Analysis J. Apel Vorlesung SS 2002 Preliminary version – 3. Juli 2002 Inhaltsverzeichnis 1 Einleitung 1.1 Leistungsnachweis . . . . . . . . . . . . . . . . . . . . . . . . . 2 4 2 Topologische Grundbegriffe 2.1 Vollständigkeitseigenschaften der reellen und komplexen Zahlen 2.2 Metrische Räume . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.1 Umgebungen und Häufungspunkte . . . . . . . . . . . 2.2.2 Abgeschlossene und offene Mengen . . . . . . . . . . . 2.2.3 Innere Punkte, Äußere Punkte, Randpunkte . . . . . . 2.3 Der Satz von Bolzano-Weierstraß . . . . . . . . . . . . . . . . 5 5 10 10 13 18 19 3 Folgen und Reihen 3.1 Grenzwert einer Zahlenfolge . . . . . . . . . . . 3.2 Grenzwerte spezieller Zahlenfolgen . . . . . . . 3.2.1 F = (an )n≥1 . . . . . . . . . . . . . . . . n 3.2.2 F = (na )n≥1 . . . . . . . . . . . . . . . √ n 3.2.3 F = ( a)n≥1 . . . . . . . . . . . . . . . 3.3 Monotone Zahlenfolgen . . . . . . . . . . . . . . 3.4 Konvergenzkriterien für Zahlenfolgen . . . . . . 3.5 Grenzwertsätze für Zahlenfolgen . . . . . . . . . 3.6 Reihen . . . . . . . . . . . . . . . . . . . . . . . 3.6.1 Unendliche geometrische Reihen . . . . . 3.6.2 Absolute Konvergenz . . . . . . . . . . . 3.6.3 Konvergenzkriterien unendlicher Reihen 3.6.4 Der große Umordnungssatz . . . . . . . . 3.6.5 Multiplikation unendlicher Reihen . . . . 22 22 26 26 27 28 28 31 34 39 41 44 45 54 57 i Preliminary version – 3. Juli 2002 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 Potenzreihen 60 4.1 Konvergenzradius und Konvergenzkreis . . . . . . . . . . . . . 62 4.2 Rechenregeln für Potenzreihen . . . . . . . . . . . . . . . . . . 68 4.3 Elementare Funktionen . . . . . . . . . . . . . . . . . . . . . . 72 5 Stetigkeit reeller Funktionen in einer reellen Variablen 5.1 Grenzwerte von Funktionen . . . . . . . . . . . . . . . . 5.2 Stetige Funktionen . . . . . . . . . . . . . . . . . . . . . 5.2.1 Zusammengesetzte stetige Funktionen . . . . . . . 5.2.2 Klassen stetiger Funktionen . . . . . . . . . . . . 5.2.3 Klassifikation von Unstetigkeitsstellen . . . . . . . 5.2.4 Sätze über stetige Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 78 81 83 86 87 89 6 Differentiation reeller Funktionen in einer reellen Variablen 93 6.1 Differenzen- und Differentialquotient . . . . . . . . . . . . . . 93 6.2 Beispiele differenzierbarer Funktionen . . . . . . . . . . . . . . 95 6.2.1 f (x) = c . . . . . . . . . . . . . . . . . . . . . . . . . . 95 6.2.2 f (x) = xn , n ∈ N, n 6= 0 . . . . . . . . . . . . . . . . 95 6.2.3 f (x) = P exp x . . . . . . . . . . . . . . . . . . . . . . . . 96 n 6.2.4 f (x) = ∞ n=0 an (x − x0 ) . . . . . . . . . . . . . . . . . 96 6.2.5 f (x) = sin x, g(x) = cos x . . . . . . . . . . . . . . 98 6.3 Zusammenhang zwischen Stetigkeit und Differenzierbarkeit . . 99 6.4 Höhere Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . 100 6.5 Differentiationsregeln . . . . . . . . . . . . . . . . . . . . . . . 101 6.5.1 Summenregel . . . . . . . . . . . . . . . . . . . . . . . 101 6.5.2 Produktregel . . . . . . . . . . . . . . . . . . . . . . . 101 6.5.3 Quotientenregel . . . . . . . . . . . . . . . . . . . . . . 102 6.5.4 Kettenregel . . . . . . . . . . . . . . . . . . . . . . . . 103 6.5.5 Ableitung der Umkehrfunktion f −1 . . . . . . . . . . . 103 6.5.6 Kurzzusammenfassung der Differentiationsregeln . . . . 106 6.5.7 Auswahl wichtiger Ableitungen . . . . . . . . . . . . . 106 6.6 Wichtige Sätze der Differentialrechnung . . . . . . . . . . . . . 108 6.6.1 Satz von Rolle . . . . . . . . . . . . . . . . . . . . . . . 108 6.6.2 Mittelwertsatz der Differentialrechnung . . . . . . . . . 109 6.6.3 Quotientenmittelwertsatz . . . . . . . . . . . . . . . . . 109 6.6.4 Regel von l’Hospital . . . . . . . . . . . . . . . . . . . 110 6.6.5 Satz von Taylor . . . . . . . . . . . . . . . . . . . . . . 112 6.7 Kurvendiskussion . . . . . . . . . . . . . . . . . . . . . . . . . 115 ii Preliminary version – 3. Juli 2002 6.7.1 6.7.2 6.7.3 6.7.4 Monotonie . . . . . . Lokale Extremwerte . Wendepunkte . . . . Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 Integration reeller Funktionen in einer reellen Variablen 7.1 Das Riemannsche Integral . . . . . . . . . . . . . . . . . . 7.2 Hauptsatz der Differential- und Integralrechnung . . . . . . 7.3 Uneigentliche Integrale . . . . . . . . . . . . . . . . . . . . 7.4 Regeln der unbestimmten Integration . . . . . . . . . . . . 7.4.1 Auswahl von Grundintegralen . . . . . . . . . . . . 7.4.2 Integration einer Summe . . . . . . . . . . . . . . . 7.4.3 Partielle Integration . . . . . . . . . . . . . . . . . 7.4.4 Subsitutionsregel . . . . . . . . . . . . . . . . . . . 7.5 Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . 7.5.1 Berechnung von Flächeninhalten . . . . . . . . . . . 7.5.2 Berechnung von Kurvenlängen . . . . . . . . . . . . iii Preliminary version – 3. Juli 2002 . . . . . . . . 115 116 117 118 . . . . . . . . . . . 125 . 125 . 133 . 136 . 138 . 138 . 139 . 140 . 142 . 144 . 144 . 147 Kapitel 1 Einleitung Bei der Behandlung der (linearen) Algebra standen strukturelle Untersuchungen im Vordergrund. Dabei nahm die Abgeschlossenheit von Operationen der Strukturen eine zentrale Rolle ein. So war es in unseren Untersuchungen ausreichend vorauszusetzen, daß ein Körper und zuweilen auch nur ein Ring zugrunde lag. Wenigstens aus Sicht der linearen Algebra ist es unerheblich, ob es sich um den Körper der rationalen, der reellen, der komplexen Zahlen oder gar um einen Restklassenkörper Zp der ganzen Zahlen modulo einer Primzahl p handelte. Erst bei der Betrachtung von Polynomen mindestens zweiten Grades zeichnen sich die komplexen gegenüber den rationalen oder reellen Zahlen aus. Nämlich dadurch, daß jedes Polynom in einer Variablen mit komplexen Koeffizienten vom Grad n ≥ 1 mindestens eine komplexe Nullstelle (bei Zählung der Nullstellen mit geeigneten Vielfachheiten handelt es sich um genau n Stück) besitzt. Nur am Rande sei erwähnt, daß man diese Eigenschaft auch schon für kleinere Körper, z.B. den nur abzählbar unendlichen Körper der algebraischen Zahlen, als den der komplexen Zahlen erhält. Während der geschichtliche Ursprung der Algebra in der Lösung algebraischer Gleichungen und Gleichungssysteme begründet war, besteht ein historisches Grundanliegen der Analysis im Ausschöpfen von (endlichen) Flächen und Körpern, d.h. im Bestimmen von Flächeninhalten und Volumen. Sobald die Begrenzungslinien bzw. -flächen krummlinig sind (z.B. bei einem Kreis oder einer Kugel), benötigt man zur Inhaltsbestimmung wenigstens im Prinzip eine immer bessere Approximation durch geradlinig bzw. ebenflächig begrenzte Körper. Erst durch den Grenzübergang zu immer besseren Approximationen, welche sich der ursprünglichen Figur beliebig genau anschmie2 Preliminary version – 3. Juli 2002 gen, gelangt man zur Maßzahl des Inhalts der Figur als dem Grenzwert der Inhalte der Approximationsfiguren. Damit ein derartiges Vorgehen überhaupt einen Sinn hat, muß gesichert sein, daß die Inhalte der Approximationsfiguren gegen eine Zahl streben. Beschränkt man sich auf rationalen Zahlen, so braucht das durchaus nicht der Fall zu sein. Man denke nur an die Fläche des Einheitskreises, deren Maßzahl ist π, also keine rationale Zahl. Die Probleme entstehen bereits bei der einfachsten aller denkbaren Inhaltsuntersuchungen, der Bestimmung der Länge einer Kurve. Bildlich geht man dabei wie folgt vor, man rektifiziert die Kurve, d.h. man “biegt” sie zu einer Strecke gleicher Länge. Aber nicht einmal die Länge jeder Strecke kann durch eine rationale Längenmaßzahl quantifiziert werden. Man betrachte √ dazu einfach die Länge der Diagonalen des Einheitsquadrates, diese ist 2. Die rationale Zahlengerade ist zwar dicht aber doch nur lückenhaft mit Punkten belegt. Aus Sicht des Ihnen aus der Vorlesung zur Mengenlehre bekannten Mächtigkeitsbegriffes muß man sogar sagen, die rationale Zahlengerade hat viel mehr (nämlich überabzählbar viele) Lücken als Punkte (nämlich nur abzählbar unendlich viele). Jede Strecke, die am Nullpunkt beginnt und an einer Lücke endet, hat demnach keine rationale Länge. Betrachten wir ein anderes Phänomen, welches bei der Untersuchung von Grenzübergängen und dem damit verbundenen Übergang zu immer kleineren bis hin zu unendlich kleinen (infinitesimalen) Quantitäten auftritt. Machen wir dazu ein kleines Gedankenexperiment. Hase und Igel machen einen Wettlauf. Der etwas arrogante und sich für viel schneller haltende Hase gibt dem Igel einen kleinen Vorsprung. Die Frage ist nun, kann der Hase das Rennen gewinnen, wird er also den Igel jemals überholen? Läuft nun der Hase bis zu dem Punkt, an dem der Igel startete, so ist der Igel in der Zwischenzeit bereits ein Stück weitergelaufen. Läuft nun der Hase bis dorthin, so ist der Igel in der Zwischenzeit wieder ein Stück weitergelaufen. Wir können diese Überlegung unendlich oft wiederholen und immer wird der Igel bereits ein Stück weiter sein, wenn der Hase an seinem vorherigen Platz angekommen ist. Also holt der Hase den Igel niemals ein? Die Praxis lehrt uns, das muß Unsinn sein, denn mittels der gleichen Argumente könnte man natürlich auch “beweisen”, daß z.B. ein Auto niemals einen vor ihm fahrenden Radfahrer überholen kann. Der Denkfehler besteht einfach darin, daß wir zwar unendlich viele Zeitintervalle betrachtet haben ohne dabei jedoch einen unendlichen Gesamtzeitraum zu überstreichen. Die Zeitintervalle werden im kürzer und der untersuchte 3 Preliminary version – 3. Juli 2002 Gesamtzeitraum reicht letztendlich nur vom Start der beiden Kontrahenten bis zum Einholen des Igels durch den Hasen. 1.1 Leistungsnachweis Die Vorlesungsreihe zur Analysis ist der zweite Bestandteil der Mathematikgrundausbildung für Informatiker. Wie im vergangenen Semester werden Übungsaufgaben gestellt, welche jeweils vor der Dienstagsvorlesung abzugeben sind. In mit mir abgesprochenen Ausnahmefällen ist ein Nachreichen bis spätestens Donnerstag 9.00 Uhr in meinen Briefkasten möglich. Bei Nichtabsprache oder noch späterer Abgabe werden die Aufgaben nicht mehr anerkannt. Die aktuellen Aufgabenstellungen finden Sie auf der Internetseite http://www.informatik.uni-leipzig.de/~apel/Ana02 In der zweiten Julihälfte findet eine 2-stündige Prüfungsklausur statt, deren Ergebnis mit 33 % in die Vordiplomsnote Mathematik eingeht. Teilnahmevoraussetzung ist das Erreichen von mindestens 50 % der Punkte aus den Übungsaufgaben. 4 Preliminary version – 3. Juli 2002 Kapitel 2 Topologische Grundbegriffe Bereits in der Einleitung haben wir festgestellt, daß die Betonung bei analytischen Untersuchungen nicht mehr nur auf der Abgeschlossenheit der Zahlenbereiche gegenüber den Körperoperationen oder der Existenz von Nullstellen liegt, sondern daß topologische Eigenschaften in den Vordergrund treten, welche in entscheidendem Maße auf Ordnungseigenschaften der reellen Zahlen basieren. 2.1 Vollständigkeitseigenschaften der reellen und komplexen Zahlen An den Anfang wollen wir einige wesentliche Eigenschaften der reellen Zahlen stellen, die im vorangegangen Semester bei der Untersuchung von Vektorräumen noch keine Rolle spielten. Axiom 1 (Axiom des Dedekindschen Schnittes:) Zu jeder Zerlegung1 der Menge R der reellen Zahlen in zwei Klassen A und B mit der Eigenschaft ∀a ∈ A ∀b ∈ R : b < a =⇒ b ∈ A gibt es genau eine reelle Zahl s ∈ R, so daß alle reellen Zahlen c < s in A und alle reellen Zahlen c > s in B enthalten sind. Man nennt (A, B) einen Dedekindschen Schnitt und s seine Schnittzahl. 1 Zur Erinnerung: Der Begriff der Zerlegung einer Menge wurde im Zusammenhang mit der Behandlung von Äquivalenzrelationen in der Vorlesungen zur linearen Algebra eingeführt. Im vorliegenden Fall beinhaltet er gerade die Bedingungen A 6= ∅, B 6= ∅, A ∩ B = ∅ und A ∪ B = R. 5 Preliminary version – 3. Juli 2002 Angemerkt sei, daß die Schnittzahl s eines Dedekindschen Schnittes entweder größtes Element der Menge A oder kleinstes Element der Menge B ist. Das Axiom des Dedekindschen Schnittes besagt, daß die reelle Zahlengerade keine Löcher aufweist. Man überzeugt sich sofort davon, daß die rationalen Zahlen keine√derartige Eigenschaft aufweisen. Sei A die Menge √ aller rationalen Zahlen ≤ 2 und B die Menge aller rationalen Zahlen > 2, dann ist {A, B} offensichtlich eine Zerlegung der rationalen Zahlen, die auch die zusätzliche Anforderung, daß A mit einer rationalen Zahl a auch alle kleineren rationalen Zahlen enthält, erfüllt. Für diese Zerlegung existiert jedoch keine rationale Schnittzahl. Definition 1 Eine Teilmenge M ⊆ R der reellen Zahlen heißt beschränkt nach oben, falls eine reelle Zahl c existiert, so daß m ≤ c für alle m ∈ M . Man nennt c in diesem Falle eine obere Schranke von M . Entsprechend heißt M im Falle der Existenz einer reellen Zahl d mit d ≤ m für alle m ∈ M beschränkt nach unten und d eine untere Schranke von M . Eine obere Schranke c von M wird obere Grenze (Supremum) von M genannt (Bezeichnung sup M ), falls es keine reelle Zahl c0 < c gibt, die ebenfalls obere Schranke von M ist. Entsprechend bezeichnet man eine untere Schranke d als untere Grenze (Infimum) von M (Bezeichnung inf M ), falls es keine größere untere Schranke von M gibt. Gilt sup M ∈ M , so nennt man das Supremum auch Maximum der Menge M . Im Fall inf M ∈ M bezeichnet man das Infimum auch als Minimum von M. Satz 1 Jede nach oben beschränkte nichtleere Menge M reeller Zahlen besitzt genau eine obere Grenze. Ebenso besitzt jede nach unten beschränkte nichtleere Menge M reeller Zahlen genau eine untere Grenze. Beweis: Wir konstruieren wie folgt einen Dedekindschen Schnitt (A, B). B bestehe genau aus allen oberen Schranken von M und A enthalte die restlichen reellen Zahlen. B ist nicht leer, denn M war als nach oben beschränkt vorausgesetzt. Da M nicht leer ist, gibt es ein m ∈ M und jede reelle Zahl c < m ist keine obere Schranke von M , also ist auch A nicht leer. A ∪ B = R und A ∩ B = ∅ ergeben sich unmittelbar aus der Konstruktion der beiden Mengen. Also handelt es sich zunächst einmal um eine Zerlegung der Menge der reellen Zahlen. Sei nun a ∈ A. a ist also keine obere Schranke von M und daher existiert ein m ∈ M mit a < m. Nun gilt aber für jedes a0 < a 6 Preliminary version – 3. Juli 2002 erst recht a0 < m und somit kann also auch a0 keine obere Schranke von M sein, muß also daher ebenfalls zu A gehören. Damit haben wir nachgewiesen, daß die oben konstruierten Mengen A und B in der Tat einen Dedekindschen Schnitt bilden. Wir werden nun zeigen, daß die Schnittzahl s von (A, B) obere Grenze von M ist. Angenommen, es existiert ein m ∈ M mit s < m und somit s < s+m < m. Aus den Eigenschaften des Dedekindschen Schnittes und der 2 linken Ungleichung folgt s+m ∈ B. Demnach müßte s+m obere Schranke von 2 2 M sein, was aber der rechten Ungleichung widerspricht. Also gilt m ≤ s für alle m ∈ M und s ist obere Schranke von M . Da aber alle reellen Zahlen d mit d < s zur Menge A gehören, welche nach Konstruktion keine oberen Schranken von M enthält, ist s sogar kleinste obere Schranke also Supremum von M . Die Existenz der oberen Grenze ist also gesichert, es bleibt die Eindeutigkeit nachzuweisen. Seien d und d0 zwei Suprema von M . Der Fall d < d0 würde der Supremum-Eigenschaft von d0 widersprechen, da d insbesondere auch obere Schranke von M ist. Analog führt man den Fall d0 < d zum Widerspruch und folglich kann nur d = d0 gelten. Analog zeigt man den zweiten Teil des Satzes in Bezug auf das Infimum nach unten beschränkter nichtleeren Mengen. 2 Definition 2 F = (In )n=1,2,3,... sei eine Folge abgeschlossener Intervalle. Dabei sei In = [an , bn ] = {x ∈ R | an ≤ x ≤ bn } und Ln = bn − an die Länge des n-ten Intervalles. F heißt Intervallschachtelung, falls gilt 1. In ⊆ Im für alle n > m; 2. Zu jeder positiven reellen Zahl ε gibt es eine natürliche Zahl N , so daß LN < ε. Satz 2 Jede Intervallschachtelung F = (In )n=1,2,... zieht sichTauf einen Punkt zusammen, d.h. es existiert eine reelle Zahl a ∈ R, so daß ∞ n=1 In = {a}. Beweis: Für beliebige positive natürliche n ≤ m gilt aufgrund der Inklusion Im ⊆ In die Beziehung an ≤ am ≤ bm ≤ bn . Insbesondere ist also jede der unteren Intervallgrenzen ai , i = 1, 2, . . . , kleiner oder gleich jeder der oberen Intervallgrenzen bi , i = 1, 2, . . . . Also ist die Menge A := {ai | i = 1, 2, . . . } 7 Preliminary version – 3. Juli 2002 nach oben beschränkt, z.B. sind alle bj , j = 1, 2, . . . , obere Schranken von A. Daraus entnehmen wir ai ≤ sup A ≤ bj für alle i = 1, 2, . . . und alle j = 1, 2, . . . . Insbesondere trifft die obige Einschließung natürlich auch im Spezialfall n = i = j für alle n = 1, 2, . . . zu, was nichts anderes T als sup A ∈ In für alle n = 1, 2, . . . bedeutet. Demzufolge gilt sup A ∈ ∞ n=1 In und wir haben gezeigt, daß der Durchschnitt der Intervallschachtelung wenigstens nicht leer sein kann. T Nehmen wir an, a, b ∈ ∞ n=1 In sind zwei verschiedene Elemente des Durchschnitts. Wir setzen ε := |b − a|. Aus den Eigenschaften der Intervallschachtelung F folgt, daß es ein Intervall IN mit LN < ε gibt. Dafür kann T∞ aber unmöglich {a, b} ⊆ IN gelten, im Widerspruch zur Annahme a, b ∈ n=1 In . Also ist der Durchschnitt einelementig und die Aussage des Satzes ist bewiesen. 2 Zieht man in Betracht, daß es zu jeder reellen Zahl t eine eindeutig bestimmte ganze Zahl g mit g ≤ t < g+1 gibt, so zeigt der Satz über die Intervallschachtelung, daß sich jede reelle Zahl als unendlicher Dezimalbruch schreiben läßt. Will man t darstellen, so geht man wie folgt vor. Wir beginnen mit dem Fall t ≥ 0. In diesem Falle ist die obige Zahl g eine natürliche Zahl und wir setzen I1 := [g, g + 1]. Sicher gilt t ∈ I1 und t − g < 1. Weiter bilden wir t1 := 10(t − g) und suchen g1 mit g1 ≤ t1 < g1 + 1. Wegen 0 ≤ t1 < 10 g1 , g + g110+1 ]. ist g1 eine Dezimalziffer. Unser zweites Intervall ist I2 := [g + 10 g1 Addition von g zur Ungleichung 10 ≤ t − g < g110+1 zeigt t ∈ I2 , die Beg1 ziehung I2 ⊂ I1 ist offensichtlich. Wir bilden t2 := 100(t − g − 10 ) und finden g2 mit g2 ≤ t2 < g2 + 1. Analog zu oben überlegt man sich, daß auch g2 eine Dezimalziffer ist. Fortsetzung dieses Verfahrens liefert eine Intervallschachtelung, die Länge Ln des Intervalls In beträgt 10−n+1 . Die so konstruierte Intervallschachtelung zieht sich auf t zusammen. Die unteren g1 g2 gn + 100 + · · · + 10 Intervallgrenzen g + 10 n sind rationale Zahlen. Die Vorkommastellen aller Intervallgrenzen sind genau die der natürlichen Zahl g. Mit größer werdendem n ändert sich höchstens die Anzahl der von Null verschiedenen Nachkommastellen, ohne daß sich eine derartige Stelle später noch einmal ändert. Mit anderen Worten, fortgesetztes Anfügen der Nachkommastellen der unteren Intervallgrenzen liefert gerade eine Darstellung von t als unendlicher Dezimalbruch. Bemerkung 1 Die obige Konstruktion mag den Anschein erwecken, daß die unendliche Dezimalbruchdarstellung von t eindeutig bestimmt ist. Das 8 Preliminary version – 3. Juli 2002 stimmt in den meisten Fällen, es gibt aber eine wesentliche Ausnahme. Bei der oben gewählten Konstruktion war t niemals rechter Randpunkt eines Intervalls In der Intervallschachtelung. Diese Tatsache folgt aus der Bedingung gi ≤ ti < gi + 1. Wohl aber kann es sein, daß t linker Randpunkt eines Intervalls IN und damit auch linker Randpunkt aller weiteren Intervalle In , n ≥ N , ist. In diesem Fall liefert unsere Konstruktion einen Dezimalbruch mit einer abschließenden Nullperiode. Alternativ hätten wir durch Verwendung der Bedingung gi < ti ≤ gi + 1 die Intervallschachtelung auch so konstruieren können, daß t sicher niemals linker möglicherweise aber rechter Randpunkt eines Intervalls In ist. Dann können wir das Verfahren zum Ablesen der unendlichen Dezimalbruchdarstellung ebenfalls anwenden. Ist t dann aber rechter Randpunkt der Intervalle mit genügend hohem Index, so erhalten wir eine Darstellung mit abschließender Neunerperiode. In allen Fällen, wo t weder linker noch rechter Randpunkt irgendwelcher Intervalle ist, erhalten wir tatsächlich eindeutige Dezimalbruchdarstellungen. Andernfalls können wir je nach Konstruktion zu zwei verschiedenen Darstellungen gelangen, wovon eine auf eine Nullperiode und die andere auf eine Neunerperiode endet. Ebenso wie die reellen Zahlen die Zahlengerade lückenlos ausfüllen, so bedecken die komplexen Zahlen die Zahlenebene lückenlos. An die Stelle der Intervallschachtelungen treten dabei sogenannte Quadratschachtelungen. Definition 3 I x = [a, b] und I y = [c, d] seien zwei abgeschlossene Intervalle reeller Zahlen. Dann versteht man unter dem abgeschlossenen Intervall I x × I y komplexer Zahlen die Menge aller komplexen Zahlen mit Realteil in I x und Imaginärteil in I y . Im Falle gleicher Länge beider reeller Intervalle, d.h. b−a = d−c, bezeichnet man das komplexe Intervall I x ×I y auch als Quadrat. Sei F = (Inx ×Iny )n=1,2,3,... eine Folge von Quadraten. Dann nennt man F eine Quadratschachtelung, falls (Inx )n=1,2,3,... sowie (Iny )n=1,2,3,... Intervallschachtelungen in den reellen Zahlen sind. Satz 3 Jede Quadratschachtelung F = (Inx × Iny )n=1,2,3,... zieht sich auf einen Punkt der komplexen zusammen, d.h. es existiert eine komplexe T∞ Zahlenebene x y Zahl z ∈ C mit n=1 (In × In ) = {z}. x Beweis: T∞gibty es ein a ∈ R T∞ (Inx)n=1,2,3,... ist reelle Intervallschachtelung, also mit n=1 In = {a}. Ebenso existiert ein b ∈ R mit n=1 In = {b}. Also 9 Preliminary version – 3. Juli 2002 T x y gehört die komplexe Zahl z := a + ib zum Durchschnitt ∞ n=1 (In × In ) aller Quadrate der Quadratschachtelung. mußTaber der Realteil T Andersherum x y x jedes Elementes des Durchschnitts ∞ (I × I ) auch in ∞ n n=1 n n=1 In liegen und entsprechendes gilt für den Imaginärteil, so daß z auch das einzige Element des Durchschnitts ist. 2 2.2 2.2.1 Metrische Räume Umgebungen und Häufungspunkte Im vergangenen Semester untersuchten wir Euklidische Vektorräume. Dabei handelt es sich um eine spezielle Klasse sogenannter metrischer Räume auf die wir jetzt eingehen wollen. Definition 4 Eine Funktion d : R × R → R wird Metrik der Menge R genannt, falls sie für alle Elemente x, y, z ∈ R den folgenden Bedingungen genügt: 1. d(x, y) ≥ 0, 2. d(x, y) = 0 genau dann, wenn x = y, 3. d(x, y) = d(y, x), 4. d(x, y) ≤ d(x, z) + d(z, y) (Dreiecksungleichung) Ist d eine Metrik in R, so nennt man (R, d) einen metrischen Raum und die Elemente von R die Punkte des Raumes. Die Metrik kann als Abstandsfunktion der Punkte des Raumes R aufgefaßt werden. Die interessanteste Bedingung ist die Dreiecksungleichung, welche man so deuten kann, daß die kürzeste Verbindung zwischen zwei Punkten stets der direkte Weg ist. Gleichheit gilt gerade für solche Punkte z, die auf dem direkten Weg von x nach y liegen. Beispiele metrischer Räume: 1. R = R, d(a, b) = |a − b|, 2. R = C, d(a + ib, c + id) = |(a + ib) − (c + id)| = 10 Preliminary version – 3. Juli 2002 p (a − c)2 + (b − d)2 , 3. Für einenp Euklidischen Vektorraum V = (V, h , i) ist R = V mit d(v, w) = hv − w, v − wi ein metrischer Raum. Definition 5 Sei (R, d) ein metrischer Raum. Für jede reelle Zahl ε > 0 und jeden Punkt x ∈ R bezeichnen wir die Punktmenge Uε (x) := {y ∈ R | d(x, y) < ε} als die ε-Umgebung des Punktes x. Eine Menge U ⊆ R nennt man Umgebung des Punktes x, wenn es eine reelle Zahl ε > 0 gibt, so daß die εUmgebung von x ganz in U liegt, d.h. Uε (x) ⊆ U . Ein Punkt x ∈ R heißt Häufungspunkt einer Teilmenge M ⊆ R, wenn sich in jeder Umgebung U von x wenigstens ein von x verschiedener Punkt aus M befindet, d.h. (U ∩ M ) \ {x} = 6 ∅. Ein Punkt y ∈ M , welcher kein Häufungspunkt von M ist, wird isolierter Punkt von M genannt. ε-Umgebung in den Beispielräumen: 1. R = R, d(a, b) = |a − b|, : Uε (x) ist das offene Intervall der Länge 2ε mit Mittelpunkt x. 2. R = C, d(a + ib, c + id) = |(a + ib) − (c + id)|, : Uε (x) ist das Innere des Kreises des Radius ε um den Mittelpunkt x. pPn 2 3. R = Rn , d((v1 , . . . , vn ), (w1 , . . . , wn )) = i=1 (vi − wi ) , : Uε (x) ist das Innere der n-dimensionalen Kugel des Radius ε um den Mittelpunkt x. Für beliebige Punkte x ∈ R und positive reelle Zahlen ε ≤ δ gilt Uε (x) ⊆ Uδ (x). Anschaulich (und später auch wörtlich) ist eine Punktmenge U genau dann eine Umgebung des Punktes x ∈ R, wenn sie x in ihrem Inneren enthält, d.h. x ∈ U und x liegt nicht auf dem Rand von U . Bemerkung 2 Da jede Umgebung von x eine ε-Umgebung von x umfaßt, ist es sofort klar, daß x bereits dann ein Häufungspunkt von M ist, wenn jede ε-Umgebung von x einen von x verschiedenen Punkt von M enthält. Ein Häufungspunkt x der Menge M kann, aber braucht nicht zur Menge M zu gehören. Beispiele: 11 Preliminary version – 3. Juli 2002 1. Die Menge M = N der natürlichen Zahlen besitzt keine Häufungspunkt im metrischen Raum (R, d), denn z.B. enthalten die Umgebungen U 1 (n) für jede natürliche Zahl n keine natürlichen Zahlen außer n. 2 Insbesondere sind alle natürlichen Zahlen isolierte Punkte der Menge N. 2. Die Menge M = { n1 | n ∈ N} besitzt genau einen Häufungspunkt, nämlich 0 und dieser gehört nicht zu M . Sämtliche Punkte von M sind isoliert. 3. Jeder Punkt des offenen reellen Intervalles M = (a, b), a < b, ist Häufungspunkt von M . Darüberhinaus sind aber auch die nicht zu M gehörigen Randpunkte a und b Häufungspunkte von M . 4. Die Häufungspunkte des abgeschlossenen reellen Intervalles M = [a, b], a < b, sind gerade die Punkte von M . Satz 4 M ⊆ R sei eine Teilmenge des metrischen Raumes (R, d) und x ein Häufungspunkt von M . Dann enthält die Menge (Uε (x) ∩ M ) \ {x} für jedes reelle ε > 0 unendlich viele Elemente. Beweis: Angenommen, es gibt ein ε > 0, so daß (Uε (x) ∩ M ) \ {x} nur endlich viele Elemente, sagen wir y1 , . . . , yk enthält. Wir bilden den minimalen Abstand δ = minki=1 d(x, yi ), den ein von x verschiedener, zur ε-Umgebung gehöriger Punkt von M vom Punkt x hat. Wegen yi 6= x gilt δ > 0 und offensichtlich gilt (Uδ (x) ∩ M ) \ {x} = ∅, im Widerspruch zur vorausgesetzten Häufungspunkteigenschaft von x. 2 Eine triviale Folgerung aus diesem Satz ist Folgerung 1 Jede endliche Teilmenge M von R besitzt keine Häufungspunkte. Satz 5 Sei H die Menge alle Häufungspunkte der Menge M ⊆ R. Dann ist jeder Häufungspunkt von H bereits in H enthalten. Beweis: Sei x ein Häufungspunkt von H und ε > 0 eine beliebige positive reelle Zahl. 12 Preliminary version – 3. Juli 2002 Dann liegt in der Umgebung U 2ε (x) ein von x verschiedener Punkt y von H. Dieser ist Häufungspunkt von M , also liegen in U 2ε (y) unendlich viele Punkte von M , insbesondere auch ein z ∈ M \ {x, y}. Aus der Dreiecksungleichung folgt ε ε d(x, z) ≤ d(x, y) + d(y, z) < + = ε 2 2 und somit z ∈ Uε (x). Also ist x Häufungspunkt von M und damit Element von H. 2 2.2.2 Abgeschlossene und offene Mengen Definition 6 Sei (R, d) ein metrischer Raum und M ⊆ R eine Punktmenge darin. Dann nennt man M genau dann abgeschlossen, wenn jeder Häufungspunkt von M Element von M ist. M heißt genau dann offen, wenn es zu jedem Punkt x ∈ M eine Umgebung U von x gibt, welche ganz in M liegt, d.h. U ⊆ M . Betrachten wir einige Beispiele abgeschlossener und offener Mengen im metrischen Raum (R, d) der reellen Zahlen mit dem gewöhnlichen Abstand d zweier Punkte. 1. Ein abgeschlossene Intervall [a, b] = {x | a ≤ x ≤ b} ist eine abgeschlossene Menge. 2. Ein offenes Intervall (a, b) = {x | a < x < b} ist eine offene Menge. 3. Für beliebige reelle Zahlen a < b ist das halboffene Intervall [a, b) = {x | a ≤ x < b} weder eine abgeschlossene noch eine offene Menge. Zum einen ist b Häufungspunkt von [a, b), gehört der Menge aber nicht an (also nicht abgeschlossen). Zum anderen gehört keine Umgebung / [a, b) für alle positiven reellen Zahlen von a ganz zu [a, b) da a − 2ε ∈ ε. Damit gilt Uε (a) 6⊆ [a, b) für alle ε > 0 und da jede Umgebung von a eine solche ε-Umgebung enthält, gilt U 6⊆ [a, b) auch für jede andere Umgebung U von a. Folglich ist [a, b) auch nicht offen. Eine analoge Aussage gilt natürlich auch für das halboffene Intervall (a, b]. 4. Die Mengen {x | x < a} und {x | x > a} (Zahlenstrahlen ohne Anfangspunkt) sind für jedes reelle a offen. 13 Preliminary version – 3. Juli 2002 5. Die Mengen {x | x ≤ a} und {x | x ≥ a} (Zahlenstrahlen mit Anfangspunkt) sind für jedes reelle a abgeschlossen. Für beliebige metrische Räume (R, d) sind die trivialen Teilmengen R und ∅ sowohl offen als auch abgeschlossen. An den Beispielen erkennen wir, daß die Begriffe der abgeschlossenen und offenen Menge keineswegs komplementär zueinander sind. Zum einen braucht eine Menge weder offen noch abgeschlossen zu sein, zum anderen kann sie aber auch beide Eigenschaften gleichzeitig aufweisen. Satz 6 Eine Menge M ist genau dann offen, wenn es zu jedem x ∈ M eine positive reelle Zahl ε mit Uε (x) ⊆ M gibt. Beweis: Sei M offen und x ∈ M . Dann existiert eine Umgebung U von x mit U ⊆ M . Zu jeder Umgebung U von x existiert aber ein ε > 0, so daß Uε (x) ⊆ U ⊆ M und die Richtung (=⇒) ist bewiesen. Bei Richtung (⇐=) folgt die Offenheit von M unmittelbar aus Definition 6 2 Folgerung 2 Für jeden Punkt x eines metrischen Raumes und jedes reelle ε > 0 ist die ε-Umgebung Uε (x) eine offene Menge. Beweis: Wir setzen M = Uε (x). Zu zeigen ist, daß zu jedem y ∈ M ein δ > 0 mit Uδ (y) ⊆ M existiert. Für y = x kann man δ = ε wählen und die geforderte Inklusion ist offensichtlich. Sei nun y ∈ M \ {x} beliebig. Wir setzen δ := ε − d(x, y) und wegen d(x, y) < ε gilt δ > 0. Für beliebiges z ∈ Uδ (y) gilt d(z, x) ≤ d(z, y) + d(y, x) < δ + (ε − δ) = ε, also z ∈ M . Somit ist Uδ (y) ⊆ M gezeigt und Anwendung des obigen Satzes liefert die Behauptung. 2 Satz 7 Sei M ⊆ Pow(R) eine Menge offener Teilmengen des metrischen Raumes (R, d). S 1. Dann ist M ebenfalls eine offene Menge. T 2. Falls die Menge M endlich ist, so ist auch M eine offene Menge. Beweis: 14 Preliminary version – 3. Juli 2002 S Zu 1. Für jedes x ∈ M existiert ein M ∈ MSmit x ∈ M . Da M offen ist, gibt es ein ε > 0, so daß Uε (x) ⊆ M ⊆ M und mit Satz 6 folgt die Behauptung. T Zu 2. Sei nun x ∈ M, also x ∈ M für alle M ∈ M. Zu jeder Menge M ∈ M existiert ein εM > 0, so daß UεM (x) ⊆ M . Da {εM | M ∈ M} eine endliche Menge ist, besitzt sie ein Minimum ε und da alle Elemente der Menge positiv sind ist ε positiv. Wegen Uε (x) ⊆ UεM (x) für alle T M ∈ M ergibt sich schließlich Uε (x) ⊆ M und die Behauptung folgt wiederum aus Satz 6. 2 Man beachte, die erste Aussage gilt für Mengensysteme M beliebiger Mächtigkeit, d.h. die Vereinigung unendlich und sogar überabzählbar vieler offener Mengen ist wieder offen. Dagegen ist die Aussage über die Offenheit des Durchschnitts offener Mengen auf endliche Durchschnitte beschränkt. In der Tat braucht der Durchschnitt unendlich vieler offener Mengen nicht notwendigerweise wieder offen zu sein. SeienTbeispielsweise a und b feste reellen Zahlen mit a < b. Der Durchschnitt c<a (c, b) aller offenen Intervalle deren obere Grenze b und deren untere Grenze kleiner als a ist, ist gleich dem halboffenen Intervall [a, b). Dieses ist aber nicht offen, wie wir in Beispiel 3 gesehen haben. Im obigen Beweis wird das Problem dadurch deutlich, daß {εM | M ∈ M} für unendliche Mengen zwar nach wie vor ein Infimum, aber nicht mehr unbedingt ein Minimum besitzt. Obwohl alle Elemente der Menge positiv sind, kann das Infimum auch 0 sein und ist dann nicht als positives ε zu gebrauchen. Satz 8 Eine Menge M ⊆ R eines metrischen Raumes (R, d) ist genau dann offen, wenn ihr Komplement M c = R \ M abgeschlossen ist. Beweis: (⇒) Sei M offen. Wir betrachten einen beliebigen Häufungspunkt x ∈ R von M c . Dann liegt in jeder ε-Umgebung Uε (x), ε > 0, wenigstens ein von x verschiedener Punkt von M c . Folglich gilt für jede dieser ε-Umgebungen Uε (x) 6⊆ M und damit kann x nicht zu M gehören, da daß der Bedingung der Offenheit widersprechen würde. Folglich gehört jeder Häufungspunkt x von M c zur Menge M c und somit ist die Menge M c abgeschlossen. 15 Preliminary version – 3. Juli 2002 (⇐) Sei nun M c abgeschlossen. Wir betrachten ein beliebiges x ∈ M . Angenommen, jede ε-Umgebung Uε (x), ε > 0, würde ein Element von M c enthalten, dann wäre x ein außerhalb von M c befindlicher Häufungspunkt der Menge M c . Das widerspräche der Abgeschlossenheit von M c . Also muß Uε (x) für wenigstens ein ε > 0 kein Element von M c enthalten, d.h. ganz in M liegen. Damit ist M nach Satz 6 offen. 2. Geht man nun in Satz 7 jeweils zu den Komplementen der Mengen M ∈ M über, so ergibt sich aus dem obigen Satz sofort die Gültigkeit von Satz 9 Sei M ⊆ Pow(R) eine Menge abgeschlossener Teilmengen des metrischen Raumes (R, d). T 1. Dann ist M ebenfalls eine abgeschlossene Menge. S 2. Für endliche Mengensysteme M ist auch M abgeschlossen. Beweis: Das Mengensystem M∗ := {M cS| M ∈ M} besteht nach dem obigen Satz nur aus offenen Mengen. AlsoSist M∗ ebenfalls offen und nach dem obigen Satz ist ihr Komplement ( M∗ )c abgeschlossen. Anwendung der DeMorganschen Regel liefert !c [ c \ \ [ ∗ c (M c )c = M. M = M = M ∈M M ∈M Analog zeigt man die zweite Behauptung 2 Definition 7 Sei M eine Punktmenge des metrischen Raumes (R, d). Die Menge M 0 aller Häufungspunkte von M nennt man die Ableitung von M . Die Menge M = M ∪ M 0 heißt abgeschlossene Hülle2 von M . Bemerkung 3 Da für jede abgeschlossene Menge M die Inklusion M 0 ⊆ M gilt, ergibt sich für abgeschlossene Mengen M die Gleichheit M = M . Bemerkung 4 Für beliebige Teilmengen M und N eines metrischen Raumes mit der Eigenschaft M ⊆ N gelten M 0 ⊆ N 0 und M ⊆ N . Beweis: Übungsaufgabe 3 2 2 zuweilen werden wir die abgeschlossene Hülle auch kurz Abschluß nennen 16 Preliminary version – 3. Juli 2002 Satz 10 Die abgeschlossene Hülle M von M ist die kleinste abgeschlossene Menge von R die M enthält. Beweis: Zunächst zeigen wir, daß M eine abgeschlossene Menge ist. Sei x ein Häufungspunkt von M . Dann existiert zu jeder reellen Zahl δ > 0 ein Punkt yδ ∈ Uδ (x) ∩ M \ {x}. Aufgrund der Definition von M muß jedes yδ zu wenigstens einer der beiden Mengen M oder M 0 gehören. Falls ein ε > 0 exisitiert, so daß yδ ∈ M für alle δ < ε, dann ist x Häufungspunkt von M und gehört somit zu M 0 , also erst recht zu M . Existiert dagegen zu jedem ε > 0 ein δ < ε mit yδ ∈ M 0 , so folgt wegen Uδ (x) ⊆ Uε (x), daß (Uε (x) ∩ M 0 ) \ {x} für kein positives ε leer ist, also ist x ein Häufungspunkt von M 0 . Nach Satz 5 gehört x zu M 0 , also erst recht zu M. Der zweite Teil der Aussage, daß es sich bei M um die kleinste, M umfaßende abgeschlossene Menge handelt, ist trivial. Würde man aus M einen Punkt von M weglassen, so ist die Enthaltenseinsbedingung verletzt. Läßt man dagegen einen Punkt aus M 0 weg, so gibt es einen nicht zur Menge gehörigen Häufungspunkt von M , was der Abgeschlossenheit widerspricht. Also muß jede M umfaßende abgeschlossene Teilmenge von R wenigstens die Punkte von M enthalten. 2 Bemerkung 5 Die Menge der reellen Zahlen ist eine abgeschlossene Teilmenge der komplexen Zahlen. Beweis: Übungsaufgabe 4 2 Übungsaufgaben, Serie 1 1. Ist die Menge M = { n1 + m1 | n, m ∈ N \ {0}} im metrischen Raum der reellen Zahlen nach oben oder unten beschränkt? Geben Sie gegebenfalls die obere beziehungsweise untere Grenze an. Handelt es sich dabei sogar um Minimum oder Maximum? 2. Bestimmen Sie die Häufungspunkte der Menge M aus Aufgabe 1! 3. Sei (R, d) ein metrischer Raum und M, N ⊆ R zwei Punktmengen mit der Eigenschaft M ⊆ N . Zeigen Sie, daß dann für die Ableitungen und abgeschlossen Hüllen von M und N die Inklusionen M 0 ⊆ N 0 beziehungsweise M ⊆ N gelten. (vgl. Bemerkung 4 aus der Vorlesung) 17 Preliminary version – 3. Juli 2002 2.2.3 Innere Punkte, Äußere Punkte, Randpunkte Man unterscheidet drei Arten der Lage eines Punktes des metrischen Raumes (R, d) in Bezug auf eine Teilmenge M ⊆ R. Definition 8 Sei M eine Punktmenge des metrischen Raumes (R, d). Ein Punkt x ∈ R heißt 1. innerer Punkt von M , falls es eine Umgebung U von x mit U ⊆ M gibt, 2. äußerer Punkt von M , falls eine zu M disjunkte Umgebung U von x existiert, d.h. U ∩ M = ∅ oder äquivalent dazu U ⊆ M c . 3. Randpunkt von M , falls jede Umgebung U von x sowohl Punkte der Menge M als auch des Komplements M c enthält. Man überzeugt sich leicht davon, daß für jeden Punkt x ∈ R genau eine der drei Lagebeziehungen bezüglich M zutrifft, d.h. jeder Punkt von R ist entweder innerer, äußerer oder Randpunkt von M . Ein zu M gehöriger Punkt x ist niemals äußerer Punkt von M , denn jede seiner Umgebungen enthält wenigstens x und ist damit nicht disjunkt zu M . Analoge Überlegungen zeigen, daß nicht zu M gehörige Punkte niemals innere Punkte von M sein können. Dagegen können sowohl M als auch das Komplement M c Randpunkte von M enthalten. Satz 11 Sei M eine Punktmenge des metrischen Raumes (R, d). 1. M ist genau dann offen, wenn jeder Punkt von M innerer Punkt von M ist, 2. M ist genau dann offen, wenn keiner der Randpunkte von M in M liegt, 3. M ist genau dann abgeschlossen, wenn jeder Randpunkt von M zu M gehört, 4. ein Punkt x ∈ / M ist genau dann Häufungspunkt von M , wenn er Randpunkt von M ist. Beweis: 18 Preliminary version – 3. Juli 2002 Zu 1. Ist M offen, so gehört mit x stets eine ganze Umgebung Uε (x), ε > 0, zu M . Daher folgt aus x ∈ M , daß x innerer Punkt von M ist. Ist umgekehrt jeder Punkt x ∈ M ein innerer Punkt von M , so gibt es eine Umgebung U von x mit U ⊆ M und folglich ist M offen. Zu 2. Im Vorfeld hatten wir festgestellt, daß alle zu M gehörigen Punkte entweder innerer Punkt oder Randpunkt sind. Also ist genau dann jeder Punkt von M innerer Punkt, wenn keine Randpunkte von M zur Menge M gehören. Damit folgt die Behauptung aus 1. Zu 3. Ist M abgeschlossen, so gehört jeder Häufungspunkt von M bereits zu M . Also existiert zu jedem x ∈ / M eine Umgebung U , welche keine Punkte von M enthält. Damit sind alle nicht zu M gehörigen Punkte äußere Punkte, weshalb sämtliche Randpunkte von M nur zu M gehören können. Gehört umgekehrt jeder Randpunkt von M zu M , so muß jeder Punkt x ∈ M c äußerer Punkt von M sein. Folglich existiert eine ganz zu M c gehörige Umgebung U von x und wegen U ∩ M = ∅ kann x kein Häufungspunkt von M sein. Zu 4. Wir betrachten einen Punkt x ∈ / M. Sei x Häufungspunkt von M . Dann enthält jede Umgebung U von x einen Punkt aus M . Andererseits enthält sie aber auch stets den nicht zu M gehörigen Punkt x. Damit erfüllt x die Anforderungen eines Randpunktes. Sei x nun Randpunkt von M . Jede Umgebung U von x muß also wenigstens einen Punkt von M enthalten. Aufgrund der Voraussetzung x ∈ / M kann es sich dabei nicht um x selbst handeln. Also ist x Häufungspunkt von M . 2 2.3 Der Satz von Bolzano-Weierstraß Unter einer Zahl wollen wir stets eine komplexe Zahl verstehen. Zahlenmengen sind also stets Teilmengen der komplexen Zahlen. Wir nennen eine Zahlenmenge M beschränkt, wenn die Menge {|x| : x ∈ M } der Beträge 19 Preliminary version – 3. Juli 2002 der Elemente von M im Sinne von Definition 1 nach oben beschränkt ist. Mit anderen Worten, M ist genau dann beschränkt, wenn eine positive reelle Zahl c mit ∀x ∈ M : 0 ≤ |x| ≤ c existiert. Insbesondere ist eine Menge reeller Zahlen genau dann beschränkt, wenn sie im Sinne von Definition 1 nach oben und nach unten beschränkt ist. Aus Sicht des metrischen Raumes der komplexen Zahlen mit der gewöhnlichen Abstandsmetrik ist |x| genau der Abstand d(x, 0) des Punktes x vom Nullpunkt. In diesem Sinne läßt sich der Beschränktheitsbegriff mittels der Bedingung, daß {d(x, 0) : x ∈ M } nach oben beschränkt sein soll, auf Teilmengen beliebiger metrischer Vektorräume ausdehnen. Satz 12 (Bolzano-Weierstraß) Jede beschränkte unendliche Zahlenmenge M besitzt einen Häufungspunkt. Beweis: Sei M eine beschränkte unendliche Menge komplexer Zahlen und c ∈ R so, daß |m| ≤ c für alle m ∈ M . Dann liegen alle Punkte von M in dem Quadrat [−c, c] × [−c, c] der komplexen Zahlenebene, zur Veranschaulichung dieses hat die Eckpunkte a + ib, a, b ∈ {−c, c}. Wir bezeichnen dieses Quadrat mit Q1 . Durch Vierteln unterteilen wir Q1 in vier Teilquadrate [−c, 0] × [−c, 0], [−c, 0] × [0, c], [0, c] × [−c, 0] und [0, c] × [0, c]. Da Q1 unendliche viele (nämlich alle) Zahlen von M enthält, muß wenigstens eines der vier Teilquadrate ebenfalls unendlich viele Zahlen von M enthalten. Ein solches wählen wir als Q2 . Dann unterteilen wir Q2 in vier gleich große Teilquadrate und wählen eines welches unendlich viele Zahlen von M enthält als Q3 . Auf diese Weise fahren wir fort und konstruieren so eine unendliche Folge (Qi )i=1,2,... von Quadraten. Nach Konstruktion gilt Qi+1 ⊂ Qi für alle i = 1, 2, . . . . Außerdem wird die Kantenlänge des Quadrates in jedem Schritt halbiert, also gibt es zu jeder positiven reellen Zahl ε > 0 eine natürliche Zahl k, so daß die Kantenlänge von Qk kleiner als ε ist. Folglich ist (Qi )i=1,2,... eine Quadratschachtelung und nach Satz 3 existiert eine (eindeutig bestimmte) komplexe Zahl z, welche Element des Durchschnittes aller Quadrate der Quadratschachtelung ist. Zu jedem ε > 0 gibt es ein Quadrat Qi , welches ganz in Uε (z) liegt. In Qi und damit auch in Uε (z) liegen unendlich viele Punkte von M , also ist z Häufungspunkt von M . Sind alle Elemente von M reelle Zahlen, so kann man sogar auf die Existenz eines reellen Häufungspunktes schließen. Nach dem oben gezeigten existiert zunächst ein komplexer Häufungspunkt von M . Gemäß Bemerkung 5 sind aber sämtliche Häufungspunkte einer Menge reeller Zahlen ebenfalls reell. 2 20 Preliminary version – 3. Juli 2002 Man beachte, daß der Satz von Bolzano-Weierstraß nicht auf beliebige metrische Räume übertragen werden kann. Wichtig ist die zusätzliche Gültigkeit einer Abgeschlossenheitsbedingung, welche sich im Beispiel der reellen und komplexen Zahlen in den Sätzen 2 beziehungsweise 3 widerspiegelt. 21 Preliminary version – 3. Juli 2002 Kapitel 3 Folgen und Reihen 3.1 Grenzwert einer Zahlenfolge Definition 9 Unter einer (komplexen) Zahlenfolge versteht man eine eindeutige Abbildung F : N → R (f : N → C) der natürlichen in die reellen (komplexen) Zahlen. Der Funktionswert ai = F (i) wird i-tes Glied der Folge genannt. Wir vereinbaren die Schreibweisen1 (ai )i≥1 oder noch kürzer (ai ) für die Zahlenfolge F mit den Gliedern a1 = F (1), a2 = F (2), . . . .2 Eine Zahl a heißt Grenzwert der Zahlenfolge F = (ai )i≥1 , falls zu jeder positiven, reellen Zahl ε eine natürliche Zahl n0 existiert, so daß für alle natürlichen Zahlen n ≥ n0 die Ungleichung |a − an | < ε erfüllt ist. Falls a Grenzwert der Folge F = (ai )i≥1 ist, so sagt man die Folge konvergiert gegen a und schreibt dafür limi→∞ ai = a. Um die bloße Existenz eines Grenzwertes hervorzuheben, sagt man auch einfach die Folge F konvergiert oder F ist konvergent. Besitzt eine Folge F keinen Grenzwert, so sagt man F divergiert oder F ist divergent. Beispiele für Zahlenfolgen und Grenzwerte: 1 In der Literatur finden Sie zuweilen die Schreibweise {ai } für Zahlenfolgen. Da die Folgenglieder a1 , a2 , . . . jedoch einer Reihenfolge unterliegen, haben wir uns hier in Anlehnung an die geordneten Tupel für die Verwendung runder Klammern entschieden, um nicht den Eindruck einer ungeordneten Menge zu erwecken. 2 Der Einfachheit halber, werden wir manchmal auch nur die natürlichen Zahlen ab einer Zahl k als Definitionsbereich einer Zahlenfolge wählen, diese schreiben wir dann in der Form (ai )i≥k . 22 Preliminary version – 3. Juli 2002 1. Die einfachste Zahlenfolge ist vielleicht F = (ai )i≥1 mit ai = i für alle natürlichen Zahlen i. Diese Zahlenfolge ist divergent, denn zu jeder reellen Zahl a ∈ R und jeder positiven reellen Zahl ε existiert eine natürliche Zahl n0 mit a + ε < n0 . 2. Sei c eine beliebige feste komplexe Zahl und F = (ai )i≥0 die konstante Folge mit ai = c für alle natürlichen Zahlen i. Dann gilt offensichtlich limi→∞ ai = c, da sogar alle Funktionswerte der Folge F in jeder εUmgebung von c liegen. 3. Wir betrachten die Zahlenfolge F = (ai )i≥1 definiert durch ai := 1i . Es gilt limi→∞ ai = 0. 4. Die Folge F = (ai )i≥1 mit ai = (−1)i + 1i besitzt keinen Grenzwert, ist also divergent. Zwar gibt es zu jedem ε > 0 eine natürliche Zahl n, so daß |1 − an | < ε und ebenso eine natürliche Zahl m mit | − 1 − am | = |1 + am | < ε. Für alle reellen Zahlen 0 < ε < 1 gilt aber auch die Implikation ∀n : |1 − an | < ε =⇒ |1 − an+1 | > ε. Damit kann 1 nicht Grenzwert sein. Analog schließt man −1 als Grenzwert aus. An der Beispielliste erkennt man, daß die Existenz eines Grenzwertes einer Zahlenfolge keinesfalls selbstverständlich ist. So ist eine Zahlenfolge F = (ai ) mit unbeschränktem Bildbereich BildF = {ai : i = 1, 2, . . . } stets divergent. Der Beweis verläuft analog zum ersten Beispiel. Angenommen, a wäre Grenzwert. Dann gäbe es zu ε > 0 ein n0 mit |a−an | < ε für alle n ≥ n0 . Sei nun c das Maximum der endlichen Menge {|a1 |, |a2 |, . . . , |an−1 |} ∪ {|a|}. Aufgrund der Unbeschränktheit von BildF existiert eine natürliche Zahl m mit |am | > c + ε ≥ |a| + ε. Folglich |am − a| ≥ |am | − |a| > ε im Widerspruch zur aus der Konstruktion folgenden Relation m ≥ n0 . Wir halten das eben bewiesene in einem Satz fest: Satz 13 Jede konvergente Zahlenfolge ist beschränkt, d.h. ihr Bildbereich ist eine beschränkte Teilmenge von C. Die Umkehrung des Satzes ist jedoch falsch, wie das vierte Beispiel zeigt. Im Falle reeller Zahlenfolgen mit unbeschränktem Bildbereich zeichnet man noch zwei spezielle divergente Situationen aus: Definition 10 F = (ai )i≥1 sei eine Folge reeller Zahlen. Man nennt F bestimmt divergent gegen +∞, falls es zu jeder reellen Zahl K einen Index n0 gibt, so daß K < an für alle n ≥ n0 . Man schreibt dafür limi→∞ ai = +∞. 23 Preliminary version – 3. Juli 2002 Gibt es zu jeder reellen Zahl K einen Index n0 mit K > an für alle n ≥ n0 so sagt man, F ist bestimmt divergent gegen −∞ und schreibt dafür limi→∞ ai = −∞. Eine Übertragung des Begriffes der bestimmten Divergenz auf die komplexen Zahlen ist nicht üblich. Da auf den komplexen Zahlen keine Ordnungsrelation erklärt ist, könnte man sich nur mit einer Forderung der folgenden Art behelfen. Zu jeder reellen Zahl K existiert ein n0 mit |an | > K für alle n ≥ n0 . Damit wird ausgesagt, daß die Folgenwerte in der komplexen Ebene immer weiter nach außen wandern, ohne allerdings eine Aussage über die Richtung des Entfernens treffen zu können. Der folgende Satz wird zum einen aufhellen, wann eine Zahlenfolge einen Grenzwert besitzt und zum anderen die Einführung der Schreibweise a = limi→∞ ai nachträglich rechtfertigen.3 Satz 14 Eine Zahlenfolge F = (ai )i≥1 besitzt höchstens einen Grenzwert. Beweis: Angenommen, a und b wären zwei verschiedene Grenzwerte von F . Zu ε := |a−b| muß es dann natürliche Zahlen n0 und m0 geben, so daß 2 |a − an | < ε für alle n ≥ n0 und |b − am | < ε für alle m ≥ m0 gelten. Für n ≥ max(n0 , m0 ) müßten sogar beide Abschätzungen |a − an | < ε und |b − an | < ε zutreffen. Das führt aber auf den Widerspruch |a − b| ≤ |a − an | + |an − b| < ε + ε = |a − b| und folglich war die Annahme der Existenz zweier Grenzwerte falsch. 2 Satz 15 Der Bildbereich BildF einer konvergenten Zahlenfolge F = (ai )i≥1 besitzt höchstens einen Häufungspunkt, dieser ist in diesem Falle der Grenzwert limn→∞ ai der Folge. Beweis: Sei a = limn→∞ ai der Grenzwert der Folge und b ein Häufungspunkt von BildF . Zum einen liegen aufgrund der Grenzwerteigenschaft von a für genügend großes n0 alle Folgenglieder an , n ≥ n0 , in der Umgebung U |a−b| (a). 2 Demnach können höchstens die endlich vielen Glieder a0 , . . . , an−1 der Umgebung U |a−b| (b) angehören, im Widerspruch zur Häufungspunkteigenschaft 2 von b und Satz 4. 3 Hätte F mehr als einen Grenzwert, so wäre die Einführung eines einzigen Symbols limi→∞ ai , welches für jeden davon stehen soll, keine gute Vorgehensweise. 24 Preliminary version – 3. Juli 2002 Damit ist gezeigt, wenn der Bildbereich BildF einer konvergenten Zahlenfolge überhaupt einen Häufungspunkt besitzt, so kann es sich dabei nur um den Grenzwert der Folge handeln. 2 Beispiel 2 unserer obigen Liste zeigt aber auch, daß der Bildbereich einer konvergenten Folge auch durchaus keinen Häufungspunkt zu haben braucht. Das ist genau dann der Fall, wenn für alle i ≥ n0 ab einem bestimmten Index n0 die Gleichheit ai = ai+1 gilt. Man sagt in diesem Fall auch, die Folge wird stationär. Ebenso sichert die Beschränktheit des Bildbereiches und die Existenz eines eindeutig bestimmten Häufungspunktes des Bildbereiches noch nicht die Konvergenz einer Zahlenfolge. Beispielsweise ist die Folge (ai ) 1 : i gerade mit den Gliedern ai = von dieser Bauart und trotzdem 1 : i ungerade i divergent. Wenigstens gilt aber Satz 16 Ist F = (ai )i≥1 eine Zahlenfolge mit paarweise verschiedenen Gliedern, so konvergiert F genau dann gegen x, wenn BildF beschränkt ist und x einziger Häufungspunkt von BildF ist. Beweis: (=⇒) Es gelte limi→∞ ai = x. Nach Satz 13 ist BildF beschränkt. Da alle Glieder ai paarweise verschieden sind, ist BildF eine unendliche beschränkte Menge und besitzt nach dem Satz von Bolzano-Weierstraß (Satz 12) einen Häufungspunkt. Gemäß Satz 15 muß es sich dabei um x handeln. (⇐=) Sei nun BildF beschränkt und x sein einziger Häufungspunkt. Angenommen x ist nicht Grenzwert von F , dann gibt es eine positive reelle Zahl ε, so daß zu jeder vorgegebenen natürlichen Zahl n0 eine weitere natürliche Zahl m0 ≥ n0 mit |am0 − x| > ε existiert. Folglich enthält die Menge BildF \ Uε (x) unendlich viele Glieder der Folge. Da diese Glieder paarweise verschieden sind, ist BildF \ Uε (x) eine unendliche beschränkte Menge und besitzt nach dem Satz von Bolzano-Weierstraß einen Häufungspunkt. Dieser ist natürlich erst recht Häufungspunkt von BildF . Andererseits kann es sich aber nicht um x handeln, da in der Umgebung Uε (x) kein einziger Punkt der Menge BildF \ Uε (x) liegt. Das steht im Widerspruch zur Voraussetzung, daß x einziger Häufungspunkt von BildF ist und folglich gilt limi→∞ ai = x. 2 Ohne Beweis halten wir den folgenden einfachen Sachverhalt fest 25 Preliminary version – 3. Juli 2002 Satz 17 Sei F = (aj )j≥1 eine komplexe Zahlenfolge mit aj = xj + iyj für j = 1, 2, . . . . Dann gilt lim aj = x + iy ⇐⇒ lim xj = x und lim yj = y . j→∞ j→∞ j→∞ Übungsaufgaben, Serie 3 7. Zeigen Sie, daß die Menge der reellen Zahlen eine abgeschlossene Teilmenge der komplexen Zahlen ist. (vgl. Bemerkung 5 aus der Vorlesung) 8. Was sind die Randpunkte der Menge Q der rationalen Zahlen im metrischen Raum R der reellen Zahlen? 9. M sei eine Teilmenge der reellen Zahlen und x ein Häufungspunkt von M . Zeigen Sie, daß dann eine gegen x konvergierende Zahlenfolge F = (ai )i≥1 von x verschiedener Elemente aus M , d.h. limi→∞ ai = x und BildF ⊆ M \ {x}, existiert. 3.2 Grenzwerte spezieller Zahlenfolgen Anhand einiger Beispiele wollen wir studieren, wie man die Konvergenz einiger wichtiger Zahlenfolgen nachweisen kann. 3.2.1 F = (an )n≥1 a sei eine komplexe Zahl, wir fragen nach dem Grenzwert der Potenzen dieser Zahl. Im Falle |a| > 1 ist BildF eine unbeschränkte Menge und die Folge F = (an )n≥1 ist nach Satz 13 divergent. Im Fall |a| = 1 läßt sich keine allgemeine Aussage treffen. Beispielsweise besitzt die konstante Folge mit ai = 1 für alle i ≥ 1 den Grenzwert 1. Die alternierende Folge der Glieder ai = (−1)i für alle i ≥ 1 ist dagegen divergent. Es bleibt die Betrachtung von |a| < 1. Wir wollen zeigen, daß in diesem Fall stets die Beziehung lim an = 0 n→∞ (|a| < 1) (3.1) gilt. Im Fall der konstanten Folge mit a = 0 ist die Behauptung offensichtlich richtig. Wir nehmen also an, 0 < |a| < 1. Sei ε > 0 beliebig. Die Frage ist, 26 Preliminary version – 3. Juli 2002 ob es ein n0 mit |an − 0| < ε für alle n ≥ n0 gibt. Wir setzen p := 1−|a| . |a| 1 Diese Zahl ist positiv und Auflösen nach |a| zeigt |a| = 1+p . Mit Hilfe des binomischen Lehrsatzes weist man leicht für Zahlen n ≥ 1 Palle natürlichen die Gültigkeit der Ungleichung (1 + p)n = ni=0 ni pi > np > 0 nach. Wir berechnen |an − 0| = |an | = |a|n = 1 1 < für alle n ≥ 1 n (1 + p) np Bei beliebig vorgegebenem ε > 0 gilt folglich für alle natürlichen Zahlen 1 n ≥ n0 := d pε e die Beziehung |an − 0| < ε , also ist 0 Grenzwert von (an )n≥1 . 3.2.2 F = (nan )n≥1 a sei wieder eine komplexe Zahl. Für |a| ≥ 1 ist die Menge der Glieder der Folge sicher unbeschränkt und die Folge divergiert. Für |a| < 1 werden wir jetzt die Gültigkeit von lim nan = 0 n→∞ (|a| < 1) (3.2) nachweisen. Für a = 0 ist die Aussage offensichtlich, da dann alle Folgenglieder 0 sind. Betrachten wir also den Fall 0 < |a| < 1. Wir gehen ähnlich . Wir verwenden nun eine andere ebenwie oben vor. p sei wieder gleich 1−|a| |a| falls aus dem binomischen Lehrsatz folgende und für alle natürlichen Zahlen n ≥ 2 gültige Abschätzung von (1 + p)n , nämlich (1 + p)n > n(n−1) p2 > 0. 2 Dann schätzen wir ab |nan − 0| = |nan | = n|a|n = n 2 < für alle n ≥ 2 (1 + p)n (n − 1)p2 Bei beliebig vorgegebenem ε > 0 gilt folglich für alle natürlichen Zahlen n ≥ n0 := 1 + max{2, d p22 ε e} die Beziehung |nan − 0| < ε , also ist 0 Grenzwert von (nan )n≥1 . 27 Preliminary version – 3. Juli 2002 3.2.3 √ F = ( n a)n≥1 Für jede positive reelle Zahl a gilt √ lim n a = 1 (a > 0, reell) n→∞ (3.3) Wir beginnen mit der Untersuchung des Falles a > 1. Aus dem binomischen Lehrsatz schließen wir auf die Ungleichung n n √ √ √ a = n a + 1 − 1 = 1 + ( n a − 1) > 1 + n( n a − 1) > 0 für alle n ≥ 2. Daraus folgt √ √ a−1 a | n a − 1| = n a − 1 < < n n Zu beliebig vorgegebenem ε > 0 ergibt sich √ | n a − 1| < ε für alle n ≥ n0 := d aε e und der eingangs behauptete Grenzwert von 1 ist gezeigt. Für a = 1 ist die Gültigkeit von (3.3) trivial und es bleibt noch die Betrachtung des Falles 0 < a < 1. Aus dem oben gezeigten ergibt sich r 1 n 1 lim √ = lim =1. n n→∞ a n→∞ a Später werden wir die Gültigkeit von 1 1 √ = lim √ n n→∞ a limn→∞ n a nachweisen und damit ist dann die Gültigkeit der Gleichung (3.3) auch für den letzten bisher noch offenen Fall gezeigt. 3.3 Monotone Zahlenfolgen Definition 11 Eine Zahlenfolge F = (ai )i≥1 mit reellen Gliedern heißt 1. monoton wachsend falls für alle i = 1, 2, . . . die Ungleichung ai+1 ≥ ai gilt, 28 Preliminary version – 3. Juli 2002 2. streng monoton wachsend falls für alle i = 1, 2, . . . die schärfere Bedingung ai+1 > ai erfüllt ist, 3. monoton fallend falls ai+1 ≤ ai für alle i = 1, 2, . . . und 4. streng monoton fallend falls ai+1 < ai für alle i = 1, 2, . . . . Satz 18 Eine monotone Zahlenfolge ist genau dann konvergent, wenn sie beschränkt ist. Beweis: (=⇒) Die Notwendigkeit der Beschränktheit ergibt sich aus Satz 13. (⇐=) Wir betrachten nun eine monoton wachsende Folge F = (ai )i≥1 . Aufgrund der Beschränktheit des Bildbereichs von F besitzt dieser eine obere Grenze a := sup BildF . Sei nun ε > 0 beliebig. Dann folgt aus der Definition der oberen Grenze, daß wenigstens ein Glied, sagen wir das n0 -te Glied an0 , der Folge größer als a − ε sein muß. Unter Ausnutzung der Monotonie folgt weiter a − ε < an0 ≤ an ≤ a für alle n ≥ n0 . Damit erhalten wir 0 ≤ a − an = |a − an | < ε für alle n ≥ n0 , also konvergiert F gegen a. Für monoton fallende Folgen verläuft der Beweis sinngemäß ab. 2 Folgerung 3 Sei ([an , bn ])n≥1 eine reelle Intervallschachtelung. Dann existieren die Grenzwerte limn→∞ an und limn→∞ bn und beide stimmen mit der Schnittzahl der Intervallschachtelung überein. Beispiel 1: Die Folge (1 + n1 )n n≥1 ist streng monoton wachsend. Alle Glieder der Folge sind positiv. Wir untersuchen den Quotienten an+1 zweier an beliebiger aufeinanderfolgender Glieder, genau dann wenn dieser für alle n = 1, 2, . . . größer als 1 ist, dann ist die obige Folge streng monoton wachsend. Es gilt !n+1 !n+1 1 1 1 + n+1 1 + n+1 n+1 1 an+1 (3.4) = = 1+ n n an 1 + n1 1 + n1 Durch äquivalentes Umformen erhalten wir !n+1 n+1 n+1 1 1 + n+1 (n + 2)/(n + 1) (n + 2)n = = (n + 1)/n (n + 1)2 1 + n1 n+1 1 = 1− (n + 1)2 29 Preliminary version – 3. Juli 2002 (3.5) An dieser Stelle verwenden wir ohne Beweis die sogenannte Bernoullische Ungleichung (1 + a)m > 1 + ma , (3.6) welche für alle von Null verschiedenen reellen Zahlen a > −1 und alle natürli1 chen Zahlen m ≥ 2 zutrifft. Für a = − (n+1) 2 und m = n + 1 ergibt sich 1 1− (n + 1)2 n+1 > 1 − (n + 1) 1 1 n =1− = 2 (n + 1) n+1 n+1 Einsetzen in Gleichung (3.4) führt auf an+1 n n+1 > =1 an n+1 n (3.7) und die strenge Monotonie der Folge ist nachgewiesen. Beispiel 2: Die Folge (1 + n1 )n+1 n≥1 ist streng monoton fallend. Der Beweisgedanke ist ähnlich. Ziel ist es diesmal nachzuweisen, daß der Quotient an für alle n = 1, 2, . . . größer als 1 ist. an+1 1 + n1 1 1 + n+1 an = an+1 !n+1 (n + 1)2 n(n + 2) 1 1 1 + n+1 n+1 1 1 1 + n+1 n+1 1 1 = 1+ 1 n(n + 2) 1 + n+1 = (3.8) Aus der Bernoullischen Ungleichung (3.6) folgt n+1 1 n+1 n+1 1 1+ >1+ =1+ >1+ 2 n(n + 2) n(n + 2) (n + 1) − 1 n+1 und Einsetzen in (3.8) zeigt an >1 an+1 für alle n ≥ 1, also fällt die Folge streng monoton. 30 Preliminary version – 3. Juli 2002 Wir bezeichnen die Glieder der Folge aus Beispiel 1 mit n 1 an = 1 + n und die Glieder der Folge aus Beispiel 1 mit n+1 1 bn = 1 + n Wegen 1 + n1 > 1 gilt an < an (1 + n1 ) = bn für alle natürlichen Zahlen n ≥ 1. Daher ist ([an , bn ])n≥1 eine Folge ineinandergeschachtelter abgeschlossener reeller Intervalle. Insbesondere gilt für alle natürlichen Zahlen n > 1 die Beziehung 2 = a1 < an < bn < b1 = 4. Sei ε eine beliebige positive reelle Zahl. Dann gilt für jede natürliche Zahl n > 4ε die Abschätzung b n − an = an 4 < <ε, n n also handelt es sich sogar um eine Intervallschachtelung. Die Schnittzahl der Intervallschachtelung ([an , bn ])n≥1 wird Eulersche Zahl genannt und mit e bezeichnet. Sie ist irrational, ihre ersten Stellen sind e = 2, 71828 . . . . 3.4 Konvergenzkriterien für Zahlenfolgen Wir wollen uns nun mit einigen Methoden beschäftigen, die es erlauben festzustellen, ob eine gegebene Zahlenfolge konvergiert oder divergiert. Zunächst halten wir einen einfachen Sachverhalt für Teilfolgen einer Folge fest. Dabei nennen wir G = (bj )j≥1 eine Teilfolge von F = (ai )i≥1 wenn G aus F durch Auslassen von Gliedern entsteht, d.h. es gibt eine aufsteigende Folge natürlicher Zahlen 1 ≤ i1 < i2 < . . . , so daß bj = aij für alle j = 1, 2, . . . . Satz 19 Eine Folge F = (ai )i≥1 konvergiert genau dann gegen die Zahl x, wenn jede Teilfolge G = (bj )j≥1 von F gegen x konvergiert. Weiterhin gilt für jede Folge F = (ai )i≥1 und jede natürliche Zahl k ≥ 1, daß die Teilfolge (ai )i≥k genau dann gegen x konvergiert, wenn F gegen x konvergiert. 31 Preliminary version – 3. Juli 2002 Beweis: Die Rückrichtung ist klar, da F eine Teilfolge von sich selbst ist. Gelte also limi→∞ ai = x und sei G = (bj )j≥1 eine beliebige Teilfolge von F . Dann gibt es zu jedem ε > 0 ein n0 , so daß |x − an | < ε für alle n ≥ n0 . Zu jedem Glied der Teilfolge G gibt es eine natürliche Zahl k mit bj = aj+k . Damit ergibt sich |x − bn | = |x − an+k | < ε für alle n ≥ n0 . Also gilt für die Teilfolge limj→∞ bj = x. Im zweiten Teil des Satzes wird eine spezielle Teilfolge (bj )j≥1 betrachtet, die durch Weglassen endlich vieler Anfangsglieder der Folge F entsteht, präziser gilt bj = ak+j−1 für j = 1, 2, . . . . Aus dem bisher gezeigten folgt bereits, daß diese im Falle der Konvergenz von F den gleichen Grenzwert wie F besitzt. Setzen wir nun umgekehrt voraus, daß die Teilfolge (bj )j≥1 gegen x konvergiert. Dann existiert zu beliebigem ε > 0 eine natürliche Zahl m0 so, daß |x − bm | < ε für alle m ≥ m0 . Wahl von n0 := m0 + k − 1 liefert |x − an | < ε für alle n ≥ n0 und bestätigt limi→∞ ai = x. 2 Bisher besteht ein wesentliches Problem der Untersuchung einer Zahlenfolge (ai ) auf Konvergenz darin, daß man eine Vermutung über ihren Grenzwert a benötigt, um die Größe |a − ai | untersuchen zu können. Dieses Problem läßt sich mit Hilfe des Cauchyschen Konvergenzkriteriums umgehen. Satz 20 (Cauchysches Konvergenzkriterium) Die Zahlenfolge F = (ai )i≥1 konvergiert genau dann, wenn zu jeder positiven reellen Zahl ε eine natürliche Zahl n0 existiert, so daß für alle n ≥ n0 und m ≥ n0 die Beziehung |an − am | < ε gilt. Beweis: (=⇒) F = (ai )i≥1 konvergiere gegen den Grenzwert a. Dann existiert zu jeder positiven reellen Zahl ε eine natürliche Zahl n0 , so daß Beziehung |a − an | < 2ε für alle n ≥ n0 . Seien nun n und m größer oder gleich n0 , dann haben wir ε ε |a − an | < , |a − am | < . 2 2 Anwendung der Dreiecksungleichung und Verwendung dieser beider Ungleichungen liefert ε ε |an − am | ≤ |an − a| + |a − am | < + = ε , 2 2 also erfüllt F das Cauchy-Kriterium. (⇐=) Nehmen wir nun umgekehrt an, daß das Cauchy-Kriterium erfüllt ist. Wir beschränken unsere Betrachtung auf Folgen mit reellen Gliedern, für komplexe Folgen verläuft der Beweis analog. 32 Preliminary version – 3. Juli 2002 Nach dem Cauchy-Kriterium existiert ein n0 mit |an − am | < 1 für alle n, m ≥ n0 . Folglich liegen alle Glieder an , n ≥ n0 , im abgeschlossenen Intervall I1 := [−(|an0 | + 1), |an0 | + 1].4 Wir halbieren I1 , in wenigstens einem der beiden Teilintervalle liegen unendlich viele Glieder der Folge, ein solches wählen wir als I2 . Auf diese Weise fahren wir fort und erhalten eine Intervallschachtelung mit der Eigenschaft, daß jedes der beteiligten Intervalle unendlich viele Folgenglieder enthält. Wir wollen uns überlegen, daß die Schnittzahl a dieser Intervallschachtelung Grenzwert von F ist. Nehmen wir einmal an, es gäbe eine positive reelle Zahl ε, so daß unendlich viele Folgenglieder außerhalb der Umgebung U2ε (a) liegen. Nach Konstruktion liegen aber auf jeden Fall auch unendlich viele Folgenglieder innerhalb von Uε (a). Aus an ∈ / U2ε (a) und am ∈ Uε (a) folgt auf jeden Fall |an −am | > ε. Es gibt unendlich viele n und unendlich viele m, welche die obige Bedingung erfüllen, also kann man bei beliebig vorgegebenem n0 auch immer zusätzlich n > n0 und m > n0 verlangen. Das widerspricht aber der Cauchy-Bedingung für dieses ε. Folglich liegen für jede positive reelle Zahl ε höchstens endlich viele Glieder der Folge außerhalb von Uε (a). Damit gibt es ein n0 , so daß an ∈ Uε (a) für alle n ≥ n0 und daher |a − an | < ε für alle n ≥ n0 . Also konvergiert F gegen a. 2 n−5 Beispiel: Wir untersuchen die Folge F = 6n+1 auf Konvergenz. Für alle n≥1 natürlichen Zahlen n und m mit 1 ≤ m ≤ n gilt n−5 m − 5 = |31n − 31m| |an − am | = − 6n + 1 6m + 1 (6n + 1)(6m + 1) 31n 31n 31 < < = m−1 (6n + 1)(6m + 1) 36nm 36 31 Zu beliebig vorgegebener positiver reeller Zahl ε und n0 := d 36ε e gilt also für alle natürlichen Zahlen n, m mit n0 ≤ m ≤ n die Ungleichung |an − am | < ε. Damit erfüllt unsere Folge das Cauchy-Kriterium und ist gemäß Satz 20 konvergent. 4 Da die Glieder der Folge reell sind, hätten wir sogar noch einfacher [an0 − 1, an0 + 1] als erstes Intervall wählen können. Dann ist aber die sinngemäße Übertragung auf die Konstruktion eines einschließenden Quadrats im komplexen Fall nicht mehr zu erkennen. Bei dem hier gewählten Intervall ist klar, daß I1 × I1 auch im Fall komplexer Glieder ein geeignetes Quadrat wäre. 33 Preliminary version – 3. Juli 2002 3.5 Grenzwertsätze für Zahlenfolgen Zu zwei gegebenen Zahlenfolgen F = (ai )i≥1 und G = (bi )i≥1 kann man die Zahlenfolgen (ai +bi )i≥1 , (ai bi )i≥1 , (−ai )i≥1 und (a−1 i )i≥1 betrachten und nach dem Zusammenhang der Konvergenzverhalten der Folgen F und G mit dem der zusammengesetzten Folgen fragen. Satz 21 Für konvergente Zahlenfolgen F = (ai )i≥1 und G = (bi )i≥1 gilt: 1. (ai + bi )i≥1 ist konvergent und es gilt limi→∞ (ai + bi ) = limi→∞ ai + limi→∞ bi 2. (ai bi )i≥1 ist konvergent und es gilt limi→∞ (ai bi ) = (limi→∞ ai ) (limi→∞ bi ) 3. die Folge (−ai )i≥1 ist konvergent und für ihren Grenzwert gilt limi→∞ (−ai ) = − limi→∞ ai 4. falls der Grenzwert a := limi→∞ ai von Null verschieden ist, so gibt es eine natürliche Zahl k mit ai 6= 0 für alle i ≥ k und die Folge (a−1 i )i≥k −1 1 1 konvergiert gegen a , d.h. limi→∞ ai = limi→∞ ai . 5. (ai − bi )i≥1 ist konvergent und es gilt limi→∞ (ai − bi ) = limi→∞ ai − limi→∞ bi 6. falls der Grenzwert a := limi→∞ ai von Null verschieden ist, sogibt es bi eine natürliche Zahl k mit ai 6= 0 für alle i ≥ k und die Folge ai i≥k konvergiert gegen limi→∞ bi ai = limi→∞ bi . limi→∞ ai Beweis: Zunächst führen wir die Bezeichungen a := limi→∞ ai und b := limi→∞ bi für die Grenzwerte der Folgen F beziehungsweise G ein. Zu beliebigem ε > 0 exisierten n0 und m0 , so daß |an − a| < ε für alle n ≥ n0 und |bm − b| < ε für alle m ≥ m0 gelten. 1. Für alle n ≥ max(n0 , m0 ) gilt |(an +bn )−(a+b)| = |(an −a)+(bn −b)| ≤ |an − a| + |bn − b| < 2ε, also konvergiert (ai + bi )i≥1 gegen a + b. 2. Für alle n ≥ max(n0 , m0 ) gilt |an bn − ab| = |(an − a)bn + (bn − b)a| ≤ |an − a||bn | + |bn − b||a|. Aufgrund der vorausgesetzten Konvergenz von G ist die Menge BildG = {bi | i = 1, 2, . . . } beschränkt, also gibt es ein c > 0 mit |bn | ≤ c für alle n ≥ 1 und wir schätzen weiter 34 Preliminary version – 3. Juli 2002 ab: |an bn − ab| ≤ |an − a|c + |bn − b||a| < ε(c + |a|). Sei ε1 > 0 beliebig vorgegeben, dann liefert Anwendung der obigen Überlegungen ε1 auf ε = c+|a| die Ungleichung |an bn − ab| < ε1 für alle n ≥ max(n0 , m0 ), also konvergiert (ai bi )i≥1 gegen ab. 3. Wegen | − an − (−a)| = |an − a| < ε für alle n ≥ n0 folgt der behauptete Grenzwert von (−ai )i≥1 unmittelbar aus limi→∞ ai = a. 4. Sei a 6= 0, dann gibt es ein k, so daß |ai −a| < |a| für alle i ≥ k, also gilt 2 für alle Glieder ai mit i ≥ k die Beziehung |ai | ≥ |a| . Insbesondere sind 2 die Glieder alle von Null verschieden, also sind die Glieder der Folge 1 n wohldefiniert. | a1n − a1 | = | a−a | = |a − an | |aa1n | ≤ |a|2 2 |a − an | < ai aan i≥k 2 . Also gibt es zu jedem ε1 > 0 ein ε := |a|2 ε1 , so daß | a1n − a1 | < ε1 für alle n ≥ max(n0 , k). Folglich konvergiert die Folge (a−1 i )i≥k gegen 1 den Grenzwert a . 2ε |a|2 5. und 6. folgen unmittelbar aus den ersten 4 Eigenschaften. 2 Übungsaufgaben, Serie 4 10. Berechnen Sie die Grenzwerte √ 1− n √ lim n→∞ 1 + n (n + 3)2 (2n − 1) − (5n + 3)3 lim n→∞ (n + 3)(2n − 1)(5n + 3) 2 n lim n→∞ n! (3.9) (3.10) (3.11) 11. Berechnen Sie den Grenzwert lim n→∞ 1 1+ n 2n+5 12. (an )n≥1 sei eine konvergente komplexe Zahlenfolge. Beweisen Sie, daß dann die reelle Zahlenfolge (|an |)n≥1 der Beträge ihrer Glieder ebenfalls konvergiert und die Gleichheit lim |an | = lim an n→∞ n→∞ 35 Preliminary version – 3. Juli 2002 vorliegt. Hinweis: Für alle komplexen Zahlen a und b gilt die Ungleichung |a − b| ≥ |a| − |b| . Diese darf ohne Beweis verwendet werden. Die Umkehrung von Satz 21 gilt nicht, so kann (ai + bi ) auch dann konvergieren, wenn (ai ) und (bi ) divergieren. Zum Beispiel konvergiert ((−1)i + (−1)i+1 ) gegen 0, obwohl weder ((−1)i ) noch ((−1)i+1 ) konvergent sind. Entsprechendes gilt auch für Differenz, Produkt und Quotient. Wenn jedoch nur eine der Folgen F oder G konvergiert und die andere divergiert, so sind Summe, Differenz und Produkt sicher divergent. Beim Quotienten sind noch weitere bi Fälle möglich. So kann ai auch dann konvergent sein, wenn F divergiert i≥1 und nichts über G vorausgesetzt wird. Zum Beispiel kann man die Nullfolge 1 als ein derartiges Beispiel auffassen. Hier divergiert die Nennerfolge i i≥1 (i)i≥1 . Ein ähnliches Beispiel, aber mit Zählerfolge ist die eben divergenter (−1)i . Auch wenn sowohl Zählerfalls gegen Null konvergierende Folge i i≥1 als auch Nennerfolge den Grenzwert 1 0 haben, kann die Folge der Quotienten konvergierten, z.B. konvergiert 1i gegen 1, obwohl der Nenner gegen i i≥1 Null konvergiert. Die übliche Anwendung des Satzes besteht darin, daß man Grenzwerte komplizierter Zahlenfolgen berechnen kann, wenn man die Grenzwerte gewisser einfacherer Folgen kennt, aus denen sich die komplizierte zusammensetzt. Beispiele: 1. Da für jedes ε > 0 und alle n > n0 := d 1ε e die Relation | n1 − 0| < ε zutrifft, gilt limn→∞ n1 = 0. Daraus ergibt sich 1 1 1 lim = lim lim =0 n→∞ n2 n→∞ n n→∞ n Mittels vollständiger Induktion über k zeigt man schließlich k 1 1 lim = lim =0 n→∞ nk n→∞ n für alle natürlichen Zahlen k ≥ 1. 36 Preliminary version – 3. Juli 2002 2. Sei (an )n≥1 eine konvergente komplexe Zahlenfolge. Dann gilt für jede natürliche Zahl k die Beziehung lim akn = n→∞ lim an n→∞ k Sind alle Glieder an und der Grenzwert limn→∞ an von Null verschieden, so gilt darüberhinaus auch die Gleichheit lim a−k n = n→∞ lim an n→∞ −k für beliebige natürliche Zahlen k. 3. Sei (an )n≥1 eine konvergente Folge positiver reeller Zahlen. Dann gilt für jede natürliche Zahl k ≥ 2 die Beziehung q √ lim k an = k lim an n→∞ Sofern der Grenzwert limn→∞ wegen n→∞ √ k an überhaupt existiert, so kann es sich √ k k lim an = lim ( an ) = n→∞ n→∞ k √ k lim an n→∞ nur um den oben behaupteten handeln. Daß der Grenzwert tatsächlich existiert, wollen wir hier nur ohne Beweis festhalten. 4. Aus den vorangegangenen beiden Beispielen ergibt sich sofort die Gleichheit q q lim an = lim an n→∞ n→∞ für jede konvergente Folge (an )n≥1 positiver reeller Zahlen und jede positive rationale Zahl q. Im Falle limn→∞ an 6= 0 gilt die Gleichheit sogar für beliebige rationale Zahlen q. Ohne Beweis merken wir an, daß die Aussagen auch allgemeiner für reelle Exponenten q gelten. 37 Preliminary version – 3. Juli 2002 5. 3n2 +n−5 2 lim n2n−1 n→∞ n2 3 + n1 − n52 = lim n→∞ 1 − n12 limn→∞ 3 + n1 − n52 = limn→∞ 1 − n12 3n2 + n − 5 lim = n→∞ n2 − 1 limn→∞ 3 + limn→∞ n1 − limn→∞ limn→∞ 1 − limn→∞ n12 3+0−0 = =3 1−0 = 5 n2 Man beachte, die Division von Zähler und Nenner durch die höchste auftretende n-Potenz war notwendig, damit die Zahlenfolgen der Zähler und Nenner konvergieren. Ein sofortiger Schritt der Art 3n2 + n − 5 limn→∞ (3n2 + n − 5) = n→∞ n2 − 1 limn→∞ (n2 − 1) lim ist unzulässig und würde nicht zum Ziel führen, da sowohl (3n2 + n − 5)n≥1 als auch (n2 − 1)n≥1 bestimmt divergent gegen +∞ sind. 6. Auf analoge Weise zeigt man ak nk + ak−1 nk−1 + · · · + a1 n + a0 lim = n→∞ bm nm + bm−1 nm−1 + · · · + b1 n + b0 ak bm 0 : falls k = m : falls k < m für beliebige komplexe Zahlen a0 , . . . , ak , b0 , . . . , bm mit k ≤ m, ak 6= 0 und bm 6= 0. Für a0 , . . . , ak , b0 , . . . , bm wie oben und k > m ist die Folge ak nk + ak−1 nk−1 + · · · + a1 n + a0 bm nm + bm−1 nm−1 + · · · + b1 n + b0 n≥1 stets divergent. Übungsaufgaben, Serie 5 13. Die Zahlenfolge F = (an )n≥1 habe den Grenzwert 0. G = (bn )n≥1 sei eine zweite Zahlenfolge, wobei für alle natürlichen Zahlen n ≥ 1 gilt, daß das n-te Glied von G einen höchstens so großen Betrag wie das n-te Glied von F hat. Beweisen Sie, daß dann limn→∞ bn = 0 gilt. 38 Preliminary version – 3. Juli 2002 14. Beweisen Sie die Gültigkeit von lim n→∞ √ n n=1 Hinweis: Zeigen Sie zunächst unter Verwendung der binomischen For√ n n mel ausgehend von der offensichtlichen Gleichheit n = (1 + ( n − 1)) √ 2 die Relation ( n n − 1) ≤ nn ≤ n4 für alle n ≥ 2 und verwenden Sie (2) diese Abschätzung unter Verwendung von Aufgabe 13 zur Berechnung √ n von limn→∞ ( n − 1). P 15. F = (an )n≥1 sei eine Zahlenfolge und P = (sn )n≥1 , mit sn = ni=1 ai für n ≥ 1, die Folge ihrer Partialsummen. Beweisen Sie, daß aus der Konvergenz von P die Konvergenz von F folgt und daß in diesem Falle darüberhinaus die Gleichheit limn→∞ an = 0 gilt. Hinweis: Nutzen Sie bei dem Beweis aus, daß P eine Cauchyfolge ist. 3.6 Reihen Definition 12 Sei F P = (ai )i≥0 eine Zahlenfolge5 . Dann nennt man sn := a0 + a1 + · · · + an = ni=0 die n-te Partialsumme von F . Die Folge P = (sn )n≥0 der Partialsummen von F bezeichnet man als unendliche Reihe mit den Gliedern ai , i ≥ 0. Falls die Folge P konvergiert, so nennt man ihren Grenzwert P S := limn→∞ sn die Summe der unendlichen Reihe und schreibt dafür S = ∞ i=0 ai . Es ist üblich, sowohl die Reihe P als auch den Grenzwert S mit der Symbolik P ∞ i=0 ai zu bezeichnen. Zu Verwechselungen kann dieser Bezeichnungskonflikt kaum führen, da aus dem Kontext heraus klar sein wird, über welches Objekt wir gerade sprechen. P Aufgrund dieses Doppellebens der Bezeichun∞ gen können wir auch dann i=0 ai schreiben, wenn die unendliche Reihe P divergiert. In diesem Fall steht die Symbolik natürlich für die Folge der Partialsummen und nicht für deren Grenzwert, welcher gar nicht existiert. P∞ Weiterhin werden die Sprechweisen, a ist konvergent oder divergent i=0 i gerechtfertigt, dabei bezieht sich die Symbolik wieder auf die Folge der Partialsummen. Ein Bezug auf den Grenzwert wäre unsinnig, denn dieser ist, 5 Natürlich gelten die Aussagen sinngemäß auch für Zahlenfolgen F = (ai )i≥k mit k > 0. 39 Preliminary version – 3. Juli 2002 sofern er überhaupt existiert, eine Zahl und eine Zahl kann nicht konvergieren P∞ ioder 1divergieren. Auf der anderen Seite können wir beispielsweise i=0 q = 1−q , wobei q eine von Null verschiedene komplexe Zahl vom Betrag kleiner 1 ist, schreiben. In diesem Falle steht die Symbolik offensichtlich für die Summe der Reihe, denn rechts steht einfach eine Zahl. P Eine notwendige Bedingung für die Konvergenz der unendlichen Reihe ∞ i=0 ai besteht darin, daß die Zahlenfolge F = (ai )i≥0 ihrer Glieder eine Nullfolge bildet, d.h. limi→∞ ai = 0 (siehe Übungsaufgabe 15). Man beachte, während das Konvergenzverhalten und der Grenzwert einer Zahlenfolge sich nicht ändert, wenn man endlich viele Anfangsglieder der P∞ Folge wegläßt, so hängt die Summe der unendlichen Reihe i=k ai natürlich vom Index k des ersten Folgengliedes ab. Für die bloße Beantwortung der Frage, ob die Summe überhaupt existiert, sind die Anfangsglieder der Folge jedoch wieder unerheblich und im Falle der Existenz der Summen besteht der Zusammenhang ∞ X ai = i=0 k−1 X ai + i=0 ∞ X ai . (3.12) i=k Die obige Gleichheit erscheint sich offensichtlich aus den Rechenregeln der komplexen Zahlen zu ergeben. Dabei ist allerdings große Vorsicht geboten, denn die üblichen Rechenregeln des Körpers der komplexen Zahlen beziehen sich nur auf Ausdrücke mit endlichen vielen Operationen. In der Tat werden wir später noch sehen, daß im Falle unendlicher Reihen manche scheinbar offensichtlichen Zusammenhänge verletzt sind. Fragen wir also nach einem ehrlichen Beweis der obigen Aussage. Aus den Rechenregeln der komplexen Zahlen folgt n X ai = i=0 k−1 X ai + k−1 X ai + zn , i=0 also sn = n X ai , i=k i=0 P∞ wobei sn die n-Partialsumme der Folge i=0 ai und zn die n-Partialsumme P∞ der abgeschnittenen Folge i=k ai bezeichnet. Anwendung des Grenzwert40 Preliminary version – 3. Juli 2002 satzes 21 liefert lim sn = lim n→∞ n→∞ k−1 X ai ! + lim zn = n→∞ i=0 k−1 X ai + lim zn . n→∞ i=0 Einsetzen der Summenschreibweise für die auftretenden Grenzwerte ergibt die behauptete Gleichheit 3.12. Auf analoge Weise zeigt man mit Hilfe von Satz 21 die Beziehung ∞ X (λai + µbi ) = λ i=0 ai + µ i=0 für beliebige konvergente Reihen Zahlen λ und µ. 3.6.1 ∞ X P∞ i=0 ai und ∞ X bi (3.13) i=0 P∞ i=0 bi und beliebige komplexe Unendliche geometrische Reihen In Abschnitt 3.2.1 hatten wir den Grenzwert der Zahlenfolge F = (ai )i≥1 für eine beliebige komplexe Zahl a untersucht. Für |a| > 1 war die Folge divergent. Für |a| = 1 konnten wir keine allgemeine Aussage über das Konvergenzverhalten der Folge treffen. Sicher ist aber, falls die Folge überhaupt konvergiert, so hat ihr Grenzwert den Betrag 1 und es handelt sich sicher um eine Nullfolge. Aus diesem Grund kann die Summe der Reihe P∞ nicht i a bestenfalls für |a| < 1 existieren, denn nur dann gilt wenigstens die i=0 notwendige Bedingung, daß die Glieder der Reihe eine Nullfolge bilden. Im Falle a = 0 sind sämtliche Partialsummen also auch die Summe der unendlichen Reihe 0. P i Betrachten wir nun den Fall 0 < |a| < 1. Man nennt ∞ i=0 a eine unendliche geometrische Reihe. Berechnen wir zunächst die n-te Partialsumme sn = Pn i i=0 a dieser geometrischen Reihe. In sehr vielen Fällen geht man so vor, daß man eine Vermutung über den Wert der Partialsumme aufstellt und diese dann mittels vollständiger Induktion bestätigt. Im vorliegenden Fall kommen wir auch etwas einfacher zum Ziel. Es gilt sn = 1 + n X i a =1+a i=1 n−1 X ai = 1 − an+1 + asn i=0 und Auflösen der Gleichung nach sn zeigt sn = 1 − an+1 . 1−a 41 Preliminary version – 3. Juli 2002 Damit kommen wir zum Überprüfen der Konvergenz der Folge P = (sn )n≥0 der Partialsummen. Mehrfache Anwendung von Satz 21 liefert: 1 − an+1 limn→∞ (1 − an+1 ) 1 − limn→∞ an+1 1 = = = . n→∞ 1 − a limn→∞ (1 − a) 1−a 1−a lim sn = lim n→∞ Man beachte, die Anwendung der Grenzwertsätze sind tatsächlich erlaubt, da sämtliche auftretende Grenzwerte tatsächlich existieren und der Nennergrenzwert aufgrund von a 6= 1 von 0 verschieden ist. Damit haben wir die Gleichung ∞ X i=0 ai = 1 wobei 0 < |a| < 1 1−a für die Summe der geometrischen Reihe nachgewiesen. Die Partialsummen der geometrischen Reihe sollten Ihnen aus der Schule unter dem Namen endliche geometrische Reihen Pn bekannt sein. Ebenso sollten Sie auch endliche arithmetische Reihen i=0 ai kennen, diese zeichnen sich dadurch aus, daß die Differenz zweier aufeinanderfolgender Glieder konstant ist, es gilt also ai+1 − ai = c für alle i = 0, . . . , n − 1. Betrachten wir nun eine unendliche Zahlenfolge F = (aj )j≥0 mit der Eigenschaft, daß die Differenz zweier beliebiger aufeinanderfolgender Glieder gleich c ist, so ergibt sich die Beziehung aj = a0 + jc für das j-te Glied der Folge. Für c 6= 0 ist der Bildbereich der Folge F unbeschränkt, denn für jede positive reelle Zahl K 0| und jedes n > K+|a gilt |an | > K . Damit ist klar, daß ein unendliche arith|c| metische Reihe 6= 0 stets divergiert. Selbst im Falle c = 0 konvergiert P mit cP ∞ die Reihe ∞ a = i=0 i i=0 a0 nur im trivialen Fall a0 = 0. Typische Anwendungen endlicher geometrischer Reihen findet man in der Finanzmathematik. So berechnet sich das Guthaben, welches aus einem Anfangskapital K nach n Jahren bei einem effektiven Jahreszins von p % p n entsteht als K 1 + 100 . Nehmen wir nun an, wir legen zum Zeitpunkt 0 ein Kapital K an und erhöhen unsere Anlage jeweils nach Ablauf eines Jahres um einen weiteren Betrag K. Die Anlage verläuft also nach dem Schema der Ansparphase eines Bausparvertrages mit jährlicher Zahlungsweise unter Vernachlässigung sämtlicher Gebühren. Dann haben wir nach n Jahren, präziser unmittelbar nach dem erneuten Einzahlen einer Rate, ein Guthaben von n n p n+1 X X 1 + 100 −1 p i p i K 1+ =K 1+ =K p 100 100 100 i=0 i=0 42 Preliminary version – 3. Juli 2002 angespart. Fragt man nun nach dem potentiellen Guthaben nach unendlich langer Ansparzeit, so bleibt festzustellen, daß die unendliche geometrische Reihe ∞ X i=0 p i K 1+ 100 p aufgrund von 1 + 100 > 1 divergiert. Alles andere wäre aber auch ein deprimierender Zustand, hieße es doch, daß man selbst bei unendlich langem Sparen nur eine begrenzte Menge Geld sammeln könnte. Betrachten wir eine andere ähnlich gelagerte Fragestellung, nur mit dem Unterschied, daß es sich nun bei p nicht um Zinsen, sondern um Depotgebühren handeln soll. K soll für eine Anzahl von Fondanteilen stehen, die wir jährlich neu erwerben. Mit der Bank wurde vereinbart, daß sie ihre Depotverwaltungsgebühren durch den jährlichen Verkauf von p % unserer Fondanteile realisiert. Der Einfachheit halber nehmen wir an, daß im Rahmen unseres Sparvertrages keine Ausgabeaufschläge auf die Fondanteile erhoben werden und daß beim jährlichen Kauf der K neuen Anteile eventuelle Gewinnausschütungen des Vorjahres voll verrechnet werden, d.h. reicht die Gewinnauschütung nicht zum Kauf von K neuen Anteilen aus, so schießen wir das fehlende Geld zu, übersteigt die Ausschütung den Wert von K neuen Anteilen, so lassen wir uns die Restsumme auszahlen. Wieviele Fondanteile besitzen wir dann nach n Jahren, wiederum unmittelbar nach dem Erwerb der neuen Anteile? Es handelt sich gerade um n n p n+1 X X 1 − 1 − 100 p i p i K 1− =K 1− =K p 100 100 100 i=0 i=0 Anteile. Bei diesem Vertrag ist die Anzahl der Anteile beschränkt, auch dann wenn er unendlich lange läuft. Die Folge der Partialsummen ist monoton wachsend und die Anzahl der Fondanteile in unserem Depot nähert sich asymptotisch der Zahl ∞ X i=0 p i 100K = K 1− 100 p an. Auch dieser Sachverhalt ist nicht unbedingt ein Grund zum Verzweifeln. Falls der Kurswert des Fond tendentiell steigt, so wächst unser Vermögen 43 Preliminary version – 3. Juli 2002 dennoch unbeschränkt an. Zum zweiten kann es durchaus sein, daß wir nach genügend langer Ansparzeit einen jährliche Gewinn aus unserem Sparvertrag abschöpfen können. Grob gesprochen tritt letzteres irgendwann ein, wenn die Dividendenrendite q die prozentualen Depotverwaltungskosten p übersteigt. In diesem Fall erhalten wir nach genügend langer Zeit ‘fast’ pq K Anteile jährlich ausgeschüttet, davon legen wir nur K wieder an und können ‘fast’ q−p Anteile zu Konsumptionszwecken verkaufen. p 3.6.2 Absolute Konvergenz P∞ Definition 13 Die unendliche Reihe n=0 an heißt absolut konvergent, falls P die unendliche Reihe ∞ |a | der Absolutbeträge der Glieder der Reihe konn n=0 vergiert. P Satz 22 Eine absolut konvergente Reihe ∞ n=0 an ist auch konvergent. Beweis: Nach dem Cauchyschen Konvergenzkriterium existiert zu beliebig vorgegebenem ε > 0 ein n0 , so daß für alle n, m ≥ n0 die Relation n m X X |ai | − |ai | < ε i=0 i=0 gilt. O.B.d.A. sei n ≤ m und p := m − n. Dann können wir die Ungleichung wie folgt umschreiben: n+p n+p n X X X |ai | − |ai | = |ai | = |an+1 | + · · · + |an+p | < ε i=0 i=0 i=n+1 Unter Verwendung der Dreiecksungleichung ergibt sich n+p n X X a − a i i = |an+1 + · · · + an+p | ≤ |an+1 | + · · · + |an+p | < ε , i=0 i=0 P∞ also bilden auch die Partialsummen von n=0 an eine Cauchyfolge und somit P∞ ist die unendliche Reihe n=0 an konvergent. 2 P∞ i Man sieht sofort, daß die unendliche geometrische Reihe i=0 a für jede komplexe Zahl a mit einem Absolutbetrag echt kleiner als 1 sogar absolut P∞ i konvergiert, da i=0 |a| ebenfalls eine konvergente geometrische Reihe ist. Später werden wir Beispiele für konvergente Reihe kennen lernen, für die die Summe der Absolutbeträge der Glieder divergiert. Die Umkehrung des obigen Satzes ist also im Allgemeinen falsch. 44 Preliminary version – 3. Juli 2002 3.6.3 Konvergenzkriterien unendlicher Reihen Kriterium von Leibniz Satz 23 (Kriterium von Leibniz) Sei F = (ai )i≥0 eine reelle Zahlenfolge mit folgenden drei Eigenschaften 1. limi→∞ ai = 0, d.h. F ist eine Nullfolge, 2. es gilt entweder ai = (−1)i |ai | für alle i ≥ 0 oder ai = (−1)i+1 |ai | für alle i ≥ 0, d.h. die Vorzeichen der Glieder alternieren6 , 3. |ai+1 | ≤ |ai | für alle i ≥ 0, d.h. die Folge der Beträge der Glieder ist monoton fallend. P Dann konvergiert die unendliche Reihe ∞ i=0 ai . Beweis: F seiPeine Folge mit den 3 genannten Eigenschaften. Wir wollen die Reihe ∞ i=0 ai mittels des Cauchyschem Kriteriums auf Konvergenz untersuchen, dazu brauchen wir zunächst eine Abschätzung des Ausdrucks Pm Pn | i=0 ai − i=0 ai | für zwei beliebige natürlichen Zahlen m, n mit 0 ≤ n < m. Unter Verwendung von Bedingung 2 erhalten wir m n X X ai − ai = |an+1 +. . .+am | = |an+1 | − |an+2 | + · · · + (−1)m−n+1 |am | i=0 i=0 Der äußere Betrag auf der rechten Seite kann weggelassen werden, denn mit Bedingung 3 ergibt sich für p := m − n und R := |an+1 | − |an+2 | + . . . + (−1)p+1 |an+p | die Abschätzung (|an+1 | − |an+2 |) + (|an+3 | − |an+4 |)+ · · · + (|a für p gerade n+p−1 | − |an+p |) R = ≥0 (|an+1 | − |an+2 |) + (|an+3 | − |an+4 |)+ · · · + (|an+p−2 | − |an+p−1 |) + |an+p | für p ungerade (3.14) 6 Die vorangegangene Beschreibung läßt die Möglichkeit ai = 0 zu. In diesem Falle müßte 0 immer das gerade passende Vorzeichen zugewiesen werden. Die nächste Bedingung erzwingt allerdings, daß aus ai = 0 auch aj = 0 für alle j ≥ i folgt. Es handelt sich dann also in Wirklichkeit nur um eine endliche Summe. Diesen Trivialfall wollen wir im Weiteren ausschließen und setzen ai 6= 0 für alle i ≥ 0 voraus. 45 Preliminary version – 3. Juli 2002 Eine ähnliche Überlegung zeigt |an+1 | − (|an+2 | − |an+3 |) + (|an+4 | − |an+5 |)+ · · · + (|an+p−2 | − |an+p−1 |) + |an+p | R = |a | − (|an+2 | − |an+3 |) + (|an+4 | − |an+5 |)+ n+1 · · · + (|an+p−1 | − |an+p |) für p gerade für p ungerade Zusammenfassend haben wir für alle natürlichen Zahlen n, m mit n < m die Gültigkeit von m n X X ai − ai ≤ |an+1 | i=0 i=0 nachgewiesen. Voraussetzung 1 sichert, daß zu jeder positiven reellen Zahl ε ein n0 mit |an | < ε für alle n ≥ n0 exisiert. Folglich gilt m n X X ai − ai ≤ |an+1 | < ε i=0 i=0 P für alle n0 ≤ n ≤ m, also erfüllt die Reihe ∞ i=0 ai die Voraussetzungen des Cauchyschen Kriteriums und ist somit konvergent. 2 Aus dem Beweis des obigen Satzes können wir sogar noch eine Abschätzung für die Abweichung der n-ten Partialsumme von der Summe der unendlichen Reihe ablesen. Satz 24 Sei F = (ai )i≥0 eine den Voraussetzungen des Leibniz-Kriteriums genügende reelle Zahlenfolge und S der Grenzwert der unendlichen Reihe (si )i≥0 der Partialsummen von F . Dann hat der “Reihenrest” S − sn für alle natürlichen Zahlen n ≥ 0 das gleiche Vorzeichen wie an+1 und es gilt |S − sn | ≤ |an+1 | . Für p ≥ 0 definieren wir Rp := |an+1 | − |an+2 | + . . . + (−1)p+1 |an+p | . Falls an negativ ist, so ist an+1 positiv und es ergibt sich Rp := an+1 − an+2 + . . . + (−1)p+1 an+p = sn+p − sn . 46 Preliminary version – 3. Juli 2002 (3.16) ≤ |an+1 | (3.15) Abschätzung (3.14) liefert schließlich sn+p ≥ sn für alle natürlichen Zahlen p ≥ 0. Die Menge der Partialsummen Pn = {sm | m ≥ n} ist also nach unten durch sn beschränkt. Wenn aber die Menge der Glieder einer reellen Zahlenfolge nach unten durch beschränkt ist, so ist auch ihr Grenzwert, sofern er überhaupt existiert, größer oder gleich jeder unteren Schranke der Menge. Wegen S = limi→∞ si erhalten wir also S ≥ sn und damit S − sn ≥ 0, das Vorzeichen stimmt also mit dem von an+1 überein. Ist an positiv, so können wir die Untersuchung durch Übergang zur Folge (−ai )i≥0 auf den obigen Fall zurückführen. Bei diesem Übergang ändern sich gerade die Vorzeichen der Summe der unendlichen Reihe und der Partialsummen. Somit erhalten wir (−S) − (−sn ) ≥ 0, also S − sn ≤ 0 und die Vorzeichengleichheit zu an+1 ist wiederum gezeigt. Kommen wir zum Nachweis der Ungleichung (3.16). Wir beginnen wieder mit dem Fall, daß an negativ ist. Aus (3.15) und dem eben gezeigten ergibt sich 0 < sn+p − sn = |sn+p − sn | ≤ |an+1 | = an+1 . Es folgt sn+p ≤ an+1 + sn und daher ist die rechte Seite an+1 +sn obere Schranke der Menge Pn = {sm | m ≥ n}. Analog zu oben folgt S ≤ an+1 + sn , also |S − sn | = S − sn ≤ an+1 = |an+1 | . Sei nun an positiv. Durch Übergang zu (−ai )i≥0 ergibt sich aus dem eben gezeigten die Ungleichung |S − sn | = −S − (−sn ) ≤ −an+1 = |an+1 | . Ungleichung (3.16) gilt also für jede natürliche Zahl n ≥ 0 unabhängig vom Vorzeichen von an . 2 Beispiel: Das klassische Beispiel für das Leibniz-Kriterium ist die sogenannte Leibnizsche Reihe ∞ X (−1)n+1 n=1 n =1− 1 1 1 + − + −··· 2 3 4 Man überzeugt sich leicht davon, daß die Folge der Glieder der Leibnizschen Reihe alle Voraussetzung von Satz 23 erfüllt, also ist sie konvergent. Satz 24 erlaubt es uns darüberhinaus, Angaben über die Größe der Summe n+1 S zu gewinnen. Alle Glieder an = (−1)n mit ungeradem Index sind positiv und die Glieder mit geradem Index sind negativ. Damit ist jede an einem 47 Preliminary version – 3. Juli 2002 P (−1)n+1 ungeraden Index endende Partialsumme 2k+1 größer oder gleich S n=1 n P (−1)n+1 und jede an einem geraden Index endende Partialsumme 2k kleiner n=1 n oder gleich S. Beispielsweise erhalten wir für k = 2 die Abschätzung 0, 583 < 7 1 1 1 7 1 47 =1− + − ≤S ≤ + = < 0, 784 12 2 3 4 12 5 60 Beachten Sie, wenn sie die Intervallgrenzen einer derartigen Einschließung gerundet angeben wollen, so dürfen Sie für die untere Grenze nur abrunden und für die obere Grenze nur aufrunden. Durch Vergrößern der natürlichen Zahl k erhält man immer engere Einschließungen des Grenzwertes, präzise ausgedrückt kann man sagen, [s2k , s2k+1 ]k≥1 ist eine Intervallschachtelung mit der Schnittzahl S. Ohne Beweis merken wir S = ln 2 an. Im folgenden werden wir nachweisen, daß die Leibnizsche Reihe nicht absolut konvergiert. Die Reihe ∞ X 1 1 1 = 1 + + ··· n 2 3 n=1 der Absolutbeträge der Leibnizschen Reihe nennt man harmonische Reihe. Um zu zeigen, daß die harmonische Reihe divergiert, werden wir nachweisen, daß die Folge ihrer Partialsummen keine Cauchyfolge bildet. Für jede natürliche Zahl k ≥ 2 gilt k |s2k − s2k−1 | = s2k − s2k−1 = 2 X i=2k−1 +1 > k−1 2X i=1 k−1 2 1 X 1 = k−1 i 2 +i i=1 1 2k−1 1 = = k k 2 2 2 Da es zu natürlichen jeder Zahl n0 eine natürliche Zahl k mit 2k−1 > n0 gibt, existiert z.B. für ε = 12 kein n0 mit |sm − sn | < ε für alle m, n ≥ n0 . Damit ist nachgewiesen, daß die Partialsummen der harmonischen Reihe keine Cauchyfolge bilden. Satz 25 Eine Reihe, deren Glieder alle nichtnegativ reell sind, konvergiert genau dann, wenn die Partialsummenfolge beschränkt ist. 48 Preliminary version – 3. Juli 2002 Beweis: Da die alle Glieder der Reihe nichtnegativ sind, wächst die Folge der Partialsummen monoton und die Behauptung folgt sofort aus Satz 18. 2 Beispiel: q sei eine rationale Zahl größer als 1. Dann konvergiert die unendP∞ liche Reihe n=1 n1q . Für k ≥ 2 gilt 2k−1 X−1 1 + i)q i=0 k−1 2k−1 X−1 1 2k−1 1 < = k−1 q = k−1 )q (2 (2 ) 2q−1 i=0 |s2k −1 − s2k−1 −1 | = s2k −1 − s2k−1 −1 = (2k−1 Sogar unabhängig von der konkreten Reihe gilt: k X (s2i −1 − s2i−1 −1 ) = −s22−1 −1 + s2k −1 = s2k −1 − s1 i=2 Weiter folgt s2k −1 = k X (s2i −1 − s2i−1 −1 ) + s1 i=2 i−1 i 1 − 1 k−1 k X X 1 1 (2q−1 )k + 1 = = < 1 2q−1 2q−1 1 − 2q−1 i=2 i=0 < 1 1− 1 q−1 2 Wegen q > 1 haben wir 1 − 1 q−1 2 > 0, also ist 1 q−1 1−( 12 ) eine von k un- abhängige positive reelle Zahl. Zu jeder natürlichen Zahl m gibt es eine natürliche Zahl k mit m < 2k − 1, damit folgt unter Beachtung ihrer Monotonie die Beschränktheit der und mit Satz 25 ergibt sich PPartialsummenfolge ∞ 1 die Konvergenz der Reihe n=1 nq . Majoranten- und Minorantenkriterium Satz 26 (Majorantenkriterium)PF = (ai )i≥0 sei eine Zahlenfolge. Falls eine konvergente unendliche Reihe ∞ i=0 bi mit positiven reellen Glieder existiert, so daß für alle i ≥ 0 die Ungleichung |ai | ≤ bi gilt7 , so konvergiert die 7 In diesem Fall nennt man P∞ i=0 bi eine Majorante von 49 Preliminary version – 3. Juli 2002 P∞ i=0 |ai |. Reihe P∞ i=0 ai absolut. P∞ Beweis: Es ist die Konvergenz von i=0 |ai | nachzuweisen. P P∞Wir bezeichnen die n-te Partialsumme von ∞ |a | mit s und die von i n i=0 i=0 bi mit zn . Die Folgen (sn )n≥0 und (zn )n≥0 sind beide monoton wachsend. Für beliebige natürliche Zahlen n, m mit n < m gilt |sm − sn | = sm − sn = m X |ai | ≤ i=n+1 m X bi = zm − zn = |zm − zn | i=n+1 P∞ Aus der P Cauchyfolgeneigenschaft von i=0 bi folgt damit unmittelbar, daß auch ∞ 2 i=0 |ai | eine Cauchyfolge ist. P∞ 1 Beispiel: Die unendliche Reihe Wir untersuchen n=0 n! ist P∞ 1 P∞konvergent. 1 zunächst die Reihe n=4 n! . Für diese ist n=4 n2 eine Majorante, denn für alle n ≥ 4 gilt n! ≥ n(n − 1)(n − 2) ≥ 2n(n − 1) > n2 . P∞ 1 P∞ 1 Aus der oben bewiesenen Konvergenz von folgt die von 2 n=4 n2 und n=1 P∞ 1 P∞ 1 n damit die von und schließlich . Am Rande sei die Gültigkeit n=4 n! n=0 n! P∞ 1 von n=0 n! = e angemerkt. Mit ähnliche Weise kann man zuweilen auch auf die Divergenz einer Reihe schließen. Satz 27 (Minorantenkriterium) F = (ai )i≥0 und G = (bi )i≥0 seien zwei Folgen positiver mit der Eigenschaft P reeller Zahlen P∞ai ≥ bi für alle i ≥ 0. 8 Falls dann ∞ b divergiert , so divergiert auch i=0 i i=0 ai . P P∞ Beweis: Da ∞ i=0 ai Majorante P∞von i=0 bi ist, würde ihre Konvergenz nach SatzP 26 die Konvergenz von i=0 bi zur Folge P∞ haben. Da aber die Divergenz von ∞ b vorausgesetzt ist, muß auch 2 i=0 i i=0 ai divergieren. P n2 −1 Beispiel: Die Reihe ∞ n=2 n3 −2n2 +n divergiert. Es gilt n2 − 1 n2 − 1 1 = > n3 − 2n2 + n n(n2 − 2n + 1) n P∞ 1 für alle n ≥ 2. Also ist die harmonische Reihe n=2 n eine divergente MinoP n2 −1 rante von ∞ n=2 n3 −2n2 +n , weshalb letztere ebenfalls divergieren muß. 8 Man nennt P∞ i=0 bi eine Minorante von P∞ i=0 ai 50 Preliminary version – 3. Juli 2002 Wurzelkriterium Satz 28 (Wurzelkriterium) Es sei plexen Gliedern. P∞ i=0 ai eine unendliche Reihe mit kom- 1. Gibt es ein ϑ mit 0 < ϑ < 1 und eine natürliche Zahl n0 ≥ 1,P so daß p n |an | ≤ ϑ für alle natürlichen Zahlen n ≥ n0 , so konvergiert ∞ i=0 ai absolut. p 2. Gibt es eine natürliche P Zahl n0 ≥ 1, so daß n |an | ≥ 1 für alle n ≥ n0 , so divergiert die Reihe ∞ i=0 ai . 3. Falls es zu jeder natürlichen Zahl n0 eine p P∞natürliche Zahl n ≥ n0 mit n |an | ≥ 1 gibt, so divergiert die Reihe i=0 ai . p Beweis: 1) Sei also n |an | ≤ ϑ für alle n ≥ n0 und 0 < ϑ < P 1. Dann gilt ∞ n i |an | ≤ ϑ für alle n ≥ n0 . Daher P∞ ist die geometrische Reihe i=n0 ϑ eine konvergente Majorante von i=n0 |ai | und es folgt die absolute Konvergenz P∞ von i=0 aip . 2) Sei nun n |an | ≥ 1 für alle n ≥ n0 . Dann gilt |an | > 1 für alle nP≥ n0 . Damit sind (|an |)n≥1 und (an )n≥1 sicher keine Nullfolgen, weshalb ∞ i=0 ai nicht konvergieren kann. 3) Diese Eigenschaft ist etwas schwächer als 2). Sie sagt aus, daß es Glieder mit beliebig hohem Index gibt, deren Betrag größer als 1 ist. Das reicht natürlich bereits aus, um auszuschließen, daß (an )n≥1 Nullfolge ist. 2 P −n Beispiel: Die Reihe ∞ ist konvergent, denn für alle n ≥ 2 gilt n=1 n s n √ 1 1 1 n n−n = n = ≤ . n n 2 p p Die Bedingung n |an | ≤ ϑ < 1 aus 1) kann nicht einfach durch n |an | < 1 ersetzt werden. Diese Bedingung wäre eine echte Abschwächung und der Satz q würde mit ihr nicht mehr gelten, wie das folgende Beispiel zeigt. Es gilt 1 < 1 für alle n n P∞ 1 n=1 n divergiert. n ≥ 2, aber wir wissen bereits, daß die harmonische Reihe 51 Preliminary version – 3. Juli 2002 Quotientenkriterium P Satz 29 (Quotientenkriterium) Es sei ∞ i=0 ai eine unendliche Reihe mit von Null verschiedenen komplexen Gliedern. 1. Gibt es ein ϑ mit 0 < ϑ < 1 und eine natürliche Zahl n0 , so daß P∞ an+1 an ≤ ϑ für alle natürlichen Zahlen n ≥ n0 , so konvergiert i=0 ai absolut. P an+1 2. Gilt an > 1 für alle n ≥ 0, so divergiert ∞ i=0 ai . Beweis: 1) O.B.d.A. können wir n0 = 0 annehmen. Gegebenenfalls lassen wir die ersten Glieder der Reihe weg und numerieren die verbleibenden Glieder neu bei Null beginnend. Aus der absoluten Konvergenz der Restsumme folgt dann natürlich die absolute Konvergenz der Gesamtsumme inklusive der ersten Glieder. an+1 Sei an ≤ ϑ für alle n ≥ 0. Dann gilt |an+1 | ≤ |an |ϑ und weiter |an+2 | ≤ |an+1 |ϑ ≤ |an |ϑ2 für alle n ≥ 0. Durch vollständige Induktion zeigt man schließlichP |an | ≤ |a0 |ϑn für alle n ≥ 0. P∞ ∞ n Damit ist |a |ϑ eine Majorante von 0 n=0 n=0 |an |. Die geometrische P∞ n P P∞ nReihe ∞ n n=0 ϑ konvergiert, also konvergiert auch n=0 |a0 |ϑ = |a0 | n=0 ϑ und P ∞ schließlich folgt die absolute Konvergenz von n=0 an . 2) Die Folge der Glieder der Reihe (|an |)n≥0 sind monoton wachsend. Eine monoton wachsende P Folge positiver reeller Zahlen kann aber niemals Nullfolge sein, also ist ∞ 2 n=0 an divergent. Beispiel: Aus dem Quotientenkriterium folgt die Konvergenz der unendlichen Reihe ∞ X 2n , n! i=0 denn für alle n ≥ 2 gilt an+1 an+1 2n+1 n! 2 2 = = = ≤ <1. an n an (n + 1)!2 n+1 3 Ähnlich dem Wurzelkriterium können die Voraussetzungen auch hier nicht an+1 zu an < 1 abgeschwächt werden. 52 Preliminary version – 3. Juli 2002 Die Bedingungen des Wurzel- oder des Quotientenkriteriums sind durchaus nicht notwendig für die KonvergenzPeiner Reihe. So haben wir früher bereits ∞ 1 daß die unendliche Reihe i=0 n2 absolut konvergiert. Es gilt aber gezeigt, an+1 n2 Die Folge dieser Quotienten ist monoton wachsend und an = (n+1) 2. hat den Grenzwert 1. Aus diesem Grund übersteigen die Quotienten für genügend große n jede vorgegebene Zahl ϑ < 1. Übungsaufgaben, Serie 6 16. Untersuchen Sie die folgenden Reihen auf Konvergenz (a) ∞ X (n + 1) an , wobei a ∈ C mit |a| < 1 n=1 (b) ∞ X (−1)n n=2 n2 n −1 (c) ∞ X an , wobei an = n=0 1 2n − 31n falls n ungerade falls n gerade 17. Zeigen Sie, daß die unendliche Reihe ∞ X (an − an+1 ) n=0 genau dann konvergiert, wenn die Zahlenfolge (an )n≥0 konvergent ist. Zeigen Sie weiterhin, daß im Fall der Konvergenz die Gleichheit ∞ X (an − an+1 ) = a0 − lim an n→∞ n=0 zutrifft. 53 Preliminary version – 3. Juli 2002 18. Berechnen Sie unter Verwendung von Aufgabe 17 die Summen der folgenden unendlichen Reihen: (a) ∞ X n=2 1 1 1 1 Hier noch eine kleine Hilfe: = − n(n − 1) n(n − 1) n−1 n (b) ∞ X √ 2n+1 2n+1 − √ 2n 2n n=1 (c) ∞ X n (−1) n=1 1 1 + 2n + 3 2n + 1 (d) ∞ X n=1 3.6.4 2 n(n + 1)(n + 2) Der große Umordnungssatz Wir wollen uns nun der Frage zuwenden, inwieweit man die Summanden einer Punendlichen Reihe zusammenfassen bzw. umordnen P∞ darf. P∞ Sei ∞ a eine unendliche Reihe. Dann sagt man, i=0 i i=0 bi geht aus i=0 ai durch Klammersetzung hervor, wenn es eine streng Pn0 monoton wachsende Pnj Folge (nj )j≥0 natürlicher Zahlen gibt, so daß b0 = i=0 ai und bj = i=nj−1 +1 ai für alle j ≥ 1 gelten. Das folgende Bild veranschaulicht diese Sprechweise: (a0 + a1 + · · · + an0 ) + (an0 +1 + · · · an1 ) + (an1 +1 + · · · an2 ) + · · · | {z } | {z } | {z } b0 b1 b2 P∞ Falls die unendliche Reihe ai konvergiert, so konvergiert auch jede uni=0 P P∞ endliche Reihe i=0 bi , die aus ∞ i=0 ai durch Klammersetzung hervorgeht. Darüberhinaus gilt ∞ ∞ X X ai = bi . i=0 i=0 54 Preliminary version – 3. Juli 2002 Der von P∞ Beweis dieser Aussage ist einfach, denn die Folge der PPartialsummen ∞ i=0 bi ist eine Teilfolge der Partialsummenfolge von i=0 ai und aus Satz 19 folgt die Behauptung. Die der Konvergenz von P∞ Umkehrung ist im allgemeinen falsch, d.h.Paus ∞ b braucht keinesfalls die Konvergenz von a i=0 i i=0 i zu folgen. Ein einP∞ i faches Beispiel ist die Reihe i=0 (−1) . Ihre Glieder bilden nicht einmal eine Nullfolge, daher ist sie divergent. Klammern wir nun gemäß der Folge (2j + 1)j≥0 , d.h. (1 − 1) + (1 − 1) + (1 − 1) + · · · , | {z } | {z } | {z } b0 =0 b1 =0 b2 =0 P∞ so gelangen wir zur konvergenten Reihe i=0 0. P∞ Sei i=0 ai eine unendliche Reihe und π : N → N eine bijektive Abbildung der natürlichen Zahlen auf sich,P d.h. eine Permutation der P∞Menge der ∞ natürlichen Zahlen, dann P sagt man i=0 i=0 ai durch Pa∞π(i) entsteht aus ∞ Umordnung. Wenngleich i=0 aπ(i) aus i=0 ai nur dadurch entsteht, daß man das Kommutativgesetz der komplexen Zahlen anwendet, so brauchen die beiden Summen keineswegs gleich zu sein. Eine positive Aussage gilt aber doch: Satz 30 Wenn eine Reihe absolut konvergiert, so konvergiert auch jede aus ihr durch Umordnung entstehende Reihe mit der gleichen Summe. Auf den Beweis des Satzes wollen wir verzichten. Aus einer Reihe, die konverP (−1)n+1 , giert aber nicht absolut konvergiert, z.B. die Leibnizsche Reihe ∞ i=1 n können durch Umordnung Reihen mit anderen Summen entstehen. Man spricht daher auch von bedingt konvergenten Reihen. P (−1)n+1 Beispiel: Sei S = ∞ die Summe der Leibnizschen Reihe. Durch i=1 n Klammersetzung enstehen die Reihen ∞ X an = n=1 und ∞ X n=1 bn = ∞ X n=1 ∞ X n=1 1 1 − 2n − 1 2n 1 1 1 1 − + − 4n − 3 4n − 2 4n − 1 4n welche ebenfalls die Summe S haben. 55 Preliminary version – 3. Juli 2002 , Betrachten wir nun die Reihe ∞ X cn = n=1 ∞ X n=1 1 1 1 + − 4n − 3 4n − 1 2n Für alle n ≥ 1 gilt cn = 12 an + bn und daher gilt unter Anwendung von Gleichung (3.13) die Beziehung ∞ ∞ ∞ ∞ X X X 1 1X 3 cn = an + b n = an + bn = S . 2 2 n=1 2 n=1 n=1 n=1 P Andererseits entsteht aber ∞ n=1 cn selbst einfach durch Umordnung aus der Leibnizschen Reihe. Die Umordnung bewirkte ein Ändern der Summe von S auf 23 S. Eine Anwendung des vorangegangenen Satz ist Satz 31 (Großer Umordnungssatz) Sei (ai,j )i,j≥0 eine Doppelfolge. Mittels einer bijektiven Abbildung ϕ : N × N → N kann man der Doppelfolge eine gewöhnliche Zahlenfolge P (bk )k≥0 , wobei bk = ai,j für alle i, j ≥ 0 und k = ϕ(i, j), zuordnen. Falls ∞ k=0 bk absolut konvergiert, so gelten die folgenden Aussagen: P∞ 1. P für jedes feste i ≥ 0 konvergiert j=0 ai,j absolut, wir setzen Zi = ∞ a , j=0 i,j P∞ 2. P für jedes feste g ≥ 0 konvergiert i=0 ai,j absolut, wir setzen Sj = ∞ i=0 ai,j , P P∞ 3. die Reihen ∞ j=0 Zi und i=0 Sj konvergieren absolut und ihre Summen sind gleich: ! ! ∞ ∞ ∞ ∞ ∞ ∞ ∞ X X X X X X X Zi = ai,j = bk = ai,j = Sj i=0 i=0 j=0 k=0 j=0 i=0 j=0 Die Elemente einer Doppelfolge (ai,j )i,j≥0 lassen sich als Einträge der unendlich reihigen Matrix a0,0 a0,1 a0,2 · · · a1,0 a1,1 a1,2 · · · a2,0 a2,1 a2,2 · · · .. .. .. . . . 56 Preliminary version – 3. Juli 2002 auffassen. Zi entspricht der Summe der i-ten Zeile, analog ist Sj die Summe der j-ten Spalte. Der große Umordungssatz besagt, daß es egal ist, ob man die Elemente zeilenweise oder spaltenweise aufsummiert. Voraussetzung dafür ist allerdings, daß eine Reihe, die alle Matrixeinträge als Glieder hat, absolut konvergieren muß. 3.6.5 Multiplikation unendlicher Reihen In Gleichung (3.13) hatten wir gezeigt, wie sich Summen und Linearkombinationen unendlicher Reihen berechnen lassen. Für Produkte haben wir eine derartige Formel bisher noch nicht. Wünschenswert wäre natürlich eine Beziehung der Art ∞ X ai i=0 ! ∞ X bj j=0 ! = ∞ ∞ X X i=0 ai b j ! = j=0 ∞ ∞ X X j=0 b j ai ! (3.17) i=0 Die Überlegungen zum großen zeigen allerdings, daß die P∞ Umordnungssatz P∞ Konvergenz der Reihen a und b dafür sicher nicht ausreicht. i=0 i j=0 j Die Produkte ai bj bilden eine Doppelfolge (ai bj )i,j≥0 . Nur wenn sich die Elemente der Doppelfolge so linear numerieren lassen, daß die Reihe mit diesen Gliedern absolut konvergiert, dann können wir uns sicher sein, daß Gleichung (3.17) gilt. Allerdings ist die Überprüfung der absoluten Konvergenz einer linearen Anordnung der Doppelfolge ein schwer handhabbares Problem. Es läßt P∞sich P∞ aber zeigen, daß die absolute Konvergenz der Reihen i=0 ai und j=0 bj hinreichend dafür ist. Wir halten also fest: P∞ Satz 32 (Cauchysche Produktreihe) Die unendlichen Reihen P∞ P∞ i=0 ai und P∞ i=0 ai und B = j=0 bj . Weij=0 bj seien absolut konvergent mit A = terhin sei ϕ : N × N → N eine bijektive Abbildung und c := ai bj für alle k P∞ i, j ≥ 0 und k = ϕ(i, j). Dann ist k=0 ck ebenfalls absolut konvergent und es gilt ! ∞ ! ! ! ∞ ∞ ∞ ∞ ∞ ∞ X X X X X X X A·B = = ck = ai b j = b j ai ai bj i=0 j=0 i=0 k=0 = ∞ X m=0 m X j=0 bn am−n n=0 57 Preliminary version – 3. Juli 2002 ! j=0 i=0 (3.18) Der Ausdruck (3.18) wird Cauchysche Produktreihe genannt. Ein entscheidender Vorteil dieser Darstellung gegenüber den beiden darüberstehenden Doppelsummen besteht darin, daß hier nur die äußere Summe eine unendliche Reihe ist. P∞ P∞ Beweis: Wir betrachten die Doppelfolge (ai bj )i,j≥0 . j=0 (ai bj ) = ai j=0 bj ist die i-te Zeilenreihe dieser Doppelfolge. Die Zeilenreihen sind absolut konP∞ P∞ P∞ vergent, denn j=0 |ai bj | = |ai | j=0 |bj | =: Zi und die Reihe j=0 P|bj | konvergiert aufgrund der vorausgesetzten absoluten Konvergenz von ∞ j=0 bj . Darüberhinaus konvergiert auch die Summe ! ! ∞ ! ∞ ∞ ∞ ∞ X X X X X Zi = |ai | |bj | = |bj | |ai | . i=0 i=0 j=0 j=0 i=0 P Dabei wurde ausgenutzt, daß die Summe ∞ j=0 |bj | eine feste Zahl ist, welche gemäß der RechenregelP(3.13) für Linearkombinationen vor die Summe P∞gezo∞ gen werden kann. Da i=0 ai absolut P∞ konvergiert, konvergiert auch i=0 Zi . Untersuchen wir P∞ck auf absolute Konvergenz. Zu jeder P nun die Reihe k=0 |c | der Reihe Partialsumme m k k=0 |ck | gibt es eine natürliche Zahl M , k=0 P Pm M PM so daß j=0 |ai bj |, M braucht nur groß genug gewählt i=0 k=0 |ck | ≤ zu werden, so daß aus ϕ(i, j) ≤ m die Ungleichungen iP ≤ M und j ≤ M folgen. Damit sind die Partialsummen nach oben durch ∞ i=0 Zi beschränkt P und aufgrund der Monotonie der Partailsummenfolge konvergiert ∞ k=0 |ck |. Somit ist der große Umordnungssatz auf die Doppelfolge (ai bj )i,j≥0 anwendbar und es ergibt sich ! ! ! ∞ ∞ ∞ ∞ ∞ m ∞ X X X X X X X ck = ai b j = b j ai = bn am−n . k=0 i=0 j=0 j=0 i=0 m=0 n=0 Die letzte Gleichheit ergibt sich daraus, daß die Cauchysche Produktreihe durch P∞ Umordnung und Klammerung aus der absolut konvergenten Reihe k=0 ck entsteht, dabei werden die Elemente der unendlichen Matrix a0 b 0 a0 b 1 a0 b 2 · · · a1 b 0 a1 b 1 a1 b 2 · · · a2 b 0 a2 b 1 a2 b 2 · · · .. .. .. . . . 58 Preliminary version – 3. Juli 2002 entlang der Nebendiagonalen durchlaufen und die zur selben Nebendiagonale gehörigen Elemente geklammert. Es fehlt noch der Nachweis der Gleichheit der Summen zum Produkt A · B. Diese folgt unter Anwendung von Gleichung (3.13) beispielsweise folgendermaßen: ! ! ! ∞ ∞ ∞ ∞ ∞ ∞ X X X X X X ai b j = bj ai = bj · A = A · bj = A · B . j=0 i=0 j=0 i=0 j=0 j=0 2 59 Preliminary version – 3. Juli 2002 Kapitel 4 Potenzreihen Potenzreihen stellen eine Verallgemeinerung von Polynomen dar. Ähnlich wie die Polynome haben auch Potenzreihen ein Doppelleben. Wir wollen uns hier auf den Fall komplexer Koeffizienten beschränken. Zum einen ist eine (formale) Potenzreihe eine Abbildung f : N → C der natürlichen in die komplexen Zahlen. Die f (i) =: ai , i = 0, 1, . . . , sind die Koeffizienten der Potenzreihe. Man führt eine Unbestimmte x ein und verwendet die formale Schreibweise f= ∞ X ai xi = a0 + a1 x + a2 x2 + · · · . i=0 Im Gegensatz zu den Polynomen verzichtet man auf die Forderung, daß die Abbildung f nur an endlich vielen Stellen von Null verschiedene Werte annehmen darf. Die zweite Natur der Polynome besteht in der Deutung als Polynomfunktion. Durch die Abbildungsvorschrift F (α) := a0 + a1 α + a2 α2 + · · · an αn für alle α ∈ C definiert das Polynom a0 + a1 x + a2 x2 + · · · + an xn eine (totale) komplexe Funktion F : C → C. Die naheliegende Übertragung des Funktionscharakters auf Potenzreihen besteht in der Zuordnungsvorschrift F (α) := ∞ X ai αi für alle α ∈ C i=0 60 Preliminary version – 3. Juli 2002 zur formalen Potenzreihe f= ∞ X ai xi . i=0 P∞ i Dabei ist der Ausdruck P i=0 ai α als Summe einer unendlichen Reihe zu ver∞ stehen. Falls die Summe i=0 ai αi aufgrund der Divergenz der unendlichen Reihe nicht existiert, so gehört α nicht dem Definitionsbereich der Funktion F an. In der Analysis steht die Auffassung einer Potenzreihe als (partielle) komplexe Funktion im Vordergrund. Man definiert: Definition 14 (an )n≥0 sei eine Zahlenfolge und a und x seien komplexe Zahlen. Unter der Potenzreihe in x − a mit den Koeffizienten an , n ≥ 0, versteht man die unendliche Reihe ∞ X an (x − a)n . n=0 Hierbei treffen wir die Vereinbarung, daß auch im Falle x = a die Gleichung (x − a)0 = 1 gelten soll. Die Koeffizientenfolge (an )n≥0 und die Zahl a werden als fest vorgegeben angesehenPund man interessiert sich für das Konvergenzverhalten der Pon tenzreihe ∞ n=0 an (x − a) in Abhängigkeit von der Zahl x. Man betrachtet die Potenzreihe also als eine komplexe Funktion in der Variablen x und fragt nach ihrem Definitionsbereich. Im Fall a = 0 sind die hier definierten Potenzreihen den oben eingeführten formalen Potenzreihen optisch gleich. Auf die Bedeutung derPZahl a wird später noch eingegangen. n Jede Potenzreihe ∞ n=0 an (x − a) konvergiert wenigstens für x = a, denn in diesem Falle verschwinden alle Glieder an (x − a)n der ReihePfür n ≥ 1. n Es gibt Potenzreihen, die nur für x = a konvergieren, z.B. ∞ n=0 n!(x − a) . Wenden wir für eine beliebige komplexe Zahl x 6= a das Quotientenkriterium an, so stellen wir (n + 1)!(x − a)n+1 = |(n + 1)(x − a)| > 1 n!(x − a)n P 1 für alle n ≥ |x−a| fest und folglich divergiert die unendliche Reihe ∞ n=0 n!(x− n a) nach Satz 29(2). 61 Preliminary version – 3. Juli 2002 Auf der anderen Seite es auch Potenzreihen, die für jede komplexe Zahl x P∞gibt(x−a) n konvergieren, z.B. n=0 n! . Anwendung des Quotientenkriteriums liefert (x − a)n+1 n! x − a 1 (n + 1)!(x − a)n = n + 1 < 2 für alle n ≥ 2|x − a|. Anwendung von Satz 29(1) bestätigt unsere Behauptung. Neben den beschriebenen Extremfällen, daß die Potenzreihe nur für x = a beziehungsweise für beliebige x konvergiert können natürlich noch Zwischenfälle auftreten. P n Beispiel: Die Potenzreihe ∞ für alle komplexen Zahlen n=0 (x−a) P∞konvergiert x mit |x − a| < 1 absolut, da dann n=0 |x − a|n eine konvergente geometrische Reihe ist. Dagegen ist die obige Potenzreihe für alle komplexen Zahlen x mit |x − a| ≥ 1 sicher divergent, denn ihre Glieder bilden dann nicht einmal eine Nullfolge. Das Konvergenzgebiet dieser Potenzreihe hat eine sehr einfache Gestalt, die Menge aller derjenigen komplexen Zahlen x für die die Potenzreihe konvergiert ist gerade das Innere des Kreises der komplexen Zahlenebene mit dem Radius 1 um den Mittelpunkt a. Der nächste Satz zeigt, daß diese einfache Gestalt des Konvergenzgebietes in diesem Beispiel nicht nur zufällig auftritt. 4.1 Konvergenzradius und Konvergenzkreis P n Satz 33 Die Potenzreihe ∞ n=0 an (x − a) möge nicht nur für x = a aber auch nicht für alle Dann existiert eine positive reelle P∞x ∈ C konvergieren. n Zahl ρ, so daß n=0 an (x − a) für alle x ∈ C mit |x − a| < ρ absolut konvergiert und für alle x ∈ C mit |x − a| > ρPdivergiert. Diese Zahl ρ nennt n man den Konvergenzradius der Potenzreihe ∞ n=0 an (x − a) . Zum Beweis des Satzes benötigen wir zwei Lemmata. P n Lemma 1 Falls die Potenzreihe ∞ n=0 an (x−a) für x = x0 6= a konvergiert, so konvergiert sie für alle komplexen Zahlen x ∈ C mit |x − a| < |x0 − a| absolut. Beweis: Für x = a ist die absolute Konvergenz der Potenzreihe klar, betrachten wir also ein beliebiges x mit 0 < |x − a| < |x0 − a|. Dann ist der Quotient ϑ := |x|x−a| eine reelle Zahl mit 0 < ϑ < 1. 0 −a| 62 Preliminary version – 3. Juli 2002 Untersuchen wir nun die Reihe Für alle n ≥ 0 gilt P∞ n=0 an (x − a)n auf absolute Konvergenz. |an (x − a)n | = |an | |(x − a)n | ≤ |an ||x0 − a|n ϑn P n Aufgrund der Konvergenz der unendlichen Reihe ∞ n=0 an (x0 − a) bilden ihre Glieder an (x0 − a)n eine Nullfolge. Bereits die Konvergenz der Folge der Glieder impliziert aber, daß die Absolutbeträge der Glieder nach oben beschränkt sind, sei also K eine positive reelle Zahl mit |an (x0 − a)n | = |an | |(x0 − a)n | ≤ K für alle n ≥ 0. Einsetzen in die obige Abschätzung ergibt |an (x − a)n | ≤ Kϑn P P∞ n Also ist ∞ Reihe |an (x − a)n |. n=0 Kϑ eine Majorante der unendlichen n=0 P∞ P ∞ n Die Konvergenz der Majorante folgt wegen Pn=0 Kϑn = K P n=0 ϑ sofort ∞ ∞ aus der Konvergenz der geometrischen Reihe n=0 ϑn . Also ist n=0 an (x − a)n für alle x ∈ C mit |x − a| < |x0 − a| absolut konvergent. 2 Umgekehrt gilt P n Lemma 2 Falls die Potenzreihe ∞ n=0 an (x − a) für x = x0 6= a divergiert, so divergiert sie für alle komplexen Zahlen x ∈ C mit |x − a| > |x0 − a|. Beweis: Angenommen, x ∈ C mit |x − a| > |x0 − a|, für welches P∞ es gäbe ein n die Potenzreihe n=0 an (x − a) konvergiert. Dann müßte die Potenzreihe wegen |x0 − a| < |x − a| nach dem vorangegangenen Lemma für x0 absolut konvergieren. Das steht aber im Widerspruch zur vorausgesetzten Divergenz P∞ 2 von n=0 an (x0 − a)n . Beweis von SatzP 33. Sei D ⊂ C die Menge aller komplexen Zahlen x für die n die Potenzreihe ∞ n=0 an (x − a) konvergiert und B := {|x − a| : x ∈ D} die Menge der Abstände der Elemente von D von a. Da die Potenzreihe nach Voraussetzung nicht für alle komplexen Zahlen x konvergieren sollte, gibt es eine Zahl x = x0 , für die die Potenzreihe divergiert. Nach Lemma 2 ist r := |x − x0 | eine obere Schranke der Menge B. Nach Satz 1 besitzt B eine obere Grenze ρ. Sei nun x ∈ C so, daß |x − a| < ρ. Dann existiert aufgrund der Eigenschaften der oberen Grenze ein x0 ∈P D mit |x − a| < |x0 − a| < ρ. 0 0 n x ∈ D bedeutet, daß die unendliche Reihe ∞ n=0 an (x − a) konvergiert, also folgt aus Lemma 1 wegen |x − a| < |x0 − a| die absolute Konvergenz der Potenzreihe für x. Damit ist gezeigt, daß die obere Grenze der Menge B alle 63 Preliminary version – 3. Juli 2002 Anforderungen an den Konvergenzradius der Potenzreihe erfüllt. P∞ n=0 an (x − a)n 2 Für die in Satz 33 ausgeschlossenen Fälle legt man formal den Konvergenzradius ρ = 0 für Potenzreihen fest, die nur für x = a konvergieren, und den Konvergenzradius ρ = ∞ für Potenzreihen fest, die in jedem Punkt x ∈ C konvergieren. Die Menge D aller komplexen Zahlen, für die die Potenzreihe P∞ Struktur der n a (x − a) konvergiert, legt die Einführung des Begriffes Konvergenzn=0 n P ∞ n kreis von n=0 an (x − a) für D nahe. Gemäß Satz 33 konvergiert die Potenzreihe für jeden inneren Punkt ihres Konvergenzkreises absolut und sie divergiert für jeden äußeren Punkt ihres Konvergenzkreises. Das Konvergenzverhalten in den Randpunkten des Konvergenzkreises hängt von den konkreten Koeffizienten an der Potenzreihe ab. P n Beispiel 1: Die oben untersuchte Potenzreihe ∞ n=0 (x − a) hat den Konvergenzradius 1 und sie divergiert für alle Randpunkte ihres Konvergenzkreises. P (x−a)n Beispiel 2: Betrachten wir nun die Potenzreihe ∞ . Die Zahlenfolge n=1 n2 (qn )n≥0 der Quotienten 2 n (x − a)n+1 n2 = qn := |x − a| (n + 1)2 (x − a)n (n + 1)2 ist monoton wachsend und hat den Grenzwert limn→∞ qn = |x − a|. Im Falle P (x−a)n |x − a| < 1 ist ∞ nach dem Quotientenkriterium absolut konvern=1 n2 gent. Für |x − a| > 1 gibt es eine natürliche Zahl n0 , so daß qn > 1 für P (x−a)n alle n ≥ n0 , also divergiert ∞ nach dem Quotientenkriterium. Der n=1 n2 Konvergenzradius der Reihe ist somit 1. P∞ 1 (x−a)n 1 Im Fall |x − a| = 1 ist n=1 n2 wegen n2 ≤ n2 eine konvergente MajoP (x−a)n , also konvergiert die Potenzreihe für alle Randpunkte rante von ∞ n=1 n2 ihres Konvergenzkreises. P (x−a)n . Analog Beispiel 3: Betrachten wir abschließend die Potenzreihe ∞ n=1 n zu oben weist man durch Untersuchung der Folge n(x − a)n+1 = n |x − a| qn := n (n + 1)(x − a) n + 1 64 Preliminary version – 3. Juli 2002 nach, daß die Potenzreihe den Konvergenzradius 1 besitzt. Im Randpunkt x = a + 1 des Konvergenzkreises geht die Potenzreihe in die divergente harmonische Reihe über. Im Randpunkt x = a − 1 des Konvergenzkreises wird sie bis auf das Vorzeichen in die konvergente Leibnizsche Reihe überführt. Die vorangegangenen Überlegungen zeigen einen Weg zum Ermitteln des Konvergenzradiuses einer Potenzreihe auf. P n Satz 34 Für den Konvergenzradius ρ einer Potenzreihe ∞ n=0 an (x−a) gilt: | 1. Falls |a|an+1 eine Nullfolge ist, so gilt ρ = ∞, d.h. die Potenzreihe n| n≥0 konvergiert für alle x ∈ C. 2. Im Falle der Konvegrenz der Zahlenfolge |an+1 | |an | gegen einen posin≥0 | tiven Grenzwert 0 < l = limn→∞ |a|an+1 gilt ρ = 1l . n| |an+1 | 3. Falls die Zahlenfolge |an | bestimmt divergent gegen +∞ ist, so n≥0 konvergiert die Potenzreihe nur für x = a, d.h. ρ = 0. p 4. Falls n |an | eine Nullfolge ist, so ist ρ = ∞ der Konvergenzradius n≥2 der Potenzreihe. p 5. Falls die Zahlenfolge n |an | gegen einen positiven Grenzwert 0 < n≥2 p l = limn→∞ n |an | konvergiert, so ist ρ = 1l der Konvergenzradius der Potenzreihe. p 6. Falls die Zahlenfolge n |an | unbeschränkt ist, so ist ρ = 0 der n≥2 Konvergenzradius der Potenzreihe. p n 7. Ist die Zahlenfolge |an | beschränkt aber nicht konvergent, so n≥2 ergibt sich der Konvergenzradius als ρ = 1l , wobei l die obereGrenzeder p Menge der Grenzwerte aller konvergenten Teilfolgen von n |an | n≥2 ist. 65 Preliminary version – 3. Juli 2002 Beweis: Die Behauptungen (1)-(3) ergeben sich aus dem Quotientenkriterium 29 für Reihen. Für den Quotient der Beträge zweier aufeinander folgender Glieder der Potenzreihen haben wir an+1 (x − a)n+1 |an+1 | (4.1) an (x − a)n = |an | |x − a| | |an+1 | eine Nullfolge, so ist auch (1) Ist |a|an+1 |x − a| eine Nullfolge, |an | n| n≥0 n≥0 also existiert zu jeder komplexen Zahl x eine natürliche Zahl n0 , so daß der Quotient (4.1) für alle n ≥ n0 kleiner als ε = 21 ist. Damit ist die Potenzreihe für jedes x ∈ C konvergent. | (2) Sei nun 0 < l = limn→∞ |a|an+1 und x ∈ C mit 0 < |x − a| < 1l . Einsetzen n| von 0 < δ := 1l − |x − a| < 1l in Gleichung (4.1) ergibt an+1 (x − a)n+1 |an+1 | 1 = −δ an (x − a)n |an | l und 0 < lim n→∞ Also gibt es zu ε = δl 2 |an+1 | |an | 1 −δ l = 1 − δl < 1 eine natürliche Zahl n0 , so daß an+1 (x − a)n+1 2 − δl an (x − a)n < 2 < 1 für alle n ≥ n0 , was die absolute Konvergenz der Potenzeihe für diese x beweist. |an+1 | (3) Die bestimmte Divergenz der Folge |an | impliziert die bestimmte n≥0 Divergenz der Folge der Quotienten (4.1), daher übersteigen alle Quotienten ab einem gewissen n0 die Zahl 1 und Anwendung des Quotientenkriteriums liefert die Behauptung. Analog verfährt man in (4)-(6) unter Bezug auf das Wurzelkriterium 28. Bedingung (7) zeigt man mit dem Wurzelkriterium 28(3). 2 Die auf dem Wurzelkriterium fußenden Bedingungen (4)-(7) haben den Vorteil, daß sie eine vollständige Fallunterscheidung darstellen. D.h. für eine beliebige Potenzreihe trifft stets eine dieser vier Bedingungen zu. 66 Preliminary version – 3. Juli 2002 Die Anwendung der Regeln (1)-(3) ist manchmal einfacher als die der Wur|an+1 | zelregeln. Wenn die Folge |an | allerdings weder konvergiert noch ben≥0 stimmt divergiert, so bietet das Quotientenkriterium keine Möglichkeit zur Bestimmung des Konvergenzradius der Potenzreihe. Darüberhinaus verlangt die Anwendung des Quotientenkriteriums, daß wenigstens ab einem n0 sämtliche Koeffizienten an , n ≥ n0 , von Null verschieden sind. Übungsaufgaben, Serie 6 16. Berechnen Sie die Summe: ∞ X (n + 1)an wobei a ∈ C, 0 < |a| < 1 n=0 P Hinweis: Für alle natürlichen Zahlen n gilt (n + 1)an = ni=0 ai an−i . Schreiben Sie damit die obige Reihe zunächst in die Cauchysche Produktreihe zweier absolut konvergenter Reihen um. 17. Beweisen Sie, daß die Reihe ∞ X n=0 a2n (1 + a2 )n−1 für jede reelle Zahl a konvergiert und berechnen Sie die Summe der Reihe. 18. Bestimmen Sie die Konvergenzradien der folgenden Potenzreihen in x: (a) ∞ X nn n=1 n! (x − 1)n (b) 2 ∞ X (n + 1)2n n2n2 n=1 xn (c) ∞ X 1 2 n=1 n x − 3 + 4i 67 Preliminary version – 3. Juli 2002 4.2 Rechenregeln für Potenzreihen P∞ P∞ n n Satz 35 n=0 an (x − a) und n=0 bn (x − a) seien zwei Potenzreihen mit den Konvergenzradien ρ1 beziehungsweise ρ2 . Dann gilt für der Konvergenzradius ρ der Potenzreihe ∞ X (λan + µbn ) (x − a)n n=0 die Beziehung ρ ≥ min {ρ1 , ρ2 }. P Beweis: Aus Gleichung 3.13 folgt sofort, daß ∞ ) (x−a)n für jen=0 (λan + µbn P n des xP∈ C konvergiert, für das auch die beiden Potenzreihen ∞ n=0 an (x − a) ∞ n und n=0 bn (x−a) konvergieren. Die Konvergenzkreise beider Potenzreihen sind konzentrische Kreise um den Punkt a, also besteht ihr Durchschnitt aus dem Kreis mit dem kleineren Radius und nach der obigen P Überlegungen ist dieser Durchschnitt im Konvergenzkreis der Potenzreihe ∞ n=0 (λan + µbn ) (x− n a) enthalten, was die behauptete Relation zwischen den Konvergenzradien zur Folge hat. 2 P n Der Konvergenzradius der Potenzreihe ∞ n=0 (λan + µbn ) (x−a) kann durchaus auch größer als min {ρ1 , ρ2 } sein. P P n!−1 n!+2 n So haben die beiden Potenzreihen ∞ a)n und ∞ n=0 n! (x n=0 n! (x − a) P− ∞ n!−1 n!+2 beide Konvergenzradius 1, aber die Reihe n=0 − n! + n! (x−a)n = P∞ den 3 n n=0 n! (x − a) konvergiert für jedes x ∈ C, hat also den Konvergenzradius ∞. P n Satz 36 (Multiplikation von Potenzreihen) Seien ∞ n=0 an (x−a) und P ∞ n mit den Konvergenzradien ρ1 beziehungsn=0 bn (x − a) zwei Potenzreihen P Pk k weise ρ2 . Dann hat die Potenzreihe ∞ k=0 ck (x−a) , wobei ck := n=0 an bk−n für alle k ≥ 0, mindestens den Konvergenzradius min{ρ1 , ρ2 } und für alle x ∈ C mit |x − a| < min{ρ1 , ρ2 } gilt ! ∞ ! ∞ ∞ X X X n n an (x − a) bn (x − a) = ck (x − a)k . n=0 n=0 k=0 Beweis: Unter Berücksichtigung der absoluten Konvergenz der Potenzreihen in jedem inneren Punkt des Konvergenzkreises folgt die Behauptung sofort aus Satz 32 2 68 Preliminary version – 3. Juli 2002 P∞ n Satz 37 (Umordnung einer Potenzreihe) n=0 an (x − a) sei eine Potenzreihe vom Konvergenzradius daß |b − a| < ρ. P ρ > 0 und mb ∈ C sei so, P ∞ n Dann besitzt die Potenzreihe ∞ b (x − b) , wobei b = m m=0 m n=m an m (b − a)n−m für alle m ≥ 0, mindestens den Konvergenzradius τ = ρ − |b − a| und für alle x ∈ C mit |x − b| < τ gilt die Gleichheit ∞ X an (x − a)n = n=0 ∞ X bm (x − b)m . m=0 Beweisskizze: Wir schreiben die Ausgangsreihe in die Form ∞ X an (x − a)n = n=0 ∞ X an ((x − b) + (b − a))n n=0 ∞ X n X n (x − b)m (b − a)n−m m n=0 m=0 ∞ ∞ X X n = an (x − b)m (b − a)n−m m n=0 m=0 ∞ ∞ XX n an = (x − b)m (b − a)n−m m m=0 n=m = = ∞ X an (4.2) (4.3) bm (x − b)n m=0 um. In Schritt (4.2) darf die obere Summationsgrenze auf ∞ erhöht werden, n da die Binomialkoeffizienten m für alle m > n als 0 definiert sind. Dann hat man sich davon zu überzeugen, daß der große Umordnungssatz für alle x mit |x − b| < τ auf die Doppelfolge n m n−m an (x − b) (b − a) m n,m≥0 anwendbar ist, aber auf diesen Beweisschritt wollen wir hier verzichten, weisen aber darauf hin, daß hierbei die Bedingung |b − a| < ρ benötigt wird. Man vertauscht die Summationen und darf die untere Summationsgrenze der n inneren Summe in Schritt (4.3) auf m setzen, da m für alle n < m Null ist. 2 69 Preliminary version – 3. Juli 2002 P m Den Übergang zur Potenzreihe ∞ bezeichnet man auch als m=0 bm (x − b) Umordnung nach Potenzen von x − b. In der Einführung dieses Kapitels hatten wir bereits einmal darauf hingewiesen, daß man sich bei der PUntersun chung der formalen Potenzreihen auf Darstellungen der Gestalt ∞ n=0 an x beschränken darf. Wir sehen, daß ein derartiges im Zusammenhang mit der Untersuchung der durch eine Potenzreihe beschriebenen komplexen Funktion gewissen Einschränkungen unterliegt. Bedenkenlos kann man die Umordnung nach Potenzen von x − 0 nur dann vornehmen, wenn die Potenzreihe den Konvergenzradius ∞ hat. Ist 0 wenigstens innerer Punkt des Konvergenzkreises der betrachteten Potenzreihe, so kann man die Potenzreihe nach Potenzen von x − 0 umordnen und die umgeordnete Potenzreihe nimmt wenigstens in einer Umgebung des Nullpunktes die gleichen Werte wie die Ausgangsreihe an. Man beachte aber, daß die Ausgangspotenzreihe und die umgeordnete Potenzreihe als Funktionen nicht mehr gleich sind, denn sie haben unterschiedliche Definitionsbereiche. Liegt 0 auf dem Rand oder gar außerhalb des Konvergenzkreises, so haben die Potenzreihen betrachtet als Abbildungsvorschriften komplexer Funktionen nichts mehr miteinander zu tun. In diesen Sachverhalten ist der Grund dafür zu suchen, daß man Potenzreihen in der Analysis bezüglich der Potenzen in x − a untersucht. P∞ n Satz 38 (Identit ätssatz f ür Potenzreihen) Es seien n=0 an (x−a) und P∞ n n=0 bn (x − a) zwei Potenzreihen mit den positiven Konvergenzradien ρ1 beziehungsweise ρ2 . Darüberhinaus sei (xi )i≥0 eine Zahlenfolge mit 0 < |xi − a| < min{ρ1 , ρ2 } für alle i ≥ 0 und limi→∞ xi = a. Falls ∀i ≥ 0 : ∞ X an (xi − a)n = n=0 ∞ X bn (xi − a)n , n=0 so gilt an = bn für alle natürlichen Zahlen n ≥ 0. P n Beweisskizze: Für eine beliebige Potenzreihe ∞ n=0 cn (x − a) des Konvergenzradius ρ und eine beliebige Zahlenfolge (yi ) mit 0 < P |yi − a| < ρ für n alle i ≥ 0 und limi→∞ yi = a konvergiert die Potenzreihe ∞ n=0 cn (x − a) für jedes P∞x = yi , i ≥n 0, absolut. Damit ist jedes Glied der Zahlenfolge (zi := n=0 cn (yi − a) )i≥0 eine wohldefinierte komplexe Zahl. Das zentrale Problem des Beweises besteht im Nachweis der Gleichheit lim zi = c0 . i→∞ 70 Preliminary version – 3. Juli 2002 (4.4) P n Dann betrachtet man die Differenz ∞ n=0 (an − bn )(x − a) . Nach Voraussetzung hat diese für jedes x = xi , i ≥ 0, die Summe 0. Mit (4.4) folgt 0 = lim i→∞ ∞ X (an − bn )(xi − a)n = a0 − b0 . n=0 Auf diese Weise erhält man a0 = b0 . Mittels vollständiger Induktion zeigt man dann, daß auch an = bn für alle n ≥ 1 gelten muß. Sei die Gleichheit an = bn bereits für alle n < m + 1 gezeigt. Dann erhalten wir 0 = ∞ X (an − bn )(xi − a)n n=0 ∞ X (an − bn )(xi − a)n n=m+1 = (xi − a)m+1 ∞ X (an − bn )(xi − a)n−(m+1) für alle i ≥ 0 n=m+1 und wegen (xi − a)m+1 6= 0 muß für alle i ≥ 0 die Gleichheit 0= ∞ X n−(m+1) (an − bn )(xi − a) = n=m+1 ∞ X (an+m+1 − bn+m+1 )(xi − a)n n=0 vorliegen. Wendet man nun darauf (4.4) an, so zeigt sich am+1 = bm+1 . Damit ist der Induktionsbeweis abgeschlossen und es folgt die Gleichheit an = bn für alle n ≥ 0. 2 Betrachten wir ein einfaches Beispiel fürP den obigen Satz. n Wenn für alle ∞ 1 natürlichen Zahlen i ≥ 1 die Gleichheit n=0 an i − a = 0 vorliegt, so muß für alle n ≥ 0 die Gleichheit an = 0 gelten. P∞ n Allgemeiner gilt, wenn die Menge {yP ∈C : n=0 an (y − a) = c} aller Stel∞ n len x = y, an denen die Potenzreihe n=0 an (x−a) einen bestimmten festen Wert c ∈ C annimmt, den Punkt a als Häufungspunkt hat, dann gilt a0 = c und an = 0 für alle n ≥ 1. SchließlichPkann man auch folgende Frage betrachten. Die Summe der Pon tenzreihe ∞ n=0 an (x − a) , a ∈ R, sei für alle dem Konvergenzkreis der Potenzreihe angehörigen reellen x eine reelle Zahl, dann sind P alle Koeffizienten n an reell. Durch Konjugation erhält man die Potenzreihe ∞ n=0 an (x − a) . Da der Konvergenzradius nur von den Beträgen der Glieder abhängt, hat 71 Preliminary version – 3. Juli 2002 diese Potenzreihe den gleichen Konvergenzradius ρ wie die Ausgangsreihe. Darüberhinaus gilt für alle x ∈ C mit |x − a| < ρ die Gleichheit ∞ X an (x − a)n ∞ X = n=0 an (x − a)n n=0 und da die Summe auf der linken Seite als reell vorausgesetzt war folgt weiter ∞ X ∞ X n an (x − a) = n=0 an (x − a)n n=0 Mit Hilfe des obigen Satzes schließt man auf an = an für alle n ≥ 0, das bedeutet aber, daß alle an , n ≥ 0, reelle Zahlen sind. 4.3 Elementare Funktionen Neben den Polynomfunktionen, den rationalen Funktionen und den Wurzelfunktionen spielen vor allem die Exponentialfunktionen, die Logarithmusfunktionen, die trigonometrischen Funktionen (auch Winkelfunktionen genannt) und die Hyperbelfunktionen eine wichtige Rolle. Durch die Zuordnungsvorschriften exp(x) = sin(x) = ∞ X xn n=0 ∞ X n! (−1)n x2n+1 (2n + 1)! (−1)n x2n (2n)! n=0 cos(x) = ∞ X n=0 definiert man Funktionen exp : R → R, sin : R → R und cos : R → R, welche man als Exponential-, Sinus- beziehungsweise Cosinusfunktion bezeichnet. Alle drei Funktionen haben die gesamte Menge der reellen Zahlen als Definitionsbereich. 72 Preliminary version – 3. Juli 2002 Nun sind Ihnen aus der Schule bereits Funktionen gleichen Namens bekannt. Natürlich wurde diese Namensgleichheit nicht zufällig gewählt, der folgende Satz faßt einige der wichtigsten Eigenschaften der oben definierten Funktionen zusammen. Satz 39 Für alle x, y ∈ R und q ∈ Q gelten die folgenden Gleichungen und Ungleichungen: exp 0 = 1 exp 1 = lim n→∞ (4.5) 1+ 1 n n =e exp q = (exp 1)q 1 exp (−x) = exp x exp (x + y) = exp x exp y π sin 0 = cos = 0 2 π sin = cos 0 = 1 2 sin (−x) = − sin x cos (−x) = cos x sin (x + y) = sin x cos y + cos x sin y cos (x + y) = cos x cos y − sin x sin y x−y x+y sin x − sin y = 2 sin · cos 2 2 x−y x+y cos x − cos y = −2 sin · sin 2 2 sin2 x + cos2 x = 1 sin (x + 2π) = sin x cos (x + 2π) = cos x | sin x| ≤ 1 | cos x| ≤ 1 (4.6) (4.7) (4.8) (4.9) (4.10) (4.11) (4.12) (4.13) (4.14) (4.15) (4.16) (4.17) (4.18) (4.19) (4.20) (4.21) (4.22) Man beachte, alle aufgeführten Eigenschaften können direkt aus den Potenzreihen abgeleitet werden, dabei ist keine Bezugnahme auf die aus der Schule bekannten Funktionen erforderlich. Im Nachhinein stellt man aber fest (siehe (4.6) und (4.7)), daß für alle rationalen Zahlen q die Gleichheit exp q = eq zutrifft. Bei Beschränkung auf 73 Preliminary version – 3. Juli 2002 rationale Argumente wirkt die Funktion exp also tatsächlich wie die aus der Schule bekannt e-Funktion. Die hier eingeführte Exponentialfunktion erlaubt es darüberhinaus, das Potenzieren mittels der Definition ex := exp x auf beliebige reelle Exponenten auszudehnen. Die Gleichungen (4.8) und (4.9) zeigen, daß die üblichen Rechenregeln auch für beliebige reelle Exponenten gültig bleiben. Zu den die Winkelfunktionen betreffenden Aussagen ist anzumerken, daß die hier auftretende Zahl π wie folgt definiert ist. Man kann zeigen, daß die cos-Reihe im offenen Intervall (0, 2) genau eine Nullstelle besitzt, das Doppelte dieser Nullstelle bezeichnet man mit π. Damit ist zunächst noch nicht klar, ob es sich tatsächlich um die üblicherweise mit π bezeichnete reelle Zahl (≈ 3, 1415 . . . ) handelt, welche den Proportionalitätsfaktor zwischen Durchmesser und Umfang eines Kreises angibt. Gleichung (4.18) zeigt jedoch, daß das Paar (cos x, sin x) die Koordinaten eines auf dem Einheitskreis liegenden Punktes der reellen Ebene ist. Mit Hilfe der Integralrechnung kann man zeigen, daß x genau der Länge des entgegen des Uhrzeigersinnes zwischen den Punkten (1, 0) und (cos x, sin x) verlaufenden Bogens auf dem Einheitskreis entspricht. Aus diesem Grund ist x tatsächlich das Bogenmaß des Öffnungswinkels dieses Kreisbogens und unser hier verwendetes π ist tatsächlich das gewöhnliche π. Aus diesen drei Grundfunktionen lassen sich weitere elementare Funktionen ableiten. Da wären zum einen die Umkehrfunktionen. Aus dem vorigen Semester ist Ihnen bekannt, daß es zu einer Funktion genau dann eine inverse Funktion gibt, wenn sie bijektiv ist. exp ist streng monoton wachsend und der Bildbereich besteht aus der Menge R+ der positiven reellen Zahlen. Also ist exp : R → R+ bijektiv. Die inverse Abbildung nennt man die natürliche Logarithmusfunktion und bezeichnet sie mit ln. Der Definitionsbereich von ln ist die Menge R+ , der Bildbereich ist ganz R und es gilt exp (ln x) = x für alle x ∈ R+ sowie ln (exp x) = x für alle x ∈ R. Betrachtet über den gesamten Definitionsbereich sind sin und cos nicht monoton, die Abbildungen sind also nicht injektiv. Das größte die Zahl 0 enthaltende abgeschlossene Intervall, auf welchem sin streng monoton wächst, ist [− π2 , π2 ]. Der Wertebereich der sin-Funktion ist [−1, 1] und diesen Wertebereich hat auch die Einschränkung der sin-Funktion auf das Intervall [− π2 , π2 ]. Also ist die Einschränkung sin : [− π2 , π2 ] → [−1, 1] eine bijektive Abbildung. Die Umkehrung dieser Abbildung bezeichnet man mit arcsin und nennt sie Arcussinus. Es gelten demnach Def(arcsin) = [−1, 1] 74 Preliminary version – 3. Juli 2002 und Bild(arcsin) = [− π2 , π2 ] sowie die Gleichungen sin (arcsin x) = x für alle −1 ≤ x ≤ 1 und arcsin (sin x) = x für alle − π2 ≤ x ≤ π2 . Analog definiert man den Arcuscosinus arccos als die inverse Abbildung der Einschränkung der Cosinusfunktion auf das maximale 0 umfaßende Intervall [0, π], auf dem die Funktion streng monoton fällt. Weitere abgeleitete elementare Funktionen sind tan(x) = cot(x) = sinh(x) = cosh(x) = tanh(x) = coth(x) = sin(x) π , x 6= + kπ, k ∈ Z, (Tangens) cos(x) 2 cos(x) , x 6= kπ, k ∈ Z, (Cotangens) sin(x) 1 (exp(x) − exp(−x)) (Sinus hyperbolicus) 2 1 (exp(x) + exp(−x)) (Cosinus hyperbolicus) 2 sinh(x) (Tangens hyperbolicus) cosh(x) cosh(x) , x 6= 0, (Cotangens hyperbolicus) sinh(x) sowie die Umkehrfunktionen arctan, arccot, arsinh, arcosh, artanh und arcoth geeigneter Einschränkungen dieser Funktionen. Die Namen der Umkehrfunktionen der Hyperbelfunktionen sind Areasinus, Areacosinus, Areatangens und Areacotangens. Die folgende Tabelle gibt Definitions- und Wertebereiche der Funktionen an, insbesondere sind die Wertebereiche jeweils der Definitionsbereich auf den die zu invertierende Funktion eingeschränkt wird. Funktion arctan arccot arsinh arcosh artanh arcoth Definitionsbereich R R R [1, ∞) (−1, 1) {x ∈ R : |x| > 1} Wertebereich − π2 , π2 (0, π) R [0, ∞) R R \ {0} 75 Preliminary version – 3. Juli 2002 Übungsaufgaben, Serie 7 19. Zeigen Sie, daß die unendliche Reihe ∞ X sin n=1 2π n2 konvergiert. Hinweis: Weisen Sie zunächst die Gültigkeit von 0 ≤ sin x ≤ x für alle 0 ≤ x ≤ 1 nach. P n 20. Gibt es eine Potenzreihe ∞ n=0 an x , welche der Gleichung (x2 − 2) · ∞ X an x n = 1 n=0 genügt? Falls ja, so berechnen Sie die Koeffizienten an , n ≥ 0, und den Konvergenzradius dieser Potenzreihe. Stellen Sie eine Vermutung über Existenz und Konvergenzradius der Reihe auf, wenn man anstelle von x2 − 2 ein anderes Polynom p ∈ R[x] betrachten würde! 21. Die Tangens-Funktion läßt sichPin einer Umgebung des Nullpunktes n durch eine Potenzreihe tan x = ∞ n=0 an x mit positivem Konvergenzradius darstellen. Bestimmen Sie die ersten 8 Koeffizienten a0 , a1 , . . . , a7 dieser Potenzreihe. Hinweis: Vergleichen Sie die Koeffizienten der Cauchyschen Produktreihe von tan (x) · cos (x) mit denen der Potenzreihe sin (x). 76 Preliminary version – 3. Juli 2002 Kapitel 5 Stetigkeit reeller Funktionen in einer reellen Variablen In diesem Kapitel wollen wir einstellige Funktionen f untersuchen, deren Definitionsbereich und Wertebereich Teilmengen der reellen Zahlen sind, d.h. f : A → R, wobei A ⊆ R. Man spricht auch von reellen Funktionen in einer reellen Variablen. Durch “Funktion in einer reellen Variablen” bringt man zum Ausdruck, daß die Funktion nur ein Argument hat, d.h. einstellig ist, und daß dieses Werte aus der Menge der reellen Zahlen annimmt. Die Sprechweise reelle Funktion weist auf die reellen Zahlen als Wertebereich hin. Es sei daran erinnert, daß der im vorigen Semester eingeführte Funktionsbegriff erfordert, daß Vorbereich und Definitionsbereich der Abbildung gleich sind, mit anderen Worten es handelt sich um eine Abbildung von - in. Derartige Funktionen nennt man oft auch totale Funktionen und verwendet daneben noch den abgeschwächten Begriff der partiellen Funktion als Synonym für eindeutige Abbildung f : A → B. Im Falle partieller Funktionen ist die Unterscheidung zwischen dem Vorbereich A und dem Definitionsbereich Deff := {a ∈ A | ∃b ∈ B : f (a) = b} von f erforderlich. Für totale Funktionen fallen beide Begriffe zusammen. In der Analysis ist es üblich, die Begriffe Funktion und partielle Funktion synonym zu verwenden, was auch wir für den Rest der Vorlesungsreihe vereinbaren. Aus diesem Grund können wir eine Funktion in einer reellen Variable durch f : R → R kennzeichnen, dennoch gilt nur Deff ⊆ R. BildF bezeichnet in der üblichen Weise die Menge Bildf := {b ∈ R : ∃a ∈ Deff : f (a) = b}. Zu Beginn unserer Untersuchungen wollen wir einige häufig verwendete Sprechweisen einführen. Man nennt eine Funktion f nach oben (unten) beschränkt, 77 Preliminary version – 3. Juli 2002 wenn ihr Bildbereich Bildf gemäß Definition 1 nach oben (unten) beschränkt ist. Entsprechend heißt f beschränkt, wenn die Menge {|f (a)| : a ∈ Deff } nach oben beschränkt ist. Ist M ⊆ Deff eine Teilmenge des Definitionsbereiches von f , dann beziehen sich die Begriffe Infimum, Supremum, Minimum und Maximum von f auf M auf die entsprechenden Größen der Menge {f (a) : a ∈ M } ⊆ Bildf . 5.1 Grenzwerte von Funktionen Definition 15 Sei f : R → R eine reelle Funktion in einer reellen Variablen. D sei der Definitionsbereich von f und x0 ∈ R ein Häufungspunkt von D. Dann sagt man, f hat im Punkt x0 den Grenzwert a (Schreibweise: limx→x0 f (x) = a), wenn zu jeder positiven reellen Zahl eine positive reelle Zahl δ existiert, so daß für alle x ∈ D mit 0 < |x − x0 | < δ die Relation |f (x) − a| < gilt.1 Natürlich braucht der Grenzwert limx→x0 f (x) imallgemeinen nicht zu exi1 für x < 0 stieren. Beispielsweise hat die Funktion f (x) = im Punkt 0 für x ≥ 0 x0 = 0 keinen Grenzwert, denn in jeder δ-Umgebung Uδ (0) von x0 gibt es negative und positive reelle Zahlen, also nimmt f in jeder δ-Umgebung von x0 sowohl den Wert 1 als auch den Wert 0 an. Damit kann es natürlich keine Zahl a geben, für welche alle Funktionswerte, die f auf Uδ (0) annimmt, in der Umgebung U 1 (a) von a liegt. Für = 12 existiert demzufolge für kein a 2 ein δ mit den geforderten Eigenschaften. Analog zu Satz 14 zeigt man, daß eine Funktion in einem Punkt x0 höchstens einen Grenzwert a besitzen kann. Dabei ist von Bedeutung, daß Grenzwerte von f nur in Häufungspunkten des Definitionsbereiches betrachtet werden dürfen. Auf diese Weise ist ausgeschlossen, daß die Menge der x ∈ D mit 0 < |x − x0 | < δ leer wird. Andernfalls könnte die Forderung |f (x) − a| < irrelevant werden. Weiterhin merken wir an, daß die Bedingung |f (x) − a| < nur für Punkte x 6= x0 gestellt wurde. limx→x0 f (x) kann also auch dann existieren, wenn x0 nicht dem Definitionsbereich D angehört. Selbst im Falle x0 ∈ D wird 1 Alternativ kann man zu jeder positiven reellen Zahl die Existenz einer positiven reellen Zahl δ fordern, so daß |f (x0 + h) − a| < für alle h ∈ R mit x0 + h ∈ D und 0 < |h| < δ. Die Äquivalenz beider Definition ist offensichtlich. 78 Preliminary version – 3. Juli 2002 nicht limx→x0f (x) = f (x0 ) verlangt. Man betrachte zum Beispiel die Funk1 für x 6= 0 tion f (x) = . Für diese Funktion gilt limx→0 f (x) = 1 aber 0 für x = 0 f (0) = 0. Definition 16 Sei f : R → R eine reelle Funktion in einer reellen Variablen. D sei der Definitionsbereich von f und x0 ∈ R ein Häufungspunkt von Dr (x0 ) := D ∩ {x ∈ R : x > x0 }. Dann sagt man, f hat im Punkt x0 den rechtsseitigen Grenzwert a (Schreibweise: limx→x0 +0 f (x) = a), wenn zu jeder positiven reellen Zahl eine positive reelle Zahl δ existiert, so daß für alle x ∈ Dr (x0 ) mit 0 < |x − x0 | = x − x0 < δ die Relation |f (x) − a| < gilt. Entsprechend führt man linksseitige Grenzwerte limx→x0 −0 f (x) unter Bezugnahme auf die Menge Dl (x0 ) := D ∩ {x ∈ R : x < x0 } ein. Bemerkung 6 Für eine reelle Funktion f in einer reellen Variablen und einen Punkt x0 , welcher sowohl Häufungspunkt von Dr (x0 ) als auch Häufungspunkt von Dl (x0 ) ist, existiert der Grenzwert limx→x0 f (x) genau dann, wenn die beiden einseitigen Grenzwerte limx→x0 +0 f (x) und limx→x0 −0 f (x) existieren und übereinstimmen. In diesem Falle gilt lim f (x) = lim f (x) = lim f (x) . x→x0 x→x0 +0 x→x0 −0 Beweis: (⇒) Es existiere der Grenzwert a := limx→x0 f (x). Dann existiert zu ε > 0 eine δ > 0 mit |f (x) − a| < für alle x ∈ D mit 0 < |x − x0 | < δ, also erst recht für alle x ∈ Dr (x0 ) ⊆ D mit 0 < |x − x0 | < δ. Unter Berücksichtigung der Tatsache, daß x0 als Häufungspunkt von Dr (x0 ) vorausgesetzt wurde, ergibt sich die Gleichheit limx→x0 +0 f (x) = a = limx→x0 f (x) unmittelbar aus Definition 16. Entsprechendes gilt für den linksseitigen Grenzwert limx→x0 −0 f (x). (⇐) x0 sei Häufungspunkt von Dr (x0 ) und von Dl (x0 ) und es gelte die Gleichheit a := limx→x0 +0 f (x) = limx→x0 −0 f (x). Dann existieren zu vorgegebenem ε > 0 zwei positive reelle Zahlen δ1 und δ2 mit |f (x) − a| < für alle x ∈ Dr (x0 ) mit 0 < x − x0 < δ1 und für alle x ∈ Dl (x0 ) mit 0 < x0 − x < δ2 . Trivialerweise ist x0 auch Häufungspunkt von D und es gilt |f (x) − a| < für alle x ∈ D 0 < |x − x0 | < δ := min{δ1 , δ2 }. Folglich gilt limx→x0 f (x) = a. 2 79 Preliminary version – 3. Juli 2002 1 für x > 1 . Für diese Funktion 0 für x < 0 gilt limx→1 f (x) = limx→1+0 f (x) = 1, aber limx→1−0 f (x) existiert nicht, da 1 kein Häufungspunkt der Menge Dl (1) = {x : x < 0} ist. Analog gilt limx→0 f (x) = limx→0−0 f (x) = 0 aber limx→0+0 f (x) existiert nicht. Betrachten wir nun die auf ganz R definierte Funktion 1 für x ∈ {q ∈ Q : q > 0} f (x) = . 0 sonst Wir betrachten die Funktion f (x) = Für x0 < 0 existieren stets alle drei Grenzwerte von f im Punkt x0 und alle sind 0. Im Punkt x0 = 0 existiert nur der linksseitige Grenzwert limx→0−0 f (x) = 0. Für positive x0 existiert keiner der drei Grenzwerte. Auf die folgende Weise lassen sich Grenzwerte von Funktionen auf Grenzwerte von Zahlenfolgen zurückführen. Bemerkung 7 Sei f eine Funktion und x0 ein Häufungspunkt ihres Definitionsbereiches. Dann gilt genau dann limx→x0 f (x) = a, wenn für jede Zahlenfolge (xi )i≥0 mit xi ∈ Deff für alle i ≥ 0 und limi→∞ xi = x0 die Gleichheit limi→∞ f (xi ) = a vorliegt. Entsprechende Aussagen gelten für einseitige Grenzwerte, anstelle aller Zahlenfolgen (xi )i≥0 mit xi ∈ Deff für alle i ≥ 0 und limi→∞ xi = x0 werden dann nur noch die Zahlenfolgen (xi )i≥0 mit xi ∈ Dr (x0 ) beziehungsweise xi ∈ Dl (x0 ) für alle i ≥ 0 und limi→∞ xi = x0 betrachtet. Für Funktionen mit unbeschränktem Definitionsbereich kann man den Grenzwertbegriff wie folgt ausweiten. Definition 17 Sei f : R → R eine reelle Funktion in einer reellen Variablen mit nach oben unbeschränktem Definitionsbereich. Falls es eine reelle Zahl a gibt, für die zu jedem ε > 0 eine relle Zahl K existiert, so daß für alle x ∈ Deff mit x ≥ K die Ungleichung |f (x) − a| < ε gilt, dann nennt man a den Grenzwert der Funktion f für x → +∞ und schreibt dafür limx→∞ f (x) = a. Entsprechend führt man für Funktionen f mit nach unten unbeschränktem Definitionsbereich den Grenzwert limx→−∞ f (x) = a von f für x → −∞ ein. Im Falle der Existenz des Grenzwertes von f für x → ∞ gilt für jede bestimmt divergente Zahlenfolge (xi )i≥1 mit limi→∞ xi = +∞ die Beziehung lim f (x) = lim f (xi ) . x→∞ i→∞ 80 Preliminary version – 3. Juli 2002 Entsprechendes gilt für Grenzwerte von f für x → −∞. Die bestimmte Divergenz beschreibenden Ausdrucke wie z.B. limx→x0 f (x) = +∞ oder limx→∞ f (x) = −∞ werden in naheliegender Weise auf Grenzwerte von Funktionen übertragen. 5.2 Stetige Funktionen Definition 18 Eine reelle Funktion f in einer reellen Variablen x heißt im Punkt x0 ∈ Deff stetig, wenn zu jeder positiven reellen Zahl ε eine positive reelle Zahl δ existiert, so daß |f (x) − f (x0 )| < ε für alle x ∈ Deff mit |x − x0 | < δ. f wird in x0 ∈ R unstetig genannt, wenn x0 ∈ / Deff oder wenn x0 ∈ Deff aber f ist nicht stetig in x0 . Die Funktion f wird auf der Menge M ⊆ R stetig genannt, wenn f in jedem Punkt von M stetig ist. Man nennt f auf M gleichmäßig stetig, wenn zu jeder positiven reellen Zahl ε eine nur von ε abhängige2 positive reelle Zahl δ existiert, so daß |f (x) − f (x0 )| < ε für alle x0 ∈ M und x ∈ Deff mit |x − x0 | < δ. Schließlich nennt man f eine stetige Funktion, wenn f in jedem Punkt ihres Definitionsbereiches stetig ist. Ist f auf ihrem Definitionsbereich gleichmäßig stetig, so spricht man von einer gleichmäßig stetigen Funktion. Analog zu den einseitigen Grenzwerten führt man die Begriffe der linksseitigen und der rechtsseitigen Stetigkeit ein, indem man zusätzlich x ≤ x0 beziehungsweise x ≥ x0 fordert. Für Häufungspunkte x0 des Definitionsbereiches von f bedeutet die Stetigkeit von f im Punkt x0 gerade lim f (x) = f (x0 ) . x→x0 In dieser Gleichung sind drei Aussagen enthalten. Zum ersten muß der Grenzwert von f im Punkt x0 existieren, zum zweiten muß x0 dem Definitionsbereich von f angehören und zum dritten müssen Grenzwert und Funktionswert von f im Punkt x0 übereinstimmen. Fragen wir nun noch danach, was Stetigkeit in einem isolierten Punkt x0 des Definitionsbereiches Deff bedeutet. Zunächst einmal existiert limx→x0 f (x) 2 δ ist also von x0 unabhängig! 81 Preliminary version – 3. Juli 2002 für ein derartiges x0 nicht, da x0 kein Häufungspunkt von D ist. Letzteres kann man auch dadurch ausdrücken, daß man feststellt, es gibt ein δ > 0 mit Uδ (x0 )∩Deff = {x0 }. Nun kann man zu jedem ε > 0 ein derartiges δ wählen und erfüllt damit auf alle Fälle die Stetigkeitsbedingungen. Wir halten also fest, eine Funktion ist in jedem isolierten Punkt ihres Definitionsbereiches stetig. Hierbei handelt es sich allerdings um eine eher exotische Eigenschaft, da die Definitionsbereiche der uns interessierenden Funktionen keine isolierten Punkte besitzen werden. Zwar sollte man Gleichung (5.1) nicht gleich als Definition der Stetigkeit verwenden, da man sich dann von vornherein auf die Untersuchung von Funktionen, deren Definitionsbereich keine isolierten Punkte besitzt, beschränken müßte. Häufig kann man sich aber bei Stetigkeitsaussagen auf den folgenden Satz beziehen: Satz 40 f sei eine reelle Funktion in einer reellen Variablen x und der Definitionsbereich Deff möge keine isolierten Punkte aufweisen. Dann ist f genau dann im Punkt x ∈ Deff stetig, wenn die Gleichheit lim f (x) = f (x0 ) x→x0 (5.1) gilt. Der folgende Satz erweist sich bei der Berechnung von Grenzwerten als nützlich. Satz 41 Sei (ai )i≥0 eine konvergente Zahlenfolge mit reellen Gliedern und limi→∞ ai = a. Weiterhin sei f eine in a stetige reelle Funktion in einer reellen Variablen, wobei ai ∈ Deff für alle i ≥ 0. Dann ist die reelle Zahlenfolge (f (ai ))i≥0 konvergent und es gilt lim f (ai ) = f lim ai = f (a) . i→∞ i→∞ Beweis: Zunächst folgt aus Bemerkung 7 die Gleichheit limi→∞ f (ai ) = limx→a f (x). Aufgrund der Stetigkeit von f an der Stelle a folgt weiter limx→a f (x) = f (a) und der Satz ist bewiesen. 2 Solch wichtige Funktionen wie Exponentialfunktionen, Logarithmusfunktionen oder Winkelfunktionen sind stetig. Daher können Grenzwertberechnungen in sie hineingezogen werden, sofern alle dabei auftretenden Grenzwerte 82 Preliminary version – 3. Juli 2002 existieren. So gelten beispielsweise n 1 lim ln 1 + = ln e = 1 n→∞ n n+1 π lim sin π = sin = 1 n→∞ 2n − 3 2 5.2.1 Zusammengesetzte stetige Funktionen Definition 19 Die Summe, die Differenz, das Produkt und der Quotient zweier Funktionen f : R → R und g : R → R werden wie folgt definiert: (f ± g)(x) = f (x) ± g(x) und Def(f + g) = Deff ∩ Defg (f · g)(x) = f (x) · g(x) und Def(f · g) = Deff ∩ Defg f (x) f ( g )(x) = g(x) und Def fg = Deff ∩ {x ∈ Defg : g(x) 6= 0} Satz 42 Die Summe, die Differenz und das Produkt zweier in x0 stetiger Funktionen f und g sind in x0 stetige Funktionen. Beweis: f und g seien in x0 stetige Funktionen. Insbesondere gilt x0 ∈ Deff ∩ Defg = Def(f ± g) = Def(f · g). Wir beginnen mit der Untersuchung der Summe f + g. Wir geben ε > 0 beliebig vor und fragen nach einem δ > 0, so daß |(f +g)(x)−(f +g)(x0 )| < ε für alle x ∈ Def(f + g) mit |x − x0 | < δ. Aufgrund der Stetigkeit von f und g in x0 existieren reelle Zahlen δ1 > 0 und δ2 > 0, so daß |f (x) − f (x0 )| < 2ε für alle x ∈ Deff ⊇ Def(f + g) und 0 < |x − x0 | < δ1 , sowie |g(x) − g(x0 )| < 2ε für alle x ∈ R mit x ∈ Defg ⊇ Def(f + g) und 0 < |x − x0 | < δ2 . Sei nun δ := min{δ1 , δ2 }. Für jedes x ∈ Def(f + g) = Deff ∩ Defg mit |x − x0 | < δ gelten dann |f (x) − f (x0 )| < 2ε und |g(x) − g(x0 )| < 2ε , also |(f + g)(x) − (f + g)(x0 )| = |(f (x) − f (x0 )) + (g(x) − g(x0 ))| ≤ |f (x) − f (x0 )| + |g(x) − g(x0 )| < ε und die Stetigkeit von f + g in x0 ist bewiesen. Analog weist man die Stetigkeit von f − g in x0 nach. Kommen wir nun zur Untersuchung der Stetigkeit des Produktes f · g in x0 , d.h. wir fragen zu beliebig vorgegebenem ε > 0 nach einem δ > 0, so daß |(f · g)(x) − (f · g)(x0 )|n< ε für alle xo∈ Def(f · g) mit |x − x0 | < δ. Wir setzen ε1 := min 1, 3(|g(xε0 )|+1) und ε2 := 3(|f (xε0 )|+1) . Es existieren δ1 > 0 und δ2 > 0, so daß |f (x) − f (x0 )| < ε1 für alle x ∈ Deff ⊇ Def(f · g) 83 Preliminary version – 3. Juli 2002 und 0 < |x − x0 | < δ1 , sowie |g(x) − g(x0 )| < ε2 für alle x ∈ R mit x ∈ Defg ⊇ Def(f · g) und 0 < |x − x0 | < δ2 . Mit δ := min{δ1 , δ2 } ergibt sich für alle x ∈ Def(f · g) = Deff ∩ Defg mit |x − x0 | < δ die Abschätzung |(f · g)(x) − (f · g)(x0 )| = |(f (x) − f (x0 )) g(x) + (g(x) − g(x0 )) f (x0 )| = (f (x) − f (x0 )) (g(x) − g(x0 )) + (f (x) − f (x0 )) g(x0 ) + (g(x) − g(x0 )) f (x0 ) ≤ |f (x) − f (x0 )| · |g(x) − g(x0 )| + |g(x0 )| |f (x) − f (x0 )| + |f (x0 )| |g(x) − g(x0 )| < ε1 ε2 + |g(x0 )|ε1 + |f (x0 )|ε2 |g(x0 )| ε |f (x0 )| ε ≤ ε2 + · + · <ε |g(x0 )| + 1 3 |f (x0 )| + 1 3 2 Satz 43 Ist f eine in x0 stetige Funktion mit f (x0 ) 6= 0, dann ist auch der Quotient f1 eine in x0 stetige Funktion. Beweis: Sei ε > 0 beliebig vorgegeben und ε1 := min 12 |f (x0 )|, 2ε |f (x0 )|2 . Wegen f (x0 ) 6= 0 gilt ε1 6= 0 und aufgrund der Stetigkeit von f in x0 gibt es ein δ > 0, so daß |f (x) − f (x0 )| < ε1 für alle x ∈ Deff mit |x − x0 | < δ. Für alle derartigen x gilt folglich |f (x)| = |f (x0 ) + f (x) − f (x0 )| ≥ |f (x0 )| − |f (x) − f (x0 )| ≥ |f (x0 )| − ε1 1 1 ≥ |f (x0 )| − |f (x0 )| = |f (x0 )| > 0 2 2 Zunächst einmal gilt aufgrund von f (x0 ) 6= 0 die Enthaltenseinsrelation x0 ∈ {y ∈ Deff : f (y) 6= 0} = Def f1 Weiterhin gilt 1 1 f (x0 ) − f (x) 1 1 (x) − (x0 ) = f f (x) − f (x0 ) = f (x)f (x0 ) f ε |f (x0 )|2 ε1 2 ≤ 1 ≤ =ε 1 |f (x0 )|2 |f (x0 )|2 2 2 für alle x ∈ Def f1 mit |x − x0 | < δ. Also ist 1 f in x0 stetig. 84 Preliminary version – 3. Juli 2002 2 Folgerung 4 Sind f und g in x0 stetige Funktionen und g(x0 ) 6= 0, dann ist der Quotient fg ebenfalls in x0 stetig. Satz 44 Ist die Funktion f im Punkt x0 und die Funktion g im Punkt f (x0 ) stetig, so ist die Hintereinanderausführung3 f ◦ g im Punkt x0 stetig. Beweis: Zu vorgegebenem ε > 0 gibt es ein δ 0 > 0, so daß für alle x ∈ R mit f (x) ∈ Defg und |f (x) − f (x0 )| < δ 0 die Ungleichung |(f ◦ g)(x) − (f ◦ g)(x0 )| = |g(f (x)) − g(f (x0 ))| < ε gilt. Weiter gibt es zu 0 = δ 0 eine positive reelle Zahl δ > 0 mit |f (x) − f (x0 )| < 0 für alle x ∈ Deff mit |x − x0 | < δ. Zuordnung von δ zu ε zeigt die Stetigkeit der Hintereinanderausführung f ◦ g im Punkt x0 . 2 Übungsaufgaben, Serie 8 22. Berechnen Sie (a) 2x3 − x + 1 x→3 x4 − 2x3 + x − 1 lim (b) lim x→2 1 4 − 2 x−2 x −4 (c) lim x→−1 23. Berechnen Sie 1 1 − x + 1 (x + 1)(x + 3) xn − 1 , x→1 xm − 1 n, m ∈ N \ {0} . lim 24. Zeigen Sie, daß die Funktion f (x) = √ x, x ≥ 0, gleichmäßig stetig ist. Hinweis: Eine geeignete Wahl ist δ(ε) = ε2 . 3 Wir halten an der im vorigen Semester getroffenen Vereinbarung (f ◦ g)(x) = g(f (x)) fest. 85 Preliminary version – 3. Juli 2002 5.2.2 Klassen stetiger Funktionen Eine unmittelbare Folgerung aus den Ergebnissen des vorangegangenen Abschnitts ist, daß jede einer Abbildungsvorschrift f (x) = a0 + a1 x + · · · + an xn genügende Funktion, man nennt derartige Funktionen auch Polynomfunktionen oder ganze rationale Funktionen, in jedem Punkt x0 ∈ R stetig ist. Allgemeiner gilt für rationale Funktionen f : R → R, d.h. die Abbildungsvorschrift hat die Gestalt a0 + a1 x + · · · + an xn f (x) = , b0 + b1 x + · · · + bm x m daß sie in jedem Punkt x0 ∈ R, für welchen b0 + b1 x0 + · · · + bm x0 m 6= 0 gilt, stetig ist. Für jede natürliche Zahl k ≥ 1 ist die Funktion f : R → R mit dem Definitionsbereich Deff = {x ∈ R : x ≥ 0} und der Abbildungsvorschrift √ k f (x) = x in jedem Punkt ihres Definitionsbereiches stetig. Gleiches trifft auf die auf ganz R definierte Funktion g : R → R mit der Abbildungsvorp k schrift g(x) = |x| zu. Auf Seite 37 in Abschnitt 3.5 hatten wir die Existenz des Grenzwertes √ lim k an n→∞ für eine konvergente Folge (an )n≥1 positiver reeller Zahlen ohne Beweis festgehalten. Wir können diesen Existenzbeweis nun nachreichen, er ergibt sich √ k unmittelbar aus der Stetigkeit der Funktion f (x) = x und Satz 41. Weiterhin ist jede durch eine Potenzreihe beschriebene Funktion in jedem inneren Punkt des Konvergenzkreises stetig. P n Satz 45 Sei ∞ n=0 an (x − a) eine Potenzreihe mit dem Konvergenzradius ρ > 0. Dann ist die auf dem der Potenzreihe durch die P∞Konvergenzkreis n Abbildungsvorschrift f (x) = n=0 an (x − a) definierte reelle Funktion f : R → R in einer reellen Variablen in jedem Punkt x0 ∈ (a − ρ, a + ρ) stetig. Beweisidee: Man zeigt zunächst die Stetigkeit von f im Punkt a. Für jedes x ∈ (a − ρ2 , a + ρ2 ) gilt |x − a| ≤ ρ2 und weiter ! ∞ ∞ X X n n−1 |f (x) − f (a)| = an (x − a) − a0 = |x − a| · an (x − a) n=0 n=1 ∞ ρ n−1 X ≤ |x − a| · |an | = |x − a| · M < ε 2 n=1 86 Preliminary version – 3. Juli 2002 für alle x mit |x − a| < δ := min ρ2 , Mε bei beliebig vorgegebenem ε > 0. Man beachte, da x = a+ ρ2 im Inneren des Konvergenzkreises der Potenzreihe liegt, konvergiert sie in diesem Punkt die Existenz absolut. Es folgt der P∞ P∞ ρ n ρ n−1 ρ n P∞ = Summen n=0 |a n | 2 , n=1 |an | 2 und damit auch n=1 |an | 2 P∞ ρ n 2 · n=1 |an | 2 . Die letztgenannte Summe ist eine positive reelle Zahl, ρ diese nennen wir M . Um die Stetigkeit von f in einem Punkt b ∈ (a − ρ, a + ρ) mit b 6= a nachzuweisen, ordnet man die Potenzreihe zunächst nach Potenzen von x − b um. Die dabei entstehende Potenzreihe ∞ X bn (x − b)n n=0 hat einen positiven Konvergenzradius ρ0 ≥ ρ−|b−a|. g bezeichne die auf dem offenen Intervall (b − ρ0 , b + ρ0 ) definierte Funktion mit der AbbildungsvorP∞ schrift g(x) = n=0 bn (x − b)n . Anwendung der obigen Überlegungen zeigt, daß g in b stetig ist, also existiert zu beliebig vorgegebenem ε > 0 ein δ > 0, so daß |g(x) − g(b)| < ε für alle x ∈ (b − ρ0 , b + ρ0 ) mit |x − b| < δ. Aufgrund von f (x) = g(x) für alle x ∈ (b − ρ + |b − a|, b + ρ − |b − a|) ergibt sich daraus |f (x) − f (b)| = |g(x) − g(b)| < ε für alle x mit |x − b| < min{ρ − |b − a|, δ}. 2 Aus diesem Satz folgt insbesondere die Stetigkeit der exp-, sin- und cosFunktion. Damit ergibt sich für die weiteren in Abschnitt 4.3 eingeführten elementaren Funktionen die Stetigkeit in allen inneren Punkten ihres Definitionsbereichs. 5.2.3 Klassifikation von Unstetigkeitsstellen Definition 20 Eine Funktion f hat in einem Häufungspunkt x0 ihres Definitionsbereiches eine hebbare Unstetigkeit, falls der Grenzwert limx→x0 f (x) existiert. Eine hebbare Unstetigkeit liegt also dann vor, wenn entweder f an der Stelle x0 nicht definiert ist oder der Funktionswert f (x0 ) nicht mit dem Grenzwert limx→x0 f (x) übereinstimmt. So besitzen die beiden Funktionen 1 für x 6= 0 1 für x 6= 0 g(x) = und h(x) = in 0 eine hebbare Un⊥ für x = 0 0 für x = 0 stetigkeit. Allgemein gilt für eine Funktion f mit hebbarer Unstetigkeit in 87 Preliminary version – 3. Juli 2002 x0 , daß die durch f¯(x) = Funktion f¯ in x0 stetig ist. f (x) für x ∈ Deff \ {x0 } definierte limx→x0 f (x) für x = x0 Definition 21 Eine Funktion f hat in einem Häufungspunkt x0 ihres Definitionsbereiches einen Sprung, wenn die beiden einseitigen Grenzwerte limx→x0 −0 f (x) und limx→x0 +0 f (x) existieren, aber nicht gleich sind. Man spricht auch von einem Sprung der Größe |al − ar |, wobei al = limx→x0 −0 f (x) sowie ar = limx→x0 +0 f (x). 1 für x < 0 Beispiel: Die Funktion g(x) = hat in 0 einen Sprung der −1 für x > 0 Größe 2. Gleiches träfe auch dann zu, wenn 0 dem Definitionsbereich von g angehören und g dort einen beliebigen Wert annehmen würde. Definition 22 Hat f in einem Häufungspunkt x0 ihres Definitionsbereiches eine hebbare Unstetigkeit oder einen Sprung, dann spricht man von einer Unstetigkeit 1. Art in x0 . Existiert wenigstens einer der beiden einseitigen Grenzwerte limx→x0 −0 f (x) oder limx→x0 +0 f (x) nicht, so sagt man f hat in x0 eine Unstetigkeit 2. Art. Bei den in der Praxis am häufigsten anzutreffenden Unstetigkeiten 2. Art ist wenigstens ein einseitiger Grenzwert, oft auch beide, uneigentlich. Beispiels1 weise hat die Funktion x1 wegen limx→0−0 x1 = −∞ und limx→0+0 = +∞ in x x für x ≤ 0 x0 = 0 eine Unstetigkeit 2. Art. Für die Funktion g(x) = 1 für x > 0 x gilt limx→0−0 g(x) = 0 sowie limx→0+0 g(x) = +∞. Auch hier liegt in x0 = 0 eine Unstetigkeit 2. Art vor. Derartige Unstetigkeiten 2. Art haben das Aussehen eines unendlichen Sprunges. Eine weitere Form der Unstetigkeit 2. Art findet man bei x12 , wo beide einseitigen Grenzwerte gleichartig uneigentlich sind, nämlich limx→0−0 x12 = +∞ und limx→0+0 x12 = +∞. Im Unterschied zu den beiden obigen Beispielen ist hier auch der Grenzwert limx→0 x12 uneigentlich, nämlich limx→0 x12 = +∞. Eine Stelle x0 an der beide einseitigen Grenzwerte von f uneigentlich sind nennt man auch einen Pol von f . In exotischen Fällen können sogar dann Unstetigkeiten 2. Art auftreten, wenn der Wertebereich der Funktion beschränkt ist. In diesem Fall sind natürlich keine uneigentlichen Grenzwerte möglich. Ein Beispiel für eine 88 Preliminary version – 3. Juli 2002 derartige Funktion ist die characteristische Funktionder Menge der rationa1 falls x ∈ Q len Zahlen als Teilmenge der reellen Zahlen, χ(x) = . Diese 0 sonst Funktion χ ist auf ganz R definiert, ihr Wertebereich ist nach oben und unten beschränkt. Die Funktion χ hat in jedem Punkt x0 ∈ R eine Unstetigkeit 2. Art, denn für kein x0 existiert auch nur einer der einseitigen Grenzwerte. 5.2.4 Sätze über stetige Funktionen Satz 46 Jede auf einer abgeschlossenen beschränkten Menge M stetige Funktion f ist gleichmäßig stetig auf M . Beweisskizze: Wir geben ε > 0 beliebig vor. Aufgrund der Stetigkeit existiert zu jedem Punkt x0 ∈ M eine positive reelle Zahl δ(x0 ) > 0, so daß |f (x) − f (x0 )| < ε 2 für alle x ∈ Deff mit |x − x0 | < δ(x0 ). Es muß nachgewiesen werden, daß man sogar ein von x0 unabhängiges δ > 0 finden kann. Die Hauptidee bestehtdarin, daß von den unendlich vielen offenen Intervallen x0 − δ(x20 ) , x0 + δ(x20 ) , x0 ∈ M , bereits endlich viele ausreichen, um ganz M zu überdecken (Heine-Borelscher Überdeckungssatz), d.h. es existieren Punkte x1 , x2 , . . . , xk ∈ M , so daß M⊆ k [ i=1 δ(xi ) δ(xi ) , xi + xi − 2 2 . Wir setzen δ := minki=1 δ(x2 i ) . Sei nun x0 ∈ M beliebig und x ∈ (x0 − δ, x0 + δ). Es gibt eine 1 ≤ l ≤ k mit x ∈ xl − δ(x2 l ) , xl + δ(x2 l ) . Wir schätzen ab |x0 − xl | = |x0 − x + x − xl | ≤ |x0 − x| + |x − xl | < δ + δ(xl ) ≤ δ(xl ) . 2 Aus diesem Grund gilt |f (x0 ) − f (xl )| < 2ε und ebenso gilt wegen x ∈ xl − δ(x2 l ) , xl + δ(x2 l ) auch |f (x) − f (xl )| < 2ε . Daraus ergibt sich |f (x)−f (x0 )| = |f (x)−f (xl )+f (xl )−f (x0 )| ≤ |f (x)−f (xl )|+|f (x0 )−f (xl )| < ε . 89 Preliminary version – 3. Juli 2002 Zusammenfassend haben wir gezeigt, daß für alle x0 ∈ M und x ∈ M mit |x − x0 | < δ die Beziehung |f (x) − f (x0 )| < ε gilt und dabei hängt δ nur von ε aber nicht von x0 ab. Also ist f auf M gleichmäßig stetig. 2 Anmerkung: Die Anforderungen an M können nicht abgeschwächt werden. Betrachten wir zum Beispiel den Verzicht auf die Abgeschlossenheit. Die Funktion f (x) = x1 ist auf (0, 1) nicht gleichmäßig stetig. Für zwei beliebige Punkte 0 < x < y < 1 gilt |f (x) − f (y)| = x1 − y1 = y−x < 1. Für ein xy den Anforderungen der Stetigkeitsdefinition 18 genügendes δ für ε = 1 und den Punkt xn = n1 ergeben sich daraus die Bedingungen δ ≤ xn (xn + δ) und x2n 1 = n(n−1) . Keine positive reelle Zahl δ kann diese Bedingung weiter δ ≤ 1−x n für alle natürlichen Zahlen n erfüllen, also ist f im offenen Intervall (0, 1) nicht gleichmäßig stetig. Das abgeschlossene Intervall [0, 1] kann man nicht als M verwenden, da dieses Intervall keine Teilmenge des Definitionsbereiches von f ist. Dagegen kann man den obigen Satz für jede Zahl 0 < ω < 1 auf das abgeschlossene Intervall [ω, 1] anwenden. Auf jedem derartigen Intervall liegt gleichmäßige Stetigkeit vor. Satz 47 Eine auf einer abgeschlossenen beschränkten Menge M stetige Funktion f hat auf M einen beschränkten Wertebereich. Beweisskizze: Nach dem vorangegangenen Satz ist f auf M absolut stetig. Zu ε = 1 existiert also eine positive reelle Zahl δ so, daß |f (x0 ) − f (x)| < 1 für alle x, x0 ∈ M mit |x − x0 | < δ. Analog zu oben folgert man aus dem Heine-Borelschen Überdeckungssatz die Existenz endlich vieler Zahlen Sk x1 , . . . , xk , so daß M ⊆ i=1 (xi − δ, xi + δ). Zu jedem x ∈ M existiert ein i, so daß |x − xi | < δ und daher folgt |f (x) − f (xi )| < ε. Also gilt |f (x)| < maxki=1 (|f (xi )| + 1) und maxki=1 (|f (xi )| + 1) ist eine obere Schranke für die Beträge der Funktionswerte, die f auf M annimmt. 2 Auch hier reicht die Voraussetzung der Stetigkeit auf einer beschränkten Menge M nicht aus. Man überzeugt sich leicht von der bestimmten Divergenz limx→0 x12 = +∞, also ist f (x) = x12 trotz Stetigkeit auf dem offenen Intervall (0, 1) nicht beschränkt. Satz 48 (Weierstraß) Für jede auf einer abgeschlossenen beschränkten Menge M stetige Funktion f existieren das Maximum G = maxx∈M f (x) und das Minimum g = minx∈M f (x) der Menge der Funktionswerte die f auf der Menge M annimmt. 90 Preliminary version – 3. Juli 2002 Beweis: Nach Satz 1 und Satz 47 existieren Supremum und Infimum der Menge {f (x) : x ∈ M }. Angenommen das Supremum G dieser Menge gehörte dieser Menge nicht an, dann würde für alle x ∈ M die Beziehung f (x) < G gelten. Dann ist die Funktion h(x) = G−f1 (x) auf ganz M definiert und stetig. Folglich ist die Menge der Werte die h auf M annimmt beschränkt. Sei also K so, daß h(x) < K für alle x ∈ M . Es folgt weiter 1 < K, also auch f (x) < G − K1 für alle x ∈ M . Das steht im WiderG−f (x) spruch zu den Eigenschaften der oberen Grenze G. Also gilt für mindestens ein x ∈ M die Gleichheit f (x) = G und das Supremum ist sogar Maximum. Analog zeigt man, daß das Infimum sogar Minimum ist. 2 Lemma 3 Sei f im Punkt x0 stetig und f (x0 ) > 0. Dann gibt es eine positive reelle Zahl δ, so daß f (x) > 0 für alle x ∈ Deff mit |x − x0 | < δ. Entsprechend folgt aus der Ungleichung f (x0 ) < 0 die Existenz einer ganzen Umgebung Uδ0 (x0 ) in der f nur negative Werte annimmt. Beweis: Zu ε = f (x0 ) gibt es ein δ > 0, so daß |f (x0 ) − f (x)| < f (x0 ) für alle x ∈ Deff mit |x − x0 | < δ. Im Falle f (x) ≤ 0 würde sich der Widerspruch f (x0 ) > |f (x0 ) − f (x)| = f (x0 ) + |f (x)| ≥ f (x0 ) ergeben. 2 Satz 49 (Bolzano) Sei f auf dem abgeschlossenen Intervall [a, b] stetig und es gelte f (a) < 0 sowie f (b) > 0. Dann hat f im offenen Intervall (a, b) eine Nullstelle, d.h. es gibt eine Zahl ξ ∈ (a, b) mit f (ξ) = 0. Beweis: Die Menge A = {x ∈ [a, b] : ∀y ∈ [a, x] : f (y) < 0} ist wegen a ∈ A nicht leer und durch b nach oben beschränkt. Also existiert das Supremum ξ = sup A. Unser Ziel ist es, die Gültigkeit von f (ξ) = 0 nachzuweisen. Würde f (ξ) > 0 gelten, so müßte es aufgrund der Stetigkeit von f im Punkt ξ nach Lemma 3 eine Umgebung Uδ (ξ) geben, in der f nur positive Werte annimmt. Dann wäre aber beispielsweise ξ − 2δ eine obere Schranke für A im Widerspruch zu sup A = ξ. Den Fall f (x) < 0 schließt man auf ähnliche Weise aus, denn dann müßte f in einer Umgebung Uδ (ξ) von ξ nur negative Werte annehmen, weshalb auch ξ + 2δ zu A gehören müßte. Das widerspricht aber ebenfalls der Supremumeigenschaft von ξ. Also kann nur f (ξ) = 0 gelten. 2 Natürlich gilt die Aussage des Satzes auch im Fall f (a) > 0 und f (b) < 0. Dann betrachtet man die ebenfalls auf [a, b] stetige Funktion −f , diese erfüllt die Voraussetzungen des Satzes und hat daher eine Nullstelle ξ ∈ (a, b). 91 Preliminary version – 3. Juli 2002 Natürlich gilt auch f (ξ) = −(−f )(ξ) = −0 = 0. Eine Verallgemeinerung des Satzes von Bolzano ist der folgende Zwischenwertsatz: Satz 50 (Zwischenwertsatz) Sei f auf dem abgeschlossenen Intervall [a, b] stetig. Ferner gelte G = maxx∈M f (x) > g = minx∈M f (x). Dann gibt es zu jedem c ∈ R mit g < c < G eine Stelle ξ ∈ (a, b) mit f (ξ) = c. Beweis: Nach dem Satz von Weierstraß existieren Zahlen y1 und y2 aus dem Intervall [a, b] mit f (y1 ) = g und f (y2 ) = G. Wir beschränken uns auf die Untersuchung des Falles y1 < y2 . y2 < y1 behandelt man analog. Die Funktion h(x) = f (x) − c ist nach Satz 42 auf [y1 , y2 ] stetig und h(y1 ) < 0 sowie h(y2 ) > 0. Also existiert nach dem Satz von Bolzano ein ξ ∈ (y1 , y2 ) mit h(ξ) = 0, also f (ξ) = h(ξ) + c = c. 2 Übungsaufgaben, Serie 9 25. Untersuchen Sie die Funktion π x cos 2x für x 6= 0 f (x) = 0 für x = 0 auf Stetigkeit im Intervall [−1, 1]. 26. Weisen Sie die Gültigkeit von exp x − 1 =1 x→0 x lim nach. Hinweis: Stellen Sie die Funktion f (x) = expxx−1 als Potenzreihe dar und nutzen Sie deren Stetigkeit zum Nachweis der obigen Beziehung aus. 27. Man zeige, daß die Gleichung x2 + 1 x4 + 1 + = 0 (α < β) x−α x−β mindestens eine Lösung x ∈ (α, β) hat. 92 Preliminary version – 3. Juli 2002 Kapitel 6 Differentiation reeller Funktionen in einer reellen Variablen 6.1 Differenzen- und Differentialquotient Definition 23 (Differenzenquotient) Sei f eine im offenen Intervall (a, b) definierte reelle Funktion in einer reellen Variablen und x0 ∈ (a, b). Man nennt die durch f (x0 + h) − f (x0 ) ϕ(h) = h definierte Funktion ϕ : R → R mit Defϕ = {h 6= 0 : a < x0 + h < b} den Differenzenquotienten von f in x0 . Inhaltlich kann man den Differenzenquotient als Anstieg der Geraden deuten, welche die auf dem Graphen von f liegenden Punkte P0 = (x0 , f (x0 )) und P1 = (x0 + h, f (x0 + h)) verbindet. Man spricht auch von der durch P0 und P1 verlaufenden Sekante des Graphen von f . Unter dem Anstieg einer (nicht zur y-Achse parallelen) Geraden verstehen wir den Tangens des Winkels, welcher entgegen des Uhrzeigersinnes vom positiven Teil der x-Achse und der in Richtung steigender x-Werte verlaufenden Halbgeraden der Sekante eingeschlossen wird. Bei den oben beschriebenen Sekanten von f handelt es sich um ein durch den Punkt (x0 , f (x0 )) verlaufendes Geradenbüschel. Wenigstens für “gutartige” Funktionen f kann man sich vorstellen, daß sich die Lage der durch 93 Preliminary version – 3. Juli 2002 (x0 , f (x0 )) verlaufenden Sekante bei Verkleinern der Größe h stabilisiert. Mit anderen Worten, ihr Anstieg ändert sich bei Verkleinern von h “fast nicht mehr”. Definition 24 (Differentialquotient) Sei f im offenen Intervall (a, b) definiert. f heißt an der Stelle x0 ∈ (a, b) differenzierbar, wenn der Grenzwert f (x0 + h) − f (x0 ) h→0 h lim ϕ(h) = lim h→0 des Differenzenquotienten für h gegen 0 existiert. Im Falle seiner Existenz bezeichnet man diesen Grenzwert als Differentialquotient (oder auch Ableitung) von f an der Stelle x0 und führt dafür die Bezeichnungen f 0 (x0 ) ein: f (x0 + h) − f (x0 ) . h→0 h f 0 (x0 ) = lim Mittels der einseitigen Grenzwerte limh→0+0 ϕ(h) und limh→0−0 ϕ(h) des Differenzenquotienten erklärt man die Begriffe in x0 rechtsseitig beziehungsweise linksseitig differenzierbarer Funktionen. Im Gegensatz zu Definition 24, wo x0 innerer Punkt des Definitionsbereichs sein mußte, benötigt man für die einseitige Differenzierbarkeit nur, daß f in einem halboffenen Intervall [x0 , b) (rechts) beziehungsweise (a, x0 ] (links) definiert ist. Wir halten fest, daß weder die Existenz noch der Wert des Differentialquotienten von der Wahl der Intervallgrenzen a und b abhängen. Sofern der Differentialquotient f 0 (x0 ) von f an der Stelle x0 existiert, so bezeichnet man die durch (x0 , f (x0 )) verlaufende Gerade mit dem Anstieg f 0 (x0 ) als Tangente in x0 an den Graphen von f . Mit Hilfe der linearen Algebra ermittelt man die implizite Darstellung y − f (x0 ) = f 0 (x0 )(x − x0 ) (6.1) der Tangente. Definition 25 Sei f eine reelle Funktion in einer reellen Variablen. Die Funktion f 0 : R → R mit dem Definitionsbereich Deff 0 = {x ∈ Deff : f ist in x0 differenzierbar} und der Abbildungsvorschrift f (x + h) − f (x) h→0 h f 0 (x) = lim nennt man die (erste) Ableitung von f . Eine alternative Symbolik für die df Ableitung ist dx . 94 Preliminary version – 3. Juli 2002 Man beachte, der Differentialquotient ist im Falle seiner Existenz eine Zahl, die erste Ableitung ist eine reelle Funktion in einer reellen Variablen. Die Ähnlichkeit in der Wahl der Bezeichnungen ist natürlich gewollt, denn für alle x0 ∈ Deff 0 ist der Differentialquotient f 0 (x0 ) tatsächlich gerade der Funktionswert der Ableitung f 0 an der Stelle x0 . Dieser Sachverhalt begründet auch die in Definition 24 eingeführte alternative Bezeichnung für den Differentialdf quotient. Die Verwendung der alternativen Symbolik dx ist beispielsweise dann vorteilhaft, wenn die Variable der Funktion f von eventuell auftretenden Parametern zu unterscheiden ist oder wir es mit mehreren Funktionen in verschiedenen Variablen oder gar einer Funktion in mehreren Variablen zu tun haben. 6.2 6.2.1 Beispiele differenzierbarer Funktionen f (x) = c Wir betrachten eine Konstante c ∈ R und die Funktion f (x) = c, die jeder reellen Zahl x ∈ R die Zahl c als Funktionswert zuordnet. Für die Ableitung f 0 von f gilt f 0 (x) = 0 für alle x ∈ R. Der Nachweis ist trivial, denn der Differenzenquotient ϕ(h) = c−c = 0 ist für jedes x0 ∈ R und jedes reelle h 6= 0 gleich 0. h 6.2.2 f (x) = xn , f (x0 +h)−f (x0 ) h = n ∈ N, n 6= 0 Wir betrachten die Ableitung der Funktion f (x) = xn . Für alle x0 ∈ R und h 6= 0 gilt f (x0 + h) − f (x0 ) (x0 + h)n − xn0 = h Pn nh n−i i n i=0 i x0 h − x0 = Pn n hn−i i n X n n−i i−1 i=1 i x0 h = x h = h i 0 i=1 ϕ(h) = P i−1 p(h) = ni=1 ni xn−i ist ein Polynom in der Variablen h und als solches 0 h auf ganz R stetig. Darüberhinaus zeigen die obigen Rechnungen, daß für alle 95 Preliminary version – 3. Juli 2002 h ∈ Defϕ die Beziehung p(h) = ϕ(h) gilt. Übergang zum Differentialquotient liefert n X n n−i i−1 n n−1 lim ϕ(h) = lim p(h) = p(0) = x0 0 = x0 = nx0n−1 . h→0 h→0 i 1 i=1 Also hat die Funktion f (x) = xn die Ableitung f 0 (x) = nxn−1 . 6.2.3 f (x) = exp x Später werden wir sehen, daß man die Ableitung der Exponentialfunktion einfach durch Ableitung der sie definierenden Potenzreihe bestimmen kann. Im Moment fehlt uns allerdings noch die Rechtfertigung für diesen Schritt und wir wollen uns einer anderen Methode bedienen. Berechnen wir zunächst den Differenzenquotient von f in x0 . exp (x0 + h) − exp x0 f (x0 + h) − f (x0 ) = h h (exp h − 1) exp x0 = h ϕ(h) = Übergang zum Differentialquotienten an der Stelle x0 liefert (exp h − 1) exp x0 exp h − 1 lim = lim exp x0 = exp x0 h→0 h→0 h h Dabei kam neben dem Grenzwertsatz 21(2) für Produkte (unter Beachtung von Bemerkung 7 läßt sich dieser leicht von Zahlenfolgen auf Funktionen übertragen) der in Übungsaufgabe 26 gezeigte Grenzwert limh→0 exphh−1 = 1 zum Einsatz. Zusammenfassend haben wir gezeigt f 0 (x) = exp(x) . 6.2.4 f (x) = P∞ n=0 an (x − x0 )n Für Potenzreihen gilt 96 Preliminary version – 3. Juli 2002 P n Satz 51 Die Potenzreihe ∞ n=0 an (x−x0 ) habe den Konvergenzradius ρ > 0 und f : R → R sei die auf dem offenen Intervall (x0 − ρ, x0 + ρ) durch die Abbildungsvorschrift ∞ X f (x) = an (x − x0 )n n=0 definierte reelle Funktion in einer reellen Variablen. Dann ist f für jedes x ∈ (x0 − ρ, x0 + ρ) differenzierbar und es gilt f 0 (x) = ∞ X nan (x − x0 )n−1 . n=1 Die Potenzreihe P∞ n=1 nan (x − x0 )n−1 hat ebenfalls den Konvergenzradius ρ. Beweis: Beginnen wir mit dem Berechnen des Differenzenquotienten von f in x0 . Für alle h mit |h| < ρ gilt f (x0 + h) − f (x0 ) h ! ∞ X 1 = an hn − a0 h n=0 ! ∞ 1 X = an hn h n=1 ϕ(h) = = ∞ X an hn−1 n=1 p p Wegen n−1 |an | ≤ n |an | für alle natürlichen Zahlen n ≥ 2 und alle Glieder |an | < 1, was aufgrund der Nullfolgenbedingung für genügend großes n erfüllt P n−1 sein muß, hat die Potenzreihe P∞ a x nach Satz 34 einen mindestens so n=1 n ∞ n großen Konvergenzradius wie n=0 an (x − x0 ) . Aus diesem Grund stimmt der Differenzenquotient ϕ(h) für alle 0 < |h| < ρ mit dem Wert der FunkP∞ n−1 tion P (h) = a h überein. Eine Potenzreihe ist im inneren ihres n=1 n Konvergenzkreises stetig, also f 0 (x0 ) = lim ϕ(h) = lim P (h) = P (0) = a1 h→0 h→0 Zur Berechnung der Ableitung f 0 (x1 ) an einer Stelle x1 6= x0 mit x1 ∈ (x0 − ρ, x0 + ρ) ordnen wir die Potenzreihe zunächst nach Potenzen von (x − x1 ) 97 Preliminary version – 3. Juli 2002 um und erhalten für alle x mit |x − x1 | < ρ − |x0 − x1 | die Beziehung f (x) = ∞ X n bn (x − x1 ) n=0 ∞ X n , wobei bm = an (x1 − x0 )n−m . m n=m Aus den obigen Betrachtungen folgt schließlich ∞ X ∞ X n n−1 f (x1 ) = b1 = an (x1 − x0 ) = nan (x1 − x0 )n−1 . 1 n=1 n=1 0 Schließlich bleibt noch der Nachweis der Behauptung über den PKonvergenzradius. Offensichtlich ist zunächst nur, daß die Potenzreihe ∞ n=1 nan (x − n−1 x0 ) mindestens den Konvergenzradius ρ hat, denn für alle x ∈ (x0 −ρ, x0 + ρ) haben wir gerade die Existenz der Summe gezeigt. Größer der P∞ als ρ kann n−1 Konvergenzradius aber ebenfalls nicht sein, denn würde n=1 nan (y −x0 ) für ein y mit |y − x0 | > ρ konvergieren, so würde die Reihe ! ∞ ∞ X X nan (y − x0 )n = (y − x0 ) nan (y − x0 )n−1 n=1 n=1 ebenfalls konvergieren und für jedes y1 mit ρ < |y1 − x0 | < |y − x0 | wäre P∞ n sogar absolut konvergent. Nach dem Majorantenkrin=1 nan (y1 − x0 ) P ∞ n terium müßte auch n=0 an (y1 − x0 ) konvergieren, im Widerspruch zu ρ < |y1 − x0 |. Also sind die beiden Konvergenzradien tatsächlich gleich. 2 6.2.5 f (x) = sin x, g(x) = cos x Mit Hilfe des obigen Satzes ergibt sich sofort f 0 (x) = ∞ X ∞ (−1)n n=0 (2n + 1)x2n X x2n = (−1)n = cos x . (2n + 1)! (2n)! n=0 Analog überzeugt man sich von g 0 (x) = ∞ X n=1 (−1)n ∞ X (2n)x2n−1 x2n+1 =− (−1)n = − sin x . (2n)! (2n + 1)! n=0 98 Preliminary version – 3. Juli 2002 6.3 Zusammenhang zwischen Stetigkeit und Differenzierbarkeit Satz 52 Eine Funktion f ist in x0 ∈ Deff genau dann differenzierbar, wenn es eine Konstante a ∈ R und eine im Nullpunkt stetige Funktion R : R → R mit R(0) = 0 gibt, so daß f (x0 + h) − f (x0 ) = ah + hR(h) . (6.2) Beweis: (⇐=) Nehmen wir zunächst an, a und R existieren. Dann gilt lim h→0 f (x0 + h) − f (x0 ) = lim (a + R(h)) = a . h→0 h Also existiert der Differentialquotient von f in x0 und es gilt f 0 (x0 ) = a. (=⇒) Sei nun f in x0 differenzierbar. Wir setzen a = f 0 (x0 ) und f (x0 +h)−f (x0 ) − f 0 (x0 ) für h 6= 0, x0 + h ∈ Deff h R(h) = . 0 für h = 0 Die vorausgesetzte Differenzierbarkeit von f in x0 sichert wegen limh→0 R(h) = f (x0 +h)−f (x0 ) 0 limh→0 − f (x0 ) = 0 die Stetigkeit von R in h = 0. Weiterhin h gilt für alle h 6= 0 mit x0 + h ∈ Deff die Beziehung f (x0 + h) − f (x0 ) 0 ah + hR(h) = ah + h − f (x0 ) = f (x0 + h) − f (x0 ) . h a und R erfüllen damit alle im Satz gestellten Anforderungen. 2 Folgerung 5 Sei f eine in x0 differenzierbare Funktion. Dann existiert eine in h = 0 stetige Funktion R mit R(0) = 0, so daß f (x0 + h) = f (x0 ) + hf 0 (x0 ) + hR(h) für alle h mit x0 + h ∈ Def(f ). Beweis: Die Aussage folgt sofort aus dem obigen Satz unter Berücksichtigung, daß im Falle der Differenzierbarkeit von f in x0 stets a = f 0 (x0 ) galt. 2 99 Preliminary version – 3. Juli 2002 Folgerung 6 Ist f in x0 differenzierbar, so ist f auch in x0 stetig. Beweis: Für a und R wie in (6.2) gilt lim f (x0 + h) = lim (ah + hR(h) + f (x0 )) = f (x0 ) , h→0 h→0 also ist f in x0 stetig. 2 Die Umkehrung der Folgerung gilt dagegen keineswegs. So ist f (x) = |x| auf ganz R sogar gleichmäßig stetig (mit δ(ε) = ε). Dennoch ist f an der Stelle x0 = 0 nicht differenzierbar. Betrachten wir einmal den linksseitigen und den rechtsseitigen Grenzwert des Differenzenquotienten in x0 = 0 für h gegen 0. f (x0 + h) − f (x0 ) |h| −h = lim = lim = −1 wegen h < 0 h→0−0 h→0−0 h h→0−0 h h lim f (x0 + h) − f (x0 ) |h| = lim = 1 wegen h > 0 h→0+0 h→0+0 h h Die beiden einseitigen Grenzwerte stimmen nicht überein, also existiert der beidseitige Grenzwert, d.h. der Differentialquotient von f in x0 = 0, nicht. Es gibt sogar auf ganz R stetige Funktionen, die in keinem Punkt differenzierbar sind. Beispielsweise kommt die Bahn der Bewegung eines Moleküls in einem Gas einer derartigen Kurve nahe. Bei jedem Zusammenstoß mit einem anderen Molekül ändert das Molekül seine Bewegungsrichtung schlagartig, so daß die Kurve an dieser Stelle ähnlich der Absolutbetragsfunktion bei 0 nicht differenzierbar ist. Ist das Gas genügend dicht, so stößt das Molekül nahezu zu jedem Zeitpunkt mit anderen Molekülen zusammen. Einschränkend ist hier noch anzumerken, daß die Bahn des Moleküls als Funktion der Zeit angesehen werden muß, der Funktionswert ist der Punkt des Raumes, wo sich das Molekül gerade befindet. Der Wertebereich sind also nicht einfach die reellen Zahlen, so daß die beschriebene Funktion streng genommen nicht in das hier behandelte Konzept paßt. lim 6.4 Höhere Ableitungen Da die Ableitung f 0 einer Funktion wieder eine reelle Funktion in einer reellen Variablen ist, liegt es nahe auch nach deren Ableitung zu fragen. Man definiert 100 Preliminary version – 3. Juli 2002 Definition 26 Sei f differenzierbar in jedem Punkt einer Umgebung U (x0 ). Ist dann die Ableitung f 0 in x0 differenzierbar, dann nennt man (f 0 )0 (x0 ) die zweite Ableitung von f an der Stelle x0 . Man schreibt dafür (f 0 )0 (x0 ) = 2 f 00 (x0 ) = ddxf2 (x0 ). Man sagt, f ist in x0 zweimal differenzierbar. Durch induktives Fortsetzen dieser Methode erklärt man die n-te Ableitung f (n) (x0 ) = dn f (x0 ) von f in x0 als (f (n−1) )0 (x0 ), sofern die (n − 1)-te Ableitung von f dxn in einer gewissen Umgebung Û (x0 ) existiert. Selbst wenn eine Funktion überall differenzierbar ist, so brauchen die höheren Ableitungen dennoch nicht notwendigerweise zu existieren. Es ist also durchaus sinnvoll davon zu sprechen, daß eine Funktion k-mal differenzierbar ist oder zu fordern, daß sie es sein soll. Die in Abschnitt 6.2 behandelten Funktionen sind alle beliebig oft differenzierbar, d.h. für jede natürliche Zahl n gilt, daß die Funktionen n-mal differenzierbar sind. 6.5 Differentiationsregeln Kommen wir nun zur Fundierung der Ihnen weitgehend bereits aus der Schule bekannten Differentiationsregeln. 6.5.1 Summenregel Satz 53 f und g seien zwei in x0 differenzierbare Funktionen. Dann ist auch die Summe f + g in x0 differenzierbar und für die Ableitung gilt (f + g)0 (x0 ) = f 0 (x0 ) + g 0 (x0 ) Der Beweis verbleibt als Übungsaufgabe 30. 6.5.2 Produktregel Satz 54 Das Produkt f · g zweier in x0 differenzierbarer Funktionen f und g ist ebenfalls in x0 differenzierbar. Für die Ableitung gilt (f · g)0 (x0 ) = f 0 (x0 )g(x0 ) + f (x0 )g 0 (x0 ) 101 Preliminary version – 3. Juli 2002 Beweis: Wir fragen nach dem Grenzwert (f · g)(x0 + h) − (f · g)(x0 ) h→0 h lim des Differenzenquotienten von f · g an der Stelle x0 . Es gilt (f · g)(x0 + h) − (f · g)(x0 ) h→0 h f (x0 + h)g(x0 + h) − f (x0 )g(x0 ) lim h→0 h g(x0 + h) (f (x0 + h) − f (x0 )) + f (x0 ) (g(x0 + h) − g(x0 )) lim h→0 h f (x0 + h) − f (x0 ) g(x0 + h) − g(x0 ) lim g(x0 + h) + lim f (x0 ) h→0 h→0 h h 0 0 g(x0 )f (x0 ) + f (x0 )g (x0 ) (f · g)0 (x0 ) = lim = = = = Dabei wurden die Differenzierbarkeit von f und g in x0 sowie die sich daraus ergebende Stetigkeit von g an der Stelle x0 verwendet. 2 6.5.3 Quotientenregel Satz 55 f und g seien in x0 differenzierbare Funktionen und g(x0 ) 6= 0. Dann ist der Quotient fg in x0 differenzierbar und besitzt dort die Ableitung 0 f f 0 (x0 )g(x0 ) − f (x0 )g 0 (x0 ) (x0 ) = g g(x0 )2 Beweis: Untersuchung des Differentialquotienten liefert: 0 f (x0 ) = lim h→0 g f (x0 +h) g(x0 +h) − f (x0 ) g(x0 ) h 1 f (x0 + h)g(x0 ) − f (x0 )g(x0 + h) = lim h→0 g(x0 + h)g(x0 ) h 1 g(x0 ) (f (x0 + h) − f (x0 )) − f (x0 ) (g(x0 + h) − g(x0 )) = lim h→0 g(x0 + h)g(x0 ) h 0 0 f (x0 )g(x0 ) − f (x0 )g (x0 ) = g(x0 )2 2 102 Preliminary version – 3. Juli 2002 6.5.4 Kettenregel Satz 56 f sei eine in x0 und g eine in f (x0 ) differenzierbare Funktion. Dann ist die Komposition f ◦ g an der Stelle x0 mit der Ableitung d 0 (f ◦ g) (x0 ) = g(f (x)) (x0 ) = g 0 (f (x0 ))f 0 (x0 ) dx differenzierbar. Beweis: Untersuchen wir den Differentialquotienten (f ◦ g)0 (x0 ) = lim h→0 g(f (x0 + h)) − g(f (x0 )) h (6.3) Aus Folgerung 5 ergibt sich die Existenz einer in h = 0 stetigen Funktion R mit R(0) = 0, so daß für alle h aus einer Umgebung von 0 die Gleichung f (x0 + h) − f (x0 ) = h (f 0 (x0 ) + R(h)) gilt. Im Falle h 6= 0 folgt weiter h= f (x0 + h) − f (x0 ) f 0 (x0 ) + R(h) und Einsetzen in (6.3) führt auf (f ◦ g)0 (x0 ) = lim (f 0 (x0 ) + R(h)) h→0 g(f (x0 + h)) − g(f (x0 )) f (x0 + h) − f (x0 ) = f 0 (x0 )g 0 (f (x0 )) 2 6.5.5 Ableitung der Umkehrfunktion f −1 Satz 57 f sei eine in x0 differenzierbare Funktion, welche in einer Umgebung U (x0 ) eine Umkehrfunktion f −1 besitzt. Dann ist f −1 in y0 = f (x0 ) mit der Ableitung 0 f −1 (y0 ) = 1 f 0 (x 0) = 1 f 0 (f −1 (y differenzierbar. 103 Preliminary version – 3. Juli 2002 0 )) Beweis: Der Differentialquotient hat die Gestalt f −1 (y0 + h) − f −1 (y0 ) . h→0 h lim Für alle y aus einer gewissen Umgebung U (y0 ) gilt f −1 (y) ∈ U (x0 ) und f (f −1 (y)) = y. Folglich gilt für kleine h die Beziehung h = f (f −1 (y0 + h)) − f (f −1 (y0 )). Einsetzen in den Differentialquotient ergibt f −1 0 f −1 (y0 + h) − f −1 (y0 ) (y0 ) = lim h→0 h f −1 (y0 + h) − f −1 (y0 ) = lim h→0 f (f −1 (y0 + h)) − f (f −1 (y0 )) 1 = f (f −1 (y0 +h))−f (f −1 (y0 )) limh→0 f −1 (y0 +h)−f −1 (y0 ) 1 = 0 f (x0 ) Hier sind zwei Hinweise angebracht. Zunächst sind f in U (x0 ) und f 0 in U (y0 ) bijektiv, also insbesondere streng monoton. Sonst würde die jeweilige Umkehrfunktion nicht existieren. Aus diesem Grund folgt aus h 6= 0 auch f −1 (y0 + h) − f −1 (y0 ) 6= 0, daher ist im vorletzten Schritt das Invertieren möglich. Außerdem geht aufgrund der Stetigkeit von f 0 in y0 mit h auch die Differenz f −1 (y0 + h) − f −1 (y0 ) gegen 0, also handelt es sich unter Berücksichtigung von f −1 (y0 ) = x0 im Nenner der vorletzten Zeile tatsächlich um den Differentialquotient von f in x0 . 2 Wir schließen diesen Abschnitt mit einem Beispiel ab und betrachten die Logarithmusfunktion ln. Deren Umkehrfunktion ist die Exponentialfunktion exp. Mit der Notation des Satzes haben wir f = exp, f −1 = ln und f 0 = exp. Damit folgt die bekannte Beziehung 0 d ln 1 1 f −1 (y0 ) = (y0 ) = = dy exp ln y0 y0 104 Preliminary version – 3. Juli 2002 Übungsaufgaben, Serie 10 28. Berechnen Sie die Ableitungen der folgenden Funktionen f, g und h (a) f (x) = sin(x) cos(x) − exp(x)2 (b) g(x) = tan(exp(x2 + 3x − 2)) (c) h(x) = cos 2πx x2 − 3 29. Was muß für die reellen Zahlen α1 , α2 , β1 , β2 , γ1 , γ2 gelten, damit die Funktion α1 x2 + β1 x + γ1 für x ≥ 0 f (x) = α2 x2 + β2 x + γ2 für x < 0 (a) stetig, (b) differenzierbar ist. 30. Beweisen Sie die Summenregel der Differentiation. (Satz 53) 105 Preliminary version – 3. Juli 2002 6.5.6 Kurzzusammenfassung der Differentiationsregeln Wir stellen die gerade erarbeiteten Regeln in einer Übersicht zusammen. Dabei sind jedoch in jedem Falle die in den Sätzen gemachten Voraussetzungen an die Funktionen f und g zu berücksichtigen! d(f + g) (x) dx d(f · g) (x) dx d fg (x) dx d(f ◦ g) (x) dx df −1 (x) dx df dg (x) + (x) dx dx df dg = (x) g(x) + f (x) (x) dx dx = df (x) dx dg g(x) − f (x) dx (x) = 2 g(x) d dg df = g(f (x)) = (f (x)) (x) dx dx dx 1 = df (f −1 (x)) dx Unter Bezugnahme auf die Funktionen selbst, nicht deren Funktionswerten an der Stelle x, kann man noch kompakter formulieren: (f + g)0 (f · g)0 0 f g (f ◦ g)0 0 f −1 6.5.7 = f 0 + g0 = f 0 · g + f · g0 f 0 · g − f · g0 = g2 = (f ◦ g 0 ) · f 0 1 = −1 f ◦ f0 Auswahl wichtiger Ableitungen Mit Hilfe der obigen Differentiationsregeln und der Beziehungen zwischen den elementaren Funktionen rechnet man die folgenden Ableitungen aus. Dabei sind gegebenenfalls Einschränkungen an die Definitionsbereiche der 106 Preliminary version – 3. Juli 2002 Funktionen hinzuzuziehen. ∞ ∞ X d X n an (x − x0 ) = nan (x − x0 )n−1 dx n=0 n=1 d exp x dx d sin x dx d cos x dx d tan x dx d cot x dx d ln x dx d arcsin x dx d arccos x dx d arctan x dx d arccotx dx d √ n x dx d a x dx d x a dx d loga x dx d x x dx = exp x = cos x = − sin x = = = = = = = = 1 = 1 + tan2 x cos2 x 1 − 2 = −(1 + cot2 x) sin x 1 x 1 √ 1 − x2 1 −√ 1 − x2 1 1 + x2 1 − 1 + x2 1 √ n n xn−1 = axa−1 , für beliebige a ∈ R = ax ln a , für beliebige positive a ∈ R 1 x ln a , für beliebige positive a ∈ R = = (ln x + 1)xx 107 Preliminary version – 3. Juli 2002 6.6 6.6.1 Wichtige Sätze der Differentialrechnung Satz von Rolle Satz 58 (Satz von Rolle) f sei im abgeschlossenen Intervall [a, b] stetig und im offenen Intervall (a, b) differenzierbar. Falls f (a) = f (b) = 0 gilt, so existiert eine Zahl ξ ∈ (a, b) mit f 0 (ξ) = 0. Beweis: 1. Fall: Gilt f (ξ) = 0 für alle a < ξ < b, so gilt auch f 0 (ξ) = 0 für alle a < ξ < b und die obige Behauptung ist erfüllt. 2. Fall: Es existiert ein a < x0 < b mit f (x0 ) > 0. Sei G das Supremum der Funktionswerte {f (x) | a ≤ x ≤ b}. Dieses Supremum ist positiv und nach Satz 48 von Weierstraß handelt es sich sogar um ein Maximum, es gibt also ein ξ ∈ (a, b) mit f (ξ) = G. Betrachten wir nun den Differenzenquotienten (ξ) ϕ(h) = f (ξ+h)−f von f an der Stelle ξ. Aufgrund von f (ξ +h)−f (ξ) ≤ 0 für h alle h ∈ R mit a < ξ + h < b ergibt sich ϕ(ξ) ≤ 0 für h > 0 und ϕ(ξ) ≥ 0 für h < 0. Wegen der vorausgesetzten Differenzierbarkeit von f in ξ existieren der linksseitige, der rechtsseitige und der beidseitige Grenzwert des Differenzenquotienten. Aus den obigen Ungleichungen ergibt sich darüberhinaus limh→0−0 ϕ(h) ≥ 0 und limh→0+0 ϕ(h) ≤ 0. Da beide einseitigen Grenzwerte gleich sein müssen folgt lim ϕ(h) = lim ϕ(h) = lim ϕ(h) = 0 = f 0 (ξ) h→0−0 h→0+0 h→0 und wir sind fertig. 3. Fall: Es existiert ein a < x0 < b mit f (x0 ) < 0. Wir betrachten die Funktion −f . Diese erfüllt ebenfalls die Voraussetzungen des Satzes und fällt unter den 2. Fall. Also gibt es ein ξ ∈ (a, b) mit (−f )0 (ξ) = −f 0 (ξ) = 0 und die Behauptung ist gezeigt. 2 Eine einfache Folgerung aus dem obigen Satz ist Folgerung 7 Ist f im abgeschlossenen Intervall [a, b] stetig und im offenen Intervall (a, b) differenzierbar und gilt f (a) = f (b), so existiert eine Zahl ξ ∈ (a, b) mit f 0 (ξ) = 0. Ein Beispiel für eine Anwendung des Satzes besteht in der Feststellung, daß sich ein schwingendes Pendel nicht ständig in Bewegung befinden kann. Zum Zeitpunkt des Umkehrens muß sich das Pendel in Ruhe befinden. 108 Preliminary version – 3. Juli 2002 6.6.2 Mittelwertsatz der Differentialrechnung Satz 59 (Mittelwertsatz der Differentialrechnung) f sei im abgeschlossenen Intervall [a, b] stetig und im offenen Intervall (a, b) differenzierbar. Dann existiert ein ξ ∈ (a, b) mit f (b) − f (a) = f 0 (ξ) b−a Beweis: Wir definieren die Funktion g(x) = f (x) − (x − a) f (b) − f (a) b−a Diese ist ebenfalls auf [a, b] stetig und auf (a, b) differenzierbar. Darüberhinaus gelten g(a) = f (a) und g(b) = f (b) − (f (b) − f (a)) = f (a). Also ist Folgerung 7 anwendbar und wir schließen auf die Existenz eines ξ ∈ (a, b) mit g 0 (ξ) = 0. (a) Mit g 0 (x) = f 0 (x) − f (b)−f folgt b−a f 0 (ξ) = f (b) − f (a) b−a 2 Inhaltlich läßt sich der Satz so formulieren, daß es im Intervall (a, b) eine Stelle gibt, an der die Tangente an den Graph von f parallel zur durch (a, f (a)) und (b, f (b)) bestimmten Sekante des Graphen verläuft. Der Satz läßt sich beispielsweise nutzen, um die Ungleichung ∀x, y ∈ R : | sin x − sin y| ≤ |x − y| zu beweisen. Die Funktion sin erfüllt in jedem Intervall [x, y], x 6= y, die Voraussetzungen des Mittelwertsatzes. Folglich existiert ein ξ ∈ [x, y], so x−sin y| x−sin y daß sin x−y = cos ξ. Also | sin|x−y| = | cos ξ| ≤ 1 und die Behauptung folgt sofort. 6.6.3 Quotientenmittelwertsatz Satz 60 (Quotientenmittelwertsatz) f und g seien zwei im abgeschlossenen Intervall [a, b] stetige und im offenen Intervall (a, b) differenzierbare 109 Preliminary version – 3. Juli 2002 Funktionen und es sei g 0 (x) 6= 0 für alle a < x < b. Dann existiert ein ξ ∈ (a, b) mit f (b) − f (a) f 0 (ξ) = 0 . g(b) − g(a) g (ξ) Beweis: Auf den ersten Blick mag es scheinen, daß man einfach Satz 59 auf f und g anwendet und dann die beiden Gleichungen dividiert. So einfach ist der Beweis allerdings nicht, da man in diesem Fall unterschiedliche Zwischenstellen ξ1 und ξ2 für die beiden Ableitungen auf der rechten Seite erhalten würde. Zunächst gilt g(b) 6= g(a), andernfalls müßte die Ableitung von g an einer Stelle des Intervalls (a, b) gemäß Satz 59 verschwinden, was aber nach Voraussetzung nicht der Fall sein soll. Damit ist die Funktion h(x) = f (x) − f (a) − g(x) − g(a) (f (b) − f (a)) , g(b) − g(a) in [a, b] stetig und in (a, b) differenzierbar. Außerdem gilt h(a) = h(b) = 0. Anwendung des Satzes von Rolle (Satz 58) zeigt die Existenz eines ξ ∈ (a, b) mit h0 (ξ) = 0 und aus 0 = h0 (ξ) = f 0 (ξ) − g 0 (ξ) f (b) − f (a) g(b) − g(a) folgt die Behauptung. 6.6.4 2 Regel von l’Hospital Den Quotientenmittelwertsatz kann man nun wiederum ausnutzen, um eine weitere Regel zur Berechnung von Grenzwerten von Funktionen abzuleiten. Satz 61 (Regel von l’Hospital) Die Funktionen f und g seien im halboffenen Intervall [x0 , x0 + l) stetig und im offenen Intervall (x0 , x0 + l) differenzierbar, wobei l eine positive reelle Zahl ist. Darüberhinaus gelte f (x0 ) = g(x0 ) = 0 sowie g 0 (x) 6= 0 für alle x ∈ (x0 , x0 + l). Dann folgt aus der Gültigkeit von f 0 (x) lim =A x→x0 +0 g 0 (x) 110 Preliminary version – 3. Juli 2002 auch die Gültigkeit der Beziehung f (x) =A. x→x0 +0 g(x) lim Erfüllen f und g die entsprechenden Bedingungen auf einem Intervall (x0 − l, x0 ], so gilt die Implikation f 0 (x) f (x) = A =⇒ lim =A 0 x→x0 −0 g (x) x→x0 −0 g(x) lim für die linksseitigen Grenzwerte. Beweis: Für beliebige Intervallgrenzen a = x0 und b = x0 + h mit 0 < h < l erfüllen f und g die Voraussetzungen des Quotientenmittelwertsatzes 60. Also existiert ein (von h abhängiges) θ ∈ (0, 1), so daß f (x0 + h) f 0 (x0 + θh) = 0 . g(x0 + h) g (x0 + θh) Aus der Voraussetzung f 0 (x) lim =A x→x0 +0 g 0 (x) folgt zu beliebig vorgegebenem ε > 0 die Existenz eines δ > 0, so daß 0 f (x0 + h) <ε − A g 0 (x0 + h) für alle 0 < h < δ. Aufgrund von 0 < θh < h ergibt sich erst recht 0 f (x0 + h) f (x0 + θh) = <ε − A − A g(x0 + h) g 0 (x0 + θh) für alle 0 < h < δ, also gilt auch die Beziehung f (x) =A. x→x0 +0 g(x) lim Die Behauptung für linkseitige Grenzwerte folgt analog. Im Hinblick auf zweiseitige Grenzwerte leiten wir daraus ab: 111 Preliminary version – 3. Juli 2002 2 Folgerung 8 Die Funktionen f und g seien auf einer Umgebung U (x0 ) stetig und in jedem von x0 verschiedenen Punkt der Umgebung differenzierbar. Darüberhinaus gelte f (x0 ) = g(x0 ) = 0 und g 0 (x) 6= 0 für alle 0 (x) x ∈ U (x0 ) \ {x0 }. Falls dann der Grenzwert limx→x0 fg0 (x) existiert, so existiert auch der Grenzwert limx→x0 sem Falle überein, d.h. f (x) g(x) und beide Grenzwerte stimmen in die- f (x) f 0 (x) lim = lim 0 . x→x0 g(x) x→x0 g (x) Ohne Beweis halten wir fest, daß die Regel von l’Hospital sinngemäß auch im Fall x0 = ±∞ gilt. Ebenso läßt sie sich auf den Fall zweier uneigentlicher Grenzwerte limx→x0 f (x) = ±∞ und limx→x0 g(x) = ±∞ anwenden. Beispiele: cos x − 1 − sin x − cos x 1 = lim = lim =− 2 x→0 x→0 x→0 x 2x 2 2 ln(1 + x) 1 lim = lim =1 x→0 x→0 x 1+x π − 2x −2 2 = limπ = limπ =2 limπ (π − 2x) tan x = limπ 2 x→ 2 x→ 2 cot x x→ 2 −(1 + cot x) x→ 2 1 + cot2 x lim lim x ln x = x→0+0 ln x = x→+∞ x lim 6.6.5 lim x→0+0 ln x 1 x = lim x→0+0 1 x − x12 = lim −x = 0 x→0+0 1 =0 x→+∞ x lim Satz von Taylor Der folgende Satz zeigt, wie man eine genügend oft differenzierbare Funktion in einer kleinen Umgebung U (x0 ) einer Stelle x0 durch ein Polynom in einer den Abstand des Funktionswertes x von x0 beschreibenden Variablen h, d.h. x = x0 + h, approximieren kann. Derartige Approximationen sind insbesondere für numerische Rechnungen bedeutsam, da man so beispielsweise Berechnungen transzendenter Funktionen auf die vier Grundrechenoperationen reduzieren kann. Satz 62 (Satz von Taylor) Es sei f eine im Intervall (x0 −l, x0 +l), wobei l > 0, (mindestens) (n + 1)-mal differenzierbare Funktion. Dann gibt es zu 112 Preliminary version – 3. Juli 2002 jedem x ∈ R mit x0 − l < x < x0 + l ein θ ∈ (0, 1), so daß f 0 (x0 ) f 00 (x0 ) (x − x0 ) + (x − x0 )2 + · · · (6.4) 1! 2! f (n) (x0 ) f (n+1) (x0 + θ(x − x0 )) + (x − x0 )n + (x − x0 )n+1 n! (n + 1)! f (x) = f (x0 ) + (n+1) (x0 +θ(x−x0 )) Die Funktion Rn (x) = f (x − x0 )n+1 heißt Lagrangsches Rest(n+1)! glied des Taylorschen Satzes. Beweis: Wir konstruieren zunächst die Funktionen f 0 (x0 ) f (n) (x0 ) g(x) = f (x) − f (x0 ) − (x − x0 ) − · · · − (x − x0 )n und 1! n! h(x) = (x − x0 )n+1 Für die Ableitungen dieser Funktionen gelten die Beziehungen g(x0 ) = g 0 (x0 ) = · · · = g (n) (x0 ) = 0 und g (n+1) (x0 ) = f (n+1) (x0 ) beziehungsweise h(x0 ) = h0 (x0 ) = · · · = h(n) (x0 ) = 0 und h(n+1) (x0 ) = (n + 1)! Wenden wir nun den Quotientenmittelwertsatz 60 auf g und h an, so erhalten wir g(x) g(x) − g(x0 ) g 0 (x0 + θ1 (x − x0 )) = = 0 h(x) h(x) − h(x0 ) h (x0 + θ1 (x − x0 )) Auf die rechte Seite können wir wieder den Quotientenmittelwertsatz anwenden und gelangen zu g(x) g 0 (x0 + θ1 (x − x0 )) g 0 (x0 + θ1 (x − x0 )) − g 0 (x0 ) g 00 (x0 + θ2 θ1 (x − x0 )) = 0 = 0 = h(x) h (x0 + θ1 (x − x0 )) h (x0 + θ1 (x − x0 )) − h0 (x0 ) h00 (x0 + θ2 θ1 (x − x0 )) Nach insgesamt (n + 1)-maligem Anwenden des Quotientenmittelwertsatzes erhalten wir schließlich g(x) g (n+1) (x0 + θ(x − x0 )) f (n+1) (x0 + θ(x − x0 )) = (n+1) = , h(x) h (x0 + θ(x − x0 )) (n + 1)! 113 Preliminary version – 3. Juli 2002 wobei θ = θn+1 θn · · · θ1 eine reelle Zahl aus dem Intervall (0, 1) ist. Einsetzen der definierenden Ausdrücke für g und h und Auflösen der Gleichung nach f (x) führt auf Gleichung (6.4). 2 Setzt man h = x − x0 , so nimmt die obige Gleichung die Gestalt f (x0 + h) = f (x0 ) + f 0 (x0 ) f (n) (x0 ) n f (n+1) (x0 + θh) n+1 h + ··· + h + h 1! n! (n + 1)! an und für kleine Zahlen h gilt die Näherung f (x0 + h) ≈ f (x0 ) + f 00 (x0 ) 2 f (n) (x0 ) n f 0 (x0 ) h+ h + ··· + h . 1! 2! n! Ist f in einer Umgebung U (x0 ) von x0 sogar beliebig oft differenzierbar, so kann man den Taylorschen Satz mit immer größerem n betrachten. Gilt dann limn→∞ Rn (x) = 0 für alle x ∈ U (x0 ), dann kann man f auf U (x0 ) in eine sogenannte Taylorreihe f (x) = ∞ X f (n) (x0 ) n=0 n! (x − x0 )n entwickeln. Auf diese Weise hätte man die Übungsaufgaben 20 und 21 ebenfalls lösen können. 114 Preliminary version – 3. Juli 2002 Übungsaufgaben, Serie 11 31. Berechnen Sie die Ableitungen der Funktionen f (x) g(x) k(x) h(x) = = = = sinh x cosh x loga x, xsin x a ist eine positive reelle Zahl 32. Zeigen Sie d 1 arctan x = dx 1 + x2 d Hinweis: Weisen Sie zunächst dx tan x = cos12 x = 1 + tan2 x nach und verwenden Sie dann den Satz über die Ableitung der Umkehrfunktion. 33. Berechnen Sie die erste Ableitung d arsinh dx der Funktion arsinh. Hinweis: Die Berechnung verläuft ähnlich der in der vorigen Aufgabe. Als Zwischenschritt benötigen sie das Additionstheorem cosh2 x − sinh2 x = 1. 6.7 6.7.1 Kurvendiskussion Monotonie Zum Abschluß des Kapitels zur Differentialrechnung wollen wir einige Sätze darüber zusammenstellen, wie die Ableitung einer reellen Funktion f in einer reellen Variablen Rückschlüsse auf den Verlauf des Graphen von f erlaubt. Satz 63 f sei in (a, b) differenzierbar. Dann ist f genau dann monoton wachsend in (a, b), wenn f 0 (x) ≥ 0 für alle a < x < b. Darüberhinaus ist f genau dann streng monoton wachsend, wenn f 0 (x) ≥ 0 für alle a < x < b gilt und auf keinem Teilintervall (c, d) ⊆ (a, b) sogar für alle c < x < d die Gleichheit f 0 (x) = 0 vorliegt. (x0 ) Beweis: Sei f monoton wachsend. Dann ist der Differenzenquotient f (x0 +h)−f h für alle x0 ∈ (a, b) und jedes h mit x0 + h ∈ (a, b) nichtnegativ. Damit ist der 115 Preliminary version – 3. Juli 2002 Differentialquotient, also die Ableitung f 0 (x0 ) (welche nach Voraussetzung existiert), ebenfalls ≥ 0. Betrachten wir nun den umgekehrten Fall, daß also für alle a < x < b die Ungleichung f 0 (x) ≥ 0 gilt. Angenommen, f wächst nicht monoton auf ganz (a, b). Dann gibt es zwei Stellen c, d ∈ (a, b) mit c < d und f (c) > f (d). Anwendung des Mittelwertsatzes 59 liefert die Existenz eines ξ ∈ (c, d) mit (d) f 0 (ξ) = f (c)−f < 0. Das steht im Widerspruch zur Voraussetzung. c−d Kommen wir nun zur Untersuchung der strengen Monotonie. Sei also f streng monoton wachsend und angenommen, es gibt ein Teilintervall (c, d) ⊆ (a, b) mit f 0 (x) = 0 für alle c < x < d. Dann müßte f auf ganz (c, d) den gleichen Wert annehmen, im Widerspruch zur strengen Monotonie. Nehmen wir nun umgekehrt an, es gilt f 0 (x) ≥ 0 für alle a < x < b aber es gibt kein Intervall (c, d) ⊆ (a, b) mit f 0 (x) = 0 für alle c < x < d. Bereits oben haben wir gezeigt, daß f dann monoton wächst. Nehmen wir an, es gibt zwei Stellen c, d mit f (c) = f (d). Aufgrund der Monotonie gilt dann sogar f (x) = f (c) = f (d) für alle c < x < d. Dann ist aber der Differentialquotient für jedes c ∈ (c, d) gleich Null, im Widersprcuh zur vorausgesetzten Nichtexistenz eines Intervalles auf dem f 0 überall den Wert Null annimmt. Also wächst f streng monoton. 2 Analoge Aussagen treffen für monoton fallende Funktionen zu. 6.7.2 Lokale Extremwerte Definition 27 Sei f eine auf einem Intervall (a, b) definierte Funktion. Man sagt, f hat an der Stelle x0 ∈ (a, b) ein lokales Maximum (Minimum), falls eine Umgebung U (x0 ) existiert, so daß f (x) < f (x0 ) (f (x) > f (x0 )) für alle x ∈ U (x0 ) \ {x0 }. Satz 64 (Notwendige Bedingung für lokale Extremwerte) f sei in x0 differenzierbar und f habe an der Stelle x0 einen lokalen Extremwert. Dann gilt f 0 (x0 ) = 0. (x0 ) von f an der Stelle x0 weißt für Beweis: Der Differenzenquotient f (x0 +h)−f h negative h ein anderes Vorzeichen auf, als für positive h (welches Vorzeichen wo auftritt, hängt davon ab, ob es sich um ein lokales Maximum oder ein lokales Minimum handelt). Daher kann der Differentialquotient nur 0 sein. 2 116 Preliminary version – 3. Juli 2002 Bemerkung 8 f sei in [a, b] stetig und f 0 besitze nur endlich viele Nullstellen in [a, b]. Dann nimmt f das Maximum seiner Funktionswerte auf [a, b] in einer der beiden Intervallgrenzen a oder b oder in einem lokalen Maximum an. Analog nimmt f das Minimum seiner Funktionswerte auf [a, b] in einer der beiden Intervallgrenzen a oder b oder in einem lokalen Minimum an. Satz 65 (Hinreichende Bedingung für lokale Extremwerte) Ist f in einer Umgebung U (x0 ) zweimal differenzierbar und gilt f 0 (x0 ) = 0 sowie f 00 (x) > 0 (f 00 (x) < 0) für alle x 6= x0 aus U (x0 ), dann besitzt f an der Stelle x0 ein lokales Minimum (Maximum). Beweis: Sei f 0 (x0 ) = 0 und f 00 (x) > 0 für alle x ∈ U (x0 ) \ {x0 }. Wir schreiben den Taylorschen Satz für n = 1 auf. Zu jedem x ∈ U (x0 ) existiert ein θ ∈ (0, 1), so daß f (x) = f (x0 ) + f 0 (x0 )(x − x0 ) + f 00 (x0 + θ(x − x0 )) (x − x0 )2 > f (x0 ) . 2! Also hat f in x0 ein lokales Minimum. 2 Eine Folgerung aus dieser hinreichenden Bedingung ist das aus der Schule bekannte Kriterium (k = 2). Satz 66 k sei eine positive gerade natürliche Zahl. f sei in einer Umgebung U (x0 ) k-mal differenzierbar mit f 0 (x0 ) = f 00 (x0 ) = · · · = f (k−1) (x0 ) = 0 und f (k) (x0 ) 6= 0. Ist f (k) stetig in x0 , dann gilt: f (k) (x0 ) > 0 =⇒ f hat lokales Minimum in x0 f (k) (x0 ) < 0 =⇒ f hat lokales Maximum in x0 Beweis: Die Stetigkeit von f (k) sichert, daß f (k) (x0 ) in einer ganzen Umgebung von x0 das gleiche Vorzeichen wie in x0 hat (Lemma 3). Damit ergibt sich die Behauptung analog zu oben aus dem Taylorschen Satz. 2 6.7.3 Wendepunkte Definition 28 F sei in (a, b) differenzierbar. f hat in x0 ∈ (a, b) einen Wendepunkt genau dann, wenn f 0 in x0 einen lokalen Extremwert hat. 117 Preliminary version – 3. Juli 2002 Ein Wendepunkt zeichnet sich dadurch aus, daß die Tangente an den Graph von f an der Stelle x0 den Graph im Punkt (x0 , f (x0 )) “durchsetzt”, d.h. für h > 0 beziehungsweise h < 0 liegen die Punkte (x0 + h, f (x0 + h)) auf verschiedenen Seiten der Tangente. Hat f 0 in x0 ein lokales Minimum, so liegt der linke Teil des Graphen unter und der rechte Teil des Graphen über der Tangente. Man spricht von einem Rechts/Links-Wendepunkt. Für ein lokales Maximum von f 0 spricht man von einem Links/Rechts-Wendepunkt, der linke Teil des Graphen liegt über, der rechte Teil unter der Tangente. 6.7.4 Beispiele Abschließend wollen wir die Graphen einiger spezieller Funktionen studieren. Beispiel 1: f (x) = x3 − 2x + 1 Die Funktion f (x) ist auf ganz R definiert und stetig. Es gilt limx→−∞ f (x) = −∞ und lim der Funktion sind x1 = 1, qx→∞ f (x) = ∞. Die Nullstellen q x2 = − 21 + 5 4 ≈ 0, 62 und x3 = − 12 − 5 4 ≈ −1, 62. Die erste Ableitung ist q q f 0 (x) = 3x2 − 2, ihre Nullstellen sind x4 = 23 ≈ 0, 82 sowie x5 = − 23 ≈ −0, 82, nur an diesen beiden Stellen können lokale Extremwerte q vorliegen. Die zweite Ableitung ist f 00 (x) = 6x, also gilt f 00 (x4 ) = 6 23 > 0 sowie q 00 f (x5 ) = −6 23 < 0. Daran erkennen wir, an der Stelle x4 hat f ein lokales Minimum und an der Stelle xq 5 eine lokales Maximum. Der Funktionswert 4 des Maximum ist f (x5 ) = 3 23 + 1 ≈ 2, 09, der des Minimum f (x4 ) = q − 43 23 + 1 ≈ −0, 09. x6 = 0 ist einzige Nullstelle der zweiten Ableitung, also kann höchstens dort ein Wendepunkt auftreten. Wegen f 000 (x) = 6 liegt tatsächlich ein Wendepunkt vor, nämlich ein Rechts/Links-Wendepunkt. Der Funktionswert an der Stelle x6 ist 1. 118 Preliminary version – 3. Juli 2002 Beispiel 2: f (x) = x+2 x2 −1 Der Definitionsbereich der Funktion sind die reellen Zahlen außer −1 und +1, da dieses die Nullstellen des Nenners sind. Für die einseitigen Grenzwerte 119 Preliminary version – 3. Juli 2002 an den Unstetigkeitsstellen gilt x+2 x2 − 1 x+2 lim x→−1+0 x2 − 1 x+2 lim 2 x→1−0 x − 1 x+2 lim 2 x→1+0 x − 1 lim x→−1−0 = +∞ = −∞ = −∞ = +∞ Weiterhin gilt im Unendlichen x+2 x+2 = lim 2 =0. 2 x→+∞ x − 1 x→−∞ x − 1 lim Einzige Nullstelle der Funktion ist x1 = −2. Die erste Ableitung der Funktion ist 1(x2 − 1) − 2x(x + 2) x2 + 4x + 1 f 0 (x) = = . (x2 − 1)2 (x2 − 1)2 √ √ Also kommen nur x2 = −2 + 3 ≈ −0, 27 und x3 = −2 − 3 ≈ −3, 73 für lokale Extremwerte in Frage. Aus der zweiten Ableitung f 00 (x) = (2x + 4)(x2 − 1) − 4x(x2 + 4x + 1) (x2 − 1)3 erkennen wir f 00 (x2 ) < 0 und f 00 (x3 ) > 0. Damit liegen tatsächlich lokale Extremwerte, nämlich in x2 ein Maximum und in x√3 ein Minimum vor. Die √ Funktionswerte an diesen Stellen sind f (x2 ) = (√3−2)3 2 −1 = 6−43√3 ≈ −1, 87 √ 3 sowie f (x3 ) = − (−√3−2) 2 −1 ≈ −0, 13. Die Bestimmung der Wendepunkte bedarf der Lösung einer Gleichung dritten Grades, welche nachweislich keine rationale Nullstelle besitzt. Ein Lösungsverfahren für derartige Gleichungen haben wir im Rahmen der Vorlesungsreihe nicht behandelt, wir müssten also numerische Methoden zur Lösung einsetzen, worauf wir an dieser Stelle allerdings verzichten wollen. 120 Preliminary version – 3. Juli 2002 Beispiel3: f (x) = sin x·ln x x2 −1 x Untersuchen wir nun die Funktion f (x) = sinx2x·ln . Der Zähler ist nur für −1 positive reelle Zahlen definiert und der Nenner besitzt die Nullstellen 1 und −1. Daher ist der Definitionsbereich Deff = {a ∈ R : a > 0, a 6= 1} gleich der Menge der von 1 verschiedenen positiven reellen Zahlen. Untersuchen wir also zunächst den Typ der Unstetigkeit von f an der Stelle 1. x Zur Berechnung von limx→1 f (x) = limx→1 sinx2x·ln ist die Regel von l’Hospital −1 anwendbar: cos x · ln x + sinx x sin x · ln x sin 1 lim = lim = ≈ 0, 42 2 x→1 x→1 x −1 2x 2 121 Preliminary version – 3. Juli 2002 Wir haben es also nur mit einer hebbaren Unstetigkeit zu tun. Für den einseitigen Grenzwert limx→0+0 f (x). Problematisch ist allein das Verhalten des Zählers, denn während sin x gegen Null konvergiert ist ln x bestimmt divergent gegen −∞, wieder ist die Regel von l’Hospital einsetzbar: lim sin x · ln x = x→0+0 = lim x→0+0 lim x→0+0 ln x 1 sin x − 1 x x→0+0 − cos2 x sin x = lim sin x tan x x = lim − x→0+0 sin2 x x cos x =0 Damit ergibt sich sofort limx→0+0 f (x) = 0. Schließlich fragen wir nach dem Verhalten des Graphen im Unendlichen. Dazu untersuchen wir zunächst mittels der Regel von l’Hospital den Grenzwert 1 ln x x = lim =0 lim x→+∞ 2x x→+∞ x2 − 1 Aufgrund der Beschränktheit von | sin x| folgt daraus (siehe dazu auch Übungsaufgabe 13): sin x ln x lim =0 x→+∞ x2 − 1 Die Nullstellen der Funktion f ergeben sich aus den Nullstellen der Sinusfunktion, es handelt sich um die Stellen x = kπ mit positiver natürlicher Zahl k. Zur Suche nach den lokalen Extremstellen muß man die Nullstellen der ersten Ableitung 2 sin x cos x ln x + (x − 1) − 2x (sin x ln x) x f 0 (x) = (x2 − 1)2 berechnen. Dazu benötigt man ebenso numerische Verfahren wie für die Bestimmung der Wendepunkte. Wir wollen an dieser Stelle auf beides verzichten. 122 Preliminary version – 3. Juli 2002 Übungsaufgaben, Serie 12 34. Berechnen Sie die Taylorreihe der Funktion f (x) = x0 = 1. √ x an der Stelle 35. Gegeben ist die Funktion f (x) = ln x+2 x2 − 1 . Bestimmen Sie den Definitionsbereich und untersuchen Sie die Funktion auf Nullstellen und lokale Extremwerte. 123 Preliminary version – 3. Juli 2002 36. Bestimmen und klassifizieren Sie die lokalen Extremwerte und Wendepunkte der Funktion f (x) = e−x sin x . 124 Preliminary version – 3. Juli 2002 Kapitel 7 Integration reeller Funktionen in einer reellen Variablen Es gibt zwei prinzipiell verschiedene Zugänge zur Integralrechnung. Zum einen kann man nach einer Möglichkeit zur Berechnung des Inhalts der von einer Kurve und gewissen achsenparallelen Geraden eingeschlossenen Fläche Rb fragen, dabei gelangt man zum bestimmten Integral a f (x)dx. Der andere Zugang untersucht die Umkehroperation des Differenzierens und führt R auf das unbestimmte Integral f (x)dx. Schließlich stellt der Hauptsatz der Differential- und Integralrechnung die Verbindung der beiden Ansätze her. 7.1 Das Riemannsche Integral Wir beginnen mit der Einführung des Riemannschen oder auch bestimmten Integrals. Sei f eine reelle Funktion in einer reellen Variablen, welche auf dem abgeschlossenen Intervall [a, b] definiert ist und dort überall positive Werte annimmt, d.h. f (x) > 0 für alle a ≤ x ≤ b. Wir fragen nach dem Inhalt der Fläche, die vom Graphen der Funktion f , der x-Achse und den beiden zur y-Achse parallelen Geraden x = a und x = b eingeschlossen wird. 125 Preliminary version – 3. Juli 2002 Eine Näherungslösung des Flächeninhaltes kann man gewinnen, indem man das Intervall [a, b] in Teilintervalle zerlegt und die Rechtecke betrachtet, die durch die x-Achse, die Parallelen zur y-Achse durch die Randpunkte eines Teilintervalls und eine Parallele zur x-Achse durch einen Punkt des Graphen mit Argument innerhalb des Teilintervalls begrenzt werden. Die Berechnung des Flächeninhaltes der Rechtecke ist klar und der gesuchte Gesamtflacheninhalt ist etwa so groß wie die Summe der Inhalte aller Teilrechtecke. 126 Preliminary version – 3. Juli 2002 Die approximierte Fläche hängt von der Zerlegung in Teilintervalle und der Auswahl der Zwischenwerte von f zur oberen Begrenzung der Rechtecke ab. Intuitiv ist klar, daß die Gefahr eines Fehlers umso größer ist, je mehr der Funktionswert innerhalb eines Teilintervalles variiert. Wenigstens für stetige Funktionen nimmt die Streuung der Funktionswerte innerhalb eines Teilintervalls mit sinkender Länge des Teilintervalls ab. Um also den Flächeninhalt zu ermitteln, muß man einen Grenzübergang betrachten, bei dem die maximale Länge der Teilintervalle gegen Null konvergiert. Die Voraussetzung, daß f auf ganz [a, b] positive Werte annehmen sollte, lassen wir von nun an wieder fallen. Diese war nur der inhaltlichen Vorstellung der Suche nach einem Flächeninhalt geschuldet. Läßt man beliebige Funktionswerte zu, so kann man unsere Aufgabe so deuten, daß wir nach der Differenz des Inhalts der oberhalb der x-Achse liegenden Teilfläche minus des Inhalts der unterhalb der x-Achse liegenden Teilfläche suchen. Definition 29 Sei [a, b] ⊂ R ein abgeschlossenes endliches Intervall und x1 , . . . , xk+1 eine aufsteigende Folge reeller Zahlen mit der Eigenschaft a = x1 < x2 < . . . < xk+1 = b. Dann nennen wir die Menge Z = {I1 , . . . , Ik } der Intervalle [xi , xi+1 ], i = 1, . . . , k, eine Zerlegung von [a, b] und die x1 , . . . , xk+1 die Teilpunkte der Zerlegung. 127 Preliminary version – 3. Juli 2002 Wir sagen die durch die aufsteigende Folge a = y1 < y2 < . . . < yn+1 = b beschriebene Zerlegung {J1 , . . . , Jn } verfeinert die Zerlegung {I1 , . . . , Ik }, falls zu jedem Index i ∈ {1, . . . , k + 1} ein Index j ∈ {1, . . . , n + 1} mit xi = yj existiert. Eine Verfeinerung einer Zerlegung Z eines Intervalls [a, b] entsteht also durch eventuelle Hinzunahme weiterer Teilpunkte, d.h. durch Zerlegung der Teilintervalle. Definition 30 Sei f eine auf dem abgeschlossenen endlichen Intervall [a, b] definierte Funktion, Z = {I1 , . . . , Ik } eine Zerlegung von [a, b] und T = {ξ1 , . . . , ξk } eine Menge von Zwischenwerten mit der Eigenschaft ξi ∈ Ii = [xi , xi+1 ] für alle i = 1, . . . , k. Dann heißt k X σf (Z, T ) = f (ξi )(xi+1 − xi ) i=1 die Zwischensumme der Funktion f zu der Zerlegung Z und den Zwischenwerten T . Die Zahl S heißt Grenzwert aller Zwischensummen, falls zu jedem ε > 0 eine Zerlegung Z0 existiert, so daß für alle Z0 verfeinernden Zerlegungen Z und alle Mengen von Zwischenwerten T von Z die Abschätzung |σf (Z, T ) − S| < ε zutrifft. Man beachte einerseits die Ähnlichkeit zur Definition gewöhnlicher Grenzwerte aber auch die Unterschiede. Hier haben wir es nicht mit einer natürlichzahligen oder komplexen Größe zu tun, die gegen unendlich oder eine Zahl läuft, sondern hier werden Zerlegungen und Mengen von Zwischenwerten variiert. Entscheidend ist, daß dieser Prozeß auch hier gerichtet verläuft, nämlich in Richtung immer feinerer Zerlegungen. Wie bei den gewöhnlichen Grenzwerten, kann es nur höchstens einen Grenzwert aller Zwischensummen geben. Denn hätte man zwei, sagen wir S1 und S2 , dann gäbe es zu vorgegebenem 2ε zwei Zerlegungen Z1,0 und Z2,0 , so daß |σf (Z1 , T1 ) − S1 | < ε ε und |σf (Z2 , T2 ) − S2 | < 2 2 128 Preliminary version – 3. Juli 2002 für alle Verfeinerungen Z1 von Z1,0 und alle Verfeinerungen Z2 von Z2,0 und alle Mengen T1 beziehungsweise T2 von Zwischenwerten. Die Zerlegung Z deren Teilpunktmenge gerade die Vereinigung der Teilpunktmengen von Z1,0 und Z2,0 ist, verfeinert beide Zerlegungen Z1,0 und Z2,0 . Für eine beliebige Zwischenwertmenge T von Z gilt also sowohl |σf (Z, T ) − S1 | < ε ε als auch |σf (Z, T ) − S2 | < 2 2 und somit |S1 − S2 | < ε. Da ε > 0 beliebig gewählt werden kann, bedeutet daß jedoch S1 = S2 . Das rechtfertigt die Begriffsbildung: Definition 31 Sei f eine auf dem abgeschlossenen endlichen Intervall [a, b] definierte Funktion. Im Falle der Existenz des Grenzwertes S aller Zwischensummen von f , nennt man diesen das bestimmte (oder auch Riemannsche) Integral von f über das Intervall [a, b] und schreibt dafür S= b Z f (x)dx . a Man sagt, f ist über [a, b] im Riemanschen Sinne integrierbar oder einfach über [a, b] R-integrierbar. Bisher läßt sich einzig für eine Funktion f (x) = c, wobei c eine reelle KonRb stante ist, das Riemannsche Integral a f (x)dx leicht bestimmen. In diesem Fall gilt nämlich σf (Z, T ) = (b − a)c für alle Zerlegungen Z und alle ZwiRb schenwertmengen T , also a cdx = (b − a)c. Wenn man bereits weiß, daß f über [a, b] R-integrierbar ist, dann kann man Rb die Berechnung von a f (x)dx auf eine gewöhnliche Grenzwertberechnung zurückführen. Man kann sich eine beliebige ausgezeichnete Folge Z1 , Z2 , . . . von Zerlegungen des Intervalls [a, b] vorgeben, ausgezeichnet soll heißen, die maximale Länge der an Zn beteiligten Teilintervalle konvergiert für n → ∞ gegen 0. Bei beliebiger Wahl der Zwischenwertmengen Tn zu Zn gilt dann Z b f (x)dx = lim σf (Zn , Tn ) . a n→∞ Wie bereits eingangs erwähnt, muß dafür allerdings die Existenz des Grenzwertes bereits bekannt sein. Andernfalls könnte eine konkrete Wahl der 129 Preliminary version – 3. Juli 2002 Z1 , Z2 , . . . und T1 , T2 , . . . auf eine konvergente Zwischensummenfolge führen, wohingegen eine andere Wahl einen anderen Grenzwert oder gar Divergenz zur Folge haben könnte. Satz 67 f und g seien über [a, b] R-integrierbare Funktionen. Dann ist für beliebige reelle Zahlen λ und µ auch λf +µg R-integrierbar mit dem bestimmten Integral Z b Z b Z b (λf + µg)(x)dx = λ f (x)dx + µ g(x)dx a a a Beweis: Sei Z eine Zerlegung von [a, b] und T eine Menge von Zwischenwerten. Einsetzen von (λf + µg)(x) = λf (x) + µg(x) in die Zwischensumme σλf +µg (Z, T ) zeigt σλf +µg (Z, T ) = λσf (Z, T ) + µσg (Z, T ) für alle Z und T , also auch für die Grenzwerte. 2 Satz 68 Für reelle Zahlen a,b,c mit a < b < c gilt, ist f über [a, b] und über [b, c] R-integrierbar, so ist f auch über [a, b] R-integrierbar mit Z c f (x)dx = a Z b f (x)dx + a Z c f (x)dx . b Beweis: Es besteht ein bijektiver Zusammenhang zwischen der Menge aller Zerlegungen von [a, c] mit der Eigenschaft, daß b einer ihrer Teilpunkte ist, und der Menge der geordneten Paare bestehend aus einer Zerlegung von [a, b] und einer Zerlegung von [b, c]. Jede Verfeinerung einer Zerlegung von [a, c] mit Teilpunkt b enthält b ebenfalls als Teilpunkt. Sind also Z1,0 und Z2,0 so, daß Z b ε |σf (Z1 , T1 ) − f (x)dx| < 2 a und |σf (Z2 , T2 ) − Z c f (x)dx| < b ε 2 für alle Verfeinerungen von Z1,0 beziehungsweise Z2,0 und alle Zwischenwertmengen T1 und T2 , so gilt Z b Z c σf (Z, T ) − f (x)dx + f (x)dx < ε a b 130 Preliminary version – 3. Juli 2002 für alle Verfeinerungen der vom Paar (Z1,0 , Z2,0 ) bestimmten Zerlegung Z0 Rb Rc von [a, c] und alle Zwischenwertmengen T . Also ist a f (x)dx + b f (x)dx der Grenzwert aller Zwischensummen von f über [a, c] und folglich Z a c f (x)dx = Z b f (x)dx + a Z c f (x)dx . b 2 Satz 69 Ist f über [a, b] R-integrierbar, dann ist f auch über jedem Teilintervall [c, d] ⊆ [a, b] R-integrierbar. Beweisidee: Wir können wieder die Grenzwertbedingung durch ein Analogon zum Chauchy-Kriterium ersetzen, d.h. zu ε > 0 existiert eine Zerlegung Z0 von [a, b] mit |σf (Z1 , T1 ) − σf (Z2 , T2 )| < ε für alle Verfeinerungen Z1 und Z2 von Z0 und Zwischenwertmengen T1 und T2 . O.B.d.A. können wir annehmen, daß c und d Teilpunkte der Zerlegung Z sind, nötigenfalls könnten wir diese Teilpunkte einfach hinzunehmen. Insbesondere gilt die obige Abschätzung auch, wenn Z1 und Z2 in allen Teilpunkten kleiner c und größer d übereinstimmen und T1 sowie T2 gleiche Zwischenwerte in den außerhalb von [c, d] liegenden Intervallen aufweisen. Im weiteren seien die Zerlegungen Z1 , Z2 und Zwischenwertmengen T1 und T2 beliebig. Dann hängt die Differenz |σf (Z1 , T1 ) − σf (Z2 , T2 )| nur von den Teilpunkten und Zwischenwerten im Inneren von [c, d] ab, wir haben also |σf (Z01 , T10 ) − σf (Z02 , T20 )| < ε für alle Zerlegungen Z01 und Z02 von [c, d], die das ‘Innere’ von Z verfeinern und alle passenden Zwischenwertmengen T10 und T20 . Also ist f über [c, d] R-integrierbar. 2 Eine in [a, b] R-integrierbare Funktion f braucht auf [a, b] nicht stetig zu sein. Eine notwendige Bedingung der R-Integrierbarkeit ist jedoch die Beschränktheit auf [a, b]. Wir halten ohne Beweis fest: Satz 70 f sei auf [a, b] beschränkt und an höchstens endlich vielen Stellen von [a, b] unstetig. Dann ist f über [a, b] R-integrierbar. Eine Folge aus diesem Satz ist, daß für Funktionen f mit höchstens endlich vielen Unstetigkeitsstellen im Intervall a, b eine ausgezeichnete Folge Z1 , Z2 , . . . von Zerlegungen und dazu passende Zwischenwertmengen T1 , T2 , . . . 131 Preliminary version – 3. Juli 2002 beliebig vorgegeben werden können und dann die Integration mittels der Formel Z b f (x)dx = lim σf (Zn , Tn ) a n→∞ ausgeführt werden kann. Beispielsweise kann man Zn durch äquidistante Zerlegung von [a, b] in n Teilintervalle [a + (i − 1) b−a , a + i b−a ], i = 1, . . . , n, welche alle die Länge b−a n n n haben, gewinnen. Als Zwischenwert jedes Intervalles von Zn könnte man die b−a Intervallmitte ξi = a + 2i−1 festlegen und erhält 2 n Z b n n X X b−a b−a b−a 1b−a f (x)dx = lim f (ξi ) = lim f a+i − n→∞ n→∞ n n n 2 n a i=1 i=1 Das gleiche Ergebnis erhält man auch bei der Wahl der jeweiligen linken beziehungsweise rechten Intervallgrenze als Zwischenwerte: Z b n n X X b−a b−a b−a b−a f (x)dx = lim f a + (i − 1) = lim f a+i . n→∞ n→∞ n n n n a i=1 i=1 Damit haben wir endlich die Möglichkeit auch ein Beispiel praktisch auszurechnen. Wir betrachten die Funktion f (x) = x. Diese hat keine Unstetigkeitsstellen, also ist sie über jedem Intervall [a, b] R-integrierbar und es gilt Z b n X b−a b−a xdx = lim a+i n→∞ n n a i=1 2 n X (b − a)a b−a = lim +i n→∞ n n i=1 2 n n (b − a)a X b−a X = lim 1 + lim i n→∞ n→∞ n n i=1 i=1 2 b − a n(n − 1) = (b − a)a + lim n→∞ n 2 2 (b − a) 1 = (b2 − a2 ) = (b − a)a + 2 2 Unsere bisherigen Untersuchungen galten zunächst nur für Intervalle [a, b] mit a < b. Mittels der Definitionen Z a f (x)dx := 0 für alle a ∈ R a 132 Preliminary version – 3. Juli 2002 und Z a f (x)dx := − b b Z f (x)dx für alle a < b a läßt sich das bestimmte Integral auch auf den Fall a ≥ b ausdehnen. Dabei bleiben alle bisherigen Sätze gültig. 7.2 Hauptsatz der Differential- und Integralrechnung Sei f eine in [a, b] stetige, also insbesondere R-integrierbare, Funktion. Halten wir die untere Intervallgrenze fest und wählen eine obere Intervallgrenze x mit a ≤ x ≤ b, dann ist f auch über jedem Intervall [a, x] R-integrierbar und wir können die auf dem Intervall [a, b] definierte reelle Funktion Z x F (x) = f (t)dt a in der reellen Variablen x betrachten. Satz 71 Sei f eine R x in [a, b] stetige Funktion und x0 0∈ (a, b). Dann ist die Funktion F (x) = a f (t)dt in x0 mit der Ableitung F (x0 ) = f (x0 ) differenzierbar. Beweis: Für den Differenzenquotienten ϕ(h) = ϕ(h) = = = = = F (x0 +h)−F (x0 ) h Z x0 +h Z x0 1 f (t)dt − f (t)dt h a a Z 1 x0 +h f (t)dt h x0 Z 1 x0 +h [f (x0 ) + (f (t) − f (x0 ))]dt h x0 Z hf (x0 ) 1 x0 +h + [f (t) − f (x0 )]dt h h x0 Z 1 x0 +h f (x0 ) + [f (t) − f (x0 )]dt h x0 133 Preliminary version – 3. Juli 2002 von F gilt (7.1) Aufgrund der Stetigkeit von f an der Stelle x0 existiert zu jedem ε > 0 ein δ > 0, so daß |f (ξ) − f (x0 )| < ε für alle ξ ∈ [a, b] mit |ξ − x0 | < δ. Sei g die auf dem Intervall [a, b] durch g(x) = f (x) − f (x0 ) definierte Funktion. Dann gilt für |h| < δ die Abschätzung |g(ξ)| = |f (ξ) − f (x0 )| < ε für alle R x +h ξ, die als Zwischenwert in einer Zwischensumme des Integrals x00 [f (t) − R x +h f (x0 )]dt = x00 g(t)dt auftreten können. Sei nun h > 0. Für beliebige Zerlegungen Z des Intervalls [x0 , x0 + h] und beliebige Zwischenwertmengen T folgt |σg (Z, T )| ≤ hε, analog ergibt sich im Falle h < 0 die Beziehung |σg (Z, T )| ≤ |h|ε Z des Intervalls [x0 +h, x0 ]. Damit R für beliebige Zerlegungen x0 +h können wir x0 [f (t) − f (x0 )]dt < |h|ε abschätzen und für alle h mit 0 < |h| < δ ergibt sich schließlich Z x0 +h 1 |ϕ(h) − f (x0 )| ≤ [f (t) − f (x0 )]dt < ε . h x0 Das heißt nichts anderes als F 0 (x0 ) = f (x0 ). 2 Definition 32 Sei f eine auf einem Intervall (a, b) definierte reelle Funktion. Eine auf (a, b) definierte und differenzierbare Funktion F mit der Eigenschaft F 0 (x) = f (x) für alle x ∈ (a, b) nennt man eine Stammfunktion von f. Aus den Differentiationsregel folgt, daß die Stammfunktion von f wegen F 0 = (F +c)0 nur bis auf einen konstanten Summanden c bestimmt sein kann. Andererseits können sich zwei Stammfunktionen F1 und F2 von f höchstens um einen konstanten Summanden unterscheiden, denn wegen F10 = F20 = f gilt F10 − F20 = (F1 − F2 )0 = 0, weswegen F1 − F2 eine Konstante sein muß. Wir fassen zusammen: Satz 72 Wenn eine reelle Funktion f überhaupt eine Stammfunktion F besitzt, dann ist {F + c : c ∈ R} die Menge aller reellen Stammfunktionen von f . Definition 33 Eine Funktion f heißt (unbestimmt) integrierbar, wenn sie eine Stammfunktion besitzt. Man nennt eine Stammfunktion F von f auch ein unbestimmtes Integral von f . Zu einer unbestimmt integrierbaren Funktion f und x0 ∈ Deff gibt es genau eine Stammfunktion Fx0 von f , welche an der Stelle x0 den Wert 0 annimmt, 134 Preliminary version – 3. Juli 2002 diese bezeichnet man auch mit Fx0 = Z f (t)dt . x0 Mit Z f (t)dt bezeichnet man eine allgemeine Stammfunktion, d.h. sie enthält einen reellen Parameter c, durch dessen Wahl man jede Stammfunktion erhalten kann. Ist R also F irgendeine Stammfunktion von f , so gilt f (t)dt = F + c. Der hier vorgestellte Zugang zur Integration als Umkehroperation des Differenzierens kann natürlich völlig unabhängig vom Riemannschen Integral betrachtet werden. Wie uns Satz 71 bereits zeigt, besteht jedoch für stetige Funktionen f ein enger Zusammenhang zwischen unbestimmter und Riemannscher Integration. Der folgende Satz präzisiert diesen Zusammenhang. Satz 73 (Hauptsatz der Differential- und Integralrechnung) Für eine in [a, b] stetige Funktion f gilt Rx 1. F (x) = a f (t)dt ist diejenige Stammfunktion von f , die an der Stelle a den Wert 0 hat. 2. Für eine beliebige Stammfunktion Φ von f gilt Z b f (t)dt = Φ(b) − Φ(a) . a Die zweite Aussage begründet die gebräuchlichen Schreibweisen Z b f (t)dt = Φ(t)|ba = [Φ(t)]ba . a Beweis des R a Satzes: Teil 1 ergibt sich sofort aus Satz 71 und der Tatsache F (x) = a f (t)dt = 0. Kommen wir zum Beweis des zweiten Teiles des Satzes. R x Eine beliebige Stammfunktion Φ von f unterscheidet sich von F (x) = a f (t)dt durch eine additive Konstante c ∈ R, d.h. F (x) = Φ(x) + c für alle x ∈ [a, b]. Insbesondere haben wir Φ(a) = −c und somit Z b Φ(b) − Φ(a) = F (b) − c − (−c) = F (b) = f (t)dt a und wir sind fertig. 2 135 Preliminary version – 3. Juli 2002 7.3 Uneigentliche Integrale Sofern gewisse Grenzwerte existieren, läßt sich das bestimmte Integral für stetige Funktionen f auf Intervallgrenzen ±∞ ausdehnen. Man spricht dann von uneigentlichen Integralen und definiert im Falle der Existenz der auftretenden Grenzwerte: Z a f (t)dt := F (a) − lim F (x) , x→−∞ −∞ +∞ Z f (t)dt := lim F (x) − F (a) sowie x→+∞ a Z +∞ f (t)dt := lim F (x) − lim F (x) x→+∞ −∞ x→−∞ Betrachten wir dazu folgendes Beispiel: Z ∞ Z −t e dt = lim 0 x→∞ x e−t dt 0 Durch Differenzieren überzeugt man sich leicht davon, daß F (t) = −e−t eine Stammfunktion von f (t) = e−t ist, also ergibt sich weiter Z ∞ x e−t dt = lim −e−t 0 = lim −e−x − (−1) = 1 0 x→∞ x→∞ Ähnlich kann man vorgehen, wenn f nur im halboffenen Intervall [a, b) definiert ist. Falls dann f für jedes positive h in [a, b − h] R-integrierbar ist und R b−h der Grenzwert limh→0+0 a f (x)dx existiert, so bezeichnet man diesen mit Rb f (x)dx. Analoge Aussagen gelten für Definitionsbereiche (a, b] und (a, b). a Betrachten wir auch dazu wieder ein Beispiel. Z b−h Z b 1 1 √ √ dx = lim dx h→0+0 a b−x b−x a √ Nachrechnen belegt, daß F (x) = − 21 b − x eine Stammfunktion des Integranden ist, also: b−h Z b 1 1√ 1√ 1√ 1√ √ dx = lim − b−x = lim − h+ b−a = b−a h→0+0 h→0+0 2 2 2 2 b−x a a 136 Preliminary version – 3. Juli 2002 Man beachte aber, hier handelt es sich in der Tat nicht um ein Riemannsches Integral. Um wenigstens die Voraussetzungen eines Riemannschen Integrales zu erfüllen, definieren wir den Integrand an der Stelle x = b mittels einer beliebigen Setzung. Gibt man irgendeine Zerlegung Z0 von [a, b] vor, und legt eine Menge T0 von Zwischenwerten fest. Die Menge aller Zwischensummen σf (Z, T ), mit Z verfeinert Z0 und T sind Zwischenwerte zu Z, ist auf jeden Fall unbeschränkt, denn bereits bei festgehaltener Zerlegung Z und festgehaltenen Zwischenwerten aller Teilintervalle mit Ausnahme des letzten führt auf eine unbeschränkte Menge von Zwischensummen, indem man nur den Zwischenwert des letzten Intervalles gegen b wandern läßt. Die zunächst notwendige Einschränkung auf stetige Funktionen zur Anwendbarkeit von Satz 73 zur Berechnung bestimmter Integrale können wir im Falle von Funktionen mit nur endlich vielen Unstetigkeitsstellen dadurch umgehen, daß wir das Intervall [a, c] an denRUnstetigkeitsstellen in Teilintervalle c zerlegen und das bestimmte Integral a f (x)dx in eine Summe von Integralen stetiger Funktionen zerlegen. Ist f wenigstens beschränkt, so treten höchstens Unstetigkeiten vom Typ 1, d.h. hebbar oder endlicher Sprung, auf. In diesem Falle sind die einzelnen Summanden und das Summenintegral sogar Riemannsch.Ist f dagegen unbeschränkt, so muß zu uneigentlichen Integralen übergegangen werden. Wenn alle uneigentlichenRSummanden existieren, c so existiert auch das uneigentliche Summenintegral a f (x)dx. Betrachten wir Beispiel zur Zerlegung des Integrationsintervalles die Funk als ex für x ≥ 0 tion f (x) = im Intervall [−2, 1]. Die Funktion ist stetig in x für x < 0 diesem Intervall, mit Ausnahme der Stelle 0, wo sie einen Sprung der Größe 1 hat. 0 Z 1 Z 0 Z 1 1 2 x e dx = x xdx + + [ex ]10 f (x)dx = 2 −2 −2 0 −2 = 0−2+e−1=e−3. Auf dem Definitionsbereich (−2, 1) f keine Stammfunktion. Eine besitzt x e − c für x > 0 d für x = 0 haben und an der solche müßte die Gestalt F (x) = 1 2 x für x < 0 2 Stelle x0 = 0 wenigstens stetig sein. Andernfalls kann F keinesfalls überall in (−2, 1) mit F 0 (x) = f (x) differenzierbar Aus der Stetigkeitsforderung sein. ex − 1 für x ≥ 0 folgern wir c = −1 und d = 0. F (x) = ist aber an der 1 2 x für x < 0 2 137 Preliminary version – 3. Juli 2002 Stelle x0 = 0 dennoch nicht differenzierbar, denn der linksseitige Grenzwert des Differenzenquotienten ist 0 und der rechtseitige 1. Also ist Satz 73 nicht direkt, d.h. ohne Aufspalten des Intervalles, anwendbar. Ändernwir das obige Beispiel geringfügig ab und betrachten die Funktion ex für x ≥ 0 g(x) = im Intervall [−2, 1]. g ist im gesamten Intervall x + 1 für x < 0 [−2, 1] stetig, der Hauptsatz ist also anwendbar. Allerdings ist dennoch direkt x e für x ≥ 0 keine StammfunkVorsicht geboten. So ist G(x) = 1 2 x + x für x < 0 2 tion von g, denn G ist an der Stelle x0 = 0 nicht stetig und erst recht nicht differenzierbar. Folgerichtig liefert G(1) − G(−2) = e − (2 − 2) = e auch nicht das korrekte Integral 0 Z 1 Z 0 Z 1 1 2 x g(x)dx = (x + 1)dx + e dx = x + x + [ex ]10 2 −2 −2 0 −2 = 0−0+e−1=e−1. x e −1 für x ≥ 0 Eine korrekte Stammfunktion ist G−2 (x) = Diese ist 1 2 x + x für x < 0 2 an der Stelle x0 = 0 sowohl stetig als auch differenzierbar. Daher liefert G−2 (1) − G−2 (−2) = e − 1 − (2 − 2) = e − 1 auch den korrekten Wert des Integrals. Diese Überlegung zeigt, daß es ratsam ist, ein bestimmtes Integral gelegentlich auch bei stetigem Integranden zu zerlegen, wenn die Stammfunktion eine stückweise Definition aufweist. 7.4 Regeln der unbestimmten Integration Wir wollen uns nun mit einer Reihe von Rechenregeln für das unbestimmte Integrieren vertraut machen. Über den Hauptsatz der Differential- und Integralrechnung erhalten wir dadurch auch die Möglichkeit der Lösung einer Vielzahl geometrischer Problemstellungen durch Riemannsches Integrieren. 7.4.1 Auswahl von Grundintegralen Beginnen wir mit einer Auswahl von Grundintegralen, deren Stammfunktionen man sofort aus den in Abschnitt 6.5.7 aufgelisteten Ableitungen erkennt. 138 Preliminary version – 3. Juli 2002 Z Z 1dx = x + c 1 xn+1 + c , n = 1, 2, . . . n+1 Z 1 xa dx = xa+1 + c , a ∈ R \ {−1} und x > 0 a+1 Z 1 dx = ln |x| + c , x 6= 0 x Z 1 √ dx = arcsin x + c , −1 < x < 1 2 1 − x Z 1 dx = arctan x + c 1 + x2 Z exp xdx = exp x + c Z 1 x ax dx = a + c , a > 0 und a 6= 1 ln a Z sin xdx = − cos x + c Z cos xdx = sin x + c Z 1 π π dx = tan x + c , − + kπ < x < + kπ, k ∈ Z 2 cos x 2 2 Z 1 dx = − cot x + c , kπ < x < (k + 1)π, k ∈ Z sin2 x 7.4.2 xn dx = Integration einer Summe Satz 74 F und G seien Stammfunktionen der auf dem Intervall (a, b) ∈ R definierten Funktionen f beziehungsweise g. Dann ist λF + µG für beliebige reelle Zahlen λ und µ eine Stammfunktion von λf + µg. Darüberhinaus gilt für x0 ∈ (a, b) die Beziehung Z Z Z (λf (x) + µg(x)) dx = λ f (x)dx + µ g(x)dx . x0 x0 x0 Beweis: Differenzieren belegt (λF + µG)0 = λF 0 + µG0 = λf + µg . 139 Preliminary version – 3. Juli 2002 Sind F und G diejenigen Stammfunktionen mit F (x0 ) = G(x0 ) = 0, dann verschwindet auch (λF + µG)(x0 ), womit auch die Gleichung für die in x0 verschwindenden Stammfunktionen nachgewiesen ist. 2 Etwas lax kann man die Summenregel der Integration in der Form Z Z Z (λf (x) + µg(x)) dx = λ f (x)dx + µ g(x)dx schreiben. In diesem Falle stehen links und rechts allgemeine, einen reellen Parameter c enthaltende, Stammfunktionen. Bei geeigneter Wahl dieser Parameter ensteht eine echte Gleichung zwischen Funktionen. Man kann diesen Satz als Gegenstück zur Summenregel der Differentiation auffassen. Das Analogon dieses Satzes für Riemann-Integrale ist Satz 68. 7.4.3 Partielle Integration Die partielle Integration ist das Gegenstück zur Produktregel der Differentiation. Satz 75 f und g seien in (a, b) differenzierbare Funktionen. Falls f 0 g eine Stammfunktion besitzt, so besitzt auch f g 0 eine Stammfunktion und für x0 ∈ (a, b) gilt Z Z 0 f (x)g (x)dx = f (x)g(x) − f (x0 )g(x0 ) − f 0 (x)g(x)dx . x0 x0 Beweis: Differenzieren der rechten Seite nach x ergibt f 0 (x)g(x)+f (x)g 0 (x)− f 0 (x)g(x) = f (x)g 0 (x). Also ist die rechte Seite in der Tat eine Stammfunktion von f (x)g 0 (x). Setzt man nun x = x0 auf der rechten Seite, so erhält man 0, also es sich tatsächlich gerade um die links stehende StammR handelt 0 funktion x0 f (x)g (x)dx. 2 Etwas lax kann man die Regel der partiellen Integration in der Form Z Z 0 f (x)g (x)dx = f (x)g(x) − f 0 (x)g(x)dx schreiben. Gewissermaßen kann man sich vorstellen, daß man die Regel der partiellen Integration durch beidseitige unbestimmte Integration der Produktregel der Differentiation erhält. 140 Preliminary version – 3. Juli 2002 Es ergibt sich Z 0 (f · g) (x)dx = Z (f 0 (x)g(x) + f (x)g 0 (x)) dx Auf der linken Seite steht eine allgemeine Stammfunktion H von (f ·g)0 , diese genügt einerR Abbildungsvorschrift H(x) = (f ·g)(x)+c = f (x)g(x)+c. Rechts R R 0 0 0 erhält man f (x)g(x)dx+ f (x)g (x)dx, also f (x)g(x)+c = f (x)g(x)dx+ R R 0 0 f (x)g R 0 (x)dx und durch Umstellen ergibt sich sofort f (x)g (x)dx = f (x)g(x)+ c − f (x)g(x)dx, wobei der Parameter c Rauf der rechten Seite weggelassen werden kann, da er mit dem im Integral f 0 (x)g(x)dx ‘enthaltenen’ Parameter zusammengefaßt werden kann. Beispiele: Wir suchen eine Stammfunktion Z xex dx . Um die Regel der partiellen Integration anwenden zu können, müssen wir xex in ein Produkt zerlegen, so daß wir einen Faktor als Funktion f (x) und den anderen als Ableitung g 0 (x) auffassen können. Setzen wir also f (x) = x und g 0 (x) = ex . Weiterhin benötigen wir die Ableitung von f , diese ist f 0 (x) = 1, und eine beliebige Stammfunktion von g 0 (x) = ex , wählen wir g(x) = ex . Einsetzen in die Formel der partiellen Integration führt auf Z Z x x xe dx = xe − 1ex dx = xex − ex + c = (x − 1)ex + c Die Probe d ((x − 1)ex + c) = ex + (x − 1)ex = xex dx zeigt die Richtigkeit unserer Rechnung. Betrachten wir nun Z sin2 xdx . Wir setzen f (x) = sin x, g 0 (x) = sin x. Mit f 0 (x) = cos x und der Wahl g(x) = − cos x für die Stammfunktion von g 0 (x) = sin x erhält man mittels 141 Preliminary version – 3. Juli 2002 partieller Integration Z Z 2 sin xdx = − sin x cos x − − cos2 xdx Z = − sin x cos x + 1 − sin2 x dx Z = − sin x cos x + x − sin2 xdx R Auflösen der erhaltenen Gleichung nach sin2 xdx und berücksichtigen der Integrationskonstante ergibt schließlich Z 1 sin2 xdx = (x − sin x cos x) + c 2 Von der Richtigkeit des Resultats kann man sich wieder durch Ableiten der rechte Seite überzeugen. Am Rande sei angemerkt, daß R im konkreten Falle eine nochmalige partielle Integration des Integrals cos2 xdxR keinen Erfolg hätte, diese hätte nur auf die triviale Gleichheit sin2 xdx = R gebracht 2 sin xdx geführt. Untersuchen wir schließlich noch das Integral Z ln xdx für x > 0. Wir wählen f (x) = ln x und g 0 (x) = 1. Mit f 0 (x) = g(x) = x erhalten wir Z Z x ln xdx = x ln x − dx = x(ln x − 1) + c . x 7.4.4 1 x sowie Subsitutionsregel Die Substitutionsregel der Integration kehrt die Kettenregel der Differentiation um. Satz 76 f und g seien auf den Intervallen (a, b) beziehungsweise (α, β) definierte Funktionen mit Bildg ⊆ (a, b). Wenn f in (a, b) integrierbar und g in (α, β) differenzierbar ist, dann ist die Funktion (g ◦ f )g 0 in (α, β) integrierbar und für alle x0 , x ∈ (α, β) gilt Z x Z g(x) 0 f (g(t))g (t)dt = f (s)ds x0 g(x0 ) 142 Preliminary version – 3. Juli 2002 Anmerkung: Die obigen Integrale mögen wie bestimmte Integrale anmuten. Natürlich ist die Gleichung auch für bestimmte Integrale mit Integrationsgrenzen in (α, β) richtig, wenn man allerdings x als Variable ansieht, so handelt es sich in der Tat auch um Stammfunktionen, also unbestimmte Integrale. Man kann im vorliegenden Fall nicht ganz auf die obere Integrationsschranke verzichten, da auf der rechten Seite nach Ausführen der Integration noch eine Subsitution der Funktionsvariablen durch g(x) erfolgen muß. Man kann die Substitutionsregel also auch lax in der Form Z Z 0 f (g(t))g (t)dt = g ◦ f (s)ds schreiben. Beweis der Substitutionsregel: Wegen g(x0 ), g(x) ∈ (a, b) besitzt f in diesen Grenzen R eine Stammfunktion F , diese ist R bis auf eine additive Konstante gleich g(x0 ) f (s)ds. Die Stammfunktion g(x0 ) f (s)ds hat an der Stelle g(x0 ) den Wert 0, also gilt für den Wert der Stammfunktion F an der Stelle g(x) die Beziehung Z Z g(x) f (s)ds (g(x)) = F (g(x0 )) + f (s)ds F (g(x)) = F (g(x0 )) + g(x0 ) g(x0 ) R g(x) f (s)ds = F (g(x))−F (g(x0 )) nach x ist F 0 (g(x))g 0 (x) = R g(x) f (g(x))g 0 (x). Demnach ist g(x0 ) f (s)ds eine Stammfunktion von f (g(x))g 0 (x) R g(x ) und ihr Wert an der Stelle x = x0 ist g(x00) f (s)ds = 0, was schließlich die Richtigkeit der behaupteten Gleichung belegt. 2 Die Ableitung von g(x0 ) Beispiele: Betrachten wir Z tan xdx für − π2 < x < π2 . Wir wählen f (s) = 1s und g(x) = cos x. Dann läßt sich das obige Integral in der Form Z Z Z 1 tan xdx = sin x = − f (g(x))g 0 (x)dx cos x 143 Preliminary version – 3. Juli 2002 schreiben und folglich gilt Z tan xdx = − ln |cos x| + c = − ln(cos x) + c Allgemeiner gilt für x ∈ (a, b) die Beziehung Z 0 f (x) dx = ln |f (x)| + c f (x) für eine beliebige auf (a, b) differenzierbare Funktion f mit f (x) 6= 0 für alle x ∈ (a, b). Wir wollen das bestimmte Integral Z b 2 xex dx a dy berechnen. Mittels der Substitution y = g(x) = x2 und dx = g 0 (x) = 2x erhalten wir b2 Z b Z b2 1 s 1 y 1 2 1 2 x2 xe dx = e ds = e = eb − ea . 2 a2 2 2 a a2 2 Wählt man die obere Integrationsgrenze als Variable x, dann erhält man für das unbestimmte Integral die Beziehung Z 1 2 2 xex dx = ex + c . 2 7.5 Anwendungen Zum Abschluß wollen wir noch zwei Anwendungen der Integralrechnung betrachten. 7.5.1 Berechnung von Flächeninhalten Zunächst kommen wir noch einmal auf das ursprüngliche Anliegen des Riemannschen Integrals zurück. Seien a und b zwei reelle Zahlen mit a < b und f eine in [a, b] R-integrierbare Funktion. Dann gibt Z b |f (x)|dx a 144 Preliminary version – 3. Juli 2002 den Inhalt der vom Graphen der Funktion, der x-Achse und den durch a und b verlaufenden Parallen R b zur y-Achse eingeschlossenen Fläche an. Es ist ratsam, das Integral a |f (x)|dx an den Nullstellen von f im Intervall [a, b] aufzuspalten, da sich an diesen Stellen die Abbildungsvorschrift der Stammfunktion von |f | ändern kann. Beispiel: Wir fragen nach der Fläche unterm Graph der Funktion f (x) = x3 + 2x2 − 5x − 6 im Intervall [−2, 2]. Die Nullstellen von f sind −1, 2, −3, −3 liegt außerhalb des betrachteten Bereiches, 2 ist ohnehin Rand des betrachteten Bereiches, also ist nur bei −1 eine Aufspaltung des Intervalls notwendig, damit ergibt sich die Fläche Z −1 Z 2 3 2 A= |x + 2x − 5x − 6|dx + |x3 + 2x2 − 5x − 6|dx −2 −1 Als nächstes ist das Vorzeichen von f (x) in den beiden Intervallen zu überprüfen. Aufgrund der Stetigkeit reicht es dafür aus, das Vorzeichen von f (x) für ein beliebiges x aus dem Inneren des jeweiligen Teilintervalls zu testen. Im Bereich (−2, −1) ist f (x) positiv und in (−1, 2) negativ. Damit ergibt 145 Preliminary version – 3. Juli 2002 sich A = Z −1 3 2 (x + 2x − 5x − 6)dx + −2 Z 2 −(x3 + 2x2 − 5x − 6)dx −1 −1 2 1 4 2 3 5 2 1 4 2 3 5 2 − x + x − x − 6x = x + x − x − 6x 4 3 2 4 3 2 −2 −1 1 2 5 16 16 1 2 5 = ( − − + 6) − (4 − − 10 + 12) − (4 + − 10 − 12) + ( − − + 6) 4 3 2 3 3 4 3 2 ≈ 18, 17 Auf und d.h. und ähnliche Weise kann man auch ein zweites Problem angehen. Seien f g zwei Funktionen, die sich an den Stellen x1 = a und x2 = b schneiden, f (a) = g(a) und f (b) = g(b). Dann erhält man den Inhalt A der von f g zwischen a und b eingeschlossenen Fläche als Z b A= |f (x) − g(x)|dx . a Beispiel: Wir betrachten zwei Parabeln f (x) = −x2 + x + 3 und g(x) = x2 + 3x − 1 und fragen nach dem Inhalt der eingeschlossenen Fläche. 146 Preliminary version – 3. Juli 2002 Die Schnittpunkte der Parabeln ergeben sich als Lösungen der Gleichung −x2 + x + 3 = x2 + 3x − 1, also 2(x2 + x − 2) = 0. Es handelt sich demnach um a = −2 und b = 1 und wir erhalten den Flächeninhalt Z 1 Z 1 A = (f (x) − g(x))dx = −2 (x2 + x − 2)dx −2 −2 1 1 3 1 2 x + x − 2x 3 2 −2 1 1 8 = −2 ( + − 2) − (− + 2 + 4) = 9 3 2 3 = −2 7.5.2 Berechnung von Kurvenlängen Wir betrachten eine durch eine Parameterdarstellung gegebene Kurve in der Ebene. Bei einer Parameterdarstellung einer Kurve hat man einen Parameter t, der ein Intervall [a, b] durchläuft, und die Kurve besteht aus allen Punkten P (t) = (x(t), y(t)), a ≤ t ≤ b. Zusätzlich verlangt man, daß die Koordinatenfunktionen x(t) und y(t) stetig sind und die Zuordnung t → P (t) eineindeutig ist. Eine Parameterdarstellung des Einheitskreises ist P (t) = (cos t, sin t), 0 ≤ t < 2π. Wir stellen uns die Frage, wie lang ist das Kurvenstück im Paramerbereich t ∈ [c, d] mit a ≤ c < d ≤ b. Im Falle glatter Kurven, d.h. ‘gutartiger ’Kurven, halten wir ohne Beweis die Formel s Z d Z d 2 2 dP dx dy dt = l= + dt dt dt dt c c für die Kurvenlänge l fest. Eine Parameterdarstellung einer glatten Kurve zeichnet sich dadurch aus, daß die Koordinatenfunktionen x(t) und y(t) im Intervall (a, b) differenzierbar mit stetiger Ableitung sind und daß für kein t0 ∈ (a, b) die Ableitungen beider Koordinatenfunktionen verschwinden, d.h. für kein t0 ∈ (a, b) trifft die Gleichheit x0 (t0 ) = y 0 (t0 ) = 0 zu. Berechnen wir nun die Länge des Einheitskreisbogens für den Parameterbereich 0 ≤ t ≤ ϕ mit ϕ < 2π. Z ϕ Z ϕp 2 2 l= (− sin t) + (cos t) dt = 1dt = ϕ 0 0 Der Parameterbereich 0 ≤ t < 2π ergibt sich aus der kleinsten Periode 2π von Sinus und Kosinus. Bis zu diesem Parameterwert erhält man vorher noch 147 Preliminary version – 3. Juli 2002 nicht durchlaufene Punkte des Einheitskreises, für größere Parameterwerte, würde man die selbe Kurve erneut durchlaufen. Hierbei handelt es sich also um das π, welches in Abschnitt 4.3 mit Hilfe der kleinsten positiven Nullstelle der Kosinusfunktion eingeführt wurde. Das obige Längenintegral zeigt aber auch, daß der Umfang des Einheitskreises genau 2π in Bezug auf diese Zahl π beträgt, also handelt es sich gleichzeitig um die Konstante π, welche Proportionalitätsfaktor zwischen Umfang und Durchmesser eines Kreises ist. Die Bedingung der Eineindeutigkeit der Zuordnung von Parameterwerten und Kurvenpunkten sichert ab, daß nicht Teile der Kurve mehrfach durchlaufen werden. Wird die Eineindeutig nur an endlich vielen Stellen gestört, so entsteht die Kurve als Zusammensetzung endlich vieler glatter Kurvenstücke und die Länge kann durch Addition der Längen der Teilstücke erhalten werden. 148 Preliminary version – 3. Juli 2002 Übungsaufgaben, Serie 13 37. Berechnen Sie die Integrale: (a) Z sinh xdx (b) Z (x2 − 1) ln(x + 1)dx (c) Z 1 2 0 √ 2x3 dx 1 − x2 38. Wie groß ist der Inhalt der von den Kurven f (x) = sinh x und g(x) = −5 + 2 cosh x zwischen ihren beiden Schnittpunkten eingeschlossenen Fläche? Hinweis: Die Koordinaten der Schnittpunkte dürfen auf zwei Nachkommastellen gerundet werden. 39. Wie lang ist die Kurve mit der Paramterdarstellung P (t) = (t + 1; 1 − 2t), 0 ≤ t ≤ 1? 149 Preliminary version – 3. Juli 2002 Literaturverzeichnis [1] Blatter. Analysis 1, Springer-Lehrbuch, Berlin, 1991. [2] Bronstein, Semendjajew. Taschenbuch der Mathematik, Teubner, Leipzig, 1981. [3] Günther et. al. Grundkurs Analysis Teil 1 und Teil 2. BSB B.G. Teubner, Leipzig, 1972. [4] Kiyek, Schwarz. Mathematik für Informatiker 1,2. Teubner, Stuttgart, 1991. [5] Piehler et. al. Mathematik zum Studieneinstieg. 2. Auflage, Springer, Berlin, 1992. [6] Zeidler (Hrsg). Teubner-Taschenbuch der Mathematik (Band 1), Teubner, Leipzig, 1996. (überarbeitete und erweiterte Ausgabe von [2]). 150 Preliminary version – 3. Juli 2002