1 0 GRUNDBEGRIFFE AUS LOGIK UND MENGENLEHRE Logik und axiomatische Mengenlehre bilden die Fundamente der Mathematik. Es ist daher ganz natürlich, daß logische und mengentheoretische Grundbegriffe und Notationen in allen Bereichen der Mathematik Verwendung finden. Die folgenden Abschnitte sollen eine kurze Einführung in diesen Begriffsapparat geben. Wir gehen dabei nicht axiomatisch vor, sondern nehmen – insbesondere in Bezug auf die Grundbegriffe Aussage, Menge, Element etc. – einen naiven Standpunkt ein. Wir setzen eine durch die natürliche Anschauung vermittelte Kenntnis der Begriffe voraus. 0.1 AUSSAGEN, LOGISCHE ZEICHEN Die Mathematik befaßt sich mit AUSSAGEN, denen sich grundsätzlich ein eindeutiger Wahrheitswert ” wahr” (w) oder ” falsch” (f) zuordnen läßt. Aussagen sind dabei sprachliche oder schriftliche Äußerungen. Gegenstand der Mathematik ist insbesondere, den Wahrheitwert von Aussagen festzustellen. Die Zuordnung des Wahrheitswertes zu einer Aussage geschieht formal häufig über die Notierung einer entsprechenden WAHRHEITSTAFEL. Beispiele: Aussage Wahrheitswert 1 1+1=2 w 2 Jedes Dreieck hat 4 Seiten f 3 Nicht jedes Dreieck hat 4 Seiten w 4 2 ist eine Primzahl größer als 5 f 5 Die Gleichung x2 + 1 = 0 hat eine reelle Lösung f 6 Zu jeder reellen Zahl x gibt es eine natürliche Zahl n mit x ≤ n w 7 Wenn f differenzierbar ist, dann ist f stetig w Im folgenden bezeichnen wir Aussagen meist mit kaligraphischen Buchstaben A, B, C, D, .... Um den Wahrheitswert von komplizierten Aussagen, die im allgemeinen durch Operationen oder Verknüpfungen von einfachen Aussagen entstehen, festzustellen, ist es wichtig, deren Struktur zu erkennen, bzw. aufzulösen. 2 Operationen mit oder Verknüpfungen von Aussagen werden in der Umgangssprache insbesondere durch die Worte ”nicht”, ”und” sowie ”oder” bewirkt. Auch in der Mathematik bzw. Logik sind dies die grundlegenden Operationen. Wir stellen im folgenden die von uns verwendeten Zeichen (Kürzel) für die wichtigsten logischen Operationen zusammen und diskutieren die jeweiligen Wahrheitswerte der zugehörigen Aussagen. Die NEGATION einer Aussage A wird mit ¬A bezeichnet. Man liest dies ”non A”. Die jeweiligen Wahrheitswerte entnimmt man der zugehörigen WAHRHEITSTAFEL: A ¬A w f f w Beispiel: Aussage A : Jedes Dreieck hat vier Seiten ¬A : Nicht jedes Dreick hat vier Seiten Wahrheitswert f w Die KONJUNKTION von zwei Aussagen A und B, d.h. die Verknüpfung durch ”und”, wird mit A ∧ B bezeichnet. Man liest dies ”A und B”. Die ADJUNKTION von zwei Aussagen A und B, d.h. die Verknüpfung durch ”oder”, wird mit A ∨ B bezeichnet. Man liest dies ”A oder B”. Die jeweiligen Wahrheitswerte entnimmt man der zugehörigen WAHRHEITSTAFEL: A w w f f B w f w f A∧B w f f f A∨B w w w f Beispiel: Aussage A : 2 ist Primzahl B : 2 ist größer als 5 A ∧ B : 2 ist eine Primzahl größer als 5 A ∨ B : 2 ist eine Primzahl oder größer als 5 Wahrheitswert w f f w 3 Die hier betrachteten Operationen ¬, ∧, ∨ sind die logischen Grundoperationen, mit denen man im Prinzip auskommen kann. Versuchte man dieses, würde allerdings oft die Struktur der Aussagen sehr komplizert. Deshalb betrachtet bzw. definiert man noch weitere Operationen. Die IMPLIKATION ”A impliziert B” wird mit A ⇒ B bezeichnet. Man liest dies ”Aus A folgt B”, ”B folgt aus A”, ”A ist hinreichend für B”, ”B ist notwendig für A”. Die Implikation A ⇒ B drückt aus: ”Wenn A wahr ist, so ist auch B wahr”. Mathematische ”Sätze” haben meist die Form einer Implikation. Die Aussage A ⇒ B ist genau dann falsch, wenn A wahr und B falsch ist. Damit lautet die zugehörige WAHRHEITSTAFEL: A B w w w f f w f f A⇒B w f w w Die beiden folgenden Beispiele dokumentieren, daß auch umgangssprachlich die Wahrheitswerte der Implikation mit der obigen Tabelle übereinstimmen. Die Implikation ”Wenn es regnet, dann ist die Erde naß” beschreibt einen bekannten Sachverhalt, ist also wahr. In Übereinstimmung mit der obigen Wahrheitstafel kann man aus der Tatsache ”die Erde ist naß” nicht folgern, das es regnet. Jedoch folgt aus ”Die Erde ist nicht naß” zwingend ”es regnet nicht”. Die Behauptung ”Wenn es heute regnet, dann fresse ich einen Besen” hat die Form der Implikation. Da die Aussage ”Ich fresse einen Besen” sicher falsch ist, ist die Implikation genau dann wahr, wenn die Aussage ”Es regnet heute” falsch, also ”Es regnet heute nicht” wahr ist. Gerade dies will man aber mit dieser Behauptung aussagen! Die ÄQUIVALENZ der Aussagen A und B wird mit A ⇔ B bezeichnent. Man liest dies ”A (gilt) genau dann wenn B (gilt)” bzw. ”A ist notwendig und hinreichend für B”. Die Aussage A ⇔ B ist genau dann wahr, wenn A und B gleiche Wahrheitswerte haben. ˙ bezeichnent. Man liest dies Die DISJUNKTION der Aussagen A und B wird mit A∨B ˙ ist genau dann wahr, wenn A und B entgegengesetzte Wahr”entweder A oder B”. A∨B heitswerte haben. 4 WAHRHEITSTAFEL: A w w f f B w f w f A⇔B w f f w ˙ A∨B f w w f SATZ: (i) Für jede (beliebige) Aussage A sind die folgenden Aussagen stets wahr: A ⇔ ¬(¬A) ˙ A∨(¬A) ¬[A ∧ (¬A)] (Satz vom ausgeschlossenen Dritten) (Satz vom Widerspruch) (ii) Für je zwei (beliebige) Aussagen A und B sind die folgenden Aussagen stets wahr: (A ⇒ B) ⇔ (¬A ∨ B) (A ⇔ B) ⇔ (A ⇒ B) ∧ (B ⇒ A) ˙ A∨B ⇔ (A ∧ ¬B) ∨ (¬A ∧ B) (A ⇒ B) ⇔ (¬B ⇒ ¬A) (Kontrapositionsgesetz) sowie A∧B ⇔ B∧A A∨B ⇔ B∨A (Kommutativgesetze) und ¬(A ∧ B) ⇔ ¬A ∨ ¬B ¬(A ∨ B) ⇔ ¬A ∧ ¬B (De Morgan’sche Regeln). (iii) Schließlich sind für je drei (beliebige) Aussagen A, B, C die folgenden Aussagen stets wahr: A ∧ (B ∧ C) ⇔ (A ∧ B) ∧ C, A ∨ (B ∨ C) ⇔ (A ∨ B) ∨ C, (Assoziativgesetze) und A ∧ (B ∨ C) ⇔ (A ∧ B) ∨ (A ∧ C) A ∨ (B ∧ C) ⇔ (A ∨ B) ∧ (A ∨ C) (Distributivgesetze) sowie (A ⇒ B) ∧ (B ⇒ C) ⇒ (A ⇒ C) . 5 Bei der Notierung der obigen Gesetze haben wir zwecks Vereinfachung der Schreibweise (Vermeidung von Klammern) entsprechend der Vereinbarung in der Arithmetik ”Punktrechnung geht vor Strichrechnung” die folgenden Vorrangigkeitsregeln bei der Benutzung von Zeichen verwendet: ¬ vor ∧, ∨, ∨˙ vor ⇒, ⇔ . Zum Beispiel kann man dadurch anstelle von [¬(A ∧ B)] ⇔ [(¬A) ∨ (¬B)] deutlich kürzer ¬(A ∧ B) ⇔ ¬A ∨ ¬B schreiben. Der Einführung neuer Sprechweisen dient das Zeichen :⇔. Der neu definierte Ausdruck steht auf der Seite des Doppelpunktes. Zum Beispiel definiert man (A ⇒ B ⇒ C) :⇔ (A ⇒ B) ∧ (B ⇒ C). Entsprechendes vereinbart man für mehr als drei Aussagen sowie auch für ⇔. Das Assoziativgesetz für ∧ rechtfertigt A ∧ B ∧ C :⇔ (A ∧ B) ∧ C. Entsprechendes vereinbart man für mehr als drei Aussagen sowie auch für ∨. Warnung: 1) Man verwechsele A ⇒ B ⇒ C nicht mit (A ⇒ B) ⇒ C oder mit A ⇒ (B ⇒ C). 2) Ein beliebter Fehler ist, anstelle von A ⇒ B zu zeigen B ⇒ A. Im allgemeinen ist (A ⇒ B) ⇔ (B ⇒ A) nicht richtig. (Beispiel?) 6 Die Struktur mathematischer Aussagen ist nicht allein mit Hilfe der bisher diskutierten Operationen zu erfassen bzw. beschreiben. Wir betrachten dazu einige der anfangs notierten Beispiele. (i) Die Aussage ”Jedes Dreieck hat 4 Seiten” kann man auf die Form bringen: Für alle Dreiecke x gilt: x hat vier Seiten. (ii) Die Aussage ”Nicht jedes Dreieck hat 4 Seiten” kann man auf die Form bringen: Es gibt ein Dreieck x mit der Eigenschaft: x hat nicht vier Seiten. (iii) Die Aussage ”Die Gleichung x2 + 1 = 0 hat eine reelle Lösung” kann man auf die Form bringen: Es gibt eine reelle Zahl x mit x2 + 1 = 0. Die so umformulierten Aussagen sind von der allgemeinen Form ”Es gibt (existiert) ein (Objekt) x mit (der Eigenschaft) A(x)” bzw. ”Für alle (Objekte) x gilt (die Eigenschaft) A(x)”. Dabei bezeichnet A(x) eine Schar von Aussagen, die von einer Variablen x abhängt, welche einen fest umrissenen Bereich von (zulässigen) Objekten durchläuft. A(x) wird durch ”Einsetzen” geeigneter Objekte für x entweder wahr oder falsch. Man bezeichnet eine solche Schar von Aussagen A(x) auch als ”Aussageform”. Beispiele: ”x (ist) gerade” und ”x (ist) Primzahl” sind Aussageformen, wobei x im Bereich der natürlichen Zahlen variiert. Da Aussagen der obigen Form häufig auftreten, führt man hierfür eine verkürzte bzw. formale Schreibweise mittels sogenannter QUANTOREN ein. Sei dazu A(x) eine von (der Variablen) x abhängige Schar von Aussagen. (i) Die Aussage ”Es gibt (existiert) ein x mit A(x)” notieren wir formal ”∃ x : A(x)” . Diese Aussage ist genau dann wahr, wenn A(x) für mindestens ein x wahr ist. Man bezeichnet ”∃” als EXISTENZQUANTOR. (ii) Die Aussage ”Für alle (jedes) x gilt A(x)” notieren wir formal ”∀ x : A(x)”. 7 Diese Aussage ist genau dann wahr, wenn A(x) für alle x wahr ist. Man bezeichnet ”∀” als ALLQUANTOR. Es gelten folgende REGELN: ¬(∀ x : A(x) ) ⇐⇒ ∃ x : ¬A(x) , ¬(∃ x : A(x) ) ⇐⇒ ∀ x : ¬A(x) . Die Aussage ¬(∃ x : A(x) ) bedeutet gerade ”Es gibt (existiert) kein x für welches A(x) gilt”. Man notiert sie daher formal 6 ∃ x : A(x). Die Aussage ”Es gibt (existiert) genau ein x für welches A(x) gilt” kommt häufig vor. Man notiert sie formal ∃! x : A(x). Offenbar gilt: ∃! x : A(x) ⇔ [∃ x : A(x)] ∧ [∀ x, y : A(x) ∧ A(y) ⇒ x = y] . Bei den obigen Formulierungen haben wir die allgemeine Regel bzw. Vereinbarung berücksichtigt, daß Variable, die durch Quantoren gebunden sind, umbenannt werden können, z. B. ∀ x : A(x) ⇔ ∀ y : A(y) . Wir betrachtet nun noch Aussageformen, die von mehr als einer Variablen abhängen. Beispiele: x ≤ y ist eine Aussageform mit den Variablen x, y); x = z ⇒ y = z ist eine Aussageform mit den Variablen x, y, z); ∀ z : [x = z ⇒ y = z] ist eine Aussageform mit den Variablen x, y. Hier variieren jeweils x, y, z im Bereich der natürlichen Zahlen. Ist A(x, y) eine Aussageform, die von zwei Variablen x, y abhängt, so gilt ∀ x : [∀ y : A(x, y)] ⇐⇒ ∀ y : [∀ x : A(x, y)] . Man definiert daher [∀ x, y : A(x, y)] :⇐⇒ ∀ x : [∀ y : A(x, y)] . Entsprechendes gilt für den Existenzquantor. Falsch ist im allgemeinen jedoch ∃ x : [∀ y : A(x, y)] ⇐⇒ ∀ y : [∃ x : A(x, y)] . 8 0.2 MENGEN, MENGENOPERATIONEN Mathematische Aussagen, deren logische Struktur wir im vorigen Abschnitt diskutiert haben, sind stets auf einen fest umrissenen (Grund-)Bereich von (unterscheidbaren) Objekten bezogen. Diese Objekte werden mit Symbolen, insbesondere Buchstaben a, b, c, . . . , A, B, C, . . . , α, β, γ, . . . , etc. bezeichnet. Für jeweils zwei Objekte a und b notiert man die Aussage ihrer ”Gleichheit” bzw. ”Identität” mit a=b lies: ”a ist gleich b 00 , deren Negation mit a 6= b lies: ”a ist ungleich b 00 . Unter den Objekten sind einige als ”Mengen” spezifiziert. Man kann eine Menge als eine ”Zusammenfassung von (ausgezeichneten) Objekten zu einem Ganzen” beschreiben. Mengen werden meist mit großen Buchstaben A, B, C, ... bezeichnet. Zwischen Mengen und beliebigen Objekten ist eine ”Elementbeziehung” gegeben. Ist A eine Menge und a ein Objekt, so notieren wir die Aussage ”a ist Element von A”, bzw ”a gehört zu A” in der Form a ∈ A sowie auch A 3 a und die Negation entsprechend a ∈ / A. Mengen sind durch ihre Elemente bestimmt: Für jeweils zwei Mengen A und B gilt A=B ⇐⇒ ∀ x : (x ∈ A ⇔ x ∈ B). Es ist sinnvoll, eine Menge einzuführen, die keine Elemente enthält. Man bezeichnet sie als die ”leere Menge” und verwendet hierfür das Symbol ∅. Für jede beliebige Menge A gilt dann A = ∅ ⇔ ∀ x : x 6∈ A. Ein wichtiges Prinzip der Bildung bzw. Beschreibung von Mengen ist die Auflistung ihrer Elemente innerhalb von ”Mengenklammern”: (i) {§, ∇, 4} ist die Menge der Zeichen §, ∇, 4. (ii) {a, b, ..., x, y, z} ist die Menge aller kleinen lateinischen Buchstaben. (iii) {2, 3, ..., 107} ist Menge der natürlichen Zahlen von 2 bis 107. (iv) {1, 2, 3, ..., 11, 13} ist die Menge der Primzahlen von 1 bis 13. (v) {0, 1, 2, 3, ...} =: IN ist die Menge aller natürlichen Zahlen. (vi) {1, 2, 3, ...} =: IN∗ ist die Menge der natürlichen Zahlen ohne die Null. 9 Oben haben wir die Schreibweise := bzw. =: verwendet. Sie dient der Definition neuer Begriffe oder Symbole. Der neu definierte Begriff steht dabei auf der Seite des Doppelpunktes. Ein weiteres wichtiges Mengenbildungsprinzip ist die Beschreibung von Mengen mittels definierender Eigenschaften: (i) { x | x ist gerade natürliche Zahl } = { x ∈ IN | x ist gerade } , (ii) { x | x ist reelle Nullstelle von x2 + x − 2 } = { x ∈ IR | x2 + x − 2 = 0 }. Allgemeiner gilt für die Mengenbildung folgendes (Aussonderungs-) Prinzip: Ist X eine Menge und A(x) eine Aussageform mit der Variablen x ∈ X, so existiert genau eine Menge A, die gerade aus den Elementen von X besteht, für die A(x) wahr ist. Man bezeichnet diese mit { x ∈ X | A(x) } := A oder, sofern X als Grundmenge fixiert ist, kürzer mit { x | A(x) } := A . Für beliebige Elemente a, b, c, . . . (irgendeiner Menge X) kann man aufgrund des obigen Mengenbildungsprinzips die folgenden Mengen bilden: {a} := {x | x = a}, {a, b} := {x | x = a ∨ x = b}, {a, b, c} := {x | x = a ∨ x = b ∨ x = c} etc.. Gelegentlich schreibt man auch {a, b, . . . , c} bzw. {a, b, c, . . .} für {x | A(x)}, wenn das Bildungsgesetz A(x) aus der Auflistung a, b, . . . , c bzw. a, b, c, . . . abzulesen ist. Man definiert ”Mengeninklusion” für jeweils zwei Mengen A und B durch A⊂B :⇐⇒ ∀ x : (x ∈ A ⇒ x ∈ B) und liest dies ”A (ist) Teilmenge von B ”, ”A (ist) in B enthalten ”, ”B (ist) Obermenge von A ”, etc.. Offenbar gilt für beliebige Mengen A, B, C A ⊂ A, A⊂B ∧ B ⊂A ⇒ A=B, . A⊂B ∧ B⊂C ⇒ A⊂C 10 Zu jeder beliebigen Menge A existiert genau eine Menge, deren Elemente gerade die Teilmengen von A sind. Man bezeichnet sie als ””Potenzmenge von A ” und verwendet das Symbol IP(A) IP(A) := {B | B ⊂ A}. Wir kommen nun zu den grundlegenden MENGENOPERATIONEN. Ist X eine (beliebige) Menge, so definiert man für A, B ∈ IP(X) die Mengen A ∩ B := {x | x ∈ A ∧ x ∈ B} , ”Durchschnitt von A und B” , A ∪ B := {x | x ∈ A ∨ x ∈ B} , ”Vereinigung von A und B” , A \ B := {x | x ∈ A ∧ x 6∈ B} , ”Komplement von B in A” . Sofern X als Grundmenge fixiert ist, bezeichnet man kurz ∼ A := X \ A ”Komplement von A” . Man nennt jeweils zwei Mengen A, B ”disjunkt”, wenn A ∩ B = ∅ ist. In diesem Fall ˙ als ”disjunkte Vereinigung von A und B”. bezeichnet man A ∪ B =: A∪B Man verifiziert leicht die folgenden RECHENREGELN für die hier definierten Mengenoperationen: SATZ : Für beliebige Mengen A, B, C ∈ IP(X) gilt: (i) ∼ (∼ A) = A . (ii) Kommutativgesetze: A ∪ B = B ∪ A, A ∩ B = B ∩ A. (iii) Assoziativgesetze: A ∪ (B ∪ C) = (A ∪ B) ∪ C , A ∩ (B ∩ C) = (A ∩ B) ∩ C . (iv) Distributivgesetze: A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C) , A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C) . (v) de MORGANsche Regeln: ∼ (A ∩ B) = (∼ A) ∪ (∼ B) , ∼ (A ∪ B) = (∼ A) ∩ (∼ B) . 11 Allgemeiner als eben betrachten wir nun noch Durchschnitte und Vereinigungen von beliebigen ”Mengensystemen”. Für eine Menge (ein Mengensystem) A ⊂ IP(X) sei deren ”Durchschnitt” durch \ A := {x ∈ X | ∀ A ∈ A : x ∈ A} A∈A und deren ”Vereinigung” durch [ A := {x ∈ X | ∃ A ∈ A : x ∈ A} A∈A definiert. Offenbar gilt für A = ∅ \ A=X, A∈∅ [ A = ∅. A∈∅ Für die Grundmengen der wichtigsten Zahlbereiche die wir im folgenden betrachten werden, haben sich die folgenden Standardbezeichnungen eingebürgert: IN = {0, 1, 2, . . .} Menge der natürlichen Zahlen ZZ = {. . . , −2, −1, 0, 1, 2, . . .} Menge der ganzen Zahlen o nm | m ∈ ZZ , n ∈ IN \ {0} Menge der rationalen Zahlen Q I = n IR Menge der reellen Zahlen C I Menge der komplexen Zahlen Man hat folgende Inklusionen IN ⊂ ZZ ⊂ Q I ⊂ IR ⊂ C I . Weiter bezeichnet man gelegentlich für M ∈ {IN, ZZ, Q I , IR, C I} M ∗ := M \ {0} . sowie für n ∈ IN INn := {0, . . . , n} , IN∗n := INn \ {0}. . 12 0.3 KARTESISCHES PRODUKT, RELATIONEN Für jeweils zwei Objekte a und b ist das geordnete Paar (a, b) definiert, für das die folgende Eigenschaft charakteristisch ist ∀ a, b, x, y : (a, b) = (x, y) ⇔ a = x ∧ b = y. a wird als erste Koordinate und b als zweite Koordinate von (a, b) bezeichnet. Zu jeweils zwei Mengen A und B existiert genau eine Menge, deren Elemente gerade die geordneten Paare (a, b) mit a ∈ A und b ∈ B sind. Man bezeichnet sie als kartesisches Produkt von A und B und verwendet für sie das Symbol A × B := { x | ∃ a ∈ A ∃ b ∈ B : x = (a, b) } . Man notiert dies kürzer in der Form A × B = { (a, b) | a ∈ A ∧ b ∈ B } . Sind X und Y (beliebige) Mengen, so bezeichnet man eine Aussageform A(x, y) mit der Variablen (x, y) ∈ X × Y auch als Relation in X × Y . Zu einer beliebigen Relation A(x, y) kann man die Menge Φ := { (x, y) ∈ X × Y | A(x, y)(wahr ) } ⊂ X × Y bilden. Sie wird als ”Graph der Relation A(x, y)” bezeichnet. Man hat offenbar ∀ (x, y) ∈ X × Y : (x, y) ∈ Φ ⇐⇒ A(x, y) (wahr). Umgekehrt kann man zu jeder beliebigen Menge Φ ⊂ X × Y die Relation ”(x, y) ∈ Φ” in X × Y betrachten. Natürlich ist der Graph dieser Relation gerade die Menge Φ. In diesem Sinne entsprechen sich Relationen in X × Y und Teilmengen von X × Y in eindeutiger Weise. Wir unterscheiden deshalb im allgemeinen nicht zwischen Relationen in X × Y und Teilmengen von X × Y . Wegen ∅ ⊂ X × Y ist die leere Menge ∅ eine Relation in X × Y , die ”leere Relation”. BEISPIELE: Sei X eine beliebige Menge. (i) Die Relation { (x, y) ∈ X × X | x = y } =: idX ⊂ X × X heißt ”Identität in X” (ii) { (x, M ) ∈ X × IP(X) | x ∈ M } ist die Element-Relation in X × IP(X) 13 (iii) { (A, B) ∈ IP(X) × IP(X) | A ⊂ B } ist die Inklusions-Relation in IP(X) . Für eine beliebige Menge Relation Φ in X × Y definiert man Φ−1 := { (y, x) ∈ Y × X | (x, y) ∈ Φ } ⊂ Y × X als ”inverse Relation von” bzw. ”Umkehrrelation zu Φ”. Weiter bezeichnet man für zwei beliebige Relationen Φ in X × Y und Ψ in U × V Ψ ◦ Φ = { (x, v) ∈ X × V | ∃ z : (x, z) ∈ Φ ∧ (z, v) ∈ Ψ } ⊂ X × V als ”Komposition” bzw. ”Produkt von Φ mit/und Ψ”. RECHENREGELN: (i) (Φ−1 )−1 = Φ (ii) Φ ⊂ Φ−1 ⇔ Φ−1 ⊂ Φ ⇔ Φ = Φ−1 (iii) Φ ◦ (Ψ ◦ Ξ) = (Φ ◦ Ψ) ◦ Ξ (iv) (Φ ◦ Ψ)−1 = Ψ−1 ◦ Φ−1 (v) Φ ◦ idX = Φ = idY ◦ Φ für Φ ⊂ X × Y . DEFINITION: Eine Relation Φ in X × X bezeichnet man auch als zweistellige Relation in X. Hierfür definiert bzw. hat man Φ reflexiv :⇔ ∀x ∈ X : (x, x) ∈ Φ ⇔ idX ⊂ Φ £ ¤ Φ symmetrisch :⇔ ∀x, y ∈ X : (x, y) ∈ Φ ⇒ (y, x) ∈ Φ ⇔ Φ = Φ−1 £ ¤ Φ antisymmetrisch :⇔ ∀x, y ∈ X : (x, y), (y, x) ∈ Φ ⇒ x = y ⇔ Φ ∩ Φ−1 ⊂ idX £ ¤ Φ transistiv :⇔ ∀x, y, z ∈ X : (x, y), (y, z) ∈ Φ ⇒ (x, z) ∈ Φ ⇔ Φ ◦ Φ ⊂ Φ Φ Äquivalenzrelation :⇔ Φ reflexiv, symmetrisch, transitiv Φ (teilweise oder partielle) Ordnungsrelation :⇔ Φ reflexiv, antisymmetrisch, transitiv Φ Totalordnung :⇔ Φ Ordnungsrelation ∧ (∀x, y ∈ X : (x, y) ∈ Φ ∨ (y, x) ∈ Φ) . 14 0.4 ABBILDUNGEN, FUNKTIONEN Es seien X und Y beliebige Mengen. Unter einer ”Funktion” oder ”Abbildung” f von X nach Y wollen wir eine Vorschrift verstehen, die jedem Element x aus einer spezifischen Menge Df ⊂ X genau ein Element y =: f (x) aus Y zuordnet. Wir notieren diesen Sachverhalt symbolisch so f : X ⊃ Df 3 x → y = f (x) ∈ Y , bzw. kürzer f : X ⊃ Df → Y . Df wird als ”Definitionsbereich” von f bezeichnet. Für x ∈ Df wird f (x) als das ”Bild von x unter f ” bzw. als der ”Funktionswert von f an der Stelle x” bezeichnet. Weiter bezeichnet man Wf := { y ∈ Y | ∃ x ∈ Df : y = f (x) } =: { f (x) | x ∈ Df } ⊂ Y als ”Bild” oder ”Wertebereich” von f . Schließlich bezeichnet man Gf := { (x, y) ∈ X × Y | x ∈ Df ∧ y = f (x) } =: { (x, f (x)) | x ∈ Df } ⊂ X × Y als ”Graph” von f . BEISPIELE: (i) Durch 3 , x=0 f (x) := 0 , x ∈ {1, 3} 2 , x=5 wird eine Funktion (z.B. von IN nach IN) mit Df = {0, 1, 3, 5} und Wf = {0, 2, 3} definiert. (ii) Durch f : IN 3 x → x2 + 1 ∈ IN wird eine Funktion von IN nach IN mit Df = IN definiert. (iii) Sei X eine beliebige Menge. Durch f (M ) := X \ M , ( M ∈ IP(X)) wird eine Abbildung von IP(X) nach IP(X) mit Df = Wf = IP(X) definiert. 15 (iv) Sei X eine beliebige Menge und M ⊂ X. Durch 1 , x∈M f (x) := 0 , x∈X \M wird eine Funktion von X nach IN mit Df = X und Wf = {0, 1} definiert, die charakteristische Funktion von M . (v) Es seien X und Y beliebige Mengen. Die durch p1 : X × Y 3 (x, y) → x ∈ X p2 : X × Y 3 (x, y) → y ∈ Y definierten Abbildungen heißen erste bzw. zweite Projektion von X × Y . DEFINITION, BEMERKUNG: (Gleichheit von Abbildungen) Es seien f : X ⊃ Df → Y und g : U ⊃ Dg → V Abbildungen. Man definiert f = g :⇔ ⇔ £ ∀ x : x ∈ Df ⇔ x ∈ Dg ⇒ f (x) = g(x) ¤ Df = Dg ∧ ∀ x ∈ Df : f (x) = g(x) . Offenbar gilt f = g ⇔ Gf = Gg . Der Graph Gf einer Abbildung f von X nach Y ist eine Relation in X × Y mit der folgenden Eigenschaft: Für (x, y), (x̃, ỹ) ∈ Gf folgt über x, x̃ ∈ Df und y = f (x), ỹ = f (x̃) sofort x = x̃ ⇒ y = ỹ. DEFINITION: Es sei Φ ⊂ X × Y . Man definiert Φ eindeutige Relation ⇔ ∀ (x, y) , (x̃, ỹ) ∈ Φ : x = x̃ ⇒ y = ỹ . Damit ist offenbar der Graph Gf einer Abbildung f eine eindeutige Relation. Es gilt aber auch die Umkehrung. (1) SATZ: Es seien X, Y beliebige Mengen. Zu jeder eindeutigen Relation Φ ⊂ X × Y existiert genau eine Abbildung f : X ⊃ Df → Y mit Gf = Φ . 16 Hierfür gilt Df = { x ∈ X | ∃ y ∈ Y : (x, y) ∈ Φ } , Wf = { y ∈ Y | ∃ x ∈ X : (x, y) ∈ Φ } . BEISPIELE: Seien X, Y beliebige Mengen. (i) Die durch Φ := ∅ gegebene Abbildung wird als die leere Abbildung ∅ bezeichnet. (ii) Die durch Φ := idX ⊂ X × X gegebene Abbildung X 3 x → x ∈ X wird ebenfalls als ”Identität” von X” und mit dem Symbol idX bezeichnet. (iii) Die für b ∈ Y durch Φ := { (x, y) ∈ X × Y | y = b } = X × {b} gegebene Abbildung X 3→ b ∈ Y wird als konstante Abbildung b mit dem Definitionsbereich X bezeichnet. DEFINITION: Es sei f : X ⊃ Df → Y eine Abbildung. Man definiert dann für eine beliebige Menge A f (A) := { y ∈ Y | ∃x ∈ A : (x, y) ∈ Gf } = { f (x) | x ∈ Df ∩ A } als ”Bild von A unter f ” und f −1 (A) := { x ∈ X | ∃y ∈ A : (x, y) ∈ Gf } = { x ∈ Df | f (x) ∈ A } als ”Urbild von A unter f ” . DEFINITION: Es sei f : X ⊃ Df → Y Abbildung. Man definiert £ ¤ (i) f ”injektiv (eineindeutig)” :⇔ ∀x, x̃ ∈ Df : f (x) = f (x̃) ⇒ x = x̃ . (ii) f surjektiv , bzw. f bildet auf Y ab :⇔ Wf = Y (iii) f bijektiv ⇔ Df = X, Wf = Y und f injektiv . . BEMERKUNG: Es sei f Abbildung von X nach Y . Dann gilt f injektiv ⇔ Gf−1 eindeutige Relation . (2) SATZ: Es sei f eine injektive Abbildung von X nach Y . Dann existiert nach (1) genau eine Abbildung g : Y ⊃ Dg → X mit Gg = Gf−1 . Man bezeichnet g =: f −1 als Umkehrabbildung zu f , bzw. als Inverse von f . Es ist Dg = Wf und Wg = Df . 17 Weiterhin gilt f −1 injektiv ∧ (f −1 )−1 = f . Damit folgt sofort f bijektiv ⇒ f −1 bijektiv . (3) SATZ: Es seien f : X ⊃ Df → Y und g : U ⊃ Dg → V Abbildungen. Dann ist Gg ◦ Gf eine eindeutige Relation in X × V . Folglich existiert nach (1) genau eine Abbildung h : X ⊃ Dh → V mit Gh = Gg ◦ Gf . Man bezeichnet h =: g ◦ f als Komposition von f mit/und g, bzw. als Produkt von f mit/und g. Es gilt für x ∈ X x ∈ Dh ⇔ x ∈ Df ∧ f (x) ∈ Dg ⇒ h(x) = g(f (x)) sowie damit Dh = { x ∈ Df | f (x) ∈ Dg } = f −1 (Dg ) , Wh = { g(y) | y ∈ Wf ∩ Dg } = g(Wf ) . g ◦ f hat die folgenden speziellen Eigenschaften: ⇒ g ◦ f injektiv ∧ (g ◦ f )−1 = f −1 ◦ g −1 . (i) f, g injektiv (ii) f, g surjektiv ∧ Dg ⊂ Y (iii) f, g bijektiv ∧ Y = U ⇒ ⇒ g ◦ f surjektiv . g ◦ f bijektiv . BEMERKUNG: (i) Für jeweils drei Abbildungen f, g, h gilt offenbar h ◦ (g ◦ f ) = (h ◦ g) ◦ f . (ii) Für zwei Abbildungen f, g gilt im allgemeinen g ◦ f 6= f ◦ g. Es sei X eine beliebige Menge. Eine Abbildung φ : X × X → X bezeichnet man gelegentlich auch als ”zweistellige Operation in X”. Man verwendet in diesem Fall für (x, y) ∈ X × X auch die Schreibweise xφy := φ(x, y), wie man es von Rechenoperationen”her gewohnt ist. Für eine zweistellige Operation φ : X × X → X definiert man (i) φ ”assoziativ” :⇔ ∀x, y, z ∈ X : xφ(yφz) = (xφy)φz . 18 (ii) φ ”kommutativ” :⇔ ∀x, y, ∈ X : xφy = yφx . (iii) Ein Element e ∈ X heißt ”neutrales Element” bzgl. der Operation φ :⇔ ∀x ∈ X : xφe = eφx = x . BEISPIELE: (i) Die zweistelligen Operationen ∩, ∪ : IP(X) × IP(X) 3 (A, B) → A n∩o ∪ B ∈ IP(X) sind assoziativ und kommutativ. ∅ ist neutrales Element bzgl. ∪ ; X ist neutrales Element bzgl. ∩. (ii) Es sei X eine beliebige Menge. Wir betrachten die Menge P(X) := { f | f : X → X bijektiv } der Permutationen von X. Wir hatten gesehen, daß ◦ : P(X) × P(X) 3 (f, g) → g ◦ f ∈ P(X) gilt. ◦ ist also eine zweistellige Operation in P(X). Diese ist assoziativ, aber (im allgemeinen) nicht kommutativ. Neutrales Element ist offenbar idX . Es seien I und X beliebige Mengen. Man bezeichet eine Abbildung A : I 3 i → Ai ∈ IP(X) gelegentlich auch als Mengenfamilie in X mit der Indexmenge I und notiert diese dann in der Form A =: (Ai )i∈I . Hierfür definiert man \ Ai := { x ∈ X | ∀ i ∈ I : x ∈ Ai } ∈ IP(X) i∈I als ”Durchschnitt der Mengenfamilie (Ai )i∈I ” und [ Ai := { x ∈ X | ∃ i ∈ I : x ∈ Ai } ∈ IP(X) i∈I als ”Vereinigung der Mengenfamilie (Ai )i∈I ”. 19 1 DIE REELLEN ZAHLEN Wir behandeln in diesem Kapitel den Zahlbereich, auf dem die Analysis basiert: Die reellen Zahlen. Dabei gehen wir axiomatisch vor, d. h. , wir gehen von dem den reellen Zahlen zugrunde liegenden Axiomensystem – welches sich im neunzehnten Jahrhundert nach einem langen Entwicklungsprozess schließlich herausgebildet hat – aus, und leiten daraus die grundlegenden Eigenschaften und Regeln ab. Auf die Historie des o.g. Entwicklungsprozesses sowie auch auf eine konstruktive Einführung der reellen Zahlen können wir hier nicht bzw. nur am Rande eingehen. Das System der reellen Zahlen (IR, 0, 1, +, ·, ≤) besteht aus • der Menge IR der reellen Zahlen, in der zwei voneinander verschiedene Elemente, die Null 0 ∈ IR und die Eins 1 ∈ IR ausgezeichnet sind, • den beiden zweistelligen Operationen Addition IR × IR 3 (x, y) → x + y ∈ IR und Multiplikation IR × IR 3 (x, y) → x · y ∈ IR • sowie der zweistelligen Kleiner-Gleich-Relation x ≤ y für (x, y) ∈ IR × IR. Hierfür gelten die folgenden Axiome: [K] Die Körperaxiome: A1: + assoziativ A2: + kommutativ A3: ∀ x ∈ IR : x + 0 = x A4: ∀ x ∈ IR ∃! y ∈ IR : x + y = 0 , Bez.: y =: −x . M1: · assoziativ M2: · kommutativ M3: ∀ x ∈ IR : 1 · x = x M4: ∀ x ∈ IR \ {0} =: IR∗ ∃! y ∈ IR∗ : y · x = 1 , D: ∀ x, y, z ∈ IR : x · (y + z) = (x · y) + (x · z) 1 =: 1/x =: x−1 . x (Distributivgesetz) Bez.: y =: 20 [A] Die Anordnungsaxiome: O.1 ≤ Totalordnung O.2 ∀ x, y, z ∈ IR : x ≤ y ⇒ x + z ≤ y + z (Monotonie der Addition) O.3 ∀ x, y, z ∈ IR : x ≤ y ∧ 0 ≤ z ⇒ x · z ≤ y · z (Monotonie der Multiplikation) [V] Das Vollständigkeitsaxiom: ∀ A, B ∈ IP(IR) \ {∅} : ∀a ∈ A ∀b ∈ B : a ≤ b ⇒ ∃ c ∈ IR ∀ a ∈ A ∀ b ∈ B : a ≤ c ≤ b . Ein System mit den Axiomen unter [K] wird als Körper bezeichnet; kommen die Axiome unter [A] hinzu, spricht man von einem angeordneten Körper; kommt schließlich noch das Axiom [V] hinzu, so hat man es mit einem vollständigen angeordneten Körper zu tun. Das System der reellen Zahlen ist also ein vollständiger angeordneter Körper. 21 1.1 FOLGERUNGEN AUS DEN KÖRPERAXIOMEN [K] Wir betrachten in diesem Abschnitt IR nur unter Zugrundelegung der Körperaxiome [K]. Die hier notierten Resultate gelten daher für jeden beliebigen Körper IK. VEREINBARUNGEN: (i)Zwecks Vermeidung von Klammern vereinbart man: ”Punktrechnung geht vor Strichrechnung” (Bindungskonvention), z. B.: x · y + z anstelle von (x · y) + z. (ii) Anstelle von x · y schreibt man kürzer auch xy. (iii) Wegen der Assoziativgesetze [A1] und [M 1] ist es sinnvoll, in diesem Zusammenhang auf die Klammerung zu verzichten und die Bezeichnung a+(b+c) = (a+b)+c =: a+b+c sowie a · (b · c) = (a · b) · c =: a · b · c zu verwenden. (1) DEFINITION, BEZEICHNUNGEN: (i) Für x, y ∈ IR bezeichnet man x − y := x + (−y) . x 1 (ii) Für x ∈ IR und y ∈ IR∗ bezeichnet man := x/y := x · = x · y −1 . y y Die folgenden Rechenregeln lassen sich aus den Axiomen [K] herleiten: (2) RECHENREGELN: (i) ∀ x ∈ IR : −(−x) = x (ii) ∀ a, b, x ∈ IR : a + x = b ⇔ x = b − a (iii) ∀ x, y ∈ IR : −(x + y) = (−x) + (−y) (iv) ∀ x ∈ IR : 0 · x = x · 0 = 0 (v) ∀ x, y, z ∈ IR : (x + y) · z = x · z + y · z (vi) ∀ x, y ∈ IR∗ : x · y 6= 0 (vii) ∀ x ∈ IR∗ : (x−1 )−1 = (IR ist ”nullteilerfrei” ) 1 =x 1/x (viii) ∀ a ∈ IR∗ ∀ x, b ∈ IR : a · x = b ⇔ x = (ix) ∀ x, y ∈ IR∗ : b a 1 1 1 = · xy x y (x) ∀ x, y ∈ IR : x · (−y) = (−x) · y = −xy ∧ (−x)(−y) = xy (xi) ∀ x, y, z ∈ IR : x(y − z) = xy − xz . 22 In jedem Körper gelten die bekannten REGELN ÜBER BRUCHRECHNUNG: Für a, b, c, d ∈ IR mit b 6= 0, d 6= 0 gilt: a c (i) = ⇔ ad = bc; b d a c a·c (ii) · = ; b d b·d a c ad ± bc (iii) ± = ; b d b·d a −a a (iv) − = = ; b b −b a/b a·d = , (c 6= 0) . (v) c/d b·c Wir wollen nun noch einige – eigentlich selbsterklärende – Bezeichnungen einführen: Für a ∈ IR und A, B ∈ IP(IR) bezeichnen wir a + A := { a + x | x ∈ A } , A + B := { x + y | x ∈ A , y ∈ B } . Entsprechend definiert man a − A , a · A , A − B , A · B und −A sowie im Falle A ⊂ IR∗ auch noch A−1 und B/A. 23 1.2 FOLGERUNGEN AUS DEN ANORDNUNGSAXIOMEN [A] Die Anordnungsaxiome [A] beinhalten zunächst O.1 ≤ ist Totalordnung auf IR d.h., ≤ ist eine Ordnungsrelation auf IR, und es gilt ∀ x, y ∈ IR : x ≤ y ∨ y ≤ x . Weiter gilt O.2 ∀ x, y, z ∈ IR : x ≤ y ⇒ x + z ≤ y + z (Monotonie der Addition) O.3 ∀ x, y, z ∈ IR : x ≤ y ∧ 0 ≤ z ⇒ x · z ≤ y · z (Monotonie der Multiplikation). (1) DEFINITION: Für x, y ∈ IR bezeichnet man (i) y ≥ x :⇔ x ≤ y (Größer-Gleich-Relation) (ii) x < y :⇔ y > x :⇔ x ≤ y ∧ x 6= y (iii) x positiv :⇔ x > 0, (Kleiner- bzw. Größer-Relation) x negativ :⇔ x < 0, x nichtnegativ ⇔ x ≥ 0 . (iv) Man bezeichnet üblicherweise IR+ := { x ∈ IR | x > 0 }. (2) RECHENREGELN: (i) ∀ x, y ∈ IR : x = y ∨ x < y ∨ x > y (ii) ∀ x, y, z ∈ IR : x < y ≤ z ∨ x ≤ y < z ⇒ x < z (iii) ∀ x, y ∈ IR : x < y ⇔ 0 < y − x ⇔ x − y < 0 ⇔ −y < −x ; insbesondere: x < 0 ⇔ −x > 0 (iv) ∀ x, y, a, b ∈ IR : x < y ∧ a ≤ b ⇒ x + a < y + b x < y ∧ z > 0 ⇒ xz < yz (v) ∀ x, y, z ∈ IR : x < y ∧ z < 0 ⇒ xz > yz (vi) ∀ x ∈ IR∗ : x · x > 0 , insbesondere 0 < 1 1 (vii) ∀ x ∈ IR∗ : x > 0 ⇒ >0 x 1 1 < (viii) ∀ x, y ∈ IR : 0 < x < y ⇒ y x 24 Wir definieren nun die Begriffe ”untere Schranke” und ”obere Schranke” sowie ”Minimum” und ”Maximum”. Diese Definitionen sind für jede Menge X mit einer Ordnungsrelation ≤ möglich bzw. gültig. Zunächst bezeichnen wir für a ∈ IR und A, B ∈ IP(IR) a ≤ A :⇔ ∀ x ∈ A : a ≤ x ; a ≥ A :⇔ ∀ x ∈ A : a ≥ x , etc sowie weiter A ≤ B :⇔ ∀ x ∈ A ∀ y ∈ B : x ≤ y . (3) DEFINITION: Es seien M ⊂ IR und a, b ∈ IR. (i) Man definiert zunächst a untere Schranke von M :⇔ a ≤ M , b obere Schranke von M :⇔ M ≤ b . (ii) Weiter definiert man a Minimum von M :⇔ a ∈ M ∧ a ≤ M , b Maximum von M :⇔ b ∈ M ∧ M ≤ b . a und b sind hierdurch eindeutig bestimmt. Damit sind jeweils die Bezeichnungen a =: min(M ) und b =: max(M ) gerechtfertigt. Offenbar gilt für x, y ∈ IR mit x ≤ y min{x, y} = x , max{x, y} = y . Weiter beweist man leicht folgende Regeln für das Rechnen mit Maximum und Minimum. (4) BEMERKUNG: Es seien A, B Teilmengen von IR, für die max(A) und max(B) existieren. Dann gilt: (i) A ⊂ B ⇒ max(A) ≤ max(B) (ii) min(−A) = − max(A) (iii) max(A ∪ B) = max({max(A), max(B)}) (iv) max(A + B) = max(A) + max(B) (v) max(A · B) = max(A) · max(B), sofern A ≥ 0 ∧ B ≥ 0. 25 Wir definieren nun den ”(Absolut-) Betrag” für reelle Zahlen. (5) DEFINITION: Für x ∈ IR bezeichnet x, x>0 | x | := max{x, −x} = 0, x=0 −x , x < 0 den (Absolut-)Betrag von x. (6) RECHENREGELN: Der Absolutbetrag ist eine Funktion | . | : IR → IR mit den Eigenschaften (i) |x| ≥ 0, |x| = 0 ⇔ x = 0, (ii) |x · y| = |x| · |y| , (iii) | x + y | ≤ | x | + | y | ”Dreiecksungleichung” . Weiter gilt (iv) (v) (vi) | x | = | −x | , ¯ ¯ ¯ x ¯ |x| ¯ ¯= ¯ y ¯ | y | , für y 6= 0 , |x − y| ≤ |x − z| + |z − y| , (vii) | | x | − | y | | ≤ | x − y | . Man zeigt leicht BEMERKUNG: Für x, y ∈ IR gilt min{x, y} = 1 (x + y − | x − y |) , 2 max{x, y} = 1 (x + y + | x − y |) . 2 26 (7) DEFINITION, BEMERKUNG: (i) Für I ⊂ IR definiert man: I Intervall :⇔ ∀ x, y ∈ I ∀ z ∈ IR : x < z < y ⇒ z ∈ I. (ii) Für a, b ∈ IR bezeichnen wir [a, b] := { x ∈ IR | min{a, b} ≤ x ≤ max{a, b} } sowie [a, b[ :=]b, a] := [a, b] \ {b} und ]a, b[ := [a, b] \ {a, b}. Dies sind jeweils Intervalle mit den ”Eckpunkten” a und b. Ferner bezeichnen wir für a ∈ IR [a, +∞[ := { x ∈ IR | a ≤ x } , sowie ]a, +∞[ := [a, +∞[ \{a} , ] − ∞, a] := { x ∈ IR | x ≤ a } ] − ∞, a[ := ] − ∞, a] \ {a}. Dies sind jeweils Intervalle mit den Eckpunkten a und +∞ bzw. −∞. Es erweist sich häufig als zweckmäßig, die reellen Zahlen um zwei uneigentliche Punkte ”+∞” und ”−∞” zu erweitern und hiermit IR := IR ∪ {−∞, +∞} zu betrachten. Man bezeichnet IR als ”Abschluß von IR”. Hierfür definiert man nun ∀x ∈ IR : −∞ ≤ x ∧ x ≤ +∞. Hierdurch wird ≤ von IR auf IR fortgesetzt, wodurch man eine Totalordnung auf IR erhält. < und ≥ sowie > werden auf IR in analoger Weise definiert. Da ≤ eine Ordnung auf IR ist, sind die in (3) definierten Begriffe auch in dieser Situation gegeben und es gelten die Aussagen aus (4). 27 1.3 DIE NATÜRLICHEN ZAHLEN Wir wollen hier zunächst die natürlichen Zahlen als eine Teilmenge der reellen Zahlen identifizieren. Ausgehend von der Vorstellung, daß die natürlichen Zahlen vom ”Zählen” herrühren, könnte man sie naiv als die Teilmenge von IR einführen, deren Elemente durch 0, 1 = 0 + 1, 2 := 1 + 1, 3 := 2 + 1, 4 := 3 + 1... etc gegeben sind. Diese Definition beinhaltet, daß 0 eine natürliche Zahl ist und mit jeder natürlichen Zahl n auch deren Nachfolger n + 1 eine natürliche Zahl ist. Diese beiden Eigenschaften reichen offenbar für die Charakterisierung der natürlichen Zahlen nicht aus, denn sowohl IR als auch [0, +∞[ besitzen diese Eigenschaften. Mit der obigen Definition möchte man die kleinstmögliche Teilmenge von IR mit diesen beiden Eigenschaften realisieren. Um eine exakte Einführung im Rahmen der zugrunde gelegten Axiome zu geben betrachten wir alle Teilmengen M von IR mit den Eigenschaften (∗) 0∈M ∧ ∀x ∈ M : x + 1 ∈ M . Hierdurch wird ein Mengensystem M in IR ausgezeichnet M := { M ∈ IP(IR) | erfüllt (∗) } . Dieses ist nicht leer, denn offenbar gilt IR, [0, +∞[∈ M. Wir fragen nun nach einer möglichst kleinen Menge M ∈ M. Dabei kann möglichst klein als minimal im Sinne der Ordnungsrelation ⊂ präzisiert werden. Wir betrachten daher die Menge aller x ∈ IR, die in jeder Menge M ∈ M vorkommen: \ IN := { x ∈ IR | ∀ M ∈ M : x ∈ M } = M. M ∈M Man sieht sofort IN ∈ M und hat nach Konstruktion IN ⊂ M, (M ∈ M). Damit folgt (1) SATZ, DEFINITION: Es existiert genau eine Teilmenge IN von IR mit (i) 0 ∈ IN ∧ ∀ n ∈ IN : n + 1 ∈ IN, £ ¤ (ii) ∀ M ∈ IP(IR) : 0 ∈ M ∧ ∀ x ∈ M : x + 1 ∈ M ⇒ IN ⊂ M . Man bezeichnet IN als die ”Menge der natürlichen Zahlen” . Es gilt IN ⊂ [0, +∞[. 28 Unmittelbare Folgerung aus (1) ist das (2) PRINZIP DER VOLLSTÄNDIGEN INDUKTION (1.Version): £ ¤ ∀ M ∈ IP(IN) : 0 ∈ M ∧ ∀n ∈ M : n + 1 ∈ M ⇒ M = IN. Vertrauter und anwendungsfreundlicher ist die folgende Version (3) PRINZIP DER VOLLSTÄNDIGEN INDUKTION (2.Version): Es sei k ∈ IN und für n ∈ IN , n ≥ k sei jeweils A(n) eine Aussage. Es gelte A(k) sowie ∀ n ∈ IN , n ≥ k : A(n) ⇒ A(n + 1) . Dann folgt ∀ n ∈ IN , n ≥ k : A(n) . Mittels vollständiger Induktion zeigt man (4) BEMERKUNG: ∀ m, n ∈ IN : n + m ∈ IN ∧ n · m ∈ IN. Wir bezeichnen IN∗ := IN \ {0}. (5) BEMERKUNG: (i) ∀ n ∈ IN∗ : n − 1 ∈ IN. (ii) ∀ n, m ∈ IN : n < m ⇒ m − n ∈ IN∗ . (iii) ∀ n ∈ IN ∀ x ∈ IR : n < x < n + 1 ⇒ x ∈ / IN . (6) BEMERKUNG: ∀ M ∈ IP(IN) \ {∅} ∃ m = min(M ) ∈ IN . Die in (6) notierte Eigenschaft bezeichnet man als Wohlordnungseigenschaft von IN. (7) POTENZEN: Für a ∈ IR und n ∈ IN definiert man (rekursiv) a0 := 1 , an+1 := an · a , (n ∈ IN) . Insbesondere ist dann a1 = a , a2 = a · a und 00 = 1. 29 Für a, b ∈ IR und n, m ∈ IN gelten die Rechenregeln am+n = am · an ; (an )m = an·m ³ a ´n an (a · b)n = an · bn ; = n , (b 6= 0) ; b b n n 0 ≤ a < b ⇒ 0 ≤ a < b , (n 6= 0). (8) BERNOULISCHE UNGLEICHUNG: Es gilt für x ∈ IR mit x > −1 (1 + x)n ≥ 1 + nx, (n ∈ IN). (9) DAS SUMMEN- UND DAS PRODUKTZEICHEN: Es seien k, ` ∈ IN mit k ≤ ` und für j = k, · · · , ` jeweils xj ∈ IR. Man definiert dann die Summe der xj von j = k bis j = ` X̀ xj ( = xk + . . . + x` ) j=k rekursiv durch k X xj := xk , n+1 X xj := ! xj + xn+1 , (k ≤ n < `) j=k j=k j=k à n X und entsprechend das Produkt der xj von j = k bis j = ` Ỳ xj ( = xk · . . . · x` ) j=k rekursiv durch k Y xj := xk , j=k n+1 Y xj := j=k à n Y ! xj · xn+1 , j=k Gelegentlich ist es nützlich, für ` < k X̀ j=k zu bezeichnen. BEISPIEL: n X j=0 j = n(n + 1) . 2 xj := 0 , Ỳ j=k xj := 1 (k ≤ n < `) . 30 (10) RECHENREGELN FÜR DAS SUMMENZEICHEN: (i) (ii) X̀ xj = j=k j=0 X̀ m X xj = j=k (iii) X̀ j=k (iv) `−k X n X i=m xk+j = à X̀ j=k X̀ x`−j , j=0 X̀ xj + xj , (k − 1 ≤ m ≤ `), j=m+1 j=k xj + `−k X yj = (xj + yj ), j=k ! aij X̀ = X̀ à n X j=k i=m j=k ! aij . Analoge RECHENREGELN gelten für das PRODUKTZEICHEN. (11) ALLGEMEINES DISTRIBUTIVGESETZ: à n ! à ! à n ! X̀ X X̀ X xj y i . xj yi = i=m j=k i=m j=k (12) DEFINITION, BEMERKUNG: (i) Für n ∈ IN definiert man ”n-Fakultät” durch n! := n Y j j=1 und hat dann 0! = 1 , (n + 1)! = n! · (n + 1) , (n ∈ IN) . (ii) Für x ∈ IR und n ∈ IN definiert man den ”Binomialkoeffizienten x über n” durch µ ¶ n 1 Y x := (x + 1 − j) n n! j=1 und hat dann µ x 0 ¶ µ = 1, x n+1 ¶ µ = x n ¶ · x−n , (n ∈ IN) . n+1 Man bestätigt sofort für k, n ∈ IN µ k n 0 ¶ = , (k < n), k! , (k ≥ n) (k − n)! n! 31 sowie µ x n ¶ µ + x n−1 ¶ µ = x+1 n ¶ , (x ∈ IR, n ∈ IN∗ ). BEISPIEL: n! ≥ 2n , (n ∈ IN , n ≥ 4) . Mittels vollständiger Induktion zeigt man (13) BINOMISCHER LEHRSATZ: Für a, b ∈ IR und n ∈ IN gilt ¶ n µ X n (a + b) = ai bn−i . i n i=0 Mithilfe von IN und IN∗ identifizieren wir in IR die Menge der ganzen Zahlen ZZ := IN ∪ (−IN∗ ) . Man verifiziert sofort ∀ m, n ∈ ZZ : n ± m ∈ ZZ , n · m ∈ ZZ . Weiter identifizieren wir hiermit in IR die Menge der rationalen Zahlen nm o Q I := | m ∈ ZZ ∧ n ∈ IN∗ . n Man bestätigt sofort, daß Q I mit + und · ein Körper ist. Es sei q ∈ Q I . Mit n(q) := min { n ∈ IN∗ | n · q ∈ ZZ } ∈ IN∗ , m(q) := q · n(q) ∈ ZZ erhält man für q die eindeutige teilerfremde Darstellung q = m(q) . n(q) 32 1.4 Folgerungen aus dem Vollständigkeitsaxiom Das Vollständigkeitsaxiom lautet [V] ∀ A, B ∈ IP(IR) \ {∅} mit A ≤ B ∃ c ∈ IR mit A ≤ c ≤ B . Hieraus folgt zunächst (1) SATZ (ARCHIMEDES): ∀ x ∈ IR ∃ n ∈ IN : x < n. (2) FOLGERUNGEN: 1 < ε. n (ii) ∀ q > 1 ∀ x ∈ IR ∃ n ∈ IN : x < q n . (i) ∀ ε > 0 ∃ n ∈ IN∗ : (3) BEMERKUNG, DEFINITION: Es gilt ∀ x ∈ IR ∃! m ∈ ZZ : m ≤ x < m + 1. Man bezeichnet m =: [x] als die ”größte ganze Zahl ≤ x” oder als den ”ganzzahligen Anteil von x”. Die Funktion IR 3 x → [x] ∈ ZZ wird als ”Gaußsche Klammer” bezeichnet. (4) BEMERKUNG: ∀ a, b ∈ IR mit a < b ∃ q ∈ Q I mit a < q < b. Bemerkung (4) besagt, daß Q I in IR dicht liegt. In 1.2 hatten wir für n ∈ IN und a ∈ IR die n-te Potenz an definiert und gesehen, daß für n ∈ IN∗ 0 ≤ a < b ⇒ 0 ≤ an < bn gilt. Wir zeigen nun mit Hilfe des Vollständigkeitsaxioms (5) SATZ, DEFINITION: Es sei n ∈ IN , n ≥ 2. Dann gilt ∀ z ∈ [0, +∞[ ∃! x ∈ [0, +∞[ mit xn = z. 1 Man bezeichnet x =: z n =: √ n z als n-te Wurzel von z. √ √ Für n = 2 bezeichnet man speziell 2 z =: z als Quadratwurzel von z. 33 Mit (5) ist gezeigt, daß für n ∈ IN∗ die Funktion ”n-te Potenz” [0, +∞[3 x → xn ∈ [0, +∞[ bijektiv ist, und die ”n-te Wurzel” √ n : [0, +∞[3 x → √ n x ∈ [0, +∞[ gerade die zugehörige Umkehrfunktion ist. (6) BEMERKUNG: Es ist √ 2∈ /Q I . Folglich gilt Q I 6= IR. Wir beweisen im folgenden mit Hilfe des Vollständigkeitsaxioms einige wichtige Eigenschaften für Teilmengen von IR. Zunächst jedoch eine allgemeine (7) DEFINITION: Es sei X eine nichtleere Menge und ≤ eine Ordnungsrelation auf X. Weiter sei M eine beliebige Teilmenge von X. Wir definieren: (i) Ein a ∈ X heißt ”untere (bzw. obere) Schranke von M ” :⇔ a ≤ M (bzw. M ≤ a) . (ii) Ein a ∈ X heißt ”Minimum (bzw. Maximum) von M ” :⇔ a ∈ M und a untere (bzw. obere) Schranke von M . Da M höchstens ein Minimum (bzw. Maximum) besitzt, ist dann gerechtfertigt, a =: min(M ) (bzw. a =: max(M ) ) zu bezeichnen. (iii) M heißt ”nach unten (bzw. nach oben) beschränkt” :⇔ ∃ a ∈ X : a untere (bzw. obere) Schranke von M . M heißt ”beschränkt” : ⇔ M nach unten und nach oben beschränkt. (iv) Besitzt M eine größte untere Schranke a ∈ X, d.h. existiert a = max { x ∈ X | x untere Schranke von M } ∈ X , so bezeichnet man a =: inf(M ) als das ”Infimum von M ”. Besitzt M eine kleinste obere Schranke a ∈ X, d.h. existiert a = min { x ∈ X | x obere Schranke von M } ∈ X , so bezeichnet man a =: sup(M ) als das ”Supremum von M ”. 34 (8) SATZ: Es sei ∅ 6= M ⊂ IR. (i) Ist M nach unten beschränkt, so existiert inf(M ) ∈ IR. (ii) Ist M nach oben beschränkt, so existiert sup(M ) ∈ IR. (9) BEMERKUNG: Für M ⊂ IR und a ∈ IR gilt a = sup(M ) ⇔ −a = inf(−M ) , a = inf(M ) ⇔ −a = sup(−M ) . Eine nützliche Charakterisierung von Infimum und Supremum liefert die folgende (10) BEMERKUNG: Es seien M ⊂ IR und a ∈ IR. Dann gilt (i) a = inf(M ) ⇔ a≤M ∧ ∀c > a ∃x ∈ M : x < c (ii) a = sup(M ) ⇔ a≥M ∧ ∀c < a ∃x ∈ M : x > c. Offenbar gilt für M ⊂ IR und a ∈ IR: a = min(M ) ⇔ a ∈ M und a = inf(M ), a = max(M ) ⇔ a ∈ M und a = sup(M ). Wir betrachten nun noch Teilmengen von IR. Offenbar ist jede Menge M ⊂ IR in IR beschränkt: −∞ ist stets eine untere und +∞ stets eine obere Schranke von M . Wir zeigen (11) BEMERKUNG: Für M ⊂ IR existieren stets jeweils inf(M ) ∈ IR und sup(M ) ∈ IR. Für das Infimum gilt insbesondere: (i) M ⊂ {+∞} ⇒ inf(M ) = +∞. (ii) −∞ ∈ M oder M ∩ IR in IR nicht nach unten beschränkt ⇒ inf(M ) = −∞. (iii) −∞ 6∈ M und ∅ 6= M ∩ IR (in IR) nach unten beschränkt ⇒ inf(M ) = inf(M ∩ IR) ∈ IR. Entsprechendes gilt für das Supremum. Insbesondere ist inf(∅) = +∞, sup(∅) = −∞, und für beliebige Mengen ∅ 6= M ⊂ IR gilt inf(M ) ≤ sup(M ). Die Aussagen in (9) und (10) gelten für Mengen M ⊂ IR entsprechend. 35 Wir betrachten nun noch Intervalle und zeigen (12) BEMERKUNG: Es sei ∅ 6= I ⊂ IR ein Intervall. Mit a := inf(I) und b := sup(I) gilt dann ]a, b[ ⊂ I ⊂ [a, b] und damit I =]a, b[ oder I =]a, b] oder I = [a, b[ oder I = [a, b]. (13) SATZ (INTERVALLSCHACHTELUNG): Es seien für n ∈ IN jeweils Intervalle In := [an , bn ] mit − ∞ < an ≤ bn < +∞ gegeben, und es gelte In ⊃ In+1 , (n ∈ IN). Mit −∞ < a := sup { an | n ∈ IN } ≤ b := inf { bn | n ∈ IN } < +∞ gilt dann \ n∈IN In = [a, b] (6= ∅). 36 2 KONVERGENZ VON FOLGEN UND REIHEN 2.1 KONVERGENZ VON FOLGEN REELLER ZAHLEN Es sei X eine beliebige Menge. Jede Abbildung α : ZZ ⊃ Dα 3 n → an ∈ X, deren (individueller) Definitionsbereich Dα von der Form Dα = k + IN mit k ∈ ZZ ist, wird als ”Folge in X” bezeichnet. Man notiert eine solche Folge im allgemeinen in der Form α =: (an )∞ n=k =: (an )n∈k+IN =: (an )n≥k oder auch nur kurz α =: (an ). Man bezeichnet an als das ”n-te Folgenglied” der Folge α = (an ). Weiter bezeichnet man Wα := { an | n ∈ k + IN } als ”Wertemenge” von α . Im Fall X = IR spricht man von einer ”reellen Zahlenfolge” bzw. ”Folge reeller Zahlen”. (1) BEISPIELE REELLER ZAHLENFOLGEN: (i) Für a ∈ IR und k ∈ ZZ definiert k + IN 3 n → a ∈ IR die ”konstante Folge” a. (ii) Die Folge IN 3 n → n ∈ IR notiert man kurz (n)n∈IN . (iii) Die Folge IN∗ 3 n → 1/n ∈ IR notiert man kurz ( 1/n )n≥1 . (iv) Für q ∈ IR definiert IN 3 n → q n ∈ IR bzw. (q n )n∈IN die ”Folge der Potenzen von q”. (v) Für a ∈ IR+ wird durch von a0 ∈ IR+ und µ ¶ 1 a an+1 := an + , 2 an (n ∈ IN) ”rekursiv” eine Folge (an )n∈IN definiert. Wir definieren für reelle Zahlenfolgen zunächst einige Begriffe, die nur von der Wertemenge abhängen. (2) DEFINITION: Für eine reelle Zahlenfolge α = (an )n≥k definiert man mittels ihrer Wertemenge Wα = {an | n ∈ k + IN } : (i) sup an := sup(Wα ) ∈ IR ∪ { +∞} heißt ”Supremum” der Folge (an ). n∈IN (an ) heißt ”nach oben beschränkt” :⇔ Wα nach oben beschränkt (ii) ⇔ sup an < +∞: n∈IN inf an := inf(Wα ) ∈ IR ∪ {−∞} heißt ”Infimum” der Folge (an ). n∈IN (an ) heißt ”nach unten beschränkt” :⇔ Wα nach unten beschränkt ⇔ inf an > −∞. n∈IN 37 (iii) Schließlich heißt (an ) ”beschränkt” :⇔ Wα beschränkt. Dies ist offenbar genau dann der Fall, wenn (an ) nach oben und nach unten beschränkt ist, bzw. genau dann wenn die Folge ( | an | )n≥k nach oben beschränkt ist. Wir wollen nun für Folgen reeller Zahlen die grundlegenden Begriffe ” Konvergenz” und ”Grenzwert” definieren. Dazu führen wir zunächst eine abkürzende Sprechweise ein: (3) DEFINITION: Es sei k ∈ ZZ und für n ∈ k + IN jeweils A(n) eine Aussage. Wir definieren A(n) (gilt) für fast alle n :⇔ A(n) ffa n :⇔ ∃ N ∈ k + IN ∀ n ≥ N : A(n) (wahr). Die Aussage A(n) kann hier also höchstens für endlich viele n ∈ k + IN falsch sein. (4) KONVERGENZ UND GRENZWERT: Es sei (an ) = (an )∞ n=k eine Folge in IR. (i) Für a ∈ IR definiert man: (an ) ”konvergiert gegen a” :⇐⇒ ( ∀ ² > 0 : | an − a | < ² ffa n bzw. ∀ ² > 0 ∃ N ∈ k + IN : | an − a | < ² (n ≥ N ). Man bezeichnet für ² ∈ IR+ das Intervall ]a − ², a + ²[ =: K² (a) als ”²-Umgebung von a”. Hiermit hat man offenbar (an ) konvergiert gegen a ⇐⇒ ( ∀ ² > 0 : an ∈ K² (a) ffa n bzw. ∀ ² > 0 ∃ N ∈ k + IN : an ∈ K² (a) (n ≥ N ). Man notiert die Aussage ”(an ) konvergiert gegen a” abkürzend in der Form an → a (n → ∞) und bezeichnet a =: lim an als ”Grenzwert” von (an ) . n→∞ Diese Bezeichnung ist gerechtfertigt, da der Grenzwert eindeutig bestimmt ist: Gilt für a, ã ∈ IR sowohl an → a (n → ∞) als auch an → ã (n → ∞), so folgt ã = a . (ii) Gilt speziell an → 0 (n → ∞), so bezeichnet man (an ) als ”Nullfolge” . (iii) Die Folge (an ) heißt ”konvergent”, kurz: ”(an ) kgt” 38 :⇐⇒ ∃ a ∈ IR mit an → a (n → ∞). (iv) Die Folge (an ) heißt ”divergent”, wenn sie nicht konvergent ist. (5) BEISPIELE: (i) Die konstante Folge k + IN 3 n → a ∈ IR konvergiert gegen a. (ii) Die Folge (n)n∈IN ist divergent. (iii) ( 1/n )n≥1 ist eine Nullfolge. √ (iv) Für 2 ≤ k ∈ IN ist ( 1/ k n )n≥1 eine Nullfolge. (v) Für q ∈ IR mit 0 ≤ q < 1 ist ( q n )n∈IN eine Nullfolge. (vi) Die Folge ( (−1)n )n∈IN ist divergent. √ (vii) Für c ∈ IR+ gilt n c → 1 (n → ∞). (6) BEMERKUNG: Jede konvergente Folge reeller Zahlen (an )∞ n=k ist beschränkt. Die Umkehrung der vorstehenden Aussage ist falsch, wie das Beispiel (5) (vi) zeigt. Aus (6) liest man noch einmal ab, daß die Folge ( n )n∈IN divergent ist, denn sie ist offensichtlich nicht beschränkt. Einen Zusammenhang zwischen Konvergenz und Nullfolgen beinhaltet die folgende (7) BEMERKUNG: Für jede reelle Zahlenfolge (an )n≥k gilt an → a (n → ∞) ⇔ (an − a)n≥k Nullfolge . Es ist daher zweckmäßig, zunächst Nullfolgen zu studieren. (8) RECHENREGELN FÜR NULLFOLGEN: Es seien (an ) und (bn ) Folgen in IR. Hierfür gilt: (i) (an ) Nullfolge ⇐⇒ (| an |) Nullfolge . (ii) (an ) und (bn ) Nullfolgen =⇒ (an ± bn ) Nullfolgen . (iii) (an ) Nullfolge und (bn ) beschränkt (iv) (an ) Nullfolge und | bn | ≤ | an | ffa n =⇒ =⇒ (an · bn ) Nullfolge (bn ) Nullfolge . . 39 ∞ In (8) (ii) sowie (8) (iii) sind für (an ) =: (an )∞ n=k und (bn ) =: (bn )n=` die Summen- bzw. Differenzfolge sowie die Produktfolge durch (an ± bn ) := (an ± bn )∞ n=m sowie (an · bn ) := (an · bn )∞ n=m mit m = max{k, `} definiert. (9) BEISPIELE: (i) Für k ∈ IN∗ ist ( 1/nk )n≥1 Nullfolge. ¡ ¢ (ii) Für k ∈ IN und q ∈ IR mit | q | < 1 ist nk · q n n∈IN Nullfolge . Wir kommen nun zu den wichtigsten RECHENREGELN für konvergente Folgen. ∞ (10) SATZ: Es seien (an ) = (an )∞ n=k und (bn ) = (bn )n=` Folgen in IR. (i) Sind (an ) und (bn ) konvergent und gilt an ≤ bn ffa n , so folgt lim an ≤ lim bn . n→∞ (ii) Sind (an )∞ n=k und (bn )∞ n=` n→∞ konvergent mit lim an =: a ∈ IR und lim bn =: b ∈ IR , n→∞ n→∞ so folgt an ± bn → a ± b (n → ∞) und an · bn → a · b (n → ∞). (iii) Ist (an ) = (an )∞ n=k eine konvergente Folge mit lim an =: a ∈ IR∗ , n→∞ so existiert ein (minimales) k̃ ∈ IN mit an 6= 0 für n ∈ k̃ + IN) . µ Hiermit ist die Folge 1 an ¶∞ definiert, und es gilt n=k̃ 1 1 → an a (n → ∞) . Ist (bn ) konvergent mit lim bn =: b, so folgt n→∞ bn b → an a (n → ∞) . 40 Nützlich für Konvergenzbeweise und Grenzwertberechnungen ist das folgende Einschachtelungsprinzip. ∞ ∞ (11) SATZ: Es seien (an )∞ n=k , (bn )n=` und (cn )n=m Folgen in IR mit an ≤ cn ≤ bn ffa n . ∞ Sind dann (an )∞ n=k und (bn )n=` konvergent mit lim an = lim bn =: c, n→∞ n→∞ so ist auch (cn )∞ n=m konvergent mit lim cn = c. n→∞ Die divergente Folge (n)n∈IN besizt offenbar ein vernünftiges, den konvergenten Folgen verwandtes Grenzverhalten. (12) DEFINITION: Es sei (an ) = (an )∞ n=k eine Folge in IR. Wir definieren (an )∞ n=k ”konvergiert gegen +∞” :⇔ an → +∞ (n → ∞) :⇔ ∀ γ ∈ IR : an > γ ffa n ⇔ ∀ γ > 0 : an > γ ffa n . (an )∞ n=k ”konvergiert gegen −∞” :⇔ an → −∞ (n → ∞) :⇔ ∀ γ ∈ IR : an < γ ffa n ⇔ ∀ γ > 0 : an < −γ ffa n . Wir bezeichnen in jeder der beiden Situationen die Folge (an )∞ n=k als uneigentlich konvergent bzw. als bestimmt divergent. Offenbar gilt für jede reelle Folge (an )∞ n=k an → +∞ (n → ∞) ⇔ −an → −∞ (n → ∞) , . (13) BEMERKUNG: Sind (an ) und (bn ) reelle Folgen mit an ≤ bn ffa n , so gilt: an → +∞ (n → ∞) ⇒ bn → +∞ (n → ∞) bn → −∞ (n → ∞) ⇒ an → −∞ (n → ∞) . 41 (14) BEISPIELE: (i) n → +∞ (n → ∞) und −n → −∞ (n → ∞) . √ (ii) Für IN 3 k ≥ 2 gilt k n → +∞ (n → ∞) und nk → +∞ (iii) Für IR 3 q > 1 gilt q n → +∞ (n → ∞) . (n → ∞). Es besteht ein einfacher Zusammenhang zwischen Nullfolgen und uneigentlich konvergenten Folgen. (15) BEMERKUNG: Es sei (an )∞ n=k eine Folge in IR mit an > 0 , (n ≥ k) bzw. mit an < 0 , (n ≥ k) . Dann gilt an → 0 (n → ∞) ⇔ 1 1 → +∞ (n → ∞) bzw. → −∞ (n → ∞) . an an Hieraus folgt dann auch unmittelbar | an | → +∞ (n → ∞) ⇒ 1 → 0 (n → ∞) . an Es folgen einige weitere RECHENREGELN für uneigentlich konvergente Folgen. (16) BEMERKUNG: Es seien (an )n≥k und (bn )n≥` Folgen in IR. (i) Gilt an → +∞ (bzw. → −∞) (n → ∞) und ist (bn )∞ n=` nach unten beschränkt (bzw. nach oben beschränkt), so folgt an + bn → +∞ (bzw. → −∞) (n → ∞) . (ii) Gilt an → +∞ (bzw. → −∞) (n → ∞) und ist inf { bn | n ∈ ` + IN } > 0 , so folgt an · bn → +∞ (bzw. → −∞) (n → ∞). 42 Wir betrachten nun noch MONOTONE FOLGEN. (17) DEFINITION: Eine Folge (an )∞ n=k in IR heißt ”monoton wachsend” (bzw. ”monoton fallend”), sofern ∀ n ∈ k + IN : an ≤ an+1 , (bzw. ∀ n ∈ k + IN : an ≥ an+1 ) gilt. Gelten hier jeweils die strikten Ungleichungen, so spricht man von einer ”streng monoton wachsenden” (bzw. ”streng monoton fallenden”) Folge. Gelten die Ungleichungen jeweils nur für fast alle n ≥ k, so sagt man, daß die Folge schließlich monoton wachsend (bzw. fallend) ist. (18) SATZ: Es sei (an )∞ n=k eine Folge in IR. (i) Ist (an )∞ n=k monoton fallend, so gilt an → inf { am | m ∈ k + IN } (n → ∞). (ii) Ist (an )∞ n=k monoton wachsend, so gilt an → sup { am | m ∈ k + IN } (n → ∞). Ein Beispiel zur monotonen Konvergenz ist die (19) REKURSIVE QUADRATWURZELBERECHNUNG Es sei a ∈ IR+ . Gibt man a0 ∈ IR+ beliebig vor und definiert man rekursiv: so folgt an → √ 2 1 a an+1 := (an + ) , 2 an (n ∈ IN) , a (n → ∞) . Ein weiteres schönes Beispiel zur monotonen Konvergenz von Folgen ist die Definition der EXPONENTIALFUNKTION. Zur Motivation betrachten wir das Problem der stetigen Verzinsung: Ein (Anfangs-)Kapital K0 werde mit P Prozent verzinst. K sei das (End-)Kapital nach einem Jahr. Mit x :=P /100 gilt bei jährlicher Verzinsung: K = K0 · (1 + x), bei monatlicher Verzinsung: ³ x ´12 , K = K0 · 1 + 12 43 bei täglicher Verzinsung: ³ x ´360 K = K0 · 1 + , 360 1 bei n-maliger Verzinsung nach jeweils -tel Jahr n ³ x ´n K = K0 · 1 + , n bei ” stetiger Verzinsung ” ³ x ´n K = K0 · lim 1 + . n→∞ n Die Existenz des Grenzwertes beinhaltet der folgende Satz. (20) SATZ: Für N ∈ IN∗ , x ∈ [−N, N ] und IN 3 n ≥ N + 1 gilt: µ ¶n+1 ³ 1 x ´n x ≤ 1+ ≤ (N + 1)N +1 . ≤ 1+ N +1 (N + 1) n n+1 Damit existiert für jedes x ∈ IR der Grenzwert ³ x ´n lim 1 + =: exp(x) ∈ ]0, +∞[. n→∞ n Man bezeichnet exp : IR 3 x → exp(x) ∈ IR als (reelle) Exponentialfunktion. Speziell bezeichnet man µ e := exp(1) = lim n→∞ 1 1+ n ¶n = 2.718 281 828 459 ... als Eulersche Zahl . Die Exponentialfunktion hat die folgenden EIGENSCHAFTEN: (i) exp(0) = 1 , (ii) exp(x) > 0 , exp(x) ≥ 1 + x , (x ∈ IR) , (iii) exp(x + y) = exp(x) exp(y) , insbesondere gilt: (x, y ∈ IR), 1 , (x ∈ IR). exp(−x) = exp(x) BEISPIEL: Für jede Nullfolge (an )n≥1 gilt ³ an ´n 1+ → 1 , (n → ∞) . n 44 2.2 LIMES INFERIOR UND LIMES SUPERIOR; BERÜHRPUNKTE; TEILFOLGEN; CAUCHY-FOLGEN (1) DEFINITION, BEMERKUNG: Es sei (xn )∞ n=k eine Folge in IR. Hiermit seien für n ∈ k + IN an := inf { xm | m ≥ n } ∈ IR ∪ {−∞} , bn := sup { xm | m ≥ n } ∈ IR ∪ {+∞} betrachtet. ∞ Ist (xn )∞ n=k nach unten beschränkt, so ist (an )n=k eine monoton wachsende Folge in IR. Es existiert dann der Grenzwert lim an = sup { an | n ≥ k } =: a ∈ IR ∪ {+∞} . n→∞ Ist (xn )∞ n=k nicht nach unten beschränkt, so gilt an = −∞ , (n ≥ k). Wir setzen dann a := −∞. Man bezeichnet jeweils a =: lim inf xn n→∞ als ”limes inferior” von (xn )∞ n=k . ∞ Ist (xn )∞ n=k nach oben beschränkt, so ist (bn )n=k eine monoton fallende Folge in IR. Es existiert dann der Grenzwert lim bn = inf { bn | n ≥ k } =: b ∈ IR ∪ {−∞} . n→∞ Ist (xn )∞ n=k nicht nach oben beschränkt, so gilt bn = +∞ , (n ≥ k). Wir setzen dann b := +∞. Man bezeichnet jeweils b =: lim sup xn n→∞ als ”limes superior” von (xn )∞ n=k . Es gilt offenbar lim inf xn ≤ lim sup xn . n→∞ n→∞ Mit −(+∞) = −∞ und −(−∞) = +∞ hat man (2) BEMERKUNG: Für jede Folge (xn )∞ n=k in IR gilt lim inf (−xn ) = − lim sup xn . n→∞ n→∞ 45 (3) BEISPIELE: (i) xn := (−1)n , (n ∈ IN) ⇒ lim inf xn = −1, lim sup xn = 1. n→∞ n→∞ √ √ (ii) xn := n + 1 + (−1)n n, (n ∈ IN) ⇒ lim inf xn = 0, lim sup xn = +∞. n→∞ n→∞ Um im folgenden bequemer formulieren zu können, führen wir eine weitere Sprechweise ein. Dazu sei wie gehabt k ∈ ZZ und für n ∈ k + IN sei jeweils A(n) eine Aussage. Wir definieren A(n) (gilt) für unendlich viele n ∈ k + IN :⇔ A(n) fuv n :⇔ ∀ N ≥ k ∃ n ≥ N : A(n). Es folgt eine Charakterisierung des Limes Inferior und des Limes Superior. (4) BEMERKUNG: Es seien (xn )∞ n=k eine Folge in IR und c ∈ IR. Dann gilt ( 1) ∀ γ < c : xn > γ ffa n, c = lim inf xn ⇔ n→∞ 2) ∀ γ > c : xn < γ fuv n, sowie entsprechend ( c = lim sup xn ⇔ n→∞ 1) 2) ∀ γ > c : xn < γ ffa n, ∀ γ < c : xn > γ fuv n. (5) DEFINITION: Es sei (xn )∞ n=k eine Folge in IR und a ∈ IR. a heißt Berührpunkt (Bp) von (xn )∞ n=k :⇔ ∀ ε > 0 : xn ∈ Kε (a) fuv n. Entsprechend heißt +∞ (bzw. −∞) (uneigentlicher) Berührpunkt (Bp) von (xn )∞ n=k :⇔ ∀ γ > 0 : xn > γ fuv n (bzw. xn < −γ fuv n) . (6) SATZ: Für jede Folge (xn )∞ n=k in IR gilt © ª lim inf xn = min x ∈ IR | x Bp von (xn )∞ n=k n→∞ und © ª lim sup xn = max x ∈ IR | x Bp von (xn )∞ . n=k n→∞ (6’) FOLGERUNG (BOLZANO-WEIERSTRASS): Jede Folge in IR besitzt (mindestens) einen Berührpunkt in IR. Ist die Folge beschränkt, so liegen alle ihre Berührpunkte in IR. 46 (7) SATZ: Es seien (xn )∞ n=k eine Folge in IR. Dann gilt für a ∈ IR xn → a (n → ∞) ⇔ a ist der einzige Bp von (xn )∞ n=k ⇔ lim inf xn = lim sup xn = a . n→∞ n→∞ (8) BEMERKUNG: Für IR 3 xn > 0, (n ∈ IN) gilt: √ √ xn+1 xn+1 lim inf ≤ lim inf n xn ≤ lim sup n xn ≤ lim sup . n→∞ n→∞ xn xn n→∞ n→∞ Wir definieren nun noch ∞ (9) DEFINITION: Es seien (xn )∞ n=k und (yn )n=` Folgen in IR. Man bezeichnet: ∞ (yn )∞ n=` heißt Teilfolge von (xn )n=k :⇔ ∃ τ : ` + IN → k + IN mit τ (n) < τ (n + 1) und yn = xτ (n) für n ≥ `. (10) BEMERKUNG: Es sei (xn )∞ n=k eine Folge in IR und a ∈ IR. Dann gilt: ∞ ∞ (i) a Bp von (xn )∞ n=k ⇒ ∃ (yn )n=1 Teilfolge von (xn )n=k : yn → a (n → ∞). ∞ (ii) Ist (yn )∞ n=` Teilfolge von (xn )n=k , so folgt: ∞ a Bp von (yn )∞ n=` ⇒ a Bp von (xn )n=k ; xn → a (n → ∞) ⇒ yn → a (n → ∞). (11) FOLGERUNG: Jede Folge in IR besitzt eine Teilfolge, die konvergent ist oder gegen +∞ oder gegen −∞ konvergiert. Jede beschränkte Folge besitzt eine konvergente Teilfolge. (12) DEFINITION: Es sei (xn )∞ n=k eine Folge in IR. Dann heißt (xn )∞ n=k Cauchy-Folge ( CF ) :⇔ ∀ ε > 0 ∃ N ≥ k ∀ n, m ≥ N : | xn − xm | < ε . (13) BEMERKUNG: Es sei (xn )∞ n=k eine Folge in IR. Dann gilt: ∞ (i) (xn )∞ n=k konvergent ⇒ (xn )n=k Cauchy-Folge. ∞ (ii) (xn )∞ n=k Cauchy-Folge ⇒ (xn )n=k beschränkt. ∞ (iii) (xn )∞ n=k Cauchy-Folge und a Berührpunkt von (xn )n=k ⇒ a ∈ IR und xn → a Hiermit folgt nun leicht (n → ∞). 47 (14) SATZ (CAUCHY’SCHES KONVERGENZKRITERIUM): Für jede Folge (xn )∞ n=k in IR gilt: ∞ (xn )∞ n=k Cauchy-Folge ⇔ (xn )n=k konvergent . Die Aussage ⇒ von Satz (14) wird als Folgenvollständigkeit von IR bezeichnet. Diese zusammen mit der Aussage des Satzes von Archimedes sind äquivalent zum Vollständigkeitsaxiom. 48 2.3 UNENDLICHE REIHEN; POTENZREIHEN (1) DEFINITION: Es sei (an )∞ n=k eine Folge in IR. Für n ∈ k + IN heißt sn := n X n-te Partialsumme der Folge (an )∞ n=k aj j=k und die Folge der Partialsummen (sn )∞ n=k ∞ X =: Reihe der Folge (an )∞ n=k . an n=k ∞ Ist die Reihe der (an )∞ n=k (d.h. die Folge der Partialsummen (sn )n=k ) konvergent, so notiert man dies auch in der Form ∞ X an konvergent (kgt) . n=k In diesem Fall bezeichnet man deren Grenzwert als die Reihensumme lim sn =: n→∞ ∞ X an ∈ IR . n=k Man notiert die Konvergenz der Reihe, bzw. die Konvergenz der Reihe gegen die Reihensumme a auch kurz in der Form ∞ X an ∈ IR bzw. ∞ X an = a ∈ IR . n=k n=k Man bezeichnet die Reihe als divergent , wenn sie nicht konvergent ist. Den Fall der (uneigentlichen) Konvergenz der Reihe gegen +∞, bzw. −∞ notiert man auch kurz in der Form ∞ X an = +∞ (bzw. = −∞) . n=k (2) BEISPIELE: (i) GEOMETRISCHE REIHE Für q ∈ IR mit | q | < 1 gilt ∞ X n=0 (ii) Es gilt ∞ X n=1 qn = 1 . 1−q 1 = 1. n(n + 1) 49 (3) BEMERKUNG (LINEARITÄT): ∞ Es seien (an )∞ n=k , (bn )n=k Folgen in IR und α, β ∈ IR. Gilt dann ∞ X ∞ X an = a ∈ IR , n=k so folgt bn = b ∈ IR, n=k ∞ X (α an + β bn ) = α a + β b. n=k (4) SATZ (CAUCHY-KRITERIUM): Es sei (an )∞ n=k eine Folge in IR. Dann gilt: ∞ X n=k an konvergent ¯ ¯ n ¯ ¯ X ¯ ¯ aj ¯ < ε. ⇔ ∀ ε > 0 ∃ N ∈ k + IN ∀ n, m ≥ N mit n ≥ m : ¯ ¯ ¯ j=m+1 (5) FOLGERUNG (NOTWENDIGE KONVERGENZBEDINGUNG): Es sei (an )∞ n=k eine Folge in IR. Dann gilt: ∞ X an konvergent ⇒ an → 0 (n → ∞). n=k Die notwendige Bedingung in (5) ist nicht hinreichend. (6) BEISPIEL (HARMONISCHE REIHE): ∞ X 1 = +∞ , n n=1 1 → 0 (n → ∞). n (7) REIHEN MIT POSITIVEN GLIEDERN: Es sei (an )∞ n=k eine Folge in IR mit an ≥ 0, (n ≥ k). Dann gilt: ( n ) ∞ X X an = sup aj | n ≥ k ∈ IR. n=k j=k Insbesondere hat man ∞ X n=k an konvergent ⇔ à n X j=k !∞ beschränkt. aj n=k 50 (8) p-ADISCHE DARSTELLUNG DER REELLEN ZAHLEN: Es sei IN 3 p > 1. Dann existiert zu jedem x ∈ IR eine Folge (an )∞ n=k mit an ∈ {0, . . . , p − 1} , (n ≥ k) und an 6= p − 1 fuv n, so daß ∞ X an x=± pn n=k mit + im Falle x ≥ 0 und − im Falle x < 0 gilt. Diese Darstellung ist eindeutig: Ist (ãn )∞ eine weitere Folge mit entsprechenden Eigenn=k̃ schaften, wobei o.E. k̃ ≤ k gelte, so folgt ( 0 , (k̃ ≤ n < k , ãn = an , (n ≥ k) . Speziell im Fall p = 10 liefert dies die Darstellung von x als (unendlichen) Dezimalbruch, den man dann in der Form x = ak ak+1 ...a0 , a1 a2 a3 a4 ... notiert. Speziell im Fall p = 2 erhält man die Dualdarstellung reeller Zahlen. (9) ALTERNIERENDE REIHEN; LEIBNIZ-KRITERIUM: Es sei (an )∞ n=k eine monotone (monoton fallende oder wachsende) Nullfolge reeller Zahlen. ∞ X (−1)n an konvergent. Ist deren Reihensumme Dann ist die (”alternierende”) Reihe n=k gleich a ∈ IR, so gilt für die Reihenreste jeweils ¯ ¯ ¯ ¯ n ∞ ¯ ¯ ¯ X ¯ X ¯ ¯ ¯ ¯ j j a − (−1) a = (−1) a ¯ ¯ j¯ j ¯ ≤ | an+1 | , ¯ ¯ ¯ ¯ (n ≥ k). j=n+1 j=k (10) ABSOLUTE KONVERGENZ: Es sei (an )∞ n=k eine Folge in IR. Man bezeichnet die Reihe der (an )∞ n=k als absolut konvergent und notiert dies ∞ X an absolut konvergent (abs.kgt), n=k genau dann, wenn die Reihe der (| an |)∞ n=k konvergent ist, d.h. wenn ∞ X | an | konvergent . n=k Dann ist auch die Reihe der (an )∞ n=k konvergent, und es gilt für die Reihensummen ¯ ¯ ∞ ∞ ¯ X ¯X ¯ ¯ ≤ | an | . a ¯ n¯ ¯ ¯ n=k n=k 51 ∞ (11) DEFINITION: Es seien (an )∞ n=k und (bn )n=` Folgen in IR. Man bezeichnet ∞ X bn Majorante von ∞ X n=` n=k n=` n=k an ⇔ | an | ≤ bn ffa n, und entsprechend ∞ ∞ X X bn Minorante von an ⇔ 0 ≤ bn ≤ | an | ffa n. (12) VERGLEICHSKRITERIEN FÜR ABSOLUTE KONVERGENZ: ∞ Es seien (an )∞ n=k und (bn )n=` Folgen in IR. Dann gilt: (i) (MAJORANTENKRITERIUM) ∞ ∞ X X bn konvergente Majorante von an n=` ⇒ n=k (ii) (MINORANTENKRITERIUM) ∞ ∞ X X bn divergente Minorante von an n=` an absolut konvergent. n=k ⇒ n=k (13) BEISPIEL: IN 3 k ≥ 2 ⇒ ∞ X ∞ X an nicht absolut konvergent. n=k ∞ X 1 konvergent. k n n=1 (14) WURZELKRITERIUM: Es sei (an )∞ n=k eine Folge in IR. Dann gilt (i) ∞ X p n an absolut konvergent. lim sup | an | < 1 ⇒ n→∞ (ii) lim sup n→∞ n=k p n | an | > 1 ⇒ ∞ X an divergent . n=k (15) QUOTIENTENKRITERIUM: Es sei (an )∞ n=k eine Folge in IR mit an 6= 0, (n ≥ k). Dann gilt: ¯ ¯ ∞ X ¯ an+1 ¯ ¯ ¯ <1 ⇒ an absolut konvergent. (i) lim sup ¯ an ¯ n→∞ n=k ¯ ¯ ∞ X ¯ an+1 ¯ ¯>1 ⇒ (ii) lim inf ¯¯ an divergent. n→∞ an ¯ n=k 52 ∞ (16) REIHENUMORDNUNG: Es seien (an )∞ k und (bn )` Folgen in IR. Gilt bn = aϕ(n) , (n ≥ `) mit einer bijektiven Abbildung ϕ : {`, ` + 1, ...} → {k, k + 1, ...}, ∞ ∞ X X so bezeichnet man die Reihe bn als ”Umordnung” der Reihe an . n=` n=k (17) KLEINER UMORDNUNGSSATZ: Es seien k, ` ∈ IN und ϕ : {`, ` + 1, ...} → {k, k + 1, ...} injektiv. Weiter sei (an )∞ k eine Folge in IR mit ∞ X an absolut kgt. n=k Dann ist ∞ X aϕ(n) absolut kgt n=` und im Fall ϕ bijektiv gilt zudem ∞ X aϕ(n) = ∞ X an . n=k n=` (18) DEFINITION: Es sei (an )∞ k eine Folge in IR. ∞ X an als ”unbedingt konvergent”, falls jede Umordnung dieser Man bezeichnet die Reihe n=k Reihe konvergent ist. Man bezeichnet sie als ”bedingt konvergent”, falls sie konvergent aber nicht unbedingt konvergent ist. (19) RIEMANNSCHER UMORDNUNGSSATZ: Es sei (an )∞ k eine Folge in IR mit ∞ X an konvergent aber nicht absolut konvergent. n=k Dann gibt es zu jedem c ∈ IR eine Umordnung ∞ X bn von n=` ∞ X ∞ X an mit n=k bn = c. n=` (20) FOLGERUNG: Für jede Folge (an )∞ k in IR gilt ∞ X n=k an absolut kgt ⇔ ∞ X n=k an unbedingt kgt. 53 Wir kommen nun zu den POTENZREIHEN. (21) DEFINITION, SATZ: Es sei (an )∞ n=0 eine Folge in IR und x0 ∈ IR. Dann heißt für x ∈ IR ∞ X an (x − x0 )n Potenzreihe um x0 mit den Koeffizienten an . n=0 Als Konvergenzradius dieser Potenzreihe bezeichnet man p ρ := 1/ lim sup n | an | ∈ [0, +∞], n→∞ wobei man hier 1/0 := +∞ und 1/ + ∞ := 0 vereinbart. Es gilt für x ∈ IR | x − x0 | < ρ ⇒ ∞ X an (x − x0 )n absolut konvergent, n=0 | x − x0 | > ρ ⇒ ∞ X an (x − x0 )n divergent . n=0 Für | x − x0 | = ρ kann Konvergenz oder Divergenz eintreten. Wir beweisen nun die Darstellung der Exponentialfunktion durch eine Potenzreihe und definieren die trigonometrischen Funktionen Sinus und Cosinus mittels Potenzreihen. (22) SATZ, DEFINITION: Die folgenden Potenzreihen um 0 haben jeweils den Konvergenzradius +∞: ∞ ∞ ∞ X X 1 n X (−1)n (−1)n 2n 2n+1 x , x , x . n! (2n + 1)! (2n)! n=0 n=0 n=0 (i) Für x ∈ IR gilt ∞ X 1 n x = exp(x). n! n=0 (ii) Für x ∈ IR definiert man ∞ X n=0 (−1)n x2n+1 =: sin(x) , (2n + 1)! ∞ X (−1)n 2n x =: cos(x). (2n)! n=0 Die hierdurch definierten Funktionen bezeichnet man sin : IR → IR Sinus , cos : IR → IR Cosinus . 54 3 STETIGE FUNKTIONEN 3.1 EINIGE TOPOLOGISCHE GRUNDBEGRIFFE Wir wollen zunächst den Umgebungsbegriff einführen. In 2.1 (4) hatten wir für a ∈ IR und IR 3 ε > 0 Kε (a) := { x ∈ IR | | x − a | < ε } = ]a − ε, a + ε[ definiert und dies als (offene) ε-Umgebung von a bezeichnet. Zweckmäßigerweise bezeichnen wir für a ∈ {+∞ , −∞} und IR 3 ε > 0 1 1 Kε (+∞) := ] , +∞] bzw. Kε (−∞) := [−∞, − [ ε ε als (offene) ε-Umgebung von +∞ bzw. von −∞. Hiermit können wir nun einheitlich definieren (1) DEFINITION, BERMERKUNG: Es sei X = IR oder X = IR. Man definiert für a ∈ X und U ⊂ X U Umgebung von a (in X) :⇔ ∃ ε > 0 : Kε (a) ⊂ U . Weiter bezeichnet man für a ∈ X Ua := { U ⊂ X | U Umgebung von a } als Umgebungssystem von a (in X) . Dieses besitzt die folgenden EIGENSCHAFTEN: ∀a ∈ X : [U.0] : Ua 6= ∅ [U.1] : ∀ U ∈ Ua : a ∈ U [U.2] : ∀ U1 , U2 ∈ Ua : U1 ∩ U2 ∈ Ua [U.3] : ∀ U ∈ Ua ∀ V ⊂ X : U ⊂ V ⇒ V ∈ U a [U.4] : ∀ U ∈ Ua ∃ V ∈ Ua ∀ x ∈ V : U ∈ Ux . Schließlich gilt folgendes ”Trennungsaxiom” ∀ a, a0 ∈ X mit a 6= a0 ∃ U ∈ Ua ∃ U 0 ∈ Ua0 : U ∩ U 0 = ∅ . 55 (2) DEFINITION, BEMERKUNG: Es sei X = IR oder X = IR. Für M ⊂ X definiert bzw. hat man M offen :⇔ ∀ a ∈ M ∃ ε > 0 : Kε (a) ⊂ M ⇔ ∀ a ∈ M : M Umgebung von a. Das System der offenen Mengen in X bezeichnen wir mit O := { M ⊂ X | M offen } . Hierfür gilt: [O.0] : [O.1] : ∅ ∈ O, X ∈ O, [ ∀M ⊂ O : M ∈ O, M ∈M [O.2] : ∀ M1 , M2 ∈ O : M1 ∩ M2 ∈ O. BEISPIELE: Es seien α, β ∈ IR. Das Intervall ]α, β[ ist eine offene Menge in IR. Die Intervalle ]α, β[, ]α, +∞], [−∞, β[ sind offene Mengen in IR . (3) DEFINITION, BEMERKUNG: Es sei X = IR oder X = IR. (i) Für M ⊂ X und a ∈ X heißt: a Berührpunkt (Bp) von M (in X) ⇔ ⇔ :⇔ ∀ ε > 0 : Kε (a) ∩ M 6= ∅ ∀ U ∈ Ua : U ∩ M 6= ∅ ∃ (xn )∞ n=1 Folge in M mit xn → a a Häufungspunkt (Hp) von M (in X) :⇔ a Bp von M \ {a} ⇔ ∃ (xn )∞ n=1 Folge in M \ {a} mit xn → a a isolierter Punkt von M (n → ∞) . :⇔ ∃ ε > 0 : Kε (a) ∩ M = {a} ⇔ ∃ U ∈ Ua : U ∩ M = {a}. (n → ∞) . 56 (ii) Man bezeichnet die Menge der Berührpunkte von M in X mit Bp(M ) := { x ∈ X | x Bp von M } ( =: M ) auch als Abschluß von M (in X), bzw. als abgeschlossene Hülle von M (in X). Offenbar gilt M ⊂ Bp(M ). Man bezeichnet weiter die Menge der Häufungspunkte von M in X mit Hp(M ) := { x ∈ X | x Hp von M } ( =: M • ). Offenbar gilt Bp(M ) = M ∪ Hp(M ) = { x ∈ X | x isol. Pkt von M } ∪ Hp(M ) . (iii) M heißt ”abgeschlossen” (in X) ⇔ Hp(M ) ⊂ M ⇔ :⇔ Bp(M ) ⊂ M ∀ (xn )∞ n=k konvergente Folge in M : lim xn ∈ M . n→∞ (4) SATZ: Es sei X = IR oder X = IR. Für M ⊂ X gilt: (i) Bp(M ) abgeschlossen (ii) M abgeschlossen (bzw. offen) ⇔ ∼ M := X \ M offen (bzw. abgeschlossen). (5) BEMERKUNG: Es sei X = IR oder X = IR. Weiter seien ∅ 6= M ⊂ X, und es bezeichne a := inf(M ) sowie b := sup(M ). (i) Es gilt {a, b} ∩ X ⊂ Bp(M ) . Insbesondere folgt im Fall M abgeschlossen a ∈ X ⇒ a = min(M ) , b ∈ X ⇒ b = max(M ) . (ii) Es sei M ein Intervall. Dann gilt Bp(M ) = [a, b] ∩ X und damit insbesondere M abgeschlossen ⇔ {a, b} ∩ X ⊂ M ⇔ M = [a, b] ∩ X. Für α, β ∈ IR ist das Intervall [α, β] abgeschlossen in IR. Für α, β ∈ IR sind die Intervalle [α, β] , ] − ∞, β] , [α, +∞[ abgeschlossen in IR. 57 3.2 KONVERGENZ UND STETIGKEIT Wir beginnen mit der Konvergenz von Funktionen. (1) DEFINITION, BEMERKUNG: Es sei X = IR oder X = IR. Wir betrachten f : X ⊃ Df → X , a ∈ Hp(Df ). (i) Man definiert bzw. hat für b ∈ X: f (x) konvergiert gegen b für x gegen a :⇔ f (x) → b (x → a) :⇔ ∀ ε > 0 ∃ δ > 0 ∀ x ∈ Df \ {a} : x ∈ Kδ (a) ⇒ f (x) ∈ Kε (b) ⇔ ∀ V ∈ Ub ∃ U ∈ Ua ∀ x ∈ Df \ {a} : x ∈ U ⇒ f (x) ∈ V ⇔ ∀ (xn )∞ n=k Folge in Df \ {a} : xn → a (n → ∞) ⇒ f (xn ) → b (n → ∞) . In diesem Falle ist b eindeutig bestimmt. Dies rechtfertigt dann, b =: lim f (x) x→a als ”Grenzwert von f für x gegen a” zu bezeichnen. (ii) Man definiert f konvergent (kgt) für x gegen a :⇔ ∃ b ∈ X : f (x) → b (x → a) . Im Fall a ∈ {+∞, −∞} oder b ∈ {+∞, −∞} spricht man auch von uneigentlicher Konvergenz. (1’) SPEZIALFÄLLE: (i) Sind in der Situation von (1) (i) sowohl a ∈ IR als auch b ∈ IR, so gilt f (x) → b (x → a) ⇔ ∀ ε > 0 ∃ δ > 0 ∀ x ∈ Df : 0 < | x − a | < δ ⇒ | f (x) − b | < ε. (ii) (Folgenkonvergenz) Es sei f = (xn )∞ n=k eine Folge reeller Zahlen und X = IR. Dann ist Df = k + IN, a := +∞ ∈ Hp(Df ), und es gilt für b ∈ X f (x) → b (x → a) ⇔ xn → b (n → ∞). Die Rechenregeln für konvergente Folgen übertragen sich in naheliegender Weise auf konvergente Funktionen. Wir verzichten auf eine explizite Notierung. 58 Wir kommen nun zur Stetigkeit. (2) DEFINITION, BEMERKUNG: Es sei X = IR oder X = IR. Wir betrachten f : X ⊃ Df → X . (i) Für a ∈ Df definiert bzw. hat man f stetig in a :⇔ ∀ ε > 0 ∃ δ > 0 ∀ x ∈ Df : x ∈ Kδ (a) ⇒ f (x) ∈ Kε (f (a)) ⇔ ∀ V ∈ Uf (a) ∃ U ∈ Ua ∀ x ∈ Df : x ∈ U ⇒ f (x) ∈ V ⇔ ∀ (xn )∞ n=k Folge in Df : xn → a (n → ∞) ⇒ f (xn ) → f (a) ⇔ (n → ∞) [ a ∈ Hp(Df ) ⇒ f (x) → f (a) (x → a) ] . (ii) Weiter definiert man f stetig :⇔ ∀ a ∈ Df : f stetig in a . (3) BEISPIELE: Es sei X = IR oder X = IR. (i) Für b ∈ X ist die konstante Funktion X 3 x → b ∈ X stetig . (ii) Für M ⊂ X ist die Identität idM : X ⊃ M 3 x → x ∈ X stetig. (iii) Die Betragsfunktion | . | : IR 3 x → | x | ∈ IR ist stetig. (iv) Für α ∈ IR ist die Multiplikation α• : IR 3 x → α x ∈ IR stetig. 1 1 (v) Die Quotientenbildung : IR∗ 3 x → ∈ IR ist stetig. • x 1 Es gilt → 0 (x → ±∞). x (vi) Für k ∈ IN∗ ist die k-te Potenz IR 3 x → xk ∈ IR stetig. Für k gerade gilt xk → +∞ (x → ±∞), für k ungerade xk → ±∞ (x → ±∞) . (vii) Die Exponentialfunktion exp : IR → IR ist stetig. Für k ∈ IN gilt xk exp(x) → 0 (x → −∞) sowie x−k exp(x) → +∞ (x → +∞) . (4) DIE KOMPOSITION VON ZWEI FUNKTIONEN: Es sei X = IR oder X = IR. Wir betrachten für f : X ⊃ Df → X , g : X ⊃ Dg → X die Komposition g ◦ f : X ⊃ Dg◦f 3 x → g(f (x)) ∈ X 59 mit Dg◦f = { x ∈ Df | f (x) ∈ Dg } = f −1 (Dg ). Für a ∈ Dg◦f gilt dann f in a stetig ∧ g in b = f (a) stetig ⇒ g ◦ f in a stetig. Insbesondere hat man damit f stetig ∧ g stetig ⇒ g ◦ f stetig. Die Beispiele (3) in Verbindung mit (4) liefern unmittelbar Konvergenz- und Stetigkeitsaussagen für die folgenden Funktionen. (5) BEISPIELE, DEFINITIONEN: Es sei X = IR oder X = IR. (i) Für M ⊂ X und f : X ⊃ Df → X bezeichnet man f |M : X ⊃ Df ∩ M 3 x → f (x) ∈ X als Einschränkung von f auf M . Diese läßt sich in der Form f |M = f ◦ idM darstellen. (ii) Für f : IR ⊃ Df → IR definiert man den Betrag von f durch | f (.) | : X ⊃ Df 3 x → | f (x) | ∈ IR . Offenbar ist | f (.) | = | . | ◦ f . (iii) Für f : X ⊃ Df → IR und α ∈ IR definiert man das α-fache von f durch α f : X ⊃ Df 3 x → α f (x) ∈ IR. Offenbar ist α f = (α•) ◦ f . Insbesondere bezeichnet man −f := (−1) f. (iv) Für f : X ⊃ Df → IR definiert man mit M := { x ∈ Df | f (x) 6= 0 } das Reziproke von f 1 Offenbar gilt = f µ ¶ 1 ◦ f. • 1 1 : X⊃M 3x→ ∈ IR. f f (x) 60 (6) SUMME, DIFFERENZ, PRODUKT UND QUOTIENT VON FUNKTIONEN: Mit X = IR oder X = IR seien f : X ⊃ Df → IR, g : X ⊃ Dg → IR betrachtet. Man definiert f ± g bzw. f · g : X ⊃ Df ∩ Dg 3 x → f (x) ± g(x) bzw. f (x) · g(x) ∈ IR. Weiter definiert man hiermit f 1 := f · . g g Es gilt damit D f = { x ∈ Df ∩ Dg | g(x) 6= 0 }. g Aus den Rechenregeln für Folgen ergeben sich in naheliegender Weise entsprechende Rechenregeln bzgl. Konvergenz und Stetigkeit der hier definierten Funktionen. Z.B. gilt für a ∈ Df ∩ Dg = Df ±g = Df ·g , bzw. für a ∈ D f g f und g stetig in a ⇒ f ± g und f · g stetig in a , bzw. f stetig in a g und damit insbesondere f und g stetig ⇒ f ± g , f · g und f stetig. g (7) POLYNOME UND RATIONALE FUNKTIONEN: (i) Es seien k ∈ IN und α0 , . . . , αk ∈ IR. Wir bezeichnen die Funktion p : IR 3 x → p(x) := k X ακ xκ ∈ IR κ=0 als Polynom (bzw. Polynomfunktion) mit den Koeffizienten α0 , . . . , αk . Man bezeichnet Np := { x ∈ IR | p(x) = 0 } als die Nullstellenmenge von p. Diese enthält höchstens k voneinander verschiedene Elemente, ist also endlich. Im Fall αk 6= 0 heißt αk der führende Koeffizient von p und k der Grad von p. Als Grad des Nullpolynoms p : IR 3 x → 0 ∈ IR verabreden wir −∞. Jedes Polynom p ist stetig. Zudem existieren die Grenzwerte lim p(x) ∈ IR. x→±∞ 61 (ii) Es seien p, q Polynome mit q 6= 0. Wir bezeichnen dann f := Es gilt Df = IR \ Nq . p als rationale Funktion. q p ist stetig. q Zudem existieren die Grenzwerte lim f (x) ∈ IR. Jede rationale Funktion f = x→±∞ Wir betrachten schließlich (8) DURCH POTENZREIHEN DEFINIERTE FUNKTIONEN: Es seien (a)∞ n=0 eine Folge in IR und ρ der Konvergenzradius der Potenzreihe ∞ X an xn . n=0 Gilt ρ > 0, so ist ∞ X f : ] − ρ, ρ[ 3 x → an xn ∈ IR stetig. n=0 (9) BEMERKUNG: Die Funktionen sin : IR → IR und cos : IR → IR sind stetig. (10) EINSEITIGE GRENZWERTE, EINSEITIGE STETIGKEIT: Es sei X = IR oder X = IR. Wir betrachten f : X ⊃ Df → X . (i) Für M ⊂ X , a ∈ Hp(M ∩ Df ) und b ∈ X definieren bzw. haben wir f (x) → b (M 3 x → a) :⇔ f |M (x) → b (x → a) ⇔ ∀ (xn )∞ n=k mit (M ∩ Df ) \ {a} 3 xn → a (n → ∞) : f (xn ) → b (n → ∞) und notieren in diesem Fall b =: lim M 3x→a f (x). (ii) Ist a ∈ Hp(Df ∩ ]a, +∞[), bzw. a ∈ Hp(Df ∩] − ∞, a[), so definieren wir für b ∈ X f besitzt in a den rechtsseitigen, bzw. linksseitigen Grenzwert b :⇔ f (x) → b ( ]a, +∞[3 x → a), bzw. ( ] − ∞, a[3 x → a) und notieren in diesem Fall b =: lim f (x) =: f (a+) , a<x→a bzw. b =: lim f (x) =: f (a−). a>x→a (iii) Ist a ∈ Df , so bezeichnet man f rechtsseitig, bzw. linksseitig stetig in a :⇔ f | [a,+∞[ , bzw. f | ]−∞,a] stetig in a. 62 BEISPIELE: 1 (i) lim = +∞ , 0<x→0 x lim 0>x→0 1 = −∞ . x (ii) Die Gaußsche Klammer [ . ] : IR 3 x → [x] ∈ IR ist in jedem Punkt a ∈ IR \ ZZ stetig, in jedem Punkt a = n ∈ ZZ rechtsseitig stetig und es gilt lim [x] = [n−] = n − 1 . n>x→n (11) BEMERKUNG: Es sei X = IR oder X = IR. Wir betrachten f : X ⊃ Df → X , a ∈ IR . (i) Existieren die einseitigen Grenzwerte f (a+) sowie f (a−) und gilt f (a+) = f (a−) =: b, so folgt f (x) → b (x → a). (ii) f in a rechtsseitig und linksseitig stetig ⇔ f in a stetig. (12) MONOTONE FUNKTIONEN: Es sei X = IR oder X = IR. Wir betrachten f : X ⊃ Df → X . (i) Man bezeichnet: f monoton wachsend, bzw. streng monoton wachsend :⇔ ∀ x1 , x2 ∈ Df mit x1 < x2 : f (x1 ) ≤ f (x2 ), bzw. f (x1 ) < f (x2 ). Entsprechend definiert man monoton fallend und streng monoton fallend . Offenbar gilt f (streng) monoton wachsend ⇔ −f (streng) monoton fallend. (ii) Ist f monoton wachsend oder monoton fallend, so existiert für a ∈ Hp(Df ∩ ]a, +∞[ ) der rechtsseitige Grenzwert f (a+) ∈ IR und für a ∈ Hp(Df ∩ ] − ∞, a[ ) der linksseitige Grenzwert f (a−) ∈ IR. 63 (13) LIMES INFERIOR, LIMES SUPERIOR VON FUNKTIONEN: Es sei X = IR oder X = IR. Weiter seien f : X ⊃ Df → X , a ∈ Hp(Df ) . Hiermit betrachten wir jeweils für ε > 0 Mε := { f (x) | x ∈ Kε (a) ∩ (Df \ {a}) } = 6 ∅. Wir definieren bzw. haben lim inf f (x) := lim inf(Mε ) = sup { inf(Mε ) | ε > 0 } x→a 0<ε→0 und bezeichnen dies als ”limes inferior” von f für x → a. Entsprechend definieren bzw. haben wir lim sup f (x) := lim sup(Mε ) = inf { sup(Mε ) | ε > 0 } x→a 0<ε→0 und bezeichnet dies als limes superior von f für x → a . (14) BEMERKUNG: Es sei X = IR oder X = IR. Weiter seien f : X ⊃ Df → X , a ∈ Hp(Df ) , b ∈ X . Dann gilt lim inf f (x) = lim sup f (x) = b ⇔ lim f (x) = b. x→a x→a x→a 64 3.3 HAUPTSÄTZE ÜBER STETIGE FUNKTIONEN (1) SATZ: Es seien X = IR oder X = IR und f : X ⊃ Df → X stetig . Ist dann Df beschränkt und abgeschlossen, so ist auch Wf := { f (x) | x ∈ Df } beschränkt und abgeschlossen . Insbesondere nimmt dann f ein Maximum und ein Minimum an: ∃ α, β ∈ Df ∀ x ∈ Df : f (α) ≤ f (x) ≤ f (β) . (2) BEISPIEL: Es sei p ein Polynom vom Grad k mit führendem Koeffizienten αk . Ist k gerade, so nimmt p im Fall αk > 0 ein Minimum, bzw. im Fall αk < 0 ein Maximum an: ∃ α ∈ IR : p(α) = inf(Wp ), bzw. = sup(Wp ) . (3) SATZ: Es seien X = IR oder X = IR und f : X ⊃ Df → X stetig . Ist dann Df ein Intervall , so ist auch Wf ein Intervall . Insbesondere gilt dann der Zwischenwertsatz: Zu jeweils α, β ∈ Df mit f (α) 6= f (β) und c ∈ ]f (α), f (β)[ existiert ein γ ∈ ]α, β[ ⊂ Df mit f (γ) = c. (4) BEISPIEL: Es sei p ein Polynom vom Grad k. Ist k ungerade, so gilt Wp = IR, d.h. ∀ b ∈ IR ∃ α ∈ IR : p(α) = b . Speziell gilt damit ∃ α ∈ IR : p(α) = 0, d.h. p besitzt mindestens eine Nullstelle. 65 (5) DEFINITION von π: Die Funktion cos : IR → IR besitzt (genau) eine kleinste positive Nullstelle α: √ α = min { x ∈ IR+ | cos(x) = 0 } ∈ ] 2, 2[ . Man bezeichnet π := 2α . (6) SATZ: Es seien X = IR oder X = IR und f : X ⊃ Df → X monoton wachsend (bzw. fallend) . Ist dann Wf ein Intervall, so ist f stetig. Eine wichtige Folgerung aus (3) und (6) ist der folgende (7) SATZ ÜBER DIE UMKEHRFUNKTION: Es sei X = IR oder X = IR. Weiter seien f : X ⊃ Df → X stetig und streng monoton wachsend (bzw. fallend), Df Intervall. Dann existiert die Umkehrfunktion f −1 : X ⊃ Df −1 → X . Für diese gilt: f −1 stetig und streng monoton wachsend (bzw. fallend), Df −1 = Wf Intervall. (8) BEISPIEL: Es sei 2 ≤ k ∈ IN. Die k-te Wurzel √ k · : [0, +∞[3 x → √ k x ∈ IR ist die Umkehrfunktion der auf [0, +∞[ eingeschränkten k-ten Potenz [0, +∞[ 3 x → xk ∈ IR. Diese erfüllt offenbar die Voraussetzungen von (7) mit ”streng monoton wachsend” und Wf = [0, +∞[. Insbesondere ist damit die k-te Wurzel eine stetige Funktion. 66 (9) LOGARITHMUS-FUNKTION: Die Exponentialfunktion exp : IR → IR ist stetig und streng monoton wachsend mit Wexp = ]0, +∞[ . Daher folgt mit (7) die Existenz der Umkehrfunktion exp−1 : ]0, +∞[ → IR stetig und streng monoton wachsend. Man bezeichnet exp−1 =: ln als (natürlichen) Logarithmus oder Logarithmus zur Basis e. EIGENSCHAFTEN: (i) ln(x y) = ln(x) + ln(y) , (ii) ln(1) = 0, (x, y ∈ ]0, +∞[ ; (Funktionalgleichung). ln(e) = 1 . (iii) ln(x) → +∞ (x → +∞), ln(x) → −∞ (x → 0) . (10) DIE ALLGEMEINE POTENZ: Für a ∈ IR mit a > 0 und x ∈ IR definieren wir die (allgemeine) Potenz ax durch ax := exp(x ln(a)) ∈ IR. Diese Bezeichnung ist gerechtfertigt, da sie für x = n ∈ ZZ mit der alten Definitionen übereinstimmt. EIGENSCHAFTEN: (i) ax ay = ax+y , (ii) ax > 0, (x, y ∈ IR , a > 0) ; (ax )y = axy , (iii) ax bx = (a b)x , (iv) ex = exp(x) , (x, y ∈ IR , a > 0); (x ∈ IR, a > 0, b > 0) ; √ 1x = 1 , (x ∈ IR) ; k a = a1/k , (a > 0 , 2 ≤ k ∈ IN) ; (v) IR 3 x → ax ∈ IR stetig, (a > 0); (vi) ]0, +∞[ 3 a → ax ∈ IR stetig, (x ∈ IR); ax → 0 (a → 0), (x > 0); man definiert für x > 0 daher 0x := 0; ax → +∞ (a → 0), (x < 0). (11) BEMERKUNG: Für f : IR → IR mit f (1) =: a 6= 0 gilt: f in 0 rechtsseitig stetig ∧ f (x + y) = f (x) · f (y), (x, y ∈ IR) ⇔ a > 0 ∧ f (x) = ax , (x ∈ IR). 67 ERGÄNZUNG: GLEICHMÄSSIGE STETIGKEIT Wir betrachten hier noch einmal ganz allgemein stetige Funktionen f : IR ⊃ Df → IR . Aus der Definition der Stetigkeit in 3.2 (2) liest man ab: ∀ε > 0 ∀a ∈ D ∃δ > 0 ∀x ∈ D : f f f stetig ⇔ | x − a | < δ ⇒ | f (x) − f (a) | < ε . Die Grösse δ hängt hier offenbar sowohl von δ als auch von a ab. Von besonderem Interesse ist jedoch auch die Situation, wo δ nur von ² und nicht von a abhängt. (12) DEFINITION, BEMERKUNG: Für f : IR ⊃ Df → IR definieren wir ∀ε > 0 ∃δ > 0 ∀x , x ∈ D : 1 2 f f heißt ”gleichmäßig stetig” ⇔ | x1 − x2 | < δ ⇒ | f (x1 ) − f (x2 ) | < ε . Weiter definieren wir ∃γ ≥ 0 ∀x , x ∈ D : 1 2 f f Lipschitz-stetig ⇔ | f (x1 ) − f (x2 ) | ≤ γ | x1 − x2 | . Offenbar gilt f Lipschitz-stetig ⇒ f gleichmäßig stetig ⇒ f stetig . Wichtig ist der folgende (13) SATZ: Es sei f : IR ⊃ Df → IR stetig. Aus Df beschränkt und abgeschlossen , folgt dann f gleichmäßig stetig . 68 4 DIFFERENTIALRECHNUNG 4.1 GRUNDLAGEN Wir betrachten in folgenden Funktionen von IR nach IR f : IR ⊃ Df → IR. Es sei a ∈ Df . Die Stetigkeit von f in a ∈ Hp(Df ) bedeutet gerade f (x) → f (a) (x → a) , bzw. f (x) − f (a) → 0 (x → a). Um das lokale Verhalten von f bei a genauer zu erfassen und zu beschreiben, führt man den Begriff der Differenzierbarkeit von f in a ein. Man betrachtet dazu den Differenzenquotienten von f in a ∆a f : IR ⊃ Df \ {a} 3 x → f (x) − f (a) ∈ IR. x−a Die Differenzierbarkeit von f in a bedeutet nun die Existenz des Grenzwertes lim ∆a f (x) =: b ∈ IR. x→a Für die Notierung der obigen Konvergenzaussagen war jeweils a ∈ Hp(Df ) notwendig. Bei der Definition der Differenzierbarkeit von f in a wollen wir jedoch für a etwas mehr verlangen, nämlich die Existenz eines δ > 0 mit Kδ (a) =]a−δ, a+δ[ ⊂ Df . Wir bezeichnen in dieser Situation a als inneren Punkt von Df . Offenbar gilt dann a ∈ Hp(Df ). Allgemeiner definieren wir in Ergänzung zu den topologischen Grundbegriffen in 3.1 (1) DEFINITION, BEMERKUNG: Es sei X = IR oder X = IR und M ⊂ X. (i) Ein a ∈ X heißt ”innerer Punkt” von M :⇔ M ∈ Ua ⇔ ∃ ε > 0 : Kε (a) ⊂ M . (ii) Die Menge der inneren Punkte von M Int(M ) := { x ∈ X | M ∈ Ux } ⊂ X wird als das ”Innere” von M bezeichnet. Offenbar gilt Int(M ) ⊂ M. (iii) M heißt ”offen” (in X) :⇔ M ⊂ Int(M ) ⇔ M = Int(M ). 69 (2) DEFINITION, BEMERKUNG: Es seien f : IR ⊃ Df → IR und a ∈ Int(Df ). (i) Man definiert bzw. hat: f differenzierbar in a :⇔ ⇔ ⇔ ( diff ’bar in a ) ∃ b ∈ IR mit f (x) − f (a) →b x−a (x → a), ∃ ϕ : IR ⊃ D → IR stetig in a mit f f (x) = f (a) + (x − a) ϕ(x), (x ∈ Df ), ∃ b ∈ IR ∃ r : IR ⊃ D → IR mit r(x) → 0 f x−a f (x) = f (a) + (x − a) b + r(x), (x ∈ Df ). (x → a) und In dieser Situation bezeichnet man den (eindeutig bestimmten) Grenzwert bzw. den Wert lim x→a f (x) − f (a) = ϕ(a) = b ∈ IR x−a als ”Ableitung” von f in a – bzw. auch als ”Differentialquotient” von f in a und notiert diesen in der Form b =: f 0 (a) =: df (a) . dx (ii) Die durch f 0 : IR ⊃ Df 0 := {x ∈ Df | f in x diff ’bar } 3 x → f 0 (x) ∈ IR definierte Funktion wird als (erste) Ableitung von f bezeichnet. (iii) Man definiert bzw. hat: f differenzierbar ( diff ’bar ) :⇔ ∀ x ∈ Df : f in x diff ’bar ⇔ Df = Df 0 sowie f stetig-differenzierbar ( st.diff ’bar ) ⇔ f diff ’bar und f 0 stetig. Den Sachverhalt f st.diff ’bar notiert man auch gelegentlich in der Form f ∈ C 1 und sagt f ist eine C 1 -Funktion . (3) BEMERKUNG: f in a diff ’bar ⇒ f in a stetig. 70 (4) BEISPIELE: (i) Es seien α, β ∈ IR und M ⊂ IR. Hiermit sei f : IR ⊃ M 3 x → αx + β ∈ IR definiert. Dann ist f in jedem x ∈ Int(M ) diff ’bar mit f 0 (x) = α. (ii) Die Quotientenbildung f := ist diff ’bar mit f 0 (x) = − 1 1 : IR∗ = IR \ {0} 3 x → ∈ IR . x 1 . x2 (iii) Die Betragsfunktion f := | . | : IR 3 x → | x | ∈ IR ist in jedem x ∈ IR∗ diff ’bar mit ( f 0 (x) = +1 , (x > 0), −1 , (x < 0). In x = 0 ist f nicht diff ’bar. (iv) Für k ∈ IN∗ ist die k-te Potenz f : IR 3 x → xk ∈ IR diff ’bar mit f 0 (x) = k xk−1 . (v) Die Exponentialfunktion exp : IR → IR ist diff ’bar mit exp0 = exp . 71 (5) RECHENREGELN: Es seien f : IR ⊃ Df → IR, g : IR ⊃ Dg → IR . (i) Für a ∈ Df ∩ Dg und α, β ∈ IR gilt: f und g in a diff ’bar ⇒ αf + βg in a diff ’bar und (αf + βg)0 (a) = αf 0 (a) + βg 0 (a) . (ii) Für a ∈ Df ∩ Dg gilt: f und g in a diff ’bar ⇒ f · g in a diff ’bar und (f · g)0 (a) = f 0 (a) g(a) + f (a) g 0 (a) (Produktregel) . (iii) Für a ∈ D f = Df ∩ {x ∈ Dg | g(x) 6= 0} gilt: g f f und g in a diff ’bar ⇒ in a diff ’bar und g µ ¶0 f f 0 (a) g(a) − f (a) g 0 (a) (a) = g g(a)2 (Quotientenregel) . (iv) Für a ∈ Dg◦f = f −1 (Dg ) gilt: f in a diff ’bar und g in b := f (a) diff ’bar ⇒ g ◦ f in a diff ’bar und (g ◦ f )0 (a) = g 0 (b) f 0 (a), (Kettenregel). (6) FOLGERUNGEN, BEISPIELE: (i) Polynome sind differenzierbar. (ii) Rationale Funktionen sind diff ’bar. (iii) Die hyperbolischen Funktionen cosh : IR 3 x → 12 (exp(x) + exp(−x)) ∈ IR sinh : IR 3 x → 12 (exp(x) − exp(−x)) ∈ IR sind diff ’bar mit cosh0 = sinh, sinh0 = cosh . (iv) Für a > 0 ist f : IR 3 x → ax ∈ IR diff ’bar mit f 0 (x) = ln(a) f (x). 72 (7) DIFFERENZIERBARKEIT DER UMKEHRFUNKTION: Es seien f : IR ⊃ Df → IR stetig und streng monoton wachsend (bzw. fallend) und Df ein Intervall. Dann existiert nach 3.3 (7) die Umkehrfunktion f −1 : IR ⊃ Df −1 → IR stetig und streng monoton wachsend (bzw. fallend), und es ist Df −1 = Wf ein Intervall. Ist nun a ∈ Int(Df ) und f in a diff ’bar mit f 0 (a) 6= 0, so ist f −1 in b := f (a) diff ’bar mit (f −1 )0 (b) = 1 f 0 (a) . (8) FOLGERUNGEN, BEISPIELE: (i) Die Logarithmusfunktion ln ist diff ’bar mit ln0 (x) = 1 , x (ii) Für λ ∈ IR ist f : ]0, +∞[ 3 x → xλ ∈ IR diff ’bar mit f 0 (x) = λ xλ−1 , (x > 0). (x > 0). 73 (9) DEFINITION UND EIGENSCHAFTEN DER AREA-FUNKTIONEN: Aufgrund der Eigenschaften der hyperbolischen Funktionen (vgl. (6) (iii) und die Übungen) existieren die folgenden Umkehrfunktionen arsinh := sinh−1 : IR → IR Area-Sinus arcosh := (cosh |[0,+∞[ )−1 : [1, +∞[→ IR Area-Cosinus Diese sind stetig, streng monoton wachsend, bijektiv. Weiter gilt arsinh’ : IR 3 x → (1 + x2 )−1/2 ∈ IR arcosh’ : ]1, +∞[3 x → (x2 − 1)−1/2 ∈ IR . (10) DIFFERENTIATION VON POTENZREIHEN: Es sei (an )∞ n=0 eine Folge in IR und ρ ∈ ]0, +∞] der Konvergenzradius von ∞ X a n xn . n=0 Dann ist f : ] − ρ, ρ[ 3 x → ∞ X an xn ∈ IR n=0 diff ’bar mit 0 f (x) = ∞ X an nxn−1 (| x | < ρ) . n=1 Mit (10) folgt auch noch einmal die Differenzierbarkeit für Polynome und für die Exponentialfunktion. (11) FOLGERUNGEN, BEISPIELE: Die trigonometrischen Funktionen sin und cos sind diff ’bar mit sin0 = cos, cos0 = − sin . 74 4.2 LOKALE EXTREMA, MITTELWERTSÄTZE, FOLGERUNGEN Es seien f : IR ⊃ Df → IR, a ∈ Df . Wir wollen zunächst aus der Differenzierbarkeit von f in a Folgerungen für das lokale Verhalten von f bei a ziehen. Wir definieren (1) DEFINITION: (i) f hat in a ein lokales Minimum (bzw. Maximum) :⇔ ∃ U ∈ Ua ∀ x ∈ U ∩ Df : f (x) ≥ f (a) Gilt sogar ∀ x ∈ U ∩ Df \ {a} : f (x) > f (a) (bzw.: . . . f (x) ≤ f (a)). (bzw.: . . . f (x) < f (a)), so spricht man von einem strikten lokalen Minimum (bzw. Maximum). Offenbar gilt f hat in a ein (striktes) lokales Minimum ⇔ −f hat in a ein (striktes) lokales Maximum. Weiter definiert man: f hat in a ein (striktes) lokales Extremum :⇔ f hat in a ein (striktes) lokales Minimum oder ein (striktes) lokales Maximum. (ii) f wächst in a :⇔ ∃ U ∈ Ua ∀ x ∈ U ∩ Df : f (x) < f (a), (x < a) und f (x) > f (a), (x > a). Entsprechend definiert man f fällt in a . (2) SATZ: Es sei f in a diff ’bar. (i) Gilt f 0 (a) > 0 (bzw. f 0 (a) < 0), so wächst (bzw. fällt) f in a. (ii) (NOTWENDIGE BEDINGUNG FÜR LOKALES EXTREMUM): Hat f in a ein lokales Extremum (Minimum oder Maximum), so gilt f 0 (a) = 0. Die Bedingung f 0 (a) = 0 in (2) (ii) ist nicht hinreichend für ein lokales Extremum; die Funktion f : IR 3 x → x3 ∈ IR erfüllt in a = 0 diese Bedingung, hat dort jedoch kein lokales Extremum. 75 Mithilfe der lokalen Aussagen von Satz (2) wollen wir nun globale Aussagen gewinnen. Hierbei wird es wichtig sein, daß unsere Funktionen auf Intervallen definiert sind. Als erstes beweisen wir (3) SATZ VON ROLLE: Es seien a, b ∈ IR mit a < b, und es gelte: f : [a, b] → IR stetig, f (a) = f (b), ∀ x ∈ ]a, b[ : f in x diff ’bar. Dann existiert ein α ∈ ]a, b[ mit f 0 (α) = 0. Hiermit folgt (4) ZWEITER MITTELWERTSATZ DER DIFFERENTIALRECHNUNG: Es seien a, b ∈ IR mit a < b, und es gelte f : [a, b] → IR stetig, g : [a, b] → IR stetig, ∀ x ∈ ]a, b[ : f und g in x diff ’bar. Dann existiert ein α ∈ ]a, b[ mit (f (b) − f (a)) · g 0 (α) = (g(b) − g(a)) · f 0 (α) . Gilt zudem ∀ x ∈ ]a, b[ : g 0 (x) 6= 0, so folgt g(b) − g(a) 6= 0 und damit f (b) − f (a) f 0 (α) = 0 . g(b) − g(a) g (α) Als Spezialfall ergibt sich (5) ERSTER MITTELWERTSATZ DER DIFFERENTIALRECHNUNG: Es seien a, b ∈ IR mit a < b, und es gelte f : [a, b] → IR stetig, ∀ x ∈ ]a, b[ : f in x diff ’bar. Dann existiert ein α ∈ ]a, b[ mit f (b) − f (a) = f 0 (α) . b−a 76 Die folgenden Sätze und Bemerkungen sind sämtlich Konsequenzen aus den Mittelwertsätzen. (6) SATZ: Es gelte f : IR ⊃ Df → IR stetig, Df Intervall, ∀ x ∈ Int(Df ) : f in x diff ’bar . Existiert dann ein γ ∈ IR+ mit | f 0 (x) | ≤ γ , (x ∈ Int(Df )), so folgt (+) | f (y) − f (x) | ≤ γ | y − x | (y, x ∈ Df ) . Speziell folgt damit f 0 = 0 ⇒ f konstant. Die Bedingung (+) besagt, dass f Lipschitz-stetig ist. (7) CHARAKTERISIERUNG DER EXPONENTIALFUNKTION MITTELS DER DIFFERENTIALGLEICHUNG: Es seien IR ⊃ I offenes Intervall und f : I → IR. Dann gilt: f diff ’bar und f 0 = f ⇐⇒ ∃ b ∈ IR : f (x) = b exp(x), (x ∈ I). Als weitere direkte Folgerung des Mittelwertsatzes (5) beweisen wir eine (hinreichende) BEDINGUNG FÜR MONOTONIE. (8) SATZ: Es gelte f : IR ⊃ Df → IR stetig, Df Intervall, ∀ x ∈ Int(Df ) : f in x diff ’bar. Gilt dann (∗) ∀ x ∈ Int(Df ) : f 0 (x) ≥ 0 (bzw. : . . . ≤ 0), so ist f monoton wachsend (bzw. fallend). Gilt neben (∗) noch (∗∗) ∀ α, β ∈ Df mit α < β ∃ x ∈ ]α, β[ : f 0 (x) 6= 0, so ist f sogar streng monoton wachsend (bzw. fallend). Hinreichend für (∗) und (∗∗) ist offenbar ∀ x ∈ Int(Df ) : f 0 (x) > 0 (bzw.: . . . < 0). 77 Man sieht unmittelbar, daß (∗) auch notwendig für Monotonie ist. Ebenso sind die beiden Bedingungen (∗) und (∗∗) auch notwendig für strenge Monotonie (Beweis !). Im Anschluß an (8) können wir nun unter Beachtung von 3.3 (7) und 4.1 (7) den folgenden SATZ ÜBER DIE UMKEHRFUNKTION notieren: (9) SATZ: Es gelte f : IR ⊃ Df → IR stetig, Df Intervall, ∀ x ∈ Int(Df ) : f in x diff ’bar mit f 0 (x) > 0 (bzw.: · · · < 0). Dann ist f streng monoton wachsend (bzw. fallend), also insbesondere injektiv. Folglich existiert die Umkehrfunktion f −1 : IR ⊃ Df −1 → IR stetig, streng monoton wachsend (bzw. fallend), mit Df −1 = Wf Intervall. Es gilt ∀ y ∈ Int(Df −1 ) : f −1 in y diff ’bar mit (f −1 )0 (y) = 1 f 0 (f −1 (y)) . Wir wollen nun die fundamentalen Eigenschaften der trigonometrischen Funktionen herleiten. Dazu zeigen wir zunächst mittels (6) (10) CHARAKTERISIERUNG VON SINUS UND COSINUS MITTELS DER DIFFERENTIALGLEICHUNG: Es seien IR ⊃ I offenes Intervall, s : I → IR und c : I → IR. Dann gilt: s und c diff ’bar mit s0 = c und c0 = −s s(x) = α sin(x) + β cos(x), ⇐⇒ ∃ α, β ∈ IR : c(x) = α cos(x) − β sin(x), (x ∈ I). Auf (10) läßt sich die gesamte Theorie der trigonometrischen Funktionen aufbauen. Wir zeigen zunächst (11) EIGENSCHAFTEN VON SINUS UND COSINUS: (i) sin(−x) = − sin(x), cos(−x) = cos(x), (x ∈ IR). (ii) (ADDITIONSTHEOREME) sin(x + y) = sin(x) cos(y) + cos(x) sin(y), cos(x + y) = cos(x) cos(y) − sin(x) sin(y), (x, y ∈ IR). 78 Speziell gilt sin(2x) = 2 sin(x) cos(x), 2 2 (x ∈ IR). cos(2x) = cos(x) − sin(x) , (iii) sin(x)2 + cos(x)2 = 1, (x ∈ IR). (iv) Für x ∈ IR gilt sin(x + π2 ) = cos(x), cos(x + π2 ) = − sin(x), sin(x + π) = − sin(x), cos(x + π) = − cos(x), sin(x + 2π) = sin(x), cos(x + 2π) = cos(x) . (v) Es sind [− π2 , π2 ] 3 x → sin(x) ∈ [−1, 1] streng monoton wachsend, bijektiv, [0, π] 3 x → cos(x) ∈ [−1, 1] streng monoton fallend, bijektiv. (vi) Für x ∈ IR gilt sin(x) = 0 ⇔ ∃ n ∈ ZZ : x = n π, cos(x) = 0 ⇔ ∃ n ∈ ZZ : x = (n + 12 ) π. (vii) sin(0) = 0, sin( π6 ) = 12 , sin( π4 ) = √1 , 2 sin( π3 ) = √ 3 . 2 (12) DEFINITION UND EIGENSCHAFTEN DES TANGENS: Man definiert sin cos tan := Tangens , cot := Cotangens . cos sin Es gilt (z.B. für den Tangens): © ª (i) Dtan = x ∈ IR | x 6= (n + 12 ) π, (n ∈ ZZ) . (ii) tan ist diff ’bar mit tan0 (x) = 1 + tan(x)2 = 1 . cos(x)2 (iii) ] − π2 , π2 [ 3 x → tan(x) ∈ IR streng monoton wachsend, bijektiv . (iv) tan(−x) = − tan(x), tan(x + π) = tan(x) (x ∈ Dtan ). √ (v) tan(0) = 0, tan( π6 ) = √13 , tan( π4 ) = 1, tan( π3 ) = 3 . Unter Beachtung von (9) erhält man aus (11) und (12) 79 (13) DEFINITIONEN UND EIGENSCHAFTEN DER ARCUS-FUNKTIONEN: Man definiert ³ ¯ ´ ¯ π π −1 arcsin := sin ¯[− 2 , 2 ] ¡ ¯ ¢−1 arccos := cos ¯[0,π] ¯ ³ ´−1 ¯ arctan := tan ¯]− π2 , π2 [ Arcus-Sinus Arcus-Cosinus Arcus-Tangens . Es gilt dann (i) arcsin : [−1, 1] → [− π2 , π2 ] stetig, streng monoton wachsend, bijektiv, in jedem x ∈] − 1, 1[ diff ’bar mit arcsin0 (x) = (1 − x2 )−1/2 . π − arcsin(x) (x ∈ [−1, 1]). 2 (iii) arctan : IR →] − π2 , π2 [ streng monoton wachsend, bijektiv und diff ’bar mit (ii) arccos(x) = 1 , 1 + x2 arctan0 (x) = (x ∈ IR). (14) REIHENDARSTELLUNGEN: (i) Für x ∈] − 1, 1] gilt ∞ X ln(1 + x) = (−1)n−1 1 n x . n (−1)n−1 1 . n n=1 Insbesondere ist ln(2) = ∞ X n=1 (ii) Es sei λ ∈ IR. Dann gilt für x ∈ ] − 1, 1[ ¶ ∞ µ X λ λ (1 + x) = xn , n (Binomische Reihe). n=0 (iii) Für x ∈ [−1, 1] gilt ¶ ∞ µ X 1 − 12 arcsin(x) = (−1)n x2n+1 . n 2n + 1 n=0 (iv) Für x ∈ [−1, 1] gilt arctan(x) = ∞ X (−1)n n=0 insbesondere ∞ x2n+1 , 2n + 1 X π 1 = arctan(1) = (−1)n . 4 2n + 1 n=0 80 Eine wichtige Anwendung des zweiten Mittelwertsatzes sind die sogenannten DE L’HOSPITALSCHEN REGELN . Sie beinhalten, wie man in gewissen Situationen Grenzwerte von Funktionen beim Vorliegen von unbestimmten Formen wie z.B. 0 , 0 ∞ , ∞ 0 · ∞, ∞ − ∞, etc. mittels Differentiation berechnen kann. (15) SATZ: Es seien a, b ∈ IR mit a < b, und es gelte f : ]a, b[→ IR und g : ]a, b[→ IR diff ’bar ; g 0 (x) 6= 0, (x ∈]a, b[); lim f (x) = lim g(x) ∈ {0, +∞, −∞}. x→b x→b Dann folgt lim x→b f0 (x) =: λ ∈ IR g0 =⇒ lim x→b f (x) = λ . g Eine entsprechende Aussage gilt auch für ]a, b[3 x → a. Eine unmittelbare Folgerung ist (16) BEMERKUNG: Es seien a ∈ IR, ε > 0, und es gelte f, g : Kε (a) → IR stetig, f (a) = g(a) = 0; ∀ x ∈ Kε (a) \ {a} : f und g in x diff ’bar, g 0 (x) 6= 0. Dann folgt f0 (x) → λ ∈ IR (x → a) g0 =⇒ f (x) → λ (x → a). g ANMERKUNGEN ZU (15): Es seien a, b ∈ IR mit a < b und f, g : ]a, b[→ IR diff ’bar. (i) Gilt lim f (x) = lim g(x) ∈ {−∞, +∞}, so kann man die Konvergenz von (f − g)(x) x→b x→b für x → b unter geeigneten Voraussetzungen mittels ³ 1 − g(x) (f − g)(x) = ³ 1 f (x) 1 f (x)·g(x) auf (15) zurückführen. ´ ´ 81 (ii) Gilt lim f (x) = 0 und lim g(x) ∈ {−∞, +∞}, so kann man die Konvergenz von x→b x→b (f · g)(x) für x → b unter geeigneten Voraussetzungen mittels f (x) ´ (f · g)(x) = ³ 1 g(x) auf (15) zurückführen. Die Mittelwertsätze sind z.B. auch in der numerischen Mathematik für die Herleitung von Iterationsverfahren zur Lösung von Gleichungen f (x) = 0 sowie die Gewinnung von entsprechenden Fehlerabschätzungen von Interesse. Wir betrachten im folgenden das NEWTON-VERFAHREN (17) SATZ: Es seien a, b ∈ IR mit a < b, und es gelte f : [a, b] → IR stetig, f (a) < 0 < f (b), ∀ x ∈]a, b[ : f in x diff ’bar, 0 ≤ f 0 (y) − f 0 (x) ≤ γ (y − x), (a < x ≤ y < b) mit γ ∈ IR+ . Dann folgt (i) ∃ ξ ∈ ]a, b[ : f (ξ) = 0. (ii) Es gilt für x ∈]a, ξ[ f (x) < 0 sowie für x ∈]ξ, b[ f 0 (x) ≥ f 0 (ξ) =: β > 0, f (x) γ x̃ := x − 0 ≤ x, 0 ≤ x̃ − ξ ≤ (x̃ − x)2 . f (x) 2β f (x) > 0, (iii) (NEWTONVERFAHREN:) Für beliebiges x0 ∈]a, b[ mit f (x0 ) > 0 ist gemäß (ii) durch xn+1 := xn − f (xn ) , f 0 (xn ) (n ∈ IN) eine Folge (xn )∞ n=0 definiert. Hierfür gilt xn → ξ (n → ∞). Als Fehlerabschätzung hat man 0 ≤ xn − xn+1 ≤ xn − ξ ≤ γ (xn − xn−1 )2 , 2β (n ∈ IN∗ ). 82 4.3 HÖHERE ABLEITUNGEN Es sei wieder f : IR ⊃ Df → IR gegeben. Wir wollen im folgenden höhere Ableitungen von f betrachten. (1) DEFINITION, BEMERKUNGEN: Wir definieren f (0) := f und weiter rekursiv für n ∈ IN f (n+1) := (f (n) )0 . Insbesondere ist f (1) = f 0 . Es heißt dann f (n) =: dn f dxn n-te Ableitung von f . Offenbar gilt Df (n+1) ⊂ Int(Df (n) ), (n ∈ IN). Mittels vollständiger Induktion folgt unmittelbar f (n+m) = (f (n) )(m) , (n, m ∈ IN). Man definiert weiter für n ∈ IN∗ und a ∈ Df (bzw. M ⊂ Df ) f in a (bzw. in M ) n-mal diff ’bar :⇐⇒ a ∈ Df (n) (bzw. M ⊂ Df (n) ); in diesem Fall heißt f (n) dn f (a) = n (a) dx n-te Ableitung von f in a . Für n ∈ IN∗ definiert man weiter f n-mal diff ’bar :⇐⇒ Df (n) = Df sowie f n-mal stetig diff ’bar :⇐⇒ f n-mal diff ’bar und f (n) stetig. Den Sachverhalt f n-mal stetig diff ’bar notiert man auch gelegentlich in der Form f ∈ C n und sagt f ist C n -Funktion . Ist f beliebig oft diff ’bar (d.h. ∀ n ∈ IN : Df (n) = Df ), so notiert man dies auch in der Form f ∈ C ∞ und sagt f ist C ∞ - Funktion . 83 Wir notieren nun die wichtigsten RECHENREGELN bezüglich n-maliger Differenzierbarkeit von zusammengesetzten Funktionen. Man beweist diese sämtlich mittels vollständiger Induktion. (2) RECHENREGELN: Es seien n ∈ IN∗ und f : IR ⊃ Df → IR, g : IR ⊃ Dg → IR. (i) Für a ∈ Df ∩ Dg und α, β ∈ IR gilt: f und g in a n-mal diff ’bar ⇒ α f + β g in a n-mal diff ’bar und (α f + β g)(n) (a) = α f (n) (a) + β g (n) (a) . (ii) Für a ∈ Df ∩ Dg gilt: f und g in a n-mal diff ’bar (n) (f · g) ⇒ f · g in a n-mal diff ’bar und ¶ n µ X n f (n−k) (a) g (k) (a), (a) = k (Leibnizsche Regel). k=0 (iii) Für a ∈ Dg◦f gilt: f in a n-mal diff ’bar und g in f (a) n-mal diff ’bar ⇒ g ◦ f in a n-mal diff ’bar. Mit (iii) erhält man unmittelbar eine Aussage über die n-malige Differenzierbarkeit der Umkehrfunktion. (3) BEMERKUNG: Es seien n ∈ IN∗ und f : IR ⊃ Df → IR n-mal diff ’bar, Df Intervall, ∀ x ∈ Df : f 0 (x) > 0 (bzw.: . . . < 0). Dann ist die (gemäß 4.2 (9) existierende) Umkehrfunktion f −1 : IR ⊃ Df −1 → IR n-mal diff ’bar. 84 (4) DIFFERENTIATION VON POTENZREIHEN: Es sei (an )∞ n=0 eine Folge in IR und ρ ∈ ]0, +∞] der Konvergenzradius von ∞ X a n xn . n=0 Es bezeichne f : ] − ρ, ρ[ 3 x → ∞ X an xn ∈ IR. n=0 Dann ist f beliebig oft diff ’bar. Für k ∈ IN∗ und x ∈ ] − ρ, ρ[ gilt: f (k) (x) = ∞ X an n(n − 1) . . . (n − k + 1)xn−k . n=k Aus (4) folgt insbesondere, daß man die Folge (an )∞ n=0 über f zurückgewinnen kann: an = 1 (n) f (0), n! (n ∈ IN). ∞ Sind daher (an )∞ n=0 und (ãn )n=0 voneinander verschiedene Folgen in IR mit Konvergenzradien ρ > 0 und ρ̃ > 0, so sind auch die zugehörigen Funktionen f und f˜ voneinander verschieden. (5) BEMERKUNG: Ein Polynom p vom Grade ≤ n ∈ IN ist beliebig oft diff ’bar, und es gilt p(k) (x) = 0, (x ∈ IR; IN 3 k ≥ n + 1). Aufgrund der obigen Anmerkung ist ein Polynom durch seine Koeffizienten eindeutig bestimmt. Dies folgte natürlich auch schon aus der Aussage, daß ein Polynom vom Grade n ∈ IN höchstens n Nullstellen besitzt. Aufgrund der obigen ”Rechenregeln” sind die folgenden Funktionen beliebig oft diff’bar: Die rationalen Funktionen , dann die Exponentialfunktion exp sowie deren Umkehrfunktion, die Logarithmusfunktion ln, weiter die hyperbolischen Funktionen sinh, cosh sowie deren Umkehrfunktionen, die AREA-Funktionen arsinh, arcosh und schließlich die Trigonometrischen Funktionen sin, cos, tan sowie deren Umkehrfunktionen, die Arcusfunktionen arcsin, arccos, arctan. 85 Wir zeigen im folgenden eine Verallgemeinerung des ersten Mittelwertsatzes für (n + 1)mal diff’bare Funktionen. (6) SATZ VON TAYLOR: (LAGRANGEsche Form) Es seien n ∈ IN und f : IR ⊃ Df → IR (n + 1)-mal diff ’bar, a, x ∈ Df mit [a, x] = [x, a] ⊂ Df , a 6= x. Dann existiert ein α ∈ ]a, x[ = ]x, a[ mit n X 1 (k) 1 f (x) = f (a) (x − a)k + f (n+1) (α) (x − a)n+1 . k! (n + 1)! k=0 (7) BEMERKUNG: Es seien n ∈ IN, I ein Intervall und f : I → IR (n + 1)-mal diff ’bar mit f (n+1) (x) = 0, (x ∈ I). Dann ist f ein Polynom, bzw. genauer die Einschränkung eines Polynoms vom Grade ≤ n. (8) DEFINITION, BEMERKUNG: Es seien f : IR ⊃ Df → IR, a ∈ Df , n ∈ IN∗ . Ist f in a n-mal diff ’bar, so bezeichnet man das Polynom n X 1 (k) f (a) (x − a)k , p(x; f, a, n) := k! k=0 (x ∈ IR) als n-tes Taylorsches Approximationspolynom zu f in a . Es gilt f (x) − p(x; f, a, n) → 0 (x → a). (x − a)n 86 In 4.2 (2) hatten wir eine notwendige Bedingung für das Vorliegen eines lokalen Extremums bewiesen. Mit Hilfe von (8) können wir diese Bedingung verschärfen und nunmehr auch eine hinreichende Bedingung herleiten. (9) KRITERIUM FÜR EIN LOKALES EXTREMUM: Es seien f : IR ⊃ Df → IR , a ∈ Df , n ∈ IN∗ . f sei in a n-mal diff ’bar und f (k) (a) = 0 (k = 1, . . . , n − 1) und f (n) (a) 6= 0 . Dann gilt: (i) Ist n ungerade, so hat f in a kein lokales Extremum. Genauer gilt: f (n) (a) > 0 ⇒ f wächst in a , f (n) (a) < 0 ⇒ f fällt in a . (ii) Ist n gerade, so besitzt f in a ein (striktes) lokales Extremum. Genauer gilt: f (n) (a) > 0 ⇒ f hat in a ein striktes lokales Minimum , f (n) (a) < 0 ⇒ f hat in a ein striktes lokales Maximum. Als Spezialfall notieren wir noch (9’) HINREICHENDE BEDINGUNG FÜR EIN LOKALES EXTREMUM: Es seien f : IR ⊃ Df → IR, a ∈ Df . Ist f in a zweimal diff ’bar mit f 0 (a) = 0 und f 00 (a) 6= 0 (> 0, bzw < 0), so hat f in a ein striktes lokales Extremum (lokales Minimum bzw. lokales Maximum). 87 (10) DEFINITION: Es seien f : IR ⊃ Df → IR, a ∈ Df . Ist f in a beliebig oft diff ’bar, so kann man f und a die folgende (Potenz-)Reihe ∞ X 1 (n) f (a) (x − a)n , n! n=0 (x ∈ IR) zuordnen. Man bezeichnet diese als Taylor-Reihe von f in a . Es stellen sich nun im Zusammenhang mit (10) die folgenden Fragen: 1) Für welche x ∈ IR konvergiert die Taylor-Reihe von f in a? 2) Sofern die Taylor-Reihe von f in a für ein x ∈ IR konvergiert, stimmt dann die Reihensumme mit f (x) überein? Zu 1) kann man Funktionen f angeben, so daß die zugehörige Taylor-Reihe in einem Punkt a den Konvergenzradius ρ = 0 besitzt, also nur für x = a konvergiert. Zu 2) geben wir im folgenden ein Beispiel einer beliebig oft diff’baren Funktion f : IR → IR an, deren Taylor-Reihe in a = 0 für jedes x ∈ IR konvergiert, deren Reihensumme jedoch für alle x ∈ IR∗ = IR \ {0} von f (x) verschieden ist. (11) BEISPIEL: Die Funktion exp(− 1 ) , (x ∈ IR∗ ) x2 f : IR 3 x → 0 , (x = 0) ist beliebig oft diff ’bar, und es gilt f (n) (0) = 0, (n ∈ IN). 88 5 INTEGRATION REELLER FUNKTIONEN 5.1 DAS RIEMANN-INTEGRAL Zunächst einige Vorbemerkungen. Es seien a, b ∈ IR mit a < b. Für n ∈ IN∗ und a = z0 < z1 < . . . < zn = b bezeichnen wir ζ := (z0 , . . . , zn ) als Zerlegung von [a, b]. Die Menge der Zerlegungen von [a, b] wollen wir mit Z[a, b] bzw. gelegentlich - wenn keine Verwechslung möglich ist - kurz mit Z notieren. 0 Für jeweils zwei Zerlegungen ζ = (z0 , . . . , zn ), ζ 0 = (z00 , . . . , zm ) ∈ Z[a, b] definieren wir ζ 0 Verfeinerung von ζ (ζ 0 > ζ bzw. ζ < ζ 0 ) 0 :⇐⇒ {z0 , . . . , zn } ⊂ {z00 , . . . , zm } (⇒ m ≥ n). Unmittelbar einzusehen ist: 1) < ist Ordnungsrelation auf Z[a, b] (reflexiv, antisymmetrisch, transitiv). 2) Z[a, b] ist mit < im folgenden Sinne gerichtet: ∀ ζ 1 , ζ 2 ∈ Z[a, b] ∃ ζ ∈ Z[a, b] : ζ i < ζ (i = 1, 2). ζ heißt dann (eine) gemeinsame Verfeinerung von ζ 1 und ζ 2 . Für ζ = (z0 , . . . , zn ) ∈ Z[a, b] bezeichne weiter δ(ζ) := max{zν − zν−1 | ν = 1, . . . , n} als Feinheitsmaß der Zerlegung ζ. Offenbar gilt für ζ 1 , ζ 2 ∈ Z[a, b] ζ 1 < ζ 2 ⇒ 0 < δ(ζ 2 ) ≤ δ(ζ 1 ). Schließlich bezeichnen wir für ζ = (z0 , . . . , zn ) ∈ Z[a, b] und τ = (t1 , . . . , tn ) mit zν−1 ≤ tν ≤ zν , (ν = 1, . . . , n) das Paar (ζ, τ ) als Zerlegung von [a, b] mit Zwischenpunkten. Die Menge der Zerlegungen von [a, b] mit Zwischenpunkten wollen wir mit Z ∗ [a, b] bzw. gelegentlich kurz mit Z ∗ notieren. 89 Im folgenden seien jeweils f : IR ⊃ Df → IR und a, b ∈ IR mit a < b betrachtet. (1) DEFINITION, BEMERKUNG: (i) Ist [a, b] ⊂ Df , so bezeichnen wir für (ζ, τ ) ∈ Z ∗ [a, b] mit ζ = (z0 , . . . , zn ) und τ = (t1 , . . . , tn ) S(f ; ζ, τ ) := n X f (tν )(zν − zν−1 ) ν=1 als (Riemannsche) Zwischensumme von f zu (ζ, τ ). (ii) Wir definieren f (Riemann-)integrierbar über [a, b] :⇐⇒ [a, b] ⊂ Df und ∃ γ ∈ IR ∀ ε > 0 ∃ ζ 0 ∈ Z[a, b] ∀ (ζ, τ ) ∈ Z ∗ [a, b] mit ζ 0 < ζ : | γ − S(f ; ζ, τ ) | < ε. Offenbar ist hier γ eindeutig bestimmt. Man bezeichnet dann Z b γ =: f (x)dx a als (Riemann-)Integral von f über [a, b]. BEISPIELE: 1) Es sei f konstant, also f (x) = c für x ∈ Df = IR. Für jedes beliebige (ζ, τ ) ∈ Z ∗ [a, b] mit ζ = (z0 , . . . , zn ) und τ = (t1 , . . . , tn ) gilt S(f ; ζ, τ ) = n X f (tν ) (zν − zν−1 ) = c (b − a). ν=1 Folglich ist f integrierbar über [a, b] und Z b f (x)dx = c (b − a). a 2) Es sei f = idIR , also f (x) = x für x ∈ Df = IR. Für jedes beliebige (ζ, τ ) ∈ Z ∗ [a, b] mit ζ = (z0 , . . . , zn ) und τ = (t1 , . . . , tn ) gilt S(f ; ζ, τ ) = n X ν=1 tν (zν − zν−1 ). 90 Weiterhin gilt n n X 1 X zν + zν−1 1 2 2 (b − a2 ) = (zν2 − zν−1 )= (zν − zν−1 ). 2 2 2 ν=1 ν=1 Folglich ist ¯ ¯ n ¯ ¯ X 1 2 2 ¯ S(f ; ζ, τ ) − (b − a ) ¯ ≤ ¯ ¯ 2 ν=1 ¯ ¯ ¯ tν − zν + zν−1 ¯ 2 ¯ ¯ ¯ (zν − zν−1 ) ≤ 1 δ(ζ) (b − a). ¯ 2 Hieraus liest man unmittelbar ab, daß f über [a, b] integrierbar ist mit Z b 1 x dx = (b2 − a2 ). 2 a (2) CAUCHY-KRITERIUM FÜR INTEGRIERBARKEIT: Es gilt: f integrierbar über [a, b] ⇐⇒ [a, b] ⊂ Df und ∀ ε > 0 ∃ ζ 0 ∈ Z[a, b] ∀ (ζ i , τ i ) ∈ Z ∗ [a, b] mit ζ i > ζ 0 (i = 1, 2) : | S(f ; ζ 1 , τ 1 ) − S(f ; ζ 2 , τ 2 ) | < ε. (3) DEFINITION, BEMERKUNG: (i) Für ∅ 6= M ⊂ Df bezeichne ωf (M ) := sup{| f (t) − f (t0 ) | | t, t0 ∈ M } die Oszillation von f über M . Unmittelbar einzusehen ist 0 ≤ ωf (M ) ≤ 2 sup{| f (t) | | t ∈ M } ≤ ∞ und damit f auf M beschränkt ⇒ ωf (M ) < ∞. Weiter gilt für ∅ 6= M1 ⊂ M2 ⊂ Df ωf (M1 ) ≤ ωf (M2 ). (ii) Ist [a, b] ⊂ Df und f auf [a, b] beschränkt, so bezeichnet man für ζ = (z0 , . . . , zn ) ∈ Z[a, b] Ω(f ; ζ) := n X ν=1 ωf ([zν−1 , zν ]) (zν − zν−1 ) 91 als Riemannsche Schwankungssume von f über [a, b] bezüglich ζ. Offenbar gilt für ζ 1 , ζ 2 ∈ Z[a, b] mit ζ 1 < ζ 2 0 ≤ Ω(f ; ζ 2 ) ≤ Ω(f ; ζ 1 ) < ∞. (4) RIEMANN-KRITERIUM FÜR INTEGRIERBARKEIT: Es gilt: [a, b] ⊂ Df , f beschränkt auf [a, b] , f integrierbar über [a, b] ⇐⇒ ∀ ε > 0 ∃ ζ 0 ∈ Z[a, b] : Ω(f ; ζ 0 ) < ε. Dann folgt für alle (ζ, τ ) ∈ Z ∗ [a, b] : ¯ Z ¯ ¯ S(f ; ζ, τ ) − ¯ b a ¯ ¯ f (x)dx ¯¯ ≤ Ω(f ; ζ). Die beiden folgenden wichtigen Sätze sind eine direkte Konsequenz aus (4). (5) SATZ: (Integrierbarkeit monotoner Funktionen) Ist [a, b] ⊂ Df und f auf [a, b] monoton, so ist f über [a, b] integrierbar. (6) SATZ: (Integrierbarkeit stetiger Funktionen) Ist [a, b] ⊂ Df und f auf [a, b] stetig, so ist f über [a, b] integrierbar. Zum Beweis von (6) benötigt man die gleichmäßige Stetigkeit von f auf [a, b]. Von praktischem Nutzen ist gelegentlich die folgende (7) BEMERKUNG: Es sei [a, b] ⊂ Df und f auf [a, b] beschränkt. Ist dann f für alle α, β ∈ IR mit a < α < β < b über [α, β] integrierbar, so ist auch f über [a, b] integrierbar. Nach (6) ist hierfür hinreichend, daß f auf ]a, b[ stetig ist. 92 (8) LINEARITÄT DES INTEGRALS: Es seien für j = 1, 2 fj : IR ⊃ Dfj → IR integrierbar über [a, b] und αj ∈ IR. Dann ist α1 f1 + α2 f2 integrierbar über [a, b] und Z Z b (α1 f1 + α2 f2 )(x)dx = α1 a Z b b f1 (x)dx + α2 a f2 (x)dx. a (9) MONOTONIE DES INTEGRALS: Es seien für j = 1, 2 fj : IR ⊃ Dfj → IR integrierbar über [a, b] mit f1 (x) ≤ f2 (x), (x ∈ [a, b]). Dann gilt Z b Z b f2 (x)dx. f1 (x)dx ≤ a a (10) SATZ: Es sei f : IR ⊃ Df → IR über [a, b] integrierbar und Φ : IR → IR stetig. Dann ist auch Φ ◦ f : IR ⊃ Df → IR über [a, b] integrierbar. (11) KOROLLAR: Es sei f : IR ⊃ Df → IR über [a, b] intgrierbar. Dann sind auch die folgenden Funktionen über [a, b] integrierbar: IR ⊃ Df 3 x → | f (x) |p ∈ IR , für p ∈ [0, ∞[ ; IR ⊃ Df 3 x → f+ (x) := max{f (x), 0} ∈ IR ; IR ⊃ Df 3 x → f− (x) := max{−f (x), 0} ∈ IR . 93 (12) SATZ: Es seien für j = 1, 2 fj : IR ⊃ Dfj → IR über [a, b] integrierbar. Dann ist auch f1 · f2 über [a, b] integrierbar. (13) INTEGRALABSCHÄTZUNGEN: Es sei f : IR ⊃ Df → IR über [a, b] integrierbar. Dann gilt mit γ− := inf{f (x) | x ∈ [a, b]} und γ+ := sup{f (x) | x ∈ [a, b]} Z Z b γ− (b − a) ≤ − f− (x)dx ≤ a Z b a sowie mit γ := sup{| f (x) | | x ∈ [a, b]} ¯Z b ¯ Z ¯ ¯ ¯ ¯ f (x)dx ¯ ≤ ¯ a b f (x)dx ≤ f+ (x)dx ≤ γ+ (b − a) a b | f (x) | dx ≤ γ (b − a). a (14) ERSTER MITTELWERTSATZ DER INTEGRALRECHNUNG: Es sei f : IR ⊃ Df → IR auf [a, b] stetig. Dann existiert ein ξ ∈ [a, b] mit Z b f (x)dx = f (ξ)(b − a). a Wir zeigen sogleich den allgemeineren (15) SATZ: Es seien f : IR ⊃ Df → IR auf [a, b] stetig und g : IR ⊃ Dg → IR über [a, b] integrierbar mit g(x) ≥ 0 für x ∈ [a, b]. Dann existiert ein ξ ∈ [a, b] mit Z Z b b f (x)g(x)dx = f (ξ) a g(x)dx. a 94 Im folgenden geht es um die Integrierbarkeit von f auf Teilintervallen von [a, b]. (16) SATZ: Für a < c < b gilt f über [a, b] integrierbar ⇐⇒ f über [a, c] und über [c, b] integrierbar und in diesem Fall weiter Z Z b f (x)dx = a Z c b f (x)dx + f (x)dx. a c Als Konsequenz hieraus und aus (7) ergibt sich sofort (17) BEMERKUNG, DEFINITION: Es sei [a, b] ⊂ Df . (i) Ist f auf [a, b] beschränkt und existiert ein ζ = (z0 , . . . , zn ) ∈ Z[a, b], so daß f für ν = 1, . . . , n jeweils auf ]zν−1 , zν [ stetig ist, so ist f über [a, b] integrierbar und Z b f (x)dx = a n Z X ν=1 zν f (x)dx. zν−1 (ii) Ist ζ = (z0 , . . . , zn ) ∈ Z[a, b] und sind für ν = 1, . . . , n jeweils γν ∈ IR gegeben, so daß f (x) = γν für zν−1 < x < zν gilt, so bezeichnet man f als Treppenfunktion auf [a, b]. f ist dann über [a, b] integrierbar und Z b f (x)dx = a n X ν=1 γν (zν − zν−1 ). 95 Da wir das Integral als Funktion der Integrationsgrenzen betrachten wollen, erweist sich die folgende Definition als zweckmäßig (18) DEFINITION, BEMERKUNG: Es sei f über [a, b] integrierbar. Man definiert dann für beliebige α, β ∈ [a, b] Z β 0 , falls α = β, Z α f (x)dx := α f (x)dx , falls β < α. − β Hiermit hat man für beliebige α, β, γ ∈ [a, b] Z Z β f (x)dx = α Z γ β f (x)dx + α f (x)dx. γ (19) SATZ: Es sei f über [a, b] integrierbar sowie c ∈ [a, b]. Wir bezeichnen Z x F : [a, b] 3 x → F (x) := f (t)dt ∈ IR . c Dann erfüllt F mit γ := sup{| f (x) | | x ∈ [a, b]} < ∞ die Lipschitzbedingung | F (x1 ) − F (x2 ) | ≤ γ | x1 − x2 | , Insbesondere ist damit F (gleichmäßig) stetig. (x1 , x2 ∈ [a, b]). 96 5.2 DIFFERENTIAL- UND INTEGRALRECHNUNG Durch Betrachtung des Integrals als Funktion der oberen Integrationsgrenze ergibt sich ein unmittelbarer Zusammenhang zwischen Integration und Differentiation. (1) SATZ: Es seien a, b ∈ IR mit a < b und f : IR ⊃ Df → IR über [a, b] integrierbar sowie c ∈ [a, b]. Wir bezeichnen Z F : [a, b] 3 x → F (x) := x f (t)dt ∈ IR. c Dann gilt für x0 ∈]a, b[: f in x0 stetig =⇒ F in x0 diff ’bar und F 0 (x0 ) = f (x0 ). (2) DEFINITION: Es sei f : IR ⊃ Df → IR, ∅ 6= Df Intervall. Jede differenzierbare Funktion F : IR ⊃ DF → IR mit F 0 = f heißt ”Stammfunktion zu f ”. Anmerkung: Es gilt dann DF = DF 0 = Df offen! Satz (1) liefert zusammen mit 5.1 (6) eine hinreichende Bedingung für die Existenz einer Stammfunktion. (3) SATZ: Es seien f : IR ⊃ Df → IR stetig, Df offenes Intervall, c ∈ Df . Dann definiert Z x F : IR ⊃ Df 3 x → f (t)dt ∈ IR c eine Stammfunktion zu f . 97 Eine Umkehrung des Sachverhalts von Satz (3) liefert der folgende (4) HAUPTSATZ DER DIFFERENTIAL– UND INTEGRALRECHNUNG: Es seien a, b ∈ IR mit a < b, f : IR ⊃ Df → IR über [a, b] integrierbar, . F : IR ⊃ DF → IR auf [a, b] stetig, ∀ x ∈]a, b[ : F in x diff ’bar und F 0 (x) = f (x) Dann gilt Z b a ¯ f (x)dx = F (b) − F (a) =: F (x) ¯ba . Die Anwendung des Hauptsatzes erfolgt unter zwei wesentlich verschiedenen Gesichtspunkten: 1 Der Hauptsatz reduziert das Problem der Berechnung eines Integrals einer integrierbaren Funktion auf das Aufsuchen einer Stammfunktion. 2 Der Hauptsatz liefert für differenzierbare Funktionen mit integrierbarer Ableitung eine Integraldarstellung. Wir beschäftigen uns im folgenden mit der Integralrechnung. Deren hauptsächlicher Gegenstand ist die Bestimmung der Integrale der wichtigsten Typen von Funktionen mit Hilfe der sich durch den Hauptsatz eröffnenden Methode des Aufsuchens von Stammfunktionen. Im Hinblick auf den durch den Hauptsatz (4) und Satz (3) gegebenen Sachverhalt wird eine Stammfunktion F einer Funktion f auch als unbestimmtes Integral von f bezeichnet. Man notiert dies auch kurz in der Form Z F Stammfunktion zu f ⇐⇒: F (x) = x f (t)dt. 98 Wir notieren hier zunächst zweckmäßigerweise eine Tabelle der uns schon bekannten Stammfunktionen bzw. Ableitungen. Rx F 0 (x) = f (x) Gültigkeitsbereiche exp(x) exp(x) 1 xλ+1 λ+1 xλ ln(x) ln(| x |) = ln(−x) x−1 x ∈ IR λ ∈ IR \ ZZ : x ∈]0, +∞[ λ ∈ IN : x ∈ IR ZZ 3 λ ≤ −2 : x ∈ IR \ {0} x ∈]0, +∞[ x ∈] − ∞, 0[ cos(x) − sin(x) x ∈ IR sin(x) cos(x) x ∈ IR tan(x) 1 + tan(x)2 = cos(x)−2 x ∈](n − 21 )π, (n + 12 )π[, (n ∈ ZZ) cosh(x) sinh(x) x ∈ IR sinh(x) cosh(x) x ∈ IR tanh(x) 1 − tanh(x)2 = cosh(x)−2 x ∈ IR arcsin(x) (1 − x2 )−1/2 x ∈] − 1, 1[ arctan(x) (1 + x2 )−1 x ∈ IR F (x) = f (t)dt arcosh(x) = ln(x + (x2 − 1)1/2 ) (x2 − 1)−1/2 x ∈]1, +∞[ arsinh(x) = ln(x + (x2 + 1)1/2 ) (x2 + 1)−1/2 x ∈ IR artanh(x) = 1 1+x ln( ) 2 1−x (1 − x2 )−1 x ∈] − 1, 1[ 99 BEISPIELE: (Berechnung von ”bestimmten” Integralen) (i) Für k ∈ IN und a, b ∈ IR mit a < b gilt Z b xk dx = a Z 1 1 xk+1 |ba = (bk+1 − ak+1 ). k+1 k+1 π/2 π/2 (ii) sin(x)dx = − cos(x)|0 0 = 1. BEISPIELE: (Integraldarstellungen) (i) Für x ∈ ]0, +∞[ gilt Z x 1 dt . t x 1 dt . 1 + t2 ln(x) = 1 (ii) Für x ∈ IR gilt Z arctan(x) = 0 BEISPIEL: Für n ∈ IN∗ sei γn := n X 1 − ln(n). ν ν=1 Mit der Integraldarstellung von ln folgt für n ∈ IN∗ γn = n−1 Z X ν=1 µ ν+1 ν 1 1 − ν t ¶ ¶ n−1 Z ν+1 µ X 1 1 1 dt + = 1 − − dt. n t ν + 1 ν ν=1 Damit ergibt sich offenbar 0 < γn+1 ≤ γn < 1, woraus die Existenz von γ = lim γn = n→∞ ∞ Z X ν=1 ν+1 ν µ 1 1 − ν t ¶ dt ∈ ]0, 1[ folgt. γ heißt Euler-Konstante. Es gilt 0 ≤ γn − γ < 1 , n (n ∈ IN∗ ). 100 Aus den bekannten Differentiationsregeln erhält man über den Hauptsatz der Differentialund Integralrechnung unmittelbar entsprechende Integrationsregeln. Auf die Linearität des Integrals brauchen wir allerdings hier nicht noch einmal einzugehen, da wir diese in (8) schon notiert haben. Mithilfe der Kettenregel für die Differentiation erhält man die folgende (5) SUBSTITUTIONSREGEL FÜR INTEGRALE: Es seien a, b ∈ IR mit a < b, f : IR ⊃ Df → IR stetig, ϕ : IR ⊃ Dϕ → IR diff ’bar, ϕ0 über [a, b] integrierbar, ϕ([a, b]) ⊂ Df . Dann gilt Z Z b ϕ(b) 0 f (ϕ(t))ϕ (t)dt = a f (x)dx. ϕ(a) Wir notieren einige wichtige Spezialfälle (6) KOROLLAR: Es seien a, b ∈ IR mit a < b sowie α, β ∈ IR mit α 6= 0 und f : IR ⊃ Df → IR stetig, [αa + β, αb + β] ⊂ Df . Dann gilt Z Z b α αb+β f (αx + β)dx = a f (x)dx. αa+β (7) KOROLLAR: Es seien a, b ∈ IR mit a < b, n ∈ IN∗ , ϕ : IR ⊃ Dϕ → IR diff ’bar, ϕ0 integrierbar über [a, b], ϕ(x) 6= 0 für x ∈ [a, b]. Dann gilt Z b a 0 ϕ (t) dt = ϕ(t)n Z ϕ(b) ϕ(a) ln(| ϕ(x) |)|ba , (n = 1), −n x dx = 1 ϕ(x)1−n |b , (n ≥ 2). a 1−n 101 Aus (7) liest man unmittelbar ab F (x) = Rx f (t)dt − ln(| cos(x) |) ln(cosh(x)) , (n = 1) ln(| x − c |) 1 (x − c)1−n , (n ≥ 2) 1−n 2 F 0 (x) = f (x) Gültigkeitsbereiche tan(x) 1 1 x ∈](n − )π, (n + )π[, (n ∈ ZZ) 2 2 tanh(x) x ∈ IR c ∈ IR, n ∈ IN∗ x ∈] − ∞, c[, ∈]c, +∞[ 1 (x − c)n , (n = 1) 2 ln((x − c) + d ) 2(x − c) 1 2 2 n ((x − c) + d ) ((x − c)2 + d2 )1−n , (n ≥ 2) 1−n c, d ∈ IR, d 6= 0; n ∈ IN∗ ; x ∈ IR Mithilfe der Produktregel für die Differentiation erhält man die folgende Regel über (8) PARTIELLE INTEGRATION: Es seien a, b ∈ IR mit a < b, u : IR ⊃ Du → IR diff ’bar, v : IR ⊃ Dv → IR diff ’bar, u0 und v 0 über [a, b] integrierbar. Dann gilt Z b a ¯b Z ¯ u (x)v(x)dx = u(x)v(x)¯¯ − b 0 a u(x)v 0 (x)dx. a Aus (8) liest man speziell mit u = idIR und v = f ab F (x) = Rx f (t)dt x ln(| x |) − x x arctan(x) − F 0 (x) = f (x) Gültigkeitsbereiche ln(| x |) 1 ln(1 + x2 ) arctan(x) 2 x arcsin(x) + (1 − x2 )1/2 arcsin(x) x ∈] − ∞, 0[ bzw. x ∈]0, +∞[ x ∈ IR x ∈] − 1, 1[ 102 BEISPIELE: 1) Für n ∈ IN∗ gilt Z x Z 2 −n (1 + t ) dt = Z x 2 −n 1 (1 + t ) 2 −n dt = x (1 + x ) x + 2n t2 (1 + t2 )−n−1 dt und folglich Z x 2 −n−1 (1 + t ) 1 2n − 1 dt = x(1 + x2 )−n + 2n 2n Z x (1 + t2 )−n dt. Hiermit kann man rekursiv die Stammfunktion zu (1 + x2 )−n für IN 3 n ≥ 2 bestimmen. 2) Für n ∈ IN∗ gilt Z Z Z Z x x n n n exp(t)t dt = exp(x)x − n Z n n cos(t)t dt = sin(x)x − n x Z x n n sin(t)t dt = − cos(x)x + n exp(t)tn−1 dt, sin(t)tn−1 dt, x cos(t)tn−1 dt. Hiermit kann man rekursiv die Stammfunktionen zu xn exp(x), xn cos(x), xn sin(x) bestimmen. 3) Für IN 3 n ≥ 2 gilt Z x Z x Z n n−1 n−1 cos(t) dt = cos(t) cos(t) dt = sin(x) cos(x) + (n − 1) x sin(t)2 cos(t)n−2 dt und folglich Z x 1 n−1 cos(t) dt = sin(x) cos(x)n−1 + n n Z n Analog erhält man Z x Z 1 n−1 n n−1 sin(t) dt = − cos(x) sin(x) + n n x x cos(t)n−2 dt. sin(t)n−2 dt. Hiermit kann man rekursiv die Stammfunktionen zu cos(x)n und sin(x)n bestimmen. Mithilfe der partiellen Integration (6) wollen wir nun noch den folgenden Taylorschen Satz mit Integralrestglied beweisen. 103 (9) SATZ VON TAYLOR (Cauchysche Form des Restgliedes): Es seien n ∈ IN, f : IR ⊃ Df → IR (n + 1)-mal stetig diff ’bar, Df Intervall, a ∈ Df . Dann gilt für x ∈ Df Z x n X 1 (ν) 1 ν f (x) = f (a)(x − a) + (x − t)n f (n+1) (t)dt. ν! n! a ν=0 Weiter folgt: ∀ p ∈ {0, . . . , n} ∃ ξ ∈ [x, a] = [a, x] mit Z x 1 (x − t)n f (n+1) (t)dt = (x − a)p+1 (x − ξ)n−p f (n+1) (ξ). p+1 a Abschließend eine Bemerkung zur Integration rationaler Funktionen. p Es sei f eine rationale Funktion. Diese besitzt eine Darstellung f = + r mit Polynomen q p, q, r, wobei grad p < grad q ist und q den höchsten Koeffizienten 1 hat. q ist dann eindeutig darstellbar in der Form q(x) = n Y ν=1 (x − aν )rν m Y ((x − bµ )2 + c2µ )sµ µ=1 mit n, m ∈ IN sowie für n ≥ 1 aν ∈ IR, rν ∈ IN (ν = 1, . . . , n), aν 6= aν 0 (ν 6= ν 0 ) und für m ≥ 1 bµ ∈ IR, IR 3 cµ > 0, sµ ∈ IN (µ = 1, . . . , m), (bµ , cµ ) 6= (b0µ , c0µ ) (µ 6= µ0 ). f läßt sich dann mit eindeutig bestimmten Konstanten Aνρ ∈ IR (ν = 1, . . . , n; ρ = 1, . . . , rν ), Bµσ , Cµσ ∈ IR (µ = 1, . . . , m; σ = 1, . . . , sµ ), Dκ ∈ IR (κ = 0, . . . , k), wobei k = grad r, in der folgenden Form schreiben f (x) = n X rν X ν=1 ρ=1 sµ k m X X Aνρ Bµσ 2(x − bµ ) + Cµσ X + D κ xκ . + (x − aν )ρ µ=1 σ=1 ((x − bµ )2 + c2µ )σ κ=0 Zu den auf der rechten Seite stehenden Funktionen können wir jedoch mithilfe der schon bewiesenen Methoden Stammfunktionen angeben. 104 Anmerkungen zur Gewinnung der PARTIALBRUCHZERLEGUNG RATIONALER FUNKTIONEN Wir stellen zunächst den Bezug her zwischen dem abstrakten Polynombegriff der Linearen Algebra und den Polynomfunktionen aus der Analysis. Es sei f : IR → IR. Wir hatten definiert: (1) ∃ k ∈ IN ∃ (a0 , . . . , ak ) ∈ IRk+1 k P f heißt ”Polynom(funktion)” :⇔ f (t) = aj tj (t ∈ IR) . j=0 Mit Hilfe des Satzes von Taylor folgt sofort: (2) f Polynom(funktion) :⇔ f ist C ∞ -Funktion und f (n) = 0 ffa n ∈ IN . Ist f Polynom(funktion), so definiert man ( © ª max n ∈ IN | f (n) 6= 0 , f 6= 0 , (3) k := grad(f ) := −∞ , f = 0, und hat hiermit die (eindeutige) Darstellung (4) k X 1 (j) f (t) = f (0) tj j! j=0 (t ∈ IR) . Wir bezeichnen die Menge der (reellen) Polynomfunktionen (einer Variablen) mit (5) P := { f : IR → IR | f Polynom(funktion) } . P ist mit den auf IRIR punktweise definierten Operationen + und · ein kommutativer (Unter-)Ring (von IRIR ) mit Einselement. Das Nullelement 0P ist die Funktion IR 3 t → 0 ∈ IR, das Einselement 1P die Funktion IR 3 t → 1 ∈ IR. In der (Linearen) Algebra definiert man mit einem beliebigen Körper IK © ª (6) IK[x] := α = (an )n∈IN ∈ IKIN | an = 0 ffa n ∈ IN . Man zeigt dort, daß IK[x] ein kommutativer (Unter-)Ring von IKIN ist, wobei die Operationen + und ∗ für α = (an ), β = (bn ) ∈ IKIN durch (7) α + β := (an + bn )n∈IN , α ∗ β := ( n X aj bn−j )n∈IN j=0 definiert werden. Das Nullelement ist hier gerade 0IK[x] = (0, 0, . . .) und das Einsele- 105 ment 1IK[x] = (1, 0, . . .). IK wird durch IK 3 a → (a, 0, . . .) ∈ IK[x] in IK[x] eingebettet. Man identifiziert daher a = (a, 0, . . .). Bezeichnet man x := (0, 1, 0, . . .) und definiert für n ∈ IN die Potenzen xn wie üblich rekursiv durch x0 := 1IK[x] , xn+1 := xn ∗ x, so gilt für α = (an ) ∈ IK[x] mit ( k := grad(α) := max { n ∈ IN | an 6= 0 } , α 6= 0IK[x] , −∞ , α = 0IK[x] , die Darstellung (8) α= k X a n ∗ xn . n=0 Man bezeichnet daher α als Polynom in der Variablen x. Der Zusammenhang von P und IR[x] wird durch die Abbildung (9) φ : IR[x] 3 α = (an ) → φ(α) := p ∈ P , hergestellt, wobei mit k := grad(α) (9.0) p(t) := k X an tn (t ∈ IR) n=0 definiert ist. Man prüft leicht nach, dass φ ein (unitärer) Ringhomomorphismus ist: φ(α + β) = φ(α) + φ(β) , φ(α ∗ β) = φ(α) · φ(β) , φ(1IR[x] ) = 1P . Nach Definition von P ist φ surjektiv. Aufgrund von (4) ist φ injektiv: Mit α = (an ) ∈ IR[x] und p := φ(α) gilt 1 (n) p (0) (n ∈ IN) . n! Damit sind IR[x] und P als Ringe (mit Einselement) isomorph. an = Weiterhin gilt für α = (an ) ∈ IR[x] und p := φ(α) (10) grad(α) = grad(p) . Hiermit – oder auch direkt – verifiziert man: Für jeweils zwei Polynome p, q ∈ P gilt (11) grad(p · q) = grad(p) + grad(q) , sowie (12) grad(p + q) ≤ max{ grad(p), grad(q)} mit = im Fall grad(p) 6= grad(q) . Aus (11) liest man ab, daß P ”nullteilerfrei” ist: ∀p, q ∈ P : p · q = 0 ⇒ p = 0 oder q = 0 . 106 Mittels (9) und (10) überträgt sich aus der Linearen Algebra: LEMMA I (Division mit Rest) Es seien p, q ∈ P mit q 6= 0. Dann existieren eindeutig s, r ∈ P mit p = s · q + r und grad(r) < grad(q). Als erste Folgerung aus LEMMA I ergibt sich: KOROLLAR Ia Es sei q ∈ P mit grad(q) ≥ 1. Dann existieren zu jedem p ∈ P für n ∈ IN jeweils eindeutig sn ∈ P mit grad(sn ) < grad(q), so daß sn = 0 ffa n ∈ IN und p = X̀ sn · q n n=0 gilt. Dabei ist ` ∈ IN mit sn = 0 für n ≥ `. Wir setzen die Kenntnis des Begriffs des größten gemeinsamen Teilers (ggT) aus der Linearen Algebra voraus. Als weitere direkte Folgerung aus LEMMA I ergibt sich: KOROLLAR Ib Es seien q1 , q2 ∈ P \ {0} und q̃ := ggT{q1 , q2 } sei deren größter gemeinsamer Teiler. Dann gilt: (i) Es existieren eindeutig sj ∈ P mit grad(sj ) < grad(qj ), so daß q̃ = s2 · q1 + s1 · q2 . (ii) Sind q1 , q2 teilerfremd, gilt also q̃ = 1, so existieren zu jedem p ∈ P eindeutig s1 , s2 , r ∈ P mit grad(sj ) < grad(qj ) (j = 1, 2), so daß p = s2 · q1 + s1 · q2 + r · q1 · q2 . In der ANALYSIS III und/oder der KOMPLEXEN FUNKTIONENTHEORIE werden wir beweisen: LEMMA II (Fundamentalsatz der Algebra) Jedes (komplexe) Polynom α = (an ) ∈ C I [x] mit k := grad(α) ≥ 1 besitzt mindestens eine 107 (komplexe) Nullstelle z0 ∈ C I: k X a n · z0 n = 0 . n=0 Dies ist äquivalent dazu, daß x − z0 = (−z0 , 1, 0, . . .) ein Teiler von α ist. Als Folgerung hieraus erhält man leicht KOROLLAR IIa (Faktorisierungssatz) Zu jedem q ∈ P \ {0} existieren eindeutig q0 ∈ IR∗ = \{0} und q1 , q2 ∈ P mit q = q0 · q1 · q2 , wobei n Q (x − a )rν (n ∈ IN∗ ) ν q1 (x) = ν=1 1 (n = 0) mit aν ∈ IR , rν ∈ IN∗ , (ν = 1, . . . , n) sowie aν 6= aν̃ , (ν 6= ν̃) im Falle n ∈ IN∗ und Q m ¡ ¢sµ (x − bµ )2 + cµ2 (m ∈ IN∗ ) q2 (x) = µ=1 1 (m = 0) mit (bµ , cµ ) ∈ IR2 , cµ > 0 , sµ ∈ IN∗ , (µ = 1, . . . , m) sowie (bµ , cµ ) 6= (bµ̃ , cµ̃ ) , (µ 6= µ̃) im Falle m ∈ IN∗ . Die n, m ∈ IN sind eindeutig bestimmt, ebenso sind die (aν , rν ) (ν = 1, . . . , n) und (bµ , cµ , sµ ) (µ = 1, . . . , m) bis auf ihre Reihenfolge eindeutig bestimmt. Es gilt n X ν=1 rν + 2 · m X µ=1 sµ = grad(q) . 108 Wir wollen nun die Partialbruchzerlegung einer rationalen Funktion durchführen. Dazu sei f= p mit p, q ∈ P , q 6= 0 q gegeben. Wir zerlegen q gemäß KOROLLAR IIa in die (eindeutig bestimmten) Faktoren q0 ∈ IR \ {0} , q1 , q2 ∈ P. Offenbar kann man o.E. q0 = 1 annehmen. Da q1 und q2 keine gemeinsame Nullstelle besitzen und daher teilerfremd sind, kann man gemäß KOROLLAR Ib (ii) (eindeutig) p1 , p2 , r ∈ P mit grad(pj ) < grad(qj ) (j = 1, 2) bestimmen, so daß gilt f= p p1 p2 = r+ + . q q1 q2 a) Ist grad(r) =: k ≥ 0, so gilt mit (eindeutig bestimmten) Dκ ∈ IR (κ = 0, . . . , k) r(x) = k X D κ xκ . κ=0 b) Gilt p1 6= 0, so ist grad (q1 ) ≥ 1 und folglich n ≥ 1. Wir wählen dann (eindeutig) q1∗ ∈ P mit q1 (x) = (x − an )rn · q1∗ (x) . Da (x − an ) und q1∗ keine gemeinsame Nullstelle besitzen, sind sie teilerfremd. Damit kann man gemäß KOROLLAR Ib (ii) (eindeutig) An,rn ∈ IR und p̃1 ∈ P mit p1 (x) = An,rn · q1∗ (x) + p̃1 (x) · (x − an ) bestimmen. Mit q̃1 (x) := (x − an )rn −1 · q1∗ (x) folgt p1 An,rn p̃1 = + . r n q1 (x − an ) q̃1 Rekursiv erhält man auf diese Weise Aν,ρ ∈ IR (ν = 1, . . . , n ; ρ = 1, . . . , rν ) mit und n rν p1 X X Aν,ρ = + r̃1 . rν q1 (x − a ) ν ν=1 ρ=1 Da grad(p1 ) < grad(q1 ) ist, folgt r̃1 = 0. r̃1 ∈ P 109 c) Gilt p2 6= 0, so ist grad (q2 ) ≥ 1 und folglich m ≥ 1. Wir wählen dann (eindeutig) q2∗ ∈ P mit 2 sm q2 (x) = [(x − bm )2 + cm ] · q2∗ (x) . 2 Da [(x − bm )2 + cm ] und q2∗ keine gemeinsame Nullstelle besitzen, sind sie teilerfremd. Damit kann man wieder gemäß KOROLLAR Ib (ii) (eindeutig) Bm,sm , Cm,sm ∈ IR und p̃2 ∈ P mit 2 p2 (x) = (2 · Bm,sm (x − bm ) + Cm,sm ) · q2∗ (x) + p̃2 (x) · [(x − bm )2 + cm ] 2 sm −1 bestimmen. Mit q̃2 (x) := [(x − bm )2 + cm ] · q2∗ (x) folgt p2 2 · Bm,sm (x − bm ) + Cm,sm p̃2 = + . 2 ]sm q2 [(x − bm )2 + cm q̃2 Rekursiv erhält man wieder auf diese Weise Bµ,σ , Cµ,σ ∈ IR (µ = 1, . . . , m; σ = 1, . . . , sµ ) mit und r̃2 ∈ P sµ m X X p2 2 · Bµ,σ (x − bµ ) + Cµ,σ = + r̃2 . 2 + c 2 ]σ q2 [(x − b ) µ µ mu=1 σ=1 Wegen grad(p2 ) < grad(q2 ) ist r̃2 = 0. Aus a), b) und c) folgt die (eindeutige) Partialbruchzerlegung von f . f ist (eindeutig) in Summanden der folgenden Form zerlegbar: (i) (ii) (iii) (iv) D · xκ mit D ∈ IR und κ ∈ IN. A mit A, a ∈ IR und ρ ∈ IN∗. (x − a)ρ 2B(x − b) mit B, b, c ∈ IR, c > 0 und σ ∈ IN∗. [(x − b)2 + c2 ]σ C mit C, b, c ∈ IR, c > 0 und σ ∈ IN∗. [(x − b)2 + c2 ]σ Stammfunktionen hierzu sind jedoch schon bekannt. 110 5.3 UNEIGENTLICHE INTEGRALE Wir haben bisher Funktionen nur über endlichen Intervallen integriert und diese waren überdies dort notwendigerweise beschränkt. Da dieser Integralbegriff für manche Anwendungen zu eng ist, wollen wir hier noch eine naheliegende Verallgemeinerung behandeln. Es seien f : IR ⊃ Df → IR, ∅ 6= Df Intervall, −∞ ≤ a := inf Df < sup Df =: b ≤ +∞. Weiter sei f über jedes abgeschlossene Teilintervall [α, β] ⊂ Df mit α, β ∈ IR, α < β integrierbar. Man bezeichnet dann f auch als lokal integrierbar . Wir betrachten nun für ein beliebiges c ∈ Df Z x Fc : Df 3 x → Fc (x) := f (t)dt ∈ IR. c Nach 5.1 (19) ist Fc stetig. Insbesondere gilt im Fall b ∈ Df dann Fc (x) → Fc (b) für Df 3 x → b bzw. im Fall a ∈ Df entsprechend Fc (x) → Fc (a) für Df 3 x → a. Ist b ∈ / Df bzw. a ∈ / Df , so kann man zumindest nach der Existenz des Grenzwertes von Fc (x) für Df 3 x → b bzw. für x → a fragen. (1) DEFINITIONEN: (i) Existiert im Fall b ∈ / Df der Grenzwert limx→b Fc (x) = Fc (b−) ∈ IR, so bezeichnen wir f als ”uneigentlich (Riemann-) integrierbar über [c, b[” und Z b f (t)dt Fc (b−) =: c als das ”(an der oberen Grenze) uneigentliche (Riemann-)Integral von f über [c, b[”. (ii) Existiert im Fall a ∈ / Df der Grenzwert limx→a Fc (x) = Fc (a+) ∈ IR, so bezeichnen wir f als ”uneigentlich (Riemann-) integrierbar über ]a, c]” und Z c −Fc (a+) =: f (t)dt a als das ”(an der unteren Grenze) uneigentliche (Riemann-)Integral von f über ]a, c]”. (iii) Gilt a, b ∈ / Df und existieren beide Grenzwerte Fc (a+), Fc (b−) ∈ IR, so bezeichnen wir f als ”uneigentlich (Riemann-) integrierbar über ]a, b[= Df ” und Z c Z b Z b Fc (b−) − Fc (a+) = f (t)dt + f (t)dt =: f (t)dt ∈ IR a c a als das ”(an beiden Grenzen) uneigentliche (Riemann-)Integral von f über ]a, b[”. 111 Wegen 5.1 (16) bzw. (18) ist die Definition in (iii) von c ∈ Df unabhängig und daher erst gerechtfertigt. BEISPIELE: 1) Wir betrachten für λ > 0 ]0, ∞[3 x → fλ (x) := x−λ ∈ IR. Es gilt für x ∈ ]0, +∞[ Z x Fλ (x) = fλ (t)dt = 1 und damit für x → +∞ 1 (x1−λ − 1) , (λ 6= 1) 1−λ ln(x) , (λ = 1) +∞ , (λ ≤ 1) Fλ (x) → 1 , (λ > 1) λ−1 sowie für x → 0 +∞ , (λ ≥ 1) −Fλ (x) → 1 , (λ < 1). 1−λ Folglich existiert das (an der oberen Grenze) uneigentliche Integral Z ∞ 1 x−λ dx = λ−1 1 genau im Fall λ > 1 und das (an der unteren Grenze) uneigentliche Integral Z 1 1 x−λ dx = 1−λ 0 genau im Fall 0 < λ < 1. 2) Es existieren die (an beiden Grenzen) uneigentlichen Integrale µZ 0 Z 1−ε ¶ Z 1 1 1 dx = lim + dx = lim 2 arcsin(1 − ε) = π, 2 1/2 ε→0 ]0,1[3ε→0 (1 − x2 )1/2 −1+ε 0 −1 (1 − x ) und Z +∞ −∞ 1 dx = lim a→+∞ 1 + x2 µZ Z a¶ 0 + −a 0 1 dx = lim 2 arctan(a) = π. a→+∞ 1 + x2 112 (2) INTEGRAL-VERGLEICHSKRITERIUM: Es seien b ∈ / Df , c ∈ Df , I := [c, b[ und g : I → IR uneigentlich integrierbar über I. Gilt dann | f (x) | ≤ g(x) , so ist f uneigentlich integrierbar über I und ¯ Z ¯Z b ¯ ¯ ¯ f (t)dt ¯¯ ≤ ¯ c (x ∈ I) , b g(t)dt . c Entsprechendes gilt in den Fällen a ∈ / Df mit I := ]a, c] sowie a , b ∈ / Df mit I := ]a, b[. (3) SATZ (Gamma-Funktion): Für x ∈]0, ∞[ existiert das uneigentliche Integral Z ∞ tx−1 exp(−t)dt =: Γ(x) ∈ IR. 0 Man bezeichnet Γ : ]0, ∞[→ IR ”Gamma-Funktion”. Es gilt die Funktionalgleichung Γ(x + 1) = x Γ(x), (x > 0) sowie Γ(n + 1) = n! , (n ∈ IN). (4) INTEGRAL-VERGLEICHSKRITERIUM FÜR REIHEN: Es sei mit k ∈ ZZ f : [k, +∞[→ [0, +∞[ monoton fallend. Dann ist die Konvergenz der Reihe ∞ X f (n) n=k äquivalent zur Existenz des (an der oberen Grenze) uneigentlichen Integrals Z ∞ f (x)dx . k BEISPIEL: Für λ ∈ IR gilt ∞ X n=1 n−λ < ∞ ⇐⇒ λ > 1.