Ralf Gerkmann Mathematisches Institut Ludwig-Maximilians-Universität München Vorlesung im Wintersemester 2016/17 Analysis einer Variablen (Mathematik I für das gymnasiale Lehramt) (Version vom 10. Februar 2017) Inhaltsverzeichnis § 1. Elementare Logik und Mengenlehre ............................ 3 § 2. Relationen und Abbildungen § 3. Die reellen Zahlen ................................. 19 ........................................ 42 § 4. Folgen und Reihen ........................................ 76 § 5. Stetigkeit § 6. Differenzierbarkeit § 7. Integralrechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109 Literaturverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187 § 1. Elementare Logik und Mengenlehre Inhaltsübersicht In diesem Abschnitt definieren wir zunächst, was unter einer mathematischen Aussage zu verstehen ist. Mit Hilfe von logischen Symbolen ¬, ∧, ⇒ usw. lassen sich einfache Aussagen zu komplexeren Aussagen zusammensetzen. Die Tautologien bilden eine besonders wichtige Klasse zusammengesetzter Aussagen, weil sie für logische Schlüsse verwendet werden können. Aus solchen Schlüssen wiederum werden mathematische Beweise aufgebaut. Fast die gesamte moderne Mathematik basiert auf dem Begriff der Menge. Eine Menge kann durch Aufzählung ihrer Elemente oder durch eine definierende Bedingung, ein sog. Aussagenschema, beschrieben werden. Mit Hilfe von Aussagenschemata definieren wir auch einige wichtige Mengenoperationen. Außerdem werden mit ihnen quantifizierte Aussagen gebildet, wie sie bei der Formulierung mathematischer Sätze fast immer vorkommen. Zum Abschluss führen wir die natürlichen Zahlen ein und besprechen das Prinzip der vollständigen Induktion. (1.1) Definition Unter einer Aussage verstehen wir einen (sprachlich oder in mathematischer Notation formulierten) Satz, von dem auf sinnvolle und objektive Weise gesagt werden kann, dass er wahr oder falsch ist. Die folgenden Sätze sind zweifellos Aussagen. (i) Heute ist Mittwoch. (wahr, jedenfalls am 19.10.2016) (ii) Der Archaeopteryx war ein flugfähiges Säugetier. (anscheinend falsch, nach vorherrschender Meinung der Paläontologen) (iii) 1 + 1 = 2 (wahr) (iv) Es gibt eine natürliche Zahl, die größer ist als alle anderen natürlichen Zahlen. (Falsch. Nehmen wir an, n wäre eine natürliche Zahl. Dann müsste n > n + 1 gelten, es gilt aber n < n + 1.) (v) Die Summe der Innenwinkel eines beliebigen Dreiecks beträgt 180◦ . (wahr, zumindest in der „normalen“ euklidischen Geometrie) (vi) Jede differenzierbare Funktion ist stetig. (wahr) (vii) Jede gerade Zahl größer als zwei kann als Summe von zwei Primzahlen dargestellt werden. (Dies ist die sog. Goldbachsche Vermutung. Zur Zeit ist noch unbekannt, ob sie wahr oder falsch ist.) Dagegen sind die folgenden Sätze mit Sicherheit nicht als Aussagen zu bezeichnen. (i) Hallo! (ii) Mach endlich Deine Hausaufgaben! (iii) 10100 ist eine große Zahl (iv) Die Kreiszahl π ist ungefähr gleich 3.14. (v) x 3 − 3x 2 − 3x + 1 (vi) a2 + b2 = c 2 —– 3 —– Offenbar ist es sinnlos, einer Begrüßung oder einer Aufforderung einen Wahrheitswert zuzuordnen. Die Sätze (iii) und (iv) sind für eine Aussage nicht hinreichend objektiv. Der Ausdruck (v) ist ein Term (genauer gesagt, ein Polynom), für den die Feststellung wahr oder falsch ebenfalls keinen Sinn macht. Satz (vi) ist für sich genommen keine Aussage, solange den Symbolen a, b und c keine Bedeutung zugeordnet wird. Legt man fest, dass a = 3, b = 4 und c = 5 sein soll, erhält man eine wahre Aussage, denn es gilt 32 + 42 = 9 + 16 = 25 = 52 . Für viele andere Belegungen von a, b, c (zum Beispiel a = 1, b = 2, c = 3) erhält man dagegen eine falsche Aussage. Legt man fest, dass a, b, c Seitenlängen eines rechtwinkligen Dreiecks sein sollen, wobei c der längsten Seite zugeordnet ist, dann erhält man wiederum eine wahre Aussage. Einer der häufigsten Fehler bei der Formulierung mathematischer Aussagen besteht darin, dass Bezeichnungen (wie hier a, b, c) verwendet werden, die zuvor nicht definiert wurden! Einfache Aussagen können umgangssprachlich, zum Beispiel durch Bindewörter wie „und“, „oder“, oder auch durch bestimmte Symbole (∨, ∧) zu komplexeren Aussagen verknüpft werden. Der Wahrheitswert der neuen Aussage ist dann durch die Wahrheitswerte der verknüpften Aussagen festgelegt. Wie diese Festlegung im einzelnen aussieht, kann am einfachsten durch sog. Wahrheitstabellen beschrieben werden. Seien ϕ und ψ zwei Aussagen. Die folgenden Verknüpfungen von Aussagen sind in der Mathematik allgemein gebräuchlich. (i) Konjunktion ϕ ∧ ψ „Es gilt ϕ und ψ.“ ϕ ψ ϕ∧ψ w w w w f f f w f f f f Die erste Zeile der Tabelle bedeutet ausformuliert: „Sind die Aussagen ϕ und ψ beide wahr, dann ist auch die zusammengesetzte Aussage ϕ ∧ ψ eine wahre Aussage.“ Beispielsweise ist der Satz „Heute ist Mittwoch, und es gilt 1 + 1 = 2.“ eine wahre Aussage - über den Erkenntniswert kann man geteilter Meinung sein. Wichtig hierbei ist, dass auch die zusammengesetzten Aussage entweder wahr oder falsch ist; in der mathematischen Logik ist kein Platz für „Halbwahrheiten“. So ist der Satz „Heute ist Mittwoch, und es gilt 1 + 1 = 3.“ auch am Mittwoch, den 19. Oktober 2016 auf Grund des Eintrags in der zweiten Tabellenzeile eindeutig als falsch zu bezeichnen. (Am 20. Oktober entnimmt man der vierten Tabellenzeile, dass die Aussage falsch ist, denn in diesem Fall sind beide Teilaussagen falsch.) —– 4 —– (ii) Disjunktion ϕ ∨ ψ „Es gilt ϕ oder ψ.“ ϕ ψ ϕ∨ψ w w w w f w f w w f f f Zum Beispiel ist die Aussage „Es gilt 1 + 2 = 3 oder 3 + 5 = 7.“ wahr (zweite Tabellenzeile). Ebenso stimmt für jede reelle Zahl a die Aussage „Es gilt a ≥ 0 oder a ≤ 0.“, und zwar unabhängig davon, welche konkrete Zahl a man dort einsetzt. Hier kommt zum Beispiel für a = 0 die die erste, für a = −2 die dritte Zeile zur Anwendung. Zu beachten ist, dass sich beim mathematischen „oder“ die beiden Aussagen ϕ und ψ nicht gegenseitig ausschließen, wie dies beim umgangssprachlichen „entweder - oder“ der Fall ist: Die Aussage ϕ ∧ ψ ist auch dann wahr, wenn die Aussagen ϕ und ψ beide zutreffen! (iii) Negation ¬ϕ „ϕ gilt nicht.“ / „ϕ ist falsch.“ ϕ ¬ϕ w f f w Beispielsweise ist der Satz „Die Gleichung 1+1 = 3 gilt nicht.“ eine wahre Aussage (laut zweiter Tabellenzeile), und der Satz „Die Gleichung 1 + 1 = 2 gilt nicht.“ ist falsch (laut erster Zeile). (iv) Implikation ϕ ⇒ ψ „Aus ϕ folgt ψ.“ / „Wenn ϕ gilt, dann gilt auch ψ.“ / „ϕ ist eine hinreichende Bedingung für ψ.“ / „ψ ist eine notwendige Bedingung für ϕ.“ ϕ ψ ϕ⇒ψ w w w w f f f w w f f w Man bezeichnet ϕ als die Prämisse, ψ als die Konklusion der Implikation ϕ ⇒ ψ. Bemerkenswert ist die Festlegung in der vierten Zeile: Wenn die Prämisse falsch ist, dann gilt die Implikation ϕ ⇒ ψ auf jeden Fall als wahr, unabhängig vom Wahrheitswert der Aussage Konklusion. So gesehen ist „Wenn 1 + 1 = 3 ist, dann gilt auch 2 + 7 = 11.“ eine wahre (wenn auch nicht besonders nützliche) Aussage. Logiker verwenden dafür den Ausspruch „Ex falso quodlibet“, d.h. aus etwas Falschem folgt alles Mögliche. —– 5 —– Bei der Implikation ist zu beachten, dass es zwischen den Aussagen A und B kein kausaler Zusammenhang bestehen muss, damit die Implikation A ⇒ B zu einer wahren Aussage wird. Es kommt nur auf die Wahrheitswerte von ϕ und ψ an. Beispielsweise ist die Implikation „Wenn 1 + 1 = 2 ist, dann beträgt die Summe der Innenwinkel aller Dreiecke 180◦ .“ wahr, obwohl die Gleichung 1 + 1 = 2 wenig bis nichts mit den geometrischen Eigenschaften irgendwelcher Dreiecke zu tun hat. Ausschlaggebend für den Wahrheitsgehalt der Implikation ist hier nur, dass die beiden Teilaussagen wahr sind. Implikationen spielen in der Mathematik eine sehr wichtige Rolle; so gut wie jeder mathematische Satz wird als Implikation formuliert. Im Mathematikunterricht werden Implikationen bereits bei ganz elementaren Vorgängen wie etwa der Umformung von Gleichungen verwendet. So verwendet man beispielsweise die Tatsache, dass die Implikation „x + 3 = 5 ⇒ x = 2“ für alle reellen Zahlen x gültig ist, um die Gleichung x + 3 = 5 nach x hin „aufzulösen.“ (v) Äquivalenz ϕ ⇔ ψ „Es gilt ϕ genau dann, wenn ψ gilt.“ / „ϕ ist hinreichende und zugleich notwendige Bedingung für ψ.“ ϕ ψ ϕ⇔ψ w w w w f f f w f f f w Beim Arbeiten mit Implikationen ist es sehr wichtig, die zusammengesetzten Aussagen „ϕ ⇒ ψ“, „ψ ⇒ ϕ“ und „ϕ ⇔ ψ“ sorgfältig auseinander zu halten. Geschieht dies nicht, dann kann das bereits beim Auflösen von quadratischen Gleichungen zu Fehlern führen. Beispielsweise ist die Implikation x = 3 ⇒ x 2 = 9 für alle reellen Zahlen x gültig, während x 2 = 9 ⇒ x = 3 für alle reellen Zahlen x 6= −3 richtig, für x = −3 aber falsch ist: In diesem Fall ist Prämisse x 2 = 9 wahr, die Konklusion x = 3 aber falsch, damit ist die gesamte Implikation falsch. Wendet man nun diese fehlerhafte Implikation bei der Auflösung der Gleichung x 2 − 8x + 7 = 0 an, so erhält man x 2 − 8x + 7 = 0 ⇒ x 2 − 8x = −7 „⇒“ ⇒ x −4=3 x 2 − 8x + 16 = 9 ⇒ ⇒ (x − 4)2 = 9 x =7 und „verliert“ somit die Lösung x = 1 der Gleichung. Der Fehler tritt an der Stelle auf, wo das Implikationszeichen ⇒ in Anführungsstriche gesetzt wurde. —– 6 —– Man könnte auch sagen, dass der Fehler in der Rechnung oben dadurch zu Stande kam, dass an einer Stelle eine notwendige Bedingung mit einer hinreichenden Bedingung verwechselt wurde: Die Gleichung (x − 4)2 = 9 ist zwar eine notwendige Bedingung dafür, dass x − 4 = 3 ist, aber eben keine hinreichende. Dieser Unterschied spielt, wie wir noch sehen werden, bei vielen mathematischen Sätzen eine wichtige Rolle, zum Beispiel bei der Bestimmung von lokalen Extremstellen einer Funktion. Häufig werden durch mehrfache Anwendung der Verknüpfungssymbole nicht nur zwei, sondern mehrere Aussagen miteinander verbunden. In welcher Reihenfolge dies geschieht, wird durch Klammern festgelegt. Beispielsweise bedeutet (ϕ ∧ ψ) ∨ ρ, dass zuerst ϕ und ψ miteinander „und“-verknüpft und diese Aussage dann anschließend mit der Aussage ρ noch „oder“-verknüpft wird. Um Schreibarbeit (also Klammern) einzusparen, legt man fest, dass bestimmte Symbole stärker binden als andere, vergleichbar mit der Konvention „Punktrechnung vor Strichrechnung“ aus der Arithmetik. Per Festlegung bindet das Negationszeichen ¬ am stärksten, danach in absteigender Reihenfolge die Zeichen ∧, ∨, ⇒ und ⇔ Beispielsweise ist der Ausdruck ¬ϕ ∧ ¬ψ ⇒ ϕ ⇔ ψ gleichbedeutend mit (((¬ϕ) ∧ (¬ψ)) ⇒ ϕ) ⇔ ψ. Gelegentlich kann der Wahrheitsgehalt einer zusammengesetzte Aussage bestimmt werden, ohne dass man die Teilaussagen, aus denen die Aussage besteht, überhaupt kennt. Solche Aussagen wirken auf den ersten Blick eher nutzlos, bilden aber die Grundlage für das logische Schließen innerhalb einer mathematischen Beweisführung. (1.2) Definition Eine zusammengesetzte Aussage, die unabhängig vom Wahrheitsgehalt ihrer Teilaussagen immer wahr ist, wird Tautologie genannt. Ein Beispiel für eine Tautologie ist die bekannte Bauernregel „Wenn der Hahn kräht auf dem Mist, dann ändert sich das Wetter, oder es bleibt, wie es ist.“ Isolieren wir hier die Teilaussagen ϕ = „Der Hahn kräht auf dem Mist.“ ψ = „Das Wetter ändert sich.“ und interpretieren den Satz „Das Wetter bleibt, wie es ist.“ als Negation ¬ψ von ψ, dann ist unsere Bauernregel φ in Kurzschreibweise durch ϕ ⇒ (ψ ∨ ¬ψ) gegeben. Wir wissen bereits, dass der Wahrheitsgehalt von φ nur von den Wahrheitswerten der Aussagen ϕ und ψ abhängt. Um zu kontrollieren, ob es sich bei φ um eine Tautologie handelt, genügt es also, alle möglichen Kombinationen von Wahrheitswerten für ϕ und ψ in den Ausdruck φ einzusetzen. —– 7 —– Wir erledigen dies durch Ausfüllen einer Tabelle. ϕ ψ ¬ψ ψ ∨ ¬ψ φ w w f w w w f w w w f w f w w f f w w w Die zusammengesetzte Aussage φ ist unabhängig von ϕ und ψ immer wahr, also eine Tautologie. Wir sagen, die Aussage ψ folgt aus den Aussagen ϕ1 , ..., ϕn durch einen (1.3) Definition logischen Schluss, wenn die Implikation ϕ1 ∧ ... ∧ ϕn ⇒ ψ eine Tautologie ist. Wir sehen uns nun eine Reihe von logischen Schlüssen an, die in der Mathematik häufig verwendet werden. Im folgenden bezeichnen ϕ, φ und ψ jeweils beliebige Aussagen. Mit Hilfe von Wahrheitstabellen wird überprüft, dass die logischen Schlüsse zulässig sind. (i) Modus Ponens ϕ ∧ (ϕ ⇒ ψ) ⇒ ψ „Wenn ϕ gilt und aus ϕ die Aussage ψ folgt, dann gilt ψ.“ ϕ ψ ϕ⇒ψ ϕ ∧ (ϕ ⇒ ψ) ϕ ∧ (ϕ ⇒ ψ) ⇒ ψ w w w w w f w w f w w f f f w f f w f w (ϕ ⇒ ψ) ⇔ (¬ψ ⇒ ¬ϕ) (ii) Beweis durch Kontraposition „Aus ϕ folgt ψ genau dann, wenn aus ¬ψ die Aussage ¬ϕ folgt. ϕ ψ ¬ϕ ¬ψ ϕ⇒ψ ¬ψ ⇒ ¬ϕ (ϕ ⇒ ψ) ⇔ (¬ψ ⇒ ¬ϕ) w w f f w w w w f f w f f w f w w f w w w f f w w w w w —– 8 —– (¬ϕ ⇒ φ ∧ ¬φ) ⇒ ϕ (iii) Beweis durch Widerspruch “Wenn aus ¬ϕ ein Widerspruch folgt (nämlich eine Aussage φ und zugleich auch ihr Gegenteil ¬φ), dann ist ϕ wahr.“ ϕ φ ¬ϕ ¬φ φ ∧ ¬φ ¬ϕ ⇒ φ ∧ ¬φ (¬ϕ ⇒ φ ∧ ¬φ) ⇒ ϕ w w f f f w w w f f w f w w f w w f f f w f f w w f f w (iv) Satz vom Ringschluss (ϕ ⇒ φ) ∧ (φ ⇒ ψ) ∧ (ψ ⇒ ϕ) ⇒ (ϕ ⇔ φ) ∧ (φ ⇔ ψ) ∧ (ψ ⇔ ϕ) „Wenn aus ϕ die Aussage φ und aus φ die Aussage ψ und aus ψ wieder die Aussage ϕ folgt, dann sind die drei Aussagen ϕ, φ und ψ äquivalent.“ Hier ist die Verifikation etwas aufwändiger als bei den vorherigen Regeln. Zur Abkürzung definieren wir A = ϕ ⇒ φ, B = φ ⇒ ψ, C = ψ ⇒ ϕ, D = ϕ ⇔ φ, E = φ ⇔ ψ und F = ψ ⇔ ϕ und erhalten ϕ φ ψ A B C D E F A∧ B ∧ C D∧E∧F A∧ B ∧ C ⇒ D ∧ E ∧ F w w w w w w w w w w w w w w f w f w w f f f f w w f w f w w f f w f f w w f f f w w f w f f f w f w w w w f f w f f f w f w f w f w f f w f f w f f w w w f w f f f f w f f f w w w w w w w w w Wir kommen nun zum zweiten großen Thema dieses Kapitels, der Mengenlehre. Fast die gesamte moderne Mathematik ist auf dem Fundament der Mengenlehre aufgebaut. Dies bedeutet, dass fast jedes mathematische Objekt, egal ob es sich dabei um eine Zahl, eine Funktion oder ein geometrisches Gebilde handelt, letztendlich durch eine Menge beschrieben werden kann. Desweiteren kann fast jede mathematische Aussage auf die Mengenlehre zurückgeführt und mit den Mitteln der Mengenlehre bewiesen werden, eine ganz erstaunliche Feststellung, wenn man sich die Vielfalt und Verschiedenartigkeit der mathematischen Strukturen vor Augen hält. (1.4) Definition (naive Mengendefinition von Cantor) „Eine Menge ist eine beliebige Zusammenfassung von bestimmten, wohlunterschiedenen Objekten unserer Anschauung oder unseres Denkens – welche die Elemente dieser Menge genannt werden – zu einem Ganzen.“ —– 9 —– Hierbei handelt es sich nicht um eine Definition im streng mathematischen Sinn; Begriffe wie „Zusammenfassung“, „Objekt“, „Anschauung“ usw. werden ihrerseits nicht definiert, sondern rein intuitiv verwendet. Auf Grund unserer Alltagserfahrung ist die Bedeutung der Cantorschen Definition dennoch unmittelbar klar. Jeder kann sich vorstellen, was es heißt, „Objekte unserer Anschauung“ zu einem „Ganzen“ zusammenzufassen (z.B. die Bürger einer Gemeinde, die Möbelstücke in einer Wohnung, die Moleküle eines Wassertropfens usw.), dasselbe gilt für die „Objekte unseres Denkens“ wie etwa die natürlichen Zahlen oder geometrische Figuren. Wir weisen auf zwei wichtige Punkte der Cantorschen Definition hin: Erstens sind sämtliche Objekte einer Menge verschieden, es ist also nicht möglich, dass ein und dasselbe Objekt mehrfach in einer Menge vorkommt. Zweitens ist jede Menge als „Zusammenfassung“ durch ihre Elemente eindeutig bestimmt. Dies bedeutet, dass zwei Mengen genau dann gleich sind, wenn sie dieselben Elemente enthalten. Folgende Kurzschreibweisen sind in der Mengenlehre üblich. x∈M Das Objekt x ist Element der Menge M . x∈ /M Das Objekt x ist kein Element der Menge M , in Kurzform also ¬(x ∈ M ). M ⊆N Jedes Element x von M ist auch ein Element von N , d.h. die Implikation x ∈ M ⇒ x ∈ N ist für alle Objekte x erfüllt. Man bezeichnet M dann als Teilmenge von N . M =N Es gilt x ∈ M ⇔ x ∈ N für alle Objekte x (äquivalent: M ⊆ N ∧ N ⊆ M ). M ⊇N gleichbedeutend mit N ⊆ M M (N M ⊆ N ∧ ¬(M = N ) M )N gleichbedeutend mit N ( M ∅ die leere Menge Dies ist die eindeutig bestimmte Menge die x ∈ / ∅ für alle Objekte x erfüllt, also die Menge, die kein einziges Objekt als Element besitzt. Es gibt mehrere Möglichkeiten, eine Menge konkret anzugeben. Zunächst kann dies umgangssprachlich geschehen. „Sei P die Menge aller Primzahlen.“ Eine andere Möglichkeit besteht darin, die Elemente einer Menge explizit aufzuzählen. M = {1, 2, 3, 4, 5, 6, 7} oder kürzer M = {1, 2, ..., 7} Bei der Verwendung von „ ... “ ist darauf zu achten, dass für den Leser klar ersichtlich ist, welche Elemente bei der Aufzählung weggelassen wurden. Schreibt man etwa P = {2, 3, 5, 7, 11, 13, 17, ...}, dann ist noch einigermaßen ersichtlich, dass die Menge der Primzahlen gemeint ist. Schwieriger wird das schon bei der Angabe M = {1, 4, ..., 64}. —– 10 —– Hier ist nicht ohne weiteres klar, ob die Menge {1, 4, 16, 64} = {40 , 41 , 42 , 43 } der ersten drei Viererpotenzen oder vielleicht {1, 4, 9, 16, 25, 36, 49, 64} = {12 , 22 , 32 , 42 , 52 , 62 , 72 , 82 }, die Menge der ersten acht Quadratzahlen, gemeint ist. Ein Vorteil der „ ... “-Schreibweise besteht aber darin, dass mit ihr auch unendliche Mengen direkt angeben werden können, zum Beispiel die Menge N = {1, 2, 3, ...} der natürlichen Zahlen. Um eine weitere Möglichkeit zur Definition von Mengen anzugeben, benötigen wir als neues Konzept den Begriff des Aussagenschemas. Dabei handelt es sich um einen Satz, in dem eine Reihe von Parametern x, y, ... vorkommen und der zu einer Aussage wird, wenn man die Parameter durch geeignete mathematische Objekte ersetzt. Beispielsweise ist der Satz „Die Zahl x ist eine Primzahl.“ ein Aussagenschema mit x als Parameter. Setzt man für x die Werte 4 oder 6 ein, so erhält man eine falsche Aussage. Setzt man dagegen 2 oder 13 ein, dann erhält man eine wahre Aussage. Ein Beispiel für ein Aussagenschema mit drei Parametern x, y, z ist die Gleichung x 2 + y 2 = z 2 . Hier erhält man durch Einsetzen von x = 3, y = 4, z = 5 eine wahre Aussage (denn es gilt 32 + 42 = 52 ), während zum Beispiel die Kombination x = 2, y = 3, z = −4 wegen 22 + 32 6= (−4)2 eine falsche Aussage liefert. Zu beachten ist, dass nicht im Allgemeinen natürlich nicht jede Einsetzung eine sinnvolle Aussage liefert. Zum Beispiel würde es keinen Sinn machen, in der Gleichung x 2 + y 2 = z 2 für x die leere Menge ∅ einzusetzen, da nicht ohne Weiteres klar ist, was der Ausdruck ∅2 + y 2 = z2 bedeuten soll. Noch einmal sei darauf hingewiesen, dass die Verwendung von nicht klar definierten Ausdrücken eine Hauptfehlerquelle beim Formulieren mathematischer Beweise ist! Schauen wir uns nun an, wie Aussagenschemata zur Definition von Mengen verwendet werden können. Sei ϕ ein Aussagenschema mit einem Parameter x und M eine Menge. Für jedes c ∈ M bezeichnen wir mit ϕ(c) den Satz, den man erhält, wenn der Parameter x durch c ersetzt wird. Wir setzen voraus, dass ϕ(c) für jedes c ∈ M eine sinnvolle Aussage ist. Nach Definition besteht dann die Menge N = { c ∈ M | ϕ(c)} aus genau denjenigen Elementen c von M , für die ϕ(c) eine wahre Aussage ist. Man nennt ϕ dann auch die definierende Bedingung für die Teilmenge N von M . Beispielsweise beschreibt {c ∈ R | c 2 < 1} die Menge derjenigen reellen Zahlen, deren Quadrat kleiner als 1 ist. In dieser Situation ist also M = R die Grundmenge und ϕ(x) = x 2 < 1 das Aussagenschema, dass die Teilmenge beschreibt. Offenbar ist c 2 < 1 für jedes c ∈ R eine sinnvolle, aber nur für −1 < c < 1 auch eine wahre Aussage. —– 11 —– Gelegentlich verwendet man auch die Notation N = { c | ϕ(c)}, ohne die Angabe einer Grundmenge für die Objekte c. In diesem Fall besteht N aus allen mathematischen Objekten c, für die die Aussage ϕ(c) wahr ist. Strenggenommen ist eine solche Definition für beliebige Aussagenschemta ϕ nicht zulässig, weil dies zu Widersprüchen führen kann (Stichwort „Russelsche Antinomie“). Wir werden die Notation aber nur in Situationen einsetzen, wo solche Probleme ausgeschlossen sind. Aus gegebenen Mengen können durch weitere Operationen neue Mengen definiert werden. Seien A und B beliebig vorgegebene Mengen. Folgende Mengeoperationen sind in der Mathematik allgemein gebräuchlich. Durchschnitt A ∩ B = { a | a ∈ A∧ a ∈ B } Vereinigung A ∪ B = { a | a ∈ A∨ a ∈ B } Differenz A \ B = { a | a ∈ A∧ a ∈ /B} kartesisches Produkt A × B = { (a, b) | a ∈ A ∧ b ∈ B } Potenzmenge P (A) = { B|B⊆A} Einige dieser Operationen lassen sich durch sog. Venn-Diagramme veranschaulichen. Durchschnitt Vereinigung Differenz Das kartesische Produkt A × B besteht aus allen Paaren (a, b), die mit Elementen a ∈ A und b ∈ B gebildet werden können. Ist bespielsweise A = {1, 2, 3} und B = {1, 2, 4, 5}, dann erhalten wir (1, 1), (1, 2), A × B = {1, 2, 3} × {1, 2, 4, 5} = (2, 1), (2, 2), (3, 1), (3, 2), (1, 4), (1, 5), (2, 4), (2, 5), (3, 4), (3, 5) (Die Elemente wurden nur zur besseren Übersicht in einem rechteckigen Schema angeordnet. Man hätte auch alle 12 Elemente direkt hintereinander schreiben können.) Bei der Definition des kartesischen Produkts ist zu beachten, dass zwei Paare (a, b) und (c, d) von Objekten a, b, c, d nur dann gleich sind, wenn a = c und b = d erfüllt ist. Zum Beispiel sind die Paare (3, 5) und (5, 3) verschieden. Im Gegensatz dazu stimmen die zweielementigen Mengen {3, 5} und {5, 3} überein, da es keine Rolle spielt, in welcher Reihenfolge die Elemente einer Menge aufgezählt werden. —– 12 —– Das kartesische Produkt kann auch mit mehr als zwei Mengen gebildet werden. Die Elemente bezeichnet man dann nicht mehr als Paare, sondern als Tupel. Sind beispielsweise A, B, C drei beliebige Mengen, dann setzt man A× B × C = { (a, b, c) | a ∈ A , b ∈ B , c ∈ C} wobei wieder (a, b, c) = (a0 , b0 , c 0 ) nur dann erfüllt ist, wenn a = a0 , b = b0 und c = c 0 gilt. Es ist also beispielsweise (1, 2, 3) 6= (1, 3, 2) und (2, 2, 4) 6= (2, 4, 2). Häufig werden mehrfache kartesische Produkte auch mit ein- und derselp ben Menge gebildet. Man definiert A2 = A×A, A3 = A×A×A, A4 = A×A×A×A usw. Beispielsweise ist (3, 4, 21 , 2, −9) eine Element der Menge R5 . Bei den Potenzmengen ist zu beachten, dass deren Elemente selbst wieder Mengen sind! Nach Definition ist für jede beliebige Mengen A, B die Aussage B ∈ P (A) äquivalent zu B ⊆ A. Intuitiv klar ist, dass bei einer endlichen Menge A die Potenzmenge P (A) ebenfalls nur endlich viele Elemente enthält. Ist beispielsweise A = {1, 2, 3}, dann enthält jede Teilmenge von A entweder kein, genau ein, genau zwei oder genau drei Elemente. Dies kann für eine systematische Aufzählung der Elemente von P (A) verwendet werden: Es gilt P (A) = { ∅, {1}, {2}, {3}, {1, 2}, {1, 3}, {2, 3}, {1, 2, 3} }. die achtelementige Potenzmenge von {1, 2, 3} Eine häufige Fehlerquelle beim Umgang mit Mengen besteht darin, dass man zwischen einer Menge und ihren Elementen nicht klar unterscheidet. Beispielsweise wäre es falsch zu sagen, dass die 1 ein Element von P (A) ist. Lediglich die Menge {1} ist ein Element von P (A), und 1 ist ein Element der Menge {1}. Momentan klingt das noch recht haarspalterisch; bei komplizierteren mengentheoretischen Konstruktionen (zum Beispiel Faktorstrukturen) kommt man aber in große Schwierigkeiten, wenn man sich an diese Unterscheidung nicht gewöhnt hat. Eine wichtige Grundtechnik beim Führen von Beweisen ist der Nachweis der Gleichheit zweier Mengen. Häufig bietet es sich an, die Aussage M = N in die folgenden beiden Teilaussagen zu zerlegen und diese einzeln zu beweisen. (i) Ist x ein Element der Menge M , dann ist x auch ein Element von N . (ii) Ist x ein Element der Menge N , dann ist x auch ein Element von M . Aus der ersten Aussage folgt M ⊆ N , aus der zweiten N ⊆ M , insgesamt also M = N . —– 13 —– Wie die Beweise der Teilaussagen (i) und (ii) aussehen können, schauen wir uns an einem konkreten Beispiel an. Unser Ziel ist der Beweis der Gleichung { (x, y, z) ∈ R3 | (x y + 1)z = 0 } = { (x, y, 0) | x, y ∈ R } ∪ { (x, − 1x , z) | x ∈ R \ {0} , z ∈ R }. Wir bezeichnen die Menge auf der linken Seite der Gleichung mit M und die Menge auf der rechten Seite der Gleichung mit N . Die Menge N enthält also alle Tupel der Form (x, y, 0) mit x, y ∈ R und alle Tupel der Form (x, − 1x , z) mit x, z ∈ R und x 6= 0. Beweis der Teilaussage (i) Sei p ∈ M . Nach Definition von M gilt p = (x, y, z) ∈ R3 mit x, y, z ∈ R und (x y + 1)z = 0. Aus dieser Gleichung folgt x y + 1 = 0 oder z = 0, denn das Produkt zweier reeller Zahlen ist nur dann gleich Null, wenn einer der beiden Faktoren gleich Null ist. Ist z = 0, dann hat p die Form (x, y, 0) mit x, y ∈ R, also liegt p in N . Ist dagegen x y + 1 = 0, dann muss x 6= 0 gelten, denn ansonsten wäre x y + 1 = 0 · y + 1 = 1. Aus x y + 1 = 0 folgt x y = −1, wegen x 6= 0 dann auch y = − 1x und somit ebenfalls p = (x, y, z) = (x, − 1x , z) ∈ N . Beweis der Teilaussage (ii) Sei p ∈ N . Dann gilt p = (x, y, 0) mit geeigneten x, y ∈ R oder p = (x, − 1x , z) für geeignete x ∈ R \ {0} und ein z ∈ R. Betrachten wir zunächst den Fall p = (x, y, 0) mit x, y ∈ R. Setzen wir z = 0, dann gilt p = (x, y, z) ∈ R3 und (x y + 1)z = (x y + 1) · 0 = 0. Daraus folgt p ∈ M . Betrachten wir nun den Fall, dass p = (x, − 1x , z) für ein x ∈ R \ {0} und ein z ∈ R gilt. Setzen wir y = − 1x , dann liegt p = (x, y, z) in R3 . Außerdem gilt (x y + 1)z = (x · (− 1x ) + 1)z = ((−1) + 1)z = 0 · z = 0. Also liegt p auch in diesem Fall in M . In einfacheren Situationen lässt sich die Gleichheit zweier Mengen auch durch eine Kette von Äquivalenzumformungen beweisen. Als Beispiel betrachten wir die Mengengleichung { x ∈ R | x2 + x − 6 = 0 } = { −3, 2 }. Wieder sei M die Menge auf der linken und N die Menge auf der rechten Seite der Gleichung. Es gilt M = N , wenn wir für jedes Objekt x die Äquivalenz x ∈ M ⇔ x ∈ N beweisen können. Da M und N beides Teilmengen von R sind, genügt es, die Äquivalenz für alle x ∈ R zu beweisen, denn ansonsten sind die Aussagen x ∈ M und x ∈ N beide falsch und die Äquivalenz damit auf jeden Fall wahr. Sei also x ∈ R vorgegeben. Dann gilt x∈M ⇔ ⇔ x2 + x − 6 = 0 (x + 12 )2 − ⇔ 5 2 2 =0 x2 + x = 6 ⇔ ((x + 12 ) + 52 )((x + 21 ) − 52 ) = 0 x +3=0∨ x −2=0 ⇔ ⇔ x2 + x + 1 4 ⇔ x = −3 ∨ x = 2 —– 14 —– ⇔ = 25 4 ⇔ ⇔ (x + 21 )2 = 5 2 2 (x + 3)(x − 2) = 0 x ∈ {−3, 2} ⇔ x ∈ N. Hier wurde nichts anderes getan, als die Gleichung durch Bildung der qudratischen Ergänzung zu lösen. Wichtig ist bei solchen Beweisen, dass jeder einzelne Schritt genau begründet werden kann, und dass jeweils beide Implikationsrichtungen gültig sind. Beispielsweise wäre x = 3 ⇔ x 2 = 9 keine zulässige Äquivalenzumformung, weil die Implikationsrichtung „⇐“ nicht für jede reelle Zahl x gültig ist. (Wie wir bereits oben festgestellt haben, ist sie ist für x = −3 falsch.) In vielen Situationen möchte man Aussagen formulieren, die die Gesamtheit der Elemente einer Menge betreffen. Dazu verwendet man den sog. Allquantor ∀ und den Existenzquantor ∃. Sei ϕ ein Aussagenschema mit x als Parameter, und wiederum sei M eine Menge mit der Eigenschaft, dass man für jedes c ∈ M durch Ersetzung von x durch c eine sinnvolle Aussage ϕ(c) erhält. Dann kann man mit Hilfe von All- und Existenzquantor zwei neue Aussagen ∀x ∈ M : ϕ und ∃x ∈ M : ϕ bilden, die man als quantifizierte Aussagen bezeichnet. (1.5) Definition (i) Die Aussage ∀x ∈ M : ϕ bedeutet, dass ϕ(c) für alle c ∈ M wahr ist. Es gilt also {c ∈ M | ϕ(c)} = M . (ii) Die Aussage ∃x ∈ M : ϕ bedeutet, dass ϕ(c) für mindestens ein c ∈ M wahr ist. Es gilt also {c ∈ M | ϕ(c)} = 6 ∅. Betrachten wir beispielsweise das Aussagenschema x ≤ 5 mit dem Parameter x über der Menge M = R der reellen Zahlen und bezeichnen es mit ϕ. (i) Die Aussage ∀x ∈ R : x ≤ 5 ist falsch, denn ϕ(c) ist nicht für alle c ∈ R erfüllt. Beispielsweise ist ϕ(7) falsch. (ii) Die Aussage ∃x ∈ R : x ≤ 5 ist wahr, denn es gibt Elemente c ∈ R, für die ϕ(c) wahr ist. Zum Beispiel ist ϕ(4) eine wahre Aussage. Die meisten Aussagen, die wir im Laufe der Zeit beweisen werden, sind quantifizierte Aussagen, enthalten also die Formulierungen „für alle“ oder „es gibt ein x, so dass...“. Dabei treten besonders zu Anfang häufig methodische Fehler auf. Um eine Aussage der Form ∀x ∈ M : ϕ zu beweisen, muss die Aussage ϕ(c) für jedes c ∈ M bewiesen werden. Dazu gibt man sich mit der Floskel „Sei c ∈ M .“ ein beliebiges Element c aus M vor und beweist anschließend die Aussage ϕ(c). Während des Beweises darf dann nur verwendet werden, dass c ein Element der Menge M ist. Jede Einschränkung oder Spezialisierung von c macht den Beweis ungültig. Um andererseits eine Aussage der Form ∃x ∈ M : ϕ zu beweisen, genügt es, ein spezielles Element c ∈ M anzugeben und die Aussage ϕ(c) nur für dieses c zu beweisen. Natürlich kann es schwierig sein, ein solches c erst einmal zu finden. Um beispielsweise die Aussage ∃x ∈ R : x 2 + x − 6 = 0 auf diesem Weg zu beweisen, muss eine Lösung der quadratischen Gleichung x 2 + x − 6 = 0 gefunden werden. —– 15 —– Gelegentlich hat man es auch mit der Negation einer quantifizierten Aussage zu tun. Auf Grund der beiden Äquivalenzen ¬∀x ∈ M : ϕ(x) ⇔ ∃x ∈ M : ¬ϕ(x) ¬∃x ∈ M : ϕ(x) ⇔ ∀x ∈ M : ¬ϕ(x) und kann diese aber leicht auf eine nicht-negierte Aussage zurückgeführt werden. Dass diese beiden Äquivalenzen gelten, wird unmittelbar klar, wenn sie umgangssprachlich formuliert: Die Aussage ϕ(c) ist genau dann nicht für alle c ∈ M wahr, wenn es (mindestens) ein c ∈ M mit ¬ϕ(c) gibt. Ebenso kann die Aussage ¬∃x ∈ M : ϕ(x) umgangssprachlich formuliert werden durch „Es gibt kein c ∈ M mit ϕ(c).“ Dies ist offenbar gleichbedeutend damit, dass ¬ϕ(c) für alle c ∈ M gilt. Schließlich ist es noch möglich, mehrere Quantoren zu verschachteln. In diesem Fall benötigt man Aussagenschemata mit mehreren Parametern. Sei ϕ ein Aussagenschema mit den beiden Parametern x, y und M , N Mengen mit der Eigenschaft, dass man für alle c ∈ M und d ∈ N eine sinnvolle Aussage ϕ(c, d) erhält, wenn man x durch c und y durch d ersetzt. Dann ist ∀ y ∈ N : ϕ ein Aussagenschema, das nur noch vom Parameter x abhängt, und ∃x ∈ M : ∀ y ∈ N : ϕ ist eine Aussage, mit zwei ineinander verschachtelten Quantoren. Umgangssprachlich bedeutet diese Aussage: „Es gibt ein c ∈ M , so dass für alle d ∈ N jeweils ϕ(c, d) gilt.“ Dabei sind die Quantoren ∃ und ∀ in beliebiger Kombination zugelassen. Es ergeben sich dadurch Aussagen mit unterschiedlicher Bedeutung. • Der Ausdruck ∀x ∈ M : ∃ y ∈ N : ϕ bedeutet: „Für jedes c ∈ M gibt es ein d ∈ N , so dass ϕ(c, d) gilt.“ • Der Ausdruck ∃x ∈ M : ∃ y ∈ N : ϕ bedeutet: „Es gibt Elemente c ∈ M und d ∈ N , so dass ϕ(c, d) gilt.“ • Der Ausdruck ∀x ∈ M : ∀ y ∈ N : ϕ bedeutet: „Für alle c ∈ M und d ∈ N gilt ϕ(c, d).“ Man beachte, dass auch die Aussagen ∀x ∈ M : ∃ y ∈ N : ϕ und ∃ y ∈ N : ∀x ∈ M : ϕ nicht etwa gleichbedeutetend sind, es kommt also auch auf die Reihenfolge der Quantoren an. Wir machen uns dies am Beispiel des Aussagenschemas x < y mit den Parametern x, y klar, das wir wieder mit ϕ bezeichnen. Offenbar erhält man jedes Mal eine sinnvolle Aussage, wenn man für x und y Elemente aus R, der Menge der reellen Zahlen, einsetzt. Die Aussage ∃x ∈ R : ∀ y ∈ R : x < y bedeutet nun: „Es gibt ein c ∈ R, so dass für alle d ∈ R jeweils c < d gilt.“ Diese Aussage ist offenbar falsch. Denn nehmen wir an, es gibt ein solches c. Dann ist d = c − 1 offenbar kleiner als c, und nicht größer. Somit ist c < d nicht für alle d ∈ R erfüllt. Die Aussage ∀ y ∈ R : ∃x ∈ R : x < y bedeutet andererseits, dass für jedes d ∈ R jeweils ein c ∈ R mit c < d existiert. Diese Aussage ist wahr. Geben wir nämlich ein beliebiges d ∈ R vor, dann können wir c = d − 1 setzen, und die Aussage c < d ist offenbar erfüllt. —– 16 —– Kommen wir nun zum letzten Thema dieses Kapitels, der vollständigen Induktion. Wir werden die Menge N = {1, 2, 3, ...} der natürlichen Zahlen in Kapitel 3 als Teilmenge der reellen Zahlen definieren. Trotzdem soll an dieser Stelle bereits mit N gearbeitet werden. Wir setzen folgende Aussagen über die Menge N als bekannt voraus. Sie sind in der Literatur unter dem Namen Peano-Axiome bekannt, benannt nach dem italienischen Mathematiker Guiseppe Peano (1858-1932) und lauten (P1) Es gibt ein ausgezeichnetes Element in N, das wir mit 1 bezeichnen. (P2) Jedes n ∈ N besitzt einen eindeutig bestimmten Nachfolger, der mit n + 1 bezeichnet wird. (P3) Kein Element aus N besitzt die 1 als Nachfolger. (P4) Sind m, n ∈ N mit m + 1 = n + 1, dann folgt m = n. Hinzu kommt noch das wichtige (P5) Induktionsprinzip: Sei ϕ ein Aussagenschema mit folgenden Eigenschaften: Für jedes n ∈ N ist ϕ(n) eine sinnvolle Aussage, darüber hinaus seien ϕ(1) und ∀x ∈ N : ϕ(x) ⇒ ϕ(x + 1) wahre Aussagen. Dann ist auch ∀x ∈ N : ϕ(x) wahr. Die Anwendung des Induktionsprinzips bezeichnet man als vollständige Induktion, es ist eines der wichtigsten Beweisprinzipien der Mathematik. Wir werden sehen, dass in vielen Situationen die Beweise der Aussagen ϕ(1) und ∀x ∈ N : ϕ(x) ⇒ ϕ(x + 1) erheblich einfacher sind als ein direkter Beweis von ∀x ∈ N : ϕ(x). Wie wir im nächsten Abschnitt sehen werden, kann das Induktionsprinzip zum Beispiel dafür benutzt werden, um auf den natürlichen Zahlen die Addition und die Multiplikation zu definieren, und um die aus der Schule bekannten Rechengesetze herzuleiten, zum Beispiel Assoziativ-, Kommutativ- und Distributivgesetz. Wir nehmen aber hier an, dass wir die aus der Schule bekannten Zahlbereiche schon zur Verfügung haben und betrachten als Beispiel den folgenden „Klassiker“ unter den Induktionsbeweisen. (1.6) Satz Sei n ∈ N. Dann ist die Summe der ersten n natürlichen Zahlen gegeben durch 1 + 2 + ... + n = 1 n(n + 1). 2 (Wir werden im nächsten Abschnitt sehen, wie sich der Ausdruck 1 + 2 + ... + n mit Hilfe des Summenzeichens kompakter schreiben lässt.) Beweis: Unser Ziel besteht darin, das Induktionsprinzip auf das Aussagenschema 1 + 2 + ... + x = 1 x(x 2 + 1) mit dem Parameter x anzuwenden. Bezeichnen wir dieses Aussagenschema mit ϕ, dann müssen wir also ϕ(1) und ∀x ∈ N : ϕ(x) ⇒ ϕ(x + 1) beweisen. Die Aussage ϕ(1) lautet 1 = wahr, denn tatsächlich gilt 1 2 · 1 · (1 + 1) = 1 2 · 1 · 2 = 1. —– 17 —– 1 2 · 1 · (1 + 1). Diese Aussage ist offensichtlich Nun beweisen wir ∀x ∈ N : ϕ(x) ⇒ ϕ(x + 1). Sei dazu n ∈ N vorgegeben. Dann ist ϕ(n) ⇒ ϕ(n + 1) zu zeigen. Setzen wir dazu voraus, dass ϕ(n) wahr ist. Dann gilt 1 + 2 + ... + n = 21 n(n + 1). Diese Gleichung bleibt erhalten, wenn wir auf beiden Seiten n + 1 addieren, es gilt also 1 + 2 + ... + n + (n + 1) = 12 n(n + 1) + (n + 1). Wegen 1 n(n + 1) + (n + 1) 2 = 21 n(n + 1) + 1 · (n + 1) = ( 21 n + 1)(n + 1) = 1 (n + 2)(n + 1) 2 = 12 (n + 1)((n + 1) + 1) erhalten wir 1+2+...+n+(n+1) = 12 (n+1)((n+1)+1). Also gilt auch ϕ(n+1). Damit ist insgesamt die Implikation ϕ(n) ⇒ ϕ(n + 1) bewiesen. In einem Induktionsbeweis über ein Aussagenschema ϕ bezeichnet man den Beweis von ϕ(1) als Induktionsanfang und den Beweis der Implikation ϕ(n) ⇒ ϕ(n + 1) für ein beliebig vorgegebenes n ∈ N als Induktionsschritt. Die Teilaussage ϕ(n) nennt man dabei die Induktionsvoraussetzung. Jeder Induktionsbeweis sollte so aufgeschrieben sein, dass klar zu erkennen ist, an welcher Stelle die Induktionsvoraussetzung verwendet wird. —– 18 —– § 2. Relationen und Abbildungen Inhaltsübersicht Eine Relation zwischen zwei Mengen X und Y ist eine Teilmenge des kartesischen Produkts X × Y ; intuitiv kann man sich darunter eine Beziehung zwischen den Elementen der Mengen X und Y vorstellen. Besonders einfache Beispiele für Relationen sind die Halb- und Totalordnungen. Auch Abbildungen zwischen Mengen sind Relationen. Für diese definieren wir die wichtigen Eigenschaften injektiv, surjektiv und bijektiv. Mit Hilfe der bijektiven Abbildungen kann auch die Mächtigkeit einer Menge definiert werden. Ist die Menge endlich, so handelt es sich dabei einfach um die Anzahl der Elemente. Mit Hilfe der vollständigen Induktion aus §1 leiten wir einige Rechenregeln für die Mächtigkeit endlicher Mengen her. Außerdem behandeln wir einige Grundlagen zu unendlichen Mengen. Zum Schluss führen wir noch das Summen- und Produktzeichen ein, formulieren auch hierfür einige Rechenregeln und diskutieren Anwendungen. (2.1) Definition Seien X und Y Mengen. Eine Relation zwischen X und Y ist eine Teilmenge R ⊆ X × Y . Eine Teilmenge R ⊆ X × X nennt man auch eine Relation auf der Menge X . Intuitiv kann man sich eine Relation R als Beziehung zwischen den Elemente von X und Y vorstellen. Für beliebige x ∈ X und y ∈ Y soll (x, y) ∈ R genau dann gelten, wenn x und y miteinander in Beziehung stehen. Betrachten wir als erstes Beispiel die Relation | auf der Menge X = {1, 2, 3, 4, 5, 6} gegeben durch | = { (a, b) ∈ X × X | a ist Teiler von b }. Man bezeichnet diese Relation als Teilerrelation. In ausgeschriebener Form handelt es sich um die Menge | = { (1, 1), (1, 2), (1, 3), (1, 4), (1, 5), (1, 6), (2, 2), (2, 4), (2, 6), (3, 3), (3, 6), (4, 4), (5, 5), (6, 6) } ⊆ X × X. Alternativ könnte man die Relation | auch in Tabellenform darstellen, wobei man für jedes Element von X eine Zeile und eine Spalte vorsieht und an der Position (x, y) genau dann ein Kreuz X setzt, wenn (x, y) ∈ | gilt. Dies würde dann folgendermaßen ausehen. | 1 2 3 4 5 6 1 X X X X X X 2 X X X X 3 X X 4 X 5 X 6 —– 19 —– Natürlich kann man die Teilerrelation auch auf der gesamten Menge N der natürlichen Zahlen betrachten. Da N aber unendlich ist, kann man die Elemente von | natürlich nicht mehr einzeln angeben, weder als Aufzählung noch in Tabellenform. Viele Relationen auf R lassen sich wiederum graphisch darstellen, weil es dabei um nichts anderes als eine Teilmenge der Ebene R2 = R × R handelt. So könnte man etwa die Punkte, die zur Relation gehören, in der Ebene blau einzeichnen. Für die Relationen R = {(x, y) ∈ R2 | x ≤ y} , S = {(x, y) ∈ R2 | y = x 2 } und T = {(x, y) ∈ R2 | x 2 + y 2 ≤ 1} würde man zum Beispiel die folgenden Bilder erhalten. Relation R Relation S Relation T Es sei noch darauf hingewiesen, dass eine Relation R ⊆ X × Y keine bestimmte „Bedeutung“ zu haben braucht, sondern vollkommen willkürlich gewählt werden kann. So ist zum Beispiel auch R = {(3, 7), (19, 8), (2, 44)} eine Relation auf N. Um allerdings zu mathematisch „interessanten“ Relationen zu kommen, beschränkt man sich auf Relationen mit bestimmten festgelegten Eigenschaften. Die folgende Klasse von Relationen ist in ausnahmelos jedem Teilgebiet der Mathematik zu finden. (2.2) Definition Sei X eine Menge und ≤⊆ X × X eine Relation auf X . Für x, y ∈ X schreiben wir x ≤ y als Abkürzung für die Aussage (x, y) ∈≤. Man nennt ≤ eine Halbordnung auf X , wenn folgende Bedingungen erfüllt sind. (i) ∀x ∈ X : x ≤ x (Reflexivität) (ii) ∀x, y ∈ X : x ≤ y ∧ y ≤ x ⇒ x = y (Anti-Symmetrie) (iii) ∀x, y, z ∈ X : x ≤ y ∧ y ≤ z ⇒ x ≤ z (Transitivität) Zwei Elemente x, y ∈ X werden vergleichbar genannt, wenn x ≤ y oder y ≤ x gilt. Man bezeichnet ≤ als Totalordnung, wenn zwei beliebig vorgegebene Elemente x, y ∈ X jeweils vergleichbar sind. —– 20 —– Man überprüft unmittelbar, dass die gewöhnliche ≤-Relation auf N, Z, Q und R jeweils eine Totalordnung ist. Die Eigenschaften dieser Totalordnungen werden wir im folgenden §3 genauer untersuchen. Wir hatten bereits weiter oben die Teilerrelation | auf der Menge N der natürlichen Zahlen angesprochen. Dies ist ein Beispiel für eine Halbordnung, die aber keine Totalordnung ist. Wir überprüfen die Halbordnungs-Eigenschaften. Für jede Zahl n ∈ N gilt n = 1 · n, also gilt n | n. Dies zeigt, dass die Relation reflexiv ist. Zur Überprüfung der AntiSymmetrie seien m, n ∈ N mit m | n und n | m vorgegeben. Nach Definition der Teilbarkeit gibt es k, ` ∈ N mit n = k · m und m = ` · n. Durch Einsetzen erhalten wir n = k · (` · n) = (k · `) · n, also k · ` = 1 und m = n. Damit ist die Anti-Symmetrie nachgewiesen. Um die Transitivität zu überprüfen, seien m, n, p ∈ N mit m | n und n | p vorgegeben. Es gibt k, ` ∈ N mit n = k · m und p = ` · n. Wegen p = ` · (k · m) = (k · `) · m folgt m | p. Um zu zeigen, dass | keine Totalordnung ist, genügt es, zwei nicht vergleichbare Elemente m, n ∈ N anzugeben. Dies ist beispielsweise für m = 2 und n = 3 der Fall, denn weder ist 2 ein Teiler von 3, noch umgekehrt 3 ein Teiler von 2. Beschränkt man sich auf eine endliche Teilmenge von N, zum Beispiel auf die Menge der Teiler einer festen Zahl n ∈ N, dann lässt sich die Teilbarkeitsrelation graphisch darstellen. Ein von unten nach oben verlaufender Weg von einem Element x zu einem Element y soll dabei bedeuten, dass x | y erfüllt ist. Für die Fälle n = 24 und n = 27 erhält man zum Beispiel die folgenden Bilder. Die lineare Struktur des Graphen rechts zeigt an, dass es sich bei der Relation | auf der Menge {1, 3, 9, 27} um eine Totalordnung handelt. Die Teiler von 24 bilden aber nur eine Halbordnung. Eine weitere wichtige Klasse von Halbordnungen erhält man durch die Inklusionsrelationen. Ist X eine beliebige Menge, dann ist Relation ⊆ eine auf der Potenzmenge P (X ) eine Halbordnung. Denn für alle A ∈ P (X ) gilt offenbar A ⊆ A, also ist die Relation ⊆ reflexiv. Sind A, B ∈ P (X ) mit A ⊆ B und B ⊆ A vorgegeben, dann folgt A = B, wie wir bereits in §1 festgestellt haben. Also ist die Relation anti-symmetrisch. Für A, B, C ∈ P (X ) folgt aus A ⊆ B und B ⊆ C offenbar A ⊆ C, also ist die Relation auch transitiv. Enthält die Menge X allerdings mindestens zwei verschiedene Elemente a, b, dann ist ⊆ keine Totalordnung auf P (X ), denn es gilt dann weder {a} ⊆ {b} noch {b} ⊆ {a}. Die Elemente {a} und {b} aus P (X ) sind also nicht miteinander vergleichbar. —– 21 —– Wie im vorherigen Beispiel ist (zumindest bei einer endlichen Menge X ) auch eine graphische Veranschaulichung der Relation ⊆ auf P (X ) möglich. Für die Potenzmengen {1}, {1, 2} und {1, 2, 3} ergeben sich beispielsweise die folgenden Bilder. Ist ≤ eine allgemeine Halbordnung auf einer beliebigen Menge X , dann verwenden wir die folgenden abkürzenden Schreibweisen. a≥b für b≤a a<b für a ≤ b ∧ a 6= b a>b für b ≤ a ∧ b 6= a Wir kommen nun zu einer weiteren wichtigen Klasse von Relationen, den Abbildungen. (2.3) Definition Seien X , Y Mengen. Eine Relation R zwischen X und Y wird Abbildung genannt, wenn für jedes x ∈ X genau ein y ∈ Y mit (x, y) ∈ R existiert. In Formelschreibweise: (i) ∀x ∈ X : ∃ y ∈ Y : (x, y) ∈ R (ii) ∀x ∈ X : ∀ y, y 0 ∈ Y : (x, y) ∈ R ∧ (x, y 0 ) ∈ R ⇒ y = y 0 . Dabei nennt man X den Definitions- und Y den Wertebereich der Abbildung. Für gegebenes x ∈ X bezeichnet man das eindeutig bestimmte y ∈ R mit der Eigenschaft (x, y) ∈ R mit R(x) und nennt es das Bild von x unter R. Die Notation R : X → Y drückt aus, dass R eine Abbildung von X nach Y , also eine Abbildung mit Definitionsbereich X und Wertebereich Y ist. Die Schreibweise x 7→ y ist gleichbedeutend mit y = R(x); man sagt auch, dass R dem Element x das Element y zuordnet. An Stelle des Großbuchstabens R bezeichnet man Abbildungen normalerweise mit kleinen lateinischen oder griechischen Buchstaben (zum Beispiel f oder φ). Ob eine Relation R auf der Menge R der reellen Zahlen eine Abbildung ist, ob also für jedes x ∈ R genau ein y ∈ R mit (x, y) ∈ R existiert, lässt sich gut an der graphischen Darstellung von R erkennen. —– 22 —– Zum Beispiel ist S = {(x, y) ∈ R2 | y = x 2 } eine Abbildung, denn für jeden x-Wert (grün) gibt es genau einen zugehörigen Punkt (x, y) ∈ S (rot), also genau ein y ∈ R mit (x, y) ∈ R. Dagegen ist T = {(x, y) ∈ R2 | x 2 + y 2 ≤ 1} keine Abbildung, denn für einige x-Werte (zum Beispiel für x = 1,2) gibt es gar kein y mit (x, y) ∈ T . Für andere x-Werte (zum Beispiel x = 0) gibt es dagegen gleich mehrere, sogar unendlich viele, zugehörige y-Werte, was bei einer Abbildung ebenfalls nicht zulässig ist. Als nächstes definieren wir zwei wichtige Operationen: die Einschränkung und die Komposition von Funktionen. Die erste Operation läuft darauf hinaus, dass man den Definitionsbereich einer Funktion f verkleinert. (2.4) Proposition Sind X , Y Mengen, f ⊆ X × Y eine Abbildung und U ⊆ X . Dann ist durch f |U = {(x, y) ∈ f | x ∈ U} eine Abbildung von U nach Y definiert. Wir bezeichnen sie als die Einschränkung von f auf die Teilmenge U. Beweis: Zu überprüfen ist, dass die Relation f |U ⊆ U × Y die Abbildungs-Eigenschaft besitzt. Wenn es für jedes x ∈ X genau ein y ∈ Y mit (x, y) ∈ f gibt, dann gilt das erst recht für alle x ∈ U. Für x ∈ U ist aber (x, y) ∈ f gleichbedeutend mit (x, y) ∈ f |U . (2.5) Proposition Seien X , Y, Z Mengen und f : X → Y , g : Y → Z zwei Abbildungen. Dann ist g ◦ f = { (x, z) ∈ X × Z | ∃ y ∈ Y : (x, y) ∈ f ∧ ( y, z) ∈ g } eine Abbildung von X nach Z. Sie wird als Komposition der Abbildungen f und g bezeichnet. Beweis: Zunächst zeigen wir, dass für jedes x ∈ X mindestens ein z ∈ Z mit (x, z) ∈ g ◦ f existiert. Sei dazu x ∈ X vorgegeben. Weil f eine Abbildung ist, gibt es ein y ∈ Y mit (x, y) ∈ f . Auf Grund der Abbildungs-Eigenschaft von g existiert auch ein z ∈ Z mit ( y, z) ∈ g. Aus (x, y) ∈ f und ( y, z) ∈ g folgt aber (x, z) ∈ g ◦ f . —– 23 —– Nun zeigen wir, dass es für jedes x ∈ X nicht mehr als ein z ∈ Z gibt, so dass (x, z) ∈ X × Y erfüllt ist. Sei x ∈ X vorgegeben, und seien z1 , z2 ∈ Z mit (x, z1 ), (x, z2 ) ∈ g ◦ f . Zu zeigen ist z1 = z2 . Nach Definition von g ◦ f gibt es y1 , y2 ∈ Y mit (x, y1 ), (x, y2 ) ∈ f und ( y1 , z1 ), ( y2 , z2 ) ∈ g. Weil aber f eine Abbildung ist, folgt aus (x, y1 ) ∈ f und (x, y2 ) ∈ f die Gleichung y1 = y2 . Es gilt also ( y1 , z1 ), ( y1 , z2 ) ∈ g, und weil auch g eine Abbildung ist, erhalten wir z1 = z2 wie gewünscht. Die Bildung der Komposition g ◦ f bedeutet praktisch formuliert einfach, dass f in g eingesetzt wird. Denn nach Definition bedeutet z = (g ◦ f )(x) für beliebiges x ∈ X und z ∈ Z, dass ein y ∈ Y mit (x, y) ∈ f und ( y, z) ∈ g existiert. Es gilt also y = f (x) und z = g( y), insgesamt also (g ◦ f )(x) = z = g( y) = g( f (x)). Später werden wir häufig mit Abbildungen auf den reellen Zahlen arbeiten, zum Beispiel f : R → R, x 7→ x + 1 oder g : R → R, x 7→ x 2 . Die Komposition von f und g ergibt in diesem Fall also (g ◦ f )(x) = g( f (x)) = g(x + 1) = (x + 1)2 für alle x ∈ R. Man kann sich das Zusammenspiel von f , g und g ◦ f durch folgendes Diagramm veranschaulichen. Eine Abbildung wirkt nicht nur auf einzelne Elemente, sondern auch auf Teilmengen ihres Definitions- und Bildbereichs. Die folgenden beiden Konzepte werden später bei der Formulierung der Ketten- und der Umkehrregel in der Analysis eine wichtige Rolle spielen. (2.6) Definition Seien f : X → Y eine Abbildung und U ⊆ X , V ⊆ Y . (i) Die Teilmenge f (U) = { f (x) | x ∈ U} ⊆ Y wird die Bildmenge von U unter der Abbildung f genannt. Es handelt sich um die Elemente von Y , die man dadurch erhält, dass man f auf ein Element aus U anwendet. (ii) Die Teilmenge f −1 (V ) = {x ∈ X | f (x) ∈ V } ⊆ X wird die Urbildmenge von V unter f genannt. Sie besteht aus genau den Elementen von X , die nach V abgebildet werden. —– 24 —– Wir betrachten als Beispiel die Abbildung f : X → Y zwischen den Mengen X = {−3, −2, −1, 0, 1, 2, 3} und Y = {0, 1, 2, 3, 4, 9} gegeben durch f (x) = x 2 für alle x ∈ X . Seien U ⊆ X und V ⊆ Y gegeben durch U = {−1, 0} und V = {3, 4, 9}. Bestimmung der Bildmenge f (U) Bestimmung der Urbildmenge f −1 (V ) Nach Definition besteht f (U) aus allen Elementen, die man durch Quadrierung von Elementen aus U = {−1, 0} erhält, also (−1)2 = 1 und 02 = 0. Die Urbildmenge f −1 (V ) enthält alle Elemente x ∈ X , deren Quadrat in V = {3, 4, 9} liegt. Wegen (−2)2 = 22 = 4 und (−3)2 = 32 = 9 sind dies die Zahlen −3, −2, 2, 3. (2.7) Proposition Sei f : X → Y eine Abbildung, U ⊆ X und V ⊆ Y . Dann gilt (i) f ( f −1 (V )) ⊆ V Beweis: (ii) U ⊆ f −1 ( f (U)) zu (i) Ist y ∈ f ( f −1 (V )), dann gibt es nach Definition der Bildmenge ein x ∈ f −1 (V ) mit y = f (x). Aus x ∈ f −1 (V ) folgt f (x) ∈ V , insgesamt also y = f (x) ∈ V . zu (ii) Sei x ∈ U vorgegeben. Dann gilt f (x) ∈ f (U). Das Element x wird also auf ein Element aus f (U) abgebildet. Nach Definition der Urbildmenge folgt daraus unmittelbar x ∈ f −1 ( f (U)). Anhand passender Beispiele werden wir uns in den Übungen klarmachen, dass die beiden Inklusionen in der Proposition im Allgemeinen keine Gleichungen sind, es braucht also weder f ( f −1 (V )) = V noch f −1 ( f (U)) = U zu gelten. Die Operationen „Bildmenge“ und „Urbildmenge“ heben sich also nicht immer gegenseitig auf. (2.8) Definition Sei f : X → Y eine Abbildung. (i) Wenn für alle x 1 , x 2 aus f (x 1 ) = f (x 2 ) jeweils x 1 = x 2 folgt, dann nennt man die Abbildung injektiv. (ii) Wenn für jedes y ∈ Y ein x ∈ X mit f (x) = y existiert, dann heißt die Abbildung surjektiv. (iii) Eine Abbildung f , die sowohl injektiv als auch surjektiv ist, bezeichnet man als bijektiv. Die drei soeben definierten Eigenschaften von Abbildungen lassen sich auch mit Hilfe der Urbildmengen charakterisieren. Eine Abbildung ist genau dann injektiv, wenn f −1 ({ y}) für jedes y ∈ Y höchstens ein Element enthält. Zum —– 25 —– Beweis setzen wir die Injektivität voraus und geben uns ein beliebiges y ∈ Y vor. Sind nun x 1 , x 2 ∈ f −1 ({ y}), dann gilt f (x 1 ) = y = f (x 2 ), und aus der Injektivität folgt x 1 = x 2 . Dies zeigt, dass f −1 ({ y}) keine zwei verschiedenen Elemente enthält. Setzen wir umgekehrt voraus, dass f −1 ({ y}) für jedes y ∈ Y höchstens ein Element enthält, und seien x 1 , x 2 ∈ X mit f (x 1 ) = f (x 2 ). Setzen wir y = f (x 1 ), dann sind x 1 , x 2 beides Elemente von f −1 ({ y}). Weil aber f −1 ({ y}) nach Voraussetzung höchstens einelementig ist, muss x 1 = x 2 gelten. Damit ist die Injektivität bewiesen. Auf ähnliche Weise zeigt man, dass die Surjektivität gleichbedeutend damit ist, dass f −1 ({ y}) für jedes y ∈ Y aus mindestens einem Element besteht. Ebenfalls zur Surjektivität äquivalent ist die Gleichung f (X ) = Y , denn nach Definition besteht f (X ) genau aus den Elementen y ∈ Y , für die ein x ∈ X mit f (x) = y existiert. Aus den Feststellungen zur Injektivität und Surjektivität ergibt sich unmittelbar, dass eine Abbildung f : X → Y genau dann bijektiv ist, wenn die Menge f −1 ({ y}) für jedes y ∈ Y jeweils genau ein Element enthält. Wieder schauen wir uns die neuen Begriffe anhand einer Reihe von Beispielen an. (i) Sei M = {1, 2, 3, 4} und N = {1, 2, 3, 4, 5}. Die Abbildung f : M → N mit f (a) = a für 1 ≤ a ≤ 4 ist injektiv. Dafür müssen wir zeigen, dass die Aussage ∀x 1 , x 2 ∈ M : f (x 1 ) = f (x 2 ) ⇒ x 1 = x 2 gültig ist. Seien also a1 , a2 ∈ M mit f (a1 ) = f (a2 ) vorgegeben. Dann gilt a1 = f (a1 ) = f (a2 ) = a2 , also ist die Implikation f (a1 ) = f (a2 ) ⇒ a1 = a2 tatsächlich für alle a1 , a2 ∈ M erfüllt. Die Abbildung ist aber nicht surjektiv, denn es gibt kein a ∈ M mit f (a) = 5. (ii) Sei M = {1, 2, 3} und N = {1, 2}. Dann ist die Abbildung f : M → N gegeben durch 1 7→ 1, 2 7→ 2, 3 7→ 2 zwar surjektiv, aber nicht injektiv. Zwar gibt es für jedes b ∈ N = {1, 2} ein a ∈ M mit f (a) = b ( f (1) = 1, f (2) = 2), aber die Implikation f (a1 ) = f (a2 ) ⇒ a1 = a2 ist beispielsweise für a1 = 2, a2 = 3 nicht erfüllt. (iii) Die Abbildung f : R → R, x 7→ x 2 ist weder injektiv noch surjektiv. Die Implikation f (a1 ) = f (a2 ) ⇒ a1 = a2 ist beispielsweise für a1 = −1, a2 = 1 nicht erfüllt, und es gibt kein a ∈ R mit f (a) = −1. (iv) Die Abbildung f : R → R, x 7→ x + 1 ist bijektiv. Zunächst zeigen wir die Injektivität. Sind a1 , a2 ∈ R beliebig vorgegeben, dann gelten die Implikationen f (a1 ) = f (a2 ) ⇒ a1 + 1 = a2 + 1 ⇒ a1 = a2 , also ist ∀x 1 , x 2 ∈ R : f (x 1 ) = f (x 2 ) ⇒ x 1 = x 2 wahr. Ist b ∈ R beliebig vorgegeben, dann setzen wir a = b−1 und erhalten f (a) = f (b − 1) = (b − 1) + 1 = b. Für jedes b ∈ R gibt es also ein a ∈ R mit f (a) = b, d.h. die Aussage ∀ y ∈ R : ∃x ∈ R : f (x) = y ist erfüllt. —– 26 —– (v) Für jede Menge X nennt man idX : X → X , x 7→ x die identische Abbildung oder Identität auf der Menge X . Sie ist offenbar ebenfalls bijektiv. (2.9) Satz Die Komposition zweier injektiver (bzw. surjektiver, bijektiver) Abbildungen ist injektiv (bzw. surjektiv, bijektiv). Beweis: Seien X , Y, Z Mengen und f : X → Y , g : Y → Z Abbildungen. Zunächst setzen wir voraus, dass f und g injektiv sind und beweisen die Injektivität von g ◦ f . Seien dazu x 1 , x 2 ∈ X mit (g ◦ f )(x 1 ) = (g ◦ f )(x 2 ) vorgegeben. Nach Definition der Komposition ◦ ist dies gleichbedeutend mit g( f (x 1 )) = g( f (x 2 )). Weil g injektiv ist, folgt daraus f (x 1 ) = f (x 2 ). Weil auch f injektiv ist, erhalten wir x 1 = x 2 . Damit ist die Injektivität von g ◦ f bewiesen. Nun setzen wir voraus, das f und g surjektiv sind, und beweisen die Surjektivität von g ◦ f . Sei z ∈ Z vorgegeben. Zu zeigen ist, dass ein x ∈ X mit (g ◦ f )(x) = z existiert. Weil g surjektiv ist, gibt es ein y ∈ Y mit g( y) = z. Weil auch f surjektiv ist, existiert ein x ∈ X mit f (x) = y. Insgesamt gilt also (g ◦ f )(x) = g( f (x)) = g( y) = z. Damit ist die Surjektivität von g ◦ f bewiesen. Setzen wir nun voraus, dass f und g bijektiv sind. Dann sind f und g insbesondere injektiv, und wie wir im ersten Absatz gezeigt haben, folgt daraus die Injektivität von g ◦ f . Die Abbildung f und g sind auch beide surjektiv. Wie im zweiten Absatz gezeigt, folgt daraus die Surjektivität von g ◦ f . Als injektive und surjektive Abbildung ist g ◦ f also insgesamt bijektiv. Oft werden wir auch die folgende Charakterisierung injektiver, surjektiver und bijektiver Abbildungen verwenden. (2.10) Satz Seien X , Y nichtleere Mengen und f : X → Y eine Abbildung. (i) Es ist f genau dann injektiv, wenn eine Abbildung g : Y → X mit g ◦ f = idX existiert. (ii) Sie ist genau dann surjektiv, wenn es ein g : Y → X mit f ◦ g = idY gibt. (iii) Sie ist bijektiv genau dann, wenn ein g : Y → X mit den Eigenschaften g ◦ f = idX und f ◦ g = idY existiert. Die Abbildung g mit diesen beiden Eigenschaften ist dann eindeutig bestimmt. Man nennt sie die Umkehrabbildung von f und bezeichnet sie mit f −1 . Beweis: zu (i) „⇒“ Sei f : X → Y eine injektive Abbildung und x 0 ∈ X ein beliebig gewähltes Element. Gibt es für y ∈ Y ein Urbild von x ∈ X , so ist dieses eindeutig bestimmt, und wir definieren g( y) = x. Besitzt y dagegen kein Urbild, dann setzen wir g( y) = x 0 . Ist nun x ∈ X und y = f (x), dann ist x das eindeutig bestimmte Urbild von y, und nach Definition von g gilt (g ◦ f )(x) = g( f (x)) = g( y) = x = idX (x). Also besitzt g die gewünschte Eigenschaft g ◦ f = idX . —– 27 —– Sei f : X → Y eine Abbildung und g : Y → X mit g ◦ f = idX . Wir müssen zeigen, dass f injektiv ist. Seien „⇐“ dazu x 1 , x 2 ∈ X Elemente mit f (x 1 ) = f (x 2 ). Dann gilt x 1 = idX (x 1 ) = (g ◦ f )(x 1 ) = g( f (x 1 )) = g( f (x 2 )) = (g ◦ f )(x 2 ) = idX (x 2 ) = x 2 . Also ist f tatsächlich injektiv. zu (ii) „⇒“ −1 xy ∈ f Sei f : X → Y eine surjektive Abbildung. Für jedes y ∈ Y wählen wir ein beliebiges Urbild ({ y}) und definieren g( y) = x y . Für jedes y ∈ Y gilt dann ( f ◦ g)( y) = f (g( y)) = f (x y ) = y = idY ( y), also besitzt g die gewünschte Eigenschaft. Sei f : X → Y eine Abbildung und g : Y → X mit f ◦ g = idY . Um die Surjektivität von f nachzuweisen, „⇐“ müssen wir zeigen, dass es für jedes y ∈ Y ein x ∈ X mit f (x) = y existiert. Ein solches Element x ist durch x = g( y) gegeben, denn es gilt f (g( y)) = ( f ◦ g)( y) = idY ( y) = y. zu (iii) „⇐“ Sei f : X → Y eine Abbildung und g : Y → X mit g ◦ f = idX und f ◦ g = idY . Dann ist f nach (i) injektiv, nach (ii) surjektiv, insgesamt also bijektiv. „⇒“ Sei f : X → Y eine bijektive Abbildung. Dann gibt es nach (i) eine Abbildung g1 : Y → X mit g1 ◦ f = idX und nach (ii) eine Abbildung g2 : Y → X mit f ◦ g2 = idY . Wir zeigen, dass g1 = g2 gilt. Für gegebenes y ∈ Y erhalten wir auf Grund unserer Voraussetzungen g1 ( y) = g1 (idY ( y)) = g1 (( f ◦ g2 )( y)) = g1 ( f (g2 ( y))) = (g1 ◦ f )(g2 ( y)) = idX (g2 ( y)) = g2 ( y). Also gilt tatsächlich g1 = g2 , d.h. g = g1 ist eine Abbildung mit den beiden gewünschten Eigenschaften. Sei nun h : Y → X eine weitere Abbildung mit h ◦ f = idX und f ◦ h = idY . Aus g ◦ f = idX und f ◦ h = idY folgt dann, wie soeben gezeigt, die Identität g = h. Also ist g eindeutig bestimmt. Eine wichtige Anwendung der Abbildungen ist die Definition der Mächtigkeit einer Menge. Für jedes n ∈ N sei Mn = {1, 2, ..., n} jeweils die Menge der natürlichen Zahlen k mit 1 ≤ k ≤ n. Außerdem setzen wir M0 = ∅. (2.11) Definition Sei n ∈ N0 . Man sagt, eine Menge A besteht aus n Elementen oder hat die Mächtigkeit n, falls eine bijektive Abbildung ϕ : Mn → A existiert. Wir schreiben dann |A| = n. (2.12) Definition Eine Menge A ist endlich, falls ein n ∈ N0 mit |A| = n existiert. Ansonsten bezeichnen wir die Menge A als unendlich. Wir müssen sicherstellen, dass unsere Definition der Mächtigkeit einer endlichen Menge eindeutig ist, dass also nicht |A| = m und |A| = n für zwei verschiedene Zahlen m, n ∈ N0 gilt. Dies erfordert ein wenig Aufwand. —– 28 —– (2.13) Lemma Sei A eine beliebige Menge, und seien a, b ∈ A zwei verschiedene Elemente. Dann ist die Abbildung τab : A → A gegeben durch b falls x = a τab (x) = a falls x = b x sonst eine Bijektion. (Die Abbildung τab vertauscht die beiden Elemente a und b miteinander, alle übrigen Elemente werden auf sich selbst abgebildet.) Beweis: Zunächst beweisen wir die Surjektivität. Sei y ∈ A vorgegeben. Ist y = a, dann gilt τab (b) = y. Im Fall y = b ist τab (a) = y, und im verbleibenden Fall y ∈ / {a, b} gilt τab ( y) = y. Also liegt y auf jeden Fall in der Bildmenge der Abbildung τab . Zum Nachweis der Injektivität seien u, v ∈ A mit τab (u) = τab (v) vorgegeben. Ist τab (u) = τab (v) = a, dann muss u = v = b gelten. Im Fall τab (u) = τab (v) = b gilt u = v = a. Ist schließlich τab (u) nicht in {a, b} enthalten, dann folgt u = τab (u) = τab (v) = v. Für den Beweis der nächsten Aussage bemerken wir vorweg, dass die vollständige Induktion aus §1 statt über N auch über N0 = N ∪ {0} geführt werden kann, wenn man den Induktionsanfang bei n = 0 ansetzt. (2.14) Proposition Sei n ∈ N0 . Dann ist jede injektive Abbildung Mn → Mn auch surjektiv. Beweis: Wir beweisen die Aussage durch vollständige Induktion über n ∈ N0 . Die einzige Abbildung von M0 nach M0 ist wegen M0 = ∅ die leere Menge, und diese ist nach Definition sowohl injektiv als auch surjektiv (also bijektiv). Damit ist die Aussage für n = 0 bewiesen. Sei nun n ∈ N0 vorgegeben und ψ : Mn+1 → Mn+1 eine injektive Abbildung. Zu zeigen ist, dass ψ auch surjektiv ist. Zunächst betrachten wir den Fall, dass ψ(n + 1) = n + 1 ist. Dann gilt ψ(Mn ) ⊆ Mn . Denn wäre dies nicht der Fall, dann gäbe es ein k ∈ Mn mit ψ(k) = n + 1, was aber wegen ψ(k) = n + 1 = ψ(n + 1) im Widerspruch zur Injektivität von ψ stehen würde. Mit ψ ist auch die Einschränkung ψ| Mn injektiv. Es handelt sich also um eine injektive Abbildung Mn → Mn ; laut Induktions- voraussetzung ist diese auch surjektiv. Daraus folgt ψ(Mn ) = Mn . Wegen ψ(n+1) = n+1 ist damit insgesamt gezeigt, dass jedes Element in Mn+1 von ψ getroffen wird, die Abbildung ψ also surjektiv ist. Damit ist die Betrachtung dieses Falls abgeschlossen. Betrachten wir nun den Fall, dass ψ(n + 1) = k mit k ∈ Mn gilt. Weil τk,n+1 nach (2.13) bijektiv ist, ist nach (2.9) mit ψ auch die Abbildung ψ̃ = τk,n+1 ◦ ψ injektiv; darüber hinaus gilt ψ̃(n + 1) = (τk,n+1 ◦ ψ)(n + 1) = τk,n+1 (ψ(n + 1)) = τk,n+1 (k) = n + 1. Wie im vorherigen Absatz gezeigt, folgt daraus, dass ψ̃ surjektiv ist. Aber damit ist auch ψ = τ−1 ◦ ψ̃ surjektiv. k,n+1 Damit ist der Induktionsschritt abgeschlossen. —– 29 —– Aus (2.14) folgt nun in der Tat die Eindeutigkeit von |A| für eine endliche Menge A. Denn nehmen wir an, es gäbe m, n ∈ N0 mit m < n und der Eigenschaft, dass sowohl |A| = m als auch |A| = n erfüllt ist. Dann gäbe es Bijektionen ϕ : Mm → A und ψ : Mn → A. Nach (2.9) wäre dann durch α = ϕ −1 ◦ ψ eine bijektive Abbildung Mn → Mm gegeben. Wegen Mm ⊆ Mn können wir α als injektive Abbildung Mn → Mn auffassen. Wegen α(Mn ) = Mm ( Mn ist α als Abbildung Mn → Mn jedoch nicht surjektiv. Wir haben also eine injektive, nicht surjektive Abbildung Mn → Mn konstruiert. Aber die Existenz einer solchen Abbildung ist nach (2.14) ausgeschlossen. Also war unsere Annahme falsch, es kann nicht gleichzeitig |A| = m und |A| = n gelten. (2.15) Proposition Zwei endliche Mengen A, B haben genau dann dieselbe Mächtigkeit, wenn eine Bijektion A → B existiert. Beweis: „⇒“ Sei n ∈ N0 mit |A| = n = |B|. Die Gleichung |A| = n bedeutet, dass eine bijektive Abbildung ϕ : Mn → A existiert. Aus |B| = n folgt, dass es eine Bijektion ψ : Mn → B gibt. Nach (2.9) ist durch ψ ◦ ϕ −1 eine Bijektion von A nach B gegeben. „⇐“ Weil A endlich ist, gibt es ein n ∈ N0 und eine Bijektion ϕ : Mn → A. Außerdem existiert nach Voraussetzung eine Bijektion ψ : A → B. Somit ist ψ ◦ ϕ eine Bijektion Mn → B, und daraus folgt |B| = n = |A|. (2.16) Proposition Eine Menge A ist genau dann unendlich, wenn eine injektive Abbildung N → A existiert. Beweis: „⇐“ Nehmen wir an, es gibt eine injektive Abbildung ψ : N → A, obwohl A endlich ist. Setzen wir |A| = n, dann existiert also eine bijektive Abbildung ϕ : Mn → A. Durch Einschränkung von ψ auf Mn+1 erhalten wir eine injektive Abbildung Mn+1 → A. Durch α = ϕ −1 ◦(ψ| Mn+1 ) ist dann eine injektive Abbildung Mn+1 → Mn gegeben. Aufgefasst als Abbildung Mn+1 → Mn+1 ist diese injektiv, aber nicht surjektiv wegen α(Mn+1 ) = Mn ( Mn+1 . Da nach (2.14) eine solche Abbildung nicht existiert, war unsere Annahme falsch. Wenn eine injektive Abbildung ψ : N → A existiert, muss A also unendlich sein. „⇒“ Nun setzen wir voraus, dass A unendlich ist. Wir konstruieren eine Abbildung ψ : N → A, indem wir die Bilder ψ(n) der Reihe nach definieren. Zunächst wählen wir ein beliebiges Element a ∈ A und setzen ψ(1) = a. Diese Abbildung ist offenbar injektiv. Sei nun n ∈ N, und nehmen wir an, dass ψ auf der Teilmenge Mn ⊆ N bereits definiert und dort injektiv ist. Wäre ψ(Mn ) = A, dann hätten wir eine Bijektion zwischen Mn und A. Die Menge A wäre dann endlich, im Widerspruch zur Annahme. So aber können wir ein neues Element a ∈ A\ ψ(Mn ) wählen und ψ(n + 1) = a setzen. Dann ist ψ auf Mn+1 weiterhin injektiv, denn wegen der Injektivität von ψ| Mn ist ψ(k) = ψ(`) für k < ` und k, ` ∈ Mn ausgeschlossen. Wegen ψ(n + 1) = a ∈ / ψ(Mn ) ist k ∈ Mn und ` = n + 1 ebenfalls unmöglich. Wir erhalten so eine Abbildung ψ, die auf ganz N definiert ist. Auch diese ist injektiv. Wäre nämlich ψ(k) = ψ(`) für zwei k, ` ∈ N mit k < `, dann würde sich ein Widerspruch zur Injektivität von ψ| M` ergeben. —– 30 —– Wir beweisen nun ein einige Rechenregeln für die Mächtigkeit endlicher Mengen. (2.17) Satz (i) Sind A und B endliche disjunkte Mengen, ist also A ∩ B = ∅, dann gilt |A ∪ B| = |A| + |B|. (ii) Ist B endlich und A ⊆ B, dann gilt |A| ≤ |B| und |B \ A| = |B| − |A|. (iii) Sind A und B beliebige endliche Mengen, dann gilt |A ∪ B| = |A| + |B| − |A ∩ B| und |A × B| = |A| × |B|. (iv) Für jede endliche Menge A gilt |P (A)| = 2|A| . Ist A also eine endliche Menge, dann ist sowohl P (A) als auch jede Teilmenge von A endlich. Beweis: zu (i) Sei m = |A| und n = |B|. Dann gibt es Bijektionen ϕ : Mm → A und ψ : Mn → B. Wir definieren nun eine Abbildung α : Mm+n → A ∪ B durch α(k) = ϕ(k) für 1 ≤ k ≤ m und α(k) = ψ(k − m) für m + 1 ≤ k ≤ n. Wenn wir zeigen können, dass α bijektiv ist, dann folgt daraus |A ∪ B| = m + n = |A| + |B|. Zum Nachweis der Injektivität seien k, ` ∈ Mm+n mit α(k) = α(`) vorgegeben. Ist k ∈ Mm , dann muss auch ` ∈ Mm gelten, denn ansonsten wäre α(k) = α(`) ein Element von A ∩ B, was wegen A ∩ B = ∅ ausgeschlossen ist. Nach Definition der Abbildung α folgt daraus ϕ(k) = α(k) = α(`) = ϕ(`), und weil ϕ injektiv ist, erhalten wir k = `. Ist k > m, dann folgt wegen A ∩ B = ∅ ebenso ` > m. Wir erhalten α(k) = ψ(k − m) = ψ(` − m) = α(`) und wiederum k = `, diesmal auf Grund der Injektivität von ψ. Zum Nachweis der Surjektivität sei x ∈ A ∩ B vorgegeben. Dann gilt x ∈ A oder x ∈ B. Ist x ∈ A, dann gibt es ein k ∈ Mm mit ϕ(k) = x. Daraus folgt α(k) = x. Gilt dagegen x ∈ B, so existiert ein k ∈ Mn mit ψ(k) = x, und wir erhalten α(k + m) = x. Damit ist die Surjektivität bewiesen, insgesamt ist α also bijektiv. zu (ii) Sei n = |B|. Zum Beweis von |A| ≤ n nehmen wir an, dass A unendlich ist oder zumindest |A| ≥ n + 1 gilt. Im ersten Fall gibt es nach (2.16) eine injektive Abbildung N → A, im zweiten eine bijektive Abbildung M r → A für ein r ≥ n + 1. In beiden Fällen können wir die Abbildung zu einer injektiven Abbildung Mn+1 → A einschränken, die wir wegen A ⊆ B auch als injektive Abbildung ϕ : Mn+1 → B betrachten können. Wegen |B| = n gibt es nun eine Bijektion ψ : Mn → B. Durch ψ−1 ◦ ϕ ist dann eine injektive Abbildung Mn+1 → Mn definiert. Fassen wir diese als Abbildung α : Mn+1 → Mn+1 auf, so ist α zwar injektiv, wegen α(Mn+1 ) = Mn ( Mn+1 aber nicht surjektiv. Die Existenz einer solchen Abbildung ist durch (2.14) ausgeschlossen. Also war unsere Annahme falsch, und |A| ≤ n ist bewiesen. Weil die Menge B disjunkt in A und B \ A zerlegt werden kann, gilt nach Teil (i) |B| = |A| + |B \ A|, also |B \ A| = |B| − |A|. —– 31 —– zu (iii) Zum Beweis der ersten Gleichung zerlegen wir |A ∪ B| disjunkt in die Teilmengen A ∩ B, A \ (A ∩ B) und B \ (A ∩ B). Durch Anwendung von (i) und (ii) erhalten wir |A ∪ B| = |A ∩ B| + |A \ (A ∩ B)| + |B \ (A ∩ B)| = = |A ∩ B| + (|A| − |A ∩ B|) + (|B| − |A ∩ B|) |A| + |B| − |A ∩ B|. Die Gleichung |A × B| = |A| · |B| beweisen wir durch vollständige Induktion über n = |B|. Ist n = 0, dann gilt B = ∅ und A× B = ∅, also |A× B| = 0 = |A|·0 = |A|·|B|. Ist n = 1, dann gilt B = {b} für ein b ∈ B. Wir bemerken, dass durch A → A × B, a 7→ (a, b) eine Bijektion gegeben ist. Denn aus (a1 , b) = (a2 , b) folgt a1 = a2 , also ist die Abbildung injektiv. Andererseits hat jedes Element in A×B die Form (a, b) für ein a ∈ A, stimmt also mit dem Bild von a überein. Daraus folgt die Surjektivität. Insgesamt ist die Abbildung bijektiv. Mit (2.15) erhalten wir |A × B| = |A| = |A| · |B|. Sei nun n ∈ N vorgegeben, und setzen wir die Aussage für dieses n voraus. Sei |B| = n + 1, b ∈ B ein beliebig gewähltes Element und B 0 = B \ {b}. Nach (i) gilt |B 0 | = |B| − 1 = n, und die Induktionsvoraussetzung liefert |A × B 0 | = |A| · n. Weil A × B sich disjunkt in die Teilmengen A × B 0 und A × {b} zerlegen lässt, gilt |A × B| = |A × B 0 | + |A × {b}| = |A| · n + |A| = |A|(n + 1) = |A| · |B|. zu (iv) Der Beweis erfolgt durch vollständige Induktion über n = |A|. Ist n = 0, dann gilt A = ∅. Die leere Menge besitzt nur eine Teilmenge, nämlich ∅. Es gilt also P (A) = {∅} und somit |P (A)| = 1 = 20 . zum Induktionsschritt im Beweis von (2.17)(iv) Sei nun n ∈ N0 , und setzen wir die Aussage für n voraus. Sei nun A eine (n + 1)-elementige Menge. Zu zeigen ist |P (A)| = 2n+1 . Dazu wählen wir ein beliebiges Element a ∈ A und setzen A0 = A \ {a}. Dann gilt |A0 | = n, und nach Induktionsvoraussetzung gilt |P (A0 )| = 2n . Wir betrachten nun die disjunkte Zerlegung P (A) = S ∪ T mit S = {B ∈ P (A) | a ∈ / B} —– und T 32 —– = {B ∈ P (A) | a ∈ B}. Nach Definition gilt S = P (A0 ), denn die Teilmengen von A0 sind genau die Teilmengen B ⊆ A mit a ∈ / B. Zwischen den Mengen S und T ist durch φ : S → T , B 7→ B ∪ {a} eine Bijektion gegeben, denn ψ : T → S , B 7→ B \ {a} ist offenbar die Umkehrabbildung von φ. Nach (2.15) folgt daraus |S | = |T |. Wir erhalten nun |P (A)| = |S | + |T | = 2|S | = 2|P (A0 )| = 2 · 2n = 2n+1 . Damit ist der Induktionsschritt abgeschlossen. (2.18) Definition Für jede Menge B und jedes k ∈ N0 sei Pk (B) jeweils die Anzahl der k- elementigen Teilmengen von B, also ¨ Pk (B) Für alle k, n ∈ N0 definieren wir n k = « A ∈ P (B) |A| = k . = |Pk (Mn )| und bezeichnen diese Zahl als den Binomial- koeffizienten von n über k. Beispielsweise ist 5 3 = 10, denn M5 = {1, 2, 3, 4, 5} hat genau zehn dreielementige Teilmengen, nämlich {1, 2, 3} , {1, 2, 4} , {1, 2, 5} , {1, 3, 4} , {1, 3, 5} , {1, 4, 5} , {2, 3, 4} , {2, 3, 5} , {2, 4, 5} , {3, 4, 5}. Einige Binomialkoeffizienten lassen sich direkt angeben. Für alle k, n ∈ N0 gilt n n n n n =1 , = n und = falls k ≤ n, außerdem = 0 falls k > n. 0 1 k n−k k n Die Gleichung 0 = 1 ergibt sich aus der Feststellung, dass Mn nur eine nullelementige Teilmenge besitzt, nämlich die leere Menge. Für n ∈ N0 mit n ≥ 1 sind die einelementigen Teilmengen von Mn offenbar genau die Mengen n {1}, {2}, ..., {n}, daraus folgt n = 1. Sind k, n ∈ N0 mit k > n, dann gibt es nach (2.17) (i) keine k-elementigen n Teilmengen von |Mn |. Daraus folgt k = 0 für k > n. Die Gleichung n k = n n−k ist für k ≤ n ergibt sich durch folgende Überlegung: Ist A ⊆ Mn eine k-elementige Teilmenge, dann ist Mn \ A nach nach (2.17) (ii) eine n − k elementige Teilmenge. Durch Φ : A 7→ Mn \ A ist also eine Abbildung Pk (Mn ) → Pn−k (Mn ) gegeben. Diese besitzt Pn−k (Mn ) → Pk (Mn ), B 7→ Mn \ B als Umkehrabbildung. Denn wegen n − (n − k) = k ist Mn \ B für jedes B ∈ Pn−k (Mn ) in Pk (Mn ) enthalten, und wegen Mn \ (Mn \ A) = A, Mn \ (Mn \ B) = B für alle A ∈ Pk (Mn ) und B ∈ Pn−k (Mn ) sind die beiden Abbildungen tatsächlich zueinander invers. Die folgenden beiden Aussagen ermöglichen die Berechnung beliebiger Binomialkoeffizienten. (2.19) Proposition Seien k, n ∈ N0 , wobei k ≥ 1 ist. Dann gilt n n n+1 = + . k k k−1 —– 33 —– Beweis: Wir betrachten die disjunkte Zerlegung von Pk (Mn+1 ) = S ∪ T in die Teilmengen ¨ « ¨ « S = A ∈ Pk (Mn+1 ) n + 1 ∈ A und T = A ∈ Pk (Mn+1 ) n + 1 ∈ /A , wobei T = Pk (Mn ) ist. Offenbar handelt es sich bei φ : Pk−1 (Mn ) → S , A 7→ A ∪ {n} um eine Bijektion, denn ψ : S → Pk−1 (Mn ), B 7→ B \ {n} ist eine Umkehrabbildung von φ. Daraus folgt |Pk (Mn )| = |S |, und insgesamt n+1 n n erhalten wir k = |Pk (Mn+1 )| = |S | + |T | = |Pk (Mn )| + |Pk−1 (Mn )| = k + k−1 . n Aus dieser Formel ergibt sich als Berechnungsschema das sogenannte Pascalsche Dreieck. Ist ` für jedes ` ∈ N0 n+ bereits bekannt, dann lässt sich der Wert k dadurch berechnen, dass man die im Dreieck unmittelbar darüber n n stehenden Werte k−1 und k einfach addiert. 0 0 1 1 0 1 1 3 3 1 2 1 3 2 3 1 3 0 1 2 2 2 1 2 0 1 1 3 3 1 Um eine explizite, nicht-rekursive Formel für die Binomialkoeffizienten anzugeben, benötigen wir die Fakultätsfunktion. Es handelt sich dabei um eine Abbildung N0 → N, n 7→ n!, die rekursiv definiert ist durch 0! = 1 (n + 1)! und = (n + 1) · n! für alle n ∈ N0 . Es gilt also 1! = 1·0! = 1, 2! = 2·1! = 2, 3! = 3·2! = 6, 4! = 4·3! = 24, 5! = 5·4! = 120 usw. Insgesamt handelt es sich um eine sehr schnell wachsende Funktion. Zum Beispiel ist 30! = 265.252.859.812.191.058.636.308.480.000.000, das sind immerhin schon 33 Dezimalstellen. (2.20) Satz Für alle k, n ∈ N0 mit k ≤ n gilt n n! = k k!(n − k)! . Wir beweisen die Aussage durch vollständige Induktion über n ∈ N0 , jeweils für alle k ∈ N0 mit k ≤ n. 0 0! Für n = k = 0 folgt die Gleichung aus 0 = 1 = 0!·0! erfüllt. Sei nun n ∈ N0 beliebig vorgegeben, und setzen wir die Beweis: Gleichung für dieses n und alle k ∈ N0 mit k ≤ n voraus. Unter dieser Voraussetzung beweisen wir die Gleichung n+1 (n+1)! für n + 1 und 1 ≤ k ≤ n + 1. Ist k = 0, so gilt 0 = 1 = 0!(n+1)! . Für 1 ≤ k ≤ n folgt die Gleichung mit Hilfe von (2.19) aus der Rechnung n+1 k = n!(n − k + 1) k!(n − k)!(n − k + 1) n k + + n k−1 = n!k k(k − 1)!(n − k + 1)! —– n! k!(n − k)! = 34 + n! (k − 1)!(n − k + 1)! n!((n − k + 1) + k) k!(n − k + 1)! —– = = (n + 1)! k!(n + 1 − k)! . Der einzige verbleibende Fall ist k = n + 1. Weil Mn+1 die einzige (n + 1)-elementige Menge von Mn+1 ist, gilt n+1 (n+1)! = |Pn+1 (Mn+1 )| = 1, und ebenso ist (n+1)!0! gleich 1. n+1 Nachdem wir uns bis jetzt mit der Mächtigkeit endlicher Mengen beschäftigt haben, wenden wir uns nun den unendlichen Mengen zu. (2.21) Definition Wir bezeichnen zwei Mengen A und B als gleichmächtig (oder als Mengen mit gleicher Mächtigkeit) und schreiben |A| = |B|, wenn eine Bijektion φ : A → B existiert. Mit Hilfe dieser Definition können nun auch verschiedene Arten von unendlichen Mengen gegeneinander abgegrenzt werden. (2.22) Definition Eine Menge A wird abzählbar unendlich genannt, wenn sie die gleiche Mächtigkeit wie N0 besitzt. Eine Menge, die endlich oder abzählbar unendlich ist, nennen wir höchstens abzählbar. Eine Menge, die nicht höchstens abzählbar ist, bezeichnet man als überabzählbar. Als erstes bemerken wir (2.23) Proposition Abzählbar unendliche Mengen sind unendlich. Nehmen wir an, dass eine Menge A zugleich endlich und abzählbar uendlich ist. Dann gibt es einerseits Beweis: ein n ∈ N0 mit |A| = n, also eine Bijektion ϕ : Mn → A, und andererseits eine Bijektion ψ : N0 → A. Sei ψn+1 die Einschränkung von ψ auf Mn+1 ; dann wäre ϕ −1 ◦ ψn+1 : Mn+1 → Mn eine injektive Abbildung von Mn+1 in eine echte Teilmenge von Mn+1 . Aber eine solche Abbildung kann es nach (2.14) nicht geben. Genau wie bei den endlichen Mengen sehen wir uns nun an, unter welchen Mengenoperationen die Abzählbarkeit erhalten bleibt. (2.24) Lemma Jede unendliche Teilmenge von N ist abzählbar unendlich. Beweis: zu (i) Sei A ⊆ N eine unendliche Teilmenge. Wir definieren eine injektive Abbildung ϕ : N → A durch folgende Rekursionsvorschrift: Wie in den Übungen mit dem Induktionsprinzip gezeigt wurde, besitzt jede nichtleere Teilmenge von N ein kleinstes Element. Bezeichnet a1 das kleinste Element in A, dann setzen wir ϕ(1) = a1 . Sei nun n ∈ N und nehmen wir nun an, dass ϕ(k) für 1 ≤ k ≤ n bereits definiert wurde, und dass ϕ auf Mn = {1, ..., n} injektiv ist. —– 35 —– Wäre die Menge A \ ϕ(Mn ) leer, dann würde daraus ϕ(Mn ) = A folgen. Damit wäre ϕ eine Bijektion zwischen Mn und A, was aber der Voraussetzung widerspricht, dass A unendlich ist. So aber können wir in A \ ϕ(Mn ) ein kleinstes Element b wählen und ϕ(n + 1) = b definieren. Offenbar ist ϕ auch auf Mn+1 injektiv. Denn nehmen wir an, es gäbe Elemente k, ` ∈ Mn+1 mit k < ` und ϕ(k) = ϕ(`). Wegen der Injektivität von ϕ| Mn ist dies nur möglich, wenn k ∈ Mn und ` = n + 1 ist. Aber dann ist ϕ(`) = ϕ(n + 1) = b ∈ / ϕ(Mn ) und ϕ(k) ∈ ϕ(Mn ). Also können ϕ(k) und ϕ(`) nicht übereinstimmen. Insgesamt erhalten wir so eine Abbildung ϕ : N → A. Auch diese ist injektiv. Sind nämlich k, ` ∈ N mit k < `, dann folgt aus der Injektivität von ϕ| M` sofort ϕ(k) 6= ϕ(`). Es bleibt zu zeigen, dass ϕ auch surjektiv ist. Nehmen wir an, dies ist nicht der Fall. Dann existiert in A ein kleinstes Element a mit a ∈ / ϕ(N). Seien a1 , ..., a r die endlich vielen Elemente in A, die kleiner als a sind. Für jedes i ∈ {1, ..., r} gibt es ein ni ∈ N mit ϕ(ni ) = ai . Nach eventueller Vertauschung der Elemente a1 , ..., a r können wir annehmen, dass n r unter den Zahlen a1 , ..., a r maximal ist. Daraus folgt {a1 , ..., a r } ⊆ ϕ(Mn ) für n = n r . Wir behaupten nun, dass ϕ(n + 1) = a gelten muss, im Widerspruch zur Annahme. Wegen A \ {a1 , ..., a r } ⊇ A \ ϕ(Mn ) ist a auch das kleinste Element in A \ ϕ(Mn ). Also ergibt sich die Gleichung ϕ(n + 1) = a direkt aus unserer Rekursionsvorschrift. (2.25) Proposition (i) Teilmengen höchstens abzählbarer Mengen sind höchstens abzählbar. (ii) Sind A, B Mengen, ist A höchstens abzählbar und φ : A → B eine surjektive Abbildung, dann ist auch B höchstens abzählbar. zu (i) Beweis: Sei B eine höchstens abzählbare Menge und A ⊆ B. Ist B endlich, dann ist A nach (2.17) (i) ebenfalls endlich und damit höchstens abzählbar. Wir können deshalb annehmen, dass B abzählbar unendlich ist. Demnach gibt es eine Bijektion ϕ : B → N. Ist A endlich, dann ist A nach Definition höchstens abzählbar. Wir können also annehmen, dass A unendlich ist. Auf Grund der Bijektivität von ϕ ist ϕ(A) eine unendliche Teilmenge von N. Diese ist nach (2.24) abzählbar unendlich. Also ist auch A abzählbar unendlich, insbesondere höchstens abzählbar. Nach (2.10) (ii) existiert eine Abbildung ψ : B → A mit ϕ ◦ ψ = idB , und nach (2.10) (i) ist diese zu (ii) Abbildung injektiv. Wie unter (i) gezeigt, ist ψ(B) als Teilmenge der höchstens abzählbaren Menge A ebenfalls höchstens abzählbar. Weil ψ als injektive Abbildung eine zwischen B und ψ(B) bijektiv ist, ist auch B höchstens abzählbar. (2.26) Satz (i) Sind A und B abzählbar unendliche Menge, dann ist auch A × B abzählbar unendlich. (ii) Ist I höchstens abzählbar, und ist (Ai )i∈I eine Familie bestehend aus lauter höchstens S abzählbaren Mengen Ai , dann ist auch die Vereinigung i∈I Ai höchstens abzählbar. Beweis: zu (i) Zunächst führen wir den Beweis auf den Fall A = B = N zurück. Weil A und B abzählbar unendlich sind, gibt es Bijektionen ϕ : N → A und ψ : N → B. Man überprüft leicht, dass dann die Abbildung —– 36 —– N × N → A × B, (m, n) 7→ (ϕ(m), ψ(n)) ebenfalls bijektiv ist. Wenn also N × N abzählbar unendlich ist, dann gilt dasselbe für A × B. Es genügt also nachzuweisen, dass N × N abzählbar unendlich ist. Dazu geben wir ein injektive Abbildung zwischen N × N und N an. Die grundlegende Idee besteht darin, die Paare in N × N nach dem folgenden Schema durchzunummerieren. (1, 1) (1, 2) (1, 3) % (2, 1) % (2, 2) % (3, 3) % (4, 1) % (2, 4) % (3, 2) (1, 5) % (2, 3) % (3, 1) (1, 4) % (4, 2) % (5, 1) Dies wird realisiert durch die Abbildung φ : N2 → N, (m, n) 7→ n + 12 (m + n − 2)(m + n − 1) + n, die folgendermaßen zu Stande kommt: In jeder Diagonale des angegebenen Schemas befinden sich die Paare (m, n) ∈ N2 mit konstanter Summe m + n, wobei (m, n) jeweils auf der n-ten Position der (m + n − 1)-ten Diagonale landet. Die r-te Diagonale hat für jedes r ∈ N jeweils genau r Einträge. Die Formel 1 + ... + r = 12 r(r + 1), die in (1.6) bewiesen wurde, zeigt, dass die (m + n − 2) vorausgehenden Diagonalen insgesamt die Länge 12 (m + n − 2)(m + n − 1) haben. Also landet das Element (m, n) im Schema auf der Position 12 (m + n − 2)(m + n − 1) + n. Wir beweisen nun die Injektivität der Abbildung ψ. Dazu seien (m1 , n1 ), (m2 , n2 ) ∈ N2 mit φ(m1 , n1 ) = φ(m2 , n2 ) vorgegeben. Zu zeigen ist (m1 , n1 ) = (m2 , n2 ). Als erstes überprüfen wir, dass die Zahlen r1 = m1 + n1 − 2 r 2 = m2 + n 2 − 2 und übereinstimmen. Nehmen wir an, dass dies nicht der Fall ist und zum Beispiel r1 < r2 gilt. Dann ist φ(m1 , n1 ) ≤ 1 r (r 2 1 1 + 1) + r1 und φ(m2 , n2 ) ≥ 12 r2 (r2 + 1). Wir erhalten φ(m2 , n2 ) − φ(m1 , n1 ) ≥ 1 r (r 2 2 2 = + 1) − 1 2 r 2 1 1 ≥ + 32 r1 r (r + 1) + r1 2 1 1 + 32 r1 + 1 − 1 r2 2 1 1 (r 2 1 = + 1)(r1 + 2) − 1 1 r (r + 1) + r1 2 1 1 , was der Voraussetzung φ(m1 , n1 ) = φ(m2 , n2 ) widerspricht. Also muss r1 = r2 gelten. Aus r1 = r2 folgt aber direkt 1 r (r + 1) 2 1 1 = 12 r2 (r2 + 1). Zusammen mit φ(m1 , n1 ) = φ(m2 , n2 ) ⇔ 21 r1 (r1 + 1) + n1 = 21 r2 (r2 + 1) + n2 folgt daraus n1 = n2 und damit auch m1 = m2 . Damit ist die Injektivität bewiesen. Wir haben somit gezeigt, dass N2 gleichmächtig zur Teilmenge ψ(N2 ) von N ist. Nach (2.24) ist N2 höchstens abzählbar ist. Andererseits ist N0 × N0 unendlich; wäre dies nicht so, dann würde aus der Injektivität der Abbildung N → N2 , m 7→ (m, 1) auch die Endlichkeit von N folgen, was nach (2.16) ausgeschlossen ist. —– 37 —– zu (ii) Da I höchstens abzählbar ist, gibt es eine injektive Abbildung ϕ : I → N. Auf Grund der Injektivität gibt es nach (2.10) (i) eine Abbildung ψ : N → I mit ϕ ◦ ψ = idN . Diese ist nach (2.10) (ii) surjektiv. Dasselbe Argument liefert uns für jedes i ∈ I auch eine surjektive Abbildung ϕi : N → Ai . Wir behaupten nun, dass durch [ Ai , (m, n) 7→ ϕψ(m) (n) φ : N2 −→ i∈I ebenfalls eine surjektive Abbildung gegeben ist. Ist nämlich a ∈ S i∈I Ai vorgegeben, dann gibt es i ∈ I mit a ∈ Ai , ein m ∈ N0 mit ψ(m) = i und ein n ∈ N0 mit ϕi (n) = a. Es folgt φ(m, n) = ϕψ(m) (n) = ϕi (n) = a. Nach (2.25) (ii) S ist deshalb mit N2 auch die Menge i∈I Ai höchstens abzählbar. Abbildungen können genutzt werden, um Elemente einer Menge A durch Elemente einer anderen Menge I zu indizieren. In diesem Zusammenhang bezeichnet man eine Abbildung ϕ : I → A auch als Familie von Elementen der Menge A und I als Indexmenge der Familie. Man verwendet dann für die Abbildung ϕ die Notation (ai )i∈I , und das Element ϕ(i) ∈ A bezeichnet man mit ai . Ist I = N oder N0 , dann nennt man die Familie auch eine Folge. Beispielsweise wird durch a1 = 3, a2 = 5, a3 = 97, a4 = 3 eine Familie (ai )i∈I natürlicher Zahlen mit der Indexmenge {1, 2, 3, 4} definiert. Durch die Festlegung an = n2 für alle n ∈ N erhält man eine Folge (an )n∈N natürlicher Zahlen, nämlich die Folge der Quadratzahlen. Familien werden verwendet, um auf die Elemente einer Menge A leichter zugreifen zu können (ähnlich wie die Seitennummern einen leichteren Zugriff auf die Seiten eines Buchs ermöglichen). Man kann auf diese Weise auch bestimmte Elemente von A auszeichnen oder sie (im Fall von I = N) in eine bestimmte Reihenfolge bringen. Zu beachten ist dabei, dass die Abbildung I → A, i 7→ ai im allgemeinen weder injektiv noch surjektiv zu sein braucht. Beispielsweise kann daseelbe Element von A in einer Familie auch mehrfach vorkommen, also ai = a j für verschiedene i, j ∈ I gelten. Ein weiteres wichtiges Hilfsmittel in der Mathematik ist das Summenzeichen. Zur Vorbereitung führen wir die folgende Notation ein: Ist I eine Menge, dann bezeichnen wir mit Pfin (I) die Menge der endlichen Teilmengen von I. Es handelt sich um die Vereinigung sämltlicher Mengen Pk (I) mit k ∈ N0 . (2.27) Satz Sei I eine Menge und (ai )i∈I eine Familie natürlicher Zahlen mit Indexmenge I. Dann gibt es eine eindeutig bestimmte Zuordnung Pfin (I) → N0 , J 7→ X ai . i∈J mit den Eigenschaften X ai = 0, i∈∅ X i∈J∪K ai = X ai = ak für alle k ∈ I und i∈{k} X i∈J aj + X ak für J, K ∈ Pfin (I) mit J ∩ K = ∅. i∈K —– 38 —– Der Beweis dieses Satzes erfolgt durch eine rekursive Definition des Summenzeichens. Zunächst definiert man das P Summenzeichen für die (einzige) nullelementige Teilmenge von I durch i∈∅ ai = 0. Sei nun n ∈ N0 , und nehmen wir an, dass das Summenzeichen für n-elementige Teilmengen von I bereits definiert wurde. Ist nun |J| = n + 1 und P P j ∈ J, dann ist J 0 = J \ { j} eine n-elementige Menge von I, und wir können i∈J ai = i∈J 0 ai + a j definieren. Es muss allerdings noch überprüft werden, dass diese Definition unabhängig von der Auswahl des Elements j aus P J ist; dieselbe Vorgehensweise mit einem anderen j 0 ∈ J muss für i∈J ai denselben Wert liefern. Aus Zeitgründen verzichten wir auf die detaillierte Ausführung, zumal wir in erster Linie an der praktischen Verwendung des Summenzeichens interessiert sind. Ist (ai )i∈I besipielsweise eine Familie natürlicher Zahlen über einer zweielementigen Menge I = {k, `}, dann gilt P P i∈I ai = ak + a` + am , und i∈I ai = ak + a` . Für eine dreielementige Menge I = {k, `, m} erhält man entsprechend so weiter. Besonders häufig verwenden als Indexmengen Teilmengen von Z der Form Mn = {1, 2, ..., n} mit n ∈ N oder M r,s = {r, r + 1, ..., s − 1, s} mit r, s ∈ Z und r ≤ s. Außerdem bietet es sich an, M0 = ∅ und M r,s = ∅ für r > s zu setzen. Ist nun (am )m∈Z eine Familie natürlicher Zahlen mit Z als Indexmenge, dann setzt man n X X = ai i=1 P7 s X und ai = ai i=r i∈Mn ai . i∈M r,s P4 ai = 0. Die Formel für die Summe der ersten n natürlichen Pn Zahlen aus Kapitel 1 kann mit dem Summenzeichen in der Form i=1 i = 21 n(n + 1) geschrieben werden. Beispielsweise ist i=3 ai = a3 +a4 +a5 +a6 +a7 und X (2.28) Proposition (i) i=6 Seien (ai )i∈I , (bi )i∈I zwei Familien natürlicher Zahlen mit endlicher Indexmenge I, und sei c ∈ N0 . Dann sind (ai + bi )i∈I und (cai )i∈I ebenfalls Familien natürlicher Zahlen über I, und es gilt X (ai + bi ) = X i∈I (ii) ai + i∈I X X und bi i∈I cai = i∈I c X ai . i∈I Sei J eine weitere endliche Menge und ϕ : J → I eine Bijektion. Dann ist (c j ) j∈J mit c j = aϕ( j) eine Familie natürlicher Zahlen mit Indexmenge J, und es gilt X = cj X j∈J = aϕ( j) X j∈J ai . i∈I Auch hier verzichten wir auf die Angabe eines Beweises. Die letzte Gleichung bezeichnet man als Umparametrisierung einer Summe. Für Anwendungen ist vor allem der folgende Spezialfall interessant: Für m, n, r ∈ Z mit m ≤ n ist durch ϕ : Mm+r,n+r → Mm,n , j 7→ j − r eine Bijektion definiert, deren Umkehrabbildung offenbar durch Mm,n → Mm+r,n+r , i 7→ i + r gegeben ist. Wir erhalten dann für eine beliebige Familie (ai )i∈Z die Gleichung n X i=m ai = X ai = i∈Mm,n X aϕ( j) j∈Mm+r,n+r —– 39 —– = n+r X j=m+r a j−r . Ist besipielsweise (am )m∈Z gegeben durch am = m2 für alle m ∈ Z, dann gilt 5 X 32 + 42 + 52 = ai (6 − 3)2 + (7 − 3)2 + (8 − 3)2 = 8 X = i=3 a j−3 . j=6 Als wichtige Anwendung des Summenzeichens beweisen wir eine Verallgemeinerung der aus der Schule bekannten binomischen Formel (a + b)2 = a2 + 2a b + b2 auf beliebige Exponenten. (2.29) Satz (Binomischer Lehrsatz) Für alle a, b, n ∈ N0 gilt die Gleichung (a + b)n = n X n k k=0 a n−k b k . Wir beweisen die Gleichung durch vollständige Induktion über N. Für n = 0 ist die Gleichung offenbar P0 0 0 erfüllt, denn einerseits gilt (a + b)0 = 1, andererseits aber auch k=0 k a0−k b k = 0 a0 b0 = 1 · 1 · 1 = 1. Sei nun Beweis: n ∈ N0 und die Gültigkeit der Gleichung für n vorausgesetzt. Dann gilt (a + b)n+1 = (a + b)(a + b)n = n X n (a + b) k=0 = a n X k=0 n k a n−k b k + b n X n k k=0 n X = a n−k b k n k k=0 k ! a n−k b k a n+1−k b k + n X n k=0 k a n−k b k+1 . Die beiden Summanden am Ende der Rechnung werden nun einzeln umgeformt. Auf Grund der Identität n+1 gilt für den ersten Summanden 0 n X n k=0 k Wegen = a n+1−k b k n n =1= n+1 n+1 n X n k=0 k a n 0 a n+1 b0 + n X n k=1 k = a n+1−k b k n+1 0 a n+1 b0 + n X n k=1 k a n+1−k b k . erhalten wir für den zweiten Summanden die Gleichung n−k k+1 b = n+1 X n k−1 k=1 = n X k=1 n k−1 a = n+1−k k b n X n k=1 a n+1−k b k + n+1 n+1 Nach (2.19) erfüllen die Binomialkoeffizienten die Gleichung n n n+1 = + k k k−1 —– 40 —– k−1 a0 b n+1 . für a b + n+1−k k (?2 ) k ∈ N, n ∈ N0 . n n a0 b n+1 n 0 =1= (?1 ) Addieren wir nun die Ausdrücke (?1 ) und (?2 ), so erhalten wir ! n n + 1 n+1 0 X n n+1−k k n+1 (a + b) = a b + a b + 0 k k=1 = n+1 0 n+1 0 a a n+1 b0 + n X n k k=1 n+1 0 b + n X n+1 k k=1 a + n b + n+1−k k k−1 n+1 n X n k=1 a n+1−k b k + 0 n+1 a b n+1 k−1 = a b + n+1−k k n+1 n+1 a0 b n+1 n+1 X n+1 k=0 k n+1 n+1 ! 0 n+1 a b = a n+1−k b k . Also ist die Gleichung auch für n + 1 gültig. Neben dem Summen- wird häufig auch das Produktzeichen verwendet. Hier ist das Ziel die Bildung von Produkten über beliebige endliche Mengen natürlicher Zahlen. Wie in (2.27) kann gezeigt werden, dass für jede Familie (ai )i∈I natürlicher Zahlen über einer Indexmenge I eine eindeutig bestimmte Zuordnung Pfin (I) −→ N0 , J 7→ Y ai i∈J ak existiert, falls J, K ⊆ I endlich und disjunkte Q Q Q Q Q sind. Es gelten zu (2.28) analoge Rechenregeln i∈I (ai bi ) = i∈I ai i∈I bi und j∈J aϕ( j) = i∈I ai , falls P P ϕ : J → I eine Bijektion bezeichnet. Lediglich die Gleichung i∈I cai = c i∈I ai muss modifiziert werden: Beim Q Q Produktzeichen gilt i∈I (cai ) = c n i∈I ai , falls n = |I| ist. mit Q i∈∅ ai = 1, Q i∈{k} ai = ak und Q i∈J∪K ai = Q i∈J aj Q i∈K Sowohl die Fakultätsfunktion als auch die Binomialkoeffizienten können mit Hilfe des Produktzeichens ausgedrückt werden: Es gilt n! = n Y k=1 k und n k = 1 k! (n − k)! für alle k, n ∈ N0 gilt k ≤ n. —– 41 n! —– = 1 n Y k! `=n−k+1 ` § 3. Die reellen Zahlen Inhaltsübersicht Bevor wir in den nachfolgenden Kapiteln mit den reellen Zahlen arbeiten und tieferliegende Sätze, zum Beispiel über reellwertige Folgen oder Funktionen beweisen können, müssen wir uns zunächst einmal ein Fundament schaffen und festlegen, welche Eigenschaften der Menge R der reellen Zahlen wir als „bekannt“ voraussetzen möchten. Ziel dieses Kapitels ist also eine axiomatische Charakterisierung der reellen Zahlen. Diese Axiome lassen sich in drei Gruppen einteilen. Zunächst einmal bilden die reellen Zahlen einen Körper. Das bedeutet, dass auf R arithmetische Operationen +, −, · und : existieren, welche die vom praktischen Rechnen her gewohnten Regeln erfüllen. Darüber hinaus existiert auf R eine Anordnung, also eine mit der Arithmetik verträgliche Totalordnung. Drittens ist R als angeordneter Körper vollständig, was man durch die Formulierung umschreibt, dass R als kontinuierlicher Zahlenstrahl keine „Lücken“ besitzt. Diese Eigenschaft unterscheidet R zum Beispiel vom Körper Q der rationalen Zahlen. Neben der axiomatischen Charakterisierung von R werden wir in diesem Kapitel auch die aus der Schule bekannten Zahlbereiche N, N0 , Z und Q als Teilmengen von R definieren. Auch die komplexen Zahlen C werden als Erweiterung von R eingeführt. Die Anordnungseigenschaft ermöglicht die Definition spezieller Teilmengen [a, b] von R, die sogenannten Intervalle. Als Anwendung der Vollständigkeit definieren wir auf R die Exponentiation positiver reeller Zahlen a mit p beliebigen rationalen Exponenten, beispielsweise a1/2 = a. (I) Ringe und Körper Eine Verknüpfung auf einer Menge X ist eine Abbildung · : X × X → X . An Stelle von ·(a, b) schreibt man in der Regel a · b für a, b ∈ X . Man bezeichnet die Verknüpfung als kommutativ, wenn a · b = b · a für alle a, b ∈ X gilt, und als assoziativ, wenn a · (b · c) = (a · b) · c für alle a, b, c ∈ X erfüllt ist. (3.1) Definition Ein Ring ist ein Tripel (K, +, ·) bestehend aus einer Menge K und Verknüpfungen + und · auf K, so dass folgende Bedingungen erfüllt sind. (i) Die Verknüpfungen + und · sind kommutativ und assoziativ. (ii) Es gilt das Distributivgesetz a(b + c) = ab + ac. (iii) Es gibt Elemente 0K und 1K mit der Eigenschaft, dass 0K + a = a und 1K · a = a für alle a ∈ K erfüllt ist. (iv) Für jedes a ∈ K gibt es ein b ∈ K mit a + b = 0K . Gilt zusätzlich 0K 6= 1K , und gibt es für jedes a ∈ K mit a 6= 0K ein b ∈ K mit ab = 1K , dann nennt man (K, +, ·) einen Körper. —– 42 —– In einem Ring (K, +, ·) gibt es jeweils nur ein Element 0K und 1K mit der unter (iii) genannten Eigenschaft. Erfüllt nämlich ein Element 00K ∈ K ebenfalls 00K + a = a für alle a ∈ K, dann erhält man durch Einsetzen von a = 0K nämlich insbesondere 0K 00K + 0K = 0K + 00K = = 00K . Ebenso gilt: Ist 10K ∈ R ein Element mit 10K · a = a für alle a ∈ K, so folgt 1K = 10K · 1K = 1K · 10K = 1K . Die Elemente 0K und 1K sind also durch ihre Eigenschaft eindeutig bestimmt. Man nennt sie das Null- bzw. Einselement des Rings. Für jedes a ∈ K gibt es nur ein b ∈ K mit der Eigenschaft (iv). Sind nämlich b, c ∈ K beliebige Elemente mit a + b = 0K und a + c = 0K , so erhält man b = c durch die Rechnung b = 0K + b = (a + c) + b = (c + a) + b = c + (a + b) = c + 0K = 0K + c = c. Man nennt das eindeutig bestimmte Element b ∈ K mit a + b = 0K das Negative von a und bezeichnet es mit −a. Mit Hilfe es Negativen kann eine weitere Verknüpfung − auf K definiert werden, und zwar durch die Festlegung a − b = a + (−b) für a, b ∈ K. Man bezeichnet die Verknüpfung + als Addition, die Verknüpfung − als Subtraktion und · als Multiplikation auf dem Ring K. Ebenso gibt es für jedes a ∈ K höchstens ein b ∈ K mit ab = 1K . Ist nämlich c ∈ K ein weiteres Element mit ac = 1K , so erhält man b = 1K · b = (ac)b = (ca)b = c(ab) = c · 1K = 1K · c = c. Ein Element b mit der Eigenschaft ab = 1K wird Kehrwert von a genannt und mit a−1 bezeichnet. Ist K ein Körper, so lässt sich mit Hilfe der Kehrwerte in K auch Brüche definieren. Man setzt dazu a b = a b−1 für alle a, b ∈ K mit b 6= 0K . Bekannte Beispiele für Körper sind die rationalen Zahlen Q und die reellen Zahlen R jeweils mit der gewöhnlichen Addition und Multiplikation als Verknüpfungen. Die in (3.1) unter (iii) genannten Elemente 0K und 1K sind in diesem Fall einfach die Zahlen 0 und 1. Dagegen sind N und Z mit den gewöhnlichen Verknüpfungen + und · keine Körper. Nicht jedes Element ungleich Null besitzt einen Kehrwert, beispielsweise gibt es keine natürliche oder ganze Zahl a mit 2 · a = 1. Für N kommt hinzu, dass auch Punkt (iv) nicht erfüllt ist. Wir werden aber sehen, dass Z immerhin noch ein Ring ist. Abgesehen von den soeben genannten Zahlbereichen kennt man eine große Zahl weiterer Körper, darunter auch solche mit endlicher Elementmenge. In diesem Fall kann die Addition und Multiplikation jeweils durch eine Wertetabelle angegeben werden. Die Körper mit der geringstmöglichen Elementezahl bestehen aus zwei bzw. drei Elementen. Sie werden üblicherweise mit F2 bzw. F3 bezeichnet. Verknüpfungstabellen des Körpers F2 : + 0 1 · 0 1 0 0 1 0 0 0 1 1 0 1 0 1 —– 43 —– Verknüpfungstabellen des Körpers F3 : + 0 1 2 · 0 1 2 0 0 1 2 0 0 0 0 1 1 2 0 1 0 1 2 2 2 0 1 2 0 2 1 Dass die Verknüpfungen kommutativ sind, erkennt man auf einen Blick daran, dass die Tabellen symmetrisch bezüglich der von links oben nach rechts unten verlaufenden Diagonalen sind. Auch die Eigenschaften (i)(b),(c) und (ii)(b),(c) überprüft man leicht. (Beispielsweise erfüllt das Element 0F2 = 0 die Bedingung 0F2 + x = x für alle x ∈ F2 , wie man durch Einsetzen der Elemente 0, 1 in x leicht überprüft.) Ziemlich mühsam ist dagegen die Verifikation von Assoziativ- und Distributivgesetz, da man hier 23 = 8 Gleichungen für F2 und sogar 33 = 27 Gleichungen für F3 kontrollieren muss. In der Algebra-Vorlesung werden wir Techniken zur Konstruktion endlicher Körper kennenlernen, die unter anderen einen einfacheren Nachweis des Assoziativ- und des Distributivgesetz mit sich bringen. Wir beweisen nun einige elementare Rechenregeln, die in allen Ringen bzw. Körpern gültig sind. (3.2) Proposition Sei (K, +, ·) ein Ring, und seien a, b ∈ K. Dann gilt (i) −0K = 0K , −(−a) = a und −(a + b) = (−a) + (−b) (ii) 0K · a = 0K , a(−b) = (−a)b = −(ab) und ab = (−a)(−b) Ist K sogar ein Körper, dann gilt zusätzlich: −1 −1 (iii) 1−1 = a und (ab)−1 = a−1 b−1 sofern a, b 6= 0K K = 1K , (a ) (iv) Aus a b = 0K folgt a = 0K oder b = 0K . Beweis: zu (i) Es gilt 0K = 0K + 0K . Wie bereits oben festgestellt, gibt es nur ein einziges Element c ∈ K mit 0K + c = 0K , nämlich das Negative −0K . Weil die Gleichung 0K + c = 0K sowohl mit c = 0K als auch c = −0K erfüllt ist, folgt −0K = 0K . Zum Beweis der zweiten Gleichung stellen wir zunächst fest, dass (−a) + a = a + (−a) = 0K gilt. Also ist a das Negative von −a, es gilt also −(−a) = a. Zum Beweis der dritten Gleichung verwenden wir die Rechnung (a + b) + ((−a) + (−b)) = (a + b) + ((−b) + (−a)) a + ((b + (−b)) + (−a)) = = a + (0K + (−a)) = a + (b + ((−b) + (−a))) a + (−a) = = 0K . Diese zeigt, dass (−a) + (−b) das Negative von a + b ist. Es gilt also −(a + b) = (−a) + (−b). zu (ii) Zum Beweis der ersten Gleichung 0K · a = 0K gehen wir in zwei Schritten vor. Zunächst gilt 0K a = (0K + 0K )a = 0K a + 0K a, und daraus wiederum folgt 0K = (0K a) + (−(0K a)) = (0K a + 0K a) + (−(0K a)) = 0K a + 0K —– 44 = —– 0K a. = 0K a + (0K a + (−(0K a))) Beweisen wir nun die zweite Gleichung. Es gilt ab + a(−b) = a(b + (−b)) = a0K = 0K a = 0K . Also ist a(−b) das Negative von a b, es folgt −(a b) = a(−b). Der Beweis der dritten Gleichung läuft nach demselben Schema ab: Wegen ab + (−a)b = (a + (−a))b = 0K b = 0K ist (−a)b ebenfalls das Negative von ab, es gilt also −(ab) = (−a)b. Die letzte Gleichung erhalten wir schließlich durch Anwendung bereits bewiesener Gleichungen. Es gilt (−a)(−b) = = −(a(−b)) −(−(ab)) = , ab wobei in den ersten beiden Schritten die soeben gezeigten Identitäten und im letzten Schritt die zweite Gleichung von (i) verwendet wurde. zu (iii) Hier ergeben sich die Gleichungen aus der Eindeutigkeit des Kehrwerts. Die Gleichung 1K = 1K · 1K zeigt, −1 dass 1K sein eigener Kehrwert ist, also 1−1 · a = 1K sieht man, dass a der Kehrwert K = 1K ist. An der Gleichung a von a−1 ist, es gilt also (a−1 )−1 = a. Aus der Rechnung gilt noch (a b) · (a−1 b−1 ) = (a b) · (b−1 a−1 ) = a(1K a−1 ) = = a(b(b−1 a−1 )) aa−1 = 1K = a((bb−1 )a−1 ) , folgt schließlich, dass a−1 b−1 der Kehrwert von ab ist, also (ab)−1 = a−1 b−1 gilt. zu (iv) Seien a, b ∈ K mit a b = 0K , und nehmen wir an, dass a 6= 0K und b 6= 0K gilt. Dann besitzen beide Elemente Kehrwerte, und es folgt 0K = 0K (a−1 b−1 ) = (ab)(a−1 b−1 ) = (ab)(ab)−1 = 1K . Aber die Gleichung 0K = 1K ist in einem Körper ausgeschlossen. Die Annahme a 6= 0K und b 6= 0K hat zu einem Widerspruch geführt, und folglich muss a = 0K oder b = 0K gelten. Auf Grund der Assoziativität für + und · können Klammern gespart werden: An Stelle von a + (b + c) oder a(bc) schreibt man einfach a + b + c oder a bc. Auf weitere Klammern kann verzichtet werden, wenn man die Konvention Punktrechnung vor Strichrechnung zu Grunde legt. Dazu vereinbart man, dass der Ausdruck a+bc gleichbedeutend mit a + (bc) ist, und dass a − bc dasselbe bedeutet wie a − (bc) oder a + (−(bc)). Aus der Rechenregel (iii) folgt unmittelbar, dass in Brüchen gekürzt werden kann: Ist K ein Körper, und sind a, b, c ∈ K mit b, c 6= 0K , dann gilt ac bc = ac(bc)−1 = ac b−1 c −1 = ab−1 cc −1 = ab−1 1K = ab−1 = a b . Übrigens wäre es nicht sinnvoll, bei der Körperdefinition auch die Existenz eines Kehrwerts 0−1 K von 0K zu fordern: −1 Dann würde man nämlich für jedes a ∈ K die Gleichung a = a · 1K = a · (0K · 0−1 K ) = 0K · (a · 0K ) = 0K erhalten, d.h. der Körper würde nur aus dem Nullelement 0K bestehen! Insbesondere würden die Elemente 0K und 1K zusammenfallen, was wir ja explizit ausgeschlossen haben. Wir halten fest: In einem Körper K besitzt das Nullelement 0K keinen Kehrwert. —– 45 —– In einem Ring K kann jeder Zahl n ∈ N0 auf natürliche Weise ein Element nK in K zugeordnet werden: Zunächst ordnet man der 0 das Nullelement 0K und der 1 das Einselement 1K des Rings zu. Anschließend definiert man rekursiv (n + 1)K = nK + 1K für alle n ∈ N. Es gilt also 2K = 1K + 1K , 3K = 2K + 1K = 1K + 1K + 1K , und so fort. Viele Rechenregeln übertragen sich von N auf diese Elemente. Dies ist in erster Linie darauf zurückzuführen, dass die Addition und Multiplikation auf N0 mit der Addition und Multiplikation der entsprechenden Körperelemente zusammenhängt. (3.3) Lemma Für alle m, n ∈ N0 gilt (m + n)K = mK + nK und (m · n)K = mK nK . Beweis: Die erste Gleichung beweisen wir durch vollständige Induktion über n ∈ N0 jeweils für alle m ∈ N0 . Für n = 0 ist die Gleichung wegen (m + 0)K = mK und mK + 0K = mK offenbar für alle m ∈ N0 erfüllt. Sei nun n ∈ N0 , und setzen wir die Gleichung für n voraus. Für jedes m ∈ N gilt dann (m + (n + 1))K = ((m + n) + 1)K mK + nK + 1K = = (m + n)K + 1K = mK + (n + 1)K . Dabei ist zu beachten, dass die Gleichungen (m + n + 1)K = (m + n)K + 1K und (n + 1)K = nK + 1K auf Grund der rekursiven Definition von nK gelten. Außerdem haben wir im dritten Schritt die Induktionsvoraussetzung angewendet. Beim Beweis der zweiten Gleichung gehen wir genauso vor. Für n = 0 ist diese wegen (m · 0)K = 0K und mK · 0K = 0K für alle m ∈ N0 erfüllt. Sei nun n ∈ N0 , und setzen wir die Gleichung für dieses n voraus. Wir erhalten (m(n + 1))K = (mn + m)K mK nK + mK 1K = = (mn)K + mK mK (nK + 1K ) = = mK nK + mK = mK (n + 1)K . Dabei wurde im zweiten Schritt die bereits bewiesene erste Gleichung und im dritten Schritt die Induktionsvoraussetzung angwendet. Die Elemente nK kamen durch wiederholte Addition des Elements 1K zu Stande. Genau lassen sich mit Hilfe der Multiplikation Potenzen von Ringelementen definieren. Für beliebiges a ∈ R setzt man a0 = 1K und definiert anschließend rekursiv a n+1 = a n · a für alle n ∈ N0 . (3.4) Lemma Seien K ein Ring, a, b ∈ K und m, n ∈ N0 . Dann gilt (i) a m+n = a m a n (ii) (a m )n = a mn (iii) (a b)m = a m b m —– 46 —– Beweis: zu (i) Das Beweisschema ist dasselbe wie bei Lemma (3.3): Wir beweisen die Aussage durch vollständige Induktion über n ∈ N0 jeweils für alle m ∈ N0 . Für n = 0 ist die Gleichung erfüllt, denn es gilt a m+0 = a m und a m a0 = a m · 1K = a m . Sei nun n ∈ N0 , und setzen wir die Gleichung für dieses n voraus. Dann folgt a m+(n+1) = a(m+n)+1 = a m+n a = am an a = a m a n+1 . Dabei wurde im zweiten Schritt die rekursive Definition der höheren Potenzen und im dritten Schritt die Induktionsvoraussetzung verwendet. Wegen (a m )0 = 1K und a m0 = a0 = 1K ist die Gleichung im Fall n = 0 für beliebige m ∈ N gültig. Sei nun zu (ii) n ∈ N0 , und setzen wir die Gleichung für dieses n voraus. Dann folgt (a m )n+1 = (a m )n a m = a mn a m = a mn+m = a m(n+1) . Im ersten Schritt haben wir die rekursive Definition der höheren Potenzen, im zweiten Schritt die Induktionsvoraussetzung und im dritten Schritt die Gleichung (i) verwendet. zu (iii) Für m = 0 ist die Gleichung erfüllt, denn es gilt (ab)0 = 1K und a0 b0 = 1K · 1K = 1K . Sei nun m ∈ N0 und die Gleichung für dieses m vorausgesetzt. Dann folgt (a b)m+1 = (a b)m (a b) = a m b m ab = a m ab m b = a m+1 b m+1 . Also ist die Gleichung auch für m + 1 gültig. Die Summen- und Produktzeichen, die wir am Ende von Kapitel 2 für Familien natürlicher Zahlen eingeführt haben, lassen sich genauso auch in beliebigen Körpern verwenden. Auch der binomische Lehrsatz (2.29) ist an Stelle von a, b ∈ N0 für beliebige Elemente a, b eines Körpers K gültig. (II) Anordnung Die Begriffe Halb- und Totalordnung haben wir bereits in Kapitel 2 kennengelernt. Auf einem Körper K sollte eine Totalordnung ≤ natürlich nicht völlig willkürlich definiert werden, sondern auf eine Art und Weise, die mit den arithmetischen Operationen + und · des Körpers zuammenhängt. Dies gelingt mit Hilfe des folgenden Begriffs. (3.5) Definition Sei K ein Körper. Eine Teilmenge K+ ⊆ K wird Anordnung von K genannt, wenn die folgenden Bedingungen erfüllt sind. (i) Für jedes x ∈ K gilt genau eine der drei Aussagen x = 0K , x ∈ K+ , −x ∈ K+ . (ii) Aus x, y ∈ K+ folgt x + y ∈ K+ und x y ∈ K+ . Das Paar (K, K+ ) bezeichnet man als angeordneten Körper. Ein Element x ∈ K wird als positiv bezeichnet, wenn x ∈ K+ , und negativ, wenn −x ∈ K+ gilt. —– 47 —– Für die spätere Verwendung definieren wir die Bezeichnungen K+ = K+ ∪ {0K } K× = K \ {0K }. und Wie wir gleich sehen werden, lässt sich mit Hilfe der Teilmenge K+ eine Totalordnung auf K im Sinne von Definition (2.2) definieren. Zunächst aber zeigen wir (3.6) Lemma Sei (K, K+ ) ein angeordneter Körper. (i) Für alle a ∈ K× gilt a2 ∈ K+ . (ii) Aus a ∈ K+ folgt jeweils a−1 ∈ K+ . Beweis: zu (i) Nach Bedingung (i) in Definition (3.5) gilt ür jedes a ∈ K× jeweils a ∈ K+ oder −a ∈ K+ . Aus Bedingung (ii) folgt im ersten Fall a2 = a·a ∈ K+ . Im zweiten Fall wenden wir dieselbe Bedingung sowie Proposition (3.2) (i) an und erhalten ebenfalls a2 = a · a = (−a)(−a) ∈ K+ . zu (ii) Das Element a−1 besitzt wegen (a−1 )−1 = a einen Kehrwert, ist also ungleich 0K . Nach (i) folgt damit (a−1 )2 ∈ K+ . Mit (a−1 )2 und a liegt auch das Produkt (a−1 )2 a in K+ , und wegen a−1 = a−1 · 1K = a−1 (a−1 a) = (a−1 a−1 )a = (a−1 )2 a gilt damit auch a−1 ∈ K+ . (3.7) Satz Sei (K, K+ ) ein angeordneter Körper. (i) Durch x ≤ y ⇔ y − x ∈ K+ ist eine Totalordnung auf K definiert. Für alle x, y ∈ K gilt x < y ⇔ y − x ∈ K+ . Seien nun x, y, a ∈ K vorgegeben. (ii) Es gilt x ≤ y ⇔ x + a ≤ y + a. (iii) Ist a positiv, dann gilt x ≤ y ⇔ ax ≤ a y. (iv) Ist a negativ, dann gilt x ≤ y ⇔ ax ≥ a y. Die drei Aussagen (ii), (iii) und (iv) bleiben gültig, wenn man ≤ durch < und ≥ durch > ersetzt. Beweis: zu (i) Als erstes beweisen wir die Zusatzaussage. Nach Definition ist für x, y ∈ K die Aussage x < y äquivalent zu (x ≤ y) ∧ x 6= y. Dies ist äquivalent zu ( y − x ∈ K+ ) ∧ ( y − x 6= 0K ), und da sich K+ disjunkt in K+ ∪ {0K } zerlegen lässt, ist dies wiederum gleichbedeutend mit y − x ∈ K+ . Beweisen wir nun, dass ≤ eine Halbordnung ist, und beginnen wir mit der Reflexivität. Sei x ∈ K vorgegeben. Zu zeigen ist x ≤ x, was nach Definition gleichbedeutend mit x − x ∈ K+ ist. Aber Letzteres ist offensichtlich wahr, denn es gilt x − x = 0K und 0K ∈ K+ . Zum Beweis der Antisymmetrie seien x, y ∈ K mit x ≤ y und y ≤ x vorgegeben. Zu zeigen ist x = y. Nehmen wir an, es gilt x 6= y. Dann wäre zugleich x < y und y < x erfüllt. Wie bereits gezeigt, hätte dies zur Folge, dass y − x und x − y beide in K+ liegen, wegen x − y = −( y − x) also y − x ∈ K+ und −( y − x) ∈ K+ . Aber dies widerspricht Axiom (i) in Definition (3.5). Also ist nur x = y möglich. —– 48 —– Wenden wir uns nun der Transitivität zu und setzen dafür x ≤ y und y ≤ z voraus. Zu zeigen ist x ≤ z. Im Fall x = y erhalten wir direkt x = y ≤ z, und aus y = z folgt genauso x ≤ y = z. Wir können uns also auf den Fall beschränken, dass x 6= y und y 6= z gilt. Dann folgt aus unserer Voraussetzung x < y und y < z, und es folgt y − x, z − y ∈ K+ . Axiom (ii) in Definition (3.5) zeigt uns, dass wegen (z − y) + ( y − x) = z + (− y) + y + (−x) = z + (−x) = z−x dann auch das Element z − x in K+ liegt. Daraus folgt x < z, insbesondere x ≤ z. Um nachzuweisen, dass ≤ nicht nur eine Halb-, sondern eine Totalordnung ist, seien x, y ∈ K vorgegeben. Zu zeigen ist, dass x ≤ y oder y ≤ x gilt. Ist x = y, dann ist x ≤ y nach Definition erfüllt. Im Fall x 6= y gilt dagegen y − x 6= 0K , und aus Axiom (i) in Definition (3.5) folgt dann, dass entweder y − x oder −(x − y) = x − y ein Element von K+ ist. Im ersten Fall gilt x < y und somit x ≤ y, im zweiten y < x und insbesondere y ≤ x. zu (ii) Wir beweisen zunächst die Äquivalenz x < y ⇔ x + a < y + a. Wie eingangs bemerkt, ist x < y gleichbedeutend mit y − x ∈ K+ . Wegen ( y + a) − (x + a) = y + a + (−x) + (−a) = y + (−x) = y − x ist dies äquivalent zu dass ( y + a) − (x + a) ∈ K+ , also zu x + a < y + a. Dieselbe Aussage für ≤ erhält man nun durch die Äquivalenzumformung x≤y zu (iii) (x < y) ∨ (x = y) ⇔ ⇔ (x + a < y + a) ∨ (x + a = y + a) ⇔ x + a ≤ y + a. Auch hier betrachten wir zunächst die Äquivalenz x < y ⇔ ax < a y. „⇒“ Aus x < y folgt y − x ∈ K+ . Wegen a ∈ K+ liegt damit auch auch a y − ax = a( y − x) in K+ , also gilt ax < a y. (3.6) (ii) mit a auch a ax < a y ⇒ a −1 ax < a −1 −1 „⇐“ Da nach Lemma positiv ist, können wir die bereits bewiesene Schlussrichtung anwenden und erhalten a y ⇒ x < y. Damit ist die Äquivalenz für die Relation < insgesamt bewiesen. Um auch die Äquivalenz für die Relation ≤ zu zeigen, bemerken wir zunächst x = y ⇒ ax = a y und ax = a y ⇒ a−1 ax = a−1 a y ⇒ x = y, insgesamt also x = y ⇔ ax = a y. Aus den beiden Äquivalenzen x < y ⇔ ax < a y und x = y ⇔ ax = a y erhält man rein logisch die Äquivalenz x ≤ y ⇔ ax ≤ a y. zu (iv) Hier zeigen wir zunächst die Äquivalenz x < y ⇔ −x > − y. Diese erhält man durch die Umformungen x<y ⇔ y − x ∈ K+ ⇔ (−x) − (− y) ∈ K+ ⇔ −x > − y. Wegen x = y ⇔ −x = − y folgt daraus auch unmittelbar x ≤ y ⇔ −x ≥ − y. Ist nun a ein beliebiges negatives Element, dann ist −a positiv. Durch Anwendung von (iii) und der soeben bewiesenen Äquivalenz erhalten wir x < y ⇔ (−a)x < (−a) y ⇔ −a x < −a y ⇔ ax > a y, und nach demselben Schema beweist man schließlich auch die Äquivalenz x ≤ y ⇔ a x ≥ a y. Ist (K, K+ ) ein angeordneter Körper, dann verwenden wir von nun an das Relationssymbol ≤ (und entsprechend auch die Symbole ≤, < und >) immer für die nach Satz (3.7) zu K+ gehörende Totalordnung auf K, ohne jeweils ausdrücklich darauf hinzweisen. —– 49 —– (3.8) Proposition (weitere Rechenregeln in angeordneten Körpern) (i) Aus 0K < a < b folgt b−1 < a−1 . (ii) Für alle n ∈ N gilt nK ∈ K+ . (iii) Für alle a, b ∈ K mit a < b gilt a < 2−1 K (a + b) < b. Beweis: zu (i) Aus a, b ∈ K+ folgt a b ∈ K+ . Nach Lemma (3.6) (ii) sind a−1 und b−1 und damit auch a−1 b−1 in K+ enthalten. Wegen a < b liegt auch b − a in K+ . Nun gilt a−1 − b−1 = 1K a−1 − 1K b−1 = = (bb−1 )a−1 − (aa−1 )b−1 b(a−1 b−1 ) − a(a−1 b−1 ) = = b(b−1 a−1 ) − a(a−1 b−1 ) (b − a)(a−1 b−1 ). Aus b − a ∈ K+ und a−1 b−1 ∈ K+ folgt also a−1 − b−1 ∈ K+ und damit a−1 > b−1 wie gewünscht. zu (ii) Wir beweisen die Aussage durch vollständige Induktion über n ∈ N0 . Wegen 0K 6= 1K und 12K = 1K können wir Teil (i) von Lemma (3.6), nach dem alle Quadrate ungleich Null positiv sind. Dies liefert uns 1K ∈ K+ , also die Aussage für n = 1. Ist nun n ∈ N beliebig, und setzen wir die Aussage für dieses n voraus, dann folgt (n + 1)K = nK + 1K ∈ K+ , denn die Summe zweier positiver Zahlen ist positiv. zu (iii) Nach Definition gilt 2K a = (1K + 1K )a = 1K a + 1K a = a + a, und ebenso erhält man 2K b = b + b. Aus a < b folgt 2K a = a + a < a + b und a + b < b + b = 2K b. Nach Teil (ii) gilt 2K ∈ K+ , und nach Lemma (3.6) (ii) ist damit auch 2−1 K positiv. Aus 2K a < a + b folgt nun a = 2−1 K (2K a) ≤ 2−1 K (a + b). −1 Aus a + b < 2K b folgt ebenso die Ungleichung 2−1 K (a + b) < 2K (2K b) = b. (3.9) Definition Eine Teilmenge I ⊆ K wird Intervall in K genannt, wenn gilt: Sind a, b ∈ I mit a < b, dann sind auch alle x ∈ K mit a < x < b in I enthalten. Für viele Anwendungen ist es hilfreich, unseren angeordneten Körper K durch Hinzunahme zweier weiterer Elementen −∞ und +∞ zu einer Menge K̄ = K ∪ {−∞, +∞} zu erweitern. Durch die Festlegung a≤b ⇔ a = −∞ ∨ (a, b ∈ R ∧ a ≤ b) ∨ b = +∞ wird die Totalordnung ≤ von K auf K̄ ausgedehnt. Denn auf Grund der Definition gilt a ≤ a nicht nur für alle a ∈ K, sondern auch für a ∈ {±∞}. Also ist ≤ reflexiv. Seien nun a, b ∈ K̄ mit a ≤ b und b ≤ a vorgegeben. Im Fall a, b ∈ K folgt a = b direkt aus der Tatsache, dass ≤ eine Totalordnung auf K ist. Gilt a ∈ / K und b ∈ K, dann folgt aus a ≤ b, dass a = −∞ sein muss, und aus b ≤ a ergibt sich ebenso b = ∞, also a = b. Analog behandelt man die beiden Kombinationen a ∈ K, b ∈ / K und a, b ∈ / K. Also ist die Relation ≤ antisymmetrisch. —– 50 —– Zum Nachweis der Transitivität seien a, b, c ∈ K̄ mit a ≤ b und b ≤ c vorgegeben. Ist a = −∞ oder c = +∞, dann gilt auf jeden Fall a ≤ c. Im Fall a = +∞ muss b = +∞ und damit auch c = +∞ gelten, also ist a ≤ c auch hier füllt. Genauso behandelt man den Fall c = −∞. Im Fall a, c ∈ K folgt aus a ≤ b zunächst b ∈ K oder b = +∞; aber b = +∞ würde wegen b ≤ c auch c = +∞ bedeuten, im Widerspruch zur Voraussetzung. Also liegt auch b in K. Die Ungleichungen a ≤ b und b ≤ c implizieren dann a ≤ c, weil ≤ auf K transitiv ist. Damit ist insgesamt gezeigt, dass ≤ auf K̄ eine Halbordnung ist. Darüber hinaus ist es sogar eine Totalordnung. Sind nämlich a, b ∈ K̄ vorgegeben, dann liegen entweder beide Elemente in K, oder mindestens eines der Elemente liegt in {±∞}. Im ersten Fall erhalten wir a ≤ b oder b ≤ a, weil ≤ eine Halbordnung auf K ist. Im zweiten Fall sei beispielsweise a = −∞. Dann gilt auf jeden Fall a ≤ b. Nach demselben Schema geht man die Fälle a = +∞, b = ∞ und b = +∞ durch. (3.10) Proposition Neben der leeren Menge ∅ sind alle Teilmengen der Form ]a, b[ = {x ∈ K | a < x < b} a, b ∈ K̄ [a, b[ = {x ∈ K | a ≤ x < b} a ∈ K, b ∈ K̄ ]a, b] = {x ∈ K | a < x ≤ b} a ∈ K̄, b ∈ K [a, b] = {x ∈ K | a ≤ x ≤ b} a, b ∈ K Intervalle in K. Insbesondere ist auch K = ]−∞, +∞[ selbst ein Intervall. Beweis: Wir beweisen die Intervalleigenschaft nur für Teilmengen der Form [a, b[ mit a ∈ K und b ∈ K̄, da für alle übrigen der Beweis sehr ähnlich funktioniert. Seien x, y Elemente aus I = [a, b[ mit x < y, und sei z ∈ K mit x < z < y. Zu zeigen ist, dass auch z in I liegt. Wegen x ∈ I gilt a ≤ x, und aus a ≤ x, x < z folgt a ≤ z sogar a < z. Aus y ∈ I folgt y < b, und zusammen mit z < y erhalten wir z < b. Insgesamt gilt also a ≤ z < b und somit z ∈ I. Man beachte, dass es die Argumentation keine Rolle spielt, ob b ∈ R oder b = +∞ gilt. Intervalle vom Typ ]a, b[ bezeichnet man als offen, die vom Typ [a, b] als abgeschlossen, und diejenigen vom Typ [a, b[ oder ]a, b] sind halboffen. In jedem Fall nennt man a und b die Grenzen des Intervalls. Sind sie beide Grenzen endlich, also Elemente aus K, so spricht man von einem endlichen, sonst von einem unendlichen Intervall. (3.11) Definition (archimedisches Axiom) Die Anordnung K+ auf K wird archimedisch genannt, wenn für beliebige x, y ∈ K+ jeweils ein n ∈ N existiert, so dass nK x > y erfüllt ist. Man bezeichnet (K, K+ ) in diesem Fall als archimedisch angeordneten Körper. Die Elemente x, y ∈ K+ erfüllen die archimedische Bedingung: Es gilt 5K x > y. —– 51 —– Es gibt angeordnete Körper, in denen das archimedische Axiom nicht gültig ist, beispielsweise die sogenannen hyperreellen Zahlen, eine Erweiterung der gewöhnlichen reellen Zahlen, in der auch „unendlich kleine“ und „unendlich große“ Elemente existieren. Wir beweisen nun noch einige Rechenregeln basierend die auf dem archimedischen Axiom. (3.12) Satz Sei (K, K+ ) ein archimedisch angeordneter Körper. (i) Für jedes " ∈ K+ gibt es ein n ∈ N mit n−1 K < ". (ii) Sei x ∈ K mit x ≥ −1K . Dann gilt (1K + x)n ≥ 1K + nK x für alle n ∈ N0 . Dies ist die sogenannte Bernoullische Ungleichung. (iii) Ist b > 1K , dann existiert für jedes κ ∈ K+ ein n ∈ N mit b n > κ. Ist dagegen 0K < b < 1K , so gibt es für jedes " ∈ K+ ein n ∈ N mit b n < ". Beweis: zu (i) Wenden wir das archimedische Axiom auf x = 1K und y = " −1 an, so erhalten wir ein n ∈ N mit nK > " −1 . Es folgt n−1 K < ". zu (ii) Wir zeigen die Ungleichung durch vollständige Induktion über n ∈ N0 . Für n = 0 ist die Aussage offen- sichtlich erfüllt, denn es ist (1K + x)0 = 1K und 1K + 0K x = 1K . Sei nun n ∈ N0 , und setzen wir die Aussage für n voraus. Es gilt (1K + x)n+1 = (1K + x)n (1K + x) 1K + nK x + x + nK x 2 ≥ ≥ 1K + nK x + x (1K + nK x)(1K + x) = 1K + (n + 1)K x = , wobei wir im zweiten Schritt neben der Induktionsvoraussetzung (1K + x)n ≥ 1+nK x auch die Bedingung 1K + x ≥ 0 an x verwendet haben, die sich aus der Voraussetzung x ≥ −1K ergibt. Insgesamt erhalten wir die gewünschte Ungleichung für n + 1. zu (iii) Zunächst bestrachten wir den Fall b > 1K . Sei x = b − 1K . Auf Grund der Bernoullischen Ungleichung gilt b = (1K + x)n ≥ 1K + nK x. Wir zeigen nun, dass ein n ∈ N mit nK x > κ − 1K existiert. Im Fall κ − 1K ≤ 0K n ist dies bereits für n = 1 erfüllt; im Fall κ − 1K > 0K liefert uns das archimedische Axiom wegen x > 0K ein solches Element. In beiden Fällen gilt dann b n ≥ 1K + nK x > 1K + (κ − 1K ) = κ. Setzen wir nun b < 1K voraus. Definieren wir c = b−1 , dann gilt c > 1K . Auf Grund des bereits bewiesenen Falls, angewendet auf κ = " −1 , gibt es ein n ∈ N n mit c n > " −1 . Daraus folgt (c n )−1 < ". Nach Lemma (3.4) (iii) ist c n b n = (c b)n = (b−1 b)n = 1K = 1K und somit (c n )−1 = b n . Auf diese Weise erhalten wir b n < ". —– 52 —– (III) Vollständigkeit Im weiteren Verlauf bezeichnet (K, K+ ) stets einen angeordneten Körper. Wie wir im vorherigen Abschnitt gesehen haben, existiert auf K eine Totalordnung, wir können uns die Menge K also als linearen „Zahlenstrahl“ vorstellen. Eine Eigenschaft, die nun die reellen Zahlen R gegebenüber anderen Körpern wie etwa Q auszeichnet, ist die Tatsache, dass dieser Zahlenstrahl keine „Lücken“ besitzt. Diese Eigenschaft soll im folgenden präzise formuliert werden. (3.13) Definition Ein Dedekindscher Schnitt von K ist ein Paar (A, B) bestehend aus Teilmengen A, B ⊆ K mit den folgenden Eigenschaften: (i) Es gilt A, B 6= ∅ und A ∪ B = K. (ii) Für alle a ∈ A und b ∈ B gilt a < b, insbesondere ist A ∩ B = ∅. Ein Element t ∈ K wird Schnittzahl von (A, B) genannt, wenn die Ungleichungen a ≤ t ≤ b für alle a ∈ A und b ∈ B erfüllt sind. ein Dedekindscher Schnitt (A, B) mit Schnittzahl t (3.14) Lemma Jeder Dedekindsche Schnitt von K besitzt höchstens eine Schnittzahl. Beweis: Sei (A, B) ein Dedekindscher Schnitt, und nehmen wir an, dass t, t 0 ∈ K mit t < t 0 beides Schnittzahlen 0 0 von (A, B) sind. Nach Proposition (3.8) erfüllt das Element u = 2−1 K (t + t ) die Ungleichungen t < u < t . Wegen / B. Das t < u und t ≥ a für alle a ∈ A gilt u ∈ / A. Andererseits gilt wegen u < t 0 und b ≥ t 0 für alle b ∈ B auch u ∈ Element u liegt also weder in der Menge A noch in der Menge B. Aber wegen A ∪ B = K muss jedes Element von K in A oder B liegen. Dieser Widerspruch zeigt, dass keine zwei verschiedenen Schnittzahlen existieren können. (3.15) Definition Ein angeordneter Körper K wird vollständig genannt, wenn jeder Dede- kindsche Schnitt (A, B) von K eine Schnittzahl besitzt. Betrachten wir im Körper R die beiden Teilmengen A = {x ∈ R | x ≤ p 2} und B = {x ∈ R | x > p 2}. Wir überprüfen, dass (A, B) ein Dedekindscher Schnitt ist. Die Mengen A und B sind nichtleer, denn beispielsweise p p gilt 1 ∈ A und 2 ∈ B. Weil für jede Zahl x ∈ R entweder x ≤ 2 oder x > 2 gilt, ist A ∪ B = R erfüllt. Ist a ∈ A und —– 53 —– p 2 < b, also insbesondere a < b. Damit haben wir alle Bedingungen für einen Dedekindschen p p Schnitt verifiziert. Anhand der Ungleichungen a ≤ 2 < b sieht man auch, dass 2 eine Schnittzahl von (A, B) ist. b ∈ B, dann gilt a ≤ Genauso können wir im Körper Q der rationalen Zahlen die beiden Teilmengen p p A = {x ∈ Q | x ≤ 2} und B = {x ∈ Q | x > 2} definieren. Wie im vorherigen Beispiel überzeugt man sich davon, dass (A, B) ein Dedekindscher Schnitt ist. Dieser besitzt aber (im Körper Q) keine Schnittzahl. Gehen wir nämlich davon aus, dass u ∈ Q eine Schnittzahl ist, dann gilt entweder p p p u < 2 oder u > 2, denn die Zahl 2 ist irrational und somit nicht in Q enthalten. Betrachten wir zunächst den p Fall u < 2. Es gibt keine Schnittzahl u < p 2. Nach Definition der Schnittzahl muss a ≤ u für alle a ∈ A gelten. Wir wir aber im nächsten Abschnitt zeigen werden, liegen die rationalen Zahlen dicht in R, was bedeutet, dass in jedem noch so kleinen offenen Intervall von R eine p rationale Zahl enthalten ist. Dies bedeutet, dass ein a1 ∈ Q miteinander u < a1 < 2 existiert. Es gilt a1 ∈ A nach p Definition der Menge A, aber dies steht im Widerspruch zu a ≤ u für alle a ∈ A. Ebenso führt man den Fall u > 2 auf einen Widerspruch. Der Körper Q ist also nicht vollständig! Wir nähern uns dem Begriff der Vollständigkeit noch von einer etwas anderen Richtung, die sich später in den Anwendungen als wichtig herausstellen wird. (3.16) Definition Sei M ⊆ K eine beliebige Teilmenge. Eine Element s ∈ K heißt obere Schranke von M , wenn s ≥ x für alle x ∈ M gilt. Ein Element, das obere Schranke von M ist und zugleich in M liegt, wird Maximum oder größtes Element von M genannt. Genauso definiert man (3.17) Definition Sei M ⊆ K eine beliebige Teilmenge. Eine Element s ∈ K heißt untere Schranke von M , wenn s ≤ x für alle x ∈ M gilt. Ein Element, das untere Schranke von M ist und zugleich in M liegt, wird Minimum oder kleinstes Element von M genannt. Jede Menge M besitzt höchstens ein Maximum. Sind nämlich s, s0 beides Maxima von M , dann ist s zugleich obere Schranke von M , und wegen s0 ∈ M folgt s ≥ s0 . Genauso beweist man die Ungleichung s0 ≥ s, und insgesamt folgt —– 54 —– s = s0 . Mit genau demselben Argument sieht man auch, dass jede Menge höchstens ein Minimum besitzt. Im Falle der Existenz bezeichnet man das größte Element von M mit max M und das kleinste Element mit min M . Für jede Teilmenge M ⊆ K bezeichnen wir mit S + (M ) die Menge der oberen und mit S − (M ) die Menge der unteren Schranken von M . (3.18) Definition Sei M ⊆ K. Ein kleinstes Element von S + (M ), sofern es existiert, wird kleinste obere Schranke oder Supremum von M genannt. Ein größtes Element von S − (M ) bezeichnet man (im Falle der Existenz) als größte untere Schranke oder Infimum von M . Die Menge M (blau) besitzt zwar unendlich viele obere Schranken (grün), aber nur eine kleinste obere Schranke (rot). Dass jede Teilmenge von K höchstens ein kleinstes bzw. größtes Element besitzt, gilt natürlich auch für die Mengen S + (M ) und S − (M ). Daraus folgt, dass das Supremum und das Infimum einer Menge M ⊆ K jeweils eindeutig bestimmt ist, sofern es existiert. Man verwendet üblicherweise für das Supremum die Bezeichnung sup M , für das Infimum die Bezeichung inf M . (3.19) Proposition Sei M ⊆ K. Existiert das Maximum von M , dann auch das Supremum von M , und es gilt max M = sup M . Wenn die Menge M ein Minimum besitzt, so hat sie auch ein Infimum, und es gilt min M = inf M . Beweis: Sei a = max M . Dann ist a nach Definition eine obere Schranke von M . Nehmen wir an, dass a kein Supremum, also keine kleinste obere Schranke von M ist. Dann gibt es eine noch kleinere obere Schranke, also ein b ∈ S + (M ) mit b < a. Aber dies ist unmöglich, denn wegen a ∈ M und b ∈ S + (M ) muss b ≥ a gelten. Dieser Widerspruch zeigt, dass a = sup M gilt. Der Beweis der Aussage über das Minimum läuft völlig analog. (3.20) Definition Eine Teilmenge M ⊆ K ist nach oben beschränkt, wenn S + (M ) nicht leer ist, und nach unten beschränkt, wenn dasselbe für S − (M ) gilt. Ist M nach oben und nach unten beschränkt, so nennt man M eine beschränkte Menge. Mit Hilfe des Supremum und des Infimums können wir die Vollständigkeit angeordneter Körper auf eine andere Art und Weise charakterisieren. —– 55 —– (3.21) Satz Folgende Aussagen sind äquivalent. (i) Der angeordnete Körper (K, K+ ) ist vollständig. (ii) Für jede nichtleere, nach oben beschränkte Menge M ⊆ K existiert sup M . (iii) Für jede nichtleere, nach unten beschränkte Menge M ⊆ K existiert inf M . Beweis: „(i) ⇒ (ii)“ Sei M ⊆ K nichtleer und nach oben beschränkt. Weiter sei B = S + (M ) und A = K \ B. Wir zeigen, dass (A, B) ein Dedekindscher Schnitt von K ist. Weil M nach oben beschränkt ist, ist B nicht leer. Sei x ∈ M ein beliebiges Element. Wegen x − 1K < x und x ∈ M ist x − 1K keine obere Schranke von M . Aus x − 1K ∈ / B folgt x − 1K ∈ A, also ist auch A nicht leer. Nach Definition ist auch A ∪ B = K erfüllt. Sei nun a ∈ A und b ∈ B, zu zeigen ist a < b. Nehmen wir an, dass a ≥ b gilt. Weil das Element b eine obere Schranke von M ist, müsste dies erst recht für a gelten. Aber dann wäre a auch ein Element von B, was auf Grund der Definition A = K \ B ausgeschlossen ist. Da K nach Voraussetzung vollständig ist, existiert für (A, B) eine Schnittzahl t. Wir zeigen, dass t = sup M gilt. −1 Nehmen wir zunächst an, t wäre keine obere Schranke. Dann gäbe es ein x ∈ M mit x > t. Setzen wir y = 2K (t + x), dann gilt t < y < x. Weil t die Schnittzahl von (A, B) ist, muss y in B liegen. Damit wäre y eine obere Schranke von M , was im Widerspruch zu x ∈ M und x > y steht. Gehen wir jetzt davon aus, das Element t wäre zwar eine obere Schranke, aber kein Supremum von M . Dann gäbe es ein t 0 ∈ S + (M ) mit t 0 < t. Weil aber t die Schnittzahl von (A, B) ist, würde daraus t 0 ∈ A folgen. Somit wäre t 0 kein Element von B und damit keine obere Schranke von M . Insgesamt ist t = sup M damit bewiesen. “(ii) ⇒ (iii)“ Sei M ⊆ K nichtleer und nach unten beschränkt. Dann ist auch −M = {−x | x ∈ M } eine nichtleere Teilmenge von K. Auf Grund der Äquivalenz t ≤ x ∀x ∈ M ⇔ −t ≥ −x ∀ x ∈ M ist ein Element t ∈ K genau dann eine untere Schranke von M , wenn −t eine obere Schranke von −M ist. Da nach Voraussetzung die Menge M untere Schranken besitzt, gibt es für −M obere Schranken. Aus unserer Voraussetzung folgt nun, dass s = sup(−M ) existiert. Wir zeigen, dass −s = inf M gilt. Weil s eine obere Schranke von −M ist, handelt es sich auf Grund unserer Vorüberlegung bei −s um eine untere Schranke von M . Wäre −s dennoch kein Infimum von M , dann müsste es ein s0 ∈ S − (M ) mit s0 > −s geben. Aber dann würde auch −s0 < s gelten, und nach unserer Vorüberlegung wäre −s0 ∈ S + (−M ). Aber dies ist unmöglich, weil s nach Voraussetzung die kleinste obere Schranke von −M ist. “(iii) ⇒ (i)“ Sei (A, B) ein Dedekindscher Schnitt von K. Wegen A 6= ∅ gibt es ein a ∈ A, und dieses erfüllt a ≤ b für alle b ∈ B. Insgesamt ist B damit nichtleer und nach unten beschränkt, und auf Grund unserer Voraussetzung existiert t = inf B. Wir zeigen, dass t die Schnittzahl von (A, B) ist. Weil t nach Definition eine untere Schranke von B ist, gilt t ≤ b für alle b ∈ B. Nehmen wir nun an, a ≤ t ist nicht für alle a ∈ A erfüllt. Dann gibt es ein a ∈ A mit a > t. Wegen a ≤ b für alle b ∈ B ist a in S − (B) enthalten. Aber dies ist unmöglich, denn nach Definition ist t das größte Element von S − (B). Also gilt a ≤ t ≤ b für alle a ∈ A und b ∈ B. —– 56 —– Ist M ⊆ K nicht nach oben beschränkt, also S + (M ) = ∅, dann definiert man sup M = +∞. Ebenso ist es üblich, inf M = −∞ zu setzen, wenn M nicht nach unten beschränkt ist. Im Gegensatz zu beliebigen angeordneten Körpern lassen sich in vollständigen Körpern die Intervalle leicht beschreiben. (3.22) Satz Ist (K, K+ ) vollständig, dann sind die Intervalle in K genau die in Proposition (3.10) angegebenen Teilmengen der Form ]a, b[, ]a, b], [a, b[ und [a, b] mit a, b ∈ K̄. Beweis: Sei I ⊆ K ein Intervall, und gehen wir davon aus, dass I nicht leer ist. Wir beweisen den Satz, indem wir die folgenden vier Einzelfälle abarbeiten. (i) Die Menge I ist weder nach oben noch nach unten beschränkt. (ii) Sie ist nach oben, aber nicht nach unten beschränkt. (iii) Sie ist nach unten, aber nicht nach oben beschränkt. (iv) Sie ist beschränkt. zu (i) Wir zeigen, dass in diesem Fall I = K gilt. Ist x ∈ K beliebig, dann gibt es ein z ∈ I mit z > x, denn sonst wäre x eine obere Schranke von I. Ebenso gibt es ein y ∈ I mit y < x, weil x ansonsten eine untere Schranke von I wäre. Aus y, z ∈ I, den Ungleichungen y < x < z und der Intervall-Eigenschaft folgt x ∈ I. zu (ii) Hier zeigen wir, dass I die Form ]−∞, b[ oder ]−∞, b] hat. Weil I nichtleer und nach oben beschränkt ist, existiert b = sup I. Setzen wir zunächt b ∈ I voraus und zeigen wir, dass in diesem Fall I = ]−∞, b] gilt. Ist x ∈ I, dann folgt x ≤ b, weil b eine obere Schranke von I ist. Somit erhalten wir I ⊆ ]−∞, b]. Zum Beweis der umgekehrten Inklusion sei x ∈ ]−∞, b] vorgegeben. Dann gilt x ≤ b, und im Fall x = b ist x ∈ I offenbar erfüllt. Gehen wir von x < b aus, dann gibt es jedenfalls ein y ∈ I mit y < x, denn ansonsten wäre x eine untere Schranke von I, die nach Voraussetzung nicht existiert. Wegen x < b ist b = sup I ist x keine obere Schranke von I, somit gibt es ein z ∈ I mit x < z. Aus y, z ∈ I, den Ungleichungen y < x < z und der Intervall-Eigenschaft folgt x ∈ I. Insgesamt haben wir damit gezeigt, dass I = ]−∞, b] gilt. Betrachten wir nun den Fall b ∈ / I und zeigen, dass in dieser Situation I = ]−∞, b[ gilt. Ist x ∈ I, dann gilt x < b und somit x ∈ ]−∞, b[. Sei umgekehrt x ∈ ]−∞, b[ vorgegeben. Dann gilt x < b. Weil x keine untere Schranke von I ist, gibt es ein y ∈ I mit y < x. Weil x keine obere Schranke von I ist, existiert ein z ∈ I mit x < z. Aus y, z ∈ I, den Ungleichungen y < x < z und der Intervall-Eigenschaft folgt wiederum x ∈ I, damit ist die Gleichung I = ]−∞, b[ insgesamt bewiesen. zu (iii) Weil I nichtleer und nach unten beschränkt ist, existiert a = inf I. Wie im vorherigen Absatz beweist man nun I = ]a, +∞[ im Fall a ∈ / I und I = [a, +∞[ im Fall a ∈ I. Weil der Beweis völlig analog verläuft, verzichten wir auf die Angabe der Details. —– 57 —– zu (iv) Weil I nichtleer und beschränkt ist, existieren a = inf I und b = sup I. Wir betrachten zunächst den Fall, dass a ∈ / I und b ∈ I gilt und zeigen, dass dann die Gleichung I = ]a, b] gilt. Sei x ∈ I. Dann gilt a ≤ x ≤ b, weil a eine untere und b eine obere Schranke von I ist. Wegen a ∈ / I gilt sogar a < x ≤ b, und daraus folgt x ∈ ]a, b]. Setzen wir nun umgekehrt x ∈ ]a, b] voraus. Ist x = b, dann folgt c ∈ I. Ansonsten gilt a < x < b. Weil x keine untere Schranke für I ist (nach Definition ist a die größte untere Schranke), gibt es ein y ∈ I mit y < x. Andererseits ist x auch keine obere Schranke von I, so dass ein z ∈ I mit x < z existiert. Aus y, z ∈ I, den Ungleichungen y < x < z und der Intervall-Eigenschaft folgt x ∈ I. Damit ist I = ]a, b] nachgewiesen. Nach demselben Schema beweist man - Ist a ∈ I und b ∈ / I, dann gilt I = [a, b[. - Aus a, b ∈ / I folgt I = ]a, b[. - Aus a, b ∈ I folgt I = [a, b]. Insgesamt ist der Beweis damit abgeschlossen. Wir werden die vollständig angeordneten Körper noch auf eine weitere Art charakterisieren. (3.23) Definition Man sagt, der angeordnete Körper (K, K+ ) besitzt die Intervallschachte- lungs-Eigenschaft, wenn für jede Folge (I n )n∈N nichtleerer, abgeschlossener, endlicher IntervalT le, die I n+1 ⊆ I n für alle n ∈ N erfüllt, die Schnittmenge n∈N I n nicht leer ist. Der Körper Q der rationalen Zahlen besitzt diese Eigenschaft nicht. Beispielsweise ist für jedes n ∈ N die Menge p p I n = [ 2 − 1n , 2 + 1n ] ∩ Q ein abgeschlossenes und endliches Intervall in Q, und es gilt I n+1 ⊆ I n für alle n ∈ N. T Aber der Durschnitt n∈N I n dieser Intervalle ist die leere Menge. (3.24) Satz Ein angeordneter Körper (K, K+ ) ist genau dann vollständig, wenn er die Intervallschachtelungs-Eigenschaft besitzt und die Anordnung K+ archimedisch ist. Beweis: „⇒“ Wir setzen voraus, dass (K, K+ ) vollständig ist und beweisen zunächst die Intervallschachtelungs- Eigenschaft. Sei I n = [an , bn ] eine Folge nichtleerer, abgeschlossener, endlicher Intervalle mit an , bn ∈ K, an < bn und I n ⊆ I n+1 für alle n ∈ N. Wir definieren A = {an | n ∈ N}. Offenbar ist A nichtleer, und wegen A ⊆ I1 ist A beschränkt. Auf Grund der Vollständigkeit existiert somit a = sup A. T Zum Nachweis der Intervallschachtelungs-Eigenschaft zeigen wir, dass a im Durchschnitt n∈N I n der Intervalle enthalten ist. Weil a eine obere Schranke von A ist, gilt a ≥ an für alle n ∈ N. Liegt a dennoch nicht im Durchschnitt, dann gilt a ∈ / I m für ein m ∈ N, also a > bm . Wir zeigen nun, dass bm eine obere Schranke von A ist. —– 58 —– Wegen I n+1 ⊆ I n für alle n ∈ N gilt jeweils an+1 ≥ an und bn+1 ≤ bn . Ist nun n ≥ m, dann gilt bm ≥ bn > an . Im Fall n ≤ m gilt bm > am ≥ an . Also ist bm tatsächlich eine obere Schranke von A. Weil a aber die kleinste obere Schranke von a ist, folgt daraus a ≤ bm , im Widerspruch zu unserer vorherigen Feststellung. Dies widerspruch zeigt, dass a im Durchschnitt sämtlicher Intervalle enthalten ist. Nun zeigen wir noch, dass K+ archimedisch ist. Seien x, y ∈ K+ vorgegeben, und nehmen wir an, es gibt kein n ∈ N mit nK x > y. Dann gilt nK x ≤ y und somit nK ≤ N x y für alle n ∈ N, das heißt die Menge = {nK | n ∈ N} ist nach oben beschränkt. Wegen 1K ∈ N ist die Menge N außerdem nichtleer. Auf Grund der Vollständigkeit existiert somit s = sup N . Weil s nach Definition die kleinste obere Schranke von N ist, kann s − 1K wegen s − 1K < s keine obere Schranke von N sein. Daraus folgt, dass ein n ∈ N mit nK > s−1K existiert. Wir erhalten (n+1)K = nK +1K > s. Aber wegen (n + 1)K ∈ N widerspricht dies s = S + (N ). Unsere Annahme, dass kein n ∈ N mit nK x > y existiert, hat zu einem Widerspruch geführt. Also gibt es ein solches n, und K+ ist archimedisch. „⇐“ Setzen wir nun voraus, dass (K, K+ ) die Intervallschachtelungs-Eigenschaft besitzt und ein archimedisch angeordneter Körper ist. Wir müssen zeigen, dass daraus die Vollständigkeit von (K, K+ ) folgt. Sei dazu M ⊆ K eine nichtleere, nach oben beschränkte Menge. Zu zeigen ist, dass s = sup M existiert. Um die IntervallschachtelungsEigenschaft anwenden zu können, definieren wir I n = [an , bn ] für jedes n ∈ N0 durch folgendes Verfahren. Sei a ∈ M und b ∈ S + (M ) mit a < b. Zunächst setzen wir a0 = a, b0 = b. Sei nun n ∈ N0 , und nehmen wir an, dass an , bn bereits konstruiert sind. Wir setzen dann cn = 2−1 K (an + bn ) und führen eine Fallunterscheidung durch. Gilt cn ∈ S + (M ), dann definieren wir an+1 = an und bn+1 = cn . Ist cn dagegen keine obere Schranke von M , dann setzen wir an+1 = cn und bn+1 = bn . Wir überprüfen durch vollständige Induktion für jedes n ∈ N0 die folgenden Aussagen. n (i) bn − an = (2−1 K ) (b − a) (ii) Das Element bn ist eine obere Schranke von M . (iii) Für das Intervall I n = [an , bn ] gilt I n ∩ M 6= ∅. Für n = 0 sind die Aussagen (i), (ii) und (iii) nach Definition erfüllt. Sei nun n ∈ N0 , und setzen wir die drei Aussagen für n voraus. Es gilt cn − an = −1 2−1 K a n + 2K b n − a n = 2−1 K (bn − an ) = n+1 (2−1 (b − a) K ) bn − cn = −1 bn − 2−1 K b n − 2K a n = 2−1 K (bn − an ) = n+1 (2−1 (b − a). K ) und ebenso Weil (an+1 , bn+1 ) entweder mit (an , cn ) oder mit (cn , bn ) übereinstimmt, ist (i) für n + 1 auf jeden Fall erfüllt. Außerdem wird bn+1 so gewählt, dass auch Aussage (ii) für n + 1 gültig ist. Überprüfen wir nun noch die Aussage (iii). Nach Induktionsvoraussetzung gibt es ein x ∈ M mit an ≤ x ≤ bn . Ist (an+1 , bn+1 ) = (an , cn ), dann ist cn = bn+1 eine obere Schranke von M . Es gilt dann an ≤ x ≤ cn , also x ∈ I n+1 ∩ M . Im Fall (an+1 , bn+1 ) = (cn , bn ) ist cn keine obere —– 59 —– Schranke von M , die Zahl bn nach Induktionsvoraussetzung aber schon. Somit gibt es ein x ∈ M mit cn < x ≤ bn , und es folgt x ∈ I n+1 ∩ M . Damit ist der Induktionsbeweis ist abgeschlossen. Für jedes n ∈ N0 gilt wegen an < cn < bn in jedem Fall an+1 ≥ an und bn+1 ≤ bn , insgesamt also I n+1 ⊆ I n . Deshalb kann die Intervallschachtelungs-Eigenschaft angewendet werden, T und diese zeigt, dass ein Element s ∈ K im Durchschnitt n∈N0 I n sämtlicher Intervalle existiert. Wir werden zu zeigen, dass s = sup M gilt. Nehmen wir zunächst an, dass s keine obere Schranke von M ist. Dann gibt es ein x ∈ M mit x > s. Auf Grund der archimedischen Anordnung finden wir für " = x−s b−a n nach Satz (3.12) (iii) ein n ∈ N mit (2−1 K ) < ". Es folgt n bn − an = (2−1 K ) (b − a) < "(b − a) = x − s und bn < an + x − s ≤ x. Aber dies widerspricht der Feststellung, dass bn eine obere Schranke von M ist. Gehen wir nun davon aus, dass s zwar eine obere Schranke, aber kein Supremum ist. Dann gibt es ein s0 ∈ S + (M ) mit s0 < s. Setzen wir " = s−s0 , b−a n dann finden wir durch erneute Anwendung der archimedischen Anordnungseigenschaft ein n ∈ N mit (2−1 K ) < ", n 0 und daraus folgt bn − an = (2−1 K ) (b − a) < s − s . Auf Grund der Aussage (iii) gibt es ein x ∈ K mit an ≤ x ≤ bn . Insgesamt erhalten wir s0 < s − bn + an ≤ an ≤ x. Aber s0 < x widerspricht der Annahme, dass s0 eine obere Schranke von M ist. Damit ist s = sup M und die Vollständigkeit von K bewiesen. Mit Hilfe des Intervallschachtelungs-Kriteriums leiten wir eine weitere wichtige Eigenschaft vollständiger angeordneter Körper her. (3.25) Satz Jeder vollständige, angeordnete Körper besitzt überabzählbar viele Elemente. Beweis: Sei (K, K+ ) vollständig, und nehmen wir an, dass K höchstens abzählbar ist. Dann gibt es eine injektive Abbildung f : K → N und nach (2.10) eine Abbildung g : N → K mit f ◦ g = idN . Wiederum nach (2.10) ist die Abbildung g surjektiv. Wir definieren x n = g(n) für alle n ∈ N und werden die Surjektivität von g nun zu einem Widerspruch führen. Dazu definieren wir zwei Folgen (i` )`∈N und ( j` )`∈N natürlicher Zahlen nach folgendem Schema. Zunächst setzen wir i1 = 1 und j1 = min{n ∈ N | x n > x i1 }. Ist nun ` ∈ N und sind i` , j` bereits konstruiert, dann setzen wir i`+1 = min{n ∈ N | x i` < x n < x j` } j`+1 = min{n ∈ N | x i`+1 < x n < x j` } Nach Konstruktion gilt für alle ` ∈ N jeweils x i` < x i`+1 < x j`+1 < x j` . Setzen wir I` = [x i` , x j` ], dann gilt also jeweils T I` ) I`+1 . Auf Grund des Intervallschachtelungs-Kriteriums gibt es ein x ∈ K im Durchschnitt `∈N I` all dieser Intervalle. —– 60 —– Auf Grund der Surjektivität von oben gibt es ein m ∈ N mit x = x m . Es gilt dann x i` ≤ x m ≤ x j` für alle ` ∈ N0 ; wegen x i` < x i`+1 und x j`+1 < x j` muss sogar x i` < x m < x j` für alle ` gelten. Weil die Indizes i` alle verschieden sind, muss ein k ∈ N0 , k ≥ 2 mit ik > m existieren. Nun gilt nach Definition ik = min{n ∈ N0 | x ik−1 < x n < x jk−1 }. Aber andererseits gilt x ik−1 < x m < x jk−1 , also widerspricht ik > m der Minimalität von ik . Die Annahme „K höchstens abzählbar“ war also falsch, und somit ist K überabzählbar. (IV) Definition der Zahlbereiche N, Z, Q und R Nach den Vorbereitungen der letzten drei Abschnitte können wir nun die reellen Zahlen definieren. (3.26) Satz (ohne Beweis) Es gibt einen vollständigen, angeordneten Körper. Wir bezeichnen ihn mit R und nennen ihn den Körper der reellen Zahlen. Für Null- und Einselement 0R , 1R in R schreiben wir 0 und 1, lassen die Angabe des Körpers R im Index also künftig weg. An Stelle des Ausdrucks a b−1 schreiben wir auch ab , d.h. wir verwenden die aus der Schule bekannte Bruchschreibweise. Wir verwenden die Bezeichnung R+ für die Teilmenge der positiven reelle Zahlen und setzen R+ = R+ ∪ {0}. Sämtliche Eigenschaften, die wir im letzten Abschnitt für vollständige Körper hergeleitet haben, sind also auch für die reellen Zahlen gültig, nämlich (i) Jede nichtleere, nach oben beschränkte Teilmenge von R besitzt ein Supremum, und jede nichtleere, nach unten beschränkte Teilmenge besitzt ein Infimum, nach (3.21). (ii) Der Körper R besitzt die Intervallschachtelungs-Eigenschaft, nach (3.22). (iii) Die Anordnung R+ ist archimedisch nach (3.22). Damit sind auch die Aussagen von (3.12) gültig. (iv) Der Körper R ist überabzählbar, siehe (3.25). Bei der Definition der archimedischen Eigenschaft wurden allerdings die natürlichen Zahlen als bekannt vorausgesetzt. Wir werden nun die natürlichen Zahlen als Teilmenge von R definieren. (3.27) Definition Eine Teilmenge M ⊆ R wird induktiv genannt, wenn 1 ∈ M gilt und für jedes x ∈ M auch x + 1 ∈ M erfüllt ist. —– 61 —– Beispiele für induktive Teilmengen in R sind R selbst, R+ oder R+ . (3.28) Definition Die Teilmenge N ⊆ R der natürlichen Zahlen ist definiert durch \ = N M = { n ∈ R | n ∈ M für jede induktive Teilmenge M ⊆ R }. M ⊆R induktiv Außerdem definieren wir N0 = N ∪ {0}. Die Menge N ist selbst induktiv. Da nämlich 1 nach Definition in jeder induktiven Menge liegt, ist 1 auch im Durchschnitt aller induktiven Mengen, also in N, enthalten. Ist x ∈ N, dann liegt x in in jeder induktivem Menge. Nach Definition ist dann auch x + 1 in jeder induktiven Menge enthalten. Des folgt x + 1 ∈ N. Aus der Definition von N folgt unmittelbar, dass N ⊆ M für jede induktive Teilmenge M ⊆ R gilt. Ist M umgekehrt eine induktive Teilmenge von R mit M ⊆ N, dann muss also M = N gelten. (3.29) Proposition (i) Sind m, n ∈ N, dann gilt auch m + n ∈ N und mn ∈ N. (ii) Ist m ∈ N, dann liegt m − 1 in N0 . (iii) Alle natürlichen Zahlen sind positiv, d.h. es gilt N ⊆ R+ . Beweis: zu (i) Sei m ∈ N. Dann ist die Teilmenge T = {n ∈ N | m + n ∈ N} induktiv, denn es gilt m + 1 ∈ N auf Grund der Induktivität von N, und aus m + n ∈ N folgt aus demselben Grund m + (n + 1) ∈ N. Es folgt T = N, also m + n ∈ N für alle n ∈ N. Ebenso ist U = {n ∈ N | mn ∈ N} eine induktive Menge, denn wegen m1 = m ∈ N gilt 1 ∈ U, und aus n ∈ U folgt mn ∈ N ⇒ mn + m = m(n + 1) ∈ N ⇒ n + 1 ∈ U. Also ist wiederum U = N, es gilt also mn ∈ N für alle n ∈ N. zu (ii) Die Menge M = {x ∈ R | x − 1 ∈ N0 } ist induktiv. Denn wegen 1 − 1 = 0 gilt 1 ∈ M , und ist n ∈ M , dann gilt n − 1 ∈ N0 . Sowohl für n − 1 = 0 als auch für n − 1 ∈ N ist (n + 1) − 1 = n in N0 enthalten, und daraus folgt n + 1 ∈ M . Die Induktivität von M impliziert N ⊆ M . Also gilt n − 1 ∈ N0 für alle n ∈ N. zu (iii) Dies folgt aus der Induktivität der Menge T = {x ∈ N | x > 0R }. (3.30) Satz Die Menge N der natürlichen Zahlen erfüllt die Peano-Axiome (P1) bis (P5) aus Kapitel 1. —– 62 —– Beweis: Die Axiome (P1) (Existenz eines ausgezeichneten Elements 1 ∈ N) und (P2) (Existenz eines Nachfolgers n + 1 für jedes n ∈ N) ergeben sich direkt aus der Induktivität von N. Nehmen wir an, es gibt ein n ∈ N, das 1 als Nachfolger besitzt. Dann gilt n + 1 = 1, und daraus folgt n = 0. Aber die Null ist in N nicht enthalten, denn R+ ist eine induktive Menge mit 0 ∈ / R+ , und N ist in jeder induktiven Teilmenge von R enthalten. Damit ist (P3) bewiesen. Sind m, n ∈ N mit m + 1 = n + 1 vorgegeben, dann können wir auf beiden Seiten der Gleichung den Wert −1 addieren und erhalten m = n. Dies zeigt (P4). Nun beweisen wir noch das Induktionsprinzip (P5). Sei dazu ϕ ein Aussagenschema mit Parameter x, dass für jedes n ∈ N eine sinnvolle Aussage ϕ(n) liefert. Außerdem setzen wir voraus, dass die Aussagen ϕ(1) und ∀x ∈ N : ϕ(x) ⇒ ϕ(x + 1) erfüllt sind. Dann ist A = {n ∈ N | ϕ(n)} eine induktive Menge, denn wegen ϕ(1) gilt 1 ∈ A, und auf Grund der zweiten Voraussetzung ist für jedes n ∈ A auch n + 1 in A enthalten. Wie zu Anfang des Abschnitts bemerkt, folgt aus A ⊆ N und der Induktivität von A die Gleichheit A = N. Somit ist die Aussage ∀x ∈ N : ϕ(x) gültig und damit das Induktionsprinzip (P5) bewiesen. In den Übungen wurde gezeigt, dass aus den Peano-Axiomen folgt, dass jede nichtleere Teilmenge von N ein kleinstes Element besitzt. Wir bemerken noch, dass die Teilmenge N ⊆ R nach oben unbeschränkt ist. Denn nehmen wir an, s ∈ R wäre eine obere Schranke von N. Wegen 1 ≤ s muss s ∈ R+ gelten. Auf Grund der archimedischen Eigenschaft gibt es aber ein n ∈ N mit n = n · 1 > s, was zu unserer Annahme im Widerspruch steht. (3.31) Definition Die Menge Z der ganzen Zahlen und die Menge Q der rationalen Zahlen sind als Teilmengen von R definiert durch Z = Q = N0 ∪ {n ∈ R | −n ∈ N} {x ∈ R | ∃a ∈ Z, b ∈ N : x = ab }. (3.32) Satz (i) Durch Einschränkung der Abbildungen + : R × R → R und · : R × R → R auf Z × Z erhält man zwei Verknüpfungen + und · auf Z. Entsprechendes gilt für die Menge Q der rationalen Zahlen. (ii) Das Tripel (Z, +, ·) ist ein Ring. (iii) Das Tripel (Q, +, ·) ist ein Körper, und durch Q+ = R+ ∩ Q ist eine archimedische Anordnung auf Q definiert. Beweis: zu (i) Durch Einschränkung der Verknüpfungen + und · auf Z × Z erhält man zunächst Abbildungen + : Z × Z → R und · : Z × Z → R. Um zu zeigen, dass diese Abbildungen Verknüpfungen auf Z sind, müssen wir nachweisen, dass Summen und Produkte ganzer Zahlen wiederum ganze Zahlen sind. —– 63 —– Wir beginnen mit der Multiplikation. Für vorgegebene x, y ∈ Z beweist man x y ∈ Z durch separate Betrachtung der Fälle x ∈ N, x = 0 und −x ∈ N sowie y ∈ N, y = 0 und − y ∈ N. Ist beispielsweise x ∈ N und − y ∈ N, dann folgt aus (3.29) −x y ∈ N und damit x y ∈ Z. Die anderen acht Kombinationen können nach dem gleichen Prinzip abgearbeitet werden. Bevor wir zeigen, dass auch x + y in Z liegt, bemerken wir zunächst, dass Z ∩ R+ = N gilt. Die Inklusion „⊇“ folgt aus (3.29) (iii). Sei umgekehrt a ∈ Z ∩ R+ . Wegen 0 ∈ / R+ ist a = 0 ausgeschlossen. Wäre a = −n für ein n ∈ N, dann würden sowohl −n als auch n in R+ liegen, was den Anordungseigenschaften von R+ widersprechen würde. Also bleibt a = n als einzige Möglichkeit. Nun beweisen wir durch vollständige Induktion über n ∈ N: Ist x ∈ Z und n ∈ N0 , dann liegt x − n in Z. Für n = 0 ist nichts zu zeigen. Sei nun die Aussage für n bewiesen und x ∈ Z. Wir müssen zeigen, dass für x ∈ Z auch x − (n + 1) = (x − n) − 1 in Z liegt. Nach Induktionsvoraussetzung gilt x − n ∈ Z. Im Fall x − n > 0 gilt x − n ∈ N auf Grund der Bemerkung von oben. Aus (3.29) (ii) folgt x − (n + 1) = (x − n) − 1 ∈ N0 , also insbesondere x − (n + 1) ∈ Z. Ist x − n = 0, dann gilt x − (n + 1) = −1, und −1 ist ebenfalls in Z enthalten. Betrachten wir nun noch den Fall x − n < 0. Dann ist n − x wieder in Z ∩ R+ = N enthalten. Es folgt n − x + 1 ∈ N und somit x − (n + 1) = −(n − x + 1) ∈ Z. Nach diesen Vorbereitungen können wir nun zeigen, dass mit x, y ∈ Z auch x + y in Z enthalten ist. Sind x, y > 0, dann folgt x, y ∈ N und somit x + y ∈ N ⊆ Z. Im Fall x, y < 0 liegen −x und − y beide in N, somit gilt auch (−x) + (− y) ∈ N und x + y = −((−x) + (− y)) ∈ Z. Sei nun x > 0 und y < 0, also n = − y ∈ N. Wie zuvor gezeigt, gilt dann x + y = x + (−n) = x − n ∈ Z. Ebenso behandelt man den Fall x < 0, y > 0. Wir zeigen nun, dass die Einschränkungen von + und · auf Q × Q Verknüpfungen auf Q sind, d.h. dass für r, s ∈ Q auch r + s und rs in Q liegen. Sei dazu r = r +s = a b a b und s = + c d = c d mit a, c ∈ Z und b, d ∈ N. Auf Grund der Gleichungen ad + bc und bd rs = ac bd und wegen bd ∈ N sowie ad + bc, ac ∈ Z sind r + s und rs Elemente von Q. zu (ii) Wir überprüfen die Bedingungen aus der Ringdefinition (3.1). Da die Assoziativ- und Kommutativgesetze sowie das Distributivgesetz für alle Elemente in R gelten, sind sie erst recht für alle Elemente von Z bzw. Q erfüllt. Die Elemente 0Q = 0 und 1Q = 1 besitzen offenbar die definierende Eigenschaft von Null- und Einselement. Ist n ∈ Z, dann überprüft man durch Betrachtung der Einzelfälle n ∈ N, n = 0 und −n ∈ N leicht, dass auch −n in Z enthalten ist. Außerdem gilt n + (−n) = 0. Sei nun x ∈ Q, x = a b mit a ∈ Z und b ∈ N. Dann ist auch −x = −a b in Q enthalten, und es gilt x + (−x) = 0. Damit haben wir gezeigt, dass Z und Q Ringe sind. Sei x ∈ Q× , x = a b mit a ∈ Z und b ∈ N. Dann gilt a ∈ N oder −a ∈ N. Im ersten Fall zeigt die Gleichung x −1 = ab , im zweiten Fall die Gleichung x −1 = (−b) , (−a) dass auch x −1 in Q enthalten ist. Wegen x · x −1 = 1 besitzt x also einen Kehrwert in Q; dies zeigt, dass Q ein Körper ist. —– 64 —– Zum Schluss zeigen wir noch, dass Q+ = Q ∩ R+ die Bedingungen für eine Anordnung aus (3.5) erfüllt. Da R+ eine Anordnung auf R ist, gilt für jedes x ∈ Q genau eine der Bedingungen x ∈ R+ , x = 0 oder −x ∈ R+ . Zusammen mit x ∈ Q folgt daraus, dass genau eine der Bedingungen x ∈ Q+ , x = 0 oder −x ∈ Q+ erfüllt ist. Sind x, y ∈ Q+ , dann gilt insbesondere x, y ∈ R+ . Weil R+ eine Anordnung auf R ist, folgt x + y ∈ R+ und x y ∈ R+ . Wegen x + y, x y ∈ Q folgt daraus wiederum x + y ∈ Q+ und x y ∈ Q+ . Die Anordnung Q+ ist archimedisch, denn die archimedische Bedingung in (3.11) gilt für alle x, y ∈ R+ und somit erst recht für alle x, y ∈ Q+ . Wir bezeichnen eine Zahl x ∈ R als rational, wenn sie in Q liegt, ansonsten also irrational. (3.33) Satz Die rationalen und die irrationalen Zahlen liegen jeweils dicht in R. Dies bedeutet, dass jedes nicht-leere, offene Intervall I ⊆ R sowohl rationale als auch irrationale Zahlen enthält. Beweis: Nach Definition gilt I = ]a, b[ mit a, b ∈ R̄. Wir dürfen davon ausgehen, dass a < b mit a, b ∈ R gilt. Denn enthält jedes solche Intervall rationale und irrationale Zahlen, dann gilt dies erst recht für Intervalle der Form ]−∞, b[ und ]a, +∞[. Zunächst konzentrieren wir uns auf den Beweis der Aussage, dass I eine rationale Zahl enthält und führen dies auf den Fall zurück, dass a > 0 ist. Nehmen wir an, wir hätten den Satz in dieser Situation bereits bewiesen, und setzen wir nun a ≤ 0 voraus. Dann können wir a und b in den positiven Bereich verschieben und dort die bereits bewiesene Aussage anwenden. Da N nach oben unbeschränkt ist, gibt es ein k ∈ N mit k > −a, und wegen a + k, b + k > 0 finden wir auf Grund unserer Annahme finden ein s ∈ Q mit a + k < s < b + k. Es folgt dann a < r < b für die rationale Zahl r = s − k. Setzen wir nun 0 < a < b voraus. Die Idee besteht darin, den Abstand zwischen x und y durch Multiplikation mit einer natürlichen Zahl so zu vergrößern, dass zwischen x und y auf jeden Fall eine natürliche Zahl liegt. Dazu definieren wir " = b − a und wählen ein auf Grund von (3.12) existierendes m ∈ N mit 1 m < ". Sei nun k ∈ N minimal mit k > ma. Dann gilt k − 1 ≤ ma < k und somit k−1 m Wir rechnen nach, dass auch die Ungleichung b Insgesamt gilt also a < = k m a + (b − a) = k m ≤ a k < m . < b erfüllt ist. Tatsächlich gilt a+" > a+ 1 m ≥ k−1 m + 1 m = k m . < b. Nun zeigen wir noch, dass jedes endliche, offene Intervall I = ]a, b[ auch eine irrationale Zahl enthält. Nach eventueller Verkleinerung von I dürfen wir 0 ∈ / I annehmen. Wie bereits gezeigt, i h p p a pb 0 0 p enthält I = , 2 eine Zahl r ∈ Q, und wegen 0 ∈ / I ist r 6= 0. Die Zahl 2r liegt dann offenbar in I. Wäre 2r 2 p p p rational, dann würde auch 2 = ( 2r)r −1 ∈ Q gelten. Es ist aber bekannt, dass 2 nicht rational ist, und somit ist p auch 2r irrational. —– 65 —– Aus (2.25) und (2.26) kann leicht hergeleitet werden, dass Z und Q abzählbar unendlich sind. Zunächst sind Z und Q offenbar unendlich, da sie N als Teilmengen enthalten. Durch n 7→ −n ist eine Bijektion zwischen N und N− = {−n | n ∈ N} definiert. Also ist auch N− abzählbar unendlich. Als Vereinigung der höchstens abzählbaren Mengen N, {0} und N− ist Z höchstens abzählbar, insgesamt also abzählbar unendlich. Die surjektive Abbildung Z × N → Q, (a, b) 7→ a b zeigt, dass auch Q höchstens abzählbar und damit insgesamt abzählbar unendlich ist. Für beliebige Körper K haben wir im Abschnitt I Potenzen der Form a n mit a ∈ K und n ∈ N0 eingeführt. Dies werden wir nun verallgemeinern. Ist K ein Körper und a ∈ K× , so definieren wir a−n (a n )−1 = für n ∈ N. Insgesamt ist a m damit für alle m ∈ Z definiert. (3.34) Lemma Die Potenzgesetze (i) bis (iii) aus Lemma (3.4) sind im Fall a, b 6= 0K für beliebige m, n ∈ Z gültig. Beweis: Weil die Rechenregeln für m, n ∈ N0 bereits bewiesen wurden, können wir von Anfang an voraussetzen, dass mindestens einer der beiden Exponenten m, n negativ ist. zu (i) Hier betrachten wir zunächst den Fall m ≥ 0, n < 0. Darüber hinaus nehmen wir an, dass m + n ≥ 0 gilt. Dann liegen m + n, −n und m in N0 . Es gilt (m + n) + (−n) = m, und auf Grund des bereits bewiesenen Falls gilt deshalb a m+n a−n = a m . Es folgt a m+n = a m (a−n )−1 = a m a−(−n) = a m a n . Ist m + n < 0, dann sind die Zahlen −(m + n), m und −n in N0 erhalten. Wegen −(m + n) + m = −n erhalten wir a−(m+n) a m = a−n . Daraus folgt weiter a m (a−n )−1 = (a−(m+n) )−1 a m a−(−n) = a−(−(m+n)) ⇔ ⇔ a m a n = a m+n . Den Fall m < 0, n ≥ 0, können wir auf den vorherigen zurückführen, denn es gilt a m+n = a n+m = a n a m = a m a n . Setzen wir nun m, n < 0 voraus. Dann liegen −m, −n und −(m + n) in N0 , und aus −(m + n) = (−m) + (−n) folgt a−(m+n) = a−m a−n . Durch die Umformungen (a−(m+n) )−1 = (a−m a−n )−1 ⇔ ⇔ (a−(m+n) )−1 = (a−m )−1 (a−n )−1 a−(−(m+n)) = a−(−m) a−(−n) ⇔ a m+n = a m a n sieht man, dass die Gleichung auch in dieser Situation erfüllt ist. zu (ii) Auch hier betrachten wir zunächst den Fall m ≥ 0, n < 0. Hier liegen −n und −(m + n) in N0 . Auf Grund des bereits bewiesenen Falls erhalten wir (a m )n = ((a m )−n )−1 = (a m(−n) )−1 = (a−mn )−1 = a−(−mn) = a mn . Bevor wir weitere Fälle bearbeiten können, müssen wir zunächst durch vollständige Induktion die Gleichung (a−1 )n a n = 1K für alle n ∈ N0 beweisen. Wegen (a−1 )0 a0 = 1K · 1K = 1K ist diese für n = 0 erfüllt. —– 66 —– Ist n ∈ N0 und die Gleichung für n vorausgesetzt, dann folgt (a−1 )n+1 a n+1 = (a−1 )n a−1 a n a (a−1 )n a n a−1 a = = 1K · 1K = 1K , wobei im vorletzten Schritt die Induktionsvoraussetzung verwendet wurde. Damit ist der Induktionsbeweis abgeschlossen. Wir beweisen nun die Gleichung (a m )n = a mn im Fall m < 0 und n ∈ Z und definieren dafür c = a−1 . Wie soeben gezeigt, gilt a−m c −m = 1K , also a m = (a−m )−1 = c −m , und ebenso a mn = c −mn . Auf Grund des bereits bewiesenen Falls und wegen −m ∈ N0 wir (a m )n zu (iii) (c −m )n = = c (−m)n = c −mn = a mn . Hier brauchen wir nur den Fall m < 0 betrachten. Wegen −m ∈ N und auf Grund des bereits bewiesenen Falls erhalten wir (a b)m = ((a b)−m )−1 = (a−m )−1 (b−m )−1 = a m b m . (3.35) Lemma Sei (K, K+ ) ein angeordneter Körper, und sei n ∈ N. Dann gilt für a, b ∈ K+ die Äquivalenz a < b ⇔ a n < b n . Ist n ungerade, dann gilt sie sogar für alle a, b ∈ K. Beweis: Seien a, b ∈ K+ . Im Fall a = 0K oder b = 0K ist die Äquivalenz offensichtlich, so dass wir uns auf a, b ∈ K+ beschränken können. Es gilt (b − a) n−1 X ! a = n−1−k k b k=0 n−1 X a n−1−k b k+1 − n−1 X k=0 bn + n−1 X k=1 Mit a und b ist auch die Summe c = k=0 n X = k=0 a n−k b k − a n − Pn−1 a n−k b k n−1 X a n−k b k − k=1 a n−k b k = n−1 X a n−k b k = k=0 bn − an. k=1 a n−1−k b k in der Klammer positiv. An der Gleichung b n − a n = c(b − a) kann somit die Äquivalenz b − a ∈ K+ ⇔ b n − a n ∈ K+ abgelesen werden, und damit gilt auch a < b ⇔ a n < b n . Sei nun n ungerade, n = 2k + 1 mit k ∈ N0 . Im Fall a, b ≥ 0K wurde die Äquivalenz bereits bewiesen. Ist a < 0K und b ≥ 0K , dann ist wegen a2k = (a k )2 auch a n = a2k a negativ. Es gilt also a < 0K ≤ b und a n < 0K ≤ b n . Dies zeigt, dass die Äquivalenz a < b ⇔ a n < b n in dieser Situation immer erfüllt ist. Nun betrachten wir noch den k Fall a, b < 0K . Weil n ungerade ist, gilt (−1K )n = (−1K )2k (−1K ) = ((−1K )2 )k (−1K ) = 1K (−1K ) = −1K . Wegen −a, −b > 0K können wir die Äquivalenz auf den bereits bewiesenen Fall zurückführen, denn es gilt a<b ⇔ −b < −a ⇔ ⇔ (−b)n < (−a)n (−1K )b n < (−1K )a n ⇔ ⇔ (−1K )n b n < (−1K )n a n an < bn. Wir bemerken noch, dass Lemma (3.35) richtig bleibt, wenn man das Zeichen < durch eines der Symbole >, ≤, ≥ oder = ersetzt. Bei > genügt es, einfach die Rollen von a und b zu vertauschen. Für die Gleichheit argumentiert man —– 67 —– indirekt: Die Implikation a = b ⇒ a n = b n gilt offensichtlich. Andererseits folgt aus a n = b n auch a = b, denn a < b hätte a n < b n zur Folge, und aus a > b würde sich a n > b n ergeben, jeweils im Widerspruch zur Voraussetzung. Damit ist auch klar, wie man die Aussagen für ≤ und ≥ herleitet. (3.36) Satz Sei b ∈ R+ und n ∈ N. Dann gibt es eine eindeutig bestimmte Zahl α ∈ R+ mit p n αn = b. Sie wird mit b bezeichnet und die n-te Wurzel von b genannt. Beweis: Im Fall n = 1 oder b = 0 ist die Aussage offensichtlich, weil man im ersten Fall α = b und im zweiten α = 0 setzen kann. Deshalb können wir n > 1 und b > 0 voraussetzen. Wir betrachten nun die Menge M = {x ∈ R | x n ≤ b} und zeigen zunächst, dass diese ein positives Supremum besitzt. Wegen 0n ≤ b gilt 0 ∈ M , also ist die Menge M nicht leer. Sei nun c = max{1, b}. Wegen Lemma (3.35) und c ≥ 1 gilt c n = c n−1 c ≥ 1n−1 c = c. Für jedes x ∈ R mit x > c gilt folglich x n > c n ≥ c ≥ b und somit x ∈ / M . Dies zeigt, dass c eine obere Schranke von M ist. Weil es sich bei M um eine nichtleere, nach oben beschränkte Menge handelt, existiert α = sup M . Wegen b > 0 enthält M auf jeden Fall positive Zahlen; wählt man beispielsweise m ∈ N so groß, dass 1 m und somit 1 m n 1 = ≤ mn 1 m < 1 m < b ist, dann folgt b ∈ M . Weil α eine obere Schranke von M ist, muss also α > 0 gelten. Nun beweisen wir die Gleichung αn = b, indem wir die beiden Ungleichungen αn > b und αn < b einzeln widerlegen. Nehmen wir zunächst an, dass αn > b gilt. In diesem Fall können wir ein h ∈ R+ so klein wählen, dass auch (α − h)n > b gilt. Denn für jedes h ∈ R+ mit h < α ist − αh > −1. Wir können deshalb die Bernoullische Ungleichung (3.12) anwenden und erhalten (α − h)n = h n αn 1 − α nh αn 1 − α ≥ = αn − hnαn−1 . Setzen wir nun " = αn − b und wählen h so klein, dass außer h < α auch hnαn−1 < " ⇔ h < " nαn−1 erfüllt ist, dann erhalten wir (α − h)n ≥ αn − hnαn−1 > αn − " = αn − (αn − b) = b wie gewünscht. Andererseits ist α−h keine obere Schranke von M , weil α nach Definition die kleinste obere Schranke ist. Es gibt also ein y ∈ M mit y > α − h. Aus y ∈ M folgt y n ≤ b und nach Lemma (3.35) somit (α − h)n < y n ≤ b, im Widerspruch zu (α − h)n > b. Dies zeigt, dass der Fall αn > b ausgeschlossen ist. —– 68 —– Nehmen wir nun an, dass αn < b gilt. In diesem Fall liefert können wir h ∈ R+ so klein wählen, dass auch (α+h)n < b noch gültig ist. Denn der binomische Lehrsatz (2.29) liefert für jedes h ∈ R+ mit h < α die Abschätzung (α + h) n n X n = k k=0 ≤ αn + h α h mit der Konstanten γ = k=1 n k α + n n X n k k=1 n X n k k=1 Pn = n−k k αn−k αk−1 = α = n−k k h α +h n n X n k=1 αn + h n X n k=1 k αn−1 = k αn−k hk−1 αn + hγ αn−1 ∈ R+ . Wir setzen nun " = b − αn und wählen h ∈ R+ so, dass neben h < α auch die Abschätzung hγ < " ⇔ h < "γ−1 erfüllt ist. Dann folgt (α + h)n αn + hγ ≤ < αn + " = αn + (b − αn ) = b. Andererseits ist α eine obere Schranke von M und somit α + h ∈ / M . Aus α + h ∈ / M folgt (α + h)n > b. Aber dies widerspricht unserer zuvor gefundenen Abschätzung (α + h)n < b. Somit scheidet auch αn < b aus, und als einzige Möglichkeit bleibt αn = b. Es gibt kein weiteres Element β ∈ R+ mit β n = b, denn wie wir im Anschluss an (3.35) festgestellt haben, folgt aus αn = b = β n unmittelbar α = β. (3.37) Lemma Für a, b ∈ R+ und m, n ∈ N, p ∈ N0 gilt p n p n = ab a· p n b , p p n ( n a) p = a p und pp m n a= p mn a. Die zweite Gleichung gilt im Fall a 6= 0 für alle p ∈ Z. Die beiden Zuordnungen R+ → R+ p gegeben durch a 7→ a n und a 7→ n a sind invers zueinander. p p p p p p p p n n n n Aus ( n a)n = a und ( b)n = b folgt ( n a · b)n = ( n a)n ( b)n = ab. Also ist γ = n a b die eindeutig Beweis: bestimmte Zahl in R+ mit γn = a b. Damit ist die erste Gleichung bewiesen. Ebenso zeigt die Rechnung p m dass γ = p n a mn = p m p n a m n = p n n a = , a pp a die eindeutig bestimmte Zahl mit γmn = a ist. Daraus folgt die dritte Gleichung. Die zweite Gleichung p kann durch vollständige Induktion über p bewiesen werden. Für p = 0 ist sie offenbar erfüllt, denn es gilt ( n a)0 = 1, p p p p n n n und wegen 1n = 1 gilt a0 = 1 = 1, insgesamt also ( n a)0 = a0 . Ist p ∈ N0 und setzen wir die Formel dieses p m n voraus, dann folgt p ( n a) p+1 = p p ( n a) p n a = p n p ap n a = p n ap · a = p n a p+1 . Beweisen wir die Gleichung nun noch im Fall a 6= 0 und p < 0. Zunächst zeigen wir für c ∈ R× und n ∈ N die Gleichung p n c −1 —– = 69 p −1 n c . —– p p p p p n n n n Wegen 1n = 1 gilt 1 = 1, und daraus folgt n c c −1 = cc −1 = 1 = 1. Multipliziert man nun beide Seiten mit p ( n c)−1 , so erhält man das gewünschte Ergebnis. Anwendung dieser Gleichung auf c = a−p liefert nun p n p = ap n (a−p )−1 p n = a−p −1 p −p −1 n a = p p n a . = Schließlich zeigt die triviale Gleichung a n = a n , dass γ = a das eindeutig bestimmte Element mit γn = a n sein p p n muss. Daraus folgt a n = a. Nach Definition der n-ten Wurzel gilt andererseits ( n a)n = a. Dies zeigt, dass die angegebenen Zuorndungen zueinander invers sind. Mit Hilfe der n-ten Wurzeln können wir Potenzen a r für a ∈ R+ beliebige rationale Exponenten r definieren. Besitzt p n a m . Die Definition ist unabhängig von r die Darstellung r = mn mit m ∈ Z und n ∈ N, dann setzen wir α r = p der Darstellung der rationalen Zahl r als Bruch. Sind nämlich p ∈ Z und q ∈ N weitere Zahlen mit r = q , dann folgt m n = p q ⇔ mq = np und p n = am qp n p (a m ) p p = np p = a mp mq = a mp qp q m (a p )m = p q ap. (3.38) Lemma Die Potenzgesetze (i) bis (iii) aus (3.4) gelten auch für a, b ∈ R+ und beliebige Exponenten r, s ∈ Q. Beweis: a r+s = a r as . Aus r + s = mq+np nq r s a a p m n Wegen r, s ∈ Q gibt es m, p ∈ Z und n, q ∈ N mit r = und s = q . Zunächst beweisen wir die Gleichung folgt p n = am p q qp n = ap q p nq = (a m )q qp q · n = a mq+np (a p )n p = nq a mq p nq a np a r+s . Die Gleichung (a r )s = a rs erhält man durch die Rechnung (a r )s = m p (a n ) q p n = p = nq p = = a nq = am a mp q mp q p n am p = a rs , p am bm q p q p = n a mp und die Gleichung (a b) r = a r b r erhält man durch (a b) r = m (a b) n = m = p m = ar br . —– 70 an bn n (ab)m n = —– p n am p n bm (V) Bewertete Körper und komplexe Zahlen (3.39) Definition Eine Bewertung auf einem Körper K ist eine Abbildung | · | : K → R+ , so dass für alle x, y ∈ K die folgenden Bedingungen erfüllt sind. (i) x = 0 ⇔ |x| = 0 (ii) |x y| = |x|| y| (iii) |x + y| ≤ |x| + | y| (Dreiecksungleichung) Das Paar (K, | · |) bezeichnet man dann als bewerteten Körper. Wir definieren eine Abbildung | · | : R → R+ durch x 7→ x −x falls x ≥0 falls x < 0. Man bezeichnet sie als Absolutbetrag auf den reellen Zahlen. (3.40) Lemma Für jedes x ∈ R gilt x ≤ |x| und |x| = | − x|. Beweis: Im Fall x = 0 sind die Gleichungen |x| = 0 = | − x| und die Ungleichung x ≤ |x| offenbar gültig. Ist x positiv, dann gilt nach Definition |x| = x und | − x| = x, und die Ungleichung ist wegen x ≤ x erfüllt. Ist dagegen x negativ, dann gilt |x| = −x und | − x| = −x. Da x eine negative und −x eine positive Zahl ist, gilt auch hier x ≤ −x = |x|. (3.41) Satz Durch den Absolutbetrag ist eine Bewertung auf R definiert. Beweis: zu (i) Zu überprüfen sind die Eigenschaften (i), (ii) und (iii) einer Bewertung. „⇒“ Nach Definition gilt |0| = 0. „⇐“ Ist |x| = 0R , dann gilt x = 0 oder −x = 0, also x = 0 in beiden Fällen. zu (ii) Man zeigt die Gleichung durch Betrachtung der vier Einzelfälle (a) x, y ≥ 0 (b) x ≥ 0, y < 0 (c) x < 0, y ≥ 0 (d) x, y < 0. Wir beschränken uns auf Fall (b). Nach Definition gilt |x| = x und | y| = − y. Im Fall x = 0 gilt |x|| y| = |0|| y| = 0 · | y| = 0 und |x y| = |0| = 0. Sei nun x > 0 vorausgesetzt. Dann gilt −x y = x(− y) > 0, also x y < 0 und deshalb |x y| = −x y. Es folgt |x y| = −x y = x(− y) = |x|| y|, die Gleichung ist im Fall (b) also erfüllt. —– 71 —– zu (iii) Wie für alle Körperelemente gilt x ≤ |x| und y ≤ | y|. Aus den Anordnungsaxiomen folgt x + y ≤ x + | y| ≤ |x| + | y|. Ebenso gilt −x ≤ | − x| = |x| und − y ≤ | − y| = | y| und somit −(x + y) ≤ |x| + | y|. Da |x + y| gleich x + y oder gleich −(x + y) ist, ist die Ungleichung |x + y| ≤ |x| + | y| somit auf jeden Fall erfüllt. Wir werden nun noch ein weiteres Beispiel für einen bewerteten Körper kennenlernen. Der Beweis des folgenden Satzes ist Gegenstand der Algebra-Vorlesung. (3.42) Satz Es gibt einen Körper (C, +C , ·C ) mit folgenden Eigenschaften. (i) Es gilt C ⊇ R, und für alle a, b ∈ R gilt a +C b = a + b und a ·C b = ab. (ii) Es gibt ein Element i ∈ C mit i 2 = −1. (iii) Jedes Element z ∈ C kann auf eindeutige Weise in der Form z = a + i b mit a, b ∈ R dargestellt werden kann. Man nennt C den Körper der komplexen Zahlen, und das Element i die imaginäre Einheit. Ist z ∈ C, z = a + i b mit a, b ∈ R, so nennt man a den Realteil Re(z) und b den Imaginärteil Im(z) von z. Wieder verwenden wir zur Vereinfachung der Notation die Symbole + und · statt +C und ·C zur Bezeichnung der Addition und Multiplikation auf C. Aus der Definition von C und der Tatsache, dass es sich um einen Körper handelt, kann direkt abgeleitet werden, nach welchen Regeln die Addition, Multiplikation, Negative- und Kehrwertbildung zu erfolgen hat. Seien z, w ∈ C, z = a + i b und w = c + id mit a, b, c, d ∈ R. Dann gilt z+w = (a + i b) + (c + id) = (a + c) + i(b + d) , und das Produkt erhält man durch zw = (a + i b)(c + id) ac + i bc + iad + i 2 bd = = = ac + (−1)bd + i bc + iad (ac − bd) + i(bc + ad). An den Gleichungen 0 + z = 0 + (a + i b) = (a + 0) + i b = a + i b = z und 1 · z = 1(a + i b) = (1a) + i(1b) = a + i b = z sieht man, dass Null- und Einselement von C durch 0C = 0 und 1C = 1 gegeben sind. Den Kehrwert erhält man im Fall z 6= 0 durch die Rechnung z −1 = 1 a + ib = a − ib (a + i b)(a − i b) a − ib a2 + ia b − ia b − (−1)b2 = —– = a − ib a2 72 + b2 —– a − ib a2 = = + iab − iab − i 2 b2 a a2 + b2 +i (−b) a2 + b2 . (3.43) Definition Für jedes z ∈ C, z = a + i b mit a, b ∈ R nennt man z̄ = a − i b das zu z konjugiert komplexe Element. Die Abbildung C → C, z 7→ z̄ bezeichnet man dann als komplexe Konjugation. Wir beweisen für die komplexe Konjuation einige einfache Rechenregeln. (3.44) Proposition Für z, w ∈ C gilt (i) z̄¯ = z Beweis: zu (i) (iii) zw = z̄ w̄. Wir schreiben z und w in der Form z = a + i b und w = c + id, mit a, b, c, d ∈ R. Diese Gleichung ergibt sich durch die Rechnung z̄¯ zu (ii) (ii) z + w = z̄ + w̄ = a + ib = = a − ib a + i(−b) = a + i(−(−b)) = a + ib = z. Es gilt z + w = (a + c) + i(b + d) und somit z+w = (a + c) + i(b + d) = (a + c) − i(b + d) = (a − i b) + (c − id) = z̄ + w̄. zu (iii) Wegen zw = (a + i b)(c + id) = (ac − bd) + i(ad + bc) gilt einerseits zw = (ac − bd) − i(ad + bc). Andererseits ist z̄ w̄ = (a − i b)(c − id) = (ac − bd) + i(−bc − ad). Also ist die Gleichung zw = z̄ w̄ erfüllt. (3.45) Definition Sei z = a + i b ∈ C mit a, b ∈ R. Dann nennt man |z| = p a2 + b2 = p (a + i b)(a − i b) = p zz̄ den Absolutbetrag von z. Der komplexe Absolutbetrag |z| ist der Abstand des Punktes z vom Nullpunkt. —– 73 —– (3.46) Satz Durch den Absolutbetrag ist eine Bewertung auf C definiert. Beweis: Wieder sind die Eigenschaften (i), (ii) und (iii) einer Bewertung zu überprüfen. zu (i) „⇒“ Die Darstellung der Null durch Real- und Imaginärteil ist gegen durch 0 + i0, und folglich gilt p p |0| = 02 + 02 = 0. „⇐“ Sei z = a + i b mit a, b ∈ R. Ist |z| = 0, dann folgt a2 + b2 = 0 und somit a2 + b2 = 0. Da Quadrate von Elementen in R entweder positiv oder gleich Null sind, folgt a = b = 0 und damit z = 0. zu (ii) Wegen (3.44) gilt |zw|2 = (zw)zw = zz̄w w̄ = |z|2 |w|2 . Durch Wurzelziehen auf beiden Seiten erhalten wir |zw| = |z||w|. zu (iii) Seien z, w ∈ C vorgegeben. Es gilt die Äquivalenz |z + w| ≤ |z| + |w| ⇔ |z + w|2 ≤ (|z| + |w|)2 (z + w)(z̄ + w̄) ≤ zz̄ + w w̄ + 2|z||w| ⇔ ⇔ |z + w|2 ≤ |z|2 + 2|z||w| + |w|2 zz̄ + wz̄ + z w̄ + w w̄ ≤ zz̄ + w w̄ + 2|z||w| ⇔ ⇔ wz̄ + z w̄ ≤ 2|z||w|. Stellen wir wz̄ durch Real- und Imaginärteil dar, wz̄ = a + i b mit a, b ∈ R, dann ist die linke Seite der Ungleichung wz̄ + z w̄ = wz̄ + wz̄ = (a + i b) + (a − i b) = 2a p p und auf der rechten Seite steht 2|z||w| = 2|z̄||w| = 2|wz̄| = 2 a2 + b2 . Zu zeigen ist also 2a ≤ 2 a2 + b2 , was zu p p p a ≤ a2 + b2 äquivalent ist. Aber diese Gleichung ist offenbar erfüllt, denn es gilt a ≤ |a| = a2 ≤ a2 + b2 . Der Körper C der komplexen Zahlen unterscheidet sich von R in einigen wichtigen Punkten. (3.47) Satz Auf dem Körper C gibt es keine Anordnung. Es gibt also keine Teilmenge C+ ⊆ C, so dass die Bedingungen (i) und (ii) aus (3.5) erfüllt sind. Angenommen, C+ ist eine Teilmenge von C mit den Eigenschaften (i) und (ii). Nach Lemma (3.6) (i) sind Quadrate von Elementen ungleich Null stets positiv, es gilt also −1 = i 2 ∈ C+ . Andererseits ist nach (3.8) (ii) das Einselement 1 positiv und −1 damit negativ. Auf Grund von Eigenschaft (i) einer Anordnung kann ein Element nicht zugleich positiv und negativ sein. Dieser Widerspruch zeigt, dass eine Menge C+ mit den Eigenschaften (i) und (ii) nicht existiert. —– 74 —– Ein weiterer Unterschied zwischen R und C besteht darin, dass man in C aus beliebigen Elementen eine Quap dratwurzeln ziehen kann; für jedes z ∈ C gibt es also ein w ∈ C mit w 2 = z. Beispielsweise sind i und 2i die p p 2 Quadratwurzeln von −1 und −2, denn es gilt i 2 = −1 und ( 2i)2 = 2 i 2 = 2(−1) = −2. Auch das Element i besitzt wieder eine Quadratwurzel, denn es gilt i 1 p +p 2 2 2 = 1 p 2 2 1 i +2· p · p + 2 2 i p 2 2 = 1 2 + i + (− 12 ) = i. Allgemeiner kann man beweisen (3.48) Satz In den komplexen Zahlen besitzt jede Gleichung der Form an z n + an−1 z n−1 + ... + a2 z 2 + a1 z + a0 = 0 mit n ∈ N und a0 , a1 , ..., an ∈ C mindestens eine Lösung. Diese Eigenschaft des Körpers C bezeichnet man als algebraische Abgeschlossenheit. Der Satz ist Thema der Algebra- und der Funktionentheorie-Vorlesung. In den reellen Zahlen ist die entsprechende Aussage falsch, denn beispielsweise besitzt die Gleichung x 2 + 1 = 0 keine reelle Lösung. —– 75 —– § 4. Folgen und Reihen Inhaltsübersicht Intuitiv bedeutet die Konvergenz einer Folge (an )n∈N reeller oder komplexer Zahlen gegen einen Grenzwert a, dass sich die Folgenglieder an mit wachsendem n dem Wert a immer weiter annähern. Präziser lässt sich dies folgendermaßen formulieren: Für jedes noch so kleine " ∈ R+ gibt es einen Index N , ab dem alle Folgenglieder von a einen Abstand kleiner als " haben. Beispielsweise gibt es einen Index N , ab dem die Folgenglieder an (mit n ≥ N ) und der Grenzwert a nur um einen Wert kleiner als " = 10−6 auseinanderliegen. Nach der Formulierung des Konvergenzbegriffs werden wir im ersten Abschnitt vor allem untersuchen, unter welchen Operationen, die auf Folgen angwendet werden können, die Konvergenzeigenschaft erhalten bleibt. Beispielsweise werden wir zeigen, dass für zwei konvergente Folgen (an )n∈N und (bn )n∈N mit Grenzwerten a und b auch die Folge (an + bn )n∈N konvergiert, und zwar gegen den Wert a + b. Außerdem werden wir die sog. uneigentliche Konvergenz gegen die unendlichen Werte ±∞ definieren. In einigen Situationen ist es notwendig, die Konvergenz einer Folge zu nachzuweisen, ohne das man einen konkreten Grenzwert angeben kann. Dies wird durch den Begriff der Cauchyfolge ermöglicht, den wir im zweiten Abschnitt einführen. Häufig kommt es auch vor, dass eine Folge zwar im Ganzen nicht konvergiert, wohl aber bestimmte Teilfolgen. Dies ist zum Beispiel immer dann der Fall, wenn die Folge beschränkt ist, und führt auf den Begriff des Häufungspunkts. Jeder Folge (an )n∈N kann eine neue Folge (sn )n∈N zugeordnet werden, deren n-tes Glied P∞ durch sn = a1 +a2 +...+an gegeben ist. Man nennt eine solche Folge eine Reihe und bezeichnet sie mit dem Ausdruck n=1 an . Beispielsweise wird die Folge mit den Gliedern 1, 1 + 21 , 1 + 12 + 13 ,... die harmonische Reihe genannt. Wir werden im dritten Abschnitt eine Reihe von Kriterien zusammenstellen, mit denen sich die Konvergenz von Reihen untersuchen lässt. Mit Hilfe der Reihen können wir dann unter anderem die aus der Schule bekannte Dezimalbruchentwicklung reeller Zahlen präzise definieren. (I) Folgen und Konvergenz Im gesamten Abschnitt bezeichnet (K, | · |) einen bewerteten Körper. Wie wir bereits in Abschnitt §3 definiert haben, ist eine Folge (an )n∈N in K eine Familie reeller Zahlen mit N als Indexmenge, also eine Abbildung N → K. Gelegentlich bietet es sich an, eine Folge nicht bei n = 1, sondern bei einer anderen Zahl n0 ∈ Z beginnen zu lassen. Auch Familien mit der Indexmenge {n ∈ Z | n ≥ n0 } nennen wir Folgen und verwenden in diesem Fall die Bezeichnung (an )n≥n0 . Wir betrachten einige konkrete Beispiele für Folgen reeller und komplexer Zahlen. (i) (a)n∈N = (a, a, a, a, ...), (ii) ( 1n )n∈N = (1, 12 , 13 , 14 , ...) (iii) n ( n+1 )n∈N = ( 12 , 23 , 34 , 45 , ...) (iv) ( 2nn )n∈N = 4 5 6 7 ( 12 , 24 , 38 , 16 , 32 , 64 , 128 , ...) (v) (b n )n∈N0 = (1, b, b2 , b3 , b4 , b5 , ...), a∈K (konstante Folge) b∈C —– 76 —– Setzt man im letzten Beispiel b = −1, dann erhält man die Folge (1, −1, 1, −1, 1, −1, 1, ...), für b = 3 kommt entsprechend (1, 3, 9, 27, 81, 243, 728, ...) und für b = i die Folge (1, i, −1, −i, 1, i, −1, −i, 1, i, −1, −i, 1, ...) heraus. Im letzten Beispiel wiederholen sich die Folgenglieder periodisch in Viererschritten, weil i 4 = 1 ist. Folgen können auch rekursiv definiert werden. Beispielsweise erhält man durch die Rekursionsvorschrift a0 = 1 und an+1 = (n + 1)an die Folge an = n!, gegeben durch die Fakultätsfunktion. Durch die Vorschrift f0 = f1 = 1 und f n+2 = f n + f n+1 für n ≥ 0 erhält man die bekannte Fibonacci-Folge, deren erste Folgenglieder durch (1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 89, 144, 233, ...) gegeben sind. Beispielsweise ist f2 = f0 + f1 = 1 + 1 = 2, f3 = f1 + f2 = 1 + 2 = 3, f4 = f2 + f3 = 2 + 3 = 5, und nach dem gleichen Schema berechnet man alle weiteren Folgenglieder. Bevor wir zur zentralen Definition dieses Abschnitts kommen, schicken wir Folgendes voraus: Sei (an )n∈N eine Folge in K, außerdem a ∈ K und " ∈ R+ . • Die Ungleichung |an − a| < " bedeutet, dass der Abstand zwischen dem Wert a und dem Folgenglied an kleiner als " ist. Da wir uns unter " im Allgemeinen einer „sehr kleine“ Zahl vorstellen, bedeutet die Ungleich also, dass an „sehr nahe“ bei a liegt. • Im Fall K = C ist dieser Abstand einfach der Abstand der beiden komplexen Zahlen an und a in der Ebene, wenn wir wie in §3 komplexe Zahlen als Punkte in der Ebene betrachten, wobei der Realteil als x- und der Imaginärteil als y-Koordinate aufgefasst wird. • Im Fall K = R ist die Ungleichung |an − a| < " gleichbedeutend mit an − a < " und −(an − a) = a − an < ", also mit a − " < an < a + ". Anschaulich bedeutet die Ungleichung, dass an und a auf dem Zahlenstrahl einen Abstand kleiner als " haben. • Sei nun N ∈ N. Die Aussage „|an − a| < " für alle n ≥ N “ bedeutet, dass die Ungleichung |an − a| < " für alle Folgenglieder an ab dem Index N erfüllt ist. Die Ungleichung gilt also für aN , aN +1 , aN +2 usw., aber nicht unbedingt für aN −1 . (4.1) Definition Sei (an )n∈N eine Folge in K und a ∈ K. Wir sagen, die Folge konvergiert gegen a und schreiben lim an n→∞ = a , wenn für jedes " > 0 ein N ∈ N existiert, so dass |an − a| < " für alle n ≥ N erfüllt ist. Man sagt in diesem Fall, a ist ein Grenzwert der Folge (an )n∈N und bezeichnet die Folge als konvergent. Folgen, die keinen Grenzwert besitzen, werden divergente Folgen genannt. —– 77 —– In der formalen Quantorenschreibweise lautet die Bedingung für die Konvergenz ∀" ∈ R+ : ∃N ∈ N : ∀n ∈ N, n ≥ N : |an − a| < ". An Stelle von lim an verwenden wir auch die einfachere Schreibweise limn an . n→∞ Veranschaulichung der Konvergenz einer Folge Egal, wie klein der "-Streifen a − " < a < a + " (grün) um den Grenzwert a herum gewählt wird, es liegen immer nur endlich viele Folgenglieder außerhalb des Streifens (schwarz) und die übrigen, unendlich vielen, innerhalb davon (rot). —– 78 —– Wir betrachten nun einige Beispiele für konvergente und divergente Folgen. 1 n (i) Für die Folge (an )n∈N mit an = (3.12) gibt es ein N ∈ N mit 1 N für alle n ∈ N gilt limn an = 0. Sei nämlich " > 0 beliebig vorgegeben. Nach < ". Für jedes n ≥ N folgt |an − 0| = 1 n ≤ 1 N < ". (ii) Sei a ∈ K. Für die konstante Folge (an )n∈N gegeben durch an = a gilt limn an = a. Sei nämlich ein " > 0 vorgegeben und N = 1. Für alle n ≥ N gilt |an − a| = |a − a| = 0 < ". (iii) Sei an = mit 1 N n n+1 für alle n ∈ N. Dann gilt limn an = 1. Für ein vorgegebenes " sei nämlich N eine natürliche Zahl < ". Für beliebige n ≥ N folgt dann |an − 1| (iv) Für an = n 2n = n n + 1 − 1 n − (n + 1) n+1 = 1 = n+1 1 < N < ". gilt limn an = 0. Um das zu sehen, zeigt man zunächst durch vollständige Induktion, dass 2n ≥ n2 für alle n ≥ 4 erfüllt ist. Für n = 4 ist 24 = 16 = 42 , also ist die Ungleichung offensichtlich erfüllt. Sei nun n ∈ N und 2n ≥ n2 bereits bewiesen. Auf Grund der Voraussetzung n ≥ 4 gilt (n − 1)2 ≥ 2 n2 − 2n + 1 ≥ 2 ⇔ 2n2 ≥ n2 + 2n + 1 ⇔ ⇔ ⇔ n2 ≥ 2n + 1 2n2 ≥ (n + 1)2 , und die Induktionsvoraussetzung liefert 2n+1 = 2 · 2n ≥ 2 · n2 ≥ (n + 1)2 . Sei nun " > 0 vorgegeben. Dann wählen wir N0 ∈ N mit 1 N0 < " und setzen N = max{4, N0 }. Für alle n ≥ N gilt dann |an − 0| = n 2n = n2 1 · 2n n ≤ 1 n ≤ 1 N0 < ". (v) Die Folge (an )n∈N gegeben durch an = (−1)n für alle n ∈ N ist divergent. Denn angenommen, a ∈ R wäre ein Grenzwert der Folge. Dann gibt es für " = 1 ein N ∈ N, so dass |an − a| < " für alle n ≥ N erfüllt ist. Für gerades n ≥ N erhalten wir |a − 1| = |a − an | < 1, insbesondere −(a − 1) < 1 ⇔ 1 − a < 1 ⇔ a > 0. Setzen wir dagegen ein ungerades n ≥ N ein, so erhalten wir |a − (−1)| = |a − an | < 1, also insbesondere a + 1 < 1 ⇔ a < 0. Beide Ungleichungen können aber unmöglich erfüllt sein. Also hat uns die Annahme, dass ein Grenzwert a existiert, zu einem Widerspruch geführt. (4.2) Definition Wir nennen eine Folge (an )n∈N beschränkt, wenn die Teilmenge von R+ gegeben durch {|an | | n ∈ N} beschränkt ist. (4.3) Satz Jede konvergente Folge (an )n∈N ist beschränkt. —– 79 —– Beweis: Sei a der Grenzwert der Folge. Die Konvergenzbedingung, angewendet auf " = 1, liefert ein N ∈ N mit |an − a| < 1 für alle n ≥ N . Für den Betrag von an folgt daraus |an | = |(an − a) + a| ≤ |an − a| + |a| < 1 + |a| für alle n ≥ N. Sei nun M = max{|a1 |, |a2 |, ..., |aN −1 |, 1 + |a|}. Dann ist |an | ≤ M für alle n ∈ N erfüllt. Wichtig ist auch der Umkehrschluss dieses Satzes: Jede unbeschränkte Folge ist divergent. (4.4) Proposition Sei b ∈ R und (an )n∈N gegeben durch an = b n für alle n ∈ N. (i) Ist |b| < 1, dann gilt limn an = 0. (ii) Für b = 1 gilt limn an = 1. (iii) In den Fällen b = −1 und |b| > 1 ist die Folge divergent. Beweis: zu (i) Durch vollständige Induktion zeigt man zunächst, dass |b n | = |b|n und |b|n < 1 für alle n ∈ N gilt. Sei nun " > 0 vorgegeben. Nach (3.12) gibt es ein N ∈ N mit |b|N < ". Für alle n ≥ N folgt dann |an − 0| = |b n | = |b|n = |b|n−N |b|N ≤ |b|N < ". zu (ii) Die Folge (1n )n∈N = (1)n∈N ist konstant und konvergiert daher, wie oben gesehen, gegen ihren konstanten Wert. zu (iii) Im Fall b = −1 stimmt (an )n∈N mit der Folge ((−1)n )n∈N überein und ist somit, wie bereits gesehen, divergent. Für alle b ∈ C und |b| > 1 zeigen wir, dass die Folge unbeschränkt ist. Angenommen, es gibt ein c ∈ R+ , c > 0 mit |an | < c für alle n ∈ N. Nach Satz (3.12) gibt es ein andererseits ein N ∈ N mit |b N | = |b|N > c. Wir erhalten somit einen Widerspruch zu unserer Annahme. (4.5) Proposition Ändert man bei einer Folge nur endlich viele Glieder ab, so ändert dies nichts am Konvergenzverhalten. Genauer: Seien (an )n∈N und (bn )n∈N Folgen und M ∈ N, so dass an = bn für alle n ≥ M erfüllt ist. Konvergiert nun (an )n∈N gegen ein a ∈ R, dann konvergiert (bn )n∈N gegen denselben Wert. Beweis: Sei " > 0 vorgegeben. Auf Grund der Konvergenz von (an )n∈N finden wir ein N0 ∈ N mit der Eigenschaft, dass |an − a| < " für alle n ≥ N0 gilt. Sei nun N = max{M , N0 }. Für alle n ≥ N gilt dann |bn − a| = |an − a| < ". Also konvergiert auch (bn )n∈N gegen a. Ebenso einfach beweist man, dass sich das Konvergenzverhalten einer Folge nicht ändert, wenn man endlich viele Glieder am Anfang der Folge hinzunimmt oder entfernt. (4.6) Satz Der Grenzwert einer Folge (an )n∈N , sofern er existiert, ist eindeutig bestimmt. —– 80 —– Beweis: Angenommen, a und a0 sind zwei verschiedene Grenzwerte der Folge. Sei " = |a0 −a|. Sei " = a0 −a. Wegen limn an = a gibt es ein N1 ∈ N, so dass |an − a| < 12 " für alle n ≥ N1 gilt. Andererseits gibt es wegen limn→∞ an = a0 auch ein N2 ∈ N mit der Eigenschaft, dass |an − a0 | < 21 " für alle n ≥ N2 erfüllt ist. Für alle n ≥ max{N1 , N2 } gilt nun " |a0 − a| = = |(a0 − an ) + (an − a)| ≤ |an − a0 | + |an − a| 1 " 2 < + 21 " = ". Dieser Widerspruch zeigt, dass die Annahme falsch war und somit keine zwei verschiedenen Grenzwerte existieren. Wir beweisen nun eine Reihe von Aussagen, die es uns erlauben, die Berechnung der Grenzwerte von kompliziert aufgebauten Folgen auf bereits bekannte Grenzwerte von Folgen zurückzuführen. Man bezeichnet diese Aussagen zusammenfassend als Grenzwertsätze. (4.7) Satz Seien (an )n∈N , (bn )n∈N und (cn )n∈N Folgen in K, wobei cn = an + bn für alle n ∈ N ist. Gilt nun lim an = a lim bn = b und n→∞ mit n→∞ a, b ∈ K , dann konvergiert auch (cn )n∈N , und zwar gegen den Wert a + b. Sei " > 0 vorgegeben. Auf Grund der Konvergenz von (an )n∈N gibt es ein N1 ∈ N mit |an − a| < 21 " für alle Beweis: n ≥ N1 . Die Konvergenz von (bn )n∈N liefert uns ein N2 ∈ N mit |bn − b| < 21 " für alle n ≥ N2 . Sei N = max{N1 , N2 }. Für n ∈ N mit n ≥ N gilt dann |cn − (a + b)| = |(an + bn ) − (a + b)| = |(an − a) + (bn − b)| ≤ |an − a| + |bn − b| < 1 " 2 + 12 " Also konvergiert (cn )n∈N tatsächlich gegen den Wert a + b. (4.8) Satz = ". Seien (an )n∈N , (bn )n∈N und (cn )n∈N Folgen in K mit cn = an bn für alle n ∈ N. Konvergieren die Folgen (an )n∈N und (bn )n∈N gegen a bzw. b ∈ K, dann konvergiert auch die Folge (cn )n∈N , und zwar gegen den Wert ab. Beweis: Weil (an )n∈N konvergent ist, ist sie nach Folgerung (4.3) auch beschränkt, es gibt also ein K1 ∈ R, K1 > 0 mit |an | < K1 für alle n ∈ N. Sei K = max{K1 , |b|} und " > 0 eine vorgegebene reelle Zahl. Auf Grund der Konvergenz von (an )n∈N und (bn )n∈N finden wir natürliche Zahlen N1 , N2 ∈ N, so dass |an − a| < " 2K für alle n ≥ N1 und |bn − b| < " 2K für alle n ≥ N2 erfüllt ist. Sei nun N = max{N1 , N2 }. Für alle n ≥ N gilt dann |cn − a b| = |an bn − an b + an b − ab| " " + K |an ||bn − b| + |an − a||b| < K 2K 2K |an bn − a b| = Also konvergiert (cn )n∈N gegen den Wert a b. = |an (bn − b) + (an − a)b| = 1 " 2 + 12 " = ≤ ". —– 81 —– (4.9) Folgerung Seien (an )n∈N und (bn )n∈N konvergente Folgen mit den Grenzwerten a bzw. b ∈ K und λ ∈ C. (i) Die Folge (cn )n∈N gegeben durch cn = λan konvergiert gegen den Wert λa. (ii) Die Folge (dn )n∈N mit dn = an − bn konvergiert gegen den Wert a − b. Beweis: Aussage (i) folgt aus Satz (4.8), wenn wir für (bn )n∈N die konstante Folge (λ)n∈N einsetzen. Zum Beweis von (ii) wenden wir Aussage (i) zunächst auf λ = −1 an. Dies liefert die Gleichung limn −bn = −b. Nun erhält man die gewünschte Aussage durch Anwendung von Satz (4.7) auf die Folgen (an )n∈N und (−bn )n∈N . (4.10) Satz Seien (an )n∈N und (bn )n∈N konvergente Folgen mit Grenzwerten a, b ∈ K, wobei b 6= 0K ist. Dann gibt es ein N0 ∈ N mit bn 6= 0K für alle n ≥ N0 , und die Folge (cn )n≥N0 mit cn = Beweis: an bn konvergiert gegen den Wert ab . Wir zeigen zunächst, dass ein N0 ∈ N mit der angegebenen Eigenschaft existiert. Sei " = 12 |b|. Auf Grund der Konvergenz von (bn )n∈N existiert ein N0 ∈ N mit |bn − b| < " für alle n ∈ N. Für alle n ≥ N0 gilt dann |b| und somit |bn | > 1 |b|, 2 = |b − bn + bn | ≤ |b − bn | + |bn | 1 |b| + |bn | 2 < insbesondere ist bn 6= 0K . Durch Übergang zum Kehrwert erhalten wir die Abschätzung |bn |−1 < 2|b|−1 . Wir beweisen nun die Konvergenz von (cn )n≥N0 zunächst für den Spezialfall, dass es sich bei (an )n∈N um die konstante Folge mit Wert 1 handelt. Für vorgegebenes " > 0 wählen wir uns ein N1 ∈ N mit der Eigenschaft, dass < |bn − b| "|b|2 für alle 2 n ≥ N1 Für alle n ≥ N mit N = max{N0 , N1 } erhalten wir dann 1 b − bn 1 1 b − b − = = n b b bn b |bn ||b| n < gilt. 2 "|b|2 |b|2 2 = ". Die entsprechende Aussage für eine beliebige konvergente Folge (an )n∈N erhält man nun wegen (4.8). an bn = an · b1 aus Satz n Als Anwendungsbeispiel für die bisherigen Sätze bestimmen wir den Grenzwert der Folge an = n2 + 7n + 3 3n2 − 5 —– 82 für alle —– n∈N Es gilt lim an n→∞ = lim n2 + 7n + 3 = 3n2 − 5 n→∞ lim n→∞ limn 1 + limn 7 n + 3− 5 n2 1+ 3 n2 7 + limn n limn 3 − lim n52 = limn 1 + 7n + n32 limn 3 − n52 = 3 n2 sofern alle in der Rechnung aufgeführten Grenzwerte existieren. (Wenn auch nur einer der Grenzwerte nicht existieren würde, dann wäre die gesamte Rechnung wertlos, weil die Voraussetzungen der Grenzwertsätze nicht erfüllt und ihre Anwendung daher unzulässig wäre!) Nun gilt limn limn 7 n = 0, limn 3 n2 = 0 und limn 5 n2 1 n = 0 und limn 1 n2 = (limn 1n )(limn 1n ) = 0 · 0 = 0. Es folgt = 0. Insgesamt erhalten wir = lim an n→∞ 1+0+0 3−0 = 1 . 3 (4.11) Satz Seien (an )n∈N , (bn )n∈N reelle konvergente Folgen mit Grenzwerten a, b ∈ R. Gilt an ≤ bn für alle n ∈ N, dann folgt a ≤ b. Beweis: Nehmen wir an, dass a > b ist, und sei " = es ein N1 ∈ N mit |an − a| < ", also an > a − " = bn < b+" = 1 (a+ b) 2 1 (a 2 1 (a 2 − b) > 0. Wegen der Konvergenz von (an )n∈N gibt + b). Ebenso finden wir ein N2 ∈ N mit |bn − b| < ", also für alle n ≥ N2 . Sei nun N = max{N1 , N2 }. Für alle n ≥ N erhalten wir dann an > 12 (a+ b) > bn , im Widerspruch zur Voraussetzung, dass an ≤ bn für alle n ∈ N gilt. (4.12) Satz („Sandwich-Lemma“) Seien (an )n∈N , (bn )n∈N und (cn )n∈N drei Folgen reeller Zahlen, und es gelte an ≤ bn ≤ für alle cn n ∈ N. Konvergieren die Folgen (an )n∈N und (cn )n∈N gegen denselben Grenzwert a ∈ R, dann konvergiert die Folge (bn )n∈N , und zwar gegen den Wert a. Beweis: Sei " ∈ R+ vorgegeben. Wegen limn an = limn cn = a gibt es N1 , N2 ∈ N, so dass |an − a| < " für alle n ≥ N1 und und |cn − a| < " für alle n ≥ N2 erfüllt ist. Es folgt an > a − " für alle n ≥ N1 und cn < a + " für alle n ≥ N2 . Sei N = max{N1 , N2 } und n ∈ N mit n ≥ N . Dann gilt einerseits bn − a ≥ an − a > a−"−a = −" cn − a < a+"−a = ". und andererseits bn − a ≤ Aus −" < bn − a < " folgt |bn − a| < ". Damit ist limn bn = a bewiesen. —– 83 —– (4.13) Definition Man sagt, eine reelle Folge (an )n∈N konvergiert uneigentlich gegen +∞ und verwendet die Notation lim an = +∞, n→∞ wenn für jedes κ ∈ R+ ein N ∈ N existiert, so dass an > κ für alle n ≥ N erfüllt ist. Ebenso schreiben wir limn an = −∞, wenn es für jedes κ ∈ R+ ein N ∈ N mit an < −κ für alle n ≥ N gibt. Wir betrachten einige Beispiele zur uneigentlichen Konvergenz. (i) Die Folge (an )n∈N mit an = 2n konvergiert uneigentlich gegen +∞. Ist nämlich κ > 0 vorgegeben, dann finden wir nach (3.12) ein N ∈ N mit 2N > κ. Für alle n ≥ N gilt dann 2n = 2n−N · 2N > κ. (ii) Die Folge (an )n∈N mit an = −n konvergiert uneigentlich gegen −∞. Ist nämlich κ ∈ R+ vorgegeben, dann gibt es nach dem archimedischen Axiom ein N ∈ N mit N > κ. Für alle n ≥ N gilt dann an = −n ≤ −N < −κ. (iii) Die Folge (an )n∈N mit an = (−1)n ist weder eigentlich noch uneigentlich konvergent. Dass es keinen reellen Grenzwert gibt, haben wir bereits gezeigt. Ebensowenig gilt limn an = +∞, denn es es gibt zum Beispiel für κ = 1 kein N ∈ N mit an > κ für alle n ≥ N . (Tatsächlich ist kein einziges Folgenglied größer als 1.) Genauso sieht man, dass auch limn an = −∞ nicht erfüllt ist. Auch für uneigentliche Grenzwerte lassen sich in begrenztem Umfang „Rechenregeln“ aufstellen. (4.14) Proposition Seien (an )n∈N und (bn )n∈N Folgen reeller Zahlen mit lim an n→∞ = lim bn n→∞ = +∞. Dann gilt auch limn (an + bn ) = +∞. Beweis: Sei κ ∈ R+ vorgegeben. Wegen limn an = +∞ gibt es ein N1 ∈ N mit an > 21 κ für alle n ≥ N1 . Ebenso gibt es wegen limn bn = +∞ ein N2 ∈ N mit bn > 12 κ. Sei nun N = max{N1 , N2 }. Für alle n ∈ N mit n ≥ N gilt dann an + bn > 1 κ + 12 κ 2 Damit ist limn (an + bn ) = +∞ bewiesen. = κ. Sind andererseits (an )n∈N und (bn )n∈N Folgen mit limn an = +∞ und limn bn = −∞, dann ist über die Folge der Form (an + bn )n∈N keine Aussage möglich. Ist beispielsweise an = 2n und bn = −n, dann gilt an + bn = n und somit limn (an + bn ) = +∞. Im Fall an = n und bn = −2n konvergiert an + bn = −n uneigentlich gegen −∞. Es kann aber auch vorkommen, dass (an + bn )n∈N gegen eine reelle Zahl konvergiert (zum Beispiel gegen 42 im Fall —– 84 —– an = n + 42, bn = −n) oder einfach divergiert (zum Beispiel bei an = n + (−1)n und bn = −n). Folgende Tabellen geben zusammenfassend an, wie sich (uneigentliche) Grenzwerte bezüglich der Rechenoperationen +, −, · und bei Kehrwertbildung verhalten. + −∞ b∈R +∞ − −∞ b∈R +∞ −∞ −∞ −∞ ? −∞ ? −∞ −∞ a∈R −∞ a+b +∞ a∈R +∞ a−b −∞ +∞ ? +∞ +∞ +∞ +∞ +∞ ? · −∞ b<0 b=0 b>0 +∞ −∞ +∞ +∞ ? −∞ −∞ a<0 +∞ ab 0 ab −∞ a=0 ? 0 0 0 ? a>0 −∞ ab 0 ab +∞ +∞ −∞ −∞ ? +∞ +∞ lim an lim an−1 −∞ 0 a<0 a −1 a=0 ? a>0 a −1 +∞ 0 Beispielsweise bedeutet der Eintrag links oben in der „+“-Tabelle: Sind (an )n∈N0 und (bn )n∈N0 Folgen mit limn an = limn bn = −∞, dann folgt limn (an + bn ) = −∞. Die Zeilen und Spalten mit den Einträgen b ∈ R, b < 0 usw. beziehen sich immer auf endliche (reelle) Werte. Der Eintrag „?“ bedeutet jeweils, dass bei der entsprechenden Kombination keine allgemeine Aussage möglich ist, so wie wir es oben bereits in einem konkreten Fall gesehen haben. Im Hinblick auf spätere Anwendungen wird es sich als günstig herausstellen, dass wir für die Konvergenz einer reellen Folge eine einheitliche Definition zur Verfügung haben. Dazu erinnern wir an die in §3 eingeführte Bezeichnung R̄ für die Menge R ∪ {±∞}. (4.15) Definition Seien a ∈ R̄ und U ⊆ R̄ vorgegeben. Wir bezeichnen die Menge U als Umgebung des Punktes a (i) im Fall a ∈ R, wenn ein " ∈ R+ existiert, so dass ]a − ", a + "[ ⊆ U erfüllt ist (ii) im Fall a = +∞, wenn ein κ ∈ R+ existiert, so dass ]κ, +∞] ⊆ U gilt, (iii) im Fall a = −∞, wenn ein κ ∈ R+ existiert, so dass [−∞, −κ[ ⊆ U gilt. Im Fall (i) bezeichnen wir die Menge ]a − ", a + "[ selbst als "-Umgebung von a. Auf der Grundlage dieser Definition gilt nun: Eine reelle Folge (an )n∈N konvergiert genau dann (eigentlich oder uneigentlich) gegen einen Punkt a ∈ R̄, wenn eine Umgebung U ⊆ R̄ von a und ein N ∈ N existieren, so dass an ∈ U für alle n ≥ N erfüllt ist. Dies ergibt sich unmittelbar durch Vergleich mit den Definitionen (4.1) und (4.13). —– 85 —– (II) Häufungspunkte und Cauchyfolgen (4.16) Definition Sei K ein bewerteter Körper und (an )n∈N eine Folge in K. Ein Punkt a ∈ K wird Häufungspunkt von (an )n∈N genannt, wenn es für jedes " ∈ R+ jeweils unendlich viele n ∈ N mit |an − a| < " gibt. Beispielsweise besitzt die Folge (an )n∈N gegeben durch an = (−1)n für zwei verschiedene Häufungspunkte, nämlich −1 und 1. Allgemein gilt (4.17) Proposition Konvergiert die Folge (an )n∈N gegen ein a ∈ K, dann ist a der einzige Häufungspunkt von (an )n∈N . Beweis: Zunächst zeigen wir, dass a ein Häufungspunkt der Folge ist. Sei " ∈ R+ vorgegeben. Dann gibt es ein N ∈ N mit |an − a| < " für alle n ≥ N . Also ist |an − a| < " für unendlich viele n ∈ N erfüllt. Nehmen wir nun an, es gibt einen weiteren Häufungspunkt b. Auf Grund der Konvergenz gibt es für "1 = |b − a| ein N1 ∈ N mit |an − a| < 12 "1 für alle n ≥ N1 . Sei nun n ∈ N mit n ≥ N1 . Wäre |an − b| < 21 "1 , dann würde daraus "1 = |b − a| ≤ |(b − an ) + (an − a)| ≤ |an − b| + |an − a| < 1 " 2 1 + 21 "1 = "1 folgen. Der Widerspruch "1 < "1 zeigt, dass |an − b| < 12 "1 nur für n < N1 möglich ist. Damit kann b kein Häufungspunkt von (an )n∈N sein. Wir werden nun die Häufungspunkte reeller Folgen genauer untersuchen. (4.18) Definition Eine Folge (an )n∈N reeller Zahlen ist (i) monoton wachsend, wenn an ≤ an+1 (ii) streng monoton wachsend, wenn an < an+1 (iii) monoton fallend, wenn an ≥ an+1 (iv) streng monoton fallend, wenn an > an+1 für alle n ∈ N erfüllt ist. (4.19) Satz Jede beschränkte, monoton wachsende oder fallende Folge reeller Zahlen konvergiert. Beweis: Sei (an )n∈N monoton wachsend und beschränkt. Auf Grund der Vollständigkeit von R existiert s = sup A für die Menge A = {an | n ∈ N}. Wir beweisen nun, dass s = limn an gilt und geben dafür ein " ∈ R+ vor. Da s − " —– 86 —– keine obere Schranke für die Menge A ist, gibt es ein N ∈ N mit s − " < aN ≤ s. Für beliebiges n ≥ N gilt nun s − " < aN ≤ an ≤ s, also an > s − " und somit |s − an | = s − an < ". Die entsprechende Argumentation für monoton fallende Folgen verläuft analog, man braucht nur das Supremum durch das Infimum zu ersetzen. (4.20) Definition Sei (an )n∈N eine Folge reeller Zahlen. Man nennt lim supn an = lim infn an = lim sup {am | m ∈ N, m ≥ n} n→∞ bzw. lim inf {am | m ∈ N, m ≥ n} n→∞ den Limes superior bzw. Limes inferior von (an )n∈N , sofern diese Grenzwerte existieren. (4.21) Proposition Sei (an )n∈N eine beschränkte Folge reeller Zahlen. Dann existieren lim supn an und lim infn an . Beweis: Wir beweisen nur die Existenz von lim supn an . Dazu definieren wir für jedes n ∈ N die Menge An = {am | m ∈ N, m ≥ n}, außerdem sei a eine untere und b eine obere Schranke von A1 = {am | m ∈ N}. Für jedes n ∈ N gilt An ⊆ A1 . Also ist a auch eine untere und b eine obere Schranke von An . Weil An nichtleer und beschränkt ist, existiert sup An , und es gilt a ≤ sup An ≤ b. Wir müssen nun zeigen, dass limn sup An existiert. Wegen An ⊇ An+1 ist jede obere Schranke von An auch eine obere Schranke von An+1 . Es gilt also S + (An ) ⊆ S + (An+1 ), und daraus folgt sup An = min S + (An ) ≥ min S + (An+1 ) = sup An+1 . Insgesamt haben wir damit nachgewiesen, dass die Folge gegeben durch die Elemente sup An , n ∈ N monoton fallend und nach unten beschränkt ist. Aus Satz (4.19) folgt die Konvergenz. (4.22) Satz Sei (an )n∈N eine beschränkte Folge reeller Zahlen. Dann ist lim supn an der größte Häufungspunkt von (an )n∈N (also maximal in der Menge der Häufungspunkte), und lim infn an ist der kleinste Häufungspunkt der Folge. Beweis: Zunächst zeigen wir, dass a = lim supn an ein Häufungspunkt der Folge ist. Sei " ∈ R+ vorgegeben. Es genügt zu zeigen, dass für jedes N ∈ N jeweils ein n ∈ N mit n ≥ N und |an − a| < " existiert, denn dann gibt es unendlich viele n mit |an − a| < ". Sei also N ∈ N vorgegeben. Wie im letzten Beweis definieren wir An = {am | m ≥ n} für alle n ∈ N. Weil die Folge (sup An )n∈N gegen a konvergiert, gibt es ein m ∈ N mit m ≥ N und | sup Am − a| < 12 ". Weil außerdem sup Am eine —– 87 —– obere Schranke, sup Am − 12 " aber keine obere Schranke von Am ist, gibt es ein n ∈ N mit n ≥ m ≥ N und sup Am − 12 " < ≤ an sup Am . Insbesondere gilt |an − sup Am | < 21 ". Insgesamt erhalten wir |an − a| = |an − sup Am + sup Am − a| ≤ |an − sup Am | + | sup Am − a| < 12 " + 12 " = ". Nun zeigen wir, dass a der größte Häufungspunkt der Folge ist. Nehmen wir an, dass b ∈ R mit b > a ein weiterer Häufungspunkt ist. Sei " = b − a. Dann gibt es für jedes m ∈ N ein n ≥ m mit |an − b| < 12 ". Insbesondere gilt an > b − 21 " = a + 12 ". Weil sup Am eine obere Schranke von {an | n ≥ m} ist, folgt daraus ≥ sup Am a + 12 ". Weil diese Abschätzung für jedes m ∈ N gültig ist, folgt a = lim sup Am m→∞ ≥ a + 21 " , im Widerspruch zu a < a + 12 ". Also muss a der größte Häufungspunkt von (an )n∈N sein. Der Beweis der entsprechenden Aussagen für den Limes inferior läuft analog. (4.23) Folgerung (Satz von Bolzano-Weierstrass) Jede beschränkte Folge reeller Zahlen besitzt einen Häufungspunkt. Beweis: Dies ist eine unmittelbare Konsequenz aus Satz (4.22). (4.24) Folgerung Eine Folge konvergiert genau dann, wenn sie beschränkt ist und genau einen Häufungspunkt besitzt. Beweis: Die Richtung „⇒“ ergibt sich aus Proposition (4.17) und Satz (4.3). „⇐“ Sei (an )n∈N eine be- schränkte Folge mit genau einem Häufungspunkt. Für jedes m ∈ N sei Am = {an | n ≥ m}. Nach Satz (4.22) ist limn sup An = lim supn an der größte und limn inf An = lim infn an der kleinste Häufungspunkt von (an )n∈N . Auf Grund der Voraussetzung, dass nur ein Häufungspunkt existiert, fallen beide Grenzwerte zusammen. Wegen am ∈ Am gilt inf Am ≤ am ≤ sup Am für alle m ∈ N. Aus dem Sandwich-Lemmas (Satz (4.12)) folgt damit die Konvergenz der Folge (an )n∈N . (4.25) Definition Eine Folge (an )n∈N in K wird Cauchyfolge genannt, wenn für jedes " > 0 ein N ∈ N existiert, so dass |an − am | < " für alle —– 88 n, m ≥ N —– gilt. Wir geben ein anschauliches Kriterium für Cauchyfolgen an, dass auf der Schachtelung von Intervallen basiert. Hierzu benötigen wir zunächst eine Beobachtung zum Durchschnitt abgeschlossener Intervalle. Ist I ein Intervall mit den Grenzen a, b ∈ R̄, a < b, so bezeichnen wir ein x ∈ R mit a < x < b als inneren Punkt von I. Sind a, b ∈ R, so wird `(I) = b − a die Länge von I genannt (4.26) Lemma Seien I und J endliche abgeschlossene Intervalle mit einem gemeinsamen inneren Punkt. Dann ist auch I ∩ J ein endliches, abgeschlossenes Intervall, mit 0 < `(I ∩ J) ≤ min{`(I), `(J)}. Beweis: Sei I = [a, b] und J = [c, d], mit a, b, c, d ∈ R, a < b und c < d. Auf Grund der Voraussetzung gibt es ein x ∈ R mit a < x < b und c < x < d. Es folgt max{a, c} < x < min{b, d}, also insbesondere min{b, d} − max{a, c} > 0. Außerdem gilt min{b, d} − max{a, c} ≤ b − a und ebenso min{b, d} − max{a, c} ≤ d − c. Das Intervall [u, v] mit den Grenzen u = max{a, c} und v = min{b, d} stimmt mit I ∩ J überein, denn für jeden Punkt y ∈ R ist a ≤ y ≤ b und c ≤ y ≤ d offenbar äquivalent zu u ≤ y ≤ v. Wie bereits festgestellt, gilt 0 < `([u, v]) < `(I) und 0 < `([u, v]) < `(J). (4.27) Proposition Eine Folge (an )n∈N in R ist genau dann eine Cauchyfolge, wenn eine Folge (I k )k∈N abgeschlossener Intervalle I k ⊆ R existiert mit den Eigenschaften (i) I k ⊇ I k+1 für alle k ∈ N (ii) Für jedes k ∈ N liegen alle bis auf endlich viele Folgenglieder in I k . (iii) Es gilt lim `(I k ) = 0. k→∞ Beweis: „⇒“ Unter der Voraussetzung, dass (an )n∈N eine Cauchyfolge ist, konstruieren wir rekursiv eine Intervallfolge (I k )k∈N mit den gewünschten Eigenschaften. Dabei soll I k jeweils ein abgeschlossenes Intervall der Länge ≤ 2 · 2−k sein. An Stelle von (ii) wählen wir die Intervalle I k sogar so, dass jeweils alle bis auf endlich viele Folgenglieder innere Punkte von I k sind. Weil (an )n∈N eine Cauchyfolge ist, gibt es ein n0 ∈ N mit |an − am | < 1 für alle m, n ≥ n0 . Definieren wir das Intervall I0 durch I0 = [an0 − 1, an0 + 1], dann ist an für alle n ≥ n0 ein innerer Punkt von I0 , und I0 hat die Länge 2 = 2 · 2−0 . Sei nun k ∈ N0 vorgegeben, und setzen wir voraus, dass nk und das Intervall I k mit der Länge 2 · 2−k bereits konstruiert wurden. Wiederum auf Grund der Cauchyfolgen-Eigenschaft existiert ein nk+1 ≥ nk , so dass |am − an | < 2−(k+1) für alle m, n ≥ nk+1 erfüllt ist. Setzen wir J = [ank+1 − 2−(k+1) , ank+1 + 2−(k+1) ] , dann ist an für jedes n ≥ nk+1 ein innerer Punkt von I k und J. Nach Lemma (4.26) ist I k+1 = I k ∩J ein abgeschlossenes Intervall mit Länge ≤ 2 · 2−(k+1) , und für jedes n ≥ nk+1 ist ist an innerer Punkt von I k+1 . Wegen limk 2 · 2−k = 0 gilt erst recht limk `(I k ) = 0. Damit sind alle Aussagen erfüllt. —– 89 —– „⇐“ Sei (I k )k∈N eine Folge von Intervallen mit der angegebenen Eigenschaft. Zum Nachweis der Cauchyfolgen- Eigenschaft sei " ∈ R+ vorgegeben. Wir wählen k ∈ N so groß, dass `(I k ) < " ist. Nach Voraussetzung liegen alle bis auf endlich viele Folgenglieder in I k , es gibt also ein N ∈ N mit an ∈ I k für alle n ≥ N . Daraus folgt |an − am | ≤ `(I k ) < " für alle m, n ≥ N . Also ist (an )n∈N eine Cauchyfolge. (4.28) Satz Die Cauchyfolgen in R sind genau die konvergenten Folgen. Beweis: „⇐“ Sei (an )n∈N eine konvergente Folge und a ∈ R ihr Grenzwert. Zum Nachweis der Cauchyfolgen- Eigenschaft sei " ∈ R+ vorgegeben. Dann gibt es N ∈ N mit |an − a| < 12 " für alle n ≥ N . Sind m, n ≥ N vorgegeben, so folgt |an − am | „⇒“ = |(an − a) + (a − am )| ≤ |an − a| + |am − a| < 1 " 2 + 21 " = ". Sei (an )n∈N eine reelle Cauchyfolge und (I k )k∈N eine Folge von Intervallen mit den in (4.27) beschriebenen Eigenschaften. Auf Grund der Vollständigkeit von R und der Intervallschachtelungs-Eigenschaft (siehe Satz (3.24)) gibt es ein a ∈ R mit a ∈ I k für alle k ∈ N. Wir zeigen, dass limn an = a gilt. Sei " ∈ R+ vorgegeben. Wir können k ∈ N nach (4.27) (iii) so groß wählen, dass `(I k ) < " gilt. Auf Grund der Eigenschaft (ii) in (4.27) existiert ein N ∈ N, so dass an ∈ I k für alle n ≥ N gilt. Aus a ∈ I k folgt |an − a| ≤ `(I k ) < " für alle n ≥ N . Cauchyfolgen ermöglichen es also, die Konvergenz einer Folge auch dann nachzuweisen, wenn der Grenzwert unbekannt ist. Dies wird sich im nächsten Abschnitt bei den unendlichen Summen (Reihen) als sehr hilfreich erweisen. Wir beenden den Abschnitt mit einem Anwendungsbeispiel, indem wir die Konvergenz der Folge 1 n an = 1+ n untersuchen. Von praktischer Bedeutung ist diese Formel für die Zinsrechnung. Stellen wir uns vor, ein gewisser Geldbetrag k (in Euro) wird mit einem jährlichen Zinssatz von 100 Prozent verzinst. (Diesen unrealistisch hohen Zinssatz wählen wir nur, um das Beispiel so einfach wie möglich zu halten.) Dann hängt der Kontostand am Ende des Jahres davon ab, wie häufig der Betrag verzinst wurde. Fallen die Zinsen nur einmal im Jahr an, hätte man am Jahresende den Betrag 2a. Bei monatlicher Verzinsung werden natürlich nicht jedesmal 100 Prozent aufgeschlagen, 1 12 sondern der Zinssatz wird durch 12 geteilt. Am Jahresende hätte sich dann der Betrag k(1 + 12 ) angesammelt. Bei n gleichmäßig über das Jahr verteilten Verzinsungen hat man am Jahresende den Betrag 1 n kan = k 1 + n angespart. Lassen wir n gegen unendlich laufen, dann erhält man den Betrag, der bei einer kontinuierlichen Verzinsung zu Stande kommt. Die entscheidende Frage ist nun, ob dies noch ein endlicher Wert ist, und wenn ja, in welcher Größenordnung sich dieser bewegt. (4.29) Proposition Die Folge (an )n∈N gegeben durch an = (1 + 1n )n für alle n ∈ N ist konvergent. Wir bezeichnen den Grenzwert als die Eulersche Zahl e. —– 90 —– Durch Anwendung der Bernoullischen Ungleichung erhalten wir für n ≥ 2 die Abschätzung Beweis: n n 1 + 1n 1 − 1n 1− = 1 n2 n ≥ 1− 1 n n n−1 1 + 1n 1 − 1n ≥1 ⇔ und weiter n 1 + 1n = an 1 n−1 1 − 1n > = 1 n−1 n−1 = n n−1 n−1 n = 1+ n−1 1 = n−1 an−1 . Dies zeigt, dass die Folge (an )n∈N monoton wachsend ist. Wir betrachten nun die Folge (bn )n∈N gegeben durch bn = (1 + 1n )n+1 für alle n ∈ N. Durch die Rechnung 1 1+ 1 n · 1 1− = 1 n n2 n2 − 1 + 1 = (n + 1)(n − 1) n2 erhalten wir wiederum mit Hilfe der Bernoullische Ungleichung n 1 1 1 1+ 2 n · n = n −1 1+ 1 1− 1 n > = −1 1+ n 1 1+ n 1 n2 −1 > 1+ 1 n2 1 n . Multiplikation der beiden Seiten mit (1 + 1n )n liefert = bn 1+ 1 n+1 n < 1 n 1 − 1n 1 n−1 n = = n n n−1 n = 1+ n n−1 = bn−1 . Also ist (bn )n∈N monoton fallend. Darüber hinaus gilt 1 < 1+ 1 n ≤ n 1 + 1n = an ≤ bn = n+1 1 + 1n ≤ (1 + 1)2 = 4. Dies bedeutet, dass (an )n∈N nach oben und (bn )n∈N nach unten beschränkt ist. Nach Satz (4.19) sind damit beide Folgen konvergent. Aus dem Beweis ergibt sich, dass die Folge (an )n∈N von unten, die Folge (bn )n∈N von oben gegen den Grenzwert e konvergiert. Es gilt also an ≤ e ≤ bn für alle n ∈ N. Man erhält auf diese Weise für n = 2 die Abschätzung 2, 25 = 9 4 <e< 27 8 = 3, 375. Für n = 105 erhält man die genauere Abschätzung 2, 71827 < e < 2, 71830, gerundet auf die ersten 60 Dezimalstellen ist e ≈ 2, 71828182845904523536028747135266249775724709369995957496697. —– 91 —– (III) Konvergenzkriterien für Reihen (4.30) Definition Sei (an )n∈N eine (reelle oder komplexe) Folge. Dann bezeichnet man die Folge (sn )n∈N gegeben durch sn = n X n∈N für ak k=1 als Reihe über (an )n∈N . Das Folgenglied sn nennt man die n-te Partialsumme der Reihe. Beginnt die Folge nicht bei 1, sondern an einem beliebigen Startwert n0 ∈ Z, dann beginnt auch die Folge der Partialsummen bei n0 . Die Reihe über (an )n≥n0 ist dann gegeben durch n X = sn n ∈ Z mit n ≥ n0 . für alle ak k=n0 Die Reihe über (an )n∈N bzw. (an )n≥n0 wird mit ∞ X ∞ X an bzw. an bezeichnet. n=n0 n=1 Wir betrachten einige konkrete Beispiele für Reihen. (i) Die Reihe ∞ X 1 n besteht aus den Folgengliedern n=1 s1 = 1, (ii) Die Reihe s2 = 1 + 1 2 = 32 , s3 = 1 + 1 2 + 1 3 = 11 , 6 s4 = 1 + 1 2 + 1 3 + 1 4 = 25 , 12 ... ∞ X (−1)n besteht aus den Folgengliedern n=1 s1 = −1, s2 = (−1) + 1 = 0, (4.31) Definition Sei P∞ n=1 s3 = (−1) + 1 + (−1) = −1, s4 = (−1) + 1 + (−1) + 1 = 0, ... an eine Reihe über R oder C und (sn )n∈N die Folge ihrer Partial- summen. Man sagt, die Reihe konvergiert gegen einen Grenzwert a ∈ R (oder C), wenn die Folge (sn )n∈N gegen a konvergiert. Existiert kein solcher Grenzwert, dann spricht man von einer divergenten Reihe. Ebenso ordnet man der Reihe den Grenzwert +∞ oder −∞ zu, wenn die Folge (sn )n∈N uneigentlich gegen +∞ oder P∞ P∞ −∞ konvergiert. Konvergiert die Reihe n=1 an , dann verwendet man die Notation n=1 an auch für den Grenzwert, man setzt also ∞ X an n=1 —– = lim n→∞ 92 n X k=1 —– ak . Die Bezeichnung P∞ n=1 an wird also für zwei verschiedene Objekte verwendet: einerseits für die Folge (sn )n∈N der Partialsummen, andererseits auch für den (evtl. uneigentlichen) Grenzwert dieser Folge, sofern er existiert. Welche Bedeutung gemeint ist, muss dem jeweiligen Kontext entnommen werden. In einigen Fällen lässt sich der Grenzwert einer Reihe direkt angeben. (4.32) Proposition Es gilt ∞ X 1 n=1 n(n + 1) = 1. Pn 1 n Wir beweisen zunächst durch vollständige Induktion über n ∈ N die Summenformel k=1 k(k+1) = n+1 . P1 1 1 1 Die Gleichung ist für n = 1 richtig, denn es gilt k=1 k+1 = 2 = 1+1 . Den Induktionsschluss von n auf n + 1 erhält Beweis: man durch n+1 X 1 k=1 k(k + 1) = n X 1 k=1 k(k + 1) n(n + 2) + 1 n Ind.-V. = (n + 1)(n + 2) n2 + 2n + 1 = (n + 1)(n + 2) 1 + (n + 1)(n + 2) = n+1 + 1 (n + 1)(n + 2) (n + 1)2 = (n + 1)(n + 2) n+1 = , n+2 wobei wir beim zweiten „=“ die Induktionsvoraussetzung verwendet haben. Die Folge (sn )n∈N ist also gegeben durch P∞ n 1 n sn = n+1 , und es folgt n=1 n(n+1) = limn n+1 = 1. (4.33) Proposition (geometrische Reihe) Für alle x ∈ C mit |x| < 1 gilt ∞ X xn = n=0 Beweis: 1 1− x . Wir beweisen durch vollständige Induktion über n ∈ N0 die Summenformel n X = xn 1 − x n+1 1− x k=0 Für n = 0 gilt n+1 X k=0 P0 xk k=0 = x0 = 1 = n X 1−x . 1−x . Der Schluss von n auf n + 1 folgt aus der Rechnung Ind.-V. x k + x n+1 = k=0 1 − x n+1 1− x + x n+1 1 − x n+1 = 1− x Die Folge (sn )n∈N der Partialsummen ist also gegeben durch sn = + 1−x n+1 . 1−x x n+1 − x n+2 1− x n=0 xn = lim n→∞ 1 − x n+1 1− x —– 93 = —– 1 1− x . 1 − x n+2 1− x . Wegen |x| < 1 gilt lim x n = 0. Unter n→∞ Verwendung der Grenzwertsätze erhalten wir also ∞ X = P∞ P∞ an und n=1 bn konvergente Reihen über R oder C und λ ∈ R bzw. P∞ P∞ P∞ C. Dann sind auch die Reihen n=1 (an + bn ), n=1 (an − bn ) und n=1 λan konvergent, und es (4.34) Satz Seien n=1 gilt ∞ ∞ ∞ X X X (an + bn ) = an + bn n=1 n=1 , n=1 ∞ ∞ ∞ X X X (an − bn ) = an − bn n=1 n=1 und n=1 ∞ X λan = λ n=1 ∞ X an . n=1 Diese Aussagen ergeben sich ziemlich unmittelbar aus den Grenzwertsätzen für Folgen. Wir beschränken P∞ P∞ uns deshalb auf die Reihe n=1 (an + bn ). Seien (sn )n∈N und (t n )n∈N die Folgen der Partialsummen von n=1 an P∞ bzw. n=1 bn . Durch einen leichten Induktionsbeweis zeigt man zunächst, dass sn + t n die n-te Partialsumme von P∞ n=1 (an + bn ) ist. Auf Grund des Grenzwertsatzes für Summen gilt nun Beweis: ∞ X (an + bn ) = n=1 Der Beweis für P∞ n=1 (an − bn ) und lim (sn + t n ) n→∞ P∞ n=1 λan = lim sn + lim t n n→∞ n→∞ = ∞ X an + n=1 ∞ X bn . n=1 verläuft völlig analog. P∞ P∞ (4.35) Proposition Seien n=1 an und n=1 bn konvergente Reihen über R. Gilt an ≤ bn für P∞ P∞ alle n ∈ N, dann folgt n=1 an ≤ n=1 bn . P∞ Beweis: Sei (sn )n∈N die Folge der Partialsummen von n=1 an und (t n )n∈N die Folge der Partialsummen von P∞ n=1 bn . Durch Anwendung der Voraussetzung an ≤ bn und vollständige Induktion beweist man, dass sn ≤ t n für alle n ∈ N gilt. Die entsprechende Aussage (4.11) für Folgen liefert nun die Behauptung. Wir werden nun einige Kriterien für die Konvergenz von Reihen herleiten. Wir beschränken uns dabei auf Reihen über reellwertigen Folgen. (4.36) Satz (Cauchy-Kriterium) P∞ Eine Reihe n=1 an = (sn )n∈N in R konvergiert genau dann, wenn für jedes " > 0 ein N ∈ N existiert, so dass n X a = k=m+1 k Beweis: |sn − sm | < " für alle m, n ∈ N mit n≥m≥N gilt. Das angegebene Kriterium ist genau dann erfüllt, wenn die Folge (sn )n∈N der Partialsummen eine Cauchy- folge bildet. Nach Satz (4.28) ist die Cauchyfolgen-Eigenschaft äquivalent zur Konvergenz der Folge. —– 94 —– ∞ X (4.37) Folgerung Sei an eine konvergente Reihe in R. Dann gilt lim an = 0. n→∞ n=1 Sei " ∈ R+ vorgegeben. Nach dem Cauchy-Kriterium gibt es ein N ∈ N mit | Beweis: Pn k=m+1 ak | < " für alle m, n ≥ N . Wählen wir n = m + 1, dann erhalten wir insbesondere |am+1 | < " für alle m ≥ N , also |am | < " für alle m ≥ N + 1. (4.38) Satz (Monotoniekriterium) Sei (an )n∈N eine Folge nichtnegativer reeller Zahlen. Genau dann konvergiert die Reihe P∞ n=1 an , wenn die Folge (sn )n∈N der Partialsummen beschränkt ist. Setzen wir voraus, dass die Folge (sn )n∈N beschränkt ist. Wegen an ≥ 0 für alle n ∈ N ist sie außerdem Beweis: monoton wachsend. Also folgt die Konvergenz aus Satz (4.19). Umgekehrt folgt aus der Konvergenz von (sn )n∈N die Beschränktheit dieser Folge. (4.39) Satz Die Reihe ∞ X 1 n=1 n divergiert. Wir zeigen, dass die Folge (sn )n∈N der Partialsummen unbeschränkt ist. Für p ∈ N gilt p+1 p p 2 2k+1 2k+1 X X X X X 1 1 1 s2p+1 = = 1+ ≥ 1+ k+1 n n 2 k k n=1 k=0 k=0 Beweis: n=2 +1 = 1+ p X 2k · k=0 1 2k+1 = 1+ p X 1 2 n=2 +1 = 1 + 12 (p + 1) 1 (p 2 = + 3). k=0 Dabei haben wir im zweiten Schritt die Summe lediglich in einzelne „Pakete“ aufgeteilt, d.h. wir haben Teilsummen von 1 + 1 2 + 1 3 + ... in der Form 1 1 2 + + ( 31 + 14 ) + ( 15 + 1 6 + 1 7 + 18 ) + ... zusammengefasst. Beim dritten Schritt in der Ungleichungskette oben beachte man, dass für alle n ∈ N im Bereich 2k + 1 ≤ n ≤ 2k+1 die Abschätzung 1 n ≥ 1 2k+1 gilt, und das insgesamt 2k Summanden in diesen Bereich fallen. Wegen lim p 21 (p + 3) = +∞ zeigt die Ungleichungskette, dass die Partialsummen s2p+1 über jede vorgegebene reelle Zahl hinauswachsen. —– 95 —– (4.40) Satz (Leibniz-Kriterium) Sei (an )n∈N eine monoton fallende Folge nichtnegativer reeller Zahlen mit der Eigenschaft P∞ limn an = 0. Dann konvergiert die Reihe n=0 (−1)n an . Beweis: Die Teilfolge (s2n )n≥0 der Folge (sn )n∈N der Partialsummen ist monoton fallend, denn es gilt = s2n+2 − s2n a2n+2 − a2n+1 ≤ 0 für alle n ∈ N0 . Die Rechnung s2n+3 −s2n+1 = −a2n+3 +a2n+2 ≥ 0 zeigt, dass die Teilfolge (s2n+1 )n≥0 monoton wächst. Außerdem sind beide Folgen beschränkt, denn es gilt s2n = s2n−1 + a2n ≥ s2n−1 ≥ s1 für alle n ∈ N und s2n+1 = s2n − a2n+1 ≤ s2n ≤ s0 für alle n ∈ N0 . Also existieren nach Satz (4.19) die beiden Grenzwerte s = lim s2n und n→∞ s0 = lim s2n+1 . n→∞ Wegen s − s0 = lim (s2n − s2n+1 ) = lim a2n+1 = 0 stimmen s und s0 überein. n→∞ n→∞ Sei nun " ∈ R+ vorgegeben. Wegen der Konvergenz der beiden Teilfolgen gibt es nun N1 , N2 ∈ N mit |s2n − s| < " für alle n ≥ N1 und |s2n+1 − s| < " für alle n ≥ N2 . Sei N = max{2N1 , 2N2 + 1} und n ∈ N mit n ≥ N . Ist n gerade, n = 2k, dann gilt 2k ≥ N ≥ 2N1 und somit k ≥ N1 , also |sn − s| = |s2k − s| < ". Ist n dagegen ungerade, n = 2k + 1, dann folgt k ≥ N2 und |sn − s| = |s2k+1 − s| < ". Nach dem Leibniz-Kriterium sind beispielsweise die Reihen ∞ X 1 (−1)n+1 n n=1 ∞ X (−1)n und n=0 1 2n + 1 konvergent. Die erste dieser beiden Reihen wird alternierende harmonische Reihe genannt. P∞ (4.41) Definition Eine Reihe n=1 an wird absolut konvergent genannt, wenn die Reihe P∞ n=1 |an | der Absolutbeträge konvergiert. (4.42) Proposition Jede absolut konvergente Reihe ist im herkömmlichen Sinn konvergent. Beweis: Durch vollständige Induktion über n verallgemeinert man die Dreiecksungleichung |x + y| ≤ |x| + | y| zunächst von zwei auf n Summanden, d.h. man beweist n n X X a ≤ |ak | k=1 k k=1 —– 96 —– P∞ für beliebiges n ∈ N und a1 , ..., an ∈ R. Sei nun n=1 an eine absolut konvergente Reihe und " ∈ R+ vorgegeben. Da P∞ n=1 |an | konvergiert, existiert nach dem Cauchy-Kriterium (Satz (4.36)) ein N ∈ N, so dass für alle m, n ≥ N die Pn Abschätzung k=m+1 |ak | < " erfüllt ist. Es folgt n n X X |ak | < ". ak ≤ k=m+1 k=m+1 Die erneute Anwendung des Cauchy-Kriteriums liefert die gewöhnliche Konvergenz der Reihe. (4.43) Satz (Majorantenkriterium) P∞ P∞ Sei n=1 cn eine konvergente Reihe in R+ und n=1 an eine Reihe mit |an | ≤ cn für fast alle P∞ (d.h. alle bis auf endlich viele) n ∈ N. Dann konvergiert n=1 an absolut. Zunächst bemerken wir, dass (wie bei den Folgen) die Modifikation von endlich vielen Gliedern einer Beweis: Reihe nichts an deren Konvergenzverhalten ändert. Deshalb können wir die Ungleichung |an | ≤ cn für alle n ∈ N voraussetzen. Wir zeigen nun, dass eine Reihe unter der angegebenen Bedingung das Cauchy-Kriterium erfüllt. P∞ Sei " ∈ R+ vorgegeben. Auf Grund der Konvergenz von n=1 cn gibt es ein N ∈ N mit n n X X ck = ck < " für n, m ≥ N . k=m+1 k=m+1 Pn Pn Wegen |ak | ≤ ck für alle k ∈ N folgt k=m+1 |ak | ≤ k=m+1 ck < ". Damit sind die Voraussetzungen des CauchyKriteriums nachgewiesen. (4.44) Folgerung (Minorantenkriterium) P∞ P∞ Sei n=1 cn eine divergente Reihe in R+ und n=1 an eine Reihe mit an ≥ cn für fast alle n ∈ N. P∞ Dann ist auch n=1 an divergent. Beweis: Wie im vorherigen Beweis können wir die Ungleichung an ≥ cn für alle n ∈ N voraussetzen. Wäre P∞ n=1 an konvergent, dann könnten wir das Majorantenkriterium anwenden und erhielten damit auch die Konvergenz der P∞ Reihe n=1 cn , im Widerspruch zur Voraussetzung. Wir illustrieren die Anwendung von Majoranten- und Minorantenkriterium an einer Reihe von Beispielen. Beispiel 1: Für alle k ≥ 2 ist die Reihe ∞ X 1 n=1 nk konvergent. Beweis: Durch direktes Nachrechnen haben wir bereits gezeigt, dass ∞ X 1 n=1 n(n + 1) —– 97 —– eine konvergente Reihe ist. Da eine konvergente Reihe auch nach Multiplikation mit einem skalaren Vielfachen noch 2 konvergent ist (vgl. Satz (4.34)) ist auch die Reihe über ( n(n+1) )n∈N konvergent. Nun gelten für alle n ∈ N die Ungleichungen n≥1 also 1 nk ≤ 1 n2 Beispiel 2: ≤ 2 n(n+1) ⇔ n2 ≥ n 2n2 ≥ n2 + n ⇔ n2 ≥ 21 n(n + 1). ⇔ für alle n ∈ N. Das Majorantenkriterium beweist somit die Konvergenz der Reihe. Die Reihe ∞ X 1 2n + 7 n=1 ist divergent. Beweis: Für alle n ∈ N mit n ≥ 7 gilt 2n + 7 ≤ 3n Wäre P∞ P∞ 1 n=1 3n 1 n=1 3n ⇔ 1 3n P∞ ≤ 1 2n + 7. 1 n=1 n , was wir bereits widerlegt haben. Also haben wir mit eine divergente Minorante für unsere Reihe gefunden. Beispiel 3: konvergent, dann nach Satz (4.34) auch Die Reihe ∞ X 1 n=1 n2 − 5 ist konvergent. Beweis: Für alle n ∈ N mit n ≥ 4 gilt n2 ≥ 10 also 1 n2 − 5 ≤ 2 ∞ X 2 n n2 . Somit ist 2 (4.45) Satz n=1 1 2 n 2 ⇔ ≥5 ⇔ n2 − 5 ≥ 12 n2 eine konvergente Majorante für ∞ X 1 n=1 n2 − 5 , . (Quotientenkriterium) Sei (an )n∈N eine Folge mit an 6= 0 für fast alle n ∈ N. Ferner existiere ein θ ∈ R, 0 < θ < 1, so dass die Ungleichung an+1 a n erfüllt ist. Dann ist ∞ X ≤ θ für fast alle an absolut konvergent. n=1 —– 98 —– n∈N Beweis: an+1 | ≤ θ für alle n ∈ N an |an+1 | ≤ θ n |a1 | für alle n ∈ N0 . Wir setzen voraus, dass die Bedingungen an 6= 0 und | |a2 | ≤ θ |a1 |, und durch vollständige Induktion beweist man erfüllt sind. Dann gilt P∞ Die Reihe n=0 θ n |a1 | stimmt bis auf den konstanten Faktor |a1 | mit der geometrischen Reihe überein, konvergiert also gegen den Wert P∞ P∞ |a1 |/(1 − θ ). Somit ist n=0 θ n |a1 | eine konvergente Majorante der Reihe n=1 an . Mit Hilfe des Quotientenkriteriums kann beispielsweise gezeigt werden, dass die Reihe ∞ X n n=1 konvergiert. Setzen wir nämlich an = an+1 a n an+1 = an n , 2n 2n dann gilt n+1 2n+1 n 2n = n + 1 2n · 2n+1 n = n+1 = 1 2 = 2n 1+ 1 n und für n ≥ 2 gilt 1 n ≤ 1 2 ⇔ 1+ 1 n ≤ 3 2 |an+1 |/|an | = 21 (1 + 1n ) ≤ 34 . ⇔ 3 4 Die Voraussetzungen des Quotientenkriteriums sind also mit der Konstante θ = erfüllt. Wir wenden das Quotientenkriterium nochmals auf eine etwas kompliziertere Situation an, indem wir die Konvergenz der Reihe ∞ X n3 + 5 4n n=1 beweisen. Setzen wir an = an+1 a n ≤ n3 +5 4n = 1 4 · für n ∈ N, dann gilt für n ≥ 2 die Ungleichung n + 1 ≤ 32 n, und somit (n + 1)3 + 5 4n+1 27 3 n + 5 · 27 8 8 n3 + 5 wobei im vierten Schritt die Abschätzung teriums sind also mit der Konstanten θ = · = 4n n3 + 5 1 4 · = 1 4 · (n + 1)3 + 5 27 (n3 + 5) 8 n3 + 5 27 ≤ 5 · 27 8 8 27 erfüllt. 32 n3 + 5 = 1 4 · 27 8 ≤ = 1 4 27 32 · ( 32 n)3 + 5 n3 + 5 < 1 , verwendetet wurde. Die Voraussetzungen des Quotientenkri- Man beachte, dass es für die Anwendung des Quotientenkriteriums nicht genügt, lediglich die Ungleichung | P∞ für fast alle n ∈ N zu beweisen. Betrachten wir zum Beispiel die Reihe n=1 an mit an = 1n . Es gilt an+1 n für alle n ∈ N , a = n+1 < 1 n an+1 | an <1 aber die Reihe ist, wie wir gezeigt haben, divergent. mit an 6= 0 und a | an+1 | n an+1 | an kann auch die Divergenz von Folgen nachgewiesen werden. Sei (an )n∈N eine Folge P∞ ≥ 1 für fast alle n ∈ N. Dann divergiert die Reihe n=1 an . Ist nämlich n0 ∈ N so gewählt, dass Mit Hilfe der Quotienten | die Bedingungen für alle n ≥ n0 erfüllt sind, dann erhält man die Ungleichungen |an0 | ≤ |an0 +1 | ≤ |an0 +2 | —– 99 —– ≤ ... , so dass die Folge an also keine Nullfolge sein kann. Deshalb ist die Reihe P∞ n=1 an divergent. (4.46) Folgerung Sei (an )n∈N eine Folge und n0 ∈ N, so dass an 6= 0 für n ≥ n0 gilt und die Folge (| an+1 |)n≥n0 an konvergiert, mit α = lim | n→∞ an+1 |. an (i) Gilt α < 1, dann konvergiert die Reihe ∞ X an absolut. n=1 (ii) Gilt α > 1, dann divergiert sie. Im Fall α = 1 ist keine Aussage möglich, d.h. es gibt Reihen mit dieser Eigenschaft, die konvergieren, und andere, die divergieren. Den Beweis stellen wir als Übungsaufgabe. Das folgende Kriterium ist dem Quotientenkriterium ähnlich, basiert aber auf der Wurzelfunktion. (4.47) Satz (Wurzelkriterium) Sei (an )n∈N eine Folge mit der Eigenschaft, dass ein θ ∈ R, 0 < θ < 1 existiert, so dass P∞ θ für fast alle n ∈ N erfüllt ist. Dann konvergiert die Reihe n=1 an absolut. p n |an | ≤ p Sei die Bedingung n |an | ≤ θ für alle n ∈ N erfüllt. Dann gilt |an | ≤ θ n für alle n ∈ N, also ist wiederum P∞ die geometrische Reihe n=0 θ n eine konvergente Majorante. Beweis: Wie beim Quotientenkriterium gilt, dass im Falle von p n |an | ≥ 1 für unendlich viele n ∈ N, die Reihe P∞ n=1 an divergiert. Denn dann gilt unendlich oft |an | ≥ 1, die Folge (an )n∈N kann also keine Nullfolge sein. Genau wie in Folgerung (4.46) beweist man auch p (4.48) Folgerung Sei (an )n∈N eine Folge mit der Eigenschaft, dass die Folge ( n |an |)n∈N konp vergiert, mit α = lim n |an |. n→∞ (i) Gilt α < 1, dann konvergiert die Reihe ∞ X an absolut. n=1 (ii) Gilt α > 1, dann divergiert sie. Wiederum ist im Fall α = 1 ist keine Aussage möglich. Weder Quotienten- noch Wurzelkriterium sind stark genug, um die Divergenz der harmonischen Reihe oder die P∞ Konvergenz der Reihe n=1 n12 nachzuweisen, denn es gilt 1 n+1 lim n→∞ 1 n = lim n→∞ n n+1 =1 und ebenso —– 100 lim n→∞ —– 1 2 ( n+1 ) ( 1n )2 = lim n→∞ n 2 n+1 = 1. Wir formulieren nun ein Kriterium, dass für diese Reihen geeignet ist. Der Beweis ähnelt dem Verfahren, mit dem P∞ wir die Divergenz der harmonischen Reihe n=1 1n nachgewiesen haben. (4.49) Satz (Verdichtungskriterium) Sei (an )n∈N eine monoton fallende Folge nichtnegativer reeller Zahlen, und sei die Folge (bk )k∈N0 definiert durch bk = 2k a2k für alle k ∈ N0 . Dann gilt die Äquivalenz ∞ X ∞ X ⇔ an ist konvergent n=1 Beweis: „⇐“ bk ist konvergent. k=0 Nach Voraussetzung ist die Reihe P∞ bk konvergent. Zu zeigen ist, dass die Reihe k=0 P∞ n=1 an konvergiert. Für alle k ∈ N0 und m ∈ N0 mit 0 ≤ m < 2 gilt auf Grund der Monotonie der Folge (an )n∈N die k Abschätzung a2k ≥ a2k +m . Setzen wir also c2k +m = a2k für k ∈ N0 und 0 ≤ m < 2k , dann gilt cn ≥ an für alle n ∈ N. P∞ P∞ Wenn wir zeigen können, dass die Reihe n=1 cn konvergiert, dann folgt die (absolute) Konvergenz von n=1 an aus dem Majorantenkriterium (Satz (4.43)). Dafür wiederum genügt es zu zeigen, dass die Folge der Partialsummen Pp r−1 ≤ p < 2 r erfüllt ist. Dann gilt die n=1 cn beschränkt ist. Sei p ∈ N vorgegeben und r ∈ N so gewählt, dass 2 Abschätzung p X cn ≤ r 2X −1 k r−1 2X −1 X = cn r−1 X = bk ∞ X ≤ k=0 Sämtliche Partialsummen Pp n=1 cn a2 k = k=0 m=0 k=0 m=0 n=1 n=1 = c2k +m k r−1 2X −1 X bk < r−1 X 2k a2k k=0 +∞. k=0 sind also durch den endlichen Wert P∞ k=0 bk nach oben beschränkt. P∞ „⇒“ Diese Richtung beweisen wir durch Kontraposition: Wir setzen voraus, dass die Reihe k=0 bk divergiert und P∞ leiten daraus die Divergenz von n=1 an ab. Für alle k ∈ N0 und m ∈ N0 mit 0 ≤ m < 2k definieren wir c2k +m = a2k+1 . P∞ Auf Grund der Monotonie der Folge (an )n∈N gilt dann cn ≤ an für alle n ∈ N. Wenn wir zeigen können, dass n=1 cn P∞ divergiert, dann folgt die Divergenz von n=1 an aus dem Minorantenkriterium (Satz (4.44)). Sei p ∈ N mit p ≥ 2 Pp vorgegeben und r ∈ N so gewählt, dass 2 r ≤ p < 2 r+1 erfüllt ist. Dann erhalten wir für die Partialsumme n=1 cn die untere Abschätzung p X cn ≥ n=1 r 2X −1 = cn = r−1 X c2k +m = k=0 m=0 n=1 1 2 k r−1 2X −1 X 2 k+1 a2k+1 = k=0 k r−1 2X −1 X a2k+1 k=0 m=0 1 2 r−1 X bk+1 k=0 = 1 2 = r−1 X 2k a2k+1 k=0 r X ! bk − a1 . k=0 Pr bk auf Grund der Voraussetzung für r → ∞ gegen +∞ läuft, gilt auf Grund der Abschätzung Pp P∞ P∞ dasselbe für die Partialsumme n=1 cn für p → ∞. Also ist n=1 cn und damit auch n=1 an divergent. Weil die Summe k=0 —– 101 —– Als Anwendung des Verdichtungskriteriums beweisen wir, dass die Reihe P∞ n=1 n−α für jedes α ∈ Q mit α > 1 konvergiert. Setzen wir an = n−α für alle n ∈ N und θ = 21−α , so gilt 0 ≤ θ < 1 und ∞ X = 2k a2k k=0 P∞ ∞ X 2k k=0 1 ∞ X k 21−α = 2kα = k=0 ∞ X θ k. k=0 a2k mit der geometrischen Reihe zum Wert θ übereinstimmt und folglich konverP∞ giert. Nach dem Verdichtungskriterium ist damit auch n=1 an konvergent. (Aussage und Beweis sind auch für Die Rechung zeigt, dass k=0 2 k irrationale α ∈ R mit α > 1 gültig, Allerdings haben wir n−α für irrationales α noch nicht definiert, weil dafür der Stetigkeitsbegriff benötigt wird.) Gelegentlich wird bei Rechnungen mit einer Reihe P∞ an die Reihenfolge der Glieder an abgeändert, und es soll n=1 sichergestellt werden, dass diese Operation keine Auswirkung auf das Konvergenzverhalten und den Grenzwert der Reihe hat. Wenn bei der ursprünglichen Reihe absolute Konvergenz vorliegt, so ist dies tatsächlich der Fall. (4.50) Satz (Umordnungssatz) P∞ Sei n=1 an eine absolut konvergente Reihe. Ist τ : N → N eine bijektive Abbildung, dann ist P∞ auch die Reihe n=1 aτ(n) absolut konvergent, und es gilt ∞ X = an ∞ X aτ(n) . n=1 n=1 Für jedes n ∈ N sei An = {1, ..., n}, Bn = τ(An ) und bn = max Bn . Zunächst beweisen wir die absolute P∞ Konvergenz von n=1 aτ(n) . Es gilt Beweis: n X a τ(k) = k=1 Dies zeigt, dass die Folge X |ak | ≤ k∈Bn Pn k=1 |aτ(k) | bn X |ak | ≤ |an | < +∞. n=1 k=1 der Partialsummen von ∞ X P∞ n=1 aτ(n) beschränkt ist und die Reihe somit tatsäch- lich absolut konvergiert. Nun muss noch gezeigt werden, dass beide Reihen gegen denselben Wert konvergieren. Für jedes n ∈ N sei Pn Pn sn = k=1 ak und sn0 = k=1 aτ(k) . Nach den Grenzwertsätzen genügt es dazu, die Gleichung limn (sn − sn0 ) = 0 P∞ nachzuweisen. Sei also " ∈ R+ vorgegeben. Weil die Reihe n=1 an absolut konvergiert, gibt es ein N ∈ N mit ∞ X |ak | k=N +1 —– 102 < 1 ". 2 —– Weil die Abbildung τ surjektiv ist, existiert ein N 0 ≥ N mit BN 0 = τ(AN 0 ) ⊇ AN . Für alle n ≥ N 0 gilt dann ebenfalls Bn ⊇ AN , was zu AN = Bn ∩ AN äquivalent ist. Für solche n erhalten wir sn − sn0 X = ak − k∈An X X k∈Bn X ak + X ak − X ak = k∈Bn \AN X ak − ak . k∈Bn \AN k∈An \AN k∈Bn \AN k∈AN X ak − k∈Bn ∩AN = ak X ak − k∈An \AN X ak − X ak + k∈AN k∈An \AN k∈AN X = ak Es folgt |sn − sn0 | X ≤ X |ak | + |ak | ∞ X ≤ k=N +1 k∈Bn \AN k∈An \AN ∞ X |ak | + 1 " 2 < |ak | k=N +1 + 21 " = ". Weil " ∈ R+ beliebig vorgegeben war, folgt daraus limn (sn − sn0 ) = 0 wie gewünscht. Wir illustrieren an einem Beispiel, dass sich der Wert einer Reihe bei Umordnung ändern kann, wenn keine absolute, sondern nur „gewöhnliche“ Konvergenz vorliegt, die man auch als bedingte Konvergenz bezeichnet. Wie wir mit Hilfe des Leibniz-Kriteriums gezeigt haben, konvergiert die alternierende harmonische Reihe ∞ X 1 (−1)n+1 n n=1 ∞ X = 1 2k − 1 k=1 Sie konvergiert aber nicht absolut, denn die harmonische Reihe 1 − 2k P∞ n=1 |(−1) . n+1 1 | n = P∞ 1 20 + 1 n=1 n ist divergent. Summieren wir nun die alternierende harmonische Reihe in der umgeordneten Form 1− 1 2 − 1 4 + 1 3 − 1 6 − 1 8 + 1 5 − 1 10 − 1 12 + 1 7 − 1 14 − 1 16 + 1 9 − 1 18 − 1 11 − 1 22 − 1 24 + ... Anstatt auf einen ungerade (positiven) Term nur einen geraden (negativen) Term folgen zu lassen, ordnen wir ihm jeweils zwei gerade Terme zu. Insgesamt wird die Summe also in „Dreierblöcken“ organisiert, die in der Form 1 1 1 2−1 1 1 1 1 − − = − = 2 − 2k − 1 2(2k − 1) 4k 2(2k − 1) 2 · 2k 2k − 1 2k geschrieben werden können. Als Summe über diese Terme erhalten wir ∞ X k=1 1 2k − 1 − 1 2(2k − 1) − 1 4k = ∞ X 1 2 k=1 1 2k − 1 − 1 2k = 1 2 ∞ X 1 (−1)n+1 . n n=1 Gegenüber der herkömmlichen Reihenfolge hat sich der Grenzwert also halbiert. Eine wichtige, konkrete Anwendung der Theorie der konvergenten Reihen liegt in der Darstellung reeller Zahlen durch endliche oder unendliche Dezimalbrüche. Weil es keinen zusätzlichen Aufwand bedeutet, beschränken wir uns nicht auf die gewohnten Darstellungen zur Basis 10, sondern betrachten als Basis beliebige natürliche Zahlen b > 1. —– 103 —– (4.51) Definition Sei b ∈ N mit b > 1. Ein b-adischer Bruch ist eine Reihe der Form ∞ X an b−n n=−r wobei r ∈ Z sowie 0 ≤ an < b und an ∈ Z für alle n ∈ Z mit n ≥ −r gilt. Dabei bezeichnet man an als die n-te Stelle des b-adischen Bruchs. Symbolisch stellt man b-adische Brüche in der Form a−r ...a−1 a0 , a1 a2 ... dar. Für b = 10 erhält man so die bekannte Dezimaldarstellung reeller Zahlen. Zum Beispiel gilt 0, 33333... ∞ X = 3 · 10 −n ∞ X = n=1 −(n+1) 3 10 = 3 · 10 · ∞ X 10−n 3 10 = · n=0 n=0 1 1 10 1− Dabei haben wir im zweiten Schritt die Formel für den Wert der geometrische Reihe 3 10 = P∞ n=0 q n = · 10 9 1 1−q = 1 . 3 verwendet. Gibt es ein N mit an = 0 für n ≥ N , dann können diese Stellen bei der symbolischen Darstellung auch weggelassen werden, d.h. 0, 497 und 0, 49700000... bezeichnen denselben b-adischen Bruch. Sich periodisch wiederholende Stellen kennzeichnet man durch einen Überstrich: 0, 3 = 0, 33333... Wir betrachten einige weitere Beispiele. (i) Die 10-adischen Brüche 1, 0 und 0, 9 stellen beide die reelle Zahl 1 dar. Im zweiten Fall folgt dies aus der Rechnung 0, 9 = ∞ X −n = 9 · 10 9 10 ∞ X · n=1 1 10 n = 9 10 · n=0 1 1− 9 10 = 1 10 · 1 9 10 = 9 10 · 10 9 = 1. Dies zeigt, dass die Darstellung einer reellen Zahl als b-adischer Bruch jedenfalls nicht völlig eindeutig ist. (ii) Die b-adischen Darstellungen der reellen Zahl 1 7 lautet 0, 001 zur Basis b = 2. Zur Basis 10 erhalten wir 0, 142857 für b = 10, und 0, 1 zur Basis b = 7. Beweis: Wir rechnen lediglich nach, dass 0, 001 die 2-adische Darstellung von 1 7 ist, und überlassen den Rest dem Leser als Übungsaufgabe. Sei (an )n∈N die Folge der Stellen des 2-adischen Bruchs. Dann gilt a3k−2 = a3k−1 = 0 und P∞ a3k = 1 für alle k ∈ N. Für jedes n ∈ N sei sn die n-te Partialsumme der Reihe n=1 an 2−n . Wir erhalten ! ∞ n 2 X X X −n `−3k 0, 001 = an 2 = lim sn = lim s3n = lim a3k−` 2 n→∞ n=1 = ∞ X 2 X k=1 `=0 n→∞ ! a3k−` 2`−3k n→∞ k=1 `=0 ∞ X (a3k−2 22−3k + a3k−1 21−3k + a3k 2−3k ) = = k=1 ∞ X (4a3k−2 + 2a3k−1 + a3k )2−3k ∞ X (4 · 0 + 2 · 0 + 1)2−3k = k=1 = k=1 1 8 ∞ X k=0 8−k = 1 8 k=1 1 1− —– ∞ X 1 8 104 = —– 1 8 · 8 7 = 1 . 7 8−k = Dabei wurde im dritten Schritt Folgerung (4.24) angewendet: Ist die Folge (sn )n∈N konvergent, dann ist mit (sn )n∈N auch (s3n ) beschränkt, und kann wie (sn )n∈N nur einen Häufungspunkt besitzen, nämlich denselben wie (sn )n∈N . Daraus folgt, dass die Grenzwerte beider Folgen, sofern sie existieren, übereinstimmen müssen. Dass sie existieren, ergibt sich unabhängig von der Rechnung auch aus dem nachfolgenden Satz. (4.52) Satz Jeder b-adische Bruch konvergiert gegen eine reelle Zahl. Beweis: Sei (an )n≥−r die Folge der Stellen und (sn )n≥−r die Folge der Partialsummen der Reihe P∞ n=−r an b−n . Wir zeigen, dass (sn )n≥−r eine Cauchyfolge ist; die Konvergenz gegen ein a ∈ R ergibt sich dann aus Satz (4.28) Ist " ∈ R+ vorgegeben, dann bestimmen wir zunächst ein N ∈ N mit b−N < ". Seien nun n, m ∈ N mit m, n ≥ N gegeben, wobei wir n ≥ m voraussetzen. Dann gilt n X = |sn − sm | ak b−k n X ≤ k=m+1 ≤ (b − 1)b−k n−m−1 X b−k ≤ k=0 (b − 1)b−m−1 k=0 1 1− (b − 1)b−k−m−1 k=m+1 (b − 1)b−m−1 (b − 1)b−m−1 n−m−1 X ≤ ≤ k=0 (b − 1)b−m−1 = 1 b ∞ X ( 1b )k b b−1 = b−m < ". (4.53) Satz Jedes a ∈ R lässt sich in der Form ±s darstellen, wobei s den Wert eines b-adischen P∞ Bruchs n=−r an b−n bezeichnet. Beweis: Wir können uns auf den Fall beschränken, dass a ≥ 0 ist. Nach Satz (3.12) existiert ein r ∈ N mit b r+1 > a. Wir beweisen nun durch vollständige Induktion über n ≥ −r, dass es jeweils Zahlen a−r , a−r+1 , gibt, so dass für sn = Pn k=−r ..., ∈ an−1 , an {0, ..., b − 1} ak b−k jeweils die Abschätzungen sn ≤ a < sn + b−n erfüllt sind. Nach Voraussetzung ist 0 ≤ a < b r+1 . Um zunächst eine geeignete Zahl a−r zu bestimmen, betrachten wir die Unterteilung 0 < b r < 2b r < ... < (b − 1)b r < b · b r = b r+1 des Intervalls 0, b r+1 . Da a in diesem Intervall enthalten ist, gibt es ein eindeutig bestimmtes a−r ∈ {0, ..., b − 1} mit a−r b r ≤ a < (a−r + 1)b r . Für s−r = a−r b r ist die Bedingung s−r ≤ a < s−r + b r dann offenbar erfüllt. Gehen —– 105 —– wir nun davon aus, dass a−r , ..., an bereits konstruiert sind. Nach Induktionsvoraussetzung gilt sn ≤ a < sn + b−n für Pn sn = k=−r ak b−k . Wir betrachten nun die Unterteilung < sn sn + 1 · b−(n+1) < sn + (b − 1)b−(n+1) < ... sn + b−n < des Intervalls sn , sn + b−n . Wieder finden wir ein eindeutig bestimmtes an+1 mit sn + an+1 b−(n+1) ≤ sn + (an+1 + 1)b−(n+1) . < a Für sn+1 = sn + an+1 b−(n+1) gilt dann sn+1 ≤ a < sn+1 + b−(n+1) . Damit ist der Induktionsbeweis abgeschlossen. Für die konstruierte Folge (sn )n≥−r gilt nun limn sn = a. Wählen wir nämlich für ein vorgegebenes " ∈ R+ ein N ∈ N mit b−N < ", dann gilt für alle n ≥ N wegen sn ≤ a < sn + b−n die Abschätzung = |a − sn | < a − sn (sn + b−n ) − sn b−n = < ". (4.54) Lemma Sei (an )n∈N eine Folge mit an ∈ Z, an ≤ b − 1 für alle n ∈ N. Dann gilt im Falle P∞ der Konvergenz die Abschätzung n=1 an b−n ≤ 1, und Gleichheit genau dann, wenn an = b − 1 für alle n ∈ N ist. Beweis: Durch Proposition (4.35) erhalten wir zunächst die Abschätzung ∞ X an b−n ≤ n=1 ∞ X (b − 1)b−n = (b − 1) n=1 ∞ X b−n ∞ b−1 X = b n=1 b−1 1 b 1− 1 b = b−1 b · b b−1 = Die Rechnung zeigt, dass im Fall an = b − 1 für alle n ∈ N die Gleichung b−n = n=0 1. P∞ n=1 an b−n = 1 erfüllt ist. Setzen wir nun umgekehrt die Gleichung voraus und nehmen an, dass an0 < b − 1 für ein n0 ∈ N gilt. Dann folgt ∞ X an b−n = n=1 lim n→∞ n X ak b−k ≤ k=1 lim n→∞ nX 0 −1 n X k=1 k=n0 +1 (b − 1)b−k + an0 b−n0 + (b − 1)b−k = = n0 −1 n X X lim (b − 1)b−k + (b − 1)b−n0 + (b − 1)b−k + (an0 − b + 1)b−n0 n→∞ lim n→∞ k=n0 +1 k=1 n X (b − 1)b−k ! + (an0 − b + 1)b−n0 = 1 + (an0 − b + 1)b−n0 < 1 k=1 im Widerspruch zur angenommenen Gleichung. —– 106 —– Der folgende Satz zeigt, inwieweit die Darstellung von reellen Zahlen als b-adische Brüche eindeutig ist. (4.55) Satz Seien c, d ∈ R, c, d ≥ 0 und c = P∞ n=−r cn b −n ,d = P∞ n=−r dn b−n Darstellungen dieser Zahlen als b-adische Brüche. Genau dann gilt c = d, wenn einer der folgenden drei Bedingungen für die b-adischen Brüche zutrifft: (i) Es gilt cn = dn für alle n ∈ Z, n ≥ −r (ii) Es gibt ein N ∈ Z, N ≥ −r, so dass cn = dn für alle n < N , dN = cN + 1 und cn = b − 1, dn = 0 für alle n > N . (iii) Es gibt ein N ∈ Z, N ≥ −r, so dass cn = dn für alle n < N , cN = dN + 1 und cn = 0, dn = b − 1 für alle n > N . Beweis: „⇐“ Im Fall (i) ist die Identität c = d klar, denn gleiche Reihen konvergieren gegen denselben Wert. Im zweiten Fall erhalten wir die Identität durch die Rechnung = d−c ∞ X (dn − cn )b−n = b +b −(N +1) (1 − b) (1 − b)b−n = n=N +1 n=N −N ∞ X b−N + ∞ X b−n = b−N + n=0 1− b b N +1 · b = b−1 b−N − b−N = 0. Die Rechnung im Fall (iii) läuft vollkommen analog. „⇒“ Sei c = d vorausgesetzt. Angenommen, die b-adischen Brüche P∞ n=−r cn b −n und P∞ n=−r dn b−n sind nicht identisch, und N ∈ Z mit N ≥ −r ist minimal mit der Eigenschaft cN 6= dN . Betrachten wir zunächst den Fall, dass cN < dN ist. Durch Umformungen erhalten wir c=d≡ ∞ X (dn − cn )b−n = 0 ≡ (dN − cN )b−N + ∞ X (dn − cn )b−n = 0 n=N +1 n=−r ≡ ∞ X (cN +n − dN +n )b−n = dN − cN n=1 Wegen 0 ≤ cN +n , dN +n < b gilt für die Differenzen cN +n − dN +n ≤ b − 1. Nach Lemma (4.54) folgt dN − cN ≤ 1, also dN − cN = 1 auf Grund der Annahme cN < dN . Nochmalige Anwendung von Lemma (4.54) liefert cN +n = b − 1 und dN +n = 0 für alle n ∈ N, d.h. die Bedingung (ii) ist erfüllt. Genauso führt die Annahme cN > dN auf Bedingung (iii). —– 107 —– Für jede Basis b findet man Zahlen x ∈ R mit zwei verschiedenen Darstellungen als b-adische Brüche. Andererseits gibt es immer auch Zahlen mit nur einer b-adischen Darstellung. Ist zum Beispiel b = 10, dann sind durch 1, 5 zwei Darstellungen von x = 3 2 = 1, 50 und 1, 49 als 10-adischer Bruch gegeben. gegeben. Dagegen ist die Darstellung von x = 2 3 zur Basis 10 eindeutig bestimmt, nämlich gleich 0, 6. Für b = 2 erhalten wir durch 1, 0 und 0, 1 zwei verschiedene Darstellungen von x = 1. Die Darstellung von x = 1 5 gegeben durch 0, 0011 ist wiederum eindeutig bestimmt. Man kann sich mit Hilfe von Satz (4.55) leicht überlegen, dass das Problem der Mehrdeutigkeit grundsätzlich nur bei rationalen Zahlen auftreten kann: Eine reelle Zahl mit einer abbrechenden Dezimalbruchentwicklung, für die also ein N ∈≥ −r mit cn = 0 für alle n ≥ N existiert, ist stets eine rationale Zahl. —– 108 —– § 5. Stetigkeit Inhaltsübersicht Nachdem wir uns im letzten Kapitel ausführlich mit Grenzwerten von Folgen beschäftigt haben, wird dieses Konzept nun hier verwendet, um Grenzwerte von Funktionen zu definieren. Intuitiv bedeutet die Gleichung lim x→a f (x) = c für eine Funktion f , dass sich f (x) dem Wert c nähert, wenn x dem Wert a angenähert wird. Präzise definiert man dies mit Hilfe der Folgenkonvergenz. Die Funktion f wird stetig im Punkt a genannt, wenn a zum Definitionsbereich von f gehört und die Gleichung lim x→a f (x) = f (a) erfüllt ist. In der Schulmathematik wird dies meist durch die Formulierung umschrieben, dass die Funktion f an der Stelle a nicht „springt“. Zunächst betrachten wir eine Reihe von Beispielen für Grenzwerte und Stetigkeit und beschäftigen wir uns mit der Frage, wie Grenzwerte von Funktionen berechnet bzw. wie sich die Stetigkeit einer Funktion nachweisen lässt. Anschließend leiten wir mit zwei zentrale Sätze über stetige Funktionen her: den Zwischenwertsatz und das Maximumsprinzip. Zum Abschluss werden diese Sätze für die Definition der Exponential- und Logarithmusfunktionen verwendet. Sei D ⊆ R. Wir erinnern daran, dass eine (reellwertige) Funktion auf D nichts weiter als eine Abbildung f : D → R ist. Dabei bezeichnet man D als den Definitionsbereich von f . Folgende Beispiele für Funktionen werden wir im Laufe der Vorlesung immer wieder aufgreifen. (i) Sei c ∈ R. Dann ist die Abbildung f : R → R, x 7→ c die konstante Funktion mit dem Wert c. 3 2 1 x −3 −2 −1 1 2 3 (ii) Die identische Abbildung id : R → R, x 7→ x ist eine Funktion. 3 2 1 x −3 −2 −1 1 −1 −2 −3 —– 109 —– 2 3 (iii) Die Betragsfunktion abs : R → R ist gegeben durch x 7→ |x|. 3 2 1 x −3 −2 −1 1 2 3 (iv) Für jedes x ∈ R definieren wir die untere Gaußklammer durch bxc = max {r ∈ Z | r ≤ x}. Dann ist durch die Zuordnung x 7→ bxc ebenfalls eine Funktion auf ganz R definiert. 3 2 1 x −3 −2 −1 1 2 3 −1 −2 −3 −4 (v) Die Zuordnungen R → R gegeben durch x 7→ 2x 2 + 1 und x 7→ x 3 − 3x 2 + 5x + 1 sind reellwertige Funktionen. Allgemeiner bezeichnet man eine Abbildung der Form x 7→ m X ak x k mit m ∈ N0 , a0 , ..., am ∈ R k=0 als (reellwertige) Polynomfunktion. (vi) Seien f , g : R → R Polynomfunktionen und D = {x ∈ R | g(x) 6= 0}. Eine Abbildung der Form h : D −→ R , x 7→ f (x) g(x) wird (reelle) rationale Funktion genannt. Konkrete Beispiele für rationale Funktionen sind R −→ R, x 7→ 1 und x2 + 1 —– 110 R \ {−1, 1} −→ R, —– x 7→ 3x + 5 x2 − 1 . Sei D ⊆ R eine beliebige Teilmenge. Eine Folge (x n )n∈N reeller Zahlen bezeichnen wir als Folge in D, wenn x n ∈ D für alle n ∈ N gilt. (5.1) Definition Sei D ⊆ R und a ∈ R̄. Man nennt a einen Häufungspunkt von D, wenn eine Folge in D \ {a} existiert, die (eventuell uneigentlich) gegen a konvergiert. Einen Punkt a ∈ D, der kein Häufungspunkt von D ist, nennt man einen isolierten Punkt von D. Ist beispielsweise D = ]0, 1]∪{2, 3}, dann ist [0, 1] die Menge der Häufungspunkte von D, während 2 und 3 isolierte Punkte sind. Das Beispiel zeigt, dass die Häufungspunkte einer Menge D nicht unbedingt in D enthalten sein müssen. Ein Häufungspunkt a von D mit a ∈ / D wird auch Berührpunkt der Menge D genannt. (5.2) Proposition Sei D ⊆ R, a ∈ R̄ und Da = D \ {a}. (i) Im Fall a ∈ R ist a genau dann ein Häufungspunkt von D, wenn für jedes " ∈ R+ ein x ∈ Da mit |x − a| < " existiert. (ii) Der Punkt a = +∞ ist genau dann Berührpunkt von D, wenn für jedes κ ∈ R+ ein x ∈ D mit x > κ existiert. (iii) Der Punkt a = −∞ ist genau dann Berührpunkt von D, wenn für jedes κ ∈ R+ ein x ∈ D mit x < −κ existiert. Beweis: zu (i) Ist a ein Häufungspunkt von D, so gibt es eine Folge (x n )n∈N in Da mit limn x n = a. Für „⇒“ + vorgegebenes " ∈ R existiert insbesondere ein n ∈ N mit |x n − a| < ", und x n liegt in Da . „⇐“ Erfüllt der Punkt a die angegebene Voraussetzung, so gibt es insbesondere für jedes n ∈ N ein x n ∈ Da mit |x n − a| < 1n . Somit ist (x n )n∈N eine Folge in Da . Wir zeigen, dass limn x n = a gilt. Ist " ∈ R+ vorgegeben, dann gibt es ein N ∈ N mit Es folgt |x n − a| < 1 n ≤ 1 N 1 N < ". < " für alle n ≥ N und damit die Behauptung. zu (ii) „⇒“ Ist +∞ ein Berührpunkt von D, dann gibt es eine Folge (x n )n∈N in D mit der Eigenschaft limn x n = +∞. Ist κ ∈ R+ vorgegeben, dann gibt es insbesondere ein n ∈ N mit x n > κ, und x n liegt in D. „⇐“ Erfüllt D die angegebene Voraussetzung, so exstiert insbesondere für jedes n ∈ N ein x n ∈ D mit x n > n. Durch (x n )n∈N ist dann also eine Folge in D gegegeben. Ist κ ∈ R+ , dann gibt es ein N ∈ N mit N > κ, und es folgt x n > n ≥ N > κ für alle n ≥ N . Damit ist limn x n = +∞ bewiesen. Der Beweis von (iii) verläuft weitgehend analog. (5.3) Definition Seien D ⊆ R, f : D → R eine Funktion und a, c ∈ R̄. Ist a ein Berührpunkt von D, und gilt für jede Folge (x n )n∈N in D die Implikation lim x n = a ⇒ lim f (x n ) = c so bezeichnet man c als Grenzwert von f im Punkt a. —– 111 —– , Falls a oder c in {−∞, +∞} liegen, spricht man genauer von einem uneigentlichen, sonst von einem eigentlichen Grenzwert der Funktion f . Grundsätzlich kann f : D → R nur einen (eigentlichen oder uneigentlichen) Grenzwert im Punkt a besitzen. Sind nämlich c, d ∈ R̄ beides Grenzwerte von f im Punkt a, und ist (x n )n eine Folge in D mit lim x n = a, so muss = c lim f (x n ) n→∞ = gelten. d Deshalb ist es gerechtfertigt, im Fall der Existenz für den Grenzwert von f im Punkt a die Bezeichnung lim f (x) x→a einzuführen. Es ist aber durchaus möglich, dass f : D → R in einem Punkt a ∈ R̄ keinen eigentlichen oder uneigentlichen Grenzwert besitzt, selbst wenn es sich bei a um einen Berührpunkt von D handelt. Als Beispiel betrachten wir die Signumsfunktion sgn : R → R gegeben durch 2 sgn(x) = −1 0 1 für x < 0 1 für x = 0 x −3 für x > 0. −2 −1 1 2 3 −1 −2 Sei f = sgn| D die Einschränkung von sgn auf die Menge D = R \ {0}. Nehmen wir an, dass c ∈ R̄ der Grenzwert von f im Punkt a = 0 ist. Die beiden Folgen (x n )n und ( yn )n gegeben durch x n = 1 n und yn = − 1n für alle n ∈ N liegen beide in D und konvergieren gegen Null. Nach Definition des Grenzwerts müsste also sowohl c = lim f (x n ) n→∞ = lim f ( 1n ) n→∞ = = lim 1 n→∞ 1 als auch c = lim f ( yn ) n→∞ = lim f (− 1n ) n→∞ = lim (−1) n→∞ = −1 gelten. Der resultierende Widerspruch 1 = c = −1 lässt nur den Schluss zu, dass der Grenzwert lim f (x) nicht x→0 existiert. Wir studieren den Grenzwertbegriff für Funktionen anhand von einigen weiteren Beispielen. Beispiel 1: Sei die Funktion f : R+ → R gegeben durch x 7→ 1x . Dann gilt 3 2 lim f (x) = +∞ x→0 und lim f (x) = 0. x→+∞ 1 x 1 —– 112 —– 2 3 Beweis: Für den Nachweis der ersten Gleichung bemerken wir zunächst, dass 0 ein Berührpunkt von D = R+ ist. Ist nämlich (an )n∈N gegeben durch an = 1 n für alle n ∈ N, dann liegen alle Folgenglieder in D, und es gilt limn an = 0; außerdem ist 0 ∈ / D. Sei nun (x n )n∈N eine beliebige Folge in D mit limn x n = 0. Zu zeigen ist limn f (x n ) = +∞. Sei dazu κ ∈ R+ vorgegeben. Wegen limn x n = 0 gibt es ein N ∈ N mit |x n | < κ−1 für alle n ≥ N . Weil die Folge (x n )n∈N in D liegt, gilt x n > 0 und somit |x n | = x n für alle n ∈ N. Somit erhalten wir für alle n ≥ N die Abschätzung f (x n ) = x n−1 = |x n |−1 > (κ−1 )−1 = κ. Weil κ ∈ R+ beliebig vorgegeben war, ist damit limn f (x n ) = +∞ bewiesen. Überprüfen wir nun den zweiten Grenzwert. Zunächst stellen wir fest, dass +∞ ein Berührpunkt von D ist, denn die Folge (an )n∈N gegeben durch an = n für alle n ∈ N liegt in D und konvergiert gegen +∞. Sei nun (x n )n∈N eine beliebige Folge in D mit limn x n = +∞. Zu zeigen ist limn f (x n ) = 0. Sei dazu " ∈ R+ vorgegeben. Wegen limn x n = +∞ gibt es ein N ∈ N mit x n > " −1 für alle n ≥ N . Wegen x n > 0 gilt auch f (x n ) = x n−1 > 0 und somit | f (x n )| = f (x n ) für alle n ∈ N. Insgesamt erhalten wir | f (x n )| = f (x n ) = x n−1 < " für alle n ≥ N . Beispiel 2: Wir betrachten die Funktion f auf dem Definitionsbereich D = [0, 1[ ∪ ]1, 2[ ∪ {3} gegeben durch 5 4 f (x) = x +1 3− x 5 für 0≤ x <1 3 für 1< x <2 2 für x = 3. 1 x 1 2 3 Dann gilt lim f (x) = 2, und der Grenzwert lim f (x) existiert nicht. x→1 Beweis: x→3 Für den ersten Grenzwert müssen wir zunächst überprüfen, dass 1 ein Berührpunkt von D ist. Sei (an )n∈N durch an = 1 − 1 n für alle n ∈ N gegeben. Dann gilt 0 ≤ an < 1 und somit an ∈ [0, 1[ ⊆ D für alle n ∈ N. Außerdem gilt 1 ∈ / D und limn an = 1. Sei nun (x n )n∈N eine beliebige Folge in D mit limn x n = 1. Zu zeigen ist limn f (x n ) = 2. Sei dazu " ∈ R+ vorgegeben. Wegen limn x n = 1 gibt es ein N ∈ N mit |x n − 1| < min{1, "} für alle n ≥ N . Sei nun n ∈ N mit n ≥ N vorgegeben. Wegen |x n − 1| < 1 gilt 0 < x n < 2. Wir unterscheiden zwei Fälle. Ist x n > 1, dann gilt 1 < x n < 2 und somit f (x n ) = 3 − x n . Daraus folgt | f (x n ) − 2| = |(3 − x n ) − 2| —– = | − (x n − 1)| 113 —– = |x n − 1| < ". Ist x n < 1, dann gilt 0 < x n < 1 und f (x n ) = x n + 1. Wir erhalten | f (x n ) − 2| = |x n + 1 − 2| = < |x n − 1| ". Also ist | f (x n ) − 2| < " für alle n ≥ N erfüllt und damit limn f (x n ) = 2 bewiesen. Der Grenzwert lim f (x) existiert x→3 nicht, weil 3 in D enthalten und damit kein Berührpunkt von D ist. Sei D ⊆ R und a ein Berührpunkt von D. Für jedes c ∈ R sei f c : D → R die konstante Funktion Beispiel 3: gegeben durch f c (x) = c für alle x ∈ D. Dann gilt lim f c (x) = c lim id D (x) = a. und x→a x→a Sei (x n )n∈N eine beliebige Folge in D mit limn x n = a. Dann gilt Beweis: lim f c (x n ) = lim c = c n→∞ lim id D (x n ) = lim x n = a. und n→∞ n→∞ n→∞ (5.4) Proposition Sei f eine Polynomfunktion gegeben durch f : R −→ R , x 7→ x m + am−1 x m−1 + ... + a1 x + a0 mit m ∈ N0 und a0 , ..., am−1 ∈ R. (i) Ist m gerade, dann gilt lim f (x) = lim f (x) = +∞. x→−∞ x→+∞ (ii) Für ungerades m gilt lim f (x) = +∞ und lim f (x) = −∞. x→−∞ x→+∞ Beweis: Wir beschränken uns auf Teil (i) und die Bestimmung des ersten Grenzwertes. Zunächst schätzen wir die Funktionswerte f (x) für x > 1 nach unten ab. Für solche x können wir die Funktion f in der Form f (x) = x m (1 + g(x)) schreiben, mit g(x) am−1 = x + ... + a0 xm = m−1 X ak k=0 x m−k . Sei nun c = max{ 2m|ak | | 0 ≤ k < m}. Ist x ∈ R mit x > c und x > 1, so erhalten wir |x| > 2m|ak | für 0 ≤ k < m. Für alle k mit ak 6= 0 gilt |ak | |x| und offensichtlich ist |g(x)| = |ak | |x| ≤ 1 2m < |ak | 2m|ak | = 1 2m , auch im Fall ak = 0 erfüllt. Wir erhalten somit m−1 X ak k=0 x m−k ≤ m−1 X k=0 a k x m−k ≤ m−1 X |ak | k=0 |x| ≤ m−1 X k=0 1 2m = m· 1 2m insbesondere g(x) > − 21 . Dies wiederum bedeutet f (x) = x m (1 + g(x)) > x m (1 + (− 12 )) = max{1, c}. —– 114 —– = 1 m x 2 1 2 , für alle x > Für den Nachweis des Grenzwerts bemerken wir zunächst, dass +∞ ein Berührpunkt von D = R ist, denn (an )n∈N gegeben durch an = n für alle n ∈ N ist eine Folge in D mit limn an = +∞. Sei nun (x n )n∈N eine beliebige Folge in D, die gegen +∞ konvergiert. Zu zeigen ist limn f (x n ) = +∞. Sei dazu κ ∈ R+ vorgegeben. Dann gibt es ein N ∈ N mit x n > max{1, c, 2κ} für alle n ≥ N . Auf Grund unserer Überlegungen aus dem ersten Teil des Beweises folgt f (x n ) 1 m x 2 n > 1 x 2 n ≥ ≥ 1 (2κ) 2 = κ für alle n ∈ N mit n ≥ N . (5.5) Definition Seien D ⊆ R und f , g : D → R Funktionen auf D. Dann bezeichnet man die Funktionen f + g und f g auf D gegeben durch ( f + g)(x) = f (x) + g(x) und ( f g)(x) = f (x)g(x) für x ∈ D als Summe bzw. Produkt von f und g. Gilt zusätzlich g(x) 6= 0 für alle x ∈ D, dann definiert man f g Die Funktion f g (x) = f (x) x ∈ D. für alle g(x) wird der Quotient von f und g genannt. (5.6) Proposition Seien D ⊆ R, f , g : D → R, und sei a ∈ R̄ ein Berührpunkt von D. Wenn die Grenzwerte lim f (x) und x→a lim g(x) x→a beide existieren und in R liegen, also endlich sind, dann gilt lim ( f + g)(x) = lim f (x) + lim g(x) x→a x→a lim ( f g)(x) = und x→a x→a insbesondere existieren diese Grenzwerte. Ist der Quotient 0, so gilt auch lim x→a Beweis: f g (x) f g lim f (x) lim g(x) . x→a x→a auf D definiert, und ist lim g(x) 6= x→a lim f (x) x→a = lim g(x) . x→a Alle Aussagen lassen sich aus den Grenzwertsätzen ableiten. Wir demonstrieren dies am Beispiel der Funktion f + g. Sei (x n )n∈N eine Folge in D mit limn x n = a. Durch Anwendung von Satz (4.7) erhalten wir lim ( f + g)(x n ) n→∞ = lim f (x n ) + g(x n ) = n→∞ lim f (x n ) + lim g(x n ) n→∞ n→∞ Damit ist die Gleichung lim ( f + g)(x) = lim f (x) + lim g(x) bewiesen. x→a x→a x→a —– 115 —– = lim f (x) + lim g(x). x→a x→a (5.7) Definition Seien D ⊆ R, f : D → R und a ∈ D. Man sagt, die Funktion f ist stetig im Punkt a, wenn für jede Folge (x n )n in D die Implikation lim x n = a n→∞ ⇒ lim f (x n ) = f (a) gilt. n→∞ Die Funktion f wird stetig genannt, wenn sie in jedem Punkt von D stetig ist. (5.8) Proposition Seien D ⊆ R, a ∈ D, Da = D \ {a} und f˜ = f | Da . Dann sind die folgenden beiden Aussagen äquivalent. (i) Die Funktion f ist stetig in a. (ii) Es gilt lim f˜(x) = f (a), oder a ist in D ein isolierter Punkt. x→a Beweis: „(i) ⇒ (ii)“ Ist a ein isolierter Punkt von D, dann brauchen wir nichts zu zeigen. Nehmen wir nun an, dass a ein Häufungspunkt von D ist. Dann ist a ein Berührpunkt der Menge Da . Sei (x n )n∈N eine Folge in Da mit limn x n = a. Dann ist (x n )n∈N erst recht eine Folge in D, und nach Definition der Stetigkeit gilt lim f˜(x n ) n→∞ = lim f (x n ) = n→∞ f (a). Damit ist lim f˜(x) = f (a) bewiesen. x→a „(ii) ⇒ (i)“ Betrachten wir zunächst den Fall, dass a ein isolierter Punkt von D ist. Sei (x n )n∈N eine Folge in D mit limn x n = a. Nach Proposition (5.2) gibt es ein " ∈ R+ , so dass |x − a| < " für kein x ∈ Da erfüllt ist. Sei nun N ∈ N so gewählt, dass |x n − a| < " für alle n ≥ N gilt. Für jedes n ∈ N mit n ≥ N gilt dann x n ∈ D \ Da , also x n = a. Es folgt f (x n ) = f (a) für alle n ≥ N und damit insbesondere limn f (x n ) = f (a). Sei nun a ein Häufungspunkt von D und wiederum (x n )n∈N eine Folge in D mit limn x n = a. Auf Grund der Häufungspunkt-Eigenschaft gibt es nach Proposition (5.2) für jedes n ∈ N ein yn ∈ Da mit | yn − a| < definieren eine neue Folge (x n0 ) 1 . n Wir in Da durch x n0 = xn falls x n ∈ Da falls xn = a yn und überprüfen, dass auch diese Folge gegen a konvergiert. Sei " ∈ R+ vorgegeben. Wegen limn x n = a gibt es ein 1 < " ist, und N N2 0 |x n − a| = | yn − a| N1 ∈ N mit |x n − a| < " für alle n ≥ N1 . Sei N2 ∈ N so gewählt, dass mit n ≥ N , dann gilt Damit ist limn x n0 |x n0 − a| = |x n − a| < " im Fall x n ∈ Da und = a bewiesen, und auf Grund der Voraussetzung gilt lim f (x n0 ) n→∞ = lim f˜(x n0 ) n→∞ = = max{N1 , N2 }. Ist nun n ∈ N < 1 n ≤ 1 N2 < " im Fall x n = a. f (a). Nun zeigen wir, dass daraus limn f (x n ) = f (a) folgt. Sei " ∈ R+ vorgegeben. Wegen limn f (x n0 ) = f (a) gibt es ein N ∈ N mit | f (x n0 ) − f (a)| < " für alle n ≥ N . Für jedes n ≥ N gilt entweder x n = x n0 oder x n = a. Im ersten Fall ist | f (x n ) − f (a)| = | f (x n0 ) − f (a)| < "; im zweiten Fall ist diese Abschätzung wegen | f (x n ) − f (a)| = | f (a) − f (a)| = 0 ebenfalls erfüllt. Damit haben wir limn f (x n ) = f (a) nachgewiesen. —– 116 —– Wir betrachten einige Beispiele für stetige Funktionen. (i) Jede konstante Funktion auf einer beliebigen Teilmenge D ⊆ R ist stetig. Beweis: Sei a ∈ D beliebig vorgegeben und (x n )n∈N eine Folge in D mit limn x n = a. Dann folgt limn f (x n ) = limn c = c = f (a). Weil die Folge beliebig vorgegeben war, folgt daraus die Stetigkeit von f im Punkt a. (ii) Für jede Teilmenge D ⊆ R ist die identische Abbildung id D stetig. Beweis: Sei a ∈ D und (x n )n∈N eine Folge in D mit limn x n = a. Dann gilt limn id D (x n ) = limn x n = a = id D (a). Also ist id D im Punkt a stetig. (iii) Die Funktion abs : R → R, x 7→ |x| ist stetig. Beweis: Sei a ∈ R und (x n )n∈N eine Folge in R mit limn x n = a. In den Übungen haben wir gezeigt, dass für beliebige x, y ∈ R jeweils ||x| − | y|| ≤ |x − y| gilt. Damit zeigen wir, dass limn abs(x n ) = abs(a) erfüllt ist. Sei " ∈ R+ vorgegeben. Wegen limn x n = a gibt es ein N ∈ N mit |x n − a| < " für alle n ≥ N . Es folgt |abs(x n ) − abs(a)| = ||x n | − |a|| ≤ |x n − a| < " für alle n ≥ N . Weil " ∈ R+ beliebig vorgegeben war, ist damit limn abs(x n ) = abs(a) bewiesen. (iv) Die Signumsfunktion sgn : R → R ist im Punkt 0 unstetig, in allen übrigen Punkten stetig. Beweis: xn = 1 n Zunächst beweisen wir die Unstetigkeit im Punkt 0 und betrachten dazu die Folge (x n )n∈N gegeben durch für alle n ∈ N. Es gilt limn x n = limn lim sgn(x n ) n→∞ 1 n = 0. Wegen x n > 0 gilt sgn(x n ) = 1 für alle n ∈ N. Daraus folgt = lim 1 n→∞ = 1 6= 0 = sgn(0). Also ist die Stetigkeitsbedingung im Punkt 0 nicht erfüllt. Sei nun a ∈ R+ . Wir müssen zeigen, dass die Abbildung sgn in a stetig ist und betrachten dazu eine beliebige reelle Folge (x n )n∈N mit limn x n = a. Für " = a ∈ R+ existiert auf Grund der Konvergenz ein N ∈ N mit |x n − a| < " für alle n ≥ N . Insbesondere gilt x n > a − " = a − a = 0 für alle n ≥ N . Aus x n > 0 folgt sgn(x n ) = 1 für alle n ≥ N1 und somit limn sgn(x n ) = 1 = sgn(a). Sei nun a ∈ R negativ und (x n )n∈N eine reelle Folge, die gegen a konvergiert. Für " = −a ∈ R+ gibt es ein N ∈ N mit |x n − a| < " für alle n ≥ N . Dies bedeutet x n < a + " = a + (−a) = 0 und somit sgn(x n ) = −1 für alle n ≥ N . Es folgt limn sgn(x n ) = −1 = sgn(a). —– 117 —– Ist D ⊆ R und a ∈ D ein isolierter Punkt, so ist jede Funktion f : D → R in a stetig. Denn in diesem Fall gibt es keine Folge (x n )n∈N in Da , die gegen a konvergiert. Die Implikation limn x n = a ⇒ limn f (x n ) = f (a) ist damit für jede Folge in D erfüllt. (5.9) Proposition Seien D ⊆ R, f , g : D → R, und sei a ∈ D. Wenn die Funktionen f und g im Punkt a stetig sind, dann gilt dasselbe für f + g und f g. Ist der Quotient so ist auch f g f g auf D definiert, in a stetig. Wir beschränken uns auf den Nachweis für die Funktion f + g. Ist a ∈ D ein isolierter Punkt von D, dann ist f + g in a auf jeden Fall stetig. Andernfalls ist a ein Berührpunkt der Menge Da = D \ {a}. Setzen wir f˜ = f | Da Beweis: und g̃ = g| Da , dann folgt aus Proposition (5.8) und der Stetigkeit von f und g im Punkt a, dass lim f˜(x) = x→a f (a) und lim g̃(x) x→a = g(a) gilt. Durch Anwendung von Proposition (5.6) erhalten wir lim ( f˜ + g̃)(x) x→a = lim f˜(x) + lim g̃(x) x→a x→a = f (a) + g(a) = ( f + g)(a). Wiederum auf Grund von Proposition (5.8) bedeutet dies, dass f + g im Punkt a stetig ist. (5.10) Folgerung Alle Polynomfunktionen und rationalen Funktionen sind jeweils auf ihrem gesamten Definitionsbereich stetig. Beweis: Dies folgt aus Proposition (5.9) und der Tatsache, dass alle rationalen Funktionen sich durch Addition, Multiplikation und Division aus der Identität id und den konstanten Funktionen zusammensetzen lassen. Reellwertige Funktionen lassen sich auch durch Komposition gegebener Funktionen definieren (siehe Abschnitt §3). Sind D, E ⊆ R und f : D → R, g : E → R Funktionen mit f (D) ⊆ E, dann ist auch g ◦ f eine reellwertige Funktion auf D. Ist zum Beispiel f = abs und g : R → R gegeben durch g(x) = x 3 + 3x + 5 für alle x ∈ R, dann sind die Kompositionen g ◦ abs und abs ◦ g gegeben durch (g ◦ abs)(x) = g(|x|) = |x|3 + 3|x| + 5 (abs ◦ g)(x) = |g(x)| = |x 3 + 3x + 5| und für alle x ∈ R. (5.11) Proposition Seien f : D → R und g : E → R stetige Funktionen mit f (D) ⊆ E. Dann ist auch die Funktion (g ◦ f ) : D → R stetig. Beweis: Sei a ∈ D und (x n )n∈N eine Folge in D mit lim x n = a. Wegen der Stetigkeit von f gilt dann lim f (x n ) = n→∞ n→∞ f (a). Nun ist durch yn = f (x n ) eine Folge in E mit lim yn = f (a) gegeben. Die Stetigkeit von g im Punkt f (a) n→∞ liefert dann lim (g ◦ f )(x n ) n→∞ = lim g( yn ) n→∞ = g( f (a)) = (g ◦ f )(a). Also sind x 7→ |x|3 + 3|x| + 5 und x 7→ |x 3 + 3x + 5| beides stetige Funktionen. —– 118 —– Häufig verwendet man auch das folgende äquivalente Kriterium, um die Stetigkeit einer Funktion zu untersuchen. (5.12) Satz ("-δ-Kriterium) Sei f : D → R eine Funktion und a ∈ D. Genau dann ist f stetig in a, wenn für jedes " ∈ R+ ein δ ∈ R+ existiert, so dass die Implikation |x − a| < δ Beweis: „⇐“ ⇒ | f (x) − f (a)| < " für alle x∈D erfüllt ist. Nehmen wir an, dass "-δ-Kriterium ist erfüllt. Sei (x n )n∈N eine Folge in D mit lim x n = a. Wir n→∞ müssen zeigen, dass lim f (x n ) = f (a) erfüllt ist. Sei dazu " > 0 vorgegeben. Dann gibt es auf Grund unseres n→∞ Kriteriums ein δ > 0, so dass aus |x − a| < δ stets | f (x) − f (a)| < " folgt, für alle x ∈ D. Wegen lim x n = a gibt es n→∞ ein N ∈ N, so dass |x n − a| < δ für alle n ≥ N erfüllt ist. Dann gilt aber auch | f (x n ) − f (a)| < " für alle n ∈ N mit n ≥ N . Damit haben wir lim f (x n ) = f (a) bewiesen. n→∞ „⇒“ Angenommen, die Funktion f ist in a stetig, aber das "-δ-Kriterium ist nicht erfüllt. Dann gibt es ein " > 0 mit der Eigenschaft, dass für jedes δ > 0 ein x ∈ D mit |x − a| < δ und | f (x) − f (a)| ≥ " existiert. Speziell finden wir für jedes n ∈ N ein x n ∈ D mit |x n − a| < 1 n und | f (x n ) − f (a)| ≥ ". Für die Folge (x n )n∈N gilt dann offenbar lim x n = a, wegen | f (x n ) − f (a)| ≥ " für alle n ∈ N konvergiert die Folge n→∞ f (x n ) aber nicht gegen f (a). Dies widerspricht unserer Annahme, dass f im Punkt a stetig ist. Ein ähnliches Kriterium lässt sich auch für Funktionsgrenzwerte formulieren. (5.13) Satz Seien D ⊆ R, f : D → R eine Funktion und a, c ∈ R̄, wobei a ein Berührpunkt von D sei. Unter diesen Voraussetzungen gilt lim f (x) = c genau dann, wenn für jede Umgebung V x→a von c eine Umgebung U von a mit f (U) ⊆ V existiert. Beweis: „⇐“ Sei (x n )n∈N eine Folge in D mit limn x n = a und V eine Umgebung von c. Wir müssen zeigen, dass ein N ∈ N mit f (x n ) ∈ V für alle n ≥ N existiert, denn dann ist limn f (x n ) = c erfüllt. Nun gibt es nach Voraussetzung eine Umgebung U von a mit f (U) ⊆ V . Wegen limn x n = a existiert ein N ∈ N mit x n ∈ U für alle n ≥ N . Daraus folgt f (x n ) ∈ f (U) ⊆ V für alle n ≥ N . „⇒“ Nehmen wir an, das lim x→a f (x) = c erfüllt ist, aber andererseits eine Umgebung V von c existiert mit der Eigenschaft, dass f (U) 6⊆ V für alle Umgebungen U von a gilt. Im Fall a ∈ R gibt es dann für jedes n ∈ N ein x n in der Umgebung Un = a − 1n , a + 1n von a mit f (x n ) ∈ / V . Ist a = +∞, dann existiert für jedes n ∈ N ein x n ∈ ]n, +∞[ —– 119 —– mit f (x n ) ∈ / V . Im Fall a = −∞ finden für jedes n ∈ N ein x n ∈ ]−∞, −n[ mit f (x n ) ∈ / V . In jedem der drei Fälle gilt dann limn x n = a, aber es existiert kein N ∈ N mit f (x n ) ∈ V für alle n ≥ N . Folglich konvergiert ( f (x n ))n∈N weder eigentlich noch uneigentlich gegen c. Dies steht zur Voraussetzung lim x→a f (x) = c im Widerspruch. Im zweiten Teil dieses Kapitels beweisen wir nun einige wichtge Sätze über stetige Funktionen. (5.14) Satz (Zwischenwertsatz) Seien a, b ∈ R mit a < b und I = [a, b]. Weiter sei f : I → R eine stetige Funktion mit f (a) < 0 und f (b) > 0. Dann existiert ein c ∈ I mit f (c) = 0. Dasselbe gilt, wenn f (a) > 0 und f (b) < 0 ist. Beweis: Wir beschränken und auf den Fall f (a) < 0, f (b) > 0, da sich der Beweis im anderen Fall analog führen lässt. Um die Existenz einer Nullstelle c zu beweisen, konstruieren wir rekursiv eine Folge von Paaren (an , bn ), so dass folgende drei Bedingungen für alle n ∈ N erfüllt sind: (i) Es gilt [an+1 , bn+1 ] ⊆ [an , bn ]. (ii) Für die Länge des Intervalls [an , bn ] gilt jeweils bn − an = 2−n (b − a). (iii) Es gilt jeweils f (an ) ≤ 0 und f (bn ) ≥ 0. Für n = 1 setzen wir a1 = a und b1 = b. Nehmen wir nun an, das Paar (an , bn ) ist bereits konstruiert, und m = 1 (an 2 + bn ) ist der Mittelpunkt des Intervalls [an , bn ]. Ist f (m) ≥ 0, dann setzen wir an+1 = an und bn+1 = m. Gilt dagegen f (m) < 0, dann sei an+1 = m und bn+1 = bn . Man rechnet unmittelbar nach, dass das Paar (an+1 , bn+1 ) in beiden Fällen wieder die Bedingungen (i) bis (iii) erfüllt. Die Folge (an )n∈N ist nach Konstruktion monoton wachsend und nach oben beschränkt (mit b als oberer Schranke), also nach Satz (4.19) konvergent. Die Folge (bn )n∈N ist monoton fallend und nach unten beschränkt, deshalb existiert —– 120 —– auch hier ein Grenzwert. Wegen lim bn − lim an n→∞ n→∞ = lim (bn − an ) n→∞ lim 2−n (b − a) = n→∞ = 0 stimmen die beiden Grenzwerte überein, wir können also c = lim an = lim bn setzen. Da f stetig ist und f (an ) ≤ 0 n→∞ n→∞ für alle n ∈ N gilt, erhalten wir die Abschätzung f (c) = lim f (an ) n→∞ ≤ 0 nach Satz (4.11). Entsprechend liefert die Stetigkeit von f und die Ungleichung f (bn ) ≥ 0 für alle n ∈ N die Abschätzung f (c) ≥ 0. Insgesamt erhalten wir so f (c) = 0, wir haben also eine Nullstelle c im Intervall I gefunden. (5.15) Folgerung Sei I wie oben und f : I → R stetig und d ∈ R mit f (a) < d < f (b). Dann gibt es ein c ∈ I mit f (c) = d. Dasselbe gilt auch im Fall f (a) > d > f (b). Beweis: Wir wenden den Zwischenwertsatz auf die Funktion g : I → R mit g(x) = f (x) − d an und erhalten ein c ∈ I mit g(c) = 0. Dieses c erfüllt dann die Gleichung f (c) = d. (5.16) Folgerung Ist I ⊆ R ein beliebiges Intervall, und ist f : I → R eine stetige Funktion, dann ist auch f (I) ein Intervall in R. Beweis: Seien c, d ∈ f (I) mit c < d und q ∈ R mit c < q < d vorgegeben. Zu zeigen ist, dass q in f (I) liegt; dies ist gleichbedeutend damit, dass ein p ∈ I mit f (p) = q existiert. Wegen c, d ∈ f (I) gibt es a, b ∈ I mit f (a) = c und f (b) = d. Nach eventueller Vertauschung von a und b können wir davon ausgehen, dass a < b gilt. Nach Folgerung (5.15) finden wir ein p ∈ [a, b] mit f (p) = q. Weil es sich bei I um ein Intervall handelt, ist p in I enthalten. (5.17) Satz (Maximumsprinzip) Seien a, b ∈ R mit a < b und I = [a, b]. Sei f : I → R stetig. Dann ist die Funktion f auf I beschränkt, was bedeutet, dass die Wertemenge M = { f (x) | x ∈ I} ⊆ R von f beschränkt ist. Außerdem nimmt die Funktion auf I ihr Maximum und ihr Minimum an, d.h. es gibt p, q ∈ I mit f (p) = max M und f (q) = min M . —– 121 —– Maximumsprinzip: Der Wertebereich von f ist beschränkt. Das Maximum wird im Punkt p, das Minimum in q angenommen. Beweis: Wir beweisen nur, dass M nach oben beschränkt ist und das Maximum von f angenommen wird. Die entsprechenden Aussagen über das Minimum folgen dann durch Anwendung der bereits bewiesenen Aussagen auf die Funktion g(x) = − f (x). Wir unterscheiden zwei Fälle. 1. Fall: Die Menge M ist nach oben beschränkt. Dann existiert das Supremum s = sup M , und es gibt eine Folge (x n )n∈N mit limn f (x n ) = s. Um dies zu zeigen, wählen wir für jedes n ∈ N ein x n ∈ I mit s − 1 n < f (x n ) ≤ s; gäbe es ein solches x n nicht, dann wäre bereits s − 1 n obere Schranke von M , im Widerspruch zur Definition des Supremums als kleinste obere Schranke. Es folgt dann | f (x n ) − s| < 1 n für alle n ∈ N und somit limn f (x n ) = s. 2. Fall: Die Menge M ist nach oben unbeschränkt. Dann finden wir eine Folge (x n )n∈N in I mit limn f (x n ) = +∞. Anderseits gilt a ≤ x n ≤ b für alle n ∈ N, die Folge (x n )n∈N ist also beschränkt. Nach dem Satz (4.23) besitzt die Folge (x n )n∈N einen Häufungspunkt c ∈ R. Demnach gibt es für jedes k ∈ N ein nk ≥ k mit |x nk − c| < 1k . Die Folge (x nk )k∈N konvergiert dann gegen den Punkt c; wegen a ≤ x nk ≤ b für jedes k ∈ N ist auch c im Intervall I enthalten. Die Stetigkeit von f im Punkt c liefert nun limk f (x nk ) = f (c), insbesondere ist die Folge bestehend aus den Werten | f (x nk )| nach Satz (4.3) durch ein r ∈ R+ beschränkt. Aber dies steht im Widerspruch zu limn f (x n ) = +∞, denn auf Grund dieser Voraussetzung müsste ein N ∈ N mit f (x n ) > r für alle n ≥ N existieren. Damit könnte | f (x nk )| ≤ r auch nur für endlich viele k ∈ N gelten. Dieser Widerspruch zeigt, dass der zweite Fall nicht auftreten kann. Also ist M in der Tat nach oben beschränkt. Wie im zweiten Fall wählen wir einen Häufungspunkt p ∈ M und eine Folge (nk )k∈N natürlicher Zahlen mit lim x nk = p. Wegen f (x n ) > s − 1 n für alle n ∈ N gilt f (p) = limk→∞ f (x nk ) ≥ s − limn→∞ 1 nk = s, also wird der maximale Wert s von f im Punkt p angenommen. Dies zeigt auch, dass s = sup M zugleich das Maximum von M ist. —– 122 —– Für offene oder halboffene Intervalle ist die Aussage falsch, wie das Beispiel f : ]0, 2] → R, x 7→ 1 x zeigt. Offenbar ist diese Funktion nach oben unbeschränkt. 2 1 x 1 2 (5.18) Definition Eine Funktion f : D → R wird monoton wachsend genannt, wenn aus a ≤ b stets f (a) ≤ f (b) folgt. Von einer streng monoton wachsenden Funktion spricht man, wenn im Fall a < b immer f (a) < f (b) erfüllt ist. Entsprechend sind die Begriffe monoton fallend bzw. streng monoton fallend definiert. Sei f : D → R eine Funktion mit der Eigenschaft, dass die Menge D bijektiv auf E = f (D) abgebildet wird. Dann nennen wir die Umkehrabbildung g = f −1 : E → D auch die Umkehrfunktion von f . Beispielsweise ist für ungerades p k ∈ N die in Abschnitt §9 definierte k-te Wurzelfunktion rk : R → R, x 7→ k x die Umkehrfunktion von pk : R → R, x 7→ x k . Dies überprüft man anhand der Gleichungen p p p k (rk ◦ pk )(x) = rk (x k ) = x k = x und (pk ◦ rk )(x) = pk ( k x) = ( k x)k = x für alle x ∈ R. Eine entsprechende Aussage gilt auch für gerades k ∈ N, nur dass hier die Definitionsbereiche D = E = R+ gewählt werden müssen. (Man beachte dazu die Voraussetzungen in Lemma (3.35).) (5.19) Satz (Stetigkeit der Umkehrfunktion) Sei I ⊆ R ein Intervall, und sei f : I → R stetig und streng monoton wachsend. Dann ist f eine Bijektion auf ihr Bild f (I), und die Umkehrfunktion f −1 : f (I) → I ist ebenfalls stetig und streng monoton wachsend. Beweis: Die Abbildung f ist injektiv, denn sind a, b ∈ I mit a 6= b, dann gilt f (a) < f (b) im Fall a < b und f (a) > f (b) im Fall a > b, auf jeden Fall also f (a) 6= f (b). Als Abbildung I → f (I) ist f außerdem surjektiv, insgesamt also eine Bijektion zwischen I und f (I). Sei f −1 : f (I) → I die Umkehrabbildung. Mit f ist auch f −1 streng monoton wachsend. Andernfalls gäbe es c, d ∈ f (I) mit c < d und f −1 (c) ≥ f −1 (d). Im Fall f −1 (c) = f −1 (d) würde c = f ( f −1 (c)) = f ( f −1 (d)) = c folgen, im Fall f −1 (c) > f −1 (d) würden wir c > d erhalten, in beiden Fällen also also c ≥ d im Widerspruch zur vorherigen Feststellung. Nach Folgerung (5.16) ist mit I auch f (I) ein Intervall. —– 123 —– Beweisen wir nun die Stetigkeit von f −1 . Sei q ∈ J und ( yn )n∈N eine Folge in J mit limn yn = q. Weiter sei p = f −1 (q) und x n = f −1 ( yn ) für jedes n ∈ N. Wir müssen zeigen, dass limn x n = p gilt. Angenommen, dies ist nicht der Fall. Dann gibt es ein " ∈ R+ , so dass |x n − p| ≥ " für unendlich viele n ∈ N gilt. Betrachten wir die Mengen M+ = {n ∈ N | x n ≥ p + "} M− = {n ∈ N | x n ≤ p − "} und , dann ist M+ oder M− unendlich. Gehen wir davon aus, dass M+ unendlich ist; im anderen Fall läuft der Beweis analog. Auf Grund der strengen Monotonie von f gilt für alle n ∈ M+ jeweils yn = f (x n ) f (p + ") ≥ > f (p) = q. Setzen wir "1 = | f (p + ") − q|, dann gilt also | yn − q| > "1 für unendlich viele n ∈ N. Aber dies widerspricht der Voraussetzung limn yn = q. Als Anwendung des soeben bewiesenen Satzes werden wir nun die aus der Schulmathematik bekannten Exponentialund Logarithmusfunktionen definieren. Zur Vorbereitung benötigen wir allerdings ein paar Hilfsaussagen. (5.20) Lemma Für jedes a ∈ R gibt es eine Folge (an )n∈N in Q mit limn an = a. Beweis: Sei a ∈ R. Weil die rationalen Zahlen in R dicht liegen (Satz (3.33)), gibt es für jedes n ∈ N eine Zahl an ∈ Q mit |an − a| < 1n . Wir zeigen, dass limn an = a gilt. Sei dazu " ∈ R+ vorgegeben. Dann gibt es ein N ∈ N mit 1 N 1 n < ". Für alle n ≥ N folgt damit |an − a| < ≤ 1 N < ". (5.21) Lemma Sei b ∈ R mit b > 1. (i) Die Funktion Q → R, x 7→ b x ist streng monoton wachsend. p n (ii) Es gilt limn b = 1. (iii) Die Abbildung Q → R, x 7→ b x ist stetig. Beweis: zu (i) Seien x, y ∈ Q mit x < y vorgegeben. Indem wir x und y auf einen Nenner bringen, erhalten wir ein n ∈ N und u, v ∈ Z mit x = un , y = v n und u < v. Dann ist v − u positiv. Es folgt b v−u ≥ b > 1. Multiplikation mit bu liefert bu < b v . Nach Lemma (3.35) gilt die Äquivalenz bx < b y ⇔ u v bn < bn ⇔ u v (b n )n < (b n )n ⇔ bu < b v . zu (ii) Sei " ∈ R+ vorgegeben und c = 1 + ". Wegen c > 1 gibt es nach Satz (3.12) (iii) ein N ∈ N mit c N > b, also p p n n gilt ebenso c n ≥ c N > b für alle n ≥ N . Nun ist 1 < b < c jeweils äquivalent zu 1 < b < c n , also gilt 1 < b < c für alle n ≥ N . Es folgt p n b − 1 = p n b−1 —– < c−1 124 —– = " für n ≥ N. zu (iii) Zunächst beweisen wir die Stetigkeit im Punkt 0. Sei also (x n )n∈N eine Folge rationaler Zahlen, die gegen p k Null konvergiert; zu zeigen ist dann limn b x n = 1 = b0 . Sei dazu " ∈ R+ vorgegeben. Nach (ii) gilt limk b2 = 1, also finden wir ein k ∈ N mit 2 bk −1 = Wegen limn x n = 0 gibt es ein N ∈ N mit |x n | ≤ Ungleichungen b − 1k <b xn 1 k 1 k 1 (b2 ) k − 1 < ". für alle n ≥ N . Aus − 1k < x n < 1 k folgen nach Teil (i) die < b und somit |b x n − 1| ≤ 1 1 b k − b− k 1 2 b− k (b k − 1) = 2 ≤ bk −1 < " für n ≥ N. Damit ist die Stetigkeit im Punkt 0 bewiesen. Sei nun x ∈ Q beliebig vorgegeben und (x n )n∈N eine Folge in Q mit limn x n = x. Dann gilt limn (x n − x) = 0, und die Stetigkeit im Punkt 0 zeigt = lim b x n = lim b x b x n −x = b x lim b x n −x n→∞ n→∞ n→∞ b x b0 = bx . Also ist die Abbildung auch im Punkt x stetig. Zu jedem b ∈ R mit b > 1 gibt es eine eindeutig bestimmte, stetige Funktion (5.22) Satz exp b : R → R mit exp b (x) = b x für alle x ∈ Q. Diese ist streng monoton wachsend und erfüllt die Gleichung exp b (x + y) = exp b (x) exp b ( y) für alle x, y ∈ R. Man bezeichnet sie als die Exponentialfunktion zur Basis b. Beweis: Wir beginnen mit der Definition einer geeigneten Funktion. Nach Lemma (5.20) gibt es für jedes irrationale x ∈ R eine Folge (an(x) )n∈N in Q, die gegen x konvergiert. Für x ∈ Q definieren wir (an(x) )n∈N durch an(x) = x für alle n ∈ N. Es liegt nahe, die Funktion exp b an jeder Stelle x ∈ R durch exp b (x) = (x) lim b an n→∞ zu definieren, allerdings müssen wir dafür nachweisen, dass der Grenzwert auf der rechten Seiten auch existiert. (x) Wir überprüfen, dass (b an )n∈N eine Cauchyfolge ist; weil jede Cauchyfolge konvergiert (Satz (4.28)), folgt daraus die Existenz des Grenzwertes. Seien also x ∈ R, " ∈ R+ vorgegeben und κ ∈ R+ eine obere Schranke der Menge {an(x) | n ∈ N}. Nach Lemma (5.21) ist die Abbildung x 7→ b x auf ganz Q und insbesondere im Nullpunkt stetig. Nach dem "-δ-Kriterium (Satz (5.12)) gibt es somit ein δ ∈ R+ mit der Eigenschaft, dass aus |a| < δ für jedes a ∈ Q jeweils |b a − 1| < b−κ " folgt. (x) Weil (an(x) )n∈N eine Cauchyfolge ist, gibt es ein N ∈ N, so dass |an(x) − am | < δ für alle m, n ≥ N erfüllt ist. Wir erhalten dann (x) an(x) b − b am = (x) (x) (x) b am b an −am − 1 —– 125 —– < bκ b−κ " = " (x) womit die Cauchyfolgen-Eigenschaft von (b an )n∈N bewiesen ist. Nach Definition gilt darüber hinaus für alle x ∈ Q (x) jeweils exp b (x) = limn b an = limn b x = b x . Im nächsten Schritt beweisen wir die Gleichung exp b (x + y) = exp b (x) exp b ( y) für alle x, y ∈ R. Nach Definition gilt exp b (x + y) exp b (x)−1 exp b ( y)−1 (x+ y) lim b an n→∞ = (x+ y) lim b an b−an b−an (x) lim b an −1 ( y) lim b an −1 n→∞ n→∞ n→∞ ( y) (x) = (x+ y) (x) ( y) lim b(an −an −an ) = n→∞ Wegen limn an(x+ y) = x + y, limn an(x) = x und limn an( y) = y gilt lim an(x+ y) − an(x) − an( y) = n→∞ (x + y) − x − y = 0. Auf Grund der Stetigkeit der Funktion x 7→ b x im Nullpunkt erhalten wir somit exp b (x + y) exp b (x)−1 exp b ( y)−1 (x+ y) (x) ( y) lim b(an −an −an ) = n→∞ = b0 = 1. Nun zeigen wir, dass die Funktion exp b auf ihrem gesamten Definitionsbereich stetig ist. Zunächst beweisen wir die Stetigkeit im Nullpunkt. Sei " ∈ R+ vorgegeben. Weil b 7→ b x in 0 stetig ist, gibt es ein δ ∈ R+ mit der Eigenschaft, dass aus |a| < δ jeweils |b a − 1| < 12 " folgt, für alle a ∈ Q. Sei nun x ∈ R mit |x| < 12 δ. Wegen limn an(x) = x und (x) (x) limn b an = exp b (x) gibt es ein n ∈ N mit |an(x) | < δ und |b an − exp b (x)| < 21 ". Es folgt | exp b (x) − 1| ≤ (x) (x) | exp b (x) − b an | + |b an − 1| 1 " 2 < + 12 " = " , womit die Stetigkeit im Nullpunkt bewiesen ist. Anschließend zeigen wir die Stetigkeit in einem beliebigen Punkt x ∈ R. Sei (x n )n∈N eine Folge in R mit limn x n = x. Dann konvergiert x n − x gegen Null, und wir erhalten lim exp b (x n ) = lim exp b (x) exp b (x n − x) = exp b (x) lim exp b (x n − x) n→∞ n→∞ = n→∞ exp b (x) exp b (0) = exp b (x + 0) = exp b (x). Um zu zeigen, dass exp b streng monoton wachsend ist, genügt es exp b (a) > 1 für alle a ∈ R+ nachzuweisen. Sind dann nämlich x, y ∈ R mit x < y vorgegeben, dann ist y − x positiv, und es folgt exp b ( y) = exp b ( y − x) exp b (x) > exp b (x). Sei also a ∈ R+ vorgegeben, und sei c ∈ Q eine Zahl mit 0 < c < a. Wegen limn an(a) = a gibt es ein N ∈ N (a) mit an(a) ≥ c für alle n ≥ N . Auf Grund der strengen Monotonie der Abbildung x 7→ b x folgt b an ≥ b c > b0 = 1 für alle n ≥ N und damit auch exp b (x) = (a) lim b an ≥ n bc > 1. Zum Beweis der Eindeutigkeit der Funktion exp b nehmen wir an, dass f : R → R eine weitere stetige Funktion mit f (x) = b x für x ∈ Q ist. Dann gilt für beliebiges x ∈ R auf Grund der Stetigkeit von f jeweils f (x) = lim f (an(x) ) n→∞ = (x) lim b an n→∞ Die Funktionen f und exp b stimmen also auf ganz R überein. —– 126 = exp b (x). —– Als Ergänzung zu Satz (5.22) bemerken wir (5.23) Proposition Der Wertebereich von exp b ist gegeben durch exp b (R) = R+ . Beweis: Zunächst einmal bemerken wir, dass exp b nur positive Werte annimmt. Denn auf Grund der strengen Monotonie von exp b gilt exp b (x) > exp b (0) = b0 = 1 > 0 für alle x ∈ R+ . Für dasselbe x gilt auch exp b (−x) exp b (x) = exp b ((−x) + x) = exp b (0) = 1 , also exp b (−x) = exp b (x)−1 > 0. Dies zeigt, dass exp b auch im Bereich x < 0 nur positive Werte annimmt. Nun zeigen wir, dass für jedes d > 1 ein x ∈ R+ mit exp b (x) = d existiert. Wegen b > 1 gibt es ein n ∈ N mit b n > d. Wir betrachten nun die Funktion exp b auf dem abgeschlossenen Intervall I = [0, n]. Es ist exp b (0) = 1 < d und exp b (n) = b n > d. Nach Folgerung (5.15) zum Zwischenwertsatz existiert somit ein x ∈ [0, n] mit exp b (x) = d. Ist 0 < d < 1, dann gilt d −1 > 1. Auf Grund des bereits Gezeigten gibt es ein x ∈ R mit exp b (x) = d −1 , und es folgt exp b (−x) = exp b (x)−1 = (d −1 )−1 = d. Berücksichtigen wir noch exp b (0) = b0 = 1, so ist damit bewiesen, dass jeder positive Wert von exp b tatsächlich angenommen wird. (5.24) Satz Die Umkehrfunktion log b : R+ → R von exp b ist stetig und streng monoton wachsend. Man nennt sie den Logarithmus zur Basis b. Für alle u, v ∈ R+ gilt log b (uv) Beweis: = log b (u) + log b (v). Alle Aussagen mit Ausnahme der Gleichung folgen aus Satz (5.19). Zum Nachweis der Gleichung seien u, v ∈ R+ vorgegeben, außerdem x = log b (u) und y = log b (v). Dann gilt u = exp b (log b (u)) = exp b (x) und ebenso v = exp b ( y), darüber hinaus exp b (x + y) = exp b (x) exp b ( y). Weil die Abbildungen log b und exp b zueinander invers sind, erhält man durch Anwendung von log b auf beide Seiten log b (uv) = log b (exp b (x) exp b ( y)) = log b (exp b (x + y)) = x + y = log b (u) + log b (v). y 10 8 6 4 2 −4 −2 2 4 6 8 10 x −2 −4 Verlauf der Exponentialfunktion (blau) und der Logarithmusfunktion (orange), jeweils zur Basis 2 —– 127 —– (5.25) Proposition Die Funktionen exp b : R → R+ und log b : R+ → R besitzen das Grenz- wertverhalten lim exp b (x) = 0 , lim log b (x) = −∞ , x→−∞ x→0 Beweis: lim exp b (x) = +∞ x→+∞ lim log b (x) = +∞ x→+∞ Sämtliche Aussagen ergeben sich aus der Monotonie der Funktionen und den Gleichungen exp b (R) = R+ und log b (R+ ) = R. Zum Nachweis von lim exp b (x) = 0 sei eine Folge (x n )n∈N mit limn x n = −∞ vorgegeben. x→−∞ Zu zeigen ist limn exp b (x n ) = 0. Dazu geben wir uns ein " ∈ R+ vor. Wegen exp b (R) = R+ existiert ein a ∈ R mit 0 < exp b (a) ≤ ". Sei nun N ∈ N so gewählt, dass x n < a für alle n ≥ N erfüllt ist. Auf Grund der strengen Monotonie von exp b folgt 0 < exp b (x n ) < exp b (a) für n ≥ N , insbesondere | exp b (x n )| = exp b (x n ) < exp b (a) ≤ " für alle n ≥ N . Damit ist limn exp b (x n ) = 0 bewiesen. Für den Beweis von lim exp b (x) = +∞ sei (x n )n∈N eine x→+∞ Folge mit limn x n = +∞. Wir müssen zeigen, dass limn exp b (x n ) = +∞ gilt. Sei dazu κ ∈ R+ vorgegeben. Wegen exp b (R) = R+ gibt es ein a ∈ R mit exp b (a) ≥ κ. Wegen limn x n = +∞ gibt es ein N ∈ N mit x n > a für alle n ≥ N . Wiederum auf Grund der strengen Monotonie erhalten wir exp b (x n ) > exp b (a) ≥ κ für alle n ≥ N , womit limn exp b (x n ) = +∞ bewiesen ist. Der Beweis der beiden Grenzwerte von log b läuft völlig analog, so dass wir ihn dem Leser als Übungsaufgabe überlassen können. In §12 haben wir die Eulersche Zahl e definiert. Wie wir noch sehen werden, fällt der Exponential- und der Logarithmusfunktion zur Basis e eine Sonderrolle zu. Den Logarithmus zu dieser Basis bezeichnet man auch als natürlichen Logarithmus. —– 128 —– § 6. Differenzierbarkeit Inhaltsübersicht Aus der Schulmathematik ist bekannt, dass die Ableitung einer Funktion f in einem Punkt a die Steigung der Tangente an den Funktionsgraphen von f durch den Punkt (a, f (a)) angibt. Dabei ist die Tangentensteigung nach Definition der Grenzwert der Sekantensteigungen durch die Punkte (a, f (a)) und (x, f (x)), den man erhält, wenn man x gegen a laufen lässt. Dieser geometrische Ansatz bildet die Grundlage für unsere Definition von f 0 (a) durch einen Funktionsgrenzwert. Nachdem wir die Definition der Ableitung anhand einiger Beispiele diskutiert haben, beweisen wir zunächst die aus der Schule bekannten Ableitungsregeln, im Einzelnen die Summen-, Produkt-, Quotienten-, Ketten- und Umkehrregel. Anschließend leiten wir den Zusammenhang zwischen dem Vorzeichen der Ableitung und dem Monotonieverhalten der Funktion her und zeigen, wie mit Hilfe von erster und zweiter Ableitung lokale Minima und Maxima bestimmt werden können. Auch dies ist bereits aus dem Schulunterricht bekannt (Stichwort „Kurvendiskussion“). Im letzten Abschnitt sehen wir uns an, inwiefern Funktionen durch höhere Ableitungen approximiert werden können und behandeln die für konkrete Berechnungen wichtigen Taylorreihen. (I) Der Differenzierbarkeitsbegriff Sei D ⊆ R eine beliebige Teilmenge. Man nennt a ∈ D einen inneren Punkt von D, wenn ein " ∈ R+ existiert, so dass ]a − ", a + "[ ⊆ D erfüllt ist. Offenbar ist ein innerer Punkt immer auch ein Häufungspunkt von D: Wählt man nämlich N hinreichend groß, so dass 1 N < " erfüllt ist, dann erhält man zum Beispiel durch (an )n≥N mit an = a + 1 n eine Folge in D, die gegen a konvergiert. (6.1) Definition Sei D ⊆ R und a ∈ D ein innerer Punkt. Eine Funktion f : D → R wird differenzierbar an der Stelle a genannt, wenn f 0 (a) = lim x→a f (x) − f (a) x −a als eigentlicher Grenzwert existiert. Man nennt f 0 (a) in diesem Fall die Ableitung von f an der Stelle a. Wir nennen die Funktion f differenzierbar, wenn sie an jeder Stelle ihres Definitionsbereichs differenzierbar ist. Als innerer Punkt von D ist a zugleich ein Berührpunkt der Menge Da = D \ {a}. Die Funktion g(x) = f (x) − f (a) x −a ist auf Da definiert, somit ist gewährleistet, dass der Grenzwert lim g(x) tatsächlich gebildet werden kann. Geomex→a trisch lässt sich g(x) als Steigung der Sekante des Funktionsgraphen von f durch die Punkte (a, f (a)) und (x, f (x)) interpretieren. Durch den Grenzübergang x → a erhält man die Steigung der Tangente an den Funktionsgraphen durch den Punkt (a, f (a)). —– 129 —– y 5 4 3 2 1 x 1 2 4 3 5 Veranschaulichung der Differenzierbarkeit: Die Sekantensteigungen (orange) nähern sich für x → a der Tangentensteigung (rot) an. (6.2) Proposition Sei f : D → R eine Funktion und a ∈ D ein innerer Punkt. Dann sind folgende Bedingungen äquivalent. (i) Die Funktion f ist in a differenzierbar. (ii) Es existiert der Grenzwert lim f (a + h) − f (a) h h→0 . (iii) Es gibt eine reelle Zahl c ∈ R und eine Funktion ψ : Da → R mit f (a + h) = f (a) + ch + ψ(a + h) und lim ψ(a + h) h→0 h = 0. Sind diese äquivalenten Bedingungen erfüllt, dann stimmt der Grenzwert in (ii) und die reelle Zahl c in (iii) mit dem Wert f 0 (a) der Ableitung überein. Beweis: „(i) ⇒ (ii)“ Die Funktion g(h) = 1h ( f (a + h) − f (a)) besitzt die Menge D0 = {h ∈ R | a + h ∈ D} \ {0} als Definitionsbereich. Damit der Grenzwert definiert ist, müssen wir zeigen, dass 0 ein Berührpunkt von D0 ist. Nach Voraussetzung gibt es eine Folge (x n )n∈N in Da mit limn x n = a. Setzen wir hn = x n − a für alle n ∈ N, so erhalten wir wegen a + hn = x n ∈ Da eine Folge in D0 mit limn hn = 0. Also ist 0 tatsächlich ein Berührpunkt. Ist nun (hn )n∈N eine beliebige Folge in D0 mit limn hn = 0, dann ist durch x n = a + hn eine Folge in Da mit Grenzwert a gegeben, und aus der Differenzierbarkeit von f in a folgt lim n→∞ f (a + hn ) − f (a) hn = lim n→∞ f (x n ) − f (a) xn − a —– 130 = —– lim x→a f (x) − f (a) x −a = f 0 (a). Wir definieren auf der Menge D0 von oben die Funktion φ durch φ(h) = f (a + h) − f (a) − ch, wobei „(ii) ⇒ (iii)“ c den Grenzwert unter (ii) bezeichnet, und setzen ψ(x) = φ(x − a) für alle x ∈ Da . Dann gilt offenbar f (a + h) = f (a) + ch + φ(h) = für alle h ∈ D0 f (a) + ch + ψ(a + h) und außerdem lim ψ(a + h) = h h→0 lim φ(h) h→0 = h lim f (a + h) − f (a) h h→0 − lim h→0 ch h = c−c = 0. „(iii) ⇒ (i)“ Sei c ∈ R und ψ : Da → R eine Funktion mit der angegebenen Eigenschaft. Weiter sei (x n )n∈N eine Folge in Da mit limn x n = a. Dann konvergiert die Folge gegeben durch hn = x n − a gegen 0, und wir erhalten lim f (x n ) − f (a) n→∞ xn − a = lim f (x)− f (a) x−a x→a gilt f (a) = c. = hn n→∞ Dies zeigt, dass der Grenzwert lim 0 f (a + hn ) − f (a) chn lim n→∞ hn + lim ψ(a + hn ) = hn n→∞ c+0 = c. existiert und mit c übereinstimmt. Also ist f in a differenzierbar, und es Wir betrachten einige Beispiele für differenzierbare und nicht differenzierbare Funktionen. (i) Sei c ∈ R und die Funktion f gegeben durch f : R → R, x 7→ c. Dann gilt f 0 (a) = 0 für alle a ∈ R, denn es gilt jeweils lim f (a + h) − f (a) h h→0 = lim c−c h→0 h = = lim 0 h→0 0. Die Ableitung von id : R → R ist gegeben durch id0 (x) = 1 für alle x ∈ R. (ii) Die Funktion id : R → R, x 7→ x ist überall differenzierbar, mit Ableitung 1. Dies folgt für alle a ∈ R aus der Rechung lim id(a + h) − id(a) = h h→0 lim (a + h) − a = h h→0 lim h→0 h = h lim 1 h→0 = 1. (iii) Die Funktion f : R → R, x 7→ x 2 ist überall differenzierbar mit der Ableitung f 0 (x) = 2x für alle x ∈ R. Denn für jedes reelle a gilt lim f (a + h) − f (a) = h h→0 lim (a + h)2 − a2 h h→0 = (iv) Die Funktion f : D → R, x 7→ mit der Ableitung f (x) = 0 − x12 1 x = 2a + 0 = lim h→0 2ah + h2 h = 2a + lim h h→0 2a. ist auf ihrem gesamten Definitionsbereich D = R \ {0} differenzierbar, für jedes x ∈ D. Zum Beweis bemerken wir zunächst, dass jedes a ∈ D ein innerer Punkt des Definitionsbereichs ist. Setzen wir nämlich " = |a|, dann gilt " ∈ R+ . Ist a < 0 und x ∈ ]a − ", a + "[, dann gilt x < a + " = a + (−a) = 0 und somit x ∈ D. Im Fall a > 0 und x ∈ ]a − ", a + "[ gilt x > a − " = a − a = 0, also wiederum x ∈ D. In beiden Fälle ist also ]a − ", a + "[ ⊆ D erfüllt. —– 131 —– Bestimmen wir nun den Wert der Ableitung an einer beliebigen Stelle a ∈ D. Es gilt lim f (a + h) − f (a) = h h→0 lim (−h) a(a+h) lim − 1 a = h h→0 = h h→0 1 a+h lim − h→0 1 a(a + h) a−(a+h) a(a+h) lim = = h h→0 − 1 a2 (v) Die Funktion abs : R → R ist an jedem Punkt a ∈ R× differenzierbar, aber im Punkt 0 nicht differenzierbar. Sei zunächst a < 0 und (hn )n∈N eine beliebige Folge mit limn hn = 0. Setzen wir " = |a|, so gibt es ein N ∈ N mit |hn | < " für alle n ≥ N . Für diese n gilt dann a + hn < a + " = a + (−a) = 0 und somit |a + hn | = −(a + hn ). Weil sich endlich viele Folgenglieder auf den Grenzwert nicht auswirken, erhalten wir abs(a + hn ) − abs(a) lim = hn n→∞ lim −(a + hn ) + a = hn n→∞ lim |a + hn | − |a| lim n→∞ = hn n→∞ −hn = hn −1 Damit ist abs0 (a) = −1 bewiesen. Betrachten wir nun den Fall a > 0. Sei wiederum (hn )n∈N eine Folge mit limn hn = 0. Wie im vorherigen Fall zeigt man, dass a + hn > 0 und somit |a + hn | = a + hn für alle bis auf endlich viele n ∈ N gilt. Man erhält dann lim abs(a + hn ) − abs(a) = hn n→∞ a + hn − a lim = hn n→∞ lim n→∞ hn hn = 1 und somit abs0 (a) = 1. Nehmen wir nun an, die Funktion abs ist auch im Nullpunkt differenzierbar. Dies würde bedeuten, dass der Grenzwert lim abs(h) − abs(0) = h h→0 lim abs(h) h h→0 existiert. Um ihn zu auszurechnen, betrachten wir die Folge ( 1n )n∈N mit limn lim abs(h) = h h→0 lim abs( 1n ) = 1 n n→∞ 1 n n→∞ 1 n lim = 1 n = 0. Wir erhalten lim 1 n→∞ = 1. Wenn der Grenzwert also existiert, dann muss er mit 1 übereinstimmen. Betrachten wir aber andererseits die Folge (− 1n )n∈N , die ebenfalls gegen Null konvergiert, so erhalten wir lim h→0 abs(h) h Der Widerspruch 1 = lim h→0 = abs(h) h lim n→∞ abs(− 1n ) (− 1n ) 1 n n→∞ (− 1 ) n = lim = lim −1 n→∞ = −1. = −1 zeigt, dass der Grenzwert nicht existiert. (vi) Die Funktion f : R → R, x 7→ p 3 x ist im Punkt a = 0 nicht differenzierbar. Zum Nachweis genügt es, eine Folge (hn )n∈N mit limn hn = 0 anzugeben, für die der Grenzwert 1 ( n→∞ hn lim —– p 132 3 hn − —– p 3 0) nicht existiert. Sei hn = 1 n3 p für alle n ∈ N. Dann gilt lim hn = 0 und 3 hn = 1n für alle n ∈ N. Wir erhalten n→∞ p p 1 3 3 hn − 0 1 3 n = = ·n = n2 . 1 hn n 3 n Die Folge ist unbeschränkt und somit nicht konvergent. y 2 1 x −5 −4 −3 −2 −1 1 2 3 4 5 −1 −2 p Die Kubikwurzel-Funktion x 7→ 3 x ist im Nullpunkt nicht differenzierbar. Der Funktionsgraph hat dort eine senkrechte Tangente (rot), die Steigung wird unendlich groß. In jedem einzelnen Beispiel hätte man nach (6.2) an Stelle des Grenzwerts lim auch den entsprechenden Grenzwert h→0 lim betrachten können, dies hätte an der Rechnung jeweils wenig geändert. Zum Abschluss bemerken wir noch x→a (6.3) Satz Sei f : D → R eine Funktion und a ∈ D. Ist f im Punkt a differenzierbar, dann ist sie dort auch stetig. An einer Unstetigkeitstelle a kann eine Funktion nicht differenzierbar sein. Die Steigungen der Sekanten (gelb) laufen für x → a gegen einen unendlichen Wert. Beweis: Wir zeigen, dass unter der angegebenen Voraussetzung lim f (x) = f (a) erfüllt ist. Als innerer Punkt von x→a D ist a auch ein Häufungspunkt von D und ein Berührpunkt von Da = D \ {a}. Sei nun (x n )n∈N eine Folge in Da mit —– 133 —– limn x n = a. Die Differenzierbarkeit von f an der Stelle a liefert nun f (x) − f (a) f (x) − f (a) lim f (x) = lim f (a) + lim (x − a) (x − a) = f (a) + lim x→a x→a x→a x→a x −a x −a = f (a) + f 0 (a) · 0 = f (a). Ist eine Funktion f : D → R an einer Stelle a nicht stetig, so ist sie also dort auch nicht differenzierbar. —– 134 —– (II) Ableitungsregeln (6.4) Satz (Summenregel) Sei D ⊆ R eine beliebige Teilmenge, f , g : D → R Funktionen und a ∈ D ein Punkt, in dem f und g beide differenzierbar sind. Dann ist auch f + g in a differenzierbar, und es gilt ( f + g)0 (a) Beweis: f 0 (a) + g 0 (a). = Nach Voraussetzung ist a ein innerer Punkt von D. Weil f und g in a differenzierbar sind, existieren die Grenzwerte lim f (x) − f (a) = f 0 (a) und lim g(x) − g(a) x→a x −a Auf Grund der Prop. (5.6) über Funktionsgrenzwerte erhalten wir x→a lim ( f + g)(x) − ( f + g)(a) lim lim f (x) − f (a) x −a x→a lim + lim + x→a x −a g(x) − g(a) g(x) − g(a) x −a = g 0 (a). f (x) + g(x) − f (a) − g(a) x→a f (x) − f (a) x −a x→a (6.5) Satz = x −a x→a x −a x −a = f 0 (a) + g 0 (a). = = (Produktregel) Sei D ⊆ R eine beliebige Teilmenge, f , g : D → R Funktionen und a ∈ D ein Punkt, in dem f und g beide differenzierbar sind. Dann ist auch f g in a differenzierbar, und es gilt ( f g)0 (a) Beweis: f 0 (a)g(a) + f (a)g 0 (a). = Auch hier ist nach Voraussetzung ist a ein innerer Punkt von D, und weil f und g in a differenzierbar sind, existieren die Grenzwerte lim f (x) − f (a) x −a x→a = f 0 (a) und lim x→a g(x) − g(a) x −a = g 0 (a). Ferner ist nach (6.3) eine differenzierbare Funktion immer auch stetig. Wenden wir dies auf die Funktion g an, so erhalten wir lim g(x) = g(a). Wiederum durch Anwendung der Rechenregeln für Funktionsgrenzwerte erhalten wir x→a lim ( f g)(x) − ( f g)(a) x→a lim x −a = lim f (x)g(x) − f (a)g(a) x −a x→a f (x)g(x) − f (a)g(x) + f (a)g(x) − f (a)g(a) x −a x→a —– 135 —– = = lim ( f (x) − f (a))g(x) x −a + lim f (a)(g(x) − g(a)) x −a g(x) − g(a) f (x) − f (a) lim g(x) + f (a) lim = lim x→a x→a x→a x −a x −a x→a (6.6) Folgerung x→a = f 0 (a)g(a) + f (a)g 0 (a). Für jedes n ∈ N sei f n : R → R gegeben durch f n (x) = x n für alle x ∈ R. Dann gilt f n0 (a) = na n−1 für alle a ∈ R und n ∈ N, insbesondere ist die Funktion f n auf ihrem gesamten Definitionsbereich differenzierbar. Beweis: Sei a ∈ R. Wir beweisen die Gleichung f n0 (a) = na n−1 durch vollständige Induktion über n. Für n = 1 gilt f10 (a) = id0 (a) = 1 = 1 · a0 . Sei nun n ∈ N, und setzen wir die Gleichung für n voraus. Dann folgt 0 f n+1 (a) = ( f n f1 )0 (a) = = f n0 (a) f1 (a) + f n (a) f10 (a) na n + a n = Ind.−V. = (n + 1)a n . na n−1 · a + a n · 1 Zusammen mit der Summenregel ergibt sich aus Folgerung (6.6) unmittelbar, dass alle Polynomfunktionen auf ganz R differenzierbar sind. (6.7) Satz (Quotientenregel) Sei D ⊆ R eine beliebige Teilmenge, seien f , g : D → R Funktionen mit g(x) 6= 0 für alle x ∈ D. Sei a ∈ D ein Punkt mit der Eigenschaft, dass f und g in a differenzierbar sind. Dann ist die Funktion f g in a differenzierbar, und es gilt 0 f g Beweis: (a) f 0 (a)g(a) − f (a)g 0 (a) = g(a)2 . Auf Grund der Voraussetzungen existiert der Grenzwert lim g(x) − g(a) x −a x→a g 0 (a). = Nach (6.3) ist g an der Stelle a auch stetig, es gilt also lim g(x) = g(a). Wir zeigen nun zunächst, dass die Funktion 1 g x→a an der Stelle a differenzierbar ist und die Gleichung 0 1 g (a) —– = 136 − g 0 (a) g(a)2 —– erfüllt ist. Auf Grund der Rechenregeln für Funktionsgrenzwerte und wegen g(a) 6= 0 gilt lim x→a 1 g(x) − 1 g(a) = x −a lim g(a) − g(x) 1 x −a g(x)g(a) x→a lim = g(a)g(a) − g 0 (a) g(a)2 1 lim x −a x→a 1 (−g 0 (a)) · = g(a) − g(x) = x→a g(x)g(a) . Mit Hilfe der Produktregel erhalten wir nun 0 f g f 0 (a) g(a) + f (a) − (a) g 0 (a) = f · 0 g (a) f 0 (a)g(a) g(a)2 1 = g(a)2 f 0 (a) = + 1 g f (a)(−g 0 (a)) (a) + f (a) = g(a)2 0 1 g (a) = f 0 (a)g(a) − f (a)g 0 (a) g(a)2 . Wir haben oben gezeigt, dass für jedes n ∈ N die Ableitung von f n (x) = x n durch f n0 (x) = nx n−1 gegeben ist. Mit der Quotientenregel kann man überprüfen, dass diese Formel auch im Fall n ∈ Z mit n < 0 die richtige Ableitung liefert. Es gilt dann nämlich m = −n ∈ N, außerdem f m = 1 , fn und auf Grund der bereits bewiesenen Formel erhalten × wir für alle x ∈ R jeweils f n0 (x) = 1 0 fm (x) = = − f m0 (x) = f m (x)2 nx −n−1 · x 2n = − mx m−1 x 2m = − (−n)x −n−1 x −2n nx n−1 . Der einzige Unterschied zum Fall n ∈ N besteht darin, dass der Definitionsbereich von f n und f n0 nicht durch R, sondern durch R = R \ {0} gegeben ist. Wir bemerken noch, dass die Ableitungsregel f n0 (x) = nx n−1 für n = 0 als einzige ganze Zahl nicht gültig ist. (6.8) Satz (Kettenregel) Seien D und E Teilmengen von R und f : D → R, g : E → R Funktionen mit f (D) ⊆ E. Sei a ∈ D ein Punkt mit der Eigenschaft, dass f in a differenzierbar ist und dass g in f (a) differenzierbar ist. Dann ist auch g ◦ f : D → R im Punkt a differenzierbar, und es gilt (g ◦ f )0 (a) Beweis: = g 0 ( f (a)) f 0 (a). Sei b = f (a) und die Funktion g̃ : E → R definiert durch g( y) − g(b) für y 6= b y−b g̃( y) = 0 g (b) für y = b. —– 137 —– Weil die Funktion g in b differenzierbar ist, gilt lim g̃( y) y→b = lim g( y) − g(b) g 0 (b) = y−b y→b = g̃(b) , mit anderen Worten, die Funktion g̃ ist im Punkt b stetig. Weil f im Punkt a und g̃ im Punkt b = f (a) stetig ist, handelt es sich bei g̃ ◦ f um eine im Punkt a stetige Funktion. Wir betrachten nun den Differentialquotienten der Funktion g ◦ f . Ist x ∈ D ein Punkt mit f (x) 6= f (a), dann gilt (g ◦ f )(x) − (g ◦ f )(a) x −a = (g ◦ f )(x) − (g ◦ f )(a) f (x) − f (a) · f (x) − f (a) x −a = (g̃ ◦ f )(x) · f (x) − f (a) x −a . Ist x 6= a und f (x) = f (a), dann ist die Gleichung (g ◦ f )(x) − (g ◦ f )(a) = f (x) − f (a) (g̃ ◦ f )(x) · x −a x −a offenbar auch erfüllt, denn dann steht auf beiden Seiten eine Null. Insgesamt erhalten wir somit (g ◦ f )(x) − (g ◦ f )(a) f (x) − f (a) = lim = lim (g̃ ◦ f )(x) lim x→a x→a x→a x −a x −a (g̃ ◦ f )(a) f 0 (a) g 0 (b) f 0 (a) = g 0 ( f (a)) f 0 (a) = Wir bestimmen die Ableitung der Funktion h : R → R, x 7→ (x 2 + 5)7 mit Hilfe der Kettenregel. Seien f , g : R → R gegeben durch f (x) = x 2 + 5 und g(x) = x 7 für alle x ∈ R. Dann ist h = g ◦ f , und die Ableitungen von f und g sind gegeben durch f 0 (x) = 2x und g 0 (x) = 7x 6 für x ∈ R. Die Kettenregel liefert also h0 (x) (6.9) Satz = (g ◦ f )0 (x) = f 0 (x)g 0 ( f (x)) = 2x · 7(x 2 + 5)6 = 14x(x 2 + 5)6 . (Umkehrregel) Sei I ⊆ R ein (endliches oder unendliches) offenes Intervall, f : I → R stetig und streng monoton wachsend. Sei J = f (I) und g = f −1 die Umkehrfunktion von f . Ist f an einer Stelle a ∈ I differenzierbar und gilt f 0 (a) 6= 0, dann ist auch g an der Stelle b = f (a) differenzierbar, und es gilt g 0 (b) Beweis: 1 = f 1 = 0 (a) f 0 (g(b)) . Sei ( yn )n∈N eine Folge in J \ {b}, die gegen b konvergiert. Definieren wir x n = g( yn ) für alle n ∈ N, so ist (x n )n∈N eine Folge in I \ {a}. Nach Satz (5.19) ist mit der Funktion f auch die Funktion g stetig, also gilt limn x n = limn g( yn ) = g(b) = f −1 ( f (a)) = a. Auf Grund der Differenzierbarkeit von f im Punkt a und wegen f 0 (a) 6= 0 gilt lim n→∞ g( yn ) − g(b) yn − b = lim n→∞ xn − a = f (x n ) − f (a) lim n→∞ = 1 f 0 (a) —– = 138 1 f 0 (g(b)) —– . 1 f (x n ) − f (a) xn − a Damit ist g 0 (b) = lim g( y) − g(b) y−b y→b 1 = f 0 (g(b)) bewiesen. (6.10) Folgerung Sei k ∈ N und g k : R+ → R+ , x 7→ p und es gilt g k0 (x) = 1k ( k x)1−k für alle x ∈ R+ . Beweis: p k x. Dann ist g k auf R+ differenzierbar, Wie wir bereits in §5 festgestellt haben, ist g k die Umkehrfunktion der Funktion f k : R+ → R+ gegeben durch x 7→ x k . Für alle x ∈ R+ gilt f k0 (x) = k x k−1 , die Umkehrregel liefert also g k0 (x) = 1 1 = f k0 (g k (x)) = p f k0 ( k x) k( p k 1 1 p ( k x)1−k . k = x)k−1 Weiter unten werden wir mit Hilfe der Umkehrregel auch die Ableitungen der Logarithmusfunktionen bestimmen. (6.11) Folgerung Sei r ∈ Q, r 6= 0 und f r : R+ → R, x 7→ x r . Dann gilt f r0 (x) = r x r−1 x ∈ R+ . für alle Beweis: Sei r = ab mit a ∈ Z, a 6= 0 und b ∈ N. Bezeichnen wir mit f a , g b : R+ → R+ die Potenzfunktion f a (x) = x a p bzw. g b (x) = b x, dann gilt f r = g b ◦ f a , denn für alle x ∈ R+ ist (g b ◦ f a )(x) = g b ( f a (x)) = g b (x a ) = p b xa = x a/b = f r (x). p Mit Hilfe der Kettenregel und der bereits bewiesenen Formel g 0b (x) = 1b ( b x)1−b erhalten wir f r0 (x) = 1 p b ( x a )1−b a x a−1 b = (g b ◦ f a )0 (x) a b a (x b )1−b x a−1 g 0b ( f a (x)) f a0 (x) = = a r x b (1−b)+(a−1) = = g 0b (x a ) f a0 (x) a r x b −1 = = r x r−1 Man kann zeigen, dass diese Ableitungsregel auch für irrationales r ∈ R \ {0} gültig bleibt, indem man die Regel für rationales r verwendet und einen Grenzübergang durchführt. Hierzu benötigt man allerdings einen Satz über die Vertauschbarkeit der Ableitung mit Grenzübergängen, den wir hier aus Zeitgründen nicht behandeln können. —– 139 —– (III) Der Mittelwertsatz (6.12) Definition Sei D ⊆ R, f : D → R eine Funktion und a ∈ D ein beliebiger Punkt. Man nannt a ein (i) lokales Maximum von f , wenn ein " ∈ R+ existiert, so dass f (a) ≥ f (x) für alle x ∈ D mit |x − a| < " gilt, und ein (ii) globales Maximum von f , wenn f (a) ≥ f (x) für alle x ∈ D erfüllt ist. Entsprechend sind die Begriffe lokales bzw. globales Minimum definiert. Das Wort Extremum ist der gemeinsame Oberbegriff für Minimum und Maximum. Man kann somit auch von lokalen oder globalen Extremstellen sprechen. Offenbar ist jedes globale Extremum auch ein lokales, während die Umkehrung im Allgemeinen falsch ist. (6.13) Proposition (notwendiges Kriterium für Extrema) Sei D ⊆ R, f : D → R eine Funktion und a ∈ D ein lokales Extremum von f . Ist die Funktion f in a differenzierbar, dann gilt f 0 (a) = 0. Beweis: Nach Voraussetzung ist a ein innerer Punkt von D, es gibt also ein " ∈ R+ mit der Eigenschaft, dass ]a − ", a + "[ in D enthalten ist. Wir gehen davon aus, dass es sich bei a um ein lokales Maximum von f handelt; im Fall eines Minimums läuft der Beweis völlig analog. Nach eventueller Verkleinerung von " ist dann f (a) ≥ f (x) für alle x ∈ D mit |x − a| < " erfüllt. Sei nun N ∈ N so groß gewählt, dass 1 N < " gilt. Wir definieren Folgen (x n )n≥N und ( yn )n≥N durch xn = a − 1 n yn = a + und 1 n für alle n ∈ N. Wegen f (x n ) − f (a) ≤ 0 und x n − a = − 1n < 0 für alle n ≥ N gilt f 0 (a) = lim n→∞ Andererseits gilt f ( yn ) − f (a) ≤ 0 sowie yn − a = f 0 (a) = 1 n f (x n ) − f (a) xn − a ≥ 0. > 0 für alle n ≥ N und somit lim n→∞ f ( yn ) − f (a) yn − a Insgesamt ist also nur f 0 (a) = 0 möglich. ≤ 0. —– 140 —– (6.14) Satz (Satz von Rolle) Seien a, b ∈ R mit a < b. Ferner sei f : [a, b] → R eine stetige Funktion mit f (a) = f (b), die darüber hinaus auf ]a, b[ differenzierbar ist. Dann gibt es ein c ∈ ]a, b[ mit f 0 (c) = 0. Beweis: Wenn f auf [a, b] konstant ist, dann ist die Aussage trivial, denn in diesem Fall gilt f 0 (x) = 0 für alle x ∈ ]a, b[. Nehmen wir nun an, dass ein x ∈ ]a, b[ mit f (x) > f (a) existiert. Nach dem Maximumsprinzip (5.17) nimmt f sein Maximum in einem Punkt c ∈ [a, b] an, wobei c ∈ {a, b} allerdings ausgeschlossen ist, denn dort ist der Funktionswert jedenfalls nicht maximal. Dieses c ist dann nach Definition auch ein lokales Maximum, und das notwendige Kriterium für Extrema (6.13) liefert f 0 (c) = 0. Wenn f auf [a, b] nicht konstant ist und auch kein x ∈ ]a, b[ mit f (x) > f (a) existiert, dann gibt es ein x ∈ ]a, b[ mit f (x) < f (a). Der Beweis verläuft dann analog zum vorherigen Fall, an Stelle des globalen Maximums betrachtet man das globale Minimum. (6.15) Satz (Mittelwertsatz der Differentialrechnung) Seien a, b ∈ R mit a < b. Ferner sei f : [a, b] → R stetig und auf ]a, b[ differenzierbar. Dann gibt es ein c ∈ ]a, b[ mit f 0 (c) = —– f (b) − f (a) b−a 141 —– . Beweis: Wir wenden den Satz von Rolle auf die Funktion g(x) = f (x) − f (b)− f (a) (x b−a − a) an. Es gilt g(a) = f (a) = g(b), außerdem ist die Funktion g stetig auf [a, b] und differenzierbar auf ]a, b[. Auf Grund des Satzes von Rolle finden wir ein c ∈ ]a, b[ mit g 0 (c) = 0, und es folgt f 0 (c) = f (b) − f (a) g 0 (c) + f (b) − f (a) = b−a b−a . Seien a, b ∈ R mit a < b. Ferner sei f : [a, b] → R stetig und es gelte (6.16) Folgerung f (x) = 0 für alle x ∈ ]a, b[. Dann ist f auf [a, b] konstant. 0 Beweis: Angenommen, es gibt ein c ∈ ]a, b] mit f (c) 6= f (a). Nach dem Mittelwertsatz finden wir dann ein x ∈ ]a, c[ mit f 0 (c) f (c) − f (a) = c−a 6= 0 im Widerspruch zur Voraussetzung. Häufig wird der Mittelwertsatz auch in der folgenden verallgemeinerten Form verwendet. (6.17) Satz Seien a, b ∈ R mit a < b und f , g : [a, b] → R stetige, auf ]a, b[ differenzierbare Funktionen, wobei wir g 0 (x) 6= 0 für alle x ∈ ]a, b[ voraussetzen. Dann gibt es ein c ∈ ]a, b[ mit f 0 (c) Beweis: f (b) − f (a) = g 0 (c) g(b) − g(a) Auf Grund unserer Voraussetzungen muss g(a) 6= g(b) gelten, weil ansonsten nach dem Satz von Rolle ein x ∈ ]a, b[ mit g 0 (x) = 0 existieren würde. Wir betrachten nun auf [a, b] die Funktion = h(x) f (x) − g(x) f (b) − f (a) g(b) − g(a) . Diese erfüllt die Voraussetzungen des Satzes von Rolle, denn es gilt h(a) = = f (a) − g(a) f (b) − f (a) g(b) − g(a) f (a)g(b) − f (b)g(a) g(b) − g(a) = f (a)g(b) − f (a)g(a) − f (b)g(a) + f (a)g(a) = = g(b) − g(a) f (b)g(b) − f (b)g(a) − f (b)g(b) + f (a)g(b) f (b) − g(b) g(b) − g(a) f (b) − f (a) g(b) − g(a) = h(b). Es gibt also ein x ∈ ]a, b[ mit h0 (x) = 0 ⇔ f 0 (x) − g 0 (x) f (b) − f (a) g(b) − g(a) —– =0 142 ⇔ —– f 0 (x) g 0 (x) = f (b) − f (a) g(b) − g(a) Als erste Anwendung des Mittelwertsatzes bestimmen wir die Ableitung der Exponential- und Logarithmusfunktionen. An Stelle von exp b (x) (für x, b ∈ R und b > 1) schreiben wir im weiteren Verlauf häufig auch b x . Für 0 < b < 1 definieren wir b x = exp1/b (x). Neben b x+ y = b x b y gelten auch die Rechenregeln (b x ) y = b x y und (ab) x = a x b y für a, b ∈ R+ und nicht nur für rationale, sondern beliebige reelle x, y. Wie schon zuvor beweist man dies dadurch, dass man x und y durch Folgen (x n )n∈N , ( yn )n∈N rationaler Zahlen approximiert, die Gültigkeit von (b x n ) yn = b x n yn und (ab) x n = a x n b yn verwendet und den Limes n → ∞ bildet. (6.18) Lemma Sei b ∈ R, b > 1. Dann existiert der Grenzwert lim f (x) für die Funktion x→0 × f : R −→ R gegeben durch f (x) = bx − 1 x . Zunächst zeigen wir, dass f auf R+ streng monoton wachsend ist. Für x, y ∈ R mit 0 < y < x gilt Beweis: f (x) bx − 1 = = x (b y ) x/ y − 1 = x b y − 1 (b y ) x/ y − 1 · . x by − 1 Durch Anwendung des Mittelwertsatzes auf die Funktion g : [1, b y ] → R, t 7→ t y/x mit der Ableitung g 0 (t) = y x t y/x−1 erhalten wir ein z ∈ ]1, b y [ mit (b y ) x/ y − 1 by g(b y ) − g(1) = −1 by = −1 g 0 (z) y = x z y/x−1 . Daraus folgt f (x) = b y − 1 (b y ) x/ y − 1 · x by − 1 = b y − 1 x x/ y−1 · z x y wobei wir im letzten Schritt verwendet haben, dass z > 1 und + = x y by − 1 y z x/ y−1 > by − 1 y = f ( y) , > 1 gilt. Damit ist nachgewiesen, dass die Funktion f auf R streng monoton wächst. Damit ist nun leicht zu sehen, dass s = inf { f (x) | x ∈ R+ } der gesuchte Grenzwert von f ist. Für den Nachweise sei (hn )n∈N eine Folge in R× mit limn hn = 0. Zunächst zeigen wir, dass limn f (|hn |) = s gilt. Nach Definition von s gibt es ein δ ∈ R+ mit f (δ) < s + ". Wählen wir N ∈ N so groß, dass |hn | < δ für alle n ≥ N erfüllt ist, dann folgt s ≤ f (|hn |) < f (δ) < s + " auf Grund des streng montonen Wachstums von f und somit | f (|hn |) − s| < " für alle n ≥ N . Damit ist limn f (|hh |) = s bewiesen. Als nächstes bemerken wir, dass für alle h ∈ R+ die Gleichung f (−h) = b−h − 1 −h = b−h · 1 − b−h h = b−h · bh − 1 h = gilt. Weil die Funktion x 7→ b x im Nullpunkt stetig ist, gilt limn b−|hn | = b0 = 1 und somit lim b−|hn | f (hn ) = lim b−|hn | lim f (hn ) = 1·s = n→∞ n→∞ n→∞ b−h f (h) s. Sei nun " ∈ R+ vorgegeben. Auf Grund unserer bisherigen Überlegungen gibt es ein N1 ∈ N mit | f (|hn |) − s| < " für alle n ≥ N1 und ein N2 ∈ N mit |e−|hn | f (|hn |) − s| < " für alle n ≥ N2 . Weil f (hn ) für jedes n ∈ N mit f (|hn |) oder mit e−|hn | f (|hn |) übereinstimmt, gilt | f (hn ) − s| < " für alle n ∈ N mit n ≥ max{N1 , N2 }. —– 143 —– Die Exponential- und Logarithmusfunktion exp : R → R und ln : R+ → R zur (6.19) Satz Basis e (der Eulerschen Zahl) sind auf ihrem gesamten Definitionsbereich differenzierbar. Es gilt exp0 (x) = exp(x) für alle Beweis: 1 ln0 (x) = x ∈ R und x ∈ R+ . für alle x Zunächst beweisen wir, dass die Exponentialfunktion auf ihrem gesamten Definitionsbereich differenzier- bar ist. Sei x ∈ R beliebig vorgegeben. Dann gilt exp0 (x) = lim e x+h − e x = h h→0 lim e x · eh − 1 = h h→0 se x , wobei s den Grenzwert aus (6.18) bezeichnet. Wäre s = 0, dann müsste die Exponentialfunktion nach (6.16) konstant sein, was offensichtlich nicht der Fall ist. So aber können wir die Umkehrregel (6.9) anwenden. Nach ihr ist mit exp auch die Umkehrfunktion ln differenzierbar, und für alle x ∈ R+ gilt ln0 (x) 1 = 1 = seln(x) sx . Wir bestimmen nun die konstante s, indem wir die Ableitung von ln an der Stelle x = 1 explizit berechnen. Mit Hilfe der Rechenregel ln(x y) = ln(x) + ln( y) erhält man durch vollständige Induktion ln(x n ) = n ln(x) für alle x ∈ R+ und n ∈ N. Es folgt 1 s 0 = ln (1) lim n · ln 1 + 1n n→∞ = lim ln(1 + h) − ln(1) lim ln (1 + 1n )n = = h h→0 = n→∞ ln lim ln(1 + 1n ) lim (1 + n→∞ = 1 n n→∞ 1 n ) n = ln e = 1 , wobei wir im vorletzten Schritt die Definition der Eulerschen Zahl aus (4.29) verwendet haben. Es folgt s = 1, und Einsetzen liefert die angegebenen Formeln für die Ableitungen von exp und log. Wir können nun auch die Ableitungen für exp b und log b zu einer beliebigen Basis b ∈ R mit b > 1 angeben. Es gilt eln(b) = b, und für jedes x ∈ R folgt daraus exp b (x) = bx = (eln(b) ) x = e x ln(b) = exp(x ln(b)). Mit Hilfe der Kettenregel erhalten wir exp0b (x) = ln(b) exp0 (x ln(b)) = ln(b) exp(x ln(b)) Wendet man log b auf beide Seiten der Gleichung ln(x) ln(x) exp b = exp · ln(b) ln(b) ln(b) = = ln(x) ln(b) und damit —– 144 log0b (x) = —– ln(b) exp b (x). exp(ln(x)) an, so erhält man log b (x) = ln0 (x) ln(b) = = x 1 x ln(b) . Zum Abschluss dieses Abschnitts beweisen wir mit Hilfe des verallgemeinerten Mittelwertsatzes noch zwei wichtige Regeln zur Bestimmung von Funktionsgrenzwerten. (6.20) Satz (l’Hospital’sche Regeln) Seien a, b ∈ R, a < b, und seien f , g : ]a, b[ → R differenzierbare Funktionen. Es sei g 0 (x) 6= 0 für alle x ∈ ]a, b[. (i) Aus lim f (x) = lim g(x) = 0 oder lim f (x) = lim g(x) = +∞ folgt x→a x→a x→a x→a f (x) lim = g(x) x→a f 0 (x) lim g 0 (x) x→a (ii) Aus lim f (x) = lim g(x) = 0 oder lim f (x) = lim g(x) = +∞ folgt x→b x→b x→b x→b f (x) lim = g(x) x→b f 0 (x) lim g 0 (x) x→b d.h. wenn die rechte Seite der Gleichung als eigentlicher Grenzwert existiert, so existiert auch der linke Grenzwert, und beide Werte stimmen überein. Beweis: Wir beschränken uns auf den Beweis der Aussage (i), da der Beweis von (ii) weitgehend analog verläuft. Zunächst beweisen wir (i) unter der Voraussetzung lim f (x) = x→a = lim g(x) x→a 0. Durch die Festlegung f (a) = g(a) = 0 können wir f und g als stetige Funktionen auf dem Intervall [a, b[ betrachten. Sei c = lim f 0 (x)/g 0 (x) und (x n )n∈N eine Folge in ]a, b[ mit limn x n = a. Zu zeigen ist x→a f (x n ) lim n→∞ g(x n ) = c. Dabei ist zu beachten, dass g(x n ) 6= 0 für jedes n ∈ N gilt, da ansonsten nach dem Satz von Rolle ein Punkt yn ∈ a, x n mit g 0 ( yn ) = 0 existieren würde, im Widerspruch zur Voraussetzung. Auf Grund des verallgemeinerten Mittelwertsatzes gibt es für jedes n ∈ N jeweils ein yn ∈ a, x n mit f 0 ( yn ) g 0 ( yn ) = f (x n ) − f (a) g(x n ) − g(a) = f (x n ) g(x n ) . Mit (x n )n∈N konvergiert auch die Folge ( yn )n∈N gegen a, und auf Grund der Voraussetzung läuft der Quotient f 0 ( yn )/g 0 ( yn ) = f (x n )/g(x n ) damit gegen den Wert c. Nun beweisen wir (i) unter der Voraussetzung lim f (x) x→a = lim g(x) x→b = +∞. Sei c wieder der Grenzwert auf der rechten Seite der Gleichung und (x n )n∈N eine Folge in ]a, b[ mit limn x n = a. Zu zeigen ist auch hier lim n→∞ f (x n ) g(x n ) —– 145 = —– c. Die Funktion h = f 0 /g 0 kann durch die Festlegung h(a) = c zu einer stetigen Funktion auf [a, b[ gemacht werden. f 0 (x) Sei " ∈ R+ vorgegeben. Nach dem "-δ-Kriterium gibt es ein δ ∈ R+ , so dass aus |x − a| < δ jeweils | g 0 (x) − c| < 12 " folgt. Sei nun y = a + δ. Wegen limn x n = a und limn f (x n ) = limn g(x n ) = +∞ gibt es ein N ∈ N, so dass x n < y, f (x n ) > 0 und g(x n ) > max{0, g( y)} für alle n ≥ N erfüllt ist. Für diese n gilt f (x n ) − f ( y) 1 − · g(x n ) − g( y) 1 − g( y) g(x n ) = f ( y) f (x n ) f (x n ) − f ( y) g(x n ) − g( y) · f (x n ) g(x n ) − g( y) · f (x n ) − f ( y) g( yn ) = f (x n ) g(x n ) . Auf Grund des verallgemeinerten Mittelwertsatzes finden wir für jedes n ≥ N ein yn ∈ x n , y mit f 0 ( yn ) 1 − · g 0 ( yn ) 1 − Wegen | yn − a| < δ gilt c − 21 " < f 0 ( yn ) g 0 ( yn ) g( y) g(x n ) = f ( y) f (x n ) f (x n ) . g(x n ) < c + 21 ". Der Faktor rechts konvergiert für n → ∞ gegen den Wert 1, so dass die Differenz zwischen f 0 ( yn )/g 0 ( yn ) und f (x n )/g(x n ) beliebig klein wird. Also gibt es ein N1 ≥ N mit c−" < f (x n ) g(x n ) < c + " für alle n ≥ N1 . Dies zeigt, dass der größte Häufungspunkt von f (x n )/g(x n ) nach oben durch c + " und der kleinste Häufungspunkt nach unten durch c − " abgeschätzt werden kann. Weil " beliebig klein gewählt werden kann, ist c tatsächlich der einzige Häufungspunkt der Folge, und nach Folgerung (4.24) bedeutet dies limn f (x n )/g(x n ) = c. Als Anwendungsbeispiel für die l’Hospitalsche Regel berechnen wir den Grenzwert lim x x→0 1 − ex auf dem Definitionsbereich D = ]0, 1[. Definieren wir die Funktionen f und g auf D durch f (x) = x und g(x) = 1 − e x , dann sind beide Funktionen differenzierbar, und es gilt g 0 (x) = −e x 6= 0 für alle x ∈ D. Auf Grund der Stetigkeit von x 7→ x und x 7→ 1 − e x im Nullpunkt gilt lim f (x) x→0 = lim g(x) x→0 = 0. Die Voraussetzungen der Ersten l’Hospitalschen Regel sind also erfüllt, und wir erhalten lim x→0 x 1− ex = lim 1 x→0 (−e x ) = 1 (−e0 ) = −1. Um den Anwendungsbereich der l’Hospitalschen Regeln zu erweitern, zeigen wir —– 146 —– (6.21) Lemma (i) Sei a > 0 und f : ]a, +∞[ → R eine beliebige Funktion und g : 0, 1a → R gegeben durch g(x) = f ( 1x ). Dann gilt lim x→+∞ f (x) = lim x→0 g(x). (ii) Sei b < 0 und f : ]−∞, b[ → R beliebig und g : 1b , 0 gegeben durch g(x) = 1x . Dann gilt lim x→−∞ f (x) = lim x→0 g(x). Dies bedeutet jeweils: Der Grenzwert auf der linken Seite der Gleichung existiert genau dann, wenn der Grenzwert rechts existiert, und in diesem Fall stimmen die beiden Werte überein. Die Aussage ist sowohl für uneigentliche als auch für eigentliche Grenzwerte gültig. Wir beschränken uns auf den Beweis von (i) und setzen voraus, dass der Grenzwert c = lim x→+∞ f (x) existiert. Ist (x n )n∈N eine Folge in 0, 1a mit limn x n = 0, dann ist ( x1 )n∈N eine Folge in ]a, +∞[ mit limn x1 = +∞. Beweis: n n Es folgt limn g(x n ) = limn f ( x1 ) = c. Gehen wir nun umgekehrt davon aus, dass c = lim x→0 g(x) existiert. Ist n (x n )n∈N eine Folge in ]a, +∞[ mit limn x n = +∞, dann ist ( x1 )n∈N eine Folge in 0, 1a mit limn x1 = 0. Daraus folgt n limn f (x n ) = limn g( x1 ) = c. n n Als weiteres Anwendungsbeispiel für die l’Hospitalschen Regeln bestimmen wir den Grenzwert x lim . x→+∞ e x Dazu betrachten wir die Funktionen f (x) = x und g(x) = e x auf ]1, +∞[. Es gilt lim f ( 1x ) = x→0 lim f (x) = +∞ lim g( 1x ) und x→+∞ x→0 = lim g(x) = +∞. x→+∞ Außerdem ist die Funktion x 7→ g( 1x ) = e−1/x differenzierbar, und die Ableitung x 7→ − x12 e−1/x nimmt auf ]0, 1[ nicht den Wert 0 an. Damit sind alle Voraussetzungen für die Anwendung der l’Hospitalschen Regel erfüllt, und wir erhalten lim x→+∞ x ex = 1 x x→0 e 1/x lim = lim x→0 (− x12 ) = (− x12 )e1/x lim e−1/x x→0 = lim e−x x→+∞ = 0. Mit Hilfe dieses Ergebnisses können wir auch den Grenzwert lim x2 ex berechnen, und zwar durch eine weitere Anwendung der l’Hospitalschen Regeln. Es gilt x→+∞ lim x→+∞ x2 ex = 1 x2 x→0 e 1/x lim = (−2) x3 x→0 (− 1 )e 1/x x2 lim = 1 x x→0 e 1/x 2 · lim = 2·0 Durch einen Induktionsbeweis kann man zeigen, dass xn = 0 ex für alle n ∈ N gilt. Die Exponentialfunktion wächst also schneller als jede Polynomfunktion. lim x→+∞ —– 147 —– = 0. (IV) Montonieverhalten und Kriterien für Extrema Wir haben oben bereits ein notwendiges Kriterium für das Auftreten lokaler Extrema formuliert, nämlich das Verschwinden der ersten Ableitung. Wie bereits aus dem Schulunterricht bekannt, ist dieses Kriterium aber nicht hinreichend. Für die Funktion f (x) = x 3 gilt beispielsweise f 0 (0) = 0, ohne dass die Funktion an dieser Stelle ein lokales Extremum besitzt. (6.22) Satz (Ableitung und Monotonieverhalten) Seien a, b ∈ R mit a < b. Sei f : [a, b] → R eine stetige, auf ]a, b[ differenzierbare Funktion. (i) Gilt f 0 (x) ≥ 0 für alle x ∈ ]a, b[, dann ist f auf [a, b] monoton wachsend. (ii) Gilt f 0 (x) > 0 für alle x ∈ ]a, b[, dann ist f auf [a, b] streng monoton wachsend. (iii) Gilt f 0 (x) ≤ 0 für alle x ∈ ]a, b[, dann ist f auf [a, b] monoton fallend. (iv) Gilt f 0 (x) < 0 für alle x ∈ ]a, b[, dann ist f auf [a, b] streng monoton fallend. Beweis: zu (i) Angenommen, es gilt f 0 (x) ≥ 0 für alle x ∈ ]a, b[, aber f ist auf I nicht monoton wachsend. Dann gibt es x, y ∈ [a, b] mit x < y und f (x) > f ( y). Nach dem Mittelwertsatz (6.15)) gibt es ein c ∈ ]x, y[ ⊆ Ĩ mit f 0 (c) f ( y) − f (x) = y−x < 0 im Widerspruch zur Voraussetzung. zu (ii) Nehmen wir an, es gilt f 0 (x) > 0 für alle x ∈ ]a, b[, aber f ist auf [a, b] nicht streng monoton wachsend. Dann finden wir x, y ∈ [a, b] mit x < y und f (x) ≥ f ( y). Auf Grund des Mittelwertsatzes existiert ein c ∈ x, y mit f 0 (c) = f ( y) − f (x) y−x ≤ 0 , was erneut der Voraussetzung widerspricht. Der Beweis der Aussagen (iii) und (iv) verläuft vollkommen analog. Sei D ⊆ R und f : D → R eine Funktion. Definieren wir die Menge D1 ⊆ R durch D1 = {x ∈ D | f ist in x differenzierbar } , so erhalten wir durch die Ableitung f 0 eine Funktion f 0 : D1 → R. Wir bezeichnen f als zweimal differenzierbar an der Stelle x ∈ D, wenn x in D1 liegt und die Funktion f 0 in x differenzierbar ist. Man bezeichnet dann f 00 (x) = ( f 0 )0 (x) als die zweite Ableitung von f an der Stelle x. Mit demselben Ansatz lassen sich auch höhere Ableitungen definieren. Sei D0 = D und f (0) = f . Für jedes n ∈ N0 definieren wir rekursiv Dn+1 = {x ∈ Dn | f (n) ist in x differenzierbar } —– 148 —– und f (n+1) (x) = ( f (n) )0 (x) für alle x ∈ Dn+1 . Man sagt, die Funktion f ist an der Stelle x n-mal differenzierbar, wenn x in Dn liegt. Gilt Dn = D, dann bezeichnet man f insgesamt als n-mal differenzierbare Funktion. Nach Definition gilt D = D0 ⊇ D1 ⊇ ... ⊇ Dn für alle n ∈ N. Liegt x in Dn und ist f (n) in x stetig, so bezeichnet man f an der Stelle x als n-mal stetig differenzierbar. Ist Dn = D und f (n) auf ganz D stetig, so ist f insgesamt eine n-mal stetig differenzierbare Funktion auf D. Die Menge dieser Funktionen D wird mit C n (D) bezeichnet. Insbesondere steht C 0 (D) für die Menge der stetigen Funktionen auf D. Gilt Dn = D für alle n ∈ N, so ist f beliebig oft differenzierbar und damit auch n-mal stetig differenzierbar für jedes n ∈ N, denn jede differenzierbare Funktion ist nach (6.3) stetig. Die Menge der Funktionen mit dieser Eigenschaft wird durch C ∞ (D) bezeichnet. Wir haben in (6.2) die folgende äquivalente Charakterisierung differenzierbarer Funktionen angegeben: Eine Funktion f : D → R ist genau dann differenzierbar an einer Stelle a ∈ D, wenn ein c ∈ R und eine Funktion ψ : D → R mit f (x) = f (a) + c(x − a) + ψ(x) für alle x ∈ D ψ(x) =0 x −a existiert. In diesem Fall gilt c = f 0 (a). Die Funktion f wird an der Stelle a also durch eine Polynomfunktion ersten und lim x→a Grades approximiert, und zwar durch τ1 ( f , a)(x) = f (a) + f 0 (a)(x − a). Man bezeichnet τ1 ( f , a) als das Taylorpolynom erster Ordnung von f an der Stelle a. Es ist dadurch gekennzeichnet, dass τ1 ( f , a)(a) = f (a) und τ1 ( f , a)0 (a) = f 0 (a) erfüllt ist. Unser Ziel besteht nun darin, die zweimal differenzierbaren Funktionen auf ähnliche Weise zu charakterisieren. Dazu suchen wir eine Polynomfunktion zweiten Grades p : R → R mit p(k) (a) = f (k) (a) für k = 0, 1, 2. Setzen wir p in der Form p(x) = u(x − a)2 + v(x − a) + w mit u, v, w ∈ R an, so gilt p0 (x) = 2u(x − a) + v und p00 (x) = 2u, also p00 (a) = 2u, p0 (a) = v und p(a) = w. Der Ansatz, dass die Ableitungen von p und f bis zum Grad 2 übereinstimmen, liefert u = 21 f 00 (a), v = f 0 (a) und w = f (a). Das gesuchte Polynom ist also p(x) = f (a) + f 0 (a)(x − a) + 12 f 00 (a)(x − a)2 . Man bezeichnet dieses Polynom mit τ2 ( f , a) und nennt es das Taylorpolynom zweiter Ordnung von f an der Stelle a. Wir werden uns nun anschauen, wie dieses Polynom mit der zweifachen Differenzierbarkeit einer Funktion zusammenhängt. Zur Vorbereitung beweisen wir (6.23) Lemma Seien a, b, c ∈ R mit a < c < b und f : ]a, b[\{c} → R eine beliebige Funktion. Wenn die beiden Grenzwerte lim x→c ( f |]a,c[ )(x) und lim x→c ( f |]c,b[ )(x) existieren und übereinstimmen, dann existiert auch der Grenzwert lim f (x), und es gilt lim f (x) = lim ( f |]a,c[ )(x) = x→c lim ( f |]c,b[ )(x). x→c x→c —– 149 —– x→c Beweis: Sei u der gemeinsame Grenzwert der Funktionen g = f |]a,c[ und h = f |]c,b[ für x → c. Erweitern wir den Definitionsbereich von g durch g(c) = u auf ]a, c] und den von h auf [c, b[ durch h(c) = u, dann sind die Funktionen g und h beide im Punkt c stetig. Sei nun (x n )n∈N eine Folge in ]a, b[ \ {c}, die gegen c konvergiert. Zu zeigen ist limn f (x n ) = u; sei dazu " ∈ R+ vorgegeben. Nach dem "-δ-Kriterium und auf Grund der Stetigkeit von g in c gibt es ein δ1 ∈ R+ mit der Eigenschaft, dass die Implikation |x − c| < δ1 ⇒ |g(x) − u| < " für alle x ∈ ]a, c[ erfüllt ist. Ebenso finden wir ein δ2 ∈ R+ mit |x − c| < δ2 ⇒ |h(x) − u| < " für alle x ∈ ]c, b[. Sei nun δ = min{δ1 , δ2 } und N ∈ N so groß gewählt, dass |x n − c| < δ für alle n ≥ N erfüllt ist. Für diese n gilt im Fall x n < c die Abschätzung | f (x n ) − u| = |g(x n ) − u| < " im Fall x n > c ebenso | f (x n ) − u| = |h(x n ) − u| < ". Damit ist limn f (x n ) = u nachgewiesen. Man bezeichnet lim ( f |]a,c[ )(x) als den linksseitigen und lim ( f |]c,b[ )(x) als den rechtsseitigen Grenzwert der Funkx→c x→c tion f , während lim f (x) der beidseitige Grenzwert genannt wird. Aus dem Lemma folgt, dass die l’Hospitalsche x→c Regel (6.20) (i) auch für beidseitige Grenzwerte gültig ist. (6.24) Satz Sei f : D → R eine Funktion und a ∈ D ein Punkt, in dem f zweimal differenzierbar ist. Dann gibt es eine Funktion ψ : D → R mit f (x) Beweis: = τ2 ( f , a)(x) + ψ(x) für alle x ∈ D und lim x→a ψ(x) (x − a)2 = 0. Für alle x ∈ D definieren wir ψ(x) = f (x) − τ2 ( f , a)(x). Mit f und τ2 ( f , a) ist auch ψ zweimal dif- ferenzierbar. Mit Hilfe der beidseitigen l’Hospitalschen Regel (s.o.) und der beiden Gleichungen ψ0 (a) = f 0 (a) − τ2 ( f , a)0 (a) = 0 und ψ00 (a) = f 00 (a) − τ2 ( f , a)00 (a) = 0 erhalten wir lim x→a ψ(x) (x − a)2 (6.25) Satz = lim x→a ψ0 (x) 2(x − a) 1 lim 2 x→a = ψ0 (x) − ψ0 (a) x −a = 1 00 ψ (a) 2 = 0 (hinreichendes Kriterium für lokale Maxima) Seien a, b, c ∈ R mit a < c < b. Sei f : ]a, b[ → R eine differenzierbare Funktion, die in c sogar zweimal differenzierbar ist, und es gelte f 0 (c) = 0 und f 00 (c) < 0. Dann besitzt f in c ein lokales Maximum. —– 150 —– Sei D = ]a, b[ und Dc = D \ {c}. Nach Satz (6.24) gibt es eine Funktion ψ : Dc → R mit f (x) = Beweis: 1 2 f (c) + f (c)(x − c)2 + ψ(x) für alle x ∈ Dc und 00 lim x→c ψ(c) = (x − c)2 0. Definieren wir ϕ : D → R durch ϕ(x) = ψ(x)/(x − c)2 für x 6= c und ϕ(c) = 0, dann ist ϕ im Punkt c stetig. Nach dem "-δ-Kriterium gibt es also für " = − 21 f 00 (c) ∈ R+ ein δ ∈ R+ mit |ϕ(x)| < " für alle x ∈ D mit |x − c| < δ. Insbesondere gilt für alle x ∈ Dc damit ϕ(x) < − 12 f 00 (c), also 1 2 f 00 (c)(x − c)2 + ψ(x) 1 2 = 1 2 f 00 (c)(x − c)2 + ϕ(x)(x − c)2 f 00 (c)(x − c)2 − 12 f 00 (c)(x − c)2 = < 0 und somit f (x) < f (c). Also ist c tatsächlich ein lokales Maximum von f . Nach demselben Schema beweist man (6.26) Satz (hinreichendes Kriterium für lokale Minima) Seien a, b, c ∈ R mit a < c < b. Sei f : ]a, b[ → R eine differenzierbare Funktion, die in c sogar zweimal differenzierbar ist, und es gelte f 0 (c) = 0 f 00 (c) > 0. und Dann besitzt f in c ein lokales Minimum. Die gerade angegebenen Kriterien sind jeweils hinreichend, aber nicht notwendig für die Existenz einer Extremstelle. So besitzt zum Beispiel die Funktion f (x) = x 4 in c = 0 ein lokales Minimum, aber statt f 00 (c) > 0 gilt f 00 (c) = 0. (V) Taylorpolynome und Taylorreihen Auch für n > 2 läst sich eine Funktion f : D → R, die in einem Punkt a mindestens n-fach differenzierbar ist, durch eine Polynomfunktion p approximieren, wobei der Grad ≤ n gewählt werden kann. Man bestimmt p so, dass p(`) (a) = f (`) (a) für 0 ≤ ` ≤ n erfüllt ist. Setzen wir die Polynomfunktion in der Form p(x) = a0 + a1 (x − a) + a2 (x − a)2 + ... + an (x − a)n mit a0 , a1 , ..., an ∈ R an, so sind die höheren Ableitungen von p gegeben durch p(`) (x) = n X k(k − 1) · ... · (k − ` + 1)(x − a)k−` ak = k=` n X k! k=` (k − `)! (x − a)k−` ak für 0≤`≤n , insbesondere gilt p(`) (a) = `!a` für 0 ≤ ` ≤ n. Die Koeffizienten des gesuchten Polynoms sind also gegeben durch a` = f (`) (a)/(`!), und das Polynom selbst ist gegeben durch τn ( f , a)(x) = p(x) = n X 1 k=0 —– 151 —– k! f (k) (a)(x − a)k . Man nennt es das Taylorpolynom n-ter Ordnung von f an der Stelle a. In Analogie zu Satz (6.24) gilt (6.27) Satz Sei n ∈ N, f : D → R eine Funktion und a ∈ D ein Punkt, in dem f mindestens n-mal differenzierbar ist. Dann gibt es eine Funktion ψ : D → R mit f (x) = τn ( f , a)(x) + ψ(x) für alle x ∈ D und lim x→a ψ(x) = 0. (x − a)n Wir definieren die Funktion ψ auf D durch ψ(x) = f (x) − τn ( f , a)(x). Mit f und τn ( f , a)(x) ist die Beweis: Funktion ψ n-mal differenzierbar in a, und es gilt ψ(k) (a) = f (k) (a) − τn ( f , a)(k) (a) = 0 für 0 ≤ k ≤ n. Durch (n − 1)-fache Anwendung der beidseitigen l’Hospitalschen Regel erhalten wir lim x→a ψ(x) = (x − a)n lim x→a ψ(n−1) (x) n!(x − a) 1 lim n! x→a = ψ(n−1) (x) − ψ(n−1) (a) (x − a) = 1 ψ(n) (a) n! = 0. (6.28) Lemma Sei n ∈ N, D ⊆ R, a ∈ D, und seien f , g : D → R zwei Funktionen, die beide im Punkt a mindestens n-mal differenzierbar sind. Dann gilt τn ( f + g, a) = τn ( f , a) + τn ( f , b) und τn (c f , a) = cτn ( f , a) für alle Durch vollständige Induktion und mit Hilfe der Summen- und Produktregel zeigt man zunächst, dass Beweis: (n) ( f + g) a ∈ D. (a) = f (n) (a) + g (n) (a) und (c f )(n) (a) = c f n (a) für alle n ∈ N gilt. Nun erhält man die Gleichungen direkt durch Einsetzen in die Definition des Taylorpolynoms. Es gilt τn ( f + g, a) = n X 1 k=0 k! ( f + g)(k) (a)(x − a)k = n X 1 k=0 = k! f (k) (a)(x − a)k + n X 1 k=0 k! g (k) (a)(x − a)k τn ( f , a) + τn (g, a) und τn (c f , a) = n X 1 k=0 (6.29) Folgerung k! (c f )(k) (a)(x − a)k = c n X 1 k=0 k! f (k) (a)(x − a)k = cτn ( f , a). Sei p : R → R eine Polynomfunktion vom Grad m ∈ N. Dann gilt für alle a, x ∈ R und n ≥ m jeweils die Gleichung p(x) = τn (p, a)(x). Also ist die Funktion p ihr eigenes n-tes Taylorpolynom für n ≥ m. —– 152 —– Beweis: Als Polynomfunktion vom Grad m kann p in der Form n X = p(x) ak (x − a)k a0 , ..., an ∈ R mit geeigneten k=0 dargestellt werden. Wegen Lemma (6.28) genügt es also, die Gleichung für den Fall p(x) = (x − a)m zu beweisen. Für 0 ≤ k ≤ m gilt p(k) (x) = m(m − 1)...(m − 1 + k)(x − a)m−k , und p(k) (x) = 0 für k > m. Es folgt p(k) (a) = 0 für 0 ≤ k < m, p(m) (a) = m! und p(k) (a) = 0 für alle k > m. Sei nun n ∈ N mit n ≥ m. Dann gilt also τn (p, a)(x) = n X 1 k! k=0 1 m! p(k) (a)(x − a)k m!(x − a)m = 1 = (x − a)m m! = p(m) (a)(x − a)m p(x). = Als Beispiel betrachten wir die Polynomfunktion p(x) = x 3 − x 2 + 7x + 5 und berechnen ihr viertes Taylorpolynom an der Stelle 0. Die Ableitungen von p sind gegeben durch p(0) (x) = x 3 − x 2 + 7x + 5 p(1) (x) = 3x 2 − 2x + 7 p(2) (x) = 6x − 2 p (3) (x) = 6 p (4) (x) = 0 Es gilt also p(0) (0) = 5, p(1) (0) = 7, p(2) (0) = −2, p(3) (0) = 6, p(4) (0) = 0. Das gesuchte Taylorpolynom ist somit τ4 (p, 0)(x) = 5+ 1 1! 7x + 1 2! 1 (−2)x 2 + 3! 6x 3 + 1 4! 0x 4 = 5 + 7x − x 2 + x 3 = p(x). Überraschend ist, dass dieselbe Rechnung auch an jedem anderen Entwicklungspunkt funktioniert. Beispielsweise ist p(0) (1) = 12, p(1) (1) = 8, p(2) (1) = 4, p(3) (1) = 6, p(4) (1) = 0. Somit ist das vierte Taylorpolynom an der Stelle 1 gegeben durch τ4 (p, 1)(x) = 12 + 1 1! 8(x − 1) + 12 + 8(x − 1) + 2(x − 1)2 + (x − 1)3 = (6.30) Definition = 1 2! 4(x − 1)2 + 1 3! 6(x − 1)3 + 1 4! 0x 4 = 12 + (8x − 8) + (2x 2 − 4x + 2) + (x 3 − 3x 2 + 3x − 1) 5 + 7x − x 2 + x 3 = p(x). Sei f : D → R eine Funktion und a ∈ D ein Punkt, an dem f beliebig oft differenzierbar ist. Dann bezeichnet man die von x ∈ R abhängige Reihe τ( f , a)(x) = ∞ X 1 n=0 n! f (n) (a)(x − a)n als Taylorreihe von f im Punkt a. —– 153 —– Die Definition enthält keine Aussage darüber, für welche x ∈ R die Reihe konvergiert. Wir werden zu einem späteren Zeitpunkt allgemeine Aussagen darüber herleiten, wie die Menge dieser x ∈ R aussehen kann. In der Tat ist es möglich, dass Konvergenz nur für x = a vorliegt, und dass die Reihe für alle x 6= a divergiert. Für x = a konvergiert die Reihe immer, denn wegen (a − a)n = 0 für n > 0 sind fast alle Reihenglieder gleich Null. Nur der erste Term ist wegen 1 0! f (0) (a0(a − a)0 = f (a) möglicherweise ungleich Null. Sei f : D → R eine Funktion und a ∈ D ein innerer Punkt von a. Man (6.31) Definition bezeichnet f als analytisch in a, wenn eine Folge (an )n∈N und eine Umgebung ]a − ", a + "[ ⊆ D von a existieren, so dass die Reihe ∞ X = p(x) an (x − a)n n=0 für alle x ∈ ]a − ", a + "[ konvergiert und die Gleichung p(x) = f (x) erfüllt ist. Man bezeichnet eine von x abhängende Reihe der Form p(x) als Potenzreihe mit Entwicklungspunkt a. Wir werden später sehen, dass eine in a analytische Funktion f auch in a differenzierbar ist. Die Ableitung f 0 ist dann ebenfalls analytisch, und es gilt f 0 (x) = ∞ X nan (x − a)n−1 für alle x ∈ ]a − ", a + "[ . n=1 Durch vollständige Induktion folgt daraus, dass eine analytische Funktion beliebig oft differenzierbar ist, und dass für alle k ∈ N0 und x ∈ ]a − ", a + "[ jeweils f (k) (x) = ∞ X n(n − 1)...(n − k + 1)an (x − a)n−k = ∞ X n! n=k (n − k)! n=k an (x − a)n−k gilt. Wir erhalten f (k) (a) = k!ak für alle k ∈ N0 und somit τ( f , a)(x) = ∞ X f (n) (a) n=0 n! (x − a)n = ∞ X n! n=0 n! an (x − a)n = ∞ X an (x − a)n = f (x). n=0 Daraus folgt unmittelbar: Ist eine Funktion f in einem Punkt a analytisch, dann kann sie in einer Umgebung von a immer durch ihre Taylorreihe dargestellt werden. In der Funktionentheorie-Vorlesung werden wir ein Kriterium formulieren, mit dem sich die Analytizität vieler Funktionen nachweisen lässt: Eine Funktion f : D → R mit Definitionsbereich D ⊆ R ist in a ∈ D genau dann analytisch, wenn sie sich in einer Umgebung von a in der Menge C der komlexen Zahlen zu einer komplex differenzierbaren Funktion fortsetzen lässt. Aus diesem Kriterium wird sich zum Beispiel leicht ergeben, dass alle rationalen Funktionen auf ihrem gesamten Definitionsbereich analytisch sind. In einfachen Fällen lässt sich das auch durch direktes Nachrechnen überprüfen. Zeigen wir zum Beispiel, dass die Funktion f : R \ {1} → R , —– 154 x 7→ —– 1 x −1 im Punkt x = 0 analytisch ist. Es gilt f 0 (x) = − 1 (x 2 f 00 (x) = , − 1)2 (x f 000 (x) = − , − 1)3 6 , (x − 1)4 und durch einen einfachen Induktionsbeweis bestätigt man die Formel f (n) (x) = (−1)n n! n ∈ N0 . für alle (x − 1)n+1 Insbesondere gilt f (n) (0) = (−1)n n!/(−1)n+1 = −n!, somit ist die Taylorreihe von f an der Stelle 0 gegeben durch τ( f , 0)(x) ∞ X f (n) (0) = n! n=0 = xn ∞ X −n! n=0 n! = xn − ∞ X x n. n=0 Es handelt sich also um die geometrische Reihe in x. Für alle x ∈ R mit |x| < 1 gilt ∞ X 1 1 − xn = − = = f (x) , 1 − x x − 1 n=0 also ist f auf dem Intervall ]−1, 1[ tatsächlich durch eine Potenzreihe darstellbar. Für Polynomfunktionen ist wegen Folgerung (6.29) ohnehin klar, dass sie in jedem Punkt ihres Definitionsbereichs durch eine Potenzreihe (mit endlich vielen Termen ungleich Null) darstellbar sind. Es kann gezeigt werden, dass auch die Exponentialfunktion exp : R → R+ analytisch ist. Sie kann auf ganz R durch ihre Taylorreihe dargestellt werden. Wegen exp0 = exp gilt exp(n) (0) = exp(0) = 1 für alle n ∈ N0 . Es gilt also exp(x) = τ(exp, 0)(x) ∞ X exp(n) (0) = n! n=0 (x − 0)n ∞ X xn = n=0 für alle x ∈ R. n! Im Rahmen der Integralrechnung werden wir zwei weitere Funktionen sin, cos : R → [−1, 1] einführen, die Sinusund Kosinusfunktion. Wie wir sehen werden, gilt sin0 (x) = cos(x) und cos0 (x) = − sin(x), außerdem sin(0) = 0 und cos(0) = 1. Durch vollständige Induktion beweist man leicht für alle n ∈ N0 die Gleichungen sin(4n) (0) = 0 sin(4n+1) (0) = 1 , cos(4n) (0) = 1 cos(4n+1) (0) = 0 , sin(4n+2) (0) = 0 , sin(4n+3) (0) = −1 , cos(4n+2) (0) = −1 , , cos(4n+3) (0) = 0. , Sowohl die Sinus- als auch die Kosinusfunktion ist auf ganz R analytisch. Ihre Entwicklungen als Taylorreihen sind gegeben durch sin(x) = τ(sin, 0)(x) ∞ X sin(n) (0) = n! n=0 lim n→∞ n X k=0 sin(4k) (0) (4k)! x 4k + lim n→∞ lim n→∞ n X k=0 (x − 0)n sin(4k+1) (0) (4k + 1)! n X k=0 (4k + 1)! (2(2k) + 1)! lim n→∞ 4k+1 1 (−1)2k x x = (−1)k k=0 (2k + 1)! n→∞ + x 2k+1 —– n X sin(k) (0) k! k=0 sin(4k+2) (0) (4k + 2)! (−1) x 4k+1 + 2(2k)+1 2n+1 X + lim (4k + 3)! x 4k+2 x 4k+3 (−1)2k+1 (2(2k + 1) + 1)! = 155 + = lim n→∞ sin(4k+3) (0) (4k + 3)! x x (2n + 1)! n=0 x 2n+1 4n+3 X k=0 sin(k) (0) k! = 2(2k+1)+1 ∞ X (−1)n —– xn = 4k+3 = xn = und = cos(x) τ(cos, 0)(x) ∞ X cos(n) (0) = n! n=0 = lim n→∞ n X k=0 cos(4k) (0) (4k)! x 4k + lim lim n→∞ k=0 cos(4k+1) (0) (4k + 1)! n X 1 n→∞ n X (x − 0)n k=0 (4k)! (−1)2k (2(2k))! lim n→∞ x x x 4k 2(2k) 2n+1 X (−1)k k=0 (2k)! 4k+1 + + x 2k = + lim n→∞ n X cos(k) (0) k=0 cos(4k+2) (0) (4k + 2)! (−1) (4k + 2)! x 4k+2 (−1)2k+1 x + lim n→∞ cos(4k+3) (0) (4k + 3)! 4n+3 X k=0 cos(k) (0) k! xn x 4k+3 = = x 2(2k+1) ∞ X (−1)n n=0 4k+2 = (2(2k + 1))! = k! xn (2n)! = x 2n und diese Reihendarstellungen sind wie bei der Exponentialfunktion für alle x ∈ R gültig. Zum Schluss sei noch angemerkt, dass eine Funktion in einem Punkt beliebig oft differenzierbar sein kann, ohne dass sie dort analytisch ist. In den Übungen werden wir zeigen, dass die Funktion exp − 1 für x > 0 x f : R −→ R , x 7→ 0 für x ≤ 0 im Punkt x = 0 genau diese Eigenschaften besitzt. —– 156 —– § 7. Integralrechnung Inhaltsübersicht In der Schule definiert man das Integral einer nicht-negativen Funktion durch die Fläche unter dem Funktionsgraphen. Diese Definition können wir hier nicht unmittelbar verwenden, weil wir den Begriff des Flächeninhalts für krummlinig begrenzte Flächen (noch) nicht zur Verfügung haben. Statt dessen werden wir das Integral zunächst approximieren, in dem wir die Fläche unter dem Funktionsgraphen durch Flächeninhalte von Rechtecken ausschöpfen bzw. überdecken. Man spricht in diesem Zusammenhang von Unter- bzw. Obersummen. Wenn sich diese Unter- und Obersummen beliebig nahe kommen, nennt man die Funktion Riemann-integrierbar. Das Supremum der Untersummen, das in diesem Fall mit dem Infimum der Obersummen zusammenfällt, wird das Riemann-Integral der Funktion genannt. Rb Aus der Schulmathematik ist auch bereits bekannt, dass ein Integral a f (x) d x durch Stammfunktionen berechnet werden kann: Es stimmt mit der Differenz F (b) − F (a) überein, wobei F eine differenzierbare Funktion mit F 0 = f bezeichnet. Dieser Zusammenhang ist als Hauptsatz der Differential- und Integralrechnung bekannt und wird im zweiten Abschnitt dieses Kapitels bewiesen. Direkt aus dem Hauptsatz ergeben sich auch zwei wichtige, aus der Schule bekannte Integrationsregeln, nämlich die Substitutionsregel und die partielle Integration. Die Anwendung dieser Regeln werden wir anhand einiger Beispiele nachvollziehen. Im letzten Abschnitt verwenden wir das Riemann-Integral, um die Bogenlänge eines Funktionsgraphens zu definieren. Dies wiederum bildet die Grundlage zur Definition der trigonometrischen Funktionen (Sinus, Konsinus, Tangens) und ihrer Umkehrfunktionen. Wie wir sehen werden, ermöglichen letztere die Integration beliebiger rationaler Funktionen. (I) Definition des Riemann-Integrals Im gesamten Abschnitt bezeichnet [a, b] ⊆ R ein endliches, abgeschlossenes Intervall positiver Länge, mit a, b ∈ R und a < b. Eine endliche (eventuell auch leere) Teilmenge Z = {x 1 , ..., x n−1 } ⊆ ]a, b[ bezeichnen wir als Zerlegung (oder Unterteilung) von [a, b]. Dabei gehen wir davon stets davon aus, dass die Zahlen x k so angeordnet sind, dass x k < x k+1 für 1 ≤ k < n − 1 erfüllt ist. Außerdem setzen wir stets x 0 = a und x n = b. Für die Menge aller Zerlegungen von [a, b] verwenden wir die Bezeichung Z(a, b). (7.1) Definition Sei f : [a, b] → R eine beschränkte Funktion, und sei Z = {x 1 , ..., x n−1 } eine Zerlegung von [a, b]. Sei x 0 = a und x n = b. Für jedes k mit 0 ≤ k < n definieren wir ck = inf f ([x k , x k+1 ]) und dk = sup f ([x k , x k+1 ]). Dann bezeichnet man S f− (Z ) = n−1 X ck (x k+1 − x k ) als Untersumme dk (x k+1 − x k ) als Obersumme k=0 und S f+ (Z ) = n−1 X k=0 von f bezüglich der Zerlegung Z . —– 157 —– Wir illustrieren den Begriff der Unter- und Obersumme am Beispiel der Funktion f : [0, 1] → R gegeben durch x 7→ x 2 . Für jedes n ∈ N betrachten wir die Zerlegung { 1n , 2n , ..., n−1 }. n = Zn Zunächst berechnen wir die Untersumme. Weil f streng monoton wachsend ist, gilt inf f ([ nk , k+1 ]) = f ( nk ) = n k 2 n . Verwenden wir die Summenformel für die ersten n Quadratzahlen n X k2 1 n(n + 1)(2n + 1) 6 = , k=1 so erhalten wir für die Untersumme den Wert S f− (Zn ) n−1 X = f ( nk ) n−1 X k 2 = n k=0 1 n 1 n3 = k=0 n−1 X k2 = 1 n3 · 16 (n − 1)n(2n − 1) = 1 (1 − 1n )(2 − 1n ). 6 k=0 Nun bestimmen wir noch die Obersumme. Auf Grund des streng monotonen Wachstums der Funktion f gilt hier 2 ]) = f ( k+1 ) = k+1 und somit sup f ([ nk , k+1 n n n S f+ (Zn ) = n−1 X f ( k+1 ) n n X k 2 = n 1 n = 1 n3 k=1 k=0 n X k2 1 n3 = · 61 n(n + 1)(2n + 1) = 1 (1 + 1n )(2 + 1n ). 6 k=1 Wir bemerken, dass sich für n → ∞ der Wert der Untersumme von unten, der Wert der Obersumme von oben gegen den exakten Wert 1 6 ·1·2= 1 3 des Integrals konvergiert. (7.2) Definition Sei f : [a, b] → R eine beschränkte Funktion. Dann bezeichnet man b Z f (x) d x o n = sup S f− (Z ) Z ∈ Z(a, b) bzw. aÆ bÆ Z f (x) d x n o inf S f+ (Z ) Z ∈ Z(a, b) = a als Unter- bzw. Oberintegral der Funktion f . Stimmen Unter- und Oberintegral von f überein, dann bezeichnet man f als Riemann-integrierbar und nennt b Z f (x) d x = Z a b f (x) d x aÆ = bÆ Z f (x) d x a das Riemann-Integral der Funktion f . Man beachte, dass Unter- und Oberintegral bei einer beschränkten Funktion f stets endliche reelle Zahlen sind. Sind nämlich c, d ∈ R Werte mit c ≤ f (x) ≤ d für alle x ∈ [a, b], und ist Z = {x 1 , ..., x n−1 } eine Zerlegung von Pn [a, b], dann können wir die Unter- und Obersummen gegeben durch S f− (Z ) = k=1 ck (x k − x k−1 ) und S f+ (Z ) = Pn k=1 dk (x k − x k−1 ) wegen c ≤ ck ≤ dk ≤ d durch c(b − a) nach unten und durch d(b − a) nach oben abschätzen. —– 158 —– Ist [a, b] ein endliches, abgeschlossenes Intervall, Z = {x 1 , ..., x n−1 } eine Zerlegung, und setzen wir x 0 = a, x n = b, dann bezeichnet man die Zahl δ(Z ) = max { x k+1 − x k | 0 ≤ k < n} als Feinheit der Zerlegung. Eine Zerlegung Z 0 heißt Verfeinerung von Z , wenn Z 0 ⊇ Z gilt. Sei f : [a, b] → R eine Funktion und Z eine Zerlegung wie oben. Ein Tupel v = (v0 , ..., vn−1 ) von Punkten mit vk ∈ x k , x k+1 für 0 ≤ k < n nennen wir einen (7.3) Definition Auswahlvektor zur Zerlegung Z . Die Zahl R f (Z , v) n−1 X = f (vk )(x k+1 − x k ) k=0 wird die Riemannsche Summe von f zu Z und v genannt. Wir haben weiter vorne im Text die Unter- und Obersummen von f : [0, 1] → R, x 7→ x 2 zu den Zerlegungen Zn = } berechnet. Sowohl S f− (Zn ) als auch S f+ (Zn ) sind auch Riemannsche Summen bezüglich Zn , nämlich { 1n , 2n , ..., n−1 n R1 die zu den Auswahlvektoren (0, 1n , ..., n−1 ) und ( 1n , ..., n−1 , 1). Alternativ könnte man aber das Integral 0 x 2 d x auch n n durch einen Riemannsche Summe berechnen, deren Auswahlvektor aus den Mittelpunkten der Teilintervalle besteht, also 1 = vn , 3 2n 2n , ..., 2n − 1 . 2n Mit Hilfe der Summenformeln n X k = 21 n(n + 1) n X und k=1 k2 = 16 n(n + 1)(2n + 1) k=1 erhalten wir hier die Werte R f (Zn , vn ) = n−1 X k+1 k f 2k+1 −n 2n n = k=0 = 1 n3 n−1 X k=1 k2 + n−1 X 2k+1 2n 2 1 n 1 4n3 = k=0 1 n3 n−1 X k+ n−1 4n3 = 1 6 = 1 n3 · 16 (n − 1)n(2n + 1) + n−1 X 4k2 + 4k + 1 k=0 1 n3 k=1 · 12 (n − 1)n + n−1 4n3 n−1 n−1 1 − 1n 2 − 1n + + . 2n2 4n3 Auch hier nähert sich Wert für n → ∞ dem exakten Wert 1 3 des Integrals. Wir werden nun den Zusammenhang zwischen diesen drei verschiedenen Summentypen genauer untersuchen. —– 159 —– (7.4) Lemma Sei f : [a, b] → R eine beschränkte Funktion, und seien Z , Z 0 Zerlegungen von [a, b], wobei Z 0 eine Verfeinerung von Z ist. Dann gilt S f− (Z 0 ) Beweis: S f− (Z ) ≥ S f+ (Z 0 ) und S f+ (Z ). ≤ Sei Z = {x 1 , ..., x m−1 } und Z 0 = { y1 , ..., yn−1 }. Wegen Z ⊆ Z 0 gibt es für jedes k mit 1 ≤ k < m ein `k ∈ {1, ..., n − 1} mit x k = y`k . Außerdem definieren wir x 0 = y0 = a, x m = yn = b sowie `0 = 0 und `m = n. Für 0 ≤ k < m sei ck = sup f ([x k , x k+1 ]), und für 0 ≤ ` < n setzen wir d` = sup f ([ y` , y`+1 ]). Für jedes ` mit `k ≤ ` < `k+1 gilt dann [ y` , y`+1 ] ⊆ [x k , x k+1 ] und folglich d` ≤ ck . Wir erhalten + 0 S f (Z ) n−1 X = d` ( y`+1 − y` ) −1 m−1 X X `k+1 = −1 m−1 X `k+1 X d` ( y`+1 − y` ) ≤ k=0 `=`k `=0 ck ( y`+1 − y` ) = k=0 `=`k m−1 X ck (x k+1 − x k ) S f+ (Z ). = k=0 Der Beweis der anderen Ungleichung läuft völlig analog. (7.5) Folgerung Für jede beschränkte Funktion f : [a, b] → R gilt Z b f (x) d x f (x) d x. ≤ aÆ Beweis: bÆ Z a Sei " ∈ R+ vorgegeben. Nach Definition von Unter- und Oberintegral gibt es Zerlegungen Z und Z 0 mit − S f (Z ) > Z b f (x) d x − " und + 0 S f (Z ) < bÆ Z aÆ f (x) d x + ". a Setzen wir Z 00 = Z ∪ Z 0 , dann erhalten wir mit (7.4) die Ungleichungen S f− (Z 00 ) ≥ S f− (Z ) und S f+ (Z 00 ) ≤ S f+ (Z 0 ). Da außerdem S f− (Z 00 ) ≤ S f+ (Z 00 ) gilt, erhalten wir insgesamt die Abschätzung bÆ Z f (x) d x − a Z b f (x) d x > (S f+ (Z 0 ) − ") − (S f− (Z ) + ") ≥ aÆ (S f+ (Z 00 ) − ") − (S f− (Z 00 ) + ") ≥ −2". Da " ∈ R+ beliebig klein gewählt werden kann, folgt daraus die Behauptung. —– 160 —– (7.6) Lemma Sei f : [a, b] → R beschränkt und Z eine Zerlegung von [a, b]. (i) Für jeden Auswahlvektor v bezüglich Z gilt S f− (Z ) R f (Z , v) ≤ ≤ S f+ (Z ). (ii) Für jedes " ∈ R+ gibt es Auswahlvektoren v und w mit R f (Z , v) < S f− (Z ) + " R f (Z , w) > S f+ (Z ) − ". und Ober- und Untersummen lassen sich also beliebig genau durch Riemannsche Summen approximieren. Beweis: zu (i) Sei Z = {x 1 , ..., x n−1 } und v = (v0 , ..., vn−1 ), außerdem x 0 = a und x n = b. Für 0 ≤ k < n sei ck = inf f ([x k , x k+1 ]) und dk = sup f ([x k , x k+1 ]). Es gilt dann ck ≤ f (vk ) ≤ dk für 0 ≤ k < n, und daraus folgt sowohl S f− (Z ) n−1 X = ck (x k+1 − x k ) ≤ k=0 n−1 X f (vk )(x k+1 − x k ) = R f (Z , v) k=0 als auch R f (Z , v) = n−1 X f (vk )(x k+1 − x k ) n−1 X ≤ k=0 zu (ii) dk (x k+1 − x k ) = S f+ (Z ). k=0 Sei δ ∈ R+ beliebig vorgegeben. Nach Definition von Infimum und Supremum gibt es für jedes k mit 0 ≤ k ≤ n − 1 jeweils vk , w k ∈ [x k , x k+1 ] mit f (vk ) < ck + δ und f (w k ) > dk − δ. Setzen wir v = (v0 , ..., vn−1 ) und w = (w0 , ..., w n−1 ), dann folgt R f (Z , v) = n−1 X f (vk )(x k+1 − x k ) < k=0 n−1 X n−1 X (ck + δ)(x k+1 − x k ) = k=0 ck (x k+1 − x k ) + k=0 n−1 X δ(x k+1 − x k ) = S f− (Z ) + δ(b − a) k=0 und ebenso R f (Z , w) = n−1 X f (w k )(x k+1 − x k ) n−1 X (dk − δ)(x k+1 − x k ) > k=0 n−1 X k=0 dk (x k+1 − x k ) − = k=0 n−1 X δ(x k+1 − x k ) = S f+ (Z ) − δ(b − a). k=0 Wählen wir δ ∈ R+ so klein, dass δ(b − a) < " gilt, dann sind die gewünschten Abschätzungen also erfüllt. —– 161 —– (7.7) Lemma Sei f : [a, b] → R eine beschränkte Funktion und Z eine Zerlegung von [a, b]. Dann gibt es für jedes " ∈ R+ ein δ ∈ R+ , so dass für jede Zerlegung Z 0 mit δ(Z 0 ) < δ jeweils die beiden Ungleichungen 0 ≤ S f+ (Z 0 ) − S f+ (Z ∪ Z 0 ) < " Beweis: 0 ≤ S f− (Z ∪ Z 0 ) − S f− (Z 0 ) < " und erfüllt sind. Sei Z 0 = {x 1 , ..., x m−1 } und Z ∪ Z 0 = { y1 , ..., yn−1 }, wobei die Punkte x k , y` wie üblich der Größe nach geordnet sind. Wieder setzen wir x 0 = y0 = a und x m = yn = b. Wegen Z 0 ⊆ Z ∪ Z 0 gibt es für jedes k ∈ {0, ..., m} ein `k ∈ {0, ..., n} mit x k = y`k , insbesondere ist `0 = 0 und `m = n. Sei nun ck = sup f ([x k , x k+1 ]) für 0 ≤ k < m und d` = sup f ([ y` , y`+1 ]) für 0 ≤ ` < n. Dann gilt nach Definition der Obersumme S f+ (Z 0 ) = m−1 X und S f+ (Z ∪ Z 0 ) = ck (x k+1 − x k ) n−1 X d` ( y`+1 − y` ). `=0 k=0 Die erste Summe kann aufgeteilt werden in S f+ (Z 0 ) m−1 X = ck (x k+1 − x k ) −1 m−1 X `k+1 X = ck ( y`+1 − y` ). k=0 `=`k k=0 Außerdem gilt für `k < ` < `k+1 jeweils [ y` , y`+1 ] ⊆ [x k , x k+1 ] und somit d` ≤ ck für diese `. Es folgt S f+ (Z 0 ) − S f+ (Z ∪ Z 0 ) = −1 m−1 X `k+1 X ck ( y`+1 − y` ) − −1 m−1 X `k+1 X d` ( y`+1 − y` ) k=0 `=`k k=0 `=`k = −1 m−1 X `k+1 X (ck − d` )( y`+1 − y` ) ≥ 0. k=0 `=`k Setzen wir t = |Z |, dann entsteht Z ∪ Z 0 aus Z 0 durch Hinzunahme von höchtens t Punkten, und diese Hinzunahme führt zur Entstehung von höchstens 2t neuen Intervallen. Für höchstens 2t Werte von ` gilt also [ y` , y`+1 ] ( [x k , x k+1 ], wobei k die eindeutig bestimmte Zahl k mit `k ≤ ` < `k+1 bezeichnet, und dmait ist ck = d` für höchstens 2t Werte von ` nicht erfüllt. Setzen wir nun s = sup{| f (x)| | x ∈ [a, b]}, und bezeichnen mit δ − 1 die Feinheit der Zerlegung Z 0 , dann folgt | y`+1 − y` | ≤ |x k+1 − x k | ≤ δ1 für alle ` und die zugehörigen k, und wir erhalten insgesamt die Abschätzung S f+ (Z 0 ) − S f+ (Z ∪ Z 0 ) ≤ 2stδ1 . Genau nach demselben Schema beweist man die Ungleichungen 0 ≤ S f− (Z ∪ Z 0 ) − S f− (Z 0 ) ≤ 2stδ1 . Sei nun " ∈ R+ vorgegeben. Wählen wir δ ∈ R+ so klein, dass 2stδ < " gilt, dann sind also für jede Zerlegung Z 0 mit δ(Z 0 ) < δ die gewünschten Abschätzungen erfüllt. —– 162 —– (7.8) Satz Sei f : [a, b] → R beschränkt. Dann sind folgenden Aussagen äquivalent. (i) Die Funktion f ist Riemann-integrierbar. (ii) Für jedes " ∈ R+ gibt es eine Zerlegung Z mit S f+ (Z ) − S f− (Z ) < ". (iii) Für jedes " ∈ R gibt es ein δ ∈ R+ , so dass für jede Unterteilung Z mit Feinheit δ(Z ) < δ jeweils S f+ (Z ) − S f− (Z ) < " erfüllt ist. (iv) Es gibt eine Zahl u ∈ R mit der folgenden Eigenschaft: Für jedes " ∈ R+ gibt es ein δ ∈ R+ , so dass |R f (Z , v) − u| < " für jede Zerlegung Z mit δ(Z ) < δ und jeden Auswahlvektor v zu Z erfüllt ist. Sind diese äquivalenten Bedingungen erfüllt, dann stimmt die Zahl u in Aussage (iv) mit dem Rb Integral a f (x) d x überein. Beweis: „(i) ⇒ (ii)“ Sei " ∈ R+ vorgegeben. Nach Definition des Unterintegrals gibt es eine Zerlegung Z mit Z b S f− (Z ) > aÆ f (x) d x − 21 ". Ebenso gibt es nach Definition des Oberintegrals eine Zerlegung Z 0 mit Z bÆ S f+ (Z 0 ) < a f (x) d x + 21 ". Weil f Riemann-integrierbar ist, stimmen Unter- und Oberintegral mit dem Riemann-Integral überein. Ersetzen wir Z und Z 0 durch die feinere Zerlegung Z 00 = Z ∪ Z 0 , dann erhalten wir mit (7.4) insgesamt S f− (Z 00 ) > Rb Rb 1 + 00 " und S (Z ) < f (x) d x + 21 ". Es folgt f (x) d x − f 2 a a ! ! Z b Z b S f+ (Z 00 ) − S f− (Z 00 ) f (x) d x + 12 " < a − a f (x) d x − 12 " = ". „(ii) ⇒ (i)“ Sei " ∈ R+ vorgegeben, und sei Z eine Zerlegung mit der unter (ii) angegebenen Eigenschaft. Nach Definition von Ober- und Unterintegral gilt Z b − S f (Z ) f (x) d x ≤ bÆ Z f (x) d x ≤ aÆ ≤ S f+ (Z ) ≤ S f− (Z ) + ". a Weil " ∈ R+ beliebig klein gewählt werden kann, müssen Unter- und Oberintegral übereinstimmen. Also ist f Riemann-integrierbar. „(i) ⇒ (iii)“ Sei " ∈ R+ vorgegeben und u = Rb a f (x) d x. Auf Grund der Voraussetzung und nach Definition des Unterintegrals gilt u Z = f (x) d x sup S f− (Z ) , = Z aÆ somit finden wir eine Zerlegung Z1 mit S f (Z1 ) > u − − 1 ". 4 Genauso findet man eine Zerlegung Z2 mit S f+ (Z2 ) < u + 14 ". Setzen wir Z = Z1 ∪ Z2 , dann ist Z eine gemeinsame Verfeinerung von Z1 und Z2 . Mit (7.4) erhält man die Abschätzungen S f− (Z ) ≥ —– S f− (Z1 ) 163 > —– u − 41 " und S f+ (Z ) S f+ (Z2 ) ≤ u + 14 ". < Mit (7.7) wählen wir nun zu 14 " und der Zerlegung Z ein passendes δ. Dann erfüllt jede Zerlegung Z 0 mit δ(Z 0 ) < δ die Abschätzung S f+ (Z 0 ) − S f− (Z 0 ) S f+ (Z ∪ Z 0 ) + 41 " − S f− (Z ∪ Z 0 ) − 41 " ≤ S f+ (Z ) + 41 " − S f− (Z ) − 14 " „(iii) ⇒ (iv)“ Sei u = R bÆ a (u + 41 " + 14 ") − (u − 14 " − 41 ") < ≤ = ". f (x) d x und " ∈ R+ beliebig vorgegeben. Nach (iii) gibt es ein zu " gehörendes δ ∈ R+ mit der dort beschriebenen Eigenschaft. Ist nun Z eine beliebige Zerlegung von [a, b] mit δ(Z ) < δ, dann gilt S f+ (Z ) − S f− (Z ) < ". Für jeden Auswahlvektor v bezüglich Z gelten nach Lemma (7.6) die Ungleichungen S f− (Z ) ≤ R f (Z , v) ≤ S f+ (Z ), und wegen (7.5) gilt Z − S f (Z ) b f (x) d x ≤ ≤ S f+ (Z ). ≤ u aÆ Insgesamt folgt daraus R (Z , v) − u f ≤ S f+ (Z ) − S f− (Z ) < ". „(iv) ⇒ (i)“ Sei " ∈ R+ beliebig vorgegeben, und seien u ∈ R und δ ∈ R+ die zu 41 " gehörenden Werte, wie unter (iv) angegeben. Sei Z eine Zerlegung von [a, b] mit δ(Z ) < δ. Nach Lemma (7.6) gibt es Auswahlvektoren v, w bezüglich Z mit R f (Z , v) < S f− (Z ) + 14 " und R f (Z , w) > S f+ (Z ) − 41 ". Nach (iv) gilt außerdem R f (Z , v) > u − 41 " und R f (Z , w) < u + 14 ". Wegen S f− (Z ) Z b f (x) d x ≤ bÆ Z f (x) d x und aÆ ≤ S f+ (Z ) a erhalten wir insgesamt bÆ Z b Z f (x) d x ≤ S f+ (Z ) − S f− (Z ) R f (Z , w) + 41 " − R f (Z , v) − 41 " = R f (Z , w) − R f (Z , v) + 12 " f (x) d x − a < aÆ (u + 41 ") − (u − 14 ") + 21 " = < ". Weil " ∈ R+ beliebig klein gewählt werden kann, folgt daraus die Übereinstimmung von Unter- und Oberintegral. Die Funktion f ist also Riemann-integrierbar. Schließlich bemerken wir noch, dass als Nebenresultat des Beweises von „(iii) ⇒ (iv)“ gezeigt wurde, dass das Oberintegral von f mit dem Wert u in Aussage (iv) identisch ist. Im Falle der Riemann-Integrierbarkeit von f gilt Rb also u = a f (x) d x. —– 164 —– Wir leiten nun einige Rechenregeln für das Riemann-Integral her. (7.9) Satz Seien f , g : [a, b] → R Riemann-integrierbare Funktionen und λ ∈ R. Dann sind auch f + g und λ f Riemann-integrierbar. Außerdem gilt b Z ( f + g)(x) d x = (i) a f (x) d x + (λ f )(x) d x = λ (ii) f (x) d x a b Z f (x) d x ≤ (iii) Aus f ≤ g folgt S f−+g (Z ) b Z g(x) d x. a Beweis: g(x) d x a b Z a b Z a b Z b Z a Zur Vorbereitung bemerken wir, dass für jede Zerlegung Z = {x 1 , ..., x n−1 } von [a, b] jeweils zu (i) ≥ S f (Z ) + S g− (Z ) und S f++g (Z ) ≤ S f+ (Z ) + S g+ (Z ) gilt. Für jedes k mit 0 ≤ k < n ist nämlich − inf f ([x k , x k+1 ]) + inf g([x k , x k+1 ]) eine untere Schranke von ( f + g)([x k , x k+1 ]), denn für jedes x ∈ [x k , x k+1 ] gilt ( f + g)(x) = f (x) + g(x) ≥ inf f ([x k , x k+1 ]) + inf g([x k , x k+1 ]). Daraus folgt inf ( f + g)([x k , x k+1 ]) ≥ inf f ([x k , x k+1 ]) + inf g([x k , x k+1 ]), und Summation über alle k ergibt S f−+g (Z ) ≥ S f− (Z ) + S g− (Z ). Der Beweis der zweiten Ungleichung läuft analog. Sei nun " ∈ R+ vorgegeben. Weil f und g nach Voraussetzung Riemann-integrierbar Funktionen sind, gibt es nach (7.8) (ii) Zerlegungen Z und Z 0 von [a, b] mit S f+ (Z ) − S f− (Z ) < 21 " und S g+ (Z 0 ) − S g− (Z 0 ) < 21 ". Ersetzen wir Z und Z 0 durch die feinere Zerlegung Z 00 = Z ∪ Z 0 , dann bleiben diese Ungleichungen wegen (7.4) erhalten. Es folgt S f++g (Z 00 ) − S f−+g (Z 00 ) ≤ S f+ (Z 00 ) + S g+ (Z 00 ) − S f− (Z 00 ) + S g− (Z 00 ) S f+ (Z 00 ) − S f− (Z 00 ) + S g+ (Z 00 ) − S g− (Z 00 ) < 1 " 2 + 12 " = Wegen (7.8) (ii) ist f + g also Riemann-integrierbar. Außerdem gilt sowohl Z b S f− (Z 00 ) + S g− (Z 00 ) ≤ S f−+g (Z 00 ) ( f + g)(x) d x ≤ ≤ S f++g (Z 00 ) ≤ = ". S f+ (Z 00 ) + S g+ (Z 00 ) a als auch − S f (Z 00 b Z ) + S g− (Z 00 ) f (x) d x + ≤ b Z a g(x) d x ≤ S f+ (Z 00 ) + S g+ (Z 00 ). a also Z b ( f + g)(x) d x − a b Z f (x) d x + a b Z a ! g(x) d x ≤ S f++g (Z 00 ) − S f−+g (Z 00 ) Da " ∈ R+ beliebig klein gewählt werden kann, stimmen die beiden Integrale überein. —– 165 —– < ". zu (ii) Hier beschränken wir uns auf den Fall, dass λ < 0 ist. Dies ist im Vergleich zu λ > 0 der problematischere Teil, weil durch die Multiplikation mit λ die Ungleichungen umgedreht werden. Der Fall λ = 0 ist trivial, weil das Riemann-Integral der konstanten Nullfunktion offenbar durch Unter- und Obersumme Null abgeschätzt werden kann. Sei also λ < 0, außerdem µ = −λ ∈ R+ und " ∈ R+ beliebig vorgegeben. Auf Grund der Riemann-Integrierbarkeit " . µ gibt es eine Zerlegung Z mit S f+ (Z ) − S f− (Z ) < Sei Z = {x 1 , ..., x n−1 }, und seien ck = inf f ([x k , x k+1 ]), dk = sup f ([x k , x k+1 ]), jeweils für 0 ≤ k < n. Dann sind Unter- und Obersummen gegeben durch S f− (Z ) = n X ck (x k+1 − x k ) S f+ (Z ) = und n X dk (x k+1 − x k ). k=0 k=0 Wegen λ < 0 gilt λck = sup (λ f )([x k , x k+1 ]) und λdk = inf (λ f )([x k , x k+1 ]). Daraus folgt unmittelbar Sλ−f (Z ) = λS f+ (Z ) und Sλ+f (Z ) = λS f− (Z ). Wir erhalten Sλ+f (Z ) − Sλ−f (Z ) = + − λ(S f (Z ) − S f (Z )) < λ· − " µ = ". Also ist λ f Riemann-integrierbar. Aus den beiden Ungleichungen Sλ−f (Z ) b Z (λ f )(x) d x ≤ ≤ Sλ+f (Z ) ≤ λS − f (Z ) a und Sλ−f (Z ) = λS + (Z ) f ≤ λ b Z f (x) d x Sλ+f (Z ) = a folgt Z Z b b f (x) d x (λ f )(x) d x − λ a a Sλ+f (Z ) − Sλ−f (Z ) ≤ < ". Da " ∈ R+ beliebig klein gewählt werden kann, stimmen die beiden Integrale überein. zu (iii) Sei " ∈ R+ beliebig vorgegeben. Weil f und g Riemann-integrierbar sind, gibt es Zerlegungen Z und Z 0 von [a, b] mit S f+ (Z ) − S f− (Z ) < " und S g+ (Z 0 ) − S g− (Z 0 ) < ". Ersetzen wir Z und Z 0 durch die feinere Zerlegung Z 00 = Z ∪ Z 0 , dann bleiben diese Ungleichungen wegen (7.4) erhalten. Wegen f ≤ g gilt S f− (Z 00 ) ≤ S f+ (Z 00 ) ≤ S g+ (Z 00 ) und somit b Z b Z f (x) d x g(x) d x − a ≥ S g− (Z 00 ) − S f+ (Z 00 ) ≥ S g+ (Z 00 ) − S f− (Z 00 ) − 2" ≥ −2". a Weil " ∈ R+ beliebig klein gewählt werden kann, folgt daraus die gewünschte Ungleichung. —– 166 —– (7.10) Satz Sei f : [a, b] → R beschränkt und c ∈ ]a, b[ ein beliebig gewählter Punkt. Genau dann ist f Riemann-integrierbar, wenn die Funktionen f |[a,c] und f |[c,b] Riemann-integrierbar sind, und in diesem Fall gilt b Z f (x) d x = a Beweis: c Z f (x) d x + b Z a f (x) d x. c Zunächst beweisen wir die „genau dann“-Aussage zur Integrierbarkeit. Auch hierzu verwenden wir das (7.8). Sei g = f |[a,c] und h = f |[c,b] . Zur Vorbereitung bemerken wir: Ist Z 0 eine Zerlegung von [a, c] und Z 00 eine Zerlegung von [c, b], dann ist durch Z = Z 0 ∪ {c} ∪ Z 00 eine Zerlegung von [a, b] gegeben. Außerdem gilt S f− (Z ) = S g− (Z 0 ) + Sh− (Z 00 ) S f+ (Z ) = S g+ (Z 0 ) + Sh+ (Z 00 ). und (7.1) Wir beschränken und auf den Beweis der ersten Gleichung. Wir können die Elemente von Z 0 und Z 00 so durchnummerieren, dass Z 0 = {x 1 , ..., x m−1 } und Z 00 = {x m+1 , ..., x n−1 } gilt, mit m, n ∈ N0 und m + 1 < n. Setzen wir außerdem x m = c und definieren ck = inf f ([ck , ck+1 ]) für 0 ≤ k < n, dann erhalten wir S f− (Z ) n−1 X = k=0 ck (x k+1 − x k ) = m−1 X ck (x k+1 − x k ) + k=0 n−1 X ck (x k+1 − x k ) = S g− (Z 0 ) + Sh− (Z 00 ). k=m+1 „⇒“ Sei " ∈ R+ vorgegeben. Weil f nach Voraussetzung integrierbar ist, existiert eine Zerlegung Z von [a, b] mit S f+ (Z ) − S f− (Z ) < ". Dabei können wir annehmen, dass c in Z liegt, denn ersetzen wir Z durch Z1 = Z ∪ {c}, dann gilt S f− (Z1 ) ≥ S f− (Z ) und S f+ (Z1 ) ≤ S f+ (Z1 ) nach (7.6) und somit auch S f+ (Z1 ) − S f− (Z1 ) < ". Setzen wir also c ∈ Z voraus, und definieren wir Z 0 = ]a, c[ ∩ Z sowie Z 00 = ]c, b[ ∩ Z . Dann ist Z 0 eine Zerlegung von [a, c], die Menge Z 00 ist eine Zerlegung von [c, b], und es gilt Z = Z 0 ∪ {c} ∪ Z 00 . Wie oben gezeigt wurde, folgt daraus (7.1). Wegen S g+ (Z 0 ) − S g− (Z 0 ) ≥ 0, Sh+ (Z 00 ) − Sh− (Z 00 ) ≥ 0 und S g+ (Z 0 ) − Sh− (Z 0 ) + S g+ (Z 00 ) − Sh− (Z 00 ) = = S g+ (Z 0 ) + Sh+ (Z 00 ) − S g− (Z 0 ) + Sh− (Z 00 ) S f+ (Z ) − S f− (Z ) < " gilt S g+ (Z 0 ) − S g− (Z 0 ) < " und Sh+ (Z 00 ) − Sh− (Z 00 ) < ". Dies zeigt, dass g und h Riemann-integrierbar sind. „⇐“ Wieder sei " ∈ R+ vorgegeben. Weil g und h nach Voraussetzung integrierbar sind, gibt es Zerlegungen Z 0 von [a, c] und Z 00 von [c, b] mit S g+ (Z 0 ) − S g− (Z 0 ) < 1 " 2 und Sh+ (Z 00 ) − Sh− (Z 00 ) < Z = Z ∪ {c} ∪ Z , dann gelten wiederum die Gleichungen (7.1). Wir erhalten S f+ (Z ) − S f− (Z ) = S g+ (Z 0 ) + Sh+ (Z 00 ) − S g− (Z 0 ) + Sh− (Z 00 ) 0 00 S g+ (Z 0 ) − S g− (Z 0 ) + Sh+ (Z 00 ) − Sh− (Z 00 ) —– 167 —– < 1 " 2 + 12 " = = ". 1 ". 2 Definieren wir Dies zeigt, dass f Riemann-integrierbar ist. Zum Schluss beweisen wir noch die angegebene Gleichung. Es gilt sowohl b Z − S f (Z ) f (x) d x ≤ S f+ (Z ) ≤ a als auch S f− (Z ) = S g− (Z 0 ) + Sh− (Z 00 ) c Z g(x) d x + ≤ h(x) d x a ≤ S g+ (Z 0 ) + Sh+ (Z 00 ) ≤ S f+ (Z ). c Daraus folgt Z Z b Z b c f (x) d x + f (x) d x − f (x) d x a c a ≤ b Z = Z Z b Z b c g(x) d x + h(x) d x − f (x) d x a c a S f+ (Z ) − S f− (Z ) < ". Da " ∈ R+ beliebig klein gewählt werden kann, erhalten wir die angegebene Gleichung. Unser nächstes Ziel ist der Nachweis, dass jede stetige Funktion f auf einem abgeschlossenen Intervall Riemannintegrierbar ist. Hierzu benötigen wir ein wenig Vorbereitung. (7.11) Definition Eine Funktion f : D → R wird auf einer Teilmenge D ⊆ R gleichmäßig stetig genannt, wenn für jedes " ∈ R+ ein δ ∈ R+ existiert, so dass die Implikation |x − y| < δ | f (x) − f ( y)| < " ⇒ für alle x, y ∈ D erfüllt ist. Eine gleichmäßig stetige Funktion f : D → R ist nach dem "-δ-Kriterium offenbar in jedem Punkt a ∈ D stetig. Umgekehrt braucht eine stetige Funktion aber nicht gleichmäßig stetig zu sein. Als Beispiel betrachten wir die Funktion f : ]0, 1[ −→ R , x 7→ 1 , x die als rationale Funktion in jedem Punkt ihres Definitionsbereichs stetig ist. Sie ist aber nicht gleichmäßig stetig. Wäre sie es, dann gäbe es für " = 1 ein δ > 0, so dass |x − y| < δ ⇒ | f (x) − f ( y)| < 1 erfüllt ist. Wir wählen nun n ∈ N so groß, so dass |x − y| = | 1n − 1 | 2n = 1 2n 1 2n für alle x, y ∈ ]0, 1[ < δ erfüllt ist. Für x = 1 n und y = 1 2n gilt dann zwar < δ, aber | f (x) − f ( y)| = |n − 2n| = n ≥ 1, im Widerspruch zur Annahme. (7.12) Satz Jede auf einem endlichen, abgeschlossenen Intervall [a, b] ⊆ R stetige Funktion ist dort auch gleichmäßig stetig. —– 168 —– Beweis: Sei f : [a, b] → R stetig und nehmen wir an, f wäre nicht gleichmäßig stetig. Dann gäbe es ein " ∈ R+ mit der Eigenschaft, dass für jedes δ ∈ R+ ein Paar x, y ∈ [a, b] mit |x − y| < δ, aber | f (x) − ( y)| ≥ " existiert. Insbesondere gäbe es dann für jedes n ∈ N Punkte x n , yn ∈ [a, b] mit |x n − yn | < 1n , aber | f (x n ) − f ( yn )| ≥ ". Nach dem Satz (4.23) von Bolzano-Weierstraß besitzt (x n )n∈N einen Häufungspunkt p. Wir finden also eine streng monoton wachsende Folge (nk )k∈N natürlicher Zahlen mit |x nk −p| < 1 k für alle k ∈ N. Die Folge (x nk )k∈N konvergiert offenbar gegen p. Wir behaupten, dass auch limk ynk = p gilt. Um dies zu beweisen, wählen wir für vorgegebenes " 0 ∈ R+ ein so großes K ∈ N, dass | ynk − p| < 12 " 0 und |x nk − p| < 12 " 0 für alle k ≥ K erfüllt ist. Es gilt dann 1 nK | ynk − x nk | + |x nk − p| ≤ < 1 nk + 21 " 0 "0 < für alle k ≥ K. Damit ist die Behauptung bewiesen. Auf Grund der Stetigkeit von f gilt nun limk ( f (x nk )− f ( ynk )) = f (p)− f (p) = 0. Dies widerspricht der Annahme | f (x n ) − f ( yn )| ≥ " für alle n ∈ N. Nach diesen Vorbereitungen können wir nun zeigen (7.13) Satz Jede stetige Funktion auf einem endlichen, abgeschlossenen Intervall ist Riemannintegrierbar. Beweis: Sei f : [a, b] → R eine stetige Funktion und " ∈ R+ vorgegeben. Nach (7.12) ist f als stetige Funktion auf einem abgeschlossenen Intervall auch gleichmäßig stetig. Seien " 0 = |x − y| < δ ⇒ | f (x) − f ( y)| < " 0 erfüllt ist. Sei außerdem n ∈ N so groß, dass " b−a für alle und die Zahl δ ∈ R+ so gewählt, dass x, y ∈ [a, b] < δ gilt. Wir definieren nun x k = a + nk (b − a) für 0 ≤ k ≤ n b−a n und setzen Z = {x 1 , ..., x n−1 }. Nach dem Maximumsprinzip (5.17) gibt es jeweils Punkte yk , zk ∈ [x k , x k+1 ], so dass ck = f ( yk ) das Minimum und dk = f (zk ) das Maximum von f auf [x k , x k+1 ] ist. Daraus folgt, dass Unter- und Obersumme der Zerlegung Z durch S f− (Z ) = n−1 X ck (x k+1 − x k ) S f+ (Z ) = und k=0 gegeben sind. Wegen | yk − zk | ≤ b−a n n−1 X dk (x k+1 − x k ) k=0 < δ gilt jeweils dk − ck = f (zk ) − f ( yk ) < " 0 . Damit erhalten wir S f+ (Z ) − S f− (Z ) = n−1 X (dk − ck )(x k+1 − x k ) ≤ k=0 n−1 X " 0 (x k+1 − x k ) = " 0 (x n − x 0 ) = " 0 (b − a) = ". k=0 Da " ∈ R+ beliebig klein gewählt werden kann, zeigt dies nach (7.8) (ii), dass f Riemann-integrierbar ist. —– 169 —– Der Satz lässt sich auf eine noch größere Klasse von Funktionen verallgemeinern. Eine Funktion f : [a, b] → R wird stückweise stetig genannt, wenn eine Zerlegung Z = {x 1 , ..., x n−1 } von [a, b] existiert, so dass die Funktionen g k = f |]x k ,x k+1 [ stetig sind und lim g k und x→x k lim g k x→x k+1 als eigentliche Grenzwerte existieren, für 0 ≤ k < n. Dabei wird wie immer x 0 = a und x n = b gesetzt. Aus den Grenzwertbedingungen folgt nämlich, dass wir g k als stetige Funktion auf [x k , x k+1 ] betrachten können, die außer in den Randpunkten x k , x k+1 mit f übereinstimmen. Nach (7.13) ist g k und damit f |[x k ,x k+1 ] integrierbar, und mit (7.10) folgt daraus die Integrierbarkeit von f auf [a, b]. Der folgende Satz wird im folgenden Abschnitt ein zentrales Hilfsmittel beim Beweis des Hauptsatzes der Differentialund Integralrechnung sein. (7.14) Satz (Mittelwertsatz der Integralrechnung) Seien f , g : [a, b] → R stetige Funktionen, wobei wir g ≥ 0 voraussetzen. Dann gibt es ein c ∈ [a, b] mit b Z f (x)g(x) d x = f (c) a g(x) d x. a Der Spezialfall g = 1 liefert die Gleichung Beweis: b Z Rb a f (x) d x = f (c)(b − a) für ein c ∈ [a, b]. Wir definieren u = min f ([a, b]) und v = max f ([a, b]). Nach dem Maximumsprinzip sind diese Werte als reelle Zahlen definiert, und es existieren Punkte p, q ∈ [a, b] mit f (p) = u und f (q) = v. Wir können p < q voraussetzen, denn im Fall q > p läuft der Beweis völlig analog, und im Fall p = q ist die Funktion f konstant und die Aussage daher trivial. Nach Voraussetzung gilt ug ≤ f g ≤ v g auf dem gesamten Intervall [a, b]. Auf Grund von (7.9) (iii) gelten deshalb die Ungleichungen b Z u b Z f (x)g(x) d x ≤ g(x) d x a ≤ v g(x) d x. a Insbesondere gibt es ein µ ∈ [u, v] mit Rb a b Z a f (x)g(x) d x = µ Rb a g(x) d x. Da f stetig ist, liefert uns der Zwischen- wertsatz (5.14) einen Punkt c ∈ [p, q] mit f (c) = µ. Damit ist die Aussage bewiesen. Für reelle Zahlen a, b ∈ R mit a < b und integrierbare Funktionen f auf [a, b] definieren wir a Z f (x) d x = 0 a Z f (x) d x = − und a b b Z f (x) d x. a Man beachte, dass der Mittelwertsatz der Integralrechnung für a ≥ b gültig bleibt. Ebenso leicht überzeugt man sich davon, dass die letzte Gleichung in (7.10) für beliebige reelle Zahlen a, b, c gültig bleibt, unabhängig von deren Anordnung. —– 170 —– (II) Der Hauptsatz der Differential- und Integralrechnung In diesem Abschnitt untersuchen wir den Zusammenhang zwischen dem Riemann-Integral und der Ableitung von Funktionen. Als Ergebnis werden wir das aus der Schulmathematik bekannte Resultat herleiten, dass sich das Integral einer Funktion f mit Hilfe von Stammfunktionen berechnen lässt. (7.15) Definition Sei D ⊆ R und f : D → R eine beliebige Funktion. Eine Funktion F : D → R wird Stammfunktion von f genannt, wenn F auf ganz D differenzierbar ist und F 0 = f gilt. Als erstes zeigen wir mit Hilfe des Mittelwertsatzes der Integralrechnung, dass das Riemann-Integral zur Definition von Stammfunktionen verwendet werden kann. (7.16) Proposition Sei f : ]a, b[ → R stetig und c ∈ ]a, b[. Die Funktion F : ]a, b[ → R sei definiert durch F (x) x Z = f (t) d t. c Dann ist F eine Stammfunktion von f . Beweis: Sei x ∈ ]a, b[ und (x n )n∈N eine Folge in ]a, b[ \ {x} mit limn x n = x. Für den Differentialquotienten von F gilt F (x n ) − F (x) xn − x = xn Z 1 xn − x f (t) d t − c x Z f (t) d t = c 1 xn − x xn Z f (t) d t. x Nach dem Mittelwertsatz der Integralrechnung gibt es für jedes n ∈ N im Fall x < x n ein yn ∈ [x, x n ] und im Fall x > x n ein yn ∈ [x n , x] mit xn Z f (t) d t = (x n − x) f ( yn ). x Nach Definition gilt | yn − x| ≤ |x n − x| für alle n ∈ N. Mit (x n )n∈N konvergiert also auch die Folge ( yn )n∈N gegen x, und aus der Stetigkeit von f folgt lim F (x n ) − F (x) n→∞ xn − x = lim f ( yn ) n→∞ = f (x). Also gilt tatsächlich F 0 (x) = f (x) für alle x ∈ ]a, b[. (7.17) Proposition Sei f : ]a, b[ → R eine Funktion und F :→ R eine Stammfunktion. Eine weitere Funktion G auf ]a, b[ ist genau dann eine Stammfunktion von f , wenn die Differenz G − F auf ]a, b[ konstant ist. Beweis: „⇒“ „⇐“ Ist G − F konstant, dann gilt (G − F )0 (x) = 0 und somit G 0 (x) = F 0 (x) = f (x) für alle x ∈ ]a, b[. Seien F, G Stammfunktionen von f . Nach Voraussetzung gilt (G − F )0 = G 0 − F 0 = f − f = 0, und nach Folgerung (6.16) ist G − F damit auf ]a, b[ konstant. —– 171 —– (7.18) Satz (Hauptsatz der Differential- und Integralrechnung) Sei f : ]a, b[ → R stetig und F eine Stammfunktion von f . Für alle c, d ∈ ]a, b[ gilt dann d Z f (x) d x = F (d) − F (c). c Rx Nach Proposition (7.16) ist durch F̃ (x) = c f (t) d t jedenfalls eine Stammfunktion von f gegeben. Für Rd diese gilt F̃ (c) = 0 und F̃ (d) = c f (t) d t. Da F eine weitere Stammfunktion ist, existiert nach Proposition (7.17) Beweis: ein u ∈ R mit F (x) = F̃ (x) + u für alle x ∈ ]a, b[. Es gilt also F (d) − F (c) = F̃ (d) − F̃ (c) d Z = f (x) d x. c Um Schreibarbeit zu sparen, verwendet man im Zusammenhang mit einer Stammfunktion F häufig die Notation d F (x) F (d) − F (c). für die Differenz c Die Gleichung aus dem Hauptsatz kann dann in der Form Rd d f (x) d x = F (x) c geschrieben werden. Man kann c die Schreibweise noch weiter vereinfachen, indem man einfach Z f (x) d x = notiert. Ausgeschrieben soll dies bedeuten, dass die Gleichung F (x) Rd c d f (x) d x = F (x) c für beliebige c, d im Defini- tionsbereich von f erfüllt ist. Den Ausdruck auf der linken Seite bezeichnet man als unbestimmtes Integral. Man beachte, dass die Funktion F auf der rechten Seite nur bis auf eine Konstante eindeutig bestimmt ist. Dort kann eine beliebige Stammfunktion von f erscheinen. So wäre zum Beispiel auch die Gleichung Z x3 d x = 1 4 x 4 +1 korrekt. Im allgemeinen bemüht man sich bei der Angabe von unbestimmten Integralen aber, eine möglichst „einfache“ Stammfunktion auszuwählen. Für n ∈ R mit n 6= −1 gilt Z xn d x = x n+1 , n+1 unter der Bedingung x 6= 0 falls n < 0. Die Bedingung x 6= 0 bedeutet, dass die Null nicht im Integrationsintervall [a, b] liegen darf, d.h. die ausführlich geschriebene Gleichung b Z xn d x = a —– 172 x n+1 b n+1 a —– ist nur gültig, wenn a, b ∈ R beide positiv oder beide negativ sind. Denn ansonsten wäre die Funktion x n nicht an Rb jeder Stelle des Intervalls [a, b] definiert und daher auch a x n d x undefiniert. Selbst wenn wir die Funktion an der Stelle 0 willkürlich fortsetzen würden, etwa in der Form 7→ x x n für x 6= 0 0 für x =0 hätte das Integralzeichen keine Bedeutung, da wir schon allein für die Definition des Ober- oder Unterintegrals eine beschränkte Funktion benötigen. Als weiteres Beispiel beweisen wir die Gleichung Z dx x = ln |x| x 6= 0. für Sei nämlich [a, b] ein Integrationsintervall. Nach Voraussetzung gilt 0 ∈ / [a, b], d.h. die Grenzen a, b ∈ R sind entweder beide positiv oder beide negativ. Für x > 0 ist ln(x) eine Stammfunktion von x 7→ 1x , also gilt b Z dx = x a b ln(x) a, b > 0 für a nach dem Hauptsatz der Differential- und Integralrechnung. Im Fall x < 0 ist F (x) = ln(−x) eine Stammfunktion 1 = 1x . Wir erhalten für x 7→ 1x , denn nach der Kettenregel gilt F 0 (x) = (−1) −x b Z dx = x a b ln(−x) a, b < 0. für a Sowohl für a, b > 0 als auch für a, b < 0 gilt also die Gleichung b Z dx a x = b ln |x| . a Aus dem Hauptsatz der Differential- und Integralrechnung ergibt sich wegen exp0 (x) = exp(x) auch unmittelbar die Integralformel Z exp(x) d x (7.19) Satz = exp(x). (Substitutionsregel) Sei f : I → R stetig und u : I → R stetig differenzierbar mit u(I) ⊆ I. Dann gilt b Z 0 f (u(t))u (t) d t = a Z u(b) u(a) —– 173 —– f (x) d x. Beweis: Sei F : I → R eine Stammfunktion von f und G = F ◦ u. Die Anwendung der Kettenregel liefert (F ◦ u)0 (t) d t F 0 (u(t))u0 (t) = f (u(t))u0 (t). = Diese Funktion ist auf Grund unserer Voraussetzungen stetig. Folglich erhalten wir nach dem Hauptsatz der Differential- und Integralrechnung Z b Z 0 f (u(t))u (t) d t b 0 = a (F ◦ u) (t) d t = b (F ◦ u)(t) = u(b) F (x) a a Z = u(a) u(b) f (x) d x. u(a) Als erstes Anwendungsbeispiel für die Substitutionsregel beweisen wir die Formel Z dx = ln |x + c| für x 6= −c. x +c Seien a, b ∈ R. Liegt −c nicht im Intervall [a, b], dann ist 0 nicht in [a + c, b + c] enthalten. Anwendung der Substitutionsregel auf u(t) = t + c mit Ableitung u0 (t) = 1 liefert Z b Z b 0 Z b+c b+c dt u (t) d x dx = = = ln |x| t+c u(t) x a+c a a a+c Z x exp(x 2 ) d x 1 2 = = ln |x + c| b a exp(x 2 ). Hier verwenden wir u(t) = t 2 mit der Ableitung u0 (t) = 2t. b Z te t2 dt = a 1 2 b Z (2t)e t2 dt 1 2 = a Beim nächsten Beispiel ist zu beachten, dass allgemein R dx f (x) Z b2 ex d x = a2 1 x2 e 2 b a nur eine vereinfachte Schreibweise für Wir zeigen Z dx (x + c)n = 1 1−n (x + c)1−n n ∈ N, n ≥ 2. für Wiederum verwenden wir die Substitution u(t) = x + c mit u0 (t) = 1 an und erhalten Z b Z b+c b+c b dt 1 1 −n 1−n 1−n = x dx = x = (x + c) (t + c)n 1−n 1−n a+c a a a+c (7.20) Satz (partielle Integration) Seien f , g : I → R zwei stetig differenzierbare Funktionen. Dann gilt b Z 0 f (x)g (x) d x = a a —– b b Z f (x)g(x) − 174 —– f 0 (x)g(x) d x. a . R 1 f (x) d x ist. Beweis: Wir wenden die Produktregel auf die Funktion F = f g an und erhalten F 0 (x) = f 0 (x)g(x) + f (x)g 0 (x). Der Hauptsatz der Differential- und Integralrechnung liefert b Z 0 f (x)g(x) d x + a b Z 0 f (x)g (x) d x b Z = a F 0 (x) d x = b F (x) = b f (x)g(x) . a a a Durch Umstellen erhalten wir die gewünschte Gleichung. Als Anwendung der partiellen Integration beweisen wir Z = x exp(x) (x − 1) exp(x). Dazu definieren wir die Funktionen f (x) = x und g(x) = exp(x) mit den Ableitungen f 0 (x) = 1 und g 0 (x) = exp(x). Für beliebige a, b ∈ R gilt dann b Z x exp(x) d x = a b Z 0 f (x)g (x) d x = a a b Z b x exp(x) − 1 · exp(x) d x a = a f 0 (x)g(x) d x = a b b x exp(x) − exp(x) a b b Z f (x)g(x) − = b (x − 1) exp(x) . a a Durch mehrfache Anwendung der partiellen Integration lassen sich kompliziertere Ausdrücke integrieren, beispielsweise Z (x 2 + 5) exp(x) d x = (x 2 − 2x + 7) exp(x). Für beliebige a, b ∈ R gilt nämlich b Z 2 (x + 5) exp(x) d x = b Z b (x + 5) exp(x) − 2x exp(x) d x 2 a a b b Z b (x 2 + 5) exp(x) − 2x exp(x) + 2 exp(x) d x a a = = a b b b (x 2 + 5) exp(x) − 2x exp(x) + 2 exp(x) a a = a b 2 (x − 2x + 7) exp(x) . a Als weiteres Anwendungsbeispiel beweisen wir Z ln(x) d x = x ln(x) − x für x > 0. Hier besteht der Trick darin, die partielle Integration auf das „triviale“ Produkt ln(x) = 1 · ln(x) anzuwenden. b Z ln(x) d x = a b Z 1 · ln(x) d x = a a = b Z b x ln(x) − 1 dx a = x· a b x ln(x) − x . a a —– b b Z x ln(x) − 175 —– 1 x dx a Allgemeiner kann mit partieller Integration und vollständiger Induktion gezeigt werden, dass Z x n+1 x n ln(x) d x = ((n + 1) ln(x) − 1) für alle n ∈ N0 gilt. (n + 1)2 Wir werden noch weitere Beispiele für die Berechnung von Integralen angeben, sobald wir die trigonometrischen Funktionen (Sinus und Kosinus) definiert haben. (III) Trigonometrische Funktionen Unser Ziel in diesem Kapitel besteht darin, die aus dem Schulunterricht bekannten trigonometrischen Funktionen (Sinus, Kosinus und Tangens) zu definieren. Bekanntlich hängen diese drei Funktionen mit der Geometrie der rechtwinkligen Dreiecke zusammen. Bezeichnet α einen der nicht-rechten Winkel eines solchen Dreiecks und sind a, b, c die Seitenlängen von Ankathete, Gegenkathete und Hypothenuse, dann gelten die Beziehungen cos(α) = a c sin(α) = , b c , tan(α) = b a . Dabei wird in die Kosinus-, Sinus- und Tangensfunktion der Winkel jeweils im Bogenmaß eingesetzt. Dies ist die Länge des Teils vom Kreisbogen, der über dem Winkel liegt, bei einem 90◦ -Winkel also beispielsweise die Bogenlänge eines Viertelkreises vom Radius 1. Um die Länge von Kreisbögen oder allgemeineren Kurven präzise definieren zu können, benötigen wir ein wenig Vorbereitung. Für jeden Punkt p = (p1 , p2 ) ∈ R2 setzen wir = kpk Æ p12 + p22 und bezeichnen diese Zahl als Abstand des Punkts p vom Koordinatenursprung (0, 0). Für beliebige Punkte p, q ∈ R2 gilt die Dreiecksungleichung kp + qk ≤ kpk + kqk. Anschaulich ist das klar, den Beweis werden wir in der Analysis meherer Variablen nachholen. Durch einen einfachen Induktionsbeweis leitet man daraus für endlich viele Punkte p1 , ..., pn die Ungleichung n X pk k=1 ≤ n X kpk k k=1 ab. Den Wert kq − pk bezeichnen wir als den Abstand der Punkte p und q. Im folgenden seien a, b ∈ R mit a < b und f : [a, b] → R eine stetige Funktion. (7.21) Definition Sei Z = {x 1 , ..., x m−1 } eine Zerlegung von [a, b], außerdem x 0 = a und x m = b. Für jedes k ∈ {0, ..., m} setzen wir pk = (x k , f (x k )). Dann bezeichnen wir `( f , Z ) = m−1 X kpk+1 − pk k k=0 als die Länge des von f und Z definierten Polygonzugs. —– 176 —– (7.22) Lemma Ist Z 0 eine Verfeinerung von Z , dann gilt `( f , Z ) ≤ `( f , Z 0 ). Beweis: Sei Z 0 = { y1 , ..., yn−1 }, außerdem y0 = a und yn = b. Wegen Z ⊆ Z 0 gibt es für jedes k ∈ {0, ..., m} ein `k ∈ {0, ..., n} mit x k = y`k , insbesondere ist `0 = 0 und `m = n. Setzen wir q` = ( y` , f ( y` )) für 0 ≤ ` ≤ n, dann gilt pk = q`k für 0 ≤ k ≤ m. Wegen = pk+1 − pk q`k+1 − q`k `k+1 −1 X (q`+1 − q` ) = `=`k erhalten wir mit der Dreiecksungleichung von oben die Abschätzung 0 `( f , Z ) = n−1 X −1 m−1 X X `k+1 = kq`+1 − q` k `=0 ≥ m−1 X k=0 = kpk+1 − pk k kq`+1 − q` k `=`k `( f , Z ). k=0 (7.23) Definition Sei Z(a, b) die Menge der Zerlegungen von [a, b]. Ist die Menge M = `( f , Z ) | Z ∈ Z(a, b) nach oben beschränkt, dann nennen wir `( f ) = sup M die Bogenlänge des Funktionsgraphen von f . (7.24) Proposition Sei c ∈ ]a, b[ ein Punkt mit der Eigenschaft, dass die Bogenlängen `( f |[a,c] ) und `( f |[c,b] ) existieren. Dann existiert auch die Bogenlänge `( f ), und es gilt `( f ) Beweis: = `( f |[a,c] ) + `( f |[c,b] ). Sei s ∈ R die Summe auf der rechten Seite der Gleichung und M = {`( f , Z ) | Z ∈ Z(a, b)}. Zu zeigen ist, dass es sich bei s um das Supremum der Menge M handelt. Zunächst überprüfen wir, dass s eine obere Schranke von M ist. Sei dazu Z ∈ Z(a, b) beliebig vorgegeben. Wir definieren Z0 = Z ∪ {c}, außerdem Z 0 = Z0 ∩ ]a, c[ Z 00 = Z0 ∩ ]c, b[ . und Sei Z 0 = {x 1 , ..., x m−1 }, Z 00 = { y1 , ..., yn−1 }, außerdem x 0 = a, x m = y0 = c und yn = b. Weiter sei pk = (x k , f (x k )) für 0 ≤ k ≤ m und qk = ( yk , f ( yk )) für 0 ≤ k ≤ n. Wir erhalten dann `( f , Z ) ≤ `( f , Z0 ) = m−1 X kpk+1 − pk k + k=0 kqk+1 − qk k k=0 `( f |[a,c] , Z 0 ) + `( f |[c,b] , Z 00 ) —– n−1 X 177 ≤ `( f |[a,c] ) + `( f |[c,b] ). —– = Nun zeigen wir noch, dass es sich bei s um die kleinste obere Schranke von M handelt. Sei dazu " ∈ R+ vorgegeben. Nach Definition von `( f |[a,c] ) und `( f |[c,b] ) gibt es Zerlegungen Z 0 und Z 00 der Intervalle [a, c] und [c, b] mit `( f |[a,c] , Z 0 ) > `( f |[a,c] ) − 21 " und `( f |[c,b] , Z 00 ) > `( f |[c,b] ) − 21 ". Setzen wir Z = Z 0 ∪ {c} ∪ Z 00 , dann gilt offenbar `( f , Z ) `( f |[a,c] , Z 0 ) + `( f |[c,b] , Z 00 ) , = und daraus folgt ( f , Z ) > s − ". Damit ist bewiesen, dass s − " für beliebiges " ∈ R+ keine obere Schranke von M ist. Für unsere trigonometrischen Anwendungen sind wir an einer speziellen Funktion besonders interessiert. Wir bezeichnen den Funktionsgraphen von κ : [−1, 1] −→ R , x 7→ p 1 − x2 als den (oberen) Halbkreis. (7.25) Proposition Seien a, b ∈ R mit a < b und −1 ≤ a, b ≤ 0 oder 0 ≤ a, b ≤ 1. Dann ist die Bogenlänge `(κ|[a,b] ) definiert und genügt der Abschätzung `(κ|[a,b] ) Beweis: ≤ (b − a) + |κ(b) − κ(a)|. Wir setzen −1 ≤ a, b ≤ 0 voraus; im andere Fall verläuft der Beweis vollkommen analog. Sei Z eine beliebige Zerlegung von [a, b]; offenbar genügt es zu zeigen, dass `(κ|[a,b] , Z ) nach oben durch (b−a)+|κ(b)−κ(a)| abgeschätzt werden kann. Sei dazu Z = {x 1 , ..., x m−1 }, außerdem x 0 = a und x m = b. Für 0 ≤ k ≤ m definieren wir die Punkte pk = (x k , κ(x k )) , qk = (x k , 0) und rk = (0, κ(x k )). Wegen pk = qk + rk gilt jeweils kpk+1 − pk k ≤ kqk+1 −qk k+krk+1 − rk k für 0 ≤ k < m. Wegen x k < x k+1 gilt außerdem kqk+1 − qk k = k(x k+1 − x k , 0)k = x k+1 − x k , und weil die Funktion κ auf [−1, 0] streng monoton wachsend ist, gilt jeweils krk+1 − rk k = κ(x k+1 ) − κ(x k ). Insgesamt erhalten wir damit die Abschätzung `(κ|[a,b] , Z ) = m−1 X kpk+1 − pk k ≤ k=0 ≤ m−1 X k=0 m−1 X k=0 X m−1 x k+1 − x k + κ(x k+1 ) − κ(x k ) = kqk+1 − qk k + m−1 X krk+1 − rk k k=0 (b − a) + (κ(b) − κ(a)). k=0 Auf Grund von (7.24) und (7.25) existiert damit auch die Bogenlänge `(κ); man bezeichnet diese als die Kreiszahl π. Wir beschäftigen und nun mit der Frage, wie die Kreiszahl mit Hilfe der Differential- und Integralrechnung bestimmt werden kann. —– 178 —– (7.26) Satz Seien a, b ∈ R, a < b und f : ]a, b[ → R eine stetig differenzierbare Funktion. Für beliebige c, d ∈ R mit a < c < d < b gilt dann `( f |[c,d] ) = d Z p 1 + f 0 (x)2 d x. c Sei Z = {x 1 , ..., x m−1 } eine beliebige Zerlegung von [c, d], und x 0 = c, x m = d. Nach dem Mittelwertsatz der Differentialrechnung (6.15) existiert für 0 ≤ k < m jeweils ein yk ∈ x k , x k+1 , so dass die Gleichung Beweis: f 0 ( yk ) f (x k+1 ) − f (x k ) = x k+1 − x k erfüllt ist. Setzen wir wieder pk = (x k , f (x k )) für 0 ≤ k ≤ m, dann erhalten wir damit `( f , Z ) = m−1 X kpk+1 − pk k = k=0 m−1 X m−1 XÆ x k+1 − x k 2 2 + f (x k+1 ) − f (x k ) = k=0 È (x k+1 − x k ) 1+ f (x k+1 ) − f (x k ) x k+1 − x k k=0 Die Funktion g : [c, d] → R, x 7→ p 2 = m−1 X p (x k+1 − x k ) 1 + f 0 ( yk )2 . k=0 1 + f 0 (x)2 ist stetig, nach Satz (7.13) also Riemann-integrierbar. Die soeben durchgeführte Rechnung zeigt, dass `( f , Z ) die Riemannsche Summe der Funktion g zur Zerlegung Z ist. Sei nun Z(c, d) die Menge aller Zerlegungen von [c, d] und M = {`( f , Z ) | Z ∈ Z(c, d)}. Wir beweisen die Aussage Rd des Satzes, indem wir zeigen, dass s = c g(x) d x das Supremum von M ist. Seien Z ∈ Z(c, d) und " ∈ R+ vorgegeben. Nach Satz (7.8) (iv) gibt es ein δ ∈ R+ mit der Eigenschaft, so dass jede Riemannsche Summe zu einer Zerlegung mit Feinheit kleiner als δ höchstens um den Wert " vom Integralwert s abweicht. Ist Z 0 eine Zerlegung von [c, d] mit δ(Z 0 ) < δ, dann kann die Feinheit von Z ∪ Z 0 erst recht durch δ abgeschätzt werden, und es folgt `( f , Z ) ≤ `( f , Z ∪ Z 0 ) ≤ s + ". Weil " ∈ R+ beliebig klein gewählt werden kann, ist s damit eine obere Schranke von M . Um zu zeigen, dass es sich um die kleinste obere Schranke handelt, sei " ∈ R+ und wiederum δ ∈ R+ der zugehörige Wert nach Satz (7.8). Für jede Zerlegung Z mit δ(Z ) < δ gilt dann `( f , Z ) > s − ". Dies zeigt, dass s − " keine obere Schranke von M ist. Leider kann (7.26) für die Berechnung von π nicht direkt verwendet werden, weil die Funktion κ in den Punkten −1 und 1 nicht differenzierbar ist. Auf dem offenen Intervall ]−1, 1[ ist die Ableitungsfunktion von κ(x) = (1 − x 2 )1/2 gegeben durch κ0 (x) = 1 (−2x)(1 − 2 —– x 2 )−1/2 179 —– = −p x 1 − x2 . Dies bedeutet, dass immerhin auf den abgeschlossenen Teilintervallen [a, b] ⊆ ]−1, 1[ die Bogenlänge von κ|[a,b] durch `(κ|[a,b] ) bp Z = 1+ f 0 (x)2 Z br = dx a x2 1+ Z br 1 − x2 + x2 1− a = dx x2 b Z = dx 1 − x2 a dx p a 1 − x2 bestimmt werden kann. Darüber hinaus ist die folgende Integralgleichung bei der Berechnung von π hilfreich. (7.27) Proposition Für alle a, b ∈ R mit −1 < a < b < 1 gilt 2 Z bp 1− x2 = dx a a Beweis: b Z p b 2 x 1− x + dx p a . 1 − x2 Dieses Ergebnis erhält man durch Anwendung der partiellen Integration. Es gilt Z b p Z bp p b Z b 1 − x2 d x = 1· a = = 1 − x2 d x 1 − x2 x − a a b p b Z 2 x 1− x + a x2 p a = = dx 1 − x2 a b p b Z 2 x 1− x + a b p b Z 2 x 1− x + dx p a 1− x2 − Z bp a a (−x) dx x·p 1 − x2 dx p 1 − x2 b Z − a 1 − x2 dx p 1 − x2 1 − x 2 d x. a Durch Umstellen der Gleichung erhält man das gewünschte Ergebnis. Daraus erhalten wir nun unmittelbar (7.28) Folgerung Die Kreiszahl π erfüllt die Gleichung π Z = 1 2 p 1 − x 2 d x. −1 Weil das Integral rechts den Flächeninhalt des Halbkreises angibt, entspricht π also nicht nur der Länge des Halbkreisbogens, sondern auch dem Flächeninhalt des Vollkreises. Beweis: Sei ("n )n∈N eine beliebige Folge in ]0, 1[ mit limn "n = 0. Für jedes n ∈ N gilt π = `(κ) = `(κ|[−1,−1+"n ] ) + `(κ|[−1+"n ,1−"n ] ) + `(κ|[1−"n ,1] ) `(κ|[−1,−1+"n ] ) + Z 1−"n −1+"n —– dx p 180 1 − x2 —– + `(κ|[1−"n ,1] ). = Der erste und letzte Term kann nach Proposition (7.25) abgeschätzt werden durch "n + κ(−1 + "n ) − κ(−1) "n + κ(1) − κ(1 − "n ) . bzw. Auf Grund der Stetigkeit von κ konvergieren also beide Terme für n → ∞ gegen Null. Für den mittleren Term gilt 1−" Z n dx p −1+"n Auch der Ausdruck p 1−"n 2 x 1− x 1 − x2 = 1−" Z n 2 p p 1−"n 1 − x2 d x − x 1 − x2 . −1+"n −1+"n p 1 − (1 − "n )2 (1 − "n ) − (−1 + "n ) = = p 2(1 − "n ) 1 − (1 − "n )2 −1+"n R 1−"n p konvergiert gegen Null. Insgesamt haben wir damit also π = limn −1+" 2 1 − x 2 d x nachgewiesen. Wegen 0 ≤ p Rbp n 1 − x 2 ≤ 1 gilt für beliebige a, b ∈ [−1, 1] die Abschätzung 0 ≤ a 1 − x 2 d x ≤ (b − a). Daraus folgt 1−" −1+" Z1 Z n p Z1 p Z n p p 2 1 − x2 d x + 2 1 − x2 d x = 2 1 − x2 d x ≤ 2 1 − x2 d x − −1 −1 −1+" 1−" n n 2((−1 + "n ) − (−1)) + 2(1 − (1 − "n )) = 4"n . Damit erhalten wir wie gewünscht π = 1−" Z n lim 2 n→∞ p 1− x2 = dx 2 −1+"n Z1 p 1 − x 2 d x. −1 Für die Definition von Sinus- und Kosinusfunktion betrachten wir nun die Abbildung α : [−1, 1] −→ R , x 7→ `(κ|[x,1] ). (7.29) Lemma Die Funktion α ist auf ihrem gesamten Definitionsbereich stetig und streng monoton fallend. Außerdem ist sie auf ]−1, 1[ differenzierbar, und sie bildet das Intervall [−1, 1] bijektiv auf [0, π] ab. Beweis: Seien x, y ∈ ]−1, 1[ vorgegeben. Nach Definition gilt α( y) − α(x) = `(κ|[ y,1] ) − `(κ[x,1] ) = `(κ|[ y,x] ) = y Z − x dt p , 1 − t2 und nach dem Hauptsatz der Differential- und Integralrechnung folgt daraus die Differenzierbarkeit von α auf ]−1, 1[ sowie die Gleichung α0 (x) = −(1 − x 2 )−1/2 . Wenn wir nachweisen können, dass α auch in den Punkten −1 —– 181 —– und 1 stetig ist, dann folgt insgesamt aus Satz (6.22), dass α eine streng monoton fallende Funktion und damit auch eine injektive Abbildung ist. Die Stetigkeit im Punkt 1 folgt aus der Abschätzung α(x) = `(κ|[x,1] ) (1 − x) + κ(1) − κ(x) für ≤ x ∈ [0, 1] nach Proposition (7.25). Die Stetigkeit im Punkt −1 erhalten wir durch π − α(x) = `(κ|[−1,1] ) − `(κ|[x,1] ) = `(κ|[−1,x] ) ≤ (x + 1) + κ(x) − κ(−1). Aus den beiden Abschätzungen folgt nämlich lim α(x) = 0 = α(1) lim (π − α(x)) = 0 = π − α(−1). und x→1 x→−1 Die Surjektivität von α folgt schließlich aus den Gleichungen α(−1) = π, α(1) = 0, der Stetigkeit von α und dem Zwischenwertsatz. Aus (7.29) folgt, dass α eine stetige, streng monoton fallende Umkehrfunktion β : [0, π] → [−1, 1] besitzt, mit β(0) = 1 und β(π) = −1. (7.30) Definition Es gibt eindeutig bestimmte Funktionen cos : R → R und sin : R → R mit den Eigenschaften (i) cos(α(x)) = x und sin(α(x)) = p 1 − x 2 für alle x ∈ [−1, 1] (ii) cos(x + π) = − cos(x) und sin(x + π) = − sin(x) für alle x ∈ R. Wir bezeichnen sie als Kosinus- und Sinusfunktion. Beweis: Wir beginnen mit der Definition der Kosinusfunktion. Ist x ∈ R vorgegeben, dann setzen wir k = b πx c cos(x) = (−1)k β(x − kπ). und Zu zeigen ist, dass cos die unter (i) und (ii) genannten Eigenschaften tatsächlich besitzt. Zum Nachweis von (i) sei x ∈ [−1, 1] vorgegeben. Ist x > −1, dann ist b α(x) = π, somit α(x) b π c α(x) c π = 0 und somit cos(α(x)) = β(α(x)) = x. Im Fall x = −1 ist = 1 und cos(α(x)) = −β(α(x) − π) = −β(0) = −1 = x. Zum Nachweis von (ii) sei x ∈ R beliebig vorgegeben. Setzen wir k = b πx c, dann ist b x+π c = k + 1, und wir erhalten π cos(x + π) = (−1)k+1 β((x + π) − (k + 1)π) = −(−1)k β(x − kπ) Nun definieren wir die Sinusfunktion für beliebiges x ∈ R durch k = b πx c und sin(x) = (−1)k —– 182 —– p 1 − cos(x − kπ)2 . = − cos(x). Für x ∈ [−1, 1] gilt dann sin(α(x)) = p 1 − cos(α(x))2 = p 1 − x 2 . Ist x ∈ R vorgegeben und k = b πx c, dann gilt b x+π c = k + 1 und folglich π sin(x + π) = (−1)k+1 p 1 − cos((x + π) − (k + 1)π)2 = −(−1)k p 1 − cos(x − kπ)2 = − sin(x). Damit ist die Existenzbeweis für die Funktionen cos und sin abgeschlossen. Zum Nachweis der Eindeutigkeit sei f : R → R eine beliebige Funktion mit f (α(x)) = x für x ∈ [−1, 1] f (x + π) = − f (x) für x ∈ R. und Sei x ∈ R vorgegeben und k = b πx c. Dann gilt 0 ≤ x −kπ < π und f (x) = (−1)k f (x −kπ). Setzen wir y = β(x −kπ), dann gilt y ∈ ]−1, 1], und wir erhalten insgesamt f (x) = (−1)k f (x − kπ) (−1)k cos(α( y)) = = (−1)k f (α( y)) = (−1)k y (−1)k cos(x − kπ) = cos(x). = Damit ist die Eindeutigkeit der Kosinusfunktion nachgewiesen. Für die Eindeutigkeit der Sinusfunktion läuft der Beweis nach demselben Schema ab. Als nächstes werden wir die Stetigkeit und die Differenzierbarkeit von Sinus- und Kosinusfunktion beweisen. Auf Grund der Gleichungen cos(x + kπ) = (−1)k cos(x) und sin(x + kπ) = (−1)k sin(x) für alle x ∈ R und k ∈ Z folgt die Stetigkeit bzw. Differenzierbarkeit an einer Stelle x auch Stetigkeit bzw. Differenzierbarkeit bei x + kπ für alle k ∈ Z; im Falle der Differenzierbarkeit gilt jeweils sin0 (x + kπ) = (−1)k sin0 (x) cos0 (x + kπ) = (−1)k cos0 (x). und Darüber hinaus zeigt (7.30), dass die Gleichung sin(x)2 + cos(x)2 = für alle x ∈ R 1 erfüllt ist. Denn nach Punkt (i) gilt sie zunächst für 0 ≤ x < π, und auf Grund der Gleichungen für sin(x + πk) und cos(x + πk) überträgt sie sich auf ganz R. Zum Schluss bemerken wir noch, dass die Ungleichung sin(x) > 0 p / {±1}. Für k ∈ Z und für alle x ∈ ]0, π[ erfüllt ist, denn für diese x ist sin(x) = 1 − cos(x)2 und cos(x) ∈ x ∈ ]kπ, (k + 1)π[ folgt damit sin(x) > 0 falls k gerade sin(x) < 0 falls k ungerade. und Das folgende Lemma war Inhalt einer Übungsaufgabe. (7.31) Lemma Seien a, b ∈ R, a < b und f : ]a, b[ → R eine stetige Funktion. Ferner setzen wir voraus, dass f auf ]a, b[ \ {c} differenzierbar ist und der Grenzwert u = lim f 0 (x) existiert. Dann ist f in c differenzierbar, und es gilt f 0 (c) = u. —– 183 —– x→c (7.32) Satz Sinus- und Kosinusfunktion sind differenzierbar, genauer gilt cos0 (x) = − sin(x) Beweis: sin0 (x) = cos(x) und für alle x ∈ R. Zunächst bestimmen wir die Ableitung von α auf dem Intervall ]−1, 1[. Bereits im Beweis von (7.29) haben wir bemerkt, dass die Gleichung α( y) − α(x) = y Z − x dt p für alle 1 − t2 x, y ∈ R gilt. Nach (7.16) folgt daraus, dass α0 (x) = −(1 − x 2 )−1/2 für alle x ∈ ]−1, 1[ erfüllt ist. Wenden wir die Umkehrregel an, so erhalten wir cos0 (x) = β 0 (x) = 1 α0 (β(x)) = − p 1 − β(x)2 = − p 1 − cos(x)2 = − sin(x) für alle x ∈ ]0, π[. Auf Grund der Vorbemerkung ist die Gleichung damit auch für alle x ∈ R \ {kπ | k ∈ Z} gültig. Als nächses zeigen wir, dass die Kosinusfunktion auf ganz R zumindest stetig ist. Auf Grund der Vorbemerkung genügt es, die Stetigkeit in 0 zu beweisen. Sei " ∈ R+ vorgegeben und (x n )n∈N eine Folge in R mit limn x n = 0. Auf Grund der Stetigkeit der Funktion β in den Punkten 0 und π gibt es ein δ ∈ R+ mit δ < π, so dass aus 0 ≤ x < δ jeweils β(x) > β(0) − " = 1 − " und aus π − δ < x ≤ π jeweils β(x) < β(π) + " = −1 + " folgt. Sei nun N ∈ N so groß, dass |x n | < δ für alle n ≥ N gilt. Für jedes solche n gilt im Fall x n > 0 dann 1 ≥ cos(x) = β(x) > 1 − ", im Fall x n < 0 gilt β(π − x) < −1 + " und somit cos(x) = −β(π − x) > 1 − ". In jedem Fall gilt also | cos(x) − cos(0)| = | cos(x) − 1| < ". Für jedes k ∈ Z und x ∈ ]kπ, (k + 1)π[ gilt jeweils sin(x) = (−1)k p 1 − cos(x)2 . Dies zeigt, dass die Sinusfunktion auf R \ {kπ | k ∈ Z} stetig ist. Wir beweisen nun die Stetigkeit der Sinusfunktion im Nullpunkt. Ist (x n )n∈N eine Folge mit limn x n = 0, dann folgt limn cos(x n ) = cos(0) = 1 auf Grund der Stetigkeit der Kosinusfunktion. Es folgt lim sin(x n )2 n→∞ = 1 − lim cos(x n )2 n→∞ = 0 und somit auch limn sin(x n ) = 0 = sin(0). Auf Grund der Vorbemerkung haben wir damit die Stetigkeit der Sinusfunktion auf ganz R bewiesen. Nun beweisen wir die Differenzierbarkeit der Kosinusfunktion im Nullpunkt. Wir wissen bereits, dass cos0 (x) = − sin(x) für alle x ∈ ]−π, π[ \ {0} gilt. Nach (7.31) folgt daraus cos0 (0) = lim cos0 (x) x→0 = lim − sin(x) x→0 = − sin(0). Mit Hilfe der Vorbemerkung erhalten wir die Differenzierbarkeit der Kosinusfunktion und die Gültigkeit der Gleichung cos0 (x) = − sin(x) auf ganz R. —– 184 —– Zum Schluss beweisen wir die Differenzierbarkeit der Sinusfunktion. Auf dem Intervall ]0, π[ gilt für den Sinus die p Gleichung sin(x) = 1 − cos(x)2 , somit liefert die Kettenregel sin0 (x) = 1 −2(− sin(x)) cos(x) · p 2 1 − cos(x)2 sin(x) cos(x) = sin(x) = cos(x). Wiederum überträgt sich die Gleichung sin0 (x) = cos(x) auf alle x ∈ R \ {kπ | k ∈ Z}. Um die Differenzierbarkeit im Nullpunkt zu beweisen, wenden wir erneut (7.31) an. Weil die Sinusfunktion auf ganz R stetig ist und sin0 (x) = cos(x) für alle x ∈ ]−π, π[ \ {0} gilt, erhalten wir sin0 (0) = lim sin0 (x) x→0 = lim cos(x) x→0 = cos(0). Auf Grund der Vorbemerkung ist damit sin0 (x) = cos(x) für alle x ∈ R bewiesen. Aus (7.32) folgt, dass Sinus- und Kosinusfunktion beliegt oft differenzierbar sind. Außerdem liefern die Ableitungen die Entwicklung als Taylorreihe, die wir am Ende des letzten Kapitels angegeben haben. Durch Einsetzen in die Reihendarstellung sieht man auch, dass cos(−x) = cos(x) und sin(−x) = − sin(x) erfüllen. Die erste Gleichung erfüllt auch die Funktion x 7→ x k für gerades, die zweite x 7→ x k für ungerades k ∈ Z. Man bezeichnet deshalb den Kosinus als gerade und den Sinus als ungerade Funktion. Wir wissen bereits, dass die Kosinusfunktion eingeschränkt auf das Intervall [0, π] eine stetige, bijektive, streng monoton fallende Funktion [0, π] → [−1, 1] definiert. Die Umkehrfunktion arccos : [−1, 1] −→ [0, π] bezeichnet man als Arcus cosinus. Wir haben bereits im Beweis von (7.32) gesehen, dass der Arcus cosinus auf ]−1, 1[ differenzierbar ist, mit der Ableitungsfunktion arccos0 (x) = −p 1 . 1 − x2 Auf Grund der Stetigkeit der Kosinusfunktion, und wegen cos(0) = 1 > 0 und cos(π) = −1 < 0 besitzt cos im offenen Intervall ]0, π[ eine Nullstelle γ. Weil cos auf [0, π] streng monoton fallend ist, muss dies die einzige Nullstelle sein. Aus der Gleichung cos(π − γ) = cos(γ − π) = (−1) cos(γ) = 0 folgt γ = 12 π. Wegen cos(x + kπ) = (−1)k cos(x) für alle x ∈ R und k ∈ Z ist die genaue Nullstellenmenge der Kosinusfunktion durch ¨ « 1 π + kπ k ∈ Z 2 gegeben. Insbesondere gilt cos(x) > 0 für alle x ∈ 0, 12 π , wegen cos(x) = cos(−x) sogar für alle x ∈ − 12 π, 12 π . Wegen sin0 (x) = cos(x) folgt daraus, dass die Sinusfunktion auf dem abgeschlossenen Intervall − 12 π, 12 π streng monoton wachsend ist. Mit dem Zwischenwertsatz und den Werten sin(− 12 π) = −1 sin( 12 π) = 1 und zeigt man, dass es sich um eine bijektive Abbildung zwischen − 21 π, 12 π und [−1, 1] handelt. Die Umkehrfunktion arcsin : [−1, 1] −→ − 12 π, 21 π —– 185 —– nennt man den Arcus sinus. Die Ableitung dieser Funktion kann mit der Umkehrregel bestimmt werden: Für alle x ∈ ]−1, 1[ und y = arcsin(x) gilt gilt arcsin0 (x) 1 = = sin ( y) 0 1 1 = cos( y) p 1 − sin( y)2 = 1 p . 1 − x2 Schließlich definiert man noch auf dem Definitionsbereich R \ { 21 π + kπ | k ∈ Z} die Tangensfunktion durch tan(x) sin(x) = cos(x) . Mit Hilfe der Quotientenregel bestimmt man die Ableitung; für alle x im Definitionsbereich gilt tan0 (x) sin0 (x) cos(x) − sin(x) cos0 (x) = cos(x)2 + sin(x)2 = cos(x)2 = cos(x)2 1 cos(x)2 . Wegen tan0 (x) > 0 für alle x ∈ − 12 π, 21 π ist die Tangensfunktion auf diesem Intervall streng monoton wachsend. Die Einschränkung der Funktion auf dieses Intervall besitzt die Grenzwerte lim tan(x) = −∞ lim tan(x) = +∞. und x→− 21 π x→ 12 π Sei nämlich (x n )n∈N eine Folge mit limn x n = 21 π. Auf Grund der Stetigkeit von Sinus- und Cosinusfunktion gilt dann limn sin(x n ) = 1, und (cos(x n ))n∈N ist eine Folge positiver Zahlen, die gegen Null konvergiert. Insgesamt erhalten wir damit limn tan(x n ) = +∞. Den anderen Grenzwert überprüft man auf analoge Weise. Die Grenzwerte zeigen, dass die Tangensfunktion eine surjektive Abbildung von − 12 π, 21 π auf R definiert. Ist näm lich y ∈ R beliebig vorgegeben, dann gibt es auf Grund der uneigentlichen Grenzwerte Punkte a, b ∈ − 21 π, 12 π mit tan(a) < y und tan(b) > y. Der Zwischenwertsatz liefert dann ein c ∈ ]a, b[ mit tan(c) = y. Insgesamt erhält man durch die Einschränkung der Tangensfunktion also eine Bijektion zwischen − 21 π, 12 π und R. Die Umkehrabbildung arctan : R −→ − 12 π, 12 π bezeichnet man als Arcus tangens. Wiederum kann die Ableitungsfunktion mit Hilfe der Umkehrregel berechnet werden. Für alle x ∈ R und y = arctan(x) gilt arctan0 (x) = 1 tan0 ( y) cos( y)2 = cos( y)2 = cos( y)2 + sin( y)2 = 1 1 + tan( y)2 = 1 1 + x2 . Die drei Gleichungen für die Ableitungsfunktionen können natürlich auch in der Form von unbestimmten Integralen geschrieben werden. Es gilt Z p dx 1− x2 = Z sowie 1 π − arccos(x) 2 = arcsin(x) dx 1 + x2 = für −1< x <1 arctan(x). Die Unterschied von 21 π in der oberen Zeile kommt auf Grund der beiden Werte arcsin(0) = 0 und arccos(0) = 12 π zu Stande. —– 186 —– Literaturverzeichnis [App] J. Appell, Analysis in Beispielen und Gegenbeispielen. Springer-Verlag Heidelberg 2009. [For] O. Forster, Analysis 1. Vieweg studium Grundkurs Mathematik, Braunschweig 1983. [Heu] H. Heuser, Lehrbuch der Analysis, Teil 1. Teubner-Verlag Stuttgart 1991. [Hil] S. Hildebrandt, Analysis 1. Springer-Verlag Heidelberg 2002. [Koe] K. Königsberger, Analysis 1. Springer-Verlag Berlin 2001.