Analysis I Version 10.2.2016 Prof. Dr. D. Müller WS 2015/16 Inhaltsverzeichnis 0 Übergang von der Schulmathematik zur Mathematik als wissenschaftlichem Fach: Exemplarisch am Beispiel der Analysis 4 0.1 Relle Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 0.2 Zur naiven“ Differentialrechnung der Schulmathematik . . . . . . . 6 ” 1 Einleitung 17 2 Einige Grundbegriffe 2.1 Aussagen . . . . . . . . . . . . . . . . . . . . . 2.2 Mengen . . . . . . . . . . . . . . . . . . . . . . 2.3 Sätze und Beweise. Verknüpfung von Aussagen . 2.4 Quantoren . . . . . . . . . . . . . . . . . . . . . 2.5 Rechenregeln für Mengen. Indexmengen . . . . . 2.6 Mengen von Mengen . . . . . . . . . . . . . . . 2.7 Das kartesische Produkt zweier Mengen . . . . . 2.8 Funktionen . . . . . . . . . . . . . . . . . . . . 2.9 Direkte Beweise und Widerspruchsbeweise . . . . . . . . . . . . 20 20 21 25 28 30 32 33 33 40 3 Natürliche Zahlen und vollständige Induktion 3.1 Beispiele zur vollständigen Induktion . . . . . . . . . . . . . . . . . . 3.2 Rekursion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3 Die axiomatische Methode . . . . . . . . . . . . . . . . . . . . . . . . 41 44 47 49 4 Die 4.1 4.2 4.3 4.4 4.5 4.6 4.7 51 51 53 55 56 59 62 63 reellen Zahlen Körper . . . . . . . . . . . . . . . Angeordnete Körper . . . . . . . Der Absolutbetrag . . . . . . . . Schranken . . . . . . . . . . . . . Der Körper R . . . . . . . . . . . Intervalle . . . . . . . . . . . . . . Das Intervallschachtelungsprinzip 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 Folgen, Grenzwerte, Unendliche Reihen 5.1 Rechenregeln für Grenzwerte und Kovergenzssätze 5.2 Teilfolgen, Häufungspunkte . . . . . . . . . . . . 5.3 Unendliche Reihen . . . . . . . . . . . . . . . . . 5.4 Uneigentliche Konvergenz . . . . . . . . . . . . . 5.5 b-adische Brüche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 70 75 79 83 85 6 Abzählbare und überabzählbare Mengen 88 7 Die 7.1 7.2 7.3 91 93 94 96 komplexen Zahlen Elementare Eigenschaften von C . . . . . . . . . . . . . . . . . . . . . Konvergenz in C . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Algebraische Abgeschlossenheit von C . . . . . . . . . . . . . . . . . . 8 Mehr zur Konvergenz von Reihen 8.1 Weitere Konvergenzkriterien für Reihen 8.2 Limes superior und Limes inferior . . . 8.3 Das Wurzelkriterium . . . . . . . . . . 8.4 Potenzreihen. . . . . . . . . . . . . . . 8.5 Die Exponentialreihe . . . . . . . . . . 8.6 Bedingt konvergente Reihen. . . . . . . 8.7 Umordnung von Reihen . . . . . . . . . . . . . . . . . . . . . . 9 Stetige Funktionen 9.1 Grenzwerte von Funktionen . . . . . . . . 9.2 Rechenregeln . . . . . . . . . . . . . . . . 9.3 Einseitige Grenzwerte . . . . . . . . . . . . 9.4 Stetigkeit . . . . . . . . . . . . . . . . . . 9.5 Der Zwischenwertsatz . . . . . . . . . . . . 9.6 Der Satz vom Maximum . . . . . . . . . . 9.7 Existenz von Umkehrfunktionen . . . . . . 9.8 Der Logarithmus, allgemeine Potenzen und 9.9 Hyperbelfunktionen . . . . . . . . . . . . . 9.10 Trigonometrische Funktionen: 1. Teil . . . 9.11 Gleichmäßige Konvergenz . . . . . . . . . 10 Differenzierbare Funktionen 10.1 Rechenregeln für die Ableitung 10.1.1 Einige Beispiele. . . . . 10.2 Ableitungen höherer Ordnung . 10.3 Extrema . . . . . . . . . . . . . 10.3.1 Satz von l’Hospital . . . 10.3.2 Fehlerabschätzung . . . 10.3.3 Monotonie . . . . . . . . . . . . . . . 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Wurzeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98 98 100 103 104 105 109 111 . . . . . . . . . . . . . . . . . . . . . . . . . 113 . 113 . 116 . 117 . 117 . 120 . 121 . 123 . 125 . 128 . 130 . 131 . . . . . . . 134 . 138 . 140 . 143 . 144 . 146 . 147 . 148 10.4 Trigonometrische Funktionen: 2. Teil. . . . . . . . . . . . . . . . . . . 148 10.5 Konvexität . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154 11 Anhang A: Zur Konstruktion des Körpers R 11.1 Konstruktion der ganzen Zahlen . . . . . . . . . 11.2 Zu Konstruktion der rationalen Zahlen . . . . . 11.3 Zur Konstruktion der reellen Zahlen . . . . . . 11.4 Ein angeordneter Körper, der nicht archimedisch 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . angeordnet ist . . . . . . . . 159 . 159 . 163 . 164 . 169 Danksagung Die in diesem Skript enthaltenen Graphiken verdanken ihre Existenz dem unermüdlichen Einsatz sowie der Sachkunde von Herrn Dipl. math. Martin Paulat, dem ich an dieser Stelle ganz besonders danken möchte. Literatur 1. Einige Standardlehrbücher, welche alle im Kern mehr oder weniger denselben Standardlehrstoff vermitteln, doch mit teils deutlich unterschiedlichem Stil: [F] O. Forster, Analysis 1. Vieweg Studium [K] K. Königsberger, Analysis 1, Springer-Lehrbuch 1992 [AE] A. Amann, J. Escher, Analysis I, Birkhäuser 1998 [Br] Th. Bröcker, Analysis I, BI Wissenschaftsverlag 1992 [B] C. Blatter, Analysis I, Heidelberger Taschenbuch 151 2. Ein Klassiker, zwar mit einem etwas altmodischen Zugang, dafür aber sehr konkret und insbesondere für Lehramtsstudierende als Ergänzung zur Vorlesung sehr zu empfehlen: [C] R. Courant, Vorlesungen über Differential- und Integralrechnung Bd. 1, Springer 1971 3. Ausländische Klassiker“, teils im Stoff deutlich weitergehend: ” [R] W. Rudin, Analysis, Oldenbourg Verlag München, 2009 (Der Baby-Rudin“) ” [L] S. Lang, Real and Functional Analysis, Springer Graduate Texts in Math., 1993 [D] J. Dieudonné, Foundations of modern analysis, Academic Press 1960 [HS] E. Hewitt, K. Stromberg, Real and Abstract Analysis, Springer 1969 4. Ein kürzlich ins Deutsche übersetztes typisches amerikanisches text” book“, welches sehr ausführlich und umfangreich an den Lehrstoff heranführt, mit sehr vielen Beispielen und Übungsaufgaben: G.B. Thomas, M.D. Weir, J. Hass, Analysis 1, Pearson Higher Education, München 2013. 5 Kapitel 0 Übergang von der Schulmathematik zur Mathematik als wissenschaftlichem Fach: Exemplarisch am Beispiel der Analysis 0.1 Relle Zahlen Die Grundlage der Analysis bilden die Reellen Zahlen: R. In der Schule werden diese i.d.R. auf zwei Arten veranschaulicht: a) Als Punkte auf einer gedachten Zahlengeraden“ ” R -3 -2 -1 0 1 √ 2 2 e 3 Abbildung 1: Die reelle Zahlengerade Dahinter verbirgt sich die Vorstellung der Euklidischen Geometrie, in der sich Zahlen als Längen von Geradensegmenten in der Ebene ergeben: √ Beispiel: Nach Pythagoras ist 2 die Länge der Hypothenuse in einem rechtwinkligen gleichschenkligen Dreieck mit Kathetenlänge 1. Problem: Was genau ist denn eine Zahlengerade,“ oder die Ebene,“ in der ” ” solch ein Dreieck liegt? Physikalisch lässt sich dies nicht begründen, denn in jedem endlichen Raumbereich gibt es nur endlich viele Atome (z.B. in einem Kreidestrich). Dagegen sollen ja wohl selbst in Intervallen endlicher Länge der Zahlengeraden unendlich viele Zahlen liegen, falls das Intervall positive Länge hat. 6 π/2 1 1 √ 2 Problem des Unendlichen! Wieviele Arten von Unendlich gibt es? Diese Frage führt rasch hinein in die Tiefen der Mathematischen Logik, der Philosophie, etc.. b) Durch die Dezimalbruchentwicklung reeller Zahlen. Mit Hilfe des Intervallschachtelungsprinzips wird in der Schule gezeigt,“ dass ” man jede reelle Zahl in einen in der Regel unendlichen Dezimalbruch entwickeln kann. Beispiel: √ 2 = 1, 414213562373095... Aber: Was heißt das genau? Die obige Entwicklung ist letztlich eine Kurzschreibweise für die unendliche Reihe √ 2 = 1 · 100 + 4 · 10−1 + 1 · 10−2 + 4 · 10−3 + 2 · 10−4 + 1 · 10−5 + 3 · 10−6 + · · · , d.h. für den Grenzwert der Folge der Partialsummen welche man erhält, wenn man die obige Reihenentwicklung jeweils nach endlich vielen Schritten abbricht, d.h. der Folge a0 = 1 · 100 = 1, a1 = 1 · 100 + 4 · 10−1 = 1, 4, a2 = 1 · 100 + 4 · 10−1 + 1 · 10−2 = 1, 41 , .. . Fragen: Hier wird unterstellt, dass die Folge a0 , a1 , a2 , a3 , a4 , a5 , · · · (rationaler Zahlen) einem Grenzwert zustrebt! Was heißt dies denn genau? Und worin liegt denn dieser Grenzwert? Fazit: Eigentlich ist ziemlich unklar, was R ist! Offenbar ist der Begriff der reellen Zahl aufs Engste mit dem Begriff des Grenzwertes verknüpft, welcher in der Schule meist nur noch vage beschrieben wird. All diese Fragen haben historisch in der Entwicklung der Mathematik zu diversen Grundlagenkrisen geführt: 18. u. frühes 19. Jahrhundert: Der Begriff der infinitesimalen“ Größe/ Grenz” wertbegriff. 7 Beginn 20. Jahrhundert: Der Mengenbegriff, Eigenschaften von R (z.B. Kontinuumshypothese). Diese Krisen haben dazu geführt, dass man in der modernen Mathematik formal logisch nach strengen Regeln argumentiert, ausgehend von gewissen Grundannahmen (Axiomen). Studienanfänger müssen all dies erst erlernen, sowie sich einem hohem Abstraktionsniveau stellen! 0.2 Zur naiven“ ” Schulmathematik Differentialrechnung der Betrachte eine Funktion f : D −→ R, wobei D ⊂ R eine geeignete“ Teilmen” ge von R sei (z.B. ein offenes Intervall ]a, b[, mit a < b). Frage: Was genau ist eine Funktion? Ist x ∈ D ein Punkt in D, so heiße f im Punkt x differenzierbar, wenn der Grenzwert f ′ (x) = lim h→0 h6=0 f (x + h) − f (x) h in R existiert. Beachte: Damit für genügend kleines“ h 6= 0 der Ausdruck f (x + h) Sinn ” macht, muss f auf einer Umgebung“(ein topologischer Begriff) definiert sein. ” Achtung: Wieder spielt der Begriff des Grenzwerts eine zentrale Rolle! Beispiele: a) f (x) = x, D = R: Hier ist f (x + h) − f (x) x+h−x = =1 h h für alle h 6= 0. Also folgt: die Ableitung f ′ (x) existiert für jedes x ∈ R, und es ist f ′ (x) = 1. b) f (x) = x2 , D = R : Hier sieht man mittels der binomischen Formel, dass f (x + h) − f (x) (x + h)2 − x2 x2 + 2xh + h2 − x2 = = = 2x + h. h h h Und, für h → 0 strebt 2x + h gegen 2x (Beweis?). Hinter diesem etwas vagen Argument verbirgt sich schon der Begriff der Stetigkeit einer Funktion, wie 8 auch die Gültigkeit gewisser Grenzwertsätze über stetige Funktionen, welche wir später beweisen werden. Folge: f (x+h)−f (x) h → 2x für h → 0, d.h. f ′ (x) = 2x. Der Begriff der Ableitung besitzt folgende wohlbekannte Geometrische Interpretation: Seien ∆y := f (x + h) − f (x) und ∆x := x + h − x = h. Dann ist anschaulich ∆y f (x + h) − f (x) = ∆x h die Steigung der Sekante durch die Punkte (x, f (x)) und (x + h, f (x + h)) des Graphen von f. Anschauliche Vorstellung: für ∆x = h → 0 strebt“ die Steigung ∆y/∆x ” df (x) der Tangente an den Graphen der Sekante gegen die Steigung f ′ (x) = dx von f im Punkt (x, f (x)): ∆y dy df (x) = (x) = = f ′ (x). ∆x→0 ∆x dx dx lim Physiker interpretieren dx und dy oft als infinitesimale Größen“ oder ” Differentiale“ . Streng genommen macht dies allerdings keinen Sinn! Ei” ne mathematisch solide Definition von Differentialen ist erst von Elie Cartan (1869-1951) gegeben worden! Je komplizierter eine Funktion wird, desto schwieriger wird es im allgemeinen, ihre Ableitung zu bestimmen (falls diese überhaupt existiert). Bereits für allgemeine Monome f (x) = xn , mit n ∈ N = {0, 1, 2, 3, ...}, ist es nicht mehr ganz so einfach, oder auch allgemeinere Polynome f (x) = a0 + a1 + a2 x2 + ... + an xn , √ 6 wie z.B. f (x) = −6x5 + 11x1001 − 3 x10 . mit a0 , a1 , ..., an ∈ R, Hier helfen die grundlegenden Rechenregeln für das Differenzieren: Satz 0.1 Es seien f und g im Punkte x ∈ R differenzierbare Funktionen, sowie α,β ∈ R. Dann sind auch die Funktionen αf + βg, f g und f /g (falls g(x) 6= 0) differenzierbar in x, und es gilt: (i) (αf +βg)′(x) = αf ′ (x)+βg ′(x) ( Linearität der Ableitung; s.Lin.Alg.), (ii) (f g)′(x) = f ′ (x)g(x) + f (x)g ′ (x) (Produktregel), (iii) ( fg )′ (x) = f ′ (x)g(x)−f (x)g ′ (x) g(x)2 (Quotientenregel). 9 Ein solcher mathematischer Satz bedarf eines sauberen Beweises! Dazu müssten allerdings alle verwendeten Begriffe sauber definiert sein- dies leistet die Schulmathematik im allgemeinen jedoch nicht mehr! Z.B. bedarf es einer sauberen Definition des Grenzwertbegriffs - dies soll im Laufe der Vorlesung bereitgestellt werden! Eine mögliche Begründung von Satz 0.1, wie sie vielleicht in der Schule geliefert wurde, sieht folgendermaßen aus: Schulbeweis“ von Satz 0.1: ” Zu (i): Es gilt (αf + βg)(x + h) − (αf + βg)(x) h αf (x + h) + βg(x + h) − (αf (x) + βg(x) = h g(x + h) − g(x) f (x + h) − f (x) +β . =α h h Dieser Ausdruck strebt“ für h → 0 gegen αf ′ (x) + βg ′ (x). Also ist ” (αf + βg)′(x) = αf ′(x) + βg ′(x). Zu (ii): Es gilt f (x + h)g(x + h) − f (x)g(x) (f g)(x + h) − (f g)(x) = h h (f (x + h) − f (x))g(x + h) + f (x)(g(x + h) − g(x)) = h g(x + h) − g(x) f (x + h) − f (x) g(x + h) + f (x) . = h h Dieser letzte Ausdruck sollte anschaulich“ für h → 0 gegen ” ′ f (x)g(x) + f (x)g ′(x) streben. Eine genaue Begründung der letzten Aussage ist jedoch gar nicht so einfach: sie erfordert die Stetigkeit von g in Punkt x (d.h. lim g(x + h) = g(x)), sowie gewisse Rechenregeln für Grenzwerte! Zu (iii): Übung! Q.E.D. Beispiel c): Für n ∈ N sei fn (x) := xn , x ∈ R. Dann gilt (1) h→0 dxn dfn (x) = = nxn−1 . dx dx 10 Beweis. Für n = 0, 1, 2 ist dies einfach (s. Beispiele a) und b)). Angenommen, wir haben (1) für irgendein n bewiesen. Wir zeigen dann, dass es auch für n + 1 gilt (stellen Sie sich z.B. n = 2, n + 1 = 3 vor, etc.). Wir zerlegen dazu fn+1 als Product fn+1 (x) = xn+1 = x · xn = f1 (x) · fn (x). Mit der Produktregel folgt daher: fn+1 ist differenzierbar, da ja f1 und fn dies sind, und es folgt: ′ fn+1 (x) = = = = = f1′ (x)fn (x) + f1 (x)fn′ (x) 1 · xn + x · n · xn−1 1 · xn + n · x · xn−1 (Kommutativität von R !) 1 · xn + n · xn (n + 1) · xn (Distributivität von R !). Mit Hilfe des Prinzips der vollständigen Induktion (einer fundamentalen Eigenschaft der Menge N der natürlichen Zahlen!) folgert man daraus, dass (1) für jede natürliche Zahl n ∈ N gilt: Die Formel (1) gilt für n = 0, 1, 2, d.h. für 1, x, x2 , folglich auch für x3 , folglich auch für x4 , folglich auch für x5 , dann auch für x6 , .... Somit sollte sie auch für alle n gelten; beweisen lässt sich dieses Prinzip jedoch nicht, denn niemand von uns lebt lang genug, um dieses Verfahren bis in alle Ewigkeit fortzusetzen. Q.E.D. Weitere klassische Funktionen: Die Exponentialfunktion exp : R → R, exp(x) = ex , e = Eulersche Zahl, exp besitzt die Ableitung exp′ (x) = d dx (x) = exp(x), kurz: dex dx = ex (später werden wir eine saubere Definition der Exponentialfunktion geben und dann diese Formel auch beweisen. Ähnliches gilt für die nachfolgenden Funktionen). Die Trigonometrischen Funktionen: Diese werden in der Schule bekanntlich geometrisch definiert anhand von Seitenverhältnissen rechtwinkliger Dreiecke. Insbesondere gilt nach Pythagoras die Formel sin2 α + cos2 α = 1 11 für alle α ∈ R Ferner sei an die Additionstheoreme für die trigonometrischen Funktionen erinnert, wie z.B. das für den Sinus: sin(α + β) = sin α cos β + cos α sin β Wählt man α = x und β = π/2, so liefert dieses wegen sin(π/2) = 1 und cos(π/2) = 0 insbesondere folgenden wohlbekannten Zusammenhang zwischen dem Sinus und dem Cosinus: cos x = sin(x + π ). 2 Für die Ableitungen dieser Funktionen gelten folgende Formeln: d sin x dx = cos x, d cos x dx = − sin x Der Tangens sowie der Cotangens sind definiert durch: x 6∈ { π2 + kπ : k ∈ Z}, x 6∈ {kπ : k ∈ Z}. sin x , tan x := cos x cos x cot x := sin x , Für die Ableitung des Tangens ergibt sich aus der Quotientenregel sin′ x cos x − sin x cos′ x d tan x = dx cos2 x cos x cos x − sin x(− sin x) = cos2 x 2 cos x + sin2 x = , cos2 x d.h. es gilt d tan x dx = 1 cos2 x Analog zeigt man: d cot x dx = − sin12 x Hyperbelfunktionen: Der hyperbolischer Cosinus und der hyperbolische Sinus sind definiert durch cosh x := ex + e−x , 2 12 sinh x := ex − e−x , 2 und der hyperbolischer Tangens sowie der hyperbolische Cotangens durch tanh x := sinh x , cosh x coth x = cosh x , sinh x wobei der hyperbolische Cotangens offenbar nur für x 6= 0 definiert ist, da bei 0 der hyperbolische Sinus eine (und auch die einzige) Nullstelle hat. Für die Ableitungen von sinh und cosh erhält man mit Hilfe unserer Rechenregeln ganz leicht folgende Formeln: d cosh x dx = sinh x, d sinh x dx = cosh x Zur Übung bestimme man die Ableitung von coth x und tanh x. Die Umkehrfunktion der Exponentialfunktion: der natürliche Logarithmus: Die Exponentialfunktion exp : R → R+ bildet R bijektiv“ (d.h. umkehrbar) auf die positive Halbachse ]0, ∞[=: R+ ” ab (dies werden wir später beweisen!). Die Umkehrfunktion der Exponentialfunktion, d.h. der natürliche Logarithmus log : R+ → R, bildet daher R+ bijektiv auf ganz R ab: Falls y = ex ist, so ist y > 0 und x = log y , und umgekehrt! Achtung: Aus gutem Grund werde ich den natürlichen Logarithmus, der oft auch mit x = ln y bezeichnet wird, mit log bezeichnen (log x steht ärgerlicherweise in der Schule manchmal für den Logarithmus von x zu Basis 10, was eher nicht natürlich ist – die Wahl der Basis 10 hat wohl eher etwas damit zu tun, dass wir zufällig 10 Finger haben). Der Logarithmus zu Basis 10 wird bei mir mit log10 bezeichnet. Um zusammengesetzte Funktionen abzuleiten, insbesondere Umkehrfunktionen, benötigt man noch die Kettenregel. Diese werde ich an dieser Stelle nur eher so formulieren, wie man es vielleicht in der Schule gesehen hat, also etwas unsauber – im Verlauf der Vorlesung wird auch dies präzisiert werden: Satz 0.2 (Kettenregel) Wenn u 7→ f (u) an der Stelle u = g(x) und x 7→ g(x) an der Stelle x differenzierbar ist, so ist auch die zusammengesetzte“ ” oder verkettete“ Funktion (f ◦ g)(x) := f (g(x)) differenzierbar an der Stelle ” x, und es gilt (f ◦ g)′(x) = f ′ (g(x)) g ′ (x). 13 In der ” gilt also für y = f (x) und u = g(x): Leibniz-Schreibweise“ dy du dy = · , dx du dx wobei dy du bei u = g(x) bestimmt wird. (Gottfried Wilhelm Leibniz (1646 - 1716) war neben Isaac Newton (1642 - 1726) einer der Hauptbegründer der Differentialrechnung, wobei zuvor bereits René Descartes (1596 - 1650) sowie Bonaventura Cavalieri (1598 - 1647) als wichtige Wegbereiter für diesen Infinitesimalkalkül“ fungierten). ” Schulbeweis“ der Kettenregel: Sei ” ∆u := g(x + ∆x) − g(x) = g(x + ∆x) − u die Veränderung von u, wenn sich x um ∆x verändert. Dann ändert sich y = f ◦ g(x) um ∆y = f (g(x + ∆x))) − f (g(x)) = f (u + ∆u) − f (u). Für ∆u 6= 0 können wir den Bruch f ◦ g(x + ∆x) − f ◦ g(x) ∆y = ∆x ∆x also schreiben als ∆y ∆u ∆y = · , ∆x ∆u ∆x (2) und dann den Grenzübergang für ∆x → 0 durchführen: dy = dx ∆y ∆y ∆u = lim · ∆x→0 ∆x ∆x→0 ∆u ∆x lim = ∆y ∆u · lim ∆x→0 ∆u ∆x→0 ∆x = ∆y ∆u · lim ∆u→0 ∆u ∆x→0 ∆x = dy du · . du dx lim lim (Grenzwertsätze !) (es gilt ∆u → 0 für ∆x → 0, da g stetig !) Achtung: Dieses Argument hat einen Haken: Auch für ∆x 6= 0 kann ∆u = 0 sein, so dass die Erweiterung mit ∆u in Gleichung (2) nicht mehr möglich ist! 14 Wir werden später einen sauberen Beweis liefern, welcher eine völlig andere Charakterisierung des Begriffs der Ableitung mittels Linearisierung benutzt. Beispiel: Ableitung des natürlichen Logarithmus log: Da log die Umkehrfunktion von exp ist, gilt (3) elog y = exp(log y) = y log(ex ) = log(exp x) = x für alle y > 0, für alle x ∈ R. Insbesondere gilt also exp ◦ log y = y für alle y > 0, d.h. exp ◦ log ist die identische Abbildung y 7→ y. Mit der Kettenregel folgt daher mit x = log y d exp d log dy = (log y) · (y) dy dx dy d log (y) = exp(log y) · dy d log = y· (y). dy 1 = Hieraus folgt sofort d log (y) dy = y1 , also log′ (y) = y1 , y>0 Bemerkungen zur Einführung des natürlichen Logarithmus und der Exponentialfunktion in der Schule: In der Schule geht man besser anders vor und führt am besten zunächst den natürlichen Logarithmus ein durch das Integral Z y 1 dt, y > 0. ln y := 1 t Dann zeigt man, dass ln : R+ → R eine umkehrbar eindeutige (d.h. bijektive) Funktion ist, und definiert dann exp : R → R+ als deren Umkehrfunktion. Der Hauptsatz der Differential- und Integralrechnung zeigt dann, dass ln′ (y) = 1/y ist, und ähnlich wie zuvor (nur unter Vertauschung der Rollen von exp und ln) folgert man mittels Kettenregel, dass dann exp′ (x) = exp(x) ist. Man erhält mit diesem Zugang zugleich einen kurzen Beweis der folgenden fundamentalen Identitäten: (4) (5) ln(ab) = ln(a) + ln(b) für alle a, b > 0. ex+z = ex · ez für alle x, z ∈ R. 15 In der Tat folgt (4) aus den Regeln für das Rechnen mit Integralen: Z ln(ab) = ab 1 Z 1 dt = t a 1 1 dt + t Z ab a 1 dt, t wobei die Substitution t = as im zweiten Integral zeigt, dass Z a ab 1 dt = t Z 1 b 1 ds = ln b s ist. (5) ergibt sich dann sofort aus (4): setze dazu a := ex , b := ey . Nach (4) gilt dann also ln(ex · ey ) = ln(ex ) + ln(ey ) = x + y, woraus durch Anwendung von exp auf beiden Seiten dieser Identität (5) folgt. In der Fachmathematik geht man jedoch anders vor: aus exp′ = exp folgt (per Induktion!), dass auch für jede höhere Ableitung der Ordnung k gilt exp(k) = exp . Die sogenannte Taylorreihe von exp (all dies wird später behandelt werden) sieht dann folgendermaßen aus: exp(x) = 1 + x x2 x3 x4 + + + +··· . 1! 2! 3! 4! In der Tat werden wir die Exponentialfunktion später durch diese unendliche Reihe definieren! Dieser Zugang wird den Vorteil haben, dass wir dies auch gleich für komplexe Zahlen x ∈ C werden tun können, was, wie wir sehen werden, große Vorteile mit sich bringt. Für die Schulmathematik ist dieser Zugang, der allerdings tiefere Erkenntnisse mit sich bringt, jedoch ungeeignet! Allgemeine Exponentialfunktionen/Potenzen: Für allgemeines a > 0 setzt man ax := ex log a = exp(x log a), x∈R Nach der Kettenregel gilt dafür dax d = exp′ (x log a) · (x log a) dx dx = exp(x log a) · log a = ax log a, d.h. es gilt 16 dax dx = log a · ax , a > 0, x ∈ R Vertauscht man die Rollen von a und x, so erhält man die allgemeine Potenzfunktion xα := eα log x , (x > 0, α ∈ R). Hierfür folgt mit der Kettenregel: d dxα = (exp ◦(α log))(x) dx dx d = exp′ (α log x) · (α log)(x) dx 1 = exp(α log x) · (α · ) x α α = x · , x d.h. d (xα ) dx = α xα−1 , x > 0, α ∈ R Für α = −1 ergibt sich insbesondere d −1 1 d 1 ( )= (x ) = −x−2 = − 2 , dx x dx x x > 0. Übung: Zeige, dass diese Formel allgemein für x 6= 0 gültig ist (Hinweis: Produktregel !), und leite damit sowie der Kettenregel die Quotientenregel für die Ableitung von f /g her (zunächst für f = 1). Einige Beispiele: (a) Sei y(t) = (t tan t)10 . Der natürliche Definitionsbereich von y ist der von tan, d.h. die Menge D = R \ { π2 + kπ : k ∈ Z}. Mit f (u) := u10 und u = g(t) = t tan t gilt dann y(t) = f (g(t)) = f ◦ g(t). Ferner ist nach der Produktregel 1 cos2 t sin t · cos t t = + 2 cos t cos2 t t + sin t cos t . = cos2 t g ′ (t) = 1 · tan t + t · 17 Da f ′ (u) = 10u9 ist, folgt zusammen mit der Kettenregel also y ′(t) = f ′ (g(t))g ′(t) t + sin t cos t = 10 g(t)9 cos2 t t + sin t cos t = 10(t tan t)9 . cos2 t (b) Sei f (x) = xx für x > 0. Hier ist der Definitionsbereich also die Menge D = R+ . Achtung: Es gilt nicht f ′ (x) = x xx−1 ! Sondern: Per definitionem ist xx = ex log x , d.h. es ist f (x) = exp(x log x). Setzen wir g(x) := x log x, so it also f = exp ◦g, so dass nach der Kettenregel f ′ (x) = exp′ (g(x)g ′(x) = exp(g(x))g ′(x) = f (x) g ′ (x) 1 = xx · (1 · log x + x · ) (Produktregel) x x = (1 + log x) x . Somit ist also dxx = (1 + log x) xx , dx 18 x > 0. Kapitel 1 Einleitung Die reellen Zahlen bilden das Fundament der klassischen Analysis. In der Schule werden in der Regel gewisse Vorstellungen von den Begriffen natürliche Zahl“, ” ganze Zahl“, rationale Zahl“, reelle Zahl“ und vielleicht auch schon komplexe ” ” ” ” Zahl“ vermittelt. Unter einer reellen Zahl stellt man sich dann meist einen Punkt auf einer gedachten Zahlengeraden vor, d.h. einer unendlichen Geraden, auf der man einen beliebigen Punkt als den Nullpunkt festgelegt hat, und einen anderen als den Punkt 1. Die Strecke zwischen diesen beiden Punkten dient dann als Maßstab, um zunächst jeder positiven oder negativen rationalen Zahl eine bestimmte Stelle auf der Zahlengeraden zuzuordnen. Dass man damit nicht alle Punkte auf der Zahlengeraden erhält, wussten schon die alten Griechen“, aber selbst der mathematische Gigant ” Pythagoras konnte sich mit der Existenz irrationaler Zahlen nicht abfinden (der Legende nach ging dies soweit, dass er seinen√Schüler Hippasus töten ließ, als dieser ihm einen Beweis für die Irrationalität von 2 präsentierte, mit der Begründung, er habe damit gegen die Grundregeln des Bundes der sogenannten Pythagoräer“ ” verstoßen). Betrachtet man nämlich beispielsweise ein rechtwinkliges gleichschenkliges Dreieck, dessen Katheten die Länge 1 haben, und bezeichnen wir mit r die Länge der Hypotenuse, so gilt nach Pythagoras r 2 = 12 + 12 = 2. r sollte natürlich einer reellen Zahl entsprechen, nämlich dem Punkt auf der Zahlengeraden, dessen Abstand zum Punkt Null (in positiver Richtung) gleich der Länge der Hypotenuse des gegebenen Dreiecks ist. Zweihundert Jahre nach Pythagoras argumentierte Euklid nun wie folgt: Wäre r rational, d.h. von der Form r = pq mit ganzzahligen, von Null verschiedenen p und q, so folgte p2 = 2q 2 . Dabei können wir annehmen, dass p und q keinen gemeinsamen Teiler haben, weil wir durch solch einen von vornherein hätten kürzen können. Da p2 aufgrund der obigen Gleichung gerade sein muss, so muss auch p gerade sein, d.h. von der Form p = 2m mit ganzzahligem m. Hieraus folgt 2q 2 = p2 = 4m2 , d.h. q 2 = 2m2 , und mit demselben Argument wie oben schließt man, dass auch q gerade sein muss. Somit besäßen also p und q den gemeinsamen Teiler 2, entgegen unserer Annahme, dass beide teilerfremd seien. Unsere Annahme, dass r rational sei, hat somit zu 19 einem Widerspruch geführt, und ist damit falsch. Die eben durchgeführte - für das Wesen eines√indirekten Beweises charakteristische - Schlussweise lehrt, dass dem Zeichen 2 keine rationale Zahl entsprechen kann. Nun möchte man man mit reellen Zahlen natürlich auch rechnen, womit sich die alten Griechen aufgrund ihrer rein geometrischen Vorstellungen von Zahlen als Punkten auf der Zahlengeraden jedoch schwertaten. Um mit reellen Zahlen zu rechnen, ordnen wir heutzutage daher in der Regel einem gegebenen Punkt auf der Zahlengeraden eine endliche oder auch unendliche Dezimalzahl zu, wie beispielsweise 987, 654321, −5, 78787878 . . . , 3, 41421 . . . . Für Punkte im Intervall zwischen 0 und 1 geschieht dies beispielsweise, indem wir das Intervall zunächst in 10 gleichlange Teilintervalle einteilen, welche wir der Reihe nach durch die Ziffern 0,1,2,. . . ,9 kennzeichnen. Liegt der gegebene Punkt r nun beispielsweise im Intervall mit der Ziffer a1 (Achtung: dieses Intervall muss nicht eindeutig sein!), so unterteilen wir in einem zweiten Schritt dieses Intervall wieder in 10 gleichlange Teilintervalle, welche wieder durch die Ziffern 0,1,2,. . . ,9 gekennzeichnet werden. Es sei dann a2 die Ziffer desjenigen Intervalles, welches den Punkt r enthält. Teilt man nun wiederum dieses Teilintervall in 10 Teilintervalle ein, und fährt mit diesem Verfahren fort, so erhält man eine unendliche Folge von Ziffern a1 , a2 , a3 , . . . zwischen 0 und 9. Dem Punkt r wird dann die unendliche Dezimalzahl 0, a1 a2 a3 . . . zugeordnet. Diese unendliche Dezimalzahl wird dann wie folgt interpretiert: Bricht man die unendliche Dezimalzahl an der n-ten Stelle ab, d.h. betrachtet man die rationale Zahl rn = 0, a1 a2 . . . an , so beträgt der Abstand zwischen r und rn höchstens 101n . Wir rechnen“ dann mit reellen Zahlen wie folgt: ” Sind beispielsweise r = 0, a1 a2 a3 . . . und s = 0, b1 b2 b3 zwei reelle Zahlen, und rn = 0, a1 . . . , an , sn = 0, b1 . . . , bn die approximierenden Folgen rationaler Zahlen, so multiplizieren wir beispielsweise r und s, indem wir zunächst die Produkte rn sn betrachten und anschließend den Grenzwert“ von rn sn bestimmen, wenn n gegen ” Unendlich“ strebt. Diesen bezeichnen wir als das Produkt rs. ” Leider mussten wir bei diesem Verfahren Begriffe benutzen, wie z.B. den des Grenz” wertes“, aber auch den des Unendlichen“, die noch gar nicht klar definiert sind, ” sondern von denen wir nur gewisse intuitive Vorstellungen besitzen (gleiches gilt für den Begriff unendliche Gerade“). Ferner wissen wir, dass gewisse reelle Zahlen zwei ” verschiedene unendliche Dezimalzahldarstellungen besitzen, wie beispielsweise der Punkt 1 die Darstellungen 1,000... und 0,9999... hat – wie erklärt sich dies? Schließlich haben wir bei der Wahl des Dezimalsystems Willkür walten lassen – wir hätten ebensogut das Dualsystem, das Hexadezimalsystem oder jedes andere b-adische System benutzen können. Dies würde zu anderen Approximationen der reellen Zahlen r und s durch rationale Zahlenfolgen (rn′ ) und (s′n ) führen. Können wir dann sicher 20 sein, dass die Produkte von r und s, welche wir in diesen Zahlensystemen berechnen, stets dieselbe reelle Zahl ergeben? Historisch betrachtet haben Mathematiker noch bis Mitte des 19. Jahrhunderts mit solch vagen Begriffen von reellen Zahlen hantiert, bevor durch R. Dedekind und G. Cantor ein systematischer Aufbau einer allgemeinen Theorie der reellen Zahlen erfolgte. Da ein solcher systematischer Aufbau des Zahlensystems jedoch ein gewisses Maß an Abstraktion voraussetzt und zudem recht zeitaufwendig ist, werden wir in der Vorlesung die reellen Zahlen dadurch beschreiben, dass wir ein Axiomensystem für die Menge R der reellen Zahlen mit den Operationen + und · sowie die Anordnung ≤ angeben, also ein System von Sätzen, welche wir immer voraussetzen werden und aus denen alles Weitere mit den Regeln der Logik gefolgert wird. Es bleibt dann natürlich die Frage, ob es irgendwo in der Welt oder außerhalb derselben etwas gibt oder etwas konstruierbar ist, welches alle diese vorausgesetzten Axiome erfüllt, d.h. ob es R überhaupt gibt. Ausgehend von der Existenz der Menge der natürlichen Zahlen N (welche wiederum auf die sogenannten Peano-Axiome zurückgeführt werden kann), werden wir in Anhang A andeuten, wie man tatsächlich mittels N die Menge der ganzen Zahlen Z, anschließend die der rationalen Zahlen Q und schließlich die der reellen Zahlen R konstruieren kann. Bevor wir uns den Fragen der reellen Analysis zuwenden können, werden wir zunächst eine Reihe von für die moderne Mathematik grundlegenden Begriffen behandeln. 21 Kapitel 2 Einige Grundbegriffe 2.1 Aussagen Unter einer Aussage versteht man jeden Satz, von dem man sinvollerweise behaupten kann, dass er entweder wahr oder falsch ist. Eine andere Möglichkeit gibt es nicht, und eine Aussage kann nicht gleichzeitig wahr und falsch sein. Beispiele. • Die Aussage 4 ist größer als 3“ ist wahr. ” • Die Aussage Es gibt eine größte natürliche Zahl“ ist falsch. ” • Aber der Satz Dieser Satz ist falsch“ ” ist keine Aussage: Wäre er eine Aussage, und wäre sie wahr, so wäre der Satz falsch, was sich widerspricht, und wäre sie falsch, so träfe der Sachverhalt nicht zu, also wäre der Satz wahr, und nicht falsch. Ist A eine Aussage, so erhält man durch Negation, d.h. die Verneinung”, die ” neue Aussage ¬A (in Worten: nicht A“). Hierbei ist ¬A wahr dann und nur dann, ” wenn A falsch ist, und ¬A ist falsch genau dann, wenn A wahr ist. Beispiele. • Ist A1 die Aussage es regnet“, so ist ¬A1 die Aussage es regnet nicht“. ” ” • Die Negation der Aussage A2 Alle Menschen sind blond“ ist die Aussage ¬A2 ” Es gibt mindestens einen Menschen, der nicht blond ist“, ” (und nicht etwa Kein Mensch ist blond“!). ” Achtung: Anstelle der Aussage ¬A2 sagt man in der Mathematik oft kürzer Es ” gibt einen Menschen, der nicht blond ist“. Damit ist aber nicht gemeint, dass es genau einen Menschen gibt, der nicht blond ist, sondern wenigstens einen, 22 eventuell auch mehrere. Allgemein gilt das Prinzip der doppelten Verneinung”: ” (2.1) Die Aussage ¬¬A := ¬(¬A) ist gleichbedeutend zur Aussage A. Das Symbol :=“ steht dabei in der Mathematik für ist definitionsgemäß gleich“. ” ” Sprachlich gefaßt: Ist es falsch, dass die Aussage A falsch ist, so ist die Aussage ” A wahr, und umgekehrt, d.h. die Aussagen ¬¬A und A sind gleichbedeutend (oder äquivalent”.) ” 2.2 Mengen Die Gegenstände, Begriffe und Objekte, mit denen in der Mathematik hantiert werden, existieren im Denken. Sie können unmittelbare Entsprechungen im Alltagsbereich haben, aber auch sehr weit von sinnlichen Erfahrungen entfernt sein. Über das Verhältnis von Mathematik und Realität lässt sich viel sagen und kontrovers diskutieren – das wollen wir hier nicht tun. Mathematische Objekte, wie immer man sie auch interpretieren will, werden seit geraumer Zeit in der Sprache der Mengenlehre formuliert. Wir wollen gemäß der naiven Mengenlehre“ den Vorstellungen Georg Cantors folgen, welcher um 1895 ” folgenden Begriff vorschlug: Unter einer Menge verstehen wir jede Zusammenfassung M von bestimmten wohlunterschiedenen Objekten m unserer Anschauung oder unseres Denkens (welche die Elemente von M genannt werden) zu einem Ganzen. Ist m Element von M, so schreiben wir m∈M ( m ist Element von M“). ” Liegt ein Objekt x nicht in M, so schreiben wir x∈ /M ( x ist kein Element von M“). ” Eine Menge lässt sich z.B. dadurch angeben, dass man ihre Elemente einzeln aufschreibt, wie z.B. {1, 3, 5, 7} . Es kann aber sein, dass man dies nicht will oder kann (z.B. weil die Menge unendlich viele Elemente hat), wie etwa bei (2.2) N = {0, 1, 2, 3, 4, . . .} 23 oder (2.3) Z = {0, 1, −1, 2, −2, 3, −3, . . .} Mit den Pünktchen unterstellt man, dass es klar ist, wie es weitergeht“. Eine an” dere Möglichkeit, neue Mengen zu erhalten, ist die Bildung von Teilmengen bereits bekannter Mengen. Eine Menge N heißt Teilmenge einer Menge M, geschrieben, N ⊂M, wenn jedes Element von N auch ein Element von M ist. Man kann Teilmengen dadurch angeben, dass man eine definierende Eigenschaft“ ihrer Elemente vorgibt. ” Beispiel. G := {n ∈ N : es gibt ein m ∈ N mit n = 2m} definiert die Menge der geraden Zahlen als Teilmenge von N. Eine solche Beschreibung hat die Form N := {x ∈ M : A(x) ist wahr} , wobei A(x) eine Aussage über die Variable x ist. Zwei Mengen A und B heißen gleich, geschrieben A = B, wenn sowohl A ⊂ B als auch B ⊂ A gelten, d.h. wenn sie dieselben Elemente enthalten. Sind A und B nicht gleich, so schreibt man A 6= B. Beispiel. {1, 3, 5, 7} = {1, 5, 7, 3} = {1, 3, 5, 1, 5, 7} Bei einer so expliziten Auflistung wird man normalerweise kein Element doppelt angeben. Bei der Beschreibung der Menge Q der rationalen Zahlen durch (2.4) Q := p : p, q ∈ Z, q 6= 0 q tauchen aber alle rationalen Zahlen mehrfach (und zwar unendlich oft) auf; es wäre sehr unzweckmäßig, würde man nur solche Beschreibungen von Mengen zulassen, in denen jedes Element genau einmal auftritt. Das Symbol ∅ bezeichnet die leere Menge. Es gibt also keine Elemente x ∈ ∅, und jede Aussage über die Elemente von ∅ ist trivialerweise richtig. Beispielsweise ist {x ∈ R : x > 0 und x < 0} = ∅. Für gewisse Standardmengen haben sich Standardbezeichnungen eingebürgert, nämlich N für die Menge der natürlichen Zahlen, Z für die Menge der ganzen Zahlen, Q für die Menge der rationalen Zahlen, R für die Menge der reellen Zahlen und C für die Menge der komplexen Zahlen. 24 Achtung: In der Analysis wird oftmals auch die 0 als natürliche Zahl betrachtet, und dieser Konvention werde ich hier folgen, d.h. 0 ∈ N. Dies wird in der Mathematik nicht einheitlich so gehandhabt; häufig findet man auch die Notationen N = {1, 2, 3, . . . } und N0 = {0, 1, 2, 3, . . . }. Da sicherlich eine gewisse Vertrautheit mit diesen Zahlensystemen (von denen später noch ausführlich die Rede sein wird) vorausgesetzt werden kann, dürften die folgenden Beispiele verständlich sein: √ √ {x ∈ R : x4 − 2x2 = 0} = {0, − 2, 2}, {x ∈ Q : x4 − 2x2 = 0} = {0}, {z ∈ C : z = z und z 2 = −4} = ∅. Dass der Cantorsche Mengenbegriff nicht unproblematisch ist, zeigt das folgende Beispiel: Wir betrachten die Bedingung für Mengen, sich nicht selbst zu enthalten: M 6∈ M. Dies trifft z.B. auf die Menge {2, 3} zu, und allgemein auf die Mengen, die man in der Mathematik üblicherweise trifft. Es ist dagegen nicht einfach, eine Menge A anzugeben, welche sich selbst als Element enthält, aber hier ist ein solche: A sei die Menge aller Mengen, welche sich durch weniger als zwanzig Wörter beschreiben lassen. Offenbar ist dann A ein Element von A. Im Sinne Cantors kann die Menge X := {M : M ist eine Menge und M 6∈ M} gebildet werden, d.h. die Menge aller Mengen, die sich nicht selbst als Element enthalten. M ∈ X gilt also genau dann, wenn M 6∈ M. Wir fragen nun, ob X ∈ X oder X 6∈ X. Die Annahme X ∈ X ist gleichbedeutend mit X 6∈ X, also nicht zulässig. Die Annahme X 6∈ X ist gleichbedeutend mit X ∈ X, also ebenfalls unzulässig. Dies ist die Russelsche Antinomie. Veranschaulicht wird sie durch die paradoxe Geschichte des Dorfbarbiers, der alle Männer des Dorfes rasiert, die sich nicht selbst rasieren, und nur diese. Von ihm selbst gilt, dass er sich genau dann selbst rasiert, wenn er sich nicht selbst rasiert. In der naiven Mengenlehre hält man trotzdem an den Vorstellungen Cantors fest, und vermeidet lediglich Begriffsbildungen, die sich als inkonsistent erwiesen haben, wie beispielsweise die oben beschriebene Menge“. Eine streng axiomatische ” Begründung der Mengenlehre wurde im Jahre 1908 von E. Zermelo initiiert. Dies reicht tief in den Bereich der Logik und Philosophie hinein, worauf wir hier nicht eingehen wollen. Wir hatten bereits die Inklusion A ⊂ B zweier Mengen A, B kennengelernt. Gilt A ⊂ B, jedoch A 6= B, so schreiben wir A $ B: es gibt also mindestens ein Element in B, welches nicht in A liegt. 25 Der Durchschnitt A ∩ B zweier Mengen A und B ist die Menge aller gemeinsamen Elemente von A und B: A ∩ B := {x : x ∈ A und x ∈ B} . B 111111111 000000000 000000000 111111111 000000000 111111111 A 000000000 111111111 000000000 111111111 A∩B 000000000 111111111 000000000 111111111 000000000 111111111 000000000 111111111 000000000 111111111 000000000 111111111 000000000 111111111 000000000 111111111 000000000 111111111 000000000 111111111 A und B heißen disjunkt, wenn es kein gemeinsames Element von A und B gibt, d.h. wenn A ∩ B = ∅. Die Vereinigung A ∪ B ist die Menge aller Elemente, die mindestens einer der Mengen A und B angehören: A ∪ B := {x : x ∈ A oder x ∈ B} . 000000000 111111111 B 000000000 111111111 111111111 000000000 000000000 111111111 000000000 111111111 A 000000000 111111111 000000000 111111111 000000000 111111111 000000000 111111111 000000000 111111111 000000000 111111111 000000000 111111111 A∪B 000000000 111111111 000000000 111111111 000000000 111111111 Offenbar ist stets A ∪ ∅ = A, A ∩ ∅ = ∅. Die leere Menge spielt also unter den Mengen eine ähnliche zentrale Rolle wie die Null bei den Zahlen. Die Differenzmenge A \ B zweier Mengen A und B besteht aus denjenigen x ∈ A, welche nach Entfernung aller Elemente von B, welche in A liegen, übrigbleiben: A \ B := {x ∈ A : x ∈ / B} . Z.B. ist R \ Q die Menge der irrationalen Zahlen. A 11111111 00000000 00000000 11111111 00000000 11111111 00000000 11111111 00000000 11111111 A\B 00000000 11111111 00000000 11111111 00000000 11111111 26 B Sind die betrachteten Mengen allesamt Teilmengen einer gemeinsamen Grundmen” ge“ X, so schreibt man anstelle von X \ B auch kürzer B c (oftmals auch ∁B), und nennt B c das Komplement von B (in X). Es gilt dann X c = ∅, ∅c = X, (B c )c = B . X 111111111111111 000000000000000 000000000000000 111111111111111 000000000000000 111111111111111 000000000000000 111111111111111 Bc 000000000000000 111111111111111 000000000000000 111111111111111 000000000000000 111111111111111 B 000000000000000 111111111111111 000000000000000 111111111111111 000000000000000 111111111111111 000000000000000 111111111111111 000000000000000 111111111111111 000000000000000 111111111111111 000000000000000 111111111111111 000000000000000 111111111111111 Die symmetrische Differenz A △ B zweier Mengen A und B besteht aus denjenigen x, die genau einer der beiden Mengen angehören: A △ B := (A ∪ B) \ (A ∩ B) . Es gilt (Übung) A △ B = (A \ B) ∪ (B \ A) . 111111111 000000000 000000000 111111111 00000000 11111111 000000000 111111111 00000000 11111111 000000000 111111111 A 00000000 11111111 000000000 111111111 00000000 11111111 000000000 111111111 00000000 11111111 000000000 111111111 00000000 11111111 000000000 111111111 00000000 11111111 000000000 111111111 00000000 11111111 000000000 111111111 00000000 11111111 00000000 11111111 A∆B 00000000 11111111 00000000 11111111 00000000 11111111 00000000 11111111 00000000 11111111 00000000 11111111 2.3 B Sätze und Beweise. Verknüpfung von Aussagen Ein mathematischer Satz enthält Voraussetzungen und Behauptungen. Er ist wahr (oder gültig“), falls die Behauptungen immer dann wahr sind, wenn die ” Voraussetzungen erfüllt, d.h. wahr sind. Beispiel eines mathematischen Satzes: Voraussetzung: Sei n eine durch 6 teilbare natürliche Zahl. Behauptung: Dann ist n durch 3 teilbar. Dieser Satz ist wahr, da jede Zahl, die durch 6 = 2 · 3 teilbar ist, auch durch 3 teilbar ist. Noch ein Beispiel. Voraussetzung: wie zuvor. Behauptung: Dann ist n ist durch 5 teilbar. 27 Dieser Satz ist falsch, da es wenigstens eine Zahl gibt, die durch 6, aber nicht durch 5 teilbar ist – z.B. die 6. (Es gibt sogar unendlich viele solcher Zahlen; dieser Sachverhalt ist jedoch unerheblich für die Frage, ob dieser Satz wahr ist.) Ein Beweis besteht darin, durch schrittweises logisches Schließen“ von den ” Voraussetzungen zu den Behauptungen zu gelangen. Dabei werden oftmals auch mehrere Zwischenbehauptungen, die bereits vorher aus den Voraussetzungen hergeleitet wurden, verwendet. Beim Hantieren mit Aussagen wird eine Reihe von logischen Verknüpfungen verwendet. Der Wahrheitswert (oder -gehalt) der durch die Verknüpfung erzeugten Aussage ist durch den Wahrheitsgehalt der beteiligten Aussagen festgelegt. a) Die Konjunktion zweier Aussagen A und B: A und B“ (geschrieben A ∧ B) ” bezeichnet die Aussage, dass sowohl A als auch B gelten. A ∧ B ist also wahr genau dann, wenn A und B gleichzeitig wahr sind. b) Die Adjunktion zweier Aussagen A und B: A oder B“ (geschrieben: A ∨ B) ” ist wahr genau dann, wenn mindestens eine der beiden Aussagen wahr ist (eventuell auch beide – nicht ausschließendes oder“). ” Z.B. ist die Aussage Es regnet oder es regnet nicht“ ” wahr (allgemein ist A ∨ ¬A stets wahr); ebenso ist für jede ganze Zahl m ∈ Z die Aussage m ≥ 0 oder m ≤ 0 wahr (für m = 0 gilt sogar beides). Eine Aussage, die stets wahr ist, bezeichnet man übrigens als eine Tautologie. c) Die Implikation A impliziert B“ (geschrieben: A ⊃ B) ” ist wahr genau dann, wenn die Aussagen A und B beide wahr sind, oder wenn A falsch ist. Sie ist also falsch nur dann, wenn A wahr ist, aber B falsch. Die logische Verknüpfung der Implikation erlaubt es, Schlüsse, d.h. Schlussfolgerungen, zu beschreiben, und ist daher für die Mathematik von fundamentaler Bedeutung (s. [KB]): Der Schluss “Aus A folgt B,” geschrieben A ⇒ B, ist wahr, wenn die Aussage A ⊃ B wahr ist. Übersetzt in die deutsche Sprache: 28 Wann immer die Voraussetzung oder “Prämisse” A erfüllt, d.h. wahr ist, so ist die Folgerung oder “Konklusion” B auch erfüllt. Ist die Voraussetzung A nicht erfüllt, d.h. falsch, so ist also nichts zu zeigen. Nur, wenn A wahr ist, so muss gearbeitet werden und gezeigt werden, dass dann stets auch B wahr ist. Beispiel: Die Behauptung Alle Menschen, die größer als 1,9 m und kleiner als 180 ” cm sind, sind blond“ ist wahr: Man kann diese nämlich folgendermaßen formulieren: Betrachte die Aussagen A := M ist ein Mensch, der größer als 1,9 m und kleiner als 180 cm ist” und B := ” M ist ein Mensch, der blond ist”. Obige Behauptung ist dann gleichbedeutend zur ” Aussage: Für alle Menschen M gilt die Implikation A impliziert B.““Diese ist aber ” ” wahr, da es offenbar keinen einzigen Menschen M gibt, der die Voraussetzungen A erfüllt, so dass A stets falsch ist. Mathematische Sätze sind Ausssagen der Form A ⇒ B“. A heißt die Vorausset” zung (oftmals bestehend aus einer Liste von Voraussetzungen), B die Folgerung des Schlusses A ⇒ B. Man sagt dann auch: A ist eine hinreichende Bedingung für B, B ist eine notwendige Bedingung für A. Beispiel: Die Aussage Für alle Zahlen n ∈ N gilt: Aus n < 3 folgt n < 5“ ” ist wahr. Hier sind n ∈ N“ und n < 3“ die Voraussetzungen, und n < 5“ die ” ” ” Behauptung. Äquivalenz von Aussagen: Sind A und B zwei Aussagen, und kann man zeigen, dass A genau dann wahr ist, wenn B wahr ist, so sagt man, beide Aussagen seien äquivalent, und schreibt dafür A ⇔ B. Die Aussagen A und B sind also äquivalent genau dann, wenn beide Schlüsse A ⇒ B und B ⇒ A gelten. Beispielsweise gilt für alle x ∈ R: x≥0 ⇔ Es gibt ein y ∈ R mit x = y 2 . Für beliebige Aussagen A, B gilt: (2.5) ¬(A ∧ B) ⇔ (¬A) ∨ (¬B) ( A und B gelten nicht gleichzeitig dann und nur dann, wenn A nicht gilt oder B ” nicht gilt (oder beide nicht - nicht ausschließendes oder“ )“). ” Beispiel: Die Negation der Aussage n ∈ N ist gerade und durch 7 teilbar“ ” ist n ∈ N ist ungerade oder nicht durch 7 teilbar“ ” 29 (aber nicht etwa: n ∈ N ist ungerade und nicht durch 7 teilbar“). ” In der Mathematik wird der Schluss A ⇒ B i.d.R. ebenfalls als die “Implikation” A ⇒ B bezeichnet. Aus dem bisher Gesagten sollte klar sein, dass dies nicht ganz korrekt ist, da die Implikation ja eigentlich für die logische Verknüpfung ⊃ steht, aber wir werden uns im Folgenden ebenfalls diesem gängigen Sprachgebrauch anschließen. 2.4 Quantoren Es ist gelegentlich praktisch, in der Formulierung von Aussagen den Existenzquantor ∃ (in Worten: es gibt“) ” und den Allquantor ∀ in Worten: für alle“ ” zur Abkürzung zu benutzen. Mit dem Gebrauch sollte man jedoch sparsam sein, da gerade Studienanfänger Gefahr laufen, die inhaltliche ( semantische“) Bedeutung ” von Aussagen aus dem Auge zu verlieren und dazu tendieren, rein formal mit den Quantoren zu hantieren. Beispiel: Die Aussage Es gibt eine natürliche Zahl, die größer als 1000 ist“ ” ist wahr. Man kann sie auch schreiben als ∃ n ∈ N mit n > 1000“ , ” oder noch kürzer als ∃ n ∈ N : n > 1000 (die An-und Ausführungszeichen zur Kennzeichnung von Aussagen werden wir bei solchen Kurzschreibweisen in Zukunft meist weglassen). Die Negation dieser Aussage ist Für alle n ∈ N gilt n ≤ 1000“ , ” oder kürzer ∀ n ∈ N : n ≤ 1000 . Allgemein gilt: Ist A(x) eine Aussage über Elemente x einer Menge M (A(x) beschreibt also eine Eigenschaft von x), so ist die Negation der Aussage Für alle x in ” der Menge M ist die Aussage A(x) wahr ”, oder, sprachlich eleganter, Alle x aus ” der Menge M besitzen die Eigenschaft A(x) ”, kurz: ∀x ∈ M : A(x), 30 die Aussage ∃ x ∈ M : ¬A(x) . Dies können wir formalisiert durch die Äquivalenz ¬(∀ x ∈ M : A(x)) ⇔ (∃ x ∈ M : ¬A(x)) beschreiben. Entsprechend gilt ¬(∃ x ∈ M : A(x)) ⇔ (∀ x ∈ M : ¬A(x)) (man mache sich diese Äquivalenz sprachlich-logisch klar!). Fazit: Die Quantoren ∃ und ∀ werden bei der Negation mitineinander vertauscht. Zur Erinnerung: Mit es gibt“ ist in der Mathematik immer gemeint es gibt minde” ” stens ein“. Will man ausdrücken, dass es auch nicht mehr als eins geben kann, sagt man es gibt genau ein“ (kurz : ∃˙ oder ∃!). ” Aussagen können mehrere Quantoren enthalten. Beispiel: ∀ n ∈ N ∃ p ∈ N : p > n und p ist Primzahl In Worten: Zu jeder natürlichen Zahl n gibt es eine Primzahl p, welche größer ist ” als n“. Die Negation dieser Aussage ist ∃ n ∈ N ∀ p ∈ N : p ≤ n oder p ist keine Primzahl“ , in Worten: Es gibt eine natürliche Zahl n, so dass für alle natürlichen Zahlen p gilt, dass p ” kleiner oder gleich n oder keine Primzahl ist“. Gleichbedeutend hierzu ist die vermutlich verständlichere Aussage Es gibt eine natürliche Zahl n, so dass jede Primzahl p kleiner oder gleich n ist“. ” Die Reihenfolge der Quantoren ist wesentlich! Die Aussage ∃ p ∈ N ∀ n ∈ N : p > n und p ist Primzahl“ ” ist eine völlig andere (und falsch, während die ursprüngliche Aussage ein wahrer mathematischer Satz ist). Noch ein Beispiel. In jeder deutschen Stadt gibt es einen Bürger, der ein Haus besitzt“ ” ist eine (vermutlich wahre) Aussage, während Es gibt einen Bürger, der in jeder deutschen Stadt ein Haus besitzt“ ” eine völlig andere (vermutlich falsche) Aussage ist. 31 2.5 Rechenregeln für Mengen. Indexmengen Seien A, B, C Mengen. Dann gilt (2.6) A ⊂ B und B ⊂ C ⇒ A ⊂ C (Transitivität der Inklusion) Insbesondere folgt hieraus: Ist A = B und B = C, so ist A = C. Beweis. Ist x ∈ A, so ist wegen A ⊂ B auch x ∈ B und weiter wegen B ⊂ C dann auch x ∈ C . Q.E.D. Wie in diesem Beispiel werden wir Beweise stets abschließen mit dem Kürzel Q.E.D.: quod erat demonstrandum“, d.h. was zu beweisen war“; oft werden dafür auch ” ” Kürzel wie ✷ oder y anstelle von Q.E.D. verwendet. Desweiteren gelten folgende Regeln, welche sich unmittelbar aus den logischen Verknüpfungen ∨ und ∧ ergeben und mehr oder weniger evident sind: A ∪ A = A, A∩A= A A ∪ B = B ∪ A, A∩B = B∩A (Kommutativität) (A ∪ B) ∪ C = A ∪ (B ∪ C), (A ∩ B) ∩ C = A ∩ (B ∩ C) (Assoziativität) A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C) (Distributivität I) A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C) (Distributivität II) Wir beweisen hier nur die Assoziativität der Vereinigung; die übrigen Regeln seien als Übung überlassen: Es gilt: x ∈ (A ∪ B) ∪ C ⇔ ⇔ ⇔ ⇔ ⇔ x ∈ A ∪ B oder x ∈ C (x ∈ A oder x ∈ B) oder x ∈ C x ∈ A oder (x ∈ B oder x ∈ C) x ∈ A oder (x ∈ B ∪ C) x ∈ A ∪ (B ∪ C) . Beim Übergang von der zweiten zur dritten Zeile wurde eine Tautologie benutzt, nämlich die Assoziativität (A ∨ B) ∨ C ⇔ A ∨ (B ∨ C) der logischen Verknüpfung oder“. Solche Standardschlüsse des logischen Denkes dürfen Sie in meiner ” Vorlesung ohne weiteren Kommentar anwenden. Wegen der Assoziativität von ∪ und ∩ kann man die Klammern weglassen und einfach A ∪ B ∪ C, A ∩ B ∩ C schreiben. 32 Sei nun I eine Menge, und für jedes i ∈ I eine Menge Ai gegeben. In diesem Kontext heißt i der Index von Ai und I eine Indexmenge. Wir definieren dann die Vereinigung und den Durchschnitt der Familie oder des Systems der Mengen Ai , i ∈ I, (geschrieben: {Ai }i∈I ) durch [ (2.7) i∈I Ai := {x : es gibt ein i ∈ I mit x ∈ Ai } , \ (2.8) i∈I Ai := {x : für alle i ∈ I gilt x ∈ Ai } . Wir führen hier noch folgende Notation ein: Ist m ∈ N gegeben, so bezeichnen wir mit Nn≥m ⊂ N die Teilmenge aller natürlichen Zahlen n ≥ m, d.h. Nn≥m := {n ∈ N : n ≥ m} = {m, m + 1, m + 2, m + 3, . . . }. Analog definiert man z.B. auch Nn>m oder Nn≤m , etc.. Beispiel. Sei für n ∈ N≥1 = {1, 2, 3, 4, . . .} die Menge An definiert durch o np :p∈Z . An := n Dann ist offenbar [ An = Q , n∈N≥1 und \ An = Z (wieso?) . n∈N≥1 Ist I ⊂ Z von der Form I = {i ∈ Z : k ≤ i ≤ l}, mit k, l ∈ Z, so schreibt man auch l [ Ai statt [ Ai , i∈I i=k und l \ statt ∞ [ Ai Ai ; i∈I i=k ebenso schreibt man \ statt [ i∈N≥k i=k etc.. 33 Ai , Beachte: Ist k > l, so ist in diesem Fall I = ∅. Um auch solche pathologischen“ ” Situationen berücksichtigen zu können, definiert man [ Ai := ∅ , i∈∅ und, falls die Ai allesamt in einer Grundmenge X liegen, \ Ai := X . i∈∅ (dies steht logisch im Einklang zu den Definitionen (2.7), (2.8)). Die Distributivgesetze für ∪ und ∩ verallgemeinern sich dann zu [ [ \ \ B∩ Ai = B ∩ Ai , B ∪ Ai = (B ∪ Ai ). i∈I i∈I i∈I i∈I Sind die Mengen Ai der Familie {Ai }i∈I paarweise disjunkt, d.h. ist Ai ∩ Aj = ∅ für S alle i, j ∈ I mit i 6= j, so spricht man auch von einer disjunkten Vereinigung i∈I Ai , und schreibt gelegentlich dafür [ ˙ Ai . i∈I Für eine beliebige Familie {Ai }i∈I von Teilmengen einer Grundmenge X gilt (Übung) !c [ \ Ai = Aci (1. Formel von De Morgan) , i∈I \ i∈I 2.6 i∈I Ai !c = [ Aci (2. Formel von De Morgan) . i∈I Mengen von Mengen Die Elemente einer Menge können ohne weiteres selbst wieder Mengen sein. Beispiele: a) {{1, 2}, {1, 3}, {1, 4}} = {{1, n} : n ∈ N, 2 ≤ n ≤ 4} ist eine Menge mit drei Elementen, die selbst zweielementige Mengen sind. b) {∅} ist nicht etwa die leere Menge, sondern die Menge, welche als einziges Element die leere Menge enthält. 34 Die Potenzmenge einer Menge M ist die Menge P(M) := {A : A ⊂ M} aller Teilmengen von M. Da stets ∅ ⊂ M, ist P(M) nie leer. Beispiele. P({1, 2}) = {∅, {1}, {2}, {1, 2}} , P({2, 3, 4}) = {∅, {2}, {3}, {4}, {2, 3}, {2, 4}, {3, 4}, {2, 3, 4}} . 2.7 Das kartesische Produkt zweier Mengen Ein fundamentaler Grundbegriff der Mathematik ist derjenige der Produktmenge oder des Produktes A × B zweier Mengen A und B. Dies ist die Menge aller (geordneten) Paare (x, y) mit x ∈ A und y ∈ B. Wir wollen diesen Begriff nicht weiter hinterfragen und nur darauf hinweisen, dass zum Begriff des Paares gehört, dass zwei Paare (x1 , y1) und (x2 , y2) gleich sind dann und nur dann, wenn x1 = x2 und y1 = y2 . Insbesondere ist für x 6= y das Paar (x, y) verschieden vom Paar (y, x). Das geordnete Paar (x, y) ist also wohl zu unterscheiden von der Menge {x, y}, bei der es nicht auf die Reihenfolge der Elemente ankommt. Wir haben also A × B := {(x, y) : x ∈ A, y ∈ B}. Sind beispielsweise A und B zwei Intervalle in R, so lässt sich die Menge A × B als ein Rechteck in einem kartesischen Koordinatensystem darstellen: A×B B A Allgemein bezeichnet man die Mengen A und B als die Faktoren von A × B. Wenn man will, kann man den Begriff des geordneteten Paares auf den Mengenbegriff zurückführen, indem man setzt (x, y) := {{x}, {x, y}} . 2.8 Funktionen Es seien A und B zwei beliebige Mengen. Unter einer Funktion oder Abbildung f von A nach B, in Zeichen: f : A → B, 35 versteht man eine Vorschrift, die für jeden Punkt x ∈ A genau einen Bildpunkt y ∈ B festlegt, in Zeichen: f : x 7→ y. Dieses y heißt Funktionswert an der Stelle x oder Bildpunkt von x und wird mit f (x) bezeichnet. Die Menge A ist der Definitionsbereich, B der Wertevorrat oder der Wertebereich von f . Den Definitionsbereich kürzen wir gelegentlich mit D(f ) ab. Unsere obige Definition einer Funktion ist vielleicht relativ anschaulich, jedoch im Grunde sehr vage, da der Begriff Vorschrift“ nicht wohldefiniert ist. Der Funk” tionsbegriff lässt sich folgendermaßen auch direkt auf schon eingeführte Begriffe abstützen. Zu jeder Funktion f : A → B gehört ihr Graph G(f ) := {(x, y) ∈ A × B : x ∈ A, y = f (x)}, eine wohlbestimmte Teilmenge von A × B. Beispielsweise ist der Graph der Funktion, die durch f (x) := x2 auf R definiert wird, eine Parabel in R × R: f (x) (x, f (x)) x Der Graph G := G(f ) besitzt folgende Eigenschaft: (2.9) Zu jedem x ∈ A gibt es genau ein y ∈ B mit (x, y) ∈ G. Ist umgekehrt G eine Teilmenge von A × B mit der Eigenschaft (2.9), so gibt es eine wohlbestimmte Funktion f : A → B, deren Graph die Menge G ist: Der Funktionswert f (x) ist für jedes Argument x ∈ A das eindeutig bestimmte y ∈ B mit (x, y) ∈ G. Da also Funktion und Graph einander gegenseitig bestimmen, werden sie oft als ein und dasselbe betrachtet. In diesem Sinne definiert man dann: Eine Funktion oder Abbildung f : A → B ist eine Teilmenge G ⊂ A × B, die die Eigenschaft (2.9) besitzt. In der Praxis ist man meist jedoch weniger präzise und spricht beispielsweise von der Funktion y = f (x)“, oder auch z.B. von der Funktion 2x/ (1 − x2 ), womit man ” im letzteren Fall die Funktion 2x f : x 7→ 1 − x2 36 gemeint ist, deren Definitionsbereich natürlicherweise R \ {−1, 1} ist, wenn wir als Grundmenge“ für x die reellen Zahlen betrachten. Allgemein soll eine solchermaßen ” durch einen Ausdruck“ definierte Funktion als Definitionsbereich die Menge all ” derjenigen x einer von vornherein vereinbarten Grundmenge X sein, für die der betreffende Ausdruck ausgewertet werden kann. Zwei Funktionen f1 : A1 → B1 und f2 : A2 → B2 heißen gleich (in Zeichen : f1 = f2 ), wenn gilt : A1 = A2 , B1 = B2 und f1 (x) = f2 (x) für alle x ∈ A1 = A2 . Ist f : A → B eine Funktion, und ist U ⊂ A eine Teilmenge von A, so bezeichnet man die Menge f (U) := {f (x) : x ∈ U} als die Bildmenge von U unter f. Die Bildmenge f (A) von A bezeichnen wir als das Bild von f. Im allgemeinen ist f (A) eine echte Teilmenge von B. Die Abbildung f : A → B heißt surjektiv oder eine Surjektion oder auch eine Abbildung von A auf B, falls gilt f (A) = B, d.h. falls jeder Punkt y ∈ B als Bildpunkt f (x) wenigstens eines Punktes x ∈ A auftritt. Sie heißt injektiv oder eineindeutig oder eine Injektion, wenn keine zwei verschiedenen Punkte x1 , x2 ∈ A denselben Bildpunkt y ∈ B besitzen, d.h. wenn für beliebige x1 , x2 ∈ A gilt x1 6= x2 ⇒ f (x1 ) 6= f (x2 ), oder, äquivalent dazu, f (x1 ) = f (x2 ) ⇒ x1 = x2 . Ist f : A → B gleichzeitig surjektiv und injektiv, so heißt f bijektiv, und man nennt f eine Bijektion. Diese Eigenschaften lassen sich äquivalent auch durch das Lösungsverhalten der Gleichung y = f (x) beschreiben: (i) f : A → B ist surjektiv genau dann, wenn die Gleichung y = f (x) für jedes y ∈ B (mindestens) eine Lösung x ∈ A besitzt. (ii) f : A → B ist injektiv genau dann, wenn die Gleichung y = f (x) für jedes y ∈ B höchstens eine Lösung x ∈ A besitzt. (iii) f : A → B ist bijektiv genau dann, wenn die Gleichung y = f (x) für jedes y ∈ B eine eindeutige Lösung x ∈ A besitzt. Beispiele. a) Betrachte die Funktionen f, g, h, k : R → R, welche durch f (x) := 2x, g(x) := x3 − x, h(x) := ex , k(x) := x2 37 definiert sind. Dann gilt f (R) = R, g(R) = R, h(R) = {y : y > 0}, k(R) = {y : y ≥ 0}. f und g sind also surjektiv, h und k nicht. f und h sind injektiv, g und k nicht, da z.B. g(0) = g(1) = 0 und k(1) = k(−1) = 1. Folglich ist nur f bijektiv. −2 2 2 1 1 1 −1 2 −2 1 −1 −1 −1 ✄ 3 ✂g(x) = x − x ✁ ✄ ✂f (x) = 2x ✁ −2 2 −2 −2 2 2 1 1 1 −1 2 −2 −1 1 −1 2 −1 ✄ 2 ✂k(x) = x ✁ ✄ x ✂h(x) = e ✁ −2 −2 b) Ist M eine nichtleere Menge, so heißt die durch Id M (x) := x definierte Abbildung Id M : M → M die Identität auf M (oder auch die identische Abbildung von M nach M). c) Ist M eine nichtleere Menge, so wird durch f (x) := {x} eine Abbildung f : M → P(M) definiert. Ist diese surjektiv? Ist f : A → B bijektiv, so erfüllt der Graph G von f neben (2.9) auch die Eigenschaft: (2.10) Zu jedem y ∈ B gibt es genau ein x ∈ A mit (x, y) ∈ G. D.h., die Teilmenge t G := {(y, x) ∈ B × A : (x, y) ∈ G} von B × A erfüllt (2.9) und ist damit der Graph einer Funktion f −1 : B → A, der Umkehrfunktion oder Umkehrabbildung von f . Die Umkehrabbildung f −1 : B → A, y 7→ “dasjenige x ∈ A mit f (x) = y“ 38 macht die Wirkung von f wieder rückgängig, und ihr Graph G(f −1 ) = tG(f ) entsteht durch Spiegeln von G(f ) an der Achse y = x“. ” Es gilt also: f −1 (f (x)) = x für alle x ∈ A, und f (f −1 (y)) = y x = f −1 (y) für alle y ∈ B. (y, f −1 (y)) y = f (x) (x, f (x)) y x Beispielsweise ist die Umkehrfunktion der obigen Funktion f (x) = 2x die Funktion f −1 : R → R, y 7→ 12 y. Weiter lässt sich, wie wir bereits diskutiert hatten, die injektive Exponentialfunktion h(x) := ex als bijektive Abbildung h : R → R+ auf die Menge R+ := {y ∈ R : y > 0} auffassen, deren Umkehrfunktion h−1 : R+ → R, y 7→ log y der natürliche Logarithmus ist. Ist f : A → B eine beliebige (nicht notwendig bijektive) Funktion, und ist W ⊂ B, so nennt man die Menge f −1 (W ) := {x ∈ A : f (x) ∈ W } das Urbild von W unter f. Im Falle einer bijektiven Abbildung f stimmt diese Menge mit dem Bild von W unter der Umkehrabbildung f −1 überein. 39 ACHTUNG: Das Symbol f −1 steht also einerseits für die Umkehrfunktion einer bijektiven Funktion f , andererseits wird es auch bei nicht-bijektiven Funktionen f verwendet, um Urbilder zu beschreiben! Für die Funktion g(x) = x3 − x ist beispielsweise g −1({0}) = {0, −1, 1}. Für Bild- und Urbildmengen gelten ebenfalls eine Reihe von Rechenregeln. Sei f : M → N eine Abbildung, und seien A, B ⊂ M. Dann gilt für die Bildmengen (2.11) (2.12) f (A ∪ B) = f (A) ∪ f (B), f (A ∩ B) ⊂ f (A) ∩ f (B). Machen Sie sich anhand eines Beispiels klar, dass in (2.12) im Allgemeinen nicht die Gleichheit gilt! Sind C, D ⊂ N, so gilt für die Urbilder (2.13) (2.14) f −1 (C ∪ D) = f −1 (C) ∪ f −1 (D), f −1 (C ∩ D) = f −1 (C) ∩ f −1 (D). Wir beweisen (2.11), und überlassen den Beweis der anderen Behauptung der Leserin oder dem Leser zur Übung. Es gilt f (A) ∪ f (B) = = = = {y : y ∈ f (A) oder y ∈ f (B)} {y : (∃x ∈ A mit f (x) = y) oder (∃x ∈ B mit f (x) = y)} {y : ∃x ∈ A ∪ B mit f (x) = y} f (A ∪ B). Ist f : A → B eine Funktion und U ⊂ A eine Teilmenge von A, so bezeichnet man die Funktion f |U : U → B, x 7→ f (x) als die Einschränkung von f auf U. Offenkundig ist G(f |U ) = {(x, f (x)) : x ∈ U} ⊂ G(f ). Ist umgekehrt à eine Obermenge von A, d.h. à ⊃ A, und f˜ : à → B eine Funktion, die auf A mit f übereinstimmt, d.h. ist f˜|A = f, so heißt f˜ eine Fortsetzung von f auf die Menge Ã. Wird beispielsweise die Funktion k(x) = x2 auf die positiven Zahlen eingeschränkt, so entsteht die bijektive Abbildung k|R+ : R+ → R+ , x 7→ x2 , 40 mit der Umkehrabbildung (k|R+ )−1 : R+ → R+ , y 7→ √ y. Sind f : A → B und g : B → C zwei Funktionen, so definieren wir die zusammengesetzte Funktion g ◦ f (Sprechweise: g nach f “) oder auch Komposition von ” f und g als die Funktion g ◦ f : A → C, x 7→ g(f (x)), d.h. g ◦ f (x) := g(f (x)). g◦f g(f (x)) x A f g C y = f (x) B Für die Funktionen f (x) = 2x und h(x) = ex gilt beispielsweise f ◦ h(x) = 2ex , h ◦ f (x) = e2x . Man sieht leicht, dass für je drei Funktionen das Assoziativgesetz für die Komposition gilt: (f1 ◦ f2 ) ◦ f3 = f1 ◦ (f2 ◦ f3 ). Ist f : A → B bijektiv, und ist f −1 : B → A die Umkehrabbildung, so gilt also f −1 ◦ f = Id A , f ◦ f −1 = Id B . Allgemein bezeichnet man jede Teilmenge R ⊂ A × B von A × B als eine Relation, und schreibt xRy, falls (x, y) ∈ R. Damit will man deutlich machen, dass zwischen x und y eine Beziehung besteht (nämlich dass (x, y) ∈ R). Ist R eine Relation in X × X, so nennt man R auch eine Relation auf X. Damit ist eine Funktion f : A → B also nichts anderes als eine Relation G ⊂ A × B, welche der Bedingung (2.9) genügt. 41 Ist X eine fest gegebene Menge, so definiert man schließlich die charakteristische Funktion oder auch Indikatorfunktion 1A : X → R einer beliebigen Teilmenge A ⊂ X wie folgt: ( 1, falls x ∈ A, 1A (x) := 0, falls x ∈ / A. Man findet oft auch die Notation χA anstelle von 1A . 2.9 Direkte Beweise und Widerspruchsbeweise Ein Beweis der Wahrheit des Satzes (oder kürzer: ein Beweis des Satzes“) ” A ⇒ B kann dadurch geführt werden, dass man eine Kette von wahren Implikationen A ⇒ C1 , C1 ⇒ C2 , . . . , Cn−1 ⇒ Cn , Cn ⇒ B findet. Soetwas nennt man einen direkten Beweis. Äquivalent dazu ist der Beweis der Aussage ¬B ⇒ ¬A . Dies beruht auf folgender Tautologie ( Kontrapositionsprinzip“) ” (2.15) (A ⇒ B) ⇔ (¬B ⇒ ¬A) . Dies macht man sich wie folgt klar: Angenommen, aus A folgt B, aber die Aussage B ist falsch, so kann A nicht wahr sein, da ja sonst auch B wahr sein müsste. Dies beweist die Implikation ⇒ in (2.15), und mit dem gleichen Schluss folgert man, dass ¬B ⇒ ¬A impliziert ¬¬A ⇒ ¬¬B, also A ⇒ B. Wir haben (2.15) mit Hilfe eines Widerspruchsbeweises begründet. Formal funktioniert ein solcher wie folgt: ” Um zu beweisen, dass A ⇒ B, nehmen wir an, dass A wahr, jedoch B falsch ist, d.h. A ∧ (¬B) wahr ist. Wir zeigen dann (eventuell wieder mit Hilfe einer Kette von Implikationen), dass dies die Wahrheit einer weiteren Aussage C impliziert, und mit Hilfe anderer Implikationen, dass C falsch sein muss : A ∧ (¬B) ⇒ E1 ⇒ · · · ⇒ En ⇒ C , A ∧ (¬B) ⇒ F1 ⇒ · · · ⇒ Fl ⇒ ¬ C . Da aber nicht gleichzeitig C und ¬ C gelten können, hat man einen Widerspruch hergeleitet aus der Annahme, dass A und ¬B gleichzeitig wahr sind: Wenn A wahr ist, muss folglich auch B wahr sein, d.h. A impliziert B. Man mache sich dieses Prinzip noch einmal am Beispiel des Euklidschen Beweises √ für die Irrationalität von 2 klar! 42 Kapitel 3 Natürliche Zahlen und vollständige Induktion Wie bereits gesagt, lassen sich die reellen Zahlen stufenweise durch gewisse Konstruktionen aus einfacheren Strukturen gewinnen. Auf diese Weise entsteht ein Turm“ von Zahlbereichen ” N ⊂ Z ⊂ Q ⊂ R, an dessen Basis die natürlichen Zahlen N stehen. Wir verstehen darunter solche Zahlen, die wir zum Abzählen benutzen: 0, 1, 2, 3, . . . , 2056, 2057, . . . . Im Folgenden verwenden wir dafür meistens kleine lateinische Buchstaben: a, b, c, . . . , m, n, . . . . Bekanntlich kann man die natürlichen Zahlen addieren, multiplizieren und ordnen. Hierfür gelten die folgenden Regeln, die wir als bekannt voraussetzen wollen: Addition: (A+ ) (a + b) + c = a + (b + c) (K+ ) a + b = b + a (N) a+0=a (S) a+c= b+c ⇒a=b (Assoziativität der Addition) (Kommutativität der Addition) (Existenz der Null) (Kürzungsregel der Addition) Multiplikation: (A· ) (K· ) (E) (Q) Dabei sei 0 6= 1. (ab)c = a(bc) (Assoziativität der Multiplikation) ab = ba (Kommutativität der Multiplikation) a·1=a (Existenz der Eins) ac = bc und c 6= 0 ⇒ a = b (Kürzungsregel der Multiplikation) Beziehung zwischen Addition und Multiplikation: (D) a(b + c) = ab + ac (Distributivgesetz) 43 Ordnung: (V) (R) (T) (I) (M+ ) (M· ) (P) Stets gilt a ≤ b oder b ≤ a a≤a a ≤ b und b ≤ c ⇒ a ≤ c a ≤ b und b ≤ a ⇒ a = b a≤b ⇒ a+c≤ b+c a ≤ b ⇒ ac ≤ bc Ist a ≤ b, so existiert c mit b = a + c. Ferner ist stets a ≥ 0. Und, aus a ≤ 1 folgt a = 0 oder a = 1. (Vergleichbarkeit aller Elemente) (Reflexivität der Ordnung) (Transitivität) (Identitivität) (Monotonie der Addition) (Monotonie der Multiplikation) Falls a ≤ b und a 6= b, so schreiben wir auch a < b. Statt a ≤ b schreiben wir auch b ≥ a. Von grundlegender Bedeutung ist letztendlich das sicherlich sehr plausible (VI) Prinzip der vollständigen Induktion: Sei n0 ∈ N. Für jedes n ∈ Nn≥n0 , d.h. n ≥ n0 , bezeichne A(n) eine Aussage. Nehmen wir an, dass A(n0 ) wahr ist. (Induktionsanfang) Für beliebiges n ∈ Nn≥n0 gilt: Falls A(n) wahr ist, so ist auch A(n + 1) wahr. (Induktionsschritt) Dann ist A(n) für alle n ≥ n0 wahr. (I) (II) Bisher ist es noch niemandem gelungen, für eine der obigen Regeln ein Gegenbeispiel anzugeben. Wir betrachten deshalb diese Regeln oder Axiome als allgemein gültig für die natürlichen Zahlen. Beweisen“ lassen sich diese Regeln nicht – allerdings ist ” es möglich, das so beschriebene System der natürlichen Zahlen auf erheblich weniger Axiome zurückführen, die sogenannten Peano-Axiome (siehe Abschnitt 3.3 sowie [B]). Zu diesen gehört insbesondere das Prinzip der vollständigen Induktion, welches also auf jeden Fall vorausgesetzt werden muss. Natürlich kann man noch beliebig viele andere Regeln für die natürlichen Zahlen aufstellen, es zeigt sich jedoch, dass weitere Eigenschaften durchweg Konsequenzen der obigen sind, mit anderen Worten: Es handelt sich bei weiteren Regeln, Formeln usw. um mathematische Sätze, die sich aus den obigen Grundsätzen“ mit den Mitteln der Logik ohne weitere Annahmen ” über die natürlichen Zahlen herleiten lassen, d.h. also, es handelt sich um beweisbare Sätze. Ein wichtiges Hilfsmittel ist der folgende Satz, dessen Beweis auf dem Prinzip der vollständigen Induktion beruht: Satz 3.1 Jede nichtleere Teilmenge A ⊂ N besitzt ein kleinstes Element (ein Mi” nimum“), d.h. es gibt ein m ∈ A, so dass m ≤ k für alle k ∈ A. 44 Beweis. Wir führen einen indirekten Beweis, und nehmen also an, A sei eine Menge natürlicher Zahlen ohne kleinstes Element. Dann bezeichne B die Menge aller unteren Schranken von A. Dabei verstehen wir unter einer unteren (oberen) Schranke einer Teilmenge C ⊂ N ein Element n ∈ N, so dass n ≤ c (n ≥ c) für alle c ∈ C (diese Begriffe lassen sich genauso für beliebige geordnete Mengen definieren - darauf werden wir zurückkommen). Sicherlich ist dann 0 ∈ B, da 0 ≤ k für alle k ∈ A. Ist weiter n ∈ B, so ist k ≥ n für alle k ∈ A, und n kann nicht in A liegen, da sonst entgegen unserer Voraussetzung n ein kleinstes Element von A wäre. Nach (P ) gibt es zu jedem k ∈ A ein ℓ ∈ N so, dass k = n + ℓ, und wie eben gezeigt, muss ℓ von 0 verschieden sein, d.h. ℓ ≥ 1. Mit (M + ) und (K + ) folgert man nun, dass n + ℓ ≥ n + 1 ist, also k = n + ℓ ≥ n + 1 für alle k ∈ A, d.h. n + 1 ist ebenfalls eine untere Schranke von A und liegt daher in B. Betrachte nun die Aussage A(n) : n liegt in der Menge B. Wir habe gesehen, dass A(0) wahr ist (da ja 0 ∈ B), und dass aus der Wahrheit von A(n) stets auch die von A(n + 1) folgt (da ja mit n ∈ B auch stets n + 1 ∈ B gilt). Nach dem Prinzip der vollständigen Induktion (VI) ist somit A(n) wahr für jedes n ∈ N, d.h. es ist B = N. Dann muss aber A leer sein, denn aus n ∈ A folgt n + 1 6∈ B. Q.E.D. Als Folgerung erhalten wir den Satz über die Division mit Rest: Satz 3.2 (Euklidischen Algorithmus) Zu a und b aus N mit b > 0 existieren durch a und b eindeutig bestimmte Zahlen n und r aus N so, dass gilt: 0 ≤ r < b. a = nb + r, Beweis: Wir zeigen zunächst die Existenz einer solchen Zerlegung. Dazu definieren wir die Menge A := {m ∈ N : (m + 1)b > a}. Da wegen unserer Grundregeln“ ” (a + 1)b = ab + b > ab ≥ a gilt, ist a ∈ A, d.h. A 6= ∅. Nach Satz 3.1 besitzt A somit ein kleinstes Element n. Für n gilt folglich nb ≤ a < (n + 1)b, und wegen (P ) gibt es ein r ∈ N mit a = nb + r. Wäre r ≥ b, so folgte a ≥ nb + b = (n + 1)b, was nicht der Fall ist. Somit ist 0 ≤ r < b. 45 Nun beweisen wir die Eindeutigkeit. Sei auch a = n′ b + r ′ , mit 0 ≤ r ′ < b. Wir können annehmen, dass etwa n ≥ n′ ist. Dann gibt es ein ℓ ∈ N so, dass n = n′ + ℓ, und wir erhalten a = (n′ + ℓ)b + r = (n′ b + ℓb) + r = n′ b + (ℓb + r). Damit ist nach (S) jedoch r ′ = ℓb + r. Dies ist nur möglich, wenn ℓ = 0 ist, da andernfalls ℓ ≥ 1 Q.E.D. wäre, also r ′ ≥ ℓb ≥ b. Somit ist r ′ = r und n = n′ . Im Folgenden wollen wir mit den natürlichen Zahlen rechnen, wie wir es gewohnt sind, ohne die jeweiligen Rechenschritte durch die Grundregeln“ zu rechtfertigen ” dies wäre auf Dauer zu mühsam. Bevor wir einige Beispiele für das Beweisprinzip der vollständigen Induktion besprechen, kurz zur Notation: Sind m, n ∈ N mit m ≤ n, so schreiben wir n X k=m ak := am + am+1 + · · · + an , und verabreden die Konvention n X n Y k=m n Y ak := 0, k=m ak := am · am+1 · · · · an , ak := 1, k=m falls m > n. 3.1 Beispiele zur vollständigen Induktion a) Für jedes n ∈ N≥1 gilt die Formel n X k=1 k = 1+2+···+n = n(n + 1) . 2 Beweis. Durch vollständige Induktion nach n : Induktionsanfang: Die behauptete Formel ist offenbar richtig für n = 1, da ja 1 X 1·2 k=1= . 2 k=1 Induktionsvoraussetzung: Wir nehmen nun an, dass die Formel wahr ist für (irgend-) ein n ∈ N≥1 . Induktionsschritt: Dann gilt n+1 X k=1 k = ( n X k) + (n + 1) = k=1 n(n + 1) + (n + 1) 2 (n + 1)((n + 1) + 1) (n + 1)(n + 2) = . = 2 2 46 Der letzte Ausdruck ist aber gerade die behauptete Formel für n + 1 anstelle von n. Somit ist nach (VI) die Formel wahr für alle natürlichen Zahlen n ≥ 1. Bemerkung: Nach unserer obigen Konvention gilt die Formel übrigens auch für n = 0, d.h. sie gilt für alle n ∈ N. Wir hätten daher auch n = 0 als Induktionsanfang wählen können. Q.E.D. b) Bemerkung: Der Induktionsschritt lässt sich auch für die falsche Behauptung n X (n + 21 )2 k= 2 k=1 (3.1) durchführen: Ist diese Formel richtig für n, so folgt n+1 X k=1 k = ( n X k=1 2 k) + (n + 1) = n + 3n + = 2 9 4 (n + 21 )2 + (n + 1) 2 ((n + 1) + 12 )2 = , 2 d.h. (3.1) ist dann auch richtig für n + 1. Trotzdem ist (3.1) für alle n ≥ 1 falsch. Dieses Beispiel lehrt, wie wichtig es bei Induktionsbeweisen ist, auch den Induktionsanfang zu verifizieren! c) Bernoullische Ungleichung: Für alle x ∈ R mit x ≥ −1 und n ∈ N gilt (3.2) (1 + x)n ≥ 1 + nx. Beweis. Durch vollständige Induktion nach n : Induktionsanfang: Für n = 0 gilt die Ungleichung trivialerweise, da per definitionem (1 + x)0 = 1 ≥ 1 = 1 + 0 · x. Induktionsvorausetzung: Die Ungleichung (3.2) gelte für ein n ∈ N. Induktionsschritt: Der Schluss von n auf n + 1 ergibt sich wegen 1 + x ≥ 0 dann folgendermaßen: (1 + x)n+1 ≥ (1 + nx)(1 + x) = 1 + (n + 1)x + nx2 ≥ 1 + (n + 1)x. Q.E.D. Mit Hilfe der vollständigen Induktion zeigt man auch folgende Aussagen, welche wir üblicherweise als selbstverständlich ansehen, welche strenggenommen jedoch bewiesen werden müssen. 47 d) Sei ∗ eine assoziative binäre Operation auf einer Menge X, d.h. eine Abbildung (a, b) 7→ a ∗ b von X × X in X, welche dem Assoziativgesetz genügt: (a ∗ b) ∗ c = a ∗ (b ∗ c) ∀a, b, c ∈ X. Dann kommt es auch bei mehr als drei Operanden nicht auf die Stellung der Klammern an. D.h., es gilt z.B. (a1 ∗ a2 ) ∗ (a3 ∗ a4 ) = a1 ∗ ((a2 ∗ a3 ) ∗ a4 ) etc.. Beweis. Per Induktion nach der Anzahl n der Faktoren aj . Für n = 3 (Induktionsanfang) ist nichts zu beweisen. Wir nehmen an, dass in Produkten von höchstens n (n ≥ 3) Faktoren die Klammern beliebig umgeordnet werden können, ohne den Wert des Produktes zu verändern (Induktionsvoraussetzung), und betrachten ein Produkt b von n + 1 Faktoren a1 , . . . , an+1 mit einer vorgegebenen Klammerung. Es genügt zu zeigen, dass dieses denselben Wert besitzt wie das Produkt a1 ∗ (a2 ∗ (a3 ∗ · · · ∗ (an−1 ∗ (an ∗ an+1 )) . . . )). Eine Klammerung dieses Typs wollen wir als Standardklammerung bezeichnen. Nun gibt es zwei Möglichkeiten: (i) b besitzt die Gestalt a1 ∗ (c), wobei c = [a2 ∗ · · · ∗ an+1 ] das Produkt von a2 , . . . , an+1 mit einer gewissen Klammerung ist. Nach Induktionsvoraussetzung können wir die Klammerung in c in die Standardklammerung überführen, ohne den Wert zu verändern. Danach besitzt aber auch b die Standardklammerung. (ii) b besitzt die Gestalt (d) ∗ (e), wobei d = [a1 ∗ · · · ∗ ak ] das Produkt von a1 , . . . , ak mit einer gewissen Klammerung ist und 2 ≤ k ≤ n. Nach Induktionsvoraussetzung dürfen wir dann die Klammerung von d in die Standardklammerung überführen, ohne den Wert zu verändern. Danach besitzt b also die Gestalt b = (a1 ∗ f ) ∗ (e), so dass nach dem Assoziativitätsgesetz b = a1 ∗ (f ∗ (e)) gilt. Damit haben wir diesen Fall auf den Fall (i) zurückgeführt und den Induktionsschritt nachgewiesen. Q.E.D. Ähnlich zeigt man: e) Ist ∗ eine kommutative und assoziative binäre Operation auf einer Menge X, d.h. gilt zusätzlich a ∗ b = b ∗ a für alle a, b ∈ X, so kommt es auch bei mehr als zwei Operanden nicht auf deren Reihenfolge an. Z.B. gilt (a1 ∗ a2 ) ∗ (a3 ∗ a4 ) = a3 ∗ ((a2 ∗ a4 ) ∗ a1 ), etc.. 48 Aufgrund von d) lässt man in der Regel auch in Ausdrücken mit mehr als zwei Operanden sämtliche Klammern weg, falls Assoziativität vorliegt. Dies trifft beispielsweise auf die Addition und die Multiplikation in N zu. (Vorsicht: Es gibt auch nicht-assoziative Operationen in der Mathematik!) 3.2 Rekursion Oftmals werden Funktionen f : N → X rekursiv definiert, d.h. durch Angabe von f (0) sowie einer Vorschrift, die für jedes n ∈ N aus f (0), f (1), . . . , f (n) den Wert f (n+1) zu berechnen gestattet. Dass hierdurch eine eindeutige Funktion f : N → X definiert ist, folgt aus dem Prinzip der vollständigen Induktion, soll hier aber nicht genau formalisiert werden. Beispiele. a) Die Rekursionsvorschrift f (0) := 0, f (1) := 1, f (n + 1) := f (n) + f (n − 1), n ≥ 1, liefert die Folge der Fibonacci-Zahlen 0, 1, 1, 2, 3, 5, 8, 13, 21, 34, 55, . . . . Diese Rekursion wurde übrigens als Modellierung für das Wachstum einer Kaninchenpopulation eingeführt: Beschreibt f (n) die Anzahl der Kaninchen im Jahre n, und nimmt man an, dass jedes Kaninchen nach einem Jahr geschlechtsreif ist und im Schnitt jedes Jahr einen Nachkommen erzeugt, so sind im Jahre n nur die f (n−1) Kaninchen aus der Population des Vorjahres unter den f (n) Kaninchen geschlechtsreif, so dass im Jahre n + 1 die Population um f (n − 1) Kaninchen wächst, d.h. es ist f (n + 1) = f (n) + f (n − 1). Natürlich ist dies ein sehr grobes Modell, welches u.a. die Sterblichkeit ignoriert. b) Ist K ein Körper“, wie beispielsweise Q, R oder C, so werden für festes a ∈ K ” die Potenzen an , n ∈ N, rekursiv definiert durch a0 := 1, an+1 := a · an , n ≥ 0 (auch 00 := 1 !). 49 c) Ist + eine als Addition interpretierte binäre Operation auf einer Menge X (solche sollen Pn stets assoziativ sein), und sind a1 , . . . , an ∈ X, so ist im Grunde k=1 ak = a1 + · · · + an rekursiv definiert mittels der Funktion f : {0, 1, . . . , n} → X, welche durch f (0) := 0, f (k + 1) := f (k) + ak+1 , festgelegt ist, wobei n P k=1 0 P Summe“ 0≤k ≤n−1 ak := f (n) ist. Danach hat insbesondere die leere ” ak den Wert 0 = f (0) (vergleiche dies mit der von uns getroffenen k=1 Konvention!). Q Ähnlich definiert man per Rekursion nk=1 ak , wobei das leere Produkt“ ” 0 Q ak den Wert 1 hat (falls X ein neutrales Einselement 1 besitzt). k=1 Ist die Addition + zusätzlich kommutativ, und ist für jeden Index i einer endlichen P Indexmenge I ein Element ai ∈ X bestimmt, so definiert man allgemeiner ai als die Summe über alle Elemente ai mit i ∈ I. Nach Beispiel i∈I 3.1 e) kommt P es hier auf die Reihenfolge der Summanden nicht an. Per definitionem ist ai := 0. Ist beispielsweise I = {k ∈ N : m ≤ k ≤ n}, so schreibt man auch i∈∅ X ak = k∈I X m≤k≤n Ähnlich definiert man Produkte Q per definitionem ai := 1. Q ak = n X ak . k=m ai über eine endliche Indexmenge I, wobei i∈I i∈∅ d) Die Fakultät, eine Funktion von N → N, wird rekursiv definiert durch 0! := 1, (n + 1)! := n!(n + 1), n ≥ 0; es gilt offenbar n! = n Y k=1 k = 1 · 2 · 3 · · · n, n ≥ 1. n! hat folgende kombinatorische Interpretation: Es gibt genau n! verschiedene Anordnungen der Elemente einer gegebenen n-elementigen Menge A. Für k, n ∈ N mit k ≤ n definiert man den Binomialkoeffizienten n! n . := k!(n − k)! k 50 Mittels vollständiger Induktion beweist man dann folgende Aussagen (Übung): (i) nk ist die Anzahl aller k-elementigen Teilmengen einer n-elementigen Menge. (ii) Für alle reellen Zahlen a, b ∈ R und jedes n ∈ N gilt folgende binomische Formel: n X n k n−k n a b . (3.3) (a + b) = k k=0 3.3 Die axiomatische Methode Mit den Sätzen 3.1 und 3.2 haben wir erste fundamentale Beispiele für die sogenannte axiomatische Methode kennengelernt, welche sich in der Mathematik seit einiger Zeit durchgesetzt hat. Dabei geht man folgendermaßen vor: Gewisse Grundaussagen werden einfach für wahr erklärt, indem man sie als Axiome bezeichnet. Im Rahmen unserer axiomatischen Beschreibung der natürlichen Zahlen waren dies die Axiome (A+ ) bis (P ), sowie (V I). Die Wahrheit weiterer Aussagen wird dadurch festgestellt, dass man sie aus den Axiomen und aus schon als wahr erkannten Aussagen beweist. Die Wahrheit – im Sinne der Mathematik – eines mathematischen Satzes ist daher immer zu verstehen als bezogen auf ein explizit zu nennendes (oder implizit gemeintes) Axiomensystem. Der mathematische Wahrheitsbegriff ist also zunächst vollkommen relativ, da jeder Mathematiker die Freiheit hat, beliebige Axiomensysteme als Ausgangspunkt festzulegen (natürlich sollten diese zumindest irgendwie plausibel sein und sich nicht gegenseitig widersprechen). Die Frage, welches Axiomensystem nach welchen Kriterien auch immer man bevorzugen sollte, ist für manche Mathematiker mehr, für andere weniger interessant. Wer sich vor allem für die Grundlagen der Mathematik interessiert wird z.B. bemüht sein, eine möglichst kleine Anzahl an Axiomen zu suchen, auf welche ein gegebenes Theoriegebäude zurückgeführt werden kann. Im Falle von N etwa kann man tatsächlich mit sehr viel weniger Axiomen auskommen, als wir dies getan haben, nämlich den folgenden Peanoschen Axiomen: Die natürlichen Zahlen N sind eine Menge mit einem Anfang“ ” (P1) 0 ∈ N. Der Zählprozess wird beschrieben durch eine Funktion ν : N → N, genannt Nachfolgefunktion, mit den Eigenschaften (P2) 0 6∈ ν(N) ( 0 ist kein Nachfolger“) ” (P3) ν : N → N ist injektiv. (P4) Ist A ⊂ N, und ist 0 ∈ A und ν(A) ⊂ A, so ist A = N. Die Existenz einer Menge N mit diesen Eigenschaften (P1)-(P4) lässt sich nicht beweisen, sondern wird als Axiom postuliert. 51 In unserer üblichen Vorstellung von N ist natürlich ν gegeben durch ν(n) = n + 1. Nach Peano definiert man daher die natürlichen Zahlen durch 1 := ν(0), 2 := ν(1), 3 := ν(2), . . . Die Eigenschaft (P4) ist übrigens äquivalent zum Prinzip der vollständigen Induktion. Nach John von Neumann (1903– 1957), einem der bedeutendsten Mathematiker des letzten Jahrhunderts, kann man ein Modell für N sogar auf den Mengenbegriff zurückführen, indem man die Zahlen folgendermaßen als Mengen definiert: 0 := ∅, 1 := {∅}, 2 := {∅, {∅}}, 3 := {∅, {∅}, {∅, {∅}}}, . . . , mit Nachfolgefunktion ν(n) := n ∪ {n} . Pikanterweise wird bei diesem Zugang der ganze Reichtum der Phänomene der Zahlenwelt auf ein einziges mathematisches Objekt zurückgeführt, und bei diesem Objekt handelt es sich auch noch um die leere Menge. Für die meisten Bereiche der Mathematik ist ein solches minimalistisches“ Vorgehen ” jedoch äußerst unpraktisch. Dies war einer der Gründe, weshalb wir anstelle der Peanoschen Axiome die erheblich praxisnäheren“ Eigenschaften (A+ ) − (P ) sowie ” (V I) postuliert haben. 52 Kapitel 4 Die reellen Zahlen Um die reellen Zahlen axiomatisch einzuführen, benötigen wir zwei weitere fundamentale Begriffe der Mathematik, nämlich den des Körpers sowie den der Ordnungsrelation. 4.1 Körper Definition. Unter einem Körper versteht man eine Menge K, versehen mit zwei binären Operationen + : K × K → K, der Addition, und · : K × K → K, der Multiplikation, so dass für alle x, y, z ∈ K gilt: (A+ ) (K + ) (x + y) + z = x + (y + z), x + y = y + x, (A· ) (x · y) · z = x · (y · z) (Assoziativität) (K · ) x · y = y · x (Kommutativität) Es existieren Elemente 0, 1 ∈ K, 0 6= 1, so dass (N) (AI) (MI) (D) x + 0 = x, (E) x · 1 = x ( Nullelement und Einselement) ∀x ∈ K ∃y ∈ K mit x + y = 0, (additives Inverses) ∀x ∈ K, x 6= 0 ∃z ∈ K mit x · z = 1, (multiplikatives Inverses) x · (y + z) = x · y + x · z (Distributivgesetz) Diese Regeln sind uns von der Schule für die Zahlbereiche Q und R vertraut. In der Algebra wird gezeigt, dass in einem Körper das Nulllement 0 und das Einselement 1 eindeutig sind, und dass es zu jedem x ∈ K genau ein additives Inverses gibt, welches mit −x bezeichnet wird, und zu jedem x 6= 0 genau ein multiplikatives Inverses, welches mit x−1 bezeichnet wird (s. auch [F]). Exemplarisch zeige ich hier nur: Es gibt genau ein Nullelement bzgl. der Addition in K. Beweis. Sei 0′ ein weiteres Element mit a + 0′ = a für alle a ∈ K. Dann gilt insbesondere 0 + 0′ = 0. Andererseits ist nach (K + ) 0 + 0′ = 0′ + 0, also nach (N) 0 + 0′ = 0′ . Es folgt insgesamt 0 = 0′ . 53 Q.E.D. Wir verwenden Subtraktion und Division in K, indem wir definieren x − y := x + (−y), x := xy −1 (falls y 6= 0) . y Aus den Eigenschaften (A+ ) − (D) folgen unmittelbar die üblichen“ Rechenregeln ” für x, y ∈ K: (4.1) (4.2) −(−x) = x, x · 0 = 0, (−x)y = −(xy), −(x + y) = −x − y, (−x)(−y) = xy , (x−1 )−1 = x, (xy)−1 = x−1 y −1, falls x, y ∈ K \ {0}, (4.3) xy = 0 ⇔ x = 0 oder y = 0 . Anstelle von x · y schreibt man, wie hier bereits praktiziert, oft kürzer xy. Beispielhaft möchte ich einmal die Identität in der zweiten Zeile von (4.1) beweisen, wobei ich annehme, dass die Identitäten in der ersten Zeile bereits nachgewiesen sind: Aus 0 = (−x) · 0 = (−x)(−y + y) folgt mit dem Distributivgesetz 0 = (−x)(−y) + (−x)y = (−x)(−y) − xy. Addiert man xy zu beiden Seiten der Gleichung, so folgt (−x)(−y) = xy. Für alle a, b ∈ K ist x := b − a die eindeutige Lösung der Gleichung a + x = b, und y := b/a die eindeutige Lösung der Gleichung a · y = b, falls a 6= 0. Aus den Assoziativgesetzen (A+ ), (A· ) folgt gemäß der Bemerkung in Beispiel 3.1 d) die Unabhängigkeit von der Klammerung bei endlichen Summen und Produkten und damit die Wohldefiniertheit von n X k=m xk , n Y k=m xk , xk ∈ K, m ≤ k ≤ n. Aus den Kommutativgesetzen (K + ), (K · ) folgt nach Beispiel 3.1 e) die Unabhängigkeit von der Reihenfolge bei endlichen Summen und Produkten. Dies wird formuliert durch den Begriff der Permutation. Unter einer Permutation einer Menge M versteht man eine bijektive Abbildung σ : M → M von M auf sich. Ist insbesondere M die endliche Menge {1, . . . , n}, so beschreibt σ offenbar eine Umordnung der Reihenfolge. Man kann σ dann in der Form (i1 , . . . , in ) mit ik := σ(k) 54 aufschreiben. Es gilt dann für x1 , . . . , xn ∈ K : n X (4.4) xk = k=1 n X xik , k=1 n Y xk = k=1 n Y xik . k=1 Aus (4.4) folgt als Spezialfall die Vertauschbarkeit der Summen- und Produktzeichen bei Doppelsummen und -produkten: n X m X (4.5) xij = i=1 j=1 m X n X xij , j=1 i=1 n Y m Y xij = i=1 j=1 m Y n Y xij , j=1 i=1 falls xij ∈ K für i = 1, . . . , n, j = 1, . . . , m. Das Distributivgesetz für endliche Summen lautet ! ! n m n X m X X X (4.6) xi · xi yj . yj = i=1 j=1 i=1 j=1 All diese Formeln werden mit vollständiger Induktion bewiesen. Wir definieren ganzzahlige Potenzen rekursiv durch x0 := 1, xn := x · xn−1 = x · · x}, n ≥ 1, x ∈ K, | ·{z n-mal −n −1 n x := (x ) , n ∈ N, x ∈ K \ {0} . Aus den Eigenschaften der Multiplikation folgt dann für alle x, y ∈ K und n, m ∈ Z (bei negativen Exponenten wird natürlich x 6= 0 bzw. y 6= 0 verlangt): xn xm = xn+m , (xn )m = xnm , xn y n = (xy)n . (4.7) 4.2 Angeordnete Körper Definition. Unter einer Ordnungsrelation oder kurz Ordnung auf einer nichtleeren Menge X versteht man eine Relation R ⊂ X × X auf X mit folgenden Eigenschaften: Schreibt man x ≤ y anstelle von (x, y) ∈ R, so gelten die Eigenschaften (R), (T) und (I) aus Kapitel 3, d.h. für alle x, y, z ∈ X gilt: (R) x ≤ x (T) x ≤ y und y ≤ z ⇒ x ≤ z (I) x ≤ y und y ≤ x ⇒ x = y (Reflexivität) (Transitivität) (Identitivität) Beispiele. a) Die natürliche Ordnung ≤ auf N. 55 b) Auf der Potenzmenge P(M) einer Menge M wird durch A ≤ B, falls A ⊂ B, (A, B ⊂ M), eine Ordnung definiert. c) Die lexikographische Ordnung auf der Menge aller Wörter einer gegebenen Sprache, wie sie z.B. in Wörterbüchern oder Telefonbüchern verwendet wird. Ist x ≤ y und x 6= y, so schreibt man x < y (oder auch y > x) ( x ist echt kleiner ” als y“, bzw. y ist echt größer als x“). Anstelle von x ≤ y ( x kleiner gleich y“) ” ” schreibt man auch y ≥ x ( y größer gleich x“). Die Ordnung ≤ auf X heiße lineare ” oder totale Ordnung, falls zusätzlich (V) gilt, d.h. wenn für alle x, y ∈ X gilt: (V) x ≤ y oder y ≤ x (Vergleichbarkeit aller Elemente). Die natürliche Ordnung auf N aus Beispiel a) ist total, die aus Beispiel b) auf P(M) nicht, falls M mindestens 2 Elemente enthält. Ist nämlich z.B. M = {1, 2}, so sind die Mengen {1} und {2} nicht vergleichbar in P({1, 2}). Die lexikographische Ordnung aus Beispiel c) ist wiederum total, und dies sollte sie besser auch sein, denn sonst wäre sie für das Aufsuchen eines Wortes in einem Lexikon wenig hilfreich! Im Falle einer totalen Ordnung auf X gilt für alle x, y ∈ X genau eine der drei Beziehungen, x < y, x = y oder x > y . Definition. Unter einem angeordneten Körper versteht man einen Körper K, versehen mit einer totalen Ordnung ≤ so, dass zusätzlich Ordnung und algebraische Struktur von K verträglich sind in folgendem Sinne: Für alle x, y, z ∈ K gilt (M+ ) (M· ) x≤y ⇒ x+z ≤y+z x ≤ y und z ≥ 0 ⇒ xz ≤ yz (Monotonie der Addition) (Monotonie der Multiplikation) Dann gilt offenbar: (4.8) x≤y ⇔ insbesondere ist x ≥ 0 y − x ≥ 0 ⇔ −y ≤ −x ; genau dann, wenn − x ≤ 0 . Beweis: Ist x ≤ y, so gilt mit z := −x nach (M+ ) x − x ≤ y − x, also 0 ≤ y − x, und analog folgt aus y − x ≥ 0 wieder y ≥ x. Die zweite Äquivalenz folgt aus der ersten, indem man x durch −y und y durch −x ersetzt. Q.E.D. Ähnlich kann man beweisen, dass in einem angeordneten Körper K all die üblichen Rechenregeln“ gelten, wie wir sie von der Schule für Q oder R gewohnt sind. Ich ” will dies für die folgenden Regeln exemplarisch nachweisen. Lemma 4.1 Sei K ein angeordneter Körper, und seien x, y ∈ K. Dann gilt: 56 a) x ≥ 0 und y ≥ 0 ⇒ x + y ≥ 0, b) x > 0 und y ≥ 0 ⇒ x + y > 0, c) x2 ≥ 0; insbesondere ist 1 > 0. Beweis. Zu a) Aus x ≥ 0 folgt nach (M + ) x + y ≥ 0 + y = y. Ist zusätzlich y ≥ 0, so folgt mit (T ) x + y ≥ 0. Zu b) Nach a) folgt aus x > 0 und y ≥ 0 zumindest x+y ≥ 0. Wäre nun x+y = 0, so wäre y = −x, und wegen y ≥ 0 nach (4.8) x = −y ≤ 0. Dies stünde im Widerspruch zu unserer Annahme x > 0. Zu c) Es gilt nach (V) stets x ≥ 0 oder x ≤ 0. (i) Ist x ≥ 0, so gilt nach (M· ) x2 = x · x ≥ 0. (ii) Ist x ≤ 0, so ist −x ≥ 0, also nach (i) (−x)2 ≥ 0, und somit x2 = (−x)2 ≥ 0. Insbesondere ist 1 = 12 ≥ 0, und wegen 1 6= 0 ist 1 > 0. Q.E.D. 4.3 Der Absolutbetrag In jedem angeordneten Körper K, wie beispielsweise Q oder R, können wir den absoluten Betrag |x| und das Signum sgn x eines Elementes x definieren durch x, x > 0 1, x > 0 0, x = 0 , 0, x = 0 . |x| := sgn x := −x, x < 0 −1, x < 0 Hierfür gelten folgende Regeln: sind x, y, a Elemente des Körpers, so ist (a) x = |x| sgn x, |x| = | − x|, (b) |x · y| = |x| · |y|, (c) |x| ≥ 0, sgn (x · y) = sgn x · sgn y, und |x| = 0 ⇔ x = 0, (d) Für beliebiges ε ≥ 0 gilt (4.9) |x| ≤ ε ⇔ −ε ≤ x ≤ ε, bzw. allgemeiner (4.10) (e) |x + y| ≤ |x| + |y| |x − a| ≤ ε ⇔ a − ε ≤ x ≤ a + ε, (Dreiecksungleichung) 57 (f) |x + y| ≥ |x| − |y| (inverse Dreiecksungleichung). Beweis. Wir beweisen nur (e), (f) und setzen bereits (a) – (d) voraus. Ist x + y ≥ 0, so gilt |x + y| = x + y ≤ |x| + |y|, denn es ist z ≤ |z| für alle z. Ist aber x + y < 0, so ist (−x) + (−y) = −(x + y) > 0, und wir erhalten aufgrund des bereits Bewiesenen und (a) |x + y| = |(−x) + (−y)| ≤ | − x| + | − y| = |x| + |y|. Damit ist (e) gezeigt. Da nach (e) und (a) |x| = |(x + y) + (−y)| ≤ |x + y| + | − y| = |x + y| + |y|, so ist |x| − |y| ≤ |x + y|. Vertauscht man hier x und y, so ist auch |y| − |x| ≤ |x + y|, d.h. −|x + y| ≤ |x| − |y| ≤ |x + y|. Mit (d) folgert man, dass |x| − |y| ≤ |x + y|, womit auch (f) bewiesen ist. Die Beweise von (a) - (d) seien als Übungsaufgabe überlassen. Q.E.D. 4.4 Schranken Definition. Sei X eine durch ≤ geordnete Menge, und sei A ⊂ X. Ein Element s ∈ X heiße eine • obere Schranke für A, wenn a ≤ s für alle a ∈ A. • untere Schranke für A, wenn s ≤ a für alle a ∈ A. A heiße nach oben (unten) beschränkt, falls es eine obere (untere) Schranke für A gibt. Ein Element z ∈ X heiße • kleinste obere Schranke oder Supremum von A, wenn z eine obere Schranke für A ist, und wenn für jede obere Schranke s von A gilt: z ≤ s. • größte untere Schranke oder Infimum von A, wenn z eine untere Schranke für A ist, und wenn für jede untere Schranke s von A gilt: z ≥ s. 58 Falls existent, so sind Supremum bzw. Infimum von A eindeutig. Sind nämlich z.B. z und z ′ Suprema von A, so gilt z ′ ≤ z und z ≤ z ′ , also z = z ′ . Man spricht daher auch von dem Supremum von A, und bezeichnet es mit dem Symbol sup A . Analog bezeichnet man das Infimum von A, falls existent, mit inf A . • Ein Element M ∈ A heißt das Maximum (oder größtes Element) von A, wenn gilt: a ≤ M ∀a ∈ A. Da M in A liegt, gilt dann für jede obere Schranke s von A die Ungleichung M ≤ s, d.h. M ist auch das Supremum von A. Insbesondere ist das Maximum eindeutig. Man bezeichnet es mit dem Symbol max A. Falls das Maximum existiert, so stimmt es also mit dem Supremum überein: sup A = max A, falls max A existiert. • m ∈ A heißt das Minimum (oder kleinstes Element) von A, wenn gilt: m ≤ a ∀a ∈ A. Analog wie beim Maximum ist das Minimum eindeutig, und man bezeichnet es mit dem Symbol min A. Falls das Minimum existiert, so stimmt es mit dem Infimum überein: inf A = min A, falls min A existiert. Das Maximum bzw. Minimum einer Menge A existiert nicht immer: z.B. ist für die Teilmenge A := {{1}, {2}} der Potenzmenge X := P({1, 2}) offenbar sup A = {1, 2}, aber diese Menge liegt nicht in A. Die Ordnung ≤ auf X wird als Wohlordnung bezeichnet und X als wohlgeordnet, falls jede nichtleere Teilmenge A ⊂ X von X ein kleinstes Element besitzt, d.h. wenn min A stets existiert. Z.B. ist N mit der natürlichen Ordnung wohlgeordnet (vergl. Satz 3.1). Sei nun K ein angeordneter Körper, und sei A ⊂ K eine nichtleere Teilmenge von K. Der folgende Satz liefert nützliche Kriterien um zu prüfen, ob eine Schranke für A das Supremum bzw. Infimum ist: 59 Satz 4.2 (Test auf Supremum bzw. Infimum) Sei z ∈ K eine obere (bzw. untere) Schranke für A. Dann sind die folgenden Aussagen äquivalent: (i) z ist das Supremum (bzw. Infimum) von A, d.h. z = sup A (bzw. z = inf A). (ii) Zu jedem y ∈ K mit y < z (bzw. y > z) gibt es ein a ∈ A mit a > y (bzw. a < y). (iii) Zu jedem ε > 0 in K existiert ein a ∈ A mit a > z − ε (bzw. a < z + ε). Beweis. Wir beweisen die Aussagen zum Supremum – der Beweis der Aussagen über das Infimum wird analog geführt. Sei also z ∈ K eine obere Schranke für A. Es genügt, die Äquivalenz von (i) und (ii) zu beweisen. Es gilt nämlich y < z dann und nur dann, wenn sich y schreiben lässt als y = z − ε mit ε > 0. Somit sind (ii) und (iii) offenkundig äquivalent. Per definitionem ist z = sup A genau dann, wenn für jedes y ∈ K gilt: ist y eine obere Schranke für A, so ist y ≥ z. Nach dem Kontrapositionsprinzip ist dies ist gleichbedeutend zu folgender Eigenschaft: Für jedes y ∈ K gilt: ist y < z, so ist y keine obere Schranke für A. Aufgrund der Definition des Begriffs der oberen Schranke ist jedoch y keine obere Schranke für A dann und nur dann, wenn es ein a ∈ A gibt mit a > y. Damit ist die Äquivalenz von (i) und (ii) nachgewiesen. Q.E.D. Beispiele. a) Betrachte das halboffene Intervall A := [0, 1[:= {x ∈ K : 0 ≤ x < 1}. Dann gilt inf A = min A = 0 und sup A = 1, wobei max A nicht existiert, denn: Da 0 in A liegt und da x ≥ 0 ist für alle x ∈ K, ist per definitionem 0 das kleinste Element von A, d.h. min A = 0, und damit existiert auch inf A = min A = 0. Ferner ist 1 eine obere Schranke für A, da ja x ≤ 1 gilt für alle x ∈ A. Sei nun y ∈ K mit y < 1. Wir zeigen, dass dann ein a ∈ A existiert mit a > y. Ist nämlich y < 0, so können wir dazu a := 0 wählen, und ist y ≥ 0, so ist y ∈ A, und wir können a := (y + 1)/2 wählen. Für dieses a gilt nämlich offenbar 0≤y<a= y+1 < 1, 2 so dass insbesondere a ∈ A ist. Nach dem Kriterium (ii) in Satz 4.2 ist somit sup A = 1. Da jedoch 1 ∈ / A, ist 1 kein Maximum von A. 60 b) Jede endliche Teilmenge A = {a1 , a2 , . . . , an } ⊂ K hat ein Maximum und ein Minimum, denn: durch Umordnen der Elemente und etwaiges Umbenennen kann man erreichen, dass a1 ≤ a2 ≤ · · · ≤ an ist. Dann ist aber a1 = min A, an = max A. c) Ist P(M) durch die Mengeninklusion geordnet, und ist A ⊂ P(M), so ist [ sup A = N =: S ∈ P(M) , N ∈A denn es ist N ⊂ S für jedes N ∈ A, so dass S ∈ P(M) eine obere Schranke für A ist, und ist umgekehrt T ∈ P(M) eine beliebige S obere Schranke für A, d.h. gilt N ⊂ T für jedes N ∈ A, so gilt auch S = N ∈A N ⊂ T, d.h. S ist die kleinste obere Schranke für A. . 4.5 Der Körper R Definition. Ein geordneter Körper K heiße ordnungsvollständig, wenn folgendes Supremumsaxiom “ erfüllt ist: ” (OV) Jede nichtleere nach oben beschränkte Teilmenge A ⊂ K besitzt eine kleinste obere Schranke sup A ∈ K. Axiomatisch können wir den Körper R der reellen Zahlen nun wie folgt beschreiben: (R) R ist ein ordnungsvollständiger angeordneter Körper. Genauer kann man zeigen: Es gibt einen Körper R mit der Eigenschaft (R), und dieser ist eindeutig bis auf Isomorphie“, (d.h. zwischen je zwei solcher Körper gibt ” es eine Bijektion, welche sowohl die algebraische als auch die Ordnungsstruktur überträgt“). Hierauf soll hier aber nicht näher eingegangen werden. ” Einbettung von N, Z und Q in R Die Bedingungen in (R) implizieren automatisch, dass R den Körper Q der rationalen Zahlen enthalten muss . Betrachte dazu die Abbildung 0 7→ 0R , ι : N → R, n 7→ nR := 1R + · · · + 1R , falls n ≥ 1 . | {z } n−mal wobei 0R und 1R vorübergehend die Null und die Eins in R bezeichnen. 61 Man folgert aus 0R < 1R dann leicht per Induktion, dass für alle n ∈ N, nR < (n + 1)R so dass diese Abbildung ι injektiv ist, und dass durch ι die Addition, die Multiplikation und die Ordnungsstruktur von N und R respektiert werden, was es uns gestattet, die natürlichen Zahlen N als Teilmenge (nämlich ι(N)) von R aufzufassen. Anders formuliert: Die Teilmenge ι(N) von R aller Zahlen der Form nR mit n ∈ N erfüllt alle Axiome, die wir von den natürlichen Zahlen postuliert hatten, so dass wir fortan mit dieser Menge als Menge der natürlichen Zahlen arbeiten können und unsere ursprüngliche Menge N vergessen dürfen. In diesem Sinne ist dann N ⊂ R (man sagt auch, dass wir N mit der Menge ι(N) identifiziert“ haben, indem wir n ∈ N mit nR identifiziert haben). Man schreibt ” dann unter leichtem Mißbrauch der Notation wieder n anstelle von nR . Damit liegen aufgrund der Körperaxiome dann auch Z und Q in R. Definition. Ein angeordneter Körper K heiße archimedisch geordnet, wenn gilt: (AR) Für alle x > 0, y ≥ 0 gibt es ein n ∈ N mit nx > y. Hierbei steht nx für das Element n P x=( k=1 n P 1)x, wobei hier 1 das Einselement des k=1 Körpers K bezeichne. Es ist leicht zu zeigen, dass der Köper Q der rationalen Zahlen archimedisch geordnet ist (Übung). Es gibt allerdings auch angeordnete Körper, welche nicht archimedisch geordnet sind (siehe Abschnitt 11.4 von Anhang A, Kapitel 11). Unsere Axiome für den Körper R implizieren jedoch, dass auch der Köper der reellen Zahlen archimedisch geordnet ist: Satz 4.3 R ist archimedisch geordnet. Beweis: Seien x, y ∈ R, x > 0, y ≥ 0, und setze A := {nx : n ∈ N}. Wäre A nach oben beschränkt, so existierte s = sup A ∈ R, und es wäre nx ≤ s für alle n ∈ N. Dann wäre auch (n + 1)x ≤ s, d.h. nx ≤ s − x für alle n ∈ N, und somit wäre auch s − x eine obere Schranke von A. Folglich wäre s ≤ s − x, d.h. x ≤ 0, ein Widerspruch. Somit kann y keine obere Schranke von A sein, d.h. es gibt ein n ∈ N mit nx > y. Q.E.D. Für Teilmengen A ⊂ R vereinbaren wir sup A := +∞, falls A nicht nach oben beschränkt ist , sup ∅ := −∞ . 62 Dabei stehen ±∞ für neue Objekte, ± Unendlich“genannt. Wir erweitern die ” Ordnung auf R zu einer Ordnung auf R ∪ {−∞, +∞}, indem wir verlangen, dass −∞ ≤ x ≤ +∞ für alle x ∈ R. Anstelle von +∞ schreiben wir auch ∞. Damit existiert für jede Teilmenge das Supremum sup A ∈ R∪{−∞, +∞} in diesem verallgemeinerten Sinne, wobei sup A allerdings endlich ist (d.h. in R liegt) dann und nur dann, wenn A nach oben beschränkt ist! Achtung: −∞ und +∞ sind keine reellen Zahlen! Für nichtleere Teilmengen A, B ⊂ R folgt aus A ⊂ B stets sup A ≤ sup B. Unsere Setzung von sup ∅ stellt sicher, dass dies auch noch für A = ∅ gültig bleibt. Entsprechend sei inf A := −∞ , inf ∅ := +∞ . falls A nicht nach unten beschränkt ist, Für x ∈ R, A ⊂ R sei xA ⊂ R definiert durch xA := {xa : a ∈ A} . Für x = −1 schreiben wir auch −A statt (−1)A. Weiter vereinbaren wir −(+∞) := −∞, −(−∞) := +∞ . Satz 4.4 Sei A ⊂ R. Dann gilt inf A = − sup(−A) . (4.11) Beweis. Für A = ∅ ist dies klar. Sei nun A 6= ∅. Sei x ∈ R. Wir behaupten: (4.12) x ist untere Schranke von A ⇔ −x ist obere Schranke von − A . In der Tat gilt ∀a ∈ A : x ≤ a ⇔ ∀a ∈ A : −x ≥ −a ⇔ ∀b ∈ −A : −x ≥ b . Wegen (4.12) ist A nach unten beschränkt genau dann, wenn −A nach oben beschränkt ist. Falls A nicht nach unten beschränkt ist, steht also −∞ auf beiden Seiten von (4.11). Andernfalls existiert s := sup(−A) ∈ R, und wegen (4.12) ist dann −s eine untere Schranke von A. Ist x eine beliebige untere Schranke von A, so ist nach (4.12) s ≤ −x, also x ≤ −s. Damit ist −s = inf A, und es folgt (4.11). Q.E.D. 63 Es ist sinnvoll, auch für Teilmengen A, B ⊂ R deren Summe und Produkt wie folgt zu definieren: A + B := {a + b : a ∈ A, b ∈ B} , AB = A · B := {ab : a ∈ A, b ∈ B} . Im Folgenden wollen wir in R rechnen wie gewohnt, dabei aber letztlich nur von (R) Gebrauch machen. Wir merken noch in Analogie zu Satz 4.2 folgende Tatsache über sup A und inf A an, von der wir frei Gebrauch machen werden. Satz 4.5 Ist A ⊂ R, A 6= ∅ und x < sup A, so gibt es ein a ∈ A mit a > x, und zwar auch im Falle sup A = ∞. Ist x > inf A, so gibt es ein a ∈ A mit a < x, und zwar auch im Falle inf A = −∞. Beweis. Wir betrachten nur die Behauptung bzgl. sup A. Gibt es in A kein Element a mit a > x, so ist a ≤ x für alle a ∈ A, d.h. x ist eine obere Schranke von A. Damit ist sup A ∈ R, und mithin sup A ≤ x. Die Behauptung folgt also per Widerspruch (genauer: Kontraposition). Q.E.D. 4.6 Intervalle Definitionen. Ein Intervall in R ist eine nichtleere Teilmenge I ⊂ R, die mit je zwei Zahlen auch alle dazwischenliegenden Zahlen enthält, d.h. für die gilt: (4.13) ∀x1 , x2 ∈ I ∀y ∈ R : x1 < y < x2 ⇒ y ∈ I. Jedes Intervall I besitzt einen linken Endpunkt, inf I, und einen rechten Endpunkt, sup I (welche nicht notwendig in I liegen müssen und auch die Werte ±∞ annehmen können). I heiße endlich, falls I beschränkt ist, d.h. nach oben und nach unten beschränkt ist. Satz 4.6 Es seien I ⊂ R ein Intervall, und α := inf I ≥ −∞, β := sup I ≤ ∞ die Endpunkte von I. Sind α, β ∈ R, so ist I eine der vier folgenden Mengen: [α, β] [α, β[ ]α, β] ]α, β[ := := := := {x ∈ R : {x ∈ R : {x ∈ R : {x ∈ R : 64 α ≤ x ≤ β}, α ≤ x < β}, α < x ≤ β}, α < x < β}. Ist α ∈ R, β = ∞, so ist I eine der Mengen [α, ∞[ := {x ∈ R : α ≤ x} oder ]α, ∞[ := {x ∈ R : α < x}, und ist α = −∞, β ∈ R, so ist I eine der Mengen ] − ∞, β] := {x ∈ R : x ≤ β} oder ] − ∞, β[ := {x ∈ R : x < β}. Im Falle α = −∞, β = ∞ schließlich ist I =] − ∞, ∞[:= R. Beweis. Wir betrachten nur den Fall α, β ∈ R; die übrigen Fälle werden ähnlich behandelt. Es genügt dann offenbar, die folgenden Inklusionen zu beweisen: ]α, β[⊂ I ⊂ [α, β]. Die rechte Inklusion ist trivial, da α und β untere bzw. obere Schranken von I sind. Für die linke Inklusion betrachten wir ein beliebiges y ∈]α, β[, es ist also α < y < β. Nach Satz 4.5 gibt es dann Punkte x1 , x2 ∈ I mit x1 < y und x2 > y. Hieraus folgt nach (4.13) aber y ∈ I. Q.E.D. Alle endlichen Intervalle I mit denselben Endpunkten α und β besitzen dieselbe Länge |I| := β − α (≥ 0). Das Intervall I heiße abgeschlossen, wenn es alle im Endlichen gelegenen Endpunkte enthält, offen, wenn es diese Endpunkte nicht enthält. Hiernach sind alle Intervalle der Form [α, β] abgeschlossen, die Intervalle der Form ]α, β[ stets offen. Die Intervalle der Form [α, β[ und ]α, β] heißen halboffen, falls sie beschränkt sind. Für die offene und abgeschlossene positive Halbachse benutzen wir im allgemeinen die folgenden Bezeichnungen: ]0, ∞[=: R+ , [0, ∞[=: R+ 0. Ferner bezeichnet man die Menge R := R ∪ {−∞, ∞} als die erweiterte Zahlengerade. Beachte, dass ±∞ nicht in R liegen! 4.7 Das Intervallschachtelungsprinzip Satz 4.7 (Intervallschachtelungsprinzip) Es sei (In )n∈N = I0 ⊃ I1 ⊃ I2 ⊃ · · · ⊃ In ⊃ In+1 ⊃ · · · eine Folge ineinander geschachtelter abgeschlossener beschränkter Intervalle In = [αn , βn ] ⊂ R. Dann enthalten die Intervalle In mindestens einen gemeinsamen Punkt, d.h. ∞ \ In 6= ∅. n=0 Strebt zusätzlich die Länge dieser Intervalle gegen 0, d.h. gibt es zu jedem ε > 0 ∞ T einen Index n(ε) ≥ 1 so, dass für alle n ≥ n(ε) gilt |In | < ε, so besteht In aus n=0 genau einem Punkt. 65 Beweis. Es sei A = {αn : n ∈ N} die Menge der linken Endpunkte der Intervalle In , B = {βn : n ∈ N} die Menge der rechten Endpunkte. Aufgrund der Inklusion In+1 ⊂ In gilt stets αn ≤ αn+1 ≤ βn+1 ≤ βn , woraus man per vollständiger Induktion nach m folgert: Ist m ≥ n, so gilt αn ≤ αm ≤ βm ≤ βn . Insbesondere ist also a ≤ b für alle a ∈ A, b ∈ B. Es sei dann x := sup A. Dann ist x ∈ R, und es gilt a ≤ x ≤ b für alle a ∈ A, b ∈ B. Insbesondere gilt αn ≤ x ≤ βn für alle n ∈ N, und somit x ∈ In für alle n ∈ N. Strebt die Länge dieser Intervalle gegen 0, so zeigen wir durch Widerspruch, dass es ∞ T nur einen einzigen Punkt in In gibt: Angenommen, es seien x < y zwei verschien=0 dene Punkte in dieser Menge. Dann sei ε := y − x > 0 deren Abstand. Für n = n(ε) gilt dann offenbar x, y ∈ In , d.h. ε = y − x ≤ βn − αn = |In |, im Widerspruch zu unserer Annahme, dass |In | < ε. Q.E.D. Wir bemerken, dass das Intervallschachtelungsprinzip i.a. für nicht-abgeschlossene oder unbeschränkte Intervalle falsch ist. Beispielsweise gilt (4.14) ∞ \ n=0 [n, ∞[= ∅, ∞ \ 1 ]0, [= ∅, n n=1 denn aufgrund der archimedischen Anordnung von R (Satz 4.3) gibt es zu jedem x ≥ 0 ein n ∈ N mit n = n · 1 > x, so dass x 6∈ [n, ∞[, und ist weiter x > 0, so gibt es ein m ∈ N mit mx > 1, d.h. x > m1 , so dass x 6∈ ]0, m1 [. Dagegen ist natürlich ∞ \ 1 [0, ] = {0}. n n=1 Es ist in der Tat sogar möglich, eine äquivalente Beschreibung von R durch das Intervallschachtelungsprinzip zu geben; dies kommt dem Zugang in der Schulmathematik vielleicht am nächsten: Bemerkungen 4.8 (a) Definiert man in einem beliebigen angeordneten Körper K Summen und Produkte von Teilmengen sowie Intervalle ähnlich wie in R, so kann man zeigen, dass Summen und Produkte abgeschlossener beschränkter Intervalle ebenso abgeschlossene beschränkte Intervalle sind (Übung). (b) Ist K ein archimedisch angeordneter Körper, in dem das Intervallschachtelungsprinzip aus Satz 4.7 gilt, so ist er ordnungsvollständig, also ( isomorph“ ” zu) R (Übung). Eine der vielen möglichen Konstruktionen des Körpers R besteht daher darin, die Menge R aller Intervallschachtelungen (In )n abgeschlossener beschränkter Intervalle In im Köper Q der rationalen Zahlen zu betrachten, deren Längen |In | im 66 Körper Q gegen 0 streben, und auf dieser Menge eine Äquivalenzrelation ∼ einzuführen (siehe Kapitel 11), indem man zwei solche Intervallschachtelungen (In )n und (Jn )n als äquivalent bezeichnet, wenn die Folge der Durchschnitte (In ∩ Jn )n ebenso in der Menge R liegt. Anschaulich bedeutet dies nämlich gerade, dass die beiden Intervallschachtelungen denselben Punkt einschachteln. Auf R kann man leicht eine Addition und eine Multiplikation wie folgt einführen: (In )n + (Jn )n := (In + Jn )n ; (In )n · (Jn )n := (In · Jn )n . Ferner schreiben wir (In )n < (Jn )n , falls ein n0 ∈ N existiert so, dass für alle n ≥ n0 gilt In < Jn in dem Sinne, dass βn < an ist, falls In = [αn , βn ] und Jn = [an , bn ]. Man kann dann zeigen (siehe Kapitel 11), dass sich diese Strukturen auf den Quotienten K = R/ ∼ von R nach dieser Äquivalenzrelation vererben “, und dass ” K dadurch auf natürliche Weise zu einem angeordneten Körper wird, welcher ordnungsvollständig ist (also ein Modell für den Körper R der reellen Zahlen ist). Diese Konstruktion des Körpers R kommt der Beschreibung der reellen Zahlen durch ihre Dezimalbruchentwicklung vermutlich am nächsten. Dabei wird ja einem gegebenen Punkt auf einer gedachten Zahlengeraden” , sagen wir der Einfachheit halber ” im Intervall [0, 1], eine unendliche Folge von Intervallen In der Länge 10−n zugeordnet, indem man das Startintervall der Länge 1 immer wieder in 10 gleichlange Teilintervalle zerlegt und schaut, in welchem dieser Teilintervalle der Punkt jeweils liegt. Man beachte auch, dass die Wahl eines anderen b-adischen Systems, z.B. des Dualsystems, zu einer jeweils anderen Folge geschachtelter Intervalle führt, welche dennoch dieselbe reelle Zahl beschreiben soll. Dies begründet die Einführung der Äquivalenzrelation ∼ auf R. Leopold Kronecker (1823 –1891): Die ganzen Zahlen hat der liebe Gott gemacht, ” alles andere ist Menschenwerk.“ 67 Kapitel 5 Folgen, Grenzwerte, Unendliche Reihen Definitionen. a) Sei X eine beliebige Menge. Eine Folge in X ist eine Abbildung f : N → X. Da f für jedes n ∈ N einen Punkt xn = f (n) ∈ X festlegt, spricht man dann meist von der Folge (xn )n∈N , (xn )n oder noch kürzer (xn ) anstatt von der “Folge f ”, oder auch von der “Folge xn := f (n)” oder (x0 , x1 , x2 , x3 , x4 , . . . ) bzw. kürzer x0 , x1 , x2 , x3 , x4 , . . . . b) Sind X, Y nichtleere Mengen, so bezeichne X Y die Menge aller Abbildungen f : Y → X. Eine Folge in X ist dann also gerade ein Element von X N . Beispielsweise nimmt die Folge xn := (−1)n nur die Werte 1 und −1 an. In Satz 4.7 haben wir Folgen von Intervallen betrachtet. Beachte: Wir haben hier Folgen, wie z.B. auch in [F], durch die Indices n ∈ N parametrisiert”; dies macht durchaus Sinn, wie wir sehen werden. Gelegentlich ” ist es auch nützlich, Folgen x1 , x2 , x3 , . . . mit Indexbereich N≥1 anstelle von N zu betrachten, oder auch allgemeiner mit Indexbereich Nn≥m . Im Folgenden werden wir meist reelle Folgen betrachten, d.h. Folgen in R. Dazu gehören beispielsweise (a) (xn )n mit xn := a, d.h. die Folge (a, a, a, a, . . . ), (b) (xn )n∈N≥1 mit xn := n1 , d.h. die Folge (1, 12 , 31 , 41 , 51 , . . . ), (c) (xn )n mit xn := (−1)n , d.h. die Folge (1, −1, 1, −1, 1, −1, . . . ) (d) (xn )n mit xn := n, d.h. die Folge (0, 1, 2, 3, 4, 5, . . . ). Ein Punkt a ∈ R heiße Grenzwert oder Limes der (reellen) Folge (xn )n , in Zeichen: xn → a für n → ∞, 68 wenn es zu jedem ε > 0 ein n(ε) ∈ N gibt so, dass |xn − a| < ε für alle n ≥ n(ε). Wir werden in Zukunft auch sagen, dass eine Aussage A(n), welche von natürlichen Zahlen n abhängt, für genügend großes n bzw. alle genügend großen n gelte, falls es ein n0 ∈ N gibt so, dass die Aussage A(n) für alle n ≥ n0 wahr ist. Dies ist offenbar gleichbedeutend damit, dass die Teilmenge A ⊂ N aller n ∈ N, für welche die Aussage falsch ist, endlich ist. Z.B. sind die Folgenglieder der Folge 1, 5, 7, 11, 12, 14, 16, 18, 20, 22, . . . für genügend großes n gerade Zahlen (nämlich für n ≥ 5, d.h. wir können hier n0 := 5 wählen; n0 = 100 wäre aber auch ein mögliche Wahl). Folgender Satz, der sich leicht auch auf endliche viele Aussagen ausdehnen lässt, ist sehr oft nützlich: Satz 5.1 Sowohl die Aussage A(n) gelte für genügend großes n, als auch die Aussage B(n). Dann gilt auch die Aussage A(n) ∧ B(n) für genügend großes n. Beweis. Laut Voraussetzung gibt es n1 und n2 in N so, dass für alle n ≥ n1 die Aussage A(n) wahr ist, und für alle n ≥ n2 die Aussage B(n) wahr ist. Sei dann n3 := max{n1 , n2 }. Für alle n ≥ n3 ist dann sowohl die Aussage A(n) als auch die Aussage B(n) wahr, also auch die Aussage A(n) ∧ B(n). Q.E.D. Ein weiterer wichtiger Begriff ist der der ε - Umgebung eines Punktes a ∈ R : für ε > 0 ist dies per definitionem das offene Intervall Uε (a) := {x ∈ R : |x − a| < ε} =]a − ε, a + ε[, a−ǫ a a+ǫ Damit kann die obige Konvergenz der Zahlenfolge (xn )n gegen die Zahl a ∈ R auch wie folgt beschrieben werden: Für jedes ε > 0 liegen die Folgenglieder xn für alle genügend großen n stets in der ε-Umgebung Uε (a) von a. Beachte: Was genügend groß” bedeutet, darf hier von dem gewählten ε abhängen, ” da ja der Index n(ε), ab dem xn in Uε (a) liegen soll, von ε abhängen darf! Besitzt die Folge (xn )n einen Grenzwert a ∈ R, so heißt sie konvergent, andernfalls divergent. Achtung: Divergenz bedeutet nicht notwendig, dass die Folge irgendwie nach ” Unendlich” strebt! Betrachte dazu das nachfolgende Beispiel (c). Betrachten wir einmal die obigen Beispiele (a) – (d). 69 (a) Die konstante Zahlenfolge mit xn := a ist konvergent und besitzt a als Grenzwert, d.h. xn → a für n → ∞, denn offensichtlich ist |xn − a| = |a − a| = 0 < ε für jedes ε > 0 und jedes n ∈ N, also insbesondere für genügend großes n. (b) Die Zahlenfolge mit xn := d.h. 1 n ist konvergent und besitzt a = 0 als Grenzwert, 1 → 0 für n → ∞. n Aufgrund der archimedischen Anordnung von R (vgl. Satz 4.3) gibt es nämlich zu jedem ε > 0 ein m ∈ N≥1 mit ε > m1 . Wählen wir daher n(ε) := m, so gilt für n ≥ n(ε): 1 − 0 = 1 ≤ 1 < ε. n n m (c) Die Folge mit xn = (−1)n ist divergent. Dies zeigen wir durch Widerspruch: Angenommen, es gäbe einen Grenzwert a ∈ R dieser Folge. Wählen wir nun ε := 1/2, so müsste dann insbesondere für alle genügend großen n gelten a− 1 1 < (−1)n < a + . 2 2 Ist nun n eine genügend große gerade Zahl (d.h. n ≥ n(1/2)), so folgte also a − 21 < 1 < a + 12 . Dann ist zudem n + 1 ungerade und ebenfalls genügend groß, und ersetzen wie in der obigen Ungleichungskette n durch n + 1, so folgte ebenso a − 21 < −1 < a + 21 . Hieraus zusammen folgte aber 12 < a < − 12 , ein offensichtlicher Widerspruch. (d) Die Folge mit xn = n ist ebenso divergent, denn wäre a ∈ R ein Grenzwert, so läge mit ε := 1 für genügend großes n die Zahl n in dem Intervall ]a − 1, a + 1[, d.h. es wäre insbesondere n < a + 1 für alle genügend großen n. Dies widerspräche jedoch der archimedischen Anordnung von R (vgl. Satz 4.3). Satz 5.2 Eine konvergente Folge hat genau einen Grenzwert. Beweis. Wir nehmen an, dass die Folge (xn )n sowohl gegen a als auch gegen b konvergiert. Sei dann ε > 0 beliebig gegeben. Dann gilt für alle genügend großen n sowohl |xn − a| < ε/2, als auch |xn − b| < ε/2. 70 Damit gelten diese beiden Ungleichungen nach Satz 5.1 auch simultan für jedes genügend große n. Insbesondere gibt es dann mindestens ein n, so dass |a − b| ≤ |a − xn | + |xn − b| < ε/2 + ε/2 = ε. Die Ungleichung |a−b| < ε gilt somit für jedes ε > 0. Dann muss jedoch insbesondere auch |a − b| = 0 gelten, denn andernfalls wäre ε := |a − b| > 0, und die Ungleichung |a − b| < ε = |a − b| lieferte einen Widerspruch. Aus |a − b| = 0 folgt aber a − b = 0, also a = b. Q.E.D. Der nach diesem Satz eindeutige Grenzwert der konvergenten Folge (xn )n wird mit lim xn oder einfach lim xn n→∞ bezeichnet; für die Aussage “xn → a für n → ∞” schreiben wir von jetzt an auch: lim xn = a. n→∞ Eine reelle Folge (xn )n heiße nach oben beschränkt (bzw. nach unten beschränkt, bzw. beschränkt), wenn ebendies auf die Bildmenge {xn : n ∈ N} ⊂ R der Folge zutrifft. Offenbar ist die Folge (xn )n genau dann beschränkt, wenn es ein M ≥ 0 gibt, so dass |xn | ≤ M für alle n. Satz 5.3 Jede konvergente Folge ist beschränkt. Beweis. Gilt a = lim xn , so gibt es zu ε := 1 ein n0 ∈ N mit |xn − a| < 1 für alle n→∞ n > n0 . Wir setzen M := max{|x1 |, . . . , |xn0 |, |a| + 1}. Da |xn | ≤ |xn − a| + |a| < |a| + 1 für n > n0 , so ist dann offenbar |xn | ≤ M für jedes n ≥ 1. Q.E.D. Bemerkung: Die Umkehrung von Satz 5.3 gilt nicht. Beispielsweise ist die Folge xn = (−1)n beschränkt, aber divergent. Die Divergenz der Folge in Beispiel (d) ist übrigens eine unmittelbare Konsequenz aus Satz 5.3. Wir wollen hier gleich ein erstes, sehr nützliches Konvergenzkriterium angeben. Wir sagen, eine reelle Zahlenfolge (xn )n sei monoton wachsend oder kurz wachsend, wenn für alle n gilt: xn+1 ≥ xn , d.h. x0 ≤ x1 ≤ x2 ≤ x3 ≤ x4 ≤ · · · ; sie heiße streng monoton wachsend oder kurz streng wachsend, wenn für alle n gilt: xn+1 > xn . Gelten dagegen die Ungleichungen xn+1 ≤ xn bzw. xn+1 < xn , so heiße die Folge monoton fallend oder kurz fallend, bzw. streng monoton fallend oder streng fallend. Die Folge sei monoton, wenn sie wachsend oder fallend ist. 71 Satz 5.4 (Grenzwerte monotoner Folgen) Jede monoton wachsende und nach oben beschränkte, bzw. monoton fallende und nach unten beschränkte reelle Zahlenfolge (xn )n ist konvergent, und zwar gilt mit F := {xn : n ∈ N} ⊂ R: lim xn = sup F bzw. lim xn = inf F, n→∞ n→∞ je nachdem, ob die Folge wächst, oder fällt. Beweis. Wir betrachten den Fall einer wachsenden Folge (xn )n (der Fall einer fallenden Folge kann analog behandelt werden). Da die Menge F laut Voraussetzung nach oben beschränkt ist, existiert a := sup F ∈ R. Zu jedem ε > 0 gibt es nach Satz 4.5 daher ein n0 mit xn0 > a − ε. Wegen der Monotonie folgt daher a − ε < xn0 ≤ xn ≤ a < a + ε für alle n ≥ n0 , und somit xn ∈ Uε (a) für alle n ≥ n0 . Damit konvergiert die Folge gegen a. Q.E.D. Beispiel. Durch die Rekursionsvorschrift x0 := 1, xn := (2n − 1)(2n + 1) xn−1 , (2n)2 n ≥ 1, wird wegen 0 < (2n − 1)(2n + 1)/(2n)2 = (4n2 − 1)/4n2 < 1 eine (streng) monoton fallende Folge positiver Zahlen definiert (mit Indexmenge N); ihr allgemeines Folgenglied lautet: xn = 1 3 3 5 5 7 2n − 1 2n + 1 · · · · · ··· · , 2 2 4 4 6 6 2n 2n n ≥ 1. Die Folge ist nach Satz 5.4 konvergent. Wir werden später zeigen, dass lim xn = 2/π. 5.1 Rechenregeln für Grenzwerte und Kovergenzssätze Satz 5.5 Es seien (an )n und (bn )n zwei konvergente Zahlfolgen mit lim an = a und lim bn = b. Ferner sei λ ∈ R. Dann sind auch die Folgen (an + bn )n , (an − bn )n , (an bn )n und (λan )n konvergent, und es gilt: (i) lim(an + bn ) = a + b = lim an + lim bn , (ii) lim(an − bn ) = a − b = lim an − lim bn , (iii) lim(an bn ) = ab = (lim an )(lim bn ), 72 (iv) lim(λan ) = λa = λ lim an . (v) Ist ferner b 6= 0, so gibt es ein n0 ∈ N, so dass bn 6= 0 für n ≥ n0 , und die Folge (an /bn )n≥n0 ist konvergent. Für ihren Grenzwert gilt lim an a lim an = = . bn b lim bn Beweis. Wir überlassen (i) als Übungsaufgabe. Zu (iii): Da die Folge (an ) konvergent ist, gibt es nach nach Satz 5.3 eine Konstante M ≥ 0, so dass |an | ≤ M für alle n. Damit können wir den Abstand von an bn zu ab wie folgt nach oben abschätzen: |ab − an bn | = |(a − an )b + an (b − bn )| ≤ |(a − an )b| + |an (b − bn )| = |b||a − an | + |an ||b − bn | ≤ |b||a − an | + M|b − bn | ≤ N|a − an | + N|b − bn |, wobei wir N := |b| + M + 1 gesetzt haben. Beachte, dass N > 0. Sei nun ε > 0. Da a = lim an existiert, und da ε/(2N) > 0 ist, gilt |a − an | < ε/(2N) für alle genügend großen n, und ähnlich gilt wegen b = lim bn die Abschätzung |b − bn | < ε/(2N) für alle genügend großen n. Somit gelten nach Satz 5.1 für alle genügend großen n die beiden Abschätzungen |a − an | < ε/(2N) und |b − bn | < ε/(2N) gleichzeitig, also auch |ab − an bn | ≤ N|a − an | + N|b − bn | < N ε ε +N = ε. 2N 2N Somit ist lim(an bn ) = ab. Zu (iv): Dies folgt sofort aus (iii), indem wir für (bn ) die konstante Folge bn := λ wählen. Zu (ii): Nach (iv) ist lim(−bn ) = − lim(bn ). Damit folgt (ii) dann aus (i). Zu (v): Aufgrund von (iii) genügt es, denn Fall an = 1 zu betrachten, da ja an /bn = an (1/bn ) ist. Sei also lim bn = b 6= 0. Dann ist δ := |b|/2 > 0, und zu diesem δ gibt es ein n0 ≥ 1, so dass |bn − b| < δ = |b|/2 für alle n ≥ n0 . Hieraus folgt für n ≥ n0 (also alle genügend großen n) |bn | = |b + (bn − b)| ≥ | |b| − |bn − b| | = |b| − |bn − b| > |b| − |b| |b| = , 2 2 d.h. |bn | > δ > 0. Insbesondere ist bn 6= 0 für n ≥ n0 , so dass wir 1/bn bilden können. Wir schätzen den Abstand von 1/bn zu 1/b für n ≥ n0 wie folgt nach oben ab: 1 bn − b |bn − b| 1 |bn − b| − = = ≤ = M|bn − b|, b bn bn b |bn ||b| (|b|/2)|b| 73 mit M := 2/|b|2 > 0. Sei nun ε > 0. Wegen b = lim bn und da die Zahl ε/M > 0 positiv ist, gilt für alle genügend großen n die Ungleichung |bn − b| < ε/M. Wieder mit Satz 5.1 folgt, dass für alle genügend großen n gilt 1 − 1 ≤ M|bn − b| < M ε = ε. b bn M Es folgt, dass lim(1/bn ) = 1/b. Q.E.D. Beispiel. Betrachte die Folge 3n2 + 13n , n2 − 2 Für n ≥ 1 lässt sich an schreiben als n ∈ N. an := 3+ an = 1− 13 n 2 n2 . Da lim(1/n) = 0, ist nach (iii) auch lim(1/n2 ) = 0, also nach (iv) auch lim(2/n2 ) = 0, und ebenso nach (iv) lim(13/n) = 0. Mit (i) folgt hieraus lim(3 + 13/n) = 3 und lim(1 − 2/n2 ) = 1 6= 0. Somit lässt sich schließlich (v) anwenden, und wir erhalten 3n2 + 13n = 3. n→∞ n2 − 2 lim Satz 5.6 Seien (an )n und (bn )n zwei konvergente reelle Folgen, und sei an ≤ bn für alle genügend großen n. Dann gilt auch lim an ≤ lim bn . Beweis. Angenommen, es sei b := lim bn < a := lim an . Dann ist ε := (a − b)/2 > 0. Somit gilt für genügend großes n die Abschätzung |an − a| < ε, und ebenso gilt für genügend großes n die Abschätzung |bn − b| < ε. Wieder nach Satz 5.1 gelten daher diese beiden Abschätzungen für genügend großes n gleichzeitig, d.h. es gibt ein n(ε) so, dass für alle n ≥ n(ε) gilt a − ε < an < a + ε und b − ε < bn < b + ε, und insbesondere also bn < b + ε = (a + b)/2 = a − ε < an . Dies steht jedoch Widerspruch zu unserer Voraussetzung, dass an ≤ bn ist für genügend großes n. Q.E.D. Vorsicht: Aus an < bn für alle n folgt nicht unbedingt lim an < lim bn , sondern i.a. nur lim an ≤ lim bn . Beispiel. Wähle an := 0 und bn := 1/n, n ≥ 1. Eine unmittelbare Folgerung aus dem vorangehenden Satz ist 74 Korollar 5.7 Sei (an )n eine konvergente reelle Folge mit A ≤ an ≤ B für genügend große n. Dann gilt auch A ≤ lim an ≤ B. Satz 5.8 (Einschließungssatz) Besitzen die beiden Zahlenfolgen (an )n und (bn )n denselben Grenzwert ξ, und ist (xn )n eine weitere Folge so, dass für alle genügend großen n (sagen wir n ≥ n0 ) gilt an ≤ xn ≤ bn , so ist auch lim xn = ξ. Beweis. Sei ε > 0. Da lim an = ξ ist, gilt für genügend großes n dann |an − ξ| < ε, also insbesondere an > ξ − ε. Analog folgert man aus lim bn = ξ, dass für genügend großes n gilt bn < ξ + ε. Zusammen mit unserer Voraussetzung, dass an ≤ xn ≤ bn für alle genügend großen n gilt, folgern wir wieder mit Satz 5.1 (in der Version mit drei Aussagen), dass diese drei Ungleichungen für genügend großes n simultan gelten. Insbesondere gilt damit für genügend großes n ξ − ε < an ≤ xn ≤ bn ≤ ξ + ε, d.h. xn ∈ Uε (ξ). Damit ist gezeigt, dass lim xn = ξ. Q.E.D. Satz 5.9 Sei A eine nichtleere nach oben (bzw. unten) beschränkte Teilmenge von R. Dann existiert eine Folge (an )n in A mit sup A = lim an (bzw. inf A = lim an ). Beweis. Wir zeigen dies für das Supremum s := sup A. Zu jedem n ∈ N≥1 gibt es nach Satz 4.5 zu ε := 1/n ein an ∈ A mit an ≥ s − 1/n. Wegen an ≤ s gilt somit für alle n ∈ N 1 s − ≤ an ≤ s. n Mit dem Einschließungssatz folgern wir daraus, dass s = lim an . Q.E.D. Als Anwendung dieser Sätze beweisen wir die Existenz k-ter Wurzeln: Sind x > 0 eine positive reelle Zahl und k ≥ 1 eine natürliche Zahl, so bezeichnen wir y ∈ R als eine k-te Wurzel aus x, falls y k = x gilt. Satz 5.10 Jede positive reelle Zahl a > 0 besitzt für jedes k ≥ 2 aus N eine und nur eine positive reelle k-te Wurzel. √ Wir bezeichnen diese eindeutige positive k-te Wurzel aus a mit k a. Beweis. Sei A := {x ≥ 0 : xk ≤ a}, und setze b := sup A. Die Menge A ist nach oben beschränkt durch 1 + a, da aus x > 1 + a mit der Bernoullischen Ungleichung folgt xk > (1 + a)k ≥ 1 + ka > a. Da 0 in A liegt, ist 75 zudem A nichtleer, so dass b ∈ R und b ≥ 0. Wähle gemäß Satz 5.9 eine Folge (xn )n in A mit lim xn = b. Nach unseren Grenzwertsätzen ist dann bk = lim xkn ≤ a. n→∞ Um zu zeigen, dass bk = a ist, bemerken wir, dass für alle ε ∈]0, 1] nach der binomischen Formel k k X X k k−j k j−1 k−j k k k b = bk + εC ε b ≤b +ε (b + ε) = b + ε j j j=1 j=1 gilt. Wäre nun bk < a, so wäre n a − bk o ∈]0, 1]. ε0 := min 1, C Für ε := ε0 folgte damit (b+ε0)k ≤ bk +(a−bk ) = a, d.h. b+ε0 ∈ A, im Widerspruch zur Definition von b. Folglich ist bk = a. Die Eindeutigkeit der positiven k-ten Wurzel von a folgt sofort aus der Beobachtung, dass 0 < b1 < b2 die Ungleichungt bk1 < bk2 impliziert. Q.E.D. Alternativ kann man die Existenz der k-ten Wurzeln auch mit Hilfe des Newtonverfahrens nachweisen, welches z.B. in [K] besprochen wird. Studieren Sie diesen Beweis in [K]! (Übung). Bemerkung: Aus dem Beweis von Satz 5.10 folgert man leicht, dass der Körper Q nicht ordnungsvollständig ist (Übung). Eine Folge (xn )n heiße Nullfolge, falls lim xn = 0. Wir fassen im nächsten Satz einige im Grunde offensichtliche, aber doch nützliche Regeln zusammen: Satz 5.11 (i) Ist (an )n eine konvergente Folge, so ist auch die Folge (|an |)n konvergent, und es gilt lim |an | = | lim an |. (ii) Die Folge (xn )n ist genau dann eine Nullfolge, wenn die Folge (|xn |)n eine Nullfolge ist. (iii) Ist (xn )n eine Nullfolge, und ist (yn )n eine weitere Folge so, dass |yn | ≤ |xn | für alle genügend großen n, so ist auch (yn )n eine Nullfolge. (iv) Der Grenzwert einer konvergenten Folge ändert sich nicht, wenn man sie durch eine Nullfolge abändert, d.h. gilt an → a und xn → 0, so folgt (an + xn ) → a. Insbesondere ändert sich der Grenzwert nicht, wenn man endlich viele Folgenglieder abändert. Beweis. (i) folgt leicht aus der Ungleichung | |a| − |an | | ≤ |a − an |, und die übrigen Aussagen sind vollkommen trivial. Q.E.D. 76 5.2 Teilfolgen, Häufungspunkte Definition. Sei (xn )n∈N ∈ X N eine Folge in einer vorgegebenen Menge X, und sei n0 < n1 < n2 < n3 < . . . eine streng wachsende Folge (nk )k natürlicher Zahlen. Dann heißt die Folge (xnk )k∈N = (xn0 , xn1 , xn2 , xn3 , . . . ) eine Teilfolge der Folge (xn )n . Mit anderen Worten: Bezeichnen f : N → X die Abbildung f : n 7→ xn und g : N → N die streng monoton wachsende Abbildung g : k 7→ nk , so ist (xnk )k∈N die zusammengesetzte Abbildung f ◦ g. Beispiel. Ist (xn )n die Folge mit xn := (−1)n , n+1 d.h. die Folge 1 1 1 1 1 1 (1, − , , − , , − , , . . . ), 2 3 4 5 6 7 so ist mit nk := 2k die Teilfolge yk := xnk = (1, 13 , 51 , 17 , . . . ). (−1)2k 2k+1 = 1 2k+1 gewählt, d.h. die Teilfolge Dagegen erhält man für mk := 2k + 1 die Teilfolge zk := xmk = d.h. die Teilfolge (− 12 , − 41 , − 16 , . . . ). (−1)2k+1 2k+2 1 = − 2k+2 , Satz 5.12 Ist lim xn = a, so hat auch jede Teilfolge von (xn )n∈N den Grenzwert a. n→∞ Beweis. Ist n0 < n1 < n2 < . . . eine aufsteigende Folge natürlicher Zahlen, so gilt nk ≥ k für alle k. Dies zeigt man leicht mittels vollständiger Induktion: Für k = 0 ist dies klar, da n0 ≥ 0, und haben wir dies bereits für ein k ≥ 0 bewiesen, so folgt nk+1 ≥ nk + 1 ≥ k + 1. Ist nun lim xn = a, und ist ε > 0, so gibt es ein n(ε) ∈ N so, dass xn ∈ Uε (a) für alle n ≥ n(ε). Für k ≥ n(ε) ist jedoch nk ≥ k ≥ n(ε), so dass auch xnk ∈ Uε (a). Q.E.D. Beispielsweise folgt aus Satz 5.12 leicht, dass für jedes ganzzahlige p ≥ 2 gilt: (5.1) 1 = 0. k→∞ pk lim Die Folge (nk )k := (pk )k ist nämlich eine aufsteigende Folge natürlicher Zahlen, so dass die Folge (1/pk )k die Teilfolge (xnk )k∈N der Nullfolge (xn )n≥1 := (1/n)n≥1 ist. 77 (5.1) lässt sich übrigens folgendermaßen verallgemeinern: für jedes r ∈ R mit 0 ≤ r < 1 gilt: lim r k = 0. (5.2) k→∞ Für r = 0 ist dies klar. Sei also 0 < r < 1. Offenbar ist die Folge (r k )k fallend und durch 0 nach unten beschränkt, so dass nach Satz 5.4 lim r k = inf r k =: a ≥ 0 k→∞ k∈N existiert. Wäre nun a > 0, so folgte aus r k ≥ a für alle k ≥ 1 auch r k−1 ≥ a/r, d.h. a = inf r k−1 ≥ a/r > a, k≥1 ein Widerspruch. Somit ist a = 0. Definition. Ein Punkt a ∈ R heiße Häufungspunkt der Zahlenfolge (xn )n∈N , wenn in jeder (noch so kleinen) ε-Umgebung von a unendlich viele Folgenglieder xn liegen, d.h., wenn es unendlich viele n ∈ N gibt mit xn ∈ Uε (a). Hierzu äquivalent ist die folgende Eigenschaft (wieso? Übung): Zu jedem ε > 0 und zu jedem m ∈ N gibt es ein n > m mit xn ∈ Uε (a). Beispielsweise besitzt die Folge xn = (−1)n die beiden Häufungspunkte 1 und -1. Satz 5.13 Seien (xn )n eine Zahlenfolge und a ∈ R. Dann ist a ein Häufungspunkt der Folge (xn )n dann und nur dann, wenn es eine Teilfolge (xnk )k gibt mit lim xnk = k→∞ a. Beweis. Es sei a ein Häufungspunkt der Folge (xn )n . Um rekursiv eine geeignete Auswahlfolge (nk )k zu konstruieren, setzen wir n0 = 0. Nach Definition des Häufungspunktes gibt es dann zu m := n0 ein n > n0 mit |xn − a| < 1; wir wählen als n1 das kleinste solche n. Nehmen wir nun an, es seien n0 < n1 < · · · < nk für ein k ≥ 1 bereits so bestimmt, dass |xnj − a| < 1j für j = 1, . . . , k (n0 fällt hier offenbar heraus). Dann gibt es ein 1 n > nk mit |xn − a| < k+1 ; wir wählen als nk+1 das kleinste solche n. Damit ist die Folge (nk )k wohldefiniert und streng wachsend, und es gilt nach Konstruktion der nk : 1 |xnk − a| < k für alle k ≥ 1. Da die Folge (1/k)k≥1 gegen 0 konvergiert, schließt man hieraus, dass xnk → a für k → ∞. Die umgekehrte Implikation ist trivial. Q.E.D. Wir haben bereits gesehen, dass nicht jede beschränkte Folge konvergent ist. Es gilt aber das wichtige 78 Theorem 5.14 (Satz von Bolzano-Weierstraß) Jede beschränkte Folge reeller Zahlen besitzt eine konvergente Teilfolge. Beweis. Sei (xn )n eine beschränkte Folge reeller Zahlen. Nach Satz 5.13 genügt es zu zeigen, dass die Folge (xn )n einen Häufungspunkt besitzt. Dazu definieren wir in einem ersten Schritt rekursiv eine Folge ineinandergeschachtelter, abgeschlossener und beschränkter Intervalle I0 ⊃ I1 ⊃ I2 ⊃ . . . mit der Eigenschaft, dass jedes der Intervalle Ik unendlich viele der Folgenglieder xn enthält (d.h. genauer, dass es unendlich viele n gibt mit xn ∈ Ik ), wobei die Länge der Intervalle gegen 0 strebt. Für I0 wählen wir irgendein beschränktes, abgeschlossenes Intervall I0 = [α0 , β0 ], welches alle xn enthält – ein solches existiert, da die Folge (xn )n beschränkt ist. Nehmen wir nun an, dass die Intervalle I0 ⊃ I0 ⊃ · · · ⊃ Ik für ein k ≥ 0 bereits so gewählt sind, dass für j = 0, . . . , k die Länge von Ij jeweils 2−j L beträgt, wobei L = β0 − α0 die Länge von I0 bezeichne, und so, dass Ik unendlich viele der Folgenglieder xn enthält, so legen wir Ik+1 wie folgt fest: Ist Ik das Intervall Ik = [αk , βk ], so unterteilen wir Ik in die beiden Teilintervalle k k J1 := [αk , αk +β ] und J2 := [ αk +β , βk ] der Länge 21 · 2−k L = 2−(k+1) L. Dann muss 2 2 offensichtlich mindestens eines der beiden Teilintervalle unendlich viele Folgenglieder xn enthalten, und wir wählen für Ik+1 eines der Teilntervalle mit dieser Eigenschaft. Nach (5.1) strebt dann offenbar die Länge der Ik gegen 0. Nach dem Intervallschachtelungsprinzip (Satz 4.7) gibt es nun genau einen Punkt a, welcher in allen Intervallen Ik liegt. Wir werden zeigen, dass a ein Häufungspunkt der Folge (xn )n ist. Dazu betrachten wir eine beliebige ε-Umgebung Uε (a), ε > 0, von a. Da die Länge βk − αk des Intervalls Ik = [αk , βk ] für k → ∞ gegen 0 strebt, gibt es ein k0 so, dass ℓ := βk0 − αk0 < ε. Da ferner a ∈ Ik0 ist, gilt |a − αk0 | ≤ ℓ < ε, und ebenso |βk0 − a| < ε, d.h. αk0 , βk0 ∈ Uε (a). Da Uε (a) ein Intervall ist, ist folglich Ik0 ⊂ Uε (a). Es gibt aber unendlich viele n mit xn ∈ Ik0 , und folglich trifft dies auch auf Uε (a) zu. Q.E.D. Wir kommen nun zu dem wohl wichtigsten Konvergenzkriterium für reelle Folgen, dem Cauchy-Kriterium: Definition. Eine reelle Folge (xn )n heiße Cauchy-Folge, wenn es zu jedem ε > 0 ein n(ε) ∈ N gibt so, dass |xn − xm | < ε für alle n, m ≥ n(ε). Grob gesprochen: eine Folge ist eine Cauchy-Folge, wenn der Abstand beliebiger ” Folgenglieder beliebig klein wird, falls deren Indizes nur genügend groß sind “. Lemma 5.15 Sei (xn )n eine Cauchy-Folge in R. Dann gilt: (i) Die Folge (xn )n ist beschränkt. (ii) Besitzt die Folge (xn )n eine konvergente Teilfolge (xnk )k mit Grenzwert a := lim xnk , so konvergiert auch die komplette Folge (xn )n ebenfalls gegen a. k→∞ 79 Beweis. (i) Zu ε = 1 gibt es ein n0 ∈ N, so daß |xn − xm | < 1 für n, m ≥ n0 . Insbesondere gilt für n ≥ n0 : |xn | ≤ |xn − xn0 | + |xn0 | < |xn0 | + 1. Somit bildet M := max{|x0 |, . . . , |xn0 −1 |, |xn0 | + 1} eine Schranke für die Folge (xn ). (ii) Sei ε > 0. Dann gibt es ein n(ε) ∈ N, so daß |xn −xm | < ε/2 für alle m, n ≥ n(ε). Wegen xnk → a gibt es ferner ein k0 ∈ N, so daß |xnk0 − a| < ε/2 und nk0 ≥ n(ε). Dann gilt aber für n ≥ n(ε) |xn − a| ≤ |xn − xnk0 | + |xnk0 − a| < ε/2 + ε/2 = ε. Somit konvergiert die Folge (xn )n gegen a. Q.E.D. Theorem 5.16 Eine reelle Zahlenfolge (xn )n ist konvergent dann und nur dann, wenn sie eine Cauchy-Folge ist. Beweis. (i) Es ist leicht einzusehen, dass jede konvergente Folge eine Cauchy-Folge ist: Ist nämlich lim xn = a, und wählt man ε > 0, so gibt es nach Definition ein n(ε) so, dass |xn − a| < ε/2 für alle n ≥ n(ε). Sind daher n, m ≥ n(ε), so folgt aus der Dreiecksgleichung |xn − xm | = |(xn − a) + (a − xm )| ≤ |xn − a| + |xm − a| < ε ε + = ε. 2 2 (ii) Wir zeigen nun die Umkehrung: Sei (xn )n eine Cauchy-Folge. Da diese nach Lemma 5.15 beschränkt ist, können wir auf sie den Satz von Bolzano-Weierstraß anwenden und finden damit eine konvergente Teilfolge (xnk )k . Wieder mit Lemma 5.15 ist damit auch die Folge (xn )n konvergent. Q.E.D. Bemerkung. Die Tatsache, dass in R jede Cauchy-Folge konvergent ist, ist von so fundamentaler Bedeutung, dass man für sie einen eigenen Begriff eingeführt hat: Man sagt, der Körper R sei vollständig (für einen archimedisch geordneten Körper sind Vollständigkeit und Ordnungsvollständigkeit übrigens äquivalente Begriffe – die eine Richtung davon haben wir soeben bewiesen). Der große Vorteil des Cauchy-Kriteriums besteht darin, dass es mit ihm oft gelingt, die Konvergenz einer gegebenen Folge nachzuweisen, ohne dass deren Grenzwert explizit bekannt ist. 80 5.3 Unendliche Reihen Folgen treten häufig in Form unendlicher Reihen auf, d.h. als Folge (sn )n∈N der Partialsummen sn := n X k=0 ak = a0 + a1 + · · · + an , n ∈ N, welche zu einer gegebenen Zahlenfolge (an )n∈N gebildet werden. Für die unendliche ∞ X Reihe (sn )n benutzt man in der Regel das Symbol ak . Konvergiert die Folge (sn )n , so wird ihr Grenzwert ebenfalls mit k=0 ak bezeichnet. k=0 zweierlei: i) Die Folge ∞ X n X ak k=0 n∈N ∞ X ak bedeutet also k=0 der Partialsummen. ii) Im Falle der Konvergenz den Limes lim n→∞ gegebenen Reihe genannt wird. n X ak , welcher auch der Wert der k=0 Übrigens lässt sich jede Folge (cn )n auch als ( teleskopische“) Reihe ” cn = c0 + (c1 − c0 ) + (c2 − c1 ) + · · · + (cn − cn−1 ) n X (ck − ck−1 ), n ∈ N. = c0 + k=1 darstellen. Bemerkungen. a) Natürlich kann die Summation in einer Reihe statt mit k = 0 auch mit irgendeinem k0 ∈ Z beginnen. Es genügt, dass die Terme ak für alle k ≥ k0 definiert sind. Durch Indexverschiebung um k0 lässt sich dieser allgemeinere Fall jedoch sofort auf den bisher betrachteten zurückführen, d.h.: ∞ P ak eine unendliche Reihe mit kleinstem Summationsindex k0 , und setzt man Ist k=k0 a′l := ak0 +l , l ∈ N, so erhält man die Reihe kP 0 +n k=k0 ak bzw. s′n := n P l=0 ∞ P l=0 a′l . Für die Partialsummen sn := a′l dieser Reihen gilt dann sn = s′n , d.h. die beiden Reihen besitzen dieselben Folgen von Partialsummen und sind somit gleich. P P b) Sei k0 ≥ 1. Da sich die Partialsummen nk=0 ak = a0 + · · · + an und nk=k0 ak = P 0 −1 ak unterscheiden, ist die ak0 + · · · + an für alle n ≥ k0 nur um die feste Zahl kk=0 81 P P∞ Reihe ∞ k=0 ak konvergent dann und nur dann, wenn die Reihe k=k0 ak konvergent ist, d.h. es ist erlaubt, endlich viele Summanden in einer Reihe abzuändern, ohne dass sich das Konvergenzverhalten ändert (natürlich wird sich der Wert dabei i.a. jedoch verändern). Von dieser Tatschen werden wir gelegentlich ohne weitere Erwähnung Gebrauch machen. Um die Notation nicht unnötig kompliziert werden zu lassen, werden wir in den folgenden Sätzen daher stets k0 = 0 annehmen - sie gelten aber natürlich auch bei beliebigen Anfangsindices k0 . Ist aufgrund des Kontextes klar, X X über welchen Bereich summiert wird, so schreiben wir auch einfach ak oder ak . k Beispiel. (a) Für die Partialsummen der Reihe n X k=1 ∞ X k=1 1 gilt sn k(k + 1) := n 1 = ; dies weist man leicht durch Induktion nach. Ein besserer Weg k(k + 1) n+1 1 besteht darin, den Summanden ak = k(k+1) zu zerlegen in wird sn zu einer telekopischen Summe 1 k(k+1) = 1 k − 1 . k+1 Dann n X 1 1 ), sn = ( − k k+1 k=1 und man sieht daran sofort, dass sn = 1 n 1 − = . 1 n+1 n+1 Da sn → 1, ist die Reihe konvergent, und für ihren Wert gilt: ∞ X k=1 1 = 1. k(k + 1) Satz 5.17 ( Unendliche geometrische Reihe) Sei |x| < 1. Dann gilt ∞ X 1 . 1−x xk = k=0 Beweis. Für die Partialsummen sn := n X k=0 sn = xk gilt (für beliebiges x ∈ R \ {1}) : 1 − xn+1 , 1−x 82 da (1 − x)sn = n X k=0 k x − n X k+1 x = k=0 n X k=0 k x − n+1 X k=1 xk = 1 − xn+1 . Ist |x| < 1, so gilt nach Satz 5.11 und (5.2) ferner lim xn+1 = 0, und somit lim sn = n→∞ n→∞ 1 . 1−x Q.E.D. Das Cauchy-Kriterium für Folgen findet seine Entsprechung in folgendem P Satz 5.18 ( Cauchy-Kriterium für Reihen) Eine Reihe k ak ist genau dann konvergent, wenn es zu jedem ε > 0 ein n(ε) ∈ N gibt so, dass m X für alle m ≥ n ≥ n(ε). a k < ε k=n Beweis. Sei sp := p P k=0 ak die p-te Partialsumme der Reihe. Dann ist für m ≥ n ≥ 1 m X ak , |sm − sn−1 | = k=n und die angegebene Bedingung drückt somit einfach aus, dass die Folge (sn ) der Partialsummen eine Cauchy-Folge ist. Satz 5.18 ist damit eine unmittelbare Konsequenz der Vollständigkeit von R (Theorem 5.14). Q.E.D. Korollar 5.19 EinePnotwendige (aber nicht hinreichende) Bedingung für die Konvergenz einer Reihe k ak ist, dass lim ak = 0. k→∞ Beweis. Sei ε > 0. Ist die Reihe konvergent, so gibt es nach Satz 5.18 ein n(ε) ∈ N, so dass m X ak < ε für m ≥ n ≥ n(ε). k=n Ist daher n ≥ n(ε), und wählen wir m = n, so gilt insbesondere |an | < ε. Hieraus folgt lim an = 0. Q.E.D. ∞ P k x divergent. Beispielsweise ist für beliebiges x ∈ R mit |x| ≥ 1 die Reihe k=0 Denn, ist |x| ≥ 1, so ist |xk | = |x|k ≥ 1 für alle k ∈ N, und folglich kann die Folge (xk ) keine Nullfolge sein. Aus Satz 5.4 gewinnen wir folgendes Kriterium. 83 P∞ ak nur nicht-negative Terme ak ≥ 0, so ist sie n P konvergent genau dann, wenn die Folge der Partialsummen sn = ak nach oben Satz 5.20 Besitzt die Reihe k=0 k=0 beschränkt ist. In diesem Falle gilt ∞ X ak = sup ( n X k=0 k=0 ) ak : n ∈ N . Beweis. Sind alle Terme ak ≥ 0, so ist die Folge (sn ) monoton wachsend. Falls die Folge der sn nach oben beschränkt ist, so konvergiert sie somit nach Satz 5.4 gegen sup{sn : n ∈ N}. Ist sie dagegen unbeschränkt, so divergiert sie nach Satz 5.3. Q.E.D. Beispiele. (a) Die harmonische Reihe ∞ P k=1 (1/k)k eine Nullfolge ist. 1 k ist divergent, obwohl die Folge ihrer Terme Für jedes n ≥ 1 gilt nämlich n-Terme z }| { 2n X 1 1 1 1 1 1 1 = + +···+ ≥ +···+ = , k n+1 n+2 2n 2n 2n 2 k=n+1 und damit erfüllt die Reihe nicht das Cauchy-Kriterium in Satz 5.18. ∞ X 1 (b) Die Reihe konvergiert. k2 k=1 Nach Beispiel (a) gilt nämlich daher ∞ X k=1 1 = 1. Durch Vergleich erhalten wir k(k + 1) n n−1 n−1 X X X 1 1 1 sn = =1+ ≤1+ ≤1+1=2 2 2 k (k + 1) k(k + 1) k=1 k=1 k=1 für alle n ≥ 1. Die Folge der Partialsummen ist also durch 2 nach oben beschränkt, und wir können Satz 5.20 anwenden. Man kann übrigens beweisen, ∞ X π2 1 = . dass 2 k 6 k=1 Wir leiten aus den Rechenregeln für Grenzwerte noch folgende Rechenregeln für unendliche Reihen ab. 84 X X Satz 5.21 Seien ak und bk zwei konvergente Reihen und λ ∈ R. Dann sind kX Xk X auch die Reihen (ak + bk ), (ak − bk ) und (λak ) konvergent und es gilt: k k X k k (ak ± bk ) = X X k λak = λ k ak ± X ak . X bk , k k Beweis. Beispielsweise gilt die Identität n X (ak + bk ) = ( n X ak ) + ( n X da es sich hier um endliche Summen handelt. Da für n → ∞, konvergiert nach Satz 5.5 (i) somit ! ! ∞ ∞ X X gegen ak + bk . k=0 bk ), k=0 k=0 k=0 n X ak → k=0 n X k=0 ∞ X ak und k=0 n X k=0 bk → ∞ X bk k=0 (ak + bk ) für n → ∞, und zwar k=0 Die anderen Formeln werden ähnlich gezeigt. Q.E.D. Bemerkung. Für das Produkt zweier unendlicher Reihen gilt keine so einfache Formel – dies soll später betrachtet werden. 5.4 Uneigentliche Konvergenz Definitionen. Eine Folge (xn ) reeller Zahlen heiße bestimmt divergent gegen +∞ ( bzw. −∞), wenn es zu jedem K ∈ R+ ein N(K) ∈ N gibt, so dass xn > K (bzw. xn < −K) für alle n ≥ N(K). Bezeichnen wir als ε-Umgebungen von ∞ und −∞ die Mengen Uε (∞) := ]1/ε, ∞[, Uε (−∞) := ] − ∞, −1/ε[, (ε > 0), so sieht man leicht ein, dass die Folge (xn ) bestimmt gegen ∞ divergiert, wenn es zu jedem ε > 0 ein n(ε) ∈ N gibt, so dass xn ∈ Uε (∞) für alle n ≥ n(ε), 85 und ähnliches gilt für die bestimmte Divergenz gegen −∞ (man wähle dazu einfach 1 K = und n(ε) = N(1/ε).). Da diese Definition formal der der Konvergenz gegen ε einen endlichen Punkt gleicht, sagt man auch häufig: Die Folge xn ist uneigentlich konvergent gegen ∞ (bzw. −∞), und schreibt dafür: xn −→ ∞ (bzw. xn −→ −∞.) Wir sagen ferner, die reelle Zahlenfolge (xn ) besitze ∞ (bzw. −∞) als uneigentlichen Häufungspunkt, wenn in jeder ε-Umgebung Uε (∞) (bzw. Uε (−∞)) unendlich viele Folgenglieder xn liegen. Damit haben wir auf der ganzen erweiterten Zahlengeraden R = R∪{−∞, ∞} einen Konvergenzbegriff eingeführt. Beispiele. (a) Die Folge xn = n, n ∈ N, ist uneigentlich konvergent gegen ∞. (b) Die Folge xn = −2n , n ∈ N, ist uneigentlich konvergent gegen −∞. (c) Die Folge xn = (−1)n n, n ∈ N, ist weder uneigentlich konvergent gegen ∞ noch gegen −∞, und natürlich divergiert sie. Sie besitzt jedoch ∞ und −∞ als uneigentliche Häufungspunkte. Die Grenzwertsätze 5.2, 5.4, 5.6 und 5.8 lassen sich, unter geringfügiger Modifizierung der Beweise, auf die betrachtete Situation uneigentlicher Konvergenz übertragen. Beispielsweise lässt sich Satz 5.4 wie folgt erweitern: Ist (xn ) eine wachsende reelle Zahlenfolge, und ist (xn ) unbeschränkt, so gilt xn → ∞ = sup{xn : n ∈ N}. Dies ist natürlich trivial. Anders ist es mit den Rechenregeln, denn ±∞ ist ja keine Zahl. Diese lassen sich in der in Satz 5.5 angegebenen Form nicht verallgemeinern. Sei etwa an = n, bn = 1, und cn = an + bn = n + 1. Dann gilt an → ∞, bn → 1, cn → ∞. Könnte man mit ∞ so rechnen wie mit reellen Zahlen, so würde nach Satz 5.5 gelten: ∞ + 1 = ∞, also 1 = 0, ein Widerspruch. Es gelten jedoch die folgenden Beziehungen, deren einfacher Beweis hier nicht angegeben werden soll. (a) an → ∞ und bn ≥ C für alle n =⇒ an + bn → ∞. (b) an → ∞ und bn ≥ C > 0 für alle genügend großen n =⇒ an bn → ∞. (c) |xn | → ∞ ⇐⇒ lim x1n = 0. 86 (d) Ist xn > 0 für alle n, so gilt: lim xn = 0 ⇐⇒ 1 xn → ∞. Man definiert daher manchmal: a±∞ +∞ + ∞ a·∞ ∞·∞ 1/∞ := := := := := ±∞ für a ∈ R, +∞, −∞ − ∞ := −∞ ( sgn a)∞ für a 6= 0, (−∞)(−∞) := ∞, ∞ · (−∞) := (−∞) · ∞ := −∞, 0, um einen Teil der Rechenregeln in Satz 5.5 auf den Fall uneigentlicher Konvergenz zu erweitern. VORSICHT: Auf keinen Fall ist es möglich, z.B. 0 · ∞ oder +∞ − ∞ sinnvoll zu definieren! Beispielsweise gilt nämlich für die Folgen an := n1 , bn := n13 und cn := n2 : lim an = lim bn = 0, cn → ∞, jedoch an cn → ∞, bn cn → 0. Man überlege sich analog Beispiele die zeigen, dass sich +∞ − ∞ nicht sinnvoll definieren läßt. Die verallgemeinerte Zahlengerade besitzt also nicht die Struktur eines Körpers, sondern sollte eher als ein gelegentlich nützliches Hilfskonstrukt betrachtet werden. Konvergiert für eine unendliche Reihe mit positiven Termen P an ≥ 0 die Folge der Partialsummen uneigentlich gegen ∞, so schreiben wir auch ak = ∞. Beispielsweise ist ∞ P n=1 k 1 n = ∞. Damit lässt sich Satz 5.20 auch folgendermaßen ausdrücken: P Eine unendliche Reihe ak mit nicht-negativen Termen ak ≥ 0 ist divergent genau k P ak = ∞. dann, wenn k 5.5 b-adische Brüche Definitionen. Sei b eine natürliche Zahl ≥ 2. Unter einem b-adischen Bruch versteht man eine Reihe der Gestalt ± ∞ X an b−n . n=−k Dabei ist k ≥ 0, und die an sind natürliche Zahlen mit 0 ≤ an < b. Falls die Basis b festgelegt ist, kann man den b-adischen Bruch auch einfach durch Aneinanderreihung der Ziffern an als unendliche b-adische Zahl ±a−k a−k+1 . . . a−1 a0 , a1 a2 a3 . . . 87 angeben. Für b = 10 spricht man von Dezimalbrüchen, für b = 2 von dyadischen Brüchen. Satz 5.22 Jeder b-adische Bruch konvergiert gegen eine reelle Zahl, und umgekehrt lässt sich jede reelle Zahl in einen b-adischen Bruch entwickeln. Beweis. Um die Konvergenz b-adischer Brüche zu zeigen, genügt es, einen positiven ∞ P b-adischen Bruch an b−n zu betrachten. Dann ist für jedes N ≥ 0 n=−k sN = N −k X n=−k −n an b ≤ also nach Satz 5.17 sN ≤ b1+k · N −k X 1−n b 1+k =b N X b−j , j=0 n=−k 1 bk+2 = . 1 − 1/b b−1 Die Konvergenz folgt daher aus Satz 5.20. Wir wollen nun umgekehrt eine gegebene reelle Zahl x in einen b-adischen Bruch entwickeln. Es genügt dies für x ≥ 0 zu tun. Da bn → ∞, gibt es mindestens eine natürliche Zahl m mit x < bm+1 . Sei k eine solche , d.h. (5.3) 0 ≤ x < bk+1 . Wir definieren nun rekursiv eine Folge (aj )j≥−k−1 von natürlichen Zahlen aj mit 0 ≤ aj ≤ b − 1, so dass für n X aj b−j xn := j=−k−1 stets gilt: (5.4) xn ≤ x < xn + b−n , n ≥ −k − 1. Dazu wählen wir für n = −k − 1 einfach a−k−1 := 0. Offensichtlich gilt dann (5.4) aufgrund von (5.3). Sind nun bereits a−k−1 , . . . , an rekursiv definiert, und gilt (5.4) für n, so unterteilen wir das Intervall [xn , xn + b−n [ in die b disjunkten Teilintervalle Ip := [xn + pb−n−1 , xn + (p + 1)b−n−1 [, p = 0, 1, . . . , b − 1. Es gibt genau ein p mit x ∈ Ip . Wählen wir für an+1 dieses p, so gilt offenbar xn + an+1 b−n−1 ≤ x < xn + an+1 b−n−1 + b−n−1 , d.h. xn+1 ≤ x < xn+1 + b−n−1 , und somit gilt (5.4) auch für n + 1 anstelle von n. 88 Nach (5.4) gilt nun |x − xn | < b−n für alle n ≥ −k, und damit lim xn = x. Also ist ∞ X aj b−j . x= Q.E.D. j=−k Da jede der Partialsummen NP −k aj b−j eine rationale Zahl ist, erhalten wir sofort j=−k Korollar 5.23 Die rationalen Zahlen liegen dicht“ in R, d.h. zu jedem x ∈ R gibt ” es (mindestens) eine Folge rationaler Zahlen (xn )n ∈ QN mit x = lim xn . 89 Kapitel 6 Abzählbare und überabzählbare Mengen Definitionen. Sei X eine nichtleere Menge. X heiße abzählbar, wenn es eine surjektive Abbildung ϕ : N → X gibt, d.h. wenn eine Folge (xk )k∈N existiert mit X = {xk : k ∈ N} (eine solche Folge nennen wir dann auch eine Abzählung von X); andernfalls heiße X überabzählbar. Beispiele. (a) Jede endliche Menge M = {a0 , . . . , an } ist abzählbar. Man wähle xk := ak für k = 0, . . . , n, xk = an für k > n. Dann ist M = {xk , k ∈ N}. (b) Die Menge Z aller ganzen Zahlen ist abzählbar, denn Z ist Bildmenge der Folge (x0 , x1 , x2 , . . . ) := (0, +1, −1, +2, −2, . . . ) (d.h. x0 = 0, und x2k−1 := k, x2k := −k für k ≥ 1). Satz 6.1 Die Vereinigung abzählbar vieler abzählbarer Mengen Xn , n ∈ N, ist wieder abzählbar. Beweis. Sei Xn =S{xnm : m ∈ N}. Wir schreiben die Elemente der Vereinigungsmenge X := Xn in einem quadratischen unendlichen Schema an. n∈N X0 : x00 X1 : x10 ↓ x20 X2 : X3 : X4 : .. . x30 ↓ x40 .. . → x01 x02 → x03 ... ւ ր ւ ր x11 x12 x13 ... ր ւ ր x21 x22 x23 ... ւ ր x31 x32 x33 ... ր ... 90 Die durch die Pfeile angedeutete Abzählvorschrift liefert eine Folge (y0 , y1 , y2 , . . . ) := (x00 , x01 , x10 , x20 , x11 , x02 , x03 , . . . ), deren Bildmenge gleich der Vereinigungsmenge X ist. Q.E.D. Korollar 6.2 Die Menge Q der rationalen Zahlen ist abzählbar. Beweis. Für jede natürliche Zahl n ≥ 1 sind die Mengen k An := : k∈Z n S abzählbar. Nach Satz 6.1 ist somit Q = An abzählbar. n≥1 Q.E.D. Satz 6.3 Die Menge R aller reellen Zahlen ist überabzählbar. Beweis. Wir verwenden das sogenannte Cantorsche Diagonalverfahren. Es genügt zu zeigen, dass das Intervall [0, 1[ nicht abzählbar ist. Nach dem Beweis von Satz 5.22 besitzt jede Zahl x ∈ [0, 1[ eine Dezimalbruchentwicklung der Form ∞ P x= an 10−n mit 0 ≤ an ≤ 9. Wir schreiben dafür auch x = 0, a1 a2 a3 . . . . Ferner n=1 liefert das im Beweis dieses Satzes angegebene Verfahren nur Entwicklungen, bei denen die Folge der an nicht von einem gewissen Index n0 an konstant 9 ist (wieso?). Wir wollen daher nur derartige Dezimalbrüche betrachten. Man zeigt dann relativ leicht, dass zwei verschiedene Folgen (an )n≥1 und (bn )n≥1 mit ∞ ∞ P P dieser Eigenschaft verschiedene reelle Zahlen an 10−n und bn 10−n bestimmen n=1 n=1 (Übung). Angenommen, [0, 1[ wäre abzählbar. Dann gäbe es also eine Folge (xk )k≥1 reeller Zahlen, so dass [0, 1[= {xk : k ≥ 1}. Die Dezimalbruchentwicklungen der xk seien x1 = 0, a11 a12 a13 . . . , x2 = 0, a21 a22 a23 . . . , x3 = 0, a31 a32 a33 . . . , .. . Wir definieren eine Zahl y ∈ [0, 1[ durch deren Dezimalbruchentwicklung y = 0, b1 b2 b3 . . . , 91 welche gegeben sei durch bn := ( 5, 4, falls ann = 6 5, falls ann = 5. Insbesondere gilt bn 6= ann für alle n ≥ 1. Die Dezimalbruchentwicklung von y kann offenbar nicht ab einem gewissen Index n0 an nur Neunen aufweisen (da nur die Ziffern 4 und 5 auftreten). Es muss jedoch laut Annahme ein Index m existieren mit xm = y, d.h. insbesondere mit amm = bm , womit ein Widerspruch hergeleitet ist. Q.E.D. Korollar 6.4 Die Menge R \ Q der irrationalen Zahlen ist überabzählbar. Beweis. Wäre R \ Q abzählbar, so träfe dies nach Korollar 6.2 und Satz 6.1 auch auf R = (R \ Q) ∪ Q zu. Q.E.D. 92 Kapitel 7 Die komplexen Zahlen Der Übergang von den natürlichen zu den ganzen und rationalen Zahlen war motiviert durch den Wunsch, beliebige lineare Gleichungen ax + b = 0 mit a 6= 0 stets lösen zu können. Dies ist natürlich auch in R für a, b ∈ R möglich. Wie sieht dies nun für quadratische Gleichungen der Form ax2 + bx + c = 0 aus? Schon die Gleichung (7.1) x2 + 1 = 0 bzw. x2 = −1 besitzt in R keine Lösung mehr, da x2 ≥ 0 für jedes x ∈ R. Wir stellen uns jetzt vor, dass K ein Erweiterungskörper von R sei, in dem die Gleichung (7.1) lösbar ist. Es gibt also ein Element i ∈ K mit i2 = −1. Offenbar ist dann i 6∈ R. Aufgrund der Körperaxiome enthält K wenigstens alle Zahlen der Form (7.2) x, y ∈ R. z := x + iy, Offenbar ist K ein Vektorraum über R. Ferner sind die Elemente 1 und i linear unabhängig über R, denn ist x′ + y ′i = 0, x′ , y ′ ∈ R, so ist entweder y ′ = 0 oder i = −x′ /y ′ ∈ R, was nicht der Fall ist. Aus y ′ = 0 folgt aber offenbar dann auch x′ = 0. Die lineare Algebra lehrt, dass daher der Realteil x =: Re z und der Imaginärteil y =: Im z von z in (7.2) durch z eindeutig bestimmt sind. Es sei jetzt C := {x + iy ∈ K : x, y ∈ R}. C ist abgeschlossen bzgl. der Addition und der Multiplikation: Sind z := x + iy, z ′ := x′ + iy ′ ∈ C, so ist (7.3) z + z ′ = x + x′ + i(y + y ′) ∈ C, z · z ′ = xx′ + xiy ′ + iyx′ + i2 yy ′, 93 also wegen i2 = −1: (7.4) z · z ′ = xx′ − yy ′ + i(xy ′ + yx′ ). Ferner besitzt z das additive Inverse −z = −x + i(−y), und das multiplikative 1 1 x − iy x − iy Inverse = = = 2 , d.h. z x + iy (x + iy)(x − iy) x + y2 (7.5) x −y 1 = 2 +i 2 , falls z 6= 0. 2 z x +y x + y2 Offenkundig bildet C daher selbst schon einen Erweiterungskörper von R. Unsere Überlegungen zeigen: Falls es überhaupt einen Erweiterungskörper von R gibt, in dem die Gleichung (7.1) lösbar ist, so gibt es einen kleinsten solchen Körper, und dieser ist (“bis auf Isomorphie”) wohlbestimmt: Die Operationen in dieser minimalen Erweiterung sind durch die Formeln (7.3) und (7.4) festgelegt. Der so charakterisierte Körper heißt Körper der komplexen Zahlen und wird mit C bezeichnet. Um die Existenz von C wirklich nachzuweisen, geben wir eine explizite Konstruktion an. Wir wissen ja bereits, dass C einen 2-dimensionalen Vektorraum über R bilden sollte, und dass in Koordinaten (x, y) ∈ R2 bzgl. der Basis 1, i gelten sollte: (7.6) (x, y) + (x′ , y ′ ) = (x + x′ , y + y ′ ), (x, y) · (x′ , y ′ ) = (xx′ − yy ′, xy ′ + yx′). Wir definieren nun einfach C, indem wir auf der Menge R2 eine Addition und eine Multiplikation durch die Formeln (7.6) einführen. Man rechnet leicht nach, dass R2 , versehen mit diesen Operationen, tatsächlich einen Körper bildet. Ferner lässt sich R durch die Einbettung x 7→ x· (1, 0) = (x, 0) als Unterkörper von C auffassen, denn offenbar gilt: (x, 0) + (x′ , 0) = (x + x′ , 0), (x, 0) · (x′ , 0) = (xx′ , 0). Schließlich ist (0, 1)2 = (0, 1) · (0, 1) = (0 · 0 − 1 · 1, 0 · 1 + 1 · 0) = (−1, 0), d.h. die imaginäre Einheit i := (0, 1) löst die Gleichung i2 = −1. Komplexe Zahlen der Gestalt iy mit y ∈ R heißen rein imaginär. Bemerkung. Der Körper C läßt sich nicht anordnen. Andernfalls würde nämlich nach Lemma 4.1 c) gelten i2 ≥ 0, sowie 1 ≥ 0, also −1 ≥ 0 und 1 ≥ 0. Damit folgte 1 = 0, was den Körperaxiomen widerspräche. 94 7.1 Elementare Eigenschaften von C Man veranschaulicht sich die komplexen Zahlen als Punkte einer Ebene, der sogenannten Gaußschen Zahlenebene. y i z = x + iy |z | x 1 −y z Die Addition in C entspricht nach (7.6) dann gerade der Vektoraddition. C besitzt eine ausgezeichnete Selbstabbildung, die (komplexe) Konjugation: z = x + iy 7→ x − iy =: z. Man nennt z die zu z konjugiert komplexe Zahl. z und z liegen spiegelbildlich zur reellen Achse. Die folgenden Regeln sind leicht nachzurechnen: z−z z+z , Im z = , 2 2i (b) z ∈ R ⇐⇒ z = z, (c) z = z, (d) z1 + z2 = z 1 + z 2 , (e) z1 · z2 = z 1 · z 2 . (a) Re z = (7.7) (7.8) Diese Identitäten zeigen insbesondere, dass die Konjugation eine bijektive Selbstabbildung ist, die die algebraische Struktur reproduziert, d.h. ein sogenannter Automorphismus. Sei z = x + iy ∈ C. Dann ist zz = (x + iy)(x − iy) = x2 + y 2 ≥ 0. Somit existiert |z| := √ zz = p x2 + y 2 ≥ 0, und man nennt |z| den (absoluten) Betrag von z. Geometrisch interpretiert ist |z| der Euklidische Abstand des Punktes z vom Ursprung. Offenbar ist |z| = |z|. Satz 7.1 Für alle z, z1 , z2 ∈ C gilt: 95 (i) |z| ≥ 0; |z| = 0 ⇔ z = 0, (ii) |z1 + z2 | ≤ |z1 | + |z2 |, (Dreiecksungleichung), (iii) |z1 z2 | = |z1 | |z2 |, (iv) |Re z| ≤ |z|, |Im z| ≤ |z|. Beweis: (i) und (iv) sind trivial. (iii) Wir haben |z1 z2 |2 = (z1 z2 ) · (z1 z2 ) = z1 z2 z 1 z 2 = z1 z 1 z2 z 2 = |z1 |2 |z2 |2 . Die Behauptung folgt, indem man die Wurzel zieht. (ii) Da nach (iv) stets Re z ≤ |z| gilt, so ist |z1 + z2 |2 = = ≤ = (z1 + z2 )(z 1 + z 2 ) = z1 z 1 + z1 z 2 + z2 z 1 + z2 z 2 |z1 |2 + 2 Re (z1 z 2 ) + |z2 |2 |z1 |2 + 2|z1 | |z2 | + |z2 |2 (|z1 | + |z2 |)2 , also |z1 + z2 | ≤ |z1 | + |z2 |. Q.E.D. Natürlich stimmt für x = x + i · 0 ∈ R der “komplexe” Betrag auf R definierten Betrag überein. 7.2 √ x2 mit dem bereits Konvergenz in C Der Betrag in C besitzt nach Satz 7.1 ganz analoge Eigenschaften wie der in R. Wir definieren daher analog zu R als ε-Umgebung eines Punktes z ∈ C die Menge Uε (z) := {w ∈ C : |w − z| < ε}. ǫ z Entsprechend heißt eine Folge (zn )n∈N komplexer Zahlen konvergent gegen eine komplexe Zahl c, wenn es zu jedem ε > 0 ein n(ε) ∈ N gibt, so dass für alle n ≥ n(ε) die Folgenglieder zn in Uε (c) liegen, d.h. wenn |zn − c| < ε für alle n ≥ n(ε). Eine Teilmenge A ⊂ C heißt beschränkt, wenn es ein reelles R ≥ 0 gibt, so dass |z| ≤ R für alle z ∈ A. Dann gelten in C die Sätze 5.2 und 5.3 genau wie in R, 96 bei identischen Beweisen, d.h. jede konvergente Folge (zn ) in C ist beschränkt und besitzt einen eindeutigen Grenzwert lim zn . Offenbar gilt zn → c genau dann, wenn n→∞ |zn − c| → 0. Satz 7.2 Sei (zn )n eine Folge komplexer Zahlen. Die Folge konvergiert genau dann, wenn die beiden reellen Folgen (Re zn )n und (Im zn )n konvergieren. Im Falle der Konvergenz gilt lim zn = lim (Re zn ) + i lim (Im zn ) . n→∞ n→∞ n→∞ Beweis. Sei zn = xn + iyn , xn , yn ∈ R. a) Die Folge (zn ) konvergiere gegen c = a + ib, a, b ∈ R. Da |xn − a| = |Re (zn − c)| ≤ |zn − c| und |yn − b| = |Im (zn − c)| ≤ |zn − c|, so folgt dann auch lim |xn − a| = lim |yn − b| = 0, d.h. xn → a und yn → b. b) Die beiden Folgen (xn ) und (yn ) seien konvergent gegen a bzw b, d.h. |xn −a| → 0 und |yn − b| → 0. Es sei c := a + ib. Wegen |zn − c| = |(xn − a) + i(yn − b)| ≤ |xn − a| + |i| |yn − b| = |xn − a| + |yn − b| folgt dann auch |zn − c| → 0, d.h. zn konvergiert gegen c. Q.E.D. Definieren wir die Begriffe Cauchy-Folge“, Häufungspunkt“ und unendliche ” ” ” Reihe“ in C genauso wie in R, so behalten sämtliche Sätze über Zahlenfolgen, Häufungspunkte und Reihen, welche wir zuvor bewiesen haben und welche nur vom Begriff des Betrages bzw. der ε-Umgebung Gebrauch machen, nicht jedoch von der Ordnung in R, ihre Gültigkeit. Dies sind explizit die Sätze 5.2, 5.3, 5.5, 5.11, 5.12, 5.13, 5.17, 5.18, Korollar 5.19 und Satz 5.21, in deren Formulierung nötigenfalls “R” durch “C” zu ersetzen sind – die angegebenen Beweise bleiben wortwörtlich auch im komplexen Fall gültig. Auch Theorem 5.14 bleibt wahr: Theorem 7.3 (Bolzano-Weierstraß für C) Jede beschränkte Folge (zn ) komplexer Zahlen besitzt eine konvergente Teilfolge. Beweis. Sei (zn )n eine komplexe Zahlenfolge, und sei |zn | ≤ R für alle n ∈ N. Ist zn = xn + iyn , xn , yn ∈ R, so folgt insbesondere: |xn | ≤ R und |yn | ≤ R für alle n ∈ N. 97 Nach Theorem 5.14 besitzt die reelle Folge (xn )n daher eine konvergente Teilfolge (xnk )k . Es sei a = lim xnk . Wenden wir nun erneut Theorem 5.14 auf die beschränkte k→∞ Folge (ynk )k an, so besitzt diese eine konvergente Teilfolge (ynkℓ )ℓ . Es sei b = lim ynkℓ . ℓ→∞ Dann ist auch a = lim xnkℓ , und damit ist nach Satz 7.2 die Teilfolge (znkℓ )ℓ der ℓ→∞ Folge (zn )n konvergent, und zwar gegen a + ib. Q.E.D. Schließlich bleibt ebenso Theorem 5.16 gültig in C : Theorem 7.4 Eine Folge komplexer Zahlen (zn ) ist konvergent dann und nur dann, wenn sie eine Cauchy-Folge ist. Somit ist auch der Körper C vollständig. Beweis. Dies lässt sich entweder durch wortwörtliche Übernahme des Beweises von Theorem 5.16 beweisen, indem auf Theorem 7.3 zurückgegriffen wird, oder leicht mittels Satz 7.2 direkt auf Theorem 5.16 zurückführen, indem Real- und Imaginärteil der Folgenglieder betrachtet werden. Q.E.D. Insbesondere gelten alle Rechenregeln, wie wir sie für reelle Folgen und Reihen aufgestellt haben, auch für komplexe Folgen und Reihen. 7.3 Algebraische Abgeschlossenheit von C Mit der Gleichung z 2 + 1 = 0 kann man in C auch jede beliebige quadratische Gleichung az 2 + bz + c = 0, a, b, c ∈ C, a 6= 0, lösen. √ Wir werden nämlich sehen, dass jede komplexe Zahl z mindestens eine Wurzel z ∈ C besitzt. Dann sind für √ 2 −b ± b − 4ac Lösungen von az 2 + bz + c, wie a 6= 0 die komplexen Zahlen z± := 2a man leicht nachrechnet. Wie sieht es mit algebraischen Gleichungen höheren Grades aus? Der folgende Satz, welcher hier nicht bewiesen werden soll, lehrt, dass auch diese stets Lösungen in C besitzen, so dass keine neuerlichen Körpererweiterungen von C mehr erforderlich sind, um algebraische Gleichungen lösen zu können. Fundamentalsatz der Algebra. Seien a0 , a1 , . . . , an ∈ C. Sind nicht alle Koeffizienten a1 , . . . , an gleich Null, so besitzt die Gleichung an z n +an−1 z n−1 +· · ·+a1 z+a0 = 0 stets (mindestens) eine Lösung z ∈ C. Die Galois-Theorie lehrt allerdings, dass sich solche Lösungen für Polynome vom Grade 5 und höher nicht mehr durch explizite Formeln“ mit Hilfe von Wurzelaus” ” drücken” wie im quadratischen Fall angeben lassen (N. H. Abel (1802-1829) hatte dies bereits vor E. Galois (1811-1832) für Gleichungen 5. Grades gezeigt, was Galois allerdings wohl nicht bekannt war). 98 Für Polynome vom Grad 3 gibt es noch eine Lösungsformel von G. Cardano (um 1545). Eine kubische Gleichung lässt sich nämlich leicht in folgende Normalform bringen (7.9) x3 + px + q = 0, und für diese lassen sich die Lösungen wie folgt darstellen: s s r r p p 3 q q q 2 q 3 2 3 3 (7.10) x= − + + + − − + . 2 3 2 2 3 2 Selbst wenn p und q reell sind und sämtliche Lösungen x1 , x2 , x3 der Gleichung (7.9) reell sind, treten in der Formel (7.10) oftmals Wurzeln komplexer Zahlen auf. Ein Beispiel ist die Gleichung x3 − 3x + 1 = 0. Eine einfache Kurvendiskussion des Graphen von x 7→ x3 − 3x + 1 zeigt, dass diese Gleichung genau drei reelle Nullstellen besitzt. Der Ausdruck (7.10) für diese lautet jedoch (mit p = −3 und q = 1) s s r r 1 1 1 1 3 3 − + (−1 + + − − (−1 + x = 2 4 2 4 s s √ √ 1 1 3 3 3 3 − +i + − −i . = 2 2 2 2 99 Kapitel 8 Mehr zur Konvergenz von Reihen 8.1 Weitere Konvergenzkriterien für Reihen Wir werden ab jetzt Reihen der Form ∞ P ak betrachten, deren Terme ak reell oder k=0 auch komplex sein dürfen. Eine solche Reihe heiße absolut konvergent, falls die Reihe ∞ P k=0 Beispiel. Die alternierende harmonische Reihe sieht man, indem man die Terme wir folgt sortiert: ∞ X (−1)k+1 k=1 k ∞ P k=1 (−1)k+1 k |ak | konvergiert. ist konvergent. Dies 1 1 1 1 1 = (1 − ) + ( − ) + · · · + ( − )+··· 2 3 4 2k + 1 2k + 2 = 1 1 +···+ +··· , 1·2 (2k + 1)(2k + 2) und die letzte Reihe ist offenbar konvergent (vgl. Beispiel (a) in Kapitel P 1 5.3). Sie ist jedoch nicht absolut konvergent, da die harmonische Reihe divergiert. k k=1 Satz 8.1 Eine absolut konvergente Reihe konvergiert auch im gewöhnlichen Sinn. ∞ P ak eine absolut konvergente Reihe. Nach dem Cauchy-Kriterium Beweis. Sei k=0 P (Satz 5.18) für die Reihe |ak | gibt es zu jedem ε > 0 ein n(ε) ∈ N, so dass k m X k=n |ak | < ε für alle m ≥ n ≥ n(ε). Hieraus folgt mittels der Dreiecksungleichung m m X X |ak | < ε für alle m ≥ n ≥ n(ε). ak ≤ k=n k=n 100 Wiederum nach Satz 5.18 ist somit die Reihe P k ak konvergent. Q.E.D. Für die absolute Konvergenz gibt es eine Anzahl von Kriterien: Satz 8.2 (Majorantenkriterium) Ist (ak )k≥0 eine Folge komplexer Zahlen, und gibt es eine Folge (bk )k≥0 nicht-negativer reeller Zahlen mit |ak | ≤ bk für alle k ≥ 0, ∞ ∞ P P so dass die Reihe bk konvergiert, so konvergiert die Reihe ak absolut. k=0 k=0 Beweis. Für n ≥ 0 gilt: n X k=0 |ak | ≤ n X bk ≤ k=0 Damit konvergiert nach Satz 5.20 die Reihe ∞ X k=0 ∞ P k=0 bk < ∞. |ak |. Q.E.D. Satz 8.3 (Quotientenkriterium) eine Zahl Θ mit 0 ≤ Θ < 1 sowie Existieren ak+1 ein k0 ∈ N, so dass ak 6= 0 und ak ≤ Θ für alle k ≥ k0 gilt, so konvergiert die ∞ P Reihe ak absolut. k=0 Beweis. Da ein Abändern endlich vieler Summanden das Konvergenzverhalten der Reihe nicht ändert, können wir o.B.d.A. annehmen, dass k0 = 0 ist, d.h. dass ak+1 ak ≤ Θ für alle k ≥ 0. Hieraus ergibt sich mittels vollständiger Induktion: |ak | ≤ |a0 |Θk für alle k ≥ 0. Da die Reihe ∞ X k=0 |a0 |Θk = |a0 | ∞ X Θk k=0 für 0 ≤ Θ < 1 konvergiert (geometrische Reihe), konvergiert somit die Reihe nach dem Majorantenkriterium absolut. P ak k Q.E.D. Beispiel. Die Reihe P∞ n=1 n2−n ist konvergent, da n+11 3 (n + 1)2−(n+1) = ≤ <1 −n n2 n 2 4 101 für n ≥ 2. Achtung: Das Quotientenkriterium gibt eine hinreichende, jedoch keine notwendige Bedingung für die Konvergenz einer Reihe. Beispielsweise haben wir gesehen, dass ∞ X 1 konvergiert. Es gilt jedoch die Reihe 2 n n=1 1/(n + 1)2 = 1/n2 n n+1 2 →1 1/(n + 1)2 ≤ Θ < 1 für alle n, und somit greift 1/n2 das Quotientenkriterium hier nicht. ak+1 Es sei ferner ausdrücklich erwähnt, dass die Bedingung ak < 1 für alle k nicht P = hinreichend für die Konvergenz der Reihe ak ist. Beispielsweise gilt 1/(n+1) 1/n P∞ 1 n < 1 für alle n, die Reihe n=1 n divergiert jedoch. n+1 für n → ∞, d.h. es gibt kein Θ mit Ein weiteres wichtiges Konvergenzkriterium liefert der folgende Satz 8.4 (Wurzelkriterium, schwache Form) Existieren eine Zahl Θ mit 0 ≤ p k Θ < 1 sowie ein k0 ∈ N, so dass |ak | ≤ Θ für alle k ≥ k0 gilt, so konvergiert die ∞ X ak absolut. Reihe k=0 p Beweis. Aus k |ak | ≤ Θ folgt |ak | ≤ Θk für alle k ≥ k0 . Damit können wir wie im Beweis von Satz 8.3 argumentieren. Q.E.D. Das Wurzelkriterium lässt sich noch verfeinern. Dazu führen wir im folgenden Abschnitt weitere fundamentale Begriffe ein, welche auch in anderen Zusammenhängen von großer Bedeutung sind. 8.2 Limes superior und Limes inferior Definitionen. a) Wir setzen zunächst die Ordnung auf R zu einer totalen Ordnung ≤ auf der erweiterten Zahlengeraden R = R∪{−∞, +∞} fort, indem wir definieren, dass −∞ ≤ a und a ≤ +∞ für alle a ∈ R. b) Es sei (an )n∈N eine Folge reeller Zahlen. Wir setzen für n ∈ N An := {ak : k ≥ n}, sowie an := sup An ∈ R ∪ {+∞}, an := inf An ∈ R ∪ {−∞}. 102 Aus An+1 ⊂ An folgt dann an ≤ an+1 ≤ an+1 ≤ an (8.1) für alle n. Insbesondere ist die Folge (an )n monoton steigend, und die Folge (an )n monoton fallend. Zudem gilt an ≤ am (8.2) für alle n, m, denn ist m ≥ n, so folgt aus (8.1) per Induktion nach m sofort an ≤ am ≤ am , und ist m < n, so folgt aus (8.1) analog an ≤ an ≤ am . Aus (8.2) folgt nun a := sup{an : n ∈ N} ≤ a := inf{an : n ∈ N}. a ∈ R bezeichnet man als den Limes inferior, a ∈ R als den Limes superior der Folge (an )n∈N , und schreibt dafür auch: a =: lim inf an (oder auch a =: lim an ) a =: lim sup an (oder auch a =: lim an ). n→∞ n→∞ bzw. n→∞ n→∞ Es gilt dann also a0 ≤ a1 ≤ a2 ≤ · · · ≤ an · · · ≤ a ≤ a ≤ · · · ≤ an ≤ · · · ≤ a2 ≤ a1 ≤ a0 . Ist die Folge (an )n∈N beschränkt, und ist genauer für alle n ∈ N, s ≤ an ≤ S mit s, S ∈ R, so ist offenbar s ≤ an ≤ am ≤ S für alle n, m, und somit s ≤ a ≤ a ≤ S. Insbesondere liegen dann a und a in R. Da die Folge (an )n wachsend und die Folge (an )n fallend ist, gilt nach Satz 5.4 ferner für jede beschränkte Folge (an )n∈N : lim inf an = lim an = lim (inf An ), n→∞ (8.3) n→∞ lim an = lim (sup An ). lim sup an = n→∞ n→∞ n→∞ a0 n→∞ a1 a2 a3 a4 a3 a4 3 4 a a a0 a1 a2 1 2 5 103 6 7 8 9 n Es sei auch noch daran erinnert, dass wir ∞ (bzw. −∞) als uneigentlichen Häufungspunkt der Folge (an )n bezeichnen, wenn es eine Teilfolge (ank )k gibt mit ank → ∞ (bzw. ank → −∞). Dies ist offenbar gleichbedeutend damit, dass die Folge (an )n nicht nach oben (bzw. nach unten) beschränkt ist. Unsere Definitionen des Limes Inferior und Limes superior mögen auf den ersten Blick sehr technisch erscheinen. Die wahre Bedeutung dieser Begriffe erschließt sich jedoch durch den folgenden Satz bzw. das nachfolgende Korollar, welches sich unmittelbar aus dem Satz ergibt. Satz 8.5 Sei (an )n eine reelle Zahlenfolge. (i) Dann besitzt diese einen größten (eventuell uneigentlichen) Häufungspunkt, und zwar ist dies gerade lim sup an . Entsprechend ist lim inf an gerade der kleinn→∞ n→∞ ste (eventuell uneigentliche) Häufungspunkt. (ii) Ist c ∈ R mit lim sup an < c, so gibt es nur endlich viele k mit ak ≥ c, und n→∞ ist d ∈ R mit lim inf an > d, so gibt es entsprechend nur endlich viele k mit n→∞ ak ≤ d. Korollar 8.6 Bezeichnet H ⊂ R die Menge aller eigentlichen oder auch uneigentlichen Häufungspunkte der Folge (an )n ∈ RN , so gilt bzgl. der Ordnung auf R lim sup an = sup H = max H, n→∞ lim inf an n→∞ = inf H = min H. Beweis. Wir zeigen jeweils nur die Aussagen über den größten Häufungspunkt; die Aussagen über den kleinsten Häufungspunkt werden analog bewiesen. (i) Ist a = ∞, so ist die Aussage in (i) offenkundig wahr. Sei also a ∈ R, und sei ε > 0. Dann gibt es ein n0 (ε) ∈ N, so dass für alle n ≥ n0 (ε) gilt: an ∈ Uε (a). Insbesondere ist dann an < ∞ für genügend großes n. Damit ist aber die Folge (an )n nach oben beschränkt. Aufgrund der Definition von an = sup An liegen ferner auch unendlich viele Folgenglieder ak in Uε (a), d.h. a ist ein Häufungspunkt der Folge (an )n . Sei b dann ein beliebiger, eventuell uneigentlicher Häufungspunkt der Folge (an )n . Wir zeigen, dass b ≤ a ist, womit dann die Behauptung folgt. Für b = −∞ ist dies klar. Sei also b ∈ R. Dann gibt es eine Teilfolge (ank )k mit b = lim ank . k→∞ Da für jedes m ∈ N die Zahl sup{ank : k ≥ m} eine obere Schranke für die Menge aller ank mit k ≥ m bildet, folgt dann mit Korollar 5.7 b ≤ sup{ank : k ≥ m} ≤ sup{an : n ≥ nm } = anm , 104 und damit b ≤ a, da mit der Folge (an )n auch die Teilfolge (anm )m gegen a konvergiert. (ii) Ist lim sup an < c, so gibt es ein m mit am < c, d.h. an < c für alle n ≥ m. n→∞ Q.E.D. Satz 8.7 Die reelle Folge (an )n∈N konvergiert dann und nur dann, wenn lim inf an = a = lim sup an = a ∈ R ist, d.h., wenn sie genau einen, endlichen Häufungspunkt besitzt. Beweis. (i) Konvergiert die Folge (an )n gegen a ∈ R, so besitzt sie nach den Sätzen 5.12 und 5.13 genau einen Häufungspunkt, nämlich a, und nach Korollar 8.6 ist dann a = a = a. (ii) Sei a = a =: a ∈ R, und sei ε > 0. Nach Satz 8.5 (ii) gibt es nur endlich viele n mit an ≥ a + ε, und ebenso nur endlich viele n mit an ≤ a − ε. Für alle genügend großen n, sagen wir n ≥ n0 , gilt somit a − ε < an < a + ε, d.h. an ∈ Uε (a). Folglich konvergiert (an )n gegen a. 8.3 Q.E.D. Das Wurzelkriterium Das schwache Wurzelkriterium aus Satz 8.4 lässt sich nun wie folgt verbessern: Satz 8.8 (Wurzelkriterium) Sei (ak )k≥0 eine Folge komplexer Zahlen, und sei ∞ p P s := lim sup k |ak |. Ist s < 1, so konvergiert die Reihe ak absolut, und ist s > 1, k→∞ k=0 so divergiert sie. Beweis. Ist s < 1, so wähle ein Θ mit s < Θ < 1. Nach Satz 8.5 (ii) gibt es dann ∞ p P ak folgt nun ein k0 mit k |ak | ≤ Θ für alle k ≥ k0 . Die Konvergenz der Reihe k=0 mit Satz 8.4. p Ist dagegen s > 1, so ist für unendlich viele k offenbar k |ak | ≥ 1, d.h. |ak | ≥ 1. Damit ist die Reihe nach Korollar 5.19 divergent. Q.E.D. Achtung: Ist s = 1 in Satz 8.8, so kann man weder auf Konvergenz noch auf Divergenz der Reihe schließen; vergleiche dazu die Beispiele 8.10. 105 8.4 Potenzreihen. Das Wurzelkriterium lässt sich besonders nutzbringend auf die wichtige Klasse der Potenzreihen anwenden. Definitionen. Eine Reihe der Form ∞ X an z n , n=0 z ∈ C, heißt Potenzreihe in z. Die reellen oder komplexen Zahlen an heißen die Koeffizienten der Potenzreihe. Für eine feste Koeffizientenfolge (an )n∈N hängt die Potenzreihe nur von z ∈ C ab. Wir schreiben (8.4) P (z) = ∞ X an z n , n=0 z ∈ C. P n P (z) steht hier also für die Folge der Partialsummen ( N n=0 an z )N . Wollen wir andeuten, dass wir uns nur für reelle Werte von z interessieren, so schreiben wir anstelle von z oftmals x, bzw. genauer P (x) = ∞ X an xn , n=0 x ∈ R. Satz 8.9 (Cauchy-Hadamard) Sei S := lim sup n→∞ p n |an |, und sei R := 1/S, wobei in diesem Zusammenhang definitionsgemäß 1/∞ := 0 und 1/0 := ∞ sei. Die Potenzreihe P (z) konvergiert absolut für alle z ∈ C mit |z| < R , und sie divergiert für alle z ∈ C mit |z| > R. Beweis.pFür z = 0 ist die Aussage trivial. Sei also z 6= 0, und setze s := lim sup n |an z n |. Dann gilt offenbar s = S|z|, und somit ist |z| < R genau dann, wenn s < 1, und |z| > R genau dann, wenn s > 1. Die Behauptung folgt damit unmittelbar aus dem Wurzelkriterium Satz 8.8 Q.E.D. Definition. Die Zahl R in Satz 8.9 heißt der Konvergenzradius der Potenzreihe P (z) (dieser kann auch ∞ sein). Nach Satz 8.9 ist R charakterisiert als dasjenige r ∈ [0, ∞] := [0, ∞[∪{∞}, für welches die Potenzreihe P (z) für |z| < r konvergent, und für |z| > r divergent ist. Das Konvergenzverhalten für z auf dem Kreis |z| = R hängt von den an ab, und es kann i.a. für solche z sowohl Konvergenz als auch Divergenz vorliegen. Konvergiert die Reihe in z, so bezeichnet man den Wert der Reihe in z meist ebenfalls mit P (z). Dies ist formal eigentlich nicht ganz korrekt, da damit dem Symbol P (z) zweierlei Bedeutung zukommt: zum einen bezeichnet es die formale Potenzreihe 106 (8.4), zum anderen den Wert dieser Reihe im Punkte z, d.h. eine komplexe Zahl. Aus dem Kontext ist in der Regel jedoch ersichtlich, welche Bedeutung gerade gemeint ist. Beispiele 8.10 a) Die Potenzreihe ∞ X zn n=1 n besitzt den Konvergenzradius R = 1. Wie in den Übungen gezeigt, ist nämlich √ (8.5) lim n n = 1, n→∞ q q und somit auch limn→∞ n n1 = 1, so dass insbesondere lim supn→∞ n n1 = 1. Man kann dies leicht auch ohne die Grenzwertbeziehung (8.5) wie folgt einsehen: n Für |z| < 1 gilt nämlich |zn | ≤ |z|n , d.h. durch Vergleich mit der geometrischen Reihe P ∞ n n=1 |z| sieht man, dass die Reihe P (z) absolut konvergiert. Somit ist sicherlich R ≥ 1. Wäre nun R > 1, so müßte die Reihe insbesondere für z = 1 konvergieren. P 1 Für z = 1 erhält man jedoch die harmonische Reihe ∞ , n=1 n welche divergiert. Also ist R = 1. Man kann q daraus übrigens umgekehrt mit Satz 8.9 auch wiederum (8.5) herleiten: Die Folge 1 n ist nämlich für genügend große n monoton wachsend (dies zeigt man q q relativ leicht), so dass 1 = 1/R = lim sup n n1 = lim n n1 . n n→∞ n→∞ Für z = −1 erhält man bis auf das Vorzeichen die alternierende harmonische Reihe ∞ X (−1)n+1 . n n=1 Wir werden später mit Hilfe des Abelschen Konvergenzkriteriums einen weiteren Beweis dafür geben, dass diese konvergiert. √ P n zn b) Aus (8.5) folgt lim n2 = 1, so dass auch die Reihe ∞ n=1 n2 den Konvergenzn→∞ radius 1 besitzt. Diese konvergiert für alle z mit |z| = 1 absolut. 8.5 Die Exponentialreihe Satz 8.11 Für jedes z ∈ C ist die Exponentialreihe exp z := ∞ X zn n=0 n! absolut konvergent. Sie besitzt also den Konvergenzradius R = ∞. 107 z n+1 z n / n! = Beweis. Sei z 6= 0 gegeben. Dann gilt (n+1)! |z| n+1 ≤ |z| |z|+1 |z| . n+1 Für n ≥ |z| ist aber =: Θ < 1, so dass die Behauptung aus dem Quotientenkriterium folgt. Q.E.D. Wir werden mit exp z ebenfalls den Wert der Exponentialreihe in z bezeichnen. Für x ∈ R ist offenbar exp x ebenfalls in R. Die Abbildung exp : R → R, x 7→ exp x wird als Exponentialfunktion bezeichnet, während wir die Abbildung exp : C → C, z 7→ exp z als die komplexe Exponentialfunktion bezeichnen wollen (das Symbol exp“hat für uns also verschiedene Bedeutungen – streng genommen hätten ” wir jeweils unterschiedliche Symbole verwenden müssen). Für x = 1 erhalten wir die Eulersche Zahl e := exp 1 = ∞ X 1 . n! n=0 Wir wollen (exp z1 )(exp z2 ) berechnen. Dazu beweisen wir allgemeiner folgenden Satz über das Produkt von Reihen, welcher im Kern einen wichtigen Spezialfall des später zu beweisenden Umordnungssatzes für Reihen darstellt: Satz 8.12 (Cauchy-Produkt von Reihen) Es seien lut konvergente komplexe Reihen. Für n ∈ N setzen wir cn := n X P∞ k=0 ak und P∞ k=0 bk abso- an−ℓ bℓ . ℓ=0 Dann ist auch die Reihe P∞ n=0 cn absolut konvergent, und es gilt ! ∞ ! ∞ ∞ X X X cn = ak bℓ . n=0 k=0 ℓ=0 Bemerkung. Die absolute Konvergenz ist wesentlich für die Gültigkeit des Satzes. Beweis. Für jedes N ∈ N gilt: N X k=0 sowie, da cn = P ak ! N X ℓ=0 bℓ ! = X ak bℓ , 0≤k≤N 0≤ℓ≤N ak bℓ ist, {(k,ℓ)∈N2 : k+ℓ=n} N X n=0 cn = X {(k,ℓ)∈N2 : 108 k+ℓ≤N } ak bℓ . Folglich ist N X cn − N X n=0 ak k=0 ! N X ℓ=0 ! bℓ X X |ak bℓ | =: RN . ak bℓ ≤ = 0≤k,ℓ≤N 0≤k,ℓ≤N k+ℓ>N k+ℓ>N (8.6) Ist nun k + ℓ > N, so ist wenigstens eine der Zahlen k oder ℓ größer als N/2. Daher ist X X |ak | |bℓ | RN ≤ |ak | |bℓ | + 0≤k≤N N/2<ℓ≤N N/2<k≤N 0≤ℓ≤N (8.7) X = N/2<k≤N X ≤ N/2<k≤N P∞ |ak | X 0≤ℓ≤N |bℓ | ! |ak | B + A X + 0≤k≤N X N/2<ℓ≤N P∞ ! |ak | X N/2<ℓ≤N |bℓ | |bℓ | , wobei wir AP := k=0 |ak | < ∞, B := ℓ=0 |bℓ | < ∞ gesetzt haben. Da die Reihen P von (8.7) nach dem k ak und ℓ bℓ absolut konvergieren, strebt die rechte Seite P P ak ak → ∞ Cauchy-Kriterium für N → ∞ gegen 0, also auch RN . Da ferner N k=0 PN P∞ Pk=0 ∞ sowie ℓ=0 bℓ → ℓ=0 bℓ für N → ∞, so folgt aus (8.6), dass die Reihe n=0 cn konvergiert, und dass ! ∞ ! ∞ ∞ X X X cn = ak bℓ . (8.8) n=0 k=0 ℓ=0 Ersetzen wir schließlich ak durch |ak | sowie bℓ durch |bℓ | in obigem Argument, so folgt nach (8.8): ! ∞ ! ∞ ∞ X X X c̃n = |ak | |bℓ | < ∞, n=0 wobei c̃n := Pn so konvergiert ℓ=0 k=0 ℓ=0 |an−ℓ | |bℓ |. Da jedoch |cn | ≤ P∞ n=0 cn n X ℓ=0 |an−ℓ | |bℓ | = c̃n , nach dem Majorantenkriterium absolut. Es seien nun z1 , z2 ∈ C gegeben. Wir setzen ak := z1k zℓ , bℓ := 2 , k! ℓ! 109 Q.E.D. sowie cn n X z1n−ℓ z2ℓ an−ℓ bℓ = := (n − ℓ)!ℓ! ℓ=0 ℓ=0 n 1 X n n−ℓ ℓ z z. = n! ℓ=0 ℓ 1 2 n X Nach der binomischen Formel (3.3) ist dann cn = (z1 + z2 )n , n! und mittels Satz 8.11 und Satz 8.12 erhalten wir unmittelbar Satz 8.13 (Funktionalgleichung der Exponentialfunktion) Es gilt (8.9) (exp z1 )(exp z2 ) = exp(z1 + z2 ) für alle z1 , z2 ∈ C. Korollar 8.14 Sei z ∈ C. Dann gilt (i) exp z 6= 0, und (exp z)−1 = exp(−z). (ii) exp z = exp z. (iii) Ist x ∈ R, so ist exp x > 0. (iv) exp m = em für jede ganze Zahl m ∈ Z. Bemerkung. Die Formel exp m = em , m ∈ Z, verallgemeinernd wollen wir künftig für exp z auch ez , z ∈ C, schreiben. Beweis. (i) Nach (8.9) ist (exp z)(exp(−z)) = exp 0 = 1, woraus (i) folgt. P P N zn zn (ii) Es gilt = N n=0 n! für jedes N ∈ N. Ferner zeigt Satz 7.2, dass eine n=0 n! Folge komplexer Zahlen cn gegen c ∈ C konvergiert dann und nur dann, wenn die Folge cn gegen c strebt. Somit folgt (ii) mittels Grenzübergang für N → ∞. P∞ xn (iii) Für x ≥ 0 ist sicherlich exp x = n=0 n! ≥ 1 > 0. Für x < 0 ist nach (i) exp x = (exp(−x))−1 , wobei exp(−x) > 0. Folglich ist ebenfalls exp x > 0. (iv) Für m ∈ N erhält man per Induktion mit (8.9) leicht, dass exp m = em gilt. Ist m ∈ Z \ N, so ist nach (i) exp m = (exp(−m))−1 = ((e−m )−1 = em . Q.E.D. 110 8.6 Bedingt konvergente Reihen. P Bei absolut konvergenten Reihen Konvergenz allein durch das k ak kommt die P “Kleinwerden” der Beträge |ak | zustande. Eine Reihe k ak , welche konvergent ist, jedoch nicht absolut konvergent ist, heiße bedingt konvergent. Für solche Reihen kommt die Konvergenz in erster Linie durch den Ausgleich zwischen positiven und negativen Folgengliedern (zumindest bei reellen Reihen) zustande. Eine große Klasse bedingt konvergenter Reihen wird durch den folgenden Satz erfaßt: Satz 8.15 (Abelsches Konvergenzkriterium) Sind die Partialsummen der (reP a beschränkt, und ist (pk )k∈N eine monoton falellen oder komplexen) Reihe ∞ k=0 k P lende Nullfolge reeller Zahlen pk ≥ 0, so ist die Reihe ∞ k=0 ak pk konvergent. Beweis: Wir benötigen folgende Formel, welche in Analogie zur Formel der partiellen Integration auch partielle Summationsformel genannt wird: Seien (pk )k und (sk )k beliebige Zahlenfolgen. Dann gilt für alle m ≥ n + 1: m X (8.10) k=n+1 pk (sk − sk−1 ) = (pm+1 sm − pn+1 sn ) − m X (pk+1 − pk )sk . k=n+1 Zum Beweis zerlegen wir die linke Seite von (8.10) in zwei Summen und ersetzen in der zweiten den Summationsindex k durch k + 1. Es ergibt sich m X k=n+1 pk (sk − sk−1 ) = = m X k=n+1 m X pk sk − pk sk − k=n+1 m X = − m−1 X pk+1 sk k=n m X k=n+1 pk+1sk + pm+1 sm − pn+1 sn (pk+1 − pk )sk + pm+1 sm − pn+1 sn . k=n+1 Um nun Satz 8.15 zu beweisen, setzen wir sn := n X ak . k=0 Nach Voraussetzung gibt es ein M > 0, so dass |sn | ≤ M ist für alle n ∈ N. Für beliebige m ≥ n + 1 ≥ 0 gilt nach (8.10) m X k=n+1 ak pk = m X k=n+1 pk (sk − sk−1 ) = pm+1 sm − pn+1 sn − 111 m X (pk+1 − pk )sk , k=n+1 und da die Folge (pk )k fallend ist folgt hieraus weiter m m X X (pk − pk+1 )|sk | ak pk ≤ pm+1 |sm | + pn+1 |sn | + k=n+1 k=n+1 ! m X (pk − pk+1 ) M. ≤ pm+1 + pn+1 + k=n+1 Der teleskopische Ausdruck wir erhalten (8.11) Pm k=n+1 (pk − pk+1 ) summiert sich zu pn+1 − pm+1 und m X ak pk ≤ 2pn+1 M. k=n+1 Zu gegebenem ε > 0 gibt es nun ein n0 ∈ N, so dass pn < ist für m ≥ n + 1 ≥ n0 nach (8.11) m X ak pk < ε, ε 2M für alle n ≥ n0 . Somit k=n+1 und die betrachtete Reihe konvergiert nach dem Cauchy-Kriterium. Fehlerabschätzung. Sei w := wir P∞ k=0 Q.E.D. ak pk der Wert der Reihe in Satz 8.15. Setzen n X ak : n ∈ N}, S := sup{ k=0 so können wir M := S in (8.11) wählen, und für m → ∞ folgt ∞ X ak pk ≤ 2pn+1S, k=n+1 d.h. (8.12) |w − n X k=0 ak pk | ≤ 2S pn+1 . Beispiel. Die alternierende harmonische Reihe Setzen wir pk := k1 , ak := (−1)k+1 , so ist wegen ( n n X X 1, sn := ak = (−1)k+1 = 0, k=1 k=1 112 ∞ X (−1)k+1 k=1 k . falls n ungerade, falls n gerade, die Folge der Partialsummen der ak beschränkt, während die Folge (pk )k = ( k1 )k eine fallende Nullfolge ist. Die Reihe konvergiert also nach Satz 8.15. Allgemein weist man mittels Satz 8.15 nach, dass jede alternierende Reihe, d.h. jede Reihe der Gestalt ∞ X (−1)k pk k=0 mit monoton fallender reeller Nullfolge (pk )k konvergent ist (Leibnizsches Kriterium). Für den Wert einer solchen Reihe läßt sich die Fehlerabschätzung (8.12) noch um den Faktor 1/2 verbessern (vgl. [B, (7.17)]). 8.7 Umordnung von Reihen P∞ Sei P k=0 ak eine komplexe Reihe. Ist σ : N → N eine Permutation, so heißt die Reihe ∞ k=0 aσ(k) eine Umordnung der gegebenen Reihe. Satz konvergenten Reihe P∞ 8.16 (Umordnungssatz) Jede Umordnung einer absolutP ∞ k=0 ak ist absolut konvergent und besitzt denselben Wert wie k=0 ak . Beweis. Zu ε > 0 gibt es nach dem Cauchy-Kriterium für Reihen ein N ∈ N mit m X k=N +1 |ak | < ε für alle m > N. P Für m → ∞ ergibt sich daraus die Abschätzung ∞ k=N +1 |ak | ≤ ε. Es sei nun σ : N → N eine Permutation von N. Dann gibt es ein M ∈ N mit {0, . . . , N} ⊂ {σ(0), . . . , σ(M)}. Für n ≥ N und m ≥ M gilt somit: | m X k=0 aσ(k) − n X k=0 ak | ≤ ∞ X k=N +1 |ak | ≤ ε. Im Grenzwert für n → ∞ ergibt sich daraus | m X k=0 aσ(k) − ∞ X k=0 ak | ≤ ε, m ≥ M. P ak konDies zeigt, dass die Umordnung k=0 aσ(k) gegen den Wert der Reihe vergiert. Ersetzen wir in diesen Betrachtungen a durch |a |, so finden wir entsprek k P∞ chend, dass die umgeordnete Reihe |a | der Beträge gegen den Wert von σ(k) P P k=0 |ak | konvergiert, d.h. die Reihe k aσ(k) ist absolut konvergent. Q.E.D. P∞ Ist eine Reihe dagen nur bedingt konvergent, so gilt der folgende 113 P∞ Satz 8.17 (Umordnungssatz von Riemann) Die reelle Reihe k=0 ak sei bedingt konvergent, und es sei ξ ∈PR eine beliebige reelle Zahl. Dann gibt es eine Permutation σ : N → N, so dass ∞ k=0 aσ(k) konvergiert und den Wert ξ besitzt. Dieser erstaunliche Satz, welcher als Übung gelassen sei, zeigt, dass beim Umgang mit bedingt konvergenten Reihen Vorsicht geboten ist – die Analogie im Verhalten endlicher Summen und unendlicher absolut konvergenter Reihen, welche durch Satz 8.16 ausgedrückt wird, nämlich die Gültigkeit des Kommutativitätsgesetzes, bricht bei bedingt konvergenten Reihen dramatisch zusammen. Dazu ein konkretes Beispiel. Wir ordnen die alternierende harmonische Reihe S =1− 1 1 1 1 1 + − +···+ − + ... 2 3 4 2k − 1 2k so um, dass auf ein positives Glied zwei negative folgen: T =1− 1 1 1 1 1 1 1 1 − + − − +···+ − − + ···+ .... 2 4 3 6 8 2k − 1 4k − 2 4k Zum Nachweis der Konvergenz von T vergleichen wir die Partialsummenfolge t3 , t6 , t9 , . . . dieser Reihe mit den Partialsummen sn von S. Wegen 1 1 1 1 1 1 − − = − 2k − 1 4k − 2 4k 2 2k − 1 2k ist t3n = n X k=1 2n 1 1 1 X (−1)m+1 1 1 = − − = s2n . 2k − 1 4k − 2 4k 2 m=1 m 2 Da s2n → S, und da die Glieder der Reihe T eine Nullfolge bilden, gibt es zu jedem ε > 0 ein N ∈ N, so dass für n > N gleichzeitig gilt: 1 ε |t3n − S| < , 2 2 ε |t3n+1 − t3n | < , 2 ε |t3n+2 − t3n | < . 2 Hieraus folgt |tm − 12 S| < ε für alle m > 3N + 2, d.h. die umgeordnete Reihe T konvergiert zwar, aber nicht gegen S, sondern gegen 21 S. Diese Beispiel zeigt deutlich, dass das Kommutativitätsgesetz für diese unendliche, bedingt konvergente Reihe ungültig ist! 114 Kapitel 9 Stetige Funktionen 9.1 Grenzwerte von Funktionen Im Folgenden stehen E und F jeweils für R oder C, und wir werden Funktionen f betrachten, deren Definitionsbereich D(f ) in E und deren Werte in F liegen. Hierunter fallen insbesondere die auf einem Intervall definierten reellwertigen Funktionen. Wir wollen zunächst das Verhalten von f (x) studieren, wenn sich x ∈ D(f ) einem Punkt ξ ∈ E nähert. Dies macht natürlich nur Sinn, wenn es in jeder noch so kleinen ε-Umgebung von ξ Punkte aus D(f ) gibt. Definitionen. Sei ε > 0. Die Menge U̇ε (ξ) := Uε (ξ) \ {ξ} = {x ∈ E : 0 < |x − ξ| < ε} wird als punktierte ε-Umgebung von ξ ∈ E bezeichnet. (Sinngemäß ist U̇ε (±∞) := Uε (±∞), falls E = R ist.) ξ ∈ E heiße Häufungspunkt der Menge A ⊂ E, wenn U̇ε (ξ) ∩ A 6= ∅ für jedes ε > 0, d.h., wenn in jeder noch so kleinen ε-Umgebung von ξ ein Punkt a ∈ A liegt mit a 6= ξ. Ein Häufungspunkt von A braucht nicht zu A gehören. Häufungspunkte von Mengen lassen sich auch leicht wie folgt charakterisieren (Übung): ξ ∈ E ist ein Häufungspunkt von A dann und nur dann, wenn es (mindestens) eine Folge (an )n in A \ {ξ} gibt, welche gegen ξ konvergiert. Beispiele. a) Die Häufungspunkte der Menge A :=]0, 1[⊂ R sind die Punkte des abgeschlossenen Intervalls [0, 1]. b) Jede reelle Zahl ξ ist Häufungspunkt der Menge Q ⊂ R. c) Ist ξ ein Häufungspunkt der Folge (an )n , so braucht ξ nicht ein Häufungspunkt der Menge A := {an : n ∈ N} der Folgenglieder zu sein: Man betrachte etwa die konstante Folge, an := ξ für alle n ∈ N. Hier ist U̇ε (ξ)∩A = ∅ für alle ε > 0, d.h. die Menge A besitzt keinen Häufungspunkt, während die Folge den Häufungspunkt ξ besitzt. 115 ACHTUNG: Der Begriff des Häufungspunktes einer Menge und der des Häufungspunktes einer Folge sind zu unterscheiden! Ein Punkt ξ ist ein Häufungspunkt der Menge A dann und nur dann, wenn es eine Folge (an )n in A\{ξ} gibt mit lim an = ξ. Dies ist nicht gleichbedeutend damit, dass ξ ein Häufungspunkt einer Folge in A ist, da ja an 6= ξ verlangt wird! ∞ bzw. −∞ heißen uneigentliche Häufungspunkte von A ⊂ R, wenn es eine Folge (an )n in A gibt mit an → ∞ bzw. an → −∞ (d.h., wenn für jedes ε > 0 in Uε (∞) bzw. Uε (−∞) wenigstens ein Element von A liegt). Beispiele. Die Mengen N und auch ]c, ∞[ besitzen ∞ als uneigentlichen Häufungspunkt. Ist der Punkt a ∈ A kein Häufungspunkt von A, so heißt a ein isolierter Punkt von A. a ist also isoliert in A dann und nur dann, wenn es ein δ > 0 gibt, so dass die δ− Umgebung Uδ (a) von a außer a keinen weiteren Punkt aus A enthält. Definitionen. Sei f : A → W eine Funktion, wobei A ⊂ E und W ⊂ F sei. Der Einfachheit halber nehmen wir an, dass W = F ist, d.h. W = R oder W = C, obwohl dies für die folgenden Betrachtungen nicht notwendig ist. Sei ξ ein eigentlicher oder uneigentlicher Häufungspunkt von A. Wir sagen, die Funktion f besitze für x → ξ den Grenzwert η ∈ F , in Zeichen: f (x) → η für x → ξ, wenn es zu jedem ε > 0 ein δ = δ(ε) > 0 gibt, so dass f (x) ∈ Uε (η) ist für alle x ∈ U̇δ (ξ) ∩ A. (9.1) Für einen endlichen Punkt ξ heißt dies: Zu jedem ε > 0 gibt es ein δ > 0, so dass gilt: |x − ξ| < δ, x ∈ A \ {ξ} =⇒ |f (x) − η| < ε. (9.2) U̇δ (ξ) ∩ A 1111 0000 0000 1111 0000 1111 Uǫ (η) ξ f x 111 000 000 111 000 111 η f (x) f (A) A Offenbar spielt der Wert f (ξ) von f für x = ξ für die Bestimmung des Grenzwertes von f für x → ξ keine Rolle. 116 Satz 9.1 Es sei ξ ∈ E ein Häufungspunkt von A ⊂ E. f : A → F besitzt η ∈ F als Grenzwert für x → ξ dann und nur dann, wenn für jede Folge (xn )n in A \ {ξ} mit xn → ξ gilt: f (xn ) → η. Eine analoge Charakterisierung gilt für den Fall eines uneigentlichen Häufungspunktes ξ. Beweis: Wir nehmen zunächst an, dass gilt f (x) → η für x → ξ. Sei (xn )n eine Folge in A \ {ξ} mit xn → ξ, und sei ε > 0. Wähle dann δ > 0 so, dass f (x) ∈ Uε (η) ist für alle x ∈ U̇δ (ξ) ∩ A. Da xn 6= ξ ist für alle n, existiert zu δ ein n0 = n0 (δ) ∈ N, so dass gilt: xn ∈ U̇δ (ξ) für alle n ≥ n0 . Folglich ist f (xn ) ∈ Uε (η) für n ≥ n0 , und es folgt: f (xn ) → η. Es gelte nun umgekehrt, dass f (xn ) → η für jede Folge (xn )n in A \ {ξ} mit xn → ξ. Sei ε > 0. Gäbe es nun kein δ > 0, so dass f (x) ∈ Uε (η) für alle x ∈ U̇δ (ξ) ∩ A, so gäbe es insbesondere zu jedem n ≥ 1 ein yn ∈ U̇1/n (ξ) ∩ A mit f (yn ) 6∈ Uε (η). Die Folge (yn )n würde dann gegen ξ konvergieren, die Folge (f (yn ))n dagegen nicht gegen η, was im Gegensatz zu unserer Annahme stünde. Somit gibt es ein δ > 0, so dass f (x) ∈ Uε (η) für alle x ∈ U̇δ (ξ) ∩ A. Q.E.D. Da der Grenzwert einer konvergenten Folge eindeutig bestimmt ist, gibt es nach Satz 9.1 höchstens ein η ∈ F mit f (x) → η für x → ξ. Der Grenzwert von f (x) für x → ξ, falls vorhanden, wird mit dem Symbol lim f (x) x→ξ bezeichnet. Beispiele. a) Sei f (x) := sgn x, x ∈ R, und seien D1 :=] − ∞, 0[, D2 := [0, ∞[, D3 := R. Wir setzen fj := f |Dj , j = 1, 2, 3. Dann gilt: lim f1 (x) = −1, x→0 lim f2 (x) = 1 x→0 (wobei f2 (0) = 0) , und der Grenzwert von f3 (x) für x → 0 existiert nicht. Ferner gilt: lim f1 (x) = −1, lim f2 (x) = 1. x→−∞ x→∞ b) lim c = c (c eine Konstante). x→ξ c) lim x = ξ x→ξ (ξ 6= ±∞). Bemerkung. Ist f : N → F eine Folge, so stimmt die obige Definition des Grenzwertes limx→∞ f (x) mit der früher gegebenen von limn→∞ f (n) für die Folge (f (n))n∈N überein. 117 9.2 Rechenregeln Sind f und g reell- oder komplexwertige Funktionen, so definieren wir Funktionen f + g, f g und f /g durch f +g : fg : f /g : x 7→ f (x) + g(x), x 7→ f (x)g(x), x 7→ f (x)/g(x); der Definitionsbereich von f + g und f g ist dabei die Menge D(f ) ∩ D(g), und der von f /g die Menge D(f ) ∩ {x ∈ D(g) : g(x) 6= 0}, welche jeweils als nichtleer vorausgesetzt werden. Ist f komplexwertig, so definieren wir ferner die reellwertigen Funktionen Re f und Im f durch (Re f )(x) := Re f (x), (Im f )(x) = Im f (x), x ∈ D(f ). Satz 9.2 Es seien f, g : A → F Funktionen, sowie ξ ∈ E ein Häufungspunkt von A (eventuell ein uneigentlicher). Es gelte limx→ξ f (x) = α, limx→ξ g(x) = β. Dann existieren auch die Grenzwerte der Funktionen f + g, f g und f /g (falls β 6= 0) für x → ξ, und es gilt: lim (f + g)(x) = α + β, x→ξ lim (f g)(x) = αβ, x→ξ lim (f /g)(x) = x→ξ α β (falls β 6= 0). Ist f komplexwertig, so gilt ferner: lim f (x) = lim Re f (x) + i lim Im f (x). x→ξ x→ξ x→ξ Beweis. Diese Regeln lassen sich unmittelbar durch Übertragung der Rechenregeln in Satz 5.5 herleiten. Ist nämlich (xn )n eine Folge in A \ {ξ} mit xn → ξ, so konvergieren nach Satz 9.1 die Folgen (f (xn ))n und (g(xn ))n , und es ist limn→∞ f (xn ) = α, limn→∞ g(xn ) = β. Nach Satz 5.5 ist folglich lim (f (xn ) + g(xn )) = α + n→∞ f (xn ) n→∞ g(xn ) β, lim (f (xn )g(xn )) = αβ und lim n→∞ folgt: lim (f + g)(x) = α + β, etc. . = αβ , falls β 6= 0. Wieder mit Satz Satz 9.1 x→ξ Die letzte Behauptung folgt analog aus Satz 7.2. Q.E.D. Weitere Regeln für das Rechnen mit Grenzwerten von Funktionen ergeben sich aus den analogen Regeln für das Rechnen mit konvergenten Folgen in Kapitel 5 (vergleiche [B, § 89]). 118 9.3 Einseitige Grenzwerte Definitionen. Es seien A ⊂ R und ξ ∈ R. Wir setzen A− := {x ∈ A : x < ξ}. A+ := {x ∈ A : x > ξ}, Ist ξ ein Häufungspunkt von A+ bzw. A− , und existiert η + := lim f |A+ (x) bzw. x→ξ η − := lim f |A− (x), so sagen wir, f besitze den rechtsseitigen Grenzwert η + für x→ξ x → ξ bzw. den linksseitigen Grenzwert η − für x → ξ, und schreiben dafür f (x) → η + für x → ξ+, bzw. f (x) → η − für x → ξ−, oder auch f (ξ−) = lim f (x) := η − . f (ξ+) := lim f (x) := η + , x→ξ+ x→ξ− Existieren die Grenzwerte f (ξ−) und f (ξ+), und sind sie verschieden, so besitzt f im Punkte ξ eine Sprungstelle. Beispiel. sgn (0+) = 1, sgn (0−) = −1. Wie für Folgen lassen sich auch für allgemeinere Funktionen uneigentliche Grenzwerte definieren. Hierzu sei z.B. auf [B, §85] verwiesen. 9.4 Stetigkeit Definitionen. Sei f : A → F eine Funktion wie zu Beginn dieses Paragraphen, und sei a ∈ A. f heiße stetig im Punkte a, wenn es zu jedem ε > 0 ein δ = δ(ε) > 0 gibt, so dass gilt: (9.3) f (x) ∈ Uε (f (a)) für alle x ∈ Uδ (a) ∩ A, oder äquivalent: (9.4) x ∈ A und |x − a| < δ =⇒ |f (x) − f (a)| < ε. f (a) ǫ ǫ Uǫ (f (a)) δ δ a 119 Uδ (a) Ist a ein Häufungspunkt der Menge A, so ist dies offenbar äquivalent dazu, dass f den Grenzwert f (a) besitzt für x → a. Ist dagegen a ein isolierter Punkt von A, so ist f automatisch stetig in a Im letzten Fall gibt es nämlich eine Umgebung Uδ0 (a) mit Uδ0 (a) ∩ A = {a}. Für δ < δ0 ist folglich a der einzige Punkt x aus A in Uδ (a), und für diesen gilt: f (x) = f (a) ∈ Uε (f (a)) für alle ε > 0. Die Stetigkeit in a drückt folgende anschauliche Beziehung aus: f (x) kommt f (a) beliebig nahe, wenn nur x genügend nahe bei a liegt“. ” Die folgende Charakterisierung der Stetigkeit lässt sich analog wie Satz 9.1 beweisen (oder sogar leicht daraus ableiten): Satz 9.3 f : A → F ist stetig in a ∈ A dann und nur dann, wenn für jede Folge (xn )n in A mit xn → a gilt: f (xn ) → f (a). Ist f in jedem Punkt von D(f ) stetig, so heißt f stetig bzw. eine stetige Funktion. Ist f stetig, so ist auch die Einschränkung von f auf irgendeine Teilmenge A von D(f ) stetig. Beispiele. a) f : A → F heiße Lipschitz-stetig, wenn es eine Konstante C ≥ 0 gibt mit |f (x) − f (y)| ≤ C|x − y| für alle x, y ∈ A. Eine solche Funktion ist stetig, denn sind ε > 0, y ∈ A, so gilt für δ := ε/(C + 1): x ∈ A, |x − y| < δ =⇒ |f (x) − f (y)| ≤ C|x − y| < Cδ < ε. b) Eine konstante Funktion ist trivialerweise stetig. c) Die identische Abbildung IdA : A → A, x 7→ x, ist Lipschitz-stetig, also stetig. d) Die Konjugation z 7→ z in C ist wegen |z 1 − z 2 | = |z1 − z2 | (Lipschitz-) stetig. e) Die Funktion sgn : R → R ist unstetig in 0, aber stetig in allen Punkten von R \ {0}. f) Die Indikatorfunktion 1Q : R → R der Menge der rationalen Zahlen (die sogenannte Dirichletfunktion) ist nirgends, d.h. in keinem Punkt a ∈ R, stetig. Zu jedem a ∈ R gibt es nämlich eine Folge (xn )n in Q sowie eine Folge (yn )n in R \ Q mit xn → a und yn → a. Dann gilt aber f (xn ) = 1 → 1 und f (yn ) = 0 → 0 für n → ∞. 120 Ganz analog wie Satz 9.2 lässt sich mittels Satz 9.3 folgender Satz beweisen. Satz 9.4 (i) Sind die reell- oder komplexwertigen Funktionen f und g stetig im Punkt a, so sind auch die Funktionen |f |, f + g, f g und f /g stetig in a (im Falle von f /g muss natürlich a in D(f /g) liegen, d.h. g(a) 6= 0 gelten). (ii) Sind die Funktionen f und g stetig, so auch die Funktionen |f |, f + g, f g und f /g. Definitionen. Ein Polynom (oder genauer: eine Polynomfunktion ) auf R (bzw. C) ist eine Funktion der Gestalt p(x) := a0 + a1 x + · · · + an−1 xn−1 + an xn , wobei die reellen oder auch komplexen Koeffizienten a0 , . . . , an als gegeben betrachtet werden. Nehmen wir o.B.d.A. an, dass der Koeffizient an von Null verschieden ist, so heißt n der Grad des Polynoms. Da alle konstanten Funktionen wie auch die Funktion IdR (bzw. IdC ) stetig sind, leitet man aus Satz 9.4 mittels vollständiger Induktion nach dem Grad des Polynoms leicht: Jede Polynomfunktion ist stetig auf R bzw. C. Mit Satz 9.4 folgt damit allgemeiner sofort: Jede rationale Funktion, d.h. jeder Quotient p/q von Polynomfunktionen p und q ( q nicht die konstante Funktion 0), ist stetig auf ihrem Definitionsbereich. Satz 9.5 Seien f : A → B und g : B → C zwei Funktionen, wobei A, B und C Teilmengen von R oder C seien. Ist f stetig (bzw. stetig im Punkt a) und g stetig (bzw. stetig im Punkt b := f (a)), so ist auch die aus f und g zusammengesetzte Funktion g ◦ f stetig (bzw. stetig im Punkt a). Beweis. Es genügt, die in Klammern gesetzte Aussage zu beweisen. Ist ε > 0 gegeben, so existiert wegen der Stetigkeit von g in b ein ε′ > 0 mit (9.5) g(y) ∈ Uε (g(b)) für alle y ∈ Uε′ (b) ∩ B. Ferner gibt es wegen der Stetigkeit von f in a ein δ > 0 mit (9.6) f (x) ∈ Uε′ (f (a)) für alle x ∈ Uδ (a) ∩ A. (9.5) und (9.6) implizieren, dass g(f (x)) ∈ Uε (g(f (a))) für alle x ∈ Uδ (a) ∩ A. Q.E.D. Vorschlag: Geben Sie einen Beweis von Satz 9.5, welcher Satz 9.3 ausnutzt. √ Beispiele. Die Funktion x → x ist stetig auf [0, ∞[ (Übung). Mit Satz 9.5 und der vorangehenden Bemerkung folgt hieraus leicht: 121 (i) Die Funktion f (t) = (ii) Die Funktion g(t) = p √ 1 + 2t2 + 1 + 3t4 ist stetig auf R. √ 1 1−t2 (iii) Die Funktion h(z) = √ 2z2 ist stetig auf ] − 1, 1[. |z| +1 ist stetig auf C. Bei der Betrachtung stetiger Funktionen wollen wir uns ab jetzt auf den Fall E = F = R beschränken, d.h. wir wollen reellwertige Funktionen mit Definitionsbereich in R betrachten. 9.5 Der Zwischenwertsatz Theorem 9.6 Sei I ⊂ R ein Intervall, und sei f : I → R stetig. Dann ist das Bild f (I) von I unter f ebenfalls ein Intervall. f (b) η f (a) a ξ1 ξ2 ξ3 = ξ b Beweis. Seien f (a) und f (b) mit a, b ∈ I zwei verschiedene Punkte in f (I), wobei wir o.B.d.A. a < b voraussetzen wollen. Es ist zu zeigen, dass jeder Punkt η, welcher zwischen f (a) und f (b) liegt, zu f (I) gehört. O.B.d.A. dürfen wir f (a) < f (b) voraussetzen (andernfalls betrachte man −f anstelle von f ). Sei also f (a) < η < f (b). Es sei A := {x ∈ [a, b] : f (x) ≤ η}. Da a ∈ A, ist A 6= ∅. Ferner ist A als Teilmenge des Intervalls [a, b] beschränkt, so dass folglich ξ := sup A ∈ [a, b] existiert. Wir behaupten, dass f (ξ) = η ist. Nach Definition des Supremums gibt es nämlich eine Folge (xn )n in A mit xn → ξ (vergl. Satz 5.9), so dass wegen der Stetigkeit von f die Folge (f (xn ))n gegen f (ξ) konvergiert. Da f (xn ) ≤ η ist für alle n, ist dann f (ξ) ≤ η. 122 Insbesondere ist damit ξ < b, und somit gibt es weiter eine Folge (zn )n mit ξ < zn ≤ b und zn → ξ. Aufgrund der Definition von ξ ist η < f (zn ) für alle n, und folglich η ≤ limn→∞ f (zn ) = f (ξ). Damit haben wir gezeigt, dass f (ξ) ≤ η ≤ f (ξ) und somit η = f (ξ) gilt. Q.E.D. Korollar 9.7 (Zwischenwertsatz) Es seien I ⊂ R ein Intervall und f : I → R stetig. Ferner sei α := inf f (I) ∈ R ∪ {−∞}, β := sup f (I) ∈ R ∪ {∞}. Dann nimmt f jeden Wert η ∈]α, β[ wenigstens einmal an. Beweis. Nach Theorem 9.6 ist f (I) ein Intervall, und nach Satz 4.6 ist daher ]α, β[⊂ f (I). Q.E.D. Beispiel. Jedes Polynom ungeraden Grades der Form p(x) = x2m+1 + a2m x2m + · · · + a1 x + a0 mit reellen Koeffizienten besitzt wenigstens eine reelle Nullstelle. Für x 6= 0 ist nämlich a0 a2m 2m+1 + · · · + 2m+1 . 1+ p(x) = x x x Hier strebt für x → ±∞ der Ausdruck in der Klammer gegen 1, so dass p(x) → −∞ für x → −∞ p(x) → +∞ für x → +∞. Mit den Bezeichnungen von Korollar 9.7 ist demnach α = −∞, β = +∞, also p(R) = R. 9.6 Der Satz vom Maximum Definitionen. Wir sagen, die Funktion f : A → R besitze im Punkt ξ ∈ A ein globales Maximum (bzw. globales Minimum), wenn f (x) ≤ f (ξ) ( bzw.f (ξ) ≤ f (x)) für alle x ∈ A (dies ist äquivalent zu: f (ξ) = max f (A) bzw. f (ξ) = min f (A)). Gibt es eine Umgebung Uε (ξ), so dass f (x) ≤ f (ξ) ( bzw.f (ξ) ≤ f (x)) für alle x ∈ Uε (ξ) ∩ A, so sagt man, f besitze in ξ ein lokales Maximum (bzw. lokales Minimum). Schließlich sagen wir, dass f in ξ ein lokales (bzw. globales) Extremum besitzt, falls f in ξ ein lokales (bzw. globales) Minimum oder Maximum hat. 123 lokales Maximum lokales Minimum x0 Uδ (x0 ) Ein abgeschlossenes und beschränktes Intervall, d.h. ein Intervall der Form [a, b] mit a, b ∈ R, a ≤ b, heiße ein kompaktes Intervall. Theorem 9.8 (Satz vom Maximum) Sind I ⊂ R ein kompaktes Intervall und f : I → R eine stetige Funktion, so nimmt f auf I ein globales Maximum und ein globales Minimum an. Beweis. Es sei I = [a, b], f : I → R stetig. Wir setzen d := sup f (I) ∈ R ∪ {∞}, c := inf f (I) ∈ R ∪ {−∞}. d c a b Nach Definition des Supremums einer Menge gibt es eine Folge (xn )n in I mit f (xn ) → d (im eigentlichen Sinne, falls d ∈ R, und im uneigentlichen Sinne, falls d = +∞ ist). Ferner gibt es nach Bolzano-Weierstraß eine konvergente Teilfolge (xnk )k der Folge (xn )n . Durch Übergang zu dieser Folge können wir annehmen, dass unsere Folge (xn )n bereits konvergiert. Sei ξ := lim xn . Da a ≤ xn ≤ b für alle n ∈ N ist, ist n→∞ a ≤ ξ ≤ b, d.h. ξ ∈ I. Die Stetigkeit von f impliziert dann, dass f (ξ) = lim f (xn ) n→∞ ist. Damit konvergiert die Folge (f (xn ))n im eigentlichen Sinne, und es ist d = f (ξ) ∈ f (I). Somit nimmt f in ξ ein globales Maximum an. Mit einem analogen Argument weist man die Existenz eines ξ ′ ∈ I mit f (ξ ′) = c (∈ R) nach. f nimmt dann in ξ ′ ein globales Minimum an. Q.E.D. 124 Korollar 9.9 (von Weierstraß) Das Bild eines kompakten Intervalls unter einer stetigen reellwertigen Funktion ist ein kompaktes Intervall. Beweis. Nach Satz 9.8 existieren d := max f (I) und c := min f (I). Für jedes x ∈ I gilt dann: c ≤ f (x) ≤ d, d.h. f (I) ⊂ [c, d]. Da ferner c, d ∈ f (I) sind, ist nach Theorem 9.6 [c, d] ⊂ f (I), also schließlich f (I) = [c, d]. Q.E.D. Beispiele. a) Die stetige Funktion f (x) = x2 auf R nimmt auf R kein globales Maximum an: Die Menge R ist unbeschränkt. b) Die stetige Funktion f (x) = x3 nimmt auf ]0, 1[ weder ein Maximum noch ein Minimum an: Das Intervall ]0, 1[ ist nicht abgeschlossen. c) Die Funktion ( |x|, x 6= 0, f (x) := 1, x = 0, nimmt auf [−1, 1] kein Minimum an: f ist unstetig in 0. 9.7 Existenz von Umkehrfunktionen Satz 9.10 Seien I ⊂ R ein Intervall und f : I → R eine stetige Funktion. Dann ist f injektiv dann und nur dann, wenn f streng monoton ist. Beweis. Nehmen wir zuerst an, dass f streng monoton ist. O.B.d.A. können wir dann voraussetzen, dass f streng wachsend ist (sonst betrachte −f anstelle von f ). Damit gilt für x1 , x2 ∈ I: Ist x1 < x2 , so ist f (x1 ) < f (x2 ). Folglich ist f injektiv. Wir setzen nun umgekehrt voraus, dass f injektiv und stetig ist. Seien a < b zwei feste Punkte aus I. Dann gilt entweder f (a) < f (b) oder f (a) > f (b). 1. Fall: f (a) < f (b). Wir zeigen zunächst: (9.7) f (a) < f (x) < f (b) für alle x mit a < x < b. Falls nämlich f (x) ≤ f (a) wäre für ein x ∈]a, b[, so wäre wegen der Injektivität von f sogar f (x) < f (a), also f (a) ∈]f (x), f (b)[, und nach dem Zwischenwertsatz existierte ein ξ ∈]x, b[ mit f (ξ) = f (a). Dann wäre aber a < x < ξ und f (ξ) = f (a), im Widerspruch zur Injektivität von f . Ähnlich schließt man aus, dass f (x) ≥ f (b) gilt für ein x ∈]a, b[. 125 Wir schließen aus (9.7), dass f streng wachsend auf [a, b] ist. Gilt nämlich a < x < y < b, so gilt nach (9.7): f (a) < f (y), also wieder nach (9.7) (indem man b durch y ersetzt): f (a) < f (x) < f (y). 2. Fall: f (a) > f (b). Mit ähnlichen Argumenten wie zuvor (oder indem man f durch −f ersetzt) zeigt man, dass hier f streng fallend auf [a, b] ist. Zusammengefaßt sehen wir: f ist streng monoton auf jedem Intervall [α, β] ⊂ I. (9.8) Ist aber f streng wachsend (bzw. fallend) auf einem festgehaltenem Teilintervall [a, b] ⊂ I mit a < b, so ist f streng wachsend (bzw. fallend) auf ganz I. Sind nämlich x, y ∈ I mit x < y, so sei [α, β] ein Teilintervall von I, welches a, b, x und y enthält. Ist nun f streng wachsend (bzw. fallend) auf [a, b], so ist f nach (9.8) streng wachsend (bzw. fallend) auf [α, β], und es gilt insbesondere f (x) < f (y) (bzw. f (x) > f (y)). Q.E.D. Ist also I ein Intervall, so ist die stetige Funktion f : I → f (I) bijektiv dann und nur dann, wenn sie streng monoton ist. Trifft dies zu, so existiert folglich die Umkehrfunktion f −1 : f (I) → I und ist streng wachsend (streng fallend) dann und nur dann, wenn f streng wachsend (streng fallend) ist. Satz 9.11 Sei f : I → f (I) eine stetige injektive Funktion auf dem Intervall I. Dann ist die Umkehrfunktion f −1 : f (I) → I ebenfalls stetig. Beweis: Sei o.B.d.A. f streng wachsend. Wir zeigen, dass f −1 stetig ist. Ist (yn )n eine Folge in J := f (I) mit yn → y ∈ J, so setzen wir xn := f −1 (yn ), x := f −1 (y) ∈ I. Wir müssen zeigen, dass xn → x. Sei dazu ξ ∈ R ∪ {−∞, ∞} ein eigentlicher oder uneigentlicher Häufungspunkt der Folge (xn )n . 1. Fall. ξ ∈ I. Dann gibt es eine Teilfolge (xnk )k mit ξ = lim xnk . Wegen der Stetigkeit von f folgt: k→∞ f (ξ) = lim f (xnk ) = lim ynk = y = f (x), also ξ = x. k→∞ k→∞ 2. Fall. ξ 6∈ I. Dann muss ξ einer der Endpunkte des Intervalls I sein, z.B. der rechte, d.h. es ist I = [a, ξ[ oder I =]a, ξ[ 126 mit a ∈ R ∪ {−∞}. Aus der Definition des Häufungspunktes leitet man dann leicht die Existenz einer streng wachsenden Teilfolge (xnk )k her mit xnk → ξ für k → ∞. Da x ∈ I, gibt es ein l ∈ N, so dass xnk > x für alle k ≥ l. Für k > l folgt dann: f (x) < f (xnl ) < f (xnk ), d.h. y < y nl < y nk . lässt man hier k → ∞ streben, so folgt: y < ynl ≤ y, ein Widerspruch. Der 2. Fall kann also gar nicht auftreten, und wir sehen, dass die Folge (xn )n genau einen, endlichen Häufungspunkt, nämlich x, besitzt. Nach Satz 8.7 konvergiert sie folglich gegen x. Q.E.D. 9.8 Der Logarithmus, allgemeine Potenzen und Wurzeln Lemma 9.12 Die Exponentialabbildung exp : R → R+ ist stetig und bijektiv. Beweis. Eine Funktion f ist stetig im Punkte a dann und nur dann, wenn gilt: (9.9) lim f (a + h) = f (a), bzw. lim (f (a + h) − f (a)) = 0 h→0 h→0 Ist nämlich x = a + h, so ist lim f (x) = lim f (a + h). x→a h→0 Die Funktion exp ist stetig in 0, da ∞ ∞ ∞ X n X X |h|n−1 1 h ≤ |h| ≤ e|h| | exp(h) − exp(0)| = ≤ |h| n! n! n! n=1 n=1 n=1 für |h| ≤ 1. Dies impliziert limh→0(exp(h) − exp(0)) = 0. Hieraus folgt leicht die Stetigkeit von exp in einem beliebigen Punkt a ∈ R mittels der Funktionalgleichung. Es ist nämlich (9.10) exp(a + h) − exp(a) = exp(a)(exp(h) − exp(0)), also | exp(a + h) − exp(a)| ≤ exp(a) e |h| für |h| ≤ 1. 127 Ferner gilt für h > 0 wegen (9.10), und da exp(h)−exp(0) = exp(a + h) − exp(a) > 0 für h > 0, P∞ hn n=1 n! > 0 für h > 0: d.h. exp ist streng wachsend. Schließlich gilt: (9.11) exp x → +∞ für x → +∞, exp x → 0 für x → −∞. Für x > 0 ist nämlich exp x > x, woraus die erste Behauptung folgt, und da exp x = 1 ist, so folgt die zweite aus der ersten. exp(−x) Der Zwischenwertsatz impliziert damit, dass exp(R) = R+ ist. Q.E.D. Satz 9.11 zeigt, dass exp : R → R+ eine stetige, streng wachsende Umkehrfunktion besitzt, welche als (natürlicher) Logarithmus bezeichnet wird; in Zeichen: exp−1 =: log : R+ → R. Es gilt also: log(ex ) = x ∀x ∈ R, elog t = t ∀t ∈ R+ . Da inf log(R+ ) = −∞, sup log(R+ ) = +∞, und da log wachsend ist, gilt außerdem: log x → −∞ log x → ∞ für x → 0+, für x → ∞. y y = ex (9.12) 1 y= log x 1 x Sind u, v ∈ R+ , so gibt es eindeutige x, y ∈ R mit u = ex , v = ey , und damit ist log(u v) = log(ex ey ) = log(ex+y ) = x + y. 128 Es gilt also die Funktionalgleichung: (9.13) log(uv) = log u + log v, u, v ∈ R+ . Für eine beliebige “Basis” a > 0 setzen wir ax := exp(x log a), (9.14) x ∈ R. ax ist die x-te Potenz von a. Beachte, dass ax für x = 1 wie zu erwarten den Wert a annimmt. Die folgenden Rechenregeln lassen sich leicht aus den Funktionalgleichungen von exp und log herleiten: (a) (b) (c) (d) (9.15) log ax = x log a, ax+y = ax ay , (ax )y = axy , ax bx = (ab)x . Die Umkehrfunktion loga : R+ → R der Funktion x 7→ ax ist der Logarithmus zur Basis a. Ferner gilt (9.16) loga (x) = log x , log a x > 0, denn nach (9.15) (a) ist die Identität ay = x äquivalent zu y log a = log x, wobei per definitionem y = loga x ist. Es sei ferner angemerkt, dass sich mittels az := exp(z log a), z ∈ C, auch komplexe Potenzen von a definieren lassen. Ferner ist die Abbildung x 7→ ax als Komposition stetiger Funktionen stetig auf R. Beachte: Ist k ∈ N, k ≥ 2, und wählen wir x := 1/k, so gilt für y := a1/k nach 1 (9.15) (c) y k = a(k k ) = a1 = a, d.h. y ist eine positive k-te Wurzel aus√a. Da es nach Satz 5.10 genau eine solche positive k-te Wurzel von a gibt, nämlich k a, so gilt also √ k (9.17) a = a1/k , a > 0, k ∈ N, k ≥ 2. Für einen positiven Exponenten α > 0 setzen wir schließlich ( exp(α log x), x > 0, xα := 0, x = 0. Die Potenzfunktion pα (x) := xα ist dann stetig auf der positiven Halbachse + R+ 0 = [0, ∞[. Auf R ist pα als Komposition stetiger Funktionen sicherlich stetig, und im Nullpunkt folgt die Stetigkeit aus lim (pα (x) − pα (0)) = lim eα log x = lim eαy = 0. x→0+ x→0+ 129 y→−∞ 9.9 Hyperbelfunktionen Für z ∈ C definieren wir den (komplexen) hyperbolischen Cosinus und den (komplexen) hyperbolischen Sinus von z durch ez + e−z , 2 ez − e−z sinh z := . 2 cosh z := Eine reell- oder komplexwertige Funktion f heiße gerade bzw. ungerade, falls y= f (−x) = −f (x) gilt für alle x ∈ D(f ), wobei D(f ) als symmetrisch bzgl. 0 vorausgesetzt sei. Offenbar ist dann cosh gerade, sinh ungerade. Mittels der Funktionalgleichung der Exponentialfunktion weist man leicht die Identität 1 = y x cosh2 z − sinh2 z = 1 (9.18) x hx s h s in bzw. co f (−x) = f (x) y für alle z ∈ C, sowie die Additionstheoreme cosh(z + w) = cosh z cosh w + sinh z sinh w, sinh(z + w) = sinh z cosh w + cosh z sinh w, (9.19) nach, welche für beliebige z, w ∈ C gelten. Z.B. folgt die erste Formel aus ez+w + e−z−w (ez + e−z )(ew + e−w ) (ez − e−z )(ew − e−w ) = + . 2 2·2 2·2 Es gilt ferner 1 2 1 2 z n (−z)n + n! n! z n (−z) − n! n! n = = ( zn , n! 0, ( 0, zn , n! n gerade, n ungerade, n gerade, n ungerade, womit die (komplexen) Hyperbelfunktionen folgende Potenzreihenentwicklungen besitzen: 130 cosh z = (9.20) sinh z = ∞ X z 2m z2 z4 z6 =1+ + + + ..., (2m)! 2! 4! 6! m=0 ∞ X z3 z5 z 2m+1 =z+ + + ..., (2m + 1)! 3! 5! m=0 für beliebiges z ∈ C. Als Differenz einer streng wachsenden und einer streng fallenden Funktion ist die (reelle) Hyperbelfunktion sinh streng wachsend; ferner gilt sinh 0 = 0, sinh x → ±∞ für x → ±∞. Natürlich ist sinh auch stetig, so dass die Umkehrfunktion sinh−1 =: arsinh : R → R existiert, genannt Areasinus. Analog überlegt man sich (vgl. [B]), dass cosh : R+ 0 → [1, ∞[ eine Umkehrfunktion cosh−1 =: arcosh : [1, ∞[→ R+ 0 besitzt, genannt Areacosinus. Schließlich ist der hyperbolische Tangens definiert durch tanh x := sinh x ex − e−x = x , cosh x e + e−x x ∈ R. Man überlegt sich leicht, dass lim tanh x = ±1 x→±∞ ist, und weist später mittels der Differentialrechnung nach, dass tanh streng wachsend ist. y 1 y= hx tan x −1 Die Umkehrfunktion tanh −1 := artanh :] − 1, 1[→ R bezeichnet man als Areatangens. 131 9.10 Trigonometrische Funktionen: 1. Teil Wir definieren auf R die komplexwertige cis-Funktion durch t 7→ eit . cis : R → C, 1/2 1/2 1/2 = (eit e−it ) = (e0 ) = 1 ist für t ∈ R, bildet cis die reelle Da |eit | = eit eit Achse stetig ab in den Einheitskreis S 1 := {z ∈ C : |z| = 1} ⊂ C. Weiter definieren wir die auf ganz R stetigen Funktionen Cosinus und Sinus durch it e +e , 2 eit − e−it . sin t := Im eit = 2i cos t := Re eit = eit sin t −it t cos t S1 Dann gilt offenbar die Eulersche Formel (9.21) eit = cos t + i sin t, t ∈ R. Wegen|eit |2 = 1 folgt hieraus: (9.22) cos2 t + sin2 t = 1 für alle t ∈ R. Natürlich lassen sich cos und sin mittels cos z := eiz + e−iz , 2 sin z := eiz − e−iz , 2i z ∈ C, auch für beliebige komplexe z ∈ C definieren. Der Vergleich mit den komplexen Hyperbelfunktionen zeigt dann sofort, dass folgender Zusammenhang mit den Hyperbelfunktionen besteht: (9.23) cos z = cosh(iz), sin z = 1 sinh(iz), i z ∈ C. Mittels (9.18) schließen wir hiermit, dass (9.22) dann auch für beliebiges t ∈ C gültig bleibt. Ferner erhalten wir durch Ersetzen von z durch iz in (9.20) sofort die folgenden Potenzreihenentwicklungen von cos z und sin z: 132 ∞ X cos z = (−1)m z2 z4 z6 z 2m =1− + − ± ..., (2m)! 2! 4! 6! (−1)m z3 z5 z 2m+1 =z− + ∓ ..., (2m + 1)! 3! 5! m=0 (9.24) ∞ X sin z = m=0 gültig für alle z ∈ C (also insbesondere für z ∈ R). Aus (9.23) und (9.19) erhält man schließlich die Additionstheoreme cos(x + y) = cos x cos y − sin x sin y, (9.25) sin(x + y) = sin x cos y + cos x sin y. Z.B. erhält man die erste Identität wie folgt: cos(x + y) = cosh(ix + iy) = cosh(ix) cosh(iy) + sinh(ix) sinh(iy) = cos x cos y + i sin x · i sin y = cos x cos y − sin x sin y. 9.11 Gleichmäßige Konvergenz Die Exponentialfunktion wie auch die Funktionen cosh, sinh, cos, sin besitzen auf ganz R (oder auch C) konvergente Potenzreihenentwicklungen. Ferner sind alle diese Funktionen stetig. ∞ P Sei nun allgemeiner ak z k eine gegebene Potenzreihe mit Konvergenzradius R. k=0 Dann konvergiert diese Reihe für alle z im Konvergenzkreis D := {z ∈ C : |z| < R} und definiert folglich eine Funktion u : D → C, ∞ X ak z k z 7→ k=0 (lässt man nur reelle Werte zu, so erhält man eine Funktion P k v :] − R, R[→ C, x 7→ ∞ k=0 ak x ). Für n ∈ N bezeichne un (z) := n X ak z k k=0 die n-te Partialsumme der gegebenen Potenzreihe. un ist ein Polynom (vom Grade ≤ n), also auf ganz C definiert und stetig. Ferner gilt: (9.26) lim un (z) = u(z) für jedes z ∈ D. n→∞ 133 Mit den Bezeichnungen zu Beginn dieses Paragraphen definieren wir: Definitionen. Seien un , n ∈ N, sowie u Funktionen auf einer Teilmenge A von E mit Werten in F . Die Folge (un )n der Funktionen un konvergiere punktweise gegen die Funktion u, falls gilt: lim un (x) = u(x) für alle x ∈ A. n→∞ Angenommen, alle Funktionen un sind stetig, so wie in (9.26). Lässt sich daraus bereits folgern, dass auch die Grenzfunktion u stetig ist? Das folgende Beispiel lehrt, dass dies i.a. falsch ist. Beispiel. Für n ≥ 1 sei un : R → R definiert durch −1, x < −1/n, un (x) := nx, |x| ≤ 1/n, 1, x > 1/n. Dann gilt offenbar lim un (x) = sgn x für jedes x ∈ R, d.h. die Folge (un )n≥1 konvern→∞ giert punktweise gegen die Signumsfunktion u = sgn . Offenbar sind alle Funktionen un stetig, die Grenzfunktion u jedoch nicht. Der folgende, stärkere Konvergenzbegriff dagegen führt zu einer positiven Antwort auf die gegebene Frage. Die Funktionenfolge (un )n∈N konvergiere gleichmäßig auf der Menge A gegen die Funktion u, wenn es zu jedem ε > 0 ein n(ε) ∈ N gibt, so dass für alle n ≥ n(ε) gilt: (9.27) |un (x) − u(x)| < ε für alle x ∈ A. Im Vergleich dazu bedeutet die punktweise Konvergenz der Funktionenfolge (un )n∈N gegen die Funktion u, dass es zu jedem ε > 0 und jedem x ∈ A ein eventuell von x abhängiges n(ε, x) ∈ N gibt, so dass für alle n ≥ n(ε, x) gilt: |un (x) − u(x)| < ε. Offenbar impliziert die gleichmäßige Konvergenz die punktweise. Die Umkehrung hiervon gilt jedoch nicht, wie wieder obiges Beispiel in Verbindung mit dem folgenden Satz zeigt. Satz 9.13 Es sei (un )n∈N eine Folge stetiger Funktionen un : A → F , welche gleichmäßig auf A gegen die Funktion u : A → F konvergiert. Dann ist auch die Funktion u stetig. Beweis. Sei a ∈ A, und sei ε > 0. Nach (9.27) gibt es ein n0 = n(ε/3) ∈ N, so dass für alle n ≥ n0 gilt: (9.28) |un (x) − u(x)| < ε/3 134 für alle x ∈ A. Da ferner die Funktion un0 stetig ist im Punkte a, existiert ein δ = δ(ε/3, n0) > 0, so dass gilt: |un0 (x) − un0 (a)| < ε/3 (9.29) für alle x ∈ A ∩ Uδ (a). Aus (9.28) (für n = n0 ) und (9.29) folgt mittels der Dreiecksungleichung: |u(x) − u(a)| = |(u(x) − un0 (x)) + (un0 (x) − un0 (a)) + (un0 (a) − u(a))| ≤ |u(x) − un0 (x)| + |un0 (x) − un0 (a)| + |un0 (a) − u(a)| < ε/3 + ε/3 + ε/3 = ε für alle x ∈ A ∩ Uδ (a). Damit ist u stetig im Punkte a. Q.E.D. Als Anwendung erhalten wir Satz 9.14 Es bezeichne D = {z ∈ C : |z| < R} den Konvergenzkreis der Potenzrei∞ ∞ P P he ak z k . Dann ist die auf D durch u(z) := ak z k definierte Funktion stetig. k=0 k=0 Beweis. Für n ∈ N bezeichne un das Polynom un (z) := n P ak z k . Für festes r mit k=0 0 ≤ r < R betrachten wir die Einschränkungen v := u|Dr sowie vn := un |Dr , wobei Dr die offene“Kreisscheibe ” Dr := {z ∈ C : |z| < r} bezeichne. Für z ∈ Dr gilt dann: |v(z) − vn (z)| = | (9.30) gilt: k=n+1 ∞ P k=0 k k k=n+1 Sei nun ε > 0. Da die Reihe ∞ P ∞ X ak z | ≤ ∞ X k=n+1 k |ak | |z| ≤ ∞ X k=n+1 |ak |r k . |ak |r k konvergiert, gibt es zu ε ein n(ε) ∈ N, so dass |ak |r < ε für alle n ≥ n(ε). Nach (9.30) folgt hieraus: |v(z) − vn (z)| < ε für alle z ∈ Dr , n ≥ n(ε). Die Funktionenfolge (vn )n konvergiert also gleichmäßig auf Dr gegen v, und da alle Funktionen vn stetig sind, so ist auch v stetig. Wir sehen also: u|Dr ist stetig für jedes r < R. Hieraus folgt die Stetigkeit von u auf D. Ist nämlich z ∈ D, so sei r so gewählt, dass |z| < r < R (z.B. r := (|z| + R)/2). Konvergiert nun eine Folge (zn )n in D gegen z, so ist lim |zn | = |z| < r, so dass n→∞ fast alle, d.h. alle bis auf höchstens endlich viele Folgenglieder bereits in Dr liegen müssen. Da u auf Dr stetig ist, folgt dann jedoch: u(zn ) → u(z) für n → ∞. Die Funktion u ist also stetig im Punkte z. Q.E.D. 135 Kapitel 10 Differenzierbare Funktionen In diesem Paragraphen werden wir ausschließlich reell- oder komplexwertige Funktionen betrachten, deren Definitionsbereich ein reelles Intervall ist. Dabei wollen wir zudem annehmen, dass alle betrachteten Intervalle positive Länge besitzen. Sei also f : I → R (bzw. f : I → C) eine auf dem Intervall I definierte Funktion, und sei x0 ∈ I. Definitionen. f heiße differenzierbar im Punkte x0 , wenn es eine Zahl A ∈ R (bzw. A ∈ C) gibt mit f (x) − f (x0 ) = A. x→x0 x − x0 (10.1) lim Beachte, dass A dann auch gleich dem Grenzwert f (x0 + h) − f (x0 ) =A h→0 h lim (x0 ) ist. Der eindeutige Grenzwert A der Funktion x 7→ f (x)−f im Punkte x0 heißt x−x0 Differentialquotient oder Ableitung von f im Punkte x0 und wird mit f ′ (x0 ) df df (x0 ) bzw. dx |x=x0 bezeichnet. Gelegentlich betrachtet man auch die einseitigen oder dx Grenzwerte f (x) − f (x0 ) , x→x0 + x − x0 f ′ (x0 +) := lim f (x) − f (x0 ) , x→x0 − x − x0 f ′ (x0 −) := lim die als rechtsseitige bzw. linksseitige Ableitung von f im Punkte x0 bezeichnet werden. Die Menge der Punkte x ∈ I, in denen f differenzierbar ist, bildet den Definitionsbereich der Funktion f ′ : x 7→ f ′ (x), genannt Ableitung von f. Anstelle von f ′ werden auch die Bezeichnungen df d , dx f (x), Df u.ä. verwendet. Ist D(f ′) = I, so heißt f differenzierbar auf dx 136 I, und ist die Ableitung f ′ sogar stetig auf I, so heißt f stetig differenzierbar auf I. Beispiele. a) Die Funktion IdR : R → R, x 7→ x, besitzt die Ableitung Id′R (x) = 1; die konstante Funktion f (x) := α besitzt die Ableitung f ′ (x) = 0: lim x→x0 x − x0 α−α = 1, lim =0 x→x x − x0 0 x − x0 b) Für die Funktion f (x) = 1 x 1 x − für alle x0 ∈ R. auf R \ {0} ist 1 x0 −1 x0 − x −1 = lim = 2, x→x0 x − x0 x→x0 x x0 (x − x0 ) x→x0 x x0 x0 1 d = − x12 , d.h. f ist also auf R \ {0} (stetig) differenzierbar, und es ist dx x f ′ (x0 ) = lim = lim c) Sei g(x) := |x|, x ∈ R. Da |x| − 0 = x→0+ x − 0 |x| − 0 = lim x→0− x − 0 lim x 6= 0. x = 1, x→0+ x −x lim = −1, x→0− x lim existieren im Punkte 0 die einseitigen Ableitungen von g, und es ist g ′(0+) = 1, g ′ (0−) = −1. Da diese verschieden sind, existiert die Ableitung von g in 0 nicht. Satz 10.1 (Äquivalente Charakterisierungen der Differenzierbarkeit) Sei f eine auf dem Intervall I definierte Funktion, und sei x0 ∈ I. Die folgenden Aussagen sind dann äquivalent. (i) f ist differenzierbar im Punkte x0 . (ii) Es gibt eine Zahl A, so dass gilt: (10.2) f (x) = f (x0 ) + A(x − x0 ) + r(x)(x − x0 ), x ∈ I, wobei r eine Funktion auf I mit lim r(x) = 0 ist. x→x0 (iii) Es gibt eine im Punkte x0 stetige Funktion u auf I, so dass gilt: (10.3) f (x) − f (x0 ) = u(x)(x − x0 ) für alle x ∈ I. Trifft (ii) zu, so ist A = f ′ (x0 ), und trifft (iii) zu, so ist u(x0 ) = f ′ (x0 ). 137 Bemerkungen: (a) Setzt man in (10.2) ϕ(x) := r(x)(x − x0 ), so erhält man f (x) = f (x0 ) + A(x − x0 ) + ϕ(x), und die Bedingung lim r(x) = 0 ist äquivalent zur x→x0 ϕ(x) x→x0 |x−x0 | Bedingung lim = 0. Dies wird die Charakterisierung der Differenzierbarkeit von Funktionen mehrere Veränderlicher sein, die wir in der Analysis II betrachten werden. (b) Differenzierbarkeit ist eine lokale Eigenschaft, so dass es offenbar genügt, die Eigenschaften in (ii) bzw. (iii) auf einer δ-Umgebung I ∩ Uδ (x0 ) nachzuweisen. Beweis. (i) ⇒ (iii): Ist f differenzierbar in x0 , so setzen wir ( f (x)−f (x0 ) , x ∈ I \ {x0 }, x−x0 u(x) := ′ f (x0 ), x = x0 . Dann ist nach (10.1) u stetig in x0 , und die Identität (10.3) folgt unmittelbar aus der Definition von u. Offenbar ist u(x0 ) = f ′ (x0 ). (iii) ⇒ (ii): Gilt (10.3), so setzen wir r(x) := u(x) − u(x0 ). Dann ist f (x) = f (x0 ) + u(x)(x − x0 ) = f (x0 ) + u(x0 )(x − x0 ) + r(x)(x − x0 ). Es gilt also (10.2), mit A = u(x0 ), und wegen der Stetigkeit von u in x0 ist lim r(x) = lim (u(x) − u(x0 )) = u(x0 ) − u(x0 ) = 0. x→x0 x→x0 (ii) ⇒ (i): Aus (10.2) folgt: f (x) − f (x0 ) = A + r(x), x ∈ I \ {x0 }, x − x0 und wegen lim r(x) = 0 ist x→x0 f (x) − f (x0 ) = A. x − x0 Somit ist f differenzierbar in x0 , und f ′ (x0 ) = A. lim x→x0 Q.E.D. Geometrische Interpretationen (f reellwertig) Sekante ∆f ∆x x0 x1 138 Tangente a) Sind x0 und x1 zwei verschiedene Punkte von I, so schreibt man ∆x := x1 − x0 , ∆f = f (x1 ) − f (x0 ). Der Differenzenquotient ∆f ist dann gerade die Steigung der Sekante, wel∆x che die Punkte (x0 , f (x0 )) und (x1 , f (x1 )) auf dem Graphen von f miteinander verbindet. ∆f x1 →x0 ∆x Die Existenz des Grenzwertes f ′ (x0 ) = lim lässt sich geometrisch so inter- pretieren, dass die obige Sekante für x1 → x0 gegen eine Grenzposition strebt, nämlich die der (nicht vertikalen) Tangente an den Graphen von f im Punkte (x0 , f (x0 )), und die Ableitung f ′ (x0 ) ist die Steigung dieser Tangente. b) Die Eigenschaft (ii) in Satz 10.1 lässt sich dahingehend interpretieren, dass die Funktion f in der Nähe von x0 eine gute“ Approximation durch eine affin ” lineare Funktion besitzt. Setzen wir nämlich g(x) := f (x0 ) + A(x − x0 ), so ist g affin linear, und für die Differenz zwischen f und g gilt f (x) − g(x) = r(x)(x − x0 ); (10.4) wegen lim r(x) = 0 geht diese für x → x0 “schneller” gegen 0 als |x − x0 |. x→x0 Oft benutzt man auch das Landau-Symbol o, um dies in Kurzform auszudrücken: Sind ϕ und h Funktionen auf einer punktierten Umgebung U̇ von x0 (in R oder in C), so schreibt man ϕ(x) = o(h(x)) für x → x0 , falls ϕ(x) = r(x)h(x) mit lim r(x) = 0. x→x0 Ist h(x) 6= 0 auf dieser punktierten Umgebung, so ist dies gleichbedeutend mit lim x→x0 ϕ(x) = 0. h(x) Gilt hingegen nur, dass r auf dieser punktierten Umgebung beschränkt ist, d.h. gilt |r(x)| ≤ C für alle x ∈ U̇ , wobei C ≥ 0 eine Konstante ist, so schreibt man ϕ(x) = O(h(x)) für x → x0 . Offenbar ist dies gleichbedeutend mit |ϕ(x)| ≤ C|h(x)| für alle x ∈ U̇ . 139 Damit läßt sich (10.4) kürzer schreiben als f (x) − g(x) = o(x − x0 ) für x → x0 . Der Graph von g ist natürlich gerade die oben beschriebene Tangente an den Graphen von f im Punkte (x0 , f (x0 )). Als Korollar aus Satz 10.1 erhalten wir: Korollar 10.2 Ist f im Punkte x0 differenzierbar, so ist f in x0 stetig. Beweis. Aus (10.3) folgt unmittelbar: lim (f (x) − f (x0 )) = 0. x→x0 Q.E.D. 10.1 Rechenregeln für die Ableitung Satz 10.3 Es seien f und g im Punkte x0 differenzierbare Funktionen, sowie α ∈ C. Dann sind auch die Funktionen αf, f +g, f g und f /g (falls g(x0 ) 6= 0) differenzierbar in x0 , und es gilt: (i) (αf )′ (x0 ) = αf ′(x0 ), (ii) (f + g)′(x0 ) = f ′ (x0 ) + g ′ (x0 ), (iii) (f g)′(x0 ) = f ′ (x0 )g(x0 ) + f (x0 )g ′(x0 ), ′ f ′ (x0 )g(x0 ) − f (x0 )g ′ (x0 ) f (iv) g (x0 ) = . g(x0 )2 (Produktregel) (Quotientenregel) Beweis. Wir benutzen die Charakterisierung (iii) in Satz 10.1. Danach existieren in x0 stetige Funktionen u und v mit u(x0 ) = f ′ (x0 ) und v(x0 ) = g ′ (x0 ), so dass gilt: f (x) − f (x0 ) = u(x)(x − x0 ), g(x) − g(x0 ) = v(x)(x − x0 ). Dann ist (αf )(x) − (αf )(x0 ) = (αu)(x)(x − x0 ), (f + g)(x) − (f + g)(x0 ) = (u + v)(x)(x − x0 ), (f g)(x) − (f g)(x0 ) = f (x)(g(x) − g(x0 )) + g(x0 )(f (x) − f (x0 )) = [f (x)v(x) + g(x0 )u(x)](x − x0 ) =: w(x)(x − x0 ), f f f (x) − f (x0 ) f (x0 ) (x) − (x0 ) = − (g(x) − g(x0 )) g g g(x) g(x)g(x0 ) u(x)g(x0 ) − f (x0 )v(x) (x − x0 ) = g(x)g(x0 ) =: q(x)(x − x0 ). 140 Im letzten Fall ist zu beachten, dass wegen 0 6= g(x0 ) = lim g(x) auch g(x) 6= 0 ist, x→x0 falls |x − x0 | genügend klein ist. Aufgrund der Rechenregeln für im Punkte x0 stetige Funktionen sind nun aber die Funktionen αu, u + v, w und q stetig in x0 und es gilt: (αu)(x0 ) = αu(x0 ) = αf ′ (x0 ), (u + v)(x0 ) = u(x0 ) + v(x0 ) = f ′ (x0 ) + g ′ (x0 ), w(x0 ) = f (x0 )g ′(x0 ) + g(x0 )f ′ (x0 ), f ′ (x0 )g(x0 ) − f (x0 )g ′ (x0 ) q(x0 ) = , g(x0 )2 womit die behaupteten Regeln folgen. Q.E.D. Satz 10.4 (Ableitung zusammengesetzter Funktionen) Es sei f : I → R differenzierbar im Punkte x0 ∈ I, sowie g : J → R (bzw. C) differenzierbar im Punkte f (x0 ), wobei J ein Intervall sei, welches f (I) enthalte. Dann ist die Funktion g ◦ f differenzierbar in x0 , und es gilt die Kettenregel: (g ◦ f )′ (x0 ) = g ′ (f (x0 ))f ′ (x0 ). Beweis. Mit denselben Bezeichnungen wie im Beweis von Satz 10.3 ist g ◦ f (x) − g ◦ f (x0 ) = = = =: g(f (x)) − g(f (x0 )) v(f (x))(f (x) − f (x0 )) (v ◦ f (x))u(x)(x − x0 ) w(x)(x − x0 ), wobei u stetig in x0 mit u(x0 ) = f ′ (x0 ) ist, sowie v stetig in f (x0 ) mit v(f (x0 )) = g ′ (f (x0 )) ist. Damit ist offenbar w stetig in x0 , und es gilt: w(x0 ) = v(f (x0 ))u(x0 ) = g ′ (f (x0 ))f ′ (x0 ). Q.E.D. Für Umkehrfunktionen erhält man folgende Regel: Satz 10.5 (Ableitung der Umkehrfunktion) Es seien I und J zwei Intervalle, und f : I → J eine stetige, bijektive Funktion. Ist f differenzierbar im Punkte x0 ∈ I, und ist f ′ (x0 ) 6= 0, so ist die Umkehrfunktion f −1 : J → I differenzierbar im Punkte y0 := f (x0 ), und es gilt: (f −1 )′ (y0 ) = 1 f ′ (x0 ) 141 = 1 f ′ (f −1 (y 0 )) . Beispiel: Die Funktion f : R → R, x 7→ x3 , ist stetig und streng wachsend, und √ besitzt somit eine stetige Umkehrfunktion 3 : R → R, welche definiert ist durch √ 3 x := ( 1 x 3 , falls x ≥ 0, 1 −|x| 3 , falls x < 0. f ist differenzierbar auf ganz R, √ und es ist f ′ (x) 6= 0 genau dann, wenn x 6= 0. Nach Satz 10.5 ist die Funktion x 7→ 3 x daher auf R \ {0} differenzierbar. In 0 gilt dies offenbar jedoch nicht. Beweis. Da f stetig ist und im Punkte x0 differenzierbar, gibt es eine auf ganz I stetige Funktion u mit u(x0 ) = f ′ (x0 ) 6= 0, so dass f (x) − f (x0 ) = u(x)(x − x0 ). Ferner gibt es ein δ > 0 so, dass auch für alle x mit 0 < |x − x0 | < δ stets u(x) 6= 0 ist, und somit 1 x − x0 = (f (x) − f (x0 )). u(x) Setzen wir y = f (x), also x = f −1 (y), so bedeutet dies: f −1 (y) − f −1 (y0 ) = 1 (y − y0 ) =: w(y)(y − y0 ). u ◦ f −1 (y) Aufgrund der Rechenregeln für stetige Funktionen ist die Funktion y 7→ w(y) = 1 1 . stetig im Punkte y0 , und es ist w(y0 ) = u(x1 0 ) = f ′ (x −1 0) u(f (y)) Q.E.D. 10.1.1 Einige Beispiele. (a) d k x dx = kxk−1 , (b) d x e dx = ex (c) d dx (d) d α x dx (e) d dx sinh x = cosh x, (f) d dx tanh x = (g) d arsinh dx log |x| = 1 x (k ∈ Z) (x 6= 0) = αxα−1 (α ∈ R, x > 0) d dx cosh x = sinh x 1 . cosh2 x x= √ 1 x2 +1 , d arcosh x dx =√ 142 1 x2 −1 (h) (i) d ix e dx d dx = ieix sin x = cos x, d dx cos x = − sin x Diese Regeln lassen sich leicht folgendermaßen beweisen: (a) wurde für k = 0 bereits bewiesen. Nach der Produktregel gilt weiter (per Induktion) d d k d k d k+1 (x ) = (x · x) = x · x + xk · x dx dx dx dx k−1 k k = kx · x + x · 1 = (k + 1)x . Für k < 0 folgt damit mittels der Quotientenregel: d 1 −|k|x|k|−1 d k x = = = kxk−1 . dx dx x|k| x2|k| (b) Setzen wir h := x − x0 , so ist x x0 e −e x0 h x0 = e (e − 1) = e = x0 e ∞ X k=0 hk (k + 1)! ∞ X hk k=1 ! k! (x − x0 ). P hk Die Potenzreihe ∞ k=0 (k+1)! konvergiert offenbar für alle h ∈ C und definiert nach Satz 9.14 eine stetige Funktion v(h) mit v(0) = 1. Damit ist ex − ex0 = (ex0 v(x − x0 ))(x − x0 ) =: u(x)(x − x0 ), wobei u stetig in x0 ist, und u(x0 ) = ex0 . Somit ist exp differenzierbar in x0 , und d x e |x=x0 dx = ex0 . (c) Für x > 0 ist nach Satz 10.5 log′ (x) = 1 exp′ (log x) = 1 1 = . exp(log x) x Für x < 0 ist nach der Kettenregel d d 1 log |x| = log(−x) = · dx dx −x d(−x) dx = 1 . x (d) Nach der Kettenregel ist d d(α log x) d α x = exp(α log x) = exp(α log x) · dx dx dx 1 = xα · α · = αxα−1 . x 143 d d (ex ) = ex , und somit nach der Kettenregel dx (e−x ) = (e) Nach (b) ist dx d e−x dx (−x) = −e−x . Es folgt 1 1 d x d d sinh(x) = (e ) − (e−x ) = (ex + e−x ) = cosh(x). dx 2 dx dx 2 ′ Analog zeigt man cosh (x) = sinh(x). (f) Nach der Quotiententregel und (9.18) ist 1 d d sinh x cosh x cosh x − sinh x sinh x = . tanh (x) = = 2 dx dx cosh x cosh x cosh2 x (g) Nach Satz 10.5 ist d 1 arsinh x = . dx cosh(arsinh x) Ferner ist aufgrund von (9.18) cosh2 y = sinh2 y + 1, also cosh y = p sinh2 y + 1, da stets cosh y ≥ 1. Es folgt 1 d arsinh x = √ . 2 dx x +1 Die zweite Formel wird ähnlich bewiesen. (h) Wir können hier ähnlich argumentieren wie in (b). Es ist eix − eix0 = eix0 (eih − 1), mit h = x − x0 . Mit der in (b) definierten Funktion v ist also eix − eix0 = (eix0 v(i(x − x0 )))i(x − x0 ), und wie in (b) folgern wir, dass (10.5) cis′ (x0 ) = ieix0 = icis(x0 ) ist. (i) Man überlegt sich leicht, dass eine komplexwertige Funktion f differenzierbar in x0 ist dann und nur dann, wenn die beiden reellwertigen Funktionen Ref und Im f differenzierbar sind in x0 , und dass dann (10.6) f ′ (x0 ) = (Ref )′ (x0 ) + i(Imf )′ (x0 ) gilt. Angewandt auf f = cis folgt nach (10.5): cos′ (t0 ) + i sin′ (t0 ) = cis′ (t0 ) = icis(t0 ) = i(cos t0 + i sin t0 ) = − sin t0 + i cos t0 , woraus (h) unmittelbar folgt. 144 10.2 Ableitungen höherer Ordnung Es seien wieder I ⊂ R ein Intervall positiver Länge und f : I → R (bzw. f : I → C) eine Funktion, sowie x0 ein fester Punkt von I. Definitionen. Die Ableitungen höherer Ordnung von f sind rekursiv definiert durch f (0) := f, f (k+1) := (f (k) )′ , k ≥ 0. k Anstelle von f (k) schreibt man auch ddxfk . Sei m ∈ N, m ≥ 1. Die Funktion f heiße im Punkte x0 m-mal differenzierbar, wenn es eine ε-Umgebung Uε (x0 ), ε > 0, gibt, sowie Funktionen f (0) , . . . , f (m−1) auf Uε (x0 ) ∩ I, so dass f (k) = (f (k−1) )′ ist für k = 1, . . . , m − 1, und so dass f (m) (x0 ) := (f (m−1) )′ (x0 ) existiert. Natürlich hängt f (m) (x0 ) dann nicht von ε ab. Man schreibt häufig auch: f (1) = f ′ , f (2) = f ′′ , f (3) = f ′′′ . Existiert f (m) auf ganz I, so heißt f m-mal differenzierbar auf I. Ist zusätzlich die m-te Ableitung f (m) stetig auf I, so heißt f m-mal stetig differenzierbar auf I, oder auch Funktion der Klasse C m . Mit C m (I) oder auch C m (I, C), m ∈ N, bezeichnen wir die Menge aller m-mal stetig differenzierbaren Funktionen auf I mit Werten in C, mit C m (I, R) die Menge aller m-mal stetig differenzierbaren Funktionen auf I mit Werten in R. Entspreched bezeichne C ∞ (I) etc. die Menge aller beliebig oft differenzierbaren Funktionen auf I. Insbesondere ist f ∈ C 0 (I, C) bzw. f ∈ C 0 (I, R) genau dann, wenn f eine stetige, komplex- bzw. reellwertige Funktion auf I ist. Man schreibt auch C(I) bzw. C(I, C) für C 0 (I, C) und C(I, R) für C 0 (I, R). Mit Hilfe der Rechenregeln für stetige bzw. differenzierbare Funktionen sieht man sofort, dass C m (I, C) einen C-Vektorraum und C m (I, R) einen R-Vektorraum bildet. Für höhere Ableitungen gelten folgende Rechenregeln. Satz 10.6 (Leibniz-Regel) Sind sowohl f als auch g m-mal (stetig) differenzierbare Funktionen auf dem Intervall I, so ist auch das Produkt f ·g dort m-mal (stetig) differenzierbar, und es gilt: m X m (m−k) (k) (m) f g . (10.7) (f · g) = k k=0 Beweis. Dies folgert man leicht mittels vollständiger Induktion aus der Produktregel (Übung). Q.E.D. Satz 10.7 Es seien I und J zwei Intervalle, sowie f : I → R mit f (I) ⊂ J und g : J → R (oder auch g : J → C) zwei Funktionen. Ist f m-mal (stetig) differenzierbar auf I, und ist g m-mal (stetig) differenzierbar auf J, so ist g ◦ f m-mal (stetig) differenzierbar auf I. 145 Satz 10.8 Es sei f : I → R eine m-mal stetig differenzierbare Funktion auf dem Intervall I, m ≥ 1. Ist f ′ (x) 6= 0 für alle x ∈ I, so ist die Umkehrfunktion f −1 m-mal stetig differenzierbar auf f (I). Diese Regeln lassen sich leicht aus den bereits bewiesenen Regeln für 1-mal (stetig) differenzierbare Funktionen mittels vollständiger Induktion herleiten (siehe [B]). Beispielsweise gilt für die 2. Ableitung der Umkehrfunktion g = f −1 von f : g ′′ (y) = − (10.8) Es ist nämlich g ′ (y) = wobei h(t) = f ′′ (g(y)) . [f ′ (g(y))]3 1 = h ◦ f ′ ◦ g(y), f ′ (g(y)) 1 sei. Die Kettenregel liefert daher t g ′′ (y) = h′ (f ′(g(y)) f ′′ (g(y)) g ′ (y) 1 1 = − ′ f ′′ (g(y)) ′ . 2 [f (g(y))] f (g(y)) 10.3 Extrema Definition. Es sei A eine Teilmenge von R oder C. Ein Punkt x0 ∈ A heiße innerer Punkt von A, wenn es ein ε > 0 gibt mit Uε (x0 ) ⊂ A. Ab jetzt sei wieder A = I ein Intervall, und f : I → R eine reellwertige Funktion. Satz 10.9 Sei f : I → R gegeben, und sei x0 ein innerer Punkt von I. Ist f differenzierbar in x0 , und besitzt f in x0 ein lokales Extremum, so ist f ′ (x0 ) = 0. Beweis. Wir dürfen annehmen, dass f in x0 ein lokales Minimum besitzt (andernfalls betrachte man −f anstelle von f ). Sei ε > 0 so, dass Uε (x0 ) ⊂ I, und so dass ferner f (x) ≥ f (x0 ) für alle x ∈ Uε (x0 ) gilt. Dann folgt für solche x ( f (x) − f (x0 ) ≤ 0 für x < x0 x − x0 ≥ 0 für x > x0 , also f ′ (x0 +) ≥ 0, f ′ (x0 −) ≤ 0. Somit ist f ′ (x0 ) = f ′ (x0 +) = f ′ (x0 −) = 0. Q.E.D. Punkte x0 , in denen f ′ (x0 ) = 0 ist, heißen kritische oder auch stationäre Punkte von f . 146 Lokale Extremalpunkte einer differenzierbaren Funktion sind also kritische Punkte – die Umkehrung hiervon gilt aber nicht. Beispiel. 0 ist ein kritischer Punkt der Funktion f (x) = x3 auf R, jedoch kein Extremalpunkt. Wie schon die Graphik zum Satz 9.8 vom Maximum zeigt, ist übrigens die Voraussetzung, dass x0 ein innerer Punkt von I ist, wichtig für die Gültigkeit von Satz 10.9. In den folgenden Sätzen werden wir meist folgende Annahme über die Funktion f machen: (∗) f : [a, b] → R ist stetig auf dem abgeschlossenen Intervall [a, b] und differenzierbar auf dem offenen Intervall ]a, b[. Dabei soll wieder a < b sein. Der Verzicht auf die Differenzierbarkeit √ in den Endpunkten macht die betreffenden Sätze z.B. auf die Funktion f (x) = 1 − x2 , D(f ) = [−1, 1], anwendbar. Satz 10.10 (Rolle) Genügt f der Voraussetzung (∗) und ist f (a) = f (b), so gibt es einen Punkt ξ ∈]a, b[ mit f ′ (ξ) = 0. Beweis. Nach dem Satz vom Maximum bzw. Minimum gibt es ξ1 , ξ2 ∈ [a, b] mit f (ξ1 ) ≤ f (x) ≤ f (ξ2 ) für alle x ∈ [a, b]. Ist nun ξ1 ein innerer Punkt von [a, b] , d.h. ξ1 ∈]a, b[, so ist nach Satz 10.9 f ′ (ξ1 ) = 0, und ebenso ist f ′ (ξ2 ) = 0, falls ξ2 ∈]a, b[. Es bleibt der Fall zu betrachten, dass ξ1 und ξ2 in {a, b} liegen. Dann ist aber wegen f (a) = f (b) auch f (ξ1) = f (ξ2), d.h. f (x) = f (ξ1 ) = f (ξ2 ) für alle x ∈ [a, b]. f ist also konstant, und somit f ′ (ξ) = 0 für alle ξ ∈]a, b[. Q.E.D. Theorem 10.11 (Verallgemeinerter Mittelwertsatz) Genügen f und g der Voraussetzung (∗) und ist g ′(x) 6= 0 für alle x ∈]a, b[, so ist g(a) = 6 g(b). Ferner gibt es einen Punkt ξ ∈]a, b[ mit (10.9) f (b) − f (a) f ′ (ξ) = ′ . g(b) − g(a) g (ξ) Beweis. Aus g(a) = g(b) folgte nach dem Satz von Rolle, dass g ′ (x) = 0 für mindestens ein x ∈]a, b[. Somit ist g(a) 6= g(b). Indem wir anstelle von f die Funktion f˜(x) := f (x) − f (a) und anstelle von g die Funktion g̃(x) := g(x) − g(a) betrachten dürfen wir in einem ersten Schritt o.B.d.A annehmen, dass f (a) = 0 = g(a). Dann ist g(b) 6= 0, und indem wir dann noch g(x)/g(b) anstelle von g(x) betrachten, dürfen wir zusätzlich noch g(b) = 1 147 annehmen, d.h. g(b) = 1 und f (a) = g(a) = 0. Unter diesen Voraussetzungen ist dann (10.9) äquivalent dazu, dass ein ξ ∈]a, b[ existiert, für welches gilt f (b) = f ′ (ξ) , g ′(ξ) d.h. f ′ (ξ) − f (b)g ′ (ξ) = 0. Wir definieren daher die Hilfsfunktion h : [a, b] → R durch h(x) := f (x) − f (b)g(x). Für diese gilt h(a) = h(b) = 0. Nach dem Satz von Rolle gibt es daher ein ξ ∈]a, b[ mit 0 = h′ (ξ) = f ′ (ξ) − f (b)g ′ (ξ). Damit ist (10.9) gezeigt. Q.E.D. Korollar 10.12 (Mittelwertsatz) Genügt f der Voraussetzung (∗), so gibt es einen Punkt ξ ∈]a, b[ mit (10.10) f (b) − f (a) = f ′ (ξ)(b − a) Beweis. Wende Theorem 10.11 mit g(x) = x an. Q.E.D. a ξ b Der Mittelwertsatz hat verschiedenste Anwendungen, von denen wir hier drei betrachten. 10.3.1 Satz von l’Hospital Satz 10.13 (Regel von l’Hospital) Wir nehmen an, dass f und g der Voraussetzung (∗) genügen, und dass x ∈ [a, b] eine gemeinsame Nullstelle von f und g ist, d.h. f (x) = g(x) = 0. Ferner sei g ′ (ξ) 6= 0 für alle ξ ∈]a, b[ mit ξ 6= x. Dann gilt: Falls der Grenzwert f ′ (ξ) lim ξ→x g ′ (ξ) 148 existiert, so existiert auch der Grenzwert f (ξ) , ξ→x g(ξ) lim und beide sind gleich: f (ξ) f ′ (ξ) = lim . ′ ξ→x g(ξ) ξ→x g (ξ) lim Beweis. Sei (xn )n eine beliebige Folge in [a, b] mit xn → x und xn 6= x für alle x. Nach Theorem 10.11 gibt es für alle n ∈ N ein ξn zwischen x und xn mit f (xn ) f (xn ) − f (x) f ′ (ξn ) = = ′ . g(xn ) g(xn ) − g(x) g (ξn ) Aus xn → x folgt ξn → x und damit f (xn ) f ′ (ξ) f ′ (ξn ) = lim ′ = lim ′ . n→∞ g(xn ) n→∞ g (ξn ) ξ→x g (ξ) lim Da die Folge (xn )n beliebig war, folgt die Behauptung. Q.E.D. Beispiel: cos x sin x = lim = cos(0) = 1. x→0 x→0 x 1 lim 10.3.2 Fehlerabschätzung Genügt f der Voraussetzung (∗), und ist (10.11) |f ′ (x)| ≤ M für alle x ∈]a, b[, so gilt für beliebige x, x0 ∈ [a, b]: f (x) = f (x0 ) + r(x), wobei (10.12) |r(x)| ≤ Mε, falls |x − x0 | ≤ ε. Es ist nämlich f (x) − f (x0 ) = f ′ (ξ)(x − x0 ) für ein ξ ∈]a, b[, also |r(x)| = |f ′(ξ)(x − x0 )| ≤ M|x − x0 |. 149 10.3.3 Monotonie Satz 10.14 f genüge der Voraussetzung (∗). Dann gilt: (i) f ist monoton wachsend auf [a, b] genau dann, wenn f ′ (x) ≥ 0 ist für alle x ∈]a, b[. (ii) f ist konstant genau dann, wenn f ′ (x) = 0 ist für alle x ∈]a, b[. (iii) f ist streng monoton wachsend, falls f ′ (x) > 0 ist für alle x ∈]a, b[. Beweis. Sind x1 , x2 ∈ [a, b] mit x1 < x2 , so gilt nach dem Mittelwertsatz: ∆f := f (x2 ) − f (x1 ) = f ′ (ξ)(x2 − x1 ), mit einem ξ = ξ(x1 , x2 ) ∈]x1 , x2 [. Aus f ′ (x) ≥ 0, bzw. f ′ (x) = 0 bzw. f ′ (x) > 0 für alle x ∈]a, b[ folgt daher ∆f ≥ 0, bzw. ∆f = 0, bzw. ∆f > 0, d.h. f ist wachsend bzw. konstant, bzw. streng wachsend. Die zu beweisenden umgekehrten Implikationen sind klar. Q.E.D. Beispiel: Die Funktion f : R≥0 → R mit 1 1+x ist streng monoton wachsend. Insbesondere ist f (x) ≥ 1 für alle x ≥ 0, da ja f (0) = 1. Es ist nämlich 1 x 1 − = > 0 für alle x > 0. f ′ (x) = 2 1 + x (1 + x) (1 + x)2 f (x) := log(1 + x) + 10.4 Trigonometrische Funktionen: 2. Teil. Lemma 10.15 Es gilt sin x > 0 für alle x ∈]0, 2], sowie cos 2 < 0. Beweis. Es ist sin x = x + r(x), mit ∞ r(x) X (−1)k x2k = . x (2k + 1)! k=1 Setzen wir pk := x2k /(2k + 1)!, so gilt für |x| ≤ 3 : pk+1/pk ≤ 1, wie man leicht ∞ P nachprüft, und natürlich ist (pk )k eine Nullfolge, d.h. die Reihe (−1)k pk = −p1 + k=1 p2 − p3 + . . . genügt dem Leibnizkriterium. Da pk − pk+1 ≥ 0 für alle k gilt, und da s2n = 2n X k=1 (−1)k pk = −(p1 − p2 ) − (p3 − p4 ) − · · · − (p2n−1 − p2n ) = −p1 + (p2 − p3 ) + (p4 − p5 ) + · · · + (p2n−2 − p2n−1 ) + p2n 150 ist, folgt −p1 ≤ s2n ≤ 0. Ganz analog erhält man aus s2n+1 = −p1 + (p2 − p3 ) + · · · + (p2n − p2n+1 ) = −(p1 − p2 ) − · · · − (p2n−1 − p2n ) − p2n+1 auch −p1 ≤ s2n+1 ≤ 0. ≤ p1 = Somit ist r(x) x Abschätzung x2 3! = x2 6 ≤ 2 3 für |x| ≤ 2. Für 0 < x ≤ 2 ergibt sich die r(x) 2 x ) ≥ x(1 − ) = > 0. x 3 3 Mit ähnlichen Überlegungen zeigt man, dass cos 2 < 0 ist. sin x = x(1 + Q.E.D. Lemma 10.16 Die Cosinus-Funktion ist im Intervall [0, 2] streng fallend und besitzt darin genau eine Nullstelle. Beweis. Nach Lemma 10.15 ist cos′ (x) = − sin(x) < 0 für x ∈]0, 2[, so dass cos auf [0, 2] nach Satz 10.14 streng fallend, also insbesondere injektiv ist. Ferner ist cos 0 = 1, cos 2 < 0, so dass cos nach dem Zwischenwertsatz auf ]0, 2[ eine Nullstelle besitzt. Diese ist aufgrund der Injektivität eindeutig. Q.E.D. Die eindeutige Nullstelle des Cosinus in ]0, 2[ wird mit π = 2 · π2 die Kreiszahl. Aus cos π2 = 0 folgt: sin2 π 2 bezeichnet, und man nennt π π = 1 − cos2 = 1, 2 2 und da sin π2 > 0 gilt nach Lemma 10.15, ist sin π2 = 1. Es folgt π ei 2 = cos π π + i sin = i, 2 2 und somit (10.13) π 3 ei 2 = i, eiπ = −1, ei 2 π = −i, ei2π = 1. Eine auf ganz R definierte Funktion f heiße periodisch, wenn es eine Zahl T > 0 gibt, so dass für alle t ∈ R gilt: f (t + T ) = f (t). 151 Ein solches T heißt eine Periode von f . Die Funktion cis : t 7→ eit , t ∈ R, ist periodisch mit Periode 2π. Es gilt nämlich ei(t+2π) = eit ei2π = eit . Folglich sind auch sin und cos 2π-periodisch. Es gilt ferner ei(t+π) = eit eiπ = −eit , (10.14) woraus (10.15) cos(t + π) = − cos t, sin(t + π) = − sin t folgt. Schließlich ist π π ei(t+ 2 ) = eit ei 2 = ieit , (10.16) woraus cos(t + π π ) = − sin t, sin(t + ) = cos t, 2 2 d.h. (10.17) cos t = sin( π π − t), sin t = cos( − t) 2 2 folgt. Diese Identitäten zeigen insbesondere, dass es genügt, die Funktion cos im Intervall [0, π2 ] zu kennen, um den Gesamtverlauf der Funktionen cos und sin auf R zu bestimmen. Satz 10.17 Die cis-Funktion bildet das Intervall [0, 2π[ bijektiv und stetig auf den Einheitskreis S 1 ab. Beweis. Nach Lemma 10.16 und dem Zwischenwertsatz bildet cos das Intervall [0, π2 [ bijektiv auf das Intervall ]0, 1] ab; dies impliziert, dass cis das Intervall [0, π2 [ bijektiv auf den Viertelkreis SI1 := {x + iy ∈ S 1 : x > 0, y ≥ 0} abbildet. eit 1 SII SI1 cos t 1 SIV 1 SIII 152 Da die Abbildung J : C → C, z 7→ iz wegen i(x + iy) = −y + ix einer Vierteldrehung der Ebene um 0 entspricht, und da cis(t + π ) = i cis(t) = J ◦ cis(t) 2 1 , das Intervall ist, bildet cis damit offenbar das Intervall [ π2 , π[ auf den Viertelkreis SII 3 3 1 1 [π, 2 π[ auf den Viertelkreis SIII und das Intervall [ 2 π, 2π[ auf den Viertelkreis SIV (siehe Zeichnung) ab, und zwar jeweils bijektiv. Q.E.D. Wir zeigen nun noch, dass cis die reelle Achse längentreu“ auf den Einheitskreis ” aufwickelt,“d.h. dass t tatsächlich den Winkel zwischen den Punkten eit = cos t + ” i sin t und der positiven Halbachse R+ , gemessen im Bogenmaß, beschreibt: Für festes t ∈ [0, 2π[ betrachten wir dazu die Kurve γ(s) := eis , s ∈ [0, t], welche den Punkt 1 mit dem Punkt eit entlang des Einheitskreises verbindet. Wir müssen zeigen, dass der dadurch definierte Kreisbogen die (Bogen-)länge t besitzt. Die Länge einer Kurve werden wir später allgemeiner definieren. Eine ad hoc- Definition sieht offenbar folgendermassen aus: Gegeben N ∈ N≥1 , zerlege das Intervall [0, t[ in N gleichlange Teilintervalle der Form [sk , sk+1 [, k = 0, . . . , N − 1, mit sk := kt/N. Wir stellen uns dann die Kurve approximiert vor durch den Polygonzug PN , welchen man dadurch erhält, dass man die Punkte γ(sk−1 ) und γ(sk ) jeweils durch ein Geradensegment der Länge ∆k := |γ(sk−1) − γ(sk )| verbindet. Der Polygonzug besitzt dann offenbar die Gesamtlänge L(PN ) = N −1 X ∆k . k=0 Ferner gilt itk ∆2k = |e N − e it(k−1) N it it −it |2 = |e N − 1|2 = (e N − 1)(e N − 1) = 2 1 − cos( t ) . N Ferner gilt bekanntlich 1 − cos x = 2 sin2 (x/2) (Additionstheorem auf cos(x/2 + x/2) t anwenden!). Für genügend großes N erhalten wir somit ∆k = 2 sin 2N , und folglich L(PN ) = N2 sin sin t t 2N . =t· t 2N 2N Für N → ∞ strebt dies gegen t, und man definiert in der Tat die Länge von γ durch diesen Grenzwert: L(γ) := lim L(PN ) = t. N →∞ Mit Hilfe von Satz 10.17 und der obigen Formeln (10.17) zeigt man leicht (Übung): 153 Ist z ∈ C, so gilt sin z = 0 genau dann, wenn z = kπ für ein k ∈ Z, und cos z = 0 genau dann, wenn z = π2 + kπ, für ein k ∈ Z. Die Funktionen cos : [0, π] → [−1, 1] und π π sin : [− , ] → [−1, 1] 2 2 sind streng monoton und stetig, und wieder mit dem Zwischenwertsatz zeigt man, dass sie auch surjektiv sind. Sie besitzen daher Umkehrfunktionen arccos : [−1, 1] → [0, π] bzw. π π arcsin : [−1, 1] → [− , ], 2 2 den Arcuscosinus bzw. Arcussinus. Abbildung 10.1: Arcuscosinus Abbildung 10.2: Arcussinus Mit ähnlichen Überlegungen wie in den Beispielen 10.1.1(g) zeigt man, dass (10.18) 1 d arccos(x) = √ , dx 1 − x2 −1 d arcsin(x) = √ , dx 1 − x2 x ∈] − 1, 1[. Außerhalb der Nullstellen von Cosinus bzw. Sinus definiert man den (komplexen) Tangens bzw. Cotangens durch tan z := sin z , cos z cot z := 154 cos z . sin z Die Einschränkungen auf die reelle Achse werden mit denselben Symbolen bezeichnet. Tangens und Cotangens sind offenbar auch 2π-periodisch, nach (10.17) sogar π-periodisch, und mit der Quotientenregel erhält man (10.19) d 1 tan(x) = , dx cos2 x d −1 . cot(x) = dx sin2 x Ferner ist die Einschränkung des Tangens auf das reelle Intervall ] − π2 , π2 [ eine streng wachsende Bijektion auf R, und besitzt somit eine Umkehrfunktion π π arctan : R →] − , [, 2 2 den Arcustangens (genauer den Hauptzweig des Arcustangens). Dessen Ableitung ist gegeben durch 1 d arctan(x) = , dx 1 + x2 (10.20) denn ist y = arctan x, d.h. x = tan y, so gilt wegen tan′ (y) = tan2 y = 1 sowie cos2 y sin2 y 1 − cos2 y 1 = = −1 cos2 y cos2 y cos2 y offenbar tan′ (y) = 1 + (tan y)2 , so dass (10.20) mit dem Satz 10.5 über die Ableitung von Umkehrfunktionen folgt. Abbildung 10.3: Arcustangens Mehr zu diesen Themen, insbesondere zu trigonometrischen Funktionen, findet man beispielsweise in [F] und [B] oder [K]. Korollar 10.18 (Polarzerlegung in C) Jede komplexe Zahl z besitzt eine Darstellung z = reiϕ mit r = |z| und ϕ ∈ R. ϕ ist im Fall z 6= 0 bis auf die Addition eines ganzzahligen Vielfachen von 2π bestimmt, im Falle z = 0 beliebig. 155 Beweis. Sei z 6= 0 (der Fall z = 0 ist trivial). Mit r := |z| gilt dann zr ∈ S 1 , so dass nach Satz 10.17 ein eindeutiges t ∈ [0, 2π[ existiert mit zr = eit , also z = reit . Da die Funktion cis 2π-periodisch ist, gilt somit z = reiϕ für jedes ϕ der Gestalt ϕ = t + k2π, k ∈ Z, und umgekehrt folgert man, dass jedes ϕ mit z = reiϕ von dieser Gestalt sein muss . Q.E.D. Man nennt eine Zahl ϕ wie im obigen Korollar dann ein Argument von z. 10.5 Konvexität Definition. Es sei f : I → R eine Funktion auf dem Intervall I. f heiße konvex auf I, wenn für alle Punkte x, y ∈ I und jedes t ∈ [0, 1] gilt: (K) f ((1 − t)x + ty) ≤ (1 − t)f (x) + tf (y). Hierzu sei angemerkt: Für x < y besitzt jeder Punkt z des Intervalls [x, y] eine eindeutige Darstellung der Form z = (1 − t)x + ty, mit t ∈ [0, 1], (warum?), und es gilt dann (10.21) (z − x) = t(y − x), (y − z) = (1 − t)(y − x). Ferner ist die Sekante durch die Punkte (x, f (x)) und (y, f (y)) gegeben als Graph der Funktion f (y) − f (x) g(s) := f (x) + (s − x). y−x Da dann f (y) − f (x) ((1 − t)x + ty − x) y−x = (1 − t)f (x) + tf (y) g(z) = f (x) + ist, bedeutet (K), dass f (z) ≤ g(z) ist für alle z ∈ [x, y], d.h. dass der Graph von f unterhalb der Sekante liegt. x y 156 Satz 10.19 (Jensensche Ungleichung) Es sei f : I → R eine konvexe Funktion. Dann gilt für alle n ∈ N, n ≥ 1: Sind x1 , . . . , xn ∈ I und α1 , . . . , αn ∈ [0, 1] mit α1 + · · · + αn = 1, so ist α1 x1 + · · · + αn xn ∈ I, und (K′ ) f (α1 x1 + · · · + αn xn ) ≤ α1 f (x1 ) + · · · + αn f (xn ). Beweis (per vollständiger Induktion). Für n = 1 ist (K′ ) klar. Setzen wir die Gültigkeit von (K′ ) für ein n ≥ 1 voraus, und sind x1 , . . . , xn+1 ∈ I sowie α1 , . . . , αn+1 ∈ [0, 1] mit α1 + · · · + αn+1 = 1 gegeben, so unterscheiden wir zwei Fälle: Ist αn+1 = 1, so ist die Ungleichung f (α1 x1 + · · · + αn xn + αn+1 xn+1 ) ≤ α1 f (x1 ) + . . . αn f (xn ) + αn+1 f (xn+1 ) (10.22) offensichtlich, da dann α1 = · · · = αn = 0 ist. Ist αn+1 < 1, so ist 1 − αn+1 > 0, und wir setzen α1 αn , . . . , βn := , 1 − αn+1 1 − αn+1 y := β1 x1 + · · · + βn xn . β1 := Da die βj ≥ 0 sind, und da β1 + · · · + βn = (α1 + · · · + αn )/(1 − αn+1 ) = (1 − αn+1 )/(1 − αn+1 ) = 1 ist, ist nach Induktionsvoraussetzung y ∈ I. Damit liegt dann auch α1 x1 + · · · + αn xn + αn+1 xn+1 = (1 − αn+1 )y + αn+1 xn+1 in I, und mit (K) folgt f (α1 x1 + · · · + αn xn + αn+1 xn+1 ) = f ((1 − αn+1 )y + αn+1 xn+1 ) ≤ (1 − αn+1 )f (y) + αn+1 f (xn+1 ). Ferner gilt nach Induktionsvoraussetzung f (y) = f (β1 x1 + · · · + βn xn ) ≤ β1 f (x1 ) + · · · + βn f (xn ). Zusammen erhalten wir f (α1 x1 + · · · + αn+1 xn+1 ) ≤ (1 − αn+1 )β1 f (x1 ) + · · · + (1 − αn+1 )βn f (xn ) + αn+1 f (xn+1 ) , also (10.22) . Q.E.D. Sind x1 , . . . , xn Vektoren in einem reellen Vektorraum E, so bezeichnet man jede Linearkombination α1 x1 + · · · + αn xn mit α1 , . . . , αn ∈ [0, 1] und α1 + · · · + αn = 1 übrigens als eine konvexe Linearkombination dieser Vektoren. 157 Satz 10.20 Ist f : I → R 2-mal differenzierbar, so sind die folgenden Eigenschaften äquivalent: (i) f ist konvex auf I. (ii) f ′ ist monoton wachsend auf I. (iii) f ′′ (x) ≥ 0 für alle x ∈ I. Beweis. (i) ⇒ (ii)“. ” Es seien x, z, y ∈ I mit x < z < y. Schreiben wir wieder z als z = (1 − t)x + ty, so ist nach (K) f (z) − f (x) = f ((1 − t)x + ty) − f (x) ≤ t[f (y) − f (x)], also wegen z − x = t(y − x): f (y) − f (x) f (z) − f (x) ≤ . z−x y−x (10.23) Analog ist nach (K) f (z) − f (y) ≤ (1 − t)[f (x) − f (y)], also wegen z − y = (1 − t)(x − y): f (y) − f (x) f (y) − f (z) ≥ . y−z y−x (10.24) Aus (10.23) und (10.24) ergibt sich f (z1 ) − f (x) f (y) − f (z2 ) ≤ z1 − x y − z2 für alle x, z1 , z2 , y ∈ I mit x < z1 , z2 < y. Lässt man in dieser Ungleichung z1 gegen x und z2 gegen y streben, so folgt: f ′ (x) ≤ f ′ (y). Somit ist f ′ wachsend. (ii) ⇒ (i)“. Es seien x, z, y ∈ I mit x < z < y. Nach dem Mittelwertsatz gibt es ” dann ein ξ1 ∈]x, z[ sowie ein ξ2 ∈]z, y[, so dass gilt: f (z) − f (x) = f ′ (ξ1 ), z−x f (y) − f (z) = f ′ (ξ2 ). y−z 158 Wegen der Monotonie von f ′ erhalten wir hieraus: f (z) − f (x) f (y) − f (z) ≤ . z−x y−z Schreiben wir hier wieder z = (1 − t)x + ty, so ergibt sich durch Umformen mittels (10.21) rasch (K). (ii) ⇔ (iii)“. Dies folgt leicht aus Satz 10.14 , da f ′′ = (f ′ )′ ist. ” Q.E.D. Als Anwendungen der obigen Sätze beweisen wir einige fundamentale Ungleichungen, welche später benötigt werden. Satz 10.21 Es seien s1 , . . . , sn ∈ [0, 1] mit s1 +· · ·+sn = 1, sowie x1 , . . . , xn ∈ R>0 . Dann gilt xs11 · · · xsnn ≤ s1 x1 + · · · + sn xn . (10.25) Beweis. Da exp′′ (y) = exp(y) > 0 gilt für alle y ∈ R, ist nach Satz 10.20 die Funktion exp konvex auf R. Wenden wir also die Jensensche Ungleichung auf exp an, so erhalten wir für alle y1 , . . . , yn ∈ R exp(s1 y1 + · · · + sn yn ) ≤ s1 exp y1 + · · · + sn exp yn , also (ey1 )s1 · · · (eyn )sn ≤ s1 (ey1 ) + · · · + sn (eyn ). Setzen wir hierin yj := log(xj ), j = 1, . . . , n, so folgt (10.25). Q.E.D. Für s1 = · · · = sn = (10.26) 1 n erhalten wir insbesondere folgende Ungleichung 1 (x1 + · · · + xn ) n 1 (x1 . . . xn ) n ≤ 1 zwischen dem geometrischen Mittel (x1 . . . xn ) n der Zahlen x1 , . . . , xn und ihrem arithmetischen Mittel n1 (x1 + · · · + xn ). Satz 10.22 (Höldersche Ungleichung) Es seien p > 1, q > 1 mit Dann gilt für alle x1 , . . . , xn , y1 , . . . , yn ∈ R≥0 : (10.27) n X k=1 xk yk ≤ n X xpk k=1 159 ! p1 n X k=1 ykq ! 1q . 1 1 + = 1. p q Beweis. Wir können o.B.d.A. annehmen, dass x1 , . . . , xn , y1 , . . . , yn in R>0 liegen. n q1 1 n P q P p p und yk durch yk / ersetzen, können wir yℓ Indem wir xk durch xk / xℓ ferner annehmen, dass ℓ=1 ℓ=1 n X xpk = k=1 n X ykq = 1 k=1 ist, und müssen zeigen, dass dann n X k=1 xk yk ≤ 1 gilt. Nach Satz 10.21 ist jedoch für k = 1, . . . , n 1 1 1 1 xk yk = (xpk ) p (ykq ) q ≤ xpk + ykq , p q also n X n n 1X p 1X q 1 1 x + y = + = 1. xk yk ≤ p k=1 k q k=1 k p q k=1 160 Q.E.D. Kapitel 11 Anhang A: Zur Konstruktion des Körpers R 11.1 Konstruktion der ganzen Zahlen In N lässt sich die Gleichung b+x = a für gegebenes a und b in N nach (P) dann lösen, wenn a ≥ b ist, aber auch nur dann, denn existiert ein x ∈ N mit b+x = a, so ist nach (M + ), (N) und (P) a = b + x ≥ b + 0 = b. Der Wunsch, die Gleichung b + x = a stets lösen zu können, hat schon früh zur Erweiterung des Systems der natürlichen Zahlen zum System der ganzen Zahlen geführt. Wir wollen hier eine konkrete Konstruktion des Systems der ganzen Zahlen angeben, welche nur auf den bereits eingeführten Begriffsbildungen fußt. Natürlich haben Sie bereits gewisse Vorstellungen davon, was ganze Zahlen sind und wie man damit rechnet; diese wollen wir uns zunutze machen und insbesondere ausnutzen, dass sich bekanntlich“ jede ganze Zahl γ als ” Differenz a − b zweier natürlicher Zahlen darstellen lässt. Eine solche Darstellung ist jedoch nicht eindeutig, da (a + c) − (b + c) = a − b für alle c ∈ N. Wir werden also versuchen, γ durch das geordnete Paar (a, b) zu beschreiben, wobei aber noch gewisse geordnete Paare miteinander zu identifizieren“ sind, nämlich alle Paare (a+ c, b+ c) ” mit c ∈ N. Dazu führen wir zunächst den grundlegenden Begriff der Äquivalenzrelation ein. Ist X eine beliebige Menge, und ist R ⊂ X × X eine Teilmenge von X × X, so wollen wir schreiben x ∼ y“, wenn das Paar (x, y) in R liegt. Damit wollen wir ” deutlich machen, dass zwischen gewissen x, y ∈ X eine Beziehung besteht, nämlich denjenigen, für die (x, y) ∈ R. Wir nennen dann R (bzw. ∼) eine Relation auf X. Beispielsweise haben wir schon die Ordnungsrelation ≤“ auf N kennengelernt. Eine ” Relation ∼ (oder genauer R) auf X heißt Äquivalenzrelation auf X, wenn für beliebige x, y, z ∈ X gilt: (A1) x ∼ x (A2) x ∼ y ⇒ y ∼ x (A3) x ∼ y, y ∼ z ⇒ x ∼ z (Reflexivität) (Symmetrie) (Transitivität) Das Zeichen ∼ wird i.d.R. nur für Äquivalenzrelationen benutzt. Gilt x ∼ y, so 161 heißen die Elemente x und y äquivalent. Ist x ∈ X, so bezeichnen wir mit [x] := {y ∈ X : y ∼ x} die sogenannte Äquivalenzklasse von x. Je zwei verschiedene Äquivalenzklassen [x] und [y] sind disjunkt. Ist nämlich z ∈ [x] ∩ [y], so ist z ∼ x und z ∼ y, also auch y ∼ z wegen (A2), und folglich y ∼ x wegen (A3). Ist nun u ∈ [y], so ist u ∼ y und ferner y ∼ x, also u ∼ x, d.h. u ∈ [x]. Folglich ist [y] ⊂ [x], und analog zeigt man [x] ⊂ [y], so dass [x] = [y]. Der letzte Schluss zeigte außerdem, dass aus x ∼ y stets [x] = [y] folgt. Ist umgekehrt [x]=[y], so ist wegen x ∼ x natürlich x ∈ [x] = [y], d.h. x ∼ y. Wir sehen also: Für x, y ∈ X gilt x ∼ y genau dann, wenn [x] = [y]. Jedes Element z ∈ [x] heißt Repräsentant der Klasse [x]. Wir bezeichnen die Menge aller Äquivalenzklassen [x], x ∈ X, mit Ẋ oder auch X/R, X/ ∼. Da schließlich x ∈ [x] für jedes x ∈ X, so sehen wir: Eine Äquivalenzrelation auf der Menge X bewirkt eine Zerlegung von X in disjunkte nicht-leere Teilmengen, die Äquivalenzklassen: (11.1) X= [ ˙ C. C∈X Durch Übergang von der Menge X zur Menge Ẋ mittels der Abbildung x 7→ [x] hören wir also auf, zwei Punkte x und y zu unterscheiden, wenn sie äquivalent sind, d.h. wenn [x] = [y] – wir identifizieren“ x und y. ” Kehren wir zu unserem Problem der Konstruktion von Z zurück. Wir setzen dazu X = N × N, und definieren, wie angedeutet, eine Äquivalenzrelation R auf X wie folgt: Zwei Paare (a1 , b1 ) und (a2 , b2 ) in X seien äquivalent, wenn es c1 , c2 ∈ N gibt so, dass (11.2) a1 + c1 = a2 + c2 , b1 + c1 = b2 + c2 , (d.h. (a1 , b1 ) + (c1 , c1 ) = (a2 , b2 ) + (c2 , c2 )). Man prüft leicht nach, dass es sich hier tatsächlich um eine Äquivalenzrelation handelt, und wir definieren nun Z als die Menge aller Äquivalenzklassen in X : Z := Ẋ = X/R. Anmerkung: In einem kartesichen Koordinatensystem (welches wir strenggenommen noch gar nicht zur Verfügung haben, da R ja noch nicht konstruiert ist) lassen sich die Äquivalenzklassen dieser Relation leicht beschreiben als die Mengen von Paaren (a, b) ∈ N × N, welche jeweils auf einer Geraden der Steigung 1 liegen. Da mit (a, b) auch (a−b, 0) auf derselben Geraden der Steigung 1 liegt, ist auch klar, mit welcher ganzen Zahl eine solche Äquivalenzklasse zu identifizieren ist, nämlich mit dem Schnittpunkt dieser Geraden mit der x-Achse des Koordinatensystems. Die Addition und Multiplikation definieren wir auf Z wie folgt: 162 (11.3) [(a1 , b1 )] + [(a2 , b2 )] := [(a1 + a2 , b1 + b2 )], [(a1 , b1 )] · [(a2 , b2 )] := [(a1 a2 + b1 b2 , a1 b2 + a2 b1 )]. Dies wird motiviert durch die Formeln (a1 − b1 ) + (a2 − b2 ) = (a1 + a2 ) − (b1 + b2 ), (a1 − b1 )(a2 − b2 ) = (a1 a2 + b1 b2 ) − (a1 b2 + a2 b1 ). Man überzeugt sich zunächst, dass Summe und Produkt in Z durch (11.3) wohldefiniert sind, d.h. nicht von der Wahl der Repräsentanten abhängen. Ersetzt man beispielsweise (a1 , b1 ) durch das äquivalente Paar (a1 + c, b1 + c), c ∈ N, so ist ((a1 + c) + a2 , (b1 + c) + b2 ) = ((a1 + a2 ) + c, (b1 + b2 ) + c) ∼ (a1 + a2 , b1 + b2 ), d.h. [(a1 + c) + a2 , (b1 + c) + b2 )] = [(a1 + a2 , b1 + b2 )], und ((a1 + c)a2 + (b1 + c)b2 , (a1 + c)b2 + a2 (b1 + c)) = ((a1 a2 + b1 b2 ) + (a2 + b2 )c, (a1 b2 + a2 b1 ) + (a2 + b2 )c) ∼ (a1 a2 + b1 b2 , a1 b2 + a2 b1 ), d.h. [(a1 + c)a2 + (b1 + c)b2 , (a1 + c)b2 + a2 (b1 + c)] = [(a1 a2 + b1 b2 , a1 b2 + a2 b1 )], und der allgemeine Fall wird ähnlich gezeigt. Mit ein wenig Fleiß zeigt man anschließend, dass die Addition und Multiplikation in Z den Regeln (A+ ), (K+ ), (A· ), (K· ) und (D) genügen, d.h. assoziativ, kommutativ und distributiv sind. Setzen wir weiter 0 := [(0, 0)], 1 := [(1, 0)], so gilt wegen (a + 0, b + 0) = (a, b), (a · 1 + b · 0, a · 0 + 1 · b) = (a, b) offenbar [(a, b)] + 0 = [(a, b)], [(a, b)] · 1 = [(a, b)] für alle [(a, b)] ∈ Z, d.h. es gelten auch die Regeln (N) und (E). Auch die Kürzungsregel der Multiplikation (Q) bleibt in Z erhalten (Übung), es gilt im Gegensatz zu N aber nun noch folgende Regel in Z: (AI) Für jedes γ ∈ Z existiert ν ∈ Z mit γ + ν = 0 (Existenz eines additiven Inversen). 163 In der Tat, ist γ = [(a, b)] ∈ Z, und setzen wir ν := [(b, a)], so ist γ + ν = 0, da (a + b, b + a) = (a + b, a + b) ∼ (0, 0). Man schreibt daher für [(b, a)] auch −[(a, b)]. (AI) gestattet es, für gegebenes γ, ν ∈ Z stets eine (eindeutige) Lösung der Gleichung γ + x = ν zu finden. x := ν + (−γ) ist nämlich eine Lösung dieser Gleichung, da γ + ν + (−γ) = ν + (γ + (−γ)) = ν + 0 = ν, und umgekehrt folgt aus γ + x = ν natürlich x = γ + x + (−γ) = ν + (−γ). Für ν + (−γ) schreiben wir wie üblich auch ν − γ. Die natürlichen Zahlen lassen sich kanonisch in Z einbetten“. Dazu definieren wir ” eine Abbildung ι : N → Z, a 7→ [(a, 0)]. ι ist injektiv, denn sind a, b ∈ N so, dass ι(a) = ι(b), so ist (a, 0) ∼ (b, 0), d.h. es existieren c1 , c2 ∈ N mit a + c1 = b + c2 , 0 + c1 = 0 + c2 , woraus c1 = c2 und a + c1 = b + c1 folgt. Mit der Kürzungsregel der Addition (S) schließt man, dass a = b. Ferner respektiert ι die Addition und Multiplikation auf N bzw. Z, d.h. für beliebige a, b ∈ N gilt (11.4) ι(a + b) = ι(a) + ι(b), ι(0) = 0, ι(a · b) = ι(a) · ι(b), ι(1) = 1, wie man sich leicht überzeugt. Die Teilmenge ι(N) ⊂ Z ist also ein isomorphes ” Bild“ von N, d.h. wir können die natürlichen Zahlen als den Teil von Z aller ganzen Zahlen der Form [(a, 0)] auffassen. In einem letzten Schritt wollen wir noch eine Ordnung auf Z einführen. Dazu setzen wir [(a1 , b1 )] :≤ [(a2 , b2 )], wenn a1 + b2 ≤ b1 + a2 . Wieder überzeugt man sich, dass diese Relation wohldefiniert ist und den Regeln (R), (T), (I) und (V) genügt, und somit eine lineare Ordnungsrelation auf Z definiert. Auch die Regeln (M+ ), (M· ) lassen sich leicht nachprüfen, wobei hier in (M· ) c ≥ 0 vorausgesetzt werden muss . Die so definierte Ordnung, wenn eingeschränkt auf ι(N), stimmt mit derjenigen von N überein, d.h. es gilt für alle a, b ∈ N (11.5) a ≤ b ⇔ ι(a) ≤ ι(b). In der Tat, da ι(a) = [(a, 0)], ι(b) = [(b, 0)], ist a ≤ b äquivalent zu a + 0 ≤ 0 + b, d.h. ι(a) ≤ ι(b). Wir bemerken abschließend noch, dass für ein Element [(a, b)] ∈ Z gilt: [(a, b)] ≥ 0 genau dann, wenn a ≥ b. Ist aber a ≥ b, so ist nach der Kürzungsregel der Addition 164 für N a von der Form b + c, d.h. [(a, b)] = [(c, 0)] = ι(c), und ist a ≤ b, so ist −[(a, b)] = [(b, a)] ≥ 0, d.h. [(a, b)] = −ι(d) für ein d ∈ N: Eine ganze Zahl ist eine natürliche Zahl, oder das Negative einer natürlichen Zahl. Nachdem wir hiermit die grundlegendsten Regeln für den Umgang mit ganzen Zahlen für die von uns konstruierten ganzen Zahlen nachgewiesen haben, ist die Existenz der ganzen Zahlen auf die der natürlichen zurückgeführt, und wir wollen im Folgenden ganze Zahlen wieder wie üblich mit kleinen lateinischen Buchstaben a, b, . . . , p, q, r, . . . etc. bezeichnen. 11.2 Zu Konstruktion der rationalen Zahlen Der Übergang von Z nach Q erfolgt mit ähnlichen Überlegungen wie der von N nach Z. Als Motivation dient hier der Wunsch, die Gleichung ax = b für beliebiges a 6= 0 und b lösen zu können, was in Z bekanntlich nicht möglich ist. Um nun Q aus Z zu konstruieren, machen wir uns unsere Kenntnis“ zunutze, dass sich jede ” p rationale Zahl als Quotient zweier ganzer Zahlen p und q , q ∈ N \ {0}, darstellen q lässt, und beachten: Sind p1 , p2 , q1 , q2 in Z, q1 , q2 von Null verschieden, und existieren p1 p2 c1 , c2 ∈ N \ {0}, so dass p1 c1 = p2 c2 , q1 c1 = q2 c2 , so ist = . q1 q2 Wir definieren daher auf Y := Z × (N \ {0}) die folgende Äquivalenzrelation: (p1 , q1 ) ∼ (p2 , q2 ) genau dann, wenn es c1 , c2 ∈ N \ {0} gibt so, dass (11.6) p1 c1 = p2 c2 , q1 c1 = q2 c2 , und definieren Q als Menge aller Äquivalenzklassen in Y . Addition, Multiplikation und Ordnung auf Q werden dann wie folgt festgesetzt: (11.7) [(p1 , q1 )] + [(p2 , q2 )] := [(p1 q2 + p2 q1 , q1 q2 )] [(p1 , q1 )] · [(p2 , q2 )] := [(p1 p2 , q1 q2 )] [(p1 , q1 )] ≤ [(p2 , q2 )] , falls p1 q2 ≤ p2 q1 . Die Null und die Eins in Q werden definiert durch 0 := [(0, 1)], 1 := [(1, 1)]. Die Einbettung von Z in Q erfolgt durch die Abbildung ̺ : a 7→ [(a, 1)]. Mit diesen Setzungen weist man nach, dass Q ein angeordneter Körper ist. 6 0, so ist Bezeichnen wir mit a1 = a−1 das multiplikative Inverse von a = [(p, q)] = −1 −1 offenbar [(p, q)] = [(q, p)], falls p > 0, und [(p, q)] = [(−q, −p)], falls p < 0, und 165 insbesondere ̺(q)−1 = [(q, 1)]−1 = [(1, q)] für q ∈ N \ {0}. Jedes Element a = [(p, q)] von Q lässt sich somit schreiben als a = ̺(p)̺(q)−1 = ̺(p) 1 ̺(p) =: , mit p ∈ Z, q ∈ N \ {0}. ̺(q) ̺(q) p q zweier ganzer Zahlen p ∈ Z und q ∈ N\{0} zurückgefunden, und wollen im Folgenden mit den rationalen Zahlen umgehen, wie wir es gewohnt sind. Dafür genügen uns die oben angegebenen Regeln – die genaue Definition der Menge Q wird dabei i.d.R. keine Rolle mehr spielen. Damit haben wir zu der üblichen Darstellung einer rationalen Zahl als Quotient Es sei noch daran erinnert, dass die obige Darstellung einer rationalen Zahl als p Quotient zweier ganzer Zahlen auch leicht genutzt werden kann um zu zeigen, q dass der Körper Q archimedisch geordnet ist. 11.3 Zur Konstruktion der reellen Zahlen Wir haben mit Satz 7.1, ausgehend von der Eigenschaft (R), die gewohnte Darstellung der reellen Zahlen z.B. als unendliche Dezimalbrüche wiedergefunden. Ferner haben wir am Ende von Kapitel 4 die Konstruktion eines Modells des Köpers der reellen Zahlen mit Hilfe von Intervallschachtelungen im Körper Q der rationalen Zahlen angedeutet. Hier soll nun gezeigt werden, dass damit tatsächlich ein Körper konstruiert wird, der den Axiomen genügt, welche wir für den Körper der reellen Zahlen R verlangt haben. Zur Erinnerung: Mit R hatten wir die Menge aller Intervallschachtelungen (An )n abgeschlossener beschränkter Intervalle An ⊂ Q mit lim |An | = 0 (im Köper Q) bezeichnet, und auf dieser Menge hatten wir eine Äquivalenzrelation ∼ eingeführt, indem wir zwei solche Intervallschachtelungen (An )n und (Bn )n als äquivalent bezeichnet hatten, wenn die Folge der Durchschnitte (An ∩ Bn )n ebenso in der Menge R liegt. Auf R hatten wir eine Addition und eine Multiplikation wie folgt eingeführt: Sind (An )n und (Bn )n in R, so sei (An )n + (Bn )n := (An + Bn )n , (An )n · (Bn )n := (An · Bn )n . Ferner schreiben wir (An )n < (Bn )n , falls ein n0 ∈ N existiert so, dass für alle n ≥ n0 gilt An < Bn , in dem Sinne, dass x < y ist für alle x ∈ An und alle y ∈ Bn . Dies ist offenbar gleichbedeutend damit, dass max An < min Bn . Die folgende einfache Beobachtung wird für uns sehr oft nützlich sein: 166 Lemma 11.1 Sind a = (An )n und b = (Bn )n in R, und gilt An ⊂ Bn für alle n, so ist a ∼ b. Beweis. Wegen An ∩ Bn = An ist (An ∩ Bn )n in R. Q.E.D. Auf der Menge K = R/ ∼ definieren wir nun eine Addition und eine Multiplikation wie folgt: Sind a = (An )n und b = (Bn )n in R, und bezeichnet wie üblich [a] bzw. [b] die Äquivalenzklasse von a bzw. b in K, so setzen wir [a] + [b] := [a + b], [a] · [b] := [a · b], sowie [a] < [b], falls a < b. Theorem 11.2 Die obigen Setzungen für die Addition + und die Multiplikation · sowie die Relation ≤ sind wohldefiniert. K, versehen mit dieser Addition und Multiplikation, ist ein Körper, und die Relation ≤ eine totale Ordnung auf K, mit der K zu einem ordnungsvollständigen angeordneten Körper wird, d.h. einem Modell für den Köper R. Beweis. 1. Wohldefiniertheit. Wir müssen zeigen, dass die obigen Setzungen wohldefiniert sind, d.h. dass sie nicht von der Wahl des Repräsentanten a ∈ [a] der Klasse [a] bzw. b ∈ [b] der Klasse [b] abhängen. Dazu betrachten wir zwei weitere Repräsentanten a′ = (A′n )n ∈ [a] von [a] und b ∈ (Bn′ )n ∈ [b] von [b]. Dann gilt also a′ ∼ a und b′ ∼ b, d.h. für jedes n gilt An ∩ A′n 6= ∅ und Bn ∩ Bn′ 6= ∅. (11.8) a) Für die Addition und Multiplikation muss dann gezeigt werden, dass [a′ + b′ ] = [a + b] und [a′ · b′ ] = [a · b], d.h. dass a′ + b′ ∼ a + b und a′ · b′ ∼ a · b. Wir werden dies nur für die Addition durchführen; für die Multiplikation läuft das Argument ganz analog. Es ist a′ + b′ = (A′n + Bn′ )n , a + b = (An + Bn )n , und offenbar gilt (A′n + Bn′ ) ∩ (An + Bn ) ⊃ (A′n ∩ An ) + (Bn′ ∩ Bn ) =: Dn , wobei Dn 6= ∅ ein abgeschlossenes beschränktes Intervall in Q ist, dessen Länge für n → ∞ gegen 0 strebt. Damit ist offenbar d := (Dn )n ∈ R, und nach Lemma 11.1 ist (A′n + Bn′ )n ∼ (Dn )n ∼ (An + Bn )n , 167 so dass wegen der Transitivität der Relation ∼ auch (A′n + Bn′ )n ∼ (An + Bn )n gilt, d.h. a′ + b′ ∼ a + b. b) Für unsere Ordnungsrelation müssen wir zeigen, dass a < b äquivalent zu a′ < b′ ist. Hierzu genügt es, eine der beiden Implikationen zu zeigen. Sei also a < b, d.h. für genügend großes n gelte An < Bn . Dann gibt es ein ε ∈ Q mit ε > 0 so, dass für genügend großes n sogar max An < min Bn − ε. Ferner gilt für genügend großes n offenbar auch max{|An |, |A′n |, |Bn |, |Bn′ | < ε/4. Wegen (11.8) gilt damit für genügend großes n max A′n ≤ max An + |A′n | < max An + ε/4, min Bn′ ≥ min Bn − |Bn′ | > min Bn − ε/4, und somit insgesamt für genügend großes n max A′n < min Bn − ε + ε/4 < min Bn′ + ε/4 − ε + ε/4 = min Bn′ − ε/2. Somit gilt auch a′ < b′ . Wir setzen in K schließlich [a] ≤ [b], falls [a] < [b] oder [a] = [b]. Damit sind auf K nun eine Addition +, , eine Multiplikation · sowie eine Relation ≤ wohldefiniert. Wir zeigen als nächstes: 2. (K, +, ·) ist ein Körper: Die Assoziativität von Addition (A+ ) und Multiplikation (A. ), ebenso die Kommutativität von Addition (K + ) und Multiplikation (M . ) sowie die Distributivität (D) folgen unmittelbar aus den entsprechenden Eigenschaften des Körpers Q, welche für alle a = (An )n , b = (Bn )n , c = (Cn )n ∈ R die folgenden Identitäten bzw. die letzte Inklusion implizieren: (An + Bn ) + Cn = An + (Bn + Cn ), (An · Bn ) · Cn = An · (Bn · Cn ), An + Bn = Bn + An , An · Bn = Bn · An , An · (Bn + Cn ) ⊂ An · Bn + An · Cn . Beachte, dass die letzte Inklusion wieder mit Lemma 11.1 impliziert, dass [a]([b] + [c]) = [a(b + c)] = [ab] + [ac]. Das Nullelement 0K in K ist offenbar gegeben durch 0K := [(Nn )n ], wobei Nn := [0, 0] = {0} ⊂ Q die konstante Folge der Intervalle bezeichnet, die nur das Nullelement 0 in Q enthalten, denn es gilt ja stets An + Nn = An . Analog ist das Einselement 1K in K ist gegeben durch 1K := [(En )n ], wobei En := [1, 1] = {1} ⊂ Q die konstante Folge der Intervalle bezeichnet, die nur das Einselement 1 in Q enthalten. Auch die Existenz eines additiven inversen Elements (AI) sowie eines multiplikativen inversen Elements (MI) sind leicht nachzuweisen: 168 Ist [a] ∈ K mit a = (An )n ∈ R, so sei −[a] := [(−An )n ]. Dann ist −[a] ∈ K, und da [0, 0] ⊂ An + (−An ) ist, folgt mit Lemma 11.1, dass [a] + (−[a]) = 0K . Analog für (MI) : Ist [a] 6= 0K , so gibt es ein n0 ∈ N so, dass für alle n ≥ n0 gilt 0 ∈ / An (sonst wäre [0, 0] ⊂ An für alle n, und damit [a] = 0K ). Dann sind jedoch, wie man leicht −1 sieht, die Mengen A−1 : x ∈ An } wohldefinierte abgeschlossene beschränkte n := {x Intervalle, deren Längen gegen Null streben, so dass [a]−1 := [(A−1 n )n≥n0 ] in K liegt, −1 und wegen [1, 1] ∈ An · A−1 ist offenbar [a] · [a] = 1 . K n 3. Die Relation ≤ ist eine totale Ordnung auf der Menge K: Seien wieder a = (An )n , b = (Bn )n , c = (Cn )n ∈ R. Die Eigenschaft (R), d.h. [a] ≤ [a], ist klar aufgrund der Definition von ≤ . Um die Transitivität (T) nachzuweisen genügt es offenbar, folgendes zu zeigen: Ist [a] < [b] und [b] < [c], so ist [a] < [c]. Nach Voraussetzung gilt aber für genügend großes n sowohl max An < min Bn als auch max Bn < min Cn , und somit insbesondere max An < min Cn , da die Ordnung auf Q transitiv ist. Damit folgt in der Tat [a] < [c]. Wir nehmen als nächstes an, dass [a] 6= [b] ist, und werden daraus folgern, dass entweder [a] < [b] oder [b] < [a] gilt. Dies stellt dann offenbar per Kontraposition auch die Eigenschaft (I), dass aus [a] ≤ [b] und [b] ≤ [a] stets [a] = [b] folgt, sicher, wie auch die totale Anordnung von K. Sei also [a] 6= [b]. Dann gilt a ≁ b, d.h. es gibt ein n0 ∈ N mit An0 ∩ Bn0 = ∅. Dann gilt auch An ∩ Bn = ∅ für alle n ≥ n0 , also entweder An < Bn , oder Bn < An . Damit folgt [a] < [b], oder [b] < [a]. 4. K ist ein angeordneter Körper: Um (M + ) nachzuweisen, seien wieder a = (An )n , b = (Bn )n , c = (Cn )n ∈ R, und wir nehmen an, dass [a] ≤ [b]. Wir wollen zeigen, dass dann [a] + [c] ≤ [b] + [c]. Ist [a] = [b], so gilt dies trivialerweise. Sei daher [a] < [b]. Für genügend großes n gilt dann An < Bn , also auch An + Cn < Bn + Cn (dies folgt mit einem ähnlichen Argument wie im Beweisabschnitt 1. zur Wohldefiniertheit, da die Intervalllängen gegen Null streben). Damit folgt aber [a] + [c] < [b] + [c]. Ganz analog zeigt man auch die Eigenschaft (M . ). 5. Einbettung von Q in K : Wir betten den Körper Q in den Körper K ein durch die Abbildung q 7→ [([q, q])n ] ∈ K, q ∈ Q. Wir werden dann der Einfachheit halber (etwas unsauber) auch wieder q anstelle von schreiben [([q, q])n ] schreiben. 6. Ordnungsvollständigkeit von K: Sei M ⊂ K nach oben beschränkt. Wir definieren dann rekursiv eine Intervallschachtelung (In )n ∈ R, In = [qn , sn ], indem wir zwei Folgen (qn )n und (sn )n rationaler Zahlen konstruieren mit qn ≤ sn und den folgenden Eigenschaften, wobei L := s0 − q0 sei: Für alle n ∈ N gelte (i) qn ≤ qn+1 und sn+1 ≤ sn . 169 (ii) sn − qn = 2−n L. (iii) sn ist eine obere Schranke für M. (iv) Es gibt ein xn ∈ M mit qn ≤ xn . Für n = 0 wählen wir dazu einen beliebigen Punkt x0 = [(An )n ] ∈ M sowie eine beliebige obere Schranke S = [(In )n ] ∈ K von M und setzen q0 := min A0 ∈ Q und s0 := max I0 ∈ Q. Dann gilt offenbar q0 ≤ x0 , da ja [q0 , q0 ] ≤ An ist für alle n, und ebenso ist S ≤ s0 , so dass q0 ≤ x0 ≤ S ≤ s0 . Nehmen wir an, wir hätten bereits q0 , . . . , qn sowie s0 , . . . , sn mit den obigen Eigenschaften konstruiert, so definieren wir qn+1 und sn+1 wie folgt: Sei an := (qn + sn )/2 ∈ Q der Mittelpunkt des Intervalls In . 1. Fall: Es existiert ein y ∈ M mit an ≤ y. Dann setzen wir qn+1 := an , sn+1 := sn und xn+1 := y ∈ M. 2. Fall: Für alle x ∈ M gilt x < an . Dann ist an eine obere Schranke für M, und wir setzen qn+1 := qn , sn+1 := an und xn+1 := xn . In beiden Fällen ist dann leicht nachzuprüfen, dass die Eigenschaften (i) –(iv) auch für qn+1 , sn+1 und xn+1 gelten. Da der Körper Q archimedisch geordnet ist, konvergiert die Folge (2−n L)n in Q gegen Null, d.h. lim |In | = 0. Somit zeigen die Eigenschaften (i) –(iv), dass in der Tat die Intervallschachtelung (In )n in R liegt. Wir betrachten nun die Zahl“ s := [(In )n ] ∈ K und behaupten, dass s = sup M : ” a) s ist eine obere Schranke für M : Angenommen, es gäbe ein a = [(An )n ] ∈ M mit s < a. Für genügend großes n, sagen wir n ≥ n0 , wäre dann [qn , sn ] = In < An . Insbesondere wäre {sn0 } = [sn0 , sn0 ] < An für alle n ≥ n0 , und somit sn0 < [(An )n ] = a, so dass sn0 im Gegensatz zu unserer Konstruktion keine obere Schranke für M wäre. Unsere Annahme führt also zu einem Widerspruch. b) s ist die kleinste obere Schranke für M : Angenommen, t = [(Tn )n ] ∈ K wäre eine obere Schranke für M mit t < s. Für genügend großes n würde dann Tn < In = [qn , sn ] gelten, also auch Tk < In = [qn , sn ] für jedes k ≥ n. Wegen qn ≤ xn ≤ sn würde insbesondere für alle k ≥ n die Relation Tk < [xn , xn ] gelten, und folglich wäre t < xn in K. xn liegt jedoch in M, und somit wäre t keine obere Schranke für M, im Widerspruch zu unserer Annahme. Damit haben wir gezeigt, dass K alle vom Köper R der reellen Zahlen geforderten Eigenschaften besitzt, d.h. wir könnten definieren R := K. Q.E.D. 170 11.4 Ein angeordneter Körper, der nicht archimedisch angeordnet ist Es sei K der Körper aller reellen, rationalen Funktionen f (x) := n P j=0 m P aj xj bk xk k=0 mit n, m ∈ N und aj , bk ∈ R, wobei das Nennerpolynom nicht identisch verschwinde, versehen mit der üblichen Addition sowie Multiplikation von rationalen Funktionen. Dabei dürfen wir stets annehmen, dass bm 6= 0, und dass an 6= 0, es sei denn, f = 0. Man sieht dann leicht, dass für alle genügend großen x > 0 entweder f (x) > 0, oder f (x) < 0 gilt, je nachdem, ob an /bm > 0, oder an /bm < 0 ist. Im ersten Fall sagen wir, dass f positiv ist und schreiben f > 0, im zweiten, dass f negativ ist und schreiben f < 0. Wir können daher eine vollständige Ordung auf K einführen indem wir für f, g ∈ K setzen f > g, falls f − g > 0, und f ≥ g, falls f > g oder f = g (dies entspricht nicht der üblichen Ordnung, welche man auf dem Raum aller reellen Funktionen einführt!). Damit wird in der Tat K zu einem angeordneten Körper, wie man leicht zeigt. Das Einselement in K ist die konstante Funktion 1. Es gibt jedoch kein n ∈ N mit n · 1 > id, wobei id ∈ K die identische Abbildung id(x) := x bezeichne (Übung!). Somit ist der Körper K nicht archimedisch geordnet. 171