Analysis in einer Variablen Eine Vorlesung für das Lehramtsstudium Franz Hofbauer SS 2009 Vorwort Die Lehramtsausbildung sollte sich an der Berufsrealität der Lehrer orientieren. Deshalb wird in diesem Skriptum ein Zugang zur Analysis gewählt, der nahe an der Mathematik im Schulunterricht bleibt. Die reellen Zahlen werden als Dezimalzahlen eingeführt, die auf der Zahlengerade angeordnet sind. Es ist dann nicht schwer, die Intervallschachtelungseigenschaft zu beweisen. Diese Version der Vollständigkeit der reellen Zahlen hat auch den Vorteil, dass man sie unmittelbar anwenden kann, zum Beispiel zum Berechnen der Wurzel einer positiven reellen Zahl oder zur Bestimmung der Fläche des Einheitskreises. Mit Hilfe einer Intervallhalbierungsmethode kann man dann den Zwischenwertsatz, den Satz von Bolzano-Weierstraß und den Satz über das Supremum einer beschränkten Menge beweisen. Diese Beweise sind in einem eigenen Kapitel zusammengefasst. Grenzwerte, Stetigkeit und Differenzierbarkeit werden wie üblich behandelt. Als zusätzliche Anwendungsmöglichkeit der Ableitung werden einige wichtige Ungleichungen bewiesen. Die trigonometrischen Fuktionen werden am Einheitskreis definiert. Geometrische Überlegungen helfen dann, die Summensätze zu beweisen und die Ungleichungen zu finden, die für die Berechnung der Ableitung gebraucht werden. Die Exponentialfunktion beschreibt kontinuierliches Wachstum. Ist x der jährliche Zinssatz und unterteilt man das Jahr in n gleich lange Perioden, an deren Enden die Zinsen gutgeschrieben werden, dann wächst das Startkapital um den Faktor (1 + nx )n in einem Jahr. Im Grenzwert n → ∞ erhält man kontinuierliches Wachstum. Das ergibt die Definition der Exponentialfunktion. Mit Hilfe von entsprechenden Ungleichungen kann die Existenz dieses Grenzwertes bewiesen werden. Ebenso findet man die Rechenregeln und die Ableitung der Exponentialfunktion. √ Die Umkehrfunktion von x 7→ (1 + nx )n ist x 7→ n( n x − 1). Als Grenzwert dieser Funktionen ergibt sich der Logarithmus. Das Riemmannintegral wird wie üblich mit Hilfe von Ober- und Untersummen eingeführt und dann der Hauptsatz bewiesen. Aus den Rechenregeln für die Ableitung erhält man die für das Integral. Schließlich wird noch die Taylorformel behandelt, um die oben genannten Funktionen und einige andere in Potenzreihen entwickeln zu können. Reihen und insbesondere Potenzreihen sind für diesen Zugang zur Analysis nicht notwendig. Sie werden daher kurz am Ende des Skriptums behandelt. Im Anhang findet man einige interessante Anwendungen und Ergänzungen. I. Reelle Zahlen und stetige Funktionen Wir führen die reellen Zahlen als Dezimalzahlen ein, die wir uns auf der Zahlengerade angeordnet vorstellen. Dadurch ist auch eine Ordnungsrelation festgelegt. Wir zeigen dann, dass die Intervallschachtelungseigenschaft gilt. Sie wird später zum Beweis der grundlegenden Sätze wie Zwischenwertsatz, Mittelwertsatz und Satz über die Konvergenz monotoner Folgen verwendet. Der Begriff des Grenzwerts spielt die Hauptrolle in der Analysis. Wir beginnen daher mit der Untersuchung von Folgen und deren Grenzwerten. Dann führen wir Funktionen ein. Beispiele dafür sind Polynome und rationale Funktionen. Wesentlich ist der Begriff der Stetigkeit. Für stetige Funktionen gilt der Zwischenwertsatz. Damit beweist man unter anderem die Existenz der Umkehrfunktion, die zur Einführung der Wurzelfunktion und damit auch der Potenzfunktion verwendet wird. 1. Dezimalzahlen Die Geschichte der Zahlen beginnt mit dem Zählen. Dadurch erhält man die natürlichen Zahlen N = {1, 2, 3, . . . }. Fügt man auch noch die Null und die negativen Zahlen hinzu, so erhält man die ganzen Zahlen Z = {. . . , −3, −2, −1, 0, 1, 2, 3, 4, . . . } Ganze Zahlen kann man addieren und multiplizieren und erhält dadurch wieder ganze Zahlen. Die Rechenregeln für Addition und Multiplikation sind Assoziativgestze: a + (b + c) = (a + b) + c und a(bc) = (ab)c Kommutativgesetze: a + b = b + a und ab = ba Distributivgesetz: (a + b)c = ac + bc Diese Gesetze garantieren, dass man so addieren und multiplizieren darf, wie man es gewohnt ist. Die Subtraktion wird als Umkehroperation zur Addition behandelt. Die Subtraktion einer Zahl ist die Addition dieser Zahl mit geändertem Vorzeichen. Neben den Rechenoperationen gibt es auch eine Ordnungsrelation < auf Z. Zwei ganze Zahlen sind immer vergleichbar, das heißt, wenn a ungleich b ist, dann gilt entweder a < b oder a > b. Man kann Z als die ganzzahligen Punkte auf der Zahlengeraden anordnen. −3 −2 −1 0 1 2 3 4 5 6 7 8 Wir wollen uns nicht weiter mit den ganzen Zahlen beschäftigen, sondern gleich zu den reellen Zahlen übergehen. In Z kann man die Subtraktion, also die Umkehroperation zur Addition ausführen, nicht aber die Umkehroperation zur Multiplikation. Will man zum Beispiel 9 durch 7 dividieren, so erhält man 1 als Ergebnis und 2 als Rest. Das Divisionsergebnis liegt also zwischen 1 und 2. Um die Division genauer ausführen zu können, gehen wir über zu einer genaueren Skala, indem wir die Längeneinheit in zehn Teile unterteilen. 0.9 1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2.0 2.1 Jetzt kann man die Division auf eine Dezimalstelle genau ausführen. Das Divisionsergebnis auf eine Dezimalstelle genau ist 1.2 mit 6 als Rest. Das exakte Divisionsergebnis liegt also 2 Reelle Zahlen und stetige Funktionen zwischen 1.2 und 1.3. Man kann dieses Verfahren fortsetzen. Unterteilt man die Abstände zwischen aufeinanderfolgenden einstelligen Dezimalzahlen jeweils wieder in zehn gleiche Teile, so erhält man eine zweistellige Dezimalskala. 1.19 1.20 1.21 1.22 1.23 1.24 1.25 1.26 1.27 1.28 1.29 1.30 1.31 Jetzt kann man die Division auf zwei Dezimalstellen genau ausführen. Das Divisionsergebnis auf zwei Dezimalstellen genau ist 1.28 mit 4 als Rest. Das exakte Divisionsergebnis liegt also zwischen 1.28 und 1.29. Das kann man immer weiter fortsetzen außer es kommt einmal der Rest 0, womit die Division endet. Als exaktes Divisionsergebnis erhält man eine Dezimalzahl. Eine Dezimalzahl besteht aus einem ganzzahligen Teil (mit Vorzeichen) und nach dem Dezimalpunkt aus einer endlichen oder unendlichen Folge von Ziffern, den Dezimalstellen. Die Menge aller Dezimalzahlen bezeichnen wir mit R und nennen sie die Menge der reellen Zahlen, wobei wir später noch eine geringfügige Modifikation vornehmen. Es gibt viele Dezimalzahlen, die nicht als Ergebnis einer Division einer ganzen Zahl durch eine natürliche Zahl auftreten. Diejenigen, die auftreten, bilden die Menge Q der rationalen Zahlen, also Q = { m n : m ∈ Z, n ∈ N}. Bekanntlich sind das die Dezimalzahlen, die nur endlich viele Dezimalstellen haben oder deren Dezimalstellen sich ab einer gewissen Stelle periodisch wiederholen. In Q rechnet man üblicherweise mit Brüchen anstatt mit Dezimalzahlen. Jedoch ist Q für die Analysis nicht geeignet, da die Intervallschachtelungseigenschaft nicht erfüllt ist. Wir brauchen daher die Menge R aller Dezimalzahlen. Die Dezimalzahl bestimmt die Position auf der Zahlengeraden. Durch jede Dezimalstelle wird die Position genauer festgelegt. Dadurch sind die Dezimalzahlen auch geordnet. Sind x und y zwei Dezimalzahlen, dann gilt x < y, wenn x auf der Zahlengeraden links von y liegt. Wir schreiben x ≤ y, wenn x < y oder x = y gilt. Die Ordnungsrelation ermöglicht es auch, Intervalle zu definieren. Mit (a, b) bezeichnen wir die Menge aller Dezimalzahlen, die auf der Zahlengeraden zwischen a und b liegen, das heißt (a, b) = {x : a < x < b}. Man nennt (a, b) das offene Intervall mit Endpunkten a und b. Das abgeschlossene Intervall enthält auch die beiden Endpunkte. Es wird mit [a, b] bezeichnet. Es gilt also [a, b] = {x : a ≤ x ≤ b}. Analog werden die halboffenen Intervalle [a, b) = {x : a ≤ x < b} und (a, b] = {x : a < x ≤ b} definiert. Man muss bei der Darstellung der Zahlen durch Dezimalzahlen allerdings ein bisschen aufpassen. Eine Dezimalzahl, bei der ab einer Stelle nur mehr 9 auftritt, fällt nämlich auf der Zahlengeraden immer mit der Dezimalzahl zusammen, die man erhält, wenn man die Neuner weglässt und die letzte Stelle vor den Neunern um 1 erhöht. Wir sehen uns dieses Problem genauer an. Seien x und y zwei Dezimalzahlen. Wir suchen die erste Dezimalstelle, an der sie sich unterscheiden. Sagen wir, es ist die zweite. Wenn sich die Ziffern an dieser Stelle um mehr als 1 unterscheiden, dann bestimmen x und y verschiedene Punkte auf der Zahlengeraden. Ist zum Beispiel x = 1.23 . . . und y = 1.25 . . . , dann liegt x in [1.23, 1.24] und y in [1.25, 1.26]. Da diese beiden Intervalle keinen gemeinsamen Punkt haben, müssen x und y verschieden sein. Unterscheiden sich die Ziffern an dieser Stelle jedoch nur um 1, zum Beispiel x = 1.23 . . . und y = 1.24 . . . , dann liegt x in [1.23, 1.24] und y in [1.24, 1.25]. Diese beiden Intervalle haben genau einen Punkt gemeinsam, nämlich 1.24. Wenn also x und y denselben Punkt darstellen, dann kann das nur 1.24 sein. Durch y wird der Punkt 1.24 nur dann dargestellt, wenn alle weiteren Dezimalstellen 0, das heißt nicht Franz Hofbauer 3 vorhanden sind. Ist 9 die nächste Ziffer in x, also x = 1.239 . . . , dann liegt x in [1.239, 1.24]. Kommt dann noch eine 9, dann liegt x in [1.2399, 1.24]. Sind alle weiteren Ziffern von x gleich 9, also x = 1.239999 . . . , dann liegt x in den Intervallen [1.2399 . . . 9, 1.24], sodass x ebenfalls den Punkt 1.24 auf der Zahlengeraden darstellt. Ist eine dieser weiteren Ziffern nicht 9, dann stellt x auch nicht den Punkt 1.24 dar. Daraus sieht man, dass eine Dezimalzahl, bei der ab einer Stelle nur mehr 9 auftritt, auf der Zahlengeraden immer mit der Dezimalzahl zusammenfällt, die man erhält, wenn man die Neuner weglässt und die letzte Stelle vor den Neunern um 1 erhöht. Man sieht daraus auch, dass das die einzige Möglichkeit für das Zusammenfallen von zwei verschiedenen Dezimalzahlen auf der Zahlengeraden ist. Um zu erreichen, dass jeder Punkt auf der Zahlengeraden genau einer Dezimalzahl entspricht, verbieten wir Dezimalzahlen, bei denen ab einer Stelle nur mehr 9 auftritt. Sollte eine Zahl wie 1.239999 . . . vorkommen, zum Beispiel als Ergebnis einer Rechnung, dann denken wir sie uns automatisch durch die entsprechende endliche Dezimalzahl ersetzt. Für 1.239999 . . . ist das 1.24. Die Menge der reellen Zahlen R ist die Menge aller Dezimalzahlen, wobei wir jetzt Dezimalzahlen, bei denen ab einer Stelle nur mehr 9 auftritt, nicht mehr zulassen. So entsprechen die reellen Zahlen in eindeutiger Weise den Punkten auf der Zahlengeraden. Auf der Menge R müssen wir Addition und Multiplikation definieren. Dazu verwenden wir gerundete Dezimalzahlen. Ist x eine Dezimalzahl, dann bezeichnen wir mit xn die auf n Stellen gerundete Zahl x. Die gerundete Zahl xn ist eine Zahl mit n Dezimalstellen und wird so definiert, dass x im Intervall (xn − 21 εn , xn + 12 εn ] liegt, wobei εn = 0.0 . . . 001 der Abstand zweier Zahlen in der n-stelligen Dezimalskala ist. Die Addition auf der n-stelligen Dezimalskala funktioniert genauso wie für ganze Zahlen. Will man zwei Dezimalzahlen x und y addieren, dann addiert man die gerundeten Zahlen xn und yn . Berücksichtigt man auch die Rundungsfehler, dann erhält man das Intervall (xn + yn − εn , xn + yn + εn ], in dem die Summe von x und y liegen muss. Die ersten n Stellen der Summe sind damit bestimmt, wobei jedoch die n-te Stelle auch um 1 größer oder kleiner sein kann. Beispiel: Sei x = 2.31745576 . . . und y = 1.22253522 . . . . Rundet man auf 5 Stellen, so erhält man x5 = 2.31746 und y5 = 1.22254. Es folgt x5 + y5 = 3.54000. Die Summe von x und y liegt daher in (3.53999, 3.54001]. Durch Vergrößern von n kann man immer mehr Stellen der Summe bestimmen, sodass x + y dadurch eindeutig definiert wird. Auf dieselbe Art erhält man auch x − y. Das ist ja die Addition einer Zahl mit geändertem Vorzeichen. Man erkennt daraus auch sofort die Gültigkeit des Kommutativgesetzes und des Assoziativgesetzes für die Addition. Da gerundete Zahlen genauso addiert werden wie ganze Zahlen, muss xn + yn = yn + xn für alle n gelten. Wäre x + y = ̸ y + x, dann könnte man ein m finden, sodass sich x + y und y + x in der m-ten Dezimalstelle unterscheiden. Man kann nun n so groß wählen, dass x + y und xn + yn über die m-te Dezimalstelle hinaus übereinstimmen und dass dasselbe auch für y +x und yn +xn gilt. Wegen xn +yn = yn +xn müssen dann auch x + y und y + x an der m-ten Dezimalstelle übereinstimmen. Damit ist x + y = y + x gezeigt. Auf ähnliche Weise folgt das Assoziativgesetz. Es genügt, das Produkt für positive reelle Zahlen einzuführen. Das Produkt von zwei beliebigen reellen Zahlen x und y erhält man, indem man das Produkt ohne Vorzeichen berechnet und mit einem positiven Vorzeichen versieht, wenn x und y gleiches Vorzeichen haben, und mit einem negativen, wenn x und y verschiedenes Vorzeichen haben. 4 Reelle Zahlen und stetige Funktionen Seien x und y also positive reelle Zahlen. Die gerundeten Zahlen xn und yn multipliziert man unter Weglassen des Dezimalpunkts wie ganze Zahlen, wobei man im Produkt den Dezimalpunkt wieder richtig setzen muss. Ist C eine Zahl größer als x+y+1 , dann liegt das 2 Produkt der Zahlen x und y im Intervall (xn yn − Cεn , xn yn + Cεn ]. Gibt man ein m vor, dann kann man immer ein n finden, sodass die ersten m Dezimalstellen von xn yn bereits die des Produkts von x und y sind. Auf diese Weise lassen sich beliebig viele Dezimalstellen des Produkts bestimmen, sodass xy eindeutig definiert ist. Wie für die Addition folgen das Kommutativgesetz und das Assoziativgesetz auch für die Multiplikation, da die gerundeten Dezimalzahlen ja wie ganze Zahlen multipliziert werden und für diese daher Kommutativund Assoziativgesetz gelten. Ebenso erhält man das Distributivgesetz. Beispiel: Sei x = 2.3714524 . . . und y = 0.02495735 . . . . Rundet man auf 4 Stellen, so erhält man x4 = 2.3715 und y4 = 0.0250. Es folgt x4 y4 = 0.0592875. Man kann C = 2 wählen und erhält, dass xy im Intervall [0.0590, 0.0595] liegt. Wir haben also 3 Dezimalstellen von xy bestimmt. Um die Division einzuführen, genügt es x1 für x > 0 zu definieren. Wir erhalten xy dann als y · x1 . Sei also x > 0. Ist x > 1, dann setzen wir k = 0. Ansonsten sei die k-te Dezimalstelle die erste, an der x eine Ziffer ̸= 0 hat. Für n > k gilt dann, dass der Kehrwert von x im Intervall [ x1n − 102k εn , x1n + 102k εn ] liegen muss. Somit liefert uns x1n die ersten n−2k Dezimalstellen von x1 . Da man n beliebig groß wählen kann, ist x1 dadurch eindeutig bestimmt. Man kann x1n als Division zweier ganzer Zahlen berechnen. Beispiel: Sei x = 0.0273152 . . . , sodass wir x5 = 0.02732 erhalten. Es folgt k = 2 und 1 100000 1 2k x5 = 36.60322 . . . , indem man den Bruch 2732 ausdividiert. Wegen 10 ε5 = 0.1 liegt x im Intervall [36.5, 36.71]. Damit sind auf R alle vier Grundrechenarten eingeführt, wobei die üblichen Rechenregeln gelten. Mit den Rechenoperationen + und · bildet R einen Körper. 2. Ordnung Wir haben die Ordnungsrelation in R so definiert: Es gilt a < b, wenn a auf der Zahlengerade links von b liegt, das heißt, wenn b − a positives Vorzeichen hat. Ebenso gilt a ≤ b, wenn b − a positives Vorzeichen hat oder null ist. Wir schreiben das so auf (A) a≤b ⇔ 0≤b−a und a<b ⇔ 0<b−a Da Summe und Produkt zweier positiver Zahlen wieder positiv sind, haben wir auch (B) a ≥ 0, b ≥ 0 ⇒ a + b ≥ 0, ab ≥ 0 und a > 0, b > 0 ⇒ a + b > 0, ab > 0 Aus diesen einfachen Eigenschaften lassen sich alle weitere Regeln für das Rechnen mit der Ordnungsrelation herleiten. Wir fassen sie in den folgenden beiden Sätzen zusammen. Satz 1.1: Für a ∈ R gilt a2 ≥ 0. Weiters gilt a < 0 ⇔ 0 < −a und a > 0 ⇒ 1 a > 0. Beweis: Wir erhalten a < 0 ⇔ 0 < −a aus (A) mit b = 0. Ist a > 0 dann folgt a2 > 0, indem man b = a in (B) setzt. Ist a < 0 dann folgt −a > 0 und (−a)2 > 0, das heißt a2 > 0 mit Hilfe der beiden gerade gezeigten Aussagen. Somit gilt a2 > 0 für alle a ̸= 0. Ist jetzt a > 0, dann gilt auch ( a1 )2 > 0, wie wir soeben gezeigt haben, und aus (B) folgt dann a( a1 )2 > 0, das heißt a1 > 0, womit a > 0 ⇒ a1 > 0 gezeigt ist. Ist a = 0, dann gilt a2 = 0, womit auch a2 ≥ 0 für alle a ∈ R gezeigt ist. Franz Hofbauer 5 Satz 1.2: Seien a, b, c, d ∈ R. Dann gilt (a) a ≤ b ⇔ a + c ≤ b + c (b) a ≤ b ⇔ ac ≤ bc, wenn c > 0 (c) a ≤ b ⇔ ac ≥ bc, wenn c < 0 (d) a ≤ b, b ≤ c ⇒ a ≤ c (e) a ≤ b, c ≤ d ⇒ a + c ≤ b + d (f) 0 ≤ a ≤ b, 0 ≤ c ≤ d ⇒ ac ≤ bd (g) a ≤ b ⇔ a2 ≤ b2 , wenn a ≥ 0 und b ≥ 0 Beweis: Es gilt a ≤ b ⇔ 0 ≤ b − a und a + c ≤ b + c ⇔ 0 ≤ b + c − (a + c) nach (A). Wegen b − a = b + c − (a + c) ist damit bereits (a) gezeigt. Wir zeigen (b). Aus a ≤ b folgt 0 ≤ b − a wegen (A) und daraus 0 ≤ bc − ac wegen (B), da c > 0 vorausgesetzt wird, und daraus dann ac ≤ bc wieder wegen (A). Somit ist a ≤ b ⇒ ac ≤ bc gezeigt. Wegen c > 0 gilt auch 1c > 0 nach Satz 1.1. Aus der soeben gezeigten Implikation folgt dann ac ≤ bc ⇒ ac 1c ≤ bc 1c , das heißt ac ≤ bc ⇒ a ≤ b. Damit sind beide Implikationen in (b) gezeigt. Wir erhalten (c) aus (b). Es gilt c < 0 und daher 0 < −c wegen Satz 1.1. Dann gilt a ≤ b ⇔ a(−c) ≤ b(−c) nach (b) und a(−c) ≤ b(−c) ⇔ a(−c) + d ≤ b(−c) + d nach (a). Setzt man das zusammen und d = ac + bc, dann hat man a ≤ b ⇔ bc ≤ ac. Es gilt a ≤ b, b ≤ c ⇒ 0 ≤ b − a, 0 ≤ c − b ⇒ 0 ≤ b − a + c − b = c − a ⇒ a ≤ c, wobei wir zuerst (A), dann (B) und schließlich nochmals (A) anwenden. Damit ist (d) gezeigt. Aus (a) und (d) folgt a ≤ b, c ≤ d ⇒ a + c ≤ b + c, c + b ≤ d + b ⇒ a + c ≤ d + b. Das ist (e). Aus (b) und (d) folgt 0 ≤ a ≤ b, 0 ≤ c ≤ d ⇒ ac ≤ bc, cb ≤ db ⇒ ac ≤ db. Das ist (f). Für c = 0 oder b = 0 ist die zweite Implikation ja trivial. Ist a = b = 0, dann gilt (g). Gilt a > 0 und b ≥ 0, dann folgt b + a ≥ 0 + a > 0. Gilt b > 0 und a ≥ 0, dann folgt a + b ≥ 0 + b > 0, beides aus (a). Sei c = b + a. Wegen c > 0 erhalten wir dann a ≤ b ⇔ 0 ≤ b − a ⇔ 0 · c ≤ (b − a)c ⇔ 0 ≤ b2 − a2 ⇔ a2 ≤ b2 mit Hilfe von (a) und (b). Damit ist (g) gezeigt. In Satz 1.2 sind einige Äquivalenzumformungen von Ungleichungen enthalten, die man verwendet, um Ungleichungen zu beweisen oder die Lösungsmenge einer Ungleichung zu suchen. Wir geben ein Beispiel. Beispiel: Wir zeigen, dass das harmonische Mittel kleiner oder gleich dem arithmetischen 2xy Mittel ist, also x+y ≤ x+y 2 für x, y > 0 gilt. Wir versuchen durch Äquivalenzumformungen eine Ungleichung zu erhalten, deren Richtigkeit klar ist: 2xy x+y ≤ 2xy ≤ | · (x + y) x+y 2 2 x +2xy+y 2 2 2 4xy ≤ x + 2xy + y 2 |·2 | − 4xy 0 ≤ x2 − 2xy + y 2 0 ≤ (x − y)2 Diese letzte Ungleichung ist richtig, da quadrierte Zahlen nach Satz 1.1 immer ≥ 0 sind. Da die erste Ungleichung dazu äquivalent ist, haben wir diese bewiesen. 6 Reelle Zahlen und stetige Funktionen Der Betrag |x| einer reellen Zahl x ist die Zahl ohne Vorzeichen, das heißt |x| = x, wenn x ≥ 0 ist, und |x| = −x, wenn x < 0 ist. Es gilt | − x| = |x|. Der Abstand zweier Zahlen x und y auf der Zahlengeraden ist durch |x − y| gegeben. Wir werden ihn bei der Definition des Grenzwerts verwenden. Der folgende Satz gibt die Eigenschaften des Betrages an. Satz 1.3: Seien x und y in R. Dann gilt (a) |x + y| ≤ |x| + |y| (Dreiecksungleichung) (b) |x| · |y| = |xy| Beweis: Es gilt x ≤ |x| und −x ≤ |x| für alle x ∈ R, da x = |x| und −x ≤ 0 ≤ |x| im Fall x ≥ 0 gilt, und x ≤ 0 ≤ |x| und −x = |x| im Fall x < 0. Seien jetzt x und y in R. Dann gilt x ≤ |x| und y ≤ |y|, wie soeben gezeigt wurde, also auch x + y ≤ |x| + |y| nach Satz 1.2 (e). Ebenso gilt −x ≤ |x| und −y ≤ |y|, und damit auch −x − y ≤ |x| + |y| wieder wegen Satz 1.2 (e). Da |x + y| entweder gleich x + y oder gleich −x − y ist, ist |x + y| ≤ |x| + |y|, also (a) gezeigt. Da das Produkt xy ohne Berücksichtigung des Vorzeichens berechnet und dieses erst danach gesetzt wird, ist |xy| das Produkt der vorzeichenlosen Zahlen, also |x| · |y|. Wir führen noch die Begriffe Maximum und Minimum ein. Unter dem Maximum von endlich vielen Zahlen x1 , x2 , . . . , xk versteht man die größte dieser Zahlen. Man bezeichnet sie mit max(x1 , x2 , . . . , xk ). Unter dem Minimum von endlich vielen Zahlen x1 , x2 , . . . , xk versteht man die kleinste dieser Zahlen. Man bezeichnet sie mit min(x1 , x2 , . . . , xk ). 3. Intervallschachtelungseigenschaft Nachdem wir die Rechenoperationen und die Ordnungsrelation behandelt haben, kommen wir jetzt zur sogenannten Intervallschachtelungseigenschaft der reellen Zahlen. Als Intervallschachtelung bezeichnet man eine Folge von abgeschlossenen Intervallen, sodass das nächstfolgende Intervall immer im vorhergehenden enthalten ist. Wir haben also Intervalle [an , bn ] für n ≥ 1, für die [a1 , b1 ] ⊇ [a2 , b2 ] ⊇ [a3 , b3 ] ⊇ [a4 , b4 ] ⊇ . . . gilt. Die Anordnung der Endpunkte ist durch a1 ≤ a2 ≤ a3 ≤ a4 ≤ · · · < · · · ≤ b4 ≤ b3 ≤ b2 ≤ b1 gegeben. Wir nehmen an, dass alle Dezimalzahlen unendlich viele Dezimalstellen haben, indem wir bei Dezimalzahlen mit endlich vielen Dezimalstellen mit Nullen fortsetzen. Satz 1.4 (Intervallschachtelungseigenschaft) Sei [an , bn ] für n ≥ 1 eine Folge von Intervallen mit [an+1 , bn+1 ] ⊆ [an , bn ]. Dann gibt es ein x ∈ R mit x ∈ [an , bn ] für alle n. Beweis: Wir nehmen zuerst an, dass alle Intervalle Teilmengen von [0, ∞) sind. Sei gn der ganzzahlige Teil der Dezimalzahl an . Wegen a1 ≤ a2 ≤ a3 ≤ · · · ≤ b1 erhalten wir g1 ≤ g2 ≤ g3 ≤ · · · ≤ b1 . Da die Zahlen gn aber ganze Zahlen sind, ist die jeweils nächste Zahl entweder gleich der vorherigen Zahl oder um mindestens eins größer als die vorherige Zahl. Daher kann es nur endlich oft vorkommen, dass die nächste Zahl größer als die vorherige ist, sonst würden diese Zahlen ja irgendwann b1 überschreiten. Es müssen ein g ∈ Z und ein n0 existieren, sodass gn = g für alle n ≥ n0 gilt. Jetzt zu den Dezimalstellen. Für k ≥ 1 sei dn,k die k-te Dezimalstelle von an . Wir beginnen mit k = 1. Es gilt an0 ≤ an0 +1 ≤ an0 +2 ≤ . . . und der ganzzahlige Teil dieser Zahlen ist derselbe. Für die erste Dezimalstelle gilt daher dn0 ,1 ≤ dn0 +1,1 ≤ dn0 +2,1 ≤ . . . . Weiters liegen die Ziffern dn,1 für n ≥ n0 in der Menge {0, 1, . . . , 9}, sodass ab einer gewissen Stelle dieselbe Ziffer auftreten muss. Es gibt somit eine Ziffer d1 und ein n1 ≥ n0 mit dn,1 = d1 für alle n ≥ n1 . Franz Hofbauer 7 So behandeln wir auch die Dezimalstellen dn,k mit k ≥ 2. Da der ganzzahlige Teil und die erste Dezimalstelle für n ≥ n1 unverändert bleiben, gilt dn1 ,2 ≤ dn1 +1,2 ≤ dn1 +2,2 ≤ . . . , und man findet wie oben ein n2 ≥ n1 und eine Ziffer d2 mit dn,2 = d2 für alle n ≥ n2 . Im k-ten Schritt findet man ein nk ≥ nk−1 und eine Ziffer dk mit dn,k = dk für alle n ≥ nk . Sei x = g.d1 d2 d3 . . . die aus den erhaltenen Ziffern gebildete Dezimalzahl. Wir geben ein Beispiel für diese Konstruktion. a1 = 2 . 7 4 2 4 5 4 8 5 7 4 8 . . . a2 = 2 . 9 5 3 8 5 2 2 1 4 7 4 . . . a3 = 3 . 2 9 3 5 8 2 0 3 1 9 5 . . . a4 = 3 . 5 2 4 6 2 8 7 0 2 3 1 . . . a5 = 3 . 7 4 2 6 9 4 0 2 4 0 7 . . . a6 = 3 . 7 6 0 7 8 4 9 5 2 2 0 . . . a7 = 3 . 7 6 0 9 6 3 2 1 7 9 5 . . . a8 = 3 . 7 6 1 2 6 3 2 9 1 4 9 . . . a9 = 3 . 7 6 1 3 8 4 7 9 3 3 1 . . . a10 = 3 . 7 6 1 4 3 1 7 6 1 2 6 . . . a11 = 3 . 7 6 1 5 0 4 1 4 7 1 4 . . . a12 = 3 . 7 6 1 5 2 7 6 4 9 8 7 . . . a13 = 3 . 7 6 1 5 4 8 7 4 2 7 4 . . . a14 = 3 . 7 6 1 5 4 9 3 2 1 4 9 . . . a15 = 3 . 7 6 1 5 4 9 5 1 7 4 8 . . . a16 = 3 . 7 6 1 5 4 9 7 0 2 2 0 . . . a17 = 3 . 7 6 1 5 4 9 7 3 8 0 7 . . . a18 = 3 . 7 6 1 5 4 9 7 4 2 3 1 . . . a19 = 3 . 7 6 1 5 4 9 7 6 3 9 5 . . . a20 = 3 . 7 6 1 5 4 9 7 6 4 7 4 . . . a21 = 3 . 7 6 1 5 4 9 7 6 5 4 8 . . . ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ x = 3 . 7 6 1 5 4 9 7 6 ... ... ... Es bleibt zu zeigen, dass die so gewonnene reelle Zahl x in allen Intervallen [an , bn ] liegt. Wir zeigen zuerst an ≤ x für alle n. Angenommen, es gibt ein k mit ak > x. Da mit wachsendem m die Dezimalzahlen am ein immer größeres Anfangsstück mit der Dezimalzahl x gemeinsam haben, findet man ein m > k, sodass am mehr Dezimalstellen mit x gemeinsam hat als ak und somit näher bei x liegt als ak . Daraus folgt ak > am , ein Widerspruch, da ja a1 ≤ a2 ≤ a3 ≤ · · · ≤ ak ≤ · · · ≤ am ≤ . . . gilt. Damit ist an ≤ x für alle n gezeigt. Ebenso gilt bn ≥ x für alle n. Angenommen, es gibt ein k mit bk < x. Da mit wachsendem m die Dezimalzahlen am ein immer größeres Anfangsstück mit der Dezimalzahl x gemeinsam haben, findet man wie oben ein m, sodass am näher bei x liegt als bk . Daraus folgt bk < am , ein Widerspruch, da die linken Endpunkte aller Intervalle kleiner sind als die rechten Endpunkte aller Intervalle. Damit ist bn ≥ x für alle n gezeigt. 8 Reelle Zahlen und stetige Funktionen Was tun wir, wenn nicht alle Intervalle Teilmengen von [0, ∞) sind? Gilt an ≤ 0 und bn ≥ 0 für alle n, dann liegt 0 in allen Intervallen. Ansonsten finden wir ein u ≥ 1, sodass [au , bu ] Teilmenge von [0, ∞) oder Teilmenge von (−∞, 0] ist. Im ersten Fall untersuchen wir dann die Folge [an , bn ] für n ≥ u, die in [0, ∞) liegt. Gilt x ∈ [an , bn ] für alle n ≥ u, dann auch x ∈ [an , bn ] für alle n ≥ 1. Im zweiten Fall untersuchen wir die Folge [−bn , −an ] für n ≥ u, die ebenfalls in [0, ∞) liegt. Ist y eine Zahl, die in [−bn , −an ] für alle n ≥ u liegt, dann liegt x = −y in den ursprünglichen Intervallen [an , bn ] für alle n ≥ 1. Dieser Satz besagt, dass es für jede Folge von abgeschlossenen Intervallen, die ineinandergeschachtelt sind, mindestens eine Zahl gibt, die in allen Intervallen enthalten ist. Wir können auch eine Aussage über die Eindeutigkeit machen. Sei ln = bn − an die Länge des n-ten Intervalls. Es gilt l1 ≥ l2 ≥ l3 ≥ . . . , da die Intervalle ineinandergeschachtelt sind. Gibt es nun zwei verschiedene Zahlen x und y, die in allen Intervallen enthalten sind, und ist ε = |x − y| > 0 der Abstand der beiden Zahlen, dann gilt ln ≥ ε für alle n ≥ 0. Wenn also keine Zahl ε > 0 existiert, sodass ln ≥ ε für alle n gilt, dann gibt es genau eine Zahl, die in allen Intervallen liegt. Oft kommt es vor, dass ln ≤ 21 ln−1 für alle n gilt. In diesem Fall gibt es genau eine Zahl, die in allen Intervallen liegt. Würde ein ε > 0 existieren, sodass ε ≤ ln für alle n gilt, dann würde ε ≤ 2l1n und daraus 2n ≤ lε1 für alle n folgen. Ein Blick auf die Zahlengerade zeigt aber, dass die Zahlen 1, 2, 4, 8, . . . jede reelle Zahl überschreiten, sodass ein n mit 2n > lε1 existiert. Daher gibt es kein ε > 0, sodass ε ≤ ln für alle n gilt. Als Anwendung der Intervallschachtelung zeigen wir, dass man aus einer positiven reellen Zahl die Wurzel ziehen kann und dadurch wieder eine reelle Zahl enthält. Beispiel: Sei x > 0. Wir bilden Intervalle [an , bn ] mit an bn = x. Wir wählen a1 und b1 beliebig, sodass 0 < a1 < b1 und a1 b1 = x gelten, zum Beispiel a1 = 1 und b1 = x für x > 1 und a1 = x und b1 = 1 für x < 1. Ist [an , bn ] mit an < bn und an bn = x schon bestimmt, dann setzen wir bn+1 = 21 (an + bn ) und an+1 = x bn+1 sodass wieder an+1 bn+1 = x gilt. Da bn+1 der Mittelpunkt des Intervalls [an , bn ] ist, x erhalten wir bn+1 < bn und an+1 = bn+1 > bxn = an . Weiters gilt bn+1 − an+1 = b2n+1 −x bn+1 = (an +bn )2 −4an bn 4bn+1 = 1 4bn+1 (bn − an )2 Wegen an < bn folgt daraus auch an+1 < bn+1 . Somit ist [an+1 , bn+1 ] ein Intervall, das in [an , bn ] enthalten ist. Da bn+1 der Mittelpunkt von [an , bn ] ist, ist das nächste Intervall höchstens halb so lang wie das vorhergehende. Es gibt somit genau eine reelle Zahl y, die in allen Intervallen enthalten ist. Es gilt a2n ≤ y 2 ≤ b2n für alle n. Wegen an bn = x und a2n ≤ an bn ≤ b2n gilt auch a2n ≤ x ≤ b2n für alle n. Wegen b2n − a2n ≤ 2b1 (bn − an ) existiert kein ε > 0, sodass b2n − a2n ≥ ε für alle n gilt. Daher gibt es nur eine Zahl, die in allen Intervallen [a2n , b2n ] liegt, sodass y 2 = x folgt. Somit ist y die Wurzel aus x. Für x = 2 sind [1, 2] ⊇ [1.3333, 1.5000] ⊇ [1.4118, 1.4167] ⊇ [1.414211, 1.414216] ⊇ . . . die ersten Intervalle. Man sieht, dass sie sehr schnell kleiner werden. Als weiteres Beispiel bestimmen wir die Zahl π, die Fläche des Kreises mit Radius 1. Wir schachteln die Kreisfläche durch Flächen von regelmäßigen n-Ecken ein. Diese Methode geht auf Archimedes zurück. Man kann damit π auf eine bestimmte Anzahl von Stellen berechnen. (Dabei bezeichnet U V die Strecke und |U V | den Abstand zwischen U und V .) Franz Hofbauer 9 Beispiel: Wir berechnen die Fläche des KreiM ses mit Radius r = 1 durch Approximation mit regelmäßigen Vielecken. Seien s und t die halben Seitenlängen des ein- und umgeschriebenen regelmäßigen k-Ecks. Seien x und y die halben Seitenlängen des ein- und umgeschriebenen regelmäßigen 2k-Ecks. In der nebenstehenden Zeichnung sind P Q und AB Seiten des ein- und umgeschriebenen res s R Q gelmäßigen k-Ecks, P C und CQ sind Seiten P 2x 2x des eingeschriebenen regelmäßigen 2k-Ecks y und CD und DQ sind halbe Seiten des umt A C D t B geschriebenen regelmäßigen 2k-Ecks. Aus der Ähnlichkeit der beiden rechtwinkeligen Dreiecke BQD und BCM folgt |DQ| : |DB| = |M C| : |M B|. Aus dem Strahlensatz folgt |M Q| : |M B| = |RQ| : |CB|. Wegen |M C| = r = |M Q| folgt |DQ| : |DB| = |RQ| : |CB|. y ts = st . Daraus folgt y = t+s . Aus der Setzt man die Seitenlängen ein, so ergibt sich t−y y Ähnlichkeit der beiden gleichschenkeligen Dreiecke P CQ und CDQ folgt 2x 2s = 2x , das √ sy heißt x = 2 . Sei Fm die Fläche des umgeschriebenen m-Ecks und fm die Fläche des eingeschriebenen m-Ecks. Ist u die halbe Seite des umgeschriebenen m-Ecks, dann gilt Fm = mur = mu, also Fk = kt und F2k = 2ky. Ist v die halbe Seite des eingeschriebenen m-Ecks, dann ist r die Grundlinie und v die Höhe in den Dreiecken, aus denen das regelmäßigen 2m-Eck besteht. Daher gilt f2m = 2m 21 rv = mv, also f2k = ks und f4k = 2kx. Wir erhalten die Rekursionsformeln √ √ 2Fk f2k F2k = 2ky = 2kts = und f = 2kx = k 2sy = f2k F2k 4k t+s Fk +f2k Für n ≥ 1 sei an = f2n+1 und bn = F2n+1 . Die Intervalle [an , bn ] enthalten dann π, die Fläche des Kreises mit Radius 1. Da das regelmäßige eingeschriebene 2n+1 -Eck im regelmäßigen eingeschriebenen 2n+2 -Eck enthalten ist, haben wir an < an+1 . Da das regelmäßige umgeschriebene 2n+1 -Eck das regelmäßige umgeschriebene 2n+2 -Eck enthält, haben wir bn > bn+1 . Daher bilden die Intervalle [an , bn ] für n ≥ 1 eine Intervallschachtelung. Die Fläche des eingeschriebenen regelmäßigen Vierecks ist 2, also a1 = 2. Die Fläche des umgeschriebenen regelmäßigen Vierecks ist 4, also b1 = 4. Mit Hilfe der obigen Rekursionsformeln kann man weitere Intervalle berechnen √ n an+1 an+1 = an bn und bn+1 = b2b n +an+1 Da das harmonische Mittel kleiner gleich dem arthmetischen Mittel ist, ist [an+1 , bn+1 ] in der linken Hälfte des Intervalls [an+1 , bn ] enthalten. Daher ist [an+1 , bn+1 ] höchstens halb so lang wie [an , bn ]. Es gibt eine eindeutig bestimmte reelle Zahl, die in allen Intervallen liegt. Das muss die Fläche des Kreises mit Radius 1 sein. Die ersten Intervalle sind [2, 4] ⊇ [2.8284, 3.3137] ⊇ [3.0615, 3.1826] ⊇ [3.1214, 3.1517] ⊇ [3.1365, 3.1441] ⊇ [3.1403, 3.1422] ⊇ [3.1413, 3.1418] ⊇ [3.1415, 3.1416] ⊇ . . . , sodass man neun Intervalle benötigt, um π auf vier Dezimalstellen genau zu erhalten. Genauso kann man einen Kreis mit Radius r ̸= 1 behandeln. Die Überlegungen sind genau dieselben. Man erhält dieselbe Intervallschachtelung, nur dass die Endpunkte aller Intervalle mit r2 multipliziert sind. Somit gibt es wieder genau eine reelle Zahl, die in allen Intervallen liegt, und diese Zahl ist r2 π. Das ist die Fläche des Kreises mit Radius r. 10 Reelle Zahlen und stetige Funktionen 4. Folgen und deren Grenzwerte Eine zentrale Rolle in der Analysis spielen Folgen und deren Grenzwerte. Eine Folge von reellen Zahlen kann man sich als zeitlichen Ablauf vorstellen. Zum Zeitpunkt 0 ist man im Punkt a0 , zum Zeitpunkt 1 ist man im Punkt a1 , zum Zeitpunkt 2 ist man im Punkt a2 , und immer so weiter. Es wird also die Folge a0 , a1 , a2 , . . . von reellen Zahlen durchlaufen. Man schreibt eine Folge auch in der Form (an )n≥0 auf. Oft beginnt man die Zeitpunkte mit 1 zu zählen, hat also die Folge (an )n≥1 . Die reellen Zahlen an heißen Glieder der Folge. Folgen können verschiedenes Verhalten zeigen. Die durch an = n für n ≥ 1 definierte Folge durchläuft die natürlichen Zahlen. Sie wird also nach ∞ entschwinden. Die durch an = n1 für n ≥ 1 definierte Folge hingegen nähert sich mit fortschreitendem n immer mehr der Zahl 0. Es ist naheliegend, die Zahl a = 0 als Grenzwert der Folge (an )n≥1 zu bezeichnen. Die Folge an = (−1)n n12 für n ≥ 1 zeigt alternierendes Verhalten. Zu geraden Zeitpunkten n ist an rechts von 0. Zu ungeraden Zeitpunkten n ist an links von 0. Mit fortschreitendem n nähert sich auch diese Folge immer mehr der Zahl 0. Daher hat sie ebenfalls den Grenzwert a = 0. Um den Begriff des Grenzwertes zu definieren, muss man zuerst Umgebungen einer Zahl a ∈ R einführen. Als ε-Umgebung der Zahl a bezeichnet man das offene Intervall (a − ε, a + ε), wobei ε > 0 ist. Ist a ∈ R und existiert zu jeder ε-Umgebung von a, wie klein ε auch sein mag, ein Zeitpunkt, ab dem die Glieder der Folge in dieser Umgebung liegen, dann wird man a als Grenzwert der Folge bezeichnen. In eine mathematische Sprahe übersetzt, ergibt das folgende Definition. Definition: Man nennt a ∈ R Grenzwert der Folge (an )n≥0 , wenn für jedes ε > 0 ein n0 existiert, sodass |an − a| < ε für alle n ≥ n0 gilt. Man schreibt limn→∞ an = a. Folgen, die einen Grenzwert haben, heißen konvergent. Alle anderen Folgen heißen divergent. Außerdem ist der Grenzwert einer Folge (an )n≥0 , falls er existiert, eindeutig bestimmt. Sind a und b zwei verschiedene Zahlen in R, dann findet man ein ε > 0, zum Beispiel ε = |a−b| 2 , sodass die offenen Intervalle (a − ε, a + ε) und (b − ε, b + ε) keinen gemeinsamen Punkt haben. Ist a Grenzwert, dann gibt es ein n0 , sodass an ∈ (a − ε, a + ε) für alle n ≥ n0 gilt. Dann gilt aber an ∈ / (b − ε, b + ε) für alle n ≥ n0 und b kann nicht Grenzwert sein. Beispiele: Sei an = n1 für n ≥ 1. Wir zeigen, dass limn→∞ an = 0 gilt, indem wir die Definition des Grenzwertes nachprüfen. Dazu sei ε > 0 vorgegeben. Wir wählen n0 > 1ε . Für n ≥ n0 gilt dann |an − 0| = n1 ≤ n10 < ε. Ist bn = √1 n für n ≥ 1, dann folgt limn→∞ bn = 0 wie oben, indem wir n0 > 1 ε2 wählen. Die Folge cn = (−1)n für n ≥ 0 ist nicht konvergent. Angenommen sie hätte den Grenzwert a. Für ε = 21 müsste es dann ein n0 geben mit an ∈ (a − 12 , a + 21 ) für n ≥ n0 . Daraus würde |an0 − an0 +1 | < 1 folgen, ein Widerspruch dazu, dass eine der Zahlen an0 und an0 +1 gleich 1 und die andere gleich −1 ist. Somit kann diese Folge keinen Grenzwert haben. Um Rechenregeln für Grenzwerte herzuleiten, benötigen wir folgenden Satz. Satz 1.5: Sei (an )n≥0 eine Folge, für die der Grenzwert limn→∞ an = a existiert. Dann gibt es ein C > 0, sodass |an | ≤ C für alle n ≥ 0 gilt. Ist a ̸= 0, dann existiert ein c > 0 und ein m0 , sodass |an | ≥ c für alle n ≥ m0 gilt. Franz Hofbauer 11 Beweis: Sei ε > 0 vorgegeben. Aus der Definition des Grenzwerts erhalten wir, dass ein n0 existiert mit |an − a| < ε für alle n ≥ n0 . Mit Hilfe der Dreiecksungleichung folgt dann |an | = |an − a + a| ≤ |an − a| + |a| < ε + |a| für alle n ≥ n0 . Wählt man für C die größte der Zahlen ε + |a|, |a0 |, |a1 |, . . . , |an0 −1 |, dann ist |an | ≤ C für alle n erfüllt. Für die zweite Aussage wird a ̸= 0 vorausgesetzt. Wir wählen ε = |a| 2 > 0. Es existiert |a| ein m0 , sodass |an − a| < ε für alle n ≥ m0 gilt. Sei c = 2 > 0. Mit Hilfe der Dreiecksungleichung erhalten wir |a| = |a − an + an | ≤ |a − an | + |an |. Für n ≥ m0 ergibt sich |an | ≥ |a| − |a − an | > |a| − ε = |a| − |a| 2 = c, womit die zweite Aussage gezeigt ist. Satz 1.6 (Rechenregeln für Grenzwerte) Seien (an )n≥0 und (bn )n≥0 Folgen, für die die Grenzwerte limn→∞ an = a und limn→∞ bn = b existieren. (a) Ist m0 ≥ 0 und an ≤ bn für n ≥ m0 , dann gilt a ≤ b. (b) Es gilt limn→∞ (an + bn ) = a + b. (c) Es gilt limn→∞ (an bn ) = ab. (d) Ist b ̸= 0 und bn ̸= 0 für alle n, dann gilt limn→∞ abnn = ab . Beweis: Um (a) zu zeigen, nehmen wir an, dass a > b gilt. Gelingt es uns, daraus einen Widerspruch zur Voraussetzung an ≤ bn für n ≥ m0 herzuleiten, dann kann a > b nicht gelten und a ≤ b ist bewiesen. Wir nehmen also an, dass a > b gilt. Sei ε = a−b 2 . Wegen limn→∞ an = a und limn→∞ bn = b finden wir n0 und n1 , sodass a − ε < an < a + ε für alle n ≥ n0 und b − ε < bn < b + ε für alle n ≥ n1 gilt. Für n ≥ max(n0 , n1 ) erhalten wir an > a − ε = b + ε > bn . Das widerspricht aber der Voraussetzung, dass an ≤ bn für n ≥ m0 gilt. Damit ist (a) gezeigt. Um (b) zu zeigen, prüfen wir die Definition des Grenzwerts nach. Sei ε > 0 vorgegeben. Wir müssen ein n0 finden, sodass |(an + bn ) − (a + b)| < ε für alle n ≥ n0 gilt. Wegen limn→∞ an = a und limn→∞ bn = b finden wir n1 und n2 , sodass |an − a| < 2ε für alle n ≥ n1 und |bn − b| < 2ε für alle n ≥ n2 gilt. Sei n0 = max(n1 , n2 ). Für n ≥ n0 erhalten wir mit Hilfe der Dreiecksungleichung |(an + bn ) − (a + b)| ≤ |an − a| + |bn − b| < 2ε + 2ε = ε. Damit ist die Grenzwertdefinition nachgeprüft und (b) gezeigt. Zum Beweis von (c) verwenden wir Satz 1.5. Es existiert ein C > 0, sodass |bn | ≤ C für alle n gilt. Sei ε > 0 vorgegeben. Wegen limn→∞ an = a und limn→∞ bn = b finden wir ε ε n1 und n2 , sodass |an − a| < C+|a| für alle n ≥ n1 und |bn − b| < C+|a| für alle n ≥ n2 gilt. Sei n0 = max(n1 , n2 ). Für n ≥ n0 erhalten wir mit Hilfe der Dreiecksungleichung |an bn − ab| = |an bn − abn + abn − ab| ≤ |(an − a)bn | + |a(bn − b)| ≤ |an − a|C + |a||bn − b| < ε C+|a| C ε + |a| C+|a| =ε womit (c) gezeigt ist. Um (d) zu zeigen, wählen wir zuerst ein m0 und ein c > 0, sodass |bn | ≥ c für alle n ≥ m0 gilt, was wegen Satz 1.5 möglich ist. Sei ε > 0 vorgegeben. Wegen limn→∞ an = a ε|b|c für alle n ≥ n1 und und limn→∞ bn = b finden wir n1 und n2 , sodass |an − a| < |a|+|b| ε|b|c |bn − b| < |a|+|b| für alle n ≥ n2 gilt. Sei n0 = max(m0 , n1 , n2 ). Für n ≥ n0 erhalten wir mit Hilfe der Dreiecksungleichung | abnn − ab | = | abnn − ≤ 1 c a bn + a bn · |an − a| + − ab | ≤ | abnn − |a| |b|c a bn | · |bn − b| < womit wir auch (d) gezeigt haben. 1 c · + | ban − ab | = ε|b|c |a|+|b| + |a| |b|c 1 |bn | · · |an − a| + ε|b|c |a|+|b| =ε |a| |b||bn | · |b − bn | 12 Reelle Zahlen und stetige Funktionen Auf einen Spezialfall dieser Rechenregeln sei noch hingewiesen. Ist die Folge (bn )n≥0 konstant, also bn = d für alle n, dann gilt natürlich auch limn→∞ bn = d, wie man leicht aus der Definition des Grenzwertes erkennt, und wir erhalten limn→∞ (d+an ) = d+limn→∞ an und limn→∞ dan = d limn→∞ an aus Satz 1.6. Mit diesen Rechenregeln ist es möglich, das Berechnen von Grenzwerten auf einfache Fälle, wie limn→∞ n1 = 0 zurückzuführen. −5n Beispiel: Wir berechnen den Grenzwert der Folge an = 2n 3n2 +4 für n → ∞. Dazu dividieren wir Zähler und Nenner durch die höchste vorkommende Potenz, das ist in diesem 2− 5 Fall n2 , und erhalten an = 3+ n4 . Wegen Satz 1.6 (d) können wir den Grenzwert von 2 n2 Zähler und Nenner getrennt berechnen. Durch Anwenden von Satz 1.6 (b) erhalten wir limn→∞ (2 − n5 ) = 2 − 5 limn→∞ n1 = 2 und limn→∞ 3 + n42 = 3 + 4 limn→∞ n1 limn→∞ n1 = 3 folgt wegen Satz 1.6 (b) und (c). Damit haben wir limn→∞ an = 23 berechnet. Der folgende Satz wird ebenfalls häufig zum Berechnen eines Grenzwerts verwendet. Satz 1.7: Existieren die Grenzwerte limn→∞ an und limn→∞ bn und sind beide gleich a und gibt es außerdem ein m0 mit an ≤ xn ≤ bn für alle n ≥ m0 , dann existiert auch limn→∞ xn und ist ebenfalls gleich a. Beweis: Sei ε > 0 vorgegeben. Wir finden n1 mit |an − a| < ε für alle n ≥ n1 und n2 mit |bn − a| < ε für alle n ≥ n2 . Sei n0 = max(m0 , n1 , n2 ). Für n ≥ n0 gilt an ≤ xn ≤ bn und an und bn liegen in der ε-Umgebung von a. Da dann auch jeder Punkt, der zwischen an und bn liegt, in der ε-Umgebung von a liegen muss, erhalten wir |xn − a| < ε für alle n ≥ n0 , womit limn→∞ xn = a gezeigt ist. √ √ √ Beispiel: Sei xn = n + 2 n − n. Wir berechnen limn→∞ xn mittels Satz 1.7. Es gilt √ √ √ √ 1 − 2√1 n ≤ xn ≤ 1 ⇔ n + 1 − 2√1 n ≤ n + 2 n ≤ n + 1 √ √ √ 1 ⇔ n + 2 n − √1n + 4n ≤n+2 n≤n+2 n+1 Die letzte Aussage ist leicht als richtig erkennbar, daher haben wir an ≤ xn ≤ bn mit an = 1 − 2√1 n und bn = 1 für n ≥ 1 gezeigt. Wegen limn→∞ √1n = 0 folgt limn→∞ an = 1 aus Satz 1.6. Klarerweise gilt limn→∞ bn = 1. Aus Satz 1.7 folgt daher limn→∞ xn = 1. Es folgt ein weiterer Satz, der ebenfalls die Existenz eines Grenzwerts zum Inhalt hat. Dazu sind einige Definitionen notwendig. Eine Folge (an )n≥0 heißt monoton wachsend, wenn an+1 ≥ an für alle n gilt. Eine Folge (an )n≥0 heißt monoton fallend, wenn an+1 ≤ an für alle n gilt. Eine Folge (an )n≥0 heißt nach oben beschränkt mit oberer Schranke c, wenn an ≤ c für alle n gilt. Eine Folge (an )n≥0 heißt nach unten beschränkt mit unterer Schranke d, wenn an ≥ d für alle n gilt. Der erste Teil von Satz 1.5 besagt, dass eine konvergente Folge sowohl nach oben als auch nach unten beschränkt ist. Satz 1.8 (Satz über die Konvergenz monotoner Folgen) Eine monoton wachsende, nach oben beschränkte Folge hat einen Grenzwert. Eine monoton fallende, nach unten beschränkte Folge hat einen Grenzwert. Der Beweis dieses Satzes verwendet die Intervallschachtelungseigenschaft der reellen Zahlen. Beweise, die die Intervallschachtelungseigenschaft verwenden, sind in einem späteren Kapitel zusammengestellt. Dort findet man unter anderem auch den Beweis von Satz 1.8. Franz Hofbauer 13 Im folgenden Beispiel werden rekursiv definierte Folgen (jedes Folgenglied wird aus den vorhergehenden berechnet) mit Hilfe von Satz 1.8 untersucht. a3 +1 Beispiel: Sei a0 = 1 und an+1 = n3 für n ≥ 0. Wir zeigen, dass die so definierte Folge monoton fallend ist und 13 als untere Schranke hat. Es gilt a1 = 23 ≤ a0 . Angenommen, wir haben a0 ≥ a1 ≥ · · · ≥ an−1 ≥ an ≥ 31 schon a3 +1 a3 +1 a3 +1 gezeigt. Dann folgt an+1 = n3 ≥ 13 und an+1 = n3 ≤ n−1 = an , sodass auch 3 1 a0 ≥ a1 ≥ · · · ≥ an−1 ≥ an ≥ an+1 ≥ 3 gilt. Durch Wiederholen dieses Beweisschritts sieht man, dass die Folge (an )n≥0 monoton fallend und nach unten durch 31 beschränkt ist. Nach Satz 1.8 existiert der Grenzwert limn→∞ an = x. Wegen Satz 1.6 gilt x ≥ 13 und lim a3 +1 3 n→∞ n x = limn→∞ an+1 = = x 3+1 . Der Grenzwert x ist also eine Lösung der 3 Gleichung x3 − 3x + 1 = 0, die im Intervall [ 13 , 1) liegt. √ √ √ Sei b0 = 1 und bn+1 = 3 − b1n . Es gilt b0 ≤ 2 = b1 ≤ 3. Wie oben zeigt man, √ dass die Folge (bn )n≥0 monoton wachsend und nach oben durch 3√ beschränkt ist. Ist √ √ b0 ≤ b1 ≤ · · · ≤ bn−1 ≤ bn ≤ 3 schon gezeigt, dann folgt bn+1 = 3 − b1n ≤ 3 und √ √ √ 1 bn+1 = 3 − b1n ≥ 3 − bn−1 = bn , sodass auch b0 ≤ b1 ≤ · · · ≤ bn−1 ≤ bn ≤ bn+1 ≤ 3 gilt. Durch Wiederholen dieses Beweisschritts sieht man, dass die Folge (bn )n≥0 monoton √ wachsend und nach oben durch 3 beschränkt ist. Nach Satz 1.8 existiert der Grenzwert limn→∞ bn = y. Da b2n+1 = 3 − b1n für alle n gilt, folgt y 2 = 3 − y1 mit Hilfe von Satz 1.6. Somit ist y wieder eine Lösung der Gleichung √ y 3 − 3y + 1 = 0, allerdings eine im Intervall (1, 3]. 5. Funktionen Sei D eine Teilmenge von R. Wird jeder Zahl x ∈ D in eindeutiger Weise eine reelle Zahl f (x) zugeordnet, dann nennt man f eine Funktion mit Definitionsbereich D. Oft werden x Funktionen durch Formeln angegeben, zum Beispiel f (x) = 2 + 3x − 5x2 oder f (x) = 1+x 2, wobei man in beiden Fällen den Definitionsbereich D = R wählen kann. Das ist jedoch 3 nicht immer möglich. Hat man zum Beispiel die Funktion f (x) = x3x 2 −1 , dann muss man 1 und −1 aus dem Definitionsbereich ausschließen, da man diese Zahlen nicht in die Formel einsetzen kann. In diesem Fall ist D = R \ {−1, 1} ein geeigneter Definitionsbereich. Man kann für diese Funktion aber auch den Definitionsbereich D = (−1, 1) wählen, oder D = [2, 9] oder viele andere Mengen. Es ist daher wichtig den Definitionsbereich D anzugeben. Man schreibt f : D → R, wenn f auf D definiert ist und Werte in R hat. Für x ∈ D nennt man die Zahl f (x) den Funktionswert im Punkt x und die Menge f (D) = {f (x) : x ∈ D} aller Funktionswerte heißt Wertebereich der Funktion f . Oft drückt man Funktionen auch mit Hilfe des Symbols 7→ aus. Zum Beispiel schreibt man die Funktion, die jedem x den Wert 3x3 zuordnet, als x 7→ 3x3 . Man kann Funktionen in einem Koordinatensystem zeichnen. Man zeichnet die Menge der Punkte (x, f (x)) für x ∈ D. Diese Menge von Punkten nennt man den Graph der Funktion f . Der Graph der Funktion f (x) = x2 ist eine Parabel. Die folgenden Zeichnungen zeigen die Graphen der Funktionen x 7→ |1 − |3x|| − 32 und x 7→ max(−2x2 + 23 , 34 x). 14 Reelle Zahlen und stetige Funktionen Wir überlegen uns, wie sich der Graph einer Funktion unter gewissen Transformationen ändert. Der Graph der Funktion x 7→ f (−x) ist der um die y-Achse gespiegelte Graph der Funktion x 7→ f (x). Der Graph der Funktion x 7→ −f (x) ist der um die x-Achse gespiegelte Graph der Funktion x 7→ f (x). Im Folgenden sei a immer > 0. Der Graph der Funktion x 7→ f (x + a) ist der um a Einheiten nach links und der Graph der Funktion x 7→ f (x − a) ist der um a Einheiten nach rechts verschobene Graph der Funktion x 7→ f (x). Der Graph der Funktion x 7→ f (ax) ist der um den Faktor a1 in x-Richtung gedehnte (gestauchte) Graph der Funktion x 7→ f (x). Der Graph der Funktion x 7→ f (x) + a ist der um a Einheiten nach oben und der Graph der Funktion x 7→ f (x) − a ist der um a Einheiten nach unten verschobene Graph der Funktion x 7→ f (x). Schließlich ist der Graph der Funktion x 7→ af (x) der um den Faktor a in y-Richtung gedehnte (gestauchte) Graph der Funktion x 7→ f (x). Beispiel: Sei f (x) = 2x2 − 4x + 1 mit Definitionsbereich D = R. Durch Umformen erhalten wir f (x) = 2(x − 1)2 − 1. Der Graph der Funktion g(x) = x2 ist eine Parabel. Wir nennen sie Standardparabel. Man erhält den Graph der Funktion f , indem man die Standardparabel um 1 Einheit nach rechts verschiebt, dann um den Faktor 2 in y-Richtung dehnt und schließlich um 1 Einheit nach unten verschiebt. Die nebenstehende Zeichnung zeigt den Graph der Funktion f (x) = 2(x − 1)2 − 1 und die Standardparabel. Man kann die durchgeführten Transformationen nachvollziehen. Die einfachsten Funktionen sind Polynome. Ihr Definitionsbereich ist ganz R. Konstante Funktionen f (x) = c haben waagrechte Geraden als Graphen. Die Funktionen f (x) = c1 x + c0 mit c1 ̸= 0 sind die Polynome ersten Grades, deren Graphen ebenfalls Gerade sind, die allerdings nicht mehr waagrecht verlaufen. Die Funktionen f (x) = c2 x2 + c1 x + c0 mit c2 ̸= 0 sind die Polynome zweiten Grades. Ihre Graphen sind Parabeln, die man aus der Standardparabel nach der Methode in obigem Beispiel erhält. Schließlich nennt man die Funktionen f (x) = cn xn + · · · + c1 x + c0 mit cn ̸= 0 die Polynome n-ten Grades. Rationale Funktionen sind Brüche, deren Zähler und Nenner Polynome sind. Das Nennerpolynom kann in endlich vielen Punkten gleich 0 sein. Diese Punkte muss man aus dem Franz Hofbauer 15 Definitionsbereich ausschließen. Dort hat der Graph der Funktion senkrechte Asymptoten. Die einfachste rationale Funktion ist f (x) = x1 mit Definitionsbereich D = R \ {0}. Der Graph ist eine Hyperbel, deren Asymptoten die x-Achse und die y-Achse sind. 3x+1 Beispiel: Sei f (x) = 6x−2 mit Definitions1 bereich D = R \ { 3 }. Durch Umformen erhalten wir f (x) = 13 x−1 1 + 12 . Man kann den 3 Graphen dieser Funktion aus dem Graphen der Funktion g(x) = x1 durch entsprechende Transformationen gewinnen. Zuerst wird der Graph der Funktion g um 13 nach rechts verschoben, dann um den Faktor 13 in y-Richtung geschrumpft und schließlich um 12 nach oben verschoben. So erhält man den Graph der Funktion f , den die nebenstehende Zeichnung zeigt. Er hat eine senkrechte Asymptote bei x = 1 3 und eine waagrechte bei y = 12 . Ist der Grad des Zählerpolynoms einer rationalen Funktion f größer oder gleich dem Grad des Nennerpolynoms, so kann man f schreiben als Summe eines Polynoms und einer rationalen Funktion, deren Zählergrad kleiner als der Nennergrad ist. Der Graph der Funktion f liegt asymptotisch zu diesem Polynom. −x+1 Beispiel: Sei f (x) = x +x mit Defi3x2 −3 nitionsbereich D = R \ {−1, 1}. Umformen ergibt f (x) = 13 x + 13 + 32 x21−1 . Die Gerade y = 13 x + 13 ist eine Asymptote für den Graphen von f , da die Differenz 23 x21−1 zwischen dieser Gerade und f (x) für Zahlen x mit großem Betrag sehr klein ist. Außerdem hat der Graph von f senkrechte Asymptoten bei x = −1 und x = 1. Die nebenstehende Zeichnung zeigt den Graph der Funktion f zusammen mit den drei Asymptoten. 3 2 Nach diesen eher geometrischen Überlegungen zu den Funktionsgraphen wollen wir uns dem Rechnen mit Funktionen zuwenden. Sind f1 und f2 Funktionen mit Definitionsbereichen D1 und D2 , dann kann man auf D = D1 ∩ D2 Summe, Differenz und Produkt dieser Funktionen bilden. Man definiert f1 + f2 als die Funktion, die jedem x ∈ D den Wert f1 (x) + f2 (x) zuordnet. Genauso definiert man f1 − f2 und f1 · f2 . Mit dem Quotient ff12 muss man vorsichtiger sein. Man muss alle Punkte x aus dem Definitionsbereich ausschließen, für die f2 (x) = 0 gilt. Funktionen lassen sich auch hintereinander ausführen. Sind f und g Funktionen mit Definitionsbereichen D1 und D2 , und gilt f (x) ∈ D2 für alle x ∈ D1 , dann kann man g(f (x)) bilden. Die Funktion mit Definitionsbereich D1 , die jedem x ∈ D1 den Wert g(f (x)) zuordnet, bezeichnet man mit g ◦ f . 16 Reelle Zahlen und stetige Funktionen 6. Stetigkeit Eine stetige Funktion f stellt man sich so vor, dass man den Graph dieser Funktion als nicht unterbrochene Linie zeichnen kann. Wenn der Punkt y dem Punkt x nahe kommt, dann muss auch der Funktionswert f (y) dem Funktionswert f (x) nahe kommen. Um eine mathematische Definition zu geben, verwenden wir Umgebungen. Definition: Sei f : D → R eine Funktion und x ∈ D. Die Funktion f heißt stetig im Punkt x, falls für jedes ε > 0 ein δ > 0 existiert, sodass |f (y) − f (x)| < ε für alle y ∈ (x − δ, x + δ) ∩ D gilt. Man sagt f ist stetig auf D, wenn f in jedem Punkt x ∈ D stetig ist. Einfache Beispiele für stetige Funktionen sind lineare Funktionen, die Definitionsbereich D = R haben. Ist f (x) = c für alle x ∈ R und ε > 0 vorgegeben, dann kann man δ > 0 wählen, wie man will. Es gilt immer |f (y) − f (x)| = 0 < ε für alle y ∈ (x − δ, x + δ). Ist a ̸= 0 und f (x) = ax + b für alle x ∈ R, dann kann man zu vorgegebenem ε > 0 immer 1 δ = |a| ε wählen. Für y ∈ (x − δ, x + δ), das sind ja die y mit |y − x| < δ, gilt dann |f (y) − f (x)| = |a| · |y − x| < ε. Damit ist gezeigt, dass f in jedem Punkt x ∈ R stetig ist. Bei komplizierteren Funktionen kann die Wahl von δ schwieriger sein, wie das folgende Beispiel zeigt. Beispiel: Die Funktion f (x) = x2 ist stetig in jedem Punkt x ∈ R. Wir prüfen die Definition nach. Sei ε > 0 vorgegeben. Hier hängt die Wahl von δ nicht nur von ε, sondern ε auch von x ab. Wir können δ = min( 1+|2x| , 1) wählen. Ist dann y ∈ (x − δ, x + δ), also |y − x| < δ, so folgt |y + x| = |y − x + 2x| ≤ |y − x| + |2x| ≤ 1 + |2x| und damit erhalten wir |f (y) − f (x)| = |y 2 − x2 | = |y + x| · |y − x| < (1 + |2x|)δ ≤ ε. Um die Stetigkeit von Funktionen nicht so mühsam nachrechnen zu müssen, führen wir im nächsten Satz die Stetigkeit auf Grenzwerte zurück. Für jede Folge (xn )n≥1 , deren Glieder xn im Definitionsbereich einer Funktion f liegen, können wir die Folge der Funktionswerte f (xn ) untersuchen. Satz 1.9: Sei f : D → R eine Funktion und x ∈ D. Dann sind äquivalent (a) f ist im Punkt x stetig (b) für jede Folge (xn )n≥1 in D mit limn→∞ xn = x gilt limn→∞ f (xn ) = f (x). Beweis: Der Beweis besteht aus zwei Teilen. Wir beginnen mit (a) ⇒ (b). Unter der Voraussetzung der Stetigkeit von f im Punkt x müssen wir limn→∞ f (xn ) = f (x) zeigen. Wir wählen ε > 0 beliebig und suchen n0 . Da f im Punkt x stetig ist, gibt es ein δ > 0, sodass |f (y) − f (x)| < ε für alle y ∈ (x − δ, x + δ) ∩ D gilt. Wegen limn→∞ xn = x finden wir jetzt ein n0 , sodass xn ∈ (x − δ, x + δ) für alle n ≥ n0 gilt. Da xn ∈ D für alle n ≥ 1 vorausgesetzt wird, gilt mit diesem n0 , dass |f (xn ) − f (x)| < ε für alle n ≥ n0 erfüllt ist, womit limn→∞ f (xn ) = f (x) gezeigt ist. Wir zeigen (b) ⇒ (a) durch einen indirekten Beweis. Wir nehmen an, dass (a) nicht gilt und zeigen, dass dann auch (b) nicht gelten kann. Sei also (a) nicht erfüllt, das heißt f ist im Punkt x nicht stetig. Nach Definition der Stetigkeit existiert ein ε > 0, sodass, ganz egal wie klein wir δ > 0 wählen, immer ein y ∈ (x − δ, x + δ) ∩ D existiert mit |f (y) − f (x)| ≥ ε. Insbesondere können wir δ = n1 wählen und finden ein yn ∈ (x − n1 , x + n1 ) ∩ D mit |f (yn ) − f (x)| ≥ ε. Somit haben wir eine Folge (yn )n≥1 in D gefunden, deren Grenzwert x ist nach Satz 1.7, da ja x − n1 ≤ yn ≤ x + n1 für alle n ≥ 1 gilt. Andererseits gilt Franz Hofbauer 17 limn→∞ f (yn ) = f (x) nicht, da f (yn ) für jedes n ≥ 1 außerhalb der ε-Umgebung von f (x) liegt. Damit ist gezeigt, dass (b) nicht gilt. Mit diesem Satz und den Rechenregeln für Grenzwerte erhält man den folgenden Satz, der besagt, dass Summe, Differenz, Produkt und Quotient von stetigen Funktionen wieder stetig sind. Satz 1.10: Seien f : D → R und g : D → R Funktionen, die im Punkt x ∈ D stetig sind. Dann sind auch die Funktionen f + g, f − g und f g im Punkt x stetig. Ist g(x) ̸= 0, dann ist auch fg im Punkt x stetig. Beweis: Der Definitionsbereich der Funktionen f + g, f − g und f g ist ebenfalls D. Sei (xn )n≥1 eine beliebige Folge in D mit Grenzwert x. Da f und g im Punkt x stetig sind, folgt limn→∞ f (xn ) = f (x) und limn→∞ g(xn ) = g(x) aus Satz 1.9. Aus Satz 1.6 folgt limn→∞ f (xn ) + g(xn ) = f (x) + g(x), limn→∞ f (xn ) − g(xn ) = f (x) − g(x) und limn→∞ f (xn )g(xn ) = f (x)g(x). Wegen Satz 1.9 heißt das aber, dass die Funktionen f + g, f − g und f g im Punkt x stetig sind. Um den Definitionsbereich E der Funktion fg zu erhalten, muss man aus D noch alle Punkte ausschließen, in denen g null ist. Da g(x) ̸= 0 vorausgesetzt wird, liegt x in E. Wählt man eine beliebige Folge (xn )n≥1 in E mit Grenzwert x, so gilt g(xn ) ̸= 0 für alle n ≥ 1. Außerdem gilt limn→∞ f (xn ) = f (x) und limn→∞ g(xn ) = g(x) wegen Satz 1.9. (xn ) (x) Aus Satz 1.6 (d) folgt limn→∞ fg(x = fg(x) . Wegen Satz 1.9 heißt das aber, dass die n) Funktion f g im Punkt x stetig ist. Mit Hilfe dieses Satzes kann man für viele Funktionen zeigen, dass sie stetig sind. Die Funktion f (x) = x ist für alle x ∈ R stetig. Durch Produktbildung folgt, dass auch die Funktionen x 7→ x2 , x 7→ x3 , . . . auf ganz R stetig sind. Da konstante Funktionen stetig sind, sind auch die Funktionen x 7→ cxn mit c ∈ R und n ∈ N stetig. Durch Bilden von Summen folgt dann, dass alle Polynome auf ganz R stetig sind. Daraus erhält man wieder die Stetigkeit von rationalen Funktionen in allen Punkten, wo das Nennerpolynom nicht null ist. Treppenfunktionen sind Beispiele für Funktionen, die nicht überall stetig sind. Die Funktion f : [0, 2] → R definiert durch f (x) = 3 für x ∈ [0, 1) und f (x) = 2 für x ∈ [1, 2] ist ein einfaches Beispiel für eine Treppenfunktion. Sie ist im Punkt 1 unstetig. Ist xn = 1− n1 für n ≥ 1, dann ist (xn )n≥1 eine Folge in [0, 2] mit f (xn ) = 3 für alle n ≥ 1, sodass auch limn→∞ f (xn ) = 3 gilt. Andererseits gilt f (1) = 2, sodass f wegen Satz 1.9 im Punkt 1 unstetig ist. Zum Abschluss behandeln wir noch die Stetigkeit bei Hintereinanderausführen von zwei Funktionen. Satz 1.11: Seien f : D1 → R und g : D2 → R Funktionen. Für alle x ∈ D1 gelte f (x) ∈ D2 . Wenn f in x ∈ D1 und g in f (x) ∈ D2 stetig sind, dann ist auch g ◦ f in x stetig. Beweis: Sei (xn )n≥1 eine beliebige Folge in D1 mit Grenzwert x. Dann ist (f (xn ))n≥1 eine Folge in D2 . Da f in x stetig ist, hat diese Folge wegen Satz 1.9 den Grenzwert f (x). Da g im Punkt f (x) stetig ist, folgt limn→∞ g(f (xn )) = g(f (x)) wieder aus Satz 1.9. Das aber bedeutet wieder wegen Satz 1.9 die Stetigkeit von g ◦ f im Punkt x. 18 Reelle Zahlen und stetige Funktionen 7. Zwischenwertsatz und Umkehrfunktion Der wichtigste Satz über stetige Funktionen ist der Zwischenwertsatz. Liegt der Funktionswert in einem Punkt a unterhalb eines Wertes y und in einem anderen Punkt b oberhalb von y, dann muss der Graph der Funktion, der ja eine nicht unterbrochene Linie ist, an einer Stelle zwischen a und b den Wert y überschreiten. Satz 1.12 (Zwischenwertsatz) Sei f : [a, b] → R stetig. Es gelte f (a) < y < f (b) oder f (a) > y > f (b). Dann existiert ein x ∈ (a, b) mit f (x) = y. Der Beweis dieses Satzes verwendet die Intervallschachtelungseigenf (b) schaft und wird in einem späteren Kapitel gemeinsam mit anderen Beweisen gebracht. Die nebenstehende Zeichnung illustriert die Aussage des Zwischenwertsatzes. Ist y eine Zahl, y die zwischen den Funktionswerten f (a) und f (b) liegt, dann hat die Gleichung f (x) = y eine Lösung x f (a) im Intervall (a, b). Wie die Zeichnung zeigt, muss diese Lösung jedoch nicht eindeutig sein. Um eindeutige Lösungen zu haben, muss die Funktion neben der Stetigkeit a x b noch eine andere Voraussetzung erfüllen. Wir müssen uns mit dem Monotonieverhalten von Funktionen beschäftigen. Definition: Sei D ⊆ R. Eine Funktion f : D → R heißt (a) konstant, wenn ein c ∈ R existiert mit f (x) = c für alle x ∈ D (b) monoton wachsend, wenn gilt: u, v ∈ D und u < v ⇒ f (u) ≤ f (v) (c) streng monoton wachsend, wenn gilt: u, v ∈ D und u < v ⇒ f (u) < f (v) (d) monoton fallend, wenn gilt: u, v ∈ D und u < v ⇒ f (u) ≥ f (v) (e) streng monoton fallend, wenn gilt: u, v ∈ D und u < v ⇒ f (u) > f (v) Satz 1.13: Sei f : [a, b] → R stetig und streng monoton wachsend oder fallend. Für jedes y, das zwischen f (a) und f (b) liegt, hat dann die Gleichung f (x) = y genau eine Lösung x ∈ (a, b). Beweis: Die Existenz von x folgt aus Satz 1.12. Für x̃ ̸= x kann aber f (x̃) = f (x) nicht gelten, da eine streng monotone Funktion in zwei verschiedenen Punkten nicht den selben Funktionswert haben kann. Schließlich führen wir noch die Umkehrfunktion zu einer Funktionen f : I → R ein, wobei I ein beliebiges Intervall ist, zum Beispiel I = [a, b], I = (a, b), I = [a, ∞), I = R oder sonst eines. Die Umkehrfunktion g ist auf dem Wertebereich f (I) = {f (x) : x ∈ I} definiert. Sie weist jedem Element y = f (x) von f (I) den Wert x zu, kehrt also die Zuordnung, die f durchführt, um. Man berechnet g, indem man die Gleichung y = f (x) nach x auflöst und g(y) = x setzt. Voraussetzung ist, dass die Lösung x eindeutig ist. Es gelten dann die Gleichungen g(f (x)) = x für alle x ∈ I und f (g(y)) = y für alle y ∈ f (I). Franz Hofbauer 19 Der Graph der Umkehrfunktion g von f geht aus dem Graph von f durch Spiegelung an der Geraden y = x hervor. Diese Spiegelung führt nämlich die Menge {(x, f (x)) : x ∈ I}, die den Graph von f bildet über in die Menge {(f (x), x) : x ∈ I} = {(y, g(y)) : y ∈ f (I)}, die den Graph von g bildet. Beispiel: Die Funktion f (x) = 4x−3 ist 2x auf dem Intervall I = (0, ∞) definiert. Die Funktionswerte f (x) durchlaufen das Intervall J = (−∞, 2), wenn x durch I läuft. Daher gilt f (I) = J. Die Umkehrfunktion erhält man durch Lösen der Gleichung y = 4x−3 2x nach x, vorausgesetzt diese Lösung ist eindeutig bestimmt. Das ist auch der Fall. Wir 3 erhalten x = 4−2y als eindeutige Lösung. Die 3 . Sie Umkehrfunktion ist daher g(y) = 4−2y ist auf J definiert und es gilt g(f (x)) = x für x ∈ I und f (g(y)) = y für y ∈ J, wie man leicht nachprüft. Die Zeichnung zeigt die Graphen der beiden Funktionen. Sie liegen symmetrisch zur Geraden y = x. g f Der folgende Satz gibt an, unter welchen Voraussetzungen eine Umkehrfunktion existiert. Satz 1.14: Sei I = [a, b] ⊆ R ein abgeschlossenes Intervall und f : I → R stetig und streng monoton wachsend oder fallend. Sei J = [f (a), f (b)], wenn f monoton wachsend, und J = [f (b), f (a)], wenn f monoton fallend ist. Dann existiert eine eindeutig bestimmte Funktion g : J → I mit g(f (x)) = x für alle x ∈ I und f (g(y)) = y für alle y ∈ J. Weiters ist g streng monoton wachsend, wenn f monoton wachsend ist, und streng monoton fallend, wenn f monoton fallend ist. Schließlich ist g auch stetig. Die Funktion g heißt Umkehrfunktion von f . Beweis: Wir führen den Beweis nur für streng monoton wachsende Funktionen. Für streng monoton fallende Funktionen verläuft der Beweis ganz analog. Es drehen sich nur Ungleichheitszeichen um. Wir definieren die Funktion g : J → I. Sei y ∈ J. Wenn y = f (a) gilt, dann setzen wir g(y) = a. Wenn y = f (b) gilt, dann setzen wir g(y) = b. Wenn keiner dieser beiden Fälle eintritt, dann liegt y zwischen f (a) und f (b). Aus dem Zwischenwertsatz folgt dann, dass ein x ∈ (a, b) existiert mit f (x) = y. Da f streng monoton wachsend ist, ist x eindeutig bestimmt. Wir setzen g(y) = x. Damit ist g : J → I definiert. Aus dieser Definition ergibt sich f (g(y)) = y für alle y ∈ J. Ist andererseits x ∈ I beliebig, dann gilt f (x) ∈ J und wir können y = f (x) in die Gleichung f (g(y)) = y einsetzen. Es folgt f (g(f (x))) = f (x) und daraus dann g(f (x)) = x, da f streng monoton ist. Weiters ist g : J → I eindeutig bestimmt. Wäre g̃ : J → I eine andere Funktion mit den selben Eigenschaften, dann hätten wir f (g(y)) = y = f (g̃(y)) und somit auch g(y) = g̃(y) für alle y ∈ J wegen der strengen Monotonie von f . Die Funktion g ist streng monoton wachsend. Aus y1 < y2 folgt g(y1 ) < g(y2 ). Wäre nämlich g(y1 ) ≥ g(y2 ), dann würde f (g(y1 )) ≥ f (g(y2 )) folgen, da f streng monoton wachsend ist, also y1 ≥ y2 . Daher kann g(y1 ) ≥ g(y2 ) nicht gelten. 20 Reelle Zahlen und stetige Funktionen Schließlich beweisen wir, dass g : J → I stetig ist. Sei y ∈ J und (yn )n≥1 eine Folge in J mit limn→∞ yn = y. Wegen Satz 1.9 genügt es zu zeigen, dass limn→∞ g(yn ) = g(y) gilt. Würde das nicht zutreffen, dann fände man ein x1 < g(y), sodass g(yn ) ≤ x1 für unendlich viele n gilt, oder ein x2 > g(y), sodass g(yn ) ≥ x2 für unendlich viele n gilt. Im ersten Fall folgt f (x1 ) < y und yn ≤ f (x1 ) für unendlich viele n, da f streng monoton wachsend ist, ein Widerspruch zu limn→∞ yn = y. Im zweiten Fall folgt f (x2 ) > y und yn ≥ f (x2 ) für unendlich viele n, ebenfalls ein Widerspruch zu limn→∞ yn = y. Die Annahme, dass limn→∞ g(yn ) = g(y) nicht gilt, führt daher immer zu einem Widerspruch, womit limn→∞ g(yn ) = g(y) gezeigt ist. Bemerkung: Für eine stetige und streng monotone Funktion f : I → R kann man die Umkehrfunktion auch dann bilden, wenn I ein Intervall ist, das nicht beschränkt und abgeschlossen ist. Das soll an Beispielen erklärt werden. Sei I = [0, ∞) und f : I → R die Funktion f (x) = x2 . Sie ist stetig und streng monoton wachsend. Für n ≥ 1 sei In = [0, n] und Jn = [0, n2 ]. Wegen f (0) = 0 und f (n) = n2 folgt aus Satz 1.14, dass die eindeutig bestimmte Umkehrfunktion g von Jn nach In definiert ist. Da n beliebig groß gewählt werden kann, ist g von J = [0, ∞) nach I = [0, ∞) definiert. Noch ein Beispiel: Sei I = (0, ∞) und f : I → R die Funktion f (x) = x13 . Sie ist stetig und streng monoton fallend. Für n ≥ 1 sei In = [ n1 , n] und Jn = [ n13 , n3 ]. Wegen f ( n1 ) = n3 und f (n) = n13 folgt aus Satz 1.14, dass die eindeutig bestimmte Umkehrfunktion g von Jn nach In definiert ist. Da n beliebig groß gewählt werden kann, ist g von J = (0, ∞) nach I = (0, ∞) definiert. 8. Potenzfunktion Zuerst behandeln wir Potenzfunktionen f (x) = xm mit ganzzahligen Exponenten m. Um rationale Exponenten einführen zu können, definieren wir dann die m-te Wurzel einer positiven reellen Zahl mit Hilfe der Umkehrfunktion. Wir haben die Quadratwurzel bereits mit Hilfe der Intervallschachtelungseigenschaft definiert, mit der Umkehrfunktion kann man jedoch einfacher arbeiten und auch höhere Wurzeln leicht definieren. Definition: Sei a > 0. Für m ∈ N definieren wir am als m-faches Produkt, wir setzen a0 = 1, und a−m definieren wir als a1m . Satz 1.15: Sei a > 0 und b > 0. Für m und n in Z gilt dann (a) am bm = (ab)m (b) am+n = am an (c) (am )n = amn Beweis: Den Beweis führt man durch Anwenden der Definition mit Hilfe entsprechender Fallunterscheidungen. Ist m > 0, dann ist am = a · a · . . . · a und bm = b · b · . . . · b, wobei rechts jeweils ein m-faches Produkt steht. Ebenso gilt (ab)m = ab · ab · . . . · ab. Daraus erkennt man, dass (a) für positives m richtig ist. Mit Hilfe dieses Resultats folgt dann 1 −m a−m b−m = a1m b1m = (ab) , sodass (a) auch für negative Exponenten gilt. Für m = (ab) m = 0 wird (a) zu 1 = 1. Sind m und n beide ≥ 0, dann ist sowohl am+n als auch am an das m + n-fache Produkt a · a · . . . · a, woraus (b) für nicht negative m und n folgt. Ist m ≥ 0 und n < 0, dann ist am an ein Bruch, dessen Zähler das m-fache Produkt a · a · . . . · a (oder 1, wenn m = 0) ist, und dessen Nenner das |n|-fache Produkt a · a · . . . · a ist. Kürzt man so viele a wie möglich weg, dann bleibt am+n übrig. Analog läßt sich (b) auch für die Fälle m < 0, n ≥ 0 und m < 0, n < 0 nachprüfen. Franz Hofbauer 21 Ist n > 0, dann ist (am )n das n-fache Produkt am · am · . . . · am . Durch wiederholtes Anwenden von (b) wird das zu am+m+···+m = amn , womit (c) für n > 0 gezeigt ist. Mit 1 Hilfe dieses Resultats folgt dann (am )−n = (am1 )n = amn = a−mn = am(−n) . Für n = 0 wird (c) zu 1 = 1. Der folgende Satz gibt eine Äquivalenzumformung, die sehr nützlich sein wird. Satz 1.16: Für a, b ∈ [0, ∞) und n ∈ N gilt a < b ⇔ an < bn und a = b ⇔ an = bn . Beweis: Wenn a = b = 0 gilt, dann auch an = bn = 0, sodass die Äquivalenzen gelten. Wir können also a > 0 oder b > 0 annehmen. Sei c = an−1 +an−2 b+· · ·+abn−2 +bn−1 . Es gilt c > 0. Wir verwenden die Formel an − bn = (a − b)(an−1 + an−2 b + · · · + abn−2 + bn−1 ). Damit sieht man, dass an − bn = (a − b)c = 0 genau dann gilt, wenn a − b = 0 ist, und an − bn = (a − b)c < 0 genau dann, wenn a − b < 0 ist. Sei n ∈ N. Die Funktion f (x) = xn von [0, ∞) nach R ist stetig und wegen Satz 1.16 auch streng monoton wachsend. Der Wertebereich von f das Intervall [0, ∞) und es existiert die √ Umkehrfunktion g : [0, ∞) → [0, ∞). Wir schreiben n y für g(y) und nennen diese Zahl √ √ die n-te Wurzel aus y. Es gilt ( n y)n = y und n xn = x. Satz 1.17: Sei x > 0 beliebig. Seien m, m̃ ∈ Z und n, ñ ∈ N. Wenn √ √ ñ gilt auch n xm = xm̃ . m n = m̃ ñ gilt, dann Beweis: Um zu dieser Schlussfolgerung zu kommen, gehen wir schrittweise vor. m n = m̃ ñ ⇒ mñ = m̃n ⇒ xmñ = xm̃n ⇒ (xm )ñ = (xm̃ )n √ √ ñ ⇒ ( n xm )nñ = ( xm̃ )ñn √ √ ñ ⇒ n xm = xm̃ wegen Satz 1.15 (c) Definition der Wurzel und Satz 1.15 (c) wegen Satz 1.16 Damit sind wir beim gewünschten Ergebnis angelangt. Jetzt können wir die Potenzfunktion mit rationalen Exponenten definieren. Definition: Sei x > 0, q ∈ Q und m n√ irgendeine Darstellung von q als Bruch mit m ∈ Z q und n ∈ N. Wir definieren x durch n xm , wobei es gleichgültig ist, welche Darstellung m n von q gewählt wurde. m Aus dieser Definition und der Definition der Wurzel folgt (x n )n = xm . Nun können wir auch Rechenregeln für rationale Exponenten herleiten. Satz 1.18: Für p, q ∈ Q und a und b in [0, ∞) gilt (a) ap bp = (ab)p (b) ap+q = ap aq (c) (ap )q = apq Beweis: Unter Verwendung von Satz 1.15 und Satz 1.16 führen wir diese Formeln durch Äquivalenzumformungen auf bekannte Formeln zurück. Um (a) zu zeigen, sei p = m n eine Darstellung von p als Bruch. Dann gilt ap bp = (ab)p ⇔ (ap bp )n = ((ab)p )n ⇔ (ap )n (bp )n = ((ab)p )n ⇔ am bm = (ab)m Da diese letzte Gleichung aus Satz 1.15 bekannt ist, ist (a) bewiesen. Um (b) zu zeigen, k wählen wir p = m n und q = n als Brüche mit gleichem Nenner. Dann gilt ap+q = ap aq ⇔ (ap+q )n = (ap aq )n ⇔ (ap+q )n = (ap )n (aq )n ⇔ am+k = am ak 22 Reelle Zahlen und stetige Funktionen womit wir (b) ebenfalls auf eine Formel aus Satz 1.15 zurückgeführt haben. Um auch die k letzte Formel zu erhalten, wählen wir p = m n und q = l und formen um (ap )q = apq ⇔ (((ap )q )l )n = (apq )ln ⇔ (ap )kn = amk ⇔ ((ap )n )k = amk ⇔ (am )k = amk womit auch (c) auf Satz 1.15 zurückgeführt ist. Zum Abschluss dieses Kapitels behandeln wir noch ein geometrisches Problem. Wir √ berechnen die Länge eines Kreisbogens. Dazu brauchen wir die Wurzelfunktion x 7→ x, die wegen Satz 1.14 stetig ist. Wir haben gesehen, dass die Fläche eines Kreises mit Radius 1 eine reelle Zahl ist, die wir π nennen. Die Fläche eines Kreises mit Radius r ist dann das r2 -fache, also r2 π. Ein Kreissektor mit Winkel α ist ein entsprechender Teil des α 2 Kreises und hat Fläche A = 360 0 r π. Wir wollen die Länge b des Bogens eines Kreissektors bestimmen. Dazu müssen wir die Bogenlänge b definieren. Seien P0 , P1 , . . . , Pn Punkte auf dem Kreisbogen, die den Bogen in n gleiche Teile unterteilen, wobei P0 und Pn die Endpunkte des Bogens sind. Die Sehnen Pk−1 Pk haben alle die gleiche Länge sn , sodass nsn die Länge des gesamten Polygonzuges ist. Wir definieren b = limn→∞ nsn . Satz 1.19: Sei A die Fläche eines Kreissektors in einem Kreis mit Radius r und b die Länge des zugehörigen Kreisbogens. Dann gilt A = 12 rb. Beweis: Sei M der Kreismittelpunkt und seien Pk−1 und Pk zwei aufeinanderfolgende Punkte auf dem Kreisbogen im Abstand sn . Sei An die Fläche des Kreissektors, die zwischen den Radien M Pk−1 und M Pk liegt, sodass A = nAn folgt. Als Fläche √ des Dreiecks Pk−1 M Pk ergibt Pk S sn r r2 − 14 s2n . Da sie kleiner als An √ Pk−1 ist, folgt 21 nsn r2 − 14 s2n ≤ nAn = A. Sei S der Schnittpunkt der beiden Tangenten an den Kreis in den Punkten Pk−1 und M Pk . Dann ist An kleiner als die Fläche des Vierecks Pk−1 M Pk S, die 12 sn · |M S| √ 2 beträgt. Nach dem Kathetensatz für das rechtwinkelige Dreieck gilt r = |M S| · r2 − 14 s2n . 2 Es folgt A = nAn ≤ 21 nsn √ 2r 1 2 . Damit haben wir gezeigt r − 4 sn √ /√ 2A 1 2 2 r − 4 sn ≤ nsn ≤ 2A r2 − 41 s2n r2 sich 21 sn Wegen limn→∞ sn = 0 folgt limn→∞ r2 − 41 s2n = r2 aus Satz 1.6. Da die Funktion f (x) = √ √ x stetig ist, folgt limn→∞ r2 − 14 s2n = r aus Satz 1.9. Wegen Satz 1.6 folgt daraus √ /√ 2A 2A 1 2 2 lim r2 r − 4 sn = r und lim 2A r2 − 14 s2n = 2A r n→∞ n→∞ Aus Satz 1.7 erhalten wir, dass limn→∞ nsn existiert und gleich 2A r ist. Da die Fläche eines Kreises mit Radius r gleich r2 π ist, ist 2r r2 π = 2rπ nach Satz 1.19 der Umfang des Kreises. Bei der Definition der trigonometrischen Funktionen werden wir die Winkel durch die Länge des entsprechenden Bogens des Einheitskreises messen. Aus 2πα dem Umfang 2π des Einheitskreises berechnet man das Bogenmaß 360 0 für den Winkel α. II. Differenzierbarkeit Wir definieren die Ableitung einer Funktion und verwenden sie, um das Monotonieverhalten dieser Funktion zu untersuchen. Daraus ergeben sich Methoden, um Maxima und Minima zu berechnen und um Gleichungen und Ungleichungen zu beweisen. Weiters werden die trigonometrischen Funktionen und die Exponentialfunktion eigeführt. 1. Grenzwerte von Funktionen Es kann vorkommen, dass Funktionen in einem isolierten Punkt nicht definiert sind. Sei D ein offenes Intervall, das auch unbeschränkt sein kann, also auch (a, ∞) oder (−∞, b) oder ganz R. Sei x ∈ D und Dx = D \ {x}. Wir nehmen an, dass die Funktion f auf Dx definiert ist und versuchen f im Punkt x sinnvoll zu ergänzen. Die nebenstehende Zeichnung zeigt den Graph einer Funktion, die im Punkt x = 2 eine Sprungstelle aufweist. Man kann natürlich f (x) irgendwie festlegen, aber ein sinnvoller Wert ist wohl der, gegen den f (y) strebt, wenn y gegen x geht. Für die Funktion in der nebenstehenden Zeichnung strebt aber f (y) gegen verschiedene Werte, je nachdem, ob y von links oder von rechts an x herankommt. Es gibt keinen Grenzwert. Deshalb ist es nicht möglich den Funktionswert bei x so festzulegen, dass die Lücke im Graph x gesclossen wird. Wir sind bei dem Problem angelangt, zuerst einmal den Grenzwert von f (y) für y gegen x zu definieren. Wir gehen analog vor, wie bei der Definition des Grenzwerts einer Folge. Soll u der Grenzwert der Funktion f im Punkt x sein und gibt man eine ε-Umgebung von u vor, dann muss der Funktionswert f (y) in dieser ε-Umgebung liegen, wenn y nur nahe genug bei x liegt. Daraus ergibt sich die Definition des Grenzwerts. Definition: Sei D ein offenes Intervall, x ∈ D und f auf Dx = D \ {x} definiert. Man nennt u den Grenzwert der Funktion f im Punkt x, wenn für jedes ε > 0 ein δ > 0 existiert, sodass |f (y) − u| < ε für alle y ∈ (x − δ, x + δ) ∩ Dx gilt. Man schreibt limy→x f (y) = u. Der Grenzwert einer Funktion ist eindeutig bestimmt. Das kann man sich genauso überlegen, wie wir es für Folgen getan haben. Die Funktion f sei auch im Punkt x definiert. Dann gilt limy→x f (y) = f (x) genau dann, wenn f im Punkt x stetig ist, wie ein Vergleich der Definitionen von Grenzwert und Stetigkeit zeigt. Wir verwenden das im folgendes Beispiel. Beispiel: Die Funktion f (y) = √ 1− 1+y y ist auf dem Intervall D = (−1, 1) definiert, außer im Punkt x = 0. Dort ist der Nenner des Bruches null. Wir berechnen limy→0 √ 1− 1+y . y 1−(1+y) −1 −1 √ = 1+√ . Die Funktion g(y) = 1+√ ist auf ganz D Für y ∈ Dx gilt f (y) = y(1+ 1+y) 1+y 1+y definiert und wegen Satz 1.10 auch stetig, also eine stetige Fortsetzung von f auf ganz D. Da f (y) = g(y) für y ∈ Dx gilt, erhalten wir limy→0 f (y) = limy→0 g(y) = g(0) = − 21 . 24 Differenzierbarkeit Wie wir es schon bei der Stetigkeit von Funktionen getan haben, charakterisieren wir Grenzwerte von Funktionen durch Grenzwerte von Folgen. Satz 2.1: Sei D ein offenes Intervall, x ∈ D und f auf Dx = D \ {x} definiert. Dann sind äquivalent (a) limy→x f (y) = u (b) für jede Folge (xn )n≥1 in Dx mit limn→∞ xn = x gilt limn→∞ f (xn ) = u. Beweis: Der Beweis besteht aus zwei Teilen. Wir beginnen mit (a) ⇒ (b). Unter der Voraussetzung limy→x f (y) = u müssen wir limn→∞ f (xn ) = u zeigen. Wir wählen ε > 0 beliebig und suchen n0 . Wegen limy→x f (y) = u gibt es ein δ > 0, sodass |f (y) − u| < ε für alle y ∈ (x − δ, x + δ) ∩ Dx gilt. Wegen limn→∞ xn = x finden wir jetzt ein n0 , sodass xn ∈ (x − δ, x + δ) für alle n ≥ n0 gilt. Da die Folge (xn )n≥1 auch in Dx liegt, erhalten wir |f (xn ) − u| < ε für alle n ≥ n0 , womit limn→∞ f (xn ) = u gezeigt ist. Wir zeigen (b) ⇒ (a) indirekt. Sei also (a) nicht erfüllt, das heißt limy→x f (y) = u gilt nicht. Es existiert ein ε > 0, sodass für jedes δ > 0 ein y ∈ (x − δ, x + δ) ∩ Dx existiert mit |f (y) − u| ≥ ε. Wir wählen δ = n1 und finden ein yn ∈ (x − n1 , x + n1 ) ∩ Dx , sodass |f (yn ) − u| ≥ ε gilt. So haben wir eine Folge (yn )n≥1 in Dx gefunden, deren Grenzwert x ist, da ja |yn − x| < n1 für alle n ≥ 1 gilt. Andererseits kann limn→∞ f (yn ) = u nicht gelten, da f (yn ) für jedes n ≥ 1 außerhalb der ε-Umgebung von u liegt. Damit ist gezeigt, dass (b) nicht gilt. Um Grenzwerte zu berechnen, sind entsprechende Rechenregeln hilfreich. Diese sind dieselben wie die Rechenregeln für Grenzwerte von Folgen. Mit Hilfe des letzten Satzes können wir die Rechenregeln leicht übertragen. Satz 2.2: Sei D ein offenes Intervall und x ∈ D. Die Funktionen f und g seien auf Dx definiert. Weiters sollen die Grenzwerte limy→x f (y) = a und limy→x g(y) = b existieren. (a) Es gilt limy→x f (y) + g(y) = a + b. (b) Es gilt limy→x f (y)g(y) = ab. (y) (c) Ist g(y) ̸= 0 für alle y ∈ Dx und b ̸= 0, dann gilt limy→x fg(y) = ab . Beweis: Sei (xn )n≥1 eine beliebige Folge in Dx mit limn→∞ xn = x. Wegen Satz 2.1 gilt limn→∞ f (xn ) = a und limn→∞ g(xn ) = b. Es folgt limn→∞ f (xn ) + g(xn ) = a + b und limn→∞ f (xn )g(xn ) = ab wegen Satz 1.6 und, wenn b ̸= 0 und g(y) ̸= 0 gilt für alle (xn ) y ∈ Dx , auch limn→∞ fg(x = ab . Wegen Satz 2.1 ist dann limy→x f (y) + g(y) = a + b n) und limy→x f (y)g(y) = ab gezeigt und, wenn b ̸= 0 und g(y) ̸= 0 gilt für alle y ∈ Dx , auch (y) limy→x fg(y) = ab . Auch der folgende Satz ergibt sich aus dem entsprechenden Satz für Folgen. Satz 2.3: Sei D ein offenes Intervall und x ∈ D. Seien f , g und h Funktionen, die auf Dx definiert sind. Wenn limy→x f (y) = limy→x g(y) = a gilt und f (y) ≤ h(y) ≤ g(y) für alle y ∈ Dx , dann existiert auch limy→x h(y) und ist ebenfalls gleich a. Beweis: Sei (xn )n≥1 eine beliebige Folge in Dx mit limn→∞ xn = x. Wegen Satz 2.1 gilt limn→∞ f (xn ) = a und limn→∞ g(xn ) = a. Weiters folgt f (xn ) ≤ h(xn ) ≤ g(xn ) für alle n ≥ 1 aus den Voraussetzungen. Nach Satz 1.7 haben wir dann auch limn→∞ h(xn ) = a. Wegen Satz 2.1 ist damit limy→x h(y) = a gezeigt. Franz Hofbauer 25 2. Die Ableitung Die Ableitung einer Funktion im Punkt x ist der Anstieg der Tangente an den Graphen von f im Punkt x, wenn diese existiert. Wir erhalten diesen Anstieg als Grenzwert der Anstiege von Sekanten. Sei D ein offenes Intervall, auf dem f definiert ist, und sei x ∈ D. Ist y ebenfalls in D und ungleich x, so erhält man den Anstieg der Sekante, die den Punkt mit Koordinaten y und f (y) und den mit Koordinaten x und f (x) verbindet, als (x) den Quotienten f (y)−f . Läßt man jetzt y gegen x wandern, dann wird die Sekante zur y−x Tangente im Punkt x. Der Grenzwert des Anstiegs der Sekante wird zum Anstieg der (x) Tangente, also zur Ableitung der Funktion im Punkt x. Da die Funktion y 7→ f (y)−f y−x für alle y ∈ Dx definiert ist, kann man die Grenzwertdefinition aus dem letzten Kapitel anwenden. Definition: Sei f auf dem offenen Intervall D definiert und x ∈ D. Existiert der Grenz(x) wert limy→x f (y)−f , dann sagt man, die Funktion f ist im Punkt x differenzierbar und y−x nennt diesen Grenzwert die Ableitung f ′ (x) der Funktion f im Punkt x. Manchmal ersetzt man in dieser Definition der Ableitung y durch x + h. Dann ist y → x (x) äquivalent zu h → 0. Daher kann man auch f ′ (x) = limh→0 f (x+h)−f schreiben. h Beispiel: Wir berechnen die Ableitungen der Funktionen f (x) = xm mit m ∈ Z. Für (x) m = 0 ist f eine konstante Funktion. Für konstante Funktionen f gilt f (y)−f = 0 für y−x ′ alle x und y, also auch f (x) = 0 für alle x. Sei k ∈ N. Die Funktion f (x) = xk ist auf D = R definiert. Wir berechnen die Ableitung von f im Punkt x. Sei g(y) = y k−1 + y k−2 x + y k−3 x2 + · · · + yxk−2 + xk−1 . Für y ̸= x k k −xk −xk gilt y y−x = g(y). Da g im Punkt x stetig ist, folgt limy→x y y−x = g(x) = kxk−1 . Damit ist f ′ (x) = kxk−1 berechnet. Sei k ∈ N. Die Funktion f (x) = x−k ist auf D = R \ {0} definiert. Wir berechnen die Ableitung von f im Punkt x ̸= 0. Sind x und y in D und ist x ̸= y, dann gilt k k f (y)−f (x) 1 y −x = − k k y−x y−x . Mit Hilfe des obigen Resultats und der Rechenregeln aus Satz 2.2 x y folgt limy→x f (y)−f (x) y−x = limy→x − xk1yk limy→x y k −xk y−x = − x12k kxk−1 = −kx−k−1 . Man kann diese Ergebnisse so zusammenfassen. Für m ∈ Z hat f (x) = xm die Ableitung f ′ (x) = mxm−1 für alle x ∈ D, wobei der Definitionsbereich D gleich R ist für m ≥ 0 und gleich R \ {0} für m < 0. Um mit Ableitungen arbeiten zu können, braucht man entsprechende Rechenregeln. Zuvor klären wir noch den Zusammenhang zwischen Stetigkeit und Differenzierbarkeit. Satz 2.4: Sei f auf dem offenen Intervall D definiert und x ∈ D. Wenn f im Punkt x differenzierbar ist, dann ist f im Punkt x auch stetig. (x) Beweis: Es existiert ein α > 0, sodass | f (y)−f −f ′ (x)| < 1 für alle y ∈ (x−α, x+α)∩Dx y−x gilt, da f im Punkt x differenzierbar ist. Sei c = |f ′ (x)| + 1. Mit Hilfe der Dreiecksun(x) gleichung folgt | f (y)−f | < 1 + |f ′ (x)| = c für alle y ∈ (x − α, x + α) ∩ Dx . Somit gilt y−x |f (y) − f (x)| ≤ c|y − x| für alle y ∈ (x − α, x + α) ∩ D. Ist ε > 0 vorgegeben, so wählen wir δ = min(α, εc ). Für alle y ∈ (x − δ, x + δ) ∩ D gilt dann |f (y) − f (x)| ≤ c|y − x| < ε. Damit ist die Stetigkeit von f im Punkt x gezeigt. 26 Differenzierbarkeit Satz 2.5 (Rechenregeln für die Ableitung) Seien f und g auf einem offenen Intervall D definiert und x ∈ D. Seien c und d in R. Dann gilt: (a) Linearität: Wenn f ′ (x) und g ′ (x) existieren, dann ist auch die Funktion cf + dg im Punkt x differenzierbar und es gilt (cf + dg)′ (x) = cf ′ (x) + dg ′ (x). (b) Produktregel: Wenn f ′ (x) und g ′ (x) existieren, dann ist auch die Funktion f g im Punkt x differenzierbar und es gilt (f g)′ (x) = f (x)g ′ (x) + f ′ (x)g(x). (c) Quotientenregel: Wenn f ′ (x) und g ′ (x) existieren und g(y) ̸= 0 ist für y ∈ D, dann ist 1 auch die Funktion fg im Punkt x differenzierbar und es gilt ( fg )′ (x) = f ′ (x) g(x) −g ′ (x) gf2(x) (x) . Beweis: Um (a) zu beweisen, gehen wir von folgender Gleichung aus f (y) − f (x) g(y) − g(x) (cf + dg)(y) − (cf + dg)(x) =c +d y−x y−x y−x ′ ′ Da f (x) und g (x) existieren, existiert wegen Satz 2.2 auch der Grenzwert der rechten Seite dieser Gleichung für y → x und ist gleich cf ′ (x) + dg ′ (x). Daher existiert auch der Grenzwert der linken Seite und ist ebenfalls gleich cf ′ (x) + dg ′ (x), womit (a) gezeigt ist. Um (b) zu zeigen, gehen wir von folgender Gleichung aus f (y)g(y) − f (x)g(x) g(y) − g(x) f (y) − f (x) = f (y) + g(x) y−x y−x y−x Nach Satz 2.4 ist f im Punkt x stetig, da f ′ (x) existiert. Also gilt limy→x f (y) = f (x). Da auch g ′ (x) existiert, existiert wegen Satz 2.2 der Grenzwert der rechten Seite dieser Gleichung für y → x und ist gleich f (x)g ′ (x) + f ′ (x)g(x). Daher existiert auch der Grenzwert der linken Seite und ist ebenfalls f (x)g ′ (x) + f ′ (x)g(x), womit (b) gezeigt ist. Um (c) zu zeigen, gehen wir von folgender Gleichung aus f (y)/g(y) − f (x)/g(x) f (y) − f (x) 1 g(y) − g(x) f (x) = − y−x y−x g(y) y−x g(x)g(y) ′ Nach Satz 2.4 ist g in x stetig, da g (x) existiert. Es folgt limy→x g(y) = g(x). Da auch f ′ (x) existiert und g(x) ̸= 0 gilt, existiert wegen Satz 2.2 der Grenzwert der rechten Seite 1 dieser Gleichung für y → x und ist gleich f ′ (x) g(x) − g ′ (x) gf2(x) (x) . Daher existiert auch der 1 − g ′ (x) gf2(x) Grenzwert der linken Seite und ist ebenfalls f ′ (x) g(x) (x) . Das beweist (c). Satz 2.6 (Kettenregel) Sei f auf einem offenen Intervall D definiert und x ∈ D. Sei g auf einem offenen Intervall definiert, das f (D) enthält. Wenn g ′ (f (x)) und f ′ (x) existieren, dann existiert auch (g ◦ f )′ (x) und es gilt (g ◦ f )′ (x) = g ′ (f (x))f ′ (x). (x) (x)) f (y)−f (x) Beweis: Es gilt limy→x g◦f (y)−g◦f = limy→x g(ff(y))−g(f = g ′ (f (x))f ′ (x), y−x (y)−f (x) y−x da mit y → x auch f (y) gegen f (x) geht (nach Satz 2.4 ist f ja im Punkt x stetig). Damit ist die Kettenregel bereits gezeigt. Allerdings hat dieser Beweis den Schönheitsfehler, dass man nicht weiß, ob f (y) − f (x) ungleich 0 ist. Wir gehen daher folgendermaßen vor. Sei φ(t) = g(t)−g(f (x)) t−f (x) für t ̸= f (x) und φ(t) = g ′ (f (x)) für t = f (x). Dann gilt g ◦ f (y) − g ◦ f (x) f (y) − f (x) = φ(f (y)) y−x y−x Die Funktion φ ist im Punkt f (x) stetig, da die Existenz von g ′ (f (x)) vorausgesetzt wird (x)) = g ′ (f (x)) = φ(f (x)) gilt. Da f ′ (x) existiert und somit f und daher limt→f (x) g(t)−g(f t−f (x) im Punkt x stetig ist, folgt die Stetigkeit von φ ◦ f im Punkt x aus Satz 1.11, und daraus wieder limy→x φ(f (y)) = φ(f (x)) = g ′ (f (x)). Der Grenzwert der rechten Seite in obiger Franz Hofbauer 27 Gleichung für y → x ist daher gleich g ′ (f (x))f ′ (x). Also existiert auch der Grenzwert der linken Seite und ist ebenfalls gleich g ′ (f (x))f ′ (x), das heißt (g ◦ f )′ (x) = g ′ (f (x))f ′ (x). Mit Hilfe dieser Rechenregeln ist es leicht, die Ableitung vieler Funktionen zu berechnen. Für f (x) = xk haben wir f ′ (x) = kxk−1 oben berechnet. Mit Hilfe von Satz 2.5 (a) erhalten wir die Ableitung eines Polynoms. Für g(x) = cn xn + cn−1 xn−1 + · · · + c1 x + c0 gilt g ′ (x) = cn nxn−1 + cn−1 (n − 1)xn−2 + · · · + c1 . Mit Hilfe von Satz 2.5 (c) lassen sich dann rationale Funktionen differenzieren. Weitere Ableitungen findet man mit Hilfe des folgenden Satzes über die Ableitung der Umkehrfunktion. Satz 2.7: Sei I ⊆ R ein offenes Intervall und f : I → R differenzierbar und streng monoton wachsend (fallend). Sei J = f (I) und g : J → I die Umkehrfunktion von f . Ist x ∈ J und 1 f ′ (g(x)) ̸= 0, dann existiert g ′ (x) und es gilt g ′ (x) = f ′ (g(x)) . Beweis: Nach Satz 2.4 ist f stetig, sodass die Umkehrfunktion wegen Satz 1.14 existiert. Es gilt f (g(x)) = x und f (g(y)) = y für alle x und y in J. Es folgt 1 g(y) − g(x) = f (g(y))−f (g(x)) y−x g(y)−g(x) für y ̸= x, da g nach Satz 1.14 streng monoton und g(y) − g(x) somit ungleich 0 ist. Nach Satz 1.14 ist g auch stetig, sodass mit y → x auch g(y) gegen g(x) geht. Da die Existenz (g(x)) = f ′ (g(x)). Wegen von f ′ (g(x)) vorausgesetzt wird, erhalten wir limy→x f (g(y))−f g(y)−g(x) f ′ (g(x)) = ̸ 0 folgt limy→x g(y)−g(x) = y−x 1 existiert g ′ (x) und ist gleich f ′ (g(x)) . 1 f ′ (g(x)) aus obiger Gleichung und Satz 2.2. Somit √ Beispiel: Sei n ∈ N. Die Wurzelfunktion g(x) = n x mit Definitionsbereich D = (0, ∞) ist die Umkehrfunktion der Funktion f (x) = xn , die ebenfalls Definitionsbereich D hat. 1 1 = n1 x n −1 für x ∈ D aus Da f ′ (x) = nxn−1 ̸= 0 für x ∈ D gilt, folgt g ′ (x) = n( √ n x)n−1 Satz 2.7. Nun können wir auch die Potenzfunktion h(x) = xq mit Definitionsbereich D differenzieren, wobei q = m m ∈ Z und n ∈ N. Wegen h(x) = (g(x))m folgt aus n ist mit √ 1 1 1 q− n x n −1 = qxq−1 für x ∈ D gilt. der Kettenregel, dass h′ (x) = m( n x)m−1 n1 x n −1 = m nx 3. Monotonieverhalten von Funktionen Eine Funktion kann auf gewissen Abschnitten ihres Definitionsbereichs monoton wachsend sein und auf anderen monoton fallend. Dieses Monotonieverhalten kann man mit Hilfe der Ableitung untersuchen. Der Satz, den man dafür benötigt, ist der Mittelwertsatz, zu dessen Beweis man ein Resultat über Extremwerte von stetigen Funktionen braucht. Ein Extremwert kann ein Maximum sein, das ist der größte Wert, den die Funktion annimmt, oder ein Minimum, das ist der kleinste Wert, den die Funktion annimmt. Diese Bezeichnungsweise ist analog zum Maximmum und Minimum von endlich vielen reellen Zahlen, wo Maximum und Minimum die größte und die kleinste dieser Zahlen bezeichnen. Satz 2.8: Seien a und b in R mit a < b. Jede stetige Funktion f : [a, b] → R ist beschränkt und nimmt ihr Maximum und ihr Minimum an, das heißt es gibt ein x0 ∈ [a, b], sodass f (x) ≤ f (x0 ) für alle x ∈ [a, b] gilt, und ein x1 ∈ [a, b], sodass f (x) ≥ f (x1 ) für alle x ∈ [a, b] gilt. Dieser Satz wird später bewiesen. Zum Beweis des Mittelwertsatzes brauchen wir noch einen weiteren Satz über die Ableitung einer Funktion in einem Extremwert. 28 Differenzierbarkeit Satz 2.9: Sei a < b. Wenn f : (a, b) → R differenzierbar ist mit einem Extremwert in x ∈ (a, b), dann gilt f ′ (x) = 0. Beweis: Der Extremwert in x sei ein Maximum. Dann gilt f (y) ≤ f (x) für alle y in (a, b). (x) Ist φ(y) = f (y)−f , dann gilt φ(y) ≥ 0 für y ∈ (a, x) und φ(y) ≤ 0 für y ∈ (x, b). Da die y−x ′ Existenz von f (x) vorausgesetzt wird, gilt auch limy→x φ(y) = f ′ (x). Sei α = x−a und xn = x − α 2 n für n ≥ 1. Dann ist (xn )n≥1 eine Folge im Intervall (a, x) mit limn→∞ xn = x und φ(xn ) ≥ 0. Wegen Satz 2.1 gilt limn→∞ φ(xn ) = f ′ (x), woraus f ′ (x) ≥ 0 wegen Satz 1.6 (a) folgt. β Sei β = b−x 2 und yn = x + n für n ≥ 1. Dann ist (yn )n≥1 eine Folge im Intervall (x, b) mit limn→∞ yn = x und φ(yn ) ≤ 0. Wegen Satz 2.1 gilt limn→∞ φ(yn ) = f ′ (x), woraus f ′ (x) ≤ 0 wegen Satz 1.6 (a) folgt. Somit ist f ′ (x) = 0 gezeigt. Der Beweis für ein Minimum verläuft analog. Satz 2.10 (Mittelwertsatz) Sei f : [a, b] → R stetig und auf dem offenen Intervall (a, b) (a) differenzierbar. Dann gibt es ein c ∈ (a, b) mit f ′ (c) = f (b)−f . b−a Beweis: Wir nehmen zuerst f (a) = f (b) = 0 an und zeigen, dass f ′ (c) = 0 für ein c ∈ (a, b) gilt. Ist f (x) = 0 für alle x dann auch f ′ (x) = 0 für alle x und man kann jedes x ∈ (a, b) als c wählen. Ansonsten liegt entweder ein Punkt, in dem das Maximum, oder ein Punkt, in dem das Minimum angenommen wird (Maximum und Minimum existieren nach Satz 2.8), in (a, b). Sei also c ∈ (a, b) ein Punkt, in dem f einen Extremwert hat. Nach Satz 2.9 gilt f ′ (c) = 0. (a) Um den allgemeinen Fall zu behandeln, sei g(x) = f (x) − f (a) − (x − a) f (b)−f . Dann b−a ist g : [a, b] → R stetig und in (a, b) differenzierbar. Es gilt g(a) = g(b) = 0. Nach dem bereits bewiesenen Spezialfall gibt es ein c ∈ (a, b) mit g ′ (c) = 0. Das aber heißt (a) = 0, was zu zeigen war. f ′ (c) − f (b)−f b−a Man kann den Mittelwertsatz auch geometrisch interpretieren. Verbindet man den Punkt mit Koordinaten a und f (a) und den Punkt mit Koordinaten b und (a) f (b) durch eine Gerade, so ist f (b)−f b−a ihr Anstieg. Der Mittelwertsatz besagt dann, dass es zwischen den Punkten a und b einen Punkt c gibt, sodass die Tangente im Punkt mit Koordinaten c und f (c) an den Graph von f parallel zu dieser Gerade (Sehne) liegt. Die nebenstehende Zeichnung zeigt ein Beispiel, wo es nicht c2 a c1 nur einen solchen Punkt c, sondern zwei b solche Punkte c1 und c2 gibt. Der Zusammenhang zwischen dem Monotonieverhalten einer Funktion und ihrer Ableitung ist offensichtlich. Dort, wo die Funktion monoton wachsend ist, hat die Tangente einen positiven Anstieg, sodass die Ableitung positiv ist. Dort, wo die Funktion monoton fallend ist, hat die Tangente einen negativen Anstieg, sodass die Ableitung negativ ist. Der Mittelwertsatz ermöglicht einen Beweis dieser Aussagen. Franz Hofbauer 29 Satz 2.11: Sei f : [a, b] → R stetig und in (a, b) differenzierbar. (a) Wenn f ′ (x) = 0 für alle x ∈ (a, b) gilt, dann ist f konstant. (b) Wenn f ′ (x) ≥ 0 für alle x ∈ (a, b) gilt, dann ist f monoton wachsend. (c) Wenn f ′ (x) > 0 für alle x ∈ (a, b) gilt, dann ist f streng monoton wachsend. (d) Wenn f ′ (x) ≤ 0 für alle x ∈ (a, b) gilt, dann ist f monoton fallend. (e) Wenn f ′ (x) < 0 für alle x ∈ (a, b) gilt, dann ist f streng monoton fallend. Beweis: Seien u und v beliebig in [a, b] mit u < v. Nach dem Mittelwertsatz gibt es ein c ∈ (u, v) ⊆ (a, b) mit f (v) − f (u) = (v − u)f ′ (c). Damit kann man jetzt die einzelnen Fälle behandeln. Im ersten Fall ist f ′ (c) = 0, also f (v) = f (u) für alle u und v in [a, b] und daher ist f konstant. Im zweiten Fall ist f ′ (c) ≥ 0, also f (v) ≥ f (u), und daher ist f monoton wachsend. Im dritten Fall ist f ′ (c) > 0, also f (v) > f (u), und daher ist f streng monoton wachsend. Ebenso lassen sich die anderen Fälle behandeln. Beispiel: Sei f (x) = x 1+x2 mit Definitionsbereich D = R. Es soll das Monotonieverhalten −x·2x 1−x von f bestimmt werden. Wir berechnen f ′ (x) = 1+x = (1+x 2 )2 mit Hilfe der Quo(1+x2 )2 tientenregel. Da (1 + x2 )2 > 0 für alle x gilt, hat f ′ (x) dasselbe Vorzeichen wie 1 − x2 . Somit gilt f ′ (x) < 0 für x ∈ (−∞, −1) und x ∈ (1, ∞) und f ′ (x) > 0 für x ∈ (−1, 1). Daher ist f auf dem Intervall (−∞, −1) streng monoton fallend, auf dem Intervall (−1, 1) streng monoton wachsend, und auf dem Intervall (1, ∞) wieder streng monoton fallend. Da die x-Achse eine Asymptote ist (der Grad des Zählerpolynoms ist kleiner als der Grad des Nennerpolynoms), hat man bereits eine gute Vorstellung, wie der Graph von f aussieht. √ Beispiel: Sei f (x) = 41 x2 − x2 + 3 mit Definitionsbereich D = R. Wir erhalten f ′ (x) = √ 1 ′ √ x √x x− . Um das Vorzeichen zu bestimmen, schreiben wir f (x) = ( x2 + 3−2) 2 2 2 x +3 2 x +3 als Produkt. Der erste Faktor ist genau dann positiv, wenn x ∈ (0, ∞) ist. Der zweite Faktor ist genau dann positiv, wenn x2 > 1 ist, also x ∈ (−∞, −1) ∪ (1, ∞) gilt. Daraus folgt dann, dass f ′ > 0 auf den Intervallen (−1, 0) und (1, ∞) und f ′ < 0 auf den Intervallen (−∞, −1) und (0, 1) gilt. Auf (−∞, −1) ist daher f streng monoton fallend, auf (−1, 0) streng monoton wachsend, auf (0, 1) wieder streng monoton fallend und schließlich auf (1, ∞) wieder streng monoton wachsend. 2 2 Sei D ein Intervall und f : D → R eine Funktion. Für a und b in D sei ℓa,b (x) = − a) + f (a) die Gerade (Sehne) durch die Punkte (a, f (a)) und (b, f (b)). Die Funktion f heißt konvex, wenn f (x) ≤ ℓa,b (x) für alle a und b in D und x ∈ (a, b) gilt, das heißt die Sehne liegt immer oberhalb der Funktion. Die Funktion f heißt konkav, wenn f (x) ≥ ℓa,b (x) für alle a und b in D und x ∈ (a, b) gilt, das heißt die Sehne liegt immer unterhalb der Funktion. f (b)−f (a) (x b−a Satz 2.12: Sei D ein offenes Intervall und f : D → R eine zweimal differenzierbare Funktion. Wenn f ′′ (y) ≤ 0 für alle y ∈ D gilt, dann ist f konkav. Wenn f ′′ (y) ≥ 0 für alle y ∈ D gilt, dann ist f konvex. Beweis: Für a, b ∈ D und a < x < b folgt ℓa,b (x)−f (x) = = (x−a)(b−x)f ′ (y2 )−(b−x)(x−a)f ′ (y1 ) b−a (x−a)(f (b)−f (x))−(b−x)(f (x)−f (a)) b−a mit Hilfe von Satz 2.10, wobei a < y1 < x < y2 < b gilt. ′′ 2 −y1 )f (y) , wobei Nochmaliges Anwenden von Satz 2.10 ergibt ℓa,b (x) − f (x) = (x−a)(b−x)(y b−a ′′ y1 < y < y2 gilt. Ist f (y) ≤ 0 für alle y ∈ D, dann ist ℓa,b (x) − f (x) ≤ 0 gezeigt, das heißt f ist konkav. Ist f ′′ (y) ≥ 0 für alle y ∈ D, dann ist ℓa,b (x) − f (x) ≥ 0 gezeigt, das heißt f ist konvex. 30 Differenzierbarkeit 4. Extremwerte Eine Anwendung der Untersuchungen über das Monotonieverhalten von Funktionen im letzten Kapitel ist die Berechnung von lokalen Extremwerten von differenzierbaren Funktionen. Man sagt, dass die Funktion f im Punkt x ein lokales Minimum hat, wenn ein ε > 0 existiert, sodass f (y) > f (x) für alle y ∈ (x − ε, x + ε) \ {x} gilt. Analog spricht man von einem lokalen Maximum im Punkt x, wenn ein ε > 0 existiert, sodass f (y) < f (x) für alle y ∈ (x − ε, x + ε) \ {x} gilt. Oft verwendet man folgenden Satz. Satz 2.13: Sei f : (a, b) → R zweimal differenzierbar und x ∈ (a, b). Wenn f ′ (x) = 0 und f ′′ (x) > 0, dann hat f im Punkte x ein lokales Minimum. Wenn f ′ (x) = 0 und f ′′ (x) < 0, dann hat f im Punkte x ein lokales Maximum. Beweis: Wir behandeln nur den Fall f ′′ (x) > 0. Sei α ∈ (0, f ′′ (x)). Wegen f ′′ (x) = ′ ′ ′ ′ (x) (x) limy→x f (y)−f existiert ein ε > 0 mit f (y)−f ≥ α, wenn y ∈ (x − ε, x + ε) \ {x}. y−x y−x Wegen f ′ (x) = 0 haben wir also f ′ (y) y−x ≥ α > 0 für y ∈ (x − ε, x + ε) \ {x}. Für y ∈ (x − ε, x) gilt y − x < 0 und daher auch f ′ (y) < 0. Für y ∈ (x, x + ε) gilt y − x > 0 und daher auch f ′ (y) > 0. Daher ist f streng monoton fallend auf (x − ε, x) und streng monoton wachsend auf (x, x + ε), womit gezeigt ist, dass f (y) > f (x) für alle y ∈ (x − ε, x + ε) \ {x} gilt, also f ein lokales Minimum in x hat. Um festzustellen, ob eine Funktion in einer Nullstelle ihrer Ableitung ein Maximum oder ein Minimum hat, ist es nicht notwendig, die zweite Ableitung auszurechnen. Man kann auch das Vorzeichen der Ableitung in den Intervallen zwischen den berechneten Nullstellen der Ableitung bestimmen. Dann weiß man, auf welchen dieser Intervalle die Funktion wächst und auf welchen sie fällt, und erkennt so, wo sie ein lokales Maximum und wo sie ein lokales Minimum hat. Beispiel: Wir zeigen, dass unter allen Rechtecken mit gegebener Diagonale das Quadrat die größte Fläche hat. Sei d√die gegebene Länge der Diagonale. Ist x√ die eine Rechteckseite, 2 2 dann ist die andere gleich d − x√. Die Fläche des Rechtecks ist x d2 − x2 . Anstatt das Maximum der Funktion f (x) = x d2 − x2 zu suchen, berechnen wir es für die Funktion g(x) = f (x)2 = x2 (d2 − x2 ), da g und f ihr Maximum im selben Punkt annehmen. Wir √ ′ 2 3 erhalten√g (x) = 2d x−4x . Die Nullstellen dieser Ableitung sind x1 = −d/ 2,√x2 = 0 und x3 = √ d/ 2. Wegen g ′ (x) = −2x(2x2 −d2 ) ist g ′ negativ auf den Intervallen (d/ 2, ∞) und (−d/ 2, 0). Daher ist g dort streng monoton√fallend. Ebenso sieht man, dass g ′ positiv √ auf den Intervallen (−∞, −d/ 2) und (0, d/ 2) ist. Daher ist g dort streng monoton √ wachsend. Aus diesem Verhalten sieht man, dass g lokale Maxima in den Punkten d/ 2 √ und −d/ 2 hat und ein lokales Minimum im Punkt 0. Natürlich sind nur Seitenlängen √ x ∈ [0, d] sinnvoll. Wir haben√eine maximale Fläche, wenn x = d/ 2 ist. Die andere Rechteckseite ist dann auch d/ 2, sodass ein Quadrat vorliegt. Beispiel: Wir berechnen den kleinsten Abstand des Punktes (12, 15 2 ) von der Parabel 2 y = x . Das Quadrat des Abstandes dieses Punkts zu einem Punkt auf der Parabel ist 801 2 4 2 f (x) = (x − 12)2 + (x2 − 15 2 ) = x − 14x − 24x + 4 . Wir suchen lokale Minima und Maxima dieser Funktion. Es gilt f ′ (x) = 4(x3 − 7x − 6). Die Nullstellen dieser Ableitung sind x1 = 3, x2 = −1 und x3 = −2. Wir haben also f ′ (x) = 4(x − 3)(x + 1)(x + 2). Auf den Intervallen (−2, −1) und (3, ∞) ist f ′ positiv und f daher streng monoton wachsend. Auf den Intervallen (−∞, −2) und (−1, 3) ist f ′ negativ und f daher streng monoton Franz Hofbauer 31 fallend. Lokale Minima haben wir für x1 = 3 und x3 = −2. Für x2 = −1 liegt ein lokales √ 333 Maximum vor. Der Abstand zum Punkt (3, 9) beträgt 2 . Der Abstand zum Punkt √ (−2, 4) beträgt 449 2 . Daher hat der Punkt (3, 9) den kleinsten Abstand. Wandert man von diesem Punkt aus die Parabel entlang zum Punkt (−1, 1), so wird der Abstand immer größer. Hat man den Punkt (−1, 1) überschritten, dann wird der Abstand wieder kleiner, bis man den Punkt (−2, 4) erreicht. Nach Überschreiten dieses Punktes vergrößert sich der Abstand wieder. 5. Gleichungen und Ungleichungen Man kann die Methoden aus dem letzten Kapitel zum Beweis von Gleichungen und Ungleichungen verwenden. Beweist man, dass die Funktion f konstant ist, dann hat man die Gleichung f (x) = c für ein c ∈ R bewiesen. Beweist man, dass die Funktion f das Minimum c annimmt, dann hat man die Ungleichung f (x) ≥ c bewiesen. Als erste Anwendung dieser Methode wollen wir den sogenannten binomischen Lehrsatz behandeln. ( n) n! Dazu benötigen wir die Binomialkoeffizienten k = k!(n−k)! . ( ) ( ) ( ) ( ) Satz 2.14 (Binomischer Lehrsatz) Es gilt (1 + x)n = n0 + n1 x + n2 x2 + · · · + nn xn für alle x ∈ R und n ∈ N. ∑n ( ) Beweis: Dazu sei fn (x) = (1 + x)n − k=0 nk xk . Um den Satz zu beweisen, zeigen wir, dass fn (x) = 0( für ) alle (1) x ∈ R und n ∈ N gilt. Wir beginnen mit n = 1. Es gilt 1 f1 (x) = (1 + x) − 0 − 1 x = 0. Für n = 1 ist die Aussage also richtig. Bevor wir ( ) ( ) (n−1)! n! größere n behandeln, berechnen wir k nk = k k!(n−k)! = n (k−1)!(n−k)! = n n−1 k−1 und damit ( ) ( ) k−1 ∑n ∑n fn′ (x) = n(1 + x)n−1 − k=0 k nk xk−1 = n(1 + x)n−1 − k=1 n n−1 = nfn−1 (x). k−1 x ′ Ist fn−1 (x) = 0 für alle x gezeigt, dann folgt wegen ( ) fn (x) = nfn−1 (x) = 0, dass fn eine konstante Funktion ist, und wegen fn (0) = 1n − n0 = 0 folgt fn (x) = 0 für alle x. Damit ist die gesuchte Gleichung für alle n durch Induktion bewiesen. Mit Hilfe von Satz 2.14 können wir folgende Grenzwerte bestimmen. Satz 2.15: Es existieren folgende Grenzwerte √ n (a) limn→∞ √ x = 1 für alle x > 0 (b) limn→∞ n n = 1. m (c) limn→∞ nxn = 0 für alle m ∈ N und alle x > 1 √ Beweis: Um (a) zu zeigen, sei x ≥ 1. Wegen Satz 1.16 gilt n x ≥ 1. Läßt man auf der rechten Seite des binomischen Lehrsatzes alle Summanden außer dem zweiten weg, so folgt √ n (1 + y)n ≥ ny für n ≥ 1 und y ≥ 0. Setzt man in diese Ungleichung y = x − 1 ≥ 0 ein, √ √ x x n n so erhält man x ≤ 1 + n . Wir haben also 1 ≤ x ≤ 1 + n für n ≥ 1. Mit Hilfe von √ Satz 1.7 folgt daraus limn→∞ n x = 1. Sei jetzt x ∈ (0, 1). Für y = x1 gilt y > 1, sodass wir √ √ √ √ 1 limn→∞ n y = 1 schon gezeigt haben. Aus Satz 1.18 (a) folgt n x n y = 1, also n x = √ n y. √ Mit Hilfe von Satz 1.6 (d) erhalten wir limn→∞ n x = 1. Damit ist (a) erledigt. Wir zeigen (b). Läßt man auf der rechten Seite des Lehrsatzes alle Summan(n)binomischen n 2 den außer dem dritten weg, so folgt (1 + x) ≥ 2 x für n ≥ 2 und x ≥ 0. Indem man √ √ √ n n − 1 für x einsetzt, folgt wie oben, dass 1 ≤ n n ≤ 1√ + 2/(n − 1) für n ≥ 2 gilt. Da die Wurzelfunktion im Punkt 0 stetig ist, gilt lim√ 2/(n − 1) = 0 wegen Satz 1.9. n→∞ n Mit Hilfe von Satz 1.7 erhalten wir dann limn→∞ n = 1. 32 Differenzierbarkeit m n Um (c) zu zeigen, überlegen wir uns zuerst, dass limn→∞ n(n−1)...(n−m) = 0 gilt. Das 1 n n folgt wegen limn→∞ n = 0, limn→∞ n−1 = 1, . . . , limn→∞ n−m = 1, indem man das Produkt dieser Folgen bildet. Läßt man auf der rechten Seite des Lehrsatzes (n) binomischen n k alle Summanden außer dem k + 1-ten weg, so folgt (1 + y)( ≥ ) k y für n ≥ k und y ≥ 0. n (x − 1)m+1 für n ≥ m + 1 Setzt man y = x − 1 und k = m + 1, so ergibt sich xn ≥ m+1 und daraus 0 ≤ nm xn ≤ (m+1)! nm n(n−1)...(n−m) (x−1)m+1 . Wendet man Satz 1.7 an, so folgt (c). Die folgenden beiden Ungleichung brauchen wir, wenn wir die Exponentialfunktion und den Logarithmus behandeln. Satz 2.16: Für x ∈ R und n ∈ N mit n > −x gilt (1 + nx )n ≤ (1 + x n+1 . n+1 ) x n+1 Beweis: Wir untersuchen f (x) = (1 + n+1 ) /(1 + nx )n auf dem Intervall (−n, ∞). x x n Es gilt f ′ (x) = n(n+1) (1 + n+1 ) (1 + nx )−n−1 , das ist ≥ 0 für x ∈ (0, ∞) und ≤ 0 für x ∈ (−n, 0), sodass f auf [0, ∞) monoton wachsend und auf (−n, 0] monoton fallend ist. x n+1 Wegen f (0) = 1 folgt f (x) ≥ 1, das heißt (1 + nx )n ≤ (1 + n+1 ) für x ∈ (−n, ∞). √ √ Satz 2.17: Es gilt (n + 1)( n+1 x − 1) ≤ n( n x − 1) für alle n ∈ N und für x > 0. √ √ Beweis: Sei f (x) = n( n x − 1) − (n + 1)( n+1 x − 1) mit Definitionsbereich D = (0, ∞). 1 1 1 1 1 Wir berechnen die Ableitung f ′ (x) = n n1 x n −1 − (n + 1) n+1 x n+1 −1 = x n −1 − x n+1 −1 . 1 Wegen n1 − 1 > n+1 − 1 erhalten wir f ′ (x) < 0 für x ∈ (0, 1) und f ′ (x) > 0 für x ∈ (1, ∞). Wegen Satz 2.11 ist f auf (0, 1) monoton fallend und auf (1, ∞) monoton wachsend. Es gilt also f (x) ≥ f (1) für alle x > 0. Wegen f (1) = 0 ist das die gesuchte Ungleichung. Wir beweisen noch eine Verallgemeinerung der Cauchy-Schwarzschen Ungleichung. p Satz 2.18: Sei p > 1 und q = p−1 . Seien ai und bi für 1 ≤ i ≤ n reelle Zahlen. Dann gilt √∑n √∑n ∑n ∑n q die Hölder-Ungleichung i=1 ai bi ≤ i=1 |ai bi | ≤ p i=1 |ai |p q i=1 |bi | . Beweis: Für 0 < r < 1 sei f (x) = xr − rx − 1 + r mit Definitionsbereich D = (0, ∞). Es gilt f ′ (x) = rxr−1 − r. Wegen f ′ (x) > 0 für x ∈ (0, 1) und f ′ (x) < 0 für x ∈ (1, ∞) hat die Funktion f im Punkt 1 ihr Maximum. Es gilt also f (x) ≤ f (1) = 0, das heißt xr ≤ rx + 1 − r für alle x > 0. Sind u und v in (0, ∞), dann kann man x = uv setzen. Multiplikation mit v ergibt ur v 1−r ≤ ru+(1−r)v. Diese Ungleichung ist auch noch richtig für u = 0 oder v = 0 oder beides. Daher ist sie für alle u ≥ 0 und v ≥ 0 gezeigt. Sind alle ai gleich ∑ 0 oder alle bi gleich 0,∑dann ist die zu beweisende Ungleichung erfüllt. n n p q Wir setzen U = = können annehmen, dass U > 0 i=1 |ai | und V p i=1 |bi | und |bi |q |ai | und V > 0∑ gilt. Somit sind ui = U und vi = V für 1 ≤ i ≤ n definiert und es gilt ∑ n n Setzt man u = ui und v = vi in obiger Ungleichung und summiert i=1 ui = i=1 vi = 1. ∑n ∑n über i so erhält man i=1 uri vi1−r ≤ 1, das heißt i=1 |ai |pr |bi |q(1−r) ≤ U r V 1−r . Setzt man jetzt r = p1 und beachtet, dass dann 1 − r = 1 − p1 = 1q nach Voraussetzung gilt, so √ √ ∑n ergibt sich i=1 |ai bi | ≤ p U q V . Das ist bereits die zu beweisende Ungleichung. 6. Trigonometrische Funktionen Trigonometrische Funktionen spielen eine wichtige Rolle in der Geometrie, zum Beispiel für Dreiecksberechnungen. Sie sind auch für die Physik wichtig. Sie treten zum Beispiel bei der Untersuchung von Schwingungen auf. Franz Hofbauer 33 Der Einheitskreis ist der Kreis mit Mittelpunkt (0, 0) und Radius 1. Um sin und cos zu definieren, sei x ∈ R. Vom Punkt (1, 0) aus wird die Strecke x auf dem Einheitskreis gemessen (für x > 0 im Gegenuhrzeigersinn, für x < 0 im Uhrzeigersinn). Die Koordinaten des so ereichten Punktes nennen wir cos x und sin x. Da man beim Abmessen der Strecken x und x + 2π den selben Punkt am Einheitskreis erreicht, erhalten wir sin(x + 2π) = sin x und cos(x + 2π) = cos x. Man sagt, die Funktionen sin und cos haben Periode 2π. Satz 2.19: Die Funktionen sin und cos haben folgende Eigenschaften (a) sin2 x + cos2 x = 1 π 3π (b) sin 0 = sin π = 0, sin π2 = 1, sin 3π 2 = −1, cos 0 = 1, cos π = −1, cos 2 = cos 2 = 0 (c) sin(−x) = − sin x, cos(−x) = cos x (d) sin(x + π2 ) = cos x, cos(x + π2 ) = − sin x, sin(x + π) = − sin x, cos(x + π) = − cos x Beweis: Wir erhalten (a), da der Punkt mit den Koordinaten cos x und sin x auf dem Einheitskreis liegt. Auch (b) folgt sofort aus der Definition, indem man die Koordinaten der Punkte abliest, die man erhält, wenn man die Strecken 0, π2 , π und 3π 2 am Einheitskreis aufträgt. Da die Punkte, die man erhält, wenn man die Strecken x und −x am Einheitskreis ( π ) 2) erhält man, aufträgt, symmetrisch zur x-Achse liegen, folgt (c). Den Vektor cos(x+ sin(x+ π ) 2 (cos x) indem man den Vektor sin x um 900 nach links verdreht. Daraus folgen die ersten beiden ( ) ( x) Gleichungen von (d). Den Vektor cos(x+π) erhält man, indem man den Vektor cos sin x um sin(x+π) den Koordinatenursprung spiegelt. Daraus folgen die anderen Gleichungen von (d). Die Tangente an den Einheitskreis im T Punkt E = (1, 0) ist parallel zur y-Achse. Für − π2 < x < π2 hat die Gerade durch P den Koordinatenursprung M und durch den Punkt P = (cos x, sin x) einen Schnittpunkt mit dieser Tangente, den wir T nennen. Wir definieren tan x als die y-Koordinate dieses Schnittpunkts T . Bezeichnet man den Punkt (cos x, 0) noch mit R, dann sind die Dreiecke P M R und T M E zueinander ähnlich. Es gilt |P R| : |RM | = |T E| : |EM |. Das ist sin x tan x x cos x = 1 . Damit haben wir die Formel sin x M R E tan x = cos x gewonnen. Um die Ableitungen berechnen zu können, brauchen wir folgende Ungleichungen. Satz 2.20: Für x ∈ [0, π2 ) gilt sin x ≤ x und x ≤ tan x. Beweis: Wir verwenden die oben eingeführten Bezeichnungen. Die Fläche des Dreiecks M EP ist kleiner als die Fläche des Kreissektors zwischen den Radien M E und M P . Die Grundlinie des Dreicks M EP hat Länge 1 und die zugehörige Höhe ist sin x. Daher ist 1 2 sin x die Fläche des Dreicks M EP . Da der Kreissektor Radius 1 und Bogenlänge x hat, ist seine Fläche nach Satz 1.19 gleich 12 x. Wir erhalten also 12 sin x ≤ 12 x. Das ergibt die erste der beiden Ungleichungen. Die Fläche des Dreiecks M ET ist größer als die Fläche des Kreissektors zwischen den Radien M E und M P . Die Grundlinie des Dreicks M ET hat Länge 1 und die zugehörige Höhe ist tan x. Daher ist 12 tan x die Fläche des Dreiecks M ET . Sie ist größer als die Fläche 21 x des Kreissektors, woraus die zweite der beiden Ungleichungen folgt. 34 Differenzierbarkeit Satz 2.21 (Summensätze) Für x und y in R gelten die beiden Formeln (a) sin(x + y) = sin x cos y + cos x sin y (b) cos(x + y) = cos x cos y − sin x sin y. Beweis: Misst man vom Punkt (1, 0) aus am Einheitskreis im Gegenuhrzeigersinn die Strecke x, so kommt man zum Punkt (cos x, sin x). Misst man vom Punkt (1, 0) aus am Einheitskreis im Uhrzeigersinn die Strecke y, so kommt man zum Punkt (cos y, − sin y). Die Länge des Bogens zwischen diesen Punkten ist x+y. Der Bogen zwischen den Punkten (1, 0) und (cos(x + y), sin(x + y)) hat ebenfalls die Länge x + y. Daher ist auch die Strecke vom Punkt (cos x, sin x) zum Punkt (cos y, − sin y) gleich der Strecke vom Punkt (1, 0) zum Punkt (cos(x + y), sin(x + y)). Das heißt also √ √ (cos x − cos y)2 + (sin x + sin y)2 = (1 − cos(x + y))2 + (sin(x + y))2 Man kann die Wurzeln auf beiden Seiten weglassen. Quadriert man aus, so erhält man cos2 x − 2 cos x cos y + cos2 y + sin2 x + 2 sin x sin y + sin2 y = 1 − 2 cos(x + y) + cos2 (x + y) + sin2 (x + y) An drei verschiedenen Stellen kann man die Formel aus Satz 2.19 (a) anwenden, und erhält 1 − 2 cos x cos y + 1 + 2 sin x sin y = 1 − 2 cos(x + y) + 1. Damit sind wir bei der Formel cos(x + y) = cos x cos y − sin x sin y angelangt und (b) ist gezeigt. Wir ersetzen in dieser soeben gezeigten Formel y durch y + π2 . Aus Satz 2.19 (d) folgt cos(x + y + π2 ) = − sin(x + y), cos(y + π2 ) = − sin y und sin(y + π2 ) = cos y. Setzt man das ein, so erhält man − sin(x + y) = cos x(− sin y) − sin x cos y. Das ist (a). Jetzt sind wir soweit, um die Ableitungen von sin und cos berechnen zu können. Satz 2.22: Für x ∈ R gilt sin′ x = cos x und cos′ x = − sin x. h Beweis: Wir zeigen zuerst limh→0 sinh h = 1 und limh→0 1−cos = 0. Für h ∈ (0, π2 ) gilt h sin h sin h sin h ≤ h und h ≤ tan h = cos h nach Satz 2.20 und daher auch cos h ≤ h ≤ 1. Setzt man −h für h ein, so ändert sich weder cos h noch sinh h . Somit gilt cos h ≤ sinh h ≤ 1 für alle h ∈ (− π2 , π2 ) \ {0}. Weiters gilt limh→0 cos h = 1, wie man aus der Definition des cos erkennt. Aus Satz 2.3 folgt somit limh→0 sinh h = 1. 2 2 h 1−cos h sin h sin h 2 h Wegen Satz 2.19 (a) gilt 1−cos = h(1+cos h h) = h(1+cos h) = ( h ) 1+cos h . Mit Hilfe von h Satz 2.2 und der oben gefundenen Grenzwerte folgt limh→0 1−cos = 0. h ′ ′ Mit Hilfe der Summensätze kann man jetzt sin x und cos x berechnen. Aus dem Sumx h mensatz für den sin folgt sin(x+h)−sin = − sin x 1−cos + cos x sinh h . Läßt man h gegen 0 h h gehen, so folgt sin′ x = cos x mit Hilfe obiger Resultate und Satz 2.2. x h Ebenso folgt cos(x+h)−cos = − cos x 1−cos − sin x sinh h aus dem Summensatz für den cos h h und daraus cos′ x = − sin x mit h → 0. Für ein beliebiges Dreieck gelten der Sinus– und der Cosinussatz. Satz 2.23 (Sinussatz) In einem beliebigem Dreieck mit Fläche F und den üblichen Be2F zeichnungen gilt abc = sina α = sinb β = sinc γ . Beweis: Sei h die Länge der Höhe auf c. Dann gilt 2F = ch. Weiters gilt sin α = hb (wegen sin(1800 − α) = sin α gilt das auch, wenn die Höhe ausserhalb des Dreiecks liegt). 2F h α 2F 2F Daraus folgt dann abc = ab = b sin = sina α . Analog folgt abc = sinb β und abc = sinc γ . ab Franz Hofbauer 35 Satz 2.24 (Cosinussatz) In einem Dreieck mit den üblichen Bezeichnungen gilt a2 = b2 + c2 − 2bc cos α, b2 = a2 + c2 − 2ac cos β und c2 = a2 + b2 − 2ab cos γ. Beweis: Sei H der Fußpunkt der Höhe auf die Seite c und h deren Länge. Sei p der Abstand von H zum Eckpunkt A, wenn H rechts von A liegt oder gleich A ist (spitzer Winkel α), und der mit negativem Vorzeichen versehene Abstand, wenn H links von A liegt (stumpfer Winkel α). In beiden Fällen gilt dann cos α = pb das heißt p = b cos α. Aus dem Satz von Pythagoras folgt b2 = h2 + p2 und a2 = h2 + (c − p)2 . Subtraktion ergibt b2 −a2 = p2 −(c−p)2 = 2pc−c2 . Setzt man für p ein, so erhält man b2 −a2 = 2bc cos α−c2 , das heißt a2 = b2 + c2 − 2bc cos α. Die anderen Gleichungen beweist man analog. Zum Abschluss behandeln wir noch kurz den Tangens und seine Umkehrfunktion. Sei sin x D = (− π2 , π2 ). Da cos x > 0 für x ∈ D gilt, ist tan x = cos x auf D definiert und stetig. Aus der Quotientenregel folgt cos2 x + sin2 x 1 tan′ x = = = 1 + tan2 x 2 cos x cos2 x Wegen tan′ x > 0 für alle x ∈ D ist tan eine streng monoton wachsende Funktion. Wegen cos π2 = 0 geht tan x gegen ∞, wenn x gegen π2 geht. Ebenso geht tan x gegen −∞, wenn x gegen − π2 geht. Der Wertebereich {tan x : x ∈ D} ist daher R. Es existiert die Umkehrfunktion arctan : R → (− π2 , π2 ). Ihre Ableitung ist wegen Satz 2.7 1 1 1 arctan′ x = = = ′ 2 tan (arctan x) 1 + x2 1 + tan (arctan x) Es stellt sich heraus, dass die Ableitung des arctan eine rationale Funktion ist. Der arctan ist ebenfalls streng monoton wachsend. 7. Exponentialfunktion und Logarithmus Die Exponentialfunktion verwendet man, um Wachstum zu beschreiben. Ein Beispiel ist die Verzinsung eines Geldbetrags a. Ist x die Zinsrate, so hat man nach einem Jahr den Betrag a(1 + x). Angenommen, die Zinsen werden nicht erst am Ende des Jahres gutgeschrieben, sondern in Monatsabständen. Nach einem Monat hat man dann den x x x Betrag a(1 + 12 ), nach zwei Monaten den Betrag a(1 + 12 )(1 + 12 ), und nach einem Jahr x 12 den Betrag a(1 + 12 ) . Teilt man das Jahr in n gleich lange Perioden und nimmt an, dass die Zinsen jeweils am Ende dieser Perioden gutgeschrieben werden, dann hat man am Ende des Jahres den Betrag a(1 + nx )n . Würde man diese Perioden immer kleiner machen, das heißt n gegen ∞ gehen lassen, dann hätte man a u(x) mit u(x) = limn→∞ (1 + nx )n . Das wäre der Betrag am Ende des Jahres, wenn man kontinuierlich verzinsen würde. Ein anderes Beispiel ist die Vermehrung von Zellen oder das Wachstum einer Bakterienkolonie. Hier finden die Zellteilungen laufend statt. Man kann dieses Zellenwachstum als einen kontinuierlichen Prozess auffassen. Ist a die Anzahl der Zellen zu Beginn und x der relative Anteil der Zellen, die sich während einer Zeiteinheit teilen, dann hat man a(1 + x) Zellen am Ende eines Zeitintervalls, dessen Länge eine Zeiteinheit ist. Da aber die Anzahl der Zellen während dieses Zeitintervalls nicht konstant bleibt, kann man diese Überlegung nur auf sehr kleine Zeitintervalle anwenden. Wir teilen das Einheitszeitintervall in n Intervalle der Länge n1 und erhalten a(1 + nx )n als Anzahl der Zellen nach einer Zeiteinheit. Im Grenzwert n → ∞ ergibt sich a u(x) wie oben. Ein weiteres Beispiel ist der radioaktive Zerfall. Sei a die ursprünglich vorhandene Menge an radioaktivem Material und x die Zerfallsrate. Dabei muss x negativ sein, da die Menge 36 Differenzierbarkeit des radioaktiven Materials ja abnimmt. Dieselbe Vorgangsweise wie oben ergibt, dass die nach einer Zeiteinheit noch vorhandene Menge gleich a u(x) ist. Die Funktion u(x) = limn→∞ (1 + nx )n nennt man Exponentialfunktion. Aber zuerst ist zu zeigen, dass dieser Grenzwert existiert. Für n = 1, 2, 3, 8 ist die Funktion x 7→ (1+ nx )n nebenstehend gezeichnet und zwar jeweils auf dem Intervall [−n, ∞). Dort ist die Funktion monoton wachsend und hat nichtnegative Werte. Man sieht auch, dass der Graph jeder dieser Funktionen über dem Graph der vorhergehenden liegt. Das wurde auch in Satz 2.16 gezeigt. Es ist bereits erkennbar, wie die Grenzfunktion aussehen wird. Für n ≥ 1 definieren wir die Funktion un : R → R durch un (x) = (1 + wiederholtes Anwenden von Satz 2.16 erhalten wir (A) un (x) ≥ um (x) x∈R für x n n) . Durch und n ≥ m > −x Gilt |t| < 1, dann gilt auch (1 + t) (1 − t) = (1 − t2 )n < 1. Damit erhalten wir 1 (B) un (x) · un (−x) < 1 und daher auch un (x) < un (−x) für x ∈ R und n > |x| n n Sei jetzt x ∈ R beliebig. Wir wählen n0 ∈ N so, dass n0 > |x| gilt. Für alle n ≥ n0 1 ≤ un 1(−x) wegen (B) und (A). Die Folge (un (x))n≥n0 erhalten wir dann un (x) < un (−x) 0 ist somit nach oben beschränkt. Wegen (A) ist sie auch monoton wachsend. Also existiert u(x) = limn→∞ un (x) nach Satz 1.8. Damit ist gezeigt, dass u(x) = limn→∞ un (x) für alle x ∈ R existiert. Es folgt u(x) ≥ 0, da ja un (x) > 0 für alle n > −x gilt. Da un (0) = 1 für alle n gilt, erhalten wir u(0) = 1. Die Zahl u(1) = limn→∞ (1 + n1 )n nennt man Eulersche Zahl und bezeichnet sie mit e. Satz 2.25: Für x und y in R gilt u(x + y) = u(x)u(y). Für x ∈ R gilt weiters u(x) > 0 1 und u(−x) = u(x) . Ist q ∈ Q und x ∈ R, dann gilt u(qx) = u(x)q , insbesondere u(q) = eq . y Beweis: Wir berechnen limn→∞ (1 + n+x )n . Dazu sei k ∈ N mit k ≥ |x| fest gewählt. Ist y y y n > |y| + k, dann liegt (1 + n+x )n zwischen (1 + n+k )n und (1 + n−k )n . Für beliebiges y y y m ∈ Z gilt limn→∞ (1 + n+m )n = limn→∞ (1 + n+m )n+m (1 + n+m )−m = u(y). Wegen y y x n n n Satz 1.7 folgt limn→∞ (1 + n+x )n = u(y). Nun gilt aber (1 + x+y n ) = (1 + n ) (1 + n+x ) . Lässt man n gegen ∞ gehen, so erhält man u(x + y) = u(x)u(y). Setzt man y = −x dann ergibt sich 1 = u(0) = u(x)u(−x). Einerseits folgt u(x) ̸= 0 und 1 daher u(x) > 0, da u(x) ≥ 0 schon gezeigt wurde. Andererseits folgt u(−x) = u(x) . Für n ≥ 0 zeigen wir u(nx) = u(x)n mit Induktion. Für n = 0 gilt diese Gleichung wegen u(0) = 1 und für n = 1 ist sie trivial. Ist u(nx) = u(x)n bereits gezeigt, dann folgt u((n + 1)x) = u(nx + x) = u(nx)u(x) = u(x)n u(x) = u(x)n+1 mit Hilfe der ersten Aussage dieses Satzes. Damit ist u(nx) = u(x)n für alle n ≥ 0 gezeigt. Aus der zweiten Aussage 1 −n dieses Satzes folgt nun u(−nx) = u(x) , sodass u(nx) = u(x)n für alle n ∈ Z n = u(x) gezeigt ist. n m Für q = m n mit m ∈ Z und n ∈ N erhalten wir u(qx) = u(nqx) = u(mx) = u(x) , woraus √ u(qx) = n u(x)m = u(x)q folgt. Setzt man x = 1, so hat man u(q) = u(1)q = eq . Franz Hofbauer 37 Nach Satz 2.25 gilt u(q) = eq für alle q ∈ Q. Das ist der Grund, warum man ex statt u(x) schreibt, auch wenn x nicht in Q liegt. Im nächsten Satz berechnen wir die Ableitung der Funktion u : R → R. Satz 2.26: Die Funktion u ist differenzierbar und es gilt u′ (x) = u(x) für alle x ∈ R. Beweis: Wir berechnen die Ableitung von u(x) im Punkt x = 0. Wegen (A) und (B) gilt u1 (x) ≤ un (x) ≤ 1 un (−x) ≤ 1 u1 (−x) für x ∈ (−1, 1) und n ≥ 1 Wir setzen für u1 (x) und u1 (−x) ein, lassen n gegen ∞ gehen und erhalten 1 + x ≤ u(x) ≤ 1 1−x für x ∈ (−1, 1) und n ≥ 1 Durch Subtraktion von 1 und Division durch x ergibt sich daraus 1≤ u(x)−1 x ≤ 1 1−x für x ∈ (0, 1) und 1 ≥ u(x)−1 x ≥ 1 1−x für x ∈ (−1, 0) Da u(0) = 1 gilt, erhalten wir limx→0 u(x)−u(0) = 1 aus diesen Ungleichungen und Satz 2.3, x ′ ′ das heißt u (0) existiert und es gilt u (0) = 1. Um u′ (x) für beliebiges x ∈ R zu finden, verwenden wir u(x + h) = u(x)u(h) aus Satz 2.25. = u(x) u(h)−1 und limh→0 u(x+h)−u(x) = u(x) limh→0 u(h)−1 = u(x), Es folgt u(x+h)−u(x) h h h h ′ ′ das heißt u (x) existiert und es gilt u (x) = u(x). Analog können wir auch den Logarithmus einführen, indem wir die Funktionen x 7→ (1+ nx )n umkehren und den Grenzwert dieser Umkehrfunktionen suchen. Wir lösen die Gleichung (1 + ny )n = x nach y auf, und √ erhalten so die Umkehrfunktion ℓn (x) = n( n x − 1). Sie hat Definitionsbereich (0, ∞). Nebenstehend ist diese Funktion für n = 1, 2, 3, 8 gezeichnet. Klarerweise erhalten wir die Spiegelung des obigen Bildes um die Hauptdiagonale. Wir zeigen, dass der Grenzwert limn→∞ ℓn (x) für x ∈ (0, ∞) existiert und bezeichnen ihn mit ℓ(x). Wir untersuchen dann die Eigenschaften der Funktion ℓ : (0, ∞) → R. Für x ≥ 1 und n ≥ 1 gilt ℓn+1 (x) ≤ ℓn (x) we√ n gen Satz 2.17 und ℓn (x) ≥ 0 wegen x ≥ 1, sodass (ℓn (x))n≥1 eine nach unten beschränkte monoton fallende Folge ist und somit ℓ(x) = limn→∞ ℓn (x) nach Satz 1.8 existiert. Da ℓn√ (1) = 0 für alle n ≥ 1 gilt, erhalten wir insbesondere ℓ(1) = 0. √ Man rechnet ℓn (x) = − n x ℓn ( x1 ) für alle x ∈ (0, ∞) nach. Da limn→∞ n x = 1 für alle x > 0 nach Satz 2.15 (a) gilt, folgt aus dieser Gleichung, dass ℓ(x) auch für 0 < x < 1 existiert und dass ℓ(x) = −ℓ( x1 ) für alle x ∈ (0, ∞) gilt. Die so auf (0, ∞) definierte Funktion ℓ heißt (natürlicher) Logarithmus. Wir haben bereits ℓ(1) = 0 und ℓ(x) = −ℓ( x1 ) für alle x ∈ (0, ∞) gezeigt. Wir beweisen weitere Eigenschaften. Satz 2.27: Die Funktion ℓ : (0, ∞) → R ist differenzierbar und es gilt ℓ′ (x) = x ∈ (0, ∞). 1 x für alle Beweis: Es gilt ℓ′n (x) = x n −1 für alle n ≥ 1. Aus dem Mittelwertsatz erhalten wir, dass 1 ℓn (y) − ℓn (x) = c n −1 (y − x) gilt für ein c zwischen x und y (c hängt von n ab). Daraus 1 38 folgt, dass Differenzierbarkeit ℓn (y)−ℓn (x) y−x für alle n ≥ 2 zwischen x n −1 und y n −1 liegt. Lässt man n gegen 1 ℓ(y)−ℓ(x) zwischen x1 und y1 y−x womit ℓ′ (x) = x1 gezeigt ist. ∞ gehen, so folgt aus Satz 1.6 (a), dass limy→x ℓ(y)−ℓ(x) y−x = 1 x wegen Satz 2.3, 1 liegt. Daher gilt Die Ableitung von ℓ : (0, ∞) → R ist größer als 0, sodass diese Funktion streng monoton wachsend ist. Wegen ℓ(1) = 0 folgt ℓ(x) > 0 für x ∈ (1, ∞) und ℓ(x) < 0 für x ∈ (0, 1). Satz 2.28: Für x und y in (0, ∞) gilt ℓ(xy) = ℓ(x) + ℓ(y). √ √ √ √ Beweis: Für n ≥ 1 gilt ℓn (xy) = n( n xy − n y + n y − 1) = n y ℓn (x) + ℓn (y). Lässt man in dieser Gleichung n gegen ∞ gehen, dann hat man ℓ(xy) = ℓ(x) + ℓ(y), da ja √ limn→∞ n y = 1 ist. Wir haben die Exponentialfunktion u : R → (0, ∞) und den Logarithmus ℓ : (0, ∞) → R definiert und ihre Ableitungen berechnet. Es ist zu erwarten, dass sie Umkehrfunktionen voneinander sind. Um das zu zeigen, sei g : R → R die Funktion g(x) = ℓ(u(x))−x. Es gilt 1 g ′ (x) = ℓ′ (u(x))u′ (x) − 1 = u(x) u(x) − 1 = 0. Somit ist g eine konstante Funktion. Wegen u(0) = 1 und ℓ(1) = 0 erhalten wir g(0) = 0. Also gilt g(x) = 0 und daher auch ℓ(u(x)) = x für alle x ∈ R. Ist y ∈ (0, ∞) und setzt man x = ℓ(y) in die Gleichung ℓ(u(x)) = x ein, dann hat man ℓ(u(ℓ(y))) = ℓ(y). Da ℓ streng monoton wachsend ist, erhalten wir u(ℓ(y)) = y. Damit ist ℓ(u(x)) = x für alle x ∈ R und u(ℓ(y)) = y für alle y ∈ (0, ∞) gezeigt. Also sind Exponentialfunktion und Logarithmus tatsächlich Umkehrfunktionen voneinander. Wir verwenden ab jetzt die übliche Schreibweise ln x statt ℓ(x) für den Logarithmus. Für a > 0 definieren wir die Funktion va : R → (0, ∞) durch va (x) = u(x ln a) = ex ln a . Wegen Satz 2.26 gilt va′ (x) = u′ (x ln a) ln a = u(x ln a) ln a = va (x) ln a. Damit ist die Ableitung der Funktion va gefunden. Satz 2.29: Für x und y in R gilt va (x + y) = va (x)va (y). Für q ∈ Q gilt va (q) = aq . Beweis: Mit Satz 2.25 erhalten wir u((x + y) ln a) = u(x ln a + y ln a) = u(x ln a)u(y ln a), das heißt va (x + y) = va (x)va (y). Ebenfalls aus Satz 2.25 folgt u(q ln a) = u(ln a)q und daraus dann va (q) = aq , da die Exponentialfunktion u ja die Umkehrfunktion von ln ist und somit u(ln a) = a gilt. Nach Satz 2.29 gilt va (q) = aq für alle q ∈ Q. Das ist der Grund, warum man ax statt va (x) schreibt, auch wenn x nicht in Q liegt. Obige Definition der Funktion va wird dann zu ax = u(x ln a) = ex ln a . Daraus folgt ln ax = x ln a, da ln die Umkehrfunktion der Exponentialfunktion u ist und somit ln ex ln a = x ln a gilt. Satz 2.30: Für a, b > 0 und x, y ∈ R gilt ax bx = (ab)x und (ax )y = axy . Beweis: Satz 2.28 und Satz 2.25 besagen ln ab = ln a + ln b und u(x + y) = u(x)u(y). Daraus erhalten wir dann (ab)x = u(x ln ab) = u(x ln a + x ln b) = u(x ln a)u(x ln b) = ax bx . Mit Hilfe der Gleichung ln ax = x ln a folgt auch (ax )y = u(y ln ax ) = u(yx ln a) = axy . Sei r ∈ R und g : R+ → R+ definiert durch g(x) = xr . Das ist die Potenzfunktion für reelle Exponenten. Es gilt g ′ (x) = rxr−1 . Um das zu zeigen, verwenden wir x = eln x und erhalten g(x) = (eln x )r = er ln x . Es folgt g ′ (x) = er ln x xr = xr xr = rxr x−1 = rxr−1 . Franz Hofbauer 39 Beispiel: Wir beweisen die Ungleichung zwischen dem arithmetischen und geometrischen Mittel. Wir zeigen zuerst, dass ex−1 ≥ x für alle x ∈ R gilt. Die Funktion f (x) = ex−1 − x hat Ableitung f ′ (x) = ex−1 − 1. Es gilt f ′ (x) < 0 für x < 1 und f ′ (x) > 0 für x > 1. Auf dem Intervall (−∞, 1) ist f monoton fallend. Auf (1, ∞) ist f monoton wachsend. Es gilt daher f (x) ≥ f (1) für alle x ∈ R. Das ist die gewünschte Ungleichung ex−1 − x ≥ 0. √ n Seien a1 , a2 , . . . , an positive reelle Zahlen. Wir zeigen n a1 a2 . . . an ≤ a1 +a2 +···+a . Dazu n aj a1 +a2 +···+an und xj = m , sodass x1 +x2 +· · ·+xn = n gilt. Aus obiger Ungleichung sei m = n folgt exj −1 ≥ xj für alle j und daraus wieder ex1 −1 ex2 −1 . . . exn −1 ≥ x1 x2 . . . xn . Die linke Seite ist aber gleich ex1 +x2 +···+xn −n = e0 = 1, sodass wir x1 x2 . . . xn ≤ 1 erhalten. Das aber bedeutet nichts anderes als a1 a2 . . . an ≤ mn . Zieht man auf beiden Seiten noch die n-te Wurzel, so steht die gewünschte Ungleichung schon da. 8. Regel von de l’Hospital Wir beweisen die Regel von de l’Hospital, die dazu dient, gewisse Grenzwerte zu berechnen. Dazu brauchen wir ein Verallgemeinerung des Mittelwertsatzes. Satz 2.31 (Verallgemeinerter Mittelwertsatz) Seien f : [a, b] → R und g : [a, b] → R stetig und auf dem offenen Intervall (a, b) differenzierbar. Dann gibt es ein c ∈ (a, b) mit (f (b) − f (a))g ′ (c) = (g(b) − g(a))f ′ (c). Gilt auch g ′ (x) ̸= 0 für alle x ∈ (a, b) dann kann ′ (c) (b)−f (a) = fg′ (c) . man diese Gleichung schreiben als fg(b)−g(a) Beweis: Sei h(x) = (f (b) − f (a))g(x) − (g(b) − g(a))f (x). Dann ist h : [a, b] → R stetig und auf dem offenen Intervall (a, b) differenzierbar. Es gilt h(a) = f (b)g(a) − g(b)f (a) und h(b) = g(a)f (b) − f (a)g(b), das heißt h(b)−h(a) = 0. Daher folgt aus Satz 2.10 die Existenz b−a ′ eines c ∈ (a, b) mit h (c) = 0. Das aber heißt (f (b) − f (a))g ′ (c) − (g(b) − g(a))f ′ (c) = 0 und die erste Aussage ist gezeigt. Gilt g ′ (x) ̸= 0 für alle x ∈ (a, b) dann folgt g(b) − g(a) ̸= 0 aus Satz 2.10 und wir können ′ (b)−f (a) (c) obige Gleichung schreiben als fg(b)−g(a) = fg′ (c) . Satz 2.32 (Regel von de l’Hospital) Sei a < s < b. Seien f : (a, b) → R und g : (a, b) → R differenzierbar. Weiters sei g ′ (x) ̸= 0 für alle x ∈ (a, s) ∪ (s, b). Wenn f (s) = g(s) = 0 und ′ (x) (x) limx→s fg′ (x) = u gilt, dann gilt auch limx→s fg(x) = u. ′ (s)−f (x) (c) (x) = fg(s)−g(x) = fg′ (c) für Beweis: Es gilt f (s) = g(s) = 0. Ist x ∈ (a, s), dann folgt fg(x) ein c ∈ (x, s) aus Satz 2.31 angewandt auf das Intervall [x, s]. Ist x ∈ (s, b), dann folgt f (x) f (x)−f (s) f ′ (c) = = g(x) g(x)−g(s) g ′ (c) für ein c ∈ (s, x) aus Satz 2.31 angewandt auf das Intervall [s, x]. Nach Voraussetzung gilt limx→s Damit ist (x) limx→s fg(x) f ′ (c) g ′ (c) = limc→s f ′ (c) g ′ (c) = u, da mit x ja auch c gegen s geht. = u bereits gezeigt. Die Voraussetzung g ′ (x) ̸= 0 für alle x ∈ (a, s) ∪ (s, b) muss man nicht überprüfen, da die auftretenden Funktionen üblicherweise isolierte Nullstellen haben und daher ein ε > 0 existiert, sodass g ′ (x) ̸= 0 für x ∈ (s − ε, s) ∪ (s, s + ε) gilt. Man kann den Satz dann mit a = s − ε und b = s + ε anwenden. −x Beispiel: Wir berechnen limx→0 e −e . In Zähler und Nenner stehen Funktionen, die x auf ganz R differenzierbar sind und die 0 ergeben, wenn man x = 0 einsetzt. Wir erhalten x −x x −x = limx→0 e +e = 2. limx→0 e −e x 1 x 40 Differenzierbarkeit 1−cos x Beispiel: Wir berechnen limx→0 1−cos 2x . Im Zähler und Nenner stehen differenzierbare 1−cos x Funktionen, die 0 ergeben, wenn man x = 0 einsetzt. Wir erhalten limx→0 1−cos 2x = sin x limx→0 2 sin 2x . Wir erhalten einen Quotienten, wo im Zähler und Nenner wieder differenzierbare Funktionen stehen, die 0 ergeben, wenn man x = 0 einsetzt. Wir wenden die Regel 1−cos x cos x 1 von de l’Hospital noch einmal an und erhalten limx→0 1−cos 2x = limx→0 4 cos 2x = 4 . 9. Komplexe Zahlen Rechnet man mit reellen Zahlen, dann hat man das Problem, dass nicht jedes Polynom eine Nullstelle hat. Das Polynom x2 + 1 hat zum Beispiel keine. Um dieses Problem zu beseitigen, führt man die komplexen Zahlen C = {a + ib : a ∈ R, b ∈ R} ein. Addition und Multiplikation sind in naheliegender Weise definiert, wobei i2 = −1 zu setzen ist. Es gelten wieder die Assoziativgesetze, die Kommutativgesetze und das Distributivgesetz. −b a Zu jeder komplexen Zahl a + bi ̸= 0 existiert die inverse Zahl a2 +b 2 + i a2 +b2 . Aus jeder komplexen Zahl lässt sich die Wurzel ziehen. Die Ordnung geht verloren. Auf C kann keine Ordnungsrelation definiert werden, die mit den Rechenoperationen verträglich ist. √ Beispiel: Wir berechnen 3 + 4i, das heißt wir lösen die Gleichung (a + ib)2 = 3 + 4i. Es folgt a2 − b2 + 2abi = 3 + 4i, also a2 − b2 = 3 und 2ab = 4. Berechnet man aus der zweiten Gleichung b und setzt es in die erste ein, so erhält man a2 − a42 = 3 oder a4 − 3a2 − 4 = 0. Als Lösungen erhält man a2 = 4 und a2 = −1. Da a eine reelle Zahl ist, muss a2 ≥ 0 gelten. Es kommt also nur a2 = 4 in Frage. Wir erhalten die beiden Lösungen a = 2 und a = −2. Die zugehörigen Werte für b sind b = 1 und b = −1. Als Wurzeln der Zahl 3 + 4i erhalten wir die beiden komplexen Zahlen 2 + i und −2 − i. Man kann komplexe Zahlen a + ib graphisch (a) als Vektoren b im R2 darstellen. Die Addition der komplexen Zahlen entspricht dann der Vektoraddition. Um auch die Multiplikar tion geometrisch zu deuten, ist es nützlich, die b Polarkoordinatendarstellung komplexer Zahlen einzuführen. √ Es gilt a + ib = r(cos φ + i sin φ), wobei r = a2 + b2 der Betrag der komplexen φ Zahl a + ib ist und φ der Winkel zwischen der a x-Achse und dem Vektor, der die komplexe Zahl a + ib darstellt. Für x ∈ R definieren wir die komplexe Zahl eix durch die sogenannte Eulersche Formel eix = cos x + i sin x Dann lässt sich die Polarkoordinatendarstellung schreiben als a + ib = reiφ . Warum man die komplexe Zahl cos x + i sin x mit eix bezeichnet, wird aus dem nächsten Satz klar. Es gelten Rechenregeln wie für die Exponentialfunktion. Satz 2.33: Für x und y in R gilt ei(x+y) = eix eiy . Beweis: Das folgt aus den Summensätzen für die trigonometrischen Funktionen. Es gilt ei(x+y) = cos(x + y) + i sin(x + y) = cos x cos y − sin x sin y + i sin x cos y + i cos x sin y und eix eiy = (cos x + i sin x)(cos y + i sin y) = cos x cos y + i sin x cos y + i cos x sin y − sin x sin y. Daraus erkennt man die gesuchte Gleichung. Franz Hofbauer 41 Nun kann man auch die Multiplikation von zwei komplexen Zahlen geometrisch deuten. Wir schreiben die Zahlen in Polarkoordinatendarstellung als r1 eiφ1 und r2 eiφ2 . Mit Hilfe von Satz 2.33 folgt r1 eiφ1 · r2 eiφ2 = r1 r2 ei(φ1 +φ2 ) . Das Produkt zweier komplexer Zahlen erhält man also, indem man die Beträge √ der beiden Zahlen multipliziert und die Winkel √ iφ/2 iφ/2 addiert. Daraus ergibt sich auch, dass re und − re die beiden Wurzeln der komplexen Zahl reiφ sind. Die Wurzel (abgesehen vom Vorzeichen) erhält man, indem man die Wurzel aus dem Betrag zieht und den Winkel halbiert. Man kann nun umgekehrt auch die trigonometrischen Funktionen durch die komplexe Exponentialfunktion darstellen. Wegen e−ix = cos(−x)+i sin(−x) = cos x−i sin x erhalten wir eix + e−ix = 2 cos x und daraus cos x = 21 (eix + e−ix ) Ebenso erhalten wir eix − e−ix = 2i sin x und daraus sin x = ix 1 2i (e − e−ix ) Diese Darstellung von sin x und cos x durch die komplexe Exponentialfunktion kann man verwenden um Potenzen und Produkte von trigonometrischen Funktionen auszurechnen. Beispiel: Es soll sin2 x sin 2x als Summe von trigonometrischen Funktionen geschrieben 2ix −2ix 2ix e −e−2ix werden. Durch Einsetzen obiger Formeln erhält man sin2 x sin 2x = e −2+e −4 2i −2ix −4ix −e Multiplikation dieser beiden Brüche ergibt e −2e +2e . Diesen Bruch kann −8i man jetzt zerteilen, sodass wir wieder trigonometrische Funktionen einsetzen können, und 2ix −2ix 4ix −e−4ix + 2e −2e = − 14 sin 4x + 12 sin 2x. Damit ist die gewünschte Summe erhalten e −8i 8i gefunden. 4ix 2ix Beispiel: Wir zeigen, dass sin 2α + sin 2β + sin 2γ = 4 sin α sin β sin γ für die Winkel eines Dreiecks, also unter der Bedingung α + β + γ = π gilt. Wir beginnen mit 4 sin α sin β sin γ 1 1 und setzen sin x = 2i (eix − e−ix ) ein. Durch Ausmultiplizieren ergibt sich − 2i (ei(α+β+γ) − ei(α+β−γ) − ei(α−β+γ) + ei(α−β−γ) − ei(−α+β+γ) + ei(−α+β−γ) + ei(−α−β+γ) − ei(−α−β−γ) ). Fasst man diese Ausdrücke entsprechend zusammen, so erhält man − sin(α + β + γ) + sin(α + β − γ) + sin(α − β + γ) + sin(−α + β + γ). Das ist das Ergebnis, wenn man die Bedingung, dass es sich um die Winkel eines Dreiecks handelt, nicht verwendet. Beachtet man, dass α+β +γ = π und sin(π −x) = sin x gilt, dann ergibt sich sin 2α+sin 2β +sin 2γ. III. Beweise durch Intervallschachtelung Die Intervallschachtelungseigenschaft macht es möglich, die grundlegenden Sätze der Analysis zu beweisen. Es waren drei Sätze, nämlich der Satz über die Konvergenz monotoner Folgen, der Zwischenwertsatz und der Satz vom Maximum und Minimum stetiger Funktionen, die nicht bewiesen wurden und deren Beweis wir jetzt führen werden. Dazu kommen noch der Satz von Bolzano–Weierstraß und ein Satz über die Existenz von Infimum und Supremum einer beschränkten Menge. Als Beweismethode verwenden wir die Intervallhalbierung. Es wird eine Folge von abgeschlossenen Intervallen konstruiert, sodass jedes Intervall entweder die linke oder die rechte Hälfte des vorhergehenden Intervalls ist. Wir wissen, dass es dann genau eine reelle Zahl gibt, die in allen Intervallen enthalten ist. 1. Intervallhalbierung Mit Hilfe der Intervallhalbierungsmethode beweisen wir den Zwischenwertsatz und den Satz von Bolzano–Weierstraß. Satz 3.1 (Zwischenwertsatz) Sei f : [a, b] → R eine stetige Funktion. Sei f (a) < y < f (b) oder f (a) > y > f (b). Dann existiert ein x ∈ (a, b) mit f (x) = y. Beweis: Wir untersuchen den Fall f (a) < y < f (b). Wir konstruieren eine Folge von geschachtelten Intervallen [an , bn ] mit f (an ) < y < f (bn ), die möglicherweise abbricht. Wir beginnen mit [a0 , b0 ] = [a, b]. Ist [an , bn ] konstruiert, dann bestimmen wir [an+1 , bn+1 ] folgendermaßen. Sei cn der Mittelpunkt von [an , bn ]. Ist f (cn ) = y, dann haben wir das gewünschte x schon gefunden und der Beweis ist fertig. Ist f (cn ) > y, dann setzen wir [an+1 , bn+1 ] = [an , cn ]. Ist f (cn ) < y, dann setzen wir [an+1 , bn+1 ] = [cn , bn ]. In beiden Fällen gilt [an+1 , bn+1 ] ⊆ [an , bn ] und f (an+1 ) < y < f (bn+1 ). Damit sind die Intervalle konstruiert. Da das nächstfolgende Intervall immer eine Hälfte des vorhergehenden ist, gilt bn − an = b−a 2n . Die Längen der Intervalle gehen gegen 0. Wegen der Intervallschachtelungseigenschaft gibt es ein x, das in allen Intervallen [an , bn ] enthalten ist. Wir zeigen limn→∞ an = x und limn→∞ bn = x. Dazu sei ε > 0 vorgegeben. Wir wählen n0 größer als b−a ε . Ist dann n ≥ n0 , dann folgt wegen x ∈ [an , bn ], dass b−a b−a |an − x| ≤ bn − an = 2n ≤ b−a n ≤ n0 < ε gilt. Damit ist limn→∞ an = x gezeigt. Genauso folgt limn→∞ bn = x, da ja auch |bn − x| ≤ bn − an gilt. Wir zeigen f (x) = y. Da f stetig ist, folgt limn→∞ f (an ) = f (x). Da f (an ) ≤ y für alle n gilt, erhalten wir f (x) ≤ y. Ebenso folgt limn→∞ f (bn ) = f (x). Da auch f (bn ) ≥ y für alle n gilt, erhalten wir f (x) ≥ y. Damit ist f (x) = y gezeigt. Der nächste Satz verwendet Teilfolgen. Ist (xn )n≥0 eine Folge, dann nennt man jede Folge xn0 , xn1 , xn2 , xn3 , . . . mit n0 < n1 < n2 < n3 < . . . eine Teilfolge. Satz 3.2 (Satz von Bolzano–Weierstraß) Jede Folge (xn )n≥0 , die in einem beschränktem Intervall [a, b] liegt, hat eine konvergente Teilfolge mit Grenzwert in [a, b]. Beweis: Wir konstruieren eine Folge von geschachtelten Intervallen [an , bn ], von denen jedes unendlich viele Glieder der Folge (xn )n≥0 enthält. Wir beginnen mit [a0 , b0 ] = [a, b]. Ist das Intervall [an , bn ] schon konstruiert, sodass es unendlich viele Folgenglieder enthält, und ist cn der Mittelpunkt von [an , bn ], dann enthält mindestens eines der Intervalle [an , cn ] oder [cn , bn ] unendlich viele Glieder der Folge. Eines dieser beiden Intervalle, das unendlich Franz Hofbauer 43 viele Folgenglieder enthält, wählen wir als [an+1 , bn+1 ]. Es gilt dann [an+1 , bn+1 ] ⊆ [an , bn ] für alle n. Damit sind die Intervalle konstruiert. Da jedes Intervall eine Hälfte des vorhergehenden ist, gilt bn − an = b−a 2n . Die Längen der Intervalle gehen gegen 0. Wir wählen eine Teilfolge (xnk )k≥0 von (xn )n≥0 , sodass xnk ∈ [ak , bk ] gilt. Wir beginnen mit xn0 = x0 ∈ [a0 , b0 ]. Sind die Folgenglieder xn0 , . . . , xnk schon gewählt, dann finden wir ein nk+1 > nk mit xnk+1 ∈ [ak+1 , bk+1 ], da dieses Intervall ja unendlich viele Folgenglieder enthält. Damit ist die Teilfolge ausgewählt. Wegen der Intervallschachtelungseigenschaft gibt es ein x, das in allen Intervallen [an , bn ] enthalten ist. Wir zeigen limk→∞ xnk = x. Sei ε > 0 beliebig. Es gibt ein k0 mit bk0 − ak0 < ε, da die Intervalllängen gegen 0 gehen. Für k ≥ k0 gilt dann |xnk −x| ≤ bk0 −ak0 < ε wegen x ∈ [ak0 , bk0 ] und xnk ∈ [ak , bk ] ⊆ [ak0 , bk0 ]. Damit ist limk→∞ xnk = x gezeigt. 2. Infimum und Supremum Infimum und Supremum werden für beschränkte nicht leere Teilmengen von R definiert. Man nennt d eine obere Schranke einer nicht leeren Teilmenge M von R, wenn jedes Element von M kleiner oder gleich d ist. Man nennt c eine untere Schranke von M , wenn jedes Element von M größer oder gleich c ist. Eine Menge heißt beschränkt, wenn sie eine obere und eine untere Schranke besitzt. Die kleinste obere Schranke einer Menge nennt man Supremum. Die größte untere Schranke einer Menge nennt man Infimum. Es gilt der folgende Satz. Satz 3.3: Sei M ⊆ R nicht leer. Hat M eine obere Schranke, dann auch eine kleinste obere Schranke. Hat M eine untere Schranke, dann auch eine größte untere Schranke. Beweis: Wir führen den Beweis für die obere Schranke. Der Beweis für die untere Schranke verläuft analog. Nach Voraussetzung hat M eine obere Schranke r. Wir konstruieren eine Folge von geschachtelten Intervallen [an , bn ], sodass an keine, wohl aber bn eine obere Schranke von M ist. Wir beginnen mit [a0 , b0 ] = [u − 1, r], wobei u ein beliebiges Element von M ist. Klarerweise ist u − 1 keine obere Schranke. Ist [an , bn ] schon konstruiert, dann bestimmen wir [an+1 , bn+1 ] folgendermaßen. Sei cn der Mittelpunkt von [an , bn ]. Ist cn eine obere Schranke, dann setzen wir [an+1 , bn+1 ] = [an , cn ]. Ist cn keine obere Schranke, dann setzen wir [an+1 , bn+1 ] = [cn , bn ]. In beiden Fällen gilt [an+1 , bn+1 ] ⊆ [an , bn ], während an+1 keine, wohl aber bn+1 eine obere Schranke ist. Damit sind die Intervalle konstruiert. 0 Da jedes Intervall eine Hälfte des vorhergehenden ist, gilt bn − an = b02−a . Die Längen n der Intervalle gehen gegen 0. Wegen der Intervallschachtelungseigenschaft gibt es ein x, das in allen Intervallen [an , bn ] enthalten ist. Wir zeigen, dass x die kleinste obere Schranke ist. Wir nehmen an, dass x keine obere Schranke der Menge M ist. Dann gibt es ein v ∈ M mit x < v. Da die Intervalllängen gegen 0 gehen, gibt es ein n mit bn − an < v − x. Wegen an ≤ x ≤ bn folgt daraus bn < v − x + an ≤ v. Da aber bn eine obere Schranke von M ist, kann bn < v nicht gelten. Die Annahme, dass x keine obere Schranke ist, ist widerlegt. Damit wissen wir, dass x eine obere Schranke ist. Um zu zeigen, dass x die kleinste obere Schranke von M ist, nehmen wir die Existenz einer oberen Schranke y mit y < x an. Da die Intervalllängen gegen 0 gehen, gibt es ein n mit bn − an < x − y. Wegen an ≤ x ≤ bn folgt daraus an > bn − x + y ≥ y. Da aber an keine obere Schranke von M ist, existiert ein v ∈ M mit v > an . Es folgt v > y. Die Annahme, dass y eine obere Schranke von M ist, ist widerlegt. Damit ist gezeigt, dass x die kleinste obere Schranke von M ist. 44 Beweise durch Intervallschachtelung Mit Hilfe des letzten Satzes, können wir die beiden folgenden beweisen. Satz 3.4: Eine monoton wachsende, nach oben beschränkte Folge hat einen Grenzwert. Eine monoton fallende, nach unten beschränkte Folge hat einen Grenzwert. Beweis: Wir behandeln nur den Fall einer monoton wachsenden Folge (xn )n≥0 . Sei r eine obere Schranke, das heißt xn ≤ r für alle n ≥ 0. Dann ist r auch eine obere Schranke für die Menge M = {xn : n ≥ 0}. Nach Satz 3.3 hat M eine kleinste obere Schranke x. Wir zeigen limn→∞ xn = x gilt. Sei ε > 0 vorgegeben. Da x die kleinste obere Schranke von M ist, ist x − ε keine obere Schranke. Es existiert ein n0 mit xn0 > x − ε. Da x eine obere Schranke von M ist, gilt xn ≤ x für alle n ≥ 0. Da die Folge (xn )n≥0 monoton wachsend ist, gilt xn ≥ xn0 für alle n ≥ n0 . Damit ist x − ε < xn ≤ x für alle n ≥ n0 gezeigt. Es folgt |xn − x| < ε für alle n ≥ n0 , das heißt limn→∞ xn = x. Man nennt d eine obere Schranke einer Funktion f : [a, b] → R, wenn f (x) ≤ d für alle x ∈ [a, b] gilt. Hat eine Funktion eine obere Schranke, dann sagt man, sie ist nach oben beschränkt. Man nennt c eine untere Schranke einer Funktion f : [a, b] → R, wenn f (x) ≥ c für alle x ∈ [a, b] gilt. Hat eine Funktion eine untere Schranke, dann sagt man, sie ist nach unten beschränkt. Eine Funktion heißt beschränkt, wenn sie nach oben und nach unten beschränkt ist. Satz 3.5: Seien a und b in R mit a < b. Jede stetige Funktion f : [a, b] → R ist beschränkt und nimmt ihr Maximum und ihr Minimum an, das heißt es gibt ein x0 ∈ [a, b], sodass f (x) ≤ f (x0 ) für alle x ∈ [a, b] gilt, und ein x1 ∈ [a, b], sodass f (x) ≥ f (x1 ) für alle x ∈ [a, b] gilt. Beweis: Wir zeigen, dass f nach oben beschränkt ist. Wäre das nicht der Fall, dann würde für jedes n ∈ N ein xn ∈ [a, b] existieren, sodass f (xn ) ≥ n gilt. Nach dem Satz von Bolzano–Weierstraß hat (xn )n≥0 eine Teilfolge (xnk )k≥0 mit limk→∞ xnk = x ∈ [a, b]. Da f stetig ist, folgt limk→∞ f (xnk ) = f (x). Das ist aber ein Widerspruch dazu, dass f (xn ) ≥ n für alle n gilt. Also kann f nicht nach oben unbeschränkt sein. Sei M = {f (x) : x ∈ [a, b]}. Wir haben soeben gezeigt, dass diese Menge nach oben beschränkt ist. Nach Satz 3.3 hat M eine kleinste obere Schranke s. Wir zeigen, dass ein x0 ∈ [a, b] existiert mit f (x0 ) = s. Wäre das nicht der Fall, dann hätten wir f (x) < s für alle x ∈ [a, b]. Die Funktion g(x) = s−f1(x) wäre dann für alle x ∈ [a, b] definiert und wegen Satz 1.10 auch stetig. Da wir gezeigt haben, dass jede auf [a, b] stetige Funktion nach oben beschränkt ist, würde es ein r > 0 geben, sodass g(x) ≤ r für alle x ∈ [a, b] gilt. Daraus folgt aber f (x) ≤ s − 1r für alle x ∈ [a, b] und wir hätten eine obere Schranke für M gefunden, die kleiner als s ist. Daher muss es ein x0 ∈ [a, b] geben mit f (x0 ) = s. Wegen f (x) ≤ s für alle x ∈ [a, b] ist damit ein x0 gefunden, sodass f (x) ≤ f (x0 ) für alle x ∈ [a, b] gilt. Wendet man dieses Ergebnis auf die Funktion −f an, die ja ebenfalls stetig ist, dann ergibt sich die Existenz eines x1 ∈ [a, b], sodass −f (x) ≤ −f (x1 ) für alle x ∈ [a, b] gilt. Es folgt dann f (x) ≥ f (x1 ) für alle x ∈ [a, b]. Zum Abschluss sollen noch einige Eigenschaften des Infimums und des Supremums behandelt werden, die wir im nächsten Kapitel bei der Definition des Integrals brauchen. Für eine beschränkte nichtleere Teilmenge M von R bezeichnen wir das Infimum, die größte untere Schranke, mit inf M und das Supremum, die kleinste obere Schranke, mit sup M . Franz Hofbauer 45 Satz 3.6: Seien M und K beschränkte nichtleere Teilmengen von R. (a) Ist c eine untere und d eine obere Schranke von M , dann gilt c ≤ inf M ≤ sup M ≤ d. (b) Ist M ⊆ K, dann gilt inf M ≥ inf K und sup M ≤ sup K. (c) Für jedes ε > 0 existieren u und v in M mit u − ε < inf M und v + ε > sup M . Beweis: Für jedes Element u von M gilt inf M ≤ u und u ≤ sup M , sodass inf M ≤ sup M folgt. Da inf M die größte untere Schranke von M ist, gilt c ≤ inf M für jede beliebige untere Schranke c von M . Da sup M die kleinste obere Schranke von M ist, gilt d ≥ sup M für jede beliebige obere Schranke d von M . Damit ist (a) gezeigt. Sei M ⊆ K. Da inf K eine untere Schranke von K ist, ist inf K auch eine untere Schranke von M . Da inf M die größte untere Schranke von M ist, erhalten wir inf M ≥ inf K. Da sup K eine obere Schranke von K ist, ist sup K auch eine obere Schranke von M . Da sup M die kleinste obere Schranke von M ist, folgt sup M ≤ sup K. Damit ist (b) gezeigt. Sei ε > 0. Da inf M die größte untere Schranke von M ist, ist inf M + ε keine untere Schranke von M . Daher existiert ein u ∈ M mit u < inf M + ε. Da sup M die kleinste obere Schranke von M ist, ist sup M − ε keine obere Schranke von M . Daher existiert ein v ∈ M mit v > sup M − ε. Damit ist auch (c) gezeigt. Für eine beschränkte Funktion f : [a, b] → R und eine Teilmenge I von [a, b] sei f (I) die Menge {f (x) : x ∈ I}, das ist die Menge aller Funktionswerte, die auf der Teilmenge I von [a, b] angenommen werden. Üblicherweise schreibt man inf I f anstelle von inf f (I) und supI f anstelle von sup f (I). Als Folgerung von Satz 3.6 erhalten wir Satz 3.7: Sei f : [a, b] → R beschränkt und I und J nicht leere Teilmengen von [a, b]. (a) Ist c eine untere und d eine obere Schranke von f , dann gilt c ≤ inf I f ≤ supI f ≤ d. (b) Ist I ⊆ J, dann gilt inf I f ≥ inf J f und supI f ≤ supJ f . (c) Für jedes ε > 0 existieren x und y in I mit f (x) − ε < inf I f und f (y) + ε > supI f . Beweis: Diese drei Aussagen erhält man, indem man M = f (I) und K = f (J) in Satz 3.6 setzt. Es gilt ja I ⊆ J ⇒ f (I) ⊆ f (J). Weiters lässt sich u ∈ f (I) schreiben als f (x) mit x ∈ I und v ∈ f (I) als f (y) mit y ∈ I. IV. Integration Wir führen das Integral ein, um die Fläche unter dem Graph einer Funktion zu berechnen. Durch eine entsprechende Approximation dieser Fläche mit Hilfe von Rechtecken ergibt sich die Definition des Integrals. Es stellt sich heraus, dass Integrieren die Umkehrung des Differenzierens ist. Aus den Rechenregeln für die Ableitung erhält man wichtige Rechenregeln für das Integral. Mit Integralen kann man aber nicht nur Flächen berechnen, sondern auch anderes, wie zum Beispiel Volumina, Bogenlängen, Oberflächen und Schwerpunkte. Schließlich wird die Approximation von Funktionen durch Polynome behandelt. Der Fehler, den man dabei macht, lässt sich durch ein Integral ausdrücken. Das führt dann auch zur Untersuchung von Potenzreihen. 1. Definition und Eigenschaften des Integrals Sei f : [a, b] → R eine beschränkte Funktion. Unser Ziel ist es, die Fläche zu berechnen, die von der x-Achse, dem Graph der Funktion f und den beiden senkrechten Geraden durch die Punkte (a, 0) und (b, 0) begrenzt wird. Liegt der Graph der Funktion unterhalb der x-Achse, dann hat die Fläche negatives Vorzeichen. Liegt der Graph teilweise über und teilweise unter der x-Achse, dann werden die Flächenstücke, die unter der x-Achse liegen, von denen, die über der x-Achse liegen, subtrahiert. Wir approximieren durch Rechtecke. Dazu sei a = x0 < x1 < · · · < xn = b. Das ergibt eine Zerlegung des Intervalls [a, b] in Teilintervalle. Das Maximum der Differenzen xj −xj−1 nennen wir die Gitterweite der Zerlegung. Hat die Zerlegung Gitterxn−1 ξn b a ξ1 x1 ξ2 x2 weite α, dann gilt xj −xj−1 ≤ α für 1 ≤ j ≤ n. Für jedes j wählen wir ein ξj ∈ [xj−1 , xj ]. Die Rechtecke mit Basislängen xj − xj−1 und Höhen ∑nf (ξj ) approximieren die zu berechnende Fläche. Die Gesamtfläche dieser Rechtecke ist j=1 (xj − xj−1 )f (ξj ). Für eine nicht leere Teilmenge I von [a, b] sei supI f das Supremum und inf I f das Infimum der Menge f (I) = {f (x) : x ∈ I}. Wir fassen eine Zerlegung des Intervalls [a, b] als endliche Menge Z von Punkten in [a, b] auf, die a und b enthält. Sei Z = {x0 , x1 , . . . , xn } eine Zerlegung des Intervalls [a, b], wobei a = x0 < x1 < · · · < xn = b gilt. Wir definieren ∑n ∑n OZ (f ) = j=1 (xj − xj−1 ) sup[xj−1 ,xj ] f und UZ (f ) = j=1 (xj − xj−1 ) inf [xj−1 ,xj ] f und nennen OZ (f ) die Obersumme und UZ (f ) die Untersumme der Funktion f zur Zerlegung Z. Weiters nennen wir die bereits oben erwähnten Summen ∑n j=1 (xj − xj−1 )f (ξj ) mit ξj ∈ [xj−1 , xj ] Riemannsummen zur Zerlegung Z. Jede Riemannsumme zur Zerlegung Z liegt zwischen UZ (f ) und OZ (f ). Es ist möglich, dass UZ (f ) oder OZ (f ) oder beide keine Riemannsummen sind. Franz Hofbauer 47 Wir beweisen einige Eigenschaften von Ober– und Untersumme. Satz 4.1: Sei f : [a, b] → R beschränkt mit unterer Schranke c und oberer Schranke d. Sei R eine Zerlegung von [a, b] mit Gitterweite α. Weiters sei s ∈ [a, b] und R̃ = R ∪ {s}. Dann gilt OR̃ (f ) ≤ OR (f ) ≤ OR̃ (f ) + α(d − c) und UR̃ (f ) ≥ UR (f ) ≥ UR̃ (f ) − α(d − c). Beweis: Wenn s in R liegt, dann gilt R̃ = R. Wir erhalten OR̃ (f ) = OR (f ) und UR̃ (f ) = UR (f ), sodass die zu beweisenden Ungleichungen trivial sind. Sei daher R = {x0 , x1 , . . . , xn } und s ∈ / R. Es existiert ein j mit xj−1 < s < xj . Aus der Definition der Obersumme folgt dann OR (f ) − (xj − xj−1 ) sup[xj−1 ,xj ] f = OR̃ (f ) − (xj − s) sup[s,xj ] f − (s − xj−1 ) sup[xj−1 ,s] f. Wegen Satz 3.7 (b) gilt sup[xj−1 ,xj ] f ≥ sup[s,xj ] f und sup[xj−1 ,xj ] f ≥ sup[xj−1 ,s] f . Somit ist OR (f ) − OR̃ (f ) = (xj − xj−1 ) sup[xj−1 ,xj ] f − (xj − s) sup[s,xj ] f − (s − xj−1 ) sup[xj−1 ,s] f größer oder gleich 0 und die erste Ungleichung ist gezeigt. Wegen Satz 3.7 (a) gilt auch sup[xj−1 ,xj ] f ≤ d, sup[s,xj ] f ≥ c und sup[xj−1 ,s] f ≥ c. Daraus folgt OR (f ) − OR̃ (f ) ≤ (xj − xj−1 )d − (xj − s)c − (s − xj−1 )c = (xj − xj−1 )(d − c) ≤ α(d − c). Damit ist auch die zweite Ungleichung gezeigt. Der Beweis für die Untersummen läuft analog. Aus der Definition der Untersumme folgt UR (f ) − (xj − xj−1 ) inf [xj−1 ,xj ] f = UR̃ (f ) − (xj − s) inf [s,xj ] f − (s − xj−1 ) inf [xj−1 ,s] f. Wegen Satz 3.7 (b) gilt inf [xj−1 ,xj ] f ≤ inf [s,xj ] f und inf [xj−1 ,xj ] f ≤ inf [xj−1 ,s] f . Somit ist UR (f ) − UR̃ (f ) = (xj − xj−1 ) inf [xj−1 ,xj ] f − (xj − s) inf [s,xj ] f − (s − xj−1 ) inf [xj−1 ,s] f kleiner oder gleich 0 und die dritte Ungleichung ist gezeigt. Wegen Satz 3.7 (a) gilt auch inf [xj−1 ,xj ] f ≥ c, inf [s,xj ] f ≤ d und inf [xj−1 ,s] f ≤ d. Daraus folgt UR̃ (f ) − UR (f ) ≤ (xj − s)d + (s − xj−1 )d − (xj − xj−1 )c = (xj − xj−1 )(d − c) ≤ α(d − c). Damit ist auch die vierte Ungleichung gezeigt. Satz 4.2: Sei f : [a, b] → R beschränkt und seien Y und Z Zerlegungen von [a, b]. (a) Wenn Y ⊆ Z gilt, dann auch OY (f ) ≥ OZ (f ) und UY (f ) ≤ UZ (f ). (b) Es gilt UY (f ) ≤ OZ (f ). Beweis: Um (a) zu zeigen, sei R0 = Y und R1 , R2 , . . . , Rk seien so gewählt, dass Ri+1 aus Ri durch Hinzufügen eines Punktes entsteht und Rk = Z gilt. Aus Satz 4.1 folgt ORj−1 (f ) ≥ ORj (f ) und URj−1 (f ) ≤ URj (f ) für 1 ≤ j ≤ k. Daraus erhalten wir dann OY (f ) = OR0 (f ) ≥ ORk (f ) = OZ (f ) und UY (f ) = UR0 (f ) ≤ URk (f ) = UZ (f ). Damit ist (a) gezeigt. Um (b) zu zeigen, sei X = Y ∪ Z. Aus der Definition von Ober- und Untersumme und Satz 3.7 (a) folgt UX (f ) ≤ OX (f ). Aus (a) erhalten wir UY (f ) ≤ UX (f ) wegen Y ⊆ X und OZ (f ) ≥ OX (f ) wegen Z ⊆ X . Somit ergibt sich UY (f ) ≤ OZ (f ). Sei SO = {OZ (f ) : Z eine Zerlegung von [a, b]}. Nach Satz 4.2 (b) ist UY (f ) für jede Zerlegung Y von [a, b] eine untere Schranke der Menge SO . Somit hat die Menge SO eine größte untere Schranke, die wir mit O(f ) bezeichnen, und wegen Satz 3.6 (a) gilt UY (f ) ≤ O(f ) für jede Zerlegung Y von [a, b]. Sei SU = {UY (f ) : Y eine Zerlegung von [a, b]}. Wir haben soeben gezeigt, dass O(f ) eine obere Schranke der Menge SU ist. Somit hat die Menge SU auch eine kleinste obere Schranke, die wir mit U (f ) bezeichnen, und wegen Satz 3.6 (a) gilt U (f ) ≤ O(f ). Wir fassen zusammen: Es gilt OZ (f ) ≥ O(f ) für alle Zerlegungen Z von [a, b], da O(f ) eine untere Schranke von SO ist. Ebenso gilt UZ (f ) ≤ U (f ) für alle Zerlegungen Z von [a, b], da U (f ) eine obere Schranke von SU ist. Und wir haben U (f ) ≤ O(f ) gezeigt. 48 Integration Die Fläche zwischen dem Graph der Funktion f und der x-Achse wird durch O(f ) von oben und durch U (f ) von unten approximiert. Eine beschränkte Funktion f : [a, b] → R heißt daher integrierbar, wenn O(f ) = U (f ) gilt. Man bezeichnet diese Zahl dann mit ∫b f (x) dx und nennt sie das Integral der Funktion f in den Grenzen von a bis b. Dabei a spielt x dieselbe Rolle wie eine Summationsvariable. Man kann genausogut eine andere ∫b Variable schreiben, zum Beispiel a f (y)dy. Im nächsten Satz charakterisieren wir das Integral als Grenzwert von Ober– und Untersummen und im übernächsten Satz dann als Grenzwert von Riemannsummen. Satz 4.3: Sei f : [a, b] → R eine beschränkte Funktion und sei (Zn )n≥1 eine Folge von Zerlegungen des Intervalls [a, b] mit Gitterweiten αn , für die limn→∞ αn = 0 gilt. Dann gilt auch limn→∞ UZn (f ) = U (f ) und limn→∞ OZn (f ) = O(f ). Beweis: Sei ε > 0 vorgegeben. Da U (f ) nach Definition gleich sup SU ist, existiert nach Satz 3.6 (c) eine Zerlegung Y des Intervalls [a, b] mit UY (f ) + 2ε > U (f ). Sei k die Anzahl der Unterteilungspunkte der Zerlegung Y. Sei c eine untere und d eine obere Schranke der Funktion f . Wir wählen n0 so, dass kαn (d − c) < 2ε für alle n ≥ n0 gilt. Für n ≥ 1 sei Xn = Zn ∪ Y. Man kann zwischen Zn und Xn Zerlegungen einfügen, sodass jede dieser Zerlegungen jeweils einen Punkt mehr als die vorhergehende enthält. Durch wiederholtes Anwenden von Satz 4.1 erhalten wir dann UZn (f ) ≥ UXn (f ) − kαn (d − c), da jede Zerlegung, die Zn enthält, Gitterweite ≤ αn hat. Weiters folgt UXn (f ) ≥ UY (f ) aus Satz 4.2 (a) wegen Y ⊆ Xn . Für n ≥ n0 gilt dann UZn (f ) > UY (f ) − 2ε > U (f ) − ε. Da U (f ) eine obere Schranke der Menge SU ist, gilt U (f ) ≥ UZn (f ) für alle n ≥ 1. Somit liegt UZn (f ) für n ≥ n0 in der ε-Umgebung von U (f ). Damit ist limn→∞ UZn (f ) = U (f ) bewiesen. Der Beweis von limn→∞ OZn (f ) = O(f ) läuft analog. Satz 4.4: Sei f : [a, b] → R integrierbar und (Zn )n≥1 eine Folge von Zerlegungen des Intervalls [a, b], deren Gitterweiten für n → ∞ gegen 0 gehen. Für n ≥ 1 sei An (f ) ∫b irgendeine Riemannsumme zur Zerlegung Zn . Dann gilt limn→∞ An (f ) = a f (x)dx. ∫b Beweis: Da f : [a, b] → R eine integrierbare Funktion ist, gilt U (f ) = O(f ) = a f (x)dx. Weiters gilt UZn (f ) ≤ An (f ) ≤ OZn (f ), da An (f ) eine Riemannsumme zur Zerlegung Zn ∫b ∫b ist. Nach Satz 4.3 gilt limn→∞ UZn (f ) = a f (x)dx und limn→∞ OZn (f ) = a f (x) dx, ∫b woraus limn→∞ An (f ) = a f (x)dx folgt. Wir beweisen einfache Rechenregeln für das Integral. Satz 4.5: Seien f und g integrierbare Funktionen von [a, b] nach R und sei c in R. Dann ∫b ∫b ∫b ∫b ∫b gilt a f (x) + g(x) dx = a f (x) dx + a g(x)dx und a cf (x) dx = c a f (x) dx. Beweis: Sei I ein Intervall. Für alle x ∈ I gilt f (x) ≤ supI f und g(x) ≤ supI g, also auch f (x) + g(x) ≤ supI f + supI g. Somit ist supI f + supI g eine obere Schranke für die Menge {f (x) + g(x) : x ∈ I}. Es folgt supI (f + g) ≤ supI f + supI g. Analog zeigt man auch inf I (f + g) ≥ inf I f + inf I g. Sei Z = {x0 , x1 , . . . , xi } eine Zerlegung des Intervalls [a, b], wobei a = x0 < · · · < xi = b gilt. Wir haben oben gezeigt, dass inf [xj−1 ,xj ] f + inf [xj−1 ,xj ] g ≤ inf [xj−1 ,xj ] (f + g) und sup[xj−1 ,xj ] (f + g) ≤ sup[xj−1 ,xj ] f + sup[xj−1 ,xj ] g für 1 ≤ j ≤ i gilt. Multipliziert man diese Ungleichungen mit xj − xj−1 und summiert über j, so ergibt sich UZ (f ) + UZ (g) ≤ UZ (f + g) und OZ (f + g) ≤ OZ (f ) + OZ (g) Franz Hofbauer 49 Da UZ (h) ≤ U (h) ≤ O(h) ≤ OZ (h) für alle Funktionen h gilt, erhalten wir UZ (f ) + UZ (g) ≤ UZ (f + g) ≤ U (f + g) ≤ O(f + g) ≤ OZ (f + g) ≤ OZ (f ) + OZ (g) Sei jetzt (Zn )n≥1 eine Folge von Zerlegungen des Intervalls [a, b], deren Gitterweiten für n → ∞ gegen 0 gehen. Dann ergibt sich aus obigen Ungleichungen UZn (f ) + UZn (g) ≤ U (f + g) ≤ O(f + g) ≤ OZn (f ) + OZn (g) ∫b Da f und g integrierbar sind, folgen limn→∞ UZn (f ) = limn→∞ OZn (f ) = a f (x)dx und ∫b limn→∞ UZn (g) = limn→∞ OZn (g) = a g(x)dx aus Satz 4.3. Damit erhalten wir ∫b ∫b U (f + g) = O(f + g) = a f (x)dx + a g(x) dx ∫b Das zeigt, dass auch die Funktion f + g integrierbar ist und dass a f (x) + g(x)dx = ∫b ∫b f (x) dx + a g(x)dx gilt. Damit ist die erste Aussage gezeigt. a Nun zur zweiten Aussage. Sei I ein Intervall. Für alle x ∈ I gilt f (x) ≤ supI f . Ist c ≥ 0, dann folgt cf (x) ≤ c supI f für alle x ∈ I. Somit ist c supI f eine obere Schranke für die Menge {cf (x) : x ∈ I}, woraus supI (cf ) ≤ c supI f folgt. Analog zeigt man auch inf I (cf ) ≥ c inf I f . Ist c < 0, dann folgt cf (x) ≥ c supI f für alle x ∈ I. Somit ist c supI f eine untere Schranke für die Menge {cf (x) : x ∈ I}, woraus inf I (cf ) ≥ c supI f folgt. Analog zeigt man auch supI (cf ) ≤ c inf I f . Ist Z eine Zerlegung des Intervalls [a, b], dann folgt wie oben, dass cUZ (f ) ≤ UZ (cf ) und OZ (cf ) ≤ cOZ (f ) im Fall c ≥ 0 gilt, und cOZ (f ) ≤ UZ (cf ) und OZ (cf ) ≤ cUZ (f ) im Fall c < 0 Da UZ (h) ≤ U (h) ≤ O(h) ≤ OZ (h) für alle Zerlegungen Z und alle Funktionen h gilt, erhalten wir cUZ (f ) ≤ UZ (cf ) ≤ U (cf ) ≤ O(cf ) ≤ OZ (cf ) ≤ cOZ (f ) im ersten und cOZ (f ) ≤ UZ (cf ) ≤ U (cf ) ≤ O(cf ) ≤ OZ (cf ) ≤ cUZ (f ) im zweiten Fall. Sei jetzt (Zn )n≥1 eine Folge von Zerlegungen des Intervalls [a, b], deren Gitterweiten für n → ∞ gegen 0 gehen. Dann ergibt sich cUZn (f ) ≤ U (cf ) ≤ O(cf ) ≤ cOZn (f ) im ersten und cOZn (f ) ≤ U (cf ) ≤ O(cf ) ≤ cUZn (f ) im zweiten Fall. Da f integrierbar ist, folgt ∫b limn→∞ UZn (f ) = limn→∞ OZn (f ) = a f (x) dx aus Satz 4.3. Damit erhalten wir sowohl im Fall c ≥ 0 als auch im Fall c < 0 ∫b U (cf ) = O(cf ) = c a f (x)dx ∫b ∫b Somit ist auch die Funktion cf integrierbar und es gilt a cf (x)dx = c a f (x)dx. Zweiter Beweis: Sei h = f + g. Sei (Zn )n≥1 eine Folge von Zerlegungen des Intervalls [a, b], deren Gitterweiten gegen 0 gehen. Nach Satz 4.3 gilt limn→∞ OZn (h) = O(h). Wir suchen eine geeignete Riemannsumme zur Zerlegung Zn . Sei Zn = {x0 , x1 , . . . , xi }. 1 Wir wählen ξj ∈ [xj−1 , xj ] so, dass h(ξj ) > sup[xj−1 ,xj ] h − n(b−a) gilt. Das ist nach Satz 3.7 (c) möglich. Die zu diesen Zwischenpunkten gehörige Riemannsumme ist An (h) = ∑i j=1 (xj − xj−1 )h(ξj ). Multipliziert man obige Ungleichung mit xj − xj−1 und summiert ∑i über j, so ergibt sich An (h) > OZn (h) − n1 wegen j=1 (xj − xj−1 ) = b − a. Da An (h) eine Riemannsumme ist, gilt auch An (h) ≤ OZn (h). Wegen limn→∞ OZn (h) = O(h) erhalten wir limn→∞ An (h) = O(h). ∑i ∑i Seien An (f ) = j=1 (xj −xj−1 )f (ξj ) und An (g) = j=1 (xj −xj−1 )g(ξj ) die Riemannsummen für die Funktionen f und g zur Zerlegung Zn , die dieselben Zwischenpunkte verwen- 50 Integration ∫b den wie die Riemannsumme An (h). Nach Satz 4.4 gilt limn→∞ An (f ) = a f (x)dx und ∫b limn→∞ An (g) = a g(x) dx, da f und g integrierbar sind. Da An (h) = An (f ) + An (g) ∫b ∫b für alle n ≥ 1 gilt, erhalten wir limn→∞ An (h) = a f (x)dx + a g(x)dx. Damit ist ∫b ∫b O(h) = a f (x)dx + a g(x) dx gezeigt. ∫b ∫b Analog zeigt man U (h) = a f (x) dx+ a g(x)dx. (Man braucht nur OZn (h) durch UZn (h), O(h) durch U (h), sup durch inf und − n1 durch n1 ersetzen und die Ungleichheitszeichen ∫b ∫b umdrehen.) Insgesamt haben wir U (h) = O(h) = a f (x)dx + a g(x)dx. Das zeigt, dass ∫b ∫b ∫b die Funktion h = g + f integrierbar ist und dass a h(x) dx = a f (x) dx + a g(x)dx gilt. Damit ist die erste Aussage gezeigt. Sei jetzt h = cf . Sei (Zn )n≥1 eine Folge von Zerlegungen des Intervalls [a, b], deren Gitterweiten gegen 0 gehen. Nach Satz 4.3 gilt limn→∞ OZn (h) = O(h). Wir gehen genauso vor wie im ersten Teil des Beweises. Zur Zerlegung Zn = {x0 , x1 , . . . , xi } ∑i finden wir eine Riemannsumme An (h) = j=1 (xj − xj−1 )h(ξj ) für die OZn (h) ≥ An (h) > OZn (h) − n1 gilt. Wegen limn→∞ OZn (h) = O(h) gilt dann auch limn→∞ An (h) = O(h). ∑i Sei An (f ) = j=1 (xj − xj−1 )f (ξj ) die Riemannsumme für die Funktion f zur Zerlegung Zn , die dieselben Zwischenpunkte verwendet wie die Riemannsumme An (h). Nach Satz 4.4 ∫b gilt limn→∞ An (f ) = a f (x) dx, da f integrierbar ist. Da An (h) = cAn (f ) für alle n ≥ 1 ∫b ∫b gilt, erhalten wir limn→∞ An (h) = c a f (x)dx. Damit ist O(h) = c a f (x) dx gezeigt. ∫b ∫b Analog zeigt man U (h) = c a f (x)dx. Insgesamt haben wir U (h) = O(h) = c a f (x)dx. ∫b ∫b Das zeigt, dass die Funktion h = cf integrierbar ist und dass a h(x)dx = c a f (x) dx gilt. Damit ist auch die zweite Aussage gezeigt. Satz 4.6: Seien f und g integrierbare Funktionen von [a, b] nach R mit f (x) ≤ g(x) für ∫b ∫b alle x ∈ [a, b]. Dann gilt a f (x)dx ≤ a g(x) dx. Beweis: Sei h(x) = g(x) − f (x). Dann gilt h ≥ 0. Wegen Satz 4.5 ist h integrierbar ∫b ∫b ∫b und es gilt a h(x) dx = a g(x) dx − a f (x)dx. Da jede Untersumme von h größer oder ∫b gleich Null sein muss, folgt a h(x) dx ≥ 0 aus der Definition des Integrals. Das ergibt ∫b ∫b f (x) dx ≤ a g(x)dx. a Man kann f : [a, b] → R natürlich auch∫über Teilintervalle seines Definitionsintervalls v integrieren. Gilt a ≤ u < v ≤ b, so wird u f (x) dx wie oben definiert. Es ist bequem, ∫u ∫u ∫v diese Definition zu ergänzen, indem man u f (x)dx = 0 und v f (x) dx = − u f (x)dx definiert. Wie man leicht sieht, bleiben die Aussagen von Satz 4.5 richtig, wenn die obere Integrationsgrenze kleiner oder gleich der unteren ist. Denkt man an die Interpretation des Integrals als Fläche, dann ist der folgende Satz unmittelbar einsichtig. Addiert man die Fläche zwischen den Grenzen u und v zu der zwischen den Grenzen v und w, dann erhält man natürlich die Fläche zwischen den Grenzen u und w. Wir geben einen formalen Beweis mit Hilfe von Riemannsummen. Satz 4.7: ∫ Seien u, v und im Definitionsintervall der Funktion f liegen. ∫ v w Zahlen,∫die w w Dann gilt u f (x)dx = u f (x)dx + v f (x) dx, wobei die Existenz dieser Integrale vorausgesetzt wird. Beweis: Sind zwei der Zahlen u, v und w gleich, dann folgt die gesuchte Gleichung sofort Franz Hofbauer 51 aus den Definitionen. Wir nehmen daher an, dass diese drei Zahlen verschieden sind. Sei zuerst u < v < w. Sei (Un )n≥1 eine Folge von Zerlegungen des Intervalls [u, v], deren Gitterweite für n → ∞ gegen 0 konvergiert. Ebenso sei (Yn )n≥1 eine Folge von Zerlegungen des Intervalls [v, w], deren Gitterweite für n → ∞ gegen 0 konvergiert. Für n ≥ 1 sei An (f ) eine Riemannsumme von f zur Zerlegung Un und Bn (f ) eine Riemannsumme ∫v von f zur Zerlegung Yn . Mit Hilfe von Satz 4.4 folgt limn→∞ An (f ) = u f (x)dx und ∫w limn→∞ Bn (f ) = v f (x) dx. Für n ≥ 1 sei Zn = Un ∪ Yn und Cn (f ) = An (f ) + Bn (f ). Dann ist Zn eine Zerlegung des Intervalls [u, w] und Cn (f ) eine Riemannsumme von f zur Zerlegung Zn . Für n → ∞ konvergiert die Gitterweite der Zerlegungen Zn gegen 0. ∫w Aus Satz 4.4 folgt limn→∞ Cn (f ) = u f (x)dx. Lässt man n in der Gleichung Cn (f ) = ∫w ∫v ∫w An (f ) + Bn (f ) gegen ∞ gehen, dann hat man u f (x)dx = u f (x) dx + v f (x)dx. Liegen die Zahlen u, v und w in einer anderen Reihenfolge, so kann man das gewünschte Resultat Fall v < u <∫w, dann haben ∫u ∫ wzurückführen. Gilt zum Beispiel ∫u ∫ w auf den bewiesenen v f (x)dx = v f (x)dx + u f (x)dx gezeigt. Wegen v f (x)dx = − u f (x)dx folgt wir ∫v ∫w ∫w v f (x) dx = − u f (x) dx + u f (x)dx, also die zu beweisende Gleichung. v Wir werden später beweisen, dass jede stetige Funktion integrierbar ist. Mit Hilfe dieses Resultats zeigen wir zwei wichtige Sätze. Satz 4.8 (Mittelwertsatz der Integralrechnung) Seien a und b verschiedene Punkte in R und sei J = [a, b], wenn a < b, und J = [b, a], wenn b < a. Seien f und g stetige Funktionen von J nach R und es gelte entweder g ≥ 0 oder g ≤ 0. Dann existiert ein c ∈ J mit ∫b ∫b ∫b f (t)g(t)dt = f (c) g(t)dt. Insbesondere eistiert ein c ∈ J mit f (t)dt = (b − a)f (c). a a a Beweis: Sei zuerst a < b und g ≥ 0. Da f : J → R stetig ist, existiert ein Punkt u ∈ J, in dem f sein Minimum annimmt, und ein Punkt v ∈ J, in dem f sein Maximum annimmt. Es gilt f (u) ≤ f (t) ≤ f (v) für alle t ∈ J. Wegen g ≥ 0 folgt f (u)g(t) ≤ f (t)g(t) ≤ f (v)g(t) für alle t ∈ J und daraus wegen Satz 4.6 und a < b dann ∫b ∫b ∫b (∗) f (u) a g(t) dt ≤ a f (t)g(t) dt ≤ f (v) a g(t)dt ∫b ∫b Gilt a g(t) dt = 0, dann auch a f (t)g(t) dt = 0 und man kann c ∈ J beliebig wählen. /∫b ∫b ∫b Gilt a g(t)dt ̸= 0, dann existiert ein c ∈ J mit f (c) = a f (t)g(t)dt a g(t)dt. Hat man in (∗) Ungleichheit, dann gilt das für ein c zwischen u und v nach dem Zwischenwertsatz. Hat man in (∗) eine Gleichheit, dann kann man c = u oder c = v wählen. Damit ist ∫b ∫b f (t)g(t)dt = f (c) g(t)dt für g ≥ 0 und a < b bewiesen ist. a a ∫a Sei jetzt b < a und g ≥ 0. Es wurde gezeigt, dass ein c ∈ J existiert mit b f (t)g(t)dt = ∫a ∫b ∫b ∫b f (c) b g(t)dt, das heißt − a f (t)g(t) dt = −f (c) a g(t)dt, woraus dann a f (t)g(t)dt = ∫b f (c) a g(t)dt folgt. Damit ist der Satz für g ≥ 0 und Punkte a und b mit a ̸= b bewiesen. Sei schließlich g ≤ 0 und a ̸= b. Dann gilt −g ≥ 0. Es wure gezeigt, dass ein c ∈ J existiert ∫b ∫b ∫b ∫b mit a −f (t)g(t)dt = f (c) a −g(t)dt, woraus a f (t)g(t)dt = f (c) a g(t) dt folgt. Damit ist der Satz vollständig bewiesen. Die letzte Aussage ist der Spezialfall, wo g die konstante Funktion 1 ist. Der zweite Satz ist der sogenannte Hauptsatz der Differential- und Integralrechnung, der besagt, dass Integrieren die Umkehrung des Differenzierens ist. Definition: Sei I ein offenes Intervall und f : I → R eine Funktion. Eine Funktion F : I → R heißt Stammfunktion von f , wenn die Ableitung F ′ von F gleich f ist. 52 Integration Satz 4.9 (Hauptsatz der Differential- und Integralrechnung) Sei I ein offenes Intervall, das auch unbeschränkt sein kann, und f : I → R stetig. Dann hat f eine Stammfunktion. Die Differenz zweier Stammfunktionen von f ist konstant. Für jede Stammfunktion F von ∫b f und a und b in I gilt a f (y)dy = F (b) − F (a). ∫x Beweis: Sei u ∈ I beliebig und G(x) = u f (t) dt für x ∈ I. Dieses Integral existiert, da ∫y f stetig ist. Für x und y in I mit x ̸= y gilt G(y) − G(x) = x f (t) dt nach Satz 4.7. Aus Satz 4.8 mit a = x und b = y folgt die Existenz einer Zahl c im Intervall mit den Endpunkten x und y, sodass G(y) − G(x) = (y − x)f (c) gilt. Wir erhalten daher limy→x G(y)−G(x) = limy→x f (c) = f (x), da f stetig ist und mit y ja auch c gegen x gehen y−x muss. Also gilt G′ (x) = f (x), das heißt G ist eine Stammfunktion von f . Die Existenz einer Stammfunktion ist somit bewiesen. Sind F und F̃ zwei beliebige Stammfunktionen, dann gilt (F − F̃ )′ = f − f = 0 auf I. Somit ist F − F̃ auf I konstant. Die Differenz zweier Stammfunktionen ist konstant. Ist F eine beliebige Stammfunktion, dann gilt F = G + c für eine Konstante c. Daher gilt ∫a ∫b ∫b F (b) − F (a) = G(b) − G(a) = u f (y) dy − u f (y)dy = a f (y) dy nach Satz 4.7. Mit Hilfe dieses Satzes kann man leicht Stammfunktionen für verschiedene Funktionen angeben. Ist f (x) = ex , dann ist F (x) = ex + c eine Stammfunktion von f für jedes c ∈ R, da ja F ′ (x) = f (x) gilt. Ebenso erhält man für f (x) = sin x die Stammfunktionen F (x) = − cos x + c und für f (x) = cos x die Stammfunktionen F (x) = sin x + c. Ist r+1 f (x) = xr mit r ∈ R, dann erhält man F (x) = xr+1 + c für r ̸= −1 und F (x) = ln |x| + c für r = −1 als Stammfunktionen, für r < 0 auf I = (0, ∞) oder auf I = (−∞, 0). Beispiel: Wir berechnen die Fläche unter einem Bogen der Sinuskurve. Gesucht ist also ∫π sin x dx. Da − cos x eine Stammfunktion von sin x ist, hat dieses Integral nach Satz 4.9 0 den Wert − cos π + cos 0 = 2. Aus den Rechenregeln für die Ableitung erhält man mit Hilfe von Satz 4.9 die wohl wichtigsten Rechenregeln fürs Integral, nämlich die partielle Interation und die Substitutionsregel. Zuerst noch eine Definition. Definition: Sei I ein offenes Intervall. Eine Funktion f : I → R heißt stetig differenzierbar, wenn die Ableitung f ′ existiert und stetig ist. Satz 4.10 (Partielle Integration) Seien f und g auf dem offenen Intervall I stetig differen∫b ∫b zierbar. Für a und b in I gilt a f ′ (x)g(x)dx = f (b)g(b) − f (a)g(a) − a f (x)g ′ (x)dx. Beweis: Die Produktregel besagt (f g)′ = f ′ g + f g ′ . Integriert man von a bis b, so folgt ∫b ∫b ∫b (f (x)g(x))′ dx = a f ′ (x)g(x)dx + a f (x)g ′ (x) dx. Da f g eine Stammfunktion von a ∫b (f g)′ ist, erhalten wir aus Satz 4.9, dass a (f (x)g(x))′ dx = f (b)g(b) − f (a)g(a) gilt. b Oft verwendet man die Schreibweise h(x)a = h(b) − h(a). Damit läßt sich die Formel b ∫ b ∫b ′ für die partielle Integration so schreiben f (x)g(x) dx = f (x)g(x) − f (x)g ′ (x)dx. ∫b a a a x ln x dx durch partielle Integration. Setzt man f ′ (x) = x, b ∫ b 2 ∫b 2 2 also f (x) = x2 , und g(x) = ln x, dann folgt a x ln x dx = x2 ln xa − a x2 x1 dx. Weiters ∫b 2 2 b gilt a x2 dx = x4 a , da x4 eine Stammfunktion von x2 ist, wie man leicht nachprüft. Wir ∫b 2 b 2 2 2 erhalten a x ln x dx = x2 ln x − x4 a = b4 (2 ln b − 1) − a4 (2 ln a − 1). Beispiel: Wir berechnen a Franz Hofbauer 53 Satz 4.11 (Substitutionsregel) Seien I und J offene Intervalle und φ : I → J stetig differenzierbar. Die Funktion f : J → R sei stetig und F sei eine Stammfunktion von f . ∫ φ(b) ∫b Für a und b in I gilt dann φ(a) f (x)dx = F (φ(b)) − F (φ(a)) = a f (φ(t))φ′ (t) dt. Beweis: Wir verwenden die Kettenregel (F ◦ φ)′ (t) = f (φ(t))φ′ (t). Integriert man von ∫b a bis b, so folgt F (φ(b)) − F (φ(a)) = a f (φ(t))φ′ (t) dt aus Satz 4.9. Da F eine Stamm∫ φ(b) funktion von f ist, gilt φ(a) f (x) dx = F (φ(b)) − F (φ(a)) wieder wegen Satz 4.9. ∫v x Beispiel: Wir berechnen 0 √2x+1 dx mit Hilfe der Substitutionsregel. Zuerst muss man √ herausfinden, welche Funktion in x man als neue Variable t wählt. Wir wollen 2x + 1 √ 2 los werden, daher wählen wir t = 2x + 1. Daraus folgt x = t 2−1 . Das ist auch die 2 Funktion φ, also φ(t) = t 2−1 und daher φ′ (t) = t. Wir müssen a und b so bestimmen, √ dass φ(a) = 0 und φ(b) = v gilt. Das kann man aus t = 2x + 1 berechnen, da dadurch die Umkehrfunktion von φ gegeben den Grenzen 0 und v läuft, √ ist. Wenn x zwischen √ dann läuft t zwischen den Grenzen 2 · 0 + 1 = 1√und 2v + 1. Setzt man das alles in die ∫v x ∫ 2v+1 t2 −1 Substitutionsregel ein, so folgt 0 √2x+1 dx = 1 2t t dt. Eine Stammfunktion des √2v+1 ∫ √ 2 3 3 v x Integranden t 2−1 ist t6 − 2t . Wir erhalten 0 √2x+1 = v−1 dx = t −3t 2v + 1 − 13 . 6 3 1 Will man eine Stammfunktion einer Funktion f bestimmen, dann berechnet man F (t) = f (x) dx, wobei a beliebig ist. Wegen Satz 4.9 ist das eine Stammfunktion von f . Man a ∫ erhält eine Stammfunktion F (x) auch als unbestimmtes Integral f (x)dx, das heißt man rechnet das Integral aus, ohne danach Grenzen einzusetzen. Das ergibt dasselbe abgesehen von der Konstanten, die durch das Einsetzen der unteren Grenze dazukommt. Aus dem 2 vorletzten Beispiel folgt, dass F (x) = x4 (2 ln x − 1) eine Stammfunktion von f (x) = x ln x ist. Verwendet man die Substitutionsregel beim Berechnen eines unbestimmten Integrals, dann erhält man die Stammfunktion als Funktion der neu eingeführten Variablen. Aus 3 x dem letzten Beispiel folgt, dass t −3t eine Stammfunktion von f (x) = √2x+1 ist, jedoch 6 √ in der neuen Variablen t. Durch Zurücksubstituieren von t = 2x + 1 erhält man die √ Stammfunktion F (x) = x−1 2x + 1. 3 √ Enthält die zu integrierende Funktion den Ausdruck r2 − x2 , dann kann man die Substitution x = r sin t versuchen. Wir rechnen dazu zwei Beispiele. ∫r√ Beispiel: Wir wollen 0 r2 − x2 dx berechnen. Wir versuchen dieses Integral zu lösen, indem wir x = φ(t) = r sin t substituieren. Da x zwischen den Grenzen 0 und r läuft, läuft t zwischen den Grenzen 0 und π2 . Es gilt ja r sin 0 = 0 und r sin π2 = r. Wegen ∫r√ 1 − sin2 t = cos2 t und φ′ (t) = r cos t folgt aus der Substitutionsregel 0 r2 − x2 dx = ∫π ∫ π2 2 2 1 r cos t · r cos t dt = r (1 + cos 2t)dt. Da 14 (2t + sin 2t) eine Stammfunktion von 0 0 2∫ √ 2 2 2 r 1 r2 − x2 dx = r4 (π + sin π) − r4 (0 + sin 0) = r 4π . 2 (1 + cos 2t) ist, erhalten wir 0 ∫r Beispiel: Wir berechnen 0 (r2 − x2 )3/2 dx. Wir substituieren wieder x = φ(t) = r sin t. Da x zwischen den Grenzen 0 und r läuft, läuft t zwischen den Grenzen 0 und π2 . Wegen ∫r 1 − sin2 t = cos2 t und φ′ (t) = r cos t folgt aus der Substitutionsregel 0 (r2 − x2 )3/2 dx = ∫π ∫ π2 3 1 r | cos t|3 · r cos t dt = r4 02 cos4 t dt. Die Eulerformel ergibt cos4 t = 16 (eit + e−it )4 = 0 1 (e4it + 4e2it + 6 + 4e−2it + e−4it ) = 18 cos 4t + 12 cos 2t + 83 . Damit erhalten wir dann π ∫16r 2 ∫π (r − x2 )3/2 dx = r4 2 1 cos 4t + 1 cos 2t + 3 dt = r4 ( 1 sin 4t + 1 sin 2t + 3 t) 2 = 3π r4 . ∫t 0 0 8 2 8 32 4 8 0 16 54 Integration √ Beispiel: Als weiteres Beispiel bestimmen wir die Stammfunktion von f (x) = 1 + x2 , √ ∫ berechnen also das unbestimmte Integral 1 + x2 dx. Wir substituieren x = 21 (et − e−t ). √ √ Es gilt 1 + x2 = 1 + 14 (e2t − 2 + e−2t ) = 21 (et + e−t ) und dx wird durch 21 (et + e−t )dt ∫ ∫ ersetzt. Wir erhalten 41 (et + e−t )2 dt = 14 (e2t + 2 + e−2t )dt = 18 e2t + 21 t − 18 e−2t . Damit ist die Stammfunktion bereits berechnet, allerdings als Funktion in t. Wir müssen t wieder durch x ersetzen. Aus x = 12 (et − e−t ) erhält man durch Lösen einer quadratischen √ √ Gleichung et = x + 1 + x2 . Da√et positiv ist, kommt die √ andere Lösung x − 1 + x2 nicht in Frage. Es folgt e−t = −x + 1 + √ x2 und t = log(x + √ 1 + x2 ). Setzt man√das ein, so 1 erhält man die Stammfunktion 8 (x+ 1 + x2 )2 − 18 (−x+ 1 + x2 )2 + 12 log(x+ 1 + x2 ) = √ √ 1 1 2 1 + x2 ). 2 x 1 + x + 2 log(x + 2. Gleichmäßige Stetigkeit In diesem Kapitel wird nur gezeigt, dass für stetige Funktionen f : [a, b] → R das Integral ∫b f (x) dx existiert. Dazu benötigen wir den Begriff der gleichmäßigen Stetigkeit. a Definition: Eine Funktion f : [a, b] → R heißt gleichmäßig stetig, wenn für jedes ε > 0 ein δ > 0 existiert, sodass für alle x und y in [a, b] mit |x − y| < δ sich die Funktionswerte f (x) und f (y) um weniger als ε unterscheiden, das heißt |f (x) − f (y)| < ε erfüllt ist. Der Unterschied zur Stetigkeit besteht darin, dass δ nur von ε, nicht aber von x abhängt. Satz 4.12: Jede stetige Funktion f : [a, b] → R ist gleichmäßig stetig. Beweis: Wir führen den Beweis indirekt. Wir nehmen an, dass f nicht gleichmäßig stetig ist. Es gibt somit ein ε > 0, sodass für jedes δ > 0 die in der Definition der gleichmäßigen Stetigkeit genannte Eigenschaft nicht gilt. Zu δ = n1 existieren also Punkte xn und yn in [a, b], sodass zwar |xn − yn | < n1 , aber |f (xn ) − f (yn )| ≥ ε gilt. Nach dem Satz von Bolzano-Weierstraß existiert eine konvergente Teilfolge (xnk )k≥1 von (xn )n≥1 , deren Grenzwert x in [a, b] liegt. Aus |xn − yn | < n1 folgt xnk − n1k ≤ ynk ≤ xnk + n1k für alle k ≥ 1, sodass limk→∞ ynk = x gilt. Die Stetigkeit von f liefert limk→∞ f (xnk ) = f (x) und limk→∞ f (ynk ) = f (x). Daraus folgt limk→∞ f (xnk ) − f (ynk ) = 0, was ein Widerspruch dazu ist, dass |f (xn ) − f (yn )| ≥ ε für alle n ≥ 1 gilt. Damit ist der Satz bewiesen. Jetzt können wir bereits die Existenz des Integrals zeigen. Satz 4.13: Für eine stetige Funktion f : [a, b] → R existiert das Integral ∫b a f (x)dx. ε Beweis: Sei ε > 0 vorgegeben. Wir setzen γ = 2(b−a) > 0. Nach Satz 4.12 existiert γ ein δ > 0, sodass |f (x) − f (y)| < 2 für alle x und y in [a, b] mit |x − y| < δ gilt. Sei Z = {x0 , x1 , . . . , xn } eine Zerlegung des Intervalls [a, b] mit Gitterweite kleiner als δ. Wegen Satz 3.7 (c) existieren Punkte x und y in [xj−1 , xj ] mit f (x) − γ4 < inf [xj−1 ,xj ] f und f (y) + γ4 > sup[xj−1 ,xj ] f . Wegen |x − y| ≤ xj − xj−1 < δ folgt |f (x) − f (y)| < γ2 und daher auch sup[xj−1 ,xj ] f − inf [xj−1 ,xj ] f < f (y) − f (x) + γ2 < γ. Wir erhalten daraus ∑n OZ (f ) − UZ (f ) ≤ j=1 γ(xj − xj−1 ) = γ(b − a) < ε. Wegen O(f ) ≤ OZ (f ) und U (f ) ≥ UZ (f ) folgt O(f ) − U (f ) < ε. Da auch O(f ) ≥ U (f ) gilt und ε > 0 beliebig klein gewählt werden kann, ist O(f ) = U (f ) gezeigt, das heißt f ist integrierbar. Franz Hofbauer 55 3. Anwendungen des Integrals Die naheliegendste Anwendung des Integrals ist die Berechnung von Flächen. Es wurde ∫b ja so definiert, dass a f (x)dx die Fläche zwischen dem Graph der Funktion f und der x-Achse in den Grenzen von a bis b angibt. Wir berechnen die Fläche einer Ellipse. 2 2 Beispiel: Wir berechnen die Fläche der Ellipse mit der Gleichung xa2 + yb2 = 1. Ein √ Viertel davon ist die Fläche zwischen x-Achse und der Funktion f (x) = ab a2 − x2 auf ∫a√ dem Intervall [0, a]. Diese Fläche ist daher ab 0 a2 − x2 dx. Dieses Integral wurde im 2 letzten Kapitel berechnet und hat den Wert a4π . Ein Viertel der Ellipsenfläche ist also abπ 4 und die gesamte Ellipsenfläche ist abπ. Eine weitere Anwendung des Integrals sind Volumsberechnungen. Sei Ex die Ebene im R3 durch den Punkt (x, 0, 0), die senkrecht auf die x-Achse steht. Der Körper, dessen Volumen V wir berechnen wollen, liege im R3 zwischen den Ebenen Ea und Eb . Für x ∈ [a, b] sei u(x) die Fläche des Schnittes der Ebene Ex mit dem Körper. Wir nehmen an, dass u : [a, b] → R eine stetige Funktion ist. Sei a = x0 < x1 < · · · < xn = b eine beliebige Zerlegung des Intervalls [a, b]. Sei Vj das Volumen des Teils des Körpers, der zwischen den Ebenen Exj−1 und Exj liegt. Die stetige Funktion u nimmt im Intervall [xj−1 , xj ] in einem Punkt p ihr Minimum und in einem Punkt q ihr Maximum an. Es gilt (xj − xj−1 )u(p) ≤ Vj ≤ (xj − xj−1 )u(q), sodass nach dem Zwischenwertsatz ein ξj ∈ [x , xj ] existiert, für das Vj = (xj − xj−1 )u(ξj ) gilt. Daraus erhalten wir dann ∑j−1 ∑n n V = j=1 Vj = j=1 (xj − xj−1 )u(ξj ). Lässt man jetzt die Gitterweite der Zerlegung gegen 0 gehen, dann geht diese Summe gegen das entsprechende Integral, sodass ∫ b V = u(x) dx a eine Formel für das Volumen des Körpers ist. Beispiel: Wir berechnen das Volumen V eines Kegels, dessen Höhe h ist und dessen Grundfläche eine beliebige ebene Figur mit Fläche G ist. Wir legen diesen Kegel in den R3 , sodass die Spitze im Koordinatenursprung und die Grundfläche in der Ebene Eh liegt. Aus dem Strahlensatz folgt, dass die Fläche u(x) des Schnittes der Ebene Ex mit diesem ∫h ∫h ∫h Kegel gleich ( hx )2 G ist. Es folgt V = 0 u(x) dx = 0 ( hx )2 G dx = hG2 0 x2 dx = Gh 3 . 2 Eine quadratische Pyramide mit Grundkante a und mit Höhe h hat dann das Volumen a3h . Ein Kegel mit kreisförmiger Grundfläche vom Radius r und mit Höhe h hat das Volumen r 2 πh 3 . 2 2 2 Beispiel: Wir berechnen das Volumen des Ellipsoids mit der Gleichung xa2 + yb2 + zc2 = 1. Dieses Ellipsoid liegt zwischen den Ebenen E−a und Ea . Für −a < x < a ist der Schnitt 2 2 2 2 von Ex mit dem Ellipsoid die Ellipse mit der Gleichung yb2 + zc2 = a a−x , das heißt 2 a2 y 2 b2 (a2 −x2 ) a2 z 2 c2 (a2 −x2 ) = 1. Sie hat die Fläche u(x) = π abc2 (a2 − x2 ). Das Volumen des ∫a ∫a 3 a Ellipsoids ist daher −a u(x) dx = π abc2 −a a2 − x2 dx = π abc2 (a2 x − x3 )−a = 43 πabc. + Ein wichtiger Spezialfall obiger Volumsformel ist das Volumen eines Drehkörpers, der durch die Rotation des Flächenstücks unter der stetigen Funktion f : [a, b] → R+ um die x-Achse entsteht. Für x ∈ [a, b] ist die Fläche des Schnittes der Ebene Ex mit dem 56 Integration Drehkörper gleich u(x) = πf (x)2 . Deshalb ist ∫ b V =π f (x)2 dx a die Formel für das Volumen des Drehkörpers. Beispiel: Sei 0 ≤ a < b ≤ r. Wir berechnen das Volumen des Segments der Kugel mit Mittelpunkt (0, 0, 0) und Radius r zwischen den Ebenen Ea und Eb . Hier rotiert das √ Flächenstück unter der Funktion f (x) = r2 − x2 mit x ∈ [a, b] um die x-Achse. Wir ∫b 3 b 3 3 erhalten V = π a r2 − x2 dx = π(r2 x − x3 )a = π(r2 (b − a) − b −a 3 ) Beispiel: Sei a > r. Wir berechnen das Volumen des Ringes (Torus), der durch die Rotation des Kreises x2 + (y − a)2 =∫ r2 um √ die x-Achse entsteht.∫ Dieses Volumen V ist √ r r 2 2 2 2 2 die Differenz der beiden Volumina π −r (a + r − x ) dx und π −r (a − r − x )2 dx. ∫r √ 2 Wir erhalten also V = 4aπ −r r2 − x2 dx = 4aπ r 2π = 2ar2 π 2 . Wir können auch das Volumen über einem sogenannten Normalbereich B ⊆ R2 unter einer Funktion g : B → R+ bestimmen. Man nennt B einen Normalbereich, wenn ein Intervall [a, b] und stetige Funktionen φ : [a, b] → R und ψ : [a, b] → R mit φ ≤ ψ existieren, sodass B = {(x, y) ∈ R2 : a ≤ x ≤ b, φ(x) ≤ y ≤ ψ(x)} gilt. Die Fläche u(x) des Schnittes der Ebene Ex mit dem Körper über B und unter g lässt sich dann durch das ∫ ψ(x) Integral φ(x) g(x, y)dy berechnen. Wir erhalten also ∫ b ∫ ψ(x) V = u(x)dx mit u(x) = g(x, y) dy a φ(x) 2 als Volumen über dem Gebiet B unter der Funktion g : R → R+ . Wir können bei allen diesen Überlegungen die Rolle der Koordinaten vertauschen. Lässt sich der Bereich B schreiben als B = {(x, y) ∈ R2 : c ≤ y ≤ d, ϱ(y) ≤ x ≤ χ(y)} für ein Intervall [c, d] und stetige Funktionen ϱ : [c, d] → R und χ : [c, d] → R mit ϱ ≤ χ, dann ergibt sich wie oben ∫ d ∫ χ(y) V = v(y) dy mit v(y) = g(x, y)dx c ϱ(y) 2 als Volumen über dem Gebiet B unter der Funktion g : R → R+ . Beispiel: Wir berechnen das Volumen über dem Rechteck B = [−1, 1] × [0, 2] unter der ∫2 ∫2 Funktion g(x, y) = x + 3y + 1. Wir erhalten u(x) = 0 g(x, y)dy = 0 x + 3y + 1 dy = 2 1 ∫1 ∫1 u(x)dx = xy + 3 y 2 + y = 2x + 6 + 2 = 2x + 8 und V = 2x + 8 dx = x2 + 8x = 2 0 9 − (−7) = 16. −1 −1 −1 1 ∫1 Man kann das auch so ausrechnen v(y) = −1 x + 3y + 1 dx = 12 x2 + 3yx + x−1 = 2 ∫2 ∫2 3y + 23 − (−3y − 12 ) = 6y + 2 und V = 0 v(y)dy = 0 6y + 2 dy = 3y 2 + 2y 0 = 12 + 4 = 16. Beispiel: Sei g(x, y) = 2x + 3y und B die Fläche zwischen den Parabeln y 2 = x und y 2 = 4(x − 3). Gesucht ist das Volumen über B und unter g. Die erste der Parabeln hat Scheitel (0, 0), die zweite (3, 0). Sie schneiden einander in den Punkten (4, 2) und (4, −2). Wir erhalten für B den Normalbereich {(x, y) ∈ R2 : −2 ≤ y ≤ 2, y 2 ≤ x ≤ 14 y 2 + 3}. Es 1 y2 +3 ∫ 1 y2 +3 gilt v(y) = y42 = ( 14 y 2 + 3)2 + 3y( 14 y 2 + 3) − y 4 − 3y 3 = 2x + 3y dx = (x2 + 3xy)y42 Franz Hofbauer 57 ∫2 1 4 3 2 3 3 15 4 9 3 3 2 4 3 und V = −2 v(y)dy = 16 y + 2 y +9+ 4 y +9y −y −3y = − 16 y − 4 y + 2 y +9y +9 2 ∫2 15 4 9 3 3 2 3 5 9 4 1 3 9 2 = −12+8+36 = 32. − y − y + y +9y +9 dy = − y − y + y + y +9y 16 4 2 16 16 2 2 −2 −2 Beispiel: Wir berechnen das Volumen des Schnittkörpers zweier Zylinder, die beide Radius r haben und deren Achsen die x-Achse bzw. die y-Achse sind. Aus Symmetriegründen genügt es, den Teil des Schnittkörpers zu betrachten, der über der Fläche B = {(x, y) : 0 ≤ x ≤ r, 0 ≤ y ≤ x} liegt. Das ist ein Sechzehntel des √ Schnittkörpers. Oberhalb von B wird der∫Schnittkörper durch die Funktion g(x, y) = r2 − x2 begrenzt. √ √ ∫x√ x x 2 2 2 2 Wir berechnen u(x) = 0 g(x, y) dy = 0 r − x dy = y r − x 0 = x r2 − x2 r ∫r √ ∫r und V = 0 u(x)dx = 0 x r2 − x2 dx = − 13 (r2 − x2 )3/2 0 = 13 r3 . Das Volumen des 3 Schnittkörpers ist daher 16 3 r . Als weitere Anwendung des Integrals bestimmen wir die Bogenlänge des Graphen einer Funktion. Sei f : [a, b] → R stetig und auf (a, b) stetig differenzierbar. Wir approximieren den Graph von f durch einen Polygonzug. Sei a = x0 < x1 < · · · < xn = b eine beliebige Zerlegung des Intervalls [a, b]. Die Länge des Polygonzugs durch die Punkte (xj , f (xj )) ist ∑n √ dann j=1 (xj − xj−1 )2 + (f (xj ) − f (xj−1 ))2 . Wegen des Mittelwertsatzes existiert für jedes j ein ξj ∈ [xj−1 , xj ] mit xjj −xj−1j−1 = f ′ (ξj ). Daher ist die Länge des Polygonzuges ∑n √ gleich j=1 1 + f ′ (ξj )2 (xj − xj−1 ). Die Bogenlänge L der Kurve ist der Grenzwert der Längen der Polygonzüge, wenn die Gitterweite der Zerlegung gegen 0 √ geht. Die Längen der Polygonzüge sind aber Riemannsummen für die stetige Funktion 1 + f ′ (x)2 . Der Grenzwert ist daher das entsprechende Integral. Wir erhalten ∫ b√ 1 + f ′ (x)2 dx L= f (x )−f (x ) a als Formel für die Bogenlänge der Kurve, die durch den Graph von f gegeben ist. Beispiel: Durch f (x) = p2 x2 ist eine Parabel gegeben. Wir berechnen die Länge des ∫c√ Parabelstücks mit 0 ≤ x ≤ c. Wegen f ′ (x) = px ergibt sich L = 0 1 + p2 x2 dx aus ∫ pc √ obiger Formel. Führt man die neue Variable t = px ein, so hat man L = 0 1 + x2 p1 dx. √ √ Nach einem früheren Beispiel ist G(x) = 12 x 1 + x2 + 12 log(x + 1 + x2 ) eine Stammfunk√ √ √ 1 tion von 1 + x2 . Es folgt L = p1 (G(pc) − G(0)) = 2c 1 + p2 c2 + 2p log(pc + 1 + p2 c2 ). 4. Verallgemeinerte Riemannsummen Um noch andere Anwendungen des Integrals behandeln zu können, brauchen wir eine verallgemeinerte Form von Riemannsummen. Es gilt folgender Satz. Satz 4.14: Seien f und g stetige Funktionen von [a, b] nach R. Sei (Zn )n≥1 eine Folge von Zerlegungen des Intervalls ∑m [a, b], deren Gitterweite für n → ∞ gegen 0 konvergiert. Für jedes n ≥ 1 sei Bn = j=1 f (ξj )g(ηj )(xj − xj−1 ), wobei wir Zn = {x0 , x1 , . . . , xm } gesetzt haben und ξj und ηj beliebig im Intervall [xj−1 , xj ] gewählt werden. Es gilt dann ∫b limn→∞ Bn = a f (x)g(x)dx. Beweis: ∑mDa f stetig ist, existiert ein c mit |f (x)| ≤ c für alle x ∈ [a, b]. Für n ≥ 1 sei An = j=1 f (ξj )g(ξj )(xj − xj−1 ), eine Riemannsumme zur Zerlegung Zn für f g. Wir zeigen limn→∞ Bn − An = 0. Dazu sei ε > 0. Da g stetig ist, existiert wegen Satz 4.12 ε gilt für alle x und y in [a, b] mit |x − y| < δ. ein δ > 0, sodass |g(x) − g(y)| < c(b−a) 58 Integration Weiters sei n0 so gewählt, dass Zn für n ≥ n0 Gitterweite < δ hat. Für n ≥ n0 ergibt ε sich dann |g(ξj ) − g(ηj )| < c(b−a) , da ja |ξj − ηj | ≤ |xj − xj−1 | < δ gilt, sodass wir ( ) ∑m ∑m |Bn −An | = | j=1 f (ξj ) g(ξj )−g(ηj ) (xj −xj−1 )| ≤ j=1 |f (ξj )| ·|g(ξj )−g(ηj )|(xj −xj−1 ) ∑m ε ε < j=1 c c(b−a) (xj − xj−1 ) = c c(b−a) (b − a) = ε erhalten. Für jedes ε > 0 existiert somit ein n0 , sodass |Bn − An | < ε für alle n ≥ n0 gilt. Damit ist limn→∞ Bn − An = 0 gezeigt. ∫b Da f g stetig und damit integrierbar ist, folgt limn→∞ An = a f (x)g(x)dx aus Satz 4.4. ∫b Wir erhalten dann auch limn→∞ Bn = limn→∞ An + limn→∞ Bn − An = a f (x)g(x)dx und der Satz ist bewiesen. Wir verwenden Satz 4.14, um eine Formel für die Mantelfläche eines Drehkörpers zu finden. Sei f : [a, b] → R+ stetig und auf (a, b) stetig differenzierbar. Der Graph von f rotiert um die x-Achse. Wir berechnen die dadurch entstehende Oberfläche, die Mantelfläche des Drehkörpers. Wie bei der Berechnung der Bogenlänge approximieren wir den Graph von f durch einen Polygonzug und lassen den Polygonzug um die x-Achse rotieren. Sei a = x0 < x1 < · · · < xn = b eine beliebige Zerlegung des Intervalls [a, b]. Die Fläche, die entsteht,√wenn die Strecke von (xj−1 , f (xj−1 )) nach (xj , f (xj )) um die x-Achse rotiert, ist 2πf (ηj ) (xj − xj−1 )2 + (f (xj ) − f (xj−1 ))2 für ein ηj im Intervall [xj−1 , xj ]. Wegen √ √ des Mittelwertsatzes gilt (xj − xj−1 )2 + (f (xj ) − f (xj−1 ))2 = 1 + f ′ (ξj )2 (xj − xj−1 ) für ein ξj ∈ [xj−1 , xj ]. √Daher ist die Fläche, die durch Rotation des Polygonzuges entsteht, ∑n gleich 2π j=1 f (ηj ) 1 + f ′ (ξj )2 (xj −xj−1 ). Die Mantelfläche M ist der Grenzwert dieser Summe, wenn die Gitterweite der Zerlegung gegen 0 geht. Wegen Satz 4.14 erhalten wir ∫ b √ M = 2π f (x) 1 + f ′ (x)2 dx a als Formel für die Mantelfläche, die durch Rotation des Graphen von f entsteht. Beispiel: Wir berechnen die Mantelfläche M eines Kegels mit Radius r und Höhe h. Diese entsteht, wenn der Graph der Funktion f (x) = hr x mit x ∈ [0, h] um die x-Achse rotiert. Wir berechnen die Ableitung f ′ (x) = hr . Aus obiger Formel erhalten wir dann h √ √ ∫h √ 2√ M = 2π 0 hr x 1 + ( hr )2 dx = 2π hr x2 1 + ( hr )2 0 = πr h2 + r2 . Oft wird h2 + r2 mit s bezeichnet, sodass sich die Formel M = πrs für die Mantelfläche ergibt. Beispiel: Wir berechnen des Graphen √ die Kugeloberfläche. Sie entsteht durch Rotation ′ 2 2 der Funktion f (x) = r − x mit x ∈ [−r, r] um die x-Achse. Es gilt f (x) = √r−x . 2 −x2 r ∫r √ r 2 Aus obiger Formel folgt dann M = 2π −r r2 − x2 √r2 −x2 dx = 2πrx−r = 4πr . Seien f und g stetige Funktionen von [a, b] nach R, sodass f (x) ≤ g(x) für alle x ∈ [a, b] gilt. Wir suchen eine Formel für den Schwerpunkt des Flächenstücks, das von den Graphen der Funktionen f und g und den beiden senkrechten Geraden x = a und x = b begrenzt wird. Sei s die x-Koordinate des Schwerpunkts. Unterstützt man das Flächenstück durch die Gerade x = s, dann darf es weder nach der einen noch nach der anderen Seite kippen. Das Drehmoment, das durch die Schwerkraft bewirkt wird, muss gleich null sein. Sei a = x0 < x1 < · · · < xn = b eine Zerlegung des Intervalls [a, b]. Das Drehmoment, das durch den Streifen zwischen den senkrechten Geraden x = xj−1 und x = xj bewirkt wird, ist gleich dem Produkt des Flächeninhalts des Streifens und des mit einem Vorzeichen versehenen Abstands seines Schwerpunktes von der Geraden x = s. Dieses Produkt ist gleich (g(ξj ) − f (ξj ))(xj − xj−1 )(ηj − s), wobei∑ ηj und ξj in [xj−1 , xj ] liegen. Als Drehmon ment für die gesamte Fläche erhalten wir D = j=1 (ηj − s)(g(ξj ) − f (ξj ))(xj − xj−1 ). Da Franz Hofbauer 59 man die Gitterweite der Zerlegung beliebig klein machen kann, folgt aus Satz 4.14, dass ∫b D = a (x − s)(g(x) − f (x)) dx gilt. Setzt man das gleich null, so erhält man /∫ b ∫ b ( ) s= x g(x)−f (x) dx g(x)−f (x) dx a a als x-Koordinate des Flächenschwerpunkts. Die y-Koordinate kann man berechnen, indem man die y-Achse als x-Achse und die x-Achse als y-Achse auffasst. Beispiel: Sei y = p − qx2 mit p > 0 und q > 0. Diese Gleichung stellt eine Parabel mit Scheitel (0, p) dar. Wir berechnen den Schwerpunkt des Flächenstücks, das oberhalb der x-Achse, rechts von der y-Achse und innerhalb der Parabel liegt, also zwischen den 2 Graphen √ der Funktionen f (x) = 0 und g(x) = p − qx und den Grenzen a = 0 und b = pq . Die x-Koordinate des Schwerpunkts ergibt sich aus obiger Formel. Wir erhalten √ √ √ ∫ √p/q ∫ √p/q px2 qx4 p/q p2 qx3 p/q 2p 2 2 x(p−qx ) dx = 2 − 4 0 p−qx dx = px− 3 0 = 4q und 0 = 3 pq . 0 √ Die x-Koordinate des Schwerpunkts ist der Quotient dieser beiden Werte, also 83 pq . Um die y-Koordinate des Schwerpunkts zu berechnen, fassen wir y als Variable auf √ und lassen die y-Achse die Rolle der x-Achse spielen. Die Parabelgleichung wird zu x = p−y . √q Das Flächenstück liegt zwischen den Graphen der Funktionen f (y) = 0 und g(y) = p−y q und √ den Grenzen a = 0 und b = p. Um obige Formel zu verwenden, √ berechnen wir ∫p ∫√ 0 p−y pz 3 qz 5 0 4p2 p 2 2 √ dy = −2q (p − qz )z dz = −2q( − ) = y q 3 5 15 q , wobei wir 0 p/q p/q √ √ √ ∫ p p−y 3 p 2p p 2 2 = √ − y) z = p−y substituiert haben, und dy = (p − q q 3 q 3 q . Der Quotient 0 0 dieser beiden Werte ist 2p 5 . Das ist die y-Koordinate des Schwerpunkts. Wir erhalten √ p 2p 3 daher ( 8 q , 5 ) als Schwerpunkt des Parabelstücks. Genauso wie für eine Fläche kann man auch die Schwerpunktskoordinaten eines Körpers berechnen. Wir tun das für einen Drehkörper, der durch Rotation des Flächenstücks unter dem Graph der stetigen Funktion f : [a, b] → R+ um die x-Achse entsteht. Der Schwerpunkt des Drehkörpers liegt auf der x-Achse. Seine x-Koordinate bezeichnen wir mit s. Sei a = x0 < x1 < · · · < xn = b eine Zerlegung des Intervalls [a, b]. Das Drehmoment, das durch die Scheibe des Drehkörpers über dem Intervall [xj−1 , xj ] bezüglich der Ebene x = s bewirkt wird, ist gleich dem Produkt des Volumens der Scheibe und des mit einem Vorzeichen versehenen Abstands ihres Schwerpunktes von der Ebene x = s. Es ist∑gleich (ηj − s)πf (ξj )2 (xj − xj−1 ), wobei ηj und ξj in [xj−1 , xj ] liegen. Daher ist n D = j=1 (ηj − s)πf (ξj )2 (xj − xj−1 ) das gesamte Drehmoment. Da man die Gitterweite ∫b der Zerlegung beliebig klein machen kann, folgt D = π a (x − s)f (x)2 dx aus Satz 4.14. Setzt man das gleich null, so erhält man /∫ b ∫ b 2 s= xf (x) dx f (x)2 dx a a als x-Koordinate des Schwerpunkts des Drehkörpers. Beispiel: Wir berechnen den Schwerpunkt des Kegels mit Höhe h und Radius r. Diesen erhält man, wenn die Fläche unter dem Graph der Funktion f (x) = hr x mit x ∈ [0, h] um ∫h ∫h 2 4 h 2 2 die x-Achse rotiert. Wir berechnen 0 xf (x)2 dx = 0 x( hr x)2 dx = hr 2 x4 0 = r 4h und 60 Integration ∫h 2 2 3 h f (x)2 dx = 0 ( hr x)2 dx = hr 2 x3 0 = r 3h . Daraus ergibt sich s = 34 h. Der Schwerpunkt des Kegels liegt also bei einem Viertel der Höhe über der Grundfläche. ∫h 0 5. Uneigentliche Integrale Wir haben bisher Integrale nur für beschränkte Funktionen auf abgeschlossenen Intervallen definiert. Ist das Integrationsintervall unbeschränkt, oder hat die zu integrierende Funktion eine Polstelle, dann spricht man von uneigentlichen Integralen. Diese definiert man durch Grenzwerte. Der Einfachheit halber behandeln wir nur ∫Funktionen mit Werten∫ in [0, ∞). Für eine n ∞ Funktion f : [a, ∞) → [0, ∞) definieren wir a f (x) dx = limn→∞ a f (x)dx. Für eine ∫b ∫b Funktion f : (−∞, b] → [0, ∞) definieren wir −∞ f (x)dx = limn→∞ −n f (x) dx. Für eine ∫n ∫∞ Funktion f : (−∞, ∞) → [0, ∞) definieren wir −∞ f (x)dx = limn→∞ −n f (x)dx. Dabei wird die Existenz der Grenzwerte und der Integrale auf der rechten Seite vorausgesetzt. ∫∞ −α+1 x−α dx für α > 0. Für α ̸= 1 ist x 7→ x−α+1 ∫n 1−α n 1−α 1 eine Stammfunktion von x 7→ x−α . Es folgt 1 x−α dx = x1−α 1 = n1−α − 1−α . Für α < 1 ∫ ∞ −α erhält man ∞, wenn n gegen ∞ geht. In diesem Fall existiert das Integral 1 x dx nicht. ∫∞ 1 1 Für α > 1 erhält man α−1 , wenn n gegen ∞ geht. In diesem Fall gilt 1 x−α dx = α−1 . −α Es der Fall α = 1. Eine Stammfunktion von x 7→ x ist x 7→ ln x. Es folgt ∫ n bleibt ∫ ∞ −1 −1 x dx = ln n, sodass das Integral x dx nicht existiert. 1 1 Beispiel: Wir berechnen das Integral 1 Ähnlich geht man bei Funktionen mit Polstelle vor. Für eine Funktion f : [a, b) → [0, ∞) ∫b ∫ b− 1 mit Polstelle bei b definieren wir a f (x)dx = limn→∞ a n f (x)dx. Für eine Funktion ∫b ∫b f : (a, b] → [0, ∞) mit Polstelle bei a definieren wir a f (x) dx = limn→∞ a+ 1 f (x)dx. n Vorausgesetzt wird die Existenz der Grenzwerte und der Integrale auf der rechten Seite. ∫1 −α+1 x−α dx für α > 0. Für α ̸= 1 ist x 7→ x−α+1 ∫1 1−α 1 1 1 eine Stammfunktion von x 7→ x−α . Es folgt 1 x−α dx = x1−α 1 = 1−α − (1−α)n 1−α . n n Für α > 1 erhält man ∞, wenn n gegen ∞ geht. In diesem Fall existiert das Integral ∫ 1 −α 1 , wenn n gegen ∞ geht. In diesem Fall gilt x dx nicht. Für α < 1 erhält man 1−α ∫01 −α 1 x dx = 1−α . Es bleibt α = 1. Eine Stammfunktion von x 7→ x−1 ist x 7→ ln x. Es 0 ∫1 ∫ 1 −1 folgt 1 x dx = ln 1 − ln n1 = ln n, sodass das Integral 0 x−1 dx nicht existiert. Beispiel: Wir berechnen das Integral 0 n Es sei noch einmal darauf hingewiesen, dass wir uneigentliche Integrale nur für Funktionen mit Werten in [0, ∞) behandelt haben. Bei Funktionen, die sowohl positive als auch negative Werte annehmen, muss man vorsichtiger vorgehen. 6. Approximation von Funktionen durch Polynome Um die Exponentialfunktion, trigonometrische Funktionen, die Logarithmusfunktion und andere berechnen zu können, muss man sie approximieren. Eine Möglichkeit ist die Approximation durch Polynome. Wir beginnen mit dem Satz von Taylor, der zeigt wie solche Polynome aussehen, und approximieren anschließend verschiedene Funktionen. Franz Hofbauer 61 Satz 4.15 (Taylorformel) Sei I ein offenes Intervall, das 0 enthält. Sei f : I → R eine (n + 1)-mal stetig differenzierbare Funktion, das heißt, für k ≤ n + 1 existiert die k-te Ableitung f (k) von f und f (n+1) ist stetig. Sei x ∈ I. Dann hat man die Formel x xn f (x) = f (0) + f ′ (0) + · · · + f (n) (0) + Rn+1 (x) 1! n! ∫ x (n+1) 1 f (t)(x − t)n dt gilt. Außerdem existiert ein c mit 0 ≤ c ≤ x wobei Rn+1 (x) = n! 0 oder x ≤ c ≤ 0, sodass Rn+1 (x) = f (n+1) (c) n+1 (n+1)! x gilt. Man nennt Rn+1 (x) das Restglied. Beweis: Für x = 0 ist die Formel trivial. Sei daher x ∈ I \ {0} fest gewählt. Aus dem Hauptsatz der Differential– und Integralrechnung folgt ∫x f (x) = f (0) + 0 f ′ (t)dt Da t ∫7→ −(x − t) eine Stammfunktion 1 ist, erhalten wir mit partieller Integration, x ∫von x ′ x ′′ ′ dass 0 f (t) · 1dt = −f (t)(x − t) 0 + 0 f (t)(x − t)dt gilt. Daraus folgt ∫x x f (x) = f (0) + f ′ (0) 1! + 0 f ′′ (t) (x−t) 1! dt 2 Da t 7→ − (x−t) eine Stammfunktion von t 7→ x−t 1! ist, erhalten wir mit partieller Integra∫ x2! ′′ (x−t) ∫ 2 x 2 x (x−t) tion, dass 0 f (t) 1! dt = −f ′′ (t) 2! 0 + 0 f (3) (t) (x−t) dt gilt. Daraus folgt 2! ∫ 2 2 x x f (x) = f (0) + f ′ (0) 1! + f ′′ (0) x2! + 0 f (3) (t) (x−t) dt 2! Führt man diesen Schritt n Mal durch, so erhält man n x f (x) = f (0) + f ′ (0) 1! + · · · + f (n) (0) xn! + ∫x 0 n dt f (n+1) (t) (x−t) n! Damit ist die Formel mit der ersten Version von Rn+1 (x) bewiesen. Um die zweite Form von Rn+1 (x) zu zeigen, sei J = [0, x], wenn x > 0, und J = [x, 0], n wenn x < 0. Sei g(t) = (x−t) n! . Dann gilt g ≥ 0 oder g ≤ 0 auf dem Intervall J. Da f (n+1) als stetig vorausgesetzt wird, folgt aus Satz 4.8, dass ein c ∈ J existiert mit ∫x ∫x xn+1 Rn+1 (x) = 0 f (n+1) (t)g(t)dt = f (n+1) (c) 0 g(t)dt = f (n+1) (c) (n+1)! . Um Funktionen durch Approximation mit Polynomen näherungsweise zu berechnen, ist es notwendig, das Restglied abzuschätzen. Dazu beweisen wir folgenden Satz. Satz 4.16: Sei a ̸= b und I das abgeschlossene Intervall mit Endpunkten a und b. Sei ∫b ∫b f : I → R eine stetige Funktion. Dann gilt | a f (y)dy| ≤ a |f (y)|dy, wenn a < b ist, und ∫b ∫a | a f (y) dy| ≤ b |f (y)| dy, wenn b < a ist. Beweis: Da f stetig ist, ist auch |f | stetig. Somit sind beide Funktionen integrierbar. Sei zuerst a < b. Es gilt f (y) ≤ |f (y)| und −f (y) ≤ |f (y)| für alle y ∈ I = [a, b]. Aus ∫b ∫b ∫b ∫b ∫b Satz 4.6 folgt a f (y) dy ≤ a |f (y)| dy und − a f (y)dy ≤ a |f (y)|dy. Da | a f (y) dy| ∫b ∫b ∫b ∫b entweder a f (y) dy oder − a f (y) dy ist, ist | a f (y)dy| ≤ a |f (y)| dy bereits gezeigt. ∫a ∫a Sei jetzt b < a. Im vorherigen Absatz wurde | b f (y)dy| ≤ b |f (y)| dy bewiesen. Wegen ∫a ∫b ∫b ∫b ∫a | b f (y) dy| = | − a f (y) dy| = | a f (y)dy| erhalten wir | a f (y)dy| ≤ b |f (y)| dy. Beispiel: Wir entwickeln die Funktion ex für x ∈ R nach der Taylorformel aus Satz 4.15. Da alle Ableitungen von ex wieder ex sind, erhalten wir ex = 1 + x + x2 2! + x3 3! + ··· + xn n! + Rn+1 (x) mit Rn+1 (x) = wobei entweder 0 ≤ c ≤ x oder x ≤ c ≤ 0 gilt. Es folgt |Rn+1 (x)| ≤ n+1 ec (n+1)! x max(1,ex ) n+1 . (n+1)! |x| 62 Integration 1 1 Für −1 ≤ x < 0 gilt |Rn+1 (x)| ≤ (n+1)! . Bestimmt man n so, dass (n+1)! < 10−6 gilt, dann ∑n k weiß man, dass k=0 xk! die Zahl ex auf 6 Dezimalstellen genau ergibt. Man erhält n = 9. k ∑9 = 0.367879188712 . . . und somit 1e = 0.367879 auf 6 Dezimalstellen Es gilt k=0 (−1) k! genau. Insbesondere hat man 1e > 13 , also e < 3. Das kann man verwenden, um |Rn+1 (x)| für positive x abzuschätzen. Beispiel: Wir entwickeln die Funktion f (x) = sin x für x ∈ R nach der Taylorformel. Es gilt f ′ (x) = cos x, f ′′ (x) = − sin x, f ′′′ (x) = − cos x, f (4) (x) = sin x, f (5) (x) = cos x, f (6) (x) = − sin x, und so weiter. Daraus erkennt man, dass f (k) (0) = 0 gilt, wenn k gerade ist, und dass f (k) (0) abwechselnd +1 und −1 ist, wenn k ungerade ist. Daher folgt sin x = x − x3 3! x5 5! + 2n−1 x sin c 2n + · · · + (−1)n−1 (2n−1)! + R2n (x) mit R2n (x) = (−1)n (2n)! x wobei entweder 0 ≤ c ≤ x oder x ≤ c ≤ 0 gilt. Es folgt |R2n (x)| ≤ 1 2n (2n)! |x| . 1 Es genügt, sin x für x ∈ (0, π2 ) zu berechnen. Für diese x gilt |R2n (x)| ≤ (2n)! ( π2 )2n . ∑n−1 x2k+1 1 Bestimmt man n so, dass (2n)! ( π2 )2n < 10−m gilt, dann gibt k=0 (−1)k (2k+1)! den Wert von sin x auf m Dezimalstellen genau an. Um Entwicklungen für Logarithmus und Arcustangens zu finden, verwenden wir nicht die Taylorformel, sondern gehen von folgender Gleichung aus, die für y ∈ (−1, 1) gilt 1 1−y = 1 + y + y 2 + · · · + y n−1 + yn 1−y Sei −1 ≤ x < 1. Aus obiger Gleichung folgt dann für y ∈ (−1, 1) 1 1+y + 1 1−y = 2 1−y 2 2n y = 2(1 + y 2 + y 4 + · · · + y 2n−2 ) + 2 1−y 2 woraus man folgendes Resultat durch Integration von 0 bis x erhält log 1+x 1−x x3 3 = 2(x + 2n + x5 5 + ··· + x2n−1 2n−1 ) + R2n+1 (x) mit R2n+1 (x) = 2 ∫x y 2n 0 1−y 2 dy 2n y x Nun gilt | 1−y 2 | ≤ 1−x2 für alle y zwischen 0 und x. Aus Satz 4.16 und Satz 4.6 folgt dann ∫ x y2n ∫ x x2n x2n |R2n+1 (x)| ≤ 2 0 | 1−y 2 | dy ≤ 2 0 1−x2 dy = 2x 1−x2 im Fall x > 0, und |R2n+1 (x)| ≤ ∫ 0 y2n ∫ 0 x2n x2n 2 x | 1−y 2 |dy ≤ 2 x 1−x2 dy = −2x 1−x2 im Fall x < 0. Wir haben somit die Abschätzung 2n x |R2n+1 (x)| ≤ 2|x| 1−x 2 für alle x ∈ (−1, 1) erhalten. 1+x Sei a > 1 beliebig. Wir setzen x = a−1 a+1 . Dann gilt 0 < x < 1 und a = 1−x . Man 1+x kann dann obige Formel verwenden, um log a = log 1−x auf eine bestimmte Anzahl von Dezimalstellen zu berechnen. Jetzt behandeln wir noch den Arcustangens. Da tan : (− π2 , π2 ) → R streng monoton wachsend und stetig ist, existiert die Umkehrfunktion arctan : R → (− π2 , π2 ). Aus der 1 Formel für die Ableitung der Umkehrfunktion erhalten wir arctan′ x = 1+x 2. Sei −1 ≤ x < 1. Aus obiger Formel mit −y 2 statt y ergibt sich 1 1+y 2 2n y = 1 − y 2 + y 4 − · · · + (−1)n−1 y 2n−2 + (−1)n 1+y 2 woraus man folgendes Resultat durch Integration von 0 bis x erhält arctan x = x − 2n x3 3 + x5 5 −···+ (−1)n−1 x2n−1 2n−1 + R2n+1 (x) mit R2n+1 (x) = (−1)n ∫x y 2n 0 1+y 2 dy y 2n Nun gilt | 1+y für alle y zwischen 0 und x. Aus Satz 4.16 und Satz 4.6 folgt wie 2| ≤ x oben |R2n+1 (x)| ≤ |x| · x2n = |x|2n+1 für alle x ∈ (−1, 1). Franz Hofbauer 63 Der arctan bietet die Möglichkeit, π zu berechnen. Es gilt π = 4(arctan 21 + arctan 13 ). Das folgt aus der Formel tan(α + β) = (tan α + tan β)/(1 − tan α tan β), die man aus den Summensätzen für sin und cos erhält. Setzt man α = arctan 12 und β = arctan 13 ein, so ergibt sich tan(α + β) = ( 12 + 13 )/(1 − 12 · 13 ) = 1. Daraus folgt, dass α + β = π4 + kπ für ein k ∈ Z gilt. Wegen α < arctan 1 = π4 und β < arctan 1 = π4 gilt α + β < π2 . Wegen α > arctan 0 = 0 und β > arctan 0 = 0 gilt auch α + β > 0. Somit ist α + β = π4 , das heißt π = 4(arctan 12 + arctan 31 ) gezeigt. Die Berechnung von π ist auf die Berechnung von arctan 12 und arctan 13 zurückgeführt. Diese kann man dann mit Hilfe obiger Entwicklung durchführen. 7. Reihen Der Versuch, unendlich ∑∞ viele Zahlen ak ∈ R zu summieren, ∑nführt zur Definition von Reihen. Man schreibt k=0 ak . Für n ≥ 0 nennt man Sn = k=0 ak die n-te Partialsumme der Reihe. ∑∞ Existiert der Grenzwert limn→∞ Sn und hat den Wert S, dann nennt man die Reihe k=0 ak konvergent mit Summe S. Existiert limn→∞ Sn nicht, dann nennt man die Reihe divergent. ∑∞ Das bekannteste Beispiel ist die geometrische Reihe. Das ist die Reihe k=0 q k für ein q ∈ R. In diesem Fall kann man die Partialsummen direkt ausrechnen. Für n ≥ 0 gilt n+1 Sn = 1−q 1−q , wenn q ̸= 1 ist, und Sn = n + 1, wenn q = 1 ist. Man sieht, dass die Reihe 1 . Wir genau dann konvergiert, wenn |q| < 1 gilt. In diesem Fall hat man limn→∞ Sn = 1−q ∑∞ k 1 schreiben dann k=0 q = 1−q . Kann man die Partialsummen nicht berechnen, dann sucht man nach ∑ Bedingungen, n unter denen die Reihe konvergiert. Man führt ∑∞ die Partialsummen S n = k=0 |ak | mit Absolutbeträgen ein, und nennt die Reihe k=0 ak absolut konvergent, wenn die Folge (S n )n≥0 konvergiert. Da die Folge (S n )n≥0 monoton ∑∞ wächst, ist sie genau dann konvergent, wenn sie beschränkt ist. Man schreibt dann k=0 |ak | < ∞. Wir haben folgenden Satz Satz 4.17: Eine absolut konvergente Reihe ist konvergent. Beweis: Sei S = limn→∞ S n . Für n ≥ 0 sei Tn = S − S n . Es gilt limn→∞ Tn = 0 und wegen S n ≤ S auch Tn ≥ 0. Für n ≥ 0 sei un = Sn − Tn und vn = Sn + Tn . Klarerweise gilt dann Sn ∈ [un , vn ]. Weiters folgt un+1 = Sn + an+1 − Tn + |an+1 | ≥ Sn − Tn = un und vn+1 = Sn + an+1 + Tn − |an+1 | ≤ Sn + Tn = vn , sodass [un+1 , vn+1 ] ⊆ [un , vn ] für alle n ≥ 0 gilt. Schließlich haben wir auch vn − un = 2Tn für n ≥ 0. Wegen der Intervallschachtelungseigenschaft gibt es ein S, das in allen Intervallen [un , vn ] enthalten ist. Wir zeigen limn→∞ Sn = S. Sei ε > 0 beliebig. Es gibt ein n0 mit 2Tn0 < ε. Wegen S ∈ [un0 , vn0 ] folgt daraus [un0 , vn0 ] ⊆ (S − ε, S + ε). Wegen Sn ∈ [un , vn ] ⊆ [un0 , vn0 ] für n ≥ n0 gilt auch Sn ∈ (S − ε, S + ε) für alle n ≥ n0 , das heißt limn→∞ Sn = S. Es folgen Sätze, die Methoden angeben, mit denen man die Konvergenz oder Divergenz einer Reihe nachprüfen kann. ∑∞ Satz 4.18: Wenn k=0 ak konvergiert, dann gilt limn→∞ an = 0. ∑n Beweis: Sei Sn = k=0 ak . Nach Voraussetzung existiert S = limn→∞ Sn . Für n ≥ 1 gilt an = Sn − Sn−1 . Es folgt limn→∞ an = limn→∞ Sn − limn→∞ Sn−1 = S − S = 0. ∑∞ k k Es folgt sofort, dass k=0 k+1 nicht konvergiert, da limk→∞ k+1 nicht 0 ist. 64 Integration ∑∞ Satz 4.19: Es sei ak > 0 und bk > 0 für k ≥ 0. Wenn die ∑ Reihe k=0 bk konvergent und ∞ die Folge ( abkk )k≥0 beschränkt ist, dann ist auch die Reihe k=0 ak konvergent. ∑n ∑n Beweis: Für n ≥ 0 sei Sn = k=0 ak und Tn = k=0 bk . Nach Voraussetzung gibt es eine Konstante ∑∞ C mit ak ≤ Cbk für alle k ≥ 0, woraus Sn ≤ CTn für alle n ≥ 0 folgt. Da die Reihe k=0 bk als konvergent vorausgesetzt wird, gilt limn→∞ Tn = T für ein T ∈ R. Wegen bk > 0 ist die Folge (Tn )n≥0 monoton wachsend, woraus Tn ≤ T für alle n ≥ 0 folgt. Somit gilt Sn ≤ CT für alle n ≥ 0 und da auch die Folge (Sn )n≥0 monoton wachsend ist, ∑∞ hat sie auch einen Grenzwert, womit die Konvergenz der Reihe k=0 ak gezeigt ist. Dieser Satz gilt natürlich genauso, wenn die Summation ∑∞ nicht bei 0 beginnt, sondern bei 1 oder sonst irgendwo. Wir untersuchen die Reihe k=0 ak mit ak = 2kk . Sei bk = ( 23 )k . Dann gilt limk→∞ abkk = limk→∞ ( 4k)k = 0, sodass die Folge ( abkk )k≥0 beschränkt ist. Da 3 ∑∞ ∑∞ b eine konvergente geometrische Reihe ist, ist auch k=0 ak konvergent. k=0 k Satz∑4.20: Sei f : [1, ∞) → (0, ∞) eine monoton fallende Funktion. Dann sind äquivalent ∞ (a) ∫ k=1 f (k) ist konvergent ∞ (b) 1 f (x) dx existiert ∫ k+2 Beweis: Um (a) ⇒ (b) zu zeigen, sei ak = k+1 f (x) dx und bk = f (k + 1) für k ≥ 0. ∑∞ Es gilt abkk ≤ 1 für k ≥ 0, da f monoton fallend ist. Da wir (a) voraussetzen, ist k=0 bk ∫∞ ∑∞ konvergent. Wegen Satz 4.19 ist dann auch k=0 ak konvergent, das heißt 1 f (x)dx = ∫ n+2 ∑n limn→∞ 1 f (x) dx = limn→∞ k=0 ak existiert und (b) ist gezeigt. ∫ k+2 Um (b) ⇒ (a) zu zeigen, sei ak = f (k + 2) und bk = k+1 f (x) dx für k ≥ 0. Es gilt abkk ≤ 1 ∑∞ für k ≥ 0, da f monoton fallend ist. Da wir (b) voraussetzen, ist k=0 bk konvergent ∫ n+2 ∫∞ ∑n wegen limn→∞ k=0 bk = limn→∞ 1 f (x)dx = 1 f (x)dx. Nach Satz 4.19 ist dann ∑∞ ∑∞ ∑∞ k=0 ak konvergent, also auch k=1 f (k) = f (1) + k=0 ak , womit (a) gezeigt ist. ∑∞ Beispiel: Wir untersuchen die Konvergenz der Reihen k=1 k1α für α > 0. Das ist die ∑∞ Reihe k=1 f (k), wenn wir die Funktion f : [1, ∞) → (0, ∞) durch f (x) = x1α definieren. Man ∫ ∞ sieht, dass f monoton fällt. Aus einem früheren Beispiel wissen wir, dass das Integral f (x) dx existiert, wenn α > 1 ist, und nicht existiert, wenn α ≤ 1 ist. Aus Satz 4.20 1 ∑∞ folgt dann, dass die Reihe k=1 k1α konvergiert, wenn α > 1 ist, und nicht konvergiert, wenn α ≤ 1 ist. ∑∞ Beispiel: Die Reihe k=2 log1 k ist divergent. Es gilt log k ≤ k, sodass die Folge ( abkk )k≥2 ∑∞ mit ak = k1 und bk = log1 k beschränkt ist. Wäre k=2 bk konvergent, dann müsste nach ∑∞ Satz 4.19 auch k=2 ak konvergent sein im Widerspruch zum letzten Beispiel. Hilfe von Reihen ist es möglich, Funktionen zu definieren. Wir haben Polynome ∑Mit n k c definiert werden. Eine naheliegende k=0 k x kennen gelernt, durch die Funktionen auf ∑R ∞ Verallgemeinerung sind sogenannte Potenzreihen k=0 ck xk , die man erhält, indem man die Summe einfach bis ∞ laufen lässt. Allerdings muss man sich zuerst klar machen, für welche x ∈ R eine Potenzreihe konvergiert. Dazu definieren wir den Limes superior einer Folge. Definition: Sei (ak )k≥0 eine beschränkte Folge. Für n ≥ 0 sei an = sup{ak : k ≥ n}. Dann heißt limn→∞ an der Limes superior der Folge (ak )k≥0 . Er wird mit lim supk→∞ ak bezeichnet. Franz Hofbauer 65 Satz 4.21: Sei (ak )k≥0 eine beschränkte Folge. Dann existiert lim supk→∞ ak . Wenn limk→∞ ak existiert, dann gilt lim supk→∞ ak = limk→∞ ak . Beweis: Da (ak )k≥0 beschränkt ist, existieren Konstante c und d mit c ≤ ak ≤ d für alle k ≥ 0. Für n ≥ 0 sei Mn = {ak : k ≥ n}. Da d eine obere Schranke der Menge Mn ist, existiert an = sup Mn . Für n ≥ 0 gilt Mn+1 ⊆ Mn , also auch an+1 ≤ an wegen Satz 3.6 (b). Die Folge (an )n≥0 ist somit monoton fallend. Für jedes n ≥ 0 ist c eine untere Schranke von Mn und somit gilt c ≤ an nach Satz 3.6 (a). Also ist die Folge (an )n≥0 auch nach unten durch c beschränkt. Aus Satz 3.4 folgt, dass limn→∞ an existiert, womit die Existenz von lim supk→∞ ak gezeigt ist. Es existiere a = limk→∞ ak . Sei ε > 0. Es gibt ein n0 mit a − 2ε < ak < a + 2ε für alle k ≥ n0 . Für n ≥ n0 gilt dann Mn ⊆ (a − 2ε , a + 2ε ), das heißt a − 2ε ist eine untere und a + 2ε ist eine obere Schranke von Mn . Wegen Satz 3.6 (a) folgt a − 2ε ≤ an ≤ a + 2ε für n ≥ n0 . Wir haben |an − a| < ε für alle n ≥ n0 gezeigt. Somit gilt limn→∞ an = a, das heißt lim supk→∞ ak = a. √ ∑∞ Definition: Sei k=0 ck xk eine Potenzreihe. Ist die Folge ( k |c√ k |)k≥1 nicht beschränkt, k dann sei T = ∞. Ist sie beschränkt, dann sei T = lim supk→∞ |ck |. Wir nennen dann die Zahl R = T1 , die in [0, ∞] liegt, den Konvergenzradius der Potenzreihe. ∑∞ k < R, dann Satz 4.22: Sei ∑∞ k=0 ckk x eine Potenzreihe mit Konvergenzradius R. Gilt |x| ∑ ∞ ist die Reihe k=0 ck x absolut konvergent. Gilt |x| > R, dann ist die Reihe k=0 ck xk divergent. √ Beweis: Für n ≥ 0 sei Mn = { k |ck | : k ≥ n} und an = sup Mn . ∑∞ Sei |x| > R. Angenommen k=0 ck xk ist konvergent. Dann gilt limk→∞ ck xk = 0 nach √ 1 für k ≥ n0 . Insbesondere ist Satz 4.18. Es gibt ein n0 mit |ck xk | ≤ 1, das heißt k |ck | ≤ |x| √ √ k k die Folge ( |ck | )k≥1 beschränkt, sodass T = lim supk→∞ |ck | = limn→∞ an existiert. 1 1 1 Für n ≥ n0 ist |x| eine obere Schranke von Mn , sodass auch an ≤ |x| gilt. Es folgt T ≤ |x| , ∑ ∞ 1 1 ein Widerspruch zu |x| < R = T . Damit ist die Divergenz von k=0 ck xk gezeigt. Sei |x| < R. Insbesondere gilt R > 0 und T < ∞. Sei s ∈ (|x|, R), das heißt 1s > T . Wegen √ T = limn→∞ an existiert ein n0 mit an0 < 1s , das heißt k |ck | < 1s für k ≥ n0 , da an0 eine obere Schranke der Menge Mn0 ist. Sei q = |x| . Dann gilt |ck xk | < q k für k ≥ n0 . Somit ( |ck xk | ) ( s |c1 x| |c2 x2 | ) |cn0 xn0 | ist die Folge durch C = max |c |, , , . . . , , 1 beschränkt. Da n 2 0 k q q q k≥0 ∑∞ k ∑q∞0 k Konvergenz von k=0 |ck x | aus Satz 4.19. k=0 q wegen q < 1 konvergiert, ∑∞folgt die k Das zeigt, dass die Potenzreihe k=0 ck x absolut konvergent ist. Durch Potenzreihen kann man Funktionen definieren, wobei man mit Hilfe von Satz 4.22 ein Intervall bestimmt, auf dem die Potenzreihe∑ absolut konvergiert und somit die Funktion ∞ definiert ist. Zum Beispiel ist durch f (x) = k=0 kxk eine Funktion auf dem Intervall √ ∑∞ (−1, 1) definiert, da limk→∞ k k = 1 und somit auch R = 1 gilt. Durch g(x) = k=0 k1k xk √ ist eine Funktion auf ganz R = (−∞, ∞) definiert, da limk→∞ k 1/k k = limk→∞ k1 = 0 und somit R = ∞ gilt. Für uns bereits bekannte Funktionen haben wir im letzten Kapitel Darstellungen durch Potenzreihen gefunden. Man muss nur zeigen, dass die Restglieder mit n → ∞ gegen 0 m gehen. Es gilt limm→∞ xm! = 0 für alle x ∈ R, da für eine fest gewählte Zahl u ∈ N mit u m um−u−1 u u u |x| ≤ u die Abschätzung | xm! | ≤ uu! (u+1)(u+2)···(m−1) m ≤ u m für alle m ≥ u erfüllt ist. 66 Integration Im letzten Kapitel wurde ex = ∑n xk k=0 k! e|x| n+1 gezeigt. (n+1)! |x| ∑n xk limn→∞ k=0 k! = ex . + Rn+1 (x) und |Rn+1 (x)| ≤ Für alle x ∈ R gilt somit limn→∞ Rn+1 (x) = 0 und daher auch ∑∞ k Damit haben wir die Reihendarstellung ex = k=0 xk! gefunden, die für alle x ∈ R gilt. 1 Die Restgliedabschätzung für sin x war |R2n (x)| ≤ (2n)! |x|2n . Wie oben erhalten wir ∑∞ (−1)k 2k+1 damit die Reihendarstellung sin x = k=0 (2k+1)! x , die ebenfalls für alle x ∈ R gilt. ∑∞ (−1)k 2k Für cos x lässt sich die Reihendarstellung cos x = k=0 (2k)! x herleiten. In der Reihendarstellung von sin x sind die Koeffizienten der geraden Potenzen gleich 0, und in der von cos x die Koeffizienten der ungeraden Potenzen. Auch auf die beiden anderen im letzten Kapitel behandelten Funktionen sich diese ∑∞ lässt 1 1+x 1 Methode anwenden. Man erhält die Reihendarstellungen 2 log 1−x = k=0 2k+1 x2k+1 und k ∑∞ 2k+1 arctan x = k=0 (−1) , die beide für x ∈ (−1, 1) gelten, da das Restglied R2n+1 (x) 2k+1 x für beide Funktionen und für alle x ∈ (−1, 1) mit n → ∞ gegen 0 geht, wie man aus den im letzten Kapitel gefundenen Abschätzungen für R2n+1 (x) leicht erkennt. Der Konvergenzradius einer Potenzreihe ist mit der oben gegebenen Formel oft nur schwierig oder gar nicht zu berechnen. Es gibt noch eine andere Möglichkeit, den Konvergenzradius zu berechnen, mit der es meistens leichter geht. ∑n Satz 4.23: Sei (vk )k≥1 eine Folge und mn = n1 k=1 vn für n ≥ 1. Gilt limk→∞ vk = v, dann auch limn→∞ mn = v. Beweis: Sei ε > 0 vorgegeben. Da wir limk→∞ ∑n0 vk = v voraussetzen, existiert ein n0 mit |vk − v| < 2ε für k ≥ n0 . Sei n1 ≥ max(n0 , 2ε k=1 |vk − v|) gewählt. Für n ≥ n1 gilt dann ∑n ∑n0 1 1 |mn − v| ≤ n k=n0 +1 |vk − v| + n k=1 |vk − v| < n1 (n − n0 ) 2ε + nn1 2ε ≤ ε. Damit ist limn→∞ mn = v gezeigt. √ k Satz 4.24: Sei uk > 0 für k ≥ 0. Gilt limk→∞ uuk−1 = T , dann auch limk→∞ k uk = T . Beweis: Sei T > 0. Für k ≥ 1 sei vk = log uk − log Voraussetzung gilt ∑nuk−1 . Nach uk 1 1 limk→∞ vk = limk→∞ log uk−1 = log T . Sei mn = n k=1 vk = n log un − n1 log u0 für n ≥ 1 . Aus Satz 4.23 folgt limn→∞ mn = log T und daher auch limn→∞ n1 log un = log T . √ 1 Daraus ergibt sich limn→∞ n un = limn→∞ e n log un = elog T = T . Es fehlt noch der Beweis für T √ = 0. Die Ungleichung für geometrisches und arithmetisches ∑n √ √ √ uk u1 1 n un−1 n n n u n Mittel ergibt 0 ≤ un = u0 uun−1 0 n k=1 uk−1 . Aus Satz 4.23 folgt un−2 . . . u0 ≤ ∑n √ √ k limn→∞ n1 k=1 uuk−1 = 0. Da limn→∞ n u0 = 1 gilt, erhalten wir limn→∞ n un = 0. ∑∞ Man hat also die Möglichkeit, den Konvergenzradius der Potenzreihe k=0 ck xk auch k| mit Hilfe von limk→∞ |c|ck−1 | zu berechnen, falls dieser Grenzwert existiert. Beispiel: Wir berechnen den Konvergenzradius der Potenzreihe |ck | |ck−1 | k ∑∞ k=0 ck x k mit ck = kk k! . k (k−1)! k k−1 1 k−1 = limk→∞ k!(k−1) = limk→∞ (1+ k−1 ) =e k−1 = limk→∞ ( k−1 ) √ 1 k und somit auch limk→∞ |ck | = e. Daher ist R = e der Konvergenzradius. Es gilt limk→∞ V. Anhang In diesem Anhang werden einige Anwendungen der Analysis in einer Variablen behandelt, und zwar die Ungleichungen zwischen geometrischen,∑ arithmetischen und noch viel ∞ allgemeineren Mitteln, die Stirlingsche Formel, die Reihe n=1 n12 , der Weierstraß’sche Approximationssatz und Integration und Differenziation von Funktionenreihen. 1. Mittelungleichungen Sei n ≥ 2 und seien a1 , a2 , . . . , an positive reelle Zahlen. Dann ist n1 (a1 + a2 + · · · + an ) √ das arithmetische und n a1 a2 . . . an das geometrische Mittel dieser Zahlen. Wir zeigen zuerst, dass das geometrische immer kleiner oder gleich dem arithmetischen Mittel ist. Dann beschäftigen wir uns mit Verallgemeinerungen. Satz 5.1: Für n ∈ N und x ≥ −1 gilt (1 + x)n ≥ 1 + nx. Beweis: mit Induktion. Für n = 1 hat man Gleichheit. Ist (1 + x)n ≥ 1 + nx bereits gezeigt, dann folgt (1 + x)n+1 ≥ (1 + nx)(1 + x) = 1 + nx + x + nx2 ≥ 1 + (n + 1)x. √ Satz 5.2: Sei n ≥ 1 und a1 , a2 , . . . , an > 0. Dann gilt n a1 a2 . . . an ≤ n1 (a1 +a2 +· · ·+an ). Beweis: Wir führen den Beweis mit Induktion. Für n = 1 hat man a1 ≤ a1 , was natürlich richtig ist. Wir nehmen an, dass die Ungleichung für n − 1 Zahlen gezeigt ist und beweisen √ 1 sie für n Zahlen. Wir setzen G = n−1 a1 a2 . . . an−1 und A = n−1 (a1 + a2 + · · · + an−1 ). Dann ist G ≤ A bereits gezeigt. Wir schreiben a für an . )n ( a a a Wir setzen x = nA ≥A − n1 in Satz 5.1 (es gilt x ≥ − n1 ≥ −1) und erhalten nA + n−1 . n ( a+(n−1)A )n n−1 n ≥ aA Multiplikation mit A ergibt . Mit der Induktionsvoraussetzung n ( a+(n−1)A )n ( a +a +···+a )n n−1 1 2 n G ≤ A folgt ≥ aG , das heißt ≥ a1 a2 . . . an . Zieht man n n √ a1 +a2 +···+an n noch die n-te Wurzel, so hat man a1 a2 . . . an . Das ist die gesuchte ≥ n Ungleichung für n Zahlen. Wir verallgemeinern diese ∑n Mittel. Wir nennen die Zahlen s1 , s2 , . . . , sn Gewichte, wenn sie > 0 sind und wenn k=1 sk = 1 gilt. Das verallgemeinerte arithmetische Mittel der Zahlen a1 , a2 , . . . , an ist dann s1 a1 +s2 a2 +· · ·+sn an und das verallgemeinerte geometrische Mittel ist as11 as22 . . . asnn . Für s1 = s2 = · · · = sn = n1 erhält man die Standardversionen dieser Mittel. Wir beweisen obige Ungleichung für die verallgemeinerten Mittel. Satz 5.3: Für x > 0 gilt log x ≤ x − 1 und Gleichheit nur dann, wenn x = 1 ist. Beweis: Sei f (x) = log x − x + 1. Wegen f ′ (x) = x1 − 1 haben wir f ′ (x) > 0 für x ∈ (0, 1) und f ′ (x) < 0 für x ∈ (1, ∞). Somit ist f streng monoton fallend auf (0, 1) und streng monoton wachsend auf (1, ∞). Wir erhalten f (x) ≥ f (1) = 0 für alle x ∈ (0, ∞), wobei Gleichheit nur für x = 1 gilt. Satz 5.4: Seien s1 , s2 , . . . , sn Gewichte. Für positive reelle Zahlen a1 , a2 , . . . , an , die nicht alle gleich sind, gilt dann as11 as22 . . . asnn < s1 a1 + s2 a2 + · · · + sn an . Beweis: Sei m = s1 a1 + s2 a2 + · · · + sn an . Für 1 ≤ k ≤ n folgt log amk ≤ amk − 1 aus ak k und wir hätten Satz 5.3, wobei nicht immer Gleichheit gilt, sonst wäre ∑nm = 1 fürakalle ∑ n a1 = a2 = · · · = an = m, ein Widerspruch. Es folgt k=1 sk log m < k=1 sk ( amk − 1). ∑n ∑ ∑ ∑ n n n ak 1 Wegen k=1 sk amk = m k=1 sk ak = 1 und k=1 sk = 1 ergibt sich k=1 sk log m < 0. 68 Anhang ∑n ∑n ∑n Wegen log amk =∑ log ak − log m folgt k=1 sk log ak < k=1 sk log m. Da k=1 sk = 1 n gilt, ergibt sich k=1 log askk < log m. Wendet man auf diese Ungleichung die Exponentialfunktion an, so hat man as11 as22 . . . asnn < m = s1 a1 + s2 a2 + · · · + sn an . Seien a1 , a2 , . . . , an positive reelle Zahlen und s1 , s2 , . . . , sn Gewichte. Wir definieren { (∑ )1 n x x s a für x ∈ R \ {0} k k k=1 h(x) = s1 s2 sn für x = 0 a1 a2 . . . an Dann ist h(0) das geometrische, h(1) das arithmetische und h(−1) das harmonische Mittel. Es sind die verallgemeinerte Versionen dieser Mittel. Satz 5.5: Die Funktion g(x) = log h(x) ist im Punkt 0 stetig. ∑n x Beweis: Für x ̸= 0 gilt g(x) = log xu(x) mit u(x) = k=1 sk ak . Wegen u(0) = 1 können wir limx→0 g(x) mit der Regel von de l’Hospital berechnen. Es gilt limx→0 g(x) = ′ ∑n ∑n (x) limx→0 uu(x) . Nun ist limx→0 u(x) = k=1 sk = 1 und wegen u′ (x) = k=1 sk axk log ak ∑n ∑n ak . Somit ist limx→0 g(x) = gilt limx→0 u′ (x) = k=1 sk log ak berechnet. k=1 sk log∑ n s1 s2 sn Da g(0) = log(a1 a2 . . . an ) = k=1 sk log ak gilt, haben wir gezeigt, dass g im Punkt 0 stetig ist. Satz∑5.6: Seien s1 , s2 , . . . , sn Gewichte und r1 , r2 , . . . , rn seien ebenfalls Gewichte. Dann n gilt k=1 rk log srkk ≤ 0 und Gleichheit nur dann, wenn sk = rk für 1 ≤ k ≤ n. ∑n ∑n ∑n ∑n Beweis: Es gilt k=1 rk log srkk ≤ k=1 rk ( srkk − 1) = k=1 sk − k=1 rk = 1 − 1 = 0 wegen Satz 5.3. Ebenfalls nach Satz 5.3 haben wir Gleichheit nur dann, wenn srkk = 1, das heißt sk = rk für 1 ≤ k ≤ n gilt. Satz 5.7: Seien a1 , a2 , . . . , an positive Zahlen, die nicht alle gleich sind, und s1 , s2 , . . . , sn Gewichte. Die Funktion h : R → R ist dann stetig und streng monoton wachsend. ∑n Beweis: Sei g(x) = log h(x). Für x ̸= 0 gilt g(x) = x1 log u(x) mit u(x) = k=1 sk axk . ′ (x) Mit Hilfe der Produktregel erhalten wir dann g ′ (x) = − x12 log u(x) + x1 uu(x) , das heißt ∑ ∑ n n x 1 x x x x2 g ′ (x) = − log u(x) + u(x) k=1 sk ak log ak = − log u(x) + u(x) k=1 sk ak log ak ∑n sk ax k . Wegen Sei rk = u(x) k=1 rk = 1 sind die Zahlen r1 , r2 , . . . , rn Gewichte. Es kann rk = sk nicht für alle k gelten, sonst wäre auch axk = u(x) für alle k erfüllt und wir hätten ∑n folgt a1 = a2 = · · · = an . Satz 5.6 ergibt dann k=1 rk log srkk < 0. Wegen srkk = u(x) ax k ∑n ∑ n u(x) u(x) < 0. Nun gilt log ax = log u(x) − log axk und k=1 rk = 1, womit wir k=1 rk log ax k k ∑n sk ax k ein, so ergibt sich log u(x) − k=1 rk log axk < 0 erhalten. Setzen wir noch rk = u(x) x ∑n sk ak log u(x) − k=1 u(x) log axk < 0. Damit ist x2 g ′ (x) > 0 gezeigt. Also gilt auch g ′ (x) > 0 für alle x ∈ R \ {0}. Nach Satz 5.5 ist g im Punkt 0 stetig. Auf R \ {0} ist g sogar differenzierbar und hat Ableitung > 0. Somit ist g auf ganz R stetig und streng monoton wachsend. Da aber h(x) = eg(x) gilt, ist auch h auf ganz R stetig und streng monoton wachsend. Satz 5.7 ergibt Ungleichungen für Mittel. Insbesondere gilt h(−1) < h(0) < h(1), das sind Ungleichungen für das harmonische, geometrische und arithmetische Mittel. Gilt a1 = a2 = · · · = an = a, dann ist h(x) = a für alle x ∈ R. Franz Hofbauer 69 2. Die Stirlingsche Formel Bevor wir zur Stirlingschen Formel kommen, behandeln wir das sogenannte Wallissche Produkt. ∫π ∫ π2 2n−3 31π 2n 2n−2 42 Satz 5.8: Es gilt 02 sin2n x dx = 2n−1 sin2n+1 x dx = 2n+1 . . . und 2n 2n−2 42 2 2n−1 . . . 5 3 0 ∫π ∫π für n ≥ 1. Weiters gilt 02 1dx = π2 und 02 sin x dx = 1, die Gleichungen für n = 0. Beweis: Für k ≥ 2 berechnen wir mit Hilfe von partieller Integration π2 ∫ π2 ∫ π2 ∫π k k−1 k−1 + (k − 1) 2 sink−2 x cos2 x dx sin x dx = sin x sin x dx = − sin x cos x 0 0 0 0 ∫ π2 ∫ π2 k−2 k = (k − 1) 0 sin x dx − (k − 1) 0 sin x dx Durch entsprechendes Umformen ergibt sich daraus dann ∫ π2 ∫ π2 k k−1 (1) sin x dx = sink−2 x dx k 0 0 ∫π ∫π Klarerweise gilt 02 1dx = π2 und 02 sin x dx = 1. Das sind die beiden Gleichungen für n = 0. Nehmen wir also an, die beiden Gleichungen seien für n schon gezeigt. Mit ∫π ∫ π2 2n 2n−1 2n−3 31π x dx = 2n+1 Hilfe von (1) folgt dann 02 sin2n+2 x dx = 2n+1 2n+2 0 sin 2n+2 2n 2n−2 . . . 4 2 2 π ∫ π2 ∫ 2n+1 2n 2n−2 42 2 und 0 sin2n+3 x dx = 2n+2 x dx = 2n+2 2n+3 0 sin 2n+3 2n+1 2n−1 . . . 5 3 , das sind die beiden Gleichungen für n + 1. Somit ist der Satz durch Induktion bewiesen. √ ( ) √1 . Satz 5.9: Es gilt limn→∞ 22nn 2n n = π Beweis: Für 0 ≤ x ≤ π2 gilt 0 ≤ sin x ≤ 1, woraus sinn x ≤ sinn−1 x für alle n ≥ 1 folgt. ∫π ∫π ∫π ∫π Wir erhalten 02 sin2n x dx ≤ 02 sin2n−1 x dx und 02 sin2n+1 x dx ≤ 02 sin2n x dx, das 2n−3 31π 2n−2 42 2n 2n−2 42 2n−1 2n−3 31π heißt 2n−1 2n 2n−2 . . . 4 2 2 ≤ 2n−1 . . . 5 3 und 2n+1 2n−1 . . . 5 3 ≤ 2n 2n−2 . . . 4 2 2 wegen 22 42 ...(2n)2 π 2n+1 32 52 ...(2n−1)2 2n ≤ 2 2n für alle n ≥ 2. Da 22 42 ...(2n)2 π aber limn→∞ 2n+1 2n = 1 gilt, erhalten wir limn→∞ 32 52 ...(2n−1)2 2n = 2 . ( ) 1·3·5···(2n−1) 1 2n folgt. Obiger Grenzwert Nun gilt 22n (n!)2 = 22 ·42 · · · (2n)2 , woraus 22n n = 2·4···(2n) √ ( ) ( 1 (2n))2 √1 . besagt, dass limn→∞ 2n 22n n = π2 gilt. Daraus folgt limn→∞ 22nn 2n n = π Satz 5.8. Durch Umformen ergibt sich π 2 ≤ Jetzt werden wir schrittweise die Stirlingsche Formel herleiten. Satz 5.10: Es gilt 2x ≤ log 1+x 1−x ≤ 2x + 1+x 1−x − 2x = 2x2 = 1−x 2 . Man Beweis: Sei f (x) = log ′ 2x3 3(1−x2 ) für 0 ≤ x < 1. log(1 + x) − log(1 − x) − 2x für x ∈ [0, 1). Dann gilt f (x) = + −2 sieht, dass f ′ (x) ≥ 0 auf dem Intervall (0, 1) gilt. Die Funktion f ist dort monoton wachsend. Es gilt somit f (x) ≥ f (0) = 0 für alle x ∈ [0, 1). Damit ist die erste Ungleichung gezeigt. 1 1+x 1 1−x 2x3 1+x 2x3 3(1−x2 ) − log 1−x = 3(1−x2 ) 2 2 4 2 3x (1−x )+2x 2x2 3x2 +x4 − 1−x 2 = 3(1−x2 )2 . 3 (1−x2 )2 Sei g(x) = 2x + − f (x) für x ∈ [0, 1). Wieder berechnen wir g ′ (x) = Man sieht, dass g ′ (x) ≥ 0 auf dem Intervall (0, 1) gilt. Die Funktion g ist dort monoton wachsend. Es gilt somit g(x) ≥ g(0) = 0 für alle x ∈ [0, 1). Damit ist auch die zweite Ungleichung gezeigt. n √ Satz 5.11: Für n ≥ 1 sei an = nn!e n n und bn = log an . Dann ist die Folge (bn )n≥1 monoton 1 fallend und hat einen Grenzwert b. Weiters gilt b ≤ bn ≤ b + 12n für alle n ≥ 1. 70 Anhang Beweis: Für n ≥ 1 gilt mit x = 1 2n+1 . an an+1 1 n+ 2 = 1e ( n+1 . Es folgt bn − bn+1 = log n ) Wegen Satz 5.10 gilt dann 0 ≤ bn − bn+1 ≤ an an+1 x2 1 3(1−x2 ) = 12n = 1 2x − 1 12(n+1) . log 1+x 1−x −1 1 . Die Folge (bn )n≥1 ist dann monoton fallend und die Folge Für n ≥ 1 sei cn = bn − 12n (cn )n≥1 ist monoton wachsend. Da bn ≥ cn ≥ c1 für alle n ≥ 1 gilt, ist die Folge (bn )n≥1 nach unten durch c1 beschränkt. Somit existiert ein b mit limn→∞ bn = limn→∞ cn = b. 1 Weiters gilt cn ≤ b ≤ bn , das heißt b ≤ bn ≤ b + 12n für alle n ≥ 1. √ n √ Satz 5.12 (Stirlingsche Formel) Es gilt limn→∞ nn!e 2π. n n = n √ Beweis: Für n ≥ 1 sei an = nn!e n n und bn = log an wie in Satz 5.11 und b sei der dort gefundene Grenzwert der Folge (bn )n≥1 . Dann gilt limn→∞ an = a mit a = eb . √ ( ) (2n)! e2n n n2n n √ √ 2n für n ≥ 1. Es gilt limn→∞ a2n √1 = Weiters gilt aa2n = (2n) 2 2 2n 2n 2n (n!) e a2 = 22n 2 n 2π n n wegen Satz 5.9. Da aber auch limn→∞ aa2n = aa2 = a1 gelten muss, erhalten wir a1 = √12π 2 n√ √ n √ und a = 2π. Damit ist limn→∞ nn!e 2π gezeigt. n n = √ √ n 1 √ Aus Satz 5.11 erhalten wir für alle n ≥ 1 die Abschätzung 2π ≤ nn!e 2π e 12n , n n ≤ √ √ √ n n 1 das heißt n en2πn ≤ n! ≤ n en2πn e 12n , da a = eb = 2π im Beweis von Satz 5.12 gezeigt wurde. 3. Die Reihe ∑∞ 1 n=1 n2 ∑∞ In der Analysis zeigt man, dass die Reihe n=1 n1α für α > 1 konvergent ist. Somit ∑∞ 1 ∑∞ 1 ist die Reihe A = n=1 n2 konvergent. Ebenso sind die Reihen U = n=1 (2n−1)2 ∑∞ 1 und G = n=1 (2n) 2 konvergent, da sie durch Streichen von Gliedern aus obiger Reihe entstehen. Es gelten die Gleichungen A = 4G und A = U + G. Man erhält sie durch Grenzübergang aus entsprechenden Gleichungen für Partialsummen. Es folgt A = 43 U . Satz 5.13: Für m ≥ 1 gilt ∑2m−1 n=1 1 (2n−1)π sin2 m+1 2 = 4m 2 . Beweis: Wegen sin 2α = 2 sin α cos α, sin2 α + cos2 α = 1 und cos α = sin(α + π2 ) erhalten wir sin21 2α = 14 ( sin12 α + cos12 α ) = 14 ( sin12 α + sin2 (1π +α) ). Wir zeigen 2 ∑2m 1 (1) = 4m für m ≥ 0 n=1 2 (2n−1)π sin 2m+1 durch Induktion nach m. Für m = 0 haben wir 1 sin2 π 2 = 1, eine richtige Gleichung. Wir nehmen an,( dass (1) bereits gezeigt ist. Setzt man oben α = (2n−1)π 2m+2 , so hat man ) 1 1 1 1 . Setzt man das in (1) ein, dann erhält (2n−1)π = 4 (2n−1)π + (2m+1 +2n−1)π sin2 m+1 sin2 m+2 sin2 2 2 2m+2 ∑2m ∑2m 1 man 14 n=1 2 (2n−1)π + 14 n=1 2 (2(2m1 +n)−1)π = 4m . Das kann man in eine Summe sin sin 2m+2 2m+2 zusammenfassen, da n in der ersten Summe von 1 bis 2m läuft und 2m + n in der zweiten ∑2m+1 1 Summe von 2m +1 bis 2m+1 . Man erhält n=1 = 4m+1 . Das ist die Gleichung 2 (2n−1)π sin 2m+2 in (1) für m + 1 anstelle von m. Damit ist (1) durch Induktion bewiesen. 1 1 . Daran erkennt man, dass in Wegen sin(π − α) = sin α gilt 2 (2m+1 = 2 (2n−1)π −2n+1)π sin 2m+1 sin 2m+1 (1) der (2 −n+1)-te Summand und der n-te Summand gleich sind. Die Summe der ersten m Franz Hofbauer 71 2m−1 Summanden ist daher gleich der Summe der übrigen 2m−1 Summanden. Summiert man in (1) nur über die ersten 2m−1 Summanden, dann erhält man auch nur den halben ∑2m−1 m 1 Wert, das heißt n=1 = 42 . 2 (2n−1)π sin Satz 5.14: Es gilt ∑∞ 1 n=1 (2n−1)2 Beweis: Für 0 < x < 1 sin2 x m−1 2 2m+1 π 2 = π2 8 . gilt bekanntlich sin x < x < tan x = √ sin x 2 , woraus wir dann 1−sin x (2n−1)π > − 1 erhalten. Setzt man x = 2m+1 und summiert über n von 1 bis > ∑2m−1 4m+1 m 4m m−1 für m ≥ 1 mit Hilfe von , dann erhält man 42 > n=1 (2n−1) 2 π2 > 2 − 2 m−1 ∑ 2 2 2 π 1 π2 π2 5.13. Multiplikation mit 4m+1 ergibt π8 > n=1 (2n−1) 2 > 8 − 2m+3 . Lässt man 1 x2 1 sin2 x Satz m gegen ∞ gehen, dann ist der Satz schon bewiesen. Mit den eingangs durchgeführten Überlegungen folgt jetzt ∑∞ 1 n=1 n2 = 4 π2 3 8 = π2 6 . 4. Der Weierstraßsche Approximationssatz Sei f : [0, 1] → R eine stetige Funktion. Der Weierstraßsche Approximationssatz besagt, dass man f beliebig gut durch∑ Polynome (approximieren kann. Man kann ) ( ) diese Polynome n k n k k n k n−k sogar angeben. Sei Pn (x) = k=0 f ( n ) k x (1 − x) . Da f ( n ) k x (1 − x)n−k ein Polynom in der Variable x ist, ist Pn (x) als Summe dieser Polynome ebenfalls ein Polynom. Wir zeigen, dass limn→∞ Pn (x) = f (x) für alle x ∈ [0, 1] gilt. ( ) Zur Abkürzung setzen wir wn,k (x) = nk xk (1 − x)n−k . Insbesondere ist wn,n (x) = xn ∑n k und wn,0 (x) = (1 − x)n . Es gilt dann Pn (x) = k=0 f ( n )wn,k (x). Wir beginnen mit Hilfsresultaten. Satz ∑n 5.15: Sei n ≥ 2 und ∑n x ∈ [0, 1]. 2Dann gilt wn,k (x) ≥ 0 für 0 ≤ k ≤ n. Weiters gilt w (x) = 1 und k=0 n,k k=0 (k − nx) wn,k (x) = nx(1 − x). ( ) Beweis: Die Zahlen wn,k (x) = nk xk (1 − x)n−k für 0 ≤ k ≤ n sind gerade die in der Binomialverteilung auftretenden Wahrscheinlichkeiten.∑Sie sind ≥ 0 und ihre Summe ist 1. ∑n n Der Erwartungswert k=0 kwn,k (x) ist nx. Somit ist k=0 (k − nx)2 wn,k (x) die Varianz, die gleich nx(1 − x) ist. Das kennt man aus der Wahrscheinlichkeitstheorie. Satz 5.16: Sei n ≥ 2 und x ∈ [0, 1] beliebig. Wir definieren ∑ Kn = {0, 1, 2, . . . , 1n} und k Jn,δ (x) = {k ∈ Kn : |x − n | ≥ δ}. Für alle δ > 0 gilt dann k∈Jn,δ (x) wn,k (x) ≤ 4nδ2 . ( )2 Beweis: Für k ∈ Jn,δ (x) gilt 1 ≤ k−nx . Wir erhalten daher nδ ( k−nx )2 ∑ ∑ ∑n wn,k (x) ≤ n21δ2 k=0 (k − nx)2 wn,k (x) k∈Jn,δ (x) wn,k (x) ≤ k∈Jn,δ (x) nδ ∑n Nach Satz 5.15 gilt k=0∑ (k − nx)2 wn,k (x) = nx(1 − x). Das Maximum der Funktion n x(1 − x) ist 41 . Somit gilt k=0 (k − nx)2 wn,k (x) = nx(1 − x) ≤ n4 für alle x ∈ [0, 1]. Setzt ∑ 1 man das oben ein, so hat man k∈Jn,δ (x) wn,k (x) ≤ 4nn2 δ2 = 4nδ 2. Eine Funktion f : [a, b] → R heißt gleichmäßig stetig, wenn für jedes ε > 0 ein δ > 0 existiert, sodass für alle x und y in [a, b] mit |x − y| < δ sich die Funktionswerte f (x) und f (y) um weniger als ε voneinander unterscheiden, das heißt |f (x) − f (y)| < ε erfüllt ist. Nach Satz 4.12 ist jede Funktion f : [a, b] → R, die stetig ist, bereits gleichmäßig stetig. 72 Anhang Satz 5.17 (Weierstraßscher Sei f : [0, 1] → R eine stetige Funktion ( ) Approximationssatz) ∑n k n k n−k . Für jedes ε > 0 existiert dann ein n0 , sodass und Pn (x) = k=0 f ( n ) k x (1 − x) |f (x) − Pn (x)| < ε für alle n ≥ n0 und alle x ∈ [0, 1] gilt (n0 hängt nur von ε, nicht aber von x ab). Beweis: Sei ε > 0 vorgegeben. Da f : [0, 1] → R stetig und somit auch gleichmäßig stetig ist, existiert ein δ > 0, sodass |f (x) − f (y)| < 2ε für alle x, y ∈ [0, 1] mit |x − y| < δ gilt. Weiters ist f beschränkt. Es existiert ein c > 0, sodass |f (x)| ≤ c für alle x ∈ [0, 1] gilt. Wir wählen dann n0 so groß, dass n0cδ2 < ε gilt. Sei x ∈ [0, 1] beliebig. Sei Kn = {0, 1, 2, . . . , n}, In,δ (x) = {k ∈ Kn : |x − nk | < δ} und Jn,δ (x) = {k ∈ Kn : |x − nk | ≥ δ}. Dann ist Kn die disjunkte Vereinigung von In,δ (x) und Jn,δ (x). Für k ∈ In,δ (x) gilt |x − nk | < δ und daher auch |f (x) − f ( nk )| < 2ε . Es folgt ∑ ∑ ∑n ε ε ε k k∈In,δ (x) |f (x) − f ( n )|wn,k (x) < k∈In,δ (x) 2 wn,k (x) ≤ 2 k=0 wn,k (x) = 2 wobei auch Satz 5.15 verwendet wurde. Wegen |f (x) − f ( nk )| ≤ |f (x)| + |f ( nk )| ≤ 2c folgt ∑ ∑ k c k∈Jn,δ (x) |f (x) − f ( n )|wn,k (x) ≤ k∈Jn,δ (x) 2c wn,k (x) ≤ 2nδ 2 c c ε mit Satz 5.16. Ist jetzt n ≥ n0 , dann gilt 2nδ 2 ≤ 2n δ 2 < 2 und mit Satz 5.15 erhalten wir 0 ) ∑n ( ∑n |f (x) − Pn (x)| = | k=0 f (x) − f ( nk ) wn,k (x)| ≤ k=0 |f (x) − f ( nk )|wn,k (x) ∑ ∑ c ≤ k∈In,δ (x) |f (x) − f ( nk )|wn,k (x) + k∈Jn,δ (x) |f (x) − f ( nk )|wn,k (x) < 2ε + 2nδ 2 < ε Damit ist |f (x) − Pn (x)| < ε für alle n ≥ n0 gezeigt und der Satz ist bewiesen. Man kann dieses Resultat noch ein wenig anders aufschreiben. Für eine Funktion g : [0, 1] → R definieren wir die sogenannte Supremumsnorm ∥g∥∞ = supx∈[0,1] |g(x)|. Dann lässt sich Satz 5.17 ∑ folgendermaßen Wenn f : [0, 1] → R eine stetige ( ) schreiben: n k n k n−k Funktion ist und Pn (x) = k=0 f ( n ) k x (1 − x) , dann existiert für jedes ε > 0 ein n0 ≥ 1, sodass ∥f − Pn ∥∞ < ε für alle n ≥ n0 gilt. Das heißt limn→∞ ∥f − Pn ∥∞ = 0. 5. Reihendarstellungen von Funktionen Wir beginnen mit einem Satz über gliedweise Integration. Satz 5.18: Sei I ein offenes Intervall, das auch unbeschränkt sein darf, und a ∈ I fest gewählt. Für n ∑ ≥ 0 sei gn : I → R eine stetige Funktion. Weiters seien Zahlen cn > 0 ∞ vorgegeben mit n=0 cn = d < ∞ und |gn (x)| ≤ cn für alle x ∈ I und alle n ≥ 0. Für ∑∞ alle x ∈ I existiert dann g(x) = n=0 gn (x). Weiters ist g auf ganz I stetig und es gilt ∫x ∑∞ ∫ x g(t)dt = n=0 a gn (t)dt. a ∑∞ Beweis: Sei x ∈ I beliebig. Da n=0 cn < ∞ und |gn (x)| ≤ cn für alle n ≥ 0 gilt, erhalten ∑∞ ∑ ∞ wir n=0 |gn (x)| < ∞. Die Reihe n=0 gn (x) ist somit absolut konvergent ∑∞ und daher nach einem Satz aus der Analysis auch konvergent. Wir schreiben g(x) = n=0 gn (x). ∑k−1 ∑k−1 Sei dk = d − n=0 cn für k ≥ 0. Wegen limk→∞ n=0 cn = d erhalten wir limk→∞ dk = 0. ∑k−1 Sei x ∈ I beliebig und k ≥ 0. Wir setzen hk (x) = n=0 gn (x). Für m ≥ k ergibt sich dann ∑m ∑m ∑m ∑m ∑m ∑k−1 | n=0 gn (x) − hk (x)| = | n=k gn (x)| ≤ n=k |gn (x)| ≤ n=k cn ≤ n=0 cn − n=0 cn . Lassen wir m gegen ∞ gehen, so erhalten wir (1) |g(x) − hk (x)| ≤ dk für alle x ∈ I und alle k ≥ 0 Um zu zeigen, dass g im Punkt x ∈ I stetig ist, sei ε > 0 vorgegeben. Sei k so gewählt, dass dk < 3ε gilt. Da hk als Summe endlich vieler stetiger Funktionen stetig ist, existiert Franz Hofbauer 73 ein δ > 0 mit |hk (x) − hk (y)| < 3ε für alle y ∈ (x − δ, x + δ) ∩ I. Mit (1) erhalten wir dann |g(x) − g(y)| ≤ |g(x) − hk (x)| + |hk (x) − hk (y)| + |hk (y) − g(y)| < 3ε + 3ε + 3ε = ε für alle y ∈ (x − δ, x + δ) ∩ I. Damit ist gezeigt, dass g im Punkt x stetig ist. Aus (1) folgt auch ∫ x g(t)−dk ≤ hk (t) ≤ g(t)+d ∫ x k für alle ∫t x∈ I und k ≥ 0. Integriert man von a bis x so folgt a g(t) dt − dk (x − a) ≤ a hk (t)dt ≤ a g(t)dt + dk (x − a). Die Integrale existieren, da g und hk stetige Funktionen sind. (Wenn x kleiner als a ist, dann drehen dass man das sich die Ungleichheitszeichen um.) Setzt man für hk (t) ein und beachtet, ∫x Integral und die endliche Summe vertauschen darf, so erhält man a g(t)dt − dk (x − a) ≤ ∫x ∑k−1 ∫ x Jetzt kann man den Grezwert für k → ∞ bilden. n=0 a gn (t)dt ≤ a g(t)dt+dk (x−a). ∑k−1 ∫ x ∑∞ ∫ x Wegen limk→∞ dk = 0 existiert n=0 a gn (t) dt = limk→∞ n=0 a gn (t)dt und es gilt ∫x ∑∞ ∫ x g(t)dt = n=0 a gn (t)dt. a Beispiel: ∑ Sei 0 < α < 1 und I = (−α, α). Für n ≥ 0 sei gn (x) = 2x2n und cn = 2α2n . ∞ 2 Dann gilt n=0 cn = 1−α 2 < ∞ und |gn (x)| ≤ cn für alle x ∈ I und n ≥ 0. Die Voraus∑∞ 2 1 1 setzungen von Satz 5.18 sind erfüllt. Es folgt g(x) = n=0 gn (x) = 1−x 2 = 1+x + 1−x ∫x x 1+x und 0 g(y)dy = log(1 + y) − log(1 − y)0 = log(1 + x) − log(1 − x) = log 1−x . Weiters ∫x 2n+1 2y 2n+1 x gilt 0 gn (y) dy = 2n+1 0 = 2x 2n+1 . Wegen Satz 5.18 erhalten wir die Reihendarstellung ∑∞ 2x2n+1 1+x log 1−x = n=0 2n+1 , die für alle x ∈ (−α, α) gilt. Da α beliebig nahe an 1 gewählt werden kann, gilt sie für alle x ∈ (−1, 1). Beispiel: Sei wieder ∑ 0 < α < 1 und I = (−α, α). Für n ≥ 0 sei gn (x) = (−1)n x2n und ∞ 1 2n cn = α . Dann gilt n=0 cn = 1−α 2 < ∞ und |gn (x)| ≤ cn für alle x ∈ I und n ≥ 0. ∑∞ 1 Die Voraussetzungen von Satz 5.18 gelten. Wir erhalten g(x) = n=0 gn (x) = 1+x 2 und x ∫x ∫x n 2n+1 n 2n+1 x y = (−1) x . g(y)dy = arctan y 0 = arctan x. Weiters gilt 0 gn (y)dy = (−1)2n+1 2n+1 0 ∑∞ (−1)0n x2n+1 Wegen Satz 5.18 erhalten wir die Reihendarstellung arctan x = n=0 , die für 2n+1 alle x ∈ (−α, α) gilt. Da α beliebig nahe an 1 gewählt werden kann, gilt sie für x ∈ (−1, 1). Satz 5.19: Sei I ein offenes Intervall, das auch unbeschränkt sein darf. Für ∑∞alle n ≥ 0 sei fn : I → R stetig differenzierbar. Weiters seien cn > 0 vorgegeben mit n=0 cn < ∞ ∑∞ ′ und |fn (x)| ≤ cn für alle x ∈ I und alle n ≥ 0. Wenn f (x) = n=0 ∑∞fn (x) für alle x ∈ I existiert, dann ist f auf ganz I differenzierbar und es gilt f ′ (x) = n=0 fn′ (x). Beweis: Wir verwenden Satz 5.18. Sei gn = fn′ für n ≥ 0 und a ∈ I fest ∑ gewählt. Dann ∞ sind die Voraussetzungen von Satz 5.18 erfüllt. ∫Dieser besagt, dass∫g(x) = n=0 fn′ (x) für ∑ x x ∞ alle x ∈ I existiert, dass g stetig ist und dass a g(t) dt = n=0 a fn′ (t)dt gilt. Wegen ∫x ′ ∫x ∑∞ ∑∞ f (t) dt = fn (x) − fn (a) erhalten wir a g(t)dt = n=0 fn (x) − n=0 fn (a). Nach a n ∫x Voraussetzung konvergieren diese Reihen und es folgt a g(t) dt = f (x) − f (a). Nach dem ∫y Mittelwertsatz der Integralrechnung gilt f (y) − f (x) = x g(t)dt = (y − x)g(c) für ein c zwischen x und y. Dividiert man durch ∑∞y − x und lässt y gegen x gehen, so erhält man f ′ (x) = g(x). Damit ist auch f ′ (x) = n=0 fn′ (x) gezeigt. ∑∞ ∑∞ Beispiel: Eine Reihe der Form 21 a0 + n=1 n cos nx + n=1 bn sin nx heißt Fourierreihe. ∑a∞ Wir untersuchen nur die Sinusreihe f (x) = n=1 bn sin nx mit bn ∈ R. Wir setzen fn (x) = b∑ n sin nx. Aus Satz 5.18 folgt, dass f (x) für alle x ∈ R existiert und stetig ist, wenn ∞ j=1 |bn | < ∞ gilt, da ja |fn (x)| = |bn sin nx| ≤ |bn | für alle x ∈ R und n ≥ 1 erfüllt ist. Wegen fn′ (x) = nbn cos nx gilt außerdem |fn′ (x)| ≤ n|bn | für alle x ∈ R und n ≥ 1. Ist 74 Anhang ∑∞ daher j=1 n|bn | < ∞ erfüllt, dann ist f nach Satz 5.19 auf ganz R differenzierbar mit ∑∞ f ′ (x) = n=1 nbn cos nx. Für die Cosinusreihe gelten analoge Resultate. ∑∞ n Beispiel: Wir untersuchen Potenzreihen f (x) = n=0 cn x mit Koeffizienten cn in R. √ Sei T = lim supn→∞ n |cn |. Man nennt R = T1 den Konvergenzradius der Potenzreihe. Ist T = 0, dann setzen wir R = ∞. Sei 0 < α < R und I = (−α, α). Wir setzen fn (x) = cn xn für n ≥ 0. Wegen 0<α<R √ n gilt αT < 1. Wir wählen q mit αT < q < 1. Es folgt lim supn→∞ α |cn | = αT < q, √ n sodass ein n0 existiert mit α |cn | < q für alle n ≥ n0 , also auch αn |cn | < q n . Wählen wir eine Konstante k, groß genug ist, dann gilt αn |cn | < kq n für alle n ≥ 0. Wegen ∑die ∞ k < ∞. Ist x ∈ I, dann gilt |fn (x)| ≤ |cn |αn < kq n 0 < q < 1 gilt auch n=0 kq n = 1−q ∑∞ ∑∞ für alle n ≥ 0. Aus Satz 5.18 folgt daher, dass f (x) = n=0 fn (x) = n=0 cn xn für alle x ∈ I = (−α, α) existiert. Da α beliebig nahe an R gewählt werden kann, gilt das für alle x ∈ (−R, R). Daher heißt R auch Konvergenzradius der Potenzreihe. n−1 Für x ∈ I = (−α, α) und n ≥ 0 gilt auch |fn′ (x)| ≤ n|cn |αn−1 ≤ kq . Weα nq ∑∞ ∑ m m−1 1−q 1 n−1 n ≤ (1−q)2 < ∞ (Differenzieren von = 1−q nach q ergibt gen n=0 nq n=0 q ∑m−1 n−1 m m−1 1−q −mq 1 = (1−q) ≤ (1−q) 2 + 2 und dann m → ∞) können wir Satz 5.19 n=0 nq 1−q anwenden. besagt, auf dem I = (−α, α) differenzierbar ist mit ∑∞Dieser ∑∞ dass f n−1 ∑∞Intervalln−1 ′ ′ f (x) = n=0 fn (x) = n=0 ncn x = n=1 ncn x . Da α beliebig nahe an R gewählt werden kann, gilt das wieder für alle x ∈ (−R, R). Inhaltsverzeichnis I. Reelle Zahlen und stetige Funktionen 1. 2. 3. 4. 5. 6. 7. 8. Dezimalzahlen Ordnung Intervallschachtelungseigenschaft Folgen und deren Grenzwerte Funktionen Stetigkeit Zwischenwertsatz und Umkehrfunktion Potenzfunktion 1 1 4 6 10 13 16 18 20 II. Differenzierbarkeit 23 1. 2. 3. 4. 5. 6. 7. 8. 9. 23 25 27 30 31 32 35 39 40 Grenzwerte von Funktionen Die Ableitung Monotonieverhalten von Funktionen Extremwerte Gleichungen und Ungleichungen Trigonometrische Funktionen Exponentialfunktion und Logarithmus Regel von de l’Hospital Komplexe Zahlen III. Beweise durch Intervallschachtelung 42 1. Intervallhalbierung 2. Infimum und Supremum 42 43 IV. Integration 46 1. 2. 3. 4. 5. 6. 7. 46 54 54 57 60 60 63 Definition und Eigenschaften des Integrals Gleichmäßige Stetigkeit Anwendungen des Integrals Verallgemeinerte Riemannsummen Uneigentliche Integrale Approximation von Funktionen durch Polynome Reihen V. Anhang 67 1. 2. 3. 4. 5. 67 69 70 71 72 Mittelungleichungen Die Stirlingsche ∑∞ Formel Die Reihe n=1 n12 Der Weierstraßsche Approximationssatz Reihendarstellungen von Funktionen