Analysis in einer Variablen

Werbung
Analysis in einer Variablen
Eine Vorlesung für das
Lehramtsstudium
Franz Hofbauer
SS 2009
Vorwort
Die Lehramtsausbildung sollte sich an der Berufsrealität der Lehrer orientieren. Deshalb
wird in diesem Skriptum ein Zugang zur Analysis gewählt, der nahe an der Mathematik
im Schulunterricht bleibt. Die reellen Zahlen werden als Dezimalzahlen eingeführt, die auf
der Zahlengerade angeordnet sind. Es ist dann nicht schwer, die Intervallschachtelungseigenschaft zu beweisen. Diese Version der Vollständigkeit der reellen Zahlen hat auch den
Vorteil, dass man sie unmittelbar anwenden kann, zum Beispiel zum Berechnen der Wurzel
einer positiven reellen Zahl oder zur Bestimmung der Fläche des Einheitskreises.
Mit Hilfe einer Intervallhalbierungsmethode kann man dann den Zwischenwertsatz, den
Satz von Bolzano-Weierstraß und den Satz über das Supremum einer beschränkten Menge
beweisen. Diese Beweise sind in einem eigenen Kapitel zusammengefasst.
Grenzwerte, Stetigkeit und Differenzierbarkeit werden wie üblich behandelt. Als zusätzliche Anwendungsmöglichkeit der Ableitung werden einige wichtige Ungleichungen bewiesen.
Die trigonometrischen Fuktionen werden am Einheitskreis definiert. Geometrische Überlegungen helfen dann, die Summensätze zu beweisen und die Ungleichungen zu finden, die
für die Berechnung der Ableitung gebraucht werden.
Die Exponentialfunktion beschreibt kontinuierliches Wachstum. Ist x der jährliche Zinssatz und unterteilt man das Jahr in n gleich lange Perioden, an deren Enden die Zinsen
gutgeschrieben werden, dann wächst das Startkapital um den Faktor (1 + nx )n in einem
Jahr. Im Grenzwert n → ∞ erhält man kontinuierliches Wachstum. Das ergibt die
Definition der Exponentialfunktion. Mit Hilfe von entsprechenden Ungleichungen kann
die Existenz dieses Grenzwertes bewiesen werden. Ebenso findet man die Rechenregeln
und die Ableitung der Exponentialfunktion.
√
Die Umkehrfunktion von x 7→ (1 + nx )n ist x 7→ n( n x − 1). Als Grenzwert dieser
Funktionen ergibt sich der Logarithmus.
Das Riemmannintegral wird wie üblich mit Hilfe von Ober- und Untersummen eingeführt
und dann der Hauptsatz bewiesen. Aus den Rechenregeln für die Ableitung erhält man die
für das Integral. Schließlich wird noch die Taylorformel behandelt, um die oben genannten
Funktionen und einige andere in Potenzreihen entwickeln zu können.
Reihen und insbesondere Potenzreihen sind für diesen Zugang zur Analysis nicht notwendig. Sie werden daher kurz am Ende des Skriptums behandelt.
Im Anhang findet man einige interessante Anwendungen und Ergänzungen.
I. Reelle Zahlen und stetige Funktionen
Wir führen die reellen Zahlen als Dezimalzahlen ein, die wir uns auf der Zahlengerade
angeordnet vorstellen. Dadurch ist auch eine Ordnungsrelation festgelegt. Wir zeigen
dann, dass die Intervallschachtelungseigenschaft gilt. Sie wird später zum Beweis der
grundlegenden Sätze wie Zwischenwertsatz, Mittelwertsatz und Satz über die Konvergenz
monotoner Folgen verwendet.
Der Begriff des Grenzwerts spielt die Hauptrolle in der Analysis. Wir beginnen daher
mit der Untersuchung von Folgen und deren Grenzwerten. Dann führen wir Funktionen
ein. Beispiele dafür sind Polynome und rationale Funktionen. Wesentlich ist der Begriff
der Stetigkeit. Für stetige Funktionen gilt der Zwischenwertsatz. Damit beweist man
unter anderem die Existenz der Umkehrfunktion, die zur Einführung der Wurzelfunktion
und damit auch der Potenzfunktion verwendet wird.
1. Dezimalzahlen
Die Geschichte der Zahlen beginnt mit dem Zählen. Dadurch erhält man die natürlichen
Zahlen N = {1, 2, 3, . . . }. Fügt man auch noch die Null und die negativen Zahlen hinzu,
so erhält man die ganzen Zahlen
Z = {. . . , −3, −2, −1, 0, 1, 2, 3, 4, . . . }
Ganze Zahlen kann man addieren und multiplizieren und erhält dadurch wieder ganze
Zahlen. Die Rechenregeln für Addition und Multiplikation sind
Assoziativgestze: a + (b + c) = (a + b) + c und a(bc) = (ab)c
Kommutativgesetze: a + b = b + a und ab = ba
Distributivgesetz: (a + b)c = ac + bc
Diese Gesetze garantieren, dass man so addieren und multiplizieren darf, wie man es
gewohnt ist. Die Subtraktion wird als Umkehroperation zur Addition behandelt. Die
Subtraktion einer Zahl ist die Addition dieser Zahl mit geändertem Vorzeichen.
Neben den Rechenoperationen gibt es auch eine Ordnungsrelation < auf Z. Zwei ganze
Zahlen sind immer vergleichbar, das heißt, wenn a ungleich b ist, dann gilt entweder a < b
oder a > b. Man kann Z als die ganzzahligen Punkte auf der Zahlengeraden anordnen.
−3
−2
−1
0
1
2
3
4
5
6
7
8
Wir wollen uns nicht weiter mit den ganzen Zahlen beschäftigen, sondern gleich zu den
reellen Zahlen übergehen.
In Z kann man die Subtraktion, also die Umkehroperation zur Addition ausführen, nicht
aber die Umkehroperation zur Multiplikation. Will man zum Beispiel 9 durch 7 dividieren,
so erhält man 1 als Ergebnis und 2 als Rest. Das Divisionsergebnis liegt also zwischen 1
und 2. Um die Division genauer ausführen zu können, gehen wir über zu einer genaueren
Skala, indem wir die Längeneinheit in zehn Teile unterteilen.
0.9
1.0
1.1
1.2
1.3
1.4
1.5
1.6
1.7
1.8
1.9
2.0
2.1
Jetzt kann man die Division auf eine Dezimalstelle genau ausführen. Das Divisionsergebnis
auf eine Dezimalstelle genau ist 1.2 mit 6 als Rest. Das exakte Divisionsergebnis liegt also
2
Reelle Zahlen und stetige Funktionen
zwischen 1.2 und 1.3. Man kann dieses Verfahren fortsetzen. Unterteilt man die Abstände
zwischen aufeinanderfolgenden einstelligen Dezimalzahlen jeweils wieder in zehn gleiche
Teile, so erhält man eine zweistellige Dezimalskala.
1.19 1.20 1.21 1.22 1.23 1.24 1.25 1.26 1.27 1.28 1.29 1.30 1.31
Jetzt kann man die Division auf zwei Dezimalstellen genau ausführen. Das Divisionsergebnis auf zwei Dezimalstellen genau ist 1.28 mit 4 als Rest. Das exakte Divisionsergebnis
liegt also zwischen 1.28 und 1.29.
Das kann man immer weiter fortsetzen außer es kommt einmal der Rest 0, womit die
Division endet. Als exaktes Divisionsergebnis erhält man eine Dezimalzahl. Eine Dezimalzahl besteht aus einem ganzzahligen Teil (mit Vorzeichen) und nach dem Dezimalpunkt
aus einer endlichen oder unendlichen Folge von Ziffern, den Dezimalstellen. Die Menge
aller Dezimalzahlen bezeichnen wir mit R und nennen sie die Menge der reellen Zahlen,
wobei wir später noch eine geringfügige Modifikation vornehmen.
Es gibt viele Dezimalzahlen, die nicht als Ergebnis einer Division einer ganzen Zahl
durch eine natürliche Zahl auftreten. Diejenigen, die auftreten, bilden die Menge Q der
rationalen Zahlen, also Q = { m
n : m ∈ Z, n ∈ N}. Bekanntlich sind das die Dezimalzahlen,
die nur endlich viele Dezimalstellen haben oder deren Dezimalstellen sich ab einer gewissen
Stelle periodisch wiederholen. In Q rechnet man üblicherweise mit Brüchen anstatt mit
Dezimalzahlen. Jedoch ist Q für die Analysis nicht geeignet, da die Intervallschachtelungseigenschaft nicht erfüllt ist. Wir brauchen daher die Menge R aller Dezimalzahlen.
Die Dezimalzahl bestimmt die Position auf der Zahlengeraden. Durch jede Dezimalstelle
wird die Position genauer festgelegt. Dadurch sind die Dezimalzahlen auch geordnet. Sind
x und y zwei Dezimalzahlen, dann gilt x < y, wenn x auf der Zahlengeraden links von y
liegt. Wir schreiben x ≤ y, wenn x < y oder x = y gilt. Die Ordnungsrelation ermöglicht
es auch, Intervalle zu definieren. Mit (a, b) bezeichnen wir die Menge aller Dezimalzahlen,
die auf der Zahlengeraden zwischen a und b liegen, das heißt (a, b) = {x : a < x < b}. Man
nennt (a, b) das offene Intervall mit Endpunkten a und b. Das abgeschlossene Intervall
enthält auch die beiden Endpunkte. Es wird mit [a, b] bezeichnet. Es gilt also [a, b] =
{x : a ≤ x ≤ b}. Analog werden die halboffenen Intervalle [a, b) = {x : a ≤ x < b} und
(a, b] = {x : a < x ≤ b} definiert.
Man muss bei der Darstellung der Zahlen durch Dezimalzahlen allerdings ein bisschen
aufpassen. Eine Dezimalzahl, bei der ab einer Stelle nur mehr 9 auftritt, fällt nämlich
auf der Zahlengeraden immer mit der Dezimalzahl zusammen, die man erhält, wenn man
die Neuner weglässt und die letzte Stelle vor den Neunern um 1 erhöht. Wir sehen uns
dieses Problem genauer an. Seien x und y zwei Dezimalzahlen. Wir suchen die erste
Dezimalstelle, an der sie sich unterscheiden. Sagen wir, es ist die zweite. Wenn sich die
Ziffern an dieser Stelle um mehr als 1 unterscheiden, dann bestimmen x und y verschiedene
Punkte auf der Zahlengeraden. Ist zum Beispiel x = 1.23 . . . und y = 1.25 . . . , dann liegt
x in [1.23, 1.24] und y in [1.25, 1.26]. Da diese beiden Intervalle keinen gemeinsamen Punkt
haben, müssen x und y verschieden sein. Unterscheiden sich die Ziffern an dieser Stelle
jedoch nur um 1, zum Beispiel x = 1.23 . . . und y = 1.24 . . . , dann liegt x in [1.23, 1.24] und
y in [1.24, 1.25]. Diese beiden Intervalle haben genau einen Punkt gemeinsam, nämlich 1.24.
Wenn also x und y denselben Punkt darstellen, dann kann das nur 1.24 sein. Durch y wird
der Punkt 1.24 nur dann dargestellt, wenn alle weiteren Dezimalstellen 0, das heißt nicht
Franz Hofbauer
3
vorhanden sind. Ist 9 die nächste Ziffer in x, also x = 1.239 . . . , dann liegt x in [1.239, 1.24].
Kommt dann noch eine 9, dann liegt x in [1.2399, 1.24]. Sind alle weiteren Ziffern von x
gleich 9, also x = 1.239999 . . . , dann liegt x in den Intervallen [1.2399 . . . 9, 1.24], sodass x
ebenfalls den Punkt 1.24 auf der Zahlengeraden darstellt. Ist eine dieser weiteren Ziffern
nicht 9, dann stellt x auch nicht den Punkt 1.24 dar.
Daraus sieht man, dass eine Dezimalzahl, bei der ab einer Stelle nur mehr 9 auftritt, auf
der Zahlengeraden immer mit der Dezimalzahl zusammenfällt, die man erhält, wenn man
die Neuner weglässt und die letzte Stelle vor den Neunern um 1 erhöht. Man sieht daraus
auch, dass das die einzige Möglichkeit für das Zusammenfallen von zwei verschiedenen
Dezimalzahlen auf der Zahlengeraden ist. Um zu erreichen, dass jeder Punkt auf der
Zahlengeraden genau einer Dezimalzahl entspricht, verbieten wir Dezimalzahlen, bei denen
ab einer Stelle nur mehr 9 auftritt. Sollte eine Zahl wie 1.239999 . . . vorkommen, zum
Beispiel als Ergebnis einer Rechnung, dann denken wir sie uns automatisch durch die
entsprechende endliche Dezimalzahl ersetzt. Für 1.239999 . . . ist das 1.24.
Die Menge der reellen Zahlen R ist die Menge aller Dezimalzahlen, wobei wir jetzt
Dezimalzahlen, bei denen ab einer Stelle nur mehr 9 auftritt, nicht mehr zulassen. So
entsprechen die reellen Zahlen in eindeutiger Weise den Punkten auf der Zahlengeraden.
Auf der Menge R müssen wir Addition und Multiplikation definieren. Dazu verwenden
wir gerundete Dezimalzahlen. Ist x eine Dezimalzahl, dann bezeichnen wir mit xn die auf
n Stellen gerundete Zahl x. Die gerundete Zahl xn ist eine Zahl mit n Dezimalstellen und
wird so definiert, dass x im Intervall (xn − 21 εn , xn + 12 εn ] liegt, wobei εn = 0.0 . . . 001 der
Abstand zweier Zahlen in der n-stelligen Dezimalskala ist.
Die Addition auf der n-stelligen Dezimalskala funktioniert genauso wie für ganze Zahlen.
Will man zwei Dezimalzahlen x und y addieren, dann addiert man die gerundeten Zahlen
xn und yn . Berücksichtigt man auch die Rundungsfehler, dann erhält man das Intervall
(xn + yn − εn , xn + yn + εn ], in dem die Summe von x und y liegen muss. Die ersten n
Stellen der Summe sind damit bestimmt, wobei jedoch die n-te Stelle auch um 1 größer
oder kleiner sein kann.
Beispiel: Sei x = 2.31745576 . . . und y = 1.22253522 . . . . Rundet man auf 5 Stellen, so
erhält man x5 = 2.31746 und y5 = 1.22254. Es folgt x5 + y5 = 3.54000. Die Summe von
x und y liegt daher in (3.53999, 3.54001].
Durch Vergrößern von n kann man immer mehr Stellen der Summe bestimmen, sodass
x + y dadurch eindeutig definiert wird. Auf dieselbe Art erhält man auch x − y. Das ist
ja die Addition einer Zahl mit geändertem Vorzeichen.
Man erkennt daraus auch sofort die Gültigkeit des Kommutativgesetzes und des Assoziativgesetzes für die Addition. Da gerundete Zahlen genauso addiert werden wie ganze
Zahlen, muss xn + yn = yn + xn für alle n gelten. Wäre x + y =
̸ y + x, dann könnte man
ein m finden, sodass sich x + y und y + x in der m-ten Dezimalstelle unterscheiden. Man
kann nun n so groß wählen, dass x + y und xn + yn über die m-te Dezimalstelle hinaus
übereinstimmen und dass dasselbe auch für y +x und yn +xn gilt. Wegen xn +yn = yn +xn
müssen dann auch x + y und y + x an der m-ten Dezimalstelle übereinstimmen. Damit ist
x + y = y + x gezeigt. Auf ähnliche Weise folgt das Assoziativgesetz.
Es genügt, das Produkt für positive reelle Zahlen einzuführen. Das Produkt von zwei
beliebigen reellen Zahlen x und y erhält man, indem man das Produkt ohne Vorzeichen
berechnet und mit einem positiven Vorzeichen versieht, wenn x und y gleiches Vorzeichen
haben, und mit einem negativen, wenn x und y verschiedenes Vorzeichen haben.
4
Reelle Zahlen und stetige Funktionen
Seien x und y also positive reelle Zahlen. Die gerundeten Zahlen xn und yn multipliziert
man unter Weglassen des Dezimalpunkts wie ganze Zahlen, wobei man im Produkt den
Dezimalpunkt wieder richtig setzen muss. Ist C eine Zahl größer als x+y+1
, dann liegt das
2
Produkt der Zahlen x und y im Intervall (xn yn − Cεn , xn yn + Cεn ]. Gibt man ein m vor,
dann kann man immer ein n finden, sodass die ersten m Dezimalstellen von xn yn bereits
die des Produkts von x und y sind. Auf diese Weise lassen sich beliebig viele Dezimalstellen
des Produkts bestimmen, sodass xy eindeutig definiert ist. Wie für die Addition folgen das
Kommutativgesetz und das Assoziativgesetz auch für die Multiplikation, da die gerundeten
Dezimalzahlen ja wie ganze Zahlen multipliziert werden und für diese daher Kommutativund Assoziativgesetz gelten. Ebenso erhält man das Distributivgesetz.
Beispiel: Sei x = 2.3714524 . . . und y = 0.02495735 . . . . Rundet man auf 4 Stellen,
so erhält man x4 = 2.3715 und y4 = 0.0250. Es folgt x4 y4 = 0.0592875. Man kann
C = 2 wählen und erhält, dass xy im Intervall [0.0590, 0.0595] liegt. Wir haben also 3
Dezimalstellen von xy bestimmt.
Um die Division einzuführen, genügt es x1 für x > 0 zu definieren. Wir erhalten xy
dann als y · x1 . Sei also x > 0. Ist x > 1, dann setzen wir k = 0. Ansonsten sei die
k-te Dezimalstelle die erste, an der x eine Ziffer ̸= 0 hat. Für n > k gilt dann, dass der
Kehrwert von x im Intervall [ x1n − 102k εn , x1n + 102k εn ] liegen muss. Somit liefert uns x1n
die ersten n−2k Dezimalstellen von x1 . Da man n beliebig groß wählen kann, ist x1 dadurch
eindeutig bestimmt. Man kann x1n als Division zweier ganzer Zahlen berechnen.
Beispiel: Sei x = 0.0273152 . . . , sodass wir x5 = 0.02732 erhalten. Es folgt k = 2 und
1
100000
1
2k
x5 = 36.60322 . . . , indem man den Bruch 2732 ausdividiert. Wegen 10 ε5 = 0.1 liegt x
im Intervall [36.5, 36.71].
Damit sind auf R alle vier Grundrechenarten eingeführt, wobei die üblichen Rechenregeln
gelten. Mit den Rechenoperationen + und · bildet R einen Körper.
2. Ordnung
Wir haben die Ordnungsrelation in R so definiert: Es gilt a < b, wenn a auf der
Zahlengerade links von b liegt, das heißt, wenn b − a positives Vorzeichen hat. Ebenso
gilt a ≤ b, wenn b − a positives Vorzeichen hat oder null ist. Wir schreiben das so auf
(A)
a≤b ⇔ 0≤b−a
und
a<b ⇔ 0<b−a
Da Summe und Produkt zweier positiver Zahlen wieder positiv sind, haben wir auch
(B) a ≥ 0, b ≥ 0 ⇒ a + b ≥ 0, ab ≥ 0
und
a > 0, b > 0 ⇒ a + b > 0, ab > 0
Aus diesen einfachen Eigenschaften lassen sich alle weitere Regeln für das Rechnen mit der
Ordnungsrelation herleiten. Wir fassen sie in den folgenden beiden Sätzen zusammen.
Satz 1.1: Für a ∈ R gilt a2 ≥ 0. Weiters gilt a < 0 ⇔ 0 < −a und a > 0 ⇒
1
a
> 0.
Beweis: Wir erhalten a < 0 ⇔ 0 < −a aus (A) mit b = 0. Ist a > 0 dann folgt a2 > 0,
indem man b = a in (B) setzt. Ist a < 0 dann folgt −a > 0 und (−a)2 > 0, das heißt
a2 > 0 mit Hilfe der beiden gerade gezeigten Aussagen. Somit gilt a2 > 0 für alle a ̸= 0.
Ist jetzt a > 0, dann gilt auch ( a1 )2 > 0, wie wir soeben gezeigt haben, und aus (B) folgt
dann a( a1 )2 > 0, das heißt a1 > 0, womit a > 0 ⇒ a1 > 0 gezeigt ist.
Ist a = 0, dann gilt a2 = 0, womit auch a2 ≥ 0 für alle a ∈ R gezeigt ist.
Franz Hofbauer
5
Satz 1.2: Seien a, b, c, d ∈ R. Dann gilt
(a) a ≤ b ⇔ a + c ≤ b + c
(b) a ≤ b ⇔ ac ≤ bc, wenn c > 0
(c) a ≤ b ⇔ ac ≥ bc, wenn c < 0
(d) a ≤ b, b ≤ c ⇒ a ≤ c
(e) a ≤ b, c ≤ d ⇒ a + c ≤ b + d
(f) 0 ≤ a ≤ b, 0 ≤ c ≤ d ⇒ ac ≤ bd
(g) a ≤ b ⇔ a2 ≤ b2 , wenn a ≥ 0 und b ≥ 0
Beweis: Es gilt a ≤ b ⇔ 0 ≤ b − a und a + c ≤ b + c ⇔ 0 ≤ b + c − (a + c) nach (A).
Wegen b − a = b + c − (a + c) ist damit bereits (a) gezeigt.
Wir zeigen (b). Aus a ≤ b folgt 0 ≤ b − a wegen (A) und daraus 0 ≤ bc − ac wegen
(B), da c > 0 vorausgesetzt wird, und daraus dann ac ≤ bc wieder wegen (A). Somit ist
a ≤ b ⇒ ac ≤ bc gezeigt. Wegen c > 0 gilt auch 1c > 0 nach Satz 1.1. Aus der soeben
gezeigten Implikation folgt dann ac ≤ bc ⇒ ac 1c ≤ bc 1c , das heißt ac ≤ bc ⇒ a ≤ b.
Damit sind beide Implikationen in (b) gezeigt.
Wir erhalten (c) aus (b). Es gilt c < 0 und daher 0 < −c wegen Satz 1.1. Dann gilt
a ≤ b ⇔ a(−c) ≤ b(−c) nach (b) und a(−c) ≤ b(−c) ⇔ a(−c) + d ≤ b(−c) + d nach (a).
Setzt man das zusammen und d = ac + bc, dann hat man a ≤ b ⇔ bc ≤ ac.
Es gilt a ≤ b, b ≤ c ⇒ 0 ≤ b − a, 0 ≤ c − b ⇒ 0 ≤ b − a + c − b = c − a ⇒ a ≤ c, wobei
wir zuerst (A), dann (B) und schließlich nochmals (A) anwenden. Damit ist (d) gezeigt.
Aus (a) und (d) folgt a ≤ b, c ≤ d ⇒ a + c ≤ b + c, c + b ≤ d + b ⇒ a + c ≤ d + b. Das
ist (e).
Aus (b) und (d) folgt 0 ≤ a ≤ b, 0 ≤ c ≤ d ⇒ ac ≤ bc, cb ≤ db ⇒ ac ≤ db. Das ist (f).
Für c = 0 oder b = 0 ist die zweite Implikation ja trivial.
Ist a = b = 0, dann gilt (g). Gilt a > 0 und b ≥ 0, dann folgt b + a ≥ 0 + a > 0. Gilt
b > 0 und a ≥ 0, dann folgt a + b ≥ 0 + b > 0, beides aus (a). Sei c = b + a. Wegen c > 0
erhalten wir dann a ≤ b ⇔ 0 ≤ b − a ⇔ 0 · c ≤ (b − a)c ⇔ 0 ≤ b2 − a2 ⇔ a2 ≤ b2 mit
Hilfe von (a) und (b). Damit ist (g) gezeigt.
In Satz 1.2 sind einige Äquivalenzumformungen von Ungleichungen enthalten, die man
verwendet, um Ungleichungen zu beweisen oder die Lösungsmenge einer Ungleichung zu
suchen. Wir geben ein Beispiel.
Beispiel: Wir zeigen, dass das harmonische Mittel kleiner oder gleich dem arithmetischen
2xy
Mittel ist, also x+y
≤ x+y
2 für x, y > 0 gilt. Wir versuchen durch Äquivalenzumformungen
eine Ungleichung zu erhalten, deren Richtigkeit klar ist:
2xy
x+y
≤
2xy ≤
| · (x + y)
x+y
2
2
x +2xy+y
2
2
2
4xy ≤ x + 2xy + y 2
|·2
| − 4xy
0 ≤ x2 − 2xy + y 2
0 ≤ (x − y)2
Diese letzte Ungleichung ist richtig, da quadrierte Zahlen nach Satz 1.1 immer ≥ 0 sind.
Da die erste Ungleichung dazu äquivalent ist, haben wir diese bewiesen.
6
Reelle Zahlen und stetige Funktionen
Der Betrag |x| einer reellen Zahl x ist die Zahl ohne Vorzeichen, das heißt |x| = x, wenn
x ≥ 0 ist, und |x| = −x, wenn x < 0 ist. Es gilt | − x| = |x|. Der Abstand zweier Zahlen x
und y auf der Zahlengeraden ist durch |x − y| gegeben. Wir werden ihn bei der Definition
des Grenzwerts verwenden. Der folgende Satz gibt die Eigenschaften des Betrages an.
Satz 1.3: Seien x und y in R. Dann gilt
(a) |x + y| ≤ |x| + |y| (Dreiecksungleichung)
(b) |x| · |y| = |xy|
Beweis: Es gilt x ≤ |x| und −x ≤ |x| für alle x ∈ R, da x = |x| und −x ≤ 0 ≤ |x| im Fall
x ≥ 0 gilt, und x ≤ 0 ≤ |x| und −x = |x| im Fall x < 0.
Seien jetzt x und y in R. Dann gilt x ≤ |x| und y ≤ |y|, wie soeben gezeigt wurde, also
auch x + y ≤ |x| + |y| nach Satz 1.2 (e). Ebenso gilt −x ≤ |x| und −y ≤ |y|, und damit
auch −x − y ≤ |x| + |y| wieder wegen Satz 1.2 (e). Da |x + y| entweder gleich x + y oder
gleich −x − y ist, ist |x + y| ≤ |x| + |y|, also (a) gezeigt.
Da das Produkt xy ohne Berücksichtigung des Vorzeichens berechnet und dieses erst
danach gesetzt wird, ist |xy| das Produkt der vorzeichenlosen Zahlen, also |x| · |y|.
Wir führen noch die Begriffe Maximum und Minimum ein. Unter dem Maximum von
endlich vielen Zahlen x1 , x2 , . . . , xk versteht man die größte dieser Zahlen. Man bezeichnet
sie mit max(x1 , x2 , . . . , xk ). Unter dem Minimum von endlich vielen Zahlen x1 , x2 , . . . , xk
versteht man die kleinste dieser Zahlen. Man bezeichnet sie mit min(x1 , x2 , . . . , xk ).
3. Intervallschachtelungseigenschaft
Nachdem wir die Rechenoperationen und die Ordnungsrelation behandelt haben, kommen wir jetzt zur sogenannten Intervallschachtelungseigenschaft der reellen Zahlen.
Als Intervallschachtelung bezeichnet man eine Folge von abgeschlossenen Intervallen,
sodass das nächstfolgende Intervall immer im vorhergehenden enthalten ist. Wir haben
also Intervalle [an , bn ] für n ≥ 1, für die [a1 , b1 ] ⊇ [a2 , b2 ] ⊇ [a3 , b3 ] ⊇ [a4 , b4 ] ⊇ . . . gilt. Die
Anordnung der Endpunkte ist durch a1 ≤ a2 ≤ a3 ≤ a4 ≤ · · · < · · · ≤ b4 ≤ b3 ≤ b2 ≤ b1
gegeben. Wir nehmen an, dass alle Dezimalzahlen unendlich viele Dezimalstellen haben,
indem wir bei Dezimalzahlen mit endlich vielen Dezimalstellen mit Nullen fortsetzen.
Satz 1.4 (Intervallschachtelungseigenschaft) Sei [an , bn ] für n ≥ 1 eine Folge von Intervallen mit [an+1 , bn+1 ] ⊆ [an , bn ]. Dann gibt es ein x ∈ R mit x ∈ [an , bn ] für alle n.
Beweis: Wir nehmen zuerst an, dass alle Intervalle Teilmengen von [0, ∞) sind.
Sei gn der ganzzahlige Teil der Dezimalzahl an . Wegen a1 ≤ a2 ≤ a3 ≤ · · · ≤ b1 erhalten
wir g1 ≤ g2 ≤ g3 ≤ · · · ≤ b1 . Da die Zahlen gn aber ganze Zahlen sind, ist die jeweils
nächste Zahl entweder gleich der vorherigen Zahl oder um mindestens eins größer als die
vorherige Zahl. Daher kann es nur endlich oft vorkommen, dass die nächste Zahl größer
als die vorherige ist, sonst würden diese Zahlen ja irgendwann b1 überschreiten. Es müssen
ein g ∈ Z und ein n0 existieren, sodass gn = g für alle n ≥ n0 gilt.
Jetzt zu den Dezimalstellen. Für k ≥ 1 sei dn,k die k-te Dezimalstelle von an . Wir beginnen
mit k = 1. Es gilt an0 ≤ an0 +1 ≤ an0 +2 ≤ . . . und der ganzzahlige Teil dieser Zahlen ist
derselbe. Für die erste Dezimalstelle gilt daher dn0 ,1 ≤ dn0 +1,1 ≤ dn0 +2,1 ≤ . . . . Weiters
liegen die Ziffern dn,1 für n ≥ n0 in der Menge {0, 1, . . . , 9}, sodass ab einer gewissen Stelle
dieselbe Ziffer auftreten muss. Es gibt somit eine Ziffer d1 und ein n1 ≥ n0 mit dn,1 = d1
für alle n ≥ n1 .
Franz Hofbauer
7
So behandeln wir auch die Dezimalstellen dn,k mit k ≥ 2. Da der ganzzahlige Teil und die
erste Dezimalstelle für n ≥ n1 unverändert bleiben, gilt dn1 ,2 ≤ dn1 +1,2 ≤ dn1 +2,2 ≤ . . . ,
und man findet wie oben ein n2 ≥ n1 und eine Ziffer d2 mit dn,2 = d2 für alle n ≥ n2 . Im
k-ten Schritt findet man ein nk ≥ nk−1 und eine Ziffer dk mit dn,k = dk für alle n ≥ nk .
Sei x = g.d1 d2 d3 . . . die aus den erhaltenen Ziffern gebildete Dezimalzahl. Wir geben ein
Beispiel für diese Konstruktion.
a1 = 2 . 7 4 2 4 5 4 8 5 7 4 8 . . .
a2 = 2 . 9 5 3 8 5 2 2 1 4 7 4 . . .
a3 = 3 . 2 9 3 5 8 2 0 3 1 9 5 . . .
a4 = 3 . 5 2 4 6 2 8 7 0 2 3 1 . . .
a5 = 3 . 7 4 2 6 9 4 0 2 4 0 7 . . .
a6 = 3 . 7 6 0 7 8 4 9 5 2 2 0 . . .
a7 = 3 . 7 6 0 9 6 3 2 1 7 9 5 . . .
a8 = 3 . 7 6 1 2 6 3 2 9 1 4 9 . . .
a9 = 3 . 7 6 1 3 8 4 7 9 3 3 1 . . .
a10 = 3 . 7 6 1 4 3 1 7 6 1 2 6 . . .
a11 = 3 . 7 6 1 5 0 4 1 4 7 1 4 . . .
a12 = 3 . 7 6 1 5 2 7 6 4 9 8 7 . . .
a13 = 3 . 7 6 1 5 4 8 7 4 2 7 4 . . .
a14 = 3 . 7 6 1 5 4 9 3 2 1 4 9 . . .
a15 = 3 . 7 6 1 5 4 9 5 1 7 4 8 . . .
a16 = 3 . 7 6 1 5 4 9 7 0 2 2 0 . . .
a17 = 3 . 7 6 1 5 4 9 7 3 8 0 7 . . .
a18 = 3 . 7 6 1 5 4 9 7 4 2 3 1 . . .
a19 = 3 . 7 6 1 5 4 9 7 6 3 9 5 . . .
a20 = 3 . 7 6 1 5 4 9 7 6 4 7 4 . . .
a21 = 3 . 7 6 1 5 4 9 7 6 5 4 8 . . .
↓
↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓
x = 3 . 7 6 1 5 4 9 7 6 ... ... ...
Es bleibt zu zeigen, dass die so gewonnene reelle Zahl x in allen Intervallen [an , bn ] liegt.
Wir zeigen zuerst an ≤ x für alle n. Angenommen, es gibt ein k mit ak > x. Da mit wachsendem m die Dezimalzahlen am ein immer größeres Anfangsstück mit der Dezimalzahl x
gemeinsam haben, findet man ein m > k, sodass am mehr Dezimalstellen mit x gemeinsam
hat als ak und somit näher bei x liegt als ak . Daraus folgt ak > am , ein Widerspruch, da
ja a1 ≤ a2 ≤ a3 ≤ · · · ≤ ak ≤ · · · ≤ am ≤ . . . gilt. Damit ist an ≤ x für alle n gezeigt.
Ebenso gilt bn ≥ x für alle n. Angenommen, es gibt ein k mit bk < x. Da mit wachsendem m die Dezimalzahlen am ein immer größeres Anfangsstück mit der Dezimalzahl x
gemeinsam haben, findet man wie oben ein m, sodass am näher bei x liegt als bk . Daraus
folgt bk < am , ein Widerspruch, da die linken Endpunkte aller Intervalle kleiner sind als
die rechten Endpunkte aller Intervalle. Damit ist bn ≥ x für alle n gezeigt.
8
Reelle Zahlen und stetige Funktionen
Was tun wir, wenn nicht alle Intervalle Teilmengen von [0, ∞) sind? Gilt an ≤ 0 und
bn ≥ 0 für alle n, dann liegt 0 in allen Intervallen. Ansonsten finden wir ein u ≥ 1, sodass
[au , bu ] Teilmenge von [0, ∞) oder Teilmenge von (−∞, 0] ist. Im ersten Fall untersuchen
wir dann die Folge [an , bn ] für n ≥ u, die in [0, ∞) liegt. Gilt x ∈ [an , bn ] für alle n ≥ u,
dann auch x ∈ [an , bn ] für alle n ≥ 1. Im zweiten Fall untersuchen wir die Folge [−bn , −an ]
für n ≥ u, die ebenfalls in [0, ∞) liegt. Ist y eine Zahl, die in [−bn , −an ] für alle n ≥ u
liegt, dann liegt x = −y in den ursprünglichen Intervallen [an , bn ] für alle n ≥ 1.
Dieser Satz besagt, dass es für jede Folge von abgeschlossenen Intervallen, die ineinandergeschachtelt sind, mindestens eine Zahl gibt, die in allen Intervallen enthalten ist. Wir
können auch eine Aussage über die Eindeutigkeit machen. Sei ln = bn − an die Länge des
n-ten Intervalls. Es gilt l1 ≥ l2 ≥ l3 ≥ . . . , da die Intervalle ineinandergeschachtelt sind.
Gibt es nun zwei verschiedene Zahlen x und y, die in allen Intervallen enthalten sind, und
ist ε = |x − y| > 0 der Abstand der beiden Zahlen, dann gilt ln ≥ ε für alle n ≥ 0. Wenn
also keine Zahl ε > 0 existiert, sodass ln ≥ ε für alle n gilt, dann gibt es genau eine Zahl,
die in allen Intervallen liegt.
Oft kommt es vor, dass ln ≤ 21 ln−1 für alle n gilt. In diesem Fall gibt es genau eine Zahl,
die in allen Intervallen liegt. Würde ein ε > 0 existieren, sodass ε ≤ ln für alle n gilt, dann
würde ε ≤ 2l1n und daraus 2n ≤ lε1 für alle n folgen. Ein Blick auf die Zahlengerade zeigt
aber, dass die Zahlen 1, 2, 4, 8, . . . jede reelle Zahl überschreiten, sodass ein n mit 2n > lε1
existiert. Daher gibt es kein ε > 0, sodass ε ≤ ln für alle n gilt.
Als Anwendung der Intervallschachtelung zeigen wir, dass man aus einer positiven reellen
Zahl die Wurzel ziehen kann und dadurch wieder eine reelle Zahl enthält.
Beispiel: Sei x > 0. Wir bilden Intervalle [an , bn ] mit an bn = x.
Wir wählen a1 und b1 beliebig, sodass 0 < a1 < b1 und a1 b1 = x gelten, zum Beispiel
a1 = 1 und b1 = x für x > 1 und a1 = x und b1 = 1 für x < 1. Ist [an , bn ] mit an < bn
und an bn = x schon bestimmt, dann setzen wir
bn+1 = 21 (an + bn ) und an+1 =
x
bn+1
sodass wieder an+1 bn+1 = x gilt. Da bn+1 der Mittelpunkt des Intervalls [an , bn ] ist,
x
erhalten wir bn+1 < bn und an+1 = bn+1
> bxn = an . Weiters gilt
bn+1 − an+1 =
b2n+1 −x
bn+1
=
(an +bn )2 −4an bn
4bn+1
=
1
4bn+1 (bn
− an )2
Wegen an < bn folgt daraus auch an+1 < bn+1 . Somit ist [an+1 , bn+1 ] ein Intervall, das
in [an , bn ] enthalten ist. Da bn+1 der Mittelpunkt von [an , bn ] ist, ist das nächste Intervall
höchstens halb so lang wie das vorhergehende. Es gibt somit genau eine reelle Zahl y,
die in allen Intervallen enthalten ist. Es gilt a2n ≤ y 2 ≤ b2n für alle n. Wegen an bn = x
und a2n ≤ an bn ≤ b2n gilt auch a2n ≤ x ≤ b2n für alle n. Wegen b2n − a2n ≤ 2b1 (bn − an )
existiert kein ε > 0, sodass b2n − a2n ≥ ε für alle n gilt. Daher gibt es nur eine Zahl, die
in allen Intervallen [a2n , b2n ] liegt, sodass y 2 = x folgt. Somit ist y die Wurzel aus x. Für
x = 2 sind [1, 2] ⊇ [1.3333, 1.5000] ⊇ [1.4118, 1.4167] ⊇ [1.414211, 1.414216] ⊇ . . . die
ersten Intervalle. Man sieht, dass sie sehr schnell kleiner werden.
Als weiteres Beispiel bestimmen wir die Zahl π, die Fläche des Kreises mit Radius 1. Wir
schachteln die Kreisfläche durch Flächen von regelmäßigen n-Ecken ein. Diese Methode
geht auf Archimedes zurück. Man kann damit π auf eine bestimmte Anzahl von Stellen
berechnen. (Dabei bezeichnet U V die Strecke und |U V | den Abstand zwischen U und V .)
Franz Hofbauer
9
Beispiel: Wir berechnen die Fläche des KreiM
ses mit Radius r = 1 durch Approximation
mit regelmäßigen Vielecken. Seien s und t
die halben Seitenlängen des ein- und umgeschriebenen regelmäßigen k-Ecks. Seien x
und y die halben Seitenlängen des ein- und
umgeschriebenen regelmäßigen 2k-Ecks. In
der nebenstehenden Zeichnung sind P Q und
AB Seiten des ein- und umgeschriebenen res
s
R
Q
gelmäßigen k-Ecks, P C und CQ sind Seiten
P
2x
2x
des eingeschriebenen regelmäßigen 2k-Ecks
y
und CD und DQ sind halbe Seiten des umt
A
C
D t
B
geschriebenen regelmäßigen 2k-Ecks. Aus
der Ähnlichkeit der beiden rechtwinkeligen
Dreiecke BQD und BCM folgt |DQ| : |DB| = |M C| : |M B|. Aus dem Strahlensatz folgt
|M Q| : |M B| = |RQ| : |CB|. Wegen |M C| = r = |M Q| folgt |DQ| : |DB| = |RQ| : |CB|.
y
ts
= st . Daraus folgt y = t+s
. Aus der
Setzt man die Seitenlängen ein, so ergibt sich t−y
y
Ähnlichkeit der beiden gleichschenkeligen Dreiecke P CQ und CDQ folgt 2x
2s = 2x , das
√ sy
heißt x =
2 . Sei Fm die Fläche des umgeschriebenen m-Ecks und fm die Fläche des
eingeschriebenen m-Ecks. Ist u die halbe Seite des umgeschriebenen m-Ecks, dann gilt
Fm = mur = mu, also Fk = kt und F2k = 2ky. Ist v die halbe Seite des eingeschriebenen
m-Ecks, dann ist r die Grundlinie und v die Höhe in den Dreiecken, aus denen das regelmäßigen 2m-Eck besteht. Daher gilt f2m = 2m 21 rv = mv, also f2k = ks und f4k = 2kx.
Wir erhalten die Rekursionsformeln
√
√
2Fk f2k
F2k = 2ky = 2kts
=
und
f
=
2kx
=
k
2sy
=
f2k F2k
4k
t+s
Fk +f2k
Für n ≥ 1 sei an = f2n+1 und bn = F2n+1 . Die Intervalle [an , bn ] enthalten dann π, die
Fläche des Kreises mit Radius 1. Da das regelmäßige eingeschriebene 2n+1 -Eck im regelmäßigen eingeschriebenen 2n+2 -Eck enthalten ist, haben wir an < an+1 . Da das regelmäßige
umgeschriebene 2n+1 -Eck das regelmäßige umgeschriebene 2n+2 -Eck enthält, haben wir
bn > bn+1 . Daher bilden die Intervalle [an , bn ] für n ≥ 1 eine Intervallschachtelung. Die
Fläche des eingeschriebenen regelmäßigen Vierecks ist 2, also a1 = 2. Die Fläche des
umgeschriebenen regelmäßigen Vierecks ist 4, also b1 = 4. Mit Hilfe der obigen Rekursionsformeln kann man weitere Intervalle berechnen
√
n an+1
an+1 = an bn und bn+1 = b2b
n +an+1
Da das harmonische Mittel kleiner gleich dem arthmetischen Mittel ist, ist [an+1 , bn+1 ] in
der linken Hälfte des Intervalls [an+1 , bn ] enthalten. Daher ist [an+1 , bn+1 ] höchstens halb
so lang wie [an , bn ]. Es gibt eine eindeutig bestimmte reelle Zahl, die in allen Intervallen
liegt. Das muss die Fläche des Kreises mit Radius 1 sein.
Die ersten Intervalle sind [2, 4] ⊇ [2.8284, 3.3137] ⊇ [3.0615, 3.1826] ⊇ [3.1214, 3.1517] ⊇
[3.1365, 3.1441] ⊇ [3.1403, 3.1422] ⊇ [3.1413, 3.1418] ⊇ [3.1415, 3.1416] ⊇ . . . , sodass man
neun Intervalle benötigt, um π auf vier Dezimalstellen genau zu erhalten.
Genauso kann man einen Kreis mit Radius r ̸= 1 behandeln. Die Überlegungen sind
genau dieselben. Man erhält dieselbe Intervallschachtelung, nur dass die Endpunkte aller
Intervalle mit r2 multipliziert sind. Somit gibt es wieder genau eine reelle Zahl, die in allen
Intervallen liegt, und diese Zahl ist r2 π. Das ist die Fläche des Kreises mit Radius r.
10
Reelle Zahlen und stetige Funktionen
4. Folgen und deren Grenzwerte
Eine zentrale Rolle in der Analysis spielen Folgen und deren Grenzwerte. Eine Folge
von reellen Zahlen kann man sich als zeitlichen Ablauf vorstellen. Zum Zeitpunkt 0 ist
man im Punkt a0 , zum Zeitpunkt 1 ist man im Punkt a1 , zum Zeitpunkt 2 ist man im
Punkt a2 , und immer so weiter. Es wird also die Folge a0 , a1 , a2 , . . . von reellen Zahlen
durchlaufen. Man schreibt eine Folge auch in der Form (an )n≥0 auf. Oft beginnt man
die Zeitpunkte mit 1 zu zählen, hat also die Folge (an )n≥1 . Die reellen Zahlen an heißen
Glieder der Folge.
Folgen können verschiedenes Verhalten zeigen. Die durch an = n für n ≥ 1 definierte
Folge durchläuft die natürlichen Zahlen. Sie wird also nach ∞ entschwinden. Die durch
an = n1 für n ≥ 1 definierte Folge hingegen nähert sich mit fortschreitendem n immer
mehr der Zahl 0. Es ist naheliegend, die Zahl a = 0 als Grenzwert der Folge (an )n≥1 zu
bezeichnen. Die Folge an = (−1)n n12 für n ≥ 1 zeigt alternierendes Verhalten. Zu geraden
Zeitpunkten n ist an rechts von 0. Zu ungeraden Zeitpunkten n ist an links von 0. Mit
fortschreitendem n nähert sich auch diese Folge immer mehr der Zahl 0. Daher hat sie
ebenfalls den Grenzwert a = 0.
Um den Begriff des Grenzwertes zu definieren, muss man zuerst Umgebungen einer
Zahl a ∈ R einführen. Als ε-Umgebung der Zahl a bezeichnet man das offene Intervall
(a − ε, a + ε), wobei ε > 0 ist. Ist a ∈ R und existiert zu jeder ε-Umgebung von a, wie klein
ε auch sein mag, ein Zeitpunkt, ab dem die Glieder der Folge in dieser Umgebung liegen,
dann wird man a als Grenzwert der Folge bezeichnen. In eine mathematische Sprahe
übersetzt, ergibt das folgende Definition.
Definition: Man nennt a ∈ R Grenzwert der Folge (an )n≥0 , wenn für jedes ε > 0 ein n0
existiert, sodass |an − a| < ε für alle n ≥ n0 gilt. Man schreibt limn→∞ an = a.
Folgen, die einen Grenzwert haben, heißen konvergent. Alle anderen Folgen heißen
divergent. Außerdem ist der Grenzwert einer Folge (an )n≥0 , falls er existiert, eindeutig
bestimmt. Sind a und b zwei verschiedene Zahlen in R, dann findet man ein ε > 0, zum
Beispiel ε = |a−b|
2 , sodass die offenen Intervalle (a − ε, a + ε) und (b − ε, b + ε) keinen
gemeinsamen Punkt haben. Ist a Grenzwert, dann gibt es ein n0 , sodass an ∈ (a − ε, a + ε)
für alle n ≥ n0 gilt. Dann gilt aber an ∈
/ (b − ε, b + ε) für alle n ≥ n0 und b kann nicht
Grenzwert sein.
Beispiele: Sei an = n1 für n ≥ 1. Wir zeigen, dass limn→∞ an = 0 gilt, indem wir die
Definition des Grenzwertes nachprüfen. Dazu sei ε > 0 vorgegeben. Wir wählen n0 > 1ε .
Für n ≥ n0 gilt dann |an − 0| = n1 ≤ n10 < ε.
Ist bn =
√1
n
für n ≥ 1, dann folgt limn→∞ bn = 0 wie oben, indem wir n0 >
1
ε2
wählen.
Die Folge cn = (−1)n für n ≥ 0 ist nicht konvergent. Angenommen sie hätte den Grenzwert
a. Für ε = 21 müsste es dann ein n0 geben mit an ∈ (a − 12 , a + 21 ) für n ≥ n0 . Daraus
würde |an0 − an0 +1 | < 1 folgen, ein Widerspruch dazu, dass eine der Zahlen an0 und an0 +1
gleich 1 und die andere gleich −1 ist. Somit kann diese Folge keinen Grenzwert haben.
Um Rechenregeln für Grenzwerte herzuleiten, benötigen wir folgenden Satz.
Satz 1.5: Sei (an )n≥0 eine Folge, für die der Grenzwert limn→∞ an = a existiert. Dann
gibt es ein C > 0, sodass |an | ≤ C für alle n ≥ 0 gilt. Ist a ̸= 0, dann existiert ein c > 0
und ein m0 , sodass |an | ≥ c für alle n ≥ m0 gilt.
Franz Hofbauer
11
Beweis: Sei ε > 0 vorgegeben. Aus der Definition des Grenzwerts erhalten wir, dass ein
n0 existiert mit |an − a| < ε für alle n ≥ n0 . Mit Hilfe der Dreiecksungleichung folgt dann
|an | = |an − a + a| ≤ |an − a| + |a| < ε + |a| für alle n ≥ n0 . Wählt man für C die größte
der Zahlen ε + |a|, |a0 |, |a1 |, . . . , |an0 −1 |, dann ist |an | ≤ C für alle n erfüllt.
Für die zweite Aussage wird a ̸= 0 vorausgesetzt. Wir wählen ε = |a|
2 > 0. Es existiert
|a|
ein m0 , sodass |an − a| < ε für alle n ≥ m0 gilt. Sei c = 2 > 0. Mit Hilfe der
Dreiecksungleichung erhalten wir |a| = |a − an + an | ≤ |a − an | + |an |. Für n ≥ m0 ergibt
sich |an | ≥ |a| − |a − an | > |a| − ε = |a| − |a|
2 = c, womit die zweite Aussage gezeigt ist.
Satz 1.6 (Rechenregeln für Grenzwerte) Seien (an )n≥0 und (bn )n≥0 Folgen, für die die
Grenzwerte limn→∞ an = a und limn→∞ bn = b existieren.
(a) Ist m0 ≥ 0 und an ≤ bn für n ≥ m0 , dann gilt a ≤ b.
(b) Es gilt limn→∞ (an + bn ) = a + b.
(c) Es gilt limn→∞ (an bn ) = ab.
(d) Ist b ̸= 0 und bn ̸= 0 für alle n, dann gilt limn→∞ abnn = ab .
Beweis: Um (a) zu zeigen, nehmen wir an, dass a > b gilt. Gelingt es uns, daraus einen
Widerspruch zur Voraussetzung an ≤ bn für n ≥ m0 herzuleiten, dann kann a > b nicht
gelten und a ≤ b ist bewiesen. Wir nehmen also an, dass a > b gilt. Sei ε = a−b
2 . Wegen
limn→∞ an = a und limn→∞ bn = b finden wir n0 und n1 , sodass a − ε < an < a + ε für
alle n ≥ n0 und b − ε < bn < b + ε für alle n ≥ n1 gilt. Für n ≥ max(n0 , n1 ) erhalten
wir an > a − ε = b + ε > bn . Das widerspricht aber der Voraussetzung, dass an ≤ bn für
n ≥ m0 gilt. Damit ist (a) gezeigt.
Um (b) zu zeigen, prüfen wir die Definition des Grenzwerts nach. Sei ε > 0 vorgegeben.
Wir müssen ein n0 finden, sodass |(an + bn ) − (a + b)| < ε für alle n ≥ n0 gilt. Wegen
limn→∞ an = a und limn→∞ bn = b finden wir n1 und n2 , sodass |an − a| < 2ε für alle
n ≥ n1 und |bn − b| < 2ε für alle n ≥ n2 gilt. Sei n0 = max(n1 , n2 ). Für n ≥ n0 erhalten
wir mit Hilfe der Dreiecksungleichung |(an + bn ) − (a + b)| ≤ |an − a| + |bn − b| < 2ε + 2ε = ε.
Damit ist die Grenzwertdefinition nachgeprüft und (b) gezeigt.
Zum Beweis von (c) verwenden wir Satz 1.5. Es existiert ein C > 0, sodass |bn | ≤ C für
alle n gilt. Sei ε > 0 vorgegeben. Wegen limn→∞ an = a und limn→∞ bn = b finden wir
ε
ε
n1 und n2 , sodass |an − a| < C+|a|
für alle n ≥ n1 und |bn − b| < C+|a|
für alle n ≥ n2
gilt. Sei n0 = max(n1 , n2 ). Für n ≥ n0 erhalten wir mit Hilfe der Dreiecksungleichung
|an bn − ab| = |an bn − abn + abn − ab| ≤ |(an − a)bn | + |a(bn − b)|
≤ |an − a|C + |a||bn − b| <
ε
C+|a| C
ε
+ |a| C+|a|
=ε
womit (c) gezeigt ist.
Um (d) zu zeigen, wählen wir zuerst ein m0 und ein c > 0, sodass |bn | ≥ c für alle n ≥ m0
gilt, was wegen Satz 1.5 möglich ist. Sei ε > 0 vorgegeben. Wegen limn→∞ an = a
ε|b|c
für alle n ≥ n1 und
und limn→∞ bn = b finden wir n1 und n2 , sodass |an − a| < |a|+|b|
ε|b|c
|bn − b| < |a|+|b|
für alle n ≥ n2 gilt. Sei n0 = max(m0 , n1 , n2 ). Für n ≥ n0 erhalten wir
mit Hilfe der Dreiecksungleichung
| abnn − ab | = | abnn −
≤
1
c
a
bn
+
a
bn
· |an − a| +
− ab | ≤ | abnn −
|a|
|b|c
a
bn |
· |bn − b| <
womit wir auch (d) gezeigt haben.
1
c
·
+ | ban − ab | =
ε|b|c
|a|+|b|
+
|a|
|b|c
1
|bn |
·
· |an − a| +
ε|b|c
|a|+|b|
=ε
|a|
|b||bn |
· |b − bn |
12
Reelle Zahlen und stetige Funktionen
Auf einen Spezialfall dieser Rechenregeln sei noch hingewiesen. Ist die Folge (bn )n≥0
konstant, also bn = d für alle n, dann gilt natürlich auch limn→∞ bn = d, wie man leicht aus
der Definition des Grenzwertes erkennt, und wir erhalten limn→∞ (d+an ) = d+limn→∞ an
und limn→∞ dan = d limn→∞ an aus Satz 1.6.
Mit diesen Rechenregeln ist es möglich, das Berechnen von Grenzwerten auf einfache
Fälle, wie limn→∞ n1 = 0 zurückzuführen.
−5n
Beispiel: Wir berechnen den Grenzwert der Folge an = 2n
3n2 +4 für n → ∞. Dazu
dividieren wir Zähler und Nenner durch die höchste vorkommende Potenz, das ist in diesem
2− 5
Fall n2 , und erhalten an = 3+ n4 . Wegen Satz 1.6 (d) können wir den Grenzwert von
2
n2
Zähler und Nenner getrennt berechnen. Durch Anwenden von Satz 1.6 (b) erhalten wir
limn→∞ (2 − n5 ) = 2 − 5 limn→∞ n1 = 2 und limn→∞ 3 + n42 = 3 + 4 limn→∞ n1 limn→∞ n1 = 3
folgt wegen Satz 1.6 (b) und (c). Damit haben wir limn→∞ an = 23 berechnet.
Der folgende Satz wird ebenfalls häufig zum Berechnen eines Grenzwerts verwendet.
Satz 1.7: Existieren die Grenzwerte limn→∞ an und limn→∞ bn und sind beide gleich a
und gibt es außerdem ein m0 mit an ≤ xn ≤ bn für alle n ≥ m0 , dann existiert auch
limn→∞ xn und ist ebenfalls gleich a.
Beweis: Sei ε > 0 vorgegeben. Wir finden n1 mit |an − a| < ε für alle n ≥ n1 und n2
mit |bn − a| < ε für alle n ≥ n2 . Sei n0 = max(m0 , n1 , n2 ). Für n ≥ n0 gilt an ≤ xn ≤ bn
und an und bn liegen in der ε-Umgebung von a. Da dann auch jeder Punkt, der zwischen
an und bn liegt, in der ε-Umgebung von a liegen muss, erhalten wir |xn − a| < ε für alle
n ≥ n0 , womit limn→∞ xn = a gezeigt ist.
√
√
√
Beispiel: Sei xn = n + 2 n − n. Wir berechnen limn→∞ xn mittels Satz 1.7. Es gilt
√
√
√
√
1 − 2√1 n ≤ xn ≤ 1 ⇔ n + 1 − 2√1 n ≤ n + 2 n ≤ n + 1
√
√
√
1
⇔ n + 2 n − √1n + 4n
≤n+2 n≤n+2 n+1
Die letzte Aussage ist leicht als richtig erkennbar, daher haben wir an ≤ xn ≤ bn mit
an = 1 − 2√1 n und bn = 1 für n ≥ 1 gezeigt. Wegen limn→∞ √1n = 0 folgt limn→∞ an = 1
aus Satz 1.6. Klarerweise gilt limn→∞ bn = 1. Aus Satz 1.7 folgt daher limn→∞ xn = 1.
Es folgt ein weiterer Satz, der ebenfalls die Existenz eines Grenzwerts zum Inhalt hat.
Dazu sind einige Definitionen notwendig. Eine Folge (an )n≥0 heißt monoton wachsend,
wenn an+1 ≥ an für alle n gilt. Eine Folge (an )n≥0 heißt monoton fallend, wenn an+1 ≤ an
für alle n gilt. Eine Folge (an )n≥0 heißt nach oben beschränkt mit oberer Schranke c, wenn
an ≤ c für alle n gilt. Eine Folge (an )n≥0 heißt nach unten beschränkt mit unterer Schranke
d, wenn an ≥ d für alle n gilt. Der erste Teil von Satz 1.5 besagt, dass eine konvergente
Folge sowohl nach oben als auch nach unten beschränkt ist.
Satz 1.8 (Satz über die Konvergenz monotoner Folgen) Eine monoton wachsende, nach
oben beschränkte Folge hat einen Grenzwert. Eine monoton fallende, nach unten beschränkte Folge hat einen Grenzwert.
Der Beweis dieses Satzes verwendet die Intervallschachtelungseigenschaft der reellen
Zahlen. Beweise, die die Intervallschachtelungseigenschaft verwenden, sind in einem späteren
Kapitel zusammengestellt. Dort findet man unter anderem auch den Beweis von Satz 1.8.
Franz Hofbauer
13
Im folgenden Beispiel werden rekursiv definierte Folgen (jedes Folgenglied wird aus den
vorhergehenden berechnet) mit Hilfe von Satz 1.8 untersucht.
a3 +1
Beispiel: Sei a0 = 1 und an+1 = n3 für n ≥ 0. Wir zeigen, dass die so definierte Folge
monoton fallend ist und 13 als untere Schranke hat.
Es gilt a1 = 23 ≤ a0 . Angenommen, wir haben a0 ≥ a1 ≥ · · · ≥ an−1 ≥ an ≥ 31 schon
a3 +1
a3 +1
a3
+1
gezeigt. Dann folgt an+1 = n3 ≥ 13 und an+1 = n3 ≤ n−1
= an , sodass auch
3
1
a0 ≥ a1 ≥ · · · ≥ an−1 ≥ an ≥ an+1 ≥ 3 gilt. Durch Wiederholen dieses Beweisschritts
sieht man, dass die Folge (an )n≥0 monoton fallend und nach unten durch 31 beschränkt ist.
Nach Satz 1.8 existiert der Grenzwert limn→∞ an = x. Wegen Satz 1.6 gilt x ≥ 13 und
lim
a3 +1
3
n→∞ n
x = limn→∞ an+1 =
= x 3+1 . Der Grenzwert x ist also eine Lösung der
3
Gleichung x3 − 3x + 1 = 0, die im Intervall [ 13 , 1) liegt.
√
√
√
Sei b0 = 1 und bn+1 = 3 − b1n . Es gilt b0 ≤ 2 = b1 ≤ 3. Wie oben zeigt man,
√
dass die Folge (bn )n≥0 monoton wachsend und nach oben durch 3√
beschränkt ist. Ist
√
√
b0 ≤ b1 ≤ · · · ≤ bn−1 ≤ bn ≤ 3 schon gezeigt, dann folgt bn+1 = 3 − b1n ≤ 3 und
√
√
√
1
bn+1 = 3 − b1n ≥ 3 − bn−1
= bn , sodass auch b0 ≤ b1 ≤ · · · ≤ bn−1 ≤ bn ≤ bn+1 ≤ 3
gilt. Durch Wiederholen dieses Beweisschritts
sieht man, dass die Folge (bn )n≥0 monoton
√
wachsend und nach oben durch 3 beschränkt ist.
Nach Satz 1.8 existiert der Grenzwert limn→∞ bn = y. Da b2n+1 = 3 − b1n für alle n gilt,
folgt y 2 = 3 − y1 mit Hilfe von Satz 1.6. Somit ist y wieder eine Lösung der Gleichung
√
y 3 − 3y + 1 = 0, allerdings eine im Intervall (1, 3].
5. Funktionen
Sei D eine Teilmenge von R. Wird jeder Zahl x ∈ D in eindeutiger Weise eine reelle Zahl
f (x) zugeordnet, dann nennt man f eine Funktion mit Definitionsbereich D. Oft werden
x
Funktionen durch Formeln angegeben, zum Beispiel f (x) = 2 + 3x − 5x2 oder f (x) = 1+x
2,
wobei man in beiden Fällen den Definitionsbereich D = R wählen kann. Das ist jedoch
3
nicht immer möglich. Hat man zum Beispiel die Funktion f (x) = x3x
2 −1 , dann muss man 1
und −1 aus dem Definitionsbereich ausschließen, da man diese Zahlen nicht in die Formel
einsetzen kann. In diesem Fall ist D = R \ {−1, 1} ein geeigneter Definitionsbereich. Man
kann für diese Funktion aber auch den Definitionsbereich D = (−1, 1) wählen, oder D =
[2, 9] oder viele andere Mengen. Es ist daher wichtig den Definitionsbereich D anzugeben.
Man schreibt f : D → R, wenn f auf D definiert ist und Werte in R hat. Für x ∈ D nennt
man die Zahl f (x) den Funktionswert im Punkt x und die Menge f (D) = {f (x) : x ∈ D}
aller Funktionswerte heißt Wertebereich der Funktion f . Oft drückt man Funktionen auch
mit Hilfe des Symbols 7→ aus. Zum Beispiel schreibt man die Funktion, die jedem x den
Wert 3x3 zuordnet, als x 7→ 3x3 .
Man kann Funktionen in einem Koordinatensystem zeichnen. Man zeichnet die Menge
der Punkte (x, f (x)) für x ∈ D. Diese Menge von Punkten nennt man den Graph der
Funktion f . Der Graph der Funktion f (x) = x2 ist eine Parabel. Die folgenden Zeichnungen zeigen die Graphen der Funktionen x 7→ |1 − |3x|| − 32 und x 7→ max(−2x2 + 23 , 34 x).
14
Reelle Zahlen und stetige Funktionen
Wir überlegen uns, wie sich der Graph einer Funktion unter gewissen Transformationen
ändert. Der Graph der Funktion x 7→ f (−x) ist der um die y-Achse gespiegelte Graph der
Funktion x 7→ f (x). Der Graph der Funktion x 7→ −f (x) ist der um die x-Achse gespiegelte
Graph der Funktion x 7→ f (x). Im Folgenden sei a immer > 0. Der Graph der Funktion
x 7→ f (x + a) ist der um a Einheiten nach links und der Graph der Funktion x 7→ f (x − a)
ist der um a Einheiten nach rechts verschobene Graph der Funktion x 7→ f (x). Der Graph
der Funktion x 7→ f (ax) ist der um den Faktor a1 in x-Richtung gedehnte (gestauchte)
Graph der Funktion x 7→ f (x). Der Graph der Funktion x 7→ f (x) + a ist der um a
Einheiten nach oben und der Graph der Funktion x 7→ f (x) − a ist der um a Einheiten
nach unten verschobene Graph der Funktion x 7→ f (x). Schließlich ist der Graph der
Funktion x 7→ af (x) der um den Faktor a in y-Richtung gedehnte (gestauchte) Graph der
Funktion x 7→ f (x).
Beispiel: Sei f (x) = 2x2 − 4x + 1 mit
Definitionsbereich D = R. Durch Umformen erhalten wir f (x) = 2(x − 1)2 − 1.
Der Graph der Funktion g(x) = x2 ist eine
Parabel. Wir nennen sie Standardparabel.
Man erhält den Graph der Funktion f , indem man die Standardparabel um 1 Einheit
nach rechts verschiebt, dann um den Faktor 2 in y-Richtung dehnt und schließlich
um 1 Einheit nach unten verschiebt. Die
nebenstehende Zeichnung zeigt den Graph
der Funktion f (x) = 2(x − 1)2 − 1 und die
Standardparabel. Man kann die durchgeführten Transformationen nachvollziehen.
Die einfachsten Funktionen sind Polynome. Ihr Definitionsbereich ist ganz R. Konstante
Funktionen f (x) = c haben waagrechte Geraden als Graphen. Die Funktionen f (x) =
c1 x + c0 mit c1 ̸= 0 sind die Polynome ersten Grades, deren Graphen ebenfalls Gerade
sind, die allerdings nicht mehr waagrecht verlaufen. Die Funktionen f (x) = c2 x2 + c1 x + c0
mit c2 ̸= 0 sind die Polynome zweiten Grades. Ihre Graphen sind Parabeln, die man aus
der Standardparabel nach der Methode in obigem Beispiel erhält. Schließlich nennt man
die Funktionen f (x) = cn xn + · · · + c1 x + c0 mit cn ̸= 0 die Polynome n-ten Grades.
Rationale Funktionen sind Brüche, deren Zähler und Nenner Polynome sind. Das Nennerpolynom kann in endlich vielen Punkten gleich 0 sein. Diese Punkte muss man aus dem
Franz Hofbauer
15
Definitionsbereich ausschließen. Dort hat der Graph der Funktion senkrechte Asymptoten.
Die einfachste rationale Funktion ist f (x) = x1 mit Definitionsbereich D = R \ {0}. Der
Graph ist eine Hyperbel, deren Asymptoten die x-Achse und die y-Achse sind.
3x+1
Beispiel: Sei f (x) = 6x−2
mit Definitions1
bereich D = R \ { 3 }. Durch Umformen erhalten wir f (x) = 13 x−1 1 + 12 . Man kann den
3
Graphen dieser Funktion aus dem Graphen
der Funktion g(x) = x1 durch entsprechende
Transformationen gewinnen. Zuerst wird der
Graph der Funktion g um 13 nach rechts verschoben, dann um den Faktor 13 in y-Richtung
geschrumpft und schließlich um 12 nach oben
verschoben. So erhält man den Graph der
Funktion f , den die nebenstehende Zeichnung
zeigt. Er hat eine senkrechte Asymptote bei x =
1
3
und eine waagrechte bei y = 12 .
Ist der Grad des Zählerpolynoms einer rationalen Funktion f größer oder gleich dem
Grad des Nennerpolynoms, so kann man f schreiben als Summe eines Polynoms und einer
rationalen Funktion, deren Zählergrad kleiner als der Nennergrad ist. Der Graph der
Funktion f liegt asymptotisch zu diesem Polynom.
−x+1
Beispiel: Sei f (x) = x +x
mit Defi3x2 −3
nitionsbereich D = R \ {−1, 1}. Umformen
ergibt f (x) = 13 x + 13 + 32 x21−1 . Die Gerade y = 13 x + 13 ist eine Asymptote für den
Graphen von f , da die Differenz 23 x21−1 zwischen dieser Gerade und f (x) für Zahlen x
mit großem Betrag sehr klein ist. Außerdem
hat der Graph von f senkrechte Asymptoten
bei x = −1 und x = 1. Die nebenstehende
Zeichnung zeigt den Graph der Funktion f
zusammen mit den drei Asymptoten.
3
2
Nach diesen eher geometrischen Überlegungen zu den Funktionsgraphen wollen wir uns
dem Rechnen mit Funktionen zuwenden. Sind f1 und f2 Funktionen mit Definitionsbereichen D1 und D2 , dann kann man auf D = D1 ∩ D2 Summe, Differenz und Produkt
dieser Funktionen bilden. Man definiert f1 + f2 als die Funktion, die jedem x ∈ D den
Wert f1 (x) + f2 (x) zuordnet. Genauso definiert man f1 − f2 und f1 · f2 . Mit dem Quotient ff12 muss man vorsichtiger sein. Man muss alle Punkte x aus dem Definitionsbereich
ausschließen, für die f2 (x) = 0 gilt.
Funktionen lassen sich auch hintereinander ausführen. Sind f und g Funktionen mit
Definitionsbereichen D1 und D2 , und gilt f (x) ∈ D2 für alle x ∈ D1 , dann kann man
g(f (x)) bilden. Die Funktion mit Definitionsbereich D1 , die jedem x ∈ D1 den Wert
g(f (x)) zuordnet, bezeichnet man mit g ◦ f .
16
Reelle Zahlen und stetige Funktionen
6. Stetigkeit
Eine stetige Funktion f stellt man sich so vor, dass man den Graph dieser Funktion als
nicht unterbrochene Linie zeichnen kann. Wenn der Punkt y dem Punkt x nahe kommt,
dann muss auch der Funktionswert f (y) dem Funktionswert f (x) nahe kommen. Um eine
mathematische Definition zu geben, verwenden wir Umgebungen.
Definition: Sei f : D → R eine Funktion und x ∈ D. Die Funktion f heißt stetig
im Punkt x, falls für jedes ε > 0 ein δ > 0 existiert, sodass |f (y) − f (x)| < ε für alle
y ∈ (x − δ, x + δ) ∩ D gilt. Man sagt f ist stetig auf D, wenn f in jedem Punkt x ∈ D
stetig ist.
Einfache Beispiele für stetige Funktionen sind lineare Funktionen, die Definitionsbereich
D = R haben. Ist f (x) = c für alle x ∈ R und ε > 0 vorgegeben, dann kann man δ > 0
wählen, wie man will. Es gilt immer |f (y) − f (x)| = 0 < ε für alle y ∈ (x − δ, x + δ). Ist
a ̸= 0 und f (x) = ax + b für alle x ∈ R, dann kann man zu vorgegebenem ε > 0 immer
1
δ = |a|
ε wählen. Für y ∈ (x − δ, x + δ), das sind ja die y mit |y − x| < δ, gilt dann
|f (y) − f (x)| = |a| · |y − x| < ε. Damit ist gezeigt, dass f in jedem Punkt x ∈ R stetig
ist. Bei komplizierteren Funktionen kann die Wahl von δ schwieriger sein, wie das folgende
Beispiel zeigt.
Beispiel: Die Funktion f (x) = x2 ist stetig in jedem Punkt x ∈ R. Wir prüfen die
Definition nach. Sei ε > 0 vorgegeben. Hier hängt die Wahl von δ nicht nur von ε, sondern
ε
auch von x ab. Wir können δ = min( 1+|2x|
, 1) wählen. Ist dann y ∈ (x − δ, x + δ), also
|y − x| < δ, so folgt |y + x| = |y − x + 2x| ≤ |y − x| + |2x| ≤ 1 + |2x| und damit erhalten
wir |f (y) − f (x)| = |y 2 − x2 | = |y + x| · |y − x| < (1 + |2x|)δ ≤ ε.
Um die Stetigkeit von Funktionen nicht so mühsam nachrechnen zu müssen, führen wir
im nächsten Satz die Stetigkeit auf Grenzwerte zurück. Für jede Folge (xn )n≥1 , deren
Glieder xn im Definitionsbereich einer Funktion f liegen, können wir die Folge der Funktionswerte f (xn ) untersuchen.
Satz 1.9: Sei f : D → R eine Funktion und x ∈ D. Dann sind äquivalent
(a) f ist im Punkt x stetig
(b) für jede Folge (xn )n≥1 in D mit limn→∞ xn = x gilt limn→∞ f (xn ) = f (x).
Beweis: Der Beweis besteht aus zwei Teilen. Wir beginnen mit (a) ⇒ (b). Unter der
Voraussetzung der Stetigkeit von f im Punkt x müssen wir limn→∞ f (xn ) = f (x) zeigen.
Wir wählen ε > 0 beliebig und suchen n0 . Da f im Punkt x stetig ist, gibt es ein δ > 0,
sodass |f (y) − f (x)| < ε für alle y ∈ (x − δ, x + δ) ∩ D gilt. Wegen limn→∞ xn = x finden
wir jetzt ein n0 , sodass xn ∈ (x − δ, x + δ) für alle n ≥ n0 gilt. Da xn ∈ D für alle n ≥ 1
vorausgesetzt wird, gilt mit diesem n0 , dass |f (xn ) − f (x)| < ε für alle n ≥ n0 erfüllt ist,
womit limn→∞ f (xn ) = f (x) gezeigt ist.
Wir zeigen (b) ⇒ (a) durch einen indirekten Beweis. Wir nehmen an, dass (a) nicht gilt
und zeigen, dass dann auch (b) nicht gelten kann. Sei also (a) nicht erfüllt, das heißt f ist
im Punkt x nicht stetig. Nach Definition der Stetigkeit existiert ein ε > 0, sodass, ganz egal
wie klein wir δ > 0 wählen, immer ein y ∈ (x − δ, x + δ) ∩ D existiert mit |f (y) − f (x)| ≥ ε.
Insbesondere können wir δ = n1 wählen und finden ein yn ∈ (x − n1 , x + n1 ) ∩ D mit
|f (yn ) − f (x)| ≥ ε. Somit haben wir eine Folge (yn )n≥1 in D gefunden, deren Grenzwert
x ist nach Satz 1.7, da ja x − n1 ≤ yn ≤ x + n1 für alle n ≥ 1 gilt. Andererseits gilt
Franz Hofbauer
17
limn→∞ f (yn ) = f (x) nicht, da f (yn ) für jedes n ≥ 1 außerhalb der ε-Umgebung von f (x)
liegt. Damit ist gezeigt, dass (b) nicht gilt.
Mit diesem Satz und den Rechenregeln für Grenzwerte erhält man den folgenden Satz,
der besagt, dass Summe, Differenz, Produkt und Quotient von stetigen Funktionen wieder
stetig sind.
Satz 1.10: Seien f : D → R und g : D → R Funktionen, die im Punkt x ∈ D stetig sind.
Dann sind auch die Funktionen f + g, f − g und f g im Punkt x stetig. Ist g(x) ̸= 0, dann
ist auch fg im Punkt x stetig.
Beweis: Der Definitionsbereich der Funktionen f + g, f − g und f g ist ebenfalls D.
Sei (xn )n≥1 eine beliebige Folge in D mit Grenzwert x. Da f und g im Punkt x stetig
sind, folgt limn→∞ f (xn ) = f (x) und limn→∞ g(xn ) = g(x) aus Satz 1.9. Aus Satz 1.6
folgt limn→∞ f (xn ) + g(xn ) = f (x) + g(x), limn→∞ f (xn ) − g(xn ) = f (x) − g(x) und
limn→∞ f (xn )g(xn ) = f (x)g(x). Wegen Satz 1.9 heißt das aber, dass die Funktionen
f + g, f − g und f g im Punkt x stetig sind.
Um den Definitionsbereich E der Funktion fg zu erhalten, muss man aus D noch alle
Punkte ausschließen, in denen g null ist. Da g(x) ̸= 0 vorausgesetzt wird, liegt x in E.
Wählt man eine beliebige Folge (xn )n≥1 in E mit Grenzwert x, so gilt g(xn ) ̸= 0 für alle
n ≥ 1. Außerdem gilt limn→∞ f (xn ) = f (x) und limn→∞ g(xn ) = g(x) wegen Satz 1.9.
(xn )
(x)
Aus Satz 1.6 (d) folgt limn→∞ fg(x
= fg(x)
. Wegen Satz 1.9 heißt das aber, dass die
n)
Funktion
f
g
im Punkt x stetig ist.
Mit Hilfe dieses Satzes kann man für viele Funktionen zeigen, dass sie stetig sind. Die
Funktion f (x) = x ist für alle x ∈ R stetig. Durch Produktbildung folgt, dass auch die
Funktionen x 7→ x2 , x 7→ x3 , . . . auf ganz R stetig sind. Da konstante Funktionen stetig
sind, sind auch die Funktionen x 7→ cxn mit c ∈ R und n ∈ N stetig. Durch Bilden von
Summen folgt dann, dass alle Polynome auf ganz R stetig sind. Daraus erhält man wieder
die Stetigkeit von rationalen Funktionen in allen Punkten, wo das Nennerpolynom nicht
null ist.
Treppenfunktionen sind Beispiele für Funktionen, die nicht überall stetig sind. Die
Funktion f : [0, 2] → R definiert durch f (x) = 3 für x ∈ [0, 1) und f (x) = 2 für x ∈ [1, 2] ist
ein einfaches Beispiel für eine Treppenfunktion. Sie ist im Punkt 1 unstetig. Ist xn = 1− n1
für n ≥ 1, dann ist (xn )n≥1 eine Folge in [0, 2] mit f (xn ) = 3 für alle n ≥ 1, sodass auch
limn→∞ f (xn ) = 3 gilt. Andererseits gilt f (1) = 2, sodass f wegen Satz 1.9 im Punkt 1
unstetig ist.
Zum Abschluss behandeln wir noch die Stetigkeit bei Hintereinanderausführen von zwei
Funktionen.
Satz 1.11: Seien f : D1 → R und g : D2 → R Funktionen. Für alle x ∈ D1 gelte
f (x) ∈ D2 . Wenn f in x ∈ D1 und g in f (x) ∈ D2 stetig sind, dann ist auch g ◦ f in x
stetig.
Beweis: Sei (xn )n≥1 eine beliebige Folge in D1 mit Grenzwert x. Dann ist (f (xn ))n≥1
eine Folge in D2 . Da f in x stetig ist, hat diese Folge wegen Satz 1.9 den Grenzwert f (x).
Da g im Punkt f (x) stetig ist, folgt limn→∞ g(f (xn )) = g(f (x)) wieder aus Satz 1.9. Das
aber bedeutet wieder wegen Satz 1.9 die Stetigkeit von g ◦ f im Punkt x.
18
Reelle Zahlen und stetige Funktionen
7. Zwischenwertsatz und Umkehrfunktion
Der wichtigste Satz über stetige Funktionen ist der Zwischenwertsatz. Liegt der Funktionswert in einem Punkt a unterhalb eines Wertes y und in einem anderen Punkt b
oberhalb von y, dann muss der Graph der Funktion, der ja eine nicht unterbrochene Linie
ist, an einer Stelle zwischen a und b den Wert y überschreiten.
Satz 1.12 (Zwischenwertsatz) Sei f : [a, b] → R stetig. Es gelte f (a) < y < f (b) oder
f (a) > y > f (b). Dann existiert ein x ∈ (a, b) mit f (x) = y.
Der Beweis dieses Satzes verwendet die Intervallschachtelungseigenf (b)
schaft und wird in einem späteren
Kapitel gemeinsam mit anderen Beweisen gebracht. Die nebenstehende
Zeichnung illustriert die Aussage des
Zwischenwertsatzes. Ist y eine Zahl,
y
die zwischen den Funktionswerten
f (a) und f (b) liegt, dann hat die
Gleichung f (x) = y eine Lösung x
f (a)
im Intervall (a, b). Wie die Zeichnung zeigt, muss diese Lösung jedoch nicht eindeutig sein. Um eindeutige Lösungen zu haben, muss
die Funktion neben der Stetigkeit
a
x
b
noch eine andere Voraussetzung erfüllen. Wir müssen uns mit dem Monotonieverhalten von Funktionen beschäftigen.
Definition: Sei D ⊆ R. Eine Funktion f : D → R heißt
(a) konstant, wenn ein c ∈ R existiert mit f (x) = c für alle x ∈ D
(b) monoton wachsend, wenn gilt: u, v ∈ D und u < v ⇒ f (u) ≤ f (v)
(c) streng monoton wachsend, wenn gilt: u, v ∈ D und u < v ⇒ f (u) < f (v)
(d) monoton fallend, wenn gilt: u, v ∈ D und u < v ⇒ f (u) ≥ f (v)
(e) streng monoton fallend, wenn gilt: u, v ∈ D und u < v ⇒ f (u) > f (v)
Satz 1.13: Sei f : [a, b] → R stetig und streng monoton wachsend oder fallend. Für jedes
y, das zwischen f (a) und f (b) liegt, hat dann die Gleichung f (x) = y genau eine Lösung
x ∈ (a, b).
Beweis: Die Existenz von x folgt aus Satz 1.12. Für x̃ ̸= x kann aber f (x̃) = f (x) nicht
gelten, da eine streng monotone Funktion in zwei verschiedenen Punkten nicht den selben
Funktionswert haben kann.
Schließlich führen wir noch die Umkehrfunktion zu einer Funktionen f : I → R ein,
wobei I ein beliebiges Intervall ist, zum Beispiel I = [a, b], I = (a, b), I = [a, ∞), I = R
oder sonst eines. Die Umkehrfunktion g ist auf dem Wertebereich f (I) = {f (x) : x ∈ I}
definiert. Sie weist jedem Element y = f (x) von f (I) den Wert x zu, kehrt also die
Zuordnung, die f durchführt, um. Man berechnet g, indem man die Gleichung y = f (x)
nach x auflöst und g(y) = x setzt. Voraussetzung ist, dass die Lösung x eindeutig ist. Es
gelten dann die Gleichungen g(f (x)) = x für alle x ∈ I und f (g(y)) = y für alle y ∈ f (I).
Franz Hofbauer
19
Der Graph der Umkehrfunktion g von f geht aus dem Graph von f durch Spiegelung an
der Geraden y = x hervor. Diese Spiegelung führt nämlich die Menge {(x, f (x)) : x ∈ I},
die den Graph von f bildet über in die Menge {(f (x), x) : x ∈ I} = {(y, g(y)) : y ∈ f (I)},
die den Graph von g bildet.
Beispiel: Die Funktion f (x) = 4x−3
ist
2x
auf dem Intervall I = (0, ∞) definiert. Die
Funktionswerte f (x) durchlaufen das Intervall J = (−∞, 2), wenn x durch I läuft. Daher gilt f (I) = J. Die Umkehrfunktion erhält
man durch Lösen der Gleichung y = 4x−3
2x
nach x, vorausgesetzt diese Lösung ist eindeutig bestimmt. Das ist auch der Fall. Wir
3
erhalten x = 4−2y
als eindeutige Lösung. Die
3
. Sie
Umkehrfunktion ist daher g(y) = 4−2y
ist auf J definiert und es gilt g(f (x)) = x
für x ∈ I und f (g(y)) = y für y ∈ J, wie
man leicht nachprüft. Die Zeichnung zeigt
die Graphen der beiden Funktionen. Sie liegen
symmetrisch zur Geraden y = x.
g
f
Der folgende Satz gibt an, unter welchen Voraussetzungen eine Umkehrfunktion existiert.
Satz 1.14: Sei I = [a, b] ⊆ R ein abgeschlossenes Intervall und f : I → R stetig und
streng monoton wachsend oder fallend. Sei J = [f (a), f (b)], wenn f monoton wachsend,
und J = [f (b), f (a)], wenn f monoton fallend ist. Dann existiert eine eindeutig bestimmte
Funktion g : J → I mit g(f (x)) = x für alle x ∈ I und f (g(y)) = y für alle y ∈ J.
Weiters ist g streng monoton wachsend, wenn f monoton wachsend ist, und streng monoton
fallend, wenn f monoton fallend ist. Schließlich ist g auch stetig. Die Funktion g heißt
Umkehrfunktion von f .
Beweis: Wir führen den Beweis nur für streng monoton wachsende Funktionen. Für
streng monoton fallende Funktionen verläuft der Beweis ganz analog. Es drehen sich nur
Ungleichheitszeichen um.
Wir definieren die Funktion g : J → I. Sei y ∈ J. Wenn y = f (a) gilt, dann setzen wir
g(y) = a. Wenn y = f (b) gilt, dann setzen wir g(y) = b. Wenn keiner dieser beiden Fälle
eintritt, dann liegt y zwischen f (a) und f (b). Aus dem Zwischenwertsatz folgt dann, dass
ein x ∈ (a, b) existiert mit f (x) = y. Da f streng monoton wachsend ist, ist x eindeutig
bestimmt. Wir setzen g(y) = x. Damit ist g : J → I definiert. Aus dieser Definition ergibt
sich f (g(y)) = y für alle y ∈ J. Ist andererseits x ∈ I beliebig, dann gilt f (x) ∈ J und wir
können y = f (x) in die Gleichung f (g(y)) = y einsetzen. Es folgt f (g(f (x))) = f (x) und
daraus dann g(f (x)) = x, da f streng monoton ist.
Weiters ist g : J → I eindeutig bestimmt. Wäre g̃ : J → I eine andere Funktion mit den
selben Eigenschaften, dann hätten wir f (g(y)) = y = f (g̃(y)) und somit auch g(y) = g̃(y)
für alle y ∈ J wegen der strengen Monotonie von f .
Die Funktion g ist streng monoton wachsend. Aus y1 < y2 folgt g(y1 ) < g(y2 ). Wäre
nämlich g(y1 ) ≥ g(y2 ), dann würde f (g(y1 )) ≥ f (g(y2 )) folgen, da f streng monoton
wachsend ist, also y1 ≥ y2 . Daher kann g(y1 ) ≥ g(y2 ) nicht gelten.
20
Reelle Zahlen und stetige Funktionen
Schließlich beweisen wir, dass g : J → I stetig ist. Sei y ∈ J und (yn )n≥1 eine Folge in
J mit limn→∞ yn = y. Wegen Satz 1.9 genügt es zu zeigen, dass limn→∞ g(yn ) = g(y)
gilt. Würde das nicht zutreffen, dann fände man ein x1 < g(y), sodass g(yn ) ≤ x1 für
unendlich viele n gilt, oder ein x2 > g(y), sodass g(yn ) ≥ x2 für unendlich viele n gilt. Im
ersten Fall folgt f (x1 ) < y und yn ≤ f (x1 ) für unendlich viele n, da f streng monoton
wachsend ist, ein Widerspruch zu limn→∞ yn = y. Im zweiten Fall folgt f (x2 ) > y und
yn ≥ f (x2 ) für unendlich viele n, ebenfalls ein Widerspruch zu limn→∞ yn = y. Die
Annahme, dass limn→∞ g(yn ) = g(y) nicht gilt, führt daher immer zu einem Widerspruch,
womit limn→∞ g(yn ) = g(y) gezeigt ist.
Bemerkung: Für eine stetige und streng monotone Funktion f : I → R kann man die
Umkehrfunktion auch dann bilden, wenn I ein Intervall ist, das nicht beschränkt und
abgeschlossen ist. Das soll an Beispielen erklärt werden.
Sei I = [0, ∞) und f : I → R die Funktion f (x) = x2 . Sie ist stetig und streng monoton
wachsend. Für n ≥ 1 sei In = [0, n] und Jn = [0, n2 ]. Wegen f (0) = 0 und f (n) = n2 folgt
aus Satz 1.14, dass die eindeutig bestimmte Umkehrfunktion g von Jn nach In definiert ist.
Da n beliebig groß gewählt werden kann, ist g von J = [0, ∞) nach I = [0, ∞) definiert.
Noch ein Beispiel: Sei I = (0, ∞) und f : I → R die Funktion f (x) = x13 . Sie ist stetig und
streng monoton fallend. Für n ≥ 1 sei In = [ n1 , n] und Jn = [ n13 , n3 ]. Wegen f ( n1 ) = n3
und f (n) = n13 folgt aus Satz 1.14, dass die eindeutig bestimmte Umkehrfunktion g von
Jn nach In definiert ist. Da n beliebig groß gewählt werden kann, ist g von J = (0, ∞)
nach I = (0, ∞) definiert.
8. Potenzfunktion
Zuerst behandeln wir Potenzfunktionen f (x) = xm mit ganzzahligen Exponenten m.
Um rationale Exponenten einführen zu können, definieren wir dann die m-te Wurzel einer
positiven reellen Zahl mit Hilfe der Umkehrfunktion. Wir haben die Quadratwurzel bereits
mit Hilfe der Intervallschachtelungseigenschaft definiert, mit der Umkehrfunktion kann
man jedoch einfacher arbeiten und auch höhere Wurzeln leicht definieren.
Definition: Sei a > 0. Für m ∈ N definieren wir am als m-faches Produkt, wir setzen
a0 = 1, und a−m definieren wir als a1m .
Satz 1.15: Sei a > 0 und b > 0. Für m und n in Z gilt dann
(a) am bm = (ab)m
(b) am+n = am an
(c) (am )n = amn
Beweis: Den Beweis führt man durch Anwenden der Definition mit Hilfe entsprechender
Fallunterscheidungen. Ist m > 0, dann ist am = a · a · . . . · a und bm = b · b · . . . · b, wobei
rechts jeweils ein m-faches Produkt steht. Ebenso gilt (ab)m = ab · ab · . . . · ab. Daraus
erkennt man, dass (a) für positives m richtig ist. Mit Hilfe dieses Resultats folgt dann
1
−m
a−m b−m = a1m b1m = (ab)
, sodass (a) auch für negative Exponenten gilt. Für
m = (ab)
m = 0 wird (a) zu 1 = 1.
Sind m und n beide ≥ 0, dann ist sowohl am+n als auch am an das m + n-fache Produkt
a · a · . . . · a, woraus (b) für nicht negative m und n folgt. Ist m ≥ 0 und n < 0, dann ist
am an ein Bruch, dessen Zähler das m-fache Produkt a · a · . . . · a (oder 1, wenn m = 0) ist,
und dessen Nenner das |n|-fache Produkt a · a · . . . · a ist. Kürzt man so viele a wie möglich
weg, dann bleibt am+n übrig. Analog läßt sich (b) auch für die Fälle m < 0, n ≥ 0 und
m < 0, n < 0 nachprüfen.
Franz Hofbauer
21
Ist n > 0, dann ist (am )n das n-fache Produkt am · am · . . . · am . Durch wiederholtes
Anwenden von (b) wird das zu am+m+···+m = amn , womit (c) für n > 0 gezeigt ist. Mit
1
Hilfe dieses Resultats folgt dann (am )−n = (am1 )n = amn
= a−mn = am(−n) . Für n = 0
wird (c) zu 1 = 1.
Der folgende Satz gibt eine Äquivalenzumformung, die sehr nützlich sein wird.
Satz 1.16: Für a, b ∈ [0, ∞) und n ∈ N gilt a < b ⇔ an < bn und a = b ⇔ an = bn .
Beweis: Wenn a = b = 0 gilt, dann auch an = bn = 0, sodass die Äquivalenzen gelten.
Wir können also a > 0 oder b > 0 annehmen. Sei c = an−1 +an−2 b+· · ·+abn−2 +bn−1 . Es
gilt c > 0. Wir verwenden die Formel an − bn = (a − b)(an−1 + an−2 b + · · · + abn−2 + bn−1 ).
Damit sieht man, dass an − bn = (a − b)c = 0 genau dann gilt, wenn a − b = 0 ist, und
an − bn = (a − b)c < 0 genau dann, wenn a − b < 0 ist.
Sei n ∈ N. Die Funktion f (x) = xn von [0, ∞) nach R ist stetig und wegen Satz 1.16 auch
streng monoton wachsend. Der Wertebereich von f das Intervall [0, ∞) und es existiert die
√
Umkehrfunktion g : [0, ∞) → [0, ∞). Wir schreiben n y für g(y) und nennen diese Zahl
√
√
die n-te Wurzel aus y. Es gilt ( n y)n = y und n xn = x.
Satz 1.17: Sei x > 0 beliebig. Seien m, m̃ ∈ Z und n, ñ ∈ N. Wenn
√
√
ñ
gilt auch n xm = xm̃ .
m
n
=
m̃
ñ
gilt, dann
Beweis: Um zu dieser Schlussfolgerung zu kommen, gehen wir schrittweise vor.
m
n
=
m̃
ñ
⇒ mñ = m̃n ⇒ xmñ = xm̃n
⇒ (xm )ñ = (xm̃ )n
√
√
ñ
⇒ ( n xm )nñ = ( xm̃ )ñn
√
√
ñ
⇒ n xm = xm̃
wegen Satz 1.15 (c)
Definition der Wurzel und Satz 1.15 (c)
wegen Satz 1.16
Damit sind wir beim gewünschten Ergebnis angelangt.
Jetzt können wir die Potenzfunktion mit rationalen Exponenten definieren.
Definition: Sei x > 0, q ∈ Q und m
n√ irgendeine Darstellung von q als Bruch mit m ∈ Z
q
und n ∈ N. Wir definieren x durch n xm , wobei es gleichgültig ist, welche Darstellung m
n
von q gewählt wurde.
m
Aus dieser Definition und der Definition der Wurzel folgt (x n )n = xm . Nun können wir
auch Rechenregeln für rationale Exponenten herleiten.
Satz 1.18: Für p, q ∈ Q und a und b in [0, ∞) gilt
(a) ap bp = (ab)p
(b) ap+q = ap aq
(c) (ap )q = apq
Beweis: Unter Verwendung von Satz 1.15 und Satz 1.16 führen wir diese Formeln durch
Äquivalenzumformungen auf bekannte Formeln zurück. Um (a) zu zeigen, sei p = m
n eine
Darstellung von p als Bruch. Dann gilt
ap bp = (ab)p ⇔ (ap bp )n = ((ab)p )n ⇔ (ap )n (bp )n = ((ab)p )n ⇔ am bm = (ab)m
Da diese letzte Gleichung aus Satz 1.15 bekannt ist, ist (a) bewiesen. Um (b) zu zeigen,
k
wählen wir p = m
n und q = n als Brüche mit gleichem Nenner. Dann gilt
ap+q = ap aq ⇔ (ap+q )n = (ap aq )n ⇔ (ap+q )n = (ap )n (aq )n ⇔ am+k = am ak
22
Reelle Zahlen und stetige Funktionen
womit wir (b) ebenfalls auf eine Formel aus Satz 1.15 zurückgeführt haben. Um auch die
k
letzte Formel zu erhalten, wählen wir p = m
n und q = l und formen um
(ap )q = apq ⇔ (((ap )q )l )n = (apq )ln ⇔ (ap )kn = amk ⇔ ((ap )n )k = amk ⇔ (am )k = amk
womit auch (c) auf Satz 1.15 zurückgeführt ist.
Zum Abschluss dieses Kapitels behandeln wir noch ein geometrisches Problem. Wir
√
berechnen die Länge eines Kreisbogens. Dazu brauchen wir die Wurzelfunktion x 7→ x,
die wegen Satz 1.14 stetig ist. Wir haben gesehen, dass die Fläche eines Kreises mit
Radius 1 eine reelle Zahl ist, die wir π nennen. Die Fläche eines Kreises mit Radius r ist
dann das r2 -fache, also r2 π. Ein Kreissektor mit Winkel α ist ein entsprechender Teil des
α
2
Kreises und hat Fläche A = 360
0 r π. Wir wollen die Länge b des Bogens eines Kreissektors
bestimmen. Dazu müssen wir die Bogenlänge b definieren. Seien P0 , P1 , . . . , Pn Punkte
auf dem Kreisbogen, die den Bogen in n gleiche Teile unterteilen, wobei P0 und Pn die
Endpunkte des Bogens sind. Die Sehnen Pk−1 Pk haben alle die gleiche Länge sn , sodass
nsn die Länge des gesamten Polygonzuges ist. Wir definieren b = limn→∞ nsn .
Satz 1.19: Sei A die Fläche eines Kreissektors in einem Kreis mit Radius r und b die
Länge des zugehörigen Kreisbogens. Dann gilt A = 12 rb.
Beweis: Sei M der Kreismittelpunkt
und seien Pk−1 und Pk zwei aufeinanderfolgende Punkte auf dem Kreisbogen im
Abstand sn . Sei An die Fläche des Kreissektors, die zwischen den Radien M Pk−1
und M Pk liegt, sodass A = nAn folgt.
Als Fläche
√ des Dreiecks Pk−1 M Pk ergibt
Pk
S
sn
r
r2 − 14 s2n . Da sie kleiner als An
√
Pk−1
ist, folgt 21 nsn r2 − 14 s2n ≤ nAn = A. Sei
S der Schnittpunkt der beiden Tangenten
an den Kreis in den Punkten Pk−1 und
M
Pk . Dann ist An kleiner als die Fläche
des Vierecks Pk−1 M Pk S, die 12 sn · |M S|
√
2
beträgt. Nach dem Kathetensatz für das rechtwinkelige Dreieck gilt r = |M S| · r2 − 14 s2n .
2
Es folgt A = nAn ≤ 21 nsn √ 2r 1 2 . Damit haben wir gezeigt
r − 4 sn
√
/√
2A
1 2
2
r − 4 sn ≤ nsn ≤ 2A
r2 − 41 s2n
r2
sich 21 sn
Wegen limn→∞ sn = 0 folgt limn→∞ r2 − 41 s2n = r2 aus Satz 1.6. Da die Funktion f (x) =
√
√
x stetig ist, folgt limn→∞ r2 − 14 s2n = r aus Satz 1.9. Wegen Satz 1.6 folgt daraus
√
/√
2A
2A
1 2
2
lim r2 r − 4 sn = r und lim 2A
r2 − 14 s2n = 2A
r
n→∞
n→∞
Aus Satz 1.7 erhalten wir, dass limn→∞ nsn existiert und gleich
2A
r
ist.
Da die Fläche eines Kreises mit Radius r gleich r2 π ist, ist 2r r2 π = 2rπ nach Satz 1.19
der Umfang des Kreises. Bei der Definition der trigonometrischen Funktionen werden wir
die Winkel durch die Länge des entsprechenden Bogens des Einheitskreises messen. Aus
2πα
dem Umfang 2π des Einheitskreises berechnet man das Bogenmaß 360
0 für den Winkel α.
II. Differenzierbarkeit
Wir definieren die Ableitung einer Funktion und verwenden sie, um das Monotonieverhalten dieser Funktion zu untersuchen. Daraus ergeben sich Methoden, um Maxima
und Minima zu berechnen und um Gleichungen und Ungleichungen zu beweisen. Weiters
werden die trigonometrischen Funktionen und die Exponentialfunktion eigeführt.
1. Grenzwerte von Funktionen
Es kann vorkommen, dass Funktionen in einem isolierten Punkt nicht definiert sind. Sei
D ein offenes Intervall, das auch unbeschränkt sein kann, also auch (a, ∞) oder (−∞, b)
oder ganz R. Sei x ∈ D und Dx = D \ {x}. Wir nehmen an, dass die Funktion f
auf Dx definiert ist und versuchen f im Punkt
x sinnvoll zu ergänzen. Die nebenstehende
Zeichnung zeigt den Graph einer Funktion, die
im Punkt x = 2 eine Sprungstelle aufweist.
Man kann natürlich f (x) irgendwie festlegen,
aber ein sinnvoller Wert ist wohl der, gegen
den f (y) strebt, wenn y gegen x geht. Für
die Funktion in der nebenstehenden Zeichnung
strebt aber f (y) gegen verschiedene Werte, je
nachdem, ob y von links oder von rechts an x
herankommt. Es gibt keinen Grenzwert. Deshalb ist es nicht möglich den Funktionswert
bei x so festzulegen, dass die Lücke im Graph
x
gesclossen wird.
Wir sind bei dem Problem angelangt, zuerst einmal den Grenzwert von f (y) für y gegen
x zu definieren. Wir gehen analog vor, wie bei der Definition des Grenzwerts einer Folge.
Soll u der Grenzwert der Funktion f im Punkt x sein und gibt man eine ε-Umgebung von
u vor, dann muss der Funktionswert f (y) in dieser ε-Umgebung liegen, wenn y nur nahe
genug bei x liegt. Daraus ergibt sich die Definition des Grenzwerts.
Definition: Sei D ein offenes Intervall, x ∈ D und f auf Dx = D \ {x} definiert. Man
nennt u den Grenzwert der Funktion f im Punkt x, wenn für jedes ε > 0 ein δ > 0 existiert,
sodass |f (y) − u| < ε für alle y ∈ (x − δ, x + δ) ∩ Dx gilt. Man schreibt limy→x f (y) = u.
Der Grenzwert einer Funktion ist eindeutig bestimmt. Das kann man sich genauso
überlegen, wie wir es für Folgen getan haben.
Die Funktion f sei auch im Punkt x definiert. Dann gilt limy→x f (y) = f (x) genau
dann, wenn f im Punkt x stetig ist, wie ein Vergleich der Definitionen von Grenzwert und
Stetigkeit zeigt. Wir verwenden das im folgendes Beispiel.
Beispiel: Die Funktion f (y) =
√
1− 1+y
y
ist auf dem Intervall D = (−1, 1) definiert, außer
im Punkt x = 0. Dort ist der Nenner des Bruches null. Wir berechnen limy→0
√
1− 1+y
.
y
1−(1+y)
−1
−1
√
= 1+√
. Die Funktion g(y) = 1+√
ist auf ganz D
Für y ∈ Dx gilt f (y) = y(1+
1+y)
1+y
1+y
definiert und wegen Satz 1.10 auch stetig, also eine stetige Fortsetzung von f auf ganz D.
Da f (y) = g(y) für y ∈ Dx gilt, erhalten wir limy→0 f (y) = limy→0 g(y) = g(0) = − 21 .
24
Differenzierbarkeit
Wie wir es schon bei der Stetigkeit von Funktionen getan haben, charakterisieren wir
Grenzwerte von Funktionen durch Grenzwerte von Folgen.
Satz 2.1: Sei D ein offenes Intervall, x ∈ D und f auf Dx = D \ {x} definiert. Dann sind
äquivalent
(a) limy→x f (y) = u
(b) für jede Folge (xn )n≥1 in Dx mit limn→∞ xn = x gilt limn→∞ f (xn ) = u.
Beweis: Der Beweis besteht aus zwei Teilen. Wir beginnen mit (a) ⇒ (b). Unter der
Voraussetzung limy→x f (y) = u müssen wir limn→∞ f (xn ) = u zeigen. Wir wählen ε > 0
beliebig und suchen n0 . Wegen limy→x f (y) = u gibt es ein δ > 0, sodass |f (y) − u| < ε
für alle y ∈ (x − δ, x + δ) ∩ Dx gilt. Wegen limn→∞ xn = x finden wir jetzt ein n0 , sodass
xn ∈ (x − δ, x + δ) für alle n ≥ n0 gilt. Da die Folge (xn )n≥1 auch in Dx liegt, erhalten
wir |f (xn ) − u| < ε für alle n ≥ n0 , womit limn→∞ f (xn ) = u gezeigt ist.
Wir zeigen (b) ⇒ (a) indirekt. Sei also (a) nicht erfüllt, das heißt limy→x f (y) = u gilt
nicht. Es existiert ein ε > 0, sodass für jedes δ > 0 ein y ∈ (x − δ, x + δ) ∩ Dx existiert
mit |f (y) − u| ≥ ε. Wir wählen δ = n1 und finden ein yn ∈ (x − n1 , x + n1 ) ∩ Dx , sodass
|f (yn ) − u| ≥ ε gilt. So haben wir eine Folge (yn )n≥1 in Dx gefunden, deren Grenzwert
x ist, da ja |yn − x| < n1 für alle n ≥ 1 gilt. Andererseits kann limn→∞ f (yn ) = u nicht
gelten, da f (yn ) für jedes n ≥ 1 außerhalb der ε-Umgebung von u liegt. Damit ist gezeigt,
dass (b) nicht gilt.
Um Grenzwerte zu berechnen, sind entsprechende Rechenregeln hilfreich. Diese sind
dieselben wie die Rechenregeln für Grenzwerte von Folgen. Mit Hilfe des letzten Satzes
können wir die Rechenregeln leicht übertragen.
Satz 2.2: Sei D ein offenes Intervall und x ∈ D. Die Funktionen f und g seien auf Dx
definiert. Weiters sollen die Grenzwerte limy→x f (y) = a und limy→x g(y) = b existieren.
(a) Es gilt limy→x f (y) + g(y) = a + b.
(b) Es gilt limy→x f (y)g(y) = ab.
(y)
(c) Ist g(y) ̸= 0 für alle y ∈ Dx und b ̸= 0, dann gilt limy→x fg(y)
= ab .
Beweis: Sei (xn )n≥1 eine beliebige Folge in Dx mit limn→∞ xn = x. Wegen Satz 2.1
gilt limn→∞ f (xn ) = a und limn→∞ g(xn ) = b. Es folgt limn→∞ f (xn ) + g(xn ) = a + b
und limn→∞ f (xn )g(xn ) = ab wegen Satz 1.6 und, wenn b ̸= 0 und g(y) ̸= 0 gilt für alle
(xn )
y ∈ Dx , auch limn→∞ fg(x
= ab . Wegen Satz 2.1 ist dann limy→x f (y) + g(y) = a + b
n)
und limy→x f (y)g(y) = ab gezeigt und, wenn b ̸= 0 und g(y) ̸= 0 gilt für alle y ∈ Dx , auch
(y)
limy→x fg(y)
= ab .
Auch der folgende Satz ergibt sich aus dem entsprechenden Satz für Folgen.
Satz 2.3: Sei D ein offenes Intervall und x ∈ D. Seien f , g und h Funktionen, die auf Dx
definiert sind. Wenn limy→x f (y) = limy→x g(y) = a gilt und f (y) ≤ h(y) ≤ g(y) für alle
y ∈ Dx , dann existiert auch limy→x h(y) und ist ebenfalls gleich a.
Beweis: Sei (xn )n≥1 eine beliebige Folge in Dx mit limn→∞ xn = x. Wegen Satz 2.1 gilt
limn→∞ f (xn ) = a und limn→∞ g(xn ) = a. Weiters folgt f (xn ) ≤ h(xn ) ≤ g(xn ) für alle
n ≥ 1 aus den Voraussetzungen. Nach Satz 1.7 haben wir dann auch limn→∞ h(xn ) = a.
Wegen Satz 2.1 ist damit limy→x h(y) = a gezeigt.
Franz Hofbauer
25
2. Die Ableitung
Die Ableitung einer Funktion im Punkt x ist der Anstieg der Tangente an den Graphen
von f im Punkt x, wenn diese existiert. Wir erhalten diesen Anstieg als Grenzwert der
Anstiege von Sekanten. Sei D ein offenes Intervall, auf dem f definiert ist, und sei x ∈ D.
Ist y ebenfalls in D und ungleich x, so erhält man den Anstieg der Sekante, die den
Punkt mit Koordinaten y und f (y) und den mit Koordinaten x und f (x) verbindet, als
(x)
den Quotienten f (y)−f
. Läßt man jetzt y gegen x wandern, dann wird die Sekante zur
y−x
Tangente im Punkt x. Der Grenzwert des Anstiegs der Sekante wird zum Anstieg der
(x)
Tangente, also zur Ableitung der Funktion im Punkt x. Da die Funktion y 7→ f (y)−f
y−x
für alle y ∈ Dx definiert ist, kann man die Grenzwertdefinition aus dem letzten Kapitel
anwenden.
Definition: Sei f auf dem offenen Intervall D definiert und x ∈ D. Existiert der Grenz(x)
wert limy→x f (y)−f
, dann sagt man, die Funktion f ist im Punkt x differenzierbar und
y−x
nennt diesen Grenzwert die Ableitung f ′ (x) der Funktion f im Punkt x.
Manchmal ersetzt man in dieser Definition der Ableitung y durch x + h. Dann ist y → x
(x)
äquivalent zu h → 0. Daher kann man auch f ′ (x) = limh→0 f (x+h)−f
schreiben.
h
Beispiel: Wir berechnen die Ableitungen der Funktionen f (x) = xm mit m ∈ Z. Für
(x)
m = 0 ist f eine konstante Funktion. Für konstante Funktionen f gilt f (y)−f
= 0 für
y−x
′
alle x und y, also auch f (x) = 0 für alle x.
Sei k ∈ N. Die Funktion f (x) = xk ist auf D = R definiert. Wir berechnen die Ableitung
von f im Punkt x. Sei g(y) = y k−1 + y k−2 x + y k−3 x2 + · · · + yxk−2 + xk−1 . Für y ̸= x
k
k
−xk
−xk
gilt y y−x
= g(y). Da g im Punkt x stetig ist, folgt limy→x y y−x
= g(x) = kxk−1 . Damit
ist f ′ (x) = kxk−1 berechnet.
Sei k ∈ N. Die Funktion f (x) = x−k ist auf D = R \ {0} definiert. Wir berechnen
die Ableitung von f im Punkt x ̸= 0. Sind x und y in D und ist x ̸= y, dann gilt
k
k
f (y)−f (x)
1 y −x
=
−
k
k
y−x
y−x . Mit Hilfe des obigen Resultats und der Rechenregeln aus Satz 2.2
x y
folgt limy→x
f (y)−f (x)
y−x
= limy→x − xk1yk limy→x
y k −xk
y−x
= − x12k kxk−1 = −kx−k−1 .
Man kann diese Ergebnisse so zusammenfassen. Für m ∈ Z hat f (x) = xm die Ableitung
f ′ (x) = mxm−1 für alle x ∈ D, wobei der Definitionsbereich D gleich R ist für m ≥ 0 und
gleich R \ {0} für m < 0.
Um mit Ableitungen arbeiten zu können, braucht man entsprechende Rechenregeln.
Zuvor klären wir noch den Zusammenhang zwischen Stetigkeit und Differenzierbarkeit.
Satz 2.4: Sei f auf dem offenen Intervall D definiert und x ∈ D. Wenn f im Punkt x
differenzierbar ist, dann ist f im Punkt x auch stetig.
(x)
Beweis: Es existiert ein α > 0, sodass | f (y)−f
−f ′ (x)| < 1 für alle y ∈ (x−α, x+α)∩Dx
y−x
gilt, da f im Punkt x differenzierbar ist. Sei c = |f ′ (x)| + 1. Mit Hilfe der Dreiecksun(x)
gleichung folgt | f (y)−f
| < 1 + |f ′ (x)| = c für alle y ∈ (x − α, x + α) ∩ Dx . Somit gilt
y−x
|f (y) − f (x)| ≤ c|y − x| für alle y ∈ (x − α, x + α) ∩ D. Ist ε > 0 vorgegeben, so wählen
wir δ = min(α, εc ). Für alle y ∈ (x − δ, x + δ) ∩ D gilt dann |f (y) − f (x)| ≤ c|y − x| < ε.
Damit ist die Stetigkeit von f im Punkt x gezeigt.
26
Differenzierbarkeit
Satz 2.5 (Rechenregeln für die Ableitung) Seien f und g auf einem offenen Intervall D
definiert und x ∈ D. Seien c und d in R. Dann gilt:
(a) Linearität: Wenn f ′ (x) und g ′ (x) existieren, dann ist auch die Funktion cf + dg im
Punkt x differenzierbar und es gilt (cf + dg)′ (x) = cf ′ (x) + dg ′ (x).
(b) Produktregel: Wenn f ′ (x) und g ′ (x) existieren, dann ist auch die Funktion f g im
Punkt x differenzierbar und es gilt (f g)′ (x) = f (x)g ′ (x) + f ′ (x)g(x).
(c) Quotientenregel: Wenn f ′ (x) und g ′ (x) existieren und g(y) ̸= 0 ist für y ∈ D, dann ist
1
auch die Funktion fg im Punkt x differenzierbar und es gilt ( fg )′ (x) = f ′ (x) g(x)
−g ′ (x) gf2(x)
(x) .
Beweis: Um (a) zu beweisen, gehen wir von folgender Gleichung aus
f (y) − f (x)
g(y) − g(x)
(cf + dg)(y) − (cf + dg)(x)
=c
+d
y−x
y−x
y−x
′
′
Da f (x) und g (x) existieren, existiert wegen Satz 2.2 auch der Grenzwert der rechten
Seite dieser Gleichung für y → x und ist gleich cf ′ (x) + dg ′ (x). Daher existiert auch der
Grenzwert der linken Seite und ist ebenfalls gleich cf ′ (x) + dg ′ (x), womit (a) gezeigt ist.
Um (b) zu zeigen, gehen wir von folgender Gleichung aus
f (y)g(y) − f (x)g(x)
g(y) − g(x) f (y) − f (x)
= f (y)
+
g(x)
y−x
y−x
y−x
Nach Satz 2.4 ist f im Punkt x stetig, da f ′ (x) existiert. Also gilt limy→x f (y) = f (x). Da
auch g ′ (x) existiert, existiert wegen Satz 2.2 der Grenzwert der rechten Seite dieser Gleichung für y → x und ist gleich f (x)g ′ (x) + f ′ (x)g(x). Daher existiert auch der Grenzwert
der linken Seite und ist ebenfalls f (x)g ′ (x) + f ′ (x)g(x), womit (b) gezeigt ist.
Um (c) zu zeigen, gehen wir von folgender Gleichung aus
f (y)/g(y) − f (x)/g(x)
f (y) − f (x) 1
g(y) − g(x) f (x)
=
−
y−x
y−x
g(y)
y−x
g(x)g(y)
′
Nach Satz 2.4 ist g in x stetig, da g (x) existiert. Es folgt limy→x g(y) = g(x). Da auch
f ′ (x) existiert und g(x) ̸= 0 gilt, existiert wegen Satz 2.2 der Grenzwert der rechten Seite
1
dieser Gleichung für y → x und ist gleich f ′ (x) g(x)
− g ′ (x) gf2(x)
(x) . Daher existiert auch der
1
− g ′ (x) gf2(x)
Grenzwert der linken Seite und ist ebenfalls f ′ (x) g(x)
(x) . Das beweist (c).
Satz 2.6 (Kettenregel) Sei f auf einem offenen Intervall D definiert und x ∈ D. Sei g auf
einem offenen Intervall definiert, das f (D) enthält. Wenn g ′ (f (x)) und f ′ (x) existieren,
dann existiert auch (g ◦ f )′ (x) und es gilt (g ◦ f )′ (x) = g ′ (f (x))f ′ (x).
(x)
(x)) f (y)−f (x)
Beweis: Es gilt limy→x g◦f (y)−g◦f
= limy→x g(ff(y))−g(f
= g ′ (f (x))f ′ (x),
y−x
(y)−f (x)
y−x
da mit y → x auch f (y) gegen f (x) geht (nach Satz 2.4 ist f ja im Punkt x stetig). Damit
ist die Kettenregel bereits gezeigt. Allerdings hat dieser Beweis den Schönheitsfehler, dass
man nicht weiß, ob f (y) − f (x) ungleich 0 ist. Wir gehen daher folgendermaßen vor.
Sei φ(t) =
g(t)−g(f (x))
t−f (x)
für t ̸= f (x) und φ(t) = g ′ (f (x)) für t = f (x). Dann gilt
g ◦ f (y) − g ◦ f (x)
f (y) − f (x)
= φ(f (y))
y−x
y−x
Die Funktion φ ist im Punkt f (x) stetig, da die Existenz von g ′ (f (x)) vorausgesetzt wird
(x))
= g ′ (f (x)) = φ(f (x)) gilt. Da f ′ (x) existiert und somit f
und daher limt→f (x) g(t)−g(f
t−f (x)
im Punkt x stetig ist, folgt die Stetigkeit von φ ◦ f im Punkt x aus Satz 1.11, und daraus
wieder limy→x φ(f (y)) = φ(f (x)) = g ′ (f (x)). Der Grenzwert der rechten Seite in obiger
Franz Hofbauer
27
Gleichung für y → x ist daher gleich g ′ (f (x))f ′ (x). Also existiert auch der Grenzwert der
linken Seite und ist ebenfalls gleich g ′ (f (x))f ′ (x), das heißt (g ◦ f )′ (x) = g ′ (f (x))f ′ (x).
Mit Hilfe dieser Rechenregeln ist es leicht, die Ableitung vieler Funktionen zu berechnen.
Für f (x) = xk haben wir f ′ (x) = kxk−1 oben berechnet. Mit Hilfe von Satz 2.5 (a)
erhalten wir die Ableitung eines Polynoms. Für g(x) = cn xn + cn−1 xn−1 + · · · + c1 x + c0
gilt g ′ (x) = cn nxn−1 + cn−1 (n − 1)xn−2 + · · · + c1 . Mit Hilfe von Satz 2.5 (c) lassen sich
dann rationale Funktionen differenzieren. Weitere Ableitungen findet man mit Hilfe des
folgenden Satzes über die Ableitung der Umkehrfunktion.
Satz 2.7: Sei I ⊆ R ein offenes Intervall und f : I → R differenzierbar und streng monoton
wachsend (fallend). Sei J = f (I) und g : J → I die Umkehrfunktion von f . Ist x ∈ J und
1
f ′ (g(x)) ̸= 0, dann existiert g ′ (x) und es gilt g ′ (x) = f ′ (g(x))
.
Beweis: Nach Satz 2.4 ist f stetig, sodass die Umkehrfunktion wegen Satz 1.14 existiert.
Es gilt f (g(x)) = x und f (g(y)) = y für alle x und y in J. Es folgt
1
g(y) − g(x)
= f (g(y))−f (g(x))
y−x
g(y)−g(x)
für y ̸= x, da g nach Satz 1.14 streng monoton und g(y) − g(x) somit ungleich 0 ist. Nach
Satz 1.14 ist g auch stetig, sodass mit y → x auch g(y) gegen g(x) geht. Da die Existenz
(g(x))
= f ′ (g(x)). Wegen
von f ′ (g(x)) vorausgesetzt wird, erhalten wir limy→x f (g(y))−f
g(y)−g(x)
f ′ (g(x)) =
̸ 0 folgt limy→x g(y)−g(x)
=
y−x
1
existiert g ′ (x) und ist gleich f ′ (g(x))
.
1
f ′ (g(x))
aus obiger Gleichung und Satz 2.2. Somit
√
Beispiel: Sei n ∈ N. Die Wurzelfunktion g(x) = n x mit Definitionsbereich D = (0, ∞)
ist die Umkehrfunktion der Funktion f (x) = xn , die ebenfalls Definitionsbereich D hat.
1
1
= n1 x n −1 für x ∈ D aus
Da f ′ (x) = nxn−1 ̸= 0 für x ∈ D gilt, folgt g ′ (x) = n( √
n
x)n−1
Satz 2.7. Nun können wir auch die Potenzfunktion h(x) = xq mit Definitionsbereich D
differenzieren, wobei q = m
m ∈ Z und n ∈ N. Wegen h(x) = (g(x))m folgt aus
n ist mit
√
1
1
1
q− n
x n −1 = qxq−1 für x ∈ D gilt.
der Kettenregel, dass h′ (x) = m( n x)m−1 n1 x n −1 = m
nx
3. Monotonieverhalten von Funktionen
Eine Funktion kann auf gewissen Abschnitten ihres Definitionsbereichs monoton wachsend sein und auf anderen monoton fallend. Dieses Monotonieverhalten kann man mit Hilfe
der Ableitung untersuchen. Der Satz, den man dafür benötigt, ist der Mittelwertsatz, zu
dessen Beweis man ein Resultat über Extremwerte von stetigen Funktionen braucht. Ein
Extremwert kann ein Maximum sein, das ist der größte Wert, den die Funktion annimmt,
oder ein Minimum, das ist der kleinste Wert, den die Funktion annimmt. Diese Bezeichnungsweise ist analog zum Maximmum und Minimum von endlich vielen reellen Zahlen,
wo Maximum und Minimum die größte und die kleinste dieser Zahlen bezeichnen.
Satz 2.8: Seien a und b in R mit a < b. Jede stetige Funktion f : [a, b] → R ist beschränkt
und nimmt ihr Maximum und ihr Minimum an, das heißt es gibt ein x0 ∈ [a, b], sodass
f (x) ≤ f (x0 ) für alle x ∈ [a, b] gilt, und ein x1 ∈ [a, b], sodass f (x) ≥ f (x1 ) für alle
x ∈ [a, b] gilt.
Dieser Satz wird später bewiesen. Zum Beweis des Mittelwertsatzes brauchen wir noch
einen weiteren Satz über die Ableitung einer Funktion in einem Extremwert.
28
Differenzierbarkeit
Satz 2.9: Sei a < b. Wenn f : (a, b) → R differenzierbar ist mit einem Extremwert in
x ∈ (a, b), dann gilt f ′ (x) = 0.
Beweis: Der Extremwert in x sei ein Maximum. Dann gilt f (y) ≤ f (x) für alle y in (a, b).
(x)
Ist φ(y) = f (y)−f
, dann gilt φ(y) ≥ 0 für y ∈ (a, x) und φ(y) ≤ 0 für y ∈ (x, b). Da die
y−x
′
Existenz von f (x) vorausgesetzt wird, gilt auch limy→x φ(y) = f ′ (x).
Sei α = x−a
und xn = x − α
2
n für n ≥ 1. Dann ist (xn )n≥1 eine Folge im Intervall (a, x)
mit limn→∞ xn = x und φ(xn ) ≥ 0. Wegen Satz 2.1 gilt limn→∞ φ(xn ) = f ′ (x), woraus
f ′ (x) ≥ 0 wegen Satz 1.6 (a) folgt.
β
Sei β = b−x
2 und yn = x + n für n ≥ 1. Dann ist (yn )n≥1 eine Folge im Intervall (x, b)
mit limn→∞ yn = x und φ(yn ) ≤ 0. Wegen Satz 2.1 gilt limn→∞ φ(yn ) = f ′ (x), woraus
f ′ (x) ≤ 0 wegen Satz 1.6 (a) folgt. Somit ist f ′ (x) = 0 gezeigt.
Der Beweis für ein Minimum verläuft analog.
Satz 2.10 (Mittelwertsatz) Sei f : [a, b] → R stetig und auf dem offenen Intervall (a, b)
(a)
differenzierbar. Dann gibt es ein c ∈ (a, b) mit f ′ (c) = f (b)−f
.
b−a
Beweis: Wir nehmen zuerst f (a) = f (b) = 0 an und zeigen, dass f ′ (c) = 0 für ein
c ∈ (a, b) gilt. Ist f (x) = 0 für alle x dann auch f ′ (x) = 0 für alle x und man kann jedes
x ∈ (a, b) als c wählen. Ansonsten liegt entweder ein Punkt, in dem das Maximum, oder
ein Punkt, in dem das Minimum angenommen wird (Maximum und Minimum existieren
nach Satz 2.8), in (a, b). Sei also c ∈ (a, b) ein Punkt, in dem f einen Extremwert hat.
Nach Satz 2.9 gilt f ′ (c) = 0.
(a)
Um den allgemeinen Fall zu behandeln, sei g(x) = f (x) − f (a) − (x − a) f (b)−f
. Dann
b−a
ist g : [a, b] → R stetig und in (a, b) differenzierbar. Es gilt g(a) = g(b) = 0. Nach
dem bereits bewiesenen Spezialfall gibt es ein c ∈ (a, b) mit g ′ (c) = 0. Das aber heißt
(a)
= 0, was zu zeigen war.
f ′ (c) − f (b)−f
b−a
Man kann den Mittelwertsatz auch geometrisch interpretieren. Verbindet man
den Punkt mit Koordinaten a und f (a)
und den Punkt mit Koordinaten b und
(a)
f (b) durch eine Gerade, so ist f (b)−f
b−a
ihr Anstieg. Der Mittelwertsatz besagt
dann, dass es zwischen den Punkten a
und b einen Punkt c gibt, sodass die Tangente im Punkt mit Koordinaten c und
f (c) an den Graph von f parallel zu dieser
Gerade (Sehne) liegt. Die nebenstehende
Zeichnung zeigt ein Beispiel, wo es nicht
c2
a c1
nur einen solchen Punkt c, sondern zwei
b
solche Punkte c1 und c2 gibt.
Der Zusammenhang zwischen dem Monotonieverhalten einer Funktion und ihrer Ableitung ist offensichtlich. Dort, wo die Funktion monoton wachsend ist, hat die Tangente
einen positiven Anstieg, sodass die Ableitung positiv ist. Dort, wo die Funktion monoton
fallend ist, hat die Tangente einen negativen Anstieg, sodass die Ableitung negativ ist.
Der Mittelwertsatz ermöglicht einen Beweis dieser Aussagen.
Franz Hofbauer
29
Satz 2.11: Sei f : [a, b] → R stetig und in (a, b) differenzierbar.
(a) Wenn f ′ (x) = 0 für alle x ∈ (a, b) gilt, dann ist f konstant.
(b) Wenn f ′ (x) ≥ 0 für alle x ∈ (a, b) gilt, dann ist f monoton wachsend.
(c) Wenn f ′ (x) > 0 für alle x ∈ (a, b) gilt, dann ist f streng monoton wachsend.
(d) Wenn f ′ (x) ≤ 0 für alle x ∈ (a, b) gilt, dann ist f monoton fallend.
(e) Wenn f ′ (x) < 0 für alle x ∈ (a, b) gilt, dann ist f streng monoton fallend.
Beweis: Seien u und v beliebig in [a, b] mit u < v. Nach dem Mittelwertsatz gibt es ein
c ∈ (u, v) ⊆ (a, b) mit f (v) − f (u) = (v − u)f ′ (c). Damit kann man jetzt die einzelnen
Fälle behandeln. Im ersten Fall ist f ′ (c) = 0, also f (v) = f (u) für alle u und v in [a, b]
und daher ist f konstant. Im zweiten Fall ist f ′ (c) ≥ 0, also f (v) ≥ f (u), und daher ist f
monoton wachsend. Im dritten Fall ist f ′ (c) > 0, also f (v) > f (u), und daher ist f streng
monoton wachsend. Ebenso lassen sich die anderen Fälle behandeln.
Beispiel: Sei f (x) =
x
1+x2
mit Definitionsbereich D = R. Es soll das Monotonieverhalten
−x·2x
1−x
von f bestimmt werden. Wir berechnen f ′ (x) = 1+x
= (1+x
2 )2 mit Hilfe der Quo(1+x2 )2
tientenregel. Da (1 + x2 )2 > 0 für alle x gilt, hat f ′ (x) dasselbe Vorzeichen wie 1 − x2 .
Somit gilt f ′ (x) < 0 für x ∈ (−∞, −1) und x ∈ (1, ∞) und f ′ (x) > 0 für x ∈ (−1, 1).
Daher ist f auf dem Intervall (−∞, −1) streng monoton fallend, auf dem Intervall (−1, 1)
streng monoton wachsend, und auf dem Intervall (1, ∞) wieder streng monoton fallend. Da
die x-Achse eine Asymptote ist (der Grad des Zählerpolynoms ist kleiner als der Grad des
Nennerpolynoms), hat man bereits eine gute Vorstellung, wie der Graph von f aussieht.
√
Beispiel: Sei f (x) = 41 x2 − x2 + 3 mit Definitionsbereich D = R. Wir erhalten f ′ (x) =
√
1
′
√ x
√x
x−
.
Um
das
Vorzeichen
zu
bestimmen,
schreiben
wir
f
(x)
=
(
x2 + 3−2)
2
2
2
x +3
2 x +3
als Produkt. Der erste Faktor ist genau dann positiv, wenn x ∈ (0, ∞) ist. Der zweite
Faktor ist genau dann positiv, wenn x2 > 1 ist, also x ∈ (−∞, −1) ∪ (1, ∞) gilt. Daraus
folgt dann, dass f ′ > 0 auf den Intervallen (−1, 0) und (1, ∞) und f ′ < 0 auf den Intervallen
(−∞, −1) und (0, 1) gilt. Auf (−∞, −1) ist daher f streng monoton fallend, auf (−1, 0)
streng monoton wachsend, auf (0, 1) wieder streng monoton fallend und schließlich auf
(1, ∞) wieder streng monoton wachsend.
2
2
Sei D ein Intervall und f : D → R eine Funktion. Für a und b in D sei ℓa,b (x) =
− a) + f (a) die Gerade (Sehne) durch die Punkte (a, f (a)) und (b, f (b)). Die
Funktion f heißt konvex, wenn f (x) ≤ ℓa,b (x) für alle a und b in D und x ∈ (a, b) gilt, das
heißt die Sehne liegt immer oberhalb der Funktion. Die Funktion f heißt konkav, wenn
f (x) ≥ ℓa,b (x) für alle a und b in D und x ∈ (a, b) gilt, das heißt die Sehne liegt immer
unterhalb der Funktion.
f (b)−f (a)
(x
b−a
Satz 2.12: Sei D ein offenes Intervall und f : D → R eine zweimal differenzierbare
Funktion. Wenn f ′′ (y) ≤ 0 für alle y ∈ D gilt, dann ist f konkav. Wenn f ′′ (y) ≥ 0 für alle
y ∈ D gilt, dann ist f konvex.
Beweis: Für a, b ∈ D und a < x < b folgt ℓa,b (x)−f (x) =
=
(x−a)(b−x)f ′ (y2 )−(b−x)(x−a)f ′ (y1 )
b−a
(x−a)(f (b)−f (x))−(b−x)(f (x)−f (a))
b−a
mit Hilfe von Satz 2.10, wobei a < y1 < x < y2 < b gilt.
′′
2 −y1 )f (y)
, wobei
Nochmaliges Anwenden von Satz 2.10 ergibt ℓa,b (x) − f (x) = (x−a)(b−x)(y
b−a
′′
y1 < y < y2 gilt. Ist f (y) ≤ 0 für alle y ∈ D, dann ist ℓa,b (x) − f (x) ≤ 0 gezeigt, das
heißt f ist konkav. Ist f ′′ (y) ≥ 0 für alle y ∈ D, dann ist ℓa,b (x) − f (x) ≥ 0 gezeigt, das
heißt f ist konvex.
30
Differenzierbarkeit
4. Extremwerte
Eine Anwendung der Untersuchungen über das Monotonieverhalten von Funktionen im
letzten Kapitel ist die Berechnung von lokalen Extremwerten von differenzierbaren Funktionen. Man sagt, dass die Funktion f im Punkt x ein lokales Minimum hat, wenn ein
ε > 0 existiert, sodass f (y) > f (x) für alle y ∈ (x − ε, x + ε) \ {x} gilt. Analog spricht man
von einem lokalen Maximum im Punkt x, wenn ein ε > 0 existiert, sodass f (y) < f (x) für
alle y ∈ (x − ε, x + ε) \ {x} gilt. Oft verwendet man folgenden Satz.
Satz 2.13: Sei f : (a, b) → R zweimal differenzierbar und x ∈ (a, b). Wenn f ′ (x) = 0 und
f ′′ (x) > 0, dann hat f im Punkte x ein lokales Minimum. Wenn f ′ (x) = 0 und f ′′ (x) < 0,
dann hat f im Punkte x ein lokales Maximum.
Beweis: Wir behandeln nur den Fall f ′′ (x) > 0. Sei α ∈ (0, f ′′ (x)). Wegen f ′′ (x) =
′
′
′
′
(x)
(x)
limy→x f (y)−f
existiert ein ε > 0 mit f (y)−f
≥ α, wenn y ∈ (x − ε, x + ε) \ {x}.
y−x
y−x
Wegen f ′ (x) = 0 haben wir also
f ′ (y)
y−x
≥ α > 0 für y ∈ (x − ε, x + ε) \ {x}.
Für y ∈ (x − ε, x) gilt y − x < 0 und daher auch f ′ (y) < 0. Für y ∈ (x, x + ε) gilt
y − x > 0 und daher auch f ′ (y) > 0. Daher ist f streng monoton fallend auf (x − ε, x)
und streng monoton wachsend auf (x, x + ε), womit gezeigt ist, dass f (y) > f (x) für alle
y ∈ (x − ε, x + ε) \ {x} gilt, also f ein lokales Minimum in x hat.
Um festzustellen, ob eine Funktion in einer Nullstelle ihrer Ableitung ein Maximum oder
ein Minimum hat, ist es nicht notwendig, die zweite Ableitung auszurechnen. Man kann
auch das Vorzeichen der Ableitung in den Intervallen zwischen den berechneten Nullstellen
der Ableitung bestimmen. Dann weiß man, auf welchen dieser Intervalle die Funktion
wächst und auf welchen sie fällt, und erkennt so, wo sie ein lokales Maximum und wo sie
ein lokales Minimum hat.
Beispiel: Wir zeigen, dass unter allen Rechtecken mit gegebener Diagonale das Quadrat
die größte Fläche hat. Sei d√die gegebene Länge der Diagonale. Ist x√
die eine Rechteckseite,
2
2
dann ist die andere gleich d − x√. Die Fläche des Rechtecks ist x d2 − x2 . Anstatt das
Maximum der Funktion f (x) = x d2 − x2 zu suchen, berechnen wir es für die Funktion
g(x) = f (x)2 = x2 (d2 − x2 ), da g und f ihr Maximum im selben Punkt annehmen.
Wir
√
′
2
3
erhalten√g (x) = 2d x−4x . Die Nullstellen dieser Ableitung sind x1 = −d/ 2,√x2 = 0 und
x3 = √
d/ 2. Wegen g ′ (x) = −2x(2x2 −d2 ) ist g ′ negativ auf den Intervallen (d/ 2, ∞) und
(−d/ 2, 0). Daher ist g dort streng
monoton√fallend. Ebenso sieht man, dass g ′ positiv
√
auf den Intervallen (−∞, −d/ 2) und (0, d/ 2) ist. Daher ist g dort streng monoton
√
wachsend.
Aus
diesem
Verhalten
sieht
man,
dass
g
lokale
Maxima
in
den
Punkten
d/
2
√
und −d/ 2 hat und ein lokales Minimum im Punkt 0. Natürlich sind
nur
Seitenlängen
√
x ∈ [0, d] sinnvoll. Wir haben√eine maximale Fläche, wenn x = d/ 2 ist. Die andere
Rechteckseite ist dann auch d/ 2, sodass ein Quadrat vorliegt.
Beispiel: Wir berechnen den kleinsten Abstand des Punktes (12, 15
2 ) von der Parabel
2
y = x . Das Quadrat des Abstandes dieses Punkts zu einem Punkt auf der Parabel ist
801
2
4
2
f (x) = (x − 12)2 + (x2 − 15
2 ) = x − 14x − 24x + 4 . Wir suchen lokale Minima und
Maxima dieser Funktion. Es gilt f ′ (x) = 4(x3 − 7x − 6). Die Nullstellen dieser Ableitung
sind x1 = 3, x2 = −1 und x3 = −2. Wir haben also f ′ (x) = 4(x − 3)(x + 1)(x + 2). Auf
den Intervallen (−2, −1) und (3, ∞) ist f ′ positiv und f daher streng monoton wachsend.
Auf den Intervallen (−∞, −2) und (−1, 3) ist f ′ negativ und f daher streng monoton
Franz Hofbauer
31
fallend. Lokale Minima haben wir für x1 = 3 und x3 = −2.
Für x2 = −1 liegt ein lokales
√
333
Maximum vor. Der Abstand zum Punkt (3, 9) beträgt 2 . Der Abstand zum Punkt
√
(−2, 4) beträgt 449
2 . Daher hat der Punkt (3, 9) den kleinsten Abstand. Wandert man
von diesem Punkt aus die Parabel entlang zum Punkt (−1, 1), so wird der Abstand immer
größer. Hat man den Punkt (−1, 1) überschritten, dann wird der Abstand wieder kleiner,
bis man den Punkt (−2, 4) erreicht. Nach Überschreiten dieses Punktes vergrößert sich
der Abstand wieder.
5. Gleichungen und Ungleichungen
Man kann die Methoden aus dem letzten Kapitel zum Beweis von Gleichungen und
Ungleichungen verwenden. Beweist man, dass die Funktion f konstant ist, dann hat man
die Gleichung f (x) = c für ein c ∈ R bewiesen. Beweist man, dass die Funktion f
das Minimum c annimmt, dann hat man die Ungleichung f (x) ≥ c bewiesen. Als erste
Anwendung dieser Methode wollen wir den sogenannten
binomischen Lehrsatz behandeln.
( n)
n!
Dazu benötigen wir die Binomialkoeffizienten k = k!(n−k)! .
( ) ( )
( )
( )
Satz 2.14 (Binomischer Lehrsatz) Es gilt (1 + x)n = n0 + n1 x + n2 x2 + · · · + nn xn für
alle x ∈ R und n ∈ N.
∑n ( )
Beweis: Dazu sei fn (x) = (1 + x)n − k=0 nk xk . Um den Satz zu beweisen, zeigen
wir, dass fn (x) = 0( für
) alle
(1) x ∈ R und n ∈ N gilt. Wir beginnen mit n = 1. Es gilt
1
f1 (x) = (1 + x) − 0 − 1 x = 0. Für n = 1 ist die Aussage also richtig. Bevor wir
( )
(
)
(n−1)!
n!
größere n behandeln, berechnen wir k nk = k k!(n−k)!
= n (k−1)!(n−k)!
= n n−1
k−1 und damit
( )
(
) k−1
∑n
∑n
fn′ (x) = n(1 + x)n−1 − k=0 k nk xk−1 = n(1 + x)n−1 − k=1 n n−1
= nfn−1 (x).
k−1 x
′
Ist fn−1 (x) = 0 für alle x gezeigt, dann folgt wegen
( ) fn (x) = nfn−1 (x) = 0, dass fn eine
konstante Funktion ist, und wegen fn (0) = 1n − n0 = 0 folgt fn (x) = 0 für alle x. Damit
ist die gesuchte Gleichung für alle n durch Induktion bewiesen.
Mit Hilfe von Satz 2.14 können wir folgende Grenzwerte bestimmen.
Satz 2.15: Es
existieren folgende Grenzwerte
√
n
(a) limn→∞ √
x = 1 für alle x > 0
(b) limn→∞ n n = 1.
m
(c) limn→∞ nxn = 0 für alle m ∈ N und alle x > 1
√
Beweis: Um (a) zu zeigen, sei x ≥ 1. Wegen Satz 1.16 gilt n x ≥ 1. Läßt man auf der
rechten Seite des binomischen Lehrsatzes alle Summanden außer dem zweiten
weg, so folgt
√
n
(1 + y)n ≥ ny für
n
≥
1
und
y
≥
0.
Setzt
man
in
diese
Ungleichung
y
=
x
− 1 ≥ 0 ein,
√
√
x
x
n
n
so erhält man x ≤ 1 + n . Wir haben also 1 ≤ x ≤ 1 + n für n ≥ 1. Mit Hilfe von
√
Satz 1.7 folgt daraus limn→∞ n x = 1. Sei jetzt x ∈ (0, 1). Für y = x1 gilt y > 1, sodass wir
√ √
√
√
1
limn→∞ n y = 1 schon gezeigt haben. Aus Satz 1.18 (a) folgt n x n y = 1, also n x = √
n y.
√
Mit Hilfe von Satz 1.6 (d) erhalten wir limn→∞ n x = 1. Damit ist (a) erledigt.
Wir zeigen (b). Läßt man auf der rechten Seite des
Lehrsatzes alle Summan(n)binomischen
n
2
den außer dem dritten weg, so folgt (1 + x) ≥ 2 x für n ≥ 2 und x ≥ 0. Indem man
√
√
√
n
n − 1 für x einsetzt, folgt wie oben, dass 1 ≤ n n ≤ 1√
+ 2/(n − 1) für n ≥ 2 gilt. Da
die Wurzelfunktion im Punkt 0 stetig ist, gilt lim√
2/(n − 1) = 0 wegen Satz 1.9.
n→∞
n
Mit Hilfe von Satz 1.7 erhalten wir dann limn→∞ n = 1.
32
Differenzierbarkeit
m
n
Um (c) zu zeigen, überlegen wir uns zuerst, dass limn→∞ n(n−1)...(n−m)
= 0 gilt. Das
1
n
n
folgt wegen limn→∞ n = 0, limn→∞ n−1 = 1, . . . , limn→∞ n−m = 1, indem man das
Produkt dieser Folgen bildet. Läßt man auf der rechten Seite des
Lehrsatzes
(n) binomischen
n
k
alle Summanden außer dem k + 1-ten weg, so folgt (1 + y)( ≥ ) k y für n ≥ k und y ≥ 0.
n
(x − 1)m+1 für n ≥ m + 1
Setzt man y = x − 1 und k = m + 1, so ergibt sich xn ≥ m+1
und daraus 0 ≤
nm
xn
≤
(m+1)!
nm
n(n−1)...(n−m) (x−1)m+1 .
Wendet man Satz 1.7 an, so folgt (c).
Die folgenden beiden Ungleichung brauchen wir, wenn wir die Exponentialfunktion und
den Logarithmus behandeln.
Satz 2.16: Für x ∈ R und n ∈ N mit n > −x gilt (1 + nx )n ≤ (1 +
x n+1
.
n+1 )
x n+1
Beweis: Wir untersuchen f (x) = (1 + n+1
)
/(1 + nx )n auf dem Intervall (−n, ∞).
x
x n
Es gilt f ′ (x) = n(n+1)
(1 + n+1
) (1 + nx )−n−1 , das ist ≥ 0 für x ∈ (0, ∞) und ≤ 0 für
x ∈ (−n, 0), sodass f auf [0, ∞) monoton wachsend und auf (−n, 0] monoton fallend ist.
x n+1
Wegen f (0) = 1 folgt f (x) ≥ 1, das heißt (1 + nx )n ≤ (1 + n+1
)
für x ∈ (−n, ∞).
√
√
Satz 2.17: Es gilt (n + 1)( n+1 x − 1) ≤ n( n x − 1) für alle n ∈ N und für x > 0.
√
√
Beweis: Sei f (x) = n( n x − 1) − (n + 1)( n+1 x − 1) mit Definitionsbereich D = (0, ∞).
1
1
1
1
1
Wir berechnen die Ableitung f ′ (x) = n n1 x n −1 − (n + 1) n+1
x n+1 −1 = x n −1 − x n+1 −1 .
1
Wegen n1 − 1 > n+1
− 1 erhalten wir f ′ (x) < 0 für x ∈ (0, 1) und f ′ (x) > 0 für x ∈ (1, ∞).
Wegen Satz 2.11 ist f auf (0, 1) monoton fallend und auf (1, ∞) monoton wachsend. Es
gilt also f (x) ≥ f (1) für alle x > 0. Wegen f (1) = 0 ist das die gesuchte Ungleichung.
Wir beweisen noch eine Verallgemeinerung der Cauchy-Schwarzschen Ungleichung.
p
Satz 2.18: Sei p > 1 und q = p−1
. Seien ai und bi für 1 ≤ i ≤ n reelle Zahlen. Dann gilt
√∑n
√∑n
∑n
∑n
q
die Hölder-Ungleichung i=1 ai bi ≤ i=1 |ai bi | ≤ p i=1 |ai |p q
i=1 |bi | .
Beweis: Für 0 < r < 1 sei f (x) = xr − rx − 1 + r mit Definitionsbereich D = (0, ∞).
Es gilt f ′ (x) = rxr−1 − r. Wegen f ′ (x) > 0 für x ∈ (0, 1) und f ′ (x) < 0 für x ∈ (1, ∞)
hat die Funktion f im Punkt 1 ihr Maximum. Es gilt also f (x) ≤ f (1) = 0, das heißt
xr ≤ rx + 1 − r für alle x > 0. Sind u und v in (0, ∞), dann kann man x = uv setzen.
Multiplikation mit v ergibt ur v 1−r ≤ ru+(1−r)v. Diese Ungleichung ist auch noch richtig
für u = 0 oder v = 0 oder beides. Daher ist sie für alle u ≥ 0 und v ≥ 0 gezeigt.
Sind alle ai gleich ∑
0 oder alle bi gleich 0,∑dann ist die zu beweisende Ungleichung erfüllt.
n
n
p
q
Wir setzen U =
=
können annehmen, dass U > 0
i=1 |ai | und V p
i=1 |bi | und
|bi |q
|ai |
und V > 0∑
gilt. Somit sind ui = U und vi = V für 1 ≤ i ≤ n definiert und es gilt
∑
n
n
Setzt man u = ui und v = vi in obiger Ungleichung und summiert
i=1 ui =
i=1 vi = 1.
∑n
∑n
über i so erhält man i=1 uri vi1−r ≤ 1, das heißt i=1 |ai |pr |bi |q(1−r) ≤ U r V 1−r . Setzt
man jetzt r = p1 und beachtet, dass dann 1 − r = 1 − p1 = 1q nach Voraussetzung gilt, so
√ √
∑n
ergibt sich i=1 |ai bi | ≤ p U q V . Das ist bereits die zu beweisende Ungleichung.
6. Trigonometrische Funktionen
Trigonometrische Funktionen spielen eine wichtige Rolle in der Geometrie, zum Beispiel
für Dreiecksberechnungen. Sie sind auch für die Physik wichtig. Sie treten zum Beispiel
bei der Untersuchung von Schwingungen auf.
Franz Hofbauer
33
Der Einheitskreis ist der Kreis mit Mittelpunkt (0, 0) und Radius 1. Um sin und cos
zu definieren, sei x ∈ R. Vom Punkt (1, 0) aus wird die Strecke x auf dem Einheitskreis
gemessen (für x > 0 im Gegenuhrzeigersinn, für x < 0 im Uhrzeigersinn). Die Koordinaten
des so ereichten Punktes nennen wir cos x und sin x. Da man beim Abmessen der Strecken
x und x + 2π den selben Punkt am Einheitskreis erreicht, erhalten wir sin(x + 2π) = sin x
und cos(x + 2π) = cos x. Man sagt, die Funktionen sin und cos haben Periode 2π.
Satz 2.19: Die Funktionen sin und cos haben folgende Eigenschaften
(a) sin2 x + cos2 x = 1
π
3π
(b) sin 0 = sin π = 0, sin π2 = 1, sin 3π
2 = −1, cos 0 = 1, cos π = −1, cos 2 = cos 2 = 0
(c) sin(−x) = − sin x, cos(−x) = cos x
(d) sin(x + π2 ) = cos x, cos(x + π2 ) = − sin x, sin(x + π) = − sin x, cos(x + π) = − cos x
Beweis: Wir erhalten (a), da der Punkt mit den Koordinaten cos x und sin x auf dem
Einheitskreis liegt. Auch (b) folgt sofort aus der Definition, indem man die Koordinaten
der Punkte abliest, die man erhält, wenn man die Strecken 0, π2 , π und 3π
2 am Einheitskreis
aufträgt. Da die Punkte, die man erhält, wenn man die Strecken x und −x am Einheitskreis
(
π )
2)
erhält man,
aufträgt, symmetrisch zur x-Achse liegen, folgt (c). Den Vektor cos(x+
sin(x+ π
)
2
(cos x)
indem man den Vektor sin x um 900 nach links verdreht. Daraus folgen die ersten beiden
(
)
( x)
Gleichungen von (d). Den Vektor cos(x+π)
erhält man, indem man den Vektor cos
sin x um
sin(x+π)
den Koordinatenursprung spiegelt. Daraus folgen die anderen Gleichungen von (d).
Die Tangente an den Einheitskreis im
T
Punkt E = (1, 0) ist parallel zur y-Achse.
Für − π2 < x < π2 hat die Gerade durch
P
den Koordinatenursprung M und durch den
Punkt P = (cos x, sin x) einen Schnittpunkt
mit dieser Tangente, den wir T nennen. Wir
definieren tan x als die y-Koordinate dieses
Schnittpunkts T . Bezeichnet man den Punkt
(cos x, 0) noch mit R, dann sind die Dreiecke
P M R und T M E zueinander ähnlich. Es
gilt |P R| : |RM | = |T E| : |EM |. Das ist
sin x
tan x
x
cos x =
1 . Damit haben wir die Formel
sin x
M
R
E
tan x = cos
x gewonnen.
Um die Ableitungen berechnen zu können, brauchen wir folgende Ungleichungen.
Satz 2.20: Für x ∈ [0, π2 ) gilt sin x ≤ x und x ≤ tan x.
Beweis: Wir verwenden die oben eingeführten Bezeichnungen. Die Fläche des Dreiecks
M EP ist kleiner als die Fläche des Kreissektors zwischen den Radien M E und M P . Die
Grundlinie des Dreicks M EP hat Länge 1 und die zugehörige Höhe ist sin x. Daher ist
1
2 sin x die Fläche des Dreicks M EP . Da der Kreissektor Radius 1 und Bogenlänge x hat,
ist seine Fläche nach Satz 1.19 gleich 12 x. Wir erhalten also 12 sin x ≤ 12 x. Das ergibt die
erste der beiden Ungleichungen.
Die Fläche des Dreiecks M ET ist größer als die Fläche des Kreissektors zwischen den
Radien M E und M P . Die Grundlinie des Dreicks M ET hat Länge 1 und die zugehörige
Höhe ist tan x. Daher ist 12 tan x die Fläche des Dreiecks M ET . Sie ist größer als die
Fläche 21 x des Kreissektors, woraus die zweite der beiden Ungleichungen folgt.
34
Differenzierbarkeit
Satz 2.21 (Summensätze) Für x und y in R gelten die beiden Formeln
(a) sin(x + y) = sin x cos y + cos x sin y
(b) cos(x + y) = cos x cos y − sin x sin y.
Beweis: Misst man vom Punkt (1, 0) aus am Einheitskreis im Gegenuhrzeigersinn die
Strecke x, so kommt man zum Punkt (cos x, sin x). Misst man vom Punkt (1, 0) aus am
Einheitskreis im Uhrzeigersinn die Strecke y, so kommt man zum Punkt (cos y, − sin y).
Die Länge des Bogens zwischen diesen Punkten ist x+y. Der Bogen zwischen den Punkten
(1, 0) und (cos(x + y), sin(x + y)) hat ebenfalls die Länge x + y. Daher ist auch die Strecke
vom Punkt (cos x, sin x) zum Punkt (cos y, − sin y) gleich der Strecke vom Punkt (1, 0)
zum Punkt (cos(x + y), sin(x + y)). Das heißt also
√
√
(cos x − cos y)2 + (sin x + sin y)2 = (1 − cos(x + y))2 + (sin(x + y))2
Man kann die Wurzeln auf beiden Seiten weglassen. Quadriert man aus, so erhält man
cos2 x − 2 cos x cos y + cos2 y + sin2 x + 2 sin x sin y + sin2 y
= 1 − 2 cos(x + y) + cos2 (x + y) + sin2 (x + y)
An drei verschiedenen Stellen kann man die Formel aus Satz 2.19 (a) anwenden, und erhält
1 − 2 cos x cos y + 1 + 2 sin x sin y = 1 − 2 cos(x + y) + 1. Damit sind wir bei der Formel
cos(x + y) = cos x cos y − sin x sin y angelangt und (b) ist gezeigt.
Wir ersetzen in dieser soeben gezeigten Formel y durch y + π2 . Aus Satz 2.19 (d) folgt
cos(x + y + π2 ) = − sin(x + y), cos(y + π2 ) = − sin y und sin(y + π2 ) = cos y. Setzt man das
ein, so erhält man − sin(x + y) = cos x(− sin y) − sin x cos y. Das ist (a).
Jetzt sind wir soweit, um die Ableitungen von sin und cos berechnen zu können.
Satz 2.22: Für x ∈ R gilt sin′ x = cos x und cos′ x = − sin x.
h
Beweis: Wir zeigen zuerst limh→0 sinh h = 1 und limh→0 1−cos
= 0. Für h ∈ (0, π2 ) gilt
h
sin h
sin h
sin h ≤ h und h ≤ tan h = cos
h nach Satz 2.20 und daher auch cos h ≤ h ≤ 1. Setzt
man −h für h ein, so ändert sich weder cos h noch sinh h . Somit gilt cos h ≤ sinh h ≤ 1 für
alle h ∈ (− π2 , π2 ) \ {0}. Weiters gilt limh→0 cos h = 1, wie man aus der Definition des cos
erkennt. Aus Satz 2.3 folgt somit limh→0 sinh h = 1.
2
2
h
1−cos h
sin h
sin h 2
h
Wegen Satz 2.19 (a) gilt 1−cos
= h(1+cos
h
h) = h(1+cos h) = ( h ) 1+cos h . Mit Hilfe von
h
Satz 2.2 und der oben gefundenen Grenzwerte folgt limh→0 1−cos
= 0.
h
′
′
Mit Hilfe der Summensätze kann man jetzt sin x und cos x berechnen. Aus dem Sumx
h
mensatz für den sin folgt sin(x+h)−sin
= − sin x 1−cos
+ cos x sinh h . Läßt man h gegen 0
h
h
gehen, so folgt sin′ x = cos x mit Hilfe obiger Resultate und Satz 2.2.
x
h
Ebenso folgt cos(x+h)−cos
= − cos x 1−cos
− sin x sinh h aus dem Summensatz für den cos
h
h
und daraus cos′ x = − sin x mit h → 0.
Für ein beliebiges Dreieck gelten der Sinus– und der Cosinussatz.
Satz 2.23 (Sinussatz) In einem beliebigem Dreieck mit Fläche F und den üblichen Be2F
zeichnungen gilt abc
= sina α = sinb β = sinc γ .
Beweis: Sei h die Länge der Höhe auf c. Dann gilt 2F = ch. Weiters gilt sin α = hb
(wegen sin(1800 − α) = sin α gilt das auch, wenn die Höhe ausserhalb des Dreiecks liegt).
2F
h
α
2F
2F
Daraus folgt dann abc
= ab
= b sin
= sina α . Analog folgt abc
= sinb β und abc
= sinc γ .
ab
Franz Hofbauer
35
Satz 2.24 (Cosinussatz) In einem Dreieck mit den üblichen Bezeichnungen gilt
a2 = b2 + c2 − 2bc cos α, b2 = a2 + c2 − 2ac cos β und c2 = a2 + b2 − 2ab cos γ.
Beweis: Sei H der Fußpunkt der Höhe auf die Seite c und h deren Länge. Sei p der
Abstand von H zum Eckpunkt A, wenn H rechts von A liegt oder gleich A ist (spitzer
Winkel α), und der mit negativem Vorzeichen versehene Abstand, wenn H links von A
liegt (stumpfer Winkel α). In beiden Fällen gilt dann cos α = pb das heißt p = b cos α. Aus
dem Satz von Pythagoras folgt b2 = h2 + p2 und a2 = h2 + (c − p)2 . Subtraktion ergibt
b2 −a2 = p2 −(c−p)2 = 2pc−c2 . Setzt man für p ein, so erhält man b2 −a2 = 2bc cos α−c2 ,
das heißt a2 = b2 + c2 − 2bc cos α. Die anderen Gleichungen beweist man analog.
Zum Abschluss behandeln wir noch kurz den Tangens und seine Umkehrfunktion. Sei
sin x
D = (− π2 , π2 ). Da cos x > 0 für x ∈ D gilt, ist tan x = cos
x auf D definiert und stetig.
Aus der Quotientenregel folgt
cos2 x + sin2 x
1
tan′ x =
=
= 1 + tan2 x
2
cos x
cos2 x
Wegen tan′ x > 0 für alle x ∈ D ist tan eine streng monoton wachsende Funktion. Wegen
cos π2 = 0 geht tan x gegen ∞, wenn x gegen π2 geht. Ebenso geht tan x gegen −∞,
wenn x gegen − π2 geht. Der Wertebereich {tan x : x ∈ D} ist daher R. Es existiert die
Umkehrfunktion arctan : R → (− π2 , π2 ). Ihre Ableitung ist wegen Satz 2.7
1
1
1
arctan′ x =
=
=
′
2
tan (arctan x)
1 + x2
1 + tan (arctan x)
Es stellt sich heraus, dass die Ableitung des arctan eine rationale Funktion ist. Der arctan
ist ebenfalls streng monoton wachsend.
7. Exponentialfunktion und Logarithmus
Die Exponentialfunktion verwendet man, um Wachstum zu beschreiben. Ein Beispiel
ist die Verzinsung eines Geldbetrags a. Ist x die Zinsrate, so hat man nach einem Jahr
den Betrag a(1 + x). Angenommen, die Zinsen werden nicht erst am Ende des Jahres
gutgeschrieben, sondern in Monatsabständen. Nach einem Monat hat man dann den
x
x
x
Betrag a(1 + 12
), nach zwei Monaten den Betrag a(1 + 12
)(1 + 12
), und nach einem Jahr
x 12
den Betrag a(1 + 12 ) . Teilt man das Jahr in n gleich lange Perioden und nimmt an,
dass die Zinsen jeweils am Ende dieser Perioden gutgeschrieben werden, dann hat man am
Ende des Jahres den Betrag a(1 + nx )n . Würde man diese Perioden immer kleiner machen,
das heißt n gegen ∞ gehen lassen, dann hätte man a u(x) mit u(x) = limn→∞ (1 + nx )n .
Das wäre der Betrag am Ende des Jahres, wenn man kontinuierlich verzinsen würde.
Ein anderes Beispiel ist die Vermehrung von Zellen oder das Wachstum einer Bakterienkolonie. Hier finden die Zellteilungen laufend statt. Man kann dieses Zellenwachstum
als einen kontinuierlichen Prozess auffassen. Ist a die Anzahl der Zellen zu Beginn und
x der relative Anteil der Zellen, die sich während einer Zeiteinheit teilen, dann hat man
a(1 + x) Zellen am Ende eines Zeitintervalls, dessen Länge eine Zeiteinheit ist. Da aber
die Anzahl der Zellen während dieses Zeitintervalls nicht konstant bleibt, kann man diese
Überlegung nur auf sehr kleine Zeitintervalle anwenden. Wir teilen das Einheitszeitintervall in n Intervalle der Länge n1 und erhalten a(1 + nx )n als Anzahl der Zellen nach einer
Zeiteinheit. Im Grenzwert n → ∞ ergibt sich a u(x) wie oben.
Ein weiteres Beispiel ist der radioaktive Zerfall. Sei a die ursprünglich vorhandene Menge
an radioaktivem Material und x die Zerfallsrate. Dabei muss x negativ sein, da die Menge
36
Differenzierbarkeit
des radioaktiven Materials ja abnimmt. Dieselbe Vorgangsweise wie oben ergibt, dass die
nach einer Zeiteinheit noch vorhandene Menge gleich a u(x) ist.
Die Funktion u(x) = limn→∞ (1 + nx )n
nennt man Exponentialfunktion. Aber zuerst ist zu zeigen, dass dieser Grenzwert
existiert. Für n = 1, 2, 3, 8 ist die Funktion x 7→ (1+ nx )n nebenstehend gezeichnet
und zwar jeweils auf dem Intervall [−n, ∞).
Dort ist die Funktion monoton wachsend
und hat nichtnegative Werte. Man sieht
auch, dass der Graph jeder dieser Funktionen über dem Graph der vorhergehenden
liegt. Das wurde auch in Satz 2.16 gezeigt.
Es ist bereits erkennbar, wie die Grenzfunktion aussehen wird.
Für n ≥ 1 definieren wir die Funktion un : R → R durch un (x) = (1 +
wiederholtes Anwenden von Satz 2.16 erhalten wir
(A)
un (x) ≥ um (x)
x∈R
für
x n
n) .
Durch
und n ≥ m > −x
Gilt |t| < 1, dann gilt auch (1 + t) (1 − t) = (1 − t2 )n < 1. Damit erhalten wir
1
(B) un (x) · un (−x) < 1 und daher auch un (x) < un (−x)
für x ∈ R und n > |x|
n
n
Sei jetzt x ∈ R beliebig. Wir wählen n0 ∈ N so, dass n0 > |x| gilt. Für alle n ≥ n0
1
≤ un 1(−x) wegen (B) und (A). Die Folge (un (x))n≥n0
erhalten wir dann un (x) < un (−x)
0
ist somit nach oben beschränkt. Wegen (A) ist sie auch monoton wachsend. Also existiert
u(x) = limn→∞ un (x) nach Satz 1.8.
Damit ist gezeigt, dass u(x) = limn→∞ un (x) für alle x ∈ R existiert. Es folgt u(x) ≥ 0,
da ja un (x) > 0 für alle n > −x gilt. Da un (0) = 1 für alle n gilt, erhalten wir u(0) = 1.
Die Zahl u(1) = limn→∞ (1 + n1 )n nennt man Eulersche Zahl und bezeichnet sie mit e.
Satz 2.25: Für x und y in R gilt u(x + y) = u(x)u(y). Für x ∈ R gilt weiters u(x) > 0
1
und u(−x) = u(x)
. Ist q ∈ Q und x ∈ R, dann gilt u(qx) = u(x)q , insbesondere u(q) = eq .
y
Beweis: Wir berechnen limn→∞ (1 + n+x
)n . Dazu sei k ∈ N mit k ≥ |x| fest gewählt. Ist
y
y
y
n > |y| + k, dann liegt (1 + n+x )n zwischen (1 + n+k
)n und (1 + n−k
)n . Für beliebiges
y
y
y
m ∈ Z gilt limn→∞ (1 + n+m )n = limn→∞ (1 + n+m )n+m (1 + n+m )−m = u(y). Wegen
y
y
x n
n
n
Satz 1.7 folgt limn→∞ (1 + n+x
)n = u(y). Nun gilt aber (1 + x+y
n ) = (1 + n ) (1 + n+x ) .
Lässt man n gegen ∞ gehen, so erhält man u(x + y) = u(x)u(y).
Setzt man y = −x dann ergibt sich 1 = u(0) = u(x)u(−x). Einerseits folgt u(x) ̸= 0 und
1
daher u(x) > 0, da u(x) ≥ 0 schon gezeigt wurde. Andererseits folgt u(−x) = u(x)
.
Für n ≥ 0 zeigen wir u(nx) = u(x)n mit Induktion. Für n = 0 gilt diese Gleichung wegen
u(0) = 1 und für n = 1 ist sie trivial. Ist u(nx) = u(x)n bereits gezeigt, dann folgt
u((n + 1)x) = u(nx + x) = u(nx)u(x) = u(x)n u(x) = u(x)n+1 mit Hilfe der ersten Aussage
dieses Satzes. Damit ist u(nx) = u(x)n für alle n ≥ 0 gezeigt. Aus der zweiten Aussage
1
−n
dieses Satzes folgt nun u(−nx) = u(x)
, sodass u(nx) = u(x)n für alle n ∈ Z
n = u(x)
gezeigt ist.
n
m
Für q = m
n mit m ∈ Z und n ∈ N erhalten wir u(qx) = u(nqx) = u(mx) = u(x) , woraus
√
u(qx) = n u(x)m = u(x)q folgt. Setzt man x = 1, so hat man u(q) = u(1)q = eq .
Franz Hofbauer
37
Nach Satz 2.25 gilt u(q) = eq für alle q ∈ Q. Das ist der Grund, warum man ex statt
u(x) schreibt, auch wenn x nicht in Q liegt. Im nächsten Satz berechnen wir die Ableitung
der Funktion u : R → R.
Satz 2.26: Die Funktion u ist differenzierbar und es gilt u′ (x) = u(x) für alle x ∈ R.
Beweis: Wir berechnen die Ableitung von u(x) im Punkt x = 0. Wegen (A) und (B) gilt
u1 (x) ≤ un (x) ≤
1
un (−x)
≤
1
u1 (−x)
für x ∈ (−1, 1) und n ≥ 1
Wir setzen für u1 (x) und u1 (−x) ein, lassen n gegen ∞ gehen und erhalten
1 + x ≤ u(x) ≤
1
1−x
für x ∈ (−1, 1) und n ≥ 1
Durch Subtraktion von 1 und Division durch x ergibt sich daraus
1≤
u(x)−1
x
≤
1
1−x
für x ∈ (0, 1)
und 1 ≥
u(x)−1
x
≥
1
1−x
für x ∈ (−1, 0)
Da u(0) = 1 gilt, erhalten wir limx→0 u(x)−u(0)
= 1 aus diesen Ungleichungen und Satz 2.3,
x
′
′
das heißt u (0) existiert und es gilt u (0) = 1.
Um u′ (x) für beliebiges x ∈ R zu finden, verwenden wir u(x + h) = u(x)u(h) aus Satz 2.25.
= u(x) u(h)−1
und limh→0 u(x+h)−u(x)
= u(x) limh→0 u(h)−1
= u(x),
Es folgt u(x+h)−u(x)
h
h
h
h
′
′
das heißt u (x) existiert und es gilt u (x) = u(x).
Analog können wir auch den Logarithmus einführen,
indem wir die Funktionen x 7→ (1+ nx )n umkehren und
den Grenzwert dieser Umkehrfunktionen suchen. Wir
lösen die Gleichung (1 + ny )n = x nach y auf, und
√
erhalten so die Umkehrfunktion ℓn (x) = n( n x − 1).
Sie hat Definitionsbereich (0, ∞). Nebenstehend ist
diese Funktion für n = 1, 2, 3, 8 gezeichnet. Klarerweise erhalten wir die Spiegelung des obigen Bildes um
die Hauptdiagonale. Wir zeigen, dass der Grenzwert
limn→∞ ℓn (x) für x ∈ (0, ∞) existiert und bezeichnen
ihn mit ℓ(x). Wir untersuchen dann die Eigenschaften
der Funktion ℓ : (0, ∞) → R.
Für x ≥ 1 und n ≥ 1 gilt ℓn+1 (x)
≤ ℓn (x) we√
n
gen Satz 2.17 und ℓn (x) ≥ 0 wegen x ≥ 1, sodass
(ℓn (x))n≥1 eine nach unten beschränkte monoton fallende Folge ist und somit ℓ(x) = limn→∞ ℓn (x) nach
Satz 1.8 existiert. Da ℓn√
(1) = 0 für alle n ≥ 1 gilt, erhalten wir insbesondere
ℓ(1) = 0.
√
Man rechnet ℓn (x) = − n x ℓn ( x1 ) für alle x ∈ (0, ∞) nach. Da limn→∞ n x = 1 für alle
x > 0 nach Satz 2.15 (a) gilt, folgt aus dieser Gleichung, dass ℓ(x) auch für 0 < x < 1
existiert und dass ℓ(x) = −ℓ( x1 ) für alle x ∈ (0, ∞) gilt.
Die so auf (0, ∞) definierte Funktion ℓ heißt (natürlicher) Logarithmus. Wir haben
bereits ℓ(1) = 0 und ℓ(x) = −ℓ( x1 ) für alle x ∈ (0, ∞) gezeigt. Wir beweisen weitere
Eigenschaften.
Satz 2.27: Die Funktion ℓ : (0, ∞) → R ist differenzierbar und es gilt ℓ′ (x) =
x ∈ (0, ∞).
1
x
für alle
Beweis: Es gilt ℓ′n (x) = x n −1 für alle n ≥ 1. Aus dem Mittelwertsatz erhalten wir, dass
1
ℓn (y) − ℓn (x) = c n −1 (y − x) gilt für ein c zwischen x und y (c hängt von n ab). Daraus
1
38
folgt, dass
Differenzierbarkeit
ℓn (y)−ℓn (x)
y−x
für alle n ≥ 2 zwischen x n −1 und y n −1 liegt. Lässt man n gegen
1
ℓ(y)−ℓ(x)
zwischen x1 und y1
y−x
womit ℓ′ (x) = x1 gezeigt ist.
∞ gehen, so folgt aus Satz 1.6 (a), dass
limy→x ℓ(y)−ℓ(x)
y−x
=
1
x
wegen Satz 2.3,
1
liegt. Daher gilt
Die Ableitung von ℓ : (0, ∞) → R ist größer als 0, sodass diese Funktion streng monoton
wachsend ist. Wegen ℓ(1) = 0 folgt ℓ(x) > 0 für x ∈ (1, ∞) und ℓ(x) < 0 für x ∈ (0, 1).
Satz 2.28: Für x und y in (0, ∞) gilt ℓ(xy) = ℓ(x) + ℓ(y).
√
√
√
√
Beweis: Für n ≥ 1 gilt ℓn (xy) = n( n xy − n y + n y − 1) = n y ℓn (x) + ℓn (y). Lässt
man in dieser Gleichung n gegen ∞ gehen, dann hat man ℓ(xy) = ℓ(x) + ℓ(y), da ja
√
limn→∞ n y = 1 ist.
Wir haben die Exponentialfunktion u : R → (0, ∞) und den Logarithmus ℓ : (0, ∞) → R
definiert und ihre Ableitungen berechnet. Es ist zu erwarten, dass sie Umkehrfunktionen
voneinander sind. Um das zu zeigen, sei g : R → R die Funktion g(x) = ℓ(u(x))−x. Es gilt
1
g ′ (x) = ℓ′ (u(x))u′ (x) − 1 = u(x)
u(x) − 1 = 0. Somit ist g eine konstante Funktion. Wegen
u(0) = 1 und ℓ(1) = 0 erhalten wir g(0) = 0. Also gilt g(x) = 0 und daher auch ℓ(u(x)) = x
für alle x ∈ R. Ist y ∈ (0, ∞) und setzt man x = ℓ(y) in die Gleichung ℓ(u(x)) = x ein, dann
hat man ℓ(u(ℓ(y))) = ℓ(y). Da ℓ streng monoton wachsend ist, erhalten wir u(ℓ(y)) = y.
Damit ist ℓ(u(x)) = x für alle x ∈ R und u(ℓ(y)) = y für alle y ∈ (0, ∞) gezeigt. Also sind
Exponentialfunktion und Logarithmus tatsächlich Umkehrfunktionen voneinander.
Wir verwenden ab jetzt die übliche Schreibweise ln x statt ℓ(x) für den Logarithmus.
Für a > 0 definieren wir die Funktion va : R → (0, ∞) durch va (x) = u(x ln a) = ex ln a .
Wegen Satz 2.26 gilt va′ (x) = u′ (x ln a) ln a = u(x ln a) ln a = va (x) ln a. Damit ist die
Ableitung der Funktion va gefunden.
Satz 2.29: Für x und y in R gilt va (x + y) = va (x)va (y). Für q ∈ Q gilt va (q) = aq .
Beweis: Mit Satz 2.25 erhalten wir u((x + y) ln a) = u(x ln a + y ln a) = u(x ln a)u(y ln a),
das heißt va (x + y) = va (x)va (y).
Ebenfalls aus Satz 2.25 folgt u(q ln a) = u(ln a)q und daraus dann va (q) = aq , da die
Exponentialfunktion u ja die Umkehrfunktion von ln ist und somit u(ln a) = a gilt.
Nach Satz 2.29 gilt va (q) = aq für alle q ∈ Q. Das ist der Grund, warum man ax statt
va (x) schreibt, auch wenn x nicht in Q liegt. Obige Definition der Funktion va wird dann
zu ax = u(x ln a) = ex ln a . Daraus folgt ln ax = x ln a, da ln die Umkehrfunktion der
Exponentialfunktion u ist und somit ln ex ln a = x ln a gilt.
Satz 2.30: Für a, b > 0 und x, y ∈ R gilt ax bx = (ab)x und (ax )y = axy .
Beweis: Satz 2.28 und Satz 2.25 besagen ln ab = ln a + ln b und u(x + y) = u(x)u(y).
Daraus erhalten wir dann (ab)x = u(x ln ab) = u(x ln a + x ln b) = u(x ln a)u(x ln b) = ax bx .
Mit Hilfe der Gleichung ln ax = x ln a folgt auch (ax )y = u(y ln ax ) = u(yx ln a) = axy .
Sei r ∈ R und g : R+ → R+ definiert durch g(x) = xr . Das ist die Potenzfunktion für
reelle Exponenten. Es gilt g ′ (x) = rxr−1 . Um das zu zeigen, verwenden wir x = eln x und
erhalten g(x) = (eln x )r = er ln x . Es folgt g ′ (x) = er ln x xr = xr xr = rxr x−1 = rxr−1 .
Franz Hofbauer
39
Beispiel: Wir beweisen die Ungleichung zwischen dem arithmetischen und geometrischen
Mittel. Wir zeigen zuerst, dass ex−1 ≥ x für alle x ∈ R gilt. Die Funktion f (x) = ex−1 − x
hat Ableitung f ′ (x) = ex−1 − 1. Es gilt f ′ (x) < 0 für x < 1 und f ′ (x) > 0 für x > 1. Auf
dem Intervall (−∞, 1) ist f monoton fallend. Auf (1, ∞) ist f monoton wachsend. Es gilt
daher f (x) ≥ f (1) für alle x ∈ R. Das ist die gewünschte Ungleichung ex−1 − x ≥ 0.
√
n
Seien a1 , a2 , . . . , an positive reelle Zahlen. Wir zeigen n a1 a2 . . . an ≤ a1 +a2 +···+a
. Dazu
n
aj
a1 +a2 +···+an
und xj = m , sodass x1 +x2 +· · ·+xn = n gilt. Aus obiger Ungleichung
sei m =
n
folgt exj −1 ≥ xj für alle j und daraus wieder ex1 −1 ex2 −1 . . . exn −1 ≥ x1 x2 . . . xn . Die linke
Seite ist aber gleich ex1 +x2 +···+xn −n = e0 = 1, sodass wir x1 x2 . . . xn ≤ 1 erhalten. Das
aber bedeutet nichts anderes als a1 a2 . . . an ≤ mn . Zieht man auf beiden Seiten noch die
n-te Wurzel, so steht die gewünschte Ungleichung schon da.
8. Regel von de l’Hospital
Wir beweisen die Regel von de l’Hospital, die dazu dient, gewisse Grenzwerte zu berechnen. Dazu brauchen wir ein Verallgemeinerung des Mittelwertsatzes.
Satz 2.31 (Verallgemeinerter Mittelwertsatz) Seien f : [a, b] → R und g : [a, b] → R
stetig und auf dem offenen Intervall (a, b) differenzierbar. Dann gibt es ein c ∈ (a, b) mit
(f (b) − f (a))g ′ (c) = (g(b) − g(a))f ′ (c). Gilt auch g ′ (x) ̸= 0 für alle x ∈ (a, b) dann kann
′
(c)
(b)−f (a)
= fg′ (c)
.
man diese Gleichung schreiben als fg(b)−g(a)
Beweis: Sei h(x) = (f (b) − f (a))g(x) − (g(b) − g(a))f (x). Dann ist h : [a, b] → R stetig
und auf dem offenen Intervall (a, b) differenzierbar. Es gilt h(a) = f (b)g(a) − g(b)f (a) und
h(b) = g(a)f (b) − f (a)g(b), das heißt h(b)−h(a)
= 0. Daher folgt aus Satz 2.10 die Existenz
b−a
′
eines c ∈ (a, b) mit h (c) = 0. Das aber heißt (f (b) − f (a))g ′ (c) − (g(b) − g(a))f ′ (c) = 0
und die erste Aussage ist gezeigt.
Gilt g ′ (x) ̸= 0 für alle x ∈ (a, b) dann folgt g(b) − g(a) ̸= 0 aus Satz 2.10 und wir können
′
(b)−f (a)
(c)
obige Gleichung schreiben als fg(b)−g(a)
= fg′ (c)
.
Satz 2.32 (Regel von de l’Hospital) Sei a < s < b. Seien f : (a, b) → R und g : (a, b) → R
differenzierbar. Weiters sei g ′ (x) ̸= 0 für alle x ∈ (a, s) ∪ (s, b). Wenn f (s) = g(s) = 0 und
′
(x)
(x)
limx→s fg′ (x)
= u gilt, dann gilt auch limx→s fg(x)
= u.
′
(s)−f (x)
(c)
(x)
= fg(s)−g(x)
= fg′ (c)
für
Beweis: Es gilt f (s) = g(s) = 0. Ist x ∈ (a, s), dann folgt fg(x)
ein c ∈ (x, s) aus Satz 2.31 angewandt auf das Intervall [x, s]. Ist x ∈ (s, b), dann folgt
f (x)
f (x)−f (s)
f ′ (c)
=
=
g(x)
g(x)−g(s)
g ′ (c) für ein c ∈ (s, x) aus Satz 2.31 angewandt auf das Intervall [s, x].
Nach Voraussetzung gilt limx→s
Damit ist
(x)
limx→s fg(x)
f ′ (c)
g ′ (c)
= limc→s
f ′ (c)
g ′ (c)
= u, da mit x ja auch c gegen s geht.
= u bereits gezeigt.
Die Voraussetzung g ′ (x) ̸= 0 für alle x ∈ (a, s) ∪ (s, b) muss man nicht überprüfen, da
die auftretenden Funktionen üblicherweise isolierte Nullstellen haben und daher ein ε > 0
existiert, sodass g ′ (x) ̸= 0 für x ∈ (s − ε, s) ∪ (s, s + ε) gilt. Man kann den Satz dann mit
a = s − ε und b = s + ε anwenden.
−x
Beispiel: Wir berechnen limx→0 e −e
. In Zähler und Nenner stehen Funktionen, die
x
auf ganz R differenzierbar sind und die 0 ergeben, wenn man x = 0 einsetzt. Wir erhalten
x
−x
x
−x
= limx→0 e +e
= 2.
limx→0 e −e
x
1
x
40
Differenzierbarkeit
1−cos x
Beispiel: Wir berechnen limx→0 1−cos
2x . Im Zähler und Nenner stehen differenzierbare
1−cos x
Funktionen, die 0 ergeben, wenn man x = 0 einsetzt. Wir erhalten limx→0 1−cos
2x =
sin x
limx→0 2 sin 2x . Wir erhalten einen Quotienten, wo im Zähler und Nenner wieder differenzierbare Funktionen stehen, die 0 ergeben, wenn man x = 0 einsetzt. Wir wenden die Regel
1−cos x
cos x
1
von de l’Hospital noch einmal an und erhalten limx→0 1−cos
2x = limx→0 4 cos 2x = 4 .
9. Komplexe Zahlen
Rechnet man mit reellen Zahlen, dann hat man das Problem, dass nicht jedes Polynom
eine Nullstelle hat. Das Polynom x2 + 1 hat zum Beispiel keine. Um dieses Problem zu
beseitigen, führt man die komplexen Zahlen C = {a + ib : a ∈ R, b ∈ R} ein. Addition
und Multiplikation sind in naheliegender Weise definiert, wobei i2 = −1 zu setzen ist.
Es gelten wieder die Assoziativgesetze, die Kommutativgesetze und das Distributivgesetz.
−b
a
Zu jeder komplexen Zahl a + bi ̸= 0 existiert die inverse Zahl a2 +b
2 + i a2 +b2 . Aus jeder
komplexen Zahl lässt sich die Wurzel ziehen. Die Ordnung geht verloren. Auf C kann
keine Ordnungsrelation definiert werden, die mit den Rechenoperationen verträglich ist.
√
Beispiel: Wir berechnen 3 + 4i, das heißt wir lösen die Gleichung (a + ib)2 = 3 + 4i. Es
folgt a2 − b2 + 2abi = 3 + 4i, also a2 − b2 = 3 und 2ab = 4. Berechnet man aus der zweiten
Gleichung b und setzt es in die erste ein, so erhält man a2 − a42 = 3 oder a4 − 3a2 − 4 = 0.
Als Lösungen erhält man a2 = 4 und a2 = −1. Da a eine reelle Zahl ist, muss a2 ≥ 0
gelten. Es kommt also nur a2 = 4 in Frage. Wir erhalten die beiden Lösungen a = 2 und
a = −2. Die zugehörigen Werte für b sind b = 1 und b = −1. Als Wurzeln der Zahl 3 + 4i
erhalten wir die beiden komplexen Zahlen 2 + i und −2 − i.
Man kann komplexe
Zahlen a + ib graphisch
(a)
als Vektoren b im R2 darstellen. Die Addition der komplexen Zahlen entspricht dann
der Vektoraddition. Um auch die Multiplikar
tion geometrisch zu deuten, ist es nützlich, die
b
Polarkoordinatendarstellung komplexer Zahlen
einzuführen.
√ Es gilt a + ib = r(cos φ + i sin φ),
wobei r = a2 + b2 der Betrag der komplexen
φ
Zahl a + ib ist und φ der Winkel zwischen der
a
x-Achse und dem Vektor, der die komplexe Zahl
a + ib darstellt.
Für x ∈ R definieren wir die komplexe Zahl eix durch die sogenannte Eulersche Formel
eix = cos x + i sin x
Dann lässt sich die Polarkoordinatendarstellung schreiben als a + ib = reiφ . Warum man
die komplexe Zahl cos x + i sin x mit eix bezeichnet, wird aus dem nächsten Satz klar. Es
gelten Rechenregeln wie für die Exponentialfunktion.
Satz 2.33: Für x und y in R gilt ei(x+y) = eix eiy .
Beweis: Das folgt aus den Summensätzen für die trigonometrischen Funktionen. Es gilt
ei(x+y) = cos(x + y) + i sin(x + y) = cos x cos y − sin x sin y + i sin x cos y + i cos x sin y und
eix eiy = (cos x + i sin x)(cos y + i sin y) = cos x cos y + i sin x cos y + i cos x sin y − sin x sin y.
Daraus erkennt man die gesuchte Gleichung.
Franz Hofbauer
41
Nun kann man auch die Multiplikation von zwei komplexen Zahlen geometrisch deuten.
Wir schreiben die Zahlen in Polarkoordinatendarstellung als r1 eiφ1 und r2 eiφ2 . Mit Hilfe
von Satz 2.33 folgt r1 eiφ1 · r2 eiφ2 = r1 r2 ei(φ1 +φ2 ) . Das Produkt zweier komplexer Zahlen
erhält man also, indem man die Beträge √
der beiden Zahlen
multipliziert und die Winkel
√ iφ/2
iφ/2
addiert. Daraus ergibt sich auch, dass re
und − re
die beiden Wurzeln der
komplexen Zahl reiφ sind. Die Wurzel (abgesehen vom Vorzeichen) erhält man, indem
man die Wurzel aus dem Betrag zieht und den Winkel halbiert.
Man kann nun umgekehrt auch die trigonometrischen Funktionen durch die komplexe
Exponentialfunktion darstellen. Wegen e−ix = cos(−x)+i sin(−x) = cos x−i sin x erhalten
wir eix + e−ix = 2 cos x und daraus
cos x = 21 (eix + e−ix )
Ebenso erhalten wir eix − e−ix = 2i sin x und daraus
sin x =
ix
1
2i (e
− e−ix )
Diese Darstellung von sin x und cos x durch die komplexe Exponentialfunktion kann man
verwenden um Potenzen und Produkte von trigonometrischen Funktionen auszurechnen.
Beispiel: Es soll sin2 x sin 2x als Summe von trigonometrischen Funktionen geschrieben
2ix
−2ix 2ix
e
−e−2ix
werden. Durch Einsetzen obiger Formeln erhält man sin2 x sin 2x = e −2+e
−4
2i
−2ix
−4ix
−e
Multiplikation dieser beiden Brüche ergibt e −2e +2e
. Diesen Bruch kann
−8i
man jetzt zerteilen, sodass wir wieder trigonometrische Funktionen einsetzen können, und
2ix
−2ix
4ix
−e−4ix
+ 2e −2e
= − 14 sin 4x + 12 sin 2x. Damit ist die gewünschte Summe
erhalten e −8i
8i
gefunden.
4ix
2ix
Beispiel: Wir zeigen, dass sin 2α + sin 2β + sin 2γ = 4 sin α sin β sin γ für die Winkel eines
Dreiecks, also unter der Bedingung α + β + γ = π gilt. Wir beginnen mit 4 sin α sin β sin γ
1
1
und setzen sin x = 2i
(eix − e−ix ) ein. Durch Ausmultiplizieren ergibt sich − 2i
(ei(α+β+γ) −
ei(α+β−γ) − ei(α−β+γ) + ei(α−β−γ) − ei(−α+β+γ) + ei(−α+β−γ) + ei(−α−β+γ) − ei(−α−β−γ) ).
Fasst man diese Ausdrücke entsprechend zusammen, so erhält man − sin(α + β + γ) +
sin(α + β − γ) + sin(α − β + γ) + sin(−α + β + γ). Das ist das Ergebnis, wenn man die
Bedingung, dass es sich um die Winkel eines Dreiecks handelt, nicht verwendet. Beachtet
man, dass α+β +γ = π und sin(π −x) = sin x gilt, dann ergibt sich sin 2α+sin 2β +sin 2γ.
III. Beweise durch Intervallschachtelung
Die Intervallschachtelungseigenschaft macht es möglich, die grundlegenden Sätze der
Analysis zu beweisen. Es waren drei Sätze, nämlich der Satz über die Konvergenz monotoner Folgen, der Zwischenwertsatz und der Satz vom Maximum und Minimum stetiger
Funktionen, die nicht bewiesen wurden und deren Beweis wir jetzt führen werden. Dazu
kommen noch der Satz von Bolzano–Weierstraß und ein Satz über die Existenz von Infimum und Supremum einer beschränkten Menge. Als Beweismethode verwenden wir die
Intervallhalbierung. Es wird eine Folge von abgeschlossenen Intervallen konstruiert, sodass
jedes Intervall entweder die linke oder die rechte Hälfte des vorhergehenden Intervalls ist.
Wir wissen, dass es dann genau eine reelle Zahl gibt, die in allen Intervallen enthalten ist.
1. Intervallhalbierung
Mit Hilfe der Intervallhalbierungsmethode beweisen wir den Zwischenwertsatz und den
Satz von Bolzano–Weierstraß.
Satz 3.1 (Zwischenwertsatz) Sei f : [a, b] → R eine stetige Funktion. Sei f (a) < y < f (b)
oder f (a) > y > f (b). Dann existiert ein x ∈ (a, b) mit f (x) = y.
Beweis: Wir untersuchen den Fall f (a) < y < f (b). Wir konstruieren eine Folge von
geschachtelten Intervallen [an , bn ] mit f (an ) < y < f (bn ), die möglicherweise abbricht.
Wir beginnen mit [a0 , b0 ] = [a, b]. Ist [an , bn ] konstruiert, dann bestimmen wir [an+1 , bn+1 ]
folgendermaßen. Sei cn der Mittelpunkt von [an , bn ]. Ist f (cn ) = y, dann haben wir das
gewünschte x schon gefunden und der Beweis ist fertig. Ist f (cn ) > y, dann setzen wir
[an+1 , bn+1 ] = [an , cn ]. Ist f (cn ) < y, dann setzen wir [an+1 , bn+1 ] = [cn , bn ]. In beiden
Fällen gilt [an+1 , bn+1 ] ⊆ [an , bn ] und f (an+1 ) < y < f (bn+1 ). Damit sind die Intervalle
konstruiert. Da das nächstfolgende Intervall immer eine Hälfte des vorhergehenden ist,
gilt bn − an = b−a
2n . Die Längen der Intervalle gehen gegen 0.
Wegen der Intervallschachtelungseigenschaft gibt es ein x, das in allen Intervallen [an , bn ]
enthalten ist. Wir zeigen limn→∞ an = x und limn→∞ bn = x. Dazu sei ε > 0 vorgegeben.
Wir wählen n0 größer als b−a
ε . Ist dann n ≥ n0 , dann folgt wegen x ∈ [an , bn ], dass
b−a
b−a
|an − x| ≤ bn − an = 2n ≤ b−a
n ≤ n0 < ε gilt. Damit ist limn→∞ an = x gezeigt.
Genauso folgt limn→∞ bn = x, da ja auch |bn − x| ≤ bn − an gilt.
Wir zeigen f (x) = y. Da f stetig ist, folgt limn→∞ f (an ) = f (x). Da f (an ) ≤ y für alle
n gilt, erhalten wir f (x) ≤ y. Ebenso folgt limn→∞ f (bn ) = f (x). Da auch f (bn ) ≥ y für
alle n gilt, erhalten wir f (x) ≥ y. Damit ist f (x) = y gezeigt.
Der nächste Satz verwendet Teilfolgen. Ist (xn )n≥0 eine Folge, dann nennt man jede
Folge xn0 , xn1 , xn2 , xn3 , . . . mit n0 < n1 < n2 < n3 < . . . eine Teilfolge.
Satz 3.2 (Satz von Bolzano–Weierstraß) Jede Folge (xn )n≥0 , die in einem beschränktem
Intervall [a, b] liegt, hat eine konvergente Teilfolge mit Grenzwert in [a, b].
Beweis: Wir konstruieren eine Folge von geschachtelten Intervallen [an , bn ], von denen
jedes unendlich viele Glieder der Folge (xn )n≥0 enthält. Wir beginnen mit [a0 , b0 ] = [a, b].
Ist das Intervall [an , bn ] schon konstruiert, sodass es unendlich viele Folgenglieder enthält,
und ist cn der Mittelpunkt von [an , bn ], dann enthält mindestens eines der Intervalle [an , cn ]
oder [cn , bn ] unendlich viele Glieder der Folge. Eines dieser beiden Intervalle, das unendlich
Franz Hofbauer
43
viele Folgenglieder enthält, wählen wir als [an+1 , bn+1 ]. Es gilt dann [an+1 , bn+1 ] ⊆ [an , bn ]
für alle n. Damit sind die Intervalle konstruiert. Da jedes Intervall eine Hälfte des vorhergehenden ist, gilt bn − an = b−a
2n . Die Längen der Intervalle gehen gegen 0.
Wir wählen eine Teilfolge (xnk )k≥0 von (xn )n≥0 , sodass xnk ∈ [ak , bk ] gilt. Wir beginnen
mit xn0 = x0 ∈ [a0 , b0 ]. Sind die Folgenglieder xn0 , . . . , xnk schon gewählt, dann finden wir
ein nk+1 > nk mit xnk+1 ∈ [ak+1 , bk+1 ], da dieses Intervall ja unendlich viele Folgenglieder
enthält. Damit ist die Teilfolge ausgewählt. Wegen der Intervallschachtelungseigenschaft
gibt es ein x, das in allen Intervallen [an , bn ] enthalten ist. Wir zeigen limk→∞ xnk = x. Sei
ε > 0 beliebig. Es gibt ein k0 mit bk0 − ak0 < ε, da die Intervalllängen gegen 0 gehen. Für
k ≥ k0 gilt dann |xnk −x| ≤ bk0 −ak0 < ε wegen x ∈ [ak0 , bk0 ] und xnk ∈ [ak , bk ] ⊆ [ak0 , bk0 ].
Damit ist limk→∞ xnk = x gezeigt.
2. Infimum und Supremum
Infimum und Supremum werden für beschränkte nicht leere Teilmengen von R definiert.
Man nennt d eine obere Schranke einer nicht leeren Teilmenge M von R, wenn jedes
Element von M kleiner oder gleich d ist. Man nennt c eine untere Schranke von M , wenn
jedes Element von M größer oder gleich c ist. Eine Menge heißt beschränkt, wenn sie eine
obere und eine untere Schranke besitzt. Die kleinste obere Schranke einer Menge nennt
man Supremum. Die größte untere Schranke einer Menge nennt man Infimum. Es gilt der
folgende Satz.
Satz 3.3: Sei M ⊆ R nicht leer. Hat M eine obere Schranke, dann auch eine kleinste
obere Schranke. Hat M eine untere Schranke, dann auch eine größte untere Schranke.
Beweis: Wir führen den Beweis für die obere Schranke. Der Beweis für die untere Schranke
verläuft analog. Nach Voraussetzung hat M eine obere Schranke r. Wir konstruieren eine
Folge von geschachtelten Intervallen [an , bn ], sodass an keine, wohl aber bn eine obere
Schranke von M ist. Wir beginnen mit [a0 , b0 ] = [u − 1, r], wobei u ein beliebiges Element
von M ist. Klarerweise ist u − 1 keine obere Schranke. Ist [an , bn ] schon konstruiert, dann
bestimmen wir [an+1 , bn+1 ] folgendermaßen. Sei cn der Mittelpunkt von [an , bn ]. Ist cn eine
obere Schranke, dann setzen wir [an+1 , bn+1 ] = [an , cn ]. Ist cn keine obere Schranke, dann
setzen wir [an+1 , bn+1 ] = [cn , bn ]. In beiden Fällen gilt [an+1 , bn+1 ] ⊆ [an , bn ], während
an+1 keine, wohl aber bn+1 eine obere Schranke ist. Damit sind die Intervalle konstruiert.
0
Da jedes Intervall eine Hälfte des vorhergehenden ist, gilt bn − an = b02−a
. Die Längen
n
der Intervalle gehen gegen 0.
Wegen der Intervallschachtelungseigenschaft gibt es ein x, das in allen Intervallen [an , bn ]
enthalten ist. Wir zeigen, dass x die kleinste obere Schranke ist.
Wir nehmen an, dass x keine obere Schranke der Menge M ist. Dann gibt es ein v ∈ M
mit x < v. Da die Intervalllängen gegen 0 gehen, gibt es ein n mit bn − an < v − x. Wegen
an ≤ x ≤ bn folgt daraus bn < v − x + an ≤ v. Da aber bn eine obere Schranke von M ist,
kann bn < v nicht gelten. Die Annahme, dass x keine obere Schranke ist, ist widerlegt.
Damit wissen wir, dass x eine obere Schranke ist.
Um zu zeigen, dass x die kleinste obere Schranke von M ist, nehmen wir die Existenz einer
oberen Schranke y mit y < x an. Da die Intervalllängen gegen 0 gehen, gibt es ein n mit
bn − an < x − y. Wegen an ≤ x ≤ bn folgt daraus an > bn − x + y ≥ y. Da aber an keine
obere Schranke von M ist, existiert ein v ∈ M mit v > an . Es folgt v > y. Die Annahme,
dass y eine obere Schranke von M ist, ist widerlegt. Damit ist gezeigt, dass x die kleinste
obere Schranke von M ist.
44
Beweise durch Intervallschachtelung
Mit Hilfe des letzten Satzes, können wir die beiden folgenden beweisen.
Satz 3.4: Eine monoton wachsende, nach oben beschränkte Folge hat einen Grenzwert.
Eine monoton fallende, nach unten beschränkte Folge hat einen Grenzwert.
Beweis: Wir behandeln nur den Fall einer monoton wachsenden Folge (xn )n≥0 . Sei r eine
obere Schranke, das heißt xn ≤ r für alle n ≥ 0. Dann ist r auch eine obere Schranke für
die Menge M = {xn : n ≥ 0}. Nach Satz 3.3 hat M eine kleinste obere Schranke x. Wir
zeigen limn→∞ xn = x gilt.
Sei ε > 0 vorgegeben. Da x die kleinste obere Schranke von M ist, ist x − ε keine obere
Schranke. Es existiert ein n0 mit xn0 > x − ε. Da x eine obere Schranke von M ist, gilt
xn ≤ x für alle n ≥ 0. Da die Folge (xn )n≥0 monoton wachsend ist, gilt xn ≥ xn0 für alle
n ≥ n0 . Damit ist x − ε < xn ≤ x für alle n ≥ n0 gezeigt. Es folgt |xn − x| < ε für alle
n ≥ n0 , das heißt limn→∞ xn = x.
Man nennt d eine obere Schranke einer Funktion f : [a, b] → R, wenn f (x) ≤ d für
alle x ∈ [a, b] gilt. Hat eine Funktion eine obere Schranke, dann sagt man, sie ist nach
oben beschränkt. Man nennt c eine untere Schranke einer Funktion f : [a, b] → R, wenn
f (x) ≥ c für alle x ∈ [a, b] gilt. Hat eine Funktion eine untere Schranke, dann sagt man,
sie ist nach unten beschränkt. Eine Funktion heißt beschränkt, wenn sie nach oben und
nach unten beschränkt ist.
Satz 3.5: Seien a und b in R mit a < b. Jede stetige Funktion f : [a, b] → R ist beschränkt
und nimmt ihr Maximum und ihr Minimum an, das heißt es gibt ein x0 ∈ [a, b], sodass
f (x) ≤ f (x0 ) für alle x ∈ [a, b] gilt, und ein x1 ∈ [a, b], sodass f (x) ≥ f (x1 ) für alle
x ∈ [a, b] gilt.
Beweis: Wir zeigen, dass f nach oben beschränkt ist. Wäre das nicht der Fall, dann
würde für jedes n ∈ N ein xn ∈ [a, b] existieren, sodass f (xn ) ≥ n gilt. Nach dem Satz
von Bolzano–Weierstraß hat (xn )n≥0 eine Teilfolge (xnk )k≥0 mit limk→∞ xnk = x ∈ [a, b].
Da f stetig ist, folgt limk→∞ f (xnk ) = f (x). Das ist aber ein Widerspruch dazu, dass
f (xn ) ≥ n für alle n gilt. Also kann f nicht nach oben unbeschränkt sein.
Sei M = {f (x) : x ∈ [a, b]}. Wir haben soeben gezeigt, dass diese Menge nach oben
beschränkt ist. Nach Satz 3.3 hat M eine kleinste obere Schranke s. Wir zeigen, dass ein
x0 ∈ [a, b] existiert mit f (x0 ) = s. Wäre das nicht der Fall, dann hätten wir f (x) < s
für alle x ∈ [a, b]. Die Funktion g(x) = s−f1(x) wäre dann für alle x ∈ [a, b] definiert und
wegen Satz 1.10 auch stetig. Da wir gezeigt haben, dass jede auf [a, b] stetige Funktion
nach oben beschränkt ist, würde es ein r > 0 geben, sodass g(x) ≤ r für alle x ∈ [a, b]
gilt. Daraus folgt aber f (x) ≤ s − 1r für alle x ∈ [a, b] und wir hätten eine obere Schranke
für M gefunden, die kleiner als s ist. Daher muss es ein x0 ∈ [a, b] geben mit f (x0 ) = s.
Wegen f (x) ≤ s für alle x ∈ [a, b] ist damit ein x0 gefunden, sodass f (x) ≤ f (x0 ) für alle
x ∈ [a, b] gilt.
Wendet man dieses Ergebnis auf die Funktion −f an, die ja ebenfalls stetig ist, dann ergibt
sich die Existenz eines x1 ∈ [a, b], sodass −f (x) ≤ −f (x1 ) für alle x ∈ [a, b] gilt. Es folgt
dann f (x) ≥ f (x1 ) für alle x ∈ [a, b].
Zum Abschluss sollen noch einige Eigenschaften des Infimums und des Supremums behandelt werden, die wir im nächsten Kapitel bei der Definition des Integrals brauchen. Für
eine beschränkte nichtleere Teilmenge M von R bezeichnen wir das Infimum, die größte
untere Schranke, mit inf M und das Supremum, die kleinste obere Schranke, mit sup M .
Franz Hofbauer
45
Satz 3.6: Seien M und K beschränkte nichtleere Teilmengen von R.
(a) Ist c eine untere und d eine obere Schranke von M , dann gilt c ≤ inf M ≤ sup M ≤ d.
(b) Ist M ⊆ K, dann gilt inf M ≥ inf K und sup M ≤ sup K.
(c) Für jedes ε > 0 existieren u und v in M mit u − ε < inf M und v + ε > sup M .
Beweis: Für jedes Element u von M gilt inf M ≤ u und u ≤ sup M , sodass inf M ≤ sup M
folgt. Da inf M die größte untere Schranke von M ist, gilt c ≤ inf M für jede beliebige
untere Schranke c von M . Da sup M die kleinste obere Schranke von M ist, gilt d ≥ sup M
für jede beliebige obere Schranke d von M . Damit ist (a) gezeigt.
Sei M ⊆ K. Da inf K eine untere Schranke von K ist, ist inf K auch eine untere Schranke
von M . Da inf M die größte untere Schranke von M ist, erhalten wir inf M ≥ inf K. Da
sup K eine obere Schranke von K ist, ist sup K auch eine obere Schranke von M . Da
sup M die kleinste obere Schranke von M ist, folgt sup M ≤ sup K. Damit ist (b) gezeigt.
Sei ε > 0. Da inf M die größte untere Schranke von M ist, ist inf M + ε keine untere
Schranke von M . Daher existiert ein u ∈ M mit u < inf M + ε. Da sup M die kleinste
obere Schranke von M ist, ist sup M − ε keine obere Schranke von M . Daher existiert ein
v ∈ M mit v > sup M − ε. Damit ist auch (c) gezeigt.
Für eine beschränkte Funktion f : [a, b] → R und eine Teilmenge I von [a, b] sei f (I)
die Menge {f (x) : x ∈ I}, das ist die Menge aller Funktionswerte, die auf der Teilmenge
I von [a, b] angenommen werden. Üblicherweise schreibt man inf I f anstelle von inf f (I)
und supI f anstelle von sup f (I). Als Folgerung von Satz 3.6 erhalten wir
Satz 3.7: Sei f : [a, b] → R beschränkt und I und J nicht leere Teilmengen von [a, b].
(a) Ist c eine untere und d eine obere Schranke von f , dann gilt c ≤ inf I f ≤ supI f ≤ d.
(b) Ist I ⊆ J, dann gilt inf I f ≥ inf J f und supI f ≤ supJ f .
(c) Für jedes ε > 0 existieren x und y in I mit f (x) − ε < inf I f und f (y) + ε > supI f .
Beweis: Diese drei Aussagen erhält man, indem man M = f (I) und K = f (J) in Satz 3.6
setzt. Es gilt ja I ⊆ J ⇒ f (I) ⊆ f (J). Weiters lässt sich u ∈ f (I) schreiben als f (x) mit
x ∈ I und v ∈ f (I) als f (y) mit y ∈ I.
IV. Integration
Wir führen das Integral ein, um die Fläche unter dem Graph einer Funktion zu berechnen. Durch eine entsprechende Approximation dieser Fläche mit Hilfe von Rechtecken
ergibt sich die Definition des Integrals. Es stellt sich heraus, dass Integrieren die Umkehrung des Differenzierens ist. Aus den Rechenregeln für die Ableitung erhält man wichtige
Rechenregeln für das Integral. Mit Integralen kann man aber nicht nur Flächen berechnen,
sondern auch anderes, wie zum Beispiel Volumina, Bogenlängen, Oberflächen und Schwerpunkte. Schließlich wird die Approximation von Funktionen durch Polynome behandelt.
Der Fehler, den man dabei macht, lässt sich durch ein Integral ausdrücken. Das führt dann
auch zur Untersuchung von Potenzreihen.
1. Definition und Eigenschaften des Integrals
Sei f : [a, b] → R eine beschränkte Funktion. Unser Ziel ist es, die Fläche zu berechnen, die von der x-Achse, dem Graph der Funktion f und den beiden senkrechten Geraden durch die Punkte (a, 0) und (b, 0) begrenzt wird. Liegt der Graph der Funktion
unterhalb der x-Achse, dann hat die Fläche negatives Vorzeichen. Liegt der Graph teilweise über und teilweise unter der
x-Achse, dann werden die Flächenstücke, die unter der x-Achse liegen,
von denen, die über der x-Achse
liegen, subtrahiert. Wir approximieren durch Rechtecke. Dazu sei
a = x0 < x1 < · · · < xn = b.
Das ergibt eine Zerlegung des Intervalls [a, b] in Teilintervalle. Das
Maximum der Differenzen xj −xj−1
nennen wir die Gitterweite der Zerlegung. Hat die Zerlegung Gitterxn−1 ξn b
a ξ1 x1 ξ2 x2
weite α, dann gilt xj −xj−1 ≤ α für
1 ≤ j ≤ n. Für jedes j wählen wir
ein ξj ∈ [xj−1 , xj ]. Die Rechtecke
mit Basislängen xj − xj−1 und Höhen
∑nf (ξj ) approximieren die zu berechnende Fläche. Die
Gesamtfläche dieser Rechtecke ist j=1 (xj − xj−1 )f (ξj ).
Für eine nicht leere Teilmenge I von [a, b] sei supI f das Supremum und inf I f das
Infimum der Menge f (I) = {f (x) : x ∈ I}. Wir fassen eine Zerlegung des Intervalls [a, b]
als endliche Menge Z von Punkten in [a, b] auf, die a und b enthält. Sei Z = {x0 , x1 , . . . , xn }
eine Zerlegung des Intervalls [a, b], wobei a = x0 < x1 < · · · < xn = b gilt. Wir definieren
∑n
∑n
OZ (f ) = j=1 (xj − xj−1 ) sup[xj−1 ,xj ] f und UZ (f ) = j=1 (xj − xj−1 ) inf [xj−1 ,xj ] f
und nennen OZ (f ) die Obersumme und UZ (f ) die Untersumme der Funktion f zur Zerlegung Z. Weiters nennen wir die bereits oben erwähnten Summen
∑n
j=1 (xj − xj−1 )f (ξj ) mit ξj ∈ [xj−1 , xj ]
Riemannsummen zur Zerlegung Z. Jede Riemannsumme zur Zerlegung Z liegt zwischen
UZ (f ) und OZ (f ). Es ist möglich, dass UZ (f ) oder OZ (f ) oder beide keine Riemannsummen sind.
Franz Hofbauer
47
Wir beweisen einige Eigenschaften von Ober– und Untersumme.
Satz 4.1: Sei f : [a, b] → R beschränkt mit unterer Schranke c und oberer Schranke d.
Sei R eine Zerlegung von [a, b] mit Gitterweite α. Weiters sei s ∈ [a, b] und R̃ = R ∪ {s}.
Dann gilt OR̃ (f ) ≤ OR (f ) ≤ OR̃ (f ) + α(d − c) und UR̃ (f ) ≥ UR (f ) ≥ UR̃ (f ) − α(d − c).
Beweis: Wenn s in R liegt, dann gilt R̃ = R. Wir erhalten OR̃ (f ) = OR (f ) und
UR̃ (f ) = UR (f ), sodass die zu beweisenden Ungleichungen trivial sind.
Sei daher R = {x0 , x1 , . . . , xn } und s ∈
/ R. Es existiert ein j mit xj−1 < s < xj . Aus der
Definition der Obersumme folgt dann
OR (f ) − (xj − xj−1 ) sup[xj−1 ,xj ] f = OR̃ (f ) − (xj − s) sup[s,xj ] f − (s − xj−1 ) sup[xj−1 ,s] f.
Wegen Satz 3.7 (b) gilt sup[xj−1 ,xj ] f ≥ sup[s,xj ] f und sup[xj−1 ,xj ] f ≥ sup[xj−1 ,s] f . Somit
ist OR (f ) − OR̃ (f ) = (xj − xj−1 ) sup[xj−1 ,xj ] f − (xj − s) sup[s,xj ] f − (s − xj−1 ) sup[xj−1 ,s] f
größer oder gleich 0 und die erste Ungleichung ist gezeigt. Wegen Satz 3.7 (a) gilt auch
sup[xj−1 ,xj ] f ≤ d, sup[s,xj ] f ≥ c und sup[xj−1 ,s] f ≥ c. Daraus folgt OR (f ) − OR̃ (f ) ≤
(xj − xj−1 )d − (xj − s)c − (s − xj−1 )c = (xj − xj−1 )(d − c) ≤ α(d − c). Damit ist auch die
zweite Ungleichung gezeigt.
Der Beweis für die Untersummen läuft analog. Aus der Definition der Untersumme folgt
UR (f ) − (xj − xj−1 ) inf [xj−1 ,xj ] f = UR̃ (f ) − (xj − s) inf [s,xj ] f − (s − xj−1 ) inf [xj−1 ,s] f.
Wegen Satz 3.7 (b) gilt inf [xj−1 ,xj ] f ≤ inf [s,xj ] f und inf [xj−1 ,xj ] f ≤ inf [xj−1 ,s] f . Somit
ist UR (f ) − UR̃ (f ) = (xj − xj−1 ) inf [xj−1 ,xj ] f − (xj − s) inf [s,xj ] f − (s − xj−1 ) inf [xj−1 ,s] f
kleiner oder gleich 0 und die dritte Ungleichung ist gezeigt. Wegen Satz 3.7 (a) gilt auch
inf [xj−1 ,xj ] f ≥ c, inf [s,xj ] f ≤ d und inf [xj−1 ,s] f ≤ d. Daraus folgt UR̃ (f ) − UR (f ) ≤
(xj − s)d + (s − xj−1 )d − (xj − xj−1 )c = (xj − xj−1 )(d − c) ≤ α(d − c). Damit ist auch die
vierte Ungleichung gezeigt.
Satz 4.2: Sei f : [a, b] → R beschränkt und seien Y und Z Zerlegungen von [a, b].
(a) Wenn Y ⊆ Z gilt, dann auch OY (f ) ≥ OZ (f ) und UY (f ) ≤ UZ (f ).
(b) Es gilt UY (f ) ≤ OZ (f ).
Beweis: Um (a) zu zeigen, sei R0 = Y und R1 , R2 , . . . , Rk seien so gewählt, dass Ri+1
aus Ri durch Hinzufügen eines Punktes entsteht und Rk = Z gilt. Aus Satz 4.1 folgt
ORj−1 (f ) ≥ ORj (f ) und URj−1 (f ) ≤ URj (f ) für 1 ≤ j ≤ k. Daraus erhalten wir dann
OY (f ) = OR0 (f ) ≥ ORk (f ) = OZ (f ) und UY (f ) = UR0 (f ) ≤ URk (f ) = UZ (f ). Damit
ist (a) gezeigt.
Um (b) zu zeigen, sei X = Y ∪ Z. Aus der Definition von Ober- und Untersumme und
Satz 3.7 (a) folgt UX (f ) ≤ OX (f ). Aus (a) erhalten wir UY (f ) ≤ UX (f ) wegen Y ⊆ X
und OZ (f ) ≥ OX (f ) wegen Z ⊆ X . Somit ergibt sich UY (f ) ≤ OZ (f ).
Sei SO = {OZ (f ) : Z eine Zerlegung von [a, b]}. Nach Satz 4.2 (b) ist UY (f ) für jede
Zerlegung Y von [a, b] eine untere Schranke der Menge SO . Somit hat die Menge SO
eine größte untere Schranke, die wir mit O(f ) bezeichnen, und wegen Satz 3.6 (a) gilt
UY (f ) ≤ O(f ) für jede Zerlegung Y von [a, b].
Sei SU = {UY (f ) : Y eine Zerlegung von [a, b]}. Wir haben soeben gezeigt, dass O(f )
eine obere Schranke der Menge SU ist. Somit hat die Menge SU auch eine kleinste obere
Schranke, die wir mit U (f ) bezeichnen, und wegen Satz 3.6 (a) gilt U (f ) ≤ O(f ).
Wir fassen zusammen: Es gilt OZ (f ) ≥ O(f ) für alle Zerlegungen Z von [a, b], da O(f )
eine untere Schranke von SO ist. Ebenso gilt UZ (f ) ≤ U (f ) für alle Zerlegungen Z von
[a, b], da U (f ) eine obere Schranke von SU ist. Und wir haben U (f ) ≤ O(f ) gezeigt.
48
Integration
Die Fläche zwischen dem Graph der Funktion f und der x-Achse wird durch O(f ) von
oben und durch U (f ) von unten approximiert. Eine beschränkte Funktion f : [a, b] → R
heißt daher integrierbar, wenn O(f ) = U (f ) gilt. Man bezeichnet diese Zahl dann mit
∫b
f (x) dx und nennt sie das Integral der Funktion f in den Grenzen von a bis b. Dabei
a
spielt x dieselbe Rolle wie eine Summationsvariable. Man kann genausogut eine andere
∫b
Variable schreiben, zum Beispiel a f (y)dy.
Im nächsten Satz charakterisieren wir das Integral als Grenzwert von Ober– und Untersummen und im übernächsten Satz dann als Grenzwert von Riemannsummen.
Satz 4.3: Sei f : [a, b] → R eine beschränkte Funktion und sei (Zn )n≥1 eine Folge von
Zerlegungen des Intervalls [a, b] mit Gitterweiten αn , für die limn→∞ αn = 0 gilt. Dann
gilt auch limn→∞ UZn (f ) = U (f ) und limn→∞ OZn (f ) = O(f ).
Beweis: Sei ε > 0 vorgegeben. Da U (f ) nach Definition gleich sup SU ist, existiert nach
Satz 3.6 (c) eine Zerlegung Y des Intervalls [a, b] mit UY (f ) + 2ε > U (f ). Sei k die Anzahl
der Unterteilungspunkte der Zerlegung Y. Sei c eine untere und d eine obere Schranke der
Funktion f . Wir wählen n0 so, dass kαn (d − c) < 2ε für alle n ≥ n0 gilt.
Für n ≥ 1 sei Xn = Zn ∪ Y. Man kann zwischen Zn und Xn Zerlegungen einfügen, sodass
jede dieser Zerlegungen jeweils einen Punkt mehr als die vorhergehende enthält. Durch
wiederholtes Anwenden von Satz 4.1 erhalten wir dann UZn (f ) ≥ UXn (f ) − kαn (d − c),
da jede Zerlegung, die Zn enthält, Gitterweite ≤ αn hat. Weiters folgt UXn (f ) ≥ UY (f )
aus Satz 4.2 (a) wegen Y ⊆ Xn . Für n ≥ n0 gilt dann UZn (f ) > UY (f ) − 2ε > U (f ) − ε.
Da U (f ) eine obere Schranke der Menge SU ist, gilt U (f ) ≥ UZn (f ) für alle n ≥ 1. Somit
liegt UZn (f ) für n ≥ n0 in der ε-Umgebung von U (f ). Damit ist limn→∞ UZn (f ) = U (f )
bewiesen. Der Beweis von limn→∞ OZn (f ) = O(f ) läuft analog.
Satz 4.4: Sei f : [a, b] → R integrierbar und (Zn )n≥1 eine Folge von Zerlegungen des
Intervalls [a, b], deren Gitterweiten für n → ∞ gegen 0 gehen. Für n ≥ 1 sei An (f )
∫b
irgendeine Riemannsumme zur Zerlegung Zn . Dann gilt limn→∞ An (f ) = a f (x)dx.
∫b
Beweis: Da f : [a, b] → R eine integrierbare Funktion ist, gilt U (f ) = O(f ) = a f (x)dx.
Weiters gilt UZn (f ) ≤ An (f ) ≤ OZn (f ), da An (f ) eine Riemannsumme zur Zerlegung Zn
∫b
∫b
ist. Nach Satz 4.3 gilt limn→∞ UZn (f ) = a f (x)dx und limn→∞ OZn (f ) = a f (x) dx,
∫b
woraus limn→∞ An (f ) = a f (x)dx folgt.
Wir beweisen einfache Rechenregeln für das Integral.
Satz 4.5: Seien f und g integrierbare Funktionen von [a, b] nach R und sei c in R. Dann
∫b
∫b
∫b
∫b
∫b
gilt a f (x) + g(x) dx = a f (x) dx + a g(x)dx und a cf (x) dx = c a f (x) dx.
Beweis: Sei I ein Intervall. Für alle x ∈ I gilt f (x) ≤ supI f und g(x) ≤ supI g, also
auch f (x) + g(x) ≤ supI f + supI g. Somit ist supI f + supI g eine obere Schranke für die
Menge {f (x) + g(x) : x ∈ I}. Es folgt supI (f + g) ≤ supI f + supI g. Analog zeigt man
auch inf I (f + g) ≥ inf I f + inf I g.
Sei Z = {x0 , x1 , . . . , xi } eine Zerlegung des Intervalls [a, b], wobei a = x0 < · · · < xi = b
gilt. Wir haben oben gezeigt, dass inf [xj−1 ,xj ] f + inf [xj−1 ,xj ] g ≤ inf [xj−1 ,xj ] (f + g) und
sup[xj−1 ,xj ] (f + g) ≤ sup[xj−1 ,xj ] f + sup[xj−1 ,xj ] g für 1 ≤ j ≤ i gilt. Multipliziert man
diese Ungleichungen mit xj − xj−1 und summiert über j, so ergibt sich
UZ (f ) + UZ (g) ≤ UZ (f + g) und
OZ (f + g) ≤ OZ (f ) + OZ (g)
Franz Hofbauer
49
Da UZ (h) ≤ U (h) ≤ O(h) ≤ OZ (h) für alle Funktionen h gilt, erhalten wir
UZ (f ) + UZ (g) ≤ UZ (f + g) ≤ U (f + g) ≤ O(f + g) ≤ OZ (f + g) ≤ OZ (f ) + OZ (g)
Sei jetzt (Zn )n≥1 eine Folge von Zerlegungen des Intervalls [a, b], deren Gitterweiten für
n → ∞ gegen 0 gehen. Dann ergibt sich aus obigen Ungleichungen
UZn (f ) + UZn (g) ≤ U (f + g) ≤ O(f + g) ≤ OZn (f ) + OZn (g)
∫b
Da f und g integrierbar sind, folgen limn→∞ UZn (f ) = limn→∞ OZn (f ) = a f (x)dx und
∫b
limn→∞ UZn (g) = limn→∞ OZn (g) = a g(x)dx aus Satz 4.3. Damit erhalten wir
∫b
∫b
U (f + g) = O(f + g) = a f (x)dx + a g(x) dx
∫b
Das zeigt, dass auch die Funktion f + g integrierbar ist und dass a f (x) + g(x)dx =
∫b
∫b
f (x) dx + a g(x)dx gilt. Damit ist die erste Aussage gezeigt.
a
Nun zur zweiten Aussage. Sei I ein Intervall. Für alle x ∈ I gilt f (x) ≤ supI f . Ist
c ≥ 0, dann folgt cf (x) ≤ c supI f für alle x ∈ I. Somit ist c supI f eine obere Schranke
für die Menge {cf (x) : x ∈ I}, woraus supI (cf ) ≤ c supI f folgt. Analog zeigt man auch
inf I (cf ) ≥ c inf I f .
Ist c < 0, dann folgt cf (x) ≥ c supI f für alle x ∈ I. Somit ist c supI f eine untere Schranke
für die Menge {cf (x) : x ∈ I}, woraus inf I (cf ) ≥ c supI f folgt. Analog zeigt man auch
supI (cf ) ≤ c inf I f .
Ist Z eine Zerlegung des Intervalls [a, b], dann folgt wie oben, dass
cUZ (f ) ≤ UZ (cf ) und
OZ (cf ) ≤ cOZ (f ) im Fall c ≥ 0 gilt, und
cOZ (f ) ≤ UZ (cf ) und
OZ (cf ) ≤ cUZ (f ) im Fall c < 0
Da UZ (h) ≤ U (h) ≤ O(h) ≤ OZ (h) für alle Zerlegungen Z und alle Funktionen h gilt,
erhalten wir cUZ (f ) ≤ UZ (cf ) ≤ U (cf ) ≤ O(cf ) ≤ OZ (cf ) ≤ cOZ (f ) im ersten und
cOZ (f ) ≤ UZ (cf ) ≤ U (cf ) ≤ O(cf ) ≤ OZ (cf ) ≤ cUZ (f ) im zweiten Fall.
Sei jetzt (Zn )n≥1 eine Folge von Zerlegungen des Intervalls [a, b], deren Gitterweiten für
n → ∞ gegen 0 gehen. Dann ergibt sich cUZn (f ) ≤ U (cf ) ≤ O(cf ) ≤ cOZn (f ) im ersten
und cOZn (f ) ≤ U (cf ) ≤ O(cf ) ≤ cUZn (f ) im zweiten Fall. Da f integrierbar ist, folgt
∫b
limn→∞ UZn (f ) = limn→∞ OZn (f ) = a f (x) dx aus Satz 4.3. Damit erhalten wir sowohl
im Fall c ≥ 0 als auch im Fall c < 0
∫b
U (cf ) = O(cf ) = c a f (x)dx
∫b
∫b
Somit ist auch die Funktion cf integrierbar und es gilt a cf (x)dx = c a f (x)dx.
Zweiter Beweis: Sei h = f + g. Sei (Zn )n≥1 eine Folge von Zerlegungen des Intervalls
[a, b], deren Gitterweiten gegen 0 gehen. Nach Satz 4.3 gilt limn→∞ OZn (h) = O(h).
Wir suchen eine geeignete Riemannsumme zur Zerlegung Zn . Sei Zn = {x0 , x1 , . . . , xi }.
1
Wir wählen ξj ∈ [xj−1 , xj ] so, dass h(ξj ) > sup[xj−1 ,xj ] h − n(b−a)
gilt. Das ist nach
Satz 3.7 (c) möglich. Die zu diesen Zwischenpunkten gehörige Riemannsumme ist An (h) =
∑i
j=1 (xj − xj−1 )h(ξj ). Multipliziert man obige Ungleichung mit xj − xj−1 und summiert
∑i
über j, so ergibt sich An (h) > OZn (h) − n1 wegen j=1 (xj − xj−1 ) = b − a. Da An (h) eine
Riemannsumme ist, gilt auch An (h) ≤ OZn (h). Wegen limn→∞ OZn (h) = O(h) erhalten
wir limn→∞ An (h) = O(h).
∑i
∑i
Seien An (f ) = j=1 (xj −xj−1 )f (ξj ) und An (g) = j=1 (xj −xj−1 )g(ξj ) die Riemannsummen für die Funktionen f und g zur Zerlegung Zn , die dieselben Zwischenpunkte verwen-
50
Integration
∫b
den wie die Riemannsumme An (h). Nach Satz 4.4 gilt limn→∞ An (f ) = a f (x)dx und
∫b
limn→∞ An (g) = a g(x) dx, da f und g integrierbar sind. Da An (h) = An (f ) + An (g)
∫b
∫b
für alle n ≥ 1 gilt, erhalten wir limn→∞ An (h) = a f (x)dx + a g(x)dx. Damit ist
∫b
∫b
O(h) = a f (x)dx + a g(x) dx gezeigt.
∫b
∫b
Analog zeigt man U (h) = a f (x) dx+ a g(x)dx. (Man braucht nur OZn (h) durch UZn (h),
O(h) durch U (h), sup durch inf und − n1 durch n1 ersetzen und die Ungleichheitszeichen
∫b
∫b
umdrehen.) Insgesamt haben wir U (h) = O(h) = a f (x)dx + a g(x)dx. Das zeigt, dass
∫b
∫b
∫b
die Funktion h = g + f integrierbar ist und dass a h(x) dx = a f (x) dx + a g(x)dx gilt.
Damit ist die erste Aussage gezeigt.
Sei jetzt h = cf . Sei (Zn )n≥1 eine Folge von Zerlegungen des Intervalls [a, b], deren
Gitterweiten gegen 0 gehen. Nach Satz 4.3 gilt limn→∞ OZn (h) = O(h).
Wir gehen genauso vor wie im ersten Teil des Beweises. Zur Zerlegung Zn = {x0 , x1 , . . . , xi }
∑i
finden wir eine Riemannsumme An (h) = j=1 (xj − xj−1 )h(ξj ) für die OZn (h) ≥ An (h) >
OZn (h) − n1 gilt. Wegen limn→∞ OZn (h) = O(h) gilt dann auch limn→∞ An (h) = O(h).
∑i
Sei An (f ) = j=1 (xj − xj−1 )f (ξj ) die Riemannsumme für die Funktion f zur Zerlegung
Zn , die dieselben Zwischenpunkte verwendet wie die Riemannsumme An (h). Nach Satz 4.4
∫b
gilt limn→∞ An (f ) = a f (x) dx, da f integrierbar ist. Da An (h) = cAn (f ) für alle n ≥ 1
∫b
∫b
gilt, erhalten wir limn→∞ An (h) = c a f (x)dx. Damit ist O(h) = c a f (x) dx gezeigt.
∫b
∫b
Analog zeigt man U (h) = c a f (x)dx. Insgesamt haben wir U (h) = O(h) = c a f (x)dx.
∫b
∫b
Das zeigt, dass die Funktion h = cf integrierbar ist und dass a h(x)dx = c a f (x) dx
gilt. Damit ist auch die zweite Aussage gezeigt.
Satz 4.6: Seien f und g integrierbare Funktionen von [a, b] nach R mit f (x) ≤ g(x) für
∫b
∫b
alle x ∈ [a, b]. Dann gilt a f (x)dx ≤ a g(x) dx.
Beweis: Sei h(x) = g(x) − f (x). Dann gilt h ≥ 0. Wegen Satz 4.5 ist h integrierbar
∫b
∫b
∫b
und es gilt a h(x) dx = a g(x) dx − a f (x)dx. Da jede Untersumme von h größer oder
∫b
gleich Null sein muss, folgt a h(x) dx ≥ 0 aus der Definition des Integrals. Das ergibt
∫b
∫b
f (x) dx ≤ a g(x)dx.
a
Man kann f : [a, b] → R natürlich auch∫über Teilintervalle seines Definitionsintervalls
v
integrieren. Gilt a ≤ u < v ≤ b, so wird u f (x) dx wie oben definiert. Es ist bequem,
∫u
∫u
∫v
diese Definition zu ergänzen, indem man u f (x)dx = 0 und v f (x) dx = − u f (x)dx
definiert. Wie man leicht sieht, bleiben die Aussagen von Satz 4.5 richtig, wenn die obere
Integrationsgrenze kleiner oder gleich der unteren ist.
Denkt man an die Interpretation des Integrals als Fläche, dann ist der folgende Satz
unmittelbar einsichtig. Addiert man die Fläche zwischen den Grenzen u und v zu der
zwischen den Grenzen v und w, dann erhält man natürlich die Fläche zwischen den Grenzen
u und w. Wir geben einen formalen Beweis mit Hilfe von Riemannsummen.
Satz 4.7: ∫ Seien u, v und
im Definitionsintervall der Funktion f liegen.
∫ v w Zahlen,∫die
w
w
Dann gilt u f (x)dx = u f (x)dx + v f (x) dx, wobei die Existenz dieser Integrale vorausgesetzt wird.
Beweis: Sind zwei der Zahlen u, v und w gleich, dann folgt die gesuchte Gleichung sofort
Franz Hofbauer
51
aus den Definitionen. Wir nehmen daher an, dass diese drei Zahlen verschieden sind.
Sei zuerst u < v < w. Sei (Un )n≥1 eine Folge von Zerlegungen des Intervalls [u, v], deren
Gitterweite für n → ∞ gegen 0 konvergiert. Ebenso sei (Yn )n≥1 eine Folge von Zerlegungen des Intervalls [v, w], deren Gitterweite für n → ∞ gegen 0 konvergiert. Für n ≥ 1
sei An (f ) eine Riemannsumme von f zur Zerlegung Un und Bn (f ) eine Riemannsumme
∫v
von f zur Zerlegung Yn . Mit Hilfe von Satz 4.4 folgt limn→∞ An (f ) = u f (x)dx und
∫w
limn→∞ Bn (f ) = v f (x) dx. Für n ≥ 1 sei Zn = Un ∪ Yn und Cn (f ) = An (f ) + Bn (f ).
Dann ist Zn eine Zerlegung des Intervalls [u, w] und Cn (f ) eine Riemannsumme von f
zur Zerlegung Zn . Für n → ∞ konvergiert
die Gitterweite der Zerlegungen Zn gegen 0.
∫w
Aus Satz 4.4 folgt limn→∞ Cn (f ) = u f (x)dx. Lässt man n in der Gleichung Cn (f ) =
∫w
∫v
∫w
An (f ) + Bn (f ) gegen ∞ gehen, dann hat man u f (x)dx = u f (x) dx + v f (x)dx.
Liegen die Zahlen u, v und w in einer anderen Reihenfolge, so kann man das gewünschte
Resultat
Fall
v < u <∫w, dann haben
∫u
∫ wzurückführen. Gilt zum Beispiel
∫u
∫ w auf den bewiesenen
v
f (x)dx = v f (x)dx + u f (x)dx gezeigt. Wegen v f (x)dx = − u f (x)dx folgt
wir
∫v
∫w
∫w v
f (x) dx = − u f (x) dx + u f (x)dx, also die zu beweisende Gleichung.
v
Wir werden später beweisen, dass jede stetige Funktion integrierbar ist. Mit Hilfe dieses
Resultats zeigen wir zwei wichtige Sätze.
Satz 4.8 (Mittelwertsatz der Integralrechnung) Seien a und b verschiedene Punkte in R
und sei J = [a, b], wenn a < b, und J = [b, a], wenn b < a. Seien f und g stetige Funktionen
von J nach R und es gelte entweder g ≥ 0 oder g ≤ 0. Dann existiert ein c ∈ J mit
∫b
∫b
∫b
f
(t)g(t)dt
=
f
(c)
g(t)dt.
Insbesondere
eistiert
ein
c
∈
J
mit
f (t)dt = (b − a)f (c).
a
a
a
Beweis: Sei zuerst a < b und g ≥ 0. Da f : J → R stetig ist, existiert ein Punkt u ∈ J, in
dem f sein Minimum annimmt, und ein Punkt v ∈ J, in dem f sein Maximum annimmt.
Es gilt f (u) ≤ f (t) ≤ f (v) für alle t ∈ J. Wegen g ≥ 0 folgt f (u)g(t) ≤ f (t)g(t) ≤ f (v)g(t)
für alle t ∈ J und daraus wegen Satz 4.6 und a < b dann
∫b
∫b
∫b
(∗)
f (u) a g(t) dt ≤ a f (t)g(t) dt ≤ f (v) a g(t)dt
∫b
∫b
Gilt a g(t) dt = 0, dann auch a f (t)g(t) dt = 0 und man kann c ∈ J beliebig wählen.
/∫b
∫b
∫b
Gilt a g(t)dt ̸= 0, dann existiert ein c ∈ J mit f (c) = a f (t)g(t)dt a g(t)dt. Hat man
in (∗) Ungleichheit, dann gilt das für ein c zwischen u und v nach dem Zwischenwertsatz.
Hat man in (∗) eine Gleichheit, dann kann man c = u oder c = v wählen. Damit ist
∫b
∫b
f
(t)g(t)dt
=
f
(c)
g(t)dt für g ≥ 0 und a < b bewiesen ist.
a
a
∫a
Sei jetzt b < a und g ≥ 0. Es wurde gezeigt, dass ein c ∈ J existiert mit b f (t)g(t)dt =
∫a
∫b
∫b
∫b
f (c) b g(t)dt, das heißt − a f (t)g(t) dt = −f (c) a g(t)dt, woraus dann a f (t)g(t)dt =
∫b
f (c) a g(t)dt folgt. Damit ist der Satz für g ≥ 0 und Punkte a und b mit a ̸= b bewiesen.
Sei schließlich g ≤ 0 und a ̸= b. Dann gilt −g ≥ 0. Es wure gezeigt, dass ein c ∈ J existiert
∫b
∫b
∫b
∫b
mit a −f (t)g(t)dt = f (c) a −g(t)dt, woraus a f (t)g(t)dt = f (c) a g(t) dt folgt. Damit
ist der Satz vollständig bewiesen.
Die letzte Aussage ist der Spezialfall, wo g die konstante Funktion 1 ist.
Der zweite Satz ist der sogenannte Hauptsatz der Differential- und Integralrechnung,
der besagt, dass Integrieren die Umkehrung des Differenzierens ist.
Definition: Sei I ein offenes Intervall und f : I → R eine Funktion. Eine Funktion
F : I → R heißt Stammfunktion von f , wenn die Ableitung F ′ von F gleich f ist.
52
Integration
Satz 4.9 (Hauptsatz der Differential- und Integralrechnung) Sei I ein offenes Intervall,
das auch unbeschränkt sein kann, und f : I → R stetig. Dann hat f eine Stammfunktion.
Die Differenz zweier Stammfunktionen von f ist konstant. Für jede Stammfunktion F von
∫b
f und a und b in I gilt a f (y)dy = F (b) − F (a).
∫x
Beweis: Sei u ∈ I beliebig und G(x) = u f (t) dt für x ∈ I. Dieses Integral existiert, da
∫y
f stetig ist. Für x und y in I mit x ̸= y gilt G(y) − G(x) = x f (t) dt nach Satz 4.7.
Aus Satz 4.8 mit a = x und b = y folgt die Existenz einer Zahl c im Intervall mit
den Endpunkten x und y, sodass G(y) − G(x) = (y − x)f (c) gilt. Wir erhalten daher
limy→x G(y)−G(x)
= limy→x f (c) = f (x), da f stetig ist und mit y ja auch c gegen x gehen
y−x
muss. Also gilt G′ (x) = f (x), das heißt G ist eine Stammfunktion von f . Die Existenz
einer Stammfunktion ist somit bewiesen.
Sind F und F̃ zwei beliebige Stammfunktionen, dann gilt (F − F̃ )′ = f − f = 0 auf I.
Somit ist F − F̃ auf I konstant. Die Differenz zweier Stammfunktionen ist konstant.
Ist F eine beliebige Stammfunktion, dann gilt F = G + c für eine Konstante c. Daher gilt
∫a
∫b
∫b
F (b) − F (a) = G(b) − G(a) = u f (y) dy − u f (y)dy = a f (y) dy nach Satz 4.7.
Mit Hilfe dieses Satzes kann man leicht Stammfunktionen für verschiedene Funktionen
angeben. Ist f (x) = ex , dann ist F (x) = ex + c eine Stammfunktion von f für jedes
c ∈ R, da ja F ′ (x) = f (x) gilt. Ebenso erhält man für f (x) = sin x die Stammfunktionen
F (x) = − cos x + c und für f (x) = cos x die Stammfunktionen F (x) = sin x + c. Ist
r+1
f (x) = xr mit r ∈ R, dann erhält man F (x) = xr+1 + c für r ̸= −1 und F (x) = ln |x| + c
für r = −1 als Stammfunktionen, für r < 0 auf I = (0, ∞) oder auf I = (−∞, 0).
Beispiel:
Wir berechnen die Fläche unter einem Bogen der Sinuskurve. Gesucht ist also
∫π
sin x dx. Da − cos x eine Stammfunktion von sin x ist, hat dieses Integral nach Satz 4.9
0
den Wert − cos π + cos 0 = 2.
Aus den Rechenregeln für die Ableitung erhält man mit Hilfe von Satz 4.9 die wohl
wichtigsten Rechenregeln fürs Integral, nämlich die partielle Interation und die Substitutionsregel. Zuerst noch eine Definition.
Definition: Sei I ein offenes Intervall. Eine Funktion f : I → R heißt stetig differenzierbar, wenn die Ableitung f ′ existiert und stetig ist.
Satz 4.10 (Partielle Integration) Seien f und g auf dem offenen Intervall I stetig differen∫b
∫b
zierbar. Für a und b in I gilt a f ′ (x)g(x)dx = f (b)g(b) − f (a)g(a) − a f (x)g ′ (x)dx.
Beweis: Die Produktregel besagt (f g)′ = f ′ g + f g ′ . Integriert man von a bis b, so folgt
∫b
∫b
∫b
(f (x)g(x))′ dx = a f ′ (x)g(x)dx + a f (x)g ′ (x) dx. Da f g eine Stammfunktion von
a
∫b
(f g)′ ist, erhalten wir aus Satz 4.9, dass a (f (x)g(x))′ dx = f (b)g(b) − f (a)g(a) gilt.
b
Oft verwendet man die Schreibweise h(x)a = h(b) − h(a). Damit läßt sich die Formel
b ∫ b
∫b ′
für die partielle Integration so schreiben
f (x)g(x) dx = f (x)g(x) − f (x)g ′ (x)dx.
∫b
a
a
a
x ln x dx durch partielle Integration. Setzt man f ′ (x) = x,
b ∫ b 2
∫b
2
2
also f (x) = x2 , und g(x) = ln x, dann folgt a x ln x dx = x2 ln xa − a x2 x1 dx. Weiters
∫b
2
2 b
gilt a x2 dx = x4 a , da x4 eine Stammfunktion von x2 ist, wie man leicht nachprüft. Wir
∫b
2 b
2
2
2
erhalten a x ln x dx = x2 ln x − x4 a = b4 (2 ln b − 1) − a4 (2 ln a − 1).
Beispiel: Wir berechnen
a
Franz Hofbauer
53
Satz 4.11 (Substitutionsregel) Seien I und J offene Intervalle und φ : I → J stetig
differenzierbar. Die Funktion f : J → R sei stetig und F sei eine Stammfunktion von f .
∫ φ(b)
∫b
Für a und b in I gilt dann φ(a) f (x)dx = F (φ(b)) − F (φ(a)) = a f (φ(t))φ′ (t) dt.
Beweis: Wir verwenden die Kettenregel (F ◦ φ)′ (t) = f (φ(t))φ′ (t). Integriert man von
∫b
a bis b, so folgt F (φ(b)) − F (φ(a)) = a f (φ(t))φ′ (t) dt aus Satz 4.9. Da F eine Stamm∫ φ(b)
funktion von f ist, gilt φ(a) f (x) dx = F (φ(b)) − F (φ(a)) wieder wegen Satz 4.9.
∫v x
Beispiel: Wir berechnen 0 √2x+1
dx mit Hilfe der Substitutionsregel. Zuerst muss man
√
herausfinden, welche Funktion in x man als neue Variable t wählt. Wir wollen 2x + 1
√
2
los werden, daher wählen wir t = 2x + 1. Daraus folgt x = t 2−1 . Das ist auch die
2
Funktion φ, also φ(t) = t 2−1 und daher φ′ (t) = t. Wir müssen a und b so bestimmen,
√
dass φ(a) = 0 und φ(b) = v gilt. Das kann man aus t = 2x + 1 berechnen, da dadurch
die Umkehrfunktion von φ gegeben
den Grenzen 0 und v läuft,
√ ist. Wenn x zwischen
√
dann läuft t zwischen den Grenzen 2 · 0 + 1 = 1√und 2v + 1. Setzt man das alles in die
∫v x
∫ 2v+1 t2 −1
Substitutionsregel ein, so folgt 0 √2x+1
dx = 1
2t t dt. Eine Stammfunktion des
√2v+1
∫
√
2
3
3
v
x
Integranden t 2−1 ist t6 − 2t . Wir erhalten 0 √2x+1
= v−1
dx = t −3t
2v + 1 − 13 .
6
3
1
Will man eine Stammfunktion einer Funktion f bestimmen, dann berechnet man F (t) =
f (x) dx, wobei a beliebig ist. Wegen Satz 4.9 ist das eine Stammfunktion
von f . Man
a
∫
erhält eine Stammfunktion F (x) auch als unbestimmtes Integral f (x)dx, das heißt man
rechnet das Integral aus, ohne danach Grenzen einzusetzen. Das ergibt dasselbe abgesehen
von der Konstanten, die durch das Einsetzen der unteren Grenze dazukommt. Aus dem
2
vorletzten Beispiel folgt, dass F (x) = x4 (2 ln x − 1) eine Stammfunktion von f (x) = x ln x
ist. Verwendet man die Substitutionsregel beim Berechnen eines unbestimmten Integrals,
dann erhält man die Stammfunktion als Funktion der neu eingeführten Variablen. Aus
3
x
dem letzten Beispiel folgt, dass t −3t
eine Stammfunktion von f (x) = √2x+1
ist, jedoch
6
√
in der neuen Variablen t. Durch
Zurücksubstituieren von t = 2x + 1 erhält man die
√
Stammfunktion F (x) = x−1
2x
+
1.
3
√
Enthält die zu integrierende Funktion den Ausdruck r2 − x2 , dann kann man die Substitution x = r sin t versuchen. Wir rechnen dazu zwei Beispiele.
∫r√
Beispiel: Wir wollen 0 r2 − x2 dx berechnen. Wir versuchen dieses Integral zu lösen,
indem wir x = φ(t) = r sin t substituieren. Da x zwischen den Grenzen 0 und r läuft,
läuft t zwischen den Grenzen 0 und π2 . Es gilt ja r sin 0 = 0 und r sin π2 = r. Wegen
∫r√
1 − sin2 t = cos2 t und φ′ (t) = r cos t folgt aus der Substitutionsregel 0 r2 − x2 dx =
∫π
∫ π2
2 2 1
r
cos
t
·
r
cos
t
dt
=
r
(1 + cos 2t)dt. Da 14 (2t + sin 2t) eine Stammfunktion von
0
0 2∫ √
2
2
2
r
1
r2 − x2 dx = r4 (π + sin π) − r4 (0 + sin 0) = r 4π .
2 (1 + cos 2t) ist, erhalten wir 0
∫r
Beispiel: Wir berechnen 0 (r2 − x2 )3/2 dx. Wir substituieren wieder x = φ(t) = r sin t.
Da x zwischen den Grenzen 0 und r läuft, läuft t zwischen den Grenzen 0 und π2 . Wegen
∫r
1 − sin2 t = cos2 t und φ′ (t) = r cos t folgt aus der Substitutionsregel 0 (r2 − x2 )3/2 dx =
∫π
∫ π2 3
1
r | cos t|3 · r cos t dt = r4 02 cos4 t dt. Die Eulerformel ergibt cos4 t = 16
(eit + e−it )4 =
0
1
(e4it + 4e2it + 6 + 4e−2it + e−4it ) = 18 cos 4t + 12 cos 2t + 83 . Damit erhalten wir dann
π
∫16r 2
∫π
(r − x2 )3/2 dx = r4 2 1 cos 4t + 1 cos 2t + 3 dt = r4 ( 1 sin 4t + 1 sin 2t + 3 t) 2 = 3π r4 .
∫t
0
0
8
2
8
32
4
8
0
16
54
Integration
√
Beispiel: Als weiteres Beispiel bestimmen
wir
die
Stammfunktion
von
f
(x)
=
1 + x2 ,
√
∫
berechnen also das unbestimmte Integral
1 + x2 dx. Wir substituieren x = 21 (et − e−t ).
√
√
Es gilt 1 + x2 = 1 + 14 (e2t − 2 + e−2t ) = 21 (et + e−t ) und dx wird durch 21 (et + e−t )dt
∫
∫
ersetzt. Wir erhalten 41 (et + e−t )2 dt = 14 (e2t + 2 + e−2t )dt = 18 e2t + 21 t − 18 e−2t .
Damit ist die Stammfunktion bereits berechnet, allerdings als Funktion in t. Wir müssen t
wieder durch x ersetzen. Aus x = 12 (et − e−t ) erhält man durch Lösen einer quadratischen
√
√
Gleichung et = x + 1 + x2 . Da√et positiv ist, kommt die √
andere Lösung x − 1 + x2 nicht
in Frage. Es folgt e−t = −x + 1 + √
x2 und t = log(x + √ 1 + x2 ). Setzt man√das ein, so
1
erhält man die Stammfunktion 8 (x+ 1 + x2 )2 − 18 (−x+ 1 + x2 )2 + 12 log(x+ 1 + x2 ) =
√
√
1
1
2
1 + x2 ).
2 x 1 + x + 2 log(x +
2. Gleichmäßige Stetigkeit
In diesem Kapitel wird nur gezeigt, dass für stetige Funktionen f : [a, b] → R das Integral
∫b
f (x) dx existiert. Dazu benötigen wir den Begriff der gleichmäßigen Stetigkeit.
a
Definition: Eine Funktion f : [a, b] → R heißt gleichmäßig stetig, wenn für jedes ε > 0
ein δ > 0 existiert, sodass für alle x und y in [a, b] mit |x − y| < δ sich die Funktionswerte
f (x) und f (y) um weniger als ε unterscheiden, das heißt |f (x) − f (y)| < ε erfüllt ist.
Der Unterschied zur Stetigkeit besteht darin, dass δ nur von ε, nicht aber von x abhängt.
Satz 4.12: Jede stetige Funktion f : [a, b] → R ist gleichmäßig stetig.
Beweis: Wir führen den Beweis indirekt. Wir nehmen an, dass f nicht gleichmäßig stetig
ist. Es gibt somit ein ε > 0, sodass für jedes δ > 0 die in der Definition der gleichmäßigen
Stetigkeit genannte Eigenschaft nicht gilt. Zu δ = n1 existieren also Punkte xn und yn
in [a, b], sodass zwar |xn − yn | < n1 , aber |f (xn ) − f (yn )| ≥ ε gilt. Nach dem Satz
von Bolzano-Weierstraß existiert eine konvergente Teilfolge (xnk )k≥1 von (xn )n≥1 , deren
Grenzwert x in [a, b] liegt. Aus |xn − yn | < n1 folgt xnk − n1k ≤ ynk ≤ xnk + n1k für alle
k ≥ 1, sodass limk→∞ ynk = x gilt. Die Stetigkeit von f liefert limk→∞ f (xnk ) = f (x) und
limk→∞ f (ynk ) = f (x). Daraus folgt limk→∞ f (xnk ) − f (ynk ) = 0, was ein Widerspruch
dazu ist, dass |f (xn ) − f (yn )| ≥ ε für alle n ≥ 1 gilt. Damit ist der Satz bewiesen.
Jetzt können wir bereits die Existenz des Integrals zeigen.
Satz 4.13: Für eine stetige Funktion f : [a, b] → R existiert das Integral
∫b
a
f (x)dx.
ε
Beweis: Sei ε > 0 vorgegeben. Wir setzen γ = 2(b−a)
> 0. Nach Satz 4.12 existiert
γ
ein δ > 0, sodass |f (x) − f (y)| < 2 für alle x und y in [a, b] mit |x − y| < δ gilt. Sei
Z = {x0 , x1 , . . . , xn } eine Zerlegung des Intervalls [a, b] mit Gitterweite kleiner als δ.
Wegen Satz 3.7 (c) existieren Punkte x und y in [xj−1 , xj ] mit f (x) − γ4 < inf [xj−1 ,xj ] f
und f (y) + γ4 > sup[xj−1 ,xj ] f . Wegen |x − y| ≤ xj − xj−1 < δ folgt |f (x) − f (y)| < γ2
und daher auch sup[xj−1 ,xj ] f − inf [xj−1 ,xj ] f < f (y) − f (x) + γ2 < γ. Wir erhalten daraus
∑n
OZ (f ) − UZ (f ) ≤ j=1 γ(xj − xj−1 ) = γ(b − a) < ε. Wegen O(f ) ≤ OZ (f ) und U (f ) ≥
UZ (f ) folgt O(f ) − U (f ) < ε. Da auch O(f ) ≥ U (f ) gilt und ε > 0 beliebig klein gewählt
werden kann, ist O(f ) = U (f ) gezeigt, das heißt f ist integrierbar.
Franz Hofbauer
55
3. Anwendungen des Integrals
Die naheliegendste Anwendung des Integrals ist die Berechnung von Flächen. Es wurde
∫b
ja so definiert, dass a f (x)dx die Fläche zwischen dem Graph der Funktion f und der
x-Achse in den Grenzen von a bis b angibt. Wir berechnen die Fläche einer Ellipse.
2
2
Beispiel: Wir berechnen die Fläche der Ellipse mit der Gleichung xa2 + yb2 = 1. Ein
√
Viertel davon ist die Fläche zwischen x-Achse und der Funktion f (x) = ab a2 − x2 auf
∫a√
dem Intervall [0, a]. Diese Fläche ist daher ab 0 a2 − x2 dx. Dieses Integral wurde im
2
letzten Kapitel berechnet und hat den Wert a4π . Ein Viertel der Ellipsenfläche ist also
abπ
4 und die gesamte Ellipsenfläche ist abπ.
Eine weitere Anwendung des Integrals sind Volumsberechnungen. Sei Ex die Ebene im
R3 durch den Punkt (x, 0, 0), die senkrecht auf die x-Achse steht. Der Körper, dessen
Volumen V wir berechnen wollen, liege im R3 zwischen den Ebenen Ea und Eb . Für
x ∈ [a, b] sei u(x) die Fläche des Schnittes der Ebene Ex mit dem Körper. Wir nehmen
an, dass u : [a, b] → R eine stetige Funktion ist. Sei a = x0 < x1 < · · · < xn = b eine
beliebige Zerlegung des Intervalls [a, b]. Sei Vj das Volumen des Teils des Körpers, der
zwischen den Ebenen Exj−1 und Exj liegt. Die stetige Funktion u nimmt im Intervall
[xj−1 , xj ] in einem Punkt p ihr Minimum und in einem Punkt q ihr Maximum an. Es
gilt (xj − xj−1 )u(p) ≤ Vj ≤ (xj − xj−1 )u(q), sodass nach dem Zwischenwertsatz ein
ξj ∈ [x
, xj ] existiert,
für das Vj = (xj − xj−1 )u(ξj ) gilt. Daraus erhalten wir dann
∑j−1
∑n
n
V = j=1 Vj = j=1 (xj − xj−1 )u(ξj ). Lässt man jetzt die Gitterweite der Zerlegung
gegen 0 gehen, dann geht diese Summe gegen das entsprechende Integral, sodass
∫ b
V =
u(x) dx
a
eine Formel für das Volumen des Körpers ist.
Beispiel: Wir berechnen das Volumen V eines Kegels, dessen Höhe h ist und dessen
Grundfläche eine beliebige ebene Figur mit Fläche G ist. Wir legen diesen Kegel in den
R3 , sodass die Spitze im Koordinatenursprung und die Grundfläche in der Ebene Eh liegt.
Aus dem Strahlensatz folgt, dass die Fläche u(x) des Schnittes der Ebene Ex mit diesem
∫h
∫h
∫h
Kegel gleich ( hx )2 G ist. Es folgt V = 0 u(x) dx = 0 ( hx )2 G dx = hG2 0 x2 dx = Gh
3 .
2
Eine quadratische Pyramide mit Grundkante a und mit Höhe h hat dann das Volumen a3h .
Ein Kegel mit kreisförmiger Grundfläche vom Radius r und mit Höhe h hat das Volumen
r 2 πh
3 .
2
2
2
Beispiel: Wir berechnen das Volumen des Ellipsoids mit der Gleichung xa2 + yb2 + zc2 = 1.
Dieses Ellipsoid liegt zwischen den Ebenen E−a und Ea . Für −a < x < a ist der Schnitt
2
2
2
2
von Ex mit dem Ellipsoid die Ellipse mit der Gleichung yb2 + zc2 = a a−x
, das heißt
2
a2 y 2
b2 (a2 −x2 )
a2 z 2
c2 (a2 −x2 )
= 1. Sie hat die Fläche u(x) = π abc2 (a2 − x2 ). Das Volumen des
∫a
∫a
3 a
Ellipsoids ist daher −a u(x) dx = π abc2 −a a2 − x2 dx = π abc2 (a2 x − x3 )−a = 43 πabc.
+
Ein wichtiger Spezialfall obiger Volumsformel ist das Volumen eines Drehkörpers, der
durch die Rotation des Flächenstücks unter der stetigen Funktion f : [a, b] → R+ um
die x-Achse entsteht. Für x ∈ [a, b] ist die Fläche des Schnittes der Ebene Ex mit dem
56
Integration
Drehkörper gleich u(x) = πf (x)2 . Deshalb ist
∫ b
V =π
f (x)2 dx
a
die Formel für das Volumen des Drehkörpers.
Beispiel: Sei 0 ≤ a < b ≤ r. Wir berechnen das Volumen des Segments der Kugel
mit Mittelpunkt (0, 0, 0) und Radius r zwischen
den Ebenen Ea und Eb . Hier rotiert das
√
Flächenstück unter der Funktion f (x) = r2 − x2 mit x ∈ [a, b] um die x-Achse. Wir
∫b
3 b
3
3
erhalten V = π a r2 − x2 dx = π(r2 x − x3 )a = π(r2 (b − a) − b −a
3 )
Beispiel: Sei a > r. Wir berechnen das Volumen des Ringes (Torus), der durch die
Rotation des Kreises x2 + (y − a)2 =∫ r2 um √
die x-Achse entsteht.∫ Dieses Volumen
V ist
√
r
r
2
2
2
2
2
die Differenz der beiden Volumina π −r (a + r − x ) dx und π −r (a − r − x )2 dx.
∫r √
2
Wir erhalten also V = 4aπ −r r2 − x2 dx = 4aπ r 2π = 2ar2 π 2 .
Wir können auch das Volumen über einem sogenannten Normalbereich B ⊆ R2 unter
einer Funktion g : B → R+ bestimmen. Man nennt B einen Normalbereich, wenn ein
Intervall [a, b] und stetige Funktionen φ : [a, b] → R und ψ : [a, b] → R mit φ ≤ ψ
existieren, sodass B = {(x, y) ∈ R2 : a ≤ x ≤ b, φ(x) ≤ y ≤ ψ(x)} gilt. Die Fläche u(x)
des Schnittes der Ebene Ex mit dem Körper über B und unter g lässt sich dann durch das
∫ ψ(x)
Integral φ(x) g(x, y)dy berechnen. Wir erhalten also
∫ b
∫ ψ(x)
V =
u(x)dx mit u(x) =
g(x, y) dy
a
φ(x)
2
als Volumen über dem Gebiet B unter der Funktion g : R → R+ .
Wir können bei allen diesen Überlegungen die Rolle der Koordinaten vertauschen. Lässt
sich der Bereich B schreiben als B = {(x, y) ∈ R2 : c ≤ y ≤ d, ϱ(y) ≤ x ≤ χ(y)} für ein
Intervall [c, d] und stetige Funktionen ϱ : [c, d] → R und χ : [c, d] → R mit ϱ ≤ χ, dann
ergibt sich wie oben
∫ d
∫ χ(y)
V =
v(y) dy mit v(y) =
g(x, y)dx
c
ϱ(y)
2
als Volumen über dem Gebiet B unter der Funktion g : R → R+ .
Beispiel: Wir berechnen das Volumen über dem Rechteck B = [−1, 1] × [0, 2] unter der
∫2
∫2
Funktion g(x, y) = x + 3y + 1. Wir erhalten u(x) = 0 g(x, y)dy = 0 x + 3y + 1 dy =
2
1
∫1
∫1
u(x)dx =
xy + 3 y 2 + y = 2x + 6 + 2 = 2x + 8 und V =
2x + 8 dx = x2 + 8x =
2
0
9 − (−7) = 16.
−1
−1
−1
1
∫1
Man kann das auch so ausrechnen v(y) = −1 x + 3y + 1 dx = 12 x2 + 3yx + x−1 =
2
∫2
∫2
3y + 23 − (−3y − 12 ) = 6y + 2 und V = 0 v(y)dy = 0 6y + 2 dy = 3y 2 + 2y 0 = 12 + 4 = 16.
Beispiel: Sei g(x, y) = 2x + 3y und B die Fläche zwischen den Parabeln y 2 = x und
y 2 = 4(x − 3). Gesucht ist das Volumen über B und unter g. Die erste der Parabeln hat
Scheitel (0, 0), die zweite (3, 0). Sie schneiden einander in den Punkten (4, 2) und (4, −2).
Wir erhalten für B den Normalbereich {(x, y) ∈ R2 : −2 ≤ y ≤ 2, y 2 ≤ x ≤ 14 y 2 + 3}. Es
1 y2 +3
∫ 1 y2 +3
gilt v(y) = y42
= ( 14 y 2 + 3)2 + 3y( 14 y 2 + 3) − y 4 − 3y 3 =
2x + 3y dx = (x2 + 3xy)y42
Franz Hofbauer
57
∫2
1 4
3 2
3 3
15 4
9 3
3 2
4
3
und V = −2 v(y)dy =
16 y + 2 y +9+ 4 y +9y −y −3y = − 16 y − 4 y + 2 y +9y +9
2
∫2
15 4
9 3
3 2
3 5
9 4
1 3
9 2
= −12+8+36 = 32.
−
y
−
y
+
y
+9y
+9
dy
=
−
y
−
y
+
y
+
y
+9y
16
4
2
16
16
2
2
−2
−2
Beispiel: Wir berechnen das Volumen des Schnittkörpers zweier Zylinder, die beide
Radius r haben und deren Achsen die x-Achse bzw. die y-Achse sind. Aus Symmetriegründen genügt es, den Teil des Schnittkörpers zu betrachten, der über der Fläche
B = {(x, y) : 0 ≤ x ≤ r, 0 ≤ y ≤ x} liegt. Das ist ein Sechzehntel des
√ Schnittkörpers.
Oberhalb von B wird der∫Schnittkörper durch
die
Funktion
g(x,
y)
=
r2 − x2 begrenzt.
√
√
∫x√
x
x
2
2
2
2
Wir berechnen u(x) = 0 g(x, y) dy = 0 r − x dy = y r − x 0 = x r2 − x2
r
∫r √
∫r
und V = 0 u(x)dx = 0 x r2 − x2 dx = − 13 (r2 − x2 )3/2 0 = 13 r3 . Das Volumen des
3
Schnittkörpers ist daher 16
3 r .
Als weitere Anwendung des Integrals bestimmen wir die Bogenlänge des Graphen einer
Funktion. Sei f : [a, b] → R stetig und auf (a, b) stetig differenzierbar. Wir approximieren
den Graph von f durch einen Polygonzug. Sei a = x0 < x1 < · · · < xn = b eine beliebige
Zerlegung des
Intervalls [a, b]. Die Länge des Polygonzugs durch die Punkte (xj , f (xj )) ist
∑n √
dann j=1 (xj − xj−1 )2 + (f (xj ) − f (xj−1 ))2 . Wegen des Mittelwertsatzes existiert für
jedes j ein ξj ∈ [xj−1 , xj ] mit xjj −xj−1j−1 = f ′ (ξj ). Daher ist die Länge des Polygonzuges
∑n √
gleich j=1 1 + f ′ (ξj )2 (xj − xj−1 ). Die Bogenlänge L der Kurve ist der Grenzwert der
Längen der Polygonzüge, wenn die Gitterweite der Zerlegung gegen 0 √
geht. Die Längen
der Polygonzüge sind aber Riemannsummen für die stetige Funktion 1 + f ′ (x)2 . Der
Grenzwert ist daher das entsprechende Integral. Wir erhalten
∫ b√
1 + f ′ (x)2 dx
L=
f (x )−f (x
)
a
als Formel für die Bogenlänge der Kurve, die durch den Graph von f gegeben ist.
Beispiel: Durch f (x) = p2 x2 ist eine Parabel gegeben. Wir berechnen die Länge des
∫c√
Parabelstücks mit 0 ≤ x ≤ c. Wegen f ′ (x) = px ergibt sich L = 0 1 + p2 x2 dx aus
∫ pc √
obiger Formel. Führt man die neue Variable t = px ein, so hat man L = 0
1 + x2 p1 dx.
√
√
Nach einem früheren Beispiel ist G(x) = 12 x 1 + x2 + 12 log(x + 1 + x2 ) eine Stammfunk√
√
√
1
tion von 1 + x2 . Es folgt L = p1 (G(pc) − G(0)) = 2c 1 + p2 c2 + 2p
log(pc + 1 + p2 c2 ).
4. Verallgemeinerte Riemannsummen
Um noch andere Anwendungen des Integrals behandeln zu können, brauchen wir eine
verallgemeinerte Form von Riemannsummen. Es gilt folgender Satz.
Satz 4.14: Seien f und g stetige Funktionen von [a, b] nach R. Sei (Zn )n≥1 eine Folge
von Zerlegungen des Intervalls
∑m [a, b], deren Gitterweite für n → ∞ gegen 0 konvergiert.
Für jedes n ≥ 1 sei Bn = j=1 f (ξj )g(ηj )(xj − xj−1 ), wobei wir Zn = {x0 , x1 , . . . , xm }
gesetzt haben und ξj und ηj beliebig im Intervall [xj−1 , xj ] gewählt werden. Es gilt dann
∫b
limn→∞ Bn = a f (x)g(x)dx.
Beweis:
∑mDa f stetig ist, existiert ein c mit |f (x)| ≤ c für alle x ∈ [a, b]. Für n ≥ 1 sei
An = j=1 f (ξj )g(ξj )(xj − xj−1 ), eine Riemannsumme zur Zerlegung Zn für f g.
Wir zeigen limn→∞ Bn − An = 0. Dazu sei ε > 0. Da g stetig ist, existiert wegen Satz 4.12
ε
gilt für alle x und y in [a, b] mit |x − y| < δ.
ein δ > 0, sodass |g(x) − g(y)| < c(b−a)
58
Integration
Weiters sei n0 so gewählt, dass Zn für n ≥ n0 Gitterweite < δ hat. Für n ≥ n0 ergibt
ε
sich dann |g(ξj ) − g(ηj )| < c(b−a)
, da ja |ξj − ηj | ≤ |xj − xj−1 | < δ gilt, sodass wir
(
)
∑m
∑m
|Bn −An | = | j=1 f (ξj ) g(ξj )−g(ηj ) (xj −xj−1 )| ≤ j=1 |f (ξj )| ·|g(ξj )−g(ηj )|(xj −xj−1 )
∑m
ε
ε
< j=1 c c(b−a)
(xj − xj−1 ) = c c(b−a)
(b − a) = ε erhalten. Für jedes ε > 0 existiert somit
ein n0 , sodass |Bn − An | < ε für alle n ≥ n0 gilt. Damit ist limn→∞ Bn − An = 0 gezeigt.
∫b
Da f g stetig und damit integrierbar ist, folgt limn→∞ An = a f (x)g(x)dx aus Satz 4.4.
∫b
Wir erhalten dann auch limn→∞ Bn = limn→∞ An + limn→∞ Bn − An = a f (x)g(x)dx
und der Satz ist bewiesen.
Wir verwenden Satz 4.14, um eine Formel für die Mantelfläche eines Drehkörpers zu
finden. Sei f : [a, b] → R+ stetig und auf (a, b) stetig differenzierbar. Der Graph von
f rotiert um die x-Achse. Wir berechnen die dadurch entstehende Oberfläche, die Mantelfläche des Drehkörpers. Wie bei der Berechnung der Bogenlänge approximieren wir den
Graph von f durch einen Polygonzug und lassen den Polygonzug um die x-Achse rotieren.
Sei a = x0 < x1 < · · · < xn = b eine beliebige Zerlegung des Intervalls [a, b]. Die Fläche,
die entsteht,√wenn die Strecke von (xj−1 , f (xj−1 )) nach (xj , f (xj )) um die x-Achse rotiert,
ist 2πf (ηj ) (xj − xj−1 )2 + (f (xj ) − f (xj−1 ))2 für ein ηj im Intervall [xj−1 , xj ]. Wegen
√
√
des Mittelwertsatzes gilt (xj − xj−1 )2 + (f (xj ) − f (xj−1 ))2 = 1 + f ′ (ξj )2 (xj − xj−1 )
für ein ξj ∈ [xj−1 , xj ].
√Daher ist die Fläche, die durch Rotation des Polygonzuges entsteht,
∑n
gleich 2π j=1 f (ηj ) 1 + f ′ (ξj )2 (xj −xj−1 ). Die Mantelfläche M ist der Grenzwert dieser
Summe, wenn die Gitterweite der Zerlegung gegen 0 geht. Wegen Satz 4.14 erhalten wir
∫ b
√
M = 2π
f (x) 1 + f ′ (x)2 dx
a
als Formel für die Mantelfläche, die durch Rotation des Graphen von f entsteht.
Beispiel: Wir berechnen die Mantelfläche M eines Kegels mit Radius r und Höhe h.
Diese entsteht, wenn der Graph der Funktion f (x) = hr x mit x ∈ [0, h] um die x-Achse
rotiert. Wir berechnen die Ableitung f ′ (x) = hr . Aus obiger Formel erhalten wir dann
h
√
√
∫h √
2√
M = 2π 0 hr x 1 + ( hr )2 dx = 2π hr x2 1 + ( hr )2 0 = πr h2 + r2 . Oft wird h2 + r2 mit
s bezeichnet, sodass sich die Formel M = πrs für die Mantelfläche ergibt.
Beispiel: Wir berechnen
des Graphen
√ die Kugeloberfläche. Sie entsteht durch Rotation
′
2
2
der Funktion f (x) = r − x mit x ∈ [−r, r] um die x-Achse. Es gilt f (x) = √r−x
.
2 −x2
r
∫r √
r
2
Aus obiger Formel folgt dann M = 2π −r r2 − x2 √r2 −x2 dx = 2πrx−r = 4πr .
Seien f und g stetige Funktionen von [a, b] nach R, sodass f (x) ≤ g(x) für alle x ∈ [a, b]
gilt. Wir suchen eine Formel für den Schwerpunkt des Flächenstücks, das von den Graphen
der Funktionen f und g und den beiden senkrechten Geraden x = a und x = b begrenzt
wird. Sei s die x-Koordinate des Schwerpunkts. Unterstützt man das Flächenstück durch
die Gerade x = s, dann darf es weder nach der einen noch nach der anderen Seite kippen.
Das Drehmoment, das durch die Schwerkraft bewirkt wird, muss gleich null sein.
Sei a = x0 < x1 < · · · < xn = b eine Zerlegung des Intervalls [a, b]. Das Drehmoment,
das durch den Streifen zwischen den senkrechten Geraden x = xj−1 und x = xj bewirkt
wird, ist gleich dem Produkt des Flächeninhalts des Streifens und des mit einem Vorzeichen
versehenen Abstands seines Schwerpunktes von der Geraden x = s. Dieses Produkt ist
gleich (g(ξj ) − f (ξj ))(xj − xj−1 )(ηj − s), wobei∑
ηj und ξj in [xj−1 , xj ] liegen. Als Drehmon
ment für die gesamte Fläche erhalten wir D = j=1 (ηj − s)(g(ξj ) − f (ξj ))(xj − xj−1 ). Da
Franz Hofbauer
59
man die Gitterweite der Zerlegung beliebig klein machen kann, folgt aus Satz 4.14, dass
∫b
D = a (x − s)(g(x) − f (x)) dx gilt. Setzt man das gleich null, so erhält man
/∫ b
∫ b
(
)
s=
x g(x)−f (x) dx
g(x)−f (x) dx
a
a
als x-Koordinate des Flächenschwerpunkts. Die y-Koordinate kann man berechnen, indem
man die y-Achse als x-Achse und die x-Achse als y-Achse auffasst.
Beispiel: Sei y = p − qx2 mit p > 0 und q > 0. Diese Gleichung stellt eine Parabel
mit Scheitel (0, p) dar. Wir berechnen den Schwerpunkt des Flächenstücks, das oberhalb
der x-Achse, rechts von der y-Achse und innerhalb der Parabel liegt, also zwischen den
2
Graphen
√ der Funktionen f (x) = 0 und g(x) = p − qx und den Grenzen a = 0 und
b = pq . Die x-Koordinate des Schwerpunkts ergibt sich aus obiger Formel. Wir erhalten
√
√
√
∫ √p/q
∫ √p/q
px2
qx4 p/q
p2
qx3 p/q
2p
2
2
x(p−qx ) dx = 2 − 4 0
p−qx dx = px− 3 0
= 4q und 0
= 3 pq .
0
√
Die x-Koordinate des Schwerpunkts ist der Quotient dieser beiden Werte, also 83 pq .
Um die y-Koordinate des Schwerpunkts zu berechnen, fassen wir y als Variable auf
√ und
lassen die y-Achse die Rolle der x-Achse spielen. Die Parabelgleichung wird zu x = p−y
.
√q
Das Flächenstück liegt zwischen den Graphen der Funktionen f (y) = 0 und g(y) = p−y
q
und √
den Grenzen a = 0 und b = p. Um obige Formel zu verwenden, √
berechnen wir
∫p
∫√
0
p−y
pz 3
qz 5 0
4p2
p
2 2
√
dy
=
−2q
(p
−
qz
)z
dz
=
−2q(
−
)
=
y
q
3
5
15
q , wobei wir
0
p/q
p/q
√
√
√
∫ p p−y
3 p
2p
p
2
2 =
√
−
y)
z = p−y
substituiert
haben,
und
dy
=
(p
−
q
q
3 q
3
q . Der Quotient
0
0
dieser beiden Werte ist 2p
5 . Das ist die y-Koordinate des Schwerpunkts. Wir erhalten
√
p 2p
3
daher ( 8 q , 5 ) als Schwerpunkt des Parabelstücks.
Genauso wie für eine Fläche kann man auch die Schwerpunktskoordinaten eines Körpers
berechnen. Wir tun das für einen Drehkörper, der durch Rotation des Flächenstücks unter
dem Graph der stetigen Funktion f : [a, b] → R+ um die x-Achse entsteht. Der Schwerpunkt des Drehkörpers liegt auf der x-Achse. Seine x-Koordinate bezeichnen wir mit s.
Sei a = x0 < x1 < · · · < xn = b eine Zerlegung des Intervalls [a, b]. Das Drehmoment, das durch die Scheibe des Drehkörpers über dem Intervall [xj−1 , xj ] bezüglich der
Ebene x = s bewirkt wird, ist gleich dem Produkt des Volumens der Scheibe und des
mit einem Vorzeichen versehenen Abstands ihres Schwerpunktes von der Ebene x = s.
Es ist∑gleich (ηj − s)πf (ξj )2 (xj − xj−1 ), wobei ηj und ξj in [xj−1 , xj ] liegen. Daher ist
n
D = j=1 (ηj − s)πf (ξj )2 (xj − xj−1 ) das gesamte Drehmoment. Da man die Gitterweite
∫b
der Zerlegung beliebig klein machen kann, folgt D = π a (x − s)f (x)2 dx aus Satz 4.14.
Setzt man das gleich null, so erhält man
/∫ b
∫ b
2
s=
xf (x) dx
f (x)2 dx
a
a
als x-Koordinate des Schwerpunkts des Drehkörpers.
Beispiel: Wir berechnen den Schwerpunkt des Kegels mit Höhe h und Radius r. Diesen
erhält man, wenn die Fläche unter dem Graph der Funktion f (x) = hr x mit x ∈ [0, h] um
∫h
∫h
2
4 h
2 2
die x-Achse rotiert. Wir berechnen 0 xf (x)2 dx = 0 x( hr x)2 dx = hr 2 x4 0 = r 4h und
60
Integration
∫h
2
2
3 h
f (x)2 dx = 0 ( hr x)2 dx = hr 2 x3 0 = r 3h . Daraus ergibt sich s = 34 h. Der Schwerpunkt
des Kegels liegt also bei einem Viertel der Höhe über der Grundfläche.
∫h
0
5. Uneigentliche Integrale
Wir haben bisher Integrale nur für beschränkte Funktionen auf abgeschlossenen Intervallen definiert. Ist das Integrationsintervall unbeschränkt, oder hat die zu integrierende
Funktion eine Polstelle, dann spricht man von uneigentlichen Integralen. Diese definiert
man durch Grenzwerte.
Der Einfachheit halber behandeln wir nur ∫Funktionen mit Werten∫ in [0, ∞). Für eine
n
∞
Funktion f : [a, ∞) → [0, ∞) definieren wir a f (x) dx = limn→∞ a f (x)dx. Für eine
∫b
∫b
Funktion f : (−∞, b] → [0, ∞) definieren wir −∞ f (x)dx = limn→∞ −n f (x) dx. Für eine
∫n
∫∞
Funktion f : (−∞, ∞) → [0, ∞) definieren wir −∞ f (x)dx = limn→∞ −n f (x)dx. Dabei
wird die Existenz der Grenzwerte und der Integrale auf der rechten Seite vorausgesetzt.
∫∞
−α+1
x−α dx für α > 0. Für α ̸= 1 ist x 7→ x−α+1
∫n
1−α n
1−α
1
eine Stammfunktion von x 7→ x−α . Es folgt 1 x−α dx = x1−α 1 = n1−α − 1−α
. Für α < 1
∫ ∞ −α
erhält man ∞, wenn n gegen ∞ geht. In diesem Fall existiert das Integral 1 x dx nicht.
∫∞
1
1
Für α > 1 erhält man α−1
, wenn n gegen ∞ geht. In diesem Fall gilt 1 x−α dx = α−1
.
−α
Es
der Fall α = 1. Eine Stammfunktion
von x 7→ x
ist x 7→ ln x. Es folgt
∫ n bleibt
∫ ∞ −1
−1
x
dx
=
ln
n,
sodass
das
Integral
x
dx
nicht
existiert.
1
1
Beispiel: Wir berechnen das Integral
1
Ähnlich geht man bei Funktionen mit Polstelle vor. Für eine Funktion f : [a, b) → [0, ∞)
∫b
∫ b− 1
mit Polstelle bei b definieren wir a f (x)dx = limn→∞ a n f (x)dx. Für eine Funktion
∫b
∫b
f : (a, b] → [0, ∞) mit Polstelle bei a definieren wir a f (x) dx = limn→∞ a+ 1 f (x)dx.
n
Vorausgesetzt wird die Existenz der Grenzwerte und der Integrale auf der rechten Seite.
∫1
−α+1
x−α dx für α > 0. Für α ̸= 1 ist x 7→ x−α+1
∫1
1−α 1
1
1
eine Stammfunktion von x 7→ x−α . Es folgt 1 x−α dx = x1−α 1 = 1−α
− (1−α)n
1−α .
n
n
Für
α > 1 erhält man ∞, wenn n gegen ∞ geht. In diesem Fall existiert das Integral
∫ 1 −α
1
, wenn n gegen ∞ geht. In diesem Fall gilt
x dx nicht. Für α < 1 erhält man 1−α
∫01 −α
1
x dx = 1−α
. Es bleibt α = 1. Eine Stammfunktion von x 7→ x−1 ist x 7→ ln x. Es
0
∫1
∫ 1 −1
folgt 1 x dx = ln 1 − ln n1 = ln n, sodass das Integral 0 x−1 dx nicht existiert.
Beispiel: Wir berechnen das Integral
0
n
Es sei noch einmal darauf hingewiesen, dass wir uneigentliche Integrale nur für Funktionen mit Werten in [0, ∞) behandelt haben. Bei Funktionen, die sowohl positive als auch
negative Werte annehmen, muss man vorsichtiger vorgehen.
6. Approximation von Funktionen durch Polynome
Um die Exponentialfunktion, trigonometrische Funktionen, die Logarithmusfunktion
und andere berechnen zu können, muss man sie approximieren. Eine Möglichkeit ist die
Approximation durch Polynome. Wir beginnen mit dem Satz von Taylor, der zeigt wie
solche Polynome aussehen, und approximieren anschließend verschiedene Funktionen.
Franz Hofbauer
61
Satz 4.15 (Taylorformel) Sei I ein offenes Intervall, das 0 enthält. Sei f : I → R eine
(n + 1)-mal stetig differenzierbare Funktion, das heißt, für k ≤ n + 1 existiert die k-te
Ableitung f (k) von f und f (n+1) ist stetig. Sei x ∈ I. Dann hat man die Formel
x
xn
f (x) = f (0) + f ′ (0) + · · · + f (n) (0)
+ Rn+1 (x)
1!
n!
∫ x (n+1)
1
f
(t)(x − t)n dt gilt. Außerdem existiert ein c mit 0 ≤ c ≤ x
wobei Rn+1 (x) = n!
0
oder x ≤ c ≤ 0, sodass Rn+1 (x) =
f (n+1) (c) n+1
(n+1)! x
gilt. Man nennt Rn+1 (x) das Restglied.
Beweis: Für x = 0 ist die Formel trivial. Sei daher x ∈ I \ {0} fest gewählt. Aus dem
Hauptsatz der Differential– und Integralrechnung folgt
∫x
f (x) = f (0) + 0 f ′ (t)dt
Da t ∫7→ −(x − t) eine Stammfunktion
1 ist, erhalten wir mit partieller Integration,
x ∫von
x ′
x ′′
′
dass 0 f (t) · 1dt = −f (t)(x − t) 0 + 0 f (t)(x − t)dt gilt. Daraus folgt
∫x
x
f (x) = f (0) + f ′ (0) 1!
+ 0 f ′′ (t) (x−t)
1! dt
2
Da t 7→ − (x−t)
eine Stammfunktion von t 7→ x−t
1! ist, erhalten wir mit partieller Integra∫ x2! ′′ (x−t)
∫
2 x
2
x
(x−t)
tion, dass 0 f (t) 1! dt = −f ′′ (t) 2! 0 + 0 f (3) (t) (x−t)
dt gilt. Daraus folgt
2!
∫
2
2
x
x
f (x) = f (0) + f ′ (0) 1!
+ f ′′ (0) x2! + 0 f (3) (t) (x−t)
dt
2!
Führt man diesen Schritt n Mal durch, so erhält man
n
x
f (x) = f (0) + f ′ (0) 1!
+ · · · + f (n) (0) xn! +
∫x
0
n
dt
f (n+1) (t) (x−t)
n!
Damit ist die Formel mit der ersten Version von Rn+1 (x) bewiesen.
Um die zweite Form von Rn+1 (x) zu zeigen, sei J = [0, x], wenn x > 0, und J = [x, 0],
n
wenn x < 0. Sei g(t) = (x−t)
n! . Dann gilt g ≥ 0 oder g ≤ 0 auf dem Intervall J.
Da f (n+1) als stetig vorausgesetzt wird, folgt aus Satz 4.8, dass ein c ∈ J existiert mit
∫x
∫x
xn+1
Rn+1 (x) = 0 f (n+1) (t)g(t)dt = f (n+1) (c) 0 g(t)dt = f (n+1) (c) (n+1)!
.
Um Funktionen durch Approximation mit Polynomen näherungsweise zu berechnen, ist
es notwendig, das Restglied abzuschätzen. Dazu beweisen wir folgenden Satz.
Satz 4.16: Sei a ̸= b und I das abgeschlossene Intervall mit Endpunkten a und b. Sei
∫b
∫b
f : I → R eine stetige Funktion. Dann gilt | a f (y)dy| ≤ a |f (y)|dy, wenn a < b ist, und
∫b
∫a
| a f (y) dy| ≤ b |f (y)| dy, wenn b < a ist.
Beweis: Da f stetig ist, ist auch |f | stetig. Somit sind beide Funktionen integrierbar.
Sei zuerst a < b. Es gilt f (y) ≤ |f (y)| und −f (y) ≤ |f (y)| für alle y ∈ I = [a, b]. Aus
∫b
∫b
∫b
∫b
∫b
Satz 4.6 folgt a f (y) dy ≤ a |f (y)| dy und − a f (y)dy ≤ a |f (y)|dy. Da | a f (y) dy|
∫b
∫b
∫b
∫b
entweder a f (y) dy oder − a f (y) dy ist, ist | a f (y)dy| ≤ a |f (y)| dy bereits gezeigt.
∫a
∫a
Sei jetzt b < a. Im vorherigen Absatz wurde | b f (y)dy| ≤ b |f (y)| dy bewiesen. Wegen
∫a
∫b
∫b
∫b
∫a
| b f (y) dy| = | − a f (y) dy| = | a f (y)dy| erhalten wir | a f (y)dy| ≤ b |f (y)| dy.
Beispiel: Wir entwickeln die Funktion ex für x ∈ R nach der Taylorformel aus Satz 4.15.
Da alle Ableitungen von ex wieder ex sind, erhalten wir
ex = 1 + x +
x2
2!
+
x3
3!
+ ··· +
xn
n!
+ Rn+1 (x) mit Rn+1 (x) =
wobei entweder 0 ≤ c ≤ x oder x ≤ c ≤ 0 gilt. Es folgt |Rn+1 (x)| ≤
n+1
ec
(n+1)! x
max(1,ex )
n+1
.
(n+1)! |x|
62
Integration
1
1
Für −1 ≤ x < 0 gilt |Rn+1 (x)| ≤ (n+1)!
. Bestimmt man n so, dass (n+1)!
< 10−6 gilt, dann
∑n
k
weiß man, dass k=0 xk! die Zahl ex auf 6 Dezimalstellen genau ergibt. Man erhält n = 9.
k
∑9
= 0.367879188712 . . . und somit 1e = 0.367879 auf 6 Dezimalstellen
Es gilt k=0 (−1)
k!
genau. Insbesondere hat man 1e > 13 , also e < 3. Das kann man verwenden, um |Rn+1 (x)|
für positive x abzuschätzen.
Beispiel: Wir entwickeln die Funktion f (x) = sin x für x ∈ R nach der Taylorformel.
Es gilt f ′ (x) = cos x, f ′′ (x) = − sin x, f ′′′ (x) = − cos x, f (4) (x) = sin x, f (5) (x) = cos x,
f (6) (x) = − sin x, und so weiter. Daraus erkennt man, dass f (k) (0) = 0 gilt, wenn k gerade
ist, und dass f (k) (0) abwechselnd +1 und −1 ist, wenn k ungerade ist. Daher folgt
sin x = x −
x3
3!
x5
5!
+
2n−1
x
sin c 2n
+ · · · + (−1)n−1 (2n−1)!
+ R2n (x) mit R2n (x) = (−1)n (2n)!
x
wobei entweder 0 ≤ c ≤ x oder x ≤ c ≤ 0 gilt. Es folgt |R2n (x)| ≤
1
2n
(2n)! |x| .
1
Es genügt, sin x für x ∈ (0, π2 ) zu berechnen. Für diese x gilt |R2n (x)| ≤ (2n)!
( π2 )2n .
∑n−1
x2k+1
1
Bestimmt man n so, dass (2n)!
( π2 )2n < 10−m gilt, dann gibt k=0 (−1)k (2k+1)!
den Wert
von sin x auf m Dezimalstellen genau an.
Um Entwicklungen für Logarithmus und Arcustangens zu finden, verwenden wir nicht
die Taylorformel, sondern gehen von folgender Gleichung aus, die für y ∈ (−1, 1) gilt
1
1−y
= 1 + y + y 2 + · · · + y n−1 +
yn
1−y
Sei −1 ≤ x < 1. Aus obiger Gleichung folgt dann für y ∈ (−1, 1)
1
1+y
+
1
1−y
=
2
1−y 2
2n
y
= 2(1 + y 2 + y 4 + · · · + y 2n−2 ) + 2 1−y
2
woraus man folgendes Resultat durch Integration von 0 bis x erhält
log
1+x
1−x
x3
3
= 2(x +
2n
+
x5
5
+ ··· +
x2n−1
2n−1 )
+ R2n+1 (x) mit R2n+1 (x) = 2
∫x
y 2n
0 1−y 2
dy
2n
y
x
Nun gilt | 1−y
2 | ≤ 1−x2 für alle y zwischen 0 und x. Aus Satz 4.16 und Satz 4.6 folgt dann
∫ x y2n
∫ x x2n
x2n
|R2n+1 (x)| ≤ 2 0 | 1−y
2 | dy ≤ 2 0 1−x2 dy = 2x 1−x2 im Fall x > 0, und |R2n+1 (x)| ≤
∫ 0 y2n
∫ 0 x2n
x2n
2 x | 1−y
2 |dy ≤ 2 x 1−x2 dy = −2x 1−x2 im Fall x < 0. Wir haben somit die Abschätzung
2n
x
|R2n+1 (x)| ≤ 2|x| 1−x
2 für alle x ∈ (−1, 1) erhalten.
1+x
Sei a > 1 beliebig. Wir setzen x = a−1
a+1 . Dann gilt 0 < x < 1 und a = 1−x . Man
1+x
kann dann obige Formel verwenden, um log a = log 1−x
auf eine bestimmte Anzahl von
Dezimalstellen zu berechnen.
Jetzt behandeln wir noch den Arcustangens. Da tan : (− π2 , π2 ) → R streng monoton
wachsend und stetig ist, existiert die Umkehrfunktion arctan : R → (− π2 , π2 ). Aus der
1
Formel für die Ableitung der Umkehrfunktion erhalten wir arctan′ x = 1+x
2.
Sei −1 ≤ x < 1. Aus obiger Formel mit −y 2 statt y ergibt sich
1
1+y 2
2n
y
= 1 − y 2 + y 4 − · · · + (−1)n−1 y 2n−2 + (−1)n 1+y
2
woraus man folgendes Resultat durch Integration von 0 bis x erhält
arctan x = x −
2n
x3
3
+
x5
5
−···+
(−1)n−1 x2n−1
2n−1
+ R2n+1 (x) mit R2n+1 (x) = (−1)n
∫x
y 2n
0 1+y 2
dy
y
2n
Nun gilt | 1+y
für alle y zwischen 0 und x. Aus Satz 4.16 und Satz 4.6 folgt wie
2| ≤ x
oben |R2n+1 (x)| ≤ |x| · x2n = |x|2n+1 für alle x ∈ (−1, 1).
Franz Hofbauer
63
Der arctan bietet die Möglichkeit, π zu berechnen. Es gilt π = 4(arctan 21 + arctan 13 ).
Das folgt aus der Formel tan(α + β) = (tan α + tan β)/(1 − tan α tan β), die man aus den
Summensätzen für sin und cos erhält. Setzt man α = arctan 12 und β = arctan 13 ein, so
ergibt sich tan(α + β) = ( 12 + 13 )/(1 − 12 · 13 ) = 1. Daraus folgt, dass α + β = π4 + kπ für
ein k ∈ Z gilt. Wegen α < arctan 1 = π4 und β < arctan 1 = π4 gilt α + β < π2 . Wegen
α > arctan 0 = 0 und β > arctan 0 = 0 gilt auch α + β > 0. Somit ist α + β = π4 , das heißt
π = 4(arctan 12 + arctan 31 ) gezeigt.
Die Berechnung von π ist auf die Berechnung von arctan 12 und arctan 13 zurückgeführt.
Diese kann man dann mit Hilfe obiger Entwicklung durchführen.
7. Reihen
Der Versuch, unendlich
∑∞ viele Zahlen ak ∈ R zu summieren,
∑nführt zur Definition von Reihen. Man schreibt k=0 ak . Für n ≥ 0 nennt man Sn = k=0 ak die n-te Partialsumme
der Reihe.
∑∞ Existiert der Grenzwert limn→∞ Sn und hat den Wert S, dann nennt man die
Reihe k=0 ak konvergent mit Summe S. Existiert limn→∞ Sn nicht, dann nennt man die
Reihe divergent.
∑∞
Das bekannteste Beispiel ist die geometrische Reihe. Das ist die Reihe k=0 q k für ein
q ∈ R. In diesem Fall kann man die Partialsummen direkt ausrechnen. Für n ≥ 0 gilt
n+1
Sn = 1−q
1−q , wenn q ̸= 1 ist, und Sn = n + 1, wenn q = 1 ist. Man sieht, dass die Reihe
1
. Wir
genau dann konvergiert, wenn |q| < 1 gilt. In diesem Fall hat man limn→∞ Sn = 1−q
∑∞ k
1
schreiben dann k=0 q = 1−q .
Kann man die Partialsummen nicht berechnen, dann sucht man nach ∑
Bedingungen,
n
unter denen die Reihe konvergiert. Man führt
∑∞ die Partialsummen S n = k=0 |ak | mit
Absolutbeträgen ein, und nennt die Reihe k=0 ak absolut konvergent, wenn die Folge
(S n )n≥0 konvergiert. Da die Folge (S n )n≥0 monoton
∑∞ wächst, ist sie genau dann konvergent,
wenn sie beschränkt ist. Man schreibt dann k=0 |ak | < ∞. Wir haben folgenden Satz
Satz 4.17: Eine absolut konvergente Reihe ist konvergent.
Beweis: Sei S = limn→∞ S n . Für n ≥ 0 sei Tn = S − S n . Es gilt limn→∞ Tn = 0 und
wegen S n ≤ S auch Tn ≥ 0. Für n ≥ 0 sei un = Sn − Tn und vn = Sn + Tn . Klarerweise
gilt dann Sn ∈ [un , vn ]. Weiters folgt un+1 = Sn + an+1 − Tn + |an+1 | ≥ Sn − Tn = un
und vn+1 = Sn + an+1 + Tn − |an+1 | ≤ Sn + Tn = vn , sodass [un+1 , vn+1 ] ⊆ [un , vn ] für
alle n ≥ 0 gilt. Schließlich haben wir auch vn − un = 2Tn für n ≥ 0. Wegen der Intervallschachtelungseigenschaft gibt es ein S, das in allen Intervallen [un , vn ] enthalten ist.
Wir zeigen limn→∞ Sn = S. Sei ε > 0 beliebig. Es gibt ein n0 mit 2Tn0 < ε. Wegen
S ∈ [un0 , vn0 ] folgt daraus [un0 , vn0 ] ⊆ (S − ε, S + ε). Wegen Sn ∈ [un , vn ] ⊆ [un0 , vn0 ] für
n ≥ n0 gilt auch Sn ∈ (S − ε, S + ε) für alle n ≥ n0 , das heißt limn→∞ Sn = S.
Es folgen Sätze, die Methoden angeben, mit denen man die Konvergenz oder Divergenz
einer Reihe nachprüfen kann.
∑∞
Satz 4.18: Wenn k=0 ak konvergiert, dann gilt limn→∞ an = 0.
∑n
Beweis: Sei Sn = k=0 ak . Nach Voraussetzung existiert S = limn→∞ Sn . Für n ≥ 1
gilt an = Sn − Sn−1 . Es folgt limn→∞ an = limn→∞ Sn − limn→∞ Sn−1 = S − S = 0.
∑∞
k
k
Es folgt sofort, dass k=0 k+1
nicht konvergiert, da limk→∞ k+1
nicht 0 ist.
64
Integration
∑∞
Satz 4.19: Es sei ak > 0 und bk > 0 für k ≥ 0. Wenn die ∑
Reihe k=0 bk konvergent und
∞
die Folge ( abkk )k≥0 beschränkt ist, dann ist auch die Reihe k=0 ak konvergent.
∑n
∑n
Beweis: Für n ≥ 0 sei Sn = k=0 ak und Tn = k=0 bk . Nach Voraussetzung gibt es
eine Konstante
∑∞ C mit ak ≤ Cbk für alle k ≥ 0, woraus Sn ≤ CTn für alle n ≥ 0 folgt. Da
die Reihe k=0 bk als konvergent vorausgesetzt wird, gilt limn→∞ Tn = T für ein T ∈ R.
Wegen bk > 0 ist die Folge (Tn )n≥0 monoton wachsend, woraus Tn ≤ T für alle n ≥ 0 folgt.
Somit gilt Sn ≤ CT für alle n ≥ 0 und da auch die Folge (Sn )n≥0
monoton wachsend ist,
∑∞
hat sie auch einen Grenzwert, womit die Konvergenz der Reihe k=0 ak gezeigt ist.
Dieser Satz gilt natürlich genauso, wenn die Summation
∑∞ nicht bei 0 beginnt, sondern bei
1 oder sonst irgendwo. Wir untersuchen die Reihe k=0 ak mit ak = 2kk . Sei bk = ( 23 )k .
Dann gilt limk→∞ abkk = limk→∞ ( 4k)k = 0, sodass die Folge ( abkk )k≥0 beschränkt ist. Da
3
∑∞
∑∞
b
eine
konvergente
geometrische
Reihe ist, ist auch k=0 ak konvergent.
k=0 k
Satz∑4.20: Sei f : [1, ∞) → (0, ∞) eine monoton fallende Funktion. Dann sind äquivalent
∞
(a) ∫ k=1 f (k) ist konvergent
∞
(b) 1 f (x) dx existiert
∫ k+2
Beweis: Um (a) ⇒ (b) zu zeigen, sei ak = k+1 f (x) dx und bk = f (k + 1) für k ≥ 0.
∑∞
Es gilt abkk ≤ 1 für k ≥ 0, da f monoton fallend ist. Da wir (a) voraussetzen, ist k=0 bk
∫∞
∑∞
konvergent. Wegen Satz 4.19 ist dann auch k=0 ak konvergent, das heißt 1 f (x)dx =
∫ n+2
∑n
limn→∞ 1
f (x) dx = limn→∞ k=0 ak existiert und (b) ist gezeigt.
∫ k+2
Um (b) ⇒ (a) zu zeigen, sei ak = f (k + 2) und bk = k+1 f (x) dx für k ≥ 0. Es gilt abkk ≤ 1
∑∞
für k ≥ 0, da f monoton fallend ist. Da wir (b) voraussetzen, ist k=0 bk konvergent
∫ n+2
∫∞
∑n
wegen limn→∞ k=0 bk = limn→∞ 1
f (x)dx = 1 f (x)dx. Nach Satz 4.19 ist dann
∑∞
∑∞
∑∞
k=0 ak konvergent, also auch
k=1 f (k) = f (1) +
k=0 ak , womit (a) gezeigt ist.
∑∞
Beispiel: Wir untersuchen die Konvergenz der Reihen k=1 k1α für α > 0. Das ist die
∑∞
Reihe k=1 f (k), wenn wir die Funktion f : [1, ∞) → (0, ∞) durch f (x) = x1α definieren.
Man
∫ ∞ sieht, dass f monoton fällt. Aus einem früheren Beispiel wissen wir, dass das Integral
f (x) dx existiert, wenn α > 1 ist, und nicht existiert, wenn α ≤ 1 ist. Aus Satz 4.20
1
∑∞
folgt dann, dass die Reihe k=1 k1α konvergiert, wenn α > 1 ist, und nicht konvergiert,
wenn α ≤ 1 ist.
∑∞
Beispiel: Die Reihe k=2 log1 k ist divergent. Es gilt log k ≤ k, sodass die Folge ( abkk )k≥2
∑∞
mit ak = k1 und bk = log1 k beschränkt ist. Wäre k=2 bk konvergent, dann müsste nach
∑∞
Satz 4.19 auch k=2 ak konvergent sein im Widerspruch zum letzten Beispiel.
Hilfe von Reihen ist es möglich, Funktionen zu definieren. Wir haben Polynome
∑Mit
n
k
c
definiert werden. Eine naheliegende
k=0 k x kennen gelernt, durch die Funktionen auf
∑R
∞
Verallgemeinerung sind sogenannte Potenzreihen k=0 ck xk , die man erhält, indem man
die Summe einfach bis ∞ laufen lässt. Allerdings muss man sich zuerst klar machen, für
welche x ∈ R eine Potenzreihe konvergiert. Dazu definieren wir den Limes superior einer
Folge.
Definition: Sei (ak )k≥0 eine beschränkte Folge. Für n ≥ 0 sei an = sup{ak : k ≥ n}.
Dann heißt limn→∞ an der Limes superior der Folge (ak )k≥0 . Er wird mit lim supk→∞ ak
bezeichnet.
Franz Hofbauer
65
Satz 4.21: Sei (ak )k≥0 eine beschränkte Folge. Dann existiert lim supk→∞ ak . Wenn
limk→∞ ak existiert, dann gilt lim supk→∞ ak = limk→∞ ak .
Beweis: Da (ak )k≥0 beschränkt ist, existieren Konstante c und d mit c ≤ ak ≤ d für
alle k ≥ 0. Für n ≥ 0 sei Mn = {ak : k ≥ n}. Da d eine obere Schranke der Menge
Mn ist, existiert an = sup Mn . Für n ≥ 0 gilt Mn+1 ⊆ Mn , also auch an+1 ≤ an wegen
Satz 3.6 (b). Die Folge (an )n≥0 ist somit monoton fallend. Für jedes n ≥ 0 ist c eine untere
Schranke von Mn und somit gilt c ≤ an nach Satz 3.6 (a). Also ist die Folge (an )n≥0 auch
nach unten durch c beschränkt. Aus Satz 3.4 folgt, dass limn→∞ an existiert, womit die
Existenz von lim supk→∞ ak gezeigt ist.
Es existiere a = limk→∞ ak . Sei ε > 0. Es gibt ein n0 mit a − 2ε < ak < a + 2ε für alle
k ≥ n0 . Für n ≥ n0 gilt dann Mn ⊆ (a − 2ε , a + 2ε ), das heißt a − 2ε ist eine untere und
a + 2ε ist eine obere Schranke von Mn . Wegen Satz 3.6 (a) folgt a − 2ε ≤ an ≤ a + 2ε für
n ≥ n0 . Wir haben |an − a| < ε für alle n ≥ n0 gezeigt. Somit gilt limn→∞ an = a, das
heißt lim supk→∞ ak = a.
√
∑∞
Definition: Sei k=0 ck xk eine Potenzreihe. Ist die Folge ( k |c√
k |)k≥1 nicht beschränkt,
k
dann sei T = ∞. Ist sie beschränkt, dann sei T = lim supk→∞ |ck |. Wir nennen dann
die Zahl R = T1 , die in [0, ∞] liegt, den Konvergenzradius der Potenzreihe.
∑∞
k
< R, dann
Satz 4.22: Sei
∑∞ k=0 ckk x eine Potenzreihe mit Konvergenzradius R. Gilt |x| ∑
∞
ist die Reihe k=0 ck x absolut konvergent. Gilt |x| > R, dann ist die Reihe k=0 ck xk
divergent.
√
Beweis: Für n ≥ 0 sei Mn = { k |ck | : k ≥ n} und an = sup Mn .
∑∞
Sei |x| > R. Angenommen k=0 ck xk ist konvergent.
Dann gilt limk→∞ ck xk = 0 nach
√
1
für k ≥ n0 . Insbesondere ist
Satz 4.18. Es gibt ein n0 mit |ck xk | ≤ 1, das heißt k |ck | ≤ |x|
√
√
k
k
die Folge ( |ck | )k≥1 beschränkt, sodass T = lim supk→∞ |ck | = limn→∞ an existiert.
1
1
1
Für n ≥ n0 ist |x|
eine obere Schranke von Mn , sodass auch an ≤ |x|
gilt. Es folgt T ≤ |x|
,
∑
∞
1
1
ein Widerspruch zu |x| < R = T . Damit ist die Divergenz von k=0 ck xk gezeigt.
Sei |x| < R. Insbesondere gilt R > 0 und T < ∞. Sei s ∈ (|x|, R), das heißt 1s > T . Wegen
√
T = limn→∞ an existiert ein n0 mit an0 < 1s , das heißt k |ck | < 1s für k ≥ n0 , da an0 eine
obere Schranke der Menge Mn0 ist. Sei q = |x|
. Dann gilt |ck xk | < q k für k ≥ n0 . Somit
( |ck xk | )
( s |c1 x| |c2 x2 |
)
|cn0 xn0 |
ist die Folge
durch
C
=
max
|c
|,
,
,
.
.
.
,
,
1
beschränkt. Da
n
2
0
k
q
q
q
k≥0
∑∞ k
∑q∞0
k
Konvergenz von k=0 |ck x | aus Satz 4.19.
k=0 q wegen q < 1 konvergiert,
∑∞folgt die
k
Das zeigt, dass die Potenzreihe k=0 ck x absolut konvergent ist.
Durch Potenzreihen kann man Funktionen definieren, wobei man mit Hilfe von Satz 4.22
ein Intervall bestimmt, auf dem die Potenzreihe∑
absolut konvergiert und somit die Funktion
∞
definiert ist. Zum Beispiel ist
durch f (x) = k=0 kxk eine Funktion auf dem Intervall
√
∑∞
(−1, 1) definiert, da limk→∞ k k = 1 und somit auch R = 1 gilt. Durch g(x) = k=0 k1k xk
√
ist eine Funktion auf ganz R = (−∞, ∞) definiert, da limk→∞ k 1/k k = limk→∞ k1 = 0
und somit R = ∞ gilt.
Für uns bereits bekannte Funktionen haben wir im letzten Kapitel Darstellungen durch
Potenzreihen gefunden. Man muss nur zeigen, dass die Restglieder mit n → ∞ gegen 0
m
gehen. Es gilt limm→∞ xm! = 0 für alle x ∈ R, da für eine fest gewählte Zahl u ∈ N mit
u
m
um−u−1
u
u u
|x| ≤ u die Abschätzung | xm! | ≤ uu! (u+1)(u+2)···(m−1)
m ≤ u m für alle m ≥ u erfüllt ist.
66
Integration
Im letzten Kapitel wurde ex =
∑n
xk
k=0 k!
e|x|
n+1
gezeigt.
(n+1)! |x|
∑n xk
limn→∞ k=0 k! = ex .
+ Rn+1 (x) und |Rn+1 (x)| ≤
Für alle x ∈ R gilt somit limn→∞ Rn+1 (x) = 0 und daher auch
∑∞ k
Damit haben wir die Reihendarstellung ex = k=0 xk! gefunden, die für alle x ∈ R gilt.
1
Die Restgliedabschätzung für sin x war |R2n (x)| ≤ (2n)!
|x|2n . Wie oben erhalten wir
∑∞ (−1)k 2k+1
damit die Reihendarstellung sin x = k=0 (2k+1)!
x
, die ebenfalls für alle x ∈ R gilt.
∑∞ (−1)k 2k
Für cos x lässt sich die Reihendarstellung cos x = k=0 (2k)! x herleiten. In der Reihendarstellung von sin x sind die Koeffizienten der geraden Potenzen gleich 0, und in der von
cos x die Koeffizienten der ungeraden Potenzen.
Auch auf die beiden anderen im letzten Kapitel behandelten Funktionen
sich diese
∑∞ lässt
1
1+x
1
Methode anwenden. Man erhält die Reihendarstellungen 2 log 1−x = k=0 2k+1 x2k+1 und
k
∑∞
2k+1
arctan x = k=0 (−1)
, die beide für x ∈ (−1, 1) gelten, da das Restglied R2n+1 (x)
2k+1 x
für beide Funktionen und für alle x ∈ (−1, 1) mit n → ∞ gegen 0 geht, wie man aus den
im letzten Kapitel gefundenen Abschätzungen für R2n+1 (x) leicht erkennt.
Der Konvergenzradius einer Potenzreihe ist mit der oben gegebenen Formel oft nur
schwierig oder gar nicht zu berechnen. Es gibt noch eine andere Möglichkeit, den Konvergenzradius zu berechnen, mit der es meistens leichter geht.
∑n
Satz 4.23: Sei (vk )k≥1 eine Folge und mn = n1 k=1 vn für n ≥ 1. Gilt limk→∞ vk = v,
dann auch limn→∞ mn = v.
Beweis: Sei ε > 0 vorgegeben. Da wir limk→∞
∑n0 vk = v voraussetzen, existiert ein n0 mit
|vk − v| < 2ε für k ≥ n0 . Sei n1 ≥ max(n0 , 2ε k=1
|vk − v|) gewählt. Für n ≥ n1 gilt dann
∑n
∑n0
1
1
|mn − v| ≤ n k=n0 +1 |vk − v| + n k=1 |vk − v| < n1 (n − n0 ) 2ε + nn1 2ε ≤ ε. Damit ist
limn→∞ mn = v gezeigt.
√
k
Satz 4.24: Sei uk > 0 für k ≥ 0. Gilt limk→∞ uuk−1
= T , dann auch limk→∞ k uk = T .
Beweis: Sei T > 0. Für k ≥ 1 sei vk = log uk − log
Voraussetzung gilt
∑nuk−1 . Nach
uk
1
1
limk→∞ vk = limk→∞ log uk−1 = log T . Sei mn = n k=1 vk = n log un − n1 log u0 für
n ≥ 1 . Aus Satz 4.23 folgt limn→∞ mn = log T und daher auch limn→∞ n1 log un = log T .
√
1
Daraus ergibt sich limn→∞ n un = limn→∞ e n log un = elog T = T .
Es fehlt noch der Beweis für T √
= 0. Die Ungleichung für geometrisches und arithmetisches
∑n
√
√
√
uk
u1
1
n un−1
n
n
n u
n
Mittel ergibt 0 ≤ un = u0 uun−1
0 n
k=1 uk−1 . Aus Satz 4.23 folgt
un−2 . . . u0 ≤
∑n
√
√
k
limn→∞ n1 k=1 uuk−1
= 0. Da limn→∞ n u0 = 1 gilt, erhalten wir limn→∞ n un = 0.
∑∞
Man hat also die Möglichkeit, den Konvergenzradius der Potenzreihe k=0 ck xk auch
k|
mit Hilfe von limk→∞ |c|ck−1
| zu berechnen, falls dieser Grenzwert existiert.
Beispiel: Wir berechnen den Konvergenzradius der Potenzreihe
|ck |
|ck−1 |
k
∑∞
k=0 ck x
k
mit ck =
kk
k! .
k (k−1)!
k k−1
1 k−1
= limk→∞ k!(k−1)
= limk→∞ (1+ k−1
)
=e
k−1 = limk→∞ ( k−1 )
√
1
k
und somit auch limk→∞ |ck | = e. Daher ist R = e der Konvergenzradius.
Es gilt limk→∞
V. Anhang
In diesem Anhang werden einige Anwendungen der Analysis in einer Variablen behandelt, und zwar die Ungleichungen zwischen geometrischen,∑
arithmetischen und noch viel
∞
allgemeineren Mitteln, die Stirlingsche Formel, die Reihe n=1 n12 , der Weierstraß’sche
Approximationssatz und Integration und Differenziation von Funktionenreihen.
1. Mittelungleichungen
Sei n ≥ 2 und seien a1 , a2 , . . . , an positive reelle Zahlen. Dann ist n1 (a1 + a2 + · · · + an )
√
das arithmetische und n a1 a2 . . . an das geometrische Mittel dieser Zahlen. Wir zeigen
zuerst, dass das geometrische immer kleiner oder gleich dem arithmetischen Mittel ist.
Dann beschäftigen wir uns mit Verallgemeinerungen.
Satz 5.1: Für n ∈ N und x ≥ −1 gilt (1 + x)n ≥ 1 + nx.
Beweis: mit Induktion. Für n = 1 hat man Gleichheit. Ist (1 + x)n ≥ 1 + nx bereits
gezeigt, dann folgt (1 + x)n+1 ≥ (1 + nx)(1 + x) = 1 + nx + x + nx2 ≥ 1 + (n + 1)x.
√
Satz 5.2: Sei n ≥ 1 und a1 , a2 , . . . , an > 0. Dann gilt n a1 a2 . . . an ≤ n1 (a1 +a2 +· · ·+an ).
Beweis: Wir führen den Beweis mit Induktion. Für n = 1 hat man a1 ≤ a1 , was natürlich
richtig ist. Wir nehmen an, dass die Ungleichung für n − 1 Zahlen gezeigt ist und beweisen
√
1
sie für n Zahlen. Wir setzen G = n−1 a1 a2 . . . an−1 und A = n−1
(a1 + a2 + · · · + an−1 ).
Dann ist G ≤ A bereits gezeigt. Wir schreiben a für an .
)n
( a
a
a
Wir setzen x = nA
≥A
− n1 in Satz 5.1 (es gilt x ≥ − n1 ≥ −1) und erhalten nA
+ n−1
.
n
( a+(n−1)A )n
n−1
n
≥ aA
Multiplikation mit A ergibt
. Mit der Induktionsvoraussetzung
n
( a+(n−1)A )n
( a +a +···+a )n
n−1
1
2
n
G ≤ A folgt
≥ aG
, das heißt
≥ a1 a2 . . . an . Zieht man
n
n
√
a1 +a2 +···+an
n
noch die n-te Wurzel, so hat man
a1 a2 . . . an . Das ist die gesuchte
≥
n
Ungleichung für n Zahlen.
Wir verallgemeinern diese
∑n Mittel. Wir nennen die Zahlen s1 , s2 , . . . , sn Gewichte, wenn
sie > 0 sind und wenn k=1 sk = 1 gilt. Das verallgemeinerte arithmetische Mittel der
Zahlen a1 , a2 , . . . , an ist dann s1 a1 +s2 a2 +· · ·+sn an und das verallgemeinerte geometrische
Mittel ist as11 as22 . . . asnn . Für s1 = s2 = · · · = sn = n1 erhält man die Standardversionen
dieser Mittel. Wir beweisen obige Ungleichung für die verallgemeinerten Mittel.
Satz 5.3: Für x > 0 gilt log x ≤ x − 1 und Gleichheit nur dann, wenn x = 1 ist.
Beweis: Sei f (x) = log x − x + 1. Wegen f ′ (x) = x1 − 1 haben wir f ′ (x) > 0 für x ∈ (0, 1)
und f ′ (x) < 0 für x ∈ (1, ∞). Somit ist f streng monoton fallend auf (0, 1) und streng
monoton wachsend auf (1, ∞). Wir erhalten f (x) ≥ f (1) = 0 für alle x ∈ (0, ∞), wobei
Gleichheit nur für x = 1 gilt.
Satz 5.4: Seien s1 , s2 , . . . , sn Gewichte. Für positive reelle Zahlen a1 , a2 , . . . , an , die nicht
alle gleich sind, gilt dann as11 as22 . . . asnn < s1 a1 + s2 a2 + · · · + sn an .
Beweis: Sei m = s1 a1 + s2 a2 + · · · + sn an . Für 1 ≤ k ≤ n folgt log amk ≤ amk − 1 aus
ak
k und wir hätten
Satz 5.3, wobei nicht immer Gleichheit gilt, sonst wäre
∑nm = 1 fürakalle ∑
n
a1 = a2 = · · · = an = m, ein Widerspruch. Es folgt k=1 sk log m < k=1 sk ( amk − 1).
∑n
∑
∑
∑
n
n
n
ak
1
Wegen k=1 sk amk = m
k=1 sk ak = 1 und
k=1 sk = 1 ergibt sich
k=1 sk log m < 0.
68
Anhang
∑n
∑n
∑n
Wegen log amk =∑
log ak − log m folgt k=1 sk log ak < k=1 sk log m. Da k=1 sk = 1
n
gilt, ergibt sich k=1 log askk < log m. Wendet man auf diese Ungleichung die Exponentialfunktion an, so hat man as11 as22 . . . asnn < m = s1 a1 + s2 a2 + · · · + sn an .
Seien a1 , a2 , . . . , an positive reelle Zahlen und s1 , s2 , . . . , sn Gewichte. Wir definieren
{ (∑
)1
n
x x
s
a
für x ∈ R \ {0}
k
k
k=1
h(x) =
s1 s2
sn
für x = 0
a1 a2 . . . an
Dann ist h(0) das geometrische, h(1) das arithmetische und h(−1) das harmonische Mittel.
Es sind die verallgemeinerte Versionen dieser Mittel.
Satz 5.5: Die Funktion g(x) = log h(x) ist im Punkt 0 stetig.
∑n
x
Beweis: Für x ̸= 0 gilt g(x) = log xu(x) mit u(x) =
k=1 sk ak . Wegen u(0) = 1
können wir limx→0 g(x) mit der Regel von de l’Hospital berechnen. Es gilt limx→0 g(x) =
′
∑n
∑n
(x)
limx→0 uu(x)
. Nun ist limx→0 u(x) = k=1 sk = 1 und wegen u′ (x) = k=1 sk axk log ak
∑n
∑n
ak . Somit ist limx→0 g(x) =
gilt limx→0 u′ (x) =
k=1 sk log ak berechnet.
k=1 sk log∑
n
s1 s2
sn
Da g(0) = log(a1 a2 . . . an ) = k=1 sk log ak gilt, haben wir gezeigt, dass g im Punkt 0
stetig ist.
Satz∑5.6: Seien s1 , s2 , . . . , sn Gewichte und r1 , r2 , . . . , rn seien ebenfalls Gewichte. Dann
n
gilt k=1 rk log srkk ≤ 0 und Gleichheit nur dann, wenn sk = rk für 1 ≤ k ≤ n.
∑n
∑n
∑n
∑n
Beweis: Es gilt k=1 rk log srkk ≤ k=1 rk ( srkk − 1) = k=1 sk − k=1 rk = 1 − 1 = 0
wegen Satz 5.3. Ebenfalls nach Satz 5.3 haben wir Gleichheit nur dann, wenn srkk = 1, das
heißt sk = rk für 1 ≤ k ≤ n gilt.
Satz 5.7: Seien a1 , a2 , . . . , an positive Zahlen, die nicht alle gleich sind, und s1 , s2 , . . . , sn
Gewichte. Die Funktion h : R → R ist dann stetig und streng monoton wachsend.
∑n
Beweis: Sei g(x) = log h(x). Für x ̸= 0 gilt g(x) = x1 log u(x) mit u(x) = k=1 sk axk .
′
(x)
Mit Hilfe der Produktregel erhalten wir dann g ′ (x) = − x12 log u(x) + x1 uu(x)
, das heißt
∑
∑
n
n
x
1
x
x
x
x2 g ′ (x) = − log u(x) + u(x)
k=1 sk ak log ak = − log u(x) + u(x)
k=1 sk ak log ak
∑n
sk ax
k
. Wegen
Sei rk = u(x)
k=1 rk = 1 sind die Zahlen r1 , r2 , . . . , rn Gewichte. Es kann
rk = sk nicht für alle k gelten, sonst wäre auch axk = u(x) für alle k erfüllt und wir hätten
∑n
folgt
a1 = a2 = · · · = an . Satz 5.6 ergibt dann k=1 rk log srkk < 0. Wegen srkk = u(x)
ax
k
∑n
∑
n
u(x)
u(x)
< 0. Nun gilt log ax = log u(x) − log axk und k=1 rk = 1, womit wir
k=1 rk log ax
k
k
∑n
sk ax
k
ein, so ergibt sich
log u(x) − k=1 rk log axk < 0 erhalten. Setzen wir noch rk = u(x)
x
∑n sk ak
log u(x) − k=1 u(x) log axk < 0. Damit ist x2 g ′ (x) > 0 gezeigt. Also gilt auch g ′ (x) > 0
für alle x ∈ R \ {0}.
Nach Satz 5.5 ist g im Punkt 0 stetig. Auf R \ {0} ist g sogar differenzierbar und hat
Ableitung > 0. Somit ist g auf ganz R stetig und streng monoton wachsend. Da aber
h(x) = eg(x) gilt, ist auch h auf ganz R stetig und streng monoton wachsend.
Satz 5.7 ergibt Ungleichungen für Mittel. Insbesondere gilt h(−1) < h(0) < h(1), das
sind Ungleichungen für das harmonische, geometrische und arithmetische Mittel.
Gilt a1 = a2 = · · · = an = a, dann ist h(x) = a für alle x ∈ R.
Franz Hofbauer
69
2. Die Stirlingsche Formel
Bevor wir zur Stirlingschen Formel kommen, behandeln wir das sogenannte Wallissche
Produkt.
∫π
∫ π2
2n−3
31π
2n 2n−2
42
Satz 5.8: Es gilt 02 sin2n x dx = 2n−1
sin2n+1 x dx = 2n+1
.
.
.
und
2n 2n−2
42 2
2n−1 . . . 5 3
0
∫π
∫π
für n ≥ 1. Weiters gilt 02 1dx = π2 und 02 sin x dx = 1, die Gleichungen für n = 0.
Beweis: Für k ≥ 2 berechnen wir mit Hilfe von partieller Integration
π2
∫ π2
∫ π2
∫π
k
k−1
k−1
+ (k − 1) 2 sink−2 x cos2 x dx
sin
x
dx
=
sin
x
sin
x
dx
=
−
sin
x
cos
x
0
0
0
0
∫ π2
∫ π2
k−2
k
= (k − 1) 0 sin
x dx − (k − 1) 0 sin x dx
Durch entsprechendes Umformen ergibt sich daraus dann
∫ π2
∫ π2
k
k−1
(1)
sin
x
dx
=
sink−2 x dx
k
0
0
∫π
∫π
Klarerweise gilt 02 1dx = π2 und 02 sin x dx = 1. Das sind die beiden Gleichungen
für n = 0. Nehmen wir also an, die beiden Gleichungen seien für n schon gezeigt. Mit
∫π
∫ π2
2n
2n−1 2n−3
31π
x dx = 2n+1
Hilfe von (1) folgt dann 02 sin2n+2 x dx = 2n+1
2n+2 0 sin
2n+2 2n 2n−2 . . . 4 2 2
π
∫ π2
∫
2n+1
2n 2n−2
42
2
und 0 sin2n+3 x dx = 2n+2
x dx = 2n+2
2n+3 0 sin
2n+3 2n+1 2n−1 . . . 5 3 , das sind die beiden
Gleichungen für n + 1. Somit ist der Satz durch Induktion bewiesen.
√ ( )
√1 .
Satz 5.9: Es gilt limn→∞ 22nn 2n
n =
π
Beweis: Für 0 ≤ x ≤ π2 gilt 0 ≤ sin x ≤ 1, woraus sinn x ≤ sinn−1 x für alle n ≥ 1 folgt.
∫π
∫π
∫π
∫π
Wir erhalten 02 sin2n x dx ≤ 02 sin2n−1 x dx und 02 sin2n+1 x dx ≤ 02 sin2n x dx, das
2n−3
31π
2n−2
42
2n 2n−2
42
2n−1 2n−3
31π
heißt 2n−1
2n 2n−2 . . . 4 2 2 ≤ 2n−1 . . . 5 3 und 2n+1 2n−1 . . . 5 3 ≤
2n 2n−2 . . . 4 2 2 wegen
22 42 ...(2n)2
π 2n+1
32 52 ...(2n−1)2 2n ≤ 2 2n für alle n ≥ 2. Da
22 42 ...(2n)2
π
aber limn→∞ 2n+1
2n = 1 gilt, erhalten wir limn→∞ 32 52 ...(2n−1)2 2n = 2 .
( ) 1·3·5···(2n−1)
1 2n
folgt. Obiger Grenzwert
Nun gilt 22n (n!)2 = 22 ·42 · · · (2n)2 , woraus 22n
n =
2·4···(2n)
√ ( )
( 1 (2n))2
√1 .
besagt, dass limn→∞ 2n 22n n
= π2 gilt. Daraus folgt limn→∞ 22nn 2n
n =
π
Satz 5.8. Durch Umformen ergibt sich
π
2
≤
Jetzt werden wir schrittweise die Stirlingsche Formel herleiten.
Satz 5.10: Es gilt 2x ≤ log
1+x
1−x
≤ 2x +
1+x
1−x − 2x =
2x2
= 1−x
2 . Man
Beweis: Sei f (x) = log
′
2x3
3(1−x2 )
für 0 ≤ x < 1.
log(1 + x) − log(1 − x) − 2x für x ∈ [0, 1). Dann gilt
f (x) =
+
−2
sieht, dass f ′ (x) ≥ 0 auf dem Intervall (0, 1) gilt. Die
Funktion f ist dort monoton wachsend. Es gilt somit f (x) ≥ f (0) = 0 für alle x ∈ [0, 1).
Damit ist die erste Ungleichung gezeigt.
1
1+x
1
1−x
2x3
1+x
2x3
3(1−x2 ) − log 1−x = 3(1−x2 )
2
2
4
2 3x (1−x )+2x
2x2
3x2 +x4
− 1−x
2 = 3(1−x2 )2 .
3
(1−x2 )2
Sei g(x) = 2x +
− f (x) für x ∈ [0, 1). Wieder berechnen wir
g ′ (x) =
Man sieht, dass g ′ (x) ≥ 0 auf dem Intervall
(0, 1) gilt. Die Funktion g ist dort monoton wachsend. Es gilt somit g(x) ≥ g(0) = 0 für
alle x ∈ [0, 1). Damit ist auch die zweite Ungleichung gezeigt.
n
√
Satz 5.11: Für n ≥ 1 sei an = nn!e
n n und bn = log an . Dann ist die Folge (bn )n≥1 monoton
1
fallend und hat einen Grenzwert b. Weiters gilt b ≤ bn ≤ b + 12n
für alle n ≥ 1.
70
Anhang
Beweis: Für n ≥ 1 gilt
mit x =
1
2n+1 .
an
an+1
1
n+ 2
= 1e ( n+1
. Es folgt bn − bn+1 = log
n )
Wegen Satz 5.10 gilt dann 0 ≤ bn − bn+1 ≤
an
an+1
x2
1
3(1−x2 ) = 12n
=
1
2x
−
1
12(n+1) .
log
1+x
1−x
−1
1
. Die Folge (bn )n≥1 ist dann monoton fallend und die Folge
Für n ≥ 1 sei cn = bn − 12n
(cn )n≥1 ist monoton wachsend. Da bn ≥ cn ≥ c1 für alle n ≥ 1 gilt, ist die Folge (bn )n≥1
nach unten durch c1 beschränkt. Somit existiert ein b mit limn→∞ bn = limn→∞ cn = b.
1
Weiters gilt cn ≤ b ≤ bn , das heißt b ≤ bn ≤ b + 12n
für alle n ≥ 1.
√
n
√
Satz 5.12 (Stirlingsche Formel) Es gilt limn→∞ nn!e
2π.
n n =
n
√
Beweis: Für n ≥ 1 sei an = nn!e
n n und bn = log an wie in Satz 5.11 und b sei der dort
gefundene Grenzwert der Folge (bn )n≥1 . Dann gilt limn→∞ an = a mit a = eb .
√
( )
(2n)! e2n
n
n2n n
√
√ 2n für n ≥ 1. Es gilt limn→∞ a2n
√1
=
Weiters gilt aa2n
= (2n)
2
2
2n
2n 2n (n!) e
a2 =
22n 2 n
2π
n
n
wegen Satz 5.9. Da aber auch limn→∞ aa2n
= aa2 = a1 gelten muss, erhalten wir a1 = √12π
2
n√
√
n
√
und a = 2π. Damit ist limn→∞ nn!e
2π gezeigt.
n n =
√
√
n
1
√
Aus Satz 5.11 erhalten wir für alle n ≥ 1 die Abschätzung 2π ≤ nn!e
2π e 12n ,
n n ≤
√
√
√
n
n
1
das heißt n en2πn ≤ n! ≤ n en2πn e 12n , da a = eb = 2π im Beweis von Satz 5.12 gezeigt
wurde.
3. Die Reihe
∑∞
1
n=1 n2
∑∞
In der Analysis zeigt man, dass die Reihe n=1 n1α für α > 1 konvergent ist. Somit
∑∞ 1
∑∞
1
ist die Reihe A =
n=1 n2 konvergent. Ebenso sind die Reihen U =
n=1 (2n−1)2
∑∞
1
und G = n=1 (2n)
2 konvergent, da sie durch Streichen von Gliedern aus obiger Reihe
entstehen. Es gelten die Gleichungen A = 4G und A = U + G. Man erhält sie durch
Grenzübergang aus entsprechenden Gleichungen für Partialsummen. Es folgt A = 43 U .
Satz 5.13: Für m ≥ 1 gilt
∑2m−1
n=1
1
(2n−1)π
sin2 m+1
2
=
4m
2 .
Beweis: Wegen sin 2α = 2 sin α cos α, sin2 α + cos2 α = 1 und cos α = sin(α + π2 ) erhalten
wir sin21 2α = 14 ( sin12 α + cos12 α ) = 14 ( sin12 α + sin2 (1π +α) ). Wir zeigen
2
∑2m
1
(1)
= 4m für m ≥ 0
n=1
2 (2n−1)π
sin
2m+1
durch Induktion nach m. Für m = 0 haben wir
1
sin2
π
2
= 1, eine richtige Gleichung.
Wir nehmen an,( dass (1) bereits gezeigt ist. Setzt
man oben α = (2n−1)π
2m+2 , so hat man
)
1
1
1
1
. Setzt man das in (1) ein, dann erhält
(2n−1)π = 4
(2n−1)π +
(2m+1 +2n−1)π
sin2 m+1
sin2 m+2
sin2
2
2
2m+2
∑2m
∑2m
1
man 14 n=1 2 (2n−1)π
+ 14 n=1 2 (2(2m1 +n)−1)π = 4m . Das kann man in eine Summe
sin
sin
2m+2
2m+2
zusammenfassen, da n in der ersten Summe von 1 bis 2m läuft und 2m + n in der zweiten
∑2m+1
1
Summe von 2m +1 bis 2m+1 . Man erhält n=1
= 4m+1 . Das ist die Gleichung
2 (2n−1)π
sin
2m+2
in (1) für m + 1 anstelle von m. Damit ist (1) durch Induktion bewiesen.
1
1
. Daran erkennt man, dass in
Wegen sin(π − α) = sin α gilt 2 (2m+1
= 2 (2n−1)π
−2n+1)π
sin
2m+1
sin
2m+1
(1) der (2 −n+1)-te Summand und der n-te Summand gleich sind. Die Summe der ersten
m
Franz Hofbauer
71
2m−1 Summanden ist daher gleich der Summe der übrigen 2m−1 Summanden. Summiert
man in (1) nur über die ersten 2m−1 Summanden, dann erhält man auch nur den halben
∑2m−1
m
1
Wert, das heißt n=1
= 42 .
2 (2n−1)π
sin
Satz 5.14: Es gilt
∑∞
1
n=1 (2n−1)2
Beweis: Für 0 < x <
1
sin2 x
m−1
2
2m+1
π
2
=
π2
8 .
gilt bekanntlich sin x < x < tan x = √ sin x 2 , woraus wir dann
1−sin x
(2n−1)π
>
− 1 erhalten. Setzt man x = 2m+1 und summiert über n von 1 bis
>
∑2m−1 4m+1
m
4m
m−1
für m ≥ 1 mit Hilfe von
, dann erhält man 42 > n=1 (2n−1)
2 π2 >
2 − 2
m−1
∑
2
2
2
π
1
π2
π2
5.13. Multiplikation mit 4m+1
ergibt π8 > n=1 (2n−1)
2 > 8 − 2m+3 . Lässt man
1
x2
1
sin2 x
Satz
m gegen ∞ gehen, dann ist der Satz schon bewiesen.
Mit den eingangs durchgeführten Überlegungen folgt jetzt
∑∞
1
n=1 n2
=
4 π2
3 8
=
π2
6 .
4. Der Weierstraßsche Approximationssatz
Sei f : [0, 1] → R eine stetige Funktion. Der Weierstraßsche Approximationssatz besagt,
dass man f beliebig gut durch∑
Polynome (approximieren
kann. Man kann
)
( ) diese Polynome
n
k n k
k n k
n−k
sogar angeben. Sei Pn (x) = k=0 f ( n ) k x (1 − x)
. Da f ( n ) k x (1 − x)n−k ein
Polynom in der Variable x ist, ist Pn (x) als Summe dieser Polynome ebenfalls ein Polynom.
Wir zeigen, dass limn→∞ Pn (x) = f (x) für alle x ∈ [0, 1] gilt.
( )
Zur Abkürzung setzen wir wn,k (x) = nk xk (1 − x)n−k . Insbesondere ist wn,n (x) = xn
∑n
k
und wn,0 (x) = (1 − x)n . Es gilt dann Pn (x) =
k=0 f ( n )wn,k (x). Wir beginnen mit
Hilfsresultaten.
Satz
∑n 5.15: Sei n ≥ 2 und
∑n x ∈ [0, 1]. 2Dann gilt wn,k (x) ≥ 0 für 0 ≤ k ≤ n. Weiters gilt
w
(x)
=
1
und
k=0 n,k
k=0 (k − nx) wn,k (x) = nx(1 − x).
( )
Beweis: Die Zahlen wn,k (x) = nk xk (1 − x)n−k für 0 ≤ k ≤ n sind gerade die in der
Binomialverteilung auftretenden
Wahrscheinlichkeiten.∑Sie sind ≥ 0 und ihre Summe ist 1.
∑n
n
Der Erwartungswert k=0 kwn,k (x) ist nx. Somit ist k=0 (k − nx)2 wn,k (x) die Varianz,
die gleich nx(1 − x) ist. Das kennt man aus der Wahrscheinlichkeitstheorie.
Satz 5.16: Sei n ≥ 2 und x ∈ [0, 1] beliebig. Wir definieren
∑ Kn = {0, 1, 2, . . . , 1n} und
k
Jn,δ (x) = {k ∈ Kn : |x − n | ≥ δ}. Für alle δ > 0 gilt dann k∈Jn,δ (x) wn,k (x) ≤ 4nδ2 .
(
)2
Beweis: Für k ∈ Jn,δ (x) gilt 1 ≤ k−nx
. Wir erhalten daher
nδ
( k−nx )2
∑
∑
∑n
wn,k (x) ≤ n21δ2 k=0 (k − nx)2 wn,k (x)
k∈Jn,δ (x) wn,k (x) ≤
k∈Jn,δ (x)
nδ
∑n
Nach Satz 5.15 gilt k=0∑
(k − nx)2 wn,k (x) = nx(1 − x). Das Maximum der Funktion
n
x(1 − x) ist 41 . Somit gilt k=0 (k − nx)2 wn,k (x) = nx(1 − x) ≤ n4 für alle x ∈ [0, 1]. Setzt
∑
1
man das oben ein, so hat man k∈Jn,δ (x) wn,k (x) ≤ 4nn2 δ2 = 4nδ
2.
Eine Funktion f : [a, b] → R heißt gleichmäßig stetig, wenn für jedes ε > 0 ein δ > 0
existiert, sodass für alle x und y in [a, b] mit |x − y| < δ sich die Funktionswerte f (x) und
f (y) um weniger als ε voneinander unterscheiden, das heißt |f (x) − f (y)| < ε erfüllt ist.
Nach Satz 4.12 ist jede Funktion f : [a, b] → R, die stetig ist, bereits gleichmäßig stetig.
72
Anhang
Satz 5.17 (Weierstraßscher
Sei f : [0, 1] → R eine stetige Funktion
( ) Approximationssatz)
∑n
k n k
n−k
. Für jedes ε > 0 existiert dann ein n0 , sodass
und Pn (x) = k=0 f ( n ) k x (1 − x)
|f (x) − Pn (x)| < ε für alle n ≥ n0 und alle x ∈ [0, 1] gilt (n0 hängt nur von ε, nicht aber
von x ab).
Beweis: Sei ε > 0 vorgegeben. Da f : [0, 1] → R stetig und somit auch gleichmäßig stetig
ist, existiert ein δ > 0, sodass |f (x) − f (y)| < 2ε für alle x, y ∈ [0, 1] mit |x − y| < δ gilt.
Weiters ist f beschränkt. Es existiert ein c > 0, sodass |f (x)| ≤ c für alle x ∈ [0, 1] gilt.
Wir wählen dann n0 so groß, dass n0cδ2 < ε gilt.
Sei x ∈ [0, 1] beliebig. Sei Kn = {0, 1, 2, . . . , n}, In,δ (x) = {k ∈ Kn : |x − nk | < δ} und
Jn,δ (x) = {k ∈ Kn : |x − nk | ≥ δ}. Dann ist Kn die disjunkte Vereinigung von In,δ (x) und
Jn,δ (x). Für k ∈ In,δ (x) gilt |x − nk | < δ und daher auch |f (x) − f ( nk )| < 2ε . Es folgt
∑
∑
∑n
ε
ε
ε
k
k∈In,δ (x) |f (x) − f ( n )|wn,k (x) <
k∈In,δ (x) 2 wn,k (x) ≤ 2
k=0 wn,k (x) = 2
wobei auch Satz 5.15 verwendet wurde. Wegen |f (x) − f ( nk )| ≤ |f (x)| + |f ( nk )| ≤ 2c folgt
∑
∑
k
c
k∈Jn,δ (x) |f (x) − f ( n )|wn,k (x) ≤
k∈Jn,δ (x) 2c wn,k (x) ≤ 2nδ 2
c
c
ε
mit Satz 5.16. Ist jetzt n ≥ n0 , dann gilt 2nδ
2 ≤ 2n δ 2 < 2 und mit Satz 5.15 erhalten wir
0
)
∑n (
∑n
|f (x) − Pn (x)| = | k=0 f (x) − f ( nk ) wn,k (x)| ≤ k=0 |f (x) − f ( nk )|wn,k (x)
∑
∑
c
≤ k∈In,δ (x) |f (x) − f ( nk )|wn,k (x) + k∈Jn,δ (x) |f (x) − f ( nk )|wn,k (x) < 2ε + 2nδ
2 < ε
Damit ist |f (x) − Pn (x)| < ε für alle n ≥ n0 gezeigt und der Satz ist bewiesen.
Man kann dieses Resultat noch ein wenig anders aufschreiben. Für eine Funktion
g : [0, 1] → R definieren wir die sogenannte Supremumsnorm ∥g∥∞ = supx∈[0,1] |g(x)|.
Dann lässt sich Satz 5.17 ∑
folgendermaßen
Wenn f : [0, 1] → R eine stetige
( ) schreiben:
n
k n k
n−k
Funktion ist und Pn (x) = k=0 f ( n ) k x (1 − x)
, dann existiert für jedes ε > 0 ein
n0 ≥ 1, sodass ∥f − Pn ∥∞ < ε für alle n ≥ n0 gilt. Das heißt limn→∞ ∥f − Pn ∥∞ = 0.
5. Reihendarstellungen von Funktionen
Wir beginnen mit einem Satz über gliedweise Integration.
Satz 5.18: Sei I ein offenes Intervall, das auch unbeschränkt sein darf, und a ∈ I fest
gewählt. Für n ∑
≥ 0 sei gn : I → R eine stetige Funktion. Weiters seien Zahlen cn > 0
∞
vorgegeben mit n=0 cn = d < ∞
und |gn (x)| ≤ cn für alle x ∈ I und alle n ≥ 0. Für
∑∞
alle
x
∈
I
existiert
dann
g(x)
=
n=0 gn (x). Weiters ist g auf ganz I stetig und es gilt
∫x
∑∞ ∫ x
g(t)dt = n=0 a gn (t)dt.
a
∑∞
Beweis:
Sei
x
∈
I
beliebig.
Da
n=0 cn < ∞ und |gn (x)| ≤ cn für alle n ≥ 0 gilt, erhalten
∑∞
∑
∞
wir n=0 |gn (x)| < ∞. Die Reihe n=0 gn (x) ist somit absolut konvergent
∑∞ und daher nach
einem Satz aus der Analysis auch konvergent. Wir schreiben g(x) = n=0 gn (x).
∑k−1
∑k−1
Sei dk = d − n=0 cn für k ≥ 0. Wegen limk→∞ n=0 cn = d erhalten wir limk→∞ dk = 0.
∑k−1
Sei x ∈ I beliebig und k ≥ 0. Wir setzen hk (x) = n=0 gn (x). Für m ≥ k ergibt sich dann
∑m
∑m
∑m
∑m
∑m
∑k−1
| n=0 gn (x) − hk (x)| = | n=k gn (x)| ≤ n=k |gn (x)| ≤ n=k cn ≤ n=0 cn − n=0 cn .
Lassen wir m gegen ∞ gehen, so erhalten wir
(1)
|g(x) − hk (x)| ≤ dk
für alle x ∈ I und alle k ≥ 0
Um zu zeigen, dass g im Punkt x ∈ I stetig ist, sei ε > 0 vorgegeben. Sei k so gewählt,
dass dk < 3ε gilt. Da hk als Summe endlich vieler stetiger Funktionen stetig ist, existiert
Franz Hofbauer
73
ein δ > 0 mit |hk (x) − hk (y)| < 3ε für alle y ∈ (x − δ, x + δ) ∩ I. Mit (1) erhalten wir dann
|g(x) − g(y)| ≤ |g(x) − hk (x)| + |hk (x) − hk (y)| + |hk (y) − g(y)| < 3ε + 3ε + 3ε = ε für alle
y ∈ (x − δ, x + δ) ∩ I. Damit ist gezeigt, dass g im Punkt x stetig ist.
Aus (1) folgt auch
∫ x g(t)−dk ≤ hk (t) ≤ g(t)+d
∫ x k für alle ∫t x∈ I und k ≥ 0. Integriert man von
a bis x so folgt a g(t) dt − dk (x − a) ≤ a hk (t)dt ≤ a g(t)dt + dk (x − a). Die Integrale
existieren, da g und hk stetige Funktionen sind. (Wenn x kleiner als a ist, dann drehen
dass man das
sich die Ungleichheitszeichen um.) Setzt man für hk (t) ein und beachtet,
∫x
Integral und die endliche Summe vertauschen darf, so erhält man a g(t)dt − dk (x − a) ≤
∫x
∑k−1 ∫ x
Jetzt kann man den Grezwert für k → ∞ bilden.
n=0 a gn (t)dt ≤ a g(t)dt+dk (x−a).
∑k−1 ∫ x
∑∞ ∫ x
Wegen limk→∞ dk = 0 existiert n=0 a gn (t) dt = limk→∞ n=0 a gn (t)dt und es gilt
∫x
∑∞ ∫ x
g(t)dt
=
n=0 a gn (t)dt.
a
Beispiel: ∑
Sei 0 < α < 1 und I = (−α, α). Für n ≥ 0 sei gn (x) = 2x2n und cn = 2α2n .
∞
2
Dann gilt n=0 cn = 1−α
2 < ∞ und |gn (x)| ≤ cn für alle x ∈ I und n ≥ 0. Die Voraus∑∞
2
1
1
setzungen von Satz 5.18 sind erfüllt. Es folgt g(x) = n=0 gn (x) = 1−x
2 = 1+x + 1−x
∫x
x
1+x
und 0 g(y)dy = log(1 + y) − log(1 − y)0 = log(1 + x) − log(1 − x) = log 1−x
. Weiters
∫x
2n+1
2y 2n+1 x
gilt 0 gn (y) dy = 2n+1 0 = 2x
2n+1 . Wegen Satz 5.18 erhalten wir die Reihendarstellung
∑∞ 2x2n+1
1+x
log 1−x = n=0 2n+1 , die für alle x ∈ (−α, α) gilt. Da α beliebig nahe an 1 gewählt
werden kann, gilt sie für alle x ∈ (−1, 1).
Beispiel: Sei wieder ∑
0 < α < 1 und I = (−α, α). Für n ≥ 0 sei gn (x) = (−1)n x2n und
∞
1
2n
cn = α . Dann gilt n=0 cn = 1−α
2 < ∞ und |gn (x)| ≤ cn für alle x ∈ I und n ≥ 0.
∑∞
1
Die Voraussetzungen von Satz 5.18 gelten. Wir erhalten g(x) = n=0 gn (x) = 1+x
2 und
x
∫x
∫x
n 2n+1
n 2n+1 x
y
= (−1) x
.
g(y)dy = arctan y 0 = arctan x. Weiters gilt 0 gn (y)dy = (−1)2n+1
2n+1
0
∑∞ (−1)0n x2n+1
Wegen Satz 5.18 erhalten wir die Reihendarstellung arctan x = n=0
, die für
2n+1
alle x ∈ (−α, α) gilt. Da α beliebig nahe an 1 gewählt werden kann, gilt sie für x ∈ (−1, 1).
Satz 5.19: Sei I ein offenes Intervall, das auch unbeschränkt sein darf. Für
∑∞alle n ≥ 0
sei fn : I → R stetig differenzierbar. Weiters seien cn > 0 vorgegeben
mit
n=0 cn < ∞
∑∞
′
und |fn (x)| ≤ cn für alle x ∈ I und alle n ≥ 0. Wenn f (x) = n=0
∑∞fn (x) für alle x ∈ I
existiert, dann ist f auf ganz I differenzierbar und es gilt f ′ (x) = n=0 fn′ (x).
Beweis: Wir verwenden Satz 5.18. Sei gn = fn′ für n ≥ 0 und a ∈ I fest ∑
gewählt. Dann
∞
sind die Voraussetzungen von Satz 5.18 erfüllt. ∫Dieser besagt, dass∫g(x) = n=0 fn′ (x) für
∑
x
x
∞
alle x ∈ I existiert, dass g stetig ist und dass a g(t) dt = n=0 a fn′ (t)dt gilt. Wegen
∫x ′
∫x
∑∞
∑∞
f (t) dt = fn (x) − fn (a) erhalten wir a g(t)dt = n=0 fn (x) − n=0 fn (a). Nach
a n
∫x
Voraussetzung konvergieren diese Reihen und es folgt a g(t) dt = f (x) − f (a). Nach dem
∫y
Mittelwertsatz der Integralrechnung gilt f (y) − f (x) = x g(t)dt = (y − x)g(c) für ein c
zwischen x und y. Dividiert man durch
∑∞y − x und lässt y gegen x gehen, so erhält man
f ′ (x) = g(x). Damit ist auch f ′ (x) = n=0 fn′ (x) gezeigt.
∑∞
∑∞
Beispiel: Eine Reihe der Form 21 a0 + n=1
n cos nx +
n=1 bn sin nx heißt Fourierreihe.
∑a∞
Wir untersuchen nur die Sinusreihe f (x) = n=1 bn sin nx mit bn ∈ R. Wir setzen fn (x) =
b∑
n sin nx. Aus Satz 5.18 folgt, dass f (x) für alle x ∈ R existiert und stetig ist, wenn
∞
j=1 |bn | < ∞ gilt, da ja |fn (x)| = |bn sin nx| ≤ |bn | für alle x ∈ R und n ≥ 1 erfüllt ist.
Wegen fn′ (x) = nbn cos nx gilt außerdem |fn′ (x)| ≤ n|bn | für alle x ∈ R und n ≥ 1. Ist
74
Anhang
∑∞
daher j=1 n|bn | < ∞ erfüllt, dann ist f nach Satz 5.19 auf ganz R differenzierbar mit
∑∞
f ′ (x) = n=1 nbn cos nx. Für die Cosinusreihe gelten analoge Resultate.
∑∞
n
Beispiel: Wir untersuchen
Potenzreihen
f
(x)
=
n=0 cn x mit Koeffizienten cn in R.
√
Sei T = lim supn→∞ n |cn |. Man nennt R = T1 den Konvergenzradius der Potenzreihe. Ist
T = 0, dann setzen wir R = ∞.
Sei 0 < α < R und I = (−α, α). Wir setzen fn (x) = cn xn für n ≥ 0. Wegen
0<α<R
√
n
gilt αT < 1. Wir wählen q mit
αT < q < 1. Es folgt lim supn→∞ α |cn | = αT < q,
√
n
sodass ein n0 existiert mit α |cn | < q für alle n ≥ n0 , also auch αn |cn | < q n . Wählen
wir eine Konstante k,
groß genug ist, dann gilt αn |cn | < kq n für alle n ≥ 0. Wegen
∑die
∞
k
< ∞. Ist x ∈ I, dann gilt |fn (x)| ≤ |cn |αn < kq n
0 < q < 1 gilt auch n=0 kq n = 1−q
∑∞
∑∞
für alle n ≥ 0. Aus Satz 5.18 folgt daher, dass f (x) = n=0 fn (x) = n=0 cn xn für alle
x ∈ I = (−α, α) existiert. Da α beliebig nahe an R gewählt werden kann, gilt das für alle
x ∈ (−R, R). Daher heißt R auch Konvergenzradius der Potenzreihe.
n−1
Für x ∈ I = (−α, α) und n ≥ 0 gilt auch |fn′ (x)| ≤ n|cn |αn−1 ≤ kq
. Weα nq
∑∞
∑
m
m−1
1−q
1
n−1
n
≤ (1−q)2 < ∞ (Differenzieren von
= 1−q nach q ergibt
gen
n=0 nq
n=0 q
∑m−1 n−1
m
m−1
1−q
−mq
1
= (1−q)
≤ (1−q)
2 +
2 und dann m → ∞) können wir Satz 5.19
n=0 nq
1−q
anwenden.
besagt,
auf dem
I = (−α, α) differenzierbar ist mit
∑∞Dieser
∑∞ dass f n−1
∑∞Intervalln−1
′
′
f (x) = n=0 fn (x) = n=0 ncn x
= n=1 ncn x
. Da α beliebig nahe an R gewählt
werden kann, gilt das wieder für alle x ∈ (−R, R).
Inhaltsverzeichnis
I. Reelle Zahlen und stetige Funktionen
1.
2.
3.
4.
5.
6.
7.
8.
Dezimalzahlen
Ordnung
Intervallschachtelungseigenschaft
Folgen und deren Grenzwerte
Funktionen
Stetigkeit
Zwischenwertsatz und Umkehrfunktion
Potenzfunktion
1
1
4
6
10
13
16
18
20
II. Differenzierbarkeit
23
1.
2.
3.
4.
5.
6.
7.
8.
9.
23
25
27
30
31
32
35
39
40
Grenzwerte von Funktionen
Die Ableitung
Monotonieverhalten von Funktionen
Extremwerte
Gleichungen und Ungleichungen
Trigonometrische Funktionen
Exponentialfunktion und Logarithmus
Regel von de l’Hospital
Komplexe Zahlen
III. Beweise durch Intervallschachtelung
42
1. Intervallhalbierung
2. Infimum und Supremum
42
43
IV. Integration
46
1.
2.
3.
4.
5.
6.
7.
46
54
54
57
60
60
63
Definition und Eigenschaften des Integrals
Gleichmäßige Stetigkeit
Anwendungen des Integrals
Verallgemeinerte Riemannsummen
Uneigentliche Integrale
Approximation von Funktionen durch Polynome
Reihen
V. Anhang
67
1.
2.
3.
4.
5.
67
69
70
71
72
Mittelungleichungen
Die Stirlingsche
∑∞ Formel
Die Reihe n=1 n12
Der Weierstraßsche Approximationssatz
Reihendarstellungen von Funktionen
Herunterladen