Analysis in einer Variablen

Analysis in einer Variablen
Eine Vorlesung für das
Lehramtsstudium
Franz Hofbauer
SS 2009
Vorwort
Die Lehramtsausbildung sollte sich an der Berufsrealität der Lehrer orientieren. Deshalb
wird in diesem Skriptum ein Zugang zur Analysis gewählt, der nahe an der Mathematik
im Schulunterricht bleibt. Die reellen Zahlen werden als Dezimalzahlen eingeführt, die auf
der Zahlengerade angeordnet sind. Es ist dann nicht schwer, die Intervallschachtelungseigenschaft zu beweisen. Diese Version der Vollständigkeit der reellen Zahlen hat auch den
Vorteil, dass man sie unmittelbar anwenden kann, zum Beispiel zum Berechnen der Wurzel
einer positiven reellen Zahl oder zur Bestimmung der Fläche des Einheitskreises.
Mit Hilfe einer Intervallhalbierungsmethode kann man dann den Zwischenwertsatz, den
Satz von Bolzano-Weierstraß und den Satz über das Supremum einer beschränkten Menge
beweisen. Diese Beweise sind in einem eigenen Kapitel zusammengefasst.
Grenzwerte, Stetigkeit und Diﬀerenzierbarkeit werden wie üblich behandelt. Als zusätzliche Anwendungsmöglichkeit der Ableitung werden einige wichtige Ungleichungen bewiesen.
Die trigonometrischen Fuktionen werden am Einheitskreis definiert. Geometrische Überlegungen helfen dann, die Summensätze zu beweisen und die Ungleichungen zu finden, die
für die Berechnung der Ableitung gebraucht werden.
Die Exponentialfunktion beschreibt kontinuierliches Wachstum. Ist x der jährliche Zinssatz und unterteilt man das Jahr in n gleich lange Perioden, an deren Enden die Zinsen
gutgeschrieben werden, dann wächst das Startkapital um den Faktor (1 + nx )n in einem
Jahr. Im Grenzwert n → ∞ erhält man kontinuierliches Wachstum. Das ergibt die
Definition der Exponentialfunktion. Mit Hilfe von entsprechenden Ungleichungen kann
die Existenz dieses Grenzwertes bewiesen werden. Ebenso findet man die Rechenregeln
und die Ableitung der Exponentialfunktion.
√
Die Umkehrfunktion von x 7→ (1 + nx )n ist x 7→ n( n x − 1). Als Grenzwert dieser
Funktionen ergibt sich der Logarithmus.
Das Riemmannintegral wird wie üblich mit Hilfe von Ober- und Untersummen eingeführt
und dann der Hauptsatz bewiesen. Aus den Rechenregeln für die Ableitung erhält man die
für das Integral. Schließlich wird noch die Taylorformel behandelt, um die oben genannten
Funktionen und einige andere in Potenzreihen entwickeln zu können.
Reihen und insbesondere Potenzreihen sind für diesen Zugang zur Analysis nicht notwendig. Sie werden daher kurz am Ende des Skriptums behandelt.
Im Anhang findet man einige interessante Anwendungen und Ergänzungen.
I. Reelle Zahlen und stetige Funktionen
Wir führen die reellen Zahlen als Dezimalzahlen ein, die wir uns auf der Zahlengerade
angeordnet vorstellen. Dadurch ist auch eine Ordnungsrelation festgelegt. Wir zeigen
dann, dass die Intervallschachtelungseigenschaft gilt. Sie wird später zum Beweis der
grundlegenden Sätze wie Zwischenwertsatz, Mittelwertsatz und Satz über die Konvergenz
monotoner Folgen verwendet.
Der Begriﬀ des Grenzwerts spielt die Hauptrolle in der Analysis. Wir beginnen daher
mit der Untersuchung von Folgen und deren Grenzwerten. Dann führen wir Funktionen
ein. Beispiele dafür sind Polynome und rationale Funktionen. Wesentlich ist der Begriﬀ
der Stetigkeit. Für stetige Funktionen gilt der Zwischenwertsatz. Damit beweist man
unter anderem die Existenz der Umkehrfunktion, die zur Einführung der Wurzelfunktion
und damit auch der Potenzfunktion verwendet wird.
1. Dezimalzahlen
Die Geschichte der Zahlen beginnt mit dem Zählen. Dadurch erhält man die natürlichen
Zahlen N = {1, 2, 3, . . . }. Fügt man auch noch die Null und die negativen Zahlen hinzu,
so erhält man die ganzen Zahlen
Z = {. . . , −3, −2, −1, 0, 1, 2, 3, 4, . . . }
Ganze Zahlen kann man addieren und multiplizieren und erhält dadurch wieder ganze
Zahlen. Die Rechenregeln für Addition und Multiplikation sind
Assoziativgestze: a + (b + c) = (a + b) + c und a(bc) = (ab)c
Kommutativgesetze: a + b = b + a und ab = ba
Distributivgesetz: (a + b)c = ac + bc
Diese Gesetze garantieren, dass man so addieren und multiplizieren darf, wie man es
gewohnt ist. Die Subtraktion wird als Umkehroperation zur Addition behandelt. Die
Subtraktion einer Zahl ist die Addition dieser Zahl mit geändertem Vorzeichen.
Neben den Rechenoperationen gibt es auch eine Ordnungsrelation < auf Z. Zwei ganze
Zahlen sind immer vergleichbar, das heißt, wenn a ungleich b ist, dann gilt entweder a < b
oder a > b. Man kann Z als die ganzzahligen Punkte auf der Zahlengeraden anordnen.
−3
−2
−1
0
1
2
3
4
5
6
7
8
Wir wollen uns nicht weiter mit den ganzen Zahlen beschäftigen, sondern gleich zu den
reellen Zahlen übergehen.
In Z kann man die Subtraktion, also die Umkehroperation zur Addition ausführen, nicht
aber die Umkehroperation zur Multiplikation. Will man zum Beispiel 9 durch 7 dividieren,
so erhält man 1 als Ergebnis und 2 als Rest. Das Divisionsergebnis liegt also zwischen 1
und 2. Um die Division genauer ausführen zu können, gehen wir über zu einer genaueren
Skala, indem wir die Längeneinheit in zehn Teile unterteilen.
0.9
1.0
1.1
1.2
1.3
1.4
1.5
1.6
1.7
1.8
1.9
2.0
2.1
Jetzt kann man die Division auf eine Dezimalstelle genau ausführen. Das Divisionsergebnis
auf eine Dezimalstelle genau ist 1.2 mit 6 als Rest. Das exakte Divisionsergebnis liegt also
2
Reelle Zahlen und stetige Funktionen
zwischen 1.2 und 1.3. Man kann dieses Verfahren fortsetzen. Unterteilt man die Abstände
zwischen aufeinanderfolgenden einstelligen Dezimalzahlen jeweils wieder in zehn gleiche
Teile, so erhält man eine zweistellige Dezimalskala.
1.19 1.20 1.21 1.22 1.23 1.24 1.25 1.26 1.27 1.28 1.29 1.30 1.31
Jetzt kann man die Division auf zwei Dezimalstellen genau ausführen. Das Divisionsergebnis auf zwei Dezimalstellen genau ist 1.28 mit 4 als Rest. Das exakte Divisionsergebnis
liegt also zwischen 1.28 und 1.29.
Das kann man immer weiter fortsetzen außer es kommt einmal der Rest 0, womit die
Division endet. Als exaktes Divisionsergebnis erhält man eine Dezimalzahl. Eine Dezimalzahl besteht aus einem ganzzahligen Teil (mit Vorzeichen) und nach dem Dezimalpunkt
aus einer endlichen oder unendlichen Folge von Ziﬀern, den Dezimalstellen. Die Menge
aller Dezimalzahlen bezeichnen wir mit R und nennen sie die Menge der reellen Zahlen,
wobei wir später noch eine geringfügige Modifikation vornehmen.
Es gibt viele Dezimalzahlen, die nicht als Ergebnis einer Division einer ganzen Zahl
durch eine natürliche Zahl auftreten. Diejenigen, die auftreten, bilden die Menge Q der
rationalen Zahlen, also Q = { m
n : m ∈ Z, n ∈ N}. Bekanntlich sind das die Dezimalzahlen,
die nur endlich viele Dezimalstellen haben oder deren Dezimalstellen sich ab einer gewissen
Stelle periodisch wiederholen. In Q rechnet man üblicherweise mit Brüchen anstatt mit
Dezimalzahlen. Jedoch ist Q für die Analysis nicht geeignet, da die Intervallschachtelungseigenschaft nicht erfüllt ist. Wir brauchen daher die Menge R aller Dezimalzahlen.
Die Dezimalzahl bestimmt die Position auf der Zahlengeraden. Durch jede Dezimalstelle
wird die Position genauer festgelegt. Dadurch sind die Dezimalzahlen auch geordnet. Sind
x und y zwei Dezimalzahlen, dann gilt x < y, wenn x auf der Zahlengeraden links von y
liegt. Wir schreiben x ≤ y, wenn x < y oder x = y gilt. Die Ordnungsrelation ermöglicht
es auch, Intervalle zu definieren. Mit (a, b) bezeichnen wir die Menge aller Dezimalzahlen,
die auf der Zahlengeraden zwischen a und b liegen, das heißt (a, b) = {x : a < x < b}. Man
nennt (a, b) das oﬀene Intervall mit Endpunkten a und b. Das abgeschlossene Intervall
enthält auch die beiden Endpunkte. Es wird mit [a, b] bezeichnet. Es gilt also [a, b] =
{x : a ≤ x ≤ b}. Analog werden die halboﬀenen Intervalle [a, b) = {x : a ≤ x < b} und
(a, b] = {x : a < x ≤ b} definiert.
Man muss bei der Darstellung der Zahlen durch Dezimalzahlen allerdings ein bisschen
aufpassen. Eine Dezimalzahl, bei der ab einer Stelle nur mehr 9 auftritt, fällt nämlich
auf der Zahlengeraden immer mit der Dezimalzahl zusammen, die man erhält, wenn man
die Neuner weglässt und die letzte Stelle vor den Neunern um 1 erhöht. Wir sehen uns
dieses Problem genauer an. Seien x und y zwei Dezimalzahlen. Wir suchen die erste
Dezimalstelle, an der sie sich unterscheiden. Sagen wir, es ist die zweite. Wenn sich die
Ziﬀern an dieser Stelle um mehr als 1 unterscheiden, dann bestimmen x und y verschiedene
Punkte auf der Zahlengeraden. Ist zum Beispiel x = 1.23 . . . und y = 1.25 . . . , dann liegt
x in [1.23, 1.24] und y in [1.25, 1.26]. Da diese beiden Intervalle keinen gemeinsamen Punkt
haben, müssen x und y verschieden sein. Unterscheiden sich die Ziﬀern an dieser Stelle
jedoch nur um 1, zum Beispiel x = 1.23 . . . und y = 1.24 . . . , dann liegt x in [1.23, 1.24] und
y in [1.24, 1.25]. Diese beiden Intervalle haben genau einen Punkt gemeinsam, nämlich 1.24.
Wenn also x und y denselben Punkt darstellen, dann kann das nur 1.24 sein. Durch y wird
der Punkt 1.24 nur dann dargestellt, wenn alle weiteren Dezimalstellen 0, das heißt nicht
Franz Hofbauer
3
vorhanden sind. Ist 9 die nächste Ziﬀer in x, also x = 1.239 . . . , dann liegt x in [1.239, 1.24].
Kommt dann noch eine 9, dann liegt x in [1.2399, 1.24]. Sind alle weiteren Ziﬀern von x
gleich 9, also x = 1.239999 . . . , dann liegt x in den Intervallen [1.2399 . . . 9, 1.24], sodass x
ebenfalls den Punkt 1.24 auf der Zahlengeraden darstellt. Ist eine dieser weiteren Ziﬀern
nicht 9, dann stellt x auch nicht den Punkt 1.24 dar.
Daraus sieht man, dass eine Dezimalzahl, bei der ab einer Stelle nur mehr 9 auftritt, auf
der Zahlengeraden immer mit der Dezimalzahl zusammenfällt, die man erhält, wenn man
die Neuner weglässt und die letzte Stelle vor den Neunern um 1 erhöht. Man sieht daraus
auch, dass das die einzige Möglichkeit für das Zusammenfallen von zwei verschiedenen
Dezimalzahlen auf der Zahlengeraden ist. Um zu erreichen, dass jeder Punkt auf der
Zahlengeraden genau einer Dezimalzahl entspricht, verbieten wir Dezimalzahlen, bei denen
ab einer Stelle nur mehr 9 auftritt. Sollte eine Zahl wie 1.239999 . . . vorkommen, zum
Beispiel als Ergebnis einer Rechnung, dann denken wir sie uns automatisch durch die
entsprechende endliche Dezimalzahl ersetzt. Für 1.239999 . . . ist das 1.24.
Die Menge der reellen Zahlen R ist die Menge aller Dezimalzahlen, wobei wir jetzt
Dezimalzahlen, bei denen ab einer Stelle nur mehr 9 auftritt, nicht mehr zulassen. So
entsprechen die reellen Zahlen in eindeutiger Weise den Punkten auf der Zahlengeraden.
Auf der Menge R müssen wir Addition und Multiplikation definieren. Dazu verwenden
wir gerundete Dezimalzahlen. Ist x eine Dezimalzahl, dann bezeichnen wir mit xn die auf
n Stellen gerundete Zahl x. Die gerundete Zahl xn ist eine Zahl mit n Dezimalstellen und
wird so definiert, dass x im Intervall (xn − 21 εn , xn + 12 εn ] liegt, wobei εn = 0.0 . . . 001 der
Abstand zweier Zahlen in der n-stelligen Dezimalskala ist.
Die Addition auf der n-stelligen Dezimalskala funktioniert genauso wie für ganze Zahlen.
Will man zwei Dezimalzahlen x und y addieren, dann addiert man die gerundeten Zahlen
xn und yn . Berücksichtigt man auch die Rundungsfehler, dann erhält man das Intervall
(xn + yn − εn , xn + yn + εn ], in dem die Summe von x und y liegen muss. Die ersten n
Stellen der Summe sind damit bestimmt, wobei jedoch die n-te Stelle auch um 1 größer
oder kleiner sein kann.
Beispiel: Sei x = 2.31745576 . . . und y = 1.22253522 . . . . Rundet man auf 5 Stellen, so
erhält man x5 = 2.31746 und y5 = 1.22254. Es folgt x5 + y5 = 3.54000. Die Summe von
x und y liegt daher in (3.53999, 3.54001].
Durch Vergrößern von n kann man immer mehr Stellen der Summe bestimmen, sodass
x + y dadurch eindeutig definiert wird. Auf dieselbe Art erhält man auch x − y. Das ist
ja die Addition einer Zahl mit geändertem Vorzeichen.
Man erkennt daraus auch sofort die Gültigkeit des Kommutativgesetzes und des Assoziativgesetzes für die Addition. Da gerundete Zahlen genauso addiert werden wie ganze
Zahlen, muss xn + yn = yn + xn für alle n gelten. Wäre x + y =
̸ y + x, dann könnte man
ein m finden, sodass sich x + y und y + x in der m-ten Dezimalstelle unterscheiden. Man
kann nun n so groß wählen, dass x + y und xn + yn über die m-te Dezimalstelle hinaus
übereinstimmen und dass dasselbe auch für y +x und yn +xn gilt. Wegen xn +yn = yn +xn
müssen dann auch x + y und y + x an der m-ten Dezimalstelle übereinstimmen. Damit ist
x + y = y + x gezeigt. Auf ähnliche Weise folgt das Assoziativgesetz.
Es genügt, das Produkt für positive reelle Zahlen einzuführen. Das Produkt von zwei
beliebigen reellen Zahlen x und y erhält man, indem man das Produkt ohne Vorzeichen
berechnet und mit einem positiven Vorzeichen versieht, wenn x und y gleiches Vorzeichen
haben, und mit einem negativen, wenn x und y verschiedenes Vorzeichen haben.
4
Reelle Zahlen und stetige Funktionen
Seien x und y also positive reelle Zahlen. Die gerundeten Zahlen xn und yn multipliziert
man unter Weglassen des Dezimalpunkts wie ganze Zahlen, wobei man im Produkt den
Dezimalpunkt wieder richtig setzen muss. Ist C eine Zahl größer als x+y+1
, dann liegt das
2
Produkt der Zahlen x und y im Intervall (xn yn − Cεn , xn yn + Cεn ]. Gibt man ein m vor,
dann kann man immer ein n finden, sodass die ersten m Dezimalstellen von xn yn bereits
die des Produkts von x und y sind. Auf diese Weise lassen sich beliebig viele Dezimalstellen
des Produkts bestimmen, sodass xy eindeutig definiert ist. Wie für die Addition folgen das
Kommutativgesetz und das Assoziativgesetz auch für die Multiplikation, da die gerundeten
Dezimalzahlen ja wie ganze Zahlen multipliziert werden und für diese daher Kommutativund Assoziativgesetz gelten. Ebenso erhält man das Distributivgesetz.
Beispiel: Sei x = 2.3714524 . . . und y = 0.02495735 . . . . Rundet man auf 4 Stellen,
so erhält man x4 = 2.3715 und y4 = 0.0250. Es folgt x4 y4 = 0.0592875. Man kann
C = 2 wählen und erhält, dass xy im Intervall [0.0590, 0.0595] liegt. Wir haben also 3
Dezimalstellen von xy bestimmt.
Um die Division einzuführen, genügt es x1 für x > 0 zu definieren. Wir erhalten xy
dann als y · x1 . Sei also x > 0. Ist x > 1, dann setzen wir k = 0. Ansonsten sei die
k-te Dezimalstelle die erste, an der x eine Ziﬀer ̸= 0 hat. Für n > k gilt dann, dass der
Kehrwert von x im Intervall [ x1n − 102k εn , x1n + 102k εn ] liegen muss. Somit liefert uns x1n
die ersten n−2k Dezimalstellen von x1 . Da man n beliebig groß wählen kann, ist x1 dadurch
eindeutig bestimmt. Man kann x1n als Division zweier ganzer Zahlen berechnen.
Beispiel: Sei x = 0.0273152 . . . , sodass wir x5 = 0.02732 erhalten. Es folgt k = 2 und
1
100000
1
2k
x5 = 36.60322 . . . , indem man den Bruch 2732 ausdividiert. Wegen 10 ε5 = 0.1 liegt x
im Intervall [36.5, 36.71].
Damit sind auf R alle vier Grundrechenarten eingeführt, wobei die üblichen Rechenregeln
gelten. Mit den Rechenoperationen + und · bildet R einen Körper.
2. Ordnung
Wir haben die Ordnungsrelation in R so definiert: Es gilt a < b, wenn a auf der
Zahlengerade links von b liegt, das heißt, wenn b − a positives Vorzeichen hat. Ebenso
gilt a ≤ b, wenn b − a positives Vorzeichen hat oder null ist. Wir schreiben das so auf
(A)
a≤b ⇔ 0≤b−a
und
a<b ⇔ 0<b−a
Da Summe und Produkt zweier positiver Zahlen wieder positiv sind, haben wir auch
(B) a ≥ 0, b ≥ 0 ⇒ a + b ≥ 0, ab ≥ 0
und
a > 0, b > 0 ⇒ a + b > 0, ab > 0
Aus diesen einfachen Eigenschaften lassen sich alle weitere Regeln für das Rechnen mit der
Ordnungsrelation herleiten. Wir fassen sie in den folgenden beiden Sätzen zusammen.
Satz 1.1: Für a ∈ R gilt a2 ≥ 0. Weiters gilt a < 0 ⇔ 0 < −a und a > 0 ⇒
1
a
> 0.
Beweis: Wir erhalten a < 0 ⇔ 0 < −a aus (A) mit b = 0. Ist a > 0 dann folgt a2 > 0,
indem man b = a in (B) setzt. Ist a < 0 dann folgt −a > 0 und (−a)2 > 0, das heißt
a2 > 0 mit Hilfe der beiden gerade gezeigten Aussagen. Somit gilt a2 > 0 für alle a ̸= 0.
Ist jetzt a > 0, dann gilt auch ( a1 )2 > 0, wie wir soeben gezeigt haben, und aus (B) folgt
dann a( a1 )2 > 0, das heißt a1 > 0, womit a > 0 ⇒ a1 > 0 gezeigt ist.
Ist a = 0, dann gilt a2 = 0, womit auch a2 ≥ 0 für alle a ∈ R gezeigt ist.
Franz Hofbauer
5
Satz 1.2: Seien a, b, c, d ∈ R. Dann gilt
(a) a ≤ b ⇔ a + c ≤ b + c
(b) a ≤ b ⇔ ac ≤ bc, wenn c > 0
(c) a ≤ b ⇔ ac ≥ bc, wenn c < 0
(d) a ≤ b, b ≤ c ⇒ a ≤ c
(e) a ≤ b, c ≤ d ⇒ a + c ≤ b + d
(f) 0 ≤ a ≤ b, 0 ≤ c ≤ d ⇒ ac ≤ bd
(g) a ≤ b ⇔ a2 ≤ b2 , wenn a ≥ 0 und b ≥ 0
Beweis: Es gilt a ≤ b ⇔ 0 ≤ b − a und a + c ≤ b + c ⇔ 0 ≤ b + c − (a + c) nach (A).
Wegen b − a = b + c − (a + c) ist damit bereits (a) gezeigt.
Wir zeigen (b). Aus a ≤ b folgt 0 ≤ b − a wegen (A) und daraus 0 ≤ bc − ac wegen
(B), da c > 0 vorausgesetzt wird, und daraus dann ac ≤ bc wieder wegen (A). Somit ist
a ≤ b ⇒ ac ≤ bc gezeigt. Wegen c > 0 gilt auch 1c > 0 nach Satz 1.1. Aus der soeben
gezeigten Implikation folgt dann ac ≤ bc ⇒ ac 1c ≤ bc 1c , das heißt ac ≤ bc ⇒ a ≤ b.
Damit sind beide Implikationen in (b) gezeigt.
Wir erhalten (c) aus (b). Es gilt c < 0 und daher 0 < −c wegen Satz 1.1. Dann gilt
a ≤ b ⇔ a(−c) ≤ b(−c) nach (b) und a(−c) ≤ b(−c) ⇔ a(−c) + d ≤ b(−c) + d nach (a).
Setzt man das zusammen und d = ac + bc, dann hat man a ≤ b ⇔ bc ≤ ac.
Es gilt a ≤ b, b ≤ c ⇒ 0 ≤ b − a, 0 ≤ c − b ⇒ 0 ≤ b − a + c − b = c − a ⇒ a ≤ c, wobei
wir zuerst (A), dann (B) und schließlich nochmals (A) anwenden. Damit ist (d) gezeigt.
Aus (a) und (d) folgt a ≤ b, c ≤ d ⇒ a + c ≤ b + c, c + b ≤ d + b ⇒ a + c ≤ d + b. Das
ist (e).
Aus (b) und (d) folgt 0 ≤ a ≤ b, 0 ≤ c ≤ d ⇒ ac ≤ bc, cb ≤ db ⇒ ac ≤ db. Das ist (f).
Für c = 0 oder b = 0 ist die zweite Implikation ja trivial.
Ist a = b = 0, dann gilt (g). Gilt a > 0 und b ≥ 0, dann folgt b + a ≥ 0 + a > 0. Gilt
b > 0 und a ≥ 0, dann folgt a + b ≥ 0 + b > 0, beides aus (a). Sei c = b + a. Wegen c > 0
erhalten wir dann a ≤ b ⇔ 0 ≤ b − a ⇔ 0 · c ≤ (b − a)c ⇔ 0 ≤ b2 − a2 ⇔ a2 ≤ b2 mit
Hilfe von (a) und (b). Damit ist (g) gezeigt.
In Satz 1.2 sind einige Äquivalenzumformungen von Ungleichungen enthalten, die man
verwendet, um Ungleichungen zu beweisen oder die Lösungsmenge einer Ungleichung zu
suchen. Wir geben ein Beispiel.
Beispiel: Wir zeigen, dass das harmonische Mittel kleiner oder gleich dem arithmetischen
2xy
Mittel ist, also x+y
≤ x+y
2 für x, y > 0 gilt. Wir versuchen durch Äquivalenzumformungen
eine Ungleichung zu erhalten, deren Richtigkeit klar ist:
2xy
x+y
≤
2xy ≤
| · (x + y)
x+y
2
2
x +2xy+y
2
2
2
4xy ≤ x + 2xy + y 2
|·2
| − 4xy
0 ≤ x2 − 2xy + y 2
0 ≤ (x − y)2
Diese letzte Ungleichung ist richtig, da quadrierte Zahlen nach Satz 1.1 immer ≥ 0 sind.
Da die erste Ungleichung dazu äquivalent ist, haben wir diese bewiesen.
6
Reelle Zahlen und stetige Funktionen
Der Betrag |x| einer reellen Zahl x ist die Zahl ohne Vorzeichen, das heißt |x| = x, wenn
x ≥ 0 ist, und |x| = −x, wenn x < 0 ist. Es gilt | − x| = |x|. Der Abstand zweier Zahlen x
und y auf der Zahlengeraden ist durch |x − y| gegeben. Wir werden ihn bei der Definition
des Grenzwerts verwenden. Der folgende Satz gibt die Eigenschaften des Betrages an.
Satz 1.3: Seien x und y in R. Dann gilt
(a) |x + y| ≤ |x| + |y| (Dreiecksungleichung)
(b) |x| · |y| = |xy|
Beweis: Es gilt x ≤ |x| und −x ≤ |x| für alle x ∈ R, da x = |x| und −x ≤ 0 ≤ |x| im Fall
x ≥ 0 gilt, und x ≤ 0 ≤ |x| und −x = |x| im Fall x < 0.
Seien jetzt x und y in R. Dann gilt x ≤ |x| und y ≤ |y|, wie soeben gezeigt wurde, also
auch x + y ≤ |x| + |y| nach Satz 1.2 (e). Ebenso gilt −x ≤ |x| und −y ≤ |y|, und damit
auch −x − y ≤ |x| + |y| wieder wegen Satz 1.2 (e). Da |x + y| entweder gleich x + y oder
gleich −x − y ist, ist |x + y| ≤ |x| + |y|, also (a) gezeigt.
Da das Produkt xy ohne Berücksichtigung des Vorzeichens berechnet und dieses erst
danach gesetzt wird, ist |xy| das Produkt der vorzeichenlosen Zahlen, also |x| · |y|.
Wir führen noch die Begriﬀe Maximum und Minimum ein. Unter dem Maximum von
endlich vielen Zahlen x1 , x2 , . . . , xk versteht man die größte dieser Zahlen. Man bezeichnet
sie mit max(x1 , x2 , . . . , xk ). Unter dem Minimum von endlich vielen Zahlen x1 , x2 , . . . , xk
versteht man die kleinste dieser Zahlen. Man bezeichnet sie mit min(x1 , x2 , . . . , xk ).
3. Intervallschachtelungseigenschaft
Nachdem wir die Rechenoperationen und die Ordnungsrelation behandelt haben, kommen wir jetzt zur sogenannten Intervallschachtelungseigenschaft der reellen Zahlen.
Als Intervallschachtelung bezeichnet man eine Folge von abgeschlossenen Intervallen,
sodass das nächstfolgende Intervall immer im vorhergehenden enthalten ist. Wir haben
also Intervalle [an , bn ] für n ≥ 1, für die [a1 , b1 ] ⊇ [a2 , b2 ] ⊇ [a3 , b3 ] ⊇ [a4 , b4 ] ⊇ . . . gilt. Die
Anordnung der Endpunkte ist durch a1 ≤ a2 ≤ a3 ≤ a4 ≤ · · · < · · · ≤ b4 ≤ b3 ≤ b2 ≤ b1
gegeben. Wir nehmen an, dass alle Dezimalzahlen unendlich viele Dezimalstellen haben,
indem wir bei Dezimalzahlen mit endlich vielen Dezimalstellen mit Nullen fortsetzen.
Satz 1.4 (Intervallschachtelungseigenschaft) Sei [an , bn ] für n ≥ 1 eine Folge von Intervallen mit [an+1 , bn+1 ] ⊆ [an , bn ]. Dann gibt es ein x ∈ R mit x ∈ [an , bn ] für alle n.
Beweis: Wir nehmen zuerst an, dass alle Intervalle Teilmengen von [0, ∞) sind.
Sei gn der ganzzahlige Teil der Dezimalzahl an . Wegen a1 ≤ a2 ≤ a3 ≤ · · · ≤ b1 erhalten
wir g1 ≤ g2 ≤ g3 ≤ · · · ≤ b1 . Da die Zahlen gn aber ganze Zahlen sind, ist die jeweils
nächste Zahl entweder gleich der vorherigen Zahl oder um mindestens eins größer als die
vorherige Zahl. Daher kann es nur endlich oft vorkommen, dass die nächste Zahl größer
als die vorherige ist, sonst würden diese Zahlen ja irgendwann b1 überschreiten. Es müssen
ein g ∈ Z und ein n0 existieren, sodass gn = g für alle n ≥ n0 gilt.
Jetzt zu den Dezimalstellen. Für k ≥ 1 sei dn,k die k-te Dezimalstelle von an . Wir beginnen
mit k = 1. Es gilt an0 ≤ an0 +1 ≤ an0 +2 ≤ . . . und der ganzzahlige Teil dieser Zahlen ist
derselbe. Für die erste Dezimalstelle gilt daher dn0 ,1 ≤ dn0 +1,1 ≤ dn0 +2,1 ≤ . . . . Weiters
liegen die Ziﬀern dn,1 für n ≥ n0 in der Menge {0, 1, . . . , 9}, sodass ab einer gewissen Stelle
dieselbe Ziﬀer auftreten muss. Es gibt somit eine Ziﬀer d1 und ein n1 ≥ n0 mit dn,1 = d1
für alle n ≥ n1 .
Franz Hofbauer
7
So behandeln wir auch die Dezimalstellen dn,k mit k ≥ 2. Da der ganzzahlige Teil und die
erste Dezimalstelle für n ≥ n1 unverändert bleiben, gilt dn1 ,2 ≤ dn1 +1,2 ≤ dn1 +2,2 ≤ . . . ,
und man findet wie oben ein n2 ≥ n1 und eine Ziﬀer d2 mit dn,2 = d2 für alle n ≥ n2 . Im
k-ten Schritt findet man ein nk ≥ nk−1 und eine Ziﬀer dk mit dn,k = dk für alle n ≥ nk .
Sei x = g.d1 d2 d3 . . . die aus den erhaltenen Ziﬀern gebildete Dezimalzahl. Wir geben ein
Beispiel für diese Konstruktion.
a1 = 2 . 7 4 2 4 5 4 8 5 7 4 8 . . .
a2 = 2 . 9 5 3 8 5 2 2 1 4 7 4 . . .
a3 = 3 . 2 9 3 5 8 2 0 3 1 9 5 . . .
a4 = 3 . 5 2 4 6 2 8 7 0 2 3 1 . . .
a5 = 3 . 7 4 2 6 9 4 0 2 4 0 7 . . .
a6 = 3 . 7 6 0 7 8 4 9 5 2 2 0 . . .
a7 = 3 . 7 6 0 9 6 3 2 1 7 9 5 . . .
a8 = 3 . 7 6 1 2 6 3 2 9 1 4 9 . . .
a9 = 3 . 7 6 1 3 8 4 7 9 3 3 1 . . .
a10 = 3 . 7 6 1 4 3 1 7 6 1 2 6 . . .
a11 = 3 . 7 6 1 5 0 4 1 4 7 1 4 . . .
a12 = 3 . 7 6 1 5 2 7 6 4 9 8 7 . . .
a13 = 3 . 7 6 1 5 4 8 7 4 2 7 4 . . .
a14 = 3 . 7 6 1 5 4 9 3 2 1 4 9 . . .
a15 = 3 . 7 6 1 5 4 9 5 1 7 4 8 . . .
a16 = 3 . 7 6 1 5 4 9 7 0 2 2 0 . . .
a17 = 3 . 7 6 1 5 4 9 7 3 8 0 7 . . .
a18 = 3 . 7 6 1 5 4 9 7 4 2 3 1 . . .
a19 = 3 . 7 6 1 5 4 9 7 6 3 9 5 . . .
a20 = 3 . 7 6 1 5 4 9 7 6 4 7 4 . . .
a21 = 3 . 7 6 1 5 4 9 7 6 5 4 8 . . .
↓
↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓
x = 3 . 7 6 1 5 4 9 7 6 ... ... ...
Es bleibt zu zeigen, dass die so gewonnene reelle Zahl x in allen Intervallen [an , bn ] liegt.
Wir zeigen zuerst an ≤ x für alle n. Angenommen, es gibt ein k mit ak > x. Da mit wachsendem m die Dezimalzahlen am ein immer größeres Anfangsstück mit der Dezimalzahl x
gemeinsam haben, findet man ein m > k, sodass am mehr Dezimalstellen mit x gemeinsam
hat als ak und somit näher bei x liegt als ak . Daraus folgt ak > am , ein Widerspruch, da
ja a1 ≤ a2 ≤ a3 ≤ · · · ≤ ak ≤ · · · ≤ am ≤ . . . gilt. Damit ist an ≤ x für alle n gezeigt.
Ebenso gilt bn ≥ x für alle n. Angenommen, es gibt ein k mit bk < x. Da mit wachsendem m die Dezimalzahlen am ein immer größeres Anfangsstück mit der Dezimalzahl x
gemeinsam haben, findet man wie oben ein m, sodass am näher bei x liegt als bk . Daraus
folgt bk < am , ein Widerspruch, da die linken Endpunkte aller Intervalle kleiner sind als
die rechten Endpunkte aller Intervalle. Damit ist bn ≥ x für alle n gezeigt.
8
Reelle Zahlen und stetige Funktionen
Was tun wir, wenn nicht alle Intervalle Teilmengen von [0, ∞) sind? Gilt an ≤ 0 und
bn ≥ 0 für alle n, dann liegt 0 in allen Intervallen. Ansonsten finden wir ein u ≥ 1, sodass
[au , bu ] Teilmenge von [0, ∞) oder Teilmenge von (−∞, 0] ist. Im ersten Fall untersuchen
wir dann die Folge [an , bn ] für n ≥ u, die in [0, ∞) liegt. Gilt x ∈ [an , bn ] für alle n ≥ u,
dann auch x ∈ [an , bn ] für alle n ≥ 1. Im zweiten Fall untersuchen wir die Folge [−bn , −an ]
für n ≥ u, die ebenfalls in [0, ∞) liegt. Ist y eine Zahl, die in [−bn , −an ] für alle n ≥ u
liegt, dann liegt x = −y in den ursprünglichen Intervallen [an , bn ] für alle n ≥ 1.
Dieser Satz besagt, dass es für jede Folge von abgeschlossenen Intervallen, die ineinandergeschachtelt sind, mindestens eine Zahl gibt, die in allen Intervallen enthalten ist. Wir
können auch eine Aussage über die Eindeutigkeit machen. Sei ln = bn − an die Länge des
n-ten Intervalls. Es gilt l1 ≥ l2 ≥ l3 ≥ . . . , da die Intervalle ineinandergeschachtelt sind.
Gibt es nun zwei verschiedene Zahlen x und y, die in allen Intervallen enthalten sind, und
ist ε = |x − y| > 0 der Abstand der beiden Zahlen, dann gilt ln ≥ ε für alle n ≥ 0. Wenn
also keine Zahl ε > 0 existiert, sodass ln ≥ ε für alle n gilt, dann gibt es genau eine Zahl,
die in allen Intervallen liegt.
Oft kommt es vor, dass ln ≤ 21 ln−1 für alle n gilt. In diesem Fall gibt es genau eine Zahl,
die in allen Intervallen liegt. Würde ein ε > 0 existieren, sodass ε ≤ ln für alle n gilt, dann
würde ε ≤ 2l1n und daraus 2n ≤ lε1 für alle n folgen. Ein Blick auf die Zahlengerade zeigt
aber, dass die Zahlen 1, 2, 4, 8, . . . jede reelle Zahl überschreiten, sodass ein n mit 2n > lε1
existiert. Daher gibt es kein ε > 0, sodass ε ≤ ln für alle n gilt.
Als Anwendung der Intervallschachtelung zeigen wir, dass man aus einer positiven reellen
Zahl die Wurzel ziehen kann und dadurch wieder eine reelle Zahl enthält.
Beispiel: Sei x > 0. Wir bilden Intervalle [an , bn ] mit an bn = x.
Wir wählen a1 und b1 beliebig, sodass 0 < a1 < b1 und a1 b1 = x gelten, zum Beispiel
a1 = 1 und b1 = x für x > 1 und a1 = x und b1 = 1 für x < 1. Ist [an , bn ] mit an < bn
und an bn = x schon bestimmt, dann setzen wir
bn+1 = 21 (an + bn ) und an+1 =
x
bn+1
sodass wieder an+1 bn+1 = x gilt. Da bn+1 der Mittelpunkt des Intervalls [an , bn ] ist,
x
erhalten wir bn+1 < bn und an+1 = bn+1
> bxn = an . Weiters gilt
bn+1 − an+1 =
b2n+1 −x
bn+1
=
(an +bn )2 −4an bn
4bn+1
=
1
4bn+1 (bn
− an )2
Wegen an < bn folgt daraus auch an+1 < bn+1 . Somit ist [an+1 , bn+1 ] ein Intervall, das
in [an , bn ] enthalten ist. Da bn+1 der Mittelpunkt von [an , bn ] ist, ist das nächste Intervall
höchstens halb so lang wie das vorhergehende. Es gibt somit genau eine reelle Zahl y,
die in allen Intervallen enthalten ist. Es gilt a2n ≤ y 2 ≤ b2n für alle n. Wegen an bn = x
und a2n ≤ an bn ≤ b2n gilt auch a2n ≤ x ≤ b2n für alle n. Wegen b2n − a2n ≤ 2b1 (bn − an )
existiert kein ε > 0, sodass b2n − a2n ≥ ε für alle n gilt. Daher gibt es nur eine Zahl, die
in allen Intervallen [a2n , b2n ] liegt, sodass y 2 = x folgt. Somit ist y die Wurzel aus x. Für
x = 2 sind [1, 2] ⊇ [1.3333, 1.5000] ⊇ [1.4118, 1.4167] ⊇ [1.414211, 1.414216] ⊇ . . . die
ersten Intervalle. Man sieht, dass sie sehr schnell kleiner werden.
Als weiteres Beispiel bestimmen wir die Zahl π, die Fläche des Kreises mit Radius 1. Wir
schachteln die Kreisfläche durch Flächen von regelmäßigen n-Ecken ein. Diese Methode
geht auf Archimedes zurück. Man kann damit π auf eine bestimmte Anzahl von Stellen
berechnen. (Dabei bezeichnet U V die Strecke und |U V | den Abstand zwischen U und V .)
Franz Hofbauer
9
Beispiel: Wir berechnen die Fläche des KreiM
ses mit Radius r = 1 durch Approximation
mit regelmäßigen Vielecken. Seien s und t
die halben Seitenlängen des ein- und umgeschriebenen regelmäßigen k-Ecks. Seien x
und y die halben Seitenlängen des ein- und
umgeschriebenen regelmäßigen 2k-Ecks. In
der nebenstehenden Zeichnung sind P Q und
AB Seiten des ein- und umgeschriebenen res
s
R
Q
gelmäßigen k-Ecks, P C und CQ sind Seiten
P
2x
2x
des eingeschriebenen regelmäßigen 2k-Ecks
y
und CD und DQ sind halbe Seiten des umt
A
C
D t
B
geschriebenen regelmäßigen 2k-Ecks. Aus
der Ähnlichkeit der beiden rechtwinkeligen
Dreiecke BQD und BCM folgt |DQ| : |DB| = |M C| : |M B|. Aus dem Strahlensatz folgt
|M Q| : |M B| = |RQ| : |CB|. Wegen |M C| = r = |M Q| folgt |DQ| : |DB| = |RQ| : |CB|.
y
ts
= st . Daraus folgt y = t+s
. Aus der
Setzt man die Seitenlängen ein, so ergibt sich t−y
y
Ähnlichkeit der beiden gleichschenkeligen Dreiecke P CQ und CDQ folgt 2x
2s = 2x , das
√ sy
heißt x =
2 . Sei Fm die Fläche des umgeschriebenen m-Ecks und fm die Fläche des
eingeschriebenen m-Ecks. Ist u die halbe Seite des umgeschriebenen m-Ecks, dann gilt
Fm = mur = mu, also Fk = kt und F2k = 2ky. Ist v die halbe Seite des eingeschriebenen
m-Ecks, dann ist r die Grundlinie und v die Höhe in den Dreiecken, aus denen das regelmäßigen 2m-Eck besteht. Daher gilt f2m = 2m 21 rv = mv, also f2k = ks und f4k = 2kx.
Wir erhalten die Rekursionsformeln
√
√
2Fk f2k
F2k = 2ky = 2kts
=
und
f
=
2kx
=
k
2sy
=
f2k F2k
4k
t+s
Fk +f2k
Für n ≥ 1 sei an = f2n+1 und bn = F2n+1 . Die Intervalle [an , bn ] enthalten dann π, die
Fläche des Kreises mit Radius 1. Da das regelmäßige eingeschriebene 2n+1 -Eck im regelmäßigen eingeschriebenen 2n+2 -Eck enthalten ist, haben wir an < an+1 . Da das regelmäßige
umgeschriebene 2n+1 -Eck das regelmäßige umgeschriebene 2n+2 -Eck enthält, haben wir
bn > bn+1 . Daher bilden die Intervalle [an , bn ] für n ≥ 1 eine Intervallschachtelung. Die
Fläche des eingeschriebenen regelmäßigen Vierecks ist 2, also a1 = 2. Die Fläche des
umgeschriebenen regelmäßigen Vierecks ist 4, also b1 = 4. Mit Hilfe der obigen Rekursionsformeln kann man weitere Intervalle berechnen
√
n an+1
an+1 = an bn und bn+1 = b2b
n +an+1
Da das harmonische Mittel kleiner gleich dem arthmetischen Mittel ist, ist [an+1 , bn+1 ] in
der linken Hälfte des Intervalls [an+1 , bn ] enthalten. Daher ist [an+1 , bn+1 ] höchstens halb
so lang wie [an , bn ]. Es gibt eine eindeutig bestimmte reelle Zahl, die in allen Intervallen
liegt. Das muss die Fläche des Kreises mit Radius 1 sein.
Die ersten Intervalle sind [2, 4] ⊇ [2.8284, 3.3137] ⊇ [3.0615, 3.1826] ⊇ [3.1214, 3.1517] ⊇
[3.1365, 3.1441] ⊇ [3.1403, 3.1422] ⊇ [3.1413, 3.1418] ⊇ [3.1415, 3.1416] ⊇ . . . , sodass man
neun Intervalle benötigt, um π auf vier Dezimalstellen genau zu erhalten.
Genauso kann man einen Kreis mit Radius r ̸= 1 behandeln. Die Überlegungen sind
genau dieselben. Man erhält dieselbe Intervallschachtelung, nur dass die Endpunkte aller
Intervalle mit r2 multipliziert sind. Somit gibt es wieder genau eine reelle Zahl, die in allen
Intervallen liegt, und diese Zahl ist r2 π. Das ist die Fläche des Kreises mit Radius r.
10
Reelle Zahlen und stetige Funktionen
4. Folgen und deren Grenzwerte
Eine zentrale Rolle in der Analysis spielen Folgen und deren Grenzwerte. Eine Folge
von reellen Zahlen kann man sich als zeitlichen Ablauf vorstellen. Zum Zeitpunkt 0 ist
man im Punkt a0 , zum Zeitpunkt 1 ist man im Punkt a1 , zum Zeitpunkt 2 ist man im
Punkt a2 , und immer so weiter. Es wird also die Folge a0 , a1 , a2 , . . . von reellen Zahlen
durchlaufen. Man schreibt eine Folge auch in der Form (an )n≥0 auf. Oft beginnt man
die Zeitpunkte mit 1 zu zählen, hat also die Folge (an )n≥1 . Die reellen Zahlen an heißen
Glieder der Folge.
Folgen können verschiedenes Verhalten zeigen. Die durch an = n für n ≥ 1 definierte
Folge durchläuft die natürlichen Zahlen. Sie wird also nach ∞ entschwinden. Die durch
an = n1 für n ≥ 1 definierte Folge hingegen nähert sich mit fortschreitendem n immer
mehr der Zahl 0. Es ist naheliegend, die Zahl a = 0 als Grenzwert der Folge (an )n≥1 zu
bezeichnen. Die Folge an = (−1)n n12 für n ≥ 1 zeigt alternierendes Verhalten. Zu geraden
Zeitpunkten n ist an rechts von 0. Zu ungeraden Zeitpunkten n ist an links von 0. Mit
fortschreitendem n nähert sich auch diese Folge immer mehr der Zahl 0. Daher hat sie
ebenfalls den Grenzwert a = 0.
Um den Begriﬀ des Grenzwertes zu definieren, muss man zuerst Umgebungen einer
Zahl a ∈ R einführen. Als ε-Umgebung der Zahl a bezeichnet man das oﬀene Intervall
(a − ε, a + ε), wobei ε > 0 ist. Ist a ∈ R und existiert zu jeder ε-Umgebung von a, wie klein
ε auch sein mag, ein Zeitpunkt, ab dem die Glieder der Folge in dieser Umgebung liegen,
dann wird man a als Grenzwert der Folge bezeichnen. In eine mathematische Sprahe
übersetzt, ergibt das folgende Definition.
Definition: Man nennt a ∈ R Grenzwert der Folge (an )n≥0 , wenn für jedes ε > 0 ein n0
existiert, sodass |an − a| < ε für alle n ≥ n0 gilt. Man schreibt limn→∞ an = a.
Folgen, die einen Grenzwert haben, heißen konvergent. Alle anderen Folgen heißen
divergent. Außerdem ist der Grenzwert einer Folge (an )n≥0 , falls er existiert, eindeutig
bestimmt. Sind a und b zwei verschiedene Zahlen in R, dann findet man ein ε > 0, zum
Beispiel ε = |a−b|
2 , sodass die oﬀenen Intervalle (a − ε, a + ε) und (b − ε, b + ε) keinen
gemeinsamen Punkt haben. Ist a Grenzwert, dann gibt es ein n0 , sodass an ∈ (a − ε, a + ε)
für alle n ≥ n0 gilt. Dann gilt aber an ∈
/ (b − ε, b + ε) für alle n ≥ n0 und b kann nicht
Grenzwert sein.
Beispiele: Sei an = n1 für n ≥ 1. Wir zeigen, dass limn→∞ an = 0 gilt, indem wir die
Definition des Grenzwertes nachprüfen. Dazu sei ε > 0 vorgegeben. Wir wählen n0 > 1ε .
Für n ≥ n0 gilt dann |an − 0| = n1 ≤ n10 < ε.
Ist bn =
√1
n
für n ≥ 1, dann folgt limn→∞ bn = 0 wie oben, indem wir n0 >
1
ε2
wählen.
Die Folge cn = (−1)n für n ≥ 0 ist nicht konvergent. Angenommen sie hätte den Grenzwert
a. Für ε = 21 müsste es dann ein n0 geben mit an ∈ (a − 12 , a + 21 ) für n ≥ n0 . Daraus
würde |an0 − an0 +1 | < 1 folgen, ein Widerspruch dazu, dass eine der Zahlen an0 und an0 +1
gleich 1 und die andere gleich −1 ist. Somit kann diese Folge keinen Grenzwert haben.
Um Rechenregeln für Grenzwerte herzuleiten, benötigen wir folgenden Satz.
Satz 1.5: Sei (an )n≥0 eine Folge, für die der Grenzwert limn→∞ an = a existiert. Dann
gibt es ein C > 0, sodass |an | ≤ C für alle n ≥ 0 gilt. Ist a ̸= 0, dann existiert ein c > 0
und ein m0 , sodass |an | ≥ c für alle n ≥ m0 gilt.
Franz Hofbauer
11
Beweis: Sei ε > 0 vorgegeben. Aus der Definition des Grenzwerts erhalten wir, dass ein
n0 existiert mit |an − a| < ε für alle n ≥ n0 . Mit Hilfe der Dreiecksungleichung folgt dann
|an | = |an − a + a| ≤ |an − a| + |a| < ε + |a| für alle n ≥ n0 . Wählt man für C die größte
der Zahlen ε + |a|, |a0 |, |a1 |, . . . , |an0 −1 |, dann ist |an | ≤ C für alle n erfüllt.
Für die zweite Aussage wird a ̸= 0 vorausgesetzt. Wir wählen ε = |a|
2 > 0. Es existiert
|a|
ein m0 , sodass |an − a| < ε für alle n ≥ m0 gilt. Sei c = 2 > 0. Mit Hilfe der
Dreiecksungleichung erhalten wir |a| = |a − an + an | ≤ |a − an | + |an |. Für n ≥ m0 ergibt
sich |an | ≥ |a| − |a − an | > |a| − ε = |a| − |a|
2 = c, womit die zweite Aussage gezeigt ist.
Satz 1.6 (Rechenregeln für Grenzwerte) Seien (an )n≥0 und (bn )n≥0 Folgen, für die die
Grenzwerte limn→∞ an = a und limn→∞ bn = b existieren.
(a) Ist m0 ≥ 0 und an ≤ bn für n ≥ m0 , dann gilt a ≤ b.
(b) Es gilt limn→∞ (an + bn ) = a + b.
(c) Es gilt limn→∞ (an bn ) = ab.
(d) Ist b ̸= 0 und bn ̸= 0 für alle n, dann gilt limn→∞ abnn = ab .
Beweis: Um (a) zu zeigen, nehmen wir an, dass a > b gilt. Gelingt es uns, daraus einen
Widerspruch zur Voraussetzung an ≤ bn für n ≥ m0 herzuleiten, dann kann a > b nicht
gelten und a ≤ b ist bewiesen. Wir nehmen also an, dass a > b gilt. Sei ε = a−b
2 . Wegen
limn→∞ an = a und limn→∞ bn = b finden wir n0 und n1 , sodass a − ε < an < a + ε für
alle n ≥ n0 und b − ε < bn < b + ε für alle n ≥ n1 gilt. Für n ≥ max(n0 , n1 ) erhalten
wir an > a − ε = b + ε > bn . Das widerspricht aber der Voraussetzung, dass an ≤ bn für
n ≥ m0 gilt. Damit ist (a) gezeigt.
Um (b) zu zeigen, prüfen wir die Definition des Grenzwerts nach. Sei ε > 0 vorgegeben.
Wir müssen ein n0 finden, sodass |(an + bn ) − (a + b)| < ε für alle n ≥ n0 gilt. Wegen
limn→∞ an = a und limn→∞ bn = b finden wir n1 und n2 , sodass |an − a| < 2ε für alle
n ≥ n1 und |bn − b| < 2ε für alle n ≥ n2 gilt. Sei n0 = max(n1 , n2 ). Für n ≥ n0 erhalten
wir mit Hilfe der Dreiecksungleichung |(an + bn ) − (a + b)| ≤ |an − a| + |bn − b| < 2ε + 2ε = ε.
Damit ist die Grenzwertdefinition nachgeprüft und (b) gezeigt.
Zum Beweis von (c) verwenden wir Satz 1.5. Es existiert ein C > 0, sodass |bn | ≤ C für
alle n gilt. Sei ε > 0 vorgegeben. Wegen limn→∞ an = a und limn→∞ bn = b finden wir
ε
ε
n1 und n2 , sodass |an − a| < C+|a|
für alle n ≥ n1 und |bn − b| < C+|a|
für alle n ≥ n2
gilt. Sei n0 = max(n1 , n2 ). Für n ≥ n0 erhalten wir mit Hilfe der Dreiecksungleichung
|an bn − ab| = |an bn − abn + abn − ab| ≤ |(an − a)bn | + |a(bn − b)|
≤ |an − a|C + |a||bn − b| <
ε
C+|a| C
ε
+ |a| C+|a|
=ε
womit (c) gezeigt ist.
Um (d) zu zeigen, wählen wir zuerst ein m0 und ein c > 0, sodass |bn | ≥ c für alle n ≥ m0
gilt, was wegen Satz 1.5 möglich ist. Sei ε > 0 vorgegeben. Wegen limn→∞ an = a
ε|b|c
für alle n ≥ n1 und
und limn→∞ bn = b finden wir n1 und n2 , sodass |an − a| < |a|+|b|
ε|b|c
|bn − b| < |a|+|b|
für alle n ≥ n2 gilt. Sei n0 = max(m0 , n1 , n2 ). Für n ≥ n0 erhalten wir
mit Hilfe der Dreiecksungleichung
| abnn − ab | = | abnn −
≤
1
c
a
bn
+
a
bn
· |an − a| +
− ab | ≤ | abnn −
|a|
|b|c
a
bn |
· |bn − b| <
womit wir auch (d) gezeigt haben.
1
c
·
+ | ban − ab | =
ε|b|c
|a|+|b|
+
|a|
|b|c
1
|bn |
·
· |an − a| +
ε|b|c
|a|+|b|
=ε
|a|
|b||bn |
· |b − bn |
12
Reelle Zahlen und stetige Funktionen
Auf einen Spezialfall dieser Rechenregeln sei noch hingewiesen. Ist die Folge (bn )n≥0
konstant, also bn = d für alle n, dann gilt natürlich auch limn→∞ bn = d, wie man leicht aus
der Definition des Grenzwertes erkennt, und wir erhalten limn→∞ (d+an ) = d+limn→∞ an
und limn→∞ dan = d limn→∞ an aus Satz 1.6.
Mit diesen Rechenregeln ist es möglich, das Berechnen von Grenzwerten auf einfache
Fälle, wie limn→∞ n1 = 0 zurückzuführen.
−5n
Beispiel: Wir berechnen den Grenzwert der Folge an = 2n
3n2 +4 für n → ∞. Dazu
dividieren wir Zähler und Nenner durch die höchste vorkommende Potenz, das ist in diesem
2− 5
Fall n2 , und erhalten an = 3+ n4 . Wegen Satz 1.6 (d) können wir den Grenzwert von
2
n2
Zähler und Nenner getrennt berechnen. Durch Anwenden von Satz 1.6 (b) erhalten wir
limn→∞ (2 − n5 ) = 2 − 5 limn→∞ n1 = 2 und limn→∞ 3 + n42 = 3 + 4 limn→∞ n1 limn→∞ n1 = 3
folgt wegen Satz 1.6 (b) und (c). Damit haben wir limn→∞ an = 23 berechnet.
Der folgende Satz wird ebenfalls häufig zum Berechnen eines Grenzwerts verwendet.
Satz 1.7: Existieren die Grenzwerte limn→∞ an und limn→∞ bn und sind beide gleich a
und gibt es außerdem ein m0 mit an ≤ xn ≤ bn für alle n ≥ m0 , dann existiert auch
limn→∞ xn und ist ebenfalls gleich a.
Beweis: Sei ε > 0 vorgegeben. Wir finden n1 mit |an − a| < ε für alle n ≥ n1 und n2
mit |bn − a| < ε für alle n ≥ n2 . Sei n0 = max(m0 , n1 , n2 ). Für n ≥ n0 gilt an ≤ xn ≤ bn
und an und bn liegen in der ε-Umgebung von a. Da dann auch jeder Punkt, der zwischen
an und bn liegt, in der ε-Umgebung von a liegen muss, erhalten wir |xn − a| < ε für alle
n ≥ n0 , womit limn→∞ xn = a gezeigt ist.
√
√
√
Beispiel: Sei xn = n + 2 n − n. Wir berechnen limn→∞ xn mittels Satz 1.7. Es gilt
√
√
√
√
1 − 2√1 n ≤ xn ≤ 1 ⇔ n + 1 − 2√1 n ≤ n + 2 n ≤ n + 1
√
√
√
1
⇔ n + 2 n − √1n + 4n
≤n+2 n≤n+2 n+1
Die letzte Aussage ist leicht als richtig erkennbar, daher haben wir an ≤ xn ≤ bn mit
an = 1 − 2√1 n und bn = 1 für n ≥ 1 gezeigt. Wegen limn→∞ √1n = 0 folgt limn→∞ an = 1
aus Satz 1.6. Klarerweise gilt limn→∞ bn = 1. Aus Satz 1.7 folgt daher limn→∞ xn = 1.
Es folgt ein weiterer Satz, der ebenfalls die Existenz eines Grenzwerts zum Inhalt hat.
Dazu sind einige Definitionen notwendig. Eine Folge (an )n≥0 heißt monoton wachsend,
wenn an+1 ≥ an für alle n gilt. Eine Folge (an )n≥0 heißt monoton fallend, wenn an+1 ≤ an
für alle n gilt. Eine Folge (an )n≥0 heißt nach oben beschränkt mit oberer Schranke c, wenn
an ≤ c für alle n gilt. Eine Folge (an )n≥0 heißt nach unten beschränkt mit unterer Schranke
d, wenn an ≥ d für alle n gilt. Der erste Teil von Satz 1.5 besagt, dass eine konvergente
Folge sowohl nach oben als auch nach unten beschränkt ist.
Satz 1.8 (Satz über die Konvergenz monotoner Folgen) Eine monoton wachsende, nach
oben beschränkte Folge hat einen Grenzwert. Eine monoton fallende, nach unten beschränkte Folge hat einen Grenzwert.
Der Beweis dieses Satzes verwendet die Intervallschachtelungseigenschaft der reellen
Zahlen. Beweise, die die Intervallschachtelungseigenschaft verwenden, sind in einem späteren
Kapitel zusammengestellt. Dort findet man unter anderem auch den Beweis von Satz 1.8.
Franz Hofbauer
13
Im folgenden Beispiel werden rekursiv definierte Folgen (jedes Folgenglied wird aus den
vorhergehenden berechnet) mit Hilfe von Satz 1.8 untersucht.
a3 +1
Beispiel: Sei a0 = 1 und an+1 = n3 für n ≥ 0. Wir zeigen, dass die so definierte Folge
monoton fallend ist und 13 als untere Schranke hat.
Es gilt a1 = 23 ≤ a0 . Angenommen, wir haben a0 ≥ a1 ≥ · · · ≥ an−1 ≥ an ≥ 31 schon
a3 +1
a3 +1
a3
+1
gezeigt. Dann folgt an+1 = n3 ≥ 13 und an+1 = n3 ≤ n−1
= an , sodass auch
3
1
a0 ≥ a1 ≥ · · · ≥ an−1 ≥ an ≥ an+1 ≥ 3 gilt. Durch Wiederholen dieses Beweisschritts
sieht man, dass die Folge (an )n≥0 monoton fallend und nach unten durch 31 beschränkt ist.
Nach Satz 1.8 existiert der Grenzwert limn→∞ an = x. Wegen Satz 1.6 gilt x ≥ 13 und
lim
a3 +1
3
n→∞ n
x = limn→∞ an+1 =
= x 3+1 . Der Grenzwert x ist also eine Lösung der
3
Gleichung x3 − 3x + 1 = 0, die im Intervall [ 13 , 1) liegt.
√
√
√
Sei b0 = 1 und bn+1 = 3 − b1n . Es gilt b0 ≤ 2 = b1 ≤ 3. Wie oben zeigt man,
√
dass die Folge (bn )n≥0 monoton wachsend und nach oben durch 3√
beschränkt ist. Ist
√
√
b0 ≤ b1 ≤ · · · ≤ bn−1 ≤ bn ≤ 3 schon gezeigt, dann folgt bn+1 = 3 − b1n ≤ 3 und
√
√
√
1
bn+1 = 3 − b1n ≥ 3 − bn−1
= bn , sodass auch b0 ≤ b1 ≤ · · · ≤ bn−1 ≤ bn ≤ bn+1 ≤ 3
gilt. Durch Wiederholen dieses Beweisschritts
sieht man, dass die Folge (bn )n≥0 monoton
√
wachsend und nach oben durch 3 beschränkt ist.
Nach Satz 1.8 existiert der Grenzwert limn→∞ bn = y. Da b2n+1 = 3 − b1n für alle n gilt,
folgt y 2 = 3 − y1 mit Hilfe von Satz 1.6. Somit ist y wieder eine Lösung der Gleichung
√
y 3 − 3y + 1 = 0, allerdings eine im Intervall (1, 3].
5. Funktionen
Sei D eine Teilmenge von R. Wird jeder Zahl x ∈ D in eindeutiger Weise eine reelle Zahl
f (x) zugeordnet, dann nennt man f eine Funktion mit Definitionsbereich D. Oft werden
x
Funktionen durch Formeln angegeben, zum Beispiel f (x) = 2 + 3x − 5x2 oder f (x) = 1+x
2,
wobei man in beiden Fällen den Definitionsbereich D = R wählen kann. Das ist jedoch
3
nicht immer möglich. Hat man zum Beispiel die Funktion f (x) = x3x
2 −1 , dann muss man 1
und −1 aus dem Definitionsbereich ausschließen, da man diese Zahlen nicht in die Formel
einsetzen kann. In diesem Fall ist D = R \ {−1, 1} ein geeigneter Definitionsbereich. Man
kann für diese Funktion aber auch den Definitionsbereich D = (−1, 1) wählen, oder D =
[2, 9] oder viele andere Mengen. Es ist daher wichtig den Definitionsbereich D anzugeben.
Man schreibt f : D → R, wenn f auf D definiert ist und Werte in R hat. Für x ∈ D nennt
man die Zahl f (x) den Funktionswert im Punkt x und die Menge f (D) = {f (x) : x ∈ D}
aller Funktionswerte heißt Wertebereich der Funktion f . Oft drückt man Funktionen auch
mit Hilfe des Symbols 7→ aus. Zum Beispiel schreibt man die Funktion, die jedem x den
Wert 3x3 zuordnet, als x 7→ 3x3 .
Man kann Funktionen in einem Koordinatensystem zeichnen. Man zeichnet die Menge
der Punkte (x, f (x)) für x ∈ D. Diese Menge von Punkten nennt man den Graph der
Funktion f . Der Graph der Funktion f (x) = x2 ist eine Parabel. Die folgenden Zeichnungen zeigen die Graphen der Funktionen x 7→ |1 − |3x|| − 32 und x 7→ max(−2x2 + 23 , 34 x).
14
Reelle Zahlen und stetige Funktionen
Wir überlegen uns, wie sich der Graph einer Funktion unter gewissen Transformationen
ändert. Der Graph der Funktion x 7→ f (−x) ist der um die y-Achse gespiegelte Graph der
Funktion x 7→ f (x). Der Graph der Funktion x 7→ −f (x) ist der um die x-Achse gespiegelte
Graph der Funktion x 7→ f (x). Im Folgenden sei a immer > 0. Der Graph der Funktion
x 7→ f (x + a) ist der um a Einheiten nach links und der Graph der Funktion x 7→ f (x − a)
ist der um a Einheiten nach rechts verschobene Graph der Funktion x 7→ f (x). Der Graph
der Funktion x 7→ f (ax) ist der um den Faktor a1 in x-Richtung gedehnte (gestauchte)
Graph der Funktion x 7→ f (x). Der Graph der Funktion x 7→ f (x) + a ist der um a
Einheiten nach oben und der Graph der Funktion x 7→ f (x) − a ist der um a Einheiten
nach unten verschobene Graph der Funktion x 7→ f (x). Schließlich ist der Graph der
Funktion x 7→ af (x) der um den Faktor a in y-Richtung gedehnte (gestauchte) Graph der
Funktion x 7→ f (x).
Beispiel: Sei f (x) = 2x2 − 4x + 1 mit
Definitionsbereich D = R. Durch Umformen erhalten wir f (x) = 2(x − 1)2 − 1.
Der Graph der Funktion g(x) = x2 ist eine
Parabel. Wir nennen sie Standardparabel.
Man erhält den Graph der Funktion f , indem man die Standardparabel um 1 Einheit
nach rechts verschiebt, dann um den Faktor 2 in y-Richtung dehnt und schließlich
um 1 Einheit nach unten verschiebt. Die
nebenstehende Zeichnung zeigt den Graph
der Funktion f (x) = 2(x − 1)2 − 1 und die
Standardparabel. Man kann die durchgeführten Transformationen nachvollziehen.
Die einfachsten Funktionen sind Polynome. Ihr Definitionsbereich ist ganz R. Konstante
Funktionen f (x) = c haben waagrechte Geraden als Graphen. Die Funktionen f (x) =
c1 x + c0 mit c1 ̸= 0 sind die Polynome ersten Grades, deren Graphen ebenfalls Gerade
sind, die allerdings nicht mehr waagrecht verlaufen. Die Funktionen f (x) = c2 x2 + c1 x + c0
mit c2 ̸= 0 sind die Polynome zweiten Grades. Ihre Graphen sind Parabeln, die man aus
der Standardparabel nach der Methode in obigem Beispiel erhält. Schließlich nennt man
die Funktionen f (x) = cn xn + · · · + c1 x + c0 mit cn ̸= 0 die Polynome n-ten Grades.
Rationale Funktionen sind Brüche, deren Zähler und Nenner Polynome sind. Das Nennerpolynom kann in endlich vielen Punkten gleich 0 sein. Diese Punkte muss man aus dem
Franz Hofbauer
15
Definitionsbereich ausschließen. Dort hat der Graph der Funktion senkrechte Asymptoten.
Die einfachste rationale Funktion ist f (x) = x1 mit Definitionsbereich D = R \ {0}. Der
Graph ist eine Hyperbel, deren Asymptoten die x-Achse und die y-Achse sind.
3x+1
Beispiel: Sei f (x) = 6x−2
mit Definitions1
bereich D = R \ { 3 }. Durch Umformen erhalten wir f (x) = 13 x−1 1 + 12 . Man kann den
3
Graphen dieser Funktion aus dem Graphen
der Funktion g(x) = x1 durch entsprechende
Transformationen gewinnen. Zuerst wird der
Graph der Funktion g um 13 nach rechts verschoben, dann um den Faktor 13 in y-Richtung
geschrumpft und schließlich um 12 nach oben
verschoben. So erhält man den Graph der
Funktion f , den die nebenstehende Zeichnung
zeigt. Er hat eine senkrechte Asymptote bei x =
1
3
und eine waagrechte bei y = 12 .
Ist der Grad des Zählerpolynoms einer rationalen Funktion f größer oder gleich dem
Grad des Nennerpolynoms, so kann man f schreiben als Summe eines Polynoms und einer
rationalen Funktion, deren Zählergrad kleiner als der Nennergrad ist. Der Graph der
Funktion f liegt asymptotisch zu diesem Polynom.
−x+1
Beispiel: Sei f (x) = x +x
mit Defi3x2 −3
nitionsbereich D = R \ {−1, 1}. Umformen
ergibt f (x) = 13 x + 13 + 32 x21−1 . Die Gerade y = 13 x + 13 ist eine Asymptote für den
Graphen von f , da die Diﬀerenz 23 x21−1 zwischen dieser Gerade und f (x) für Zahlen x
mit großem Betrag sehr klein ist. Außerdem
hat der Graph von f senkrechte Asymptoten
bei x = −1 und x = 1. Die nebenstehende
Zeichnung zeigt den Graph der Funktion f
zusammen mit den drei Asymptoten.
3
2
Nach diesen eher geometrischen Überlegungen zu den Funktionsgraphen wollen wir uns
dem Rechnen mit Funktionen zuwenden. Sind f1 und f2 Funktionen mit Definitionsbereichen D1 und D2 , dann kann man auf D = D1 ∩ D2 Summe, Diﬀerenz und Produkt
dieser Funktionen bilden. Man definiert f1 + f2 als die Funktion, die jedem x ∈ D den
Wert f1 (x) + f2 (x) zuordnet. Genauso definiert man f1 − f2 und f1 · f2 . Mit dem Quotient ff12 muss man vorsichtiger sein. Man muss alle Punkte x aus dem Definitionsbereich
ausschließen, für die f2 (x) = 0 gilt.
Funktionen lassen sich auch hintereinander ausführen. Sind f und g Funktionen mit
Definitionsbereichen D1 und D2 , und gilt f (x) ∈ D2 für alle x ∈ D1 , dann kann man
g(f (x)) bilden. Die Funktion mit Definitionsbereich D1 , die jedem x ∈ D1 den Wert
g(f (x)) zuordnet, bezeichnet man mit g ◦ f .
16
Reelle Zahlen und stetige Funktionen
6. Stetigkeit
Eine stetige Funktion f stellt man sich so vor, dass man den Graph dieser Funktion als
nicht unterbrochene Linie zeichnen kann. Wenn der Punkt y dem Punkt x nahe kommt,
dann muss auch der Funktionswert f (y) dem Funktionswert f (x) nahe kommen. Um eine
mathematische Definition zu geben, verwenden wir Umgebungen.
Definition: Sei f : D → R eine Funktion und x ∈ D. Die Funktion f heißt stetig
im Punkt x, falls für jedes ε > 0 ein δ > 0 existiert, sodass |f (y) − f (x)| < ε für alle
y ∈ (x − δ, x + δ) ∩ D gilt. Man sagt f ist stetig auf D, wenn f in jedem Punkt x ∈ D
stetig ist.
Einfache Beispiele für stetige Funktionen sind lineare Funktionen, die Definitionsbereich
D = R haben. Ist f (x) = c für alle x ∈ R und ε > 0 vorgegeben, dann kann man δ > 0
wählen, wie man will. Es gilt immer |f (y) − f (x)| = 0 < ε für alle y ∈ (x − δ, x + δ). Ist
a ̸= 0 und f (x) = ax + b für alle x ∈ R, dann kann man zu vorgegebenem ε > 0 immer
1
δ = |a|
ε wählen. Für y ∈ (x − δ, x + δ), das sind ja die y mit |y − x| < δ, gilt dann
|f (y) − f (x)| = |a| · |y − x| < ε. Damit ist gezeigt, dass f in jedem Punkt x ∈ R stetig
ist. Bei komplizierteren Funktionen kann die Wahl von δ schwieriger sein, wie das folgende
Beispiel zeigt.
Beispiel: Die Funktion f (x) = x2 ist stetig in jedem Punkt x ∈ R. Wir prüfen die
Definition nach. Sei ε > 0 vorgegeben. Hier hängt die Wahl von δ nicht nur von ε, sondern
ε
auch von x ab. Wir können δ = min( 1+|2x|
, 1) wählen. Ist dann y ∈ (x − δ, x + δ), also
|y − x| < δ, so folgt |y + x| = |y − x + 2x| ≤ |y − x| + |2x| ≤ 1 + |2x| und damit erhalten
wir |f (y) − f (x)| = |y 2 − x2 | = |y + x| · |y − x| < (1 + |2x|)δ ≤ ε.
Um die Stetigkeit von Funktionen nicht so mühsam nachrechnen zu müssen, führen wir
im nächsten Satz die Stetigkeit auf Grenzwerte zurück. Für jede Folge (xn )n≥1 , deren
Glieder xn im Definitionsbereich einer Funktion f liegen, können wir die Folge der Funktionswerte f (xn ) untersuchen.
Satz 1.9: Sei f : D → R eine Funktion und x ∈ D. Dann sind äquivalent
(a) f ist im Punkt x stetig
(b) für jede Folge (xn )n≥1 in D mit limn→∞ xn = x gilt limn→∞ f (xn ) = f (x).
Beweis: Der Beweis besteht aus zwei Teilen. Wir beginnen mit (a) ⇒ (b). Unter der
Voraussetzung der Stetigkeit von f im Punkt x müssen wir limn→∞ f (xn ) = f (x) zeigen.
Wir wählen ε > 0 beliebig und suchen n0 . Da f im Punkt x stetig ist, gibt es ein δ > 0,
sodass |f (y) − f (x)| < ε für alle y ∈ (x − δ, x + δ) ∩ D gilt. Wegen limn→∞ xn = x finden
wir jetzt ein n0 , sodass xn ∈ (x − δ, x + δ) für alle n ≥ n0 gilt. Da xn ∈ D für alle n ≥ 1
vorausgesetzt wird, gilt mit diesem n0 , dass |f (xn ) − f (x)| < ε für alle n ≥ n0 erfüllt ist,
womit limn→∞ f (xn ) = f (x) gezeigt ist.
Wir zeigen (b) ⇒ (a) durch einen indirekten Beweis. Wir nehmen an, dass (a) nicht gilt
und zeigen, dass dann auch (b) nicht gelten kann. Sei also (a) nicht erfüllt, das heißt f ist
im Punkt x nicht stetig. Nach Definition der Stetigkeit existiert ein ε > 0, sodass, ganz egal
wie klein wir δ > 0 wählen, immer ein y ∈ (x − δ, x + δ) ∩ D existiert mit |f (y) − f (x)| ≥ ε.
Insbesondere können wir δ = n1 wählen und finden ein yn ∈ (x − n1 , x + n1 ) ∩ D mit
|f (yn ) − f (x)| ≥ ε. Somit haben wir eine Folge (yn )n≥1 in D gefunden, deren Grenzwert
x ist nach Satz 1.7, da ja x − n1 ≤ yn ≤ x + n1 für alle n ≥ 1 gilt. Andererseits gilt
Franz Hofbauer
17
limn→∞ f (yn ) = f (x) nicht, da f (yn ) für jedes n ≥ 1 außerhalb der ε-Umgebung von f (x)
liegt. Damit ist gezeigt, dass (b) nicht gilt.
Mit diesem Satz und den Rechenregeln für Grenzwerte erhält man den folgenden Satz,
der besagt, dass Summe, Diﬀerenz, Produkt und Quotient von stetigen Funktionen wieder
stetig sind.
Satz 1.10: Seien f : D → R und g : D → R Funktionen, die im Punkt x ∈ D stetig sind.
Dann sind auch die Funktionen f + g, f − g und f g im Punkt x stetig. Ist g(x) ̸= 0, dann
ist auch fg im Punkt x stetig.
Beweis: Der Definitionsbereich der Funktionen f + g, f − g und f g ist ebenfalls D.
Sei (xn )n≥1 eine beliebige Folge in D mit Grenzwert x. Da f und g im Punkt x stetig
sind, folgt limn→∞ f (xn ) = f (x) und limn→∞ g(xn ) = g(x) aus Satz 1.9. Aus Satz 1.6
folgt limn→∞ f (xn ) + g(xn ) = f (x) + g(x), limn→∞ f (xn ) − g(xn ) = f (x) − g(x) und
limn→∞ f (xn )g(xn ) = f (x)g(x). Wegen Satz 1.9 heißt das aber, dass die Funktionen
f + g, f − g und f g im Punkt x stetig sind.
Um den Definitionsbereich E der Funktion fg zu erhalten, muss man aus D noch alle
Punkte ausschließen, in denen g null ist. Da g(x) ̸= 0 vorausgesetzt wird, liegt x in E.
Wählt man eine beliebige Folge (xn )n≥1 in E mit Grenzwert x, so gilt g(xn ) ̸= 0 für alle
n ≥ 1. Außerdem gilt limn→∞ f (xn ) = f (x) und limn→∞ g(xn ) = g(x) wegen Satz 1.9.
(xn )
(x)
Aus Satz 1.6 (d) folgt limn→∞ fg(x
= fg(x)
. Wegen Satz 1.9 heißt das aber, dass die
n)
Funktion
f
g
im Punkt x stetig ist.
Mit Hilfe dieses Satzes kann man für viele Funktionen zeigen, dass sie stetig sind. Die
Funktion f (x) = x ist für alle x ∈ R stetig. Durch Produktbildung folgt, dass auch die
Funktionen x 7→ x2 , x 7→ x3 , . . . auf ganz R stetig sind. Da konstante Funktionen stetig
sind, sind auch die Funktionen x 7→ cxn mit c ∈ R und n ∈ N stetig. Durch Bilden von
Summen folgt dann, dass alle Polynome auf ganz R stetig sind. Daraus erhält man wieder
die Stetigkeit von rationalen Funktionen in allen Punkten, wo das Nennerpolynom nicht
null ist.
Treppenfunktionen sind Beispiele für Funktionen, die nicht überall stetig sind. Die
Funktion f : [0, 2] → R definiert durch f (x) = 3 für x ∈ [0, 1) und f (x) = 2 für x ∈ [1, 2] ist
ein einfaches Beispiel für eine Treppenfunktion. Sie ist im Punkt 1 unstetig. Ist xn = 1− n1
für n ≥ 1, dann ist (xn )n≥1 eine Folge in [0, 2] mit f (xn ) = 3 für alle n ≥ 1, sodass auch
limn→∞ f (xn ) = 3 gilt. Andererseits gilt f (1) = 2, sodass f wegen Satz 1.9 im Punkt 1
unstetig ist.
Zum Abschluss behandeln wir noch die Stetigkeit bei Hintereinanderausführen von zwei
Funktionen.
Satz 1.11: Seien f : D1 → R und g : D2 → R Funktionen. Für alle x ∈ D1 gelte
f (x) ∈ D2 . Wenn f in x ∈ D1 und g in f (x) ∈ D2 stetig sind, dann ist auch g ◦ f in x
stetig.
Beweis: Sei (xn )n≥1 eine beliebige Folge in D1 mit Grenzwert x. Dann ist (f (xn ))n≥1
eine Folge in D2 . Da f in x stetig ist, hat diese Folge wegen Satz 1.9 den Grenzwert f (x).
Da g im Punkt f (x) stetig ist, folgt limn→∞ g(f (xn )) = g(f (x)) wieder aus Satz 1.9. Das
aber bedeutet wieder wegen Satz 1.9 die Stetigkeit von g ◦ f im Punkt x.
18
Reelle Zahlen und stetige Funktionen
7. Zwischenwertsatz und Umkehrfunktion
Der wichtigste Satz über stetige Funktionen ist der Zwischenwertsatz. Liegt der Funktionswert in einem Punkt a unterhalb eines Wertes y und in einem anderen Punkt b
oberhalb von y, dann muss der Graph der Funktion, der ja eine nicht unterbrochene Linie
ist, an einer Stelle zwischen a und b den Wert y überschreiten.
Satz 1.12 (Zwischenwertsatz) Sei f : [a, b] → R stetig. Es gelte f (a) < y < f (b) oder
f (a) > y > f (b). Dann existiert ein x ∈ (a, b) mit f (x) = y.
Der Beweis dieses Satzes verwendet die Intervallschachtelungseigenf (b)
schaft und wird in einem späteren
Kapitel gemeinsam mit anderen Beweisen gebracht. Die nebenstehende
Zeichnung illustriert die Aussage des
Zwischenwertsatzes. Ist y eine Zahl,
y
die zwischen den Funktionswerten
f (a) und f (b) liegt, dann hat die
Gleichung f (x) = y eine Lösung x
f (a)
im Intervall (a, b). Wie die Zeichnung zeigt, muss diese Lösung jedoch nicht eindeutig sein. Um eindeutige Lösungen zu haben, muss
die Funktion neben der Stetigkeit
a
x
b
noch eine andere Voraussetzung erfüllen. Wir müssen uns mit dem Monotonieverhalten von Funktionen beschäftigen.
Definition: Sei D ⊆ R. Eine Funktion f : D → R heißt
(a) konstant, wenn ein c ∈ R existiert mit f (x) = c für alle x ∈ D
(b) monoton wachsend, wenn gilt: u, v ∈ D und u < v ⇒ f (u) ≤ f (v)
(c) streng monoton wachsend, wenn gilt: u, v ∈ D und u < v ⇒ f (u) < f (v)
(d) monoton fallend, wenn gilt: u, v ∈ D und u < v ⇒ f (u) ≥ f (v)
(e) streng monoton fallend, wenn gilt: u, v ∈ D und u < v ⇒ f (u) > f (v)
Satz 1.13: Sei f : [a, b] → R stetig und streng monoton wachsend oder fallend. Für jedes
y, das zwischen f (a) und f (b) liegt, hat dann die Gleichung f (x) = y genau eine Lösung
x ∈ (a, b).
Beweis: Die Existenz von x folgt aus Satz 1.12. Für x̃ ̸= x kann aber f (x̃) = f (x) nicht
gelten, da eine streng monotone Funktion in zwei verschiedenen Punkten nicht den selben
Funktionswert haben kann.
Schließlich führen wir noch die Umkehrfunktion zu einer Funktionen f : I → R ein,
wobei I ein beliebiges Intervall ist, zum Beispiel I = [a, b], I = (a, b), I = [a, ∞), I = R
oder sonst eines. Die Umkehrfunktion g ist auf dem Wertebereich f (I) = {f (x) : x ∈ I}
definiert. Sie weist jedem Element y = f (x) von f (I) den Wert x zu, kehrt also die
Zuordnung, die f durchführt, um. Man berechnet g, indem man die Gleichung y = f (x)
nach x auflöst und g(y) = x setzt. Voraussetzung ist, dass die Lösung x eindeutig ist. Es
gelten dann die Gleichungen g(f (x)) = x für alle x ∈ I und f (g(y)) = y für alle y ∈ f (I).
Franz Hofbauer
19
Der Graph der Umkehrfunktion g von f geht aus dem Graph von f durch Spiegelung an
der Geraden y = x hervor. Diese Spiegelung führt nämlich die Menge {(x, f (x)) : x ∈ I},
die den Graph von f bildet über in die Menge {(f (x), x) : x ∈ I} = {(y, g(y)) : y ∈ f (I)},
die den Graph von g bildet.
Beispiel: Die Funktion f (x) = 4x−3
ist
2x
auf dem Intervall I = (0, ∞) definiert. Die
Funktionswerte f (x) durchlaufen das Intervall J = (−∞, 2), wenn x durch I läuft. Daher gilt f (I) = J. Die Umkehrfunktion erhält
man durch Lösen der Gleichung y = 4x−3
2x
nach x, vorausgesetzt diese Lösung ist eindeutig bestimmt. Das ist auch der Fall. Wir
3
erhalten x = 4−2y
als eindeutige Lösung. Die
3
. Sie
Umkehrfunktion ist daher g(y) = 4−2y
ist auf J definiert und es gilt g(f (x)) = x
für x ∈ I und f (g(y)) = y für y ∈ J, wie
man leicht nachprüft. Die Zeichnung zeigt
die Graphen der beiden Funktionen. Sie liegen
symmetrisch zur Geraden y = x.
g
f
Der folgende Satz gibt an, unter welchen Voraussetzungen eine Umkehrfunktion existiert.
Satz 1.14: Sei I = [a, b] ⊆ R ein abgeschlossenes Intervall und f : I → R stetig und
streng monoton wachsend oder fallend. Sei J = [f (a), f (b)], wenn f monoton wachsend,
und J = [f (b), f (a)], wenn f monoton fallend ist. Dann existiert eine eindeutig bestimmte
Funktion g : J → I mit g(f (x)) = x für alle x ∈ I und f (g(y)) = y für alle y ∈ J.
Weiters ist g streng monoton wachsend, wenn f monoton wachsend ist, und streng monoton
fallend, wenn f monoton fallend ist. Schließlich ist g auch stetig. Die Funktion g heißt
Umkehrfunktion von f .
Beweis: Wir führen den Beweis nur für streng monoton wachsende Funktionen. Für
streng monoton fallende Funktionen verläuft der Beweis ganz analog. Es drehen sich nur
Ungleichheitszeichen um.
Wir definieren die Funktion g : J → I. Sei y ∈ J. Wenn y = f (a) gilt, dann setzen wir
g(y) = a. Wenn y = f (b) gilt, dann setzen wir g(y) = b. Wenn keiner dieser beiden Fälle
eintritt, dann liegt y zwischen f (a) und f (b). Aus dem Zwischenwertsatz folgt dann, dass
ein x ∈ (a, b) existiert mit f (x) = y. Da f streng monoton wachsend ist, ist x eindeutig
bestimmt. Wir setzen g(y) = x. Damit ist g : J → I definiert. Aus dieser Definition ergibt
sich f (g(y)) = y für alle y ∈ J. Ist andererseits x ∈ I beliebig, dann gilt f (x) ∈ J und wir
können y = f (x) in die Gleichung f (g(y)) = y einsetzen. Es folgt f (g(f (x))) = f (x) und
daraus dann g(f (x)) = x, da f streng monoton ist.
Weiters ist g : J → I eindeutig bestimmt. Wäre g̃ : J → I eine andere Funktion mit den
selben Eigenschaften, dann hätten wir f (g(y)) = y = f (g̃(y)) und somit auch g(y) = g̃(y)
für alle y ∈ J wegen der strengen Monotonie von f .
Die Funktion g ist streng monoton wachsend. Aus y1 < y2 folgt g(y1 ) < g(y2 ). Wäre
nämlich g(y1 ) ≥ g(y2 ), dann würde f (g(y1 )) ≥ f (g(y2 )) folgen, da f streng monoton
wachsend ist, also y1 ≥ y2 . Daher kann g(y1 ) ≥ g(y2 ) nicht gelten.
20
Reelle Zahlen und stetige Funktionen
Schließlich beweisen wir, dass g : J → I stetig ist. Sei y ∈ J und (yn )n≥1 eine Folge in
J mit limn→∞ yn = y. Wegen Satz 1.9 genügt es zu zeigen, dass limn→∞ g(yn ) = g(y)
gilt. Würde das nicht zutreﬀen, dann fände man ein x1 < g(y), sodass g(yn ) ≤ x1 für
unendlich viele n gilt, oder ein x2 > g(y), sodass g(yn ) ≥ x2 für unendlich viele n gilt. Im
ersten Fall folgt f (x1 ) < y und yn ≤ f (x1 ) für unendlich viele n, da f streng monoton
wachsend ist, ein Widerspruch zu limn→∞ yn = y. Im zweiten Fall folgt f (x2 ) > y und
yn ≥ f (x2 ) für unendlich viele n, ebenfalls ein Widerspruch zu limn→∞ yn = y. Die
Annahme, dass limn→∞ g(yn ) = g(y) nicht gilt, führt daher immer zu einem Widerspruch,
womit limn→∞ g(yn ) = g(y) gezeigt ist.
Bemerkung: Für eine stetige und streng monotone Funktion f : I → R kann man die
Umkehrfunktion auch dann bilden, wenn I ein Intervall ist, das nicht beschränkt und
abgeschlossen ist. Das soll an Beispielen erklärt werden.
Sei I = [0, ∞) und f : I → R die Funktion f (x) = x2 . Sie ist stetig und streng monoton
wachsend. Für n ≥ 1 sei In = [0, n] und Jn = [0, n2 ]. Wegen f (0) = 0 und f (n) = n2 folgt
aus Satz 1.14, dass die eindeutig bestimmte Umkehrfunktion g von Jn nach In definiert ist.
Da n beliebig groß gewählt werden kann, ist g von J = [0, ∞) nach I = [0, ∞) definiert.
Noch ein Beispiel: Sei I = (0, ∞) und f : I → R die Funktion f (x) = x13 . Sie ist stetig und
streng monoton fallend. Für n ≥ 1 sei In = [ n1 , n] und Jn = [ n13 , n3 ]. Wegen f ( n1 ) = n3
und f (n) = n13 folgt aus Satz 1.14, dass die eindeutig bestimmte Umkehrfunktion g von
Jn nach In definiert ist. Da n beliebig groß gewählt werden kann, ist g von J = (0, ∞)
nach I = (0, ∞) definiert.
8. Potenzfunktion
Zuerst behandeln wir Potenzfunktionen f (x) = xm mit ganzzahligen Exponenten m.
Um rationale Exponenten einführen zu können, definieren wir dann die m-te Wurzel einer
positiven reellen Zahl mit Hilfe der Umkehrfunktion. Wir haben die Quadratwurzel bereits
mit Hilfe der Intervallschachtelungseigenschaft definiert, mit der Umkehrfunktion kann
man jedoch einfacher arbeiten und auch höhere Wurzeln leicht definieren.
Definition: Sei a > 0. Für m ∈ N definieren wir am als m-faches Produkt, wir setzen
a0 = 1, und a−m definieren wir als a1m .
Satz 1.15: Sei a > 0 und b > 0. Für m und n in Z gilt dann
(a) am bm = (ab)m
(b) am+n = am an
(c) (am )n = amn
Beweis: Den Beweis führt man durch Anwenden der Definition mit Hilfe entsprechender
Fallunterscheidungen. Ist m > 0, dann ist am = a · a · . . . · a und bm = b · b · . . . · b, wobei
rechts jeweils ein m-faches Produkt steht. Ebenso gilt (ab)m = ab · ab · . . . · ab. Daraus
erkennt man, dass (a) für positives m richtig ist. Mit Hilfe dieses Resultats folgt dann
1
−m
a−m b−m = a1m b1m = (ab)
, sodass (a) auch für negative Exponenten gilt. Für
m = (ab)
m = 0 wird (a) zu 1 = 1.
Sind m und n beide ≥ 0, dann ist sowohl am+n als auch am an das m + n-fache Produkt
a · a · . . . · a, woraus (b) für nicht negative m und n folgt. Ist m ≥ 0 und n < 0, dann ist
am an ein Bruch, dessen Zähler das m-fache Produkt a · a · . . . · a (oder 1, wenn m = 0) ist,
und dessen Nenner das |n|-fache Produkt a · a · . . . · a ist. Kürzt man so viele a wie möglich
weg, dann bleibt am+n übrig. Analog läßt sich (b) auch für die Fälle m < 0, n ≥ 0 und
m < 0, n < 0 nachprüfen.
Franz Hofbauer
21
Ist n > 0, dann ist (am )n das n-fache Produkt am · am · . . . · am . Durch wiederholtes
Anwenden von (b) wird das zu am+m+···+m = amn , womit (c) für n > 0 gezeigt ist. Mit
1
Hilfe dieses Resultats folgt dann (am )−n = (am1 )n = amn
= a−mn = am(−n) . Für n = 0
wird (c) zu 1 = 1.
Der folgende Satz gibt eine Äquivalenzumformung, die sehr nützlich sein wird.
Satz 1.16: Für a, b ∈ [0, ∞) und n ∈ N gilt a < b ⇔ an < bn und a = b ⇔ an = bn .
Beweis: Wenn a = b = 0 gilt, dann auch an = bn = 0, sodass die Äquivalenzen gelten.
Wir können also a > 0 oder b > 0 annehmen. Sei c = an−1 +an−2 b+· · ·+abn−2 +bn−1 . Es
gilt c > 0. Wir verwenden die Formel an − bn = (a − b)(an−1 + an−2 b + · · · + abn−2 + bn−1 ).
Damit sieht man, dass an − bn = (a − b)c = 0 genau dann gilt, wenn a − b = 0 ist, und
an − bn = (a − b)c < 0 genau dann, wenn a − b < 0 ist.
Sei n ∈ N. Die Funktion f (x) = xn von [0, ∞) nach R ist stetig und wegen Satz 1.16 auch
streng monoton wachsend. Der Wertebereich von f das Intervall [0, ∞) und es existiert die
√
Umkehrfunktion g : [0, ∞) → [0, ∞). Wir schreiben n y für g(y) und nennen diese Zahl
√
√
die n-te Wurzel aus y. Es gilt ( n y)n = y und n xn = x.
Satz 1.17: Sei x > 0 beliebig. Seien m, m̃ ∈ Z und n, ñ ∈ N. Wenn
√
√
ñ
gilt auch n xm = xm̃ .
m
n
=
m̃
ñ
gilt, dann
Beweis: Um zu dieser Schlussfolgerung zu kommen, gehen wir schrittweise vor.
m
n
=
m̃
ñ
⇒ mñ = m̃n ⇒ xmñ = xm̃n
⇒ (xm )ñ = (xm̃ )n
√
√
ñ
⇒ ( n xm )nñ = ( xm̃ )ñn
√
√
ñ
⇒ n xm = xm̃
wegen Satz 1.15 (c)
Definition der Wurzel und Satz 1.15 (c)
wegen Satz 1.16
Damit sind wir beim gewünschten Ergebnis angelangt.
Jetzt können wir die Potenzfunktion mit rationalen Exponenten definieren.
Definition: Sei x > 0, q ∈ Q und m
n√ irgendeine Darstellung von q als Bruch mit m ∈ Z
q
und n ∈ N. Wir definieren x durch n xm , wobei es gleichgültig ist, welche Darstellung m
n
von q gewählt wurde.
m
Aus dieser Definition und der Definition der Wurzel folgt (x n )n = xm . Nun können wir
auch Rechenregeln für rationale Exponenten herleiten.
Satz 1.18: Für p, q ∈ Q und a und b in [0, ∞) gilt
(a) ap bp = (ab)p
(b) ap+q = ap aq
(c) (ap )q = apq
Beweis: Unter Verwendung von Satz 1.15 und Satz 1.16 führen wir diese Formeln durch
Äquivalenzumformungen auf bekannte Formeln zurück. Um (a) zu zeigen, sei p = m
n eine
Darstellung von p als Bruch. Dann gilt
ap bp = (ab)p ⇔ (ap bp )n = ((ab)p )n ⇔ (ap )n (bp )n = ((ab)p )n ⇔ am bm = (ab)m
Da diese letzte Gleichung aus Satz 1.15 bekannt ist, ist (a) bewiesen. Um (b) zu zeigen,
k
wählen wir p = m
n und q = n als Brüche mit gleichem Nenner. Dann gilt
ap+q = ap aq ⇔ (ap+q )n = (ap aq )n ⇔ (ap+q )n = (ap )n (aq )n ⇔ am+k = am ak
22
Reelle Zahlen und stetige Funktionen
womit wir (b) ebenfalls auf eine Formel aus Satz 1.15 zurückgeführt haben. Um auch die
k
letzte Formel zu erhalten, wählen wir p = m
n und q = l und formen um
(ap )q = apq ⇔ (((ap )q )l )n = (apq )ln ⇔ (ap )kn = amk ⇔ ((ap )n )k = amk ⇔ (am )k = amk
womit auch (c) auf Satz 1.15 zurückgeführt ist.
Zum Abschluss dieses Kapitels behandeln wir noch ein geometrisches Problem. Wir
√
berechnen die Länge eines Kreisbogens. Dazu brauchen wir die Wurzelfunktion x 7→ x,
die wegen Satz 1.14 stetig ist. Wir haben gesehen, dass die Fläche eines Kreises mit
Radius 1 eine reelle Zahl ist, die wir π nennen. Die Fläche eines Kreises mit Radius r ist
dann das r2 -fache, also r2 π. Ein Kreissektor mit Winkel α ist ein entsprechender Teil des
α
2
Kreises und hat Fläche A = 360
0 r π. Wir wollen die Länge b des Bogens eines Kreissektors
bestimmen. Dazu müssen wir die Bogenlänge b definieren. Seien P0 , P1 , . . . , Pn Punkte
auf dem Kreisbogen, die den Bogen in n gleiche Teile unterteilen, wobei P0 und Pn die
Endpunkte des Bogens sind. Die Sehnen Pk−1 Pk haben alle die gleiche Länge sn , sodass
nsn die Länge des gesamten Polygonzuges ist. Wir definieren b = limn→∞ nsn .
Satz 1.19: Sei A die Fläche eines Kreissektors in einem Kreis mit Radius r und b die
Länge des zugehörigen Kreisbogens. Dann gilt A = 12 rb.
Beweis: Sei M der Kreismittelpunkt
und seien Pk−1 und Pk zwei aufeinanderfolgende Punkte auf dem Kreisbogen im
Abstand sn . Sei An die Fläche des Kreissektors, die zwischen den Radien M Pk−1
und M Pk liegt, sodass A = nAn folgt.
Als Fläche
√ des Dreiecks Pk−1 M Pk ergibt
Pk
S
sn
r
r2 − 14 s2n . Da sie kleiner als An
√
Pk−1
ist, folgt 21 nsn r2 − 14 s2n ≤ nAn = A. Sei
S der Schnittpunkt der beiden Tangenten
an den Kreis in den Punkten Pk−1 und
M
Pk . Dann ist An kleiner als die Fläche
des Vierecks Pk−1 M Pk S, die 12 sn · |M S|
√
2
beträgt. Nach dem Kathetensatz für das rechtwinkelige Dreieck gilt r = |M S| · r2 − 14 s2n .
2
Es folgt A = nAn ≤ 21 nsn √ 2r 1 2 . Damit haben wir gezeigt
r − 4 sn
√
/√
2A
1 2
2
r − 4 sn ≤ nsn ≤ 2A
r2 − 41 s2n
r2
sich 21 sn
Wegen limn→∞ sn = 0 folgt limn→∞ r2 − 41 s2n = r2 aus Satz 1.6. Da die Funktion f (x) =
√
√
x stetig ist, folgt limn→∞ r2 − 14 s2n = r aus Satz 1.9. Wegen Satz 1.6 folgt daraus
√
/√
2A
2A
1 2
2
lim r2 r − 4 sn = r und lim 2A
r2 − 14 s2n = 2A
r
n→∞
n→∞
Aus Satz 1.7 erhalten wir, dass limn→∞ nsn existiert und gleich
2A
r
ist.
Da die Fläche eines Kreises mit Radius r gleich r2 π ist, ist 2r r2 π = 2rπ nach Satz 1.19
der Umfang des Kreises. Bei der Definition der trigonometrischen Funktionen werden wir
die Winkel durch die Länge des entsprechenden Bogens des Einheitskreises messen. Aus
2πα
dem Umfang 2π des Einheitskreises berechnet man das Bogenmaß 360
0 für den Winkel α.
II. Diﬀerenzierbarkeit
Wir definieren die Ableitung einer Funktion und verwenden sie, um das Monotonieverhalten dieser Funktion zu untersuchen. Daraus ergeben sich Methoden, um Maxima
und Minima zu berechnen und um Gleichungen und Ungleichungen zu beweisen. Weiters
werden die trigonometrischen Funktionen und die Exponentialfunktion eigeführt.
1. Grenzwerte von Funktionen
Es kann vorkommen, dass Funktionen in einem isolierten Punkt nicht definiert sind. Sei
D ein oﬀenes Intervall, das auch unbeschränkt sein kann, also auch (a, ∞) oder (−∞, b)
oder ganz R. Sei x ∈ D und Dx = D \ {x}. Wir nehmen an, dass die Funktion f
auf Dx definiert ist und versuchen f im Punkt
x sinnvoll zu ergänzen. Die nebenstehende
Zeichnung zeigt den Graph einer Funktion, die
im Punkt x = 2 eine Sprungstelle aufweist.
Man kann natürlich f (x) irgendwie festlegen,
aber ein sinnvoller Wert ist wohl der, gegen
den f (y) strebt, wenn y gegen x geht. Für
die Funktion in der nebenstehenden Zeichnung
strebt aber f (y) gegen verschiedene Werte, je
nachdem, ob y von links oder von rechts an x
herankommt. Es gibt keinen Grenzwert. Deshalb ist es nicht möglich den Funktionswert
bei x so festzulegen, dass die Lücke im Graph
x
gesclossen wird.
Wir sind bei dem Problem angelangt, zuerst einmal den Grenzwert von f (y) für y gegen
x zu definieren. Wir gehen analog vor, wie bei der Definition des Grenzwerts einer Folge.
Soll u der Grenzwert der Funktion f im Punkt x sein und gibt man eine ε-Umgebung von
u vor, dann muss der Funktionswert f (y) in dieser ε-Umgebung liegen, wenn y nur nahe
genug bei x liegt. Daraus ergibt sich die Definition des Grenzwerts.
Definition: Sei D ein oﬀenes Intervall, x ∈ D und f auf Dx = D \ {x} definiert. Man
nennt u den Grenzwert der Funktion f im Punkt x, wenn für jedes ε > 0 ein δ > 0 existiert,
sodass |f (y) − u| < ε für alle y ∈ (x − δ, x + δ) ∩ Dx gilt. Man schreibt limy→x f (y) = u.
Der Grenzwert einer Funktion ist eindeutig bestimmt. Das kann man sich genauso
überlegen, wie wir es für Folgen getan haben.
Die Funktion f sei auch im Punkt x definiert. Dann gilt limy→x f (y) = f (x) genau
dann, wenn f im Punkt x stetig ist, wie ein Vergleich der Definitionen von Grenzwert und
Stetigkeit zeigt. Wir verwenden das im folgendes Beispiel.
Beispiel: Die Funktion f (y) =
√
1− 1+y
y
ist auf dem Intervall D = (−1, 1) definiert, außer
im Punkt x = 0. Dort ist der Nenner des Bruches null. Wir berechnen limy→0
√
1− 1+y
.
y
1−(1+y)
−1
−1
√
= 1+√
. Die Funktion g(y) = 1+√
ist auf ganz D
Für y ∈ Dx gilt f (y) = y(1+
1+y)
1+y
1+y
definiert und wegen Satz 1.10 auch stetig, also eine stetige Fortsetzung von f auf ganz D.
Da f (y) = g(y) für y ∈ Dx gilt, erhalten wir limy→0 f (y) = limy→0 g(y) = g(0) = − 21 .
24
Diﬀerenzierbarkeit
Wie wir es schon bei der Stetigkeit von Funktionen getan haben, charakterisieren wir
Grenzwerte von Funktionen durch Grenzwerte von Folgen.
Satz 2.1: Sei D ein oﬀenes Intervall, x ∈ D und f auf Dx = D \ {x} definiert. Dann sind
äquivalent
(a) limy→x f (y) = u
(b) für jede Folge (xn )n≥1 in Dx mit limn→∞ xn = x gilt limn→∞ f (xn ) = u.
Beweis: Der Beweis besteht aus zwei Teilen. Wir beginnen mit (a) ⇒ (b). Unter der
Voraussetzung limy→x f (y) = u müssen wir limn→∞ f (xn ) = u zeigen. Wir wählen ε > 0
beliebig und suchen n0 . Wegen limy→x f (y) = u gibt es ein δ > 0, sodass |f (y) − u| < ε
für alle y ∈ (x − δ, x + δ) ∩ Dx gilt. Wegen limn→∞ xn = x finden wir jetzt ein n0 , sodass
xn ∈ (x − δ, x + δ) für alle n ≥ n0 gilt. Da die Folge (xn )n≥1 auch in Dx liegt, erhalten
wir |f (xn ) − u| < ε für alle n ≥ n0 , womit limn→∞ f (xn ) = u gezeigt ist.
Wir zeigen (b) ⇒ (a) indirekt. Sei also (a) nicht erfüllt, das heißt limy→x f (y) = u gilt
nicht. Es existiert ein ε > 0, sodass für jedes δ > 0 ein y ∈ (x − δ, x + δ) ∩ Dx existiert
mit |f (y) − u| ≥ ε. Wir wählen δ = n1 und finden ein yn ∈ (x − n1 , x + n1 ) ∩ Dx , sodass
|f (yn ) − u| ≥ ε gilt. So haben wir eine Folge (yn )n≥1 in Dx gefunden, deren Grenzwert
x ist, da ja |yn − x| < n1 für alle n ≥ 1 gilt. Andererseits kann limn→∞ f (yn ) = u nicht
gelten, da f (yn ) für jedes n ≥ 1 außerhalb der ε-Umgebung von u liegt. Damit ist gezeigt,
dass (b) nicht gilt.
Um Grenzwerte zu berechnen, sind entsprechende Rechenregeln hilfreich. Diese sind
dieselben wie die Rechenregeln für Grenzwerte von Folgen. Mit Hilfe des letzten Satzes
können wir die Rechenregeln leicht übertragen.
Satz 2.2: Sei D ein oﬀenes Intervall und x ∈ D. Die Funktionen f und g seien auf Dx
definiert. Weiters sollen die Grenzwerte limy→x f (y) = a und limy→x g(y) = b existieren.
(a) Es gilt limy→x f (y) + g(y) = a + b.
(b) Es gilt limy→x f (y)g(y) = ab.
(y)
(c) Ist g(y) ̸= 0 für alle y ∈ Dx und b ̸= 0, dann gilt limy→x fg(y)
= ab .
Beweis: Sei (xn )n≥1 eine beliebige Folge in Dx mit limn→∞ xn = x. Wegen Satz 2.1
gilt limn→∞ f (xn ) = a und limn→∞ g(xn ) = b. Es folgt limn→∞ f (xn ) + g(xn ) = a + b
und limn→∞ f (xn )g(xn ) = ab wegen Satz 1.6 und, wenn b ̸= 0 und g(y) ̸= 0 gilt für alle
(xn )
y ∈ Dx , auch limn→∞ fg(x
= ab . Wegen Satz 2.1 ist dann limy→x f (y) + g(y) = a + b
n)
und limy→x f (y)g(y) = ab gezeigt und, wenn b ̸= 0 und g(y) ̸= 0 gilt für alle y ∈ Dx , auch
(y)
limy→x fg(y)
= ab .
Auch der folgende Satz ergibt sich aus dem entsprechenden Satz für Folgen.
Satz 2.3: Sei D ein oﬀenes Intervall und x ∈ D. Seien f , g und h Funktionen, die auf Dx
definiert sind. Wenn limy→x f (y) = limy→x g(y) = a gilt und f (y) ≤ h(y) ≤ g(y) für alle
y ∈ Dx , dann existiert auch limy→x h(y) und ist ebenfalls gleich a.
Beweis: Sei (xn )n≥1 eine beliebige Folge in Dx mit limn→∞ xn = x. Wegen Satz 2.1 gilt
limn→∞ f (xn ) = a und limn→∞ g(xn ) = a. Weiters folgt f (xn ) ≤ h(xn ) ≤ g(xn ) für alle
n ≥ 1 aus den Voraussetzungen. Nach Satz 1.7 haben wir dann auch limn→∞ h(xn ) = a.
Wegen Satz 2.1 ist damit limy→x h(y) = a gezeigt.
Franz Hofbauer
25
2. Die Ableitung
Die Ableitung einer Funktion im Punkt x ist der Anstieg der Tangente an den Graphen
von f im Punkt x, wenn diese existiert. Wir erhalten diesen Anstieg als Grenzwert der
Anstiege von Sekanten. Sei D ein oﬀenes Intervall, auf dem f definiert ist, und sei x ∈ D.
Ist y ebenfalls in D und ungleich x, so erhält man den Anstieg der Sekante, die den
Punkt mit Koordinaten y und f (y) und den mit Koordinaten x und f (x) verbindet, als
(x)
den Quotienten f (y)−f
. Läßt man jetzt y gegen x wandern, dann wird die Sekante zur
y−x
Tangente im Punkt x. Der Grenzwert des Anstiegs der Sekante wird zum Anstieg der
(x)
Tangente, also zur Ableitung der Funktion im Punkt x. Da die Funktion y 7→ f (y)−f
y−x
für alle y ∈ Dx definiert ist, kann man die Grenzwertdefinition aus dem letzten Kapitel
anwenden.
Definition: Sei f auf dem oﬀenen Intervall D definiert und x ∈ D. Existiert der Grenz(x)
wert limy→x f (y)−f
, dann sagt man, die Funktion f ist im Punkt x diﬀerenzierbar und
y−x
nennt diesen Grenzwert die Ableitung f ′ (x) der Funktion f im Punkt x.
Manchmal ersetzt man in dieser Definition der Ableitung y durch x + h. Dann ist y → x
(x)
äquivalent zu h → 0. Daher kann man auch f ′ (x) = limh→0 f (x+h)−f
schreiben.
h
Beispiel: Wir berechnen die Ableitungen der Funktionen f (x) = xm mit m ∈ Z. Für
(x)
m = 0 ist f eine konstante Funktion. Für konstante Funktionen f gilt f (y)−f
= 0 für
y−x
′
alle x und y, also auch f (x) = 0 für alle x.
Sei k ∈ N. Die Funktion f (x) = xk ist auf D = R definiert. Wir berechnen die Ableitung
von f im Punkt x. Sei g(y) = y k−1 + y k−2 x + y k−3 x2 + · · · + yxk−2 + xk−1 . Für y ̸= x
k
k
−xk
−xk
gilt y y−x
= g(y). Da g im Punkt x stetig ist, folgt limy→x y y−x
= g(x) = kxk−1 . Damit
ist f ′ (x) = kxk−1 berechnet.
Sei k ∈ N. Die Funktion f (x) = x−k ist auf D = R \ {0} definiert. Wir berechnen
die Ableitung von f im Punkt x ̸= 0. Sind x und y in D und ist x ̸= y, dann gilt
k
k
f (y)−f (x)
1 y −x
=
−
k
k
y−x
y−x . Mit Hilfe des obigen Resultats und der Rechenregeln aus Satz 2.2
x y
folgt limy→x
f (y)−f (x)
y−x
= limy→x − xk1yk limy→x
y k −xk
y−x
= − x12k kxk−1 = −kx−k−1 .
Man kann diese Ergebnisse so zusammenfassen. Für m ∈ Z hat f (x) = xm die Ableitung
f ′ (x) = mxm−1 für alle x ∈ D, wobei der Definitionsbereich D gleich R ist für m ≥ 0 und
gleich R \ {0} für m < 0.
Um mit Ableitungen arbeiten zu können, braucht man entsprechende Rechenregeln.
Zuvor klären wir noch den Zusammenhang zwischen Stetigkeit und Diﬀerenzierbarkeit.
Satz 2.4: Sei f auf dem oﬀenen Intervall D definiert und x ∈ D. Wenn f im Punkt x
diﬀerenzierbar ist, dann ist f im Punkt x auch stetig.
(x)
Beweis: Es existiert ein α > 0, sodass | f (y)−f
−f ′ (x)| < 1 für alle y ∈ (x−α, x+α)∩Dx
y−x
gilt, da f im Punkt x diﬀerenzierbar ist. Sei c = |f ′ (x)| + 1. Mit Hilfe der Dreiecksun(x)
gleichung folgt | f (y)−f
| < 1 + |f ′ (x)| = c für alle y ∈ (x − α, x + α) ∩ Dx . Somit gilt
y−x
|f (y) − f (x)| ≤ c|y − x| für alle y ∈ (x − α, x + α) ∩ D. Ist ε > 0 vorgegeben, so wählen
wir δ = min(α, εc ). Für alle y ∈ (x − δ, x + δ) ∩ D gilt dann |f (y) − f (x)| ≤ c|y − x| < ε.
Damit ist die Stetigkeit von f im Punkt x gezeigt.
26
Diﬀerenzierbarkeit
Satz 2.5 (Rechenregeln für die Ableitung) Seien f und g auf einem oﬀenen Intervall D
definiert und x ∈ D. Seien c und d in R. Dann gilt:
(a) Linearität: Wenn f ′ (x) und g ′ (x) existieren, dann ist auch die Funktion cf + dg im
Punkt x diﬀerenzierbar und es gilt (cf + dg)′ (x) = cf ′ (x) + dg ′ (x).
(b) Produktregel: Wenn f ′ (x) und g ′ (x) existieren, dann ist auch die Funktion f g im
Punkt x diﬀerenzierbar und es gilt (f g)′ (x) = f (x)g ′ (x) + f ′ (x)g(x).
(c) Quotientenregel: Wenn f ′ (x) und g ′ (x) existieren und g(y) ̸= 0 ist für y ∈ D, dann ist
1
auch die Funktion fg im Punkt x diﬀerenzierbar und es gilt ( fg )′ (x) = f ′ (x) g(x)
−g ′ (x) gf2(x)
(x) .
Beweis: Um (a) zu beweisen, gehen wir von folgender Gleichung aus
f (y) − f (x)
g(y) − g(x)
(cf + dg)(y) − (cf + dg)(x)
=c
+d
y−x
y−x
y−x
′
′
Da f (x) und g (x) existieren, existiert wegen Satz 2.2 auch der Grenzwert der rechten
Seite dieser Gleichung für y → x und ist gleich cf ′ (x) + dg ′ (x). Daher existiert auch der
Grenzwert der linken Seite und ist ebenfalls gleich cf ′ (x) + dg ′ (x), womit (a) gezeigt ist.
Um (b) zu zeigen, gehen wir von folgender Gleichung aus
f (y)g(y) − f (x)g(x)
g(y) − g(x) f (y) − f (x)
= f (y)
+
g(x)
y−x
y−x
y−x
Nach Satz 2.4 ist f im Punkt x stetig, da f ′ (x) existiert. Also gilt limy→x f (y) = f (x). Da
auch g ′ (x) existiert, existiert wegen Satz 2.2 der Grenzwert der rechten Seite dieser Gleichung für y → x und ist gleich f (x)g ′ (x) + f ′ (x)g(x). Daher existiert auch der Grenzwert
der linken Seite und ist ebenfalls f (x)g ′ (x) + f ′ (x)g(x), womit (b) gezeigt ist.
Um (c) zu zeigen, gehen wir von folgender Gleichung aus
f (y)/g(y) − f (x)/g(x)
f (y) − f (x) 1
g(y) − g(x) f (x)
=
−
y−x
y−x
g(y)
y−x
g(x)g(y)
′
Nach Satz 2.4 ist g in x stetig, da g (x) existiert. Es folgt limy→x g(y) = g(x). Da auch
f ′ (x) existiert und g(x) ̸= 0 gilt, existiert wegen Satz 2.2 der Grenzwert der rechten Seite
1
dieser Gleichung für y → x und ist gleich f ′ (x) g(x)
− g ′ (x) gf2(x)
(x) . Daher existiert auch der
1
− g ′ (x) gf2(x)
Grenzwert der linken Seite und ist ebenfalls f ′ (x) g(x)
(x) . Das beweist (c).
Satz 2.6 (Kettenregel) Sei f auf einem oﬀenen Intervall D definiert und x ∈ D. Sei g auf
einem oﬀenen Intervall definiert, das f (D) enthält. Wenn g ′ (f (x)) und f ′ (x) existieren,
dann existiert auch (g ◦ f )′ (x) und es gilt (g ◦ f )′ (x) = g ′ (f (x))f ′ (x).
(x)
(x)) f (y)−f (x)
Beweis: Es gilt limy→x g◦f (y)−g◦f
= limy→x g(ff(y))−g(f
= g ′ (f (x))f ′ (x),
y−x
(y)−f (x)
y−x
da mit y → x auch f (y) gegen f (x) geht (nach Satz 2.4 ist f ja im Punkt x stetig). Damit
ist die Kettenregel bereits gezeigt. Allerdings hat dieser Beweis den Schönheitsfehler, dass
man nicht weiß, ob f (y) − f (x) ungleich 0 ist. Wir gehen daher folgendermaßen vor.
Sei φ(t) =
g(t)−g(f (x))
t−f (x)
für t ̸= f (x) und φ(t) = g ′ (f (x)) für t = f (x). Dann gilt
g ◦ f (y) − g ◦ f (x)
f (y) − f (x)
= φ(f (y))
y−x
y−x
Die Funktion φ ist im Punkt f (x) stetig, da die Existenz von g ′ (f (x)) vorausgesetzt wird
(x))
= g ′ (f (x)) = φ(f (x)) gilt. Da f ′ (x) existiert und somit f
und daher limt→f (x) g(t)−g(f
t−f (x)
im Punkt x stetig ist, folgt die Stetigkeit von φ ◦ f im Punkt x aus Satz 1.11, und daraus
wieder limy→x φ(f (y)) = φ(f (x)) = g ′ (f (x)). Der Grenzwert der rechten Seite in obiger
Franz Hofbauer
27
Gleichung für y → x ist daher gleich g ′ (f (x))f ′ (x). Also existiert auch der Grenzwert der
linken Seite und ist ebenfalls gleich g ′ (f (x))f ′ (x), das heißt (g ◦ f )′ (x) = g ′ (f (x))f ′ (x).
Mit Hilfe dieser Rechenregeln ist es leicht, die Ableitung vieler Funktionen zu berechnen.
Für f (x) = xk haben wir f ′ (x) = kxk−1 oben berechnet. Mit Hilfe von Satz 2.5 (a)
erhalten wir die Ableitung eines Polynoms. Für g(x) = cn xn + cn−1 xn−1 + · · · + c1 x + c0
gilt g ′ (x) = cn nxn−1 + cn−1 (n − 1)xn−2 + · · · + c1 . Mit Hilfe von Satz 2.5 (c) lassen sich
dann rationale Funktionen diﬀerenzieren. Weitere Ableitungen findet man mit Hilfe des
folgenden Satzes über die Ableitung der Umkehrfunktion.
Satz 2.7: Sei I ⊆ R ein oﬀenes Intervall und f : I → R diﬀerenzierbar und streng monoton
wachsend (fallend). Sei J = f (I) und g : J → I die Umkehrfunktion von f . Ist x ∈ J und
1
f ′ (g(x)) ̸= 0, dann existiert g ′ (x) und es gilt g ′ (x) = f ′ (g(x))
.
Beweis: Nach Satz 2.4 ist f stetig, sodass die Umkehrfunktion wegen Satz 1.14 existiert.
Es gilt f (g(x)) = x und f (g(y)) = y für alle x und y in J. Es folgt
1
g(y) − g(x)
= f (g(y))−f (g(x))
y−x
g(y)−g(x)
für y ̸= x, da g nach Satz 1.14 streng monoton und g(y) − g(x) somit ungleich 0 ist. Nach
Satz 1.14 ist g auch stetig, sodass mit y → x auch g(y) gegen g(x) geht. Da die Existenz
(g(x))
= f ′ (g(x)). Wegen
von f ′ (g(x)) vorausgesetzt wird, erhalten wir limy→x f (g(y))−f
g(y)−g(x)
f ′ (g(x)) =
̸ 0 folgt limy→x g(y)−g(x)
=
y−x
1
existiert g ′ (x) und ist gleich f ′ (g(x))
.
1
f ′ (g(x))
aus obiger Gleichung und Satz 2.2. Somit
√
Beispiel: Sei n ∈ N. Die Wurzelfunktion g(x) = n x mit Definitionsbereich D = (0, ∞)
ist die Umkehrfunktion der Funktion f (x) = xn , die ebenfalls Definitionsbereich D hat.
1
1
= n1 x n −1 für x ∈ D aus
Da f ′ (x) = nxn−1 ̸= 0 für x ∈ D gilt, folgt g ′ (x) = n( √
n
x)n−1
Satz 2.7. Nun können wir auch die Potenzfunktion h(x) = xq mit Definitionsbereich D
diﬀerenzieren, wobei q = m
m ∈ Z und n ∈ N. Wegen h(x) = (g(x))m folgt aus
n ist mit
√
1
1
1
q− n
x n −1 = qxq−1 für x ∈ D gilt.
der Kettenregel, dass h′ (x) = m( n x)m−1 n1 x n −1 = m
nx
3. Monotonieverhalten von Funktionen
Eine Funktion kann auf gewissen Abschnitten ihres Definitionsbereichs monoton wachsend sein und auf anderen monoton fallend. Dieses Monotonieverhalten kann man mit Hilfe
der Ableitung untersuchen. Der Satz, den man dafür benötigt, ist der Mittelwertsatz, zu
dessen Beweis man ein Resultat über Extremwerte von stetigen Funktionen braucht. Ein
Extremwert kann ein Maximum sein, das ist der größte Wert, den die Funktion annimmt,
oder ein Minimum, das ist der kleinste Wert, den die Funktion annimmt. Diese Bezeichnungsweise ist analog zum Maximmum und Minimum von endlich vielen reellen Zahlen,
wo Maximum und Minimum die größte und die kleinste dieser Zahlen bezeichnen.
Satz 2.8: Seien a und b in R mit a < b. Jede stetige Funktion f : [a, b] → R ist beschränkt
und nimmt ihr Maximum und ihr Minimum an, das heißt es gibt ein x0 ∈ [a, b], sodass
f (x) ≤ f (x0 ) für alle x ∈ [a, b] gilt, und ein x1 ∈ [a, b], sodass f (x) ≥ f (x1 ) für alle
x ∈ [a, b] gilt.
Dieser Satz wird später bewiesen. Zum Beweis des Mittelwertsatzes brauchen wir noch
einen weiteren Satz über die Ableitung einer Funktion in einem Extremwert.
28
Diﬀerenzierbarkeit
Satz 2.9: Sei a < b. Wenn f : (a, b) → R diﬀerenzierbar ist mit einem Extremwert in
x ∈ (a, b), dann gilt f ′ (x) = 0.
Beweis: Der Extremwert in x sei ein Maximum. Dann gilt f (y) ≤ f (x) für alle y in (a, b).
(x)
Ist φ(y) = f (y)−f
, dann gilt φ(y) ≥ 0 für y ∈ (a, x) und φ(y) ≤ 0 für y ∈ (x, b). Da die
y−x
′
Existenz von f (x) vorausgesetzt wird, gilt auch limy→x φ(y) = f ′ (x).
Sei α = x−a
und xn = x − α
2
n für n ≥ 1. Dann ist (xn )n≥1 eine Folge im Intervall (a, x)
mit limn→∞ xn = x und φ(xn ) ≥ 0. Wegen Satz 2.1 gilt limn→∞ φ(xn ) = f ′ (x), woraus
f ′ (x) ≥ 0 wegen Satz 1.6 (a) folgt.
β
Sei β = b−x
2 und yn = x + n für n ≥ 1. Dann ist (yn )n≥1 eine Folge im Intervall (x, b)
mit limn→∞ yn = x und φ(yn ) ≤ 0. Wegen Satz 2.1 gilt limn→∞ φ(yn ) = f ′ (x), woraus
f ′ (x) ≤ 0 wegen Satz 1.6 (a) folgt. Somit ist f ′ (x) = 0 gezeigt.
Der Beweis für ein Minimum verläuft analog.
Satz 2.10 (Mittelwertsatz) Sei f : [a, b] → R stetig und auf dem oﬀenen Intervall (a, b)
(a)
diﬀerenzierbar. Dann gibt es ein c ∈ (a, b) mit f ′ (c) = f (b)−f
.
b−a
Beweis: Wir nehmen zuerst f (a) = f (b) = 0 an und zeigen, dass f ′ (c) = 0 für ein
c ∈ (a, b) gilt. Ist f (x) = 0 für alle x dann auch f ′ (x) = 0 für alle x und man kann jedes
x ∈ (a, b) als c wählen. Ansonsten liegt entweder ein Punkt, in dem das Maximum, oder
ein Punkt, in dem das Minimum angenommen wird (Maximum und Minimum existieren
nach Satz 2.8), in (a, b). Sei also c ∈ (a, b) ein Punkt, in dem f einen Extremwert hat.
Nach Satz 2.9 gilt f ′ (c) = 0.
(a)
Um den allgemeinen Fall zu behandeln, sei g(x) = f (x) − f (a) − (x − a) f (b)−f
. Dann
b−a
ist g : [a, b] → R stetig und in (a, b) diﬀerenzierbar. Es gilt g(a) = g(b) = 0. Nach
dem bereits bewiesenen Spezialfall gibt es ein c ∈ (a, b) mit g ′ (c) = 0. Das aber heißt
(a)
= 0, was zu zeigen war.
f ′ (c) − f (b)−f
b−a
Man kann den Mittelwertsatz auch geometrisch interpretieren. Verbindet man
den Punkt mit Koordinaten a und f (a)
und den Punkt mit Koordinaten b und
(a)
f (b) durch eine Gerade, so ist f (b)−f
b−a
ihr Anstieg. Der Mittelwertsatz besagt
dann, dass es zwischen den Punkten a
und b einen Punkt c gibt, sodass die Tangente im Punkt mit Koordinaten c und
f (c) an den Graph von f parallel zu dieser
Gerade (Sehne) liegt. Die nebenstehende
Zeichnung zeigt ein Beispiel, wo es nicht
c2
a c1
nur einen solchen Punkt c, sondern zwei
b
solche Punkte c1 und c2 gibt.
Der Zusammenhang zwischen dem Monotonieverhalten einer Funktion und ihrer Ableitung ist oﬀensichtlich. Dort, wo die Funktion monoton wachsend ist, hat die Tangente
einen positiven Anstieg, sodass die Ableitung positiv ist. Dort, wo die Funktion monoton
fallend ist, hat die Tangente einen negativen Anstieg, sodass die Ableitung negativ ist.
Der Mittelwertsatz ermöglicht einen Beweis dieser Aussagen.
Franz Hofbauer
29
Satz 2.11: Sei f : [a, b] → R stetig und in (a, b) diﬀerenzierbar.
(a) Wenn f ′ (x) = 0 für alle x ∈ (a, b) gilt, dann ist f konstant.
(b) Wenn f ′ (x) ≥ 0 für alle x ∈ (a, b) gilt, dann ist f monoton wachsend.
(c) Wenn f ′ (x) > 0 für alle x ∈ (a, b) gilt, dann ist f streng monoton wachsend.
(d) Wenn f ′ (x) ≤ 0 für alle x ∈ (a, b) gilt, dann ist f monoton fallend.
(e) Wenn f ′ (x) < 0 für alle x ∈ (a, b) gilt, dann ist f streng monoton fallend.
Beweis: Seien u und v beliebig in [a, b] mit u < v. Nach dem Mittelwertsatz gibt es ein
c ∈ (u, v) ⊆ (a, b) mit f (v) − f (u) = (v − u)f ′ (c). Damit kann man jetzt die einzelnen
Fälle behandeln. Im ersten Fall ist f ′ (c) = 0, also f (v) = f (u) für alle u und v in [a, b]
und daher ist f konstant. Im zweiten Fall ist f ′ (c) ≥ 0, also f (v) ≥ f (u), und daher ist f
monoton wachsend. Im dritten Fall ist f ′ (c) > 0, also f (v) > f (u), und daher ist f streng
monoton wachsend. Ebenso lassen sich die anderen Fälle behandeln.
Beispiel: Sei f (x) =
x
1+x2
mit Definitionsbereich D = R. Es soll das Monotonieverhalten
−x·2x
1−x
von f bestimmt werden. Wir berechnen f ′ (x) = 1+x
= (1+x
2 )2 mit Hilfe der Quo(1+x2 )2
tientenregel. Da (1 + x2 )2 > 0 für alle x gilt, hat f ′ (x) dasselbe Vorzeichen wie 1 − x2 .
Somit gilt f ′ (x) < 0 für x ∈ (−∞, −1) und x ∈ (1, ∞) und f ′ (x) > 0 für x ∈ (−1, 1).
Daher ist f auf dem Intervall (−∞, −1) streng monoton fallend, auf dem Intervall (−1, 1)
streng monoton wachsend, und auf dem Intervall (1, ∞) wieder streng monoton fallend. Da
die x-Achse eine Asymptote ist (der Grad des Zählerpolynoms ist kleiner als der Grad des
Nennerpolynoms), hat man bereits eine gute Vorstellung, wie der Graph von f aussieht.
√
Beispiel: Sei f (x) = 41 x2 − x2 + 3 mit Definitionsbereich D = R. Wir erhalten f ′ (x) =
√
1
′
√ x
√x
x−
.
Um
das
Vorzeichen
zu
bestimmen,
schreiben
wir
f
(x)
=
(
x2 + 3−2)
2
2
2
x +3
2 x +3
als Produkt. Der erste Faktor ist genau dann positiv, wenn x ∈ (0, ∞) ist. Der zweite
Faktor ist genau dann positiv, wenn x2 > 1 ist, also x ∈ (−∞, −1) ∪ (1, ∞) gilt. Daraus
folgt dann, dass f ′ > 0 auf den Intervallen (−1, 0) und (1, ∞) und f ′ < 0 auf den Intervallen
(−∞, −1) und (0, 1) gilt. Auf (−∞, −1) ist daher f streng monoton fallend, auf (−1, 0)
streng monoton wachsend, auf (0, 1) wieder streng monoton fallend und schließlich auf
(1, ∞) wieder streng monoton wachsend.
2
2
Sei D ein Intervall und f : D → R eine Funktion. Für a und b in D sei ℓa,b (x) =
− a) + f (a) die Gerade (Sehne) durch die Punkte (a, f (a)) und (b, f (b)). Die
Funktion f heißt konvex, wenn f (x) ≤ ℓa,b (x) für alle a und b in D und x ∈ (a, b) gilt, das
heißt die Sehne liegt immer oberhalb der Funktion. Die Funktion f heißt konkav, wenn
f (x) ≥ ℓa,b (x) für alle a und b in D und x ∈ (a, b) gilt, das heißt die Sehne liegt immer
unterhalb der Funktion.
f (b)−f (a)
(x
b−a
Satz 2.12: Sei D ein oﬀenes Intervall und f : D → R eine zweimal diﬀerenzierbare
Funktion. Wenn f ′′ (y) ≤ 0 für alle y ∈ D gilt, dann ist f konkav. Wenn f ′′ (y) ≥ 0 für alle
y ∈ D gilt, dann ist f konvex.
Beweis: Für a, b ∈ D und a < x < b folgt ℓa,b (x)−f (x) =
=
(x−a)(b−x)f ′ (y2 )−(b−x)(x−a)f ′ (y1 )
b−a
(x−a)(f (b)−f (x))−(b−x)(f (x)−f (a))
b−a
mit Hilfe von Satz 2.10, wobei a < y1 < x < y2 < b gilt.
′′
2 −y1 )f (y)
, wobei
Nochmaliges Anwenden von Satz 2.10 ergibt ℓa,b (x) − f (x) = (x−a)(b−x)(y
b−a
′′
y1 < y < y2 gilt. Ist f (y) ≤ 0 für alle y ∈ D, dann ist ℓa,b (x) − f (x) ≤ 0 gezeigt, das
heißt f ist konkav. Ist f ′′ (y) ≥ 0 für alle y ∈ D, dann ist ℓa,b (x) − f (x) ≥ 0 gezeigt, das
heißt f ist konvex.
30
Diﬀerenzierbarkeit
4. Extremwerte
Eine Anwendung der Untersuchungen über das Monotonieverhalten von Funktionen im
letzten Kapitel ist die Berechnung von lokalen Extremwerten von diﬀerenzierbaren Funktionen. Man sagt, dass die Funktion f im Punkt x ein lokales Minimum hat, wenn ein
ε > 0 existiert, sodass f (y) > f (x) für alle y ∈ (x − ε, x + ε) \ {x} gilt. Analog spricht man
von einem lokalen Maximum im Punkt x, wenn ein ε > 0 existiert, sodass f (y) < f (x) für
alle y ∈ (x − ε, x + ε) \ {x} gilt. Oft verwendet man folgenden Satz.
Satz 2.13: Sei f : (a, b) → R zweimal diﬀerenzierbar und x ∈ (a, b). Wenn f ′ (x) = 0 und
f ′′ (x) > 0, dann hat f im Punkte x ein lokales Minimum. Wenn f ′ (x) = 0 und f ′′ (x) < 0,
dann hat f im Punkte x ein lokales Maximum.
Beweis: Wir behandeln nur den Fall f ′′ (x) > 0. Sei α ∈ (0, f ′′ (x)). Wegen f ′′ (x) =
′
′
′
′
(x)
(x)
limy→x f (y)−f
existiert ein ε > 0 mit f (y)−f
≥ α, wenn y ∈ (x − ε, x + ε) \ {x}.
y−x
y−x
Wegen f ′ (x) = 0 haben wir also
f ′ (y)
y−x
≥ α > 0 für y ∈ (x − ε, x + ε) \ {x}.
Für y ∈ (x − ε, x) gilt y − x < 0 und daher auch f ′ (y) < 0. Für y ∈ (x, x + ε) gilt
y − x > 0 und daher auch f ′ (y) > 0. Daher ist f streng monoton fallend auf (x − ε, x)
und streng monoton wachsend auf (x, x + ε), womit gezeigt ist, dass f (y) > f (x) für alle
y ∈ (x − ε, x + ε) \ {x} gilt, also f ein lokales Minimum in x hat.
Um festzustellen, ob eine Funktion in einer Nullstelle ihrer Ableitung ein Maximum oder
ein Minimum hat, ist es nicht notwendig, die zweite Ableitung auszurechnen. Man kann
auch das Vorzeichen der Ableitung in den Intervallen zwischen den berechneten Nullstellen
der Ableitung bestimmen. Dann weiß man, auf welchen dieser Intervalle die Funktion
wächst und auf welchen sie fällt, und erkennt so, wo sie ein lokales Maximum und wo sie
ein lokales Minimum hat.
Beispiel: Wir zeigen, dass unter allen Rechtecken mit gegebener Diagonale das Quadrat
die größte Fläche hat. Sei d√die gegebene Länge der Diagonale. Ist x√
die eine Rechteckseite,
2
2
dann ist die andere gleich d − x√. Die Fläche des Rechtecks ist x d2 − x2 . Anstatt das
Maximum der Funktion f (x) = x d2 − x2 zu suchen, berechnen wir es für die Funktion
g(x) = f (x)2 = x2 (d2 − x2 ), da g und f ihr Maximum im selben Punkt annehmen.
Wir
√
′
2
3
erhalten√g (x) = 2d x−4x . Die Nullstellen dieser Ableitung sind x1 = −d/ 2,√x2 = 0 und
x3 = √
d/ 2. Wegen g ′ (x) = −2x(2x2 −d2 ) ist g ′ negativ auf den Intervallen (d/ 2, ∞) und
(−d/ 2, 0). Daher ist g dort streng
monoton√fallend. Ebenso sieht man, dass g ′ positiv
√
auf den Intervallen (−∞, −d/ 2) und (0, d/ 2) ist. Daher ist g dort streng monoton
√
wachsend.
Aus
diesem
Verhalten
sieht
man,
dass
g
lokale
Maxima
in
den
Punkten
d/
2
√
und −d/ 2 hat und ein lokales Minimum im Punkt 0. Natürlich sind
nur
Seitenlängen
√
x ∈ [0, d] sinnvoll. Wir haben√eine maximale Fläche, wenn x = d/ 2 ist. Die andere
Rechteckseite ist dann auch d/ 2, sodass ein Quadrat vorliegt.
Beispiel: Wir berechnen den kleinsten Abstand des Punktes (12, 15
2 ) von der Parabel
2
y = x . Das Quadrat des Abstandes dieses Punkts zu einem Punkt auf der Parabel ist
801
2
4
2
f (x) = (x − 12)2 + (x2 − 15
2 ) = x − 14x − 24x + 4 . Wir suchen lokale Minima und
Maxima dieser Funktion. Es gilt f ′ (x) = 4(x3 − 7x − 6). Die Nullstellen dieser Ableitung
sind x1 = 3, x2 = −1 und x3 = −2. Wir haben also f ′ (x) = 4(x − 3)(x + 1)(x + 2). Auf
den Intervallen (−2, −1) und (3, ∞) ist f ′ positiv und f daher streng monoton wachsend.
Auf den Intervallen (−∞, −2) und (−1, 3) ist f ′ negativ und f daher streng monoton
Franz Hofbauer
31
fallend. Lokale Minima haben wir für x1 = 3 und x3 = −2.
Für x2 = −1 liegt ein lokales
√
333
Maximum vor. Der Abstand zum Punkt (3, 9) beträgt 2 . Der Abstand zum Punkt
√
(−2, 4) beträgt 449
2 . Daher hat der Punkt (3, 9) den kleinsten Abstand. Wandert man
von diesem Punkt aus die Parabel entlang zum Punkt (−1, 1), so wird der Abstand immer
größer. Hat man den Punkt (−1, 1) überschritten, dann wird der Abstand wieder kleiner,
bis man den Punkt (−2, 4) erreicht. Nach Überschreiten dieses Punktes vergrößert sich
der Abstand wieder.
5. Gleichungen und Ungleichungen
Man kann die Methoden aus dem letzten Kapitel zum Beweis von Gleichungen und
Ungleichungen verwenden. Beweist man, dass die Funktion f konstant ist, dann hat man
die Gleichung f (x) = c für ein c ∈ R bewiesen. Beweist man, dass die Funktion f
das Minimum c annimmt, dann hat man die Ungleichung f (x) ≥ c bewiesen. Als erste
Anwendung dieser Methode wollen wir den sogenannten
binomischen Lehrsatz behandeln.
( n)
n!
Dazu benötigen wir die Binomialkoeﬃzienten k = k!(n−k)! .
( ) ( )
( )
( )
Satz 2.14 (Binomischer Lehrsatz) Es gilt (1 + x)n = n0 + n1 x + n2 x2 + · · · + nn xn für
alle x ∈ R und n ∈ N.
∑n ( )
Beweis: Dazu sei fn (x) = (1 + x)n − k=0 nk xk . Um den Satz zu beweisen, zeigen
wir, dass fn (x) = 0( für
) alle
(1) x ∈ R und n ∈ N gilt. Wir beginnen mit n = 1. Es gilt
1
f1 (x) = (1 + x) − 0 − 1 x = 0. Für n = 1 ist die Aussage also richtig. Bevor wir
( )
(
)
(n−1)!
n!
größere n behandeln, berechnen wir k nk = k k!(n−k)!
= n (k−1)!(n−k)!
= n n−1
k−1 und damit
( )
(
) k−1
∑n
∑n
fn′ (x) = n(1 + x)n−1 − k=0 k nk xk−1 = n(1 + x)n−1 − k=1 n n−1
= nfn−1 (x).
k−1 x
′
Ist fn−1 (x) = 0 für alle x gezeigt, dann folgt wegen
( ) fn (x) = nfn−1 (x) = 0, dass fn eine
konstante Funktion ist, und wegen fn (0) = 1n − n0 = 0 folgt fn (x) = 0 für alle x. Damit
ist die gesuchte Gleichung für alle n durch Induktion bewiesen.
Mit Hilfe von Satz 2.14 können wir folgende Grenzwerte bestimmen.
Satz 2.15: Es
existieren folgende Grenzwerte
√
n
(a) limn→∞ √
x = 1 für alle x > 0
(b) limn→∞ n n = 1.
m
(c) limn→∞ nxn = 0 für alle m ∈ N und alle x > 1
√
Beweis: Um (a) zu zeigen, sei x ≥ 1. Wegen Satz 1.16 gilt n x ≥ 1. Läßt man auf der
rechten Seite des binomischen Lehrsatzes alle Summanden außer dem zweiten
weg, so folgt
√
n
(1 + y)n ≥ ny für
n
≥
1
und
y
≥
0.
Setzt
man
in
diese
Ungleichung
y
=
x
− 1 ≥ 0 ein,
√
√
x
x
n
n
so erhält man x ≤ 1 + n . Wir haben also 1 ≤ x ≤ 1 + n für n ≥ 1. Mit Hilfe von
√
Satz 1.7 folgt daraus limn→∞ n x = 1. Sei jetzt x ∈ (0, 1). Für y = x1 gilt y > 1, sodass wir
√ √
√
√
1
limn→∞ n y = 1 schon gezeigt haben. Aus Satz 1.18 (a) folgt n x n y = 1, also n x = √
n y.
√
Mit Hilfe von Satz 1.6 (d) erhalten wir limn→∞ n x = 1. Damit ist (a) erledigt.
Wir zeigen (b). Läßt man auf der rechten Seite des
Lehrsatzes alle Summan(n)binomischen
n
2
den außer dem dritten weg, so folgt (1 + x) ≥ 2 x für n ≥ 2 und x ≥ 0. Indem man
√
√
√
n
n − 1 für x einsetzt, folgt wie oben, dass 1 ≤ n n ≤ 1√
+ 2/(n − 1) für n ≥ 2 gilt. Da
die Wurzelfunktion im Punkt 0 stetig ist, gilt lim√
2/(n − 1) = 0 wegen Satz 1.9.
n→∞
n
Mit Hilfe von Satz 1.7 erhalten wir dann limn→∞ n = 1.
32
Diﬀerenzierbarkeit
m
n
Um (c) zu zeigen, überlegen wir uns zuerst, dass limn→∞ n(n−1)...(n−m)
= 0 gilt. Das
1
n
n
folgt wegen limn→∞ n = 0, limn→∞ n−1 = 1, . . . , limn→∞ n−m = 1, indem man das
Produkt dieser Folgen bildet. Läßt man auf der rechten Seite des
Lehrsatzes
(n) binomischen
n
k
alle Summanden außer dem k + 1-ten weg, so folgt (1 + y)( ≥ ) k y für n ≥ k und y ≥ 0.
n
(x − 1)m+1 für n ≥ m + 1
Setzt man y = x − 1 und k = m + 1, so ergibt sich xn ≥ m+1
und daraus 0 ≤
nm
xn
≤
(m+1)!
nm
n(n−1)...(n−m) (x−1)m+1 .
Wendet man Satz 1.7 an, so folgt (c).
Die folgenden beiden Ungleichung brauchen wir, wenn wir die Exponentialfunktion und
den Logarithmus behandeln.
Satz 2.16: Für x ∈ R und n ∈ N mit n > −x gilt (1 + nx )n ≤ (1 +
x n+1
.
n+1 )
x n+1
Beweis: Wir untersuchen f (x) = (1 + n+1
)
/(1 + nx )n auf dem Intervall (−n, ∞).
x
x n
Es gilt f ′ (x) = n(n+1)
(1 + n+1
) (1 + nx )−n−1 , das ist ≥ 0 für x ∈ (0, ∞) und ≤ 0 für
x ∈ (−n, 0), sodass f auf [0, ∞) monoton wachsend und auf (−n, 0] monoton fallend ist.
x n+1
Wegen f (0) = 1 folgt f (x) ≥ 1, das heißt (1 + nx )n ≤ (1 + n+1
)
für x ∈ (−n, ∞).
√
√
Satz 2.17: Es gilt (n + 1)( n+1 x − 1) ≤ n( n x − 1) für alle n ∈ N und für x > 0.
√
√
Beweis: Sei f (x) = n( n x − 1) − (n + 1)( n+1 x − 1) mit Definitionsbereich D = (0, ∞).
1
1
1
1
1
Wir berechnen die Ableitung f ′ (x) = n n1 x n −1 − (n + 1) n+1
x n+1 −1 = x n −1 − x n+1 −1 .
1
Wegen n1 − 1 > n+1
− 1 erhalten wir f ′ (x) < 0 für x ∈ (0, 1) und f ′ (x) > 0 für x ∈ (1, ∞).
Wegen Satz 2.11 ist f auf (0, 1) monoton fallend und auf (1, ∞) monoton wachsend. Es
gilt also f (x) ≥ f (1) für alle x > 0. Wegen f (1) = 0 ist das die gesuchte Ungleichung.
Wir beweisen noch eine Verallgemeinerung der Cauchy-Schwarzschen Ungleichung.
p
Satz 2.18: Sei p > 1 und q = p−1
. Seien ai und bi für 1 ≤ i ≤ n reelle Zahlen. Dann gilt
√∑n
√∑n
∑n
∑n
q
die Hölder-Ungleichung i=1 ai bi ≤ i=1 |ai bi | ≤ p i=1 |ai |p q
i=1 |bi | .
Beweis: Für 0 < r < 1 sei f (x) = xr − rx − 1 + r mit Definitionsbereich D = (0, ∞).
Es gilt f ′ (x) = rxr−1 − r. Wegen f ′ (x) > 0 für x ∈ (0, 1) und f ′ (x) < 0 für x ∈ (1, ∞)
hat die Funktion f im Punkt 1 ihr Maximum. Es gilt also f (x) ≤ f (1) = 0, das heißt
xr ≤ rx + 1 − r für alle x > 0. Sind u und v in (0, ∞), dann kann man x = uv setzen.
Multiplikation mit v ergibt ur v 1−r ≤ ru+(1−r)v. Diese Ungleichung ist auch noch richtig
für u = 0 oder v = 0 oder beides. Daher ist sie für alle u ≥ 0 und v ≥ 0 gezeigt.
Sind alle ai gleich ∑
0 oder alle bi gleich 0,∑dann ist die zu beweisende Ungleichung erfüllt.
n
n
p
q
Wir setzen U =
=
können annehmen, dass U > 0
i=1 |ai | und V p
i=1 |bi | und
|bi |q
|ai |
und V > 0∑
gilt. Somit sind ui = U und vi = V für 1 ≤ i ≤ n definiert und es gilt
∑
n
n
Setzt man u = ui und v = vi in obiger Ungleichung und summiert
i=1 ui =
i=1 vi = 1.
∑n
∑n
über i so erhält man i=1 uri vi1−r ≤ 1, das heißt i=1 |ai |pr |bi |q(1−r) ≤ U r V 1−r . Setzt
man jetzt r = p1 und beachtet, dass dann 1 − r = 1 − p1 = 1q nach Voraussetzung gilt, so
√ √
∑n
ergibt sich i=1 |ai bi | ≤ p U q V . Das ist bereits die zu beweisende Ungleichung.
6. Trigonometrische Funktionen
Trigonometrische Funktionen spielen eine wichtige Rolle in der Geometrie, zum Beispiel
für Dreiecksberechnungen. Sie sind auch für die Physik wichtig. Sie treten zum Beispiel
bei der Untersuchung von Schwingungen auf.
Franz Hofbauer
33
Der Einheitskreis ist der Kreis mit Mittelpunkt (0, 0) und Radius 1. Um sin und cos
zu definieren, sei x ∈ R. Vom Punkt (1, 0) aus wird die Strecke x auf dem Einheitskreis
gemessen (für x > 0 im Gegenuhrzeigersinn, für x < 0 im Uhrzeigersinn). Die Koordinaten
des so ereichten Punktes nennen wir cos x und sin x. Da man beim Abmessen der Strecken
x und x + 2π den selben Punkt am Einheitskreis erreicht, erhalten wir sin(x + 2π) = sin x
und cos(x + 2π) = cos x. Man sagt, die Funktionen sin und cos haben Periode 2π.
Satz 2.19: Die Funktionen sin und cos haben folgende Eigenschaften
(a) sin2 x + cos2 x = 1
π
3π
(b) sin 0 = sin π = 0, sin π2 = 1, sin 3π
2 = −1, cos 0 = 1, cos π = −1, cos 2 = cos 2 = 0
(c) sin(−x) = − sin x, cos(−x) = cos x
(d) sin(x + π2 ) = cos x, cos(x + π2 ) = − sin x, sin(x + π) = − sin x, cos(x + π) = − cos x
Beweis: Wir erhalten (a), da der Punkt mit den Koordinaten cos x und sin x auf dem
Einheitskreis liegt. Auch (b) folgt sofort aus der Definition, indem man die Koordinaten
der Punkte abliest, die man erhält, wenn man die Strecken 0, π2 , π und 3π
2 am Einheitskreis
aufträgt. Da die Punkte, die man erhält, wenn man die Strecken x und −x am Einheitskreis
(
π )
2)
erhält man,
aufträgt, symmetrisch zur x-Achse liegen, folgt (c). Den Vektor cos(x+
sin(x+ π
)
2
(cos x)
indem man den Vektor sin x um 900 nach links verdreht. Daraus folgen die ersten beiden
(
)
( x)
Gleichungen von (d). Den Vektor cos(x+π)
erhält man, indem man den Vektor cos
sin x um
sin(x+π)
den Koordinatenursprung spiegelt. Daraus folgen die anderen Gleichungen von (d).
Die Tangente an den Einheitskreis im
T
Punkt E = (1, 0) ist parallel zur y-Achse.
Für − π2 < x < π2 hat die Gerade durch
P
den Koordinatenursprung M und durch den
Punkt P = (cos x, sin x) einen Schnittpunkt
mit dieser Tangente, den wir T nennen. Wir
definieren tan x als die y-Koordinate dieses
Schnittpunkts T . Bezeichnet man den Punkt
(cos x, 0) noch mit R, dann sind die Dreiecke
P M R und T M E zueinander ähnlich. Es
gilt |P R| : |RM | = |T E| : |EM |. Das ist
sin x
tan x
x
cos x =
1 . Damit haben wir die Formel
sin x
M
R
E
tan x = cos
x gewonnen.
Um die Ableitungen berechnen zu können, brauchen wir folgende Ungleichungen.
Satz 2.20: Für x ∈ [0, π2 ) gilt sin x ≤ x und x ≤ tan x.
Beweis: Wir verwenden die oben eingeführten Bezeichnungen. Die Fläche des Dreiecks
M EP ist kleiner als die Fläche des Kreissektors zwischen den Radien M E und M P . Die
Grundlinie des Dreicks M EP hat Länge 1 und die zugehörige Höhe ist sin x. Daher ist
1
2 sin x die Fläche des Dreicks M EP . Da der Kreissektor Radius 1 und Bogenlänge x hat,
ist seine Fläche nach Satz 1.19 gleich 12 x. Wir erhalten also 12 sin x ≤ 12 x. Das ergibt die
erste der beiden Ungleichungen.
Die Fläche des Dreiecks M ET ist größer als die Fläche des Kreissektors zwischen den
Radien M E und M P . Die Grundlinie des Dreicks M ET hat Länge 1 und die zugehörige
Höhe ist tan x. Daher ist 12 tan x die Fläche des Dreiecks M ET . Sie ist größer als die
Fläche 21 x des Kreissektors, woraus die zweite der beiden Ungleichungen folgt.
34
Diﬀerenzierbarkeit
Satz 2.21 (Summensätze) Für x und y in R gelten die beiden Formeln
(a) sin(x + y) = sin x cos y + cos x sin y
(b) cos(x + y) = cos x cos y − sin x sin y.
Beweis: Misst man vom Punkt (1, 0) aus am Einheitskreis im Gegenuhrzeigersinn die
Strecke x, so kommt man zum Punkt (cos x, sin x). Misst man vom Punkt (1, 0) aus am
Einheitskreis im Uhrzeigersinn die Strecke y, so kommt man zum Punkt (cos y, − sin y).
Die Länge des Bogens zwischen diesen Punkten ist x+y. Der Bogen zwischen den Punkten
(1, 0) und (cos(x + y), sin(x + y)) hat ebenfalls die Länge x + y. Daher ist auch die Strecke
vom Punkt (cos x, sin x) zum Punkt (cos y, − sin y) gleich der Strecke vom Punkt (1, 0)
zum Punkt (cos(x + y), sin(x + y)). Das heißt also
√
√
(cos x − cos y)2 + (sin x + sin y)2 = (1 − cos(x + y))2 + (sin(x + y))2
Man kann die Wurzeln auf beiden Seiten weglassen. Quadriert man aus, so erhält man
cos2 x − 2 cos x cos y + cos2 y + sin2 x + 2 sin x sin y + sin2 y
= 1 − 2 cos(x + y) + cos2 (x + y) + sin2 (x + y)
An drei verschiedenen Stellen kann man die Formel aus Satz 2.19 (a) anwenden, und erhält
1 − 2 cos x cos y + 1 + 2 sin x sin y = 1 − 2 cos(x + y) + 1. Damit sind wir bei der Formel
cos(x + y) = cos x cos y − sin x sin y angelangt und (b) ist gezeigt.
Wir ersetzen in dieser soeben gezeigten Formel y durch y + π2 . Aus Satz 2.19 (d) folgt
cos(x + y + π2 ) = − sin(x + y), cos(y + π2 ) = − sin y und sin(y + π2 ) = cos y. Setzt man das
ein, so erhält man − sin(x + y) = cos x(− sin y) − sin x cos y. Das ist (a).
Jetzt sind wir soweit, um die Ableitungen von sin und cos berechnen zu können.
Satz 2.22: Für x ∈ R gilt sin′ x = cos x und cos′ x = − sin x.
h
Beweis: Wir zeigen zuerst limh→0 sinh h = 1 und limh→0 1−cos
= 0. Für h ∈ (0, π2 ) gilt
h
sin h
sin h
sin h ≤ h und h ≤ tan h = cos
h nach Satz 2.20 und daher auch cos h ≤ h ≤ 1. Setzt
man −h für h ein, so ändert sich weder cos h noch sinh h . Somit gilt cos h ≤ sinh h ≤ 1 für
alle h ∈ (− π2 , π2 ) \ {0}. Weiters gilt limh→0 cos h = 1, wie man aus der Definition des cos
erkennt. Aus Satz 2.3 folgt somit limh→0 sinh h = 1.
2
2
h
1−cos h
sin h
sin h 2
h
Wegen Satz 2.19 (a) gilt 1−cos
= h(1+cos
h
h) = h(1+cos h) = ( h ) 1+cos h . Mit Hilfe von
h
Satz 2.2 und der oben gefundenen Grenzwerte folgt limh→0 1−cos
= 0.
h
′
′
Mit Hilfe der Summensätze kann man jetzt sin x und cos x berechnen. Aus dem Sumx
h
mensatz für den sin folgt sin(x+h)−sin
= − sin x 1−cos
+ cos x sinh h . Läßt man h gegen 0
h
h
gehen, so folgt sin′ x = cos x mit Hilfe obiger Resultate und Satz 2.2.
x
h
Ebenso folgt cos(x+h)−cos
= − cos x 1−cos
− sin x sinh h aus dem Summensatz für den cos
h
h
und daraus cos′ x = − sin x mit h → 0.
Für ein beliebiges Dreieck gelten der Sinus– und der Cosinussatz.
Satz 2.23 (Sinussatz) In einem beliebigem Dreieck mit Fläche F und den üblichen Be2F
zeichnungen gilt abc
= sina α = sinb β = sinc γ .
Beweis: Sei h die Länge der Höhe auf c. Dann gilt 2F = ch. Weiters gilt sin α = hb
(wegen sin(1800 − α) = sin α gilt das auch, wenn die Höhe ausserhalb des Dreiecks liegt).
2F
h
α
2F
2F
Daraus folgt dann abc
= ab
= b sin
= sina α . Analog folgt abc
= sinb β und abc
= sinc γ .
ab
Franz Hofbauer
35
Satz 2.24 (Cosinussatz) In einem Dreieck mit den üblichen Bezeichnungen gilt
a2 = b2 + c2 − 2bc cos α, b2 = a2 + c2 − 2ac cos β und c2 = a2 + b2 − 2ab cos γ.
Beweis: Sei H der Fußpunkt der Höhe auf die Seite c und h deren Länge. Sei p der
Abstand von H zum Eckpunkt A, wenn H rechts von A liegt oder gleich A ist (spitzer
Winkel α), und der mit negativem Vorzeichen versehene Abstand, wenn H links von A
liegt (stumpfer Winkel α). In beiden Fällen gilt dann cos α = pb das heißt p = b cos α. Aus
dem Satz von Pythagoras folgt b2 = h2 + p2 und a2 = h2 + (c − p)2 . Subtraktion ergibt
b2 −a2 = p2 −(c−p)2 = 2pc−c2 . Setzt man für p ein, so erhält man b2 −a2 = 2bc cos α−c2 ,
das heißt a2 = b2 + c2 − 2bc cos α. Die anderen Gleichungen beweist man analog.
Zum Abschluss behandeln wir noch kurz den Tangens und seine Umkehrfunktion. Sei
sin x
D = (− π2 , π2 ). Da cos x > 0 für x ∈ D gilt, ist tan x = cos
x auf D definiert und stetig.
Aus der Quotientenregel folgt
cos2 x + sin2 x
1
tan′ x =
=
= 1 + tan2 x
2
cos x
cos2 x
Wegen tan′ x > 0 für alle x ∈ D ist tan eine streng monoton wachsende Funktion. Wegen
cos π2 = 0 geht tan x gegen ∞, wenn x gegen π2 geht. Ebenso geht tan x gegen −∞,
wenn x gegen − π2 geht. Der Wertebereich {tan x : x ∈ D} ist daher R. Es existiert die
Umkehrfunktion arctan : R → (− π2 , π2 ). Ihre Ableitung ist wegen Satz 2.7
1
1
1
arctan′ x =
=
=
′
2
tan (arctan x)
1 + x2
1 + tan (arctan x)
Es stellt sich heraus, dass die Ableitung des arctan eine rationale Funktion ist. Der arctan
ist ebenfalls streng monoton wachsend.
7. Exponentialfunktion und Logarithmus
Die Exponentialfunktion verwendet man, um Wachstum zu beschreiben. Ein Beispiel
ist die Verzinsung eines Geldbetrags a. Ist x die Zinsrate, so hat man nach einem Jahr
den Betrag a(1 + x). Angenommen, die Zinsen werden nicht erst am Ende des Jahres
gutgeschrieben, sondern in Monatsabständen. Nach einem Monat hat man dann den
x
x
x
Betrag a(1 + 12
), nach zwei Monaten den Betrag a(1 + 12
)(1 + 12
), und nach einem Jahr
x 12
den Betrag a(1 + 12 ) . Teilt man das Jahr in n gleich lange Perioden und nimmt an,
dass die Zinsen jeweils am Ende dieser Perioden gutgeschrieben werden, dann hat man am
Ende des Jahres den Betrag a(1 + nx )n . Würde man diese Perioden immer kleiner machen,
das heißt n gegen ∞ gehen lassen, dann hätte man a u(x) mit u(x) = limn→∞ (1 + nx )n .
Das wäre der Betrag am Ende des Jahres, wenn man kontinuierlich verzinsen würde.
Ein anderes Beispiel ist die Vermehrung von Zellen oder das Wachstum einer Bakterienkolonie. Hier finden die Zellteilungen laufend statt. Man kann dieses Zellenwachstum
als einen kontinuierlichen Prozess auﬀassen. Ist a die Anzahl der Zellen zu Beginn und
x der relative Anteil der Zellen, die sich während einer Zeiteinheit teilen, dann hat man
a(1 + x) Zellen am Ende eines Zeitintervalls, dessen Länge eine Zeiteinheit ist. Da aber
die Anzahl der Zellen während dieses Zeitintervalls nicht konstant bleibt, kann man diese
Überlegung nur auf sehr kleine Zeitintervalle anwenden. Wir teilen das Einheitszeitintervall in n Intervalle der Länge n1 und erhalten a(1 + nx )n als Anzahl der Zellen nach einer
Zeiteinheit. Im Grenzwert n → ∞ ergibt sich a u(x) wie oben.
Ein weiteres Beispiel ist der radioaktive Zerfall. Sei a die ursprünglich vorhandene Menge
an radioaktivem Material und x die Zerfallsrate. Dabei muss x negativ sein, da die Menge
36
Diﬀerenzierbarkeit
des radioaktiven Materials ja abnimmt. Dieselbe Vorgangsweise wie oben ergibt, dass die
nach einer Zeiteinheit noch vorhandene Menge gleich a u(x) ist.
Die Funktion u(x) = limn→∞ (1 + nx )n
nennt man Exponentialfunktion. Aber zuerst ist zu zeigen, dass dieser Grenzwert
existiert. Für n = 1, 2, 3, 8 ist die Funktion x 7→ (1+ nx )n nebenstehend gezeichnet
und zwar jeweils auf dem Intervall [−n, ∞).
Dort ist die Funktion monoton wachsend
und hat nichtnegative Werte. Man sieht
auch, dass der Graph jeder dieser Funktionen über dem Graph der vorhergehenden
liegt. Das wurde auch in Satz 2.16 gezeigt.
Es ist bereits erkennbar, wie die Grenzfunktion aussehen wird.
Für n ≥ 1 definieren wir die Funktion un : R → R durch un (x) = (1 +
wiederholtes Anwenden von Satz 2.16 erhalten wir
(A)
un (x) ≥ um (x)
x∈R
für
x n
n) .
Durch
und n ≥ m > −x
Gilt |t| < 1, dann gilt auch (1 + t) (1 − t) = (1 − t2 )n < 1. Damit erhalten wir
1
(B) un (x) · un (−x) < 1 und daher auch un (x) < un (−x)
für x ∈ R und n > |x|
n
n
Sei jetzt x ∈ R beliebig. Wir wählen n0 ∈ N so, dass n0 > |x| gilt. Für alle n ≥ n0
1
≤ un 1(−x) wegen (B) und (A). Die Folge (un (x))n≥n0
erhalten wir dann un (x) < un (−x)
0
ist somit nach oben beschränkt. Wegen (A) ist sie auch monoton wachsend. Also existiert
u(x) = limn→∞ un (x) nach Satz 1.8.
Damit ist gezeigt, dass u(x) = limn→∞ un (x) für alle x ∈ R existiert. Es folgt u(x) ≥ 0,
da ja un (x) > 0 für alle n > −x gilt. Da un (0) = 1 für alle n gilt, erhalten wir u(0) = 1.
Die Zahl u(1) = limn→∞ (1 + n1 )n nennt man Eulersche Zahl und bezeichnet sie mit e.
Satz 2.25: Für x und y in R gilt u(x + y) = u(x)u(y). Für x ∈ R gilt weiters u(x) > 0
1
und u(−x) = u(x)
. Ist q ∈ Q und x ∈ R, dann gilt u(qx) = u(x)q , insbesondere u(q) = eq .
y
Beweis: Wir berechnen limn→∞ (1 + n+x
)n . Dazu sei k ∈ N mit k ≥ |x| fest gewählt. Ist
y
y
y
n > |y| + k, dann liegt (1 + n+x )n zwischen (1 + n+k
)n und (1 + n−k
)n . Für beliebiges
y
y
y
m ∈ Z gilt limn→∞ (1 + n+m )n = limn→∞ (1 + n+m )n+m (1 + n+m )−m = u(y). Wegen
y
y
x n
n
n
Satz 1.7 folgt limn→∞ (1 + n+x
)n = u(y). Nun gilt aber (1 + x+y
n ) = (1 + n ) (1 + n+x ) .
Lässt man n gegen ∞ gehen, so erhält man u(x + y) = u(x)u(y).
Setzt man y = −x dann ergibt sich 1 = u(0) = u(x)u(−x). Einerseits folgt u(x) ̸= 0 und
1
daher u(x) > 0, da u(x) ≥ 0 schon gezeigt wurde. Andererseits folgt u(−x) = u(x)
.
Für n ≥ 0 zeigen wir u(nx) = u(x)n mit Induktion. Für n = 0 gilt diese Gleichung wegen
u(0) = 1 und für n = 1 ist sie trivial. Ist u(nx) = u(x)n bereits gezeigt, dann folgt
u((n + 1)x) = u(nx + x) = u(nx)u(x) = u(x)n u(x) = u(x)n+1 mit Hilfe der ersten Aussage
dieses Satzes. Damit ist u(nx) = u(x)n für alle n ≥ 0 gezeigt. Aus der zweiten Aussage
1
−n
dieses Satzes folgt nun u(−nx) = u(x)
, sodass u(nx) = u(x)n für alle n ∈ Z
n = u(x)
gezeigt ist.
n
m
Für q = m
n mit m ∈ Z und n ∈ N erhalten wir u(qx) = u(nqx) = u(mx) = u(x) , woraus
√
u(qx) = n u(x)m = u(x)q folgt. Setzt man x = 1, so hat man u(q) = u(1)q = eq .
Franz Hofbauer
37
Nach Satz 2.25 gilt u(q) = eq für alle q ∈ Q. Das ist der Grund, warum man ex statt
u(x) schreibt, auch wenn x nicht in Q liegt. Im nächsten Satz berechnen wir die Ableitung
der Funktion u : R → R.
Satz 2.26: Die Funktion u ist diﬀerenzierbar und es gilt u′ (x) = u(x) für alle x ∈ R.
Beweis: Wir berechnen die Ableitung von u(x) im Punkt x = 0. Wegen (A) und (B) gilt
u1 (x) ≤ un (x) ≤
1
un (−x)
≤
1
u1 (−x)
für x ∈ (−1, 1) und n ≥ 1
Wir setzen für u1 (x) und u1 (−x) ein, lassen n gegen ∞ gehen und erhalten
1 + x ≤ u(x) ≤
1
1−x
für x ∈ (−1, 1) und n ≥ 1
Durch Subtraktion von 1 und Division durch x ergibt sich daraus
1≤
u(x)−1
x
≤
1
1−x
für x ∈ (0, 1)
und 1 ≥
u(x)−1
x
≥
1
1−x
für x ∈ (−1, 0)
Da u(0) = 1 gilt, erhalten wir limx→0 u(x)−u(0)
= 1 aus diesen Ungleichungen und Satz 2.3,
x
′
′
das heißt u (0) existiert und es gilt u (0) = 1.
Um u′ (x) für beliebiges x ∈ R zu finden, verwenden wir u(x + h) = u(x)u(h) aus Satz 2.25.
= u(x) u(h)−1
und limh→0 u(x+h)−u(x)
= u(x) limh→0 u(h)−1
= u(x),
Es folgt u(x+h)−u(x)
h
h
h
h
′
′
das heißt u (x) existiert und es gilt u (x) = u(x).
Analog können wir auch den Logarithmus einführen,
indem wir die Funktionen x 7→ (1+ nx )n umkehren und
den Grenzwert dieser Umkehrfunktionen suchen. Wir
lösen die Gleichung (1 + ny )n = x nach y auf, und
√
erhalten so die Umkehrfunktion ℓn (x) = n( n x − 1).
Sie hat Definitionsbereich (0, ∞). Nebenstehend ist
diese Funktion für n = 1, 2, 3, 8 gezeichnet. Klarerweise erhalten wir die Spiegelung des obigen Bildes um
die Hauptdiagonale. Wir zeigen, dass der Grenzwert
limn→∞ ℓn (x) für x ∈ (0, ∞) existiert und bezeichnen
ihn mit ℓ(x). Wir untersuchen dann die Eigenschaften
der Funktion ℓ : (0, ∞) → R.
Für x ≥ 1 und n ≥ 1 gilt ℓn+1 (x)
≤ ℓn (x) we√
n
gen Satz 2.17 und ℓn (x) ≥ 0 wegen x ≥ 1, sodass
(ℓn (x))n≥1 eine nach unten beschränkte monoton fallende Folge ist und somit ℓ(x) = limn→∞ ℓn (x) nach
Satz 1.8 existiert. Da ℓn√
(1) = 0 für alle n ≥ 1 gilt, erhalten wir insbesondere
ℓ(1) = 0.
√
Man rechnet ℓn (x) = − n x ℓn ( x1 ) für alle x ∈ (0, ∞) nach. Da limn→∞ n x = 1 für alle
x > 0 nach Satz 2.15 (a) gilt, folgt aus dieser Gleichung, dass ℓ(x) auch für 0 < x < 1
existiert und dass ℓ(x) = −ℓ( x1 ) für alle x ∈ (0, ∞) gilt.
Die so auf (0, ∞) definierte Funktion ℓ heißt (natürlicher) Logarithmus. Wir haben
bereits ℓ(1) = 0 und ℓ(x) = −ℓ( x1 ) für alle x ∈ (0, ∞) gezeigt. Wir beweisen weitere
Eigenschaften.
Satz 2.27: Die Funktion ℓ : (0, ∞) → R ist diﬀerenzierbar und es gilt ℓ′ (x) =
x ∈ (0, ∞).
1
x
für alle
Beweis: Es gilt ℓ′n (x) = x n −1 für alle n ≥ 1. Aus dem Mittelwertsatz erhalten wir, dass
1
ℓn (y) − ℓn (x) = c n −1 (y − x) gilt für ein c zwischen x und y (c hängt von n ab). Daraus
1
38
folgt, dass
Diﬀerenzierbarkeit
ℓn (y)−ℓn (x)
y−x
für alle n ≥ 2 zwischen x n −1 und y n −1 liegt. Lässt man n gegen
1
ℓ(y)−ℓ(x)
zwischen x1 und y1
y−x
womit ℓ′ (x) = x1 gezeigt ist.
∞ gehen, so folgt aus Satz 1.6 (a), dass
limy→x ℓ(y)−ℓ(x)
y−x
=
1
x
wegen Satz 2.3,
1
liegt. Daher gilt
Die Ableitung von ℓ : (0, ∞) → R ist größer als 0, sodass diese Funktion streng monoton
wachsend ist. Wegen ℓ(1) = 0 folgt ℓ(x) > 0 für x ∈ (1, ∞) und ℓ(x) < 0 für x ∈ (0, 1).
Satz 2.28: Für x und y in (0, ∞) gilt ℓ(xy) = ℓ(x) + ℓ(y).
√
√
√
√
Beweis: Für n ≥ 1 gilt ℓn (xy) = n( n xy − n y + n y − 1) = n y ℓn (x) + ℓn (y). Lässt
man in dieser Gleichung n gegen ∞ gehen, dann hat man ℓ(xy) = ℓ(x) + ℓ(y), da ja
√
limn→∞ n y = 1 ist.
Wir haben die Exponentialfunktion u : R → (0, ∞) und den Logarithmus ℓ : (0, ∞) → R
definiert und ihre Ableitungen berechnet. Es ist zu erwarten, dass sie Umkehrfunktionen
voneinander sind. Um das zu zeigen, sei g : R → R die Funktion g(x) = ℓ(u(x))−x. Es gilt
1
g ′ (x) = ℓ′ (u(x))u′ (x) − 1 = u(x)
u(x) − 1 = 0. Somit ist g eine konstante Funktion. Wegen
u(0) = 1 und ℓ(1) = 0 erhalten wir g(0) = 0. Also gilt g(x) = 0 und daher auch ℓ(u(x)) = x
für alle x ∈ R. Ist y ∈ (0, ∞) und setzt man x = ℓ(y) in die Gleichung ℓ(u(x)) = x ein, dann
hat man ℓ(u(ℓ(y))) = ℓ(y). Da ℓ streng monoton wachsend ist, erhalten wir u(ℓ(y)) = y.
Damit ist ℓ(u(x)) = x für alle x ∈ R und u(ℓ(y)) = y für alle y ∈ (0, ∞) gezeigt. Also sind
Exponentialfunktion und Logarithmus tatsächlich Umkehrfunktionen voneinander.
Wir verwenden ab jetzt die übliche Schreibweise ln x statt ℓ(x) für den Logarithmus.
Für a > 0 definieren wir die Funktion va : R → (0, ∞) durch va (x) = u(x ln a) = ex ln a .
Wegen Satz 2.26 gilt va′ (x) = u′ (x ln a) ln a = u(x ln a) ln a = va (x) ln a. Damit ist die
Ableitung der Funktion va gefunden.
Satz 2.29: Für x und y in R gilt va (x + y) = va (x)va (y). Für q ∈ Q gilt va (q) = aq .
Beweis: Mit Satz 2.25 erhalten wir u((x + y) ln a) = u(x ln a + y ln a) = u(x ln a)u(y ln a),
das heißt va (x + y) = va (x)va (y).
Ebenfalls aus Satz 2.25 folgt u(q ln a) = u(ln a)q und daraus dann va (q) = aq , da die
Exponentialfunktion u ja die Umkehrfunktion von ln ist und somit u(ln a) = a gilt.
Nach Satz 2.29 gilt va (q) = aq für alle q ∈ Q. Das ist der Grund, warum man ax statt
va (x) schreibt, auch wenn x nicht in Q liegt. Obige Definition der Funktion va wird dann
zu ax = u(x ln a) = ex ln a . Daraus folgt ln ax = x ln a, da ln die Umkehrfunktion der
Exponentialfunktion u ist und somit ln ex ln a = x ln a gilt.
Satz 2.30: Für a, b > 0 und x, y ∈ R gilt ax bx = (ab)x und (ax )y = axy .
Beweis: Satz 2.28 und Satz 2.25 besagen ln ab = ln a + ln b und u(x + y) = u(x)u(y).
Daraus erhalten wir dann (ab)x = u(x ln ab) = u(x ln a + x ln b) = u(x ln a)u(x ln b) = ax bx .
Mit Hilfe der Gleichung ln ax = x ln a folgt auch (ax )y = u(y ln ax ) = u(yx ln a) = axy .
Sei r ∈ R und g : R+ → R+ definiert durch g(x) = xr . Das ist die Potenzfunktion für
reelle Exponenten. Es gilt g ′ (x) = rxr−1 . Um das zu zeigen, verwenden wir x = eln x und
erhalten g(x) = (eln x )r = er ln x . Es folgt g ′ (x) = er ln x xr = xr xr = rxr x−1 = rxr−1 .
Franz Hofbauer
39
Beispiel: Wir beweisen die Ungleichung zwischen dem arithmetischen und geometrischen
Mittel. Wir zeigen zuerst, dass ex−1 ≥ x für alle x ∈ R gilt. Die Funktion f (x) = ex−1 − x
hat Ableitung f ′ (x) = ex−1 − 1. Es gilt f ′ (x) < 0 für x < 1 und f ′ (x) > 0 für x > 1. Auf
dem Intervall (−∞, 1) ist f monoton fallend. Auf (1, ∞) ist f monoton wachsend. Es gilt
daher f (x) ≥ f (1) für alle x ∈ R. Das ist die gewünschte Ungleichung ex−1 − x ≥ 0.
√
n
Seien a1 , a2 , . . . , an positive reelle Zahlen. Wir zeigen n a1 a2 . . . an ≤ a1 +a2 +···+a
. Dazu
n
aj
a1 +a2 +···+an
und xj = m , sodass x1 +x2 +· · ·+xn = n gilt. Aus obiger Ungleichung
sei m =
n
folgt exj −1 ≥ xj für alle j und daraus wieder ex1 −1 ex2 −1 . . . exn −1 ≥ x1 x2 . . . xn . Die linke
Seite ist aber gleich ex1 +x2 +···+xn −n = e0 = 1, sodass wir x1 x2 . . . xn ≤ 1 erhalten. Das
aber bedeutet nichts anderes als a1 a2 . . . an ≤ mn . Zieht man auf beiden Seiten noch die
n-te Wurzel, so steht die gewünschte Ungleichung schon da.
8. Regel von de l’Hospital
Wir beweisen die Regel von de l’Hospital, die dazu dient, gewisse Grenzwerte zu berechnen. Dazu brauchen wir ein Verallgemeinerung des Mittelwertsatzes.
Satz 2.31 (Verallgemeinerter Mittelwertsatz) Seien f : [a, b] → R und g : [a, b] → R
stetig und auf dem oﬀenen Intervall (a, b) diﬀerenzierbar. Dann gibt es ein c ∈ (a, b) mit
(f (b) − f (a))g ′ (c) = (g(b) − g(a))f ′ (c). Gilt auch g ′ (x) ̸= 0 für alle x ∈ (a, b) dann kann
′
(c)
(b)−f (a)
= fg′ (c)
.
man diese Gleichung schreiben als fg(b)−g(a)
Beweis: Sei h(x) = (f (b) − f (a))g(x) − (g(b) − g(a))f (x). Dann ist h : [a, b] → R stetig
und auf dem oﬀenen Intervall (a, b) diﬀerenzierbar. Es gilt h(a) = f (b)g(a) − g(b)f (a) und
h(b) = g(a)f (b) − f (a)g(b), das heißt h(b)−h(a)
= 0. Daher folgt aus Satz 2.10 die Existenz
b−a
′
eines c ∈ (a, b) mit h (c) = 0. Das aber heißt (f (b) − f (a))g ′ (c) − (g(b) − g(a))f ′ (c) = 0
und die erste Aussage ist gezeigt.
Gilt g ′ (x) ̸= 0 für alle x ∈ (a, b) dann folgt g(b) − g(a) ̸= 0 aus Satz 2.10 und wir können
′
(b)−f (a)
(c)
obige Gleichung schreiben als fg(b)−g(a)
= fg′ (c)
.
Satz 2.32 (Regel von de l’Hospital) Sei a < s < b. Seien f : (a, b) → R und g : (a, b) → R
diﬀerenzierbar. Weiters sei g ′ (x) ̸= 0 für alle x ∈ (a, s) ∪ (s, b). Wenn f (s) = g(s) = 0 und
′
(x)
(x)
limx→s fg′ (x)
= u gilt, dann gilt auch limx→s fg(x)
= u.
′
(s)−f (x)
(c)
(x)
= fg(s)−g(x)
= fg′ (c)
für
Beweis: Es gilt f (s) = g(s) = 0. Ist x ∈ (a, s), dann folgt fg(x)
ein c ∈ (x, s) aus Satz 2.31 angewandt auf das Intervall [x, s]. Ist x ∈ (s, b), dann folgt
f (x)
f (x)−f (s)
f ′ (c)
=
=
g(x)
g(x)−g(s)
g ′ (c) für ein c ∈ (s, x) aus Satz 2.31 angewandt auf das Intervall [s, x].
Nach Voraussetzung gilt limx→s
Damit ist
(x)
limx→s fg(x)
f ′ (c)
g ′ (c)
= limc→s
f ′ (c)
g ′ (c)
= u, da mit x ja auch c gegen s geht.
= u bereits gezeigt.
Die Voraussetzung g ′ (x) ̸= 0 für alle x ∈ (a, s) ∪ (s, b) muss man nicht überprüfen, da
die auftretenden Funktionen üblicherweise isolierte Nullstellen haben und daher ein ε > 0
existiert, sodass g ′ (x) ̸= 0 für x ∈ (s − ε, s) ∪ (s, s + ε) gilt. Man kann den Satz dann mit
a = s − ε und b = s + ε anwenden.
−x
Beispiel: Wir berechnen limx→0 e −e
. In Zähler und Nenner stehen Funktionen, die
x
auf ganz R diﬀerenzierbar sind und die 0 ergeben, wenn man x = 0 einsetzt. Wir erhalten
x
−x
x
−x
= limx→0 e +e
= 2.
limx→0 e −e
x
1
x
40
Diﬀerenzierbarkeit
1−cos x
Beispiel: Wir berechnen limx→0 1−cos
2x . Im Zähler und Nenner stehen diﬀerenzierbare
1−cos x
Funktionen, die 0 ergeben, wenn man x = 0 einsetzt. Wir erhalten limx→0 1−cos
2x =
sin x
limx→0 2 sin 2x . Wir erhalten einen Quotienten, wo im Zähler und Nenner wieder diﬀerenzierbare Funktionen stehen, die 0 ergeben, wenn man x = 0 einsetzt. Wir wenden die Regel
1−cos x
cos x
1
von de l’Hospital noch einmal an und erhalten limx→0 1−cos
2x = limx→0 4 cos 2x = 4 .
9. Komplexe Zahlen
Rechnet man mit reellen Zahlen, dann hat man das Problem, dass nicht jedes Polynom
eine Nullstelle hat. Das Polynom x2 + 1 hat zum Beispiel keine. Um dieses Problem zu
beseitigen, führt man die komplexen Zahlen C = {a + ib : a ∈ R, b ∈ R} ein. Addition
und Multiplikation sind in naheliegender Weise definiert, wobei i2 = −1 zu setzen ist.
Es gelten wieder die Assoziativgesetze, die Kommutativgesetze und das Distributivgesetz.
−b
a
Zu jeder komplexen Zahl a + bi ̸= 0 existiert die inverse Zahl a2 +b
2 + i a2 +b2 . Aus jeder
komplexen Zahl lässt sich die Wurzel ziehen. Die Ordnung geht verloren. Auf C kann
keine Ordnungsrelation definiert werden, die mit den Rechenoperationen verträglich ist.
√
Beispiel: Wir berechnen 3 + 4i, das heißt wir lösen die Gleichung (a + ib)2 = 3 + 4i. Es
folgt a2 − b2 + 2abi = 3 + 4i, also a2 − b2 = 3 und 2ab = 4. Berechnet man aus der zweiten
Gleichung b und setzt es in die erste ein, so erhält man a2 − a42 = 3 oder a4 − 3a2 − 4 = 0.
Als Lösungen erhält man a2 = 4 und a2 = −1. Da a eine reelle Zahl ist, muss a2 ≥ 0
gelten. Es kommt also nur a2 = 4 in Frage. Wir erhalten die beiden Lösungen a = 2 und
a = −2. Die zugehörigen Werte für b sind b = 1 und b = −1. Als Wurzeln der Zahl 3 + 4i
erhalten wir die beiden komplexen Zahlen 2 + i und −2 − i.
Man kann komplexe
Zahlen a + ib graphisch
(a)
als Vektoren b im R2 darstellen. Die Addition der komplexen Zahlen entspricht dann
der Vektoraddition. Um auch die Multiplikar
tion geometrisch zu deuten, ist es nützlich, die
b
Polarkoordinatendarstellung komplexer Zahlen
einzuführen.
√ Es gilt a + ib = r(cos φ + i sin φ),
wobei r = a2 + b2 der Betrag der komplexen
φ
Zahl a + ib ist und φ der Winkel zwischen der
a
x-Achse und dem Vektor, der die komplexe Zahl
a + ib darstellt.
Für x ∈ R definieren wir die komplexe Zahl eix durch die sogenannte Eulersche Formel
eix = cos x + i sin x
Dann lässt sich die Polarkoordinatendarstellung schreiben als a + ib = reiφ . Warum man
die komplexe Zahl cos x + i sin x mit eix bezeichnet, wird aus dem nächsten Satz klar. Es
gelten Rechenregeln wie für die Exponentialfunktion.
Satz 2.33: Für x und y in R gilt ei(x+y) = eix eiy .
Beweis: Das folgt aus den Summensätzen für die trigonometrischen Funktionen. Es gilt
ei(x+y) = cos(x + y) + i sin(x + y) = cos x cos y − sin x sin y + i sin x cos y + i cos x sin y und
eix eiy = (cos x + i sin x)(cos y + i sin y) = cos x cos y + i sin x cos y + i cos x sin y − sin x sin y.
Daraus erkennt man die gesuchte Gleichung.
Franz Hofbauer
41
Nun kann man auch die Multiplikation von zwei komplexen Zahlen geometrisch deuten.
Wir schreiben die Zahlen in Polarkoordinatendarstellung als r1 eiφ1 und r2 eiφ2 . Mit Hilfe
von Satz 2.33 folgt r1 eiφ1 · r2 eiφ2 = r1 r2 ei(φ1 +φ2 ) . Das Produkt zweier komplexer Zahlen
erhält man also, indem man die Beträge √
der beiden Zahlen
multipliziert und die Winkel
√ iφ/2
iφ/2
addiert. Daraus ergibt sich auch, dass re
und − re
die beiden Wurzeln der
komplexen Zahl reiφ sind. Die Wurzel (abgesehen vom Vorzeichen) erhält man, indem
man die Wurzel aus dem Betrag zieht und den Winkel halbiert.
Man kann nun umgekehrt auch die trigonometrischen Funktionen durch die komplexe
Exponentialfunktion darstellen. Wegen e−ix = cos(−x)+i sin(−x) = cos x−i sin x erhalten
wir eix + e−ix = 2 cos x und daraus
cos x = 21 (eix + e−ix )
Ebenso erhalten wir eix − e−ix = 2i sin x und daraus
sin x =
ix
1
2i (e
− e−ix )
Diese Darstellung von sin x und cos x durch die komplexe Exponentialfunktion kann man
verwenden um Potenzen und Produkte von trigonometrischen Funktionen auszurechnen.
Beispiel: Es soll sin2 x sin 2x als Summe von trigonometrischen Funktionen geschrieben
2ix
−2ix 2ix
e
−e−2ix
werden. Durch Einsetzen obiger Formeln erhält man sin2 x sin 2x = e −2+e
−4
2i
−2ix
−4ix
−e
Multiplikation dieser beiden Brüche ergibt e −2e +2e
. Diesen Bruch kann
−8i
man jetzt zerteilen, sodass wir wieder trigonometrische Funktionen einsetzen können, und
2ix
−2ix
4ix
−e−4ix
+ 2e −2e
= − 14 sin 4x + 12 sin 2x. Damit ist die gewünschte Summe
erhalten e −8i
8i
gefunden.
4ix
2ix
Beispiel: Wir zeigen, dass sin 2α + sin 2β + sin 2γ = 4 sin α sin β sin γ für die Winkel eines
Dreiecks, also unter der Bedingung α + β + γ = π gilt. Wir beginnen mit 4 sin α sin β sin γ
1
1
und setzen sin x = 2i
(eix − e−ix ) ein. Durch Ausmultiplizieren ergibt sich − 2i
(ei(α+β+γ) −
ei(α+β−γ) − ei(α−β+γ) + ei(α−β−γ) − ei(−α+β+γ) + ei(−α+β−γ) + ei(−α−β+γ) − ei(−α−β−γ) ).
Fasst man diese Ausdrücke entsprechend zusammen, so erhält man − sin(α + β + γ) +
sin(α + β − γ) + sin(α − β + γ) + sin(−α + β + γ). Das ist das Ergebnis, wenn man die
Bedingung, dass es sich um die Winkel eines Dreiecks handelt, nicht verwendet. Beachtet
man, dass α+β +γ = π und sin(π −x) = sin x gilt, dann ergibt sich sin 2α+sin 2β +sin 2γ.
III. Beweise durch Intervallschachtelung
Die Intervallschachtelungseigenschaft macht es möglich, die grundlegenden Sätze der
Analysis zu beweisen. Es waren drei Sätze, nämlich der Satz über die Konvergenz monotoner Folgen, der Zwischenwertsatz und der Satz vom Maximum und Minimum stetiger
Funktionen, die nicht bewiesen wurden und deren Beweis wir jetzt führen werden. Dazu
kommen noch der Satz von Bolzano–Weierstraß und ein Satz über die Existenz von Infimum und Supremum einer beschränkten Menge. Als Beweismethode verwenden wir die
Intervallhalbierung. Es wird eine Folge von abgeschlossenen Intervallen konstruiert, sodass
jedes Intervall entweder die linke oder die rechte Hälfte des vorhergehenden Intervalls ist.
Wir wissen, dass es dann genau eine reelle Zahl gibt, die in allen Intervallen enthalten ist.
1. Intervallhalbierung
Mit Hilfe der Intervallhalbierungsmethode beweisen wir den Zwischenwertsatz und den
Satz von Bolzano–Weierstraß.
Satz 3.1 (Zwischenwertsatz) Sei f : [a, b] → R eine stetige Funktion. Sei f (a) < y < f (b)
oder f (a) > y > f (b). Dann existiert ein x ∈ (a, b) mit f (x) = y.
Beweis: Wir untersuchen den Fall f (a) < y < f (b). Wir konstruieren eine Folge von
geschachtelten Intervallen [an , bn ] mit f (an ) < y < f (bn ), die möglicherweise abbricht.
Wir beginnen mit [a0 , b0 ] = [a, b]. Ist [an , bn ] konstruiert, dann bestimmen wir [an+1 , bn+1 ]
folgendermaßen. Sei cn der Mittelpunkt von [an , bn ]. Ist f (cn ) = y, dann haben wir das
gewünschte x schon gefunden und der Beweis ist fertig. Ist f (cn ) > y, dann setzen wir
[an+1 , bn+1 ] = [an , cn ]. Ist f (cn ) < y, dann setzen wir [an+1 , bn+1 ] = [cn , bn ]. In beiden
Fällen gilt [an+1 , bn+1 ] ⊆ [an , bn ] und f (an+1 ) < y < f (bn+1 ). Damit sind die Intervalle
konstruiert. Da das nächstfolgende Intervall immer eine Hälfte des vorhergehenden ist,
gilt bn − an = b−a
2n . Die Längen der Intervalle gehen gegen 0.
Wegen der Intervallschachtelungseigenschaft gibt es ein x, das in allen Intervallen [an , bn ]
enthalten ist. Wir zeigen limn→∞ an = x und limn→∞ bn = x. Dazu sei ε > 0 vorgegeben.
Wir wählen n0 größer als b−a
ε . Ist dann n ≥ n0 , dann folgt wegen x ∈ [an , bn ], dass
b−a
b−a
|an − x| ≤ bn − an = 2n ≤ b−a
n ≤ n0 < ε gilt. Damit ist limn→∞ an = x gezeigt.
Genauso folgt limn→∞ bn = x, da ja auch |bn − x| ≤ bn − an gilt.
Wir zeigen f (x) = y. Da f stetig ist, folgt limn→∞ f (an ) = f (x). Da f (an ) ≤ y für alle
n gilt, erhalten wir f (x) ≤ y. Ebenso folgt limn→∞ f (bn ) = f (x). Da auch f (bn ) ≥ y für
alle n gilt, erhalten wir f (x) ≥ y. Damit ist f (x) = y gezeigt.
Der nächste Satz verwendet Teilfolgen. Ist (xn )n≥0 eine Folge, dann nennt man jede
Folge xn0 , xn1 , xn2 , xn3 , . . . mit n0 < n1 < n2 < n3 < . . . eine Teilfolge.
Satz 3.2 (Satz von Bolzano–Weierstraß) Jede Folge (xn )n≥0 , die in einem beschränktem
Intervall [a, b] liegt, hat eine konvergente Teilfolge mit Grenzwert in [a, b].
Beweis: Wir konstruieren eine Folge von geschachtelten Intervallen [an , bn ], von denen
jedes unendlich viele Glieder der Folge (xn )n≥0 enthält. Wir beginnen mit [a0 , b0 ] = [a, b].
Ist das Intervall [an , bn ] schon konstruiert, sodass es unendlich viele Folgenglieder enthält,
und ist cn der Mittelpunkt von [an , bn ], dann enthält mindestens eines der Intervalle [an , cn ]
oder [cn , bn ] unendlich viele Glieder der Folge. Eines dieser beiden Intervalle, das unendlich
Franz Hofbauer
43
viele Folgenglieder enthält, wählen wir als [an+1 , bn+1 ]. Es gilt dann [an+1 , bn+1 ] ⊆ [an , bn ]
für alle n. Damit sind die Intervalle konstruiert. Da jedes Intervall eine Hälfte des vorhergehenden ist, gilt bn − an = b−a
2n . Die Längen der Intervalle gehen gegen 0.
Wir wählen eine Teilfolge (xnk )k≥0 von (xn )n≥0 , sodass xnk ∈ [ak , bk ] gilt. Wir beginnen
mit xn0 = x0 ∈ [a0 , b0 ]. Sind die Folgenglieder xn0 , . . . , xnk schon gewählt, dann finden wir
ein nk+1 > nk mit xnk+1 ∈ [ak+1 , bk+1 ], da dieses Intervall ja unendlich viele Folgenglieder
enthält. Damit ist die Teilfolge ausgewählt. Wegen der Intervallschachtelungseigenschaft
gibt es ein x, das in allen Intervallen [an , bn ] enthalten ist. Wir zeigen limk→∞ xnk = x. Sei
ε > 0 beliebig. Es gibt ein k0 mit bk0 − ak0 < ε, da die Intervalllängen gegen 0 gehen. Für
k ≥ k0 gilt dann |xnk −x| ≤ bk0 −ak0 < ε wegen x ∈ [ak0 , bk0 ] und xnk ∈ [ak , bk ] ⊆ [ak0 , bk0 ].
Damit ist limk→∞ xnk = x gezeigt.
2. Infimum und Supremum
Infimum und Supremum werden für beschränkte nicht leere Teilmengen von R definiert.
Man nennt d eine obere Schranke einer nicht leeren Teilmenge M von R, wenn jedes
Element von M kleiner oder gleich d ist. Man nennt c eine untere Schranke von M , wenn
jedes Element von M größer oder gleich c ist. Eine Menge heißt beschränkt, wenn sie eine
obere und eine untere Schranke besitzt. Die kleinste obere Schranke einer Menge nennt
man Supremum. Die größte untere Schranke einer Menge nennt man Infimum. Es gilt der
folgende Satz.
Satz 3.3: Sei M ⊆ R nicht leer. Hat M eine obere Schranke, dann auch eine kleinste
obere Schranke. Hat M eine untere Schranke, dann auch eine größte untere Schranke.
Beweis: Wir führen den Beweis für die obere Schranke. Der Beweis für die untere Schranke
verläuft analog. Nach Voraussetzung hat M eine obere Schranke r. Wir konstruieren eine
Folge von geschachtelten Intervallen [an , bn ], sodass an keine, wohl aber bn eine obere
Schranke von M ist. Wir beginnen mit [a0 , b0 ] = [u − 1, r], wobei u ein beliebiges Element
von M ist. Klarerweise ist u − 1 keine obere Schranke. Ist [an , bn ] schon konstruiert, dann
bestimmen wir [an+1 , bn+1 ] folgendermaßen. Sei cn der Mittelpunkt von [an , bn ]. Ist cn eine
obere Schranke, dann setzen wir [an+1 , bn+1 ] = [an , cn ]. Ist cn keine obere Schranke, dann
setzen wir [an+1 , bn+1 ] = [cn , bn ]. In beiden Fällen gilt [an+1 , bn+1 ] ⊆ [an , bn ], während
an+1 keine, wohl aber bn+1 eine obere Schranke ist. Damit sind die Intervalle konstruiert.
0
Da jedes Intervall eine Hälfte des vorhergehenden ist, gilt bn − an = b02−a
. Die Längen
n
der Intervalle gehen gegen 0.
Wegen der Intervallschachtelungseigenschaft gibt es ein x, das in allen Intervallen [an , bn ]
enthalten ist. Wir zeigen, dass x die kleinste obere Schranke ist.
Wir nehmen an, dass x keine obere Schranke der Menge M ist. Dann gibt es ein v ∈ M
mit x < v. Da die Intervalllängen gegen 0 gehen, gibt es ein n mit bn − an < v − x. Wegen
an ≤ x ≤ bn folgt daraus bn < v − x + an ≤ v. Da aber bn eine obere Schranke von M ist,
kann bn < v nicht gelten. Die Annahme, dass x keine obere Schranke ist, ist widerlegt.
Damit wissen wir, dass x eine obere Schranke ist.
Um zu zeigen, dass x die kleinste obere Schranke von M ist, nehmen wir die Existenz einer
oberen Schranke y mit y < x an. Da die Intervalllängen gegen 0 gehen, gibt es ein n mit
bn − an < x − y. Wegen an ≤ x ≤ bn folgt daraus an > bn − x + y ≥ y. Da aber an keine
obere Schranke von M ist, existiert ein v ∈ M mit v > an . Es folgt v > y. Die Annahme,
dass y eine obere Schranke von M ist, ist widerlegt. Damit ist gezeigt, dass x die kleinste
obere Schranke von M ist.
44
Beweise durch Intervallschachtelung
Mit Hilfe des letzten Satzes, können wir die beiden folgenden beweisen.
Satz 3.4: Eine monoton wachsende, nach oben beschränkte Folge hat einen Grenzwert.
Eine monoton fallende, nach unten beschränkte Folge hat einen Grenzwert.
Beweis: Wir behandeln nur den Fall einer monoton wachsenden Folge (xn )n≥0 . Sei r eine
obere Schranke, das heißt xn ≤ r für alle n ≥ 0. Dann ist r auch eine obere Schranke für
die Menge M = {xn : n ≥ 0}. Nach Satz 3.3 hat M eine kleinste obere Schranke x. Wir
zeigen limn→∞ xn = x gilt.
Sei ε > 0 vorgegeben. Da x die kleinste obere Schranke von M ist, ist x − ε keine obere
Schranke. Es existiert ein n0 mit xn0 > x − ε. Da x eine obere Schranke von M ist, gilt
xn ≤ x für alle n ≥ 0. Da die Folge (xn )n≥0 monoton wachsend ist, gilt xn ≥ xn0 für alle
n ≥ n0 . Damit ist x − ε < xn ≤ x für alle n ≥ n0 gezeigt. Es folgt |xn − x| < ε für alle
n ≥ n0 , das heißt limn→∞ xn = x.
Man nennt d eine obere Schranke einer Funktion f : [a, b] → R, wenn f (x) ≤ d für
alle x ∈ [a, b] gilt. Hat eine Funktion eine obere Schranke, dann sagt man, sie ist nach
oben beschränkt. Man nennt c eine untere Schranke einer Funktion f : [a, b] → R, wenn
f (x) ≥ c für alle x ∈ [a, b] gilt. Hat eine Funktion eine untere Schranke, dann sagt man,
sie ist nach unten beschränkt. Eine Funktion heißt beschränkt, wenn sie nach oben und
nach unten beschränkt ist.
Satz 3.5: Seien a und b in R mit a < b. Jede stetige Funktion f : [a, b] → R ist beschränkt
und nimmt ihr Maximum und ihr Minimum an, das heißt es gibt ein x0 ∈ [a, b], sodass
f (x) ≤ f (x0 ) für alle x ∈ [a, b] gilt, und ein x1 ∈ [a, b], sodass f (x) ≥ f (x1 ) für alle
x ∈ [a, b] gilt.
Beweis: Wir zeigen, dass f nach oben beschränkt ist. Wäre das nicht der Fall, dann
würde für jedes n ∈ N ein xn ∈ [a, b] existieren, sodass f (xn ) ≥ n gilt. Nach dem Satz
von Bolzano–Weierstraß hat (xn )n≥0 eine Teilfolge (xnk )k≥0 mit limk→∞ xnk = x ∈ [a, b].
Da f stetig ist, folgt limk→∞ f (xnk ) = f (x). Das ist aber ein Widerspruch dazu, dass
f (xn ) ≥ n für alle n gilt. Also kann f nicht nach oben unbeschränkt sein.
Sei M = {f (x) : x ∈ [a, b]}. Wir haben soeben gezeigt, dass diese Menge nach oben
beschränkt ist. Nach Satz 3.3 hat M eine kleinste obere Schranke s. Wir zeigen, dass ein
x0 ∈ [a, b] existiert mit f (x0 ) = s. Wäre das nicht der Fall, dann hätten wir f (x) < s
für alle x ∈ [a, b]. Die Funktion g(x) = s−f1(x) wäre dann für alle x ∈ [a, b] definiert und
wegen Satz 1.10 auch stetig. Da wir gezeigt haben, dass jede auf [a, b] stetige Funktion
nach oben beschränkt ist, würde es ein r > 0 geben, sodass g(x) ≤ r für alle x ∈ [a, b]
gilt. Daraus folgt aber f (x) ≤ s − 1r für alle x ∈ [a, b] und wir hätten eine obere Schranke
für M gefunden, die kleiner als s ist. Daher muss es ein x0 ∈ [a, b] geben mit f (x0 ) = s.
Wegen f (x) ≤ s für alle x ∈ [a, b] ist damit ein x0 gefunden, sodass f (x) ≤ f (x0 ) für alle
x ∈ [a, b] gilt.
Wendet man dieses Ergebnis auf die Funktion −f an, die ja ebenfalls stetig ist, dann ergibt
sich die Existenz eines x1 ∈ [a, b], sodass −f (x) ≤ −f (x1 ) für alle x ∈ [a, b] gilt. Es folgt
dann f (x) ≥ f (x1 ) für alle x ∈ [a, b].
Zum Abschluss sollen noch einige Eigenschaften des Infimums und des Supremums behandelt werden, die wir im nächsten Kapitel bei der Definition des Integrals brauchen. Für
eine beschränkte nichtleere Teilmenge M von R bezeichnen wir das Infimum, die größte
untere Schranke, mit inf M und das Supremum, die kleinste obere Schranke, mit sup M .
Franz Hofbauer
45
Satz 3.6: Seien M und K beschränkte nichtleere Teilmengen von R.
(a) Ist c eine untere und d eine obere Schranke von M , dann gilt c ≤ inf M ≤ sup M ≤ d.
(b) Ist M ⊆ K, dann gilt inf M ≥ inf K und sup M ≤ sup K.
(c) Für jedes ε > 0 existieren u und v in M mit u − ε < inf M und v + ε > sup M .
Beweis: Für jedes Element u von M gilt inf M ≤ u und u ≤ sup M , sodass inf M ≤ sup M
folgt. Da inf M die größte untere Schranke von M ist, gilt c ≤ inf M für jede beliebige
untere Schranke c von M . Da sup M die kleinste obere Schranke von M ist, gilt d ≥ sup M
für jede beliebige obere Schranke d von M . Damit ist (a) gezeigt.
Sei M ⊆ K. Da inf K eine untere Schranke von K ist, ist inf K auch eine untere Schranke
von M . Da inf M die größte untere Schranke von M ist, erhalten wir inf M ≥ inf K. Da
sup K eine obere Schranke von K ist, ist sup K auch eine obere Schranke von M . Da
sup M die kleinste obere Schranke von M ist, folgt sup M ≤ sup K. Damit ist (b) gezeigt.
Sei ε > 0. Da inf M die größte untere Schranke von M ist, ist inf M + ε keine untere
Schranke von M . Daher existiert ein u ∈ M mit u < inf M + ε. Da sup M die kleinste
obere Schranke von M ist, ist sup M − ε keine obere Schranke von M . Daher existiert ein
v ∈ M mit v > sup M − ε. Damit ist auch (c) gezeigt.
Für eine beschränkte Funktion f : [a, b] → R und eine Teilmenge I von [a, b] sei f (I)
die Menge {f (x) : x ∈ I}, das ist die Menge aller Funktionswerte, die auf der Teilmenge
I von [a, b] angenommen werden. Üblicherweise schreibt man inf I f anstelle von inf f (I)
und supI f anstelle von sup f (I). Als Folgerung von Satz 3.6 erhalten wir
Satz 3.7: Sei f : [a, b] → R beschränkt und I und J nicht leere Teilmengen von [a, b].
(a) Ist c eine untere und d eine obere Schranke von f , dann gilt c ≤ inf I f ≤ supI f ≤ d.
(b) Ist I ⊆ J, dann gilt inf I f ≥ inf J f und supI f ≤ supJ f .
(c) Für jedes ε > 0 existieren x und y in I mit f (x) − ε < inf I f und f (y) + ε > supI f .
Beweis: Diese drei Aussagen erhält man, indem man M = f (I) und K = f (J) in Satz 3.6
setzt. Es gilt ja I ⊆ J ⇒ f (I) ⊆ f (J). Weiters lässt sich u ∈ f (I) schreiben als f (x) mit
x ∈ I und v ∈ f (I) als f (y) mit y ∈ I.
IV. Integration
Wir führen das Integral ein, um die Fläche unter dem Graph einer Funktion zu berechnen. Durch eine entsprechende Approximation dieser Fläche mit Hilfe von Rechtecken
ergibt sich die Definition des Integrals. Es stellt sich heraus, dass Integrieren die Umkehrung des Diﬀerenzierens ist. Aus den Rechenregeln für die Ableitung erhält man wichtige
Rechenregeln für das Integral. Mit Integralen kann man aber nicht nur Flächen berechnen,
sondern auch anderes, wie zum Beispiel Volumina, Bogenlängen, Oberflächen und Schwerpunkte. Schließlich wird die Approximation von Funktionen durch Polynome behandelt.
Der Fehler, den man dabei macht, lässt sich durch ein Integral ausdrücken. Das führt dann
auch zur Untersuchung von Potenzreihen.
1. Definition und Eigenschaften des Integrals
Sei f : [a, b] → R eine beschränkte Funktion. Unser Ziel ist es, die Fläche zu berechnen, die von der x-Achse, dem Graph der Funktion f und den beiden senkrechten Geraden durch die Punkte (a, 0) und (b, 0) begrenzt wird. Liegt der Graph der Funktion
unterhalb der x-Achse, dann hat die Fläche negatives Vorzeichen. Liegt der Graph teilweise über und teilweise unter der
x-Achse, dann werden die Flächenstücke, die unter der x-Achse liegen,
von denen, die über der x-Achse
liegen, subtrahiert. Wir approximieren durch Rechtecke. Dazu sei
a = x0 < x1 < · · · < xn = b.
Das ergibt eine Zerlegung des Intervalls [a, b] in Teilintervalle. Das
Maximum der Diﬀerenzen xj −xj−1
nennen wir die Gitterweite der Zerlegung. Hat die Zerlegung Gitterxn−1 ξn b
a ξ1 x1 ξ2 x2
weite α, dann gilt xj −xj−1 ≤ α für
1 ≤ j ≤ n. Für jedes j wählen wir
ein ξj ∈ [xj−1 , xj ]. Die Rechtecke
mit Basislängen xj − xj−1 und Höhen
∑nf (ξj ) approximieren die zu berechnende Fläche. Die
Gesamtfläche dieser Rechtecke ist j=1 (xj − xj−1 )f (ξj ).
Für eine nicht leere Teilmenge I von [a, b] sei supI f das Supremum und inf I f das
Infimum der Menge f (I) = {f (x) : x ∈ I}. Wir fassen eine Zerlegung des Intervalls [a, b]
als endliche Menge Z von Punkten in [a, b] auf, die a und b enthält. Sei Z = {x0 , x1 , . . . , xn }
eine Zerlegung des Intervalls [a, b], wobei a = x0 < x1 < · · · < xn = b gilt. Wir definieren
∑n
∑n
OZ (f ) = j=1 (xj − xj−1 ) sup[xj−1 ,xj ] f und UZ (f ) = j=1 (xj − xj−1 ) inf [xj−1 ,xj ] f
und nennen OZ (f ) die Obersumme und UZ (f ) die Untersumme der Funktion f zur Zerlegung Z. Weiters nennen wir die bereits oben erwähnten Summen
∑n
j=1 (xj − xj−1 )f (ξj ) mit ξj ∈ [xj−1 , xj ]
Riemannsummen zur Zerlegung Z. Jede Riemannsumme zur Zerlegung Z liegt zwischen
UZ (f ) und OZ (f ). Es ist möglich, dass UZ (f ) oder OZ (f ) oder beide keine Riemannsummen sind.
Franz Hofbauer
47
Wir beweisen einige Eigenschaften von Ober– und Untersumme.
Satz 4.1: Sei f : [a, b] → R beschränkt mit unterer Schranke c und oberer Schranke d.
Sei R eine Zerlegung von [a, b] mit Gitterweite α. Weiters sei s ∈ [a, b] und R̃ = R ∪ {s}.
Dann gilt OR̃ (f ) ≤ OR (f ) ≤ OR̃ (f ) + α(d − c) und UR̃ (f ) ≥ UR (f ) ≥ UR̃ (f ) − α(d − c).
Beweis: Wenn s in R liegt, dann gilt R̃ = R. Wir erhalten OR̃ (f ) = OR (f ) und
UR̃ (f ) = UR (f ), sodass die zu beweisenden Ungleichungen trivial sind.
Sei daher R = {x0 , x1 , . . . , xn } und s ∈
/ R. Es existiert ein j mit xj−1 < s < xj . Aus der
Definition der Obersumme folgt dann
OR (f ) − (xj − xj−1 ) sup[xj−1 ,xj ] f = OR̃ (f ) − (xj − s) sup[s,xj ] f − (s − xj−1 ) sup[xj−1 ,s] f.
Wegen Satz 3.7 (b) gilt sup[xj−1 ,xj ] f ≥ sup[s,xj ] f und sup[xj−1 ,xj ] f ≥ sup[xj−1 ,s] f . Somit
ist OR (f ) − OR̃ (f ) = (xj − xj−1 ) sup[xj−1 ,xj ] f − (xj − s) sup[s,xj ] f − (s − xj−1 ) sup[xj−1 ,s] f
größer oder gleich 0 und die erste Ungleichung ist gezeigt. Wegen Satz 3.7 (a) gilt auch
sup[xj−1 ,xj ] f ≤ d, sup[s,xj ] f ≥ c und sup[xj−1 ,s] f ≥ c. Daraus folgt OR (f ) − OR̃ (f ) ≤
(xj − xj−1 )d − (xj − s)c − (s − xj−1 )c = (xj − xj−1 )(d − c) ≤ α(d − c). Damit ist auch die
zweite Ungleichung gezeigt.
Der Beweis für die Untersummen läuft analog. Aus der Definition der Untersumme folgt
UR (f ) − (xj − xj−1 ) inf [xj−1 ,xj ] f = UR̃ (f ) − (xj − s) inf [s,xj ] f − (s − xj−1 ) inf [xj−1 ,s] f.
Wegen Satz 3.7 (b) gilt inf [xj−1 ,xj ] f ≤ inf [s,xj ] f und inf [xj−1 ,xj ] f ≤ inf [xj−1 ,s] f . Somit
ist UR (f ) − UR̃ (f ) = (xj − xj−1 ) inf [xj−1 ,xj ] f − (xj − s) inf [s,xj ] f − (s − xj−1 ) inf [xj−1 ,s] f
kleiner oder gleich 0 und die dritte Ungleichung ist gezeigt. Wegen Satz 3.7 (a) gilt auch
inf [xj−1 ,xj ] f ≥ c, inf [s,xj ] f ≤ d und inf [xj−1 ,s] f ≤ d. Daraus folgt UR̃ (f ) − UR (f ) ≤
(xj − s)d + (s − xj−1 )d − (xj − xj−1 )c = (xj − xj−1 )(d − c) ≤ α(d − c). Damit ist auch die
vierte Ungleichung gezeigt.
Satz 4.2: Sei f : [a, b] → R beschränkt und seien Y und Z Zerlegungen von [a, b].
(a) Wenn Y ⊆ Z gilt, dann auch OY (f ) ≥ OZ (f ) und UY (f ) ≤ UZ (f ).
(b) Es gilt UY (f ) ≤ OZ (f ).
Beweis: Um (a) zu zeigen, sei R0 = Y und R1 , R2 , . . . , Rk seien so gewählt, dass Ri+1
aus Ri durch Hinzufügen eines Punktes entsteht und Rk = Z gilt. Aus Satz 4.1 folgt
ORj−1 (f ) ≥ ORj (f ) und URj−1 (f ) ≤ URj (f ) für 1 ≤ j ≤ k. Daraus erhalten wir dann
OY (f ) = OR0 (f ) ≥ ORk (f ) = OZ (f ) und UY (f ) = UR0 (f ) ≤ URk (f ) = UZ (f ). Damit
ist (a) gezeigt.
Um (b) zu zeigen, sei X = Y ∪ Z. Aus der Definition von Ober- und Untersumme und
Satz 3.7 (a) folgt UX (f ) ≤ OX (f ). Aus (a) erhalten wir UY (f ) ≤ UX (f ) wegen Y ⊆ X
und OZ (f ) ≥ OX (f ) wegen Z ⊆ X . Somit ergibt sich UY (f ) ≤ OZ (f ).
Sei SO = {OZ (f ) : Z eine Zerlegung von [a, b]}. Nach Satz 4.2 (b) ist UY (f ) für jede
Zerlegung Y von [a, b] eine untere Schranke der Menge SO . Somit hat die Menge SO
eine größte untere Schranke, die wir mit O(f ) bezeichnen, und wegen Satz 3.6 (a) gilt
UY (f ) ≤ O(f ) für jede Zerlegung Y von [a, b].
Sei SU = {UY (f ) : Y eine Zerlegung von [a, b]}. Wir haben soeben gezeigt, dass O(f )
eine obere Schranke der Menge SU ist. Somit hat die Menge SU auch eine kleinste obere
Schranke, die wir mit U (f ) bezeichnen, und wegen Satz 3.6 (a) gilt U (f ) ≤ O(f ).
Wir fassen zusammen: Es gilt OZ (f ) ≥ O(f ) für alle Zerlegungen Z von [a, b], da O(f )
eine untere Schranke von SO ist. Ebenso gilt UZ (f ) ≤ U (f ) für alle Zerlegungen Z von
[a, b], da U (f ) eine obere Schranke von SU ist. Und wir haben U (f ) ≤ O(f ) gezeigt.
48
Integration
Die Fläche zwischen dem Graph der Funktion f und der x-Achse wird durch O(f ) von
oben und durch U (f ) von unten approximiert. Eine beschränkte Funktion f : [a, b] → R
heißt daher integrierbar, wenn O(f ) = U (f ) gilt. Man bezeichnet diese Zahl dann mit
∫b
f (x) dx und nennt sie das Integral der Funktion f in den Grenzen von a bis b. Dabei
a
spielt x dieselbe Rolle wie eine Summationsvariable. Man kann genausogut eine andere
∫b
Variable schreiben, zum Beispiel a f (y)dy.
Im nächsten Satz charakterisieren wir das Integral als Grenzwert von Ober– und Untersummen und im übernächsten Satz dann als Grenzwert von Riemannsummen.
Satz 4.3: Sei f : [a, b] → R eine beschränkte Funktion und sei (Zn )n≥1 eine Folge von
Zerlegungen des Intervalls [a, b] mit Gitterweiten αn , für die limn→∞ αn = 0 gilt. Dann
gilt auch limn→∞ UZn (f ) = U (f ) und limn→∞ OZn (f ) = O(f ).
Beweis: Sei ε > 0 vorgegeben. Da U (f ) nach Definition gleich sup SU ist, existiert nach
Satz 3.6 (c) eine Zerlegung Y des Intervalls [a, b] mit UY (f ) + 2ε > U (f ). Sei k die Anzahl
der Unterteilungspunkte der Zerlegung Y. Sei c eine untere und d eine obere Schranke der
Funktion f . Wir wählen n0 so, dass kαn (d − c) < 2ε für alle n ≥ n0 gilt.
Für n ≥ 1 sei Xn = Zn ∪ Y. Man kann zwischen Zn und Xn Zerlegungen einfügen, sodass
jede dieser Zerlegungen jeweils einen Punkt mehr als die vorhergehende enthält. Durch
wiederholtes Anwenden von Satz 4.1 erhalten wir dann UZn (f ) ≥ UXn (f ) − kαn (d − c),
da jede Zerlegung, die Zn enthält, Gitterweite ≤ αn hat. Weiters folgt UXn (f ) ≥ UY (f )
aus Satz 4.2 (a) wegen Y ⊆ Xn . Für n ≥ n0 gilt dann UZn (f ) > UY (f ) − 2ε > U (f ) − ε.
Da U (f ) eine obere Schranke der Menge SU ist, gilt U (f ) ≥ UZn (f ) für alle n ≥ 1. Somit
liegt UZn (f ) für n ≥ n0 in der ε-Umgebung von U (f ). Damit ist limn→∞ UZn (f ) = U (f )
bewiesen. Der Beweis von limn→∞ OZn (f ) = O(f ) läuft analog.
Satz 4.4: Sei f : [a, b] → R integrierbar und (Zn )n≥1 eine Folge von Zerlegungen des
Intervalls [a, b], deren Gitterweiten für n → ∞ gegen 0 gehen. Für n ≥ 1 sei An (f )
∫b
irgendeine Riemannsumme zur Zerlegung Zn . Dann gilt limn→∞ An (f ) = a f (x)dx.
∫b
Beweis: Da f : [a, b] → R eine integrierbare Funktion ist, gilt U (f ) = O(f ) = a f (x)dx.
Weiters gilt UZn (f ) ≤ An (f ) ≤ OZn (f ), da An (f ) eine Riemannsumme zur Zerlegung Zn
∫b
∫b
ist. Nach Satz 4.3 gilt limn→∞ UZn (f ) = a f (x)dx und limn→∞ OZn (f ) = a f (x) dx,
∫b
woraus limn→∞ An (f ) = a f (x)dx folgt.
Wir beweisen einfache Rechenregeln für das Integral.
Satz 4.5: Seien f und g integrierbare Funktionen von [a, b] nach R und sei c in R. Dann
∫b
∫b
∫b
∫b
∫b
gilt a f (x) + g(x) dx = a f (x) dx + a g(x)dx und a cf (x) dx = c a f (x) dx.
Beweis: Sei I ein Intervall. Für alle x ∈ I gilt f (x) ≤ supI f und g(x) ≤ supI g, also
auch f (x) + g(x) ≤ supI f + supI g. Somit ist supI f + supI g eine obere Schranke für die
Menge {f (x) + g(x) : x ∈ I}. Es folgt supI (f + g) ≤ supI f + supI g. Analog zeigt man
auch inf I (f + g) ≥ inf I f + inf I g.
Sei Z = {x0 , x1 , . . . , xi } eine Zerlegung des Intervalls [a, b], wobei a = x0 < · · · < xi = b
gilt. Wir haben oben gezeigt, dass inf [xj−1 ,xj ] f + inf [xj−1 ,xj ] g ≤ inf [xj−1 ,xj ] (f + g) und
sup[xj−1 ,xj ] (f + g) ≤ sup[xj−1 ,xj ] f + sup[xj−1 ,xj ] g für 1 ≤ j ≤ i gilt. Multipliziert man
diese Ungleichungen mit xj − xj−1 und summiert über j, so ergibt sich
UZ (f ) + UZ (g) ≤ UZ (f + g) und
OZ (f + g) ≤ OZ (f ) + OZ (g)
Franz Hofbauer
49
Da UZ (h) ≤ U (h) ≤ O(h) ≤ OZ (h) für alle Funktionen h gilt, erhalten wir
UZ (f ) + UZ (g) ≤ UZ (f + g) ≤ U (f + g) ≤ O(f + g) ≤ OZ (f + g) ≤ OZ (f ) + OZ (g)
Sei jetzt (Zn )n≥1 eine Folge von Zerlegungen des Intervalls [a, b], deren Gitterweiten für
n → ∞ gegen 0 gehen. Dann ergibt sich aus obigen Ungleichungen
UZn (f ) + UZn (g) ≤ U (f + g) ≤ O(f + g) ≤ OZn (f ) + OZn (g)
∫b
Da f und g integrierbar sind, folgen limn→∞ UZn (f ) = limn→∞ OZn (f ) = a f (x)dx und
∫b
limn→∞ UZn (g) = limn→∞ OZn (g) = a g(x)dx aus Satz 4.3. Damit erhalten wir
∫b
∫b
U (f + g) = O(f + g) = a f (x)dx + a g(x) dx
∫b
Das zeigt, dass auch die Funktion f + g integrierbar ist und dass a f (x) + g(x)dx =
∫b
∫b
f (x) dx + a g(x)dx gilt. Damit ist die erste Aussage gezeigt.
a
Nun zur zweiten Aussage. Sei I ein Intervall. Für alle x ∈ I gilt f (x) ≤ supI f . Ist
c ≥ 0, dann folgt cf (x) ≤ c supI f für alle x ∈ I. Somit ist c supI f eine obere Schranke
für die Menge {cf (x) : x ∈ I}, woraus supI (cf ) ≤ c supI f folgt. Analog zeigt man auch
inf I (cf ) ≥ c inf I f .
Ist c < 0, dann folgt cf (x) ≥ c supI f für alle x ∈ I. Somit ist c supI f eine untere Schranke
für die Menge {cf (x) : x ∈ I}, woraus inf I (cf ) ≥ c supI f folgt. Analog zeigt man auch
supI (cf ) ≤ c inf I f .
Ist Z eine Zerlegung des Intervalls [a, b], dann folgt wie oben, dass
cUZ (f ) ≤ UZ (cf ) und
OZ (cf ) ≤ cOZ (f ) im Fall c ≥ 0 gilt, und
cOZ (f ) ≤ UZ (cf ) und
OZ (cf ) ≤ cUZ (f ) im Fall c < 0
Da UZ (h) ≤ U (h) ≤ O(h) ≤ OZ (h) für alle Zerlegungen Z und alle Funktionen h gilt,
erhalten wir cUZ (f ) ≤ UZ (cf ) ≤ U (cf ) ≤ O(cf ) ≤ OZ (cf ) ≤ cOZ (f ) im ersten und
cOZ (f ) ≤ UZ (cf ) ≤ U (cf ) ≤ O(cf ) ≤ OZ (cf ) ≤ cUZ (f ) im zweiten Fall.
Sei jetzt (Zn )n≥1 eine Folge von Zerlegungen des Intervalls [a, b], deren Gitterweiten für
n → ∞ gegen 0 gehen. Dann ergibt sich cUZn (f ) ≤ U (cf ) ≤ O(cf ) ≤ cOZn (f ) im ersten
und cOZn (f ) ≤ U (cf ) ≤ O(cf ) ≤ cUZn (f ) im zweiten Fall. Da f integrierbar ist, folgt
∫b
limn→∞ UZn (f ) = limn→∞ OZn (f ) = a f (x) dx aus Satz 4.3. Damit erhalten wir sowohl
im Fall c ≥ 0 als auch im Fall c < 0
∫b
U (cf ) = O(cf ) = c a f (x)dx
∫b
∫b
Somit ist auch die Funktion cf integrierbar und es gilt a cf (x)dx = c a f (x)dx.
Zweiter Beweis: Sei h = f + g. Sei (Zn )n≥1 eine Folge von Zerlegungen des Intervalls
[a, b], deren Gitterweiten gegen 0 gehen. Nach Satz 4.3 gilt limn→∞ OZn (h) = O(h).
Wir suchen eine geeignete Riemannsumme zur Zerlegung Zn . Sei Zn = {x0 , x1 , . . . , xi }.
1
Wir wählen ξj ∈ [xj−1 , xj ] so, dass h(ξj ) > sup[xj−1 ,xj ] h − n(b−a)
gilt. Das ist nach
Satz 3.7 (c) möglich. Die zu diesen Zwischenpunkten gehörige Riemannsumme ist An (h) =
∑i
j=1 (xj − xj−1 )h(ξj ). Multipliziert man obige Ungleichung mit xj − xj−1 und summiert
∑i
über j, so ergibt sich An (h) > OZn (h) − n1 wegen j=1 (xj − xj−1 ) = b − a. Da An (h) eine
Riemannsumme ist, gilt auch An (h) ≤ OZn (h). Wegen limn→∞ OZn (h) = O(h) erhalten
wir limn→∞ An (h) = O(h).
∑i
∑i
Seien An (f ) = j=1 (xj −xj−1 )f (ξj ) und An (g) = j=1 (xj −xj−1 )g(ξj ) die Riemannsummen für die Funktionen f und g zur Zerlegung Zn , die dieselben Zwischenpunkte verwen-
50
Integration
∫b
den wie die Riemannsumme An (h). Nach Satz 4.4 gilt limn→∞ An (f ) = a f (x)dx und
∫b
limn→∞ An (g) = a g(x) dx, da f und g integrierbar sind. Da An (h) = An (f ) + An (g)
∫b
∫b
für alle n ≥ 1 gilt, erhalten wir limn→∞ An (h) = a f (x)dx + a g(x)dx. Damit ist
∫b
∫b
O(h) = a f (x)dx + a g(x) dx gezeigt.
∫b
∫b
Analog zeigt man U (h) = a f (x) dx+ a g(x)dx. (Man braucht nur OZn (h) durch UZn (h),
O(h) durch U (h), sup durch inf und − n1 durch n1 ersetzen und die Ungleichheitszeichen
∫b
∫b
umdrehen.) Insgesamt haben wir U (h) = O(h) = a f (x)dx + a g(x)dx. Das zeigt, dass
∫b
∫b
∫b
die Funktion h = g + f integrierbar ist und dass a h(x) dx = a f (x) dx + a g(x)dx gilt.
Damit ist die erste Aussage gezeigt.
Sei jetzt h = cf . Sei (Zn )n≥1 eine Folge von Zerlegungen des Intervalls [a, b], deren
Gitterweiten gegen 0 gehen. Nach Satz 4.3 gilt limn→∞ OZn (h) = O(h).
Wir gehen genauso vor wie im ersten Teil des Beweises. Zur Zerlegung Zn = {x0 , x1 , . . . , xi }
∑i
finden wir eine Riemannsumme An (h) = j=1 (xj − xj−1 )h(ξj ) für die OZn (h) ≥ An (h) >
OZn (h) − n1 gilt. Wegen limn→∞ OZn (h) = O(h) gilt dann auch limn→∞ An (h) = O(h).
∑i
Sei An (f ) = j=1 (xj − xj−1 )f (ξj ) die Riemannsumme für die Funktion f zur Zerlegung
Zn , die dieselben Zwischenpunkte verwendet wie die Riemannsumme An (h). Nach Satz 4.4
∫b
gilt limn→∞ An (f ) = a f (x) dx, da f integrierbar ist. Da An (h) = cAn (f ) für alle n ≥ 1
∫b
∫b
gilt, erhalten wir limn→∞ An (h) = c a f (x)dx. Damit ist O(h) = c a f (x) dx gezeigt.
∫b
∫b
Analog zeigt man U (h) = c a f (x)dx. Insgesamt haben wir U (h) = O(h) = c a f (x)dx.
∫b
∫b
Das zeigt, dass die Funktion h = cf integrierbar ist und dass a h(x)dx = c a f (x) dx
gilt. Damit ist auch die zweite Aussage gezeigt.
Satz 4.6: Seien f und g integrierbare Funktionen von [a, b] nach R mit f (x) ≤ g(x) für
∫b
∫b
alle x ∈ [a, b]. Dann gilt a f (x)dx ≤ a g(x) dx.
Beweis: Sei h(x) = g(x) − f (x). Dann gilt h ≥ 0. Wegen Satz 4.5 ist h integrierbar
∫b
∫b
∫b
und es gilt a h(x) dx = a g(x) dx − a f (x)dx. Da jede Untersumme von h größer oder
∫b
gleich Null sein muss, folgt a h(x) dx ≥ 0 aus der Definition des Integrals. Das ergibt
∫b
∫b
f (x) dx ≤ a g(x)dx.
a
Man kann f : [a, b] → R natürlich auch∫über Teilintervalle seines Definitionsintervalls
v
integrieren. Gilt a ≤ u < v ≤ b, so wird u f (x) dx wie oben definiert. Es ist bequem,
∫u
∫u
∫v
diese Definition zu ergänzen, indem man u f (x)dx = 0 und v f (x) dx = − u f (x)dx
definiert. Wie man leicht sieht, bleiben die Aussagen von Satz 4.5 richtig, wenn die obere
Integrationsgrenze kleiner oder gleich der unteren ist.
Denkt man an die Interpretation des Integrals als Fläche, dann ist der folgende Satz
unmittelbar einsichtig. Addiert man die Fläche zwischen den Grenzen u und v zu der
zwischen den Grenzen v und w, dann erhält man natürlich die Fläche zwischen den Grenzen
u und w. Wir geben einen formalen Beweis mit Hilfe von Riemannsummen.
Satz 4.7: ∫ Seien u, v und
im Definitionsintervall der Funktion f liegen.
∫ v w Zahlen,∫die
w
w
Dann gilt u f (x)dx = u f (x)dx + v f (x) dx, wobei die Existenz dieser Integrale vorausgesetzt wird.
Beweis: Sind zwei der Zahlen u, v und w gleich, dann folgt die gesuchte Gleichung sofort
Franz Hofbauer
51
aus den Definitionen. Wir nehmen daher an, dass diese drei Zahlen verschieden sind.
Sei zuerst u < v < w. Sei (Un )n≥1 eine Folge von Zerlegungen des Intervalls [u, v], deren
Gitterweite für n → ∞ gegen 0 konvergiert. Ebenso sei (Yn )n≥1 eine Folge von Zerlegungen des Intervalls [v, w], deren Gitterweite für n → ∞ gegen 0 konvergiert. Für n ≥ 1
sei An (f ) eine Riemannsumme von f zur Zerlegung Un und Bn (f ) eine Riemannsumme
∫v
von f zur Zerlegung Yn . Mit Hilfe von Satz 4.4 folgt limn→∞ An (f ) = u f (x)dx und
∫w
limn→∞ Bn (f ) = v f (x) dx. Für n ≥ 1 sei Zn = Un ∪ Yn und Cn (f ) = An (f ) + Bn (f ).
Dann ist Zn eine Zerlegung des Intervalls [u, w] und Cn (f ) eine Riemannsumme von f
zur Zerlegung Zn . Für n → ∞ konvergiert
die Gitterweite der Zerlegungen Zn gegen 0.
∫w
Aus Satz 4.4 folgt limn→∞ Cn (f ) = u f (x)dx. Lässt man n in der Gleichung Cn (f ) =
∫w
∫v
∫w
An (f ) + Bn (f ) gegen ∞ gehen, dann hat man u f (x)dx = u f (x) dx + v f (x)dx.
Liegen die Zahlen u, v und w in einer anderen Reihenfolge, so kann man das gewünschte
Resultat
Fall
v < u <∫w, dann haben
∫u
∫ wzurückführen. Gilt zum Beispiel
∫u
∫ w auf den bewiesenen
v
f (x)dx = v f (x)dx + u f (x)dx gezeigt. Wegen v f (x)dx = − u f (x)dx folgt
wir
∫v
∫w
∫w v
f (x) dx = − u f (x) dx + u f (x)dx, also die zu beweisende Gleichung.
v
Wir werden später beweisen, dass jede stetige Funktion integrierbar ist. Mit Hilfe dieses
Resultats zeigen wir zwei wichtige Sätze.
Satz 4.8 (Mittelwertsatz der Integralrechnung) Seien a und b verschiedene Punkte in R
und sei J = [a, b], wenn a < b, und J = [b, a], wenn b < a. Seien f und g stetige Funktionen
von J nach R und es gelte entweder g ≥ 0 oder g ≤ 0. Dann existiert ein c ∈ J mit
∫b
∫b
∫b
f
(t)g(t)dt
=
f
(c)
g(t)dt.
Insbesondere
eistiert
ein
c
∈
J
mit
f (t)dt = (b − a)f (c).
a
a
a
Beweis: Sei zuerst a < b und g ≥ 0. Da f : J → R stetig ist, existiert ein Punkt u ∈ J, in
dem f sein Minimum annimmt, und ein Punkt v ∈ J, in dem f sein Maximum annimmt.
Es gilt f (u) ≤ f (t) ≤ f (v) für alle t ∈ J. Wegen g ≥ 0 folgt f (u)g(t) ≤ f (t)g(t) ≤ f (v)g(t)
für alle t ∈ J und daraus wegen Satz 4.6 und a < b dann
∫b
∫b
∫b
(∗)
f (u) a g(t) dt ≤ a f (t)g(t) dt ≤ f (v) a g(t)dt
∫b
∫b
Gilt a g(t) dt = 0, dann auch a f (t)g(t) dt = 0 und man kann c ∈ J beliebig wählen.
/∫b
∫b
∫b
Gilt a g(t)dt ̸= 0, dann existiert ein c ∈ J mit f (c) = a f (t)g(t)dt a g(t)dt. Hat man
in (∗) Ungleichheit, dann gilt das für ein c zwischen u und v nach dem Zwischenwertsatz.
Hat man in (∗) eine Gleichheit, dann kann man c = u oder c = v wählen. Damit ist
∫b
∫b
f
(t)g(t)dt
=
f
(c)
g(t)dt für g ≥ 0 und a < b bewiesen ist.
a
a
∫a
Sei jetzt b < a und g ≥ 0. Es wurde gezeigt, dass ein c ∈ J existiert mit b f (t)g(t)dt =
∫a
∫b
∫b
∫b
f (c) b g(t)dt, das heißt − a f (t)g(t) dt = −f (c) a g(t)dt, woraus dann a f (t)g(t)dt =
∫b
f (c) a g(t)dt folgt. Damit ist der Satz für g ≥ 0 und Punkte a und b mit a ̸= b bewiesen.
Sei schließlich g ≤ 0 und a ̸= b. Dann gilt −g ≥ 0. Es wure gezeigt, dass ein c ∈ J existiert
∫b
∫b
∫b
∫b
mit a −f (t)g(t)dt = f (c) a −g(t)dt, woraus a f (t)g(t)dt = f (c) a g(t) dt folgt. Damit
ist der Satz vollständig bewiesen.
Die letzte Aussage ist der Spezialfall, wo g die konstante Funktion 1 ist.
Der zweite Satz ist der sogenannte Hauptsatz der Diﬀerential- und Integralrechnung,
der besagt, dass Integrieren die Umkehrung des Diﬀerenzierens ist.
Definition: Sei I ein oﬀenes Intervall und f : I → R eine Funktion. Eine Funktion
F : I → R heißt Stammfunktion von f , wenn die Ableitung F ′ von F gleich f ist.
52
Integration
Satz 4.9 (Hauptsatz der Diﬀerential- und Integralrechnung) Sei I ein oﬀenes Intervall,
das auch unbeschränkt sein kann, und f : I → R stetig. Dann hat f eine Stammfunktion.
Die Diﬀerenz zweier Stammfunktionen von f ist konstant. Für jede Stammfunktion F von
∫b
f und a und b in I gilt a f (y)dy = F (b) − F (a).
∫x
Beweis: Sei u ∈ I beliebig und G(x) = u f (t) dt für x ∈ I. Dieses Integral existiert, da
∫y
f stetig ist. Für x und y in I mit x ̸= y gilt G(y) − G(x) = x f (t) dt nach Satz 4.7.
Aus Satz 4.8 mit a = x und b = y folgt die Existenz einer Zahl c im Intervall mit
den Endpunkten x und y, sodass G(y) − G(x) = (y − x)f (c) gilt. Wir erhalten daher
limy→x G(y)−G(x)
= limy→x f (c) = f (x), da f stetig ist und mit y ja auch c gegen x gehen
y−x
muss. Also gilt G′ (x) = f (x), das heißt G ist eine Stammfunktion von f . Die Existenz
einer Stammfunktion ist somit bewiesen.
Sind F und F̃ zwei beliebige Stammfunktionen, dann gilt (F − F̃ )′ = f − f = 0 auf I.
Somit ist F − F̃ auf I konstant. Die Diﬀerenz zweier Stammfunktionen ist konstant.
Ist F eine beliebige Stammfunktion, dann gilt F = G + c für eine Konstante c. Daher gilt
∫a
∫b
∫b
F (b) − F (a) = G(b) − G(a) = u f (y) dy − u f (y)dy = a f (y) dy nach Satz 4.7.
Mit Hilfe dieses Satzes kann man leicht Stammfunktionen für verschiedene Funktionen
angeben. Ist f (x) = ex , dann ist F (x) = ex + c eine Stammfunktion von f für jedes
c ∈ R, da ja F ′ (x) = f (x) gilt. Ebenso erhält man für f (x) = sin x die Stammfunktionen
F (x) = − cos x + c und für f (x) = cos x die Stammfunktionen F (x) = sin x + c. Ist
r+1
f (x) = xr mit r ∈ R, dann erhält man F (x) = xr+1 + c für r ̸= −1 und F (x) = ln |x| + c
für r = −1 als Stammfunktionen, für r < 0 auf I = (0, ∞) oder auf I = (−∞, 0).
Beispiel:
Wir berechnen die Fläche unter einem Bogen der Sinuskurve. Gesucht ist also
∫π
sin x dx. Da − cos x eine Stammfunktion von sin x ist, hat dieses Integral nach Satz 4.9
0
den Wert − cos π + cos 0 = 2.
Aus den Rechenregeln für die Ableitung erhält man mit Hilfe von Satz 4.9 die wohl
wichtigsten Rechenregeln fürs Integral, nämlich die partielle Interation und die Substitutionsregel. Zuerst noch eine Definition.
Definition: Sei I ein oﬀenes Intervall. Eine Funktion f : I → R heißt stetig diﬀerenzierbar, wenn die Ableitung f ′ existiert und stetig ist.
Satz 4.10 (Partielle Integration) Seien f und g auf dem oﬀenen Intervall I stetig diﬀeren∫b
∫b
zierbar. Für a und b in I gilt a f ′ (x)g(x)dx = f (b)g(b) − f (a)g(a) − a f (x)g ′ (x)dx.
Beweis: Die Produktregel besagt (f g)′ = f ′ g + f g ′ . Integriert man von a bis b, so folgt
∫b
∫b
∫b
(f (x)g(x))′ dx = a f ′ (x)g(x)dx + a f (x)g ′ (x) dx. Da f g eine Stammfunktion von
a
∫b
(f g)′ ist, erhalten wir aus Satz 4.9, dass a (f (x)g(x))′ dx = f (b)g(b) − f (a)g(a) gilt.
b
Oft verwendet man die Schreibweise h(x)a = h(b) − h(a). Damit läßt sich die Formel
b ∫ b
∫b ′
für die partielle Integration so schreiben
f (x)g(x) dx = f (x)g(x) − f (x)g ′ (x)dx.
∫b
a
a
a
x ln x dx durch partielle Integration. Setzt man f ′ (x) = x,
b ∫ b 2
∫b
2
2
also f (x) = x2 , und g(x) = ln x, dann folgt a x ln x dx = x2 ln xa − a x2 x1 dx. Weiters
∫b
2
2 b
gilt a x2 dx = x4 a , da x4 eine Stammfunktion von x2 ist, wie man leicht nachprüft. Wir
∫b
2 b
2
2
2
erhalten a x ln x dx = x2 ln x − x4 a = b4 (2 ln b − 1) − a4 (2 ln a − 1).
Beispiel: Wir berechnen
a
Franz Hofbauer
53
Satz 4.11 (Substitutionsregel) Seien I und J oﬀene Intervalle und φ : I → J stetig
diﬀerenzierbar. Die Funktion f : J → R sei stetig und F sei eine Stammfunktion von f .
∫ φ(b)
∫b
Für a und b in I gilt dann φ(a) f (x)dx = F (φ(b)) − F (φ(a)) = a f (φ(t))φ′ (t) dt.
Beweis: Wir verwenden die Kettenregel (F ◦ φ)′ (t) = f (φ(t))φ′ (t). Integriert man von
∫b
a bis b, so folgt F (φ(b)) − F (φ(a)) = a f (φ(t))φ′ (t) dt aus Satz 4.9. Da F eine Stamm∫ φ(b)
funktion von f ist, gilt φ(a) f (x) dx = F (φ(b)) − F (φ(a)) wieder wegen Satz 4.9.
∫v x
Beispiel: Wir berechnen 0 √2x+1
dx mit Hilfe der Substitutionsregel. Zuerst muss man
√
herausfinden, welche Funktion in x man als neue Variable t wählt. Wir wollen 2x + 1
√
2
los werden, daher wählen wir t = 2x + 1. Daraus folgt x = t 2−1 . Das ist auch die
2
Funktion φ, also φ(t) = t 2−1 und daher φ′ (t) = t. Wir müssen a und b so bestimmen,
√
dass φ(a) = 0 und φ(b) = v gilt. Das kann man aus t = 2x + 1 berechnen, da dadurch
die Umkehrfunktion von φ gegeben
den Grenzen 0 und v läuft,
√ ist. Wenn x zwischen
√
dann läuft t zwischen den Grenzen 2 · 0 + 1 = 1√und 2v + 1. Setzt man das alles in die
∫v x
∫ 2v+1 t2 −1
Substitutionsregel ein, so folgt 0 √2x+1
dx = 1
2t t dt. Eine Stammfunktion des
√2v+1
∫
√
2
3
3
v
x
Integranden t 2−1 ist t6 − 2t . Wir erhalten 0 √2x+1
= v−1
dx = t −3t
2v + 1 − 13 .
6
3
1
Will man eine Stammfunktion einer Funktion f bestimmen, dann berechnet man F (t) =
f (x) dx, wobei a beliebig ist. Wegen Satz 4.9 ist das eine Stammfunktion
von f . Man
a
∫
erhält eine Stammfunktion F (x) auch als unbestimmtes Integral f (x)dx, das heißt man
rechnet das Integral aus, ohne danach Grenzen einzusetzen. Das ergibt dasselbe abgesehen
von der Konstanten, die durch das Einsetzen der unteren Grenze dazukommt. Aus dem
2
vorletzten Beispiel folgt, dass F (x) = x4 (2 ln x − 1) eine Stammfunktion von f (x) = x ln x
ist. Verwendet man die Substitutionsregel beim Berechnen eines unbestimmten Integrals,
dann erhält man die Stammfunktion als Funktion der neu eingeführten Variablen. Aus
3
x
dem letzten Beispiel folgt, dass t −3t
eine Stammfunktion von f (x) = √2x+1
ist, jedoch
6
√
in der neuen Variablen t. Durch
Zurücksubstituieren von t = 2x + 1 erhält man die
√
Stammfunktion F (x) = x−1
2x
+
1.
3
√
Enthält die zu integrierende Funktion den Ausdruck r2 − x2 , dann kann man die Substitution x = r sin t versuchen. Wir rechnen dazu zwei Beispiele.
∫r√
Beispiel: Wir wollen 0 r2 − x2 dx berechnen. Wir versuchen dieses Integral zu lösen,
indem wir x = φ(t) = r sin t substituieren. Da x zwischen den Grenzen 0 und r läuft,
läuft t zwischen den Grenzen 0 und π2 . Es gilt ja r sin 0 = 0 und r sin π2 = r. Wegen
∫r√
1 − sin2 t = cos2 t und φ′ (t) = r cos t folgt aus der Substitutionsregel 0 r2 − x2 dx =
∫π
∫ π2
2 2 1
r
cos
t
·
r
cos
t
dt
=
r
(1 + cos 2t)dt. Da 14 (2t + sin 2t) eine Stammfunktion von
0
0 2∫ √
2
2
2
r
1
r2 − x2 dx = r4 (π + sin π) − r4 (0 + sin 0) = r 4π .
2 (1 + cos 2t) ist, erhalten wir 0
∫r
Beispiel: Wir berechnen 0 (r2 − x2 )3/2 dx. Wir substituieren wieder x = φ(t) = r sin t.
Da x zwischen den Grenzen 0 und r läuft, läuft t zwischen den Grenzen 0 und π2 . Wegen
∫r
1 − sin2 t = cos2 t und φ′ (t) = r cos t folgt aus der Substitutionsregel 0 (r2 − x2 )3/2 dx =
∫π
∫ π2 3
1
r | cos t|3 · r cos t dt = r4 02 cos4 t dt. Die Eulerformel ergibt cos4 t = 16
(eit + e−it )4 =
0
1
(e4it + 4e2it + 6 + 4e−2it + e−4it ) = 18 cos 4t + 12 cos 2t + 83 . Damit erhalten wir dann
π
∫16r 2
∫π
(r − x2 )3/2 dx = r4 2 1 cos 4t + 1 cos 2t + 3 dt = r4 ( 1 sin 4t + 1 sin 2t + 3 t) 2 = 3π r4 .
∫t
0
0
8
2
8
32
4
8
0
16
54
Integration
√
Beispiel: Als weiteres Beispiel bestimmen
wir
die
Stammfunktion
von
f
(x)
=
1 + x2 ,
√
∫
berechnen also das unbestimmte Integral
1 + x2 dx. Wir substituieren x = 21 (et − e−t ).
√
√
Es gilt 1 + x2 = 1 + 14 (e2t − 2 + e−2t ) = 21 (et + e−t ) und dx wird durch 21 (et + e−t )dt
∫
∫
ersetzt. Wir erhalten 41 (et + e−t )2 dt = 14 (e2t + 2 + e−2t )dt = 18 e2t + 21 t − 18 e−2t .
Damit ist die Stammfunktion bereits berechnet, allerdings als Funktion in t. Wir müssen t
wieder durch x ersetzen. Aus x = 12 (et − e−t ) erhält man durch Lösen einer quadratischen
√
√
Gleichung et = x + 1 + x2 . Da√et positiv ist, kommt die √
andere Lösung x − 1 + x2 nicht
in Frage. Es folgt e−t = −x + 1 + √
x2 und t = log(x + √ 1 + x2 ). Setzt man√das ein, so
1
erhält man die Stammfunktion 8 (x+ 1 + x2 )2 − 18 (−x+ 1 + x2 )2 + 12 log(x+ 1 + x2 ) =
√
√
1
1
2
1 + x2 ).
2 x 1 + x + 2 log(x +
2. Gleichmäßige Stetigkeit
In diesem Kapitel wird nur gezeigt, dass für stetige Funktionen f : [a, b] → R das Integral
∫b
f (x) dx existiert. Dazu benötigen wir den Begriﬀ der gleichmäßigen Stetigkeit.
a
Definition: Eine Funktion f : [a, b] → R heißt gleichmäßig stetig, wenn für jedes ε > 0
ein δ > 0 existiert, sodass für alle x und y in [a, b] mit |x − y| < δ sich die Funktionswerte
f (x) und f (y) um weniger als ε unterscheiden, das heißt |f (x) − f (y)| < ε erfüllt ist.
Der Unterschied zur Stetigkeit besteht darin, dass δ nur von ε, nicht aber von x abhängt.
Satz 4.12: Jede stetige Funktion f : [a, b] → R ist gleichmäßig stetig.
Beweis: Wir führen den Beweis indirekt. Wir nehmen an, dass f nicht gleichmäßig stetig
ist. Es gibt somit ein ε > 0, sodass für jedes δ > 0 die in der Definition der gleichmäßigen
Stetigkeit genannte Eigenschaft nicht gilt. Zu δ = n1 existieren also Punkte xn und yn
in [a, b], sodass zwar |xn − yn | < n1 , aber |f (xn ) − f (yn )| ≥ ε gilt. Nach dem Satz
von Bolzano-Weierstraß existiert eine konvergente Teilfolge (xnk )k≥1 von (xn )n≥1 , deren
Grenzwert x in [a, b] liegt. Aus |xn − yn | < n1 folgt xnk − n1k ≤ ynk ≤ xnk + n1k für alle
k ≥ 1, sodass limk→∞ ynk = x gilt. Die Stetigkeit von f liefert limk→∞ f (xnk ) = f (x) und
limk→∞ f (ynk ) = f (x). Daraus folgt limk→∞ f (xnk ) − f (ynk ) = 0, was ein Widerspruch
dazu ist, dass |f (xn ) − f (yn )| ≥ ε für alle n ≥ 1 gilt. Damit ist der Satz bewiesen.
Jetzt können wir bereits die Existenz des Integrals zeigen.
Satz 4.13: Für eine stetige Funktion f : [a, b] → R existiert das Integral
∫b
a
f (x)dx.
ε
Beweis: Sei ε > 0 vorgegeben. Wir setzen γ = 2(b−a)
> 0. Nach Satz 4.12 existiert
γ
ein δ > 0, sodass |f (x) − f (y)| < 2 für alle x und y in [a, b] mit |x − y| < δ gilt. Sei
Z = {x0 , x1 , . . . , xn } eine Zerlegung des Intervalls [a, b] mit Gitterweite kleiner als δ.
Wegen Satz 3.7 (c) existieren Punkte x und y in [xj−1 , xj ] mit f (x) − γ4 < inf [xj−1 ,xj ] f
und f (y) + γ4 > sup[xj−1 ,xj ] f . Wegen |x − y| ≤ xj − xj−1 < δ folgt |f (x) − f (y)| < γ2
und daher auch sup[xj−1 ,xj ] f − inf [xj−1 ,xj ] f < f (y) − f (x) + γ2 < γ. Wir erhalten daraus
∑n
OZ (f ) − UZ (f ) ≤ j=1 γ(xj − xj−1 ) = γ(b − a) < ε. Wegen O(f ) ≤ OZ (f ) und U (f ) ≥
UZ (f ) folgt O(f ) − U (f ) < ε. Da auch O(f ) ≥ U (f ) gilt und ε > 0 beliebig klein gewählt
werden kann, ist O(f ) = U (f ) gezeigt, das heißt f ist integrierbar.
Franz Hofbauer
55
3. Anwendungen des Integrals
Die naheliegendste Anwendung des Integrals ist die Berechnung von Flächen. Es wurde
∫b
ja so definiert, dass a f (x)dx die Fläche zwischen dem Graph der Funktion f und der
x-Achse in den Grenzen von a bis b angibt. Wir berechnen die Fläche einer Ellipse.
2
2
Beispiel: Wir berechnen die Fläche der Ellipse mit der Gleichung xa2 + yb2 = 1. Ein
√
Viertel davon ist die Fläche zwischen x-Achse und der Funktion f (x) = ab a2 − x2 auf
∫a√
dem Intervall [0, a]. Diese Fläche ist daher ab 0 a2 − x2 dx. Dieses Integral wurde im
2
letzten Kapitel berechnet und hat den Wert a4π . Ein Viertel der Ellipsenfläche ist also
abπ
4 und die gesamte Ellipsenfläche ist abπ.
Eine weitere Anwendung des Integrals sind Volumsberechnungen. Sei Ex die Ebene im
R3 durch den Punkt (x, 0, 0), die senkrecht auf die x-Achse steht. Der Körper, dessen
Volumen V wir berechnen wollen, liege im R3 zwischen den Ebenen Ea und Eb . Für
x ∈ [a, b] sei u(x) die Fläche des Schnittes der Ebene Ex mit dem Körper. Wir nehmen
an, dass u : [a, b] → R eine stetige Funktion ist. Sei a = x0 < x1 < · · · < xn = b eine
beliebige Zerlegung des Intervalls [a, b]. Sei Vj das Volumen des Teils des Körpers, der
zwischen den Ebenen Exj−1 und Exj liegt. Die stetige Funktion u nimmt im Intervall
[xj−1 , xj ] in einem Punkt p ihr Minimum und in einem Punkt q ihr Maximum an. Es
gilt (xj − xj−1 )u(p) ≤ Vj ≤ (xj − xj−1 )u(q), sodass nach dem Zwischenwertsatz ein
ξj ∈ [x
, xj ] existiert,
für das Vj = (xj − xj−1 )u(ξj ) gilt. Daraus erhalten wir dann
∑j−1
∑n
n
V = j=1 Vj = j=1 (xj − xj−1 )u(ξj ). Lässt man jetzt die Gitterweite der Zerlegung
gegen 0 gehen, dann geht diese Summe gegen das entsprechende Integral, sodass
∫ b
V =
u(x) dx
a
eine Formel für das Volumen des Körpers ist.
Beispiel: Wir berechnen das Volumen V eines Kegels, dessen Höhe h ist und dessen
Grundfläche eine beliebige ebene Figur mit Fläche G ist. Wir legen diesen Kegel in den
R3 , sodass die Spitze im Koordinatenursprung und die Grundfläche in der Ebene Eh liegt.
Aus dem Strahlensatz folgt, dass die Fläche u(x) des Schnittes der Ebene Ex mit diesem
∫h
∫h
∫h
Kegel gleich ( hx )2 G ist. Es folgt V = 0 u(x) dx = 0 ( hx )2 G dx = hG2 0 x2 dx = Gh
3 .
2
Eine quadratische Pyramide mit Grundkante a und mit Höhe h hat dann das Volumen a3h .
Ein Kegel mit kreisförmiger Grundfläche vom Radius r und mit Höhe h hat das Volumen
r 2 πh
3 .
2
2
2
Beispiel: Wir berechnen das Volumen des Ellipsoids mit der Gleichung xa2 + yb2 + zc2 = 1.
Dieses Ellipsoid liegt zwischen den Ebenen E−a und Ea . Für −a < x < a ist der Schnitt
2
2
2
2
von Ex mit dem Ellipsoid die Ellipse mit der Gleichung yb2 + zc2 = a a−x
, das heißt
2
a2 y 2
b2 (a2 −x2 )
a2 z 2
c2 (a2 −x2 )
= 1. Sie hat die Fläche u(x) = π abc2 (a2 − x2 ). Das Volumen des
∫a
∫a
3 a
Ellipsoids ist daher −a u(x) dx = π abc2 −a a2 − x2 dx = π abc2 (a2 x − x3 )−a = 43 πabc.
+
Ein wichtiger Spezialfall obiger Volumsformel ist das Volumen eines Drehkörpers, der
durch die Rotation des Flächenstücks unter der stetigen Funktion f : [a, b] → R+ um
die x-Achse entsteht. Für x ∈ [a, b] ist die Fläche des Schnittes der Ebene Ex mit dem
56
Integration
Drehkörper gleich u(x) = πf (x)2 . Deshalb ist
∫ b
V =π
f (x)2 dx
a
die Formel für das Volumen des Drehkörpers.
Beispiel: Sei 0 ≤ a < b ≤ r. Wir berechnen das Volumen des Segments der Kugel
mit Mittelpunkt (0, 0, 0) und Radius r zwischen
den Ebenen Ea und Eb . Hier rotiert das
√
Flächenstück unter der Funktion f (x) = r2 − x2 mit x ∈ [a, b] um die x-Achse. Wir
∫b
3 b
3
3
erhalten V = π a r2 − x2 dx = π(r2 x − x3 )a = π(r2 (b − a) − b −a
3 )
Beispiel: Sei a > r. Wir berechnen das Volumen des Ringes (Torus), der durch die
Rotation des Kreises x2 + (y − a)2 =∫ r2 um √
die x-Achse entsteht.∫ Dieses Volumen
V ist
√
r
r
2
2
2
2
2
die Diﬀerenz der beiden Volumina π −r (a + r − x ) dx und π −r (a − r − x )2 dx.
∫r √
2
Wir erhalten also V = 4aπ −r r2 − x2 dx = 4aπ r 2π = 2ar2 π 2 .
Wir können auch das Volumen über einem sogenannten Normalbereich B ⊆ R2 unter
einer Funktion g : B → R+ bestimmen. Man nennt B einen Normalbereich, wenn ein
Intervall [a, b] und stetige Funktionen φ : [a, b] → R und ψ : [a, b] → R mit φ ≤ ψ
existieren, sodass B = {(x, y) ∈ R2 : a ≤ x ≤ b, φ(x) ≤ y ≤ ψ(x)} gilt. Die Fläche u(x)
des Schnittes der Ebene Ex mit dem Körper über B und unter g lässt sich dann durch das
∫ ψ(x)
Integral φ(x) g(x, y)dy berechnen. Wir erhalten also
∫ b
∫ ψ(x)
V =
u(x)dx mit u(x) =
g(x, y) dy
a
φ(x)
2
als Volumen über dem Gebiet B unter der Funktion g : R → R+ .
Wir können bei allen diesen Überlegungen die Rolle der Koordinaten vertauschen. Lässt
sich der Bereich B schreiben als B = {(x, y) ∈ R2 : c ≤ y ≤ d, ϱ(y) ≤ x ≤ χ(y)} für ein
Intervall [c, d] und stetige Funktionen ϱ : [c, d] → R und χ : [c, d] → R mit ϱ ≤ χ, dann
ergibt sich wie oben
∫ d
∫ χ(y)
V =
v(y) dy mit v(y) =
g(x, y)dx
c
ϱ(y)
2
als Volumen über dem Gebiet B unter der Funktion g : R → R+ .
Beispiel: Wir berechnen das Volumen über dem Rechteck B = [−1, 1] × [0, 2] unter der
∫2
∫2
Funktion g(x, y) = x + 3y + 1. Wir erhalten u(x) = 0 g(x, y)dy = 0 x + 3y + 1 dy =
2
1
∫1
∫1
u(x)dx =
xy + 3 y 2 + y = 2x + 6 + 2 = 2x + 8 und V =
2x + 8 dx = x2 + 8x =
2
0
9 − (−7) = 16.
−1
−1
−1
1
∫1
Man kann das auch so ausrechnen v(y) = −1 x + 3y + 1 dx = 12 x2 + 3yx + x−1 =
2
∫2
∫2
3y + 23 − (−3y − 12 ) = 6y + 2 und V = 0 v(y)dy = 0 6y + 2 dy = 3y 2 + 2y 0 = 12 + 4 = 16.
Beispiel: Sei g(x, y) = 2x + 3y und B die Fläche zwischen den Parabeln y 2 = x und
y 2 = 4(x − 3). Gesucht ist das Volumen über B und unter g. Die erste der Parabeln hat
Scheitel (0, 0), die zweite (3, 0). Sie schneiden einander in den Punkten (4, 2) und (4, −2).
Wir erhalten für B den Normalbereich {(x, y) ∈ R2 : −2 ≤ y ≤ 2, y 2 ≤ x ≤ 14 y 2 + 3}. Es
1 y2 +3
∫ 1 y2 +3
gilt v(y) = y42
= ( 14 y 2 + 3)2 + 3y( 14 y 2 + 3) − y 4 − 3y 3 =
2x + 3y dx = (x2 + 3xy)y42
Franz Hofbauer
57
∫2
1 4
3 2
3 3
15 4
9 3
3 2
4
3
und V = −2 v(y)dy =
16 y + 2 y +9+ 4 y +9y −y −3y = − 16 y − 4 y + 2 y +9y +9
2
∫2
15 4
9 3
3 2
3 5
9 4
1 3
9 2
= −12+8+36 = 32.
−
y
−
y
+
y
+9y
+9
dy
=
−
y
−
y
+
y
+
y
+9y
16
4
2
16
16
2
2
−2
−2
Beispiel: Wir berechnen das Volumen des Schnittkörpers zweier Zylinder, die beide
Radius r haben und deren Achsen die x-Achse bzw. die y-Achse sind. Aus Symmetriegründen genügt es, den Teil des Schnittkörpers zu betrachten, der über der Fläche
B = {(x, y) : 0 ≤ x ≤ r, 0 ≤ y ≤ x} liegt. Das ist ein Sechzehntel des
√ Schnittkörpers.
Oberhalb von B wird der∫Schnittkörper durch
die
Funktion
g(x,
y)
=
r2 − x2 begrenzt.
√
√
∫x√
x
x
2
2
2
2
Wir berechnen u(x) = 0 g(x, y) dy = 0 r − x dy = y r − x 0 = x r2 − x2
r
∫r √
∫r
und V = 0 u(x)dx = 0 x r2 − x2 dx = − 13 (r2 − x2 )3/2 0 = 13 r3 . Das Volumen des
3
Schnittkörpers ist daher 16
3 r .
Als weitere Anwendung des Integrals bestimmen wir die Bogenlänge des Graphen einer
Funktion. Sei f : [a, b] → R stetig und auf (a, b) stetig diﬀerenzierbar. Wir approximieren
den Graph von f durch einen Polygonzug. Sei a = x0 < x1 < · · · < xn = b eine beliebige
Zerlegung des
Intervalls [a, b]. Die Länge des Polygonzugs durch die Punkte (xj , f (xj )) ist
∑n √
dann j=1 (xj − xj−1 )2 + (f (xj ) − f (xj−1 ))2 . Wegen des Mittelwertsatzes existiert für
jedes j ein ξj ∈ [xj−1 , xj ] mit xjj −xj−1j−1 = f ′ (ξj ). Daher ist die Länge des Polygonzuges
∑n √
gleich j=1 1 + f ′ (ξj )2 (xj − xj−1 ). Die Bogenlänge L der Kurve ist der Grenzwert der
Längen der Polygonzüge, wenn die Gitterweite der Zerlegung gegen 0 √
geht. Die Längen
der Polygonzüge sind aber Riemannsummen für die stetige Funktion 1 + f ′ (x)2 . Der
Grenzwert ist daher das entsprechende Integral. Wir erhalten
∫ b√
1 + f ′ (x)2 dx
L=
f (x )−f (x
)
a
als Formel für die Bogenlänge der Kurve, die durch den Graph von f gegeben ist.
Beispiel: Durch f (x) = p2 x2 ist eine Parabel gegeben. Wir berechnen die Länge des
∫c√
Parabelstücks mit 0 ≤ x ≤ c. Wegen f ′ (x) = px ergibt sich L = 0 1 + p2 x2 dx aus
∫ pc √
obiger Formel. Führt man die neue Variable t = px ein, so hat man L = 0
1 + x2 p1 dx.
√
√
Nach einem früheren Beispiel ist G(x) = 12 x 1 + x2 + 12 log(x + 1 + x2 ) eine Stammfunk√
√
√
1
tion von 1 + x2 . Es folgt L = p1 (G(pc) − G(0)) = 2c 1 + p2 c2 + 2p
log(pc + 1 + p2 c2 ).
4. Verallgemeinerte Riemannsummen
Um noch andere Anwendungen des Integrals behandeln zu können, brauchen wir eine
verallgemeinerte Form von Riemannsummen. Es gilt folgender Satz.
Satz 4.14: Seien f und g stetige Funktionen von [a, b] nach R. Sei (Zn )n≥1 eine Folge
von Zerlegungen des Intervalls
∑m [a, b], deren Gitterweite für n → ∞ gegen 0 konvergiert.
Für jedes n ≥ 1 sei Bn = j=1 f (ξj )g(ηj )(xj − xj−1 ), wobei wir Zn = {x0 , x1 , . . . , xm }
gesetzt haben und ξj und ηj beliebig im Intervall [xj−1 , xj ] gewählt werden. Es gilt dann
∫b
limn→∞ Bn = a f (x)g(x)dx.
Beweis:
∑mDa f stetig ist, existiert ein c mit |f (x)| ≤ c für alle x ∈ [a, b]. Für n ≥ 1 sei
An = j=1 f (ξj )g(ξj )(xj − xj−1 ), eine Riemannsumme zur Zerlegung Zn für f g.
Wir zeigen limn→∞ Bn − An = 0. Dazu sei ε > 0. Da g stetig ist, existiert wegen Satz 4.12
ε
gilt für alle x und y in [a, b] mit |x − y| < δ.
ein δ > 0, sodass |g(x) − g(y)| < c(b−a)
58
Integration
Weiters sei n0 so gewählt, dass Zn für n ≥ n0 Gitterweite < δ hat. Für n ≥ n0 ergibt
ε
sich dann |g(ξj ) − g(ηj )| < c(b−a)
, da ja |ξj − ηj | ≤ |xj − xj−1 | < δ gilt, sodass wir
(
)
∑m
∑m
|Bn −An | = | j=1 f (ξj ) g(ξj )−g(ηj ) (xj −xj−1 )| ≤ j=1 |f (ξj )| ·|g(ξj )−g(ηj )|(xj −xj−1 )
∑m
ε
ε
< j=1 c c(b−a)
(xj − xj−1 ) = c c(b−a)
(b − a) = ε erhalten. Für jedes ε > 0 existiert somit
ein n0 , sodass |Bn − An | < ε für alle n ≥ n0 gilt. Damit ist limn→∞ Bn − An = 0 gezeigt.
∫b
Da f g stetig und damit integrierbar ist, folgt limn→∞ An = a f (x)g(x)dx aus Satz 4.4.
∫b
Wir erhalten dann auch limn→∞ Bn = limn→∞ An + limn→∞ Bn − An = a f (x)g(x)dx
und der Satz ist bewiesen.
Wir verwenden Satz 4.14, um eine Formel für die Mantelfläche eines Drehkörpers zu
finden. Sei f : [a, b] → R+ stetig und auf (a, b) stetig diﬀerenzierbar. Der Graph von
f rotiert um die x-Achse. Wir berechnen die dadurch entstehende Oberfläche, die Mantelfläche des Drehkörpers. Wie bei der Berechnung der Bogenlänge approximieren wir den
Graph von f durch einen Polygonzug und lassen den Polygonzug um die x-Achse rotieren.
Sei a = x0 < x1 < · · · < xn = b eine beliebige Zerlegung des Intervalls [a, b]. Die Fläche,
die entsteht,√wenn die Strecke von (xj−1 , f (xj−1 )) nach (xj , f (xj )) um die x-Achse rotiert,
ist 2πf (ηj ) (xj − xj−1 )2 + (f (xj ) − f (xj−1 ))2 für ein ηj im Intervall [xj−1 , xj ]. Wegen
√
√
des Mittelwertsatzes gilt (xj − xj−1 )2 + (f (xj ) − f (xj−1 ))2 = 1 + f ′ (ξj )2 (xj − xj−1 )
für ein ξj ∈ [xj−1 , xj ].
√Daher ist die Fläche, die durch Rotation des Polygonzuges entsteht,
∑n
gleich 2π j=1 f (ηj ) 1 + f ′ (ξj )2 (xj −xj−1 ). Die Mantelfläche M ist der Grenzwert dieser
Summe, wenn die Gitterweite der Zerlegung gegen 0 geht. Wegen Satz 4.14 erhalten wir
∫ b
√
M = 2π
f (x) 1 + f ′ (x)2 dx
a
als Formel für die Mantelfläche, die durch Rotation des Graphen von f entsteht.
Beispiel: Wir berechnen die Mantelfläche M eines Kegels mit Radius r und Höhe h.
Diese entsteht, wenn der Graph der Funktion f (x) = hr x mit x ∈ [0, h] um die x-Achse
rotiert. Wir berechnen die Ableitung f ′ (x) = hr . Aus obiger Formel erhalten wir dann
h
√
√
∫h √
2√
M = 2π 0 hr x 1 + ( hr )2 dx = 2π hr x2 1 + ( hr )2 0 = πr h2 + r2 . Oft wird h2 + r2 mit
s bezeichnet, sodass sich die Formel M = πrs für die Mantelfläche ergibt.
Beispiel: Wir berechnen
des Graphen
√ die Kugeloberfläche. Sie entsteht durch Rotation
′
2
2
der Funktion f (x) = r − x mit x ∈ [−r, r] um die x-Achse. Es gilt f (x) = √r−x
.
2 −x2
r
∫r √
r
2
Aus obiger Formel folgt dann M = 2π −r r2 − x2 √r2 −x2 dx = 2πrx−r = 4πr .
Seien f und g stetige Funktionen von [a, b] nach R, sodass f (x) ≤ g(x) für alle x ∈ [a, b]
gilt. Wir suchen eine Formel für den Schwerpunkt des Flächenstücks, das von den Graphen
der Funktionen f und g und den beiden senkrechten Geraden x = a und x = b begrenzt
wird. Sei s die x-Koordinate des Schwerpunkts. Unterstützt man das Flächenstück durch
die Gerade x = s, dann darf es weder nach der einen noch nach der anderen Seite kippen.
Das Drehmoment, das durch die Schwerkraft bewirkt wird, muss gleich null sein.
Sei a = x0 < x1 < · · · < xn = b eine Zerlegung des Intervalls [a, b]. Das Drehmoment,
das durch den Streifen zwischen den senkrechten Geraden x = xj−1 und x = xj bewirkt
wird, ist gleich dem Produkt des Flächeninhalts des Streifens und des mit einem Vorzeichen
versehenen Abstands seines Schwerpunktes von der Geraden x = s. Dieses Produkt ist
gleich (g(ξj ) − f (ξj ))(xj − xj−1 )(ηj − s), wobei∑
ηj und ξj in [xj−1 , xj ] liegen. Als Drehmon
ment für die gesamte Fläche erhalten wir D = j=1 (ηj − s)(g(ξj ) − f (ξj ))(xj − xj−1 ). Da
Franz Hofbauer
59
man die Gitterweite der Zerlegung beliebig klein machen kann, folgt aus Satz 4.14, dass
∫b
D = a (x − s)(g(x) − f (x)) dx gilt. Setzt man das gleich null, so erhält man
/∫ b
∫ b
(
)
s=
x g(x)−f (x) dx
g(x)−f (x) dx
a
a
als x-Koordinate des Flächenschwerpunkts. Die y-Koordinate kann man berechnen, indem
man die y-Achse als x-Achse und die x-Achse als y-Achse auﬀasst.
Beispiel: Sei y = p − qx2 mit p > 0 und q > 0. Diese Gleichung stellt eine Parabel
mit Scheitel (0, p) dar. Wir berechnen den Schwerpunkt des Flächenstücks, das oberhalb
der x-Achse, rechts von der y-Achse und innerhalb der Parabel liegt, also zwischen den
2
Graphen
√ der Funktionen f (x) = 0 und g(x) = p − qx und den Grenzen a = 0 und
b = pq . Die x-Koordinate des Schwerpunkts ergibt sich aus obiger Formel. Wir erhalten
√
√
√
∫ √p/q
∫ √p/q
px2
qx4 p/q
p2
qx3 p/q
2p
2
2
x(p−qx ) dx = 2 − 4 0
p−qx dx = px− 3 0
= 4q und 0
= 3 pq .
0
√
Die x-Koordinate des Schwerpunkts ist der Quotient dieser beiden Werte, also 83 pq .
Um die y-Koordinate des Schwerpunkts zu berechnen, fassen wir y als Variable auf
√ und
lassen die y-Achse die Rolle der x-Achse spielen. Die Parabelgleichung wird zu x = p−y
.
√q
Das Flächenstück liegt zwischen den Graphen der Funktionen f (y) = 0 und g(y) = p−y
q
und √
den Grenzen a = 0 und b = p. Um obige Formel zu verwenden, √
berechnen wir
∫p
∫√
0
p−y
pz 3
qz 5 0
4p2
p
2 2
√
dy
=
−2q
(p
−
qz
)z
dz
=
−2q(
−
)
=
y
q
3
5
15
q , wobei wir
0
p/q
p/q
√
√
√
∫ p p−y
3 p
2p
p
2
2 =
√
−
y)
z = p−y
substituiert
haben,
und
dy
=
(p
−
q
q
3 q
3
q . Der Quotient
0
0
dieser beiden Werte ist 2p
5 . Das ist die y-Koordinate des Schwerpunkts. Wir erhalten
√
p 2p
3
daher ( 8 q , 5 ) als Schwerpunkt des Parabelstücks.
Genauso wie für eine Fläche kann man auch die Schwerpunktskoordinaten eines Körpers
berechnen. Wir tun das für einen Drehkörper, der durch Rotation des Flächenstücks unter
dem Graph der stetigen Funktion f : [a, b] → R+ um die x-Achse entsteht. Der Schwerpunkt des Drehkörpers liegt auf der x-Achse. Seine x-Koordinate bezeichnen wir mit s.
Sei a = x0 < x1 < · · · < xn = b eine Zerlegung des Intervalls [a, b]. Das Drehmoment, das durch die Scheibe des Drehkörpers über dem Intervall [xj−1 , xj ] bezüglich der
Ebene x = s bewirkt wird, ist gleich dem Produkt des Volumens der Scheibe und des
mit einem Vorzeichen versehenen Abstands ihres Schwerpunktes von der Ebene x = s.
Es ist∑gleich (ηj − s)πf (ξj )2 (xj − xj−1 ), wobei ηj und ξj in [xj−1 , xj ] liegen. Daher ist
n
D = j=1 (ηj − s)πf (ξj )2 (xj − xj−1 ) das gesamte Drehmoment. Da man die Gitterweite
∫b
der Zerlegung beliebig klein machen kann, folgt D = π a (x − s)f (x)2 dx aus Satz 4.14.
Setzt man das gleich null, so erhält man
/∫ b
∫ b
2
s=
xf (x) dx
f (x)2 dx
a
a
als x-Koordinate des Schwerpunkts des Drehkörpers.
Beispiel: Wir berechnen den Schwerpunkt des Kegels mit Höhe h und Radius r. Diesen
erhält man, wenn die Fläche unter dem Graph der Funktion f (x) = hr x mit x ∈ [0, h] um
∫h
∫h
2
4 h
2 2
die x-Achse rotiert. Wir berechnen 0 xf (x)2 dx = 0 x( hr x)2 dx = hr 2 x4 0 = r 4h und
60
Integration
∫h
2
2
3 h
f (x)2 dx = 0 ( hr x)2 dx = hr 2 x3 0 = r 3h . Daraus ergibt sich s = 34 h. Der Schwerpunkt
des Kegels liegt also bei einem Viertel der Höhe über der Grundfläche.
∫h
0
5. Uneigentliche Integrale
Wir haben bisher Integrale nur für beschränkte Funktionen auf abgeschlossenen Intervallen definiert. Ist das Integrationsintervall unbeschränkt, oder hat die zu integrierende
Funktion eine Polstelle, dann spricht man von uneigentlichen Integralen. Diese definiert
man durch Grenzwerte.
Der Einfachheit halber behandeln wir nur ∫Funktionen mit Werten∫ in [0, ∞). Für eine
n
∞
Funktion f : [a, ∞) → [0, ∞) definieren wir a f (x) dx = limn→∞ a f (x)dx. Für eine
∫b
∫b
Funktion f : (−∞, b] → [0, ∞) definieren wir −∞ f (x)dx = limn→∞ −n f (x) dx. Für eine
∫n
∫∞
Funktion f : (−∞, ∞) → [0, ∞) definieren wir −∞ f (x)dx = limn→∞ −n f (x)dx. Dabei
wird die Existenz der Grenzwerte und der Integrale auf der rechten Seite vorausgesetzt.
∫∞
−α+1
x−α dx für α > 0. Für α ̸= 1 ist x 7→ x−α+1
∫n
1−α n
1−α
1
eine Stammfunktion von x 7→ x−α . Es folgt 1 x−α dx = x1−α 1 = n1−α − 1−α
. Für α < 1
∫ ∞ −α
erhält man ∞, wenn n gegen ∞ geht. In diesem Fall existiert das Integral 1 x dx nicht.
∫∞
1
1
Für α > 1 erhält man α−1
, wenn n gegen ∞ geht. In diesem Fall gilt 1 x−α dx = α−1
.
−α
Es
der Fall α = 1. Eine Stammfunktion
von x 7→ x
ist x 7→ ln x. Es folgt
∫ n bleibt
∫ ∞ −1
−1
x
dx
=
ln
n,
sodass
das
Integral
x
dx
nicht
existiert.
1
1
Beispiel: Wir berechnen das Integral
1
Ähnlich geht man bei Funktionen mit Polstelle vor. Für eine Funktion f : [a, b) → [0, ∞)
∫b
∫ b− 1
mit Polstelle bei b definieren wir a f (x)dx = limn→∞ a n f (x)dx. Für eine Funktion
∫b
∫b
f : (a, b] → [0, ∞) mit Polstelle bei a definieren wir a f (x) dx = limn→∞ a+ 1 f (x)dx.
n
Vorausgesetzt wird die Existenz der Grenzwerte und der Integrale auf der rechten Seite.
∫1
−α+1
x−α dx für α > 0. Für α ̸= 1 ist x 7→ x−α+1
∫1
1−α 1
1
1
eine Stammfunktion von x 7→ x−α . Es folgt 1 x−α dx = x1−α 1 = 1−α
− (1−α)n
1−α .
n
n
Für
α > 1 erhält man ∞, wenn n gegen ∞ geht. In diesem Fall existiert das Integral
∫ 1 −α
1
, wenn n gegen ∞ geht. In diesem Fall gilt
x dx nicht. Für α < 1 erhält man 1−α
∫01 −α
1
x dx = 1−α
. Es bleibt α = 1. Eine Stammfunktion von x 7→ x−1 ist x 7→ ln x. Es
0
∫1
∫ 1 −1
folgt 1 x dx = ln 1 − ln n1 = ln n, sodass das Integral 0 x−1 dx nicht existiert.
Beispiel: Wir berechnen das Integral
0
n
Es sei noch einmal darauf hingewiesen, dass wir uneigentliche Integrale nur für Funktionen mit Werten in [0, ∞) behandelt haben. Bei Funktionen, die sowohl positive als auch
negative Werte annehmen, muss man vorsichtiger vorgehen.
6. Approximation von Funktionen durch Polynome
Um die Exponentialfunktion, trigonometrische Funktionen, die Logarithmusfunktion
und andere berechnen zu können, muss man sie approximieren. Eine Möglichkeit ist die
Approximation durch Polynome. Wir beginnen mit dem Satz von Taylor, der zeigt wie
solche Polynome aussehen, und approximieren anschließend verschiedene Funktionen.
Franz Hofbauer
61
Satz 4.15 (Taylorformel) Sei I ein oﬀenes Intervall, das 0 enthält. Sei f : I → R eine
(n + 1)-mal stetig diﬀerenzierbare Funktion, das heißt, für k ≤ n + 1 existiert die k-te
Ableitung f (k) von f und f (n+1) ist stetig. Sei x ∈ I. Dann hat man die Formel
x
xn
f (x) = f (0) + f ′ (0) + · · · + f (n) (0)
+ Rn+1 (x)
1!
n!
∫ x (n+1)
1
f
(t)(x − t)n dt gilt. Außerdem existiert ein c mit 0 ≤ c ≤ x
wobei Rn+1 (x) = n!
0
oder x ≤ c ≤ 0, sodass Rn+1 (x) =
f (n+1) (c) n+1
(n+1)! x
gilt. Man nennt Rn+1 (x) das Restglied.
Beweis: Für x = 0 ist die Formel trivial. Sei daher x ∈ I \ {0} fest gewählt. Aus dem
Hauptsatz der Diﬀerential– und Integralrechnung folgt
∫x
f (x) = f (0) + 0 f ′ (t)dt
Da t ∫7→ −(x − t) eine Stammfunktion
1 ist, erhalten wir mit partieller Integration,
x ∫von
x ′
x ′′
′
dass 0 f (t) · 1dt = −f (t)(x − t) 0 + 0 f (t)(x − t)dt gilt. Daraus folgt
∫x
x
f (x) = f (0) + f ′ (0) 1!
+ 0 f ′′ (t) (x−t)
1! dt
2
Da t 7→ − (x−t)
eine Stammfunktion von t 7→ x−t
1! ist, erhalten wir mit partieller Integra∫ x2! ′′ (x−t)
∫
2 x
2
x
(x−t)
tion, dass 0 f (t) 1! dt = −f ′′ (t) 2! 0 + 0 f (3) (t) (x−t)
dt gilt. Daraus folgt
2!
∫
2
2
x
x
f (x) = f (0) + f ′ (0) 1!
+ f ′′ (0) x2! + 0 f (3) (t) (x−t)
dt
2!
Führt man diesen Schritt n Mal durch, so erhält man
n
x
f (x) = f (0) + f ′ (0) 1!
+ · · · + f (n) (0) xn! +
∫x
0
n
dt
f (n+1) (t) (x−t)
n!
Damit ist die Formel mit der ersten Version von Rn+1 (x) bewiesen.
Um die zweite Form von Rn+1 (x) zu zeigen, sei J = [0, x], wenn x > 0, und J = [x, 0],
n
wenn x < 0. Sei g(t) = (x−t)
n! . Dann gilt g ≥ 0 oder g ≤ 0 auf dem Intervall J.
Da f (n+1) als stetig vorausgesetzt wird, folgt aus Satz 4.8, dass ein c ∈ J existiert mit
∫x
∫x
xn+1
Rn+1 (x) = 0 f (n+1) (t)g(t)dt = f (n+1) (c) 0 g(t)dt = f (n+1) (c) (n+1)!
.
Um Funktionen durch Approximation mit Polynomen näherungsweise zu berechnen, ist
es notwendig, das Restglied abzuschätzen. Dazu beweisen wir folgenden Satz.
Satz 4.16: Sei a ̸= b und I das abgeschlossene Intervall mit Endpunkten a und b. Sei
∫b
∫b
f : I → R eine stetige Funktion. Dann gilt | a f (y)dy| ≤ a |f (y)|dy, wenn a < b ist, und
∫b
∫a
| a f (y) dy| ≤ b |f (y)| dy, wenn b < a ist.
Beweis: Da f stetig ist, ist auch |f | stetig. Somit sind beide Funktionen integrierbar.
Sei zuerst a < b. Es gilt f (y) ≤ |f (y)| und −f (y) ≤ |f (y)| für alle y ∈ I = [a, b]. Aus
∫b
∫b
∫b
∫b
∫b
Satz 4.6 folgt a f (y) dy ≤ a |f (y)| dy und − a f (y)dy ≤ a |f (y)|dy. Da | a f (y) dy|
∫b
∫b
∫b
∫b
entweder a f (y) dy oder − a f (y) dy ist, ist | a f (y)dy| ≤ a |f (y)| dy bereits gezeigt.
∫a
∫a
Sei jetzt b < a. Im vorherigen Absatz wurde | b f (y)dy| ≤ b |f (y)| dy bewiesen. Wegen
∫a
∫b
∫b
∫b
∫a
| b f (y) dy| = | − a f (y) dy| = | a f (y)dy| erhalten wir | a f (y)dy| ≤ b |f (y)| dy.
Beispiel: Wir entwickeln die Funktion ex für x ∈ R nach der Taylorformel aus Satz 4.15.
Da alle Ableitungen von ex wieder ex sind, erhalten wir
ex = 1 + x +
x2
2!
+
x3
3!
+ ··· +
xn
n!
+ Rn+1 (x) mit Rn+1 (x) =
wobei entweder 0 ≤ c ≤ x oder x ≤ c ≤ 0 gilt. Es folgt |Rn+1 (x)| ≤
n+1
ec
(n+1)! x
max(1,ex )
n+1
.
(n+1)! |x|
62
Integration
1
1
Für −1 ≤ x < 0 gilt |Rn+1 (x)| ≤ (n+1)!
. Bestimmt man n so, dass (n+1)!
< 10−6 gilt, dann
∑n
k
weiß man, dass k=0 xk! die Zahl ex auf 6 Dezimalstellen genau ergibt. Man erhält n = 9.
k
∑9
= 0.367879188712 . . . und somit 1e = 0.367879 auf 6 Dezimalstellen
Es gilt k=0 (−1)
k!
genau. Insbesondere hat man 1e > 13 , also e < 3. Das kann man verwenden, um |Rn+1 (x)|
für positive x abzuschätzen.
Beispiel: Wir entwickeln die Funktion f (x) = sin x für x ∈ R nach der Taylorformel.
Es gilt f ′ (x) = cos x, f ′′ (x) = − sin x, f ′′′ (x) = − cos x, f (4) (x) = sin x, f (5) (x) = cos x,
f (6) (x) = − sin x, und so weiter. Daraus erkennt man, dass f (k) (0) = 0 gilt, wenn k gerade
ist, und dass f (k) (0) abwechselnd +1 und −1 ist, wenn k ungerade ist. Daher folgt
sin x = x −
x3
3!
x5
5!
+
2n−1
x
sin c 2n
+ · · · + (−1)n−1 (2n−1)!
+ R2n (x) mit R2n (x) = (−1)n (2n)!
x
wobei entweder 0 ≤ c ≤ x oder x ≤ c ≤ 0 gilt. Es folgt |R2n (x)| ≤
1
2n
(2n)! |x| .
1
Es genügt, sin x für x ∈ (0, π2 ) zu berechnen. Für diese x gilt |R2n (x)| ≤ (2n)!
( π2 )2n .
∑n−1
x2k+1
1
Bestimmt man n so, dass (2n)!
( π2 )2n < 10−m gilt, dann gibt k=0 (−1)k (2k+1)!
den Wert
von sin x auf m Dezimalstellen genau an.
Um Entwicklungen für Logarithmus und Arcustangens zu finden, verwenden wir nicht
die Taylorformel, sondern gehen von folgender Gleichung aus, die für y ∈ (−1, 1) gilt
1
1−y
= 1 + y + y 2 + · · · + y n−1 +
yn
1−y
Sei −1 ≤ x < 1. Aus obiger Gleichung folgt dann für y ∈ (−1, 1)
1
1+y
+
1
1−y
=
2
1−y 2
2n
y
= 2(1 + y 2 + y 4 + · · · + y 2n−2 ) + 2 1−y
2
woraus man folgendes Resultat durch Integration von 0 bis x erhält
log
1+x
1−x
x3
3
= 2(x +
2n
+
x5
5
+ ··· +
x2n−1
2n−1 )
+ R2n+1 (x) mit R2n+1 (x) = 2
∫x
y 2n
0 1−y 2
dy
2n
y
x
Nun gilt | 1−y
2 | ≤ 1−x2 für alle y zwischen 0 und x. Aus Satz 4.16 und Satz 4.6 folgt dann
∫ x y2n
∫ x x2n
x2n
|R2n+1 (x)| ≤ 2 0 | 1−y
2 | dy ≤ 2 0 1−x2 dy = 2x 1−x2 im Fall x > 0, und |R2n+1 (x)| ≤
∫ 0 y2n
∫ 0 x2n
x2n
2 x | 1−y
2 |dy ≤ 2 x 1−x2 dy = −2x 1−x2 im Fall x < 0. Wir haben somit die Abschätzung
2n
x
|R2n+1 (x)| ≤ 2|x| 1−x
2 für alle x ∈ (−1, 1) erhalten.
1+x
Sei a > 1 beliebig. Wir setzen x = a−1
a+1 . Dann gilt 0 < x < 1 und a = 1−x . Man
1+x
kann dann obige Formel verwenden, um log a = log 1−x
auf eine bestimmte Anzahl von
Dezimalstellen zu berechnen.
Jetzt behandeln wir noch den Arcustangens. Da tan : (− π2 , π2 ) → R streng monoton
wachsend und stetig ist, existiert die Umkehrfunktion arctan : R → (− π2 , π2 ). Aus der
1
Formel für die Ableitung der Umkehrfunktion erhalten wir arctan′ x = 1+x
2.
Sei −1 ≤ x < 1. Aus obiger Formel mit −y 2 statt y ergibt sich
1
1+y 2
2n
y
= 1 − y 2 + y 4 − · · · + (−1)n−1 y 2n−2 + (−1)n 1+y
2
woraus man folgendes Resultat durch Integration von 0 bis x erhält
arctan x = x −
2n
x3
3
+
x5
5
−···+
(−1)n−1 x2n−1
2n−1
+ R2n+1 (x) mit R2n+1 (x) = (−1)n
∫x
y 2n
0 1+y 2
dy
y
2n
Nun gilt | 1+y
für alle y zwischen 0 und x. Aus Satz 4.16 und Satz 4.6 folgt wie
2| ≤ x
oben |R2n+1 (x)| ≤ |x| · x2n = |x|2n+1 für alle x ∈ (−1, 1).
Franz Hofbauer
63
Der arctan bietet die Möglichkeit, π zu berechnen. Es gilt π = 4(arctan 21 + arctan 13 ).
Das folgt aus der Formel tan(α + β) = (tan α + tan β)/(1 − tan α tan β), die man aus den
Summensätzen für sin und cos erhält. Setzt man α = arctan 12 und β = arctan 13 ein, so
ergibt sich tan(α + β) = ( 12 + 13 )/(1 − 12 · 13 ) = 1. Daraus folgt, dass α + β = π4 + kπ für
ein k ∈ Z gilt. Wegen α < arctan 1 = π4 und β < arctan 1 = π4 gilt α + β < π2 . Wegen
α > arctan 0 = 0 und β > arctan 0 = 0 gilt auch α + β > 0. Somit ist α + β = π4 , das heißt
π = 4(arctan 12 + arctan 31 ) gezeigt.
Die Berechnung von π ist auf die Berechnung von arctan 12 und arctan 13 zurückgeführt.
Diese kann man dann mit Hilfe obiger Entwicklung durchführen.
7. Reihen
Der Versuch, unendlich
∑∞ viele Zahlen ak ∈ R zu summieren,
∑nführt zur Definition von Reihen. Man schreibt k=0 ak . Für n ≥ 0 nennt man Sn = k=0 ak die n-te Partialsumme
der Reihe.
∑∞ Existiert der Grenzwert limn→∞ Sn und hat den Wert S, dann nennt man die
Reihe k=0 ak konvergent mit Summe S. Existiert limn→∞ Sn nicht, dann nennt man die
Reihe divergent.
∑∞
Das bekannteste Beispiel ist die geometrische Reihe. Das ist die Reihe k=0 q k für ein
q ∈ R. In diesem Fall kann man die Partialsummen direkt ausrechnen. Für n ≥ 0 gilt
n+1
Sn = 1−q
1−q , wenn q ̸= 1 ist, und Sn = n + 1, wenn q = 1 ist. Man sieht, dass die Reihe
1
. Wir
genau dann konvergiert, wenn |q| < 1 gilt. In diesem Fall hat man limn→∞ Sn = 1−q
∑∞ k
1
schreiben dann k=0 q = 1−q .
Kann man die Partialsummen nicht berechnen, dann sucht man nach ∑
Bedingungen,
n
unter denen die Reihe konvergiert. Man führt
∑∞ die Partialsummen S n = k=0 |ak | mit
Absolutbeträgen ein, und nennt die Reihe k=0 ak absolut konvergent, wenn die Folge
(S n )n≥0 konvergiert. Da die Folge (S n )n≥0 monoton
∑∞ wächst, ist sie genau dann konvergent,
wenn sie beschränkt ist. Man schreibt dann k=0 |ak | < ∞. Wir haben folgenden Satz
Satz 4.17: Eine absolut konvergente Reihe ist konvergent.
Beweis: Sei S = limn→∞ S n . Für n ≥ 0 sei Tn = S − S n . Es gilt limn→∞ Tn = 0 und
wegen S n ≤ S auch Tn ≥ 0. Für n ≥ 0 sei un = Sn − Tn und vn = Sn + Tn . Klarerweise
gilt dann Sn ∈ [un , vn ]. Weiters folgt un+1 = Sn + an+1 − Tn + |an+1 | ≥ Sn − Tn = un
und vn+1 = Sn + an+1 + Tn − |an+1 | ≤ Sn + Tn = vn , sodass [un+1 , vn+1 ] ⊆ [un , vn ] für
alle n ≥ 0 gilt. Schließlich haben wir auch vn − un = 2Tn für n ≥ 0. Wegen der Intervallschachtelungseigenschaft gibt es ein S, das in allen Intervallen [un , vn ] enthalten ist.
Wir zeigen limn→∞ Sn = S. Sei ε > 0 beliebig. Es gibt ein n0 mit 2Tn0 < ε. Wegen
S ∈ [un0 , vn0 ] folgt daraus [un0 , vn0 ] ⊆ (S − ε, S + ε). Wegen Sn ∈ [un , vn ] ⊆ [un0 , vn0 ] für
n ≥ n0 gilt auch Sn ∈ (S − ε, S + ε) für alle n ≥ n0 , das heißt limn→∞ Sn = S.
Es folgen Sätze, die Methoden angeben, mit denen man die Konvergenz oder Divergenz
einer Reihe nachprüfen kann.
∑∞
Satz 4.18: Wenn k=0 ak konvergiert, dann gilt limn→∞ an = 0.
∑n
Beweis: Sei Sn = k=0 ak . Nach Voraussetzung existiert S = limn→∞ Sn . Für n ≥ 1
gilt an = Sn − Sn−1 . Es folgt limn→∞ an = limn→∞ Sn − limn→∞ Sn−1 = S − S = 0.
∑∞
k
k
Es folgt sofort, dass k=0 k+1
nicht konvergiert, da limk→∞ k+1
nicht 0 ist.
64
Integration
∑∞
Satz 4.19: Es sei ak > 0 und bk > 0 für k ≥ 0. Wenn die ∑
Reihe k=0 bk konvergent und
∞
die Folge ( abkk )k≥0 beschränkt ist, dann ist auch die Reihe k=0 ak konvergent.
∑n
∑n
Beweis: Für n ≥ 0 sei Sn = k=0 ak und Tn = k=0 bk . Nach Voraussetzung gibt es
eine Konstante
∑∞ C mit ak ≤ Cbk für alle k ≥ 0, woraus Sn ≤ CTn für alle n ≥ 0 folgt. Da
die Reihe k=0 bk als konvergent vorausgesetzt wird, gilt limn→∞ Tn = T für ein T ∈ R.
Wegen bk > 0 ist die Folge (Tn )n≥0 monoton wachsend, woraus Tn ≤ T für alle n ≥ 0 folgt.
Somit gilt Sn ≤ CT für alle n ≥ 0 und da auch die Folge (Sn )n≥0
monoton wachsend ist,
∑∞
hat sie auch einen Grenzwert, womit die Konvergenz der Reihe k=0 ak gezeigt ist.
Dieser Satz gilt natürlich genauso, wenn die Summation
∑∞ nicht bei 0 beginnt, sondern bei
1 oder sonst irgendwo. Wir untersuchen die Reihe k=0 ak mit ak = 2kk . Sei bk = ( 23 )k .
Dann gilt limk→∞ abkk = limk→∞ ( 4k)k = 0, sodass die Folge ( abkk )k≥0 beschränkt ist. Da
3
∑∞
∑∞
b
eine
konvergente
geometrische
Reihe ist, ist auch k=0 ak konvergent.
k=0 k
Satz∑4.20: Sei f : [1, ∞) → (0, ∞) eine monoton fallende Funktion. Dann sind äquivalent
∞
(a) ∫ k=1 f (k) ist konvergent
∞
(b) 1 f (x) dx existiert
∫ k+2
Beweis: Um (a) ⇒ (b) zu zeigen, sei ak = k+1 f (x) dx und bk = f (k + 1) für k ≥ 0.
∑∞
Es gilt abkk ≤ 1 für k ≥ 0, da f monoton fallend ist. Da wir (a) voraussetzen, ist k=0 bk
∫∞
∑∞
konvergent. Wegen Satz 4.19 ist dann auch k=0 ak konvergent, das heißt 1 f (x)dx =
∫ n+2
∑n
limn→∞ 1
f (x) dx = limn→∞ k=0 ak existiert und (b) ist gezeigt.
∫ k+2
Um (b) ⇒ (a) zu zeigen, sei ak = f (k + 2) und bk = k+1 f (x) dx für k ≥ 0. Es gilt abkk ≤ 1
∑∞
für k ≥ 0, da f monoton fallend ist. Da wir (b) voraussetzen, ist k=0 bk konvergent
∫ n+2
∫∞
∑n
wegen limn→∞ k=0 bk = limn→∞ 1
f (x)dx = 1 f (x)dx. Nach Satz 4.19 ist dann
∑∞
∑∞
∑∞
k=0 ak konvergent, also auch
k=1 f (k) = f (1) +
k=0 ak , womit (a) gezeigt ist.
∑∞
Beispiel: Wir untersuchen die Konvergenz der Reihen k=1 k1α für α > 0. Das ist die
∑∞
Reihe k=1 f (k), wenn wir die Funktion f : [1, ∞) → (0, ∞) durch f (x) = x1α definieren.
Man
∫ ∞ sieht, dass f monoton fällt. Aus einem früheren Beispiel wissen wir, dass das Integral
f (x) dx existiert, wenn α > 1 ist, und nicht existiert, wenn α ≤ 1 ist. Aus Satz 4.20
1
∑∞
folgt dann, dass die Reihe k=1 k1α konvergiert, wenn α > 1 ist, und nicht konvergiert,
wenn α ≤ 1 ist.
∑∞
Beispiel: Die Reihe k=2 log1 k ist divergent. Es gilt log k ≤ k, sodass die Folge ( abkk )k≥2
∑∞
mit ak = k1 und bk = log1 k beschränkt ist. Wäre k=2 bk konvergent, dann müsste nach
∑∞
Satz 4.19 auch k=2 ak konvergent sein im Widerspruch zum letzten Beispiel.
Hilfe von Reihen ist es möglich, Funktionen zu definieren. Wir haben Polynome
∑Mit
n
k
c
definiert werden. Eine naheliegende
k=0 k x kennen gelernt, durch die Funktionen auf
∑R
∞
Verallgemeinerung sind sogenannte Potenzreihen k=0 ck xk , die man erhält, indem man
die Summe einfach bis ∞ laufen lässt. Allerdings muss man sich zuerst klar machen, für
welche x ∈ R eine Potenzreihe konvergiert. Dazu definieren wir den Limes superior einer
Folge.
Definition: Sei (ak )k≥0 eine beschränkte Folge. Für n ≥ 0 sei an = sup{ak : k ≥ n}.
Dann heißt limn→∞ an der Limes superior der Folge (ak )k≥0 . Er wird mit lim supk→∞ ak
bezeichnet.
Franz Hofbauer
65
Satz 4.21: Sei (ak )k≥0 eine beschränkte Folge. Dann existiert lim supk→∞ ak . Wenn
limk→∞ ak existiert, dann gilt lim supk→∞ ak = limk→∞ ak .
Beweis: Da (ak )k≥0 beschränkt ist, existieren Konstante c und d mit c ≤ ak ≤ d für
alle k ≥ 0. Für n ≥ 0 sei Mn = {ak : k ≥ n}. Da d eine obere Schranke der Menge
Mn ist, existiert an = sup Mn . Für n ≥ 0 gilt Mn+1 ⊆ Mn , also auch an+1 ≤ an wegen
Satz 3.6 (b). Die Folge (an )n≥0 ist somit monoton fallend. Für jedes n ≥ 0 ist c eine untere
Schranke von Mn und somit gilt c ≤ an nach Satz 3.6 (a). Also ist die Folge (an )n≥0 auch
nach unten durch c beschränkt. Aus Satz 3.4 folgt, dass limn→∞ an existiert, womit die
Existenz von lim supk→∞ ak gezeigt ist.
Es existiere a = limk→∞ ak . Sei ε > 0. Es gibt ein n0 mit a − 2ε < ak < a + 2ε für alle
k ≥ n0 . Für n ≥ n0 gilt dann Mn ⊆ (a − 2ε , a + 2ε ), das heißt a − 2ε ist eine untere und
a + 2ε ist eine obere Schranke von Mn . Wegen Satz 3.6 (a) folgt a − 2ε ≤ an ≤ a + 2ε für
n ≥ n0 . Wir haben |an − a| < ε für alle n ≥ n0 gezeigt. Somit gilt limn→∞ an = a, das
heißt lim supk→∞ ak = a.
√
∑∞
Definition: Sei k=0 ck xk eine Potenzreihe. Ist die Folge ( k |c√
k |)k≥1 nicht beschränkt,
k
dann sei T = ∞. Ist sie beschränkt, dann sei T = lim supk→∞ |ck |. Wir nennen dann
die Zahl R = T1 , die in [0, ∞] liegt, den Konvergenzradius der Potenzreihe.
∑∞
k
< R, dann
Satz 4.22: Sei
∑∞ k=0 ckk x eine Potenzreihe mit Konvergenzradius R. Gilt |x| ∑
∞
ist die Reihe k=0 ck x absolut konvergent. Gilt |x| > R, dann ist die Reihe k=0 ck xk
divergent.
√
Beweis: Für n ≥ 0 sei Mn = { k |ck | : k ≥ n} und an = sup Mn .
∑∞
Sei |x| > R. Angenommen k=0 ck xk ist konvergent.
Dann gilt limk→∞ ck xk = 0 nach
√
1
für k ≥ n0 . Insbesondere ist
Satz 4.18. Es gibt ein n0 mit |ck xk | ≤ 1, das heißt k |ck | ≤ |x|
√
√
k
k
die Folge ( |ck | )k≥1 beschränkt, sodass T = lim supk→∞ |ck | = limn→∞ an existiert.
1
1
1
Für n ≥ n0 ist |x|
eine obere Schranke von Mn , sodass auch an ≤ |x|
gilt. Es folgt T ≤ |x|
,
∑
∞
1
1
ein Widerspruch zu |x| < R = T . Damit ist die Divergenz von k=0 ck xk gezeigt.
Sei |x| < R. Insbesondere gilt R > 0 und T < ∞. Sei s ∈ (|x|, R), das heißt 1s > T . Wegen
√
T = limn→∞ an existiert ein n0 mit an0 < 1s , das heißt k |ck | < 1s für k ≥ n0 , da an0 eine
obere Schranke der Menge Mn0 ist. Sei q = |x|
. Dann gilt |ck xk | < q k für k ≥ n0 . Somit
( |ck xk | )
( s |c1 x| |c2 x2 |
)
|cn0 xn0 |
ist die Folge
durch
C
=
max
|c
|,
,
,
.
.
.
,
,
1
beschränkt. Da
n
2
0
k
q
q
q
k≥0
∑∞ k
∑q∞0
k
Konvergenz von k=0 |ck x | aus Satz 4.19.
k=0 q wegen q < 1 konvergiert,
∑∞folgt die
k
Das zeigt, dass die Potenzreihe k=0 ck x absolut konvergent ist.
Durch Potenzreihen kann man Funktionen definieren, wobei man mit Hilfe von Satz 4.22
ein Intervall bestimmt, auf dem die Potenzreihe∑
absolut konvergiert und somit die Funktion
∞
definiert ist. Zum Beispiel ist
durch f (x) = k=0 kxk eine Funktion auf dem Intervall
√
∑∞
(−1, 1) definiert, da limk→∞ k k = 1 und somit auch R = 1 gilt. Durch g(x) = k=0 k1k xk
√
ist eine Funktion auf ganz R = (−∞, ∞) definiert, da limk→∞ k 1/k k = limk→∞ k1 = 0
und somit R = ∞ gilt.
Für uns bereits bekannte Funktionen haben wir im letzten Kapitel Darstellungen durch
Potenzreihen gefunden. Man muss nur zeigen, dass die Restglieder mit n → ∞ gegen 0
m
gehen. Es gilt limm→∞ xm! = 0 für alle x ∈ R, da für eine fest gewählte Zahl u ∈ N mit
u
m
um−u−1
u
u u
|x| ≤ u die Abschätzung | xm! | ≤ uu! (u+1)(u+2)···(m−1)
m ≤ u m für alle m ≥ u erfüllt ist.
66
Integration
Im letzten Kapitel wurde ex =
∑n
xk
k=0 k!
e|x|
n+1
gezeigt.
(n+1)! |x|
∑n xk
limn→∞ k=0 k! = ex .
+ Rn+1 (x) und |Rn+1 (x)| ≤
Für alle x ∈ R gilt somit limn→∞ Rn+1 (x) = 0 und daher auch
∑∞ k
Damit haben wir die Reihendarstellung ex = k=0 xk! gefunden, die für alle x ∈ R gilt.
1
Die Restgliedabschätzung für sin x war |R2n (x)| ≤ (2n)!
|x|2n . Wie oben erhalten wir
∑∞ (−1)k 2k+1
damit die Reihendarstellung sin x = k=0 (2k+1)!
x
, die ebenfalls für alle x ∈ R gilt.
∑∞ (−1)k 2k
Für cos x lässt sich die Reihendarstellung cos x = k=0 (2k)! x herleiten. In der Reihendarstellung von sin x sind die Koeﬃzienten der geraden Potenzen gleich 0, und in der von
cos x die Koeﬃzienten der ungeraden Potenzen.
Auch auf die beiden anderen im letzten Kapitel behandelten Funktionen
sich diese
∑∞ lässt
1
1+x
1
Methode anwenden. Man erhält die Reihendarstellungen 2 log 1−x = k=0 2k+1 x2k+1 und
k
∑∞
2k+1
arctan x = k=0 (−1)
, die beide für x ∈ (−1, 1) gelten, da das Restglied R2n+1 (x)
2k+1 x
für beide Funktionen und für alle x ∈ (−1, 1) mit n → ∞ gegen 0 geht, wie man aus den
im letzten Kapitel gefundenen Abschätzungen für R2n+1 (x) leicht erkennt.
Der Konvergenzradius einer Potenzreihe ist mit der oben gegebenen Formel oft nur
schwierig oder gar nicht zu berechnen. Es gibt noch eine andere Möglichkeit, den Konvergenzradius zu berechnen, mit der es meistens leichter geht.
∑n
Satz 4.23: Sei (vk )k≥1 eine Folge und mn = n1 k=1 vn für n ≥ 1. Gilt limk→∞ vk = v,
dann auch limn→∞ mn = v.
Beweis: Sei ε > 0 vorgegeben. Da wir limk→∞
∑n0 vk = v voraussetzen, existiert ein n0 mit
|vk − v| < 2ε für k ≥ n0 . Sei n1 ≥ max(n0 , 2ε k=1
|vk − v|) gewählt. Für n ≥ n1 gilt dann
∑n
∑n0
1
1
|mn − v| ≤ n k=n0 +1 |vk − v| + n k=1 |vk − v| < n1 (n − n0 ) 2ε + nn1 2ε ≤ ε. Damit ist
limn→∞ mn = v gezeigt.
√
k
Satz 4.24: Sei uk > 0 für k ≥ 0. Gilt limk→∞ uuk−1
= T , dann auch limk→∞ k uk = T .
Beweis: Sei T > 0. Für k ≥ 1 sei vk = log uk − log
Voraussetzung gilt
∑nuk−1 . Nach
uk
1
1
limk→∞ vk = limk→∞ log uk−1 = log T . Sei mn = n k=1 vk = n log un − n1 log u0 für
n ≥ 1 . Aus Satz 4.23 folgt limn→∞ mn = log T und daher auch limn→∞ n1 log un = log T .
√
1
Daraus ergibt sich limn→∞ n un = limn→∞ e n log un = elog T = T .
Es fehlt noch der Beweis für T √
= 0. Die Ungleichung für geometrisches und arithmetisches
∑n
√
√
√
uk
u1
1
n un−1
n
n
n u
n
Mittel ergibt 0 ≤ un = u0 uun−1
0 n
k=1 uk−1 . Aus Satz 4.23 folgt
un−2 . . . u0 ≤
∑n
√
√
k
limn→∞ n1 k=1 uuk−1
= 0. Da limn→∞ n u0 = 1 gilt, erhalten wir limn→∞ n un = 0.
∑∞
Man hat also die Möglichkeit, den Konvergenzradius der Potenzreihe k=0 ck xk auch
k|
mit Hilfe von limk→∞ |c|ck−1
| zu berechnen, falls dieser Grenzwert existiert.
Beispiel: Wir berechnen den Konvergenzradius der Potenzreihe
|ck |
|ck−1 |
k
∑∞
k=0 ck x
k
mit ck =
kk
k! .
k (k−1)!
k k−1
1 k−1
= limk→∞ k!(k−1)
= limk→∞ (1+ k−1
)
=e
k−1 = limk→∞ ( k−1 )
√
1
k
und somit auch limk→∞ |ck | = e. Daher ist R = e der Konvergenzradius.
Es gilt limk→∞
V. Anhang
In diesem Anhang werden einige Anwendungen der Analysis in einer Variablen behandelt, und zwar die Ungleichungen zwischen geometrischen,∑
arithmetischen und noch viel
∞
allgemeineren Mitteln, die Stirlingsche Formel, die Reihe n=1 n12 , der Weierstraß’sche
Approximationssatz und Integration und Diﬀerenziation von Funktionenreihen.
1. Mittelungleichungen
Sei n ≥ 2 und seien a1 , a2 , . . . , an positive reelle Zahlen. Dann ist n1 (a1 + a2 + · · · + an )
√
das arithmetische und n a1 a2 . . . an das geometrische Mittel dieser Zahlen. Wir zeigen
zuerst, dass das geometrische immer kleiner oder gleich dem arithmetischen Mittel ist.
Dann beschäftigen wir uns mit Verallgemeinerungen.
Satz 5.1: Für n ∈ N und x ≥ −1 gilt (1 + x)n ≥ 1 + nx.
Beweis: mit Induktion. Für n = 1 hat man Gleichheit. Ist (1 + x)n ≥ 1 + nx bereits
gezeigt, dann folgt (1 + x)n+1 ≥ (1 + nx)(1 + x) = 1 + nx + x + nx2 ≥ 1 + (n + 1)x.
√
Satz 5.2: Sei n ≥ 1 und a1 , a2 , . . . , an > 0. Dann gilt n a1 a2 . . . an ≤ n1 (a1 +a2 +· · ·+an ).
Beweis: Wir führen den Beweis mit Induktion. Für n = 1 hat man a1 ≤ a1 , was natürlich
richtig ist. Wir nehmen an, dass die Ungleichung für n − 1 Zahlen gezeigt ist und beweisen
√
1
sie für n Zahlen. Wir setzen G = n−1 a1 a2 . . . an−1 und A = n−1
(a1 + a2 + · · · + an−1 ).
Dann ist G ≤ A bereits gezeigt. Wir schreiben a für an .
)n
( a
a
a
Wir setzen x = nA
≥A
− n1 in Satz 5.1 (es gilt x ≥ − n1 ≥ −1) und erhalten nA
+ n−1
.
n
( a+(n−1)A )n
n−1
n
≥ aA
Multiplikation mit A ergibt
. Mit der Induktionsvoraussetzung
n
( a+(n−1)A )n
( a +a +···+a )n
n−1
1
2
n
G ≤ A folgt
≥ aG
, das heißt
≥ a1 a2 . . . an . Zieht man
n
n
√
a1 +a2 +···+an
n
noch die n-te Wurzel, so hat man
a1 a2 . . . an . Das ist die gesuchte
≥
n
Ungleichung für n Zahlen.
Wir verallgemeinern diese
∑n Mittel. Wir nennen die Zahlen s1 , s2 , . . . , sn Gewichte, wenn
sie > 0 sind und wenn k=1 sk = 1 gilt. Das verallgemeinerte arithmetische Mittel der
Zahlen a1 , a2 , . . . , an ist dann s1 a1 +s2 a2 +· · ·+sn an und das verallgemeinerte geometrische
Mittel ist as11 as22 . . . asnn . Für s1 = s2 = · · · = sn = n1 erhält man die Standardversionen
dieser Mittel. Wir beweisen obige Ungleichung für die verallgemeinerten Mittel.
Satz 5.3: Für x > 0 gilt log x ≤ x − 1 und Gleichheit nur dann, wenn x = 1 ist.
Beweis: Sei f (x) = log x − x + 1. Wegen f ′ (x) = x1 − 1 haben wir f ′ (x) > 0 für x ∈ (0, 1)
und f ′ (x) < 0 für x ∈ (1, ∞). Somit ist f streng monoton fallend auf (0, 1) und streng
monoton wachsend auf (1, ∞). Wir erhalten f (x) ≥ f (1) = 0 für alle x ∈ (0, ∞), wobei
Gleichheit nur für x = 1 gilt.
Satz 5.4: Seien s1 , s2 , . . . , sn Gewichte. Für positive reelle Zahlen a1 , a2 , . . . , an , die nicht
alle gleich sind, gilt dann as11 as22 . . . asnn < s1 a1 + s2 a2 + · · · + sn an .
Beweis: Sei m = s1 a1 + s2 a2 + · · · + sn an . Für 1 ≤ k ≤ n folgt log amk ≤ amk − 1 aus
ak
k und wir hätten
Satz 5.3, wobei nicht immer Gleichheit gilt, sonst wäre
∑nm = 1 fürakalle ∑
n
a1 = a2 = · · · = an = m, ein Widerspruch. Es folgt k=1 sk log m < k=1 sk ( amk − 1).
∑n
∑
∑
∑
n
n
n
ak
1
Wegen k=1 sk amk = m
k=1 sk ak = 1 und
k=1 sk = 1 ergibt sich
k=1 sk log m < 0.
68
Anhang
∑n
∑n
∑n
Wegen log amk =∑
log ak − log m folgt k=1 sk log ak < k=1 sk log m. Da k=1 sk = 1
n
gilt, ergibt sich k=1 log askk < log m. Wendet man auf diese Ungleichung die Exponentialfunktion an, so hat man as11 as22 . . . asnn < m = s1 a1 + s2 a2 + · · · + sn an .
Seien a1 , a2 , . . . , an positive reelle Zahlen und s1 , s2 , . . . , sn Gewichte. Wir definieren
{ (∑
)1
n
x x
s
a
für x ∈ R \ {0}
k
k
k=1
h(x) =
s1 s2
sn
für x = 0
a1 a2 . . . an
Dann ist h(0) das geometrische, h(1) das arithmetische und h(−1) das harmonische Mittel.
Es sind die verallgemeinerte Versionen dieser Mittel.
Satz 5.5: Die Funktion g(x) = log h(x) ist im Punkt 0 stetig.
∑n
x
Beweis: Für x ̸= 0 gilt g(x) = log xu(x) mit u(x) =
k=1 sk ak . Wegen u(0) = 1
können wir limx→0 g(x) mit der Regel von de l’Hospital berechnen. Es gilt limx→0 g(x) =
′
∑n
∑n
(x)
limx→0 uu(x)
. Nun ist limx→0 u(x) = k=1 sk = 1 und wegen u′ (x) = k=1 sk axk log ak
∑n
∑n
ak . Somit ist limx→0 g(x) =
gilt limx→0 u′ (x) =
k=1 sk log ak berechnet.
k=1 sk log∑
n
s1 s2
sn
Da g(0) = log(a1 a2 . . . an ) = k=1 sk log ak gilt, haben wir gezeigt, dass g im Punkt 0
stetig ist.
Satz∑5.6: Seien s1 , s2 , . . . , sn Gewichte und r1 , r2 , . . . , rn seien ebenfalls Gewichte. Dann
n
gilt k=1 rk log srkk ≤ 0 und Gleichheit nur dann, wenn sk = rk für 1 ≤ k ≤ n.
∑n
∑n
∑n
∑n
Beweis: Es gilt k=1 rk log srkk ≤ k=1 rk ( srkk − 1) = k=1 sk − k=1 rk = 1 − 1 = 0
wegen Satz 5.3. Ebenfalls nach Satz 5.3 haben wir Gleichheit nur dann, wenn srkk = 1, das
heißt sk = rk für 1 ≤ k ≤ n gilt.
Satz 5.7: Seien a1 , a2 , . . . , an positive Zahlen, die nicht alle gleich sind, und s1 , s2 , . . . , sn
Gewichte. Die Funktion h : R → R ist dann stetig und streng monoton wachsend.
∑n
Beweis: Sei g(x) = log h(x). Für x ̸= 0 gilt g(x) = x1 log u(x) mit u(x) = k=1 sk axk .
′
(x)
Mit Hilfe der Produktregel erhalten wir dann g ′ (x) = − x12 log u(x) + x1 uu(x)
, das heißt
∑
∑
n
n
x
1
x
x
x
x2 g ′ (x) = − log u(x) + u(x)
k=1 sk ak log ak = − log u(x) + u(x)
k=1 sk ak log ak
∑n
sk ax
k
. Wegen
Sei rk = u(x)
k=1 rk = 1 sind die Zahlen r1 , r2 , . . . , rn Gewichte. Es kann
rk = sk nicht für alle k gelten, sonst wäre auch axk = u(x) für alle k erfüllt und wir hätten
∑n
folgt
a1 = a2 = · · · = an . Satz 5.6 ergibt dann k=1 rk log srkk < 0. Wegen srkk = u(x)
ax
k
∑n
∑
n
u(x)
u(x)
< 0. Nun gilt log ax = log u(x) − log axk und k=1 rk = 1, womit wir
k=1 rk log ax
k
k
∑n
sk ax
k
ein, so ergibt sich
log u(x) − k=1 rk log axk < 0 erhalten. Setzen wir noch rk = u(x)
x
∑n sk ak
log u(x) − k=1 u(x) log axk < 0. Damit ist x2 g ′ (x) > 0 gezeigt. Also gilt auch g ′ (x) > 0
für alle x ∈ R \ {0}.
Nach Satz 5.5 ist g im Punkt 0 stetig. Auf R \ {0} ist g sogar diﬀerenzierbar und hat
Ableitung > 0. Somit ist g auf ganz R stetig und streng monoton wachsend. Da aber
h(x) = eg(x) gilt, ist auch h auf ganz R stetig und streng monoton wachsend.
Satz 5.7 ergibt Ungleichungen für Mittel. Insbesondere gilt h(−1) < h(0) < h(1), das
sind Ungleichungen für das harmonische, geometrische und arithmetische Mittel.
Gilt a1 = a2 = · · · = an = a, dann ist h(x) = a für alle x ∈ R.
Franz Hofbauer
69
2. Die Stirlingsche Formel
Bevor wir zur Stirlingschen Formel kommen, behandeln wir das sogenannte Wallissche
Produkt.
∫π
∫ π2
2n−3
31π
2n 2n−2
42
Satz 5.8: Es gilt 02 sin2n x dx = 2n−1
sin2n+1 x dx = 2n+1
.
.
.
und
2n 2n−2
42 2
2n−1 . . . 5 3
0
∫π
∫π
für n ≥ 1. Weiters gilt 02 1dx = π2 und 02 sin x dx = 1, die Gleichungen für n = 0.
Beweis: Für k ≥ 2 berechnen wir mit Hilfe von partieller Integration
π2
∫ π2
∫ π2
∫π
k
k−1
k−1
+ (k − 1) 2 sink−2 x cos2 x dx
sin
x
dx
=
sin
x
sin
x
dx
=
−
sin
x
cos
x
0
0
0
0
∫ π2
∫ π2
k−2
k
= (k − 1) 0 sin
x dx − (k − 1) 0 sin x dx
Durch entsprechendes Umformen ergibt sich daraus dann
∫ π2
∫ π2
k
k−1
(1)
sin
x
dx
=
sink−2 x dx
k
0
0
∫π
∫π
Klarerweise gilt 02 1dx = π2 und 02 sin x dx = 1. Das sind die beiden Gleichungen
für n = 0. Nehmen wir also an, die beiden Gleichungen seien für n schon gezeigt. Mit
∫π
∫ π2
2n
2n−1 2n−3
31π
x dx = 2n+1
Hilfe von (1) folgt dann 02 sin2n+2 x dx = 2n+1
2n+2 0 sin
2n+2 2n 2n−2 . . . 4 2 2
π
∫ π2
∫
2n+1
2n 2n−2
42
2
und 0 sin2n+3 x dx = 2n+2
x dx = 2n+2
2n+3 0 sin
2n+3 2n+1 2n−1 . . . 5 3 , das sind die beiden
Gleichungen für n + 1. Somit ist der Satz durch Induktion bewiesen.
√ ( )
√1 .
Satz 5.9: Es gilt limn→∞ 22nn 2n
n =
π
Beweis: Für 0 ≤ x ≤ π2 gilt 0 ≤ sin x ≤ 1, woraus sinn x ≤ sinn−1 x für alle n ≥ 1 folgt.
∫π
∫π
∫π
∫π
Wir erhalten 02 sin2n x dx ≤ 02 sin2n−1 x dx und 02 sin2n+1 x dx ≤ 02 sin2n x dx, das
2n−3
31π
2n−2
42
2n 2n−2
42
2n−1 2n−3
31π
heißt 2n−1
2n 2n−2 . . . 4 2 2 ≤ 2n−1 . . . 5 3 und 2n+1 2n−1 . . . 5 3 ≤
2n 2n−2 . . . 4 2 2 wegen
22 42 ...(2n)2
π 2n+1
32 52 ...(2n−1)2 2n ≤ 2 2n für alle n ≥ 2. Da
22 42 ...(2n)2
π
aber limn→∞ 2n+1
2n = 1 gilt, erhalten wir limn→∞ 32 52 ...(2n−1)2 2n = 2 .
( ) 1·3·5···(2n−1)
1 2n
folgt. Obiger Grenzwert
Nun gilt 22n (n!)2 = 22 ·42 · · · (2n)2 , woraus 22n
n =
2·4···(2n)
√ ( )
( 1 (2n))2
√1 .
besagt, dass limn→∞ 2n 22n n
= π2 gilt. Daraus folgt limn→∞ 22nn 2n
n =
π
Satz 5.8. Durch Umformen ergibt sich
π
2
≤
Jetzt werden wir schrittweise die Stirlingsche Formel herleiten.
Satz 5.10: Es gilt 2x ≤ log
1+x
1−x
≤ 2x +
1+x
1−x − 2x =
2x2
= 1−x
2 . Man
Beweis: Sei f (x) = log
′
2x3
3(1−x2 )
für 0 ≤ x < 1.
log(1 + x) − log(1 − x) − 2x für x ∈ [0, 1). Dann gilt
f (x) =
+
−2
sieht, dass f ′ (x) ≥ 0 auf dem Intervall (0, 1) gilt. Die
Funktion f ist dort monoton wachsend. Es gilt somit f (x) ≥ f (0) = 0 für alle x ∈ [0, 1).
Damit ist die erste Ungleichung gezeigt.
1
1+x
1
1−x
2x3
1+x
2x3
3(1−x2 ) − log 1−x = 3(1−x2 )
2
2
4
2 3x (1−x )+2x
2x2
3x2 +x4
− 1−x
2 = 3(1−x2 )2 .
3
(1−x2 )2
Sei g(x) = 2x +
− f (x) für x ∈ [0, 1). Wieder berechnen wir
g ′ (x) =
Man sieht, dass g ′ (x) ≥ 0 auf dem Intervall
(0, 1) gilt. Die Funktion g ist dort monoton wachsend. Es gilt somit g(x) ≥ g(0) = 0 für
alle x ∈ [0, 1). Damit ist auch die zweite Ungleichung gezeigt.
n
√
Satz 5.11: Für n ≥ 1 sei an = nn!e
n n und bn = log an . Dann ist die Folge (bn )n≥1 monoton
1
fallend und hat einen Grenzwert b. Weiters gilt b ≤ bn ≤ b + 12n
für alle n ≥ 1.
70
Anhang
Beweis: Für n ≥ 1 gilt
mit x =
1
2n+1 .
an
an+1
1
n+ 2
= 1e ( n+1
. Es folgt bn − bn+1 = log
n )
Wegen Satz 5.10 gilt dann 0 ≤ bn − bn+1 ≤
an
an+1
x2
1
3(1−x2 ) = 12n
=
1
2x
−
1
12(n+1) .
log
1+x
1−x
−1
1
. Die Folge (bn )n≥1 ist dann monoton fallend und die Folge
Für n ≥ 1 sei cn = bn − 12n
(cn )n≥1 ist monoton wachsend. Da bn ≥ cn ≥ c1 für alle n ≥ 1 gilt, ist die Folge (bn )n≥1
nach unten durch c1 beschränkt. Somit existiert ein b mit limn→∞ bn = limn→∞ cn = b.
1
Weiters gilt cn ≤ b ≤ bn , das heißt b ≤ bn ≤ b + 12n
für alle n ≥ 1.
√
n
√
Satz 5.12 (Stirlingsche Formel) Es gilt limn→∞ nn!e
2π.
n n =
n
√
Beweis: Für n ≥ 1 sei an = nn!e
n n und bn = log an wie in Satz 5.11 und b sei der dort
gefundene Grenzwert der Folge (bn )n≥1 . Dann gilt limn→∞ an = a mit a = eb .
√
( )
(2n)! e2n
n
n2n n
√
√ 2n für n ≥ 1. Es gilt limn→∞ a2n
√1
=
Weiters gilt aa2n
= (2n)
2
2
2n
2n 2n (n!) e
a2 =
22n 2 n
2π
n
n
wegen Satz 5.9. Da aber auch limn→∞ aa2n
= aa2 = a1 gelten muss, erhalten wir a1 = √12π
2
n√
√
n
√
und a = 2π. Damit ist limn→∞ nn!e
2π gezeigt.
n n =
√
√
n
1
√
Aus Satz 5.11 erhalten wir für alle n ≥ 1 die Abschätzung 2π ≤ nn!e
2π e 12n ,
n n ≤
√
√
√
n
n
1
das heißt n en2πn ≤ n! ≤ n en2πn e 12n , da a = eb = 2π im Beweis von Satz 5.12 gezeigt
wurde.
3. Die Reihe
∑∞
1
n=1 n2
∑∞
In der Analysis zeigt man, dass die Reihe n=1 n1α für α > 1 konvergent ist. Somit
∑∞ 1
∑∞
1
ist die Reihe A =
n=1 n2 konvergent. Ebenso sind die Reihen U =
n=1 (2n−1)2
∑∞
1
und G = n=1 (2n)
2 konvergent, da sie durch Streichen von Gliedern aus obiger Reihe
entstehen. Es gelten die Gleichungen A = 4G und A = U + G. Man erhält sie durch
Grenzübergang aus entsprechenden Gleichungen für Partialsummen. Es folgt A = 43 U .
Satz 5.13: Für m ≥ 1 gilt
∑2m−1
n=1
1
(2n−1)π
sin2 m+1
2
=
4m
2 .
Beweis: Wegen sin 2α = 2 sin α cos α, sin2 α + cos2 α = 1 und cos α = sin(α + π2 ) erhalten
wir sin21 2α = 14 ( sin12 α + cos12 α ) = 14 ( sin12 α + sin2 (1π +α) ). Wir zeigen
2
∑2m
1
(1)
= 4m für m ≥ 0
n=1
2 (2n−1)π
sin
2m+1
durch Induktion nach m. Für m = 0 haben wir
1
sin2
π
2
= 1, eine richtige Gleichung.
Wir nehmen an,( dass (1) bereits gezeigt ist. Setzt
man oben α = (2n−1)π
2m+2 , so hat man
)
1
1
1
1
. Setzt man das in (1) ein, dann erhält
(2n−1)π = 4
(2n−1)π +
(2m+1 +2n−1)π
sin2 m+1
sin2 m+2
sin2
2
2
2m+2
∑2m
∑2m
1
man 14 n=1 2 (2n−1)π
+ 14 n=1 2 (2(2m1 +n)−1)π = 4m . Das kann man in eine Summe
sin
sin
2m+2
2m+2
zusammenfassen, da n in der ersten Summe von 1 bis 2m läuft und 2m + n in der zweiten
∑2m+1
1
Summe von 2m +1 bis 2m+1 . Man erhält n=1
= 4m+1 . Das ist die Gleichung
2 (2n−1)π
sin
2m+2
in (1) für m + 1 anstelle von m. Damit ist (1) durch Induktion bewiesen.
1
1
. Daran erkennt man, dass in
Wegen sin(π − α) = sin α gilt 2 (2m+1
= 2 (2n−1)π
−2n+1)π
sin
2m+1
sin
2m+1
(1) der (2 −n+1)-te Summand und der n-te Summand gleich sind. Die Summe der ersten
m
Franz Hofbauer
71
2m−1 Summanden ist daher gleich der Summe der übrigen 2m−1 Summanden. Summiert
man in (1) nur über die ersten 2m−1 Summanden, dann erhält man auch nur den halben
∑2m−1
m
1
Wert, das heißt n=1
= 42 .
2 (2n−1)π
sin
Satz 5.14: Es gilt
∑∞
1
n=1 (2n−1)2
Beweis: Für 0 < x <
1
sin2 x
m−1
2
2m+1
π
2
=
π2
8 .
gilt bekanntlich sin x < x < tan x = √ sin x 2 , woraus wir dann
1−sin x
(2n−1)π
>
− 1 erhalten. Setzt man x = 2m+1 und summiert über n von 1 bis
>
∑2m−1 4m+1
m
4m
m−1
für m ≥ 1 mit Hilfe von
, dann erhält man 42 > n=1 (2n−1)
2 π2 >
2 − 2
m−1
∑
2
2
2
π
1
π2
π2
5.13. Multiplikation mit 4m+1
ergibt π8 > n=1 (2n−1)
2 > 8 − 2m+3 . Lässt man
1
x2
1
sin2 x
Satz
m gegen ∞ gehen, dann ist der Satz schon bewiesen.
Mit den eingangs durchgeführten Überlegungen folgt jetzt
∑∞
1
n=1 n2
=
4 π2
3 8
=
π2
6 .
4. Der Weierstraßsche Approximationssatz
Sei f : [0, 1] → R eine stetige Funktion. Der Weierstraßsche Approximationssatz besagt,
dass man f beliebig gut durch∑
Polynome (approximieren
kann. Man kann
)
( ) diese Polynome
n
k n k
k n k
n−k
sogar angeben. Sei Pn (x) = k=0 f ( n ) k x (1 − x)
. Da f ( n ) k x (1 − x)n−k ein
Polynom in der Variable x ist, ist Pn (x) als Summe dieser Polynome ebenfalls ein Polynom.
Wir zeigen, dass limn→∞ Pn (x) = f (x) für alle x ∈ [0, 1] gilt.
( )
Zur Abkürzung setzen wir wn,k (x) = nk xk (1 − x)n−k . Insbesondere ist wn,n (x) = xn
∑n
k
und wn,0 (x) = (1 − x)n . Es gilt dann Pn (x) =
k=0 f ( n )wn,k (x). Wir beginnen mit
Hilfsresultaten.
Satz
∑n 5.15: Sei n ≥ 2 und
∑n x ∈ [0, 1]. 2Dann gilt wn,k (x) ≥ 0 für 0 ≤ k ≤ n. Weiters gilt
w
(x)
=
1
und
k=0 n,k
k=0 (k − nx) wn,k (x) = nx(1 − x).
( )
Beweis: Die Zahlen wn,k (x) = nk xk (1 − x)n−k für 0 ≤ k ≤ n sind gerade die in der
Binomialverteilung auftretenden
Wahrscheinlichkeiten.∑Sie sind ≥ 0 und ihre Summe ist 1.
∑n
n
Der Erwartungswert k=0 kwn,k (x) ist nx. Somit ist k=0 (k − nx)2 wn,k (x) die Varianz,
die gleich nx(1 − x) ist. Das kennt man aus der Wahrscheinlichkeitstheorie.
Satz 5.16: Sei n ≥ 2 und x ∈ [0, 1] beliebig. Wir definieren
∑ Kn = {0, 1, 2, . . . , 1n} und
k
Jn,δ (x) = {k ∈ Kn : |x − n | ≥ δ}. Für alle δ > 0 gilt dann k∈Jn,δ (x) wn,k (x) ≤ 4nδ2 .
(
)2
Beweis: Für k ∈ Jn,δ (x) gilt 1 ≤ k−nx
. Wir erhalten daher
nδ
( k−nx )2
∑
∑
∑n
wn,k (x) ≤ n21δ2 k=0 (k − nx)2 wn,k (x)
k∈Jn,δ (x) wn,k (x) ≤
k∈Jn,δ (x)
nδ
∑n
Nach Satz 5.15 gilt k=0∑
(k − nx)2 wn,k (x) = nx(1 − x). Das Maximum der Funktion
n
x(1 − x) ist 41 . Somit gilt k=0 (k − nx)2 wn,k (x) = nx(1 − x) ≤ n4 für alle x ∈ [0, 1]. Setzt
∑
1
man das oben ein, so hat man k∈Jn,δ (x) wn,k (x) ≤ 4nn2 δ2 = 4nδ
2.
Eine Funktion f : [a, b] → R heißt gleichmäßig stetig, wenn für jedes ε > 0 ein δ > 0
existiert, sodass für alle x und y in [a, b] mit |x − y| < δ sich die Funktionswerte f (x) und
f (y) um weniger als ε voneinander unterscheiden, das heißt |f (x) − f (y)| < ε erfüllt ist.
Nach Satz 4.12 ist jede Funktion f : [a, b] → R, die stetig ist, bereits gleichmäßig stetig.
72
Anhang
Satz 5.17 (Weierstraßscher
Sei f : [0, 1] → R eine stetige Funktion
( ) Approximationssatz)
∑n
k n k
n−k
. Für jedes ε > 0 existiert dann ein n0 , sodass
und Pn (x) = k=0 f ( n ) k x (1 − x)
|f (x) − Pn (x)| < ε für alle n ≥ n0 und alle x ∈ [0, 1] gilt (n0 hängt nur von ε, nicht aber
von x ab).
Beweis: Sei ε > 0 vorgegeben. Da f : [0, 1] → R stetig und somit auch gleichmäßig stetig
ist, existiert ein δ > 0, sodass |f (x) − f (y)| < 2ε für alle x, y ∈ [0, 1] mit |x − y| < δ gilt.
Weiters ist f beschränkt. Es existiert ein c > 0, sodass |f (x)| ≤ c für alle x ∈ [0, 1] gilt.
Wir wählen dann n0 so groß, dass n0cδ2 < ε gilt.
Sei x ∈ [0, 1] beliebig. Sei Kn = {0, 1, 2, . . . , n}, In,δ (x) = {k ∈ Kn : |x − nk | < δ} und
Jn,δ (x) = {k ∈ Kn : |x − nk | ≥ δ}. Dann ist Kn die disjunkte Vereinigung von In,δ (x) und
Jn,δ (x). Für k ∈ In,δ (x) gilt |x − nk | < δ und daher auch |f (x) − f ( nk )| < 2ε . Es folgt
∑
∑
∑n
ε
ε
ε
k
k∈In,δ (x) |f (x) − f ( n )|wn,k (x) <
k∈In,δ (x) 2 wn,k (x) ≤ 2
k=0 wn,k (x) = 2
wobei auch Satz 5.15 verwendet wurde. Wegen |f (x) − f ( nk )| ≤ |f (x)| + |f ( nk )| ≤ 2c folgt
∑
∑
k
c
k∈Jn,δ (x) |f (x) − f ( n )|wn,k (x) ≤
k∈Jn,δ (x) 2c wn,k (x) ≤ 2nδ 2
c
c
ε
mit Satz 5.16. Ist jetzt n ≥ n0 , dann gilt 2nδ
2 ≤ 2n δ 2 < 2 und mit Satz 5.15 erhalten wir
0
)
∑n (
∑n
|f (x) − Pn (x)| = | k=0 f (x) − f ( nk ) wn,k (x)| ≤ k=0 |f (x) − f ( nk )|wn,k (x)
∑
∑
c
≤ k∈In,δ (x) |f (x) − f ( nk )|wn,k (x) + k∈Jn,δ (x) |f (x) − f ( nk )|wn,k (x) < 2ε + 2nδ
2 < ε
Damit ist |f (x) − Pn (x)| < ε für alle n ≥ n0 gezeigt und der Satz ist bewiesen.
Man kann dieses Resultat noch ein wenig anders aufschreiben. Für eine Funktion
g : [0, 1] → R definieren wir die sogenannte Supremumsnorm ∥g∥∞ = supx∈[0,1] |g(x)|.
Dann lässt sich Satz 5.17 ∑
folgendermaßen
Wenn f : [0, 1] → R eine stetige
( ) schreiben:
n
k n k
n−k
Funktion ist und Pn (x) = k=0 f ( n ) k x (1 − x)
, dann existiert für jedes ε > 0 ein
n0 ≥ 1, sodass ∥f − Pn ∥∞ < ε für alle n ≥ n0 gilt. Das heißt limn→∞ ∥f − Pn ∥∞ = 0.
5. Reihendarstellungen von Funktionen
Wir beginnen mit einem Satz über gliedweise Integration.
Satz 5.18: Sei I ein oﬀenes Intervall, das auch unbeschränkt sein darf, und a ∈ I fest
gewählt. Für n ∑
≥ 0 sei gn : I → R eine stetige Funktion. Weiters seien Zahlen cn > 0
∞
vorgegeben mit n=0 cn = d < ∞
und |gn (x)| ≤ cn für alle x ∈ I und alle n ≥ 0. Für
∑∞
alle
x
∈
I
existiert
dann
g(x)
=
n=0 gn (x). Weiters ist g auf ganz I stetig und es gilt
∫x
∑∞ ∫ x
g(t)dt = n=0 a gn (t)dt.
a
∑∞
Beweis:
Sei
x
∈
I
beliebig.
Da
n=0 cn < ∞ und |gn (x)| ≤ cn für alle n ≥ 0 gilt, erhalten
∑∞
∑
∞
wir n=0 |gn (x)| < ∞. Die Reihe n=0 gn (x) ist somit absolut konvergent
∑∞ und daher nach
einem Satz aus der Analysis auch konvergent. Wir schreiben g(x) = n=0 gn (x).
∑k−1
∑k−1
Sei dk = d − n=0 cn für k ≥ 0. Wegen limk→∞ n=0 cn = d erhalten wir limk→∞ dk = 0.
∑k−1
Sei x ∈ I beliebig und k ≥ 0. Wir setzen hk (x) = n=0 gn (x). Für m ≥ k ergibt sich dann
∑m
∑m
∑m
∑m
∑m
∑k−1
| n=0 gn (x) − hk (x)| = | n=k gn (x)| ≤ n=k |gn (x)| ≤ n=k cn ≤ n=0 cn − n=0 cn .
Lassen wir m gegen ∞ gehen, so erhalten wir
(1)
|g(x) − hk (x)| ≤ dk
für alle x ∈ I und alle k ≥ 0
Um zu zeigen, dass g im Punkt x ∈ I stetig ist, sei ε > 0 vorgegeben. Sei k so gewählt,
dass dk < 3ε gilt. Da hk als Summe endlich vieler stetiger Funktionen stetig ist, existiert
Franz Hofbauer
73
ein δ > 0 mit |hk (x) − hk (y)| < 3ε für alle y ∈ (x − δ, x + δ) ∩ I. Mit (1) erhalten wir dann
|g(x) − g(y)| ≤ |g(x) − hk (x)| + |hk (x) − hk (y)| + |hk (y) − g(y)| < 3ε + 3ε + 3ε = ε für alle
y ∈ (x − δ, x + δ) ∩ I. Damit ist gezeigt, dass g im Punkt x stetig ist.
Aus (1) folgt auch
∫ x g(t)−dk ≤ hk (t) ≤ g(t)+d
∫ x k für alle ∫t x∈ I und k ≥ 0. Integriert man von
a bis x so folgt a g(t) dt − dk (x − a) ≤ a hk (t)dt ≤ a g(t)dt + dk (x − a). Die Integrale
existieren, da g und hk stetige Funktionen sind. (Wenn x kleiner als a ist, dann drehen
dass man das
sich die Ungleichheitszeichen um.) Setzt man für hk (t) ein und beachtet,
∫x
Integral und die endliche Summe vertauschen darf, so erhält man a g(t)dt − dk (x − a) ≤
∫x
∑k−1 ∫ x
Jetzt kann man den Grezwert für k → ∞ bilden.
n=0 a gn (t)dt ≤ a g(t)dt+dk (x−a).
∑k−1 ∫ x
∑∞ ∫ x
Wegen limk→∞ dk = 0 existiert n=0 a gn (t) dt = limk→∞ n=0 a gn (t)dt und es gilt
∫x
∑∞ ∫ x
g(t)dt
=
n=0 a gn (t)dt.
a
Beispiel: ∑
Sei 0 < α < 1 und I = (−α, α). Für n ≥ 0 sei gn (x) = 2x2n und cn = 2α2n .
∞
2
Dann gilt n=0 cn = 1−α
2 < ∞ und |gn (x)| ≤ cn für alle x ∈ I und n ≥ 0. Die Voraus∑∞
2
1
1
setzungen von Satz 5.18 sind erfüllt. Es folgt g(x) = n=0 gn (x) = 1−x
2 = 1+x + 1−x
∫x
x
1+x
und 0 g(y)dy = log(1 + y) − log(1 − y)0 = log(1 + x) − log(1 − x) = log 1−x
. Weiters
∫x
2n+1
2y 2n+1 x
gilt 0 gn (y) dy = 2n+1 0 = 2x
2n+1 . Wegen Satz 5.18 erhalten wir die Reihendarstellung
∑∞ 2x2n+1
1+x
log 1−x = n=0 2n+1 , die für alle x ∈ (−α, α) gilt. Da α beliebig nahe an 1 gewählt
werden kann, gilt sie für alle x ∈ (−1, 1).
Beispiel: Sei wieder ∑
0 < α < 1 und I = (−α, α). Für n ≥ 0 sei gn (x) = (−1)n x2n und
∞
1
2n
cn = α . Dann gilt n=0 cn = 1−α
2 < ∞ und |gn (x)| ≤ cn für alle x ∈ I und n ≥ 0.
∑∞
1
Die Voraussetzungen von Satz 5.18 gelten. Wir erhalten g(x) = n=0 gn (x) = 1+x
2 und
x
∫x
∫x
n 2n+1
n 2n+1 x
y
= (−1) x
.
g(y)dy = arctan y 0 = arctan x. Weiters gilt 0 gn (y)dy = (−1)2n+1
2n+1
0
∑∞ (−1)0n x2n+1
Wegen Satz 5.18 erhalten wir die Reihendarstellung arctan x = n=0
, die für
2n+1
alle x ∈ (−α, α) gilt. Da α beliebig nahe an 1 gewählt werden kann, gilt sie für x ∈ (−1, 1).
Satz 5.19: Sei I ein oﬀenes Intervall, das auch unbeschränkt sein darf. Für
∑∞alle n ≥ 0
sei fn : I → R stetig diﬀerenzierbar. Weiters seien cn > 0 vorgegeben
mit
n=0 cn < ∞
∑∞
′
und |fn (x)| ≤ cn für alle x ∈ I und alle n ≥ 0. Wenn f (x) = n=0
∑∞fn (x) für alle x ∈ I
existiert, dann ist f auf ganz I diﬀerenzierbar und es gilt f ′ (x) = n=0 fn′ (x).
Beweis: Wir verwenden Satz 5.18. Sei gn = fn′ für n ≥ 0 und a ∈ I fest ∑
gewählt. Dann
∞
sind die Voraussetzungen von Satz 5.18 erfüllt. ∫Dieser besagt, dass∫g(x) = n=0 fn′ (x) für
∑
x
x
∞
alle x ∈ I existiert, dass g stetig ist und dass a g(t) dt = n=0 a fn′ (t)dt gilt. Wegen
∫x ′
∫x
∑∞
∑∞
f (t) dt = fn (x) − fn (a) erhalten wir a g(t)dt = n=0 fn (x) − n=0 fn (a). Nach
a n
∫x
Voraussetzung konvergieren diese Reihen und es folgt a g(t) dt = f (x) − f (a). Nach dem
∫y
Mittelwertsatz der Integralrechnung gilt f (y) − f (x) = x g(t)dt = (y − x)g(c) für ein c
zwischen x und y. Dividiert man durch
∑∞y − x und lässt y gegen x gehen, so erhält man
f ′ (x) = g(x). Damit ist auch f ′ (x) = n=0 fn′ (x) gezeigt.
∑∞
∑∞
Beispiel: Eine Reihe der Form 21 a0 + n=1
n cos nx +
n=1 bn sin nx heißt Fourierreihe.
∑a∞
Wir untersuchen nur die Sinusreihe f (x) = n=1 bn sin nx mit bn ∈ R. Wir setzen fn (x) =
b∑
n sin nx. Aus Satz 5.18 folgt, dass f (x) für alle x ∈ R existiert und stetig ist, wenn
∞
j=1 |bn | < ∞ gilt, da ja |fn (x)| = |bn sin nx| ≤ |bn | für alle x ∈ R und n ≥ 1 erfüllt ist.
Wegen fn′ (x) = nbn cos nx gilt außerdem |fn′ (x)| ≤ n|bn | für alle x ∈ R und n ≥ 1. Ist
74
Anhang
∑∞
daher j=1 n|bn | < ∞ erfüllt, dann ist f nach Satz 5.19 auf ganz R diﬀerenzierbar mit
∑∞
f ′ (x) = n=1 nbn cos nx. Für die Cosinusreihe gelten analoge Resultate.
∑∞
n
Beispiel: Wir untersuchen
Potenzreihen
f
(x)
=
n=0 cn x mit Koeﬃzienten cn in R.
√
Sei T = lim supn→∞ n |cn |. Man nennt R = T1 den Konvergenzradius der Potenzreihe. Ist
T = 0, dann setzen wir R = ∞.
Sei 0 < α < R und I = (−α, α). Wir setzen fn (x) = cn xn für n ≥ 0. Wegen
0<α<R
√
n
gilt αT < 1. Wir wählen q mit
αT < q < 1. Es folgt lim supn→∞ α |cn | = αT < q,
√
n
sodass ein n0 existiert mit α |cn | < q für alle n ≥ n0 , also auch αn |cn | < q n . Wählen
wir eine Konstante k,
groß genug ist, dann gilt αn |cn | < kq n für alle n ≥ 0. Wegen
∑die
∞
k
< ∞. Ist x ∈ I, dann gilt |fn (x)| ≤ |cn |αn < kq n
0 < q < 1 gilt auch n=0 kq n = 1−q
∑∞
∑∞
für alle n ≥ 0. Aus Satz 5.18 folgt daher, dass f (x) = n=0 fn (x) = n=0 cn xn für alle
x ∈ I = (−α, α) existiert. Da α beliebig nahe an R gewählt werden kann, gilt das für alle
x ∈ (−R, R). Daher heißt R auch Konvergenzradius der Potenzreihe.
n−1
Für x ∈ I = (−α, α) und n ≥ 0 gilt auch |fn′ (x)| ≤ n|cn |αn−1 ≤ kq
. Weα nq
∑∞
∑
m
m−1
1−q
1
n−1
n
≤ (1−q)2 < ∞ (Diﬀerenzieren von
= 1−q nach q ergibt
gen
n=0 nq
n=0 q
∑m−1 n−1
m
m−1
1−q
−mq
1
= (1−q)
≤ (1−q)
2 +
2 und dann m → ∞) können wir Satz 5.19
n=0 nq
1−q
anwenden.
besagt,
auf dem
I = (−α, α) diﬀerenzierbar ist mit
∑∞Dieser
∑∞ dass f n−1
∑∞Intervalln−1
′
′
f (x) = n=0 fn (x) = n=0 ncn x
= n=1 ncn x
. Da α beliebig nahe an R gewählt
werden kann, gilt das wieder für alle x ∈ (−R, R).
Inhaltsverzeichnis
I. Reelle Zahlen und stetige Funktionen
1.
2.
3.
4.
5.
6.
7.
8.
Dezimalzahlen
Ordnung
Intervallschachtelungseigenschaft
Folgen und deren Grenzwerte
Funktionen
Stetigkeit
Zwischenwertsatz und Umkehrfunktion
Potenzfunktion
1
1
4
6
10
13
16
18
20
II. Diﬀerenzierbarkeit
23
1.
2.
3.
4.
5.
6.
7.
8.
9.
23
25
27
30
31
32
35
39
40
Grenzwerte von Funktionen
Die Ableitung
Monotonieverhalten von Funktionen
Extremwerte
Gleichungen und Ungleichungen
Trigonometrische Funktionen
Exponentialfunktion und Logarithmus
Regel von de l’Hospital
Komplexe Zahlen
III. Beweise durch Intervallschachtelung
42
1. Intervallhalbierung
2. Infimum und Supremum
42
43
IV. Integration
46
1.
2.
3.
4.
5.
6.
7.
46
54
54
57
60
60
63
Definition und Eigenschaften des Integrals
Gleichmäßige Stetigkeit
Anwendungen des Integrals
Verallgemeinerte Riemannsummen
Uneigentliche Integrale
Approximation von Funktionen durch Polynome
Reihen
V. Anhang
67
1.
2.
3.
4.
5.
67
69
70
71
72
Mittelungleichungen
Die Stirlingsche
∑∞ Formel
Die Reihe n=1 n12
Der Weierstraßsche Approximationssatz
Reihendarstellungen von Funktionen

Zugehörige Unterlagen

UE 7

2 - (sin(α)) · 0 1 - Mathematisches Institut der Universität Bonn

Analysis in einer Variablen

Zugehörige Unterlagen

Dieses Dokument Sammlung (en)

Dieses Dokument gespeichert

Schlagen Sie uns vor, wie wir StudyLib verbessern können