I (Kurzskript) - Fachbereich Mathematik und Informatik

Werner
Universität Münster
WS 08/09
Mathematik für Physiker
(und Informatiker) I
(Kurzskript)
Mathematische Strukturen sind durch einen Satz von Axiomen bestimmt.
Man ist bemüht, wichtige und interessante Aussagen aus diesen Axiomen
herzuleiten. Die Sprache, derer man sich dabei bedient, ist die der (mathematischen) Logik.
Entgegen einem weit verbreiteten Irrtum beschäftigt sich Mathematik
nicht bloß mit der Syntax dieser Sprache; wichtig ist Mathematik nicht zuletzt durch den Erfolg der mathematischen Modelle, auf die man bei vielen
Gelegenheiten stößt. Nach einer mathematischen Untersuchung dieser Modelle, lassen sich die Ergebnisse für (präzise) Vorhersagen nutzen, die überprüfbar sind. (Bevölkerungswachstum, Ausbreitung von Infektionskrankheiten, optimierter Entwurf von Schaltkreisen, Mischen von Spielkarten, Wirkung der Schwerkraft auf Licht, Periheldrehung des Merkur, Existenz spezieller Elementarteilchen).
Ziel in dieser Vorlesung ist es, einige der mathematischen Grundtechniken zu vermitteln und anzuwenden.
2
Mathematik für Physiker und Informatiker I (Kurzskript)
0. Ein paar syntaktische Grundlagen
Aussagelogische Formeln
Eine Aussage im mathematischen Sinn ist ein in einer gültigen Sprache abgefaßter Satz, der in eindeutiger Weise mit einem der Wahrheitswerte ‘w’
(für ‘wahr’) oder ‘f ’ (für ‘falsch’) belegt werden kann. Neben den Aussagen
(die hier so etwas wie Konstanten sind), benutzt man Aussagevariablen, die
beliebige Wahrheitswerte annehmen können. Aussagen und Aussagevariable
können durch Junktoren wie ∨ (‘oder’), ∧ (‘und’) oder auch ⇒ (‘impliziert’)
miteinander verbunden oder durch ein vorangestelltes ¬ negiert werden. Das
bei dieser Gelegenheit entstehende Produkt nennt man aussagelogische Formel. Welchen Wahrheitswert eine solche Formel bei Belegung durch Wahrheitswerte annimmt, entnimmt man sogenannten Wahrheitstafeln. Im Falle
der gerade erwähnten Junktoren lauten diese:
a
f
f
w
w
b
f
w
f
w
a∧b
f
f
f
w
a
f
f
w
w
b
f
w
f
w
a∨b
f
w
w
w
sowie
a
f
f
w
w
b
f
w
f
w
a⇒b
w
w
f
w
Zu beachten ist der von der Umgangsprache häufig abweichende Gebrauch
von “oder” sowie die vielleicht überraschende Wahrheitstafel der Implikation.
Eine aussagelogische Formel heißt gültig, wenn diese bei jeder Belegung der in ihr auftretenden Variablen stets wahr ist. Zwei aussagelogische
Formeln, die von denselben Variablen abhängen heißen äquivalent, wenn
identische Belegungen der Variablen für beide Formeln zu stets denselben
Wahrheitswerten führen. Zwei aussagelogische Formeln A(a1 , . . . , an ) und
B(a1 , . . . , an ) sind äquivalent genau dann, wenn A(a1 , . . . , an ) ⇔ B(a1 , . . . , an )
gültig ist. Hier ist a ⇔ b durch (a ⇒ b) ∧ (b ⇒ a) definiert. Beispiele für
äquivalente Aussagen sind (a ⇒ b) ⇔ (¬a ∨ b) (was zeigt, dass die Implikation gar nicht in die anfängliche Liste von Junktoren mit aufgenommen
werden müsste), die Distributivgesetze
a ∨ (b ∧ c) ⇔ (a ∨ b) ∧ (a ∨ c),
a ∧ (b ∨ c) ⇔ (a ∧ b) ∨ (a ∧ c)
sowie die de Morganschen Regeln
¬(a ∨ b) ⇔ ¬a ∧ ¬b
¬(a ∧ b) ⇔ ¬a ∨ ¬b.
Es gibt einen engen Zusammenhang zwischen aussagelogischen Formeln und
Mengen. Nach Auszeichnung einer (großen) Grundmenge G selektiert eine
Formel A, in die die Elemente von G eingesetzt werden können, die Elemente
einer Menge
M = {g ∈ G | A(g) ist wahr } .
Werner, Universität Münster, WS 05/06
3
Für aussagelogische Formeln gibt es entsprechende Mengenoperationen: Vereinigung bzw. Durchschnitt entsprechen ∨ bzw. ∧, oder
{g ∈ G | A(g) ist wahr } ⊂ {g ∈ G | B(g) ist wahr }
⇔
für alle g ∈ G gilt A(g) ⇒ B(g)
D.h. wir sehen hier, dass die Sprache “Aussagelogik” mit Inhalt gefüllt werden und über “Mengenlehre” sprechen kann.
Der aussagelogische Kalkül spricht übrigens auch über Schaltkreise: Jeder Variablen ordnet man einen Schalter zu, und einer aussagelogischen
Formel entspricht ein ganzes Netzwerk von Schaltern. Dabei wird verabredet, dass eine Variable mit dem Wahrheitswert w zu belegen ist, falls der
Schalter sich in dem Zustand ‘Strom fließt’ befindet, und mit f , falls ‘kein
Strom fließt’. Die logischen Verknüpfungen zwischen den Variablen lassen
sich dann stets durch passende Verdrahtungen zwischen den Schaltern realisieren. So entspricht beispielsweise ‘a ∨ b’ der Parallel– und ‘a ∧ b’ der
Reihenschaltung der zu a und b gehörigen Schalter, die Negation erhält man
durch Umkehrung der Schalterstellung. Man kann sich überlegen, dass diese
Schaltelemente zusammen mit der Negation in der Tat ausreichen, um jede
auch noch so komplizierte Schaltung aufzubauen.
Zum Beispiel besitzt die Treppenhausschaltung (Licht soll ein- bzw. ausgeschaltet werden, wenn irgendwo im Treppenhaus der Schalter umgelegt
wird) mit zwei Schaltern a und b und einem Ausgang L (an dem die Lampe hängt) nach Festlegung des Zustands “Dunkelheit im Treppenhaus” die
Wahrheitstafel
a b L
f
f
f
f w w
w f w
w w f
und wird modelliert durch die Formel L = (¬a ∧ b) ∨ (a ∧ ¬b).
Die Vereinfachungen, die man durch äquivalente Umformung der modellierenden aussagelogischen Formeln erhält, führen oft zu Vereinfachung
beim Aufbau von Schaltungen.
Quantoren
Es ist günstig, häufig benutzte Sprechweisen abzukürzen. Sehr wichtig sind
die Quantoren ∀ (“für alle”) und ∃ (“es gibt ein”). So ist etwa für M ⊆ Z
∃S ∈ Z ∀m ∈ M
gilt m ≤ S
die Aussage “Die Menge M ist beschränkt”. Man beachte, dass man die
Reihenfolge von Quantoren auf keinen Fall ändern darf; denn z.B.
∀m ∈ M ∃S ∈ Z mit m ≤ S
4
Mathematik für Physiker und Informatiker I (Kurzskript)
beschreibt eine Eigenschaft, die jede Teilmenge von Z besitzt.– Praktisch
sind Quantoren, um die Negation einer Aussage zu bestimmen: Man tauscht
überall ∃ und ∀ gegeneinander aus und negiert die ganz rechts stehende
Aussage. So ist eine Menge M ⊆ Z unbeschränkt, falls
∀S ∈ Z ∃m ∈ M
mit
m 6≤ S
bzw.
∀S ∈ Z ∃m ∈ M
mit
m>S
Auch für Quantoren gibt es eine entsprechende Konstrukion für Mangen.
Dabei ist ∃ mit der Vereinigung von Mengen, und ∀ mit deren Durschnitt
verknüpft: Ist A eine Menge von Indizes α, so bezeichnet man ein System
von Mengen Mα , α ∈ A, als eine (über A indizierte) Familie von Mengen.
Man setzt
[
Mα = {m ∈ G | ∃α ∈ A mit
m ∈ Mα }
sowie
α∈A
\
Mα = {m ∈ G | ∀α ∈ A
gilt m ∈ Mα }
α∈A
Streng genommen betreten wir hier recht dünnes Eis; denn wir trauen uns ja
zu, eine beliebig große Anzahl (und das kann in der Mathematik sehr groß
sein) von Aussagen auf einmal in den Griff zu bekommen.
I. Zahlen
1. Ganze Zahlen
A. Vollständige Induktion oder: Wann ist eine Teilmenge von N
gleich N? Gilt für eine Menge M von natürlichen Zahlen
• 1∈M
• ∀m ∈ M
gilt m + 1 ∈ M ,
so ist M = N. Die Tatsache, dass jede Teilmenge M von N ein kleinstes
Element m0 = min M enthält, erlaubt die folgende Variante dieser Aussage:
Es gilt M = {n ∈ N | n ≥ m0 }, falls aus m ∈ M folgt m + 1 ∈ M . Anwendung findet diese Beobachtung auf das Prinzip der vollständigen Induktion:
Danach kann man eine von n ∈ N abhängige Aussage A(n) für alle n ≥ n0
beweisen, falls man zuerst A(n0 ) beweist (diesen Vorgang nennt man auch
den Induktionsanfang) und sodann nachweist, dass A(n+1) aus der Aussage
A(n) (Induktionsschritt) folgt. 1
1
Neben der hier erwähnten sind auch die folgende Varianten der vollständigen Induktion sind in Gebrauch:
• Gilt A(n0 ) und
∀n ∈ N, n ≥ n0
gilt
A(n) ⇒ A(n + 1),
Werner, Universität Münster, WS 05/06
5
Nicht nur für Beweise ist diese Technik von Bedeutung; auch Definitionen
lassen mit ihrer Hilfe rekursiv durchführen. Beispiele sind die Zeichen “Σ”
und “Π” oder auch die rekursive Definition von Folgen.
Beispiele Jede Zahl der Form n3 − n, n ∈ N, ist durch 3 teilbar.
(Diese Aussage folgt eigentlich aus der Tatsache, dass das Produkt dreier
aufeinander folgender Zahlen stets durch 3 teilbar sein muss; wenn man sie
bereits kennt, lässt sich diese Aussage bequem durch vollständige Induktion
beweisen.)
Trägt man zu Beginn eines jeden Jahres einen festen Betrag K zur Bank,
der jährlich zu p% verzinst wird, dann beträgt das kurz nach Beginn des nten Jahrs angesparte Kapital
p n
p n+1
p Kn = K 1 +
+K 1+
+ ··· + K 1 +
+K =
100
100
100
n
X
p ν
.
=
K 1+
100
ν=0
Eine Summe dieser Form heißt geometrisch, und durch vollständige Induktion zeigt man, dass für a0 , q ∈ Q gilt
n
X
a0 q ν = a0
ν=0
q n+1 − 1
q−1
h
i
p n+1
(was hier die sogenannte Rentenformel Kn = K 100
−
1
er1
+
p
100
gibt). Eine andere wichtige Summenformel, die durch vollständige Induktion
bewiesen werden kann, ist die binomische Formel
n X
n ν n−ν
n
(a + b) =
a b
.
ν
ν=0
Dabei sind die in ihr auftretenden Binomialkoeffizienten definiert durch
n
n!
n(n − 1) · · · (n − k + 1)
=
.
=
k!(n − k)!
k(k − 1) · · · 2 · 1
k
Der Induktionsschritt macht Gebrauch von der für die ganzen Zahlen 0 ≤
k ≤ n gültigen Beziehung
n
n
n+1
+
=
k
k−1
k
so gilt A(n) für alle natürlich Zahlen n ≥ n0 .
• Gilt A(n0 ) und
∀n ∈ N, n ≥ n0
gilt
A(1), A(2), . . . , A(n) ⇒ A(n + 1),
so gilt A(n) für alle natürlich Zahlen n ≥ n0 .
6
Mathematik für Physiker und Informatiker I (Kurzskript)
Erklären kann man das Auftreten der Binomialkoeffizienten
in der binomi
schen Formel, wenn man weiß, dass nk angibt, wieviele verschiedene Teilmengen mit k Elementen eine n-elementige Menge besitzt.
B. Algebraische Struktur und Anordnung Auf der Menge Z kann
man addieren und multiplizieren. Erinnert sei daran, dass
• Multiplikation und Addition das Assoziativ- und Kommutativgesetz
erfüllen,
• dass es ein Distributivgesetz gibt, welches das Aufeinandertreffen von
Addition und Multiplikation regelt
• und dass es sogenannte neutrale Elemente 0 und 1 gibt, die durch
Addition bzw. Multiplikation eine ganze Zahl nicht verändern.
Neben der algebraischen Struktur ist die Anordnung der ganzen Zahlen wichtig. Die Ordnungsrelation “≤” besitzt die Eigenschaft, dass für alle
Zahlen p, q und r gilt
• p ≤ p (Reflexivität)
• p ≤ q und q ≤ r hat zur Folge, dass p ≤ r (Transitivität)
• Es gilt stets p < q oder p > q oder p = q
Das Aufeinandertreffen von Ordnugs- und algebraischer Struktur wird kontrolliert durch die Tatsache, dass Summe und Produkt positiver Zahlen stets
positiv sind.
Eine Zahl s heißt obere (untere) Schranke der Menge M ⊆ Z, falls für
alle m ∈ M gilt m ≤ s (bzw. m ≥ s). M heißt nach oben (unten) beschränkt,
falls M eine obere (untere) Schranke besitzt. Falls M eine obere Schranke
besitzt, die in M enthalten ist, so nennt man dieses (eindeutig bestimmte)
Element das Maximum oder auch das größte Element von M . Analog definiert man das Minimum (das kleinste Element) von M . Nicht jede Menge
ganzer Zahlen besitzt ein Maximum (Minimum).
Ergänzung. Die Existenz kleinster natürlicher Zahlen* Man kann kann sich abschließend fragen, ob das Prinzip der vollständigen Induktion aus mehr grunglegenden
Axiomen abgeleitet werden kann. Tatsächlich ist dieses Prinzip eng verwandt mit den sogenannten Peano-Axiomen, die die natürlichen Zahlen charakterisieren. Wir gehen hierauf
nicht weiter ein, sondern zeigen noch, dass das Prinzip der vollständigen Induktion äquivalent zu der (gleichfalls nützliche) Aussage Jede (nicht leere) Teilmenge M von N besitzt
ein kleinstes Element ist: Es sei M ⊆ N nicht leer und U die Menge der unteren Schranken von M , die nicht in M enthalten sind. Wir nehmen nun an, dass M kein kleinstes
Element enthält. Dann folgt aus dem Prinzip der vollständigen Induktion, dass U = N,
M = ∅ und daraus die Behauptung.— Nimmt man umgekehrt an, dass jede nicht leere
Werner, Universität Münster, WS 05/06
7
Menge natürlicher Zahlen ein kleinstes Element besitzt, so ergibt sich daraus das Prinzip
der vollständigen Induktion: Es sei M ⊆ N mit 1 ∈ M und k ∈ M ⇒ k + 1 ∈ M . Falls
M c = N \ M 6= ∅, enthält diese Menge ein kleinstes Element k. Natürlich ist k 6= 1, und
k − 1 ist eine natürliche Zahl, die in M liegen muss. Dann aber ist nach Annahme auch
k = (k − 1) + 1 in M , und es gilt nicht: k − 1 ∈ M ⇒ k ∈ M .
2. Grenzwerte
A. Die rationalen Zahlen Die algebraische Struktur der Menge Q unterscheidet sich bekanntlich von der auf Z dadurch, dass man beliebige Zahlen
durch solche teilen kann, die von Null verschieden sind. Zusätzlich zu den
im Abschnitt I.1.A angeführten algebraischen Eigenschaften tritt also der
‘multiplikative’ Teil der Aussage
• Für jedes Element q ∈ Q existiert ein multiplikatives und additives
Inverses, d.h. es gibt Zahlen −q und q −1 mit
q + (−q) = 0
q · q −1 = 1
bzw.
All diese Eigenschaften fasst man in einer einzigen Definition zusammen und
sagt kurz, dass (Q, +, ·) ein Körper ist. Auch auf Q gibt es eine Ordnung,
die wieder die Axiome des Abschnitts I.1.A erfüllt. Die Kurzfassung lautet
hier: (Q, +, ·, ≤) ist ein geordneter Körper.
Eine große Rolle spielt im folgenden die auf Q definierte Betragsfunktion,
|a| = max{a, −a} =


a
falls a ≥ 0
.

−a falls a < 0
Wichtige Beziehungen, die der Betrag für beliebige a, b ∈ Q erfüllt, sind
−|a| ≤ a ≤ |a|
|ab| = |a||b|
sowie die Dreiecksungleichung
|a + b| ≤ |a| + |b|.
Die Dreiecksungleichung
giltP
für a1 , . . . , an ∈ Q auch in der Form (vollständiPn
ge Induktion!) | ν=1 aν | ≤ nν=1 |aν |. Eine weiter Variante ist ||a| − |b|| ≤
|a − b|. Technisch gesprochen erfordert ein genaueres Rechnen mit Beträgen,
Fallunterscheidungen durchzuführen. Wichtig ist die Tatsache, dass durch
d(a, b) = |a − b|
8
Mathematik für Physiker und Informatiker I (Kurzskript)
der Abstand zwischen den beiden Zahlen a, b ∈ Q definiert wird2 . So ist also
für rationale Zahlen a und α > 0
{q ∈ Q | |q − a| ≤ α } = {q ∈ Q | a − α ≤ q ≤ a + α }
die Menge der q ∈ Q, die von dem Punkt a einen Abstand haben, der
höchstens gleich α ist.
B. Es können nicht immer Wurzeln gezogen werden (Teil 1) Man
ist daran gewöhnt, dass an jeder Zahlenmenge irgendwann herumgenörgelt
wird. Natürlich auch an Q. Unser erster Kritikpunkt:
Satz 1 Falls N ∈ N keine Quadratzahl ist, dann gibt es auch kein Element
q ∈ Q mit q 2 = N
Der Kernpunkt des Beweises ist die Tatsache, dass jede ganze Zahl k ∈ Z
eine bis auf die Reihenfolge eindeutig festgelegt Zerlegung in Primfaktoren
besitzt:
Satz 2 Für jede ganze Zahl k ∈ Z \ {±1} gibt es ein Vorzeichen ε ∈ {±1},
Primzahlen p1 < p2 < . . . < pn sowie Exponenten α1 , . . . , αn ∈ N, so dass
k=
εpα1 1 pα2 2
· · · pαnn
=ε
n
Y
pαν ν .
ν=1
Q
βµ
Ist k = η m
µ=1 qµ eine weitere solche Darstellung, so folgt η = ε, m = n,
und, falls µ = ν, pν = qµ sowie αν = βµ .
Dieser Satz lässt sich durch vollständige Induktion beweisen, was wir hier
aber nicht tun wollen.
Beim Beweis von Satz 1 nimmt man an, es gäbe doch eine rationale Zahl
q ∈ Q (von der wir annehmen dürfen, dass sie positiv ist) mit q 2 = N . Es
sei


−1
n
m
Y
Y
s
β
pαν ν 
qµ µ 
q= =
t
ν=1
µ=1
eine Darstellung von q mit Hilfe der Primfaktorzerlegung, wobei t 6= 1, da
N ja keine Quadratzahl ist. Wir nehemen außerdem an, dass dieser Bruch
2
Warum ist das der Abstand von a und b? Wenn man diese Frage nicht durch Beispiele
klären möchte, dann ist dies eine gute Gelegenheit, die axiomatische Methode auszuprobieren. Wenn man nämlich nur davon ausgeht, dass der Abstand von a und b gleich bleibt,
wenn man beide Punkte um eine feste Zahl r > 0 verschiebt, und wenn man ferner festlegt, dass der Abstand von q ∈ Q zum Nullpunkt gleich |q| sein soll, dann bleibt für den
Abstand zwischen a und b schon nichts anderes mehr als |a − b|.
Werner, Universität Münster, WS 05/06
9
gekürzt ist, dass also Zähler und Nenner keine gemeinsamen Primfaktoren
mehr enthalten. Es ergibt sich
2αm
2αn
1 2α2
= N q12α1 q22α2 · · · qm
p2α
1 p2 · · · pn
was, nachdem wir auch N in Primfaktoren zerlegt haben, auf zwei verschie2αn führt.
1 2α2
dene Primfaktorzerlegungen für die Zahl p2α
1 p2 · · · pn
Die Zahlenmenge, in der Wurzeln und, allgemeiner, die Nullstellen aller Polynome mit rationalen Koeffizienten enthalten sind, nennt man die Menge
der algebraischen Zahlen. Wir sind hier auf dem Weg zur Menge der reellen Zahlen, die viel, viel umfangreicher ist als die Menge der algebraischen
Zahlen3
C. Konvergente Folgen Es gibt Folgen von Zahlen, bei denen man zu
sehen glaubt, dass ihre Glieder einer Zahl a immer näher kommen und diese
‘letztlich’ erreichen, ohne dass ein Folgenglied den Wert a je wirklich erreicht.
Beispiele sind die Werte der Folge
0, 9,
0, 99,
0, 999,
0, 9999,
0, 99999,
0, 999999, . . . ,
die eine entscheidende Rolle bei der Antwort auf die Frage spielen, ob 0, 9
wirklich gleich 1 ist. Ein bereits den Griechen im Altertum bekanntes Beispiel ist die Folge (tn ) der Momente, zu denen der zehnmal so schnelle Achilles scheinbar vergeblich versucht, eine Schildkröte zu überholen: Starten beide zur selben Zeit, besitzt die Schildkröte einen Vorsprung von 10m und
erreicht der schnelle Läufer diesen Punkt nach einer Sekunde, so besitzt die
Schildkröte dann immerhin noch eine Vorsprung von 1m. Dieser Vorsprung
und die dann jedes Mal neu verstrichene Zeit schmelzen beide um den Faktor
10, wenn Achilles dort ankommt, wo die Schildkröte sich zuvor aufgehalten
hat, und so scheint es unmöglich, dass er die Schildkröte überholt.
Ein mathematisches Modell für die Behandlung solcher Probleme benutzt den Begriff der konvergenten Folge:
Definition 1 Eine Folge (an )n∈N rationaler Zahlen heißt konvergent gegen
den Grenzwert a ∈ Q genau dann, wenn
Für jede Genauigkeit ε > 0 gibt es einen ersten Folgenindex
N (ε) ∈ N, so dass für die N (ε) nachfolgenden Folgenindizes
n ≥ N (ε) gilt
|a − an | < ε.
3
In der Menge der algebraischen Zahlen sind z.B. π und e noch nicht enthalten, die
man aus diesem Grund transzendent nennt. Wenn man genau hinsieht, stellt man fest,
dass die Menge der reellen Zahlen von einer neuen Art unendlich ist, eine Unendlichkeit,
die die der Zahlenmengen N, Z, Q und selbst die der algebraischen Zahlen übersteigt.
10
Mathematik für Physiker und Informatiker I (Kurzskript)
Falls (an )n∈N den Grenzwert a besitzt, so schreibt man
lim an = a
n→∞
Konvergiert eine Folge gegen Null, so nennt man sie eine Nullfolge. Falls
(an ) gegen den Wert a konvergiert,
so ist (|a − an |)n∈N eine Nullfolge. Eine
1
gut untersuchte Nullfolge ist n . Ist q ∈ Q, so gilt:
1) Ist |q| < 1, so ist (q n )n∈N eine Nullfolge,
2) für q = 1 ist (q n )n∈N eine Nullfolge, für q = −1 divergiert diese Folge,
und
3) für |q| > 1 ist die Folge (q n )n∈N divergent.
Der Nachweis im konvergenten Fall gelingt mit Hilfe der für alle n ∈ N und
alle δ ≥ −1 gültigen Bernoullischen Ungleichung
(1 + δ)n ≥ 1 + nδ,
die man mit vollständiger Induktion zeigt. Es folgt nämlich aus 1 > |q| =
(1 + δ)−1 , 1 ≥ δ > −1, dass
|q n | = (1 + δ)−n <
1
1
<
1 + nδ
nδ
Der hier ganz rechts stehende Ausdruck ist eine Nullfolge, und wenn man
eine Folge nichtnegativer Zahlen erst einmal durch eine Nullfolge nach oben
abgeschätzt hat, dann ist sie selbst eine. – Dass die Folge (−1)n divergiert,
lässt sich an dieser Stelle nur etwas umständlich herleiten mit Hilfe der Negation der Aussage ‘Es gibt eine Zahl a, gegen die die Folge (an ) konvergiert’,
nämlich
∀a ∈ Q ∃ε0 > 0 ∀N ∈ N ∃n ≥ N
mit
|a − an | ≥ ε.
Die Divergenz im Fall |q| > 1 folgt am einfachsten aus (nochmals der Bernoulli Ungleichung sowie) Teil (a) des folgenden Satzes.
Satz 3 Es sei (an )n∈N eine gegen a konvergente Folge. Dann gilt
(a) (an ) ist beschränkt, d.h. die Menge der Folgenglieder {an | n ∈ N } ist
beschränkt.
(b) Für jede Zahl b 6= a gibt es einen Index N ∈ N mit der Eigenschaft,
dass für alle nachfolgenden Indizes n ≥ N jeweils gilt
|an − b| >
|a − b|
.
2
Insbesondere ist der Grenzwert der Folge (an )n∈N eindeutig bestimmt.
Werner, Universität Münster, WS 05/06
11
Für den Beweis der ersten Aussage wählt man für ε = 1 den Index N1 ∈ N,
für dessen Nachfolger n ∈ N gilt |a − an | < 1. Für diese Indizes ist dann
nach der Dreiecksungleichung |an | ≤ 1 + |a|, so dass für alle Indizes n ∈ N
gilt
|an | ≤ max{|a1 |, . . . , |aN |, 1 + |a|}
Im Teil (b) wählt man den Startindex N ∈ N für den Wert ε =
Falls n ≥ N, folgt
|an − b| ≥ |b − a| − |a − an | >
1
2 |a
− b|.
|a − b|
.
2
D. Grenzwertsatz und Beispiele
Satz 4 Es seien (an )n∈N , (bn )n∈N und (cn )n∈N Folgen, (an )n∈N und (bn )n∈N
seien konvergent mit limn→∞ an = a und limn→∞ bn = b. Dann gilt
(a) Die Folgen (an + bn )n∈N und (an bn )n∈N konvergieren mit
lim an + bn = a + b
n→∞
und
lim an bn = ab
n→∞
Falls b 6= 0, dann gibt es einen Index N ∈ N mit bn 6= 0 für n ≥ N und
−1
die ab diesem Index definierte Folge an b−1
n konvergiert gegen ab .
(b) Gilt von einem gewissen Index N ∈ N an, dass an ≤ bn , so folgt a ≤ b.
(c) Ist a = b und für n ≥ N stets
an ≤ cn ≤ bn ,
dann konvergiert auch (cn ) gegen den gemeinsamen Grenzwert von
(an ) und (bn ).
Für die Summenfolge wird N (ε) = max{Na (ε/2), Nb (ε/2)} gewählt (wobei Na (ε) und Nb (ε) die zu ε > 0 gehörenden Startindizes für die Folgen
(an ) und (bn ) sind) und mit der Dreiecksungleichung abgeschätzt. Im Fall
der Produktfolgen nutzt man die Beschränktheit konvergenter Folgen, wählt
M > 0 mit |bn | ≤ M für alle n ∈ N und schätzt für einen Index n ∈ N ab
|ab − an bn | ≤ |a||b − bn | + M |a − an |.
Ist nun N ∈ N so groß gewählt, dass für n ≥ N
|a − an | <
ε
2M
und
|b − bn | <
ε
,
2 + 2|a|
dann folgt |ab − an bn | < ε. Für die Aussage über die Quotienten reicht es,
von der konstanten Folge an = 1 auszugehen. Nach Satz 3(b) gibt es N ∈ N,
12
Mathematik für Physiker und Informatiker I (Kurzskript)
so dass für alle n ≥ N stets |bn | > |b|/2 ist. Für diese Indizes sind alle Brüche
wohldefiniert, und es folgt außerdem
1
− 1 < 1 |b − bn |,
b bn 2|b|2
so dass für N (ε) = max{N, Nb (2ε|b|2 )} und n ≥ N (ε) folgt |1/b − 1/bn | < ε.
Wäre im Teil (b) a > b, dann würde ab einem passend gewählten Index N
gleichzeitig gelten
an > a −
a−b
a+b
=
2
2
sowie
bn < b +
a−b
a+b
=
,
2
2
was der Bedigung an ≤ bn widerspricht. Für den Teil (c) schließlich wählt
man N (ε) = max{Na (ε), Nb (ε)}, so dass also für n ≥ N(ε) gilt [an , bn ] ⊆
(a−ε, a+ε). Da aber nach Annahme cn ∈ [an , bn ] muss auch cn ∈ (a−ε, a+ε),
folglich |a − cn | < ε.
Ein wichtiges Besipiel: Für |q| < 1 gilt
∞
X
a0 q ν := lim
ν=0
n→∞
n
X
a0 q ν =
ν=0
a0
.
q−1
Die letzte Beziehung zeigt: Die Zahl 0, 9, die nicht anders als ein Grenzwert
definiert werden kann, ist gleich 1; und auch Achilles holt die Schildkröte
schließlich nach 10
9 Sekunden ein, wenn man sich gestattet, die geschilderte
Aufholjagd mit Hilfe einer konvergenten Folgen von Zeiten zu modellieren.
Wir benötigen im Folgenden weitere Beispiele. Wir werden nun bereits Wurzeln ziehen, ohne zunächst weiter auf den Zahlbereich einzugehen, für den
das möglich ist. Wichtige weitere Grenzwerte sind (für a > 0):
√
√
lim n a = 1 sowie lim n n = 1.
n
n
Im ersten Fall reicht es wegen des Teils (a) des Grenzwertsatzes, von a > 1
auszugehen. Man setzt für diesen Fall a = (1 + δn )n , δn > 0, schätzt mit
Hilfe der Bernoulli-Ungleichung ab und erhält δn < (a−1)/n. Für die zweite
Folge erhält man in ähnlicher Weise durch einen weiteren Rückgriff auf die
binomische Formel
r
n 2
2
n
n = (1 + δn ) >
δn
sowie
δn <
.
2
n−1
E. Teilfolgen Die Folge
an = (−1)n
hatten wir bereits als divergent indentifiziert — etwas umständlich durch
die Negation des Konvergenzkriteriums oder, mehr anschaulich, aufgrund
Werner, Universität Münster, WS 05/06
13
der Tatsache, dass sie sich nicht zwischen −1 und 1 entscheiden kann. Dieser letzte Gesichtspunkt soll hier noch etwas genauer erläutert werden. Die
Idee, dass Folgen aus vielen anderen “zusammengesetzt” sein können (die
u.U. gegen verschiedene Grenzwerte konvergieren können) wird durch die
folgende Definition präzisiert:
Definition 2 Es sei (an ) eine Folge und (nk )k∈N eine Folge streng monoton
wachsender natürlicher Zahlen. Dann nennt man die Folge (ank )k∈N eine
Teilfolge der Folge (an ).
Dabei nennt man eine Folge (an ) (streng) monoton wachsend, wenn für alle
n ∈ N gilt an ≤ an+1 (bzw. an < an+1 ). In ähnlicher Weise definiert man
(streng) monoton fallende Folgen.
Satz 5 Eine Folge (an ) konvergiert genau dann, wenn jede ihrer Teilfolgen
dies tut. Der Grenzwert einer Teilfolge stimmt in diesen Fällen mit dem
Grenzwert der gesamten Folge überein.
Da jede Folge Teilfolge ihrer selbst ist, folgt deren Konvergenz aus der Konvergenz aller Teilfolgen. Ist umgekehrt (an ) gegen a konvergent, (ank ) eine
Teilfolge und N (ε) der zu ε > 0 gehörige Startindex, so gilt wegen k ≤ nk
für alle k ∈ N (vollständige Induktion!), dass |a − ank | < ε für alle k ≥ N(ε).
Die uns bereits bekannte Folge an = (−1)n zerlegt sich nun tatsächlich
in die beiden Teilfolgen amk und ank mit mk = 2k, nk = 2k − 1, es gilt
limk→∞ amk = 1 sowie limk→∞ ank = −1, und, nun wissen wir es ganz
genau, (an ) kann nicht konvergieren.– Im Folgenden werden auch Teilfolgen
der Form (an+n0 ), n0 ∈ N fest, eine wichtige Rolle spielen.
Der O(n)-Kalkül* Ein wesentlicher Bestandteil im Umgang mit Folgen ist das Abschätzen
komplizierter Terme durch einfache, die das Verhalten der komplizierten gut widerspiegeln,
zugleich aber in ihrem Verhalten für große n leichter zu beurteilen sind. Häufig benutzt
wird hierzu der sogenannte O-Kalkül: Von einer Folge (an ) sagt man, sie wachse für n → ∞
(wenigstens) von der Ordnung ϕ(n), ϕ eine auf N definierte Funktion, Funktion, falls es
eine Zahl M ≥ 0 gibt mit der Eigenschaft, dass
|an | ≤ M ϕ(n)
für alle n ∈ N, n ≥ N0 .
In diesem Fall schreibt man auch
an = O(ϕ(n))
für n → ∞.
Beispiele: Falls es ein α ∈ N und an = O(nα ) für n → ∞, so sagt man auch, (an ) besitzt
polynomiales Wachstum. Z.B. gilt an = O(nk√) für jede durch ein Polynom definierte Folge
√
an = Ak nk + Ak−1 nk−1 + . . . + A1 n + A0 , n + 1 − n = O(n−1/2 ), und, wie gesehen,
gilt für jedes a > 0
√
√
n
n
a − 1 = O(n−1 )
sowie
n − 1 = O(n−1/2 ).
14
Mathematik für Physiker und Informatiker I (Kurzskript)
3. Reelle Zahlen
A. Konvergenz ohne einen Grenzwert zu kennen Wie berechnet
man die Wurzel aus einer gegebenen Zahl a, zumindest approximativ, in
systematischer Weise, ohne zu probieren, also direkt mit einem (vielleicht
sogar programmierbaren) Algorithmus?
Ein bekannter Versuch (der auf dem Newton-Verfahren und damit letztlich
auf dem Banachschen Fixpunktsatz basiert) besteht darin, zu versuchen
√
einen Schätzwert an für a durch
1
a
an+1 =
an +
2
an
zu verbessern. Beginnt man etwa mit dem (meist nicht besonders klug
gewählten) Schätzwert a0 = 1, so gelangt man zu einer (rekursiv definierten) Folge, von der es ohne Weiteres nicht ganz leicht ist zu sehen, ob sie
konvergiert. Eins jedoch ist klar: Falls sie das tut, so muss auch die Teilfolge
(an+1 ) gegen denselben Grenzwert w konvergieren, und es folgt
1
a
a = lim an = lim an+1 =
a+
.
n→∞
n→∞
2
a
Da stets an > 0, müsste a die Quadratwurzel von a sein.
Warum sollte nun die Folge (an ) konvergieren? Man kann in diesem Fall
nur sehr indirekt zu Werke gehen. Eine einfache Rechnung zeigt, dass gilt
2
1
x
1
2
an −x =
an−1 −
(a2 −x) > 0,
>0
sowie
an −an+1 =
4
an−1
2an n
woraus folgt, dass (an ) für n ≥ 1 monoton fallend und nach unten beschränkt
ist. Man kann es anschaulich überzeugend finden, dass dieses Verhalten einer Folge deren Konvergenz erzwingen sollte. In einer anderen Verkleidung
kommt dieselbe Struktur bei dem Begriff der Intervallschachtelung zum Tragen. Dies ist eine Folge (In ) von abgeschlossenen Intervallen In = [an , bn ]
mit den beiden Eigenschaften
• Für alle n ∈ N gilt In+1 ⊆ In sowie
• limn→∞ (bn − an ) = 0
Wenn man will kann man eine Intervallschachtelung als die Idealisierung
einer sich fortwährend verbessernden Messung einer Naturkonstanten ansehen; nicht zuletzt von diesem Standpunkt aus sollte eine Intervallschachtelung dann genau einer SZahlëntsprechen, nämlich der einzigen, die in allen
Intervallen zugleich enthalten ist. Eins ist aber völlig klar:
Es gibt Folgen von rationalen Zahlen, von denen man allen Grund hat
anzunehmen, dass sie konvergent sind, die aber auf keinen Fall einen
Grenzwert in Q besitzen können.
Werner, Universität Münster, WS 05/06
15
Ein sehr kluger, bei Anfängern dennoch nicht besonders beliebter, aber sehr
universell einsetzbarer Versuch, Konvergenz ohne Kenntnis des Grenzwerts
zu verstehen, geht auf den französischen Mathematiker Cauchy4 zurück und
lautet
Definition 3 Eine Folge (an ) heißt Cauchy-Folge genau dann, wenn es für
jedes ε > 0 ein N (ε) ∈ N gibt, so dass für alle Indizes n, m ≥ N (ε) gilt
|am − an | < ε.
Diese Definition sieht vielleicht plausibel aus, scheint aber nicht unbedingt
einfach zu verwenden zu sein. Es gibt aber sehr einfache hinreichende Kriterien für das Vorliegen einer Cauchy-Folge:
Satz 6 Eine Folge (an ) ist eine Cauchy-Folge, falls sie
(a) konvergiert oder
(b) monoton wächst (fällt) und nach oben (unten) beschränkt ist.
Der erste Teil folgt aus der Beobachtung, dass für m, n ≥ Na (ε/2) gilt
|an − am | ≤ |an − a| + |a − am | < ε.
Für den zweiten Teil nimmt man an, dass (die monoton wachsende, nach
oben beschränkte Folge) (an ) keine Cauchy-Folge ist, also
∃ε0 > 0 ∀N ∈ N ∃m, n ≥ N
mit |an − am | ≥ ε0 .
Unter diesen Umständen kann man (durch vollständige Induktion) zwei Folgen (mk ), (nk ) natürlicher Zahlen finden mit m1 < n1 < m2 < n2 < . . . <
mk < nk < mk+1 < nk+1 < . . . und amk > ank + ε0 . Es folgt
amk > ank + ε0 ≥ amk−1 + ε0 > ank−1 + 2ε0 ≥ . . . > an1 + (k + 1)ε0 ,
und das übertrifft bei freier Wahl von k ∈ N jede obere Schranke.
Die wichtige Frage aber ist: Konvergieren Cauchy-Folgen? Und da wissen
wir bereits, dass dies für die Zahlenmenge Q nicht der Fall ist.
B. Supremum, Infimum und Häufungswert Bevor wir die Menge der
rationalen Zahlen zu der Menge der reellen Zahlen erweitern, benötigen wir
ein paar weitere Begriffe.
4
http://www-groups.dcs.st-and.ac.uk/ history/Biographies/Cauchy.html
16
Mathematik für Physiker und Informatiker I (Kurzskript)
Es sei M eine Teilmenge eines geordenten Zahlenkörpers K5 sowie
OM = {k ∈ K | ∀m ∈ M
gilt m ≤ k }
und
UM = {k ∈ K | ∀m ∈ M
gilt m ≥ k }
die Menge der oberen bzw. unteren Schranken von M . Falls OM ein kleinstes
Element enthält, so nennt man dies das Supremum von M und bezeichnet
es mit sup M . In genau derselben Weise verfährt man mit UM und gelangt
zum Begriff es Infimums einer Menge M . Besitzt M ein größtes (kleinstes)
Element, so ist dieses stets das Supremum (Infimum) von M . Auf der anderen Seite besitzt die Menge (a, b) = {q ∈ Q | a < q < b } weder ein kleinstes
noch ein größtes Element. Hier sind
O(a,b) = {q ∈ Q | q ≥ b } = [b, ∞),
U(a,b) = {q ∈ Q | q ≤ a } = (−∞, a],
und sup(a, b) = b sowie inf(a, b) = a.
Definition 4 Ein Punkt p ist ein Häufungswert der Menge M falls es für
jedes ε > 0 ein Element m in M gibt, so dass |p − m| < ε.
Wählt man zu jedem n ∈ N einen Punkt mn ∈ M mit |p − mn | < 1/n, so
erkennt man, dass p ein Häufungswert genau dann ist, wenn es eine Folge in
M gibt, die gegen p konvergiert. Wir nennen im folgenden eine Menge der
Form
Uε (p) = {k ∈ K | |k − p| < ε }
eine ε-Umgebung des Punktes p.
Satz 7 (i) Die Zahl s ist das Supremum der Menge M genau dann, wenn
s zugleich obere Schranke und Häufungswert von M ist.
(ii) Eine monoton steigende (fallende) Folge (an ) konvergiert genau dann,
wenn das Supremum der Menge (Infimum) der Folgenglieder existiert.
In einem solchen Fall ist
lim an = sup {an | n ∈ N } .
n→∞
Das Supremum von M ist eine obere Schranke. Wäre s kein Häufungswert
von M , dann gäbe es in einer ε-Umgebung U von s kein weiteres Element aus
M und damit aber viele weitere obere Schranken von M , die echt kleiner
als s sind. Ähnlich sieht man, dass es zu einer oberen Schranke von M ,
die zugleich Häufungswert dieser Menge ist, keine wirklich kleinere obere
Schranke von M geben kann.— Für den Beweis der zweiten Aussage sei
5
Wer will, kann sich hier immer noch Q vorstellen, obwohl im kommenden Abschnitt
die folgende Definition für den Körper der reellen Zahlen benutzt wird. Auch braucht man
für die Definition weder Addtion noch Multiplikation sondern nur eine Ordnungsrelation.
Werner, Universität Münster, WS 05/06
17
s = sup {an | n ∈ N } sowie ε > 0. In der ε-Umgebung gibt es dann (nach dem
ersten Teil dieses Satzes) wenigstens ein Folgenglied aN (ε) . Da an monoton
wächst, liegen auch alle nachfolgenden Folgenglieder in dieser ε-Umgebung,
und (an ) konvergiert gegen s. Umgekehrt muss der Grenzwert einer monoton
wachsenden Folge eine obere Schranke sein. Da er zugleich Häufungswert der
Menge der Folgenglieder ist, ist er deren Supremum.
C. Der Zahlkörper R: Charakterisierung und Eigenschaften
Satz 8 Es gibt (im wesentlichen) genau einen (archimedisch) geordneten
Zahlenkörper (R, +, ·, ≤), in dem jede Cauchy-Folge bezüglich des Betrags
|r| = max{r, −r} einen Grenzwert besitzt.
In einem solchen Körper findet man übrigens (zuerst N durch mehrfache
Addition des neutralen Elements der Multiplikation, dann Z durch Subtraktion und schließlich) die Elemente von Q (durch Division) wieder, so dass Q
also in R ‘eingebettet’ ist.
Da wir bisher bei unseren Überlegungen über Q nur die Tatsache verwendet haben, dass Q ein geordneter Körper ist, können wir alle Definition
auch in derselben Weise für reelle Zahlen aussprechen und dann mit diesen genau dieselben Sätze beweisen. Wir werden hiervon im folgenden stets
Gebrauch machen, ohne darauf jedes Mal hinzuweisen.
Satz 9 In der Menge R gilt:
(i) Jede monoton wachsende (fallende) und nach oben (unten) beschränkte
Folge ist gegen ihr Supremum (Infimum) konvergent. Ganz allgemein
besitzt jede nach oben (unten) beschränkte Menge in R ein Supremum
(Infimum).
(ii) Für jede Intervallschachtelung (In ) aus R gibt es genau einen Punkt
ξ ∈ R mit
\
In = {x ∈ R | x ∈ In für alle n ∈ N } = {ξ}.
n∈N
Der Beweis des ersten Teils wird hier nicht weiter ausgeführt.
Für den Beweis von Teil (ii) beobachtet man, dass für die Randpunktfolgen (an ), (bn ) der Intervallfolge In = [an , bn ] gilt a1 ≤ a2 ≤ . . . ak ≤ ak+1 ≤
. . . bk+1 ≤ bk ≤ . . . ≤ b2 ≤ b1 . Dies zeigt, dass (an ) monoton wächst, nach
oben (durch b1 ) beschränkt ist, und dass (bn ) monoton fällt und nach unten
(durch a1 ) beschränkt ist. Aufgrund des ersten Teil des Satzes konvergieren
beide Folgen. Wegen limn→∞ bn −an = 0 besitzen sie denselben
Grenzwert ξ.
T
Da ξ = sup {an | n ∈ N } = inf {bn | n ∈ N } folgt ξ ∈ n∈N In . Eine weitere,
von ξ verschiedene Zahl η, etwa η < ξ, in diesem Schnitt würde der Tatsache
18
Mathematik für Physiker und Informatiker I (Kurzskript)
widersprechen, dass ξ die kleinste obere Schranke der Menge {an | n ∈ N }
ist.
Man kann R übrigens als Menge definieren, deren Elemente aus Mengen
gleichartiger Cauchy-Folgen von rationalen Zahlen bestehen. Zwei CauchyFolgen sieht man dabei als gleichartig an, wenn sie anscheinend dieselbe Zahl
in der Menge R beschreiben werden, d.h. wenn die Folge der Differenzen
eine Nullfolge bildet. Es ist sehr zeitraubend, den Nachweis zu erbringen,
dass eine solche Menge auch wirklich die oben angeführten Eigenschaften
besitzt. Insbesondere ergibt sich, dass es für jede reelle Zahl r ∈ R eine
Folge rationaler Zahlen gibt, die gegen r konvergiert. — R ist tatsächlich
sehr viel größer als die Menge der algebraischen Zahlen A, der Bereich,
aus dem fast alle Zahlen der Schulmathematik stammen, und der aus allen
Nullstellen von Polynomen mit rationalen Koeffizienten besteht. Während
die Elemente von A noch als Folge geschrieben werden können, ist dies mit
den Elementen von R nicht möglich, R ist überabzählbar.
3. Komplexe Zahlen
A. Es können nicht immer Wurzeln gezogen werden (Teil 2) Bekanntlich besitzt die Gleichung x2 + 1 = 0 keine Lösung über den reellen
Zahlen, was oft unpraktisch ist. Wer kühn genug ist, kann eine Lösung dieser Gleichung i nennen (die andere ist dann −i) und versuchen, mit dieser
Zahl einen neuen Zahlkörper aufzumachen, einer Menge also mit Produkt
und Addition, die sich beide so verhalten wie diese Operationen auf Q. Und
natürlich sollte man davon ausgehen, dass i zu den reellen Zahlen hinzugefügt wird. Denkt man diesen Gedanken zu Ende so gelangt man zu der
Menge
C = {x + iy | x, y ∈ R }
mitsamt den Verknüpfungen
(x1 + iy1 ) + (x2 + iy2 ) = x1 + x2 + i(y1 + y2 )
sowie
(x1 + iy1 )(x2 + iy2 ) = x1 x2 − y1 y2 + i(x2 y1 + x1 y2 ).
Für eine komlexe Zahl z = x + iy heißt x = Re z der Real-, y = Im z der
Imaginärteil von z. Die zu z konjugierte Zahl ist z = x − iy, und der Betrag
von z ist durch
p
√
|z| = zz = x2 + y 2
erklärt. Die Konjugation komplexer Zahlen ermöglicht es auch, in einfacher
Weise den Quotienten zweier komplexer Zahlen zk = xk + iyk , k = 1, 2 zu
berechnen,
z1
z 2 z1
x1 x2 + y1 y2 + i(x2 y1 − x1 y2 )
=
=
.
2
z2
|z2 |
x22 + y22
Die Art, wie die Addition zweier komplexer Zahlen funktioniert, erinnert
stark an die Addition zweier Vektoren der Ebene. In der Tat stellt man
Werner, Universität Münster, WS 05/06
19
sich komplexe Zahlen am besten als Punkte in der Ebene vor. Üblicherweise
trägt man den imaginären Anteil einer komplexen Zahl entlang der y- und
den reelle Anteil entlang der x-Achse ab. In dieser Weise wird die Addition
tatsächlich zur Vektoraddition, der Betrag von z ist der Abstand des zugehörigen Punktes vom Ursprung und die komplexe Konjugation entspricht
der Spiegelung an der x-Achse. Der (euklidische) Abstand zwischen zwei
komplezen Zahlen z1 und z2 ist so durch |z1 − z2 | gegeben.
Um auch die Geometrie des Produkts zu verstehen, benutzt man am
besten ebene Polarkoordinaten: Jede komplexe Zahl lässt sich als
z = (|z|, ϕ) = |z|(cos ϕ + i sin ϕ)
schreiben, wobei man ϕ stets so wählt, dass ϕ ∈ [0, 2π). (Anschaulich wird
hier jeder ebene Vektor durch Länge und Richtung beschrieben.) Einzig der
Nullpunkt ist kritisch: Für diesen ist |z| = 0 und ϕ im Prinzip beliebig.
Mit Hilfe der Polarkoordinaten lässt sich das Produkt zweier komplexer
Zahlen nun geometrisch deuten: Für zi = (ri , ϕi ), i = 1, 2, gilt nämlich
unter Verwendung der trigonometrischen Additionstheoreme
(r1 , ϕ1 ) · (r2 , ϕ2 ) = (r1 r2 , ϕ1 + ϕ2 )
Dabei sind die erhaltenen Winkel durch Addition ganzzahliger Vielfacher
von 2π auf einen Wert im Intervall [0, 2π) zu normalisieren. Hieraus ergeben
sich die n Wurzeln der Zahl (r, ϕ) als
√
ϕ + 2kπ
n
r,
,
k = 0, . . . , n − 1.
n
Wiederum ist es der Abstandsbegriff, der es erlaubt, die Konvergenz von
Folgen zu definieren:
Definition 5 Die Folge (zn ) komplexer Zahlen konvergiert gegen den Punkt
z ∈ C genau dann, wenn gilt
lim |zn − z| = 0.
n→∞
Tatsächlich geschieht hier nicht wirklich etwas Neues:
Satz 10 Die komplexe Folge (zn ) konvergiert gegen z ∈ C genau dann, wenn
lim Re zn = Re z
n→∞
sowie
lim Im zn = Im z.
n→∞
Konvergieren nämlich die Elemente zn = xn + iyn gegen z = x + iy, so folgt
eine Richtung dieser Aussage aus
p
|x − xn | ≤ |x − xn |2 + |y − yn |2 = |z − zn |
20
Mathematik für Physiker und Informatiker I (Kurzskript)
bzw. |y −yn | ≤ |z −zn |. Die andere Richtung aber ist eine einfache Folgerung
aus den Grenzwertsätzen sowie der Tatsache, dass für eine Folge (an ) positi√
√
ver, gegen a konvergenter Zahlen gilt limn→∞ an = a (die Stetigkeit der
Wurzelfunktion, eine Eigenschaft von Funktionen, über die noch gesprochen
werden muss). Ein interessantes Beispiel ist die Folge (q n ) mit q ∈ C und
|q| = 1. Ist für das Argument ϕ von q die Zahl ϕ/π rational, so besitzt die
Folge (q n ) genau endlich viele Häufungspunkte. Ist jedoch ϕ/π irrational, so
liegen die Folgenglieder q n dicht im ganzen Einheitskreis.
Die bisher besprochenen Definitionen und Sätze über relle Folgen und
Reihen erlauben es fast immer, sie direkt auf den komplexen Fall zu übertragen. Zumeist reicht es, die reelle durch die komplexe Betragsfunktion zu
ersetzen. So zeigt man z.B. ganz ähnlich wie zuvor, dass eine Folge komplexer Zahlen (zn ) eine Cauchy-Folge genau dann ist, wenn die Folgen der
Real- bzw. der Imaginärteile dies ist. Damit (und Satz 25) konvergiert eine
Folge in C (genau wie in R) genau dann, wenn sie eine Cauchy-Folge ist. —
Nicht möglich ist eine Übertragung solcher Resultate, wenn man im reellen
Fall die Anordnung dieser Zahlen berücksichtigen muss.
B. Reihen Ist (an ) eine Folge (komplexer oder reeller Zahlen), so bezeichnet der Ausdruck
∞
X
an
n=1
P
P
N
die Folge der Partialsummen (sN ) =
a
. Man nennt ∞
n
n=1 an eine
n=1
N
Reihe. Konvergiert die Folge der Partialsummen,Pso spricht man von einer
konvergenten Reihe. Für eine konvergente Reihe ∞
n=1 an ist (an ) stets eine
Nullfolge, die Umkehrung gilt nicht: Die harmonische Reihe
∞
X
1
1
1 1
1 1 1 1
=1+ +
+
+
+ + +
+ ··· >
n
2
3 4
5 6 7 8
n=1
1
1 1
1 1 1 1
1 1 1
>1+ +
+
+
+ + +
+ ··· = 1 + + + + ···
2
4 4
8 8 8 8
2 2 2
divergiert.
P
Eine Reihe heißt absolut konvergent genau dann, wenn ∞
n=1 |an | konvergiert.
Eine
absolut
konvergente
Reihe
ist
konvergent,
die
Umkehrung
gilt
P∞
n
−1
nicht: n=1 (−1)Pn konvergiert aber nicht absolut. DaP
die Folge der Par∞
tialsummen von ∞
|a
|
monoton
wächst,
konvergiert
n
n=1
n=1 an nach Satz
Pn
7 (ii) in R genau dann, wenn ( ν=1 |aν |)n eine beschränkte Folge ist. Ein
sehr wichtiges Beispiel: Für |q| < 1 ist
∞
X
ν=0
qν =
1
,
q−1
und diese Konvergenz ist absolut. Für |q| ≥ 1 divergiert die Reihe.
Werner, Universität Münster, WS 05/06
21
P∞
P
Satz 11 Es seien ∞
n=1 bn Reihen. Dann gelten die folgenden
n=1 an und
Konvergenzkriterien.
P
Majorantenkriterium
Ist
|a
|
≤
b
und
bn konvergent, so konvergiert
n
n
P
an absolut.
P
Minorantenkriterium Pbn divergiert, falls für fast alle Indizes n ∈ N
gilt 0 ≤ an ≤ bn und
an divergiert
P
Quotienten- und Wurzelkriterium
an konvergiert absolut, falls es einen
Index N0 ∈ N sowie eine positive Zahl q gibt, so dass für alle n ≥ N0
gilt
p
an+1 n
|an | ≤ q < 1.
oder
an ≤ q < 1
P
Die Reihe
an divergiert für den Fall, dass für alle n ≥ N0 gilt
p
an+1 n
oder
|an | > 1 für unendlich viele n.
an > 1,
Leibniz-Kriterium Eine Reihe der Form
∞
X
(−1)n an
n=1
konvergiert immer dann, wenn die Nullfolge (an ) streng monoton fällt
und an ≥ 0 ist.
Cauchysche Verdichtungskriterium
Ist an ≥ 0 und an+1 ≤ an , so konP
vergiert die Reihe
an genau dann, wenn
∞
X
2k a2k
k=1
dies tut.
Das Majoranten- bzw. Minorantenkriterium ergibt sich aus der Tatsache,
dass für eine Reihe mit positiven Summanden Konvergenz äquivalent zur
Beschränktheit der Folge der Partialsummen ist (Satz 9, Satz 3(a)):
PN Falls
bn ≥ |an | für fast alle n ∈ N, so ist jede einzelne Partialsumme n=1 |an |
P
durch N
Folgenglieder von
n=1 bn beschränkt, und dieselbe Schranke, die die
PN
PN
( n=1 |an |)N ∈N beschränkt, kann auch von den Zahlen n=1 bn nicht übertroffen werden. Ganz ähnlich
aus der
P folgt im Fall des Minorantenkriteriums
P
Unbeschränktheit von
an die der Partialsummen von
bn ,P
die ja alle
mindestens so stark wachsen, wie die Partialsummen der Reihe
an .
Für Wurzel- und Quotientenkriterium wendet man das Majoranten- bzw.
Minorantenkriterium an, unter Ausnutzung des bekannten
p Konvergenzverhaltens der geometrischen Reihe: Falls für n ≥ N0 gilt n |an | < 1, so ist
22
Mathematik für Physiker und Informatiker I (Kurzskript)
P n
n , und die Reihe
ür diese Indizes |an | < qp
q ist eine konvergente Man
jorante.
Ist
andererseits
|a
|
>
1
für
unednlich
viele Indizes n, so kann
n
P
an nicht konvergieren, da (an ) keine Nullfolge ist. Falls für alle n ∈ N
ab einem Startindex n0 gilt |an+1 ||an |−1 ≤ q < 1, so ist von da an stets
n−n0 |a |, so dass wiederum eine
|an+1 | ≤ q|an |, und induktiv folgt |aP
n| ≤ q
n0
konvergente geometrische Reihe — n (|a0 |q −n0 )q n — eine Majorante ist.
Falls |an+1 ||an |−1 > 1 für n ≥ n1 gilt, so ist dann stets |an+1 | > |an | und
auch hier kann (an ) keine Nullfolge sein6 .
Im Fall des Leibnizkriteriums folgt aus der Tatsache, dass (an ) streng
monoton fällt
2N
+2
X
(−1)n an = a2N +2 − a2N +1 +
n=1
2N
X
(−1)n an <
n=1
2N
+1
X
2N
X
(−1)n an
sowie
n=1
n
(−1) an = −a2N +1 + a2N +
2N
−1
X
n=1
n
(−1) an >
n=1
2N
−1
X
(−1)n an .
n=1
P2N −1
P
n
n
Wegen 2N
n=1 (−1) an ist daher die aus den Partialsumn=1 (−1) an >
men sN gebildete Folge ([s2N , s2N −1 ]) eine Intervallschachtelung, deren innerer Punkt der Grenzwert der betrachteten Reihe sein muss.— Das LeibnizKriterium gilt natürlich in derselben Weise, wenn (an ) streng monoton
wächst und an ≤ 0 ist für alle n ∈ N.
Für das Cauchysche Verdichtungskriterium benutzt man die Beziehungen
N
N
X
1X k
2 a2k ≤ a1 +
2
k
2
X
k=1 n=2k−1 +1
k=0
N
an =
2
X
n=1
N
−1 2k+1
X
X−1
an = a2N +
an ≤
k=0 n=2k
Das Cauchysche
erlaubt es, Reihen der Form
P Verdichtungskriterium
−p ln n auf Konvergenz zu untersuchen.
oder auch ∞
n
n=1
N
X
2k a2k
k=0
P∞
n=1 n
−p
Die Aussagen von Wurzel- und Quotientenkriterium kann man recht prägnant
mit Hilfe von ausgezeichneten Häufungspunkten der Folge (an ) formulieren. Ist (an ) eine reelle Folge, so bezeichnet man mit lim supn→∞ an und
lim inf n→∞ an das Supremum bzw. Infimum aller Häufungspunkte von (an ).
Beide Zahlen sind ihrerseits Häufungspunkte7 . Nun gilt aber
6
Zu bemerken ist, dass das Quotientenkriterium im allgemeinen einfacher zu handhaben ist, das Wurzelkriterium aber oft auch dann noch Ergebnisse liefert, wenn das
Quotientenkriterium versagt. Es gilt genauer:
lim inf
n
p
p
|an+1 |
|an+1 |
≤ lim inf n |an | ≤ lim sup n |an | ≤ lim sup
n
|an |
|an |
n
n
für alle (beschränkten) Folgen (an )(vgl. Rudin,Principles of Mathematical Analysis, pp.
59)
7
Man hat es ja beim Beweis dieser Aussage mit einer Folge ((ank,` )k∈N )`∈N von Teil-
Werner, Universität Münster, WS 05/06
23
• lim sup αn < A ist äquivalent zu der Tatsache, dass für ein N0 ∈ N
und alle n ≥ N0 gilt αn < A, und aus lim sup αn > A folgt αn > A für
unendlich viele n ∈ N.
• lim inf αn > A ist äquivalent zu der Tatsache, dass für ein N0 ∈ N und
alle n ≥ N0 gilt αn < A, und aus lim inf αn < A folgt αn > A für
unendlich viele n ∈ N.
Damit gilt unterPden Voraussetzungen des Wurzel- und Quotientenkriteriums: Die Reihe
an konvergiert absolut, falls
an+1 <1
lim sup an n
bzw.
lim sup
n
p
n
|an | < 1,
und sie divergiert im Fall von
an+1 >1
lim inf n
an bzw.
lim sup
n
p
n
|an | > 1.
In vielen Fällen stimmen größter und kleinster Häufungspunkt einer Folge
(an ) meist schon mit limn an überein. Ein Beispiel, bei dem das nicht so ist,
ist
 k
1 1


für n = 2k + 1

2 4
an =  1 k−1



für n = 2k
4
mit
lim inf
n
an+1
1
= ,
an
8
lim sup
n
an+1
=2
an
sowie
lim sup
n
p
1
n
|an | = .
2
folgen zu tun, die alle gegen die Glieder einer Folge von Häufungspunkten (a0,` )`∈N konvergieren, die ihrerseits für ` → ∞ gegen lim supn→∞ an konvergiert. Wählt man nun in
jeder dieser Folgen ein Folgenglied mit Hilfe der Indizes nk1 ,1 < nk2 ,2 < . . . < nk` ,` < . . .,
so dass
1
|a0,` − ank` ,` | < ,
`
(um das monotone Wachsen der Indizes zu erzwingen, muss man unter Umständen etwas
länger warten) und ist für ε > 0 die Zahl `0 so groß, dass `−1
0 < ε/2 und | lim supn→∞ an −
a0,` | < ε/2 für ` ≥ `0 , dann gilt für alle ` ≥ `0
| lim sup an − ank` ,` | ≤ | lim sup an − a0,` | + |a0,` − ank` ,` | < ε.
n→∞
n→∞
Dies zeigt, dass lim supn→∞ an der Grenzwert der Teilfolge ank` ,` von (an ) und damit
selbst ein Häufungspunkt dieser Folge ist.
24
Mathematik für Physiker und Informatiker I (Kurzskript)
C.
(1.Teil) Aus der Schule bekannt sind die Polynome
Pn Potenzreihen
ν , in die beliebige Werte x ∈ R eingesetzt werden dürfen. Die Theoa
x
ν
ν=0
rie der Reihen legt es nahe, Polynome ‘unendlicher Länge’ zu betrachten,
die sogenannten Potenzreihen. Es wird sich herausstellen, dass eine ganze
Reihe wichtiger Funktionen tatsächlich solche Polynome von unendlichem
Grad sind, etwa
∞
X
x2n+1
sin x =
(−1)n
.
(2n + 1)!
n=0
P
Für die (zunächst formal gebildeten) Ausdrücke der Form n an xn stellt
sich zu allererst die Frage, welche reellen Werte x in sie eingesetzt werden
dürfen. Diese Frage aber können wir schon recht gut beantworten:
P
Satz 12 Es sei n an xn eine Potenzreihe.
(i) Es existiert eine Zahl r ∈ [0, ∞], Konvergenzradius
genannt, mit der
P
n
Eigenschaft, dass für r ∈ (0, ∞) die Reihe n an x für |x| < r konvergiert und für |x| > r divergiert. ‘r = ∞’ steht für den Fall, dass
die gegebene P
Potenzreihe für alle x ∈ R konvergiert, und ‘r = 0’ soll
heißen, dass n an xn allein im Nullpunkt konvergiert.
(ii) Im Fall r ∈ (0, ∞) gilt die Formel
r=
1
lim supn
p
,
n
|an |
und r = ∞ gilt genau dann, wenn
p
p
lim sup n |an | = lim n |an | = 0
n→∞
n
p
ist; der Fall r = 0 tritt genau dann ein, wenn ( n |an |) unbeschränkt
ist.
P∞
n
Eine Potenzreihe
n=0 cn (z − z0 ) , cn , z, z0 ∈ C konvergiert absolut im
Innern der Kreisscheibe mit Radius
R :=
1
lim supn→∞
p
n
|an |
um den Punkt z0 und divergiert außerhalb dieser Kreisscheibe.
Das Verhalten einer Potenzreihe auf dem Rande des Konvergenzgebietes,
also für die x mit |x| = r, ist allgemein nicht in einfacher Weise vorherzusagen und muß in jedem Einzelfall gesondert überprüft werden.
Der Beweis von Satz 13(i),(ii) im Fall r ∈ (0,p∞) ergibt sich aus
p einer
Anwendung des Wurzelkriteriums. Falls lim supn n |an | = limn→∞ n |an | =
0 ist, so folgt für alle x ∈ R aus
p
p
lim sup n |an xn | = |x| lim sup n |an | = 0 < 1
n
n
Werner, Universität Münster, WS 05/06
25
p
P
n
die Konvergenz von n an xn . Ist umgekehrt
lim
sup
|an | =:
n
p
Pr > 0, so gilt
n
n
für unendlich viele Indizes lim supn |an x | > |x|r/2, und n an xn kann
für
|x| > 2/r nicht konvergieren. Besitzt schließlich im Fall r = 0 die Folge
p
n
( |an |) keine unbeschränkte Teilfolge, dann ist diese Folge beschränkt,
und
p
es gibt ein M > 0, so dass für 0 < |x| < M −1 folgt lim supn n |an xn | < 1,
die gegebene
Potenzreihe folglich auch für Werte
x 6= 0 konvergiert. Mit der
p
p
n
n
n
Folge
(
|a
|)
ist
aber
für
alle
x
=
6
0
auch
(
|a
n
n x |) unbeschränkt, und
P
n
n an x konvergiert für kein x 6= 0.
Versucht man, den Konvergenzradius einer Potenzreihe zu ermitteln,
dann ist die im zweiten Teil des Satzes angegebene Formel häufig zu schwierig zu handhaben. So macht im Fall der Reihe
∞
X
(−1)n
n=0
x2n+1
(2n + 1)!
die Tatsache Schwierigkeiten, dass die Hälfte der an verschwindet. Es ist hier
wie in vielen anderen Fällen auch günstiger, nur den Teil (i) des Satzes zu
verwenden und das Quotientenkriterium unmittelbar auf die Reihenglieder
anzuwenden. Man sieht dann, dass Konvergenz für alle x ∈ R gegeben ist.
II. Funktionen
Einschub: Kartesisches Produkt und Abbildungen
Es seien X und Y Mengen. Das kartesische Produkt von X und Y ist die
Menge der geordneten Paare
X × Y = {(x, y) | x ∈ X, y ∈ Y } .
‘Geordnet’ bedeutet, dass (x, y) 6= (y, x)8 . Eine Relation zwischen den Mengen X und Y ist eine Teilmenge R ⊆ X × Y . Eine uns bereits bekannte Relation ist die Ordnungsrelation auf der Menge der reellen Zahlen,
R × R ⊇ G = {(x, y) ∈ R × R | x > y }. Eine Abbildung zwischen X und
Y ist eine Relation F ⊆ X × Y mit der Eigenschaft, dass für alle x ∈ X
genau ein Element y ∈ Y existiert mit (x, y) ∈ F . Man nennt X auch den
Definitionsbereich von F und Y den Werte- oder Bildbereich. Es ist üblich,
statt (x, y) ∈ F auch F (x) = y zu schreiben, und von einer Abbildung
F : X → Y , x 7→ F (x) zu sprechen. (Umgekehrt kann man sich die zu einer
Abbildungen gehörende Menge F ⊆ X ×Y als eine Liste der zu den Elementen von x ∈ X gehörigen ‘Funktionswerte’ vorstellen.) Ist Y eine Teilmenge
von R, so nennt man in diesem Fall eine Abbildungen meist Funktion. Eine
Abbildung F : X → Y heißt
8
Wem das als Definition nicht genüngt, muss von (x, y) := {x, {x, y}} ausgehen.
26
Mathematik für Physiker und Informatiker I (Kurzskript)
• injektiv, falls für alle y ∈ {F (x) ∈ Y | x ∈ X } genau ein x ∈ X mit
F (x) = y existiert (also aus F (x1 ) = F (x2 ) stets x1 = x2 folgt), und
• surjektiv, wenn es für alle y ∈ Y ein x ∈ X mit F (x) = y gibt.
Beispiele für Abbildungen, für die Injektivität von Bedeutung ist, ist die Zuordnung von charakteristischen Kenngrößen (Studierende −→ Matrikelnummern, Kraftfahrzeuge −→ Kraftfahrzeugkennzeichen, . . .), die typischerweise nicht surjektiv sind (um die Injektivität nicht zu gefährden). Wichtig ist
Surjektivität z.B. bei der Zuordnung Spieler −→ Spielerposition in den meisten Mannschaftssportarten oder auch bei der Abbildung ‘Lokomotivführer
im Einsatz’ −→ ‘Lokomotiven unterwegs’. Stellt man sich die Beziehung
F (x) = y als eine Gleichung vor, bei der nach Vorgabe von y ∈ Y die Unbekannte x ∈ X zu bestimmen ist, dann ist F surjektiv genau dann, wenn
eine solche Gleichung für jedes y ∈ Y eine Lösung besitzt; injektiv ist F ,
falls bei gegebenem y nicht zwei verschiedene Lösungen existieren können.
Hilfreich sind die Schreibweisen
F (A) = {F (a) ∈ Y | a ∈ A }
sowie
F −1 (B) = {x ∈ X | F (x) ∈ B } .
Damit ist F z.B. surjetiv genau dann, wenn F (X) = Y ist. Etwas weniger
offensichtlich ist die Tatsache, dass F injektiv genau dann ist, wenn für alle
A, B ⊆ X gilt F (A ∩ B) = F (A) ∩ F (B). (Für eine beliebige Abbildung
gilt stets F (A ∩ B) ⊆ F (A) ∩ F (B).) Eine injektive Abbildung F : X → Y
definiert in eindeutiger Weise eine Umkehrabbildung F −1 : F (X) → X
durch
F −1 (y) = x
genau dann, wenn
F (x) = y.
Ist F zusätzlich surjektiv, so ist der natürliche Definitionsbereich von F −1
die ganze Menge Y . Sind f : X → Y und g : Y → Z Abbildungen, dann
definiert man die Verknüpfung von f und g als
g ◦ f : X → Z,
g ◦ f (x) := g(f (x)).
1. Stetigkeit
A. Definition und einfache Eigenschaften Stetige Funktionen sind
vorhersagefreundlich. Sie gestatten es, aus dem Verhalten von f in der Nähe
eines Punktes x0 auf den Wert von f bei x0 selbst zu schließen.
Definition 6 Es sei D eine Menge reeller Zahlen, f : D → R eine Funktion
sowie x0 ∈ D.
(i) f bestitzt bei x0 den Grenzwert y0 genau dann, wenn gilt
y0 = lim f (xn )
n→∞
Werner, Universität Münster, WS 05/06
27
für alle gegen x0 konvergenten Folgen (xn ) in D, mit von x0 verschiedenen Folgengliedern. In einem solchen Fall schreibt man
lim f (x) = y0 .
x→x0
(ii) Eine Funktion f : D → R heißt stetig bei x0 ∈ D genau dann, wenn
lim f (x) = f (x0 ),
x→x0
wenn also der Grenzwertsatz f (limn→∞ xn ) = limn→∞ f (xn ) gültig
ist.
(iii) f heißt auf D stetig, falls f an jedem Punkt x0 ∈ D stetig ist.
Die hier gegebene Definition von Stetigkeit ist recht allgemein. Sie beinhaltet etwa die (einseitige) Stetigkeit von Funktionen an Randpunkten eines
Intervalls oder zeigt, dass auf endlichen Mengen definierte Funktionen überall stetig sind. Man beachte auch, dass der Grenzwert von f am Punkt x0
automatisch bereits mit f (x0 ) übereinstimmen muss, wenn man die Forderung xn 6= x0 an die an der Definition von limx→x0 f (x) beteiligten Folgen
(xn ) fortlässt.
Drei Beispiele: Die Funktion f : R → R, f (x) = 0 für x 6= 0 und f (0) = 1
besitzt bei 0 den Grenzwert 0, der aber nicht der Funktionswert an dieser
Stelle ist. Die Funktion g(x) = 0 für x ≤ 0 und g(x) = 1 für x > 0, besitzt
am Nullpunkt gar keinen Grenzwert; denn für die durch xn = 1/n und
yn = −1/n definierten Folgen gilt limn→∞ g(xn ) = 1, limn→∞ g(yn ) = 0 (was
alleine schon ausreicht), und für zn = (−1)n /n besitzt die Folge g(zn ) nicht
einmal einen Grenzwert. Die Unstetigkeitsstelle der letzten Funktion ist eine
sogenannte Sprungstelle, die man glaubt, gut am Graphen der Funktion
ablesen zu können. Etwas Vorsicht ist hier geboten: Ist h : [a, b] ∪ [c, d] →
R mit a < b < c < d durch h(x) = 0 für x ∈ [a, b] und h(x) = 1 für
x ∈ [c, d], dann sieht auch das nach einer Sprungstelle aus, ist es aber nicht
(jedenfalls ist diese Funktion überall stetig): Ist (xn ) eine Folge aus der
Menge [a, b] ∪ [c, d], die gegen b konvergiert, dann ist ja ab einem Index
N ∈ N für n ≥ N stets |xn − b| < |c − b|, und das bedeutet, xn ∈ [a, b] für
alle diese Indizes. Dann aber ist h(xn ) = 0, und es folgt limn→∞ h(xn ) = 0
und, weil die Folge beliebig gewählt werden konnte, limx→b h(x) = 0. Die
Funktion h ist also am Punkt b (genauso übrigens wie am Punkt c) stetig.
Satz 13 Es seien D, E ⊆ R, f, g : D → R und h : E → R Funktionen sowie
x0 ∈ D. Ferner sei g(x0 ) ∈ E.
(i) Die Funktion f besitzt den Grenzwert a am Punkt x0 genau dann, wenn
für jedes ε > 0 ein δ(ε, x0 ) > 0 existiert, so dass für alle x ∈ D mit
0 < |x − x0 | < δ(ε, x0 ) gilt |f (x) − a| < ε, und f ist stetig bei x0 genau
dann, wenn für jedes ε > 0 ein δ(ε, x0 ) > 0 existiert, so dass für alle
x ∈ D mit |x − x0 | < δ(ε, x0 ) gilt |f (x) − f (x0 )| < ε.
28
Mathematik für Physiker und Informatiker I (Kurzskript)
(ii) Sind f und g bei x0 stetig, so gilt dies auch für die Funktionen f + g,
f g sowie f /g, sofern im letzten Fall g(x0 ) 6= 0 ist. Ist zusätzlich h am
Punkt g(x0 ) stetig, so ist h ◦ g bei x0 stetig.
(iii) (Zwischenwertsatz) Ist D = [a, b] und η ∈ R eine Zahl, die zwischen
f (a) und f (b) liegt, dann gibt es ein ξ ∈ [a, b] mit f (ξ) = η.
Für den Beweis des ersten Teils sei zunächst f stetig bei x0 im Sinne der
zuvor gemachten Definition. Wir nehmen außerdem an, es wäre die ε-δBedingung aus (i) verletzt. Dann gibt es ein ε0 > 0 sowie eine Folge (xn )
in D mit |xn − x0 | < 1/n und |f (xn ) − f (x0 )| ≥ ε0 . Dann aber kann ganz
offenkundig f (x0 ) nicht der Grenzwert von f an der Stelle x0 sein. Falls
umgekehrt die ε-δ-Bedingung erfüllt ist, und (xn ) eine in D enthaltenen
Folge bezeichnet, für die |x0 − xn | < η für n ≥ N (η) und η > 0 beliebig,
so wählt man, um die Konvergenz von (f (xn )) gegen f (x0 ) zu zeigen, bei
vorgelegtem ε > 0 eine Zahl δ > 0, so dass |f (x0 )−f (x)| < ε falls |x0 −x| < δ.
Ist dann n ≥ N (δ) beliebig, so folgt |x0 − xn | < δ und |f (xn ) − f (x0 )| < ε.
Bis auf die letzte Aussage folgt Teil (ii) aus den entsprechenden Aussagen
über Folgen im Satz 4(a). Die Aussage über h◦g ist eine einfache Konsequenz
aus der Defintion.
Der Beweis des Teils (iii) ist eine Anwendung des Intervallschachtelungsprinzips: Wir nehmen an, dass gilt f (a) < η < f (b). Induktiv definieren wir
Intervalle In = [an , bn ] durch I1 = [a, b] und

an + bn
an + bn


falls f (an ) < η < f

 an ,
2
2
In+1 = [an+1 , bn+1 ] := .

an + bn
an + bn


, bn
falls f
< η < f (bn )

2
2
Dabei soll die Folge abbrechen (der Beweis wäre dann bereits beendet), wenn
der Funktionswert von f am Mittelpunkt einer der Intervalle In bereits η
ist. In allen anderen Fällen
T gilt f (an ) < η < f (bn ), und wir erhalten wir
einen inneren Punkt ξ ∈ n∈N In , für den aufgrund der Stetigkeit von f gilt
f (ξ) = lim f (an ) ≤ η ≤ lim f (bn ) = f (ξ),
n→∞
n→∞
und somit auch f (ξ) = η.
Ein Beispiel zur Stetigkeitsaussage: Die Funktion w : R+
0 → R, w(x) =
√
x, ist an jedem Punkt x0 stetig: Ist x0 6= 0, so kann man bei vorgelegtem
√
ε > 0 wählen δ(ε, x0 ) = ε x0 . Ist dann |x − x0 | < δ(ε, x0 ), so folgt
|x − x0 |
|x − x0 |
|w(x) − w(x0 )| = √
< ε.
√ ≤ √
x0
x + x0
Für x0 = 0 wählt man δ(ε, 0) = ε2 . Dann folgt aus |x| < δ(ε, 0) sofort
|w(x) − w(0)| < ε.
Werner, Universität Münster, WS 05/06
29
Wenn man will, kann man den Zwischenwertsatz als die Aussage deuten,
die besagt, dass man den Graphen stetiger, auf einem Intervall definierter
Funktionen ‘in einem Strich’ zeichnen kann. Diese Vorstellung ist inosfern
problematisch, als es stetige Fuktionen gibt, bei denen man sich dies trotz
Zwischenwertsatzes nur sehr schwer vorstellen kann, und umgekehrt gibt es
unstetige Funktionen, deren Einschränkungen auf beliebige abgeschlossene
Teilintervalle der Aussage des Zwischenwertsatzes genügen.
Eine einfache Anwendung des Zwischenwertsatzes ist: Die Gleichung
x − cos x = 0
besitzt im Intervall [0, π/2] eine Lösung. (Hierzu muss man allerdings daran
glauben, das cos x eine stetige Funktion ist, was wir erst später nachweisen
werden.)
B. Kompaktheit Eine Zahl α nennt man einen Häufungspunkt der Folge
(an ), falls es eine Teilfolge von (an ) gibt, die gegen α konvergiert. Man beachte, dass jeder Häufungspunkt einer Folge auch Häufungswert der Menge der
Folgenglieder ist, dass aber umgekehrt jeder Punkt einer Folge Häufungswert
der Menge der Folgenglieder ist und damit nicht unbedingt ein Häufungspunkt.
Satz 14 (Bolzano-Weierstraß) Jede beschränkte Folge in R besitzt einen
Häufungspunkt
Ist die Folge (xn ) in dem Intervall [a, b] enthalten, dann wird eine Intervallschachtelung (In ) = ([an , bn ]) induktiv definiert durch I0 = [a, b],

an + bn

an +bn

a
,
falls
x
∈
a
,

n
n
n

2

2



für unendlich viele n
In+1 = [an+1 , bn+1 ] =
.





an + bn


, bn
sonst

2
Induktiv ergibt sich auch, dass jeweils in einer dieser Intervallhälften für
unendlich viele Indizes Folgenglieder liegen müssen und diese Konstruktion
folglich nicht abbrechen kann. Man kann jetzt eine monoton steigende Folge
(nk ) von Indizes mit xnk ∈ Ik für jedes k ∈ N wählen. Ist ξ der innere
Punkt der Intervallschachtelung (Ik ), so ist der Abstand von xnk zu ξ für
alle k ≥ K ∈ N kleiner oder gleich der Intervallbreite von IK . Es folgt
limk→∞ xnk = ξ.
Definition 7 Es seine K und F Mengen reeller Zahlen.
(i) K heißt kompakt, falls jede Folge mit Gliedern in K eine gegen ein
Element von K konvergente Teilfolge besitzt.
30
Mathematik für Physiker und Informatiker I (Kurzskript)
(ii) F heißt abgeschlossen, falls F jeden ihrer Häufungswerte enthält.
Ein einfaches Beispiel von kompakten Mengen sind die endlichen Mengen.
Da x ∈ C Häufungswert von F genau dann ist, wenn es eine Folge in F
gibt, die gegen x konvergiert, ist F abgeschlossen genau dann, wenn jede
konvergente Folge in F ihren Grenzwert auch in F besitzt. Beispiele für
abgeschlossene Mengen sind die abgeschlossenen Intervalle.
Satz 15 Eine Teilmenge K von reellen Zahlen ist kompakt genau dann,
wenn sie beschränkt und abgeschlossen ist.
Ist K nämlich beschränkt und abgeschlossen, so folgt die Behauptung aus
dem Satz von Bolzano-Weierstraß. Ist K umgekehrt kompakt und k ein
Häufungswert von K, gegen den die Folge (kn ) aus K konvergiert, so gibt es
nach Annahme eine Teilfolge, deren Grenzwert in K liegt. Da der Grenzwert
von Teilfolgen konvergenter Folgen mit dem Grenzwert der ganzen Folge
übereistimmt, muss k ∈ K sein, und K ist abgeschlossen. In einer unbeschränkten Menge lässt sich stets eine Folge (xn ) finden mit |xn | ≥ n. Keine
Teilfolge einer solchen Folge kann beschränkt und folglich auch nicht konvergent sein. Damit sind weitere Beispiele für kompakte Mengen die Intervalle
[a, b].
Ist eine stetige Funktion f auf einer kompakten Menge K ⊆ R definiert,
so ergibt sich eine erstaunlicher Zugewinn an Qualtität von f . Eine Funktion
f : D ⊆ R → R heißt beschränkt, falls f (D) eine beschränkte Menge ist.
D.h. es gibt eine Zahl M > 0, so dass für alle x ∈ D gilt |f (x)| ≤ M .
Satz 16 Es sei K ⊆ R kompakt und f : K → R auf ganz K stetig. Dann
gilt
(i) f ist beschränkt.
(ii) f nimmt Supremum und Infimum ihrer Funktionswerte an, d.h. es existieren Punkte d1,2 ∈ D mit
f (d1 ) = sup f (d)
d∈D
sowie
f (d2 ) = inf f (d).
d∈D
(iii) f ist gleichmäßig stetig, d.h. für alle ε > 0 existiert ein δ(ε) > 0 mit
der Eigenschaft, dass |f (x) − f (y)| < ε für alle Punktepaare x, y ∈ D
mit |x − y| < δ(ε).
Die Beweise für die drei Teile sind im Prinzip alle recht ähnlich und basieren darauf, besonderes Verhalten von Funktionen auf kompakten Mengen
(durch Auswahl konvergenter Teilfolgen) zu lokalisieren. Wäre f etwa auf
der kompakten Menge K unbeschränkt, dann gibt es ja zunächst nur eine
Folge (xn ) in K mit |f (xn )| ≥ n. Da aber K kompakt ist, kann man eine
gegen einen Punkt x0 ∈ K konvergente Teilfolge (xnk ) finden, und es ist
Werner, Universität Münster, WS 05/06
31
dann nicht mehr recht klar, welchen Wert f bei x0 eigentlich annehmen soll.
Diese Überlegung zeigt Teil (i). Ganz ähnlich geht man für den zweiten Teil
vor und wählt eine Folge (xn ) in K mit (z.B.)
lim f (xn ) = sup f (x)
n→∞
x∈K
Für eine konvergente Teilfolge dieser Folge ist der in K gelegene Grenzwert
eine Stelle, an der f sein Supremum auf K annimmt. Hätte man es schließlich
bei f mit einer nicht gleichmäßig stetigen Funktion zu tun, dann gäbe es
eine Zahl ε0 > 0 und eine Folge von Paaren (xn , yn ) ∈ K 2 mit
|xn − yn | ≤
1
n
sowie
|f (xn ) − f (yn )| ≥ ε0 .
Sind x0 und y0 die Grenzwerte von Teilfolgen (xnk ) und (ynk ) (man macht
sich leicht klar, dass beide Teilfolgen mit Hilfe derselben Indexfolge (nk )
gebildet werden können), so folgt aus der ersten Bedingung x0 = y0 und aus
der zweiten |f (x0 ) − f (y0 )| ≥ ε0 , was ganz offensichtlich nicht möglich ist.
√
Für die Funktion w : R+
x, hatten wir im letzten
0 → R, w(x) =
√
Abschnitt ein ganz wesentlich von x0 6= 0 abhängiges δ(ε, x0 ) = ε x0 bestimmt. Der voranstehende Satz sagt voraus, dass es möglich sein muss, ein
nur von ε abhängiges δ zu finden. Ein solches ist δ(ε) = ε2 , und die verbesserte Abschätzung, die hier√notwendig
wird, basiert auf der für a ≥ b ≥ 0
√
√
gültige Ungleichung a − b ≤ a − b: Für |x − x0 | < δ(ε) folgt mit ihrer
Hilfe
p
√
√
| x0 − x| ≤ |x − x0 | < ε.
2. Differenzierbarkeit
A. Definition und Ableitungsregeln Eines der mehr rätselhaften Instrumente des Alltags ist der Tachometer. Beschreibt x : R+
0 → R den Ort
eines Punktes auf der reellen Achse zum Zeitpunkt t, dann ist die Durchschnittsgeschwindigkeit dieses Punktes zwischen den Zeitpunkten t1 < t2
durch den Ausdruck
x(t2 ) − x(t1 )
vD (t1 ; t2 ) =
t2 − t1
gegeben. Der Tachometer behauptet, zu jedem Zeitpunkt und ohne nennenswerte Verzögerung die sogenannte Momentangeschwidigkeit,
v(t0 ) = lim
t→t0
x(t) − x(t0 )
,
t − t0
ermitteln zu können.
Definition 8 Eine Funktion f : [a, b] → R heißt am Punkt x0 ∈ [a, b]
differenzierbar genau dann, wenn der Grenzwert
lim
x→x0
f (x0 ) − f (x)
f (x0 + h) − f (x0 )
df
= lim
:= f 0 (x0 ) =
(x0 )
h→0
x − x0
h
dx
32
Mathematik für Physiker und Informatiker I (Kurzskript)
existiert.
Ein Beispiel für eine auf ganz R differenzierbare Funktion ist die Potenzfunktion Pn : R → R, x 7→ xn . Dies wird ersichtlich aus
n−1
X n
Pn (x0 + h) − Pn (x0 )
(x0 + h)n − xn0
xν hn−ν−1 =
= lim
= lim
h→0
h→0
h→0
h
h
ν 0
ν=0
n−2
X n
nxn−1
+ lim h
xν hn−ν−2 = nx0n−1 .
0
h→0
ν 0
lim
ν=0
Die Betragsfunktion x 7→ |x| ist nicht dfferenzierbar am Nullpunkt; denn die
Funktion
(
1
für x > 0
|x| − |0|
|x|
=
=
x−0
x
−1 für x < 0
besitzt am Nullpunkte keinen Grenzwert. Die folgende Beobachtung ist sehr
wichtig für das Verständnis des Ableitungsbegriffs.
Satz 17 Eine Funktion f : (a, b) → R ist bei x0 ∈ (a, b) differenzierbar,
falls es eine Zahl f 0 (x0 ) sowie eine Funktion h 7→ r(x0 , h) gibt mit
f (x0 + h) = f (x0 ) + f 0 (x0 )h + r(x0 , h)
und
lim
h→0
r(x0 , h)
=0
h
Jede bei x0 differenzierbare Funktion ist insbesondere stetig.
f ist danach am Punkt x0 differenzierbar, genau dann, wenn f in der Nachbarschaft des Punkts x0 so gut durch eine Gerade (und zwar die durch die
Abbildungsvorschrift x0 + h 7→ f (x0 ) + hf 0 (x0 ) gegebene Tangente) approximiert werden kann, dass der Fehler, den man dabei macht, nämlich r(x0 , h),
so schnell in h gegen Null konvergiert, dass immer noch limh→0 r(x0 , h)h−1 =
0 gilt.
Der Beweis des ersten Teils von Satz 17 ist sehr einfach und benutzt
nicht mehr als die beteiligten Definitionen. Dass f bei x0 stetig sein muss,
ist eine leichte Übungsaufgabe.
Die Ableitung spielt in den Anwendungen der Mathematik eine große
Rolle, vor allem da dieser Begriff es ermöglicht, zeitlich punktuelle (“momentane”) oder räumlich in einem Punkt konzentrierte Erscheinungen mathematisch in den Griff zu bekommen (etwas, für das man allerdings in
der fortgeschrittenen Physik einen bisweilen recht hohen Preis zu entrichten hat). Dabei mündet eine solche Modellierung häufig in einer sogenannten
Differentialgleichung, einer Gleichung, in der die modellierende Funktion mit
ihren Ableitungen in Beziehung steht. Ein Beispiel. Es sei B(t) die Anzahl
der Bakterien in einer Kultur Wir gehen davon aus, dass der Zuwachs dieser
Kolonie während eines Zeitintervalls ∆t, das so klein sein muss, dass Enkel
Werner, Universität Münster, WS 05/06
33
noch keine Rolle spielen, proportional sowohl zur Menge der bereits vorhandenen Bakterien als auch zu ∆t ist. Ist der Proportionalitätsfaktor α, dann
heißt das
B(t + ∆t) − B(t) = αB(t)∆t
Da diese Beziehung für alle ∆t gelten soll, kann man für alle Zeiten t den
Grenzwert ∆t → 0 betrachten(falls man annimmt, dass B eine differenzierbare Funktion der Zeit ist) und schließen9
B 0 (t) = lim
∆t→0
B(t + ∆t) − B(t)
= αB(t).
∆t
Kurz: Eine Funktion B, die das Bakterienwachstum in dieser Weise modelliert, muss notwendigerweise der Gleichung B 0 = αB genügen. Wir werden
später sehen, welche Funktionen das genau sind.
Satz 18 (Ableitungsregeln) Es seien f, g : [a, b] → R am Punkt x ∈ [a, b]
und ϕ : [c, d] → [a, b] am Punkt x0 ∈ [c, d] mit ϕ(x0 ) = x differenzierbare
Funktionen. Dann gilt
(i) f + g, f g sowie, für den Fall, dass g(x) 6= 0, die Funktion f /g sind bei
x differenzierbar mit
(f + g)0 (x) = f 0 (x) + g 0 (x)
(f g)0 (x) = f 0 (x)g(x) + f (x)g 0 (x)
0
f
f 0 (x)g(x) − f (x)g 0 (x)
sowie
(x) =
g
g(x)2
(ii) f ◦ ϕ ist am Punkt x0 differenzierbar mit
(f ◦ ϕ)0 (x0 ) = f 0 (ϕ(x0 ))ϕ0 (x0 )
(iii) Besitzt f in einer Umgebung um x0 eine differenzierbare Umkehrfunktion f −1 , so gilt
1
(f −1 )0 (f (x)) = 0
.
f (x)
Ein paar Beispiele: Die Quotientenregel, die Ableitungsregel für die inverse
Funktion sowie die Kettenregel zeigen (in dieser Reihenfolge), dass die Gleichung (xn )0 = nxn−1 auch für rationale Zahlen richtig bleibt, d.h. für alle
m, n ∈ N und p, q ∈ Z gilt:
1 0
p 0 p p
1 0
m
1 1 −1
−1
n
n
= − m+1
x
= x
sowie
xq = xq
xm
x
n
q
9
So, wie wir B(·) definiert hatten ist sie allerdings nicht einmal stetig; am einfachsten
stellt man sich vor, dass die Funktion B zwischen den durch die Bakteriengeburten entsthehenden Sprungstellen differenzierbar interpoliert und die wahre Anzahl der Bakterien
bis auf die erste Kommastelle genau vorhersagt — was viel besser wäre als die Situation
im Labor hergibt.
34
Mathematik für Physiker und Informatiker I (Kurzskript)
Die Kettenregel ergibt außerdem nochmals die Formel für 1/g.
Es ist sehr einfach, im Teil (i) die Summenformel zu beweisen. Die sogenannte Produktregel ergibt sich, wenn man in der Beziehung
f (x + h)g(x + h) − f (x)g(x)
=
h
f (x + h) − f (x)
g(x + h) − g(x)
=
g(x + h) + f (x)
.
h
h
den Grenzübergang h → 0 durchführt. Zu beachten ist dabei, dass die (durch
die Differenzierbarkeit sich ergebende) Stetigkeit von g bei x ausgenutzt
werden muss. Die Formel für den Quotienten reduziert man mit der Produktregel auf den Fall den, dass die Funktion f konstant gleich 1 ist. Diesen
wiederum erledigt die Gleichheit
1
1
g(x + h) − g(x)
1
1
−
=−
h g(x + h) g(x)
g(x + h)g(x)
h
sowie der Grenzübergang h → 0. (Natürlich spielt auch wieder die Stetigkeit
von g bei x eine Rolle und das gleich zweimal: Einmal für den Grenzübergang
und das zweite Mal für die Tatsache, dass bei hinreichend kleinem h der
Funktionswert g(x + h) nicht verschwindet.)
Die Aussage über die Umkehrfunktion erhält man durch Anwendung der
Kettenregel auf die in besagter Umgebung gültige Gleichung
f −1 (f (x)) = x.
Für den Beweis der Kettenregel selbst greifen wir schließlich auf die Funktion

f (x) − f (x0 )


für x 6= x0
x − x0
fx∆0 (x) =

 0
f (x0 )
für x = x0
zurück. Diese ist aufgrund der Definition der Differenzierbarkeit bei x0 genau
dann stetig, wenn f bei x0 differenzierbar mit Ableitung f 0 (x0 ) ist. Eine
elementare Rechnung zeigt, dass
f (ϕ(x0 )) − f (ϕ(x))
ϕ(x) − ϕ(x0 )
∆
= fϕ(x
(ϕ(x))
0)
x − x0
x − x0
womit
lim
x→x0
f (ϕ(x0 )) − f (ϕ(x))
=
x − x0
∆
= lim fϕ(x
(ϕ(x)) lim
0)
x→x0
x→x0
ϕ(x) − ϕ(x0 )
= f 0 (ϕ(x0 ))ϕ0 (x0 )
x − x0
Werner, Universität Münster, WS 05/06
35
folgt10 , da wir ja von all den hier auftretenden Grenzwerten die Existenz
vorausgesetzt hatten.
Die Ableitung f 0 einer auf (a, b) differenzierbaren Funktion ist im allgemeinen nicht stetig; sie genügt aber immer noch dem Zwischenwertsatz
(Satz von Darboux) und besitzt daher keine Sprungstellen. Differenzierbare Funktionen mit stetigen Ableitungen heißen stetig differenzierbar. Wenn
man etwas vorgreift, und die Ableitung der Sinus-Funktion als bekannt voraussetzt, dann kann man zeigen, dass f : R → R,

x2 sin 1
für x 6= 0
x
f (x) =

0
für x = 0
für x 6= 0 die Ableitung f 0 (x) = 2x sin(x−1 ) − cos(x−1 ) besitzt. Für den
Nullpunkt errechnet man direkt
f (x) − f (0)
1
0
f (0) = lim
= 0.
= lim x sin
x→0
x→0
x−0
x
Hier wird noch einmal die Schwierigkeit im Umgang mit unstetigen Funktionen deutlich: Nichts anderes als die direkte Rechnung ist in der Lage zu
ermitteln, wie es mit der Ableitung von f bei 0 steht; die Ableitung an von
Null verschiedenen Punkten erlaubt gar keinen Rückschluss.
B.Extremalpunkte und Mittelwertsatz
Definition 9 Es sei f : D → R eine Funktion. Ein Punkt ξ heißt eine
lokale Extremalstelle für f und f (ξ) ein lokaler Extremalwert, falls für ein
ε > 0 gilt
f (ξ) = sup {f (x) | x ∈ Uε (ξ) ∩ D }
bzw.
f (ξ) = inf {f (x) | x ∈ Uε (ξ) ∩ D }
Im ersten Fall nennt man ξ eine lokale Maximalstelle und f (ξ) ein lokales
Maximum, im zweiten Fall eine lokale Minimalstelle und f (ξ) ein lokales
Minimum.
Stetige, auf kompakten Mengen definierte Funktionen besitzen (lokale) Extremalstellen. Beim Vorliegen von Differenzierbarkeit lässt sich deren Lage
genauer eingrenzen.
10
mit
Man mache sich klar, dass ein Beweis der Kettenregel durch einfaches “Erweitern”
f (ϕ(x0 )) − f (ϕ(x))
ϕ(x) − ϕ(x0 )
insofern fragwürdig ist, als niemand ausschließen kann, dass ϕ(x) − ϕ(x0 ) in der Nachbarschaft von x0 immer wieder mal verschwindet. Hiergegen hilft natürlich auch die Forderung
x 6= x0 nichts.
36
Mathematik für Physiker und Informatiker I (Kurzskript)
Satz 19 Für jede lokale Extremalstelle x0 einer differenzierbaren Funktion
f : (a, b) → R gilt f 0 (x0 ) = 0.
Ist etwa f (ξ) = sup {f (x) | x ∈ Uε (ξ) ∩ (a, b) } für eine Zahl ε > 0, so gilt für
Folgen (xn ) mit x0 − ε < xn ≤ x0
f 0 (x0 ) = lim
n→∞
f (x0 ) − f (xn )
≥0
x0 − xn
und genauso für xn ≥ x0
f 0 (x0 ) = lim
n→∞
f (x0 ) − f (xn )
≤0
x0 − xn
weshalb f 0 (x0 ) = 0 gelten muss. In derselben Weise verfährt man für lokale
Minimalstellen.
Satz 20 (Satz von Rolle, Mittelwertsatz) Es sei f : [a, b] → R stetig
und eingeschränkt auf (a, b) sogar differenzierbar. Dann gilt
(i) Ist f (a) = f (b), so gibt es einen Punkt ξ ∈ (a, b) mit f 0 (ξ) = 0.
(ii) Es gibt einen Punkt x ∈ (a, b) mit
f (a) − f (b)
= f 0 (x)
a−b
(iii) Es gibt einen Punkt y ∈ (a, b) mit
f 0 (y)(g(a) − g(b)) = g 0 (y)(f (a) − f (b)).
Den Teil (i) nennt man den Satz von Rolle (das ist der Name eines französischen Mathematikers, der anders ausgesprochen gehört als die Sportübung;
es hält sich allerdings kaum jemand daran). Teil (ii) ist der Mittelwertsatz.
Er folgt aus Teil (iii) mit g(x) = x (umgekehrt geht es nicht).
Der Beweis von (i) beginnt mit der Beobachtung, dass für eine nicht
konstante Funktion f (für konstante Funktionen ist nichts zu zeigen), es in
(a, b) Punkte v oder w geben muss mit f (v) > f (a) = f (b) bzw. f (w) <
f (a) = f (b). Dann aber muss f in (a, b) sein absolutes Maximum bzw.
Minimum an einem Punkt ξ ∈ (a, b) annehmen, an dem nach dem letzten
Satz f 0 (ξ) = 0 gelten muss.
Für den Teil (iii) betrachtet man die Funktion
h(t) = f (t)(g(a) − g(b)) − g(t)(f (a) − f (b)).
Für diese gilt h(a) = −f (a)g(b) + g(a)f (b) = h(b), weshalb es aber nach
(i) einen Punkt y ∈ (a, b) geben muss mit 0 = h0 (y) = f 0 (y)(g(a) − g(b)) −
g 0 (y)(f (a) − f (b)).
Die Anwendungen des Mittelwertsatzes (Teil (ii)) sind zahlreich. Ein
paar einfache Beispiele:
Werner, Universität Münster, WS 05/06
37
• Die sogenannte Differentialgleichung y 0 = 0 besitzt genau die konstanten Funktionen als Lösung.
• Eine Funktion f : (a, b) → R mit f 0 (x) ≥ 0 (f 0 (x) ≤ 0) für alle x ist auf
(a, b) monoton wachsend (fallend). Strenge Monotonie ist in derselben
Weise mit den entsprechenden strikten Ungleichungen verknüpft.
• Für die Funktion f ist x0 ein Maximalpunkt, wenn f 0 (x0 ) = 0 und
f 0 bei x0 ‘das Vorzeichen von + nach − wechselt’. Eine entsprechende
Aussage gilt für Minimalpunkte.
C. Uneigentliche Grenzwerte und die Regeln von l’Hospital Eine
ganz wesentliche Rolle bei der Definition von Grenzwert und Stetigkeit haben die kleinen ε−Umgebungen um den Grenzwert gespielt. Kann man also
von einem Punkt sagen, was die kleinen Nachbarschaften sind, so kann man
gegen einen solchen Folgen konvergieren lassen. Diese Überlegung nutzt man
im Zusammenhang mit den Punkten ±∞ aus, die gewissermaßen die Zahlengerade nach rechts (oder links) abschließen. Mit diesen beiden Punkten
kann man nicht vernünftig rechnen — bei einer ganze Reihe von Opera∞
tionen, wie etwa ∞ − ∞ oder ∞
, kann man im Allgemeinen nicht recht
sagen, was herauskommen soll — sehr wohl aber macht es Sinn, mit Grenzb = R ∪ {±∞} zu hantieren. Die Idee ist, die Rolle, die die
werten auf R
ε-Umgebungen spielen, von den Mengen
US (∞) = {x ∈ R | x > S }
bzw.
US (−∞) = {x ∈ R | x < S }
übernehmen zu lassen.
Definition 10 Es sei (xn ) eine Folge reeller Zahlen. Dann bedeutet
lim xn = ∞
n→∞
bzw.
lim xn = −∞
n→∞
genau dasselbe wie
∀S ∈ R ∃N (S) ∈ N ∀n ≥ N (S)
gilt
xn ∈ US (∞)
bzw.
∀S ∈ R ∃N (S) ∈ N ∀n ≥ N (S)
gilt
xn ∈ US (−∞)
Ist eine dieser Bedingungen erfüllt, so sagt man, (xn ) konvergiere uneigentlich gegen ∞ bzw. −∞.
Einfache Beispiele sind die durch an = n bzw. bn = −n definierten Folgen,
die gegen ∞ bzw. −∞ konvergieren. Man beachte, dass es auch immer noch
Folgen gibt, die in keinem Sinne konvergieren, etwa cn = (−1)n (die auch
nicht uneigentlich konvegieren kann, da eine uneigentlich konvergente Folge
auf jeden Fall unbeschränkt sein muss), oder dn = (−1)n n, die aus zwei
uneigentlich konvergenten Teilfolgen besteht. Für Funktionen definiert man
in derselben Weise:
38
Mathematik für Physiker und Informatiker I (Kurzskript)
Definition 11 Es sei f : (x0 , ∞) → R eine Funktion. Dann ist
lim f (x) = α ⇐⇒ ∀ ε > 0∃ x0 ∈ R∀ x > x0
gilt
|f (x) − α| < ε
lim f (x) = α ⇐⇒ ∀ ε > 0∃ x0 ∈ R∀ x < x0
gilt
|f (x) − α| < ε,
x→∞
x→−∞
und
lim f (x) = −∞
x→x0
bzw.
lim f (x) = ∞
x→x0
ist definiert als
∀S ∈ R ∃δ > 0 ∀ 0 < x < |x − x0 | < δ
gilt
f (x) > S
∀S ∈ R ∃δ > 0 ∀ 0 < x < |x − x0 | < δ
gilt
f (x) < S.
bzw.
Ist die Variable des Definitionsbereichs von f die Zeit t, so modelliert man
mit den Grenzwerten t → ±∞ das langfristige, in Vergangenheit oder Zukunft liegende Verhalten eines durch f beschriebenen Systems. Häufig ist
nämlich das, was in kurzen Zeiträumen geschieht, fast unüberschaubar komplex und erst durch Grenzwertbildung einer vereinfachten Betrachtung zugänglich. Beispiele gibt es etwa in der chemischen Reaktionskinematik, bei den
Streuversuche, die Physiker in Teilchenbeschleunigern durchführen oder auch
ganz einfach beim Umrühren von Milch im Kaffee. Ein sehr einfaches mathematisches Beispiel ist die Untersuchung des asymptotischen Verhaltens
von z.B. gebrochen rationalen Funktionen: Dazu seien x1 , . . . xN die (reellen)
Nullstellen des Polynoms Q(x), P (x) ein weiteres Polynom sowie
f : R \ {x1 , . . . , xn } → R,
x 7−→
P (x)
.
Q(x)
Gilt nach einer Polynomdivision
P (x)
P 0 (x)
= R(x) +
,
Q(x)
Q(x)
dass R(x) ein Polynom und dass der Grad von P 0 echt kleiner als der von
Q ist, dann folgt
P (x)
− R(x) = 0,
lim
x→±∞ Q(x)
und man sagt, f verhält sich asymptotisch wie das Polynom R(x). Mit anderen Worten, das für ein Polynom untypische Verhalten einer gebrochen
rationalen Funktion (etwa die Existenz von Stellen, an denen diese Funktion die Grenzwerte ±∞ besitzt), findet auf einem abgeschlossenen Intervall
[a, b] statt, im Komplement dieses Intervalls weicht f vom Polynom R nur
um eine kleine Zahl ab, die zuvor durch Festlegung von [a, b] frei gewählt
werden kann.
Die Berechnung einer ganzen Reihe von Grenzwerten vereinfachen sich
aufgrund der Regeln von l’Hospital:
Werner, Universität Münster, WS 05/06
39
Satz 21 Es sei −∞ ≤ a < b ≤ ∞, f und g auf (a, b) differenzierbare
Funktionen und g 0 (x) 6= 0 für alle x ∈ (a, b). Ferner sei
f 0 (x)
= c.
x→a g 0 (x)
lim
(i) Gilt
lim f (x) = lim g(x) = 0
x→a
x→a
(ii) oder
lim g(x) = ∞,
x→a
so folgt
lim
x→a
f (x)
=c
g(x)
Die enstprechende Aussage gilt auch für Grenzwerte x → b oder, in (ii),
g(x) → −∞.
Der erste Teil folgt für a < ∞ sehr direkt aus Satz 20(iii): Ergänzt man f
und g stetig am Punkt a durch f (a) = g(a) = 0, so findet man einen Punkt
ξx mit a < ξx < x und
f (x)
f (a) − f (x)
f 0 (ξ)
=
= 0
g(x)
g(a) − g(x)
g (ξ)
Da mit x → a auch gilt ξx → a, folgt Teil (i) im Fall a > −∞. (Man beachte,
dass aus dieser Überlegung aufgrund der Voraussetzung f 0 (x)/g 0 (x) → c
für x → a zugleich auch folgt, dass der Bruch f (x)/g(x) für Punkte x,
die hinreichend nahe bei a sich befinden, wohldefiniert ist.) Den Fall a =
−∞ kann man durch Übergang zu f1 (x) = f (1/x) und g1 (x) = g(1/x)
bewältigen:
− x12 f 0 x1
f (x)
f (1/x)
f 0 (x)
lim
= lim
= lim
=
lim
,
x→−∞ g(x)
x→−∞ g 0 (x)
x→0 g(1/x)
x→0 − 12 g 0 1
x
x
Der Teil (ii) ist ein klein wenig schwieriger: Wir wählen eine Zahl δ > a, so
dass aus δ > x > a folgt
0
f (x)
g 0 (x) − c < ε.
Es sei δ > x0 > a festgewählt. Dann folgt für jedes δ > x > a aus Satz
20(iii)
f (x) − f (x0 )
<ε
(1)
−
c
g(x) − g(x0 )
und somit
f (x) − f (x0 ) g(x) − g(x0 ) < |c| + ε.
40
Mathematik für Physiker und Informatiker I (Kurzskript)
Multipliziert man diese Ungleichung mit |g(x) − g(x0 )||g(x)|−1 (dazu muss
man ggf. zu einer Zahl δ ≥ δ1 > 0 übergehen mit der Eigenschaft, dass aus
δ1 > x > a folgt g(x) 6= 0), so wird daraus
f (x) f (x0 ) f (x) f (x0 ) g(x0 ) g(x) − g(x) ≤ g(x) − g(x) ≤ |c| + ε + g(x) .
Damit ist |f (x)||g(x)|−1 für δ2 > x > a durch eine feste Konstante beschränkt. Aus dieser Beschränktheit sowie der Tatsache, dass g(x) → ∞ für
x → a folgt dann
f (x) − f (x0 ) f (x)
lim
−
= lim
x→a g(x) − g(x0 )
g(x) x→a
f (x0 )
f (x) g(x0 )
g(x) g(x) − g(x)
0)
1 − g(x
g(x)
=0
Damit existiert eine Zahl δ3 , so dass aus δ3 > x > a folgt
f (x) f (x) − f (x0 ) g(x) − g(x) − g(x0 ) < ε,
weshalb mit (1) für δ3 > x > a
f (x)
< 2ε
−
−c
g(x)
gelten muss, und die Behauptung ist bewiesen.
Nicht nur die hier betrachteten Grenzwerttypen können mit den Regeln
von l’Hospital behandelt werden; mit etwas Phantasie lassen sich auch andere Grenzwert auf die behandelten Typen zurückführen, etwa
1
x→∞ 1/x
p
n
lim
xn + xn−1 − x = lim
x→∞
r
n
1
1+ −1
x
1 1
= lim
x→∞ −1/x2 n
!
=
1
1 n −1 −1
1
1+
= .
2
x
x
n
E. Der Mittelwertsatz n-ter Ordnung: Satz von Taylor Wir wissen,
dass für eine auf einem offenen Intervall (a, b) um den Punkt x0 differenzierbare Funktion f es für jedes x ∈ (a, b) eine Punkt ξ zwischen x und x0 gibt
mit
f (x) = f (x0 ) + f 0 (ξ)(x − x0 ).
Im Folgenden gehen wir der Frage nach, ob es zu dieser Aussage ein Analogon
für die n-fache Ableitung f (n) gibt. Es wird sich zeigen, dass diese Frage auch
zu einer besonders guten Approximation von f um den Punkt x0 durch
Polynome führt.
Werner, Universität Münster, WS 05/06
41
Satz 22 Es sei f : (a, b) → R n-fach differenzierbar. Sind x, x0 ∈ (a, b), so
existiert ein Punkt ξ zwischen x und x0 mit der Eigenschaft, dass
f (x) =
n−1
X
ν=0
f (ν) (x0 )
f n (ξ)
(x − x0 )ν +
(x − x0 )n .
ν!
n!
Mit anderen Worten: Für eine n-fach differenzierbare Funktion f und einen
Punkt x0 aus deren Definitionsbereich gibt es ein Polynom P , das f in der
Nachbarschaft von x0 bis auf einen Term der Ordung n approximiert11 .
Der Beweis ist im wesentlichen eine n − 1-fache Anwendung des Satzes
von Rolle. Natürlich gibt es immer eine Zahl M mit
f (x) =
n−1
X
ν=0
f (ν) (x0 )
(x − x0 )ν + M (x − x0 )n ,
ν!
und die Kunst besteht darin nachzuweisen, dass n!M = f n (ξ) für einen
strikten Zwischenwert ξ gilt. Zu diesem Zweck sei
g(t) = f (t) −
n−1
X
ν=0
f (ν) (x0 )
(t − x0 )ν − M (t − x0 )n .
ν!
Pn−1 f (ν) (x0 )
(t − x0 )ν gerade
Wenn Sie sich gefragt haben, warum P (t) = ν=0
ν!
von dieser Form sein muss, dann kommt hier der Grund: P ist genau das
Polynom vom Grad (höchstens) n − 1, für das
f (k) (x0 ) = P (k) (x0 )
für alle k = 0, . . . , n − 1 gilt. Aus dieser Eigenschaft folgt nämlich, dass
g (k) (x0 ) = 0 für alle diese k, und die angekündigte mehrfache Anwendung
des Satzes von Rolle kann beginnen: Nach Definition von M gilt im ersten
Schritt g(x) = 0 und (Rolle) es gibt einen Punkt x1 (strikt) zwischen x
und x0 mit g 0 (x1 ) = 0. Dann aber gibt es auch einen Punkt x2 (wieder
nach dem Satz von Rolle), echt zwischen x0 und x1 gelegen mit g 00 (x2 ) = 0.
Argumentiert man in dieser Weise weiter, so gelangt man nach n−1 Schritten
schließlich zu dem gesuchten Zwischenwert ξ.
F. Beispiele und Anwendungen Interessant ist, dass die Taylorformel
ein sehr allgemein gültiges Rezept vermittelt,Pnach dem man eine gegebene
n
Funktion f in eine Potenzreihe der Form12 ∞
n=0 an (x − x0 ) ‘entwickeln’
Pn−1 f (ν) (x0 )
Man kann zeigen, dass das Polynom
(x − x0 )ν durch diese Forderung
ν=0
ν!
eindeutig bestimmt ist.
12
Diese ist von etwas allgemeinerer Form als die, die wir bislang angesehen haben; die
wesentlichen Aussagen sind jedoch dieselben.
11
42
Mathematik für Physiker und Informatiker I (Kurzskript)
kann. Es ist aber zum einen nicht klar, für welche Punkte x die sogenannte
Taylorreihe
∞
X
f (n) (x0 )
(x − x0 )n
n!
n=0
von f um x0 konvergiert, und zum anderen ist auch nicht offensichtlich, für
welche x die Taylorreihe gegen den Wert f (x) konvergiert (d.h. für welche
x das Restglied im Satz eine Nullfolge bildet).
Zwei Beispiele: Für α ∈ Q — um Fallunterscheidungen zu vermeiden,
schließen wir den einfachen Fall aus, dass α ∈ N ist — sei f (x) = (1 + x)α .
Dann ist f (n) am Punkt x0 = 0 durch α(α − 1) . . . (α − ν + 1) gegeben. Für
|x| < 1 ist die resultierende Taylorreihe (die sogenannte Binomische Reihe)
Y
∞ n
X
α n
α
α−ν+1
x
mit
=
n
n
ν
n=0
ν=1
(1 + x)α
konvergent und stellt die Funktion
dar: Dass diese Potenzreihe den
Konvergenzradius 1 besitzt, sieht man mit Hilfe des Quotientenkriteriums.
Dass sie die Funktion (1+x)α darstellt, folgt für 1 > x ≥ 0 aus der Tatsache,
dass das Restglied
n
f n (ξ)
α
x
(x − x0 )n = (1 + ξ)α
,
0 < ξ < x < 1,
n!
n
1+ξ
aufgrund der Konvergenz der Reihe eine Nullfolge sein muss. Wenn wir für
den Moment einmal davon ausgehen, dass sich Potenzreihen innerhalb ihres
Konvergenzintervalls ableiten lassen wie die Polynome (was wir im nächsten
Kapitel genau zeigen werden), dann sieht man, dass f 0 (x)(1 + x) = αf (x)
für alle x mit |x| < 1 gilt. Da diese Beziehung auch für die Funktion g(x) =
(1+x)α besteht, folgt (für α 6= 0) f 0 (x)/g 0 (x) = f (x)/g(x) sowie f 0 (x)g(x)−
f (x)g 0 (x) = 0 für alle diese x, und der Quotient f /g muss eine konstante
Funktion sein. Der Wert dieser Konstanten aber ist f (0)/g(0) = 1.
Wenn Ihnen diese Überlegun sehr umständlich vorkommt, dann hilft
vielleicht das folgende Beispiel für ein besseres Verständnis: Es sei ϕ : R →
R,
 1
−

e x2 für x 6= 0
ϕ(x) =

0
für x = 0
Nimmt man die Ableitungsregeln der Exponentialfunktion vorweg, dann
gibt es für alle n ∈ N ein Polynom Pn mit ϕ(n) (x) = Pn (x−1 )ϕ(x) für x 6= 0
und aus der Regel von l’Hospital folgt ϕ(n) (0) = 0 für alle n ∈ N0 . Die
Tayloreihe von ϕ konvergiert also überall und stellt die Funktion ϕ dennoch
nur im Nullpunkt dar.
Es wird nun aber Zeit, dass wir uns darum kümmern, ob Potenzreihen
wirklich so differenziert werden dürfen wie Polynome.
Werner, Universität Münster, WS 05/06
43
3. Funktionenfolgen
A. Punktweise und gleichmäßige P
Konvergenz Bisher habe wir die
Konvergenz von Potenzreihen P (x) = n an (x − x0 )n stets für einzelne xWerte betrachtet
und damit eine Folge von Funktionen (die der Polynome
P
n
a
PN (x) = N
n=1 n (x − x0 ) ) erhalten, die punktweise gegen eine Grenzfunktion konvergiert. Auch die durch fn : [0, 1] → R, fn (x) := xn definierte
Funktionenfolge konvergiert an jedem Punkt von [0, 1] und zwar
lim xn =
n→∞

1
falls x = 1

0
sonst
.
Hieraus kann man lernen, dass punktweise Konvergenz nicht ausreicht,
um von der Stetigkeit der Folgenglieder auf die der Grenzfunktion zu schließen. Dieser punktweisen Konvergenz liegt übrigens auch keine Vorstellung
von Abstand zu Grunde, der ja ganz wesentlicher Bestandteil bei der Konvergenz von Zahlenfolgen war. Die folgende Definition behebt auch dieses
Manko. Anschaulich besagt der gleich eingeführte Abstandsbegriff, dass zwei
Funktionen f und g dann einen Abstand haben, der kleiner oder gleich d ∈ R
ist, wenn der Graph von f in einem Schlauch der Breite 2d um den Graphen
von g enthalten ist.
Definition 12 Es seien f, g, fn : [a, b] → R, n ∈ N, Funktionen.
(a) Der Abstand zwischen f und g ist definiert durch
kf − gk = sup |f (x) − g(x)|.
x∈[a,b]
(b) Die Folge (fn ) konvergiert gleichmäßig gegen f , falls limn→∞ kf −fn k =
0, d.h. falls für alle ε > 0 ein N (ε) ∈ N existiert, so dass für alle
x ∈ [a, b] und alle n ≥ N (ε) stets |f (x) − fn (x)| < ε gilt.
Satz 23 Es sei (fn ) eine auf dem Intervall [a, b] definierte Folge von Funktionen.
(a) Konvergiert die Folge (fn ) gleichmäßig gegen f : [a, b] → R, so ist mit
den Funktionen fn auch f stetig.
(b) Sind die Funktionen fn (an den Randpunkten einseitig) differnzierbar, konvergiert die Folge der Ableitungen (fn0 ) gleichmäßig gegen eine Funktion ϕ und ist fn (x) konvergent für wenigstens einen Punkt
x ∈ [a, b], so konvergiert (fn ) gleichmäßig gegen eine differenzierbare
Funktion f mit f 0 = ϕ.
44
Mathematik für Physiker und Informatiker I (Kurzskript)
Der Beweis des Teils (a) ist ein sogenanntes ‘typisches ε/3-Argument’: Es
sei ε > 0 und x0 ∈ [a, b]. Zuerst wählt man n ∈ N mit kf − fn k < ε/3,
sodann für die stetige Funktion fn eine Zahl δ > 0, so dass aus |x − x0 | < δ
stets |fn (x) − fn (x0 )| < ε/3 folgt. Dann ergibt sich aber für dieselben x
|f (x) − f (x0 )| ≤ |f (x) − fn (x)| + |fn (x) − fn (x0 )| + |fn (x0 ) − f (x0 )| < ε.
Den Beweis des Teils (b) lassen wir weg und betrachten im Anschluss aber
den Fall, der uns hier besonders interessiert, die Folge der Partialsummen einer Potenzreihe. Die gleichmäßige Konvergenz der Folge (fn ) selbst reicht im
Teil (b) übrigens nicht: Anschaulich gesprochen ist für jede Folge von Funktionen deren Glieder in immer engeren ε-Schläuchen um eine Grenzfunktion
enthalten sind, stets Platz für nahezu beliebige Eskapaden der Tangentensteigungen. Wem diese Begründung nicht ausreicht: Die durch
x
gn : [−1, 1] → R
gn (x) =
1 + nx2
definierten Glieder einer Folge besitzen den Abstand
1
kgn k = √
2 n
zur Nullfunktion (das Ergebnis einer Extremalwertaufgabe), so dass (gn )
gleichmäßig gegen diese konvergiert. Zugleich aber ist

1 falls x = 0
2
1 − nx
lim gn0 (x) = lim
=
,
n→∞ (1 + nx2 )2

0 sonst
und (gn0 ) konvergiert weder gleichmäßig noch ist der punktweise gebildete
Limes die Ableitung der Grenzfunktion der Folge (gn ).
B. Die Konvergenz der Potenzreihen
P
Satz 24 Es besitze die Potenzreihe n an (x − x0 )n den Konvergenzradius
r ∈ R ∪ {∞}.
(a) Für
P jede Zahl 0 n< α < r konvergiert die Folge der Partialsummen von
auf dem Intervall [x0 − α, x0 + α], und
n an (x −
Px0 ) gleichmäßig
n
die durch n an (x − x0 ) vermittelte Funktion ist auf (x0 − r, x0 + r)
stetig.
P
(b) Die Funktion x 7→ n an (x−x0 )n ist an jedem Punkt x ∈ (x0 −r, x0 +r)
differenzierbar, und es gilt auf dem gesamten Intervall (x0 − r, x0 + r)
!0
∞
∞
X
X
n
an (x − x0 )
=
nan (x − x0 )n−1 ,
n=0
n=1
wobei die zweite Potenzreihe den gleichen Konvergenzradius wie
x0 )n besitzt.
P
n an (x−
Werner, Universität Münster, WS 05/06
45
Für den Beweis lohnt es sich, die Begründung für das Quotientenkriterium
in Erinnerung
zu rufen: Danach ist für eine passend
gewählte Zahl A die
P
P
Reihe n Aq np
eine konvergente Majorante für n an (x − P
x0 )n , wann immer
n
n
q = lim sup
n≥N an (x − x0 )
P n |an n(x − x0 ) | < 1. Für den Reihenrest
ist dann
Aq
eine
Majorante,
die
unabhängig
von
x ist, für jedes
n≥N
p
n
n
α0 < q und alle p
x mit lim supn |an (x − x0 ) | ≤ α0 < q, bzw. für jedes
n
α = α0 (lim supn |an |)−1 < r und alle x mit |x − x0 | < α.
Für den Beweis von
der KonvergenzraP∞
P (b) beobachtenn wir zunächst, dass
n−1
a
(x−x
)
gleich
dem
von
dius der Potenzreihe ∞
0
n=1 nan (x−x0 )
n=0 n
√
ist (was im wesentlichen aus lim n n → 1 folgt). Eine zweifache Anwendung
des Mittelwertsatzes zeigt, dass für jede doppelt differenzierbare Funktion
f : (a, b) → R mit |f 00 (x)| ≤ K für alle x ∈ (a, b) und jeden Punkt x0 ∈ (a, b)
gilt
f (x) − f (x0 )
0
≤ K|x − x0 |.
−
f
(x
)
0
x − x0
Für die Funktion Pn (x) = (x−x0 )n gilt entsprechend |P 00 (x)| ≤ n(n−1)hn−2
für alle x ∈ (x0 + h, x0 − h), und damit folgt für h mit |h| ≤ h0 und
(x0 − h0 , x0 + h0 ) ⊆ (x0 − r, x0 + r)
!
∞
∞
∞
1 X
X
X
an (x + h − x0 )n −
an (x − x0 )n −
nan (x − x0 )n−1 h
n=0
n=0
n=1
∞
X
≤ |h| an n(n − 1)hn−2
0
n=2
Die auf der rechten Seite sich befindende Reihe aber konvergiert (im Prinzip
√
wiederum wegen lim n n → 1), und für h → 0 ergibt sich die behauptete
Formel für die Ableitung einer Potenzreihe.
Man kann die Aussage natürlich immer wieder neu auf die nach einer
Ableitung erhaltene Potenzreihe anwenden. Es stellt sich so heraus, dass Potenzreihen im Innern ihres Konvergenzintervalls
beliebig oft differenzierbar
P
n
sind. Für die n-te Ableitung von f (x) = ∞
a
n=0 n (z − z0 ) am Punkt x0 gilt
insbesondere
f (n) (x0 ) = n!an ,
und wir erhalten
Satz 25 Besitzt die Funktion f die Darstellung
f (x) =
∞
X
an (z − z0 )n ,
n=0
so ist diese Reihe bereits die Taylorreihe von f .
Dieser Satz vereinfacht häufig die Berechnung einer Taylorreihe: Ist man
in der Lage, eine Potenzreihenentwicklung für eine vorgelegte Funktion zu
“erraten”, so hat man deren Taylorreihe bereits gefunden.
46
Mathematik für Physiker und Informatiker I (Kurzskript)
C. Anwendung: Die Erzeugendenfunktion der Fibonacchi-Zahlen
Die durch F0 = F1 = 1 und Fn = Fn−1 + Fn−2 rekursiv definierte Folge der
Fibonacchi-Zahlen besitzt die geschlossene Darstellung
1
Fn = √
5
"
√ !n #
1− 5
.
2
√ !n
1+ 5
−
2
Die Erzeugenden-Funktion der Folge (Fn ) ist
Φ(x) =
∞
X
Fn xn
n=0
Die Rekursion für die Fn liefert
−F0 x + xΦ(x) + x2 Φ(x) = Φ(x) − F1 x − F0 ,
woraus sich Φ zu
Φ(x) =
1
1 − x − x2
errechnet. Der Trick besteht nun darin, Φ noch einmal direkt in eine Potenzreihe um den Nullpunkt zu entwickeln:
√ Die Nullstellen des Nenners
von (1 − x − x2 )−1 sind x1,2 = −1/2(1 ± 5) und daher ist 1 − x − x2 =
(x − x1 )(x − x2 ). In dem Ansatz
1
A
B
=
+
2
1−x−x
x − x1 x − x2
bestimmt man die Zahlen A und B (etwa durch Probieren oder, systematischer, durch Ausmultiplizieren und Koeffizientenvergleich), was auf
1
1
Φ(x) =
=√
2
1−x−x
5
1
2√
−1+ 5
− −1+2 √5 x
−
1
!
2√
−1− 5
− −1−2 √5 x
=
"
n+1 n+1 #
∞
X
1
2
2
√
√
√
=
−
xn
5
−1
+
5
−1
−
5
n=0
führt. Aufgrund von Satz ??, müssen die Koeffizienten beider Potenzreihenentwicklungen von Φ um Null dieselben sein, und man erhält die angegebene
Formel für die Fibonacchi-Zahlen, nachdem man die Brüche passend erweitert hat.
In der Physik taucht diese Technik (in etwas komplexerer Form) für eine
ganze Reihe wichtiger und nicht ganz einfach zu handhabenden Funktionen
auf. So genügen etwa die Bessel-Funktionen erster Art, Jn (x), n ∈ Z, (die
Werner, Universität Münster, WS 05/06
47
man kennen muss, um z.B. die Grundschwingungen einer kreisförmigen, am
Rande eingespannten Membran zu verstehen) der Beziehung
∞
X
x
1
exp
t−
=
Jn (x)tn ,
2
t
n=−∞
in der nicht nur eine “unendlich lange gebrochen rationale Funktion” (eine
Laurent-Reihe als Verallgemeinerung der Potenzreihen) in Erscheinung tritt,
sondern die Koeffizienten auch noch von einer zweiten Variablen abhängen.
4. Wichtige Funktionen
A. Die Exponentialfunktion Wir kommen zurück zu den Funktionen,
die die Wachstumsgleichung
y 0 (t) = αy(t)
lösen. Wie man leicht sieht, ist eine jede solche Funktion beliebig
Poft diffen
renzierbar. Wenn wir für den Augenblick annehmen, dass y(t) = ∞
n=0 an t
in einer Umgebung des Nullpunkts durch ihre Taylorreihe dargestellt wird,
dann muss gelten
!0
∞
∞
∞
X
X
X
(n + 1)an+1 tn =
an tn = α
an tn
n=0
n=0
und daher
an+1 =
α
an
n+1
Wir schreiben
exp(αz) :=
n=0
oder
an = a0
∞
X
(αz)n
n=0
n!
αn
n!
.
Die Funktion z 7→ a0 exp(αz) ist dann für alle z ∈ C definiert und löst das
sogenannte Anfangswertproblem y 0 = αy, y(0) = a0 . Weiter unten werden
wir zeigen, dass diese Funktionen für a0 6= 0 nirgends verschwinden, und es
folgt aus dem Mittelwertsatz, dass diese Lösung die einzige ist, die es gibt.
Um die wichtigsten Eigenschaften dieser Funktionen herleiten zu können,
brauchen wir den folgenden Satz über das sogenannte Cauchy-Produkt von
Reihen.
P
P
Satz 26 Es seien n an und n bn absolut konvergente Reihen komplexer
Zahlen an und bn , n ∈ N0 . Dann gilt
! ∞ !
∞
∞ X
n
X
X
X
aν
bν =
an−ν bν ,
ν=0
ν=0
und auch die Reihe mit den Gliedern
n=0 ν=0
Pn
ν=0 an−ν bν
konvergiert absolut.
48
Mathematik für Physiker und Informatiker I (Kurzskript)
Diese Methode, die vielen Produkte der Summanden des Produkts zweier
Reihen aufzuschreiben ist nicht zuletzt deswegen besonders praktisch, da
sie genau der Ordnung der Terme nach dem Grad der Potenzen (z − z0 )n
entspricht.
Wir erhalten als Folgerung eine Reihe von wichtigen Eigenschaften der
Exponentialfunktionen:
Satz 27 Für die im komplexen definierte Funktion E(·) gilt
(a) Für alle z, w ∈ C ist
E(z + w) = E(z)E(w).
(b) E(z) 6= 0 für alle z ∈ C
(c) E(z) = E(z) für alle z ∈ C.
(d) Es ist
E(x) = lim
n→∞
und mit
1+
x n
,
n
∞
1 n X 1
e := E(1) = lim 1 +
=
n→∞
n
n!
n=0
erhält man
E(r) = er
für alle r ∈ Q.
Teil (a) ist eine gemeinsame Anwendung von Cauchy-Produkt und binomischer Formel:
∞ X
n
∞
n X
X
1
1 X n ν n−ν
ν n−ν
E(z)E(w) =
z w
=
z w
= E(z+w),
ν!(n − ν)!
n!
ν
n=0 ν=0
n=0
ν=0
Teil (b) folgt hieraus, da 1 = E(0) = E(z)E(−z) für alle z ∈ C, und
der Teil (c) ist eine Konsequenz der Tatsache, dass die Konjugation ein
sogenannter (stetiger) Körperautomorphismus von C ist, d.h. für alle z, w
gilt z + w = z + w, sowie z · w = z · w. Die erste Gleichung des Teils (d)
ergibt sich mit Hilfe der Regel von l’Hospitalr. Die für alle rationale Zahlen
r gültige Beziehung exp(r) = er ist jetzt leicht einzusehen.
C. Trigonometrische Funktionen Wir untersuchen zunächst weiterhing die komplexe Exponentialfunktion. Wir bezeichnen diese mit exp(z)
oder auch ez . Es gilt für alle x+iy ∈ C exp(x+iy) = exp(x) exp(iy), und hier
ist der Anteil exp(iy) unklar. Wir definieren zwei Funktionen A, B : R → R
durch
exp(iy) = A(y) + iB(y)
Werner, Universität Münster, WS 05/06
49
Da die Potenzen von i durch die Folge 1, i, −1, −i, 1, i, . . . gegeben sind,
entnimmt man der Potenzreihe von exp
A(y) =
∞
X
(−1)n
n=0
y 2n
(2n)!
sowie
B(y) =
∞
X
(−1)n
n=0
y 2n+1
(2n + 1)!
und daraus
A0 (y) = −B(y)
und
B 0 (y) = A(y).
Aufgrund des Teils (c) des letzten Satzes ist stets | exp(iy)| = 1 und wir
wollen versuchen zu klären, was die geometrische Bedeutung der Zahl y ist.
Wir stellen uns dazu die Abbildung t 7→ exp(it) als die Darstellung eines
Punktes P vor, dass sich auf dem Einheitskreis in der Ebene bewegt und zum
Zeitpunkt t sich im Punkt exp(it) befindet. Der Betrag der Geschwindigkeit,
mit dem P vorankommt13 , ist wegen exp0 (it) = i exp(it) konstant gleicht
1, so dass P den Einheitskreis stets mit demselben Drehsinn durchläuft
(wäre dies nicht so, so müsste die Geschwindigkeit an einem “Umkehrpunkt”
verschwinden). Nun erkennt man leicht aus den Potenzreihen, dass A(y) und
B(y) für y ∈ (0, 1] strikt positiv sind. Daher fällt A in diesem Bereich, und B
steigt monoton: Die Bewegung von P erfolgt als entgegen dem Uhrzeigersinn.
Die Strecke, die P beginnend bei 0 bis zum Zeitpunkt t zurückgelegt hat,
ist
Geschwindigkeit × Zeit = 1 × t = t.
Damit befindet sich der Punkt exp(it) also am Ende eines gegen den Uhrzeigersinn abgetragenen Bogens der Länge t. Anders ausgedrückt: t ist der
Winkel (gemessen im Bogenmaß) den der Vektor exp(it) mit der reellen
Achse einschließt. Es stellt sich heraus, dass die Funktionen A und B genau
die aus der Schule bekannten trigonometrischen Funktionen sind, und wir
können nach einer rein formalen Umbenennung schreiben für alle x, y ∈ R
exp(x + iy) = exp(x)(cos y + i sin y),
An dieser Stelle wird klar, weshalb es günstig ist, die Winkelfunktionen
auf das Bogenmaß zu beziehen. Wir erhalten jetzt: Zunächst die nicht unverdient populäre Gleichung eiπ = −1, sodann einen einfachen Beweis der
trigonometrischen Additionstheoreme, die sich für alle x, y ∈ R aus
cos(x + y) + i sin(x + y) = exp(i(x + y)) = exp(ix) exp(iy) =
= cos(x) cos(y) − sin(x) sin(y) + i (cos(x) sin(y) + cos(y) sin(x))
ergeben und schließlich eine neue Darstellung für die Polarkoordinaten: Für
jede komplexe Zahl gilt
z = (|z|, ϕ) = |z|eiϕ .
13
An dieser Stelle greifen wir ein wenig vor; denn der Pfad, um den es hier geht, ist eine
Funktion R → R2 , deren Ableitungen wir noch nicht behandelt haben
50
Mathematik für Physiker und Informatiker I (Kurzskript)
D. Die Umkehrfunktionen Die letzte Ausbaustufe unserer Betrachtungen zur Stetigkeit der Wurzelfunktion liefert der nachfolgende Satz. Er besagt, dass alle expliziten Rechnungen überflüssig waren, und die Stetigkeit
der Wurzelfunktion bereits aus der der Abblidung x 7→ x2 folgt, die ja sehr
viel einfacher zu erhalten ist. Sein Beweis benutzt ganz wesentlich den Satz
15.
Satz 28 Ist f : [a, b] → R eine monoton wachsende Funktion, so bildet f
das Intervall [a, b] bijektiv auf das Intervall [f (a), f (b)] ab, und die Umkehrfunktion
f −1 : [f (a), f (b)] → [a, b]
ist stetig. Analoge Aussagen gelten für monoton fallende Funktionen.
Die Tatsache, dass f injektiv ist, folgt aus dem monotonen Wachstum, die
Surjektivität ist eine Konsequenz des Zwischenwertsatzes. Um die Stetigkeit der Umkehrfunktion nachzuweisen, beginnt man mit einem Punkt y0 ∈
[f (a), f (b)] sowie einer gegen y0 konvergenten Folge (yn ) aus [f (a), f (b)].
Falls (im Gegensatz zu dem, was wir eigentlich zeigen müssten) f −1 (yn )
nicht gegen f −1 (y0 ) konvergiert, gibt es eine Teilfolge (ynk ) sowie eine Zahl
ε0 > 0, so dass für alle k ∈ N gilt |f −1 (ynk ) − f −1 (y0 )| ≥ ε0 . Da [a, b] kompakt ist, können wir sogar annehmen, dass f −1 (ynk ) eine konvergente Folge
ist, deren Grenzwert wir x0 nennen — unter Umständen müssen wir halt zu
einer weiteren Teilfolge übergehen, die wir hier aber der Einfachheit halber
auch f −1 (ynk ) nennen. Es folgt dann einerseits |x0 − f −1 (y0 )| ≥ ε0 , auf der
anderen Seite aber ist wegen der Stetigkeit von f zugleich
y0 = lim ynk = lim f (f −1 (ynk )) = f (x0 )
k→∞
k→∞
woraus sich der Widerspruch f −1 (y0 ) = x0 ergibt.
Dieser Satz lässt sich recht leicht auf den Fall von monoton wachsenden
(fallenden) Funktionen auf Intervallen [a, ∞) bzw. (−∞, b] ausdehnen: Ist
z.B. f : [a, ∞) stetig und monoton, dann besitzt für jedes n ∈ N nach Satz 16
die Einschränkung f |[a,a+n] : [a, b] → R, x 7→ f (x) eine (insbesondere) am
Punkt y0 stetige Inverse
f |[a,a+n] −1 = f −1 |[f (a),f (a+n)] : [f (a), f (a + n)] → [a, a + n].
Was noch zu zeigen bleibt, ist, dass aus der Stetigkeit der Einschränkung an
einem Punkt y0 die der ursprünglichen Abbildung an derselben Stelle folgt.
Dies aber ist eine Konsequenz der Tatsache, dass jede Folge in f (D), die
gegen y0 konvergiert, von einem Index N0 an in dem Intervall [f (a), f (a+n)]
enthalten ist.
Eine Konsequenz dieser Überlegung: Die Wurzelfunktionen f : R+
0 → R,
√
x 7→ n x sind für jedes n ∈ N stetig. Im Reellen besitzen die Funktionen ex ,
Werner, Universität Münster, WS 05/06
51
sin x, cos x, tan x = sin x(cos x)−1 für entsprechend eingeschränkte Definitionsbereiche die Umkehrfunktionen
h π πi
ln x : R+ → R,
arcsin x : [−1, 1] → − ,
,
2 2π π arccos x : [−1, 1] → [0, π],
arctan x : R → − ,
,
2 2
deren Existenz, Stetigkeit und Differenzierbarkeit alle entsprechenden Monotonieaussagen und den Sätzen 16 und 18(ii) folgt. Für die Ableitungen
erhält man
(ln x)0 =
1
,
x
(arcsin x)0 = √
1
(arccos x)0 = − √
,
1 − x2
1
,
1 − x2
(arctan x)0 =
1
.
1 + x2
Die Talorreihen aller dieser Ableitungen lassen sich auf die binomische Reihe
zurückführen. Wenn man noch den Wert a0 = f (x0 ) hinzunimmt so, lässt
sich aus den Taylorreihen für die Ableitungen diejenigen der Umkehrfunktionen selbst ermitteln. Man erhält
∞
∞ n+1
X
X
−1/2 x2n+1
n (x − 1)
ln x =
(−1)
,
arcsin x =
,
n+1
n
2n + 1
n=0
n=0
2n+1
∞ ∞
X
X
π
−1/2 x
x2n+1
arcosh x = −
,
arctan x =
(−1)n
,
2
n
2n + 1
2n + 1
n=0
n=0
jeweils für |x| < 1 bzw. (für ln) |x − 1| < 1. Bemerkenswert an diesen
Potenzreihen ist, dass unter ihnen für bestimmte x-Werte alte Bekannte
auftreten. Unglücklicherweise scheinen die interessanten Reihen aber immer
gerade für x-Werte auf dem Rand des Konvergenzbereichs aufzutreten. Das
folgende Ergebnis erlaubt es, den Wert dieser Reihen auch an diesen Stellen
zu berechnen.
P∞
Satz 29 Es besitze die Potenzreihe f (x) =
P∞ n=0 einen Konvergenzradius,
der größer oder gleich 1 ist. Falls f (1) := n=0 an konvergiert, so gilt
f (1) = lim f (x).
x→1
Dieses Resultat ist auch als der Abelsche
P Grenzwertsatz bekannt. Der Beweis
gründet sich auf den Einfall, rn = ∞
ν=n+1 aν für n ≥ −1 zu setzen, womit
man dann schreiben kann
f (1) − f (x) = (1 − x)
∞
X
rn−1 xn
n=0
P
n
(aus dieser Beziehung ergibt sich auch im Grenzübergang, dass ∞
n=0 rn−1 x
für x ∈ [−1, 1] konvergiert.) Die Reihe lässt sich günstig zerlegen: Falls