I (Kurzskript) - Fachbereich Mathematik und Informatik

Werbung
Werner
Universität Münster
WS 08/09
Mathematik für Physiker
(und Informatiker) I
(Kurzskript)
Mathematische Strukturen sind durch einen Satz von Axiomen bestimmt.
Man ist bemüht, wichtige und interessante Aussagen aus diesen Axiomen
herzuleiten. Die Sprache, derer man sich dabei bedient, ist die der (mathematischen) Logik.
Entgegen einem weit verbreiteten Irrtum beschäftigt sich Mathematik
nicht bloß mit der Syntax dieser Sprache; wichtig ist Mathematik nicht zuletzt durch den Erfolg der mathematischen Modelle, auf die man bei vielen
Gelegenheiten stößt. Nach einer mathematischen Untersuchung dieser Modelle, lassen sich die Ergebnisse für (präzise) Vorhersagen nutzen, die überprüfbar sind. (Bevölkerungswachstum, Ausbreitung von Infektionskrankheiten, optimierter Entwurf von Schaltkreisen, Mischen von Spielkarten, Wirkung der Schwerkraft auf Licht, Periheldrehung des Merkur, Existenz spezieller Elementarteilchen).
Ziel in dieser Vorlesung ist es, einige der mathematischen Grundtechniken zu vermitteln und anzuwenden.
2
Mathematik für Physiker und Informatiker I (Kurzskript)
0. Ein paar syntaktische Grundlagen
Aussagelogische Formeln
Eine Aussage im mathematischen Sinn ist ein in einer gültigen Sprache abgefaßter Satz, der in eindeutiger Weise mit einem der Wahrheitswerte ‘w’
(für ‘wahr’) oder ‘f ’ (für ‘falsch’) belegt werden kann. Neben den Aussagen
(die hier so etwas wie Konstanten sind), benutzt man Aussagevariablen, die
beliebige Wahrheitswerte annehmen können. Aussagen und Aussagevariable
können durch Junktoren wie ∨ (‘oder’), ∧ (‘und’) oder auch ⇒ (‘impliziert’)
miteinander verbunden oder durch ein vorangestelltes ¬ negiert werden. Das
bei dieser Gelegenheit entstehende Produkt nennt man aussagelogische Formel. Welchen Wahrheitswert eine solche Formel bei Belegung durch Wahrheitswerte annimmt, entnimmt man sogenannten Wahrheitstafeln. Im Falle
der gerade erwähnten Junktoren lauten diese:
a
f
f
w
w
b
f
w
f
w
a∧b
f
f
f
w
a
f
f
w
w
b
f
w
f
w
a∨b
f
w
w
w
sowie
a
f
f
w
w
b
f
w
f
w
a⇒b
w
w
f
w
Zu beachten ist der von der Umgangsprache häufig abweichende Gebrauch
von “oder” sowie die vielleicht überraschende Wahrheitstafel der Implikation.
Eine aussagelogische Formel heißt gültig, wenn diese bei jeder Belegung der in ihr auftretenden Variablen stets wahr ist. Zwei aussagelogische
Formeln, die von denselben Variablen abhängen heißen äquivalent, wenn
identische Belegungen der Variablen für beide Formeln zu stets denselben
Wahrheitswerten führen. Zwei aussagelogische Formeln A(a1 , . . . , an ) und
B(a1 , . . . , an ) sind äquivalent genau dann, wenn A(a1 , . . . , an ) ⇔ B(a1 , . . . , an )
gültig ist. Hier ist a ⇔ b durch (a ⇒ b) ∧ (b ⇒ a) definiert. Beispiele für
äquivalente Aussagen sind (a ⇒ b) ⇔ (¬a ∨ b) (was zeigt, dass die Implikation gar nicht in die anfängliche Liste von Junktoren mit aufgenommen
werden müsste), die Distributivgesetze
a ∨ (b ∧ c) ⇔ (a ∨ b) ∧ (a ∨ c),
a ∧ (b ∨ c) ⇔ (a ∧ b) ∨ (a ∧ c)
sowie die de Morganschen Regeln
¬(a ∨ b) ⇔ ¬a ∧ ¬b
¬(a ∧ b) ⇔ ¬a ∨ ¬b.
Es gibt einen engen Zusammenhang zwischen aussagelogischen Formeln und
Mengen. Nach Auszeichnung einer (großen) Grundmenge G selektiert eine
Formel A, in die die Elemente von G eingesetzt werden können, die Elemente
einer Menge
M = {g ∈ G | A(g) ist wahr } .
Werner, Universität Münster, WS 05/06
3
Für aussagelogische Formeln gibt es entsprechende Mengenoperationen: Vereinigung bzw. Durchschnitt entsprechen ∨ bzw. ∧, oder
{g ∈ G | A(g) ist wahr } ⊂ {g ∈ G | B(g) ist wahr }
⇔
für alle g ∈ G gilt A(g) ⇒ B(g)
D.h. wir sehen hier, dass die Sprache “Aussagelogik” mit Inhalt gefüllt werden und über “Mengenlehre” sprechen kann.
Der aussagelogische Kalkül spricht übrigens auch über Schaltkreise: Jeder Variablen ordnet man einen Schalter zu, und einer aussagelogischen
Formel entspricht ein ganzes Netzwerk von Schaltern. Dabei wird verabredet, dass eine Variable mit dem Wahrheitswert w zu belegen ist, falls der
Schalter sich in dem Zustand ‘Strom fließt’ befindet, und mit f , falls ‘kein
Strom fließt’. Die logischen Verknüpfungen zwischen den Variablen lassen
sich dann stets durch passende Verdrahtungen zwischen den Schaltern realisieren. So entspricht beispielsweise ‘a ∨ b’ der Parallel– und ‘a ∧ b’ der
Reihenschaltung der zu a und b gehörigen Schalter, die Negation erhält man
durch Umkehrung der Schalterstellung. Man kann sich überlegen, dass diese
Schaltelemente zusammen mit der Negation in der Tat ausreichen, um jede
auch noch so komplizierte Schaltung aufzubauen.
Zum Beispiel besitzt die Treppenhausschaltung (Licht soll ein- bzw. ausgeschaltet werden, wenn irgendwo im Treppenhaus der Schalter umgelegt
wird) mit zwei Schaltern a und b und einem Ausgang L (an dem die Lampe hängt) nach Festlegung des Zustands “Dunkelheit im Treppenhaus” die
Wahrheitstafel
a b L
f
f
f
f w w
w f w
w w f
und wird modelliert durch die Formel L = (¬a ∧ b) ∨ (a ∧ ¬b).
Die Vereinfachungen, die man durch äquivalente Umformung der modellierenden aussagelogischen Formeln erhält, führen oft zu Vereinfachung
beim Aufbau von Schaltungen.
Quantoren
Es ist günstig, häufig benutzte Sprechweisen abzukürzen. Sehr wichtig sind
die Quantoren ∀ (“für alle”) und ∃ (“es gibt ein”). So ist etwa für M ⊆ Z
∃S ∈ Z ∀m ∈ M
gilt m ≤ S
die Aussage “Die Menge M ist beschränkt”. Man beachte, dass man die
Reihenfolge von Quantoren auf keinen Fall ändern darf; denn z.B.
∀m ∈ M ∃S ∈ Z mit m ≤ S
4
Mathematik für Physiker und Informatiker I (Kurzskript)
beschreibt eine Eigenschaft, die jede Teilmenge von Z besitzt.– Praktisch
sind Quantoren, um die Negation einer Aussage zu bestimmen: Man tauscht
überall ∃ und ∀ gegeneinander aus und negiert die ganz rechts stehende
Aussage. So ist eine Menge M ⊆ Z unbeschränkt, falls
∀S ∈ Z ∃m ∈ M
mit
m 6≤ S
bzw.
∀S ∈ Z ∃m ∈ M
mit
m>S
Auch für Quantoren gibt es eine entsprechende Konstrukion für Mangen.
Dabei ist ∃ mit der Vereinigung von Mengen, und ∀ mit deren Durschnitt
verknüpft: Ist A eine Menge von Indizes α, so bezeichnet man ein System
von Mengen Mα , α ∈ A, als eine (über A indizierte) Familie von Mengen.
Man setzt
[
Mα = {m ∈ G | ∃α ∈ A mit
m ∈ Mα }
sowie
α∈A
\
Mα = {m ∈ G | ∀α ∈ A
gilt m ∈ Mα }
α∈A
Streng genommen betreten wir hier recht dünnes Eis; denn wir trauen uns ja
zu, eine beliebig große Anzahl (und das kann in der Mathematik sehr groß
sein) von Aussagen auf einmal in den Griff zu bekommen.
I. Zahlen
1. Ganze Zahlen
A. Vollständige Induktion oder: Wann ist eine Teilmenge von N
gleich N? Gilt für eine Menge M von natürlichen Zahlen
• 1∈M
• ∀m ∈ M
gilt m + 1 ∈ M ,
so ist M = N. Die Tatsache, dass jede Teilmenge M von N ein kleinstes
Element m0 = min M enthält, erlaubt die folgende Variante dieser Aussage:
Es gilt M = {n ∈ N | n ≥ m0 }, falls aus m ∈ M folgt m + 1 ∈ M . Anwendung findet diese Beobachtung auf das Prinzip der vollständigen Induktion:
Danach kann man eine von n ∈ N abhängige Aussage A(n) für alle n ≥ n0
beweisen, falls man zuerst A(n0 ) beweist (diesen Vorgang nennt man auch
den Induktionsanfang) und sodann nachweist, dass A(n+1) aus der Aussage
A(n) (Induktionsschritt) folgt. 1
1
Neben der hier erwähnten sind auch die folgende Varianten der vollständigen Induktion sind in Gebrauch:
• Gilt A(n0 ) und
∀n ∈ N, n ≥ n0
gilt
A(n) ⇒ A(n + 1),
Werner, Universität Münster, WS 05/06
5
Nicht nur für Beweise ist diese Technik von Bedeutung; auch Definitionen
lassen mit ihrer Hilfe rekursiv durchführen. Beispiele sind die Zeichen “Σ”
und “Π” oder auch die rekursive Definition von Folgen.
Beispiele Jede Zahl der Form n3 − n, n ∈ N, ist durch 3 teilbar.
(Diese Aussage folgt eigentlich aus der Tatsache, dass das Produkt dreier
aufeinander folgender Zahlen stets durch 3 teilbar sein muss; wenn man sie
bereits kennt, lässt sich diese Aussage bequem durch vollständige Induktion
beweisen.)
Trägt man zu Beginn eines jeden Jahres einen festen Betrag K zur Bank,
der jährlich zu p% verzinst wird, dann beträgt das kurz nach Beginn des nten Jahrs angesparte Kapital
p n
p n+1
p Kn = K 1 +
+K 1+
+ ··· + K 1 +
+K =
100
100
100
n
X
p ν
.
=
K 1+
100
ν=0
Eine Summe dieser Form heißt geometrisch, und durch vollständige Induktion zeigt man, dass für a0 , q ∈ Q gilt
n
X
a0 q ν = a0
ν=0
q n+1 − 1
q−1
h
i
p n+1
(was hier die sogenannte Rentenformel Kn = K 100
−
1
er1
+
p
100
gibt). Eine andere wichtige Summenformel, die durch vollständige Induktion
bewiesen werden kann, ist die binomische Formel
n X
n ν n−ν
n
(a + b) =
a b
.
ν
ν=0
Dabei sind die in ihr auftretenden Binomialkoeffizienten definiert durch
n
n!
n(n − 1) · · · (n − k + 1)
=
.
=
k!(n − k)!
k(k − 1) · · · 2 · 1
k
Der Induktionsschritt macht Gebrauch von der für die ganzen Zahlen 0 ≤
k ≤ n gültigen Beziehung
n
n
n+1
+
=
k
k−1
k
so gilt A(n) für alle natürlich Zahlen n ≥ n0 .
• Gilt A(n0 ) und
∀n ∈ N, n ≥ n0
gilt
A(1), A(2), . . . , A(n) ⇒ A(n + 1),
so gilt A(n) für alle natürlich Zahlen n ≥ n0 .
6
Mathematik für Physiker und Informatiker I (Kurzskript)
Erklären kann man das Auftreten der Binomialkoeffizienten
in der binomi
schen Formel, wenn man weiß, dass nk angibt, wieviele verschiedene Teilmengen mit k Elementen eine n-elementige Menge besitzt.
B. Algebraische Struktur und Anordnung Auf der Menge Z kann
man addieren und multiplizieren. Erinnert sei daran, dass
• Multiplikation und Addition das Assoziativ- und Kommutativgesetz
erfüllen,
• dass es ein Distributivgesetz gibt, welches das Aufeinandertreffen von
Addition und Multiplikation regelt
• und dass es sogenannte neutrale Elemente 0 und 1 gibt, die durch
Addition bzw. Multiplikation eine ganze Zahl nicht verändern.
Neben der algebraischen Struktur ist die Anordnung der ganzen Zahlen wichtig. Die Ordnungsrelation “≤” besitzt die Eigenschaft, dass für alle
Zahlen p, q und r gilt
• p ≤ p (Reflexivität)
• p ≤ q und q ≤ r hat zur Folge, dass p ≤ r (Transitivität)
• Es gilt stets p < q oder p > q oder p = q
Das Aufeinandertreffen von Ordnugs- und algebraischer Struktur wird kontrolliert durch die Tatsache, dass Summe und Produkt positiver Zahlen stets
positiv sind.
Eine Zahl s heißt obere (untere) Schranke der Menge M ⊆ Z, falls für
alle m ∈ M gilt m ≤ s (bzw. m ≥ s). M heißt nach oben (unten) beschränkt,
falls M eine obere (untere) Schranke besitzt. Falls M eine obere Schranke
besitzt, die in M enthalten ist, so nennt man dieses (eindeutig bestimmte)
Element das Maximum oder auch das größte Element von M . Analog definiert man das Minimum (das kleinste Element) von M . Nicht jede Menge
ganzer Zahlen besitzt ein Maximum (Minimum).
Ergänzung. Die Existenz kleinster natürlicher Zahlen* Man kann kann sich abschließend fragen, ob das Prinzip der vollständigen Induktion aus mehr grunglegenden
Axiomen abgeleitet werden kann. Tatsächlich ist dieses Prinzip eng verwandt mit den sogenannten Peano-Axiomen, die die natürlichen Zahlen charakterisieren. Wir gehen hierauf
nicht weiter ein, sondern zeigen noch, dass das Prinzip der vollständigen Induktion äquivalent zu der (gleichfalls nützliche) Aussage Jede (nicht leere) Teilmenge M von N besitzt
ein kleinstes Element ist: Es sei M ⊆ N nicht leer und U die Menge der unteren Schranken von M , die nicht in M enthalten sind. Wir nehmen nun an, dass M kein kleinstes
Element enthält. Dann folgt aus dem Prinzip der vollständigen Induktion, dass U = N,
M = ∅ und daraus die Behauptung.— Nimmt man umgekehrt an, dass jede nicht leere
Werner, Universität Münster, WS 05/06
7
Menge natürlicher Zahlen ein kleinstes Element besitzt, so ergibt sich daraus das Prinzip
der vollständigen Induktion: Es sei M ⊆ N mit 1 ∈ M und k ∈ M ⇒ k + 1 ∈ M . Falls
M c = N \ M 6= ∅, enthält diese Menge ein kleinstes Element k. Natürlich ist k 6= 1, und
k − 1 ist eine natürliche Zahl, die in M liegen muss. Dann aber ist nach Annahme auch
k = (k − 1) + 1 in M , und es gilt nicht: k − 1 ∈ M ⇒ k ∈ M .
2. Grenzwerte
A. Die rationalen Zahlen Die algebraische Struktur der Menge Q unterscheidet sich bekanntlich von der auf Z dadurch, dass man beliebige Zahlen
durch solche teilen kann, die von Null verschieden sind. Zusätzlich zu den
im Abschnitt I.1.A angeführten algebraischen Eigenschaften tritt also der
‘multiplikative’ Teil der Aussage
• Für jedes Element q ∈ Q existiert ein multiplikatives und additives
Inverses, d.h. es gibt Zahlen −q und q −1 mit
q + (−q) = 0
q · q −1 = 1
bzw.
All diese Eigenschaften fasst man in einer einzigen Definition zusammen und
sagt kurz, dass (Q, +, ·) ein Körper ist. Auch auf Q gibt es eine Ordnung,
die wieder die Axiome des Abschnitts I.1.A erfüllt. Die Kurzfassung lautet
hier: (Q, +, ·, ≤) ist ein geordneter Körper.
Eine große Rolle spielt im folgenden die auf Q definierte Betragsfunktion,
|a| = max{a, −a} =


a
falls a ≥ 0
.

−a falls a < 0
Wichtige Beziehungen, die der Betrag für beliebige a, b ∈ Q erfüllt, sind
−|a| ≤ a ≤ |a|
|ab| = |a||b|
sowie die Dreiecksungleichung
|a + b| ≤ |a| + |b|.
Die Dreiecksungleichung
giltP
für a1 , . . . , an ∈ Q auch in der Form (vollständiPn
ge Induktion!) | ν=1 aν | ≤ nν=1 |aν |. Eine weiter Variante ist ||a| − |b|| ≤
|a − b|. Technisch gesprochen erfordert ein genaueres Rechnen mit Beträgen,
Fallunterscheidungen durchzuführen. Wichtig ist die Tatsache, dass durch
d(a, b) = |a − b|
8
Mathematik für Physiker und Informatiker I (Kurzskript)
der Abstand zwischen den beiden Zahlen a, b ∈ Q definiert wird2 . So ist also
für rationale Zahlen a und α > 0
{q ∈ Q | |q − a| ≤ α } = {q ∈ Q | a − α ≤ q ≤ a + α }
die Menge der q ∈ Q, die von dem Punkt a einen Abstand haben, der
höchstens gleich α ist.
B. Es können nicht immer Wurzeln gezogen werden (Teil 1) Man
ist daran gewöhnt, dass an jeder Zahlenmenge irgendwann herumgenörgelt
wird. Natürlich auch an Q. Unser erster Kritikpunkt:
Satz 1 Falls N ∈ N keine Quadratzahl ist, dann gibt es auch kein Element
q ∈ Q mit q 2 = N
Der Kernpunkt des Beweises ist die Tatsache, dass jede ganze Zahl k ∈ Z
eine bis auf die Reihenfolge eindeutig festgelegt Zerlegung in Primfaktoren
besitzt:
Satz 2 Für jede ganze Zahl k ∈ Z \ {±1} gibt es ein Vorzeichen ε ∈ {±1},
Primzahlen p1 < p2 < . . . < pn sowie Exponenten α1 , . . . , αn ∈ N, so dass
k=
εpα1 1 pα2 2
· · · pαnn
=ε
n
Y
pαν ν .
ν=1
Q
βµ
Ist k = η m
µ=1 qµ eine weitere solche Darstellung, so folgt η = ε, m = n,
und, falls µ = ν, pν = qµ sowie αν = βµ .
Dieser Satz lässt sich durch vollständige Induktion beweisen, was wir hier
aber nicht tun wollen.
Beim Beweis von Satz 1 nimmt man an, es gäbe doch eine rationale Zahl
q ∈ Q (von der wir annehmen dürfen, dass sie positiv ist) mit q 2 = N . Es
sei


−1
n
m
Y
Y
s
β
pαν ν 
qµ µ 
q= =
t
ν=1
µ=1
eine Darstellung von q mit Hilfe der Primfaktorzerlegung, wobei t 6= 1, da
N ja keine Quadratzahl ist. Wir nehemen außerdem an, dass dieser Bruch
2
Warum ist das der Abstand von a und b? Wenn man diese Frage nicht durch Beispiele
klären möchte, dann ist dies eine gute Gelegenheit, die axiomatische Methode auszuprobieren. Wenn man nämlich nur davon ausgeht, dass der Abstand von a und b gleich bleibt,
wenn man beide Punkte um eine feste Zahl r > 0 verschiebt, und wenn man ferner festlegt, dass der Abstand von q ∈ Q zum Nullpunkt gleich |q| sein soll, dann bleibt für den
Abstand zwischen a und b schon nichts anderes mehr als |a − b|.
Werner, Universität Münster, WS 05/06
9
gekürzt ist, dass also Zähler und Nenner keine gemeinsamen Primfaktoren
mehr enthalten. Es ergibt sich
2αm
2αn
1 2α2
= N q12α1 q22α2 · · · qm
p2α
1 p2 · · · pn
was, nachdem wir auch N in Primfaktoren zerlegt haben, auf zwei verschie2αn führt.
1 2α2
dene Primfaktorzerlegungen für die Zahl p2α
1 p2 · · · pn
Die Zahlenmenge, in der Wurzeln und, allgemeiner, die Nullstellen aller Polynome mit rationalen Koeffizienten enthalten sind, nennt man die Menge
der algebraischen Zahlen. Wir sind hier auf dem Weg zur Menge der reellen Zahlen, die viel, viel umfangreicher ist als die Menge der algebraischen
Zahlen3
C. Konvergente Folgen Es gibt Folgen von Zahlen, bei denen man zu
sehen glaubt, dass ihre Glieder einer Zahl a immer näher kommen und diese
‘letztlich’ erreichen, ohne dass ein Folgenglied den Wert a je wirklich erreicht.
Beispiele sind die Werte der Folge
0, 9,
0, 99,
0, 999,
0, 9999,
0, 99999,
0, 999999, . . . ,
die eine entscheidende Rolle bei der Antwort auf die Frage spielen, ob 0, 9
wirklich gleich 1 ist. Ein bereits den Griechen im Altertum bekanntes Beispiel ist die Folge (tn ) der Momente, zu denen der zehnmal so schnelle Achilles scheinbar vergeblich versucht, eine Schildkröte zu überholen: Starten beide zur selben Zeit, besitzt die Schildkröte einen Vorsprung von 10m und
erreicht der schnelle Läufer diesen Punkt nach einer Sekunde, so besitzt die
Schildkröte dann immerhin noch eine Vorsprung von 1m. Dieser Vorsprung
und die dann jedes Mal neu verstrichene Zeit schmelzen beide um den Faktor
10, wenn Achilles dort ankommt, wo die Schildkröte sich zuvor aufgehalten
hat, und so scheint es unmöglich, dass er die Schildkröte überholt.
Ein mathematisches Modell für die Behandlung solcher Probleme benutzt den Begriff der konvergenten Folge:
Definition 1 Eine Folge (an )n∈N rationaler Zahlen heißt konvergent gegen
den Grenzwert a ∈ Q genau dann, wenn
Für jede Genauigkeit ε > 0 gibt es einen ersten Folgenindex
N (ε) ∈ N, so dass für die N (ε) nachfolgenden Folgenindizes
n ≥ N (ε) gilt
|a − an | < ε.
3
In der Menge der algebraischen Zahlen sind z.B. π und e noch nicht enthalten, die
man aus diesem Grund transzendent nennt. Wenn man genau hinsieht, stellt man fest,
dass die Menge der reellen Zahlen von einer neuen Art unendlich ist, eine Unendlichkeit,
die die der Zahlenmengen N, Z, Q und selbst die der algebraischen Zahlen übersteigt.
10
Mathematik für Physiker und Informatiker I (Kurzskript)
Falls (an )n∈N den Grenzwert a besitzt, so schreibt man
lim an = a
n→∞
Konvergiert eine Folge gegen Null, so nennt man sie eine Nullfolge. Falls
(an ) gegen den Wert a konvergiert,
so ist (|a − an |)n∈N eine Nullfolge. Eine
1
gut untersuchte Nullfolge ist n . Ist q ∈ Q, so gilt:
1) Ist |q| < 1, so ist (q n )n∈N eine Nullfolge,
2) für q = 1 ist (q n )n∈N eine Nullfolge, für q = −1 divergiert diese Folge,
und
3) für |q| > 1 ist die Folge (q n )n∈N divergent.
Der Nachweis im konvergenten Fall gelingt mit Hilfe der für alle n ∈ N und
alle δ ≥ −1 gültigen Bernoullischen Ungleichung
(1 + δ)n ≥ 1 + nδ,
die man mit vollständiger Induktion zeigt. Es folgt nämlich aus 1 > |q| =
(1 + δ)−1 , 1 ≥ δ > −1, dass
|q n | = (1 + δ)−n <
1
1
<
1 + nδ
nδ
Der hier ganz rechts stehende Ausdruck ist eine Nullfolge, und wenn man
eine Folge nichtnegativer Zahlen erst einmal durch eine Nullfolge nach oben
abgeschätzt hat, dann ist sie selbst eine. – Dass die Folge (−1)n divergiert,
lässt sich an dieser Stelle nur etwas umständlich herleiten mit Hilfe der Negation der Aussage ‘Es gibt eine Zahl a, gegen die die Folge (an ) konvergiert’,
nämlich
∀a ∈ Q ∃ε0 > 0 ∀N ∈ N ∃n ≥ N
mit
|a − an | ≥ ε.
Die Divergenz im Fall |q| > 1 folgt am einfachsten aus (nochmals der Bernoulli Ungleichung sowie) Teil (a) des folgenden Satzes.
Satz 3 Es sei (an )n∈N eine gegen a konvergente Folge. Dann gilt
(a) (an ) ist beschränkt, d.h. die Menge der Folgenglieder {an | n ∈ N } ist
beschränkt.
(b) Für jede Zahl b 6= a gibt es einen Index N ∈ N mit der Eigenschaft,
dass für alle nachfolgenden Indizes n ≥ N jeweils gilt
|an − b| >
|a − b|
.
2
Insbesondere ist der Grenzwert der Folge (an )n∈N eindeutig bestimmt.
Werner, Universität Münster, WS 05/06
11
Für den Beweis der ersten Aussage wählt man für ε = 1 den Index N1 ∈ N,
für dessen Nachfolger n ∈ N gilt |a − an | < 1. Für diese Indizes ist dann
nach der Dreiecksungleichung |an | ≤ 1 + |a|, so dass für alle Indizes n ∈ N
gilt
|an | ≤ max{|a1 |, . . . , |aN |, 1 + |a|}
Im Teil (b) wählt man den Startindex N ∈ N für den Wert ε =
Falls n ≥ N, folgt
|an − b| ≥ |b − a| − |a − an | >
1
2 |a
− b|.
|a − b|
.
2
D. Grenzwertsatz und Beispiele
Satz 4 Es seien (an )n∈N , (bn )n∈N und (cn )n∈N Folgen, (an )n∈N und (bn )n∈N
seien konvergent mit limn→∞ an = a und limn→∞ bn = b. Dann gilt
(a) Die Folgen (an + bn )n∈N und (an bn )n∈N konvergieren mit
lim an + bn = a + b
n→∞
und
lim an bn = ab
n→∞
Falls b 6= 0, dann gibt es einen Index N ∈ N mit bn 6= 0 für n ≥ N und
−1
die ab diesem Index definierte Folge an b−1
n konvergiert gegen ab .
(b) Gilt von einem gewissen Index N ∈ N an, dass an ≤ bn , so folgt a ≤ b.
(c) Ist a = b und für n ≥ N stets
an ≤ cn ≤ bn ,
dann konvergiert auch (cn ) gegen den gemeinsamen Grenzwert von
(an ) und (bn ).
Für die Summenfolge wird N (ε) = max{Na (ε/2), Nb (ε/2)} gewählt (wobei Na (ε) und Nb (ε) die zu ε > 0 gehörenden Startindizes für die Folgen
(an ) und (bn ) sind) und mit der Dreiecksungleichung abgeschätzt. Im Fall
der Produktfolgen nutzt man die Beschränktheit konvergenter Folgen, wählt
M > 0 mit |bn | ≤ M für alle n ∈ N und schätzt für einen Index n ∈ N ab
|ab − an bn | ≤ |a||b − bn | + M |a − an |.
Ist nun N ∈ N so groß gewählt, dass für n ≥ N
|a − an | <
ε
2M
und
|b − bn | <
ε
,
2 + 2|a|
dann folgt |ab − an bn | < ε. Für die Aussage über die Quotienten reicht es,
von der konstanten Folge an = 1 auszugehen. Nach Satz 3(b) gibt es N ∈ N,
12
Mathematik für Physiker und Informatiker I (Kurzskript)
so dass für alle n ≥ N stets |bn | > |b|/2 ist. Für diese Indizes sind alle Brüche
wohldefiniert, und es folgt außerdem
1
− 1 < 1 |b − bn |,
b bn 2|b|2
so dass für N (ε) = max{N, Nb (2ε|b|2 )} und n ≥ N (ε) folgt |1/b − 1/bn | < ε.
Wäre im Teil (b) a > b, dann würde ab einem passend gewählten Index N
gleichzeitig gelten
an > a −
a−b
a+b
=
2
2
sowie
bn < b +
a−b
a+b
=
,
2
2
was der Bedigung an ≤ bn widerspricht. Für den Teil (c) schließlich wählt
man N (ε) = max{Na (ε), Nb (ε)}, so dass also für n ≥ N(ε) gilt [an , bn ] ⊆
(a−ε, a+ε). Da aber nach Annahme cn ∈ [an , bn ] muss auch cn ∈ (a−ε, a+ε),
folglich |a − cn | < ε.
Ein wichtiges Besipiel: Für |q| < 1 gilt
∞
X
a0 q ν := lim
ν=0
n→∞
n
X
a0 q ν =
ν=0
a0
.
q−1
Die letzte Beziehung zeigt: Die Zahl 0, 9, die nicht anders als ein Grenzwert
definiert werden kann, ist gleich 1; und auch Achilles holt die Schildkröte
schließlich nach 10
9 Sekunden ein, wenn man sich gestattet, die geschilderte
Aufholjagd mit Hilfe einer konvergenten Folgen von Zeiten zu modellieren.
Wir benötigen im Folgenden weitere Beispiele. Wir werden nun bereits Wurzeln ziehen, ohne zunächst weiter auf den Zahlbereich einzugehen, für den
das möglich ist. Wichtige weitere Grenzwerte sind (für a > 0):
√
√
lim n a = 1 sowie lim n n = 1.
n
n
Im ersten Fall reicht es wegen des Teils (a) des Grenzwertsatzes, von a > 1
auszugehen. Man setzt für diesen Fall a = (1 + δn )n , δn > 0, schätzt mit
Hilfe der Bernoulli-Ungleichung ab und erhält δn < (a−1)/n. Für die zweite
Folge erhält man in ähnlicher Weise durch einen weiteren Rückgriff auf die
binomische Formel
r
n 2
2
n
n = (1 + δn ) >
δn
sowie
δn <
.
2
n−1
E. Teilfolgen Die Folge
an = (−1)n
hatten wir bereits als divergent indentifiziert — etwas umständlich durch
die Negation des Konvergenzkriteriums oder, mehr anschaulich, aufgrund
Werner, Universität Münster, WS 05/06
13
der Tatsache, dass sie sich nicht zwischen −1 und 1 entscheiden kann. Dieser letzte Gesichtspunkt soll hier noch etwas genauer erläutert werden. Die
Idee, dass Folgen aus vielen anderen “zusammengesetzt” sein können (die
u.U. gegen verschiedene Grenzwerte konvergieren können) wird durch die
folgende Definition präzisiert:
Definition 2 Es sei (an ) eine Folge und (nk )k∈N eine Folge streng monoton
wachsender natürlicher Zahlen. Dann nennt man die Folge (ank )k∈N eine
Teilfolge der Folge (an ).
Dabei nennt man eine Folge (an ) (streng) monoton wachsend, wenn für alle
n ∈ N gilt an ≤ an+1 (bzw. an < an+1 ). In ähnlicher Weise definiert man
(streng) monoton fallende Folgen.
Satz 5 Eine Folge (an ) konvergiert genau dann, wenn jede ihrer Teilfolgen
dies tut. Der Grenzwert einer Teilfolge stimmt in diesen Fällen mit dem
Grenzwert der gesamten Folge überein.
Da jede Folge Teilfolge ihrer selbst ist, folgt deren Konvergenz aus der Konvergenz aller Teilfolgen. Ist umgekehrt (an ) gegen a konvergent, (ank ) eine
Teilfolge und N (ε) der zu ε > 0 gehörige Startindex, so gilt wegen k ≤ nk
für alle k ∈ N (vollständige Induktion!), dass |a − ank | < ε für alle k ≥ N(ε).
Die uns bereits bekannte Folge an = (−1)n zerlegt sich nun tatsächlich
in die beiden Teilfolgen amk und ank mit mk = 2k, nk = 2k − 1, es gilt
limk→∞ amk = 1 sowie limk→∞ ank = −1, und, nun wissen wir es ganz
genau, (an ) kann nicht konvergieren.– Im Folgenden werden auch Teilfolgen
der Form (an+n0 ), n0 ∈ N fest, eine wichtige Rolle spielen.
Der O(n)-Kalkül* Ein wesentlicher Bestandteil im Umgang mit Folgen ist das Abschätzen
komplizierter Terme durch einfache, die das Verhalten der komplizierten gut widerspiegeln,
zugleich aber in ihrem Verhalten für große n leichter zu beurteilen sind. Häufig benutzt
wird hierzu der sogenannte O-Kalkül: Von einer Folge (an ) sagt man, sie wachse für n → ∞
(wenigstens) von der Ordnung ϕ(n), ϕ eine auf N definierte Funktion, Funktion, falls es
eine Zahl M ≥ 0 gibt mit der Eigenschaft, dass
|an | ≤ M ϕ(n)
für alle n ∈ N, n ≥ N0 .
In diesem Fall schreibt man auch
an = O(ϕ(n))
für n → ∞.
Beispiele: Falls es ein α ∈ N und an = O(nα ) für n → ∞, so sagt man auch, (an ) besitzt
polynomiales Wachstum. Z.B. gilt an = O(nk√) für jede durch ein Polynom definierte Folge
√
an = Ak nk + Ak−1 nk−1 + . . . + A1 n + A0 , n + 1 − n = O(n−1/2 ), und, wie gesehen,
gilt für jedes a > 0
√
√
n
n
a − 1 = O(n−1 )
sowie
n − 1 = O(n−1/2 ).
14
Mathematik für Physiker und Informatiker I (Kurzskript)
3. Reelle Zahlen
A. Konvergenz ohne einen Grenzwert zu kennen Wie berechnet
man die Wurzel aus einer gegebenen Zahl a, zumindest approximativ, in
systematischer Weise, ohne zu probieren, also direkt mit einem (vielleicht
sogar programmierbaren) Algorithmus?
Ein bekannter Versuch (der auf dem Newton-Verfahren und damit letztlich
auf dem Banachschen Fixpunktsatz basiert) besteht darin, zu versuchen
√
einen Schätzwert an für a durch
1
a
an+1 =
an +
2
an
zu verbessern. Beginnt man etwa mit dem (meist nicht besonders klug
gewählten) Schätzwert a0 = 1, so gelangt man zu einer (rekursiv definierten) Folge, von der es ohne Weiteres nicht ganz leicht ist zu sehen, ob sie
konvergiert. Eins jedoch ist klar: Falls sie das tut, so muss auch die Teilfolge
(an+1 ) gegen denselben Grenzwert w konvergieren, und es folgt
1
a
a = lim an = lim an+1 =
a+
.
n→∞
n→∞
2
a
Da stets an > 0, müsste a die Quadratwurzel von a sein.
Warum sollte nun die Folge (an ) konvergieren? Man kann in diesem Fall
nur sehr indirekt zu Werke gehen. Eine einfache Rechnung zeigt, dass gilt
2
1
x
1
2
an −x =
an−1 −
(a2 −x) > 0,
>0
sowie
an −an+1 =
4
an−1
2an n
woraus folgt, dass (an ) für n ≥ 1 monoton fallend und nach unten beschränkt
ist. Man kann es anschaulich überzeugend finden, dass dieses Verhalten einer Folge deren Konvergenz erzwingen sollte. In einer anderen Verkleidung
kommt dieselbe Struktur bei dem Begriff der Intervallschachtelung zum Tragen. Dies ist eine Folge (In ) von abgeschlossenen Intervallen In = [an , bn ]
mit den beiden Eigenschaften
• Für alle n ∈ N gilt In+1 ⊆ In sowie
• limn→∞ (bn − an ) = 0
Wenn man will kann man eine Intervallschachtelung als die Idealisierung
einer sich fortwährend verbessernden Messung einer Naturkonstanten ansehen; nicht zuletzt von diesem Standpunkt aus sollte eine Intervallschachtelung dann genau einer SZahlëntsprechen, nämlich der einzigen, die in allen
Intervallen zugleich enthalten ist. Eins ist aber völlig klar:
Es gibt Folgen von rationalen Zahlen, von denen man allen Grund hat
anzunehmen, dass sie konvergent sind, die aber auf keinen Fall einen
Grenzwert in Q besitzen können.
Werner, Universität Münster, WS 05/06
15
Ein sehr kluger, bei Anfängern dennoch nicht besonders beliebter, aber sehr
universell einsetzbarer Versuch, Konvergenz ohne Kenntnis des Grenzwerts
zu verstehen, geht auf den französischen Mathematiker Cauchy4 zurück und
lautet
Definition 3 Eine Folge (an ) heißt Cauchy-Folge genau dann, wenn es für
jedes ε > 0 ein N (ε) ∈ N gibt, so dass für alle Indizes n, m ≥ N (ε) gilt
|am − an | < ε.
Diese Definition sieht vielleicht plausibel aus, scheint aber nicht unbedingt
einfach zu verwenden zu sein. Es gibt aber sehr einfache hinreichende Kriterien für das Vorliegen einer Cauchy-Folge:
Satz 6 Eine Folge (an ) ist eine Cauchy-Folge, falls sie
(a) konvergiert oder
(b) monoton wächst (fällt) und nach oben (unten) beschränkt ist.
Der erste Teil folgt aus der Beobachtung, dass für m, n ≥ Na (ε/2) gilt
|an − am | ≤ |an − a| + |a − am | < ε.
Für den zweiten Teil nimmt man an, dass (die monoton wachsende, nach
oben beschränkte Folge) (an ) keine Cauchy-Folge ist, also
∃ε0 > 0 ∀N ∈ N ∃m, n ≥ N
mit |an − am | ≥ ε0 .
Unter diesen Umständen kann man (durch vollständige Induktion) zwei Folgen (mk ), (nk ) natürlicher Zahlen finden mit m1 < n1 < m2 < n2 < . . . <
mk < nk < mk+1 < nk+1 < . . . und amk > ank + ε0 . Es folgt
amk > ank + ε0 ≥ amk−1 + ε0 > ank−1 + 2ε0 ≥ . . . > an1 + (k + 1)ε0 ,
und das übertrifft bei freier Wahl von k ∈ N jede obere Schranke.
Die wichtige Frage aber ist: Konvergieren Cauchy-Folgen? Und da wissen
wir bereits, dass dies für die Zahlenmenge Q nicht der Fall ist.
B. Supremum, Infimum und Häufungswert Bevor wir die Menge der
rationalen Zahlen zu der Menge der reellen Zahlen erweitern, benötigen wir
ein paar weitere Begriffe.
4
http://www-groups.dcs.st-and.ac.uk/ history/Biographies/Cauchy.html
16
Mathematik für Physiker und Informatiker I (Kurzskript)
Es sei M eine Teilmenge eines geordenten Zahlenkörpers K5 sowie
OM = {k ∈ K | ∀m ∈ M
gilt m ≤ k }
und
UM = {k ∈ K | ∀m ∈ M
gilt m ≥ k }
die Menge der oberen bzw. unteren Schranken von M . Falls OM ein kleinstes
Element enthält, so nennt man dies das Supremum von M und bezeichnet
es mit sup M . In genau derselben Weise verfährt man mit UM und gelangt
zum Begriff es Infimums einer Menge M . Besitzt M ein größtes (kleinstes)
Element, so ist dieses stets das Supremum (Infimum) von M . Auf der anderen Seite besitzt die Menge (a, b) = {q ∈ Q | a < q < b } weder ein kleinstes
noch ein größtes Element. Hier sind
O(a,b) = {q ∈ Q | q ≥ b } = [b, ∞),
U(a,b) = {q ∈ Q | q ≤ a } = (−∞, a],
und sup(a, b) = b sowie inf(a, b) = a.
Definition 4 Ein Punkt p ist ein Häufungswert der Menge M falls es für
jedes ε > 0 ein Element m in M gibt, so dass |p − m| < ε.
Wählt man zu jedem n ∈ N einen Punkt mn ∈ M mit |p − mn | < 1/n, so
erkennt man, dass p ein Häufungswert genau dann ist, wenn es eine Folge in
M gibt, die gegen p konvergiert. Wir nennen im folgenden eine Menge der
Form
Uε (p) = {k ∈ K | |k − p| < ε }
eine ε-Umgebung des Punktes p.
Satz 7 (i) Die Zahl s ist das Supremum der Menge M genau dann, wenn
s zugleich obere Schranke und Häufungswert von M ist.
(ii) Eine monoton steigende (fallende) Folge (an ) konvergiert genau dann,
wenn das Supremum der Menge (Infimum) der Folgenglieder existiert.
In einem solchen Fall ist
lim an = sup {an | n ∈ N } .
n→∞
Das Supremum von M ist eine obere Schranke. Wäre s kein Häufungswert
von M , dann gäbe es in einer ε-Umgebung U von s kein weiteres Element aus
M und damit aber viele weitere obere Schranken von M , die echt kleiner
als s sind. Ähnlich sieht man, dass es zu einer oberen Schranke von M ,
die zugleich Häufungswert dieser Menge ist, keine wirklich kleinere obere
Schranke von M geben kann.— Für den Beweis der zweiten Aussage sei
5
Wer will, kann sich hier immer noch Q vorstellen, obwohl im kommenden Abschnitt
die folgende Definition für den Körper der reellen Zahlen benutzt wird. Auch braucht man
für die Definition weder Addtion noch Multiplikation sondern nur eine Ordnungsrelation.
Werner, Universität Münster, WS 05/06
17
s = sup {an | n ∈ N } sowie ε > 0. In der ε-Umgebung gibt es dann (nach dem
ersten Teil dieses Satzes) wenigstens ein Folgenglied aN (ε) . Da an monoton
wächst, liegen auch alle nachfolgenden Folgenglieder in dieser ε-Umgebung,
und (an ) konvergiert gegen s. Umgekehrt muss der Grenzwert einer monoton
wachsenden Folge eine obere Schranke sein. Da er zugleich Häufungswert der
Menge der Folgenglieder ist, ist er deren Supremum.
C. Der Zahlkörper R: Charakterisierung und Eigenschaften
Satz 8 Es gibt (im wesentlichen) genau einen (archimedisch) geordneten
Zahlenkörper (R, +, ·, ≤), in dem jede Cauchy-Folge bezüglich des Betrags
|r| = max{r, −r} einen Grenzwert besitzt.
In einem solchen Körper findet man übrigens (zuerst N durch mehrfache
Addition des neutralen Elements der Multiplikation, dann Z durch Subtraktion und schließlich) die Elemente von Q (durch Division) wieder, so dass Q
also in R ‘eingebettet’ ist.
Da wir bisher bei unseren Überlegungen über Q nur die Tatsache verwendet haben, dass Q ein geordneter Körper ist, können wir alle Definition
auch in derselben Weise für reelle Zahlen aussprechen und dann mit diesen genau dieselben Sätze beweisen. Wir werden hiervon im folgenden stets
Gebrauch machen, ohne darauf jedes Mal hinzuweisen.
Satz 9 In der Menge R gilt:
(i) Jede monoton wachsende (fallende) und nach oben (unten) beschränkte
Folge ist gegen ihr Supremum (Infimum) konvergent. Ganz allgemein
besitzt jede nach oben (unten) beschränkte Menge in R ein Supremum
(Infimum).
(ii) Für jede Intervallschachtelung (In ) aus R gibt es genau einen Punkt
ξ ∈ R mit
\
In = {x ∈ R | x ∈ In für alle n ∈ N } = {ξ}.
n∈N
Der Beweis des ersten Teils wird hier nicht weiter ausgeführt.
Für den Beweis von Teil (ii) beobachtet man, dass für die Randpunktfolgen (an ), (bn ) der Intervallfolge In = [an , bn ] gilt a1 ≤ a2 ≤ . . . ak ≤ ak+1 ≤
. . . bk+1 ≤ bk ≤ . . . ≤ b2 ≤ b1 . Dies zeigt, dass (an ) monoton wächst, nach
oben (durch b1 ) beschränkt ist, und dass (bn ) monoton fällt und nach unten
(durch a1 ) beschränkt ist. Aufgrund des ersten Teil des Satzes konvergieren
beide Folgen. Wegen limn→∞ bn −an = 0 besitzen sie denselben
Grenzwert ξ.
T
Da ξ = sup {an | n ∈ N } = inf {bn | n ∈ N } folgt ξ ∈ n∈N In . Eine weitere,
von ξ verschiedene Zahl η, etwa η < ξ, in diesem Schnitt würde der Tatsache
18
Mathematik für Physiker und Informatiker I (Kurzskript)
widersprechen, dass ξ die kleinste obere Schranke der Menge {an | n ∈ N }
ist.
Man kann R übrigens als Menge definieren, deren Elemente aus Mengen
gleichartiger Cauchy-Folgen von rationalen Zahlen bestehen. Zwei CauchyFolgen sieht man dabei als gleichartig an, wenn sie anscheinend dieselbe Zahl
in der Menge R beschreiben werden, d.h. wenn die Folge der Differenzen
eine Nullfolge bildet. Es ist sehr zeitraubend, den Nachweis zu erbringen,
dass eine solche Menge auch wirklich die oben angeführten Eigenschaften
besitzt. Insbesondere ergibt sich, dass es für jede reelle Zahl r ∈ R eine
Folge rationaler Zahlen gibt, die gegen r konvergiert. — R ist tatsächlich
sehr viel größer als die Menge der algebraischen Zahlen A, der Bereich,
aus dem fast alle Zahlen der Schulmathematik stammen, und der aus allen
Nullstellen von Polynomen mit rationalen Koeffizienten besteht. Während
die Elemente von A noch als Folge geschrieben werden können, ist dies mit
den Elementen von R nicht möglich, R ist überabzählbar.
3. Komplexe Zahlen
A. Es können nicht immer Wurzeln gezogen werden (Teil 2) Bekanntlich besitzt die Gleichung x2 + 1 = 0 keine Lösung über den reellen
Zahlen, was oft unpraktisch ist. Wer kühn genug ist, kann eine Lösung dieser Gleichung i nennen (die andere ist dann −i) und versuchen, mit dieser
Zahl einen neuen Zahlkörper aufzumachen, einer Menge also mit Produkt
und Addition, die sich beide so verhalten wie diese Operationen auf Q. Und
natürlich sollte man davon ausgehen, dass i zu den reellen Zahlen hinzugefügt wird. Denkt man diesen Gedanken zu Ende so gelangt man zu der
Menge
C = {x + iy | x, y ∈ R }
mitsamt den Verknüpfungen
(x1 + iy1 ) + (x2 + iy2 ) = x1 + x2 + i(y1 + y2 )
sowie
(x1 + iy1 )(x2 + iy2 ) = x1 x2 − y1 y2 + i(x2 y1 + x1 y2 ).
Für eine komlexe Zahl z = x + iy heißt x = Re z der Real-, y = Im z der
Imaginärteil von z. Die zu z konjugierte Zahl ist z = x − iy, und der Betrag
von z ist durch
p
√
|z| = zz = x2 + y 2
erklärt. Die Konjugation komplexer Zahlen ermöglicht es auch, in einfacher
Weise den Quotienten zweier komplexer Zahlen zk = xk + iyk , k = 1, 2 zu
berechnen,
z1
z 2 z1
x1 x2 + y1 y2 + i(x2 y1 − x1 y2 )
=
=
.
2
z2
|z2 |
x22 + y22
Die Art, wie die Addition zweier komplexer Zahlen funktioniert, erinnert
stark an die Addition zweier Vektoren der Ebene. In der Tat stellt man
Werner, Universität Münster, WS 05/06
19
sich komplexe Zahlen am besten als Punkte in der Ebene vor. Üblicherweise
trägt man den imaginären Anteil einer komplexen Zahl entlang der y- und
den reelle Anteil entlang der x-Achse ab. In dieser Weise wird die Addition
tatsächlich zur Vektoraddition, der Betrag von z ist der Abstand des zugehörigen Punktes vom Ursprung und die komplexe Konjugation entspricht
der Spiegelung an der x-Achse. Der (euklidische) Abstand zwischen zwei
komplezen Zahlen z1 und z2 ist so durch |z1 − z2 | gegeben.
Um auch die Geometrie des Produkts zu verstehen, benutzt man am
besten ebene Polarkoordinaten: Jede komplexe Zahl lässt sich als
z = (|z|, ϕ) = |z|(cos ϕ + i sin ϕ)
schreiben, wobei man ϕ stets so wählt, dass ϕ ∈ [0, 2π). (Anschaulich wird
hier jeder ebene Vektor durch Länge und Richtung beschrieben.) Einzig der
Nullpunkt ist kritisch: Für diesen ist |z| = 0 und ϕ im Prinzip beliebig.
Mit Hilfe der Polarkoordinaten lässt sich das Produkt zweier komplexer
Zahlen nun geometrisch deuten: Für zi = (ri , ϕi ), i = 1, 2, gilt nämlich
unter Verwendung der trigonometrischen Additionstheoreme
(r1 , ϕ1 ) · (r2 , ϕ2 ) = (r1 r2 , ϕ1 + ϕ2 )
Dabei sind die erhaltenen Winkel durch Addition ganzzahliger Vielfacher
von 2π auf einen Wert im Intervall [0, 2π) zu normalisieren. Hieraus ergeben
sich die n Wurzeln der Zahl (r, ϕ) als
√
ϕ + 2kπ
n
r,
,
k = 0, . . . , n − 1.
n
Wiederum ist es der Abstandsbegriff, der es erlaubt, die Konvergenz von
Folgen zu definieren:
Definition 5 Die Folge (zn ) komplexer Zahlen konvergiert gegen den Punkt
z ∈ C genau dann, wenn gilt
lim |zn − z| = 0.
n→∞
Tatsächlich geschieht hier nicht wirklich etwas Neues:
Satz 10 Die komplexe Folge (zn ) konvergiert gegen z ∈ C genau dann, wenn
lim Re zn = Re z
n→∞
sowie
lim Im zn = Im z.
n→∞
Konvergieren nämlich die Elemente zn = xn + iyn gegen z = x + iy, so folgt
eine Richtung dieser Aussage aus
p
|x − xn | ≤ |x − xn |2 + |y − yn |2 = |z − zn |
20
Mathematik für Physiker und Informatiker I (Kurzskript)
bzw. |y −yn | ≤ |z −zn |. Die andere Richtung aber ist eine einfache Folgerung
aus den Grenzwertsätzen sowie der Tatsache, dass für eine Folge (an ) positi√
√
ver, gegen a konvergenter Zahlen gilt limn→∞ an = a (die Stetigkeit der
Wurzelfunktion, eine Eigenschaft von Funktionen, über die noch gesprochen
werden muss). Ein interessantes Beispiel ist die Folge (q n ) mit q ∈ C und
|q| = 1. Ist für das Argument ϕ von q die Zahl ϕ/π rational, so besitzt die
Folge (q n ) genau endlich viele Häufungspunkte. Ist jedoch ϕ/π irrational, so
liegen die Folgenglieder q n dicht im ganzen Einheitskreis.
Die bisher besprochenen Definitionen und Sätze über relle Folgen und
Reihen erlauben es fast immer, sie direkt auf den komplexen Fall zu übertragen. Zumeist reicht es, die reelle durch die komplexe Betragsfunktion zu
ersetzen. So zeigt man z.B. ganz ähnlich wie zuvor, dass eine Folge komplexer Zahlen (zn ) eine Cauchy-Folge genau dann ist, wenn die Folgen der
Real- bzw. der Imaginärteile dies ist. Damit (und Satz 25) konvergiert eine
Folge in C (genau wie in R) genau dann, wenn sie eine Cauchy-Folge ist. —
Nicht möglich ist eine Übertragung solcher Resultate, wenn man im reellen
Fall die Anordnung dieser Zahlen berücksichtigen muss.
B. Reihen Ist (an ) eine Folge (komplexer oder reeller Zahlen), so bezeichnet der Ausdruck
∞
X
an
n=1
P
P
N
die Folge der Partialsummen (sN ) =
a
. Man nennt ∞
n
n=1 an eine
n=1
N
Reihe. Konvergiert die Folge der Partialsummen,Pso spricht man von einer
konvergenten Reihe. Für eine konvergente Reihe ∞
n=1 an ist (an ) stets eine
Nullfolge, die Umkehrung gilt nicht: Die harmonische Reihe
∞
X
1
1
1 1
1 1 1 1
=1+ +
+
+
+ + +
+ ··· >
n
2
3 4
5 6 7 8
n=1
1
1 1
1 1 1 1
1 1 1
>1+ +
+
+
+ + +
+ ··· = 1 + + + + ···
2
4 4
8 8 8 8
2 2 2
divergiert.
P
Eine Reihe heißt absolut konvergent genau dann, wenn ∞
n=1 |an | konvergiert.
Eine
absolut
konvergente
Reihe
ist
konvergent,
die
Umkehrung
gilt
P∞
n
−1
nicht: n=1 (−1)Pn konvergiert aber nicht absolut. DaP
die Folge der Par∞
tialsummen von ∞
|a
|
monoton
wächst,
konvergiert
n
n=1
n=1 an nach Satz
Pn
7 (ii) in R genau dann, wenn ( ν=1 |aν |)n eine beschränkte Folge ist. Ein
sehr wichtiges Beispiel: Für |q| < 1 ist
∞
X
ν=0
qν =
1
,
q−1
und diese Konvergenz ist absolut. Für |q| ≥ 1 divergiert die Reihe.
Werner, Universität Münster, WS 05/06
21
P∞
P
Satz 11 Es seien ∞
n=1 bn Reihen. Dann gelten die folgenden
n=1 an und
Konvergenzkriterien.
P
Majorantenkriterium
Ist
|a
|
≤
b
und
bn konvergent, so konvergiert
n
n
P
an absolut.
P
Minorantenkriterium Pbn divergiert, falls für fast alle Indizes n ∈ N
gilt 0 ≤ an ≤ bn und
an divergiert
P
Quotienten- und Wurzelkriterium
an konvergiert absolut, falls es einen
Index N0 ∈ N sowie eine positive Zahl q gibt, so dass für alle n ≥ N0
gilt
p
an+1 n
|an | ≤ q < 1.
oder
an ≤ q < 1
P
Die Reihe
an divergiert für den Fall, dass für alle n ≥ N0 gilt
p
an+1 n
oder
|an | > 1 für unendlich viele n.
an > 1,
Leibniz-Kriterium Eine Reihe der Form
∞
X
(−1)n an
n=1
konvergiert immer dann, wenn die Nullfolge (an ) streng monoton fällt
und an ≥ 0 ist.
Cauchysche Verdichtungskriterium
Ist an ≥ 0 und an+1 ≤ an , so konP
vergiert die Reihe
an genau dann, wenn
∞
X
2k a2k
k=1
dies tut.
Das Majoranten- bzw. Minorantenkriterium ergibt sich aus der Tatsache,
dass für eine Reihe mit positiven Summanden Konvergenz äquivalent zur
Beschränktheit der Folge der Partialsummen ist (Satz 9, Satz 3(a)):
PN Falls
bn ≥ |an | für fast alle n ∈ N, so ist jede einzelne Partialsumme n=1 |an |
P
durch N
Folgenglieder von
n=1 bn beschränkt, und dieselbe Schranke, die die
PN
PN
( n=1 |an |)N ∈N beschränkt, kann auch von den Zahlen n=1 bn nicht übertroffen werden. Ganz ähnlich
aus der
P folgt im Fall des Minorantenkriteriums
P
Unbeschränktheit von
an die der Partialsummen von
bn ,P
die ja alle
mindestens so stark wachsen, wie die Partialsummen der Reihe
an .
Für Wurzel- und Quotientenkriterium wendet man das Majoranten- bzw.
Minorantenkriterium an, unter Ausnutzung des bekannten
p Konvergenzverhaltens der geometrischen Reihe: Falls für n ≥ N0 gilt n |an | < 1, so ist
22
Mathematik für Physiker und Informatiker I (Kurzskript)
P n
n , und die Reihe
ür diese Indizes |an | < qp
q ist eine konvergente Man
jorante.
Ist
andererseits
|a
|
>
1
für
unednlich
viele Indizes n, so kann
n
P
an nicht konvergieren, da (an ) keine Nullfolge ist. Falls für alle n ∈ N
ab einem Startindex n0 gilt |an+1 ||an |−1 ≤ q < 1, so ist von da an stets
n−n0 |a |, so dass wiederum eine
|an+1 | ≤ q|an |, und induktiv folgt |aP
n| ≤ q
n0
konvergente geometrische Reihe — n (|a0 |q −n0 )q n — eine Majorante ist.
Falls |an+1 ||an |−1 > 1 für n ≥ n1 gilt, so ist dann stets |an+1 | > |an | und
auch hier kann (an ) keine Nullfolge sein6 .
Im Fall des Leibnizkriteriums folgt aus der Tatsache, dass (an ) streng
monoton fällt
2N
+2
X
(−1)n an = a2N +2 − a2N +1 +
n=1
2N
X
(−1)n an <
n=1
2N
+1
X
2N
X
(−1)n an
sowie
n=1
n
(−1) an = −a2N +1 + a2N +
2N
−1
X
n=1
n
(−1) an >
n=1
2N
−1
X
(−1)n an .
n=1
P2N −1
P
n
n
Wegen 2N
n=1 (−1) an ist daher die aus den Partialsumn=1 (−1) an >
men sN gebildete Folge ([s2N , s2N −1 ]) eine Intervallschachtelung, deren innerer Punkt der Grenzwert der betrachteten Reihe sein muss.— Das LeibnizKriterium gilt natürlich in derselben Weise, wenn (an ) streng monoton
wächst und an ≤ 0 ist für alle n ∈ N.
Für das Cauchysche Verdichtungskriterium benutzt man die Beziehungen
N
N
X
1X k
2 a2k ≤ a1 +
2
k
2
X
k=1 n=2k−1 +1
k=0
N
an =
2
X
n=1
N
−1 2k+1
X
X−1
an = a2N +
an ≤
k=0 n=2k
Das Cauchysche
erlaubt es, Reihen der Form
P Verdichtungskriterium
−p ln n auf Konvergenz zu untersuchen.
oder auch ∞
n
n=1
N
X
2k a2k
k=0
P∞
n=1 n
−p
Die Aussagen von Wurzel- und Quotientenkriterium kann man recht prägnant
mit Hilfe von ausgezeichneten Häufungspunkten der Folge (an ) formulieren. Ist (an ) eine reelle Folge, so bezeichnet man mit lim supn→∞ an und
lim inf n→∞ an das Supremum bzw. Infimum aller Häufungspunkte von (an ).
Beide Zahlen sind ihrerseits Häufungspunkte7 . Nun gilt aber
6
Zu bemerken ist, dass das Quotientenkriterium im allgemeinen einfacher zu handhaben ist, das Wurzelkriterium aber oft auch dann noch Ergebnisse liefert, wenn das
Quotientenkriterium versagt. Es gilt genauer:
lim inf
n
p
p
|an+1 |
|an+1 |
≤ lim inf n |an | ≤ lim sup n |an | ≤ lim sup
n
|an |
|an |
n
n
für alle (beschränkten) Folgen (an )(vgl. Rudin,Principles of Mathematical Analysis, pp.
59)
7
Man hat es ja beim Beweis dieser Aussage mit einer Folge ((ank,` )k∈N )`∈N von Teil-
Werner, Universität Münster, WS 05/06
23
• lim sup αn < A ist äquivalent zu der Tatsache, dass für ein N0 ∈ N
und alle n ≥ N0 gilt αn < A, und aus lim sup αn > A folgt αn > A für
unendlich viele n ∈ N.
• lim inf αn > A ist äquivalent zu der Tatsache, dass für ein N0 ∈ N und
alle n ≥ N0 gilt αn < A, und aus lim inf αn < A folgt αn > A für
unendlich viele n ∈ N.
Damit gilt unterPden Voraussetzungen des Wurzel- und Quotientenkriteriums: Die Reihe
an konvergiert absolut, falls
an+1 <1
lim sup an n
bzw.
lim sup
n
p
n
|an | < 1,
und sie divergiert im Fall von
an+1 >1
lim inf n
an bzw.
lim sup
n
p
n
|an | > 1.
In vielen Fällen stimmen größter und kleinster Häufungspunkt einer Folge
(an ) meist schon mit limn an überein. Ein Beispiel, bei dem das nicht so ist,
ist
 k
1 1


für n = 2k + 1

2 4
an =  1 k−1



für n = 2k
4
mit
lim inf
n
an+1
1
= ,
an
8
lim sup
n
an+1
=2
an
sowie
lim sup
n
p
1
n
|an | = .
2
folgen zu tun, die alle gegen die Glieder einer Folge von Häufungspunkten (a0,` )`∈N konvergieren, die ihrerseits für ` → ∞ gegen lim supn→∞ an konvergiert. Wählt man nun in
jeder dieser Folgen ein Folgenglied mit Hilfe der Indizes nk1 ,1 < nk2 ,2 < . . . < nk` ,` < . . .,
so dass
1
|a0,` − ank` ,` | < ,
`
(um das monotone Wachsen der Indizes zu erzwingen, muss man unter Umständen etwas
länger warten) und ist für ε > 0 die Zahl `0 so groß, dass `−1
0 < ε/2 und | lim supn→∞ an −
a0,` | < ε/2 für ` ≥ `0 , dann gilt für alle ` ≥ `0
| lim sup an − ank` ,` | ≤ | lim sup an − a0,` | + |a0,` − ank` ,` | < ε.
n→∞
n→∞
Dies zeigt, dass lim supn→∞ an der Grenzwert der Teilfolge ank` ,` von (an ) und damit
selbst ein Häufungspunkt dieser Folge ist.
24
Mathematik für Physiker und Informatiker I (Kurzskript)
C.
(1.Teil) Aus der Schule bekannt sind die Polynome
Pn Potenzreihen
ν , in die beliebige Werte x ∈ R eingesetzt werden dürfen. Die Theoa
x
ν
ν=0
rie der Reihen legt es nahe, Polynome ‘unendlicher Länge’ zu betrachten,
die sogenannten Potenzreihen. Es wird sich herausstellen, dass eine ganze
Reihe wichtiger Funktionen tatsächlich solche Polynome von unendlichem
Grad sind, etwa
∞
X
x2n+1
sin x =
(−1)n
.
(2n + 1)!
n=0
P
Für die (zunächst formal gebildeten) Ausdrücke der Form n an xn stellt
sich zu allererst die Frage, welche reellen Werte x in sie eingesetzt werden
dürfen. Diese Frage aber können wir schon recht gut beantworten:
P
Satz 12 Es sei n an xn eine Potenzreihe.
(i) Es existiert eine Zahl r ∈ [0, ∞], Konvergenzradius
genannt, mit der
P
n
Eigenschaft, dass für r ∈ (0, ∞) die Reihe n an x für |x| < r konvergiert und für |x| > r divergiert. ‘r = ∞’ steht für den Fall, dass
die gegebene P
Potenzreihe für alle x ∈ R konvergiert, und ‘r = 0’ soll
heißen, dass n an xn allein im Nullpunkt konvergiert.
(ii) Im Fall r ∈ (0, ∞) gilt die Formel
r=
1
lim supn
p
,
n
|an |
und r = ∞ gilt genau dann, wenn
p
p
lim sup n |an | = lim n |an | = 0
n→∞
n
p
ist; der Fall r = 0 tritt genau dann ein, wenn ( n |an |) unbeschränkt
ist.
P∞
n
Eine Potenzreihe
n=0 cn (z − z0 ) , cn , z, z0 ∈ C konvergiert absolut im
Innern der Kreisscheibe mit Radius
R :=
1
lim supn→∞
p
n
|an |
um den Punkt z0 und divergiert außerhalb dieser Kreisscheibe.
Das Verhalten einer Potenzreihe auf dem Rande des Konvergenzgebietes,
also für die x mit |x| = r, ist allgemein nicht in einfacher Weise vorherzusagen und muß in jedem Einzelfall gesondert überprüft werden.
Der Beweis von Satz 13(i),(ii) im Fall r ∈ (0,p∞) ergibt sich aus
p einer
Anwendung des Wurzelkriteriums. Falls lim supn n |an | = limn→∞ n |an | =
0 ist, so folgt für alle x ∈ R aus
p
p
lim sup n |an xn | = |x| lim sup n |an | = 0 < 1
n
n
Werner, Universität Münster, WS 05/06
25
p
P
n
die Konvergenz von n an xn . Ist umgekehrt
lim
sup
|an | =:
n
p
Pr > 0, so gilt
n
n
für unendlich viele Indizes lim supn |an x | > |x|r/2, und n an xn kann
für
|x| > 2/r nicht konvergieren. Besitzt schließlich im Fall r = 0 die Folge
p
n
( |an |) keine unbeschränkte Teilfolge, dann ist diese Folge beschränkt,
und
p
es gibt ein M > 0, so dass für 0 < |x| < M −1 folgt lim supn n |an xn | < 1,
die gegebene
Potenzreihe folglich auch für Werte
x 6= 0 konvergiert. Mit der
p
p
n
n
n
Folge
(
|a
|)
ist
aber
für
alle
x
=
6
0
auch
(
|a
n
n x |) unbeschränkt, und
P
n
n an x konvergiert für kein x 6= 0.
Versucht man, den Konvergenzradius einer Potenzreihe zu ermitteln,
dann ist die im zweiten Teil des Satzes angegebene Formel häufig zu schwierig zu handhaben. So macht im Fall der Reihe
∞
X
(−1)n
n=0
x2n+1
(2n + 1)!
die Tatsache Schwierigkeiten, dass die Hälfte der an verschwindet. Es ist hier
wie in vielen anderen Fällen auch günstiger, nur den Teil (i) des Satzes zu
verwenden und das Quotientenkriterium unmittelbar auf die Reihenglieder
anzuwenden. Man sieht dann, dass Konvergenz für alle x ∈ R gegeben ist.
II. Funktionen
Einschub: Kartesisches Produkt und Abbildungen
Es seien X und Y Mengen. Das kartesische Produkt von X und Y ist die
Menge der geordneten Paare
X × Y = {(x, y) | x ∈ X, y ∈ Y } .
‘Geordnet’ bedeutet, dass (x, y) 6= (y, x)8 . Eine Relation zwischen den Mengen X und Y ist eine Teilmenge R ⊆ X × Y . Eine uns bereits bekannte Relation ist die Ordnungsrelation auf der Menge der reellen Zahlen,
R × R ⊇ G = {(x, y) ∈ R × R | x > y }. Eine Abbildung zwischen X und
Y ist eine Relation F ⊆ X × Y mit der Eigenschaft, dass für alle x ∈ X
genau ein Element y ∈ Y existiert mit (x, y) ∈ F . Man nennt X auch den
Definitionsbereich von F und Y den Werte- oder Bildbereich. Es ist üblich,
statt (x, y) ∈ F auch F (x) = y zu schreiben, und von einer Abbildung
F : X → Y , x 7→ F (x) zu sprechen. (Umgekehrt kann man sich die zu einer
Abbildungen gehörende Menge F ⊆ X ×Y als eine Liste der zu den Elementen von x ∈ X gehörigen ‘Funktionswerte’ vorstellen.) Ist Y eine Teilmenge
von R, so nennt man in diesem Fall eine Abbildungen meist Funktion. Eine
Abbildung F : X → Y heißt
8
Wem das als Definition nicht genüngt, muss von (x, y) := {x, {x, y}} ausgehen.
26
Mathematik für Physiker und Informatiker I (Kurzskript)
• injektiv, falls für alle y ∈ {F (x) ∈ Y | x ∈ X } genau ein x ∈ X mit
F (x) = y existiert (also aus F (x1 ) = F (x2 ) stets x1 = x2 folgt), und
• surjektiv, wenn es für alle y ∈ Y ein x ∈ X mit F (x) = y gibt.
Beispiele für Abbildungen, für die Injektivität von Bedeutung ist, ist die Zuordnung von charakteristischen Kenngrößen (Studierende −→ Matrikelnummern, Kraftfahrzeuge −→ Kraftfahrzeugkennzeichen, . . .), die typischerweise nicht surjektiv sind (um die Injektivität nicht zu gefährden). Wichtig ist
Surjektivität z.B. bei der Zuordnung Spieler −→ Spielerposition in den meisten Mannschaftssportarten oder auch bei der Abbildung ‘Lokomotivführer
im Einsatz’ −→ ‘Lokomotiven unterwegs’. Stellt man sich die Beziehung
F (x) = y als eine Gleichung vor, bei der nach Vorgabe von y ∈ Y die Unbekannte x ∈ X zu bestimmen ist, dann ist F surjektiv genau dann, wenn
eine solche Gleichung für jedes y ∈ Y eine Lösung besitzt; injektiv ist F ,
falls bei gegebenem y nicht zwei verschiedene Lösungen existieren können.
Hilfreich sind die Schreibweisen
F (A) = {F (a) ∈ Y | a ∈ A }
sowie
F −1 (B) = {x ∈ X | F (x) ∈ B } .
Damit ist F z.B. surjetiv genau dann, wenn F (X) = Y ist. Etwas weniger
offensichtlich ist die Tatsache, dass F injektiv genau dann ist, wenn für alle
A, B ⊆ X gilt F (A ∩ B) = F (A) ∩ F (B). (Für eine beliebige Abbildung
gilt stets F (A ∩ B) ⊆ F (A) ∩ F (B).) Eine injektive Abbildung F : X → Y
definiert in eindeutiger Weise eine Umkehrabbildung F −1 : F (X) → X
durch
F −1 (y) = x
genau dann, wenn
F (x) = y.
Ist F zusätzlich surjektiv, so ist der natürliche Definitionsbereich von F −1
die ganze Menge Y . Sind f : X → Y und g : Y → Z Abbildungen, dann
definiert man die Verknüpfung von f und g als
g ◦ f : X → Z,
g ◦ f (x) := g(f (x)).
1. Stetigkeit
A. Definition und einfache Eigenschaften Stetige Funktionen sind
vorhersagefreundlich. Sie gestatten es, aus dem Verhalten von f in der Nähe
eines Punktes x0 auf den Wert von f bei x0 selbst zu schließen.
Definition 6 Es sei D eine Menge reeller Zahlen, f : D → R eine Funktion
sowie x0 ∈ D.
(i) f bestitzt bei x0 den Grenzwert y0 genau dann, wenn gilt
y0 = lim f (xn )
n→∞
Werner, Universität Münster, WS 05/06
27
für alle gegen x0 konvergenten Folgen (xn ) in D, mit von x0 verschiedenen Folgengliedern. In einem solchen Fall schreibt man
lim f (x) = y0 .
x→x0
(ii) Eine Funktion f : D → R heißt stetig bei x0 ∈ D genau dann, wenn
lim f (x) = f (x0 ),
x→x0
wenn also der Grenzwertsatz f (limn→∞ xn ) = limn→∞ f (xn ) gültig
ist.
(iii) f heißt auf D stetig, falls f an jedem Punkt x0 ∈ D stetig ist.
Die hier gegebene Definition von Stetigkeit ist recht allgemein. Sie beinhaltet etwa die (einseitige) Stetigkeit von Funktionen an Randpunkten eines
Intervalls oder zeigt, dass auf endlichen Mengen definierte Funktionen überall stetig sind. Man beachte auch, dass der Grenzwert von f am Punkt x0
automatisch bereits mit f (x0 ) übereinstimmen muss, wenn man die Forderung xn 6= x0 an die an der Definition von limx→x0 f (x) beteiligten Folgen
(xn ) fortlässt.
Drei Beispiele: Die Funktion f : R → R, f (x) = 0 für x 6= 0 und f (0) = 1
besitzt bei 0 den Grenzwert 0, der aber nicht der Funktionswert an dieser
Stelle ist. Die Funktion g(x) = 0 für x ≤ 0 und g(x) = 1 für x > 0, besitzt
am Nullpunkt gar keinen Grenzwert; denn für die durch xn = 1/n und
yn = −1/n definierten Folgen gilt limn→∞ g(xn ) = 1, limn→∞ g(yn ) = 0 (was
alleine schon ausreicht), und für zn = (−1)n /n besitzt die Folge g(zn ) nicht
einmal einen Grenzwert. Die Unstetigkeitsstelle der letzten Funktion ist eine
sogenannte Sprungstelle, die man glaubt, gut am Graphen der Funktion
ablesen zu können. Etwas Vorsicht ist hier geboten: Ist h : [a, b] ∪ [c, d] →
R mit a < b < c < d durch h(x) = 0 für x ∈ [a, b] und h(x) = 1 für
x ∈ [c, d], dann sieht auch das nach einer Sprungstelle aus, ist es aber nicht
(jedenfalls ist diese Funktion überall stetig): Ist (xn ) eine Folge aus der
Menge [a, b] ∪ [c, d], die gegen b konvergiert, dann ist ja ab einem Index
N ∈ N für n ≥ N stets |xn − b| < |c − b|, und das bedeutet, xn ∈ [a, b] für
alle diese Indizes. Dann aber ist h(xn ) = 0, und es folgt limn→∞ h(xn ) = 0
und, weil die Folge beliebig gewählt werden konnte, limx→b h(x) = 0. Die
Funktion h ist also am Punkt b (genauso übrigens wie am Punkt c) stetig.
Satz 13 Es seien D, E ⊆ R, f, g : D → R und h : E → R Funktionen sowie
x0 ∈ D. Ferner sei g(x0 ) ∈ E.
(i) Die Funktion f besitzt den Grenzwert a am Punkt x0 genau dann, wenn
für jedes ε > 0 ein δ(ε, x0 ) > 0 existiert, so dass für alle x ∈ D mit
0 < |x − x0 | < δ(ε, x0 ) gilt |f (x) − a| < ε, und f ist stetig bei x0 genau
dann, wenn für jedes ε > 0 ein δ(ε, x0 ) > 0 existiert, so dass für alle
x ∈ D mit |x − x0 | < δ(ε, x0 ) gilt |f (x) − f (x0 )| < ε.
28
Mathematik für Physiker und Informatiker I (Kurzskript)
(ii) Sind f und g bei x0 stetig, so gilt dies auch für die Funktionen f + g,
f g sowie f /g, sofern im letzten Fall g(x0 ) 6= 0 ist. Ist zusätzlich h am
Punkt g(x0 ) stetig, so ist h ◦ g bei x0 stetig.
(iii) (Zwischenwertsatz) Ist D = [a, b] und η ∈ R eine Zahl, die zwischen
f (a) und f (b) liegt, dann gibt es ein ξ ∈ [a, b] mit f (ξ) = η.
Für den Beweis des ersten Teils sei zunächst f stetig bei x0 im Sinne der
zuvor gemachten Definition. Wir nehmen außerdem an, es wäre die ε-δBedingung aus (i) verletzt. Dann gibt es ein ε0 > 0 sowie eine Folge (xn )
in D mit |xn − x0 | < 1/n und |f (xn ) − f (x0 )| ≥ ε0 . Dann aber kann ganz
offenkundig f (x0 ) nicht der Grenzwert von f an der Stelle x0 sein. Falls
umgekehrt die ε-δ-Bedingung erfüllt ist, und (xn ) eine in D enthaltenen
Folge bezeichnet, für die |x0 − xn | < η für n ≥ N (η) und η > 0 beliebig,
so wählt man, um die Konvergenz von (f (xn )) gegen f (x0 ) zu zeigen, bei
vorgelegtem ε > 0 eine Zahl δ > 0, so dass |f (x0 )−f (x)| < ε falls |x0 −x| < δ.
Ist dann n ≥ N (δ) beliebig, so folgt |x0 − xn | < δ und |f (xn ) − f (x0 )| < ε.
Bis auf die letzte Aussage folgt Teil (ii) aus den entsprechenden Aussagen
über Folgen im Satz 4(a). Die Aussage über h◦g ist eine einfache Konsequenz
aus der Defintion.
Der Beweis des Teils (iii) ist eine Anwendung des Intervallschachtelungsprinzips: Wir nehmen an, dass gilt f (a) < η < f (b). Induktiv definieren wir
Intervalle In = [an , bn ] durch I1 = [a, b] und

an + bn
an + bn


falls f (an ) < η < f

 an ,
2
2
In+1 = [an+1 , bn+1 ] := .

an + bn
an + bn


, bn
falls f
< η < f (bn )

2
2
Dabei soll die Folge abbrechen (der Beweis wäre dann bereits beendet), wenn
der Funktionswert von f am Mittelpunkt einer der Intervalle In bereits η
ist. In allen anderen Fällen
T gilt f (an ) < η < f (bn ), und wir erhalten wir
einen inneren Punkt ξ ∈ n∈N In , für den aufgrund der Stetigkeit von f gilt
f (ξ) = lim f (an ) ≤ η ≤ lim f (bn ) = f (ξ),
n→∞
n→∞
und somit auch f (ξ) = η.
Ein Beispiel zur Stetigkeitsaussage: Die Funktion w : R+
0 → R, w(x) =
√
x, ist an jedem Punkt x0 stetig: Ist x0 6= 0, so kann man bei vorgelegtem
√
ε > 0 wählen δ(ε, x0 ) = ε x0 . Ist dann |x − x0 | < δ(ε, x0 ), so folgt
|x − x0 |
|x − x0 |
|w(x) − w(x0 )| = √
< ε.
√ ≤ √
x0
x + x0
Für x0 = 0 wählt man δ(ε, 0) = ε2 . Dann folgt aus |x| < δ(ε, 0) sofort
|w(x) − w(0)| < ε.
Werner, Universität Münster, WS 05/06
29
Wenn man will, kann man den Zwischenwertsatz als die Aussage deuten,
die besagt, dass man den Graphen stetiger, auf einem Intervall definierter
Funktionen ‘in einem Strich’ zeichnen kann. Diese Vorstellung ist inosfern
problematisch, als es stetige Fuktionen gibt, bei denen man sich dies trotz
Zwischenwertsatzes nur sehr schwer vorstellen kann, und umgekehrt gibt es
unstetige Funktionen, deren Einschränkungen auf beliebige abgeschlossene
Teilintervalle der Aussage des Zwischenwertsatzes genügen.
Eine einfache Anwendung des Zwischenwertsatzes ist: Die Gleichung
x − cos x = 0
besitzt im Intervall [0, π/2] eine Lösung. (Hierzu muss man allerdings daran
glauben, das cos x eine stetige Funktion ist, was wir erst später nachweisen
werden.)
B. Kompaktheit Eine Zahl α nennt man einen Häufungspunkt der Folge
(an ), falls es eine Teilfolge von (an ) gibt, die gegen α konvergiert. Man beachte, dass jeder Häufungspunkt einer Folge auch Häufungswert der Menge der
Folgenglieder ist, dass aber umgekehrt jeder Punkt einer Folge Häufungswert
der Menge der Folgenglieder ist und damit nicht unbedingt ein Häufungspunkt.
Satz 14 (Bolzano-Weierstraß) Jede beschränkte Folge in R besitzt einen
Häufungspunkt
Ist die Folge (xn ) in dem Intervall [a, b] enthalten, dann wird eine Intervallschachtelung (In ) = ([an , bn ]) induktiv definiert durch I0 = [a, b],

an + bn

an +bn

a
,
falls
x
∈
a
,

n
n
n

2

2



für unendlich viele n
In+1 = [an+1 , bn+1 ] =
.





an + bn


, bn
sonst

2
Induktiv ergibt sich auch, dass jeweils in einer dieser Intervallhälften für
unendlich viele Indizes Folgenglieder liegen müssen und diese Konstruktion
folglich nicht abbrechen kann. Man kann jetzt eine monoton steigende Folge
(nk ) von Indizes mit xnk ∈ Ik für jedes k ∈ N wählen. Ist ξ der innere
Punkt der Intervallschachtelung (Ik ), so ist der Abstand von xnk zu ξ für
alle k ≥ K ∈ N kleiner oder gleich der Intervallbreite von IK . Es folgt
limk→∞ xnk = ξ.
Definition 7 Es seine K und F Mengen reeller Zahlen.
(i) K heißt kompakt, falls jede Folge mit Gliedern in K eine gegen ein
Element von K konvergente Teilfolge besitzt.
30
Mathematik für Physiker und Informatiker I (Kurzskript)
(ii) F heißt abgeschlossen, falls F jeden ihrer Häufungswerte enthält.
Ein einfaches Beispiel von kompakten Mengen sind die endlichen Mengen.
Da x ∈ C Häufungswert von F genau dann ist, wenn es eine Folge in F
gibt, die gegen x konvergiert, ist F abgeschlossen genau dann, wenn jede
konvergente Folge in F ihren Grenzwert auch in F besitzt. Beispiele für
abgeschlossene Mengen sind die abgeschlossenen Intervalle.
Satz 15 Eine Teilmenge K von reellen Zahlen ist kompakt genau dann,
wenn sie beschränkt und abgeschlossen ist.
Ist K nämlich beschränkt und abgeschlossen, so folgt die Behauptung aus
dem Satz von Bolzano-Weierstraß. Ist K umgekehrt kompakt und k ein
Häufungswert von K, gegen den die Folge (kn ) aus K konvergiert, so gibt es
nach Annahme eine Teilfolge, deren Grenzwert in K liegt. Da der Grenzwert
von Teilfolgen konvergenter Folgen mit dem Grenzwert der ganzen Folge
übereistimmt, muss k ∈ K sein, und K ist abgeschlossen. In einer unbeschränkten Menge lässt sich stets eine Folge (xn ) finden mit |xn | ≥ n. Keine
Teilfolge einer solchen Folge kann beschränkt und folglich auch nicht konvergent sein. Damit sind weitere Beispiele für kompakte Mengen die Intervalle
[a, b].
Ist eine stetige Funktion f auf einer kompakten Menge K ⊆ R definiert,
so ergibt sich eine erstaunlicher Zugewinn an Qualtität von f . Eine Funktion
f : D ⊆ R → R heißt beschränkt, falls f (D) eine beschränkte Menge ist.
D.h. es gibt eine Zahl M > 0, so dass für alle x ∈ D gilt |f (x)| ≤ M .
Satz 16 Es sei K ⊆ R kompakt und f : K → R auf ganz K stetig. Dann
gilt
(i) f ist beschränkt.
(ii) f nimmt Supremum und Infimum ihrer Funktionswerte an, d.h. es existieren Punkte d1,2 ∈ D mit
f (d1 ) = sup f (d)
d∈D
sowie
f (d2 ) = inf f (d).
d∈D
(iii) f ist gleichmäßig stetig, d.h. für alle ε > 0 existiert ein δ(ε) > 0 mit
der Eigenschaft, dass |f (x) − f (y)| < ε für alle Punktepaare x, y ∈ D
mit |x − y| < δ(ε).
Die Beweise für die drei Teile sind im Prinzip alle recht ähnlich und basieren darauf, besonderes Verhalten von Funktionen auf kompakten Mengen
(durch Auswahl konvergenter Teilfolgen) zu lokalisieren. Wäre f etwa auf
der kompakten Menge K unbeschränkt, dann gibt es ja zunächst nur eine
Folge (xn ) in K mit |f (xn )| ≥ n. Da aber K kompakt ist, kann man eine
gegen einen Punkt x0 ∈ K konvergente Teilfolge (xnk ) finden, und es ist
Werner, Universität Münster, WS 05/06
31
dann nicht mehr recht klar, welchen Wert f bei x0 eigentlich annehmen soll.
Diese Überlegung zeigt Teil (i). Ganz ähnlich geht man für den zweiten Teil
vor und wählt eine Folge (xn ) in K mit (z.B.)
lim f (xn ) = sup f (x)
n→∞
x∈K
Für eine konvergente Teilfolge dieser Folge ist der in K gelegene Grenzwert
eine Stelle, an der f sein Supremum auf K annimmt. Hätte man es schließlich
bei f mit einer nicht gleichmäßig stetigen Funktion zu tun, dann gäbe es
eine Zahl ε0 > 0 und eine Folge von Paaren (xn , yn ) ∈ K 2 mit
|xn − yn | ≤
1
n
sowie
|f (xn ) − f (yn )| ≥ ε0 .
Sind x0 und y0 die Grenzwerte von Teilfolgen (xnk ) und (ynk ) (man macht
sich leicht klar, dass beide Teilfolgen mit Hilfe derselben Indexfolge (nk )
gebildet werden können), so folgt aus der ersten Bedingung x0 = y0 und aus
der zweiten |f (x0 ) − f (y0 )| ≥ ε0 , was ganz offensichtlich nicht möglich ist.
√
Für die Funktion w : R+
x, hatten wir im letzten
0 → R, w(x) =
√
Abschnitt ein ganz wesentlich von x0 6= 0 abhängiges δ(ε, x0 ) = ε x0 bestimmt. Der voranstehende Satz sagt voraus, dass es möglich sein muss, ein
nur von ε abhängiges δ zu finden. Ein solches ist δ(ε) = ε2 , und die verbesserte Abschätzung, die hier√notwendig
wird, basiert auf der für a ≥ b ≥ 0
√
√
gültige Ungleichung a − b ≤ a − b: Für |x − x0 | < δ(ε) folgt mit ihrer
Hilfe
p
√
√
| x0 − x| ≤ |x − x0 | < ε.
2. Differenzierbarkeit
A. Definition und Ableitungsregeln Eines der mehr rätselhaften Instrumente des Alltags ist der Tachometer. Beschreibt x : R+
0 → R den Ort
eines Punktes auf der reellen Achse zum Zeitpunkt t, dann ist die Durchschnittsgeschwindigkeit dieses Punktes zwischen den Zeitpunkten t1 < t2
durch den Ausdruck
x(t2 ) − x(t1 )
vD (t1 ; t2 ) =
t2 − t1
gegeben. Der Tachometer behauptet, zu jedem Zeitpunkt und ohne nennenswerte Verzögerung die sogenannte Momentangeschwidigkeit,
v(t0 ) = lim
t→t0
x(t) − x(t0 )
,
t − t0
ermitteln zu können.
Definition 8 Eine Funktion f : [a, b] → R heißt am Punkt x0 ∈ [a, b]
differenzierbar genau dann, wenn der Grenzwert
lim
x→x0
f (x0 ) − f (x)
f (x0 + h) − f (x0 )
df
= lim
:= f 0 (x0 ) =
(x0 )
h→0
x − x0
h
dx
32
Mathematik für Physiker und Informatiker I (Kurzskript)
existiert.
Ein Beispiel für eine auf ganz R differenzierbare Funktion ist die Potenzfunktion Pn : R → R, x 7→ xn . Dies wird ersichtlich aus
n−1
X n
Pn (x0 + h) − Pn (x0 )
(x0 + h)n − xn0
xν hn−ν−1 =
= lim
= lim
h→0
h→0
h→0
h
h
ν 0
ν=0
n−2
X n
nxn−1
+ lim h
xν hn−ν−2 = nx0n−1 .
0
h→0
ν 0
lim
ν=0
Die Betragsfunktion x 7→ |x| ist nicht dfferenzierbar am Nullpunkt; denn die
Funktion
(
1
für x > 0
|x| − |0|
|x|
=
=
x−0
x
−1 für x < 0
besitzt am Nullpunkte keinen Grenzwert. Die folgende Beobachtung ist sehr
wichtig für das Verständnis des Ableitungsbegriffs.
Satz 17 Eine Funktion f : (a, b) → R ist bei x0 ∈ (a, b) differenzierbar,
falls es eine Zahl f 0 (x0 ) sowie eine Funktion h 7→ r(x0 , h) gibt mit
f (x0 + h) = f (x0 ) + f 0 (x0 )h + r(x0 , h)
und
lim
h→0
r(x0 , h)
=0
h
Jede bei x0 differenzierbare Funktion ist insbesondere stetig.
f ist danach am Punkt x0 differenzierbar, genau dann, wenn f in der Nachbarschaft des Punkts x0 so gut durch eine Gerade (und zwar die durch die
Abbildungsvorschrift x0 + h 7→ f (x0 ) + hf 0 (x0 ) gegebene Tangente) approximiert werden kann, dass der Fehler, den man dabei macht, nämlich r(x0 , h),
so schnell in h gegen Null konvergiert, dass immer noch limh→0 r(x0 , h)h−1 =
0 gilt.
Der Beweis des ersten Teils von Satz 17 ist sehr einfach und benutzt
nicht mehr als die beteiligten Definitionen. Dass f bei x0 stetig sein muss,
ist eine leichte Übungsaufgabe.
Die Ableitung spielt in den Anwendungen der Mathematik eine große
Rolle, vor allem da dieser Begriff es ermöglicht, zeitlich punktuelle (“momentane”) oder räumlich in einem Punkt konzentrierte Erscheinungen mathematisch in den Griff zu bekommen (etwas, für das man allerdings in
der fortgeschrittenen Physik einen bisweilen recht hohen Preis zu entrichten hat). Dabei mündet eine solche Modellierung häufig in einer sogenannten
Differentialgleichung, einer Gleichung, in der die modellierende Funktion mit
ihren Ableitungen in Beziehung steht. Ein Beispiel. Es sei B(t) die Anzahl
der Bakterien in einer Kultur Wir gehen davon aus, dass der Zuwachs dieser
Kolonie während eines Zeitintervalls ∆t, das so klein sein muss, dass Enkel
Werner, Universität Münster, WS 05/06
33
noch keine Rolle spielen, proportional sowohl zur Menge der bereits vorhandenen Bakterien als auch zu ∆t ist. Ist der Proportionalitätsfaktor α, dann
heißt das
B(t + ∆t) − B(t) = αB(t)∆t
Da diese Beziehung für alle ∆t gelten soll, kann man für alle Zeiten t den
Grenzwert ∆t → 0 betrachten(falls man annimmt, dass B eine differenzierbare Funktion der Zeit ist) und schließen9
B 0 (t) = lim
∆t→0
B(t + ∆t) − B(t)
= αB(t).
∆t
Kurz: Eine Funktion B, die das Bakterienwachstum in dieser Weise modelliert, muss notwendigerweise der Gleichung B 0 = αB genügen. Wir werden
später sehen, welche Funktionen das genau sind.
Satz 18 (Ableitungsregeln) Es seien f, g : [a, b] → R am Punkt x ∈ [a, b]
und ϕ : [c, d] → [a, b] am Punkt x0 ∈ [c, d] mit ϕ(x0 ) = x differenzierbare
Funktionen. Dann gilt
(i) f + g, f g sowie, für den Fall, dass g(x) 6= 0, die Funktion f /g sind bei
x differenzierbar mit
(f + g)0 (x) = f 0 (x) + g 0 (x)
(f g)0 (x) = f 0 (x)g(x) + f (x)g 0 (x)
0
f
f 0 (x)g(x) − f (x)g 0 (x)
sowie
(x) =
g
g(x)2
(ii) f ◦ ϕ ist am Punkt x0 differenzierbar mit
(f ◦ ϕ)0 (x0 ) = f 0 (ϕ(x0 ))ϕ0 (x0 )
(iii) Besitzt f in einer Umgebung um x0 eine differenzierbare Umkehrfunktion f −1 , so gilt
1
(f −1 )0 (f (x)) = 0
.
f (x)
Ein paar Beispiele: Die Quotientenregel, die Ableitungsregel für die inverse
Funktion sowie die Kettenregel zeigen (in dieser Reihenfolge), dass die Gleichung (xn )0 = nxn−1 auch für rationale Zahlen richtig bleibt, d.h. für alle
m, n ∈ N und p, q ∈ Z gilt:
1 0
p 0 p p
1 0
m
1 1 −1
−1
n
n
= − m+1
x
= x
sowie
xq = xq
xm
x
n
q
9
So, wie wir B(·) definiert hatten ist sie allerdings nicht einmal stetig; am einfachsten
stellt man sich vor, dass die Funktion B zwischen den durch die Bakteriengeburten entsthehenden Sprungstellen differenzierbar interpoliert und die wahre Anzahl der Bakterien
bis auf die erste Kommastelle genau vorhersagt — was viel besser wäre als die Situation
im Labor hergibt.
34
Mathematik für Physiker und Informatiker I (Kurzskript)
Die Kettenregel ergibt außerdem nochmals die Formel für 1/g.
Es ist sehr einfach, im Teil (i) die Summenformel zu beweisen. Die sogenannte Produktregel ergibt sich, wenn man in der Beziehung
f (x + h)g(x + h) − f (x)g(x)
=
h
f (x + h) − f (x)
g(x + h) − g(x)
=
g(x + h) + f (x)
.
h
h
den Grenzübergang h → 0 durchführt. Zu beachten ist dabei, dass die (durch
die Differenzierbarkeit sich ergebende) Stetigkeit von g bei x ausgenutzt
werden muss. Die Formel für den Quotienten reduziert man mit der Produktregel auf den Fall den, dass die Funktion f konstant gleich 1 ist. Diesen
wiederum erledigt die Gleichheit
1
1
g(x + h) − g(x)
1
1
−
=−
h g(x + h) g(x)
g(x + h)g(x)
h
sowie der Grenzübergang h → 0. (Natürlich spielt auch wieder die Stetigkeit
von g bei x eine Rolle und das gleich zweimal: Einmal für den Grenzübergang
und das zweite Mal für die Tatsache, dass bei hinreichend kleinem h der
Funktionswert g(x + h) nicht verschwindet.)
Die Aussage über die Umkehrfunktion erhält man durch Anwendung der
Kettenregel auf die in besagter Umgebung gültige Gleichung
f −1 (f (x)) = x.
Für den Beweis der Kettenregel selbst greifen wir schließlich auf die Funktion

f (x) − f (x0 )


für x 6= x0
x − x0
fx∆0 (x) =

 0
f (x0 )
für x = x0
zurück. Diese ist aufgrund der Definition der Differenzierbarkeit bei x0 genau
dann stetig, wenn f bei x0 differenzierbar mit Ableitung f 0 (x0 ) ist. Eine
elementare Rechnung zeigt, dass
f (ϕ(x0 )) − f (ϕ(x))
ϕ(x) − ϕ(x0 )
∆
= fϕ(x
(ϕ(x))
0)
x − x0
x − x0
womit
lim
x→x0
f (ϕ(x0 )) − f (ϕ(x))
=
x − x0
∆
= lim fϕ(x
(ϕ(x)) lim
0)
x→x0
x→x0
ϕ(x) − ϕ(x0 )
= f 0 (ϕ(x0 ))ϕ0 (x0 )
x − x0
Werner, Universität Münster, WS 05/06
35
folgt10 , da wir ja von all den hier auftretenden Grenzwerten die Existenz
vorausgesetzt hatten.
Die Ableitung f 0 einer auf (a, b) differenzierbaren Funktion ist im allgemeinen nicht stetig; sie genügt aber immer noch dem Zwischenwertsatz
(Satz von Darboux) und besitzt daher keine Sprungstellen. Differenzierbare Funktionen mit stetigen Ableitungen heißen stetig differenzierbar. Wenn
man etwas vorgreift, und die Ableitung der Sinus-Funktion als bekannt voraussetzt, dann kann man zeigen, dass f : R → R,

x2 sin 1
für x 6= 0
x
f (x) =

0
für x = 0
für x 6= 0 die Ableitung f 0 (x) = 2x sin(x−1 ) − cos(x−1 ) besitzt. Für den
Nullpunkt errechnet man direkt
f (x) − f (0)
1
0
f (0) = lim
= 0.
= lim x sin
x→0
x→0
x−0
x
Hier wird noch einmal die Schwierigkeit im Umgang mit unstetigen Funktionen deutlich: Nichts anderes als die direkte Rechnung ist in der Lage zu
ermitteln, wie es mit der Ableitung von f bei 0 steht; die Ableitung an von
Null verschiedenen Punkten erlaubt gar keinen Rückschluss.
B.Extremalpunkte und Mittelwertsatz
Definition 9 Es sei f : D → R eine Funktion. Ein Punkt ξ heißt eine
lokale Extremalstelle für f und f (ξ) ein lokaler Extremalwert, falls für ein
ε > 0 gilt
f (ξ) = sup {f (x) | x ∈ Uε (ξ) ∩ D }
bzw.
f (ξ) = inf {f (x) | x ∈ Uε (ξ) ∩ D }
Im ersten Fall nennt man ξ eine lokale Maximalstelle und f (ξ) ein lokales
Maximum, im zweiten Fall eine lokale Minimalstelle und f (ξ) ein lokales
Minimum.
Stetige, auf kompakten Mengen definierte Funktionen besitzen (lokale) Extremalstellen. Beim Vorliegen von Differenzierbarkeit lässt sich deren Lage
genauer eingrenzen.
10
mit
Man mache sich klar, dass ein Beweis der Kettenregel durch einfaches “Erweitern”
f (ϕ(x0 )) − f (ϕ(x))
ϕ(x) − ϕ(x0 )
insofern fragwürdig ist, als niemand ausschließen kann, dass ϕ(x) − ϕ(x0 ) in der Nachbarschaft von x0 immer wieder mal verschwindet. Hiergegen hilft natürlich auch die Forderung
x 6= x0 nichts.
36
Mathematik für Physiker und Informatiker I (Kurzskript)
Satz 19 Für jede lokale Extremalstelle x0 einer differenzierbaren Funktion
f : (a, b) → R gilt f 0 (x0 ) = 0.
Ist etwa f (ξ) = sup {f (x) | x ∈ Uε (ξ) ∩ (a, b) } für eine Zahl ε > 0, so gilt für
Folgen (xn ) mit x0 − ε < xn ≤ x0
f 0 (x0 ) = lim
n→∞
f (x0 ) − f (xn )
≥0
x0 − xn
und genauso für xn ≥ x0
f 0 (x0 ) = lim
n→∞
f (x0 ) − f (xn )
≤0
x0 − xn
weshalb f 0 (x0 ) = 0 gelten muss. In derselben Weise verfährt man für lokale
Minimalstellen.
Satz 20 (Satz von Rolle, Mittelwertsatz) Es sei f : [a, b] → R stetig
und eingeschränkt auf (a, b) sogar differenzierbar. Dann gilt
(i) Ist f (a) = f (b), so gibt es einen Punkt ξ ∈ (a, b) mit f 0 (ξ) = 0.
(ii) Es gibt einen Punkt x ∈ (a, b) mit
f (a) − f (b)
= f 0 (x)
a−b
(iii) Es gibt einen Punkt y ∈ (a, b) mit
f 0 (y)(g(a) − g(b)) = g 0 (y)(f (a) − f (b)).
Den Teil (i) nennt man den Satz von Rolle (das ist der Name eines französischen Mathematikers, der anders ausgesprochen gehört als die Sportübung;
es hält sich allerdings kaum jemand daran). Teil (ii) ist der Mittelwertsatz.
Er folgt aus Teil (iii) mit g(x) = x (umgekehrt geht es nicht).
Der Beweis von (i) beginnt mit der Beobachtung, dass für eine nicht
konstante Funktion f (für konstante Funktionen ist nichts zu zeigen), es in
(a, b) Punkte v oder w geben muss mit f (v) > f (a) = f (b) bzw. f (w) <
f (a) = f (b). Dann aber muss f in (a, b) sein absolutes Maximum bzw.
Minimum an einem Punkt ξ ∈ (a, b) annehmen, an dem nach dem letzten
Satz f 0 (ξ) = 0 gelten muss.
Für den Teil (iii) betrachtet man die Funktion
h(t) = f (t)(g(a) − g(b)) − g(t)(f (a) − f (b)).
Für diese gilt h(a) = −f (a)g(b) + g(a)f (b) = h(b), weshalb es aber nach
(i) einen Punkt y ∈ (a, b) geben muss mit 0 = h0 (y) = f 0 (y)(g(a) − g(b)) −
g 0 (y)(f (a) − f (b)).
Die Anwendungen des Mittelwertsatzes (Teil (ii)) sind zahlreich. Ein
paar einfache Beispiele:
Werner, Universität Münster, WS 05/06
37
• Die sogenannte Differentialgleichung y 0 = 0 besitzt genau die konstanten Funktionen als Lösung.
• Eine Funktion f : (a, b) → R mit f 0 (x) ≥ 0 (f 0 (x) ≤ 0) für alle x ist auf
(a, b) monoton wachsend (fallend). Strenge Monotonie ist in derselben
Weise mit den entsprechenden strikten Ungleichungen verknüpft.
• Für die Funktion f ist x0 ein Maximalpunkt, wenn f 0 (x0 ) = 0 und
f 0 bei x0 ‘das Vorzeichen von + nach − wechselt’. Eine entsprechende
Aussage gilt für Minimalpunkte.
C. Uneigentliche Grenzwerte und die Regeln von l’Hospital Eine
ganz wesentliche Rolle bei der Definition von Grenzwert und Stetigkeit haben die kleinen ε−Umgebungen um den Grenzwert gespielt. Kann man also
von einem Punkt sagen, was die kleinen Nachbarschaften sind, so kann man
gegen einen solchen Folgen konvergieren lassen. Diese Überlegung nutzt man
im Zusammenhang mit den Punkten ±∞ aus, die gewissermaßen die Zahlengerade nach rechts (oder links) abschließen. Mit diesen beiden Punkten
kann man nicht vernünftig rechnen — bei einer ganze Reihe von Opera∞
tionen, wie etwa ∞ − ∞ oder ∞
, kann man im Allgemeinen nicht recht
sagen, was herauskommen soll — sehr wohl aber macht es Sinn, mit Grenzb = R ∪ {±∞} zu hantieren. Die Idee ist, die Rolle, die die
werten auf R
ε-Umgebungen spielen, von den Mengen
US (∞) = {x ∈ R | x > S }
bzw.
US (−∞) = {x ∈ R | x < S }
übernehmen zu lassen.
Definition 10 Es sei (xn ) eine Folge reeller Zahlen. Dann bedeutet
lim xn = ∞
n→∞
bzw.
lim xn = −∞
n→∞
genau dasselbe wie
∀S ∈ R ∃N (S) ∈ N ∀n ≥ N (S)
gilt
xn ∈ US (∞)
bzw.
∀S ∈ R ∃N (S) ∈ N ∀n ≥ N (S)
gilt
xn ∈ US (−∞)
Ist eine dieser Bedingungen erfüllt, so sagt man, (xn ) konvergiere uneigentlich gegen ∞ bzw. −∞.
Einfache Beispiele sind die durch an = n bzw. bn = −n definierten Folgen,
die gegen ∞ bzw. −∞ konvergieren. Man beachte, dass es auch immer noch
Folgen gibt, die in keinem Sinne konvergieren, etwa cn = (−1)n (die auch
nicht uneigentlich konvegieren kann, da eine uneigentlich konvergente Folge
auf jeden Fall unbeschränkt sein muss), oder dn = (−1)n n, die aus zwei
uneigentlich konvergenten Teilfolgen besteht. Für Funktionen definiert man
in derselben Weise:
38
Mathematik für Physiker und Informatiker I (Kurzskript)
Definition 11 Es sei f : (x0 , ∞) → R eine Funktion. Dann ist
lim f (x) = α ⇐⇒ ∀ ε > 0∃ x0 ∈ R∀ x > x0
gilt
|f (x) − α| < ε
lim f (x) = α ⇐⇒ ∀ ε > 0∃ x0 ∈ R∀ x < x0
gilt
|f (x) − α| < ε,
x→∞
x→−∞
und
lim f (x) = −∞
x→x0
bzw.
lim f (x) = ∞
x→x0
ist definiert als
∀S ∈ R ∃δ > 0 ∀ 0 < x < |x − x0 | < δ
gilt
f (x) > S
∀S ∈ R ∃δ > 0 ∀ 0 < x < |x − x0 | < δ
gilt
f (x) < S.
bzw.
Ist die Variable des Definitionsbereichs von f die Zeit t, so modelliert man
mit den Grenzwerten t → ±∞ das langfristige, in Vergangenheit oder Zukunft liegende Verhalten eines durch f beschriebenen Systems. Häufig ist
nämlich das, was in kurzen Zeiträumen geschieht, fast unüberschaubar komplex und erst durch Grenzwertbildung einer vereinfachten Betrachtung zugänglich. Beispiele gibt es etwa in der chemischen Reaktionskinematik, bei den
Streuversuche, die Physiker in Teilchenbeschleunigern durchführen oder auch
ganz einfach beim Umrühren von Milch im Kaffee. Ein sehr einfaches mathematisches Beispiel ist die Untersuchung des asymptotischen Verhaltens
von z.B. gebrochen rationalen Funktionen: Dazu seien x1 , . . . xN die (reellen)
Nullstellen des Polynoms Q(x), P (x) ein weiteres Polynom sowie
f : R \ {x1 , . . . , xn } → R,
x 7−→
P (x)
.
Q(x)
Gilt nach einer Polynomdivision
P (x)
P 0 (x)
= R(x) +
,
Q(x)
Q(x)
dass R(x) ein Polynom und dass der Grad von P 0 echt kleiner als der von
Q ist, dann folgt
P (x)
− R(x) = 0,
lim
x→±∞ Q(x)
und man sagt, f verhält sich asymptotisch wie das Polynom R(x). Mit anderen Worten, das für ein Polynom untypische Verhalten einer gebrochen
rationalen Funktion (etwa die Existenz von Stellen, an denen diese Funktion die Grenzwerte ±∞ besitzt), findet auf einem abgeschlossenen Intervall
[a, b] statt, im Komplement dieses Intervalls weicht f vom Polynom R nur
um eine kleine Zahl ab, die zuvor durch Festlegung von [a, b] frei gewählt
werden kann.
Die Berechnung einer ganzen Reihe von Grenzwerten vereinfachen sich
aufgrund der Regeln von l’Hospital:
Werner, Universität Münster, WS 05/06
39
Satz 21 Es sei −∞ ≤ a < b ≤ ∞, f und g auf (a, b) differenzierbare
Funktionen und g 0 (x) 6= 0 für alle x ∈ (a, b). Ferner sei
f 0 (x)
= c.
x→a g 0 (x)
lim
(i) Gilt
lim f (x) = lim g(x) = 0
x→a
x→a
(ii) oder
lim g(x) = ∞,
x→a
so folgt
lim
x→a
f (x)
=c
g(x)
Die enstprechende Aussage gilt auch für Grenzwerte x → b oder, in (ii),
g(x) → −∞.
Der erste Teil folgt für a < ∞ sehr direkt aus Satz 20(iii): Ergänzt man f
und g stetig am Punkt a durch f (a) = g(a) = 0, so findet man einen Punkt
ξx mit a < ξx < x und
f (x)
f (a) − f (x)
f 0 (ξ)
=
= 0
g(x)
g(a) − g(x)
g (ξ)
Da mit x → a auch gilt ξx → a, folgt Teil (i) im Fall a > −∞. (Man beachte,
dass aus dieser Überlegung aufgrund der Voraussetzung f 0 (x)/g 0 (x) → c
für x → a zugleich auch folgt, dass der Bruch f (x)/g(x) für Punkte x,
die hinreichend nahe bei a sich befinden, wohldefiniert ist.) Den Fall a =
−∞ kann man durch Übergang zu f1 (x) = f (1/x) und g1 (x) = g(1/x)
bewältigen:
− x12 f 0 x1
f (x)
f (1/x)
f 0 (x)
lim
= lim
= lim
=
lim
,
x→−∞ g(x)
x→−∞ g 0 (x)
x→0 g(1/x)
x→0 − 12 g 0 1
x
x
Der Teil (ii) ist ein klein wenig schwieriger: Wir wählen eine Zahl δ > a, so
dass aus δ > x > a folgt
0
f (x)
g 0 (x) − c < ε.
Es sei δ > x0 > a festgewählt. Dann folgt für jedes δ > x > a aus Satz
20(iii)
f (x) − f (x0 )
<ε
(1)
−
c
g(x) − g(x0 )
und somit
f (x) − f (x0 ) g(x) − g(x0 ) < |c| + ε.
40
Mathematik für Physiker und Informatiker I (Kurzskript)
Multipliziert man diese Ungleichung mit |g(x) − g(x0 )||g(x)|−1 (dazu muss
man ggf. zu einer Zahl δ ≥ δ1 > 0 übergehen mit der Eigenschaft, dass aus
δ1 > x > a folgt g(x) 6= 0), so wird daraus
f (x) f (x0 ) f (x) f (x0 ) g(x0 ) g(x) − g(x) ≤ g(x) − g(x) ≤ |c| + ε + g(x) .
Damit ist |f (x)||g(x)|−1 für δ2 > x > a durch eine feste Konstante beschränkt. Aus dieser Beschränktheit sowie der Tatsache, dass g(x) → ∞ für
x → a folgt dann
f (x) − f (x0 ) f (x)
lim
−
= lim
x→a g(x) − g(x0 )
g(x) x→a
f (x0 )
f (x) g(x0 )
g(x) g(x) − g(x)
0)
1 − g(x
g(x)
=0
Damit existiert eine Zahl δ3 , so dass aus δ3 > x > a folgt
f (x) f (x) − f (x0 ) g(x) − g(x) − g(x0 ) < ε,
weshalb mit (1) für δ3 > x > a
f (x)
< 2ε
−
−c
g(x)
gelten muss, und die Behauptung ist bewiesen.
Nicht nur die hier betrachteten Grenzwerttypen können mit den Regeln
von l’Hospital behandelt werden; mit etwas Phantasie lassen sich auch andere Grenzwert auf die behandelten Typen zurückführen, etwa
1
x→∞ 1/x
p
n
lim
xn + xn−1 − x = lim
x→∞
r
n
1
1+ −1
x
1 1
= lim
x→∞ −1/x2 n
!
=
1
1 n −1 −1
1
1+
= .
2
x
x
n
E. Der Mittelwertsatz n-ter Ordnung: Satz von Taylor Wir wissen,
dass für eine auf einem offenen Intervall (a, b) um den Punkt x0 differenzierbare Funktion f es für jedes x ∈ (a, b) eine Punkt ξ zwischen x und x0 gibt
mit
f (x) = f (x0 ) + f 0 (ξ)(x − x0 ).
Im Folgenden gehen wir der Frage nach, ob es zu dieser Aussage ein Analogon
für die n-fache Ableitung f (n) gibt. Es wird sich zeigen, dass diese Frage auch
zu einer besonders guten Approximation von f um den Punkt x0 durch
Polynome führt.
Werner, Universität Münster, WS 05/06
41
Satz 22 Es sei f : (a, b) → R n-fach differenzierbar. Sind x, x0 ∈ (a, b), so
existiert ein Punkt ξ zwischen x und x0 mit der Eigenschaft, dass
f (x) =
n−1
X
ν=0
f (ν) (x0 )
f n (ξ)
(x − x0 )ν +
(x − x0 )n .
ν!
n!
Mit anderen Worten: Für eine n-fach differenzierbare Funktion f und einen
Punkt x0 aus deren Definitionsbereich gibt es ein Polynom P , das f in der
Nachbarschaft von x0 bis auf einen Term der Ordung n approximiert11 .
Der Beweis ist im wesentlichen eine n − 1-fache Anwendung des Satzes
von Rolle. Natürlich gibt es immer eine Zahl M mit
f (x) =
n−1
X
ν=0
f (ν) (x0 )
(x − x0 )ν + M (x − x0 )n ,
ν!
und die Kunst besteht darin nachzuweisen, dass n!M = f n (ξ) für einen
strikten Zwischenwert ξ gilt. Zu diesem Zweck sei
g(t) = f (t) −
n−1
X
ν=0
f (ν) (x0 )
(t − x0 )ν − M (t − x0 )n .
ν!
Pn−1 f (ν) (x0 )
(t − x0 )ν gerade
Wenn Sie sich gefragt haben, warum P (t) = ν=0
ν!
von dieser Form sein muss, dann kommt hier der Grund: P ist genau das
Polynom vom Grad (höchstens) n − 1, für das
f (k) (x0 ) = P (k) (x0 )
für alle k = 0, . . . , n − 1 gilt. Aus dieser Eigenschaft folgt nämlich, dass
g (k) (x0 ) = 0 für alle diese k, und die angekündigte mehrfache Anwendung
des Satzes von Rolle kann beginnen: Nach Definition von M gilt im ersten
Schritt g(x) = 0 und (Rolle) es gibt einen Punkt x1 (strikt) zwischen x
und x0 mit g 0 (x1 ) = 0. Dann aber gibt es auch einen Punkt x2 (wieder
nach dem Satz von Rolle), echt zwischen x0 und x1 gelegen mit g 00 (x2 ) = 0.
Argumentiert man in dieser Weise weiter, so gelangt man nach n−1 Schritten
schließlich zu dem gesuchten Zwischenwert ξ.
F. Beispiele und Anwendungen Interessant ist, dass die Taylorformel
ein sehr allgemein gültiges Rezept vermittelt,Pnach dem man eine gegebene
n
Funktion f in eine Potenzreihe der Form12 ∞
n=0 an (x − x0 ) ‘entwickeln’
Pn−1 f (ν) (x0 )
Man kann zeigen, dass das Polynom
(x − x0 )ν durch diese Forderung
ν=0
ν!
eindeutig bestimmt ist.
12
Diese ist von etwas allgemeinerer Form als die, die wir bislang angesehen haben; die
wesentlichen Aussagen sind jedoch dieselben.
11
42
Mathematik für Physiker und Informatiker I (Kurzskript)
kann. Es ist aber zum einen nicht klar, für welche Punkte x die sogenannte
Taylorreihe
∞
X
f (n) (x0 )
(x − x0 )n
n!
n=0
von f um x0 konvergiert, und zum anderen ist auch nicht offensichtlich, für
welche x die Taylorreihe gegen den Wert f (x) konvergiert (d.h. für welche
x das Restglied im Satz eine Nullfolge bildet).
Zwei Beispiele: Für α ∈ Q — um Fallunterscheidungen zu vermeiden,
schließen wir den einfachen Fall aus, dass α ∈ N ist — sei f (x) = (1 + x)α .
Dann ist f (n) am Punkt x0 = 0 durch α(α − 1) . . . (α − ν + 1) gegeben. Für
|x| < 1 ist die resultierende Taylorreihe (die sogenannte Binomische Reihe)
Y
∞ n
X
α n
α
α−ν+1
x
mit
=
n
n
ν
n=0
ν=1
(1 + x)α
konvergent und stellt die Funktion
dar: Dass diese Potenzreihe den
Konvergenzradius 1 besitzt, sieht man mit Hilfe des Quotientenkriteriums.
Dass sie die Funktion (1+x)α darstellt, folgt für 1 > x ≥ 0 aus der Tatsache,
dass das Restglied
n
f n (ξ)
α
x
(x − x0 )n = (1 + ξ)α
,
0 < ξ < x < 1,
n!
n
1+ξ
aufgrund der Konvergenz der Reihe eine Nullfolge sein muss. Wenn wir für
den Moment einmal davon ausgehen, dass sich Potenzreihen innerhalb ihres
Konvergenzintervalls ableiten lassen wie die Polynome (was wir im nächsten
Kapitel genau zeigen werden), dann sieht man, dass f 0 (x)(1 + x) = αf (x)
für alle x mit |x| < 1 gilt. Da diese Beziehung auch für die Funktion g(x) =
(1+x)α besteht, folgt (für α 6= 0) f 0 (x)/g 0 (x) = f (x)/g(x) sowie f 0 (x)g(x)−
f (x)g 0 (x) = 0 für alle diese x, und der Quotient f /g muss eine konstante
Funktion sein. Der Wert dieser Konstanten aber ist f (0)/g(0) = 1.
Wenn Ihnen diese Überlegun sehr umständlich vorkommt, dann hilft
vielleicht das folgende Beispiel für ein besseres Verständnis: Es sei ϕ : R →
R,
 1
−

e x2 für x 6= 0
ϕ(x) =

0
für x = 0
Nimmt man die Ableitungsregeln der Exponentialfunktion vorweg, dann
gibt es für alle n ∈ N ein Polynom Pn mit ϕ(n) (x) = Pn (x−1 )ϕ(x) für x 6= 0
und aus der Regel von l’Hospital folgt ϕ(n) (0) = 0 für alle n ∈ N0 . Die
Tayloreihe von ϕ konvergiert also überall und stellt die Funktion ϕ dennoch
nur im Nullpunkt dar.
Es wird nun aber Zeit, dass wir uns darum kümmern, ob Potenzreihen
wirklich so differenziert werden dürfen wie Polynome.
Werner, Universität Münster, WS 05/06
43
3. Funktionenfolgen
A. Punktweise und gleichmäßige P
Konvergenz Bisher habe wir die
Konvergenz von Potenzreihen P (x) = n an (x − x0 )n stets für einzelne xWerte betrachtet
und damit eine Folge von Funktionen (die der Polynome
P
n
a
PN (x) = N
n=1 n (x − x0 ) ) erhalten, die punktweise gegen eine Grenzfunktion konvergiert. Auch die durch fn : [0, 1] → R, fn (x) := xn definierte
Funktionenfolge konvergiert an jedem Punkt von [0, 1] und zwar
lim xn =
n→∞

1
falls x = 1

0
sonst
.
Hieraus kann man lernen, dass punktweise Konvergenz nicht ausreicht,
um von der Stetigkeit der Folgenglieder auf die der Grenzfunktion zu schließen. Dieser punktweisen Konvergenz liegt übrigens auch keine Vorstellung
von Abstand zu Grunde, der ja ganz wesentlicher Bestandteil bei der Konvergenz von Zahlenfolgen war. Die folgende Definition behebt auch dieses
Manko. Anschaulich besagt der gleich eingeführte Abstandsbegriff, dass zwei
Funktionen f und g dann einen Abstand haben, der kleiner oder gleich d ∈ R
ist, wenn der Graph von f in einem Schlauch der Breite 2d um den Graphen
von g enthalten ist.
Definition 12 Es seien f, g, fn : [a, b] → R, n ∈ N, Funktionen.
(a) Der Abstand zwischen f und g ist definiert durch
kf − gk = sup |f (x) − g(x)|.
x∈[a,b]
(b) Die Folge (fn ) konvergiert gleichmäßig gegen f , falls limn→∞ kf −fn k =
0, d.h. falls für alle ε > 0 ein N (ε) ∈ N existiert, so dass für alle
x ∈ [a, b] und alle n ≥ N (ε) stets |f (x) − fn (x)| < ε gilt.
Satz 23 Es sei (fn ) eine auf dem Intervall [a, b] definierte Folge von Funktionen.
(a) Konvergiert die Folge (fn ) gleichmäßig gegen f : [a, b] → R, so ist mit
den Funktionen fn auch f stetig.
(b) Sind die Funktionen fn (an den Randpunkten einseitig) differnzierbar, konvergiert die Folge der Ableitungen (fn0 ) gleichmäßig gegen eine Funktion ϕ und ist fn (x) konvergent für wenigstens einen Punkt
x ∈ [a, b], so konvergiert (fn ) gleichmäßig gegen eine differenzierbare
Funktion f mit f 0 = ϕ.
44
Mathematik für Physiker und Informatiker I (Kurzskript)
Der Beweis des Teils (a) ist ein sogenanntes ‘typisches ε/3-Argument’: Es
sei ε > 0 und x0 ∈ [a, b]. Zuerst wählt man n ∈ N mit kf − fn k < ε/3,
sodann für die stetige Funktion fn eine Zahl δ > 0, so dass aus |x − x0 | < δ
stets |fn (x) − fn (x0 )| < ε/3 folgt. Dann ergibt sich aber für dieselben x
|f (x) − f (x0 )| ≤ |f (x) − fn (x)| + |fn (x) − fn (x0 )| + |fn (x0 ) − f (x0 )| < ε.
Den Beweis des Teils (b) lassen wir weg und betrachten im Anschluss aber
den Fall, der uns hier besonders interessiert, die Folge der Partialsummen einer Potenzreihe. Die gleichmäßige Konvergenz der Folge (fn ) selbst reicht im
Teil (b) übrigens nicht: Anschaulich gesprochen ist für jede Folge von Funktionen deren Glieder in immer engeren ε-Schläuchen um eine Grenzfunktion
enthalten sind, stets Platz für nahezu beliebige Eskapaden der Tangentensteigungen. Wem diese Begründung nicht ausreicht: Die durch
x
gn : [−1, 1] → R
gn (x) =
1 + nx2
definierten Glieder einer Folge besitzen den Abstand
1
kgn k = √
2 n
zur Nullfunktion (das Ergebnis einer Extremalwertaufgabe), so dass (gn )
gleichmäßig gegen diese konvergiert. Zugleich aber ist

1 falls x = 0
2
1 − nx
lim gn0 (x) = lim
=
,
n→∞ (1 + nx2 )2

0 sonst
und (gn0 ) konvergiert weder gleichmäßig noch ist der punktweise gebildete
Limes die Ableitung der Grenzfunktion der Folge (gn ).
B. Die Konvergenz der Potenzreihen
P
Satz 24 Es besitze die Potenzreihe n an (x − x0 )n den Konvergenzradius
r ∈ R ∪ {∞}.
(a) Für
P jede Zahl 0 n< α < r konvergiert die Folge der Partialsummen von
auf dem Intervall [x0 − α, x0 + α], und
n an (x −
Px0 ) gleichmäßig
n
die durch n an (x − x0 ) vermittelte Funktion ist auf (x0 − r, x0 + r)
stetig.
P
(b) Die Funktion x 7→ n an (x−x0 )n ist an jedem Punkt x ∈ (x0 −r, x0 +r)
differenzierbar, und es gilt auf dem gesamten Intervall (x0 − r, x0 + r)
!0
∞
∞
X
X
n
an (x − x0 )
=
nan (x − x0 )n−1 ,
n=0
n=1
wobei die zweite Potenzreihe den gleichen Konvergenzradius wie
x0 )n besitzt.
P
n an (x−
Werner, Universität Münster, WS 05/06
45
Für den Beweis lohnt es sich, die Begründung für das Quotientenkriterium
in Erinnerung
zu rufen: Danach ist für eine passend
gewählte Zahl A die
P
P
Reihe n Aq np
eine konvergente Majorante für n an (x − P
x0 )n , wann immer
n
n
q = lim sup
n≥N an (x − x0 )
P n |an n(x − x0 ) | < 1. Für den Reihenrest
ist dann
Aq
eine
Majorante,
die
unabhängig
von
x ist, für jedes
n≥N
p
n
n
α0 < q und alle p
x mit lim supn |an (x − x0 ) | ≤ α0 < q, bzw. für jedes
n
α = α0 (lim supn |an |)−1 < r und alle x mit |x − x0 | < α.
Für den Beweis von
der KonvergenzraP∞
P (b) beobachtenn wir zunächst, dass
n−1
a
(x−x
)
gleich
dem
von
dius der Potenzreihe ∞
0
n=1 nan (x−x0 )
n=0 n
√
ist (was im wesentlichen aus lim n n → 1 folgt). Eine zweifache Anwendung
des Mittelwertsatzes zeigt, dass für jede doppelt differenzierbare Funktion
f : (a, b) → R mit |f 00 (x)| ≤ K für alle x ∈ (a, b) und jeden Punkt x0 ∈ (a, b)
gilt
f (x) − f (x0 )
0
≤ K|x − x0 |.
−
f
(x
)
0
x − x0
Für die Funktion Pn (x) = (x−x0 )n gilt entsprechend |P 00 (x)| ≤ n(n−1)hn−2
für alle x ∈ (x0 + h, x0 − h), und damit folgt für h mit |h| ≤ h0 und
(x0 − h0 , x0 + h0 ) ⊆ (x0 − r, x0 + r)
!
∞
∞
∞
1 X
X
X
an (x + h − x0 )n −
an (x − x0 )n −
nan (x − x0 )n−1 h
n=0
n=0
n=1
∞
X
≤ |h| an n(n − 1)hn−2
0
n=2
Die auf der rechten Seite sich befindende Reihe aber konvergiert (im Prinzip
√
wiederum wegen lim n n → 1), und für h → 0 ergibt sich die behauptete
Formel für die Ableitung einer Potenzreihe.
Man kann die Aussage natürlich immer wieder neu auf die nach einer
Ableitung erhaltene Potenzreihe anwenden. Es stellt sich so heraus, dass Potenzreihen im Innern ihres Konvergenzintervalls
beliebig oft differenzierbar
P
n
sind. Für die n-te Ableitung von f (x) = ∞
a
n=0 n (z − z0 ) am Punkt x0 gilt
insbesondere
f (n) (x0 ) = n!an ,
und wir erhalten
Satz 25 Besitzt die Funktion f die Darstellung
f (x) =
∞
X
an (z − z0 )n ,
n=0
so ist diese Reihe bereits die Taylorreihe von f .
Dieser Satz vereinfacht häufig die Berechnung einer Taylorreihe: Ist man
in der Lage, eine Potenzreihenentwicklung für eine vorgelegte Funktion zu
“erraten”, so hat man deren Taylorreihe bereits gefunden.
46
Mathematik für Physiker und Informatiker I (Kurzskript)
C. Anwendung: Die Erzeugendenfunktion der Fibonacchi-Zahlen
Die durch F0 = F1 = 1 und Fn = Fn−1 + Fn−2 rekursiv definierte Folge der
Fibonacchi-Zahlen besitzt die geschlossene Darstellung
1
Fn = √
5
"
√ !n #
1− 5
.
2
√ !n
1+ 5
−
2
Die Erzeugenden-Funktion der Folge (Fn ) ist
Φ(x) =
∞
X
Fn xn
n=0
Die Rekursion für die Fn liefert
−F0 x + xΦ(x) + x2 Φ(x) = Φ(x) − F1 x − F0 ,
woraus sich Φ zu
Φ(x) =
1
1 − x − x2
errechnet. Der Trick besteht nun darin, Φ noch einmal direkt in eine Potenzreihe um den Nullpunkt zu entwickeln:
√ Die Nullstellen des Nenners
von (1 − x − x2 )−1 sind x1,2 = −1/2(1 ± 5) und daher ist 1 − x − x2 =
(x − x1 )(x − x2 ). In dem Ansatz
1
A
B
=
+
2
1−x−x
x − x1 x − x2
bestimmt man die Zahlen A und B (etwa durch Probieren oder, systematischer, durch Ausmultiplizieren und Koeffizientenvergleich), was auf
1
1
Φ(x) =
=√
2
1−x−x
5
1
2√
−1+ 5
− −1+2 √5 x
−
1
!
2√
−1− 5
− −1−2 √5 x
=
"
n+1 n+1 #
∞
X
1
2
2
√
√
√
=
−
xn
5
−1
+
5
−1
−
5
n=0
führt. Aufgrund von Satz ??, müssen die Koeffizienten beider Potenzreihenentwicklungen von Φ um Null dieselben sein, und man erhält die angegebene
Formel für die Fibonacchi-Zahlen, nachdem man die Brüche passend erweitert hat.
In der Physik taucht diese Technik (in etwas komplexerer Form) für eine
ganze Reihe wichtiger und nicht ganz einfach zu handhabenden Funktionen
auf. So genügen etwa die Bessel-Funktionen erster Art, Jn (x), n ∈ Z, (die
Werner, Universität Münster, WS 05/06
47
man kennen muss, um z.B. die Grundschwingungen einer kreisförmigen, am
Rande eingespannten Membran zu verstehen) der Beziehung
∞
X
x
1
exp
t−
=
Jn (x)tn ,
2
t
n=−∞
in der nicht nur eine “unendlich lange gebrochen rationale Funktion” (eine
Laurent-Reihe als Verallgemeinerung der Potenzreihen) in Erscheinung tritt,
sondern die Koeffizienten auch noch von einer zweiten Variablen abhängen.
4. Wichtige Funktionen
A. Die Exponentialfunktion Wir kommen zurück zu den Funktionen,
die die Wachstumsgleichung
y 0 (t) = αy(t)
lösen. Wie man leicht sieht, ist eine jede solche Funktion beliebig
Poft diffen
renzierbar. Wenn wir für den Augenblick annehmen, dass y(t) = ∞
n=0 an t
in einer Umgebung des Nullpunkts durch ihre Taylorreihe dargestellt wird,
dann muss gelten
!0
∞
∞
∞
X
X
X
(n + 1)an+1 tn =
an tn = α
an tn
n=0
n=0
und daher
an+1 =
α
an
n+1
Wir schreiben
exp(αz) :=
n=0
oder
an = a0
∞
X
(αz)n
n=0
n!
αn
n!
.
Die Funktion z 7→ a0 exp(αz) ist dann für alle z ∈ C definiert und löst das
sogenannte Anfangswertproblem y 0 = αy, y(0) = a0 . Weiter unten werden
wir zeigen, dass diese Funktionen für a0 6= 0 nirgends verschwinden, und es
folgt aus dem Mittelwertsatz, dass diese Lösung die einzige ist, die es gibt.
Um die wichtigsten Eigenschaften dieser Funktionen herleiten zu können,
brauchen wir den folgenden Satz über das sogenannte Cauchy-Produkt von
Reihen.
P
P
Satz 26 Es seien n an und n bn absolut konvergente Reihen komplexer
Zahlen an und bn , n ∈ N0 . Dann gilt
! ∞ !
∞
∞ X
n
X
X
X
aν
bν =
an−ν bν ,
ν=0
ν=0
und auch die Reihe mit den Gliedern
n=0 ν=0
Pn
ν=0 an−ν bν
konvergiert absolut.
48
Mathematik für Physiker und Informatiker I (Kurzskript)
Diese Methode, die vielen Produkte der Summanden des Produkts zweier
Reihen aufzuschreiben ist nicht zuletzt deswegen besonders praktisch, da
sie genau der Ordnung der Terme nach dem Grad der Potenzen (z − z0 )n
entspricht.
Wir erhalten als Folgerung eine Reihe von wichtigen Eigenschaften der
Exponentialfunktionen:
Satz 27 Für die im komplexen definierte Funktion E(·) gilt
(a) Für alle z, w ∈ C ist
E(z + w) = E(z)E(w).
(b) E(z) 6= 0 für alle z ∈ C
(c) E(z) = E(z) für alle z ∈ C.
(d) Es ist
E(x) = lim
n→∞
und mit
1+
x n
,
n
∞
1 n X 1
e := E(1) = lim 1 +
=
n→∞
n
n!
n=0
erhält man
E(r) = er
für alle r ∈ Q.
Teil (a) ist eine gemeinsame Anwendung von Cauchy-Produkt und binomischer Formel:
∞ X
n
∞
n X
X
1
1 X n ν n−ν
ν n−ν
E(z)E(w) =
z w
=
z w
= E(z+w),
ν!(n − ν)!
n!
ν
n=0 ν=0
n=0
ν=0
Teil (b) folgt hieraus, da 1 = E(0) = E(z)E(−z) für alle z ∈ C, und
der Teil (c) ist eine Konsequenz der Tatsache, dass die Konjugation ein
sogenannter (stetiger) Körperautomorphismus von C ist, d.h. für alle z, w
gilt z + w = z + w, sowie z · w = z · w. Die erste Gleichung des Teils (d)
ergibt sich mit Hilfe der Regel von l’Hospitalr. Die für alle rationale Zahlen
r gültige Beziehung exp(r) = er ist jetzt leicht einzusehen.
C. Trigonometrische Funktionen Wir untersuchen zunächst weiterhing die komplexe Exponentialfunktion. Wir bezeichnen diese mit exp(z)
oder auch ez . Es gilt für alle x+iy ∈ C exp(x+iy) = exp(x) exp(iy), und hier
ist der Anteil exp(iy) unklar. Wir definieren zwei Funktionen A, B : R → R
durch
exp(iy) = A(y) + iB(y)
Werner, Universität Münster, WS 05/06
49
Da die Potenzen von i durch die Folge 1, i, −1, −i, 1, i, . . . gegeben sind,
entnimmt man der Potenzreihe von exp
A(y) =
∞
X
(−1)n
n=0
y 2n
(2n)!
sowie
B(y) =
∞
X
(−1)n
n=0
y 2n+1
(2n + 1)!
und daraus
A0 (y) = −B(y)
und
B 0 (y) = A(y).
Aufgrund des Teils (c) des letzten Satzes ist stets | exp(iy)| = 1 und wir
wollen versuchen zu klären, was die geometrische Bedeutung der Zahl y ist.
Wir stellen uns dazu die Abbildung t 7→ exp(it) als die Darstellung eines
Punktes P vor, dass sich auf dem Einheitskreis in der Ebene bewegt und zum
Zeitpunkt t sich im Punkt exp(it) befindet. Der Betrag der Geschwindigkeit,
mit dem P vorankommt13 , ist wegen exp0 (it) = i exp(it) konstant gleicht
1, so dass P den Einheitskreis stets mit demselben Drehsinn durchläuft
(wäre dies nicht so, so müsste die Geschwindigkeit an einem “Umkehrpunkt”
verschwinden). Nun erkennt man leicht aus den Potenzreihen, dass A(y) und
B(y) für y ∈ (0, 1] strikt positiv sind. Daher fällt A in diesem Bereich, und B
steigt monoton: Die Bewegung von P erfolgt als entgegen dem Uhrzeigersinn.
Die Strecke, die P beginnend bei 0 bis zum Zeitpunkt t zurückgelegt hat,
ist
Geschwindigkeit × Zeit = 1 × t = t.
Damit befindet sich der Punkt exp(it) also am Ende eines gegen den Uhrzeigersinn abgetragenen Bogens der Länge t. Anders ausgedrückt: t ist der
Winkel (gemessen im Bogenmaß) den der Vektor exp(it) mit der reellen
Achse einschließt. Es stellt sich heraus, dass die Funktionen A und B genau
die aus der Schule bekannten trigonometrischen Funktionen sind, und wir
können nach einer rein formalen Umbenennung schreiben für alle x, y ∈ R
exp(x + iy) = exp(x)(cos y + i sin y),
An dieser Stelle wird klar, weshalb es günstig ist, die Winkelfunktionen
auf das Bogenmaß zu beziehen. Wir erhalten jetzt: Zunächst die nicht unverdient populäre Gleichung eiπ = −1, sodann einen einfachen Beweis der
trigonometrischen Additionstheoreme, die sich für alle x, y ∈ R aus
cos(x + y) + i sin(x + y) = exp(i(x + y)) = exp(ix) exp(iy) =
= cos(x) cos(y) − sin(x) sin(y) + i (cos(x) sin(y) + cos(y) sin(x))
ergeben und schließlich eine neue Darstellung für die Polarkoordinaten: Für
jede komplexe Zahl gilt
z = (|z|, ϕ) = |z|eiϕ .
13
An dieser Stelle greifen wir ein wenig vor; denn der Pfad, um den es hier geht, ist eine
Funktion R → R2 , deren Ableitungen wir noch nicht behandelt haben
50
Mathematik für Physiker und Informatiker I (Kurzskript)
D. Die Umkehrfunktionen Die letzte Ausbaustufe unserer Betrachtungen zur Stetigkeit der Wurzelfunktion liefert der nachfolgende Satz. Er besagt, dass alle expliziten Rechnungen überflüssig waren, und die Stetigkeit
der Wurzelfunktion bereits aus der der Abblidung x 7→ x2 folgt, die ja sehr
viel einfacher zu erhalten ist. Sein Beweis benutzt ganz wesentlich den Satz
15.
Satz 28 Ist f : [a, b] → R eine monoton wachsende Funktion, so bildet f
das Intervall [a, b] bijektiv auf das Intervall [f (a), f (b)] ab, und die Umkehrfunktion
f −1 : [f (a), f (b)] → [a, b]
ist stetig. Analoge Aussagen gelten für monoton fallende Funktionen.
Die Tatsache, dass f injektiv ist, folgt aus dem monotonen Wachstum, die
Surjektivität ist eine Konsequenz des Zwischenwertsatzes. Um die Stetigkeit der Umkehrfunktion nachzuweisen, beginnt man mit einem Punkt y0 ∈
[f (a), f (b)] sowie einer gegen y0 konvergenten Folge (yn ) aus [f (a), f (b)].
Falls (im Gegensatz zu dem, was wir eigentlich zeigen müssten) f −1 (yn )
nicht gegen f −1 (y0 ) konvergiert, gibt es eine Teilfolge (ynk ) sowie eine Zahl
ε0 > 0, so dass für alle k ∈ N gilt |f −1 (ynk ) − f −1 (y0 )| ≥ ε0 . Da [a, b] kompakt ist, können wir sogar annehmen, dass f −1 (ynk ) eine konvergente Folge
ist, deren Grenzwert wir x0 nennen — unter Umständen müssen wir halt zu
einer weiteren Teilfolge übergehen, die wir hier aber der Einfachheit halber
auch f −1 (ynk ) nennen. Es folgt dann einerseits |x0 − f −1 (y0 )| ≥ ε0 , auf der
anderen Seite aber ist wegen der Stetigkeit von f zugleich
y0 = lim ynk = lim f (f −1 (ynk )) = f (x0 )
k→∞
k→∞
woraus sich der Widerspruch f −1 (y0 ) = x0 ergibt.
Dieser Satz lässt sich recht leicht auf den Fall von monoton wachsenden
(fallenden) Funktionen auf Intervallen [a, ∞) bzw. (−∞, b] ausdehnen: Ist
z.B. f : [a, ∞) stetig und monoton, dann besitzt für jedes n ∈ N nach Satz 16
die Einschränkung f |[a,a+n] : [a, b] → R, x 7→ f (x) eine (insbesondere) am
Punkt y0 stetige Inverse
f |[a,a+n] −1 = f −1 |[f (a),f (a+n)] : [f (a), f (a + n)] → [a, a + n].
Was noch zu zeigen bleibt, ist, dass aus der Stetigkeit der Einschränkung an
einem Punkt y0 die der ursprünglichen Abbildung an derselben Stelle folgt.
Dies aber ist eine Konsequenz der Tatsache, dass jede Folge in f (D), die
gegen y0 konvergiert, von einem Index N0 an in dem Intervall [f (a), f (a+n)]
enthalten ist.
Eine Konsequenz dieser Überlegung: Die Wurzelfunktionen f : R+
0 → R,
√
x 7→ n x sind für jedes n ∈ N stetig. Im Reellen besitzen die Funktionen ex ,
Werner, Universität Münster, WS 05/06
51
sin x, cos x, tan x = sin x(cos x)−1 für entsprechend eingeschränkte Definitionsbereiche die Umkehrfunktionen
h π πi
ln x : R+ → R,
arcsin x : [−1, 1] → − ,
,
2 2π π arccos x : [−1, 1] → [0, π],
arctan x : R → − ,
,
2 2
deren Existenz, Stetigkeit und Differenzierbarkeit alle entsprechenden Monotonieaussagen und den Sätzen 16 und 18(ii) folgt. Für die Ableitungen
erhält man
(ln x)0 =
1
,
x
(arcsin x)0 = √
1
(arccos x)0 = − √
,
1 − x2
1
,
1 − x2
(arctan x)0 =
1
.
1 + x2
Die Talorreihen aller dieser Ableitungen lassen sich auf die binomische Reihe
zurückführen. Wenn man noch den Wert a0 = f (x0 ) hinzunimmt so, lässt
sich aus den Taylorreihen für die Ableitungen diejenigen der Umkehrfunktionen selbst ermitteln. Man erhält
∞
∞ n+1
X
X
−1/2 x2n+1
n (x − 1)
ln x =
(−1)
,
arcsin x =
,
n+1
n
2n + 1
n=0
n=0
2n+1
∞ ∞
X
X
π
−1/2 x
x2n+1
arcosh x = −
,
arctan x =
(−1)n
,
2
n
2n + 1
2n + 1
n=0
n=0
jeweils für |x| < 1 bzw. (für ln) |x − 1| < 1. Bemerkenswert an diesen
Potenzreihen ist, dass unter ihnen für bestimmte x-Werte alte Bekannte
auftreten. Unglücklicherweise scheinen die interessanten Reihen aber immer
gerade für x-Werte auf dem Rand des Konvergenzbereichs aufzutreten. Das
folgende Ergebnis erlaubt es, den Wert dieser Reihen auch an diesen Stellen
zu berechnen.
P∞
Satz 29 Es besitze die Potenzreihe f (x) =
P∞ n=0 einen Konvergenzradius,
der größer oder gleich 1 ist. Falls f (1) := n=0 an konvergiert, so gilt
f (1) = lim f (x).
x→1
Dieses Resultat ist auch als der Abelsche
P Grenzwertsatz bekannt. Der Beweis
gründet sich auf den Einfall, rn = ∞
ν=n+1 aν für n ≥ −1 zu setzen, womit
man dann schreiben kann
f (1) − f (x) = (1 − x)
∞
X
rn−1 xn
n=0
P
n
(aus dieser Beziehung ergibt sich auch im Grenzübergang, dass ∞
n=0 rn−1 x
für x ∈ [−1, 1] konvergiert.) Die Reihe lässt sich günstig zerlegen: Falls
Herunterladen