Skriptum Mathematik 1

Werbung
Skriptum zur Vorlesung
n
P
1
n→∞ ν=1 ν(ν + 1)
Mathematik 1 = lim
Dipl.-Ing. Dr. techn. Friedrich Hanser1
www.umit.at
Carl Friedrich Gauß (1777—1855)
Erstellt mit LATEX 2ε
Letztes Update: 19/10/09
1 Email:
[email protected]
Bemerkungen zum Gebrauch dieses Skriptums
Dieses Skriptum stellt den Lehrstoff aus Mathematik 1 in einer komprimierten, mathematischen Form dar. Aus
diesem Grund ist es zum Selbststudium absolut ungeeignet. Es kann nur in Verbindung mit einer Vorlesung,
in der die mathematischen Sachverhalte erklärt, diskutiert und mit Beispielen erläutert werden, seinen Zweck
erfüllen.
Das vorliegende Skriptum zielt darauf ab, Sie an die zugegebenermaßen gewöhnungsbedürftige Sprache der
Mathematik heranzuführen. Idealerweise soll das Skriptum im Anschluss an die Vorlesung zum mathematischen
Nachlesen und zur Vertiefung verwendet werden.
Das Skriptum folgt in Notation und Aufbau der Serie Analysis I-III, Eine integrierte Darstellung“
”
von Kurt Endl und Wolfgang Luh.
Hall i. Tirol, im WS 2009/2010
Friedrich Hanser
Inhaltsverzeichnis
1 Grundlagen
1
1.1
Aussagenlogik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1
1.2
Mengen, Mengenoperationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
1.3
Vollständige Induktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6
1.4
Abbildungen, Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7
2 Geordnete Körper
11
2.1
Körper und Metrische Räume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.2
Folgen und Reihen in geordneten Körpern . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.3
Cauchy-Folgen in geordneten Körpern . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.4
Relationen, Klasseneinteilungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.5
Die Konstruktion der reellen Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.6
Der Hauptsatz über monotone Folgen und die Zahl e . . . . . . . . . . . . . . . . . . . . . . . . . 20
3 Der Körper der komplexen Zahlen C
23
3.1
Der Körper der komplexen Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
3.2
Die Einbettung von R in C . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
3.3
C als 2-dimensionaler Vektorraum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
3.4
Konjugiert komplexe Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
3.5
Polarkoordinatendarstellung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
3.6
Potenzen und Wurzeln komplexer Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
4 Abstrakte Räume
31
4.1
Vektorraum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
4.2
Metrischer Raum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
4.3
Der normierte Raum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
4.4
Der unitäre Raum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
4.5
Banach- und Hilberträume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
5 Differentialrechnung
37
5.1
Das Tangentenproblem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
5.2
Definition und Eigenschaften der Ableitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
5.3
Ableitungsregeln, Kettenregel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
5.4
Der Satz von Rolle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
5.5
Der 1. Mittelwertsatz der Differentialrechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
5.6
Die Regeln von de l’Hospital
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
6 Integralrechnung
43
6.1
Die Idee des Riemannschen Integrals . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
6.2
Untere und obere Darboux-Integrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
6.3
Das Riemannsche Integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
6.4
Riemannsche Summen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
6.5
Der Hauptsatz der Differential- und Integralrechnung . . . . . . . . . . . . . . . . . . . . . . . . . 48
6.6
Die Mittelwertsätze der Integralrechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
6.7
Der Taylorsche Satz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
7 Unendliche Reihen
55
7.1
Beispiele unendlicher Reihen
7.2
Rechenregeln für unendlicher Reihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
7.3
Das Cauchysche Kriterium für Reihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
7.4
Absolute Konvergenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
7.5
Vergleichskriterium . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
7.6
Reihen mit nichtnegativen Gliedern . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
7.7
Das Wurzel- und das Quotientenkriterium . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
A Spezielle Folgen und Reihen
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
63
A.1 Die Fibonacci Folge . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
1
Grundlagen
Dieses Kapitel soll in die Sprache und Denkweise der Mathematik einführen. Zu diesem Zweck werden wir uns
mit grundlegenden Dingen wie Logik, Mengen, Relationen, Funktionen, Abbildungen, sowie Folgen und Reihen
etwas eingehender beschäftigen.
1.1
Aussagenlogik
In diesem Abschnitt werden wir definieren was man unter einer Aussage im logischen Sinne versteht, und wie
Aussagen miteinander verknüpft werden können.
Definition 1.1.1 [Aussage]: Eine Aussage ist ein Satz einer menschlichen oder künstlichen Sprache, dem
einer der beiden Wahrheitswerte wahr (w) oder falsch (f ) zugeordnet werden kann.
Beispiel: Der Nil mündet in das Mittelmeer“, 20 ist durch 5 teilbar“ und Die Florida Keys gehören nicht zu
”
”
”
den Tropen“ sind Aussagen, die alle den Wahrheitswert w haben. Wann bist du geboren?“ ist natürlich
”
keine Aussage.
Nachdem man mit einer Aussage alleine noch nicht viel anfangen kann, definieren wir Operationen, mit deren
Hilfe neue Aussagen produziert werden können.
Definition 1.1.2 [Negation]: Die Negation einer Aussage p, für die man das Symbol ¬p oder p̄ verwendet,
hat den Wahrheitswert falsch, wenn p selbst wahr ist, und umgekehrt.
Verknüpft man Aussagen mit “und”, “oder” und “entweder oder,” gelangt man zwangsläufig zu folgender
Definition:
Definition 1.1.3 [Konjunktion, Disjunktion, Exklusiv Oder]:
(1) Die Verknüpfung der Aussagen p und q durch das logische “und” nennt man Konjunktion und man
schreibt p ∧ q. Sie ist nur dann wahr, wenn p und q beide wahr sind.
(2) Die Verknüpfung der Aussagen p und q durch das logische “oder” nennt man Disjunktion und man
schreibt p ∨ q. Sie ist wahr, wenn entweder p oder q wahr ist, oder wenn beide wahr sind. Sonst ist
sie falsch.
(3) Die Verknüpfung “entweder . . . oder” ist nur wahr, wenn genau eines der beiden Argumente wahr
ist. Man nennt diesen logischen Operator “exklusives Oder” oder “xor.”
Obige Definitionen faßt man üblicherweise kurz und bündig in einer Wahrheitstafel, wie in Tabelle 1.1 dargestellt, zusammen. Man könnte sich jetzt fragen wie viel verschiedene Verknüpfungen von zwei logischen Variablen
überhaupt existieren. Bisher haben wir die drei Verknüpfungen Konjunktion, Disjunktion und Exklusiv Oder
mit den Wahrheitsverläufen (f, f, f, w), (f, w, w, w) und (f, w, w, f ) kennengelernt. Insgesamt gibt es laut Kombinatorik 24 = 16 (geordnete Stichprobe mit Zurücklegen) verschiedene Möglichkeiten für die Verknüpfung von
Tabelle 1.1: Wahrheitstafel einiger logischer Verknüpfungen wie Konjunktion, Disjunktion, Exklusiv Oder, Implikation und Äquivalenz. Die Variablen p und q sind die unabhängigen Aussagenvariablen.
p
f
f
w
w
q
f
w
f
w
p̄
w
w
f
f
q̄
w
f
w
f
Konj.
Disj.
Excl. O.
Impl.
Äqui.
NAND
NOR
p∧q
f
f
f
w
p∨q
f
w
w
w
p xor q
f
w
w
f
p⇒q
w
w
f
w
p⇔q
w
f
f
w
p|q
w
w
w
f
p↓q
w
f
f
f
q̄ ⇒ p̄
w
w
f
w
q⇒p
w
f
w
w
zwei logischen Variablen. Eine solche Verknüpfung definiert einen (binären) Operator zwischen zwei logischen
Variablen.
Ein sehr wichtiges Konstruktionsprinzip der Mathematik besteht darin, ausgehend von wahren Aussagen neue
wahre Aussagen abzuleiten. Diese Schlussfolgerungen werden als Wenn . . . , dann . . .“– Sätze formuliert. In der
”
mathematischen Logik entspricht dies dem Wahrheitsverlauf (w, w, f, w).
Definition 1.1.4 [Implikation]: Verknüpft man zwei Aussagen p und q durch Wenn p, dann q,“ dann
”
nennt man den Ausdruck logische Folgerung oder Implikation. Man bezeichnet p als die Voraussetzung
und q als die Behauptung der Implikation und schreibt p ⇒ q. Die Wahrheitswerte der Implikation sind
durch die Wahrheitstafel in Tabelle 1.1 festgelegt. Alternative Ausdrucksweisen für p ⇒ q sind Aus p
”
folgt q,“ p impliziert q,“ p ist eine hinreichende Bedingung für q,“ oder q ist eine notwendige
”
”
”
Bedingung für p.“
Die Wahrheitstafel in Tabelle 1.1 sagt aus, dass die Implikation nur falsch ist, wenn aus einer wahren Voraussetzung eine falsche Behauptung folgt.
Beispiel:
(1) Die Aussage Wenn morgen Schnee fällt, werden wir Ski fahren“ ist nur dann falsch, wenn morgen Schnee
”
fällt und wir trotzdem nicht Ski fahren.
(2) Die Implikation 1 < 2 ⇒ −1 < −2 “ ist falsch, da zwar die Voraussetzung, nicht jedoch die Behauptung
”
wahr ist.
(3) 16 ist durch 2 teilbar ⇒ 16 ist eine gerade Zahl“ ist eine wahre Implikation.
”
d
f (x)|x=x0 = 0 ist eine wahre
(4) Die Funktion f (x) hat an der Stelle x = x0 ein lokales Maximum ⇒ dx
d
Implikation. Die Umkehrung gilt nicht. Ist dx f (x)|x=x0 = 0 so folgt noch lange nicht, dass die Funktion
an dieser Stelle ein Maximum besitzt. Man kann aber folgendes sagen: das Verschwinden der ersten
Ableitung ist eine notwendige Bedingung für die Existenz eines Extremums.
Eine weitere wichtige Verknüpfung ist die der logischen Äquivalenz und durch folgende Definition gegeben:
Definition 1.1.5 [Äquivalenz]: Verknüpft man zwei Aussagen p und q durch p genau dann, wenn q,“
”
dann nennt man den Ausdruck logische Äquivalenz und schreibt p ⇔ q. Die Wahrheitswerte der Äquivalenz sind durch die Wahrheitstafel in Tabelle 1.1 festgelegt. Alternative Ausdrucksweisen für p ⇔ q
sind p dann und nur dann, wenn q“ oder p ist notwendig und hinreichend für q.“
”
”
Die nächsten beiden Operatoren haben in der Mathematik keine Bedeutung, spielen jedoch beim Schaltungsentwurf eine äußerst wichtige Rolle. Deshalb, und aus Gründen einer gewissen Vollständigkeit, seien sie hier
angeführt.
Definition 1.1.6 [NAND, NOR]:
(1) Den logischen Operator mit dem Wahrheitsverlauf (w, w, w, f ) nennt man Sheffer-Operator oder
NAND und man schreibt p | q.
(2) Den logischen Operator mit dem Wahrheitsverlauf (w, f, f, f ) nennt man Peirce-Operator oder
NOR und man schreibt p ↓ q
Logische Ausdrücke, die für alle Kombinationen der logischen Variablen immer den selben Wahrheitswert liefern,
erhalten einen Namen.
Definition 1.1.7 [Tautologie, Widerspruch]: Man nennt einen logischen Ausdruck eine Tautologie (einen
Widerspruch), wenn sich für alle Kombinationen der logischen Variablen immer der Wahrheitswert wahr
(falsch) ergibt.
Beispiel:
(1) Die Äquivalenz p ⇒ q ⇔ q̄ ⇒ p̄ ist laut Wahrheitstafel 1.1 eine Tautologie. Auf ihr beruht das Beweisverfahren der Kontraposition. Man spricht auch von einem indirektem Beweis.
(2) Der Ausdruck p ∨ p̄ ist eine Tautologie.
(3) Der Ausdruck p ∧ p̄ ist ein Widerspruch.
Natürlich gibt es beim Rechnen mit logischen Ausdrücken jede Menge Regeln die eine typische mathematische
Struktur widerspiegeln.
Satz 1.1.1: Für beliebige logische Ausdrücke p, q und r gelten folgende Rechenregeln:
(1)
Kommutativgesetz:
Assoziativgesetz:
Distributivgesetz:
(2)
p=p
(3)
f ∧p=f
p∧q =q∧p
(p ∧ q) ∧ r = p ∧ (q ∧ r)
p ∧ (q ∨ r) = (p ∧ q) ∨ (p ∧ r)
p∨p=w
(4) De Morgan’sche Regeln:
w∧p=p
p∧p=f
p∧q =p∨q
p∨q =q∨p
(p ∨ q) ∨ r = p ∨ (q ∨ r)
p ∨ (q ∧ r) = (p ∨ q) ∧ (p ∨ r)
f ∨p=p
w∨p = w
p∨q =p∧q
Damit verlassen wir das Gebiet der Logik, um in die wahre Mathematik einzutauchen.
1.2
Mengen, Mengenoperationen
In diesem Abschnitt sollen die Grundbegriffe der Mengentheorie bereitgestellt werden. Dabei benützen wir den
Mengenbegriff, wie er von Georg Cantor geprägt wurde.
Definition 1.2.1 [Menge]: Eine Menge M ist eine Zusammenfassung von wohlbestimmten und wohlunterschiedenen Objekten unserer Anschauung oder unseres Denkens, welche die Elemente von M genannt
werden, zu einem Ganzen.
Die Mengenlehre basierend auf dieser Definition wird als naive Mengenlehre bezeichent. Sie führt zu Widersprüchen, insbesondere dann, wenn Mengen eingeführt werden, die sich selbst als Element enthalten. Am bekanntesten ist die Russelsche Antinomie. Der Barbier von Sevillia, der alle Männer rasiert, die sich selbst nicht
rasieren, ist eine bekannte Formulierung dieses Sachverhaltes. Dennoch werden wir an diesem Mengenbegriff
festhalten.
Im weiteren führen wir folgende Bezeichnungen und Sprechweisen ein:
Definition 1.2.2:
(1) x ∈ M bzw. x ∈
/ M bedeutet: x ist bzw. ist nicht Element von M.
(2) M = {x1 , x2 , x3 , . . .} bedeutet: M ist die Menge, die aus den Elementen x1 , x2 , x3 usw. besteht
(aufzählende Charakterisierung der Menge M ).
(3) M = {x : x hat die Eigenschaft E} bedeutet: M ist die Menge aller Elemente x, die die Eigenschaft E besitzen (beschreibende Charakterisierung der Menge M ).
Die Gleichheit von Mengen wird erwartungsgemäß wie folgt definiert:
Definition 1.2.3 [Gleichheit von Mengen]: Zwei Mengen M1 und M2 heißen gleich, wenn sie dieselben
Elemente enthalten. Man schreibt dann M1 = M2 .
Die Definition der Teilmengenbeziehung gestaltet sich folgendermaßen:
Definition 1.2.4 [Inklusion]: Es seien M1 und M2 Mengen.
(1) M1 heißt enthalten in M2 oder Teilmenge von M2 , wenn jedes Element von M1 auch Element von
M2 ist. Wir schreiben dann M1 ⊂ M2 .
(2) M1 heißt echte Teilmenge von M2 , wenn M1 ⊂ M2 , aber M1 6= M2 .
(3) Ist M1 keine Teilmenge von M2 , so schreibt man M1 6⊂ M2 .
Bemerkung: Zur besseren Unterscheidung von Teilmenge und echter Teilmenge bedient man sich auch der
Symbole ⊆ und ⊂ .
Beziehungen zwischen Mengen untereinander können graphisch mit Hilfe sog. Venn-Diagramme veranschaulicht
werden wie Abb. 1.1 zeigt. Hierbei werden Mengen als Teilmengen der Zeichenebene dargestellt.
M1
M2
M1
M2
M1 ⊂ M2
M1 6⊂ M2
Abbildung 1.1: Teilmengenbeziehungen veranschaulicht mit sog. Venn-Diagrammen.
Als elementare Eigenschaften der Inklusion führen wir an:
Satz 1.2.1:
(1) Für jede Menge M gilt M ⊂ M ( Reflexivität“).
”
(2) Es seine M1 , M2 , M3 drei Mengen mit M1 ⊂ M2 und M2 ⊂ M3 .
Dann gilt M1 ⊂ M3 ( Tansitivität“).
”
(3) Es seien M1 und M2 zwei Mengen.
Genau dann ist M1 = M2 , wenn gilt M1 ⊂ M2 und M2 ⊂ M1 .
Bemerkung: Obiger Satz gestattet die Gleichheit zweier Mengen zu beweisen, indem man zeigt, dass jede in
der anderen enthalten ist.
Die grundlegenden Mengenoperationen sind folgendermaßen definiert:
Definition 1.2.5 [Vereinigung, Durchschnitt]: Es seien M1 und M2 beliebige Mengen.
(1) Die Vereinigung von M1 und M2 ist
(2) Der Durchschnitt von M1 und M2 ist
M1 ∪ M2 = {x : x ∈ M1
M1 ∩ M2 = {x : x ∈ M1
oder x ∈ M2 }.
und
x ∈ M2 } .
Definition 1.2.6 [Differenz, Komplement]: Es seien M1 und M2 beliebige Mengen.
(1) Die Differenz von M1 und M2 , geschrieben in der Form M1 \M2 , ist die Menge derjenigen Elemente,
die zu M1 , aber nicht zu M2 gehören:
M1 \ M2 = {x : x ∈ M1 und x ∈
/ M2 } .
(2) Ist M2 ⊂ M1 , so wird die Menge M1 \ M2 auch als Komplement von M2 bezüglich M1 bezeichnet.
Man schreibt dann CM1 (M2 ) oder kurz M2 .
Abbildung 1.2 zeigt eine grafische Darstellung obiger Definition. Es bleibt noch zu klären was passiert, wenn
eine Menge kein einziges Element enthält. Dazu führt man folgenden Begriff ein:
Definition 1.2.7 [Leere Menge]: Die leere Menge ∅ oder {} ist die Menge, die kein Element enthält.
Beim Rechnen mit Mengen gelten die (fast schon) üblichen“ Regeln (vergleiche insbesondere mit den Logikge”
setzen):
M1
M2
M1
M2
M1 \ M2
CM1 (M2 )
Abbildung 1.2: Differenzmenge von M1 und M2 (links) bzw. Komplement von M2 bezüglich M1 (rechts).
Satz 1.2.2: Für beliebige Mengen M1 , M2 und M3 gelten folgende Rechenregeln:
M1 ∪ M2 = M2 ∪ M1
(1)
(M1 ∪ M2 ) ∪ M3 = M1 ∪ (M2 ∪ M3 )
M1 ∩ (M2 ∪ M3 ) = (M1 ∩ M2 ) ∪ (M1 ∩ M3 )
(2) Absorptionsgesetze:
(3)
M1 ⊂ M2
⇔
M1 ∩ (M1 ∪ M2 ) = M1
M1 ∪ M2 = M2
(4) De Morgan’sche Regeln: für M1 , M2 ⊂ M
CM (M1 ∪ M2 ) = CM (M1 ) ∩ CM (M2 )
M1 ∩ M2 = M2 ∩ M1
(M1 ∩ M2 ) ∩ M3 = M1 ∩ (M2 ∩ M3 )
M1 ∪ (M2 ∩ M3 ) = (M1 ∪ M2 ) ∩ (M1 ∪ M3 )
M1 ∪ (M1 ∩ M2 ) = M1
⇔
M1 ∩ M2 = M1
CM (M1 ∩ M2 ) = CM (M1 ) ∪ CM (M2 )
Eine grafische Darstellung der de Morgan’schen Regeln zeigt Abb. 1.3.
CM (M1 ∪ M2 )
M1
CM (M1 )
M2
CM (M2 )
M2
M1
M
M
M
CM (M1 ∩ M2 )
Abbildung 1.3: Visualisierung der Regeln von de Morgan.
In der Praxis ist es natürlich erforderlich Mengenoperationen mit mehr als zwei Mengen durchzuführen. Dazu
betrachtet man ein beliebiges System F von Mengen, man spricht auch von einer Familie von Mengen, und
meint damit eine Menge deren Elemente wieder Mengen sind. Vereinigung und Durchschnitt kann wie folgt auf
ein Mengensystem erweitert werden:
Definition 1.2.8 [Mengensystem: Vereinigung, Durchschnitt]: Es sei F ein System von Mengen.
(1) Die Vereinigung der Mengen, die zu F gehören, ist:
S
M = {x : x ∈ M für mindestens ein M in F }.
M∈F
(2) Der Durchschnitt der Mengen, die zu F gehören, ist:
T
M = {x : x ∈ M für alle M in F }.
M∈F
Bemerkung: In der Praxis wird ein System F von Mengen oft dadurch gewonnen, dass man jedem Element α
einer sog. Indexmenge A eine Menge Mα zuordnet. Man schreibt dann F = {Mα : α ∈ A} = {Mα }α∈A .
Beispiel: Es sei A
S= (0, ∞) ⊂ R eine
T Indexmenge und Mα = (−α, α) für α ∈ A bilde eine System von Mengen.
Dann gilt:
Mα = R und
Mα = {0}
α∈A
α∈A
Beispiel: Die Mengenfamilie Mr = {z ∈S
C : |z| = r, r ∈ [0, ∞)} bildet ein disjunktes System von Mengen. Es
′
Mr = C.
gilt Mr ∩ Mr′ = ∅ für r 6= r und
r∈[0,∞)
Eine Familie von Mengen bildet auch die sog. Potenzmenge deren Existenz nicht verschwiegen werden soll:
Definition 1.2.9 [Potenzmenge]: Als Potenzmenge bezeichnet man die Menge aller Teilmengen einer
Grundmenge X. Man schreibt hierfür P(X), Π(X), 2X , oder P ot(X).
P(X) = {U : U ⊂ X}
Im weiteren ist das kartesische Produkt zweier und mehrerer Mengen von Bedeutung:
Definition 1.2.10 [Kartesisches Produkt von Mengen]:
(1) Die Menge aller geordneten Paare (a, b) (auch Tupel) zweier Mengen A und B wird kartesiches
Produkt von A und B genannt und als A × B geschrieben und A kreuz B gelesen:
”
A × B = {(a, b) : a ∈ A und b ∈ B}.
(2) Das kartesische Produkt der Mengen A1 , A2 , . . . , An ist die Menge aller n-Tupel mit
A1 × A2 × . . . × An = {(a1 , a2 , . . . , an ) : a1 ∈ A1 , a2 ∈ A2 , . . . , an ∈ An }.
Beispiel: R × R = R2 , R3 , Rn , Cn , [2, 3] × [−3, 6]
Damit haben wir die wichtigsten Begriffe der Mengenlehre kennen gelernt.
1.3
Vollständige Induktion
Zum Beweis von Aussagen A(n), die von natürlichen Zahlen n ∈ N abhängen, dient das Prinzip der
vollständigen Induktion:
Satz 1.3.1 [Vollständige Induktion]: Es sei A(n) eine Aussage, welche von den natürlichen Zahlen n ∈ N
abhängig ist.
(1) Induktionsanfang: Es sei A(n0 ) richtig für die natürliche Zahl n0 ∈ N.
(2) Induktionsschluss: Aus der Richtigkeit von A(n) für eine natürliche Zahl n ≥ n0 folgt stets die
Richtigkeit von A(n + 1). Man muss also die Implikation A(n) ⇒ A(n + 1) zeigen.
Dann folgt hieraus, dass die Aussage A(n) für alle natürlichen Zahlen n ≥ n0 richtig ist.
Beispiel: Für jede natürliche Zahl n ∈ N gilt:
Induktionsanfang:
Induktionsschluss:
n+1
P
k=1
k=
n
P
k + (n + 1)
k=1
A(1) :
A(n) :
1
P
1(1 + 1)
1=
k=
=1
2
k=1
A(n) ⇒ A(n + 1)
A(n)sei
richtig
=
1 + 2 + . . . + (n − 1) + n =
für
n
P
k=1
k=
n(n + 1)
2
Behauptung richtig für n = 1
n≥1
n(n + 1)
(n + 1)(n + 2)
+ (n + 1) =
2
2
Aus der Richtigkeit von A(n) folgt also stets die Richtigkeit von A(n + 1).
Beispiel: Für jede natürliche Zahl n ≥ 4 gilt:
Induktionsanfang:
Induktionsschluss:
2n+1 = 2 · 2n
A(n)sei
richtig
≥
A(4) :
A(n) :
24 = 16 ≥ 16 = 42
2 n ≥ n2
Behauptung richtig für n = 4
A(n) ⇒ A(n + 1) :
2n2 = n2 + n2
(n≥4)
≥
n2 + 4n = n2 + 2n + 2n
(2n≥1)
≥
n2 + 2n + 1 = (n + 1)2
Aus der Richtigkeit von A(n) folgt also stets die Richtigkeit von A(n + 1).
Beispiel: Es sei x ∈ R, mit x > −1 und x 6= 0. Dann gilt für jede natürliche Zahl n ≥ 2:
A(n) :
(1 + x)n > 1 + n · x
Induktionsanfang:
Induktionsschluss:
A(2) :
(Bernoullische Ungleichung)
(1 + x)2 = 1 + 2x + x2
A(n) ⇒ A(n + 1) :
(x2 >0)
>
1 + 2x
Richtig für n = 2
n+1
(1 + x)
n
= (1 + x) (1 + x)
A(n)sei
richtig
>
(1 + nx)(1 + x) = 1 + (n + 1)x + nx2
(nx2 >0)
>
1 + (n + 1)x
Aus der Richtigkeit von A(n) folgt also stets die Richtigkeit von A(n + 1).
Das Arbeiten mit dem Prinzip der vollständigen Induktion wird in der Vorlesung und in den Übungen sehr
ausführlich anhand zahlreicher Beispiele erläutert.
1.4
Abbildungen, Funktionen
Neben dem Begriff der Menge ist für die moderne Mathematik der Begriff der Abbildung oder Funktion von
zentraler Bedeutung.
Definition 1.4.1 [Abbildung, Funktion]: Es seien A und B Mengen.
(1) Eine Vorschrift f , welche jedem x einer Teilmenge D(f ) ⊂ A eindeutig ein Element y = f (x) ∈ B
zuordnet, heißt eine Abbildung oder Funktion aus A in B. Man schreibt f : A −→ B und x 7−→ f (x).
Die Menge D(f ) wird als Definitionsmenge von f bezeichnet.
(2) Eine Abbildung (Funktion) f : A −→ B heißt Abbildung von A in B, wenn D(f ) = A gilt.
(3) Die Menge B(f ) = {y : y = f (x) für ein x ∈ D(f )} heißt Bildmenge oder Wertebereich der
Funktion f .
(4) Ist M ⊂ D(f ), so heißt f (M ) = {y : y = f (x) für ein x ∈ M } das Bild von M unter f .
(5) Zwei Funktionen f : A −→ B und g : A −→ B heißen gleich, wenn D(f ) = D(g) ist und f (x) = g(x)
für alle x ∈ D(f ) gilt.
Bemerkung: f : A −→ B impliziert also nicht, dass f auf ganz A definiert sein muß! Es bedeutet nur, dass f
für gewisse Elemente x aus A definiert ist und die Bilder f (x) Elemente von B sind, wie Abb. 1.4 zeigt.
f
X
z
X
D(f )
A
x b
B(f )
: b y = f (x)
B
Abbildung 1.4: Grafische Visualisierung einer Abbildung oder Funktion f aus der Menge A in die Menge B.
Beispiel:
(1) f : R −→ R, x 7−→ f (x) = 2, D(f ) = R, B(f ) = {2}
n
1 , D(a) = N, B(a) = {1, 9 , 64 , 625 , 7776 , . . .}
(2) a : N −→ Q, n 7−→ a(n) = 1 + n
4 27 256 3125
(3) f : R −→ R, x 7−→ f (x) = x2 , D(f ) = R, B(f ) = [0, ∞)

 −1 : x < 0
0 : x = 0 , D(f ) = R, B(f ) = {−1, 0, 1}
(4) f : R −→ R, x 7−→ f (x) =

1 : x>1
1
, D(f ) = R, B(f ) = (0, 1]
(5) f : R −→ R, x 7−→ f (x) =
1 + x2
1 , D(f ) = R \ {0} = C ({0}), B(f ) = (−∞, 0) ∪ (0, ∞) = R \ {0}
(6) f : R −→ R, x 7−→ f (x) = x
R
π ] −→ [−1, 1], x 7−→ f (x) = sin(x), D(f ) = [− π , π ], B(f ) = [−1, 1]
(7) f : [− π
,
2 2
2 2
Die Verknüpfung, Verkettung, oder Hintereinanderausführung von Abbildungen ist folgendermaßen definiert:
Definition 1.4.2 [Verknüpfung von Abbildungen]: Gegeben seien die Mengen A, B und C sowie die
Abbildungen f : A −→ B und g : B −→ C mit B(f ) ⊂ D(g).
Die Abbildung g ◦ f : A −→ C, welche durch
D(g ◦ f ) = D(f ), (g ◦ f )(x) = g(f (x)) definiert ist, heißt Verknüpfung von f und g.
g
H
j
H
f
A
@
R
@
D(g)
D(f )
C
B(f )
B
B(g)
X
zb
X
y = f (x)
x b
@
R b z = g(y) = g(f (x))
@
g◦f
:
Abbildung 1.5: Die Hintereinanderausführung der Abbildungen f : A −→ B, x 7−→ y = f (x) und g : B −→ C,
y 7−→ z = g(y) ergibt die zusammengesetzte“ Abbildung (g ◦ f ) : A −→ C, x 7−→ z = g(f (x)).
”
Beispiel: Gegeben seien zwei Funktionen f und g mit
f : R −→ R, x 7−→ f (x) = sin(x),
D(f ) = R,
B(f ) = [−1, 1],
1,
D(g) = R \ {0},
B(g) = R \ {0}.
g : R −→ R, x 7−→ g(x) = x
Dann erhält man folgende zusammengesetzte Funktionen:
g ◦ f : R −→ R, x 7−→ (g ◦ f ) (x) = g (f (x)) = 1 , mit
sin(x)
D(g ◦ f ) = R \ {0, ±π, ±2π, . . .},
B(g ◦ f ) = (−∞, −1] ∪ [1, ∞) = CR ((−1, 1)).
1 , mit
f ◦ g : R −→ R, x 7−→ (f ◦ g) (x) = f (g(x)) = sin x
D(f ◦ g) = R \ {0},
B(f ◦ g) = [−1, 1]
Bemerkung: Obiges Beispiel zeigt, dass die Verknüpfung von Funktionen im allgemeinen nicht kommutativ
ist, d.h. f ◦ g 6= g ◦ f . Es gilt allerdings das Assoziativgesetz (f ◦ g) ◦ h = f ◦ (g ◦ h).
Für die Frage der Existenz einer Umkehrabbildung zu einer gegebenen Abbildung führt man folgende Begriffe
ein:
Definition 1.4.3 [Injektiv, surjektiv, bijektiv]: Es sei eine Abbildung f : A −→ B gegeben.
(1) Die Abbildung oder Funktion f , heißt eineindeutig oder injektiv, wenn verschiedene Elemente
von D(f ) auf verschiedene Elemente von B(f ) abgebildet werden, d.h. wenn gilt
x1 6= x2 ⇒ f (x1 ) 6= f (x2 ) für alle x1 , x2 ∈ D(f ).
Äquivalent dazu ist die Bedingung (Kontraposition)
f (x1 ) = f (x2 ) ⇒ x1 = x2 für alle x1 , x2 ∈ D(f ).
Aus der Gleichheit der Bildpunkte folgt die Gleichheit der Urbildpunkte.“
”
(2) Die Abbildung f : A −→ B heißt surjektiv, wenn D(f ) = A und B(f ) = B gilt.
(3) Die Abbildung f heißt bijektiv oder eins-zu-eins Abbildung, wenn f sowohl surjektiv als auch
injektiv ist.
Für eine injektive Abbildung f : A −→ B gibt es zu einem Element y ∈ B(f ) genau ein Element x ∈ D(f ).
Ordnet man nun jedem y ∈ B(f ) das eindeutig bestimmte x ∈ D(f ) zu, für welches ja y = f (x) gilt, so definiert
man dadurch eine Abbildung aus B in A. Diese Abbildung heißt Umkehrabbildung von f und wird mit f −1
bezeichnet. Nachfolgende Definition und Abb. 1.6 veranschaulichen diesen Zusammenhang.
Definition 1.4.4 [Umkehrabbildung]: Die Abbildungen f : A −→ B sei injektiv. Die Umkehrabbildung
f −1 : B −→ A mit D(f −1 ) = B(f ) und B(f −1 ) = D(f ) ist gegeben durch: f −1 (y) = x mit y = f (x).
f −1
)
A
f
x2 b
H
j
H
B
:b
y2 = f (x2 )
D(f ) = B(f −1 )
B(f ) = D(f −1 )
x1 b
- b y1 = f (x1 )
Abbildung 1.6: Für eine injektive Abbildung existiert eine Umkehrabbildung.
Bemerkung: Offensichtlich gilt folgendes:
f −1 (f (x)) = x
f f −1 (y) = y
−1
f −1
(x) = f (x)
für alle x ∈ D(f );
für alle y ∈ B(f );
für alle x ∈ D(f ).
Beispiel: Gegeben sei eine bijektive Funktion f
i
h
π
−1
(1) f : − π
ist gegeben durch:
2 , 2 −→ [−1, 1], x 7−→ f (x) = sin(x). Die Umkehrfunktion f
i
h
π
−1
f −1 : [−1, 1] −→ − π
2 , 2 , x 7−→ f (x) = arcsin(x). Es muss folgendes gelten:
h
i
π , und
f −1 (f (x)) = arcsin(sin(x)) = x
für alle x ∈ − π
,
2 2
f f −1 (x) = sin(arcsin(x)) = x
für alle x ∈ [−1, 1]
(2) f : R −→ (0, ∞), x 7−→ f (x) = ex . Die Umkehrfunktion f −1 ist gegeben durch:
f −1 : (0, ∞) −→ R, x 7−→ f −1 (x) = ln(x). Es muss wiederum folgendes gelten:
f −1 (f (x)) = ln(ex ) = x
für alle x ∈ R, und
f f −1 (x) = eln(x) = x
für alle x ∈ (0, ∞)
2
Geordnete Körper
2.1
Körper und Metrische Räume
Das gesamte Gebäude der Analysis beruht auf dem Rechnen innerhalb der Körper der rationalen, reellen und
komplexen Zahlen, also auf Q, R und C. Die vielen Regeln, die für das Rechnen in einem Körper gelten, lassen
sich alle aus einem minimalen System von Grundregeln, den Körperaxiomen, ableiten.
Definition 2.1.1 [Körper]: Eine Menge K mit mindestens 2 Elementen heißt ein Körper, wenn für die
Elemente von K eine Addition“ und Multiplikation,“
”
”
+: K ×K →K
∗: K ×K →K
(x, y) 7→ x + y,
(x, y) 7→ x ∗ y,
so erklärt sind, so dass die Summe und das Produkt wieder Elemente von K sind (die Verknüpfungen
also nicht aus der Menge herausführen) und folgende Rechenaxiome für alle x, y, z ∈ K gelten:
Addition
x+y =y+x
Kommutativgesetz
(x + y) + z = x + (y + z)
Assoziativgesetz
Es gibt 0 ∈ K mit
x+0=x
Zu jedem x ∈ K gibt es
ein (−x) ∈ K mit x + (−x) = 0
Existenz eines neutralen Elementes
(Nullelement)
x∗y =y∗x
Kommutativgesetz
Es gibt e ∈ K, e 6= 0 mit
x∗e=x
Zu jedem x ∈ K, x 6= 0 gibt es
ein x−1 ∈ K mit x ∗ x−1 = e
Verträglichkeit von Addition und Multiplikation
x ∗ (y + z) = x ∗ y + x ∗ z
Existenz eines neutralen Elementes
(Einselement)
Existenz inverser Elemente
Multiplikation
(x ∗ y) ∗ z = x ∗ (y ∗ z)
Assoziativgesetz
Existenz inverser (reziproker) Elemente
Distributivgesetz
Bemerkung: In einem Körper kann man beliebig Addieren, Subtrahieren, Multiplizieren und Dividieren. Die
Division durch 0 ist übrigens axiomatisch ausgeschlossen, weil es zur 0 kein inverses Element bezüglich
der Multiplikation gibt.
Beispiel:
(1) Die Menge der natürlichen Zahlen N und die Menge der ganzen Zahlen Z bilden keinen Körper.
p
(2) Die Menge der Brüche B = {x : x = q , p, q ∈ Z, q 6= 0, p und q teilerfremd} bildet mit der
p1
p2
p1 q2 + p2 q1
p1 p2
p1 p2
Addition
und Multiplikation
q1 + q2 =
q1 q2
q1 · q2 = q1 q2
11
den Körper Q der rationalen Zahlen.
(3) Die reellen und komplexen Zahlen, R und C bilden einen Körper.
Bemerkung: In einem beliebigen Körper gelten also genau dieselben Rechenregeln, die wir vom Umgang mit
den rationalen Zahlen her gewohnt sind. Die Körper der rationalen und reellen Zahlen, Q und R, besitzen
über die algebraische Körperstruktur hinaus noch eine Ordnungsstruktur. Das bedeuted, dass für jeweils
2 Elemente x und y genau eine der Beziehungen x = y, oder x < y, oder y > x erfüllt ist. Der Körper der
komplexen Zahlen C ist kein geordneter Körper.
Für die (geordneten) Körper Q und R ist der Absolutbetrag eines Elementes wie folgt definiert:
Definition 2.1.2 [Betrag]: Es sei x ∈ Q oder x ∈ R. Unter dem absoluten Betrag versteht man
x : x≥0
|x| =
.
−x : x < 0
Bemerkung: Der Absolutbetrag hat nichts mit dem Betrag einer komplexen Zahl zu tun.
Satz 2.1.1: Seien x, y ∈ R. Für den Betrag gelten folgende Gesetze:
(1) |x| = | − x| ≥ 0
(2) x ≤ |x|,
−x ≤ |x|,
(3) |x · y| = |x| · |y|
und
|x| = 0 genau dann, wenn x = 0
Produkt und Betrag vertauschbar“
”
(4) |x + y| ≤ |x| + |y|
Dreiecksungleichung“
”
(5) ||x| − |y|| ≤ |x + y| ≤ |x| + |y|
Mit Hilfe des Betrages kann man den Abstand d(x, y) zwischen Zahlen x und y bestimmen indem man |x − y|
berechnet.
2.2
Folgen und Reihen in geordneten Körpern
Wir werden uns jetzt mit den eher ungeliebten“ Folgen und Reihen beschäftigen. Folgen und Reihen sind in der
”
Mathematik deshalb so wichtig, weil sie die Begriffe der Konvergenz und Divergenz einführen und festlegen. Die
Untersuchung einer Folge läuft letztendlich auf die Frage hinaus, was passiert wenn man gegen Unendlich“ geht.
”
Das gesamte Gebäude der Analysis beruht ja auf Unendlichkeiten. Man denke etwa an den Differenzenquotienten
in der Differentialrechnung und die Riemann-Summe in der Integralrechnung.
Wir werden Folgen und Reihen in den geordneten Körpern Q und R betrachten. Genau genommen haben wir die
reellen Zahlen R mathematisch“ noch nicht eingeführt, werden dies aber später kurz nachholen. Im folgenden
”
wollen wir die zugrunde liegenden Körper einfach mit K bezeichnen.
Wir werden jetzt definieren was wir unter einer Folge verstehen:
Definition 2.2.1 [Folge]: Ordnet man jeder natürlichen Zahl n ∈ N ein Element an ∈ K zu, so entsteht
eine Folge von Zahlen a1 , a2 , a3 , a4 , . . . für die man
<an>∞
n=1
oder einfach nur kurz
<an> schreibt.
Eine Folge ist also eine Abbildung a : N −→ K(Q, R).
Bemerkung: Zuweilen betrachtet man auch Folgen <an >∞
n=m , bei denen die ”Numerierung“ von einer Zahl
m ∈ Z an läuft.
Bemerkung: Der Unterschied zwischen einer Folge <an> und der Menge {an } liegt darin, dass in einer Folge
die Elemente angeordnet sind, im Gegensatz zur Menge, wo man die Elemente ja beliebig anordnen und
umordnen darf.
Beispiel: Die Folge von Zahlen < 21 , 23 , 34 , 54 , . . .> ist eine Folge <an > in Q mit dem expliziten Bildungsgesetz
n . Man könnte diese Folge auch prägnant in der Form < n > darstellen.
an = n +
1
n+1
Beispiel: Die Folge <c, c, c, c, . . .> mit c ∈ Q ist eine Konstant-Folge <an> mit an = c.
Beispiel: Durch eine rekursive Bildungsvorschrift ist die Folge <an> mit a1 = 1 und an+1 = 12 an + a1n gegeben.
Hier kann ein Glied erst berechnet werden, wenn alle vorhergehenden schon bekannt sind.
Definition 2.2.2: Eine Folge <an> heißt:
(1) nach oben beschränkt, wenn eine obere Schranke M ∈ K existiert mit:
an ≤ M
für alle n ∈ N;
an ≥ M
für alle n ∈ N;
(2) nach unten beschränkt, wenn eine untere Schranke M ∈ K existiert mit:
(3) beschränkt, wenn sie nach oben und unten beschränkt ist.
Bemerkung: Offensichtlich ist eine Folge <an> genau dann beschränkt, wenn eine Schranke M ∈ K existiert
mit: |an | ≤ M
für alle n ∈ N.
Beispiel: Die Folge <an> mit an = (−1)n+1 1/n ist nach unten durch −1/2 und nach oben durch 1 beschränkt.
Sie ist deshalb auch beschränkt mit |an | ≤ 1.
Beispiel: Die Folge <an> mit an = ln(n) ist nach unten beschränkt durch 0. Sie ist nach oben unbeschränkt
da ln(n) → ∞ für n → ∞.
Wir können sofort behaupten:
Satz 2.2.1: Es seien <an> und <bn> beschränkte Folgen. Dann sind die Summenfolge <an + bn > und die
Produktfolge <an · bn> ebenfalls beschränkt.
Beweis: Da die Folgen <an> und <bn> beschränkt sind gibt es Konstanten Ma und Mb , so dass für alle n ∈ N
gilt: |an | ≤ Ma und |bn | ≤ Mb . Aus den Abschätzungen
|an + bn | ≤ |an | + |bn | ≤ Ma + Mb
|an · bn | = |an | · |bn | ≤ Ma · Mb
(Dreiecksungleichung) und
folgt die Behauptung.
Wir werden jetzt die Konvergenz einer Folge definieren:
Definition 2.2.3 [Konvergenz]: Eine Folge <an> heißt konvergent zum Grenzwert a ∈ K, wenn für jedes
(noch so kleine) ε ∈ K mit ε > 0, eine natürliche Zahl Nε ∈ N existiert, so dass für alle n > Nε gilt:
|an − a| < ε.
Wir schreiben dann:
lim an = a
n→∞
oder
an → a.
Eine nichtkonvergente Folge heißt divergent.
Wenn wir uns diese Definition auf der Zahlengeraden veranschaulichen, so bedeutet sie, dass bei Vorgabe eines
noch so kleinen Intervalls (a − ε, a + ε) = Uε (a), von einem genügend großen Index ab (der natürlich von ε
abhängen wird), alle Elemente der Folge in diesem Intervall liegen, wie in Abb. 2.1 dargestellt. In jeder noch so
kleinen ε-Umgebung von a liegen immer unendlich viele Folgenglieder.
an
a−ε
a
a+ε
Abbildung 2.1: Die Fogle <an> konvergiert zum Grenzwert a, wenn ab einem bestimmten Index Nε alle Folgenglieder in der ε-Umgebung des Punktes a liegen.
n gilt lim a = lim n = 1.
Beispiel: Für die Folge <an> mit an = n +
n
1
n→∞
n→∞ n + 1
Es sei also ε > 0 vorgegeben und |an − 1| < ε. Es muss uns jetzt gelingen einen Index Nε zu finden, so
n − 1| < ε für alle n > N erfüllt ist. Es gilt | n − 1| = 1 − n = 1 < ε. Aus dieser
dass | n +
ε
1
n+1
n+1
ln + 1 m
1
Ungleichung folgt n > ε − 1. Wählen wir nun für Nε = 1ε − 1 (Aufrundungsfunktion, ceiling function),
so haben wir diesen Index gefunden. Die Folge konvergiert also gegen 1.
Wir geben nun einige fundamentale Gesetzmäßigkeiten über das Rechnen mit konvergenten Folgen.
Satz 2.2.2: Die Folge <an> sei konvergent. Dann ist <an> beschränkt.
Beweis: Es sei lim an = a. Dann existiert ein N ∈ N mit |an − a| < e für alle n > N . Daraus folgt:
n→∞
|an | = |an − a + a| ≤ |an − a| + |a| < e + |a|
für alle n > N . Ferner gilt für 1 ≤ n ≤ N :
|an | ≤ max{|a1 |, |a2 |, . . . , |aN |}. Es gilt also für alle natürlichen Zahlen n:
|an | ≤ max{|a1 |, |a2 |, . . . , |aN |, |a| + e} = M . Wir haben damit eine Schranke gefunden.
Bemerkung: Konvergenz einer Folge ist eine hinreichende Bedingung für die Beschränktheit einer Folge.
Oder: Beschränktheit ist eine notwendige Voraussetzung für Konvergenz.
Satz 2.2.3: Die Folgen <an> und <bn> seien konvergent zu den Grenzwerten a und b. Dann gilt:
(1) Die Folge <an + bn> konvergiert zum Grenzwert a + b,
(2) Die Folge <an · bn> konvergiert zum Grenzwert a · b,
an /bn
(3) Für b 6= 0 konvergiert die Folge <cn> mit cn =
0
falls bn 6= 0
zum Grenzwert a/b.
falls bn = 0
Beweis: (1) Zu ε ∈ K, ε > 0 existiert ein Nεa ∈ N so, dass einerseits |an − a| < ε/2 für alle n > Nεa
und andererseits ein Nεb ∈ N so, dass |bn − b| < ε/2 für alle n > Nεb . Hieraus ergibt sich für alle
n > max{Nεa , Nεb }: |(an + bn ) − (a + b)| ≤ |an − a| + |bn − b| < ε/2 + ε/2 = ε.
(2) Da die Folge <bn> beschränkt ist, gibt es eine Konstante M ∈ K, M > 0, so dass |bn | ≤ M für alle
n. Ferner gibt es zu einem ε ∈ K, ε > 0, ein Nεa ∈ N, so dass |an − a| < ε/(2M ) für alle n > Nεa und ein
Nεb ∈ N so, dass |a| · |bn − b| < ε/2 für alle n > Nεb . Hieraus ergibt sich dann für alle n > max{Nεa , Nεb }:
|an · bn − a · b| = |(an − a) · bn + (bn − b) · a| ≤ |bn | · |an − a| + |a| · |bn − b| ≤
≤ M · |an − a| + |a| · |bn − b| < M · (ε/2M ) + ε/2 = ε.
(3) Wegen (2) genügt es, die Behauptung für die Folge <an> mit an = 1 zu beweisen. (a) Es existiert ein
N ∈ N, so dass |b| − |bn | ≤ |bn − b| < |b|/2 für alle n > N gilt. Hieraus folgt für alle n > N : |bn | > |b|/2 > 0
und daher gilt cn = 1/bn . Wir haben also sichergestellt, dass bn 6= 0 für alle n > N . (b) Zu einem ε ∈ K,
ε > 0 existiert ein Nε ∈ N, so dass |bn − b| < ε|b|2 /2 für alle n > Nε . Hieraus ergibt sich nun für alle
n > max{N, Nε }: |cn − 1/b| = |1/bn − 1/b| = |bn − b|/|bn · b| < 2|bn − b|/|b|2 < ε.
Es gilt also lim cn = 1/b.
n→∞
Ein wichtiges Kriterium zum Nachweis der Konvergenz einer Folge ist das Einschließungskriterium:
Satz 2.2.4 [Einschließungskriterium]: Es seien <an>, <bn> und <cn> Folgen mit an ≤ bn ≤ cn . Ferner
seien <an> und <cn> konvergent und es gelte:
lim an = lim cn = a ∈ K.
n→∞
n→∞
Dann konvergiert auch <bn>, und es gilt lim bn = a.
n→∞
Beweis: Wegen an → a und cn → a gibt es zu jedem ε > 0 ein Nεa und Nεc , so dass −ε < an − a < ε für alle
n > Nεa und −ε < cn − a < ε für alle n > Nεc gilt. Aus der Voraussetzung an ≤ bn ≤ cn folgt dann für
alle n > max{Nεa , Nεc }: −ε < an − a ≤ bn − a ≤ cn − a < ε, also |bn − a| < ε.
Wir behandeln nun noch zwei wichtige Begriffe der Folgentheorie, nämlich den Begriff der Monotonie und der
Teilfolge.
Definition 2.2.4 [Monotonie]: Eine Folge <an> heißt:
(1) monoton wachsend bzw. monoton fallend, wenn für alle n gilt:
an ≤ an+1 bzw. an ≥ an+1 ;
(2) streng monoton wachsend bzw. streng monoton fallend, wenn für alle n gilt:
an < an+1 bzw. an > an+1 .
Beispiel: Die Folge <an> mit an = e−n ist streng monoton fallend und beschränkt.
Definition 2.2.5 [Teilfolge]: Es sei < nk >∞
k=1 eine streng monoton wachsende Folge natürlicher Zahlen.
Dann heißt <ank >∞
Teilfolge
der
Folge
<an>∞
n=1 .
k=1
Beispiel: Die Folgen <a8 , a16 , a32 , a64 , . . .> und <a10 , a100 , a1000 , . . .> sind Teilfolgen der Folge <an>.
Eine besonders wichtige Klasse von Folgen bilden die sog. unendlichen Reihen.
Definition 2.2.6 [Unendliche Reihe]: Gegeben sei eine Folge <aν >∞
ν=1 .
n
∞
P
P
Die Folge <sn>∞
aν nennen wir eine unendliche Reihe und bezeichnen sie mit
aν .
n=1 mit sn =
ν=1
ν=1
Die Summe sn wird n-te Teilsumme oder Partialsumme der Reihe genannt.
Wir machen uns klar, dass eine unendliche Reihe keine unendliche Summe“ bedeutet, sondern nur eine
”
Abkürzung für die Folge ihrer Teilsummen ist. Die Untersuchung einer Reihe läuft daher auf die Untersuchung
ihrer Teilsummenfolge hinaus. Es gibt also keinen neuen Konvergenzbegriff für Reihen, sondern die Konvergenz
einer Reihe wird durch die Konvergenz ihrer Partialsummen definiert:
Definition 2.2.7 [Reihe]: Die Reihe
Wir schreiben dann:
∞
P
∞
P
aν heißt konvergent zur Summe s, wenn gilt:
ν=1
aν = s.
lim sn = s.
n→∞
Eine nichtkonvergente Reihe heißt divergent.
ν=1
Bemerkung: Wie bei Folgen betrachten wir öfters auch Reihen
∞
P
ν=m
Zahl m ∈ Z an läuft.
aν , wo der Summationsindex von einer
Wir werden jetzt einige wichtige Folgen und Reihen auf Konvergenz oder Divergenz untersuchen und diese,
wegen ihrer Wichtigkeit, als Sätze formulieren.
1 >, konvergiert zum Grenzwert 0, d.h. es gilt: lim 1 = 0.
Satz 2.2.5: Die Folge < n
n→∞ n
Beweis: Es sei ein beliebig kleines ε > 0 vorgegeben. Es muss uns wieder gelingen einen Index Nε zu finden,
1 − 0| < ε für alle n > N erfüllt ist. Es gilt | 1 − 0| = 1 < ε. Aus dieser Ungleichung folgt
so dass | n
n
n
l εm
1
n > ε . Wählen wir nun für Nε = 1ε (Aufrundungsfunktion, ceiling function), so haber wir diesen Index
gefunden. Die Folge konvergiert also gegen 0.
Mit dieser konvergenten Folgen bilden wir jetzt eine Reihe und erhalten die sog. harmonische Reihe, die wir
sofort auf Konvergenz oder Divergenz untersuchen.
Satz 2.2.6: Die harmonische Reihe
∞
P
1
ν ist divergent.
ν=1
n
P
1
ν nicht beschränkt ist. Wir werden dazu
ν=1
jeweils 2, 4, 8, 16, 32, 64, . . . Summanden betrachten. Zu einer natürlichen Zahl k bilden wir die Abschnitts2k
P
1
1
1
summe σ1 = 12 , σ2 = 13 + 14 , σ3 = 51 + 16 + 17 + 18 , σ4 = 19 + 10
+ . . . + 16
, oder allgemein σk =
ν.
k−1
Beweis: Wir werden zeigen, dass die Folge der Teilsummen sn =
ν=2
Wir können diese Abschnittssummen abschätzen:
σk ≥ (2k − 2k−1 ) · 1k = 12 .
|
{z
} 2
+1
# Summanden
n
2
n
n
P
P
P
1
1 = 1+ n
Aus
s2n =
σk ≥ 1 +
ergibt sich, dass <sn > nicht beschränkt und
ν = 1+
2
2
ν=1
k=1
k=1
somit divergent ist. Genau genommen haben wir eine unbeschränkte Teilfolge <s2n > der Teilsummenfolge
<sn> gefunden.
Von eminenter Wichtigkeit sind die geometrische Folge und Reihe.
Satz 2.2.7: Es sei q ∈ K. Dann gilt für die geometrische Folge <q n>:
(1) Für |q| < 1 gilt: lim q n = 0.
n→∞
(2) Für |q| = 1 gilt: lim q n = 1.
n→∞
(3) Für alle anderen Werte von q divergiert <q n>.
Beweis: (1) Für q = 0 ist <q n > trivialerweise konvergent zum Grenzwert 0; für q 6= 0 und |q| < 1 setzen wir
|q| = 1 , wobei δ > 0. Nach der Bernoulli-Ungleichung gilt für n ≥ 2 die Abschätzung (1 + δ)n > nδ
1+δ
1
1 . Ist nun ε ∈ K, ε > 0 gegeben, so ist 1 < ε für alle n > 1 . Wählen
und daher: |q|n =
n <
nδ
δn
δε
(1
+
δ)
l m
1
1
n
n
wir Nε =
, so können wir sagen, dass |q − 0| = |q | <
< ε für alle n > Nε . Somit konvergiert
δε
nδ
<q n> für |q| < 1 zum Grenzwert 0.
(2) Für q = 1 konvergiert <q n> trivialerweise zum Grenzwert 1.
(3) Für q = −1 gilt <q n>=<−1, 1, −1, 1, −1, . . .>, so dass die Folge nicht konvergiert.
(4) Für |q| > 1 ist die Folge <q n > nicht konvergent. Wäre sie konvergent, so wäre sie auch beschränkt
mit |q n | ≤ M . Setzen wir |q| = 1 + δ > 1, so folgt wieder aus der Bernoulli-Ungleichung für n ≥ 2:
|q n | = (1 + δ)n > nδ. Für genügend großes n ist jedoch nδ > M , was im Widerspruch zur Voraussetzung
ist. Also kann <q n> nicht konvergent sein.
Bildet man mit der geometrischen Folge eine Reihe, so erhält man die geometrische Reihe.
Satz 2.2.8: Es sei q ∈ K. Dann gilt für die geometrische Reihe
(1) Für |q| < 1 gilt:
∞
P
ν=0
1 .
qν = 1 −
q
(2) Für alle anderen Werte von q divergiert
∞
P
∞
P
qν :
ν=0
qν .
ν=0
Beweis: Mit
2.3
n
P
q n+1 folgt die Behauptung.
qν = 1 −
1−q
ν=0
Cauchy-Folgen in geordneten Körpern
Der Konvergenzbegriff den wir kennen gelernt haben hat den Nachteil, dass man den Grenzwert schon kennen
muss. Sehr häufig gelingt es aber nicht, den Grenzwert zu bestimmen. Es wäre deshalb von Vorteil, wenn man
einen Konvergenzbegriff hätte, der nur mit den Folgegliedern arbeitet und der offensichtlichen Verdichtungs”
eigenschaft“ einer konvergenten Folge berücksichtigt. Dies führt uns zum Begriff der Cauchy-Folge, oder kurz
C-Folge. Dieser ist von zentraler Bedeutung in der modernen Mathematik. Nicht nur bei der Konstruktion
der reellen Zahlen, sondern auch in der Funktionalanalysis, Maßtheorie, Wahrscheinlichkeitstheorie, u.a. spielt
dieser Begriff eine wichtige Rolle.
Definition 2.3.1 [Cauchy-Folge]: Die Folge <an > in K heißt Cauchy-Folge, oder auch C-Folge, wenn
für jedes ε ∈ K und ε > 0 ein Nε ∈ N existiert, so dass:
|an − am | < ε
für alle n, m > Nε .
Wir wollen uns diesen Begriff etwas näher anschauen. Dazu sei ein beliebiges ε > 0 gegeben und der zugehörige
Index Nε bestimmt. Wählen wir jetzt ein festes m > Nε , so liegen alle an mit n > Nε in der ε-Umgebung
um am , wie Abb. 2.2 zeigt. Dies bedeutet, dass schließlich alle Folgenglieder ganz dicht zusammenliegen, sich
also verdichten an einer bestimmeten Stelle. Man spricht deshalb auch von der Verdichtungseigenschaft einer
Cauchy-Folge.
Es gelten wieder einige, leicht einzusehende, Regeln für das Rechnen mit Cauchy-Folgen.
Satz 2.3.1: Ist <an> eine Cauchy-Folge in K, dann ist <an> beschränkt.
an
am − ε
am
am + ε
Abbildung 2.2: Bei einer Cauchy-Fogle <an> liegen für ein festes m > Nε alle Folgenglieder für n > Nε in der
ε-Umgebung um am .
Beweis: Es gibt ein Ne ∈ N mit |an − am | < e für alle n > Ne . Insbesondere gilt für m = Ne + 1 und alle
n > Ne die Abschätzung an − aNe +1 < e. Hieraus folgt:
|an | = |an − aNe +1 + aNe +1 | ≤ |an − aNe +1 | + |aNe +1 | < e + |aNe +1 |
für alle n > Ne . Es ergibt sich also:
|an | ≤ max{|a1 |, |a2 |, . . . , |aNe |, |aNe | + e} = M , womit wir eine Schranke gefunden hätten.
Wieder gilt, dass Summen, Produkte und Quotienten von C-Folgen wiederum C-Folgen ergeben.
Satz 2.3.2: Es seien <an> und <bn> Cauchy-Folgen in K. Dann gilt:
(1) Die Summenfolge <an + bn> ist eine Cauchy-Folge,
(2) die Produktfolge <an · bn> ist eine Cauchy-Folge,
(3) und falls ein δ ∈ K mit δ > 0 und
ein N ∈ N existieren mit |bn | ≥ δ für alle n > N , so ist die
an /bn falls bn 6= 0
Quotientenfolge <cn> mit cn =
ist ebenfalls eine Cauchy-Folge.
0
falls bn = 0
Den Zusammenhang zwischen gewöhnlichen“ Folgen und C-Folgen klärt folgender Satz:
”
Satz 2.3.3: Ist <an> konvergent zum Grenzwert a ∈ K, so ist <an> eine Cauchy-Folge.
Beweis: Es sei lim an = a ∈ K. Zu jedem ε ∈ K und ε > 0 gibt es ein Nε ∈ N mit |an − a| < ε/2 für alle
n→∞
n > Nε . Ist nun n > Nε und m > Nε , so ergibt sich |an −am | = |(an −a)−(am −a)| ≤ |an −a|+|am −a| < ε.
Somit ist <an> eine C-Folge.
Es ist nun von größter Wichtigkeit, dass dieser Satz i.a. nicht umkehrbar ist. Es kann und es kommt vor, dass
eine C-Folge in K keinen Grenzwert hat. Das bedeutet, dass die Folge gegen eine Lücke“ konvergiert mit der
”
Konsequenz, dass die Menge in der die C-Folge lebt“ nicht vollständig
ist. Ein sehr berühmtes Beispiel hierfür
” 1
ist die Folge <an > in Q mit a1 = 1 und an+1 = 2 an + a1n . Es kann gezeigt werden, dass diese Folge eine
√
C-Folge ist, die gegen die irrationale Zahl 2 konvergiert. Die Folge <an> konvergiert also gegen eine Lücke“
”
oder Loch“ in Q. Dieses Beispiel zeigt, dass die Menge der rationalen Zahlen zu schwach“ ist, zumal die
”
”
triviale Gleichung x2 = 2 in Q keine Lösung hat. Die Behebung dieser Schwäche führt uns zu den reellen Zahlen
R, die wir ja schon kennen, deren Wesen“ uns aber noch unbekannt ist. Um zu klären, was eine reelle Zahl
”
eigentlich ist, müssen wir uns mit Relationen beschäftigen.
2.4
Relationen und Klasseneinteilungen von Mengen
Umgangssprachlich versteht man unter einer Relation eine Beziehung zwischen jeglicher Art von Objekten. wie
z. B. Staaten, Hauptstädte, Menschen, Farben, reellen Zahlen, Cauchy-Folgen, komplexen Zahlen, stetigen
Funktionen, Matrizen, und viele mehr. Betrachten wir die Menge der Staaten und die Menge der Hauptstädte
so beschreibt Wien ist Hauptstadt von Österreich“ eine Relation zwischen diesen (verschiedenen) Mengen.
”
Die Beziehung ist verwandt mit“ definiert eine Relation in der Menge aller Menschen. Mathematisch werden
”
Relationen folgendermaßen definiert:
Definition 2.4.1 [Relation]: Eine Relation R zwischen den Mengen A und B ist eine Teilmenge des
kartesischen Produktes A × B, also R ⊂ A × B. Für (a, b) ∈ R sagt man a steht in Relation oder
”
Beziehung R zu b“. Oft schreibt man aRb oder a ∼ b für (a, b) ∈ R. Für den Fall A = B = M spricht
man von einer Relation in oder Relation auf M.
Beispiel: In der Menge aller Menschen bildet gleich alt wie“ eine Relation.
”
Im weiteren untersuchen wir bestimmte Eigenschaften einer Relation. Dazu benötigen wir folgende Definition:
Definition 2.4.2 [Reflexiv, symmetrisch, transitiv]: Eine Relation in der Menge M heißt:
(1) reflexiv, wenn für alle x ∈ M gilt: x ∼ x,
(2) symmetrisch, wenn für alle x, y ∈ M mit x ∼ y folgt: y ∼ x,
(3) transitiv, wenn für alle x, y, z ∈ M mit x ∼ y und y ∼ z folgt: x ∼ z.
Eine Relation, die reflexiv, symmetrisch und transitiv ist, wird Äquivalenzrelation genannt.
Beispiel: In der Menge der ganzen Zahlen M = Z sei eine Relation R gegeben durch:
R = {(n, m) : n ∈ Z, m ∈ Z, n − m gerade} ⊂ Z × Z.
Die Relation lautet hier: Die ganze Zahl n steht in Relation (oder Beziehung) zur ganzen Zahl m, wenn
”
ihre Differenz n − m gerade oder durch 2 teilbar ist.“ Wir überprüfen jetzt, ob diese Relation reflexiv,
symmetrsich oder transitiv ist.
• reflexiv: ja, weil für alle n ∈ M gilt: n − n = 0 und durch 2 teilbar. Dies bedeutet aber n ∼ n.
• symmetrisch: ja, weil für n ∼ m, d.h. n − m gerade oder durch 2 teilbar, gefolgert werden kann, dass
m − n durch 2 teilbar ist. Dies bedeutet aber m ∼ n.
• transitiv: ja, weil für n ∼ m und m ∼ p, d.h. n − m gerade und m − p gerade, gefolgert werden
kann, dass n − p = (n − m) + (m − p) als Summe zweier gerader Zahlen eine gerade Zahl ergibt. Dies
bedeutet wiederum n ∼ p.
Diese Relation bildet also eine Äquivalenzrelation. Welches sind nun die Zahlen, die zueinander in Relation stehen? Einerseits sind das alle ungeraden Zahlen Zu = {. . . , −3, −1, 1, 3, 5, 7, . . .} und andererseits
alle geraden Zahlen Zg = {. . . , −4, −2, 0, 2, 4, 6, . . .}. Wir haben also zwei Klassen“ von ganzen Zahlen
”
bekommen für welche Zu ∩ Zg = ∅ und Zu ∪ Zg = Z gilt. Diese beiden Klassen sind sog. Äquivalenzklassen. Alle ungeraden und alle geraden Zahlen sind äquivalent zueinander. Man bezeichnet diese beiden
Äquivalenzklassen üblicherweise folgendermaßen: [0] = {n ∈ Z : n ∼ 0} und [1] = {n ∈ Z : n ∼ 1}, d.h.
die Äquivalenzklasse zur geraden Zahl 0 und zur ungraden Zahl 1. Man hätte aber auch [10] schreiben
können anstatt [0], da ja 0 und 10 äquivalent sind.
Die Vermutung, dass es einen Zusammenhang zwischen Äquivalenzrelationen und Klasseneinteilungen gibt,
bestätigt sich vollends. Wir müssen zuvor noch festlegen, was wir unter einer Klasseneinteilung einer Menge M
und einer Äquivalenzklasse verstehen:
Definition 2.4.3 [Klasseneinteilung einer Menge]: Es sei M eine beliebige Menge. Eine Klasseneinteilung von M ist ein Mengensystem F = {Mα }α∈A mit:
(1) Mα ∩ Mβ = ∅ für α 6= β (disjunktes Mengensystem),
S
(2) M =
Mα .
α∈A
Definition 2.4.4 [Äquivalenzklasse]: In einer Menge M sei eine Äquivalenzrelation ∼ gegeben. Für ein
a ∈ M heißt:
[a] = Ma = {x : x ∈ M, x ∼ a}
die von a erzeugte Äquivalenzklasse.
Entscheidend für den Zusammenhang von Äquivalenzrelationen und Klasseneinteilungen ist:
Satz 2.4.1: Es sei M eine Menge.
(1) Jede Klasseneinteilung von M erzeugt eine Äquivalenzrelation in M .
(2) Bei gegebener Äquivalenzrelation bildet das System der verschiedenen Äquivalenzklassen eine Klasseneinteilung von M .
Beispiel: In der Menge der komplexen Zahlen C sei eine Relation R gegeben durch:
R = {(z1 , z2 ) : z1 ∈ C, z2 ∈ C, |z1 | = |z2 |} ⊂ C2 .
Die Relation lautet hier: Die komplexe Zahl z1 steht in Relation zur komplexen Zahl z2 , wenn ihre Beträge
”
gleich sind.“ Wir überprüfen, ob diese Relation eine Äquivalenzrelation bildet.
• reflexiv: ja, weil für alle z ∈ C gilt: |z| = |z|. Dies bedeutet aber z ∼ z.
• symmetrisch: ja, weil für z1 ∼ z2 , d.h. |z1 | = |z2 |, gefolgert werden kann, dass |z2 | = |z1 | ist und
somit z2 ∼ z1 .
• transitiv: ja, weil für z1 ∼ z2 und z2 ∼ z3 , d.h. |z1 | = |z2 | und |z2 | = |z3 |, gefolgert werden kann, dass
|z1 | = |z3 | gilt. Dies bedeutet wiederum z1 ∼ z3 .
Diese Relation bildet also eine Äquivalenzrelation. Welches sind nun die komplexen Zahlen, die äquiva”
lent“ sind? Offensichtlich alle komplexen Zahlen die auf einem Kreis mit Radius r liegen, weil diese alle
den Betrag r haben. Jeder Radius r ∈ [0, ∞) induziert also eine Äquivalenzklasse Mr = {z ∈ C : |z| = r}.
Wiederum gilt:
S
Mr ∩ Mr′ = ∅ für r 6= r′ und C =
Mr .
r∈[0,∞)
2.5
Die Konstruktion der reellen Zahlen
Wir haben gesehen, dass der Körper Q der rationalen Zahlen in mancher Hinsicht unbefriedigend ist. Unter
anderem haben wir gesehen, dass es Cauchy-Folgen gibt, die in Q keinen Grenzwert haben. In der modernen
Mathematik spielen Körper, in denen jede C-Folge konvergiert, aber eine wichtige Rolle. Dies führt uns zum
Begriff der Vollständigkeit:
Definition 2.5.1: Ein geordneter Körper K heißt vollständig, wenn jede Cauchy-Folge in K konvergiert,
d. h. in K einen Grenzwert besitzt.
Es stellt sich nun die Frage, ob man Q nicht erweitern kann, d. h. ob es nicht einen größeren geordneten
Zahlenkörper R gibt, der Q enthält, und darüber hinaus genügend Elemente besitzt, so dass R vollständig ist
und jede Gleichung der Form xn = a mit a ∈ Q und a ≥ 0 eine Lösung in R besitzt.
Zur Erweiterung von Q, d. h. zur Konstruktion der reellen Zahlen werden wir C-Folgen heranziehen, da diese
sich ja zu einer bestimmten Stelle“ hin verdichten. Diese Stelle“, repräsentiert durch die entsprechende C”
”
Folge, identifizieren wir dann mit einer reellen Zahl. Es gibt aber unendlich viele verschiedene C-Folgen mit der
Eigenschaft, dass sie sich an ein und derselben Stelle verdichten. Welche C-Folge soll man dann nehmen? Es
würde also Sinn machen, alle C-Folgen, die sich an der selben Stelle verdichten, als äquivalent zu identifizieren.
Deshalb führen wir eine Äquivalenzrelation in der Menge aller C-Folgen in Q ein.
Satz 2.5.1: Sei M die Menge aller C-Folgen in Q und zwei C-Folgen < xn >∈ M und < yn >∈ M seien
zueinander in Relation, geschrieben <xn >∼<yn >, wenn gilt: limn→∞ (xn − yn ) = 0. Diese Relation
bildet eine Äquivalenzrelation in M .
Beweis: Die Relation lautet: zwei C-Folgen sind zueinander in Relation, wenn ihre Differenzfolge gegen 0 konvergiert. Wir überprüfen folgende Eigenschaften:
• reflexiv: ja, weil für alle <xn>∈ M gilt: lim (xn − xn ) = 0. Dies bedeutet aber <xn>∼<xn>.
n→∞
• symmetrisch: ja, weil für < xn >∼< yn >, d.h. lim (xn − yn ) = 0, gefolgert werden kann, dass
n→∞
lim (yn − xn ) = 0 ist, und somit <yn>∼<xn> gilt.
n→∞
• transitiv: ja, weil für <xn>∼<yn> und <yn>∼<zn>, d.h. lim (xn − yn ) = 0 und lim (yn − zn ) =
n→∞
n→∞
0, gefolgert werden kann, dass lim (xn − zn ) = lim [(xn − yn ) + (yn − zn )] = lim (xn − yn ) +
n→∞
n→∞
lim (yn − zn ) = 0 gilt. Dies bedeutet wiederum <xn>∼<zn>.
n→∞
n→∞
Mit obiger Äquivalenzrelation haben wir eine Klasseneinteilung in der Menge aller C-Folgen erhalten. Alle CFolgen in einer Klasse führen, kurz gesagt, zur selben Stelle“. Bezeichnen wir die Äquivalenzklasse zu einer
”
vorgegebenen C-Folge < xn > mit C<xn > so können wir jetzt mit dieser Äquivalenzklasse ein neues Objekt
identifizieren, nämlich eine reelle Zahl X = C<xn > .
Definition 2.5.2 [relle Zahl]: Eine reelle Zahl X ist eine Äquivlenzklasse C<xn > von Cauchy-Folgen rationaler Zahlen. Die Menge aller reellen Zahlen wird, wie ja schon bekannt, mit R bezeichnet.
Genau genommen dürften wir noch nicht von Zahlen sprechen. Bisher haben wir ja nur eine komplizierte Menge
definiert, nämlich die Menge aller Äquivalenzklassen von C-Folgen in Q. Für diese neuen Objekte ist aber weder
eine Addition noch eine Multiplikation erklärt, ganz zu schweigen von einer Verifikation der Körperaxiome.
Satz 2.5.2: Es seien X, Y ∈ R. Mit den Operationen
Addition
X +Y
=
C<xn > + C<yn >
= C<xn +yn > ,
Multiplikation
X ·Y
=
C<xn > · C<yn >
= C<xn ·yn > ,
wobei <xn> und <yn> beliebige Repräsentanten aus X und Y sind, bildet R einen Körper.
Beweis: Der Beweis ist relativ einfach und basiert auf der Tatsache, dass Addition und Multiplikation zweier
C-Folgen wieder eine C-Folge ergeben.
Jetzt endlich wissen wir, was man mathematisch unter einer reellen Zahl versteht und warum man sie eingeführt
hat. Zu klären bleibt noch, wo die rationalen Zahlen geblieben sind, oder wie sie in der Menge der reellen Zahlen
zu identifizieren sind. Dies geschieht durch eine in sehr natürlicher Weise gegebenen injektiven Abbildung
F : Q −→ R und x 7−→ F (x) = C<x> mit D(F ) = Q, B(F ) = {X : X ∈ R mit X = C<x> , x ∈ Q}, wobei
unter <x> die konstante C-Folge <x, x, x, x, . . .> gemeint ist. Zur Abbildung F existiert eine Umkehrfunktion
F −1 mit D(F −1 ) = B(F ), B(F −1 ) = Q. In Abb. 2.3 sind die Gegebenheiten grafisch illustriert.
0
1
x
Q
6
F −1
F
?
?
?
?
C<0>
C<1>
C<x>
R
Abbildung 2.3: Einbettung der rationalen Zahlen Q in der Menge der reellen Zahlen R. Die rationale Zahl x ∈ Q
wird dabei mit der rational-reellen Zahl X = C<x> identifiziert.
Die Abbildungen F und F −1 haben nun die fundamentale Eigenschaft, mit den Körper- und Ordnungsstrukturen
in Q bzw. R verträglich zu sein. Für x, y ∈ Q bedeutet dies, dass folgendes gilt: F (x+y) = F (x)+F (y), F (x·y) =
F (x) · F (y), und aus x < y folgt F (x) < F (y). Für X, Y ∈ D(F −1 ) gilt: F −1 (X + Y ) = F −1 (X) + F −1 (Y ),
F −1 (X · Y ) = F −1 (X) · F −1 (Y ), und aus X < Y folgt F −1 (X) < F −1 (Y ).
Es ist also vollkommen gleichgültig, ob wir in Q nach den Gesetzen in Q rechnen, oder mit den Bilder in B(F )
nach den Gesetzen in R rechnen. Aus diesem Grund können wir tatsächlich von einer Einbettung von Q in R
sprechen.
Jetzt kommen wir zu dem berühmten Satz von Dedekind:
Satz 2.5.3 [Dedekind]: R ist vollständig.
In der Menge der reellen Zahlen R gilt desweiteren:
Satz 2.5.4 [Cauchysches Konvergenzkriterium]: Eine reelle Zahlenfolge ist dann und nur dann konvergent, wenn sie eine C-Folge ist.
Leider lassen auch die reellen Zahlen noch Wünsche offen. Versucht man etwa die Gleichung x2 + 1 = 0 zu lösen,
muss man zur Kenntnis nehmen, dass diese einfache Gleichung in R keine Lösung hat. Der Ausweg aus dieser
Miesere führt uns zu den komplexen Zahlen C in Kapitel 3.
2.6
Der Hauptsatz über monotone Folgen und die Zahl e
Nachdem wir nun wissen, dass R vollständig ist und somit jede Cauchy-Folge in R auch konvergiert, wäre es
wünschenswert, ein weniger allgemeines, dafür aber handlicheres Konvergenzkriterium als das Cauchysche zu
haben. Für monotone Folgen gibt es ein solches hinreichendes Kriterium.
Satz 2.6.1 [Hauptsatz über monotone Folgen]:
(1) Eine monoton wachsende und nach oben beschränkte Folge ist konvergent.
(2) Eine monoton fallende und nach unten beschränkte Folge ist konvergent.
Beweis:(Widerspruchsbeweis) (1) Es sei <xn > eine Folge mit xn+1 ≥ xn und xn ≤ M für alle n ∈ N. Wir
müssen zeigen, dass <xn> eine C-Folge ist. Angenommen, <xn> ist keine C-Folge, dann gibt es ein ε∗ > 0
und beliebig große Indizes m, n, so dass |xn − xm | ≥ ε∗ ist (sonst gäbe es ja zu jedem ε > 0 ein Nε , so
dass |xn − xm | < ε gilt für alle n, m > Nε ). Wir nehmen ein Indexpaar m1 , n1 mit 1 < m1 < n1 und
|xn1 − xm1 | ≥ ε∗ , dann ein weiteres Indexpaar m2 , n2 mit m1 < n1 < m2 < n2 und |xn2 − xm2 | ≥ ε∗ usw.
Auf diese Weise entstehen Folgen <mi> und <ni> mit 1 < m1 < n1 < m2 < n2 < · · · < mi < ni · · · und
|xni − xmi | ≥ ε∗ (für i = 1, 2, . . .).
Es folgt xnk ≥ xmk + ε∗ ≥ xnk−1 + ε∗ ≥ xmk−1 + 2ε∗ ≥ xn1 + (k − 1)ε∗ ≥ xm1 + kε∗ ≥ x1 + kε∗ . Für
genügend große k ist xnk ≥ x1 + kε∗ > M im Widerspruch zur Voraussetzung. Die Folge kann also nur
eine C-Folge sein. Der Beweis von (2) geht analog.
Bemerkung: Man beachte, dass bei diesem Kriterium, wie auch beim Cauchy-Kriterium, der Grenzwert der
Folge nicht eingeht.
Im weiteren untersuchen wir zwei Folgen die beide gegen die Eulersche Zahl e konvergieren. Dabei kommt der
Hauptsatz über monotone Folgen zum Einsatz.
∞
P
1
ν!
ν=0
Satz 2.6.2 Die unendliche Reihe
konvergiert.
Beweis: Nach der Definition der Konvergenz einer Reihe müssen wir die Konvergenz der Folge < yn > ihrer
n
P
1 zeigen.
Teilsummen yn =
ν!
ν=0
1
(1) Die Folge <yn> ist streng monoton steigend, da
yn+1 − yn =
>0
gilt.
(n − 1)!
(2) Mit ν! = 1 · 2 · 3 · · · ν ≥ 2ν−1 für ν ≥ 2 gilt:
h
n i
n
n−1 ν
n
P
1 ≤2+ P 1 =1+ P 1 =1+2 1− 1
yn = 2 +
< 3.
ν−1
2
2
ν!
ν=2
ν=0
ν=2 2
Damit ist die Folge <yn> nach oben beschränkt und somit konvergent.
Als nächstes beweisen wir:
n
1
Satz 2.6.3 Die Folge <xn> mit xn = 1 + n
Beweis: Mit Hilfe des binomischen
n
n
P
1
xn = 1 + n
=
ν=0
ist konvergent.
Lehrsatzes erhalten wir für xn folgenden Ausdruck:
n
n
n 1 = 1 + P n(n − 1) · · · (n − ν + 1) = 1 + P 1
ν
ν nν
ν!
ν!n
ν=1
ν=1
"
ν−1
Q µ=0
µ
µ
0 ≤ 1 − n ≤ 1 − n + 1 ≤ 1 für µ = 0, 1, . . . , n.
"
#
"
#
n+1
n
ν−1
P 1 ν−1
Q P
Q µ
µ
1
(1) Monotonie:
xn+1 − xn =
−
=
ν! µ=0 1 − n + 1
ν! µ=0 1 − n
ν=1
ν=1
"
"
#
#
ν−1
n n
ν−1
Q
P
Q Q µ
µ
µ
1
1
=
1− n+1
+
> 0.
ν! µ=0 1 − n + 1 − µ=0 1 − n
(n + 1)! µ=0
ν=1
Wir bemerken ferner, dass gilt:
µ
1− n
#
.
Damit ist die Folge <xn> streng monoton steigend.
(2) Beschränktheit: Mit obigen Darstellung erhalten wir für n ≥ 2:
n
P
1 =y <3
2 = x1 < xn ≤
n
ν!
ν=0
Damit ist die Folge <xn> beschränkt und mit (1) konvergent.
Mit dem Einschließungskriterium können wir zeigen, dass die Folgen < xn > und < yn > gegen den selben
(unbekannten) Grenzwert konvergieren.
Satz 2.6.4 Für die Folgen <xn> und <yn> gilt:
lim xn = lim yn .
n→∞
n→∞
Beweis: Es sei k eine feste natürliche Zahl, und es sei n ≥ k. Dann gilt:
"
"
"
#
#
#
k
ν−1
n
ν−1
k
ν−1
P
Q Q Q P
P
µ
µ
µ
1
1
1
xn = 1 +
1− n
+
1− n
≥1+
1− n .
ν! µ=0
ν! µ=0
ν! µ=0
ν=1
ν=1
ν=k+1
Lassen wir in dieser Ungleichung n gegen Unendlich gehen, so erhalten wir:
lim xn ≥
n→∞
k
P
1 =y .
k
ν!
ν=1
Oben haben wir gesehen, dass xk ≤ yk gilt. Insgesamt erhalten wir für alle natürlichen Zahlen k:
xk ≤ yk ≤ lim xn .
n→∞
Aus dem Einschließungskriterium folgt lim xk = lim yk .
k→∞
k→∞
Der gemeinsame Grenzwert der Folgen <xn > und <yn > ist eine der wichtigsten Zahlen in den Naturwissenschaften.
Definition 2.6.1 [ Eulersche Zahl]: Wir bezeichnen den Grenzwert
n
∞
P
1 =e
1
=
lim 1 + n
als Eulersche Zahl.
ν!
n→∞
ν=0
Wir zeigen noch, dass die Eulersche Zahl irrational ist.
Satz 2.6.5 Die Eulersche Zahl e ist irrational.
Beweis:(Widerspruchsbeweis) Wir betrachten für eine feste natürliche Zahl n ∈ N den Ausdruck:
1
1−
n+m
m−1
P 1
P
(n
+
2)m
1
1
1
n+2
yn+m − yn =
≤
<
=
.
ν
1
ν!
(n + 1)! ν=0 (n + 2)
(n + 1)!
(n + 1)!(n + 1)
ν=n+1
1−
n+2
Lassen wir in dieser Ungleichung m gegen Unendlich gehen, so erhalten wir die wichtige Abschätzung:
n+2
0 < lim yn+m − yn = e − yn ≤
= n+2 2 < 1 .
n!n
(n + 1)!(n + 1)
m→∞
n!(n + 1)
Für die Zahl θn = (e − yn )n!n ergibt sich wegen dieser Beziehung 0 < θn < 1 sowie
n
P
1,
e = θn + y n = θn +
n!n
n!n ν=0 ν!
für jede natürliche Zahl n. Nehmen wir nun an, dass e rational ist, so gibt es p, q ∈ N mit e = p/q. Wegen
obiger Beziehung gilt dann für n = q:
q
p = θq + P
1.
q
q!q ν=0 ν!
Eine Multiplikation dieser Gleichung
mit dem Faktor q! ergibt links eine ganze Zahl (q − 1)!p, rechts die
P
Summe einer ganzen Zahl q! qν=0 (1/ν!) und einer zwischen 0 und 1 gelegenen Zahl θq /q. Dies ist aber
ein Widerspruch. Die Zahl e kann also nicht rational sein.
3
Der Körper der komplexen Zahlen C
Komplexe Zahlen sind nicht so komplex wie ihr Name andeuten mag. Es stellt sich berechtigterweise die Frage
nach der Notwendigkeit dieser Zahlen. Bei der Menge der rationalen Zahlen Q haben wir gesehen, dass man
mit diesen zwar uneingeschränkt endliche Operationen durchführen kann, es aber bei Unendlichkeitsprozessen
zu Problemen kommt, wie wir anhand nicht-konvergenter C-Folgen gesehen haben. Darüberhinaus besitzt die
sehr einfache Gleichung x2 = 2 in Q keine Lösung. Dieses waren die ausschlaggebenden Gründe die Menge der
reellen Zahlen R, als Erweiterung der rationalen Zahlen, einzuführen.
Leider haben auch die reelen Zahlen einige Schwächen. Zum einen besitzt eine einfache Gleichung wie x2 +
1 = 0 keine Lösung in R, zum anderen kann man bei Polynomen keine allgemeinen Aussagen bezüglich der
Nullstellen machen. Ein Polynom 3. Grades hat mindestens eine Nullstelle, man kann aber nicht sagen ob es zwei
oder drei Nullstellen besitzt. Ein Polynom 4. Grades kann auch keine Nullstelle haben. Diese Ungewissheit ist
mathematisch sehr unbefriedigent. Wir werden sehen, dass in der Menge der komplexen Zahlen C ein Polynom
n-ten Grades genau n Nullstellen besitzt.
Wir werden in diesem Kapitel den Körper R zum Körper C der komplexen Zahlen erweitern. Hierbei wird es
sich im Gegensatz zur Erweiterung von Q zu R, die im wesentlichen durch einen analytischer Prozess (CauchyFolgen) gegeben ist, jetzt um eine wesentlich einfachere Erweiterung algebraischer Natur handeln.
3.1
Der Körper der komplexen Zahlen
Eine komplexe Zahl ist als ein geordnetes Paar reeller Zahlen definiert.
Definition 3.1.1 [Komplexe Zahl]:
(1) Eine komplexe Zahl z ist ein Zahlenpaar
z = (x, y)
mit x, y ∈ R.
Dabei heißen x = Re(z) und y = Im(z) Realteil und Imaginärteil von z.
(2) Zwei komplexe Zahlen z1 = (x1 , y1 ) und z2 = (x2 , y2 ) heißen gleich, wenn ihre Real- und Imaginärteile gleich sind, d. h. wenn x1 = x2 und y1 = y2 gilt.
(3) Die Menge der komplexen Zahlen wird mit C bezeichnet.
Bis jetzt haben wir nur die Menge der komplexen Zahlen definiert und dürften eigentlich nicht von Zahlen
sprechen. Mit einer geeigneten Definition von Addition und Subtraktion wir C zum Körper.
Satz 3.1.1: Es seien z1 , z2 ∈ C mit z1 = (x1 , y1 ) und z2 = (x2 , y2 ). Mit den Operationen
Addition
z1 + z2
=
(x1 + x2 , y1 + y2 ),
Multiplikation
z1 · z2
=
(x1 x2 − y1 y2 , x1 y2 + x2 y1 ),
bildet C einen Körper.
Beweis: Die Körperaxiome können leicht überprüft werden. Das Nullelement ist durch 0 = (0, 0) , das Einselement durch
1 = (1, 0) gegeben.
Das inverse Element der Multiplikation zu z = (x, y) ist gegeben durch
−y
x
−1
,
.
z =
x2 + y 2 x2 + y 2
Komplexe Zahlen werden als Punkte im R2 veranschaulicht, wie Abb. 3.1 zeigt. Man spricht auch von der
Gaussschen oder komplexen Zahlenebene.
y = Im(z)
6
z2
r
C
y2
rz1
y1
x2
x1
- x = Re(z)
Abbildung 3.1: Eine komplexe Zahl z = (x, y) wird durch einen Punkt in der Gaussschen Zahlenebene veranschaulicht.
3.2
Die Einbettung von R in C
Wir haben jetzt mit C einen Körper konstruiert, dessen Elemente aus Paaren reeller Zahlen bestehen. Das
eigentliche Ziel war ja, den Körper der reellen Zahlen so zu erweitern, dass die bekannten Schwächen“ von
”
R behoben werden können. Wir wollen uns deshalb mit der Frage beschäftigen, ob C auch tatsächlich eine
Erweiterung von R ist und, wenn ja, wie wir die reellen Zahlen unter den komplexen Zahlen wiederfinden“
”
können. Dazu benötigen wir den Begriff der Isomorphie.
Definition 3.2.1 [Isomorphie]: Zwei Körper K1 und K2 heißen isomorph, wenn eine injektive Abbildung
F : K1 −→ K2 mit D(F ) = K1 und B(F ) = K2 existiert, so dass für alle x, y ∈ K1 gilt:
F (x + y) = F (x) + F (y),
F (x · y) = F (x) · F (y).
Bemerkung: Die in Kapitel 1, Abschnitt 2.5 auf Seite 20 betrachtete Abbildung F : Q −→ R liefert die
Isomorphie von Q und der Menge der rational-reellen Zahlen.
wir betrachten nun eine besonders wichtige Teilmenge von C, nämlich die Menge
CR = {z : z ∈ C, z = (x, 0)}.
Wenig überraschend gilt:
Satz 3.2.1: Die Menge CR ist bezüglich der Operationen in C ein Körper.
Jetzt zeigen wir:
Satz 3.2.2: Die Körper R und CR sind isomorph.
Beweis: Wir betrachten die Abbildung F : R −→ CR mit F (x) = (x, 0) und D(F ) = R.
(1) F ist offenbar eine injektive Abildung mit B(F ) = CR .
(2) Für alle x, y ∈ R gilt:
F (x + y) = (x + y, 0) = (x, 0) + (y, 0) = F (x) + F (y)
F (x · y) = (x · y, 0) = (x, 0) · (y, 0) = F (x) · F (y).
Damit folgt die Isomporphie der beiden Körper.
6
C
(0, 1)
0
1
x
c
R
(1, 0)
-
CR
(x, 0)
: c F
Abbildung 3.2: Einbettung der reellen Zahlen R in der Menge der komplexen Zahlen C. Die Abbildung F
vermittelt einen Isomoporphismus zwischen den Körpern R und CR ⊂ C.
Eine grafische Veranschaulichung des Isomorphismus zwischen R und CR zeigt Abb. 3.2.
Es ist also vollkommen gleichgültig, ob wir in R nach den Rechengesetzen in R oder mit den Bildern in CR
nach den Gesetzen in C rechnen. Aus diesem Grunde identifizieren wir, so wie wir die rationalen Zahlen mit
den rational-reellen Zahlen identifiziert haben, die reellen Zahlen mit den reell-komplexen Zahlen. Für eine
reell-komplexe Zahl (x, 0) können und werden wir ab sofort einfach nur
(x, 0) = x
schreiben. Bezeichnet man darüberhinaus die komplexe Zahl (0, 1) als imaginäre Einheit i = (0, 1) so kann
man für z = (x, y) = (x, 0) + (0, y) = (x, 0) + (0, 1)(y, 0) schreiben. Mit den eben eingeführten Abkürzungen
gelangen wir zur Normaldarstellung einer komlexen Zahl
z = x + iy
die wir fortan verwenden werden. Summen, Produkte und Quotienten von komplexen Zahlen schreiben sich in
Normaldarstellung wie folgt:
Satz 3.2.3: Es seien z1 , z2 ∈ C, sowie z1 = x1 + iy1 und z2 = x2 + iy2 . Dann gilt:
(1) z1 + z2 = (x1 + x2 ) + i(y1 + y2 ),
(2) z1 z2 = (x1 x2 − y1 y2 ) + i(x1 y2 + x2 y1 ),
x x + y1 y2
−x y + x y
(3) zz12 = 1 22
+ i 1 22 22 1 ,
x + y2
x +y
2
2
2
2
Bemerkung: Für das Quadrat von i erhalten wir i2 = (0, 1)(0, 1) = (−1, 0) = −1, d.h. i ist eine Lösung der
Gleichung z 2 + 1 = 0.
3.3
C als 2-dimensionaler Vektorraum
Die Menge der komplexen Zahlen C bildet einen 2-dimensionalen Vektorraum, wenn man als Addition im
Vektorraum die Addition in C und als skalare Multiplikation im Vektorraum die Multiplikation in C mit einer
reellen komplexen Zahl nehmen.
Satz 3.3.1: C bildet mit der Addition in C und der skalaren Multiplikation
λz = (λ, 0)(x, y) = (λx, λy)
mit
λ∈R
einen 2-dimensionalen Vektorraum über R mit der Basis 1 und i.
Beweis: Da die Addition identisch ist mit der Addition in C und die skalare Multiplikation als Spezialfall der
Multiplikation in C definiert ist, folgen aus den Körperaxiomen sofort die Vektorraumgesetze.
Im folgenden werden wir die komplexen Zahlen sowohl durch Punkte im R2 als auch durch Vektoren des V2
veranschaulichen. Durch die Vektordarstellung koönnen wir uns sofort die Addition zweier komplexer Zahlen
veranschaulichen. Diese entspricht genau der Vektoraddition, wie Abb. 3.3 zeigt.
iy
Im(z)
6
Im(z)
6
z =r x + iy
3
i
- Re(z)
x
1
z1 XXXX
XX
XXX
XXX
z
: z1 + z2
- Re(z)
X
X
XXX
XX
XXX
XX
z2
z
Abbildung 3.3: Eine komplexe Zahl z = (x, y) kann durch einen Punkt oder durch einen Vektor dargestellt
werden. Die Addition zweier komplexer Zahlen entspricht der Vektoraddition.
3.4
Konjugiert komplexe Zahlen
Für das weitere Rechnen mit komplexen Zahlen führen wir den Begriff der konjugiert komplexen Zahl ein.
Definition 3.4.1 [Konjugiert komplexe Zahl]: Für eine komplexe Zahl z = x + iy = (x, y) heißt
z = x − iy = (x, −y)
die zu z konjugiert komplexe Zahl. Zuweilen wird die konj. komplexe Zahl auch mit z ∗ bezeichnet.
Für die Operationen mit konjugiert komplexen Zahlen gelten wieder eine Reihe von Rechenregeln:
Satz 3.4.1: Für die komplexen Zahlen z, z1 , z2 ∈ C gelten folgende Regeln:
(1) z1 + z2 = z1 + z2 ,
(2) z1 · z2 = z1 · z2 ,
(3) zz12 = zz1 ,
2
Addition und Konjugation vertauschen“
”
Multiplikation und Konjugation vertauschen“
”
Division und Konjugation vertauschen“
”
(4) (z) = z,
(5) Re(z) = 12 (z + z),
1 (z − z).
Im(z) = 2i
Von großer Wichtigkeit für die weiteren Untersuchungen ist die Einführung des Betrages einer komplexen Zahl.
Definition 3.4.2 [Betrag]: Für eine komplexe Zahl z = x + iy = (x, y) heißt die reelle Zahl
p
|z| = x2 + y 2
der Betrag von z.
Für das Rechnen mit Beträgen gelten folgende Regeln:
Satz 3.4.2: Für die komplexen Zahlen z, z1 , z2 ∈ C gelten folgende Regeln:
(1) |z| ≥ 0,
(2) |z| = |z|,
|z| = 0
|z| =
(3) |z1 · z2 | = |z1 | · |z2 |.
√
genau dann, wenn
z = 0;
zz;
Multiplikation und Betrag vertauschen“
”
Darüberhinaus erfüllt der komplexe Betrag“ noch die wichtige Dreiecksungleichung.
”
Satz 3.4.3 [Dreiecksungleichung]: Für komplexe Zahlen z1 , z2 ∈ C gilt die Abschätzung:
|z1 | − |z2 | ≤ |z1 + z2 | ≤ |z1 | + |z2 |.
Beweis: Mit Hilfe der Minkowskischen Ungleichung.
3.5
Polarkoordinatendarstellung
Zur Beschreibung von Punkten in der komplexen Zahlenebene C verwendet man außer den cartesischen Koordinaten (x, y) sehr oft die Polarkoordinaten (r, ϕ). Für eine komplexe Zahlp
z = (x, y) 6= 0 existiert ein Zahlenpaar
2
(r, ϕ) ∈ R mit der Eigenschaft x = r cos ϕ und y = sin ϕ, wobei r = x2 + y 2 = |z| und ϕ den bis auf ein
additives Vielfaches von 2π bestimmten Winkel im Bogenmaß zwischen der positiven x-Achse und dem Vektor
z bedeutet, wie Abb. 3.4 zeigt. Wir wollen dies in folgender Definition zusammenfassen:
Im(z)
6
y
z = x + iy = r (cos ϕ + i sin ϕ) = reiϕ = |z|ei arg z
r
p
√
r
r = x2 + y 2 = zz = |z|
y
ϕ
ϕ
=
arctan
x = arg z
- Re(z)
x
Abbildung 3.4: Darstellung oder Adressierung“ einer komplexen Zahl z in cartesischen Koordinaten z = (x, y)
”
sowie in Polarkoordinaten z = (r, ϕ).
Definition 3.5.1 [Polarkoordinatendarstellung]: Eine Darstellung einer komplexen Zahl z in der Form
z = r (cos ϕ + i sin ϕ)
heißt Polarkoordinatendarstellung der Zahl z.
Für den Winkel ϕ mit 0 ≤ ϕ < 2π setzen wir
ϕ = arg z.
Mit Hilfe der Taylorreihen der Funktionen ex , sin x und cos x läßt sich ein Zusammenhang herleiten, mit dem
man die Polarkoordinatendarstellung noch viel eleganter ausdrücken kann:
Satz 3.5.1: Es gilt die Eulersche Identität
eiϕ = cos ϕ + i sin ϕ.
∞
P
xk ; Für x = iϕ erhalten wir:
Beweis: Die Taylorreihe für ex lautet ex =
k!
k=0
eiϕ =
k
∞
∞ 2ν+1 2ν+1
∞
∞
∞ k k
∞ 2ν 2ν
P
P
P
P
P
P
(iϕ)
i
ϕ
ϕ2ν
ϕ2ν+1
i ϕ
i ϕ
=
=
+
=
(−1)ν
+i
(−1)ν
,
k!
k!
(2ν)!
(2ν
+
1)!
(2ν)!
(2ν
+ 1)!
ν=0
ν=0
ν=0
ν=0
k=0
k=0
wobei wir (1) die Summe in gerade und ungerade Potenzen zerlegt und (2) für i2ν = (−1)ν und i2ν+1 =
i(−1)ν gesetzt haben. Die beiden Potenzreihen identifizieren wir als die Taylorreihen der Funktionen
cos ϕ und sin ϕ und wir erhalten :
eiϕ = cos ϕ + i sin ϕ.
Für die Polarkoordinatendarstellung konjugiert komplexer Zahlen gilt
Satz 3.5.2: Ist z = r (cos ϕ + i sin ϕ) = reiϕ so gilt für die konjugiert komplexe Zahl:
z = r (cos ϕ − i sin ϕ) = re−iϕ .
Beweis: Mit cos(−ϕ) = cos ϕ und sin(−ϕ) = − sin ϕ erhalten wir:
z = r (cos ϕ + i sin ϕ) = r (cos ϕ − i sin ϕ) = r [cos(−ϕ) + i sin(−ϕ)] = re−iϕ .
3.6
Potenzen und Wurzeln komplexer Zahlen
Die Menge der komplexen Zahlen C bilden einen Körper undQdeshalb können wir wie im Reellen die Potenz
n
z n für z ∈ C und n ∈ N0 definieren durch z 0 = 1 und z n = ν=1 z. Für die Polarkoordinatendarstellung der
n
Potenz z gilt:
Satz 3.6.1: Ist z = r (cos ϕ + i sin ϕ) = reiϕ so gilt für die Potenz z n = rn [cos(nϕ) + i sin(nϕ)] = rn ei(nϕ) .
Beweis: Wir beweisen die Behauptung wieder einmal mit vollständiger Induktion.
(1) Für den Fall n = 0 ist die Behauptung trivial.
(2) Für ein n ≥ 0 gelte z n = rn [cos(nϕ) + i sin(nϕ)]. Dann bekommen wir:
z n+1 = z n · z = rn [cos(nϕ) + i sin(nϕ)] · r (cos ϕ + i sin ϕ) =
rn+1 [cos(nϕ) cos ϕ − sin(nϕ) sin ϕ + i (sin(nϕ) cos ϕ + cos(nϕ) sin ϕ)] =
rn+1 [cos(n + 1)ϕ + i sin(n + 1)ϕ] .
Damit folgt die Behauptung.
Für den Fall z 6= 0 und n ∈ N setzen wir wie im Reellen: z −n = 1/z n . Es gilt dann allgemein:
Satz 3.6.2: Ist z = r (cos ϕ + i sin ϕ) = reiϕ 6= 0 so gilt für m ∈ Z:
z m = rm [cos(mϕ) + i sin(mϕ)] = rm ei(mϕ) .
Beweis: Für m ≥ 0 haben wir die Gültigkeit schon gezeigt. Sei also m = −n für n ∈ N:
cos(nϕ) − i sin(nϕ)
1
z −n = 1n = n
·
=
z
r [cos(nϕ) + i sin(nϕ)] cos(nϕ) − i sin(nϕ)
cos(nϕ) − i sin(nϕ)
= r−n [cos(−nϕ) + i sin(−nϕ)] = r−n ei(−nϕ) .
1
Bemerkung: Ist z eine komplexe Zahl vom Betrag 1, d.h. gilt z = cos ϕ + i sin ϕ, und ist n ∈ Z, so ergibt sich
aus obigem Satz die interessante Formel von Moivre:
n
n
eiϕ = (cos ϕ + i sin ϕ) = cos(nϕ) + i sin(nϕ) = ei(nϕ)
r−n
Nachdem wir nun geklärt haben, was man unter einer Potenz einer komplexen Zahl versteht, wollen wir uns der
umgekehrten Fragestellung widmen, nämlich der Wurzel aus einer komplexen Zahl. Dazu untersuchen wir die
Gleichung z n = ζ mit z, ζ ∈ C und n ∈ N.
Definition 3.6.1: Eine Lösung z der Gleichung
zn = ζ
heißt n-te Wurzel aus ζ.
Im Falle ζ = 0 haben wir als Lösung offenbar nur z = 0. Für ζ 6= 0 machen wir den Ansatz
ζ = ρ(cos ψ + i sin ψ) = ρeiψ ,
z = r(cos ϕ + i sin ϕ) = reiϕ ,
und erhalten z n = rn ei(nϕ) = ρeiψ = ζ. Aus dieser Gleichung folgt sofort, dass rn = ρ und nϕ = ψ+2πk, k ∈ Z
erfüllt sein muss. Zwei komplexe Zahlen sind gleich, wenn sie gleiche Real- und Imaginärteile haben, oder
gleichwertig, gleiche Beträge und Argumente haben. Eine Lösung der obiger Gleichung muss also notwendig von
folgender Form sein:
ψ
2πk
ψ
√
2πk
ψ 2πk
√
n
k ∈ Z.
zk = ρ cos
+
+ i sin
+
= n ρ ei( n + n ) ,
n
n
n
n
Dieses Ergebnis würde bedeuten, dass es unendlich viele Lösungen zur Gleichung z n = ζ gibt. Dem ist aber
nicht so, da nur n Lösungen voneinander verschieden sind. Setzten wir nämlich k = κn + ν mit κ ∈ Z und
ν = 0, 1, 2, . . . , n − 1, so gilt:
ψ 2πk
ψ
2π(κn + ν)
ψ
2πν
+
= +
= +
+ 2πκ.
n
n
n
n
n
n
Ein Resultat der Tatsache, dass der Winkel oder das Argument einer komplexen Zahl eben nur bis auf ein
Vielfaches von 2π bestimmt ist (wegen der Periodizität der Winkelfunktionen).
Bezüglich der Lösungen der n-ten Wurzel aus einer komplexen Zahl können wir zusammenfassend behaupten:
Satz 3.6.3: Für n ∈ N und ζ 6= 0 hat die Gleichung
z n = ζ = |ζ|ei arg ζ = ρeiψ = ρ(cos ψ + i sin ψ)
genau n verschiedene Wurzeln (Lösungen). Diese sind gegeben durch:
p
√
arg ζ
2πν
2πν
zν = n ρeiϕν = n |ζ|eiϕν mit ϕν = ψ
n + n = n + n , und ν = 0, 1, 2, . . . , n − 1.
Bemerkung: Die Wurzeln von z n = ζ bilden die Ecken eines regelmäßigen n-Eckes auf dem Kreis |z| =
wie Abb. 3.5 demonstriert.
p
n
|ζ|,
ψ = arg ζ
ρ = |ζ|
Im(z)
1.5
ζ
Im(z)
1
1
ζ
z2
z0
ρ
0.5
0.5
ψ
z1
ψ
3
z1
0
z0
0
Re(z)
−0.5
Re(z)
z19
√
3 ρ
−0.5
z2
−1
2π
20
−1
−1.5
−1.5
−1
−0.5
0
0.5
1
1.5
−1
−0.5
0
0.5
1
Abbildung 3.5: Lösungen (Wurzeln) zur Gleichung z 3 = − 32 + i (links) und z 20 = − 31 + 43 i (rechts). Die Lösungen
bilden die Ecken eines regelmäßigen n-Eckes.
Beispiel: Wir wollen die 3-te Wurzel der komplexen Zahl −1 + i bestimmen, d.h. wir suchen die Lösungen
der Gleichung
z 3 = −1 + i = ζ. Als erstes
wir Betrag und Argument der Zahl ζ und erhalten
bestimmen
p
√
Im(ζ)
3π
|ζ| = ζζ = 2 und arg ζ = arctan Re(ζ) = 4 (der Winkel muss im 2. Quadranten liegen). Wir
p
√
√ iϕ
3
1
2πk
erhalten genau 3 Lösungen: zk =
2e k = 6 2eiϕk mit ϕk = 3π
4 3 + 3 und k = 0, 1, 2.
√
√
√ 19π
3π
11π
Die einzelnen Lösungen lauten: z0 = 6 2ei 12 , z1 = 6 2ei 12 und z2 = 6 2ei 12 . Wir können die Probe
h √ 19π i3 √ 19π
√ 3π 16π
√ 3π
machen für z2 indem wir z23 berechnen: z23 = 6 2ei 12
= 2ei 4 = 2ei 4 ei 4 = 2ei 4 .
Beispiel: Die 4-te Wurzel der (reellen) Zahl −1 kann nur Lösungen im Komplexen besitzen. Wir suchen also
Lösungen zur Gleichung z 4 = −1+i0 = ζ. Als erstes bestimmen wir wieder
√ Betrag und Argument der Zahl
ζ und erhalten |ζ| = 1 und arg ζ = π. Es gibt genau 4 Lösungen: zk = 4 1eiϕk = 1eiϕk mit ϕk = π4 + 2πk
4
und k = 0, 1, 2, 3.
π
Die einzelnen Lösungen lauten: z0 = ei 4 , z1 = ei
3π
4
, z 2 = ei
5π
4
und z3 = ei
7π
4
.
Beispiel: Die 10-te Wurzel der (reellen) Zahl 1 hat im Rellen nur eine Lösung. Im Komplexen erhalten wir
genau 10 Lösungen. Wir bestimmen Betrag und Argument der Zahl ζ und erhalten |ζ| = 1 und arg ζ = 0.
Die 10 Lösungen sind von der Form: zk = 1eiϕk mit ϕk = 2πk
10 und k = 0, 1, 2, . . . , 9.
2π
2π
2π
2π
Die einzelnen Lösungen lauten: z0 = ei0 = 1, z1 = ei 10 , z2 = ei 10 2 , z3 = ei 10 3 , . . ., z9 = ei 10 9 .
4
Abstrakte Räume
Ein Raume ist eine Menge von Elementen M = {a, b, c, . . . , f, g, h, . . . , ϕ, ψ, χ, . . . , x, y, z}, deren Zahl endlich,
abzählbar unendlich, meistens aber sogar überabzählbar unendlich sein kann. Die Elemente von M sind die
Objekte für die man sich interessiert und für die gewisse Rechenregeln gelten sollen. Mit diesen Rechenregeln
werden Strukturelemente definiert und mit dieser Struktur wird die Menge erst zu dem, was wir unter einem
Raum verstehen. Räume sind also Mengen mit darauf definierten Strukturen. Im Folgenden lernen wir einige
Typen von Räumen kennen.
4.1
Vektorraum
Die Strukturelemente eines Vektorraums umfassen eine Vektoraddition und eine Multiplikation mit einem Skalar
(Körperelement). Ein Vektorraum wird auch als linearer Raum bezeichnet.
Definition 4.1.1 [Vektorraum, linearer Raum]: Ein Tripel (V, +, ∗) bestehend aus einer Menge V , einer
Addition“ und einer Multiplikation mit einem Skalar,“
”
”
+: V ×V →V
∗ : K×V →V
(a, b) 7→ a + b,
(k, a) 7→ k ∗ a,
heißt Vektorraum über einem Körper K, wenn folgende Axiome für alle a, b, c ∈ V und h, k ∈ K gelten:
Vektoraddition
a+b= b+a
Kommutativgesetz
(a + b) + c = a + (b + c)
Assoziativgesetz
Es gibt 0 ∈ V mit
a+0=a
Zu jedem a ∈ V gibt es
ein (−a) ∈ V mit a + (−a) = 0
Existenz eines neutralen Elementes
(Nullvektor)
Existenz inverser Elemente
Multiplikation mit einem Skalar
k ∗ (h ∗ a) = (kh) ∗ a
man schreibt dann kha
1∗a=a
k ∗ (a + b) = k ∗ a + k ∗ b
Distributivgesetze
(k + h) ∗ a = k ∗ a + h ∗ a
Bemerkung: Die Elemente von V werden als Vektoren bezeichnet und die Elemente von K als Skalare. Für
K = R spricht man von einem reellen Vektorraum, für K = C von einem komplexen Vektorraum.
Bemerkung: Mit obigen Definitionen folgen die bekannten Eigenschaften
0 ∗ a = 0,
k∗0=0
und
(−1) ∗ a = −a.
31
Beispiel:
(1) Die Mengen Rn und Cn der reellen und komplexen n-Tupel bilden mit a + b = (a1 + b1 , . . . , an + bn ) und
k ∗ a = (ka1 , . . . , kan ) einen Vektorraum. Die Axiome können leicht überprüft werden. Insbesondere ist
das Nullelement oder der Nullvektor gegeben durch 0 = (0, . . . , 0).
(2) Die Menge aller Polynome vom Grad ≤ 2 bilden einen Vektorraum. Die Summe zweier Polynome p1 (x) =
a0 + a1 x + a2 x2 und p2 (x) = b0 + b1 x + b2 x2 sowie das Produkt eines Polynoms mit einem Skalar
hp1 (x) = ha0 + ha1 x + ha2 x2 sind wieder Polynome vom Grad ≤ 2.
(3) Die Menge C(a, b) der auf [a, b] stetigen Funktionen bildet einen Vektorraum, da sowohl die Summe zweier
stetiger Funktionen (f + g)(x) = f (x) + g(x) als auch das Produkt mit einem Skalar (λf )(x) = λf (x)
wieder eine stetige Funktion ergibt. Das Nullelement ist hier die Funktion f (x) = 0 auf [a, b].
(4) In der Codierungstheorie und in der Kryptographie sind die Vektorräume Znp und insbesondere Zn2 wichtig.
Hier entspricht die Vektoraddition der bitweisen XOR-Verknüpfung.
P∞
(5) Der Raum l2 = {f |f =<x1 , x2 , . . . , xi , . . .>, xi ∈ K, i=1 |xi |2 < ∞} der unendlichen Zahlenfolgen wird
mit f + g =<x1 + y1 , x2 + y2 , . . . , xi + yi , . . .> und λf =<λx1 , λx2 , . . . , λxi , . . .> zum Vektorraum, da
2
2
2
wegen |xi + yi |2 ≤ (|xi | + |yi |) ≤ (|xi | + |yi |) + (|xi | − |yi |) = 2|xi |2 + 2|yi |2 aus f ∈ l2 und g ∈ l2 auch
f + g ∈ l2 geschlossen werden kann. Insbesondere ist das Nullelement gegeben durch 0 = (0, 0, . . .) ∈ l2 . 4.2
Metrischer Raum
Will man ein Maß für die Verschiedenheit von Elementen einer Menge haben, so führt dies zwangsläufig zum
Begriff des Abstandes zweier Elemente. Einen Raum M mit dem Strukturelemtent Abstand bezeichnet man als
metrischen Raum, den Abstand als Metrik.
Definition 4.2.1 [Metrischer Raum]: Ein Paar (M, d) bestehend aus einer Menge M und einer Abbildung
M × M → [0, ∞)
(x, y) 7→ d(x, y)
d:
heißt metrischer Raum, wenn folgende Axiome gelten:
d(x, y) ≥ 0
d(x, y) = 0
für alle
x, y ∈ M
genau dann, wenn x = y
d(x, y) = d(y, x)
für alle
d(x, y) ≤ d(x, z) + d(z, y)
Nichtnegativität
x, y ∈ M
Symmetrie
x, y, z ∈ M
für alle
Dreiecksungleichung
d(x, y) heißt Abstand der Elemente x und y. Den Abstand bezeichnet man auch als Metrik.
Bemerkung: Ein metrischer Raum besteht demnach aus einer Menge M und einem auf M definierten Abstand d. Man bezeichnet einen metrischen Raum deswegen oft mit (M, d) oder, wenn Verwechslungen
ausgeschlossen sind, auch einfach nur mit M .
Beispiel: Mit der Abstandsdefinition d(x, y) = |x − y| ist R ein metrischer Raum, denn es gilt:
|x − y| ≥ 0 für alle
x, y ∈ R
und |x − y| = 0 ⇐⇒ x = y,
|x − y| = |(x − z) + (z − y)| ≤ |x − z| + |z − y| für alle x, y, z ∈ R.
Beispiel: Folgende Mengen bilden metrische Räume:
s
n
P
n
(1) (R , d) mit d(x, y) =
(xi − yi )2 für x, y ∈ Rn .
i=1
(2) (Rn , d) mit
d(x, y) =
n
P
i=1
(3) (R, d)
mit
(4) (C, d)
mit
|xi − yi |
|x − y|
1 + |x − y|
für
x, y ∈ Rn .
für x, y ∈ R.
p
d(z1 , z2 ) = |z1 − z2 | = (x1 − x2 )2 + (y1 − y2 )2
d(x, y) =
für
z1 , z2 ∈ C.
In einem metrischen Raum kann man unter anderem Folgen auf Konvergenz untersuchen, weil man ja mit Hilfe
der Metrik beurteilen kann ob sich Elemente immer näher“ kommen.
”
4.3
Der normierte Raum
In vielen Anwendungen ist die Struktur des benutzten Raumes an allen Stellen gleich, d.h. dass man Abstandsmessungen als Relativmessungen zwischen zwei Elementen betrachten kann. Dann kann man umgekehrt auch
den Abstand zum Nullelement als ausgezeichnet betrachten. Voraussetzung hierfür ist ein Raum mit Linearitätsstruktur. An Stelle des Abstandes tritt der schärfere Begriff der Norm.
Definition 4.3.1 [Normierter Raum]: Ein Paar (V, k · k) bestehend aus einem Vektorraum V und einer
Abbildung, genannt Norm,
k·k :
V → [0, ∞)
a 7→ kak
heißt normierter Raum, wenn folgende Axiome gelten:
kak ≥ 0
kak = 0
für alle
a∈V
genau dann, wenn a = 0
kλak = |λ| · kak
für alle
ka + bk ≤ kak + kbk
Nichtnegativität
a ∈ V und λ ∈ K
für alle
a, b ∈ V
Homogenität
Dreiecksungleichung
Bemerkung: Die Dreiecksungleichung besagt, dass die Länge einer Seite eines Dreiecks immer kleiner als die
Summe der Längen der anderen beiden Seiten ist.
Bemerkung: Jeder normierte Raum ist zugleich auch ein metrischer Raum, weil durch die Norm eine Metrik
induziert wird: d(x, y) = kx − yk. Umgekehrt läßt sich nicht jeder metrische Raum normieren.
Beispiel: In Kn (Rn , Cn ) kann man folgende Normen einführen:
(1) kak = max |ai |,
1≤i≤n
(2) kak =
(3) kak =
(4) kak =
Pn
i=1
|ai |,
p
Pn
2
i=1
p
Pn
p
i=1
∞-Norm, Maximumsnorm
1-Norm, Betragsnorm
|ai |2 ,
2-Norm, Euklidsche Norm,
|ai |p ,
p-Norm.
Beispiel: Der Raum l2 wird mit kf k =
4.4
p
P∞
2
i=1
|xi |2 zum normierten Raum.
Der unitäre Raum
Als weiteres Strukurelement führen wir das Innere Produkt“ oder einfach Skalarprodukt“ ein, um nicht nur
”
”
Abstände und Längen, sondern auch den Begriff des Winkels aus der Vektorrechnung abstrakt zu beschreiben.
Definition 4.4.1 [Unitärer Raum]: Ein Paar (V, <, >) bestehend aus einem Vektorraum V und einer
Abbildung, genannt Inneres Produkt,
<, >:
V ×V →K
(a, b) 7→<a, b>
heißt unitärer Raum, wenn folgende Axiome gelten:
<a, b> = <a, b>
für alle
<a, λb> = λ <a, b>
a, b ∈ V
a, b ∈ V und λ ∈ K
für alle
<a, b1 + b2> = <a, b1> + <a, b2>
<a, a> ≥ 0
und
<a, a> = 0
a, b1 , b2 ∈ V
für alle
genau dann, wenn
a = 0.
Bemerkung: Einfache Folgerungen:
<λa, b> = λ <a, b>,
<a1 + a2 , b> = <a1 , b> + <a2 , b>.
Bemerkung: Es gilt <a, b> = 0, wenn mindestens einer der beiden Faktoren Null ist. Die Umkehrung gilt
allerdings nicht. Das Innere Produkt kann auch Null sein, wenn beide Faktoren a, b von Null verschieden
sind. Dann heißt a orthogonal zu b. Man schreibt hierfür a⊥b.
√
Bemerkung: Ein Inneres Produkt induziert eine Norm und folglich auch eine Metrik. Mit kak = <a, a> ist
eine auf ganz V definierte Zahlenfunktion definiert, die die Normaxiome erfüllt.
In einem unitären Raum gilt die sehr wichtige Schwarzsche Ungleichung:
Satz 4.4.1 [Schwarzsche Ungleichung]: Es gilt | <a, b> | ≤ kak · kbk.
Beweis: Sofern a oder b oder beide Null sind, ist die Schwarzsche Ungleichung offenbar richtig. Sei also a 6= 0
und b 6= 0. Wir zerlegen dann zum Beispiel a =<b, a> b/kbk2 + c und erhalten <b, c> = 0, wie das
Innere Produkt mit b zeigt. Folglich erhalten wir
kak2 = <a, a> =
| <a, b> |2
| <a, b> |2
2
2
·
kbk
+
kck
≥
kbk4
kbk2
Bemerkung: In der Schwarzschen Ungleichung gilt das Gleichheitszeichen genau dann, wenn a und b linear
abhängig sind.
Beispiel: In Kn (Rn , Cn ) kann man folgende Innere Produkte einführen:
n P
n
P
(1) <a, b> =
ai Aij bj
mit einer positiv definiten, hermiteschen Matrix Aij = Aji ,
i=1 j=1
(2) <a, b> =
n
P
ai bi , Spezialfall von (1) mit Aij = δij .
i=1
Beispiel: Der Raum l2 wird mit
<f, g> =
∞
P
xi yi
zum unitären Raum.
i=1
Beispiel: Der Raum C(a, b) der über [a, b] stetigen Funktionen wird mit
<f, g> =
Rb
f (x)g(x) dx
zum unitären Raum.
a
Wir hatten oben bereits festgestellt, dass ein Inneres Produkt zwar Null ist, wenn einer der beiden Faktoren
Null ist, man diese Aussage aber nicht umkehren darf. Zum Beispiel das Innere Produkt < f, g > von f =
(1, 0, 0, . . .) ∈ l2 und g(0, 1, 0, . . .) ∈ l2 gleich Null.
Definition 4.4.2 : Zwei Elemente f, g ∈ M heißen orthogonal f ⊥g, wenn <f, g> = 0.
Für den weiteren Gebrauch ist der Begriff eines normierten Vektors notwendig.
Definition 4.4.3: Ein Vektor f ∈ M heißt normiert, wenn kf k = 1.
Eine Menge von normierten Vektoren die paarweise orthogonal sind, definieren ein Orthonormalsystem.
Definition 4.4.4: Eine Menge von Vektoren {ϕi } ⊂ M heißt Orthonormalsystem (o.n.S), wenn
<ϕi , ϕj > = δij .
In unitären Räumen ist das Schmidtsche Orthogonalisierungsverfahren anwendbar und eine endliche oder
abzählbare Menge {fi } linear unabhängiger Vektoren fi ∈ M läßt sich in eine orthonormierte Menge {ϕi }
gleicher Mächtigkeit umformen, so dass die linearen Hüllen gleich sind.
4.5
Banach- und Hilberträume
In Räumen stellt sich oft die Frage inwieweit man Elemente durch andere approximieren kann. Dies führt zum
Begriff der Konvergenz.
Definition 4.5.1: Eine Folge <fn> von abzählbar vielen Elementen fn ∈ M eines metrischen Raumes heißt
gegen f ∈ M konvergent, bezeichnet fn ⇒ f , wenn d(fn , f ) → 0 im üblichen Zahlensinne gilt, d.h. wenn
zu jedem ε > 0 eine natürliche Zahl Nε ∈ N existiert, so dass
d(fn , f ) < ε
für alle n ≥ Nε gilt.
Diese Definition verlangt die Kenntnis des Grenzwertes, was nicht immer möglich ist. Als notwendige Bedingung
erwarten wir aber, dass sich die Elemente immer ähnlicher werden. Dies berücksichtigt folgende Definition.
Definition 4.5.2: Eine Folge <fn> von abzählbar vielen Elementen fn ∈ M eines metrischen Raumes heißt
Cauchy-Folge oder Fundamentalfolge oder in sich konvergent,“ wenn zu jedem ε > 0 eine natürliche
”
Zahl Nε existiert, so dass
d(fn , fm ) < ε
für alle m, n ≥ Nε gilt.
Unsere Erwartungen formulieren wir in folgendem Satz:
Satz 4.5.1: Notwendige Bedingung für die Konvergenz einer Folge <fn> gegen ein Grenzelement f ist, dass
<fn> eine Cauchy-Folge ist.
Beweis: Aus d(fn , f ) → 0 folgt d(fn , fm ) ≤ d(fn , f ) + d(fm , f ) → 0.
Als nächsts müssen wir untersuchen, ob die In-sich-Konvergenz“ auch hinreichend für die Existenz eines Grenz”
wertes ist. Wie wir bei rationalen Zahlenfolgen gesehen haben, konvergiert nicht jede Cauchy-Folge. Mathematisch besonders bequem sind nun Räume bei denen jede Cauchy-Folge auch einen Grenzwert besitzt.
Definition 4.5.3 [Vollständigkeit]: Ein metrischer Raum M heißt vollständig, wenn jede Cauchy-Folge
ein Limeselement in M besitzt.
Da bestimmte Eigenschaften oder Strukturmerkmale bei Verwendung der Räume immer wieder vorkommen,
trifft man folgende Vereinbarungen:
Definition 4.5.4 [Banachraum]: Ein linearer, normierter, vollständiger Raum heißt Banachraum.
Definition 4.5.5 [Hilbertraum]: Ein linearer, unitärer, vollständiger Raum heißt Hilbertraum.
Bemerkung: Jeder Hilbertraum ist zugleich auch Banachraum.
5
Differentialrechnung
Die Differentialrechnung spielt in den Naturwissenschaften eine zentrale Rolle, da sehr viele Naturgesetze
(Newtonsche Bewegungsgleichung, Schrödinger-Gleichung, Boltzmann-Gleichung, uva.) durch Differentialgleichungen beschrieben werden. Deshalb werden wir uns in diesem Kapitel mit der Methodik und Anwendung
der Differentialrechnung beschäftigen.
5.1
Das Tangentenproblem
Die Differentialrechnung geht wie viele Gebiete der Analysis auf ein geometrisches Problem zurück, nämlich
auf das Problem, an eine Kurve in der Ebene Tangenten zu konstruieren. Um uns diesen Sachverhalt klar zu
machen betrachten wir eine auf [a, b] definierte Funktion f deren Graph in Abb. 5.1 zu sehen ist. Im Punkt
3
y
T
f (x) − f (x0 )
∆y
kP = ∆x =
x − x0
2.5
SP
f (x)
P
2
f (x)
1.5
f (xn )
∆y
P0
f1(x0 )
∆x
0.5
0
a
−0.5
−8
−6
x0
−4
−2
0
xn
x
2
x
b
4
6
8
10
Abbildung 5.1: Graph der Funktion f . Im Punkt P0 = (x0 , f (x0 )) soll eine Tangente an die Kurve konstruiert
werden.
P0 = (x0 , f (x0 )) wollen wir eine Tangente konstruieren. Dabei müssen wir akzeptieren, dass eine Tangente T
an die Kurve im Punkt P0 nicht a priori existiert, sondern dass wir sie irgendwie definieren müssen. Wir folgen
dabei der klassischen Idee, nach der die Tangente als Grenzlage von Sekanten definiert wird. Dazu betrachten
wir einen Nachbarpunkt P = (x, f (x)) und die Sekante SP durch die Punkte P0 und P . Diese Sekante wird
dann eindeutig bestimmt durch das Steigungsmaß kp . Existiert nun
lim =
x→x0
f (x) − f (x0 )
= f ′ (x0 )
x − x0
und ist f ′ (x0 ) ∈ R, so definieren wir die Gerade durch den Punkt P0 = (x0 , f (x0 )) mit diesem Steigungsmaß
f ′ (x0 ) (die Ableitung der Funktion f an der Stelle x0 ) als Tangente im Punkt P0 .
5.2
Definition und Eigenschaften der Ableitung
Mit obigen Vorarbeiten können wir uns jetzt der analytischen Definition der Ableitung zuwenden.
Definition 5.2.1 [Ableitung]: Es sei f : R −→ R und D(f ) = I ein beliebiges Intervall.
(1) Die Funktion f heißt differenzierbar an der Stelle x0 ∈ I, wenn der Grenzwert
lim
x→x0
f (x) − f (x0 )
f (x0 + ∆x) − f (x0 )
df
= lim
(x )
=
x − x0
∆x
dx 0
∆x→0
für jede erdenkliche Annäherung an den Punkt x0 existiert. Ist x0 linker (rechter) Endpunkt von
I, so heißt f an x0 auch rechtsseitig (linksseitig) differenzierbar.
(2) Die Funktion f ′ : R −→ R mit
n
o
df
df
D(f ′ ) = x0 : dx (x0 ) existiert und f ′ (x0 ) = dx (x0 )
heißt Ableitung von f .
(3) Ist f ′ stetig auf X ⊂ D(f ′ ), so heißt die Funktion f stetig differenzierbar auf X.
(4) Die höheren Ableitungen einer Funktion werden rekursiv definiert:
d f (n−1) (x) = f (n−1) (x)′ .
f (n) (x) = dx
Die Funktion f wird auch als 0-te Ableitung bezeichnet: f = f (0) .
Im folgenden wollen wir grundlegende Eigenschaften der Differentiation (oder des Differentialoperators) untersuchen. Eine der wichtigsten Eigenschaften des Differenzialoperators ist die Linearität.
Satz 5.2.1 [Linearität]: Die Operation des Differenzierens ist linear, d.h. es gilt für a, b ∈ R
d [af (x) + bg(x)] = a d [f (x)] + b d [g(x)]
dx
dx
dx
oder
[af (x) + bg(x)]′ = a [f (x)]′ + b [g(x)]′ .
Als nächstes wollen wir klären wie Stetigkeit und Differenzierbarkeit zueinander in Beziehung stehen.
Satz 5.2.2: Die Funktion f sei definiert auf I und differenzierbar an der Stelle x0 ∈ I.
Dann ist die Funktion f stetig an x0 . Differenzierbarkeit ist also eine hinreichende Bedingung für Stetigkeit.
Beweis: Für jede Folge < xn > mit xn → x0 , xn ∈ I, xn 6= x0 gilt nach Voraussetzung:
f (xn ) − f (x0 )
→ f ′ (x0 ).
xn − x0
Es folgt:
f (xn ) − f (x0 ) = (xn − x0 ) ·
f (xn ) − f (x0 )
→ 0 · f ′ (x0 ) = 0.
xn − x0
Beispiel: Die stetige Funktion f mit f (x) = |x|, D(f ) = R ist an der Stelle x0 = 0 nicht differenzierbar, weil
lim
x→0+
lim
x→0−
f (x) − f (x0 )
|x| − |0|
= lim+ x − 0 = lim+ x
x = 1, (rechtsseitige Annäherung an 0) und
x − x0
x→0
x→0
f (x) − f (x0 )
|x| − |0|
= lim− x − 0 = lim− −x
x = −1 (linksseitige Annäherung an 0)
x − x0
x→0
x→0
verschiedene Grenzwerte liefern.
Wenn man rein technisch“ differenzieren muss, berechnet man nicht obigen Grenzwert, sondern man bedient
”
sich einer Sammlung von Regeln, den sog. Ableitungsregeln, die im folgenden vorgestellt werden.
5.3
Ableitungsregeln, Kettenregel
In diesem Abschnitt lernen wir Ableitungsregeln kennen, mit denen man in eleganter Weise die mühsame
Grenzwertberechnung umgeht. Durch geschicktes Anwenden der Ableitungsregeln kann man das Differenzieren
komplizierter Funktionen in mehrere, weniger komplizierte, Teilaufgaben zerlegen. Durch diese Vorgangsweise
gelingt es, jede noch so komplizierte Funktion zu differenzieren. Im Gegensatz zur Integralrechnung kann man
also fast alles“ differenzieren.
”
Satz 5.3.1 [Ableitungsregeln]: Die Funktionen f und g seien definiert auf dem Intervall I und differenzierbar an der Stelle x0 ∈ I. Dann gelten folgende Regeln:
(1) Summenregel: f + g ist differenzierbar an x0 und
d
d
d
dx [(f + g)(x)] = dx [f (x)] + dx [g(x)]
(2) Produktregel: f · g ist differenzierbar an x0 und
(f + g)′ (x0 ) = f ′ (x0 ) + g ′ (x0 )
oder
(f · g)′ (x0 ) = f ′ (x0 ) · g(x0 ) + f (x0 ) · g ′ (x0 )
(3) Quotientenregel: Ist g(x0 ) 6= 0, so ist auch f /g differenzierbar an x0 und
′
f ′ (x0 )g(x0 ) − f (x0 )g ′ (x0 )
f
g (x0 ) =
g 2 (x0 )
Beweis: (Produktregel) Sei < xn > eine Folge aus I mit xn → x0 , xn ∈ I, xn 6= x0 . Dann gilt f (xn ) → f (x0 )
(wegen der Stetigkeit von f ), und wir erhalten:
f (xn )g(xn ) − f (x0 )g(x0 )
(f · g)(xn ) − (f · g)(x0 )
=
=
xn − x0
xn − x0
f (xn )g(xn ) − f (xn )g(x0 ) + f (xn )g(x0 ) − f (x0 )g(x0 )
=
xn − x0
f (xn ) − f (x0 )
g(xn ) − g(x0 )
· g(x0 ) +
· f (xn )
xn − x0
xn − x0
→
f ′ (x0 ) · g(x0 ) + g ′ (x0 ) · f (x0 ).
Zur Differentiation zusammengesetzter Funktionen verwendet man die sehr mächtige Kettenregel:
Satz 5.3.2 [Kettenregel]: Es sei h = g ◦ f definiert auf dem Intervall I. Ist f differenzierbar an der Stelle
x0 ∈ I und g differenzierbar an y0 = f (x0 ), so ist h = g ◦ f differenzierbar an x0 und es gilt:
h′ (x0 ) = (g ◦ f )′ (x0 ) = g ′ (f (x0 )) · f ′ (x0 )
oder
d [g(f (x))] = d [g(f (x))] · d [f (x)]
dx
df
dx
Beweis: Sei < xn > eine Folge aus I mit xn → x0 , xn 6= x0 . Dann gilt:
g(f (xn )) − g(f (x0 ))
g(f (xn )) − g(f (x0 )) f (xn ) − f (x0 )
h(xn ) − h(x0 )
=
=
·
→ g ′ (f (x0 )) · f ′ (x0 )
xn − x0
xn − x0
xn − x0
f (xn ) − f (x0 )
Bemerkung: Die Kettenregel besagt also folgendes: man differenziert die äußerste Funktion (z.B. e() hoch
gibt e() ) und multipliziert mit der Ableitung der nächsten inneren Schicht. Dies wird dann rekursiv so
lange fortgeführt, bis man die innerste Schicht erreicht hat. Lange Rede, kurzer Sinn: äußere mal innere
”
Ableitung.“
d ln(arctan(ax2 )) nach x.
Beispiel: Wir differenzieren die zusammmengesetzte Funktion
dx
Die äußerste Funktion ist ln(·) und diese gibt differenziert 1/(·). Also erhalten wir:
d ln(arctan(ax2 )) =
1
· d arctan(ax2 ). In der nächst inneren Schicht sehen“ wir die
dx
”
arctan(ax2 ) dx
Funktion arctan(·) und diese gibt differenziert 1/(1 + (·)2 ). Also:
d ln(arctan(ax2 )) =
1
1
1
2ax
·
· d ax2 =
·
dx
arctan(ax2 ) 1 + (ax2 )2 dx
arctan(ax2 ) 1 + (ax2 )2
Sehr nützlich ist auch folgende Regel für die Differentiation von Umkehrfunktionen.
Satz 5.3.3 [Umkehrfunktion]: Die Funktion f sei auf I stetig und streng monoton und im Punkt x0 ∈ I
differenzierbar. Gilt f (x0 ) 6= 0, so ist die Umkehrfunktion f −1 differenzierbar an y0 = f (x0 ), und es gilt:
(f −1 )′ (y0 ) =
1 .
f ′ (x0 )
Beweis: Sei < yn > eine Folge aus D(f −1 ) mit yn → y0 und yn 6= y0 . Ferner sei xn = f −1 (yn ). Offensichtlich
gilt xn 6= x0 und xn → x0 (Monotonie und Stetigkeit) und wir erhalten:
f −1 (yn ) − f −1 (y0 )
xn − x0
1
=
=
→ ′1 .
yn − y0
f (xn ) − f (x0 )
f (xn ) − f (x0 )
f (x0 )
xn − x0
Beispiel: Wir betrachten die Funktion f (x) = y = sin x. Für die Umkehrfunktion erhalten wir
f −1 (y) = arcsin y = x. Es gilt nun:
d f −1 (y) = d [arcsin y] = 1 =
1
. Aus sin2 x + cos2 x = y 2 + cos2 x = 1 bekommen wir
cos x
dy
dy
d f (x)
dx
p
d [arcsin y] = p 1
cos x = 1 − y 2 und erhalten die Formel dy
.
1 − y2
5.4
Der Satz von Rolle
In diesem Paragraphen wollen wir den für den weiteren Ausbau der Differentialrechnung wichtigen Satz von
Rolle behandeln. Wir betrachten zunächst lokale Extrema und beweisen das folgende notwendige Kriterium:
Satz 5.4.1: Es sei die Funktion f definiert auf [a, b] und differenzierbar an x0 ∈ (a, b). Hat die Funktion f an
der Stelle x0 ein lokales Maximum oder Minimum, so gilt notwendig f ′ (x0 ) = 0.
Beweis: Hat f an x0 ein lokales Maximum, so gilt für alle genügend großen n: f (x0 ± n1 ) ≤ f (x0 )
f (x0 + 1/n) − f (x0 )
f (x0 − 1/n) − f (x0 )
≤ 0 und f ′ (x0 ) = lim
≥0
1/n
(−1/n)
n→∞
′
Insgesamt erhalten wir deshalb f (x0 ) = 0.
Hieraus folgt: f ′ (x0 ) = lim
n→∞
Aus diesem Satz kann jetzt leicht der Satz von Rolle gefolgert werden:
Satz 5.4.2 [Rolle]: Die Funktion f sei stetig auf [a, b] und differenzierbar auf (a, b), und es gelte f (a) = f (b).
Dann gibt es wenigstens eine ξ ∈ (a, b) mit f ′ (ξ) = 0.
Beweis: Ist f (x) = f (a) für alle x ∈ [a, b], so gilt für jedes ξ ∈ (a, b) : f ′ (ξ) = 0, und wir sind fertig. Andernfalls
gibt es eine Stelle ξ ∈ (a, b) an der f ihr absolutes Minimum oder Maximum annimmt. Nach obigem Satz
gilt für dieses ξ aber f ′ (ξ) = 0.
Bemerkung: Der Satz von Rolle besagt anschaulich, dass der Funktionsgraph von f an einer Stelle ξ eine
horizontale Tangente besitzt wie in Abb. 5.2 dargestellt.
2
y
1.5
1
0.5 = f (b)
f (a)
x
0
a
ξ
b
f (x)
−0.5
−1
−1.5
−6
−4
−2
0
2
4
6
8
10
12
Abbildung 5.2: Visualisierung des Satzes von Rolle. Dieser garantiert die Existenz mindestens eines Punktes
ξ ∈ (a, b) mit einer horizontalen Tangente.
5.5
Der 1. Mittelwertsatz der Differentialrechnung
Mit Hilfe des Satzes von Rolle folgt nun einer der wichtigsten Sätze der Differentialrechnung.
Satz 5.5.1 [1. Mittelwertsatz]: Die Funktion f sei stetig auf [a, b] und differenzierbar auf (a, b). Dann gibt
es mindestens eine Stelle ξ ∈ (a, b) mit:
f (b) − f (a)
= f ′ (ξ).
b−a
Beweis: Wir wenden den Satz von Rolle auf die Funktion
f (b) − f (a)
(x − a)
x ∈ [a, b]
b−a
an und stellen fest, dass F (a) = F (b) = f (a) gilt. Ausserdem ist F stetig auf [a, b] und differenzierbar auf
(a, b), so dass die Voraussetzungen des Satzes von Rolle erfüllt sind. Deshalb gibt es ein ξ ∈ (a, b) mit
F ′ (ξ) = 0. Wegen
F (x) = f (x) −
F ′ (x) = f ′ (x) −
f (b) − f (a)
b−a
ergibt sich f ′ (ξ) =
f (b) − f (a)
.
b−a
Bemerkung: Dieser Satz besagt geometrisch, dass mindestens ein ξ ∈ (a, b) existiert mit der Eigenschaft,
dass die Tangente T im Kurvenpunkt (ξ, f (ξ)) und die Sekante S durch die Punkte (a, f (a)) und (b, f (b))
parallel verlaufen, wie in Abb. 5.3 dargesrtellt. Über die genaue Lage von ξ ∈ (a, b) kann i.a. keine Auskunft
gegeben werden, was einer reinen Existenzaussage gleichkommt.
y
1.8
T
1.6
1.4
f (ξ)
f (b)
S
1.2
1
0.8
0.6
0.4
0.2
f (a)
x
0
a
−0.2
−3
ξ
−2
−1
b
0
1
2
3
4
5
6
Abbildung 5.3: Visualisierung des 1. Mittelwertsatzes der Differentialrechnung. Über die Lage von ξ ∈ (a, b) kann
i.a. keine Auskunft gegeben werden.
Der Mittelwertsatz erweist sich oft als geeignet zur Abschätzung von Funktionen.
1 .
Beispiel: Für alle x mit 0 < x < 1 gilt: 1 + x < ex < 1 −
x
Zum Nachweis wenden wir den Mittelwertsatz auf die Funktion et im Intervall [0, x] an und erhalten für
ein geeignetes ξ mit 0 < ξ < x:
ex − e0 = eξ .
Für eξ gilt die Abschätzung 1 < eξ < ex , und hieraus ergibt sich:
x
ex − 1 > 1 ⇔ ex > 1 + x
ex − 1 < ex ⇔ ex < 1
und
x
x
1−x
x < ln(1 + x) < x.
Beispiel: Für alle x > 0 gilt: 1 +
x
Zum Nachweis wenden wir den Mittelwertsatz auf die Funktion ln(1 + t) im Intervall [0, x] an und erhalten
für ein geeignetes ξ mit 0 < ξ < x:
ln(1 + x) − ln(1)
1 < 1 < 1, und hieraus ergibt
= 1 .
Für 1 gilt die Abschätzung 1 +
x
x
1+ξ
1+ξ
1+ξ
sich:
ln(1 + x)
ln(1 + x)
1 ⇔ ln(1 + x) > x
und
> 1+
< 1 ⇔ ln(1 + x) < x
x
x
x
1+x
Die Regeln von de l’Hospital
5.6
Die Berechnung von Grenzwerten von Funktionen kann mitunter äußerst kompliziert werden, vor allem wenn
man den Grenzwert eines Quotienten
h(x) =
f (x)
g(x)
für den Fall bestimmen muss, dass f (x) und g(x) beide 0 oder beide ∞ sind. Zur Ermittlung von Grenzwerten
solchen Typs stehen uns aber jetzt die Mittel der Differentialrechnung zur Verfügung. Nach de l’Hospital
gelten einfache Regeln:
Satz 5.6.1 [de l’Hospital]: Es sei −∞ ≤ a < b ≤ +∞ und −∞ ≤ l ≤ ∞, und ferner seien die Funktionen
f und g differenzierbar auf (a, b). Es gelte g ′ (x) 6= 0 auf (a, b) und
f ′ (x)
= l.
′
x→b g (x)
lim
Dann folgt aus
lim f (x) = lim g(x) = 0
x→b
x→b
a cos(ax)
sin(ax)
= lim
= a.
x
1
x→0
Beispiel: Es gilt für alle a ∈ R, a 6= 0:
x→0
Beispiel: Es gilt für jedes α ∈ (0, ∞):
x→∞
Beispiel: Es gilt:
Beispiel: Es gilt:
lim
die Aussage:
1
= lim 1 α = 0.
lim lnαx = lim
x
x→∞ αx
x→∞ xαxα−1
lim x ln x = lim+ ln1x = lim+ 1 = − lim+ x = 0.
x→0 x − 1
x→0
x→0
x
x2
x→0+
x
lim x = lim+ e
x→0+
x→0
x ln x
=e
lim x ln x
x→0+
= e0 = 1.
lim
x→b
f (x)
= l.
g(x)
6
Integralrechnung
Neben der Differentialrechnung bildet die Integralrechnung den zweiten großen Pfeiler in den Naturwissenschaften. Viele Naturgesetze, wie etwa die Boltzmann-Gleichung, enthalten einen Integralterm und die meisten
dieser Naturgesetze werden durch geeignete Integrationsmethoden gelöst.
Die Idee des Riemannschen Integrals
6.1
So wie die Differentialrechnung geht auch die Integralrechnung auf ein geometrisches Problem zurück, nämlich
auf das Problem, den Flächeninhalt von Punktmengen F der Ebene zu berechnen, die von Kurven begrenzt werden wie Abb. 6.1 zeigt. Wie bei der Differentialrechnung müssen wir uns klarmachen, dass der Flächeninhalt der
1.8
y
1.8
1.6
y
1.6
f (x)
1.4
f (x) = c
1.4
1.2
1.2
1
1
F
0.8
0.8
0.6
0.6
0.4
0.4
0.2
0.2
0
x0
a
−0.2
−3
−2
b
−1
0
1
2
3
4
5
F
a
−0.2
6
−3
−2
b
−1
0
1
2
3
4
5
x
6
Abbildung 6.1: Flächeninhalt der Punktmenge F unterhalb der Kurve f (x).
Punktmenge F nicht a priori definiert ist. Wir müssen vielmehr definieren, was wir unter einem Flächeninhalt
einer Punktmenge verstehen. Dabei verwenden wir selbstverständlich den geläufigen und bewährten Flächeninhalt von Rechtecken. Ist etwa f (x) = c > 0 auf [a, b], so wollen wir weiterhin als Flächeninhalt von F das
Produkt (b − a) · c nehmen.
Wir wollen kurz die äußerst einfache aber geniale Idee von Riemann darstellen. Dazu benötigen wir einige
Definitionen:
Definition 6.1.1 [Partition]: Gegeben sei ein Intervall [a, b].
(1) Je n + 1 Zahlen P = {x0 , x1 , . . . , xn } mit
a = x0 < x1 < . . . < xn = b
bilden eine Partition (Zerlegung) von [a, b].
(2) Für 1 ≤ k ≤ n heißt
Ik = [xk−1 , xk ]
k-tes Teilintervall der Partition, und
∆xk = xk − xk−1
Länge von Ik .
(3) Die Zahl kP k = max {∆xk } heißt Norm oder Feinheit der Partition P .
1≤k≤n
Offensichtlich gilt:
n
P
k=1
∆xk = b − a.
Die Verfeinerung einer Partition wird wie folgt definiert:
Definition 6.1.2 [Verfeinerung einer Partition]:
Eine Partition P ′ = {x′0 , x′1 , . . . , x′n } eines Intervalls [a, b] heißt Verfeinerung einer Partition
{x0 , x1 , . . . , xn } ⊂ {x′0 , x′1 . . . , x′n }.
P = {x0 , x1 , . . . , xn } des Intervalls [a, b], wenn gilt:
Jetzt können wir Ober- und Untersummen definieren:
Definition 6.1.3 [Ober- und Untersumme]: Die Funktion f sei beschränkt auf [a, b], und es sei
P = {x0 , x1 , . . . , xn } eine Partition von [a, b]. Wir setzen:
(1) mk (f ) = inf f (x)
Mk (f ) = sup f (x)
(2) m(f ) = inf f (x)
M (f ) = sup f (x)
Ik
[a,b]
(3) S P (f ) =
(4) S P (f ) =
P
P
P
P
Minimum und Maximum von f (x) im Intervall Ik .
Ik
Minimum und Maximum von f (x) im Intervall [a, b].
[a,b]
mk (f ) · ∆xk =
Mk (f ) · ∆xk =
n
P
k=1
n
P
k=1
mk (f ) · ∆xk
Untersumme von f bzgl. P .
Mk (f ) · ∆xk
Obersumme von f bzgl. P .
Abbildung 6.2 veranschaulicht oben eingeführte Begriffe. Die Partition P erzeugt eine untere und obere
1.8
y
1.6
f (x)
1.4
1.2
1
0.8
0.6
0.4
0.2
0
−0.2
a = x0
−3
−2
I1 I2
x1 x2
−1
I3
I4
x3
0
I5
x4
1
I6
I7
x6 x7
2
3
x5
I8
x
I9
x8 x9 = b
4
5
6
Abbildung 6.2: Approximation des Flächeninhaltes der Punktmenge F durch eine Ober- und Untersumme der
Funktion f bezüglich der Partition P .
Treppenfunktion, deren zugehörige Flächeninhalte gerade S P (f ) und S P (f ) sind. Dabei gilt offensichtlich
S P (f ) ≤ S P (f ). Streben nun für immer feiner werdende Unterteilungen S P (f ) und S P (f ) einem gemeinsamen
Wert zu, was einer Approximation der Funktion f von unten und oben durch Treppenfunktionen entspricht,
so definieren wir nach Riemann diesen gemeinsamen Wert als Flächeninhalt der Punktmenge F . Die Funktion f nennt man dann Riemann-integrierbar. Abbildung 6.3 zeigt die Ober- und Untersumme für eine feinere
Unterteilung und ein Vergleich mit Abb. 6.2 zeigt, dass die Obersummen kleiner und die Untersummen größer
werden.
1.8
y
1.6
f (x)
1.4
1.2
1
0.8
0.6
0.4
0.2
0
a = x0
xk
xn = b
x
−0.2
−3
−2
−1
0
1
2
3
4
5
6
Abbildung 6.3: Für feiner werdende Partitionen werden die Obersummen kleiner und die Untersummen größer.
Streben sie einem gemeinsame Wert zu, so nennt man die Funktion f Riemann-integrierbar.
Die Ober- und Untersummen besitzen eine Reihe von Eigenschaften die für den weiteren Ausbau wichtig sind.
Es gilt folgende Abschätzung:
Satz 6.1.1: Die Funktion f sei beschränkt auf [a, b], und es sei P eine Partition von [a, b]. Dann gilt:
m(f ) · (b − a) ≤ S P (f ) ≤ S P (f ) ≤ M (f ) · (b − a).
Beweis: Da m(f ) ≤ mk (f ) ≤ Mk (f ) ≤ M (f ) für k = 1, 2, . . . , n ist, ergibt sich nach Multiplikation mit ∆xk
und Aufsummieren:
P
P
m(f ) · (b − a) ≤ mk (f ) · ∆xk ≤ Mk (f ) · ∆xk ≤ M (f ) · (b − a).
P
P
Die wichtigste Eigenschaft von Ober- und Untersummen ist die Tatsache, dass bei Verfeinerung der Partition
die Obersummen nicht wachsen und die Untersummen nicht fallen.
Satz 6.1.2: Die Funktion f sei beschränkt auf [a, b], es seien P und P ′ Partitionen von [a, b] und P ′ eine
Verfeinerung von P . Dann gilt:
S P ′ (f ) ≤ S P (f )
und
S P ′ (f ) ≥ S P (f ).
Aus diesen beiden Sätzen folgt nun:
Satz 6.1.3: Die Funktion f sei beschränkt auf [a, b]. Es seien P1 und P2 beliebige Partitionen von [a, b], dann
gilt:
S P1 (f ) ≤ S P2 (f ).
Beweis: Die Partition P = P1 ∪ P2 ist eine Verfeinerung sowohl von P1 als auch P2 . Deshalb gilt:
S P1 (f ) ≤ S P (f ) ≤ S P (f ) ≤ S P2 (f ).
6.2
Untere und obere Darboux-Integrale
Wir können jetzt die oberen und unteren Darboux-Integrale definieren.
Definition 6.2.1 [Darboux-Integrale]: Die Funktion f sei beschränkt auf [a, b]. Man bezeichnet:
(1)
Rb
a
(2)
Rb
f (x) dx = sup S P (f )
als unteres Darboux-Integral, und
f (x) dx = inf S P (f )
als oberes Darboux-Integral.
P
P
a
Wir können leicht nachvollziehen, dass das untere Darboux-Integral immer kleiner oder gleich dem oberen
Darboux-Integral sein muss:
Satz 6.2.1: Die Funktion f sei beschränkt auf [a, b]; dann gilt:
Rb
a
f (x) dx ≤
Rb
f (x) dx.
a
Beweis: Für beliebige Partitionen P1 und P2 gilt S P1 (f ) ≤ S P2 (f ). Halten wir P2 fest, so folgt:
sup S P1 (f ) ≤ S P2 (f ).
Hieraus ergibt sich:
P1
Rb
a
f (x) dx = sup S P1 (f ) ≤ inf S P2 (f ) =
P1
P2
Rb
f (x) dx.
a
Eine weitere wichtige Eigenschaft ist die Additivität des unteren und oberen Darboux-Integrals bezüglich des
Integrations-Intervalls.
Satz 6.2.2: Die Funktion f sei beschränkt auf [a, b], und es sei a < c < b. Dann gilt:
(1)
Rb
f (x) dx =
a
(2)
Rb
Rc
f (x) dx +
a
f (x) dx =
a
Rc
Rb
f (x) dx
c
f (x) dx +
a
Rb
f (x) dx
c
Das Riemannsche Integral
6.3
Mit Hilfe des oberen und unteren Darboux-Integrals definieren wir jetzt das Riemannsche Integral.
Definition 6.3.1 [Riemannsches Integral]: Die Funktion f sei beschränkt auf [a, b]. Gilt
Rb
f (x) dx =
Rb
f (x) dx,
a
a
so heißt f Riemann-integrierbar auf [a, b]. Der gemeinsame Wert heißt das bestimmte Riemann-Integral
von f auf [a, b] und wird mit
Rb
f (x) dx
bezeichnet.
a
Rb
Ist f (x) ≥ 0 auf [a, b] und f Riemann-integrierbar, so können wir jetzt mit Recht die Zahl a = f (x) dx als
den Flächeninhalt der Punktmenge unter der Kurve“ bezeichnen. Das Riemannsche Integral stellt also unsere
”
konstruktive Definition des Flächeninhaltes dar. Die Frage, ob der Flächeninhalt der Punktmenge unter der
”
Kurve“ existiert, ist jetzt äquivalent mit der Frage, ob die Funktion f Riemann-integrierbar ist.
Beispiel: Wir betrachten auf [a, b] die Funktion f mit f (x) = 1 für alle x ∈ [a, b]. Für jede Partition P von
[a, b] gilt offenbar: S P (f ) = b − a und S P (f ) = b − a. Hieraus ergibt sich
Rb
a
1 dx =
Rb
a
1 dx = b − a. Also ist f auf [a, b] Riemann-integrierbar, und es gilt
Beispiel: Wir betrachten auf [a, b] die Funktion f mit
1 falls x ∈ [a, b] und x rational
f (x) =
.
0 falls x ∈ [a, b] und x irrational
Rb
a
1 dx = b − a.
Für jede Partition P von [a, b] gilt offenbar: S P (f ) = b − a und S P (f ) = 0. Hieraus ergibt sich
Rb
a
1 dx = 0 6=
Rb
a
1 dx = b − a. Also ist f auf [a, b] nicht Riemann-integrierbar.
Für die Praxis ist es erforderlich, ein Kriterium zu haben, mit dessen Hilfe man die Integrierbarkeit einer
gegebenen Funktion entscheiden kann. Der folgende Satz liefert uns dazu eine notwendige und hinreichende
Bedingung.
Satz 6.3.1 [Riemannsche Integrabilitätskriterium]: Die beschränkte Funktion f ist auf [a, b] genau dann
Riemann-integrierbar, wenn zu jedem ε > 0 eine Partition P existiert mit
S P (f ) − S P (f ) < ε.
Mit Hilfe dieses Satzes können wir die Integrierbarkeit zweier wichtiger Klassen von Funktionen beweisen.
Satz 6.3.2: Die Funktion f sei monoton auf [a, b]. Dann ist f Riemann-integrierbar auf [a, b].
Satz 6.3.3: Die Funktion f sei stetig auf [a, b]. Dann ist f Riemann-integrierbar auf [a, b].
6.4
Riemannsche Summen
Wir wissen jetzt, dass jede stetige Funktion Riemann-integrierbar ist. Doch ist vorläufig von dieser Erkenntnis
Rb
bis zur tatsächlichen Berechnung von a f (x) dx ein weiter Weg. Wir müßten etwa explizit alle Obersummen
berechnen und von dieser Zahlenmenge das Infinum bilden. In einigen Fällen kann die Berechnung durch die
sog. Riemannschen Summen erleichtert werden.
Definition 6.4.1 [Riemannsche Summe]: Die Funktion f sei beschränkt auf dem Intervall [a, b], P =
{x0 , x1 , . . . , xn } sei eine Partition von [a, b]. Ferner sei ξ = {ξ1 , ξ2 , . . . , ξn } eine Menge von Punkten mit
der Eigenschaft ξk ∈ [xk−1 , xk ] = Ik für k = 1, 2, . . . , n. Dann heißt
n
P
P
f (ξk )∆xk
eine Riemannsche Summe zur Partition P .
SP (f, ξ) = f (ξk )∆xk =
P
k=1
Wir notieren, dass es zu einer Partition P unendlich viele Riemannsche Summe gibt, da es für die Wahl der
Zwischenpunkte unendlich viele Möglichkeiten gibt, wie Abb. 6.4 zeigt. Auf den ersten Blick erscheint diese
Theorie noch komplizierter als die Theorie der Ober- und Untersummen, von denen es wenigstens zu einer
Partition nur je eine gibt. Die freie Auswahl der Zwischenpunkte ξk bietet manchmal numerische Vorteile. Wir
bemerken ferner noch, dass i.a. eine Ober- und Untersumme keine Riemannsche Summe ist, da die Zahlen
Mk (f ) und mk (f ) in Ik nicht angenommen zu werden brauchen.
1.8
y
1.6
f (x)
1.4
1.2
1
0.8
0.6
0.4
SP (f, ξ)
0.2
0
−0.2
a = x0
−3
−2
ξ1 ξ2 ξ3
x1 x2
−1
ξ4
x3
0
ξ5
x4
1
ξ6
ξ7
x6 x7
2
3
x5
ξ8 ξ9
x8 x9 = b
4
5
x
6
Abbildung 6.4: Approximation des Flächeninhaltes der Punktmenge F durch eine Riemannsche Summe. Zu einer
gewählten Partition gibt es unendlich viele Riemannsche Summen.
Satz 6.4.1: Die Funktion f sei beschränkt auf [a, b]. Für jede Partition P von [a, b] gilt bei beliebiger Wahl
der Zwischenpunkte ξk ∈ Ik , k = 1, 2, . . . , n:
S P (f ) ≤ SP (f, ξ) ≤ S P (f ).
Beweis: Für jedes k gilt mk (f ) ≤ f (ξk ) ≤ Mk (f ). Multipliziert man mit ∆xk und summiert über k = 1, 2, . . . , n,
so folgt die Behauptung.
Wir definieren jetzt die Konvergenz Riemannscher Summen. Alternativ hätten wir auch diese Definition für
die Riemann-Integrierbarkeit verwenden können.
Definition 6.4.2 [Konvergenz Riemannscher Summen]: Die Funktion f sei beschränkt auf dem Intervall [a, b]. Existiert eine Zahl I ∈ R und zu jedem ε > 0 ein δε > 0 so, dass für alle Partitionen P von
[a, b] mit kP k < δε bei beliebiger Wahl der ξk ∈ Ik folgt:
|SP (f, ξ) − I| < ε,
so heißen die Riemannschen Summen konvergent gegen I und wir schreiben:
I = lim SP (f, ξ).
kP k→0
Wir beobachten, dass der Nachweis der Konvergenz von Riemann-Summen SP (f, ξ) außerordentlich schwierig
ist, da man ja, bei vorgegebenen ε > 0, alle Partitionen und bei fester Partition noch jede Wahl der Zwischenpunkte in Betracht ziehen muss. Dieses Verfahren ist für die Praxis also vollkommen unbrauchbar. Wissen wir
jedoch, dass die Funktion f auf [a, b] Riemann-integrierbar ist, so genügt es, eine einfache Folge von RiemannSummen zu betrachten.
Satz 6.4.2: Es sei die Funktion f Riemann-integrierbar auf [a, b], < P (n) > eine Folge von Partitionen mit
lim kP (n) k = 0, und ξ (n) eine feste Wahl von Zwischenpunkten zur Partition P (n) . Dann gilt:
n→∞
Rb
a
f (x) dx = lim SP (n) (f, ξ (n) ).
n→∞
R1
Beispiel: Es soll 0 x2 dx berechnet werden. Da f (x) = x2 auf [0, 1] stetig ist, existiert das Integral, und wir
können obigen Satz verwenden. Dazu betrachten wir die Folge < P (n) > von Partitionen des Intervalls [0, 1]
(n)
mit xk = k/n für k = 0, 1, 2, . . . , n. Es gilt dann offensichtlich lim kP (n) k → 0. Für die Zwischenpunkte
n→∞
(n)
wählen wir ξk
= k/n für k = 1, 2, . . . , n. Dann folgt:
n
n
P
P
(n)
(n)
k2 k − k − 1 = 1 P k2 =
SP (n) (f, ξ (n) ) =
f (ξk )∆xk =
2 n
3
n
n k=1
k=1 n
P (n)
R1
n(n + 1)(2n + 1)
1 )(2 + 1 ) 1 → 2 = 1 .
= 13 ·
= 1(1 + n
Es gilt also x2 dx = 13 .
n
6
6
6
3
n
0
Ra
Beispiel: Es soll für ein a > 1 das Integral 1 (1/x) dx berechnet werden. Dieses Integral existiert, da f (x) = 1/x
(n)
auf [1, a] stetig ist. Wir betrachten die Folge < P (n) > von Partitionen des Intervalls [1, a] mit xk = ak/n
(n)
(n)
(n)
k/n
(k−1)/n
(k−1)/n
1/n
für k = 0, 1, 2, . . . , n. Es ist dann ∆xk = xk − xk−1 = a
−a
=a
· a
− 1 , so dass
(n)
also lim kP (n) k → 0 gilt. Für die Zwischenpunkte wählen wir ξk
n→∞
SP (n) (f, ξ (n) ) =
P
P (n)
(n)
(n)
f (ξk )∆xk
=
1/n
− 1 → ln a.
= n a1/n − 1 = a
1/n
6.5
n
P
k=1
(n)
= xk−1 für k = 1, 2, . . . , n. Dann folgt:
n
P
a−(k−1)/n · a(k−1)/n · a1/n − 1 =
a1/n − 1 =
k=1
Wir bekommen also
Ra
1
1
x dx = ln a.
Der Hauptsatz der Differential- und Integralrechnung
Zur Berechnung eines Integrals stehen uns bisher nur die Theorien der Unter- und Obersummen sowie der
Riemann-Summen zur Verfügung. Die numerische Berechnung mit diesen Mitteln bereitet allerdings erhebliche
Mühen. Es ist deshalb erforderlich, einfachere Integrationsmethoden bereitzustellen. Solche Methoden erhalten
wir praktisch nebenbei, wenn wir jetzt die Verbindung zwischen den beiden Hauptdisziplinen der Analysis, der
Differentiations- und Integrationstheorie, herstellen.
Dazu brauchen wir folgende Definition:
Definition 6.5.1: Es sei I ein beliebiges Intervall und die Funktion f Riemann-integrierbar auf jedem Intervall [a, b] ⊂ I. Ist x0 ∈ I, so heißt die Funktion F mit D(f ) = I und
Rx
F (x) = f (t) dt
Integral von f als Funktion der oberen Grenze.
x0
Für eine Funktion f (t) ≥ 0 stellt F (x) anschaulich den in Abb. 6.5 eingefärbten Flächeninhalt dar.
1.8
y
1.6
f (t)
1.4
1.2
1
0.8
F (x)
0.6
0.4
0.2
0
a
x0
x
t
b
−0.2
−3
−2
−1
0
Abbildung 6.5: Darstellung der Funktion F (x) =
Abhängigkeit der oberen Grenze x.
1
Rx
x0
2
3
4
5
6
f (t) dt als bestimmtes Integral der Funktion f (t) in
Wir wollen nun Eigenschaften der Funktion F (x) untersuchen.
Satz 6.5.1: Es sei I ein beliebiges Intervall und die Funktion f Riemann-integrierbar auf jedem Intervall
[a, b] ⊂ I. Dann ist F stetig auf I.
Beweis: Es sei x ∈ I und [a, b] ⊂ I ein beliebiges Intervall mit x ∈ (a, b). Auf [a, b] gilt |f (x)| ≤ M mit einer
geeigneten Konstanten M . Ist < xn > eine Folge aus I mit xn → x, so gilt xn ∈ [a, b] für alle genügend
großen n, und es folgt dann:
x
xRn
xRn
Rn
Rx
|F (xn ) − F (x)| = f (t) dt − f (t) dt = f (t) dt ≤ |f (t)| dt ≤ |xn − x| · M .
x0
x0
x
x
Es gilt daher F (xn ) → F (x).
setzen wir die Stetigkeit von f an einem Punkt voraus, so können wir sogar die Differenzierbarkeit von F an
diesem Punkt beweisen.
Satz 6.5.2 [Haupsatz der Differential- und Integralrechnung]: Es sei I ein beliebiges Intervall und die
Funktion f Riemann-integrierbar auf jedem Intervall [a, b] ⊂ I. Ist f stetig an x ∈ I, so ist F differenzierbar an x, und es gilt: F ′ (x) = f (x).
Beweis: Da f an x stetig ist, gibt es zu jedem ε > 0 ein δε > 0, so dass für alle t mit t ∈ I und |t − x| < δε
gilt: |f (t) − f (x)| < ε. Ist nun < xn > eine Folge aus I mit xn 6= x und xn → x, so gibt es ein Nε , so dass
|xn − x| < δε für alle n > Nε . Für diese n gilt dann:
"
#
x
F (xn ) − F (x)
1
Rn
Rx
−
f
(x)
=
f
(t)
dt
−
f
(t)
dt
−
f
(x)
=
xn − x
xn − x
x0
x0
x
Rn
|x − x|
1
=
· [f (t) − f (x)] dt < n
· ε = ε.
|xn − x| x
|xn − x|
Dieser Satz heißt mit Recht Haupsatz oder Fundamentalsatz der Differential- und Integralrechnung. Er stellt
das Bindeglied zwischen Differentiations- und Integrationstheorie dar und ist damit von eminenter Bedeutung
für die gesamte Analysis. Als erste Anwendung benutzen wir ihn zur Berechnung von Integralen. Dazu brauchen
wir den Begriff der Stammfunktion einer Funktion.
Definition 6.5.2 [Stammfunktion]: Es sei I ein beliebiges Intervall und die Funktionen f und F seien
definiert auf I und F sei differenzierbar auf I. Gilt auf I
F ′ (x) = f (x)
so heißt F Stammfunktion von f auf I.
Über die Gesamtheit der Stammfunktionen, welche eine Funktion besitzen kann, gilt:
Satz 6.5.3: Es seien F1 und F2 Stammfunktionen von f auf I.
Dann gilt mit einer geeigneten Konstanten c auf I:
F1 (x) = F2 (x) + c.
Eine der wichtigsten Anwendungen des Hauptsatzes ist:
Satz 6.5.4: Es sei f stetig auf [a, b] und F eine Stammfunktion von f auf [a, b]. Dann gilt:
Rb
a
f (t) dt = F (b) − F (a).
Rx
Beweis: Die Funktion F1 (x) = a f (t) dt ist eine Stammfunktion von f auf [a, b]. Es gilt also F1 (x) = F (x) + c
mit einer geeigneten Konstanten c. Für x = a erhalten wir 0 = F (a) + c und für x = b:
Rb
a
f (t) dt = F1 (b) = F (b) + c = F (b) − F (a).
Bemerkung: Wir benutzen bisweilen folgende Schreibweise:
b
Rb
f (t) dt = F (x) = F (b) − F (a).
a
6.6
a
Die Mittelwertsätze der Integralrechnung
Wie in der Differentialrechnung, so gibt es auch in der Integralrechnung Mittelwertsätze, welche in der Praxis
insbesondere zur Abschätzung von Integralen benutzt werden.
Satz 6.6.1 [1. Mittelwertsatz]: Es sei f stetig auf [a, b]. Dann existiert ein ξ ∈ (a, b) mit
Rb
a
f (x) dx = f (ξ) · (b − a).
Rx
Beweis: Wir betrachten die Funktion F (x) = a f (t) dt. Nach dem Mittelwertsatz der Differentialrechnung gibt
es eine Stelle ξ ∈ (a, b) für die F (b) − F (a) = F ′ (ξ) · (b − a) gilt.
Rb
Wir erhalten also a f (x) dx = f (ξ) · (b − a).
Für eine auf [a, b] positive Funktion f besagt dieser Satz, dass die Fläche unter der Kurve für ein geeignetes
ξ ∈ (a, b) gleich dem Inhalt des Rechtecks mit den Seiten b − a und f (ξ) ist, wie in Abb. 6.6 angedeutet.
Eine Verallgemeinerung des 1. Mittelwertsatzes ist:
Satz 6.6.2 [Erweiterter 1. Mittelwertsatz]: Es sei f und g stetig, sowie g(x) ≥ 0 (oder g(x) ≤ 0) auf
[a, b]. Dann existiert ein ξ ∈ (a, b) mit
Rb
a
f (x)g(x) dx = f (ξ)
Rb
g(x) dx.
a
Bemerkung: Wählen wir als spezielle, zulässige Funktion g(x) = 1 auf [a, b], so folgt wieder die Aussage des
1. Mittelwertsatzes.
Zum Schluss und der Vollständigkeit halber zeigen wir noch:
y
1.8
f (x)
1.6
1.4
1.2
f (ξ)
1
0.8
f (ξ) · (b − a)
0.6
0.4
0.2
0
a
ξ
x
b
−0.2
−3
−2
−1
0
1
2
3
4
5
6
Abbildung 6.6: Visualisierung des 1. Mittelwertsatzes der Integralrechnung.
Satz 6.6.3 [2. Mittelwertsatz]: Die Funktion f sei monoton auf [a, b], f ′ und g seien stetig auf [a, b]. Dann
existiert ein ξ ∈ (a, b) mit
Rb
a
6.7
Rξ
Rb
f (x)g(x) dx = f (a) g(x) dx + f (b) g(x) dx.
a
ξ
Der Taylorsche Satz
In der Diferentialrechnung haben wir gesehen, dass aus dem Verhalten der Ableitungen einer Funktion wesentliche Aussagen über die Funktion gemacht werden können. In diesem Abschnitt werden wir dies noch deutlicher
herausarbeiten.
Wir wenden uns dabei der Aufgabe zu, eine auf einem Intervall [a, b] definierte Funktion f durch ein Polynom
zu approximieren. Hierzu beschäftigen wir uns zunächst mit dem Fall, dass die Funktion f selbst ein Polynom
ist.
Pn
Satz 6.7.1 [Taylorscher Satz für Polynome]: Ist f (x) = ν=0 aν xν ein Polynom und x0 ∈ R, so hat f
auf R die Darstellung:
f (x) =
n
P
f (ν) (x0 )
(x − x0 )ν .
ν!
ν=0
Beweis: Durch Anwendung des binomischen Satzes ergibt sich mit gewissen Koeffizienten bν :
"
#
n
n
n
ν
n
P
P
P
P
P
ν
ν
ν
µ ν−µ
f (x) =
aν x =
aν (x − x0 + x0 ) =
aν
=
bν (x − x0 )ν .
µ (x − x0 ) x0
ν=0
ν=0
ν=0
µ=0
ν=0
f (0) (x0 )
. Für ein k mit 1 ≤ k ≤ n differenzieren
Setzen wir x = x0 so erhalten wir: f (x0 ) = b0 , d.h. b0 =
0!
n
P
wir f k-mal und erhalten: f (k) (x) =
bν ν(ν − 1) · . . . · (ν − k + 1)(x − x0 )ν−k . Setzen wir wieder x = x0 ,
ν=k
so erhalten wir: f
(k)
(x0 ) = bk · k!, d.h. bk =
f (k) (x0 )
. Somit ist die Behauptung bewiesen.
k!
Aus diesem Satz folgt insbesondere, dass ein Polynom f vom Grad n schon vollkommen bestimmt ist, wenn an
einer beliebigen Stelle x0 die Ableitungen f (0) (x0 ), f (1) (x0 ), . . . f (n) (x0 ) bekannt sind. Diese kennt man, sobald
man das Polynom in einer beliebigen Umgebung U (x0 ) kennt. Die Taylorsche Formel gestattet also, aus dem
lokalen Verhalten in einer beliebig kleinen Umgebung auf das globale Verhalten des Polynoms auf der ganzen
reellen Achse zu schließen.
Unser nächstes Ziel ist die Formulierung eines analogen Satzes für Funktionen, die hinreichend oft differenzierbar
sind. Wir werden sehen, dass solche Funktionen durch gewisse Polynome approximiert werden können.
Satz 6.7.2 [Taylorscher Satz]: Es sei I ein beliebiges Intervall, es sei x0 ∈ I, n ∈ N0 und die Funktion f
sei (n + 1)-mal stetig differenzierbar auf I. Dann gilt:
(1) Für alle x ∈ I läßt sich f durch die Taylorsche Formel mit der Entwicklungsmitte x0 darstellen:
f (x) =
n
P
f (ν) (x0 )
(x − x0 )ν + Rn (x, x0 ).
ν!
ν=0
Rx
Rn (x, x0 ) = 1 · (x − t)n f (n+1) (t) dt
n! x0
(2) Für das Restglied Rn (x, x0 ) gilt:
Beweis: Es sei x ∈ I.
Rx
Rx
Für n = 0 ist x0 f ′ (t) dt = f (x) − f (x0 ), und daraus f (x) = f (x0 ) + x0 f ′ (t) dt = f (0) (x0 ) + R0 (x, x0 ).
Ist n > 0, so nehmen wir an, dass für ein k mit 0 ≤ k < n die Behauptung schon gilt:
f (x) =
k
P
f (ν) (x0 )
(x − x0 )ν + Rk (x, x0 ).
ν!
ν=0
Dann erhalten wir durch partielle Integration:
#
Rx
Rx (x − t)k+1 (k+2)
−(x − t)k+1 (k+1) x
1
1
k (k+1)
Rk (x, x0 ) =
(x − t) f
(t) dt =
f
(t) +
f
(t) dt =
k! x0
k!
k+1
k+1
x0
x0
=
"
Rx
f (k+1) (x0 )
f (k+1) (x0 )
1
(x − x0 )k+1 +
(x − t)k+1 f (k+2) (t) dt =
(x − x0 )k+1 + Rk+1 (x, x0 ).
(k + 1)!
(k + 1)! x0
(k + 1)!
Hieraus folgt die Behauptung für k + 1.
Für die praktische Anwendung dieses Satzes ist es wichtig, das Restglied abschätzen zu können. Mit Hilfe der
Mittelwertsätze der Integralrechnung können wir zwei integralfreie Darstellungen des Restgliedes angeben:
Satz 6.7.3: Es gibt ein ϑ ∈ (0, 1) und ein Θ ∈ (0, 1), so dass gilt:
(1) Rn (x, x0 ) =
f (n+1) (x0 + ϑ(x − x0 ))
(x − x0 )n+1
(n + 1)!
(2) Rn (x, x0 ) =
f (n+1) (x0 + Θ(x − x0 ))
(1 − Θ)n (x − x0 )n+1
n!
Lagrangesche Form.
Cauchysche Form.
Beweis: Durch direkte Anwendung des erweiterten 1. Mittelwertsatzes folgt die Lagrangesche Form und durch
Anwendung des 1. Mittelwertsatzes folgt die Cauchysche Form.
Ist nun f auf I beliebig oft differenzierbar, so gilt die Taylorsche Formel für alle n ∈ N. Für jedes feste x ∈ I
sind dann die Taylorpolynome
n
X
f (ν) (x0 )
Tn (x, x0 ) =
(x − x0 )ν
ν!
ν=0
Teilsummen der unendlichen Reihe
∞
X
f (ν) (x0 )
ν=0
ν!
(x − x0 )ν ,
der Taylorschen Reihe von f bzgl. der Entwicklungsmitte x0 . Die Frage unter welchen Voraussetzungen diese
Reihe konvergiert und gegen welchen Wert, wird durch folgenden Satz beantwortet:
Satz 6.7.4: Ist f auf I beliebig oft differenzierbar, so läßt sich f an der Stelle x ∈ I genau dann durch die
Taylorreihe mit Entwicklungsmitte x0 darstellen:
f (x) =
∞
P
f (ν) (x0 )
(x − x0 )ν ,
ν!
ν=0
wenn gilt:
lim Rn (x, x0 ) = 0.
n→∞
Bemerkung: Es kann durchaus vorkommen, dass die Folge der Restglieder an einer Stelle x konvergiert,
aber nicht gegen 0. In diesem Fall konvergiert zwar auch die Taylorreihe an x, aber nicht gegen den
Funktionswert.
Beispiel: Wir betrachten auf R die Funktion f mit
2
e−1/x falls x =
6 0
f (x) =
. Die Funktion f ist auf R beliebig oft differenzierbar, und es ist f (ν) (0) =
0
falls x = 0
∞
P
f (ν) (0) ν
(x) = 0 auf R, und nur für die Entwicklungsmitte x0 = 0 stellt die
ν!
ν=0
Taylorsche Reihe von f die Funktion dar!
0 für ν ∈ N0 . Also gilt
Ein handliches Kriterium zur Entscheidung über Konvergenz der Taylorreihe an einer Stelle liefert:
Satz 6.7.5: Es sei f auf I beliebig
oft differenzierbar und
x ∈ I. Existiert ein von ν ∈ N0 unabhängiges
K > 0 mit
max f (ν) (ξ) ≤ K
bzw.
max f (ν) (ξ) ≤ K so folgt:
[x0 ,x]
f (x) =
[x,x0 ]
∞
P
f (ν) (x0 )
(x − x0 )ν .
ν!
ν=0
Beweis: Die Aussage eribt sich aus der Abschätzung
(n+1)
f
K|x − x0 |n+1
(x0 + Θ(x − x0 ))
|x − x0 |n+1
n+1 |Rn (x, x0 )| = · (x − x0 )
≤
,
da
lim
= 0 ist.
(n + 1)!
(n + 1)!
(n + 1)!
n→∞
7
Unendliche Reihen
In Kapitel 1 Abschnitt 2.2 haben wir den Begriff der unendlichen
Reihe und ihrer Konvergenz eingeführt. Wir
P∞
haben insbesondere erwähnt, dassPeine unendliche ReiheP ν=1 aν nur eine andere Schreibweise für die Folge
n
∞
< sn > der Partialsummen sn = ν=1 aν darstellt und ν=1 aν = s für die Aussage limn→∞ sn = s steht.
Bisher sind wir den unendlichen Reihen im Zusammenhang mit den Taylor-Reihen von Funktionen begegnet.
In diesem Kapitel wollen wir etwas allgemeiner in das sehr wichtige Gebiet der unendlichen Reihen eintauchen.
Dabei werden wir den Körper R der reellen Zahlen zugrunde legen.
7.1
Beispiele unendlicher Reihen
Wir wollen uns zunächst mit ein paar konkreten Beispielen beschäftigen, die wir mit den bisher gewonnenen
Methoden behandeln können.
Satz 7.1.1: Die Reihe
∞
P
1 konvergiert.
2
ν=1 ν
1
> 0 gilt. Wir
Beweis: Die Folge der Teilsummen sn = 12 ist monoton wachsend da sn+1 − sn =
ν
(n + 1)2
können aber auch zeigen, dass sie nach oben beschränkt ist:
i
n−1
n−1
n−1
P
P
P h1
1
1
1
1
sn = 1 +
=1+
−ν+
2 ≤ 1+
ν
1 = 1 + 1 − n < 2.
ν=1 (ν + 1)
ν=1
ν=1 ν(ν + 1)
Nach dem Hauptsatz über monotone Folgen ist die Folge <sn> also konvergent.
Wir bemerken, dass wir bei der vorangegangenen Reihe nur die Konvergenz zeigten, ihre Summe aber nicht
angeben konnten. Im folgenden Beispiel gelingt es sogar die Summe zu berechnen.
Satz 7.1.2: Es gilt
∞
P
ν=1
1
= 1.
ν(ν + 1)
Beweis: Für die Folge der Teilsummen gilt: sn =
n
P
i
n h
P
1
1− 1
1
=
ν
ν + 1 = 1 − n + 1 −→ 1.
ν=1 ν(ν + 1)
ν=1
Eine der wichtigsten Reihen ist die geometrische Reihe
∞
P
q k die wir ja schon kennengelernt haben. Wir fassen
k=0
nochmals die Resultate bezgl. der geometrischen Reihe zusammen:
Satz 7.1.3: Es sei q ∈ R. Dann gilt folgendes:
(1) Für |q| < 1 konvergiert die geometrsiche Reihe und es gilt:
∞
P
k=0
(2) Für alle anderen Werte von q divergiert die geometrsiche Reihe.
55
1 .
qk = 1 −
q
Beweis: Aus
n
P
q n+1
qk = 1 + q + q2 + . . . + qn = 1 −
1−q
k=0
folgt die Behauptung.
Beispiel: Im Zusammenhang mit der Taylor-Entwicklung haben wir noch weitere Reihen erhalten:
∞
∞
2k+1
P
P
xk ,
ex
=
x∈R
sin x =
(−1)k x
, x∈R
k!
(2k + 1)!
k=0
k=0
ln(1 + x)
=
∞
P
k
(−1)k+1 x , x ∈ (−1, 1]
k
k=1
cos x
=
∞
P
2k
(−1)k x ,
(2k)!
k=0
x ∈ R.
Man beachte, dass jedes erlaubte“ x eine konvergente unendliche Reihe ergibt. Dadurch erhält man eine
”
Funktion (Abbildung), weshalb man auch von einer Funktionenreihe spricht.
7.2
Rechenregeln für unendlicher Reihen
Für das Rechnen mit unendlichen Reihen gilt folgende wichtige, einfache Regel:
P∞
P∞
Satz 7.2.1: Es seien ν=1 aν und ν=1 bν zwei konvergente Reihen und α, β ∈ R beliebig.
∞
∞
∞
∞
P
P
P
P
Dann konvergiert auch
(αaν + βbν ), und es gilt:
(αaν + βbν ) = α
aν + β
bν .
ν=1
ν=1
ν=1
ν=1
Pn
Pn
Pn
Beweis: Mit
und den Grenzwertsätzen über Folgen (Summe
ν=1 (αaν + βbν ) = α
ν=1 aν + β
ν=1 bν
konvergenter Folgen konvergiert) folgt sofort die Behauptung.
∞
∞
∞
P
2k + 3 und stellen fest, dass sowohl P 1 als auch P 1 konvergieren.
k
k
k
4
k=0
k=0 2
k=0 4
Deshalb können wir obigen Satz anwenden:
i
∞ h
∞
∞
∞
P
1
2k + 3 = P 1 + 3 = P 1 + 3 P 1 =
+3 1
= 6.
k
k
k
k
k
1
−
1/2
1 − 1/4
4
2
4
2
4
k=0
k=0
k=0
k=0
P
Man
gilt. Ist ∞
ν=1 (αaν + βbν ) konvergent, so brauchen weder
P∞die Umkehrung dieses Satzes nicht P
P∞ beachte, dass
∞
Die
Reihe
(ν
+
(−1)ν) ist trivialerweise konvergent, weil alle
ν=1 bν zu konvergieren.
ν=1
ν=1 aν noch
P∞
Reihenglieder Null sind. Die Reihe ν=1 ν ist jedoch divergent.
Beispiel: Wir betrachten die Reihe
7.3
Das Cauchysche Kriterium für Reihen
Wir wissen, dass eine Folge aus R genau dann konvergiert, wenn sie eine C-Folge ist, gemäß dem Cauchyschen
Konvergenzkriterium. Dieses Kriterium haben wir als ein inneres Kriterium“ bezeichnet, weil es ganz ohne
”
Kenntnis des Grenzwertes erlaubt auf die Konvergenz der Folge zu schließen. In diesem Abschnitt lernen wir
ein inneres Kriterium“ für Reihen kennen.
”
Folgende Definition ist von Vorteil:
P
Definition 7.3.1: Ist ∞
ν=1 aν eine unendliche Reihe, so heißt für n > m ≥ 0
sm,n =
n
P
ν=m+1
aν = am+1 + am+2 + · · · + an
ein Teilstück der Reihe.
Jetzt zeigen wir:
P∞
Satz 7.3.1 [Cauchysches Konvergenzkriterium]: Die Reihe ν=1 aν ist genau dann konvergent, wenn
es zu jedem (noch so kleinem) ε > 0 ein Nε existiert, so dass für alle m, n ∈ N mit n > m > Nε gilt:
n
P
|sm,n | = aν < ε.
ν=m+1
Beweis: Mit
sm,n = sn − sm
folgt die Behauptung sofort aus dem Cauchyschen Kriterium für Folgen. Bemerkung: Das Cauchyschen Konvergenzkriterium besagt also, dass eine Reihe genau dann konvergiert,
wenn |sm,n | unabhängig von der Länge“ des Teilstückes sm,n beliebig klein gemacht werden kann, wenn
”
man nur weit genug hinausgeht,“ d.h. m genügend groß wählt.
”
Beispiel: Wir zeigen
P∞mit Hilfe des Cauchyschen Konvergenzkriteriums nochmals die Divergenz der harmonischen Reihe ν=1 ν1 . Dazu betrachten wir die speziellen Teilstücke sn,2n . Für diese gilt
2n
P
1
1
1
sn,2n =
mit der Konsequenz, dass das Cauchysche Kriterium nicht erfüllt
ν ≥ n · 2n = 2
ν=n+1
werden kann, d.h. die harmonische Reihe ist divergent.
Bemerkung: Es ergibt sich unmittelbar aus dem Cauchyschen Konvergenzkriterium, dass sich das Konvergenzverhalten sowie das Divergenzverhalten durch Weglassen, Hinzufügen oder Abändern endlich vieler
Glieder nicht ändert.
Außerdem folgt, dass die Glieder einer konvergenten Reihe eine Nullfolge bilden:
Satz 7.3.2: Ist die Reihe
∞
P
aν konvergent, so gilt:
ν=1
lim aν = 0.
ν→∞
Beweis: Wir setzen im Cauchyschen Konvergenzkriterium n = m + 1 und erhalten für alle m > Nε :
|sm,m+1 | = |am+1 | < ε.
Hieraus ergibt sich die Behauptung.
Bemerkung: Wir beachten, dass dieser
nur ein notwendiges, nicht aber ein hinreichendes Kriterium
P Satz
1
darstellt. So ist etwa die Reihe ∞
divergent,
obwohl limk→∞ ak = limk→∞ k1 = 0 gilt.
k=1 k
7.4
Absolute Konvergenz
Wir wollen jetzt den Begriff der absoluten
unendlichen Reihen einführen. Zur Motivierung
P∞ Konvergenz
P∞ von ν+1
1
1
1
1
betrachten
wir
die
konvergente
Reihe
a
=
(−1)
ν=1 ν
ν=1
ν = 1 − 2 + 3 − 4 ± · · · und die divergente
P∞
P∞ 1
1
1
1
Reihe ν=1 bν = ν=1 ν = 1 + 2 + 3 + 4 + · · ·. Diese beiden Reihen unterscheiden sich offenbar nur durch
das Vorzeichen ihrer Reihenglieder, denn es gilt nämlich |aν | = bν für alle ν ∈ N. Beim Übergang zu der
mit den Absolutbeträgen gebildeten Reihe geht dramatischerweise die Konvergenz verloren. In der Theorie der
unendlichen Reihen spielen nun diejenigen eine besonders wichtige Rolle, wo dies nicht passiert, d.h. wo auch
die mit den Absolutbeträgen gebildete Reihe noch konvergiert.
Definition 7.4.1: Die Reihe
∞
P
aν heißt:
ν=1
(1) absolut konvergent, wenn
∞
P
ν=1
|aν | konvergiert;
(2) bedingt konvergent, wenn sie konvergiert, aber nicht absolut konvergiert.
Beispiel: Die Reihe
∞ ∞
P
P
1 ist konvergent. (−1)ν+1 12 ist absolut konvergent, denn
(−1)ν+1 12 =
2
ν
ν
ν=1
ν=1
ν=1 ν
∞
P
Beispiel: Die oben erwähnte Reihe
∞
P
(−1)ν+1 ν1 ist (nur) bedingt konvergent.
ν=1
Aus der Konvergenz einer Reihe folgt also nicht immer ihre absolute Konvergenz. Das Umgekehrte ist jedoch
immer gegeben, denn es gilt:
Satz 7.4.1: Ist die Reihe
∞
P
aν absolut konvergent, so ist sie auch konvergent.
ν=1
n
P
Beweis: Es sei n > m und wegen aν ≤
ν=m+1
vergenzkriterium.
7.5
n
P
ν=m+1
|aν | folgt die Behauptung aus dem Cauchyschen Kon
Vergleichskriterium
In sehr vielen Fällen gelingt der Nachweis der Konvergenz bzw. Divergenz einer unendlichen Reihe durch Vergleich mit einer anderen Reihe, einer sog. Majorante“ bzw. Minorante“.
”
”
Satz 7.5.1 [Vergleichskriterium]: Gegeben sei die unendliche Reihe
∞
P
ν=1
(1) Gilt |aν | ≤ cν für alle ν ≥ N und ist
∞
P
cν konvergent, so ist
ν=1
(2) Gilt |aν | ≥ dν ≥ 0 für alle ν ≥ N und ist
∞
P
aν und N ∈ N.
aν absolut konvergent.
ν=1
∞
P
dν divergent, so ist
ν=1
∞
P
ν=1
|aν | divergent.
P∞
Beweis: (1)
sei ε > 0 gegeben. Aus der Konvergenz von
die Existenz eines
ν=1 cν folgtP
PEs
Pn Nε , so dass
n
n
0 ≤ ν=m+1 cν < ε für alle m, n ∈ N mit n > m > Nε . Daher gilt ν=m+1 |aν | ≤ ν=m+1 cν < ε
für alle m, n mit n > m > max{N, Nε }. Die Reihe konvergiert also nach dem Cauchyschen Kriterium
absolut.
P∞
P∞
(2) Würde ν=1 |aν | konvergieren, so würde nach (1) auch ν=1 dν konvergieren, im Widerspruch zu
unserer Voraussetzung.
Beispiel: Die Reihe
∞
P
√1 ist wegen √1 ≥ ν1 divergent.
ν
ν
ν=1
∞
P
(−1)ν · ν!
ist absolut konvergent.
νν
ν=1
∞
P
1 folgt also
Für alle ν ≥ 2 gilt nämlich |aν | = ν!ν = ν1 ·· 2ν ·· ·· ·· νν ≤ 22 . Aus der Konvergenz der Reihe
2
ν
ν
ν=1 ν
die absolute Konvergenz der betrachteten Reihe.
Beispiel: Die Reihe
7.6
Reihen mit nichtnegativen Gliedern
In
diesem Abschnitt untersuchen wir Reihen mit ausschließlich positiven (nichtnegativen) Gliedern, d.h. Reihen
P∞
ν=1 aν mit aν ≥ 0 für ν ∈ N. Wir beginnen mit einem einfachen, aber wichtigen Kriterium, das wir implizit
schon mehrfach verwendet haben.
Satz 7.6.1: Eine Reihe
∞
P
aν mit nichtnegativen Gliedern konvergiert genau dann, wenn die Folge ihrer
ν=1
Teilsummen beschränkt ist.
P
Beweis: Die Folge der Teilsummen sn = nν=1 aν ist offenbar monoton wachsend, so dass sich die Behauptung
sofort aus der Definition der Konvergenz einer Reihe und dem Hauptsatz über monotone Folgen ergibt. Ein weiteres, sehr nützliches, Kriterium geht auf Cauchy zurück.
Satz 7.6.2[ Cauchyscher Verdichtungssatz]: Es sei die Folge der Reihenglieder <aν > monoton fallend
∞
∞
P
P
und aν ≥ 0. Dann konvergiert die Reihe
aν genau dann, wenn
2ν a2ν konvergiert.
ν=1
ν=0
Pn
Pn
Beweis: Wir führen die Bezeichnungen sn = ν=1 aν und σn = ν=0 2ν a2ν ein und bemerken, dass sowohl
<sn> als auch <σn> monoton wachsende Folgen sind.
P∞
(1) Ist ν=0 2ν a2ν konvergent, so ist <σn > beschränkt. Wegen der Monotonie von <aν > erhalten wir
P2n+1 −1
für n ≥ 1: sn ≤ ν=1
aν = a1 + (a2 + a3 ) + (a4 + · · · + a7 ) + · · · + (a2n + a2nP
+1 + · · · + a2n+1 −1 ) ≤
∞
20 a1 + 21 a2 + 22 a4 + · · · + 2n a2n = σn . Also ist auch <sn> beschränkt und somit ν=1 aν konvergent.
P∞
(2) Ist ν=1 aν konvergent, so ist <sn> beschränkt,
und wir erhalten:
σn = 2 12 a1 + 20 a2 + 21 a4 + 22 a8 + · · · + 2n−1 a2n ≤
≤ 2 [a1 + a2 + (a3 +P
a4 ) + (a5 + · · · + a8 ) + · · · + (a2n−1 +1 + · · · + a2n )] = 2s2n . Also ist auch <σn > be∞
schränkt und somit ν=0 2ν a2ν konvergent.
Beispiel: Wir betrachten für ein α ∈ (0, ∞) die Reihe
∞
P
1 .
α
ν
ν=1
(1) Ist α ≤ 0, so ist <aν > mit aν = 1/ν α keine Nullfolge und in diesem Falle divergiert die Reihe.
(2) Ist α > 0, so ist <aν > eine monotone Nullfolge. Nach dem Cauchyschen Verdichtungssatz konvergiert
∞
1 = P 21−α ν konvergiert.
(2 )
ν=0
ν=0
ν=0
Diese geometrische Reihe ist jedoch genau dann konvergent, wenn 21−α < 1 also α > 1 gilt.
die betrachtete Reihe genau dann, wenn die Reihe
∞
P
2ν a2ν =
∞
P
2ν
ν α
Ein weiteres Kriterium zur Beurteilung der Konvergenz von Reihen mit nichtnegativen Gliedern ist das folgende
Integralkriterium, welches ebenfalls auf Cauchy zurückgeht.
Satz 7.6.3 [Integralkriterium]: Es sei < aν > eine monoton fallende Nullfolge, und es sei f (x) monoton
fallend in [1, ∞) mit der Eigenschaft f (ν) = aν für ν ∈ N.
∞
R∞
P
Dann ist die Reihe
aν genau dann konvergent, wenn das Integral f (x) dx konvergiert.
ν=1
1
Beweis: Die Funktion f (x) sei Riemann-integrierbar auf jedem Intervall [A, B] ⊂ [1, ∞), und es gilt
ν+1
R
aν+1 ≤
f (x) dx ≤ aν , wie Abb. 7.1 graphisch veranschaulicht. Durch Summation ergibt sich:
ν
n
P
ν=1
aν+1 ≤
n ν+1
R
P
ν=1 ν
f (x) dx ≤
n
P
aν
sn+1 −a1 ≤
oder
ν=1
Rn
1
f (x) dx ≤ sn . Hieraus folgt, dass
∞
P
aν genau
ν=1
Rn
dann konvergiert, wenn die Folge < f (x) dx> beschränkt ist. Wegen f (x) ≥ 0 ist dies gleichbedeutend
1
mit der Existenz von lim
RR
R→∞ 1
f (x) dx =
R∞
f (x) dx.
1
y
1
0.8
f (x)
0.6
0.4
aν
0.2
a
ν+1
0
ν
0
1
2
3
ν +1
4
x
5
6
7
Abbildung 7.1: Visualisierung des Cauchyschen Integralkriteriums.
Beispiel: Wir betrachten die Reihe
∞
P
νe−ν . Offenbar bilden die Glieder dieser Reihe eine monoton fallende
ν=1
Nullfolge. Für die Funktion f (x) = xe−x gilt:
R RR
RR
RR
f (x) dx = xe−x dx = −xe−x + e−x dx = −Re−R + 1e − e−R + 1e .
1
1
Mit
1
R∞
1
1
f (x) dx = 2e und wegen f (ν) = νe−ν folgt hieraus die Konvergenz der Reihe.
∞
P
1 . Es gilt für ein R > 1:
Beispiel: Wir betrachten für ein α ∈ (0, ∞) noch einmal die Reihe
να
ν=1
(
ln R
RR dx
falls α = 1
,
α =
1 · 1− 1
x
falls α 6= 1
1
α−1
Rα−1
∞
P
1 für α > 1 und die Divergenz für
so dass mit Hilfe des Integralkriteriums die Konvergenz der Reihe
α
ν=1 ν
α ≤ 1 folgt.
7.7
Das Wurzel- und das Quotientenkriterium
In diesem Abschnitt untersuchen wir wieder Reihen mit beliebigen reellen Gliedern. Durch Anwendung des
Vergleichskriterium beweisen wir die beiden Standardkriterien der Reihentheorie.
Satz 7.7.1 [Wurzelkriterium]: Gegeben sei die unendliche Reihe
Wir setzen
aν .
ν=1
1
α = lim |aν | ν .
Dann gilt:
ν→∞
(1) Ist α < 1, so konvergiert
(2) Ist α > 1, so divergiert
∞
P
∞
P
aν absolut.
ν=1
∞
P
aν .
ν=1
(3) Ist α = 1 kann keine Aussage bezgl. Konvergenz oder Divergenz gemacht werden.
Beweis: (1) Ist α < 1, so existiert
ein q ∈ (0, 1) und ein N ∈ N mit |aν | ≤P
q ν für alle ν > N . Aus der Konvergenz
P∞
∞
ν
der geometrischen Reihe ν=1 q folgt daher die Konvergenz von ν=1 |aν |.
(2) Ist α > 1, so können wir eine Folge <νk > natürlicher Zahlen bestimmen mit limk→∞ |aνk |1/νk = α.
Es gibt dann ein K ∈ N, so dass fürP
alle k > K gilt: |aνk |1/νk ≥ 1 oder |aνk | ≥ 1. Hieraus folgt, dass |aν |
∞
keine Nullfolge ist. Somit divergiert ν=1 aν .
P∞
P∞
(3) Für die beiden Reihen ν=1 12 und ν=1 ν1 gilt jeweils limν→∞ |aν |1/ν = 1. Die erste konvergiert,
ν
die zweite divergiert. Das Wurzelkriterium versagt also im Fall α = 1.
1
Beispiel: Die Reihe
Beispiel: Die Reihe
2
∞
P
k 2 ist konvergent, da lim |a | k1 = lim (k ) k = 1 < 1 gilt.
k
k
2
2
k→∞
k→∞
k=0 2
∞
P
1
1
1 = 0 < 1 gilt.
ν ist konvergent, da lim |aν | ν = lim
ln
ν
(ln
ν)
ν→∞
ν→∞
ν=2
Satz 7.7.2 [Quotientenkriterium]: Gegeben sei die unendliche Reihe
∞
P
ν=1
Wir setzen
aν+1 α = lim a
.
ν
ν→∞
(1) Ist α < 1, so konvergiert
(2) Ist α > 1, so divergiert
Dann gilt:
∞
P
aν mit aν 6= 0 für ν = 1, 2, . . ..
aν absolut.
ν=1
∞
P
aν .
ν=1
(3) Ist α = 1 kann keine Aussage bezgl. Konvergenz oder Divergenz gemacht werden.
aν+1 Beweis: (1) Ist α < 1, so existiert ein q ∈ (0, 1) und ein N ∈ N mit a
≤ q für alle ν > N .
ν
|aN | n
an an−1 aN +1 Ist nun n > N , so erhalten wir: |an | = an−1 · an−2 · · · aN · |aN | ≤ q n−N · |aN | = N
·q .
q
P∞
Mit dem Vergleichskriterium folgt die Konvergenz von ν=1 |aν |.
aν+1 (2) Ist α > 1, so gibt es ein N ∈ N mit a
≥ 1 für alle ν > N . Hieraus folgt für alle n > N :
ν
|an+1 | ≥ |an | ≥ · · · ≥ |aN | > 0. Also ist <aν > keine Nullfolge.
P∞
P∞
aν+1 (3) Für die beiden Reihen ν=1 12 und ν=1 ν1 gilt jeweils limν→∞ a
= 1. Die erste konvergiert,
ν
ν
die zweite divergiert. Das Quotientenkriterium versagt also auch im Fall α = 1.
∞
P
ν! xν .
Beispiel: Für ein festes x ∈ R betrachten wir die Reihe
νν
ν=1
ν
h
ν i−1
(ν + 1)!xν+1 (ν)ν aν+1 ν
1
= |x|
Wir erhalten: a
=
·
=
|x|
1
+
, und es ergibt sich
ν
ν+1
ν
ν
+
1
ν
(ν)!x
(ν + 1)
aν+1 |x|
lim a
= e . Die betrachtete Reihe konvergiert absolut für alle x mit |x| < e und divergiert für alle
ν
ν→∞
x mit |x| > e. Für |x| = e ist leider keine Aussage möglich.
A
Spezielle Folgen und Reihen
In diesem Anhang werden wir einige ausgewählte Themen aus dem unerschöpflichen Bereich der Folgen und
Reihen, die in vielen Gebieten der Naturwissenschaften immer wieder vorkommen, etwas genauer untersuchen,
mit dem Ziel, die mathematischen Hintergründe und Methoden zu erhellen und zu vertiefen.
A.1
Die Fibonacci-Folge
In diesem Abschnitt werden wir den Zusammenhang zwischen der Fibonacci-Folge und dem Goldenen
Schnitt etwas genauer unter die Lupe nehmen. Wir beginnen mit dem Goldenen Schnitt: dieser wird auch
als stetige Teilung oder göttliche Teilung bezeichnet. Im Englischen bezeichnet man ihn als golden ratio,
golden section, oder auch golden mean. Dabei wird eine Strecke dermaßen geteilt, dass das Verhältnis des
kürzeren zum längeren Abschnitt gleich dem Verhältnis des längeren Abschnitts zur gesamten Strecke ist, wie
in Abb. A.1 dargestellt. Bezeichnet man den längeren Abschnitt mit a, den Kürzeren mit b, so gilt im Goldenen
b=φ−1
a=1
a+b=φ
Abbildung A.1: Teilung einer Strecke im Goldenen Schnitt.
φ−1
Schnitt ab = a . Mit der Normierung a = 1 und a + b = φ erhält man die Gleichung 1 = 1 , welche
a+b
φ
der quadratischen Gleichung φ2 − φ − 1 = 0 entspricht. Diese hat zwei Lösungen, welche üblicherweise in der
folgenden Form dargestellt werden:
√
√
1+ 5
1− 5
φ1 =
= ϕ = 1.618
und
φ2 =
= 1 − ϕ = −0.618.
2
2
Dieses Verhältnis ϕ, der Goldene Schnitt, wird in der Kunst und Architektur als ideale Proportion zwischen
verschiedenen Längen angesehen. Es gilt auch als Inbegriff für Ästhetik und Schönheit, und hat einige interessante mathematische Eigenschaften, welche wir im Folgenden untersuchen wollen. Dazu schwenken wir zur
Fibonacci-Folge, welche rekursiv folgendermaßen definiert ist:
Definition A.1.1 [Fibonacci-Folge]: Die Folge <fn>=<0, 1, 1, 2, 3, 5, 8, 13, 21, . . .> mit

0
,n=0

fn =
1
,n=1
wird als Fibonacci-Folge bezeichnet.

fn−1 + fn−2 , n ≥ 2
Die Fibonacci-Folge ist offensichtlich nicht beschränkt und deshalb divergent. Aber was hat diese Folge dann
mit dem Goldenen Schitt ϕ zu tun? Dazu definieren wir die Funktion (Folge) Fa,b (n) = aϕn + b(1 − ϕ)n mit
a, b ∈ R und n ∈ N0 und behaupten, dass diese die Fibonacci-Rekursion erfüllt.
Satz A.1.1: Die Funktion Fa,b (n) = aϕn + b(1 − ϕ)n mit a, b ∈ R, n ∈ N und Goldener Schnitt ϕ erfüllt die
Fibonacci-Rekursion Fa,b (n) = Fa,b (n − 1) + Fa,b (n − 2).
Beweis: Fa,b (n − 1) + Fa,b (n − 2) = aϕn−1 + b(1 − ϕ)n−1 + aϕn−2 + b(1 − ϕ)n−2 =
1 + b(1 − ϕ)n−1 1 + 1
a ϕn−1 + ϕn−2 + b (1 − ϕ)n−1 + (1 − ϕ)n−2 = aϕn−1 1 + ϕ
1−ϕ .
1 = ϕ − 1 in geeigneter Form und erhalten:
Wir verwenden die Gleichung des Goldenen Schnitts ϕ
Fa,b (n − 1) + Fa,b (n − 2) = aϕn−1 (1 + ϕ − 1) + b(1 − ϕ)n−1 (1 + (−ϕ)) = aϕn + b(1 − ϕ)n = Fa,b (n). Die Funktion Fa,b (n) gestattet bei passender Wahl der Parameter a und b eine explizite Darstellung oder Formel
für die Fibonacci-Folge.
Satz A.1.2: Erfüllt ϕ die Gleichung des Goldenen Schnittes, so hat die Fibonacci-Folge die explizite Darstellung
fn = √1 [ϕn − (1 − ϕ)n ]
mit n ∈ N0 .
5
Beweis: Wir versuchen die Parameter a und b für die Funktion Fa,b (n) geeignet zu wählen. Es muss folgendes
gelten: (1) Fa,b (0) = a + b = 0 und (2) Fa,b (1) = aϕ + b(1 − ϕ) = 1. Aus diesen beiden Gleichungen ergibt
√
sich a = √1 und b = − √1 unter Verwendung von 2ϕ − 1 = 5.
5
5
Wie eingangs schon erwähnt ist die Fibonacci-Folge divergent. Betrachtet man aber das Verhältnis zweier
benachbarter Folgeglieder fn+1 /fn , so erhält man wieder Konvergenz.
Satz A.1.3: Für die Fibonacci-Folge <fn> und dem Goldenen Schnitt ϕ gilt:
Beweis: Mit der expliziten Darstellung für die Fibonacci-Folge erhält man:
n+1 . h
n i
ϕn+1 − (1 − ϕ)n+1
fn+1
1−ϕ
n+1
=
ϕn 1 − 1−ϕ
−→ ϕ.
=
ϕ
1
−
n
n
ϕ
ϕ
fn
ϕ − (1 − ϕ)
lim
n→∞
fn+1
fn = ϕ.
Herunterladen