HS 2010

Werbung
Mathematik für die Chemie I
Herbstsemester 2010
Erwin Bolthausen
Inhaltsverzeichnis
1 Mengen und Abbildungen
1.1 Mengen . . . . . . . . .
1.2 Funktionen . . . . . . .
1.3 Polynome . . . . . . . .
2 Die
2.1
2.2
2.3
2.4
2.5
2.6
2.7
(Funktionen)
2
. . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
. . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
. . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
komplexen Zahlen
Motivation . . . . . . . . . . . . . . . . . . . . . . . .
De…nition der komplexen Zahlen und Addition . . . .
Multiplikation komplexer Zahlen . . . . . . . . . . . .
Graphische Darstellung, Polarkoordinaten . . . . . . .
Konjugation komplexer Zahlen, Division . . . . . . . .
Potenzen und Wurzeln . . . . . . . . . . . . . . . . . .
Hauptsatz der Algebra: Jedes Polynom hat mindestens
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
eine Nullstelle
.
.
.
.
.
.
.
.
.
.
.
.
.
.
3 In…mum, Supremum, Minimum, Maximum
15
15
17
18
19
22
24
27
30
4 Folgen und Reihen
31
4.1 Konvergenz von Folgen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
4.2 Reihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
5 Stetigkeit
43
6 Di¤erentialrechnung
6.1 De…nition des Di¤erentialquotienten und
6.2 Höhere Ableitungen . . . . . . . . . . .
6.3 Die Regel von Bernoulli-l’Hospital . . .
6.4 Geometrische Anwendungen . . . . . . .
54
54
68
71
73
grundlegende
. . . . . . . .
. . . . . . . .
. . . . . . . .
Rechenregeln
. . . . . . . .
. . . . . . . .
. . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
7 Integration
81
7.1 Das bestimmte Integral und die Stammfunktion . . . . . . . . . . . . . . . 81
7.2 Zwei Integrationsmethoden: Partielle Integration und Substitution . . . . 90
7.3 Die Taylorformel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
1
7.4
7.5
Potenzreihen und die Taylorreihe . . . . . . . . . . . . . . . . . . . . . . . 97
Uneigentliche Integrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
8 Periodische Funktionen und Fourierreihen
1
1.1
110
Mengen und Abbildungen (Funktionen)
Mengen
Eine Menge ist eine beliebige Kollektion von Objekten, wie z.B. Zahlen, geometrischen
Objekten, Tieren, Menschen, Himmelskörpern etc., den Elementen der Menge.
Notation 1.1
a 2 M bedeutet: a ist Element der Menge M:
a2
= M bedeutet: a ist nicht Element der Menge M
Es gibt verschiedenen Möglichkeiten, Mengen darzustellen; die einfachste ist, die
Elemente der Menge aufzulisten. Man schreibt die Elemente üblicherweise dann in geschweifte Klammern:
M = f1; 4; 7; 9g :
(1.1)
Diese Menge enthält 4 Elemente, nämlich die Elemente 1; 4; 7 und 9: Die Elemente einer
Menge müssen keinesfalls Zahlen sein. So ist
M = fMerkur, Venus, Jupiterg
eine wohlde…nierte Menge mit 3 Elementen. Die Anzahl der Elemente einer Menge nennt
man die Kardinalität der Menge. Die durch (1.1) gegebene Menge hat also die Kardinalität 4: Wir schreiben jM j für die Kardinalität der Menge M: Es ist also jf1; 4; 7; 9gj = 4:
Schwierig wird diese Darstellungsweise dann, wenn die Menge sehr viel Elemente oder
gar unendlich viele Elemente enthält. Man behilft sich dann oft mit “Pünktchen”. Z.B.
ist die Menge
M = f1; 3; 5; 7; 9; : : :g
die Menge der ungeraden natürlichen Zahlen. Diese Menge enthält natürlich unendlich
viele Elemente. Man sagt, die Kardinalität sei 1:
Es ist üblich, Mengen mit grossen lateinischen Buchstaben wie A; B oder M zu
bezeichnen, und die Elemente mit kleinen. Dies kann jedoch nicht immer durchgehalten
werden. Wir werden uns nach Möglichkeit an diese Konvention halten; es wird jedoch
auch Ausnahmen geben.
Es folgt eine Au‡istung der für uns wichtigsten Mengen von Zahlen. Es ist hier üblich, diese mit grossen lateinischen Buchstaben mit “Doppelstrichen”zu bezeichnen. Die
entsprechenden Bezeichnungen sind ein für allemal für diese speziellen Mengen reserviert.
2
N ist die Menge der natürlichen Zahlen, d.h.
N := f1; 2; 3; 4; : : :g :
Mit N0 bezeichnen wir die Menge der natürlichen Zahlen inklusive der Null: N0 :=
f0; 1; 2; 3; 4; : : :g
Z ist die Menge der ganzen Zahlen, d.h.
Z := f0; 1; 1; 2; 2; 3; 3; 4; 4; : : :g :
Q ist die Menge der rationalen Zahlen, d.h. der Zahlen, die sich als Brüche von
ganzen Zahlen (mit Nenner 6= 0) darstellen lassen. Also z.B. sind 3=4, 234=1875
rationale Zahlen, in unserer Sprechweise also Elemente von Q:
R ist die Menge der reellen Zahlen. Aus der Schule am besten bekannt ist wahrscheinlich die Darstellung der reellen Zahlen als unendlich lange Dezimalbrüche.
Statt durch eine Aufzählung beschreibt man Mengen auch oft durch die Angabe der
Eigenschaften ihrer Elemente. Hier ein Beispiel:
M = fx : x 2 N; x ist durch 5 teilbarg :
Dies bedarf einiger Erläuterungen. Die Menge M besteht aus denjenigen Elementen
x; deren Eigenschaften hinter dem Doppelpunkt aufgezählt sind.1 Hier sind es zwei
Eigenschaften: x muss eine natürliche Zahl sein, und x ist durch 5 teilbar. Oft schreibt
man auch etwas einfacher für dieselbe Menge
M = fx 2 N : x ist durch 5 teilbarg :
Eine aufzählende Beschreibung für diese Menge ist
M = f5; 10; 15; 20; : : :g :
Ein anderes Beispiel:
A = x 2 R : x2 = 1
(1.2)
Das ist natürlich die zweielementige Menge f 1; 1g :
Nun zu weiteren De…nitionen: Zwei Mengen A und B heissen gleich, wenn sie dieselben Elemente enthalten. Wir benützen die Gelegenheit, eine “stenographische”Kurzschreibweise solcher Aussagen einzuführen:
A = B , 8x (x 2 A , x 2 B) :
(1.3)
Die Notationen sind vielleicht schon aus der Schule bekannt. 8 ist ein Kürzel für “für
alle”. 8x bedeutet “für alle x gilt:”. Der Doppelpfeil , ist sicher aus der Schule bekannt.
1
In manchen Textbüchern wird anstelle des Doppelpunktes auch ein senkrechter Strich verwendet.
Also fxjx 2 N; x ist durch 5 teilbarg :
3
Es ist eine Abkürzung für “gilt dann und nur dann wenn”oder “gilt genau dann wenn”.
Das Kryptogramm (1.3) besagt also einfach: A und B sind genau dann gleich, wenn für
alle x gilt: x ist Element von A genau dann, wenn es Element von B ist. Etwas weniger
umständlich ausgedrückt: A und B sind genau dann gleich, wenn sie dieselben Elemente
enthalten.
Eine spezielle Menge spielt eine besondere Rolle, die sogenannte leere Menge ;: Sie
ist de…niert als die Menge, die keine Elemente enthält. Natürlich mag man sich fragen, ob
eine solche Menge von irgendwelchem Interesse ist. Es ist für viele Zwecke bequem, die
Existenz einer derartigen Menge zu postulieren. Es gibt o¤enbar nur eine leere Menge,
denn zwei Mengen sind gleich, wenn sie dieselben Elemente enthalten. Da leere Mengen
gar keine Elemente enthalten, sind o¤enbar zwei leere Mengen gleich, d.h. es gibt nur
eine leere Menge.
A ist eine Teilmenge von B, wenn jedes Element von A auch Element von B ist.
Man schreibt dann A B: Wieder “stenographisch”:
A
B , 8x (x 2 A =) x 2 B) :
Hier verwenden wir den einfachen Implikationspfeil =); der sicher auch aus der Schule
bekannt ist. Natürlich ist B stets eine Teilmenge von B: Ferner ist die leere Menge ; eine
Teilmenge jeder Menge. Man beachte, dass zwei Mengen A und B genau dann gleich
sind, wenn A
B und B
A gelten. Manchmal wird für die Teilmengenbeziehung
auch noch die Schreibweise
verwendet, die explizit andeutet, dass die Mengen auch
gleich sein können. Wir werden diese Notation jedoch nicht verwenden, da sie (leider)
ungebräuchlich geworden ist.
Intervalle sind spezielle Teilmengen von R: Für a < b bezeichnen wir mit [a; b] das
Intervall von a nach b; d.h. die Menge der Zahlen, die zwischen a und b sind, inklusive
der beiden Endpunkte:
[a; b] := fx 2 R : a x bg :
Mit ]a:b[ bezeichnen wir das sogenannte o¤ene Intervall, das die Punkte enthält, die
echt zwischen a und b liegen, also exklusive der Endpunkte.
]a; b[:= fx 2 R : a < x < bg :
Wir schreiben [a; 1[ für die Menge der reellen Zahlen, die
a sind und ]a; 1[ für die
Menge der Zahlen, welche > a sind. Analog sind ] 1; a] ; ] 1; a[ etc. de…niert.
Teilmengen einer Menge werden auch sehr oft durch Eigenschaften beschrieben. Ist
M eine Menge und E eine Eigenschaft, so ist
A = fx 2 M : x hat Eigenschaft Eg
die Menge derjenigen Elemente von M; die die Eigenschaft E besitzen. Wir haben das
schon oben in (1.2) angetro¤en.
Aus der Schule sind wahrscheinlich Durchschnitt, Vereinigung und Komplement bekannt: Es seien A und B zwei Mengen. Dann sind diese neuen Mengen wie folgt
de…niert:
A \ B := fx : x 2 A und x 2 Bg ;
4
A [ B := fx : x 2 A oder x 2 Bg ;
AnB := fx : x 2 A und x 2
= Bg :
An dieser Stelle sollte betont werden, dass Mathematiker das Wort „oder“ in einem
Sinn verwenden, der nicht dem der Alltagssprache entspricht. „x 2 A oder x 2 B“ bedeutet nicht „entweder oder“, sondern dass mindestens eine der beiden Eigenschaften
gilt.
Zwei Mengen A; B heissen disjunkt, wenn sie keine gemeinsamen Elemente haben.
Wir können das mit dem Durchschnitt und der leeren Menge ausdrücken. A; B sind
genau dann disjunkt, wenn A \ B = ; gilt. Sind drei oder mehr Mengen gegeben, so sagt
man, sie seien paarweise disjunkt, wenn je zwei disjunkt sind. f1; 2g ; f1; 3g ; f2; 3g zwar
nicht paarweise disjunkt, der Durchschnitt der drei Mengen ist jedoch leer, d.h. es gibt
kein Element, das in allen drei Mengen liegt.
Wir werden oft Teilmengen einer festen Menge, nennen wir sie M; betrachten, die
dann für eine längere Betrachtung nicht mehr wechselt. Dann schreibt man Ac für M nA:
Das ist das Komplement von A in M: Natürlich müsste man eigentlich M in der Notation
mit ausdrücken. Das wird jedoch stets aus dem Kontext ersichtlich sein.
Für die obigen Mengenoperationen gelten einige Rechenregeln, die wir hier als bekannt voraussetzen, z.B.
A \ (B [ C) = (A \ B) [ (A \ C) ;
(1.4)
(A [ B)c = Ac \ B c :
Den Beweis, dass zwei Mengen A und B gleich sind, führt man oft in zwei Schritten.
Man zeigt zuerst, dass A B gilt und dann, dass B A gilt. Wir exempli…zieren das
mit einem Beweis von (1.4):
Beweis von (1.4) . Sei x 2 A \ (B [ C) : Dann ist x Element von A und von B [ C:
Ist x 2 B [ C; so ist x in B oder in C: Gilt Ersteres, so ist x 2 A \ B; und gilt Letzteres,
so gilt x 2 A \ C: In jedem Fall folgt dann x 2 (A \ B) [ (A \ C) : Damit haben wir
gezeigt, dass jedes Element von A \ (B [ C) auch in (A \ B) [ (A \ C) ist. Damit haben
wir nachgewiesen, dass
A \ (B [ C)
(A \ B) [ (A \ C)
(1.5)
gilt.
Nun kommen wir zum zweiten Teil des Beweises. Sie x 2 (A \ B) [ (A \ C) : Dann
ist x 2 A \ B oder x 2 A \ C: x liegt also in A und B; oder in A und C: In jedem
Fall liegt also x in A und dann in B oder C: Das bedeutet aber nichts anderes, als dass
x 2 A \ (B [ C) gilt. Wir haben also
(A \ B) [ (A \ C)
nachgewiesen.
5
A \ (B [ C)
(1.6)
(1.5) und (1.6) implizieren (1.4).
Produktmengen: Sind A; B zwei Mengen, so ist die Produktmenge A B de…niert als
die Menge aller geordneten Paare (a; b) mit a 2 A und b 2 B: Es wird nicht vorausgesetzt,
dass die beiden Mengen A; B verschieden sind. Man kann also durchaus die Menge A A
betrachten. Es ist dabei jedoch wichtig, dass man auf die Reihenfolge der Paare achtet.
Sind a; b zwei verschiedene Elemente in A; so sind (a; b) und (b; a) zwei verschiedene
Elemente in A A: Für A A schreibt man meist A2 :
Ist m = jAj und n = jBj ; so gilt jA Bj = m n:
Beispiel 1.2
A = f1; 2; 3g : Dann ist
A
A = f(1; 1) ; (1; 2) ; (1; 3) ; (2; 1) ; (2; 2) ; (2; 3) ; (3; 1) ; (3; 2) ; (3; 3)g :
Vorsicht: Man darf die Mengenklammer f g nicht mit der Klammer ( ) für die Paarbildung verwechseln. f1; 2g ist die Menge, die die Elemente 1 und 2 enthält. Diese Menge
ist die gleiche wie f2; 1g : Bei der Aufzählung der Mengenelemente spielt es keine Rolle,
in welcher Reihenfolge man diese aufzählt. Hingegen ist (1; 2) 6= (2; 1) :
1.2
Funktionen
Es seien A; B Mengen. Eine Funktion f (oder Abbildung) von A nach B weist jedem
Element a 2 A genau ein Element f (a) 2 B zu.2 Man schreibt f : A ! B: f (a)
nennt man den Funktionswert von a: a heisst auch Argument oder Variable. Mit der
Bezeichnung „Variable“ will man zum Ausdruck bringen, dass a nicht ein festes Element
in A ist, sondern in A quasi variieren kann. A nennt man den De…nitionsbereich der
Funktion. Es hat sich in der Mathematik eingebürgert, dass man Funktion mit kleinen
lateinischen Buchstaben, typischerweise f; g; h oder griechischen Buchstanben '; etc.
bezeichnet. Dies ist jedoch keine feste Regel. Wenn man will, so kann man Kurzwörter wie
in der Informatik üblich verwenden, welche die De…nition der Funktion widerspiegeln.
Beispiel 1.3
Körpergrösse von Menschen: A ist die Menge aller Menschen, B die Menge der reellen
Zahlen. f ordnet jedem Menschen seine Körpergrösse zu: Ist a 2 A; d.h. ist a ein Mensch,
so ist f (a) die Körpergrösse des Menschen a; z.B. in Centimetern.
Wir können das Beispiel verfeinern, indem wir noch den Zeitpunkt betrachten, zu
welchem die Körpergrösse bestimmt wird. Einem Menschen a und einem Zeitpunkt t
ordnen wir die Körpergrösse von a zum Zeitpunkt t zu. (Wir lassen die Schwierigkeit
ausser Betracht, dass a zum Zeitpunkt t vielleicht noch nicht geboren ist, oder schon
gestorben ist.) Formal können wir die Produktmenge A T betrachten, wobei T die
Menge der betrachteten Zeitpunkte ist. Dann ist f (a; t) die Körpergrösse von a zur
Zeit t: (Eigentlich müsste man f ((a; t)) schreiben, was man jedoch in diesem Fall nicht
macht. f ist in diesem Fall eine Funktion A T ! R:
2
Manchmal wird die Bezeichnung „Funktion“ für spezielle Abbildungen verwendet, meist wenn B = R
ist. Ich verwende die Ausdrücke „Funktion“ und „Abbildung“ hier synonym.
6
Für eine Funktion f : A ! B wird nicht vorausgesetzt, dass jedes Element b 2 B als
Bildelement unter f vorkommt. So gibt es keinen Menschen, der 500 cm gross ist, d.h. im
obigen Beispiel gibt es kein a 2 A mit f (a) = 500: Ferner wird auch nicht vorausgesetzt,
dass verschiedene Elemente in A auch verschiedene Funktionswerte haben. So können
zwei verschiedene Menschen durchaus dieselbe Körpergrösse haben, d.h. aus a 6= a0 folgt
nicht f (a) 6= f (a0 ) :
Die Menge der Elemente b 2 B; welche als Funktionswerte von f auftreten, bezeichnen wir mit im (f ) : Formal:
im (f ) := ff (a) : a 2 Ag :
im (f ) ist o¤enbar eine Teilmenge von B:
Beispiel 1.4
Seien A = f1; 2; 3; 4g und B = f1; 2; 3; 4; 5g : Wir setzen f (1) = 3; f (2) = 4; f (3) =
3; f (4) = 5: Hier gibt es zwei verschiedene Elemente in A, nämlich 1 und 3; die denselben
Funktionswert haben. Ferner kommen die Elemente 1; 2 2 B nicht als Funktionswerte
vor, d.h. im (f ) = f3; 4; 5g :
De…nition 1.5
Eine Funktion f : A ! B heisst injektiv, falls verschiedene Elemente in A stets verschieden Funktionswerte haben, d.h. wenn aus a 6= a0 die Ungleichung f (a) 6= f (a0 )
folgt. f heisst surjektiv, falls alle Elemente in B als Funktionswerte vorkommen, d.h.
wenn für jedes b 2 B mindestens ein a 2 A existiert mit f (a) = b; oder kurz, wenn
im (f ) = B ist. Eine Funktion, die sowohl injektiv wie surjektiv ist, nennt man bijektiv.
Ist eine Funktion f : A ! B bijektiv, erzeugt f o¤enbar eine eineindeutige Verknüpfung der Elemente von A mit den Elementen von B : Jedes Element b 2 B ist der
Funktionswert f (a) eines eindeutigen Elementes a 2 A: In diesem Falle kann man die
Abbildung quasi „umdrehen“, indem man jedem b 2 B dieses eindeutige Element a 2 A
zuweist, das f (a) = b erfüllt. Man schreibt dann a = f 1 (b) und nennt f 1 : B ! A
die zu f inverse Abbildung, oder die Umkehrfunktion.3
Hier ein paar Beispiele mit A = B = R
1. f (x) = x2 : im (f ) ist die Menge der reellen Zahlen 0; d.h. im (f ) = [0; 1[ in der
vorher eingeführten Notation. Die Abbildung ist weder injektiv noch surjektiv.
2. f (x) = x3 : f ist sowohl injektiv wie surjektiv, d.h. f ist bijektiv. Die Umkehrfunktion ist die dritte Wurzel, die für jede Zahl in R eindeutig de…niert ist.
3. f (x) = ex : (Ich gehe davon aus, dass die Exponentialfunktion mit der Eulerschen
Konstanten e = 2:71828::: bekannt ist.) Die Abbildung ist injektiv, aber nicht
surjektiv. im (f ) = ]0; 1[ :
4. f (x) = x3
3
Vorsicht: f
1
x: Hier ist der Graph der Funktion:
(a) ist nicht 1=f (a) :
7
y
10
8
6
4
2
-4
-3
-2
-1
1
-2
2
3
4
x
-4
-6
-8
-10
Die Funktion ist surjektiv, aber nicht injektiv. Dass die Funktion nicht injektiv ist
erkennt man an f ( 1) = f (0) = f (1) = 0:4
5. Eine sehr spezielle Klasse von Funktionen sind die konstanten Funktionen, welche für jedes a 2 A stets denselben Wert annehmen. D.h. es existiert ein b 2 B,
sodass f (a) = b für alle a 2 A gilt. Von einer Funktion f : A ! R sagt man, dass
sie identisch verschwindet, falls sie konstant gleich 0 ist.
Funktionen f : R ! R werden meist mit ihrem Graphen veranschaulicht. Das ist
einfach die Punktmenge
f(x; y = f (x)) : x 2 Rg R2
in der Zahlenebene.
Ist die Funktion f : R ! R bijektiv, so erhält man den Graphen der inversen Funktion
1
f aus dem Graphen der Funktion f indem man die x- gegen die y-Achse austauscht.
Geometrisch ist das eine Spiegelung an der 45 -Gerade im ersten Quadranten.
Hier ein Beispiel f (x) = x + sin (x) : Die Funktion ist bijektiv, was nicht ganz o¤ensichtlich ist. Wir werden das später sehen. In der Zeichnung unten ist schwarz (durchgezogen) der Graph von f eingezeichnet, rot (gestrichelt) der Graph von f 1 ; und gepunktet
die 45 Gerade.
Um nachzuweisen, dass eine Funktion nicht injektiv ist, muss man bloss zwei Elemente a 6= a0 …nden
mit f (a) = f (a0 ) :
4
8
y
5
4
3
2
1
-5
-4
-3
-2
-1
1
2
3
4
5
x
-1
-2
-3
-4
-5
Die Funktion x ! x + sin (x) und ihre Umkehrfunktion
Für jede Funktion f : A ! B; die nicht surjektiv ist, kann die Bildmenge durch
im (f ) ersetzt werden: f : A ! im (f ) ; denn die Funktionswerte von f sind ja alle in
im (f ) : Das ist gewissermassen eine banale Modi…kation. Es ist jedoch gut, zwischen
den Funktionen zu unterscheiden, obwohl das etwas pedantisch anmutet. f : A ! im (f )
wird dann surjektiv. Ist f injektiv, so ist diese Modi…kation f : A ! im (f ) bijektiv.
Im Beispiel 3. oben ist die Exponentialfunktion als Funktion f : R ! ]0; 1[ bijektiv.
Die Umkehrabbildung ist die (natürliche) Logarithmusfunktion. f 1 (x) = log (x) : (Ich
verwende hier log (x) für den natürlichen Logarithmus von x und nicht, wie vielleicht in
der Schule gelernt, ln (x)).
Ist f : A ! B eine Funktion und ist A0 eine Teilmenge von A0 ; so kann man f
auf A0 einschränken, indem man f (a) nur für a 2 A0 betrachtet. Man nennt dies die
Einschränkung von f auf A0 : Wir bezeichnen sie oft mit f jA0 : Mit der Einschränkung
ändern sich oft auch die Eigenschaften der Funktion.
Beispiel 1.6
Wir betrachten die Sinusfunktion sin : R ! R: (Wenn nichts anderes vermerkt ist, so
werden Winkel stets im Bogenmass angegeben).
9
sin(x)
1.4
1.2
1.0
0.8
0.6
0.4
0.2
-10
-8
-6
-4
-2
2
-0.2
4
6
8
10
x
-0.4
-0.6
-0.8
-1.0
-1.2
-1.4
sin (x) im Intervall [ 10; 10]
Die Funktion ist weder injektiv noch surjektiv. im (sin) = [ 1; 1] : Wenn wir die Funktion
jedoch auf das Intervall [ =2; =2] einschränken, so erhalten wir eine injektive Funktion,
die [ =2; =2] bijektiv auf [ 1; 1] abbildet.
sin(x)
1.0
0.8
0.6
0.4
0.2
-1.4 -1.2 -1.0 -0.8 -0.6 -0.4 -0.2
-0.2
0.2
0.4
0.6
0.8
1.0
1.2
1.4
x
-0.4
-0.6
-0.8
-1.0
sin (x) im Intervall [
=2; =2]
Die Umkehrfunktion ist natürlich die Arkussinusfunktion arcsin : [ 1; 1] ! [
=2; =2] :
Beispiel 1.7
Ein anderes Beispiel. f (x) = x2 : Schränkt man den De…nitionsbereich auf [0; 1[ ein, so
10
ist es eine bijektive Funktion [0; 1[ ! [0; 1[ : Die Umkehrfunktion f
p
wurzel: f 1 (x) = x:
1
ist die Quadrat-
Bemerkung zur Notation: Es ist ziemlich gebräuchlich, dass man für die Variable
die Bezeichnung x verwendet, vor allem, wenn eine Funktion betrachtet wird, die auf R
de…niert ist. Mathematisch ist jedoch unerheblich, welchen Buchstaben man verwendet.
Es ist auch nicht unüblich, dass man von der „Funktion f (x)“ spricht, obwohl das genau
genommen eine falsche Redewendung ist: f (x) ist der Funktionswert an der Stelle x: Wir
werden in dieser Hinsicht auch nicht immer ganz pingelig sein, wenn aus dem Kontext
klar ist, ob man die Funktion meint, oder den Funktionswert. Manchmal sprechen wir
auch von der „Funktion x ! f (x)“, also von der Funktion, welche x in f (x) überführt.
1.3
Polynome
Zu den einfachsten Funktionen in der Variable x gehören die Potenzen von x : x =
x1 ; x2 ; x3 ; : : : : Mit x0 bezeichnet man üblicherweise die Funktion, die konstant = 1 ist.
Polynome sind Funktionen R ! R die sich durch Addition von Vielfachen dieser Potenzen darstellen lassen, z.B.
3 + 1:5x4 7x100 :
(1.7)
Die allgemeine De…nition: Ein Polynom p ist eine Funktion R ! R die eine Darstellung
der Form
p (x) = a0 + a1 x + a2 x2 +
+ an xn
hat, mit a0 ; a1 ; : : : ; an 2 R: Diese Zahlen nennt man die Koe¢ zienten des Polynoms.
Gilt an 6= 0; so heisst n der Grad des Polynoms und schreibt dafür grad (p (x)) : (Ist
an = 0; so lässt man den Summanden an xn natürlich einfach weg bis man zu einem
Koe¢ zienten 6= 0 gelangt). Das obige Beispiel (1.7) eines Polynoms hat den Grad 100.
Aus der Schule sollten quadratische Polynome bekannt sein, d.h. die Polynome vom Grad
2: Der Graph dieser Poylnome ist stets eine Parabel, nach oben geö¤net, sofern a2 > 0
ist, und nach unten, wenn a2 < 0 ist. Es sollte bekannt sein, wie man den Scheitel der
Parabel und dessen Lage berechnet.
Die Polynome höheren Grades können kompliziert aussehen. Unten ist der Graph
eines Polynoms sechsten Grades eingezeichnet.
p (x) = 1 + x x2 0:1x3 0:1x4 + 0:03x5 + 0:01x6
11
p(x)
30
20
10
-6
-5
-4
-3
-2
-1
1
2
3
4
5
6
x
-10
-20
-30
Von besonderer Bedeutung sind die Nullstellen eines Polynoms, d.h. die Lösungen
der Gleichung p (x) = 0: Im Falle eines linearen Polynoms p (x) = a + bx ist die Lösung
der Gleichung a + bx = 0 trivial: a=b; sofern b 6= 0 ist.
Im Falle eines quadratischen Polynoms sind die Nullstellen die Lösung der entsprechenden quadratischen Gleichung. Wie sicher bekannt ist, gibt es nicht immer eine Lösung.
Das obige Polynom sechsten Grades hat, wie man dem Graphen entnimmt, o¤enbar
4 Nullstellen. Ganz sicher kann man sich nicht sein, denn wir haben den Graphen nur
für x-Werte zwischen 6 und 6 eingezeichnet, sodass nicht ganz klar ist, ob es nicht
noch Nullstellen ausserhalb dieses Intervalles gibt. Die Diskussion der Nullstellen eines
Polynoms vom Grad grösser als 2 ist schon ziemlich kompliziert.
Zwei Polynome kann man miteinander multiplizieren. Da das aus dem Gymnasium
sicher bekannt ist, soll hier nur ein Beispiel gerechnet werden: Wir multiplizieren die
Polynom p (x) = 2 + 3x x5 und q (x) = 1 x2 + x3 :
2 + 3x
x4
1
x2 + x3
2x2 + 2x3 + 3x
= 2
x4 + x6
= 2 + 3x
3x3 + 3x4
x7
2x2
x3 + 2x4 + x6
x7 :
Der Grad die Produktes ist immer die Summe der Grade der beiden einzelnen Polynome.
Aus dem Gymnasium sollte die Polynomdivision mit Rest bekannt sein: Ein Polynom
kann durch ein Polynom gleichen oder kleineren Grades dividiert werden, wobei als Rest
ein Polynom kleineren Grades als der Nenner übrigbleibt. Als Repetition rechnen wir
ein Beispiel durch. Wir dividieren das Polynom x5 2x3 + x2 x 5 durch das Polynom
x2 + 2: Das Vorgehen ist folgendes: Man teilt die höchste Potenz des Zählers durch die
höchste Potenz des Nenners, also x5 durch x2 : Das ergibt x3 : Dann multipliziert man
den Nenner x2 + 2 mit x3 : x3 x2 + 2 = x5 + 2x3 und subtrahiert dieses vom Zähler:
12
Das ergibt 4x3 + x2 x 5: Dann fährt man in dieser Weise mit der Division weiter,
bis nur noch ein Polynom übrigbleibt, das Grad < 2 hat. Hier ist das Schema:
x5
2x3 + x2 x
4x3 + x2 x
x2 + 7x
7x
Die Division ergibt also x3
x5
2x3 + x2
5
5
5
7
x2 + 2
:
x3
4x + 1
Rest 7x
4x + 1 mit Rest 7x
x
=
5 = x2 + 2
7
7: Das entsprich der Gleichung
x3
4x + 1 + 7x
7:
Die Sache ist völlig analog zur Division natürlicher Zahlen mit Rest: 36 dividiert
durch 7 ergibt 5 Rest 1; d.h. 36 = 7 5 + 1:
Wir formulieren den Sachverhalt für Polynome in einem Satz:
Satz 1.8
Seien p (x) und q (x) zwei Polynome 6= 05 mit grad (q (x)) grad (p (x)) : Dann existieren
eindeutig zwei Polynome h (x) ; r (x) ; grad (r (x)) < grad (q (x)) ; sodass
p (x) = h (x) q (x) + r (x)
gilt.
Für den Fall, dass r (x) das Nullpolynom ist, d.h. dass p (x) = h (x) q (x) gilt, sagt
man, dass q (x) das Polynom p (x) teilt.
Wir untersuchen nun noch die Frage, wann ein lineares Polynom x
ein anderes
Polynom teilt. Zumindest für quadratische Polynome sollte das aus dem Gymnasium
bekannt sein. Dass x
ein Polynom ax2 + bx + c teilt, bedeutet ja einfach, dass man
x
ausklammern kann. Das ist gleichbedeutend damit, dass die Zahl eine Nullstelle
des quadratischen Polynoms ist.
Ein Beispiel: x2 3x+2 hat die beiden Nullstellen 1 und 2; was auch daraus ersichtlich
ist, dass x2 3x + 2 = (x 2) (x 1) ist.
Wir diskutieren das nun ganz allgemein.
Satz 1.9
p (x) sei ein Polynom vom Grad 1: Eine Zahl
p (x) wenn x
das Polynom p (x) teilt.
2 R ist genau dann eine Nullstelle von
Beweis. Es gibt zwei Richtungen zu zeigen: (I) Wenn x
das Polynom teilt, so ist
eine Nullstelle von p (x) : (II) Wenn eine Nullstelle ist, so teilt x
das Polynom.
Beweis von (I): Dass x
das Polynom p (x) teilt bedeutet, dass ein Polynom h (x)
existiert mit p (x) = (x
) h (x) : Setzen wir für x ein, so ergibt sich
p( ) = (
) h ( ) = 0 h ( ) = 0:
5
Das bedeutet nicht, dass die Polynome keine Nullstellen haben, sondern, dass sie nicht identisch
gleich Null sind.
13
Somit ist eine Nullstelle von p ( ) :
Beweis von (II): Wir dividieren p (x) durch x
p (x) = (x
mit Rest:
) q (x) + r (x) ;
wobei r (x) ein Polynom von kleinerem Grad als x
ist. Da letzteres Grad 1 hat, so
ist r (x) einfach ein konstantes Polynom: r (x) = a; also
p (x) = (x
Setzen wir nun wieder
) q (x) + a:
für x ein, so erhalten wir
0 = p( ) = (
) q ( ) + a;
die erste Gleichung, da wir voraussetzen, dass
sich a = 0; d.h. wir haben gezeicht, dass
eine Nullstelle von p (x) ist. Somit ergibt
p (x) = (x
ist, d.h. dass x
) q (x)
das Polynom p (x) teilt.
Beispiel 1.10
Das Polynom
p (x) = x7 + 3x5
x4
x3 + 5x
7
hat die Nullstelle 1; wie man sofort durch Einsetzen nachprüft. Tatsächlich ist
x7 + 3x5
x4
x3 + 5x
7 = (x
1) x6 + x5 + 4x4 + 3x3 + 2x2 + 2x + 7 :
Der Satz hat eine Reihe von Folgerungen. Hier ist eine: Hat das Polynom p (x) den
Grad n 1; so kann man o¤ensichtlich höchstens n Mal einen Faktor der Form (x
)
ausklammern. Wir erhalten also
Satz 1.11
Ein Polynom vom Grad n
1 hat höchstens n verschiedene Nullstellen.
Die Funktion sin (x) z.B. hat unendlich viele Nullstellen. Wir sehen also, dass diese
Funktion kein Polynom ist.
Beispiel 1.12
Wir betrachten das Polynom
p (x) = x6
2x4 + 15x3
Durch Einsetzen sieht man, dass 1 und
(x 1) und (x + 3) ausklammern:
x6
2x4 + 15x3
13x2 + 11x
13x2 + 11x
12:
3 Nullstellen sind. Wir können also die Faktoren
12 = (x
1) (x + 3) x4
2x3 + 5x2
x+4 :
Das Polynom x4 2x3 + 5x2 x + 4 hat keine Nullstellen mehr. Diese Behauptung ist
nicht ganz einfach mathematisch zu begründen; man „sieht“ es jedoch, wenn man den
Graphen betrachtet:
14
y
60
50
40
30
20
10
-4
-3
-2
-1
0
Polynom x4
1
2x3 + 5x2
2
3
4
x
x+4
Das ursprüngliche Polynom hat also keine weiteren Nullstellen. Hier sein Graph
x6 2x4 + 15x3 13x2 + 11x 12
y
200
100
-4
-3
-2
-1
1
2
3
4
x
-100
-200
Polynom x6
2
2.1
2x4 + 15x3
13x2 + 11x
12
Die komplexen Zahlen
Motivation
In der Geschichte der Mathematik hat sich immer wieder die Notwendigkeit ergeben,
den Bereich der Zahlen zu erweiteren.
15
Man kann davon ausgehen, dass die Menschheit seit jeher mit den Zahlen 1; 2; 3; : : :
und den elementaren Operationen wie die Addition und die Multiplikation umgehen
konnten.
Ein wichtiger Schritt war die Einführung der Zahl 0 und der negativen Zahlen. Damit
konnte man etwa Schulden als negative Guthaben deklarieren und mit ihnen auf die
übliche Weise rechnen. Etwas abstrakter formuliert: Dank der Einführung der negativen
Zahlen konnte man Gleichung wie z.B.
x+5=3
eindeutig lösen. Die Zahlen 0; 1; 1; 2; 2; : : : bezeichnet man als ganze Zahlen. Die
Menge aller ganzen Zahlen wird meist mit Z bezeichnet. Jede natürliche Zahl ist auch
eine ganze Zahl, aber nicht umgekehrt.
Der nächste Schritt war die Einführung von Brüchen, also der rationalen Zahlen, die
sich als p=q mit p; q 2 Z schreiben lassen, q 6= 0: Durch die Erweiterung der Zahlen zu den
Brüchen konnte man stets nicht nur addieren, multiplizieren, sondern auch dividieren,
sofern der Nenner nicht gleich 0 ist.
Schon den Griechen war bekannt, dass es Zahlen gibt, die sich nicht als Brüche von
ganzen Zahlen darstellen lassen. Das einfachte Beispiel ist die Länge der Diagonalen
im Quadrat mit Seitenlänge 1: Nach dem Satz von Pythagoras
erfüllt die Länge x der
p p
Diagonalen die Gleichung x2 = 12 + 12 = 2; also x = 2: 2 lässt
p sich nicht als Bruch
von ganzen Zahlen darstellen, was Euklid bewiesen hat: Wäre 2 rational, also von der
Form
p
p
2=
q
mit ganzen Zahlen p; q; so könnte man annehmen, dass p; q teilerfremd sind, da sich der
Bruch sonst kürzen liesse. Aus der obigen Darstellung folgt jedoch
2=
p p
:
q q
Wenn p; q keinen gemeinsamen Teiler haben, so haben auch p p und q q keinen gemeinsamen Teiler. Das widerspräche jedoch der obigen Darstellung, denn sie besagt, dass
p sich
p p durch q q teilen lässt. Somit ist nachgewiesen, dass es eine Darstellung von 2 der
obigen Form nicht geben kann.
Diese und viele andere Beispiele haben dazu geführt, dass man den Zahlbegri¤ erweitert hat und neben der rationalen Zahlen die sogenannten „irrationalen“ Zahlen betrachtet.6 Die irrationalen Zahlen lassen sich durch unendliche Dezimalbrüche darstellen,
jedoch nicht als Brüche ganzer Zahlen. Die rationalen Zahlen lassen sich ebenfalls als
unendliche Dezimalbrüche schreiben, z.B. 1=3 = 0:33333::: . Die rationalen Zahlen sind
genau diejenigen unendlichen Dezimalbrüche, deren Darstellung periodisch wird. Z.B.
ist 0:2573919191919191:::: eine rationale Zahl, was aus dem Gymnasium bekannt sein
sollte.
6
Die Bezeichnung „irrational“ ist etwas unglücklich, hat sich jedoch fest etabliert.
16
Die komplexen Zahlen sind eingeführt worden, um gewisse Gleichungen, wie die Gleichung x2 +1 = 0 lösen zu können. Insofern besteht kein grosser Unterschied zum Problem
der Länge der Diagonalen in einem Quadrat mit Seitenlänge 1. Während aber eigentlich niemand die Existenz der Länge der Diagonalen im Einheitsquadrat in Frage stellen
kann, ist es nicht klar, wieso man die Gleichung x2 + 1 = 0 lösen will und man sich nicht
mit der simplen Antwort begnügt, dass es keine Lösung gibt.
Es gibt jedoch eine Reihe von sehr guten Gründen, derentwegen man diese Gleichung
lösen möchte, auf die wir im Moment nicht eingehen können.
Ein historisch wichtiges Motiv für die Einführung der komplexen Zahlen war die
Cardanische Formel für die Lösung der Gleichung dritten Grades
x3 + ax2 + bx + c = 0;
die im 16. Jh. gefunden wurde. Die Gleichung dritten Grades hat immer eine reelle
Lösung, wie wir später sehen werden, oft aber auch drei (in Spezialfällen auch zwei). Die
Cardanische Formel für die Lösungen, auf die wir nicht in Details eingehen wollen, hat
jedoch die Besonderheit, dass gerade im Fall, wo alle Lösungen reell sind, diese nur über
den Umweg über die komplexen Zahlen gewonnen werden können.
2.2
De…nition der komplexen Zahlen und Addition
Der Trick ist ganz einfach. Da man die Gleichung x2 +p
1 = 0 lösen will, so fügt man zu
den reellen Zahlen noch
eine
Zahl
hinzu,
die
man
als
1 bezeichnet. Dafür hat sich
p
1 eingebürgert. (Bei Physikern manchmal j). Natürlich will man
die Abkürzung i :=
z.B. auch
x2 +p4 =p0 lösen. Nach den üblichen Rechenregeln sollte die
p
p die Gleichung
Lösung
4 = 4 ( 1) = 4
1 = 2i sein. Wir benötigen also auch Zahlen der
Form ai oder ia mit a 2 R: Es hat sich eingebürgert, dass man Zahlen dieser Form als
„imaginär“ bezeichnet. i bezeichnet man als die imaginäre Einheit. Nun wollen wir
auch addieren können: Ein Zahlbegri¤, in dem man nicht addieren kann, ist zu nichts zu
gebrauchen. Addition von imaginären Zahlen ist kein Problem: ai + a0 i := (a + a0 ) i:
Nächster Schritt: Man will auch imaginäre Zahlen zu den üblichen reellen Zahlen
addieren können. Wir müssen also Zahlen der Form
a + ib; a; b 2 R
einführen. Diese Zahlen nennt man „komplex“. Ist b = 0; so ist die Zahl reell und im
Fall a = 0; b 6= 0 ist die Zahl (rein) imaginär.
De…nition 2.1
Die Menge C der komplexen Zahlen ist de…niert durch
C := fa + ib : a; b 2 Rg :
a heisst der Realteil der komplexen Zahl z = a + bi; bi der Imaginärteil. Man schreibt
a = Re (z) ; b = Im (z) : Zwei komplexe Zahlen a + ib; a0 + ib0 werden auf die folgende
Weise addiert:
(a + ib) + a0 + ib0 := a + a0 + i b + b0 :
17
Die komplexe Zahl Null ist die Zahl mit Real- und Imaginärteil = 0: Wir schreiben
dafür auch einfach 0: Also 0 (als komplexe Zahl) = 0 + i0: Diese Zahl wird o¤ensichtlich
durch die Eigenschaft charakterisiert, dass 0 + z = z für jede komplexe Zahl z ist.
Geometrische Veranschaulichung der Addition: Die komplexen Zahlen kann man
als Punkte in der Ebene darstellen. z = x + iy entspricht einfach dem Punkt der Ebene
mit den entsprechenden Koordinaten (x; y) : Wenn man will kann man z auch als Vektor
von (0; 0) nach (x; y) interpretieren.
Die Addition entspricht dann der Addition von Vektoren, entsprechend der Addition
von Kräftevektoren in der Physik.
Beispiel 2.2
Wir addieren z1 = 2 + 4i und z2 = 3 + i : z1 + z2 = 5 + 5i: Unten ist das graphisch als
Vektoraddition dargestellt.
y
7
6
5
4
3
2
1
0
0
2.3
1
2
3
4
5
6
7
x
Multiplikation komplexer Zahlen
Komplexe Zahlen kann man auch multiplizieren. Dies macht keine Schwierigkeiten.
Man wendet einfach die üblichen Rechenregeln an und erinnert sich, dass i die Gleichung
i2 = 1 erfüllt. Also
(a + ib)
a0 + ib0
= aa0 + iab0 + ia0 b + i2 bb0
= aa0 + i2 bb0 + i ab0 + a0 b
=
aa0
bb0 + i ab0 + a0 b :
Das ist die einfache Regel, wie man komplexe Zahlen miteinander multipliziert. Zwei
Spezialfälle:
18
Multiplikation einer komplexen Zahl mit einer reellen:
a a0 + ib0 = aa0 + iab0 :
Insbesondere ist
1
a0 + ib0 = a0 + ib0 ;
d.h. die reelle Zahl 1 ist das sogenannte Neutralelement der Multiplikation.
Multiplikation mit imaginären Zahlen
ib
a0 + ib0 =
bb0 + iba0 :
Addition und Multiplikation erfüllen die üblichen Rechenregeln: Unten sind z; z 0 ; z 00
komplexe Zahlen
Kommutativität:
z + z 0 = z 0 + z; z z 0 = z 0 z:
Assoziativität:
z + z 0 + z 00
=
z + z 0 + z 00 ;
z
z 0 z 00
=
z z0
z
z 0 + z 00 = z z 0 + z z 00 :
z 00 :
Distributivgesetz:
Das erste wirkliche Wunder ist, dass man durch komplexe Zahlen 6= 0 auch dividieren
kann. Die Formel ist nicht kompliziert; wir verschieben das jedoch noch einen Moment
bis nach der geometrischen Beschreibung der obigen Konstruktion.
2.4
Graphische Darstellung, Polarkoordinaten
Wie oben stellen wir komplexe Zahlen z = x + iy als Punkte (x; y) in der Ebene dar,
bzw. als Vektoren mit Ursprung in (0; 0) :
Für die geometrische Interpretation der Multiplikation führen wir Polarkoordinaten
ein.
p
Die Länge dieses Vektors von (0; 0) nach (x; y) ist nach Pythagoras r = x2 + y 2 :
Diese Länge bezeichnet man als den Absolutbetrag von z = x + iy :
p
jzj = jx + iyj := x2 + y 2 :
Wie man sieht, hat nur die komplexe Zahl 0 = 0 + 0i die Länge 0:
Ein Punkt (x; y) in der Ebene wird eindeutig festgelegt durch Angabe der Länge
r des Vektors von (0; 0) nach (x; y) sowie durch Angabe des Drehwinkels 2 [0; 2 )
von der positiven x-Achse, bei uns die „reelle Achse“, zu diesem Vektor, gemessen im
19
Gegenuhrzeigersinn. Man bezeichnet das Paar (r; ) als die Polarkoordinaten von z: x; y
ergeben sich aus den Polarkoordinaten durch
x = r cos ; y = r sin :
Umgekehrt legen die kartesischen Koordinaten (x; y) die Polarkoordinaten eindeutig fest,
mit Ausnahme von (x; y) = (0; 0) : Für diesen Vektor ist r = 0; aber ist nicht festgelegt.
Für jeden anderen ergibt sich durch Lösen der Gleichung
tan
= y=x;
d.h.
= arctan (y=x) :
Bei der Festlegung von arctan (y=x) muss man auf die Vorzeichen von x und y achten, denn der Arkustangens ist keine eindeutig de…nierte Funktion, da der Tangens
-periodisch ist. Ferner ist arctan (y=x) für x = 0 nicht de…niert. Die üblichen Implementierungen in Taschenrechnern geben den Arkustangens mit einem Wert ( =2; =2)
aus. Hier die Regeln zur Bestimmung von mit dem Taschenrechner:
x = 0; y > 0 =)
= =2
x = 0; y < 0 =)
= 3 =2
x > 0; y
0 =)
Arkustangens“)
x < 0 =)
= TRarctan (y=x) (TRarctan steht für „Taschenrechner-
= TRarctan (y=x) +
x > 0; y < 0 =)
= TRarctan (y=x) + 2
Hier ein Beispiel für die komplexe Zahl z = 2+3i: Die Länge ist
0:982793::: :
φ
20
p
13:
= arctan (3=2) =
Wenn wir (cos + i sin ) durch e ( ) abkürzen, so erhalten wir die beiden Darstellungen einer komplexen Zahl z durch
z = x + iy
= re ( ) :
nennt man auch das Argument von z und schreibt oft
= arg (z) : Wir werden
später eine andere Darstellung von e ( ) herleiten, nämlich e ( ) = ei ; d.h. die berühmte
Eulersche Formel
ei = cos + i sin ;
was wir jedoch noch nicht richtig verstehen können. Im Moment ist e ( ) einfach eine
Abkürzung für cos + i sin : Die erstere Darstellung oben, nennen wir die kartesische
Darstellung von z und die zweite die Darstellung in Polarkoordinaten.
Beispiel 2.3
p
1+i =
1
p
i =
2e ( =4) ;
2e (7 =4) :
Ein Spezialfall verdient es hervorgehoben zu werden:
e( ) =
1:
(2.1)
Eine explizite Angabe des Drehwinkels
p ist natürlich nicht immer möglich. So erhalt
man für z = 3 + 7i den Absolutbetrag 58 und den Drehwinkel
7
3
' = arctan
:
Eine naive Anwendung des Taschenrechners ergibt = 1:1659:::; was jedoch der Wert
zwischen
=2 und 0 des arctan ist. Da die komplexe Zahl im zweiten Quadranten ist,
ist dieser Wert plus der richtige Wert: = 1:9757::::
Die Addition zweier komplexer Zahlen erfolgt am besten via die kartesische Darstellung, wie wir oben gesehen haben. Die Multiplikation ist einfacher in Polarkoordinaten
durchzuführen: Sind z = re ( ) = r (cos + i sin ) ; z 0 = r0 e 0 zwei Zahlen in Polarkoordinaten, so erhalten wir nach den obigen Multiplikationsregeln.
zz 0 = rr0 cos cos
0
0
sin sin
+ i sin cos
0
+ sin
0
cos
:
Nun muss man sich an die Additionstheoreme für die trigonometrischen Funktionen aus
dem Gymi erinnern:
cos cos
0
sin cos
0
sin sin
+ sin
0
cos
0
= cos
= sin
Somit erhalten wir
zz 0 = rr0 e
Mit anderen Worten:
21
+
0
:
+
0
;
+
0
:
(2.2)
Satz 2.4
Bei der Multiplikation zweier komplexen Zahlen werden die Absolutbeträge multipliziert
und die Winkel (d.h. die Argumente) addiert.
Mit Winkeln rechnet man modulo 2 : Wenn wir zwei Winkel addieren, deren Summe
grösser als 2 ist, so beginnen wir nach 2 einfach wieder von vorne zu zählen. Man
nennt dies „Addition modulo 2 “. Also + 3 =2 = =2 modulo 2 : Wir lassen den
Zusatz „modulo 2 “ in der Regel weg und merken uns, dass wir mit Winkeln so rechnen.
Genauso machen wir es mit der Subtraktion: Wir achten in der Regel darauf, dass wir
immer im Intervall [0; 2 ) landen. Also etwa
=2 = 3 =2:
Für das Rechnen mit guten Taschenrechnern spielt es jedoch keine Rolle.
2.5
Konjugation komplexer Zahlen, Division
Mit Hilfe der Darstellung komplexer Zahlen in Polarkoordinaten sehen wir, dass wir
durch komplexe Zahlen 6= 0 dividieren können: Seien z; z 0 zwei komplexe Zahlen, z 0 6= 0;
in Polarkoordinaten z = re ( ) ; z 0 = r0 e 0 mit r0 6= 0; so ergibt sich
re ( )
r
0 = r0 e
0
re
0
:
Diese Zahl hat o¤ensichtlich die Eigenschaft, dass wenn sie mit r0 e 0 multipliziert wird
sich die Zahl re ( ) ergibt. Genau diese Eigenschaft zeichnet die Division aus: 7=4 ist
diejenige Zahl, die mit 4 multipliziert 7 ergibt.
Für die Berechnung der Division in kartesischen Koordinaten ist es zweckmässig, die
Konjugation einer komplexen Zahl einzuführen.
De…nition 2.5
Ist z = x + iy eine komplexe Zahl, so nennt man die komplexe Zahl x
konjugierte, und bezeichnet sie (üblicherweise) mit z:
iy die zu z
Die Konjugation erfolgt geometrisch durch eine Spiegelung an der reellen Achse. In
Polarkoordinaten erhält man
re ( ) = re ( ) :
Wird z mit z multipliziert, z = re ( ) ; so ergibt sich
zz = re ( ) re (
) = r2 e (
) = r2 = jzj2 :
zz ist also das Quadrat des Absolutbetrages von z: Wir können die Rechnung auch in
kartesischen Koordinaten nachprüfen:
(x + iy) (x
iy) = x2
ixy + yix
= x2 + y 2 = jzj2 :
22
y 2 i2
Wenn wir nun z = x + iy durch z 0 = x0 + iy 0 dividieren, so erweitern wir den Bruch
mit z 0 :
x + iy
x0 + iy 0
=
=
(x + iy) (x0 iy 0 )
(xx0 + yy 0 ) + i (x0 y
=
(x0 + iy 0 ) (x0 iy 0 )
x02 + y 02
0
0
0
0
xx + yy
x y xy
+ i 02
:
02
02
x +y
x + y 02
xy 0 )
Wie man sieht, ist die Berechnung der Division in kartesischen Koordinaten etwas komplizierter als in Polarkoordinaten. Allerdings wird man für die Division üblicherweise
nicht erst von kartesischen in Polarkoordinaten umrechnen, denn die Berechnung des
Winkels und des Absolutbetrages r = jzj ist meist nur numerisch möglich.
Beispiel 2.6
2 + 3i
1 i
(2 + 3i) (1 + i)
(2 + 3i) (1 + i)
=
(1 i) (1 + i)
2
1 5
=
+ i:
2 2
p
1 i hat eine „schöne“ Darstellung in Polarkoordinaten 2e (7 =4) ; der Zähler
2 + 3i jedoch nicht. Es würde deshalb keinen Sinn ergeben, für die Division erst in
Polarkoordinaten zu transformieren.
=
Die Konjugation gehorcht einigen einfachen, aber nützlichen Regeln: Sind z; z 0 zwei
komplexe Zahlen, so gilt
z + z0 = z + z0;
(2.3)
z z0 = z z0:
(2.4)
Wir beweisen das kurz: z = x + iy; z 0 = x0 + iy 0 :
z + z 0 = x + x0 + i (y + y 0 ) = x + x0
= x
iy + x0
i y + y0
iy 0 = z + z 0 :
Für die Multiplikation verwenden wir besser die Darstellung in Polarkoordinaten: z =
re ( ) ; z 0 = r0 e 0
z z 0 = rr0 e
+
= (re (
))
0
= rr0 e
r0 e
0
0
= z z0:
Eine weitere nützliche Eigenschaft: Für z = x + iy gilt o¤enbar z = z genau dann, wenn
y = 0 ist, d.h. wenn z eine reelle Zahl ist.
23
2.6
Potenzen und Wurzeln
In Polarkoordinaten kann man sehr einfach potenzieren und Wurzeln ziehen. Wir betrachten zunächst die n-te Potenz einer Zahl z = re ( ) : Hier erhalten wir
z n = rn e (n ) ;
(2.5)
wobei wir wie üblich n modulo 2 rechnen, wenn notwendig:
Beispiel 2.7
(1 + i)12 : Wir drücken 1 + i in Polarkoordinaten aus:
1+i=
Also ergibt sich
(1 + i)12 =
p
2
12
p
2e ( =4) :
e (12 =4) = 64e ( ) =
64:
Die obige Formel (2.5) gilt auf für negative n: So ist etwa
(1 + i)
8
=
=
p
2
8
e ( 8 =4)
1
1
e (0) = :
4
2
16
Nun zur n-ten Wurzel. Diese ist nicht eindeutig de…niert. Zu einer komplexen Zahl
z suchen wir alle Lösungen der Gleichung n = z: Die Gleichung in Polarkoordinaten
z = re ( ) ; = e ( ) ergibt
n
e (n ) = re ( ) :
Wir schliessen den trivialen Fall z = 0 aus, wo es nur die Lösung = 0 gibt. Ist z 6= 0;
so ist r > 0; und ist eindeutig bestimmt als die positive reelle n-te Wurzel von r :
p
= n r:
Für müssen wir die Gleichung n = lösen. Wir rechnen Winkel modulo 2 . Daher
gibt es für diese Gleichung n verschiedene Lösungen . Zunächst = =n: Jedoch ist
auch = =n + 2 =n eine Lösung, denn n ( =n + 2 =n) = modulo 2 : Die Liste der
Lösungen für ist:
+2
+4
+ 2 (n 1)
;
;
;:::;
:
n
n
n
n
Das nächste in der Liste gibt nichts Neues:
folgenden Sachverhalt nachgewiesen:
+2n
n
=
n
Satz 2.8
Für eine komplexe Zahl z 6= 0 hat die Gleichung (in x)
n
= z = re ( )
24
modulo 2 : Wir haben also den
die n verschiedenen Lösungen:
Im Fall r = 1;
1
=
p
n
re
3
=
p
n
re
;
n
+4
n
2
=
p
n
re
;:::;
n
= 0; d.h. z = 1; nennt man
+2
n
p
= n re
1; : : : ; n
;
+ 2 (n
n
1)
:
die n-ten Einheitswurzeln.
Beispiel 2.9
Wir lösen die Gleichung 4 = 2 (1 + i) : 2 (1 + i) in Polarkoordinaten ist 2 (1 + i) =
p
p
p
8e ( =4) : Die vierte Wurzel aus 8 ist 8 8 = 1:2968::: .Somit erhalten wir die Lösungen
p
p
p
8
8
8
8e ( =16) = 8 cos ( =16) + 8i sin ( =16) ;
1 =
p
8
8e ( =16 + =2) ;
2 =
p
8
8e ( =16 + ) ;
3 =
p
8
8:e ( =16 + 3 =2) ;
4 =
In der Graphik unten sind 2 (1 + i) (blau) und die 4 vierten Wurzeln daraus (rot) ein
der Gaussschen Zahlenebene eingezeichnet.
y
2.5
2.0
1.5
1.0
0.5
-2.5
-2.0
-1.5
-1.0
-0.5
0.5
1.0
1.5
-0.5
-1.0
-1.5
-2.0
-2.5
2 + 2i und die 4 vierten Wurzeln daraus
25
2.0
2.5
x
Beispiel 2.10
Die 6-ten Einheitswurzeln sind
1; e
p
1
3
= +i
; e
2
2
3
4
3
e
Bemerkung 2.11
Statt e ( ) = cos + i sin
1
2
=
p
1
2
3
=
+i
;e( ) =
3
2
2
p
p
3
1
3
5
=
i
; e
i
:
2
3
2
2
1;
schreibt man üblicherweise ei : Die Formel
ei = cos + i sin
heisst Eulersche Formel. Wir werden die Formel später begründen. Es soll hier nur
bemerkt werden, dass mit dieser Formel die Additionsformeln für die trigonometrischen
Funktionen (2.2) sich in der handlichen Form
ei ei
0
= ei(
+ 0)
präsentieren. Aus dieser Formel, die man sich leicht merken kann, und der Eulerschen
Formel, lassen sich die Additionsformeln herleiten: Wegen der Eulerschen Formel und
cos ( ) = cos ; sin ( ) = sin ergibt sich
e
i
= cos (
) + i sin (
und damit
cos
sin
) = cos
1 i
e +e
2
1 i
=
e
e
2i
=
i
;
i
:
i sin
Damit erhält man
sin
+
0
=
=
=
0
1 i( + 0 )
e
e i( + )
2i
0
1 i i 0
e e
e i e i
2i
1
[(cos + i sin ) cos
2i
(cos
i sin ) cos
= sin cos
0
26
+ cos sin
0
0
0
:
0
+ i sin
i sin
0
]
2.7
Hauptsatz der Algebra: Jedes Polynom hat mindestens eine Nullstelle
Wie im vorangegangen Kapitel diskutiert wurde, sind Polynome Funktionen R ! R der
Form
p (x) = an xn + an 1 xn 1 +
+ a1 x + a0 :
Wichtig sind die Nullstellen von Polynomen, also die Lösungen der Gleichung
p (x) = 0:
Wir hatten Polynome als (spezielle) Abbildungen R ! R de…niert. Es spricht nichts
dagegen, in die Polynomvariable komplexe Werte einzusetzen. Da wir komplexe Zahlen
meist mit z bezeichnen, betrachten wir also ein Polynom
p (z) = an z n + an
1z
n 1
+
+ a1 z + a0 ;
und fassen es als Abbildung C ! C auf. Wir können auch zulassen, dass ai 2 C ist.
Ein Polynom p (z) vom Grad mindestens 1 hat genau dann die Nullstelle z0 , wenn
man z z0 aus p (z) ausklammern kann, d.h. wenn ein Polynom q (z) mit einem um Eins
kleineren Grad existiert, sodass
p (z) = (z
z0 ) q (z)
gilt. Diese Aussage ergibt sich auf die gleiche Weise wie bei den reellen Polynomen in
Satz 1.9.
Hier nun der sogenannte Hauptsatz der Algebra:
Satz 2.12
Jedes komplexe Polynom p (z) vom Grad
1 hat mindestens eine Nullstelle.
Ist also p (z) ein Polynom mit grad (p (x)) 1; so existiert mindestens eine komplexe
Zahl , sodass sich z
ausklammern lässt: p (z) = (z
) q (z) : ist dann eine Nullstelle
des Polynoms. Dieselbe Überlegung lässt sich nun auf q (z) anwenden, sofern sein Grad
1 ist. Wir können so lange Linearfaktoren, d.h. Polynome der Form (z
) mit 2 C
ausklammern, bis wir bei einem konstanten Polynom angelangt sind7 . Unter Umständen
lässt sich derselbe Linearfaktor mehrfach ausklammern. Man spricht dann von einer
mehrfachen Nullstelle. Das konstante Polynom, das man schlussendlich erhält, muss
gleich an sein.
Satz 2.13
Jedes Polynom in C lässt sich in sogenannte Linearfaktoren zerlegen: Sind z1 ; : : : ; zk 2
C die Nullstellen, so gilt lässt es sich wie folgt darstellen:
p (z) = an (z
z1 )m1 (z
z2 )m2
(z
z1 )m1 :
Die mi sind die sogenannten Vielfachheiten der Nullstellen, deren Summe gleich n ist.
7
„Können“ ist hier in einem abstrakt mathematischen Sinn zu verstehen. Wir haben noch nicht
diskutiert, wie wir die Nullstelle konkret …nden können.
27
Ganz konkret können wir das nur in Spezialfällen durchführen. Hier als Repetition
die quadratischen Polynome:
p (z) = az 2 + bz + c; a 6= 0:
Wir setzen nicht voraus, dass a; b; c reell sind. Man löst die Gleichung p (z) = 0 durch
quadratische Ergänzung, was schon den Babyloniern vor 4000 Jahren bekannt war:
b
b2
p (z) = a z 2 + z + 2
a
4a
= a z+
+c
2
b
2a
b2
4a
b2
:
4a
+c
Die Nullstellen von p (z) = 0 sind also die Lösungen der Gleichung
z+
b
2a
2
=
b2
4ac
4a2
:
(2.6)
Nun benötigt man eine Fallunterscheidung: Ist die rechte Seite = 0; so ist
b
2a
z1 =
die einzige Lösung und das Polynom hat die Darstellung
p (z) = a z +
Ist hingegen
b2 4ac
4a2
2
b
2a
:
6= 0; so hat die Gleichung
2
=
b2
4ac
4a2
(2.7)
zwei Lösungen 1 ; 2 , wie wir in Abschnitt 2.6 diskutiert haben. In der Gaussschen
Zahlenebene erhält man 2 aus 1 durch eine Drehung um 180 ; d.h. 2 =
1 : Die
ursprüngliche quadratische Gleichung (2.6) hat die beiden Lösungen
z1 =
1
b
; z2 =
2a
b
:
2a
2
Im reellen Fall, also wenn a; b; c 2 R gilt, vereinfacht sich das Wurzelziehen in (2.7)
etwas. Ist b2 > 4ac; so ist der Ausdruck auf der rechten Seite positiv und es existiert
daher eine postive Quadratwurzel. Dann ist
r
p
p
b2 4ac
b2 4ac
b2 4ac
=
=
;
=
1
2
4a2
2a
2a
und die beiden Lösungen der Gleichung sind
p
b2 4ac
b
z1 =
+
; z2 =
2a
2a
28
b
2a
p
b2
4ac
2a
Dieser Fall ist sicher aus dem Gymnasium bekannt. Ist b2 < 4ac; so sind die beiden
Lösungen 1 ; 2 imaginär:
p
p
4ac b2
4ac b2
=
i
;
=
i
1
2
2a
2a
und die beiden Lösungen der quadratischen Gleichung sind in diesem Fall
p
p
4ac b2
4ac b2
b
b
z1 =
+i
; z2 =
i
:
2a
2a
2a
2a
Für die Polynome höheren Grades ist das Bestimmen der Nullstellen, bzw. die Faktorisierung des Polynoms in Linearfaktoren, sehr viel komplizierter. Für die Polynome
3. und 4. Grades gibt es noch explizite Darstellungen der Nullstellen durch Wurzelausdrücke. Für die Gleichung 3. Grades sind dies die berühmten Cardanischen Formeln, auf
die wir hier nicht im Detail eingehen wollen.8 Für die Polynome vom Grad 5 können
die Nullstellen im Allgemeinen nicht mehr durch Wurzelausdrücke dargestellt werden.
Ein reelles Polynom, also ein Polynom mit allen ai 2 R hat die Eigenschaft, dass die
Nullstellen immer in konjugierten Paaren auftreten: Ist z0 eine komplexe Nullstelle des
Polynoms, so auch z0 : Dies sieht man wie folgt: Da 0 = 0 ist folgt
n 1
1 z0
0 = 0 = an z0n + an
+
n 1
+
1 z0
n 1
an 1 z0
+
= an z0n + an
n
= an z0 +
+ a1 z0 + a0
+ a1 z0 + a0
+ a1 z0 + a0 :
Im ersten Schritt haben wir (2.3) verwendet, im zweiten (2.4) und die Tatsache, dass
a = a für reelle Zahlen ist. Wir sehen also, dass z0 ebenfalls eine Nullstelle ist.
Beispiel 2.14
p (z) = z 4 + z 3 z 1: Man sieht sofort, dass das Polynom die Nullstellen 1 und
Daher können wir (z + 1) und (z 1) ausklammern und erhalten
p (z) = (z + 1) (z
1 hat.
1) z 2 + z + 1 :
Das quadratische Polynom hat keine reellen Nullstellen mehr, jedoch die beiden komplexen:
p
1
3
z3;4 =
i
:
2
2
8
Durch eine einfache Substitution lässt sich die Gleichung dritten Grades in die reduzierte Form
z 3 + pz + qz = 0
überführen. Die Cardanische Formel für die Lösungen ist
s
s
r
3
3
q
q 2
p 3
q
2
z=
+
+
+
2
2
3
2
r
2
q
2
2
+
p
3
3
:
Da die Quadratwurzel zwei und die dritte Wurzel drei Lösungen hat, erhält man jedoch zuviele Lösungen,
sodass man noch Regeln benötigt, wie die Wurzeln kombiniert werden. Darauf wollen wir nicht eingehen.
Die Formeln wurden erstmals von Hieronimo Cardano (1501-1576) publiziert. Cardano hatte sie jedoch
nicht selbst gefunden, sondern sie Nicola Tartaglia (1501-1557) abgekupfert.
29
Beispiel 2.15
Wir gehen zurück auf Beispiel 2.10: Die sechsten Einheitswurzeln sind die sechs Lösungen
der Gleichung z 6 1 = 0: Daher ergibt sich
p !
p !
1
1
3
3
z+
z 6 1 = (z 1) z
i
i
2
2
2
2
p !
p !
1
3
1
3
(z + 1) z + + i
z
+i
2
2
2
2
3
In…mum, Supremum, Minimum, Maximum
Wir diskutieren einige wichtige Eigenschaften von Teilmengen der Menge R der reellen
Zahlen.
De…nition 3.1
Eine nichtleere Teilmenge A
R heisst nach oben beschränkt, wenn es eine Zahl
c 2 R gibt mit a c für alle a 2 A: c heisst in diesem Falle eine obere Schranke von
A: Entsprechend heisst die Menge nach unten beschränkt, wenn es eine Zahl d 2 R
gibt mit d a für alle a 2 A: d heisst in diesem Fall eine untere Schranke von A: Die
Menge A heisst beschränkt, wenn sie nach oben und nach unten beschränkt ist.
Eine obere Schranke ist nicht eindeutig de…niert: Gibt es eine obere Schranke c für
A; so gibt es auch viele weitere. So ist auch c + 1 eine obere Schranke für A; sofern c
eine ist. Eine entsprechende Bemerkung gilt auch für untere Schranken.
Endliche Intervalle in R sind o¤enbar beschränkte Mengen.
Eine der wichtigsten Eigenschaften von R wird im folgenden Satz beschrieben.
Satz 3.2
Sei A eine nach oben beschränkte nichtleere Teilmenge von R: Dann besitzt A eine
kleinste obere Schranke, die man als Supremum von A, oder kurz sup A bezeichnet,
sup A 2 R: Diese Zahl hat die folgenden zwei Eigenschaften
1. sup A ist eine obere Schranke von A:
2. Ist c eine obere Schranke von A; so gilt sup A
c
Entsprechend existiert für nach unten beschränkte Mengen eine grösste untere
Schranke, die man als In…mum von A; kurz inf A bezeichnet.
Es ist sehr einfach zu sehen, dass ein Supremum, sofern es existiert, eindeutig durch
A bestimmt ist: Sind nämlich s1 ; s2 zwei Suprema, so gilt wegen der Eigenschaft 2 sowohl
s1 s2 wie auch s2 s1 : Somit muss s1 = s2 gelten.
Sehr viel schwieriger ist die Existenz von Supremum und In…mum nachzuweisen. Wir
beweisen den obigen Satz nicht.
30
Beispiel 3.3
Wir betrachten die Menge A = x : x 2 R; 0 x und x2 < 2 : A ist nicht leer, denn es
gilt 1 2 A: O¤ensichtlich ist die Menge nach unten beschränkt und 0 ist das In…mum.
Die Menge ist auch nach oben beschränkt. So ist z.B. 10 eine obere Schranke, was man
wie folgt einsieht: Wäre 10 keine obere Schranke, so gäbe es ein Element x 2 A mit
x > 10: Daraus folgt x2 = x x > 100; was jedoch x2 2 widerspricht, was alle Elemente
in A erfüllen. Somit haben wir nachgewiesen, dass 10 eine obere Schranke von A ist.
Diese Schranke ist für uns völlig uninteressant; wichtig ist uns nur, dass eine Schranke
existiert.
Nun zum entscheidenden Punkt: Nach dem vorangegangenen Satz p
besitzt A eine
kleinste obere Schranke sup A: Klarerweise ist sup A die Zahl, die man als 2 bezeichnet.
Die Tatsache, dass noch oben bzw. nach unten beschränkte Teilmengen von R Suprema bzw. In…ma besitzen, ist eine der wichtigsten Eigenschaften von R: Sie garantiert,
wie wir oben angedeutet haben, dass wir die Quadratwurzel aus 2 ziehen können.
Gilt sup A 2 A; so ist sup A o¤enbar das grösste Element in A: Man bezeichnet
dieses dann auch als das Maximum von A: Man sagt dann auch, A habe ein maximales
Element. Eine entsprechende Aussage gilt auch für das In…mum.
Beispiel 3.4
a) A =]0; 1[: Die Menge ist o¤enbar beschränkt. sup A = 1; inf A = 0: Beide liegen
nicht in der Menge.
b) A = 21 ; 32 ; 34 ; 45 ; : : : : Es gilt sup A = 1; inf A = 21 : 12 ist in A: A besitzt somit ein
Minimum. Jedoch ist 1 2
= A: A besitzt somit kein Maximum.
4
4.1
Folgen und Reihen
Konvergenz von Folgen
De…nition 4.1
Eine Funktion a : N ! R nennt man eine reelle Zahlenfolge, oder auch eine Folge.
Eine Folge ist einfach eine unendlich lange Sequenz a (1) ; a (2) ; : : : von reellen Zahlen.
Manchmal schreibt man die Argumente auch als Indizes an anstelle von a (n) : Eine
übliche Schreibweise für die Folge ist
fan gn2N :
Es ist üblich aber völlig unerheblich, dass man die Indizes mit 1 und nicht mit 0 beginnt.
Wenn klar ist, dass die Indizes durch die natürlichen Zahlen laufen, so schreiben wir auch
einfach fan g für die Folge.
Beispiel 4.2
1.
an := n2 :
31
2.
an :=
1
:
n
3.
an := 1
4.
an :=
1+
2
1
n
n
n
:
Man nennt eine Reihe konvergent, falls es eine Zahl a 2 R gibt, gegen die „die
Folgenglieder streben“. Das ist keine mathematisch präzise Ausdrucksweise. Was soll es
heissen, dass die an gegen a streben? Hier die präzise De…nition:
De…nition 4.3
Eine Folge fan g konvergiert gegen a 2 R; Schreibweise limn!1 an = a; falls für jede
(noch so kleine) reelle Zahl " > 0; die absoluten Di¤erenzen jan aj kleiner oder gleich
" sind, sofern n genügend gross ist, d.h. wenn es zu jedem " > 0 eine natürlich Zahl N
gibt (die von " abhängen kann9 ) mit der Eigenschaft, dass jan aj " für alle n N
gilt: a bezeichnet man als den Grenzwert oder den Limes der Folge. Manchmal schreiben
n!1
wir auch an ! a anstelle von limn!1 an = a:
Die Folge heisst divergent, sofern sie nicht konvergiert.
n
Wir veranschaulichen die De…nition an der Folge 1 + n1
des Beispiels 4: Wie
wir unten nachweisen werden, konvergiert die Folge. Der Grenzwert ist die Eulersche
Zahl e = 2:71828182845905:::: In der Graphik unten haben wir die Folgenglieder für
n = 1; : : : ; 20 eingezeichnet. Ferner ist grün ein „"-Schlauch“ mit " = 0:1 um e eingezeichnet. Wie man sieht, liegen die Folgenglieder ab n = 13 im Schlauch (a13 liegt
ziemlich genau auf der Grenze ist aber schon drin). Die Zeichnung ist natürlich kein Beweis, dass alle Folgenglieder ab n = 13 im Schlauch liegen, denn es könnte ja sein, dass
z.B. das Zehntausendste Folgenglied plötzlich draussen liegt. Tatsächlich sind jedoch alle
Folgenglieder ab n = 13 im Schlauch. Konvergenz bedeutet, dass für jeden noch so engen
Schlauch um e die Folgenglieder an für genügend grosses n im Schlauch liegen. Hätten
wir einen Schlauch mit " = 0:01 genommen, so liegen alle Folgenglieder ab n = 134 in
dem entsprechenden engeren Schlauch, die Folgenglieder bis n = 133 jedoch noch nicht.
9
Um das zu betonen schreibt man manchmal N (") :
32
3.0
2.8
2.6
2.4
2.2
2.0
1.8
0
2
4
6
8
10
12
14
16
18
20
n
Es ist ziemlich o¤ensichtlich, dass in den Beispielen 2. und 3. oben die Folgen konvergieren
1
lim
= 0;
n!1 n
lim 1 2 n = 1:
n!1
Wir schauen uns den ersten Fall etwas genauer an. Um die Behauptung nachzuweisen
müssen wir für jedes " > 0 eine Zahl N = N (") …nden mit
1
1
=
n
n
" fu
•r n
N (") :
Dazu müssen wir nur
1
"
setzen. Hier bedeutet dxe die kleinste ganze Zahl, die grösser als x ist, z.B. d3; 14159e = 4:
Ist n N (") ; so gilt
1
1
1
1 = ":
n
N (")
"
N (") :=
Die Folge von Beispiel 1. konvergiert o¤ensichtlich nicht.
Die De…nition oben ist wenig nützlich um herauszu…nden, ob eine Reihe konvergiert,
wenn man den Grenzwert nicht direkt erraten kann. Es ist daher wichtig, Kriterien für
die Konvergenz zu haben, die keinen Bezug auf den Grenzwert nehmen. Ein solches
Kriterium ist das Cauchy-Kriterium.
Um dieses zu motivieren betrachten wir eine konvergente Folge fan g mit a = limn!1 an :
Zu " > 0 existiert N (") mit jan aj " für n N: Damit gilt für n; m N
jan
am j = jan
a
(am
2":
33
a)j
jan
aj + jam
aj
Wir sehen also, dass für jedes " > 0 eine Zahl N 0 (") := N ("=2) existiert mit
jan
am j
" fu
•r n; m
N 0 (") :
Eine Folge mit dieser Eigenschaft nennt man eine Cauchy-Folge. Wir haben somit
gesehen, dass jede konvergente Folge eine Cauchy-Folge ist. Interessanterweise gilt die
Umkehrung dieser Aussage:
Satz 4.4
Eine Folge fan g konvergiert dann und nur dann, wenn sie eine Cauchy-Folge ist.
Dieser Satz ermöglicht es, die Konvergenz nachzuweisen, ohne dass man den Grenzwert schon kennt.
Es gibt eine Reihe anderer Konvergenzkriterien für spezielle Folgen. Besonders wichtig sind monotone Folgen. Eine Folge fan g heisst monoton ansteigend, wenn für alle
n 2 N die Ungleichung an
an+1 gilt. Die Folge heisst monoton fallend falls stets
an+1
an gilt. Für monotone Folgen ist Konvergenz gleichbedeutend mit Beschränktheit:
Satz 4.5
a) Ist fan g monoton ansteigend, so ist die Folge dann und nur dann konvergent, wenn
sie nach oben beschränkt ist. In diesem Fall gilt
lim an = sup an :
n!1
n
b) Ist die Folge monoton fallend, so ist sie dann und nur dann konvergent, wenn sie
nach unten beschränkt ist. In diesem Fall gilt
lim an = inf an :
N !1
n
Mit diesem Kriterium können wir die Konvergenz in Beispiel 4 nachweisen. Wir
brauchen jedoch noch ein Hilfsmittel, die Bernoullische Ungleichung.
Satz 4.6 (Bernoullische Ungleichung)
Für jede Zahl a > 1 und jedes n 2 N gilt die Ungleichung
(1 + a)n
1 + na
Beweis. Wir führen den Beweis mit vollständiger Induktion. Das bedeutet, dass
man die Behauptung erst für n = 1 zeigt (Induktionsverankerung). Anschliessend weist
man nach, dass, falls für jedes n
2 folgendes gilt: Stimmt die Aussage für n 1
(Induktionsvoraussetzung), so gilt sie auch für n (Induktionsschluss). Falls man dies für
beliebiges n 2 gezeigt hat, so folgt, dass die Aussage für jedes n gilt.
Um die Bernoullische Ungleichung einzusehen, untersuchen wir also zunächst den
Fall n = 1: Hier steht links und rechts einfach 1 + a; sodass die Behauptung sicher richtig
ist.
34
Nun der Induktionsschluss. Sei n 2 und wir nehmen an, dass die Ungleichung für
n 1 (und beliebiges a > 1) gilt. Dann folgt zunächst
(1 + a)n = (1 + a)n
1
Wegen 1 + a > 0 und der Tatsache, dass (1 + a)n
aussetzung), folgern wir
(1 + a)n
(1 + (n
(1 + a) :
1
1 + (n
1) a) (1 + a) = 1 + (n
1) a gilt (Induktionsvor-
1) a + a + (n
1) a2
1 + na;
wegen (n 1) a2
0: Damit ist gezeigt, dass die Ungleichung auch für n gilt. Mithin
gilt sie für alle natürlichen Zahlen n:10
Wir beweisen nun, dass die Folge in Beispiel 4 konvergiert:
an :=
n
1
1+
n
:
Diese Folge haben wir oben schon graphisch dargestellt (bis n = 20). Die Graphik legt
nahe, dass die Folge monoton ansteigt, was wir nun nachweisen: Sei n
2: Nach der
Bernoullischen Ungleichung gilt
(n
1) (n + 1)
n2
n
=
n
=
n
Somit, nach Multiplikation mit
1
1+
n
1
n
n
1
n2
1
1
1
n
:
n
n 1
n
=
=
n
n+1
n
1+
n
1
n 1
1
n
n 1
n
1
:
Damit ist nachgewiesen, dass die Folge monoton ansteigend.
Um zu sehen, dass sie konvergiert, müssen wir eine obere Schranke für die Folge
…nden. Es genügt dafür, gerade n zu betrachten, denn wenn wir eine obere Schranke für
10
Eine der bekannten Scherzanwendungen der vollständigen Induktion ist der Nachweis, dass ein Zoo,
der mindestens einen Elefanten hat, nur aus Elefanten besteht.
Hier der Beweis: Wir führen Induktion nach der Anzahl n der Tiere im Zoo. n = 1 ist klar: Da wir
voraussetzen, dass der Zoo mindestens einen Elefanten hat, so besteht er nur aus Elefanten. Nun das
Induktionsargument: Der Zoo habe mehr als ein Tier. Wir entnehmen dem Zoo ein Tier, sodass der Rest
aus n 1 Tieren mindestens den einen Elefanten enthält, dessen Existenz wir ohnehin postulieren. Nach
Induktionsvoraussetzung sind die n 1 Tiere alles Elefanten. Nun tauschen wir einen dieser Elefanten
durch das vorher entnommene Tier aus und wenden die Induktionsvoraussetzung nochmals an, sodass
auch diese Gruppe wieder nur Elefanten enthält. Somit ist das eine Tier, dessen Elefantenhaftigkeit noch
nicht nachgewiesen war, ebenfalls ein Elefant. q.e.d.
35
alle geraden Folgenglieder …nden, so dient diese Schranke der gesamten Folge, da ja ein
ungerades Glied der Folge durch das nächste dominiert wird, welches gerade ist. Sei also
n gerade, n = 2m: Dann ist
1+
m
1
n
m
2m + 1
2m
=
:
Ferner gilt
2m
2m 1
2m + 1
2m
2m
2m
1
2
m+2
:
m+1
:::
In dieser Kaskade von Ungleichungen stehen m Quotienten. Demzufolge ist
höchstens das Produkt dieser m Grössen, was einfach
2m + 1
m+1
2m+1 m
2m
2m + 2
=2
m+1
ist. Somit haben wir gezeigt, dass
1+
und somit
1+
1
n
n
=
1+
1
n
m
1
n
2
2m
=
1+
m 2
1
n
22 = 4:
n
Wir haben somit nachgewiesen, dass 1 + n1
4 für alle n ist. Da die Folge monoton
ansteigend ist, konvergiert sie nach dem obigen Satz. Ferner wissen wir, dass
lim
n!1
1+
1
n
n
4
ist. Das ist eine eher schlechte Schranke. Bekanntlich ist der Grenzwert die Eulersche
Zahl e = 2; 71828:::
Hier noch eine Zusammenstellung von einfachen Fakten über konvergente Folgen:
Satz 4.7
Es seien fan g ; fbn g zwei konvergente Folgen. Dann gilt
a) fan + bn g ist konvergent und es gilt
lim (an + bn ) = lim an + lim bn
n!1
n!1
n!1
b) fan bn g ist konvergent und es gilt
lim an bn = lim an
n!1
n!1
36
lim bn :
n!1
c) Sind die bn alle 6= 0 und ist limn!1 bn 6= 0; so konvergiert fan =bn g und es gilt
lim
n!1
an
limn!1 an
=
:
bn
limn!1 bn
Bemerkung 4.8
Obwohl z.B. die Folge n2 nicht in unserem Sinn konvergiert, schreibt man oft limn!1 n2 =
1: Allgemein: Für eine Folge fan g bedeutet limn!1 an = 1; dass für jede (noch so
grosse) Zahl K > 0 ein N existiert mit an
K für n
N: Analog de…niert man
limn!1 an = 1: Z.B. gilt limn!1 log n = 1:
4.2
Reihen
Ist fan g eine beliebige Folge reeller Zahlen, so de…niert
sn := a1 + a2 +
+ an
eine neue Folge fsn g von reellen Zahlen. Man nennt die sn auch die Partialsummen.
De…nition 4.9
P
fsn g nennt man die zu fan g gehörende Reihe. Man schreibt oft (symbolisch)
an für
fsn g : Die Reihe heisst konvergent, falls die Folge fsn g konvergent ist. Die Reihe heisst
divergent, falls die Folge fsn g divergent ist. Ist die Reihe konvergent, so schreibt man
für den Limes s := limn sn :
1
X
s=
an :
n=1
Die Reihe heisst absolut konvergent, falls die Reihe
Beispiel 4.10
1.
P
jan j konvergiert.
X1
:
n
Die Reihe nennt man auch die harmonische Reihe.
2.
X 1
:
n!
(n! steht für „n Fakultät“: n! := 1 2 3
n).
3.
4.
X 1
:
n2
X
1
1 1 1
:=1
+
+
n
2 3 4
Diese Reihe nennte man die alternierende harmonische Reihe.
( 1)n+1
37
Bemerkung 4.11
P
a) Die Reihe
an kann nur konvergieren, wenn fan g eine Nullfolge ist, d.h. wenn
limn!1
a
=
P n 0 ist. Wenn fan g eine Nullfolge ist, so folgt aber keineswegs, dass die
Reihe
an konvergiert.
b) Ist die Reihe absolut konvergent, so ist sie konvergent.
Beweis. a) Wir zeigen, dass die Reihe divergiert, wenn fan g keine Nullfolge ist. Nach
der De…nition ist fan g keine Nullfolge, wenn es eine positive Zahl " > 0 gibt, sodass
jan j > " für unendlich viele n gilt. Wegen sn sn 1 = an folgt dann auch jsn sn 1 j > "
für unendlich viele n: Somit ist fsn g keine Cauchy-Folge und damit konvergiert diese
Folge auch nicht.
Das Beispiel 1 oben ist divergent, wie wir gleich zeigen werden, obwohl f1=ng eine
Nullfolge ist.
P
b) Wir argumentieren wieder mit dem Cauchy-Kriterium. Sei sn := nk=1 jak j : Da
wir voraussetzen, dass die Reihe absolut konvergiert, so ist diese Folge eine Cauchy-Folge.
Zu jedem " > 0 existiert somit N (") mit jsn sm j " für n; m N (") : Wir können
annehmen, dass m < n ist, sonst vertauschen wir einfach die Rollen. (Für m = n ist die
Di¤erenz einfach 0). Dann ist
Xn
Xn
jsn sm j =
ak
jak j
k=m+1
= jsn
sm j
k=m+1
"
für N (") m < n: DamitP
ist gezeigt, dass fsn g eine Cauchy-Folge ist.
1
Hier der Beweis, dass
n divergiert. Die Folge
sn = 1 +
1 1
+ +
2 3
+
1
n
ist o¤ensichtlich monoton ansteigend. Wir zeigen nun einfach, dass sie nicht nach oben
beschränkt ist. Dazu klammern wir die Summe in s2n in spezieller Weise:
s2n
= 1+
+
1
2
+
1
2n
1
+1
1 1
+
3 4
+
2n
1 1 1 1
+ + +
5 6 7 8
1
1
+
+ n :
1+2
2
+
+
Wir klammern also immer
1
2k 1
+1
+
1
2k 1
+2
+
+
1
2k
zusammen, für k = 1; : : : ; n: (Das Glied 1 zu Beginn geht separat). Diese Ausdrücke in
Klammern haben stets 2k 2k 1 = 2k 1 (2 1) = 2k 1 Summanden, und jeder Summand
ist 2 k : Die Summe in den Klammern ist also 2k 1 2 k = 1=2:
Damit ist s2n
1 + n=2: Dies gilt für jedes n: Mithin ist die Folge fsn g nicht
beschränkt und somit auch nicht konvergent.
38
Es gibt einige Kriterien, mit denen sich Konvergenz einer Reihe in vielen Fällen
nachweisen lässt. Hier zunächst das sogenannte Quotientenkriterium. Man betrachtet
dazu die Quotienten
an+1
qn :=
;
an
wobei man voraussetzt, dass an 6= 0 ist.
Satz 4.12
Existiert q := limn!1 qn und gilt q < 1; so ist die Reihe konvergent. Existiert q und
gilt q > 1; so ist die Reihe divergent. (Man beachte, dass der Satz keine Aussage im Fall
q = 1 macht).
Wir wenden das auf das Beispiel 2 an:
X 1
n!
wobei n! die Fakultät von n ist: n! := 2 3 4
qn =
n: Dann gilt
n!
1
=
:
(n + 1)!
n+1
Wegen q = limn!1 qn = 0 folgt aus dem Quotientenkriterium, dass die Reihe konvergent
ist.
Es gilt übrigens
1
X
1
1
= e = lim 1 +
n!1
n!
n
n
= e = 2:71828182845905 : : : ;
n=0
was wir hier nicht nachweisen. Die Reihe wird von n = 0 an summiert, nicht n = 1; was
für die Konvergenz natürlich keine
spielt. 0! ist per Konvention = 1:
P Rolle
Versucht man im Beispiel 3.
n 2 das Quotientenkriterium, so kommt nichts dabei
raus:
an+1
n2
1
lim
= lim
= lim
2
1 = 1:
2
n!1 an
n!1 (n + 1)
n!1 1 +
n + n2
Damit ist das Quotientenkriterium nicht anwendbar, weder um die Konvergenz noch die
Divergenz zu zeigen. Die Reihe ist jedoch in der Tat konvergent (Übungsaufgabe). Es
gilt übrigens
1
2
X
1
=
;
n2
6
n=1
ein berühmtes Resultat von Euler.
Eine andere viel benützte Möglichkeit, um die Konvergenz nachzuweisen, besteht
darin, dass man die Reihe mit einer anderen Reihe vergleicht, deren Konvergenz man
schon kennt.
39
Satz 4.13
Existieren Zahlen bn
0 mit
P jan j
konvergiert auch die Reihe
an :
bn für alle n und konvergiert die Reihe
P
bn ; so
Aus diesem Kriterium sehen wir z.B., dass die Reihen
X 1
n
für
2 alle konvergieren, denn wie schon oben erwähnt, konvergiert die Reihe für
= 2. Für
2 gilt jedoch
1
1
:
n
n2
(Die Reihe konvergiert allerdings für alle > 1).
Die Reihe von Beispiel 4 ist konvergent. Hier die graphische Veranschaulichung der
ersten 20 Partialsummen:
1.0
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0.0
0
2
4
6
8
10
12
14
16
18
20
n
Sie ist ein Beispiel einer alternierenden Reihe, d.h. einer Reihe, deren Reihenglieder
stets das Vorzeichen wechseln. Wir formulieren das in einem allgemeinen Satz:
Satz 4.14
fan g sei eine monton fallende Folge von postiven Zahlen mit limn!1 an = 0: Dann
P
P
konvergieren die Reihen
( 1)n+1 an und
( 1)n an
Beweis. Die zweite Reihe ist einfach das Negative der ersten, sodass es genügt, die erste
zu betrachten, welche mit einem positiven Glied beginnt. Für ungerade n folgt
sn+1 = sn + ( 1)n+2 an+1 = sn
40
an+1 :
Da die an alle postiv sind, folgt sn+1 < sn ; falls n ungerade ist. Ferner gilt (weiter für
ungerade n)
sn+2 = sn an + an+1 sn ;
da wir voraussetzen, dass an+1
sn
an gilt, und somit gilt
sn+2
sn+4
sn+6
;
d.h. die Folge der ungerade Partialsummen ist monoton fallend. Analog folgt, dass die
Folge der geraden Partialsummen monoton ansteigend ist.
Aus diesen Überlegungen ergibt sich nun, dass für ein beliebiges ungerades n sämtliche sk mit k
n im Intervall [sn+1 ; sn ] liegen. In der Tat: Ist k ungerade, so folgt
sn sk > sk+1 sn+1 ; und ist k gerade, so folgt sn sk+1 > sk sn+1 : Somit gilt in
jedem Fall sk 2 [sn+1 ; sn ] für k n
Nach diesen Vorüberlegungen zeigen wir nun, dass die Folge fsn g eine Cauchy-Folge
ist. Sei " > 0 beliebig. Da wir voraussetzen, dass fan g eine Nullfolge ist, existiert ein N
(ungerade, wenn wir wollen), sodass 0 < aN " gilt. Damit hat das Intervall [sN +1 ; sN ]
eine Länge, die " ist. Wie wir gesehen haben, liegen alle Partialsummen sk für k N
in diesem Intervall. Somit gilt für alle k; m N die Ungleichung jsk sm j ":
Damit haben wir gezeicht, dass fsn g eine Cauchy-Folge ist. Nach Satz 4.4 folgt die
Konvergenz.
Ein berühmtes Beispiel einer alternierenden Reihe ist die Leibnizsche Reihe
1
1 1
+
3 5
1 1
+
7 9
=
4
:
Dass die Reihe konvergiert, haben wir eben bewiesen. Dass der Wert =4 ist, können wir
(noch) nicht einsehen. Die Reihe konvergiert zwar, aber sehr schlecht, d.h. man muss sehr
viele Reihenglieder summieren um =4 zu approximieren. Die Reihe eignet sich nicht zur
genauen Berechnung von :
Die Summation der ersten 10000 Reihenglieder, multipliziert mit 4; ergibt: 3:141492 65359004:
Diese Reihe ist auch ein Beispiel einer Reihe, die konvergiert, aber nicht absolut
konvergiert. Dass 1 + 13 + 15 + 71 + 19 +
divergiert sieht man analog wie bei der
harmonischen Reihe.
Mit abosolut konvergenten Reihen kann man gewissermassen umgehen wie mit endlichen Summen. Wir fassen einige wichtige diesbezügliche Fakten zusammen:
Satz
P 4.15
P
P1
P1
an ;
bn seien zwei absolut konvergente Reihen mit s =
n=1 an ; t =
n=1 bn :
Dann gelten:
a) Die Reihe
P
(an + bn ) ist absolut konvergent und es gilt
s+t=
1
X
n=1
41
(an + bn ) :
b) Die Reihe
P
cn sei wie folgt de…niert:
cn =
n
X
ak bn+1
k:
k=1
Diese Reihe ist absolut konvergent mit
st =
1
X
cn :
n=1
Mit anderen Worten:
st = (a1 + a2 + a3 +
) (b1 + b2 + b3 +
)
= a1 b1 + a2 b1 + a1 b2 + a3 b1 + a2 b2 + a1 b3 +
42
:
5
Stetigkeit
De…nition 5.1
1.
a) Ist D eine Teilmenge von R; so heisst 2 R ein Häufungspunkt von D; falls für
jedes " > 0; das Intervall ]
"; + "[ mindestens einen Punkt in D enthält, der
6= ist.
b) Ein Punkt 2 D heisst innererer Punkt von D; falls ein " > 0 existiert, sodass
]
"; + "[
D gilt. Ist 2 D kein innerer Punkt, so nennt man ihn einen
Randpunkt von D:
in der obigen De…nition a) kann, aber muss nicht, zu D gehören. Ist 2 D kein
Häufungspunkt von D; so nennt man auch einen isolierten Punkt von D: Ein innerer
Punkt ist o¤ensichtlich stets ein Häufungspunkt. Ein Häufungspunkt, der in D liegt,
muss jedoch nicht notwendigerweise in innerer Punkt sein.
Beispiel 5.2
a) Ist D = ]a; b[ ; mit a < b; so ist jeder Punkt in [a; b] ein Häufungspunkt von D:
Die Punkte ausserhalb von [a; b] sind keine Häufungspunkte, denn jeder Punkt
2
= [a; b] hat einen positiven Abstand r zu dieser Menge. Ist " < r; so gibt es keine
Punkte von D in ]
"; + "[ : Somit ist ein Punkt, der nicht in [a; b] liegt, kein
Häufungspunkt der Menge D: Die beiden Punkte a; b sind Häufungspunkte der
Menge D; obwohl sie nicht zu D gehören.
D enthält nur innere Punkte und keine Randpunkte.
b) D = [a; b]: Die Menge der inneren Punkte ist gleich ]a; b[ und a; b sind Randpunkte.
Die Menge der Häufungspunkte ist D:
c) D = Z: Diese Menge hat keine Häfungspunkte und keine inneren Punkte. Alle
Punkte von D sind isolierte Punkte.
d) D = f1=n : n 2 Ng : Die Elemente von D sind alle isoliert. Die Menge hat jedoch
den Häufungspunkt 0; der nicht in D liegt. 0 ist der einzige Häufungspunkt der
Menge.
e) Für D = Q ist jeder Punkt 2 R ein Häufungspunkt von D: Für jedes 2 R und
jedes " > 0 gibt es eine rationale Zahl 6= in ]
"; + "[ : Q enthält keine inneren
Punkte und alle Punkte sind somit Randpunkte.
Die Eigenschaft, dass ein Häufungspunkt von D ist, wird auch dadurch charakterisiert, dass eine Folge fxn g existiert, xn 2 D; xn 6= ; für alle n; mit limn!1 xn = :
Wir betrachten eine Funktion f : D ! R; welche auf einer Teilmenge D R de…niert
ist. Ist ein Häufungspunkt von D; so schreiben wir
y=
lim
x! ; x2Dnf g
43
f (x) :
(5.1)
falls für jede Folge fxn g
D; die gegen konvergiert und für die xn 6=
für alle n ist, der Limes limn!1 f (xn ) existiert und = y ist. Äquivalent dazu ist die Eigenschaft, dass für jedes " > 0 ein > 0 existiert, sodass jy f (x)j
" für jedes
x 2 (D \ ]
; + [) n f g ist. Etwas salopper ausgedrückt: f (x) ist beliebig nahe bei
y; sofern x in einer genügend kleinen Umgebung von ist, wobei jedoch x ungleich ist.
In der Notation (5.1) lassen wir oft die Präzisierung x 2 Dn f g weg und schreiben
einfach limx! f (x) :
Manchmal benötigt man auch die Unterscheidung, ob x den Punkt von oben, oder
von unten approximiert. Wir schreiben
y = lim f (x) ;
x#
wenn für jede monoton fallende Folge fxn g ; die limn!1 xn = erfüllt, y = limn!1 f (xn )
gilt. Analog ist y = limx" f (x) de…niert. Diese De…nitionen lassen sich auch durch ";
wie oben ausdrücken. Wir verzichten auf die Details.
y = limx! f (x) gilt genau denn, wenn y = limx# f (x) und y = limx" f (x) beide
gelten.
Es muss hier betont werden, dass für eine Funktion f und einen Häufungspunkt
der Grenzwert limx! f (x) keinesfalls immer existiert.
Bemerkung 5.3
Es ist nicht schwer zu sehen, dass sich die Eigenschaften aus Satz 4.7 auf die hier betrachtete Situation übertragen: Sind etwa f; g zwei auf D de…nierte Funktionen und ein
Häufungspunkt von D; so gilt die folgende Aussage: Existieren sowohl limx! f (x) ; wie
limx! g (x) ; so existiert limx! (f (x) + g (x)) und ist gleich limx! f (x)+limx! g (x) :
Die anderen Aussagen übertragen sich analog.
De…nition 5.4
f sei eine auf D
R de…nierte Funktion, und sei 2 D kein isolierter Punkt von
D. f heisst stetig in ; falls f ( ) = limx! f (x) ist. Ist ein isolierter Punkt, so ist
(per Konvention) jede Funktion stetig in : f heisst stetig auf D; falls es stetig in allen
Punkten von D ist.11
Bemerkung 5.5
Die folgenden Formulierungen (I) und (II) sind äquivalent zur Stetigkeit einer Funktion
f : D ! R in 2 D :
(I) Für jede Folge fxn g
D mit limn!1 xn =
(II) Zu jedem " > 0 gibt es ein
jx
j
gilt limn!1 f (xn ) = f ( )
> 0 mit
und x 2 D =) jf (x)
11
f ( )j
":
Hat D nur isolierte Punkte, so ist nach dieser De…nition jede Funktion f : D ! R stetig, da es
gar keine Häfungspunkte gibt, für die irgend etwas nachzuprüfen wäre. Insbesondere ist jede Funktion
N ! R stetig.
44
Zur Veranschaulichung der letzten De…nition eine Graphik mit einem Beispiel: Die
eingezeichnete Funktion hat in 2 den Funktionswert f (2) = 3:87: In der Graphik
haben wir " = 0:2 genommen. Die beiden horizontalen roten Linien markieren
einen "-Schlauch um den Funktionswert 3:87: Falls die Funktion stetig in = 2
ist, so …ndet man ein > 0; sodass für alle x 2 [2
; 2 + ] der Funktionswert
f (x) im roten Schlauch zu liegen kommen. Im Beispiel unten reicht = 0:025:
Um Stetigkeit zu zeigen, muss man nachweisen, dass für jeden (noch so engen)
horizontalen "-Schlauch ein vertikeler Schlauch um existiert, sodass alle Punkte
auf der x-Achse, die innerhalb des Letzteren liegen, auf Punkte innerhalb des "Schlauchs abgebildet werden.
5
4
3
2
1.6
1.8
2.0
2.2
2.4
Beim Nachweis der Stetigkeit wird selten direkt die De…nition verwendet, sondern
man stützt sich auf eine Reihe von Resultaten und Sätzen, die unmittelbar aus Satz 4.7
und Bemerkung 5.3 folgen.
Satz 5.6
Es seien f; g : D ! R zwei Funktionen, die stetig in
folgenden Funktionen stetig in :
2 D sind. Dann sind auch die
a) Die Summe f + g der beiden Funktionen, die de…niert ist durch (f + g) (x) :=
f (x) + g (x) :
b) Das Produkt der Funktionen f g; de…niert durch (f g) (x) = f (x) g (x) :
c) Falls g ( ) 6= 0 ist, der Quotient (f =g) ; de…niert durch (f =g) (x) = f (x) =g (x)
(eventuell mit eingeschränktem De…nitionsbereich fx : g (x) 6= 0g :
45
Korollar 5.7
Sind f; g stetig auf dem ganzen De…nitionsbereich, so auch f + g; f g; und f =g; letzteres
auf fx 2 D : g (x) 6= 0g :
Zwei Beispiele stetiger Funktionen sind fast trivial:
Beispiel 5.8
a) Die identische Funktion of R : id (x) = x ist stetig auf R: Das ist eine triviale
Folgerung aus der De…nition und der Formulierung von Bemerkung 5.5 (I): Ist
fxn g eine Folge, die gegen 2 R konvergiert, so gilt
lim id (xn ) = lim xn =
n!1
n!1
b) Für jeden De…nitionsbereich A
stetig.
= id ( ) ;
R sind die konstanten Funktionen f (x) = c
Mit diesen beiden Beispielen und Satz 5.6 können wir das Beispielreservoir von stetigen Funktionen nun erweitern.
Zunächst sehen wir durch Multiplikation von id mit sich selbst und einer Anwendung
von Satz 5.6 b), dass auch die Funktion f (x) = x2 stetig ist. Diese Funktion können wir
nochmals mit id multiplizieren und erhalten, dass f (x) = x3 stetig ist, etc. Wir sehen
also (genau genommen mit vollständiger Induktion), dass für jedes n 2 N die Funktion
f (x) = xn stetig ist. Verwenden wir nun, dass die konstanten Funktionen stetig sind
und nochmals Satz 5.6 b), so sehen wir, dass auch Funktionen der Form f (x) = cxn
stetig sind, c 2 R: Nun können wir solche Funktionen auch addieren unter Erhalt der
Stetigkeit. Mit Satz 5.6 a) folgt somit:
Satz 5.9
Alle Polynome sind stetige Funktionen R ! R:
Unter Verwendung von 5.6 c) können wir weiter folgern, dass auch die sogenannten
rationalen Funktionen stetig sind:
De…nition 5.10
Eine rationale Funktion r ist de…niert durch
r (x) =
p (x)
;
q (x)
wobei p (x) ; q (x) zwei Polynome sind. Der De…nitionsbereich der rationalen Funktion
ist fx 2 R : q (x) 6= 0g : (Ist q (x) ein Polynom vom Grad n
1; so wissen wir schon,
dass es höchstens n Nullstellen hat. Die obige rationale Funktion ist somit bis auf diese
maximal n Punkte überall de…niert).
Satz 5.11
Eine rationale Funktion ist auf ihrem De…nitionsbereich stetig.
46
x2
Ein Beispiel einer rationalen Funktion. Wir nehmen p (x) = 1 + x + x3 =10; q (x) =
1: q (x) hat die beiden Nullstellen 1; 1: Hier der Graph:
3
2
1
-3
-2
-1
1
2
3
x
-1
-2
-3
Diese rationale Funktion hat zwei sogenannte Pole bei
Nullstellen des Nenners entspricht.
Hier noch zwei Beispiele von unstetigen Funktionen:
1 und bei +1; was den
Beispiel 5.12
1. Sei f : R ! R de…niert durch
f (x) :=
0 fu
•r x < 0
:
1 fu
•r x 0
Die Funktion ist o¤ensichtlich unstetig im Punkt 0: Formal können wir das wie
folgt beweisen. Wir betrachten die Folge fxn g mit xn := 1=n: Diese Folge konvergiert gegen 0: Da alle xn kleiner als 0 sind, gilt f (xn ) = 0 für alle n und somit
limn!1 f (xn ) = 0: Anderseits ist f (0) = 1: Somit gilt
f (0) 6= lim f (xn ) :
n!1
2. Wir betrachten die folgende Funktion f : R ! R
f (x) :=
1 fu
•r x rational
:
0 fu
•r x irrational
Diese Funktion ist in keinem Punkt stetig.
Wir weisen zunächst nach, dass die Funktion in keinem irrationalen Punkt x stetig ist. Ist eine irrationale Zahl, so lässt sie sich in einen unendlichen Dezimalbruch entwickeln. Wir de…nieren xn indem wir in der Dezimalbruchentwicklung die Stellen nach der n-ten nach dem Komma durch 0 ersetzen. Ist z.B.
47
= = 3:141592 65358979; so de…nierten wir x1 = 3:1; x2 = 3:14; x3 = 3:141
etc. Diese xn sind alle rational und die Folge konvergiert gegen : Jedoch gilt
f ( ) = 0 6= 1 = limn!1 f (xn ) : Somit ist gezeigt, dass f nicht stetig in ist, wenn
rational ist.
Wir weisen nun nach, dass f auch p
in rationalen Punkten nicht stetig ist. Sei also
rational. Wir wissen schon, dass 2 irrational ist. Dann ist auch
p
2
xn := +
n
p
)). Die Folge fxn g konvergiert
irrational. (Wäre xn rational, so auch 2 = n (xn
o¤ensichtlich gegen ; aber es gilt
f ( ) = 1 6= 0 = lim f (xn ) :
n!1
Somit ist gezeigt, dass f in keinem Punkt stetig ist.
Neben den Polynomen und rationalen Funktionen sind auch die üblichen Standardfunktionen stetig, was wir nicht beweisen wollen.
Satz 5.13
a) Die Funktionen ex ; sin (x) ; cos (x) sind stetige Funktion auf R:
b) Die Funktion log (x) ist stetig auf ]0; 1[ :
c) Die Funktion tan (x) ist stetig auf ]
=2; =2[ :
d) arcsin (x) ist stetig auf dem Intervall [ 1; 1] ; arctan (x) ist stetig auf R:
Komposition von Funktionen: Wir führen die Komposition (Zusammensetzung,
„Hintereinanderschaltung“) von Funktionen ein. Wir können das ganz allgemein de…nieren, obwohl wir es in diesem Kapitel nur für Funktionen auf R benötigen.
De…nition 5.14
Es seien f : D ! A und g : B ! C Abbildungen, wobei der Bildbereich im (f ) eine
Teilmenge des De…nitionsbereich B von g sei. Dann ist die Zusammensetzung g f :
D ! C de…niert durch (g f ) (a) = g (f (a)) : (Man beachte, dass f (a) 2 B gilt, da wir
im (f ) B voraussetzen).12
Beispiel 5.15
p
Die Funktion x ! sin2 ( x) ist auf der positiven reellen Achse de…niert und ist die
p
Komposition von drei Funktionen: Erst f (x) := x; was nur auf der positiven Achse
de…niert ist, dann g (x) := sin x; und schliesslich h (x) := x2 : Formal
p
sin2
x = (h g f ) (x) = h (g (f (x))) :
12
Man beachte, dass f zuerst ausgeführt wird, und anschliessend g; obwohl g links von f steht. Die
Notation hat sich leider so durchgesetzt, was darauf zurückzuführen ist, dass man f (x) schreibt für f
an der Stelle x; obwohl (x) f sinnvoller wäre, denn man „nimmt“ erst x und bildet dann x mit f ab. Es
hat erfolglose Versuche gegeben, die Bezeichnungen umzustellen.
48
Zurück zu stetigen Funktionen. Es stellt sich heraus, dass Kompositionen von stetigen
Funktionen wieder stetig sind:
Satz 5.16
Es seien f : D ! R und g : B ! R Funktionen mit D; B
R; wobei vorausgesetzt
sei, dass im (f ) B ist. Ferner sei 2 D: Ist f stetig in und g stetig in f ( ) ; so ist
g f : D ! R stetig in : Sind f; g beide stetig auf ihren De…nitionsbereichen, so ist g f
ebenfalls stetig auf D:
Beweis. Der Beweis ist wieder eine simple Anwendung von Bemerkung 5.5 (I): Ist fxn g
eine Folge, die gegen konvergiert, so gilt nach Voraussetzung an die Stetigkeit von f
die Gleichung
lim f (xn ) = f ( )
n!1
und dann unter Verwendung der Stetigkeit von g :
lim g (f (xn )) = g (f ( )) :
n!1
Da das für jede Folge fxn g ; die gegen konvergiert, richtig ist, folgt die Stetigkeit von
g f in :
Mit Hilfe diese Satzes und Satz 5.13 können wir viele neue Beispiele von stetigen
Funktionen konstruieren.
Beispiel 5.17
Die Gausssche Glockenfunktion f (x) = e
x2 ;
hier der Graph der Funktion
1.0
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
-3
-2
-1
0
1
2
3
x
ist stetig. Die Funktion ist die Zusammensetzung der Funktion x ! x2 ; deren Stetigkeit
wir schon gesehen haben (es ist ein Polynom) mit der Exponentialfunktion. Nach Satz
5.16 ist die Glockenfunktion somit stetig.
49
Eine wichtige, intuitiv unmittelbar einleuchtende Eigenschaft stetiger Funktionen ist
im folgend Satz beschrieben:
Satz 5.18 (Zwischenwertsatz)
Ist f : [a; b] ! R eine stetige Funktion, die auf dem Intervall [a; b] de…niert ist, und
ist J das Intervall mit Endpunkten f (a) und f (b) (also entweder [f (a) ; f (b)] oder
[f (b) ; f (a)] je nach dem, welcher Funktionswert grösser ist), so gibt es für jedes y 2 J
mindestens ein x 2 [a; b] mit f (x) = y:
Beispiel 5.19
Als Anwendung des Zwischenwertsatzes können wir zeigen, dass jedes reelle Polynom
dritten Grades mindestens eine reelle Nullstelle hat. Das Polynom sei p (x) = ax3 +
bx2 + cx + d mit a 6= 0: Für die Nullstellen p (x) = 0 können wir durch a dividieren, und
wir können deshalb voraussetzen, dass a = 1 ist. Sei
K := max f3 jbj ; 3 jcj ; 3 jdjg + 1
Dann gilt
K 3 = KK 2
K3
K
3
3 jbj K 2 + 1 > 3 jbj K 2
K 2 (wegen K
K > 3 jdj
3d:
1) > 3 jcj K
3bK 2
3cK
Somit also
K3 =
>
K3 K3 K3
+
+
3
3
3
2
bK
cK d;
und damit
p (K) = K 3 + bK 2 + cK + d > 0:
Analog zeigt man
p ( K) < 0:
Das Polynom ist überall stetig, insbesondere als Abbildung [ K; K] ! R: Aus dem
Zwischenwertsatz folgt also, dass ein x 2 [ K; K] existiert, mit p (x) = 0:
Wir wenden uns nun einem etwas anderen, aber eng verwandten Thema zu, das für
das nächste Kapitel wichtig wird. Oft kommt es vor, dass eine stetige Funktion auf einer
Menge D R de…niert ist, welche einen oder mehrere Häufungspunkte hat, die nicht zu
D gehören. Ein typisches Beispiel ist eine Funktion, die auf der positiven reellen Achse
]0; 1[ de…niert ist, aber (zunächst) nicht im Nullpunkt. 0 ist ein Häufungspunkt von
]0; 1[ : Wir diskutieren für einige wichtige Beispiele, ob sich die Funktion auf diesem
oder diesen Häufungspunkten so de…nieren lässt, dass die gesamte Funktion stetig wird.
Wenn f z.B. zunächst stetig auf ]0; 1[ de…niert ist, stellt sich die Frage, ob sich f auf 0
so de…nieren lässt, dass die Funktion auf [0; 1[ stetig ist.
50
O¤ensichtlich geht das nicht immer. Z.B. ist die Logarithmusfunktion stetig auf
]0; 1[ ; aber es gibt keine Möglichkeit, f (0) 2 R so zu de…nieren, dass die Logarithmusfunktion auf [0; 1[ stetig ist.13 .
Hier zwei andere Beispiele:
Beispiel 5.20
a) f :]0; 1[! R sei de…niert durch
f (x) = sin (1=x) :
Das ist die Komposition der Funktion x ! 1=x; die stetig auf ]0; 1[ ist mit der
Sinusfunktion, die überall stetig ist. f ist daher stetig auf ]0; 1[ : Hier ist der Graph
der Funktion: sin (1=x) :
sin(1/x)
1.0
0.8
0.6
0.4
0.2
0.0
0.2
0.4
0.6
-0.2
0.8
1.0
1.2
1.4
1.6
1.8
2.0
x
-0.4
-0.6
-0.8
-1.0
Wenn x gegen 0 strebt, so strebt 1=x gegen 1: Somit ‡uktuiert der Funktionswert
sin (1=x) zwischen 1 und 1; für x ! 0: Es ist o¤ensichtlich nicht möglich, einen
Funktionswert für x = 0 so festzulegen, dass die Funktion auch in 0 stetig wird.
b) Wir mod…zieren das obige Beispiel, indem wir die Funktion noch mit x multiplizieren:
f (x) = x sin (1=x) :
Hier der Graph:
13
Manchmal behilft man sich damit, dass man 1 oder 1 als Funktionswerte zulässt und noch
de…niert, was es heissen soll, dass eine Funktion mit Werten in R[ f 1; 1g stetig ist. Bei der Logarithmusfunktion würde man dann log (0) = 1 setzen. Wir diskutieren das jedoch nicht im Detail.
51
xsin(1/x)
1.0
0.8
0.6
0.4
0.2
0.0
0.2
0.4
0.6
0.8
1.0
-0.2
1.2
1.4
1.6
1.8
2.0
x
-0.4
-0.6
-0.8
-1.0
Der Faktor x vor sin (1=x) „killt“ o¤enbar die Unstetigkeit in 0: Setzt man f (0) :=
0; so ist die Funktion auf der ganzen reellen Achse stetig, was sich der Leser als
Übungsaufgabe überlegen möge.
n
exiNun zu weiteren Beispielen: Wir hatten schon gezeigt, dass limn!1 1 + n1
stiert. Der Grenzwert ist die Eulersche Zahl e: Die Folge n1 ist jedoch nur eine ganz
spezielle Folge, die gegen 0 konvergiert. Die Funktion
f (x) := (1 + x)1=x
ist jedoch für jedes x > 0 de…niert und stetig auf ]0; 1[ : Dies können wir wie folgt sehen:
Die Funktion lässt sich wie folgt umschreiben:
f (x) = e(1=x) log(1+x)
Sowohl x ! 1=x; wie x ! log (1 + x) sind stetige Funktionen auf ]0; 1[. Also ist auch
das Produkt dieser Funktionen stetig. Da die Exponentialfunktion stetig ist, folgt die
behauptete Stetigkeit auf ]0; 1[ : 0 ist ein Häufungspunkt des Intervalls ]0; 1[ : Diese
Funktion lässt sich stetig im Nullpunkt fortsetzen, indem man f (0) := e de…niert, denn
es gilt das folgende Resultat:
Lemma 5.21
lim (1 + x)1=x = e:
x!0
Um dies nachzuweisen, müsste man beweisen, dass für jede Folge fxn g ; die gegen 0
konvergiert e der Limes von (1 + xn )1=xn ist, oder äquivalent die Eigenschaft über "; :
Das ist nicht schwierig; wir wollen es jedoch nicht durchführen.
52
Etwas schwieriger ist folgendes Beispiel. Wir betrachten die Funktion
f (x) =
sin x
;
x
die für alle x 6= 0 de…niert ist. Die Frage ist wieder, ob wir sie im Nullpunkt so festlegen
können, dass sie auf ganz R stetig de…niert ist. Das geht in der Tat mit der Festsetzung
f (0) := 1:
Lemma 5.22
sin x
=1
x!0 x
lim
Beweis. Wir zeigen nur
lim
x#0
sin x
= 1:
x
Für x " 0 verwenden wir, dass sin ( x) = ( x) = sinx x ist, sodass wir diesen Fall auf
den ersten zurückführen können. Wenn wir irgend etwas zu einem Limes x # 0 beweisen
wollen, so reicht es natürlich aus, die betrachteten Funktionen für (beliebig) kleine x > 0
zu untersuchen. Wir können uns insbesondere auf 0 < x < =2 einschränken. Für diese
Winkel gilt sin x < x; was man der unten stehenden Zeichnung entnimmt: Der Winkel
x im Bogenmass ist die Länge auf dem Einheitheitskreis von B nach D: sin (x) ist die
Länge der Strecke von A nach D: Diese Länge ist o¤ensichtlich kleiner als x: Daher gilt
sin (x) < x und mithin
sin x
<1
x
für alle 0 < x < =2: Somit folgt
sin x
x!0 x
lim
53
1:
Anderseits ist die Länge der Strecke von B nach C grösser als x: Das wirklich mathematisch zu beweisen, erfordert etwas Aufwand; geometrisch ist es jedoch (ho¤entlich)
sin x
klar ersichtlich. Diese Länge ist tan x = cos
x : Somit erhalten wir
sin x
;
cos x
sin x
cos x <
:
x
cos x ist stetig in x und cos 0 = 1: Geht man zum Limes x ! 0 über, so erhält man14
sin x
lim
1:
x!0 x
x <
6
Di¤erentialrechnung
6.1
De…nition des Di¤erentialquotienten und grundlegende Rechenregeln
Wenn man mit einem Automobil eine Strecke von 200 km in zwei Stunde zurücklegt,
und stets dieselbe Geschwindigkeit einhalten kann, so fährt man mit einer Geschwindig14
Die vorgestellte Argumentation ist mathematisch nicht ganz sauber, denn wir haben die Existenz
vom limx!0 sinx x implizite vorausgesetzt und nur gezeigt, dass der Limes unter dieser Voraussetzung
gleich 1 ist. Das lässt sich jedoch mit etwas formalem Aufwand, den wir hier nicht betreiben wollen,
leicht rechtfertigen.
54
keit von 100 km/h. Diese Geschwindigkeit ergibt sich als Quotient der zurückgelegten
Strecke dividiert durch die benötigte Zeit. Bekanntlich ist das Einhalten einer konstanten
Geschwindigkeit in dieser Höhe, vor allem, wenn man den Führerschein behalten will,
nicht immer möglich. Die Geschwindigkeit zu einem bestimmten Zeitpunkt t ergibt sich
auch im Fall, wo diese nicht konstant ist, als zurückgelegte Strecke pro Zeiteinheit, wobei
man jedoch den Quotienten nur über ein kleines Zeitintervall betrachtet.
Unten ein Beispiel. Die eingezeichnete Kurve sei die zurückgelegte Strecke s als Funktion der Zeit t: Die Funktion ist künstlich als s (t) = 0:2t + 0:1t3 gewählt, aber das
ist hier ohne Belang. Wir wollen die Geschwindigkeit zum Zeitpunkt t = 1 bestimmen.
s (1) = 0:595 8: Wir können die Geschwindigkeit approximieren, indem wir s (2) = 0:963
bestimmen und dann den Quotienten betrachten: Streckenzuwachs dividiert durch Zeitzuwachs
s (2) s (1)
= 0:9
1
Die Steigungsgeraden ist unten rot eingezeichnet. O¤ensichtlich ist die Approximation für
die Geschwindigkeit nicht besonders gut. Wir wählen als Nächstes ein kürzeres Intervall
der Länge 0:1: Das ist unten grün eingezeichnet. Die approximative Geschwindigkeit
ergibt sich als
s (1:1) s (1)
= 0:531
0:1
Wählt man die Zeitdi¤erenz stets kleiner und kleiner, so erhalten wir am Schluss die
korrekte Geschwindigkeit, welche durch die Steigung der Tangente an die Kurve zum
Zeitpunkt 1 gegeben ist. Für die obige Funktion ist das exakt 1=2: Die Tangente ist
unten blau eingezeichnet.
55
s(t) 2.4
2.2
2.0
1.8
1.6
1.4
1.2
1.0
0.8
0.6
0.4
0.2
0.0
0.0
0.2
0.4
0.6
0.8
1.0
1.2
1.4
1.6
1.8
2.0
2.2
2.4
t
Diese Betrachtung legt die folgende De…nition nahe:
De…nition 6.1
f sei eine stetige Funktion f : I ! R; wobei I ein o¤enes Intervall in I ist.15 Die Funktion
heisst di¤erenzierbar in x 2 I; falls
f (x + h)
h!0
h
lim
f (x)
df
exisitiert. Den Grenzwert bezeichnen wir mit f 0 (x) oder dx
(x) : Man nennt ihn den
Di¤erentialquotientent im Punkt x; oder die Ableitung von f im Punkt x: Die
Ausdrücke der Form f (x+h)h f (x) ; h 6= 0; heissen Di¤erenzenquotienten.
Die Funktion heisst di¤erenzierbar auf I; falls sie di¤erenzierbar in jedem Punkt
x 2 I ist. Die Funktion heisst stetig di¤erenzierbar auf I; wenn sie di¤erenzierbar auf
I ist, und die Ableitung f 0 eine stetige Funktion auf I ist.
Der Sinn, in dem der obige Limes verstanden wird, benötigt gewisse Präzisierungen.
Der Limes h ! 0 wird entlang von reellen Zahlen 6= 0 genommen, für die selbstverständlich x + h 2 I sein muss. Da wir voraussetzen, dass I ein o¤enes Intervall ist, gilt für
jeden Punkt x 2 I dass x + h 2 I ist, sofern h genügend klein ist. Die Einschränkung,
15
Ein Intervall I
I = R ist.
R heisst o¤en, wenn es von der Form ]a; b[ , ]a; 1[ oder ] 1; b[ ist, oder wenn
56
dass x + h in I sein muss (damit f (x + h) de…niert ist), ist daher nicht von Bedeutung.
Etwas anders sähe der Fall aus, wo f auf einem Intervall [a; b] de…niert ist. Dann könnten wir für x = a den Limes a + h ! a nur von rechts, und den Limes b + h ! b nur
von links nehmen. Man spricht dann von einer rechtsseitigen bzw. linksseitigen Ableitung. Auf solche Feinheiten wollen wir hier nicht weiter eingehen. Deshalb betrachten
wir nur Funktionen, die auf einem o¤enen Intervall (oder ganz R) de…niert sind, bzw.
für Funktionen, die auf einem abgeschlossenen Intervall de…niert sind, betrachten wir die
Di¤erentialquotienten (in der Regel) nur für Punkte im Inneren des Intervalls.
Geometrisch gibt die Ableitung f 0 (x0 ) von f im Punkt x0 die Steigung der Tangente an den Graphen der Funktion im Punkt x0 an. Wir werden später diese Interpretation benützen, um geometrische Eigenschaften von Funktionen zu diskutieren.
Die Tangente an den Graphen der Funktion, die durch (x0 ; f (x0 )) geht, ist durch die
Funktion
x ! f (x0 ) + (x x0 ) f 0 (x0 )
gegeben. Dies ist nämlich die Gerade, die für x0 den Wert f (x0 ) hat und die Steigung
f 0 (x0 ) besitzt. Das sollte aus dem Gymnasium bekannt sein.
Unten als Beispiel die Funktion f (x) = x3 x mit der Tangente im Punkt (1=4; f (1=4)) ;
die rot eingezeichnet ist:
3
2
1
-2.0
-1.5
-1.0
-0.5
0.5
1.0
1.5
2.0
x
-1
-2
-3
In Bereichen des De…nitionsbereichs, in denen die Ableitung positiv ist, steigt die
Funktion o¤enbar an, während sie dort fällt, wo sie negativ ist.
Wir diskutieren einige wichtige Beispiele von Funktionen, in denen sich die Ableitungen leicht berechnen lassen.
57
Beispiel 6.2
f : R ! R sei die identische Abbildung f (x) = x: Da die Di¤erenzenzenquotienten alle
gleich 1 sind:
f (x + h) f (x)
x+h x
=
= 1;
h
h
folgt f 0 (x) = 1 für alle x:
Ebenso einfach ist die Ableitung einer konstanten Funktion f (x) = c: Deren Ableitung ist o¤ensichtlich 0; da der Zähler im Di¤erenzenquotienten stets 0 ist.
Beispiel 6.3 (Ableitung von Potenzen)
Etwas schwieriger ist der Fall einer ganzzahligen Potenz von x : f (x) = xn ; n 2 N: Wir
berechnen f (x + h) mit dem binomischen Lehrsatz:
f (x + h) = (x + h)n =
n
X
n k n
h x
k
k
:
k=0
Subtrahieren wir f (x) = xn ; so fällt der erste Summand weg. Dividieren wir anschliessend durch h 6= 0; so ergibt sich
(x + h)n
h
xn
=
n
X
n k
h
k
1 n k
x
k=1
n 1
= nx
n
X
n k
h
+
k
1 n k
x
:
k=2
Nun sieht man, dass in den Summanden nach nxn 1 jeder Summand den Faktor h
mindestens einmal enthält. Somit strebt dieser Teil gegen 0 mit h ! 0: Wir haben somit
gezeigt, dass f (x) = xn stegig di¤erenzierbar ist, mit
f 0 (x) = nxn
1
:
Beispiel 6.4
Wir können auch negative Potenzen ableiten. Hier das Beispiel f (x) = 1=x. Die Funktion
ist für x 6= 0 de…niert. Für x; x + h 6= 0 ist
f (x + h)
h
f (x)
1
1
1
1 x (x + h)
=
h x+h x
h x (x + h)
1
:
x (x + h)
=
=
Für h ! 0 geht das gegen
1=x2 : Wir haben also gezeigt, dass
d
1
x
dx
=
ist.
58
1
x2
Ist die Funktion f : I ! R auf ganz I di¤erenzierbar, so können wir die Ableitung
selbst als Funktion von x auf ganz I au¤assen.
Nehmen wir etwa die Funktion f (x) = x2 ; die auf ganz R de…niert ist, so ist die
Ableitung die Funktion f 0 (x) = 2x; also eine lineare Funktion. In der Graphik unten sind
die beiden Funktionen x ! x2 (durchgezogen) und deren Ableitung x ! 2x (gestrichelt)
eingezeichnet:
f 0 (x)
20
10
-5
-4
-3
-2
-1
1
2
3
4
5
x
-10
Eine wichtige Eigenschaft ist die sogenannte Linearität der Ableitung: Sie besagt,
dass die Ableitung von Linearkombinationen von Funktionen gegeben ist durch die Linearkombination der Ableitungen. Hier die genaue Formulierung.
Es seien f; g zwei Funktionen I ! R gegeben. Wir de…nieren die Summe der beiden
Funktionen durch
(f + g) (x) := f (x) + g (x) ; x 2 I:
Noch etwas allgemeiner: Sind noch zwei reelle Zahlen a; b 2 R gegeben, so de…nieren wir
die Linearkombination durch
(af + bg) (x) = af (x) + bg (x) ; x 2 I:
Satz 6.5
Sind f; g zwei di¤erenzierbare Funktion I ! R; so ist af + bg di¤erenzierbar, und es gilt
(af + bg)0 (x) = af 0 (x) + bg 0 (x) ; x 2 I:
Beweis.
(af + bg) (x + h)
h
(af + bg) (x)
af (x + h) + bg (x + h) (af (x) + bg (x))
h
f (x + h) f (x)
g (x + h) g (x)
= a
+b
:
h
h
=
59
Nach Voraussetzung konvergieren für h ! 0 die beiden Summanden auf der rechten
Seite gegen af 0 (x) bzw. bg 0 (x) : Nach Satz 4.7 konvergiert die linke Seite daher gegen
af 0 (x) + bg 0 (x) :
Mit Hilfe dieser Resultate, können wir nun alle Polynome ableiten:
Satz 6.6
p (x) = a0 + a1 x +
+ an xn sei ein Polynom n-ten Grades. Dann ist
p0 (x) = a1 + 2a2 x + 3a3 x2 +
+ nan xn
1
:
(Man beachte, dass die Ableitung eines Polynoms n-ten Grades ein Polynom (n
Grades ergibt.)
1)-ten
Bevor wir weitere Beispiele diskutieren, noch etwas Theorie. Unten sind die zwei
wichtigsten Sätze über Di¤erentiation aufgeführt.
Satz 6.7 (Produktregel)
f; g : I ! R seien zwei stetige und di¤erenzierbare Funktionen. Dann ist das Produkt
f g der Funktionen (de…niert durch (f g) (x) := f (x) g (x)) di¤erenzierbar und es gilt
(f g)0 = f 0 g + f g 0 :
Beweis. Sie x 2 I und h 6= 0: Dann ist
(f g) (x + h)
h
(f g) (x)
=
=
f (x + h) g (x + h) f (x) g (x)
h
f (x + h) f (x)
g (x + h)
g (x) + f (x + h)
h
h
g (x)
:
Für h ! 0 konvergiert der erste Faktor des ersten Summanden gegen f 0 (x) : Im zweiten
Summanden konvergiert der erste Faktor gegen f (x) wegen der Stetigkeit von f; und
der zweite Faktor gegen g 0 (x) : Somit konvergiert (nach Satz 4.7) der ganze Ausdruck
gegen f 0 (x) g (x) + f (x) g 0 (x) :
Das zweite wichtige Resultat ist die sogenannte Kettenregel, die beschreibt, wie man
Kompositionen von Funktionen di¤erenziert.
Satz 6.8 (Kettenregel)
Es seien f; g zwei stetige Funktionen f : I ! R; g : J ! R; wobei im (f ) J vorausgesetzt wird. Sind f; g beide di¤erenzierbar, so ist g f : I ! R di¤erenzierbar, und es
gilt
(g f )0 (x) = g 0 (f (x)) f 0 (x) :
Beweis. x sei eine Zahl in I: Für h ! 0 geht, wegen der Stetigkeit von f; auch h0 :=
f (x + h) f (x) ! 0: (h0 hängt natürlich von x ab, aber wir halten x im Moment fest).
(g f ) (x + h)
h
(g f ) (x)
=
=
g (f (x + h)) g (f (x))
h
g (f (x) + h0 ) g (f (x)) f (x + h)
h0
h
60
f (x)
:
Wir setzen hier voraus, dass h0 6= 0 ist, was nicht immer garantiert ist. Wir lassen diese
(kleine) Schwierigkeit ausser Betracht. Für h ! 0 geht der erste Faktor (wegen h0 ! 0)
gegen g 0 (f (x)) und der zweite Faktor gegen f 0 (x) :
Mit Hilfe der Kettenregel können wir nun auch die Quotientenregel herleiten. Sei
i (x) := x 1 ; was für x 6= 0 de…niert ist. Die Ableitung von i ist, wie oben in Beispiel
6.4 gesehen, 1=x2 : Ist g eine Funktion, die im De…nitionsbereich 6= 0 ist, so können wir
1=g (x) als
1
= i (g (x))
g (x)
schreiben und erhalten nach der Kettenregel
g 0 (x)
:
g (x)2
d 1
= i0 (g (x)) g 0 (x) =
dx g (x)
Wenden wir die Produktregel an, so können wir auch f (x) =g (x) ableiten:
Satz 6.9 (Quotientenregel)
Sind f; g zwei di¤erenzierbare Funktionen, so gilt für g (x) 6= 0
f (x)
g (x)
Beweis. Wir schreiben
0
=
f 0 (x) g (x) f (x) g 0 (x)
:
g (x)2
f (x)
1
= f (x)
g (x)
g (x)
und wenden die Produktregel an:
f (x)
g (x)
0
0
1
1
+ f (x)
g (x)
g (x)
f 0 (x)
g 0 (x)
f 0 (x) g (x) f (x) g 0 (x)
+ f (x)
=
:
g (x)
g 2 (x)
g (x)2
= f 0 (x)
=
Wir kommen zur Herleitung der Ableitungen einiger wichtiger Funktionen wie log x;
ex ; der trigonometrischen Funktion, arcsin; arctan; etc.
Zunächst die Logarithmusfunktion, die nur auf der positiven reellen Achse de…niert
ist. Wie schon festgelegt wurde, betrachten wir stets den Logarithmus zur Basis e; was
nun wichtig ist. e ist de…niert als
e = lim
n!1
1+
1
n
n
:
Nach Lemma 5.21 gilt
e = lim (1 + h)1=h :
h!0
61
(6.1)
Für x > 0; h 6= 0 mit x + h > 0 gilt
log (x + h)
h
log x
1 log 1 +
=
x
h=x
h
x
1
= log
x
h
1+
x
x=h
!
:
Mit h ! 0 gilt auch h=x ! 0; also mit (6.1)
lim
h!0
h
1+
x
x=h
= e:
Wegen log e = 1 und der Stetigkeit des Logarithmus folgt
lim
h!0
log (x + h)
h
log x
=
1
:
x
Wir haben somit den folgenden Satz hergeleitet:
Satz 6.10
Die Ableitung des natürlichen Logarithmus ist die Funktion x ! 1=x:
Um die Exponentialfunktion abzuleiten, verwenden wir den folgenden allgemeinen
Satz über die Ableitungen von Umkehrfunktionen.
Satz 6.11 (Ableitung der Umkehrfunktion)
Sei f : I ! R ein stetige Funktion, welche I bijektiv auf I 0 := im (f ) abbildet. Ist
x 2 I; y := f (x) und ist f di¤erenzierbar in x mit f 0 (x) 6= 0; so ist die inverse Funktion
f 1 : I 0 ! I di¤erenzierbar in y und es gilt
1 0
f
(y) =
1
f 0 (x)
=
1
f 0 (f 1 (y))
Beweis. Wir beweisen die Di¤ernzierbarkeit von f
leitung bloss anhand der Kettenregel: Wegen
f
1
1
:
nicht, sondern berechnen die Ab-
(f (x)) = x
folgt
h
f
i
(f (x)) f 0 (x) = 1;
i
h
0
f 1 (y) f 0 (x) = 1:
1 0
Da wir f 0 (x) 6= 0 voraussetzen, folgt die Behauptung.
Mit diesem Resultat können wir die Ableitung der Exponentialfunktion auf die Ableitung des Logarithmus zurückführen, die wir schon kennen. Die Logarithmusfunktion
f (x) = log x bildet ]0; 1[ bijektiv auf R ab und die Ableitung ist überall 6= 0: Nach dem
obigen Satz folgt:
62
Satz 6.12
dey
= ey :
dy
Beweis. ey = f
1 (y) ;
also
dey
1
= 0 y = ey ;
dy
f (e )
wegen f 0 (x) = 1=x:
Mit Hilfe dieser Resultate können wir unser Beispielreservoir enorm erweitern. Zunächst können wir auch auch eax für a 2 R ableiten. Wir schreiben f (x) := ax, was die
Ableitung f 0 (x) = a hat, und erhalten mit der Kettenregel
d ax
d f (x)
e =
e
= ef (x) f 0 (x) = aeax :
dx
dx
Wir können auch die Gausssche Glockenfunktion x ! e
2x ergibt sich aus der Kettenregel
d
e
dx
x2
=e
x2
( 2x) =
2xe
x2
x2
(6.2)
ableiten. Wegen
d
dx
x2 =
:
Als Anwendung dieser neuen Ableitungsformeln können wir nun auch f (x) = xa für
ein beliebiges a 2 R herleiten. Diese Funktion ist jedoch im allgemeinen nur auf der
positiven reellen Achse ]0; 1[ de…niert. Wir schreiben sie als
xa = ea log x
und erhalten mit der Kettenregel
dxa
dx
= ea log x a
= axa
1
d log x
1
= ea log x a
dx
x
(6.3)
:
Unten sind die Funktion x ! x2=3 und ihre Ableitung
zeichnet.
63
2
1=3
3x
(gestrichelt) einge-
3
2
1
0
0
1
2
3
4
5
x
Nun zu den trigonometrischen Funktionen, zunächst sin (x) : Zunächst eine etwas
gewagt Herleitung unter Verwendung der Eulerschen Formel
eix = cos (x) + i sin (x) ;
die wir noch nicht bewiesen haben. Wegen
e
ix
= cos ( x) + i sin ( x) = cos (x)
i sin (x)
folgt
sin (x) =
cos (x) =
1 ix
e
e ix ;
2i
1 ix
e + e ix
2
Verwenden wir nun frecherweise die Formel (6.2) auch für a = i; so erhalten wir
d sin (x)
dx
=
=
1
ieix ( i) e ix
2i
1 ix
e + e ix = cos (x) ;
2
und analog
d cos (x)
= sin (x) :
dx
Da wir diese Ableitungsformeln später bei der Herleitung der Eulerschen Formeln
verwenden werden, sollten wir ein anderes Argument angeben. Dazu verwenden wir das
Additionstheorem für den Sinus und Kosinus (2.2), woraus sich
sin (x + h)
sin (x) = 2 cos x +
64
h
2
sin
h
2
ergibt. Somit ergibt sich für den Di¤erenzenquotienten:
sin (x + h)
h
sin (x)
= cos x +
h
2
sin h2
:
(h=2)
Der erste Faktor auf der rechten Seite konvergiert für h ! 0 gegen cos (x) (wegen der
Stetigkeit der Kosinusfunktion) und der zweite nach Lemma 5.22 gegen 1: Somit folgt
d sin x
= cos x:
dx
Analog weist man
d cos x
=
dx
sin x
nach.
Für die Ableitung des Tangens verwenden wir tan (x) = sin (x) = cos (x) und die Quotientenregel. Mit dieser können wir den Tangens in Punkten x 2 R; die keine Nullstellen
der Kosinusfunktion sind, berechnen, also für x 6=
=2; 3 =2; : : : . Dann ist
d tan (x)
dx
=
d
dx
sin x
cos x
=
sin0 (x) cos x sin x cos0 (x)
cos2 x + sin2 x
=
cos2 x
cos2 x
= 1 + tan2 x:
Wir kommen nun noch zu den Ableitungen der Umkehrfunktionen der trigonometrischen Funktionen. Dazu verwenden wir Satz 6.11: Die Sinusfunktion ist eine bijektive
Abbildung des Intervalls ] =2; =2[ auf das Intervall ] 1; 1[. Ferner ist die Ableitung
der Sinusfunktion, nämlich die Kosinusfunktion, 6= 0 auf ] =2; =2[. Wir können somit
Satz 6.11 anwenden und erhalten für die Umkehrfunktion des Sinus:
d arcsin (x)
dx
=
=
1
1
=
=p
sin0 (arcsin x)
cos (arcsin x)
1
1
p
; x 2 ] 1; 1[ :
1 x2
1
2
sin (arcsin x)
Zur Veranschaulichung wieder die Graphen der Funktion und ihre Ableitung:
65
3.0
2.5
2.0
1.5
1.0
0.5
-1.0
-0.8
-0.6
-0.4
-0.2
0.2
0.4
0.6
0.8
1.0
x
-0.5
-1.0
-1.5
Die Funktion arcsin (x) und die Ableitung (gestrichelt)
Bemerkung 6.13
Die Sinusfunktion bildet das abgeschlossene Intervall [ =2; =2] auf das abgeschlossene
Intervall [ 1; 1] ab. Die Ableitung der Sinsusfunktion ist jedoch = 0 in den Randpunkten
=2 und
=2; die auf 1 bzw. 1 abgebildet werden. Deshalb können wir Satz 6.11 nicht
auf die Ableitung des Arkussinus in den Randpunkten anwenden. Tatsächlich ist dort
die Tangentensteigung 1:
Anlog für den Arkuskosinus:
d arccos (x)
=
dx
p
1
1
x2
:
Wir machen das noch für den Arkustangens: Der Tangens bildet das Intervall
2; 2
bijektiv auf R ab. Die Umkehrfunktion davon ist der übliche Arkustangens, der R bijektiv
auf
2 ; 2 abbildet. Hier erhalten wir für alle x 2 R
d arctan (x)
1
1
1
=
=
=
:
dx
tan0 (arctan (x))
1 + x2
1 + tan2 (arctan (x))
Dies gilt für alle x 2 R:
Als Zusammenfassung eine Tabelle der Ableitungen der wichtigsten Funktionen:
66
Funktion
xa ; a 2 R
ex
log x
sin x
cos x
tan x
arcsin x
arccos x
arctan x
Ableitung
axa 1 ; x 2 R falls a 2 N0 ; x 6= 0 falls a < 0; 2 Z; x > 0 sonst.
ex
1=x; x > 0
cos x
sin x
1 + tan2 x; x 6= 2 ; 32 ; : : :
p 1
; x 2 ] 1; 1[
1 x2
p 1
; x 2 ] 1; 1[
1 x2
1
; x 2 R:
1+x2
Wir schliessen den Abschnitt mit einem wichtigen, anschaulich evidenten Resultat:
Satz 6.14
f : [a; b] ! R sei eine stetige Funktion, die auf ]a; b[ stetig di¤erenzierbar sei. Dann
existiert in ]a; b[ ein Punkt mit
f0 ( ) =
f (b)
b
f (a)
;
a
d.h.
f (b) = f (a) + (b
a) f 0 ( ) :
Wir beweisen das hier nicht, sondern veranschaulichen es bloss an einer Zeichnung:
p
Die Funktion, die unten eingezeichnet ist, ist f (x) = sin x im Intervall [1; 3] : Hier
gibt es genau einen Punkt 2 ]1; 3[ ; (numerisch berechnet als = 1:876993) sodass
f (3) = f (1) + 2f 0 ( ) ist. In der Graphik eingezeichnet sind neben dem Graphen von f
die Tangente in ( ; f ( )) und die parallel verschobene Tangente (gestrichelt), die durch
den Punkt (1; f (1)) geht.
1.1
1.0
0.9
0.8
1.0
1.2
1.4
1.6
1.8
2.0
67
2.2
2.4
2.6
2.8
3.0
x
Es ist natürlich keinesfalls immer so, dass wie im obigen Beispiel der Punkt
6.14 eindeutig bestimmt ist.
Eine einfache Folgerung aus dem Satz ist der folgende:
im Satz
Satz 6.15
Sei f : [a; b] ! R sei eine stetige Funktion, die stetig di¤erenzierbar in ]a; b[ ist mit
f 0 (x) > 0 für alle x 2 ]a; b[ : Dann ist f monoton ansteigend in [a; b] ; d.h. für a x <
y b gilt f (x) < f (y) : Analog, wenn f 0 überall negativ ist, so ist die Funktion monoton
fallend.
Beweis. Wir wenden Satz 6.14 auf das Intervall [x; y] an. Es gibt somit einen Punkt
2 ]x; y[ mit f (y) = f (x) + f 0 ( ) (y x) : Wegen f 0 ( ) > 0 folgt, dass der zweite
Summand positiv ist. Somit gilt f (y) > f (x) :
6.2
Höhere Ableitungen
Ist f : I ! R stetig di¤erenzierbar, so ist die Ableitung f 0 : I ! R selbst wieder
eine stetige Funktion. Wir können daher versuchen, die Funktion f 0 selbst wieder zu
di¤erenzieren.
De…nition 6.16
Eine stetige Funktion f : I ! R heisst zweimal di¤erenzierbar auf I; wenn die Ableitung
f 0 : I ! R di¤erenzierbar auf I ist. Die Ableitung von f 0 heisst die zweite Ableitung
f 00 von f: Ist f 00 stetig, so sagt man, f sei zweimal stetig di¤erenzierbar.
Man kann in dieser Weise weiterfahren: Ist f 00 wieder di¤erenzierbar, so heisst f
dreimal di¤erenzierbar, und man bezeichnet die Ableitung von f 00 mit f 000 : Ist f 000 stetig,
so heisst f dreimal stetig di¤erenzierbar. In dieser Weise kann man weiterfahren: Die
n-te Ableitung ist die Ableitung der (n 1)-ten Ableitung.
Notation 6.17
Für die zweite Ableitung an der Stelle x schreibt man f 00 (x) oder
d2 f (x)
:
dx2
Ab der dritten oder vierten Ableitung schreibt man in der der Regel f (3) (x) oder f (4) (x)
anstelle von f 000 (x) bzw. f 0000 (x) ; und für die n-te Ableitung f (n) (x) : Als Di¤erentialquotienten schreibt man es auch16 als
dn f (x)
:
dxn
16
Die Notationen, die im Wesentlichen auf Leibniz zurückgehen, sind formal nicht ganz koscher. Die
Ableitungen sind Funktionen. Wenn man x dazu schreibt, so heisst das nach heutigen Masstäben, dass
(x)
man sie an der Stelle x auswertet. Noch zu Beginn des 20. Jh. haben aber alle Mathematiker f (x) ; dfdx
etc. geschrieben und gingen davon aus, dass der Leser klug genug sei, aus dem Kontext zu erkennen, ob
die Funktion gemeint ist, oder der Wert der Funktion bzw. der Ableitungen an der Stelle x: Erst in den
zweiten Hälfte des 20. Jh. wurde man in dieser Hinsicht pädantischer. Wir wollen das hier jedoch nicht
übertreiben.
68
Bemerkung 6.18
In der Physik schreibt man für Ableitungen einer Funktion f der Zeit t üblicherweise
f_ für die erste Ableitung und f• für die zweite Ableitung. Diese Schreibweise geht auf
Newton zurück.
Existieren alle Ableitungen und sind sie stetig, so heisst f unendlich oft stetig di¤erenzierbar.
Beispiel 6.19
1. f (x) = ex : Da die erste Ableitung wieder ex ist, so ist klar, dass alle Ableitungen
existieren und
dn ex
= ex
dxn
gilt.
2. Etwas komplizierter ist f (x) = sin x: Die erste Ableitung ist f 0 (x) = cos x: Dessen
Ableitung ist f 00 (x) = sin x: Leitet man nochmals ab, so erhält man für die
dritte Ableitung cos x: Bei der vierten wechselt das Vorzeichen und man erhält
die Ausgangsfunktion zurück: f (4) (x) = sin x: Fährt man in dieser Weise weiter, so
beginnt der Zyklus nun wieder neu. Wir sehen also, dass f (n) (x) = sin x ist, sofern
n durch 4 teilbar ist, d.h. wenn n von der Form 4m ist mit m 2 N: Wenn n bei der
Division durch 4 Rest 1 hat, so ist f (n) (x) = cos x; bei Rest 2; f (n) (x) = sin x;
und bei Rest 3; f (n) (x) = cos x:
3. Noch etwas komplizierter ist f (x) = log x; was für x > 0 de…niert ist, und dort
stetig di¤erenzierbar ist. Die erste Ableitung ist
d log x
1
= :
dx
x
Leitet man weiter ab, so erhält man
d x1
d2 log x
=
=
dxn
dx
1
d
d3 log x
x2
=
dx3
dx
1
;
x2
=
2
;
x3
d x23
d4 log x
6
=
=
:
4
dx
dx
x4
Man sollte nun sehen, wie es weitergeht: Bei jeder zusätzlichen Ableitung wechselt
das Vorzeichen, man erhöht den Exponenten im Nenner, und man multipliziert
noch mit dem Exponenten, den man vor der Ableitung hat. Die allgemeine Formel
ist somit
dn log x
(n 1)!
= ( 1)n 1
:
n
dx
xn
69
4. Polynome sind wieder ziemlich einfach: Zunächst hat eine konstante Funktion die
Ableitung 0: Leitet man weiter ab, so erhält man stets 0: Die nächst komplizierteren
Polynome, sind die vom Grad 1 : p (x) = ax + b: Leitet man einmal ab, so erhält
man p0 (x) = a und die zweite Ableitung ist 0: D.h. alle Ableitungen nach der
ersten sind 0: Quadratische Polynome: p (x) = ax2 + bx + c: Einmal ableiten gibt
p0 (x) = 2ax + b; zweimal: p00 (x) = 2a: Ab der dritten Ableitung sind sie gleich 0:
Es sollte klar sein, wie das weiter geht: Für ein Polynom vom Grad n vermindert
sich bei jeder Ableitung der Grad um 1: Die Ableitungen ab der (n + 1)-ten sind
gleich 0:
Beispiel 6.20
Die vorangegangen Beispiele sind insofern etwas irreführend, als „typischerweise“ die
Ableitungen immer komplizierter werden. Wir betrachten die Gausssche Glockenfunktion
x2
f (x) = e
:
Einmal ableiten ergibt, wie schon gesehen
f 0 (x) =
2xe
x2
:
Leitet man nochmals ab, so erhält man nach der Produktregel
00
f (x) =
=
dx
dx
2
x2
2e
e
de x
2x
dx
x2
2x ( 2x) e
x2
2
2 + 4x2 e
=
x2
:
Leitet man nochmals ab, so verwendet man wieder die Produktformel. Der erste Faktor
2
ist das Polynom 2 + 4x2 und der zweite Faktor die Ausgangsfunktion e x : Anwendung
der Produktregel ergibt:
f 000 (x) = 8xe
=
12x
x2
+
2 + 4x2 ( 2x) e
8x3 e
x2
x2
:
Man kann nun leicht erraten, wie das im allgemeinen aussieht: Die n-te Ableitung ist ein
2
Polynom n-ten Grades, nennen wir es Hn (x) ; multipliziert mit e x :
f (n) (x) = Hn (x) e
x2
:
Die Polynome Hn (x) sind nicht ganz einfach explizit zu berechnen (für allgemeines n),
wir können jedoch leicht eine Formel angeben, wie man Hn+1 (x) aus Hn (x) gewinnt:
2
f (n+1) (x) =
=
=
dHn (x) x2
de x
e
+ Hn (x)
dx
dx
dHn (x) x2
2
e
+ Hn (x) ( 2x) e x
dx
dHn (x)
2
+ Hn (x) ( 2x) e x :
dx
70
Somit ist
Hn+1 (x) =
dHn (x)
dx
2xHn (x) :
n (x)
ein Polynom vom Grad n 1; und
Ist Hn (x) ein Polynom n-ten Grades, so ist dHdx
2xHn (x) ist ein Polynom vom Grad n + 1: Somit ist Hn+1 (x) ein Polynom vom Grad
n + 1:
Die Polynome Hn (x) nennt man die Hermit-Polynome. Sie spielen in den Naturwissenschaften eine wichtige Rolle, was von der herausragenden Bedeutung der Gaussschen
Glockenkurve in der Physik herrührt.
6.3
Die Regel von Bernoulli-l’Hospital
Seien f und g zwei Funktionen I ! R: Die Funktion f =g ist in allen Punkten x 2 I
de…niert, für die g (x) 6= 0 ist. Manchmal kann man den Quotienten jedoch auch für
Nullstellen von g de…nieren, wenn gleichzeitig f dort ebenfalls 0 ist. Sei also x0 2 I mit
f (x0 ) = g (x0 ) = 0; jedoch g (x) 6= 0 für x 6= x0 (zumindest in einer kleinen Umgebung
von x0 ). Man wird versuchen,
f
f (x)
(x0 ) = lim
x!x0 g (x)
g
zu de…nieren, sofern der Limes existiert.
Satz 6.21 (Regel von Bernoulli-l’Hôpital)
Sind f; g stetig di¤erenzierbar auf I mit f (x0 ) = g (x0 ) = 0; g (x) 6= 0 für x 6= x0 ; und
gilt g 0 (x0 ) 6= 0; so gilt17
f (x)
f 0 (x0 )
lim
= 0
:
x!x0 g (x)
g (x0 )
Beweis. Wegen f (x0 ) = 0 folgt aus dem Zwischenwertsatz 6.14, dass für x 6= x0 und
eine Zwischenstelle zwischen x0 und x die Gleichung
f (x) = f (x)
x0 ) f 0 ( )
f (x0 ) = (x
gilt. Analog für g :
g (x) = (x
x0 ) g 0
0
:
Die beiden Punkte ; 0 müssen nicht dieselben sein, was uns jedoch nicht weiter stören
wird. Jedenfalls erhält man für x 6= x0
f (x)
(x
=
g (x)
(x
x0 ) f 0 ( )
f0 ( )
=
:
x0 ) g 0 0
g0 0
17
Die Regel wurde von de l’Hôspital, einem französischen Marquis, erstmals publiziert, der wegen
seiner Kurzsichtigkeit den Militärdienst quittierte und sich der Mathematik zuwandte. Sein voller Name
ist: Guillaume-François-Antoine Marquis de l’Hôpital, Marquis de Sainte-Mesme, Comte d’Entremont
and Seigneur d’Ouques-la-Chaise. De l’Hôpital war ein Schüler Johann Bernoullis. Man weiss heute,
dass das Resultat von Bernoulli gefunden wurde, dieser es jedoch für Geld de l’Hôpital zur Publikation
überliess, der es 1696 verö¤entlichte. Nach de l’Hôpitals frühem Tod 1704 erhob Bernoulli Anspruch auf
die Prioriät, verschwieg jedoch das pekuniäre Arrangement.
71
Für x ! x0 streben auch ; 0 nach x0 und wegen der Stetigkeit der Ableitung konvergieren Zähler und Nenner der rechten Seite gegen f 0 (x0 ) bzw. g 0 (x0 ) : Somit folgt
lim
x!x0
f (x)
f 0 (x0 )
= 0
:
g (x)
g (x0 )
Beispiel 6.22
Der Grenzwert
sin x
x
kann mit der Regel von l’Hôpital berechnet werden, wobei man allerdings beachten sollte,
dass dieser Limes zur Berechnung der Ableitung des Sinus verwendet wurde, sodass es
sich streng genommen um ein zirkuläres Argument handelt:
lim
x!0
sin x
= lim
x!0 x
x!0
lim
d sin x
dx
dx
dx
cos x
= 1:
x!0 1
= lim
Eine Modi…kation der Regel kann auch für die Auswertung von Ausdrücken der Form
verwendet werden. Gelten limx!x0 f (x) = 118 und limx!x0 g (x) = 1; so schreiben
wir den Quotienten als
1=g (x)
f (x)
=
g (x)
1=f (x)
1
1
und wenden l’Hôpital auf 1=f (x) und 1=g (x) an
(1=g)0 (x)
f 2 (x) g 0 (x)
g 0 (x) =g 2 (x)
=
=
f 0 (x) =f 2 (x)
g 2 (x) f 0 (x)
(1=f )0 (x)
Nimmt man an, dass q := limx!x0 f (x) =g (x) existiert, so ergibt sich
q = lim
x!x0
f (x)
f 2 (x) g 0 (x)
g 0 (x)
2
= lim 2
=
q
lim
;
x!x0 f 0 (x)
g (x) x!x0 g (x) f 0 (x)
und somit
q = lim
x!x0
f (x)
f 0 (x)
= lim 0
g (x) x!x0 g (x)
sofern die Grenzwert auf der rechten Seite existiert.
Beispiel 6.23
Was ist limx!0 x log x? Das ist ein Ausdruck der Form 0 ( 1) ; aber wir können ihn
als
log x
(1=x)
18
Hier noch eine formale De…nition von limx!x0 f (x) = 1; wenn x0 ein Häufungspunkt des De…nitionsbereichs D ist: Dies bedeutet dass für jede („noch so grosse“) reelle Zahl M ein " > 0 existiert mit
f (x) M für alle x 2 D \ [x0 "; x0 + "] : Analog ist limx!x0 f (x) = 1 de…niert. In diesem Sinn gilt
limx!0 log x = 1:
72
schreiben, sodass wir einen Ausdruck vom Typus 1
1 erhalten haben. Wenden wir nun
l’Hôpital an, so erhalten als Quotienten der Ableitungen
d log x
dx
d(1=x)
dx
=
1=x
=
1=x2
x:
Der Limes davon für x ! 0 ist 0: Somit gilt
lim x log x = 0
x!0
Falls notwendig, kann man die Regel auch mehrmals anwenden. Wir illustrieren das
bloss an einem Beispiel.
Beispiel 6.24
Wir untersuchen
x tan x
1 cos x
für x ! 0: Sowohl Zähler wie Nenner ergeben 0 im Limes. Eimaliges Ableiten von Zähler
und Nenner ergibt
tan x + x 1 + tan2 x
;
sin x
was immer noch 0=0 ergibt. Wir können deshalbe l’Hôpital auf diesen Quotienten anwenden. Der Quotient der Ableitungen ergibt
2 1 + tan2 x + 2x tan x 1 + tan2
:
cos x
Nun x = 0 eingesetzt ergibt 2: Also
x tan x
= 2:
x!0 1
cos x
lim
6.4
Geometrische Anwendungen
Wie schon oben erwähnt, zeigt das Vorzeichen der Ableitung einer Funktion an, wo die
Funktion steigt und wo sie fällt. Hier noch ein Beispiel graphisch dargestellt. Schwarz
durchgezogen ist die Funktion und rot gestrichelt die Ableitung.
73
y
3
2
1
-3
-2
-1
1
2
3
x
-1
-2
-3
Man sieht, dass die Funktion ansteigt in Bereichen, wo die Ableitung positiv ist, und
abfällt, wo die Ableitung negativ ist. Dies impliziert o¤ensichtlich, dass an Extremalstellen der Funktion die Ableitung gleich 0 ist. Wir präzisieren die Begri¤e:
Sei f : D ! R eine Funktion, wobei D eine (im Moment beliebige) Teilmenge von R
ist.
De…nition 6.25
Sei x0 2 D:
a) Die Funktion f nimmt in x0 ihr Maximum an, wenn f (x0 ) f (x) für alle x 2 D
gilt. f nimmt in x0 ihr Minimum an, wenn f (x0 ) f (x) für alle x 2 D gilt.
b) f hat ein lokales Maximum in x0 ; falls ein " > 0 existiert, sodass f (x0 ) f (x)
für alle x 2 D \ [x0 "; x0 + "] gilt. Analog wird ein lokales Minimum de…niert.
Manchmal spricht man bei einem Maxiumum auch von einem globalen Maximum
um zu betonen, dass es sich nicht bloss um ein lokales Maximum handelt. Wenn man
nicht spezi…ziert, ob es sich um ein Minimum oder Maximum handelt spricht man von
einem Extremum.
74
Beispiel 6.26
Sei f (x) = x3 x: Hier der Graph
y
10
8
6
4
2
-3
-2
-1
1
-2
2
3
x
-4
-6
-8
-10
Die Funktion hat kein globales
Es gibt jedoch ein
p Maximum und kein globales Minimum.
p
lokales Maximum (bei 1= 3) und ein lokales Minimum (bei 1= 3). Schränkt man die
Funktion auf das Intervall [ 2; 2] ein, so hat sie ein Minimum bei 2 und ein Maximum
bei 2:
An dem Beispiel sieht man, dass eine Funktion keine globalen Extrema besitzen muss.
Es gilt jedoch:
Satz 6.27
Sei f : [a; b] ! R eine stetige Funktion, wobei 1 < a < b < 1 ist. Dann hat die
Funktion ein globales Maximum und ein globales Minimun, d.h. es existieren Punkte
x0 ; y0 2 [a; b] mit f (x0 ) f (x) f (y0 ) für alle x 2 [a; b] :
Lokale Extrema kann man über die Ableitung …nden, sofern die Funktion stetig
di¤erenzierbar ist, und die Extremalstellen nicht am Rand des De…nitionsbereichs sind.
Wir setzen nachfolgend voraus, dass f auf einem Intervall I de…niert ist, wobei I = R
zugelassen ist. Der folgende Satz ist anschaulich evident:
Satz 6.28
Sei die Funktion f : I ! R stetig auf I, und stetig di¤erenzierbar auf dem Inneren
von I. Ist ein innerer Punkt x0 ein lokales Maxiumum oder ein lokales Minium, so gilt
f 0 (x0 ) = 0:
Beweis. Wir verzichten auf einen detaillierten Beweis. Die Aussage folgt aus dem Zwischenwertsatz 6.14.
75
De…nition 6.29
Ist f eine Funktion wie oben, so heisst ein innerer Punkt x0 kritischer Punkt von f;
falls f 0 (x0 ) = 0 gilt.
Lokale Extrema in inneren Punkten sind stets kritische Punkte, jedoch sind nicht
alle kritischen Punkte lokale Extrema.
Ob ein kritischer Punkt ein lokales Extrema ist lässt sich „meist“ an der zweiten
Ableitung in diesem Punkt entscheiden, ebenso wie die Frage, ob es sich gegebenenfalls
um ein Maximum oder ein Minimum handelt.
Satz 6.30
Sei f zweimal di¤erenzierbar im Inneren des De…nitionsbereichs. Ist x0 ein (innerer)
kritischer Punkt so gilt:
a) Ist f 00 (x0 ) > 0; so hat f in x0 ein lokales Minimum.
b) Ist f 00 (x0 ) < 0; so hat f in x0 ein lokales Minimum.
Wir beweisen das ebenfalls nicht. Die Sache ist jedoch plausibel. Ist f 00 (x0 ) > 0 aber
= 0; so ist die Ableitung links von x0 negativ und rechts von x0 positiv. Die
Funktion selbst fällt also links von x0 und steigt rechts von x0 an. Die Funktion hat
somit ein lokales Minimum in x0 : Analog argumentiert man im Fall b).
Hier ein Beispiel:
f 0 (x0 )
Beispiel 6.31
Wir betrachten die Funktion sin x + x=2 auf dem Intevall [0; 2 ] : Wir bestimmen erst
alle kritischen Punkte. Dies sind die Lösungen von cos x + 1=2 = 0: Der Kosinus ist 1=2
bei =2 + =6 = 2 =3 und bei 4 =3: Dies sind also die kritischen Punkte im Innern
des Intervalls. Die zweite Ableitung ist sin x; was negativ bei 2 =3 und positiv bei
4 =3 ist. Bei 2 =3 hat die Funktion also ein lokales Maximum und bei 4 =3 ein lokales
Minimum. Da es keine anderen kritischen Punkte gibt, so sind dies die einzigen lokalen
Extrema in ]0; 2 [ : Die Funktionswerte in diesen Punkten sind:
p
2
3
sin
+
=
+
1:913222
3
3
2p 3
4
2
3 2
sin
+
=
+
1:228369:
3
3
2
3
An den Randpunkten 0; 2 sind die Funktionswerte 0 und : Da grösser ist als das
lokale Maximum, so ist das globale Maximum im Randpunkt 2 . Analog sieht man, dass
das Minimum bei 0 ist.
Hier ist der Graph der Funktion:
76
3
2
1
0
1
2
3
4
5
6
x
-1
Kritische Punkte brauchen keine lokalen Extrema zu sein. Hier das Standardbeispiel:
Beispiel 6.32
f (x) = x3 : Die Ableitung ist 3x2 : f hat also den einen kritischen Punkt 0; der jedoch
kein lokales Extrema ist. In der Tat ist auch die zweite Ableitung 6x im Nullpunkt gleich
0; sodass Satz 6.30 nichts hergibt.
Hier das Schema nach dem man für eine stetig di¤erenzierbare Funktion f , die auf
einem Intervall I de…niert ist, die Extrema sucht.
Man bestimmt alle kritischen Punkte im Inneren des Intevalls.
Anhand der zweiten Ableitung eruiert man, ob es sich um lokale Maxima oder
Minima handelt.19
Hat der De…nitionsbereich Randpunkte, so wertet man die Funktion an diesen
Punkten aus. In der Regel sind Randpunkte lokale Extrema. (Dies ist jedoch nicht
immer richtig. Z.B. hat die in Beispiel 5.20 b) diskutierte Funktion x sin (1=x) ; die
auf dem Intervall [0; 1[ stetig ist, sofern man den Funktionswert im Nullpunkt
gleich 0 setzt, und im Inneren di¤erenzierbar ist, in 0 kein lokales Extremum).
Man vergleicht dann die lokalen Maxima um das globale Maximum zu bestimmen,
falls es exisitiert. Man muss sich jedoch klar darüber sein, dass globale Extrema
nicht immer existieren, selbst wenn es lokale Extrema gibt. Das Beispiel 6.26 z.B.
hat ein lokales Maximum und ein lokales Minimum, jedoch keine globalen Extrema.
19
Ist die zweite Ableitung in einem kritischen Punkt ebenfalls gleich 0; so hat man Pech gehabt und
kann zunächst nicht entscheiden, ob es sich um ein lokales Maximum oder lokales Minimum handelt,
oder um gar keinen lokalen Extremalpunkt wie im obigen Beispiel. Unter Umständen kann dies anhand
von höheren Ableitungen entschieden werden. Wir gehen hier auf diese Schikanen nicht weiter ein.
77
Schränkt man diese Funktion
p auf das Intervall [ 2; 2] ein, so hat sie zwei lokale
p
Maxima, nämlich bei 1= 3 und bei 2; und zwei lokale Minima, nämlich bei 1= 3
und bei 2: Die lokalen Extrema in den Randpunkten sind globale.
Die zweite Ableitung hat ebenfalls eine einfache geometrische Interpretation, die wir
oben schon ausgenützt haben. Ist die zweite Ableitung f 00 einer Funktion f positiv,
so bedeutet dies ja, dass die erste Ableitung, welche die Steigung der Tangente angibt,
ansteigt. Dies bedeutet also, dass die Funktion nach rechts steiler wird. Unten ein Beispiel
graphisch dargestellt mit rot gestrichelt die zweite Ableitung.
2
1
-0.5
-0.4
-0.3
-0.2
-0.1
0.1
0.2
0.3
0.4
0.5
x
-1
Gibt f die zurückgelegte Strecke als Funktion der Zeit an, so liegt eine Beschleunigung
vor. Für den Graphen der Funktion bedeutet es, dass dieser eine „Linkskurve“ beschreibt.
Analog: Wenn die zweite Ableitung negativ ist, so fällt die Steigung ab, was für den
Graphen bedeutet, dass er eine „Rechtskurve“ beschreibt.20
Interessant sind die speziellen Punkte (x0 ; f (x0 )) auf dem Graphen, wo der Graph
von einer Rechts- in eine Linkskurve übergeht, oder umgekehrt. Man nennt solche Punkte
Wendepunkte. In Wendepunkten wechselt die zweite Ableitung das Vorzeichen. Ist
die zweite Ableitung stetig, was wir hier stets voraussetzen wollen, so muss die zweite
Ableitung in Wendepunkten gleich 0 sein.
Hier noch eine andere Interpretation eines Wendepunktes. Wir betrachten dazu die
Tangente im Punkt (x0 ; f (x0 )) ; welche wie schon beschrieben, als Graph der Funktion
tx0 (x) = f (x0 ) + (x
x0 ) f 0 (x0 )
beschrieben wird. In einem Wendepunkt liegt der Funktionswert f (x) für x in einer
genügend kleinen Umgebung von x0 links von x0 oberhalb der Tangente und rechts
20
Man nennt Funktionen, die auf einem Intervall de…niert sind, und deren zweite Ableitung überall
positiv ist, konvex. Wenn die zweite Ableitung negativ ist, so nennt man sie konkav.
78
unterhalb, oder umgekehrt. Wir fassen diese Betrachtungen in einer formalen De…nition
zusammen.
De…nition 6.33
f sei auf dem Intervall I de…niert und im Inneren stetig di¤erenzierbar. Ein innerer
Punkt x0 ist ein Wendepunkt der Funktion, falls ein " > 0 existiert mit
(f (x)
tx0 (x)) (f (y)
tx0 (y)) < 0
für alle x 2 ]x0 "; x0 [ und alle y 2 ]x0 ; x0 + "[ ; d.h. wenn f (x)
tx0 (y) unterschiedliche Vorzeichen haben für diese x; y:
tx0 (x) und f (y)
Satz 6.34
Sei f : I ! R zweimal stetig di¤erenzierbar im Inneren von I und sei x0 ein innerer
Punkt von I: Dann gelten die folgenden Aussagen:
a) Ist x0 ein Wendepunkt, so gilt f 00 (x0 ) = 0:
b) Ist f 00 (x0 ) = 0 und f 000 (x0 ) 6= 0; so ist x0 ein Wendepunkt.
Hier ein Bild für die Funktion f (x) = x3 3x2 + x 1: Die Funktion hat einen
Wendepunkt bei x = 1: Rot gestrichelt ist die Tangente in x = 1 eingezeichnet.
y
5
4
3
2
1
-1.0
-0.5
0.5
1.0
-1
1.5
2.0
2.5
3.0
x
-2
-3
-4
-5
Die zweite Ableitung ist 6x 6 und die dritte ist 6: Die Funktion hat somit genau
einen Wendepunkt bei 1:
Man muss sich klar darüber sein, dass f 00 (x0 ) nicht notwendigerweise impliziert, dass
x0 ein Wendepunkt ist. Hier das Beispiel der Funktion f (x) = x4 :
79
80
70
60
50
40
30
20
10
-3
-2
-1
0
1
2
3
x
Die zweite Ableitung ist 12x2 ; ist also 0 im Nullpunkt. Trotzdem hat die Funktion
keinen Wendepunkt. Die dritte Ableitung ist 24x; ist also ebenfalls gleich 0 im Nullpunkt,
sodass wir b) im obigen Satz nicht anwenden können. In der Tat hat die Funktion ein
Minimum in 0:21
21
In Fällen, wo man Satz 6.30 und Satz 6.34 b) nicht anwenden kann, kann man durch die Analyse
höherer Ableitungen in der Regel entscheiden, ob Extremalpunkte bzw. Wendepunkte vorliegen. Wir
gehen jedoch nicht weiter darauf ein.
80
7
Integration
Die Integration dient zur Berechnung von Flächen, die durch Kurven berandet sind.
Später diskutieren wir auch Volumen von Körpern.
7.1
Das bestimmte Integral und die Stammfunktion
Seien 1 < a < b < 1 und f eine Funktion [a; b] ! R, wobei wir (im Moment)
voraussetzen, dass f (x)
0 für alle x 2 [a; b] gilt. (Wir werden diese Voraussetzung
gleich aufgeben).
Das bestimmte Integral
Z b
f (x) dx
a
ist de…niert als die Fläche zwischen der x-Achse und dem Graphen der Funktion f über
dem Intervall [a; b] :
R3
p
Als Beispiel ist hier die Funktion f (x) := sin x + x eingezeichnet. 1 f (x) dx ist
die Fläche des rotumrandeten Gebietes.
2.0
1.5
1.0
0.5
0.0
0
1
2
3
4
5
x
Mathematisch wird das Integral als Grenzwert von zusammengesetzten Rechtecks‡ächen de…niert. Dazu teilt man das Intervall [a; b] in 2n Teilintervalle auf: Ist l = b a
die Länge des Intevalls, so betrachtet man die Intervalle
I1 := a; a +
l
l
2l
; I2 = a + n ; a + n ; : : : ; I2n := b
n
2
2
2
l
;b ;
2n
welche alle die Länge l2 n haben. Im Intervall Ik betrachtet man den minimalen und
den maximalen Funktionswert
mk := inf f (x) ; Mk := sup f (x) :
x2Ik
x2Ik
81
O¤ensichtlich ist die Fläche des Rechtecks mit Grund‡äche Ik und Höhe mk kleiner oder
gleich der Fläche unterhalb des Graphen, die wiederum kleiner oder gleich der Fläche
des Rechtecks mit Grund‡äche Ik und Höhe Mk ist. Die Fläche dieser beiden Rechtecke
ist mk l2 n bzw. Mk l2 n :
Die Summe dieser Rechtecks‡ächen bezeichnet man als die Unter- bzw. Obersummen:
n
Un (f ) :=
2
X
mk l2
n
Mk l2
n
;
k=1
bzw.
n
On (f ) :=
2
X
:
k=1
p
Im Graphen unten ist wieder die Funktion f (x) = sin x + x dargestellt, mit der
Fläche für die Untersumme mit a = 1; b = 3; wie zuvor, und n = 4:
2.0
1.5
1.0
0.5
0.0
0
1
2
3
4
5
x
Die Untersumme ist die Summe der Flächen der rot eingezeichneten Rechtecke. Wenn
n um 1 erhöht wird, so halbiert sich einfach die Basis der Rechtecke und die Anzahl der
Rechtecke verdoppelt sich. Es ist daher evident, dass die Untersummen mit n ansteigen
und die Obersummen mit n fallen:
Un (f )
Un+1 (f )
On+1 (f )
On (f ) :
Wegen dieser Monotonieeigenschaft konvergiert sowohl die Folge der Untersummen, wie
die Folge der Obersummen:
U[a;b] (f ) := lim Un (f ) ; O[a;b] (f ) := lim On (f ) :
n!1
n!1
82
De…nition 7.1
Die Funktion f heisst Riemann-integrierbar auf dem Intervall [a; b] ; falls U[a;b] (f ) =
O[a;b] (f ) gilt. Der gemeinsame Limes ist das bestimmte Integral
Z b
f (x) dx;
a
das man auch Riemann-Integral nennt. a heisst die obere Integrationsgrenze, b die
untere. Die Variable x nennt man auch die Integrationsvariable.
Bemerkung 7.2
Aus dieser De…nition entnimmt man leicht, dass
Z a
f (x) dx = 0
a
ist. Das Gebiet, dessen Fläche man betrachtet, ist ja nur ein „Strich“, hat also die Fläche
0:
Für die De…nition des Riemann-Integrals spielt es keine Rolle, ob f auch negative
Werte annimmt. Man beachte jedoch, dass in Bereichen, wo f negativ ist, die Fläche
zwischen der x-Achse und dem Graphen negativ gezählt wird.
Eine weiter Konvention: In der De…nition wird zunächst vorausgesetzt, dass a < b
ist. Für a > b de…niert man
Z b
Z a
f (x) dx =
f (x) dx:
a
b
Ein Beispiel: Ohne irgendwelche Theorie sieht man aus der De…nition, dass
Z 2
sin x dx = 0
0
ist, denn die Fläche unter dem positiven Teil ist o¤ensichtlich gleich gross, wie die unter
dem negativen Teil.
Satz 7.3
Rb
Ist f stetig und [a; b] ein endliches Intervall, so existiert das Riemann-Integral a f (x) dx
Bemerkung 7.4
Die Funktion f muss nicht notwendigerweise stetig sein, damit das Integral existiert. Ein
Beispiel ist etwa die Funktion
f (x) :=
1 fu
•r x 0
:
0 fu
•r x < 0
Rb
Hier ist für a < b das Integral a f (x) dx natürlich einfach die Länge von [a; b] \ [0; 1[ :
Ganz allgemein: Wenn die Funktion f stetig ist bis auf endlich viele Sprungstellen (keine
Rb
Pole), so ist a f (x) dx de…niert. Hat f Pole im Intervall [a; b], so hängt es von den
genauen Eigenschaften der Pole ab, ob das Integral existiert. Wir diskutieren das später.
83
Die grundlegende Idee, Flächen, die durch gekrümmte Kurven begrenzt sind, durch
Ausschöpfen mit einfacheren geometrischen Objekten zu bestimmen, stammt von Archimedes (287-212 vuZ). Er hat sie verwendet, um die Fläche des Kreises und die Fläche
unter einer Parabel zu berechnen.
Die nächste wirklich grundlegende Idee zu dem Thema stammt von Isaac Newton
(1643-1727) und Gottfried Wilhelm Leibniz (1646-1716), die entdeckt haben, dass Integration gewissermassen die Umkehroperation zur Di¤erentiation ist.22
Die Idee war, das Integral als Funktion der oberen Grenze zu betrachten und nach
Eigenschaften dieser Funktion zu suchen.
Gegeben eine Funktion f; so de…nieren wir
Z x
f (y) dy:
F (x) =
a
Das wir x für die Variable in F verwenden, müssen wir die Integrationsvariable in f
umbenennen.
Wir gehen nachfolgend davon aus, dass f auf einem Intervall de…niert und stetig ist.
Dann ist F (x) für jedes x im De…nitionsbereich de…niert. F hängt natürlich auch noch
von a ab, was wir im Moment nicht weiter berücksichtigen.
Satz 7.5
Unter den obigen Voraussetzungen ist F stetig di¤erenzierbar in x und es gilt
dF (x)
= f (x) :
dx
Beweis. Der Einfachheit halber nehmen wir im Moment an, dass h > 0 gilt. Dann ist
F (x + h) F (x) die Fläche unter der Kurve f über dem Intervall [x; x + h] : Die Fläche
wird negativ gerechnet, wenn f negativ ist. Diese Fläche ist
h
sup
f (y)
y2[x;x+h]
und
h
inf
y2[x;x+h]
f (y) :
Mithin ist
F (x + h)
h
F (x)
supy2[x;x+h] f (y)
:
inf y2[x;x+h] f (y)
22
Über die Priorität der Entdeckung hat es erbitterte Gefechte gegeben. Erwiesen ist, dass Newton
die grundlegenden Fakten vor Leibniz gefunden hatte, diese jedoch zunächst nicht publizierte sondern
nur in Briefen kommunizierte. Leibniz verö¤entlichte seine Ergebnisse jedoch vor Newton. Soweit ist die
Sachlage klar. Ebenso klar ist, dass der Formalismus von Leibniz dem von Newton überlegen war, was für
die weitere Entwicklung der Theorie von grosser Bedeutung war. Kontrovers diskutiert wird jedoch nach
wie vor, ob Leibniz Kenntnis von den Entdeckungen Newtons hatte. Heute gilt es als ziemlich gesichert,
dass Leibniz wenigstens teilweise über die Ideen von Newton orientiert war. Die Kontroverse ist auch
durch eine Untersuchung der Royal Society angeheizt worden, die zum Schluss kam, dass Leibniz die
Ideen von Newton gestohlen hatte. Allerdings hatte Newton selbst an der Untersuchung mitgewirkt.
84
Da wir voraussetzen, dass f stetig ist, folgt
lim
sup
f (y) = f (x) ;
lim
inf
f (y) = f (x) :
h!0 y2[x;x+h]
h!0 y2[x;x+h]
Somit ergibt sich
lim
h#0
F (x + h)
h
F (x)
= f (x) :
Man überlegt sich leicht, dass diese Gleichung auch gilt, wenn h " 0 von der negativen
Seite her erfolgt.
Die Aufgabe, F zu bestimmen läuft also darauf hinaus, F so zu bestimmen, dass
F 0 (x) = f (x)
ist. Gleichungen für eine unbekannte Funktion, hier F; in die F 0 (oder auch die höheren
Ableitungen) eingehen, nennt man Di¤erentialgleichungen.
De…nition 7.6
Gegeben eine Funktion f; so heisst eine Funktion F; die die Gleichung F 0 = f erfüllte
eine Stammfunktion von f:
Wie wir
R x oben gesehen haben, …nden wir eine Stammfunktion von f indem wir das
Integral a f (y) dy als Funktion von x betrachten, wobei a beliebig ist.
Wieviele Stammfunktionen einer Funktion f kann es geben? Ist F eine Stammfunktion von f; so ist auch F + C eine Stammfunktion, wo C 2 R eine beliebige Konstante
ist. Dies ergibt sich einfach daraus, dass die Ableitung einer Konstanten gleich 0 ist
und mithin (F + C)0 = F 0 = f: Man fragt sich, ob es noch andere Möglichkeiten gibt,
Stammfunktionen von f zu erhalten. Die Antwort ist: Nein. Zumindest dann nicht, wenn
f auf einem Intervall de…niert ist:
Satz 7.7
Ist f auf einem Intervall I de…niert, so unterscheiden sich zwei Stammfunktionen von f
bloss durch eine Konstante.
Beweis. Die Behauptung ergibt sich aus dem Zwischenwertsatz: Sind F und F^ zwei
Stammfunktion von f; so erfüllt G := F F^ die Gleichung
G0 = F 0
F^ 0 = f
f = 0:
Für zwei Zahlen s; t 2 I mit s < t ergibt sich aus dem Zwischenwertsatz
G (t)
G (s) = (t
s) G0 ( )
mit einer Zahl 2 [s; t] ; die uns nicht weiter interessiert, da ohnehin einfach G0 ( ) = 0
gilt. Somit ist stets G (t) G (s) = 0; d.h. G (t) = G (s) : Die Funktion G nimmt also auf
allen Punkten des Intervalls den gleichen Wert an, ist also eine Konstante.
85
Wir diskutieren nun noch genau den Zusammenhang zwischen Stammfunktion und
bestimmtem Integral. Wir setzen voraus, dass f auf einem Intervall I de…niert ist.
Wir haben schon gesehen, dass für a 2 I die Funktion
Z x
f (y) dy
x 7!
a
eine Stammfunktion ist. Sei nun umgekehrt F eine beliebige Stammfunktion, so ist
Z x
F (x)
f (y) dy
a
die Di¤erenz zweier Stammfunktionen, ist also eine Konstante C :
Z x
f (y) dy = C:
F (x)
a
Um die Konstante zu bestimmen, setzen wir x = a ein und erhalten
Z a
f (y) dy = C:
F (a)
a
Da das Integral
Resultat gezeigt:
Ra
a
gleich 0 ist, ergibt sich C = F (a) : Wir haben somit das folgende
Satz 7.8
Ist F eine beliebige Stammfunktion von f; so gilt für a; b
Z
b
f (y) dy = F (b)
F (a) :
a
Notation 7.9
1. Statt F (b)
F (a) schreibt man auch oft
F (x)jbx=a ;
obwohl es eigentlich nicht einfacher ist.
R
2. Die „allgemeine“ Stammfunktion schreibt man in der Regel mit f (x) dx; d.h.
mit dem Integralzeichen ohne Angabe der Integrationsgrenzen. Man bezeichnet
das auch als das unbestimmte Integral. Man muss sich jedoch klar darüber
sein, dass eine Stammfunktion nur bis auf eine Konstante eindeutig de…niert ist.
Ein Beispiel dazu. Eine Stammfunktion von f (x) = x ist o¤ensichtlich x2 =2; denn
die Ableitung dieser Funktion ist x: Jedoch ist auch x2 =2 + C für ein beliebiges C
eine Stammfunktion. In vielen Textbüchern wird deshalb
Z
x2
x dx =
+C
2
86
geschrieben. Wir machen das hier nicht, um eine In‡ation von C’s zu vermeiden,
sondern schreiben einfach
Z
x2
x dx =
;
2
merken uns aber, dass wir immer eine beliebige Konstante zu der rechten Seite
addieren können.
Eine grundlegende Eigenschaft der Integration ist ähnlich wie bei der Di¤erentiation
die Linearität:
Satz 7.10
Sind f; g zwei integrierbare Funktionen I ! R und sind a; b 2 R; so ist af +bg integrierbar
und es gilt
Z
Z
Z
(af (x) + bg (x)) dx = a f (x) dx + b g (x) dx
und entsprechend auch für die bestimmten Integrale.
Beweis. Wir müssen zeigen, dass die rechte Seite der Gleichung eine Stammfunktion
von af + bg ist. Das ergibt sich sofort aus der Linearität der Ableitung.
Eine für bestimmte Integrale oft verwendete Variante der Linearität ist die folgende:
Satz 7.11
Seien a < b < c und f sei auf [a; c] integrierbar. Dann gilt
Z c
Z b
Z c
f (x) dx =
f (x) dx +
f (x) dx:
a
a
b
Leider gibt es keinen systematischen Kalkül um Stammfunktionen zu …nden; in vielen
Fällen kann man sie jedoch erraten. Es gibt weiter einige Tricks, auf die wir unten
kommen werden.
Hier die Fälle, die man einfach aus den entsprechenden Di¤erentiationsregeln erraten
kann:
Potenzen: Für a 6= 1 gilt
Z
1
xa dx =
xa+1 ;
a+1
denn die Ableitung der rechten Seite ergibt xa ; wie wir wissen. Der De…nitionsbereich
von xa ist R falls a 2 N ist, Rn f0g ; falls a ganzzahlig aber negativ (6= 1) ist und ]0; 1[
in den anderen Fällen.
Polynome: Aus der Integration von Potenzen und der Linearität ergibt sich
Z
a1
an n+1
(a0 + a1 x +
+ an xn ) dx = a0 x + x2 +
+
x
2
n+1
Als Beispiel betrachten wir die nach unten geö¤nete Parabel 1 x2 ; die zwischen
und 1 positiv ist. Die Fläche unter diesem postiven Teil der Parabel ist
Z 1
1
x3
1
1
4
2
1 x dx = x
=1
1+
= ;
3
3
3
3
1
x= 1
87
1
was schon Archimedes wusste.
Integration von x 1 : Hier muss man etwas aufpassen. Die Funktion ist für x = 0
nicht de…niert, jedoch sowohl für postive x; wie für negative. Betrachten wir zunächst
die Funktion für postive x: Dann ist eine Stammfunktion log x; denn die Ableitung des
Logarithmus ist 1=x: Was macht man für negative x; wo 1=x ebenfalls de…niert ist, aber
der Logarithmus nicht? Der Trick: Man nimmt einfach log ( x) : Dessen Ableitung ist
nach der Kettenregel
d log ( x)
1
1
=
( 1) = :
dx
x
x
Somit erhalten wir
Z
1
dx = log jxj :
x
Hier gibt es noch eine Schikane: Die Funktion f (x) = 1=x ist ja nicht auf ganz R
de…niert, sondern nur für x 6= 0; d.h. auf den beiden Intervallen ]0; 1[ und ] 1; 0[ :
Streng genommen müssen wir daher von zwei Stammfunktionen sprechen, die eine für
den Bereich ]0; 1[ und die andere für den Bereich ] 1; 0[ : In der Tat können wir für
diese Bereiche auch unterschiedliche Konstanten wählen. So ist etwa
F (x) =
log x
fu
•r x > 0
log ( x) + 100 f u
•r x < 0
eine Stammfunktion von 1=x; denn o¤ensichtlich erfüllt sie F 0 (x) = 1=x für alle x im
De…nitionsbereich.
Exponentialfunktion: Natürlich gilt
Z
ex dx = ex :
Eine kleine Modi…kation ergibt für a 2 R; a 6= 0
Z
1
eax dx = eax :
a
Trigonometrischen Funktione: Die Stammfunktionen von Sinus und Kosinus sind
einfach:
Z
sin x dx =
cos x;
Z
cos x dx = sin x:
Der Tangens ist schon tückischer. Wir werden sein Integral später berechnen.
Aus den Formeln ergibt sich z.B. die Fläche unter dem positiven Bauch der Sinusfunktion, d.h. auf dem Intervall [0; ]:
Z
sin x dx = cos xx=0 = cos + cos 0 = 2:
0
88
Logarithmus: Hier muss man etwas …ndig sein. Zunächst bemerkt man, dass x log x es
„fast“ tut: Nach der Produktregel gilt
d (x log x)
d log x
x
= log x + x
= log x + = log x + 1:
dx
dx
x
Wegen der Linearität der Ableitung gilt somit
d (x log x
dx
also
Z
x)
= log x + 1
log x dx = x log x
1 = log x;
x:
Hier eine etwas überraschende Anwendung. Der Logarithmus ist ja negativ für x < 1
und hat einen Pol bei x = 0: Wir können versuchen, die Fläche unter diesem negativen
Teil zu berechnen, wobei zunächst nicht klar ist, ob diese endlich ist. Für eine positive
Zahl " > 0 existiert die Fläche zwischen " und 1 :
Z 1
log x dx = 1 log 1 1 (" log ") + "
"
=
1
(" log ") + ":
Was passiert nun mit " ! 0? Wie wir schon als Anwendung der Regel von l’Hôpital
gesehen hatten, gilt lim"!0 " log " = 0: Es gilt somit
Z 1
lim
log x dx = 1:
"!0 "
Die Fläche wird hier negativ gerechnet, da die Funktion selbst in dem betrachteten
Bereich negativ ist. Die Fläche unter der Logarithmusfunktion zwischen x = 0 und
x = 1 ist also endlich, obwohl die Funktion selbst einen Pol hat.
Zum Schluss dieses Abschnitts noch Abschätzungen, die wir später benötigen.
Lemma 7.12
a) Sind f und g im Intervall [a; b] integrierbar und gilt f (x)
so gilt
Z b
Z b
f (x) dx
g (x) dx:
a
g (x) für alle x 2 [a; b] ;
a
b) Ist f auf dem Intervall [a; b] integrierbar, so ist jf j integrierbar und es gilt
Z
b
f (x) dx
Z
a
a
89
b
jf (x)j dx:
Beweis. a) folgt aus der De…nition des Riemann-Integrals, denn aus f
g auf dem
ganzen Intervall folgt, dass auch die Unter- wie die Obersummen die gleiche Ungleichung
erfüllen.
In b) zeigen wir nicht, dass jf j integrierbar ist. Die Ungleichung selbst folgt jedoch
sofort aus a), denn es gelten f jf j und f jf j auf dem ganzen Intervall, woraus sich
Z
Z
b
f (x) dx
Z
jf (x)j dx
a
a
und
b
b
f (x) dx =
Z
b
( f (x)) dx
ergeben, woraus die Behauptung folgt.
7.2
b
a
a
a
Z
jf (x)j dx
Zwei Integrationsmethoden: Partielle Integration und Substitution
Die grundlegenden Regeln über Di¤erentiation führen auf entsprechende Regeln für die
Integration.
Wir betrachten zunächst die Produktregel: Seien f; G zwei di¤erenzierbare Funktionen mit Ableitungen f 0 ; G0 = g: Nach der Produktregel ist
(f G)0 = f 0 G + f g:
Integriert ergibt das
fG =
Wir erhalten somit:
Z
0
f G dx +
Z
f g dx:
Satz 7.13 (Partielle Integration)
f sei eine di¤erenzierbare Funktionen, und g sei integriebar, beide de…niert auf einem
Intervall. G sei eine Stammfunktion von g: Dann gilt
a) f G
R
f 0 G dx ist eine Stammfunktion von f g:
b) Für a < b (im De…nitionsbereich) gilt
Z
b
f (x) g (x) dx = [f (b) G (b)
a
f (a) G (a)]
Z
b
f 0 (x) G (x) dx:
a
Die Formel ist in folgender Situation nützlich: Gegeben seien f und g und man möchte
f gdx bestimmen. Angenommen, man kennt eine Stammfunktion von g; nämlich G,
und ist imstande f 0 G zu integrieren, dann kann man auch f g integrieren. Besser als viel
Theorie sieht man das an einer Reihe von Beispielen:
R
90
Beispiel 7.14
1.
Z
x sin x dx:
Wir kennen eine Stammfunktion von sin x; nämlich cos x: Ebenso kennen wir
natürlich die Ableitung von x; nämlich 1: Wir nehmen also f (x) = x; g (x) = sin x;
d.h. G (x) = cos x: Also ergibt sich
Z
Z
x sin x dx =
x cos x
( cos x) dx
Z
=
x cos x + cos xdx
R
Da wir auch cos x integrieren können: cos x dx = sin x; so erhalten wir
Z
x sin x dx = x cos x + sin x:
2.
Z
ex sin x dx:
Hier versuchen wir f (x) = ex ; g (x) = sin x: Dann ist G (x) =
Z
Z
x
x
e sin x dx = e cos x + ex cos x dx:
cos x:
Man sieht nicht recht, was man gewonnen hat, aber wir wenden dasselbe nochmals
auf den zweiten Summanden an. Eine Stammfunktion von cos x ist sin x :
Z
Z
x
x
e cos x dx = e sin x
ex sin x dx:
Zusammen also
Z
x
e sin x dx =
Daraus ergibt sich
Z
x
x
e cos x + e sin x
1
ex sin x dx = ex (sin x
2
Z
ex sin x dx:
cos x) :
3. f (x) = sin2 (x) : Am einfachsten ist es, man verwendet die Beziehung: sin2 x =
1
1
2
2 cos 2x; aber wir wollen uns das Leben nicht so einfach machen und verwenden
partielle Integration mit sin2 x = cos0 x sin x :
Z
Z
2
sin x dx =
cos x sin x + cos2 x dx
Z
=
cos x sin x +
1 sin2 x dx
Z
=
cos x sin x + x
sin2 x dx:
91
Daraus ergibt sich
Z
1
[x
2
sin2 x dx =
sin x cos x] :
Die nächste wichtige Regel:
Satz 7.15 (Substitutionsregel)
f : I ! R sei stetig, g : J ! R sei stetig di¤erenzierbar und es gelte im (g)
eine Stammfunktion von f:
a) F
I: F sei
g ist eine Stammfunktion von (f g) g 0 ; d.h.
Z
(f g) g 0 dx = F (g (x)) :
b)
Z
g(b)
f (x) dx =
Z
b
f (g (x)) g 0 (x) dx:
a
g(a)
Beweis. Das ist einfach die Kettenregel als Integrationsregel interpretiert: Die Ableitung von F g ist ja (F 0 g) g 0 = (f g) g 0 : b) ergibt sich aus a) durch Einsetzen der
Integrationsgrenzen.
In der obigen Formulierung ist die Regel ohne zusätzliche Voraussetzungen korrekt.
Oft wird sie jedoch so verwendet, dass man „x durch g (y) substituiert“. Dies setzt jedoch
voraus, dass g : J ! I bijektiv ist. In diesem Fall seien ; 2 I und wir …nden a; b mit
g (a) = ; g (b) = ; d.h. a = g 1 ( ) ; b = g 1 ( ) : Dann liest sich die obige Formel als
Z
f (x) dx =
Z
g
1(
g
1(
)
f (g (y)) g 0 (y) dy;
)
wobei wir die Integrationsvariable auf der rechten Seite noch in y umbenannt haben. Als
unbestimmtes Integral liest sich das wie folgt:
Z
Z
f dx =
(f g) g 0 dy
g 1
Formal ergibt sich das wie folgt: Wir setzen die Substitution x = g (y) : Dann ist
dx
0
0
dy = g (y) ; d.h. dx = g (y) dy: Eingesetzt ergibt sich die obige Formel, wobei die
Integrationsgrenzen gemäss der Substitution transformiert werden müssen, d.h. wenn
auf der linken Seite die Integration von x = bis x = erfolgt, so erfolgt sie auf der
rechten Seite von y = g 1 ( ) = a bis y = g 1 ( ) = b: Man muss sich jedoch klar
darüber sein, dass die Regel in dieser Form nur gilt, wenn g bijektiv ist.
Beispiel 7.16
1.
Z
xe
92
x2
dx:
Hier nehmen wir F (x) = ex ; g (x) = x2 : Dann ist g 0 (x) =
Z
Z
1
1
2
x2
xe dx =
( 2x) e x dx =
e
2
2
Die Stammfunktion von e
x2
2x und wir erhalten
x2
:
kann man jedoch nicht elementar ausdrücken.
2. Da log x die Stammfunktion vom 1=x ist für x > 0; so erhalten wir, dass für eine
Funktion g mit positivem Wertebereich die Formel
Z 0
g (x)
dx = log (g (x))
g (x)
gilt.
Z.B. im Intervall
2; 2
Z
3.
erhalten wir
Z
sin x
dx =
tan (x) dx =
cos x
Z
log (cos x) :
arctan (x) dx:
Hier wenden wir erst partielle Integration ein, um den Arkustangens in “handli1
chere” Form zu bringen. Die Ableitung von arctan (x) ist ja 1 + x2
:
Z
Z
Z
x
arctan (x) dx = 1 arctan (x) dx = x arctan (x)
dx:
1 + x2
Nun ist x die Hälfte der Ableitung von 1 + x2 : Aus der Substitutionsregel ergibt
sich also
Z
x
1
dx = log 1 + x2 :
1 + x2
2
Zusammen also
Z
1
arctan (x) dx = x arctan (x)
log 1 + x2 :
2
4. In vielen Fällen erfordert die Berechnung des Integrals einige Kni¤e, wenn sie
überhaupt möglich ist. Wir betrachten
Z p
1 x2 dx;
wobei der De…nitionsbereich das Intervall [ 1; 1] ist. Die Funktion beschreibt einen
Halbkreis über diesem Intervall. Daher gilt
Z 1p
1 x2 dx = :
2
1
93
Wir versuchen eine Substitution x = cos y: Die Kosinusfunktion bildet [0; ] bijektiv auf das Intervall [ 1; 1] ab. dx = sin y dy: Nach der obigen Substitutionsregel
erhalten wir
Z p
Z p
1 x2 dx =
1 cos2 y ( sin y dy)
:
y=arccos(x)
Nun ist
p
1
cos2 y = sin y; sodass das Integral einfach
Z
1
sin2 y dy = [sin y cos y y]
2
ist, wie wir oben gesehen hatten. Setzen
wir y = arccos x p
ein, so erhalten wir mit
p
cos (arccos x) = x; sin (arccos x) = 1 cos2 (arccos x) = 1 x2 :
Z p
i
1h p
1 x2 dx =
x 1 x2 arccos x :
2
Zur Kontrolle berechnen wir das obige bestimmte Integral:
Z
1
1
p
1
x2 dx =
=
7.3
i1
1h p
x 1 x2 arccos x
2
x= 1
1
(arccos ( 1) arccos (1)) = :
2
2
Die Taylorformel
Die Taylorformel gestattet es, ziemlich allgemeine Funktionen durch Polynome zu approximieren. Die Basis der Taylorformel ist einfach die Tatsache, dass eine di¤erenzierbare
Funktion f die Stammfunktion von f 0 ist. Für x0 ; x im De…nitionsbereich, den wir als
Intervall voraussetzen, gilt daher
Z x
Z x
0
f (x) f (x0 ) =
f (y) dy =
1 f 0 (y) dy
x0
x0
Wir setzen nun voraus, dass f zweimal di¤erenzierbar ist, und wenden auf die rechte
Seite partielle Integration an. Eine Stammfunktion von 1 ist (y x) ; als Funktion von
y: Daher ergibt sich
Z x
Z x
x
0
0
1 f (y) dy = (y x) f (y) y=x0
(y x) f 00 (y) dy
x0
x0
Z x
0
= (x x0 ) f (x0 ) +
(x y) f 00 (y) dy:
x0
Falls f dreimal di¤erenzierbar ist, so kann man nun mit dem zweiten Summanden in
gleicher Weise weiterfahren. Eine Stammfunktion von (x y) (als Funktion von y) ist
94
(y x)2
:
2
Somit erhalten wir
Z
x
(x
y) f (y) dy =
2
x0
=
x)2
(y
00
(x
x
00
f (y)
+
Z
x0 ) 00
f (x0 ) +
2
x
x
2
x)2
(y
x0
x)2
(y
x0
y=x0
2
Z
2
f 000 (y) dy
f 000 (y) dy:
Somit erhalten wir
f (x) = f (x0 ) + (x x0 ) f 0 (x0 ) +
Z x
(y x)2 00
+
f (y) dy:
2
x0
(x
x0 )2 00
f (x0 )
2
In dieser Weise kann man weiterfahren, immer mit partieller Integration des Integrationsterms. Wenn f (n + 1)-mal di¤erenzierbar ist, so erhalt man
f (x) = f (x0 ) +
n
X
(x
k=1
x0 )k (k)
f (x0 ) +
k!
Z
x
(y
x0
x)n (n+1)
f
(y) dy:
n!
(7.1)
Die ersten beiden Terme auf der rechten Seite bilden zusammen ein Polynom.
De…nition 7.17
Sei f (n + 1)-mal di¤erenzierbar auf dem o¤enen Intervall I und sei x0 2 I: Das Polynom
Tn;x0 (x) := f (x0 ) +
n
X
(x
k=1
x0 )k (k)
f (x0 )
k!
heisst das Taylorpolynom vom Grad n von f um x0 : Den Term
Z x
(y x)n (n+1)
f
(y) dy
Rn (x) :=
n!
x0
nennt man das Lagrangesche Restglied.
Die Idee dieser Darstellung ist, dass selbst nach Weglassung des Restgliedes das
Taylorpolynom selbst eine gute Approximation der Funktion f ist, und zwar je besser,
desto grösser n ist und desto näher x bei x0 ist. Die Diskussion des Restgliedes ist nicht
immer ganz einfach. Wir werden das weiter unten bei besonders wichtigen Beispielen
durchführen.
Das Taylorpolynom 1: Grades ist einfach
x0 ) f 0 (x0 ) ;
f (x0 ) + (x
was einfach die Funktion der Tangente von f im Punkt x0 ist.
95
Uebung 7.18
Das Taylorpolynom n-ten Grades von f in x0 ist das eindeutig de…nierte Polynom n-ten
Grades p (x), das die Eigenschaft hat, dass erstens die Funktionswerte von p und f in
x0 übereinstimmen, und zweitens dies auch für alle Ableitungen bis zur n-ten gilt.
Wir betrachten ein Beispiel: f (x) = sin x und x0 = 0: Die Ableitungen von sin x
hatten wir schon berechnet. Die geraden Ableitungen sind alle sin x; was im Nullpunkt
= 0 ist. Die geraden Potenzen tauchen also im Taylorpolynom nicht auf. Die ungeraden
Ableitungen ergeben cos x; mit +; wenn n bei Division durch 4 Rest 1 hat und
andernfalls. Das Taylorpolynom n-ten Grades von sin x um den Nullpunkt ist also (für
n ungerade)
x3
x5
x7
xn
Tn;0 (x) = x
+
+
;
6
120
7!
n!
wobei sich das Vorzeichen des letzten Summanden gemäss der obigen Regel ergibt. Unten
eingezeichnet ist die Sinusfunktion, dann das Taylorpolynom 5. Grades (rot) und das
Taylorpolynom 11. Grades (schwarz)
y
1.4
1.2
1.0
0.8
0.6
0.4
0.2
-7
-6
-5
-4
-3
-2
-1
1
-0.2
2
3
4
5
6
7
x
-0.4
-0.6
-0.8
-1.0
-1.2
-1.4
Besonders einfach sind die Taylorpolynome für die Funktion ex ; denn alle Ableitungen
der Exponentialfunktion sind wieder ex ; und die Ableitungen im Punkt 0 sind alle 1: Das
n-te Taylorpolynom für ex im Punkt x0 = 0 ist daher:
Tn;0 =
n
X
xk
k=0
k!
mit der Festlegung x0 := 1 und 0! := 1:
Beispiel 7.19
p
Wir betrachten ein etwas kompliziertes Beispiel: f (x) = sin (x); wobei wir x so einschränken, dass sin (x) nicht negativ ist, z.B. 0 x
: Die Wurzelfunktion können wir
96
jedoch im Nullpunkt nicht ableiten. Deshalb schränken wir uns auf x 2 ]0; [ ein. Nach
der Kettenregel und der Quotientenregel gilt
f 0 (x) =
f 00 (x) =
=
1
2
p
1 cos x
p
2 sin x
p
1 cos x
3=2
sin x
sin x cos x d dx
1 sin x cos x 2 psin x
=
sin x
2
sin x
1 sin2 x + 1
1 2 sin2 x + cos2 x
=
:
4
4 sin3=2 x
sin3=2 x
d cos x
dx
Wir berechnen das Taylorpolynom 2. Grades um x0 = =2: f ( =2) = 1; f 0 ( =2) =
0; f 00 ( =2) = 12 ; d.h.
2
1
T2; =2 (x) = 1
:
x
4
2
Die Idee des Taylorpolynoms ist selbstverständlich, mit ihm eine Approximation der
Funktion f zu …nden. Die Abweichung der Funktion vom Taylorpolynom kennen wir
„im Prinzip“, nämlich durch das Lagrangesche Restglied. Dieses ist jedoch nicht sehr
explizit, denn es verwendet alle Funktionswerte zwischen x0 und x: Man kann es jedoch
häu…g abschätzen.
Z x
(y x)n (n+1)
jx x0 jn+1
jRn (x)j =
f
(y) dy
sup f (n+1) (y) :
n!
(n + 1)! y2[x0 ;x]
x0
Die Taylorformel wird man in der Regel dann verwenden wollen, wenn x nahe bei x0
liegt. Sonst ist die Approximation in der Regel nicht besonders gut. Ferner hängt die
obige Abschätung des Restgliedes auch davon ab, wie gross die (n + 1)-te Ableitung im
Intervall [x0 ; x] werden kann (absolut).
Ein Beispiel: f (x) = sin x: Hier hat man das Glück, dass alle Ableitungen selbst
wieder sin x und cos x sind, die alle durch 1 beschränkt sind. Man erhalt daher (mit
x0 = 0)
jxjn+1
jRn (x)j
:
(n + 1)!
Für x = 1=2 und n = 11 ergibt sich eine Abschätzung des Restgliedes
jRn (x)j
7.4
(1=2)12
12!
5 10
13
:
Potenzreihen und die Taylorreihe
Die Taylorformel legt es nahe, dass man für Funktionen, die beliebig oft di¤erenzierbar
sind, das „unendliche“ Taylorpolynom
1
X
1 (k)
f (x0 ) (x
k!
k=0
97
x0 )k
betrachtet, in der Ho¤nung, dass für n ! 1 das Restglied verschwindet und man die
Funktion f vollständig zurückerhält.
Wir machen erst etwas Theorie zu solchen Reihen.
Für x0 ; x 2 R und einer Folge fan gn 0 reeller Zahlen betrachten wir die Reihe
Für x0 = 0 ergibt sich einfach
X
x0 )n :
an (x
X
an xn ;
Solche Reihen summiert man üblicherweise ab n = 0, mit der Konvention x0 = 1: Eine
derartige Reihe nennt man Potenzreihe. Für allgemeine an ist jedoch keinesfalls klar,
ob die Reihe für irgend ein x konvergiert, ausser natürlich für x = 0:
Satz 7.20
Es gibt eine Zahl 2 [0; 1] ; den sogenannten Konvergenzradius, sodass die obige
Reihe für jx x0 j < absolut konvergiert und für jx x0 j > divergiert. Ferner gilt
=
1
limn!1
p
n
jan j
;
sofern der Grenzwert existiert. Ist der Limes im Nenner gleich 0; so istpder Konvergenzradiusq1; d.h. die Reihe konvergiert für alle x: Ist umgekehrt limn n jan j = 1; d.h.
limn n jan j
x 6= x0 :
1
= 0; so ist der Konvergenzradius 0; d.h. die Reihe konvergiert für kein
Über das Konvergenzverhalten einer Potenzreihe für jx x0 j = kann man keine
allgemeinen Aussagen machen. Dies ist von Fall zu Fall unterschiedlich.
Im Konvergenzbereich der Potenzreihe de…niert diese natürlich eine Funktion in x;
d.h. mindestens für jx x0 j < :
Beispiel 7.21
1. Ist an = 1 für alle n; so ist der Konvergenzradius o¤enbar 1: Die Reihe
1
X
n=0
xn =
1
1
x
; jxj < 1;
sollte aus dem Gymnasium bekannt sein (geometrische Reihe). Die Reihe konvergiert weder für x = 1 noch für x = 1:
2. an = n!: Wir können an nach unten abschätzen, indem wir die erste Hälfte der
Faktoren weglassen. Ist n gerade, so erhalten wir
n!
n
+1
2
n
+2
2
98
n
n
+1
2
n=2
:
Für n ungerade haben wir n!
abschätzen. Wegen (n 1) =2
(n 1)! und können dies nach der Formel oben
n=3 für n 2 ergibt sich in diesem Fall:
n
+1
3
n!
n=3
:
(7.2)
1=3
Die n-te Wurzel aus dem Ausdruck rechts ist n3 + 1
, was o¤ensichtlich gegen
1 strebt für n ! 1: Somit ist der Konvergenzradius 0; d.h. die Reihe
1
X
n!xn
n=0
konvergiert für kein x 6= 0:
3. an = 1=n!: Mit einer kleinen Modi…kation der Rechnung im 2. Beispiel folgt, dass
der Konvergenzradius hier 1 ist.
De…nition 7.22
Sei die Funktion f auf einem o¤enen Intervall I de…niert mit x0 2 I; und f sei in x0
unendlich oft di¤erenzierbar. Dann heisst die Reihe
X f (n) (x0 )
n!
(x
x0 )n
die Taylorreihe von f im Punkt x0 :
Eine naheliegende Frage ist, ob die Taylorreihe dort, wo sie konvergiert, mit der
Funktion übereinstimmt. Dies ist nicht immer der Fall, jedoch in vielen („den meisten“)
interessanten Fällen. Der Beweis erfolgt in der Regel mit einer Abschätzung des Restgliedes in der Taylor-Formel.
Wir diskutieren das Beispiel der Exponentialfunktion sorgfältig.
Satz 7.23
Die Taylorreihe der Exponentialfunktion ex um den Punkt x0 = 0 ist
X xn
n!
:
Sie konvergiert absolut auf ganz R und stimmt mit der Funktion ex überein.
Beweis. Die Ableitungen im Nullpunkt sind alle gleich 1; sodass die Taylorreihe o¤ensichtlich die obige Gestalt hat. Wie wir schon gesehen haben, ist der Konvergenzradius
dieser Potenzreihe gleich 1; sodass die Reihe auf ganz R absolut konvergiert. Es bleibt
zu zeigen, dass sie auf ganz R mit der Exponentialfunktion übereinstimmt. Das Taylorpolynom n-ten Grades ist natürlich einfach
Tn;0 (x) =
n
X
xk
k=0
99
k!
;
was einfach die entsprechende Partialsumme der Taylorreihe ist. Aus (7.1) erhalten wir
Z x
Z x
(y x)n y
(y x)n y
x
jTn;0 (x) e j = jRn (x)j =
e dy
e dy
n!
n!
0
0
Z x
(jy xj)n y
e dy
=
n!
0
Für x > 0 ist ey
Fall die Schranke
ex für y 2 [0; x] und jy
jTn;0 (x)
x
e j
e
x
Z
x
xj = x
y: Daher erhalten wir in diesem
y)n
xn+1
dy = ex
:
n!
(n + 1)!
(x
0
Unter Verwendung von (7.2) lässt sich die rechte Seite durch
!n
n+1
x
x
ex
= ex x p
3
n=3 + 1
(n=3 + 1)n=3
abschätzen. Für jedes x > 0 ist
p
3
x
n=3 + 1
1
;
2
sofern n genügend gross ist. Damit ergibt sich
ex j
jTn;0 (x)
xex
1
;
2n
sofern n genügend gross ist. Der Restterm konvergiert deshalb gegen 0 für n ! 1:
Für x < 0 ist das Argument analog.
Bemerkung 7.24
Aus der obigen Reihendarstellung der Exponentialfunktion ergibt sich auch die bekannte
Formel
ex ey = ex+y :
Da die Reihe der Exponentialfunktion für alle x und y absolut konvergiert, ergibt sich
aus Satz 4.15 b):
ex ey =
=
=
=
X1
xn
n=0 n!
X1
Xn
n=0
X1
n=0
X1
n=0
X1
n=0
yn
n!
xk
yn k
k=0 k! (n
k)!
Xn
n!
xk y n
k=0 k! (n
k)!
1
n!
1
(x + y)n = ex+y :
n!
100
k
Die Taylorreihen für Sinus und Kosinus lassen sich ebenfalls leicht berechnen. Wir
nehmen wieder x0 = 0:
Die geraden Ableitungen von sin x sind stets sin x; also = 0 im Nullpunkt. Die
ungeraden Ableitungen sind cos x; also 1 im Nullpunkt, beginnend mit +1 für die
erste Ableitung und anschliessenden Vorzeichenwechseln. Die Taylorreihe ist daher
1
X
( 1)n
n=0
x2n+1
:
(2n + 1)!
Ananlog ist die Taylorreihe von cos x :
1
X
( 1)n
n=0
x2n
:
2n!
Diese Taylorreihen sind für alle x konvergent und stellen ihre Funktionen dar:
Satz 7.25
Für alle x 2 R gelten
1
X
sin x =
n=0
1
X
cos x =
( 1)n
x2n+1
;
(2n + 1)!
( 1)n
x2n
:
2n!
n=0
Wir berechnen noch die Taylorreihe der Logarithmusfunktion. Diese ist im Nullpunkt
nicht de…niert, sodass wir sie im Punkte x0 = 1 berechnen. Die Ableitungen haben wir
in Beispiel 6.19 3. berechnet. Setzen wir dort x = 1 ein, so erhalten wir für f (x) = log x
f (n) (1) = ( 1)n
1
(n
1)!:
Die Taylorreihe für den Logarithmus im Punkt 1 ist also
1
X
( 1)n
1
1)n
(x
n
n=1
:
(7.3)
Der Konvergenzradius dieser Reihe ist
=
lim
n!1
p
n
1
n = lim e n log n
n!1
1
= elimn!1 n log n = e0 = 1:
Die Potenzreihe konvergiert somit für jx 1j < 1: Sie konvergiert allerdings auch
noch für x 1 = 1; d.h. x = 2; aber nicht für x = 0:
Satz 7.26
Die Taylorreihe von log x bei x0 = 1 ist gegeben durch (7.3). Sie konvergiert gegen log x
für 0 < x 2:
101
Bemerkung 7.27
Manchmal schreibt man die Taylorreihe des Logarithmus auch mit einer Substitution
y = 1 x: Dann ergibt sich
1
X
yn
log (1 y) =
;
n
n=1
was für jyj < 1 absolut konvergiert.
Wir diskutieren nun einige weitere allgemeine theoretische Resultate über Potenzreihen, die wir dann auch für die Taylorreihen anwenden können. Der (notationellen)
Einfachheit halber diskutieren wir das nur für Potenzreihen mit x0 = 0:
SatzP7.28
Sei
an xn eine Potenzreihe mit Konvergenzradius
für jxj < :
> 0 und sei f (x) :=
P1
n
n=0 an x
a) f ist di¤erenzierbar mit
f 0 (x) =
1
X
nan xn
1
:
n=1
Diese Reihe hat ebenfalls Konvergenzradius :
b) f ist für jxj < unendlich oft di¤erenzierbar, wobei sich die Ableitungen durch
gliedweise Di¤erentiation der Summanden der Reihe ergeben.
P
c) Die n-te Ableitung von f im Nullpunkt ist gleich n! an : Somit ist
an xn die
Taylorreihe von f um x0 = 0:
Wir beweisen den Satz nicht. Die einzige Schwierigkeit ist der Beweis von a). b) folgt
sofort aus a) und c) ergibt sich aus b).
Beispiel 7.29
Die Taylorreihe für
1
1 x
ist
P1
n
n=0 x :
1
(1
2
x)
Der Konvergenzradius ist 1: Daher ist
=
1
X
d 1
=
nxn
dx 1 x
1
:
n=1
Ein analoges Resultat gilt für die Integration:
Satz 7.30 P
n
Sei f (x) := 1
n=0 an x eine Potenzreihe mit Konvergenzradius
Z
f (x) dx =
1
X
n=0
an
Z
xn dx =
102
1
X
n=0
an
xn+1
n+1
> 0: Dann ist
für jxj < : Hier sollte man sich daran erinnern, dass Stammfunktionen noch eine freie
Konstante erhalten, sodass die allgemeine Stammfunktion
C+
1
X
an
1
n=1
xn
n
ist.
Beispiel 7.31
1. Wir können die Potenzreihe des Logarithmus durch Integration der geometrischen
Reihe gewinnen:
1
X
1
=
xn ;
1 x
n=0
was für jxj < 1 absolut konvergiert. Durch Integration erhalten wir
log (1
x) =
1
1
X
X
xn+1
xn
+C =
+ C;
n+1
n
n=0
n=1
mit einer noch zu bestimmen Konstanten C: Diese ergibt sich durch Einsetzen von
x = 0 : nämlich C = 0: Somit ist
log (1
1
X
xn
x) =
n
n=1
:
2. Wir können die Potenzreihe des Arkustangens aus der Potenzreihe der Ableitung
gewinnen:
1
1 + x2
=
=
1
1
X
1
=
( x2 )
x2
n
n=0
1
X
( 1)n x2n :
n=0
Die Reihe konvergiert absolut für jxj < 1: Durch Integration ergibt sich
arctan (x) =
1
X
( 1)n
n=0
x2n+1
:
2n + 1
Wegen arctan (0) = 0 ist die mögliche Konstante wieder = 0: Wegen arctan (1) =
=4 erhält man die Leibnizsche Reihe
4
=
1
X
( 1)n
n=0
1
:
2n + 1
Da der Konvergenzradius = 1 ist, ergibt sich die Darstellung nicht ganz sauber aus
dem vorangegangenen Satz. Die Reihe konvergiert nicht sehr schnell und ist für die
103
Berechnung von nicht brauchbar. Wesentlich besserpfährt man mit Einsetzen
einer
p
Zahl < 1; deren Arkustangens man kennt, z.B. 1= 3 mit arctan 1= 3 = =6:
Somit gilt
6
=
1
X
p 2n+1
1
1= 3
1 X
1
=p
( 1)n n
:
2n + 1
3 (2n + 1)
3 n=0
n
( 1)
n=0
Diese Reihe konvergiert recht gut.23
Satz
P 7.32
P
an xn und bn xn seien zwei Potenzreihen mit Konvergenzradien
f (x) :=
1
X
an xn ; g (x) :=
n=0
für jxj <
1;
bzw. jxj <
a) Für jxj <
2:
Sei
1
X
1
und
2:
Wir setzen
bn xn
n=0
:= min ( 1 ;
2) :
gilt
f (x) + g (x) =
1
X
(an + bn ) xn :
n=0
b) Für jxj <
gilt
f (x) g (x) =
1
X
cn xn ;
n=0
mit
cn :=
n
X
ak bn
k:
k=0
Beweis. Die Behauptungen folgen sofort mit Satz 4.15.
Es spricht nichts dagegen, auch komplexe Potenzreihen zu betrachten: Für eine Folge
fcn g von komplexen Zahlen betrachten wir die Potenzreihe
X
cn z n ;
23
Ludolph van Ceulen berechnete die Kreiszahl Ende des 16. Jh. im Wesentlichen mit der von Archimedes eingeführten Methode (Approximation durch Vielecke) auf 35 Stellen nach dem Komma. Mit
dieser Beschäftigung verbrachte er einen Grossteil seines Lebens. Immerhin wurde ihm die Ehre zuteil,
dass die Kreiszahl bis ins 19 Jh. als Ludolphsche Zahl bezeichnet wurde, etwas unsinnigerweise, denn die
Idee der Approximation stammt vollständig von Archimedes. Mit der Entdeckung der Reihendarstellungen der Zahl - wie der obigen - konnte dieselbe Genauigkeit (auch ohne Taschenrechner) in ein paar
Stunden erzielt werden.
Die Leibnizsche Reihe war übrigens in Indien schon im 15. Jh. bekannt.
104
wobei wir uns hier für die Konvergenz der Reihe für komplexe Zahlen z 2 C interessieren. Wir hatten bisher komplexe Reihen nicht betrachtet. Konvergenz der obigen Reihe
bedeutet einfach, dass sowohl Real- wie Imaginärteile der Folge der Partialsummen
sn :=
n
X
ck z k
k=0
konvergieren. Das ist gleichbedeutend damit, dass eine komplexe Zahl s 2 C existiert
mit
lim jsn sj = 0:
n!1
Man schreibt in einem solchen Fall
s=
1
X
ck z k :
k=0
Komplexe Potenreihen haben ebenfalls einen Konvergenzradius , der sich als
=
1
limn!1
p
n
jcn j
ergibt, sofern der Limes existiert.
Die komplexe Potenzreihe konvergiert absolut für jzj <
bedeutet hier, dass die reelle Reihe
X
jcn j jzjn
: Absolute Konvergenz
konvergiert.
Es ist naheliegend, die komplexe Exponentialfunktion als
ez :=
1
X
zk
k=0
k!
zu de…nieren. Der Konvergenzradius dieser Reihe ist 1:
Aus dieser Reihendarstellung lassen sich nun mühelos die grundlegenden Eigenschaften der komplexen Exponentialfunktion herleiten:
Satz 7.33
Die komplexe Exponentialfunktion hat die folgenden Eigenschaften:
a) Für z; w 2 C gilt
ez ew = ez+w :
b) Für x 2 R gilt die Eulersche Formel:
eix = cos x + i sin x:
105
Beweis. Der Beweis von a) ist der gleiche wie in Bemerkung 7.24.
b): Wir setzen ix in die Potenzreihe ein. Der Wert von (ix)k hängt davon ab, welchen
Rest bei der Division von k durch 4 vorliegt:
8
xk
bei Rest 0
>
>
<
k
ix
bei Rest 1
(ix)k =
:
k
x
bei Rest 2
>
>
:
ixk bei Rest 3
Wir erhalten also
e
ix
1
X
1
=
(ix)k = 1
k!
x2 x4
+
2
4!
k=0
x3 x5
+
3!
5!
= cos x + i sin x:
x6
+
6!
x7
+
7!
+i x
Es gibt eine Reihe von weiteren Sätzen, die für den Umgang mit Potenzreihen nützlich sind. Sind z.B. f; g zwei Funktionen, deren Taylorreihen um x0 man kennt und ist
g (x0 ) 6= 0; so kann man f (x) =g (x) um x0 in eine Taylorreihe entwickeln, deren Gestalt man durch Koe¢ zientenvergleich ermitteln kann. Wir wollen das hier nur an einem
Beispiel demonstrieren, der Tangensfunktion:
tan (x) =
sin x
:
cos x
Die Reihen für Sinus und Kosinus kennen wir schon. Wir wollen den Tangens um 0
entwickeln. Wegen tan (0) = 0 beginnt die Reihe mit a1 x: Wir machen also den Ansatz
tan (x) = a1 x + a2 x2 + a3 x3 +
:
Daraus ergibt sich wegen sin (x) = tan (x) cos (x) :
x
x3 x5
+
3!
5!
=
a1 x + a2 x2 + a3 x3 +
= a1 x + a2 x2 + a3
a1
2
x2 x4
+
2
4!
a2 4
3
x + a4
x + a5
2
:
1
Daraus ergibt sich eine Folge von Gleichungen:
a1 = 1;
a5
a2
a1
a3
2
a2
a4
2
a3 a1
+
2
4!
= 0;
1
=
3!
=
1
6
= 0
=
106
1
1
=
:
5!
120
a3 a1 5
+
x +
2
4!
:
Man sieht sofort, dass die geraden Koe¢ zienten alle gleich 0 sind. Ferner a1 = 1; a3 = 13 ;
a5 =
1
120
1
1
16
2
+ =
= :
24 6
120
15
Es ist klar, dass man so weiter fahren kann. Den allgemeinen Ausdruck der Koe¢ zienten
sparen wir uns.
7.5
Uneigentliche Integrale
Bisher hatten wir Integrale von Funktionen nur über endlichen Intervallen [a; b] betrachtet, auf denen die Funktion de…niert ist. Manchmal ist es jedoch auch möglich, ein
Integral auf einem unbeschränkten Intervall zu de…nieren, oder wenn die Funktion auf
den Randpunkten nicht de…niert ist.
De…nition 7.34
RN
a) Ist die Funktion f auf dem Intervall [a; 1[ de…niert, existiert das Integral a f (x) dx
RN
für alle N 2 N; N > a; und existiert limN !1 a f (x) dx; so nennt man diesen
Limes das (uneigentliche) Riemann-Integral und schreibt dafür
Z 1
f (x) dx:
a
Ra
Analog wird 1 f (x) dx de…niert. Ist f auf R de…niert und existieren die Integrale
R0
R1
f
(x)
dx
und
1 f (x) dx; so schreibt man
0
Z
1
f (x) dx :=
1
Z
1
f (x) dx +
0
Z
0
f (x) dx:
1
Man sagt auch oft, die Funktion f sei „bei 1 integrierbar“ bzw. bei
Grenzwerte existieren.
1; falls die
Rb
b) Ist f auf dem Intervall ]a; b] de…niert, aber nicht in a; und existiert lim"#0 " f (x) dx;
so nennt man diesen Grenzwert das (uneigentliche) Riemann-Integral auf dem Intervall und schreibt dafür
Z
b
f (x) dx:
a
Wir machen dazu einige Beispiele:
Beispiel 7.35
Die Funktion xa ist für jedes a 2 R auf der
R 1postiven reellen Achse de…niert. Für a 0 ist
sie auch für x = 0 de…niert. Das Integral 0 xa dx existiert für a 0 jedoch o¤ensichtlich
nicht, denn der Funktionswert ist ja 1 für jedes x 1:
Um das Integral bei 1 zu de…nieren müssen wir also auf jeden Fall a < 0 voraussetzen. In diesem Fall haben wir jedoch auch in Problem bei 0; da dann die Funktion in 0
107
nicht de…niert ist. Wir untersuchen daher die Sache getrennt auf den Intevallen [1; 1[
und ]0; 1] : Für a < 0 und N > 1 ist
( a+1
Z N
N
1
fu
•r a 6= 1
a
a+1
x dx =
:
log
N
f
u
•r a = 1
1
Limes N ! 1 existiert (in R) genau dann, wenn a <
RDer
1 a
1 x dx existiert genau dann, wenn a < 1 ist, und es gilt
Z 1
xa dx = (a + 1) 1 :
1 ist, d.h. das Integral
1
Für den Fall a
1 schreibt man oft
Z 1
xa dx = 1:
1
Nun zum Intervall ]0; 1] : Für " > 0 gilt
(
Z
a+1
1
xa dx =
"
1 "
a+1
fu
•r a 6=
log " f u
•r a =
1
:
1
In diesem Fall konvergiert dieser Ausdruck für " ! 0 genau dann, wenn a >
wir erhalten in diesem Fall
Z
1
xa dx = (a + 1)
1
1 ist, und
:
0
Wir sehen also: xa ist integrierbar bei 1 genau dann, wenn a < 1 gilt, und bei 0
genau dann, wenn a > 1 ist. Für a = 1 ist es weder bei 1 noch bei 0 integrierbar.
Beispiel 7.36
Wir untersuchen eax ; was auf ganz R de…niert ist. Für a
natürlich nicht integrierbar. Für a < 0 gilt jedoch
Z N
1 aN
1
eax dx =
e
1 !
a
a
0
0 ist die Funktion bei 1
für N ! 1: Die Funktion ist also bei 1 integrierbar. Umgekehrt: Für a > 0 ist die
Funktion bei 1 integrierbar.
Beispiel 7.37
2
Ein wichtiges Beispiel ist die Gausssche Glockenfunktion e x : Da sie stetig ist, ist sie
auf jedem endlichen Intervall integrierbar. Die Stammfunktion ist jedoch nicht elementar
durch die Kombination der üblichen Funktionen darstellbar. Wir können jedoch leicht
nachweisen, dass das uneigentliche Integral
Z 1
2
e x dx
(7.4)
1
108
existiert. Zunächst gilt für x 1 die Ungleichung x2 x; d.h. e
N >1
Z N
Z N
x2
e x dx 1:
e dx
RN
x2
e
x:
Daher ist für
1
1
x2
Die Folge 1 e dx steigt monoton an und ist nach dieser Ungleichung nach oben
beschränkt. Daher existiert
Z N
Z 1
2
2
e x dx:
e x dx = lim
N !1 1
1
R1
2
Da das Integral 0 e x dx wegen der Stetigkeit der Funktion existiert, so existiert auch
R 1 x2
2
dx: Da die Funktion f (x) = e x gerade ist, d.h. f ( x) = f (x) erfüllt, so sieht
0 e
R0
R1
2
2
man leicht, dass auch 1 e x dx existiert und in der Tat gleich 0 e x dx ist. Somit
existiert (7.4). Es gilt übrigens
Z 1
p
2
e x dx =
;
1
was nicht ganz einfach zu sehen ist, da man die Stammfunktion nicht explizit hinschreiben kann.
109
8
Periodische Funktionen und Fourierreihen
De…nition 8.1
Sei T eine reelle Zahl > 0: Eine Funktion f : R ! R heisst T -periodisch, falls f (x + T ) =
f (x) für alle x gilt. Man sagt in diesem Fall auch, f habe die Periode T:
Die Prototypen periodischer Funktionen sind Sinus und Kosinus. Diese sind o¤ensichtlich 2 -periodisch. Jede konstante Funktion ist natürlich T -periodisch für beliebiges
T > 0:
Bemerkung 8.2
Es ist für die De…nition nicht wichtig, dass der Wertebereich die reellen Zahlen sind. Wir
können von einer Funktion f : R ! A mit beliebiger Menge A de…nieren, was es heisst,
dass sie T -periodisch ist. Wichtig sind insbesondere komplexwertige Funktionen R ! C:
So ist die Funktion f (x) = eix 2 -periodisch.
Satz 8.3
a) Hat f die Periode T; so hat sie auch die Periode 2T: Allgemeiner: Für jede natürliche Zahl n hat f die Periode nT:
b) Hat f die Periode T und sei die Funktion g de…niert durch
g (x) = f (x + a) ;
a 2 R beliebig. Dann ist g ebenfalls T -periodisch.
c) Hat f die Periode T und ist
de…niert durch
eine positive reelle Zahl, so hat die Funktion g
g (x) = f ( x)
die Periode T = :
d) Sind f; g zwei T -periodische Funktionen, so ist auch f + g T -periodisch.
e) Ist f eine T -periodische Funktion und ist
2 R; so ist auch f T -periodisch.
Beweis. a) Zweimaliges Anwenden der Periodizitätseigenschaft ergibt für beliebiges x 2
R:
f (x + 2T ) = f ((x + T ) + T ) = f (x + T ) = f (x) :
Für allgemeines n folgt die Aussage sofort per Induktion.
b)
g (x + T ) = f (x + a + T ) = f (x + a) = g (x) :
c)
g x+
T
= f
x+
T
= f ( x) = g (x) :
110
= f ( x + T)
d)
(f + g) (x + T ) = f (x + T ) + g (x + T )
= f (x) + g (x) = (f + g) (x) :
e) ist o¤ensichtlich.
Kennt man eine T -periodische Funktion auf dem Intevall [0; T [ oder einem beliebigen Intervall der Länge T; so kennt man sie o¤enbar auf ganz R: Man kann deshalb die T -periodischen Funktionen einfach mit den Funktionen [0; T [ ! R identi…zieren. Jede Funktion f : [0; T [ ! R kann durch periodische Fortsetzung zu einer T periodischen Funktion gemacht werden. Ein Problem entsteht jedoch mit der Stetigkeit.
Ist f : [0; T [ ! R stetig so braucht die periodisch fortgesetzte Funktion auf R keinesfalls
stetig zu sein. Hier ein Beispiel. Wir betrachten die Funktion f (x) = x auf dem Intervall
[0; 1[ : Die periodisch fortgesetzte Funktion ist die „Sägezahnfunktion“ mit dem unten
stehenden Graphen:
1.0
0.5
-5
-4
-3
-2
-1
0
1
2
3
4
Die Funktion ist o¤ensichtlich unstetig für ganzzahlige x:
Aus Teil c) des Satzes folgt, dass man die Betrachtungen auf 2 -periodische Funktionen beschränken kann. Ist nämlich f eine T -periodische Funktion, so ist
g (x) = f
xT
2
2 -periodisch, und ist f eine 2 -periodische Funktion, so ist
g (x) = f
2 x
T
eine T -periodische Funktion. Durch eine einfach Variablentransformation lässt sich daher
die Periode in 2 transformieren. Man könnte sich auch auf 1-periodische Funktionen
beschränken, wegen der 2 -Periodizität von Sinus und Kosinuns nimmt man jedoch meist
Periode 2 :
Wir kennen also nun schon eine Reihe von 2 -periodischen Funktionen:
1; sin x; cos x; sin 2x; cos 2x; sin 3x; cos 3x; : : :
(8.1)
Diese Funktionen können wir auch linear kombinieren. Die damit gewonnen Funktionen
sind nach dem obigen Satz ebenfalls 2 -periodisch.
111
5
x
De…nition 8.4
Eine Funktion der Form
n
X
p (x) = a0 +
ak cos (kx) +
k=1
n
X
bk sin (kx)
(8.2)
k=1
mit a0 ; a1 ; : : : ; an ; b1 ; : : : ; bn 2 R, n 2 N nennt man ein trigonometrisches Polynom vom
Grad n:
Bemerkung 8.5
Man stellt trigonometrische Polynome oft bequemer in komplexer Schreibweise dar, nämlich als
n
X
ck eikx :
k= n
Durch geeignete Wahl der ck 2 C lässt sich nämlich jedes trigonometrische Polynom in
dieser kompakteren Schreibweise darstellen. Nach der Eulerschen Formel gilt
eikx = cos kx + i sin kx:
Ausgehend vom trigonometrischen Polynom (8.2) bestimmen wir die ck so, dass
n
X
ck eikx = p (x)
(8.3)
k= n
ist. Dies wird erreicht durch
c0 = a0 ;
und ck =
k
+i
k;
c
k
=
k
i
k
= ck ; k
k
=
1 mit der Festlegung
ak
;
2
k
=
bk
:
2
Mit dieser Festlegung der ck gilt nämlich
ck eikx + c
ke
ikx
= ck eikx + ck eikx
= 2 Re ck eikx
= 2 Re ((
= 2(
k
k
+i
cos kx
k ) (cos kx
k
+ i sin kx))
sin kx)
= ak cos kx + bk sin kx:
Daraus ergibt sich (8.3).
Es ist etwas Geschmackssache, ob man die komplexe Schreibweise vorzieht. Der Vorteil ist, dass die Exponentialfunktion einfacher zu handhaben ist. Anderseits mag es etwas
unnatürlich erscheinen, für eine reellwertige Funktion über das Komplexe zu gehen.
112
Wir wollen nun eine weitgehend beliebige 2 -periodische Funktion f „möglichst gut“
durch trigonometrische Polynome approximieren.
Eine der grundlegenden Eigenschaften der Liste (8.1) von Funktionen besteht darin,
dass sie - wie man sagt - orthonormiert sind. Dies bedeutet folgendes:
Satz 8.6
a) Für alle k 2 N gilt
Z
2
sin (kx) dx =
0
Z
2
cos (kx) dx = 0:
0
b) Für alle k; l 2 N gilt
Z
2
cos (kx) sin (lx) dx = 0:
0
c) Für k 6= l gilt
Z
2
cos (kx) cos (lx) dx =
0
Z
2
sin (kx) sin (lx) dx = 0:
0
d) Für alle k 2 N gilt
Z
2
2
cos (kx) dx =
0
Z
2
sin2 (kx) dx = :
0
Beweis. a) ist o¤ensichtlich. b): Unter Verwendung von
1
[sin ( + ) + sin (
2
cos ( ) sin ( ) =
erhalten wir
Z 2
cos (kx) sin (lx) dx =
0
1
2
= 0:
Z
2
sin ((k + l) x) dx +
0
)]
1
2
Z
2
sin ((k
l) x) dx
0
c) Aus
sin ( ) sin ( ) =
erhält man für k 6= l
Z 2
sin (kx) sin (lx) dx =
0
1
2
= 0:
Z
1
[cos (
2
)
cos ( + )]
2
cos ((k
l) x) dx
0
Die entsprechende Gleichung mit Kosinus folgt analog.
113
1
2
Z
0
(8.4)
2
cos ((k + l) x) dx
d) Unter Verwendung von (8.4) erhält man
Z
Z 2
1 2
2
cos (0 x) dx
sin (kx) dx =
2 0
0
=
+0= :
1
2
Z
2
cos ((k + l) x) dx
0
Die Behauptung mit Kosinus folgt analog.
Zu einer vorgegebenen 2 -periodischen Funktion f suchen wir nun ein trigonometrisches Polynom, das f möglichst gut approximiert. Wir geben dieses Polynom einfach an
und beweisen anschliessend, dass die Approximation in gewisser Hinsicht optimal ist.
Zu gegebenem f de…nieren wir
Z 2
1
a0 (f ) :=
f (x) dx;
(8.5)
2 0
und für k
1;
ak (f ) : =
1
Z
2
f (x) cos (kx) dx
(8.6)
f (x) sin (kx) dx:
(8.7)
0
bk (f ) : =
1
Z
2
0
Wir setzen dabei voraus, dass die Integrale alle existieren. Die Zahlen ak (f ) ; bk (f )
heissen die Fourierkoe¢ zienten von f:
Wir schreiben
FPn;f (x) := a0 (f ) +
n
X
ak (f ) cos (kx) +
k=1
n
X
bk (f ) sin (kx) ;
(8.8)
k=1
und bezeichnen es als das Fourierpolynom vom Grad n von f:
Für die nachfolgende Diskussion ist es (vor allem notationell) bequemer, wenn wir die
Situation etwas kompakter formulieren. Wir de…nieren die folgenden 2n + 1 Funktionen:
p
p
p
2 cos x; 2 (x) = 2 cos (2x) ; : : : ; n (x) = 2 cos (nx) ;
0 (x) = 1; 1 (x) =
p
p
p
2 sin x; n+2 (x) = 2 sin (2x) ; : : : ; 2n (x) = 2 sin (nx) :
n+1 (x) =
Ferner führen wir die folgende Abkürzung ein: Für zwei Funktionen f; g; die auf [0; 2 ]
de…niert sind, schreiben wir
Z 2
1
hf; gi :=
f (x) g (x) dx;
2 0
wobei wir natürlich voraussetzen, dass das Integral de…niert ist. Man beachte, dass wegen
der Linearität des Integrals die folgenden Gleichungen gelten: Für Funktionen f1 ; : : : ; fm
und Zahlen 1 ; : : : ; m 2 R und eine beliebige Funktion g gilt
Xk
i=1
i fi ; g
=
Xk
114
i=1
i hfi ; gi :
Analog gilt für Funktionen f; g1 ; : : : ; gk und
f;
Xk
i=1
=
i gi
1; : : : ;
m
Xk
2R
i hf; gi i :
i=1
Satz 8.6 lässt sich dann wie folgt kompakt ausdrücken:
i;
j
0 fu
•r i 6= j
:
1 fu
•r i = j
=
(8.9)
Ferner ist das Fourierpolynom einer Funktion f gebeben durch
FPn;f (x) =
2n
X
k=0
hf;
ki
k:
Das allgemeine trigonometrische Polynom (8.2) können wir dann als
2n
X
ck
(8.10)
k
k=0
schreiben mit ck = p12 ak für k n; und ck = p12 bk n für n + 1 k 2n:
Der nachfolgende Satz gibt an, in welchem Sinn das Fourierpolynom die Funktion
optimal approximiert.
Satz 8.7
Sei f eine 2 -periodische Funktion und sei p (x) ein beliebiges trigonometrisches Polynom
der Form (8.10), dann gilt
Z
2
(f (x)
2
FPn;f (x)) dx
0
Z
2
(f (x)
p (x))2 dx:
0
Wir setzen hier voraus, dass die Integrale existieren, was stets dann der Fall ist, wenn
das Integral von f 2 (x) über eine Periode existiert.
Bemerkung 8.8
Sind f; g zwei auf dem Intervall de…nierte Funktionen, so de…niert
Z
2
(f (x)
g (x))2 dx
0
eine Art von „Abstand“ zwischen den Funktionen f; g; ist also ein Mass dafür, wie weit
sich die Funktionen unterscheiden. Meist zieht man noch die Quadratwurzel aus dem
Ausdruck, was für die Diskussion hier jedoch ohne Belang ist. Der obige Satz besagt daher, dass FPn;f dasjenige trigonometrische Polynom vom Grad n ist, welches minimalen
Abstand von f hat.
115
Beweis von Satz 8.7. Für ein beliebiges trigonometrisches Polynom p (x) der Form
(8.10) ergibt sich
Z 2
Z 2
Z 2
Z 2
1
1
1
1
2
2
(f (x) p (x)) dx =
f (x) dx 2
f (x) p (x) dx +
p (x)2 dx
2 0
2 0
2 0
2 0
2n
2n
X
X
= hf; f i 2
ck hf; k i +
ck cl h k ; l i
k=0
= hf; f i
2
k;l=0
2n
X
ck hf;
k=0
ki +
2n
X
c2k ;
k=0
die letzte Gleichung wegen (8.9).
Dieselbe Rechnung mit FPn;f (x) anstelle von p (x), d.h. mit dem Spezialfall ck =
hf; k i ; ergibt
Z 2
2n
2n
X
X
1
(f (x) FPn;f (x))2 dx = hf; f i 2
hf; k i2 +
hf; k i2
2 0
= hf; f i
Somit ergibt sich
=
k=0
hf;
k=0
2
ki :
Z 2
1
(f (x) p (x)) dx
(f (x) FPn;f (x))2 dx
2
0
0
2n
2n
2n
2n
X
X
X
X
hf; k i2 =
(ck hf; k i)2
2
ck hf; k i +
c2k +
1
2
Z
k=0
2n
X
2
2
k=0
k=0
k=0
0:
k=0
Bemerkung 8.9
R
ersetzen, wenn dies bequemer ist: Z.B.
Wir können die Integrale auch durch
Z 2
Z
Z 2
f (x) cos (kx) dx =
f (x) cos (kx) dx +
f (x) cos (kx) dx:
0
0
Im zweiten Integral substituieren wir x = y + 2 : Wegen dx = dy und der Periodizität
ergibt sich
Z 2
Z 0
f (x) cos (kx) dx =
f (y + 2 ) cos (ky + 2k ) dy
=
Z
0
f (y) cos (ky) dy:
Die Integrationsvariable können wir wieder in x umtaufen und erhalten
Z 2
Z
f (x) cos (kx) dx =
f (x) cos (kx) dx:
0
116
De…nition 8.10
f sei eine 2 -periodische Funktion. Die Reihe
a0 (f ) +
1
X
(ak (f ) cos kx + bk (f ) sin kx)
(8.11)
k=1
heisst die Fourier-Reihe von f:
Im Moment wissen wir noch nicht, unter welchen Bedingungen an f die Fourier-Reihe
konvergiert.
Enthält die Reihe keine Sinus-Glieder, so nennt man sie eine Kosinusreihe. Sind
hingegegen alle ak (f ) = 0; k 0; so nennt man sie eine Sinusreihe.
Lemma 8.11
Ist f eine gerade 2 -periodische Funktion, d.h. gilt f ( x) = f (x) ; so ist die FourierReihe eine Kosinusreihe. Ist f ungerade, d.h. gilt f (x) = f (x) ; so ist die Reihe eine
Sinusreihe.
Beweis. Wir verwenden die Bemerkung 8.9 und stellen die ak (f ) ; bk (f ) durch Integration über das Intervall [ ; ] dar. Für gerade Funktionen f erhalten wir
Z
1
bk (f ) =
f (x) sin (kx) dx
(8.12)
=
1
Z
f (x) sin (kx) dx +
0
1
Z
0
f (x) sin (kx) dx:
Mit der Substitution y = x; dy = dx ergibt sich für den zweiten Summanden:
Z 0
Z 0
f (x) sin (kx) dx =
f ( y) sin ( ky) dy
=
Z
=
0
f (y) sin (ky) dy
Z
f (y) sin (ky) dy:
0
Somit ist der zweite Summand in (8.12) das Negative des ersten Summanden und bk (f ) =
0 für alle k:
Für ungerade Funktionen ergibt sich analog ak (f ) = 0 für alle k:
Wie schon beim Taylorpolynom erwartet man vom Fourierpolynom, dass dieses eine Funktion möglichst gut approximiert. Bei den Fourierpolynomen setzt man jedoch
voraus, dass die Funktion, für die man sich interessiert, periodisch ist.
Wir berechnen einige Beispiele.
Beispiel 8.12
Zunächst die „Sägezahnfunktion“: f (x) = x für x 2 [0; 2 [ und 2 -periodisch fortgesetzt.
Die Fourierkoe¤ezienten lassen sich leicht mit partieller Integration berechnen:
Z 2
1
a0 (f ) =
x dx = ;
2 0
117
Z
1
ak (f ) =
2
0
1
x cos (kx) dx =
x sin (kx)jx=2
x=0
k
1
k
Z
|
2
sin (kx) dx
{z
}
0
=0 nach Satz 8.6 a)
1
cos (kx)jx=2
x=0 = 0; k
k2
=
bk (f ) =
1
Z
2
x sin (kx) dx =
0
=
2
k
1:
1
1
x cos (kx)jx=2
x=0 +
k
k
2
:
k
+0=
Z
2
cos (kx) dx
0
Das Fourierpolyonom ist daher
n
X
2 sin kx
FPn;f (x) =
k=1
k
:
Unten ist der Graph der Funktion zusammen mit dem Fourierpolynomen vom Grad 5
(rot) und vom Grad 10 (blau):
6
5
4
3
2
1
-10
-8
-6
-4
-2
2
4
6
8
Beispiel 8.13
f (x) = jsin (x=2)j : Diese Funktion ist ebenfalls 2 -periodisch. sin (x=2) ist natürlich
nur 4 -periodisch, aber nach der halben Periode dieser Funktion wiederholt sich die
Funktion, wenn man den Absolutbetrag nimmt:
118
10
x
1.0
0.8
0.6
0.4
0.2
-10
-8
-6
-4
-2
0
2
4
Da die Funktion gerade ist, hat die Funktion eine Kosinusreihe.
Z 2
Z
1
1
a0 =
jsin (x=2)j dx =
sin (y) dy
2 0
0
1
2
=
cos yjy=0 = ;
und für k
1
ak =
=
1
2
Z
2
jsin (x=2)j cos (kx) dx =
Z0
1
Z
2
sin (x=2) cos (kx) dx
0
sin (y) cos (2ky) dy:
0
Unter Verwendung von sin cos = 12 [sin (
) + sin ( + )] erhalten wir
Z
1
ak =
[sin ((1 2k) y) + sin ((2k + 1) y)] dy
0
=
=
1
(2k
1)
2
(2k
cos ((2k
1)
+
1) y)jy=0
2
=
(2k + 1)
1
cos ((2k + 1) y)jy=0
(2k + 1)
4
:
(4k 2 1)
Hier das Fourierpolynom
FPn (x) =
2
n
X
k=1
4
(4k 2
und hier noch der Graph für n = 5
119
1)
cos (kx) ;
6
8
10
x
1.2
1.0
0.8
0.6
0.4
0.2
-10
-8
-6
-4
-2
0
2
4
6
8
Die Frage, ob die unendliche Fourierreihe einer 2 -periodischen Funktion f für jedes
x gegen f (x) konvergiert, ist nicht ganz einfach zu beantworten.
Wir nennen eine 2 -periodische Funktion f stückweise glatt, falls es endlich viele
Punkte 0 < x1 < x2 <
< xk
2 gibt, sodass die Funktion ausser in den Punkten
xj + 2n ; 1 j
k; n 2 Z stetig und di¤erenzierbar ist mit beschränkter Ableitung,
und in den Punkten xj rechtsseitige und linksseitige Limiten besitzt:
f (xj ) := lim f (x) ; f (xj +) := lim f (x) :
x"xj
x"xj
Die beiden oben diskutierten Beispiele sind stückweise glatt.
Satz 8.14
Sei f eine stückweise glatte 2 -periodische Funktion. Dann konvergiert die Fourierreihe
(8.11) für jedes x 2 R gegen
1
(f (x+) + f (x )) :
2
(Ist f stetig in x; so konvergiert sie gegen f (x) :
Formal wesentlich einfacher ist die Approximation im Sinne des “Abstands” aus
Bemerkung 8.8:
Satz 8.15
Sei f eine 2 -periodische Funktion und sei f 2 integrierbar. Dann gilt
lim
Z
n!1 0
2
(f (x)
FPn;f (x))2 dx = 0:
Wir haben bisher nur den 2 -periodischen Fall diskutiert. Der allgemeine Fall lässt
sich leicht darauf zurückführen. Hier die Details:
Ist f eine T -periodische Funktion, so ist
F (x) := f
120
x
T
2
10
x
eine 2 -periodische Funktion. Das Fourierpolynom ist daher
a0 (F ) +
n
X
ak (F ) cos (kx) +
k=1
n
X
bk (F ) sin (kx)
k=1
mit ak (F ) ; bk (F ) gegeben durch (8.5), (8.6), (8.7). Diese können wir natürlich auch
sofort in f ausdrücken. Z.B.
Z
1 2
F (x) sin (kx) dx
bk =
0
Z
1 2
T
=
f x
sin (kx) dx
2
0
Z T
2 ky
y=xT =2 2
f (y) sin
dy;
=
T 0
T
und analog
a0 =
ak =
Z
1 T
f (y) dy;
T 0
Z
2 T
f (y) cos
T 0
2 ky
T
dy; k
1:
Ist f stückweise glatt, so ist auch F stückweise glatt. In diesem Fall können wir F
durch die Fourierreihe darstellen:
F (x) = a0 +
1
X
ak cos (kx) +
k=1
1
X
bk sin (kx) :
k=1
Diesen Ausdruck können wir wieder zurücksubstituieren:
f (x) = a0 +
1
X
k=1
ak cos
2 kx
T
121
+
1
X
k=1
bk sin
2 kx
T
:
Herunterladen