Rechnen in Naturwissenschaft und Technik

Rechnen in Naturwissenschaft
und Technik:
Mathematischer Vorkurs für
Studienanfänger
28.09.-08.10.2009, Geb. C 6.3, gr. Hörsaal
K. Kruse
L. Santen
W. Zimmermann
Kontakt: L. Santen, Theoretische Physik, Geb. E2.6
[email protected]
http://www.unisaarland.de/campus/fakultaeten/professuren/naturwissenschaftlichtechnische-fakultaet-ii/theoretische-physik/professurentheoretische-physik-fr-71/prof-dr-ludger-santen.html
1
Die Mathematik stellt am Anfang des Physikstudiums oft eine große Hürde dar. Ähnliches gilt für das Studium der Ingenieurswissenschaften und in geringerem Umfang auch
für das der anderen Naturwissenschaften. Die Mathematikausbildung in der Schule
sollte Ihnen aber ein gutes Fundament vermittelt haben, von dem aus Sie diese Hürde
überwinden können. Dieser Vorkurs soll Ihnen dabei helfen, die in der Schule erworbenen Mathematikkenntnisse aufzufrischen, und damit den Einstieg in die universitäre
Mathematik erleichtern.
Mit der Wiederholung des Ihnen bekannten mathematischen Stoffs sollen Sie auch in
die studentische Arbeitsweise eingeführt werden. Diese erfordert zunächst eine große
Selbstdisziplin. Aus diesem Grund sind die Vormittage zum Selbststudium vorgesehen.
Setzen Sie sich in Gruppen zusammen und arbeiten die angegebenen Seiten des Skripts
durch. An den Nachmittagen findet eine Übung statt, in der Sie im Beisein von Tutoren Aufgaben lösen können, die zu dem für den Vormittag vorgesehenen Stoff passen.
Wie tief Sie jeweils in ein Problem oder ein Thema eintauchen, ist ganz allein Ihnen
überlassen. Bedenken Sie aber, dass Sie ohne solide mathematische Grundkenntnisse
eher früher als später in Ihrem Studium auf große Probleme stoßen werden.
Für diesen Vorkurs stehen uns zwei Wochen zur Verfügung, in denen wir den Stoff der
Oberstufe Revue passieren lassen werden. Natürlich ist es nicht möglich, ihn sich in dieser Zeit komplett neu zu erarbeiten. Auch ist das vorliegende Skript nicht als Lehrbuch
gedacht. Sollten Sie mal eine Lücke feststellen oder sollte Ihnen die Darstellung des
einen oder anderen Punkts anders vorkommen als in der Schule, dann lassen Sie sich
dadurch nicht abschrecken. Nehmen Sie sich in diesem Fall ihr Schulbuch zur Hand und
arbeiten sie den entsprechenden Punkt dort durch. Gehen Sie dann zurück zum Skript
und setzen sich an die entsprechenden Übungsaufgaben. Gerade für die Mathematik
gilt, dass nur durch das selbständige Lösen vieler Aufgaben die nötige Souverenität im
Umgang mit Konzepten und Rechentechniken erworben werden kann.
2
Inhaltsverzeichnis
1 Funktionen und Ableitungen
1.1 Funktionen . . . . . . . . .
1.2 Umkehrfunktionen . . . . .
1.3 Grenzwerte und Stetigkeit .
1.4 Gewöhnliche Ableitungen . .
1.5 Höhere Ableitungen . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
5
5
8
9
9
12
2 Folgen, Reihen, die Exponentialfunktion und eine Differentialgleichung
2.1 Folgen und Reihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.1.1 Arithmetische Folgen und Reihen . . . . . . . . . . . . . . . . .
2.1.2 Geometrische Folgen und Reihen . . . . . . . . . . . . . . . . .
2.2 Die Exponentialfunktion . . . . . . . . . . . . . . . . . . . . . . . . . .
2.3 Differentialgleichungen und die Exponentialfunktion . . . . . . . . . . .
2.4 Einige Rechenregeln für die Exponentialfunktion . . . . . . . . . . . . .
2.5 Der natürliche Logarithmus . . . . . . . . . . . . . . . . . . . . . . . .
14
14
14
15
16
20
22
22
3 Komplexe Zahlen und weitere elementare Funktionen
3.1 Wo treten komplexe Zahlen auf? . . . . . . . . . . . . . .
3.2 Die vier Grundrechenarten mit komplexen Zahlen . . . .
3.2.1 Addition und Subtraktion . . . . . . . . . . . . .
3.2.2 Multiplikation . . . . . . . . . . . . . . . . . . . .
3.2.3 Division . . . . . . . . . . . . . . . . . . . . . . .
3.3 Komplex konjugierte Zahl . . . . . . . . . . . . . . . . .
3.4 Betrag und Argument komplexer Zahlen . . . . . . . . .
3.5 Komplexe Zahlen und die Exponentialfunktion . . . . . .
3.6 Die Polardarstellung komplexer Zahlen . . . . . . . . . .
3.7 de Moivres Theorem . . . . . . . . . . . . . . . . . . . .
3.8 Trigonometrische Funktionen . . . . . . . . . . . . . . .
3.9 Additionstheoreme . . . . . . . . . . . . . . . . . . . . .
3.10 Die n-te Wurzel von 1 . . . . . . . . . . . . . . . . . . .
3.11 Der komplexe Logarithmus . . . . . . . . . . . . . . . . .
3.12 Hyperbolische Funktionen . . . . . . . . . . . . . . . . .
3.13 Hyperbolische Umkehrfunktionen – Areafunktionen . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
24
24
26
26
26
27
27
27
28
28
30
30
32
34
35
36
37
4 Funktionen und Ableitungen II
4.1 Ableitungen von Umkehrfunktionen . . . . . . . . . . . . . . . . . . . .
4.2 Ableitungen der trigonometrischen und der hyperbolischen Funktionen
4.3 Anwendungsbeispiel für den tanh(x) . . . . . . . . . . . . . . . . . . .
4.4 Regel von l’Hospital . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.5 Taylor-Entwicklung von Funktionen in Potenzreihen . . . . . . . . . . .
4.6 Das Newton-Verfahren . . . . . . . . . . . . . . . . . . . . . . . . . . .
38
38
38
40
41
42
43
3
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
5 Integralrechnung
5.1 Das bestimmte Integral . . . . . . . . . .
5.2 Das unbestimmte Integral . . . . . . . .
5.3 Integration durch Ansehen . . . . . . . .
5.4 Integration trigonometrischer Funktionen
5.5 Integration durch Substitution . . . . . .
5.6 Logarithmische Integration . . . . . . . .
5.7 Partielle Integration . . . . . . . . . . .
5.8 Integration durch Partialbruchzerlegung
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
45
45
46
48
48
49
50
50
52
6 Vektoren
6.1 Koordinatendarstellung von Vektoren . . . . .
6.1.1 Länge eines Vektors . . . . . . . . . . .
6.1.2 Elementare Rechenregeln für Vektoren
6.2 Schnitte zweier Geraden . . . . . . . . . . . .
6.3 Polarkoordinaten . . . . . . . . . . . . . . . .
6.4 Skalarprodukt . . . . . . . . . . . . . . . . . .
6.5 Vektorprodukt im R3 . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
53
53
55
55
56
59
60
61
7 Lineare Systeme
7.1 Drehungen von Vektoren . . . . .
7.2 Matrix-Multiplikation . . . . . . .
7.3 Transponierte und inverse Matrix
7.4 Eigenwerte und Eigenvektoren . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
63
63
64
65
67
8 Wahrscheinlichkeitsrechnung
8.1 Wahrscheinlichkeiten . . . . . . . . . . . . . . . .
8.2 Eigenschaften der Wahrscheinlichkeit . . . . . . .
8.3 Bedingte Wahrscheinlichkeiten . . . . . . . . . . .
8.4 Permutationen und Kombinationen . . . . . . . .
8.5 Kontinuierliche Zufallsvariablen und Verteilungen
8.6 Statistische Größen . . . . . . . . . . . . . . . . .
8.7 Die Gauß-Verteilung . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
69
69
69
69
71
73
74
75
9 Literatur
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
77
4
1
1.1
Funktionen und Ableitungen
Funktionen
Funktionsverläufe begegnen uns tagtäglich in Nachrichten- und Informationssendungen im Fernsehen oder in Zeitungen zur Darstellung empirischer Daten. Häufig werden die Ergebnisse von Meinungsumfragen oder die Entwicklung von Börsenkursen als
Funktion der Zeit durch Graphen dargestellt. Formal ist eine Funktion eine eindeutige
Zuordnung von Elementen einer Definitionsmenge zu Elementen einer Bildmenge. Hier
bedeutet eindeutig“, dass jedem Element der Definitionsmenge genau ein Element
”
der Bildmenge zugeordnet wird, so ist zum Beispiel die Größe eines Menschen eine
Funktion seines Alters, denn er hat zu jedem Zeitpunkt nur eine Größe. Die Größe der
Menschen überhaupt in Abhängigkeit ihres Alters ist dagegen keine Funktion, denn
zwei Menschen desselben Alters können verschieden gross sein. Formal schreibt man
für eine Funnktion f
f : D → B
(1)
x 7→ f (x) .
Hier ist f der Funktionsname, D die Definitions-, B die Bildmenge und x 7→ f (x) die
Abbildungsvorschrift. Häufig ergeben sich D und B aus dem Zusammenhang und es
wird nur die Abbildungsvorschrift angegeben, z.B. f (x) = x.
Nicht jeder Funktionsverlauf ist analytisch durch eine einfache Formel darstellbar. Dies
setzt nämlich ein Verständnis der mit der Formel beschriebenen Vorgänge voraus. Nach
dem Stand der Dinge verstehen wir die komplizierten Ursachen und Beweggründe z.B.
der Bevölkerungsentwicklung noch nicht, auch nicht die Entwicklung der Börsenkurse.
Demzufolge können wir für deren zeitliche Entwicklung immer nur bis zur Gegenwart
die Daten aufzeichnen und keine Formel angeben, um damit deren Entwicklungen auch
vorherzusagen.
Im folgenden geht es um typische und analytisch darstellbare Gesetzmäßigkeiten, wie
sie bei vielen naturwissenschaftlichen und technischen Vorgängen auftreten. Beginnen
wir mit besonders einfachen Beispielen. Fährt ein Fahrzeug am Ort y0 mit konstanter
Geschwindigkeit v los und behält diese bei, dann befindet es sich zur Zeit t am Ort
y = y0 + vt .
(2)
Dieser einfache und lineare (gerade) Funktionsverlauf ist in Abb. 1a für y0 = 0, 1 und
v = 1 (durchgezogene Linie) und für y0 = 1, 0 mit entgegengesetzter Geschwindigkeit
v = −1 dargestellt (gestrichelt). Auch Funktionsverläufe mit der Form einer Parabel
y = x2 , wie in Abb. 1b zu sehen, sind in Wissenschaft und Technik weit verbreitet.
Abbildung 1c zeigt einen Funktionsverlauf, der sich aus einem linearen und einem
parabolischen Anteil zusammensetzt:
y = b + ax + x2 .
Ein wichtiges Beispiel für eine Polynomfunktion höheren Grades ist
5
(3)
2
a)
y
2
c)
b)
1
y
y = x
2
y
1
1
0
0
0
−1
0
1
t
2
−1
0
1
−1
x
0
1
x
Abbildung 1: Elementare Funktionen: Im Teil (a) sind es zwei Geraden nach Gl.(2)
und Parametern wie im Text. In (b) ist die Parabel f (x) = x2 dargestellt und in (c)
ist ein Verlauf nach Gl. (3) dargestellt, wobei a = −1 (durchgezogen) und a = 1.5
(gestrichelt) sowie in beiden Fällen b = 0.
y
2
1
− 1.5 − 1.0 − 0.5
0.5
1.0
1.5
x
−1
Abbildung 2: Die Polynomfunktion fp (x) = −ax2 + x4 für a = −2 (Strichpunktlinie),
a = 0 (gestrichelt) und a = 2 (durchgezogen) .
f (x) = −ax2 + x4 .
(4)
Diese einfache Polynomfunktion begegnet ihnen z.B. während des Studiums in der
Mechanik, der Thermodynamik und Statistik und in der Festkörperphysik. Man stelle
sich z.B. vor, der Funktionsverlauf in Abb. 2 entspräche einer Muldenform in dem ein
Kügelchen losgelassen wird. Das Kügelchen wird dem niedrigsten Punkt der Kurve
zustreben. Dies ist einmal x = 0 für a < 0 und x 6= 0 für a > 0. Bestimmen Sie als
Übung den Wert x 6= 0.
Nicht nur Summen verschiedener Potenzen xn einer Variablen x sind als Funktionen von
Bedeutung. Manche Funktionen haben die Variable x im Exponenten, wie z.B. für eine
positive reelle Zahl b die Funktion f (x) = bx . Die berühmteste und zugleich wichtigste
Funktion dieser Art ist die Exponentialfunktion ex auch ex = exp(x) geschrieben. Die
Zahl e hat den Wert e = 2.7182818 . . ., welchen wir uns später im Abschnitt 2 mit
einer Reihendarstellung noch beschaffen werden. Der Funktionsverlauf von ex ist zur
Erinnerung in Abb. 3 dargestellt.
Die Exponentialfunktion tritt in vielerlei Zusammenhängen auf, wie z.B bei der Zinses–
6
10
y
8
x
y=e
6
y
4
2
1
y = ln ( x )
2
0
0
−1
0
1
2
0
x
2
4
6
x
8
10
Abbildung 3: Zwei weitere elementare Funktionen. Links ist die Exponentialfunktion
ex = exp(x) dargestellt und rechts ist ihre Umkehrfunktion ln(x) gezeigt.
zinsrechnung, bei der Rentenrechnung oder beim Bakterienwachstum. Aber auch bei
sehr vielen anderen funktionalen Zusammenhängen tritt die Exponentialfunktion auf.
Wie wir noch in vielen Beispielen sehen werden, ist die Exponentialfunktion ganz zentral bei sogenannten linearen Systemen (deren Bedeutung später erklärt wird).
Ähnlich universelle Funktionen sind die trigonometrischen Funktionen sin und cos,
welche beide in Abb. 4 dargestellt sind. f (t) = A sin(ωt) beschreibt beispielsweise die
kleinen Auslenkungen eines Uhrenpendels als Funktion der Zeit t, wobei ω die Kreisfrequenz der Schwingung mit Periode T ist: ω = 2π/T . Beide Funktionen lassen sich
durch die Exponentialfunktion ausdrücken, wie im Abschnitt 3.8 beschrieben werden
wird.
Auch die Anwendung der trigonometrischen Funktionen ist nicht auf ein Beispiel be-
1
y
0
−1
0
5
10
15
x
Abbildung 4: Die durchgezogene Kurve ist f (x) = cos(x) und die gestrichelte Line ist
f (x) = sin(x).
7
Abbildung 5: Ein Beispiel für eine Funktion, die von zwei Variablen abhängt. Die
Funktion beschreibt hier eine etwas seltsame Fläche, deren analytischer Ausdruck im
Bild angegeben ist.
schränkt. Wie die Exponentialfunktion begleiten sie diese durch die Mechanik, Elektrizitätslehre und Elektrodynamik, Quantenphysik etc. Dahinter steckt, daß viele grundlegende Differentialgleichungen linear sind, welche sin(ωt), cos(ωt) als Lösungen besitzen.
Neben Funktionen von einer Variablen sind auch Funktionen von mehreren Variablen
vorstellbar und von Bedeutung: Flächen über einer Ebene, wie z.B. in Abb. 5, sind
Funktionen von zwei Variablen, f (x, y); die Temperatur T in einem Raum hängt von
wenigstens 4 veränderlichen ab, den drei Raumkoordinaten x, y, z und der Zeit t, T =
T (x, y, z, t).
In den bisher angeführten Beispielen war die Definitionsmenge durch ein oder mehrere Intervalle bestimmt. Sie kann aber auch durch eine diskrete Menge gegeben sein.
Zum Beispiel kann man jedem Menschen ein Geburtsdatum zuordnen. Die Definitionsmenge kann auch beide Formen mischen: Betrachten wir ein Gas in einem Volumen.
Jedem Gasteilchen (i = 1, ..., N) kann zu j edem Zeitpunkt des Beobachtungszeitraums
(tǫ[0, T ]) ein Ort zugeordnet werden.
1.2
Umkehrfunktionen
Wenn man eine Funktion y = f (x) kennt, dann möchte man oft auch x durch die
Variable y, also durch eine Funktion x = g(y) ausdrücken. Man nennt dann g(y) die
Umkehrfunktion zu f (x). Dieses geht offensichtlich nur dann, wenn die Funktion eineindeutig ist: nicht nur das jedem Element der Definitionsmenge genau ein Element der
8
g
f
x
0
0
x
Abbildung 6: Stetigkeit.
Bildmenge zugeordnet wird sondern auch umgekehrt - jedem Element der Bildmenge
wird genau ein Element der Definitionsmenge zugeordnet. Die Verkettung der Funktion
mit ihrer Umkehrfunktion liefert die Identität, g ◦ f = I, d.h., ein Element wird durch
diese Operation auf sich selbst abgebildet, g(f (x)) = x.
Für die lineare Funktion f (x) = ax mit a 6= 0 ist die Umkehrfunktion g(y) = a1 y,
denn f (g(y)) = a a1 y = y. Für die quadratische Funktion f (x) = bx2 , b > 0, existiert
keine Umkehrfunktion, falls die Definitions- und Bildmenge R sind. Werden für
p die
beiden nur die positiven
reellen
p Zahlen einschließlich 0 gewählt, dann ist g(y) = y/b,
p
2
denn f (g(y)) = by /b = y 2 = y. Die Umkehrfunktion der in Abb. 3 gezeigten
Exponentialfunktion ist der Logarithmus ln(x), welche ebenfalls in Abb. 3 gezeigt ist.
1.3
Grenzwerte und Stetigkeit
Die beiden in Abb. 6 gezeigten Funktionen unterscheiden sich qualitativ. Während
f in einer Linie durchgezogen werden kann, hat g Sprünge. Die Eigenschaft von f
bezeichnet man als Stetigkeit. Sie bedeutet, daß limx→x0 f (x) = f (x0 ) für alle x0
gilt. In dieser Beziehung bezeichnet limx→x0 f (x) den Grenzwert von f wenn x gegen
x0 geht. Anschaulich heißt das, daß je dichter Sie x bei x0 wählen, desto dichter liegt
f (x) bei f (x0 ). Bei geeigneter Wahl von x aus einer Umgebung von x0 unterschreitet
der Abstand von f (x) zu f (x0 ) jeden beliebigen von Ihnen vorgegebenen Wert.
1.4
Gewöhnliche Ableitungen
Eine Funktion f (x) heißt differenzierbar an der Stelle x0 , falls der Grenzwert
lim
x→x0
f (x) − f (xo )
= f ′ (x0 )
x − x0
(5)
existiert. f ′ (x0 ) nennt man die Ableitung der Funktion f (x) im Punkt x0 . Es gibt
dafür auch andere und oft benutzte äquivalente Schreibweisen:
df ′
f (x0 ) =
= fx (x0 ) .
(6)
dx x=x0
9
Handelt es sich bei der Variablen x um die Zeit t, so ist für die Ableitung einer Funktion
g auch die Schreibweise g ′(t0 ) = ġ(t0 ) üblich. Da f ′ (x) für eine differenzierbare Funktion
an jeder Stelle des Definitionsbereichs berechnet werden kann, ist f ′ (x) selbst wieder
eine Funktion.
Betrachten wir ein Beispiel. Der zurückgelegte Weg eines Teilchens nach der Zeit t
und der Anfangsposition y0 zur Zeit t = 0 sei durch Gl. (2) gegeben. Die Ableitung
(t0 )
0
= limt→t0 t−t
v = v ist offensichtlich die von t unabhängige
f ′ (t) = limt→t0 f (t)−f
t−t0
t−t0
Geschwindigkeit v des Teilchens.
Nehmen wir als zweites Beispiel die Parabel f (x) = ax2 :
ax2 − ax20
(x + x0 )(x − x0 )
= lim a
= lim a(x + x0 ) = 2ax0 .
x→x0
x→x0
x→x0
x − x0
x − x0
lim
(7)
Die Ableitung der Parabel f (x) = ax2 an der Stelle x ist also
f ′ (x) = 2ax
(8)
und hängt selbst wieder von x ab.
(x0 )
gibt die Steigung der Geraden, die durch (x, f (x))
Der Differenzenquotient f (x)−f
x−x0
und (xa , f (x0 )) geht an, siehe Abb. 7. Die Ableitung f ′ (x0 ) gibt entsprechend die Steigung der Tangente an die Funktion f im Punkt (x0 , f (x0 )) an. Sie wird durch die
Gleichung
T (x; x0 ) = f (x0 ) + f ′ (x0 )(x − x0 )
(9)
beschrieben. Die Ableitung f ′ (x0 ) wird auch als Steigung von f in x0 bezeichnet. Die
Tangente T (x; x0 ) stellt eine lineare Näherung (Approximation) der Funktion f in x0
dar. Wie gut diese Näherung ist, können wir am Besipiel der Parabel betrachten. Sei
f (x) = x2 , x0 = 1 und x1 = 1.1. Dann ist T (x1 ; x0 )−f (x1 ) = 12 +2.1(1.1−1)−(1.1)2 =
1 + 0.2 − 1.21 = −0.01. Der Fehler durch die Näherung beträgt also nur etwa 1%.
Das Differential der Funktion y = f (x) ist
dy = f ′ (x)dx .
(10)
Wegen y = f (x) ist für das Differential auch die Schreibweise df (x) üblich. Mit dem
Differential werden also infinitesimale Veränderungen einer Größe beschrieben und mit
infinitesimalen Veränderungen anderer Größen in Verbindung gesetzt. Es ist insbesondere in der Thermodynamik von großer Bedeutung, tritt aber auch in anderen
Zusammenhängen in der Physik auf.
Wir wenden uns nun einfachen Ableitungsregeln zu, die es uns ersparen werden, Ableitungen über den häufig umständlich zu berechnenden Grenzwert (5) auszurechnen.
Aus der Definition der Ableitung ergibt sich sofort, dass sie eine lineare Operation ist.
Die Ableitung einer Summe von zwei Funktionen ist also die Summe der Ableitungen
der beiden Funktionen, (f + g)′(x) = f ′ (x) + g ′(x), und bei der Multiplikation mit einer
Konstanten α kann diese vor die Ableitung gezogen werden, (αf )′(x) = αf ′(x).
10
y=f(x)
y
∆ y=f(x+dx)-f(x)
dy
dx
x
x+dx
x
Abbildung 7: ∆y ist also die Änderung von y = f (x) entlang des Wegstückes ∆x = dx.
dy ist die Änderung von y entlang der Tangente. D.h. dy ist die Tangentenapproximation (lineare Approx.) zu ∆y und der Unterschied zwischen ∆y und dy verschwindet
für ∆x → 0.
Oftmals ist f (x) aus anderen Funktionen zusammengesetzt, z.B. als Produkt f (x) =
g(x) h(x) zweier differenzierbarer Funktionen. Die Parabel ist ein sehr einfaches Beispiel
mit g(x) = h(x) = x. Der Differentialquotient ist
f (x + ∆x) − f (x)
∆x→0
∆x
g(x + ∆x)h(x + ∆x) − g(x)h(x)
= lim
∆x→0
∆x
g(x + ∆x)h(x + ∆x) − g(x)h(x + ∆x) + g(x)h(x + ∆x) − g(x)h(x)
= lim
∆x→0
∆x
′
′
= g (x) h(x) + g(x) h (x)
(11)
f ′ (x) =
lim
Also gilt
(g h)′ (x) = g ′ (x) h(x) + g(x) h′ (x)
(12)
Wenn man diese Produktregel auf f (x) = x2 anwendet, folgt f ′ (x) = x·x′ +x′ ·x = 2x
wie oben.
′
Als ein weiteres Beispiel betrachten wir f (x) = x3 . Die Ableitung ist f ′ (x) = (x3 ) =
′
x2 (x)′ + (x2 )′ x = x2 + x(2x) = 3x2 . Es liegt nun folgende Vermutung nahe: (xn ) =
nxn−1 . Gezeigt haben wir es für n = 1, 2, 3. Nehmen wir an, dass wir die Formel bis zu
′
einem Wert n gezeigt hätten, (xn )′ = nxn−1 . Dann gilt (xn+1 )′ = (xn x)′ = (xn+1 ) =
(xn )′ x + xn (x)′ = (n + 1)xn . Also gilt diese Aussage auch für n + 1 und daher für jedes
n (dieses Beweisschema nennt man vollständige Induktion):
d(xn )
= nxn−1
dx
.
(13)
Damit kann man nun auch die Ableitung der Funktion in Gl. (4) leicht berechnen:
fp′ (x) = −2ax + 4x3 .
11
Neben Produkten von Funktionen gibt es auch Quotienten von Funktionen f (x) =
g(x)/h(x). Auch deren Ableitungen können wieder durch Ableitungen der Teilfunktionen dargestellt werden, siehe unten.
Als letztes lassen Sie uns die Ableitungen zusammengestzter Funktionen f (x) = g(h(x))
berechnen. Ein Beispiel ist f (x) = g(h(x)) = h2 (x) mit h(x) = 2x + b. Bei deren Ableitung nach x geht man schrittweise vor. Mit y = g(h(x)) kann man für die Differenzen
∆y
auch schreiben
durch Erweiterung des Bruches ∆x
∆y
∆y ∆h
=
∆x
∆h ∆x
.
(14)
Geht dann ∆x → 0, so strebt für eine differenzierbare und damit stetige Funktion h
auch ∆h → 0. Damit kann der Grenzwert ∆x → 0
∆y
∆h
∆y
= lim
· lim
∆x→0 ∆x
∆h→0 ∆h ∆x→0 ∆x
lim
(15)
gebildet werden und es folgt die Regel für die Ableitung einer Verkettung von Funktionen
dg(h(x))
dg(h) dh(x)
=
.
(16)
dx
dh dx
Damit folgt für das Beispiel
df
dx
=
dh2
dx
=
dh2 dh
dh dx
= 2h · 2 = 4(2x + b).
Ableitungsregeln
d
dx
(f + g) (x) =
d
dx
(αf (x))
d
(f
dx
g)(x)
d
f (x)
dx
+
d
g(x)
dx
Summenregel
d
= α dx
f (x)
d
d
= dx
f (x) g(x) + f (x) dx
g(x)
d f (x)
dx g(x)
=
d
f (g(x))
dx
=
( dxd f (x))g(x)−f (x) dxd g(x)
g 2 (x)
für g(x) 6= 0
df (g) dg(x)
dg
dx
(α ∈ R)
Produktregel
Quotientenregel
Kettenregel
Die Ableitungen der Exponential- und Logarithmusfunktionen sowie der trigonometrischen Funktionen berechnen wir im Abschnitt 4.
1.5
Höhere Ableitungen
Oftmals ist die Ableitung h(x) = f ′ (x) einer Funktion f (x) wieder differenzierbar, d.h.
es existiert der Grenzwert
h(x) − h(x0 )
= h′ (x0 ) .
x→x0
x − x0
lim
12
(17)
Der Ausdruck h′ (x0 ) wird als die zweite Ableitung von f an der Stelle x0 bezeichnet.
Hierfür verwendet man die Schreibweisen
f ′′ (x0 ) =
d2 f
|x=x0
dx2
.
(18)
Die zweite Ableitung bestimmt die geometrische Krümmung einer Kurve, wie z.B. die
Parabel f (x) = ax2 verdeutlicht: f ′′ (x) = a.
Die n-te Ableitung wird entsprechend über
dn
f (n−1) (x + ∆x) − f (n−1) (x)
(n)
f
(x)
=
f
(x)
=
lim
∆x→0
dxn
∆x
definiert, wobei f (1) (x) = f ′ (x), f (2) (x) = f ′′ (x) usw.
13
(19)
2
Folgen, Reihen, die Exponentialfunktion und eine
Differentialgleichung
In diesen Abschnitt beschäftigen wir uns mit der in den Natur- und Ingenieurswissenschaften laufend vorkommenden und auch in der Mathematik zentralen Exponentialfunktion. Bevor wir jedoch die Zahl e berechnen und uns Beispielen zuwenden in denen
die Exponentialfunktion auftritt, frischen wir unser Wissen zu Folgen und Reihen ein
wenig auf.
2.1
Folgen und Reihen
Zahlenfolgen haben große Bedeutung, welche z.B. darauf beruht, daß viele Zahlen wie
z.B. die Zahl e und andere Ausdrücke sich nicht exakt angeben lassen, sondern nur
durch geeignete Zahlenfolgen approximieren lassen. Auch bei vielen Beispielen aus Physik und Technik ist das Ergebnis der Grenzwert einer Zahlenfolge oder die Summe einer
Zahlenfolge. Eine Folge ist hierbei zunächst nichts anderes als eine Funktion, deren
Definitionsbereich die natürlichen Zahlen N sind.
2.1.1
Arithmetische Folgen und Reihen
Gewöhnlich werden die Glieder einer Folge in der Form an angegeben, wobei an die
Zahl ist, die der natürlichen Zahl n zugeordnet wird. Beispiele sind an = n oder bn = n1 .
Letztere konvergiert für n → ∞ gegen den Wert 0, d.h. limn→∞ bn = 0.
Eine Reihe
PN ist eine Folge, die durch Summen der Glieder einer Folge gebildet wird
SN = n=1 an . Arithmetische und geometrische Folgen und Reihen, denen wir uns im
folgenden zuwenden, sind von besonderer Bedeutung.
Ein sehr einfaches Beispiel einer Reihe ist die Summe der Folge natürlicher Zahlen
1, 2, 3, . . . :
SN =:
N
X
k = 1 + 2 + 3+ ...
k=1
Welchen Zahlenwert ergibt diese Summe? Probieren wir: 1 + 2 = 3 =
6 = 3·4
; 1 + 2 + 3 + 4 = 10 = 4·5
. . . Demzufolge scheint zu gelten
2
2
N
X
k=1
k=
N(N + 1)
2
.
2·3
;
2
1+2+3 =
(20)
Wir können dies überprüfen, indem wir wieder das Schema der vollständigen Induktion
verwenden. Für N = 1, 2, 3, 4 haben wir die Vermutung bereits bestätigt. Nehmen wir
an, wir hätten die Formel bis zu einem gewissen Wert N überprüft. Wir zeigen nun,
14
dass sie dann auch für N + 1 gilt:
N
+1
X
k =
k=1
N
X
k + (N + 1) =
k=1
N(N + 1)
+ (N + 1) =
2
N(N + 1) + 2N + 2
N 2 + 3N + 2
(N + 1)(N + 2)
=
=
.
2
2
2
Im 2. Schritt haben wir die Annahme, dass wir die Formel bereits für N überprüft
haben, genutzt. Damit gilt die Formel für alle natürlichen Zahlen N.
Bei dem vorhergehenden Beispiel handelt es sich um eine arithmetische Reihe. Allgemein sind diese dadurch bestimmt, dass die Differenz zweier beliebiger aufeinanderfolgender Glieder eine Konstante d ist, d.h.
=
an+1 − an = d ,
(21)
für alle n. Weitere Beispiele sind 1, 3, 5, 7, . . . (also d = 2) oder 1, 21 , 0, − 12 , . . . (also
d = − 21 ). Die Summenformel für arithmetische Zahlenfolgen ist
SN =
N
X
N
(a1 + aN ).
2
aν =
ν=1
2.1.2
(22)
Geometrische Folgen und Reihen
Bei einer geometrischen Zahlenfolge an ist der Quotient zweier aufeinanderfolgender
Glieder konstant, d.h.
an+1
= q.
an
Die Folge an = ( 21 )n−1 mit n = 1, . . . , N erfüllt das Kriterium der geometrischen
Zahlenfolge, denn an+1 /an = 1/2. Aber auch jede andere Folge aus Potenzen einer
Zahl b, wie an = bn−1 , erfüllt dieses Kriterium.
Nun wollen wir die Glieder der zugehörigen geometrischen Reihe berechnen. Es ist
a0 + a1 + a2 + . . . aN −1 = a0 (1 + q + q 2 + q 3 + . . . + q N −1 )
N
X
= a0
q n−1 = a0 SN .
(23)
n=1
Multiplizieren wir die Reihe SN mit q und subtrahieren davon wieder SN , erhalten wir
qSN − SN = (q − 1)SN = q N − 1
oder
SN =
N
X
ν=1
q
ν−1
1 − qN
=
.
1−q
15
(24)
y
5.0
2.5
x
− 1.0
− 0.5
0.5
1.0
Abbildung 8: Die Funktion f (x) = 1/(1 − x)
Ist zusätzlich q < 1, so konvergiert q n gegen 0: limn→∞ q n → 0. In diesem Fall konvergiert auch die Reihe. Es ist
lim SN = lim
N →∞
N →∞
N
X
q n−1 =
n=1
1
1−q
(25)
für |q| < 1.
Die geometrische Reihe ist ein Beispiel für die Reihendarstellung einer Funktion
f (x) =
1
1−x
,
siehe Abb. 8. Ein konkretes Zahlenbeispiel für die geometrische Reihe ist:
n
∞ ∞
X
X
4
1
1
= 3 .
=4
=
4
1
n
(−3)
−3
1
−
−3
n=0
n=0
(26)
(27)
Ein völlig anderes Ergebnis liefert dagegen folgende Summe:
∞
X
1
= ζ(a) .
a
n
n=1
(28)
Dies ist die Riemannsche Zeta-Funktion, die hier aber nicht weiter diskutiert werden
soll.
2.2
Die Exponentialfunktion
Enorm viele Prozesse in Natur und Gesellschaft, bei denen eine gewisse Größe y im
Laufe der Zeit ab- oder zunimmt, sind Wachstums- oder Schrumpfungsprozesse, deren
16
Änderung von y proprotional zum aktuellen Wert y(t) ist. Zum Beispiel ist die absolute Änderung einer Bakterienpopulation proportional zur momentanen Größe der
Population - eine größere Zahl produziert mehr Nachkommen. Schreitet man um einen
kleinen Zeitschritt ∆t voran, so wächst oder fällt die Funktion um ∆y(t). Diese kleine
Änderung ∆y(t) = y(t + ∆t) − y(t) ist auch noch proportional zum Zeitschritt ∆t, also
insgesamt
∆y(t) = y(t + ∆t) − y(t) = αy(t) · ∆t ,
(29)
wobei α eine vom aktuellen System abhängige Proportionalitätskonstante ist und Auskunft über die Stärke des Wachstums oder der Schrumpfung gibt.
Dieser Zusammenhang gilt nicht nur für Bakterienpopulationen. Liegt eine vorgegebene Menge radioaktiver Elemente vor, dann zerfallen absolut gesehen umso weniger
Elemente pro Zeiteinheit je weniger radioaktive Elemente vorhanden sind. Wenn man
sein Kapital anlegt, dann ist der Zuwachs pro Zeiteinheit auch umso größer, je größer
das eingesetzte Kapital ist. Dies sind alles ähnliche Wachstums- oder Schrumpfungsprozesse.
Die Frage ist nun, ob man mit Hilfe dieses lokal gültigen Änderungsgesetzes nicht auch
den Endzustand eines längerdauernden Prozesses bis zu einem beliebigen Zeitpunkt T
berechnen kann. Hierzu unterteilen wir das Intervall [0, T ] in k = 0, 1, . . . , m Teilintervalle mit den Intervallgrenzen tk = k∆t und ∆t = T /m. Setzen wir yk = y(tk ), so
erhalten wir folgende Näherungsgleichungen.
T
y1 ≈
1+α
y0 ,
m
2
T
T
y1 = 1 + α
y0 ,
y2 ≈
1+α
m
m
..
. m
T
y0 ,
y(T ) = ym ≈
1+α
m
T m
) y0 den Endzustand y(T ) umso besser beschreiben wird, je kleiner ∆t =
Da (1 + α m
T /m und je größer also m gewählt wurde, gilt
m
T
y(T ) = lim 1 + α
y0 .
m→∞
m
Mathematiker beginnen an dieser Stelle berechtigterweise damit, über die Existenz
dieses Limes nachzudenken. Wir fangen einfach an, ihn auszurechnen. Dazu fromen
wir ym noch etwas um, indem wir
m (m/αT )·(αT ) "
m/αT #αT
T
T
T
1+α
= 1+α
=
1+α
m
m
m
17
(30)
schreiben und uns um die innere Klammer kümmern. Insbesondere benötigen wir
n
m
1
,
wobei
n=
.
(31)
lim 1 +
n→∞
n
αT
Wie kann man diesen Ausdruck berechnen? Wie groß muß n werden, damit man den
Ausdruck hinreichend genau bekommt? Der Grenzübergang n → ∞ ist auch mit Rechenmaschinen schwer. Ein analytischer Zugang für den Grenzübergang ist daher sehr
nützlich.
Erinnern wir uns hierzu an die Binomischen Formeln aus der Schule: (a + b)2 = a2 +
2ab + b2 . Diese Gesetze sind auch für die n − te Potenz des Binoms erweiterbar. Hier
verwenden wir das Ergebnis
n n−2 2
n
n 0
n−1 1
a b
(a + b) = a b + na b +
2
n 0 m
n n−k k
ab ,
(32)
a b +
...+
n
k
um den Ausdruck (31) umzuformen. Die Klammern sind dabei eine Abkürzung für
n!
n
≡
,
(33)
k
k!(n − k)!
wobei das Symbol n! für das Produkt von n Zahlen
n! = 1 · 2 · . . . · n
steht und n Fakultät genannt wird. Die Fakulät ist eine sehr schnell wachsende Funktion: 2! = 2, 3! = 6, 4! = 24, 5! = 120, 6! = 720, 7! = 5040, 8! = 40320, 9! =
362880, 10! = 3628800, . . . . In guter Näherung läßt sich n! durch die Stirling-Formel
ausdrücken
√
n! ≈
2πn nn e−n ,
(34)
√
Diese Formel ergibt 10! = 3598697.76838632 und der relative Fehler ist (10! − 20 π ·
1010 · e−10 )/10! ∼ 0.0083, also bereits bei n = 10 kleiner als 1%.
Setzen wir nun die Formel (32) ein und formen den Ausdruck (31 ) wie folgt um
n
n 1
n 1
n 1
1
+
+
+ ...
= 1+
1+
2
n
2 n
3 n3
1 n
n!
n
=
und
,
2
2!(n − 2)!
n 1
n!
(n)! (n − 1) (n)
11
=
=
2 n2
2!(n − 2)! n n
2!(n)!
n
n
1 n−1
1
=
(
) ≈
für n → ∞ ,
2!
n
2!
18
n 1
3 n3
=
≈
usw.
n!
(n − 3)! (n − 2)(n − 1)n
1
=
3
3!(n − 3)! n
3!(n − 3)!
n·n·n
1
für n → ∞
3!
Der gesuchte Ausdruck in Gleichung (31) kann also durch eine Reihe, die sogenannte
Exponentialreihe, ausgedrückt werden,
n
∞
X
1
1
lim 1 +
= e = 2.7182818 . . .
(35)
=
n→∞
n
k!
k=0
Nun stellt sich die Frage, bis zu welchen Wert n man die Exponentialreihe aufsummieren muß, damit der Fehler so klein wie gewünscht wird. Eine Möglichkeit hierzu
wäre, für die Reihe einfach ein kleines Computerprogramm zu schreiben und dies bis
zu verschiedenen Werten von n aufzusummieren. Mit der folgenden Abschätzung geht
es aber noch schneller. Trennen wir nun die unendliche Reihe in zwei Teile,
n
X
1
+ rn+1
e=
k!
mit
rn+1
∞
X
1
=
,
k!
(36)
k=n+1
k=0
wobei rn+1 das Restglied genannt wird. Dessen Größe können wir abschätzen
1
1
1
1+
+
+ ...
rn+1 =
(n + 1)!
n + 2 (n + 2)(n + 3)
1
1
1
<
1+
+
+ ...
(n + 1)!
(n + 2) (n + 2)2
k
∞ ∞ k
X
X
1
1
1
1
<
=
(n + 1)! k=0 n + 2
(n + 1)! n=0 2
=
1
1
(n + 1)! 1 −
1
2
1
< 1 gilt, haben wir im vorletzten Schritt das Ergebnis für die geometrische
Da n+2
Reihe (25) eingesetzt. Insgesamt gilt also
rn+1 <
2
.
(n + 1)!
(37)
Nun haben wir eine bequeme Methode zur Berechnung von e und wir kennen nun auch
den Fehler, der z.B. für n = 15
r16 <
2
< 10−13
16!
beträgt.
Folgende Zahlenbeispiele sollen nochmals verdeutlichen, daß die Exponentialreihe viel
schneller konvergiert als der Ausdruck in (31).
19
n
Sn :=
n
P
k=0
2
4
6
12
105
107
1
k!
2,5
2,7083333333
2,7180555555
2,7182818282
-
an := 1 +
1 n
n
2.25
2,4414062500
2,5216263717
2,6130352901
2,7181459268
2,7182816925
Mit Gl. (30) und x = αT gilt offensichtlich
x n
= ex
lim 1 +
n→∞
n
(38)
und man nennt die x-te Potenz von e die Exponentialfunktion, wobei ebenso die
Schreibweise
exp(x) =: ex ,
gängig ist. Die Exponentialfunktion ist positiv und monoton wachsend wie auch bereits
in Abb. 3 zu sehen war.
Kommen wir zum Ausgangsproblem zurück. Wir können die Größe y nun auch für
größere Zeiten berechnen
y(T ) = eαT y0 ,
(39)
wobei y0 der Anfangszustand ist. Mit dem bisher Besprochenen und nach der Ersetzung
1 → x, sowie der Wiederholung der Rechenschritte folgt nun auch die Reihendarstellung
der Exponentialfunktion
x m x 2 m x 3
x m
x
e = lim 1 +
+
= 1+m
+
+ ...
m→∞
2
m
m
m
m
3
∞
X
1 k
=
x = exp(x) .
(40)
k!
n=0
2.3
Differentialgleichungen und die Exponentialfunktion
In Abschnitt 1.4 haben wir gesehen, daß die Ableitung einer Parabel y ′ = (x2 )′ = 2x
√
ist. Die Umkehrfunktion der Parabel ist x = y (für x > 0). Faßt man die beiden
√
Gleichungen zusammen, so folgt y ′ = 2 y. Wenn eine Ableitung selbst wieder durch
die ursprüngliche Funktion ausgedrückt wird, spricht man von einer Differentialgleichung.
20
10
y
8
−x
x
y=e
y=e
6
4
2
0
−2
−1
0
1
x
2
Abbildung 9: Die Funktionen ex und e−x .
Führen wir nun in Gl. (29) den Grenzprozeß ∆t → 0 aus, so folgt die Differentialgleichung
d
y(t) = αy(t)
(41)
dt
und mit Gl. (39) auch
d
y(t) = αy(t) = eαt y0 .
dt
Setzen wir noch α = 1, so ergibt sich mit
d
y(t) = y(t) = et y0
dt
auch
d t
e = et .
dt
(42)
Für beliebige Werte von α finden wir
d αt
e = αeαt .
dt
(43)
und für die n-malige Ableitung der Exponentialfunktion
dn αt
e = αn eαt .
dtn
(44)
Die Differentialgleichung (41) heißt linear, weil y in der Gleichung nur linear vorkommt
und z.B. keine Potenz oder eine Wurzel von y. Es ist eine Differentialgleichung erster
Ordnung, da nur die erste Ableitung vorkommt. Wie dieses einfache Beispiel bereits
21
zeigt, haben lineare Differentialgleichungen mit konstanten Koeffizienten Exponentialfunktionen als Lösung. Es lassen sich sehr viele Gesetzmäßigkeiten, wenn auch manchmal nur als Näherung, durch lineare Differentialgleichungen beschreiben. Aus diesen
Gründen ist die Exponentialfunktion ein ständiger Begleiter in den Naturwissenschaften.
2.4
Einige Rechenregeln für die Exponentialfunktion
Für eine reelle Zahl u gilt mit natürlichen Zahlen n1 und n2 als Exponenten
un1 un2 = un1 +n2 .
(45)
Wieder ein Beispiel zur Erinnerung: 23 · 22 = 8 · 4 = 32 bzw. 2(2+3) = 25 =32. Dies gilt
für die Zahl e ebenso und zwar auch für beliebige reelle Zahlen x, y im Exponenten
exp(x) exp(y) = exp(x + y) .
(46)
Werden also zwei Exponentialfunktionen miteinander multipliziert, so addieren sich
die Argumente. Lassen Sie uns diesen Zusammenhang beweisen f (x) = ex erfüllt die
Gleichung f ′ = f . Aber auch f (x) = ex+y erfüllt die Gleichung f ′ = f , allerdings jetzt
mit der Anfangsbedingung f (0) = c(y) = ey bei x = 0. Damit gilt für alle Werte von
x die Relation ex+y = c(y)ex = ey ex .
Hiermit kann man auch sofort auf folgende nützliche Regel schließen
exp(−x) =
1
exp(x)
(47)
und ebenso
(ex )n = ex · ex · . . . ex = enx .
(48)
Letzteres gilt nicht nur für natürliche Zahlen, sondern ebenso für reelle Zahlen r im
Exponenten
(exp(x))r = (ex )r = erx = exp(rx)
2.5
(49)
Der natürliche Logarithmus
Die Umkehrfunktion der Exponentialfunktion x = ey heißt natürlicher Logarithmus
und definitionsgemäß sind die beiden Gleichungen
x = ey
und
y = ln x
(50)
zueinander äquivalent. Entsprechend gilt x = eln x . Mit der Identität
eln(xy) = xy = eln(x) · eln(y) = enx + ny
22
(51)
folgt eine wichtige Rechenregel:
ln(xy) = ln(x) + ln(y) .
(52)
Bei einem wichtigen Problem der Physik vieler Teilchen (Statistische Physik) steht man
z.B. vor dem Problem, welchen Wert der Ausdruck
za − 1
a→o
a
(53)
R = lim
hat Auch hier sind Exponential-Funktion und der Logarithmus sehr hilfreich. Wir wissen bereits z = eln z . Dies bedeutet
z a = (eln z )a = ea ln z
.
(54)
Benutzen wir noch die Reihenentwicklung der Exponentialfunktion, so bekommen wir
für R
ea ln z − 1
=
a→o
a
2
z)2
z
1 + a ln
+ a (ln
+ ...− 1
1!
2!
= lim
a→o
a
a2 (ln z)2
a ln z + 2!
= lim
a→0
a
= ln z
R = lim
Ähnlich gelagerte Probleme wie z a kommen immer wieder vor.
23
(55)
3
Komplexe Zahlen und weitere elementare Funktionen
√
√
2
oder
2 = 1.4142.. waren schon den Griechen bekannt. Aber
Die Wurzeln wie 4 =
√
was macht man mit −1 ? Man trifft auf diese Wurzel aus einer negativen Zahl bei
der Suche nach der Lösung der scheinbar sehr einfachen Gleichung x2 + 1 = 0. Um mit
derartigen Problemen umzugehen, sind komplexe Zahlen
der Ausweg. Komplexe Zahlen
√
wurden aber nicht nur wegen des Problemes mit −1 eingeführt. Vielmehr erfuhren
durch deren Einführung im 16. Jahrhundert die Analysis und die Algebra eine große
Vereinfachung. Außerdem werden durch die komplexen Zahlen ganz verschiedene Teile
der Mathematik miteinander in Verbindung gesetzt. Auch die Beschränkung auf die
reelle Zahlenachse wird abgestreift. Dadurch werden viele Dinge überschaubarer. Eine
berühmte Relation ist die Euler-Beziehung
eix = cos x + i · sin x ,
(56)
durch welche auf einen Schlag Zusammenhänge zwischen scheinbar ganz verschiedenen
Funktionen aufgedeckt werden. Die volle Entfaltung findet diese Idee in der Funktionentheorie, in der Funktionen von komplexen Zahlen untersucht werden.
3.1
Wo treten komplexe Zahlen auf?
Obwohl komplexe Zahlen in sehr vielen Bereichen auftreten, begegnen sie uns am
natürlichsten als Wurzeln von Polynomen. Polynome treten laufend bei der Berechnung von Eigenwerten von Matrizen auf. Wie in Abschnitt 7.4 gezeigt wird, werden die
Eigenwerte z einer 2 × 2 Matrix durch eine quadratische Gleichung bestimmt:
Sie hat die beiden Lösungen1
z2 − b z + c = 0 .
z1/2 =
i
√
1 h
b ± b2 − 4c .
2
(57)
(58)
Wenn der Ausdruck unter der Wurzel positiv ist, also b2 −4c > 0 gilt, so sind die beiden
Lösungen reelle Zahlen. Für b2 − 4c < 0 steht man allerdings wieder wie oben vor dem
Problem, was die Wurzel einer negativen Zahl ist.
Verdeutlichen wir uns nochmals mit dem Zahlenbeispiel b = 4 und c = 5 in Abb. 10,
was das eigentliche Problem ist. Dort ist die Funktion f (z)
f (z) = z 2 − 4z + 5
für reelle Werte von z = x gezeigt. Man sieht, daß f (x) keine Nullstelle besitzt.
1
Zur Erinnerung: Gleichung (57) kann umgeschrieben werden in (z − b/2)2p
+ c − b4 /4 = 0 bzw.
2
2
2
(z − b/2)
p = b /4 − c. Zieht man daraus die Wurzel, so folgt z − b/2 = ± b /4 − c bzw. z =
b/2 ± b2 /4 − c .
24
y
4
2
y = x −4x+5
2
0
0
1
2
3
4
x
Abbildung 10: Die Funktion f (x) = x2 − 4x + 5.
Dasselbe Polynom kann sich aber z.B. bei der Berechnung der Schwingungsfrequenz
(auch Eigenfrequenz) eines Pendels oder eines elektrischen Schwingkreises, oder auch
bei der sogenannten Stabilitätsanalyse nichtlinearer und chaotischer Systeme (z.B. bei
der Analyse des Räuber-Beute-Verhaltens von Luchs und Schneehase etc.) und vielen
anderen Problemen ergeben. Dort wird man auf die Berechnung einer Determinate
einer Matrix A geführt, die selbst wieder verschwinden soll: Also D = det(A) = 0 ist
gefragt. Nehmen wir ein Beispiel für eine Matrix, wie sie typischerweise bei derartigen
Fragestellungen auftritt
z−2
1
,
(59)
A=
−1 z − 2
dann führt die Bedingung D = det(A) = 0 auf
D = (z − 2)2 + 1 = z 2 − 4z + 5 = 0 .
(60)
Während wir bei der Funktion f (x) evtl. damit leben können, daß diese keine Nullstelle
hat, sind wir bei der Berechnung der Schwingungsfrequenz eines Schwingkreises etc.
darauf angewiesen, daß Polynome wie in (60) eine Lösung haben.
Um mit diesem Problem fertig zu werden, wird die imaginäre Einheit i eingeführt.
√
−1 = +i
bzw.
i2 = −1 .
(61)
√
In Ingenieurbüchern schreibt man auch oft −1 = j, weil dort i als Symbol für den
Strom verwendet wird. Mit dieser Vereinbarung läßt sich nun auch für b2 − 4c < 0 eine
Lösung angeben
i
√
1 h
z1/2 =
b ± i 4c − b2 .
(62)
2
Ganz allgemein schreiben wir komplexe Zahlen in der Form
z = x + iy ,
25
(63)
wobei x und y reelle Zahlen sind. Man nennt x den Realteil
und y den Imaginärteil
√
von z. In dem vorigen Beispiel ist x = b/2 und y = ± 4c − b2 /2. Man schreibt für
den Real- und den Imaginärteil auch
x = Re(z)
und
y = Im(z).
(64)
Wenden wir uns nun den elementaren Rechenregeln komplexer Zahlen zu.
3.2
3.2.1
Die vier Grundrechenarten mit komplexen Zahlen
Addition und Subtraktion
Die Addition zweier komplexer Zahlen z1 und z2 ergibt im allgemeinen wieder eine
komplexe Zahl. Dabei werden die Realteile xi und die Imaginärteile yi separat addiert.
z1 + z2 = (x1 + iy1 ) + (x2 + iy2 ) = (x1 + x2 ) + i(y1 + y2 ) .
(65)
Dies hat eine gewisse Ähnlichkeit zu Vektoren, wo die Addition komponentenweise
ausgeführt wird siehe Abschnitt 6. Man kann sich auch sofort überzeugen, daß aus der
Gültigkeit des Assoziativ- und Kommutativgesetzes für die Addition reeller Zahlen,
diese Gesetze ebenso für komplexe Zahlen folgen.
z1 + z2 = z2 + z1
(Kommutativgesetz)
z1 + (z2 + z3 ) = (z1 + z2 ) + z3 (Assoziativgesetz)
3.2.2
(66)
(67)
Multiplikation
Die Multiplikation zweier komplexer Zahlen ergibt gewöhnlich auch wieder eine komplexe Zahl. Das Produkt wird erhalten, indem man alles ausmultipliziert und sich daran
erinnert, daß i2 = −1 gilt.
z1 z2 = (x1 + iy1 )(x2 + iy2 )
= x1 x2 + ix1 y2 + iy1 x2 + i2 y1 y2
= (x1 x2 − y1 y2 ) + i(x1 y2 + x2 y1 )
(68)
Das Produkt der beiden Zahl z1 = 3 + 2i und z2 = −1 − 4i ist demnach
z1 z2 = (3 + 2i)(−1 − 4i)
= −3 − 2i − 12i − 8i2
= 5 − 14i
Wie für reelle Zahlen, so gelten auch für die Multiplikation komplexer Zahlen das
Kommutativ- und das Assoziativgesetz
z1 z2 = z2 z1
(z1 z2 )z3 = z1 (z2 z3 ) .
26
(69)
3.2.3
Division
Der Quotient zweier komplexer Zahlen ist
z3 =
x1 + iy1
z1
=
z2
x2 + iy2
.
Dies möchte man natürlich wieder in der Form z3 = x3 + iy3 mit x3 , y3 ǫR darstellen
und erweitert hierfür einfach den Quotienten mit (x2 − iy2 ).
z1
(x1 + iy1 )(x2 − iy2 )
(x1 x2 + y1 y2 ) + i(x2 y1 − x1 y2 )
=
=
z2
(x2 + iy2 )(x2 − iy2 )
x22 + y22
x1 x2 + y1 y2
x2 y1 − x1 y2
=
+i
2
2
x2 + y2
x22 + y22
3.3
(70)
Komplex konjugierte Zahl
Zu einer komplexen Zahl z = x+ iy wird noch die komplex konjugierte Zahl z ∗ = x−iy
definiert.
Es gelten einige nützliche Rechenregeln. Für z = x + iy gilt
(z ∗ )∗ = z
z + z ∗ = 2x
z − z ∗ = 2iy
3.4
(71)
Betrag und Argument komplexer Zahlen
Da jede komplexe Zahl z = x + iy als geordnetes Paar reeller Zahlen betrachtet werden
kann, lassen sich solche Zahlen durch Punkte in der xy-Ebene, der sogenannten komplexen Ebene (Argand Diagramm) darstellen. Eine komplexe Zahl die z.B. durch den
Punkt P = (3, 4) in der xy-Ebene repräsentiert wird, kann daher als (3, 4) oder 3 + 4i
gelesen werden. Für jede komplexe Zahl gibt es genau einen Punkt in der Ebene, und
umgekehrt entspricht jedem Punkt der Ebene genau eine komplexe Zahl. Manchmal
bezeichnet man die x und y-Achse als relle bzw. imaginäre Achse und die komplexe
Ebene als z-Ebene.
Der Abstand des Punktes (x, y) vom Ursprung (0, 0) entspricht der Länge des Vektors
~r = (x, y), was wir als den Betrag der komplexen Zahl interpretieren.
p
(72)
| z |= x2 + y 2 .
Anders geschrieben
| z |=
√
z · z∗ =
p
(x + iy)(x − iy)
(73)
Mit dem Argument einer komplexen Zahl arg(z) wird der Winkel φ = arg z in Abb. 11
bezeichnet
y
(74)
arg(z) = arctan( ) .
x
27
y
P(x,y)
r
φ
x
Abbildung 11: Punkt P (x, y) in der komplexen Ebene
Durch Konvention wird dieser Winkel entgegen des Uhrzeigersinnes positiv gewählt.
Betrachten Sie z = 2 − 3i. Der Betrag dieser komplexen Zahl ist
p
√
| z |= 22 + (−3)2 = 13
und ihr Argument
3
arg(z) = arctan(− ) ∼ −56, 3◦ = −0.98279
2
3.5
Komplexe Zahlen und die Exponentialfunktion
√
Nachdem wir mit der Wurzel einer negativen √
Zahl −1 = i umzugehen gelernt haben, stellt sich die Frage, was machen wir mit i und ähnlichen Ausdrücken? Hierfür
wird sich die Exponentialfunktion mit einer komplexen Zahl im Argument als nützlich erweisen. Daher ist es an dieser Stelle ganz passend, daß wir bisher bei der Exponentialfunktion exp(x) noch wenig über das Argument x angenommen haben. Die
Reihendarstellung (40) gilt nämlich auch für komplexe Zahlen
∞
X
zk
e =
.
k!
k=0
z
(75)
Dies wird ihnen in der Mathematik noch genauer erklärt.
3.6
Die Polardarstellung komplexer Zahlen
Im folgenden wählen wir ω = iφ mit reeller Variable φ. In diesen Fall ist dann ω
rein imaginär und exp(ω) = exp(iφ). Wir nutzen nun die Reihendarstellung (75) der
28
Exponentialfunktion aus und schreiben davon die ersten Summanden hin
i
φ+
1!
i
exp (−iφ) = 1 − φ +
1!
exp (iφ) = 1 +
i2 2 i3 3
φ + φ + ...
2!
3!
2
i 2 i3 3
φ − φ + ...
2!
3!
,
.
(76)
Nutzen wir noch die Regel i2 = −1, so bekommen wir mit
i2 2 i4 4
φ + φ + . . .)
2!
4!
φ2 φ4
+
+ . . .)
= 2(1 −
2!
4!
exp (iφ) + exp (−iφ) = 2(1 +
(77)
wieder eine reelle Zahl! Offensichtlich sind für reelles φ die komplexen Zahlen z = eiφ
und z = e−iφ konjugiert komplex zueinander, also z ∗ = (eiφ )∗ = e−iφ . Demzufolge gilt
z + z ∗ = eiφ + e−iφ = 2 Re{eiφ }
z − z ∗ = eiφ − e−iφ = 2 Im{eiφ } .
(78)
Für den Betrag von eiφ folgt mit der Regel (72)
|z|2 = |eiφ |2 = zz ∗ = eiφ e−iφ = eiφ−iφ = e0 = 1
Offensichtlich beschreibt eiφ einen Kreis mit Radius 1 in der komplexen Ebene.
Mit z = x + iy = eiφ sieht man aus Abb. 11 daß x = cos φ und y = sin φ. Daraus folgt
die Eulersche Formel
cos φ + i sin φ = eiφ .
(79)
Hier sieht man nun auch, daß es sich z.B. für z = iφ = iωt bei eiωt um eine Schwingung
handelt. Die Exponentialfunktion in dieser Schreibweise ist daher bei der Untersuchung
schwingender Systeme unentbehrlich.
Insbesondere folgt man sofort
eiπ = −1,
eiπ/2 = i
und
ei0 = ei2π = 1.
Mit der Darstellung (79) kann man auch leicht eine altbekannte Formel neu ableiten
1 = |z|2 = (cos φ + i sin φ)(cos φ − i sin φ)
= cos2 φ + sin2 φ = 1 .
Darüberhinaus läßt sich jede komplexe Zahl in dieser sogenannten Polardarstellung
z = reiφ
schreiben, wobei r und φ reell sind. Das Argument arg(z) = φ ist in dieser Darstellung
trivial abzulesen.
29
Die Multiplikation und Division komplexer Zahlen wird in Polardarstellung ausgesprochen einfach. Das Produkt der komplexen Zahlen z1 = r1 eiφ1 und z2 = r2 eiφ2 ist mit
den Regeln (46) für die Exponentialfunktion
z1 z2 = r1 eiφ1 r2 eiφ2 = r1 r2 ei(φ1 +φ2 )
.
(80)
Daraus folgen auch unmittelbar |z1 z2 | = |z1 | · |z2 | und arg(z1 z2 ) = arg(z1 ) + arg(z2 ).
Insbesondere ist auch die Division komplexer Zahlen in Polardarstellung sehr einfach
z1
r1 eiφ1
r1 i(φ1 −φ2 )
r1 iφ1 −iφ2
=
e
e
=
e
=
iφ
z2
r2 e 2
r2
r2
.
(81)
Die Beziehungen |z1 /z2 | = |z1 |/|z2 | und arg(z1 /z2 ) = arg z1 − arg z2 folgen.
3.7
de Moivres Theorem
Ein recht wichtiges Theorem für sin und cos folgt aus der einfachen Identität (eiφ )n =
einφ . Schreibt man dies in der sin und cos Darstellung, so ist dies äquivalent mit
n
(cos φ + i sin φ)n = eiφ = einφ = cos(nφ) + i sin(nφ) ,
(82)
3.8
Trigonometrische Funktionen
Diese Verwandtschaft zwischen der Exponentialfunktion und den trigonometrischen
Funktionen werden Sie auf Schritt und Tritt durch Ihr Naturwissenschaftler- oder Ingenieurleben begleiten. Die Moivres Theorem läßt sich vorzüglich benutzen, um eine
Reihe von Beziehungen für trigonometrische Funktionen abzuleiten und zu berechnen.
Beginnen wir mit den komplexen Darstellungen von sin und cos
1 iφ
(e + e−iφ )
2
1 iφ
(e − e−iφ ) ,
(83)
sin φ =
2i
welche unmittelbar aus (79) und (78) folgen. Mit Gl. (76) erhält man auch Reihendarstellungen für cos und sin
cos φ =
cos φ =
sin φ =
∞
X
k=0
∞
X
k=0
1 2k
φ
(2k)!
1
φ2k+1
(2k + 1)!
(84)
.
(85)
Entsprechend folgt auch für tan und cot eine Exponentialdarstellung.
sin φ
1 eiφ − e−iφ
tan φ =
=
,
cos φ
i eiφ + e−iφ
cos φ
eiφ + e−iφ
cot φ =
= i iφ
.
sin φ
e − e−iφ
30
(86)
Ersetzt man nun φ = nΘ, so folgt auch für den n-fachen Winkel Θ zusammen mit
z = eiΘ
1 n
1
1 inΘ
−inΘ
z + n
e +e
=
cos(nΘ) =
2
2
z
1
1
1 inΘ
−inΘ
n
e −e
=
z − n
(87)
sin(nΘ) =
2i
2i
z
Anwendungsbeispiele
1) Überlagerung zweier Schwingungen gleicher Frequenz ω, welche gegeneinander Phasenverschoben sind. Die Gesamtschwingung ist dann
f (t) = A1 sin(ωt + ϕ1 ) + A2 sin(ωt + ϕ2 )
1 A1 ei(ωt+ϕ1 ) − e−i(ωt+ϕ1 ) + A2 ei(ωt+ϕ2 ) − e−i(ωt+ϕ2 )
=
2i
1
1 i(ωt+ϕ1 )
=
e
A1 + A2 ei(ϕ2 −ϕ1 ) − e−i(ωt+ϕ1 ) A1 + A2 e−i(ϕ2 −ϕ1 )
2i
2i
1 i(ωt+ϕ1 )
i(ϕ2 −ϕ1 )
e
A1 + A2 e
+ konj. komplex
=
2i
Nun kann man den Vorfaktor umschreiben und man erhält mit
−η A1 + A2 ei(ϕ2 −ϕ1 ) = A eiϕ
(88)
wieder eine komplexe Zahl, die sich leicht mit den bisherigen Regeln berechnen läßt.
Das Endsignal hat also die gleiche Frequenz, aber eine andere Amplitude und ist phasenverschoben
f (t) = A cos(ωt + ϕ) .
(89)
2) Betrachten wir einen Verstärker mit einem Input-Signal x(t) = x0 cos(ωt) und der
Eigenschaft, daß der Output mit dem Input wie folgt zusammenhängt
y(t) = B(x + f x2 ) = B(x0 cos(ωt) + x20 cos2 (ωt)) .
(90)
Um daran zu erkennen, welche Frequenzen im Output sind, muß man z.B. ausrechnen
wie cos2 (ωt) mit der ursprünglichen Frequenz zusammenhängt. Das Input- und Outputsignal ist für ein Zahlenbeispiel in Abb. 12 gezeigt.
3) Ein anderes Problem von großer Bedeutung betrifft die Überlagerung von zwei
Schwingungen mit zwei leicht verstimmten Frequenzen:
f (t) = A1 cos((ω + ∆ω)t + ϕ1 ) + A2 cos(ωt + ϕ2 ) .
(91)
Das Resultat ist eine Schwebung siehe Abb. 13. In der Akustik ist dieses Phänomen
gut hörbar.
31
1
x
0
0
5
10
15
t
Abbildung 12: Modellverstärker für den Input x(t) = 0.2 sin(t) (durchgezogene Linie)
und dem Output y(t) = 0.3 sin(t) + 0.5 sin2 (t). Ein ähnliches Verhalten zeigen auch
nichtlineare optische Frequenzverdoppler.
y
0
0
5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95100 105 110 115 120 125 130 135 140 145 150
t
Abbildung 13: Eine Überlagerung zweier leicht verstimmter Schwingungen y = cos(x) +
cos(1.1 x). Das Ergebnis ist eine Schwebung.
3.9
Additionstheoreme
Was ist z.B. mit Winkelsummen sin(x + y), die einem ständig über den Weg laufen?
Diese lassen sich mit Gl. (83) auch in Produkte von sin und cos umschreiben. Hierfür
sind die Exponentialdarstellung und die Euler Formel (79) besonders hilfreich.
sin(x + y) =
1 i(x+y)
e
− e−i(x+y)
2i
.
(92)
Von exp(i(x + y)) brauchen wir nur den Imaginärteil und zur Umformung dieses Ausdruckes verwenden wir die Produktregel für Exponentialfunktionen und die EulerFormel (79)
ei(x+y) = eix eiy = (cos x + i sin x)(cos y + i sin y)
= i(sin x cos y + cos x sin y) + cos x cos y − sin x sin y
32
(93)
Subtrahieren wir hiervon noch exp(−i(x + y)) so bleibt nur der Imaginärteil übrig.
Insgesamt bekommen wir dadurch
sin(x + y) = sin x cos y + cos x sin y
.
(94)
Oder man steht vor dem Problem sin 3Θ und cos 3Θ durch Potenzen von cos Θ und
sin Θ auszudrücken. Nutzen wir hierzu das Theorem von de Moivre. Wir erhalten
cos 3Θ + i sin 3Θ = (cos Θ + i sin Θ)3
= (cos3 Θ − 3 cos Θ sin2 Θ) + i(3 sin Θ cos2 Θ − sin3 Θ).
Vergleichen wir die die Real- und Imaginärteile auf beiden Seiten, so bekommen wir
cos 3Θ = cos3 Θ − 3 cos Θ sin2 Θ
= cos3 Θ − 3 cos Θ(1 − cos2 Θ)
= 4 cos3 Θ − 3 cos Θ
(95)
und
sin 3Θ = 3 sin Θ cos2 Θ − sin3 Θ
= 3 sin Θ(1 − sin2 Θ) − sin3 Θ
= 3 sin Θ − 4 sin3 Θ .
(96)
Ein weiteres Beispiel ist cos3 Θ, das wir mit z = eiΘ und Gl. (78) leicht berechnen
können
1
1
(z + )3
3
2
z
1
1
1 3
(z + 3z + 3 + 3 )
=
8
z z
1 3
1
3
1
=
(z + 3 ) + (z + )
8
z
8
z
3
1
cos(3Θ) + cos Θ
=
4
4
cos3 Θ =
(97)
Potenzen von sin x und cos x führen offensichtlich zu höheren harmonischen wie cos(3x)
und umgekehrt lassen sich höhere harmonische Funktionen durch Potenzen der Grundfrequenz ausdrücken. An dem oben genannten nichtlinearen Verstärker wird dann eine
Frequenzmischung deutlich. Auf diese und ähnliche Weise lassen sich eine Reihe weiterer nützlicher Beziehungen ableiten.
33
Einige nützliche Formeln
sin(x ± y) = sin x cos y ± cos x sin y
cos(x ± y) = cos x cos y ∓ sin x sin y
x−y
x+y
cos
cos x + cos y = 2 cos
2
2
x+y
x−y
cos x − cos y = −2 sin
sin
2
2
x+y
x−y
cos
sin x − sin y = 2 sin
2
2
x+y
x−y
sin x + sin y = 2 sin
cos
2
2
tan x = sin x/ cos x
2 tan x
sin(2x) = 2 sin x cos x =
1 + tan2 x
cos(2x) = cos2 x − sin2 x = 2 cos2 x − 1
sin(3x) = 3 sin x − 4 sin3 x
1
(1 − cos 2x)
sin2 (x) =
2
1
(1 + cos 2x)
cos2 (x) =
2
1
sin(x) cos(y) =
{sin(x − y) + sin(x + y)}
2
n
n
n−2
2
n
cosn−4 x sin4 x . . .
cos
x sin x +
cos(nx) = cos x −
4
2
r
1 − cos x
x
sin
= ±
2
2
r
x
1 + cos x
cos
= ±
2
2
2
1 = sin x + cos2 x
3.10
(98)
(99)
(100)
(101)
(102)
(103)
(104)
(105)
(106)
(107)
(108)
(109)
(110)
(111)
(112)
(113)
(114)
Die n-te Wurzel von 1
Die Gleichung z 2 = 1 hat die beiden bekannten Lösungen z = ±1. Nachdem uns die
komplexen Zahlen bekannt sind, können wir auch alle Lösung von z n = 1 beschaffen.
Nach dem Fundamentalsatz der Algebra gibt es für jedes Polynom n-ten Grades n
Lösungen. Wir wissen auch schon, daß
e2iπk = cos(2πk) + i sin(2πk) = 1
(115)
falls k ∈ Z Demzufolge können wir schreiben
z n = e2ikπ
34
(116)
oder
z = e2iπk/n
.
(117)
Dies bedeutet, die Lösungen von z n = 1 sind
z1,2,...,n = 1, e2iπ/n , . . . , e2i(n−1)π/n ,
(118)
wobei wir hier k = 0, 1, 2, . . . , n − 1 verwenden. Größere Werte von k ergeben keine
neuen Lösungen, sondern sind nur eine Duplizierung der vorhandenen Lösungen.
Betrachten wir als Beispiel die Lösungen der Gleichung z 3 = 1. Wenden wir nun Formel
(118) an, so erhalten wir z1 = 20i , z2 = e2iπ/3 , z3 e4iπ/3 . Für k = 3, also z4 = e6iπ/3 =
e2iπ = 1 = z1 , nur eine Wiederholung von z1 .
Es ist auch keine Überraschung, daß wir auch |z|3 = |z 3 | finden, da alle Wurzeln auf
dem Einheitskreis liegen und damit den Betrag 1 haben.
3.11
Der komplexe Logarithmus
Die Umkehrfunktion der Exponentialfunktion exp(x) = y ist der Logarithmus
x = ln y
(119)
falls x, yǫR siehe Abschnitt 2.5. Der Funktionsverlauf wurde in Abb. 3 gezeigt.
Der Logarithmus ist auch die Umkehrfunktion der Exponentialfunktion für komplexe
Zahlen. Für den Logarithmus einer komplexen Zahl z schreiben wir
w = ln z
mit
z = ew
(120)
Jetzt können wir die Regeln für die Exponentialfunktion ausnutzen, um den Logarithmus eines Produktes komplexer Zahlen
z1 · z2 = ew1 ew2 = ew1 +w2
(121)
ln(z1 z2 ) = w1 + w2 = ln(z1 ) + ln(z2 ) .
(122)
zu berechnen
Nehmen wir eine komplexe Zahl auf dem Einheitskreis, so wissen wir bereits, daß
z = eiφ = ei(φ+2πk) .
(123)
Diese Vieldeutigkeit wirkt sich auch auf den Logarithmus aus und es folgt
ln z = ln r + i(φ + 2π) .
(124)
Um die Vieldeutigkeit zu vermeiden, schränkt man das Argument arg(z) = φ auf
−π < φ ≤ π ein und nennt ln(z) bei dieser Einschränkung den Hauptwert.
Und was ist ln(−i)? Hier schreiben wir zuerst −i in Exponentialform um
π
ln(−i) = ln ei(−π/2+2nπ) = i − + 2πn
,
(125)
2
mit einer natürlichen Zahl n. Dies bedeutet ln(−i) = −i π2 , 3i π2 , . . . Für den Hauptwert
gilt ln(−i) = − π2 i.
35
3.12
Hyperbolische Funktionen
Was bedeutet eigentlich cos(iφ) oder sin(iφ)? Mit dieser Wahl eines rein imaginären
Argumentes im cos und sin werden die Exponente von e in Gl. (83) reell und es folgt
eine neue Klasse von Funktionen:
1 −φ
cos(iφ) =
(e + e+φ ) =: cosh φ
2
1 −φ
(e − e+φ ) =: sinh φ .
(126)
i sin(iφ) =
2
Die beiden Funktionen cosh φ und sinh φ bezeichnet man als ”Cosinus Hyperbolicus”
oder ”Hyperbelcosinus” bzw. ”Sinus Hyperbolicus” oder ”Hyperbelsinus”. Diese hyperbolischen Funktionen sind die komplexen Analoga zu den trigonometrischen Funktionen. Neben den beiden fundamentalen Funktionen gibt es in Analogie zu den trigonometrischen Funktionen die verbleibenden hyperbolischen Funktionen
ex − e−x
sinh x
= x
cosh x
e + e−x
cosh x
ex + e−x
coth x =
= x
sinh x
e + e−x
1
2
sechx =
= x
cosh x
e + e−x
2
1
= x
cosechx =
sinh x
e − e−x
tanh x =
,
(127)
siehe Abb. 14. Folgende Beziehungen zwischen trigonometrischen und Hyperbelfunktionen sind noch ganz hilfreich
cosh x
i sinh x
cos x
i sin x
=
=
=
=
cos(ix)
sin(ix)
cosh(ix)
sinh(ix) .
(128)
Ähnlich zu den Relationen zwischen verschiedenen trigonometrischen Funktion lassen
sich auch Hyperbelfunktionen durch andere Hyperbelfunktionen ausdrücken. Gehen
wir von cos2 x + sin2 x = 1 aus und benutzen (128) so folgt mit cosh2 x = cos2 (ix) und
sinh2 x = − sin2 (ix)
cosh2 x − sinh2 x = 1 .
(129)
Einige andere Identitäten können ebenso abgeleitet werden.
sech2 x
cosech2 x
sinh(2x)
cosh(2x)
=
=
=
=
1 − tanh2 x
coth2 x − 1
2 sinh x cosh x
cosh2 x + sinh2 x
36
(130)
5.0
y
5.0
y
5.0
y
cosech x
coth x
2.5
2.5
cosh x
sinh x
2.5
−2
sech x
−2
−1
1
x
−1
1
x
2
−2
−1
1
−2.5
−2.5
−5.0
−5.0
tanh x
2
2
x
Abbildung 14: Graphen der verschieden hyperbolischen Funktion deren analytische Darstellung im Text angegeben ist.
3.13
Hyperbolische Umkehrfunktionen – Areafunktionen
Die Umkehrfunktion von y = sinh x nennen wir x = arsinh y. Wir sind nun an der
expliziten Form dieses Ausdruckes interessiert. Hierfür drückt man ex durch Linearkombinationen von cosh x und sinh x aus.
ex = p
cosh x + sinh x
=
1 + sinh2 x + sinh x
p
=
1 + y2 + y .
(131)
Wenden wir auf beide Seiten den Logarithmus an, so folgt der explizite Ausdruck für
die Umkehrfunktion
p
x = arsinh(y) = ln( 1 + y 2 + y) .
(132)
Auf ähnliche Weise erhält man
p
x = arcosh(y) = ln( y 2 − 1 + y).
(133)
für |y| > 1. Die Umkehrfunktion von tanh(x) nennen wir analog artanh(y) und die
explizite Form ist
1+y
1
(134)
x = artanh(y) = ln
2
1−y
37
4
Funktionen und Ableitungen II
In diesem Abschnitt werden weitere Ableitungsregeln wiederholt. Zunächst berechnen
wir die Ableitungen der Funktionen aus dem vorigen Abschnitt. Darüberhinaus betrachten wir Reihendarstellungen dieser Funktionen sowie ein numerisches Verfahren,
um Ableitungen zu berechnen.
4.1
Ableitungen von Umkehrfunktionen
Neben einer Reihe von Funktionen sind nun schon eine Reihe von Umkehrfunktionen
definiert worden. Wir zeigen jetzt, wie sich die Ableitung einer Umkehrfunktion aus
der Ableitung der zugehörigen Funktion berechnen läßt.
Sei y = f (x) und x = g(y) die zugehörige Umkehrfunktion. Dann ist f (g(y)) = y. Die
Ableitung dieser Gleichung führt unter Benutzung der Kettenregel auf
df dg
d
f (g(y)) =
dy
dg dy
d
=
y
dy
= 1
Also ist
g ′ (y) =
1
f ′ (g(y))
.
(135)
(136)
Lassen Sie uns ein einfaches Beispiel betrachten. Sei f (x) = x/2 − 2. Dann ist g(y) =
2y + 4. Es gilt df/dx = 1/2 und dg/dy = 2. Also ist g ′ (y) = 1/f ′ (g(y)). Auch die Ableitung des Logarithmus läßt sich auf diese Weise erhalten: d ln x/dx = 1/ exp(y)|y=ln x =
1/x.
4.2
Ableitungen der trigonometrischen und der hyperbolischen
Funktionen
Die Ableitungen der trigonometrischen Funktionen berechnen unter Berücksichtigung
von Gl. (83) sich zu
1
1 d ix
d
e − e−ix =
ieix + ie−ix
sin x =
dx
2i dx
2i
= cos x
1
1 d
d
eix + e−ix =
i eix − i e−ix
cos x =
dx
2 dx
2
1
= −
eix − e−ix
2i
= − sin x ,
38
(137)
(138)
die der Hyperbolfunktionen analog zu
1 d
d
ex − e−x =
sinh x =
dx
2 dx
= cosh x
d
1 d
ex − e−x =
cosh x =
dx
2 dx
= sinh x .
1 x
e + e−x
2
(139)
1 x
e + e−x
2
(140)
Damit können wir die Ableitung der anderen trigonometrischen und hyperbolischen
Funktionen berechnen, z.B.
sinh2 x
d
sinh′ x sinh x cosh′ x
=
1
−
tanh x =
−
dx
cosh x
cosh2 x
cosh2 x
1
= 1 − tanh2 x =
.
cosh2 x
(141)
Wir zeigen nun noch an einigen Beispielen, wie die Ableitungen der Umkehrfunktionen
der trigonometrischen und der hyperbolischen Funktionen berechnet werden. Beginnen
wir mit arsinh. Die zugehörige ursprüngliche Funktion ist x = sinh y. Nach Gl. (136)
gilt
1
1
d
arsinhx =
=
′
dx
sinh (arsinhx)
cosh(arsinhx)
1
= q
1 + sinh2 (arsinhx)
= √
1
1 + x2
.
(142)
(143)
(144)
Auf dieselbe Art erhält man die Ableitung von artanhx:
1
1
d
artanh x =
=
′
2
dx
tanh (artanh x)
1 − tanh (artanh x)
1
=
1 − x2
39
(145)
(146)
Im folgenden finden Sie eine Zusammenstellung einiger wichtiger Ableitungen:
f (x)
f ′ (x)
Anmerkungen
xq
q xq−1
qǫR
eax
a eax
ln x
1/x
cos x
− sin x
sin x
cos x
1
cos2 (x)
tan(x)
−1
sin2 (x)
cot(x)
= (1 + tan2 (x))
= − (1 + cot2 (x))
(1 − tanh2 (x)) =
tanh(x)
− sinh12 x
coth(x)
arcsin(x)
arccos(x)
arctan(x)
arccot(x)
√ 1
1−x2
1
− √1−x
2
1
1+x2
1
− 1+x
2
artanh(x)
√ 1
1+x2
√ 1
x2 −1
1
1−x2
arcoth(x)
1
1−x2
arsinh(x)
arcosh(x)
4.3
1
cosh2 (x)
−1 ≤ x ≤ 1
x>1
|x| < 1
|x| > 1
Anwendungsbeispiel für den tanh(x)
Betrachten Sie die nicht-lineare Differentialgleichung
0 = u(x) +
ξ 2 d2
u(x) − u3 (x) .
2 dx2
(147)
Diese beschreibt in dieser oder in leicht veränderter Form Phänomene in Magneten
(Sprünge in der magnetischen Diplostärke), Defektstrukturen in Supraleitern oder Phasensprünge in der Konvektion (beispielsweise in Wolkenstraßen) und in anderen selbstorganisierenden chemischen oder biologischen Systemen.
Es ist eine nichtlineare Differentialgleichung und diese Gleichung hat die hyperbolische
Funktion u(x) = tanh(x/ξ) als Lösung. Dies können wir mit dem bisher gelernten
Stoff leicht nachprüfen, indem man den tanh(x/ξ) zweimal nach x ableitet. Die erste
40
Abbildung 15:
Ableitung ist oben bereits ausgeführt worden und leiten wir diese noch einmal ab und
bekommen dadurch
x
1 d
x
d2
2
=
1 − tanh
tanh
2
dx
ξ
ξ dx
ξ
2
x d
x
= − 2 tanh
tanh
ξ
ξ dx
ξ
x
x
2
2
1 − tanh
(148)
= − 2 tanh
ξ
ξ
ξ
Setzt man diese Ableitung ein und sammelt die Vorfaktoren von tanh(x/ξ) und tanh3 (x/ξ)
so verschwinden diese Vorfaktoren und damit ist gezeigt, daß tanh(x/ξ) eine Lösung
von (147) ist. Für x → ±∞ strebt tanh(x/ξ) → ±1. Die Breite des Übergangsbereiches
von −1 nach +1 wird durch die ”Länge” ξ bestimmt, welche in jedem der erwähnten
Systeme eine andere Bedeutung hat, siehe Abb. 15.
4.4
Regel von l’Hospital
Jetzt wollen wir noch daran erinnern, dass Ableitungen auch helfen können, Grenzwerte zu berechnen. Sind zwei Funktionen f (x) und g(x) in einer Umgebung von x0
∞
differenzierbar und ist limx→x0 f (x)/g(x) von der Form 00 “ bzw. ∞
“, dann ist
”
”
f (x)
f ′ (x)
= lim ′
x→x0 g(x)
x→x0 g (x)
lim
,
falls der letzte Grenzwert existiert. Ein Beispiel hierfür ist die Funktion
sich für x → 0 das Problem 0/0 ergibt
cos x
sin x
= lim
=1 .
x→0
x→0 x
1
lim
41
(149)
sin x
,
x
bei der
(150)
4.5
Taylor-Entwicklung von Funktionen in Potenzreihen
Mit der geometrischen Reihe und der Exponentialreihe haben wir bereits im Abschnitt
2 Darstellungen von Funktionen durch Potenzreihen kennengelernt. Wir werden jetzt
sehen, daß jede differenzierbare Funktion wenigstens lokal durch eine Potenzreihe dargestellt werden kann. Die zugrundeliegende Idee ist, daß wenn ich alle Ableitungen
einer Funktion f im Punkt x0 kenne, dann kenne ich f auch in einer Umgebung von
x0 .
Nehmen wir an, wir wollen eine Funktion f (x) in Form einer Potenzreihe mit Koeffizienten an für alle n = 0, 1, 2, 3, . . . darstellen:
f (x) =
∞
X
an xn
.
(151)
n=0
k
Für die Exponentialreihe wissen wir, dass an = xk! . Wie finden wir für eine beliebige
Funktion f die Koeffizienten durch formale Operationen an dieser Funktion?
Nun, wir differenzieren f (x) einmal, zweimal, dreimal etc. nach x, und setzen dann
x = 0. Hierbei sei f (n) die n-te Ableitung von f (x) nach x. Wir finden Folgendes:
f (0)
f (0)
f (2) (0)
f (3) (0)
f (4) (0)
=
=
=
=
=
..
.
(n)
f (0) =
(1)
a0
a1
2 · a2
3 · 2 · a3
4 · 3 · 2 · a4
n! an
.
(152)
Damit folgt die neue Darstellung der Funktion
f (x) =
∞
X
f (n) (0)
n=0
n!
xn = f (0) + f ′ (0)x +
1 ′′
f (0)x2 + . . .
2!
,
(153)
die sogenannte Taylor-Reihe von f .
Natürlich sind wir nicht auf diese Entwicklung um den Ursprung x = 0 fixiert. Durch
schlichte Verschiebung des Ursprungs nach x = b erhalten wir die Taylor-Reihe für
f (x) um den Punkt x = b:
f (x) =
∞
X
f (n) (b)
n=0
n!
(x − b)n = f (b) + f ′ (b)(x − b) +
1 ′′
f (b)(x − b)2 + . . .
2!
(154)
Wir haben damit ein wirksames Verfahren gefunden, um nahezu beliebige Funktionen
durch einfache Summen von Potenzen auszudrücken. Wir können diese Taylor-Reihen
42
y
f(x)
x2
x1
x0
x
Abbildung 16: Illustration des Newton-Verfahrens zur näherungsweisen Bestimmung
von Nullstellen. Für nähere Erläuterungen, siehe Text.
näherungsweise nach einer endlichen Anzahl von Termen abbrechen. Solche Potenzreihen sind beispielsweise auch sehr einfach zu integrieren.
Betrachten wir als Beispiel die Entwicklung von ln(1 + x) in der Nähe von x = 0. Wir
finden
ln(1 + x) |x=0 = ln(1) = 0
1 1
′
ln (1 + x) |x=0 =
=
1 + x x=0 2
1
1
′′
=−
ln (1 + x) |x=0 = −
2
(1 + x) x=0
2
..
.
(155)
(156)
(157)
(158)
Also ist ln(1 + x) = 12 x − 41 x2 + . . . Diese Entwicklung kann offensichtlich nur dann
sinnvolle Ergebnisse liefern, wenn x > −1 (tatsächlich muß |x| < 1 gelten).
Ein zweites Beispiel liefert ln(1 + x2 ):
ln(1 + x2 ) |x0
ln′ (1 + x2 ) |x=0
ln′′ (1 + x2 ) |x=0
= ln(1) = 0
2x =0
=
1 + x2 x=0
2(1 + x2 ) − 4x2 =
=2
x=0
(1 + x2 )2
..
.
(159)
(160)
(161)
(162)
Also ist ln(1 + x2 ) = x2 + . . . Diese Entwicklung gilt für alle x ∈ R.
4.6
Das Newton-Verfahren
Wir wollen jetzt noch ein Näherungsverfahren zur Nullstellenbestimmung vorstellen,
welches die Taylor-Entwicklung benutzt. Oftmals sind Stellen x∗ gesucht, an der eine
43
Funktion f verschwindet, f (x∗ ) = 0. Allerdings lassen sich die Nullstellen nur selten exakt angeben, wie z.B. bei der quadratischen Gleichung x2 + bx + c = 0. Man
ist dann auf Näherungsverfahren angewiesen. Das bekannteste ist wohl das folgende
von Newton angegebene Näherungsverfahren. Das Newton-Verfahren nutzt die TaylorEntwicklung der Funktion f (x) an einer Stelle f (xi ) aus und gibt eine Vorschrift an,
wie man sich an x∗ durch mehrmalige Iterationen herantastet. Als Startpunkt wird der
Funktionswert an einer Stelle x0 benötigt und deren Ableitung f ′ (x0 ). Damit kann die
Tangentengleichung
T0 (x) = f (x0 ) + f ′ (x0 )(x − x0 )
(163)
aufgestellt werden und man kann die Nullstelle x1 der Tangentenfunktion T0 (x1 ) = 0
bestimmen
f (x0 )
,
(164)
x1 = x0 − ′
f (x0 )
siehe Abb. 16. Im nächsten Schritt wird f (x1 ) und f ′ (x1 ) berechnet und es ergibt sich
mit
T1 (x) = f (x1 ) + f ′ (x1 )(x − x0 )
(165)
die Nullstelle x2 von T1 aus
x2 = x1 −
f (x1 )
f ′ (x1 )
.
(166)
Man fährt nun solange mit dem Iterationsschema
xi+1 = xi −
f (xi )
f ′ (xi )
(167)
fort, bis die Unterschiede zwischen xi+1 und xi und der Wert f (xi ) so klein sind wie
gewünscht. Der Startwert sollte bei diesem Verfahren schon gut geschätzt werden. Die
Funktion f muß außerdem in dem Intervall, in dem die Nullstelle und der Schätzwert
liegen, monoton sein (steigend oder fallend). Wenn die Funktion f (x) zwei nahe benachbarte Nullstellen besitzt oder wenn zwischen zwei Nullstellen eine Polstelle liegt,
ist eine gute Wahl des Schätzwertes besonders wichtig.
44
5
Integralrechnung
Zur Formulierung (nicht nur physikalischer) Gesetze spielt neben der Differentialrechnung auch die Integralrechnung eine bedeutende Rolle.
5.1
Das bestimmte Integral
Über das Integral berechnet man die Fläche unter einer Kurve. Formal schreibt man
für die Fläche I unter der Funktion f im Intervall [a, b]
Z b
I=
f (x)dx
(168)
a
Da in Gl. (168) die untere Grenze x = a und die obere Grenze x = b festgelegt (bestimmt) sind, spricht man von einem bestimmten Integral. Die Funktion f wird in
diesem Zusammenhang Integrand genannt.
Eine Näherung des Integrals folgt durch Unterteilung des Intervalles [a, b] in n Teilintervalle der Breite ∆x = (b − a)/n, der anschließenden Berechnung der Funktion f (x)
an den Stellen xk = a + k∆x (k = 1, 2, 3, . . . , n) und der Berechnung der Summe
n
X
f (xk )∆x ,
(169)
k=1
siehe Abb. 17. Bei numerischen Berechnungen von Integralen mit dem Computer wird
eine ähnliche Diskretisierung und Summenbildung vorgenommen. Der bei der Näherung der Fläche durch kleine Rechtecke begangene Fehler läßt sich bei analytischen
Betrachtungen durch Verkleinerung von ∆x oder entsprechend einer Erhöhung von n
minimieren. Tatsächlich ist das Riemannsche Integral über den Grenzwert ∆x → 0 in
der Summe (169) definiert. Beachten Sie, dass bei numerischen Rechnungen auf dem
Computer Rundungsfehler der einfachen Verkleinerung von ∆x zur Verbesserung der
Genauigkeit Grenzen setzen.
Wir wollen nun die Fläche unter der Parabel f (x) = x2 im Intervall [a,b] berechnen,
Rb
I = 0 x2 dx. Hierfür unterteilen wir die Fläche unter der Kurve f (x) = x2 zwischen 0
und b in n Rechtecke der Breite h. Die Fläche des k-ten Rechteckes ist
(kh)2 h = k 2 h3 .
Pn−1
Aufsummation aller Rechtecke liefert mit Hilfe der Summenformel k=0 k 2 = n(n −
1)(2n − 1)/6 die Gesamtfläche
A=
n−1
X
k=0
2 3
3
k h =h
n−1
X
1
k 2 = h3 n(n − 1)(2n − 1) .
6
k=0
Da h = b/n, läßt sich A weiter umformen
3
1
1
b3
n
b
1−
2−
.
(n − 1)(2n − 1) =
A=
n3 6
6
n
n
45
y=f(x)
dx
111
000
000
111
000
111
000
111
000
111
000
111
000
111
000
111
000
111
000
111
000
111
000
111
000
111
000
111
000
111
000
111
000
111
000
111
000
111
000
111
000
111
000
111
000
111
000
111
000
111
000
111
000
111
000
111
000
111
000
111
000
111
000
111
000
111
a
xi
x i+1
x
b
Abbildung 17: Das Integral als Fläche unter einer Kurve f (x) zwischen a und b.
Im Limes n → ∞ strebt der Wert der Fläche gegen A →
b3
.
3
Nun listen wir noch einige Regeln für bestimmte Integrale auf, die sich unmittelbar aus
der Summendarstellung (169) ableiten lassen
Zb
αf (x)dx = α
a
Za
f (x)dx
a
f (x)dx = −
Zc
Zb
b
f (x)dx =
a
[f (x) + g(x)]dx =
a
5.2
f (x)dx
Zb
a
Zb
Zb
f (x)dx +
f (x)dx
a
Zc
Zb
f (x)dx +
Zb
g(x)dx .
b
a
(170)
a
Das unbestimmte Integral
Die Integration kann auch als inverse Operation der Differentiation aufgefaßt werden.
Ist F ′ (x) = f (x), so heißt F (x) eine Stammfunktion von f (x). Prüfen wir dies kurz
nach und betrachten hierzu das Integral mit variabler Obergrenze x
F (x) =
Zx
f (u)du .
a
46
(171)
Jetzt berechnen wir F (x + ∆x)
F (x + ∆x) =
x+∆x
Z
f (u)du =
a
= F (x) +
Zx
f (u)du +
a
x+∆x
Z
f (u)du
x
x+∆x
Z
f (u)du .
x
Damit erhält man
1
F (x + ∆x) − F (∆x)
=
∆x
∆x
x+∆x
Z
f (u)du .
x
Für kleines ∆x unterscheidet sich f (u) mit u ∈ [x, x + ∆x] kaum von f (x) und das
Integral kann durch f (x)∆x genähert werden. Im Limes ∆x → 0 wird diese Näherung
exakt und man erhält
dF
= f (x)
(172)
F ′ (x) =
dx
oder auch
 x

Z
d 
f (u)du = f (x) .
(173)
dx
a
Diese Rechnung zeigt, daß die Integration als die inverse Operation zur Differentiation
betrachtet werden kann. Die Konstante a in (173) ist allerdings beliebig. Dies bedeutet, die Ableitung besitzt keine eindeutige Umkehrung. Jene Funktion F , die Gl. (172)
erfüllt, wird auch das unbestimmte Integral von f genannt, wobei F bis auf eine Integrationskonstante c bestimmt ist:
F (x) =
Zx
f (u)du + c
(174)
a
R
Häufig schreibt man einfach F = f (u)du + c. Auch das bestimmte Integral kann
durch die Stammfunktion F (x) ausgedrückt werden:
Zb
a
f (x)dx =
Zb
x0
f (x)dx −
Za
x0
f (x)dx = F (b) − F (a) .
(175)
wobei F ′ = f . Dieses ist der Hauptsatz der Differential- und Integralrechnung.
Während bei der Differentiation durch wiederholte Anwendung von Produkt- und Summenregel das entgültige Resultat für die Ableitung folgt, ist dies bei der Integration
47
nicht immer möglich. Für viele elementare Funktionen f (x) lassen sich die Stammfunktionen F (x) zwar berechnen, wie wir gleich sehen. Im allgemeinen lassen sich aber
keine geschlossenen Ausdrücke für Stammfunktionen angeben. In diesen Fällen bleibt
man auf die numerische Berechnung eines Integrals angewiesen.
5.3
Integration durch Ansehen
Für eine Reihe von Funktionen f (x) kann die Stammfunktion F (x) einfach durch
rückwärtslesen der Formeln in den Gleichung (137) ermittelt werden. Wir Rnotieren in
der Tabelle die Ausgangsfunktion f (x) und aus dem unbestimmten Integral f (x)dx =
F (x) + c nur die Stammfunktion F (x) ohne die Konstante c .
f(x)
F(x)
xn
1
xn+1
n+1
1
x
ln |x|
1
a
e(ax)
sin(ax)
n 6= −1
x 6= 0
e(ax)
− a1 cos(ax)
cos(ax)
1
a
sin(ax)
1
cos2 (ax)
1
a
tan(ax)
1
sin2 (ax)
- a1 cot(ax)
√ 1
1−x2
1
1+x2
arcsin(x)
1
1−x2
artanh(x) =
1
2
sinh(x)
sinh(x)
cosh(x)
1
sinh2 (ax)
√ 1
1+x2
√ 1
x2 −1
x 6= (2k + 1)π/a
|x| < 1
arctan(x)
cosh(x)
1
cosh2 (ax)
5.4
Anmerkungen
1
a
ln 1+x
1−x
|x| < 1
tanh(ax)
− a1 coth(ax)
√
arsinh(x) = ln x + 1 + x2
√
arscosh(x) = ln | x + x2 − 1 |
|x| > 1
Integration trigonometrischer Funktionen
R
R
Integrale vom Typ sinn (x)dx und cosn (x)dx können durch geeignete trigonometrische Umformungen berechnet werden. Hierzu zwei Beispiele: eines für gerades und eines
48
für ungerades n. In beiden Fällen wird der Integrand so umgeformt, ss der Integrand
die Ableitung einer Potenz vonR sin oder cos ist.
Betrachten wir zunächst I = sin5 x dx. Wir nutzen zu dessen Berechnung sin2 x =
1 − cos2 x aus. Damit folgt
Z
Z
4
I =
sin x sin x dx = (1 − cos2 x)2 sin x dx
Z
=
(1 − 2 cos2 x + cos4 x) sin x dx
Z
=
(sin x − 2 sin x cos2 x + sin x cos4 x)dx
= − cos x +
1
2
cos3 x − cos5 x + c ,
3
5
(176)
d
wobei wir im letzten Schritt
einfach dx
cos3 x = −3 sin x cos2 x etc. verwendet haben.
R
Betrachten wir nun I = cos4 x dx. Dieses Integral wird berechnet, indem wir cos2 x =
1
(1 + cos 2x) ausnutzen.
2
Z
Z
1
2
2
I =
(cos x) dx =
(1 + cos 2x)2 dx
4
Z
1
1 + 2 cos(2x) + cos2 (2x) dx .
(177)
=
4
Benutzt man zusätzlich cos2 (2x) = 12 (1 + cos 4x), so folgt
Z 1 1
1
I =
+ cos(2x) + (1 + cos(4x)) dx
4 2
8
1
1
1
1
x + sin(2x) + x +
sin(4x) + c
=
4
4
8
32
3
1
1
=
x + sin(2x) +
sin(4x) + c .
8
4
32
5.5
(178)
Integration durch Substitution
Durch Substitution kann oft ein kompliziertes Integral in ein einfacheres und manchmal
schon bekanntes Integral umgeformt werden. Zu erkennen, welche Substitution gerade
geeignet Rist,
√ ist oft eine Frage der Erfahrung.
2x + 1dx. Obwohl das Integral sehr einfach aussieht, zählt es nicht zu
Sei I =
den elementaren bisher bekannten Integralen. Durch die Substitution
z = 2x + 1 wird
√
dz
eine neue Variable eingeführt. Damit ist der Integrand nun z. Wegen dx
= 2 können
1
wir im Integral dx = 2 dz ersetzen.
Z
Z
√
1 √
2x + 1dx =
zdz
I =
2
1 3/2
1
=
z + c = (2x + 1)3/2 + c .
(179)
3
3
49
5.6
Logarithmische Integration
d
ln[f (x)] = f ′ (x)/f (x). Dies beAus dem Abschnitt über Differentiation wissen wir dx
deutet natürlich
Z ′
f (x)
dx = ln f + c
(180)
f (x)
Mit dieser Kenntnis kann man folgendes Integral leicht berechnen, an dessen Integranden zu erkennen ist, daß der Zähler proportional zur Ableitung des Nenners ist.
Z
6x2 + 2 cos x
I=
dx = 2 ln(x3 + sin x) + c .
(181)
3
x + sin x
5.7
Partielle Integration
Die partielle Integration ist die Analogie zur Differentiation eines Produktes. Das Prinzip ist, eine komplizierte Funktion in ein Produkt zweier oder mehrerer Funktionen
aufzuspalten, von denen die Stammfunktionen schon bekannt sind. Hierzu gehen wir
von der Produktregel (12) aus
dv du
d
(uv) = u + v
dx
dx dx
.
Durch Integration dieser Gleichung finden wir
uv|ba
=
Zb
dv
u
dx +
dx
a
Zb
du
v dx
dx
a
und durch Umstellen folgt die häufig gebrauchte Form
Zb
dv
u
dx = uv|ba −
dx
a
Zb
du
v dx .
dx
(182)
a
R
Berechnen wir mit dieser Regel zunächst I = x sin x dx. Hierzu identifizieren wir
dv
= sin x. Damit folgt v = − cos x und du
= 1. Nutzt man dies zusammen
u = x und dx
dx
mit Regel (182), so folgt
Z
I = x(− cos x) − (1)(− cos x)dx = −x cos x + sin x + c .
Nicht immer ist die Identifikation der
u und v so offensichtlich, wie das
R Funktionen
3 −x2
folgende Beispiel verdeutlicht, I = x e
dx. Hier identifizieren wir u = x2 und
2
2
dv
1
= xe−x . Dann haben wir v = − 2 e−x und du
= 2x und bekommen
dx
dx
Z
1 2 −x2
1
1
2
2
2
I =− x e
− (−x)e−x dx = − x2 e−x − e−x + c ,
2
2
2
50
2
dv
= xe−x ausgenutzt haben.
wobei wir im letzten Schritt nochmals dx
Ein weiterer Trick ist
R manchmal, die 1 als Faktor des Produktes dvzu identifizieren.
Betrachten Sie I = ln x, dx. Hier identifizieren wir u = ln x und dx = 1. Damit ist
v = x und du
= 1/x und wir bekommen
dx
Z 1
xdx = x ln x − x + c .
I = (ln x)(x) −
x
Bei Integranden der Gestalt xn eax für n ∈ N kann der Exponent n durch partielle
Integration erniedrigt werden:
Z
Z
1 n ax n
n ax
xn−1 eax dx .
In = x e dx = x e −
a
a
Dadurch erhält man die Rekursionsformel
1
n
In = xn cax − In−1
a
a
,
(183)
R
die In sukzessive auf I0 = eax dx = a1 eax zurückführt. Mit In hat man auch Stammfunktionen für xn eax cos bx und xn eax sin bx für a, b ∈ R. Ist c = a + ib, so gilt
Z
Z
n ax
x e cos bxdx = ReIn ,
xn eax sin bx dx = ImIn .
(184)
R√
Betrachten wir nun
1 − x2 dx . Mit dem angeführten Trick der 1 erhalten wir
Z
Z √
√
x(−2x)
2
2
√
1 − x · 1dx = x 1 − x −
dx
2 1 − x2
Z
Z
√
1 − x2
dx
2
− √
dx
= x 1−x + √
1 − x2Z
1 − x2
√
√
1 − x2 dx .
= x 1 − x2 + arcsin x −
Die gleichen Terme auf der linken und rechten Seite können nun zusammengefaßt werden und es folgt somit
Z √
1 √
2
2
x 1 − x + arcsin x
1 − x dx =
2
für x ∈ [−1; 1]. Ebenso berechnet man
Z √
1 √
1 + x2 dx =
x 1 + x2 + arsinh x
2
Z √
1 √ 2
2
x − 1 dx =
x x − 1 − arcosh x
2
wobei im letzten Fall x ∈ [1; ∞].
51
,
5.8
Integration durch Partialbruchzerlegung
Bei dieser Methode versucht man einen Integranden, der in der Form eines komplizierten Bruchs vorliegt, in eine Summe von zwei oder mehreren einfachen Brüchen zu
zerlegen, deren Stammfunktionen möglichst schon bekannt sind. Man bestimmt dazu
die reellen Nullstellen des Nenners und zerlegt den Bruch als Summe vonR Brüchen mit
nur einer Nullstelle im Nenner. Wir illustrieren das an dem Beispiel: x21+x dx. Die
B
. MultiplikatiNullstellen sind x = 0 und x = −1. Wir schreiben daher x21+x = Ax + x+1
on mit x bzw. x + 1 und Auswertung der so entstandenen Gleichungen bei x = 0 bzw.
x = −1 liefert:
1
B
=A+
x+1
x+1
A(x + 1)
1
=
+B
x
x
x=0
=⇒ A = 1
x=−1
=⇒ B = −1 .
(185)
1
geschrieben werden und wir
Damit kann der Integrand in der Form x21+x = x1 − x+1
erhalten
Z
Z 1
1
1
dx
dx =
−
x2 + x
x x+1
= ln x − ln(x + 1) + c
x
+c .
(186)
= ln
x+1
52
6
Vektoren
Viele physikalische Größen lassen sich durch eine Zahl zusammen mit einer physikalischen Dimension charakterisieren. Beispiele sind die Masse (m = 78 kg), die Energie
(E = 10 J), die Temperatur (T = - 177◦ C) oder die Zeit (t = 3 s). Solche Größen nennt
man skalare Größen.
Andere physikalische Größen wie etwa die Kraft, die Geschwindigkeit, die Beschleunigung usw. sind durch eine Richtung und einen Betrag gegeben, wobei der Betrag wieder
eine skalare Größe ist. Eine derartig gerichtete Größe beschreibt man ganz praktisch
und intuitiv durch einen Pfeil. Um eine Größe formal als Vektor zu kennzeichnen sind
verschiedene Konventionen gebräuchlich, z.B. ~v , v.
Das n-fache einer Kraft oder einer Geschwindigkeit wird durch einen Pfeil in gleicher
Richtung, aber mit der n-fachen Länge veranschaulicht, die Gegenkraft durch einen
Pfeil gleicher Länge, aber entgegengesetzter Richtung. Formal schreibt man ~k2 = n~k1 ,
bzw. ~k2 = −~k1 .
Greifen zwei Kräfte ~k1 und ~k2 in einem Punkt P an, so bewirken sie insgesamt dasselbe
wie eine einzige Kraft. Die resultierende Kraft ~kres ergibt sich geometrisch durch die
skizzierte Parallelogrammkonstruktion in Abb. 18. Dieses definiert die Vektoraddition
~kres = ~k1 + ~k2 .
6.1
Koordinatendarstellung von Vektoren
Eine gerichtete Größe durch einen Pfeil darzustellen, ist plausibel. Um damit auch
vernünftig rechnen zu können, muß man einem Pfeil Zahlen zuordnen. Hierzu müssen
erst einmal Vereinbarungen getroffen werden.
Wenn sie in einer Stadt jemandem die Lage einer in der Nähe liegenden Straße beschreiben, ist es häufig ganz praktisch, dies mit Hilfe der Anzahl von Abzweigungen zu
machen: an der dritten Kreuzung nach links abzweigen und dann die vierte Querstraße.
Beschreiben sie die Lage eines Objektes in einem Raum, so liegt es nahe, dies wie folgt
zu tun: von der Raumecke an der Eingangstür 2 Meter an der linken Wand entlang
und dann zu dieser Wand senkrecht 3 Meter nach rechts. Treffen sie die Vereinbarung,
ss die Wegstrecke nach rechts zuerst vor der Wegstrecke nach links genannt wird, so
können sie die Lage nun durch das Zahlenpaar (3, 2) Meter angeben. Wenn sie dies
mit der gemachten Vereinbarung richtig lesen, ist eigentlich über die Lage des Objektes alles gesagt. Jetzt können sie noch die Richtung an der linken Wand entlang die
kres
k1
a)
k2
b)
Abbildung 18: a) Ein Vektor für eine gerichtete Größe. b) Überlagerung von Vektoren.
53
3
y
(3,2)
2
k
1
1
2
3
x
Abbildung 19: Die Koordinaten (x = 3, y = 2) im kartesischen (x, y)-Koordinatensystem geben die Lage des Punktes P an. Andererseits beschreibt das Zahlenpaar auch
den Vektorpfeil ~r, der bei (0, 0) startet und bei (3, 2) endet.
y-Richtung nennen und die an der rechten Wand entlang x-Richtung und die Lage wie
in Abb. 19 veranschaulichen. Formal können sie die x- und y-Richtung wieder durch
Vektoren angeben, also ~ex und ~ey . Dann ist ~k = x~ex + y~ey für geeignete Zahlen x und y.
Die Zahlen x und y nennt man die Koordinaten des Vektors ~k in dem durch ~ex und ~ey
aufgespannten Koordinatensystem. Die Vektoren ~ex und ~ey sind dessen Basis. Es sind
viele verschiedene Koordinatensysteme möglich. Tatsächlich definieren zwei beliebige
Vektoren ~e1 und ~e2 ein Koordinatensystem in der Ebene, solange ~e1 6= α~e2 für alle
α ∈ R. Hat man sich auf ein Koordinatensystem geeinigt, so reicht die Angabe der
Koordinaten zur Bestimmung eines Vektors: ~k = (x, y).
Ganz analog liegt es im dreidimensionalen Raum nahe, anstelle eines ebenen Koordinatensystemes ein Koordinatensystem mit drei Raumachsen x, y und z einzurichten und
einen Punkt P im Raum bzw. einen Vektor ~r vom Ursprung zum Punkt
P durch ein
 
x
 
 
Zahlentripel (x, y, z) zu beschreiben. Manchmal ist es bequemer ~r =  y  zu schrei 
z
 
x
 
 
ben. Tatsächlich gibt es einen formalen Unterschied zwischen (x, y, z) und  y , der
 
z
hier aber nicht von Bedeutung ist. Besondere Koordinatensysteme sind die kartesischen Koordinatensysteme. Für diese stehen jeweils zwei Basisvektoren senkrecht
aufeinander und jeder Basisvektor hat die Länge 1. Wir beschränken uns zunächst auf
solche Koordinatensysteme.
54
k2
k1
k1
k2
Abbildung 20: Addition von Vektoren bzw. deren Verschiebung ist vertauschbar.
6.1.1
Länge eines Vektors
Für die Länge oder Norm eines Vektors schreibt man |r|. Es entspricht dem Abstand
eines Punktes P welcher durch r beschrieben wird vom Ursprung. Dessen Abstand läßt
sich in der Ebene mit den Regeln zur Berechnung der Hypothenuse eines Dreieckes
bestimmen.
p
(187)
| r |= x2 + y 2
Analog ist die Norm eines Vektors in 3 Dimensionen
p
| r |= x2 + y 2 + z 2
und für einen Vektor in N Dimensionen r = (x1 , x2 , . . . , xN ) ist die Länge
v
u N
uX
x2i .
| r |= t
(188)
(189)
i=1
6.1.2
Elementare Rechenregeln für Vektoren




x2
x1








Die Addition zweier Vektoren r1 =  y1  und r2 =  y2  sieht in Komponenten



z2
z1
schreibweise so aus


x + x2

 1


(190)
r1 + r2 =  y 1 + y 2  .


z1 + z2
Es ist daraus unmittelbar einsichtig, daß die Reihenfolge der Addition beliebig ist. Die
Summe ergibt immer den gleichen Endpunkt, was man sich leicht wie in Abb. 20 veranschaulichen kann. Es gilt also für Vektoren wie für reelle Zahlen das Kommutativgesetz.
r1 + r2 = r2 + r1
55
.
(191)
A
v
a
B
b
g
O
Abbildung 21: Parameterdarstellung einer Geraden.
Es gibt ein neutrales Element 0 :
r+0=r
(192)
und die Multiplikation eines Vektors mit einer Zahl a entspricht einer Multiplikation
der Komponenten des Vektors,


ax




(193)
ar =  ay  ,


az
was einer Verlängerung gleichkommt: |ar| = a|r| (a > 0). Ausserdem gilt für Vektoren
auch das Assoziativgesetz.
(a + b) + c = a + (b + c) .
6.2
(194)
Schnitte zweier Geraden
Seien A und B zwei verschiedene Punkte mit Ortsvektoren a und b und sei g die
Gerade durch A und B, so sind die Punkte von g durch die Ortsvektoren a + t(b − a)
mit t ∈ R gegeben. Hierfür schreibt man
g = {a + tv | tǫR}
(195)
wobei v = b − a. Man nennt g die Gerade durch den Punkt a mit Richtungsvektor v
in Parameterdarstellung.
Betrachten wir nun zwei Geraden
g = {a + x1 b | x1 ǫR} und f = {c + x2 d | x2 ǫR}.
56
(196)
Ist b = 0 und d = 0 so schneiden sich beide Geraden offensichtlich bei x1 = x2 = 0. Sind
aber b 6= 0 und d 6= 0, dann schneiden sich beiden Geraden nur, wenn die Bedingung
a + x1 b = c + x2 d
(197)
für geeignete Werte x1 und x2 erfüllt ist. Diese Bedingung bedeutet nichts weiter, als
ss beide Geraden einen gemeinsamen Punkt haben. Aus dieser Bedingung können wir
bei gegebenen Vektoren a, b, c, d die notwendigen Werte für x1 und x2 berechnen.
Schreiben wir die Vektoren in Komponentendartstellung








a1
b1
c1
d1
,
,
,

a=
b=
c=
d=
(198)
a2
b2
c2
d2
so wird offensichtlich, daß die Vektorgleichung (197) eigentlich zwei gekoppelte lineare
Gleichungen für die noch Unbekannten x1 und x2 bedeutet:
x1 b1 − x2 d1 = c1 − a1
x1 b2 − x2 d2 = c2 − a2 .
(199)
Identifiziert man a11 = b1 , a12 = −d1 , a21 = b2 , a22 = −d2 , f1 = c1 − a1 , f2 = c2 − a2 ,
so läßt sich Gl.(199) umschreiben in
a11 x1 + a12 x2 = f1
a21 x1 + a22 x2 = f2 .
Dies läßt sich nochmals kompakter als Matrix-Gleichung schreiben


 

a
a
x
f
 11 12   1  =  1  .
a21 a22
x2
f2
Mit der weiteren Abkürzung für die Koeffizientenmatrix


a11 a12

A=
a21 a22
(200)
(201)
(202)
kann Gl. (201) in die Form
Ax = f
(203)
gebracht werden, an der man auf den ersten Blick gar nicht mehr erkennt, um wieviele
gekoppelte lineare Gleichungen es sich handelt.
Damit hat sich hier im Falle des zweidimensionalen Raumes - zwei Unbekannte x1 und
x2 - neben dem Vektor mit der Matrix noch eine weitere Rechengröße aufgedrängt.
Analog können auch größere Systeme linearer Gleichungen in Matrixform geschrieben
werden.
57
Durch den Vergleich von Gl. (203) mit Gl. (200) erkennen wir, wie das Produkt einer
Matrix A mit einem Vektor ausgeführt wird. Erstens erkennt man an Gl. (203), daß Ax,
also (Matrix × Vektor), wieder ein Vektor ist. In der ersten Zeile dieses resultierenden
Vektors stehen die ausmultiplizierten Faktoren der ersten Zeile der Matrix mit dem
Vektor x, nämlich a11 x1 + a12 x2 , und das Produkt der zweiten Zeile der Matrix mit
dem Vektor x, a21 x1 + a2 x2 , steht in der zweiten Komponente. Multiplikationen von
mehrkomponentigen Vektoren mit entsprechenden Matrizen werden auf dieselbe Weise
ausgeführt.
Wir versuchen nun das Gleichungssystem (199) bzw. (201) zu lösen und x1 und x2 zu
bestimmen. Hierfür eliminieren wir erst einmal x2 , indem wir die erste Gleichung in
(200) mit a22 und die zweite aus (200) mit a12 multiplizieren und dann beide voneinander subtrahieren. Dies ergibt
(a11 a22 − a21 a12 )x1 = a22 f1 − a12 f2 .
(204)
Entsprechend gibt a21 · (Zeile 1) - a11 · (Zeile 2)
(a12 a21 − a11 a22 )x2 = a21 f1 − a11 f2 .
(205)
Der Vorfaktor von x1 bzw. x2 in den beiden vorangegangen Gleichungen ist die Determinante der Matrix A aus Gl. (203)
det(A) = D = a11 a22 − a21 a12 .
(206)
Damit sehen wir, daß die beiden Gleichungen (204) und (205) gerade dann lösbar sind,
wenn die Determinante D verschieden von Null ist - ansonsten würden wir ja durch 0
dividieren. Diese Lösbarkeitsbedingung gilt auch in 3 und höheren Dimensionen, die
Berechnung der Determinante ist allerdings komplizierter.
Für D 6= 0 sind die beiden Lösungen
1
(a22 f1 − a12 f2 )
D
1
(a11 f2 − a21 f1 )
=
D
x1 =
x2
.
(207)
Ist die Determinante Null, so sind obige Gleichungssysteme entweder unlösbar oder die
Menge der Lösungspunkte (x1 , x2 ) enthält mindestens eine Gerade. Ist das Gleichungssystem (203) andererseits homogen, d.h. f = 0, dann gibt es zwei Möglichkeiten. Falls
D 6= 0, dann gibt es nur die Lösung x = 0. Falls die Determinate verschwindet, dann
gibt es Lösungen x 6= 0 dieses homogenen Gleichungsystems.
58
y
a
α
x
Abbildung 22: Vektor a = r(cos α, sin α) in Polarkoordinaten.
6.3
Polarkoordinaten
Neben kartesischen Koordinaten (x, y) kann in der Ebene ein durch die Pfeilspitze des
Vektors a gekennzeichneter Punkt auch durch den Abstand vom Ursprung, also der
Länge des Vektors r = |a|, und dem Winkel α zwischen dem Vektor und der x-Achse
beschrieben werden. Dies sind ebenfalls zwei Zahlen, r und α, wie die Anzahl der
Komponenten des Vektors a = (a1 , a2 ). Aus diesen Polarkoordinaten erhält man die
kartesische Koordinaten über die Beziehung


cos α
 ,
a = r
(208)
sin α
wobei −π ≤ α < π. Wegen cos2 α + sin2 α = 1 gilt dann nach Konstruktion für die
Länge |a| = r. In drei Dimensionen sind das Analogon die Kugelkoordinaten (gegeben
durch die Länge und 2 Winkel).
Polarkoordinaten von Vektoren in der Ebene sind eng mit der Polardarstellung von
komplexen Zahlen verbunden, siehe 3.6. Tatsächlich kann man jeden Vektor r = (x, y)
mit kartesischen Koordinaten x und y mit der komplexen Zahl x + iy identifizieren.
Eine weitere Darstellung von r ist also r = reiφ .
Betrachtet man noch einen zweiten Vektor




b1
cos β
 = rb 

b=
(209)
b2
sin β
mit rb = |b| und −π ≤ β < π, so stellt sich z.B. die Frage, welchen Winkel diese beiden
Vektoren a und b einschließen?
59
6.4
Skalarprodukt
Die Multiplikation eines Vektors mit einer Zahl führt zu einer Verlängerung desselben,
siehe Abschnitt 6.1.1. Für das Produkt zweier Vektoren kann man sich verschiedene
Möglichkeiten vorstellen. Das Skalarprodukt zweier Vektoren so definiert, ss das Ergebnis eine reelle Zahl, ein Skalar, ist. Das Skalarprodukt ermöglicht die Definition
eines Winkels ϕ zwischen zwei Vektoren.
Definition Skalarprodukt. Für N-dimensionale Vektoren a und b ist
a·b =
N
X
ai bi
.
(210)
i=1
Zum Skalarprodukt sagt man in der Literatur auch häufig Inneres Produkt.
Mit dem Skalarprodukt definiert man den Winkel zwischen a und b über
a · b = |a| |b| cos ϕ .
(211)
Mit a in Polardarstellung, a= r(cos α, sin α), und b = (1, 0) ist diese Definition unmittelbar einsichtig: a · b = r cos α. Dreht man beide Vektoren um einen Winkel β,
verändert aber den Winkel zwischen beiden nicht, dann sind die Lagen beider Vektoren
a = r(cos(α, β), sin(α + β)) und b = (cos β, sin β) und das Skalarprodukt von beiden
Vektoren muß unverändert bleiben. Man kann dies unmittelbar nachrechnen:

 

cos(α + β)
cos β
·

a·b = r
sin(α + β)
sin β
= r [cos(α + β) cos β + sin(α + β) sin β]
= r [(cos α cos β − sin α sin β) cos β + (cos α sin β + sin α cos β) sin β]
= r cos α cos2 β + sin2 β = r cos α .
(212)
Im dritten Schritt der Rechnung wurden Additionstheoreme für trigonometrische Funktionen verwendet.
Regeln für das Skalarprodukt
S1
S2
S3
a·b= b·a
a · (αb) = αa · b
a · (b + c) = a · b + a · c
60
kommutativ
assoziativ
distributiv
6.5
Vektorprodukt im R3
Im Gegensatz zum Skalerprodukt ergibt das Vektorprodukt einen Vektor. Der Begriff
des Vektorprodukts hat nur im dreidimensionalen Raum Bedeutung.
Definition Vektorprodukt. Für Vektoren




b
a
 1 
 1 




b =  b2 
a =  a2  ,




b3
a3
nennt man den Vektor

a b − a3 b2
 2 3

c := a × b =  a3 b1 − a1 b3

a1 b2 − a2 b1





(213)
(214)
das Vektorprodukt, Kreuzprodukt oder äußere Produkt von a und b.
Man kann zur Übung leicht nachrechnen, daß a·c = 0 und b·c = 0 gilt, also c senkrecht
auf a und b steht. Andere in der Literatur benutzte Notationen sind [a, b], [ab] oder
ab. Die Vektoren a, b, c bilden ein positiv orientiertes Dreibein, d.h. liegen im Raum
wie Daumen, Zeigefinger und Mittelfinger der rechten Hand (Dreifingerregel).
Eine nützliche Eigenschaft ist, daß die Länge von c dem Flächeninhalt des von a und
b aufgespannten Parallelogramms entspricht. Es ist also
|c| = |a| · |b| · sin ϕ,
(215)
wo 0 ≤ ϕ < π der Winkel zwischen den Vektoren a und b ist. Das kann man schnell
nachrechnen indem man die Quadrate davon betrachtet.
|a|2 |b|2 sin2 ϕ = |a|2 |b|2 (1 − cos2 ϕ) = |a|2 |b|2 − (a · b)2
= (a21 + a22 + a23 )(b21 + b22 + b23 ) − (a1 b1 + a2 b2 + a3 b3 )2
= (a2 b3 − a3 b2 )2 + (a3 b1 − a1 b3 )2 + (a1 b2 − a2 b1 )2 = |a × b|2
(216)
Aus der Definition ergeben sich auch noch folgende leicht nachrechenbare
Regeln für das Vektorprodukt
V1
V2
V3
V4
b × a = −a × b
a × (b + c) = (a × b) + (a × c)
a × (rb) = r(a × b)
(a × b) · a = 0 und (a × b) · b = 0
61
(217)
Für das angegebene Vektorprodukt gilt also das Kommutativgesetz, nicht. Stattdessen
gilt das in (V1) angegebene Gesetz. Auch das Assoziativgesetz gilt nicht. Jedoch gilt das
Distributivgesetz (V2) und damit eine der wichtigsten Regeln für eine Multiplikation
in einem Bereich, in dem auch eine Addition definiert ist.
Das Vektorprodukt tritt in Physik und Technik bei der Beschreibung des Drehimpulses,
der Bewegung eines starren Körpers sowie bei der Bewegung eines Elektrons in einem
Magnetfeld auf.
62
7
Lineare Systeme
Viele Probleme der Physik führen auf lineare Gleichungssysteme. In diesem Abschnitt
wird deren Verbindung mit Matrizen aufgezeigt. Dies geschieht am Beispiel von Systemen aus zwei Gleichungen.
7.1
Drehungen von Vektoren
Mit der Translation wurde bereits im vorigen Abschnitt eine einfache Transformation
eines Vektors beschrieben: r1 → r2 = r1 + v. Eine weitere Transformation, welche die
Länge des Vektors unverändert läßt, ist die Rotation um eine Winkel φ, r1 → r2 =
D(φ)r1 wie Abb. 23 dargestellt.
Diese Drehung läßt sich kompakt in der Polardarstellung komplexer Zahlen beschreiben
r1 = reiφ1
r2 = reiφ2
.
(218)
Wenn r2 aus r1 durch eine Drehung hervorgeht, dann ist der Drehwinkel φ sofort
offensichtlich
φ = φ2 − φ1 , mit r2 = r1 eiφ .
(219)
In kartesischen Koordinaten führt dieses Ergebnis auf zwei Gleichungen für die einzelnen Komponenten
x2 = cos(φ) x1 − sin(φ) y1
y2 = sin(φ) x1 + cos(φ) y1
(220)
(221)
.
y
r2
r1
φ
φ1
x
Abbildung 23: Drehung eines Vektors in der Ebene um den Winkel φ.
63
In Matrix-Schreibweise umformuliert werden diese Gleichungen zu

 


x
cos φ − sin φ
x
 2 =
 1 
y2
+ sin φ cos φ
y1
(222)
Dies kann noch kompakter in der Form
r2 = D(φ)r1
,
geschrieben werden, wobei

D(φ) = 
cos ϕ
− sin φ
+ sin φ
cos ϕ

.
(223)
det D(φ) = cos2 φ + sin2 φ = 1 .
(224)
Die Determinante der Drehmatrix D(φ) ist

Dieses Ergebnis gilt allgemein: für alle Matrizen D, die Vektoren im Raume drehen und
die Länge unverändert lassen, gilt det D = 1.
Wird im dreidimensionalen Raum die Drehachse als die z-Achse gewählt, so ist die
Darstellung der Drehung in drei Dimensionen




x
x
 1 
 2 




 y2  = Dz (φ)  y1 




z1
z2



x
cos φ − sin φ 0
 1 




(225)
=  + sin φ cos φ 0   y1 



z1
0
0
1
analog zu der Drehung in der Ebene.
7.2
Matrix-Multiplikation
Wenn wir nun nach der Drehung um den Winkel φ noch eine weitere Drehung um
den Winkel θ mit der Drehmatrix D(θ) ausführen möchten, so werden wir mit der
Multiplikation von Matrizen konfrontiert. Wird nämlich nach der ersten Drehung r2 =
D(φ)r1 noch die zweite Drehung mit der Drehmatrix D(θ) ausgeführt, so führt dies auf
r3 = D(θ)r2 = D(θ)D(φ)r1 . Da die Drehung auch in einem Schritt r3 = D(θ + φ)r1
möglich ist, ergibt sich offensichtlich die Matrix der Gesamtdrehung als das Produkt
der beiden Matrizen für die Einzeldrehungen D(θ + φ) = D(θ)D(φ). Allgemein läßt
64
sich das Produkt C von zwei 2 × 2-Matrizen A und B explizit für die Matrixelemente
Aij , Bij , Ci,j mit i, j = 1, 2 angeben
Cij =
2
X
Aik Bkj
.
(226)
k=1
Konkret gilt für D(φ) und D(θ) unter Benutzung der Regel für die Matrixmultiplikation
und den Additionstheoremen für sin und cos


cos θ cos φ − sin θ sin φ
− cos θ sin φ − sin θ cos φ

D(θ + φ) = 
sin θ cos φ + cos θ sin φ
− sin θ sin φ + cos θ cos φ


cos(θ + φ)
− sin(φ + θ)
 .
= 
(227)
sin(θ + φ)
cos(θ + φ)
Die zusammengesetzte Drehung ist wie erwartet tatsächlich auch in dieser Darstellung eine Addition der Drehwinkel. Es folgt sofort, ss hier D(θ)D(φ) = D(φ)D(θ). Im
allgemeinen jedoch kommutieren zwei Matrizen unter der Multiplikation nicht!
7.3
Transponierte und inverse Matrix
Zur jeder n×n Matrix A gibt es eine transponierte Matrix AT . Diese wird aus A erzeugt,
indem die Matrixelemente an der Diagonale gespiegelt werden. Die Transponierte der
in Gl. (235) definierten Drehmatrix ist


cos
φ
sin
φ

DT = 
(228)
− sin φ cos φ
Eine Matrix heißt invers zurMatrixA, wenn das Produkt mit dieser die Einheits1 0
. Es gilt IA = AI = A. Die folgende Matrixmatrix I ergibt, wobei I = 
0 1
−1
Bestimmungsgleichung für A
A−1 A = I
(229)
ist bei 2 × 2 Matrizen äquivalent zu 4 linearen Gleichungen für die 4 Matrixelemente
von A−1 . Diese sollen nun berechnet werden.
Ist die Ausgangsmatrix


a b

A = 
(230)
c d
65
so werden die Elemente der inversen Matrix


v
v
1
2

A−1 = 
v3 v4
(231)
nach Gl. (229), also durch die Gleichungen


 

v v
a b
1 0
 1 2 
=

v3 v4
c d
0 1
(232)
oder
av1 + cv2 = 1 ,
av3 + cv4 = 0 ,
bv1 + dv2 = 0
bv3 + dv4 = 1 .
(233)
bestimmt.
Eliminiert man zuerst v3 und v1 so folgen unmittelbar zwei Ausdrücke für v4 und v2 ,
womit auch gleich v3 und v1 bestimmt werden können. Insgesamt bekommt man für
die inverse Matrix


d
−b
1

 .
(234)
A−1 =
ad − bc
−c a
Für obige Drehmatrix ist damit

D−1 = DT = 
cos φ
sin φ
− sin φ cos φ


.
(235)
Die Äquivalenz D−1 = DT zeichnet die Drehmatrizen aus. Diese Eigenschaft zusammen
mit det D = 1 definiert die sogenannten orthogonalen Matrizen.
Unter Benutzung der inversen Matrix kann das lin. Gleichungssystem (203) leicht gelöst
werden:
x = A−1 f
.
(236)
Da die Inverse von A nur existiert, falls det A 6= 0, finden wir hier die Lösbarkeitsbedingung aus 6.2 wieder.
66
7.4
Eigenwerte und Eigenvektoren
Die Drehmatrizen in drei Dimensionen lassen Vektoren entlang der Drehachse offensichtlich unverändert. Zum Beispiel läßt die Matrix aus Gl. (225) den Vektor ez =
(0, 0, 1) unverändert, Dz (φ)ez = ez unabhängig vom Wert φ. Allgemeiner nennt man
Vektoren, die bei Multiplikation mit einer Matrix ihre Richtung nicht ändern, Eigenvektoren der Matrix. Der Betrag, um den sich ihre Länge ändert, nennt man den
zugehörigen Eigenwert.
Formal werden die Eigenvektoren r und Eigenwerte λ einer Matrix A durch die Eigenwertgleichung
Ar = λr
bestimmt. Für eine 2 × 2-Matrix hat sie die Form

 
 
a b
x
x

  = λ .
c d
y
y
Bringt man alles auf eine Seite, so nimmt dies die Form

   
a−λ
b
x
0
  =   = 0
(A − λI)r = 
c
d−λ
y
0
(237)
(238)
(239)
an. Diese Gleichung hat nur dann Lösungen x, y 6= 0, wenn die Determinante der
Matrix sf A − λI verschwindet. Die Gleichung det (A − λI) = 0 führt auf ein Polynom
2. Grades in λ
(a − λ)(d − λ) − cb = λ2 − (a + d)λ + ad − cb = 0 .
(240)
Die beiden Lösungen dieses quadratischen Polynomes sind die beiden Eigenwerte der
Matrix A
p
1
a + d ± (a + d)2 − 4(ad − cb)
λ1,2 =
2
p
1
=
a + d ± (a − d)2 + 4cb)
(241)
2
Diese sind reell, wenn (a − d)2 + 4cb > 0. Andernfalls sind die beiden Eigenwerte
komplex konjugiert zueinander.
Die Vektoren r1,2 , die für λ1,2 die Eigenwertgleichung
Ar1,2 = λ1,2 r1,2
(242)
erfüllen sind die beiden Eigenvektoren. Da auch ein gestreckter Vektor αr mit α ∈ R
diese Eigenwertgleichung erfüllt, ist eine Komponente des Eigenvektors frei wählbar.
Wählt man x1,2 = 1, so folgt als Bestimmungsgleichung für die zweite Komponente
y1,2 =
λ1,2 − a
.
b
67
(243)
Häufig werden Eigenvektoren auf die Länge 1 normiert. Die Eigenwerte orthogonaler
Matrizen sind zueinander orthogonal. Sind die Eigenwerte komplex, so werden auch
die Eigenvektoren komplex.
Beispiel 1: a = 1, b = 2, c = 2, d = 1. Die Eigenwerte sind in diesem Fall λ1 = 3 und
λ = −1. Für die korrespondierenden normierten Eigenvektoren finden wir
 


1
1
1
1
 .
r2 = √ 
(244)
r1 = √   ,
2
2
1
−1
Es ist an diesem Beispiel zu sehen, daß diese beiden Eigenvektoren orthogonal zueinander sind r1 · r2 = 0, obwohl die Matrix selbst nicht orthogonal ist.
Beispiel 2: a = 1, b = 2, c = −2, d = 1. In diesem Falle sind die beiden Eigenwerte
komplex: λ1 = 1 + 2i und λ = 1 − 2i. Die Eigenvektoren hierzu sind
 


1
1
1
1
 .
r1 = √   ,
r2 = √ 
(245)
2
2
i
−i
68
8
Wahrscheinlichkeitsrechnung
8.1
Wahrscheinlichkeiten
Bei vielen Experimenten läßt sich der Ausgang nicht mit Bestimmtheit vorhersagen.
Dennoch weisen sie eine gewisse Regulation auf. Dies ist z.B. beim Würfeln der Fall:
Man erwartet, dass in etwa 61 der Fälle der Wurf die 6 ergibt.
Bei dieser Art von Ereignissen A können wir also eine Wahrscheinlichkeit P (A) angeben, mit der das Ereignis eintritt. Für P (A) gilt P (A) = nnAS wobei nA die Anzahl der Ereignisse A angibt und nS die Gesamtzahl aller möglichen Ereignisse S und
ns , nA ≫ 1.
8.2
Eigenschaften der Wahrscheinlichkeit
Unabhängig von dem betrachteten System besitzen die Wahrscheinlichkeiten folgende
Eigenschaften:
(i) Für ein beliebiges Ereignis A im Konfigurationsraum F gilt
0 ≤ P (A) ≤ 1
(246)
(ii) Für die Gesamtwahrscheinlichkeit aller möglichen Ereignisse S gilt
P (S) =
nS
=1
nS
(247)
(iii) Die Zahl der Ereignisse bei denen A oder B auftritt ist
nA∪B = nA + nB − nA∩B
,
(248)
wobei nA∩B die Zahl der Ereignissen angibt bei denen A und B gemeinsam auftreten. Damit gilt für die Wahrscheinlichkeit
P (A ∪ B) = P (A) + P (B) − P (A ∩ B)
(249)
Lassen Sie uns für (iii) ein Beispiel betrachten. Wir suchen die Wahrscheinlichkeit
dafür, aus einem Skat-Kartenspiel zufällig ein Pik oder einen Buben zu ziehen. Da es 8
Pik-Karten, 4 Buben und einen Pik-Buben gibt, gilt nS = 32; nP = 8; nB = 4; nB∩P = 1
und damit P (P ∪ B) = P (P ) + P (B) − P (P ∩ B) = 8/32 + 4/32 − 1/32 = 11/32.
8.3
Bedingte Wahrscheinlichkeiten
Bislang haben wir nur Wahrscheinlichkeiten betrachtet, die die relative Häufigkeit angeben, ss Ereignis A eintritt. Häufig ergeben sich aber auch Fragestellungen, bei denen
man die Wahrscheinlichkeit dafür sucht, ss Ereignis B eintritt unter der Bedingung,
69
ss vorher A eingetreten ist. Man spricht dann von einer bedingten Wahrscheinlichkeit. Um bei dem Kartenbeispiel zu bleiben: Was ist die Wahrscheinlichkeit dafür zwei
Asse hintereinander aus einen Kartenstapel zu ziehen? Solche bedingten Wahrscheinlichkeiten schreiben wir in der Form P (B|A).
Wie berechnet man bedingte Wahrscheinlichkeiten? Die Wahrscheinlichkeit, ss A und
B auftreten, sei gegeben durch P (A ∩ B) = P (B ∩ A). Dann gilt
P (A ∩ B) = P (A) P (B|A) = P (B) P (A|B) .
(250)
Also gilt für die bedingte Wahrscheinlichkeit
P (A ∩ B)
P (B)
P (A|B) =
und
P(B|A) =
P(B ∩ A)
P(A)
.
(251)
Für den Fall, dass sich zwei Ereignisse ausschließen gilt:
P (A|B) = 0 = P (B|A)
(252)
Lassen Sie uns diese Ergebnisse auf das Beispiel mit den zwei Assen anwenden. Bei
einem solchen Experiment muß man zwischen zwei Fällen unterscheiden. Im ersten
Fall wird die erste gezogene Karte wieder zurückgelegt bevor die zweite gezogen wird
(Sampling mit Ersetzen), im zweiten Fall nicht (Sampling ohne Ersetzen). In unserem
Beispiel erhält man
(i) mit Zurücklegen
1
64
;
(253)
3
1 3
·
=
8 31
248
.
(254)
P (A ∩ B) = P (A) P (B|A) = P (A)2 =
(ii) ohne Zurücklegen
P (A ∩ B) = P (A) P (B|A) =
Von statistischer Unabhängigkeit zweier Ereignisse spricht man, wenn P (A|B) =
P (A). Daraus folgt sofort, ss in diesem Fall
P (A ∩ B) = P (A)P (B) .
Eine nützliche Eigenschaft ist die folgende Normierungsbedingung
X
P (B) =
P (A) P (B|A)
(255)
(256)
A
falls die Summe über alle Ereignisse A läuft.
Aus der Identität P (A) P (B|A) = P (A∩B) = P (B) P (A|B) folgt direkt das Bayes’sche
Theorem:
P (A)
P (A|B) =
P (B|A) ,
(257)
P (B)
70
welches die Basis für einen ganzen Zweig der Statistik bildet. Bevor wir den Nutzen
des Theorems an einem Beispiel illustrieren, stellen wir noch eine Umformulierung des
Theorems vor. Sie ist immer dann nützlich, wenn die Einzelwahrscheinlichkeit P (B)
nicht bekannt ist. Aus der Normierungsbedingung erhalten wir
P (B) = P (A) P (B|A) + P (A) P (B|A) ,
(258)
wobei P (A) die Wahrscheinlichkeit ist, ss A nicht eintritt. Damit lautet dann (257):
P (A|B) =
P (A) P (B|A)
P (A) P (B|A) + P (A)P (B|A)
.
(259)
Betrachten wir als Beispiel einen Bluttest, der mit 99,99 % Wahrscheinlichkeit ein
positives Ergebnis aufweist, wenn ein Patient infiziert ist. Für nichtinfizierte Menschen ist der Test mit Wahrscheinlichkeit 0.02% positiv. Die Krankheit tritt in einer
Gruppe von 10.000 Menschen einmal auf. Nun wird zufällig ein Mensch ausgewählt
und positiv getestet. Wie groß ist die Wahrscheinlichkeit, dass er tatsächlich infiziert
ist? Sei P (A) die Wahrscheinlichkeit der Infektion und P (B) die Wahrscheinlichkeit
9999
1
, P (A) = 1 − P (A) = 10000
,
für einen positiven Test. Dann gilt also P (A) = 10000
9998
2
P (B|A) = 1 − P (B|A) = 10000 und P (B, A) = 10000 . Damit folgt durch Anwendung
von Bayes’ Theorem für die Wahrscheinlichkeit einer Infektion bei einem positiven Test
P (A) P (B|A)
P (A) P (B|A) + P (A) P (B|A)
1/10000 · 9998/10000
=
(1/10000 · 9998/10000) + (9999/10000 · 2/10000)
1
.
(260)
≈
3
Trotz der großen Zuverlässigkeit des Tests, ist die Unsicherheit nach dem Test also
immer noch sehr groß. Dies liegt darin begründet, ss die Krankheit so selten auftritt.
P (A|B) =
8.4
Permutationen und Kombinationen
Zur Berechnung von Wahrscheinlichkeiten ist es also nötig, die Häufigkeit zu bestimmen, mit der ein Ereignis auftritt. Häufig kann dieses Problem in der folgenden Form
formuliert werden: Man betrachte n Objekte, die alle paarweise verschieden sind. Auf
wie viele Arten kann man die Objekte auf n Plätze verteilen? Anders gefragt: wieviele
Permutationen dieser Objekte gibt es?
Das Ergebnis lässt sich einfach herleiten: Bei der Anordnung des ersten Objekts gibt
es n Möglichkeiten, bei der Anordnung des zweiten bleiben (n − 1) Möglichkeiten usw.,
so ss sich insgesamt n(n − 1)(n − 1) . . . 2 · 1 = n! verschiedene Möglichkeiten ergeben.
Wenn wir nur k ≤ n Objekte ohne Zurücklegen aus den n Objekten auswählen, so gibt
es insgesamt
n!
n(n − 1)(n − 2) . . . (n − k + 1) =
≡ Pkn
(261)
(n − k)!
71
Varianten, die alle zu derselben Menge von ausgewählten Objekten führen. Mit Zurücklegen gibt es nk Varianten.
Mit diesen Überlegungen können wir nun bestimmen, wie groß ist die Wahrscheinlichkeit dafür ist, ss in einer Gruppe von k Personen zwei am gleichen Tag Geburtstag
haben. Die Gesamtzahl aller möglichen Geburtstagskombinationen ist nk = 365k , die
Anzahl der Kombinationen ohne Überschneidungen (entspricht dem Fall ohne Zurücklegen) ist Pkn . Daraus erhalten wir für die gesuchte Wahrscheinlichkeit P
Pkn
365!
=
k
365
(365 − k)! 365k
√
n
Mit der Stirling-Formel n! ≈ 2πn ne erhalten wir
1−P =
−k
P ≈1−e
365
365 − k
.
365−4+0.5
(262)
(263)
Für k = 23 gilt bereits P > 12 und für k = 50 gilt p ≈ 0.97!
Wenn die Reihenfolge der Anordnung keine Rolle spielt, so gilt für die Zahl der Möglichkeiten:
 
n
h!
≡ Ckn =   ,
(264)
(n − k)!k!
k
wobei 0 ≤ k ≤ n. Damit erhalten
 wir
 dann auch sofort den verallgemeinerten binomin
n
P
  ak bn−k : die Binomialkoeffizienten Ckn geben
schen Lehrsatz (a + b)n =
k=0
k
an, auf wieviele Arten man k a’s und n − k b’s anordnen kann.
Abbildung 24: kumulative Wahrscheinlichkeitsfunktion
72
8.5
Kontinuierliche Zufallsvariablen und Verteilungen
Bisher haben wir nur Systeme betrachtet, die eine diskrete Menge von Ereignissen besitzen. Die Zufallsvariable X kann in diesem Fall nur die Werte X1 , . . . , Xn mit den
Wahrscheinlichkeiten P1 , . . . , Pn annehmen. Wir können eine Wahrscheinlichkeitsfunktion definieren, die die folgende Gestalt hat

 P falls x = X
i
i
f (x) = P (X = x) =
.
(265)
 0 sonst
Die Wahrscheinlichkeitsfunktion ist normiert, denn es gilt
auch die kumulative Wahrscheinlichkeitsfunktion
X
F (x) = P (X ≤ x) =
f (xi )
n
P
f (xi ) = 1. Wir können
i=1
(266)
xi ≤x
definieren, die beide in Abb. 24 für das Beispiel eines Würfels illustriert sind.
Diese Funktionen bringen kaum Vorteile, wenn man sich auf diskrete Zufallsvariablen beschränkt, sind aber von großer Bedeutung bei kontinuierlichen Zufallsvariablen.
Wenn die Wertemenge einer Zufallsvariable nicht mehr abzählbar ist, werden die Wahrscheinlichkeiten über eine Wahrscheinlichkeitsdichte f (x) bestimmt. Für diese gilt,
ss die Wahrscheinlichkeit, dass die Zufallsvariable χ zwischen x und x + dx liegt, durch
P (x < χ ≤ x + dx) ≡ f (x)dx gegeben ist. Außerdem gilt die Normierungsbedingung
R∞
f (x)dx = 1, denn es ist sicher, ss irgendein Ereignis eintritt. Ist χ auf das Intervall
−∞
Rx
[x1 , x2 ] beschränkt, so gilt x12 f (χ)dχ = 1. Die Wahrscheinlichkeit, ss χ einen Wert im
Rb
Intervall [a, b] annimmt ist P (a ≤ χ ≤ b) = a f (x)dx.
Die kumulative Verteilung ist durch
Z x
F (x) = P r(χ ≤ x) =
f (χ)dχ
(267)
x1
gegeben. Also ist P (a ≤ χ ≤ b) = F (b) − F (a).
Lassen Sie uns noch anmerken, ss die Wahrscheinlichkeitsdichte auch von mehr als
einer Variablen abhängen kann. In diesem Fall ist
P (x = xi ; y = yj ) = f (xi , yj ) ,
(268)
P (x < χ ≤ x + dx, y < η ≤ y + dy) = f (x, y)dxdy .
(269)
bzw.
Bei statistischer Unabhängigkeit der Variablen χ und η faktorisiert die Verteilungsfunktion, d.h. f (x, y) = g(x)h(y).
73
8.6
Statistische Größen
Sei g eine Funktion der Zufallsvariable χ, die eine Wahrscheinlichkeitsdichte f besitze.
Dann ist der Erwartungswert E[g] von g definiert über

 P g(x )f (x ) für eine diskrete Verteilung
i
i
i
E[g] =
.
(270)
R
 g(x)f (x)dx für eine kontinuierliche Verteilung
Aus dieser Definition lassen sich folgende Eigenschaften des Erwartungswertes leicht
ableiten:
(i) Falls a eine Konstante ist, gilt E[a] = a.
(ii) Für eine beliebige Konstante gilt a E[ag] = aE[g].
(iii) Falls g(x) = h(x) + k(x), so ist auch E[g] = E[h] + E[k]
Der Erwartungswert der Funktion g(x) = x wird auch der Mittelwert der Verteilung
f genannt. Also

 P x f (x ) für diskrete Verteilungen
i
i i
hxi =
.
(271)
R
 xf (x)dx für kontinuierliche Verteilungen
Andere Schreibweisen sind E(x) oder [x]. Der Mittelwert einer Verteilung gibt häufig
den typischen Wert der zugehörigen Zufallsvariable an.
Neben den Mittelwert wird eine Verteilung auch oft durch den Median xmed charakterisiert. Das ist der Wert für den P (χ ≤ xmed ) = 1/2.
Bei Zufallsprozessen ist es auch wichtig, die Fluktuationen um den Mittelwert zu charakerisieren. Üblicherweise wird dazu die Varianz verwendet. Sie wird definiert als

 P (x − hxi)2 f (x ) für diskrete Verteilungen
i
i i
2
E[(x − hxi) ] =
. (272)
R
 (x − hxi)2 f (x)dx für kontinuierliche Verteilungen
Eine alternative Notation ist σ 2 oder auch V [x]. Ein weiteres Maß für die Fluktuationen
ist die mittlere absolute Abweichung
Z
Eabs = E[|x − hxi|] = |x − hxi|f (x) dx .
(273)
Betrachten wir ein Beispiel aus der Atomphysik. Die Wahrscheinlichkeit, ein Elektron
im Wasserstoffatom im Volume dV zu finden ist durch ψ ∗ ψdV gegeben, wobei ψ(x, y, z)
die quantenmechanische Wellenfunktion bezeichnet. Bei der Lösung der Schrödingergleichung für dieses Problem stellt sich heraus, ss die Wahrscheinlichkeit nur vom Abstand zum Atomkern abhängt. Es ist ψ = Ae−r/a0 . Für die radiale Wahrscheinlichkeitsdichte ergibt sich denn insgesamt
2
−2r/a0
P (r < R ≤ r + dr) = |A2 e{z
}4πr
| {z dr}
ψψ∗
74
V olumen
(274)
Die Konstante A bestimmen wir aus der Normierungsbedingung
A2
Z∞
e−2r/a0 4πr 2 dr = 1 .
(275)
0
Dieses Integral können wir durch partielle Integration lösen. Es folgt A =
2 −2r/a0
f (r) = 4a−3
0 r e
.
1
,
πa30
so ss
(276)
Der mittlere Abstand des Elektrons vom Kern ist somit
hri =
Z∞
0
4
rf (r)dr = 3
a0
Z∞
r 3 c−2r/a0 dr =
3a0
2
.
(277)
0
Schließlich können wir noch die Varianz σ 2 berechnen
σ
2
Z∞
=
(r − hri)2 f (r) dr
(278)
0
4
= 3
a0
Mit hri =
8.7
3a0
2
ergibt sich σ 2 =
Z∞
(r 4 − 2r 3 hri + r 2 hri2 )e−2r/a0 dr
.
(279)
0
3a20
.
4
Die Gauß-Verteilung
Sehr viele Systeme werden durch die Gauß-Verteilung beschrieben. Diese hat die Form
1
(x − x0 )2
(280)
fσ (x) ≡ √
exp −
2σ 2
2πσ 2
mit dem Mittelwert x0 und der Varianz σ 2 .
Eine besondere Eigenchaft der Gauß-Verteiliung f σ ist der schnelle asymptotische Abfall. Zum Beispiel treten Fluktuationen der Größe 10σ nur mit einer Wahrscheinlichkeit
kleiner als 2 × 10−23 auf.
Die Bedeutung der Gauß-Verteilung ergibt sich aus dem zentralen Grenzwertsatz: Seien
χi mit i = 1, 2, . . . , n unabhängige Zufallsvariablen, die durch die Wahrscheinlichkeitsdichten fi (x) beschrieben werden. Diese können alle verschieden sein. Die Mittelwerte
2
der Verteilungen seien mP
i und die Varianzen σi .
n
Die Zufallsvariable ζ = ( i=1 χi ) /n besitzt die folgenden Eigenschaften
P
(i) E(ζ) = ( ni=1 mi )/n = m
75
2
(ii) V [ζ] ≡ σ =
n
P
i=1
σi2
/n2
(iii) Für n → ∞ ist die zugehörige Wahrscheinlichkeitsdichte eine Gauß-Verteilung
mit Erwartungswert m und Varianz σ 2 .
Damit werden unkorrelierte Summen von Zufallsvariablen unter sehr allgemeinen Bedingungen durch Gauß-Verteilungen beschrieben.
76
9
Literatur
Da die hier behandelte Mathematik nicht wesentlich über die Schulmathematik hinausgeht, sollten Sie alles Wesentliche in Ihren Schulbüchern finden. Falls Sie schon etwas
weiterlesen möchten, so seien Ihnen die folgenden beiden Bücher empfohlen:
• S. Großmann, Mathematischer Einführungskurs für die Physik, B.G. Teubner
Verlag, Wiesbaden
Das Buch ist von einem Physiker geschrieben und bietet ausführliche Erklärungen
der Methoden, ohne größere mathematische Beweise.
• K. Jähnich, Mathematik. Geschrieben für Physiker, Springer-Verlag, Heidelberg
Die beiden Bände behandeln einen Großteil der Mathematik, wie sie im Grundstudium gelehrt wird. Dabei wird ein guter Mittelweg zwischen mathematische
Strenge und dem Bedürfnis der Physiker nach anwendbarem Wissen gefunden.
Der Autor ist Mathematiker.
Es sei darauf hingewiesen, dass kein Buch allen Wünschen und Bedürfnissen gerecht
werden kann. Bevor Sie sich eines anschaffen, sollten Sie ausprobieren, wie Sie mit ihm
zurechtkommen.
Darüberhinaus ist es empfehlenswert, sich ein Nachschlagewerk anzuschaffen. Unter
Physikern erfreut sich die folgende Formelsammlung großer Beliebtheit
• I. Bronstein, K. Semendjajew, Taschenbuch der Mathematik, Verlag Harri Deutsch,
Frankfurt
Dort sind nahezu alle Regeln gesammelt, die irgendwo in Mathematikvorlesungen
besprochen werden und mehr.
77