Skript

Werbung
Albert-Ludwigs Universität Freiburg
Skriptum zur Vorlesung
Mathematik für Studierende der
Naturwissenschaften
Susanne Knies
12. Juni 2017
Dieses Skript soll nicht die Vorlesung ersetzen. Es erhebt auch keinen Anspruch auf
Vollständigkeit. Es soll den Studierenden lediglich ein Hilfe sein, anhand einer
Zusammenfassung die Vorlesung nachzuarbeiten. Falls Sie beim Lesen Fehler finden, einfach
eine Email an susanne.knies at math.uni-freiburg.de.
Vielen Dank.
2
Inhaltsverzeichnis
1 Grundbegriffe und Grundlagen der Kombinatorik
1.1 Grundbegriffe . . . . . . . . . . . . . . . . . .
1.1.1 Mengennotation . . . . . . . . . . . .
1.1.2 Quantoren . . . . . . . . . . . . . . . .
1.2 Grundlagen der Kombinatorik . . . . . . . . .
1.2.1 Permutationen (Anordnungen) . . . .
1.2.2 Variationen . . . . . . . . . . . . . . .
1.2.3 Kombinationen . . . . . . . . . . . . .
1.2.4 Allgemeine binomische Formel . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
6
6
6
9
10
10
11
12
13
2 Folgen und Reihen
2.1 Folgen . . . . . . . . . . . . . .
2.1.1 Konvergenz von Folgen
2.1.2 Die Fibonacci-Folge . .
2.2 Reihen . . . . . . . . . . . . . .
2.2.1 Endliche Reihen . . . .
2.2.2 Unendliche Reihen . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
17
17
19
24
26
26
27
.
.
.
.
.
.
.
.
.
.
.
32
32
32
34
36
38
41
42
43
44
46
49
.
.
.
.
.
.
.
.
50
50
53
53
55
60
60
60
63
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
3 Funktionen
3.1 Grundlagen . . . . . . . . . . . . . . . . . .
3.1.1 Elementare Begriffe . . . . . . . . .
3.1.2 Umkehrfunktion und Verkettung von
3.2 Polynome . . . . . . . . . . . . . . . . . . .
3.3 Rationale Funktionen . . . . . . . . . . . .
3.4 Die allgemeine Potenzfunktion . . . . . . .
3.5 Die allgemeine Exponentialfunktion . . . . .
3.5.1 Exponentialfunktion zur Basis e . .
3.6 Die allgemeine Logarithmusfunktion . . . .
3.7 Trigonometrische Funktionen . . . . . . . .
3.8 Sigmoidfunktionen . . . . . . . . . . . . . .
.
.
.
.
.
.
. . . . . . .
. . . . . . .
Funktionen
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
4 Differentialrechnung
4.1 Grenzwert einer Funktion, Stetigkeit . . . . .
4.2 Ableitung einer Funktion . . . . . . . . . . .
4.2.1 Definition der Ableitung . . . . . . . .
4.2.2 Ableitung der elementaren Funktionen
4.3 Anwendungen der Differentialrechnung . . . .
4.3.1 Lokale Extrema . . . . . . . . . . . . .
4.3.2 Mittelwertsatz/Monotonie . . . . . . .
4.3.3 Die Regel von de l’Hospital . . . . . .
3
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Inhaltsverzeichnis
4.3.4
4.3.5
Taylorpolynome . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Anwendung auf Extremwerte . . . . . . . . . . . . . . . . . . . . . . . .
5 Integralrechnung
5.1 Definition und Eigenschaften des Integrals . . . .
5.2 Hauptsatz der Differential- und Integralrechnung
5.2.1 Der Hauptsatz . . . . . . . . . . . . . . .
5.2.2 Stammfunktionen elementarer Funktionen
5.3 Integrationsregeln . . . . . . . . . . . . . . . . . .
5.3.1 Partielle Integration . . . . . . . . . . . .
5.3.2 Integration durch Substitution . . . . . .
5.3.3 Der ln - Trick . . . . . . . . . . . . . . . .
5.3.4 Integration rationaler Funktionen . . . . .
5.4 Uneigentliche Integrale . . . . . . . . . . . . . . .
5.5 Die Kreisfläche . . . . . . . . . . . . . . . . . . .
66
69
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
72
72
76
76
78
79
80
82
83
84
85
87
6 Stochastik
6.1 Vorüberlegungen . . . . . . . . . . . . . . . . . . . . . . .
6.1.1 Relative Häufigkeit (Empirischer Ansatz) . . . . .
6.1.2 Laplace-Wahrscheinlichkeit (Theoretischer Ansatz)
6.2 Endliche Ergebnismengen . . . . . . . . . . . . . . . . . .
6.2.1 Notation . . . . . . . . . . . . . . . . . . . . . . . .
6.2.2 Bedingte Wahrscheinlichkeit . . . . . . . . . . . . .
6.2.3 Zufallsvariable . . . . . . . . . . . . . . . . . . . .
6.2.4 Erwartungswert, Varianz und Standardabweichung
6.2.5 Die Binomialverteilung . . . . . . . . . . . . . . . .
6.2.6 Die Poissonverteilung . . . . . . . . . . . . . . . .
6.3 Stetige Zufallsvariablen, die Normalverteilung . . . . . . .
6.3.1 Stetige Zufallsvariablen . . . . . . . . . . . . . . .
6.3.2 Die Gaußsche Normalverteilung . . . . . . . . . . .
6.3.3 Die N (µ; σ 2 ) - Verteilung . . . . . . . . . . . . . .
6.3.4 Die σ - Regeln . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
89
89
89
89
91
91
94
97
100
104
106
109
109
110
113
118
7 Lineare Algebra
7.1 Vektoren . . . . . . . . . . . . . . . . . . . . . . . .
7.1.1 Rechnen mit Vektoren . . . . . . . . . . . .
7.1.2 Winkel und Skalarprodukt . . . . . . . . .
7.1.3 Der Korrelationskoeffizient . . . . . . . . .
7.1.4 Lineare Unterräume des Rn . . . . . . . . .
7.2 Lineare Gleichungssysteme . . . . . . . . . . . . . .
7.2.1 Lösungsmengen linearer Gleichungssysteme
7.2.2 Das Gaußsche Eliminationsverfahren . . . .
7.3 Matrizen . . . . . . . . . . . . . . . . . . . . . . . .
7.3.1 Einführung . . . . . . . . . . . . . . . . . .
7.3.2 Rechnen mit Matrizen . . . . . . . . . . . .
7.3.3 Die Determinante einer Matrix . . . . . . .
7.3.4 Eigenwerte und Eigenvektoren . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
121
121
121
124
127
129
131
131
134
136
136
139
143
146
4
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Inhaltsverzeichnis
7.4
Das Leslie-Modell . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
7.4.1 Das Modell . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
7.4.2 Das Leslie-Modell für 2 Altersklassen . . . . . . . . . . . . . . . . . . . . 152
8 Komplexe Zahlen
8.1 Einführung . . . . . . . . . . . . . . . . . . . . . . . .
8.1.1 Die Zahl i . . . . . . . . . . . . . . . . . . . . .
8.1.2 Die komplexe Zahlenebene . . . . . . . . . . . .
8.1.3 Division in C . . . . . . . . . . . . . . . . . . .
8.1.4 Quadratische Gleichungen in C . . . . . . . . .
8.2 Polardarstellung im Komplexen . . . . . . . . . . . . .
8.2.1 Umrechnung der Koordinaten . . . . . . . . . .
8.2.2 Geometrische Interpretation der Multiplikation
8.2.3 Die Exponentialfunktion im Komplexen . . . .
8.2.4 Flächenberechnung und Determinante . . . . .
8.3 Fundamentalsatz der Algebra . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
154
154
154
157
160
162
164
165
167
168
169
172
9 Gewöhnliche Differentialgleichungen
9.1 Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.2 Differentialgleichungen 1. Ordnung . . . . . . . . . . . . . . . . .
9.2.1 Konstantes und exponentielles Wachstum . . . . . . . . .
9.2.2 Logistisches Wachstum . . . . . . . . . . . . . . . . . . . .
9.2.3 Trennung der Variablen . . . . . . . . . . . . . . . . . . .
9.2.4 Lineare Differentialgleichungen 1.Ordnung . . . . . . . . .
9.2.5 Richtungsfelder . . . . . . . . . . . . . . . . . . . . . . . .
9.2.6 Stationäre Punkte . . . . . . . . . . . . . . . . . . . . . .
9.3 Lineare Differentialgleichungen 2.Ordnung . . . . . . . . . . . . .
9.3.1 Beispiel: Der harmonische Oszillator . . . . . . . . . . . .
9.3.2 Lösung der linearen Differentialgleichung 2.Ordnung . . .
9.4 Systeme von Differentialgleichungen . . . . . . . . . . . . . . . .
9.4.1 Lineare Systeme 1.Ordnung mit konstanten Koeffizienten
9.4.2 Komplexwertige Lösungen . . . . . . . . . . . . . . . . . .
9.4.3 Nichtlineare Systeme, das Räuber-Beute-Modell . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
174
174
175
175
176
181
182
189
192
195
195
195
202
202
204
207
5
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
1 Grundbegriffe und Grundlagen der
Kombinatorik
1.1 Grundbegriffe
In der Mathematik werden häufig Aussagen über Zusammenfassungen gemacht:
- „Alle Dreiecke haben die Winkelsumme 180◦ .“
- „x2 ≥ 0 für alle reellen Zahlen x.“
Um Aussagen präzise formulieren zu können, brauchen wir den Begriff der „Menge“.
1.1.1 Mengennotation
1.1 Definition
Eine Menge ist eine Zusammenfassung unterscheidbarer Objekte zu einem Ganzen. Die
Objekte x, die zu einer Menge M gehören, heißen Elemente von M , geschrieben x ∈ M .
Ist x nicht Element von M , so schreiben wir x ∈
/ M . Mit ∅ := { } bezeichnet man die
leere Menge, die keine Elemente enthält.
Eine Menge wird definiert, indem man ihre Elemente aufzählt oder durch Eigenschaften eindeutig beschreibt.
Aufzählende Darstellung einer Menge:
A = {0, 1, 2, 3}
B = {0, 1, ..., 9}
N = {0, 1, 2, . . .}
Menge der natürlichen Zahlen
Z = {0, +1, −1, +2, −2, +3, −3, . . .}
Menge der ganzen Zahlen
D = {rot,grün,blau}
Beschreibende Darstellung einer Menge:
P = {p ∈ N | p ist eine Primzahl}
B = {n ∈ N | n < 10}
L = {x ∈ R | x2 − 1 = 0}
M = {x ∈ R | x2 + 1 = 0}
6
1 Grundbegriffe und Grundlagen der Kombinatorik
Bei der beschreibenden Darstellung wird immer zunächst die Grundmenge notiert, aus der die
Elemente auszuwählen sind, („n ∈ N“, „ x ∈ R“ ) und dann eine Eigenschaft angegeben, durch
welche die Elemente der Menge eindeutig beschrieben werden.
1.2 Definition
Seien M , N Mengen.
i) M heißt Teilmenge von N , wenn jedes Element von M auch Element von N ist:
x ∈ M ⇒ x ∈ N.
Schreibweise: M ⊆ N .
ii) Es ist M = N , genau dann wenn M ⊆ N und N ⊆ M .
iii) Sei N eine endliche Menge, so heißt
|N | = „Betrag von N“
und bezeichnet die Anzahl der Elemente von N .
iv) Die Menge aller Teilmengen einer Menge M wird bezeichnet mit
P (M ) := {A A ⊆ M }
und heißt Potenzmenge von M.
1.3 Bemerkung Der Betrag einer reellen Zahl x ∈ R (geschrieben |x|) ist definiert durch:
(
|x| =
falls x ≥ 0
falls x < 0.
x
−x
1.4 Definition
Für Mengen M, N definieren wir die Mengenoperationen
Differenz:
M ∩ N := {x | x ∈ M und x ∈ N }
M ∪ N := {x | x ∈ M oder x ∈ N }
M \ N := {x | x ∈ M und x ∈
/ N}
Produkt:
M × N := {(x, y) | x ∈ M und y ∈ N }.
Durchschnitt:
Vereinigung:
Insbesondere bezeichnet R \ {0} die Menge der reellen Zahlen ohne die 0.
7
1 Grundbegriffe und Grundlagen der Kombinatorik
1.5 Definition
Abgeschlossene, offene und halboffene Intervalle in R werden notiert durch
[a, b] := {x ∈ R| a ≤ x ≤ b}
(a, b) := {x ∈ R| a < x < b}
abgeschlossenes Intervall
[a, b) := {x ∈ R| a ≤ x < b}
(a, b] := {x ∈ R| a < x ≤ b}
halboffenes Intervall
offenes Intervall
halboffenes Intervall.
Hierbei sind a, b ∈ R mit a < b. Uneigentliche Intervalle sind definiert durch
[a, ∞) := {x ∈ R| a ≤ x < ∞}
(a, ∞) := {x ∈ R| a < x < ∞}
(−∞, b) := {x ∈ R| − ∞ < x < b}
(−∞, b] := {x ∈ R| − ∞ < x ≤ b}.
1.6 Beispiele
a) Für die obigen Beispielmengen gilt A ⊆ B ⊆ N und M = ∅.
b) Sei D = {r, g, b}. Dann ist die Potenzmenge von D
P (D) = {{r}, {g}, {b}, {r, g}, {r, b}, {g, b}, {r, g, b}, ∅}.
c) Es ist R die Menge der reellen Zahlen und
R≥0 := {x ∈ R | x ≥ 0}
R≤0 := {x ∈ R | x ≤ 0}.
d) Bei einem Zufallsexperiment heißt die Menge der möglichen Ergebnisse Ergebnismenge
und wird mit Ω bezeichnet. Wird ein Würfel geworfen so ist die Ergebnismenge
Ω1 = {1, 2, 3, 4, 5, 6}
und es ist der Betrag von Ω1
|Ω1 | = 6.
Eine Teilmenge E der Ergebnismenge Ω1 heißt Ereignis. Es ist zum Beispiel das Ereignis
E = „ Die gewürfelte Zahl ist größer als 2 “
= {3, 4, 5, 6}
und daher ist
|E| = 4.
e) Betrachten wir in obigem Zufallsexperiment als weiteres Ereignis
G = „ Die gewürfelte Zahl ist gerade “
= {2, 4, 6},
8
1 Grundbegriffe und Grundlagen der Kombinatorik
so können wir die Schnittmenge von E und G bilden:
E ∩ G = {4, 6}.
Diese bezeichnet das Ereignis „ E und G “, in dem die gewürfelte Zahl größer als 2 und
gerade ist. Bilden wir hingegen die Vereinigung
E ∪ G = {2, 3, 4, 5, 6},
so erhalten wir das Ereignis E oder G, in welchem die gewürfelte Zahl größer als 2 oder
gerade ist. Mittels einer Skizze kann man sich verdeutlichen, dass allgemein gilt:
|E ∪ G| = |E| + |G| − |E ∩ G| .
f) Würfeln wir 2-mal hintereinander (oder gleichzeitig mit zwei unterscheidbaren Würfeln),
so ist die Ergebnismenge eine Menge geordneter Paare, nämlich das Produkt
Ω2 = Ω1 × Ω1
= {(a1 , a2 ) | a1 , a2 ∈ {1, 2, ..., 6}}
1.1.2 Quantoren
Die Notation mathematischer Aussagen wird häufig vereinfacht durch die Verwendung der
Quantoren:
∃
∀
Existenzquantor:
Allquantor:
„Es gibt ein . . . “
„Für alle . . . “
1.7 Beispiele
a) ∀ n ∈ N gilt: n ≥ 0.
„Für alle natürlichen Zahlen n gilt: n ≥ 0.“
b) ∀ n ∈ N gilt: ∃ pn ∈ N, pn ist Primzahl und pn > n.
„Für alle natürlichen Zahlen n gilt: zu n gibt es eine Primzahl pn mit pn > n.“
c) ∃ x ∈ R : x2 = 2.
„Es gibt eine reelle Zahl x, für die x2 = 2 gilt.“
d) ∀ ∈ R mit > 0: ∃ n ∈ N, so dass n1 < .
„Für alle reellen Zahlen mit > 0 gilt: es gibt eine natürliche Zahl n, so dass
1
n
< .“
e) Vertauschen wir in Beispiel b) die Reihenfolge der Quantoren, so wird aus der obigen
wahren Aussage eine falsche Aussage:
∃ p ∈ N : p ist Primzahl, so dass ∀n ∈ N gilt: p > n.
„Es existiert eine Primzahl p, so dass für alle natürlichen Zahlen n gilt: p > n.“
Dieses zeigt uns, dass die Reihenfolge der Quantoren wesentlich für den Inhalt der Aussage
ist.
9
1 Grundbegriffe und Grundlagen der Kombinatorik
1.2 Grundlagen der Kombinatorik
1.8 Definition
Für natürliche Zahlen n, k ∈ N mit k ≤ n definieren wir:
n ! := n · (n − 1) · . . . · 2 · 1
i)
ii)
“ n Fakultät ”
0 ! := 1
n
k
iii)
!
:=
n!
k ! (n − k) !
“ n über k ”
und für k > n wird festegelgt
n
k
iv)
!
:= 0.
1.9 Beispiel Aus dieser Definition folgt für natürliche Zahlen n, k ∈ N mit k ≤ n:
und
n
n
!
n
n−1
!
n
n−k
!
!
=
n
0
!
=
n
1
=
n
.
k
= 1,
= n,
!
Wir betrachten nun drei Grundaufgaben der Kombinatorik, wobei stets zwischen den Situationen mit oder ohne Wiederholungen unterschieden wird und immer n Objekte gegeben sind.
1.2.1 Permutationen (Anordnungen)
Permutationen sind Umordnungen gegebener Objekte, es wird die Reihenfolge der anzuordnenden Objekte beachtet:
1.) ohne Wiederholungen: (Alle Objekte sind unterscheidbar.)
Sollen n Objekte auf n Plätzen angeordnet werden, so stehen für den ersten Platz n Objekte
zur Auswawhl, für den zweiten Platz noch (n − 1) usw. :
1.
2.
3.
···
(n − 1).
n.
Platz
n
(n − 1)
(n − 2)
···
2
1
Möglichkeiten.
Das heißt es ergeben sich
n · (n − 1) · (n − 2) · . . . · 2 · 1 = n !
Möglichkeiten, n unterscheidbare Objekte anzuordnen.
10
(1.1)
1 Grundbegriffe und Grundlagen der Kombinatorik
2.) mit Wiederholungen: (Einige Objekte sind nicht unterscheidbar.) Zur Herleitung betrachten wir die Situation mit drei Objekten, die zunächst unterscheidbar seien und notieren
in Tabelle 1.1 alle Möglichkeiten, diese anzuordnen. Dann notieren wir, welche Permutationen
nicht mehr unterscheidbar sind, wenn die 1 und die 2 identifiziert werden.
Allgemein: Treten unter n Objekten k Objekte mehrfach auf mit den Häufigkeiten n1 , n2 , . . . , nk ,
Drei verschiedene Objekte
1
2
3
3
2
1
2
1
2
1
3
3
Objekte „1“ und „2“ sind indentfiziert
3
3
1
2
1
2
1
1
3
3
1
1
3! = 6 Permutationen
1
1
1
1
3
3
3
3
1
1
1
1
Die Anordnungen, die durch Vertauschen
von „1“ und „2“ entstehen, sind nicht mehr
unterscheidbar, d.h. je 2! Möglichkeiten
fallen zusammen. 3!
2! Permutationen
Tabelle 1.1: Permutationen mit und ohne Wiederholungen
so gibt es
n!
n1 ! · n2 ! · . . . · nk !
(1.2)
Permutationen.
1.10 Beispiel Wie viele (nicht umbedingt sinnvolle) verschiedene Wörter lassen sich aus den
Buchstaben des Wortes „BIOLOGIE“ bilden? Das Wort hat 8 Buchstaben, es ist also n = 8,
die Buchstaben I und O treten dabei doppelt auf, so dass
2 mal „I“
2 mal „O“
⇒
⇒
n1 = 2
n2 = 2
Die Anzahl der Permutationen der Buchstaben ist also:
8!
8·7·6·5·4·3·2·1
=
= 10.080.
2! · 2!
2·1·2·1
1.2.2 Variationen
Aus n unterscheidbaren Objekten werden k Objekte unter Beachtung der Reihenfolge ausgewählt:
1.) ohne Wiederholungen: (Die Objekte werden nicht zurückgelegt.) Für den ersten Platz
stehen n Objekte zur Auswahl, für den zweiten nur noch (n − 1) usw. Insgesamt erhalten wir
11
1 Grundbegriffe und Grundlagen der Kombinatorik
1.
2.
3.
···
(n − 1).
k.
n
(n − 1)
(n − 2)
···
n−k+2
n−k+1
Platz
Möglichkeiten.
Das heißt es ergeben sich
n · (n − 1) · (n − 2) · . . . · (n − k + 1) =
n!
(n − k)!
(1.3)
Möglichkeiten, k aus n Objekten unter Beachtung der Reihenfolge auszuwählen.
2.) mit Wiederholungen (Die Objekte werden zurückgelegt.) Für jeden Platz stehen alle n
Objekte zur Auswahl. Es ergeben sich dann
n · n · n · . . . · n = nk
(1.4)
Möglichkeiten.
1.2.3 Kombinationen
Aus n unterscheidbaren Objekten werden k Objekte ohne Beachtung der Reihenfolge ausgewählt:
1.) ohne Wiederholungen: (Die ausgewählten Objekte werden nicht zurückgelegt.)
n!
Auswahlen, solange die Reihenfolge beachtet wird (s. Variationen 1.2.2). Nun
Es gibt (n−k)!
ist die Reihenfolge egal, so dass je k! Möglichkeiten die gleichen k Objekte unterschiedlich
anzuordnen, nicht mehr unterscheidbar sind:
n!
1
n!
· =
=
(n − k)! k!
(n − k)! · k!
Es gibt also
n
k
!
n
.
k
(1.5)
(gesprochen: „n über k“) Möglichkeiten.
2.) mit Wiederholungen: (Die Objekte werden zurückgelegt.)
Werden beim Auswählen Wiederholungen zugelassen, so betrachten wir folgendes Modell:
Vor uns stehe ein Bücherregal mit n = 6 Büchern B1 , ...., B6 :
Wir nehmen k = 3 Mal ein Buch heraus und stellen es zurück an seinen Platz. Es kann ein
Buch mehrmals herausgenommen werden. Jede Auswahl markieren wir mit einem „+“. Diese
Auswahl kann auch dargestellt werden durch:
B1
B2
++
B3
B4
+
B5
B6
Tabelle 1.2: B2 wird zweimal ausgewählt, B4 einmal.
Dies kann ebenso, ohne Informationsverlust, dargestellt werden durch:
++
+
d.h. alle möglichen Auswahlen entsprechen genau einer Anordnung der n − 1 = 6 − 1 = 5
Striche „|“ und k = 3 Kreuze „+“. Da die Striche und die Kreuze jeweils untereinander nicht
12
1 Grundbegriffe und Grundlagen der Kombinatorik
unterscheidbar sind, gibt es nach Formel (1.2) mit n = 5 + 3, n1 = 5 und n2 = 3 gerade
Möglichkeiten diese anzuordnen. Allgemein gibt es
(n − 1 + k)!
(n − 1 + k)!
=
=
(n − 1)! · k!
(n − 1 + k − k)! · k!
n−1+k
k
(5+3)!
5! · 3!
!
(1.6)
Möglichkeiten, k aus n Objekten auszuwählen, wenn Wiederholungen zugelassen sind.
Zusammenfassung
alle Objekte
unterscheidbar
mit
Wiederholungen
n!
n!
n1 ! · ... · nk !
Permutationen
(Anordnungen, Reihenfolge wichtig)
Variationen
(Auswahl, Reihenfolge wichtig)
n!
(n−k)!
Kombinationen
(Auswahl, Reihenfolge unwichtig)
mit
Zurücklegen
nk
n
k
n−1+k
k
1.2.4 Allgemeine binomische Formel
Gesucht ist eine Formel für
(x + y)n ,
n ∈ N.
Ist n = 2, so erhält man durch einfaches Ausmultiplizieren die bekannte binomische Formel:
(x + y)2 = (x + y)(x + y) = x2 + 2xy + y 2 .
Für n = 3 erhält man:
(x + y)3 = (x + y)(x + y)(x + y) = x3 + 3x2 y + 3xy 2 + y 3 .
Wollen wir für beliebiges n ∈ N den Term
(x + y)n = (x + y)(x + y) · . . . · (x + y)
|
{z
n Faktoren
}
ausmultiplizieren, so trägt jeder der n Faktoren entweder ein x oder ein y bei. Daher hat jeder
der entstehenden Summanden die Form
xk y n−k ,
wobei 0 ≤ k ≤ n ist,
d. h. die Summe der Exponenten ist gleich n.
Der Term xk y n−k entsteht beim Ausmultiplizieren
n
n
k -mal, denn es gibt nach (1.5) gerade k Möglichkeiten, aus den n-Faktoren (x + y) genau
k-mal das x auszuwählen. Alle anderen (n − k) Faktoren tragen ein y bei, so dass nk -mal
13
1 Grundbegriffe und Grundlagen der Kombinatorik
xk y n−k entsteht. Daher erhalten wir die allgemeine binomische Formel:
!
(x + y)n =
=
!
!
!
!
n 0 n
n 1 n−1
n 2 n−2
n
n n 0
x y +
x y
+
x y
+ ... +
xn−1 y 1 +
x y
0
1
2
n−1
n
n
X
!
n k n−k
x y
.
k
k=0
1.11 Bemerkung Die Zahlen
(1.7)
n
k
heißen auch Binominalkoeffizienten.
Wollen wir die Formel für n = 3 überprüfen, so erhalten wir:
!
3
(x + y) =
!
!
!
3 0 3
3 1 2
3 2 1
3 3 0
x y +
x y +
x y +
x y = y 3 + 3xy 2 + 3x2 y + x3 .
0
1
2
3
Für die Binomialkoeffizienten gelten die folgenden wichtigen Rechenregeln, die sich anschaulich
gut verstehen lassen, wenn man sich nk immer gleich als Anzahl der k-elementigen Teilmengen
einer n-elementigen Menge vorstellt:
1.12 Folgerungen
Eine n - elementige Menge hat
Symmetrie: Es gilt
n
k
=
n
n−k
n n−k ,
!
n
k
Teilmengen mit k Elementen.
denn
n!
n!
=
=
=
(n − k)! (n − (n − k))!
(n − k)! k!
!
n
.
k
(1.8)
Anschaulich bedeutet das: Eine n - elementige Menge hat genau so viele k - elementige wie
(n − k) - elementige Teilmengen. Denn sei mit n = 10
M = {A, B, C, D, E, F, G, H, I, J}.
eine 10-elementige Menge gegeben, so legt die Auswahl der k = 3 Elemente {B, F, H} eindeutig
die n − k = 7 - elementige Teilmenge N durch N := M \{B, F, H} = {A, C, D, E, G, I, J} fest.
Daher gibt es gleich viele 3 - und 7 - elementige Teilmengen von M .
Rekursionsformel für
n
k :
Man kann direkt nachrechnen, dass
n+1
k+1
!
!
=
n
n
+
k
k+1
!
(1.9)
gilt. (Was wir hier nicht ausführen.) Anschaulich bedeutet diese Formel: Fügt man zu einer n
- elementigen Menge {a1 , ..., an } ein neues Element an+1 hinzu, und wählt (k + 1) - elementige
Teilmengen aus, so gibt es zwei Möglichkeiten:
1) Die (k + 1) - elementige Teilmenge enthält das neue Element an+1 , so hat man
Möglichkeiten, die restlichen k Elemente aus {a1 , . . . , an } auszuwählen.
n
k
2) Die (k + 1) - elementige Teilmenge enthält das neue Element an+1 nicht, so hat man
n
k+1 Möglichkeiten (k + 1) Elemente aus der alten n - elementigen Menge {a1 , ...., an }
14
1 Grundbegriffe und Grundlagen der Kombinatorik
auszuwählen.
Zusammen erhält man also
n+1
k+1
=
n
k
n k+1
+
Teilmengen mit (k + 1) Elementen:
Abbildung 1.1: (k + 1) = 3 - elementige Teilmengen mit n = 8, k = 2
1.13 Beispiele
a) Wählen wir in der binomischen Formel (1.7) x = y = 1, so erhalten wir:
n
n
X
n
k=0
n
X
(1 + 1) =
⇔
2 =
!
n k n−k
1 1
k
!
n
.
k
k=0
(1.10)
b) Sei M = {a1 , ..., an } eine Menge mit n Elementen. Dann gilt für den Betrag der Potenzmenge P (M ):
|P (M )| = 2n ,
denn nach (1.10) gilt
n
2 =
n
X
n
k
k=0
!
!
=
!
!
n
n
n
+
+ ... +
.
0
1
n
Dieses ist die Anzahl der 0, 1, 2, . . . , n - elementigen (also aller) Teilmengen von M .
c) Pascalsches Dreieck:
n
n Aus der Rekursionsformel n+1
k+1 = k + k+1 ergibt sich eine einfache Möglichkeit, die
Binominalkoeffizienten nk zu berechnen. Dazu notieren wir zunächst
0
0
1
3
0
2
0
0
2
1
3
1
..
.
15
1
1
3
2
2
2
3
3
1 Grundbegriffe und Grundlagen der Kombinatorik
n
n
Nun ist nn = n0 = 1, woraus sich mit n+1
k+1 = k + k+1 ergibt, dass jedes
Summe der beiden im Dreieck darüber stehenden Binominalkoeffizienten ist:
1
1
1
1
2
1
1
3
3
1
..
.
d) Ein Basketballtrainer hat
9
5
n+1
k+1
die
Möglichkeiten aus 9 Spielern 5 Startspieler auszuwählen.
e) Wird eine Münze 5 mal geworfen und stets
das Resultat „Kopf“ oder „Zahl“ notiert, so
5
5
gibt es 2 = 32 mögliche Ergebnisse. In 3 = 10 dieser Ergebnisse fällt genau 3 mal „Zahl“.
f) Wie viele Möglichkeiten haben 10 nicht unterscheidbare Vögel, sich auf 6 Telegrafenleitungen niederzulassen? Da mehrere Vögel auf einer Leitung sitzen können, ist die Formel
(1.6) anzuwenden mit n = 6 und k = 10. Es gibt also
6 − 1 + 10
10
!
!
=
15
10
=
15 · 14 · 13 · 12 · 11
= 3003
5·4·3·2·1
Möglichkeiten, wenn nicht beachtet wird, in welcher Reihenfolge die Vögel auf den Leitungen sitzen.
g) Wie viele Möglichkeiten gibt es, 12 Probanden in 2 gleich große Gruppen aufzuteilen?
16
2 Folgen und Reihen
2.1 Folgen
2.1 Definition
Unter einer Folge reeller Zahlen versteht man eine Abbildung N → R. Jedem n ∈ N wird
eine reelle Zahl x(n) ∈ R zugeordnet. Man schreibt xn := x(n) für die Folgenglieder und
(xn )n∈N oder auch x0 , x1 , x2 , ... für die Folge.
2.2 Beispiele
a) Arithmetische Folge: Seien a, b ∈ R, dann definieren wir:
x0 := a
x1 := a + b
x2 := x1 + b = a + 2b
..
.
xn := xn−1 + b = a + nb
Die Folge beschreibt lineares Wachstum, z.B. ein Konto mit Anfangsguthaben a und monatlicher Zinszahlung b (ohne Zinseszins). Der Name der Folge kommt daher, dass ein
Folgenglied das arithmetische Mittel seines Vorgängers und seines Nachfolgers ist:
xn =
xn+1 + xn−1
2
b) Geometrische Folge: Dies ist das einfachste Modell für das Wachstum von Populationen: a Bakterien werden in eine Nährlösung eingesetzt. Unter der Annahme stündlicher
Verdopplung, ist die Anzahl xn der Bakterien nach n Stunden:
x0 := a
x1 := a · 2
x2 := x1 · 2 = a · 2 · 2 = a · 22
..
.
xn := xn−1 · 2 = a · 2n−1 · 2 = a · 2n
17
2 Folgen und Reihen
Die allgemeine geometrische Folge ist definiert durch
xn := a q n ,
für a, q ∈ R, q > 0.
(2.1)
Der Name der Folge kommt daher, dass ein Folgenglied das geometrische Mittel seines
Vorgängers und seines Nachfolgers ist:
xn =
√
xn+1 · xn−1
c) Harmonische Folge: Die harmonische Folge ist definiert durch
xn :=
1
.
n
Die ersten Folgenglieder sind 1, 12 , 31 , . . .. Der Name der Folge kommt daher, dass ein Folgenglied das harmonische Mittel seines Vorgängers und seines Nachfolgers ist:
1
1
=
xn
2
1
xn+1
+
1
xn−1
denn:
1
2
1
xn+1
+
1
xn−1
1
=
2
1
1
n+1
+
1
1
n−1
!
=
1
1
1
(n + 1 + n − 1) = n = 1 =
2
x
n
n
d) Zinseszins: K0 sei ein Anfangskapital, das Sie zu fantastischen 100% jährlichem Zinssatz
anlegen können. Nach einem Jahr beträgt das Kapital dann K1 = 2K0 . Wie verändert sich
das Kapital am Ende des Jahres, wenn statt dessen während des Jahres zweimal, dreimal,
viermal, . . . jeweils 12 , 13 , 41 , . . . des aktuellen Kapitals als Zinsen gezahlt werden?
Definieren wir eine Folge (xn )n∈N entsprechend des oben beobachteten Wachstums durch
1-malige Zinszahlung:
(jährliche)
2-malige Zinszahlung:
(6-monatige)
3-malige Zinszahlung
(4-monatige)
..
.
K1 = K0 + K0 = 2K0
n-maliger Zinszahlung
Kn = K0 (1 + n1 )n
K2 = K0 (1 + 21 )(1 + 21 ) = K0 (1 + 12 )2
K3 = K0 (1 + 31 )(1 + 31 )(1 + 13 ) = K0 (1 + 13 )3
Tabelle 2.1: Zinseszinsentwicklung bei unterjähriger Zinszahlung
xn := 1 +
1
n
n
.
so können wir später zeigen, dass diese Folge für immer größer werdendes n gegen die
18
2 Folgen und Reihen
Eulersche Zahl e strebt:
e := lim
n→∞
1
1+
n
n
= 2,71828 . . .
(2.2)
e) Logistische Folge: Die logistische Folge wird verwendet um beschränktes Wachstum zu
beschreiben. Es wird ein Anfangswert x0 ∈ (0, 1) vorgegeben, die weiteren Folgenglieder
werden dann berechnet aus
xn+1 = rxn (1 − xn )
Hierbei ist r ∈ R>0 ein Parameter des zu beschreibenden Wachstumsprozesses.
2.3 Bemerkung Berechnet eine Zuordnungsvorschrift für eine Folge ein Folgenglied xn aus
dem vorhergehenden Folgenglied xn−1 , so heißt diese Vorschrift rekursiv, kann das Folgenglied
ohne Kenntnis der vorhergehenden Folgenglieder berechnet werden, so heißt die Vorschrift
explizit. Beispielweise ist für die arithmetische Folge
xn := xn−1 + b
eine rekursive Vorschrift und
xn := a + nb
eine explizite Vorschrift.
2.1.1 Konvergenz von Folgen
Mit Folgen können Wachstums- und Zerfallsprozesse wie zum Beispiel Zellteilung und radioaktiver Zerfall in diskreten Zeitschritten beschrieben werden. Für immer größer werdende Indizes
n werden die Glieder der arithmetischen Folge (für b > 0) unbeschränkt wachsen, die Glieder der harmonischen Folge gegen 0 gehen, während die Entwicklung der geometrischen Folge
von dem Wert von q abhängt. Mathematisch beschreibt man dieses unterschiedliche Verhalten
durch die Begriffe Divergenz und Konvergenz.
2.4 Definition: Konvergenz von Folgen
i) Eine Folge (xn )n∈N heißt konvergent gegen den Grenzwert x, wenn für jede
beliebig kleine Schranke > 0 ein Index n existiert, so dass ab diesem n die
Folgenglieder um weniger als von dem Grenzwert x abweichen:
|x − xn | < ∀n ≥ n
(2.3)
Diese Bedingung ist äquivalent zu x − < xn < x + für alle n ≥ n . Man sagt: xn
konvergiert gegen x und schreibt hierfür:
lim xn = x.
n→∞
19
2 Folgen und Reihen
ii) Eine Folge (xn )n∈N heißt divergent, wenn sie nicht konvergent ist.
iii) Eine Folge (xn )n∈N heißt divergent bestimmt gegen +∞, wenn zu jeder beliebig
großen Schranke C > 0 ein Index nC existiert, so dass
∀n > nC .
xn > C
Schreibweise: limn→∞ xn = ∞.
iv) Die Folge (xn )n∈N divergiert bestimmt gegen −∞, wenn es zu jeder beliebig großen
Schranke C > 0 ein Index nC existiert, so dass
xn < − C
∀n ≥ nC .
Schreibweise: limn→∞ xn = −∞.
2.5 Beispiele
a) arithmetische Folge: xn := a + bn. Das Konvergenzverhalten der Folge hängt von dem
Vorzeichen von b ab:
b > 0 ⇒ limn→∞ xn = ∞
b = 0 ⇒ limn→∞ xn = a
b < 0 ⇒ limn→∞ xn = −∞.
b) harmonische Folge: xn = n1
Behauptung: (xn )n∈N konvergiert gegen den Grenzwert x = 0.
Beweis. Sei > 0 beliebig gegeben. Für Konvergenz gegen x = 0 lautet die Bedingung
(2.3):
|xn − 0| < ⇔
|xn | < 1
< ,
n
⇔
dieses ist erfüllt für n > 1 . Wähle also für n eine natürliche Zahl größer als 1 , dann ist
1
− 0 < n
∀ n ≥ n ,
also konvergiert die Folge gegen Null.
c) geometrische Folge: Es sei xn := q n . Wir unterscheiden die Fälle q > 1 und 0 < q < 1:
i) Es sei q > 1, dann ist die geometrische Folge bestimmt divergent:
lim xn = lim q n = ∞.
n→∞
n→∞
Beweis. Nach Definition 2.4 iii) müssen wir zeigen, dass die Folgenglieder größer
werden als jede beliebig große Schranke C ∈ R. Da q > 1 vorausgesetzt ist, können
20
2 Folgen und Reihen
wir q schreiben als q = 1 + p mit einem p > 0. Nun wenden
wir die allgemeine
binomische Formel (1.7) an und beachten, dass n0 = 1 und n1 = n gilt:
n
n
xn = q = (1 + p) =
n
X
k=0
!
n k n−k
p 1
k
!
!
!
n
n
n n 0
· p0 · 1n +
p · 1n−1 + ... +
p ·1
0
1
n
=
= 1 + np + . . . + 1 · pn
|
{z
}
Summanden>0
> 1 + np,
wobei in der letzten Zeile durch das Weglassen positiver Summanden der Term nach
unten abgeschätzt wird. Sei nun eine Schranke C ∈ R, C > 0 beliebig vorgegeben,
dann ist
⇔
1 + np > C
n>
C −1
,
p
d.h. wir wählen zu gegebener Schranke C einen festen Index nC , so dass
nC >
C −1
p
und dann gilt:
xn = q n
= (1 + p)n
> 1 + np
∀n ≥ nC ,
>C
womit die Behauptung bewiesen ist.
ii) Es sei 0 < q < 1, dann konvergiert die geometrische Folge gegen Null:
lim xn = lim q n = 0.
n→∞
Beweis. Es ist
folgt.
1
q
n→∞
> 1 so dass die Behauptung aus Teil v) des folgenden Satzes 2.9
Um allgemeine Aussagen über die Konvergenz von Folgen treffen zu können und nicht für jede
konkrete Folge das -Kriterium der Definition 2.4 i) überprüfen zu müssen, sind die folgenden
Begriffe monoton und beschränkt hilfreich.
21
2 Folgen und Reihen
2.6 Definition: Monotonie von Folgen
Eine reelle Folge (xn )n∈N heißt
i) monoton wachsend, wenn für alle Folgenglieder xn gilt:
xn ≤ xn+1
ii) monoton fallend, wenn für alle Folgenglieder xn gilt:
xn ≥ xn+1
iii) beschränkt, wenn es eine Schranke K ∈ R gibt, so dass für alle n ∈ N
|xn | < K.
.
2.7 Bemerkung Eine Folge heißt monoton, wenn sie monoton wachsend oder monoton fallend ist.
Nun können wir ein Kriterium dafür formulieren, wann eine monotone Folge konvergent ist.
2.8 Satz: 1. Konvergenzsatz, Monotoniekriterium
Ist die reelle Folge (an )n∈N monoton und beschränkt, so ist sie konvergent gegen ein x ∈ R.
Wichtig ist jedoch zu beachten, dass nicht jede konvergente Folge monoton sein muss, die Umkehrung dieses Satzes also nicht gilt! Werden zwei konvergente Folgen miteinander verknüpft,so
entsteht unter geeigneten Voraussetzungen wieder eine konvergente Folge. Mit Hilfe des folgenden Satzes kann daher die Konvergenz einer Folge überprüft werden, indem sie in Folgen
„zerlegt“ wird, deren Konvergenzverhalten bereits bekannt ist.
2.9 Satz: 2. Konvergenzsatz, Grenzwertsatz
Seien (an )n∈N und (bn )n∈N konvergente Folgen mit limn→∞ an = a und limn→∞ bn = b.
Sei k ∈ R eine Konstante, dann gilt:
i) Die Folge cn := k · an ist konvergent mit limn→∞ cn = k · a.
ii) Die Folge cn := an + bn ist konvergent mit limn→∞ cn = a + b.
iii) Die Folge cn := an · bn ist konvergent mit limn→∞ cn = a · b.
22
2 Folgen und Reihen
iv) Falls bn 6= 0 ∀n ∈ N und b 6= 0, so ist die Folge cn :=
a
b.
an
bn
konvergent mit limn→∞ cn =
v) Falls bn 6= 0 ∀n ∈ N und limn→∞ bn = ∞, so ist die Folge cn :=
limn→∞ cn = 0.
1
bn
konvergent mit
2.10 Beispiele
1
a) xn = n(n+1)
ist monoton fallend und beschränkt, also konvergent nach dem 1. Konvergenzsatz.
b) xn := n3 , wende Satz 2.9 i) an mit k = 3:
lim
n→∞
3
1
= 3 · lim
= 3·0 = 0
n→∞
n
n
c) xn := 2 + n7 , wende Satz 2.9 i) und ii) an:
lim
n→∞
d) xn := 2 +
(2.2)
7
n
· 1+
lim
n→∞
1
n
n
7
2+
n
7
2+
n
= lim 2 + 7 · lim
n→∞
n→∞
1
=2
n
, wende Satz 2.9 iii) an, dann ist zusammen mit dem Grenzwert
·
1
1+
n
n !
= lim
n→∞
7
2+
n
· lim
n→∞
1
1+
n
n
= 2e
e) Mit Satz 2.9 iv) erhalten wir:
n · n3 + 2
3 + 2n
=
xn =
= 5 + 4n
n n5 + 4
⇒
lim
n→∞
3
n
5
n
+2
+4
3 + 2n
2
1
= = .
5 + 4n
4
2
f) Durch x0 = 2 und
1
2
xn+1 = (xn +
)
2
xn
(2.4)
für n ∈ N und n ≥ 1 wird rekursiv eine Folge definiert, die konvergent ist mit
√
lim xn = 2.
n→∞
Insbesondere erhalten wir auf diese Weise eine Folge rationaler Zahlen, es ist xn ∈ Q, ∀n ∈
N, mit einem
√ nicht rationalen Grenzwert x ∈ R\Q. Davon dass der Grenzwert dieser Folge
tatsächlich 2 können Sie sich auf die folgende Weise überzeugen: Stellen Sie sich vor, dass
der Unterschied zwischen xn und xn+1 für sehr große n sehr, sehr klein geworden ist, so
23
2 Folgen und Reihen
dass Sie diese beiden Zahlen kaum noch unterscheiden können. Setzen Sie daher in der
Rekursiongleichung (2.4) einfach x ein an Stelle von xn , xn+1 , so erhalten Sie x = 21 (x+ x2 ).
√
Wenn Sie diese Gleichung nach x auflösen erhalten Sie x = 2.
2.1.2 Die Fibonacci-Folge
Die Folge (Fn )n∈N der Fibonacci-Zahlen wird definiert durch die Anfangsbedingungen
F1 := 1 und F2 := 1
(AB)
für die ersten beiden Folgenglieder und die Rekursionsformel
Fn+2 := Fn+1 + Fn .
(RF)
Die ersten Folgenglieder sind dann
1, 1, 2, 3, 5, 8, 13, 21, 34, 55 . . . .
Man sieht sofort, dass die Folge (Fn )n∈N monoton wachsend ist und bestimmt divergent:
lim Fn = ∞
n→∞
Gesucht ist nun eine explizite Darstellung (s. Bemerkung 2.3) der Folge (Fn )n∈N . Die Herleitung
dieser Formel erfolgt in zwei Schritten:
−
1. Es werden explizite Darstellungen für zwei Folgen (G+
n )n∈N und (Gn )n∈N bestimmt,
welche der Rekursionsformel (RF) genügen. Da die Gleichung (RF) linear ist, erfüllen
dann auch alle Folgen (Mn )n∈N , welche durch
−
Mn := a G+
n + b Gn
a, b ∈ R
definiert sind die Rekursionsbedingung (RF). (Zum Begriff “linear” siehe Definition 3.5.)
2. Die Koeffizienten a, b ∈ R werden so bestimmt, dass die Anfangsbedingungen (AB) von
−
Mn = aG+
n + bGn für n = 1 und n = 2 erfüllt werden.
zu 1.) Die Folge ist monoton wachsend, daher wählen wir den Ansatz
Gn := λn
und versuchen ein λ ∈ R\{0} zu finden, so das die so definierte Folge (Gn )n∈N die Rekursionsformel (RF) erfüllt. Es muss also gelten:
⇔
⇔
Gn+2 = Gn+1 + Gn
| Gn = λ n
λn+2 = λn+1 + λn
| : λn , λ 6= 0
λ2 = λ + 1
Dieses ist eine quadratische Gleichung für λ mit den beiden Lösungen:
√
√
1+ 5
1− 5
λ+ =
und λ− =
,
2
2
24
(2.5)
2 Folgen und Reihen
−
d.h. wir haben nun zwei Folgen (G+
n )n∈N und (Gn )n∈N , definiert durch:
√ !n
1+ 5
+
n
Gn := λ+ =
2
√ !n
1− 5
−
n
,
Gn := λ− =
2
welche die Rekursionsbedingung (RF) erfüllen.
zu 2.) Gesucht sind nun a, b ∈ R, so dass die durch die Linearkombination
−
Fn := a G+
n + b Gn
definierte Folge (Fn )n∈N der Anfangsbedingung (AB) genügt:
!
−
F1 = aG+
1 + bG1 = a λ+ + b λ− = 1
!
−
2
2
F2 = aG+
2 + bG2 = a λ+ + b λ− = 1
Dieses sind 2 lineare Gleichungen für a und b, welche sich lösen lassen. Wir erhalten (ohne die
Rechung hier auszuführen)
1
a= √ ,
5
1
b = −√ .
5
Es ist also
1 −
1 n
1
n
Fn := √ G+
n − √ Gn = √ (λ+ − λ− )
5
5
5
eine Folge, welche sowohl die Rekursionsformel (RF) und die Anfangsbedingung (AB) der
Fibonacci-Zahlen erfüllt. Indem wir für λ+ und λ− die in (2.5) berechneten Werte einsetzen,
können wir die n-te Fibonacci-Zahl berechnen aus:
√ !n
√ !n !
1+ 5
1
1− 5
Fn = √
−
.
2
2
5
Es ist nicht offensichtlich, dass die rechte Seite dieser Gleichung immer eine natürliche Zahl
ergibt. Tipp:
Sie durch Nachrechnen, dass mit dieser Formel F1 = 1 und F2 = 1.
√ Überprüfen
√
Wenn Sie 53 = 5 · 5 beachten, können Sie auch F3 = 2 nachrechnen.
25
2 Folgen und Reihen
2.2 Reihen
Aus einer Folge x0 , x1 , x2 , . . . kann man eine neue Folge konstruieren, indem man die Folge der
Partialsummen bildet:
S0 := x0
S1 := x0 + x1
S2 := x0 + x1 + x2
..
.
Sn := x0 + x1 + . . . + xn =
n
X
xk
k=0
Eine so definierte Folge (Sn )n∈N heißt Reihe.
2.2.1 Endliche Reihen
Für endliche Reihen lässt sich in einigen Fällen eine Summenformel herleiten, mit der sich die
n-te Partialsumme Sn (die Summe der ersten n Folgenglieder) berechnen lässt.
2.11 Beispiele
a) Ist xn = n, dann ist
S0 := x0 = 0
S1 := x0 + x1 = 0 + 1 = 1
S2 := x0 + x1 + x2 = 0 + 1 + 2 = 3
..
.
Sn := x0 + x1 + . . . + xn = 0 + 1 + . . . + n =
n
X
k
k=0
Für Sn können wir eine Summenformel herleiten, denn
Sn = 1 + 2 + ... + (n − 1) + n
Sn = n + (n − 1) + ... + 2 + 1
⇒
⇒
2Sn = (n + 1) + (n + 1) + .... + (n + 1) + (n + 1)
= n(n + 1)
n(n + 1)
Sn =
2
also ist
Sn =
n
X
k=0
k=
n(n + 1)
2
26
(2.6)
2 Folgen und Reihen
b) Geometrische Reihe: Mit xn = q n ist
n
X
Sn =
q k = 1 + q + ... + q n .
(2.7)
k=0
Eine Summenformel können wir herleiten, indem wir Gleichung (2.7) mit q multiplizieren
und die Differenz zwischen Sn und q Sn bilden:
q Sn = q + q 2 + .... + q n+1
Sn − q Sn = 1 − q n+1
⇒
so dass wir insgesamt
Sn =
n
X
1 − q n+1
1−q
qk =
k=0
(2.8)
als Summenformel für die geometrische Reihe im Falle q 6= 1 erhalten.
2.2.2 Unendliche Reihen
2.12 Definition
Wenn für eine Folge (xn )n∈N die Folge der Partialsummnn (Sn )n∈N , Sn :=
n → ∞ gegen S ∈ R konvergiert, so setzen wir
∞
X
k=0 xk ,
für
xk := S = lim Sn
n→∞
k=0
und sagen, die unendliche Reihe
Pn
P∞
k=0 xk
konvergiert gegen S.
Wichtig: Eine Reihe (Sn )n∈N kann höchstens dann konvergieren, wenn die zugrundeliegende
Folge (xn )n∈N gegen 0 konvergiert, diese Bedingung ist aber nicht hinreichend! (Siehe weiter
unten das Beispiel der harmonischen Reihe.)
2.13 Beispiele
d) Arithmetische Reihe: xn = a + n · b
Sn =
n
X
(a + kb) = a(n + 1) + b
k=0
n(n + 1)
.
2
(Sn )n∈N kann nicht konvergieren (außer falls a = b = 0).
e) Geometrische Reihe: Bilden wir die geometrische Folge xn = q n mit einem q mit |q| < 1,
so wissen wir aus Beispiel c) im Abschnitt 2.1.1, dass die geometrische Folge gegen 0
konvergiert: limn→∞ q n = 0 für |q| < 1. Daher gilt für die Folge der Partialsummen mit
27
2 Folgen und Reihen
Hilfe des 2. Konvergenzsatzes 2.9:
Sn =
n
X
qk =
k=0
1 − q n+1 n→∞
1
−−−→
.
1−q
1−q
In diesem Fall konvergiert also auch die geometrische Reihe und wir können den Grenzwert
berechnen:
S = lim Sn =
n→∞
1
1−q
Speziell gilt für q = 21 :
Sn = 1 +
1 1 1
1
+ + + ... + n
2 4 8
2
(2.9)
und
lim Sn =
n→∞
∞
X
1
k=0
2k
=
1
1−
1
2
= 2.
(2.10)
Die Summe der Flächen der Quadrate und Rechtecke ist offenbar in einem Rechteck der
Fläche 2 enthalten und konvergiert gegen dessen Fläche:
1
1
1/2
1
1/2
1
1/8
1/4
1/16
1/2
1/4
Abbildung 2.1: Die geometrische Reihe
f) Harmonische Reihe: Es ist xn =
Sn :=
1
n
für n ≥ 1. Um die Reihe
n
X
1
k
k=1
=1+
28
1
1
+ ... +
2
n
2 Folgen und Reihen
auf Konvergenz zu untersuchen, betrachten wir die 16. Partialsumme
S16 = 1 +
1 1 1 1 1 1 1 1
1
+ + + + + + + + ... +
2 |3 {z 4} |5 6 {z 7 8} |9
{z 16}
1
1
1
>2 · 4
>4 · 8
>8 · 16
1
=2
=1
2
1
=2
und können hier immer Gruppen von Summanden bilden, deren Summe größer ist als 12 .
Beachten wir nun noch dass 16 = 24 , so sehen wir, dass für die 16. Partialsumme gilt:
S24 > 1 + 4 ·
1
2
und genau wie oben, kann man allgemein für S2m zeigen, dass
S2m > 1 + m ·
1
2
woraus folgt:
lim S2m = ∞
m→∞
∞
X
1
⇔
k=0
k
= ∞.
Hier sehen wir, dass limn→∞ xn = 0 offenbar eine notwendige Vorraussetzung dafür ist,
P
dass die unendliche Reihe ∞
k=0 xk konvergiert aber offensichtlich keine hinreichende. Um
Reihen auf Konvergenz zu untersuchen, stehen uns aber die folgenden Kriterien zur Verfügung:
2.14 Satz: Konvergenz von Reihen
i) (Monotoniekriterium) Eine monotone und beschränkte Reihe ist konvergent.
ii) (Vergleichskriterium) Seien (xn )n∈N und (yn )n∈N Folgen mit
0 ≤ x n ≤ yn
und ist
P∞
k=0 yn
konvergent, so ist auch
∞
X
P∞
xk ≤
k=0
k=0 xk
∞
X
(2.11)
konvergent und es gilt
yk .
k=0
2.15 Beispiele
1
g) Die Reihe Sn := nk=0 k!
ist konvergent. Um dieses zu beweisen schätzen wir für k ≥ 2 die
1
1
Folgenglieder xk = k!
nach oben durch yk = 2k−1
ab und wenden das Vergleichskriterium
P
29
2 Folgen und Reihen
aus Satz 2.14 ii) an:
1
1
1
1
=
≤
= k−1
k!
1·2·3· ... ·k
1·2·2· ... ·2
2
1
und da offensichtlich 0 ≤ k!
gilt, folgt, dass die Reihe konvergiert, da (2.11) erfüllt ist und
die Sn durch die Glieder der geometrischen Reihe abgeschätzt werden können:
1
1
1
1
+ + + ... +
0! 1! 2!
n!
1
1
1
≤ 1 + 0 + 1 + . . . + n−1
2
2
2
n−1
X 1 k
=1+
.
2
k=0
Sn =
Mit dem Grenzwert für die geometrische Reihe (2.9) erhalten wir
lim Sn =
n→∞
∞
X
1
k=0
n!
≤1+
∞ k
X
1
k=0
2
h) Im Beispiel 2.2 d) (Zinseszins) haben wir die Folge 1 +
Zahl e definiert als deren Grenzwert: e = limn→∞
lim
1+
n→∞
1
n
n
=
∞
X
1
k=0
k!
1+
= 3.
n
1
n
n
1
.
n
betrachtet und die Eulersche
Nun können wir zeigen, dass
.
woraus
nmit dem Ergebnis aus dem vorhergehenden Beispiel die Konvergenz der Folge
1
1+ n
folgt. Es ist nach der allgemeinen binomischen Formel (1.7) (mit x = n1 und
y = 1)
1
1+
n
n
=
n
X
!
n 1
k nk
k=0
und die Summanden der rechten Seite lassen sich abschätzen durch
!
n 1
n · (n − 1) · . . . · (n − k + 1) 1
=
k
k n
k!
nk
n · (n − 1) · . . . · (n − k + 1) 1
n·n· ... ·n
k!
n−k+1 1
n−1
= 1·
· ... ·
·
n }
n } k!
| {z
| {z
=
<1
1
≤ .
k!
30
<1
2 Folgen und Reihen
Also gilt für jedes einzelne Folgenglied
1
1+
n
n
=
n
X
n
X
n 1
1
≤
k
k n
k!
k=0
!
k=0
und daher auch für den Grenzübergang n → ∞
lim
n→∞
1
1+
n
n
≤
∞
X
1
k=0
(2.12)
k!
Auf ähnliche Weise lässt sich zeigen, dass
∞
X
1
k=0
k!
≤ lim
n→∞
1
1+
n
n+1
.
(2.13)
Da aber limn→∞ (1 + n1 ) = 1 ist
lim
n→∞
1
1+
n
n+1
1 n
1
= lim 1 +
lim (1 + )
n→∞
n n→∞
n
1 n
= lim 1 +
n→∞
n
und es folgt nun aus (2.12) und (2.13) dass
lim
n→∞
1
1+
n
n
≤
n
X
1
k=0
≤ lim
k!
n→∞
1
1+
n
n+1
= lim
n→∞
1
1+
n
n
.
Es muss insgesamt gelten:
∞
X
1
k=0
k!
1
1+
n
= lim
n→∞
31
n
= e.
(2.14)
3 Funktionen
3.1 Grundlagen
3.1.1 Elementare Begriffe
3.1 Definition: Abbildung
Eine Abbildung f von einer Menge D in eine Menge W ordnet jedem Element x ∈ D
genau ein Element f (x) ∈ W zu. Es wird x das Urbild und f (x) das Bild von x genannt.
Es heißt D der Definitionsbereich und W die Wertemenge der Abbildung, welche notiert
wird durch
f :D→W
x 7→ f (x).
Eine Abbildung wird also festgelegt durch drei Angaben: Definitionsbereich, Wertebereich und
Zuordnungsvorschrift. Wie wir im Folgenden sehen werden, gehören Defintions- und Wertebereich genauso zu einer Abbildung wie ihre Zuordnungsvorschrift, da sie wesentlich für wichtige
Eigenschaften der Abbildung sind. Abbildungen, deren Definitionsbereich und Wertebereich
Teilmengen der reellen Zahlen sind, werden als Funktionen bezeichnet.
3.2 Definition: Funktion
Eine Funktion ist eine Abbildung f , die jedem Element x ihres Definitionsbereiches D ⊆ R
genau ein Bild f (x) ∈ W ⊂ R zuordnet.
Hierbei heißt f (D) := {y ∈ R | ∃ x ∈ D mit f (x) = y} das Bild von f über D.
3.3 Beispiel (Kugelvolumen) Wir definieren die Funktion V
V : R≥0 → R
4
r 7→ πr3 ,
3
welche aus dem Radius r einer Kugel ihr Volumen berechnet. Da wir keine negativen Radien
betrachten, schränken wir den Definitionsbereich D auf R≥0 ein. In diesem Beispiel ist also
4
D = R≥0 , V (D) = R≥0 , V (r) = πr3 .
3
Für die genauere Beschreibung von Funktionen definieren wir die folgenden Begriffe:
32
3 Funktionen
3.4 Definition: Monotonie einer Funktion
Sei f : D → R eine Funktion. f heißt
i) streng monoton wachsend genau dann, wenn
∀x1 , x2 ∈ D mit x1 < x2 gilt: f (x1 ) < f (x2 )
ii) monoton wachsend genau dann, wenn
∀x1 , x2 ∈ D mit x1 < x2 gilt: f (x1 ) ≤ f (x2 )
iii) streng monoton fallend genau dann, wenn
∀x1 , x2 ∈ D mit x1 < x2 gilt: f (x1 ) > f (x2 )
iv) monoton fallend genau dann, wenn
∀x1 , x2 ∈ D mit x1 < x2 gilt: f (x1 ) ≥ f (x2 )
v) f : (−a, a) → R heißt gerade (symmetrisch zur y - Achse) genau dann, wenn gilt:
f (−x) = f (x)
∀x ∈ (−a, a)
vi) f : (−a, a) → R heißt ungerade (punktsymmetrisch zum Ursprung) genau dann,
wenn gilt:
f (−x) = −f (x)
∀x ∈ (−a, a)
In den Teilen v) und vi) ist der Definitionsbereich D von f entweder ein endliches symmetrisches Intervall (−a, a) oder ganz R.
Ein in vielen Bereichen der Mathematik wichtiger Begriff ist der der “Linearität”. Hier wird er
für Abbildungen nach R erklärt.
3.5 Definition: Linearität
Eine Abbildung L : R → R heißt linear, genau dann wenn für alle x, y ∈ R und c ∈ R
gilt:
L(x + y) = L(x) + L(y)
L(cx) = cL(x)
(3.1)
(3.2)
3.6 Beispiele
a) Eine Gerade durch den Koordinatenursprung, gegeben durch f (x) = ax ist eine lineare
33
3 Funktionen
Funktion.
b) Eine um eine Konstante verschobenen Gerade, gegeben durch f (x) = ax+b ist nach obiger
Defintion nicht linear, auch wenn sie häufig so bezeichnet wird. Die korrekte Bezeichnung
ist “affin linear”.
c) Eine quadratische Funktion ist nicht linear. Als Beispiel sei f (x) = 3x2 betrachtet. Dann
ist
f (x) + f (y) = 3x2 + 3y 2
hingegen ist
f (x + y) = 3(x + y)2 = 3x2 + 6xy + 3y 2 .
Bedingung (3.1) ist offensichtlich nicht erfüllt, also ist f nicht linear. Dass Bedingung (3.2)
ebenfalls nicht erfüllt ist, sieht man auf die gleiche Weise durch nachrechnen.
d) Wird einer Funktion f ihre Ableitung f 0 oder eine Stammfunktion F zugeordnet, so sind
dieses Abbildungen ebenfalls linear, siehe hierzu Satz 4.12 und Folgerung 5.3.
3.1.2 Umkehrfunktion und Verkettung von Funktionen
3.7 Definition: Umkehrfunktion
Sei f : D → R und sei D0 ⊆ D. f heißt umkehrbar über D0 , wenn zu jedem y ∈ f (D0 ) die
Gleichung y = f (x) genau eine Lösung x ∈ D0 hat. Hierdurch wird die Umkehrfunktion
f −1 : f (D0 ) → D0
y 7→ x = f −1 (y)
definiert, welche jedem y ∈ f (D0 ) das durch y = f (x) eindeutig definierte x ∈ D0 zuordnet.
Die Zuordnungsvorschrift der Umkehrfunktion f −1 erhält man, indem man die Gleichung
f (x) = y nach x auflöst.
3.8 Beispiel Wir betrachten die Funktion f : R → R mit x 7→ x2 . Hier ist D = R und
W = R. Wollen wir die Umkehrfunktion f −1 berechnen, so müssen, damit die Gleichung
x2 = y stets eindeutig lösbar ist, Wertebereich und Definitionsbereich von f verkleinert werden
zu W = R≥0 und D = R≥0 . Den Graphen der Umkehrfunktion erhält man durch Spiegelung
des Funktionsgraphen an der Winkelhalbierenden:
34
3 Funktionen
y
4
y = x2
3
2
y=
√
x
1
x
1
2
3
4
Abbildung 3.1: Graph der Umkehrfunktion
Verkettung von Funktionen
Werden zwei Funktionen betrachtet, welche die Eigenschaft haben, dass der Wertebereich der
einen Funktion im Definitionsbereich der anderen enthalten ist, so können diese Funktionen
nacheinander ausgeführt werden.
3.9 Definition: Verkettung von Funktionen
Seien f : D → R und g : E → R Funktionen mit D, E ⊆ R und g(E) ⊆ D, dann wird die
Verkettung von f und g, gesprochen „f nach g“, definiert durch:
(f ◦ g) : E → R
(f ◦ g)(x) := f (g(x)).
3.10 Bemerkung Die Operation „Verkettung“ ist nicht kommutativ. Im Allgemeinen ist
(f ◦ g)(x) 6= (g ◦ f )(x), wie wir an diesem einfachen Beispiel sehen: Seien zwei Funktionen
f, g gegeben durch
f :R→R
g : R≥0 → R≥0
√
g(x) = x.
f (x) = 3x + 7
Dann ist
f ◦ g : R≥0 → R≥0
√
√
(f ◦ g)(x) = f (g(x)) = f ( x) = 3 x + 7
35
3 Funktionen
und
g ◦ f : {x ∈ R | x ≥ − 73 } → R≥0
√
(g ◦ f )(x) = g(f (x)) = g(3x + 7) = 3x + 7 ,
welches offensichtlich verschiedene Funktionen sind.
3.2 Polynome
Ein Polynom n-ten Grades ist eine Funktion vom Typ
f (x) = an xn + an−1 xn−1 + ... + a1 x + a0
mit a0 , ..., an ∈ R und an 6= 0. Man schreibt
grad(f ) = n.
Kennt man eine Nullstelle eines Polynoms, so kann man diese als Linearfaktor „abspalten“.
Hierzu betrachten wir zunächst ein Polynom 2. Grades:
f2 (x) = ax2 + bx + c
(3.3)
und nehmen an, dieses habe eine Nullstelle in x1 :
f2 (x1 ) = ax21 + bx1 + c = 0.
Dann ist f2 (x) = f2 (x) − f2 (x1 ) für jedes x ∈ R, also ist
f2 (x) = f2 (x) − f2 (x1 )
(1)
= ax2 + bx + c − (ax21 + bx1 + c)
= a(x2 − x21 ) + b(x − x1 )
(2)
= a(x − x1 )(x + x1 ) + b(x − x1 )
= (x − x1 ) · (a(x + x1 ) + b)
|
{z
}
Linearf aktor
|
{z
=:f1 (x)
}
wobei wir in (1) die Funktionsgleichung (3.3) von f2 und in (2) die binomische Formel verwendet
haben. f1 (x) = ax + (ax1 + b) ist ein Polynom 1. Grades, wir haben also f2 zerlegt in einen
Linearfaktor und ein Polynom f1 mit grad f1 = 1. Ist nun allgemein fn (x) ein Polynom n-ten
Grades und ist x1 eine Nullstelle von fn (x), so gibt es ein Polynom fn−1 (x) mit grad fn−1 =
(n − 1), so dass
fn (x) = (x − x1 ) · fn−1 (x).
36
3 Funktionen
Hat fn−1 (x) eine Nullstelle in einem x2 ∈ R, so kann man diesen Schritt wiederholen und
erhält schließlich die Darstellung
fn (x) = (x − x1 ) · . . . · (x − xk ) · fn−k (x),
wobei fn−k (x) ein Polynom vom Grad (n − k) ist und keine reellen Nullstellen hat.
3.11 Satz
Ist fn (x) ein Polynom n-ten Grades, so gilt
i) fn hat höchstens n Nullstellen.
ii) Sind x1 , . . . , xk ∈ R Nullstellen von fn (x), so gibt es ein Polynom fn−k (x), mit
grad(fn−k ) = n − k, welches keine reellen Nullstellen hat und
fn (x) = (x − x1 )(x − x2 ) · . . . · (x − xk )fn−k (x).
Man beachte, dass die x1 , . . . , xk nicht verschieden sein müssen.
iii) fn (x) konvergiert für x → ±∞:
(
a) falls n gerade
⇒
limx→±∞ fn (x) = +∞
limx→±∞ fn (x) = −∞
(
b) falls n ungerade ⇒
limx→±∞ fn (x) = ±∞
limx→±∞ fn (x) = ∓∞
falls an > 0
falls an < 0
falls an > 0
falls an < 0
iv) fn hat für ungerades n mindestens eine Nullstelle.
Spezialfälle:
1. Für n = 1 ist f (x) = ax + b mit a 6= 0, f ist eine Gerade (nicht parallel zur x-Achse) und
hat genau eine Nullstelle in x1 = − ab .
2. Für n = 2 ist f2 eine quadratische Funktion f2 (x) = ax2 + bx + c mit den möglichen
Nullstellen
v
u 2
u b
b
c
x1,2 = − ± u
−
2a u
2a
a
t
|
{z
}
=:D
⇒
f2 hat



2 reelle Nullstellen,
1 reelle Nullstelle,


keine reelle Nullstelle,
falls D > 0
falls D = 0
falls D < 0.
Hieraus ergibt sich insbesondere, dass im Falle zweier Nullstellen x1 , x2 gilt (s. Abbildung
37
3 Funktionen
3.2)
f2 (x) = a(x − x1 )(x − x2 )
und falls f2 (x) genau eine Nullstelle x1 hat, gilt:
f2 (x) = a(x − x1 )2 .
Formt man f2 (x) = ax2 + bx + c zur Scheitelpunktform
f2 (x) = a(x +
b 2 b2
) −
+c
2a
4a
um, so sieht man, dass der Graph von f stets eine verschobene und um den Faktor a
gestreckte Standardparabel ist, welcher also symmetrisch ist zur Parallelen zur y - Achse,
welche durch den Scheitelpunkt der Parabel verläuft.
R
R
x1
b
− 2a
x2
2
b
- 4a
+c
Abbildung 3.2: Symmetrieachse, Nullstellen und Scheitelpunkt einer Parabel
3.3 Rationale Funktionen
Sind p(x), q(x) Polynome mit grad(p) = n, grad(q) = m und m ≥ 1, so heißt der Quotient
f (x) =
p(x)
an xn + an−1 xn−1 + . . . a1 x + a0
=
q(x)
bm xm + bm−1 xm−1 + . . . + b1 x + b0
rationale Funktion. Der Definitionsbereich D von f ist ganz R ohne die Nullstellen des Nenners
q(x):
D(f ) = {x ∈ R | q(x) 6= 0}.
Nullstellen von f sind die Nullstellen von p welche in D(f ) liegen. Um den Verlauf des Graphen
von f skizzieren zu können, untersuchen wir das asymptotische Verhalten für x → ±∞ und
die Polstellen von f :
38
3 Funktionen
I. Asymptotisches Verhalten für x → ±∞
Es sind die 3 Fälle n < m, n = m und n > m zu untersuchen:
I.1 Ist der Grad des Zählerpolynoms kleiner als der des Nennerpolynoms, n < m, so dominiert für große Werte von x die Nennerfunktion, und es ist
lim
x→±∞
p(x)
=0
q(x)
was wir an der Funktion f (x) =
f (x) =
x−1
3x2 +x+1
beispielhaft beobachten:
1
1
x2
x−1
x − x2
=
·
3x2 + x + 1
x2 3 + x1 + x12
−→
x→±∞
0
=0
3
I.2 Stimmen Zählergrad und Nennergrad überein, n = m, so ist
lim
x→±∞
p(x)
an
.
=
q(x)
bn
was wir uns wiederrum an einem Beispiel verdeutlichen:
2x3 + x2 + 1
4x3 + 10x2 + x
2 + x−1 + x−3
=
4 + 10x−1 + x−2
2
1
−→
= .
x→±∞ 4
2
f (x) =
| : x3
∼
I.3 Ist der Zählergrad größer als der Nennergrad, n > m, dann existiert ein Polynom p(x)
∼
mit grad( p) = n − m und ein Polynom r(x) mit grad(r) < m, so dass
p(x) ∼
r(x)
= p(x) +
.
q(x)
q(x)
Hierzu betrachten wir als Beispiel
p(x)
2x3 − x − 1
=
q(x)
x2 − 1
Mittels Polynomdivision erhält man
=r(x)
2x3
z }| {
x−1
−x−1
= |{z}
2x + 2
.
−1
x
− 1}
∼
|
{z
= p(x)
x2
=q(x)
∼
3
2x −x−1
Für x → ±∞ verhält sich p(x)
wie die Gerade p(x) = 2x. da aus I.1 folgt,
q(x) =
x2 −1
x−1
dass limx→±∞ x2 −1 = 0 da grad(r) < grad(q) ist. Wir sehen hier, dass für große Werte
39
3 Funktionen
von x wiederum in p(x) und q(x) die Terme höchster Ordnung dominieren, so dass sich
f verhält wie eine Polynom vom Grad (n − m).
II. Polstellen:
Mögliche Polstellen sind die Nullstellen der Nennerfunktion. Hat q(x) in x0 eine Nullstelle,
q(x0 ) = 0, so können wir q(x) schreiben als
∼
q(x) = (x − x0 )k · q(x),
(3.4)
∼
wobei q(x0 ) 6= 0 ist und k die Vielfachheit der Nullstelle angibt. Zu untersuchen ist nun, ob
auch die Zählerfunktion p(x) in x0 eine Nullstelle hat oder nicht:
II.1 Ist p(x0 ) 6= 0, dann ist
p(x)
1
p(x)
=
·∼ ,
k
q(x)
(x − x0 ) q(x)
wobei
p(x0 )
q (x0 )
∼
6= 0 ist. Dann hat
p(x)
q(x)
in x0 einen Pol der Ordnung k, der Pol ist
mit Vorzeichenwechsel,
ohne Vorzeichenwechsel,
falls k ungerade
falls k gerade ist.
∼
∼
II.2 Ist p(x0 ) = 0, dann ist analog zu (3.4) p(x) = (x − x0 )j p(x0 ) mit p(x0 ) 6= 0, so dass
∼
(x − x0 )j p(x)
p(x)
=
·
,
q(x)
(x − x0 )k ∼
q(x)
∼
∼
wobei q(x0 ) 6= 0 und p(x0 ) 6= 0. Nun sind die Fälle j ≥ k und j < k zu unterscheiden:
i) j ≥ k: x0 ist eine hebbare Singularität, denn es ist
f (x) =

∼
p(x)

(x − x0 )j−k · ∼
p(x)
= ∼
 p(x)
q(x) 
∼
q (x)
falls j > k
falls j = k,
q (x)
∼
so dass f (x0 ) = 0 im Falle j > k und f (x0 ) =
p(x0 )
q (x0 )
∼
im Falle j = k gilt.
ii) j < k: x0 ist ein Pol der Ordnung k − j
∼
f (x) =
p(x)
1
p(x)
=
·∼ .
k−j
q(x)
(x − x0 )
q(x)
3.12 Beispiel Gegeben sei die Funktion
f (x) =
p(x)
2x3 − x − 1
=
.
q(x)
x2 − 1
Hier hat q(x) zwei Nullstellen, x1 = 1 und x2 = −1.
40
3 Funktionen
1. x1 = 1: Es ist q(1) = 0 und p(1) = 0,
∼
p(x)
x − 1 2x2 + 2x + 1
x − 1 p(x)
=
·
=
·
,
q(x)
x−1
x+1
x−1 ∼
q(x)
∼
∼
und da p(1) 6= 0 und q(1) 6= 0, liegt der Fall k = j, also II.2 i) vor. Daher hat f in x0 = 1
eine hebbare Singularität und wir setzen
∼
f (1) =
p(1)
∼
q(1)
=
5
2+2+1
= .
1+1
2
2. x2 = −1: Es ist q(−1) = 0 und p(−1) = −2. Da q(x) = (x − 1)(x + 1) ist, ist x2 = −1
eine Polstelle der Ordnung 1:
p(x)
1
2x3 − x − 1
,
=
·
q(x)
x+1
x
−
1
| {z }
∼
= q (x)
es liegt also der Fall II.1 vor mit k = 1, daher ist x2 = −1 eine Polstelle mit Vorzeichenwechsel.
3.4 Die allgemeine Potenzfunktion
Zunächst ist die Potenzfunktion f (x) = xα durch
xα := |x · .{z
. . · x}
(3.5)
α−mal
nur definiert für positive ganze Zahlen α ∈ N. Diese
Definition wollen wir verallgemeinern für
√
− 25
2
und x definiert sind. Wir gehen schrittweise vor:
α ∈ R, so dass auch Terme vom Typ x
1.) Für Werte α ∈ Z und α < 0 definieren wir
xα =
1
.
x−α
(3.6)
Beachte hierbei, dass −α > 0 ist, also durch Gleichung (3.5) erklärt. Für diese Erweiterung muss x ∈ R \ {0} gelten.
1
2.) Es wird x n definiert als das Urbild der umkehrbaren Funktion f : [0, ∞) → [0, ∞),
√
1
f (x) = xn . Man schreibt hierfür auch x n = n x. Diese Defintion ist nur möglich für
x ∈ R>0 .
3.) Für α =
m
n ,m
∈ Z, n ∈ N definieren wir
m
1
xa = x n = (x m )n .
Jetzt ist der Ausdruck xα definiert für alle α ∈ Q und x ∈ R>0 .
41
3 Funktionen
4.) Nun sei α ∈ R. Wir nähern α durch Brüche an, wie wir es in Beispiel 2.10 f) getan haben.
Sei (an )n∈N eine Folge aus Q, mit limn→∞ an = α, so setzen wir
xα = lim xan .
n→∞
Damit ist die Potenzfunktion f (x) = xα definiert für jede Potenzα ∈ R und Argumente x ∈ R.
R
a>1
4
a<0
a=1
3
2
0<a<1
1
a=0
R
1
2
3
4
Abbildung 3.3: Qualitativer Verlauf der Graphen von xa
3.13 Bemerkung Für die oben definierten Potenzfunktionen gelten die folgenden Rechenregeln:
xα+β = xα xβ
α β
αβ
(x ) = x
α
α
(3.7)
(3.8)
α
(x y) = x y .
(3.9)
3.5 Die allgemeine Exponentialfunktion
Nun vertauschen wir in Gleichung (3.5) die Rollen von Exponent und Basis. Zu einer festen
Basis a sei der Exponent das Argument der Funktion, so definieren wir durch
expa : R → R>0
x 7→ a
(3.10)
x
die Exponentialfunktion zur Basis a. Aus den Rechenregeln (3.7) der Potenzfunktion ergibt
sich unmittelbar die Funktionalgleichung der Exponentialfunktion
expa (x + y) = expa (x) expa (y).
42
(3.11)
3 Funktionen
Ferner folgen aus (3.8) und (3.9) die Rechenregeln
(expa (x))y = expa (x y)
(3.12)
expa (x) expb (x) = expa b (x).
(3.13)
Die Exponentialfunktion ist definiert für Basen a ∈ R>0 und Argumente x ∈ R. In Abbildung 3.4 der Verlauf des Graphen der Exponentialfunktion für verschiedene Werte der Basis
a dargestellt.
R
0<a<1
a>1
a=1
R
Abbildung 3.4: Der Graph der allgemeinen Exponentialfunktion expa (x)
3.5.1 Exponentialfunktion zur Basis e
Stellen wir uns nun vor, wie sich der Graph der allgemeinen Exponentialfunktion verändert,
wenn ausgehend von a = 1 die Basis a immer größer wird, dann sehen wir, dass es gerade eine
Basis ã gibt, für die der Graph expã (x) immer oberhalb der Funktion f (x) = 1 + x liegt, siehe
hierzu Abbildung 3.5. Diese Basis bezeichnen wir mit e und wir werden später sehen, dass die
so definierte Zahl e übereinstimmt mit der Eulerschen Zahl e, die wir in den Beispielen 2.2 d)
und 2.15 g) kennengelernt haben als Grenzwert einer unendlichen Reihe.
R
ex
1+x
R
Abbildung 3.5: Es ist expe (x) ≥ 1 + x für alle x ∈ R
43
3 Funktionen
Wäre die Basis der Exponentialfunktion in Abbildung 3.5 kleiner, so verliefe der Graph
flacher und für einige x > 1 wäre ex < 1 + x. Wäre hingegen die Basis größer, so verliefe der
Graph steiler und es wäre ex < 1 + x für einige x < 0.
3.14 Folgerungen
1) Die Exponentialfunktion ist positiv, dieses folgt aus ihrer Definition mittels der allgemeinen
Potenzfunktion in Abschnitt 3.4.
2) Da ex > 1 + x gilt, ist ex > 1 für x > 0.
3) Die Exponentialfunktion ist streng monoton wachsend, denn aus x < y folgt ex < ey :
x
x
ey = e(y−x)+x = e| y−x
{z } · e > e ,
>1
da y − x > 0, so dass nach Folgerung 2) ey−x > 1 gilt.
4) Für das asymptotische Verhalten der Exponentialfunktion gilt
lim ex = ∞,
lim
x→∞
x→−∞
ex = 0.
3.6 Die allgemeine Logarithmusfunktion
Aus den Folgerungen 3.14 3) und 4) folgt, dass die Exponentialfunktion expa : R → R>0 für
a 6= 1 umkehrbar ist. Die Umkehrfunktion heißt Logarithmusfunktion zur Basis a und wird
notiert durch:
loga : R>0 → R
(3.14)
y 7→ loga (y)
mit a > 0 und a 6= 1. Es gilt also
⇐⇒
x = loga (y)
ax = y.
(3.15)
Dieses impliziert insbesondere dass
aloga (y) = y
∀y ∈ R>0
(3.16)
loga (ax ) = x
∀x ∈ R.
(3.17)
und
Funktionalgleichung:
Aus der Funktionalgleichung der Exponentialfunktion (3.11) lässt sich eine Funktionalgleichung
für den Logarithmus herleiten:
loga (x y) = loga (x) + loga (y),
44
(3.18)
3 Funktionen
denn es ist
loga (x y) = loga (aloga (x) aloga (y) )
= loga (a
loga (x)+loga (y)
| folgt aus (3.16)
| folgt aus (3.11)
)
| folgt aus (3.17)
= loga (x) + loga (y)
Als verallgemeinerung der Funktionalgleichung (3.18) gilt das Logarithmengesetz
loga (xα ) = α loga (x)
(3.19)
3.15 Folgerungen
1) Es ist loga (1) = 0, was aus a0 = 1 folgt.
2) Eine wichtige Folgerung aus der Funktionalgleichung und Folgerung 1) ist:
⇐⇒
⇐⇒
⇐⇒
loga (1) = 0
x
loga ( ) = 0
x
1
loga (x) + loga = 0
x
1
loga ( ) = − loga (x).
x
x
einsetzen
x
| (3.18) anwenden
|1=
(3.20)
3) Aus der Funktionalgleichung (3.18) und Folgerung a) folgt
x
loga ( ) = loga (x) − loga (y).
y
(3.21)
4) Ein Spezialfall des Logarithmengesetzes (3.19) ist
loga (xn ) = loga (x · . . . · x) = loga (x) + . . . + loga (x) = n loga (x)
für natürliche Zahlen n ∈ N.
Der natürliche Logarithmus
Dir Logarithmusfunktion zur Basis e heißt natürlicher Logarithmus:
ln : R>0 → R
y 7→ ln (y)
und es ist ln (y) = x, für das x, für welches ex = y gilt. Dann ist:
eln (y) = y
∀y ∈ R>0
(3.22)
ln (ex ) = x
∀x ∈ R.
(3.23)
und
45
3 Funktionen
Basiswechsel der Logarithmusfunktion
Möchte man die Basis eines Logarithmus wechseln, so erhält man wie folgt eine Formel: Ist
ay = x, so ist y = loga (x). Also erhält man mit ln(ay ) = y ln(a) dass
ay = x
| logb anwenden
y
| folgt aus (3.19)
⇐⇒
logb (a ) = logb (x)
⇐⇒
y logb (a) = logb (x)
logb (x)
y=
logb (a)
⇐⇒
so dass wir mit y = loga (x) eine Formel zum Basiswechsel erhalten:
⇐⇒
loga (x) =
logb (x)
.
logb (a)
(3.24)
3.7 Trigonometrische Funktionen
Die Winkelfunktionen sin(t) und cos(t) lassen sich geometrisch definieren. Betrachten wir den
Einheitskreis S = {(x, y) ∈ R2 | x2 + y 2 = 1} und tragen auf dem Kreisbogen die Bogenlänge t
entgegen dem Uhrzeigersinn ab, so erhalten wir den Punkt (x(t), y(t)). Die Winkelfunktionen
werden nun über dessen x - und y - Koordinaten definiert:
cos(t) := x(t),
sin(t) := y(t).
(3.25)
y(t)
cos(t) 1
1
sin(t)
t
sin(t)
x(t)
-1
cos(t)
1
t
−2π
-1
− 32 π
−π
− π2
+ π2
-1
Abbildung 3.6: Definition von cos(t) und sin(t)
Aus dieser Definition ergeben sich unmittelbar die folgenden Eigenschaften:
46
π
3
2π
2π
3 Funktionen
3.16 Folgerungen
a) Aus dem Satz des Pythagoras folgt
cos2 (t) + sin2 (t) = 1
(3.26)
für jedes t ∈ R.
b) Die Funktionen sin(t) und cos(t) sind 2π - periodisch, es ist
cos(t + 2π) = cos(t),
sin(t + 2π) = sin(t)
(3.27)
woraus wegen sin(0) = 0 und Gleichung cos( π2 ) = 0 insbesondere
sin(t) = 0
⇔ t = kπ
für ein k ∈ Z
(3.28)
cos(t) = 0
π
⇔ t = kπ +
2
für ein k ∈ Z
(3.29)
folgt.
c) Ebenfalls aus der Definition (3.25) folgen die Symmetrieeigenschaften (Vergleiche hierzu
auch Definition 3.4 v) und vi).)
sin(−t) = − sin(t),
cos(−t) = cos(t).
(3.30)
d) Die Graphen von cos(t) und sin(t) sind gegeneinander verschoben (s. Abbildung 3.6):
cos(t +
π
) = − sin(t),
2
sin(t +
π
) = cos(t)
2
e) Elementargeometrisch lassen sich die Additionstheoreme
sin(t + s) = sin(t) cos(s) + sin(s) cos(t)
(3.31)
cos(t + s) = cos(t) cos(s) − sin(t) sin(s)
(3.32)
beweisen.
Die Funktionen tan(t) und cot(t) werden definiert durch
π
tan : R \ {(2k + 1) | k ∈ Z} → R,
2
cot : R \ {kπ | k ∈ Z} → R,
sin(t)
cos(t)
cos(t)
cot(t) =
,
sin(t)
tan(t) =
(3.33)
(3.34)
die Einschränkungen der Definitionsbereiche ergben sich aus den Nullstellen der sin - und cos
- Funktionen, s. (3.28). Aus ihrer Definition ergibt sich, dass die tan - und cot - Funktion
periodisch sind mit Periode π. Da die trigonometrischen Funktionen periodisch sind, sind sie
47
3 Funktionen
nicht umkehrbar ohne dass zuvor die Definitionsbereiche geeignet eingeschränkt werden.
π π
sin : [− , ] → [−1, 1]
2 2
cos : [0, π] → [−1, 1]
π π
tan : (− , ) → R
2 2
cot : (0, π) → R
R
π π
arcsin : [−1, 1] → [− , ]
2 2
ist umkehrbar mit arccos : [−1, 1] → [0, π]
π π
ist umkehrbar mit arctan : R → (− , )
2 2
ist umkehrbar mit arccot : R → (0, π).
ist umkehrbar mit
tan(t)
R
+ π2
R
− 32 π
− π2
+ π2
R
3
2π
arctan(t)
− π2
Abbildung 3.7: tan(t) und arctan(t)
R
R
+ π2
1
R
R
− π2
+ π2
-1
-1
1
− π2
Abbildung 3.8: sin(t) und arcsin(t)
48
3 Funktionen
3.8 Sigmoidfunktionen
Von besonderem Interesse in Biologie und Chemie sind Funktionen, mit denen sich Sättigungsprozesse beschreiben lassen. Hierzu gibt es einerseits Funktionen, wie zum Beispiel
f (t) = S − c e−kt ,
(3.35)
welche mit den Parametern S, c ∈ R und k ∈ R>0 gegen den Sättigungswert S streben.
Ist c > 0, so beschreibt diese Funktion einen Zerfallsprozess, ist c < 0, so beschreibt sie
einen Wachstumsprozess, siehe hierzu Abbildung 3.9. Der Verlauf dieser Kurve berücksichtigt
f (t)
c<0
S
c>0
t
Abbildung 3.9: Beschränktes Wachstum, beschränkter Zerfall
nun jedoch noch nicht, dass viele Prozesse auch zu Beginn nur eine kleine Änderungsrate
(bzw. Wachstumsrate) haben, diese ansteigt und ein Maximum erreicht, die Änderungsrate
dann aber wieder abnimmt und die Funktion sich einem Sättigungswert nähert. Funktionen,
deren Verlauf ein solches Verhalten wiedergeben, werden als Sigmoidfunktionen bezeichnet,
ihr Graph erinnert an ein langgestrecktes, liegendes „S“. Beispiele hierfür sind die Funktion
arctan(x) (siehe Abbildung 3.7) oder auch die Funktion
P (t) =
K
1+
K−P0 −cKt
P0 e
,
deren Graph in Abbilung 3.10 dargestellt ist.
P (t)
K
t
Abbildung 3.10: Qualitativer Verlauf des logistischen Wachstums
49
4 Differentialrechnung
4.1 Grenzwert einer Funktion, Stetigkeit
Sei I ⊆ R ein offenes Intervall mit einem Punkt a ∈ I und f eine Funktion die auf I, eventuell
mit Ausnahme des Punktes a, definiert ist:
f : I\{a} → R
4.1 Definition: Grenzwert einer Funktiom
Eine Funktion f : I\{a} → R hat in a den Grenzwert c ∈ R, wenn für jede beliebige
Folge (xn )n∈N aus I mit limn→∞ xn = a gilt:
lim f (xn ) = c.
n→∞
Hierfür schreibt man auch
lim f (x) = c,
x→a
wobei durch die Notation x → a zum Ausdruck kommt, dass der Grenzwert c nicht von der
Wahl einer speziellen Folge (xn )n∈N abhängig sein darf.
4.2 Beispiele
a) Wähle I = (−1, 1) und untersuche f (x) =
lim
n→∞
1
x
an der Stelle a = 0. Für xn :=
1
n
ist
1
= lim n = ∞,
xn n→∞
also hat f keinen Grenzwert in a = 0, da ∞ ∈
/ R.
b) Wähle I = (−2, 2) und untersuche f (x) = x2 an der Stelle a = 1, 5. Es sei (xn )n∈N eine
50
4 Differentialrechnung
beliebige Folge mit limn→∞ xn = a. Zu zeigen, ist, dass limn→∞ f (xn ) existiert:
lim f (xn ) = lim x2n
n→∞
n→∞
(∗)
= lim xn lim xn
n→∞
n→∞
= 1, 52 = 2, 25.
Wir sehen, dass unabhängig von der gewählten Folge (xn )n∈N die Folge der Funktionswerte
gegen den gleichen Grenzwert konvergiert. Die Funktion f (x) = x2 hat daher in a = 1, 5
den Grenzwert 2, 25.
4.3 Definition: Stetigkeit
i) Eine Funktion f : I → R heißt stetig an der Stelle a ∈ I genau dann wenn
lim f (x) = f (a).
x→a
ii) f : I → R heißt stetig auf dem Intervall I genau dann wenn f stetig in jedem a ∈ I
ist.
4.4 Satz: Stetige Funktionen
i) Sind f und g auf einem Intervall I ⊆ R stetige Funtkionen und α ∈ R, so sind auch
die Funktionen (f + g), (f · g) und αf stetig auf I. fg ist stetig in allen x ∈ I mit
g(x) 6= 0.
ii) Sind f : I → R, g : D → R stetig und g(D) ⊆ I, dann ist auch die Verkettung
h = f ◦ g,
h: D→R
h(x) = f (g(x))
stetig auf D.
4.5 Beispiele
a) f (x) = x ist stetig auf ganz R: Sei a ∈ R beliebig und (xn )n∈N eine Folge mit limn→∞ xn =
a. Dann ist
lim f (xn ) = lim xn = a = f (a).
n→∞
n→∞
51
4 Differentialrechnung
Also ist
lim f (xn ) = f (a).
n→∞
b) Aus Beispiel a) folgt zusammen mit dem Satz 4.4, dass alle Polynome auf R stetig sind
und alle rationalen Funktionen auf ihrem Definitionsbereich stetig sind.
c) sin (x), cos (x) und ex sind stetig auf R, ln(x) ist stetig auf R>0 . (ohne Beweis)
4.6 Satz
Seien a, b ∈ R, a < b, und f : [a, b] → R eine auf dem abgeschlossenen Intervall [a, b]
stetige Funktion.
i) (Zwischenwertsatz) Dann nimmt f jeden Wert zwischen f (a) und f (b) an. Zu jedem
c ∈ R mit f (a) ≤ c ≤ f (b), bzw. f (a) ≥ c ≥ f (b), gibt es ein x ∈ [a, b] so dass
f (x) = c.
ii) (Existenz von Minimum und Maximum) Es existieren x− , x+ ∈ [a, b], so dass f in
diesen Punkten ihren größten bzw. kleinsten Funtionswert auf dem Intervall [a, b]
annimmt:
f (x− ) ≤ f (x) ≤ f (x+ )
∀x ∈ [a, b].
4.7 Bemerkung Aus i) folgt speziell: Ist f : [a, b] → R stetig und f (a) < 0 und f (b) > 0,
dann hat f hat eine Nullstelle in [a, b]:
∃ y ∈ [a, b] mit f (y) = 0.
Um die Aussage von Satz 4.6 Teil ii) zu veranschaulichen, betrachten wir die folgenden Beispiele:
4.8 Beispiele
a) Sei f (x) = x2 auf dem Intervall [a, b] = [−2, 3]. Dann ist 0 ≤ x2 ≤ 9 für alle x ∈ [−2, 3]
und da f (0) = 0 und f (3) = 9 ist
x− = 0 und
x+ = 3.
b) Die Funktion
(
f (x) =
1
,
x2
0,
x 6= 0
x=0
ist auf dem Intervall I = [−1, 1] nicht stetig und es gibt kein x+ , denn limx→0
52
1
x2
=∞
4 Differentialrechnung
c) Sei I = [0, 4] und
(
f (x) =
3x,
1,
x<2
x ≥ 2.
Es gibt kein x+ an welchem das Maximum der Funktionswerte auf I = [0, 4] angenommen
wird, denn es müsste f (x+ ) = 6 sein, so ein x+ gibt es nicht, da f (2) = 1.
4.2 Ableitung einer Funktion
4.2.1 Definition der Ableitung
4.9 Definition
Sei f : I → R, I = (a, b) sei ein offenes Intervall und x0 ∈ I.
i) f heißt an der Stelle x0 ∈ I differenzierbar, falls der Grenzwert der Differenzen(x0 )
quotienten f (x)−f
existiert. Der Grenzwert heißt Ableitung von f an der Stelle
x−x0
x0 und man schreibt
f 0 (x0 ) = lim
x→x0
f (x) − f (x0 )
.
x − x0
(4.1)
ii) Ist f in jedem x0 ∈ I differenzierbar, so heißt f differenzierbar auf I und f 0 heißt
Ableitung von f .
Eine äquivalente Formulierung zu obiger Definition ist durch
f 0 (x0 ) = lim
h→0
f (x0 + h) − f (x0 )
h
gegeben, was man aus (4.1) erhält, wenn man h = x − x0 setzt. Legen wir an den Graphen von
f eine Tangente tx0 (x) an, so ist diese eine Gerade mit Steigung f 0 (x0 ), welche den Graphen
von f in x0 berührt (tx0 (x0 ) = f (x0 )) und wird beschrieben durch Gleichung
tx0 (x) = f (x0 ) + f 0 (x0 )(x − x0 )
(4.2)
siehe hierzu Abb. 4.1. Die Tangente ist eine lineare Approximation von f in der Nähe von x0 :
f (x) = f (x0 ) + f 0 (x0 )(x − x0 ) +rx0 (x).
|
{z
linear in x
(4.3)
}
Hier ist rx0 eine sogenannte Fehlerfunktion, welche die Abweichung der Funktion f (x) von der
Tangente tx0 (x) beschreibt.
4.10 Bemerkung Ist f differenzierbar in x0 , dann ist f auch stetig in x0 .
53
4 Differentialrechnung
R
f (x)
tx0 (x)
rx0 (x)
R
-3
-2
-1
1
x0
3
Abbildung 4.1: Funktion f (x) und Tangente tx0 (x) in x0 = 2
4.11 Beispiele
a) f (x) = c ist differenzierbar in jedem x0 ∈ R:
=⇒
f (x) − f (x0 )
c−c
=
=0
x − x0
x − x0
f (x) − f (x0 )
f 0 (x0 ) = lim
=0
x→x0
x − x0
b) f (x) = mx + c ist differenzierbar in jedem x0 ∈ R:
mx + c − (mx0 + c)
f (x) − f (x0 )
=
=m
x − x0
x − x0
f (x) − f (x0 )
⇒
f 0 (x0 ) = lim
=m
x→x0
x − x0
c) f (x) = x2 ist differenzierbar in jedem x0 ∈ R:
f (x) − f (x0 )
x2 − x20
(x − x0 )(x + x0 )
=
=
= x + x0 −→ 2x0
x→x0
x − x0
x − x0
x − x0
0
⇒
f (x0 ) = 2x0
54
4 Differentialrechnung
4.2.2 Ableitung der elementaren Funktionen
4.12 Satz: Elementare Ableitungsregeln
Seienf, g : I → R aus I differenzierbar. Dann ist auch
i) (f + g) : I → R differenzierbar, mit
(f + g)0 (x) = f 0 (x) + g 0 (x)
(Summenregel)
ii) (f · g) : I → R differenzierbar, mit
(f · g)0 (x) = f 0 (x)g(x) + f (x)g 0 (x)
iii)
f
g
(Produktregel)
: I → R differenzierbar (falls g(x) 6= 0), mit
0
f
g
(x) =
f 0 (x)g(x) − f (x)g 0 (x)
(g(x))2
(Quotientenregel)
iv) Ist g : I → I, so ist auch (f ◦ g) : I → R differenzierbar, mit
(f ◦ g)0 (x) = f 0 (g(x)) · g 0 (x)
Beweis.
(Kettenregel)
i) Wir wenden Definition 4.9 auf die Summe f + g an und erhalten
(f (x) + g(x)) − (f (x0 ) + g(x0 ))
x→x0
x − x0
f (x) − f (x0 ) g(x) − g(x0 )
(∗)
= lim
+
x→x0
x − x0
x − x0
0
0
= f (x0 ) + g (x0 ),
(f + g)0 (x0 ) = lim
wobei wir in (∗) lediglich die Summanden im Zähler umgestellt haben.
ii) Wiederum wenden wir Definition 4.9 an und fügen in der Umformung (∗) im Zähler
−f (x0 )g(x) + f (x0 )g(x) ein:
(f (x)g(x)) − (f (x0 )g(x0 ))
x − x0
f (x)g(x) − f (x0 )g(x) + f (x0 )g(x) − f (x0 )g(x0 )
= lim
x→x0
x − x0
(f · g)0 (x0 ) = lim
x→∞

(∗)

 f (x) − f (x )
g(x) − g(x0 ) 
0


g(x) +f (x0 )

x→x0 
| {z }
x − x0
x − x0 
|
{z
} →g(x0 )
|
{z
}
= lim 
→f 0 (x0 )
0
→g 0 (x0 )
0
= f (x0 )g(x0 ) + f (x0 )g (x0 )
Hier folgt limx→x0 g(x) = g(x0 ) aus der Stetigkeit von g.
55
4 Differentialrechnung
iv) Wir wenden Definition 4.9 auf die Verkettung an und erweitern den Differenzenquotienten
mit g(x) − g(x0 ):
f (g(x)) − f (g(x0 ))
x − x0
f (g(x)) − f (g(x0 )) g(x) − g(x0 )
= lim
·
x→x0
x − x0
g(x) − g(x0 )
f (g(x)) − f (g(x0 )) g(x) − g(x0 )
= lim
·
x→x0
g(x) − g(x0 )
x − x0
0
0
= f (g(x0 )) · g (x0 ).
(f ◦ g)0 (x0 ) = lim
x→x0
Hiermit können wir die ersten elementaren Funktionen ableiten:
1. Polynome: Aus (xk )0 = k xk−1 folgt für allgemeine Polynome f (x) = an xn +an−1 xn−1 +
. . . + a1 x + a0
f 0 (x) = n an xn−1 + (n − 1)an−1 xn−2 + . . . + a1
2. Rationale Funktionen: Rationale Funktionen f (x) =
abgeleitet werden durch
f 0 (x) =
p(x)
q(x)
können mit der Kettenregel
q(x)p0 (x) − q 0 (x)p(x)
,
(q(x))2
wobei p0 (x) und q 0 (x) nach der Regel a) für Polynome abgeleitet werden. Speziell gilt für
p(x) = 1:
1
q(x)
0
p (x) = 0
f (x) =
⇒
⇒
1
q(x)
0
=−
q 0 (x)
,
(q(x))2
womit wir beispielsweise ( x1 )0 = − x12 erhalten.
3. Exponentialfunktion zur Basis e: Die Exponentialfunktion zur Basis e, welche wir
hier durch exp(x) notieren, wurde in Abschnitt 3.5.1 eingeführt als diejenige Exponentialfunktion, deren Tangente im Punkt x = 0 die Gerade t0 (x) = 1 + x ist, siehe hierzu
Abbildung 3.5. Hieraus ergibt sich, dass die Ableitung der Exponentialfunktion in der
Stelle x = 0 gleich der Steigung der Tangente t0 (x) ist:
exp0 (0) = 1
56
4 Differentialrechnung
es gilt also für den Differenzenquotienten
exp(h) − exp(0)
= 1.
h→0
h
lim
Wollen wir nun die Exponentialfunktion an einer anderen Stelle x ∈ R ableiten, so
verwenden wir die Ableitung an der Stelle 0 und die Funktionalgeleichung der Exponentialfunktion:
exp(h) − exp(0)
exp(x + h) − exp(x)
= lim exp(x)
h→0
h→0
h
h
exp(h) − exp(0)
= exp(x) lim
= exp(x).
h→∞
h
exp0 (x) = lim
4. Trigonometrische Funktionen: Für alle x ∈ R gilt (ohne Beweis)
sin0 (x) = cos(x),
sin (x)
cos (x)
Aus hieraus folgt für tan (x) :=
cos0 (x) = − sin(x)
mit der Quotientenregel:
cos (x) cos (x) + sin (x)(− sin (x))
cos2 (x)
cos2 (x) + sin2 (x) (∗)
=
= 1 + tan2 (x),
cos2 (x)
tan0 (x) =
wobei in (∗) ebenso zu tan0 (x) =
1
cos2 (x)
(4.4)
umgeformt werden kann.
4.13 Beispiele
a) Summenregel:
f (x) = x2 + sin (x)
⇒
f 0 (x) = 2x + cos (x)
b) Produktregel:
f (x) = x2 · sin (x)
⇒
f 0 (x) = 2x · sin (x) + x2 · cos (x)
c) Die Funktion h(x) = sin (x2 ) leiten wir mit der Kettenregel ab, in dem wir in h(x) =
f (g(x)) als äußere Funktion f (y) = sin (y) und als innere Funktion g(x) = x2 einsetzen.
57
4 Differentialrechnung
Dann ist
h0 (x) = f 0 (g(x)) · g 0 (x)
= sin0 (g(x)) · (x2 )0
= cos(g(x)) · 2x
= cos (x2 ) · 2x.
Die Logarithmusfunktion, die allgemeine Potenzfunktion und die Umkehrungen der trigonometrischen Funktionen können wir bisher nicht ableiten. Hier hilt der folgende Satz weiter, der
sich aus der Kettenregel folgern lässt.
4.14 Satz: Ableitung der Umkehrfunktion
Ist f differenzierbar und umkehrbar auf I, und ist f 0 (x0 ) 6= 0, so ist die Umkehrfunktion
f −1 differenzierbar und
(f −1 )0 (f (x0 )) =
1
.
f 0 (x0 )
(4.5)
Mit y0 := f (x0 ) und x0 := f −1 (y0 ) erhält Gleichung (4.5) die Form
(f −1 )0 (y0 ) =
1
f 0 (f −1 (y
0 ))
.
(4.6)
Beweis. Zum Beweis betrachten wir die Identität (f −1 ◦ f )(x) = x und leiten diese Gleichung
auf beiden Seiten ab. Dann ist mit der Kettenregel ( Satz 4.12 iv))
(f −1 ◦ f )0 (x) = 1
⇐⇒
(f −1 )0 (f (x)) · f 0 (x) = 1
(f −1 )0 (f (x)) =
⇐⇒
1
f 0 (x)
Nun ergeben sich weitere Möglichkeiten, uns bekannte Funktionen abzuleiten:
1. Logarithmusfunktion: Da ln (y) als Umkehrfunktion von ex definiert ist, berechnen wir
die Ableitung (ln (y))0 mit Satz 4.14. Es ist f (x) = ex zu wählen so dass f −1 (y) = ln (y)
ist und (ln (y))0 = (f −1 (y))0 gilt. Also ist nach (4.6)
(ln(y))0 =
1
f 0 (f −1 (y))
=
=
1
ef −1 (y)
1
eln (y)
=
1
.
y
(4.7)
2. Umkehrungen der trigonometrischen Funktionen: Die Ableitung von arctan (y)
58
4 Differentialrechnung
können wir nun ebenfalls berechnen. Nach Satz 4.14 ist
arctan0 (y) =
=
1
tan0 (arctan (y))
1
1
=
.
1 + y2
1 + tan2 (arctan (y))
(4.8)
Wollen wir arcsin (x) ableiten, so erhalten wir:
arcsin0 (x) =
1
sin0 (arcsin (x))
Wobei im Schritt (∗) cos (y) =
=
1
1
(∗)
= √
cos (arcsin (x))
1 − x2
(4.9)
p
1 − (sin (y))2 verwendet wurde mit y = arcsin (x).
3. Allgemeine Potenzfunktion: Nicht nur für c ∈ N, sondern auch für allgemeine Exponenten c ∈ R gilt:
f (x) = xc
⇒
f 0 (x) = c · xc−1 .
c
Um diese Regel herzuleiten schreiben wir xc = eln(x ) und wenden das Logarithmengesetz
(3.19) an, so dass wir
xc = ec ln(x)
erhalten. Diesen Term können wir mit der Kettenregel und Beispiel 4.7 ableiten:
(ec ln (x) )0 = (c ln (x))0 · ec ln (x)
1
= c · xc
x
= c · xc−1
4. Allgemeine Exponentialfunktion: Die Ableitung folgt ebenfalls aus der Darstellung
ax = ex ln (a) und der Kettenregel:
(ax )0 = (ex ln (a) )0
= ln (a) · ex ln (a)
= ln (a) · ax
5. Allgemeiner Logarithmus: Die Ableitung folgt aus Beispiel 4.7 und der Formel (3.24)
für den Basiswechsel der Logarithmusfunktion:
(loga (x))0 = (
1
1
1
ln x)0 =
· .
ln(a)
ln (a) x
59
4 Differentialrechnung
4.3 Anwendungen der Differentialrechnung
4.3.1 Lokale Extrema
4.15 Definition
Die Funktion f : (a, b) → R hat in x0 ∈ (a, b) ein lokales Maximum genau dann, wenn es
eine Umgebung U = (x0 − , x0 + ) von x0 gibt, so dass
f (x) ≤ f (x0 )
∀x ∈ U .
Entsprechend hat f in x0 ein lokales Minimum, wenn f (x) ≥ f (x0 ) für alle x ∈ U gilt.
4.16 Satz
Hat f : (a, b) → R in x0 ∈ (a, b) ein lokales Maximum oder Minimum und ist f in x0
differenzierbar, so ist
f 0 (x0 ) = 0.
Beweis. Hat f in x0 ein lokales Maximum, so gilt für ein > 0, dass alle x ∈ (a, b), deren
Abstand von x geringer ist als Funktionswerte kleiner als f (x0 ) haben:
|x − x0 | < ⇒ f (x) − f (x0 ) ≤ 0.
Also wechselt der Differenzenquotient in x0 sein Vorzeichen,
f (x) − f (x0 )
x − x0
(
≤ 0 falls x ≥ x0
≥ 0 falls x ≤ x0 ,
so dass für den Grenzwert gelten muss
f 0 (x0 ) = lim
x→x0
f (x) − f (x0 )
= 0.
x − x0
Hat f in x0 ein lokales Minimum, so verläuft der Beweis ananlog.
4.3.2 Mittelwertsatz/Monotonie
4.17 Satz: Mittelwertsatz der Differentialrechnung
Ist f : [a, b] → R differenzierbar, so existiert ein x0 ∈ (a, b) in welchem die Steigung des
Graphen von f gerade gleich der Steigung der Sekante durch die Punkte (a, f (a)) und
(b, f (b)) ist:
f 0 (x0 ) =
f (b) − f (a)
.
b−a
60
4 Differentialrechnung
Wie man in Abbildung 4.2 sieht, kann es auch mehrere x0 , x1 geben in denen
f 0 (x0 ) = f 0 (x1 ) =
gilt. Hier ist a = 0 und b =
Steigung.
9
2
f (b) − f (a)
b−a
und es gibt zwei Tangenten (grün) mit zur Sekante (blau) gleicher
R
2
1
R
1
2
3
b=
9
2
Abbildung 4.2: Mittelwertsatz der Differentialrechnung
Beweis. Wir betrachten die folgende Hilfsfunktion:


 f (b) − f (a)



(x − b) + f (b)


b
−
a
|
{z
}
g(x) := f (x) − 
(4.10)
Gleichung der Sekante
Aus der Definition von g(x) folgt, dass
g(a) = 0
und
g(b) = 0,
und dass g differenzierbar ist mit
g 0 (x) = f 0 (x) −
f (b) − f (a)
.
b−a
(4.11)
Außerdem ist g stetig, weshalb aus Satz 4.6 b) über Existenz von Minimum und Maximum
folgt, dass es Punkte x+ , x− ∈ [a, b] gibt, für welche gilt
g(x− ) ≤ g(x) ≤ g(x+ )
∀x ∈ [a, b].
(4.12)
Wir unterscheiden nun 2 Fälle:
1. Fall: Mindestens einer der Punkte x− , x+ liegt im Inneren von [a, b]. Angenommen dieses
61
4 Differentialrechnung
sei x− , dann hat g in x− ein lokales Minimum, also ist
g 0 (x− ) = 0.
Damit folgt aber aus (4.11) dass f 0 (x− ) −
f (b)−f (a)
b−a
f 0 (x− ) =
= 0, was äquivalent ist zu
f (b) − f (a)
b−a
Dann ist x− der gesuchte Punkt x0 .
2. Fall: x− und x+ sind beides Randpunkte des Intervalls [a, b], d.h. x+ und x− können nur
die Punkte a, b sein (x− , x+ ∈ {a, b}). Da g(a) = g(b) = 0, folgt
g(x− ) = 0
und
g(x+ ) = 0.
Somit folgt aus (4.12) dass g(x) = 0 ist für alle x ∈ [a, b]. Also ist g konstant, so dass
g 0 (x) = 0
∀x ∈ [a, b],
weshalb aus (4.11) wiederum für alle x ∈ [a, b]
f 0 (x) =
f (b) − f (a)
b−a
folgt.
4.18 Folgerungen
a) Monotonie: Ist die Funktion f : [a, b] → R stetig, auf dem offenen intervall I = (a, b)
differenzierbar und die Ableitung f 0 (x) > 0 für alle x ∈ (a, b), dann ist f streng monoton
wachsend.
Beweis. Seien x1 , x2 ∈ (a, b), x1 < x2 , dann gibt es ein x0 ∈ (x1 , x2 ) mit
⇒
f (x2 ) − f (x1 )
= f 0 (x0 )
x2 − x1
f (x2 ) − f (x1 ) = f 0 (x0 ) · (x2 − x1 ) > 0
| {z }
>0
|
{z
>0
}
Also ist f (x2 ) > f (x1 ), was bedeutet, dass f ist streng monoton wachsend ist (s.Definition
3.4).
Ebenso lässt sich zeigen:
f 0 (x) ≥ 0 ∀x ∈ (a, b) ⇒ f ist monoton wachsend.
f 0 (x) ≤ 0 ∀x ∈ (a, b) ⇒ f ist monoton fallend.
f 0 (x) < 0 ∀x ∈ (a, b) ⇒ f ist streng monoton fallend.
62
4 Differentialrechnung
b) Konstante Funktionen: Aus 1) folgt insbesondere eine Aussage über konstante Funktionen:
f 0 (x) = 0 ∀x ∈ (a, b) ⇔ f ist konstant auf [a, b]: f (x) = c ∀x ∈ [a, b].
Dieses folgt, da nach 1) die Funktion gleichzeitig monoton fallend und wachsend sein
muss.
c) Extremwerte: Ist die zweite Ableitung f 00 (x) > 0, so ist die erste Ableitung f 0 (x)
streng monoton wachsend, also ist f konvex. Die Aussagen aus Satz 4.16 lassen sich also
dahingehend präzisieren, dass aus f 0 (x0 ) = 0 und f 00 (x0 ) > 0 folgt, dass f ein lokales
Minimum in x0 hat. Analog gilt: ist f 0 (x0 ) = 0 und f 00 (x0 ) < 0, so hat f ein lokales
Maximum in x0 . Ist auch f 00 (x0 ) = 0, so ist noch keine Aussage möglich (hierzu siehe
Abschnitt 4.3.4).
4.3.3 Die Regel von de l’Hospital
Seien f, g : (a, b) → R Funktionen, x0 ∈ (a, b) und f (x0 ) = g(x0 ) = 0. Dann ist der Quotient
f (x0 )
g(x0 ) nicht definiert. Es kann aber sein, das der Grenzwert des Quotienten existiert und daher
eine sinnvolle Fortsetzung der Funktion
tiert limx→x0
f (x)
g(x)
f
g
in den Punkt x0 definiert werden kann. Wann exis-
und wie berechnet man ihn?
4.19 Satz: Regel von de l’Hospital
Seien f, g differenzierbar auf (a, b) und stetig auf [a, b], x0 ∈ (a, b) und f (x0 ) = g(x0 ) = 0.
0 (x)
existiert, dann gilt:
Wenn der Grenzwert des Quotienten der Ableitungen limx→x0 fg0 (x)
Der Grenzwert limx→x0
f (x)
g(x)
existiert ebenfalls und es ist
lim
x→x0
f (x)
f 0 (x)
= lim 0
g(x) x→x0 g (x)
Beweis. (Beweisidee) Die Ableitungen f 0 , g 0 existieren nach Voraussetzung, also ist nach dem
Mittelwertsatz
f (x) − f (x0 )
= f 0 (x1 )
x − x0
für ein x1 ∈ (x, x0 )
g(x) − g(x0 )
= g 0 (x2 )
x − x0
für ein x2 ∈ (x, x0 ).
und
63
4 Differentialrechnung
Da f (x0 ) = 0 und g(x0 ) = 0 ist, gilt:
f (x)
f (x) − f (x0 )
=
g(x)
g(x) − g(x0 )
x − x0
f (x) − f (x0 )
·
=
x − x0
g(x) − g(x0 )
f 0 (x1 )
= 0
g (x2 )
für Punkte x1 , x2 ∈ (x, x0 ). Somit gilt für den Grenzwert x → x0
f (x)
=
g(x)
lim
x→x0
lim
x→x0
x1 ,x2 ∈(x,x0 )
f 0 (x1 )
g 0 (x2 )
f (x0 )
f 0 (x0 )
= 0
,
g(x0 )
g (x0 )
⇒
sofern der Limes von
f 0 (x1 )
g 0 (x2 )
existiert.
4.20 Bemerkung Analog zu Satz 4.19 gilt:
1) Ist limx→x0 f (x) = ∞ und limx→x0 g(x) = ∞ und existiert der Grenzwert des Quotienten
0 (x)
, so ist
der Ableitungen limx→x0 fg0 (x)
lim
x→x0
f (x)
f 0 (x)
= lim 0
.
g(x) x→x0 g (x)
2) Für den Fall I = (a, ∞) und x → ∞ (statt x → x0 ) gelten analoge Aussagen: Wenn
lim f (x) = 0 und lim g(x) = 0, oder
x→∞
x→∞
lim f (x) = ∞ und lim g(x) = ∞,
x→∞
x→∞
und der Grenzwert des Quotienten der Ableitungen limx→∞
auch limx→∞
f (x)
g(x)
f 0 (x)
g 0 (x)
existiert, dann existiert
und es ist
lim
x→∞
f 0 (x)
f (x)
= lim 0
g(x) x→∞ g (x)
Entsprechendes gilt für I = (−∞, b) und x → −∞.
4.21 Beispiele
a) Seien f (x) = sin(x) und g(x) = 2x + x2 . Dann ist g(0) = 0 und f (0) = 0, der Grenzwert
(x)
limx→0 fg(x)
ist also zunächst nicht bekannt. Nun ist aber
f 0 (x) = cos(x), g 0 (x) = 2 + 2x ⇒ f 0 (0) = 1, g 0 (0) = 2
64
4 Differentialrechnung
so dass die Regel von L’Hospital angewendet werden darf und es folgt
f 0 (x)
1
=
0
x→0 g (x)
2
cos(x)
1
sin(x)
= lim
= .
⇒ lim
x→0 2 + 2x
x→0 2x + x2
2
lim
b) Wir betrachten als Beispiel in dem die Regel nicht angewendet werden kann die Funktion
sin(x)
f (x)
g(x) = x2 in x0 = 0:
f 0 (x) = cos(x) ⇒ f 0 (0) = 1
g 0 (x) = 2x ⇒ g 0 (0) = 0.
Also ist die Regel von L’Hospital nicht anwendbar, da limx→0
f 0 (x)
g 0 (x)
nicht existiert.
2
c) Gesucht ist limx→∞ xex . Also ist f (x) = x2 und g(x) = ex und es ist limx→∞ x2 = ∞ und
limx→∞ ex = ∞ Die Grenzwerte der Ableitungen sind
lim (x2 )0 = lim 2x = ∞,
x→∞
lim (ex )0 = lim ex = ∞
x→∞
x→∞
x→∞
Also ist l’Hospital nicht anwendbar, da beide Grenzwerte wiederum unendlich sind. Wir
untersuchen daher die 2.Ableitungen:
lim (2x)0 = lim 2 = 2,
x→∞
lim (ex )0 = lim ex = ∞
x→∞
x→∞
x→∞
Nun kann L’Hospital zunächst auf die ersten Ableitungen und dann auf die Funktion
angewendet werden:
x2
ex
2
f 00 (x)
= lim x = 0
00
x→∞ e
x→∞ g (x)
f (x)
f 0 (x)
f 00 (x)
⇒
lim
= lim 0
= lim 00
= 0.
x→∞ g(x)
x→∞ g (x)
x→∞ g (x)
lim
Wichtig ist, dass der Grenzwert limx→∞
d) Wir suchen den Grenzwert limx→∞
f 00 (x)
g 00 (x)
existiert!
x+cos(x)
x−sin(x) .
x + cos(x)
f 0 (x)
1 + sin(x)
f (x)
=
⇒ 0
=
g(x)
x − sin(x)
g (x)
1 + cos(x)
Also folgt, da limx→∞
bar ist.
1+sin(x)
1+cos(x)
nicht existiert, dass die Regel von l’Hospital nicht anwend-
65
4 Differentialrechnung
4.3.4 Taylorpolynome
4.22 Satz
Sei f : [a, b] → R in x0 ∈ (a, b) n-mal differenzierbar, dann existiert genau ein Polynom
n
n (x )
Pf,x
vom Grad höchstens n so dass nicht nur die Funktionswerte f (x0 ) und Pf,x
0
0
0
n
sondern auch die ersten n Ableitungen von Pf,x0 und f in x0 übereinstimmen:
n
(Pf,x
)0 (x0 ) = f 0 (x0 ),
0
n
Pf,x
(x0 ) = f (x0 ),
0
...,
n
(Pf,x
)(n) (x0 ) = f (n) (x0 ).
0
n
Das Polynom Pf,x
ist gegeben durch
0
n
Pf,x
(x) = f (x0 ) + f 0 (x0 )(x − x0 ) +
0
=
n
X
f (k) (x0 )
k=0
k!
f (n) (x0 )
f 00 (x0 )
(x − x0 )2 + ... +
(x − x0 )n
2!
n!
(x − x0 )k .
(4.13)
n
n
Man sagt „ Pf,x
approximiert f nahe x0 von n-ter Ordnung“. Pf,x
heißt „Taylorpolynom
0
0
n-ter Ordnung zu f am Entwicklungspunkt x0 “.
Beweis. Den Beweis führen wir, indem wir in Gleichung (4.13) den Wert x = x0 einsetzen. Für
n = 1 wird (4.13) zu
1
Pf,x
(x) = f (x0 ) + f 0 (x0 )(x − x0 ),
0
(4.14)
1 (x ) = f (x ) ist. Leiten wir (4.14) nach x
so dass man durch Einsetzen von x0 sieht dass Pf,x
0
0
0
ab, so sehen wir dass (Pf,1 x0 )0 (x) = f 0 (x0 ), woraus insbesondere
P 0 (x0 ) = f 0 (x0 )
folgt. Für n = 2 ist
2
Pf,x
(x) = f (x0 ) + f 0 (x0 )(x − x0 ) +
0
f 00 (x0 )
(x − x0 )2
2
woraus P (x0 ) = f (x0 ) folgt und für die Ableitungen gilt
2
(Pf,x
)0 (x) = f 0 (x0 ) + f 00 (x0 ) · (x − x0 )
0
2
(Pf,x
)00 (x) = f 00 (x0 )
0
2 )0 (x ) = f 0 (x ) und
Hier erkennt man wiederum durch Einsetzen von x = x0 dass (Pf,x
0
0
0
2
00
00
(Pf,x0 ) (x0 ) = f (x0 ). Für die Polynome mit Ordnung n ≥ 3 verfährt man analog.
4.23 Beispiel Reihendarstellung der Exponentialfunktion: Als erste Anwendung berechnen wir die Taylorreihe der Exponentialfunktion exp(x) am Entwicklungspunkt x0 = 0.
Wie wir wissen ist die n-te Ableitung exp(n) (x) = exp(x) für jedes n ∈ N, so dass immer
66
4 Differentialrechnung
exp(n) (0) = 1 gilt. Setzen wir diese Ableitungen in die Formel (4.13) ein, so erhalten wir
n
Pexp,0
(x) =
n
X
1
k=0
k!
(x − 0)k =
n
X
xk
k=0
k!
(4.15)
Berechnet man diese Taylorpolynome für immer größer werdende Ordnungen n, so konvergiert
die Folge der Taylorpolynome gegen die Exponentialfunktion und wir erhalten
ex =
∞
X
xk
k=0
k!
und speziell aus x = 1 die Beziehung
e=
∞
X
1
k=0
k!
über welche wir bereits in (2.14) die Eulersche Zahl e definiert hatten.
4.24 Beispiel Wir betrachten die Funktion f (x) = ln (x) am Entwicklungspunkt x0 = 1 und
berechnen das Taylorpolynom 3. Ordnung.
f (x) = ln (x)
1
f 0 (x) =
x
1
f (2) (x) = − 2
x
2
(3)
f (x) = 3
x
f (x0 ) = ln(1) = 0
1
f 0 (x0 ) = = 1
1
1
f (2) (x0 ) = − 2 = −1
1
2
(3)
f (x0 ) = 3 = 2
1
Setzen wir diese Werte in die Formel (4.13) ein, so erhalten wir
−1
2
(x − 1)2 + (x − 1)3
2!
3!
1
1
2
= (x − 1) − (x − 1) + (x − 1)3
2
3
3
Pln
,1 (x) = 0 + 1(x − 1) +
Abschätzung der Differenz:
Natürlich interessiert man sich nun dafür, wie groß der Fehler ist, den man macht, wenn man
eine Funktion f in der Nähe eines Punktes x0 durch ihr Taylorpolynom ersetzt. Sei rn (x) der
auftretende Fehler bei Approximation der Funktion f durch das Taylorpolynom n-ter Ordnung:
n
rn (x) := f (x) − Pf,x
(x).
0
67
4 Differentialrechnung
R
3 (x)
Pln,1
1
ln(x)
R
1
2 (x)
Pln,1
-1
Abbildung 4.3: Taylorpolynome von ln(x) für n = 2 und n = 3 um x0 = 1
4.25 Satz: Lagrange’sche Restglieddarstellung
Es sei f : (a, b) → R eine (n + 1)-mal differenzierbare Funktion und x, x0 ∈ (a, b), dann
existiert ein x zwischen x und x0 , so dass der Fehler rn (x) gegeben ist durch:
n
rn (x) = f (x) − Pf,x
(x) = f (x) −
0
n
X
f (k) (x0 )
k=0
k!
(x − x0 )k =
f (n+1) (x)
(x − x0 )n+1 (4.16)
(n + 1)!
Der Beweis erfolgt mit dem Mittelwertsatz, wird hier aber nicht ausgeführt.
4.26 Beispiel Wir wollen abschätzen, wie stark die Funktion f (x) = ln (x) auf dem Intervall
9 11
, 10 ] um den Entwicklungspunkt x0 = 1 von seinem Taylorpolynom 3. Ordnung abweicht.
[ 10
Nach Beispiel 4.24 ist
1
1
3
2
3
Pln
,1 (x) = (x − 1) − (x − 1) + (x − 1) .
2
3
Um die Abweichung mit dem Lagrangeschen Restglied (4.16) berechnen zu können, benötigen
wir die 4. Ableitung von ln (x):
ln(4) (x) = −
6
.
x4
68
4 Differentialrechnung
Dann ist der Betrag des Lagrangeschen Restglieds gegeben durch
3
| r3 (x) | =| ln (x) − Pln
,1 (x) |=|
6
x4
1
= 4
x
=
ln(4) (x)
(x − 1)4 |
4!
1
(x − 1)4
4!
1
· (x − 1)4
4
·
für ein x zwischen x und x0 . Die Funktion x14 ist auf R≥0 monoton fallend, daher können wir
den Faktor x14 abschätzen, wenn wir die Fälle x < 1 und x > 1 getrennt betrachten.
1
1
< 4,
4
x
x
1
≤ 1,
x4
9
<x<1:
10
11
und für 1 < x <
:
10
Es gilt für
also ist mit (4.17) für
9
10
da x < x < 1
(4.17)
da 1 < x < x.
(4.18)
< x < 1:
1 1
·
· (x − 1)4
4 x4
1 1
≤ · 4 · (x − 1)4
4 x
1
1
= (1 − )4
4
x
1
10
1 1
≤ (1 − )4 = · 4 .
4
9
4 9
|r3 (x)| =
Mit (4.18) für 1 < x <
11
10
(4.19)
können wir r3 (x) abschätzen durch
1 1
· (x − 1)4
4 x4
1
≤ · (x − 1)4
4
1 11
1 1
< ( − 1)4 = · 4 .
4 10
4 10
|r3 (x)| =
Aus den Abschätzungen (4.19) und (4.20) folgt nun, da
1 1
3
·
ln x − Pln
,1 (x) <
4 94
1
4
· 914 >
(4.20)
1
4
für x ∈ [
· 1014 :
9 11
; ]
10 10
4.3.5 Anwendung auf Extremwerte
Es ist nun eine allgemeine Aussage darüber möglich, wann eine Funktion in einem Punkt x0 , in
dem die ersten (n − 1) Ableitungen gleich 0 sind, einen Sattelpunkt oder ein lokales Maximum
oder Minimum hat.
69
4 Differentialrechnung
4.27 Satz: Lokale Extrema
Sei n ∈ N und die Funktion f : (a, b) → R sei n-mal differenzierbar. Es gelte:
f 0 (x0 ) = f 00 (x0 ) = ... = f (n−1) (x0 ) = 0
und
f (n) (x0 ) 6= 0.
Dann gilt:
i) Ist n gerade und f (n) (x0 ) < 0 ⇒ f hat an der Stelle x0 ein lokales Maximum.
ii) Ist n gerade und f (n) (x0 ) > 0 ⇒ f hat an der Stelle x0 ein lokales Minimum.
iii) Ist n ungerade, so hat f an der Stelle x0 kein lokales Extremum sondern einen
Sattelpunkt.
Beweis. Zum Beweis von i) und i) betrachten wir die Differenz von der Funktion f und ihrem
n−1
Taylorpolynom Pf,x
. Es ist einerseits
0
n−1
f (x) − Pf,x
(x) = f (x) −
0
n−1
X
f (k) (x0 )
(x − x0 )k
k!
k=0
= f (x) − f (x0 ),
(4.21)
da f (k) (x0 ) = 0 für k = 1, . . . , n − 1 vorausgesetzt wurde und andererseits wissen wir aus der
Lagrangeschen Restglied Darstellung (4.16) dass
n−1
f (x) − Pf,x
(x) =
0
f (n) (x)
(x − x0 )n .
n!
(4.22)
Vergleichen wir die rechten Seiten von (4.21) und (4.22) so erhalten wir
f (x) − f (x0 ) =
f (n) (x)
(x − x0 )n .
n!
(4.23)
Da f (n) (x0 ) < 0 ist und f (n) stetig ist, ist f (n) (x) < 0 in einer ganzen Umgebung von x0 ,
insbesondere auch in x, so dass, da bei geradem Exponenten n stets (x − x0 )n > 0 gilt, aus
(4.21) und (4.22) folgt dass f (x) − f (x0 ) ≤ 0 ist in einer Umgebung von x0 was bedeutet,
dass f in x0 ein lokales Maximum hat. Ist nun aber f (n) (x0 ) > 0, so folgt mit der gleichen
Argumentation
f (x) − f (x0 ) =
f (n) (x)
(x − x0 )n > 0,
n!
was beutet, dass f in x0 ein lokales Minimum hat.
Um iii) zu beweisen, beachten wir dass im Falle dessen dass n ungerade ist, der Term (x − x0 )n
70
4 Differentialrechnung
in x0 sein Vorzeichen wechselt, weshalb auch
f (x) − f (x0 ) =
f (n) (x)
(x − x0 )n
n!
das Vorzeichen bei x0 wechselt. Daher hat f in x0 kein lokales Extremum, da f von größeren
zu kleineren Werten als in x0 wechselt. f hat in x0 einen Sattelpunkt.
4.28 Beispiel Die Funktion f (x) = xn hat für gerade n in x0 = 0 ein lokales Minimum und für
ungerade n einen Sattelpunkt. Die Funktion f (x) = −xn hat für gerade n ein lokales Maximum
und für ungerade n einen Sattelpunkt.
71
5 Integralrechnung
5.1 Definition und Eigenschaften des Integrals
Sei f : [a, b] → R eine stetige Funktion und x0 , x1 , ..., xn eine Zerlegung des Intervalls [a, b]:
a = x0 < x1 < ... < xn = b
f (x)
a = x0
ξ1
x1
ξ2
x2 ξ3
x3
ξ4
x4 = b
x
Abbildung 5.1: Eine Riemannsche Summe mit n = 4
Dann approximiert
Zn :=
n
X
f (ξk )(xk − xk−1 )
k=1
die Fläche unter dem Graphen von f . Zn heißt „Riemannsche Summe“. Bezeichnen wir mit
(x0 , x1 , ..., xn ) := max |xi − xi−1 |
i=1,...,n
den maximalen Abstand zweier benachbarter Unterteilungspunkte, welchen wir die Feinheit
der Zerlegung x0 , x1 , ..., xn nennen, so kann man zeigen, dass der Grenzwert der Riemannschen
72
5 Integralrechnung
Summen
n
X
lim
(x0 ,...,xn )→0
f (ξi )(xi − xi−1 )
k=1
existiert, wenn die Feinheit der Zerlegung gegen 0 geht. Überdies ist für stetige Funktionen
der Grenzwert unabhängig von den gewählten Zerlegungen, so dass wir den gemeinsamen
Grenzwert als Integral über f definieren können.
5.1 Definition: Riemannintegral
Sei f eine auf dem Intervall [a, b] definierte stetige Funktion. Dann heißt
bestimmte Integral von f über [a, b] und ist definiert durch
n
X
Z b
f (x) dx := lim
n→∞
a
Rb
a
f (x) dx das
f (ξi )(xi − xi−1 )
i=1
für Zerlegungen mit (x0 , ..., xn ) → 0. Die Randpunkte a, b heißen Integrationgrenzen.
5.2 Beispiel f (x) = const = c
Zn =
n
X
f (ξi )(xi − xx−i ) =
i=1
n
X
c(xi − xx−i ) = c(a − b)
i=1
für beliebige Zerlegungen (x0 , ..., xn ) mit Randpunkten x0 = a, xn = b. Also ist
Z b
c dx = c(b − a).
a
Aus der Definition ergeben sich folgende Eigenschaften des Integrals:
5.3 Folgerungen
1) Linearität:
Z b
Z b
Z b
a
g(x) dx
f (x) dx +
(f (x) + g(x)) dx =
a
a
Z b
Z b
c(f (x)) dx = c
f (x) dx.
a
a
Eine solche Gleichung gilt nicht für Produkte
Rb
a
f (x) · g(x) dx!
2) Positivität: Ist f (x) ≤ g(x) für alle x ∈ [a, b], so ist
Z b
f (x) dx ≤
a
Z b
g(x) dx.
a
73
(5.1)
5 Integralrechnung
Insbesondere gilt:
Z b
min f (x)(b − a) ≤
x∈[a,b]
f (x) dx ≤ max f (x)(b − a)
x∈[a,b]
a
und falls g(x) ≥ 0 auf dem Intervall [a, b] ist, gilt das auch für das Integral:
Z b
g(x) dx ≥ 0.
a
3) Zerlegung des Integrationsgebietes: Ist a < c < b, so gilt
Z b
Z b
Z c
f (x) dx.
f (x) dx =
f (x) dx +
(5.2)
a
c
a
Definiert man
Z a
f (x) dx := −
Z b
f (x) dx,
a
b
so gilt (5.2) für alle a, b, c.
5.4 Definition
Der Mittelwert f einer Funktion f auf dem Intervall [a, b] ist definiert durch
f :=
1
b−a
Z b
f (x) dx
a
5.5 Satz: Mittelwertsatz der Integralrechnung
Ist f : [a, b] → R stetig, so existiert ein c ∈ (a, b) > 0, so dass:
1
f (c) = f =
b−a
Z b
f (x) dx.
a
Dies bedeutet anschaulich, dass in Abbildung 5.2 die Fläche unter dem Graphen von f genauso
groß ist wie das Rechteck unter der grünen Linie. Insbesondere gibt es einen Punkt c, so dass
f = f (c). In Abbildung 5.2 ist x− = 0. Der Punkt c ist im allgemeinen nicht eindeutig bestimmt.
Beweis. f ist stetig, dann folgt aus Satz 4.6 über Existenz von Minimum und Maximum dass
es zwei Punkte x− , x+ ∈ [a, b] gibt, so dass
min f (x) = f (x− )
max f (x) = f (x+ ).
x∈[a,b]
x∈[a,b]
74
5 Integralrechnung
R
f (x+ )
f = f (c)
f (x− )
R
c
x+
3
Abbildung 5.2: Mittelwertsatz der Integralrechnung für f (x) = 12 x3 −3x2 +5x+ 12 auf I = [0, 3]
Mit Eigenschaft (5.1) des Integrals folgt:
f (x− )(b − a) ≤
Z b
f (x) dx ≤ f (x+ )(b − a)
a
⇔
f (x− ) ≤
1
(b − a)
Z b
|
{z
f (x) dx ≤ f (x+ ).
a
}
f
Also liegt f zwischen f (x− ) und f (x+ ), so dass aus dem Zwischenwertsatz 4.6 folgt, dass es
ein c ∈ [a, b] mit f (c) = f gibt.
5.6 Bemerkung Die Integration entspricht anschaulich der Flächenberechnung. Es werden
oberhalb der x-Achse liegende Flächen positiv „bewertet“ und unterhalb der x-Achse liegende
Flächen negativ. So kann es also negative Integrale geben und auch eine Funktion, deren
Integral über ein Intervall gleich Null ist, kann dort ein Gebiet mit der x-Achse einschließen.
R
+
+
R
π
−
75
2π
5 Integralrechnung
5.2 Hauptsatz der Differential- und Integralrechnung
5.2.1 Der Hauptsatz
Sei f auf dem Intervall I ⊆ R stetig, a ∈ I. Wir bezeichnen mit F die Intergralfunktion
F : I → R, welche definiert ist durch
Z x
f (t) dt.
F (x) :=
(5.3)
a
5.7 Satz: Hauptsatz der Differential- und Integralrechnung
F ist differenzierbar auf I und für alle x ∈ I gilt:
F 0 (x) = f (x).
Beweis. Wir berechnen die Ableitung von F , indem wir den Differenzenquotienten untersuchen:
Z x+h
F (x + h) − F (x)
1
=
h
h
f (t) dt −
a
!
Z x
f (t) dt
a
1 x+h
=
f (t) dt
h x
(∗∗) 1
· f (τ ) · ((x + h) − x)
=
h
= f (τ )
(∗)
Z
für ein τ ∈ [x, x + h]
wobei in (∗) die Eigenschaft über die Zerlegbarkeit des Integrationsintervalls (5.2) verwendet
wurde und (∗∗) aus dem Mittelwertsatz 5.5 folgt. Da f stetig ist, kann nun der Grenzwert
h → 0 gebildet werden, wobei τ ∈ [x, x + h] beachtet werden muss, und es folgt
F (x + h) − F (x)
= lim f (τ ) = f (x).
h→0
h→0
h
lim
Die letzte Gleichheit gilt, da f stetig vorausgesetzt wurde.
5.8 Definition: Stammfunktion
Eine differenzierbare Funktion G : I → R heißt (eine) Stammfunktion von f , falls für
alle x ∈ I gilt:
G0 (x) = f (x).
76
5 Integralrechnung
5.9 Folgerungen
a) Aus dem Hauptsatz folgt, dass die Intergalfunktion
Z x
f (t) dt
F (x) =
a
eine Stammfunktion von f (x) ist. Jede weitere Stammfunktion G von f unterscheidet
sich dann von F nur durch eine Konstante c:
G(x) = F (x) + c.
b) Ist G eine Stammfunktion von f auf einem Intervall I, so gilt für alle Punkte a, b ∈ I:
Z b
f (t) dt = G(b) − G(a).
a
Beweis. zu a): Sei F wie oben als Integralfunktion von f definiert und sei G eine weitere
Stammfunktion von f . Dann gilt nach dem Hauptsatz für die Ableitungen Dann ist
G0 (x) = f (x) und
F 0 (x) = f (x).
Also gilt in jedem x ∈ I für die Differenz (G − F )0 (x) = 0, weshalb nach Folgerung 4.18 2) die
Differenz konstant ist: G(x) − F (x) = const. = c.
zu b): Aus Folgerung a) wissen wir, dass G(x) = F (x) + c, weshalb
G(b) − G(a) = (F (b) + c) − (F (a) + c)
= F (b) − F (a) =
Z b
f (t) dt.
a
77
5 Integralrechnung
5.2.2 Stammfunktionen elementarer Funktionen
Mit Hilfe des Hauptsatzes der Differential- und Integralrechnung können wir die Stammfunktionen einiger elementarer Funktionen angeben:
Funktion f
Stammfunktion F
1
n+1
n+1 x
xn
Bestimmtes Integral (Beispiele)
R1 n
1
n+1 ]1
0
0 x dx = [ n+1 x
+c
n 6= −1
sin (x)
=
Rπ
− cos (x) + c
0
1n+1
n+1
−0=
1
n+1
sin (x) dx = [− cos (x)]π0
= −(−1) + 1 = 2
cos (x)
Rπ
sin (x) + c
0
cos (x) dx = [sin (x)]π0
=0−0=0
ex
R1 x
x 1
0 e dx = [e ]0
ex + c
= e1 − e0 = e1 − 1
1
cos2
(x)
R
tan (x) + c
π
4
0
1
cos2
π
dx = [tan (x)]04
(x)
= tan ( π4 ) − tan (0) = 1 − 0 = 1
(s. (4.4))
√ 1
1−x2
R
arcsin (x) + c
1
2
− 21
√ 1
1−x2
1
dx = [arcsin (x)]−2 1
(s. (4.9))
1
1+x2
2
=
π
6
−
− π6
=
π
3
arctan (x) + c
(s. (4.8))
Integration von f (x) = x1 :
Aus Beispiel 4.7 wissen wir, dass der Logarithmus eine Stammfunktion von f (x) = x1 ist.
Allerdings darf ein Integrationsintervall I = [a, b] den Punkt x = 0 nicht enthalten, da die
Funktion dort eine Polstelle hat. Wir unterscheiden also die Fälle 0 < a < b und a < b < 0:
1. Fall: 0 < a < b: Es ist F (x) = ln (x) eine Stammfunktion von f (x) = x1 , also ist
Z b
1
a
b
dx = ln (b) − ln (a) = ln ( ).
x
a
2. Fall: a < b < 0: Wir definieren F (x) = ln (−x), dann ist F definiert für x ∈ R<0 und mit
der Kettenregel folgt
F 0 (x) =
1
1
· (−1) = ,
−x
x
78
5 Integralrechnung
1
x
also ist F : R<0 → R eine Stammfunktion von f (x) =
Z b
1
x
a
auf R<0 , so dass
dx = F (b) − F (a)
= ln (−b) − ln (−a)
−b
b
= ln (
) = ln ( ).
−a
a
Jede Stammfunktion F (x) von f (x) =
1
x
ist also von der Form
F (x) = ln |x| + c
(5.4)
und es ist zu beachten, dass x = 0 nicht im Integrationsintervall liegt.
5.10 Beispiele
a) Wir integrieren f (x) = x1 auf den zum Punkt x = 0 symmetrisch liegenden Intervallen
I1 = [1, 2] und I2 = [−2, −1]:
Z 2
1
dx = [ln (x)]21
x
1
= ln (2) − ln (1) = ln (2)
I1 =
und
Z −1
1
dx = [ln |−x|]−1
−2
x
= ln |−(−1)| − ln |−(−2)| = ln (1) − ln (2)
I2 =
−2
= − ln (2).
Also ist I2 = −I1 , was auch der Anschauung entspricht.
b) Die Gravitationskraft
K(x) = G ·
mM
x2
leistet entlang des Weges [a, b] die Arbeit
Z b
A=
K(x) dx = GmM
Z b
1
dx
x2
1 b
1 1
= GmM · −
= GmM
−
.
x a
a b
a
a
5.3 Integrationsregeln
Um auch komplexere als die elementaren Funktionen integrieren zu können, sind die folgenden Regeln nützlich. Die „partielle Integration“ wird aus der Produktregel der Differentiation
hergeleitet und die „Integration durch Substitution“ aus der Kettenregel der Differentiation.
79
5 Integralrechnung
5.3.1 Partielle Integration
5.11 Satz: Partielle Integration
Sind u, v : [a, b] → R stetig differenzierbare Funktionen, so gilt
Z b
0
u (x)v(x) dx =
a
[u(x)v(x)]ba
−
Z b
u(x)v 0 (x) dx,
(5.5)
a
und für das unbestimmte Integral
Z
0
u (x)v(x) dx = u(x)v(x) −
Z
u(x)v 0 (x) dx.
(5.6)
Beweis. Die Produktregel für die Differentiation, (s. Satz 4.12), besagt dass
(u(x)v(x))0 = u0 (x)v(x) + u(x)v 0 (x).
Stellen wir diese Gleichung um, so erhalten wir
u0 (x)v(x) = (u(x)v(x))0 − u(x)v 0 (x)
woraus durch Integration folgt:
Z
u(x)0 v(x) dx =
Z
Z
u0 (x)v(x) dx = u(x)v(x) −
(u(x)v(x))0 dx −
Z
u(x)v 0 (x) dx
so dass
Z
u(x)v 0 (x) dx
Diese Regel ist anwendbar, wenn ein Produkt f (x) = g1 (x) · g2 (x) integriert werden soll und
wenn eine der Funktionen als u0 (x) und die andere als v(x) aufgefasst werden kann.
5.12 Beispiele
a) Wir wollen f (x) = x ex integrieren, wofür wir f partiell integrieren mit v(x) = x und
u0 (x) = ex . Es ist dann v 0 (x) = 1 und u(x) = ex , was eingesetzt in (5.6)
Z
xex dx = xex −
Z
1 · ex dx
= xex − ex + c
= (x − 1) · ex + c
80
5 Integralrechnung
als Stammfunktion ergibt. Für ein bestimmtes Integral folgt mit (5.5) also z.B.
Z 2
1
xex dx = [(x − 1)ex ]21
= (2 − 1)e2 − 0
= e2 .
b) Mittels partieller Integration lässt sich auch die Stammfunktion von v(x) = ln (x) berechnen:
Z
Z
1 · ln (x) dx
|{z}
| {z }
u0
v
Z
ln (x) dx =
= |{z}
x · ln (x) −
| {z }
u
v
= x ln (x) −
1
x ·
dx
|{z}
x
|{z}
u
v0
Z
1 dx
= x ln (x) − x + c
= x(ln (x) − 1) + c.
c) Die Stammfunktion von cos2 (x) berechnet man durch
Z
cos (x) · cos (x) dx = sin (x) cos (x) −
| {z }
u
Z
sin (x) (− sin (x)) dx
| {z } | {z }
| {z }
u
v0
| {z } |
v
{z
v
u0
Z
(∗)
= sin (x) cos (x) +
}
(1 − cos2 (x)) dx.
In (∗) wurde sin2 (x) = 1−cos2 (x) verwendet. Addiert man nun auf beiden Seiten cos2 (x) dx,
so erhält man
R
Z
2
cos2 (x) dx = sin (x) cos (x) + x.
d) Es kann, wie in (∗), eine zweite partielle Integration notwendig sein:
Z
2
2
x sin (x) −
x · cos (x) dx = |{z}
|{z}
| {z }
| {z }
u
u
v0
Z
2x sin (x) dx
|{z}
| {z }
u0
v
= x2 sin (x) − 2
v
Z
x sin (x) dx
|{z}
| {z }
g
h0

(∗)

= x2 sin (x) − 2 |{z}
x (− cos (x)) −

g
|
{z
h
}
2
Z

1 (− cos (x)) dx
|{z}
|
{z
}
= x sin (x) + 2x cos (x) − 2 sin (x) + c
= (x2 − 2) sin (x) + 2x cos (x) + c.
81
g0
h
5 Integralrechnung
5.3.2 Integration durch Substitution
5.13 Satz: Substitutionsregel
Ist g : [a, b] → I ⊆ R stetig differenzierbar und f : I → R stetig, so gilt:
Z b
Z g(b)
f (t) dt =
f (g(x))g 0 (x) dx.
(5.7)
a
g(a)
Beweis. Ist F eine Stammfunktion von f , d.h. F 0 (x) = f (x), so folgt aus der Kettenregel:
(F ◦ g)0 (x) = F 0 (g(x)) · g 0 (x)
= f (g(x)) · g 0 (x),
d.h. (F ◦ g)(x) ist eine Stammfunktion von f (g(x)) · g 0 (x). Also ist
Z b
f (g(x)) · g 0 (x) dx = (F ◦ g)(b) − (F ◦ g)(a)
a
= F (g(b)) − F (g(a)).
(5.8)
Anderseits ist F nach Vorraussetzung eine Stammfunktion von f , so dass wenn wir g(a) und
g(b) als Integrationsgrenzen auffassen
Z g(b)
f (t) dt = F (g(b)) − F (g(a))
(5.9)
g(a)
folgt. Vergleichen wir nun die linken Seiten von (5.8) und (5.9), so erhalten wir
Z b
Z g(b)
f (t) dt =
f (g(x)) · g 0 (x) dx.
a
g(a)
5.14 Beispiele
2
a) Wir möchten die Funktion (lnxx) auf dem Intervall [1, 2] integrieren. Um die Substitutionsregel anwenden zu können, setzen wir f (t) = t2 und g(x) = ln (x), woraus g 0 (x) = x1
folgt. Das Integral hat dann die Strukur (Beachte f (g(x)) = (ln (x))2 !)
Z 2
I=
1
1
(ln (x))
dx =
x
2
Z 2
f (g(x)) · g 0 (x) dx.
1
Also ist nach Gleichung (5.7) und da ln(1) = 0:
Z g(2)
I=
Z ln (2)
f (t) dt =
g(1)
"
=
t3
3
ln (1)
#ln (2)
=
0
(ln (2))3
.
3
82
t2 dt
5 Integralrechnung
b) Es soll esin (x) cos (x) auf dem Intervall [0, π2 ] integriert werden. Mit f (t) = et und g(x) =
sin (x) ist g 0 (x) = cos (x), so dass wiederum mit Gleichung (5.7) folgt
Z
I=
π
2
e
sin (x)
Z
cos (x) dx =
0
=
π
2
f (g(x)) · g 0 (x) dx
0
Z g( π )
2
f (t) dt =
Z sin ( π )
2
g(0)
et dt
sin (0)
= e1 − e0
= e − 1.
c) Wir betrachten den Fall dass die „innere Funtkion“ linear ist, d. h.
g(x) = mx + c
g 0 (x) = m
dann wird Gleichung (5.7) mit g(a) = ma + c, g(b) = mb + c und g 0 (x) = m zu
Z mb+c
Z b
f (t) dt =
ma+c
f (mx + c)m dx
a
und mit einer Stammfunktion F von f folgt
1
(F (mb + c) − F (ma + c)) =
m
Z b
f (mx + c) dx.
a
5.3.3 Der ln - Trick
0
(x)
ln -Trick“
Hat die zu intergrierende Funktion die Form gg(x)
, so lässt sich der sogennante „ln
anwenden, welcher ein einfacher Spezialfall der Substitutionsregel ist. Sei g : [a, b] → R stetig
differenzierbar und g(x) 6= 0 für alle x ∈ [a, b]. Wir berechnen das Integral über [a, b] mit der
1
Substitution f (t) = 1t . Da nun f (g(x)) = g(x)
ist, folgt
I=
Z b 0
g (x)
a
g(x)
Z b
dx =
f (g(x)) · g 0 (x) dx
a
Z g(b)
f (t) dt =
=
g(a)
Z g(b)
1
g(a)
t
dt
(∗)
= ln |g(b)| − ln |g(a)|
|g(b)|
= ln
.
|g(a)|
In (∗) wurde Gleichung (5.4) verwendet.
5.15 Beispiel Mit Hilfe des ln -Tricks können wir z. B. tan (x) integrieren:
Z
I=
π
4
Z
tan (x) dx =
0
0
83
π
4
sin (x)
dx
cos (x)
(5.10)
5 Integralrechnung
Mit g(x) = − cos (x) ist g 0 (x) = sin (x) also ist
π
4
sin (x)
dx
−
cos (x)
0
Z π 0
4 g (x)
=−
dx
g(x)
0
− cos ( π )
4
= − ln
|− cos (0)|
√
1
= − ln ( √ ) = ln ( 2).
2
I=−
Z
5.3.4 Integration rationaler Funktionen
Rationale Funktionen f (x) = p(x)
q(x) , wobei p(x) und q(x) Polynome sind, können immer integriert
werden, wenn die Nullstellen der Nennerfunktion bekannt sind. Wir betrachen nur einige Fälle:
1) f (x) =
1
x−a :
Wir können den „ln -Trick“ (5.10) anwenden und erhalten
Z
1
dx = ln |x − a| + c.
x−a
(5.11)
Es muss x 6= a im Integrationsgebiet sein!
2) f (x) =
1
(x+a)k
für k > 1:
Z
1
1
1
dx = −
·
+ c.
(x + a)k
k − 1 (x + a)k−1
1
für 4q − p2 < 0: Der Nenner hat 2 reelle Nullstellen x0 , x1 so dass
3) f (x) = x2 +px+q
2
x + px + q = (x − x0 )(x − x1 ) und es ist mit Partialbruchzerlegung
1
1
f (x) =
=
·
(x − x0 )(x − x1 )
(x0 − x1 )
1
1
−
x − x0 x − x1
Diese Funktionen kann mit (5.11) integriert werden:
Z
1
1
1
1
dx =
·
−
dx
2
x + px + q
x0 − x1
x − x0 x − x1
1
=
· (ln |x − x0 | − ln |x − x1 |) + c
x0 − x1
1
|x − x0 |
=
· ln
+ c.
x0 − x1
|x − x1 |
Z 0
(x)
4) f (x) = qq(x)
: Ist das Zählerpolynom gerade die Ableitung des Nennerpolynoms, so lässt
sich wieder der „ln -Trick“ anwenden:
Z
q 0 (x)
dx = ln |q(x)| + c
q(x)
84
5 Integralrechnung
5.16 Beispiele
a) Das Polynom q(x) = x2 − 4x + 3 hat die Nullstellen x0 = 3 und x1 = 1, also ist q(x) =
(x − 3)(x − 1) und
Z
1
1
1
1
dx
dx =
·
−
2
x − 4x + 3
3−1
x−3 x−1
1
= · (ln |x − 3| − ln |x − 1|) + c
2
1
|x − 3|
= · ln
+c
2
|x − 1|
Z b) Das Polynom q(x) = x2 + 3x + 4 hat die Ableitung q 0 (x) = 2x + 3 so dass mit 4) folgt:
Z 2
1
h
i2
2x + 3
2
dx
=
ln
|x
+
3x
+
4|
1
x2 + 3x + 4
4+6+4
= ln
1+3+4
7
= ln .
4
5.4 Uneigentliche Integrale
Hat die Funktion f an einer der Integrationsgrenzen keinen endlichen Wert oder ist eine der
Integrationsgrenzen nicht endlich, so sprechen wir von einer kritischen Grenze und das Integral
muss durch einen Grenzübergang bestimmt werden. Wir betrachten 3 Fälle:
1) Eine Integrationsgrenze ist unendlich.
2) Der Integrand ist an einer Integrationsgrenze nicht definiert.
3) Beide Grenzen sind kritisch.
Das Vorgehen ist immer, dass der Intergrationsbereich so eingeschränkt wird, dass das Integral
berechnet werden kann und dann (wenn möglich!) ein Grenzwert bestimmt wird:
1) Sei f : R → R stetig und a ∈ R. Gesucht ist das uneigentliche Integral
Z ∞
f (x) dx.
I=
a
Falls
Z R
f (x) dx
lim
R→∞
a
existent, so existiert das uneigentliche Integral und wir setzen
Z ∞
I=
Z R
f (x) dx := lim
R→∞
a
85
f (x) dx
a
5 Integralrechnung
2) Sei f : (a, b) → R stetig und f (a) nicht definiert. Gesucht ist das uneigentliche Integral
Z b
f (x) dx.
I=
a
Falls
Z b
f (x) dx
lim
&0
a+
existiert, so existiert das uneigentliche Integral und wir setzen
Z b
Z b
f (x) dx.
f (x) dx = lim
I=
&0
a
a+
3) Sind beide Integrationsgrenzen kritisch oder liegt ein kritischer Punkt im Integrationsgebiet, so muss das Integrationsgebiet in Teilintervalle zerlegt werden, die den Fällen 1)
und 2) entsprechen. Es dürfen nicht 2 Grenzprozesse gleichzeitig ausgeführt werden.
5.17 Beispiele
a) Die Funktion f (x) = x1S mit S > 1 soll auf I = [1, ∞) integriert werden. Es ist f auf [1, R]
integrierbar für 1 < R < ∞ mit
1
1 R
dx
=
−
·
xS
S − 1 xS−1 1
1
1
( S−1 −1).
=−
S − 1 |R{z
}
Z R
1
1
→ 0
R→∞
Also existiert
lim
R→∞
Z R
1
1
xS
dx = −
1
S−1
für S > 1 und es ist
Z ∞
1
1
xS
dx =
1
.
S−1
b) Die Funktion f (x) = x1s mit 0 ≤ s < 1 soll auf I = [0, 1] intergriert werden. Es ist f auf
[, 1] integrierbar für 0 < < 1 mit
Z 1
1
xs
1
1 1
· s−1
s−1 x
1
1−s
=
(1 − |{z}).
1−s
dx = −
→0
→0
86
5 Integralrechnung
Also existiert
lim
Z 1
1
&
xs
dx =
1
1−s
dx =
1
.
1−s
für 0 ≤ s < 1 und es ist
Z 1
1
xs
0
5.5 Die Kreisfläche
Wir wollen die Fläche A(R) eines
√ Kreises mit Radius R berechnen. Der Bogen des Halbkreises
ist durch die Funktion f (t) = R2 − t2 auf t ∈ [−R, R] beschrieben.
f (t)
f (t)
t
t
R
Abbildung 5.3: Kreisfläche mit Radius R
Wählen wir zunächst als Radius R = 1, so ist die Fläche F (1) des Halbkreises gegeben durch
das Integral
F (1) =
Z 1 p
1 − t2 dt.
−1
Wählen wir in der Substitutionsregel (Satz 5.13) g(x) = sin x, so dass g 0 (x) = cos (x), so
erhalten wir
Z bq
1 − sin2 (x) cos (x) dx =
a
⇔
Z b
cos2 (x) dx =
a
Z g(b) p
g(a)
Z g(b) p
g(a)
87
1 − t2 dt
1 − t2 dt.
5 Integralrechnung
R
Aus Beispiel 5.12 c) kennen wir die Stammfunktion
müssen also noch die Integrationsgrenzen berechnen:
cos2 (x) dx = sin (x) cos (x) + x. Wir
g(b) = 1
⇒
sin (b) = 1
⇒
g(a) = −1
⇒
sin (a) = −1
⇒
π
2
π
wähle a = − .
2
wähle b =
Damit ist mit Beispiel 5.12 c)
1
A(1) =
2
⇒
π
2
Z
− π2
cos2 (x) dx =
π
2
A(1) = π.
Sei nun der Radius R > 0 beliebig, dann ist f (t) =
1
A(R) =
2
Z R p
√
R2 − t2 und
R2 − t2 dt
−R
Z R
s
=R
1−
−R
t
R
2
dt.
Wieder verwenden wir die Substitutionsregel, dieses Mal mit
t = g(x) = R sin (x), d.h. g 0 (x) = R cos (x)
und
t
R
= sin (x). Einsetzen in
Z b
f (g(x)) · g 0 (x) dx =
Z g(b)
f (t) dt
g(a)
a
ergibt
Z b
q
R 1 − sin2 (x) · R cos (x) dx =
⇐⇒
R
s
R 1−
−R
a
2
Z R
Z
π
2
− π2
|
q
1−
sin2 (x) ·
Z R
s
cos (x) dx = R
−R
{z
}
π
2
π
1
= A(R)
2
2
A(R) = πR2 .
R2 ·
⇐⇒
⇐⇒
88
t
R
1−
2
t
R
dt
2
dt
6 Stochastik
6.1 Vorüberlegungen
Bezeichnen wir mit E ein Ereignis, das mit einer gewissen Wahrscheinlichkeit eintritt, so wird
mit P (E) die Wahrscheinlichkeit bezeichnet, dass das Ereignis E eintritt. Es ist
0 ≤ P (E) ≤ 1.
Wie kann P (E) bestimmt werden?
6.1.1 Relative Häufigkeit (Empirischer Ansatz)
Es wurden 960 Personen betragt, ob sie im vergangenen Winter an Grippe erkrankt waren.
Das Ergebnis war:
erkrankt:
nicht erkrankt:
Gesamt n =
406
554
960.
Dann ist die relative Häufigkeit hn (E) des Ereignisses
E = „an Grippe erkrankt“
gegeben durch
hn (E) =
406
≈ 0,42.
960
Hier ist hn (E) abhängig von der gewählten Stichprobe, d. h. hn (E) liegt nur mit einer gewissen
Wahrscheinlichkeit in der Nähe von P (E).
6.1.2 Laplace-Wahrscheinlichkeit (Theoretischer Ansatz)
Die Laplace-Wahrscheinlichkeit ist anwendbar bei Experimenten mit endlich vielen, gleich
wahrscheinlichen Ergebnissen.
n = Anzahl der möglichen Ergebnisse
n(E) = Anzahl der Ergebnisse, bei denen das Ereignis E eintritt.
6.1 Beispiele
a) Wurf mit einem idealen Würfel. Die Anzahl der Augen ist n = 6, mögliche Ergebnisse
sind {1, 2, ..., 6}. Da jedes mögliche Ergebnis mit gleicher Wahrscheinlichkeit gewürfelt
89
6 Stochastik
wird, ist die Wahrscheinlichkeit P (1) eine 1 zu würfeln gegeben durch
1
P (1) = .
6
Betrachten wir nun E = {1, 3, 5}, („Es wird eine ungerade Zahl gewürfelt“), so ist wiederum n = 6 aber die Anzahl der günstigen Ergebnisse für das Ereignis E ist n(E) = 3. Also
ist
P (E) =
3
1
n(E)
= = .
n
6
2
b) Wir betrachten eine Urne mit 10 gleichförmigen Kugeln, so ist n = 10. Es seien 3 rote, 2
grüne und 5 schwarze Kugeln in der Urne und es werde eine Kugel gezogen.
E1 = „Kugel rot“
n(E1 ) = 3
⇒
E2 = „Kugel grün“
n(E2 ) = 2
⇒
E3 = „Kugel schwarz“
n(E3 ) = 5
⇒
E4 = „Kugel rot oder grün“
n(E4 ) = 3 + 2
⇒
3
10
2
1
P (E2 ) =
=
10
5
1
5
=
P (E3 ) =
10
2
5
1
P (E4 ) =
=
10
2
P (E1 ) =
c) Eine symmetrische Münze hat beim Werfen die möglichen Ergebnisse
„Kopf“= 0 und „Zahl“= 1.
Werden 5 Würfe ausgeführt so gibt es nach Formel (1.5)
n = 25 = 32
mögliche Ergebnisse. Betrachten wir das Ereignis
E = „genau 3-mal ‚Zahl‘ bei 5 Würfen“,
so ist n(E) = 53 =
Menge. Dann ist
5!
3! 2!
= 10 die Anzahl der 3-elementigen Teilmenge einer 5-elementigen
P (E) =
n(E)
10
5
=
= .
n
32
16
d) Es wird 2-mal gewürfelt. Es ist n = 36, denn mögliche Ergebnisse sind die Paare {(a1 , a2 ) |
a1 , a2 ∈ {1, ..., 6}}. Die Augensumme wird beobachtet, das Ereignis E sei
E = „Augensumme ist 5“ = {(a1 , a2 ) | a1 + a2 = 5}
= {(1, 4), (2, 3), (3, 2), (4, 1)}.
Also ist n(E) = 4 und
P (E) =
n(E)
4
1
=
= .
n
36
9
90
6 Stochastik
e) Gemeinsamer Geburtstag: Wie groß ist die Wahrscheinlichkeit des Ereignisses E, dass
von 30 Personen 2 am gleichen Tag Geburtstag haben? Es ist
n = 36530
die Anzahl der Möglichkeiten, 30 Geburtstage auf 365 Tage im Jahr zu verteilen. E ist
aufwändig zu formulieren, also betrachten wir das Gegenereignis:
E := „Alle Personen haben an verschiedenen Tagen Geburtstag“
Dann ist
n(E) = 365 · 364 · ... · 336
⇒
⇒
n(E) = 36530 − 365 · 364 · ... · 336
n(E)
365 · 364 · ... · 336
P (E) =
≈ 0,706
=1−
n
36530
Es ist P (E) > 0,5 bereits für n ≥ 23, d.h. bereits bei 23 Personen haben mit mehr als
50%iger Wahrscheinlichkeit zwei am gleichen Tag Geburtstag.
6.2 Endliche Ergebnismengen
6.2.1 Notation
Eine endliche Ergebnismenge mit n Elementen wird notiert durch
Ω = {ω1 , ..., ωn },
deren Elemente ω ∈ Ω heißen Elementarereignisse. Eine Teilmenge der Ergebnismenge
E⊆Ω
heißt Ereignis. Ein Ereignis E tritt ein, wenn ein Elementarereignis ω ∈ E eingetreten ist. Ist
jedes der Elementarereignisse gleich wahrscheinlich, so ist
P (ω) =
1
1
=
|Ω|
n
(6.1)
die Wahrscheinlichkeit mit der es eintritt (Laplace - Wahrscheinlichkeit) und
P (E) =
|E|
|Ω|
(6.2)
die Wahrscheinlichkeit mit der ein Ereignis E eintritt. In den obigen Beispielen bedeutet dieses:
91
6 Stochastik
6.2 Beispiele
a) Für das Zufallsexperiment einmaliges Würfeln erhält man mit diesen Begriffen, dass die
Ergebnismege Ω = {1, 2, ..., 6} ist und n = |Ω| = 6. Im Falle eines idealen Würfels
liegt ein Laplace - Experiment vor mit P (ω) = 16 . Betrachten wir nun das Ereignis
E = „Augenzahl kleiner als 3“ so ist
E = {1, 2}
|E| = 2
|E|
2
1
P (E) =
= =
|Ω|
6
3
b) Beim Experiment mit 10 gleichförmigen Kugeln (3 rote, 2 grüne, 5 schwarze) muss jede
einzelne Kugel als mögliches Elementarereignis betrachtet werden, damit ein Laplace Experiment vorliegt. Wird das Ereignis „Kugel ist rot oder grün“ betrachtet, so ist
Ω = {r1 , r2 , r3 , g1 , g2 , s1 , s2 , ..., s5 }
n = |Ω| = 10
E = {r1 , r2 , r3 , g1 , g2 }
|E| = 5
5
1
|E|
=
=
P (E) =
|Ω|
10
2
Bemerkung: Man kann Ω = {r, g, s} wählen, allerdings handelt es sich dann nicht um
3
2
5
ein Laplace-Experiment, denn P (r) = 10
, P (g) = 10
und P (s) = 10
.
c) Bezeichnen wir beim 5-fachen Münzwurf wiederum die Resultate der einzelnen Würfe mit
0 und 1 so ist ein Elementarereignis z. B. von der Form ω = (1, 0, 0, 1, 1) und es ist
Ω = {(a1 , a2 , a3 , a4 , a5 ) | ai ∈ {0, 1} für i = 1, 2, . . . , 5}
n = |Ω| = 25 = 32
und für das oben betrachtete Ereignis E = „Genau 3 mal Zahl“ ist
!
5
3
|E| =
P (E) =
da es nach (1.5) genau
=
5!
= 10
3! 2!
10
5
|E|
=
= ,
|Ω|
32
16
5
3
Möglichkeiten gibt, bei 5 Würfen genau 3 mal Zahl zu erhalten.
d) 2-mal Würfeln (unter Beachtung der Reihenfolge oder mit unterscheidbaren Würfeln) ergibt
Ω = {(a1 , a2 ) | a1 , a2 ∈ {1, 2, ..., 6}}
|Ω| = 36.
92
6 Stochastik
Sind nicht alle Elementarereignisse gleich wahrscheinlich, so kann keine Laplace - Wahrscheinlichkeit (6.1) zugrunde gelegt werden. Es wird der allgemeine Begriff der Wahrscheinlichkeitsverteilung benötigt.
6.3 Definition: Wahrscheinlichkeitsverteilung
Eine Wahrscheinlichkeitsverteilung über einer Ergebnismenge Ω = {ω1 , ω2 , ..., ωn } ist
eine Funktion
P : Ω → [0.1]
ω 7→ P (ωi )
= „Wahrscheinlichkeit, dass das Elementarereignis ωi eintritt“
mit der Eigenschaft:
P (ω1 ) + ... + P (ωn ) =
n
X
P (ωi ) = 1.
(6.3)
i=1
Ist P : Ω → [0, 1] mit der Eigenschaft (6.3) gegeben, so definiert man für jedes Ereignis
E ⊆ Ω:
P (E) :=
X
P (ω).
ω∈E
6.4 Beispiel Wir betrachten wieder die Urne mit 3 roten, 2 grünen und 5 schwarzen Kugeln
3
2
5
und wählen nun Ω = {r, g, s}. Dann ist P (r) = 10
, P (g) = 10
und P (s) = 10
. Für das Ereignis
E = „rot oder grün“ = {r, g} folgt dann
P (E) = P (r) + P (g) =
3
2
1
+
= .
10 10
2
6.5 Satz
Für eine Wahrscheinlichkeitsverteilung P über einer Ergebnismenge Ω gelten die folgenden
Rechenregeln:
i) P (∅) = 0 und P (Ω) = 1
ii) Für jedes Ereignis E ⊆ Ω ist
0 ≤ P (E) ≤ 1
iii) Sind E1 , E2 ⊆ Ω Ereignisse, so ist
P (E1 ∪ E2 ) = P (E1 ) + P (E2 ) − P (E1 ∩ E2 )
93
6 Stochastik
E1 ∪ E2 bedeutet, dass E1 oder E2 eintritt (oder auch E1 und E2 ), E1 ∩ E2 bedeutet
dass E1 und E2 eintreten.
iv) Ist E ⊆ Ω ein Ereignis, so bezeichnet E := Ω \ E (siehe Definition 1.4) das Komplementärereignis („E tritt nicht ein“) und es gilt
P (E) = 1 − P (E).
Beweis: Es folgt iv) aus iii) und i), wenn man beachtet, dass E ∪ E = Ω und E ∩ E = ∅.
Dann ist P (E ∪ E) = 1 und P (E ∩ E) = 0, so dass aus iii) folgt:
1 = P (E ∪ E) = P (E) + P (E) − P (E ∩ E)
= P (E) + P (E).
6.2.2 Bedingte Wahrscheinlichkeit
Bei einem Glücksspiel mit einem Würfel sollen Sie, nachdem der Würfel geworfen wurde aber
ohne dass Sie ihn sehen können, tippen, ob das Ergebnis kleiner als 3 ist. Die Wahrscheinlichkeit, dass F = {1, 2} eintritt, beträgt 31 . Nun erhalten Sie vorab die Information, dass das
Ergebnis des Wurfes kleiner oder gleich 3 ist, d. h. das Ereignis E = {1, 2, 3} ist eingetreten.
Dadurch verändert sich für Sie die Wahrscheinlichkeit dass das Ereignis F ebenfalls eingetreten
ist, diese beträgt nun 32 . In formaler Notation ist Ω = {1, 2, ..., 6} und
F = {1, 2},
1
3
1
P (E) = .
2
P (F ) =
E = {1, 2, 3},
Wissen Sie nun, dass eine der 3 Zahlen aus E = {1, 2, 3} geworfen wurde, so ist für Sie die
Wahrscheinlichkeit, dass das Ereignis F = {1, 2} eingetreten ist gegeben durch
|F ∩ E|
2
= .
|E|
3
(6.4)
Dieses führt zu der folgenden Begriffsbildung.
6.6 Definition: Bedingte Wahrscheinlichkeit
Sei P eine Wahrscheinlichkeitsverteilung über Ω und seien E ⊆ Ω, F ⊆ Ω Ereignisse und
sei P (E) > 0. Die bedingte Wahrscheinlichkeit P (F | E) für das Eintreten von F
unter der Vorraussetzung, dass E eintritt, ist durch
P (F | E) =
P (F ∩ E)
P (E)
(6.5)
definiert. Die Ereignisse E und F heißen unabhängig, wenn die Information über das
Eintreten von E die Wahrscheinlichkeit für F nicht verändert, d. h. wenn
P (F | E) = P (F )
94
(6.6)
6 Stochastik
gilt.
P (F ) ist die a-priori-Wahrscheinlichkeit für das Eintreten von F , P (F | E) ist die a-posterioriWahrscheinlichkeit für F , wenn die Information vorliegt, dass E eingetreten ist.
6.7 Beispiel In dem Eingangsbeispiel ist E ∩ F = {1, 2}, also ist P (E ∩ F ) = 13 , also folgt mit
P (E) = 21 nach obiger Definition (6.5)
P (E ∩ F )
=
P (F | E) =
P (E)
1
3
1
2
2
= .
3
Da aber P (F ) = 31 ist, sind E und F nicht unabhängig, Bedingung (6.6) ist nicht erfüllt.
Betrachten wir hingegen das Ereignis G = {2, 4}, so ist P (G) = 13 und E ∩ G = {2}. Also ist
P (E ∩ G) = 61 , so dass
P (G | E) =
P (E ∩ G)
=
P (E)
1
6
1
2
=
2
1
=
6
3
Also sind E und G unabhängige Ereignisse, die Kenntnis dass E eingetreten ist beeinflusst die
Wahrscheinlichkeit das G ebenfalls eintritt nicht, (6.6) ist erfüllt.
6.8 Bemerkung Liegt, wie in dem Eingangsbeispiel mit denm Würfel, ein Laplace-Experiment
|E∩F |
zugrunde, so ist P (E) = |E|
|Ω| und P (E ∩ F ) = |Ω| , so wird (6.5) zu
P (F ∩ E)
P (F | E) =
=
P (E)
|E∩F |
|Ω|
|E|
|Ω|
=
|F ∩ E|
,
|E|
was in den Vorüberlegungen (siehe (6.4)) bereits verwendet wurde.
Die bedingten Wahrscheinlichkeiten P (F | E) und P (E | F ) dürfen nicht verwechselt werden.
Ihr Zusammenhang wird durch die Formel von Bayes bschrieben.
6.9 Satz: Formel von Bayes
Seien E, F ⊆ Ω Ereignisse mit P (E) 6= 0 und P (F ) 6= 0. Dann ist
P (F | E) =
P (E | F )
· P (F ).
P (E)
(6.7)
Beweis. Es sind nach (6.5) die bedingten Wahrscheinlichkeiten gegeben durch
P (F | E) =
P (F ∩ E)
P (E)
und
P (E | F ) =
P (E ∩ F )
P (F )
so dass
P (F ∩ E) = P (F | E) · P (E)
und
95
P (E ∩ F ) = P (E | F ) · P (F )
6 Stochastik
Nun ist aber P (F ∩ E) = P (E ∩ F ), so dass aus diesen beiden Gleichungen
P (F | E) · P (E) = P (E | F ) · P (F ),
folgt, wass gerade die zu zeigende Gleichung (6.7) ist.
6.10 Beispiel Der Eliza-HIV-Test: Der Unterschied von P (E | F ) zu P (F | E) sei am Beispiel
des Eliza-HIV-Tests demonstriert. Der Test soll feststellen, ob Antikörper im Blut vorhanden sind, hierbei sind Fehler möglich. Es werden also in einer Testgruppe Ω die folgenden 4
Ergebnisse betrachtet
A+
A−
B+
B−
Es sind Antikörper vorhanden.
Es sind keine Antikörper vorhanden.
Testbefund ist positiv.
Testbefund ist negativ.
Die Qualität des Test wird durch die Kenngrößen P (B + | A+ ) (Sensitivität), welche die Wahrscheinlichkeit dafür angibt, dass das Vorhandensein von Antikörpern zu einem positiven Testergebnis führt, und P (B − | A− ) (Spezifität), welche umgekehrt wie Wahrscheinlichkeit dafür
ist, dass bei einer Probe die frei von Antikörpern ist, ein negatives Testergebnis erzielt wird,
beschrieben. Für den Eliza-Test gilt:
P (B + | A+ ) = 0,999
−
Sensitivität
−
P (B | A ) = 0,995
Spezifität.
Zudem sei die a-priori-Wahrscheinlichkeit mit der eine Person der Testgruppe infiziert sei
aufgrund von Erfahrungswerten angenommen als P (A+ ) = 0,001. Trotz der augenscheinlich
sehr guten Werte für Sensitivität und Spezifität sind die meisten positiven Befunde falsch
positiv:
Ω
P (A− )
P (A+ )
A−
A+
P (B + | A+ )
1 − P (B + | A+ )
B−
B+
1 − P (B − | A− )
P (B − | A− )
B+
B−
Wie man der Skizze entnimmt ist die Wahrscheinlichkeit für einen positiven Befund
P (B + ) = P (A+ ) · P (B + | A+ ) + P (A− ) · (1 − P (B − | A− ))
= 0,001 · 0,999 + 0,999 · 0,005
= 0,00599.
96
6 Stochastik
Die Wahrscheinlichkeit, bei einem positiven Befund auch tatsächlich infiziert zu sein, ist nun
P (A+ | B + ) =
0,999
P (B + | A+ )
· P (A+ ) =
· 0,001 = 0,1667.
P (B + )
0,00599
Dieses bedeutet, dass bei einem positiven Testbefund die Wahrscheinlichkeit einer tatsächlichen
Infektion nur bei ca. 16,7 % liegt. Die Wahrscheinlichkeit bei positivem Befund nicht infiziert
zu sein ist hingegen
P (A− | B + ) = 1 − P (A+ | B + ) ≈ 83,3%.
Ein negatives Testergebnis tritt auf mit Wahrscheinlichkeit
P (B − ) = 1 − P (B + ) = 0,99401
und sagt mit hoher Wahrscheinlichkeit aus, dass tatsächlich keine Infektion vorliegt:
P (B − | A− )
· P (A− )
P (B − )
0,995
=
· 0,999 = 0,999999.
0,99401
P (A− | B − ) =
6.2.3 Zufallsvariable
Häufig interessiert man sich bei einem Zufallsexperiment nicht unmittelbar für die Beobachtungsgröße und deren Wahrscheinlichkeit, sondern für eine aus der Beobachtung abgeleitete
Größe und die Wahrscheinlichkeit mit der diese eintritt. Beim Roulette interessiert uns beispielsweise nicht vorrangig ob “rot” oder “schwarz” eintritt, sondern mit welcher Wahrscheinlichkeit wir einen hieraus resultierenden Gewinn erwarten können. Um diese Fragestellung zu
formulieren, benötigen wir den Begriff der Zufallsvariablen.
6.11 Definition: Zufallsvariable
Eine Zufallsvariable (Zufallsgröße) auf einer Ergebnismenge Ω ist eine Funktion
X: Ω→R
ω 7→ X(ω),
die jedem möglichen Elementarereignis ω eine relle Zahl X(ω) zuordnet. Die Elemente
der Wertemenge der Zufallsvariablen X(Ω) = {X(ω) | ω ∈ Ω} ⊆ R werden mit
x ∈ X(Ω)
bezeichnet. Es ist
{ω | X(ω) = x} ⊆ Ω
die Menge der Elementarereignisse ω, für die die Zufallsvariable X den Wert x annimmt.
97
6 Stochastik
6.12 Beispiel Beim 2-maligen Würfeln wird die Augensumme beobachtet (siehe Beispiel 6.1
d)). Dann ist die Ergebnismenge Ω = {(a1 , a2 ) | a1 , a2 ∈ {1, 2, . . . , 6}} und die Zufallsvariable
X =“Augensumme” wird definiert durch
X: Ω→R
(a1 , a2 ) 7→ a1 + a2 .
Diese zufallsvariable hat die Wertemenge
X(Ω) = {2, 3, ..., 12} ⊆ R
Die Zufallsvariable “Augensumme” nimmt den Wert 5 an auf der Menge
{(1, 4), (2, 3), (3, 2), (4, 1)}.
Nun möchten wir die Wahrscheinlichkeit berechnen, mit der die Augensumme 5 gewürfelt wird.
Dies führt zu der
6.13 Definition: Induzierte Wahrscheinlichkeit
Die induzierte Wahrscheinlichkeitsverteilung P X auf X(Ω) ist gegeben durch
P X (x) := P ({ω | X(ω) = x}).
(6.8)
Formal bedeutet dieses:
P
Ω
[0, 1]
X
X(Ω)
PX
[0, 1]
Im Beispiel mit 2-mal Würfeln heißt das: Wählen wir x = 5 ∈ X(Ω) aus dem Wetrebereich
der Zufallsvariablen “Augensumme”, dann wird dieser Wert realisiert durch die 4 Elementarereignisse
{ω | X(ω) = 5} = {(1, 4), (2, 3), (3, 2), (4, 1)}
so dass die induzierte Wahrscheinlichkeit
P X (5) = P ({(1, 4), (2, 3), (3, 2), (4, 1)})
1
4
=
=
36
9
ist. Die Wahrscheinlichkeit, beim Wurf mit zwei Würfeln die Augensumme 5 zu erhalten ist
also 19 . Die induzierte Wahrscheinlichkeit notiert man auch durch P (X = x) = P X (x) oder
98
6 Stochastik
P (x) = P X (x). In obigem Beispiel ist also:
P X (5) = P (X = 5) = P (5).
Für eine Teilmenge E ⊆ X(Ω) definiert man:
P X (E) := P ({ω | X(ω) ∈ E})
= P (x ∈ E)
6.14 Beispiel Für das Ereignis E = „Augensumme kleiner als 4“ = {(1, 1), (1, 2), (2, 1)}, ist
P X (E) = P (X < 4)
1
3
= .
=
36
12
Darstellung einer Zufallsvariablen im Histogramm:
Wir bleiben bei dem Experiment 2-maliges Würfeln und betrachten weiterhin die Augensumme.
Es ist
Ω = {(a1 , a2 ) | a1 , a2 ∈ {1, ..., 6}},
X(ω) = a1 + a2 ,
|Ω| = 36,
X(Ω) = {2, 3, ..., 12}.
Um die induzierte Wahrscheinlichkeit zu berechnen überlegen wir uns zunächst, dass
{ω | X(ω) = 2} = {(1, 1)}
{ω | X(ω) = 3} = {(1, 2), (2, 1)}
{ω | X(ω) = 4} = {(1, 3), (2, 2), (3, 1)}
{ω | X(ω) = 5} = {(1, 4), (4, 1), (3, 2), (2, 3)}
{ω | X(ω) = 6} = {(1, 5), (2, 4), (3, 3), (4, 2), (5, 1)}
(6.9)
{ω | X(ω) = 7} = {(1, 6), (2, 5), (3, 4), (4, 3), (5, 2), (6, 1)}
{ω | X(ω) = 8} = {(2, 6), (3, 5), (4, 4), (5, 3), (6, 2)}
..
.
{ω | X(ω) = 12} = {(6, 6)}.
Da für das Würfelexperiment eine Laplace-Verteilung angenommen werden kann, berechnet
sich die induzierte Wahrscheinlichkeit P X (x) durch
P X (x) = P ({ω | X(ω) = x}) =
|{ω | X(ω) = x}|
,
|Ω|
woraus wir mit den Werten aus (6.9) die induzierten Wahrscheinlichkeiten erhalten. Diese
Wahrscheinlichkeitsverteilung kann einerseits tabellarisch, aber auch in einem Histogramm
dargestellt werden. In einem Histogramm wird die induzierte Wahrscheinlichkeit über dem
Wertebereich der Zufallsvariablen aufgetragen.
99
6 Stochastik
x
2
3
4
5
6
7
8
9
10
11
12
P X (x)
1
36
2
36
3
36
4
36
5
36
6
36
5
36
4
36
3
36
2
36
1
36
Tabelle 6.1: Wahrscheinlichkeitsverteilung der Zufallsvariablen “Augensumme”
1
P (x) [ 36
]
6
5
4
3
2
1
1
2
3
4
5
6
7
8
9
10
11
12
x= Augensumme
Abbildung 6.1: Histogramm der Zufallsvariablen “Augensumme”
6.2.4 Erwartungswert, Varianz und Standardabweichung
6.15 Definition: Erwartungswert
Ist X : Ω → R eine Zufallsvariable und P eine Wahrscheinlichkeitsverteilung auf Ω, so
heißt
E(X) :=
X
X(ω) · P (ω)
(6.10)
ω∈Ω
=
X
x · P (X = x)
(6.11)
x∈X(Ω)
der Erwartungswert von X.
6.16 Beispiel Es soll der Erwartungswert für das Werfen zweier Würfel bestimmt werden.
Um deutlich zu machen, dass die Formeln (6.10) und (6.11) übereinstimmen, werden wir beide
Formeln auswerten. Es ist Ω = {(a1 , a2 ) | a1 , a2 ∈ {1, ..., 6}} und für die Elementarereignisse
ω gilt
P (ω) =
1
36
und
100
X(ω) = a1 + a2 .
6 Stochastik
Also können wir den Erwartungswert mit Formel (6.10) berechnen durch
E(X) =
X
X(ω) ·
ω∈Ω
1
36
1
· X(1, 1) + X(1, 2) + X(2, 1) + X(1, 3) + X(3, 1) + ... + X(5, 6) + X(6, 6)
36
=2
=3
=3
=4
=4
=11
=12
1
=
· [1 · 2 + 2 · 3 + 3 · 4 + 4 · 5 + 5 · 6 + 6 · 7 + 5 · 8 + 4 · 9 + 3 · 10 + 2 · 11 + 1 · 12]
36
=7
=
oder, in dem wir die Werte P (X = x) Tabelle 6.1 entnehmen, mit Formel (6.11) durch:
E(X) =
X
x · P (X = x)
x∈X(Ω)
2
3
4
5
6
1
+ 3·
+ 4·
+ 5·
+ 6·
+ 7·
36
36
36
36
36
36
5
4
3
2
1
+ 8·
+ 9·
+ 10 ·
+ 11 ·
+ 12 ·
36
36
36
36
36
=7
= 2·
Zufallsvariablen sehr unterschiedlicher “Streubreite” können den gleichen Erwartungswert haben. Daher ist neben dem Erwartungswert selber die durchschnittliche Abweichung einer Zufallsvariablen von ihrem Erwartungswert eine wichtige Kenngröße.
6.17 Definition: Varianz, Standardabweichung
Die Varianz Var(X) einer Zufallsvariablen X : Ω → R mit Erwartungswert E(X) bezüglich einer Wahrscheinlichkeitsverteilung P ist
Var(X) :=
X
(X(ω) − E(X))2 · P (ω).
(6.12)
ω∈Ω
Die Standardabweichung ist definiert durch
σ(X) :=
q
Var(x).
(6.13)
σ(X) ist ein Maß für die durchschnittliche Abweichung von X vom Erwartungswert E(X).
6.18 Folgerung Äquivalent zu (6.12) lässt sich die Varianz auch definieren durch
Var(X) =
X
(x − E(X))2 · P (X = x)
(6.14)
x∈X(ω)
= E (X − E(X))2 .
6.19 Beispiel Sei X die Augensumme beim Wurf mit zwei Würfeln. Es ist der Erwartungswert
E(X) = 7, so dass mit X(Ω) = {2, ..., 12} und den Werten für P (x) aus Tabelle 6.1 die Varianz
101
6 Stochastik
mit Gleichung (6.14) berechnet werden kann.
Var(X) =
(x − E(X))2 · P (X = x)
X
x∈X(Ω)
1
1
+ (12 − 7)2 ·
36
36
2
2
+ (3 − 7)2 ·
+ (11 − 7)2 ·
36
36
2 3
2 3
+ (4 − 7) ·
+ (10 − 7) ·
36
36
4
4
+ (5 − 7)2 ·
+ (9 − 7)2 ·
36
36
2 5
2 5
+ (6 − 7) ·
+ (8 − 7) ·
36
36
2 6
+ (7 − 7) ·
36
1
=
· (2 · 52 + 2 · 42 · 2 + 2 · 32 · 3 + 2 · 22 · 4 + 2 · 12 · 5)
36
210
=
≈ 5,83.
36
= (2 − 7)2 ·
Damit erhält man für die Standardabweichung
σ(X) =
p
5,83 ≈ 2,41.
Betrachten wir den Bereich, in dem die Zufallsvariable “Augensumme” um höchstens σ von
ihrem Erwartungswert abweicht,
E(X) − σ ≤ X ≤ E(X) + σ,
so entnehmen wir obigem Histogramm die Wahrscheinlichkeit dafür, dass ein Ereignis in einer
σ-Umgebung des Erwartungswerts liegt:
P (7 − 2,4 ≤ X(ω) ≤ 7 + 2,4) = P (5 ≤ X(ω) ≤ 9)
4
5
6
5
4
=
+
+
+
+
36 36 36 36 36
24
2
=
= .
36
3
Bei vielen Würfen werden etwa 23 um höchstens den Wert 2 vom Erwartungswert 7 abweichen.
Siehe hierzu auch Abbildung 6.2 auf Seite 109.
6.20 Satz
i) Für jede Zufallsvariable X : Ω → R gilt:
E (|X − E(X)|) ≤ σ(X).
102
6 Stochastik
ii) Sei eine weitere Zufallsvariable Y definiert durch
Y : Ω→R
ω 7→ Y (ω) = αX(ω) + β
mit α, β ∈ R, α 6= 0, dann sind der Erwartungswert und die Varianz von Y gegeben
durch
E(Y ) = α E(X) + β
Var(Y ) = α2 Var(X)
σ(Y ) = α σ(X).
iii) Für zwei Zufallsvariablen X, Y : Ω → R gilt:
E(X + Y ) = E(X) + E(Y ).
Beweis. von ii): Nach der Definition des Erwartungswertes durch Gleichung (6.10) ist
X
E(Y ) =
Y (ω) · P (ω)
ω∈Ω
X
=
(αX(ω) + β) · P (ω)
ω∈Ω
=α
X
X(ω) · P (ω) + β
ω∈Ω
X
P (ω)
ω∈Ω
|
{z
=1
}
= α E(X) + β.
Die Varianz ist definiert durch Gleichung (6.12), so dass
Var(Y ) =
(Y (ω) − E(Y ))2 · P (ω)
X
ω∈Ω
=
(αX(ω) + β − (α E(X) + β))2 · P (ω)
X
ω∈Ω
X
2
(X(ω) − E(X))2 · P (ω)
=α
ω∈Ω
2
= α Var(X)
und für die Standardabweichung folgt
σ(Y ) =
q
Var(Y ) =
q
α2 Var(X) = α σ(X).
Wichtig: Im Allgemeinen ist
E(X · Y ) 6= E(X) · E(Y )
und
Var(X · Y ) 6= Var(X) · Var(Y ).
103
6 Stochastik
6.21 Satz
Für die Varianz gilt: (Ohne Beweis)
Var(X) = E (X − E(X))2
= E(X 2 ) − E(X)2
6.2.5 Die Binomialverteilung
Es werden Zufallsexperimente mit genau 2 möglichen Ergebnissen untersucht, d.h. der Ergebnisraum kann stets als Ω = {0, 1} aufgefasst werden. Beispiele hierzu sind in Tabelle 6.2
aufgeführt. Eine Wahrscheinlichkeitsverteilung auf Ω ist gegeben durch
p := P (1)
q := P (0) = 1 − p.
und
Wird eines dieser Experimente 5-mal hintereinander ausgeführt, so ist die Ergebnismenge
Ω5 = {(a1 , a2 , ..., a5 ) | a1 , ..., a5 ∈ {0, 1}}
= {(0, 0, 0, 0, 0), (1, 0, 0, 0, 0), (0, 1, 0, 0, 0), ...}
Gesucht sei nun die Wahrscheinlichkeit
für genau 2-mal die „1“. Wie wir aus der Kombinatorik
wissen (siehe (1.5), gibt es 52 Möglichkeiten für 2-mal die „1“. Hat ein Elementarereignis ω ∈ Ω5
2-mal die „1“, so dessen Wahrscheinlichkeit
P (ω) = p2 · q 5−2 .
Ist also X : Ω5 → R die Zufallsvariable mit
X(ω) = „Anzahl der ‚1‘ in ω“,
so gibt es
5
2
Elemente ω ∈ Ω mit X(ω) = 2 und es ist
!
P (X = 2) =
5 2 5−2
p ·q .
2
1
0
P (1)
Kopf
Zahl
1
2
Geschlecht Neugeborenes
w
m
0,484
Roulette
rot
nicht rot
2 Würfel
Pasch
kein Pasch
18
37
1
6
Münzwurf
Tabelle 6.2: Beispiele binomialverteilter Zufallsexperimente
104
6 Stochastik
Allgemein gilt bei n Ausführungen des Experiments:
Ωn = {(a1 , ..., an ) | a1 , ..., an ∈ {0, 1}}
und es ist die Wahrscheinlichkeit für genau k-mal die „1“:
!
P (X = k) =
n k n−k
p ·q
.
k
6.22 Bemerkung Durch P wird eine Wahrscheinlichkeitsverteilung auf Ωn definiert, da die
Summe der Wahrscheinlichkeiten aller möglichen Ereignisse 1 ergibt:
X
P (ω) =
ω∈Ω
=
=
n
X
P (X = k)
k=0
n
X
!
n k n−k
p ·q
k
k=0
n
X
!
n k
p · (1 − p)n−k
k
k=0
= (p + (1 − p))n = 1.
6.23 Definition: Binomialverteilung
Eine Zufallsvariable X : Ω → R heißt binomialverteilt mit den Parametern n, p, wenn
sie die Werte X(Ω) = {0, 1, ..., n} annimmt und wenn
!
P (X = k) =
n k n−k
p ·q
k
(6.15)
für 0 ≤ k ≤ n gilt, wobei 0 < p < 1 und q = 1 − p. Man schreibt auch
X ∼ B(n, p).
Erwartungswert und Varianz der Binomialverteilung:
Es sei X eine binomialverteilte Zufallsvariable, X ∼ B(n, p). Wir betrachten als Hilfsgröße die
Zufallsvariable
Xi := „Treffer im i-ten Experiment“.
Dann ist
P (Xi = 1) = p
und
105
P (Xi = 0) = 1 − p,
6 Stochastik
so dass der Erwartungswert der Hilfsgröße Xi nach (6.10)
E(Xi ) = 1 · p + 0 · (1 − p) = p
ist. Aus X =
Pn
i=1 Xi
und Satz 6.20 iii) folgt für den Erwartungswert von X
E(X) =
n
X
E(Xi ) =
i=1
n
X
p = np.
i=1
Für die Varianz der Xi gilt:
Var(Xi ) = (0 − p)2 · (1 − p) + (1 − p)2 · p
= p2 (1 − p) + (1 − p)2 · p
= p(1 − p)(p + 1 − p)
= p · q.
Da die Zufallsvariablen Xi unabhängig sind, gilt:
(∗)
Var(X) =
n
X
Var(Xi )
i=1
= npq.
(Ohne Beweis. Die Gleicheit (∗) gilt nur für unabhängige Zufallsvariablen und nicht allgemein!)
6.24 Satz: Binomialverteilung
Für eine B(n, p)-verteilte Zufallsvariable X gilt:
E(X) = np
Var(X) = npq
√
σ(X) = npq
6.2.6 Die Poissonverteilung
Anwendung findet die Poissonverteilung zur Beschreibung vieler gleichartiger Ereignisse, die
jeweils nur mit geringer Wahrscheinlichkeit p eintreten, z. Bsp.
- Verteilung von Bakterien in einer Suspension
- Anzahl der zerfallenen Atome pro Zeiteinheit in einem radioaktiven Material.
Sie wird auch verwendet als Approximation der Binomialverteilung B(n, p) für große n und
kleine p, da die Binomialverteilung dann schlecht zu berechnen ist. Betrachten wir
!
B(n, p, k) :=
n k
p (1 − p)n−k
k
106
6 Stochastik
für festen Erwartungswert µ = np. Setzen wir in dieser Gleichung p =
µ
B(n, , k) =
n
n
k
! k
µ
k
µ
n
n−k
µ
n
1−
=
n!
µk
· k·
k! (n − k)! n
n!
µk
·
·
(n − k)! nk k!
=
|
|
{z
}
(1)
1−
1−
µ
n
ein, so erhalten wir
n−k
µ
n
n
{z
}
(2)
µ
n
−k
{z
}
·
1−
|
(3)
Die Terme (1), (2) und (3) konvergieren für n → ∞, da
(1):
n!
n · (n − 1) · (n − 2) · ... · (n − k + 1) (n − k)!
=
·
k
(n − k)! n
n · n · n · ... · n
(n − k)!
2
k+1
1
· 1−
· ... · 1 −
= 1· 1 −
n
n
n
|
{z
}
k Faktoren
−→ 1.
n→∞
(2):
µ
1−
n
n
−→ e
n→∞
−µ
x
1+
n
,
da lim
n→∞
n
= ex .
(3):
1−
µ
n
−→ 1,
n→∞
also auch
1−
µ
n
−k
−→ 1.
n→∞
Insgesamt folgt also:
µ
µk −µ
lim B(n, , k) =
·e .
n→∞
n
k!
6.25 Definition: Poissonverteilung
Eine Zufallsvariable X mit der Wahrscheinlichkeitsverteilung
P (X = k) =
µk −µ
·e
k!
heißt poissonverteilt mit Parameter µ , geschrieben auch als P (µ; k) ∼ X.
107
(6.16)
6 Stochastik
6.26 Satz: Poissonverteilung
Für eine mit Parameter µ poissonverteilte Zufallsvariable X gilt:
i)
E(X) = µ
ii)
Var(X) = µ
√
σ(X) = µ.
iii)
Beweis von i): Nach der Definition des Erwartungswerts ist
E(X) =
=
X
k · P (X = k)
k∈X(Ω)
∞
X
µk
k·
k=1
= µe−µ ·
= µe
= µe
−µ
k!
· e−µ
∞
X
µk−1
(k − 1)!
k=1
∞
X
µk
k=0
−µ µ
k!
e
= µ.
6.27 Beispiel In einer Glasschmelze seien Einschlüsse (z.B. Bläschen, Körner) verteilt. 1 Kilogramm Glasschmelze enthalte im Schnitt λ = 10 Einschlüsse. Es werden 2 g schwere Linsen
gegossen. Dann ist der Erwartungswert der Einschlüsse pro Linse
µ = E(X) = 0,002 kg ·
10
= 0,02,
kg
die Zufallsvariable X = „Einschlüsse pro Linse“ ist P (0,02; k)-verteilt:
X ∼ P (0,02; k)
und die Wahrscheinlichkeit genau keinen, einen oder mindestens zwei Einschlüsse in einer Linse
zu finden ist
0,020 −0,02
·e
= 0,98
0!
0,021 −0,02
P (X = 1) =
·e
= 0,0196
1!
P (X ≥ 2) = 1 − P (X = 0) − P (X = 1) = 0,0004.
P (X = 0) =
D.h. es werden 98% der Linsen fehlerfrei sein, 1,96% werden genau einen Fehler und 0,04%
zwei oder mehr Fehler haben.
108
6 Stochastik
6.3 Stetige Zufallsvariablen, die Normalverteilung
6.3.1 Stetige Zufallsvariablen
Bisher haben wir Zufallsvariablen mit diskreten Werten in N oder Z behandelt. Diese ließen
sich darstellen in einem Histogramm.
1
P (x) [ 36
]
P (5 ≤ x ≤ 9)
6
5
4
3
2
1
1
2
3
4
5
6
7
8
9
10
11
12
x= Augensumme
Abbildung 6.2: Der Bereich P (5 ≤ x ≤ 9) einer diskreten Zufallsvariablen
Die Wahrscheinlichkeit dafür, dass die Zufallsvariable Werte in einem Intervall [a, b] annimmt
wird gegeben durch die Summe
P (a ≤ X ≤ b) =
b
X
P (X = k).
k=a
Der schraffierten Fläche im Histogramm entspricht die Wahrscheinlichkeit, dass die Augensumme beim Wurf mit 2 Würfeln 5 bis 9 beträgt (siehe Beispiel 6.19). Kann nun die Zufallsvariable
X Werte in R annehmen, so wird die Wahrscheinlichkeit P (X = x) = 0 sein für die „meisten“ x ∈ R. Sinnvoller ist die Frage danach, mit welcher Wahrscheinlichkeit die Zufallsvariable
X Werte in einem Intervall [a, b] annimmt und das Histogramm durch die Fläche unter einer Kurve zu ersetzen, siehe hierzu Abb. 6.3 Die Wahrscheinlichkeitsverteilung einer stetigen
Zufallsvariable X ist dann durch eine Funktion p : R → R≥0 gegeben:
P (a ≤ X ≤ b) =
Z b
p(x) dx.
(6.17)
a
Wegen P (−∞ < X < ∞) = 1 muss die Funktion p normiert sein,
Z ∞
p(x) dx = 1.
(6.18)
−∞
Die Funktion p heißt Dichtefunktion oder auch Wahrscheinlichkeitsdichte der Zufallsvariablen X, wenn (6.17) gilt. Analog zum diskreten Fall (siehe Definitionen 6.15 und 6.17)
109
6 Stochastik
0.5 R
R
a
b
Abbildung 6.3: Der Bereich P (a ≤ X ≤ b) einer stetigen Zufallsvariablen
definiert man den Erwartungswert und die Varianz von X durch:
Z ∞
E(X) :=
−∞
Z ∞
Var(X) :=
x · p(x) dx
(6.19)
(x − µ)2 p(x) dx,
(6.20)
−∞
sofern die uneigentlichen Integrale existieren. Wir verwenden die Abkürzung
µ := E(X)
und es ist weiterhin
σ(X) =
q
Var(X).
6.3.2 Die Gaußsche Normalverteilung
Ein wichtiges Beispiel einer stetigen Zufallsvariablen ist die Gaußsche Normalverteilung.
6.28 Definition: Gaußsche Normalverteilung
Eine Zufallsvariable X heißt standardnormalverteilt, wenn sie die Wahrscheinlichkeits2
dichte ϕ(x) =
x
√1 e− 2
2π
hat, so dass für alle a, b ∈ R mit a ≤ b gilt
1
P (a ≤ X ≤ b) = √
2π
Z b
e−
x2
2
dx.
(6.21)
a
6.29 Satz: Gaußsche Normalverteilung
Für eine Zufallsvariable X mit Wahrscheinlichkeitsverteilung (6.21) ist E(X) = 0 und
Var(X) = 1. Man schreibt hierfür auch
X ∼ N (0; 1).
110
6 Stochastik
Definition 6.28 ist sinnvoll, da die Normierungsbedingung (6.18) für die Funktion ϕ(x) gilt,
was hier nicht bewiesen wird:
1
√
2π
Z ∞
e−
x2
2
dx = 1.
(6.22)
−∞
Beweis. Satz 6.29 beweisen wir, indem wir verwenden, dass ϕ(x) eine gerade Funktion ist, und
daher x · ϕ(x) ungerade ist. Der Erwartungswert E(X) ist also nach (6.19)
Z ∞
E(X) =
x · ϕ(x) dx =
Z 0
x · ϕ(x) dx +
Z ∞
−∞
−∞
x · ϕ(x) dx = 0.
(6.23)
0
Die Varianz ist nach Gleichung (6.20) mit Erwartugswert µ = 0 durch das folgende Integral
gegeben, welches mit partieller Integration (siehe (5.5)) berechnet werden kann:
Z ∞
Var(X) =
1
(x − 0)2 · ϕ(x) dx = √
2π
−∞
Z ∞
x2
− 2
x · |xe{z
|{z}
}
−∞
v
u0


1 
= √ [−xe
]∞
−∞ +
{z
}
2π |
2
− x2
Z ∞
e
2
− x2
−∞
dx

(6.24)
=0
1
=√
2π
Z ∞
e−
x2
2
dx
−∞
(∗)
= 1,
wobei in (∗) Gleichung (6.22) verwendet wurde.
In den Rechungen (6.23) und (6.24) wurde nicht darauf eingegangen, dass es sich um uneigentliche Integrale handelt, somit zusätzlich eine Grenwertbetrachtung nach Abschnitt 5.4
erfolgen müsste. Wissen wir nun, dass das Ergebnis X bei einer Messung N (0; 1)-verteilt ist,
so möchten wir berechnen können, mit welcher Wahrscheinlichkeit wir einen Messergebnis im
Intervall (−∞, 21 ] erwarten können. Zur Berechnung von P (−∞ < X ≤ 12 ) bräuchten wir die
Stammfunktion von ϕ(x). Diese heißt Verteilungsfunktion von ϕ und wird für die Standardnormalverteilung mit
1
Φ(x) := √
2π
Z x
e−
y2
2
dy
(6.25)
−∞
bezeichnet. Es ist Φ(x) die „Fläche unter ϕ bis x“, siehe Abb. 6.4
Φ ist keine elementare Funktion, es gibt keine explizite Darstellung, aber Φ ist tabelliert,
einige Werte sind in Tabelle 6.3 angegeben. Den Verlauf der Verteilungsfunktion Φ kann man
x
Φ(x)
0
0,5
0,2
0,579
0,5
0,691
0,75
0,77
1
0,841
1,25
0,89
1,5
0,933
1,96
0,975
2
0,977
2,5
0,994
3,0
0,999
Tabelle 6.3: Wertetabelle der Φ - Funktion
2
skizzieren, indem man den Zuwachs der Fläche unter ϕ(x) =
ϕ(x) = ϕ(−x) beachtet:
111
x
√1 e− 2
2π
und die Symmetrie
6 Stochastik
0.5 R
ϕ(y)
Φ(x)
R
x
Abbildung 6.4: Die Verteilungsfunktion Φ(x) = P (−∞ ≤ X ≤ x) der Gaußverteilung
R
1
Φ(a)
Φ(a)+Φ(−a)=1
Φ(−a)
R
a
−a
Abbildung 6.5: Die Verteilungsfunktion Φ(x) der Normalverteilung
Es ist offenbar limx→−∞ Φ(x) = 0 und wegen der Normierung (6.22) gilt limx→∞ Φ(x) = 1.
Ferner ist der Anstieg von Φ(x) in der Nähe der 0 am größten und Φ hat in 0 einen Wendepunkt.
Veranschaulichen Sie sich die Aussagen des folgenden Satzes an den Abbildungen 6.4 und 6.5.
6.30 Satz: Rechenregeln zur Gaußschen Normalverteilung
Sei X ∼ N (0; 1), dann gilt für die Verteilungsfunktion Φ(x) := P (X ≤ x):
P (a ≤ X ≤ b) = Φ(b) − Φ(a)
(6.26)
P (X ≥ x) = 1 − Φ(x)
1
Φ(0) =
2
Φ(−x) = 1 − Φ(x)
(6.27)
P (X ≥ −x) = 1 − Φ(−x) = 1 − (1 − Φ(x)) = Φ(x)
P (−x ≤ X ≤ x) = Φ(x) − Φ(−x) = 2Φ(x) − 1
(6.28)
(6.29)
(6.30)
(6.31)
6.31 Bemerkungen
1) Gleichung (6.26) verwendet nur die Definition (6.25) der Verteilungsfunktion Φ und Glei-
112
6 Stochastik
chung (6.27) verwendet zusätzlich nur die Normierung der Wahrscheinlichkeitsdichte ϕ,
sie gelten also für Verteilungsfunktionen zu beliebigen Wahrscheinlichkeitsdichten. Gleichungen (6.28), (6.29), (6.30) und (6.31) setzen die Symmetrie der Wahrscheinlichkeitsdichte und der daraus resultierenden Punktsymmetrie der Verteilungsfunktion bezüglich
des Punktes (0, 12 ) voraus. Sie gelten daher für alle Verteilungsfunktionen symmetrischer Wahrscheinlichkeitsdichten und nicht nur speziell die der Gaußverteilung. Gleichung (6.27) hat insbesondere zur Folge, dass es ausreicht, die Verteilungsfunktion Φ für
Werte x ≥ 0 zu tabellieren.
2 ) Mit Hilfe der Tabelle 6.3 können wir nun berechnen, dass
1
x2
2
1
1
e− 2 dx
P (−∞ < X ≤ ) = √
2
2π −∞
1
= 0,691.
=Φ
2
Z
Gleichzeitig ist natürlich
1
1
P ( ≤ X < ∞) = 1 − P (−∞ < X ≤ )
2
2
= 1 − 0,691 = 0,309
die Wahrscheinlichkeit für ein Messergebnis größer als
1
2
in obigem Beispiel.
6.3.3 Die N (µ; σ 2 ) - Verteilung
Viele Zufallsvariablen X haben eine Dichtefunktion, die aus der ϕ - Funktion Gaußschen Normalverteilung durch Streckung und Verschiebung entlang der x- Achse hervorgeht.
6.32 Definition: Gaußverteilung
Eine Zufallsvariable X̃ heißt normalverteilt mit Parametern µ, σ (µ ∈ R, σ > 0) wenn sie
die Wahrscheinlichkeitsdichte
ϕµ,σ (x) = √
1 x−µ 2
1
e− 2 ( σ )
2πσ
(6.32)
hat, das heißt wenn für alle a ≤ b mit a, b ∈ R gilt:
P (a ≤ X̃ ≤ b) = √
1
2πσ
Z b
1
e− 2 (
x−µ 2
σ
) dx
(6.33)
a
Man schreibt auch:
X̃ ∼ N (µ; σ 2 ).
Wie die Veränderung des Parameters µ die Glockenkurve ϕµ,σ verschiebt, wird dargestellt in
Abbildung 6.6, die Stauchung bzw. Streckung der Kurve durch verändertes σ in Abbildung 6.7.
113
6 Stochastik
R
σ=
1
2
0.5
σ=1
σ=
-3
-2
-1
1
3
2
R
2
Abbildung 6.7: Gaußsche Glockenkurven mit µ = 0 und σ = 21 , σ = 1 bzw. σ =
3
2
R
µ = −2 0.5
µ=2
R
-3
-2
-1
1
2
3
Abbildung 6.6: Gaußsche Glockenkurve mit µ = −2, µ = 0 bzw. µ = 2 und σ = 1
Man sieht, dass µ den Erwartungswert der Verteilung verändert und σ die Streubreite,
also die Varianz, beeinflusst. Durch eine lineare Transformation können Zufallsvariable mit der
Wahrscheinlichkeitsdichte (6.32) auf normalverteilte Zufallsvariable umgerechnet werden. Dass
ermöglicht es dann einerseits, Erwartungswert und Varianz zu berechnen und andererseits die
Wahrscheinlichkeit eines Ereignisses auf die Φ - Funktion der N (0; 1)-Verteilung zurück zu
führen.
6.33 Satz: Transformationsregel
i) Sei X eine Zufallsvariable mit Wahrscheinlichkeitsdichte p : R → R≥0 und seien α,
β ∈ R und α > 0. Die Zufallsvariable
X̃ := αX + β
hat dann die Wahrscheinlichkeitsdichte
1
x−β
p
α
α
p̃(x) =
und es gilt für Erwartungswert und Varianz von X̃
E(X̃) = α E(X) + β
Var(X̃) = α2 · Var(X).
114
6 Stochastik
ii) Für die durch Definition 6.32 erklärte Zufallsvariable X gilt
E(X) = µ
Var(X) = σ 2 .
und
1
α
Beweis. zu i): Wir zeigen nur, dass p̃(x) =
p
x−β
α
Wahrscheinlichkeitsdichte von X̃ ist. Die
Aussagen zu E(X̃) und Var(X̃) ergeben sich dann aus den definierenden Formeln für Erwartungswert (6.19) und Varianz (6.20) analog
zu
den entsprechenden Rechnungen im dirkreten
x−β
1
Fall (siehe Satz 6.20). Wenn p̃(x) = α p α
die Wahrscheinlichkeitsdichte von X̃ sein soll,
muss gelten:
P (a ≤ X̃ ≤ b) =
Z b
p̃(x) dx.
a
Also berechnen wir das Integral mittels der Substitutionsregel (Satz 5.13) mit g(x) =
g 0 (x) = α1 :
Z b
p̃(x) dx =
Z b x−β
p
α
a
a
Z b
=
·
x−β
α
und
1
dx
α
p(g(x)) · g 0 (x) dx
a
Z g(b)
p(y) dy
=
g(a)
Z
=
b−β
α
a−β
α
p(y) dy
b−β
a−β
≤X≤
)
α
α
= P (a ≤ αX + β ≤ b)
(∗)
= P(
= P (a ≤ X̃ ≤ b).
Wobei die Gleichheit (∗) gilt, da p(y) Wahrscheinlichkeitsdichte von X ist.
zu ii): Es ist ϕµ,σ (x) = σ1 ϕ( x−µ
σ ), wobei ϕ die Wahrscheinlichkeitsdichte der N (0; 1) - Verteilung
ist. Daher folgt aus Teil i) des Satzes dass
E(X̃) = σ E(X) + µ = µ
Var(X̃) = σ 2 · Var(X) = σ 2 ,
da E(X) = 0 und Var(X) = 1.
Ist nun eine N (µ; σ 2 ) - Verteilte Zufallsvariable X gegeben, so können wir durch die inverse
Transformation eine N (0; 1) - verteilte Zufallsvariable X ? erhalten. Hierfür wählen wir
1
1
α := p
=
σ
Var(X)
und
115
µ
β := − E(X) = − ,
σ
6 Stochastik
und es für die transformierte Zufallsvariable X ? = σ1 (X − µ) = σ1 X −
µ
σ
1
µ
E(X) − = 0
σ
σ
1
Var(X ? ) = 2 Var(X) = 1.
σ
E(X ? ) =
6.34 Bemerkungen
1) X ist standardnormalverteilt, wenn µ = 0 und σ = 1.
2) Ist X ∼ N (µ; σ 2 ), dann ist E(X) = µ und σ(x) = σ bzw. Var(X) = σ 2 .
3) Es gelten die Transformationsregeln
X ∼ N (0; 1)
⇒
X ∼ N (µ; σ 2 )
⇒
X̃ = σX + µ ∼ N (µ; σ 2 )
X −µ
∼ N (0; 1).
X? =
σ
(6.34)
(6.35)
Hiermit können wir eine N (µ; σ 2 )-verteilte Zufallsvariable X berechnen:
6.35 Satz
Sei X ∼ N (µ; σ 2 ), dann ist
P (a ≤ X ≤ b) = Φ
b−µ
σ
−Φ
a−µ
,
σ
(6.36)
wobei Φ(x) die in (6.25) definierte Verteilungsfunktion der N (0; 1)-Verteilung ist.
Beweis: Für den Beweis nutzen wir aus, dass Äquivalenzumformungen der Ungleichungskette
im Argument der Funktion P deren Wert nicht ändern, so dass aus
a≤X≤b
⇔
a−µ
X −µ
b−µ
≤
≤
,
σ
σ
σ
folgt, dass
a−µ
X −µ
b−µ
P (a ≤ X ≤ b) = P
≤
≤
σ
σ
σ
a−µ
b−µ
=P
≤ X? ≤
σ
σ
a−µ
b−µ
(∗)
=Φ
−Φ
.
σ
σ
In (∗) konnte Regel (6.26) verwendet werden, da nach (6.35) die Zufallsvariable X ? := σ1 (X −µ)
standardnormalverteilt ist.
6.36 Beispiel Die Zufallsvariable X=„Körperlänge von Neugeborenen“ sei N (µ; σ 2 ) - verteilt
mit µ = 51 cm und σ = 4 cm. Mit welcher Wahrscheinlichkeit ist ein Neugeborenes
a) zwischen 54cm und 56cm lang?
116
6 Stochastik
b) über 57cm lang?
zu a): Gesucht ist P (54 ≤ X ≤ 56):
54 − 51
X − 51
56 − 51
≤
≤
4
4
4
3
5
=P
≤ X̃ ≤
4
4
P (54 ≤ X ≤ 56) = P
(∗)
= Φ(1,25) − Φ(0, 75)
= 0,89 − 0,77
= 0,12 = 12%
wobei (∗) gilt, da X ? := X−51
N (0; 1)-verteilt ist, so dass Φ die Verteilungsfunktion von X ?
4
ist, deren Werte Tabelle 6.3 entnommen werden können.
zu b): Gesucht ist P (X > 57):
P (X > 57) = 1 − P (X ≤ 57)
57 − 51
X − 51
≤
=1−P
4
4
6
= 1 − P X? ≤
4
= 1 − Φ(1,5)
= 1 − 0,933 = 0,067.
6.37 Bemerkung Ein Beispiel einer anderen stetigen Zufallsverteilung als der Gaußverteilung
ist die Exponentialverteilung. Sie wird mit einem Parameter λ ∈ R>0 beschrieben durch die
Wahrscheinlichkeitsdichte
(
pλ (x) =
λ e−λx
0
falls x ≥ 0
falls x < 0.
∞
Dass auch hier die Normierungsbedingung (6.18)
p (x) dx = 1 erfüllt ist, rechnet man
R x −∞ λ
leicht nach. Die Verteilungsfunktion Fλ (x) = −∞ pλ (y) dy lässt sich in diesem Fall explizit
berechnen, sie lautet
R
(
Fλ (x) =
1 − e−λ x
0
falls x ≥ 0
falls x < 0.
Da die Wahrscheinlichkeitsdichte pλ nicht symmetrisch ist, gelten die Rechenregeln (6.28) (6.31) der Φ - Funktion nicht für die Verteilungsfunktion Fλ . Lediglich (6.26) und (6.27) bleiben richtig. In diesem Beispiel sieht man auch, dass eine Wahrscheinlichkeitsdichte durchaus
Funktionswerte größer als 1 annehmen kann. Bei einer Wahrscheinlichkeitsverteilung mit endlicher Ergebnismenge ist dieses nicht möglich!
Mit der Exponentialverteilung wird beispielsweise die Lebensdauer von Atomen beim radioaktiven Zerfall beschreiben.
117
6 Stochastik
R
2
1.5
1
pλ (x)
Fλ (x)
0.5
R
-1
1
2
Abbildung 6.8: W-dichte und -verteilung der Exponentialverteilung mit λ = 2
6.3.4 Die σ - Regeln
6.38 Satz
Die Zufallsvariable X sei N (µ; σ 2 )-verteilt, dann gilt:
P (µ − σ ≤ X ≤ µ + σ) ≈ 0,683
P (µ − 2σ ≤ X ≤ µ + 2σ) ≈ 0,955
P (µ − 3σ ≤ X ≤ µ + 3σ) ≈ 0,997.
Zur Veranschaulichung der Aussagen von Satz 6.38 siehe Abbildung 6.9.
Beweis: Sei X ? =
X−µ
σ ,
dann ist X ? ∼ N (0; 1) so dass aus
µ − kσ ≤ X ≤ µ + kσ
X −µ
⇔
−k ≤
≤k
σ
⇔
−k ≤ X ? ≤ k
folgt, dass
P (µ − kσ ≤ X ≤ µ + kσ) = P (−k ≤ X ? ≤ k)
= 2Φ(k) − 1.
Damit folgt für k = 1, 2, 3:
P (µ − σ ≤ X ≤ µ + σ) = 2Φ(1) − 1 ≈ 0,683
P (µ − 2σ ≤ X ≤ µ + 2σ) = 2Φ(2) − 1 ≈ 0,955
P (µ − 3σ ≤ X ≤ µ + 3σ) = 2Φ(3) − 1 ≈ 0,997
Die Werte Φ(k) entnimmt man Tabelle 6.3.
118
6 Stochastik
0.5 R
95%
68%
99%
R
−3σ
−2σ
σ
−σ
2σ
3σ
Abbildung 6.9: Die σ - Bereiche der N (0, 1) - Verteilung
6.39 Beispiel Pipetten werden vom Hersteller vertrieben mit der Angabe Volumen µ = 10
ml, σ = 0,01 ml. Mit welcher Wahrscheinlichkeit hat eine Pipette ein Volumen, dass um mehr
als 0,02 ml von dem Nennvolumen 10 ml abweicht?
P (10 − 0,02 ≤ X ≤ 10 + 0,02)
= P (µ − 2σ ≤ X ≤ µ + 2σ)
= 0,955
Das Volumen der Pipette weicht also mit Wahrscheinlichkeit
P = 1 − 0,955 = 0,045 = 4,5%
um mehr als 0,02 ml ab.
Wir interessieren uns nun für die umgekehrte Fragestellung: Wie groß muss bei einer N (0; 1)verteilten Zufallsvariablen ein symmetrisches Intervall [−τ, τ ] sein, damit 95% der Werte in
diesem Bereich liegen?
0.5 R
95%
2,5%
2,5%
R
−τ
−τ
Aufgrund der Regel (6.31) können wir diese Aufgabe schreiben als
P (−τ < X < τ ) = 2Φ(τ ) − 1
= 0,95
119
(6.37)
6 Stochastik
d.h. es ist Φ(τ ) =
0,95+1
,
2
also (siehe Tabelle 6.3):
τ = Φ−1
0,95 + 1
2
= Φ−1 (0,975) = 1,96.
(6.38)
Es liegen also 95% aller Werte einer N (0; 1) - verteilten Zufallsvariablen im Intervall [−1, 96; 1, 96].
Verallgemeinern wir obige Fragestellung, indem wir in Gleichung (6.37) den Wert 0, 95 durch
ein allgemeines α ∈ [0, 1) ersetzen, so erhalten wir, dass Zufallsvariable X mit Wahrscheinlichkeit α in dem zu µ symmetrischen Intervall der Breite
τ = Φ−1
α+1
2
(6.39)
liegt.
Sei nun X̃ ∼ N (µ; σ 2 ) (also nicht mehr standardnormalverteilt), dann wissen wir, dass man
X̃ schreiben kann als
X̃ = σX + µ,
wobei X ∼ N (0; 1). Also ist
P (−τ ≤ X ≤ τ ) = P (−στ + µ ≤ σX + µ ≤ στ + µ)
= P (−στ + µ ≤ X̃ ≤ στ + µ)
d.h. wegen (6.37) und (6.38) liegen für τ = 1, 96 somit 95% aller Ergebnisse einer N (µ; σ 2 )
verteilten Zufallsvariablen im Intervall
[−στ + µ; στ + µ].
120
7 Lineare Algebra
7.1 Vektoren
Viele Beobachtungsgrößen lassen sich alleine durch ihren Betrag bereits vollständig beschreiben, wie z.B. Energie, Masse, Länge oder Volumen. Diese heißen skalare Größen. Im Gegensatz
hierzu haben Größen wie Beschleunigung, Geschwindigkeit und Kraft neben einem Betrag immer auch eine Richtung. Sie heißen vektorielle Größen und werden dargestellt durch n-Tupel
im Rn
 
x1
 .. 
(7.1)
x =  .  ∈ Rn ,
xn
wobei die Einträge x1 , . . . , xn reelle Zahlen sind.
7.1.1 Rechnen mit Vektoren
Sofern keine Missverständnisse auftreten können, unterscheiden wir nicht zwischen der Spaltennotation (7.1) und der platzsparenden Zeilennotation x = (x1 , . . . , xn ) von Vektoren. Um
Vektoren in der Notation von Skalaren zu unterscheiden, werden im Skriptum Vektoren stets
fett gedruckt, es ist also x ∈ Rn ein Vektor und x ∈ R ein Skalar.
7.1 Definition
i) Für zwei Vektoren x = (x1 , . . . , xn ) und y = (y1 , . . . , yn ) des Rn definieren wir die
Summe durch


   
x 1 + y1
y1
x1


   
..
x + y =  ...  +  ...  := 
.
.
x n + yn
yn
xn
ii) Für einen Vektor x = (x1 , . . . , xn ) ∈ Rn und ein Skalar s ∈ R definieren wir die
Multiplikation mit Skalaren durch
x1
s · x1
 .. 
 .. 
s x = s  .  :=  . 


xn
121

s · xn

7 Lineare Algebra
iii) Wir erklären −x durch
−x1
 .. 
−x := (−1)x =  . 


−xn
und die Differenz x − y zweier Vektoren durch
x − y := x + (−y).
iv) Der Nullvektor 0 ∈ Rn ist definiert durch
0
 
 
0 :=  ...  .
0
Für die so definierten Verknüpfungen gelten die folgenden Rechenregeln.
7.2 Satz
Für Vektoren x, y, z ∈ Rn und Skalare s, t ∈ R gilt:
(x + y) + z = x + (y + z)
Assoziativgesetz der Addition;
x+y=y+x
Kommutativgesetz der Addition;
s(tx) = (s t)x
Assoziativgesetz der Multiplikation mit Skalaren;
(s + t)x = sx + tx
s(x + y) = sx + sy
Distributivgesetze.
Vektoraddition, -subtraktion und die Multiplikation mit Skalaren lassen sich geometrisch interpretieren.
x2
x2
2
2
x+y
x
1
x−y
x
1
y
1
x
y
x1
2
1
Abbildung 7.1: Addition und Subtraktion zweier Vektoren
122
x1
2
7 Lineare Algebra
7.3 Beispiele
a)
 






−3
1−2
2
1
  

   
3 2 − −1 = 3 2 + 1 =  9  .
−3
3−4
4
3
b) Wirken auf einen Massenpunkt zwei Kräfte F und F̃ , so erhält man die resultierende Kraft
Fres durch Vektoraddition:
Fres = F + F̃
7.4 Bemerkung Zwei Darstellungen eines Vektors, die durch Parallelverschiebung ineinander
überführt werden können, repräsentieren den gleichen Vektor. Eine Darstellung eines Vektors,
die ihren Ursprung im Nullpunkt des Koordinatensystems hat, bezeichnet man als Ortsvektor.
Ein Punkt P = (p1 , . . . , pn ) ∈ Rn ist identisch mit seinem Ortsvektor p = (p1 , . . . , pn ).
7.5 Definition
Sei x ∈ Rn ein Vektor, so ist der Betrag von x, geschrieben kxk, definiert durch
kxk :=
q
x21 + x22 + · · · + x2n .
7.6 Beispiele
a) Ist x ∈ R2 gegeben durch x = (cos ϕ, sin ϕ) mit ϕ ∈ [0, 2π), so ist
q
kxk =
cos2 ϕ + sin2 ϕ = 1.
x liegt auf dem Einheitskreis im R2 .
b) Ist x ∈ R2 gegeben durch x = (r cos ϕ, r sin ϕ), mit ϕ ∈ [0, 2π) und r ∈ R≥0 , so ist
kxk =
q
r2 cos2 ϕ + r2 sin2 ϕ = r.
x liegt auf dem Kreis mit Radius r und Mittelpunkt (0, 0) des R2 . Wir nennen (r, ϕ)
Polarkoordinaten des Vektors x = (r cos ϕ, r sin ϕ).
c) Ist x ∈ R3 gegeben durch


cos ϕ sin ϑ


x = r  sin ϕ sin ϑ 
cos ϑ
123
(7.2)
7 Lineare Algebra
mit ϕ ∈ [0, 2π), ϑ ∈ [0, π] und r ∈ R, so ist für r = 1
kxk =
=
q
cos2 ϕ sin2 ϑ + sin2 ϕ sin2 ϑ + cos2 ϑ
s
(cos2 ϕ + sin2 ϕ) sin2 ϑ + cos2 ϑ
{z
|
}
=1
= 1.
x liegt auf der Kugel mit Radius 1 und Mittelpunkt (0, 0, 0) des R3 . Für r 6= 1 ist kxk = r.
(r, ϕ, ϑ) heißen Kugelkoordinaten des Vektors x ∈ R3 . Es gibt ϕ den Winkel in der x1 , x2
- Ebene an (den Längengrad) und ϑ den Winkel, den der Ortsvektor mit der x3 - Achse
einschließt (siehe Abb. 7.2). Es gibt unterschiedliche Möglichkeiten, Kugelkoordinaten zu
definieren, der Winkel ϑ lässt sich beispielsweise anstelle von der x3 - Achse auch von der
x1 , x2 - Ebene aus messen (der Äquator - Ebene).
x3
x
ϑ
x2
ϕ
x1
Abbildung 7.2: Die Kugelkoordinaten
Es ist auch möglich, den Winkel ϑ von der x1 /x2 - Ebene aus zu messen, Gleichung (7.2)
ist die übliche Konvention.
d) Für t ∈ R und x ∈ Rn gilt
kt xk = |t| · kxk.
7.1.2 Winkel und Skalarprodukt
7.7 Definition
Für zwei Vektoren x, y ∈ Rn definieren wir das Skalarprodukt von x und y durch
x1
y1
 ..   .. 
x·y =  .  ·  . 
xn
yn




: = x1 y1 + · · · + xn yn .
124
7 Lineare Algebra
7.8 Bemerkungen
1. Für x · x schreiben wir abkürzend x · x = x2 .
2. Terme der Form x3 oder x−1 sind für Vektoren nicht definiert.
3. Aus dem Skalarprodukt lässt sich der Betrag eines Vektors berechnen:
kxk2 = x · x.
Für das Skalarprodukt gelten die folgenden Rechenregeln.
7.9 Satz: Rechenregeln Skalarprodukt
Seien x, y, z ∈ Rn Vektoren und t ∈ R, dann gilt:
x·y = y·x
Kommutativgesetz;
x · (y + z) = x · y + x · z
Distributivgesetz;
(tx) · y = t(x · y)
= x · (ty).
Nun soll der Winkel zwischen zwei Vektoren x und y berechnet werden. Hierzu betrachten wir
ein allgemeines Dreieck mit den Seitenlängen a, b, c welches auch mittels der Vektoren x, y, z
dargestellt werden kann, wobei kxk = a, kyk = b und kzk = kx + yk = c ist.
x2
x2
4I
2
γ
a
1
4II
2
b
1
c
γ
x
y
z=y−x
x1
1
x1
2
1
2
Abbildung 7.3: Beschreibung eines Dreicks mittels Seitenlängen oder durch Vektoren
Für das linke Dreieck 4I gilt der Cosinussatz
c2 = a2 − 2ab cos γ + b2 ,
125
(7.3)
7 Lineare Algebra
welcher sich mit dem Satz des Pythagoras und der Definition des Cosinus beweisen lässt.
Berechnen wir in dem rechten Dreieck 4II den Betrag von z, geschrieben kzk, durch
kzk2 = ky − xk2 = (y − x) · (y − x)
= (y · y) − (x · y) − (y · x) + (x · x)
2
(7.4)
2
= kyk − 2x · y + kxk
und vergleichen wir (7.4) mit (7.3), so erhalten wir (mit a = kxk und b = kyk)
−2ab cos γ = − 2x · y
⇐⇒ kxk kyk cos γ = − x · y.
Damit ist
cos γ =
x·y
,
kxk kyk
(7.5)
d.h. der Winkel γ ∈ [0, π] zwischen x und y lässt sich berechnen durch
γ = arccos(
x·y
).
kxk kyk
Da −1 ≤ cos γ ≤ 1 gilt, folgt aus (7.5), dass −kxk kyk ≤ x · y ≤ kxk kyk, ein Ergebnis, das als
Cauchy-Schwarzsche-Ungleichung bekannt ist.
7.10 Satz: Cauchy-Schwarzsche Ungleichung
Für x, y ∈ Rn gilt
|x · y| ≤ kxk kyk
⇐⇒ (x1 y1 + · · · + xn yn )2 ≤ (x21 + · · · + x2n ) · (y12 + · · · + yn2 ).
(7.6)
Hieraus folgt die Dreiecksungleichung.
7.11 Satz: Dreiecksungleichung
Für x, y ∈ Rn gilt
kx + yk ≤ kxk + kyk.
Beweis. Wie in (7.4) berechnen wir
kx + yk2 = kxk2 + 2 x · y + kyk2 .
126
(7.7)
7 Lineare Algebra
x2
y
x
2
1
z=x+y
x1
1
2
Abbildung 7.4: Die Dreiecksungleichung
Da nach (7.6) gilt, dass |x · y| ≤ kxk · kyk, können wir die rechte Seite abschätzen durch
kxk2 + 2x · y + kyk2 ≤ kxk2 + 2kxk kyk + kyk2
= (kxk + kyk)2 .
Also folgt kx + yk2 ≤ (kxk + kyk)2 so dass wir die Wurzel ziehen können und als Ergebnis
erhalten
kx + yk ≤ kxk + kyk.
7.12 Bemerkung Ist das Skalarprodukt zweier Vektoren x, y ∈ Rn gleich Null, x · y = 0, so
ist (7.4) äquivalent zum Satz des Pythagoras
kzk2 = kxk2 + kyk2
für z = x + y. Man definiert daher:
7.13 Definition: Orthogonal
Zwei Vektoren x, y ∈ Rn heißen orthogonal (x ⊥ y) genau dann, wenn
x · y = 0.
7.1.3 Der Korrelationskoeffizient
Es soll festgestellt werden, ob zwischen zwei Merkmalen X und Y ein linearer Zusammenhang
besteht. Hierzu liegen n Messwertpaare (xi , yi ), i = 1, . . . , n, vor. Zunächst standardisieren wir
die Werte durch
xi − x̄
yi − ȳ
und
ỹi =
,
x̃i =
σx
σy
127
7 Lineare Algebra
wobei x̄, ȳ die Mittelwerte und σx , σy die Standardabweichung der xi , yi (i = 1, . . . , n) sind:
v
u
n
n
u1 X
1X
x̄ =
xi , σx = t
(xi − x̄)2 ,
n i=1
n i=1
ȳ, σy werden analog definiert. Hierbei bewirkt die Verschiebung der Werte um x̄, ȳ, dass die
Messwerte der Paare (xi , yi ), i = 1, . . . , n, um den Nullpunkt zentriert werden und die Faktoren σ1x , σ1y bewirken Invarianz gegenüber der Skalierung. Es soll keinen Einfluss haben, ob eine
Größe beispielsweise in Millimetern oder Metern gemessen wird. Das Produkt eines Wertepaares
xi − x̄ yi − ȳ
x̃i · y˜i =
·
σx
σy
hat ein positives Vorzeichen, wenn die Messpunkte xi , yi in gleicher Richtung von den Mittelwerten x̄, ȳ abweichen und ein negatives Vorzeichen, wenn die Abweichung in unterschiedlicher
Richtung erfolgt. Dieses deutet auf einen linear wachsenden oder linear fallenden Zusammenhang hin. Mitteln wir dieses Produkt über alle Wertpaare, so erhalten wir den Korrelationskoeffizienten r(x, y) :
n
n
1X
1X
xi − x̄
r(x, y) : =
x̃i · y˜i =
n i=1
n i=1
σx
n
P
1
n
=s
1
n
=s
n
P
·
yi − ȳ
σy
!
(xi − x̄) · (yi − ȳ)
i=1
s
1
n
(xi − x̄)2 ·
i=1
n
P
n
P
(yi − ȳ)2
i=1
(xi − x̄) · (yi − ȳ)
i=1
n
P
s
(xi −
x̄)2 ·
i=1
n
P
(7.8)
(yi −
ȳ)2 .
i=1
Fassen wir nur die zentrierten Messwerte in Datenvektoren x∗ , y∗ ∈ Rn zusammen,
x∗ := (x1 − x̄, x2 − x̄, . . . , xn − x̄)
y∗ := (y1 − ȳ, y2 − ȳ, . . . , yn − ȳ),
so können wir (7.8) schreiben als
r(x, y) =
x ∗ · y∗
= cos α,
kx∗ k · ky∗ k
(7.9)
wobei α der Winkel zwischen x∗ und y∗ ist. r(x, y) nimmt also nur Werte aus [−1, +1] an.
Ein Wert nahe +1 oder −1 deutet auf einen linearen Zusammenhang hin, ein Wert nahe 0 auf
keinen linearen Zusammenhang. Trotzdem kann natürlich ein nichtlinearer Zusammenhang
vorliegen. Auch sagt ein Wert nahe ±1 nichts über einen kausalen Zusammenhang aus.
128
7 Lineare Algebra
7.1.4 Lineare Unterräume des Rn
Sind im Rn Vektoren v1 , v2 , . . . , vk gegeben und ferner k skalare Koeffizienten s1 , . . . , sk ∈ R,
so bezeichnet man den Vektor
v = s1 v1 + s2 v2 + · · · + sk vk
(7.10)
als Linearkombination der Vektoren v1 , v2 , . . . , vk . Geraden und Ebenen des Rn die den Koordinatenursprung enthalten, haben die besondere Eigenschaft, dass Linearkombinationen ihrer
Elemente wieder auf dieser Geraden bzw. Ebene liegen. Diese Struktur soll im Folgenden näher
beschrieben werden.
7.14 Definition: Linear unabhängig
i) Zwei Vektoren v, w ∈ Rn heißen linear unabhängig, wenn sie nicht die Nullvektoren
sind, v 6= 0 und w 6= 0, und wenn
w 6= sv,
∀s ∈ R
gilt.
ii) Je k Vektoren des Rn , v1 , v2 , . . . , vk , heißen linear unabhängig, wenn die Gleichung
s1 v1 + s2 v2 + · · · + sk vk = 0
nur die Lösung
s1 = 0,
s2 = 0,
...
,
sk = 0
hat.
iii) Vektoren, die nicht linear unabhängig sind, heißen linear abhängig.
7.15 Bemerkungen 1) Anschaulich bedeutet Bedingung i), dass die beiden Vektoren v, w
nicht auf einer Geraden durch den Koordinatenursprung liegen. Im Falle dreier linear
unabhängiger Vektoren im R3 bedeutet Bedingung ii), dass diese drei Vektoren nicht in
einer Ebene durch den Koordinatenursprung des R3 liegen.
2) Definition 7.14 ii) bedeutet, dass sich keiner der Vektoren v1 , . . . , vk als Linearkombination der übrigen Vektoren darstellen lässt, was im Falle k = 2 gerade die Bedingung i)
ist.
3) Im Rn kann es höchstens n linear unabhängige Vektoren geben. Sind n + 1 verschiedene
Vektoren gegeben, so sind diese stets linear abhängig.
129
7 Lineare Algebra
7.16 Definition: Linearer Unterraum
Eine Teilmenge L des Rn , L ⊆ Rn , heißt linearer Unterraum des Rn , wenn sie den
Koordinatenursprung enthält und wenn Summen und skalare Vielfache ihrer Elemente
wieder in der Teilmenge L liegen:
0
 
 
i) 0 =  ...  ∈ L
0
ii) v ∈ L und t ∈ R ⇒ tv ∈ L
iii) v, w ∈ L ⇒ v + w ∈ L.
Wiederholtes Anwenden von ii) und iii) ergibt, dass alle Linearkombinationen (7.10) von Elementen eines linearen Unterraumes wieder in diesem linearen Unterraum liegen. Lineare Unterräume haben offenbar immer unendlich viele Elemente, gesucht ist daher ein Maß, das ihre
„Größe “ beschreibt, mit dem sich beispielsweise eine Gerade von einer Ebene unterscheiden
lässt. Dieses Maß bezeichnet man als Dimension.
7.17 Definition: Dimension eines linearen Unterraumes
Die Dimension eines linearen Unterraumes L des Rn , geschrieben dim L, ist die kleinste
Anzahl k an Vektoren v1 , . . . , vk ∈ L, so dass sich jeder Vektor v ∈ L darstellen lässt als
Linearkombination der v1 , . . . , vk ∈ L:
v = s1 v1 + · · · + sk vk
(7.11)
mit Koeffizienten s1 , . . . , sk ∈ R. Man sagt, dass die Vektoren v1 , . . . , vk den linearen
Unterraum L aufspannen.
Die Vektoren v1 , . . . , vk sind nicht eindeutig bestimmt, aber sie sind immer linear unabhängig.
Ließe sich nämlich einer der Vektoren als Linearkombination der restlichen Vektoren darstellen,
so könnte man auch auch alle anderen Vektoren v ohne ihn darstellen, indem man ihn in
Darstellung (7.11) einfach durch diese Linearkombination ersetzt.
7.18 Beispiele
a) Sei u ∈ Rn fest. Dann ist
G = {x | x = su, s ∈ R}
eine Gerade durch den Ursprung des Rn . G ist ein linearer Unterraum des Rn , denn die
drei Bedingungen aus Definition 7.16 sind erfüllt:
i) 0 = 0 u, also ist 0 ∈ G.
ii) Ist v ∈ G, so ist v = s u. Daher ist
tv = t (su) = (t s)u ∈ G,
130
7 Lineare Algebra
da (t s) ∈ R
iii) Sind v, w ∈ G, so sind v = su und w = tu mit s, t ∈ R. Also ist auch
v + w = su + tu
= (s + t)u ∈ G,
da s + t ∈ R.
Da alle Elemente der Geraden G skalare Vielfache des Vektors u sind, ist G ein eindimensionaler linearer Unterraum des Rn , dim G = 1.
b) Seien v1 , v2 ∈ R3 linear unabhängig (siehe Definition 7.14), so ist
E = {x |x = s1 v1 + s2 v2 ; s1 , s2 ∈ R}
(7.12)
eine Ebene durch den Ursprung des R3 . E ist ein linearer Unterraum des R3 . Aus der
Definition (7.12) von E folgt direkt, dass dim E = 2 gilt.
c) Sind k linear unabhängige Vektoren im Rn gegeben, so ist die Mengen U ihrer Linearkombinationen
U = {u |u = s1 v1 + . . . + sk vk ; s1 , . . . , sk ∈ R}
ein linearer Unterraum der Dimension k, dim U = k.
d) Der Rn ist ein n-dimensionaler linearer Unterraum von sich selbst.
e) Wie wir im folgenden Abschnitt sehen werden, sind die Lösungsmengen homogener linearer
Gleichungssysteme lineare Unterräume des Rn .
7.2 Lineare Gleichungssysteme
7.2.1 Lösungsmengen linearer Gleichungssysteme
Betrachten wir zunächst eine lineare Gleichung mit 3 Unbekannten:
a1 x1 + a2 x2 + a3 x3 = b,
(7.13)
mit gegebenen Zahlen a1 , a2 , a3 , b ∈ R und gesuchten Unbekannten x1 , x2 , x3 ∈ R. Wenn a1 6= 0
ist, so lässt sich die Gleichung nach x1 auflösen zu
x1 = −
a2
a3
b
x2 − x3 + ,
a1
a1
a1
(7.14)
wobei x2 , x3 ∈ R beliebig gewählt werden können. Dann ist (x1 , x2 , x3 ) eine Lösung zu (7.13),
wenn x1 aus (7.14) errechnet wurde. Bezeichnen wir also mit s := x2 und t := x3 die freien
131
7 Lineare Algebra
Parameter, so ist die Lösungsmenge Lb von (7.13)
a3
b
a2
s − t + , s, t | s, t ∈ R}
a1
a
a
1 1
b
a2
a3
, 0, 0 +s − , 1, 0 +t − , 0, 1 | s, t ∈ R}
={
a1
a1
a1
Lb = { −
|
{z
=:v0
|
}
{z
}
=:v1
|
{z
(7.15)
}
=:v2
= {v0 + s v1 + t v2 | s, t ∈ R}.
Die Bezeichnung Lb bringt zum Ausdruck, dass die Lösungsmenge insbesondere auch von der
sogenannten “rechten Seite” b abhängt. Man sieht, dass Lb eine Ebene im R3 ist. Ist b = 0, so
ist v0 = 0 und L0 ein linearer Unterraum des R3 mit dimL = 2, der aufgespannt wird von den
Vektoren
a2
a3
v1 = − , 1, 0
und v2 = − , 0, 1 ,
a1
a1
siehe hierzu Beispiel 7.18 b). Ist b 6= 0 , so ist Lb kein
linearer
Unterraum und heißt stattdessen
b
affiner Unterraum, es ist der um den Vektor v0 = a1 , 0, 0 "verschobene" lineare Unterraum:
x1
Lb = L0 + v0
b
a1
∈ Lb
v0
v0
x2
x3
L0
Ist nun ein System von zwei linearen Gleichungen mit drei Unbekannten gegeben
a11 x1 + a12 x2 + a13 x3 = b1
I
a21 x1 + a22 x2 + a23 x3 = b2
II,
(7.16)
so haben Gleichung I und II jeweils eine Ebene im R3 als Lösungsmenge. Gemeinsame Lösungsmenge beider Gleichungen I und II ist die Schnittmenge dieser Ebenen. Sind die Ebenen
parallel zueinander, so ist die Schnittmenge leer und das System hat keine Lösungen, anderenfalls ist die Schnittmenge eine Gerade im R3 . Gilt b1 = 0 und b2 = 0, so ist (x1 , x2 , x3 ) = (0, 0, 0)
eine Lösung des Systems, die Gerade geht also durch den Ursprung des R3 , der Lösungsraum
L0 ist daher nach Beispiel 7.18 a) ein linearer Unterraum des R3 .
132
7 Lineare Algebra
7.19 Beispiel Wir betrachten das System
x1 + x2 + x3 = 1
I
x1 − x2 + 2x3 = 2
II.
Subtrahiert man I von II, so erhält man
x1 + x2 + x3 = 1
I
II0 .
−2x2 + x3 = 1
Wählen wir in II0 t := x3 als freien Parameter, so erhalten wir durch Einsetzen
1 1
x2 = − + t
2 2
3 3
x1 = − t ,
2 2
so dass

3
2

3
2

− 3t
 1 21 
L = {− 2 + 2 t | t ∈ R}
t


− 23

= {− 12  +t  12  | t ∈ R}
0
1


| {z }
=:v0


| {z }
=:v1
= {v0 + t v1 | t ∈ R},
3
was offenbar
die
parametrisierte Darstellung einer Geraden im R mit Richtungsvektor
v1 = − 23 , 12 , 1 ist.
Sind drei Gleichungen mit drei Unbekannten gegegben, so ist die Lösungsmenge entweder
leer oder ein Punkt, eine Gerade oder eine Ebene im R3 , je nachdem wie die Schnittmenge
der drei Ebenen, welche die Lösungsmengen der drei Gleichungen sind, aussieht. Analoges gilt
natürlich für Gleichungen mit zwei Unbekannten, hier ist die Lösungsmenge einer Gleichung
eine Gerade im R2 . Bei einem System zweier Gleichungen hängt die Lösbarkeit davon ab, ob
die Geraden einen Schnittpunkt besitzen.
7.20 Beispiel Betrachten wir das System
x1 + 2x2 = 3
I
3x1 − 2x2 = 3
II
x1 + 2x2 = 3
I
welches wir umformen zu
−8x2 = −6
133
II0 .
7 Lineare Algebra
Dann erhalten wir aus II0 dass x2 = 34 , was wir in I einsetzen können und dann
x1 = 3 − 2x2 = 3 − 2 ·
3
3
=
4
2
erhalten. Das System I,II hat also die eindeutige Lösung
x=
3 3
,
,
2 4
während die einzelnen Gleichungen I und II die Geraden
!
GI
!
GII
!
3
−2
= {
+t
| t ∈ R}
0
1
2
1
= {
+t 3
0
1
!
| t ∈ R}
als Lösungsmengen haben. Rechnen Sie zur Übung nach, dass x =
liegt und daher deren Schnittpunkt ist.
3 3
2, 4
auf beiden Geraden
7.2.2 Das Gaußsche Eliminationsverfahren
Das Gaußsche Eliminationsverfahren ist ein systematisches Verfahren zum Lösen linearer Gleichungssysteme, kurz LGS, das darauf beruht, dass die zwei folgenden elementaren Umformungen die Lösungsmenge des LGS nicht ändern:
(U1) Multiplikation einer Gleichung mit einer Zahl c 6= 0. Wählen wir z.B. in (7.13) c =
so erhält man
⇐⇒
1
a1 ,
a1 x1 + a2 x2 + a3 x3 = b
a2
a3
b
x1 + x2 + x3 = ,
a1
a1
a1
wobei sich die Lösungsmenge der Gleichung offensichtlich nicht ändert.
(U2) Ersetzen einer Gleichung durch die Summe dieser Gleichung und einer anderen Gleichung
des LGS.
Liegt ein System von m Gleichungen mit n Unbekannten vor (m ≤ n), so kann durch sukzessives Anwenden der Regeln (U1) und (U2) das LGS
a11 x1 + a12 x2 + · · · + a1n xn = b1
a21 x1 + a22 x2 + · · · + a2n xn = b2
..
.
am1 x1 +am2 x2 + · · · + amn xn = bm
134
(LGS)
7 Lineare Algebra
in ein LGS in Stufenform
ã11 x1 +ã12 x2 + · · · +ã1m xm + · · · + ã1n xn = b̃1
ã22 x2 + · · · +ã2m xm + · · · + ã2n xn = b̃2
..
.
(LGS0 )
ãmm xm + · · · + ãmn xn = b̃m
umgeformt werden, welches die gleiche Lösungsmenge hat wie (LGS). Sind alle Koeffizienten
ã11 , ã22 , . . . , ãmm 6= 0, so lässt sich das System beginnend mit der letzten durch Einsetzen
lösen, wobei für den Fall m < n für die Unbekannten xm+1 , . . . , xn frei wählbare Parameter
s1 , . . . , sn−m eingesetzt werden. Die Unbekannte xm erhält man aus
xm =
1
amm
(bm − amm+1 s1 − · · · − amn sn−m ).
Nun können xm , s1 , . . . , sn−m eingesetzt werden, um xm−1 zu berechnen, bis schließlich alle
x1 , . . . , xm in Abhängigkeit der freien Parameter s1 , . . . , sn−m berechnet sind. Die Lösungsmenge von (LGS0 ) können wir daher darstellen als
L = {v0 + s1 v1 + . . . + sn−m vn−m | s1 , . . . , sn−m ∈ R}.
Vergleiche hierzu auch (7.15). Ist m = n, so besitzt das System (LGS’) eine eindeutige Lösung,
welche man durch "Rückwärtseinsetzen" erhält, sofern ã11 6= 0, . . . , ãnn 6= 0.
Ist einer der Koeffizienten ã11 , . . . , ãn in (LGS0 ) gleich Null, so gibt es entweder keine Lösung
oder einen zusätzlich freien Parameter. Betrachten wir hierzu als Beispiel das folgenden System,
in welchem zunächst der Koeffizient a34 und der Wert für b3 variabel seien:
3x1


3x1
+x2
+x3
+2x2 +2x3
· (−2)
+x4
=1
+x4

= 2  | · (−1) ←
−+

6x1 +3x2 +3x3 +a34 x4 = b3
(7.17)
←−−−−−−−−−− +
Mittels der elementaren Umformungen U1 und U2 bringen wir (7.17) auf Diagonalgestalt:

⇐⇒ 

3x1 +x2 +x3
+x4

=
1


+x3
x2
+x3 +(a34 − 2)x4 = b3 − 2
3x1 +x2 +x3

1
x2
+x4

⇐⇒ 
=
x2
+x3
· (−1)
←
−+
=
1

=
1

 .
(7.18)
+(a34 − 2)x4 = b3 − 3
In (7.18) ist nun ã33 = 0, ã34 = a34 − 2 und b̃3 = b3 − 3. Wir unterscheiden nun die Fälle
ã34 = 0 und ã34 6= 0:
3 −3
1.Fall ã34 6= 0 (d. h. a34 6= 2): Es ist x4 = ab34
−2 und in der 2. Gleichung kann für x3 (oder x2 )
ein freier Parameter gewählt werden. (7.18) hat einen 1-dimensionalen Lösungsraum.
2.Fall ã34 = 0 (d. h. a34 = 2): Nun kommt es auf die rechte Seite der 3. Gleichung in (7.18) an :
135
7 Lineare Algebra
i) Ist b3 − 3 6= 0, so hat die 3.Gleichung in (7.18)
0 · x4 = b3 − 3
keine Lösung, also hat das LGS (7.18) keine Lösung. Es ist L = ∅
ii) Ist b3 − 3 = 0, so ist
0 · x4 = 0
richtig für alle x4 ∈ R. Ferner kann x3 (oder x2 ) in der 2. Gleichung von (7.18) frei
gewählt werden. Das System hat also einen 2-dimensionalen Lösungsraum:
Mit b3 = 3 und a34 = 2 wird (7.18) zu
3x1 +x2 + x3 +x4
x2 +
=1
x3
=1
(7.19)
0 · x4 = 0.
Setzen wir x4 = s2 und x3 = s1 , so erhalten wir
x2 = 1 − s1
1
1
x1 = (1 − x2 − x3 − x4 ) = − s2 .
3
3
Die Lösungsmenge von (7.19) ist also

− 1 s2


1 −3 s 



1
4
L= x∈R |x=
 , mit s1 , s2 ∈ R


 s1 






s2









0
0
− 13


1
−1
 0 

 
 


4
= x ∈ R | x =   + s1   + s2   , mit s1 , s2 ∈ R ,


0
 1 
 0 






0
0
1





 





es ist dim L = 2.
7.3 Matrizen
7.3.1 Einführung
Mit Hilfe von Matrizen lassen sich lineare Gleichungssysteme in einer kompakten, übersichtlicheren Schreibweise angeben. Sei ein LGS gegeben durch
a11 x1 + a12 x2 + a13 x3 = b1
a21 x1 + a22 x2 + a23 x3 = b2
136
7 Lineare Algebra
dann lässt sich dieses abkürzend schreiben durch
a11 a12 a13
a21 a22 a23
|
{z
A


!
x1
b1
 
x2  =
b2
| {z }
} x3
!
(7.20)
b
| {z }
x
Das mit dem Großbuchstaben A bezeichnete Zahlenschema heißt Matrix. In einer Matrix
werden die Einträge doppelt indiziert, aij , wobei der erste Index für die Zeile und der zweite
für die Spalte steht (“Zeilen zuerst, Spalten später”). Die Multiplikation einer Matrix mit einem
Vektor, A x, ist definiert durch die Skalarprodukte aus den Zeilen von A mit dem Vektor x:
a11 a12 a13
a21 a22 a23
!


x1
 
x2  :=
x3
!
a11 x1 + a12 x2 + a13 x3
.
a21 x1 + a22 x2 + a23 x3
(7.21)
Diese Multiplikation ist offensichtlich nur dann möglich, wenn der Vektor genau so viele Komponenten hat wie die Matrix Spalten hat. Eine Matrix A mit m Zeilen und n Spalten

a11

 a21
A=
 ..
 .
a12
a22
..
.
···
···

a1n
a2n 

am1 am2 · · · amn



heißt (m × n)-Matrix und der Raum aller (m × n)-Matrizen heißt Rm×n . Eine Matrix repräsentiert nicht nur wie oben beschrieben ein lineares Gleichungssystem. Durch Multiplikation mit
einer (m × n)-Matrix wird ein Vektor x ∈ Rn auf einen Vektor b ∈ Rm abgebildet (s.(7.20)).
Die hierdurch definierte Zuordnung ist eine lineare Abbildung (siehe Definition 3.5) und wird
notiert durch
A : Rn → Rm
(7.22)
x 7→ Ax = b.
7.21 Beispiele
a) Zur Demonstration der in (7.21) erklärten Multiplikation berechnen wir
 

  
1
1·1 + 3·2 + 7·1 + 0·3
14
1 3
7 0  

 2 
  
2 −3 4 1   = 2 · 1 + (−3) · 2 + 4 · 1 + 1 · 3 =  3 
1
0 · 1 + 2 · 2 + (−1) · 1 + 4 · 3
15
0 2 −1 4
3


b) Die Matrix Dϕ ∈ R2×2
!
Dϕ =
dreht einen Vektor x ∈
R2
cos ϕ − sin ϕ
sin ϕ cos ϕ
um den Winkel ϕ. Sei beispielsweise x =
137
(7.23)
0
1
!
!
und y =
1
0
,
7 Lineare Algebra
so ist
!
Dϕ x =
cos ϕ − sin ϕ
sin ϕ cos ϕ
Dϕ y =
cos ϕ − sin ϕ
sin ϕ cos ϕ
und
!
0
1
!
!
=
− sin ϕ
cos ϕ
=
cos ϕ
,
sin ϕ
!
0
1
!
was der Drehung um den Winkel ϕ gegen den Uhrzeigersinn entspricht, wie in Abbildung
(7.5) verdeutlicht ist.
R
1
cos(ϕ)
ϕ
ϕ
R
− sin(ϕ)
Abbildung 7.5: Drehung von x =
sin(ϕ)
0
1
1
0
und y =
1
um den Winkel ϕ gegen den Uhrzeigersinn
c) Die Matrix T ∈ R2×2
!
T =
t 0
0 t
streckt einen Vektor x ∈ R2 um den Faktor t:
Tx =
t 0
0 t
!
x1
x2
!
=
t x1
t x2
!
= tx.
d) Spezielle Matrizen: Im Rn×n wird mit


1 ··· ··· 0

.. 
0 1
.


In :=  .
,
. . .. 
.
. .
.

0 ··· ··· 1
die Matrix bezeichnet, deren Elemente auf der Diagonalen gleich 1, aii = 1, und sonst
gleich 0 sind, d. h. aij = 0 für i 6= j. Es gilt
In v = v
∀v ∈ R. In (oder auch I) heißt Einheitsmatrix im Rn×n . Mit 0 ∈ Rm×n wird die Nullmatrix
bezeichnet, deren Elemente alle 0 sind, aij = 0 für i = 1, . . . , m und j = 1, . . . , n.
138
7 Lineare Algebra
e) Die Matrix A ∈ R2×2
A=
a b
c d
!
!
bildet die Einheitsvektoren e1 =
1
0
0
1
und e2 =
!
ab auf die Spaltenvektoren der
Matrix A:
A e1 =
a b
c d
!
1
0
!
!
=
a
c
A e2 =
und
a b
c d
!
!
0
1
!
=
b
.
d
Daher wird das Einheitsquadrat, welches von den Vektoren e1 und e2 aufgespannt wird,
unter
auf das Parallelogramm, welches aufgespannt wird von den Vektoren
! A abgebildet
!
a
b
und
.
c
d
R
R
2
c+d
A
−−−−−→
1
d
c
R
1
R
2
b
a a+b
Abbildung 7.6: Verzerrung des Einheitsquadrates durch die Matrix A
7.3.2 Rechnen mit Matrizen
7.22 Definition
Seien A, B ∈ Rm×n zwei Matrizen mit den Elementen A = (aij ) und B = (bij ) und sei
weiter t ∈ R. Summe und Differenz der Matrizen A und B werden durch Addition und
Subtraktion der Elemente der Matrizen erklärt:
A + B = (aij + bij )
A − B = (aij − bij ).
Multiplikation einer Matrix mit einem Skalar t ∈ R:
t A = (t aij ).
139
7 Lineare Algebra




3 0 1
2 0 1




7.23 Beispiel Sei A = 1 0 2, B = 3 2 1 und t = 3, dann erhalten wir
1 2 3
3 3 3







5 0 2
2+3 0+0 1+1

 

A + B = 1 + 3 0 + 2 2 + 1 = 4 2 3 ,
4 5 6
3+1 3+2 3+3

−1 0 0
2−3 0−0 1−1

 

A − B = 1 − 3 0 − 2 2 − 1 = −2 −2 1 ,
2
1 0
3−1 3−2 3−3


3·2 3·0 3·1


3 A = 3 · 1 3 · 0 3 · 2
3·3 3·3 3·3


6 0 3


= 3 0 6 .
9 9 9
Die Multiplikation zweier Matrizen kann nicht auf die gleiche Weise intuitiv und erklärt werden.
Um zu einer sinnvollen Definition zu gelangen, stellen wir die folgende Überlegung an: Soll ein
Vektor x ∈ R2 erst um den Winkel ϕ gedreht und dann um den Faktor t gestreckt werden, so
muss zunächst Dϕ x berechnet und dann auf das Ergebnis die Matrix T (siehe Beispiel 7.21 b)
und c)) angewendet werden. Daher soll die Multiplikation zweier Matrizen so definiert werden,
dass ihr Produkt das Gleiche bewirkt, wie die Hintereinanderausführung der Mutliplikationen.
Es soll für jeden Vektor x
(T Dϕ )x = T (Dϕ x)
und allgemein
(AB)x = A(Bx)
(7.24)
gelten. Dieses ist nicht der Fall, wenn, analog zur Addition, einfach die Elemente der Matrizen
multipliziert werden. Damit (7.24) gilt, wird AB = C erklärt durch Skalarmultiplikation der
Zeilen von A mit den Spalten von B:
cij = (i-te Zeile von A) · (j-te Spalte von B).
↑
Skalarprodukt
Hierzu muss die Zeile von A genau so “lang” sein wie die Spalte von B. Die Multiplikation
zweier Matrizen kann daher nur dann definiert werden, wenn die Spaltenzahl n der ersten
Matrix gleich der Zeilenzahl der zweiten Matrix ist.
7.24 Definition: Multiplikation von Matrizen
Seien A, B ∈ Rn×n , dann ist das Produkt A B =: C ∈ Rn×n erklärt durch
C = (cij ) mit cij :=
n
X
k=1
140
aik bkj
7 Lineare Algebra
für alle i = 1, . . . , m und j = 1, . . . , p. Das Matrixelement cij ist das Skalarprodukt der
i-ten Zeile von A mit der j-ten Spalte von B:

a11
 .
 ..


 ai1
 .
 .
 .
an1
···
···
···


a1n

.. 
b11
. 

  ..
ain  ·  .
.. 

bn1
. 
ann
···
···
b1j
..
.
···
bnj
···


b1n

..  = 

.  


bnn


c11
..
.
..
.
..
.
···
···
..
.
···
···
cij
..
.
···
cn1
···
···
···
c1n
..
.
..
.
..
.










cnn
7.25 Beispiel Die Matrizen



1
2 1


A = −1 0 3
4 −3 2
und

1 2 −2


B = 2 1 5 
3 1 0
sollen multipliziert werden. Zur einfacheren Darstellung verwenden wir das sogenannte FalkSchema, in welchem stets die links des zu berechnenden Elements stehende Zeile mit der
darüberstehenden Spalte skalar multipliziert wird:
B
1
-1
4
Es ist also
A
2
0
-3
1
3
2
1
2
3
8
8
4

2
1
1
5
1
7
-2
5
0
8
2
-23

8 5
8


2 .
A B = 8 1
4 7 −23
7.26 Satz
Für die so definierten Verknüpfungen gelten die folgenden Rechenregeln:
i) Seien A, B ∈ Rm×n , x, y ∈ Rn und s, t ∈ R. Dann gilt
A+B =B+A
s(tA) = (s t)A
A + (B + C) = (A + B) + C
(s + t)A = sA + tA
s(A + B) = sA + sB
(A + B)x = Ax + Bx
A(x + y) = Ax + Ay.
141
7 Lineare Algebra
ii) Seien A, B, C ∈ Rn×n und x ∈ Rn . Dann gilt:
(AB)x = A(Bx)
(AB)C = A(BC)
A(B + C) = AB + AC
(A + B)C = AC + BC
AIn = In A = A
In x = x.
7.27 Beispiele
a) Die Multiplikation von Matrizen ist nicht kommutativ. Für
!
A=
1 2
3 0
!
AB =
3 4
9 6
und
B=
3 2
0 1
!
ist
!
aber
BA =
9 6
.
3 0
b) Gilt für zwei Matrizen A, B, dass AB = 0 ist,!so kann hieraus nicht! A = 0 oder B = 0
1 4
2
4
gefolgert werden. Sei beispielsweise A =
und B =
, dann gilt AB = 0
2 8
− 12 −1
(Hinweis: Es ist BA 6= 0). In den reellen Zahlen wird diese Schlussfolgerung beispielsweise
beim Lösen quadratischer Gleichungen angewendet, wenn aus (x − a)(x − b) = 0 gefolgert
wird, dass x = a oder x = b gelten muss.
7.28 Satz
Die durch eine Matrix A ∈ Rm×n nach (7.22) definierte Abbildung ist linear.
Beweis. Es muss nach Definition 3.5 überprüft werden, dass A(x + y) = Ax + Ay und A(tx) =
tAx) für alle x, y ∈ Rn und t ∈ R gilt. Dieses folgt aber direkt aus Satz 7.26 i).
142
7 Lineare Algebra
7.3.3 Die Determinante einer Matrix
7.29 Definition
Gibt es zu einer quadratischen Matrix A ∈ Rn×n eine Matrix A−1 ∈ Rn×n so dass
AA−1 = A−1 A = In
gilt, so heißt A−1 die zu A inverse Matrix.
7.30 Bemerkung Ist zu einer Matrix A ∈ Rn×n die inverse Matrix A−1 ∈ Rn×n bekannt, so
kann das LGS
Ax = b
(7.25)
für beliebige rechte Seiten b ∈ Rn gelöst werden durch
x : = A−1 b.
(7.26)
Denn setzen wir (7.26) in (7.25) ein, erhalten wir
Ax = A(A−1 b) = (AA−1 )b = b.
Diese Lösung von (7.25) ist eindeutig, was man erkennt, wenn man annimmt, dass es eine
weitere Lösung y von (7.25) gäbe. Dann wäre Ay = b und wenn wir diese Gleichung mit A−1
multiplizieren, erhalten wir
A−1 (Ay) = A−1 b
(A−1 A) y = A−1 b
⇐⇒
| {z }
=In
y = A−1 b
⇐⇒
d.h. y ist die bereits bekannte Lösung aus (7.26).
Die zu A inverse Matrix A−1 kann mit dem an einem Beispiel dargstellten folgenden Verfahren berechnet werden. Wir notieren die gegebene Matrix A in einem um die Einheitsmatrix
erweiterten Zahlenschema, d. h. es werden


1 0 1


A = 2 1 0 
0 2 1

und

1 0 0


I3 =  0 1 0 
0 0 1
zusammengefasst zu


1 0 1 | 1 0 0


2 1 0 | 0 1 0 .
0 2 1 | 0 0 1
143
(7.27)
7 Lineare Algebra
Nun wird die Matrix A mit Umformungen wie im Gaußschen Eliminationsverfahren zur Einheitsmatrix I3 umgeformt und gleichzeitig werden alle Schritte dieser Umformungen ebenfalls
an der rechten Seite in (7.27) vorgenommen:
· (−2)
1 0 1 | 1 0 0



2 1 0

−+
0 ←
| 0 1
0 2 1 | 0 0 1
1 0

0 1
|
1

1
· (−2)

0 2
1
|
0
1 0
1
|
1
0 0
|
5
1 0
1
−2 | −2
0 0

1
0

| · 51
4
5

←−−−−− +
0
0
1

0
−+
 ←
2
5
1
5
| − 25
0 0 1 |
0
− 25
1
5
1 0 0 |

0 1 0

4
5
|
1
0

−2 1
4
|
1
←
−+
0 1
−2 | −2


0 1


−2 | −2 1 0


0 1
0 0
− 25
1
5

− 51

2 
5 
1
5
· (2)
· (−1)
Auf der rechten Seite steht nun die inverse Matrix A−1 :

1
5
A−1 = − 25

4
5
2
5
1
5
− 25
Inverse !
einer (2 × 2)-Matrix
a b
∈ R2×2 , dann ist
Sei A :=
c d
Die
− 15
2
5
1
5



1
2 −1
1


2 .
 = −2 1
5
4 −2 1
lässt
sich
berechnen
durch
folgende
Formel:
!
A
−1
1
d −b
=
.
ad − bc −c a
(7.28)
Die Richtigkeit von (7.28) prüft man durch Nachrechnen von AA−1 = I2 und A−1 A = I2 nach.
Offenbar ist die Inverse (7.28) zu einer 2 × 2−Matrix genau dann definiert, wenn ad − bc 6= 0
ist. Dieser Term heißt Determinante von A:
7.31 Definition: Determinante
!
Sei A ∈
R2×2
mit A =
a b
. Dann wird durch
c d
det(A) = ad − bc
144
7 Lineare Algebra


a11 a12 a13


die Determinante von A definiert. Für eine (3 × 3)−Matrix A = a21 a22 a23  ist die
a31 a32 a33
Determinante definiert durch die Sarrus-Regel: Man schreibt die ersten beiden Spalten
nochmals rechts neben die Matrix A
a11 a12 a13
a21 a22 a23
a31 a32 a33
a11 a12
a21 a22
a31 a32
addiert die Produkte der Elemente auf den ersten 3 &-Diagonalen und subtrahiert die
Produkte der Elemente auf den %-Diagonalen:
det(A) = a11 a22 a33 + a12 a23 a31 + a13 a21 a32 − a31 a22 a13 − a32 a23 a11 − a33 a21 a12 .
Wie man der Formel (7.28) für (2 × 2)−Matrizen entnimmt, so gilt auch allgemein:
7.32 Satz
Eine Matrix A ist genau dann invertierbar, wenn det(A) 6= 0.
7.33 Beispiel Wie im Beispiel zur Drehmatrix (7.23) gesehen, beschreibt Dϕ die Drehung
eines Vektors x ∈ R2 um den Winkel ϕ. Berechnen wir nun die inverse Matrix zu Dϕ , so
erwarten wir natürlich, dass Dϕ−1 = D−ϕ ist, d.h. die Drehung um den Winkel −ϕ. Nach
Formel (7.28) ist
!
Dϕ−1
1
cos ϕ sin ϕ
=
cos ϕ cos ϕ − sin ϕ(− sin ϕ) − sin ϕ cos ϕ
|
(∗)
=
{z
}
=1
!
cos(−ϕ) − sin(−ϕ)
sin(−ϕ) cos(−ϕ)
= D−ϕ ,
wobei wir in (∗) die Symmetrieeigenschaften der cosinus- und sinus-Funktion verwendet haben:
cos(−ϕ) = cos(ϕ)
und
sin(−ϕ) = − sin ϕ.
Fassen wir nun unsere Ergebnisse über die Lösbarkeit linearer Gleichungssysteme in der MatrixNotation zusammen, so erhalten wir die folgenden Aussagen:
7.34 Satz: Lösungsmengen linearer Gleichungssysteme
i) Sei A ∈ Rm×n und seien v1 , . . . , vk ∈ Rn Lösungen des homogenen LGS
Ax = 0.
145
(7.29)
7 Lineare Algebra
Dann sind auch alle Linearkombinationen
v = λ1 v1 + · · · + λk vk
(7.30)
Lösungen von (7.29).
ii) Sei w∗ ∈ Rn eine Lösung des inhomogenen LGS
Ax = b
(7.31)
mit einem b ∈ Rm . Ist nun v eine Lösung des homogenen LGS (7.29), so ist jedes
w = w∗ + v
eine Lösung von (7.31). Ferner ist jede Lösung des inhomogenen Systems (7.31)
darstellbar als Summe der speziellen Lösung w∗ von (7.31) und einer Lösung v des
homogenen Systems (7.29).
iii) Das inhomogene System (7.31) ist genau dann eindeutig lösbar, wenn das homogene
System nur den Nullvektor 0 ∈ Rn als Lösung hat.
iv) Ist A ∈ Rn×n quadratisch, so ist das LGS (7.31) genau dann eindeutig lösbar, wenn
A invertierbar ist. Die Lösung w von (7.31) ist dann gegeben durch
w = A−1 b.
7.3.4 Eigenwerte und Eigenvektoren
Sei A ∈ Rn×n eine quadratische Matrix und x ∈ Rn nicht der Nullvektor, x 6= 0. Interessiert
man sich für die Folge
x, Ax, A2 x, A3 x, . . .
so ist viel Rechenaufwand notwendig um die Vektoren vom Typ Ak x für k ∈ N zu berechnen
und es ist schwierig zu erkennen, ob diese (für k → ∞) konvergieren. Wird ein Vektor x bei
Multiplikation mit A jedoch auf ein skalares Vielfaches von sich selbst abgebildet, d. h. gilt
Ax = λx
für ein λ ∈ R, so ist A2 x = A(Ax) = A(λx) = λ(Ax) = λ2 x und entsprechend
Ak x = λ k x
für alle k ∈ N. Je nachdem ob |λ| > 1, |λ| < 1 oder |λ| = 1 ist, können wir nun Aussagen über
das asymptotische Verhalten machen;
(
k
k
kA xk = |λ |kxk →
∞ für |λ| > 1
0 für |λ| < 1
146
7 Lineare Algebra
und
(
k
x
(−1)k x
k
A x=λ x=
für λ = 1
.
für λ = −1
7.35 Definition: Eigenwerte/Eigenvektoren
Ist A ∈ Rn×n , so heißt ein Vektor x ∈ Rn , x 6= 0, Eigenvektor der Matrix A zum
Eigenwert λ ∈ R, wenn
Ax = λx
(7.32)
gilt.
7.36 Beispiele
a) Sei D ∈ Rn×n eine Diagonalmatrix:


d1 0 . . . 0


 0 d2 . . . 0 

D=.
. .
..
. .. 
 ..

0 0 . . . dn
Dann sind die Diagonalelemente
d1 , . . . , dn Eigenwerte von D mit zugehörigen Eigenvek 
 
 
0
0
1
1
.
 
 
 .. 
0
 
 

0
toren e1 = 
 ..  , e2 =   , . . . , en =  :
.


0
.
 .. 
1
0
0
Dek = dk ek
für k = 1, . . . , n.
b) Die Scherungsmatrix im R2 (s. Übungsaufgabe Blatt 4) lässt die Vektoren unverändert,
die auf der x1 −Achse liegen:
!
!
!
1 a
x1
x1
=
0 1
0
0
d.h. alle Vektoren vom Typ
x1
0
!
sind Eigenvektoren zum Eigenwert λ = 1.
7.37 Bemerkungen
a) Den Nullvektor 0 ∈ Rn in Definition 7.35 als möglichen Eigenvektor zuzulassen macht
keinen Sinn, da der Nullvektor Gleichung (7.32) trivialerweise immer erfüllt.
b) Ist x Eigenvektor von A zum Eigenwert λ, so ist tx für jedes t ∈ R \ {0} ebenfalls
147
7 Lineare Algebra
Eigenvektor von A zum Eigenwert λ:
A(tx) = tAx = tλx = λ(tx).
c) Eigenvektoren v1 , v2 einer Matrix A zu verschiedenen Eigenwerten λ1 , λ2 sind linear
unabhängig.
Bisher ist unklar, wie Eigenwerte und Eigenvektoren einer gegebenen Matrix berechnet werden
können. Entscheidendes Hilfsmittel hierfür ist der folgenden Satz.
7.38 Satz: Berechnung von Eigenwerten
Sie A ∈ Rn×n . Es ist λ ∈ R genau dann Eigenwert von A, wenn
det(A − λIn ) = 0.
(7.33)
Beweis. Ein λ ∈ R ist Eigenwert von A, wenn Ax = λx gilt, was äquivalent ist zu
(A − λIn )x = 0,
(7.34)
d.h. λ ist genau dann Eigenwert von A, wenn das homogene LGS (7.34) eine Lösung x 6=
0 besitzt. Dieses ist nach Satz 7.34 genau dann der Fall, wenn die Matrix (A − λIn ) nicht
invertierbar ist, d.h. wenn
det(A − λIn ) = 0
gilt. Denn sonst wäre x = (A − λIn )−1 0 = 0 die einzige Lösung von (7.34).
7.39 Beispiele
!
a b
a) Sei A =
eine (2 × 2)-Matrix, so ist λ ∈ R Eigenwert von A genau dann, wenn
c d
(A − λI2 ) keine Inverse Matrix besitzt. Dies ist nach (7.33) genau dann der Fall, wenn
det(A − λI2 ) = 0,
d.h.
!
det
a b
λ 0
−
c d
0 λ
!!
=0
!
⇐⇒
a−λ
b
det
c
d−λ
⇐⇒
(a − λ)(d − λ) − bc = 0.
=0
Die Eigenwerte λ von A sind also genau die Nullstellen der quadratischen Gleichung
λ2 − (a + d)λ + ad − bc = 0.
148
(7.35)
7 Lineare Algebra
Damit hat A höchstens 2 Eigenwerte
1
1q
λ1/2 = (a + d) ±
(a − d)2 + 4bc.
2
2
(7.36)
Die zugehörigen Eigenvektoren v1 und v2 sind dann nach Gleichung (7.33) Lösungen des
LGS
(A − λi I2 )vi = 0,
i = 1, 2.
(7.37)
b) Aus Beispiel a) folgt: Die Matrix
!
A=
a b
0 d
hat die Eigenwerte λ1 = a und λ2 = d.
7.40 Definition: charakteristisches Polynom einer Matrix
Zu einer Matrix A ∈ Rn×n heißt
p(λ) = det(A − λIn )
das charakteristische Polynom von A.
7.41 Folgerungen Wie wir in (7.35) sehen, ist das charakteristische Polynom p(λ) einer
(2 × 2)−Matrix vom Grad 2 in λ. Allgemein ist das charakteristische Polynom einer
(n × n)−Matrix vom Grad n in λ, daher hat eine (n × n)−Matrix höchstens n Eigenwerte, da
p(λ) höchstens n Nullstellen hat.
7.42 Beispiele
a) Es sollen die Eigenwerte und Eigenvektoren von A =
1 2
2 1
!
bestimmt werden. Hierzu
berechnen wir
det(A − λI2 ) = 0
!
⇐⇒
1−λ
2
det
2
1−λ
(1 − λ)2 − 4 = 0
⇐⇒
⇐⇒
=0
λ2 = −1.
λ1 = 3
Um die Eigenvektoren zu diesen Eigenwerten zu berechnen, muss das Gleichungssystem
149
7 Lineare Algebra
(7.37) mit λ1 , λ2 gelöst werden. Für λ1 = 3 muss gelten
x1
x2
!
x1
x2
!
−2x1 + 2x2
2x1 − 2x2
!
!
1 2
1 0
−3
2 1
0 1
!!
1−3
2
2
1−3
⇐⇒
⇐⇒
!
!
=
0
0
=
0
0
=
0
.
0
!
!
Wir erhalten 2 Gleichungen für x1 und x2 ,
−2x1 + 2x2 = 0 und
2x1 − 2x2 = 0,
!
welche für x1 = x2 beide erfüllt sind. Der Eigenvektor v zu λ1 = 3 ist also v =
1
, oder
1
!
1
in parametrisierter Form v = t
1
mit t ∈ R. Für λ2 = −1 muss gelten
!
x1
x2
!
x1
x2
!
⇐⇒
2 2
2 2
!
⇐⇒
2x1 + 2x2
2x1 + 2x2
1 2
1 0
− (−1)
2 1
0 1
!!
!
!
=
0
0
!
=
0
0
=
0
.
0
!
Wir erhalten zweimal die gleiche Gleichungen für x1 und x2 , 2x1 + 2x2 = 0, !welche für
1
x1 = −x2 erfüllt ist. Der Eigenvektor w zu λ2 = −1 ist daher w =
, oder in
−1
!
1
parametrisierter Form w = t
−1
für t ∈ R.
!
b) Man sieht, dass die Eigenwerte einer symmetrischen Matrix A =
a b
b a
stets gegeben
sind durch
λ1 = a + b und
λ2 = a − b,
wenn man sich das charakteristische Polynom
p(λ) = (a − λ)2 − b2
notiert und davon überzeugt, dass λ1 , λ2 dessen Nullstellen sind. Die zugehörigen Eigenvektoren zu diesen Eigenwerten sind
v1 =
1
1
!
!
und
150
v2 =
1
.
−1
7 Lineare Algebra
7.4 Das Leslie-Modell
7.4.1 Das Modell
Die Altersstruktur einer Population werde in gleich langen, diskreten Zeitabschnitten beobachtet. Zu einem Zeitpunkt seien in n gleich großen Altersklassen x1 , . . . , xn Individuen. Die
Population wird also beschrieben durch den Vektor x = (x1 , . . . , xn ). Sei nun ai die Reproduktionsrate der i-ten Altersklasse pro Zeiteinheit, so ergibt sich nach einer Beobachtungsperiode
für die neue jüngste Altersklasse y1 :
y1 = a1 x1 + a2 x2 + · · · + an xn .
Bezeichnet pi die Überlebensrate der Individuen in der i-ten Altersklasse, so ist
yi = pi−1 xi−1
für i = 2, . . . , n und es ist pn = 0. Die Altersstruktur y errechnet sich demnach aus x durch

a1 a2
p
 1 0

0 p2
y=

 ..
.
...
..
an
.
pn−1


x1
 x 
  2
 
  x3 
 
  .. 
 . 
0
xn
= Lx,
L heißt Leslie-Matrix der Population. Betrachten wir nun die Population über mehrere Zeitabschnitte hinweg und bezeichnen wir die Altersstruktur zum Zeitpunkt t mit xt , so erhalten
wir nach einem Startwert x0 die Entwicklung
x0 → Lx0 → Lx1 = L2 x0 → Lx2 = L3 x0 . . .
|{z}
x1
| {z }
=x2
| {z }
=x3
Wie wir in Abschnitt (7.3.4) Eigenwerte und Eigenvektoren gesehen haben, lässt sich diese Entwicklung dann besonders gut beobachten, wenn die Leslie Matrix L Eigenvektoren v1 , . . . , vn
zu Eigenwerten λ1 , . . . , λn hat und der Anfangszustand x0 der Population dargestellt werden
kann als Linearkombination der Eigenvektoren. Ist nänlich
x0 = α1 v1 + · · · + αn vn ,
so folgt
Lk x0 = Lk (α1 v1 + · · · + αn vn )
= α1 Lk v1 + · · · + αn Lk vn
= α1 λk1 v1 + · · · + αn λkn vn .
151
(7.38)
7 Lineare Algebra
7.4.2 Das Leslie-Modell für 2 Altersklassen
Betrachten wir das Leslie-Modell für eine Population mit 2 Altersklassen, so ist die LeslieMatrix gegeben durch
!
a b
L=
,
p 0
wobei a ≥ 0, b ≥ 0 die Fertilitätsraten der beiden Altersklassen sind und 0 < p < 1 die
Überlebensrate von der ersten zur zweiten Altersklasse ist. Die Eigenwerte dieser Matrix sind
dann nach (7.36)
q
1
a ± a2 + 4bp .
2
λ+/− =
(7.39)
Es ist a2 + 4bp > 0, denn da alle Parameter des Systems nichtnegativ sind, ist a2 + 4bp = 0 nur
dann, wenn a = b = p = 0 ist, was offensichtlich nicht sinnvoll ist. Daher können wir folgern,
dass
1. λ+ 6= λ− gilt, d.h. die Matrix hat zwei verschiedenen Eigenwerte
2. L hat daher 2 linear unabhängige Eigenvektoren v+ , v− ∈ R2 (s.(7.37))
Lv+ = λ+ v+
Lv− = λ− v−
und jeder Anfangszustand x0 ist darstellbar als Linearkombination
x0 = α+ v+ + α− v−
(7.40)
mit α+ , α− ∈ R.
3. Aus a2 + 4bp > 0 folgt ferner
λ+ > a und
λ− < 0,
außerdem ist
q
1
|λ− | = |a − a2 + 4bp|
2
q
(∗) 1
≤ (|a| + a2 + 4bp)
2
= λ+ ,
(7.41)
wobei die Abschätzung (∗) mit der Dreiecksungleichung (s. Satz(7.11)) erfolgt ist. Ein
Anfangszustand x0 entwickelt sich nun nach (7.38) und (7.40) zu
Ln x0 = α+ λn+ v+ + α− λn− v− .
Für eine Prognose sind wegen λ+ > |λ− | die Fälle λ+ > 1, λ+ = 1 und 0 < λ < 1 zu unterscheiden.
λ+ > 1 : Dieses bedeutet, dass λk+ α+ → ∞, d.h. dass die Population unbegrenzt wächst.
152
7 Lineare Algebra
Es ist nach (7.39)
λ+ > 1
⇐⇒ a +
q
⇐⇒
q
a2 + 4bp > 2
a2 + 4bp > 2 − a,
was immer erfüllt ist, wenn a > 2. Wenn 0 < a < 2 gilt, kann die Ungleichung quadriert
werden und wir erhalten
a2 + 4bp > 4 − 4a + a2
⇐⇒ a + bp > 1.
Der Fall λ+ > 1 tritt also ein, wenn K := a + bp > 1. K heißt Kenngröße des Modells.
λ+ = 1 : Nach analoger Rechnung zu oben ist
λ+ = 1
Da nun wegen (7.41) und
⇐⇒
K = a + bp = 1.
p
a2 + 4bp > 0
|λ− | < λ+
folgt, so nähert sich jeder Anfangszustand einer festen Struktur:
Lk x0 =
λk− α− v− + 1k α+ v+
| {z }
→0 (k→∞)
d.h. es folgt
Lk x0 → α+ v+ .
0 < λ < 1 : In diesem Fall ist auch |λ− | < 1, so dass die Population ausstirbt. Der Fall
0 < λ+ < 1 tritt ein, wenn K < 1.
153
8 Komplexe Zahlen
8.1 Einführung
8.1.1 Die Zahl i
Quadratische Gleichungen können in den reellen Zahlen nicht immer gelöst werden, es gibt
beispielsweise kein x ∈ R so dass x2 = −4. Es erweist sich aber für viele Anwendungen als
sinnvoll, den Zahlenraum um Lösungen dieser Gleichungen zu erweitern. Hierzu definieren wir
eine “imaginäre Einheit” i als die Lösung der Gleichung z 2 = −1:
i2 := −1.
(8.1)
Wenn wir −i = (−1) i definieren, so ist auch (−i)2 = (−1)2 i2 = −1. Es ist offensichtlich i
keine reelle Zahl, i ∈
/ R.
Ziel ist es, allgemein quadratische Gleichungen lösen zu können. Angenommen wir könnten mit
der imaginären Einheit i rechnen wie mit den Symbolen physikalischer Einheiten (und natürlich unter Beachtung von Gleichung (8.1)), so können wir, zunächst als formale Überlegung,
Lösungen der folgenden Gleichungen berechnen:
a) Die Gleichung z 2 = −1 hat die beiden Lösungen
z+ = i
und
z− = −i
2
b) z 2 = −4. Dann ist z2 = −1, was nach a) die beiden Lösungen
Lösungen von z 2 = −4 sind also
z+ = 2i
und
z
2
= i und
z− = −2i.
z
2
= −i hat.
(8.2)
c) (z − 3)2 = −1. Dann sind z − 3 = i und (z − 3) = −i Lösungen, so dass
z+ = 3 + i
und
z− = 3 − i
Lösungen von (z − 3)2 = −1 sind.
Wie wir sehen, erhalten wir Terme der Form z = x + iy mit x, y ∈ R, weshalb wir unseren
erweiterten Zahlenraum wie folgt definieren.
154
8 Komplexe Zahlen
8.1 Definition
Die Menge C der komplexen Zahlen wird definiert durch
C := {x + iy | x, y ∈ R}.
Für eine komplexe Zahl z = x + iy ∈ C heißt
Re(z) := x der Realteil von z
und
Im(z) := y der Imaginärteil von z.
8.2 Beispiel Um diese Begriffe zu erläutern, zerlegen wie die folgenden komplexen Zahlen
Real- und Imaginärteil.
z = 3 + 4i
Re(z) = 3
Im(z) = 4
z =5−i
Re(z) = 5
Im(z) = −1
z = 2i = 0 + 2i
Re(z) = 0
Im(z) = 2
z = 2, 5 = 2, 5 + 0 · i
Re(z) = 2, 5
Im(z) = 0
Insbesondere sind Re(z) und Im(z) immer reelle Zahlen!
8.3 Bemerkungen
a) Für eine komplexe Zahl z = x + iy gilt z = 0 genau dann, wenn
x = 0 und y = 0.
b) Zwei Zahlen z1 = x1 + iy1 ∈ C und z2 = x2 + iy2 ∈ C sind genau dann gleich, wenn Realund Imaginärteil jeweils gleich sind. Dieses sieht man, wenn man x1 + iy1 = x2 + iy2
umstellt zu
x − x = i (y − y )
| 1 {z 2} |{z} | 1 {z 2}
∈R
/
∈R
∈R
und beachtet, dass Gleichheit hier nur dann gelten kann, wenn auf beiden Seiten “0”
steht:
x1 = x2
und
y1 = y2
(8.3)
Diese zunächst simpel erscheinende Beobachtung hat weitreichende Anwendungen, da sie
es ermöglicht, aus einer komplexwertigen Gleichung auf zwei reellwertige Gleichungen zu
schließen.
c) Es ist R ⊆ C, denn nach Beispiel 8.2 lässt sich jedes x ∈ R schreiben als
x = x + i · 0.
155
8 Komplexe Zahlen
8.4 Definition
Seien z1 , z2 ∈ C mit z1 = x1 + iy1 und z2 = x2 + iy2 . Dann werden Summe und Produkt
von z1 und z2 erklärt durch
z1 + z2 = (x1 + iy1 ) + (x2 + iy2 )
: = (x1 + x2 ) + i(y1 + y2 )
z1 · z2 = (x1 + iy1 ) · (x2 + iy2 )
: = x1 x2 + ix1 y2 + ix2 y1 + i2 y1 y2
|
i2 = −1
= (x1 x2 − y1 y2 ) + i(x1 y2 + x2 y1 ).
(8.4)
8.5 Satz: Rechengesetze in C Teil I
Für die in Definition 8.4 erklärte Addition und Multiplikation komplexer Zahlen gelten
das Kommutativ-, Assoziativ- und Disitributivgesetz, d.h. seien z1 , z2 , z3 ∈ C, dann gilt
i) z1 + z2 = z2 + z1 und z1 · z2 = z2 · z1
(Kommutativgesetz)
ii) (z1 + z2 ) + z3 = z1 + (z2 + z3 ) und (z1 · z2 )z3 = z1 (z2 · z3 ) (Assoziativgesetz)
iii) z1 (z2 + z3 ) = z1 · z2 + z1 · z3
(Distributivgesetz)
iv) Ferner gilt: z1 · z2 = 0 ⇐⇒ z1 = 0 oder z2 = 0.
Beweis. Kommutativität, Assoziativität und Distributivität folgen direkt aus Definition 8.4.
Aussage iv) folgt mit Fallunterscheidungen aus Gleichung (8.4).
8.6 Bemerkung Sei z ∈ C mit z = x + iy. Dann bezeichnen wir mit −z die komplexe Zahl
−z : = −x + i(−y) = −x − iy
und für z1 = x1 + iy1 , z2 = x2 + iy2 ∈ C folgt
z1 − z2 = z1 + (−z2 )
= x1 + iy1 − x2 − iy2
= x1 − x2 + i(y1 − y2 ).
8.7 Beispiele
a) Seien zwei komplexe Zahlen z1 = 3 + 2i und z2 = 1 + 3i gegeben. Dann ist
z1 + z2 = 3 + 2i + 1 + 3i = (3 + 1) + i(2 + 3)
= 4 + 5i
156
8 Komplexe Zahlen
und
z1 · z2 = (3 + 2i)(1 + 3i)
= 3 + 9i + 2i + 6i2
| i2 = −1
= 3 + 9i + 2i − 6
= −3 + 11i.
b) Seien die komplexen Zahlen z1 = 3 + 2i, z2 = 5 − i und z3 = 2i gegeben. Dann gilt
z1 − z2 = 3 + 2i − (5 − i) = 3 + 2i − 5 + i
= −2 + 3i
und
z1 (z2 + z3 ) = (3 + 2i)(5 − i + 2i)
= (3 + 2i)(5 + i)
= 15 + 3i + 10i + 2i2
|
i2 = −1
= 13 + 13i.
8.1.2 Die komplexe Zahlenebene
Jede komplexe Zahl z = x + iy ∈ C mit x, y ∈ R kann mit dem Tupel (x, y) ∈ R2 identifiziert
werden. Weiter kann der Raum der komplexen Zahlen C mit dem R2 identifiziert werden.
iR
R
2
C
2
y
z = x + iy
◦
y
R2
(x, y)
R
R
x
1
1
x
Abbildung 8.1: Die Ebene C und der R2
8.8 !
Bemerkung
Die Addition in C entspricht der Vektoraddition in R2 , denn sind einerseits
!
x1
x
, 2 Vektoren in R2 , dann ist
y1
y2
!
x1
x2
+
y1
y2
!
!
=
x1 + x2 ← x − Komponente
y1 + y2 ← y − Komponente
157
8 Komplexe Zahlen
wohingegen andererseits für x1 + iy1 , x2 + iy2 ∈ C gilt
(x1 + iy1 ) + (x2 + iy2 ) = (x1 + x2 ) +i (y1 + y2 ) .
{z
|
Re
}
|
{z
Im
}
8.9 Beispiel Seien die zwei komplexen Zahlen z1 = 1 + 2i und z2 = 1 + i gegeben. Dann ist
!
z1 + z2 = 1 + 2i + 1 + i = 2 + 3i und
1
1
+
2
1
!
!
=
2
.
3
Anschaulich:
iy
2 + 3i
3
2
1 + 2i
1
1+i
x
1
2
3
!
p
x
k = x2 + y 2 . In der nächsten DefiniWir kennen in R2 den Betrag eines Vektors als k
y
tion werden wir sehen, dass der Betrag einer Zahl z ∈ C genauso definiert ist.
8.10 Definition: Betrag und komplex konjugierte Zahl
Sei z = x + iy ∈ C. Dann definieren wir den Betrag |z| von z durch
|z| =
q
x2 + y 2 ∈ R
und die komplex konjugierte Zahl z durch
z = x − iy,
die anschaulich eine Spiegelung an der reellen Achse darstellt.
158
8 Komplexe Zahlen
8.11 Beispiele
a) Sei die komplexe Zahl z = 1 + 2i gegeben. Dann gilt für ihren Betrag
p
√
√
|z| = 12 + 22 = 1 + 4 = 5
und die komplex konjugierte ist
z = 1 − 2i.
b) Es ist |z| = |z|, denn
|z| =
q
x2 + (−y)2 =
q
x2 + y 2 = |z|.
8.12 Satz: Rechengesetze in C Teil II
Seien z = x + iy, z1 , z2 ∈ C. Dann gilt
z=z
(8.5)
z1 + z2 = z1 + z2
(8.6)
z1 · z 2 = z 1 · z2
2
(8.7)
2
2
z · z = x + y = |z|
|z1 · z2 | = |z1 ||z2 |
1
1
Re(z) = (z + z) Im(z) = (z − z).
2
2i
√
Aus (8.8) folgt insbesondere z · z ∈ R und |z| = z · z
(8.8)
(8.9)
(8.10)
Beweis. Seien z = x + iy, z1 = x1 + iy1 , z2 = x2 + iy2 ∈ C. Die obigen Aussagen können durch
direktes Nachrechnen gezeigt werden:
zu (8.5): z = (x + iy) = (x − iy) = x + iy = z
zu (8.6):
z1 + z2 = (x1 + iy1 ) + (x2 + iy2 )
= x1 + x2 + i(y1 + y2 )
= x1 + x2 − i(y1 + y2 )
= x1 − iy1 + x2 − iy2 = z1 + z2
zu (8.7): Einerseits ist
z1 · z2 = (x1 + iy1 ) · (x2 + iy2 )
= x1 x2 − y1 y2 + i(x1 y2 + x2 y1 )
= x1 x2 − y1 y2 − i(x1 y2 + x2 y1 )
159
8 Komplexe Zahlen
andererseits ist
z1 · z2 = (x1 + iy1 ) · (x2 + iy2 )
= (x1 − iy1 )(x2 − iy2 )
= x1 x2 − ix1 y2 − ix2 y1 + i2 y1 y2
= x1 x2 − y1 y2 − i(x1 y2 + x2 y1 )
woraus z1 · z2 = z1 · z2 folgt.
zu (8.8): Da |z| =
p
x2 + y 2 gilt, folgt
z · z = (x + iy)(x − iy)
= x2 − i2 y 2
= x2 + y 2 = |z|2 .
Die Gleichungen (8.9) und (8.10) können ebenso durch Nachrechnen gezeigt werden.
8.1.3 Division in C
Division in R entspricht der Multiplikation mit dem Multiplikationsinversen. Es ist für x ∈ R
und y ∈ R \ {0}
1
x:y=x
y
wobei y1 das Multiplikationinverse y −1 von y bezeichnet. In C tritt nun das Problem auf,
1
dass ein Term der Form z1 = x+iy
nicht von der Form “Realteil + i · Imaginärteil” ist, wir
also noch nicht wissen, welche komplexe Zahl hiermit gemeint ist. Um die Division komplexer
Zahlen zu erklären, verwenden wir Regel (8.8) aus Satz 8.12. Mit dieser können wir durch
1
geschicktes Erweitern in einem Bruch der Form x+iy
einen reellwertigen Nenner erzeugen.
Tritt die komplexe Einheit i nur noch im Zähler eines Bruches auf, so kann dieser in Realund Imaginärteil zerlegt werden. Sei beispielsweise z = 3 + 4i, dann ist durch Erweitern mit
z = 3 − 4i
1
1
3 − 4i
=
·
3 + 4i
3 + 4i 3 − 4i
3 − 4i
= 2
3 − (4i)2
3
4
3 − 4i
=
=
− i.
9 + 16
25 25
1
Es ist also gelungen 3+4i
in einen Term vom Typ a + ib umzuformen, mit dem nach den
bisherigen Regeln gerechnet werden kann. Das es sich hierbei tatsächlich um das Multiplika-
160
8 Komplexe Zahlen
tioninsverse von 3 + 4i handelt, überprüft man durch
(3 + 4i)(
3
4
3
4
3
4
− i) = 3 + 3(− i) + 4i + 4i(− i)
25 25
25
25
25
25
9 + 16
−12 + 12
=
+i
25
25
= 1.
8.13 Satz: Multiplikationsinverses in C
Zu jedem z = x + iy ∈ C \ {0} existiert genau ein Multiplikationsinverses z −1 ∈ C, so
dass
z · z −1 = 1
(8.11)
gilt. Das Multiplikationsinverse z −1 ist gegeben durch
z −1 =
y
x
−i 2
x2 + y 2
x + y2
(8.12)
und wir schreiben auch
1
: = z −1 .
z
Beweis. Dass für das durch (8.12) definierte z −1 die Gleichheit (8.11) gilt, sieht man durch
Nachrechnen wie in obigem Beispiel. Die Eindeutigkeit des Multiplikationsinversen folgt, wenn
wir annehmen, es gäbe eine weitere Zahl w ∈ C mit z · w = 1. Dann wäre
z · z −1 − z · w = 0
⇐⇒
z(z −1 − w) = 0,
also muss nach Satz 8.5 entweder z = 0 oder (z −1 −w) = 0 gelten. Da z ∈ C\{0} vorausgesetzt
wurde, ist z −1 − w = 0, woraus z −1 = w folgt. Also ist z −1 eindeutig.
8.14 Definition: Division in C
Sei w ∈ C und z ∈ C \ {0}. Dann erklären wir die Division
w
:= w · z −1 .
z
161
w
z
durch
8 Komplexe Zahlen
8.15 Beispiele
a) Sei w = 3 + i und z = 2 + 3i. Dann ist nach Formel (8.12) z −1 =
3+i
3
2
−i 2
= (3 + i) 2
2
2 + 3i
2 +3
2 + 32
6 + 2i 9i + 3i2
=
−
4+9
4+9
6 + 2i − 9i + 3
=
13
9
7
=
−i .
13
13
2
22 +32
3
− i 22 +3
2 so das
b) Die Formel (8.12) für z −1 erhalten wir formal auch durch Erweitern von
z
1
1 z
x − iy
= · = 2 = 2
,
z
z z
|z|
x + y2
1
z
mit z :
(8.13)
wobei wir Satz 8.12 Regel (8.8) verwendet haben.
c) Das Multiplikationsinverse von i können wir mit (8.12) berechnen durch i = 0 + 1i:
0
1
1
= 2
−i 2
= −i
2
i
0 +1
0 + 12
oder auch mit (8.13) durch Erweitern mit i = −i
:
1
1 (−i)
−i
= ·
=
= −i.
i
i (−i)
−i2
d) Auf der reellen Achse, z = x + 0i, stimmt die Formel (8.12) mit dem aus R bekannten
Multiplikationsinversen überein:
(x + 0i)−1 =
x2
x
0
x
1
−i 2
= 2 = .
2
2
+0
x +0
x
x
8.1.4 Quadratische Gleichungen in C
Eine quadratische Gleichung mit reellen Koeffizienten p, q ∈ R
x2 + px + q = 0
(8.14)
konnten wir bisher in R lösen durch
x+/−
2
p
=− ±
2
s p 2
2
2
−q
für den Fall dass p2 − q ≥ 0 ist. Ist nun p2 − q < 0, so gibt es offenbar keine Lösungen in
R, aber Lösungen in C. Um diese Gleichung für komplexe Unbekannte zu formulieren, setzen
162
8 Komplexe Zahlen
wir in (8.14) x = z ein und formen um:
z 2 + pz + q = 0
⇐⇒
2
(8.15)
2
p
p
=
−q
2
2
2
p 2
p
z+
=
−q
2
2
z 2 + pz +
⇐⇒
2
mit rechter Seite p2 − q < 0. Genauso, wie wir in (8.2) aus z 2 = −4 gefolgert hatten, dass
√
z+/− = ±i 4 = ±2i Lösungen sind, folgern wir nun
s 2
p
p
z+ =± |
2
2
s
= ±i q −
wobei q −
p 2
2
− q|
2
p
2
> 0 zu beachten ist. Also sind
s
z+/−
p
=− ±i q−
2
2
p
(8.16)
2
zwei komplexwertige Lösungen der quadratischen Gleichung (8.15). Es ist zu beachten, dass
die Koeffizienten p, q nach wie vor reellwertig sind: p, q ∈ R.
8.16 Beispiele
a) Wir betrachten
z 2 + 3z + 5 = 0,
es ist also p = 3 und q = 5, also
Lösungen
p 2
2
−q =
9
4
s
z+/−
− 5 < 0. Formel (8.16) liefert nun die
3
=− ±i 5−
2
√
11
3
=− ±i
.
2
2
2
3
2
!
b) Wir berechnen die Eigenwerte der Matrix A =
3 2
. Zunächst bestimmen wir das
−1 4
charakteristische Polynom von A durch
3−λ
2
p(λ) = det(A − λI2 ) = det
−1 4 − λ
= (3 − λ)(4 − λ) + 2
= λ2 − 7λ + 14.
163
!
8 Komplexe Zahlen
Es ist also p = −7 und q = 14, so dass
2
p
2
2
−q =
7
2
− 14 =
49
7
− 14 = − < 0.
4
4
Verwenden wir daher Formel (8.16), so erhalten wir als Nullstellen des charakteristischen
Polynoms p(λ) und somit als Eigenwerte von A
s
λ+/−
7
= ± i 14 −
2
r
7
7
= ±i
2
√4
7
7
= ±i
.
2
2
2
7
2
!
a b
c) Eine Matrix der Form A =
hat bei reellen Einträgen a, b ∈ R stets 2 kom−b a
plexwertige Eigenwerte λ+/− ∈ C \ R. Wir berechnen das charakteristische Polynom von
A:
p(λ) = det(A − λI2 )
!
a−λ
b
= det
−b a − λ
= (a − λ)2 + b2 .
Es ist λ genau dann Eigenwert von A, wenn p(λ) = 0, also wenn (a − λ)2 = −b2 . Hier
könnte man ausmultiplizieren und die dadurch erhaltene quadratische Gleichung für λ wie
in Beispiel b) lösen. Man kann aber auch direkt erkennen, dass
λ+/− = a ± ib
die Nullstellen von p(λ) sind.
8.2 Polardarstellung im Komplexen
Anstelle der kartesischen Darstellung durch Real- und Imaginärteil, z = x + iy, lässt sich jeder
Punkt z der Ebene auch beschreiben durch seinen Abstand r zum Nullpunkt und den Winkel
ϕ, den sein Ortsvektor mit der postitiven reellen Achse einschließt (Orientierung hierbei gegen
den Uhrzeigersinn).
164
8 Komplexe Zahlen
iy
◦
y = r sin(ϕ)
r=
z = x + iy
|z |
ϕ
x
x = r cos(ϕ)
Abbildung 8.2: Polarkoordinaten und cartesische Koordinaten
Es ist r ∈ R≥0 und ϕ ∈ [0, 2π) und
z = x + iy
= r(cos ϕ + i sin ϕ).
Weiter ist r = |z| der Betrag von z und der Winkel ϕ heißt Argument von z, arg(z) := ϕ. Das
Paar (r, ϕ) heißt Polarkoordinaten von z.
8.2.1 Umrechnung der Koordinaten
Sind die Polarkoordinaten (r, ϕ) von z ∈ C gegeben, so erhält man (wie in Abbildung 8.2)
Real- und Imaginärteil durch
z = r cos ϕ + ir sin ϕ,
so dass die kartesischen Koordinatengegeben sind durch x = r cos ϕ und y = r sin ϕ. Ist
hingegen z ∈ C in kartesischen Koordinaten gegeben durch z =
px + iy und möchte man diese
umrechnen in Polarkoordinaten, so erhält man r durch r = x2 + y 2 . Das Argument ϕ zu
berechnen erfordert eine Fallunterscheidung, da (siehe Abbildung 8.2) tan(ϕ) = xy ist, so dass
y
ϕ = tan−1 ( ).
x
Nun bildet aber der Tangens das Intervall (− π2 , π2 ) auf ganz R ab, tan : (− π2 , π2 ) → R, so dass
π π
tan−1 : R → (− , ),
2 2
d.h. der Bildbereich der Umkehrfunktion tan−1 ist nicht das für die Polardarstellung von z
gewünschte Intervall [0, 2π).
165
8 Komplexe Zahlen
tan
R
R
+ π2
R
− π2
R
+ π2
tan−1
− π2
Abbildung 8.3: Definitions - und Wertebereich von tan und tan−1
Der Abbildung 8.3 entnehmen wir:
y
π
y
∈ (0, )
> 0 ⇒ tan−1
x
x
2
π
y
−1 y
< 0 ⇒ tan
∈ (− , 0).
x
x
2
Nun ist aber der Wertebereich von ϕ = arg(z) in den 4 Quadranten der Ebene C wie in
Abbildung 8.4 dargestellt,
II
I
ϕ ∈ ( π2 , π)
ϕ ∈ (0, π2 )
x < 0,
y>0
x > 0,
y>0
x < 0,
y<0
x > 0,
y<0
ϕ ∈ (π, 3π
2 )
ϕ ∈ ( 3π
2 , 2π)
III
IV
Abbildung 8.4: Wertebereich von ϕ = arg(z) in der Komplexen Ebene
so dass der Wertebereich von tan−1 xy in den Quadranten II und III um +π und im Quadranten IV um +2π angepasst werden muss. Dann können wir ϕ für z = x + iy in den
166
8 Komplexe Zahlen
Quadranten I - IV wie folgt berechnen:
y
x
y
II: x < 0, y > 0 ⇒
x
y
III: x < 0, y < 0 ⇒
x
y
IV: x > 0, y < 0 ⇒
x
I: x > 0, y > 0 ⇒
y
π
π
∈ (0, ) ⇒ ϕ = tan−1
∈ (0, ).
x
2
x
2
π
π
−1 y
−1 y
∈ (− , 0) ⇒ ϕ = tan
+ π ∈ ( , π).
< 0 ⇒ tan
x
2
x
2
y
y
π
3
∈ (0, ) ⇒ ϕ = tan−1
+ π ∈ (π, π).
> 0 ⇒ tan−1
x
2
x
2
π
3
−1 y
−1 y
< 0 ⇒ tan
∈ (− , 0) ⇒ ϕ = tan
+ 2π ∈ ( π, 2π).
x
2
x
2
> 0 ⇒ tan−1
y
Auf den Koordinaten-Achsen ist ϕ gegeben durch
ϕ=0
π
ϕ=
2
ϕ=π
3
ϕ= π
2
für z = x
mit x > 0
für z = iy
mit y > 0
für z = x
mit x < 0
für z = iy
mit y < 0.
Die so definierte Abbildung z 7→ ϕ := arg(z) ist stetig in z, unter Ausnahme von Werten auf
der positiven reellen Achse. Hier macht die Abbildung einen Sprung um 2π.
8.17 Beispiele
a) Sei z gegeben durch r = 4, ϕ = 30◦ =
ˆ π6 . Dann ist sin ϕ =
1
2
√
und cos ϕ =
3
2 ,
so dass
z = r(cos ϕ + i sin ϕ)
√
3
1
+i )
= 4(
2
2
√
= 2 3 + 2i.
√
√
b) Sei z = −2 3 + 2i, so liegt z im II. Quadranten und es ist x = −2 3 und y = 2. Also
sind die Polarkoordinaten
√
(−2 3)2 + 22 = 4
2
1
√
ϕ = tan−1
+ π = tan−1 − √
+π
−2 3
3
π
5
= − +π = π=
ˆ 150◦ .
6
6
r=
q
8.2.2 Geometrische Interpretation der Multiplikation
Seien zwei komplexe Zahlen z, w ∈ C in Polarkoordinaten gegeben:
z = |z|(cos α + i sin α)
w = |w|(cos β + i sin β),
167
8 Komplexe Zahlen
so ist eine geometrische Interpretation der Multiplikation ermöglicht. Hierzu berechnen wir
z · w = |z| |w|(cos α + i sin α)(cos β + i sin β)
= |z| |w|(cos α cos β + i cos α sin β + i sin α cos β − sin α sin β)
= |z| |w| [(cos α cos β − sin α sin β) + i(cos α sin β + sin α cos β)] .
(8.17)
Verwenden wir nun die Additionstheoreme für die cosinus- und sinus-Funktion
cos(α + β) = cos α cos β − sin α sin β
(8.18)
sin(α + β) = cos α sin β + sin α cos β,
so erhalten wir
z · w = |z| |w| [cos(α + β) + i sin(α + β)] .
(8.19)
Bei der Multiplikation von z und w werden also die Beträge multipliziert und die Winkel
addiert.
8.18 Beispiel Sei z = 1 + i und w = i. Dann ist
|z| =
√
|w| = 1,
Also folgt |z| · |w| =
√
2,
π
4
π
β = arg(w) = .
2
α = arg(z) =
2 und α + β = 43 π. Berechnen wir nun z · w, so erhalten wir
z · w = (1 + i)i = i + i2 = −1 + i.
Dann ist |z · w| =
√
(8.20)
2 und in der Skizze sehen wir arg(z · w) = 43 π, was gerade
π
4
+
π
2
ist:
iy
z · w = −1 + i
z =1+i
w=i
x
1
Abbildung 8.5: Multiplikation z · w
8.2.3 Die Exponentialfunktion im Komplexen
Es soll die Exponentialfunktion für komplexe Werte definiert werden. Wir setzen fü r ϕ ∈ R
eiϕ := cos ϕ + i sin ϕ.
168
(8.21)
8 Komplexe Zahlen
Dann folgt mit der gleichen Rechnung wie in (8.17), (8.18) und (8.19)
eiϕ eiψ = (cos ϕ + i sin ϕ)(cos ψ + i sin ψ)
= cos(ϕ + ψ) + i sin(ϕ + ψ)
= ei(ϕ+ψ) ,
(8.22)
d.h. wir erhalten die gleiche Funktionalgleichung für die durch (8.21) definierte Funktion wie
für die reelle Exponentialfunktion (s.(3.3)). Die Additionstheoreme der sin- und cos-Funktionen
(8.18) sind also äquivalent zu Gleichung (8.22) und durch (8.21) wird die Exponentialfunktion
auf sinnvolle Weise für komplexe Argumente definiert.
8.19 Bemerkungen
a) Es sind die cosinus- und sinus- Funktion (2π)-periodisch, cos(ϕ+2π) = cos ϕ und sin(ϕ+
2π) = sin ϕ, also ist auch
ei(ϕ+2π) = eiϕ
und allgemein für k ∈ N
ei(ϕ+2kπ) = eiϕ .
(8.23)
b) Es gilt die Eulersche Formel
eiπ = cos π + i sin π = −1.
c) Sei z ∈ C \ {0} in Polardarstellung gegeben mit Koordinaten (r, ϕ), so ist z = reiϕ und
es ist
z = re−iϕ .
d) Die Multiplikation zweier komplexer Zahlen in der Polardarstellung wird nun besonders
einfach durch z = reiϕ und w = seiψ
⇒ z · w = reiϕ · seiψ = rsei(ϕ+ψ) .
Die geometrische Interpretation aus Abschnitt 8.2.2 lässt sich hier direkt ablesen.
8.2.4 Flächenberechnung und Determinante
Seien zwei komplexe Zahlen z, w sowohl in kartesischer wie auch in Polardarstellung gegeben,
z = a + ic = |z|eiϕ
w = b + id = |w|eiψ ,
169
(8.24)
8 Komplexe Zahlen
iy
z+w
w
d
h = |w| sin(α)
h
c
z
α
x
a
b
Abbildung 8.6: Das von z, w aufgespannte Parallelogramm
so muss dass Produkt z · w das gleiche sein, egal ob es in kartesischer oder in Polardarstellung
berechnet wird:
(a − ic)(b + id) = |z|e−iϕ |w|eiψ
⇐⇒
⇐⇒
ab + iad − iac − i2 cd = |z||w|ei(ψ−ϕ)
ab + cd + i(ad − bc) = |z||w| (cos(ψ − ϕ) + i sin(ψ − ϕ))
(8.25)
Zwei komplexe Zahlen sind genau dann gleich, wenn Real- und Imaginärteil übereinstimmen
(s.(8.3)), was zur Folge hat, dass eine Gleichung im Komplexen genau dann richtig ist, wenn
die Gleichheit für Real- und Imaginärteil der Gleichung gilt. Vergleicht man die Imaginärteile
der Gleichung (8.25), so erhält man
ad − bc = |z||w| sin(ψ − ϕ).
(8.26)
Diese Gleichung lässt sich geometrisch
interpretieren:
!
a b
ist die Determinante gegeben durch det(A) = ad − bc, was auf
Zu einer Matrix A =
c d
der linken Seite von (8.26) steht. In den
stehen die Vektoren, die den
! Spalten dieser Matrix
!
b
a
Zahlen z, w entsprechen: a + ic =
ˆ
und b + id =
ˆ
, wenn C mit dem R2 identifiziert
d
c
wird. Auf der rechten Seite von (8.26) steht die Fläche des von den Vektoren
!
!
a
c
!
!
und
b
d
a
b
aufgespannten Parallelogramms, da |z| = k
k und |w| = k
k, siehe hierzu Gleichung
c
d
(8.24). Es ist die Fläche des Parallelogramms
FP = “Grundfläche” · “Höhe” = | sin(ψ − ϕ)||z||w|,
170
8 Komplexe Zahlen
was in Abbildung 8.6 dargestellt ist. Daher gibt det(A) die Fläche des Parallelogramms an, das
von den Spaltenvektoren
der Matrix A aufgespannt wird. Betrachten wir in R2 das Quadrat
!
x
Q = {
| 0 ≤ x, y ≤ 1}, so sehen wir, dass die Punkte Q durch Mutliplikation mit der
y
Matrix A auf das Parallelogramm abgebildet werden, welches von den
von
! Spaltenvektoren
!
!
! A
0
1
0
1
aufgespannt wird. Wir berechnen die Bildpunkte der Eckpunkte
,
,
und
:
0
0
1
1
!
0
A
0
!
=
a b
c d
!
=
a b
c d
!
=
a b
c d
!
=
a b
c d
!
1
A
0
!
0
A
1
!
1
A
1
0
0
!
1
0
!
!
=
0
0
=
a
c
=
b
d
=
a+b
.
c+d
!
!
0
1
!
!
1
1
!
Diese Eckpunkte von Q werden also auf die Eckpunkte des Parallelogramms P abgebildet, das
gleiche gilt auch für die Randpunkte und das Innere von Q. Also gilt, da FQ = 1
FP = det(A) · FQ ,
was sich auch für allgemeine Quadrate und allgemeine Flächen Q in R2 zeigen lässt. Daher
heißt det(A) auch Flächenverzerrungsfaktor und
Fläche (A(Q)) = det(A) · Fläche(Q)
gilt für beliebige Flächen Q, nicht nur für Quadrate.
8.20 Beispiele
a) Betrachte die Scherungsmatrix
!
S=
1 a
.
0 1
Es ist det(S) = 1, d.h. die Scherung lässt eine Fläche gleich groß.
!
b) Die Drehmatrix Dϕ =
c) Die Streckung mit T =
cos ϕ − sin ϕ
sin ϕ cos ϕ
t 0
0 t
ändert die Größe einer Fläche ebenfalls nicht.
!
verändert eine Fläche um t2 , da det(T ) = t2 .
171
8 Komplexe Zahlen
8.3 Fundamentalsatz der Algebra
Ein komplexes Polynom von Grad n ist eine Abbildung p : C → C der Form
p(z) = c0 + c1 z + c2 z 2 + · · · + cn z n
mit c0 , . . . , cn ∈ C und cn 6= 0. Wir nennen z0 ∈ C Nullstelle von p, falls p(z0 ) = 0 gilt.
8.21 Satz: Fundamentalsatz der Algebra
Jedes Polynom vom Grad n ≥ 1 besitzt eine Nullstelle in C.
Mit dieser Aussage können Polynome in C in Linearfaktoren zerlegt werden:
8.22 Satz
Ist p ein Polynom vom Grad n ≥ 1, so existieren z1 , . . . , zn ∈ C (nicht notwendigerweise
verschieden), so dass
p(z) = c(z − z1 )(z − z2 ) · . . . · (z − zn )
gilt.
Sei nun p ein Polynom mit reellen Koeffizienten a0 , . . . , an ∈ R
p(z) = a0 + a1 z + a2 z 2 + · · · + an z n
und an 6= 0. Dann ist das komplex konjugierte eines Funktionswertes p(z)
p(z) = a0 + a1 z + · · · + an z n
= a0 + a1 z + · · · + an z n = a0 + a1 z + · · · + an z n = p(z),
(s. Satz 8.12) da speziell ai = ai für ai ∈ R gilt. Also folgt, dass zu einer komplexen Nullstelle
z0 ∈ C von p auch das konjugiert komplexe z0 Nullstelle von p ist:
p(z0 ) = 0
⇐⇒
p(z0 ) = p(z0 ) = 0.
8.23 Folgerung Sei p ein reelles Polynom vom Grad n mit den reellen Nullstellen x1 , . . . , xk ∈
R. Dann ist n − k = 2l eine gerade Zahl und es existiert ein reelles Polynom p2l (z) vom Grad
2l, so dass
p(z) = an (z − x1 ) · . . . · (z − xk )p2l (z),
wobei p2l keine reellen Nullstellen hat. Die Nullstellen von p2l sind gegeben durch z1 , . . . , zl , z1 , . . . , zl ,
so dass
p(z) = an (z − x1 ) · . . . · (z − xk ) · (z − z1 ) · . . . · (z − zl ) · (z − z1 ) · . . . · (z − zl )
8.24 Bemerkungen
1) Es ist k + 2l = n.
172
8 Komplexe Zahlen
2) Weder die x1 , . . . , xk noch die z1 , . . . , zl müssen verschieden sein.
3) Für n =2 erkennt man diese Aussage an der pq-Formel. Das Polynomz 2 + pz + q hat im
2
Falle p2 − q < 0 die Nullstellen
s
p
z+/− = − ± i q −
2
=x
ˆ ± iy,
man sieht also, dass z− = z+ .
173
2
p
2
9 Gewöhnliche Differentialgleichungen
9.1 Einleitung
Bisher wurden Gleichungen untersucht, deren Lösungen Zahlen (aus R oder C) oder Vektoren
sind:
5
3
x2 + 2x − 3 = 0 Lösungen: x1 = −3, x2 = 1
1
e3x = 5 Lösung: x = ln 5
3
Ax = b Lösung x ∈ Rn , falls A ∈ Rm×n , b ∈ Rm
3x = 5 Lösung: x =
Mathematische Modelle für Vorgänge aus Biologie, Chemie, Physik, Ökonomie etc. geben im
Allgemeinen nicht Gleichungen der o. g. Art für die untersuchten Größen an, sondern eine
Beziehung zwischen der Änderung der Größe und ihrem aktuellen Wert. Das ergibt dann eine
Differentialgleichung. Besteht der Zusammenhang nur zwischen der gesuchten Funktion u und
ihrer ersten Ableitung, so ist das Problem gegeben durch eine Gleichung vom Typ
u0 (t) = g(t, u(t)).
(9.1)
Ist zusätzlich der Funktionswert zu einem Anfangszeitpunkt t0 bekannt, u(t0 ) = u0 , so sprechen wir von einem Anfangswertproblem. Die Lösungen von Differentialgleichungen sind
Funktionen. Merkmale einer Differentialgleichung sind:
1. Die Unbekannte der Gleichung ist eine Funktion.
2. Es treten Ableitungen der gesuchten Funktion auf.
3. Beim Lösen ist eine Integration notwendig.
4. Es taucht eine Integrationskonstante auf, die Lösung ist (ohne weitere Bedingungen)
nicht eindeutig.
Bereits bekannt ist das Problem der Suche nach Stammfunktionen, was als einfache Differentialgleichung verstanden weden kann. Zum Beispiel seien alle Stammfunktionen u(t) von sin(t)
gesucht, d.h. alle u welche die Gleichung
u0 (t) = sin(t),
(9.2)
erfüllen. Die Lösungen sind Funktionen der Form
u(t) = − cos(t) + c
174
(9.3)
9 Gewöhnliche Differentialgleichungen
wobei c ∈ R für eine Integrationskonstante steht. Da c frei wählbar ist, ist die Lösung von
Gleichung (9.2) bis hierher noch nicht eindeutig bestimmt, denn Lösung (9.3) bezeichnet nicht
eine spezielle Funktion sondern eine ganze Funktionenschaar. Wird die Problemstellung jetzt
durch einen sogenannten Anfangswert ergänzt, soll also zu einem Zeitpunkt t0
u(t0 ) = u0 ,
(9.4)
gelten, so erhalten wir, indem wir in Gleichung (9.3) t = t0 einsetzen, dass c = − cos(t0 ) + u0
gelten muss. Die eindeutige Lösung von (9.2) und (9.4) ist also
u(t) = − cos(t) + cos(t0 ) + u0 .
9.1 Bemerkungen
a) Eine kanonische Wahl für den Anfangszeitpunkt ist häufig t0 = 0, es ist aber jedes t0 ∈ R
möglich.
b) Die Variable t der gesuchten Funktion kann für beliebige Größen stehen, sie kann die Zeit,
den Ort (allerdings nur eindimensional), die Konzentration eines Stoffes oder anderes
bezeichnen. Da wir im weiteren Verlauf des Kapitels häufig Modelle für die zeitliche
Entwicklung von Populationen untersuchen werden, interpretieren wir dieses Variable,
wie oben bereits geschehen, meist als die Zeit. Die erzielten Ergebnisse sind natürlich bei
allen Interpretationen richtig.
9.2 Differentialgleichungen 1. Ordnung
Als Differentialgleichung 1. Ordnung wird eine Gleichung bezeichnet, die neben der gesuchten
Funktion selbst auch ihre 1. Ableitung enthält. Ableitungen höherer Ordnung treten nicht auf.
Die allgemeine Form ist Gleichung (9.1) und beschreibt mittels der Funktion g den Zusammenhang zwischen u0 und u. Die Methoden, mit denen sich diese Gleichungen lösen lassen, richten
sich nach der Gestalt der Funktion g. In den Abschnitten 9.2.1 und 9.2.2 werden zunächst
Beispiele für Wachstumsprozesse untersucht.
9.2.1 Konstantes und exponentielles Wachstum
Konstantes Wachstum
Ist die Änderungsrate einer gesuchten Größe u konstant, so hat sie eine konstante Ableitung,
d. h. es gilt
u0 (t) = a.
Ausgehend von einem Anfangswert u(t0 ) = u0 zu einem Zeitpunkt t0 können wir mittels
Intergration eine Lösung erhalten:
Z t
Z t
0
u (τ ) dτ =
t0
=⇒
a dτ
t0
u(t) = a(t − t0 ) + u0 .
175
9 Gewöhnliche Differentialgleichungen
Die Lösung ist eine affin lineare Funktion mit u(t0 ) = u0 . Wenn der Anfangszeitpunkt t0 = 0
ist, so erhalten wir
u(t) = at + u0 .
Exponentielles Wachstum
Beim radioaktiven Zerfall einer Probe P hingegen wird beobachtet, dass die Änderung während
einer kleinen Zeiteinheit 4t nicht konstant ist, sondern proportional zur aktuellen Größe der
Probe P (t):
⇐⇒
P (t + 4t) − P (t) = −aP (t)4t
P (t + 4t) − P (t)
= −aP (t),
4t
wobei a > 0 eine Materialkonstante ist. Der Grenzübergang t → 0 führt zu der Differentialgleichung
P 0 (t) = −aP (t),
(9.5)
die sich mittels des “ln - Tricks” ( siehe Abschnitt 5.3.3 ) integrieren lässt:
P 0 (t)
= −a
P (t)
Z
⇐⇒
⇐⇒
(ln P (τ ))0 dτ = −
Z
a dτ
ln P (t) = −at + c
P (t) = ec e−at .
⇐⇒
(9.6)
Unter der Annahme, dass P (0) = P0 gelten soll, folgt aus (9.6) ec = P0 , d.h.
P (t) = P0 e−at .
(9.7)
Man sieht, dass für die Gleichung (9.5) zunächst unendlich viele Lösungen ec e−at (c ∈ R beliebig) existieren, durch den Anfangswert P (0) = P0 wird die Konstante c bestimmt und die
Lösung eindeutig. Genauso lässt sich eine Population P beschreiben, deren Zuwachs proportional ist zur aktuellen Größe P (t) und deren Anfangswert P (0) = P0 ist:
P 0 (t) = aP (t)
⇒
(9.8)
at
P (t) = P0 e .
9.2.2 Logistisches Wachstum
Sollen Populationen beschrieben werden, so ist ein Nachteil von Gleichung (9.8), dass nicht
berücksichtigt wird, dass auch Individuen sterben. Daher wählen wir nun als Ansatz
P 0 (t) = (a − b)P (t),
176
(9.9)
9 Gewöhnliche Differentialgleichungen
wobei a die Geburtenrate und b die Sterberate ist. Dann ist
P 0 (t) = P0 e(a−b)t


a > b

exponentielles Wachstum 

was für a = b eine konstante Population

a < b eine exponentielle Abnahme

ergibt. Zur weiteren Verfeinerung des Modells hänge die Sterberate b von der Größe der Population P ab. Das einfachste Modell hierfür ist eine lineare Abhängigkeit, welche beschrieben
wird mit dem Ansatz
b(P ) = b0 + cP,
mit einer Konstanten c > 0. Hierdurch kann beispielsweise ein beschränkter Lebensraum modelliert werden, in welchem die Sterberate bei wachsender Population zunimmt. Dann wird die
Differentialgleichung (9.9) zu
P 0 (t) = (a − b0 − cP (t))P (t)
was durch Ausklammern von c zu
P 0 (t) = c(K − P (t))P (t)
(9.10)
0
wird. Die DGL (9.10) heißt logistische Differentialgleichung. Bevor wir diese
mit K = a−b
c
Gleichung lösen, können wir den Verlauf möglicher Lösungen bereits qualitativ beschreiben:
i) P (t) ≡ 0 ist eine Lösung, da dann P 0 (t) = 0 gilt und Gleichung (9.10) erfüllt ist.
ii) P (t) ≡ K ist eine Lösung, da dann P 0 (t) = 0 und (K − P (t)) = 0 gilt, so dass Gleichung
(9.10) wiederum erfüllt ist.
iii) Für Werte P (t) mit 0 < P (t) < K folgt aus (9.10) dass die Ableitung positiv ist,
P 0 (t) > 0, d.h. die Population wächst. Für Werte P (t) > K folgt aus (9.10) hingegen,
dass die Ableitung negativ ist, P 0 (t) < 0, d.h. die Population schrumpft.
K heißt daher Kapazität des Lebensraums der Population. Zu Anfangswerten P0 > K und
0 < P̃0 < K haben Lösungskurven einen qualitativen Verlauf wie in Abbildung 9.1.
Nun lösen wir Gleichung (9.10) explizit. Es sei P (t) 6= 0, P (t) 6= K, dann ist (9.10) äquivalent
zu
P 0 (t)
=c
(K − P (t))P (t)
(9.11)
Schritt 1: Integration der Gleichung
Wir führen eine Partialbruchzerlegung durch, um den Bruch in eine Summe aufzuspalten. Mit
1
1
=
(K − P )P
K
1
1
+
P
K −P
177
9 Gewöhnliche Differentialgleichungen
P0 P (t)
K
P̃0
t
Abbildung 9.1: Qualitativer Verlauf der Lösungskurven für P0 > K und P̃0 < K.
erhalten wir aus (9.11)
P 0 (t)
P 0 (t)
+
= cK
P (t)
(K − P (t))
⇐⇒ (ln P (t))0 − (ln(K − P (t)))0 = cK
⇐⇒
⇐⇒
⇐⇒
| “ln-Trick” anwenden
| integrieren
ln(P (t)) − ln(K − P (t)) = cKt + c1
ln(
P (t)
) = cKt + c1
K − P (t)
P (t)
= ecKt |{z}
ec1 .
K − P (t)
=:c
a
| ln(a) − ln(b) = ln( )
b
| e-Funktion anwenden
0
Da die Integrationskonstante c1 in der Form ec1 auftritt führen wir hier c0 = ec1 als neue
Konstante ein. Auflösen nach P (t) ergibt
P (t) = c0 ecKt (K − P (t))
= c0 KecKt − c0 ecKt P (t)
⇐⇒
⇐⇒
(1 + c0 ecKt )P (t) = c0 KecKt
c0 Keckt
c0 ecKt + 1
K
=
1 −cKt .
1 + c0 e
P (t) =
(9.12)
Schritt 2: Bestimmen der Integrationskonstanten
In Schritt 1 haben wir eine Funktion P (t) errechnet, welche die logistische DGL (9.10) löst.
Allerdings ist diese Lösung noch nicht eindeutig, sondern ernhält die Integrationskonstante c0 .
Diese bestimmen wir jetzt wieder zu einem Anfangswert P (0) = P0 . Hierzu setzen wir in der
178
9 Gewöhnliche Differentialgleichungen
allgemeinen Lösung (9.12) t = 0 ein und erhalten zu einem Anfangswert P0 :
K
1 + c10
K
1
=
⇐⇒ 1 +
c0
P0
1
K
K − P0
⇐⇒
=
−1=
.
c0
P0
P0
P0 =
Setzen wir dies für den Faktor
1
c0
in (9.12) ein, so erhalten wir als Lösung die Funktion
P (t) =
K
1+
K−P0 −cKt
P0 e
,
(9.13)
deren Verlauf in Abbildung 9.1 dargestellt ist.
Interpretation der Lösung
Man sieht in (9.13), dass sich die Größe der Population langfristig der Kapazitätsgrenze K
0 −cKt
nähert, da lim K−P
= 0 und daher
P0 e
t→∞
lim P (t) = K,
t→∞
unabhängig von P0 > K oder 0 < P0 < K gilt. Dieses bestätigt das asymptotische Verhalten,
das wir aufgrund des qualitativen Verlaufs der Lösungen in Abbildung 9.1 bereits vermutet
hatten.
Explosives Wachstum
Betrachten wir nun ein verändertes Modell mit konstanter Sterberate b und einer Geburtenrate,
welche proportional zur Populationsgröße wächst,
a = d P (t),
mit Propotionalitätsfaktor d > 0. Dieses ist z.B. ein Modell für Populationen geringer Dichte,
in denen nicht die Sterbe- sondern die Geburtenrate mit der Größe der Population zunimmt.
Es ist dann
P 0 (t) = (dP (t) − b)P (t)
= d(P (t) − S)P (t)
(9.14)
mit einem Parameter S = db , welcher die Bedeutung eines “Schwellenwertes” hat: Ist P (t) > S,
so ist P 0 (t) > 0 und die Population wird wachsen. Ist P (t) < S, so ist P 0 (t) < 0 und die
Population wird weiter schrumpfen. Wir können Gleichung (9.14) umformen zu
P 0 (t) = −d(S − P (t))P (t)
179
9 Gewöhnliche Differentialgleichungen
und erhalten die selbe Struktur wie in Gleichung (9.10) mit K = S und c = −d. Die Lösung
von Gleichung (9.13) kann man also genau wie oben in Schritt 1 und Schritt 2 ausgeführt
berechnen und erhält
P (t) =
S
1+
S−P0 dSt
P0 e
.
(9.15)
Diese Lösung ähnelt (9.13) stark, hat aber ein anderes asymptotisches Verhalten, welches
vom veränderten Vorzeichen des Argumentes der e - Funktion im Nenner in Gleichung (9.15)
herrührt. Es muss unterschieden werden zwischen Anfangswerten P0 < S und P0 > S.
P0 < S: Es ist
S−P0
P0
> 0, so dass lim
t→∞
S−P0 dKt
P0 e
lim P (t) lim
t→∞
t→∞
= ∞. Daraus folgt für P (t)
S
→ 0.
S − P0 dSt
e
1+
P0
|
{z
→∞
}
∗
0
P0 > S: Es ist S−P
P0 < 0 so dass ein Wert t > 0 existiert, für den der Nenner aus (9.15) Null
wird. Wir berechnen t∗ durch
1+
S − P0 dSt∗
e
=0
P0
P0
P0
=
S − P0
P0 − S
P
0
)
dSt∗ = ln(
P0 − S
1
P0
t∗ =
ln(
).
dS
P0 − S
∗
edSt = −1 ·
⇐⇒
⇐⇒
⇐⇒
Da für dieses t∗ gilt, dass lim∗ (1 +
t→t
S−P0 dSt
)
P0 e
= 0, folgt für P (t)
lim P (t) = lim∗
t→t∗
t→t
S
1+
S−P0 dSt
P0 e
= ∞.
Ist der Anfangswert P0 größer als der Schwellenwert S, so wird in diesem Modell die Population
explosionsartig wachsen, indem sie zu einem endlichen Zeitpunkt gegen unendlich strebt, siehe
hierzu Abb. 9.2.
Die logistische Differentialgleichung ist wichtig in der Biologie, sie beschreibt beispielsweise
die Vermehrung von Bakterien in einer Nährlösung oder auch chemische Reaktionen.
9.2 Beispiel Ein anderes Beispiel einer Differentialgleichung, die wir mithilfe des “ln-Tricks”
und direkter Integration lösen können, ist die Gleichung
u0 = −
u
,
1+u
180
(9.16)
9 Gewöhnliche Differentialgleichungen
P (t)
P0
S
P0
t
t∗
Abbildung 9.2: Qualitativer Verlauf der Lösungskurven der Gleichung (9.14)
welche ein Spezialfall der Michaelis-Mentengleichung
u0 = −
Vu
Km + u
ist. Hier bezeichnet V die maximale Reaktionsgeschwindigkeit, Km ist die Michaeliskonstante
und u(t) die Substratkonzentration bei einer enzymatischer Reaktion. Wir lösen (9.16) durch
u0
⇐⇒
⇐⇒
1+u
= −1
u
u0
+ u0 = −1
u
ln u + u = −t,
(9.17)
d.h. die Michaelis-Menten Gleichung kann, wie die logistische Differentialgleichung (9.10), integriert werden, aber das Ergebnis (9.17) kann nicht nach u aufgelöst werden. Man erhält also
keine explizite Darstellung einer Lösung u(t).
9.2.3 Trennung der Variablen
Bisher war die Funktion g immer nur von der gesuchten Funktion u(t) ( bzw. P (t) ) und nicht
explizit von t abhängig und wir konnten die Gleichungen direkt integrieren. Lassen wir nun
für die rechte Seite in Gleichung (9.1) Funktionen der Form g(t, u) = a(t)f (u) zu, so können
wir diesen Lösungsansatz weiterentwickeln, die Methode heißt “Trennung der Variablen”. (Es
kommt darauf an, dass g(t, u) ein Produkt ist eines Termes der nur die Variable t enthält und
eines Termes, der nur die Variable u enthält.) Die Differentialgleichung hat nun die Form
du
= a(t)f (u)
dt
181
(9.18)
9 Gewöhnliche Differentialgleichungen
und wir betrachten du
dt als Bruch und bringen (formal) alle Terme mit u auf die linke Seite der
Gleichung und alle Terme mit t auf die rechte Seite. Dann wird (9.18) zu
du
= a(t)dt,
f (u)
wobei f nun als Funktion einer Variablen u angesehen wird. Durch Integration erhalten wir
Z
1
du =
f (u)
Z
a(t)dt.
(9.19)
Sind für beide Integrale Stammfunktionen bekannt, so kann die Differentialgleichung (9.18)
gelöst werden, indem man in (9.19) - wenn möglich - nach der gesuchten Funktion auflöst. Die
Integrationskonstante c kann man bestimmen, wenn ein Anfangswert u(t0 ) = u0 gegeben ist.
d
9.3 Bemerkung Selbstverständlich darf mit den Differentiationssymbolen dt
im Allgemeinen
nicht wie mit Brüchen gerechnet werden. Hier erhält man aber auf diese Weise eine einfache
Merkregel für die Methode der “Trennung der Variablen”. Auf einen Beweis verzichten wir.
9.4 Beispiel Wir betrachten die Gleichung
du(t)
= t (u(t))2 ,
dt
(9.20)
hier ist a(t) = t und f (u) = u2 . Der Lösungsansatz (9.19) führt auf
Z
1
du =
u2
Z
t dt,
was wir integrieren und nach u auflösen können:
−
⇐⇒
1
t2
=
+c
u
2
2
u=− 2
.
t + 2c
(9.21)
Sei nun als Anfangswert u(0) = a für t0 = 0 gegeben. Dann erhalten wir aus (9.21) die
Bedingung u(0) = − 1c = a, d. h. es ist c = − a1 und die Lösung von (9.20) mit Anfangswert
u(0) = a lautet
u(t) = −
t2
2
.
− a2
9.2.4 Lineare Differentialgleichungen 1.Ordnung
Ist die Funktion g in Gleichung (9.1) linear in ihrem zweiten Argument, so spricht man von
einer inhomogenen linearen Differentialgleichung 1. Ordnung. Diese hat die Form
u0 (t) + a(t)u(t) = b(t),
182
(9.22)
9 Gewöhnliche Differentialgleichungen
d.h. es ist g(t, u(t)) = b(t) − a(t)u(t). Es kommt hier nicht darauf an, dass die Funktionen a(t)
und b(t) lineare Funktionen sind, die Linearität bezieht sich allein auf das Auftreten von u
und u0 . Die Gleichung (9.22) heißt homogen, falls b(t) ≡ 0, um Verwechslungen zu vermeiden
bezeichnen wir in diesem Fall die gesuchten Lösungen mit h(t):
h0 (t) + a(t)h(t) = 0.
(9.23)
9.5 Bemerkung Zur Übung rechne man nach, dass wenn zwei Funktionen h1 (t) und h2 (t)
Lösungen der homogenen Gleichung (9.23) sind, auch deren Linearkombinationen
h(t) = c1 h1 (t) + c2 h2 (t)
Gleichung (9.23) lösen.
Lösungsmengen inhomogener linearer Differentialgleichungen sind - wie die Lösungsmengen
linearer Gleichungssysteme - von einer speziellen Struktur, wie der folgende Satz besagt.
9.6 Satz: Struktur der Lösungen
Ist u∗ (t) eine spezielle Lösung der linearen Differentialgleichung (9.22), so lässt sich jede
andere Lösung u(t) von (9.22) schreiben als
u(t) = u∗ (t) + h(t),
wobei h(t) eine Lösung der homogenen linearen Gleichung (9.23) ist.
Beweis. 1. Zunächst zeigen wir, dass für beliebige Lösungen u∗ von (9.22) und h von (9.23)
gilt, dass u∗ + h Lösung von (9.22) ist. Hierzu setzen wir (u∗ + h) in die Gleichung ein:
(u∗ (t) + h(t))0 + a(t)(u∗ (t) + h(t)) = (u∗ (t))0 + a(t)u∗ (t) + h(t) + a(t)h(t)
|
{z
=b(t)
}
|
{z
=0
}
= b(t).
Also erfüllt u∗ + h Gleichung (9.22).
2. Seien nun u, u∗ zwei Lösungen von (9.22). Dann ist
u0 (t) + a(t)u(t) = b(t)
und
(u∗ )0 (t) + a(t)u∗ (t) = b(t),
für die Differenz
(u − u∗ )0 (t) + a(t)(u − u∗ )(t) = 0,
gilt, d.h. es ist h(t) := u(t) − u∗ (t) eine Lösung der homogenen Gleichung (9.23) und u lässt
sich wie gewünscht schreiben als
u = u∗ + h.
183
9 Gewöhnliche Differentialgleichungen
Diese Struktur der Lösungen wird nun verwendet, um eine allgemeine Lösung des inhomogenen
Problems (9.22) zu finden.
Schritt 1: Lösung des homogenen Problems
Es wird zunächst das homogene Probleme (9.23) explizit gelöst und danach das inhomogene
Problem (9.22). Um (9.23) zu lösen, machen wir auf Grund der Ähnlichkeit zur Differentialgleichung (9.8), die exponentielles Wachstum beschreibt, die Annahme, dass die Lösung h(t)
vom Typ
h(t) = eϕ(t)
(9.24)
ist mit einer differenzierbaren Funktion ϕ(t). Wir setzen den Ansatz (9.24) in die Gleichung
(9.23) ein und versuchen aus der resultierenden Gleichung ϕ(t) zu bestimmen. Es ist nach der
Kettenregel
h0 (t) = ϕ0 (t)eϕ(t) ,
so dass die homogene lineare Gleichung (9.23) zu
ϕ0 (t)eϕ(t) + a(t)eϕ(t) = 0
wird. Dividieren wir nun durch eϕ(t) , so erhalten wir
ϕ0 (t) + a(t) = 0
und daraus nach Integration
ϕ(t) = −
Zt
a(τ )dτ + c̃
t0
mit einer Integrationskonstanten c̃. Diese setzen wir in den Ansatz (9.24) ein. Die gesuchte
Lösung h(t) des homogenen Problems (9.23) ist also
−
Rt
a(τ )dτ +c̃
= c e−A(t)
t0
h(t) = e
(9.25)
mit den den Abkürzungen
c̃
c := e
Zt
und
A(t) =
a(τ )dτ.
t0
Die Konstante c in der Lösung (9.25) wird durch eine Anfangsbedingung für die Differentialgleichung (9.23) bestimmt. Ist h(t0 ) = h0 , so folgt, da A(t0 ) = 0 gilt,
h(t0 ) = c e0 = c,
so dass c = h0 gewählt werden muss.
184
9 Gewöhnliche Differentialgleichungen
Schritt 2: Lösung des inhomogenen Problems
Um die inhomogene Gleichung (9.22) zu lösen, verwenden wir die Methode der “Variation der
Konstanten”. In der Lösung (9.25) für die homogene Gleichung ersetzen wir die Konstante c
durch eine Funktion c(t) und setzen
u(t) = c(t) e−A(t)
(9.26)
in die Gleichung (9.22) ein. Es ist mit der Produktregel
u0 (t) = c0 (t) e−A(t) − c(t) A0 (t) e−A(t)
= c0 (t) e−A(t) − c(t) a(t) e−A(t)
(∗) 0
= c (t) e−A(t) − a(t) f (t)
wobei A0 (t) = a(t) und in (∗) der Ansatz (9.26) für u(t) verwendet wurde. Damit wird (9.22)
zu
c0 (t)e−A(t) − a(t)u(t) + a(t)u(t) = b(t)
c0 (t) = b(t)eA(t)
⇐⇒
Zt
⇐⇒
c(t) =
b(τ )eA(τ ) dτ + c0 ,
t0
hier bezeichnet c0 die Integrationskonstante. Setzen wir dieses Ergebnis für c(t) in den Ansatz
(9.26) für u ein, so erhalten wir als Lösung
Zt
u(t) = (
b(τ )eA(τ ) dτ + c0 ) e−A(t)
t0
= c0 e
−A(t)
−A(t)
Zt
+e
b(τ )eA(τ ) dτ
(9.27)
t0
und es bleibt lediglich die Integrationskonstante c0 zu bestimmen. Für einen gegebenen Anfangswert u(t0 ) = u0 ist nach (9.27)
u(t0 ) = c0 e0 = c0
sodass c0 = u0 gewählt werden muss. Hierbei wurde wiederum
Rt0
. . . dτ = 0 verwendet. Insge-
t0
samt erhalten wir also:
9.7 Satz: Lösungsformel für lineare Differentialgleichungen
Die homogene lineare Differentialgleichung
h0 (t) + a(t)h(t) = 0
185
9 Gewöhnliche Differentialgleichungen
hat zu einem Anfangswert h(t0 ) = h0 die Lösung
h(t) = h0 e−A(t)
(9.28)
und zu jedem Anfangswert u0 ∈ R gibt es genau eine Lösung u der linearen Differentialgleichung
u0 (t) + a(t)u(t) = b(t)
mit u(t0 ) = u0 , nämlich
u(t) = u0 e
−A(t)
−A(t)
Zt
+e
eA(τ ) b(τ )dτ
(9.29)
t0
mit
Zt
A(t) =
a(τ )dτ.
t0
9.8 Bemerkung Man beachte, dass durch b(t) ≡ 0 in der Lösungsformel für das inhomogene
Problem (9.29) die Lösung (9.28) der homogenen Differentialgleichung enthalten ist. Gleichzeitig ist die Lösung des inhomogenen Problems (9.29) zum Anfangswert u0 = 0 gegeben durch
∗
−A(t)
Zt
u (t) = e
eA(τ ) b(τ )dτ,
t0
sodass die allgemeine Lösung (9.29) tatsächlich von der Struktur
u(t) = h(t) + u∗ (t)
ist, wie in Satz 9.6 behauptet.
9.9 Beispiele
a) In der physikalischen Chemie wird in der Reaktionskinetik die Geschwindigkeit chemischer
Reaktionen untersucht. Bei einer Reaktion 1. Ordnung ist die Änderung der Konzentration
eines Stoffes proportional zur Konzentration:
−
d [A]
= k[A].
dt
Wir erhalten also als Lösung
[A](t) = A0 e−kt
186
9 Gewöhnliche Differentialgleichungen
zu einem Anfangswert [A](0) = A0 . Betrachten wir nun Folgereaktionen
k
1
−→
A
k
2
−→
B
C
so werden diese beschrieben durch ein System linearer Differentialgleichungen
[A]0 (t) = −k1 [A](t)
[B]0 (t) = k1 [A](t) − k2 [B](t)
[C]0 (t) = k2 [B](t)
welche wir sukzessive lösen können, siehe Übungen.
a
b) Wir untersuchen eine Population der Größe P (t) mit zeitabhängiger Geburtenrate 1+t
und konstanter Sterberate σ, es seien die Parameter a, σ > 0. Die Differentialgleichung zu
diesem Modell lautet
P 0 (t) =
a
− σ P (t)
1+t
sodass in der Lösungsformel (9.28) für die homogene Gleichung
a
−σ
a(t) = −
1+t
zu wählen ist. Damit ist
−A(t) =
Zt a
− σ dτ
1+τ
0
= [a ln(1 + τ ) − στ ]t0
= (a ln(1 + t) − σt) − (a ln(1))
a
| ln(1) = 0
|a ln(x) = ln(xa )
= ln((1 + t) ) − σt
(9.30)
und für den Anfangswert P (0) = P0 erhalten wir die Lösung
a −σt
P (t) = P0 eln(1+t)
= P0 (1 + t)a e−σt .
(9.31)
c) Erweitern wir nun das Modell für die Population um einen Term, der eine konstante
Zuwanderungsrate z beschreibt, dann erhalten wir die Gleichung
0
P (t) =
a
− σ P (t) + z
1+t
welche vom Typ der linearen Differentialgleichung (9.22) ist mit
a(t) = −
a
−σ
1+t
b(t) = z.
187
(9.32)
9 Gewöhnliche Differentialgleichungen
Daher können wir eine Lösung von (9.32) mit der Formel (9.27) berechnen. Es ist A(t) wie
in (9.30), so dass wiederrum
e−A(t) = (1 + t)a · e−σt
und
eA(t) = (1 + t)−a · eσt
ist. Bleibt also das Integral
Rt
0
b(τ )eA(τ ) dτ zu bestimmen:
Zt
b(τ )e
A(τ )
Zt
dτ =
0
z(1 + τ )−a eστ dτ.
0
Dieses Integral können wir nicht explizit integrieren, wir lassen es stehen und erhalten als
Lösung von (9.32) mit Anfangswert P (0) = P0
a −σt
P (t) = P0 (1 + t) e
a −σt
+ (1 + t) e
Zt
z
(1 + τ )−a eστ dτ.
(9.33)
0
d) Bei Populationsmodellen interessiert man sich häufig für die langfristige Entwicklung. In
dem Modell ohne Zuwanderung erhalten wir aus (9.31)
lim P (t) = lim P0 (1 + t)a e−σt
t→∞
t→∞
= lim
t→∞
P0 (1 + t)a
eσt
= 0,
da die Exponentialfunktion stärker wächst als jede Potenz. Dass die Population ausstirbt,
war aufgrund der zeitlich abnehmenden Geburtenrate auch zu erwarten. Um eine Vorhersage für das Modell (9.32) mit konstanter Zuwanderung z zu machen, betrachten wir
die Lösung (9.33). Hier konvergiert der erste Summand wie gerade gesehen gegen 0, den
zweiten können wir umformen zu dem Quotienten
z
u(t)
=
v(t)
Rt
+ τ )−a eστ dτ
,
(1 + t)−a eσt
0 (1
auf den wir wegen lim u(t) = ∞ und lim v(t) = ∞ die Regel von de l’Hospital anwenden
t→∞
t→∞
können. Die Ableitung von u(t) ist der Wert des Integranden an der oberen Integrationsgrenze
u0 (t) = z(1 + t)−a eσt
und mit der Produktregel ist
v 0 (t) = −a(1 + t)−a−1 eσt + (1 + t)−a σeσt
= (1 + t)−a eσt −a(1 + t)−1 + σ .
188
9 Gewöhnliche Differentialgleichungen
Es ist also
u0 (t)
t→∞ v 0 (t)
lim P (t) = lim
t→∞
z(1 + t)−a eσt
= lim
−a
(1 + t)−a eσt 1+t
+σ
z
z
= .
= lim
t→∞ − a + σ
σ
1+t
t→∞
Im Modell mit abnehmender Geburtenrate und konstanter Zuwanderung konvergiert die
Größe der Population also gegen den Quotienten aus Zuwanderung und Sterberate.
9.2.5 Richtungsfelder
Eine Differentialgleichung 1.Ordnung mit rechter Seite g, aufgefasst als Funktion von t und u,
u0 = g(t, u)
(9.34)
kann auch verstanden werden als Gleichung, die zu möglichen Wertepaaren (u, t), bei unbekannter Lösung u(t), die Steigung u0 (t) angibt, indem g(t, u) berechnet wird. D. h. wir können
- ohne die Gleichung (9.34) gelöst zu haben - in der (u, t)- Ebene in jedem beliebigen Punkt
die Steigung einer Lösung u(t) skizzieren, die durch den Punkt verläuft, ohne die Lösung u(t)
selbst zu kennen.
9.10 Beispiele
a) Betrachten wir die Michaelis-Menten Gleichung (9.16), die sich nicht explizit lösen ließ.
u
Aus u0 = − 1+u
können wir zu verschiedenen u die Steigung einer Lösung u0 (t) berechnen:
u = 0 ⇒ u0 = 0,
1
1
⇒ u0 = − ,
2
3
1
0
u=1 ⇒ u =− ,
2
u=
2
3
3
0
u =3 ⇒ u = − ,
4
4
0
u =4 ⇒ u = − .
5
u =2 ⇒ u0 = −
In der Michaelis-Menten Gleichung ist u0 stets unabhängig von t, es ist also für jede Lösungskurve, die den Wert 1 annimmt, dort die Steigung − 12 etc. Dieses können wir durch
kleine Tangentenstücke in der (u, t)-Ebene veranschaulichen, siehe Abb. 9.3. Eine Lösung
der Michaelis-Menten Gleichung muss einen solchen Verlauf haben, dass die Tangentenstücke aus Abbildung 9.3 stets die Steigung der Lösungskurve angeben. Die Funktion muss
sich also in das Richtungsfeld aus Abbildung 9.3 einfügen, ohne die Tangenten zu schneiden. Auf diese Weise kann man zu verschiedenen Anfangswerten u(0) = u0 Lösungskurven
skizzieren, ohne die Gleichung selbst zu lösen.
b) Auch die qualitativen Überlegungen zur Lösung der logistischen Differentialgleichung (9.10)
lassen sich in einem Richtungsfeld darstellen.
c) In einigen Fällen lässt sich aus dem Richtungsfeld die Lösung u(t) der Differentialgleichung
189
9 Gewöhnliche Differentialgleichungen
u(t)
5
4
3
2
1
t
1
2
3
4
5
Abbildung 9.3: Richtungsfeld der Michaelis-Menten Gleichung
P (t)
K
t
Abbildung 9.4: Richtungsfeld einer logistischen Differentialgleichung
190
9 Gewöhnliche Differentialgleichungen
explizit erraten. Hierzu untersuchen wir als Beispiel die Differentialgleichung
t
u0 (t) = − .
u
(9.35)
Die Tangenten im Richtungsfeld sind nun nicht nur von u, sondern auch von t abhängig.
Wir können leicht erkennen, dass
t = 0 ⇒ u0 =0
für alle u ∈ R,
0
u = 0 ⇒ u =∞ für alle t ∈ R,
u=t
⇒ u0 = − 1,
u = −t ⇒ u0 =1.
Tragen wir diese Steigungen in der (u, t)-Ebene ein, so erhalten wir
u(t)
t
Abbildung 9.5: Richtungsfeld der DGL u0 = − ut .
weswegen wir vermuten, dass die Lösungskurven von (9.35) Kreise um den Nullpunkt sind.
Die gesuchte Lösung u(t) hätte demnach die Form
u(t) =
p
R2 − t2 ,
(9.36)
da wegen u(t)2 + t2 = R2 der Graph dieser Funktion ein Halbkreis mit Radius R ist. Um
zu prüfen, ob (9.36) auch der Differentialgleichung (9.35) genügt, berechnen wir u0 (t) (mit
der Kettenregel) und erhalten
u0 (t)
=
(9.36)
=
1
√
· (−2t)
2 R 2 − t2
t
−
.
u(t)
Wir haben also durch Auswerten des Richtungsfeldes die Differentialgleichung (9.35) gelöst
9.11 Bemerkung Ebenfalls lösen lässt sich (9.35) durch die Methode der Trennung der Va-
191
9 Gewöhnliche Differentialgleichungen
riablen. Es wird aus (9.19) und (9.35)
udu = −tdt
u2
t2
=− +c
2
p2
=⇒ u = 2c − t2 .
⇐⇒
Die Konstante 2c lässt sich durch einen Anfangswert bestimmen. Für einen Kreis vom Radius
R ist u(0) = R, daher ist
√
u(0) = 2c = R,
sodass 2c = R2 folgt und wir (9.36) erhalten.
9.2.6 Stationäre Punkte
Hat eine Differentialgleichung 1.Ordnung die Form u0 (t) = g(u(t)), d.h. hängt g nicht explizit von t ab, so sind konstante Funktionen u(t) ≡ ū, für die g(ū) = 0 gilt, Lösungen der
Differentialgleichung, da für konstante Lösungen u(t) immer u0 (t) = 0 gilt.
9.12 Definition: Stationärer Punkt
Ein ū ∈ R mit g(ū) = 0 heißt stationärer Punkt der Differentialgleichung u0 (t) = g(u(t)).
9.13 Beispiele
a) Die logistische Differentialgleichung u0 (t) = c(K − u(t))u(t) hat die stationären Punkte
ū1 = 0 und
ū2 = K.
b) Die homogene lineare Differentialgleichung u0 (t) = a u(t), in der a konstant ist, hat den
stationären Punkt
ū = 0.
c) Die lineare Differentialgleichung u0 (t) = a u(t) + b, in der a und b konstant sind, hat den
stationären Punkt
b
ū = − .
a
9.14 Bemerkungen
a) Im Richtungsfeld einer Differentialgleichung, siehe Abb.b) erkennt man stationäre Punkte daran, dass die Tangenten auf der Parallelen zur x-Achse waagerecht verlaufen:
b) Da sich Lösungskurven nicht schneiden können, bleiben Lösungen zu Anfangswerten u0
192
9 Gewöhnliche Differentialgleichungen
mit
u0 > ū immer größer als ū
u0 < ū immer kleiner als ū.
Interessant ist nun zu wissen, wie sich Lösungen in der Nähe von stationären Punkten verhalten.
Nähern sie sich diesen an, oder entfernen sie sich?
9.15 Definition: Stabilität stationärer Punkte
Ein stationärer Punkt ū einer Differentialgleichung u0 = g(u) mit Anfangswert u0 “in der
Nähe ” von ū heißt
i) stabil, wenn die Lösung zu u0 “in der Nähe” von ū bleibt.
ii) anziehend stabil, wenn für die Lösung zu u0
lim u(t) = ū
t→∞
gilt.
iii) instabil, wenn ū nicht stabil ist.
Wenden wir uns nun wieder den Beispielen 9.13 zu.
9.16 Beispiele
a) Im Richtungsfeld der logistischen Differentialgleichung sieht man, dass ū = K anziehend
stabil ist und ū = 0 instabil.
b) Die Lösungen der homogenen linearen Differentialgleichung sind u(t) = u0 eat . Daher gilt
für den stationären Punkt ū = 0
i) falls a < 0, ist lim u0 eat = 0, d.h. ū = 0 ist anziehend stabil.
t→∞
ii) falls a > 0, ist lim u0 eat = ∞, d.h. ū = 0 ist instabil.
t→∞
iii) falls a = 0, ist jeder Punkt ū ∈ R stationärer Punkt. Da alle Funktionen ū ≡ const
Lösungen der Differentialgleichung sind, sind die ū stabil, aber nicht anziehened stabil.
c) Der stationäre Punkt ū = − ab der linearen Differentialgleichung u0 = au + b ist für
a<0
anziehend stabil,
a>0
instabil,
wie man aus der Lösung u(t) = u0 + ab eat −
tialgleichung keine stationären Punkte.
193
b
a
ersieht. Im Falle a = 0 hat die Differen-
9 Gewöhnliche Differentialgleichungen
Aus diesen Ergebnissen für lineare Differentialgleichung lassen sich auch Aussagen für nichtlineare Differentialgleichungen ableiten. Angenommen in
u0 (t) = g(u)
(9.37)
sei g(u) differenzierbar als Funktion von u. Dann kann die nichtlineare rechte Seite durch eine
lineare Funktion approximiert werden,
l(u) = g(a) + g 0 (a)(u − a)
(9.38)
beschreibt eine Tangente an g im Punkt a mit Steigung g 0 (a). In der Nähe von a beschreibt
l(u) das Verhalten von g(u), sofern g(u) “glatt” ist, d.h. keine Sprünge oder Knicke hat. Sei
nun ū ein stationärer Punkt von g, d.h. g(ū) = 0, so ersetzen wir in der Gleichung (9.37) die
Funktion g(u) durch die Approximation (9.38) und erhalten als neue Differentialgleichung
ũ0 (t) = g(ū) + g 0 (ū)(ũ − ū)
= g 0 (ū)(ũ − ū),
(9.39)
da g(ū) = 0 ist. Die Differentialgleichung (9.39) hat ebenfalls ū als stationären Punkt und ist
linear, d.h. wir können die Ergbenisse aus Beispiel c) übertragen, da sich die Lösungen von
(9.37) in der Nähe des stationären Punktes so verhalten wie die Lösungen von (9.39).
9.17 Satz: Stabilität stationärer Punkte
Ein stationärer Punkt ū einer Differentialgleichung u0 (t) = g(u) ist
anziehend stabil, wenn g 0 (ū) < 0,
instabil, wenn g 0 (ū) > 0.
Für g 0 (ū) = 0 ist keine Aussage möglich.
9.18 Beispiel Wir betrachten wieder die logistische Differentialgleichung u0 = c(K −u)u, dann
ist
g(u) = c(K − u)u
= cKu − cu2
und
g 0 (u) = cK − c2u.
Dann gilt für die stationären Punkte
ū1 = 0: Es ist g 0 (ū1 ) = g 0 (0) = cK > 0, d.h. ū1 = 0 ist instabil;
ū2 = K: Es ist g 0 (ū2 ) = g 0 (K) = −cK < 0, d.h. ū2 = K ist anziehend stabil.
194
9 Gewöhnliche Differentialgleichungen
9.3 Lineare Differentialgleichungen 2.Ordnung
9.3.1 Beispiel: Der harmonische Oszillator
Wir betrachten lineare Differentialgleichungen von 2.Ordnung mit konstanten Koeffizienten.
Ein Beispiel hierfür ist die Bewegung eines Massenpunktes mit Masse m, der an einer
Spiralfeder aufgehängt ist und sich entlang der vertikalen y-Achse bewegt. Seine Bewegung
wird beschrieben durch die Differentialgleichung
mÿ = −ky(t),
(9.40)
wobei k > 0 die Federkonstante
ist. Lösungen von (9.40) sind y1 (t) = cos(ωt) und y2 (t) =
q
k
sin(ωt), wobei ω =
m gesetzt wird. Da (9.40) eine lineare Gleichung ist, sind auch alle
Linearkombinationen von y1 und y2 Lösungen dieser Gleichung, sodass
y(t) = c1 cos(ωt) + c2 sin(ωt)
(9.41)
für c1 , c2 ∈ R die Differentialgleichung (9.40) löst. Die Linearfaktoren c1 , c2 ∈ R können eindeutig bestimmt werden, wenn zwei Anfangsbedingungen durch y(0) = y0 und y 0 (0) = y00 gegeben
sind. Setzt man t = 0 in (9.41) und in die Ableitung dieser Funktion ein, so erhält man
y(0) = c1
⇒ c1 = y0
y 0 (0) = c2 ω
⇒ c2 =
y00
,
ω
so dass die Lösung von (9.40) zu Anfangswerten y0 , y00 lautet:
y(t) = y0 cos(ωt) +
y00
sin(ωt).
ω
Es ist also ω die Kreisfrequenz der harmonischen Schwingung.
9.3.2 Lösung der linearen Differentialgleichung 2.Ordnung
Es soll eine Lösung der allgemeinen homogenen linearen Differentialgleichung 2.Ordnung mit
konstanten Koeffizienten
y 00 (t) + ay 0 (t) + by(t) = 0
(9.42)
hergeleitet werden. Hierfür wählen wir einen Exponentialansatz für die Funktion y(t)
y(t) = eλt
(9.43)
für ein λ ∈ R. Für die Ableitungen folgt dann y 0 (t) = λeλt und y 00 (t) = λ2 eλt . Setzen wir diese
in (9.42) ein, erhalten wir
λ2 eλt + aλeλt + beλt = 0
195
9 Gewöhnliche Differentialgleichungen
und nachdem wir durch eλt teilen
λ2 + aλ + b = 0
was eine quadratische Gleichung für λ ist.
9.19 Definition: Charakteristisches Polynom
Das Polynom
p(λ) = λ2 + aλ + b
(9.44)
heißt charakteristisches Polynom der Differentialgleichung (9.42).
q
2
a
Ist λ = − a2 ±
− b eine Nullstelle des charakteristischen Polynoms p(λ), so ist eλt eine
2
Lösung der Differentialgleichung
(9.42). Um die allgemeine Lösung
von (9.42) genau angeben
2
2
2
zu können, müssen die Fälle a2 − b > 0, a2 − b = 0 und a2 − b < 0 unterschieden werden:
1. Fall: Zwei reelle Nullstellen
Ist
a 2
2
− b > 0, so sind
a
λ1 = − +
2
s 2
a
2
a
λ2 = − −
2
− b,
s a 2
2
−b
(9.45)
zwei verschiedene reelle Nullstellen. Es sind
y1 (t) = eλ1 t ,
y2 (t) = eλ2 t
Lösungen von (9.42) und wegen der Linearität der Gleichung sind auch alle Linearkombinationen
y(t) = c1 eλ1 t + c2 eλ2 t
von y1 (t) und y2 (t) mit c1 , c2 ∈ R Lösungen. (Bemerkung: falls a > 0 ist, folgt λ1 < 0 und
λ2 < 0. Was lässt sich in diesem Fall über das aymptotische Verhalten der Lösungen sagen?)
2. Fall: Genau eine reelle Nullstelle
Ist
a 2
2
− b = 0 so hat das charakteristische Polynom p(λ)
λ=−
a
2
als einzige Lösung, weshalb
a
y1 (t) = e− 2 t
196
(9.46)
9 Gewöhnliche Differentialgleichungen
Lösung
von (9.42) ist. Darüber hinaus kann man durch Nachrechnen zeigen, dass im Falle
a 2
−
b
=0
2
a
y2 (t) = te− 2 t
ebenfalls (9.42) löst, sodass die allgemeine Lösung gegeben ist durch
a
a
y(t) = c1 e− 2 t + c2 te− 2 t
mit c1 , c2 ∈ R.
3. Fall: Zwei komplexwertige Nullstellen
2
Ist a2 − b < 0, so hat das charakteristische Polynom (9.44) die beiden komplex konjugierten
Nullstellen
s
a
λ1 = − + i b −
2
welche mit α := − a2 und β :=
q
b−
s
2
a
2
a 2
2
a
λ2 = − − i b −
2
,
2
a
2
(9.47)
als
λ2 = α − iβ
λ1 = α + iβ
geschrieben werden können. Also sind
y1 (t) = eλ1 t = e(α+iβ)t
= eαt eiβt = eαt (cos(βt) + i sin(βt))
und
y2 (t) = eλ2 t = e(α−iβ)t = e(αt) ei(−βt)
= eαt (cos(−βt) + i sin(−βt)) = eαt (cos(βt) − i sin(βt))
Lösungen von (9.42), daher auch alle Linearkombinationen
y(t) = c1 y1 (t) + c2 y2 (t)
für c1 , c2 ∈ C. Nun interessieren uns reellwertige Lösungen. Eine spezielle reellwertige Lösung
erhalten wir für c˜1 , c˜2 = 12 durch
1
1
ỹ(t) = eαt (cos(βt) + i sin(βt)) + eαt (cos(βt) − i sin(βt))
2
2
= eαt cos(βt)
und eine weitere für cˆ1 =
1
2i , cˆ2
1
= − 2i
durch
1
1 αt
e (cos(βt) + i sin(βt)) − eαt (cos(βt) − i sin(βt))
2i
2i
= eαt sin(βt).
ŷ(t) =
197
9 Gewöhnliche Differentialgleichungen
Wegen der Linearität der Gleichung (9.42) sind nicht nur ỹ und ŷ reellwertige Lösungen sondern
auch alle Linearkombinationen mit reellen Linearfaktoren c1 , c2 :
y(t) = c1 ỹ(t) + c2 ŷ(t)
= eαt (c1 cos(βt) + c2 sin(βt))
ist die allgemeine reellwertige Lösung von (9.42) und die c1 , c2 ∈ R werden aus den reellen
Anfangswerten bestimmt.
9.20 Satz: Lösungen der linearen DGL 2. Ordnung
Sei
y 00 + ay 0 + by = 0
(9.48)
eine homogene lineare Differentialgleichung mit konstanten Koeffizienten a, b ∈ R. Dann
ist die allgemeine reellwertige Lösung im Falle von
i)
a 2
2
− b > 0 durch
y(t) = c1 eλ1 t + c2 eλ2 t
mit λ1 = − a2 +
ii)
a 2
2
q
a 2
2
− b und λ2 = − a2 −
q
a 2
2
(9.49)
− b,
− b = 0 durch
y(t) = eλt (c1 + c2 t)
(9.50)
y(t) = eαt (c1 cos(βt) + c2 sin(βt))
(9.51)
mit λ = − a2 ,
iii)
a 2
2
− b < 0 durch
mit α = − a2 und β =
q
b−
a 2
2
gegeben, mit Konstanten c1 , c2 ∈ R.
9.21 Beispiel In der Physik wird die lineare gedämpfte Schwingung beschrieben durch die
Differentialgleichung
my 00 (t) + dy 0 (t) + ky(t) = 0,
in welcher m für die Masse steht, d für die Dämpfung und k für die Federkonstante. Teilen wir
d
k
und b = m
. Da für die
diese Gleichung durch m, so erhalten wir Gleichung (9.42) mit a = m
physikalischen Parameter d ≥ 0 und m, k > 0 gilt, ist also auch a ≥ 0 und b > 0. Die drei oben
unterschiedenen Fälle beschreiben nun unterschiedlich stark gedämpfte Schwingungen:
198
9 Gewöhnliche Differentialgleichungen
1. Fall: Starke Dämpfung oder auch Kriechfall
Im Fall ( a2 )2 − b > 0 sind für a, b > 0 die beiden reellen Nullstellen negativ, vergleiche hierzu
(9.45). Daher ist die Lösung stets eine Linearkombination zweier abfallender e - Funktionen.
Betrachten wir
y 00 (t) + 3y 0 (t) + 2y(t) = 0,
(9.52)
so ist a = 3 und b = 2 so dass ( a2 )2 − b = ( 32 )2 − 2 = 41 > 0 gilt. Die allgemeine Lösung ist nach
Satz 9.20 i) gegeben durch (9.49) wobei λ1 , λ2 die Nullstellen des charakteristischen Polynoms
p(λ) = λ2 + 3λ + 2 sind, d. h. es ist λ1 = −1 und λ2 = −2. Setzen wir diese Werte ein, so
erhalten wir
y(t) = c1 e−t + c2 e−2t .
(9.53)
Um die Linearfaktoren c1 , c2 zu bestimmen benötigen wir Anfangswerte, welche beispielsweise
durch
y(0) = 2 und y 0 (0) = 0
gegeben seien. Berechnen wir die Ableitung von (9.53), so erhalten wir y 0 (t) = c1 λ1 eλ1 t +
c2 λ2 eλ2 t , was für t = 0 ausgewertet y 0 (0) = c1 λ1 + c2 λ2 ergibt. Gemeinsam mit der Anfangsbedingung für y welche durch Einsetzen in (9.53) y(0) = c1 + c2 = 2 ergibt, erhalten wir ein
lineares Gleichungssystem
c1 + c2 = 2
−c1 − 2c2 = 0
woraus wir c1 = 4 und c2 = −2 berechnen. Die Lösung der Gleichung (9.52) zu den gewählten
Anfangswerten lautet also
y(t) = 4e−t − 2e−2t ,
welche in Abb. 9.6 dargestellt ist. Man sieht, dass es zu keiner Schwingung kommt, das System
konvergiert gegen die Ruhelage bei y = 0.
2.Fall: Aperiodischer Grenzfall
Im Fall ( a2 )2 − b = 0 erhält man für a > 0 nach (9.46) genau eine negative Nullstelle des
charakteristischen Polynoms, λ = − a2 < 0. Betrachten wir als Beispiel
y 00 (t) + 2y(t) + y(t) = 0,
so ist a = 2 und b = 1 so dass ( a2 )2 − b = 0 gilt. Die allgemeine Lösung ist dann nach Satz 9.20
ii) mit λ = − a2 = −1 gegeben durch
y(t) = e−t (c1 + c2 t).
Die Linearfaktoren c1 , c2 können nun aus Anfangsbedingungen berechnet werden. Seien
y(0) = 2 und
199
y 0 (0) = −4
(9.54)
9 Gewöhnliche Differentialgleichungen
gegeben. Es folgt mit t = 0 in (9.54) dass y(0) = c1 , also c1 = 2 zu wählen ist. Um die
Anfangsbedingung für y 0 nutzen zu können leiten wir (9.54) ab und erhalten
y 0 (t) = (c2 − c1 )e−t − c2 te−t .
Setzen wir hier wiederum t = 0 ein, ergibt sich y 0 (0) = c2 − c1 , woraus folgt dass c2 = −2 ist.
Die Lösung zu den gegebenen Anfangsbedingungen lautet also
y(t) = e−t (2 − 2t)
und ist dargestellt in Abb. 9.7. Durch Nachrechnen sieht man, dass die Lösung in diesem
aperiodischen Grenzfall immer genau eine Nullstelle t∗ hat, es ist stets t∗ > 0, und genau ein
Minimum. Daher kommt es auch in diesem Fall nicht zu einer Schwingung, sondern das System
hat genau einen Nulldurchgang und konvergiert dann gegen die Ruhelage.
3. Fall: Schwingfall
Im Fall ( a2 )2 − b < 0 hat das charakteristische Polynom nach (9.47) genau zwei konjugiert
komplexe Nullstellen. Sei
y 00 (t) + y 0 (t) + 3y(t) = 0,
(9.55)
so ist a = 1 und b = 3, so dass ( a2 )2 − b = ( 21 )2 − 3 < 0 gilt. Die allgemeine Lösung ist
nach Satz 9.20 iii) gegeben durch (9.51) wobei α, β Real- und Imaginärteil der (komplexwertigen) Nullstellen des charakteristischen Polynoms sind, d. h. es ist α = − a2 = − 12 und
β=
q
b − ( a2 )2 =
q
3 − ( 12 )2 =
√
11
2 .
Setzen wir diese Werte ein in (9.51), so erhalten wir
√
11
11
t) + c2 sin(
t)).
(c1 cos(
2
2
√
− 21 t
y(t) = e
(9.56)
Um die Linearfaktoren c1 , c2 zu bestimmen benötigen wir Anfangswerte, welche beispielsweise
durch
y(0) = 2 und y 0 (0) = 0
gegeben seien. Zunächst folgt aus (9.56) mit t = 0 eingesetzt, dass y(0) = c1 , was c1 = 2
bedeutet. Berechnen wir die Ableitung der allgemeinen Lösung (9.51), so erhalten wir für
t=0
y 0 (0) = α c1 + β c2 .
Wenn wir nun noch t = 0 in (9.51) einsetzen erhalten wir mit den Werten dieses Beispiels das
c2 =
y 0 (0) − αc1
=
β
1
22
√
11
2
2
=√ .
11
Die Lösung der Gleichung (9.55) zu den gewählten Anfangswerten lautet also
√
√
11
2
11
− 12 t
y(t) = e
(2 cos(
t) + √ sin(
t)),
2
2
11
welche in Abb. 9.8 dargestellt ist.
200
9 Gewöhnliche Differentialgleichungen
9.22 Satz: Lösungen der inhomogenen linearen DGL 2. Ordnung
Sei
y 00 + ay 0 + by = c
(9.57)
die Gleichung aus Satz 9.20, nur ergänzt um eine konstante rechte Seite c ∈ R. Dann ist
die konstante Funktion
y ∗ (t) =
c
b
eine spezielle Lösung von (9.57) und die allgemeine Lösung von ist gegeben durch die
Summe aus der allgemeinen Lösung yh (t) der homogenen Gleichung (9.48) und y ∗ :
y(t) = yh (t) + y ∗ (t),
Beweis. Übung.
R
R
Abbildung 9.6: starke Dämpfung: y(t) = 4e−t − 2e−2t .
R
R
Abbildung 9.7: Aperiodischer Grenzfall y(t) = e−t (2 − 2t)
201
9 Gewöhnliche Differentialgleichungen
R
R
Abbildung 9.8: Gedämpfte Schwingung
9.4 Systeme von Differentialgleichungen
9.4.1 Lineare Systeme 1.Ordnung mit konstanten Koeffizienten
Wir betrachten ein System mit zwei unbekannten Größen u1 (t), u2 (t). Über die beiden Differentialgleichungen
u01 (t) = au1 (t) + bu2 (t)
u02 (t) = cu1 (t) + du2 (t)
werden!diese Größen miteinander gekoppelt. Fassen wir u1 (t), u!
2 (t) zu einem Vektor u =
u1 (t)
a b
und die Koeffizienten a, b, c, d zu einer Matrix A =
zusammen, so können wir
u2 (t)
c d
!
obiges System mit
u0 (t)
=
u01 (t)
u02 (t)
auch schreiben als
u01 (t)
u02 (t)
!
=
a b
c d
!
u1 (t)
u2 (t)
!
oder noch kürzer als
u0 (t) = A u(t)
(9.58)
Hierbei sind u(t), u0 (t) ∈ R2 für jedes feste t ∈ R.
9.23 Bemerkung Man sieht, dass (9.58) wieder eine lineare Struktur hat, d. h. dass mit zwei
Lösungen u(t) und v(t) von (9.58) auch alle Linearkombinationen
w(t) = c1 u(t) + c2 v(t)
Lösungen von (9.58) sind.
202
9 Gewöhnliche Differentialgleichungen
Beweis.
w0 (t) = (c1 u(t) + c2 v(t))0 = c1 u0 (t) + c2 v0 (t)
(∗)
= c1 Au(t) + c2 Av(t)
= A(c1 u(t) + c2 v(t)).
In (∗) wurde verwendet, dass u(t), v(t) Lösungen von (9.58) sind.
9.24 Satz: Lösungen im Falle reeller Eigenwerte
u01
u02
i) Ist λ ∈ R Eigenwert der Matrix A und u0 =
!
Eigenvektor von A zum Eigen-
wert λ, so ist
u(t) = eλt u0 =
u01 eλ t
u02 eλ t
!
Lösung von (9.58).
ii) Hat die Sytemmatrix A ∈ R2×2 des Differentialgleichungssystems (9.58) zwei Eigenwerte λ1 , λ2 mit Eigenvektoren u0 , v0 so ist die allgemeine Lösung gegeben durch
u(t) = c1 u0 (t) + c2 v0 (t).
(9.59)
Die Linearfaktoren c1 , c2 können aus gegebenen Anfangswerten bestimmt werden.
Beweis. Es ist Au0 = λu0 und u0 ∈ R2 \ {0}. Dann gilt:
u0 (t) = (eλt u0 )0 = λ eλt u0
= eλt λ u0
= eλt A u0
= A eλt u0 = A u(t).
9.25 Beispiel Gelöst werden soll das System
u01 (t) = u1 (t) + 2u2 (t)
u02 (t) = 2u1 (t) + u2 (t).
In vektorieller Schreibweise lautet es
!
0
u (t) =
1 2
u(t).
2 1
203
(9.60)
9 Gewöhnliche Differentialgleichungen
Die Eigenwerte λ der Matrix A =
λ1 = 3
λ2 = −1
1 2
2 1
!
sind nach Beispiel 7.42 gegeben durch
mit Eigenvektor u0 =
u01
u02
mit Eigenvektor
v01
v02
v0 =
!
!
=
1
1
=
1
−1
!
!
Daher erhalten wir mit Satz 9.24 i) die beiden Lösungen
u(t) = e
3t
v(t) = e
−t
1
1
!
e3t
e3t
=
!
1
−1
!
!
=
e−t
.
−e−t
Nach Satz 9.24 ii) ist die allgemeine Lösung gegeben durch
w(t) = c1 u(t) + c2 v(t)
!
mit Linearfaktoren c1 , c2 ∈ R. Ist nun als Anfangswert beispielsweise w(0) =
2
1
vorgegeben,
so können c1 , c2 bestimmt werden:
w(0) = c1 u(0) + c2 v(0)
= c1 u0 + c2 v0
!
= c1
!
1
1
+ c2
.
1
−1
!
Soll nun w(0) =
2
1
gelten, so muss
c1 + c2 = 2
c1 − c2 = 1
erfüllt sein. Diese Gleichungen!können wir auflösen zu c1 =
2
zu (9.60) mit Anfangswert
gegeben ist durch
1
!
3
2
und c2 = 12 , so dass die Lösung
!
3
1
1
1
w(t) = e3t
+ e−t
.
1
−1
2
2
9.4.2 Komplexwertige Lösungen
Es kann der Fall eintreten, dass die Eigenwerte der Matrix A in (9.58) nicht reell-, sondern
komplexwertig sind. Ist also λ = α + iβ ∈ C \ R Eigenwert von A, so wissen wir, dass auch
204
9 Gewöhnliche Differentialgleichungen
λ̄ = α − iβ Eigenwert von A ist, denn da A nur reelle Einträge hat, hat das charakteristische
Polynom der Matrix reelle Koeffizienten und wir können Bemerkung 8.24 iii) anwenden. Ist
nun z0 ∈ C2 \ {0} Eigenvektor von A zum Eigenwert λ so ist die Funktion z : R → C2 , welche
definiert ist durch
z(t) = eλt z0
eine Lösung der Differentialgleichung
z0 (t) = Az(t)
(9.61)
Ziel ist es auch hier, reellwertige Lösungen zu finden. Dazu zerlegen wir Gleichung (9.61)
in ihren Real - und Imaginärteil. Um z0 (t) zerlegen zu können, muss zunächst z(t) zerlegt
werden. Hierzu bezeichnen wir Real - und Imaginärteil von z0 mit z0 = x0 + iy0 (beachte, dass
x0 , y0 ∈ R2 !) und berechnen dann
z(t) = eλt z0
= e(α+iβ)t (x0 + iy0 )
= eαt (cos(βt) + i sin(βt))(x0 + iy0 )
= eαt [cos(βt)x0 + i cos(βt)y0 + i sin(βt)x0 + i sin(βt)iy0 ]
= eαt [cos(βt)x0 − sin(βt)y0 + i(cos(βt)y0 + sin(βt)x0 )] .
(9.62)
Bezeichnen wir nun den Real- und Imaginärteil von z(t) mit x(t) und y(t) so ist also
x(t) = eαt [cos(βt)x0 − sin(βt)y0 ]
y(t) = eαt [(cos(βt)y0 + sin(βt)x0 )]
Setzen wir diese Zerlegungen in die Differentialgleichung ein, so ist
z0 (t) = Az(t)
⇐⇒
x0 (t) + iy0 (t) = A(x(t) + iy(t)).
(9.63)
Eine Gleichung in C ist aber immer genau dann erfüllt, wenn sie für den Real- und Imaginärteil
der Gleichung gilt, wir können also (9.63) zerlegen in zwei Gleichungen
x0 (t) = Ax(t)
y0 (t) = Ay(t)
welche jeweils genau der Gleichung (9.61) entsprechen, nur dass wir mit x(t) und y(t) zwei
reellwertige Lösungen gefunden haben.
9.26 Satz: Lösungen im Falle komplexwertiger Eigenwerte
Sei eine Matrix A ∈ R2×2 gegeben mit Eigenwerten λ, λ̄ ∈ C \ R und einem Eigenvektor
205
9 Gewöhnliche Differentialgleichungen
z0 = x0 + iy0 ∈ C2 zu λ = α + iβ, so sind durch
x(t) = eαt (cos(βt)x0 − sin(βt)y0 )
y(t) = eαt (cos(βt)y0 + sin(βt)x0 )
zwei reelle Lösungen des Systems
z0 (t) = Az(t)
gegeben. Alle Linearkombinationen
w(t) = c1 x(t) + c2 y(t)
sind für c1 , c2 ∈ R ebenfalls reellwertige Lösungen des Systems.
9.27 Beispiel Gesucht sind Lösung in R2 des Systems
u01 (t) = au1 (t) − bu2 (t)
(9.64)
u02 (t) = bu1 (t) + au2 (t)
welches in vektorieller Schreibweise
!
a −b
u(t)
b a
0
u (t) =
(9.65)
!
lautet. Die Eigenwerte der Koeffizientenmatrix A =
Wir berechnen den Eigenvektor z0 =
!
a −b
b a
sind nach Beispiel 8.16 c)
λ2 = a − ib.
λ1 = a + ib
e1
e2
a −b
b a
!
zum Eigenwert λ1 = a + ib. Es muss gelten
e1
e2
!
!
e
= (a + ib) 1 .
e2
(9.66)
Betrachten wir in dieser Gleichung die erste Koordinate, so erhalten wir
ae1 − be2 = (a + ib)e1 .
(9.67)
Zu beachten ist hier, dass in (9.66) auf der linken Seite das Produkt “Matrix · Vektor” zu
berechnen ist und auf der rechten Seite “Zahl · Vektor”. Aus (9.67) erhalten wir zunächst
!
1
−be2 = ibe1 , was, wenn man e1 = 1 wählt, e2 = −i ergibt. Der Eigenvektor ist also z0 =
,
−i
206
9 Gewöhnliche Differentialgleichungen
in Real- und Imaginärteil zerlegt wird dieses zu
!
1
−i
z0 =
!
!
1
0
+i
0
−1
=
= x0 + iy0 .
Nach der Formel aus Satz 9.26 erhalten wir die beiden reellwertigen Lösungen
!
x(t) = e
1
0
cos(b t)
− sin(b t)
0
−1
at
cos(b t)
sin(b t)
= eat
!!
!
!
!!
y(t) = e
at
0
1
cos(b t)
+ sin(b t)
−1
0
=e
at
sin(b t)
− cos(b t)
!
so dass die allgemeine reelle Lösung u(t) von (9.64) gegeben ist durch
u(t) = c1 x(t) + c2 y(t)
!
"
=e
at
c1
!#
cos(bt)
sin(bt)
+ c2
sin(bt)
− cos(bt)
mit c1 , c2 ∈ R. Zu reellen Anfangswerten u0 =
u01
u02
(9.68)
!
lassen sich nun aus (9.68) c1 , c2 ∈ R
bestimmen:
!
u(0) =
c1
1
0
+ c2
0
−1
!!
=
c1
−c2
!
!
=
u01
,
u02
es ist also c1 = u01 und c2 = −u02 .
9.28 Folgerung Insbesondere weiß man nun, dass das System (9.58) bei reellen Koeffizienten
und reellen Anfangswerten auch reellwertige Lösungen hat.
9.4.3 Nichtlineare Systeme, das Räuber-Beute-Modell
Man betrachte die folgende Situation: Beobachtet wird eine Beutepopulation x(t) und eine
Räuberpopulation y(t) von denen Geburten- und Sterberate gegeben sind durch
b y(t) : Sterberate von x
d
: Sterberate von y
a : Geburtenrate von x
c x(t) : Geburtenrate von y
207
9 Gewöhnliche Differentialgleichungen
Drückt man diese Kopplung in Differentialgleichungen aus, so erhält man das System
x0 (t) = ax(t) − by(t)x(t) = (a − by(t))x(t)
y 0 (t) = cx(t)y(t) − dy(t) = (cx(t) − d)y(t).
(9.69)
9.29 Bemerkung Allgemein kann man ein System aus zwei Differentialgleichungen notieren
durch
x0 (t) = F1 (x(t), y(t))
(9.70)
y 0 (t) = F2 (x(t), y(t))
oder kürzer mit z(t) =
x(t)
y(t)
!
!
und F =
F1 (x, y)
F2 (x, y)
durch
z0 (t) = F(x, y).
Hier ist z : R → R2 und F : R2 → R2 .
Solche Systeme wie explizit zu lösen ist im Allgemeinen nicht möglich, daher ist man wieder
an geometrischen Veranschaulichungen und qualitativen Aussagen über deren Lösungskurven
(x(t), y(t)) interessiert. Zunächst lassen sich stationäre Punkte des Systems bestimmen.
9.30 Definition
Ein!Punkt (xs , ys ) ∈ R2 , der Nullstelle der Funktion F : R2 → R2 ist, d.h. F(xs , ys ) =
0
∈ R2 , heißt stationärer Punkt der Differentialgleichung (9.70), denn dann gilt für
0
ts ∈ R mit x(ts ) = xs und y(ts ) = ys
!
x0 (ts )
y 0 (ts )
!
= F(xs , ys ) =
0
.
0
In dem System (9.69) ist (xs , ys ) mit
xs =
d
c
und
ys =
a
b
(9.71)
stationärer Punkt, wie man durch Einsetzen leicht überprüft. Damit können wir (9.69) auch
schreiben als
x0 (t) = b(ys − y(t))x(t)
y 0 (t) = c(x(t) − xs )y(t).
(9.72)
Ähnlich wie wir für eine gewöhnliche Differentialgleichung ein Richtungsfeld skizzieren konnten,
können wir für ein System ein Vektorfeld zeichnen. Eine Lösungskurve (x(t), y(t)) von (9.70)
bzw. (9.72) ist eine Kurve in der 2-dimensionalen (x, y)-Ebene. Auch wenn wir nicht wissen,
wie die Kurve verläuft, so können wir doch mittels (9.70) oder (9.72) zu jedem Punktepaar
208
9 Gewöhnliche Differentialgleichungen
(x, y) ∈ R2 die Änderungen (x0 (t), y 0 (t)) durch das Differentialgleichungssystem berechnen.
Wenn wir also in jedem Punkt (x, y) den Vektor (x0 , y 0 ) “anheften”, so sehen wir in welche
Richtung eine Lösungskurve durch den Punkt (x, y) verlaufen würde. Dem Räuber-BeuteSystem (9.72) entnehmen wir, dass
1. Für x = xs gilt:
y0 = 0
0
∀y∈R
x >0
∀ y < ys
x0 = 0
∀x∈R
x0 < 0
∀ y > ys .
y0 < 0
∀ x < xs .
2. Für y = ys gilt:
0
y >0
∀ x > xs
3. Für x = 0 folgt x0 = 0 und y 0 < 0 und für y = 0 folgt y 0 = 0 und x0 > 0.
Dieses lässt sich veranschaulichen in einem Phasendiagramm:
y
ys
xs
x
Abbildung 9.9: Phasendiagramm des Räuber-Beute Systems (9.69)
In der Abbildung 9.9 kann man sehen, dass Lösungskurven in einer Linksdrehung um den
Punkt (xs , ys ) herum verlaufen. Da sich die Kurven nicht schneiden können, gibt es die Möglichkeiten, dass sich Lösungskurven von (9.72) für t → ∞
a) spiralförmig auf den stationären Punkt (xs , ys ) zubewegen.
b) spiralförmig von dem stationären Punkt (xs , ys ) wegbewegen.
c) den stationären Punkt auf geschlossenen Bahnen umlaufen.
Um diese Frage zu klären, betrachen wir die Funktion G : R2 → R, welche definiert ist durch
G(x, y) = b(ys ln(y) − y) + c(xs ln(x) − x)
209
(9.73)
9 Gewöhnliche Differentialgleichungen
für x, y > 0. Es gilt der folgende Satz.
9.31 Satz
Für die durch (9.73) definierte Funktion G(x, y) gilt
i) lim G(x, y) = lim G(x, y) = lim G(x, y) = lim G(x, y) = −∞
x→0
y→0
x→∞
y→∞
ii) (xs , ys ) ist globales Maximum von G und es gibt keine weiteren lokalen Extremwerte.
iii) Die Funktion G(x, y) ist konstant entlang von Lösungskurven von (9.72):
G(x(t), y(t)) = G(x(0), y(0)) = const.
wenn (x(t), y(t)) Lösung von (9.72) ist.
Beweis.
iii) Wir betrachten die Hilfsfunktion g(t) := G(x(t), y(t)) und zeigen, dass g 0 (t) = 0 wenn
(x(t), y(t)) Lösung von (9.72) ist. Dann folgt die Behauptung.
g 0 (t) = [b(ys ln y(t) − y(t)) + c(xs ln x(t) − x(t))]0
y 0 (t)
x0 (t)
− y 0 (t)) + c(xs
− x0 (t))
y(t)
x(t)
xs
ys
− 1) + cx0 (t)(
− 1)
= by 0 (t)(
y(t)
x(t)
ys
xs
= bc(x(t) − xs )y(t)(
− 1) + bc(ys − y(t))x(t)(
− 1)
y(t)
x(t)
= bc(x(t) − xs )(ys − y(t)) + bc(ys − y(t))(xs − x(t))
= b(ys
(∗)
= 0,
wobei in (∗) für x0 (t) und y 0 (t) jeweils die rechte Seite von (9.72) eingesetzt wurde.
i) Die Grenzwerte folgen aus
lim (ln x − x) = −∞,
x→∞
lim (ln x − x) = −∞.
x→0
ii) Hat die Funktion G(x, y) ein lokales Maximum, so muss sie auch ein lokales Maximum haben
wenn man sie nur als eine Funktion von x bei festem y und umgekehrt betrachtet. Also müssen
die partiellen Ableitungen von G, für die G nur als Funktion von x oder von y betrachtet wird,
∂G
Null sein. Diese werden bezeichnet mit ∂G
∂x und ∂y . Es ist
∂G
1
(x, y) = c(xs − 1)
∂x
x
∂G
1
(x, y) = b(ys − 1).
∂y
y
210
9 Gewöhnliche Differentialgleichungen
Man sieht sofort, dass
∂G
∂G
(x, y) = 0 und
(x, y) = 0 ⇐⇒
∂x
∂y
(x, y) = (xs , ys ).
Da G(x, y) daher nur einen Extremwert haben kann, folgt zusammen mit Satz 9.31 ii), dass
es ein globales Maximum sein muss.
Aus den Aussagen von Satz (9.31) können wir folgern, dass die Lösungskurven (x(t),y(t)) von
(9.72) als Höhenlinien der Funktion G interpretiert werden können. Da G genau ein Maximum
hat, also nur eine “Bergspitze” und keine “Nebengipfel”, müssen diese Höhenlinien geschlossene
Kurven rund um die Bergspitze sein. Wir können also folgern, dass Fall c) eintritt, die Lösungskurven verlaufen auf geschlossenen Bahnen um den stationären Punkt (xs , ys ), die Fälle a) und
b) können nicht eintreten.
y
ymax
ys
ymin
xmin
xs
xmax
x
Abbildung 9.10: Lösungskurven des Räuber-Beute Modells (9.69)
Die Interpretation ergibt also
i) x(t) und y(t) schwanken periodisch.
ii) Auf ein Maximum von y(t) folgt ein Minimum von x(t).
iii) Auf ein Minimum von x(t) folgt ein Minimum von y(t).
iv) Auf ein Minimum von y(t) folgt ein Maximum von x(t).
v) Auf ein Maximum von x(t) folgt ein Maximum y(t).
Ist T > 0 die unbekannte Periode der Lösungskurven x(t), y(t), so können die Mittelwerte x̄
211
9 Gewöhnliche Differentialgleichungen
und ȳ berechnet werden:
1
x̄ :=
T
ZT
1
ȳ :=
T
x(t)dt
0
ZT
y(t)dt.
(9.74)
0
Aus der 1.Gleichung von (9.72) folgt
⇐⇒
x0 (t)
= b(ys − y(t))
x(t)
(ln x(t))0 = b(ys − y(t))
⇐⇒ ln(x(T )) − ln(x(0)) = b
ZT
(ys − y(t))dt
0
= b(ys T −
ZT
y(t)dt).
(9.75)
0
Wegen der Periodizität ist x(T ) = x(0), sodass ln x(T ) − ln x(0) = 0 ist und aus (9.75) folgt
1
ys =
T
ZT
y(t)dt,
0
sodass aus (9.74) folgt, dass ȳ = ys . Mit der 2. Gleichung von (9.72) zeigt man genauso, dass
x̄ = xs . Für jede Lösungskurve des Räuber-Beute-Modells (9.72) folgt also, dass die Mittelwerte
x̄, ȳ der Beute- und Räuberpopulation gegeben sind durch
x̄ = xs =
d
c
ȳ = ys =
212
a
.
b
Herunterladen