Mathematischer Vorkurs WiSe 2017 / 2018 Fortgeschrittene

Mathematischer Vorkurs
WiSe 2017 / 2018
Fortgeschrittene Themenblöcke
Fachbereich Physik
Universität Hamburg
Inhaltsverzeichnis
Kapitel 1 – Summen- und Produktzeichen
1
Kapitel 2 – Aussagenlogik
4
Kapitel 3 – Beweistechniken
7
Kapitel 4 – Folgen und Konvergenz
10
Kapitel 5 – Reihen und Taylorreihen
13
Kapitel 6 – Elementare Differentialgleichungen
16
Das vorliegende Kursmaterial bildet den stofflichen Inhalt der Fortgeschrittenen Themenblöcke, die ergänzend
zum Mathematischen Vorkurs für die Studierenden angeboten werden, die Spaß und Interesse an noch mehr
Mathematik haben, als ohnehin schon im gewöhnlichen Curriculum präsentiert wird. Es wird keineswegs für ein
gelingendes Physikstudium vorausgesetzt, die hier dargestellten Inhalte schon vor Studienbeginn mitzubringen
– vielmehr sind inhaltliche Überschneidungen insbesondere mit dem Modul Mathematik für Studierende der
Physik unvermeidbar.
In der Themenauswahl wird auf die Grundlage von früheren Mathematischen Vorkursen am Fachbereich zurückgegriffen, sie vermittelt einen hoffentlich vielseitigen und ansprechenden Überblick über ausgewählte Inhalte der Höheren Mathematik für Einsteiger. Die Themen der ersten Woche bilden konzeptionelle Fundamente
für die Anwendungen der zweiten Woche; es sollte jedoch auch ohne den Besuch der vorhergehenden Themenblöcke möglich sein, sich an den neuen Sachverhalten zu probieren und viel zu lernen. Die Aufgaben finden
sich eingebettet in kurze Erklärungen, damit im Nachhinein auch ohne Hilfestellung das Erlernte wiederholt
werden kann.
Ich bin sehr dankbar für jede Art von Feedback und Kommentaren – gewiss haben sich irgendwo Fehler eingeschlichen oder Unklarheiten versteckt. Diese dürfen sehr gerne an [email protected]
gemeldet werden.
Stand: 7. September 2017
Kapitel 1 – Summen- und Produktzeichen
Das Summenzeichen ist eine abkürzende Schreibweise für eine längere Summe, deren Summanden nach einem
bestimmten Muster aufgebaut sind. Als Symbol wird das große Σ (Sigma) benutzt. Dabei werden die Summanden in Abhängigkeit einer Laufvariablen (in der unten stehenden Definition das k) ausgedrückt. Diese
Laufvariable nimmt alle ganzen Zahlen zwischen ihrem Anfangswert und ihrem Endwert an; dabei wird der
Anfangswert unterhalb und der Endwert oberhalb des Summenzeichens notiert. Die einzelnen Summanden
stehen direkt hinter dem Summenzeichen. Seien die von k abhängigen Summanden gegeben durch die Terme
ak , dann lässt sich das Summenzeichen rekursiv definieren:
m
X
ak := an +
k=n
m
X
ak
k=n+1
solange m ≥ n. Zusätzlich müssen wir als Abbruchbedingung noch die leere Summe definieren: Falls die Obergrenze kleiner ist als die Untergrenze, ergibt das Summenzeichen den Wert Null.
Diese Definition lässt sich so verstehen, dass man im ersten Schritt k = n setzt und den zugehörigen Summanden an berechnet. Dann erhöht man die Laufvariable auf k = n + 1, berechnet an+1 und addiert das zum
Vorherigen. Diese Prozedur wird wiederholt, bis der letzte Summand am ermittelt und addiert wird. So ergibt
sich beispielsweise für ak = 1/k:
4
X
1 1 1 1
25
1
= + + + =
k
1 2 3 4
12
k=1
Aufgabe 1
Berechnen Sie die Werte der folgenden Ausdrücke:
a)
2
X
3k + 2k
b)
6
X
m
m=1
k=−1
c)
2
X
√
m
(4n − 1)
d)
15
X
3z 2
z=17
j=3
Aufgabe 2
Schreiben Sie die folgenden Summen mittels des Summenzeichens:
1
1
1 1
+ +
+
3 9 27 81
d) 1 − 2 + 3 − 4 + . . . − 16
a) 1 + 3 + 5 + . . . + 19
b) 1 +
c) x + 4x2 + 9x3 + . . . + 100x10
Ganz analog zum Summenzeichen wird das Produktzeichen definiert:
m
Y
bk := bn ·
k=n
m
Y
bk
k=n+1
für n ≤ m, und das leere Produkt ist Eins. Damit lässt sich die Fakultät einfach schreiben: n! =
1
Qn
k=1
k
Aufgabe 3
Zeigen Sie, dass für den Binomialkoeffizienten gilt:
n
n
n+1
+
=
k
k+1
k+1
Y
n
n−k
k
Y 1 Y
n
1
=
j·
·
k
j j=1 j
j=1
j=1
Hinweis:
Zusätzlich zu oder anstelle von der Angabe von Ober- und Untergrenze werden oft auch Einschränkungen an
das Summenzeichen geschrieben, die die Laufvariable zu erfüllen hat. Dann werden nur solche Summanden
aufaddiert, für die die Laufvariable die Einschränkung erfüllt, wie die folgenden zwei Beispiele illustrieren:
X
1≤k<7
ak =
6
X
k gerade
X
ak
k=1
ck = c2 + c4 + c6 + · · · + c36
2≤k≤37
Man kann auch mehrere Summenzeichen schachteln. Die Berechnung verläuft dann so, dass die Laufvariable
k der äußeren Summe einen Wert annimmt, dann wird zu diesem festen Wert die innere Summe ausgeführt,
bevor k inkrementiert und die innere Summe zum neuen Wert ausgerechnet wird. Schließlich wird alles addiert,
wie im Beispiel zu sehen ist:
n X
m
X
aj,k =
k=1 j=1
m
X
aj,1 +
j=1
m
X
aj,2 + · · · +
j=1
m
X
aj,n
j=1
Aufgabe 4
Gelten die folgenden Beziehungen für Summenzeichen allgemein? Begründen Sie!
a)
n
X
(ak + λ · bk + c) =
c)
xk yk =
k=1
e)
ak + λ ·
N
N
X
X
n1 =1 n2 =1
n
X
k=1
!
xk
·
n
X
n
X
bk + c
b)
!
yk
d)
m+1
X
ak =
n
X
2 X
N
Y
exp(αj n)
j=1 n=1
f)
cij dj =
n
X
cij ·
i=1
2n
X
(1 + (−1)k )
k=1
ak−1
k=n+1
i,j=1
k=1
exp(α1 n1 + α2 n2 ) =
m
X
k=n
k=1
k=1
k=1
n
X
n
X
2
zk =
n
X
dj
j=1
n
X
z2k
k=1
Pn
Darüber hinaus treten in der Physik oft Summen der Form k=1 ak bk auf (zum Beispiel beim Skalarprodukt
von Vektoren). Daher führen wir noch weitere abkürzende Schreibweisen ein. Geht aus dem Kontext hervor,
was obere und untere Grenze
der Summation sind, lässt man diese in der Notation oft weg und gelangt so
P
zu einem Ausdruck wie k ak bk . In einigen Situationen, in denen viele Summationen über unterschiedliche
Indizes auftauchen, geht man sogar noch weiter: Die Einstein’sche Summenkonvention besagt, dass in einem
Produkt oder elementaren Ausdruck über doppelt auftretende Indizes summiert wird. Häufiger darf ein Index
dann nicht auftreten. Man spart sich also das Summenzeichen: ak bk . Hier ist also immer Vorsicht geboten: Es
muss geklärt werden, ob der Ausdruck nun von einem externen Index k abhängt und für diesen
P festen Wert
das Produkt ak bk gemeint ist, oder ob in Einstein’scher Summenkonvention die Summation k ak bk gemeint
ist.
2
Aufgabe 5
Betrachten Sie die folgenden Ausdrücke in Einstein’scher Summenkonvention. Sind die Ausdrücke wohlgeformt? Über welche Indizes wird summiert? Gibt es freie Indizes?
a) aijk bmi ck
c) aj blm · j
b) akik
d) ai bi cj dij
e) ak + bk
Für heute wollen wir uns nun noch ein Anwendungsbeispiel zur Umformung von Summen ansehen: Wir wollen
verstehen, warum ex · ey = ex+y gilt. Dafür benötigen wir einerseits den Binomischen Lehrsatz, den man recht
instruktiv mittels vollständiger mathematischer Induktion (siehe Kapitel 3: Beweistechniken) beweisen kann:
(a + b)n =
n X
n
k=0
k
ak bn−k =
n
X
k=0
n!
ak bn−k
k!(n − k)!
Zusätzlich brauchen wir noch die Reihendarstellung der Exponentialfunktion. Sie kann als Definition der
Exponentialfunktion aufgefasst werden und wird im Kapitel 5: Reihen und Taylorreihen hergeleitet.
ex :=
∞
X
xn
n!
n=0
Dass hier die obere Summationsgrenze unendlich groß ist, birgt eigentlich Schwierigkeiten, die wir jedoch auf
den Themenblock zu Reihen und Taylorreihen verschieben. Nun beginnen wir mit dem Beweis:

! ∞
∞
∞
k
X yj
X
X
xk y j
x
=
·
ex · ey =
k!
j!
k!j!
j=0
k,j=0
k=0
Die Laufvariablen werden unabhängig voneinander jeden beliebigen Wert annehmen. Wir wollen die Summation ein wenig umsortieren und nach Potenzen von x und y geordnet verfahren. Dazu führen wir die Summe
beider Variablen n = k + j ein. Wenn wir über jeden möglichen Wert von n summieren, und auch jede Möglichkeit, wie sich k + j = n ergeben kann, einschließen, haben wir lediglich die Summanden in eine andere
Reihenfolge gebracht:
n
∞ k+j=n
∞ X
X
X xk y j
X
xk y n−k
ex · ey =
=
k!j!
k!(n − k)!
n=0
n=0
k=0
k,j
Nun erweitern wir den Bruch mit n!, um den binomischen Lehrsatz wiederzuerkennen:
ex · ey =
∞
n
∞
X
X
1 X
n!
1
xk y n−k =
· (x + y)n = ex+y
n!
k!(n
−
k)!
n!
n=0
n=0
k=0
Damit ist der Beweis abgeschlossen, und wir haben gesehen, dass man beispielsweise mittels Umordnung der
Summationsreihenfolge interessante Eigenschaften ableiten kann. Solche Tricks, inklusive dem Vertauschen
verschiedener Summen und dem Verschieben von Indizes, finden oft Anwendung, wenn man mathematische
Ausdrücke ineinander überführen möchte. Somit sind Summen- und Produktzeichen nicht nur praktisch und
üblich in der Organisation von längeren Rechnungen, sondern stellen auch einen Formalismus bereit, um Muster
in Ausdrücken zu erkennen und systematisch ausnutzen zu können.
3
Kapitel 2 – Aussagenlogik
Die Aussagenlogik ist ein zentrales Konzept zur Formalisierung und Abstraktion von Zusammenhängen, um
deren Struktur zu untersuchen und logische Schlüsse zu ziehen. Damit bildet sie einen Grundbaustein der
Mathematik. In der Aussagenlogik gibt es Variablen, die die Werte wahr und falsch annehmen können: Bezeichnen wir die Aussage „Heute hat es in Hamburg geregnet“ mit dem Variablensymbol A, dann kann A
mit dem Wahrheitswert wahr oder falsch belegt sein. Eine solche Variable im aussagenlogischen Sinne wird
oft auch als atomare Formel bezeichnet, um sie von allgemeinen, zusammengesetzten Formeln sprachlich zu
unterscheiden. Formeln lassen sich mithilfe von sogenannten Junktoren zu einer neuen Formel kombinieren.
Ein recht einfacher Junktor ist ∧, gesprochen „Und“, der zwei Formeln miteinander in Verbindung setzt. Der
Wahrheitswert von A ∧ B ist wahr, wenn sowohl A als auch B wahr sind, ansonsten ist er falsch. Die Wirkung
vom ∧-Junktor lässt sich mittels einer Wahrheitstafel zusammenfassen:
A
0
0
1
1
∧ (Und)
B A∧B
0
0
1
0
0
0
1
1
Dabei muss für jede Kombination von Belegungen der Komponentenformeln A und B — codiert mittels 1 für
wahr und 0 für falsch — angegeben werden, welchen Wahrheitswert A ∧ B hat. Mit dieser Schreibweise lassen
sich ganz analog vier weitere Junktoren definieren:
A
0
0
1
1
∨ (Oder)
B A∨B
0
0
1
1
0
1
1
1
⇒ (Implikation)
A B A⇒B
0 0
1
0 1
1
1 0
0
1 1
1
⇔ (Äquivalenz)
A B A⇔B
0 0
1
0 1
0
1 0
0
1 1
1
¬ (Negation)
A
¬A
0
1
1
0
In der natürlichsprachlichen Bedeutung der Junktoren wird „Oder“ häufig fälschlicherweise als „EntwederOder“ behandelt, deswegen ist es wichtig, zu konstatieren, dass A ∨ B auch dann erfüllt ist, wenn beide
Aussagensymbole mit wahr belegt sind.
Die Implikation entspricht dem natürlichsprachlichen „Wenn-Dann“-Konstrukt und ist von der Äquivalenz
(„Genau-Dann-Wenn“) zu unterscheiden. A ⇒ B, also „Wenn A gilt, gilt auch B“, ist wahr, wenn A und B
es beide sind; aber auch, wenn A falsch ist, da in diesem Fall gar keine Aussage über die Gültigkeit von B
getroffen wird (Aus Falschem folgt Beliebiges). A ⇔ B ist wahr, wenn A und B den gleichen Wahrheitswert
haben, uns sonst falsch.
Es kann passieren, dass Formeln aufgrund ihrer inneren logischen Struktur unabhängig von der Wahrheitswertbelegung ihrer atomaren Formeln immer wahr sind – solche Formeln nennt man Tautologien. A ∨ ¬A ist
eine solche Tautologie, denn in der zugehörigen Wahrheitstafel sind alle Einträge 1:
A
0
1
¬A
1
0
A ∨ ¬A
1
1
4
Aufgabe 1
Weisen Sie die deMorgan’schen Regeln nach, indem Sie die Felder der Wahrheitstafel ausfüllen. Erläutern
Sie Ihr Vorgehen.
a) ¬(A ∨ B) ⇔ (¬A ∧ ¬B)
b) ¬(A ∧ B) ⇔ (¬A ∨ ¬B)
A
0
0
1
1
B
0
1
0
1
¬A
¬B
¬A ∧ ¬B
¬(A ∨ B)
¬A ∨ ¬B
¬(A ∧ B)
Aufgabe 2
a) Weisen Sie nach, dass das Distributivgesetz der Aussagenlogik ((A ∨ B) ∧ C) ⇔ ((A ∧ C) ∨ (B ∧ C))
gilt, indem Sie die Wahrheitstafel ausfüllen:
A
0
0
0
0
1
1
1
1
B
0
0
1
1
0
0
1
1
C
0
1
0
1
0
1
0
1
A∨B
(A ∨ B) ∧ C
A∧C
B∧C
(A ∧ C) ∨ (B ∧ C)
Zeigen Sie weiterhin, dass
b) (A ⇒ B) ⇔ (¬A ∨ B)
c)
((A ⇒ B) ∧ (B ⇒ C)) ⇒ (A ⇒ C)
d) (A ⇔ B) ⇔ ((A ⇒ B) ∧ (B ⇒ A))
Eine Verallgemeinerung der Aussagenlogik wird durch die Prädikatenlogik erreicht – in ihr werden noch bestimmte quantitative Eigenschaften von Aussagen untersucht. Dazu werden zunächst die Begriffe Domäne,
Instanz und Prädikat eingeführt. Eine Domäne ist eine Menge von Objekten, die beschrieben werden sollen –
zum Beispiel die natürlichen Zahlen. Eine Instanz ist eines dieser Objekte aus der Domäne. Das Elementsymbol
∈ gibt an, dass eine Instanz in der Domäne enthalten ist. Ein Prädikat ist nun irgendeine Eigenschaft, bei der
für jede Instanz der Domäne entscheidbar ist, ob die Instanz die Eigenschaft erfüllt oder nicht. Notiert wird
dies als P (x), wobei P das Prädikat ist und x die Instanz, die P erfüllt (P (x) ist wahr ) oder nicht (P (x) ist
falsch). Es gibt auch Prädikate, die von je zwei oder noch mehr Instanzen abhängen wie etwa K(x, y) für „x
ist kleiner als y“. Bei mathematischen Prädikaten ist es auch üblich, direkt die mathematische Symbolik als
Prädikat zu benutzen, K(x, y) und x < y sind somit gleichwertig.
Darüber hinaus werden noch die beiden Quantoren ∀ und ∃ definiert. Mit ihnen ist es möglich, Aussagen
darüber zu treffen, inwiefern ein Prädikat von den Instanzen einer Domäne erfüllt wird. ∀, der sogenannte
Allquantor, kann als „für alle“ übersetzt werden. Er sagt aus, dass alle Instanzen das nachfolgende Prädikat
erfüllen: ∀x ∈ D : P (x) heißt also, dass alle Instanzen aus D die Eigenschaft P haben. Der Doppelpunkt
kann dabei stets als „es gilt“ übersetzt werden. Man sagt, der Allquantor habe die Variable x gebunden, da
es gar nicht mehr auf die Benennung der Instanzen ankommt. ∀x ∈ D : P (x) ist damit ein Ausdruck, der im
aussagenlogischen Sinne wahr oder falsch sein kann. Ganz analog zu ∀ wird der Existenzquantor ∃ mit der
5
natürlichsprachlichen Bedeutung „es existiert“ assoziiert. Auch er kann Variablen binden, sodass ∃x ∈ D : P (x)
wahr wird, wenn es in der Domäne mindestens eine Instanz gibt, die das Prädikat erfüllt.
Aufgabe 3
Übersetzen Sie die folgenden prädikatenlogischen Formeln ins Deutsche:
a) ∀n ∈ N∃m ∈ N : (n > m) ∧ (2m > n)
b) ∃x ∈ D : P (x) ⇔ ∀x ∈ D : P (x)
c) P ⇒ ∀y ∈ U : W (y)
Aufgabe 4
Bilden Sie zu folgenden Sätzen je eine prädikatenlogische Formel. Definieren Sie sich dabei geeignete
Prädikate und Domänen.
a) Für jede natürliche Zahl n gibt es eine natürliche Zahl m, sodass n oder n + 1 das Doppelte von m
sind.
b) Wenn eine Zahl durch 4 teilbar ist, dann ist sie auch durch 2 teilbar.
c) Jeder Mensch, der an der Universität Hamburg studiert, kennt das Geomatikum.
Wir haben damit gesehen, dass sich prädikatenlogische Formeln mittels der Junktoren aus der Aussagenlogik
verknüpfen lassen. Dabei kann es sein, dass die Reihenfolge der Quantoren durchaus nicht unerheblich ist:
„Für alle Schlösser gibt es einen passenden Schlüssel“ ist etwas anderes als „Es gibt einen Schlüssel, der für alle
Schlösser passt“.
Eine Besonderheit tritt beim Negieren einer quantorgebundenen Formel auf. Möchte man die Aussage „Alle
Tiere sind Hunde“ verneinen, ist das gleichbedeutend zu „Es gibt ein Tier, das kein Hund ist“. Hier zeigt
sich, dass aus einer allquantorgebundenen Variable unter Negation eine existenzquantorgebundene Variable
hervorgeht. Formalisieren wir das mit der Vereinbarung, dass H(t) das Prädikat „t ist ein Hund“ bezeichne
und T die Menge aller Tiere sei, dann sehen wir:
¬ (∀t ∈ T : H(t)) ⇔ (∃t ∈ T : ¬H(t))
Negationen lassen sich also an Quantoren vorbeiziehen, bis sie direkt auf die Prädikate wirken. Dabei wandeln
sich die Quantoren ineinander um, aus ∀ wird ∃ und umgekehrt.
Aufgabe 5
Negieren Sie die prädikatenlogischen Formeln aus den Aufgaben 3 und 4 und vereinfachen Sie sie möglichst
weit.
6
Kapitel 3 – Beweistechniken
Mathematische Sätze, Korollare und Lemmata sind Behauptungen, die man in der Mathematik rigoros beweisen muss, damit sie nicht mehr den Status einer Hypothese haben, sondern in dem betrachteten System als
gesichert gelten können. Dazu wollen wir uns heute mit einigen elementaren Beweistechniken beschäftigen –
also die Frage aufwerfen, wie Behauptungen mittels logischer Muster bewiesen werden können. Dass die hier
vorgestellten Beweistechniken gültig sind, mag offenkundig erscheinen, liegt aber bei genauerer Betrachtung
daran, dass wir die gängigen Axiome, etwa über Aussagenlogik und natürliche Zahlen, zugrunde legen.
Beim Beweisen sollte eine konventionsgetreue Notation beachtet werden. Die Behauptung, die natürlichsprachlich oder in Quantorschreibweise stehen darf, steht als solche gekennzeichnet über dem Beweis. Das Ende des
Beweises wird durch die Buchstaben qed für quod erat demonstrandum oder ein Kästchen gekennzeichnet.
Die rudimentärste Form des Beweises ist der direkte Beweis. Hierbei versucht man, die Behauptung durch
direkte logische Schlüsse oder algebraische Umformungen zu belegen. Der direkte Beweis findet beispielsweise
dann häufig Anwendung, wenn man die Gültigkeit einer Gleichung zeigen soll. Dabei geht man von einer Seite
der Gleichung aus und überführt sie in den Ausdruck auf der anderen Seite. Ein häufiger Fehler, der auftritt,
wenn man die Gültigkeit einer Gleichung zeigen soll und die Gleichung so weit umformt, bis etwas offensichtlich
Wahres herauskommt, ist etwas diffizil. Man muss stets darauf achten, nur Äquivalenzumformungen vorzunehmen – Implikationen reichen nicht aus, denn ansonsten würde man lediglich zeigen, dass man aus der eingangs
behaupteten Gleichung etwas Wahres folgern kann; das kann man aber auch aus etwas Falschem: Ex falso
sequitur quodlibet (Aus Falschem folgt Beliebigies). Wichtig ist aber, dass man durch logische Schlüsse von der
schließlich erreichten offenkundig wahren Aussage rückwärts auf die Gültigkeit der Behauptung schließen kann.
Aus diesem Grund ist es oft sicherer, wie eingangs beschrieben die beiden Ausdrücke ineinander zu überführen.
Beispiel:
Behauptung:
Die Summe zweier ungerader Zahlen ist gerade.
Beweis:
Seien a und b ungerade natürliche Zahlen, das heißt ∃n, m ∈ N : (a = 2n + 1) ∧ (b = 2m + 1)
Dann gilt a + b = 2n + 2m + 2 = 2 · (n + m + 1) ∈ 2N, also ist a + b gerade.
| {z }
∈N
Zu beachten ist außerdem, dass wenn eine „Genau dann wenn“ -Beziehung gezeigt werden soll, oft je ein Beweis
für jede Richtung geführt werden muss, denn (A ⇔ B) ⇔ ((A ⇒ B) ∧ (B ⇒ A)), vergleiche Kapitel 2. Das
bedeutet, dass man einmal annehmen darf, dass A gilt, und man daraus B folgern muss, und einmal umgekehrt
aus der Gültigkeit von B die Gültigkeit von A gefolgert werden muss (Natürlich kann man statt B ⇒ A auch
¬A ⇒ ¬B zeigen).
Aufgabe 1
Zeigen Sie durch einen direkten Beweis, dass eine Zahl m genau dann gerade ist, wenn ihr Quadrat m2 = n
gerade ist.
Aufgabe 2
Zeigen Sie durch einen direkten Beweis, dass für alle natürlichen Zahlen n und für x 6= 1 gilt:
n
X
xk = 1 + x + x2 + · · · + xn =
k=0
1 − xn+1
1−x
Dem direkten Beweis recht ähnlich ist der Beweis durch Widerspruch (reductio ad absurdum), auch indirekter
Beweis genannt. Dieser macht Gebrauch davon, dass genau dann, wenn ein Satz S gilt, seine Verneinung nicht
gültig ist:
(S ist wahr) ⇔ (¬S ist falsch)
7
Dafür wird die Behauptung logisch negiert und unter der Annahme dieser negierten Behauptung ein logischer
Widerspruch erzeugt. Wir können in diesem Fall ausschließen, dass ¬S gültig ist (dies folgt aus Kalkülen des
logischen Schließens, die hier den Rahmen sprengen würden), und damit muss S wahr sein (tertium non datur ).
Das Auftreten des logischen Widerspruchs signalisiert man mit einem Blitz-Symbol.
Möchte man beispielsweise einen Satz beweisen, der aus gewissen Vorbedingungen eine Aussage folgert, lässt
sich dieses Verfahren oft anwenden. Die Behauptung lautet abstrahiert A ⇒ B und die negierte Behauptung
damit A ∧ ¬B. Nun wird angenommen, dass A und ¬B gelten, und durch Umformungen gezeigt, dass ein logischer Widerspruch auftritt. Damit muss die Annahme falsch sein, und damit ist die ursprüngliche Behauptung
bewiesen. Beispiel:
Behauptung:
Es gibt unendlich viele verschiedene Primzahlen.
Beweis durch Widerspruch:
Annahme: Es gibt nur n < ∞ viele Primzahlen. Diese seien P = {p1 , p2 , . . . , pn }
n
Y
Nun können wir z =
pk bilden. Diese Zahl ist durch alle Primzahlen teilbar.
k=1
Also ist z + 1 durch keine dieser Primzahlen teilbar. Damit hat z + 1 aber
weitere Teiler, die nicht in P sind, oder ist selbst prim. In beiden Fällen gilt,
dass es nicht nur n verschiedene Primzahlen gibt. Widerspruch zur Annahme
Es kann also nicht nur endlich viele Primzahlen geben.
Aufgabe 3
Zeigen Sie, dass es unter den reellen Zahlen kleiner 1 keine größte Zahl gibt.
Aufgabe 4 √
Zeigen Sie, dass 2 nicht rational ist. Hinweis: Jede rationale Zahl r lässt sich durch teilerfremde Zahlen
n ∈ Z und m ∈ N\{0} darstellen als r = n/m
Zuletzt widmen wir uns einer konzeptionell etwas anders gearteten Beweistechnik, der vollständigen mathematischen Induktion. Diese Methode eignet sich hervorragend, um eine Aussage zu zeigen, die von einer
natürlichen Zahl n abhängt, etwa von der Form der berühmten Gauß’schen Summenformel, mit der der Wert
der Summe der ersten n natürlichen Zahlen bestimmt werden kann.
Nennen wir die zu beweisende Familie von Aussagen A(n). Die Idee der vollständigen Induktion ist ein zweigeteiltes Beweisverfahren: Zunächst weist man explizit die Gültigkeit der Aussage für ein festes n0 nach (A(n0 )
ist wahr durch explizites Einsetzen). Diesen Nachweis nennt man Induktionsanfang, für dieses n0 ist die Induktion verankert. Da es unendlich viele natürliche Zahlen gibt, kann man durch explizites Einsetzen nie zeigen,
dass eine Formel für alle natürlichen Zahlen gilt. Daher bedient man sich eines Tricks: Man zeigt, dass wenn
die Aussage für ein beliebiges, aber festes n gilt, dann gilt sie auch für n + 1, also ∀n ∈ N : A(n) ⇒ A(n + 1).
Ohne den Induktionsanfang bedeutet dieser sogenannte Induktionsschritt gar nichts, aber ist die Induktion
irgendwo verankert, folgt damit iterativ recht viel: Da A(n0 ) wahr ist, folgt mit A(n) ⇒ A(n+1) die Gültigkeit
von A(n0 + 1), daraus wiederum die Gültigkeit von A(n0 + 2) und so weiter. Insgesamt zeigt man also, dass
die Aussage für n0 und alle nachfolgenden natürlichen Zahlen gilt. Verankert man die Induktion bei n0 = 0,
zeigt man mit dem Induktionsschritt also die Gültigkeit für alle natürlichen Zahlen.
8
Schauen wir uns das am Beispiel der Gauß’schen Summenformel an:
Behauptung:
∀n ∈ N :
n
X
k=
k=0
n · (n + 1)
2
d.h. A(n) lautet
n
X
k=0
k=
n · (n + 1)
2
Beweis (Induktion):
•
Induktionsanfang:
Wähle n0 = 0, dann ist
0
X
k=0=
k=0
•
Induktionsschritt:
0·1
, also ist die Induktion bei n0 = 0 verankert.
2
Sei nun n eine beliebige, aber feste natürliche Zahl, für die die Formel gilt. Dann folgt:
n+1
n
X
X
n (n + 1)(n + 2)
n · (n + 1)
(∗)
=
k = (n + 1) +
= (n + 1) · 1 +
k = (n + 1) +
2
2
2
k=0
k=0
In der letzten Zeile wurde an der markierten Stelle die Induktionsvoraussetzung eingesetzt, nämlich dass A(n)
für dieses feste, aber beliebige n gültig ist. Demnach kann man die Summe durch den gleichwertigen Ausdruck
ersetzen. Damit zeigt man aber die Gültigkeit von A(n + 1). Wichtig ist hierbei, dass A(n + 1) nicht allgemein
gültig ist, sondern nur unter der Voraussetzung gilt, dass A(n) gültig ist. Somit wird ganz abstrakt gezeigt, dass
aus der Gültigkeit einer Aussage die Gültigkeit der nächsten Aussage folgt. Dabei bedeutet die Formulierung
beliebig, aber fest, dass man ein n betrachtet, das einen fixen Wert angenommen hat, den man allerdings nicht
genauer spezifizieren kann. Erst im Zusammenspiel von Induktionsverankerung und Induktionsschritt ergibt
sich der erwünschte Beweis.
Aufgabe 5
Beweisen Sie folgende Behauptung:
∀n ∈ N :
n
X
k2 =
k=0
n · (n + 1) · (2n + 1)
6
Aufgabe 6
Wenn Sie zeigen möchten, dass n > n + 1 (was natürlich völliger Quatsch ist), können Sie das mit
vollständiger Induktion versuchen. Was funktioniert, wo gibt es Schwierigkeiten?
Zuletzt wollen wir noch den in Kapitel 1 angekündigten binomischen Lehrsatz mittels vollständiger Induktion
zeigen. Der Beweis ist ein wenig länglich, aber instruktiv.
Aufgabe 7
Beweisen Sie den binomischen Lehrsatz, also dass für a, b ∈ R und n ∈ N gilt:
(a + b)n =
n X
n k n−k
a b
k
k=0
Hinweis: Sie dürfen aus Kapitel 1 verwenden:
durch.
n
k
+
n
k+1
=
n+1
k+1
. Führen Sie eine Indexverschiebung
Damit haben wir einen kurzen Einblick gewonnen in die wichtigsten mathematischen Beweistechniken. Zwar
sind diese Muster oft anwendbar, aber dennoch gehört für die einzelnen Schritte und Ableitungen meist eine
große Menge an Kreativität und Geschick dazu. Neben den hier vorgestellten Beweistechniken gibt es noch
weitere, und es gibt keine allgemeingültigen Regeln, die vorschreiben, wann welche Methode zu verwenden
ist. Es gibt sogar mathematische Sätze, die sich per se weder beweisen noch widerlegen lassen (Gödelscher
Unvollständigkeitssatz).
9
Kapitel 4 – Folgen und Konvergenz
Heute beschäftigen wir uns mit einem Thema, das viele schon aus der Schule kennen und mit dem viele intuitiv
umgehen können. Unser Ziel ist es, dieses Thema etwas zu formalisieren. Es geht um den Begriff der Konvergenz
von Folgen. Eine Folge ist eine Aneinanderreihung von Zahlen – dies können endlich oder unendlich viele sein.
Endliche Folgen sind nicht besonders spannend und sollen uns hier nicht weiter interessieren. Wir betrachten
Folgen, die für jeden beliebigen Index n ∈ N eine reelle Zahl an ∈ R als Folgenglied liefern. Folgen können
explizit dargestellt werden durch die Angabe der Folgenglieder oder einer Berechnungsformel dafür. Greift die
Formel zur Berechnung des n-ten Folgenglieds auf die Werte von a1 , . . . , an−1 zurück, spricht man von einer
rekursiv definierten Folge. Folgen können nun bestimmte Eigenschaften haben, die wir hier definieren wollen:
(an )n∈N ist monoton steigend
:⇔
∀n, m ∈ N : n > m ⇒ an ≥ am
(an )n∈N ist beschränkt
:⇔
∃c, C ∈ R ∀n ∈ N : c ≤ an ≤ C
(monoton fallend analog)
Aufgabe 1
Entscheiden Sie, welche Folgen monoton fallend/steigend sind und welche Folgen beschränkt sind. Geben
Sie gegebenenfalls Schranken an.
a) an = n − n2
d) dn = 1 − e−
√
(−1)n
n+1
e) en = q n für festes q ∈ R
b) bn =
n
c) cn = cos (πn(n + 1))
Daneben gibt es noch eine weitere sehr zentrale Eigenschaft: Die Konvergenz beschreibt, ob eine Folge sich
für größer werdende Folgenindizes einem Grenzwert annähert. Dies ist freilich nicht für jede Folge der Fall,
an = n2 wächst immer weiter, ohne dass es einen Grenzwert gibt. Nun müssen wir zunächst definieren, was es
heißen soll, dass eine Folge gegen einen Grenzwert konvergiert:
(an )n∈N heißt konvergent mit Grenzwert a
:⇔
∀ε > 0 ∃N ∈ N ∀n ∈ N : n > N ⇒ |a − an | < ε
Wir schreiben limn→∞ an = a und nennen a den Grenzwert der Folge. Was bedeutet das? Die Definition
sagt aus, dass zu jedem beliebig gewählten positiven ε ein Folgenindex N gefunden werden kann, ab dem
der Abstand von den nachfolgenden Folgengliedern zum Grenzwert kleiner ist als ε. Wie groß dieses N ist,
ist dabei unerheblich. Wichtig ist nur, dass man zu jedem noch so kleinen ε ein N (ε) finden kann, sodass
die Abstandsbedingung erfüllt ist. Anschaulich gesprochen kommen die Folgenglieder dem Grenzwert also
beliebig nahe – in jeder noch so kleinen Umgebung um den Grenzwert liegen ab einem gewissen Index alle
Folgenglieder, und nur endlich viele Folgenglieder liegen außerhalb der Umgebung. Für den Nachweis der
Konvergenz ist damit auch gar nicht relevant, das optimale N (ε) zu finden, ab dem tatsächlich alle Nachfolger
einen hinreichend kleinen Abstand zum Grenzwert haben.
Aufgabe 2
a) Weisen Sie explizit nach, dass die Folge (an )n∈N\{0} mit an =
1
n
gegen 0 konvergiert.
b) Zeigen Sie, dass die Folge (an )n∈N mit an = (−1)n nicht konvergiert.
c) Sei die Folge (an )n∈N konvergent, ist dann auch die Folge (bn )n∈N mit bn = an+2 konvergent?
10
Offensichtlich ist also nach Aufgabenteil b) nicht jede beschränkte Folge konvergent (Umgekehrt ist aber
jede konvergente Folge beschränkt). Ist eine Folge jedoch sowohl beschränkt als auch monoton, dann folgt
Konvergenz, wie wir jetzt beweisen möchten. Dazu betrachten wir ohne Beschränkung der Allgemeinheit
unseres Beweises eine beschränkte und monoton steigende Folge (an )n∈N . Wäre sie monoton fallend, dann
wäre bn = −an monoton steigend und wir könnten Aufgabe 3 benutzen.
Behauptung:
Jede beschränkte und monoton steigende Folge (an )n∈N ist konvergent.
Beweis:
Sei a die kleinste obere Schranke an die Folge, das heißt für alle Folgenglieder gilt
a ≥ an und es gibt keine kleinere Zahl, die diese Eigenschaft ebenso erfüllt (Dass
diese Zahl eindeutig ist und immer existiert, folgt aus der Vollständigkeit von R).
Da die Folge beschränkt ist, gilt a < ∞. Betrachte nun ein beliebiges ε > 0.
Nun ist a − ε < a und es gibt ein Folgenglied aN , sodass a − ε < aN ≤ a.
Dieses Folgenglied muss es geben, da sonst a − ε eine kleinere obere Schranke wäre.
Aufgrund der Monotonie von (an )n∈N gilt für alle n > N :
Aufgelöst nach ε ergibt das:
a − ε < aN ≤ an
∀n ∈ N : n > N ⇒ a − an < ε
Da ε beliebig gewählt war und wir mit der obigen Argumentation zu jedem ε ein N ∈ N
finden, das die Relation erfüllt, haben wir die Konvergenzbedingung nachgewiesen!
Aufgabe 3
Sei (an )n∈N eine konvergente Folge und λ ∈ R\{0}. Zeigen Sie, dass dann auch (λ · an )n∈N konvergiert.
Für λ = −1 haben Sie damit gezeigt, dass auch monoton fallende und beschränkte Folgen konvergieren.
Zuletzt haben wir gesehen, dass man Folgen mit Konstanten multiplizieren kann und die Eigenschaft der
Konvergenz erhalten bleibt. Wir wollen uns im Weiteren damit beschäftigen, welche weiteren algebraischen
Operationen in Ordnung sind und bei welchen Vorsicht geboten ist. Die Idee dazu wird sein, dass man ausnutzt,
dass es für konvergente Folgen eine Zuordnung ε 7→ N gibt, um für die zu untersuchende Folge eine Zuordnung
ε 7→ Ñ zu finden. Gelingt dies, ist die Verträglichkeit von Grenzwertbildung mit dieser Operation gezeigt –
ansonsten ist es meist einfach, eine Behauptung durch ein geeignetes Gegenbeispiel zu widerlegen.
Aufgabe 4
Gelten die im Folgenden behaupteten Rechenregeln für Grenzwertprozesse? Liefern Sie eine kurze Begründung oder ein Gegenbeispiel.
a) Seien (an )n∈N und (bn )n∈N konvergente Folgen. Dann ist auch (an + bn )n∈N konvergent.
b) Seien (an )n∈N und (bn )n∈N konvergente Folgen. Dann ist auch abnn
konvergent.
n∈N
c) Sei die Folge (an · bn )n∈N konvergent, dann konvergieren auch (an )n∈N und (bn )n∈N .
d) Seien (an )n∈N und (bn )n∈N konvergente Folgen. Dann ist auch die Folge (cn )n∈N mit c2n = an und
c2n+1 = bn konvergent.
Nachdem wir nun einige algebraische Operationen untersucht haben, die man mit Folgen durchführen kann,
wollen wir uns noch dem Thema Abschätzungen widmen. Abschätzungen können helfen, den tatsächlichen
Grenzwert einer Folge zu bestimmen (und nicht nur zu entscheiden, ob eine Folge konvergiert oder nicht). Wir
betrachten eine Folge (an )n∈N und wollen diese nach oben abschätzen. Dazu suchen wir eine Folge (bn )n∈N ,
welche bn > an erfüllt. Wenn (an )n∈N und (bn )n∈N konvergente Folgen sind mit den Grenzwerten
lim an = a
n→∞
und
11
lim bn = b
n→∞
dann kann man zeigen:
∀n ∈ N : an < bn
⇒
a≤b
Insbesondere können die Grenzwerte aber durchaus gleich sein, wie man an den Folgen n1
− n1 n∈N\{0} unschwer erkennen kann – beide konvergieren gegen 0.
Abschließend wollen wir noch kurz einen hilfreichen Zusammenhang konstatieren und beweisen.
Behauptung:
n∈N\{0}
und
Sei (an )n∈N eine Folge, und sei (bn )n∈N eine obere Abschätzung und (cn )n∈N eine
untere Abschätzung. Wenn (bn )n∈N und (cn )n∈N beide gegen den gleichen Wert a
konvergieren, dann konvergiert auch (an )n∈N gegen diesen Wert.
Beweis:
Für jedes ε > 0 finden wir natürliche Zahlen Nb und Nc , sodass
|cn − a| < ε und |bn − a| < ε für alle n > N = max(Nb , Nc ).
Dies lässt sich äquivalent umformulieren zu:
a − ε < cn < a + ε und a − ε < bn < a + ε
Wegen cn < an < bn gilt also auch a − ε < an < a + ε
für alle n > N und die Folge (an )n∈N konvergiert ebenfalls gegen a.
Wir können das nutzen, wenn wir eine unbekannte Folge auf Konvergenz untersuchen möchten. Wir müssen
die Folge nur nach oben und unten gegen konvergente Folgen mit gleichem Grenzwert abschätzen, um nachzuweisen, dass die unbekannte Folge auch gegen diesen Grenzwert konvergiert. In der letzten Aufgabe für heute
versuchen wir, ein paar Grenzwerte zu bestimmen.
Aufgabe 5
Bestimmen Sie die jeweiligen Grenzwerte der konvergenten Folgen:
a) (an )n∈N\{0} mit an =
√
2n+5√ n3
8n· n
b) (bn )n∈N\{0} mit bn = nn!n
√
c) (cn )n∈N mit cn = n2 + n − n.
d) (dn )n∈N mit dn+1 = 2 +
1
dn
und d0 = 1.
12
Kapitel 5 – Reihen und Taylorreihen
Das heutige Thema schließt sich an den Themenblock zur Konvergenz von Folgen an. Heute untersuchen wir
eine spezielle Art von Folgen, nämlich Reihen. Eine Reihe ist eine Summe mit unendlich vielen Summanden:
S=
∞
X
sk
k=0
Gewiss werden aber nicht alle Summen einen wohldefinierten, endlichen Wert ergeben – zur mathematischen
Behandlung interpretieren wir eine Reihe als Folge von sogenannten Partialsummen. Wir definieren eine Folge
(pn )n∈N
mit pn =
n
X
sk
k=0
Dabei schneiden wir also die Summation für jedes Folgenglied nach dem n-ten Summanden ab. Den Wert der
Reihe verstehen wir nun als Grenzwert der Folge der Partialsummen:
S=
∞
X
sk = lim pn
n→∞
k=0
Wir haben also prinzipiell sämtliche Schwierigkeiten mit Reihen auf die wohlbekannte Konvergenz von Folgen
zurückgeführt. Wenn die Folge der Partialsummen konvergiert, spricht man auch von einer konvergenten Reihe,
sonst ist die Reihe nicht wohldefiniert.
P∞Eigenschaften
P∞wie die Linearität oder Abschätzungen vererben sich auf
Reihen, das heißt wenn die Reihen k=0 sk und k=0 rk wohldefiniert sind, gilt:
Für α, β ∈ R :
α·
∞
X
sk + β ·
k=0
∞
X
rk =
k=0
∀k ∈ N : sk < rk
⇒
∞
X
(αsk + βrk )
k=0
∞
X
k=0
sk <
∞
X
rk
k=0
Damit können wir nun erste Grenzwerte von Reihen bestimmen:
Aufgabe 1
P∞
Pn
1
Berechnen Sie den Wert der Reihe k=1 sk mit sk = k1 − k+1
, indem Sie die Partialsummen pn = k=1 sk
berechnen und den Grenzwert limn→∞ pn bestimmen.
Wenn wir uns fragen, wann eine Reihe konvergiert, kommen wir ziemlich schnell zu einem Ausschlusskriterium: Ist die Folge der Summanden (sk )k∈N keine Nullfolge, dann unterscheiden sich zwei aufeinanderfolgende
Partialsummen pn und pn+1 auch für beliebig große n stets um einen noch nicht beliebig kleinen Betrag. Das
heißt, dass P
die Folge der Partialsummen nicht gegen einen Grenzwert konvergieren kann. Insbesondere ist eine
∞
Reihe wie k=0 (−1)k nicht wohldefiniert, denn die Partialsummen oszillieren zwischen den Werten 0 und 1
hin und her und konvergieren nicht.
P∞
Es reicht jedoch nicht aus, dass die Folge der Summanden (sk )k∈N eine Nullfolge ist. Die Reihe k=1 k1 heißt
harmonische Reihe, sie konvergiert aber nicht gegen einen endlichen Wert. Das liegt darin begründet, dass
die Summanden nicht schnell genug abfallen, sodass die Partialsummen immer größer werden und über jede
Grenze wachsen – ähnlich wie beim Integral
Z ∞
1
dx = lim ln(x) − ln(1) = ∞
x→∞
x
1
Daher ist das gefundene Kriterium nur ein notwendiges, kein hinreichendes. Es wird auch Trivialkriterium
genannt. Darüber hinaus gibt es noch weitere Kriterien, die die Konvergenz von Reihen zusichern – diese
werden ausführlich in der Vorlesung Mathematik für Studierende der Physik 1 thematisiert.
13
Eine besonders wichtige Rolle kommen den sogenannten geometrischen Reihen zu. Das sind Reihen, deren
Summanden von der Form xk sind. Das vermeintliche Paradoxon um Achilles und die Schildkröte beruht auf
eben so einer Reihe. Für x = 21 ergibt sich:
∞
X
1 1 1
1
= 1 + + + + ... = 2
2k
2 4 8
k=0
Zum Nachweis bemühen wir Aufgabe 2 vom Themenblock über Beweistechniken. Dort haben wir gezeigt, dass
n
X
xk =
k=0
1 − xn+1
1−x
Sei nun |x| < 1, dann ist limn→∞ xn+1 = 0. Damit ergibt sich:
∞
X
1
1 − xn+1
=
n→∞
1−x
1−x
xk = lim
k=0
Tatsächlich ergibt sich für x =
erfüllt und die Reihe divergiert.
1
2
der erwartete Grenzwert von 2. Für |x| ≥ 1 ist das Trivialkriterium nicht
Aufgabe 2
a) Bestimmen Sie den Wert der Reihe
P∞
x2k .
b) Bestimmen Sie den Wert der Reihe
P∞
kxk . Hinweis: Nutzen Sie
k=0
k=1
d
dx
P∞
k=0
xk =
P∞
d k
k=0 dx x
In der Vorlesung wurde die berühmte Taylorformel
Tf (x) =
k ∞
X
d f
1
·
· (x − x0 )k
k!
dxk x=x0
k=0
besprochen. Sie liefert zu einer Funktion f die sogenannte Taylorreihe. Schneidet man die Summe ab und lässt k
(n)
nur bis zur oberen Grenze n iterieren, erhält man das n-te Taylorpolynom Tf (x). Diese sind Approximationen
an die Funktion f .
Aufgabe 3
Plausibilisieren Sie die Taylorformel, indem Sie nachweisen, dass die Taylorreihe Tf (x) direkt an der
Entwicklungsstelle x0 in allen Ableitungen mit f übereinstimmt:
dn
dn T
=
f
f
dxn
dxn x=x0
x=x0
Das Muster, das wir nun einige Male einüben möchten, besteht also darin, dass wir zu einer gegebenen Funktion
f in einem Entwicklungspunkt (meistens wird das x0 = 0 sein) die Werte
f (x0 ),
f 0 (x0 ),
f 00 (x0 ),
f 000 (x0 ),
···
berechnen und auf ein Muster hin untersuchen, sodass wir einen allgemeinen Ausdruck für
können.
14
dn f
dxn |x=x0
finden
Aufgabe 4
Entwickeln Sie die folgenden Funktionen in Taylorreihen um x0 = 0, indem Sie ein Muster in den Ableitungen erkennen
a) f (x) = exp(x)
b) f (x) = sin(x)
c) f (x) = cos(x)
d) f (x) = ln(1 + x)
e) f (x) = sinh(x)
f) f (x) = cosh(x)
Damit haben wir die sogenannten Potenzreihendarstellungen
P∞der elementaren Funktionen exp, sin und cos
hergeleitet. Potenzreihen, also Funktionen der Form P (x) = k=0 ak (x−x0 )k , sind beispielsweise dann wichtig,
wenn wir in der Quantenmechanik nicht mehr das Exponential einer Zahl berechnen wollen, sondern von einer
Matrix oder gar einem noch komplexeren Objekt. Für heute wollen wir sie nutzen, um die berühmte EulerFormel für komplexe Zahlen nachzuvollziehen.
Aufgabe 5
Nutzen Sie die Reihendarstellung von exp, sin und cos, um
exp(ix) = cos(x) + i · sin(x)
zu beweisen.
Auch wenn es für die oben betrachteten Funktionen der Fall ist, können wir nicht zeigen, dass sich die Taylorreihe tatsächlich so verhält wie die Funktion, die sie approximieren soll. Entwickelt man beispielsweise die
Funktion
(
für x 6= 0
exp −1
x2
f :R→R
f (x) =
0
sonst
um x0 = 0 in eine Taylorreihe, stellt man fest, dass alle Ableitungen verschwinden, die Taylorreihe ist also die
konstante Nullfunktion. Für diese Funktion stimmt also ihre Taylorreihe ausschließlich in der Entwicklungsstelle
mit ihrer zugrundeliegenden Funktion überein.
Manchmal ist es nicht oder nur schwer möglich, ein wiederkehrendes Muster in den Ableitungen zu erkennen.
Es ist damit jedoch nicht ausgeschlossen, dass man eine Potenzreihe findet, wie das folgende Beispiel illustriert.
Aufgabe 6
Bestimmen Sie die Potenzreihenentwicklung von f (x) = arctan(x). Nutzen Sie dafür
Z x
1
arctan(x) =
dt
1
+
t2
0
und interpretieren Sie den Integranden als Grenzwert einer geometrischen Reihe.
15
Kapitel 6 – Elementare Differentialgleichungen
Differentialgleichungen sind in den Naturwissenschaften unabdingbar. Die Maxwellgleichungen der Elektrodynamik ebenso wie die Schrödingergleichung der Quantenmechanik werden als solche formuliert. Bei einer Differentialgleichung wird eine nicht näher spezifizierte Funktion f in Abhängigkeit zu ihren Ableitungen f 0 , f 00 , . . .
ausgedrückt. Das Ziel ist es dann, eine Funktion zu finden, die die Differentialgleichung erfüllt. Sehen wir uns
als Beispiel eine recht leicht anschaulich zu rechtfertigende Differentialgleichung an: die Differentialgleichung
für den radioaktiven Zerfall. Wir suchen die Anzahl der nach einer gewissen Zeit t noch vorhandenen Atome N (t). Da die Kerne stochastisch und unkorreliert zerfallen, können wir davon ausgehen, dass die Anzahl
der Zerfälle pro Zeiteinheit (also die Änderungsrate − dN
dt ) proportional ist zur Anzahl der Kerne, die noch
vorhanden sind:
dN (t)
−
= λ · N (t)
mit λ > 0 konstant
dt
Dies ist formal eine lineare Differentialgleichung erster Ordnung. Linear ist sie deshalb, weil die auftretenden
Ableitungen der gesuchten Funktion N nur linear auftreten und nicht etwa quadratisch. Die Ordnung gibt an,
was die höchste auftretende Ableitung ist. Hier tritt neben der Funktion selbst nur die erste Ableitung auf.
Bei dieser einfachen Differentialgleichung können wir durch Hinschauen die Lösung erraten:
N (t) = c · exp(−λt)
mit c ∈ R
Da wir zu jedem Parameter c eine gültige Lösung haben, haben wir noch keine eindeutige Lösung zur Differentialgleichung. Dazu müssen wir noch spezifieren, wie viele Kerne am Anfang bei t = 0 vorhanden waren:
!
N (t = 0) = c · exp(0) = N0
⇒
N (t) = N0 · exp(−λt)
Dies ist sehr generell: Für eine eindeutige Lösung der Differentialgleichung sucht man nicht nur nach einer
Funktion, deren Ableitungen die gewünschte Relation erfüllen, sondern man benötigt noch Anfangsbedingungen, mit denen auftretende Konstanten auf einen Wert festgelegt werden können. Für eine Differentialgleichung
erster Ordnung braucht man dabei eine Anfangsbedingung, für eine Differentialgleichung n-ter Ordnung sind
es n (In der Vorlesung Mathematik für Studierende der Physik 2 wird untersucht, welche Bedingungen erfüllt
sein müssen, damit man sich überhaupt sicher sein kann, dass eine Differentialgleichung eine Lösung hat und
ob diese eindeutig ist – das ignorieren wir hier).
Nun möchten wir das ganze etwas formaler betreiben, um allgemeine Regeln und Vorgehensweisen abzuleiten.
Gesucht ist im Folgenden stets eine Funktion y(t). Wir betrachten eine Differentialgleichung erster Ordnung
von der Form:
dy
= F [y(t)] · G(t)
dt
Dabei stecken in F sämtliche Abhängigkeiten von der gesuchten Funktion, in G steckt die explizite Abhängigkeit von t. Es lässt sich nicht jede Differentialgleichung in eine solche Form bringen, dass die explizite
t-Abhängigkeit entkoppelt, aber wenn es möglich ist, können wir das Verfahren zur Trennung der Variablen
anwenden, um eine Lösung zu erhalten. Dazu teilen wir durch F und integrieren in t-Richtung mit unbestimmten Grenzen:
Z
Z
1
dy
·
· dt = G(t) dt
F [y(t)] dt
Wir erkennen, dass wir auf der linken Seite die Ketten- beziehungsweise Substitutionsregel der Integralrechnung
anwenden können:
Z
Z
1
dy = G(t) dt
F (y)
Diese Integrale können wir dann berechnen und das Ergebnis nach y(t) umformen, um die Differentialgleichung
zu lösen. Unbedingt zu beachten ist dabei die auftretende Integrationskonstante, durch deren Wahl abschließend
die Anfangsbedingung erfüllt werden kann.
Nun wollen wir uns mit einigen einfachen (aber nicht unbedingt linearen) Differentialgleichungen beschäftigen,
die sich mit dem Verfahren zur Trennung der Variablen lösen lassen:
16
Aufgabe 1
Bestimmen Sie die Lösung y(t) der Differentialgleichungen zu den gegebenen Anfangswerten.
a) y 0 (t) = t exp(−y(t))
mit y(1) = 0
π
mit y
=0
4
mit y(2) = 8
b) y 0 (t) − y(t)2 = 1
c) (t2 + 1)y 0 (t) = 2ty(t)
p
y 0 (t)
y 0 (t)
y(t)
tanh(t)
+
=
8
d)
sinh2 (t)
cosh2 (t)
mit y (ln(2)) = 0
Für schwierigere Differentialgleichungen, bei denen diese einfache Herangehensweise nicht zielführend ist, behilft man sich oft eines Ansatzes. Das bedeutet, dass man rät, dass die Lösung eine gewisse Form hat, und
diese Form in die Differentialgleichung einsetzt, um sie zu vereinfachen und dann zu lösen. Natürlich kann
ein geratener Ansatz falsch sein – dann wird die Differentialgleichung sich nicht vereinfachen oder auf eine
nicht lösbare Gleichung führen. Grundsätzlich gilt aber: Wie auch immer man zum Ergebnis gelangt, wenn es
die Differentialgleichung erfüllt, ist es richtig (Ausnahme: die Lösung ist mehrdeutig, dann beschränkt man
sich gegebenenfalls zu Unrecht im Lösungsraum). Wir können also stets durch Einsetzen überprüfen, ob die
Differentialgleichung korrekt gelöst wurde. Dies wollen wir am Beispiel der Schwingungsgleichung für eine freie,
ungedämpfte Schwingung durchführen. Wie viele klassischen Bewegungsgleichungen der Physik handelt es sich
um eine Differentialgleichung zweiter Ordnung, weil die Beschleunigung als zweite Ableitung des Ortes nach
der Zeit auftritt:
r
k
00
00
2
my (t) = −ky(t)
⇒
y (t) = −ω y(t) mit ω =
m
Aufgabe 2
Lösen Sie die Schwingungsgleichung mit dem Ansatz:
y(t) = A · exp(λt)
Hinweis: Lassen Sie zu, dass λ eine komplexe Zahl ist.
Wie zu erwarten war, ergeben sich hier bei der Lösung einer linearen Differentialgleichung zweiter Ordnung
zwei unterschiedliche Lösungen, die wir zur allgemeinen Lösung zusammenaddieren können, und wir benötigen zwei Anfangsbedingungen, um sie eindeutig festzulegen. Typischerweise werden y(0) = y0 und y 0 (0) = v0
als Anfangsauslenkung und Anfangsgeschwindigkeit vorgegeben. Man kann auch noch einen Dämpfungsterm
−δy 0 (t) mit in die Bewegungsgleichung aufnehmen – mit dem gleichen Ansatz gelangt man dann nach etwas
mehr Rechenaufwand zu echten physikalischen Schwingungen, die mit der Zeit abklingen. Insbesondere manifestieren sich durch die Verhältnisse der Parameter verschiedene physikalische Phänomene in den Gleichungen.
Der Ansatz y ∼ exp(λt) ist also allgemein genug, um die Differentialgleichung zu lösen.
Wir haben uns bisher stillschweigend größtenteils mit homogenen Differentialgleichungen beschäftigt. Es gab
nie einen t-abhängigen Störterm J(t), wie er hier auftritt:
y 0 (t) = −2y(t) + sin(t)
| {z }
=J(t)
Ein Störterm (oder auch Inhomogenität genannt) ist ein Summand, der nicht von der Funktion oder ihren
Ableitungen abhängt. Bevor wir uns anschauen, mit welchem Verfahren wir diesen Störterm eliminieren, machen wir uns kurz allgemeine Gedanken über die Lösung einer homogenen linearen Differentialgleichung. Da
alle Ableitungen nur linear auftreten, ist die Summe zweier Lösungen wie oben bereits erwähnt wieder eine
17
Lösung der Differentialgleichung:
Behauptung:
Seien y1 (t) und y2 (t) Lösungen von y(t) = F [y 0 (t), y 00 (t), . . . , t], dann ist auch
y1 (t) + y2 (t) eine Lösung.
Beweis:
Betrachte
F [y10 (t) + y20 (t), y100 (t) + y200 (t), . . . , t]
(∗)
= F [y10 (t), y100 (t), . . . , t] + F [y20 (t), y200 (t), . . . , t] = y1 (t) + y2 (t)
Im mit (∗) markierten Schritt wurde ausgenutzt, dass F linear in allen auftretenden Ableitungen ist. Nun
können wir uns also den abstrakten Lösungsraum zu einer homogenen, linearen Differentialgleichung vorstellen
als Ursprungsgerade – denn auch diese erfüllt die Relation, dass die Vektoren zu zwei Punkten, die auf der
Geraden liegen, addiert wieder einen Vektor zu einem Punkt der Geraden ergeben. Außerdem ist bei allen
homogenen Differentialgleichungen die triviale Lösung y(t) = 0 ∀t gegeben. Die allgemeine Lösung einer
homogenen, linearen Differentialgleichung ist also vergleichbar mit dem Richtungsvektor der Geraden.
Betrachtet man nun eine inhomogene Differentialgleichung
y(t) = F [y 0 (t), y 00 (t), . . . , t] + J(t)
dann ist y = 0 keine Lösung mehr – im Bild der Geraden geht diese nun nicht mehr durch den Ursprung. Der
Lösungsraum einer inhomogenen, linearen Differentialgleichung ist also ebenso eine Gerade wie der Lösungsraum einer homogenen Gleichung, nur dass jene wegen der Inhomogenität verschoben wurde. Wir können
also zu einer inhomogenen Differentialgleichung eine zugehörige homogene bilden, indem wir den Störterm
ignorieren. Die Lösung davon bleibt der Richtungsvektor. Nun brauchen wir noch einen Stützvektor, der die
Verschiebung kompensiert. Dieser lässt sich mittels des Verfahrens der Variation der Konstanten ermitteln.
Dabei wird ausgehend von der allgemeinen homogenen Lösung die dort auftretende Konstante als variabel
angenommen, um nach Einsetzen in die Differentialgleichung eine Bestimmungsgleichung zu erhalten. Addiert
man zum Schluss die allgemeine Lösung der homogenen Differentialgleichung und die spezielle Lösung zur Inhomogenität, hat man die allgemeine Lösung der inhomogenen Differentialgleichung bestimmt. Dieses Konzept
wollen wir nun auf die obige inhomogene Gleichung anwenden:
y 0 (t) = −2y(t) + sin(t)
Zugehörige homogene DGL:
y 0 (t) = −2y(t)
Trennung der Variablen, die homogene Lösung lautet:
yh (t) = c · exp(−2t)
Spezielle Lösung durch Variation der Konstanten – Ansatz c = c(t)
0
!
ys0 (t) = c(t) · exp(−2t) = −2c(t) · exp(−2t) +c0 (t) · exp(−2t) = −2ys (t) + sin(t)
{z
}
|
=−2ys (t)
0
Daraus lässt sich ablesen: c (t) · exp(−2t) = sin(t)
Z
exp(2t)
⇒ c(t) = exp(2t) sin(t) dt =
(2 sin(t) − cos(t))
5
exp(2t)
(2 sin(t) − cos(t))
ys (t) = exp(−2t) ·
(2 sin(t) − cos(t)) =
5
5
(2 sin(t) − cos(t))
Allgemeine Lösung der inhomogenen DGL: y(t) = c · exp(−2t) +
5
Aufgabe 3
Bestimmen Sie die allgemeinen Lösungen der inhomogenen linearen Differentialgleichungen!
a) y 0 (t) = y(t) + t exp(2t)
b) y 0 (t) =
y(t)
+t−1
1−t
18
Notizen