Mathematischer Vorkurs WiSe 2017 / 2018 Fortgeschrittene Themenblöcke Fachbereich Physik Universität Hamburg Inhaltsverzeichnis Kapitel 1 – Summen- und Produktzeichen 1 Kapitel 2 – Aussagenlogik 4 Kapitel 3 – Beweistechniken 7 Kapitel 4 – Folgen und Konvergenz 10 Kapitel 5 – Reihen und Taylorreihen 13 Kapitel 6 – Elementare Differentialgleichungen 16 Das vorliegende Kursmaterial bildet den stofflichen Inhalt der Fortgeschrittenen Themenblöcke, die ergänzend zum Mathematischen Vorkurs für die Studierenden angeboten werden, die Spaß und Interesse an noch mehr Mathematik haben, als ohnehin schon im gewöhnlichen Curriculum präsentiert wird. Es wird keineswegs für ein gelingendes Physikstudium vorausgesetzt, die hier dargestellten Inhalte schon vor Studienbeginn mitzubringen – vielmehr sind inhaltliche Überschneidungen insbesondere mit dem Modul Mathematik für Studierende der Physik unvermeidbar. In der Themenauswahl wird auf die Grundlage von früheren Mathematischen Vorkursen am Fachbereich zurückgegriffen, sie vermittelt einen hoffentlich vielseitigen und ansprechenden Überblick über ausgewählte Inhalte der Höheren Mathematik für Einsteiger. Die Themen der ersten Woche bilden konzeptionelle Fundamente für die Anwendungen der zweiten Woche; es sollte jedoch auch ohne den Besuch der vorhergehenden Themenblöcke möglich sein, sich an den neuen Sachverhalten zu probieren und viel zu lernen. Die Aufgaben finden sich eingebettet in kurze Erklärungen, damit im Nachhinein auch ohne Hilfestellung das Erlernte wiederholt werden kann. Ich bin sehr dankbar für jede Art von Feedback und Kommentaren – gewiss haben sich irgendwo Fehler eingeschlichen oder Unklarheiten versteckt. Diese dürfen sehr gerne an [email protected] gemeldet werden. Stand: 7. September 2017 Kapitel 1 – Summen- und Produktzeichen Das Summenzeichen ist eine abkürzende Schreibweise für eine längere Summe, deren Summanden nach einem bestimmten Muster aufgebaut sind. Als Symbol wird das große Σ (Sigma) benutzt. Dabei werden die Summanden in Abhängigkeit einer Laufvariablen (in der unten stehenden Definition das k) ausgedrückt. Diese Laufvariable nimmt alle ganzen Zahlen zwischen ihrem Anfangswert und ihrem Endwert an; dabei wird der Anfangswert unterhalb und der Endwert oberhalb des Summenzeichens notiert. Die einzelnen Summanden stehen direkt hinter dem Summenzeichen. Seien die von k abhängigen Summanden gegeben durch die Terme ak , dann lässt sich das Summenzeichen rekursiv definieren: m X ak := an + k=n m X ak k=n+1 solange m ≥ n. Zusätzlich müssen wir als Abbruchbedingung noch die leere Summe definieren: Falls die Obergrenze kleiner ist als die Untergrenze, ergibt das Summenzeichen den Wert Null. Diese Definition lässt sich so verstehen, dass man im ersten Schritt k = n setzt und den zugehörigen Summanden an berechnet. Dann erhöht man die Laufvariable auf k = n + 1, berechnet an+1 und addiert das zum Vorherigen. Diese Prozedur wird wiederholt, bis der letzte Summand am ermittelt und addiert wird. So ergibt sich beispielsweise für ak = 1/k: 4 X 1 1 1 1 25 1 = + + + = k 1 2 3 4 12 k=1 Aufgabe 1 Berechnen Sie die Werte der folgenden Ausdrücke: a) 2 X 3k + 2k b) 6 X m m=1 k=−1 c) 2 X √ m (4n − 1) d) 15 X 3z 2 z=17 j=3 Aufgabe 2 Schreiben Sie die folgenden Summen mittels des Summenzeichens: 1 1 1 1 + + + 3 9 27 81 d) 1 − 2 + 3 − 4 + . . . − 16 a) 1 + 3 + 5 + . . . + 19 b) 1 + c) x + 4x2 + 9x3 + . . . + 100x10 Ganz analog zum Summenzeichen wird das Produktzeichen definiert: m Y bk := bn · k=n m Y bk k=n+1 für n ≤ m, und das leere Produkt ist Eins. Damit lässt sich die Fakultät einfach schreiben: n! = 1 Qn k=1 k Aufgabe 3 Zeigen Sie, dass für den Binomialkoeffizienten gilt: n n n+1 + = k k+1 k+1 Y n n−k k Y 1 Y n 1 = j· · k j j=1 j j=1 j=1 Hinweis: Zusätzlich zu oder anstelle von der Angabe von Ober- und Untergrenze werden oft auch Einschränkungen an das Summenzeichen geschrieben, die die Laufvariable zu erfüllen hat. Dann werden nur solche Summanden aufaddiert, für die die Laufvariable die Einschränkung erfüllt, wie die folgenden zwei Beispiele illustrieren: X 1≤k<7 ak = 6 X k gerade X ak k=1 ck = c2 + c4 + c6 + · · · + c36 2≤k≤37 Man kann auch mehrere Summenzeichen schachteln. Die Berechnung verläuft dann so, dass die Laufvariable k der äußeren Summe einen Wert annimmt, dann wird zu diesem festen Wert die innere Summe ausgeführt, bevor k inkrementiert und die innere Summe zum neuen Wert ausgerechnet wird. Schließlich wird alles addiert, wie im Beispiel zu sehen ist: n X m X aj,k = k=1 j=1 m X aj,1 + j=1 m X aj,2 + · · · + j=1 m X aj,n j=1 Aufgabe 4 Gelten die folgenden Beziehungen für Summenzeichen allgemein? Begründen Sie! a) n X (ak + λ · bk + c) = c) xk yk = k=1 e) ak + λ · N N X X n1 =1 n2 =1 n X k=1 ! xk · n X n X bk + c b) ! yk d) m+1 X ak = n X 2 X N Y exp(αj n) j=1 n=1 f) cij dj = n X cij · i=1 2n X (1 + (−1)k ) k=1 ak−1 k=n+1 i,j=1 k=1 exp(α1 n1 + α2 n2 ) = m X k=n k=1 k=1 k=1 n X n X 2 zk = n X dj j=1 n X z2k k=1 Pn Darüber hinaus treten in der Physik oft Summen der Form k=1 ak bk auf (zum Beispiel beim Skalarprodukt von Vektoren). Daher führen wir noch weitere abkürzende Schreibweisen ein. Geht aus dem Kontext hervor, was obere und untere Grenze der Summation sind, lässt man diese in der Notation oft weg und gelangt so P zu einem Ausdruck wie k ak bk . In einigen Situationen, in denen viele Summationen über unterschiedliche Indizes auftauchen, geht man sogar noch weiter: Die Einstein’sche Summenkonvention besagt, dass in einem Produkt oder elementaren Ausdruck über doppelt auftretende Indizes summiert wird. Häufiger darf ein Index dann nicht auftreten. Man spart sich also das Summenzeichen: ak bk . Hier ist also immer Vorsicht geboten: Es muss geklärt werden, ob der Ausdruck nun von einem externen Index k abhängt und für diesen P festen Wert das Produkt ak bk gemeint ist, oder ob in Einstein’scher Summenkonvention die Summation k ak bk gemeint ist. 2 Aufgabe 5 Betrachten Sie die folgenden Ausdrücke in Einstein’scher Summenkonvention. Sind die Ausdrücke wohlgeformt? Über welche Indizes wird summiert? Gibt es freie Indizes? a) aijk bmi ck c) aj blm · j b) akik d) ai bi cj dij e) ak + bk Für heute wollen wir uns nun noch ein Anwendungsbeispiel zur Umformung von Summen ansehen: Wir wollen verstehen, warum ex · ey = ex+y gilt. Dafür benötigen wir einerseits den Binomischen Lehrsatz, den man recht instruktiv mittels vollständiger mathematischer Induktion (siehe Kapitel 3: Beweistechniken) beweisen kann: (a + b)n = n X n k=0 k ak bn−k = n X k=0 n! ak bn−k k!(n − k)! Zusätzlich brauchen wir noch die Reihendarstellung der Exponentialfunktion. Sie kann als Definition der Exponentialfunktion aufgefasst werden und wird im Kapitel 5: Reihen und Taylorreihen hergeleitet. ex := ∞ X xn n! n=0 Dass hier die obere Summationsgrenze unendlich groß ist, birgt eigentlich Schwierigkeiten, die wir jedoch auf den Themenblock zu Reihen und Taylorreihen verschieben. Nun beginnen wir mit dem Beweis: ! ∞ ∞ ∞ k X yj X X xk y j x = · ex · ey = k! j! k!j! j=0 k,j=0 k=0 Die Laufvariablen werden unabhängig voneinander jeden beliebigen Wert annehmen. Wir wollen die Summation ein wenig umsortieren und nach Potenzen von x und y geordnet verfahren. Dazu führen wir die Summe beider Variablen n = k + j ein. Wenn wir über jeden möglichen Wert von n summieren, und auch jede Möglichkeit, wie sich k + j = n ergeben kann, einschließen, haben wir lediglich die Summanden in eine andere Reihenfolge gebracht: n ∞ k+j=n ∞ X X X xk y j X xk y n−k ex · ey = = k!j! k!(n − k)! n=0 n=0 k=0 k,j Nun erweitern wir den Bruch mit n!, um den binomischen Lehrsatz wiederzuerkennen: ex · ey = ∞ n ∞ X X 1 X n! 1 xk y n−k = · (x + y)n = ex+y n! k!(n − k)! n! n=0 n=0 k=0 Damit ist der Beweis abgeschlossen, und wir haben gesehen, dass man beispielsweise mittels Umordnung der Summationsreihenfolge interessante Eigenschaften ableiten kann. Solche Tricks, inklusive dem Vertauschen verschiedener Summen und dem Verschieben von Indizes, finden oft Anwendung, wenn man mathematische Ausdrücke ineinander überführen möchte. Somit sind Summen- und Produktzeichen nicht nur praktisch und üblich in der Organisation von längeren Rechnungen, sondern stellen auch einen Formalismus bereit, um Muster in Ausdrücken zu erkennen und systematisch ausnutzen zu können. 3 Kapitel 2 – Aussagenlogik Die Aussagenlogik ist ein zentrales Konzept zur Formalisierung und Abstraktion von Zusammenhängen, um deren Struktur zu untersuchen und logische Schlüsse zu ziehen. Damit bildet sie einen Grundbaustein der Mathematik. In der Aussagenlogik gibt es Variablen, die die Werte wahr und falsch annehmen können: Bezeichnen wir die Aussage „Heute hat es in Hamburg geregnet“ mit dem Variablensymbol A, dann kann A mit dem Wahrheitswert wahr oder falsch belegt sein. Eine solche Variable im aussagenlogischen Sinne wird oft auch als atomare Formel bezeichnet, um sie von allgemeinen, zusammengesetzten Formeln sprachlich zu unterscheiden. Formeln lassen sich mithilfe von sogenannten Junktoren zu einer neuen Formel kombinieren. Ein recht einfacher Junktor ist ∧, gesprochen „Und“, der zwei Formeln miteinander in Verbindung setzt. Der Wahrheitswert von A ∧ B ist wahr, wenn sowohl A als auch B wahr sind, ansonsten ist er falsch. Die Wirkung vom ∧-Junktor lässt sich mittels einer Wahrheitstafel zusammenfassen: A 0 0 1 1 ∧ (Und) B A∧B 0 0 1 0 0 0 1 1 Dabei muss für jede Kombination von Belegungen der Komponentenformeln A und B — codiert mittels 1 für wahr und 0 für falsch — angegeben werden, welchen Wahrheitswert A ∧ B hat. Mit dieser Schreibweise lassen sich ganz analog vier weitere Junktoren definieren: A 0 0 1 1 ∨ (Oder) B A∨B 0 0 1 1 0 1 1 1 ⇒ (Implikation) A B A⇒B 0 0 1 0 1 1 1 0 0 1 1 1 ⇔ (Äquivalenz) A B A⇔B 0 0 1 0 1 0 1 0 0 1 1 1 ¬ (Negation) A ¬A 0 1 1 0 In der natürlichsprachlichen Bedeutung der Junktoren wird „Oder“ häufig fälschlicherweise als „EntwederOder“ behandelt, deswegen ist es wichtig, zu konstatieren, dass A ∨ B auch dann erfüllt ist, wenn beide Aussagensymbole mit wahr belegt sind. Die Implikation entspricht dem natürlichsprachlichen „Wenn-Dann“-Konstrukt und ist von der Äquivalenz („Genau-Dann-Wenn“) zu unterscheiden. A ⇒ B, also „Wenn A gilt, gilt auch B“, ist wahr, wenn A und B es beide sind; aber auch, wenn A falsch ist, da in diesem Fall gar keine Aussage über die Gültigkeit von B getroffen wird (Aus Falschem folgt Beliebiges). A ⇔ B ist wahr, wenn A und B den gleichen Wahrheitswert haben, uns sonst falsch. Es kann passieren, dass Formeln aufgrund ihrer inneren logischen Struktur unabhängig von der Wahrheitswertbelegung ihrer atomaren Formeln immer wahr sind – solche Formeln nennt man Tautologien. A ∨ ¬A ist eine solche Tautologie, denn in der zugehörigen Wahrheitstafel sind alle Einträge 1: A 0 1 ¬A 1 0 A ∨ ¬A 1 1 4 Aufgabe 1 Weisen Sie die deMorgan’schen Regeln nach, indem Sie die Felder der Wahrheitstafel ausfüllen. Erläutern Sie Ihr Vorgehen. a) ¬(A ∨ B) ⇔ (¬A ∧ ¬B) b) ¬(A ∧ B) ⇔ (¬A ∨ ¬B) A 0 0 1 1 B 0 1 0 1 ¬A ¬B ¬A ∧ ¬B ¬(A ∨ B) ¬A ∨ ¬B ¬(A ∧ B) Aufgabe 2 a) Weisen Sie nach, dass das Distributivgesetz der Aussagenlogik ((A ∨ B) ∧ C) ⇔ ((A ∧ C) ∨ (B ∧ C)) gilt, indem Sie die Wahrheitstafel ausfüllen: A 0 0 0 0 1 1 1 1 B 0 0 1 1 0 0 1 1 C 0 1 0 1 0 1 0 1 A∨B (A ∨ B) ∧ C A∧C B∧C (A ∧ C) ∨ (B ∧ C) Zeigen Sie weiterhin, dass b) (A ⇒ B) ⇔ (¬A ∨ B) c) ((A ⇒ B) ∧ (B ⇒ C)) ⇒ (A ⇒ C) d) (A ⇔ B) ⇔ ((A ⇒ B) ∧ (B ⇒ A)) Eine Verallgemeinerung der Aussagenlogik wird durch die Prädikatenlogik erreicht – in ihr werden noch bestimmte quantitative Eigenschaften von Aussagen untersucht. Dazu werden zunächst die Begriffe Domäne, Instanz und Prädikat eingeführt. Eine Domäne ist eine Menge von Objekten, die beschrieben werden sollen – zum Beispiel die natürlichen Zahlen. Eine Instanz ist eines dieser Objekte aus der Domäne. Das Elementsymbol ∈ gibt an, dass eine Instanz in der Domäne enthalten ist. Ein Prädikat ist nun irgendeine Eigenschaft, bei der für jede Instanz der Domäne entscheidbar ist, ob die Instanz die Eigenschaft erfüllt oder nicht. Notiert wird dies als P (x), wobei P das Prädikat ist und x die Instanz, die P erfüllt (P (x) ist wahr ) oder nicht (P (x) ist falsch). Es gibt auch Prädikate, die von je zwei oder noch mehr Instanzen abhängen wie etwa K(x, y) für „x ist kleiner als y“. Bei mathematischen Prädikaten ist es auch üblich, direkt die mathematische Symbolik als Prädikat zu benutzen, K(x, y) und x < y sind somit gleichwertig. Darüber hinaus werden noch die beiden Quantoren ∀ und ∃ definiert. Mit ihnen ist es möglich, Aussagen darüber zu treffen, inwiefern ein Prädikat von den Instanzen einer Domäne erfüllt wird. ∀, der sogenannte Allquantor, kann als „für alle“ übersetzt werden. Er sagt aus, dass alle Instanzen das nachfolgende Prädikat erfüllen: ∀x ∈ D : P (x) heißt also, dass alle Instanzen aus D die Eigenschaft P haben. Der Doppelpunkt kann dabei stets als „es gilt“ übersetzt werden. Man sagt, der Allquantor habe die Variable x gebunden, da es gar nicht mehr auf die Benennung der Instanzen ankommt. ∀x ∈ D : P (x) ist damit ein Ausdruck, der im aussagenlogischen Sinne wahr oder falsch sein kann. Ganz analog zu ∀ wird der Existenzquantor ∃ mit der 5 natürlichsprachlichen Bedeutung „es existiert“ assoziiert. Auch er kann Variablen binden, sodass ∃x ∈ D : P (x) wahr wird, wenn es in der Domäne mindestens eine Instanz gibt, die das Prädikat erfüllt. Aufgabe 3 Übersetzen Sie die folgenden prädikatenlogischen Formeln ins Deutsche: a) ∀n ∈ N∃m ∈ N : (n > m) ∧ (2m > n) b) ∃x ∈ D : P (x) ⇔ ∀x ∈ D : P (x) c) P ⇒ ∀y ∈ U : W (y) Aufgabe 4 Bilden Sie zu folgenden Sätzen je eine prädikatenlogische Formel. Definieren Sie sich dabei geeignete Prädikate und Domänen. a) Für jede natürliche Zahl n gibt es eine natürliche Zahl m, sodass n oder n + 1 das Doppelte von m sind. b) Wenn eine Zahl durch 4 teilbar ist, dann ist sie auch durch 2 teilbar. c) Jeder Mensch, der an der Universität Hamburg studiert, kennt das Geomatikum. Wir haben damit gesehen, dass sich prädikatenlogische Formeln mittels der Junktoren aus der Aussagenlogik verknüpfen lassen. Dabei kann es sein, dass die Reihenfolge der Quantoren durchaus nicht unerheblich ist: „Für alle Schlösser gibt es einen passenden Schlüssel“ ist etwas anderes als „Es gibt einen Schlüssel, der für alle Schlösser passt“. Eine Besonderheit tritt beim Negieren einer quantorgebundenen Formel auf. Möchte man die Aussage „Alle Tiere sind Hunde“ verneinen, ist das gleichbedeutend zu „Es gibt ein Tier, das kein Hund ist“. Hier zeigt sich, dass aus einer allquantorgebundenen Variable unter Negation eine existenzquantorgebundene Variable hervorgeht. Formalisieren wir das mit der Vereinbarung, dass H(t) das Prädikat „t ist ein Hund“ bezeichne und T die Menge aller Tiere sei, dann sehen wir: ¬ (∀t ∈ T : H(t)) ⇔ (∃t ∈ T : ¬H(t)) Negationen lassen sich also an Quantoren vorbeiziehen, bis sie direkt auf die Prädikate wirken. Dabei wandeln sich die Quantoren ineinander um, aus ∀ wird ∃ und umgekehrt. Aufgabe 5 Negieren Sie die prädikatenlogischen Formeln aus den Aufgaben 3 und 4 und vereinfachen Sie sie möglichst weit. 6 Kapitel 3 – Beweistechniken Mathematische Sätze, Korollare und Lemmata sind Behauptungen, die man in der Mathematik rigoros beweisen muss, damit sie nicht mehr den Status einer Hypothese haben, sondern in dem betrachteten System als gesichert gelten können. Dazu wollen wir uns heute mit einigen elementaren Beweistechniken beschäftigen – also die Frage aufwerfen, wie Behauptungen mittels logischer Muster bewiesen werden können. Dass die hier vorgestellten Beweistechniken gültig sind, mag offenkundig erscheinen, liegt aber bei genauerer Betrachtung daran, dass wir die gängigen Axiome, etwa über Aussagenlogik und natürliche Zahlen, zugrunde legen. Beim Beweisen sollte eine konventionsgetreue Notation beachtet werden. Die Behauptung, die natürlichsprachlich oder in Quantorschreibweise stehen darf, steht als solche gekennzeichnet über dem Beweis. Das Ende des Beweises wird durch die Buchstaben qed für quod erat demonstrandum oder ein Kästchen gekennzeichnet. Die rudimentärste Form des Beweises ist der direkte Beweis. Hierbei versucht man, die Behauptung durch direkte logische Schlüsse oder algebraische Umformungen zu belegen. Der direkte Beweis findet beispielsweise dann häufig Anwendung, wenn man die Gültigkeit einer Gleichung zeigen soll. Dabei geht man von einer Seite der Gleichung aus und überführt sie in den Ausdruck auf der anderen Seite. Ein häufiger Fehler, der auftritt, wenn man die Gültigkeit einer Gleichung zeigen soll und die Gleichung so weit umformt, bis etwas offensichtlich Wahres herauskommt, ist etwas diffizil. Man muss stets darauf achten, nur Äquivalenzumformungen vorzunehmen – Implikationen reichen nicht aus, denn ansonsten würde man lediglich zeigen, dass man aus der eingangs behaupteten Gleichung etwas Wahres folgern kann; das kann man aber auch aus etwas Falschem: Ex falso sequitur quodlibet (Aus Falschem folgt Beliebigies). Wichtig ist aber, dass man durch logische Schlüsse von der schließlich erreichten offenkundig wahren Aussage rückwärts auf die Gültigkeit der Behauptung schließen kann. Aus diesem Grund ist es oft sicherer, wie eingangs beschrieben die beiden Ausdrücke ineinander zu überführen. Beispiel: Behauptung: Die Summe zweier ungerader Zahlen ist gerade. Beweis: Seien a und b ungerade natürliche Zahlen, das heißt ∃n, m ∈ N : (a = 2n + 1) ∧ (b = 2m + 1) Dann gilt a + b = 2n + 2m + 2 = 2 · (n + m + 1) ∈ 2N, also ist a + b gerade. | {z } ∈N Zu beachten ist außerdem, dass wenn eine „Genau dann wenn“ -Beziehung gezeigt werden soll, oft je ein Beweis für jede Richtung geführt werden muss, denn (A ⇔ B) ⇔ ((A ⇒ B) ∧ (B ⇒ A)), vergleiche Kapitel 2. Das bedeutet, dass man einmal annehmen darf, dass A gilt, und man daraus B folgern muss, und einmal umgekehrt aus der Gültigkeit von B die Gültigkeit von A gefolgert werden muss (Natürlich kann man statt B ⇒ A auch ¬A ⇒ ¬B zeigen). Aufgabe 1 Zeigen Sie durch einen direkten Beweis, dass eine Zahl m genau dann gerade ist, wenn ihr Quadrat m2 = n gerade ist. Aufgabe 2 Zeigen Sie durch einen direkten Beweis, dass für alle natürlichen Zahlen n und für x 6= 1 gilt: n X xk = 1 + x + x2 + · · · + xn = k=0 1 − xn+1 1−x Dem direkten Beweis recht ähnlich ist der Beweis durch Widerspruch (reductio ad absurdum), auch indirekter Beweis genannt. Dieser macht Gebrauch davon, dass genau dann, wenn ein Satz S gilt, seine Verneinung nicht gültig ist: (S ist wahr) ⇔ (¬S ist falsch) 7 Dafür wird die Behauptung logisch negiert und unter der Annahme dieser negierten Behauptung ein logischer Widerspruch erzeugt. Wir können in diesem Fall ausschließen, dass ¬S gültig ist (dies folgt aus Kalkülen des logischen Schließens, die hier den Rahmen sprengen würden), und damit muss S wahr sein (tertium non datur ). Das Auftreten des logischen Widerspruchs signalisiert man mit einem Blitz-Symbol. Möchte man beispielsweise einen Satz beweisen, der aus gewissen Vorbedingungen eine Aussage folgert, lässt sich dieses Verfahren oft anwenden. Die Behauptung lautet abstrahiert A ⇒ B und die negierte Behauptung damit A ∧ ¬B. Nun wird angenommen, dass A und ¬B gelten, und durch Umformungen gezeigt, dass ein logischer Widerspruch auftritt. Damit muss die Annahme falsch sein, und damit ist die ursprüngliche Behauptung bewiesen. Beispiel: Behauptung: Es gibt unendlich viele verschiedene Primzahlen. Beweis durch Widerspruch: Annahme: Es gibt nur n < ∞ viele Primzahlen. Diese seien P = {p1 , p2 , . . . , pn } n Y Nun können wir z = pk bilden. Diese Zahl ist durch alle Primzahlen teilbar. k=1 Also ist z + 1 durch keine dieser Primzahlen teilbar. Damit hat z + 1 aber weitere Teiler, die nicht in P sind, oder ist selbst prim. In beiden Fällen gilt, dass es nicht nur n verschiedene Primzahlen gibt. Widerspruch zur Annahme Es kann also nicht nur endlich viele Primzahlen geben. Aufgabe 3 Zeigen Sie, dass es unter den reellen Zahlen kleiner 1 keine größte Zahl gibt. Aufgabe 4 √ Zeigen Sie, dass 2 nicht rational ist. Hinweis: Jede rationale Zahl r lässt sich durch teilerfremde Zahlen n ∈ Z und m ∈ N\{0} darstellen als r = n/m Zuletzt widmen wir uns einer konzeptionell etwas anders gearteten Beweistechnik, der vollständigen mathematischen Induktion. Diese Methode eignet sich hervorragend, um eine Aussage zu zeigen, die von einer natürlichen Zahl n abhängt, etwa von der Form der berühmten Gauß’schen Summenformel, mit der der Wert der Summe der ersten n natürlichen Zahlen bestimmt werden kann. Nennen wir die zu beweisende Familie von Aussagen A(n). Die Idee der vollständigen Induktion ist ein zweigeteiltes Beweisverfahren: Zunächst weist man explizit die Gültigkeit der Aussage für ein festes n0 nach (A(n0 ) ist wahr durch explizites Einsetzen). Diesen Nachweis nennt man Induktionsanfang, für dieses n0 ist die Induktion verankert. Da es unendlich viele natürliche Zahlen gibt, kann man durch explizites Einsetzen nie zeigen, dass eine Formel für alle natürlichen Zahlen gilt. Daher bedient man sich eines Tricks: Man zeigt, dass wenn die Aussage für ein beliebiges, aber festes n gilt, dann gilt sie auch für n + 1, also ∀n ∈ N : A(n) ⇒ A(n + 1). Ohne den Induktionsanfang bedeutet dieser sogenannte Induktionsschritt gar nichts, aber ist die Induktion irgendwo verankert, folgt damit iterativ recht viel: Da A(n0 ) wahr ist, folgt mit A(n) ⇒ A(n+1) die Gültigkeit von A(n0 + 1), daraus wiederum die Gültigkeit von A(n0 + 2) und so weiter. Insgesamt zeigt man also, dass die Aussage für n0 und alle nachfolgenden natürlichen Zahlen gilt. Verankert man die Induktion bei n0 = 0, zeigt man mit dem Induktionsschritt also die Gültigkeit für alle natürlichen Zahlen. 8 Schauen wir uns das am Beispiel der Gauß’schen Summenformel an: Behauptung: ∀n ∈ N : n X k= k=0 n · (n + 1) 2 d.h. A(n) lautet n X k=0 k= n · (n + 1) 2 Beweis (Induktion): • Induktionsanfang: Wähle n0 = 0, dann ist 0 X k=0= k=0 • Induktionsschritt: 0·1 , also ist die Induktion bei n0 = 0 verankert. 2 Sei nun n eine beliebige, aber feste natürliche Zahl, für die die Formel gilt. Dann folgt: n+1 n X X n (n + 1)(n + 2) n · (n + 1) (∗) = k = (n + 1) + = (n + 1) · 1 + k = (n + 1) + 2 2 2 k=0 k=0 In der letzten Zeile wurde an der markierten Stelle die Induktionsvoraussetzung eingesetzt, nämlich dass A(n) für dieses feste, aber beliebige n gültig ist. Demnach kann man die Summe durch den gleichwertigen Ausdruck ersetzen. Damit zeigt man aber die Gültigkeit von A(n + 1). Wichtig ist hierbei, dass A(n + 1) nicht allgemein gültig ist, sondern nur unter der Voraussetzung gilt, dass A(n) gültig ist. Somit wird ganz abstrakt gezeigt, dass aus der Gültigkeit einer Aussage die Gültigkeit der nächsten Aussage folgt. Dabei bedeutet die Formulierung beliebig, aber fest, dass man ein n betrachtet, das einen fixen Wert angenommen hat, den man allerdings nicht genauer spezifizieren kann. Erst im Zusammenspiel von Induktionsverankerung und Induktionsschritt ergibt sich der erwünschte Beweis. Aufgabe 5 Beweisen Sie folgende Behauptung: ∀n ∈ N : n X k2 = k=0 n · (n + 1) · (2n + 1) 6 Aufgabe 6 Wenn Sie zeigen möchten, dass n > n + 1 (was natürlich völliger Quatsch ist), können Sie das mit vollständiger Induktion versuchen. Was funktioniert, wo gibt es Schwierigkeiten? Zuletzt wollen wir noch den in Kapitel 1 angekündigten binomischen Lehrsatz mittels vollständiger Induktion zeigen. Der Beweis ist ein wenig länglich, aber instruktiv. Aufgabe 7 Beweisen Sie den binomischen Lehrsatz, also dass für a, b ∈ R und n ∈ N gilt: (a + b)n = n X n k n−k a b k k=0 Hinweis: Sie dürfen aus Kapitel 1 verwenden: durch. n k + n k+1 = n+1 k+1 . Führen Sie eine Indexverschiebung Damit haben wir einen kurzen Einblick gewonnen in die wichtigsten mathematischen Beweistechniken. Zwar sind diese Muster oft anwendbar, aber dennoch gehört für die einzelnen Schritte und Ableitungen meist eine große Menge an Kreativität und Geschick dazu. Neben den hier vorgestellten Beweistechniken gibt es noch weitere, und es gibt keine allgemeingültigen Regeln, die vorschreiben, wann welche Methode zu verwenden ist. Es gibt sogar mathematische Sätze, die sich per se weder beweisen noch widerlegen lassen (Gödelscher Unvollständigkeitssatz). 9 Kapitel 4 – Folgen und Konvergenz Heute beschäftigen wir uns mit einem Thema, das viele schon aus der Schule kennen und mit dem viele intuitiv umgehen können. Unser Ziel ist es, dieses Thema etwas zu formalisieren. Es geht um den Begriff der Konvergenz von Folgen. Eine Folge ist eine Aneinanderreihung von Zahlen – dies können endlich oder unendlich viele sein. Endliche Folgen sind nicht besonders spannend und sollen uns hier nicht weiter interessieren. Wir betrachten Folgen, die für jeden beliebigen Index n ∈ N eine reelle Zahl an ∈ R als Folgenglied liefern. Folgen können explizit dargestellt werden durch die Angabe der Folgenglieder oder einer Berechnungsformel dafür. Greift die Formel zur Berechnung des n-ten Folgenglieds auf die Werte von a1 , . . . , an−1 zurück, spricht man von einer rekursiv definierten Folge. Folgen können nun bestimmte Eigenschaften haben, die wir hier definieren wollen: (an )n∈N ist monoton steigend :⇔ ∀n, m ∈ N : n > m ⇒ an ≥ am (an )n∈N ist beschränkt :⇔ ∃c, C ∈ R ∀n ∈ N : c ≤ an ≤ C (monoton fallend analog) Aufgabe 1 Entscheiden Sie, welche Folgen monoton fallend/steigend sind und welche Folgen beschränkt sind. Geben Sie gegebenenfalls Schranken an. a) an = n − n2 d) dn = 1 − e− √ (−1)n n+1 e) en = q n für festes q ∈ R b) bn = n c) cn = cos (πn(n + 1)) Daneben gibt es noch eine weitere sehr zentrale Eigenschaft: Die Konvergenz beschreibt, ob eine Folge sich für größer werdende Folgenindizes einem Grenzwert annähert. Dies ist freilich nicht für jede Folge der Fall, an = n2 wächst immer weiter, ohne dass es einen Grenzwert gibt. Nun müssen wir zunächst definieren, was es heißen soll, dass eine Folge gegen einen Grenzwert konvergiert: (an )n∈N heißt konvergent mit Grenzwert a :⇔ ∀ε > 0 ∃N ∈ N ∀n ∈ N : n > N ⇒ |a − an | < ε Wir schreiben limn→∞ an = a und nennen a den Grenzwert der Folge. Was bedeutet das? Die Definition sagt aus, dass zu jedem beliebig gewählten positiven ε ein Folgenindex N gefunden werden kann, ab dem der Abstand von den nachfolgenden Folgengliedern zum Grenzwert kleiner ist als ε. Wie groß dieses N ist, ist dabei unerheblich. Wichtig ist nur, dass man zu jedem noch so kleinen ε ein N (ε) finden kann, sodass die Abstandsbedingung erfüllt ist. Anschaulich gesprochen kommen die Folgenglieder dem Grenzwert also beliebig nahe – in jeder noch so kleinen Umgebung um den Grenzwert liegen ab einem gewissen Index alle Folgenglieder, und nur endlich viele Folgenglieder liegen außerhalb der Umgebung. Für den Nachweis der Konvergenz ist damit auch gar nicht relevant, das optimale N (ε) zu finden, ab dem tatsächlich alle Nachfolger einen hinreichend kleinen Abstand zum Grenzwert haben. Aufgabe 2 a) Weisen Sie explizit nach, dass die Folge (an )n∈N\{0} mit an = 1 n gegen 0 konvergiert. b) Zeigen Sie, dass die Folge (an )n∈N mit an = (−1)n nicht konvergiert. c) Sei die Folge (an )n∈N konvergent, ist dann auch die Folge (bn )n∈N mit bn = an+2 konvergent? 10 Offensichtlich ist also nach Aufgabenteil b) nicht jede beschränkte Folge konvergent (Umgekehrt ist aber jede konvergente Folge beschränkt). Ist eine Folge jedoch sowohl beschränkt als auch monoton, dann folgt Konvergenz, wie wir jetzt beweisen möchten. Dazu betrachten wir ohne Beschränkung der Allgemeinheit unseres Beweises eine beschränkte und monoton steigende Folge (an )n∈N . Wäre sie monoton fallend, dann wäre bn = −an monoton steigend und wir könnten Aufgabe 3 benutzen. Behauptung: Jede beschränkte und monoton steigende Folge (an )n∈N ist konvergent. Beweis: Sei a die kleinste obere Schranke an die Folge, das heißt für alle Folgenglieder gilt a ≥ an und es gibt keine kleinere Zahl, die diese Eigenschaft ebenso erfüllt (Dass diese Zahl eindeutig ist und immer existiert, folgt aus der Vollständigkeit von R). Da die Folge beschränkt ist, gilt a < ∞. Betrachte nun ein beliebiges ε > 0. Nun ist a − ε < a und es gibt ein Folgenglied aN , sodass a − ε < aN ≤ a. Dieses Folgenglied muss es geben, da sonst a − ε eine kleinere obere Schranke wäre. Aufgrund der Monotonie von (an )n∈N gilt für alle n > N : Aufgelöst nach ε ergibt das: a − ε < aN ≤ an ∀n ∈ N : n > N ⇒ a − an < ε Da ε beliebig gewählt war und wir mit der obigen Argumentation zu jedem ε ein N ∈ N finden, das die Relation erfüllt, haben wir die Konvergenzbedingung nachgewiesen! Aufgabe 3 Sei (an )n∈N eine konvergente Folge und λ ∈ R\{0}. Zeigen Sie, dass dann auch (λ · an )n∈N konvergiert. Für λ = −1 haben Sie damit gezeigt, dass auch monoton fallende und beschränkte Folgen konvergieren. Zuletzt haben wir gesehen, dass man Folgen mit Konstanten multiplizieren kann und die Eigenschaft der Konvergenz erhalten bleibt. Wir wollen uns im Weiteren damit beschäftigen, welche weiteren algebraischen Operationen in Ordnung sind und bei welchen Vorsicht geboten ist. Die Idee dazu wird sein, dass man ausnutzt, dass es für konvergente Folgen eine Zuordnung ε 7→ N gibt, um für die zu untersuchende Folge eine Zuordnung ε 7→ Ñ zu finden. Gelingt dies, ist die Verträglichkeit von Grenzwertbildung mit dieser Operation gezeigt – ansonsten ist es meist einfach, eine Behauptung durch ein geeignetes Gegenbeispiel zu widerlegen. Aufgabe 4 Gelten die im Folgenden behaupteten Rechenregeln für Grenzwertprozesse? Liefern Sie eine kurze Begründung oder ein Gegenbeispiel. a) Seien (an )n∈N und (bn )n∈N konvergente Folgen. Dann ist auch (an + bn )n∈N konvergent. b) Seien (an )n∈N und (bn )n∈N konvergente Folgen. Dann ist auch abnn konvergent. n∈N c) Sei die Folge (an · bn )n∈N konvergent, dann konvergieren auch (an )n∈N und (bn )n∈N . d) Seien (an )n∈N und (bn )n∈N konvergente Folgen. Dann ist auch die Folge (cn )n∈N mit c2n = an und c2n+1 = bn konvergent. Nachdem wir nun einige algebraische Operationen untersucht haben, die man mit Folgen durchführen kann, wollen wir uns noch dem Thema Abschätzungen widmen. Abschätzungen können helfen, den tatsächlichen Grenzwert einer Folge zu bestimmen (und nicht nur zu entscheiden, ob eine Folge konvergiert oder nicht). Wir betrachten eine Folge (an )n∈N und wollen diese nach oben abschätzen. Dazu suchen wir eine Folge (bn )n∈N , welche bn > an erfüllt. Wenn (an )n∈N und (bn )n∈N konvergente Folgen sind mit den Grenzwerten lim an = a n→∞ und 11 lim bn = b n→∞ dann kann man zeigen: ∀n ∈ N : an < bn ⇒ a≤b Insbesondere können die Grenzwerte aber durchaus gleich sein, wie man an den Folgen n1 − n1 n∈N\{0} unschwer erkennen kann – beide konvergieren gegen 0. Abschließend wollen wir noch kurz einen hilfreichen Zusammenhang konstatieren und beweisen. Behauptung: n∈N\{0} und Sei (an )n∈N eine Folge, und sei (bn )n∈N eine obere Abschätzung und (cn )n∈N eine untere Abschätzung. Wenn (bn )n∈N und (cn )n∈N beide gegen den gleichen Wert a konvergieren, dann konvergiert auch (an )n∈N gegen diesen Wert. Beweis: Für jedes ε > 0 finden wir natürliche Zahlen Nb und Nc , sodass |cn − a| < ε und |bn − a| < ε für alle n > N = max(Nb , Nc ). Dies lässt sich äquivalent umformulieren zu: a − ε < cn < a + ε und a − ε < bn < a + ε Wegen cn < an < bn gilt also auch a − ε < an < a + ε für alle n > N und die Folge (an )n∈N konvergiert ebenfalls gegen a. Wir können das nutzen, wenn wir eine unbekannte Folge auf Konvergenz untersuchen möchten. Wir müssen die Folge nur nach oben und unten gegen konvergente Folgen mit gleichem Grenzwert abschätzen, um nachzuweisen, dass die unbekannte Folge auch gegen diesen Grenzwert konvergiert. In der letzten Aufgabe für heute versuchen wir, ein paar Grenzwerte zu bestimmen. Aufgabe 5 Bestimmen Sie die jeweiligen Grenzwerte der konvergenten Folgen: a) (an )n∈N\{0} mit an = √ 2n+5√ n3 8n· n b) (bn )n∈N\{0} mit bn = nn!n √ c) (cn )n∈N mit cn = n2 + n − n. d) (dn )n∈N mit dn+1 = 2 + 1 dn und d0 = 1. 12 Kapitel 5 – Reihen und Taylorreihen Das heutige Thema schließt sich an den Themenblock zur Konvergenz von Folgen an. Heute untersuchen wir eine spezielle Art von Folgen, nämlich Reihen. Eine Reihe ist eine Summe mit unendlich vielen Summanden: S= ∞ X sk k=0 Gewiss werden aber nicht alle Summen einen wohldefinierten, endlichen Wert ergeben – zur mathematischen Behandlung interpretieren wir eine Reihe als Folge von sogenannten Partialsummen. Wir definieren eine Folge (pn )n∈N mit pn = n X sk k=0 Dabei schneiden wir also die Summation für jedes Folgenglied nach dem n-ten Summanden ab. Den Wert der Reihe verstehen wir nun als Grenzwert der Folge der Partialsummen: S= ∞ X sk = lim pn n→∞ k=0 Wir haben also prinzipiell sämtliche Schwierigkeiten mit Reihen auf die wohlbekannte Konvergenz von Folgen zurückgeführt. Wenn die Folge der Partialsummen konvergiert, spricht man auch von einer konvergenten Reihe, sonst ist die Reihe nicht wohldefiniert. P∞Eigenschaften P∞wie die Linearität oder Abschätzungen vererben sich auf Reihen, das heißt wenn die Reihen k=0 sk und k=0 rk wohldefiniert sind, gilt: Für α, β ∈ R : α· ∞ X sk + β · k=0 ∞ X rk = k=0 ∀k ∈ N : sk < rk ⇒ ∞ X (αsk + βrk ) k=0 ∞ X k=0 sk < ∞ X rk k=0 Damit können wir nun erste Grenzwerte von Reihen bestimmen: Aufgabe 1 P∞ Pn 1 Berechnen Sie den Wert der Reihe k=1 sk mit sk = k1 − k+1 , indem Sie die Partialsummen pn = k=1 sk berechnen und den Grenzwert limn→∞ pn bestimmen. Wenn wir uns fragen, wann eine Reihe konvergiert, kommen wir ziemlich schnell zu einem Ausschlusskriterium: Ist die Folge der Summanden (sk )k∈N keine Nullfolge, dann unterscheiden sich zwei aufeinanderfolgende Partialsummen pn und pn+1 auch für beliebig große n stets um einen noch nicht beliebig kleinen Betrag. Das heißt, dass P die Folge der Partialsummen nicht gegen einen Grenzwert konvergieren kann. Insbesondere ist eine ∞ Reihe wie k=0 (−1)k nicht wohldefiniert, denn die Partialsummen oszillieren zwischen den Werten 0 und 1 hin und her und konvergieren nicht. P∞ Es reicht jedoch nicht aus, dass die Folge der Summanden (sk )k∈N eine Nullfolge ist. Die Reihe k=1 k1 heißt harmonische Reihe, sie konvergiert aber nicht gegen einen endlichen Wert. Das liegt darin begründet, dass die Summanden nicht schnell genug abfallen, sodass die Partialsummen immer größer werden und über jede Grenze wachsen – ähnlich wie beim Integral Z ∞ 1 dx = lim ln(x) − ln(1) = ∞ x→∞ x 1 Daher ist das gefundene Kriterium nur ein notwendiges, kein hinreichendes. Es wird auch Trivialkriterium genannt. Darüber hinaus gibt es noch weitere Kriterien, die die Konvergenz von Reihen zusichern – diese werden ausführlich in der Vorlesung Mathematik für Studierende der Physik 1 thematisiert. 13 Eine besonders wichtige Rolle kommen den sogenannten geometrischen Reihen zu. Das sind Reihen, deren Summanden von der Form xk sind. Das vermeintliche Paradoxon um Achilles und die Schildkröte beruht auf eben so einer Reihe. Für x = 21 ergibt sich: ∞ X 1 1 1 1 = 1 + + + + ... = 2 2k 2 4 8 k=0 Zum Nachweis bemühen wir Aufgabe 2 vom Themenblock über Beweistechniken. Dort haben wir gezeigt, dass n X xk = k=0 1 − xn+1 1−x Sei nun |x| < 1, dann ist limn→∞ xn+1 = 0. Damit ergibt sich: ∞ X 1 1 − xn+1 = n→∞ 1−x 1−x xk = lim k=0 Tatsächlich ergibt sich für x = erfüllt und die Reihe divergiert. 1 2 der erwartete Grenzwert von 2. Für |x| ≥ 1 ist das Trivialkriterium nicht Aufgabe 2 a) Bestimmen Sie den Wert der Reihe P∞ x2k . b) Bestimmen Sie den Wert der Reihe P∞ kxk . Hinweis: Nutzen Sie k=0 k=1 d dx P∞ k=0 xk = P∞ d k k=0 dx x In der Vorlesung wurde die berühmte Taylorformel Tf (x) = k ∞ X d f 1 · · (x − x0 )k k! dxk x=x0 k=0 besprochen. Sie liefert zu einer Funktion f die sogenannte Taylorreihe. Schneidet man die Summe ab und lässt k (n) nur bis zur oberen Grenze n iterieren, erhält man das n-te Taylorpolynom Tf (x). Diese sind Approximationen an die Funktion f . Aufgabe 3 Plausibilisieren Sie die Taylorformel, indem Sie nachweisen, dass die Taylorreihe Tf (x) direkt an der Entwicklungsstelle x0 in allen Ableitungen mit f übereinstimmt: dn dn T = f f dxn dxn x=x0 x=x0 Das Muster, das wir nun einige Male einüben möchten, besteht also darin, dass wir zu einer gegebenen Funktion f in einem Entwicklungspunkt (meistens wird das x0 = 0 sein) die Werte f (x0 ), f 0 (x0 ), f 00 (x0 ), f 000 (x0 ), ··· berechnen und auf ein Muster hin untersuchen, sodass wir einen allgemeinen Ausdruck für können. 14 dn f dxn |x=x0 finden Aufgabe 4 Entwickeln Sie die folgenden Funktionen in Taylorreihen um x0 = 0, indem Sie ein Muster in den Ableitungen erkennen a) f (x) = exp(x) b) f (x) = sin(x) c) f (x) = cos(x) d) f (x) = ln(1 + x) e) f (x) = sinh(x) f) f (x) = cosh(x) Damit haben wir die sogenannten Potenzreihendarstellungen P∞der elementaren Funktionen exp, sin und cos hergeleitet. Potenzreihen, also Funktionen der Form P (x) = k=0 ak (x−x0 )k , sind beispielsweise dann wichtig, wenn wir in der Quantenmechanik nicht mehr das Exponential einer Zahl berechnen wollen, sondern von einer Matrix oder gar einem noch komplexeren Objekt. Für heute wollen wir sie nutzen, um die berühmte EulerFormel für komplexe Zahlen nachzuvollziehen. Aufgabe 5 Nutzen Sie die Reihendarstellung von exp, sin und cos, um exp(ix) = cos(x) + i · sin(x) zu beweisen. Auch wenn es für die oben betrachteten Funktionen der Fall ist, können wir nicht zeigen, dass sich die Taylorreihe tatsächlich so verhält wie die Funktion, die sie approximieren soll. Entwickelt man beispielsweise die Funktion ( für x 6= 0 exp −1 x2 f :R→R f (x) = 0 sonst um x0 = 0 in eine Taylorreihe, stellt man fest, dass alle Ableitungen verschwinden, die Taylorreihe ist also die konstante Nullfunktion. Für diese Funktion stimmt also ihre Taylorreihe ausschließlich in der Entwicklungsstelle mit ihrer zugrundeliegenden Funktion überein. Manchmal ist es nicht oder nur schwer möglich, ein wiederkehrendes Muster in den Ableitungen zu erkennen. Es ist damit jedoch nicht ausgeschlossen, dass man eine Potenzreihe findet, wie das folgende Beispiel illustriert. Aufgabe 6 Bestimmen Sie die Potenzreihenentwicklung von f (x) = arctan(x). Nutzen Sie dafür Z x 1 arctan(x) = dt 1 + t2 0 und interpretieren Sie den Integranden als Grenzwert einer geometrischen Reihe. 15 Kapitel 6 – Elementare Differentialgleichungen Differentialgleichungen sind in den Naturwissenschaften unabdingbar. Die Maxwellgleichungen der Elektrodynamik ebenso wie die Schrödingergleichung der Quantenmechanik werden als solche formuliert. Bei einer Differentialgleichung wird eine nicht näher spezifizierte Funktion f in Abhängigkeit zu ihren Ableitungen f 0 , f 00 , . . . ausgedrückt. Das Ziel ist es dann, eine Funktion zu finden, die die Differentialgleichung erfüllt. Sehen wir uns als Beispiel eine recht leicht anschaulich zu rechtfertigende Differentialgleichung an: die Differentialgleichung für den radioaktiven Zerfall. Wir suchen die Anzahl der nach einer gewissen Zeit t noch vorhandenen Atome N (t). Da die Kerne stochastisch und unkorreliert zerfallen, können wir davon ausgehen, dass die Anzahl der Zerfälle pro Zeiteinheit (also die Änderungsrate − dN dt ) proportional ist zur Anzahl der Kerne, die noch vorhanden sind: dN (t) − = λ · N (t) mit λ > 0 konstant dt Dies ist formal eine lineare Differentialgleichung erster Ordnung. Linear ist sie deshalb, weil die auftretenden Ableitungen der gesuchten Funktion N nur linear auftreten und nicht etwa quadratisch. Die Ordnung gibt an, was die höchste auftretende Ableitung ist. Hier tritt neben der Funktion selbst nur die erste Ableitung auf. Bei dieser einfachen Differentialgleichung können wir durch Hinschauen die Lösung erraten: N (t) = c · exp(−λt) mit c ∈ R Da wir zu jedem Parameter c eine gültige Lösung haben, haben wir noch keine eindeutige Lösung zur Differentialgleichung. Dazu müssen wir noch spezifieren, wie viele Kerne am Anfang bei t = 0 vorhanden waren: ! N (t = 0) = c · exp(0) = N0 ⇒ N (t) = N0 · exp(−λt) Dies ist sehr generell: Für eine eindeutige Lösung der Differentialgleichung sucht man nicht nur nach einer Funktion, deren Ableitungen die gewünschte Relation erfüllen, sondern man benötigt noch Anfangsbedingungen, mit denen auftretende Konstanten auf einen Wert festgelegt werden können. Für eine Differentialgleichung erster Ordnung braucht man dabei eine Anfangsbedingung, für eine Differentialgleichung n-ter Ordnung sind es n (In der Vorlesung Mathematik für Studierende der Physik 2 wird untersucht, welche Bedingungen erfüllt sein müssen, damit man sich überhaupt sicher sein kann, dass eine Differentialgleichung eine Lösung hat und ob diese eindeutig ist – das ignorieren wir hier). Nun möchten wir das ganze etwas formaler betreiben, um allgemeine Regeln und Vorgehensweisen abzuleiten. Gesucht ist im Folgenden stets eine Funktion y(t). Wir betrachten eine Differentialgleichung erster Ordnung von der Form: dy = F [y(t)] · G(t) dt Dabei stecken in F sämtliche Abhängigkeiten von der gesuchten Funktion, in G steckt die explizite Abhängigkeit von t. Es lässt sich nicht jede Differentialgleichung in eine solche Form bringen, dass die explizite t-Abhängigkeit entkoppelt, aber wenn es möglich ist, können wir das Verfahren zur Trennung der Variablen anwenden, um eine Lösung zu erhalten. Dazu teilen wir durch F und integrieren in t-Richtung mit unbestimmten Grenzen: Z Z 1 dy · · dt = G(t) dt F [y(t)] dt Wir erkennen, dass wir auf der linken Seite die Ketten- beziehungsweise Substitutionsregel der Integralrechnung anwenden können: Z Z 1 dy = G(t) dt F (y) Diese Integrale können wir dann berechnen und das Ergebnis nach y(t) umformen, um die Differentialgleichung zu lösen. Unbedingt zu beachten ist dabei die auftretende Integrationskonstante, durch deren Wahl abschließend die Anfangsbedingung erfüllt werden kann. Nun wollen wir uns mit einigen einfachen (aber nicht unbedingt linearen) Differentialgleichungen beschäftigen, die sich mit dem Verfahren zur Trennung der Variablen lösen lassen: 16 Aufgabe 1 Bestimmen Sie die Lösung y(t) der Differentialgleichungen zu den gegebenen Anfangswerten. a) y 0 (t) = t exp(−y(t)) mit y(1) = 0 π mit y =0 4 mit y(2) = 8 b) y 0 (t) − y(t)2 = 1 c) (t2 + 1)y 0 (t) = 2ty(t) p y 0 (t) y 0 (t) y(t) tanh(t) + = 8 d) sinh2 (t) cosh2 (t) mit y (ln(2)) = 0 Für schwierigere Differentialgleichungen, bei denen diese einfache Herangehensweise nicht zielführend ist, behilft man sich oft eines Ansatzes. Das bedeutet, dass man rät, dass die Lösung eine gewisse Form hat, und diese Form in die Differentialgleichung einsetzt, um sie zu vereinfachen und dann zu lösen. Natürlich kann ein geratener Ansatz falsch sein – dann wird die Differentialgleichung sich nicht vereinfachen oder auf eine nicht lösbare Gleichung führen. Grundsätzlich gilt aber: Wie auch immer man zum Ergebnis gelangt, wenn es die Differentialgleichung erfüllt, ist es richtig (Ausnahme: die Lösung ist mehrdeutig, dann beschränkt man sich gegebenenfalls zu Unrecht im Lösungsraum). Wir können also stets durch Einsetzen überprüfen, ob die Differentialgleichung korrekt gelöst wurde. Dies wollen wir am Beispiel der Schwingungsgleichung für eine freie, ungedämpfte Schwingung durchführen. Wie viele klassischen Bewegungsgleichungen der Physik handelt es sich um eine Differentialgleichung zweiter Ordnung, weil die Beschleunigung als zweite Ableitung des Ortes nach der Zeit auftritt: r k 00 00 2 my (t) = −ky(t) ⇒ y (t) = −ω y(t) mit ω = m Aufgabe 2 Lösen Sie die Schwingungsgleichung mit dem Ansatz: y(t) = A · exp(λt) Hinweis: Lassen Sie zu, dass λ eine komplexe Zahl ist. Wie zu erwarten war, ergeben sich hier bei der Lösung einer linearen Differentialgleichung zweiter Ordnung zwei unterschiedliche Lösungen, die wir zur allgemeinen Lösung zusammenaddieren können, und wir benötigen zwei Anfangsbedingungen, um sie eindeutig festzulegen. Typischerweise werden y(0) = y0 und y 0 (0) = v0 als Anfangsauslenkung und Anfangsgeschwindigkeit vorgegeben. Man kann auch noch einen Dämpfungsterm −δy 0 (t) mit in die Bewegungsgleichung aufnehmen – mit dem gleichen Ansatz gelangt man dann nach etwas mehr Rechenaufwand zu echten physikalischen Schwingungen, die mit der Zeit abklingen. Insbesondere manifestieren sich durch die Verhältnisse der Parameter verschiedene physikalische Phänomene in den Gleichungen. Der Ansatz y ∼ exp(λt) ist also allgemein genug, um die Differentialgleichung zu lösen. Wir haben uns bisher stillschweigend größtenteils mit homogenen Differentialgleichungen beschäftigt. Es gab nie einen t-abhängigen Störterm J(t), wie er hier auftritt: y 0 (t) = −2y(t) + sin(t) | {z } =J(t) Ein Störterm (oder auch Inhomogenität genannt) ist ein Summand, der nicht von der Funktion oder ihren Ableitungen abhängt. Bevor wir uns anschauen, mit welchem Verfahren wir diesen Störterm eliminieren, machen wir uns kurz allgemeine Gedanken über die Lösung einer homogenen linearen Differentialgleichung. Da alle Ableitungen nur linear auftreten, ist die Summe zweier Lösungen wie oben bereits erwähnt wieder eine 17 Lösung der Differentialgleichung: Behauptung: Seien y1 (t) und y2 (t) Lösungen von y(t) = F [y 0 (t), y 00 (t), . . . , t], dann ist auch y1 (t) + y2 (t) eine Lösung. Beweis: Betrachte F [y10 (t) + y20 (t), y100 (t) + y200 (t), . . . , t] (∗) = F [y10 (t), y100 (t), . . . , t] + F [y20 (t), y200 (t), . . . , t] = y1 (t) + y2 (t) Im mit (∗) markierten Schritt wurde ausgenutzt, dass F linear in allen auftretenden Ableitungen ist. Nun können wir uns also den abstrakten Lösungsraum zu einer homogenen, linearen Differentialgleichung vorstellen als Ursprungsgerade – denn auch diese erfüllt die Relation, dass die Vektoren zu zwei Punkten, die auf der Geraden liegen, addiert wieder einen Vektor zu einem Punkt der Geraden ergeben. Außerdem ist bei allen homogenen Differentialgleichungen die triviale Lösung y(t) = 0 ∀t gegeben. Die allgemeine Lösung einer homogenen, linearen Differentialgleichung ist also vergleichbar mit dem Richtungsvektor der Geraden. Betrachtet man nun eine inhomogene Differentialgleichung y(t) = F [y 0 (t), y 00 (t), . . . , t] + J(t) dann ist y = 0 keine Lösung mehr – im Bild der Geraden geht diese nun nicht mehr durch den Ursprung. Der Lösungsraum einer inhomogenen, linearen Differentialgleichung ist also ebenso eine Gerade wie der Lösungsraum einer homogenen Gleichung, nur dass jene wegen der Inhomogenität verschoben wurde. Wir können also zu einer inhomogenen Differentialgleichung eine zugehörige homogene bilden, indem wir den Störterm ignorieren. Die Lösung davon bleibt der Richtungsvektor. Nun brauchen wir noch einen Stützvektor, der die Verschiebung kompensiert. Dieser lässt sich mittels des Verfahrens der Variation der Konstanten ermitteln. Dabei wird ausgehend von der allgemeinen homogenen Lösung die dort auftretende Konstante als variabel angenommen, um nach Einsetzen in die Differentialgleichung eine Bestimmungsgleichung zu erhalten. Addiert man zum Schluss die allgemeine Lösung der homogenen Differentialgleichung und die spezielle Lösung zur Inhomogenität, hat man die allgemeine Lösung der inhomogenen Differentialgleichung bestimmt. Dieses Konzept wollen wir nun auf die obige inhomogene Gleichung anwenden: y 0 (t) = −2y(t) + sin(t) Zugehörige homogene DGL: y 0 (t) = −2y(t) Trennung der Variablen, die homogene Lösung lautet: yh (t) = c · exp(−2t) Spezielle Lösung durch Variation der Konstanten – Ansatz c = c(t) 0 ! ys0 (t) = c(t) · exp(−2t) = −2c(t) · exp(−2t) +c0 (t) · exp(−2t) = −2ys (t) + sin(t) {z } | =−2ys (t) 0 Daraus lässt sich ablesen: c (t) · exp(−2t) = sin(t) Z exp(2t) ⇒ c(t) = exp(2t) sin(t) dt = (2 sin(t) − cos(t)) 5 exp(2t) (2 sin(t) − cos(t)) ys (t) = exp(−2t) · (2 sin(t) − cos(t)) = 5 5 (2 sin(t) − cos(t)) Allgemeine Lösung der inhomogenen DGL: y(t) = c · exp(−2t) + 5 Aufgabe 3 Bestimmen Sie die allgemeinen Lösungen der inhomogenen linearen Differentialgleichungen! a) y 0 (t) = y(t) + t exp(2t) b) y 0 (t) = y(t) +t−1 1−t 18 Notizen