Analysis E.Fašangová July 23, 2015 Contents 1 Reelle Zahlen 3 2 Topologie 7 3 Folgen 9 3.1 Konvergenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 3.2 Die Symbole +∞ und −∞ . . . . . . . . . . . . . . . . . . . 13 4 Reihen 4.1 Cauchy-Folgen . . . . . . . . 4.2 Konvergenzkriterien . . . . . 4.3 Exponentialfunktion . . . . 4.3.1 Komplexe Zahlen . . 4.4 Dezimalbruchdarstellung . . 4.5 Unendliche Produkte . . . . 4.6 Umordnung der Summanden . . . . . . . . . . . . . . . . . . . . . 5 Funktionen 5.1 Grenzwert . . . . . . . . . . . . . 5.2 Stetigkeit . . . . . . . . . . . . . 5.3 Eigenschaften stetiger Funktionen 5.4 Inverse Funktion, Logarithmus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 16 18 19 20 21 22 22 . . . . 23 26 29 31 34 6 Differentiation 35 6.1 Eigenschaften differenzierbaren Funktionen . . . . . . . . . . . 38 6.2 Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 6.3 Arkussinus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 1 7 Integration 41 7.1 Bogenlänge . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 8 Literatur 44 9 Höhere Ableitungen, Kurvenverlauf 45 9.0.1 Zusammenfassung der Anwendung der Differentialrechnung für Kurvendiskussion . . . . . . . . . . . . . . . . 48 10 Taylorreihenentwicklung 50 10.0.2 Anwendung I: parabolische Antenne . . . . . . . . . . . 54 10.0.3 Anwendung II: Lösung einer Differenzialgleichung mit Potenzreihenansatz . . . . . . . . . . . . . . . . . . . . 55 11 Differentialgleichungen - Einblick 57 11.1 Einige Lösungsmethoden . . . . . . . . . . . . . . . . . . . . . 59 11.2 Anwendung: Mathematisches Pendel . . . . . . . . . . . . . . 59 12 Funktionen mehrerer Variablen 12.1 Konvergenzbegriffe . . . . . . . . . 12.2 Flächenverlauf . . . . . . . . . . . . 12.3 Zusammenfassung der Anwendung für Flächendiskussion . . . . . . . . 61 . . . . . . . . . . . . . . . 65 . . . . . . . . . . . . . . . 68 der Differentialrechnung . . . . . . . . . . . . . . . 72 13 Kurven, implizite Funktionen 13.1 Motivation: die Kreislinie . . . . . . 13.2 Kurven . . . . . . . . . . . . . . . . . 13.2.1 Anwendungen in der Physik . 13.3 Satz über implizite Funktionen . . . 13.3.1 Anwendungen des Satzes über 14 Abbildungen von Rn nach Rm . . . . . . . . . . . . . . . . . . . . implizite . . . . . . . . . . . . . . . . . . . . . . . . . . . . Funktionen . . . . . . . . . . 73 73 74 77 77 81 83 15 Lineare Differentialgleichungen n-ter Ordnung mit konstanten Koeffizienten 85 15.1 Wiederholungen von linearen Algebra . . . . . . . . . . . . . . 89 16 Lineare Differentialgleichungssysteme erster Ordnung mit konstanten Koefizienten 92 17 Fazit und Ausblicke 95 18 Literatur 96 2 1 Reelle Zahlen R ist eine Menge, +, · sind binäre Operationen auf R, die Teilmenge {x ∈ R : x > 0} von R ist gegeben, 0 und 1 sind zwei ausgezeichnete Elemente der R und folgende Eigenschaften (Axiome) gelten: (K1) + ist assoziativ (K2) 0 ist neutral bezüglich + (K3) jedes Element hat ein Inverses bezüglich + (K4) + ist kommutativ; (K5) · ist assoziativ (K6) 1 ist neutral bezüglich · (K7) jedes von 0 verschiedenes Element hat ein Inverses bezüglich · (K8) · ist kommutativ; (K9) Distributivität; (A1) für jedes x ∈ R gilt genau eine der folgenden Aussagen: x > 0, x = 0, −x > 0 (A2) für jede x, y ∈ R gilt: ( x>0 ∧ y >0 ) ⇒ ( x·y >0 ∧ x+y >0 ) (A3) vorausgesetzt dass N ⊂ R bekannt ist, dann existiert für jedes x ∈ R mindestens ein n ∈ N mit n − x > 0; (S1) (siehe später) (K1)–(K4) sind die Axiome einer kommutativen Gruppe, (K1)–(K9) sind die Körperaxiome, mit (A1)–(A3) sind es die Axiome eines archimedisch angeordneten Körpers. Die Menge Q erfüllt auch diese Axiome (K1)– (A3). Konstruktion: 0, 1, 2, . . . ; N; Z; Q. 3 Veranschaulichung als Zahlengerade. Notation: x ̸> 0 ist eine Notation für die Aussage ¬(x > 0). x < 0 ist eine Notation für die Aussage (x ̸= 0 ∧ x ̸> 0); x ≤ 0 bedeutet, dass x = 0 oder x < 0; x ≤ y bedeutet, dass entweder x = y oder y − x > 0. · ist weggelassen, xy = x · y. Potenznotation: x2 = xx. Satz (Rechenregeln) Für + und · siehe Rechenregeln für Gruppen und Körper. Regeln für ≤. Für beliebige reelle Zahlen gelten folgende Aussagen: i) (x ≤ y ∧ y ≤ z) ⇒ x ≤ z. Folglich ist ≤ eine Ordnungsrelation auf R. ii) x > 0 ⇒ −x < 0 iii) x > 0 ⇒ 1 x >0 iv) x ̸= 0 ⇒ x2 > 0; folglich 1 > 0 v) (a < b ∧ c ≤ d) ⇒ a + c < b + d vi) (0 ≤ a < b ∧ 0 < c ≤ d) ⇒ ac ≤ db Beweis von i): x ≤ y bedeutet, dass x = y oder y − x > 0. y ≤ z bebeutet, dass y = z oder z − y > 0. Wir können also vier Fälle unterscheiden: • x = y und y = z: Dann ist x = z. • x = y und z − y > 0: Dann ist z − x > 0. • y − x > 0 und y = z: Dann ist z − x > 0. • y − x > 0 und z − y > 0: Dann ist laut (A1) (y − x) + (z − y) > 0 und nach (K1)–(K4) (Rechenregeln für Gruppe) (y − x) + (z − y) = z − x. Also ist z − x > 0. In allen Fällen gilt, dass entweder x = z oder z − x > 0. Das bedeutet, dass x ≤ z. 2 Beweis von ii): Für −x gibt es drei Fälle: • −x > 0: Dann ist nach (A2) x + (−x) > 0, und nach (K1)–(K4) x + (−x) = 0. Also 0 > 0. Weil 0 = 0 ist, kann wegen (A1) nicht 0 > 0 gelten. Dieser Fall führt zu einem Widerspruch, kann also nicht vorkommen. 4 • −x = 0: Dann nach (A1)–(A4) gilt x = 0, was wegen (A2) auch ein Widerspruch ist. • ¬(−x > 0) und ¬(−x = 0): Dies bedeutet genau dass −x < 0, was zu beweisen ist. 2 Definition Sei M eine Menge, ≤ eine Ordnungsrelation auf M und A ⊂ M eine nichtleere Teilmenge. Ein x ∈ M heißt obere Schranke für A in M falls für jedes a ∈ A gilt a ≤ x. A heißt nach oben beschränkt in M , falls mindestens eine obere Schranke für A in M existiert. Ein s ∈ M heißt Supremum von A in M falls i) s eine obere Schranke für A in M ist und ii) wenn x ∈ M eine obere Schranke für A in M ist, dann gilt s ≤ x. Bezeichnung: supM A = s. Wenn s = supM A und s ∈ A, dann heißt s Maximum von A bezüglich ≤. Bezeichnung: s = max A. Beispiele in M = R mit ≤, A = [0, 1] (abgeschlossenes Intervall), (0, 1) (offenes Intervall), N. Dann gelten: 1 ist eine obere Schranke für [0, 1] und für (0, 1), 2 auch, 15 nicht. Folglich sind [0, 1] und (0, 1) nach oben beschränkt. supR [0, 1] = 1, maxR [0, 1] = 1, supR (0, 1) = 1, (0, 1) besitzt kein Maximum bezüglich ≤. N ist wegen (A3) nicht nach oben beschränkt und hat folglich kein Supremum und kein Maximum. Jetzt können wir das Axiom über das Supremum für R, genannt auch Vollständigkeitsaxiom, definieren: (S1) jede nichtleere Teilmenge von R, die nach oben beschränkt ist, besitzt ein Supremum in R. Bemerkungen: Die Menge A = {x ∈ R : x2 < 2} ist Teilmenge von R, sie ist nicht leer und ist nach oben beschränkt. √ Also besitzt A wegen (S1) ein Supremum in R. Tatsächlich ist supR A = 2. Die Menge B = {x ∈ Q : x2 < 2} ist Teilmenge von Q, sie ist nicht leer und ist nach oben beschränkt (in Q bezüglich ≤). Sie besitzt aber kein Supremum in Q. Wir sagen, dass Q das Vollständigkeitsaxiom nicht erfüllt. 5 Mit (K1)–(S1) √ ist R eindeutig gegeben (bis auf Isomorphismus). Eigentlich √ ist 2 ∈ R durch 2 := supR B definiert. Insbesondere kann man die Menge R aus der Menge Q konstruieren. Das Supremum ist “die kleinste obere Schranke” der Menge. Ähnlich definiert man untere Schranke, nach unten beschränkt, Infimum (als “größte untere Schranke”) und Minimum. Abkürzungen inf M A, min A. Vorausgesetzt, dass die Menge R mit den Axiomen (K1)–(A2), (S1) gegeben ist, kann man N als die “kleinste” (bezüglich ⊂) Teilmenge von R definieren, die die folgende Eigenschaften hat: 1 ∈ N und x ∈ N ⇒ x + 1 ∈ N. Man kann dann beweisen, dass (A3) gilt (es wird also ein Satz). Satz (Eigenschaften von N) i) Die Beweismethode der vollständigen Induktion gilt. ii) ∀a, b ∈ R, a, b > 0, ∃n ∈ N : na > b iii) Jede nichtleere Teilmenge M ⊂ N ist in R nach unten beschränkt und besitzt ein Minimum bezüglich ≤. Jede nichtleere, in R nach oben beschränkte Teilmenge M ⊂ Z besitzt ein Maximum bezüglich ≤. iv) Für jedes x ∈ R gibt es genau ein n ∈ Z mit n ≤ x < n+1. Bezeichnung n = ⌊x⌋, genannt der ganze Teil von x. Beweis von ii): Nach (K7) existiert a1 , also auch b a1 ∈ R. Nach (A3) existiert mindestens ein n ∈ N mit n − b a1 > 0. Nach den Rechenregeln für archimedisch angeordnete Körper gilt n > b a1 und na > b. 2 Beweis von iv): Wir betrachten die Menge A = {k ∈ Z : k ≤ x}. x ist eine obere Schranke für A, also A ist nach oben beschränkt. Nach (A3) existiert m ∈ N mit m − (−x) > 0. Folglich ist laut Rechenregeln für archimedisch angeordnete Körper −m ≤ x, wobei −m ∈ Z. Also −m ∈ A und damit ist A nicht leer. Mit iii) besitzt A ein Maximum. Sei n = max A. Dann gilt n ≤ x, weil x eine obere Schranke für A ist (n ist die “kleinste obere Schranke” und n ∈ A). Dabei ist n ∈ Z, weil n ∈ A ist. Für n + 1 gibt es zwei Fälle: • n + 1 ≤ x: dann gilt n + 1 ∈ A und n + 1 ≤ n weil n obere Schranke für A ist. Mit den Rechenregeln führt dies zu 1 ≤ 0, ein Widerspruch. • n + 1 > x: dieser Fall muss also vorkommen. Folglich ist n die gesuchte Zahl. 6 Wenn es mindestens zwei solche Zahlen gäbe, n1 und n2 , bekommen wir mithilfe der Rechenregeln, dass n1 = n2 . 2 Beispiele: ⌊4, 6⌋ = 4, ⌊−4, 6⌋ = −5, ⌊4⌋ = 4. 2 Topologie Unser Ziel ist es, von einem x ∈ R “Umgebungen” zu definieren. Definition Für x ∈ R definiere den (absoluten) Betrag von x als |x| = max{x, −x}. Für x, y ∈ R definiere den (euklidischen) Abstand zwischen x und y als d(x, y) = |x − y|. Satz a) Der Betrag ist eine Abbildung von R nach R und hat folgende Eigenschaften: i) |0| = 0 und für u ̸= 0 ist |u| > 0, ii) ∀λ ∈ R ∀u ∈ R : |λu| = |λ| |u|, iii) |u + v| ≤ |u| + |v|. Folglich, wenn wir R als Vektorraum über dem Körper R betrachten, dann ist |.| eine Norm auf diesem Vektorraum. b) Der Abstand d ist eine Abbildung von R × R nach R und hat folgende Eigenschaften: i) d(x, x) = 0, und für x ̸= y ist d(x, y) > 0, ii) d(x, y) = d(y, x), iii) d(x, y) ≤ d(x, z) + d(z, y). Folglich, d ist eine Metrik auf der Menge R. Beweis von a). i) |0| = max{0, −0} = max{0, 0} = max{0} = 0. Für u > 0 ist −u < 0, also −u < u, und folglich |u| = max{u, −u} = u > 0. Für u < 0 ist −u > 0, also −u > u, und folglich |u| = max{u, −u} = −u > 0. ii) Mit Fallunterscheidung. Wenn u = 0 dann ist wegen i) |u| = 0, außerdem λu = 0, |λu| = 0, und anderseits |λ| |u| = |λ| · 0 = 0. Wenn u > 0, dann gibt es drei Möglichkeiten: • λ = 0: Hier ist λu = 0, |λ| = 0, und die Gleichung gilt. 7 • λ > 0: Hier ist λu > 0, |λu| = λu = |λ| |u|. • λ < 0: Hier ist λu < 0, |λu| = −λu = |λ| |u|. Wenn u < 0, gibt es wieder drei Möglichkeiten, die man untersuchen muss (Übung!). iii) Mit Fallunterscheidung. Wenn u = 0, dann ist |u + v| = |0 + v| = |v| = 0 + |v| = |0| + |v| = |u| + |v|. Wenn v = 0, dann folgt die Aussage aus der vorigen Rechnung, weil wir die Rollen von v und u vertauschen können (wegen (K4)). Es bleiben vier Fälle: • u > 0 ∧ v > 0: Dann ist u + v > 0, |u + v| = u + v = |u| + |v|. • u > 0 ∧ v < 0: Hier gibt es drei Fälle: • u + v > 0: Hier gilt |u + v| = u + v. Außerdem gilt mit den Rechenregeln v < 0, 2v < 0, v < −v, u + v < u − v, folglich |u + v| = u + v < u − v = |u| + |v|. • u + v < 0: Hier gilt |u + v| = −(u + v) = −u − v. Außerdem gilt mit den Rechenregeln 0 < u, 0 < 2u, −u < u, −u − v < u − v, folglich |u + v| = −u − v < u − v = |u| + |v|. • u + v = 0: |u + v| = |0| = 0 < |u| + |v|. • u < 0 ∧ v > 0: In diesem Fall folgt die Aussage aus dem oberen Teil des Beweises, weil wir die Rollen von u und v vertauschen können. • u < 0 ∧ v < 0: Dann ist u + v < 0, |u + v| = −(u + v) = −u + (−v) = |u| + |v|. In jedem Fall gilt |u + v| ≤ |u| + |v|. 2 Definition Sei M eine Menge und d eine Metrik auf M . Für a ∈ M und r ∈ R, r > 0, definiere BM (a, r) = {x ∈ M : d(a, x) < r} . Sei A ⊂ M . Die Menge A heißt offen in M bezüglich d falls es für jedes a ∈ A (mindestens) eine reelle Zahl r > 0 gibt mit BM (a, r) ⊂ A. A heißt abgeschlossen in M bezüglich d falls M \ A offen ist. Die Menge M \ A heißt das Komplement von A in M . Beispiele: • BR (a, r) = (a − r, a + r) (offenes Intervall mit Mittelpunkt a) 8 • BR (a, r) ist offen in R bezüglich der euklidischen Metrik • (2, 7) (offenes Intervall) ist offen in R bezüglich der euklidischen Metrik, ist nicht abgeschlossen, [2, 7) nicht offen, nicht abgeschlossen, (2, +∞) offen und nicht abgeschlossen • [2, 7] (abgeschlossenes Intervall) ist abgeschlossen, ist nicht offen, [2, +∞) abgeschlossen, nicht offen • { } (leere Menge), R: beide sind offen und abgeschlossen in R • BR2 ((0, 0), 1) = {(x, y) ∈ R2 : x2 + y 2 < 1} (offene Kreisscheibe mit Mittelpunkt (0, 0) und Radius 1 • R2 \ BR2 ((0, 0), 1) ist abgsechlossen in R2 bezüglich der euklidischen Metrik und ist gleich {(x, y) ∈ R2 : x2 + y 2 ≥ 1} • {(x, y) ∈ R2 : y ≥ 0} ist nicht offen und ist abgeschlossen, {(x, y) ∈ R2 : y > 0} ist offen und ist nicht abgeschlossen • Punkt, Quadrant, Gerade in R2 • Punkt, N, Q in R 3 Folgen Definition Sei M eine nichtleere Menge. Eine Abbildung von N nach M , die auf ganz N definiert ist, heißt Folge in M . Eine Folge in R heißt auch reelle Folge, und eine Folge in C komplexe Folge. Beispiele: • f : N → R definiert durch f (n) = 2n ist eine reelle Folge • f : N → R mit f (n) = 5, n ∈ N, ist eine reelle Folge (konstante Folge) • (1, −1, 1, −1, . . . ) ist eine reelle Folge • Unterschied zwischen Folge (a1 , a2 , a3 , . . . ) und Menge {a1 , a2 , a3 , . . . } • (an ) mit an = −1 + n1 i, n ∈ N, ist eine komplexe Folge • (an ) mit a1 = 1, an+1 = an +(n+1), n ∈ R, ist eine rekursiv definierte reelle Folge 9 • arithmetische Folge • geometrische Folge • (an ) mit a1 = 1, a2 = 1, an+2 = an + an+1 , n ∈ N, ist eine reelle Folge, die sogenannte Fibonacci-Folge • (1, 3, 5, 7, 11, ....) (Primzahlen) ist eine reelle Folge, obwohl es keine direkte Formel für die n-te Primzahl gibt • f : N → R2 definiert durch f (n) = (n, 2n) ist eine Folge in R2 . • (gn ), wobei gn = {(x, y) ∈ R2 : y = n1 x}, n ∈ N, ist eine Folge von Geraden, also eine Folge in P (R2 ) (Potenzmenge; beachte: gn ⊂ R2 , gn ∈ P (R2 )) Verschiedene Notationen: Abbildung f , f : N → M , (an ), (an )n∈N , (a1 , a2 , . . . ) Manchmal betrachtet man Folgen als Abbildungen von N0 = N ∪ {0}. Veranschaulichungen: Aufzählen (Reihenfolge wichtig!), reelle Folgen auf dem Zahlenstrahl, oder im kartesischen Produkt N × R beziehungsweise auf der Gaußschen Zahlenebene markieren. Definition (Monotonie) Sei (an ) eine Folge in R, und betrachte die Relation ≤ auf R. Wir sagen, dass die reelle Folge (an ) streng monoton wachsend ist, falls es gilt: a1 < a2 < a3 < · · · < ai < ai+1 < . . . . Wenn wir in der oberen Zeile das Zeichen < durch das Zeichen ≤ ersetzen, heißt die Folge monoton wachsend. Sie heißt nach oben beschränkt falls die Menge {an : n ∈ N} in R nach oben beschränkt ist. Ähnlich definiert man (streng) monoton fallende und nach unten beschränkte Folge. Wenn eine Folge nach oben und nach unten beschränkt ist, heißt sie beschränkt. Wenn eine Folge monoton wachsend oder monoton fallend ist, heißt sie monoton. Beispiele von oben. Für komplexe Folgen hat dieser Begriff kein Sinn. Potenzen Wir führen rekursiv die ganzzahlige Potenzen ein. Für x (∈ )R mit n x ̸= 0 definiere x0 = 1, xn+1 = xn x wenn n ∈ N ist, und x−n = x1 für n ∈ N. Dass damit xn für jedes n ∈ Z definiert ist, folgt aus der vollständigen Induktion. Weiter wird es praktisch, 0n = 0 für n ̸= 0 und 00 = 1 zu setzen. Die Rechenregeln für die Potenzen kann man aus den Rechenregeln 10 für Gruppen (hier R \ {0} mit ·) mit Hilfe vollständiger Induktion herleiten. Genauso kann man ganzzahlige Potenzen von komplexen Zahlen definieren. Hilfsatz (Bernoullische Ungleichung) Für x ∈ R mit x ≥ −1 und für n ∈ N gilt (1 + x)n ≥ 1 + nx . Wenn zusätzlich x ̸= 0 und n ≥ 2 ist, dann gilt sogar (1 + x)n > 1 + nx. Beweis [Tretter I, Seite 18] ( )n Satz (die Zahl e) Die reelle Folge (an ) mit an = 1 + n1 , n ∈ N, ist streng monoton wachsend. Das Supremum der Menge {an : n ∈ N} ⊂ R wird mit e bezeichnet. Es gilt 2 < e ≤ 3. Beweis [Tretter I, Seiten 42-43] Bemerkungen: e heißt Eulersche Zahl. e ̸∈ Q (ohne Beweis). Die Folge (an ) ist nicht zur numerischen Berechnung von e geeignet, sie konvergiert sehr langsam. Bei n = 1000 hat man erst 2 gültige Stellen nach dem Komma, bei n = 30000 erst 4. 3.1 Konvergenz Wir werden den Begriff sup{an : n ∈ N}, wobei (an ) eine beschränkte, monoton wachsende reelle Folge ist, verallgemeinern. Jedoch wird nicht für alle Begriffe wichtig, dass wir mit reellen Zahlen arbeiten. Wesentlich ist, dass wir ein Abstand haben. Definition Sei M eine Menge und d eine Metrik auf M . Sei b ∈ M und (an ) eine Folge in M . Wir sagen, dass die Folge (an ) gegen b konvergiert (in M bezüglich d), falls zu jeder positiven reellen Zahl ε > 0 (mindestens) eine natürliche Zahl n0 ∈ N existiert, sodass folgende Aussage wahr ist: ( n ∈ N ∧ n > n0 ) ⇒ an ∈ BM (b, ε) . Schreibweise: an → b. b heißt Grenzwert der Folge (an ), und die Folge (an ) heißt konvergente Folge. Bemerkung: in R mit der Euklidischen Metrik hat die obere Aussage folgende Form: ( n ∈ N ∧ n > n0 ) ⇒ |an − b| < ε Beispiele: 11 • 1 n → 0 in R bezüglich der Euklidischen Metrik; Beweis • 1 n ̸→ 1 in R bezüglich der Euklidischen Metrik; Beweis • für jedes x ∈ R gilt n2 ̸→ x • ( n1 , 1) → (0, 1) in R2 bezüglich Euklidischer Metrik • wenn wir C mit der Metrik aus R2 betrachten, gilt 1 n + i → i. • Solange wir keine Metrik (z.B. auf P (R2 )) haben, können wir nicht über Konvergenz einer Folge (z.B. von Geraden) reden ! Satz (Eindeutigkeit des Grenzwertes) Sei (an ) eine Folge in M , wobei M eine Menge und d eine Metrik auf M sind. Seien b, c ∈ M . Dann gilt folgende Aussage: ( an → b ∧ an → c ) ⇒ b = c . Beweis. Satz (Rechenregeln für Konvergenz) Für reelle Folgen gelten folgende Aussagen: i) Wenn die reelle Folge (an ) monoton wachsend und nach oben beschränkt ist, dann konvergiert sie gegen sup{an : n ∈ N}. ii) Wenn die Folge (an ) konvergent ist, dann ist die Menge {an : n ∈ N} beschränkt. iii) Wenn an → b und c eine obere Schranke für die Menge {an : n ∈ N} ist, dann gilt b ≤ c. iv) Wenn (an ) und (bn ) reelle Folgen sind, dann sind auch (an bn ), (an +bn ), (|an |), (−an ) reelle Folgen, und wenn zusätzlich bn ̸= 0 für alle n ∈ N, dann sind auch ( abnn ), ( b1n ) reelle Folgen. In diesen Situationen gelten: an → c ⇒ |an | → |c| ( an → c ∧ bn → d ) ⇒ an bn → cd ( an → c ∧ bn → d ) ⇒ an + bn → c + d an c ( an → c ∧ bn → d ∧ d ̸= 0 ) ⇒ → bn d (an → c ∧ bn → d ∧ ( ∀n ∈ N : an ≤ bn ) ) ⇒ c ≤ d 12 v) (Satz über die zwei Gendarmen) Wenn an → d und bn → d und (cn ) eine Folge mit der Eigenschaft an ≤ cn ≤ bn für alle n ∈ N ist, dann ist die Folge (cn ) konvergent und ihr Grenzwert ist d. Beweis von i) und Teil von iv) (Produkt) Beispiele: • Für k ∈ N gilt: • 1 nk →0 4n2 −1 ; n3 +7 • für x ∈ R mit |x| < 1 gilt: xn → 0. Beweis mit Hilfe Bernoullischer Ungleichung Wurzeln und rationale Potenzen Man kann zeigen, dass für jedes k ∈ N und jedes x ∈ R mit x > 0 die Menge {y ∈ R : y > 0 ∧ y k ≤ x} ⊂ R besitzt √ k ein Supremum; dieses wird durch x ∈ R bezeichnet. Weiter definieren wir für x > 0 und p ∈ Z, q ∈ N die (rationale) pq -te Potenz von x durch p √ ( q x)p ; Schreibweise x q . Rechenregeln. ( ) Beispiel Sei a1 = 1 und an+1 = 12 an + a2n für n ∈ N. Dann ist die reelle Folge (an ) nach √ unten beschränkt, monoton fallend, konvergent und ihr Grenzwert ist √ 2. Siehe 1, Satz IV.42]. Man kann auch Folgen √ [Tretter √ angeben, die gegen k 2, x, k x konvergieren. Bemerkung: was gilt auch für komplexe Folgen 3.2 Die Symbole +∞ und −∞ Definition Sei (an ) eine reelle Folge. Wir sagen dass (an ) gegen +∞ konvergiert, wenn für jede reelle Zahl R (mindestens) eine natürliche Zahl n0 existiert, sodass folgende Aussage wahr ist: ( n ∈ N ∧ n > n 0 ) ⇒ an > R . Wir sagen dass (an ) gegen −∞ konvergiert, wenn für jede reelle Zahl T (mindestens) eine natürliche Zahl n0 existiert, sodass folgende Aussage wahr ist: ( n ∈ N ∧ n > n 0 ) ⇒ an < T . Schreibweise: an → +∞, an → −∞ 13 Bemerkungen: In dem Fall an → +∞ ist (an ) nicht eine konvergente Folge! Weitere Namen dafür sind bestimmt divergent, uneigentlich konvergent. Beispiele: • n2 → +∞ • (−1)n n ̸→ +∞ • 2n n → +∞ • für x > 1 gilt: xn → +∞ Die Rechenregeln von R kann man mit Vorsicht auch für +∞, −∞ erweitern. Definition: +∞ ̸= −∞ für x ∈ R : x ̸= +∞ x ̸= −∞ (+∞) + (+∞) = +∞ (+∞) · (+∞) = +∞ (−∞) + (−∞) = −∞ (−∞) · (−∞) = +∞ (+∞) · (−∞) = −∞ für x ∈ R : x + (+∞) = +∞ x + (−∞) = −∞ für x ∈ R, x > 0 : x · (+∞) = +∞ x · (−∞) = −∞ für x ∈ R, x < 0 : x · (+∞) = −∞ x · (−∞) = +∞ 0 < +∞ −∞ < 0 für x ∈ R : x < +∞ −∞ < x 1 1 =0 =0 +∞ −∞ | + ∞| = +∞ | − ∞| = +∞ +∞ Aber wir definieren nicht (+∞) + (−∞), 0 · (+∞), +∞ , usw. ! Dann kann man auch die Rechenregeln für Konvergenz mit Vorsicht erweitern, zum Beispiel: Satz Für beliebige reelle Folgen (an ) und (bn ) gilt: ( an → +∞ ∧ bn → c ∧ c ∈ R ∧ c > 0 ) ⇒ an bn → +∞ . 14 Beweis Beispiel: • n2n n+1 Bemerkung: Für komplexe Folgen hat dies kein Sinn. Man könnte ∞ einführen, und für eine komplexe Folge (cn ) folgendes definieren: cn → ∞ falls |cn | → +∞. 4 Reihen Wir werden “unendliche Summen” einführen. Wir brauchen die Körperstruktur von R, oder von C, und den Grenzwertbegriff. Intuitiv ist 21 + 14 + 81 + · · · = 1, 1 + 1 + 1 + · · · = +∞, aber was ist 12 + 13 + 14 + . . . ? Wir führen die mathematischen Begriffe ein. Definition Wenn eine (reelle) Folge (an ) gegeben ist, dann heißt die Folge (sn ), die durch sn = a1 + a2 + · · · + an , n ∈ N, definiert ist, (reelle) Reihe. Die Zahl an heißt ihr n-ter Summand und die Zahl sn heißt ihre n-te Partialsumme. Neue Notation: ∑ an (das ist eine neue Notation für die Folge(a1 +a2 +· · ·+an ) bzw. (sn ) ) (das ist erstmal nur ein Symbol, und deswegen hat kein Wert). Falls zusätzlich gilt, dass die Folge (sn ) konvergent ist und b ihr Grenzwert ist, dann heißt b ∑∞ die Summe der Reihe n=1 an . In diesem Fall definieren wir den Wert ∞ ∑ an = b ( das ist eine neue Notation für sn → b) n=1 ∑ ∑ und nennen die Reihe an konvergente Reihe. Falls die Reihe |an | ∑ konvergent ist, heißt die Reihe an absolut ∑ konvergente Reihe. Falls sn → +∞, wir schreiben formal an = +∞. Beispiele: ∑∞ n 1−q n+1 • ; für |q| < 1 n=0 q : die Folge der Partialsummen ist sn = 1−q ∑ n 1 ist sn → 1−q ; also die Reihe q ist konvergent für |q| < 1, nicht ∑∞ n 1 konvergent für |q| ≥ 1; ihre Summe für |q| < 1 ist n=0 q = 1−q (q ∈ R oder q ∈ C) 15 • ∑∞ 1 n=1 n : (sn ) ist monoton wachsend, ∑ 1 nicht nach oben beschränkt, also sn → +∞; folglich ist die Reihe nicht konvergent n ∑∞ ∑ 1 1 1 • ist konvern=1 n(n+1) : sn = 1 − n+1 , sn → 1, also die Reihe n(n+1) ∑∞ 1 gent; die Summe n=1 n(n+1) = 1 Satz (Rechenregeln) Für reelle Reihen gelten folgende Aussagen. ∑ ∑ • ∑ Falls die Reihen an und bn konvergent sind, dann ist die Reihe (an + bn ) auch konvergent und es gilt: ∞ ∑ (an + bn ) = n=1 ∞ ∑ an + n=1 ∞ ∑ bn . n=1 ∑ • Falls die Reihe an konvergent ist und c ∈ R eine Zahl ist, dann ist ∑ die Reihe (can ) auch konvergent und es gilt: ∞ ∞ ∑ ∑ (can ) = c an . n=1 n=1 ∑ ∑ • Falls die Reihen an und bn konvergent sind und es gilt an ≤ bn für alle n ∈ N, dann gilt für die Summen ∞ ∑ an ≤ n=1 ∞ ∑ bn . n=1 Beweis: folgt aus Rechenregeln für Folgen Bemerkung: Bei dem Produkt von zwei unendlichen Reihen ist die Reihenfolge der Summanden allgemein nicht beliebig. Wir besprechen dieses Thema zuerst nicht. 4.1 Cauchy-Folgen Ziel: entscheiden, ob eine Folge konvergent ist, ohne ihren Grenzwert zu kennen. Beispiele: ∑∞ 1 • n=1 2n : (sn ) monoton wachsend, sn → 1 ∑∞ 1 • n=1 n : (sn ) monoton wachsend, sn → +∞ 16 • ∑∞ 1 n=1 n2 : (sn ) monoton wachsend, beschränkt, also konvergent; aber wir kennen den Grenzwert nicht Definition Sei (sn ) eine Folge in einer Menge M und d eine Metrik auf M . Die Folge heißt Cauchy-Folge, falls es gilt: ∀ε > 0 ∃n0 ∈ N : n, m ∈ N ∧ n > n0 ∧ m > n0 ⇒ d(an , am ) < ε (d.h., die Folge hat diese Eigenschaft). Bemerkung: Konvergent sein bedeutet, dass der Abstand der Folgenglieder zum Grenzwert klein wird; Cauchy-Folge sein bedeutet, dass der Abstand von Folgengliedern zueinander klein wird. Satz Sei (sn ) eine reelle Folge. i) Wenn die Folge (sn ) konvergent ist, dann ist sie eine Cauchy-Folge. ii) Wenn (sn ) eine Cauchy-Folge ist, dann ist sie konvergent (in R). Beweis von i): Mit der Nebenrechnung |an − am | ≤ |an − b| + |b − an |, wobei b der Grenzwert ist. ii) beweisen wir hier nicht (man braucht den Axiom (S1) und weitere Begriffe für Folgen). Beispiel Sei die Folge (an ) rekursiv mit a0 = 1, an+1 = 21 (an + a2n , n ∈ N, definiert. Man kann zeigen, dass (an ) monoton fallend und nach unten beschränkt ist, siehe [Tretter, S. √ 41]. Folglich konvergiert (an ) gegen das Infimum b. Weiter gilt: an+1 ≥ 2 (AG-Ungleichung), b ̸= 0. Mit Rechenregeln bekommt man 12 (an + a2n ) → 21 (b + 2b ), an+1 → b, also b = √ √ 1 (b + 2b ). Letzte Gleichung umgestellt lautet b = 2. Also an → 2. 2 Insbesondere, (an ) ist eine Cauchy-Folge in R. Betrachten wir jetzt Q mit der Euklidischen Metrik. Es gilt an ∈ Q (Beweis mit Induktion), also ist (an ) eine Folge in Q, und eine Cauchy-Folge in Q. Aber sie ist nicht konvergent in Q! Bemerkung: Wir formulieren das Axiom: (S2) Jede Cauchy-Folge ist konvergent. Angenommen, dass die Axiome (K1)–(A3) gelten, diese Aussage ist eine äquivalente Aussage zum Axiom (S1), und heißt (auch) Vollständigkeitsaxiom. Der Beispiel oben sagt, dass Q nicht vollständig ist (d.h. Q erfüllt (S2) nicht). 17 Man könnte die reelle Zahlen auch mit den Axiomen (K1)–(K9), (A1)– (A3), (S2) angeben. R ist vollständig, C auch (ohne Beweis). 4.2 Konvergenzkriterien Satz (Konvergenzkriterien) Für reelle (bzw. komplexe) Reihen gelten folgende Aussagen. ∑ i) Majorantenkriterium Wenn die reelle Reihe bn konvergent ist, und |a | ≤ b für alle n ∈ N, dann ist die (reelle bzw. komplexe) Reihe n n ∑ an konvergent, absolut konvergent, und für ihre Summe gilt: | ∞ ∑ an | ≤ n=1 ∞ ∑ bn . n=1 ∑ ii) Quotientenkriterium Betrachte die Reihe an mit an ̸= 0 für alle |an+1 | n ∈ N. Falls die Folge ( |an | ) konvergent und ihr Grenzwert kleiner ∑ als 1 ist, dann ist die Reihe an konvergent und absolut konvergent. |an+1 | Falls die Folge ( |an | ) konvergent und ihr Grenzwert größer als 1 ist, ∑ dann ist die Reihe an nicht konvergent. √ ∑ iii) Wurzelkriterium Betrachte die Reihe an . Falls die Folge ( n ∑ |an |) konvergent und ihr Grenzwert kleiner als 1 ist, dann ist √ die Reihe an konvergent und absolut konvergent. Falls die Folge ( n |an∑ |) konvergent und ihr Grenzwert größer als 1 ist, dann ist die Reihe an nicht konvergent. iv) Leibniz-Kriterium Sei cn ∈ R nichtnegativ so, dass die Folge (cn ) monoton fallend ist und gegen 0 konvergiert. Dann ist die Reihe ∑ n (−1) cn konvergent. Beweis von i) und iii). ∑ ∑ Folgerung an absolut konvergent ⇒ an konvergent Beweis ∑ Satz (notwendige Bedingung) Wenn die Reihe an konvergent ist, dann ist die Folge (an ) konvergent und ihr Grenzwert ist 0. Beweis Beispiele: siehe Übung 18 4.3 Exponentialfunktion ∑ xn Für x ∈ R (bzw. C) ist die Reihe ∞ n=0 n! absolut konvergent (nach dem Quotientenkriterium), ihre Summe sei durch exp(x) bezeichnet: exp(x) = ∞ ∑ xn n=0 n! . Die Abbildung x 7→ exp(x) von R nach R (bzw. von C nach C) heißt reelle (bzw. komplexe) Exponentialfunktion. Satz i) exp(0) = 1, und für alle x ∈ R (bzw. x ∈ C) gilt, dass exp(x) ̸= 0; ii) für alle x, y ∈ R (bzw. x, y ∈ C) gilt, dass exp(x + y) = exp(x) · exp(y); iii) für alle x ∈ R, y ∈ Q (bzw. x ∈ C, y ∈ Z) gilt, dass exp(x)y = exp(xy); iv) exp(1) = e v) Sei (an ) eine reelle Folge und b ∈ R (beziehungsweise (an ) komplexe Folge und b ∈ C). Wenn an → b, dann exp(an ) → exp(b). Wenn (an ) eine reelle Folge ist, dann folgt aus an → +∞, dass exp(an ) → +∞, und an → −∞ impliziert exp(an ) → 0. Beweis: ii) ist ohne Beweis, weil wir Produkte von Reihen nicht untersucht haben. i) mit Einsetzen; die zweite Aussage folgt aus ii). iii) zuerst für y = n ∈ N und für y = −1; der Rest folgt aus ii) und aus der Definition von Potenzen. iv) ohne Beweis, siehe [Lasser, Hofmeier, Seiten 56-57]. v) zuerst für b = 0, der allgemeiner Fall folgt dann mit der Hilfe von ii). Bemerkungen: Man kann die reelle Exponentialfunktion auch mit Hilfe von Folgen definieren, als Grenzwert der Folge ((1+ nx )n ), für x ∈ R. Mit Hilfe von Reihen kann man auch die Logarithmusfunktion und die trigonometrischen Funktionen definieren, auch komplex. Wir definieren für z ∈ C (insbesondere auch für z ∈ R): sin(z) = ∞ ∑ (−1)k z 2k+1 , (2k + 1)! (−1)k z 2k . (2k)! k=0 cos(z) = ∞ ∑ k=0 19 Sie heißen Sinusfunktion und Kosinusfunktion. Wenn wir x = iφ in die Definition für die Exponentialfunktion und z = φ mit φ ∈ R in die Definition für die Sinus- und Kosinusfunktionen einsetzen, und die Real- und Imaginärteile vergleichen, bekommen wir die Eulersche Formel exp(iφ) = cos(φ) + i sin(φ), φ ∈ R . Für φ ∈ R gilt 1 = exp(0) = exp(iφ + (−iφ)) = exp(iφ) · exp(−iφ) = (cos(φ) + i sin(φ)) · (cos(−φ) + i sin(−φ)) = (cos(φ) + i sin(φ)) · (cos(φ) − i sin(φ)) = (cos(φ))2 + (sin(φ))2 . Die Abkürzung exp(z) = ez für z ∈ R (bzw. C) ist erlaubt, weil exp(1) = e = e1 und die Rechenregeln für die Potenzennnotation sind die Rechenregeln für die Exponentialfunktion. 4.3.1 Komplexe Zahlen Sei z ∈ C eine komplexe Zahl. Die algebraische Form der komplexen Zahl ist z = x +√iy mit x, y ∈ R. Die Aussage z ̸= 0 ist äquivalent zu |z| ̸= 0, und weiter zu x2 + y 2 ̸= 0. Wir können für z ̸= 0 schreiben ( ) √ x y x + iy = x2 + y 2 √ + i√ x2 + y 2 x2 + y 2 = r (cos(φ) + i sin(φ)) = reiφ mit r = √ sin(φ) = √ x2 + y 2 > 0 und mit φ ∈ R so, dass cos(φ) = √ x x2 +y 2 y x2 +y 2 und . Die Frage ob so ein φ überhaupt existiert, ist im Moment nicht beantwortet. Mit der Einschränkung φ ∈ [0, 2π) gilt, dass genau ein φ existiert, das diese Eigenschaften hat (ohne Beweis). Die Darstellung z = reiφ heißt Exponentialdarstellung der komplexen Zahl z ̸= 0. Für die Exponentialdarstellung der komplexen Zahl z = 0 können wir 0 = 0 · eiφ mit r = 0 und mit beliebigen φ ∈ R nehmen. Wenn wir die komplexe Zahl z in der Gaußschen Zahlenebene als Punkt bzw. Vektor mit Koordinaten (x, y) veranschaulichen, ist r der Abstand zwischen den Punkten (0, 0) und (x, y) (bzw. Länge des Vektors), und φ der Winkel zwischen der positiv orientierten x-Halbachse und dem Vektor. 20 Aus dem Satz über der Exponentialfunktion kann man herleiten, dass man die Rechenregeln für die Potenzen beim Rechnen mit der Exponentialdarstellung komplexer Zahlen verwenden kann. Insbesondere wird diese praktisch bei Multiplikationsaufgaben und bei der Aufgabe, die Wurzeln von √ einer komplexen Zahl z, n z = {u ∈ C : un = z}, n ∈ N, zu bestimmen. 4.4 Dezimalbruchdarstellung Ist n0 ∈ N und ak ∈ {0, 1, 2, 3, 4, 5, 6, 7, 8, 9} für jede k ∈ Z mit k ≤ n0 , dann ist die folgende Reihe (absolut) konvergent und folglich ist ihre Summe eine reelle Zahl: n0 ∑ ak 10k ∈ R k=−∞ ∑ 0 (hier ist die Partialsumme sn als sn = nk=−n ak 10k zu verstehen, und die Summe der Reihe als der Grenzwert der Folge (sn )). Umgekehrt zeigen wir, dass für jede reelle Zahl x ∈ R ein n0 ∈ N und ak ∈ {1, 2, 3, 4, 5, 6, 7, 8, 9} für jede k ∈ Z mit k ≤ n0 existieren, sodass die folgende Reihe (absolut) konvergiert und ihre Summe x ist: n0 ∑ ak 10k . k=−∞ Der Einfachheit wegen sei x > 0. Zerlegen wir zuerst x = ⌊x⌋ + x − ⌊x⌋ = m + y1 , wobei m = ⌊x⌋ ∈ Z. Folglich kann man (intuitiv !) m als eine dezimale Zahl schreiben: m = an0 10n0 + an0 −1 10n0 −1 + · · · + a1 10 + a0 mit n0 ∈ N∪{0}, an0 , an0 −1 , . . . , a1 , a0 ∈ {0, 1, . . . , 9}. Weiter ist y1 = x−⌊x⌋. Dann ist 0 ≤ y1 < 1, folglich 10y1 ∈ [0, 10). Wir definieren a−1 = ⌊10y1 ⌋ und y2 = 10y1 − ⌊10y1 ⌋. So ist a−1 ∈ {0, 1, . . . , 9}, 0 ≤ y2 < 1 und 10y1 = ⌊10y1 ⌋ + 10y1 − ⌊10y1 ⌋ = a−1 + y2 , folglich y1 = a−1 10−1 + y2 10−1 . Wir setzen a−2 = ⌊10y2 ⌋, y3 = 10y2 − ⌊10y2 ⌋, und erhalten y1 = a−1 10−1 + y2 10−1 = a−1 10−1 + a−2 10−2 + y3 10−2 . 21 Mit diesem Verfahren bekommen wir die Zahlen ak ∈ {0, 1, 2, 3, 4, 5, 6, 7, 8, 9} für k ∈ Z mit k ≤ n0 . Es muss noch gezeigt werden, dass die Reihe n0 ∑ ak 10k k=−∞ konvergiert und ihre Summe x ist. Wegen der Konstruktion ist die Folge (sn ) von Partialsummen wie folgt darstellbar und konvergent: sn = n0 ∑ x − sn = yn+1 10−n → 0 . ak 10k , k=−n Mit Komma und Dezimalzahlnotation ist x= n0 ∑ ak 10k = m, a−1 a−2 a−3 . . . . k=−∞ dass für die Zahl x = 1 diese Konstruktion die Reihe ∑0 Wir bemerken, k a 10 mit a 0 = 1, a−1 = 0, a−2 = 0, . . . liefert, wobei auch (gek=−∞ k ∑ −1 k ometrische Reihe) k=−∞ 9 · 10 = 1 ist. Also hat die Zahl x = 1 zwei Darstellungen: 1 = 1, 000 · · · = 0, 999 . . . . 4.5 Unendliche Produkte Wie unendliche Summen, man kann auch unendliche Produkte definieren. Sei (an ) eine Folge. Wir definieren das Partialprodukt pn = a1 · a2 · · · · · an = ∏ n k=1 ak . Das ist eine Zahl für jede n ∈ N. Damit ist (pn ) eine Folge. Wenn die Folge (pn ) konvergent ist und p ihr Grenzwert ist, dann heißt die Zahl p Produkt, und man schreibt ∞ ∏ ak = p . k=1 Die Zahlen an können reelle oder komplexe Zahlen sein. 4.6 Umordnung der Summanden Auch wenn die Reihenfolge der Summanden in einer endlichen Summe keine Rolle spielt (wegen Kommutativität der Addition), ist die Reihenfolge der Summanden in einer unendlichen Summe wichtig! 22 ∑ (−1)n+1 Beispiel: die Reihe ist nach dem Leibnizkriterium konvergent, n ∑1 aber sie ist nicht absolut konvergent, weil die Reihe nicht konvergent ist. n Man kann die Summanden dieser Reihe so umordnen, dass die neue Reihe nicht konvergent wird. Man kann zeigen, dass im Fall absoluter Konvergenz der Reihe die Summe der Reihe unabhängig von der Reihenfolge der Summanden ist, aber für eine Reihe, die konvergent aber nicht absolut konvergent ist, kann sich die Summe (sogar beliebig !) ändern, wenn wir die Reihenfolge der Summanden ändern. (Siehe in der Literatur: Riemannscher Umordnungssatz.) 5 Funktionen Wiederholung: Seien X, Y Mengen. Eine Teilmenge von X×Y heißt Relation zwischen X und Y . Eine Relation R ⊂ X × Y heißt Abbildung (Funktion) von X nach Y , falls folgende Aussage wahr ist: ( (x, y1 ) ∈ R ∧ (x, y2 ) ∈ R ) ⇒ y1 = y2 . Für Abbildungen (Funktionen) benutzen wir andere Notationen: statt (x, y) ∈ R schreiben wir y = f (x), statt R ⊂ X ×Y schreiben wir f : X → Y . Oft geben wir eine Funktion mit einer Vorschrift f (x) = ...., x ∈ M , und mit einer Menge M ⊂ X, an. Manchmal ist die Menge M aus der Vorschrift herauszufinden. Für eine Relation R ⊂ X × Y definieren wir die Mengen DR = {x ∈ X : ∃y ∈ Y mit (x, y) ∈ R} WR = {y ∈ Y : ∃x ∈ X mit (x, y) ∈ R} . Definition Eine Abbildung von R nach R heißt reelle Funktion einer reellen Variable, kurz Funktion. Notation: f : R → R. Im Ausdruck f (x) = y heißt x Variable, und f (x) Wert der Funktion f an der Stelle x oder (das) Bild von x unter f , x heißt auch (ein) Urbild von y unter f. Sei f : R → R eine Funktion. Die Mengen Df = {x ∈ X : ∃y ∈ Y mit f (x) = y} und Wf = {y ∈ Y : ∃x ∈ X mit f (x) = y} heißen Definitionsbereich und Wertebereich der Funktion f . Seien weiter A ⊂ R und B ⊂ R. Die Mengen f (A) = {f (x) : x ∈ A ∩ Df }, f−1 (B) = {x ∈ Df : f (x) ∈ B} 23 heißen Bild der Menge A unter f und Urbild der Menge B unter f . Die Menge Gf = {(x, y) ∈ R : x ∈ Df ∧ f (x) = y} heißt Graph der Funktion f . Wir können ihn im kartesischen Koordinatensystem veranschaulichen. Mit den obigen Notationen ist Wf = f (Df ) = f (R), Df = f−1 (Wf ) = f−1 (R), und wenn f (x) = y, dann können wir schreiben f ({x}) = {y} (als Bild einer Menge), x ∈ f−1 ({y}). Beispiele: • Seien a, b ∈ R. Die Abbildung f (x) = ax + b, x ∈ R, ist eine Funktion. Df = R. Für a ̸= 0 ist Wf = R, für a = 0 ist Wf = {b}. Die Funktion f heißt lineare Funktion, in dem Fall a = 0 konstante Funktion. (Achtung: in der linearen Algebra hieß die Abbildung f (x) = ax + b affine Abbildung, und die Abbildung f (x) = ax lineare Abbildung !) Der Graph einer linearen Funktion ist eine Gerade in der Ebene. (Aber nicht jede Gerade ist Graph einer linearen Funktion!) • Seien a, b, c ∈ R. Die Abbildung f (x) = ax2 + bx + c, x ∈ R, ist eine Funktion. Df = R. Wenn a ̸= 0, dann heißt f quadratische Funktion. Der Graph einer quadratischen Funktion ist eine Quadrik in der Ebene, genauer eine Parabel. (Aber nicht jede Parabel ist Graph einer quadratischen Funktion !) • f (x) = exp(x), x ∈ R, ist eine Funktion. Df = R, Wf können wir noch nicht bestimmen. Wir können nur feststellen, dass 1 ∈ Wf , e ∈ Wf und 0 ̸∈ Wf . √ • f (x) = x, x ≥ 0, ist eine Funktion. Df = [0, +∞), Wf = [0, +∞). Gf ist Teilmenge einer Parabel. Definition (Eigenschaften von Funktionen) Sei f : R → R eine Funktion. Die Funktion f heißt surjektiv, wenn Wf = R ist. Sei A ⊂ R. Die Funktion f heißt injektiv auf A, wenn ( x1 ∈ A ∧ x2 ∈ A ∧ f (x1 ) = f (x2 ) ) ⇒ x1 = x2 . Die Funktion f heißt injektiv, wenn sie injektiv auf Df ist. 24 Sei A ⊂ R und B ⊂ R. Die Funktion f heißt bijektiv von A nach B, wenn A ⊂ Df , f injektiv auf A und f (A) = B ist. Die Funktion f heißt bijektiv, wenn sie bijektiv von R nach R ist (das ist genau dann, wenn Df = R, f injektiv und surjektiv ist). Sei I ein Intervall mit I ⊂ Df . Die Funktion f heißt (streng) monoton wachsend auf I, wenn folgende Aussage wahr ist: ( x1 ∈ I ∧ x2 ∈ I ∧ x1 < x2 ) ⇒ f (x1 ) < f (x2 ) . Die Funktion f heißt beschränkt, wenn die Menge Wf als Teilmenge von R beschränkt (bezüglich der Euklidischen Metrik) ist. Im folgenden fassen wir zusammen, wie man von bekannten Funktionen weitere Funktionen bilden kann. Es ist offensichtlich, dass Summe und Produkt von zwei Funktionen, ein Vielfaches einer Funktion, und die Inverse einer Funktion bezüglich Multiplikation wieder Funktionen sind, d.h. wenn f, g Funktionen sind und c eine Zahl ist, dann sind f + g, f · g, c · f und f1 auch Funktionen. Die Notation f −1 = f1 ist wegen Rechenregeln für Potenzen erlaubt. Definition Seien f : R → R und g : R → R Funktionen. Wir definieren f ◦ g wie folgt: (f ◦ g)(x) = f (g(x)) für x ∈ Dg mit g(x) ∈ Df . Dann ist f ◦ g eine Funktion. Sie heißt Komposition von g und f (erst g, dann f ). Wenn f injektiv ist, definieren wir f−1 wie folgt: f−1 (x) = y ⇔ ( y ∈ Df ∧ f (y) = x ) . Damit ist f−1 eine Funktion. Sie heißt Inverse von f (bezüglich Komposition). Beispiel: • f (x) = √ x, x ≥ 0; g(x) = x2 , x ∈ R. k = f ◦ g, k(x) = |x|, Dk = R. l = g ◦ f , l(x) = x, Dl = [0, +∞). h = f−1 , h(x) = x2 , Dh = [0, +∞). g ist nicht injektiv, deswegen ist g−1 , als Funktion, nicht definiert. Graphen 25 Beispiele: • Sei n ∈ N ∪ {0} und seien a0 , a1 , . . . , an ∈ R. f (x) = an xn + an−1 xn−1 + · · · + a1 x + a0 , x ∈ R, ist eine Funktion und heißt Polynom. −2 , Df = R \ {1, 2} ist eine Funktion und heißt rationale • f (x) = x2x−3x+2 Funktion (Quotient von Polynomen). √ • f (x) = 1 − x2 , |x| ≤ 1, ist eine Funktion, der Graph ist Teilmenge √ der Kreislinie mit Mittelpunkt (0, 0) und Radius 1. g(x) = x2 − 1, |x| ≥ 1, ist eine Funktion, der Graph ist Teilmenge einer Hyperbel. f und g heißen irrationale Funktionen (aus rationalen Funktionen und Wurzeln zusammengesetzt). 2 sin(x) • tan(x) = cos(x) , x ∈ R mit cos(x) ̸= 0, heißt Tangens. Wir kennen Dtan noch nicht ! Trigonometrische Funktionen Satz Die Exponentialfunktion ist streng monoton wachsend auf R und für alle x ∈ R gilt exp(x) > 0. Folglich ist die Exponentialfunktion injektiv auf R und besitzt eine Inverse (bezüglich der Komposition). Diese heißt natürlicher Logarithmus, ln(x). Weiter ist Wexp ⊂ (0, +∞), aber weil wir Wexp noch nicht bestimmt haben, kennen wir Dln nicht ! Für x = 0 ist exp(x) = exp(0) = 1 > 0. Für x > 0 ist exp(x) = ∑∞Beweis. xn ≥ 1 + x > 1 > 0. Für x < 0 ist −x > 0, also mit Rechenregel und n=0 n! 1 der obigen Eigenschaft ist 1 < exp(−x) = exp(x) , folglich 0 < exp(x) < 1. exp(y) Seien jetzt x, y ∈ R mit x < y. Dann ist y − x > 0, exp(x) = exp(y − x) > 1, und folglich exp(y) > exp(x). Also ist die Exponentialfunktion streng monoton wachsend. 5.1 Grenzwert Wir führen eine neue Notation für Konvergenz von Folgen ein: für eine (reelle oder komplexe) Folge (an ) und b (reelle oder komplexe) Zahl oder +∞, −∞ werden wir statt an → b ab jetzt limn→∞ an = b schreiben. Definition Sei f : R → R eine Funktion. Nehmen wir an, dass es ein R1 ∈ R existiert mit (R1 , +∞) ⊂ Df . Sei b ∈ R. Wir sagen, dass f (x) gegen b konvergiert wenn x gegen +∞ konvergiert, falls es zu jeder positiven reellen Zahl ε (mindestens) ein x0 ∈ R gibt, sodass folgende Aussage wahr ist: x > x0 ⇒ |f (x) − b| < ε . 26 Notation: limx→+∞ f (x) = b. Wir sagen, dass f (x) gegen +∞ konvergiert wenn x gegen +∞ konvergiert, falls es zu jedem R ∈ R (mindestens) ein x0 ∈ R gibt, sodass folgende Aussage wahr ist: x > x0 ⇒ f (x) > R . Notation: limx→+∞ f (x) = +∞. Sei jetzt a ∈ R und nehmen wir an, dass ein r1 > 0 existiert mit (a − r1 , a) ∪ (a, a + r1 ) ⊂ Df . Sei b ∈ R. Wir sagen, dass f (x) gegen b konvergiert wenn x gegen a konvergiert, falls zu jeder positiven reellen Zahl ε (mindestens) eine positive reelle Zahl δ existiert, sodass folgende Aussage wahr ist: x ∈ B(a, δ) \ {a} ⇒ |f (x) − b| < ε . Notation: limx→a f (x) = b. Wir sagen, dass f (x) gegen +∞ konvergiert wenn x gegen a konvergiert, falls zu jedem R ∈ R (mindestens) eine positive reelle Zahl δ existiert, sodass folgende Aussage wahr ist: x ∈ B(a, δ) \ {a} ⇒ f (x) > R . Notation: limx→a f (x) = +∞. Erweiterungen auf −∞ sind offensichtlich. Wenn für a, b ∈ R ∪ {+∞, −∞} die Aussage limx→a f (x) = b gilt, sagen wir, dass b der Grenzwert (Limes) der Funktion f an der Stelle a ist. Weiter können wir einseitige Grenzwerte einführen. Zum Beispiel, seien a, b ∈ R, und r1 > 0 so, dass (a − r1 , a) ⊂ Df . Wir sagen, dass f (x) gegen b konvergiert wenn x gegen a von links konvergiert, falls zu jeder positiven reellen Zahl ε (mindestens) eine positive reelle Zahl δ existiert, sodass folgende Aussage wahr ist: x ∈ (a − δ, a) ⇒ f (x) ∈ (b − ε, b + ε) . Notation: limx↗a f (x) = b oder limx→a− f (x) = b Wir sagen, dass f (x) gegen b konvergiert wenn x gegen a von rechts konvergiert, falls zu jeder positiven reellen Zahl ε (mindestens) eine positive reelle Zahl δ existiert, sodass folgende Aussage wahr ist: x ∈ (a, a + δ) ⇒ f (x) ∈ (b − ε, b + ε) . Notation: limx↘a f (x) = b oder limx→a+ f (x) = b Beispiele: siehe Übung 27 Satz (Rechenregeln für Grenzwert) Für Funktionen f : R → R, g : R → R und a ∈ R ∪ {+∞, −∞} gelten folgende Aussagen. i) Wenn f monoton wachsend ist, dann existieren die (einseitigen) Grenzwerte limx↗a f (x) und limx↘a f (x) (eventuell im Sinne von +∞, −∞). Wenn f zusätzlich beschränkt ist, dann sind diese Grenzwerte reelle Zahlen (also nicht +∞, −∞). ii) Es existiere limx→a f (x) = A und limx→a g(x) = B mit A, B ∈ R ∪ {+∞, −∞}. Dann gilt limx→a |f (x)| = |A|. Wenn A ̸= 0 dann 1 gilt limx→a f (x) = A1 . Wenn zusätzlich A + B definiert ist, dann gilt limx→a (f (x) + g(x)) = A + B, und wenn A · B definiert ist, dann gilt limx→a (f (x) · g(x)) = A · B. iii) Satz über die zwei oder einen Gendarmen Wenn a ∈ R, limx↗a f (x) = A und limx↗a g(x) = A und h eine Funktion mit der Eigenschaft, dass f (x) ≤ h(x) ≤ g(x) für x ∈ (a − r1 , a) ist, dann ist limx↗a h(x) = A. Wenn limx↗a f (x) = +∞ und h eine Funktion mit der Eigenschaft, dass f (x) ≤ h(x) für x ∈ (a − r1 , a) ist, dann ist limx↗a h(x) = +∞. Weitere Fälle sind offensichtlich. Beweis von i) Mit Supremum und Infimum. Zum Beispiel, für f monoton wachsend und beschränkt auf (R1 , +∞) ist limx→+∞ f (x) = sup{f (x) : x ∈ (R1 , +∞)} und limx↘R1 f (x) = inf{f (x) : x ∈ (R1 , +∞)}. Satz (Charakterisierung des Grenzwertes durch Folgen) Sei f : R → R eine Funktion und a, b ∈ R ∪ {+∞, −∞}. Wenn limx→a f (x) = b, dann gilt für jede Folge (xn ) mit der Eigenschaft, dass xn ∈ Df und xn ̸= a für alle n ∈ N, die Aussage xn → a ⇒ f (xn ) → b . Umgekehrt, sei U1 eine Umgebung von a mit U1 \ {a} ⊂ Df . Wenn für jede Folge (xn ) mit der Eigenschaft, dass xn ∈ U1 \ {a} für alle n ∈ N, die Aussage xn → a ⇒ f (xn ) → b gilt, dann ist limx→a f (x) = b. Beweis der erster Aussage ist einfach, die zweite Aussage ist ohne Beweis. 28 5.2 Stetigkeit Motivation: Wir betrachten die Abbildung durch eine Linse. Wenn f die Brennweite der Linse, g die Gegenstandsweite und b die Bildweite sind, gilt die Beziehung 1 1 1 + = . b g f fg Bestimme b als Funktion von g ! Diese ist b(g) = g−f , f gegeben. Zum Beispiel, für f = 2 Meter und für einen Gegenstand ausserhalb der Bren4 nweite ist die Funktion für die Bildweite (weiter umgestellt) b(g) = 2+ g−2 mit Definitionsbereich Db = (2, +∞). Wir stellen fest, dass b eine streng monoton fallende Funktion ist. Wir wollen untersuchen, ob kleine Änderungen des Gegenstandes kleine (also nicht große !) Änderungen des Bildes verursachen. Mit Hilfe der Nebenrechnung |b(g) − b(g0 )| = 4 |g − g0 | δ < 41 = 8δ ≤ ε |g − 2| |g0 − 2| · 1 2 für |g − g0 | < δ, |g − 2| > 12 , |g0 − 2| > 1, δ ≤ 8ε , können wir folgendes schlussfolgern. Sei g0 > 3. Für gegebene ε > 0 definiere δ = min{ 21 , 8ε }. Damit gilt die Implikation |g − g0 | < δ ⇒ |b(g) − b(g0 )| < ε . Wir haben bewiesen: Sei g0 ∈ Db gegeben, der Einfachheit halber sei g0 > 3. Es sei ein gewünschter maximaler Fehler im Bild gegeben (ε > 0). Man kann eine Grenze (δ > 0) des Fehlers des Gegenstandes so bestimmen, dass wenn der Fehler des Gegenstandes kleiner als δ ist, dann ist der Fehler des Bildes nicht größer als gewünscht. Mathematisch heißt diese Eigenschaft “Stetigkeit der Funktion b an der Stelle g0 ”. Definition Sei f : R → R eine Funktion mit Definitionsbereich Df . Sei a ∈ Df und (a − r, a + r) ⊂ Df für eine r > 0 und nehmen wir an, dass der Grenzwert limx→a f (x) existiert. Die Funktion f heißt stetig an der Stelle a, wenn der Wert der Funktion f an der Stelle a gleich der Grenzwert der Funktion f an der Stelle a ist (d.h. wenn f (a) = limx→a f (x)). Wir sagen, dass f stetig ist, wenn sie an jeder Stelle a ∈ Df stetig ist. Beobachtung. a ∈ Df und f (a) = limx→a f (x) ist äquivalent zu der Aussage a ∈ Df ∧ ( ∀ ε > 0 ∃ δ > 0 : x ∈ Df ∧ |x − a| < δ ⇒ |f (x) − f (a)| < ε ) . 29 Das ist also die Charakterisierung, dass f an der Stelle a stetig ist. Beispiele: • b(x) = 2 + 4 x−2 ist an der Stelle x0 mit x0 > 3 stetig. • f (x) = x mit Df = R, ist stetig in jedem a ∈ R, also stetig. Beweis: man kann δ = ε wählen. • f (x) = x3 , x ∈ R, a = 1. f ist stetig in 1. Beweis: Mit der Nebenrechnung |x3 − 13 | = |x − 1| |x2 + x + 1| < δ(22 + 2 + 1) = 7δ ≤ ε für δ < 1, |x − 1| < δ, δ ≤ 7ε , erhalten wir, dass für gegebene ε > 0 und mit der Wahl δ = min{1, 7ε } die obere Charakterisierung gilt. Man kann auch beweisen, dass f stetig ist. √ • f (x) = 3 x, a = 1. f ist stetig in 1. (Man kann beweisen, dass f in jedem a ∈ R stetig ist.) Bemerkungen. Ist zum Beispiel [a, b] = Df , a < b, kann man Stetigkeit von f an der Stelle a von rechts, beziehungsweise Stetigkeit von f an der Stelle b von links definieren. Man kann Stetigkeit von einer Abbildung f : M → N , M, N Mengen, definieren, sobald die Mengen M und N mit Metriken dM und dN ausgestattet sind. f heißt stetig in a ∈ M , wenn a ∈ Df und für jede ε > 0 existiert δ > 0 mit x ∈ Df ∧ dM (x, a) < δ ⇒ dN (f (x), f (a)) < ε . Zum Beispiel, mann kann Stetigkeit von komplexen Funktionen untersuchen (bezüglich Euklidischer Metrik). Satz (Rechenregeln) Seien f und g Funktionen, λ ∈ R und a ∈ R. Es gelten folgende Aussagen. i) Wenn f und g stetig an der Stelle a sind, dann sind f + g und f · g stetig an der Stelle a. ii) Wenn f stetig an der Stelle a ist und f (a) ̸= 0, dann ist Stelle a. 30 1 f stetig an der iii) Wenn f stetig an der Stelle a ist, dann sind |f | und λf stetig an der Stelle a. iv) Wenn f und g stetig an der Stelle a sind und g(a) ̸= 0, dann ist stetig an der Stelle a. f g v) Wenn g stetig an der Stelle a ist und f stetig an der Stelle g(a) ist, dann ist f ◦ g stetig an der Stelle a. Beweis von i) und v). Der Rest ist empfohlen als Übung. Beispiele: • konstante, lineare, quadratische Funktionen und Polynome, sind stetig. Beweis mit Rechenregeln. √ • x und andere, bis jetzt definierte Wurzelfunktionen sind stetig. Beweis mit Definition. • Rationale und irrationale Funktionen sind stetig. Folgt aus dem obigen mit Rechenregeln. • Die reelle Exponentialfunktion ist stetig. Beweis mit Charakterisierung des Grenzwertes durch Folgen. • Die Kosinusfunktion ist stetig. Mögliche Beweisidee: die komplexe Exix −ix ponentialfunktion ist stetig, cos(x) = e +e für x ∈ R, Rechenregeln. 2 sin(x) • Trigonometrische Funktionen sind stetig; z.B. tan(x) = cos(x) für x ∈ R mit cos(x) ̸= 0 ist stetig als Quotient stetiger Funktionen. 5.3 Eigenschaften stetiger Funktionen Satz (Nullstellensatz) Sei f eine Funktion mit Df = [a, b], wobei a, b ∈ R, a < b. Wenn f (a) < 0 und f (b) > 0 und f stetig (an jeder Stelle x ∈ [a, b] !) ist, dann existiert mindestens ein ξ ∈ (a, b) mit f (ξ) = 0. Beweis. Die Menge M = {x ∈ [a, b] : f (x) ≤ 0} ist nicht leer, nach oben beschränkt. Sei x0 = sup M . Es gilt M ⊂ [a, x0 ]. > 0 existiert δ > 0 x0 > a: Weil f ist stetig in a von rechts, zu ε = − f (a) 2 mit x ∈ (a, a + δ) ⇒ f (a) − ε < f (x) < f (a) + ε . 31 Insbesondere, für x = a + 2δ gilt: f (a + 2δ ) < f (a) + ε = f (a) < 0. Also ist 2 a + 2δ ∈ M , a + 2δ ≤ x0 , a < x0 . x0 > b: Weil f stetig in b von links ist, zu ε = f (b) > 0 existiert δ > 0 mit 2 x ∈ (b − δ, b) ⇒ f (b) − ε < f (x) < f (b) + ε . Für solche x gilt insbesondere 0 < f (b) = f (b) − ε < f (x), folglich x ̸∈ M . 2 Deswegen ist M ⊂ [a, b − δ], x0 ≤ b − δ < b. Also ist x0 ∈ (a, b). Wir zeigen, dass f (x0 ) = 0. Wenn f (x0 ) > 0 wäre, führt diese zu Widerspruch wegen Stetigkeit von f in x0 . Nämlich für ε = f (x2 0 ) > 0 existiert δ > 0 mit x ∈ (x0 − δ, x0 + δ) ⇒ 0 < f (x0 ) = f (x0 ) − ε < f (x) < f (x0 ) + ε , 2 folglich sind diese x nicht in M . Also M ⊂ [a, x0 − δ], x0 = sup M ≤ x0 − δ < x0 , Widerspruch. Wenn f (x0 ) < 0 wäre, führt diese zu Widerspruch wegen Stetigkeit von f in x0 . Nämlich für ε = − f (x2 0 ) > 0 existiert δ > 0 mit x ∈ (x0 − δ, x0 + δ) ⇒ f (x0 ) − ε < f (x) < f (x0 ) + ε = f (x0 ) <0, 2 insbesondere gilt diese für x = x0 + 2δ , d.h. x0 + 2δ ∈ M , Widerspruch mit x0 = sup M . Es muss f (x0 ) = 0 sein, und x0 ist ein gesuchtes Element. Anwendung: Existenz von Lösungen von Gleichungen, z.B. jedes reelle Polynom 3. Grades hat mindestens eine reelle Nullstelle. Satz (Existenz von Maximum und Minimum) Sei f eine Funktion mit Df = [a, b], wobei a, b ∈ R, a < b. Wenn f stetig in [a, b] ist, dann gibt es x1 ∈ [a, b] so, dass x ∈ [a, b] ⇒ f (x) ≤ f (x1 ) , und x2 ∈ [a, b] so, dass x ∈ [a, b] ⇒ f (x2 ) ≤ f (x) . D.h., f (x1 ) = max{f (x) : x ∈ [a, b]} und f (x2 ) = min{f (x) : x ∈ [a, b]}. Insbesondere ist f beschränkt auf [a, b]. Wir sagen, dass f ein Maximum an der Stelle x1 in [a, b] hat, und dass f (x1 ) das Maximum von f auf [a, b] ist. 32 Beweisidee. Zu zeigen ist, dass die Menge A = {f (x) : x ∈ [a, b]} nach oben beschränkt ist und Supremum besitzt. Dabei benutzen wir die Eigenschaft, dass von jede beschränkte Folge (xn ) ( in [a, b] ) man eine konvergente Teilfolge konstruieren kann, mit Hilfe der Intervallhalbierung. Weiter zeigt man, dass diese Supremum eigentlich ein Maximum ist, wobei man wieder aus eine beschränkte Folge (xn ) eine konvergente Teilfolge konstruiert. Ihr Grenzwert wird das x0 . In beiden Teilen des Beweises ist die Steigkeit der Funktion an der Stelle des Grenzwertes der konvergente Teilfolge benutzt. Anwendung: Existenz von Lösungen von Extremalproblemen. Z.B., gegebener Umfang, suche einen Rechteck mit größter Fläche. Definition Teilmengen M von R der Form (−∞, +∞), (−∞, b), (−∞, b], (a, b), (a, b], [a, b), (a, b], (a, +∞), [a, +∞) heißen Intervalle. Intervalle haben die Eigenschaft, dass x1 , x2 ∈ M, x1 < x2 ⇒ [x1 , x2 ] ∈ M , d.h., mit jeden zwei Punkten enthalten sie die ganze Strecke zwischen diesen zwei Punkten. Sie sind also die zusammenhängende Teilmengen der R. Satz (Erhaltung der Zusammenhang) Sei I ⊂ R ein Intervall und f eine Funktion mit I ⊂ Df . Wenn f stetig in I ist, dann ist die Menge f (I) ein Intervall. Das ist eine Verallgemeinerung des Nullstellensatzes. Ohne Beweis. Satz (π) Es gibt eine einzige reelle Zahl π mit der Eigenschaften i) 0 < π < 4, ii) für alle x ∈ [0, π2 ) gilt cos(x) > 0, und iii) cos( π2 ) = 0. ∑∞ 24 n 22n Beweis. cos(0) = 1 > 0, cos(2) = n=0 (−1) (2n)! = 1 − 2 + 4! + ( 6 ) 8 4 − 26! + 28! + (−. + .) + · · · < 1 − 2 + 24! = − 13 < 0, die Kosinusfunktion ist stetig, insbesondere auf [0, 2]. Folglich nach dem Nullstellensatz existiert mindestens eine Nullstelle in (0, 2). Die Menge A = {x ∈ (0, 2) : cos(x) = 0} ist nicht leer und nach unten beschränkt, besitzt also ein Infimum, r = inf A ∈ R. r > 0, weil cos(0) > 0 und cos ist stetig in 0. r < 2, weil cos mindestens eine Nullstelle in (0, 2) hat. cos(r) = 0, weil cos ist stetig in r. 33 Für x ∈ (0, r) ist cos(x) ̸= 0, weil r ist das Infimum von A. Für x ∈ (0, r) ist cos(x) > 0, weil im Gegenfall würde man den Nullstellensatz auf einem Intervall [0, x1 ] mit 0 < x1 < r anwenden und eine Nulstelle finden die kleiner als r ist. Das wäre Widerspruch mit der Definition von r. Wir setzen π = 2r. 5.4 Inverse Funktion, Logarithmus Satz (Stetigkeit der inverse Funktion) Sei I ein Intervall und f eine Funktion mit I = Df . Wenn f streng monoton wachsend auf I und stetig ist, dann existiert die inverse Funktion f−1 mit Definitionsbereich Df−1 = f (I) und Wertebereich I, f (I) ist ein Intervall, f−1 ist streng monoton wachsend und stetig. Ohne Beweis Die Exponentialfunktion f (x) = exp(x), x ∈ R, ist streng monoton wachsend auf R, R ist ein Intervall, f ist stetig. Folglich existiert die inverse Funktion f−1 . Weiter gilt, mit Hilfe der Charakterisierung des Grenzwertes einer Funktion durch Folgen, dass limx→−∞ exp(x) = 0 und limx→+∞ exp(x) = +∞, also muss f (R) = (0, +∞) sein. Die inverse Funktion zu exp heißt (natürliche) Logarithmusfunktion, ln(x), hat Definitionsbereich Dln = (0, +∞), Wertebereich R, ist streng monoton wachsend, stetig, limx→0+ ln(x) = −∞, limx→+∞ ln(x) = +∞, ln(1) = 0, ln(e) = 1. Die Rechenregel ln(xy) = ln(x) + ln(y) folgt aus der Rechenregel für die Exponentialfunktion. Mit Hilfe der Exponentialfunktion und des natürlichen Logarithmus definieren wir für a ∈ R mit a > 0 und b ∈ R (auch für b ∈ C) die b-te Potenz von a als ab = exp(b ln(a)). Hier heißt a Basis und b Exponent. Der b-te Wurzel √ 1 von a ist b a = a b , für a > 0, b ̸= 0. Man kann beweisen, dass diese Notationen in den speziellen Fällen mit den vorherigen Definitionen übereinstimmen und dass die Regeln der Potenzrechnung gelten. Für gegebene a > 0 heißt die Funktion f (x) = ax Potenzfunktion mit Basis a. Sie hat Definitionsbereich R und ist stetig. exp(x) = ex ist also die Potenzfunktion√mit Basis e. Man kann auch Funktionen wie g(x) = xa , h(x) = xx , k(x) = a x mit angepassten Definitionsbereichen definieren. 34 6 Differentiation Motivation: Weil lineare Funktionen einfacher sind, als allgemeine Funktionen, wird eine gegebene Funktion in der Umgebung eines Punktes in ihrem Definitionsbereich durch eine angepasste lineare Funktion approximiert. Die Steigung dieser linearen Funktion impliziert Aussagen über die ursprüngliche Funktion, wie zum Bespiel ihre Monotonie. Definition Sei f eine Funktion, x0 ∈ Df und r > 0 so, dass (x0 − r, x0 + r) ⊂ Df . Wenn der Grenzwert lim x→x0 f (x) − f (x0 ) x − x0 existiert und eine reelle Zahl (also nicht +∞, −∞) ist, dann heißt er die Ableitung der Funktion f an der Stelle x0 und ist mit f ′ (x0 ) bezeichnet. Wir sagen in diesem Fall, dass f in x0 differenzierbar ist. Die Abbildung x 7→ f ′ (x) mit Definitionsbereich Df ′ = {x ∈ Df : f differenzierbar in x} heißt Ableitung der Funktion f und ist mit f ′ bezeichnet. Beispiele: • f (x) = x2 , x0 ∈ R beliebig: f ′ (x0 ) = 2x0 √ • f (x) = x, x0 > 0: f ′ (x0 ) = 2√1x0 • exp(x), zuerst x0 = 0, dann x0 ∈ R beliebig: exp′ (x) = exp(x) für x∈R • sin′ (x) = cos(x), siehe Übung • cos′ (x) = − sin(x) ohne Beweis Bemerkungen: Wenn der Grenzwert +∞ ist, darf man schreiben f ′ (x0 ) = +∞, aber x0 ̸∈ Df ′ (also f ist nicht differenzierbar in x0 ) ! Wenn [x0 , x0 + r) ⊂ Df ist, kann man die Ableitung von f in x0 von rechts als den einseitigen Grenzwert definieren. Notation f+′ (x0 ). Satz Wenn f in x0 differenzierbar ist, dann ist f in x0 stetig und für die lineare Funktion g(x) = f (x0 ) + f ′ (x0 )(x − x0 ), x ∈ R, gilt lim x→x0 |f (x) − g(x)| =0. |x − x0 | 35 Diese Aussage bedeutet, dass in der Umgebung von x0 die Funktion f durch g gut approximiert ist; dass die Gerade Gg (Graph von g) die Tangente an die Kurve Gf im Punkt (x0 , f (x0 )) ist. Beweis lim f (x) − f (x0 ) = lim (f (x) − f (x0 )) = lim x→x0 x→x0 = lim x→x0 x→x0 f (x) − g(x) f f (x) − f (x0 ) = lim (x − x0 ) lim x→x0 x→x0 x − x0 x − x0 ( f (x) − f (x0 ) lim (x − x0 ) = f ′ (x0 ) · 0 = 0 ; x→x0 x − x0 Satz (Rechenregeln) Seien f und g Funktionen, λ ∈ R. i) Wenn f und g differenzierbar in x0 sind, dann gilt (f + g)′ (x0 ) = f ′ (x0 ) + g ′ (x0 ), (λf )′ (x0 ) = λf ′ (x0 ) und (Produktregel) (f · g)′ (x0 ) = f ′ (x0 )g(x0 ) + f (x0 )g ′ (x0 ) . ii) (Quotientenregel) Wenn f und g differenzierbar in x0 sind und g(x0 ) ̸= 0 ist, dann gilt ( )′ f f ′ (x0 )g(x0 ) − f (x0 )g ′ (x0 ) (x0 ) = g (g(x0 ))2 ′ g (x0 ) und insbesondere ( g1 )′ (x0 ) = − (g(x 2. 0 )) iii) (Kettenregel) Wenn g differenzierbar in x0 ist und f differenzierbar in g(x0 ) ist, dann ist (f ◦ g)′ (x0 ) = f ′ (g(x0 ))g ′ (x0 ) . iv) Sei (a, b) ein Intervall, f streng monoton wachsend auf (a, b) und x0 ∈ (a, b). Wenn f in x0 differenzierbar ist und f ′ (x0 ) ̸= 0 ist, dann ist die inverse Funktion f−1 an der Stelle y0 = f (x0 ) differenzierbar und ′ (y0 ) = f−1 1 f ′ (x0 ) . Beispiele • f (x) = exp(x), x ∈ R. f ist stetig im Intervall R = (−∞, +∞), differenzierbar und streng monoton wachsend, f ′ (x0 ) = exp(x0 ) ̸= 0 für x0 ∈ R. Folglich ist ′ (y0 ) = ln′ (y0 ) = f−1 1 1 1 = = , f ′ (x0 ) exp(x0 ) y0 36 y0 ∈ (0, +∞) . = lim x→x0 • f (x) = xn , f ′ (x) = nxn−1 für x ∈ R, wobei n ∈ N ist. Folglich sind Polynome, rationale Funktionen differenzierbar. • trigonometrische Funktionen sind differenzierbar • f (x) = ax , x ∈ R: f ′ (x) = (exp(ln(a)))′ = exp(x ln(a)) ln(a) = ln(a)ax • f (x) = xa , x > 0: f ′ (x) = (ea ln(x) )′ = ea ln(x) · a · 1 x = axa−1 Satz (Notwendige Bedingung für Extrema) Sei f eine Funktion, I ein Intervall, I ⊂ Df , x0 ∈ I. Wenn f an der Stelle x0 ein Maximum oder ein Minimum in I besitzt, dann ist entweder x0 Randpunkt des Intervalles (d.h. für I = [a, b] ist x0 = a oder x0 = b), oder x0 innerer Punkt des Intervalles (d.h. für I = [a, b] ist x0 ∈ (a, b)) und f nicht differenzierbar in x0 , oder x0 innerer Punkt des Intervalles, f differenzierbar in x0 und f ′ (x0 ) = 0. Beweis für Maximum mit Widerspruch. Sei x0 innerer Punkt des Intervalles und f differenzierbar in x0 . ′ 0) Wenn f ′ (x0 ) > 0 wäre, existiert zu ε = f (x > 0 ein δ > 0 mit 2 x ∈ B(x0 , δ) \ {x0 } ⇒ f ′ (x0 ) − ε < f (x) − f (x0 ) < f ′ (x0 ) + ε . x − x0 ′ 0) Da 0 < f (x = f ′ (x0 ) − ε ist, folgt insbesondere für x ∈ (x0 , x0 + δ) dass 2 (x0 ) 0 < f (x)−f , umgestellt f (x0 ) < f (x). Das ist ein Widerspruch damit, dass x−x0 f an der Stelle x0 ein Maximum hat. ′ 0) Wenn f ′ (x0 ) < 0 wäre, existiert zu ε = − f (x > 0 ein δ > 0 mit 2 x ∈ B(x0 , δ) \ {x0 } ⇒ f ′ (x0 ) − ε < f (x) − f (x0 ) < f ′ (x0 ) + ε . x − x0 ′ 0) < 0 ist, folgt insbesondere für x ∈ (x0 − δ, x0 ) dass Da f ′ (x0 ) + ε = f (x 2 f (x)−f (x0 ) < 0, umgestellt f (x) > f (x0 ). Das ist ein Widerspruch damit, dass x−x0 f an der Stelle x0 ein Maximum hat. Also muss f ′ (x0 ) = 0 sein. Beispiele für alle drei Möglichkeiten, Beispiele wo f kein Maximum besitzt, und wo es mehrere Maximalstellen gibt. Anwendung: Extremalstellen einer Funktion finden. 37 6.1 Eigenschaften differenzierbaren Funktionen Satz (Rolle) Seien a, b ∈ R, a < b, f eine Funktion mit [a, b] ⊂ Df . Nehmen wir an, dass f stetig in [a, b] ist (d.h. stetig in allen inneren Punkten, und stetig von rechts in a, stetig von links in b), und dass f in (a, b) differenzierbar ist (d.h. differenzierbar in jedem x ∈ (a, b)). Wenn f (a) = f (b) ist, dann existiert mindestens ein x0 ∈ (a, b) mit f ′ (x0 ) = 0. Beweis. Da die Funktion f stetig in dem abgeschlossenen, beschränkten Intervall [a, b] ist, besitzt sie nach dem Satz über Existenz von Extrema Maximum in [a, b] und Minimum in [a, b]. Fallunterscheidung: Wenn f konstant ist, ist f ′ (x) = 0 für alle x ∈ (a, b). Wenn es ein x1 ∈ (a, b) mit f (x1 ) > f (a) existiert, sei x0 ∈ [a, b] eine Stelle, wo f sein Maximum hat. x0 ̸= a da f (x1 ) > f (a), und x0 ̸= b da f (x1 ) > f (a) = f (b). Also ist x0 ∈ (a, b). Da f differenzierbar in x0 ist, muss nach dem Satz über die notwendige Bedingung für Extrema f ′ (x0 ) = 0 sein. Wenn es ein x2 ∈ (a, b) mit f (x2 ) < f (a) existiert, sei x0 ∈ [a, b] eine Stelle, wo f sein Minimum hat. x0 ̸= a da f (x2 ) < f (a), und x0 ̸= b da f (x2 ) < f (a) = f (b). Also ist x0 ∈ (a, b). Da f differenzierbar in x0 ist, muss nach dem Satz über die notwendige Bedingung für Extrema f ′ (x0 ) = 0 sein. Satz (Mittelwertsatz der Differenzialrechnung) Seien a, b ∈ R, a < b, und f, g Funktionen auf [a, b] definiert. a) Wenn f stetig in [a, b] und differenzierbar in (a, b) ist, dann existiert mindestens ein x0 ∈ (a, b) mit f ′ (x0 ) = f (b) − f (a) . b−a b) Wenn f und g stetig in [a, b] und differenzierbar in (a, b) sind, dann existiert mindestens ein x0 ∈ (a, b) mit f ′ (x0 )(g(b) − g(a)) = g ′ (x0 )(f (b) − f (a)) . Beweisidee. Diese Aussagen folgen aus dem Satz von Rolle für die Funktionen h(x) = (f (b) − f (a)) (g(x) − g(a)) − (g(b) − g(a)) (f (x) − f (a)) für b) und h(x) = (f (b) − f (a)) (x − a) − (b − a) (f (x) − f (a)) für a). 6.2 Anwendungen Satz (l’Hospital) Seien x0 ∈ R, r > 0 reelle Zahlen, f , g differenzierbare Funktionen in (x0 , x0 + r) so, dass g ′ (x) ̸= 0 und g(x) ̸= 0 für x ∈ 38 (x0 , x0 + r). Wenn limx→x0 + f (x) = 0, limx→x0 + g(x) = 0 und der Grenzw′ (x) ert limx→x0 + fg′ (x) = A existiert (A ∈ R ∪ {+∞, −∞}), dann existiert der Grenzwert limx→x0 + f (x) g(x) und es gilt f (x) f ′ (x) = lim ′ . x→x0 + g(x) x→x0 + g (x) lim Beweis für A ∈ R. Für A = +∞, −∞ empfohlen als Übung. Wir setzen fe(x) = f (x) für x ∈ (x0 , x0 + r) und fe(x0 ) = 0; ähnlich ge(x) = g(x) für x ∈ (x0 , x0 + r) und ge(x0 ) = 0. Damit sind die Funktionen fe, ge stetig in [x0 , x0 +r), differenzierbar in (x0 , x0 +r). Nebenrechnung: für x ∈ (x0 , x0 +r) gibt es nach dem Mittelwertsatz b) (angewandt auf fe, ge im Intervall [x0 , x]) ein ξx ∈ (x0 , x) so, dass f (x) fe(x) − fe(x0 ) fe′ (ξx ) f ′ (ξx ) = = ′ = ′ . g(x) ge(x) − ge(x0 ) ge (ξx ) g (ξx ) ′ (x) Sei jetzt ε > 0. Da der Grenzwert limx→x0 + fg′ (x) = A existiert, gibt es ein δ > 0 mit f ′ (ξ) ξ ∈ (x0 , x0 + δ) ⇒ | ′ − A| < ε . g (ξ) Wir behalten dieses δ. Für x ∈ (x0 , x0 +δ) ist das oben gefundene ξx ∈ (x0 , x) insbesondere in (x0 , x0 + δ), also gilt | f (x) f ′ (ξx ) − A| = | ′ − A| < ε . g(x) g (ξx ) Das bedeutet, dass limx→x0 + f (x) g(x) = A. Bemerkung. Es gibt Versionen für beidseitige Grenzwerte, für Grenzwerte wenn x → +∞, x → −∞, und für den Fall wenn die Voraussetzung ist lim g(x) = +∞ oder −∞. Satz (Monotonie) Seien a, b ∈ R ∪ {+∞, −∞} mit a < b, f eine Funktion mit (a, b) ⊂ Df , f differenzierbar in (a, b). Es gelten folgende Aussagen: ( ( ( ( ( ∀x ∈ (a, b) : ∀x ∈ (a, b) : ∀x ∈ (a, b) : ∀x ∈ (a, b) : ∀x ∈ (a, b) : f ′ (x) > 0 f ′ (x) ≥ 0 f ′ (x) < 0 f ′ (x) ≤ 0 f ′ (x) = 0 ) ) ) ) ) ⇒ ⇒ ⇒ ⇒ ⇒ f f f f f ist ist ist ist ist streng monoton wachsend in (a, b) monoton wachsend in (a, b) streng monoton fallend in (a, b) monoton fallend in (a, b) konstant in (a, b) Beweis: mit Widerspruch aus Mittelwertsatz. 39 6.3 Arkussinus Wir betrachten die Sinus- und Kosinusfunktionen, und die reelle Zahl π > 0. Für x ∈ (0, π2 ) gilt sin′ (x) = cos(x) > 0, folglich ist sin auf (0, π2 ) streng monoton wachsend. Da sin stetig ist, ist sie streng monoton wachsend auf [0, π2 ]. Weiter ist sin(0) = 0, folglich sin(x) > 0 für x ∈ (0, π2 ]. Aus der Formel (sin(x))2 +(cos(x))2 = 1 folgt, dass sin( π2 ) = 1. Weiter ist sin(−x) = − sin(x), und folglich ist sin streng monoton wachsend auf [− π2 , π2 ], sin([− π2 , π2 ]) = [−1, 1]. Damit besitzt die Funktion f (x) = sin(x) mit Df = [− π2 , π2 ] die Inverse f−1 , sie heißt Arkussinus, abgekürzt arcsin. Ihr Definitionsbereich ist Darcsin = [−1, 1], Wertebereich ist Warcsin = [− π2 , π2 ]. Arkussinus ist streng monoton wachsend, stetig (da sin stetig ist). Da √ cos(−x) = cos(x), für x ∈ [− π2 , π2 ] ist cos(x) ≥ 0, und sin′ (x) = cos(x) = 1 − (sin(x))2 ̸= 0 für x ∈ (− π2 , π2 ). Folglich ist Arkussinus differenzierbar und ihre Ableitung an der Stelle y ∈ (−1, 1) ist (arcsin)′ (y) = 1 1 1 =√ =√ , ′ sin (x) 1 − (sin(x))2 1 − y2 wobei x ∈ (− π2 , π2 ) ist durch y = sin(x) gegeben. Wir betrachten weiter die Kosinus- und Sinusfunktionen. Da cos′ (x) = − sin(x) < 0 für x ∈ (0, π2 ), ist cos auf (0, π2 ) streng monoton fallend. Da cos stetig ist, ist sie streng monoton fallend auf [0, π2 ]. Weiter ist cos(−x) = cos(x). Um das Verhalten der Kosinusfunktion auf dem Intervall [ π2 , π] zu bestimmen, brauchen wir Additionstheoreme für trigonometrische Funktionen. Wir beweisen hier eins. Die Eulersche Formel für t ∈ R und für −t addiert implizieren eit + e−it cos(t) = , 2 t∈R. Damit bekommen wir für x, y ∈ R, unter Verwendung der Rechenregeln für die Exponentialfunktion und die Symmetrieeigenschaften der Sinus und 40 Kosinus, ei(x+y) + e−i(x+y) = 2 eix eiy + e−ix e−iy = = 2 1 = ((cos(x) + i sin(x))(cos(y) + i sin(y)) + (cos(x) − i sin(x))(cos(y) − i sin(y))) 2 1 = (2 cos(x) cos(y) − 2 sin(x) sin(y) + i · 0) 2 = cos(x) cos(y) − sin(x) sin(y) . cos(x + y) = Insbesondere für y = cos( π 2 und x ∈ [0, π2 ] ist π π π π + x) = cos(x + ) = cos(x) cos( ) − sin(x) sin( ) = − sin(x) , 2 2 2 2 deswegen ist cos streng monoton fallend auf [ π2 , π], cos([ π2 , π]) = [−1, 0]. Man kann fortfahren, und mit dem Additionstheorem sin( π π π + x) = sin(x) cos( ) + cos(x) sin( ) = cos(x) 2 2 2 bekommen, damit das Verhalten von sin auf dem Intervall [ π2 , π], usw. Wir stellen fest, dass die Sinus- und Kosinusfunktionen den aus der Schule bekannten Kurvenverlauf haben. Insbesondere sind sie 2π-periodisch. Ähnlich wie beim Arkussinus, kann man aus der Funktion f (x) = cos(x) mit Definitionsbereich Df = [0, π] als Inverse die Arkuskosinusfunktion bekommen. Wir können jetzt auch den Kurvenverlauf des Tangens herleiten. 7 Integration Motivation: Flächeninhalt von Figuren bzw. Länge von Kurven zu berechnen. Werkzeug: Rückwärtsoperation zu Ableitung. Definition Seien a, b ∈ R ∪ {+∞, −∞}, a < b, und f , F Funktionen mit (a, b) ⊂ Df , (a, b) ⊂ DF . F heißt (eine) Stammfunktion zu f auf dem Intervall (a, b), wenn für jedes x ∈ (a, b) gilt F ′ (x) = f (x). (D.h. f ist die Ableitung von F auf (a, b).) Beispiele • Stammfunktion eines Polynoms; Stammfunktion ist nicht eindeutig 41 • arcsin ist eine Stammfunktion zu √ 1 1−x2 auf (−1, 1) Satz Wenn F1 und F2 Stammfunktionen zu f auf (a, b) sind, dann existiert eine Konstante c ∈ R so, dass F2 (x) = F1 (x) + c für alle x ∈ (a, b). Beweis aus dem Satz über Monotonie für F2 − F1 Seien a, b ∈ R, a < b, und f eine Funktion mit Df = [a, b]. Wir werden voraussetzen, dass f stetig ist (für Flächeninhalt) bzw. dass f differenzierbar ist und f ′ stetig ist (für Kurvenlänge). Die Menge Ff = {(x, y) ∈ R : 0 ≤ y ≤ f (x)} ist eine Figur in der Ebene, und der Graph Gf von f ist eine Kurve in der Ebene. Approximation: wir werden Kurvenstücke durch gerade Linien ersetzen, und deren Länge, beziehungsweise die Fläche eines Rechteckes, berechnen. Sei n ∈ N, xi = a + i b−a für i = 0, 1, 2, . . . , n. Wir approximieren den n Flächeninhalt der Figur Ff durch Fn = n−1 ∑ f (xi )(xi+1 − xi ) , i=0 und wenn der Grenzwert der (reellen) Folge (Fn ) existiert, nennen wir ihn Integral von f von a bis b, bezeichnet durch ∫ b f (x)d x = lim Fn = F(Ff ) , a und interpretieren das Integral als den Flächeninhalt der Figur Ff . Wir approximieren die Länge der Kurve Gf durch n−1 ∑ √ ln = (f (xi+1 ) − f (xi ))2 + (xi+1 − xi )2 i=0 (Satz von Pythagoras), und wenn der Grenzwert der (reellen) Folge (ln ) existiert, nennen wir ihn Länge der Kurve Gf . Mit dem Mittelwertsatz der Differenzialrechnung (angewendet auf die Funktion f auf dem Intervall [xi , xi+1 ]) ist ln = n−1 ∑ √ (f ′ (ξi ))2 + 1 · (xi+1 − xi ) , wobei ξi ∈ (xi , xi+1 ) . i=0 Deswegen ist die Notation ∫ b√ l(Gf ) = lim ln = (f ′ (x))2 + 1d x a 42 vernünftig. Satz (Hauptsatz der Differential- und Integralrechnung) i) Wenn f∫ : [a, b] → R stetig ist, dann ist die Funktion g definiert durch y g(y) = a f (x)dx für y ∈ [a, b], differenzierbar und es gilt g ′ (y) = f (y) für y ∈ [a, b] (mit einseitigen Ableitungen in dem Randpunkten a, b). ii) Wenn F eine Stammfunktion zu f auf (a, b) ist, und f , F stetig in [a, b] sind, dann gilt ∫ b f (x)dx = F (b) − F (a) . a Beweisidee: i) ∫ y g(y) − g(y0 ) 1 1 g (y0 ) = lim = lim f (y0 )(y−y0 ) = f (y0 ) . f (x)dx ≈ y→y0 y→y0 y − y0 y y − y0 y − y0 0 ∫y ii) Sei g(y) = a f (x)dx. Dann ist g(a) = 0, g ′ (y) = f (y), und die Funktion h = F − g hat an jeder Stelle y ∈ (a, b) Ableitung gleich 0. Deswegen muss h konstant sein. Da sie stetig in [a, b] ist, gilt h(x) = h(a) für alle x ∈ [a, b]. Es folgt ∫ b f (x)dx = g(b) = g(b)−g(a) = (g(b)+h(b))−(g(a)+h(a)) = F (b)−F (a) . ′ a 7.1 Bogenlänge Jetz können wir zeigen, dass π die Länge der Halbkreislinie mit Radius 1 √ ist. Der Viertelkreislinie ist Graph der Funktion f (x) = 1 − x2 , x ∈ [0, 1]. −x f ′ (x) = √1−x 2 für x ∈ [0, 1). Die Länge ist ∫ 1 l(Gf ) = ∫ √ ′ 2 (f (x)) + 1dx = 0 ∫ = 0 1 1 √ 1 dx 1 − x2 arcsin′ (x)dx = arcsin(1) − arcsin(0) = 0 43 π π −0= . 2 2 8 Literatur • R.Lasser, F. Hofmaier: Analysis 1+2, Springer Verlag, 2012 • K. Tretter: Analysis I, Analysis II, Birkhäuser, 2013 • K. Königsberger: Analysis 1, Springer Verlag, 1999 (4. Auflage) • W. Luh, M. Wießner: Aufgabensammlung Analysis, Aula-Verlag, 1991 • K. Tretter: Analysis I, Birkhäuser Verlag, 2013 • O. Forster. Analysis 1, Vieweg Verlag, 2011 (10. Auflage) • H. Heuser, Lehrbuch der Analysis, Band 1, Teubner Verlag, 1980 • E. Fašangová: Grundlagen der linearen Algebra und analytischen Geometrie, Vorlesung und Skript TU Dresden 2013/2014 • 44 9 Höhere Ableitungen, Kurvenverlauf Definition Sei f eine (reelle) Funktion mit Definitionsbereich Df . Ihre Ableitung f ′ mit Definitionsbereich Df ′ = {x ∈ Df : f differenzierbar an der Stelle x} ist wieder eine (reelle) Funktion. Man kann diese Funktion f ′ auf Differenzierbarkeit untersuchen. Die Ableitung von f ′ , das heißt (f ′ )′ beziechnet durch f ′′ mit Definitionsbereich Df ′′ = {x ∈ Df ′ : f ′ differenzierbar an der Stelle x} heißt zweite Ableitung von f . Man kann fortfahren und dritte Ableitung von f (bezeichnet f ′′′ ), vierte Ableitung von f (bezeichnet f (4) statt f ′′′′ ), und allgemein n-te Ableitung von f (bezeichnet f (n) ) für n ∈ N definieren. Als 0-te Ableitung von f kann man f selbst nennen. Beispiel: f (x) = −x2 + 1 für x ≤ 1 und f (x) = 21 (x − 1) für x > 1: f ′ , f ′′ direkt nachgerechnet. Bemerkung: Es gilt folgender Satz, den man auch anwenden könnte. Satz Wenn f differenzierbar in (x0 , x0 + r) (x0 ∈ R, r > 0) ist, und f stetig von rechts in x0 ist, und wenn der Grenzwert A = lim f ′ (x) x→x0 + existiert und eine reelle Zahl ist, dann ist f differnzierbar von rechts in x0 und f ′ (x0 ) = A . Beweis: mit l’Hospital Definition (Krümmung) Sei I ⊂ R ein Intervall und f eine Funktion mit I ⊂ Df . f heißt strikt (streng) konvex (konvex von unten, linksgekrümmt) auf I, wenn folgende Aussage gilt: für jede x1 , x2 ∈ I, x1 < x2 und jede ξ ∈ (x1 , x2 ) ist der Wert f (ξ) kleiner als der Wert g(ξ), wobei g die lineare Funktion mit g(x1 ) = f (x1 ) und g(x2 ) = f (x2 ) (mit diesen zwei Bedingungen ist eine lineare Funktion eindeutig bestimmt!) ist. Die obere Aussage anders geschrieben lautet: ∀x1 , x2 ∈ I, x1 < x2 , ∀ξ ∈ (x1 , x2 ) : f (ξ) < f (x2 ) − f (x1 ) (ξ − x1 ) + f (x1 ). x2 − x1 Wenn die Aussage mit der umgekehrter Ungleichung > gilt, heißt die Funktion strikt konkav (konvex von oben, rechtsgekrümmt) . Wenn die Aussagen mit ≤ bzw. ≥ gelten, heißt die Funktion konvex bzw. konkav. 45 Beispiele: • lineare Funktion f (x) = ax + b ist konvex auf R, konkav auf R, nicht strikt konvex auf R • f (x) = x2 ist strikt konvex auf R (die Ungleichung in der Aussage kann man direkt nachprüfen) • exp(x) ist konvex auf R; das kann man an den Graphen sehen, Beweis kommt später • sin(x) ist nicht konvex auf R, nicht konkav auf R, konvex auf [0, π]; das kann man an den Graphen sehen, später auch beweisen Satz (Krümmungstest) Wenn f zweimal differenzierbar auf dem Intervall I ist, und f ′′ (x) > 0 für alle x ∈ I gilt, dann ist f auf I strikt konvex. Beweis. Da (f ′ )′ (x) = f ′′ (x) > 0 für jede x ∈ I, ist nach dem Satz über Monotonie (Monotonie-Test) die Funktion f ′ streng monoton wachsend auf I. Da f zweimal differenzierbar in I ist, ist insbesondere f differenzierbar in I, und folglich f stetig in I. Seien x1 , x2 ∈ I mit x1 < x2 und sei ξ ∈ (x1 , x2 ). Zu beweisen ist, dass folgende Ungleichung gilt: f (ξ) < f (x2 ) − f (x1 ) (ξ − x1 ) + f (x1 ) . x2 − x1 Betrachten wir den Intervall [x1 , ξ], und die Funktion f auf diesem Intervall. Da f stetig in [x1 , ξ] ist und differenzierbar in (x1 , ξ) ist, existiert nach dem Mittelwertsatz ξ1 ∈ (x1 , ξ) so, dass f ′ (ξ1 ) = f (ξ) − f (x1 ) . ξ − x1 Betrachten wir den Intervall [ξ, x2 ], und die Funktion f auf diesem Intervall. Da f stetig in [ξ, x2 ] und differenzierbar in (ξ, x2 ) ist, existiert nach dem Mittelwertsatz ξ2 ∈ (ξ, x2 ) so, dass f ′ (ξ2 ) = f (x2 ) − f (ξ) . x2 − ξ Offensichtlich ist ξ1 < ξ2 , ξ1 , ξ2 ∈ I, deswegen gilt f ′ (ξ1 ) < f ′ (ξ2 ), da f streng monoton wachsend auf I ist. Eingesetzt in diese Ungleichung, äquivalent umgestellt erhalten wir genau die Ungleichung, die zu beweisen war. 46 Beobachtung: f ist konkav auf I genau dann wenn −f konvex auf I ist. Beispiele: • f (x) = x2 ist strikt konvex auf R, da f ′′ (x) = 2 > 0 für x ∈ R gilt. • f (x) = exp(x) ist strikt konvex auf R, da f ′′ (x) = exp(x) > 0 für x ∈ R gilt. • f (x) = ln(x) ist strikt konkav auf (0, +∞), da f ′′ (x) = − x12 < 0 für x > 0 ist. • f (x) = cos(x) ist strikt konkav auf [− π2 , π2 ], da f ′′ (x) = − cos(x) < 0 für x ∈ (− π2 , π2 ) ist, und weil f auch stetig ist. Weitere Beobachtungen: f ist konkav auf I genau dann wenn −f konvex auf I ist. Wenn f konvex auf (a, b) ist und f stetig von links in b ist, dann ist f konvex auf (a, b]. Wenn f konvex auf (a, b] und f konvex auf [b, c) ist, muss nicht unbedingt f konvex auf (a, c) sein ! Vergleiche mit Monotonieeigenschaften: f ist fallend auf I genau dann wenn −f wachsend auf I ist. Wenn f wachsend auf (a, b) ist und f stetig von links in b ist, dann ist f wachsend auf (a, b]. Wenn f wachsend auf (a, b] ist und f wachsend auf [b, c) ist und f stetig in b ist, dann ist f wachsend auf (b, c). Ohne der Voraussetzung der Stetigkeit gilt diese Aussage nicht ! f ist konvex auf Intervall I genau dann, wenn die Menge M = {(x, y) ∈ R : x ∈ I ∧ y ≥ f (x)} eine konvexe Teilmenge des Vektorraumes R2 (über R) ist (d.h. mit jeden zwei Elementen P1 , P2 ∈ M erhält M auch die Strecke zwischen P1 und P2 : P1 + t(P2 − P1 ) ∈ M für t ∈ R). 2 Definition (Wendepunkt) Sei f eine Funktion, x0 ∈ Df , r > 0, mit (x0 − r, x0 + r) ⊂ Df . Wenn f konvex auf (x0 − r, x0 ) ist und f konkav auf (x0 , x0 + r) ist, oder umgekehrt, und f stetig in x0 ist, dann heißt x0 eine Wendestelle (Inflexionspunkt) von f . Definition (lokales Minimum, Maximum) Sei f eine Funktion, x0 ∈ Df . Wenn es ein r > 0 existiert so, dass für alle x ∈ (x0 − r, x0 + r) ∩ Df f (x0 ) ≤ f (x) (bzw. ≥ )gilt, dann heißt x0 eine lokale Minimalstelle (bzw. 47 Maximalstelle) von f , und der Wert f (x0 ) ein lokales Minimum von f . In beiden Fällen heißt x0 eine lokale Extremalstelle, und f (x0 ) der zugehöriger lokaler Extremalwert von f . Satz (Extremalstelle-Test) Sei f eine Funktion, x0 ∈ Df , f zweimal differenzierbar in x0 . Wenn f ′ (x0 ) = 0 und f ′′ (x0 ) ̸= 0, dann ist x0 eine lokale Extremalstelle von f , und zwar lokale Minimalstelle im Fall f ′′ (x0 ) > 0 und lokale Maximalstelle im Fall f ′′ (x0 ) < 0. Beweis. Da f ′′ (x0 ) definiert ist, existiert insbesondere f ′ (x0 ) und folglich ist f stetig an der Stelle x0 . Untersuchen wir den Fall f ′′ (x0 ) > 0. Da 0 < f ′′ (x0 ) = lim x→x0 für ε = gilt f ′′ (x0 ) 2 0< f ′ (x) − f ′ (x0 ) , x − x0 > 0 existiert r > 0 so, dass für x ∈ (x0 − r, x0 ) ∪ (x0 , x0 + r) f ′′ (x0 ) f ′ (x) − f ′ (x0 ) = f ′′ (x0 ) − ε < < f ′′ (x0 ) + ε . 2 x − x0 Insbesondere, für x ∈ (x0 , x0 +r) gilt f ′ (x)−f ′ (x0 ) > 0 und für x ∈ (x0 −r, x0 ) gilt f ′ (x) − f ′ (x0 ) < 0. Da f ′ (x0 ) = 0 ist, bedeutet dieses, dass für x ∈ (x0 , x0 + r) ist f ′ (x) > 0 und für x ∈ (x0 − r, x0 ) ist f ′ (x) < 0. Nach dem Satz über Monotonie (Monotonie-Test) ist f streng monoton wachsend auf (x0 , x0 + r) und streng monoton fallend auf (x0 − r, x0 ). Da f auch stetig in x0 ist, folgt daraus, dass f an der Stelle x0 ein Minimum auf (x0 − r, x0 + r) hat. Insbesondere ist x0 eine lokale Minimalstelle von f . Ähnlich könnte man den Fall f ′′ (x0 ) < 0 untersuchen. Beispiel: Kurvendiskussion für f (x) = x . (x+2)2 Satz (Wendestelle-Test) Sei f eine Funktion, x0 ∈ Df , f dreimal differenzierbar in x0 . Wenn f ′′ (x0 ) = 0 und f ′′′ (x0 ) ̸= 0, dann ist x0 eine Wendestelle von f . Ohne Beweis. 9.0.1 Zusammenfassung der Anwendung der Differentialrechnung für Kurvendiskussion • Monotonie-Test: untersuche Vorzeichen von f ′ auf einem Intervall • Krümmungstest: untersuche Vorzeichen von f ′′ auf einem Intervall 48 • Extremalstelle-Test: finde Nullstelle von f ′ und untersuche das Vorzeichen von f ′′ an dieser Stelle. (Es reicht aber, das Vorzeichen von f ′ in einer Umgebung einer Nullstelle von f ′ zu kennen, da folgendes gilt. Sei f eine Funktion, x0 ∈ Df , r > 0, mit (x0 − r, x0 + r) ⊂ Df . Wenn f wachsend auf (x0 − r, x0 ) ist und f fallend auf (x0 , x0 + r) ist und f stetig in x0 ist, dann ist x0 ein lokales Maximum von f .) • Wendestelle-Test: finde Nullstelle von f ′′ und untersuche das Vorzeichen von f ′′′ an dieser Stelle. (Es reicht aber, das Vorzeichen von f ′′ in einer Umgebung einer Nullstelle von f ′′ zu kennen.) • Stetigkeitstest: wenn f differenzierbar an einer Stelle ist, dann ist f an dieser Stelle stetig. 49 10 Taylorreihenentwicklung Definition Sei f eine Funktion, (x0 − r, x0 + r) ⊂ Df , r > 0, x0 ∈ R. Nehmen wir an, dass alle Ableitungen f (k) (x0 ), k ∈ N, an der Stelle x0 existieren. Dann heißt die Reihe ∞ ∑ f (k) (x0 ) (x − x0 )k k! k=0 (x ∈ R ist als Parameter zu sehen) die Taylorreihe der Funktion f mit Mittelpunkt x0 . Das ist ein Beispiel einer Potenzreihe mit Mittelpunkt (k) x0 , da das k-te Reihenglied f k!(x0 ) (x−x0 )k , gesehen als Funktion der Variable x, eine (um x0 verschobene) Potenzfunktion ist. Die n-te Partialsumme dieser Reihe n ∑ f (k) (x0 ) Tf,x0 ,n (x) = (x − x0 )k k! k=0 gesehen als Funktion der Variable x, ist eine Polynomfunktion und heißt Taylorpolynom n-ter Ordnung der Funktion f mit Mittelpunkt x0 . Die Menge aller x ∈ R, für welche die obere Reihe konvergent ist, heißt Konvergenzbereich der Reihe. Die Menge aller x ∈ R, für welche die obere Reihe konvergent ist und ihre Summe gleich f (x) ist, werden wir Entwicklungsbereich der Funktion f in eine Potenzreihe um den Mittelpunkt x0 nennen. Wenn wir diesen mit If,x0 bezeichnen, können wir schreiben ∞ ∑ f (k) (x0 ) f (x) = (x − x0 )k , x ∈ If,x0 k! k=0 und wir sagen, dass dieser Ausdruck die Taylorreihenentwicklung der Funktion f um den Mittelpunkt x0 in der Menge If,x0 ist. Anders gesagt, für jedes x ∈ If,x0 ist die Folge (Tf,x0 ,n (x))n∈N konvergent und ihr Grenzwert ist gleich f (x); d.h. folgende Aussage ist wahr: ∀x ∈ If,x0 : Tf,x0 ,n (x) → f (x) für n → ∞ . Bemerkungen: Konvergenz der Reihe kann man mit dem Quotientenkriterium untersuchen, eventuell noch mit Leibniz-Kriterium. Die Reihe (formal) ist immer definiert (sobald f alle Ableitungen hat). Es kann aber passieren, dass sie nicht für alle x konvergent ist. Selbst wenn sie für x konvergent ist, kann es passieren, dass ihre Summe nicht gleich f (x) ist. Beispiele: 50 1 1 • f (x) = ln(x + 1): Df = (−1, +∞), f ′ (x) = x+1 , f ′′ (x) = − (x+1) 2 und 1 (k) k−1 allgemein f (x) = (−1) (k − 1)! (x+1)k für x > −1, k ∈ N. Da 1 = 1, f ′′ (0) = −1 sind und allgemein f (0) = ln(1) = 0, f ′ (0) = 0+1 f (k) (0) = (−1)k−1 (k − 1)!, k ∈ N, ist Tf,0,1 (x) = 0 0 1 1 x + x =x 0! 1! das Taylorpolynom erster Ordnung der Funktion f (x) = ln(x + 1) mit Mittelpunkt 0, Tf,0,2 (x) = 0 0 1 1 −1 2 1 x + x + x = x − x2 0! 1! 2! 2 das Taylorpolynom zweiter Ordnung der Funktion f (x) = ln(x + 1) mit Mittelpunkt 0, und ∞ ∑ (−1)k−1 k x . k k=1 die Taylorreihe der Funktion ln(x + 1) mit Mittelpunkt 0. Diese Reihe ist konvergent, sogar absolut konvergent für jedes x ∈ (−1, 1) (nach Quotientenkriterium), und konvergent für x = 1 nach Leibniz-Kriterium, aber nicht absolut konvergent für x = 1 (harmonische Reihe) und nicht konvergent für x ∈ R \ (−1, 1]. Ob diese Reihe tatsächlich die Summe f (x) hat, werden wir später untersuchen. • Für f (x) = cos(x), x0 = 0: Taylorpolynom, Taylorreihe, Taylorreihenentwicklung in R • Für eine Polynomfunktion, x0 ∈ R. • Sei f (x) = exp(− x12 ) für x ̸= 0, f (0) = 0. Man kann nachrechnen: f ′ (0) = 0, f ′ (x) = exp(− x12 ) x23 für x ̸= 0, f ′′ (0) = 0, f ′′ (x) = .... für x ̸= 0, f ′′′ (0) = 0, etc. f (k) (0) = 0, k ∈ N. Die Taylorreihe ist ∞ ∑ k 0x = k=0 ∞ ∑ 0 k=0 die offensichtlich konvergent ist und deren Summe gleich 0 ist für jedes x ∈ R, also ist die Summe nicht gleich f (x) für x ̸= 0. Satz Es gilt ln(x + 1) = ∞ ∑ (−1)k−1 k=1 k 51 xk , x ∈ (−1, 1] . D.h., die Taylorreihe der Funktion f (x) = ln(x + 1) mit Mittelpunkt 0 ist konvergent und ihre Summe ist gleich f (x) für jedes x ∈ (−1, 1] (wir haben die Taylorreihenentwicklung der Funktion ln(x + 1) um Mittelpunkt 0 im Intervall (−1, 1]). Beweis. Wir haben gesehen, dass die Taylorreihe der Funktion für alle x ∈ (−1, 1] konvergent ist (für x = 0 ist es offensichtlich, für x ∈ (−1, 0) ∪ (0, 1) kann man es mit Quotientenkriterium herleiten, und für x = 1 folgt es aus dem Leibniz-Kriterium). Bezeichnen wir durch s(x) die Summe der Reihe, und das Taylorpolynom Tf,0,n (x) n-ter Ordnung ist ihre n-te Partialsumme. Teil I. Sei y ∈ (−1, 1) fest. Zu zeigen ist, dass s(y) = f (y), d.h. dass Tf,0,n (y) → f (y) als Grenzwert der Folge. Diese ist trivialerweise wahr für y = 0, da Tf,0,n (0) = 0 und f (0) = 0. Sei also y ̸= 0. Sei ε > 0 gegeben. Da (|y|n )n∈N eine gegen 0 konvergente Folge ist, zu ε(1 − |y|) > 0 existier ein n0 ∈ N so, dass folgende Aussage gilt: n ∈ N, n > n0 ⇒ |y|n < ε(1 − |y|) . Wir werden zeigen, dass folgende Aussage gilt: n ∈ N, n > n0 ⇒ |Tf,0,n (y) − f (y)| < ε . Damit wird der Beweis des Teiles I beendet. Sei also n > n0 fest. Folgendes Argument nutzt nur die Tatsache, dass die Funktion f (n + 1)mal differenzierbar ist in einer Umgebung von x0 (in unserem Fall x0 = 0 und die Umgebung ist (−1, 1)), und gilt sonst für andere Funktionen mit dieser Eigenschaft auch. Betrachte die Funktionen g(x) = n ∑ f (k) (x) k! k=0 (y − x)k , h(x) = x − y auf dem Intervall [x0 , y] bzw. [y, x0 ] je nach dem ob y > x0 oder y < x0 ist. Da diese stetig in dem abgeschlossenem Intervall, differenzierbar in dem offenem Intervall sind, existiert laut dem Mittelwertsatz (b) ein ξ zwischen x0 und y so, dass g(y) − g(x0 ) g ′ (ξ) = . ′ h (ξ) h(y) − h(x0 ) 52 Wir berechnen: f (n+1) (x) (y − x)n g (x) = ... = n! h′ (x) = 1 g(y) − g(x0 ) = f (y) − Tf,x0 ,n (y), h(y) − h(x0 ) = (y − y) − (x0 − y) = y − x0 ′ und setzen ein für x = ξ in die obere Gleichung. Umgestellt, damit bekommen wir f (n+1) (ξ) f (y) − Tf,x0 ,n (y) = (y − ξ)n (y − x0 ) n! mit ξ zwischen x0 und y (aber sonst unbekannt). Dieser Ausdruck heißt Cauchy-Darstellung des Restgliedes in der Taylor-Formel für f mit Mittelpunkt x0 , und gilt für beliebige, (n+1)-mal differenzierbare Funktion und ihr Taylorpolynom. Zurück zu unsere Funktion f (x) = ln(x + 1), können wir f (n+1) (x) = x > −1, berechnen, und dieses für x = ξ (und auch x0 = 0 in die obere Cauchy-Darstellung einsetzen: (−1)n n! , (x+1)n+1 f (y) − Tf,0,n (y) = (−1)n n! (ξ+1)n+1 (y − ξ)n y n! ( )n y−ξ y n = (−1) , ξ+1 ξ+1 mit ξ zwischen 0 und y (aber sonst unbekannt). Wir wollen in diesem Ausdruck den Betrag von oben abschätzen. Erstens, da ξ zwischen 0 und y ist y 1 | ≤ 1−|y| . Zweitens analysieren wir den Kurund y ∈ (−1, 1) ist, gilt | ξ+1 y−z venverlauf der Funktion k(z) = z+1 als Funktion der Variable z auf dem −1−y Intervall I = [0, y] bzw. I = [y, 0]. Sie ist stetig. Da k ′ (z) = (z+1) 2 ≤ 0 ist, ist k monoton fallend. Folglich gilt für das Maximum von |k|: max{|k(z)| : z ∈ I} = max{|k(0)|, |k(y)|} = max{|y|, 0} = |y| . Schliesslich schätzen wir ab: |f (y) − Tf,0,n (y)| ≤ (max{|k(z)| : z ∈ I})n 1 1 ≤ |y|n ≤ε, 1 − |y| 1 − |y| da n0 so gewählt wurde. Der Beweis des Teiles I ist beendet. 53 Teil II. Sei y = 1. Da f stetig an der Stelle 1 (von links) ist, können wir mit Anwendung des Teiles I schreiben: f (1) = lim f (x) = lim s(x) . x→1− x→1− Es ist also zu zeigen, dass s stetig von links an der Stelle 1 ist. Damit würde der Beweis beendet. Die Stetigkeit von s kann man mit der gleiche Idee beweisen, wie die Stetigkeit der Exponentialfunktion. Ohne Beweis. Ausblicke. Aufgabentyp I: gegeben eine Reihe, finde ihre Summe. Das ist eigentlich ein Grenzwertproblem, und oft sehr schwierig. Einfach ist nur die Konvergenz der Reihe zu beweisen. Aufagebentyp II: gegeben eine Funktion, finde ihre Taylorreihe. Das ist einfach, man mus nur die Ableitungen der Funktion nachrechnen. Schwierig wird es erst, wenn man die Konvergenz der Reihe gegen den Wert f (x) beweisen will. Man kann eine gegebene Funktion auch in anderen Reihentypen entwickeln wollen, z.B. statt in Potenzreihe in eine Reihe wo die Reihenglieder die Trigonometrische Funktionen bk sin(kx), ak cos(kx), k ∈ N, sind. Diese heißt Fourierreihe. Manche Rechnungen sind einfacher mit Reihen zu machen. Deswegen transformiert man die Funktion in eine Reihe (Aufgabentyp II), rechnet mit der Reihe, und dann für die erhaltene neue Reihe ihre Summe findet (Aufgabentyp I). Anwendungstyp I: ersetze die (komplizierte) Funktion durch ihr Taylorpolynom (einfachere funktion) Anwendungstyp II: Reihenansatz für Lösungen bestimmter Problemen 10.0.2 Anwendung I: parabolische Antenne Die Parabel P sei als Graph der Funktion f (x) = x2 , x ∈ R, beschrieben. Wir untersuchen die Spiegelungen den Strahlen parallelen zu y-Achse an der parabolische Spiegelfläche P. Sei x0 ∈ R, dann ist P0 = (x0 , x20 ) ∈ P. Wir approximieren die Funktion f in der Umgebung von x0 durch ihren Taylorpolynom erster Ordnung mit Mittelpunkt x0 , das heißt die Parabel P in der Umgebung von P0 durch der Tangente t in P0 . Die Tangente t ist der Graph der linearen Funktion f ′ (x0 )(x − x0 ) + f (x0 ), x ∈ R, also die Gerade t = {(x, y) ∈ R2 : y − 2x0 x = −x20 }, da f ′ (x) = 2x für x ∈ R ist. Ein Richtungsvektor ist z.B. r = (1, 2x0 ). Die Strahl sei durch der Gerade g1 = {(y, x0 ) : y ∈ R} beschrieben. Sie 54 spiegelt sich an P als ob sie sich an der Tangente t gespiegelt hätte, also wird es eine Strahl (Gerade) g2 die durch dem Punkt P0 geht und beschliest mit t den gleichen Winkel wie der Winkel zwischen g1 und t. Da z.B. r1 = (0, 1) ein Richtungsvektor der Gerade g1 ist, gilt für die Größe des Winkels zwischen g1 und t, α1 , folgendes: cos(α1 ) = 2|x0 | |⟨r1 , r⟩| |2x | √ 0 =√ = . ∥r1 ∥ ∥r∥ 1 · 1 + (2x0 )2 1 + 4x20 Wenn wir mit y die y-Koordinate des Schnittpunktes der Gerade g2 mit der y-Achse bezeichnen (der Schnittpunkt ist also P = (0, y)), ist z.B. r2 = P0 − P = (x0 , x20 − y) ein Richtungsvektor der Gerade g2 und für die Größe α2 des Winkels zwischen t und g2 gilt: |⟨r2 , r⟩| |x0 · 1 + (x20 − y) · 2x0 | √ =√ 2 ∥r2 ∥ ∥r∥ x0 + (x20 − y)2 · 1 + (2x0 )2 |1 + 2x20 − 2y| |x0 | √ =√ . 1 + 4x20 x20 + x40 − 2x20 y + y 2 cos(α2 ) = Weil α1 = α2 ist, muss auch cos(α1 ) = cos(α2 ) sein und eingesetzt von oben bekommen wir eine Gleichung für die Unbekannte y, die man nach äquivalente Umformungen lösen kann. Man bekommt die eindeutige Lösung y = 41 . Diese ist unabhängig von x0 . Das bedeutet, dass alle Strahlen parallel zur y-Achse werden an der Parabel P so gespiegelt, dass sie alle durch den Punkt (0, 14 ) gehen. Dieser Punkt heißt Fokuspunkt der Parabel P. 10.0.3 Anwendung II: Lösung einer Differenzialgleichung mit Potenzreihenansatz Problem: finde eine Funktion f mit Df = R, f differenzierbar, f ′ = f und f (0) = 1. Mit dem Ansatz dass f Taylorreihenentwicklung mit Mittelpunkt 0 in R hat, ∞ ∑ f (x) = an xn , x ∈ R n=0 mit a0 , a1 , · · · ∈ R (unbekannt), wir führen folgende formale Rechnungen durch, die nicht begründet sind: f ′ (x) = ∞ ∑ an nxn−1 = n=1 ∞ ∑ k=0 55 ak+1 (k + 1)xk in f ′ = f und f (0) = 1 eingesetzt, ∞ ∑ k ak+1 (k + 1)x = k=0 ∞ ∑ ∞ ∑ k ak x , k=0 ak 0k = 1 k=0 und auf ak aufgelöst ak = ak+1 (k + 1), a0 = 1 bekommen wir a0 = 1, a1 = a0 a1 1 ak 1 = 1, a2 = = , . . . , ak+1 = = 1 2 2 k+1 (k + 1)! also f (x) = ∞ ∑ 1 k x . k! k=0 Diese waren nicht Begründet. Wir wissen aber, dass die Reihe ∑∞ Rechnungen 1 k k=0 k! x für jedes x ∈ R konvergent ist, und ihre Summe die Exponentialfunktion ist. Wir begründen jetzt, dass die Exponentialfunktion f (x) = exp(x) wirklich unsere Aufgabe löst: tatsächlich ist Df = R, f differenzierbar, f ′ (x) = exp(x) = f (x) für jedes x ∈ R und exp(0) = 1. Damit haben wir eine Lösung des Problemes gefunden, und zwar die Exponentialfunktion. Wir beantworten nicht die Frage, ob es andere Lösungen gibt. Ähnlich kann man lösen: xf ′ (x) = 1 für x > 0, oder f ′′ = −f . 56 11 Differentialgleichungen - Einblick Eine Stammfunktion zu einer gegebenen Funktion zu finden ist eine Aufgabe, die sich als Lösen einer Gleichung, wo die Unbekannte eine Funktion ist, darstellen lässt; z. B. f ′ (x) = x3 , x ∈ R. Diese Gestalt hat auch die folgende Aufgabe: Finde eine Funktion f mit Df = R so, dass f differenzierbar ist und f ′ = f erfüllt. Die Antwort erraten wir: die Funktion exp(x), aber auch a exp(x) für beliebige Parameter a ∈ R. Wenn wir einen Wert festlegen, z. B. f (0) = 1, dann ist unter den Funktionen der Form fa (x) = a exp(x), a Parameter, nur die Funktion f1 (x) = exp(x) eine Lösung. Definition Eine Gleichung, wo die Unbekannten eine reelle Funktion f und ein offenes Intervall I ⊂ Df sind, und wo Ableitungen dieser Funktion vorkommen, heißt Differentialgleichung für f auf I. Beispiele: • f ′ = f , xf ′ (x) = 1, f ′′ + f = 0, f ′ (x) = (f (x))2 x sind Differentialgleichungen. • Jede Stammfunktion zu x2 −7x+3 auf R erfüllt die Differentialgleichung f ′ (x) = x2 − 7x + 3 auf R. • Die funktion exp(3x) erfüllt die Differentialgleichung f ′ = 3f auf R. • Die Funktion ln(x) erfüllt die Differentialgleichung xf ′ (x) = 1 auf (0, +∞). • Die Funktion sin(x) erfüllt die Differentialgleichung f ′′ + f = 0 auf R. Die Funktion cos(x) auch. Eine Funktion der Form a sin(x) + b cos(x), für beliebige Parametern a, b ∈ R, auch. Unter den Funktionen der Form f (x) = a sin(x) + b cos(x), a, b Parametern, finden wir genau eine, welche folgende Eigenschaften erfüllt: f ′′ (x) + f (x) = 0, x ∈ (0, +∞), f (0) = 2, f ′ (0) = −1 (Differentialgleichung mit Anfangsbedingung). Unter den Funktionen der Form f (x) = a sin(x) + b cos(x), a, b Parametern, finden wir genau eine, welche folgende Aussage erfüllt: f ′′ (x) + f (x) = 0, x ∈ (0, 1), f (0) = −1, (Differentialgleichung mit Randbedingung). 57 f (1) = 2 Satz Es existiert genau eine Funktion f mit Definitionsbereich R, welche folgende Eigenschaften erfüllt: f ist differenzierbar, f ′ (x) = f (x) für x ∈ R und f (0) = 1. Beweis (mit Zusammenfassung der bis jetzt bewiesenen ∑∞ Aussagen). 1. Teil: Existenz. Für jedes x ∈ R ist die Reihe k=0 k!1 xk konvergent (für x = 0 ist dies offensichtlich, für x ̸= 0 folgt dies aus dem Quotientenkriterium), ihre Summe ist durch exp(x) bezeichnet. Offensichtlich ist ∞ n ∑ ∑ 1 k 1 k exp(0) = 0 = lim 0 = lim (1 + 0 + · · · + 0) = lim 1 = 1 . n→∞ n→∞ n→∞ k! k! k=0 k=0 Ausserdem haben wir schon bewiesen, dass die Funktion exp differenzierbar ist und exp′ (x) = exp(x), x ∈ R. Folglich erfüllt die Funktion f (x) = exp(x), x ∈ R, die Aussage des Satzes. 2. Teil: Eindeutigkeit. Wir kennen schon die Funktion exp(x), x ∈ R, und ihre Eigenschaften. Nehmen wir jetzt an, dass eine andere Funktion f die Aussage erfüllt. Insbesondere ist f stetig und differenzierbar. Betrachten wir die Funktion h(x) = exp(−x)f (x), x ∈ R. Dann ist h′ (x) = exp(−x)(−1)f (x) + exp(−x)f ′ (x) = − exp(−x)f (x) + exp(−x)f (x) = 0, x∈R. Folglich ist h konstant, h(x) = h(0) = 1 für jedes x ∈ R. Dies bedeutet, dass exp(−x)f (x) = 1, und daraus folgt f (x) = (exp(−x))−1 = exp(x), x ∈ R. Wir haben bewiesen, dass f (x) = exp(x), das heißt, dass die Aussage nicht von mehr als einer Funktion erfüllt werden kann. Damit ist der Satz komplett bewiesen. Bemerkung: Man könnte die Exponentialfunktion als die Lösung ∑ eindeutige 1 k der oberen Aufgabe definieren, und dann beweisen, dass ∞ x die Tayk=0 k! lorreihe mit Mittelpunkt 0 von dieser Funktion ist (das ist einfach), und beweisen, dass die Summe dieser Reihe mit dieser Funktion auf R übereinstimmt (das ist schwierig, kann mithilfe Cauchyscher-Darstellung des Restgliedes in der Taylor-Formel durchgeführt werden). Es gibt auch weitere Alternativen, die Exponentialfunktion einzuführen. Zum Beispiel, als die einzige Funktion, welche die folgende Aussage erfüllt: f stetig auf R, f (0) = 1, und für alle x, y ∈ R gilt f (x + y) = f (x)f (y) ; das ist aber auch nicht einfach ! 58 11.1 Einige Lösungsmethoden • Integration, Raten • “Trennung der Variablen”: Wir stellen die Differenzialgleichung f ′ = f ′ um: entweder ist f = 0 oder ff = 1. In dem zweiten Fall stellen wir weiter um: (ln(f (x)))′ = 1 oder (ln(−f (x)))′ = 1 , (ln(f (x)) − x)′ = 0 oder (ln(−f (x)) − x)′ = 0, ln(f (x)) − x = c oder ..., ln(f (x)) = x + c oder ... , f (x) = exp(x + c) oder ..., f (x) = exp(c) exp(x) oder .... . Insgesamt ist f = d exp(x), d ∈ R Parameter. Diese Methode ist anwendbar auf f ′ = f , xf ′ (x)) = 1, f ′ (x) = (f (x))2 x; nicht anwendbar auf f ′′ + f = 0. • Exponentialansatz: Wir suchen Lösungen unter Funktionen der Form f (x) = exp(λx), λ ∈ C Parameter. Anwendbar auf f ′ = f , f ′′ + f = 0; nicht anwendbar auf xf ′ (x) = 1, f ′ (x) = (f (x))2 x. • Potenzreihenansatz: Wir suchen Lösungen unter Funktionen in Form einer Potenzreihe. Anwendbar auf f ′ = f , f ′′ + f = 0, xf ′ (x) = 1; nicht anwendbar auf f ′ (x) = (f (x))2 x. • andere Ansätze (Raten) Wenn man nachprüft, dass der gefundene Kandidat tatsächlich die Aufgabe löst, ist es nicht nötig, bei diesen Methoden die Schritte zu begründen, und es ist ein vollständiger Beweis für die Existenz einer Lösung. Dabei ist die Frage, wieviele Lösungen es überhaupt gibt, und ob man alle gefunden hat, aber nicht beantwortet ! (Man kann theoretisch die Schritte begründen, und damit die Eindeutigkeit der Lösung bekommen, wir werden es hier nicht tun.) 11.2 Anwendung: Mathematisches Pendel Sei φ(t) der Auslenkungswinkel im Zeitpunkt t. Laut der Bewegungsgleichung aus der Physik (Newtonsches Gesetz) genügt die Funktion φ der Aussage mlφ′′ (t) = −mg sin(φ(t)), t > 0 , wo die rechte Seite die tangentiale Komponente der Schwerkraft und die linke Seite die Rückstellkraft des Pendels ist, m das Gewicht, l die Länge des Fadens und g die Gravitationskonstante sind. 59 Gegeben l, ist dies eine Differentialgleichung für die unbekannte Funktion φ. Man beachte, dass die Masse m > 0 keine Rolle spielt. Diese Differentialgleichung kann man nicht direkt lösen. Wir approximieren die Sinusfunktion in der Nähe von 0 durch ihr Taylorpolynom erster Ordnung und Mittelpunkt 0: Tsin,0,1 (x) = 0 ∑ (−1)k k=0 x2k+1 =x. (2k + 1)! Aus diesem Grund ersetzen wir für kleine Auslenkungswinkel φ(t) den Ausdruck sin(φ(t)) durch φ(t). Wir erhalten die (approximierte) Differentialgleichung lφ′′ (t) = −gφ(t), t > 0 . Diese Differentialgleichung kann man direkt lösen. √ Wir weisen nach, dass die Funktionen φ1 (t) = cos( gl t) und φ2 (t) = √ sin( gl t), und auch alle Funktionen der Form f (t) = aφ1 (t) + bφ2 (t), t ∈ R, das approximierte Problem auf R lösen. Mit dem Ansatz φ(t) = aφ1 (t) + bφ2 (t), t ∈ R, a, b Parameter, erhalten wir die Lösung der Differentialgleichung mit Anfangsbedingungen, mit gegebener Länge l = 50 cm und g ≈ 10 m/s2 : π lφ′′ (t) = −gφ(t), φ(0) = 5◦ = , φ′ (0) = 0 , 36 √ π cos( 0, 05t) in s. Damit erhalten wir eine Approximation und zwar φ(t) = 36 der Auslenkungswinkel. Man hätte auch ein Taylorpolynom höherer Ordnung nehmen können. Die Approximation kann dann besser werden, die neue Aufgabe kann aber schwieriger werden. Zum Beispiel beim Ersetzen durch Taylorpolynom dritter Ordnung 1 ∑ x2k+1 x3 (−1)k Tsin,0,3 (x) = =x− (2k + 1)! 6 k=0 erhalten wir die sogenannte Duffing-Gleichung ( ) φ(t)3 ′′ lφ (t) = −g φ(t) − , 6 60 t>0. 12 Funktionen mehrerer Variablen Definition Eine Abbildung von R2 nach R heißt Funktion von zwei Variablen, geschrieben f : R2 → R, statt f ((x1 , x2 )) werden wir kürzer f (x1 , x2 ) schreiben, oder f (x, y). Definitionsbereich Df = {(x1 , x2 ) ∈ R2 : ∃z ∈ R mit f (x1 , x2 ) = z} ⊂ R2 und Wertebereich Wf = {z ∈ R : ∃(x1 , x2 ) ∈ Df mit f (x1 , x2 ) = z} ⊂ R sind wie bei allgemeinen Abbildungen definiert. Allgemeiner, für n ∈ N, eine Abbildung f : Rn → R heißt Funktion von n Variablen. Die Menge Gf = {(x1 , . . . , xn , xn+1 ) ∈ Rn+1 : xn+1 = f (x1 , . . . , xn )} ⊂ Rn+1 = Rn × R heißt Graph der Funktion f , Rn ist die Variablenebene (Variablenraum), R ist die Menge der Werte (Werteraum). Beispiele: • f (x1 , x2 ) = 2x1 − x2 + 8, Df = R, das ist eine lineare Funktion von zwei Variablen. Allgemein eine lineare Funktion von zwei Variablen ist eine Abbildung der Form f (x, y) = ax + by + c, wobei a, b, c ∈ R gegeben sind (Parameter). • f (x1 , x2 ) = x21 − 3x22 − x1 x2 , das ist eine Polynomfunktion von zwei Variablen. • f (x, y) = x3 , y 2 +1 das ist eine rationale Funktion. • x sin(y) + z Beobachtungen: • Graph einer Funktion von zwei Variablen ist eine Teilmenge des Raumes. • Graph einer linearen Funktion von 2 Variablen ist eine Ebene im Raum. • Eine Ebene im Raum ist Graph einer linearen Funktion, wenn man die Variablenebene passend wählt. 61 • Für f : R2 → R kann man Schnittmengen von Gf mit vertikalen Ebenen (d.h. senkrecht auf der Variablenebene) betrachten. Diese Schnittmengen sind offensichtlich Graphen von Funktionen einer Variable. Diese Funktionen einer Variable können untersucht werden, insbesondere auf Differenzierbarkeit. Man kann auch Schnittmengen des Graphen mit horizontalen Ebenen (d.h. parallel zur Variablenebene) betrachten. Für diese gilt die obere Aussage nicht immer. Wir werden diese später untersuchen. Neue Notation der Ableitung einer reellen Funktion g der Variablen x an der Stelle x0 ∈ R: d g ′ (x0 ) = g(x)|x=x0 . dx Definition (partielle Ableitungen) Sei f : Rn → R eine Funktion, (a1 , . . . , an ) ∈ Df . Betrachten wir die Funktion g1 (x) = f (x, a2 , . . . , an ) der Variablen x. Wenn die Funktion g1 an der Stelle a1 differenzierbar ist, heißt ihre Ableitung g1′ (a1 ) die partielle Ableitung von f nach der ersten Variable x1 an der Stelle (a1 , . . . , an ) und geschrieben wird ∂f d d (a1 , . . . an ) = f (x, a1 , . . . an )|x=a1 = g1 (x)|x=a1 = g1′ (a1 ) . ∂x1 dx dx Betrachten wir die Funktion g2 (y) = f (a1 , y, a3 , . . . , an ) der Variablen y. Wenn die Funktion g2 an der Stelle a2 differenzierbar ist, heißt ihre Ableitung g2′ (a2 ) die partielle Ableitung von f nach der zweiten Variable x2 an der Stelle (a1 , a2 , . . . , an ) und geschrieben wird ∂f d d (a1 , . . . , an ) = f (a1 , y, a3 , . . . , an )|y=a2 = g2 (y)|y=a2 = g2′ (a2 ) . ∂x2 dy dy Usw, bis ∂f d (a1 , . . . , an ) = f (a1 , a2 , . . . , an−1 , z)|z=an , ∂xn dz die partielle Ableitung von f nach der n-ter Variable xn an der Stelle (a1 , a2 , . . . , an ) . Der Vektor ( ) ∂f ∂f ∇f (a1 , . . . , an ) = (a1 , . . . an ), . . . , (a1 , . . . an ) ∈ Rn ∂x1 ∂xn heißt Gradient der Funktion f an der Stelle (a1 , . . . , an ). Beispiel: 62 • f (x, y) = x3 : y 2 +1 ∂f 3x2 (x, y) = 2 , ∂x y +1 ∇f (x, y) = ( ∂f −2yx3 (x, y) = 2 , ∂y (y + 1)2 3x2 −2yx3 , ), y 2 + 1 (y 2 + 1)2 (x, y) ∈ R2 , (x, y) ∈ R2 . Definition (höhere partielle Ableitungen) Sei f : R2 → R eine Funktion von zwei Variablen, f (x, y), und sei (x0 , y0 ) ∈ Df fest. Nehmen wir an, dass die partielle Ableitung von f nach der ersten Variable, ∂f , an jeder Stelle in ∂x 2 einer Umgebung von (x0 , y0 ) ∈ R existiert. Wenn die Funktion g1 (x) = ∂f (x, y0 ) eine Ableitung an der Stelle x0 be∂x sitzt, nennen wir diese die zweite partielle Ableitung von f (zuerst) nach der ersten Variable und (danach) nach der ersten Variable an der Stelle (x0 , y0 ), oder kürzer zweite partielle Ableitung von f nach der (beide Male) ersten Variable an der Stelle (x0 , y0 ). Notation: ( ) ( ) ∂ ∂f ∂ 2f d ∂f ∂x (x0 , y0 ) = (x0 , y0 ) = (x, y0 ) |x=x0 = g1′ (x0 ) . ∂x2 ∂x dx ∂x (x0 , y) eine Ableitung an der Stelle y0 Wenn die Funktion g2 (y) = ∂f ∂x besitzt, nennen wir diese die zweite partielle Ableitung von f (zuerst) nach der ersten Variable und (danach) nach der zweiten Variable an der Stelle (x0 , y0 ). Notation: ( ) ( ) ∂ ∂f ∂ 2f d ∂f ∂x (x0 , y0 ) = (x0 , y0 ) = (x0 , y) |y=y0 = g2′ (y0 ) . ∂y∂x ∂y dy ∂x Nehmen wir jetzt an, dass die partielle Ableitung von f nach der zweiten Variable, ∂f , an jeder Stelle in einer Umgebung von (x0 , y0 ) ∈ R2 existiert. ∂y (x, y0 ) eine Ableitung an der Stelle x0 Wenn die Funktion g3 (x) = ∂f ∂y besitzt, nennen wir diese die zweite partielle Ableitung von f (zuerst) nach der zweiten Variable und (danach) nach der ersten Variable an der Stelle (x0 , y0 ). Notation: ( ) ∂f ) ( ∂ 2 ∂y d ∂f ∂ f (x0 , y0 ) = (x0 , y0 ) = (x, y0 ) |x=x0 = g3′ (x0 ) . ∂x∂y ∂x dx ∂y Wenn die Funktion g4 (y) = ∂f (x0 , y) eine Ableitung an der Stelle y0 ∂y besitzt, nennen wir diese die zweite partielle Ableitung von f (zuerst) nach 63 der zweiten Variable und (danach) nach der zweiten Variable an der Stelle (x0 , y0 ), oder kürzer zweite partielle Ableitung von f nach der (beide Male) zweiten Variable an der Stelle (x0 , y0 ). Notation: ( ) ∂f ( ) ∂ 2 ∂y ∂ f d ∂f (x0 , y0 ) = (x0 , y0 ) = (x0 , y) |y=y0 = g4′ (y0 ) . ∂y 2 ∂y dy ∂y Wenn alle vier Bedingungen von oben erfüllt sind, heißt die Matrix ( 2 ) ( ( ∂f ) ) ∂ f ∂2f ∇( ∂x )(x0 , y0 ) (x , y ) (x , y ) 0 0 0 0 2 ∂y∂x Hf (x0 , y0 ) = ∂∂x2 f = ∂2f ∇ ∂f (x0 , y0 ) (x , y ) (x0 , y0 ) 0 0 ∂y ∂x∂y ∂y 2 die Hesse-Matrix der Funktion f an der Stelle (x0 , y0 ). Beispiel: • f (x, y) = x3 : y 2 +1 Da ∂f (x, y) ∂x ∂2f 6x (x, y) = 2 , 2 ∂x y +1 Da ∂f (x, y) ∂y = −2yx3 , (y 2 +1)2 = 3x2 , y 2 +1 gilt ∂ 2f 3x2 (x, y) = 2 (−2y), ∂y∂x (y + 1)2 (x, y) ∈ R2 . gilt ∂2f −6yx2 ∂ 2 f −2x3 (y 2 + 1)2 − (−2x3 y)2(y 2 + 1)2y 6x3 y 2 − 2x3 (x, y) = 2 , = = , ∂x∂y (y + 1)2 ∂y 2 (y 2 + 1)4 (y 2 + 1)3 für (x, y) ∈ R2 . Folglich ist ( Hf (x, y) = 6x y 2 +1 −6yx2 (y 2 +1)2 ) 3x2 (−2y) (y 2 +1)2 6x3 y 2 −2x3 (y 2 +1)3 , (x, y) ∈ R2 . Bemerkung: Ähnlich definiert man zweite partielle Ableitungen einer Funktion von n Variablen (insgesamt n2 Stück), und dritte partielle Ableitungen einer Funktion von zwei Variablen (2 · 2 · 2 = 8 Stück), von n Variablen (n3 Stück), usw. Die Reihenfolge der Ableitungen muss man beachten, da ∂2f ∂2f im Allgemeinen ∂x∂y und ∂y∂x verschieden sein können ! 64 12.1 Konvergenzbegriffe Auf der Menge Rn haben wir den Euklidischen Abstand (auf R den Betrag), damit können wir auch Konvergenzbegriffe einführen. Definition (Grenzwert, Stetigkeit) Sei f : Rn → R eine Funktion. a) Sei a ∈ Rn und nehmen wir an, dass ein r1 > 0 existiert mit B(a, r1 ) \ {a} ⊂ Df . Sei b ∈ R. Wir sagen, dass f (x) gegen b konvergiert wenn x gegen a konvergiert, falls zu jeder positiven reellen Zahl ε (mindestens) eine positive reelle Zahl δ existiert, sodass folgende Aussage wahr ist: x ∈ B(a, δ) \ {a} ⇒ |f (x) − b| < ε . Notation: limx→a f (x) = b, b heißt Grenzwert von f in a. b) Sei a ∈ Df ⊂ Rn und nehmen wir an, dass ein r1 > 0 existiert mit B(a, r1 ) \ {a} ⊂ Df , und dass b ∈ R der Grenzwert von f in a ist. Wir sagen, dass f an der Stelle a stetig ist, wenn f (a) = b, d.h. wenn f (a) = lim f (x) . x→a Beispiele: • lim(x,y)→(x √ 0 ,y0 ) (x + y) = x0 + y0 ; Hinweis: für beliebiege a, b ∈ R gilt a+b 2 ≤ a2 +b2 . 2 • Viele elementare Funktionen sind stetig, da die Rechenregeln gelten ähnlich wie für Funktionen einer Variable. Polynome sind stetig. Da die Mengen Rn und R zusätzlich eine Vektorraumstruktur haben, kann man über linearen Abbildungen reden. Mithilfe Euklidischen Abstandes können wir “Approximation” als ein Grenzwert ausdrücken. Definition (totale Ableitung) Sei f : Rn → R eine Funktion (von n Variablen), a = (a1 , . . . , an ) ∈ Df , und A = (A1 , . . . , An ) ∈ Rn ein Vektor. Wenn die lineare Funktion g(x) = f (a1 , . . . , an ) + A1 (x1 − a1 ) + . . . An (xn − an ) = f (a) + A · (x − a)T , x = (x1 , . . . , xn ) ∈ Rn , die Eigenschaft |f (x) − g(x)| =0 x→a ∥x − a∥ lim 65 erfüllt, heißt der Vektor A die totale Ableitung der Funktion f an der Stelle a und wir schreiben f ′ (a) = A. Wir sagen dann, dass f (total) differenzierbar an der Stelle a ist. In diesem Fall heißt der Graph von g die Tangentialebene an der Fläche Gf im Punkt (a, f (a)) (oder: Tangentialebene der Funktion f an der Stelle a). Der Grenzwert in der Definition sagt aus, dass in der Umgebung von a die Funktion f durch g gut approximiert ist. Satz Wenn f an der Stelle a totale Ableitung besitzt, dann ist f an der Stelle a stetig. Beweis: Für x ∈ B(a, r1 ) \ {a} ⊂ Df können wir schreiben: f (x) − f (a) = f (x) − g(x) + g(x) − f (a) = f (x) − g(x) ∥x − a∥ + g(x) − g(a) ∥x − a∥ Mit Rechneregeln für die Grenzwerte man kann nachprüfen, dass der Grenzwert der rechten Seite für x → a gleich 0 ist. Daraus folgt, dass f in a stetig ist. Bemerkung: Existenz von partiellen Ableitungen impliziert Stetigkeit nicht ! Beispiel: Sei f (x, y) = 0 wenn x = 0 oder y = 0, f (x, y) = 1 sonst. Dann ist ∂f (0, 0) = 0, ∂f (0, 0) = 0, aber offensichtlich ist f an der ∂x ∂y Stelle (0, 0) nicht stetig. Satz i) Wenn f total differenzierbar in a ist, dann existieren die partielle Ableitungen von f an der Stelle a und es gilt: ∇f (a) = f ′ (a) . ii) Wenn f alle partielle Ableitungen in einer Umgebung von a besitzt, und alle diese sind an der Stelle a stetig, dann hat f totale Ableitung an der Stelle a und es gilt: f ′ (a) = ∇f (a) . Beweis von i) für n = 2. a = (a1 , a2 ) ∈ R2 . Sei f ′ (a1 , a2 ) = (A1 , A2 ) ∈ R2 und g die lineare Funktion aus der Definition der totaler Ableitung, g(x1 , x2 ) = 66 f (a1 , a2 ) + A1 (x1 − a1 ) + A2 (x2 − a2 ). Es gilt ∂f f (x, a2 ) − f (a1 , a2 ) d (a1 , a2 ) = f (x, a2 )|x=a1 = lim x→a1 ∂x1 dx x − a1 f (x, a2 ) − g(x, a2 ) + g(x, a2 ) − f (a1 , a2 ) = lim x→a1 x − a1 f (x, a2 ) − (A1 (x − a1 ) − f (a1 , a2 )) + A1 (x − a1 ) = lim x→a1 x − a1 f (x, a2 ) − g(x, a2 ) + A1 . = lim x→a1 x − a1 Mithilfe der Definition des Grenzwertes können wir beweisen, dass der letzter Grenzwert gleich 0 ist. Tatsächlich, für ε > 0 existiert δ > 0 so, dass (x1 , x2 ) ∈ BR2 ((a1 , a2 ), δ) \ {(a1 , a2 )} ⇒ |f (x1 , x2 ) − g(x1 , x2 )| ( ) ( ) <ε. x1 a1 ∥ − ∥ x2 a2 ( ) ( ) x a Insbesondere, für x ∈ R gilt ∥ − 1 ∥ = |x − a1 |, also gilt auch a2 a2 x ∈ BR (a1 , δ)\{a1 } ⇒ (x, a2 ) ∈ BR2 ((a1 , a2 ), δ)\{(a1 , a2 )} ⇒ |f (x, a2 ) − g(x, a2 )| <ε. |x − a1 | Das bedeutet, dass der letzter Grenzwert oben geich 0 ist, und folglich besitzt ∂f f partielle Ableitung nach der ersten Variable an der Stelle a und ∂x (a) = 1 ∂f A1 . Genauso zeigt man, dass ∂x2 (a) = A2 . Insgesamt bedeutet dies, dass ∇f (a) = A. Beweis von ii) wird hier nicht gemacht, da Taylorpolynom benötigt; siehe [Tretter II, Seiten 41-42]. Beispiele • f (x, y) = −2x2 − 3y 2 an der Stelle (1, 1): da ∂f (x, y) = −4x, diese ∂x Funktion ist eine Polynom, also stetig, insbesondere stetig an der Stelle (1, 1), ∂f (x, y) = −6y, diese Funktion ist eine Polynom, also stetig, ∂y insbesondere stetig an der Stelle (1, 1), der Satz Teil ii) sagt aus, dass f total differenzierbar an der Stelle (1, 1) ist und f ′ (1, 1) = ∇f (1, 1) = (−4, −6). • f (x, y) = y wenn x ̸= 0, und f (x, y) = 0 wenn x = 0, Stelle a = (0, 0): 67 Es gilt ∂f (0, 0) = ∂x ∂f (0, 0) = ∂y d f (x, 0) − f (0, 0) f (x, 0)|x=0 = lim =0, x→0 dx x−0 d f (0, y) − f (0, 0) f (0, y)|y=0 = lim = 0, y→0 dy y−0 und sei g(x, y) = f (0, 0) + 0(x − 0) + 0(y − 0) = 0. Wir können nachprüfen, dass die Aussage |f (x, y) − g(x, y)| =0 (x,y)→(0,0) ∥(x, y) − (0, 0)∥ lim nicht gilt, folglich ist (0, 0) nicht die totale Ableitung der Funktion f an der Stelle (0, 0). Da es nach Satz Teil i) nichts anderes als ∇f (0, 0) = (0, 0) die totale Ableitung der Funktion f an der Stelle (0, 0) sein kann, ist f an der Stelle (0, 0) nicht total differenzierbar. Satz (Schwarz) Sei f : R2 → R eine Funktion, U ⊂ Df , U offen, a ∈ U . ∂2f ∂2f und ∂y∂x existieren in U und sind stetig an der Stelle a, dann gilt Wenn ∂x∂y ∂ 2f ∂ 2f (a) = (a) . ∂x∂y ∂y∂x Ohne Beweis, siehe [Tretter II, Seiten 51-52], oder [Lasser-Hofmaier, Satz 14.11, Beispiel S. 204]. 12.2 Flächenverlauf Definition (lokale Extremalstellen) Sei f : Rn → R eine Funktion, a ∈ Df . Wenn ein r > 0 existiert so, dass die Aussage x ∈ B(a, r) ∩ Df ⇒ f (a) ≤ f (x) (bzw. ≥ ) gilt, dann heißt a eine lokale Minimalstelle (bzw. Maximalstelle) von f , und der Wert f (a) ein lokales Minimum (bzw. Maximum) von f . Satz (notwendige Bedingung für Extrema) Sei f : Rn → R eine Funktion, M ⊂ Df , a ∈ M . Wenn f an der Stelle a ein Maximum auf M besitzt, dann ist 68 entweder a ein Randpunkt der Menge M , oder a ein innerer Punkt der Menge M (in diesem Fall ist a eine lokale Maximalstelle der f ) und mindestens eine partielle Ableitung der Funktion f an der Stelle a existiert nicht, oder a ein innerer Punkt der Menge M (in diesem Fall ist a eine lokale Maximalstelle der f ) und alle partielle Ableitungen von f an der Stelle a existieren und sind gleich 0, d.h. ∇f (a) = (0, . . . , 0). Eine analoge Aussage gilt, wenn f an der Stelle a ein Minimum auf M besitzt. Beweis: folgt aus dem Satz notwendige Bedingung für Extrema für Funktionen einer Variable. Für n = 2 betrachte die Durchschnittmengen von Gf mit den vertikalen Ebenen {(x, y, z) ∈ R3 : x = a1 } bzw. {(x, y, z) ∈ R3 : y = a2 }, welche Graphen von Funktionen einer Variable sind. Für diese Funktionen einer Variable ist a2 bzw. a1 lokale Extremalstelle. Satz (Extremalstelle-Test) Sei f : Rn → R eine Funktion, U ⊂ Df , U offen, a ∈ U . Nehmen wir an, dass f alle partielle Ableitungen bis zu zweiter Ordnung in U besitzt und diese sind in U stetig. (In diesem Fall ist die Hesse-Matrix Hf (x) eine symmetrische Matrix für jede x ∈ U .) Nehmen wir weiter an, dass an der Stelle a alle partielle Ableitungen erster Ordnung der Funktion f gleich Null sind, d.h. ∇f (a) = (0, . . . , 0). i) Wenn die Hesse-Matrix Hf (a) positiv definit ist, dann ist a eine lokale Minimalstelle von f . ii) Wenn die Hesse-Matrix Hf (a) negativ definit ist, dann ist a eine lokale Maximalstelle von f . iii) Wenn die Hesse-Matrix Hf (a) indefinit ist, dann ist a keine lokale Extremalstelle von f . In diesem Fall heißt a ein Sattelpunkt von f . iv) In übrigen Fällen (semidefinit) ist keine Aussage in allgemeinen möglich. Ohne Beweis, da Approximation mit Taylorpolynom ist benötigt, siehe [Tretter II, Kapitel 9]. Beispiele • x2 + y 2 : (0, 0) ist lokale Minimalstelle (auch globale) • x2 − y 2 : (0, 0) ist Sattelpunkt 69 • −x2 − y 2 : (0, 0) ist lokale Maximalstelle (auch globale) ( ) 0 0 4 4 • f (x, y) = x + y : da Hf (0, 0) = semidefinit ist, der Satz 0 0 liefert keine Aussage. Aber man kann die Funktion direkt untersuchen, f (x, y) ≥ 0, f (0, 0) = 0, und feststellen, dass (0, 0) eine globale Minimalstelle ist. ( ) 0 0 4 4 • f (x, y) = x − y : da Hf (0, 0) = semidefinit ist, der Satz liefert 0 0 keine Aussage. Aber man kann die Funktion direkt untersuchen und feststellen, dass der Grapgh von f wie ein Sattel aussieht. ( ) 0 0 4 4 • f (x, y) = −x − y : da Hf (0, 0) = semidefinit ist, der Satz 0 0 liefert keine Aussage. Aber man kann die Funktion direkt untersuchen und feststellen, dass (0, 0) eine globale Maximalstelle ist. Monotonie hat kein Sinn, da wir auf Rn keine Ordnungsrelation definiert haben. Man kann aber ein Richtungsvektor v ∈ Rn festlegen und die Funktion fv einer Variable t, fv (t) = f (x + tv), t∈I⊂R, definieren und auf Monotonie untersuchen. Definition Sei f : Rn → R, a ∈ Df , v ∈ Rn . Wenn die Funktion fv an der Stelle 0 differenzierbar ist, dann heißt ihre Ableitung, also die Zahl fv′ (0) = d f (a + tv)|t=0 dt die Ableitung der Funktion f in der Richtung v an der Stelle a. Sie drückt die Größe des Anstieges der Funktion f in der Richtung v an der Stelle a aus. Satz Nehmen wir an, dass die Funktion f : Rn → R an der Stelle a ∈ Df differenzierbar ist. i) Sei v ∈ Rn gegeben. Dann ist d f (a + tv)|t=0 = ⟨∇f (a), v⟩ . dt 70 ∇f (a) ii) Wenn ∇f (a) ̸= 0, dann ist ∥∇f die Einheitsrichtung des größten (a)∥ Anstieges der Funktion f an der Stelle a. (Der Gradient zeigt in der Richtung des größten Anstieges.) Beweis von i): Sei g die lineare Funktion in der Definition der totaler Ableitung der f an der Stelle a. Mithilfe Matrixnotation, Matrixmultiplikation bzw. Skalarprodukt können wir umschreiben: g(x) = f (a)+f ′ (a)·(x−a)T = f (a)+∇f (a)·(x−a)T = f (a)+⟨∇f (a), x−a⟩ . Insbesondere ist g(x + tv) = f (a) + ⟨∇f (a), a + tv − a⟩ = f (a) + t⟨∇f (a), v⟩ . Es gilt d f (a + tv) − f (a) f (a + tv)|t=0 = lim t→0 dt t f (a + tv) − g(a + tv) + g(a + tv) − f (a) = lim t→0 t f (a + tv) − g(a + tv) = lim + ⟨∇f (a), v⟩ t→0 t f (a + tv) − g(a + tv) ∥v∥ + ⟨∇f (a), v⟩ = lim t→0 t∥v∥ wenn ∥v∥ ̸= 0. Es folgt aus der Definition der totaler Ableitung, dass der letzter Grenzwert gleich 0 ist, und damit ist die Aussage i) in dem Fall v ̸= 0 bewiesen. Der Fall v = 0 ist trivial, Ableitung einer konstanten Funktion ist gleich Null. Beweis von ii): Für Einheitsrichtungen, d.h. v mit ∥v∥ = 1, gilt mithilfe der Cauchy-Schwarz-Bunjakowsky-Ungleichung −∥∇f (a)∥∥v∥ ≤ ⟨∇f (a), v)⟩ ≤ ∥∇f (a)∥ · ∥v∥ mit Gleichheit genau dann wenn ∇f (a) und v parallel sind. Daraus folgt, ∇f (a) dass die Richtung des größten Anstieges ist v = ∥∇f und die Richtung des (a)∥ ∇f (a) größten Abstieges ist v = − ∥∇f . (a)∥ Beispiel • x3 y 2 +1 Bemerkung. Die partielle Ableitung nach der ersten Variable ist eigentlich die 71 Richtungsableitung in der Richtung der ersten Koordinatenvektor e1 = (1, 0): ∂f d f (x1 , a2 ) − f (a1 , a2 ) (a1 , a2 ) = f (x1 , a2 )|x1 =a1 = lim x1 →a1 ∂x dx1 x1 − a1 f (a1 + t, a2 ) − f (a1 , a2 ) d = lim = f (a1 + t, a2 )|t=0 t→0 t dt d = f (a + te1 )|t=0 dt Die lineare Funktion g in der Definition der totaler Ableitung ist eigentlich der Taylorpolynom erster Ordnung der Funktion f mit Mittelpunkt a. Die quadratische Funktion q(x) = f (a) + ∇f (a) · (x − a)T + (x − a) · Hf (a) · (x − a)T ist der Taylorpolynom zweiter Ordnung der Funktion f mit Mittelpunkt a, sobald f partielle Ableitungen bis zu zweiter Ordnung an der Stelle a besitzt. 12.3 Zusammenfassung der Anwendung der Differentialrechnung für Flächendiskussion • Maximal- , Minimalstellen zu finden: Den Satz über notwendige Bedingung für Extrema anwenden. Nullstellen des Gradientes und Definitheit der Hesse-Matrix an diesen Stellen untersuchen, den ExtermalstelleTest verwenden. Die Stellen, wo die Funktion partielle Ableitungen nicht hat, sind direkt zu untersuchen. Wenn wir nach Extremen an einer Menge M suchen, es sind zusätzlich noch die Randpunkte der Menge M extra zu untersuchen. • Sattelpunkt: spezielle Stelle, wo es offensichtig kein Minimum und kein Maximum ist. • Konvex, konkav kann man ähnlich wie für Funktionen einer Variable definieren, aber wir werden diese nicht untersuchen. • Taylorpolynom kann man definieren und verwenden. 72 13 Kurven, implizite Funktionen Wiederholung. Wir haben Kurven betrachtet, aber nicht gesagt, was eine Kurve ist: Graph einer Funktion f : R → R einer Variable, Gf ⊂ R2 ; eine Gerade in der Ebene, im Raum, mit Parameterdarstellung oder Normalendarstellung; eine Quadrik in der Ebene, Ellipse, Parabel, Hyperbel. 13.1 Motivation: die Kreislinie Wir werden die Kreislinie mit Mittelpunkt (0, 0) und Radius 1 in der Ebene in verschiedenen Weisen beschreiben. Satz Folgende Mengen sind gleich: i) Die Teilmenge des Vektorraumes R2 mit Euklidischen Abstand d: K = {(x, y) ∈ R2 : d((x, y), (0, 0)) = 1} . ii) Das Bild (Wertebereich) der Abbildung ϕ : R → R2 (also eine Vektorfunktion) ϕ(t) = (cos(t), sin(t)), Dϕ = [0, 2π], das heißt die Menge ϕ([0, 2π]) = {(cos(t), sin(t)) : t ∈ [0, 2π]} ⊂ R2 . iii) Das Urbild der einelementigen Menge {1} bei der Funktion von zwei Variablen f : R2 → R, f (x, y) = x2 + y 2 , das heißt die Menge f−1 ({1}) = {(x, y) ∈ R2 : f (x, y) = 1} . iv) Die Vereinigung zwei reellen Funktionen einer Vari√ von Graphen von √ 2 able, g1 (x) = 1 − x , g2 (x) = − 1 − x2 , x ∈ [−1, 1], das heißt die Menge Gg1 ∪ Gg2 ⊂ R2 . Beweis. Offensichtlich ist K = {(x, y) ∈ R2 : x2 + y 2 = 1} = f−1 ({1}) und wenn man die Gleichung x2 + y 2 = 1 auf y auflöst, bekommt man auch {(x, y) ∈ R2 : x2 + y 2 = 1} = Gg1 ∪ Gg2 . Es bleibt zu zeigen, dass diese Menge mit der Menge in ii) übereinstimmt. Die Beziehung ϕ([0, 2π]) ⊂ K folgt aus der Eigenschaft der Sinus- und Kosinusfunktion: (cos(t))2 +(sin(t))2 = 1, t ∈ R. Um die Rückrichtung K ⊂ ϕ([0, 2π]) 73 zu zeigen, sei (x0 , y0 ) ∈ K. Da 0 ≤ x20 ≤ x20 + y02 = 1, gilt |x0 | ≤ 1, also x0 ∈ [−1, 1]. Ähnlich y0 ∈ [−1, 1]. Da die Funktion cos : [0, π2 ] → [0, 1] bijektive ist, folg aus der Symmetrieeigenschaften dass auch cos : [ π2 , π] → [−1, 0], ] → [−1, 0], cos : [ 3π , 2π] → [0, 1] bijektiv sind. Wir definieren cos : [π, 3π 2 2 t0 ∈ [0, 2π] folgenderweise: wenn x0 ≥ 0 und y0 ≥ 0 dann sei t0 ∈ [0, π2 ] so, dass cos(t0 ) = x0 , wenn x0 < 0 und y0 ≥ 0 dann sei t0 ∈ [ π2 , π] so, dass cos(t0 ) = x0 , wenn x0 < 0 und y0 ≤ 0 dann sei t0 ∈ [π, 3π ] so, dass cos(t0 ) = x0 , 2 wenn x0 ≥ 0 und y0 ≤ 0 dann sei t0 ∈ [ 3π , 2π] so, dass cos(t0 ) = x0 . 2 √ √ In allen Fällen gilt dann, dass sin(t0 ) = ± 1 − (cos(t0 ))2 = ± 1 − x20 = y0 . Folglich gilt für diese t0 ∈ [0, 2π] dass ϕ(t0 ) = (x0 , y0 ), also (x0 , y0 ) ∈ ϕ([0, 2π]). Der Satz ist damit bewiesen. In i) ist eine analytisch-geometrische Beschreibung der Kreislinie. Gesehen wie in iii), ist die Kreislinie eine Höhenlinie einer Funktion von zwei Variablen. Da diese Funktion quadratisch ist, ist die Kreislinie eine Quadrik. Die Beschreibung ii) heißt parametrische Darstellung, die Variable t heißt Parameter (obwohl es Variable ist). Die Darstellung iii) heißt implizite Darstellung, die in iv) explizite Darstellung. Von implizite auf explizite Darstellung zu übergehen muss man eine Gleichung (für zwei Variablen) auf eine Variable (hier y) auflösen. Für eine Gerade in der Ebene, ihre parametrische Darstellung entspricht der ii), ihre Normaldarstellung enspricht der iii), wobei die Funktion f linear ist. 13.2 Kurven Eine Abbildung von R nach R2 nennt man Vektorfunktion. Jede ϕ : R → R2 ist darstellbar durch zwei reellen Funktionen einer Variable: ϕ1 : R → R, ϕ2 : R → R, ϕ(t) = (ϕ1 (t), ϕ2 (t)), t ∈ Dϕ . Wir definieren die Ableitung ϕ′ (t) = (ϕ′1 (t), ϕ′2 (t)). Definition Sei I ⊂ R ein Intervall. Eine stetige Abbildung ϕ : I → R2 heißt ebene Kurve. Wenn die Funktion ϕ differenzierbar an der Stelle t0 ist, heißt der Vektor ϕ′ (t0 ) Tangentialvektor der Kurve ϕ : I → R2 im Punkt ϕ(t0 ), und die Gerade t = {ϕ(t0 ) + sϕ′ (t0 ) : s ∈ R} heißt Tangente zu der Kurve ϕ(I) im Punkt ϕ(t0 ). Manchmal nennt man den Wertebereich ϕ(I) 74 der Abbildung ϕ : I → R2 Kurve, ϕ eine Parametrisierung der Kurve und t ∈ I Parameter (obwohl es die Variable der Abbildung ϕ ist). Beispiele: • Eine Gerade g = {Q0 +sv0 : s ∈ R} ist eine Kurve: wähle I = R, ϕ(t) = Q0 + sv0 , t ∈ I. Diese Kurve ist differenzierbar, Tangentialvektor ist v0 , Tangente ist g, in jedem Punkt. Strahl, Strecke sind auch Kurven. • Für a, b positive Zahlen sei I = [0, 2π], ϕ(t) = (a cos(t), b sin(t)), t ∈ I. Man kann zeigen, dass ϕ(I) eine Ellipse ist. • Kreislinie: ϕ1 (t) = (cos(t), sin(t)), t ∈ [0, 2π], ϕ2 (t) = (cos(2t), sin(2t)), t ∈ [0, 2π], ϕ3 (t) = (cos(−t), sin(−t)), t ∈ [0, 2π] sind drei Parametrisierungen der Kreislinie. Die Wertebereiche sind gleich, die Tangenten auch, die Tangentialvektoren nicht (sie sind aber parallel). • Graph einer Funktion einer Variable ist eine Kurven: wenn f : I → R eine stetige Funktion ist, definiere ϕ(t) = (t, f (t)), t ∈ I. Dann ist ϕ(I) = Gf und ϕ′ (t) = (1, f ′ (t)), wenn f in t differenzierbar ist. Satz Sei ϕ : I → R2 eine Kurve, t0 ein innerer Punkt des Intervalles I, ϕ differenzierbar in t0 . Dann hat die lineare Abbildung g : R → R2 definiert durch g(t) = ϕ(t0 ) + (t − t0 )ϕ′ (t0 ), t ∈ R die Eigenschaft lim t→t0 ∥ϕ(t) − g(t)∥ =0. |t − t0 | Dies bedeutet, dass die lineare Vektorfunktion g die Vektorfunktion ϕ in der Umgebung der Stelle t0 gut aprroximiert. Beweis. Folgt aus der Definition und Rechenregeln der Differentialrechnung: √ |ϕ1 (t) − g1 (t)|2 + |ϕ2 (t) − g2 (t)|2 ∥ϕ(t) − g(t)∥ = |t − t0 | |t − t0 | √( )2 ( )2 |ϕ1 (t) − g1 (t)| |ϕ2 (t) − g2 (t)| + = |t − t0 | |t − t0 | √( )2 ( )2 |ϕ2 (t) − (ϕ2 (t) + (t − t0 )ϕ′2 (t0 ))| |ϕ1 (t) − (ϕ1 (t) + (t − t0 )ϕ′1 (t0 ))| + = |t − t0 | |t − t0 | √ wo der letzter Term gegen 02 + 02 = 0 konvergiert. 75 Satz Seien a, b ∈ R, a < b, ϕ : I → R2 eine differenzierbare Kurve. Wenn ϕ′ stetig ist, dann existiert ∫ b ∥ϕ′ (t)∥dt a und diese Zahl heißt die Länge der Kurve ϕ(I). Wenn ϕ : I → R2 , ϕ̃ : I˜ → R2 zwei differenzierbare Parametrisierungen ˜ ϕ−1 ◦ ϕ̃ : I˜ → I stetig und bijektiv ist, dann ist sind, ϕ(I) = ϕ̃(I), ∫ b ′ ∫ ∥ϕ (t)∥dt = a b̃ ∥ϕ̃′ (t)∥dt . ã (Die Länge ist unabhängig von der Parametrisierung.) Ohne Beweis. Liegt an der Definition und Eigenschaften des Integrales, die wir nicht vollständig gelernt haben. Die Idee ist, dass man die kurvlinige Kurve durch geradlinigen Stücken approximieren. Beispiele • Kreislinie: ∫ 2π 0 ∥ϕ′ (t)∥dt = 2π ∫1 • Strecke: ϕ : [0, 1] → R2 , ϕ(s) = P1 + s(P2 − P1 ): 0 ∥ϕ′ (t)∥dt = ∥P2 − P1 ∥ ∫1 ∫1 √ • Parabelstück: ϕ(t) = (t, t2 ), t ∈ [−1, 1]: −1 ∥ϕ′ (t)∥dt = −1 1 + 4t2 dt; um dieses Integral zu berechnen fehlen uns elementare Integrationsmethoden. • Graph: für f : [a,√ b] → R setze ϕ(t) = (t, f (t)), t ∈ [a, b]. Dann ist ∫b ′ ∫b ∥ϕ (t)∥dt = a 1 + (f ′ (t))2 dt, die bekannte Formel für die Länge a des Graphes. • Spirale: ϕ(t) = (e−t cos(t), e−t sin(t)), t ∈ [0, +∞). • Sraubenlinie: ϕ(t) = (cos(t), sin(t), t), t ∈ R Ähnlich: Kurven im Raum sind stetige Abbildungen eines Intervalles nach R , Kurven in Rn . 3 76 13.2.1 Anwendungen in der Physik Wenn ein Draht durch eine Kurve ϕ : [a, b] → R3 modelliert ist, und m(x) die Dichte des Drahtes im Punkt x = ϕ(t) ist, dann hat die Zahl ∫ b m(ϕ(t))∥ϕ′ (t)∥dt a die physikalische Bedeutung der Masse des Drahtes. Wenn ein Kraftfeld durch eine Funktion F : R3 → R3 modelliert, und ein Weg durch eine Kurve ϕ : [a, b] → R3 modelliert ist, dann hat die Zahl ∫ b ⟨F (ϕ(t)), ϕ′ (t)⟩dt a die physikalische Bedeutung der Arbeit des Kraftfeldes F entlang des Weges ϕ. Begründung: Im Punkt ϕ(t), aus dem Vektor F (ϕ(t)) ist nur die Komponente parallel zu der Kurve relevant, das′ ist die orthogonale Projektion von F (ϕ(t)) entlang des Einheitsvektors ∥ϕϕ′ (t) , (t)∥ ⟨F (ϕ(t)), ϕ′ (t) ϕ′ (t) ⟩ ∥ϕ′ (t)∥ ∥ϕ′ (t)∥ und davon die Größe (nicht absolute, sondern mit Vorzeichen) ist ⟨F (ϕ(t)), ϕ′ (t) ⟩. ∥ϕ′ (t)∥ Diese Größe wird entlang der Kurve wie oben die Dichte in dem ersten Integral integriert, um das zweite Integral zu erhalten. Dieses heißt Kurvenintegral zweiter Art. 13.3 Satz über implizite Funktionen Motivation: Für f : R2 → R ist der Durchschnitt des Graphes Gf ⊂ R2 × R mit einer horizontalen Ebene {(x, y, z) ∈ R3 : z = c} nur unten bestimmten Bedingungen eine Kurve, dann sogar Graph einer Funktion einer Variable, wenn man das Euklidische Koordinatensystemn passend wählt. Folgender Satz sagt, dass diese Funktion einer Variable existiert und dass man ihre Ableitung berechnen kann, ohne die Funktion explizit zu kennen. Sie ist nur implizit als Lösung der Gleichung f (x, y) = c gegeben (für x Variable ist die Lösung y = g(x) der Funktionswert dieser Funktion g an der Stelle x). 77 Satz über implizite Funktionen Sei f : R2 → R eine Funktion von zwei Variablen und c ∈ R. Nehmen wir an, dass f (x0 , y0 ) = c und dass f in einer Rechteckigen Umgebung U von (x0 , y0 ), U = [x0 −r0 , x0 +r0 ]×[y0 −r0 , y0 +r0 ] mit r0 > 0, partial differenzierbar ist und dass die partielle Ableitungen ∂f ∂x in U stetig sind. (Dann ist insbesondere f total differenzierbar und und ∂f ∂y stetig in U .) i) Wenn ∂f (x0 , y0 ) ̸= 0 ist, dann existieren positive Zahlen r1 , r2 und ∂y eine Funktion g : R → R (also reelle Funktion einer Variable) mit (x0 − r1 , x0 + r1 ) ⊂ Dg und g((x0 − r1 , x0 + r1 )) ⊂ (y0 − r2 , y0 + r2 ) so, dass x ∈ (x0 − r1 , x0 + r1 ) ∧ y ∈ (y0 − r2 , y0 + r2 ) ∧ f (x, y) = c ⇔ x ∈ (x0 − r1 , x0 + r1 ) ∧ y = g(x). Insbesondere g(x0 ) = y0 . Weiter gilt, dass g auf (x0 − r1 , x0 + r1 ) ∂f (x,y) ∂x differenzierbar ist und für x ∈ (x0 − r1 , x0 + r1 ) gilt g ′ (x) = − ∂f , (x,y) ∂y wobei y = g(x). Insbesondere, ∂f ∂x g ′ (x0 ) = − ∂f (x0 , y0 ) (x0 , y0 ) ∂y . (x0 , y0 ) ̸= 0 ist, dann existieren positive Zahlen r1 , r2 und ii) Wenn ∂f ∂x eine Funktion h : R → R (also reelle Funktion einer Variable) mit (y0 − r2 , y0 + r2 ) ⊂ Dg und h((y0 − r2 , y0 + r2 )) ⊂ (x0 − r1 , x0 + r1 ) so, dass x ∈ (x0 − r1 , x0 + r1 ) ∧ y ∈ (y0 − r2 , y0 + r2 ) ∧ f (x, y) = c ⇔ y ∈ (y0 − r2 , y0 + r2 ) ∧ x = h(y) . Insbesondere h(y0 ) = x0 . Weiter gilt, dass h auf (y0 − r2 , y0 + r2 ) ∂f (x,y) ∂y differenzierbar ist und für y ∈ (y0 − r2 , y0 + r2 ) gilt h′ (y) = − ∂f , (x,y) ∂x wobei x = h(y). Insbesondere, ′ h (y0 ) = − ∂f (x0 , y0 ) ∂y ∂f (x0 , y0 ) ∂x . c) Wenn ∇f (x0 , y0 ) = (0, 0) ist, dann ist eine Aussage der oberen Form in allgemeinen nicht möglich. 78 Idee des Beweises von i) im Fall ∂f (x0 , y0 ) ∂y = α > 0. Teil I: Konstruktion von g. Aus der Stetigkeit der partiellen Ableitung folgt die Existenz einer Zahl r2 > 0 mit ∂f (x, y) > α2 > 0 für alle (x, y) ∈ ∂y (x0 − r2 , x0 + r2 ) × (y0 − r2 , y0 + r2 ). Folglich ist die Hilfsfunktion h1 (y) = f (x0 , y) streng monotone wachsend, h1 (y0 − r2 ) < c, h1 (y0 ) = c, h1 (y0 + r2 ) > c. Aus der Stetigkeit der Funktion f folgt, dass die Hilfsfunktion h2 (x) = f (x, y0 − r2 ) in einer Umgebung von x0 kleiner als c, und die Hilfsfunktion h3 (x) = f (x, y0 + r2 ) in einer Umgebung von x0 größer als c ist. Nennen wir diese Umgebung (x0 − r1 , x0 + r1 ). Für festes x ∈ (x0 − r1 , x0 + r1 ) folg aus dem Nullstellensatz, dass die Hilfsfunktion hx (y) = f (x, y) − c genau eine Nullstelle im (y0 − r2 , y0 + r2 ) hat, nennen wir diese g(x). Teil II: Differenzierbarkeit von g. Sei x1 ∈ (x0 − r1 , x0 + r1 ) eine feste Stelle und h kleine Zahl. Für y1 ∈ (y0 − r2 , y0 + r2 ) und kleine Zahl k können wir mithilfe des Mittelwertsatzes schreiben f (x1 + h, y1 + k) − f (x1 , y1 ) = = f (x1 + h, y1 + k) − f (x1 + h, y1 ) + f (x1 + h, y1 ) − f (x1 , y1 ) ∂f ∂f = (x1 + h, ξ)k + (ζ, y1 )h , ∂y ∂x wobei ζ zwischen x1 und x1 + h liegt (aber sonst unbekannt ist), und ξ zwischen y1 und y1 + k liegt (aber sonst unbekannt ist). Wenn wir jetzt konkret y1 = g(x1 ) und k = g(x1 + h) − g(x1 ) wählen, dann gilt wegen der Definition der Funktion g, dass f (x1 , y1 ) = f (x1 , g(x1 )) = c und f (x1 +h, y1 + k) = f (x1 + h, g(x1 ) + g(x1 + h) − g(x1 )) = f (x1 + h, g(x1 + h)) = c, und eingesetz in die obere Formel bekommen wir ∂f ∂f (x1 + h, ξ)k + (ζ, y1 )h ∂y ∂x ∂f ∂f = (x1 + h, ξ)(g(x1 + h) − g(x1 )) + (ζ, y1 )h . ∂y ∂x 0=c−c= Wenn man aus dieser Gleichung k ausdrückt, kann man feststellen, dass für h klein wird auch k klein sein. Außerdem wird ξ in der Nähe von y1 und ζ in der Nähe von x1 sein. Aus der oberen Gleichung, mit Rechenregeln für Grenzwerte und weil die partielle Ableitungen der Funktion f stetig an der Stelle (x1 , y1 ) sind, man kann berechnen ∂f (x1 , y1 ) g(x1 + h) − g(x1 ) ∂x = − ∂f . g (x1 ) = lim h→0 h (x1 , y1 ) ∂y ′ Here ist y1 = g(x1 ). 79 Beispiele √ √ • f (x, y) = x2 + y 2 , c = 1, (x0 , y0 ) = ( 22 , 22 ). Es gilt: f hat stetige partielle Ableitungen, ∂f (x, y) = 2x, ∂f (x, y) = 2y für (x, y) ∈ R2 . ∂x √ ∂y f (x0 , y0 ) = 1, ∂f (x0 , y0 ) = 2 ̸= 0. Folglich kann man den Satz, Teil ∂y i) verwenden und wir bekommen eine Funktion g mit g(x) = y ⇔ f (x, y) = c. Außerdem ist g ′ (x) = − 2x mit y = g(x), insbesondere 2y ′ 2 g (x0 ) = −1. Die Menge {(x, y) ∈ R : f (x, y) = 1} ist in einer Umgebung von (x0 , y0 ) eine Kurve und ihre Tangente im Punkt (x0 , y0 ) ist die Gerade {(x0 , y0 ) + t(1, −1) : t ∈ R}. • Sei jetzt (x0 , y0 ) = (0, 1). Es gelten f (0, 1) = 1, ∂f (0, 1) = 2 ̸= 0. ∂y Folglich kann man den Satz, Teil i) verwenden, und wir bekommen eine Funktion g mit g(x) = y ⇔ f (x, y) = c. g ′ (0) = 0, die Menge {(x, y) ∈ R2 : f (x, y) = 1} ist in einer Umgebung von (0, 1) eine Kurve und ihre Tangente im Punkt (0, 1) ist die Gerade {(0, 1) + t(1, 0) : t ∈ R}. • Sei jetzt (x0 , y0 ) = (1, 0). Es gelten f (1, 0) = 1, aber ∂f (1, 0) = 0, ∂y folglich kann man den Teil i) des Satzes nicht verwenden. Da aber ∂f (1, 0) = 2 ̸= 0, man kann Teil ii) verwenden und wir bekommen ∂x eine Funktion h mit h(y) = x ⇔ f (x, y) = c. Weiter gilt h′ (0) = 0, die Menge {(x, y) ∈ R2 : f (x, y) = 1} ist in einer Umgebung von (1, 0) eine Kurve und ihre Tangente im Punkt (1, 0) ist die Gerade {(1, 0) + t(0, 1) : t ∈ R}. • Die Kreislinie K = {(x, y) ∈ R2 : f (x, y) = 1} ist einer Umgebung von jedem (x0 , y0 ) ∈ K eine differenzierbare Kurve. • Quadriken in der Ebene sind lokal differenzierbare Kurven, falls sie nicht entartet sind. Bemerkung: Der Satz hat Verallgemeinerungen für Funktionen mehreren Variablen, sogar für Vektorfunktionen mehreren Variablen. Der hier präsentierter Beweis funktioniert aber nur in dem Fall für reelle Funktion von zwei Variablen, da sie sich auf Monotonieeigenschaften beruht. Siehe Übungsaufgaben aus [Forster, Szymczak: Übungsbuch zu Analysis 2]. 80 13.3.1 Anwendungen des Satzes über implizite Funktionen Beispiel. Betrachte die Funktion f (x, y) = (x2 +y 2 −x)2 −(x2 +y 2 ), x, y ∈ R, die Zahl c = 0, die Stelle P0 = (0, 1) ∈ Df . Die Funktion f ist (total) differenzierbar, weil ihre partielle Ableitungen ∂f (x, y) = 2(x2 + y 2 − x)(2x − 1) − 2x, ∂x ∂f (x, y) = 2(x2 + y 2 − x)2y − 2y ∂y stetige Funktionen (Polynome) sind. Außerdem ist auch f ′ stetig. Da f (0, 1) = 0 = c, ∂f (0, 1) = 2 ̸= 0, sind die Vorassetzungen des Satzes ∂y über implizite Funktionen erfüllt. Folglich existieren positive Zahlen r1 , r2 und eine Funktion g : R → R einer Variable mit (−r1 , r1 ) ⊂ Dg , g(−r1 , r1 ) ⊂ (1 − r2 , 1 + r2 ), und f (x, y) = 0 ⇔ y = g(x) für x ∈ (−r1 , r1 ) und y ∈ (1 − r2 , 1 + r2 ). Außerdem ist g differenzierbar und ∂f (0,1) ∂x = 1. Folglich ist die Menge g(0) = 1, g ′ (0) = − ∂f (0,1) ∂y H = {(x, y) ∈ R2 : (x2 + y 2 − x)2 − (x2 + y 2 ) = 0} in der Umgebung U = (−r1 , r1 )×(1−r2 , 1+r2 ) des Punktes (0, 1) ∈ H Graph einer differenzierbaren Funktion mit Tangente {(0, 1) + t(1, 1) : t ∈ R} im (0, 1). √ √ Wir betrachten weiter die Stelle P1 = (1, 1+2 5 ). Es gilt: P1 ∈ H, √ √ ∂f (1, 1+2 5 ) ̸= 0. Man kann wieder den Satz über implizite Funktionen an∂y √ √ √ √ ∂f (1, 1+2 5 ) 1+ 5 ∂x ′ wenden und die Funktion g mit g(1) = , g (1) = − ∂f √ 1+√5 bekom2 (1, ) ∂y 2 √ √ men. Folglich ist die Menge H in einer Umgebung des Punktes (1, 1+2 5 ) Graph einer differenzierbaren Funktion, und man kann die Tangente dieser Funktion an der Stelle 1 berechnen. Für die Stelle P2 = (2, 0) gilt: f (2, 0) = 0, ∂f (2, 0) = 0, ∂f (2, 0) = 8 ̸= 0, ∂y ∂x folglich kann man den Satz über implizite Funktionen anwenden und positive Zahlen r1 , r2 , sowie eine Funktion h bekommen mit f (x, y) = 0 ⇔ x = h(y) für (x, y) ∈ (2 − r1 , 2 + r1 ) × (−r2 , r2 ) = U2 . Außerdem ist h(0) = 2 und h′ (0) = − 80 = 0. Die Menge H ∩ U2 ist Graph der Funktion h der Variable y. Die Tangente im (2, 0) ist {(2, 0) + t(0, 1) : t ∈ R}. 81 Für die Stelle P3 = (0, 0) gilt: P3 ∈ H, ∂f (0, 0) = 0, ∂f (0, 0) = 0. Der ∂y ∂x Satz über implizite Funktionen liefert keine Aussage, da seine Voraussetzungen nicht erfüllt sind. Man kann die Menge H mit anderen Methoden untersuchen. Sie heißt Herzkurve (Kardioide). Die Menge L = {(x, y) ∈ R2 : (x2 + y 2 )2 = a2 (x2 − y 2 )} heißt Lemniskate von Bernoulli (a > 0 ist ein gegebener Parameter). Der Satz über implizite Funktionen sagt, dass in einer Umgebung von jedem Punkt P ∈ L, bis auf P = (0, 0) ∈ L, L eine differenzierbare Kurve (eigentlich der Wertebereich einer differenzierbaren Parametrisation) ist. Für (0, 0) ∈ L liefert der Satz über implizite Funktionen keine Aussege. Man kann mit anderen Methoden feststellen, dass L wie ∞ aussieht. Dann wird es offensichtlich, dass L in der Nähe von (0, 0) nicht eine Kurve (Graph) ist. Satz über inverse Funktion Sei f : R → R eine Funktion einer Variable so, dass f differenzierbar in einer Umgebung der Stelle x0 ∈ Df ist, und die Ableitung f ′ stetig in dieser Umgebung ist. Wenn f ′ (x0 ) ̸= 0, dann existieren positive Zahlen r1 , r2 so, dass die Abbildung f : (x0 −r1 , x0 +r1 ) → (f (x0 ) − r2 , f (x0 ) + r2 ) bijektiv, und folglich invertierbar, ist. Außerdem ist die Umkehrfunktion f−1 differenzierbar, und für ihre Ableitung an der Stelle y0 = f (x0 ) gilt (f−1 )′ (y0 ) = f ′ (x0 )−1 , x0 = f−1 (y0 ) . Beweis folgt aus dem Satz über implizite Funktionen angewendet auf die Funktion F (x, y) = f (x) − y, Stelle (x0 , y0 ) und Zahl c = 0. Rechnung: ∂F (x, y) = f ′ (x), die Bedingung ∂F (x0 , y0 ) = f ′ (x0 ) ̸= 0 ist erfüllt. Es ∂x ∂x exitiert also eine Funktion h mit f (x) = y ⇔ F (x, y) = 0 ⇔ x = h(y) in einer Umgebung von x0 , y0 . Damit ist h die inverse Funktion zu f . Außerdem gilt ′ ′ (f−1 ) (y) = h (y) = − ∂F (x, y) ∂y ∂F (x, y) ∂x =− −1 = (f ′ (x))−1 f ′ (x) wobei x = h(y). Insbesondere ist h(y0 ) = x0 , und (f−1 )′ (y0 ) = f ′ (x0 )−1 . 82 14 Abbildungen von Rn nach Rm Definition Seien n, m ∈ N. Eine Abbildung von Rn nach Rm heißt Vektorfunktion von n Variablen. Solche Funktion f : Rn → Rm ist representierbar durch m Stück (reellen) Funktionen von n Variablen: f1 (x) f2 (x) f (x) = ... , x ∈ Df fm (x) mit f1 , f2 , . . . , fm : Rn → R, die “Koordinaten” der Funktion f . a) Wenn alle Funktionen f1 , f2 , ...fm an der Stelle a partiell differenzierbar sind, dann heißt ∂f1 ∂f1 ∂f1 (a) (a) ... (a) ∂x2 ∂xn 1 ∂x ∂f ∂f ∂f ∂x21 (a) ∂x22 (a) ... ∂xn2 (a) ... ... ... ... ∂fm m m (a) ∂f (a) ... ∂f (a) ∂x1 ∂x2 ∂xn die Jacobi-Matrix der Funktion f an der Stelle a. Das ist eine m × n reelle Matrix. b) Wenn alle Funktionen f1 , f2 , ...fm an der Stelle a total differenzierbar sind, dann heißt f (total) differenzierbar an der Stelle a und die (totale) Ableitung der Funktion f an der Stelle a ist die JacobiMatrix ∂f1 ∂f1 ∂f1 ′ (a) (a) ... (a) ∂x2 ∂xn 1 f1 (a) ∂x ∂f2 ∂f2 ∂f2 (a) (a) ... (a) ′ ∂x ∂x ∂x n 1 2 ... f (a) = = . ... ... ... ... ′ fm (a) ∂fm m m (a) ∂f (a) ... ∂f (a) ∂x1 ∂x2 ∂xn f1 Satz Sei f : Rn → Rm , f = ... , a ∈ Df . Wenn alle Funktionen fm f1 , f2 , ...fm an der Stelle a differenzierbar sind, dann erfüllt die (lineare) Vektorfunktion von n Variablen g : Rn → Rm , definiert durch g(x) = f (a) + f ′ (a) · (x − a)T , 83 x ∈ Rn , die Eigenschaft ∥f (x) − g(x)∥ =0. x→a ∥x − a∥ (Dies bedeutet, dass die lineare Vektorfunktion g die Vektorfunktion f in der Nähe von a gut approximiert.) Der Graph von g heißt Tangentialraum an die Fläche Gf im Punkt (a, f (a)). lim Ohne Beweis, weil Formeln lang, aber direkt. Die Fälle n = m = 1 (reelle Funktion einer Variable), n = 2 und m = 1 (reelle Funktion von zwei Variablen), n = 1 und m = 2 (Kurven in der Ebene) haben wir schon betrachtet. Satz (Kettenregel) Wenn g : Rn → Rm an der Stelle a total differenzierbar ist, und f : Rm → Rn an der Stelle b = g(a) total differenzierbar ist, dann ist die Komposition f ◦ g : Rn → Rk an der Stelle a total differenzierbar und ihre Ableitung ist (f ◦ g)′ (a) = f ′ (g(a)) · g ′ (a) . Ohne Beweis. Vergleiche mit dem Satz über Komposition linearer Abbildungen in Matrixdarstellung von [GLAAG]. (Nichtlineare) Funktionen sind in der Nähe einer Stelle durch linearen Funktionen approximiert, die entsprechende lineare Abbildungen mit Matrizen (das sind die Ableitungen) representiert. Komposition linearer Abbildungen ist dann mit Matrixprodukt representiert. ( ) g1 2 2 Beispiel. Sei g : R → R eine Vektorfunktion, g = , von zwei g2 Variablen x1 , x2 , und sei f : R2 → R eine Funktion von zwei Variablen y1 , y2 . Wenn f und g differenzierbar sind, dann ist die Funktion h(x1 , x2 ) = (f ◦ g)(x1 , x2 ) = f (g1 (x1 , x2 ), g2 (x1 , x2 )) differenzierbar und ihre Ableitung ist f ′ (g1 (x1 , x2 ), g2 (x1 , x2 )) · g ′ (x1 , x2 ). Wir berechnen ( ) ∂g1 ∂g1 (x , x ) (x , x ) 1 2 1 2 ∂x2 1 g ′ (x1 , x2 ) = ∂x , ∂g2 ∂g2 (x , x ) (x , x 1 2 1 2) ∂x1 ∂x2 ) ( ∂f ∂f (y , y ) (y , y ) . f ′ (y1 , y2 ) = ∂y 1 2 1 2 ∂y1 1 Damit ist (Zeilenmatrix !) ∂f ∂g1 ∂f ∂g2 (g1 (x1 , x2 ), g2 (x1 , x2 )) (x1 , x2 ) + (g1 (x1 , x2 ), g2 (x1 , x2 )) (x1 , x2 ) ∂y1 ∂x1 ∂y2 ∂x1 ∂f ∂g1 ∂f ∂g2 (g1 (x1 , x2 ), g2 (x1 , x2 )) (x1 , x2 ) + (g1 (x1 , x2 ), g2 (x1 , x2 )) (x1 , x2 )) ∂y1 ∂x2 ∂y2 ∂x2 h′ (x1 , x2 ) =( 84 und insbesondere ∂f ∂g1 ∂f ∂g2 ∂h (x1 , x2 ) = (g1 (x1 , x2 ), g2 (x1 , x2 )) (x1 , x2 )+ (g1 (x1 , x2 ), g2 (x1 , x2 )) (x1 , x2 ) ∂x1 ∂y1 ∂x1 ∂y2 ∂x1 für alle (x1 , x2 ). Satz (lokale Invertierbarkeit) Sei g : Rn → Rn eine Funktion, die in einer Umgebung von a ∈ Df differenzierbar ist und ihre Ableitung in dieser Umgebung stetig ist. Wenn die Matrix f ′ (a) invertierbar ist, dann existieren positive Zahlen r1 , r2 so, dass die Abbildung f : B(a, r1 ) → B(f (a), r2 ) bijektiv, und folglich invertierbar, ist. Außerdem ist die Umkehrfunktion f−1 differenzierbar, und für ihre Ableitung an der Stelle b = f (a) gilt (f−1 )′ (b) = f ′ (a)−1 , a = f−1 (b) . Allgemeiner Fall ist ohne Beweis. Den Fall n = 1 haben wir schon bewiesen mithilfe des Satzes über implizite Funktionen. Vergleiche mit dem Satz über Invertierbarkeit linearer Abbildungen in Matrixdarstellung von [GLAAG]. Die (nichtlineare) Funktion f ist in der Nähe der Stelle a durch eine lineare Funktion (die Ableitungen) approximiert, die entsprechende lineare Abbildung mit einer Matrix (das ist die Ableitung, Jacobi-Matrix) representiert. Die lineare Abbildungen ist invertierbar genau dann, wenn die Matrix invertierbar ist, und die inverse Matrix representiert die inverse Abbildung. Eine quadratische reelle (oder komplexe) Matrix ist genau dann invertierbar, wenn ihre Determinante ungleich Null ist. Beispiel: Polarkoordinaten, siehe Übung. 15 Lineare Differentialgleichungen n-ter Ordnung mit konstanten Koeffizienten Beispiel. Wenn in einem RLC Reihenschwingkreis L die Induktivität der Spule, C Kapazität des Kondensators und R den ohmschen Widerstand bezeichnet (das sind gegebene positive Zahlen), und i(t) den Spulenstrom in der Zeit t bezeichnet (das ist also eine unbekannte Funktion der Variable t), gilt nach dem physikalischen Gesetz LCi′′ (t) + RCi′ (t) + i(t) = 0, t∈R. Die Kondensatorspannung uc (t) lässt sich nach dem Gesetz uc (t) = −Ri(t) − Li′ (t), 85 t∈R √ berechnen. Für kleinen Widerstand, d.h. R < 2 L , C erfüllt die Funktion u0 −δt e sin(ωt), t ∈ R , ωL wobei u0 die Spannung auf dem Kondensator in der Zeitpunkt t = 0 (auch √ i(t) = − R 1 R gegebene Zahl) ist, und δ = 2L (Abklingkonstante), ω = LC − 4L 2 (Eigenkreisfrequenz), die obere Differenzialgleichung. Prüfe nach ! Aber we hat man diese Lösung geraten ? 2 Definition Seien n + 1 Zahlen a0 , a1 , . . . an ∈ R mit an ̸= 0, eine (reelle) Funktion (einer Variable) g und ein Intervall I ⊂ Dg gegeben, wobei n ∈ N. Der Ausdruck an f (n) (x) + an−1 f (n−1) (x) + · · · + a1 f ′ (x) + a0 f (x) = g(x), x∈I heißt inhomogene lineare Differentialgleichung n-ter Ordnung mit konstanten Koeffizienten für die Funktion f auf I. an , . . . a0 sind die Koeffizienten, g die rechte Seite. Wenn g = 0, heißt die lineare Differentialgleichung homogen. Eine Funktion f mit I ⊂ Df , die auf I n-mal differenzierbar ist und die obere Aussage erfüllt, heißt Lösung auf I. Das Polynom p(X) = an X n + an−1 X n−1 + · · · + a1 X + a0 heißt das zugehörige charakteristische Polynom der (homogenen oder inhomogenen) linearen Differentialgleichung mit konstanten Koeffizienten. Satz i) Wenn λ ∈ R eine Nullstelle des charakteristischen Polynomes ist, dann ist f (x) = eλx eine Lösung der homogenen Differentialgleichung auf R. ii) Wenn λ ∈ R eine m-Fache Nullstelle des charakteristischen Polynomes ist, dann sind eλx , xeλx , x2 eλx , . . . , xm−1 eλx , x ∈ R , Lösungen der homogenen Differenzialgleichung auf R. iii) Wenn λ ∈ C \ R eine Nullstelle des charakteristischen Polynomes ist, dann sind eℜλx sin(ℑλx) und eℜλx cos(ℑλx) Lösungen der homogenen Differenzialgleichung auf R. iv) Wenn λ ∈ C \ R mit λ = α + iβ, α, β ∈ R, eine m-Fache Nullstelle des charakteristischen Polynomes ist, dann sind eαx sin(βx), xeαx sin(βx), . . . , xm−1 eαx sin(βx), eαx cos(βx), xeαx cos(βx), . . . , xm−1 eαx cos(βx) 86 Lösungen der homogenen Differenzialgleichung auf R. Beweis von i): Ableitungen von f berechnen und in die Differenzialgleichung einsetzen. Rest ohne Beweis, Idee wäre einsetzen. Beispiel. Die Differentialgleichung bei dem RLC Reihenschwingkreis ist eine homogene Differentialgleichung zweiter Ordnung mit konstanten Koeffizienten. Das zugehörige charakteristische Polynom ist p(X) = LCX 2 + RCX + 1 (LC und RC sind reelle Zahlen, X ist die Variable bzw. das Symbol). Die Nullstellen, also Lösungen λ ∈ R bzw. C von p(λ) = 0, bekommt man mithilfe der pq-Formel: √ √ R R2 1 R R2 1 λ1 = − + − , λ = − − − . 2 2 2 2L 4L LC 2L 4L LC √ • Realer Schwingkreis: 0 < R < 2 CL . Laut dieser Voraussetzung sind R = die Nullstellen komplexe Zahlen. Mit Abkürzungen ℜλ1 = − 2L √ 1 R2 −δ < 0, ℑλ1 = LC − 4L2 = ω > 0, sind laut des Satzes die Funktionen i1 (t) = e−δt sin(ωt), i2 (t) = e−δt cos(ωt), t ∈ R Lösungen der Gleichung auf R. Der Kurvenverlauf dieser Funktionen erklärt die Namen der physikalischen Konstanten δ und ω. • Idealer Schwingkreis: R = 0. In diesem Fall ist ℜλ1 = 0, ℑλ1 = Laut des Satzes sind 1 1 i1 (t) = sin( √ t), i2 (t) = cos( √ t), LC LC √1 . LC t∈R Lösungen der Gleichung auf R. √ R • Aperiodischer Grenzfall: R = 2 CL . In diesem Fall ist λ1 = λ2 = − 2L eine reelle zweifache Nullstelle, und laut des Satzes sind i1 (t) = e− 2L t , R i2 (t) = te− 2L t , R Lösungen der Gleichung auf R. 87 t∈R √ • Aperiodischer Kriechfall: R > 2 CL . Da die Nullstellen einfach und reell sind, sind laut des Satzes die Funktionen i1 (t) = eλ1 t , i2 (t) = eλ2 t , t∈R Lösungen der Gleichung auf R. Dabei gilt λ1 < 0 und λ2 < 0. Für n ∈ N ∪ {0} und ein Intervall I ⊂ R bezeichnen wir die Menge Vn,I = {f : f ist eine n-mal differenzierbare reelle Funktion mit I = Df } . Bezüglich der Operationen Addition von zwei Funktionen und Multiplikation einer Funktion mit einer reellen Zahl ist diese Menge ein Vektorraum über R. Man kann folgenden Satz über der Lösungsmenge beweisen. Vergleiche mit dem Satz über der Lösungsmenge einer (homogonen bzw. inhomogenen) linearen Gleichungssystem von n Gleichungen. Satz (über Lösungsmenge) i) Die Lösungsmenge des homogenen Systemes Lös(an , . . . , a0 , 0, I) ist als Teilmenge des Vektorraumes Vn,I ein Vektorraum der Dimension n. Mithilfe vorherigen Satzes kann man n linear unabhängige Lösungen konstruiren, und damit eine Basis von Lös(an , . . . , a0 , 0, I). ii) Für die Lösungsmenge des inhomogenen Systemes Lös(an , . . . , a0 , g, I) gilt Lös(an , . . . , a0 , g, I) = {fs + f : f ∈ Lös(an , . . . , a0 , 0, I)} , wobei fs ∈ Lös(an , . . . , a0 , g, I). Ohne Beweis. Definition Eine Basis von Lös(an , . . . , a0 , 0, I) heißt Fundamentalsystem, und eine Lösung fs des inhomogenen Systemes heißt eine spezielle Lösung. Der Satz über der Lösungsmenge sagt, dass beliebige Lösung des homogegenen Systemes ist als lineare Kombination des Fundamentalsystemes darstellbar, und dass beliebige Lösung des inhomogegenen Systemes ist als Summe der speziellen Lösung und der linearen Kombination des Fundamentalsystemes darstellbar. 88 Beispiel. Für die homogene Differenzialgleichung des RLC Reihenschwingkreises sind jeweils i1 , i2 zwei linear unabhängige Lösungen, und da die Differenzialgleichung Ornung 2 hat, sie Formen den Fundamentalsystem. Eine allgemeine Lösung (also jede Lösung) ist der Form i(t) = c1 i1 (t) + c2 i2 (t), t∈R, wobei c1 , c2 ∈ R Konstanten sind. Wenn wir z.B. die Anfangswerte i(0) = 0, uc (0) = u0 festlegen (angeben), in diese zwei Bedingungen die allgemeine Lösung einsetzen und daraus die zwei Konstanten c1 , c2 bestimmen, bekommen wir die Lösung des Anfangswertproblemes, die am Anfang der Kapitel angegeben war. 15.1 Wiederholungen von linearen Algebra Lemma i) Für gegebene n ∈ N und Intervall I ⊂ R ist Vn,I bezüglich der Operationen Addition von zwei Funktionen und Multiplikation einer Funktion mit einer reellen Zahl ein Vektorraum über R. ii) Wenn λ1 ̸= λ2 reelle Zahlen sind, dann sind die Funktionen f1 (x) = exp (λ1 x), f2 (x) = exp(λ2 x), x ∈ [0, 1], Elemente der Menge V1,[0,1] , und es sind linear unabhängige Vektoren des Vektorraumes V1,[0,1] . iii) Die Abbildung A von V2,[0,1] nach V1,[0,1] definiert durch A(f ) = f ′ ist eine lineare Abbildung. iv) Die Abbildung dmax von V1,[0,1] ×V1,[0,1] nach R definiert durch dmax (f, g) = max{|f (x) − g(x)| : x ∈ [0, 1]} ist eine Metrik auf V1,[0,1] . Beweis. i) Dass Vn,I eine Menge ist, ist zu akzeptieren, da wir keine vollständige Definition einer Menge gegeben haben. Für f, g ∈ Vn,I ist f + g durch (f + g)(x) = f (x) + g(x), x ∈ I, definiert. Mithilfe Rechenregeln für die Ableitung gilt, dass f + g ∈ Vn,I . Ähnlich gilt für f ∈ Vn,I , λ ∈ R, dass λf ∈ Vn,I . Bezeichnen wir f0 (x) = 0, x ∈ I. Offensichtlich ist f0 ∈ Vn,I . Außerdem, für beliebige f ∈ Vn,I gilt f + f0 = f0 + f = f , damit ist f0 der Nullvektor. Für f ∈ Vn,I ist −f ∈ Vn,I und f + (−f ) = f0 , damit ist −f die Inverse zu f bezüglich Addition von zwei Funktionen. Weitere Eigenschaften eines Vektorraumes sind auch einfach zu überprüfen. 89 ii) Seien c1 , c2 ∈ R mit c1 f1 + c2 f2 = f0 , wobei f0 der Nullvektor (die Nullfunktion) ist. Das bedeutet c1 exp(λ1 x) + c2 exp(λ2 x) = 0, x ∈ [0, 1] . Daraus folg, mit Einsetzen von zuerst x = 0 und dann x = 1, dass c1 + c2 = 0 c1 exp(λ1 ) + c2 exp(λ2 ) = 0 . Das ist ein lineares Gleichungssystem für die zwei Unbekannte c1 , c2 (die Zahlen λ1 , λ2 sind gegeben), homogen, mit Matrixnotation geschrieben ( )( ) ( ) 0 1 1 c1 = . exp(λ1 ) exp(λ2 ) c2 0 ( ) 1 1 Da det = exp(λ1 ) − exp(λ2 ) ̸= 0 (Injektivität der reellen exp(λ1 ) exp(λ2 ) ( ) 1 1 Exponentialfunktion), ist die Matrix invertierbar und exp(λ1 ) exp(λ2 ) ( ) c folglich hat das lineare homogene Gleichungssystem die einzige Lösung 1 = c2 ( ) 0 . Also ist c1 = 0 und c2 = 0, was bedeutet, dass f1 und f2 linear un0 abhängig sind. iii) Zu überprüfen ist, dass für f, g ∈ V2,[0,1] und λ ∈ R folgende Aussagen gelten: A(f + g) = A(f ) + A(g), A(λf ) = λA(f ) . Diese Aussagen gelten wegen den Rechenregeln für die Ableitung. iv) Seien f, g ∈ V1,[0,1] . Dann sind f und g differenzierbar (einseitig in den Endpunkten 0 und 1), und folglich stetig (einseitig in den Endpunkten). Damit, unter Anwendung des Rechenregeln für Stetigkeit, ist auch die Funktion h(x) = |f (x) − g(x)| stetig auf [0, 1]. Da die Menge [0, 1] abgeschlossen und beschränkt (bezüglich der Euklidieschen Abstand) ist, besitzt die Funktion h ein Maximum. Deswegen ist dmax (f, g) ∈ R. Außerdem ist h(x) ≥ 0 für alle x ∈ [0, 1], folglich ist dmax (f, g) ≥ 0. Es ist offesichtlich, dass dmax (f, g) = 0 impliziert h(x) = 0 für alle x ∈ [0, 1] und damit f = g. Weiter gilt dmax (f, g) = dmax (g, f ), da |f (x) − g(x)| = |g(x) − f (x)| gilt für alle x ∈ [0, 1]. Es beibt zu zeigen, dass für f, g, h ∈ V1,[0,1] gilt dmax (f, g) ≤ dmax (f, h) + dmax (h, g). Diese Aussage folgt aus der Dreiecksungleichung |f (x) − g(x)| ≤ |f (x) − h(x)| + |h(x) − g(x)| , 90 die für beliebige x ∈ [0, 1] gilt. Damit haben wir bewiesen, dass dmax (., .) die Eigenschaften einer Metrik auf V1,[0,1] erfüllt. Bemerkungen. Man kann zeigen, dass z.B. die Vektoren fk , definiert durch fk (x) = sin(kπx), x ∈ [0, 1], wobei k ∈ N, linear unabhängige Vektoren des Vektorraumes V1,[0,1] sind. Damit ist V1,[0,1] unendlich dimensional. Die Abbildung A : V1,[0,1] → V1,[0,1] mit Definitionsbereich DA = V2,[0,1] ist zwar linear, aber bezüglich der Metrik dmax nicht stetig. Man kann trotzdem Abbildungen wie A “diagonalisieren” und damit in Anwendungen die Rechnungen vereinfachen, aber es treten neue Probleme auf, die man in endlichdimensionalen Fall ([GLAAG]) nicht hatte. 91 16 Lineare Differentialgleichungssysteme erster Ordnung mit konstanten Koefizienten Viele Größen sind zeitabhängig und können als Funktionen y1 (t), . . . yn (t) der Variable t ∈ R beschrieben werden. Oft ist die Größe in der Zeitpunkt t = 0 gegeben, sowie ein Gesetz, welcher die Änderung der Größe beschreibt. Im einfachsten Fall können diese Gesetze als ein System von Differentialgleichungen für die Funktionen y1 , . . . yn beschrieben werden: y1′ (t) = a1,1 y1 (t) + a1,2 y2 (t) + · · · + a1,n yn (t), y2′ (t) = a2,1 y1 (t) + a2,2 y2 (t) + · · · + a2,n yn (t), , ... yn′ (t) = an,1 y1 (t) + an,2 y2 (t) + · · · + an,n yn (t), t ∈ R. Oft sind zusätzlich die Anfangswerte y1 (0) = α1 , . . . , yn (0) = α n (reelle y1 y2 Zahlen) gegeben. Mit Matrix- und Sapltenvektornotation y = ... umgeyn formt, ist das obere System äquivalent zu y ′ (t) = Ay(t), t ∈ R . Für dieses Problem gibt es ein allgemeines Verfahren, um die Funktionen y1 , . . . yn zu berechnen und ihr Verhalten wenn t → +∞ zu analysieren. Vergleiche folgenden Satz mit linearen Differenzengleichungssysteme aus [GLAAG]. Satz Sei λ1 0 0 λ2 ... 0 0 Problem A ∈ Mat(n × n, R) diagonalisierbar: A = CDC −1 mit D = ... 0 ... 0 diagonale und C invertierbare Matrix. Dann hat das ... λn y1 (t) y1′ (t) y2′ (t) = A y2 (t) , t ∈ R, ... ... ′ yn (t) yn (t) 92 α1 y1 (0) y2′ (0) α2 ... = ... αn yn′ (0) die Lösung λt y1 (t) e 1 0 ... 0 α1 y2 (t) 0 eλ2 t ... 0 −1 α2 C , ... = C ... ... λn t yn (t) 0 0 ... e αn t∈R. Wenn ℜλk < 0 für alle k = 1, . . . n, dann gilt limt→+∞ yk (t) = 0 für alle k = 1, . . . , n. Ohne Beweis. Bemerkung. Es gibt Lösungsmethode auch in dem Fall wenn A nicht diagonalisierbar ist, dann spielt die Jordan-Form der Matrix eine essentielle Rolle. Definition Für gegebene Matrix A ∈ Mat(n × n, R) und Vektorfunktion b : R → Rn heißt der Ausdruck y ′ (t) = Ay(t) + b(t), t∈R ein inhomogenes lineares Differentialgleichungssystem erster Ordnung mit konstanten Koeffizienten. ai,j heißen Koeffizienten und b heißt rechte Seite (schreibe die Gleichung um als y ′ − Ay = b), manchmal Störfunktion. Wenn b = 0, dann heißt das System homogen. Eine Vektorfunktion y : R → Rn heißt Lösung auf R, wenn sie die obere Aussage erfüllt. Bezeichne Lös(A, b) die Lösungsmenge des inhomogenen Systemes, und Lös(A, 0) die Lösungsmenge des zugehörigen homogenen Sytemes. Satz (über Lösungsmenge) i) Lös(A, 0) ist ein Vektorraum über R der Dimension n. (Als Teilmenge von V = {f : Funktion von R nach Rn , differenzierbar} bezüglich der Operationen Addition von zwei Funktionen und Multiplikation einer Funktion mit einer reellen Zahl.) ii) Für ys ∈ Lös(A, b) gilt Lös(A, b) = {y + ys : y ∈ Lös(A, 0)} . Beweis von ii). 93 Bemerkungen. ys heißt spezielle Lösung. Wenn man n Stück linear unabhängige Lösungen z1 , . . . , zn des homogenen Systemes hat, ist eine beliebige Lösung des homogenen Systemes darstellbar als y = c1 z1 + . . . cn zn , wobei c1 , . . . , cn ∈ R Konstanten sind. Wenn man eine Lösung (die spezielle Lösung) des inhomogenen Systemes, und n linear unabhängige Lösungen z1 , . . . , zn des zugehörigen homogenen Systemes kennt, ist eine beliebige Lösung des inhomogenen Systemes darstellbar als y s + c1 z1 + . . . c n zn , wobei c1 , . . . , cn ∈ R Konstanten sind. Aus dem vorherigen Satz kann man n Stück linear unabhängige Lösungen des homogenen Systemes konstruiren, indem man fürdenVektor α n Stück linear unabhängige Vektoren nimmt 1 0 0 0 1 0 (zum Beispiel ... , ... , . . . , ...), wenn A diagonalisierbar ist. Wir 0 0 1 haben nicht gelernt, wie man solche findet wenn A nicht diagonaliesierbar ist. Wir haben nicht gelernt, wie man eine spezielle Lösung findet. Zusammenhang mit Differentialgleichungen erster Ordnung mit konstanten Koeffizienten: an f (n) (x) + an−1 f (n−1) (x) + · · · + a1 f ′ (x) + a0 f (x) = g(x), x∈I (an ̸= 0). Bezeichne y0 (x) = f (x), y1 (x) = f ′ (x), . . . , yn−1 (x) = f (n−1) (x), x ∈ I. Wir berechnen y0′ = y1 y1′ = y2 ... an−1 a0 g(x) ′ yn−1 (x) = f (n) (x) = − yn−1 (x) − · · · − y0 (x) − an an an 0 y0 .... y1 und mit Vektornotation y = .. b(x) = 0 und Matrix A = yn−1 − g(x) an 0 1 ... 0 . . ... 0 ist die (eine) Differentialgleichung n-ter Ordnung 0 0 ... 1 − aan0 − aan1 ... − an−1 an 94 für die Funktion f äquivalent zu dem Differentialgleichungssystem (n Gleichungen) erster Ordnung für die Vektorfunktion y: y ′ (x) = Ay(x) + b(x), x∈I . Beispiel. Die Differentialgleichung φ′′ = −φ zu lösen. Bezeichne y1 (t) = φ(t) und y2 (t) = φ′ (t), dann ist unseres Problem äquivalent umgeformt ) ( ) ( ′ ) ( 0 1 y1 (t) y1 (t) = · ,t ∈ R . y2′ (t) −1 0 y2 (t) 17 Fazit und Ausblicke Wir haben ausschlieslich reelle Funktionen abgeleitet. Für komplexe Funktionen existiert der Begriff auch, aber die Theorie ist wesentlich anders (erste komplexe Ableitung impliziert schon zweite und weitere Ableitungen !). Sie heißt Funktionentheorie. Wir haben Differenzialgleichungen für Funktionen einer Variable betrachtet. Diese heißen gewöhnliche Differentialgleichungen. Man kann auch für Funktionen mehrerer Variablen die sogenannte partielle Differenzialgleichungen studieren. Wie parametrisch gegebene Kurven, man kann auch parametrisch gegebene Flächen definieren. Tangentialebene und Flächenintgrale haben geometrische und physikalische Bedeutung und Anwendungen. Eine noch allgemeinere Theorie heißt Differenzialgeometrie. Wir haben Funktionen nur in Taylorreihen entwickelt. Für andere Anwendungen passen andere Reihen, z.B. Fourierreihen für viele partielle Differentialgleichungen der Physik. In Funktionentheorie sind auch Reihen, die die Funktion in der Nähe von “Definitionslücken”, sogenannte Singularitäten, approximieren, benutzt. Diese heißen Laurentreihen. Wir haben viel differenziert, aber wenig integriert. Um ein bisschen intergrieren zu können, muss man gut differenzieren können. Die Theorie der Integration für Funktionen mehreren Variablen liefert z.B. die Formeln zur Berechnung von Flächen und Volumen. 95 18 Literatur • R.Lasser, F. Hofmaier: Analysis 1+2, Springer Verlag, 2012 • K. Tretter: Analysis I, Analysis II, Birkhäuser, 2013 • K. Königsberger: Analysis 1, Springer Verlag, 1999 (4. Auflage) • W. Luh, M. Wießner: Aufgabensammlung Analysis, Aula-Verlag, 1991 • K. Tretter: Analysis I, Birkhäuser Verlag, 2013 • O. Forster: Analysis 1, Vieweg Verlag, 2011 (10. Auflage) • H. Heuser: Lehrbuch der Analysis, Band 1, Teubner Verlag, 1980 • O. Forster, Th. Szymczak: Übungsbuch zur Analysis 2 - Aufgaben und Lösungen 2013 (8. Auflage) • V. P. Minorskij: Aufgabensammlung der höheren Mathematik / mit 2670 Aufgaben mit Lösungen 2008 (15. Auflage, aus Russischen übersetzt) • E. Fašangová: Grundlagen der linearen Algebra und analytischen Geometrie, Vorlesung und Skript TU Dresden 2013/2014 96