Höhere Mathematik I Universität Stuttgart, WS 2008/09 Prof. Dr. M. Griesemer Inhaltsverzeichnis 1 Grundlagen 1.1 Aussagenlogik . . . . . . . . . . . . 1.2 Mengen . . . . . . . . . . . . . . . 1.3 Abbildungen . . . . . . . . . . . . . 1.4 Reelle Zahlen . . . . . . . . . . . . 1.5 Komplexe Zahlen . . . . . . . . . . 1.6 Polynome und rationale Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 Lineare Algebra 2.1 Rn und Cn als Vektorräume . . . . . . . . . . . . . . . 2.2 Lineare Gleichungssysteme . . . . . . . . . . . . . . . . 2.3 Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4 Das Gaußsche Lösungsverfahren . . . . . . . . . . . . . 2.5 Die Matrizenmultiplikation . . . . . . . . . . . . . . . . 2.6 Vektorräume . . . . . . . . . . . . . . . . . . . . . . . . 2.7 Basis und Dimension . . . . . . . . . . . . . . . . . . . 2.8 Elementarmatrizen und elementare Umformungen . . . 2.9 Determinanten . . . . . . . . . . . . . . . . . . . . . . 2.10 Rn als Euklidischer Vektorraum . . . . . . . . . . . . . 2.11 Lineare Abbildungen . . . . . . . . . . . . . . . . . . . 2.12 Basiswechsel . . . . . . . . . . . . . . . . . . . . . . . . 2.13 Eigenwerte und Eigenvektoren . . . . . . . . . . . . . . 2.14 Symmetrische Matrizen und quadratische Formen . . . 2.15 Quadriken . . . . . . . . . . . . . . . . . . . . . . . . . 2.16 PageRank: die Bewertung einer Webpage durch Google . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1 2 4 6 10 13 . . . . . . . . . . . . . . . . 15 15 15 16 18 20 22 24 25 26 29 32 36 37 39 42 44 3 Konvergenz und Stetigkeit 45 3.1 Zahlenfolgen und Grenzwerte . . . . . . . . . . . . . . . . . . . . . . . . 45 3.2 Grenzwerte von Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . 52 3.3 Stetigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54 1 4 Differentialrechnung 4.1 Die Ableitung . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2 Der Mittelwertsatz und Anwendungen der Differentialrechnung 4.3 Umkehrfunktionen . . . . . . . . . . . . . . . . . . . . . . . . 4.4 Exponentialfunktion und Logarithmus . . . . . . . . . . . . . 4.5 Konvexe Funktionen . . . . . . . . . . . . . . . . . . . . . . . 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57 57 61 65 68 71 1 Grundlagen 1.1 Aussagenlogik Eine Aussage ist ein Satz in Worten oder Zeichen, welche eindeutig als wahr oder falsch deklariert werden kann. Aussagen sind: • 2+2=5 • Durch zwei verschiedene Punkte gibt es genau eine Gerade • Morgen scheint die Sonne Keine Aussagen sind: • Elektronen sind blau • Die Beatles waren bessere Musiker als Beethoven Ein Axiom oder ein Postulat ist eine Aussage, welche gemäß Vereinbarung wahr ist. Beispiele: • Zu jeder Geraden g und zu jedem nicht auf g liegenden Punkt P gibt es genau eine Gerade, welche durch P verläuft und zu g parallel ist. • Die Lichtgeschwindigkeit im Vakuum ist unabhängig vom Bewegungszustand von Quelle und Beobachter. Ein Theorem, Satz, Lemma oder Korollar ist eine wahre Aussage, welche aus den Axiomen hergeleitet werden kann. Eine Aussagenform ist ein Satz in Worten oder Zeichen, welcher mindestens eine Variable enthält, und für jede zulässige Belegung der Variablen zu einer Aussage wird (Bsp.: x < 1). Nicht, und, oder Wir benutzen a, b, c . . . zur Abkürzung von Aussagen (a := 5 ist eine Primzahl.“) Die ” möglichen Wahrheitswerte einer Aussage bezeichnen wir mit 1 (wahr) und 0 (falsch). Die Wahrheitswerte der neuen Aussagen: ¬a nicht a“ ” a ∨ b a oder b“ ” a ∧ b a und b“ ” ¬a a b a ∨ b a ∧ b 1 0 0 0 0 0 1 0 1 0 1 0 1 1 0 0 1 1 1 1 hängen nur von den Wahrheitswerten von a und b ab, und sind definiert durch obige Wahrheitswertetabelle. Implikation und Äquivalenz Seien a und b zwei Aussageformen. a⇒b: aus a folgt b“ ” bedeutet: falls a wahr ist, dann ist auch b wahr, a ⇔ b : a ist äquivalent zu b“ ” bedeutet: a ist genau dann wahr, wenn b wahr ist. Bemerkung: a ⇒ b und a ⇔ b sind keine Aussagen, sondern beschreiben Beziehungen zwischen den Aussageformen a und b. (siehe Vortragsübung) Satz 1.1. Die Implikation a ⇒ b und deren Kontraposition ¬b ⇒ ¬a sind logisch äquivalent. Beweis: Vortragsübung. Satz 1.2 (De Morgansche Regeln). ¬(a ∧ b) ⇔ ¬a ∨ ¬b ¬(a ∨ b) ⇔ ¬a ∧ ¬b Satz 1.3 (Distributivgesetze). a ∧ (b ∨ c) ⇔ (a ∧ b) ∨ (a ∧ c) a ∨ (b ∧ c) ⇔ (a ∨ b) ∧ (a ∨ c). Quantoren Sei a(x) eine Aussageform. ∀x : a(x) für alle x gilt a(x)“ ” ist die und-Verknüpfung aller Aussagen a(x). Man schreibt daher auch ∃x : a(x) V x : a(x). es gibt ein x, so dass a(x) gilt“ ” ist die oder-Verknüpfung aller Aussagen a(x). Man schreibt daher auch W x : a(x). De Morgansche Regeln: ¬∀x : a(x) ⇔ ∃x : ¬a(x), ¬∃x : a(x) ⇔ ∀x : ¬a(x). 1.2 Mengen Eine Menge M ist eine Zusammenfassung von Objekten m, genannt Elemente von M , zu einem Ganzen. m ∈ M : m ist Element von M “ ” m 6∈ M : m ist nicht Element von M “. ” 2 ∅ bezeichnet die leere Menge (sie enthält kein Element). Mengen kann man beschreiben durch Aufzählung der Elemente: {1, 3, 7} = {3, 1, 7} = {1, 1, 3, 7} oder mit Hilfe einer Aussageform a(x): M := {x ∈ X|a(x)} ist die Menge der Elemente x ∈ X für welche die Aussage a(x) wahr ist. Wichtige Beispiele N := {1, 2, 3, . . .} Menge der natürlichen Zahlen, N0 := {0, 1, 2, 3, . . .} Z := {0, ±1, ±2, . . .} Menge der ganzen Zahlen, m Q := { |(m ∈ Z) ∧ (n ∈ N)} Menge der rationalen Zahlen, n R := Menge der reellen Zahlen, C := Menge der komplexen Zahlen. Teilmengen Eine Menge A heißt Teilmenge der Menge B: A⊂B falls jedes Element von A auch ein Element von B ist. Dabei ist A = B erlaubt. Es gilt also: ∅ ⊂ A, A ⊂ A. Beispiele: N ⊂ N0 ⊂ Z ⊂ Q ⊂ R ⊂ C. Die Menge aller Teilmengen einer Menge A heißt Potenzmenge von A und wird mit P(A) bezeichnet. Beispiel: P({1, 3, 7}) = ∅, {1}, {3}, {7}, {1, 3}, {1, 7}, {3, 7}, {1, 3, 7} . 3 Mengenoperationen Seien A und B zwei Mengen. A ∩ B := {x|x ∈ A ∧ x ∈ B} A ∪ B := {x|x ∈ A ∨ x ∈ B} A\B := {x|x ∈ A ∧ x 6∈ B} = {x ∈ A|x 6∈ B}. Durchschnitt Vereinigung Differenz Die Mengen A und B heißen disjunkt, falls A ∩ B = ∅. Falls A Teilmenge einer Grundmenge X ist, über welche kein Zweifel besteht, dann heißt Ac := X\A, das Komplement von A. Kartesisches Produkt Das kartesische Produkt von zwei Mengen A, B ist die Menge A × B := {(x, y)|x ∈ A, y ∈ B} der geordneten Paare (a, b). Also B × A 6= A × B. Für n Mengen A1 , . . . An ist A1 × A2 × · · · An := {(a1 , . . . , an )|ai ∈ Ai } die Menge der geordneten n-Tupel (a1 , . . . , an ), und An := A × · · · A} . | × A{z n Faktoren 1.3 Abbildungen Seien A, B zwei beliebige Mengen. Eine Abbildung oder Funktion f von A nach B, in Zeichen: f : A → B, ist eine Vorschrift, welche jedem Element x ∈ A ein Element y ∈ B zuordnet. Man schreibt y = f (x), oder f : x 7→ f (x). A heißt Definitionsbereich, f (A) := {f (x)|x ∈ A} heißt Wertebereich oder Bildmenge von f . f ist der Name der Funktion und f (x) ist der Wert der Funktion an der Stelle x. Für U ⊂ A und V ⊂ B ist f (U ) := {f (x)|x ∈ U } f (V ) := {x|f (x) ∈ V } −1 Bild von U, Urbild von V. Der Graph der Abbildung f ist die Menge G(f ) := {(x, y)|x ∈ A, y = f (x)}. 4 Die Umkehrabbildung Eine Abbildung f : A → B heißt injektiv, falls für alle x, y ∈ A gilt: ⇒ f (x) = f (y) x = y. f heißt surjektiv, falls f (A) = B, und f heißt bijektiv, falls f injektiv und surjektiv ist. Ist f bijektiv, dann existiert die Umkehrabbildung f −1 : B → A, definiert durch y = f (x) ⇔ x = f −1 (y). Es gilt also f −1 (f (x)) = x und f (f −1 (y)) = y. Vorsicht: f −1 (y) 6= f (y)−1 ! Im Fall A, B ⊂ R bekommt man den Graphen von f −1 durch Spiegelung des Graphen von f an der Geraden y = x in R2 . Einschränkung einer Funktion Sei f : A → B gegeben und sei U ⊂ A. Die Einschränkung oder Restriktion von f auf U ist die neue Abbildung f U : U → B, (f U )(x) = f (x). Bemerkungen. • Durch geeignete Wahl von U kann eine nicht-injektive Funktion injektiv gemacht werden. • Falls B wählbar ist, dann wird f durch die Wahl B = f (A) surjektiv. Beispiel. Mit f (x) = x2 meint man in der Regel eine Funktion, mit A = B = R. f ist also weder injektiv noch √ surjektiv. Durch die Wahl A = B = {x ∈ R|x ≥ 0} wird f −1 bijektiv und f (x) = x. Komposition von Funktionen Sind f : X → Y und g : Y → Z zwei gegebene Abbildungen, dann ist die Verknüpfung (Zusammensetzung, Komposition) g◦f :X →Z von f und g definiert durch (g ◦ f )(x) := g(f (x)). Satz 1.4. Die Verknüpfung von Abbildungen ist assoziativ. D.h., wenn f : X → Y, g : Y → Z und h : Z → W , dann (h ◦ g) ◦ f = h ◦ (g ◦ f ). Satz 1.5. Sind f : X → Y und g : Y → Z bijektiv, dann ist auch g ◦ f : X → Z bijektiv und es gilt (g ◦ f )−1 = f −1 ◦ g −1 . 5 1.4 Reelle Zahlen Vollständige Induktion Die Elemente von N := {1, 2, 3. . . .} heißen natürliche Zahlen. Alle Eigenschaften der natürlichen Zahlen, z.B. • m, n ∈ N ⇒ m + n ∈ N, m · n ∈ N • Jede nichtleere Teilmenge von N hat ein kleinstes Element. lassen sich aus fünf Axiomen herleiten (Peanosche Axiome, siehe Bärwolff). Das wichtigste für uns ist das Induktionsaxiom: Falls M ⊂ N, 1 ∈ M und n ∈ M ⇒ (n + 1) ∈ M , dann gilt M = N. Beweisprinzip der vollständigen Induktion: Sei n0 ∈ Z und für jedes n ≥ n0 sei a(n) eine Aussage. Falls: 1. a(n0 ) ist wahr, 2. a(n) ⇒ a(n + 1), dann ist a(n) wahr für alle n ≥ n0 . (Wähle M = {k ∈ N|a(n0 − 1 + k) ist wahr} im Induktionsaxiom) Rekursive Definitionen Fakultät: 0! = 1, (n + 1)! = n! · (n + 1) Potenzen: a0 := 1, an+1 := an · a, für alle a ∈ R. Summen und Produktzeichen: n X ak = a1 + a2 + . . . + an , k=1 n Y ak = a1 a2 · · · an k=1 werden rekursiv definiert: 1 X k=1 1 Y n+1 X ak := a1 , k=1 n+1 Y ak := a1 , k=1 k=1 6 ak := n X ak + an+1 k=1 ak := n Y k=1 ak · an+1 Binomialkoeffizienten Für k, n ∈ N0 mit k ≤ n definiert man n n! n(n − 1) . . . (n − k + 1) := = k k!(n − k)! k! Es gilt n n =1= , 0 n n n = . k n−k Lemma 1.6. Für alle k, n ∈ N mit k ≤ n gilt n+1 n n = + . k k−1 k Bemerkung: diese Rekursionsbeziehung führt auf das Pascalsche Dreieck. Binomische Formel Satz 1.7. Für beliebige a, b ∈ R und jede natürliche Zahl n gilt n X n n−k k n (a + b) = a b . k k=0 Rationale und irrationale Zahlen Reelle Zahlen, die sich schreiben lassen als m/n mit m ∈ Z und n ∈ N heißen rationale Zahlen. Reelle Zahlen, welche sich nicht so schreiben lassen heißen irrationale Zahlen. Die Summe m/n + p/q und das Produkt m/n · p/q von zwei rationalen Zahlen ist wieder eine rationale Zahl, und wenn m/n 6= 0, dann ist auch die Inverse n/m eine rationale Zahl. √ Es gibt aber auch irrationale Zahlen! Zum Beispiel: 2, π, e = 2.71828 . . . Satz 1.8. Eine reelle Zahl ist genau dann rational, wenn sie eine abbrechende oder eine periodische Dezimalbruchdarstellung hat. Es gilt 0.b1 b2 . . . bk = b 1 b 2 . . . bk 99 . . . 9 mit k Neunen im Nenner. Wir stellen uns reelle Zahlen als Punkte auf der Zahlengeraden vor. Intervalle Seien a, b ∈ R. a < b, sprich a ist kleiner als b“, bedeutet dass b − a > 0, und a ≤ b ⇔ ” (a < b) ∨ a = b. Eine Teilmenge I ⊂ R heißt Intervall, falls x, y ∈ I ∧ (x < t < y) ⇒ t ∈ I. 7 Für a, b ∈ R definiert man [a, b] (a, b) [a, b) (a, b] [a, ∞) (a, ∞) := := := := := := {x ∈ R|a ≤ x ≤ b} {x ∈ R|a < x < b} {x ∈ R|a ≤ x < b} {x ∈ R|a < x ≤ b} {x ∈ R|a ≤ x} {x ∈ R|x > a}, abgeschlossenes Intervall offenes Intervall und analog für (−∞, b] und (−∞, b). Die Intervalle [a, b) und (a, b] nennt man halboffen. (±∞ sind keine reelle Zahlen!) Schranken und Vollständigkeitsaxiom Sei S ⊂ R. S heißt nach oben beschränkt, falls ein b ∈ R existiert, mit S ⊂ (−∞, b] (d.h. x ∈ S ⇒ x ≤ b) Die Zahl b nennt man dann eine obere Schranke von S. Die Menge S heißt nach unten beschränkt, falls eine Zahl a ∈ R existiert, mit S ⊂ [a, ∞), und dann heißt a eine untere Schranke. Die Menge S heißt beschränkt, wenn sie eine untere Schranke a und eine obere Schranke b hat, so dass S ⊂ [a, b]. Vollständigkeitsaxiom: Jede nicht leere, nach oben beschränkte Menge S ⊂ R, hat eine kleinste obere Schranke, genannt Supremum von S, sup(S). Bemerkungen: • Das Vollständigkeitsaxiom garantiert die Existenz irrationaler Zahlen, wie z.B. √ 2 = sup{x ∈ Q|x2 < 2}. √ 2: • Aus dem Vollständigkeitsaxiom folgt, dass jede nach unten beschränkte Menge U ⊂ R eine grösste untere Schranke hat. Man nennt Sie Infimum von U , inf(U ). Es gilt inf(U ) = − sup{−u|u ∈ U }. • Wenn β := sup(S) in S liegt, dann heißt β größtes oder maximales Element von S. Man schreibt dann β = max(S). Wenn α = inf(U ) in U liegt, dann heißt α kleinstes oder minimales Element von U und man schreibt α = min(U ). • Um auszudrücken, dass S nicht nach oben und U nicht nach unten beschränkt ist, schreibt man auch sup(S) = ∞, inf(U ) = −∞. 8 Ungleichungen Für alle rellen Zahlen x, y, a, b gilt x ≤ y, a ≤ b ⇒ x + a ≤ y + b x ≤ y, 0 ≤ a ⇒ xa ≤ ya x ≤ y ⇒ −x ≥ −y 1 1 0<x≤y ⇒ 0< ≤ y x Diese Beziehungen kann man herleiten aus den Definitionen von <, ≤ und den Tatsachen (Axiomen), dass die Summe und das Produkt von zwei positiven Zahlen positiv ist. Der Betrag |a| einer reellen Zahl a ist definiert durch a, falls a ≥ 0 |a| := −a, falls a < 0. Folglich gilt |a| = max{a, −a}, |a| = | − a| und a = ±|a|. Satz 1.9. Für alle a, b ∈ R gilt (i) |a| ≥ 0 und |a| = 0 ⇔ (a = 0) (ii) |a · b| = |a||b| (iii) |a + b| ≤ |a| + |b| Körpereigenschaften von R Ein Körper ist eine Menge K für deren Elemente zwei Operationen + : K ×K →K · : K ×K →K (Addition) (Multiplikation) definiert sind, welche folgende Eigenschaften haben: (K1) Die Addition ist kommutativ und assoziativ: a + b = b + a, a + (b + c) = (a + b) + c (K2) Es gibt ein Element 0 ∈ K, genannt Null, sodass für alle a ∈ K a+0=a (K3) Zu jedem Element a ∈ K gibt es ein Element (−a) ∈ K, sodass a + (−a) = 0. (K4) Die Multiplikation ist kommutativ und assoziativ: a · b = b · a, a · (b · c) = (a · b) · c 9 (K5) Es gibt ein Element 1 ∈ K\{0}, genannt Eins, so dass a·1=a für alle a ∈ K (K6) Zu jedem Element a ∈ K\{0} gibt es ein Element a−1 ∈ K, so dass a · a−1 = 1. (K7) Für alle Elemente a, b, c ∈ K gilt das Distributivgesetz a · (b + c) = a · b + a · c. Alle algebraischen Eigenschaften von R folgen aus der Tatsache, dass R die Körperaxiome erfüllt. Da diese auch von den komplexen Zahlen erfüllt werden, kann man mit den komplexen Zahlen rechnen wie mit reellen Zahlen. 1.5 Komplexe Zahlen Definition von C Die Menge R × R versehen mit der Addition (a, b) + (c, d) = (a + c, b + d) und der Multiplikation (a, b) · (c, d) = (ac − bd, ad + bc) wird mit C bezeichnet. Die Elemente von C heißen komplexe Zahlen. Satz 1.10. C ist ein Körper. R ⊂ C und Imaginäre Einheit Für die Elemente der Teilmenge R × {0} = {(a, 0)|a ∈ R} gilt (a, 0) + (b, 0) = (a + b, 0) (a, 0) · (b, 0) = (ab, 0). Das heißt, R×{0} ist invariant unter Addition und Multiplikation und verhält sich unter diesen Operationen gleich wie R. Wir werden daher im folgenden (a, 0) ∈ C mit a ∈ R identifizieren und R als Teilmenge von C auffassen. Die komplexe Zahl i := (0, 1) ∈ C heißt imaginäre Einheit. Satz 1.11. i2 = −1 und a + ib = (a, b) für alle a, b ∈ R. 10 Realteil, Imaginärteil und komplexe Konjugation Sei z = a + ib ∈ C, dann heißt a Realteil von z, a = Re(z), und b heißt Imaginärteil von z, b = Im(z). Weiter ist z̄ := a − ib die zu z konjugiert komplexe Zahl. Satz 1.12. Für alle z, w ∈ C gilt (i) z + w = z̄ + w̄ (ii) zw = z̄ w̄ (iii) Re(z) = (z + z̄)/2, (iv) z∈R (v) ⇔ z = a + ib Im(z) = (z − z̄)/(2i) z = z̄ ⇒ z z̄ = a2 + b2 . Betrag einer komplexen Zahl Sei z = a + ib ∈ C (a, b ∈ R), dann heißt √ √ |z| := z z̄ = a2 + b2 (absoluter) Betrag von z. Offenbar ist der Betrag von z = a + ib der Abstand des Punktes (a, b) ∈ R2 vom Ursprung (0, 0). Satz 1.13. Seien z, w ∈ C, dann gilt (i) |z| ≥ 0 und (|z| = 0 ⇔ z = 0) (ii) |zw| = |z||w| (iii) |z + w| ≤ |z| + |w| (iv) | Re(z)|, | Im(z)| ≤ |z| ≤ | Re(z)| + | Im(z)| (v) z 6= 0 ⇒ z −1 = z̄/|z|2 (Dreiecksungleichung) Konsequenzen der Dreiecksungleichung Korollar 1.14. (1) z1 , . . . , zn ∈ C ⇒ n n X X zk ≤ |zk |, k=1 k=1 (2) z, w ∈ C ⇒ |z| − |w| ≤ |z − w|. 11 Polardarstellung einer komplexen Zahl Für ϕ ∈ R definieren wir eiϕ := cos ϕ + i sin ϕ Offensichtlich gilt |eiϕ | = 1, ei0 = 1, eiπ/2 = i, eiπ = −1 und ei(ϕ+2π) = eiϕ . Aus den Formeln für cos(ϕ1 + ϕ2 ) und sin(ϕ1 + ϕ2 ) folgt, dass ei(ϕ1 +ϕ2 ) = eiϕ1 eiϕ2 . (1) Jede komplexe Zahl z hat eine Polardarstellung z = |z|eiϕ wobei das Argument ϕ ∈ R nur bis auf ein ganzzahliges Vielfaches von 2π bestimmt ist, und für z = 0 beliebig gewählt werden kann. Aus (1) folgt für z1 = |z1 |eiϕ1 und z2 = |z2 |eiϕ2 , dass z1 z2 = |z1 ||z2 |ei(ϕ1 +ϕ2 ) . Potenzen und binomische Formel Sei z ∈ C und n ∈ N. Dann wird z n rekursiv definiert durch z 0 := 1 und z n+1 := z n z. Weiter ist z −n := (z −1 )n . Satz 1.15. Für alle z, w ∈ C\{0} und alle n, m ∈ Z gilt (i) (zw)n = z n wn , (ii) z n z m = z n+m (iii) (z n )m = z (nm) z −n = (z n )−1 Für alle z, w ∈ C und für alle n ∈ N gilt die binomische Formel: n X n n−k k (z + w) = z w . k k=0 n 12 (2) Wurzeln Wir suchen die komplexen Lösungen z der Gleichung z n = w für gegebenes w ∈ C. Sei z = |z|eiα , w = |w|eiβ und sei z n = w. Dann folgt aus (2) und e2πi = 1, dass z n = |z|n eiαn = |w|ei(β+2πk) , k ∈ Z. Wir definieren daher: zk := |w|1/n ei(β+2πk)/n , k ∈ Z. Dann gilt zkn = w wobei z−n = z0 = zn = z2n etc. Satz 1.16. Für jede komplexe Zahl w = |w|eiβ 6= 0 hat die Gleichung z n = w mit n ∈ N, genau n verschiedene Lösungen, nämlich die n-ten Wurzeln zk := |w|1/n ei(β/n+2πk/n) , 1.6 k = 0, . . . , n − 1. Polynome und rationale Funktionen Polynome Eine Abbildung p : C → C heißt Polynom n-ten Grades, wenn es Zahlen a0 , . . . , an ∈ C gibt, mit an 6= 0 und p(x) = n X ak xk = a0 + a1 x + . . . an xn . k=0 Die Zahlen a0 , . . . , an ∈ C heißen Koeffizienten des Polynoms f . Summe und Produkt von zwei Polynomen sind wieder Polynome, denn n X ak x k + k=0 n X n X bk x k = k=0 n X (ak + bk )xk k=0 m m+n k X X X k k k = ak x · bk x x ak−l bl k=0 k=0 k=0 l=0 wobei ak−l := 0 für k − l > n und bl := 0 für l > m. Satz 1.17. Die Koeffizienten eines Polynoms sind eindeutig bestimmt: aus n X k ak x = k=0 n X bk x k k=0 folgt, dass ak = bk , für k = 0 . . . n. 13 für alle x ∈ R Fundamentalsatz der Algebra Satz 1.18 (Fundamentalsatz der Algebra). Jedes Polynom p vom Grad n ≥ 1 hat mindestens eine Nullstelle. D.h. es gibt eine komplexe Zahl α mit p(α) = 0. (Beweis in HM3) P Satz 1.19. Jedes Polynom p(x) = nk=0 ak xk von Grad n ≥ 1, besitzt die Faktorisierung über C: p(x) = an (x − α1 )m1 (x − α2 )m2 · · · (x − αr )mr , mit den verschiedenen Nullstellen αi der Vielfachheit mi , (i = 1, . . . , r), m1 + m2 + . . . + mr = n. Ein Polynom vom Grad n ≥ 1 hat also genau n Nullstellen in C, wobei jede Nullstelle so oft gezählt wird, wie ihre Vielfachheit angibt. Polynome mit reellen Koeffizienten Satz 1.20. Ist α eine Nullstelle der Vielfachheit m eines Polynoms mit reellen Koeffizienten, dann ist auch α eine Nullstelle der Vielfachheit m. P Satz 1.21. Jedes Polynom p(x) = nk=0 ak xk mit n ≥ 1, ak ∈ R, an 6= 0 hat die Faktorisierung über R p(x) = an (x − b1 )m1 · · · (x − br )mr (x2 + c1 x + d1 )k1 · · · (x2 + cs x + ds )ks mit reellen Nullstellen bi der Vielfachheit mi (i = 1 . . . r) und quadratischen Polynomen x2 + ci x + di der Vielfachheit ki (i = 1 . . . s), die in R keine Nullstellen haben. Rationale Funktionen Ein Quotient zweier Polynome an x n + . . . + a1 x + a0 p(x) , = q(x) bm x m + . . . + b1 x + b0 an 6= 0, bm 6= 0, (3) heißt rationale Funktion. Der Definitionsbereich von p/q ist die Menge {x ∈ C | q(x) 6= 0}. Satz 1.22. Jede rationale Funktion (3) mit Zählergrad ≥ Nennergrad (n ≥ m), lässt sich darstellen in der Form p(x) r(x) = h(x) + q(x) q(x) mit einem Polynom h und einem Restpolynom r wobei r = 0 oder Grad(r) < Grad(q). Diese Darstellung ist eindeutig. 14 2 Lineare Algebra 2.1 Rn und Cn als Vektorräume Sei K = R oder K = C. Wir definieren in K n = K × . . . × K eine Addition von zwei n-Tupeln ~x = (x1 , . . . , xn ) und ~y = (y1 , . . . , yn ) durch ~x + ~y := (x1 + y1 , . . . , xn + yn ), und eine Multiplikation von einer Zahl λ ∈ K mit einem n-Tupeln ~x = (x1 , . . . , xn ) durch λ~x := (λx1 , . . . , λxn ). Die Elemente von K n versehen mit diesen Operationen nennt man Vektoren (statt n-Tupel). Der Vektor ~0 = (0, . . . , 0) heißt Nullvektor. Man definiert ~x − ~y := ~x + (−~y ). Für die Vektoroperationen in K n gelten folgende Rechenregeln: • Die Vektoraddition ist kommutativ und assoziativ, • ~x + ~0 = ~x für alle x ∈ K n , • ~x + (−~x) = ~0 für alle x ∈ K n . Ausserdem gilt für alle λ, µ ∈ K und alle ~x, ~y ∈ K n : • λ(~x + ~y ) = λ~x + λ~y , • (λ + µ)~x = λ~x + µ~x, • (λµ)~x = λ(µ~x), • 1~x = ~x. Damit wird K n zu einem n-dimensionalen Vektorraum (vgl. spätere Definition abstrakter Vektorräume) 2.2 Lineare Gleichungssysteme Ein reelles lineares Gleichunssystem mit m Gleichungen und n Unbekannten ist von der Form a11 x1 + a12 x2 + . . . + a1n xn = b1 a21 x1 + a22 x2 + . . . + a2n xn = b2 .. .. .. . . . am1 x1 + am2 x2 + . . . + amn xn = bm wobei aik , bi , für 1 ≤ i ≤ m, 1 ≤ k ≤ n gegebene reelle Zahlen sind. Das System heißt homogen, wenn b1 = b2 = · · · = bm = 0, sonst heißt es inhomogen. Wir interessieren uns für die Lösungsmenge, d.h. die Menge der n-Tupel (x1 , . . . , xn ), welche alle m Gleichungen gleichzeitig lösen. 15 Das Gauß’sche Lösungsverfahren Bei folgenden Umformungen ändert sich die Lösungsmenge eines lineare Gleichungssystems nicht. Wir sagen: das Gleichungssystem geht in ein äquivalentes Gleichungssystem über. 1. Vertauschung zweier Gleichungen. 2. Multiplikation einer Gleichung mit λ 6= 0. 3. Addition des λ-fachen der iten Gleichung zur j-ten Gleichung. Diese Feststellung ist die Grundlage Gauß’sches Lösungsverfahren. 2.3 Matrizen Eine reelle m × n-Matrix ist ein a11 a21 A = .. . am1 rechteckiges Schema von reellen Zahlen a12 a13 . . . a1n a22 a23 . . . a2n .. .. .. = (aik ). . . . am2 am3 . . . amn Das Element aik steht in der i-ten Zeile und der k-ten Spalte. Man definiert die Summe von zwei m × n Matrizen A = (aik ) und B = (bik ) durch A + B := (aik + bik ) und das Produkt einer Matrix A = (aik ) mit einer Zahl λ ∈ R durch λA := (λaik ). Weiter ist A − B := A + (−B). Diese Addition und die skalare Multiplikation von m × n Matrizen unterscheidet sich nicht von den entsprechenden Operationen in Rnm . Somit gilt für alle m × n Matrizen A, B und alle λ, µ ∈ R: • Die Matrixaddition ist kommutativ und assoziativ, • A+0=A • A + (−A) = 0 • λ(A + B) = λA + λB, • (λ + µ)A = λA + µA, • (λµ)A = λ(µA), • 1A = A. 16 Hier bezeichnet 0 die m × n-Nullmatrix deren Elemente lauter Nullen sind. Eine m × 1 Matrix a1 a2 .. ∈ Rm . am nennt man auch Spaltenvektor. Eine 1 × n-Matrix (a1 , a2 , . . . , an ) ∈ Rn heißt Zeilenvektor. Wir definieren das Produkt eines Zeilenvektors aus Rn mit einem Spaltenvektor aus Rn durch b1 n b2 X ak b k . (a1 , a2 , . . . , an ) .. := . k=1 bn Ein lineares Gleichungssystem mit schreiben als a11 a12 a21 a22 .. . am1 am2 m Gleichungen und n Unbekannten lässt sich somit . . . a1n x1 b1 . . . a2n x2 b2 .. .. = .. . . . . . . . amn xn bm Links steht die Koeffizientenmatrix A = (aij ) angewandt auf den Spaltenvektor ~x mit den unbekannten Komponenten xi , d.h, jede Zeile von A wird multipliziert mit dem Spaltenvektor ~x. Kurz A~x = ~b wobei x1 x2 ~x := .. , . b1 b2 ~b := .. . . xn bm Die Umformungen des Gauß’schen Lösungsverfahrens lassen sich übersichtlich ausführen an der erweiterten Koeffizientenmatrix: a11 a12 . . . a1n b1 a21 a22 . . . a2n b2 ~ (A, b) := .. .. .. . . . am1 am2 . . . amn bm Die Gleichungsumformungen entsprechen den folgenden elementaren Zeilenumformungen: 17 1. Vertauschen von zwei Zeilen 2. Multiplikation einer Zeile mit einer Zahl λ 6= 0, 3. Addition (Subtraktion) des λ-fachen einer Zeile zu einer anderen Zeile. 2.4 Das Gaußsche Lösungsverfahren Das homogene System A~x = ~0 Im Fall ~b = ~0 genügt die einfache“ Koeffizientenmatrix: ” a11 a12 . . . a1n a21 a22 . . . a2n .. .. . . . am1 am2 . . . amn Vorwärtselimination: • Zeilen vertauschen bis a11 6= 0, (bzw bis a12 6= 0, falls a11 = . . . = am1 = 0), • subtrahiere a21 -faches a11 der ersten Zeile von zweiter Zeile, • subtrahiere a31 -faches a11 der ersten Zeile von dritter Zeile, • etc. Das Resultat ist: ∗ ∗ ∗ ∗ ∗ 0 ∗ ∗ ∗ ∗ ∗ .. . A1 0 ∗ ∗ ∗ ∗ ∗ An der -Stelle ist eine Zahl 6= 0, über die Zahlen an den ∗-Stellen wird nichts ausgesagt, und A1 bezeichnet eine (m − 1) × (n − 1) Matrix. Falls A1 die Nullmatrix ist, ist man fertig. Sonst wiederholt man das Eliminationsverfahren mit A1 . Nach höchstens m − 1 Eliminationsschritten gelangt man zu einer Matrix M in Zeilenstufenform, z.B. auf: ∗ ∗ ∗ ∗ ∗ 0 0 ∗ ∗ ∗ . M = 0 0 0 ∗ ∗ 0 0 0 0 0 0 Rückwärtssubstitution • Die Unbekannten zu den Spalten ohne mit λ1 , . . . , λn−r . 18 sind freie Variablen. Wir bezeichnen sie • Im Gleichungssystem das der Matrix M entspricht bringt man die freien Variablen λ1 , . . . , λn−r auf die rechte Seite und berechnet der Reihe nach, von unten nach oben, die zu den -Stellen gehörenden abhängigen Variablen (in Abhängigkeit von λ1 , . . . , λn−r ). Die so bestimmte Lösung heißt allgemeine Lösung des Systems. Der Rang der m×n-Matrix A, RangA, ist die Anzahl der von Null verschiedenen Zeilen in der Zeilenstufenmatrix M , welche aus A mittels Gauß-Elimination erzielten wurde. Offensichtlich ist RangA ≤ m. Satz 2.1. Sei A eine m × n Matrix. Dann enthält allgemeine Lösung des homogenen Systems A~x = ~0: n − RangA frei wählbare Parameter. Falls RangA = n dann ist ~0 ist die einzige Lösung. Für RangA < n, z.B. wenn m < n, dann gibt es von Null verschiedene Lösungen. Das inhomogene System A~x = ~b • Vorwärtselimination an der Matrix (A, ~b) liefert ∗ ∗ ∗ ∗ 0 0 ∗ ∗ ~ = (M, d) 0 0 0 ∗ 0 0 0 0 0 ∗ d1 ∗ : . ∗ dr 0 dm • Falls eine der Zahlen dr+1 , . . . , dm verschieden von 0 ist, dann ist M~x = d~ nicht lösbar, also hat auch A~x = ~b keine Lösung • Die Rücksubstitution im Fall dr+1 = . . . = dm = 0 wird analog wie bei homogenen Systemen durchgeführt. Alternative: man berechne zuerst eine spezielle Lösung ~v0 ∈ Rn , z.B. mit λ1 = . . . = λn−r = 0, und dann die allgemeine Lösung ~u(λ1 , . . . , λn−r ) von M~x = ~0. Dann ist ~v0 + ~u(λ1 , . . . , λn−r ) ~ die allgemeine Lösung von M~x = d. Satz 2.2. Sei A eine reelle m × n Matrix und sei ~b ∈ Rm . (a) A~x = ~b ist genau dan lösbar, wenn Rang(A, ~b) = Rang(A). (b) Falls A~x = ~b lösbar ist, dann ist die allgemeine Lösung von der Form ~v = ~v0 + ~u wobei ~v0 eine spezielle Lösung von A~x = ~b und ~u die allgemeine Lösung von A~x = 0 ist. ~v0 + ~u enthält n − Rang(A) frei wählbare Parameter. (c) Ist A~x = ~b lösbar und Rang(A) = n =Anzahl der Variablen, dann ist die Lösung eindeutig. 19 2.5 Die Matrizenmultiplikation Das Produkt C := AB einer m × n Matrix A = (aij ) und einer n × r Matrix B = (bjk ) ist eine m × r Matrix C = (cij ) definiert durch cik := n X aij bjk = ai1 b1k + . . . + ain bnk . j=1 • Im allgemeinen ist AB 6= BA. • Ist A eine m × n Matrix und ist ~x ∈ Rn ein Spaltenvektor, dann ist A~x ein Matrixprodukt. • Das Produkt eines Zeilenvektors mit einem Spaltenvektor ist ein Spezialfall des Matrixprodukts. Die n × n Einheitsmatrix En = (δij ) ist definiert durch 1, i = j, δij = 0, i 6= j. δij heißt Kroneckersymbol. Satz 2.3. Seien A, A1 , A2 m × n Matrizen, B, B1 , B2 n × r Matrizen und sei C eine r × s Matrix. Dann gilt: (a) (b) (c) (d) (A1 + A2 )B = A1 B + A2 B, A(B1 + B2 ) = AB1 + AB2 , λ(AB) = (λA)B = A(λB), (λ ∈ R), (AB)C = A(BC), Em A = AEn = A. Transponierte einer Matrix Sei A eine m×n Matrix. Dann ist AT die n×m Matrix, welche aus A durch Spiegelung an der Diagonalen ensteht: die i-te Spalte von AT ist die die i-te Zeile von A, (AT )ji = Aij . AT heißt die zu A transponierte Matrix. Insbesondere ist T b1 .. . = (b1 , . . . , bn ) bn a1 .. T (a1 , . . . , an ) = . , an Satz 2.4. Seien A, B m × n Matrizen und sei C eine n × r Matrix. Dann gilt: (a) (A + B)T = AT + B T , (b) (λA)T = λAT , (c) (AT )T = A, 20 (d) (AC)T = C T AT . Eine n × n Matrix heißt symmetrisch, falls AT = A, sie heißt schiefsymmetrisch (antisymmetrisch), falls AT = −A. Offensichtlich gilt AT = A ⇔ aij = aji AT = −A ⇔ aij = −aji . • Ist A schiefsymmetrisch, dann ist aii = 0 für alle i = 1, . . . , n. • Für jede n × n Matrix, sind A + AT , AT A und AAT symmetrisch, und A − AT ist schiefsymmetrisch. • Die Einheitsmatrix En ist symmetrisch. Invertierbare Matrizen Im folgenden ist E := En und auch alle anderen Matrizen sind quadratisch. Satz 2.5. Seien A, B, C n × n Matrizen mit BA = E = AC. Dann gilt B = C. Eine n × n Matrix A heißt invertierbar, falls eine n × n Matrix B existiert mit AB = E = BA. Nach Satz 2.5 ist B eindeutig durch A bestimmt. B heißt Inverse von A und wird mit A−1 bezeichnet. Beispiele: 1. Für λ 6= 0 ist λE invertierbar und (λE)−1 = λ−1 E. 2. Falls ad − bc 6= 0, dann hat 1 d −b a b −1 A= . die Inverse A = a c d ad − bc −c Satz 2.6. (a) Ist A invertierbar, dann auch A−1 , und (A−1 )−1 = A. (b) Sind A, B invertierbar, dann auch AB, und (AB)−1 = B −1 A−1 . (c) AT ist genau dann invertierbar, wenn A invertierbar ist, und dann gilt (AT )−1 = (A−1 )T . Satz 2.7. Folgende Aussagen über eine n × n Matrix A sind äquivalent: (a) A ist invertierbar. (b) Es gibt eine n × n Matrix B mit AB = E. (c) Es gibt eine n × n Matrix C mit CA = E. (d) A~x = 0 ⇒ ~x = ~0. (e) RangA = n. 21 Diagonalmatrizen Eine Matrix der Form a1 0 · · · 0 a2 diag(a1 , . . . , an ) := .. .. . . ··· 0 0 .. . an heißt Diagonalmatrix. Z.B. ist En = diag(1, . . . , 1) und es gilt diag(a1 , . . . , an ) diag(b1 , . . . , bn ) = diag(a1 b1 , . . . , an bn ). Falls ai 6= 0 für alle i, dann ist diag(a1 , . . . , an ) invertierbar und es gilt 1 1 diag(a1 , . . . , an )−1 = diag( , . . . , ). a1 an Dreiecksmatrizen Quadratische Matrizen der Form ∗ ∗ 0 ∗ 0 0 0 0 ∗ ∗ ∗ 0 ∗ ∗ , ∗ ∗ ∗ ∗ ∗ ∗ 0 ∗ ∗ ∗ 0 0 ∗ ∗ 0 0 , 0 ∗ heißen Dreiecksmatrizen. Jede Diagonalmatrix ist eine Dreiecksmatrix. Satz 2.8. Eine Dreiecksmatrix A = (aij ) ist genau dann invertierbar, wenn alle Diagonalelemente aii verschieden von Null sind. 2.6 Vektorräume Der abstrakte Vektorraum Se K = R oder K = C. Eine nichtleere Menge V für deren Elemente eine Addition a + b und eine Multiplikation λa mit Zahlen λ ∈ K definiert ist heißt K-Vektorraum, oder Vektorraum über K, wenn folgende Axiome erfüllt sind: (V1) Die Addition ist kommutativ und assoziativ. (V2) Es gibt ein Element 0 ∈ V , genannt Nullvektor, mit a + 0 = a für alle a ∈ V . (V3) Zu jedem a ∈ V gibt es ein Element −a ∈ V mit a + (−a) = 0. (V4) 1a = a für alle a ∈ V . (V5) λ(µa) = (λµ)a für alle λ, µ ∈ K, a ∈ V . (V6) λ(a + b) = λa + λb für alle λ ∈ K, a, b ∈ V . (V7) (λ + µ)a = λa + µa für alle λ, µ ∈ K, a ∈ V . Die Elemente eines Vektorraums nennt man Vektoren; statt a + (−b) schreibt man a − b. 22 Beispiele von Vektorräumen • Rn ist eine Vektorraum über R, Cn ist ein Vektorraum über C. • Die Mengen der reellen m × n Matrizen bilden einen Vektorraum über R. • Die Menge aller Funktionen f : [a, b] → R bei festen a, b ∈ R zuammen mit den Operationen (f + g)(x) := f (x) + g(x), (λf )(x) := λf (x), ist eine R-Vektorraum. • Die Menge der Polynome vom Grad ≤ n, Pn := {a0 + a1 x + . . . + an xn | ai ∈ K} bilden einen Vektorraum über K. Sei V ein Vektorraum über K. Eine nichtleere Teilmenge U ⊂ V heißt Unterraum von V , wenn (U1) u, v ∈ U ⇒ (U2) u ∈ U, λ ∈ K u + v ∈ U, ⇒ λu ∈ U . Bemerkungen: • Ein Unterraum eines K-Vektorraums ist wieder ein K-Vektorraum. • Jeder Unterraum enthält den Nullvektor. • Jeder Vektorraum V hat die Unterräume U = {0} und U = V . Jede aus endliche vielen Vektoren v1 , . . . , vk ∈ V gebildete Summe k X λi ∈ K, λi vi , i=1 heißt Linearkombination der vi . Die Menge aller Linearkombinationen der vi , Lin(v1 , . . . , vk ) := k nX o λi vi λi ∈ K i=1 heißt lineare Hülle der vi . Lin(v1 , . . . , vk ) ist ein Unterraum von V .Ein Unterraum U wird von den Vektoren v1 , . . . , vk erzeugt, falls U = Lin(v1 , . . . , vk ). Man sagt auch, {v1 , . . . , vk } ist ein Erzeugendensystem von U . 23 Lineare Unabhängigkeit Endliche viele Vektoren v1 , . . . , vk heißen abhängig, wenn es Zahlen λ1 , . . . , λk ∈ Plinear k K gibt, nicht alle gleich Null, so dass i=1 λi vi = 0. Im Fall k > 1 ist das äquivalent dazu, dass sich einer der Vektoren vi als Linearkombination der anderen schreiben lässt. Z.B. k−1 X vk = µi v i . i=1 Endliche viele Vektoren v1 , . . . , vk heißen linear unabhängig, wenn sie nicht linear abhängig sind, d.h., wenn k X λi vi = 0 ⇒ λ1 = λ2 . . . = λk = 0. i=1 Satz 2.9. Ist A eine m × n Matrix in Zeilenstufenform, dann sind die von Null verschiedenen Zeilenvektoren linear unabhängig. Satz 2.10. Für eine n × n Matrix sind folgende Aussagen äquivalent: • A ist invertierbar • Die Spalten von A sind linear unabhängig. • Die Zeilen von A sind linear unabhängig. Satz 2.11. Für Vektoren v1 , . . . , vk , w ∈ V gilt: (a) Lin(v1 , . . . , vk , w) = Lin(v1 , . . . , vk ) ⇔ w ∈ Lin(v1 , . . . , vk ). (b) v1 , . . . , vk sind linear unabhängig ⇔ zur Erzeugung von Lin(v1 , . . . , vk ) kann kein vi weggelassen werden. 2.7 Basis und Dimension Eine Familie von linear unabhängigen Vektoren v1 , . . . , vn ∈ V mit V = Lin(v1 , . . . , vn ) heißt Basis von V . Satz 2.12. Ist v1 , . . . , vn eine Basis von V , dann hat jeder Vektor a ∈ V eine Darstellung a = λ1 v1 + λ2 v2 + · · · + λn vn . wobei die Zahlen λ1 , . . . , λn ∈ K eindeutig bestimmt sind. Jede Familie von m > n Vektoren ist linear abhängig. Sind v1 , . . . , vn und w1 , . . . , wm zwei Basen von V , dann folgt aus Satz 2.12, dass m = n. Die Anzahl Vektoren einer Basis heißt Dimension von V . Die Dimension von {0} ist per Vereinbarung gleich Null. 24 Existenz einer Basis Ein Vektorraum V heißt endlich erzeugt, wenn es endlich viele Vektoren w1 , . . . , wr gibt, mit V = Lin(w1 , . . . , wr ). Satz 2.13. Jedes Erzeugendensystem w1 , . . . , wr von V lässt sich (durch Weglassen von Vektoren) zu einer Basis von V reduzieren und dim Lin(w1 , . . . , wr ) ist die Maximalzahl linear unabhängiger Vektoren die in w1 , . . . , wr gefunden werden können. Insbesondere hat jeder endlich erzeugte Vektorraum eine Basis. Satz 2.14. Sei V ein endlich erzeugter Vektorraum. Dann lässt sich jede Familie linear unabhängiger Vektoren v1 , . . . , vk ∈ V zu einer Basis von V erweitern. Aus den Sätzen 2.13 und 2.14 folgt sofort: Satz 2.15. Sei V ein Vektorraum der Dimension n. (a) Ist V = Lin(v1 , . . . , vn ), dann bilden v1 , . . . , vn eine Basis. (b) Sind die Vektoren v1 , . . . , vn linear unabhängig, dann bilden sie eine Basis. Satz 2.16. Ist U ein Unterraum eines endlich dimensionalen Vektorraums V und U 6= V , dann ist U endlich dimensional und dim U < dim V. 2.8 Elementarmatrizen und elementare Umformungen Zeilen- und Spaltenraum einer Matrix Sei A eine m × n Matrix. Der durch die Spaltenvektoren a1 , . . . , an von A aufgespannte Unterraum von Rm ist der Spaltenraum von A = Lin(a1 , . . . , an ) = {Ax | x ∈ Rn }. Der durch die Zeilenvektoren z1 , . . . , zm von A aufgespannte Unterraum von Rn ist der Zeilenraum von A = Lin(z1 , . . . , zn ) = {y T A | y ∈ Rm }. Der Kern der Matrix A ist der Unterraum von Rn definiert durch KernA := {x ∈ Rn | Ax = 0}. Satz 2.17. Sei A eine m × n Matrix. 25 (a) Entsteht M aus A durch endliche viele elementare Zeilenumformungen, dann gibt es eine invertierbare m × m Matrix P mit M = P A. (b) Entsteht N aus A durch endlich viele elementare Spaltenumformungen, dann gibt es eine invertierbare n × n Matrix Q mit N = AQ. Satz 2.18. Bei elementaren Zeilenumformungen ändert sich der Zeilenraum nicht, bei elementaren Spaltenumformungen ändert sich der Spaltenraum nicht. Insbesondere gilt RangA = Dimension des Zeilenraums von A. Theorem 2.19. Sei A eine m × n Matrix. Dann gilt (a) RangA = Dimension des Zeilenraums von A, = Dimension des Spaltenraums von A. (b) RangA + dim(KernA) = n. (c) Es gibt eine invertierbare m × m Matrix P und eine invertierbare n × n Matrix Q, derart dass Er 0 P AQ = , r = RangA. 0 0 2.9 Determinanten Die Determinante einer 2 × 2 Matrix a1 b 1 A= ist a2 b 2 det A := a1 b2 − a2 b1 . Also ist A genau dann invertierbar, wenn det A 6= 0. Die Determinate einer 3 × 3 Matrix a1 b 1 c 1 A = a2 b 2 c 2 a3 b 3 c 3 ist definiert durch b2 c 2 b1 c 1 b1 c 1 det A :=a1 det − a2 det + a3 det b3 c 3 b3 c 3 b2 c 2 =a1 b2 c3 + b1 c2 a3 + c1 a2 b3 − a3 b2 c1 − b3 c2 a1 − c3 a2 b1 26 Rekursive Definition der Determinante Sei A = (aij ) eine n × n Matrix. • Für n = 1, d.h. A = (a11 ), ist die det A = a11 . • Für n ≥ 2 ist (Entwicklung nach der ersten Spalte): det A = n X (−1)i+1 ai1 det Ai1 i=1 = a11 det A11 − a21 det A21 + . . . (−1)n+1 an1 det An1 , wobei Ai1 die (n − 1) × (n − 1) Matrix ist, welche aus A durch Entfernen der i-ten Zeile und der erste Spalte ensteht. Rechenregeln für Determinanten Satz 2.20. Für jede n × n Matrix A gilt: (a) Entsteht à aus A durch vertauschen zweier Zeilen, dann gilt det à = − det A. (b) det A ist linear als Funktion der Zeilenvektoren von A. D.h., a1 λa1 a2 a2 det = λ det , .. .. . . a1 + b 1 a1 b1 a2 a2 a2 det = det + det .. .. .. . . . und analog für die anderen Zeilen von A. Folgerungen: • Sind zwei Zeilenvektoren von A gleich, dann ist det A = 0. • det(λA) = λn det A wenn A eine n × n Matrix ist. Korollar 2.21. Die elementaren Zeilenumformungen: 1. Vertauschen von zwei Zeilen, 2. Multiplikation einer Zeile mit λ 6= 0, 3. Addition des λ-fachen einer Zeile zu einer anderen Zeile, verändern die Determinante um den Faktor −1, λ bzw. 1. 27 Eine Elementarmatrix P ist eine quadratische Matrix, welche eine elementare Zeilenumformung erzeugt. Die Determinante von P stimmt überein mit dem Zahlenfaktor −1, λ bzw. 1 um welchen die Determinante sich ändert bei der P entsprechenden Zeilenumfomung. Es gilt also: det(P A) = det(P ) det(A). Satz 2.22. Jede invertierbare Matrix ist das Produkt von Elementarmatrizen. Theorem 2.23. Für n × n Matrizen A, B gilt: (a) A ist genau dann invertierbar wenn det A 6= 0. (b) det AT = det A und Satz 2.20 gilt auch für die Spaltenvektoren einer Matrix. (c) det(AB) = det(A) det(B). Satz 2.24. Das durch die Vektoren a, b ∈ R2 aufgespannte Parallelogramm hat den Flächeninhalt | det(a, b)|. Das durch die Vektoren a, b, c ∈ R3 aufgespannte Parallelepiped (Spat) hat das Volumen | det(a, b, c)|. Entwicklung von det A nach beliebiger Spalte/Zeile Sei A = (aij ) eine n × n Matrix und sei Aij die (n − 1) × (n − 1) Matrix welche aus A durch Streichen der i-ten Zeile und der j-ten Spalte entsteht. Dann gelten folgende Entwicklungsformeln: Entwicklung nach der j-ten Spalte: det A = n X (−1)i+j aij det Aij i=1 Entwicklung nach der i-ten Zeile: det A = n X (−1)i+j aij det Aij j=1 Cramersche Regel und inverse Matrix Sei A = (a1 , . . . , an ) eine invertierbare n × n Matrix und sei b ∈ Rn . Dann ist die (eindeutige) Lösung des Gleichungssystems Ax = b gegeben durch die Cramersche Regel 1 det(a1 , . . . , ai−1 , b, ai+1 , . . . , an ). xi = det A (i-te Spalte von A durch b ersetzt.) Satz 2.25. Sei A eine invertierbare n × n Matrix. Dann gilt: 1 (A−1 )ik = (−1)i+k det Aki det A wobei rechts die Reihenfolge der indizes i, k gegenüber links vertauscht ist. 28 Permutationen Eine Permutation der Zahlen {1, . . . , n} ist eine bijektive Abbildung σ : {1, . . . , n} → {1, . . . , n}. Die Permutation σ wird durch das Schema 1 2 3 ... n σ(1) σ(2) σ(3) . . . σ(n) vollständig beschrieben. Es gibt n! verschiedene Permutationen von {1, . . . , n}. Das Signum einer Permutation, sgn(σ), ist definiert durch sgn(σ) = (−1)r wobei r die Anzahl Vertauschungen zweier Elemente ist, welche notwendig ist um {1, . . . , n} in die Reihenfolge {σ(1), . . . , σ(n)} zu bringen. Die Permutation σ heißt gerade, wenn sgn(σ) = +1 und ungerade wenn sgn(σ) = −1. Die zyklischen Permutationen von {1, 2, 3}: 1 2 3 1 2 3 1 2 3 , , , 1 2 3 2 3 1 3 1 2 sind gerade, die anderen drei Permutationen sind ungerade. Satz 2.26. Die Determinate einer n × n Matrix A = (aij ) lässt sich schreiben als X det A = sgn(σ)a1σ(1) a2σ(2) · · · anσ(n) σ wobei über alle Permutationen σ von {1, . . . , n} zu summieren ist. 2.10 Rn als Euklidischer Vektorraum Seien x, y ∈ Rn , x = (x1 , . . . , xn )T , y = (y1 , . . . , yn )T . Die Zahl T x · y := x y = n X xi y i i=1 heißt Skalarprodukt (inneres Produkt ) von x und y, und √ |x| := x · x heißt Betrag (oder Länge) von x. Ein Vektor x ∈ Rn heißt normiert oder Einheitsvektor, wenn |x| = 1. Vorsicht: (x · y)z 6= x(y · z). Satz 2.27. Für alle x, y, z ∈ Rn und alle λ ∈ R gilt (a) x · x ≥ 0 und x · x = 0 ⇔ x = 0. (b) x · y = y · x (c) x · (y + z) = x · y + x · z, und x · (λy) = λ(x · y), 29 Satz 2.28. Für alle x, y ∈ Rn und alle λ ∈ R gilt (a) |x| ≥ 0 und |x| = 0 ⇔ x = 0. (b) |λx| = |λ||x|, (c) |x · y| ≤ |x||y| (Cauchy-Schwarzsche Ungleichung), (d) |x + y| ≤ |x| + |y| (Dreiecksungleichung). Satz 2.29. Seien x, y ∈ Rn und sei ϕ ∈ [0, π] der Winkel zwischen x und y. Dann gilt x · y = |x||y| cos ϕ. Zwei Vektoren x, y ∈ Rn heißen orthogonal, in Zeichen x ⊥ y, wenn x · y = 0. Der Nullvektor ist othogonal zu allen Vektoren. Sind x und y orthogonal, dann gilt |x + y|2 = |x|2 + |y|2 . Satz 2.30 (Satz von Pytagoras). Sind x1 , . . . , xk ∈ Rn paarweise othogonal, d.h. xi ·xj = 0 für i 6= j, dann gilt 2 k k X X x = |xi |2 i i=1 i=1 Gram-Schmidtsches Orthogonalisierungsverfahren Eine Familie von Vektoren b1 , . . . , bk ∈ Rn heißt orthogonal wenn bi · bj = 0 für i 6= j und sie heißt orthonormal, wenn wenn sie othogonal ist und alle Vektoren normiert sind, d.h. wenn bi · bj = δij . Satz 2.31. • Jede orthogonale Familie {b1 , . . . , bk } ⊂ Rn ohne den Nullvektor ist linear unabhängig. • Ist b1 , . . . , bn eine orthonormale Basis (ONB) von Rn , dann gilt für jeden Vektor x ∈ Rn : n X x= (x · bi )bi i=1 Zu jedem System linear unabhängiger Vektoren a1 , . . . , ak ∈ Rn gibt es ein orthonormales System b1 , . . . , bk mit Lin{a1 , . . . , ak } = Lin{b1 , . . . , bk }. 30 Insbesondere hat jeder Unterraum U ⊂ Rn eine ONB. Gram-Schmidtsches Orthogonalisierungsverfahren: b1 := a1 |a1 | a02 := a2 − (a2 · b1 )b1 , a03 := a3 − (a3 · b1 )b1 − (a3 · b2 )b2 , .. . a02 |a02 | a0 b3 := 03 |a3 | b2 := .. . a0k := ak − k−1 X (ak · bi )bi , bk := i=1 a0k |a0k | Orthogonale Projektion Ist U ⊂ Rn eine beliebige Teilmenge und x ⊥ y für alle y ∈ U , dann schreiben wir x ⊥ U. Satz 2.32. Sei U ein Unterraum von Rn . Dann hat jeder Vektor x ∈ Rn eine eindeutige Zerlegung x = xU + yU , mit xU ∈ U, yU ⊥ U. Ist {b1 , . . . , bk } eine ONB von U , dann gilt xU = k X (x · bi )bi . i=1 xU heißt heißt orthogonale Projektion von x auf U . Das Vektorprodukt in R3 Das Vektorprodukt a∧b von zwei Vektoren a, b ∈ R3 , a = (a1 , a2 , a3 )T , b = (b1 , b2 , b3 )T ist definiert durch a2 b 3 − a3 b 2 a ∧ b := a3 b1 − a1 b3 a1 b 2 − a2 b 1 Offenbar gilt für alle Vektoren a, b, c ∈ R3 die Identität (a ∧ b) · c = det(a, b, c). Der Betrag des Spatprodukt (a ∧ b) · c ist nach Satz 2.24 das Volumen des durch a, b, c aufgespannten Spats. 31 Folgerungen: • a ∧ b ist orthogonal zu a und b. • |a ∧ b| = |a||b| sin ϕ wobei ϕ ∈ [0, π] der Winkel zwischen a und b ist. • Die drei Vektoren a, b, a ∧ b bilden ein Rechtssystem, d.h. sie sind gleich orientiert wie e1 = (1, 0, 0), e2 = (0, 1, 0) und e3 = (0, 0, 1). Satz 2.33. Für alle a, b, c ∈ R3 gilt: (a) a ∧ b = −b ∧ a, also a ∧ a = 0, (b) λ(a ∧ b) = (λa) ∧ b = a ∧ (λb) für alle λ ∈ R, (c) a ∧ (b + c) = a ∧ b + a ∧ c, (a + b) ∧ c = a ∧ c + b ∧ c, (d) |a ∧ b|2 = |a|2 |b|2 − (a · b)2 . Satz 2.34. Für alle a, b, c, d ∈ R3 gelten die Identitäten: a ∧ (b ∧ c) = (a · c)b − (a · b)c (Grassmann) (a ∧ b) · (c ∧ d) = (a · c)(b · d) − (a · d)(b · c) (Lagrange). Das Vektorprodukt a ∧ b in der Darstellung a2 b 2 a1 b 1 a1 b 1 a ∧ b = e1 det − e2 det + e3 det a3 b 3 a3 b 3 a2 b 2 mit der Standardbasis e1 , e2 , e3 von R3 sieht aus wie die Determinante einer 3 × 3 Matrix deren erste Spalte aus e1 , e2 und e3 besteht, d.h. formal e1 a1 b1 a ∧ b = det e2 a2 b2 . e3 a3 b3 2.11 Lineare Abbildungen Lineare Abbildungen Seien V, W zwei Vektorräume über K (K = R oder K = C). Eine Abbildung F : V → W heißt linear falls für alle u, v ∈ V and alle λ ∈ K, F (λv) = λF (v), F (u + v) = F (u) + F (v). Für jede lineare Abbildung F ist F (0) = 0 und ! n n X X F λi vi = λi F (vi ). i=1 i=1 Der Kern {v ∈ V | F (v) = 0} und das Bild {F (v) | v ∈ V } einer linearen Abbildung F : V → W sind Unterräume von V bzw. W . Bemerkungen: 32 (a) Sind F, G : V → W linear, dann sind auch F + G und λF linear. Somit ist die Menge der linearen Abbildungen von V nach W , Hom(V, W ) := {F : V → W |F ist linear} selbst auch ein Vektorraum über K (Raum der Homomorphismen). (b) Sind F : V → W und G : U → V linear, dann ist auch F ◦ G : U → W linear. (c) Ist F : V → W linear und bijektiv, dann ist auch F −1 : W → V linear. Matrizen linearer Abbildungen Satz 2.35. Zu jeder linearen Abbildung F : K n → K m gibt es eine m × n Matrix A = (aij ), aij ∈ K, so dass F (x) = Ax, für alle x ∈ K n . (4) Umgekehrt wird durch jede m×n Matrix A via (4) eine lineare Abbildung F : K n → K m definiert. Die Spalten von A sind die Bilder der Basisvektoren e1 , . . . , en von K n . Bemerkungen: (a) Sind F, G : K n → K m linear mit F (x) = Ax und G(x) = Bx, dann ist A + B die Matrix von F + G und λA ist die Matrix von λF . (b) Sind F : K n → K m und G : K l → K n linear mit F (x) = Ax und G(x) = Bx, dann ist AB die Matrix von F ◦ G, d.h (F ◦ G)(x) = ABx, für alle x ∈ K l . (c) Eine lineare Abbildung F : K n → K n mit F (x) = Ax ist genau dann bijektiv, wenn die Matrix A invertierbar ist, und dann gilt F −1 (x) = A−1 x. Satz 2.36. Sei F : K n → K m linear mit F (x) = Ax. Dann gilt (a) F ist genau dann injektiv wenn KernA = {0}. (b) F ist genau dann surjektiv wenn RangA = m. Aus diesem Satz und der Dimensionsformel RangA + dim(KernA) = n (Theorem 2.19) folgt sofort: Satz 2.37. Für eine lineare Abbildung F : K n → K n (quadratische Matrix!) sind äquivalent: (a) F ist injektiv, (b) F ist surjektiv, (c) F ist bijektiv. 33 Orthogonale Abbildungen Eine reelle n × n Matrix A und auch die zugehörige lineare Abbildung F : Rn → Rn heißen orthogonal wenn AT = A−1 . Das wird durch folgenden Satz erklärt: Satz 2.38. Sei A eine reelle n × n Matrix. Dann sind äquivalent: (a) A ist orthogonal, (b) (Ax) · (Ay) = x · y für alle x, y ∈ Rn , (c) |Ax| = |x| für alle x ∈ Rn , (d) die Spalten von A bilden eine ONB von Rn . (e) die Zeilen von A bilden eine ONB von Rn . Ist A orthogonal, dann gilt det A = ±1, denn aus E = AT A folgt 1 = det E = det AT A = (det A)2 . O(n) := Menge der orthogonalen n × n Matrizen, heißt orthogonale Gruppe des Rn . SO(n) := {A ∈ O(n) | det A = +1} heißt spezielle orthogonale Gruppe. Orthogonale Abbildungen sind • längentreu • winkeltreu • volumentreu Spiegelungen und Drehungen Die Spiegelung s : Rn → Rn am Ursprung 0 ∈ Rn , s(x) = −x, hat die orthogonale Matrix −E mit Determinante det(−E) = (−1)n . Die Spiegelung an der Ebene a · x = 0 mit |a| = 1: s : R3 → R3 , s(x) = x − 2a(a · x) hat die orthogonale Matrix 1 − 2a21 −2a1 a2 −2a1 a3 E − 2aaT = −2a2 a1 1 − 2a22 −2a2 a3 −2a3 a1 −2a3 a2 1 − 2a23 34 mit det(E − 2aaT ) = −1. Offensichtlich ist diese Matrix symmetrisch. Das muss so sein, denn s−1 = s und somit gilt S T = S −1 = S für S = E − 2aaT . Eine Drehungen in der Ebene um 0 ∈ R2 wird beschrieben durch eine orthogonale Matrix: cos ϕ − sin ϕ D(ϕ) = , det D(ϕ) = 1. sin ϕ cos ϕ Drehungen um die x, y und z-Achse werden dargestellt durch SO(3) Matrizen 1 0 0 cos β 0 sin β 1 0 D1 (α) = 0 cos α − sin α , D2 (β) = 0 0 sin α cos α − sin β 0 cos β cos γ − sin γ 0 D3 (γ) = sin γ cos γ 0 0 0 1 Die Vorzeichen sind so gewählt, dass ein positiver Winkel zu einer Drehung im Gegenuhrzeigesinn führt wenn man gegen der Achse blickt. Die Drehung im Raum um die Achse parallel zu einem gegebenen Einheitsvektor a ∈ R3 mit Winkel ϕ ist eine orthogonale Abbildung d : R3 → R3 gegeben durch d(x) = (cos ϕ)x + (1 − cos ϕ)(x · a)a + (sin ϕ)a ∧ x. Die zugehörige Matrix ist: 0 −a3 a2 0 −a1 D = (cos ϕ)E + (1 − cos ϕ)aaT + (sin ϕ) a3 | {z } −a2 a1 0 symmetrisch | {z } (5) antisymmetrisch Man kann zeigen, dass D ∈ SO(3) ⇔ D ist Drehmatrix. Somit ist jede jede SO(3) Matrix von der Form (5). Ist D = (dij ) eine gegebene SO(3)-Matrix dann kann man den zugehörige Drehwinkel ϕ und den Vektor a aus den Elementen der Matrix D berechnen. Nach (5) gilt 1 cos ϕ = (SpurD − 1) mit SpurD := d11 + d22 + d33 2 was einen Winkel ϕ ∈ [0, π] festlegt, und der zugehörige Vektor a ist gegeben durch d32 − d23 d a= , mit d := d13 − d31 |d| d21 − d12 falls ϕ 6= π und für ϕ = π kann für a eine normierte Lösung von (D − E)a = 0 gewählt werden. 35 Euler-Winkel Sind b1 , b2 , b3 ∈ R3 orthonormierte Vektoren welche ein Rechtsystem bilden, zum Beispiel bk = Dek wobei D eine Drehmatrix ist, dann sind die Eulerschen Winkel ψ, ϕ, θ definiert 000 000 durch folgende Figur, worin die Achsen x000 1 , x2 , x3 durch die Vektoren b1 , b2 , b3 definiert sind. Es gilt also bk = D3 (ψ)D1 (θ)D3 (ϕ)ek . Jede Drehmatrix D lässt sich somit schreiben als D = D3 (ψ)D1 (θ)D3 (ϕ) . 2.12 Basiswechsel Sei {e1 , . . . , en } die Standardbasis von K n und sei P {b1 , . . . , bn } eine zweite Basis von K n . T Dann lässt sich jeder Vektor x = (x1 , . . . , xn ) = ni=1 xi ei darstellen in der Form x= n X x0k bk , (6) k=1 mit eindeutig bestimmten Koordinaten x0k ∈ K. Der Spaltenvektor x0 := (x01 , . . . , x0n )T heißt Koordinatenvektor von x bezüglich der Basis {b1 , . . . , bn }. Aus (6) folgt, dass x = Bx0 , x0 = B −1 x, B := (b1 , . . . , bn ) P denn nk=1 x0k bk = Bx0 , wenn B die Matrix gebildet aus den Spaltenvektoren b1 , . . . , bn bezeichnet. Bemerkungen: • Im Fall der Standardbasis stimmt der Koordinatenvektor x0 mit dem zugehörigen Vektor x ∈ K n überein. • Bei einem Basiswechsel ändert sich nur der Koordinatenvektor. Der Vektor selbst bleibt unverändet! 36 Die Matrix A einer lineare Abbildung F : K n → K n besteht aus den Spaltenvektoren Ae1 , . . . , Aen . Diese Spaltenvektoren sind Koordinatenvektoren von F (e1 ), . . . , F (en ) bezüglich der Standardbasis. Ist {b1 , . . . , bn } eine beliebige Basis von K n , dann ist die Abbildungsmatrix C von F bezüglich {b1 , . . . , bn } definiert durch C = F (b1 )0 , . . . , F (bn )0 . F (bk )0 = Koordinatenvektor von F (bk ) bezüglich {b1 , . . . , bn }. Satz 2.39. Ist C die Abbildungsmatrix einer linearen Abbildung F : K n → K n bezüglich der Basis {b1 , . . . , bn }, dann gilt F (x)0 = Cx0 , und C = B −1 AB, wobei x0 , F (x)0 Koordinatenvektoren bezüglich der Basis {b1 , . . . , bn } sind, und A die Abbildungsmatrix von F bezüglich der Standardbasis von K n bezeichnet. Zwei n × n-Matrizen A, C heißen ähnlich, wenn es eine invertierbare Matrix B gibt, so dass C = B −1 AB. 2.13 Eigenwerte und Eigenvektoren Eigenwerte und Eigenvektoren Sei A = (aij ) eine komplexe (oder reelle) n×n Matrix. Eine Zahl λ ∈ C heißt Eigenwert von A, wenn es einen Vektor b ∈ Cn , b 6= 0, gibt Ab = λb. Jeder Vektor b 6= 0 der diese Gleichung erfüllt heißt Eigenvektor von A zum Eigenwert λ. Satz 2.40. Eine komplexe Zahl λ ist genau dann ein Eigenwert der n × n Matrix A, wenn det(A − λE) = 0. Zur Berechnung der Eigenwerte von A sind also die Nullstellen des charakteristisches Polynom χA (λ) := det(A − λE) von A zu bestimmen. a b Für eine 2 × 2-Matrix A = gilt c d a−λ b χA (λ) = det = λ2 − (a + d)λ + (ad − bc) c d−λ = λ2 − (SpurA)λ + det A, und allgemein χA (λ) = (−λ)n + (SpurA)(−λ)n−1 + . . . + det A wobei die Spur von A definiert ist durch Spur(A) := a11 + a22 + . . . + ann . 37 (7) Berechnung der Eigenwerte und Eigenvektoren • Nach Satz 1.19 hat χA eine Faktorisierung χA (λ) = (λ1 − λ)m1 · · · (λr − λ)mr . (8) Die Zahlen λ1 . . . , λr sind die Nullstellen von χA und somit die Eigenwerte von A. Die Vielfachheit mi der Nullstelle λi heißt algebraische Vielfachheit des Eigenwerts λi . • Die Eigenvektoren zum Eigenwert λi sind die von Null verschiedenen Lösungen des homogenen linearen Gleichungssystems (A − λi E)x = 0. Der Lösungsraum V (λi ) := Kern(A − λi E) heißt Eigenraum zu λi . dim V (λi ) heißt geometrische Vielfachheit des Eigenwerts λi . Durch Ausmultiplizieren von (8) und Vergleich mit (7) bekommt man SpurA = r X mi λi , det A = i=1 r Y i λm i . i=1 Also gilt: SpurA = Summe der Eigenwerte det A = Produkt der Eigenwerte wenn in der Summe und im Produkt jeder Eigenwert so oft aufgenommen wird wie seine algebraische Vielfachheit angibt. Satz 2.41. Sei A eine komplexe oder reelle n × n-Matrix. (a) Sei b ein Eigenvektor von A mit Eigenwert λ. Dann ist b auch ein Eigenvektor von am Am + . . . + a1 A + a0 E und der zugehörige Eigenwert ist am λm + . . . + a1 λ + a0 . (b) A, AT und B −1 AB haben dasselbe charakteristische Polynom und deshalb auch dieselben Eigenwerte. Ist b ein Eigenvektor von A, dann ist B −1 b eine Eigenvektor von B −1 AB und umgekehrt. (c) A ist genau dann invertierbar wenn 0 keine Eigenwert von A ist. Ist λ ein Eigenwert von A mit Eigenvektor b, dann ist λ−1 eine Eigenvektor von A−1 mit demselben Eigenvektor b. Satz 2.42. Eigenvektoren b1 , . . . , br zu paarweise verschiedenen Eigenwerten λ1 , . . . , λr der Matrix A sind linear unabhängig. 38 Satz 2.43. Sei A eine komplexe oder reelle n × n-Matrix. Falls A n linear unabhängige Eigenvektoren b1 , . . . , bn hat mit nicht notwendig verschiedenen Eigenwerten λ1 , . . . , λn , dann gilt λ1 0 · · · 0 0 λ2 B −1 AB = .. .. , . . . . . 0 · · · λn wobei B = (b1 , . . . , bn ). Anwendung von Satz 2.43: Berechnung von Ak . 2.14 Symmetrische Matrizen und quadratische Formen Theorem 2.44. Für jede symmetrische reelle n × n Matrix A gilt: (a) Alle Eigenwerte sind reell. (b) Eigenvektoren zu verschiedenen Eigenwerten sind orthogonal. (c) Algebraische und geometrische Vielfachheit jedes Eigenwerts stimmen überein. Korollar 2.45. Ist A eine symmetrische reelle n × n-Matrix, dann gibt es eine ONB von Rn bestehend aus Eigenvektoren von A. Nach Korollar 2.45 lässt sich eine symmetrische 3 × 3 Matrix durch eine Drehung des Koordinatensystems diagonalisieren, d.h. auf Diagonalgestalt bringen. Satz 2.46. Zwei symmetrische n×n Matrizen A, C mit AC = CA lassen sich gleichzeitig (orthogonal) diagonalisieren, d.h. es gibt eine ONB {b1 , . . . , bn } von Rn , so dass B −1 AB und B −1 CB Diagonalmatrizen sind wenn B = (b1 , . . . , bn ). Eine quadratische Form q ist eine Abbildung q : Rn → R mit q(x) = xT Ax wobei A eine reelle, symmetrische n × n Matrix ist. q heißt rein quadratisch wenn A eine Diagonalmatrix ist. Bemerkung: • Wenn die Matrix A nicht symmetrisch ist, dann kann man sie ersetzen durch die symmetrische Matrix (A + AT )/2 ohne dass sich dabei die quadratische Form q(x) = xT Ax ändert. • Eine Funktion f : Rn → R deren Graph bei 0 eine horizontale Tangentialeben hat, kann dort durch eine quadratische Form q : Rn → R approximiert werden (HM2). Das Studium von q gibt Aufschluss darüber, ob f bei 0 ein Maximum, ein Minimum oder keines von beidem hat. 39 Basiswechsel. Sei b1 , . . . , bn eine Basis von Rn , B := (b1 , . . . , bn ), und sei x = By, d.h. y1 , . . . , yn sind die Koordinaten von x ∈ Rn bezüglich der neuen Basis. Dann gilt q(x) = xT Ax = (By)T ABy = y T (B T AB)y =: q̃(y). Die quadratische Form q wir also bezüglich der Basis b1 , . . . , bn dargestellt durch die Matrix à = B T AB Bemerkungen: • Die Matrix einer quadratischen Form transformiert sich bei Basiswechsel nicht so wie die Matrix einer linearen Abbildung, ausser B T = B −1 . • Die Matrizen à = B T AB und A haben nicht dieselben Eigenwerte, ausser B T = B −1 , d.h. ausser {b1 , . . . , bn } eine ONB von Rn . Eine ONB {b1 , . . . , bn } heißt Hauptachsensystem von q, wenn q in dieser Basis rein quadratisch ist. Aus Korollar 2.45 folgt Jede quadratische Form hat ein Hauptachsensystem. Bestimmung eines Hauptachsensystems von q(x) = xT Ax: 1. Man bestimme die Eigenwerte λ1 , . . . , λr von A. (i) (i) 2. Zu jedem der verschiedenen Eigenwerte λi bestimmt man eine ONB {b1 , . . . , br } von V (λi ) = Kern(A − λi E). (i) (i) 3. Die Vereingung ∪ri=1 {b1 , . . . , br } der Teilbasen ist ein Hauptachsensystem. Die Signatur einer symmetrischen Matrix A ist die das Zahlentripel (p, q, s) bestehend aus: p = Anzahl positiver Eigenwerte von A, q = Anzahl negativer Eigenwerte von A, s = Vielfachheit des Eigenwerts 0. Satz 2.47 (Trägheitssatz von Sylvester). Ist A eine symmetrische und W eine invertierbare n × n Matrix, dann haben A und W T AW die selbe Signatur Beweis: Siehe Meyberg, Vachenauer Terminologie für quadratische Formen q : Rn → R mit q(x) = xT Ax, bzw. für symmetrische Matrizen A: für alle x 6= 0 gilt q(x) > 0 q(x) ≥ 0 q(x) ≤ 0 q(x) < 0 q(x1 ) > 0, q(x2 ) < 0 40 q bzw. A heißt positiv definit positiv semidefinit negativ semidefinit negativ definit indefinit. Diese Eigenschaften einer symmetrischen Matrix sind unabhängig von der Wahl der Basis, denn es gilt: A ist positiv definit ⇔ W T AW ist positiv definit wenn W eine invertierbare Matrix ist, und analog für positiv semidefinit, negativ semidefinit, etc. Sei A eine symmetrische n × n Matrix und b1 , . . . , bn ein Hauptachsensystem von A, d.h. eine ONB mit Abi = λi bi . Sei B = (b1 , . . . , bn ), dann ist A positiv definit genau dann wenn B T AB positiv definit ist und T T x (B AB)x = n X λi x2i . i=1 Satz 2.48. Für jede symmetrische n × n Matrix A gilt: (i) A ist positiv definit ⇔ alle EW sind > 0, (ii) A ist positiv semidefinit ⇔ alle EW sind ≥ 0, (iii) A ist negativ semidefinit ⇔ alle EW sind ≤ 0, (iv) A ist negativ definit ⇔ alle EW sind < 0, (v) A ist indefinit ⇔ es gibt positive und negative EW. Typische Graphen -1.0 -0.5 0.5 0.0 1.0 2.0 1.5 q(x, y) = x2 + y 2 , positiv definit 1.0 0.5 0.0 -1.0 -0.5 0.0 0.5 1.0 -1.0 -0.5 1.0 0.5 0.0 1.0 0.5 q(x, y) = x2 , positiv semidefinit 0.0 -1.0 -0.5 0.0 0.5 1.0 -1.0 -0.5 0.0 1.0 0.5 1.0 0.5 0.0 -0.5 q(x, y) = x2 − y 2 , indefinit -1.0 -1.0 -0.5 0.0 0.5 1.0 Sei A = (aij ) eine symmetrische n × n Matrix. Dann gilt: A ist positiv definit ⇒ aii > 0, für alle i. Die Positivität der Diagonalelemente aii ist aber nicht hinreichend dafür, dass A positiv definit ist. Folgender Satz gestattet zu prüfen ob eine Matrix positiv definit ist, ohne die Eigenwerte zu berechnen: 41 Satz 2.49 (Jacobi). Eine symmetrische n × n Matrix A = (aij ) ist genau dann positiv definit, wenn die n Hauptuntermatrizen H1 = a11 , a11 . . . a1k a11 a12 .. , . . . , H = A H2 = , . . . , Hk = ... n . a21 a22 ak1 . . . akk positive Determinanten haben. 2.15 Quadriken Transformation von Punktkoordinaten Jeder Punkt X = (x1 , . . . , xn ) ∈ Rn entspricht einem Ortsvektor x = (x1 , . . . , xn )T und umgekehrt. Aber man muss zwischen Koordinaten eines Punktes (oder Ortsvektors) und Koordinaten eines Vektors unterscheiden, da sie sich verschieden verhalten unter Basiswechsel. Ein affines Koordinatensystem K = (P ; b1 , . . . , bn ) von Rn besteht aus einem Punkt P ∈ Rn und einer Basis {b1 , . . . , bn } von Rn (als Vektorraum). Die Koordinaten x01 , . . . , x0n von X ∈ Rn bezüglich K sind bestimmt durch die Gleichung x=p+ n X x0i bi . i=1 P Wir schreiben XK := (x01 , . . . , x0n ) und x0 := ni=1 x0i bi . Ist B = (b1 , . . . , bn ) dann gilt offenbar: x = p + Bx0 , x0 = B −1 (x − p). Quadriken Eine Funktion p : Rn → R der Form p(x) = a0 + aT x + xT Ax = a0 + n X ai x i + i=1 X aij xi xj i,j mit a0 ∈ R, a ∈ Rn und AT = A = (aij ) heißt quadratisches Polynom in den Variablen x1 , . . . , xn . Insbesondere ist jede quadratische Form q(x) = xT Ax ein quadratisches Polynom. Die Menge aller Punkte x = (x1 , . . . , xn ) ∈ Rn , welche eine Gleichung der Form p(x) = xT Ax + aT x + β = 0, erfüllen, nennt man eine Quadrik (oder Hyperfläche zweiter Ordnung). Jede Niveaufläche {x ∈ Rn | p(x) = const} eines quadratischen Polynoms p ist also eine Quadrik. 42 Beispiele von Quadriken in R2 1.0 0.8 2 2 x + 2xy + 3y − 2y − x = 0 0.6 0.4 0.2 -0.4 -0.2 0.2 0.4 0.6 0.8 1.0 -0.2 -0.4 1.0 0.5 2 2 x − 6xy + 9y − 2 = 0 -1.0 -0.5 0.5 1.0 -0.5 -1.0 0.5 1.0 1.5 2.0 -1.5 -2.0 21 y2 + xy + 4x + y − =0 −x + 2 20 2 -2.5 -3.0 Normalform von Quadriken Die Quadrik xT Ax+aT x+β = 0 liegt in Normalform vor, wenn xT Ax rein quadratisch ist, und aT x + β durch keine affine Substitution verkürzt werden kann. Für eine Tabelle von Quadriken in Normalform siehe Meyberg/Vachenauer. Transformation auf Normalform: • Hauptachsentransformation: Bestimmung der Eigenwerte λ1 , . . . , λn von A und einer ONB zugehöriger Eigenvektoren b1 , . . . , bn . Die Quadrikengleichung im Koordinatensystem (0; b1 , . . . , bn ) lautet: λ1 y12 + . . . + λn yn2 + γ1 y1 + . . . + γn yn + β = 0 P wobei γi = bi · a und x = nk=1 yk bk . • Quadratische Ergänzung: Sei λ1 , . . . , λr 6= 0 und λr+1 , . . . , λn = 0. Durch quadratische Ergänzung erhalten wir r r X X 2 λk yk + γk yk + β = λk zk2 + γ k=1 k=1 wobei zk := yk + (γk /2λk ) und γ := b − γk2 k=1 4λk . Pr • Reduktion des linearen Anteils. Falls γk 6= 0 für eine k ≥ r + 1, z.B. γn 6= 0, dann wird γ eliminiert durch γn yn + γ = γn zn mit zn := yn + (γ/γn ). Wir setzen zk := yk für die übrigen k’s und erhalten n X γ alle γk = 0 γk yk + γ = Pn k=r+1 γk zk ein γk 6= 0. k=r+1 Die Normalform wird angenommen im Koordinatensystem (Bu; b1 , . . . , bn ) wobei uk = −γk /2λk , k ≤ r, und für k ≥ r + 1, uk = 0 oder uk = −γ/γk . 43 2.16 PageRank: die Bewertung einer Webpage durch Google Problemstellung: Sei n die Anzahl existierender Webseiten (ein paar Milliarden). Gesucht ist für jede Webpage i ∈ {1, . . . , n} eine Bewertung xi ≥ 0, welche ein Mass für die relative Wichtiggkeit der Seite darstellt. Suchmaschinen benötigen eine solche Bewertung um die gefundenen Webseiten nach Wichtigkeit zu ordnen. 1 es gibt einen Link von Seite j auf die Seite i. 0 sonst. n X nj := Lji = Anzahl Links von Seite j auf andere Seiten, Lji := i=1 n X Lji = Anzahl Links von anderen Seiten auf die Seite i. j=1 Lii := 0. Idee: Die Bewertungen x1 , . . . , xn sollen den Gleichungen n X 1 xi = Lji xj n j j=1 i = 1, . . . , n, (9) genügen. D.h. xi ist groß, wenn viele oder wichtige andere Webseiten einen Link auf die Seite i haben. Dabei ist der Wert eines Links reduziert wenn er von einer Seite mit vielen Links kommt. Gleichung (9) ist äquivalent zum Eigenwertproblem x = Ax, Aij := 1 Lji , nj x := (x1 , . . . , xn )T . (10) Die Matrix A hat die Eigenschaften Aij ≥ 0 und Spaltensumme: n X Aij = 1, für alle j. i=1 Man nennt solche Matrizen stochastisch. Satz 2.50. Sei A eine stochastische Matrix. Dann gilt: (a) Für alle Eigenwerte λ ∈ C von A gilt |λ| ≤ 1. (b) λ = 1 ist ein Eigenwert von A und es gibt einen Eigenvektor x = (x1 , . . . , xn ) mit xi ≥ 0. (c) Wenn Aij > 0Pfür alle i, j, dann hat der Eigenwert 1 die Vielfachheit 1 und für jedes v ∈ Rn , i vi 6= 0, ist der Limes lim Ak v k→∞ ein Eigenvektor von A zum Eigenwert 1. 44 Problem: Die Bedingung Aij > 0 ist nicht erfüllt für die Matrix Aij = Lji /nj . Die Lösung von (10) ist daher in der Regel nicht eindeutig und der Limes in Teil (b) des obigen Satzes braucht nicht zu existieren. Lösung: Die Bedingung an x wir wie folgt modifiziert: e = (1, . . . , 1)T , x = αAx + (1 − α)e, (11) wobei α ∈ (0, 1). In der Praxis wird α = 0.85 gewählt. Jede Webseite hat also ein Gewicht von 0.15 unabhängig von der Linkstruktur des www. Die Lösung des Gleichungssystems (11) ist x = (1 − α)(E − αA)−1 e. (12) Weil die Berechnung der Inversen von E − αA zu aufwending ist berechnet man (12) durch Iteration der Gleichung (11): wenn x(k+1) := αAx(k) + (1 − α)e, dann ist limk→∞ x(k) die Lösung von (11) und zwar unabhängig von der Wahl von x(0) . Also, a PageRank for 26 million web pages can be computed in a few hours on a medium size workstation. (http://infolab.stanford.edu/ backrub/google.html) 3 3.1 Konvergenz und Stetigkeit Zahlenfolgen und Grenzwerte Beispiele von Zahlenfolgen Für n ∈ N sei 1 bn = (−1)n−1 , an := , n Graphische Darstellung (Graphen): ì ì ì 3 ì ì 2 ì ì 1 æ à ì à æ -1 æ à æ æ à æ æ æ 2 4 6 8 à à à à Zahlenfolgen Eine Folge reeller Zahlen ist eine Abbildung N → R, n 7→ an . 45 cn = √ n n! Man schreibt dafür (an )n∈N , (an )n≥1 , (an ), oder a1 , a2 , a3 . . . Die Zahlen an heißen Glieder der Folge. Eine Folge braucht nicht mit a1 zu beginnen; z.B. nennt man auch a5 , a6 , a7 , . . . eine Folge, da man durch die Umnumerierung der Glieder bn := an+4 , n ≥ 1, eine Folge in obigem Sinn definieren kann. Eine Folge heißt beschränkt, wenn es eine Zahl K gibt, mit |an | ≤ K für alle n ∈ N. Folgen und Flächenberechnung 1.0 1.0 1.0 1.0 0.8 0.8 0.8 0.8 0.6 0.6 0.6 0.6 0.4 0.4 0.4 0.4 0.2 0.2 0.2 0.2 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 a1 = 0.433013, 1.0 0.2 0.4 0.6 0.8 a2 = 0.623927, 1.0 a3 = 0.709955. an = Gesamtfläche der 2n − 1 Rechtecke unterhalb des Viertelskreises. Je größer n ist, desto besser wird die Fläche des Viertelskreises durch an approximiert. Wir werden später sehen, das π (n → ∞). an → = 0.785398 . . . , 4 Konvergenz Eine Folgen (an ) konvergiert (oder strebt) gegen die Zahl a, in Zeichen lim an = a, n→∞ oder an → a, (n → ∞), falls es zu jeder noch so kleinen Zahl ε > 0 einen Indexwert n0 ∈ N gibt, so dass n ≥ n0 ⇒ |an − a| < ε. Die Zahl a heißt Grenzwert der Folge (an ). Eine Folge heißt konvergent wenn sie einen Grenzwert hat, sonst heißt sie divergent. Eine Folge mit Grenzwert 0 heißt Nullfolge. Wichtigstes Beispiel: 1 = 0. n→∞ n lim 46 Illustrationen von Konvergenz und Divergenz 1.6 1.4 æ æ æ 1.2 æ 1.0 æ 0.8 æ æ æ æ æ æ æ æ æ æ æ æ æ æ æ æ 0.6 5 æ 10 15 20 25 æ lim n→∞ 2.0 1.5 1.0 0.5 -0.5 -1.0 -1.5 æ æ æ æ æ 5 æ æ æ æ æ 10 æ æ æ æ æ 15 æ æ æ 20 sin(n) 1+ n2 æ æ = 1. æ 20 æ 25 æ æ æ Die Folge an = (−1)n hat weder den Grenzwert 1 (siehe Figur) noch irgend einen anderen Grenzwert. Sie ist daher divergent. Satz 3.1. (a) Der Grenzwert einer konvergenten Folge ist eindeutig: falls limn→∞ an = a und limn→∞ an = b dann gilt a = b. (b) Jede konvergente Folge ist beschränkt. Korollar 3.2. Ist die Folge (an ) unbeschränkt, dann ist sie divergent. Die Folge (an ) divergiert gegen ∞ (oder strebt gegen ∞), in Zeichen lim an = ∞ oder an → ∞, n→∞ (n → ∞) falls zu jeder noch so großen Zahl K ∈ R eine Indexwert n0 ∈ N existiert, so dass n ≥ n0 ⇒ an > K. Divergenz gegen −∞ ist analog definiert. Geometrische Folge und geometrische Reihe Für jede reelle Zahl x gilt: x > 1, ∞ n 0 −1 < x < 1, lim x = n→∞ unbestimmt x ≤ −1. (13) Für jede reelle Zahl x 6= 1 gilt 1 − xn+1 . (14) 1−x Die Folge (14) heißt geometrische Reihe. Sie ist konvergent für |x| < 1 und divergent für |x| ≥ 1. Nach (13) gilt ∞ X 1 xk := lim (1 + x + x2 + . . . + xn ) = , |x| < 1. n→∞ 1 − x k=0 sn := 1 + x + x2 + . . . + xn = 47 Teilfolgen und Häufungspunkte Ist (an )n≥1 eine Folge und n1 < n2 < n3 , . . . eine aufsteigende Indexfolge, dann heißt die Folge an1 , an2 , an3 , . . . Teilfolge der Folge (an ). Satz 3.3. Hat die Folge (an ) den Grenzwert a, dann konvergiert auch jede Teilfolge von (an ) gegen a. Eine Zahl a ∈ R heißt Häufungspunkt der Folge (an ), wenn eine Teilfolge existiert, welche gegen a konvergiert. Insbesondere ist der Grenzwert einer Folge auch ein Häufungspunkt. Konvergenzkriterien und Rechenregeln Satz 3.4 (Vergleichskriterien). dann gilt (a) Falls |an | ≤ bn für alle n ≥ n1 und limn→∞ bn = 0, lim an = 0 n→∞ (b) Falls an ≤ bn ≤ cn für n ≥ n1 und limn→∞ an = L = limn→∞ cn , dann gilt lim bn = L. n→∞ (c) Falls limn→∞ an = a, limn→∞ bn = b, und an ≤ bn für alle n ≥ n1 , dann gilt - a ≤ b. æ Bemerkung: Wenn an < bn für alle n ≥ n1 in Teil (c), dann folgt trotzdem nur a ≤ b. Das sieht man am Beispiel an = 0, bn = 1/n. æ 1.5 - 1.0 0.5 0.0 - - - æ æ - - - - æ æ æ - - - - æ æ æ - - - æ æ æ æ æ æ æ æ - - - - æ æ æ æ - - - - - æ æ - - - - - - æ 5 10 - − Satz 3.5. (a) limn→∞ an = a 15 1 1 + 2 sin(n) 3 ≤ ≤ . n n n ⇒ limn→∞ |an | = |a|. √ √ ⇒ limn→∞ an = a. (b) an ≥ 0 und limn→∞ an = a √ (c) limn→∞ n a = 1 für alle a > 0. √ (d) limn→∞ n n = 1. 48 20 25 Satz 3.6 (Rechenregeln). Seien (an ) und (bn ) konvergente Folgen mit limn→∞ an = a und limn→∞ bn = b. Dann gilt (a) limn→∞ (an + bn ) = a + b. (b) limn→∞ (an bn ) = ab. (c) Falls b 6= 0, dann gibt es ein n1 mit bn 6= 0 für n ≥ n1 und an a = . n→∞ bn b lim Monotone Folgen Eine Folge (an )n≥1 heißt monoton wachsend, wenn an ≤ an+1 , für alle n ≥ 1. Sie heißt monoton fallend wenn an ≥ an+1 für alle n ≥ 1. Theorem 3.7. Jede beschränkte monotone Folge ist konvergent. Die Eulersche Zahl ∞ X 1 = 2, 71828 . . . e := k! k=0 ist der Grenzwert der beschränkten, monoton wachsenden Folge sn = Pn 1 k=0 k! . Lemma 3.8 (Bernoullische Ungleichung). Für alle n ∈ N und alle x ≥ −1 gilt: (1 + x)n ≥ 1 + nx. Illustration für n = 2 und n = 3: 2.0 2.0 1.5 1.5 1.0 1.0 0.5 -2.0 -1.5 -1.0 -0.5 0.5 0.5 1.0 -2.0 -1.5 -1.0 -0.5 0.5 -0.5 -0.5 -1.0 -1.0 1.0 Satz 3.9. Die Folge (1 + n1 )n ist monoton wachsend, beschränkt und lim n→∞ 1 1+ n n X 1 = e. n→∞ k! k=0 n = lim Satz 3.10. Für alle x ∈ R existiert der Limes x n exp(x) := lim 1 + n→∞ n und es gilt exp(0) = 1, exp(x) > 0 und exp(−x) = 1/ exp(x). 49 Satz 3.11. Für alle x ∈ R und alle rationalen Zahlen r ∈ Q gilt exp(xr) = exp(x)r . Für rationale Zahlen r gilt nach Satz 3.9 und Satz 3.11, exp(r) = exp(1)r = er . Man definiert daher für alle x ∈ R: ex := exp(x). Graph der Exponentialfunktion 3.0 2.5 2.0 1.5 1.0 0.5 -4 -3 -2 -1 0 1 2 Zinseszins Ein Guthaben a > 0 wird für ein Jahr zum Zinssatz r ∈ (0, 1), also 100r Prozent, angelegt. Das Endguthaben hängt davon ab, wie oft Zins ausgeschüttet wird: Zinsausschüttung jährlich monatlich täglich jede Stunde jede Sekunde kontinuierlich Endbetrag a(1 + r) r 12 ) a(1 + 12 r 365 a(1 + 365 ) r a(1 + 8760 )8760 r a(1 + 31536000 )31536000 limn→∞ a(1 + nr )n = aer Da die Folge (1 + nr )n monoton wachsend ist, ist der Endbetrag umso größer, je öfter Zins ausgeschüttet wird. Wurzelberechnung Satz 3.12. Sei b > 0, a0 > 0, und sei an+1 1 = 2 b an + an Dann gilt a1 ≥ a2 ≥ a3 ≥ . . . und √ lim an = n→∞ 50 b. . Zur Berechnung von √ 3 wählen wir x0 = 2 und und erhalten: x1 x2 x3 x4 = = = = 1.75 1.7321... 1.732050810 1.732050808 Limes superior und Limes inferior Sei (an ) eine Folge reeller Zahlen. Dann ist bn := sup ak = sup{ak | k ≥ n} k≥n offensichtlich eine monoton fallende Folge. Wenn sie beschränkt ist, dann ist sie konvergent. Sonst ist entweder bn = ∞ für alle n, oder limn→∞ bn = −∞. In jedem Fall ist also der Limes superior lim sup an := lim sup ak . n→∞ n→∞ k≥n wohldefiniert. Die Folge bn := inf k≥n ak = inf{ak | k ≥ n} ist monoton wachsend. Also existiert auch der Limes inferior lim inf an := lim inf ak . n→∞ n→∞ k≥n • Im allgemeinen gilt lim inf n→∞ an ≤ lim supn→∞ an . Für eine beschränkte Folge gilt lim inf an = kleinster Häufungspunkt von (an ), n→∞ lim sup an = größter Häufungspunkt von (an ). n→∞ • Eine Folge (an ) ist genau dann konvergent, wenn sie beschränkt ist und lim inf an = lim sup an , n→∞ (15) n→∞ und dann ist (15) der Grenzwert der Folge. • Jede beschränkte Folge (an ) hat eine konvergente Teilfolge. Z.B. die Teilfolge welche gegen den Häufungspunkt lim supn→∞ an konvergiert. (Satz von Bolzano - Weierstraß.) 51 Das Cauchy-Kriterium Eine Folge (an ) heißt Cauchy-Folge, wenn zu jedem ε > 0 ein Indexwert n0 ∈ N existiert, so dass n, m ≥ n0 ⇒ |an − am | < ε. Theorem 3.13. Eine Folge reeller Zahlen ist genau dann konvergent, wenn sie eine Cauchy-Folge ist. Beweisidee: Mit Hilfe der Dreiecksungleichung ist es leicht zu zeigen, dass eine konvergente Folge das Cauchy-Kriterium erfüllt, und dass jede Cauchy-Folge beschränkt ist (Übung). Für eine Cauchy-Folge (an ) sind somit lim inf n→∞ an und lim supn→∞ an endlich und, wegen dem Cauchy-Kriterium, sogar gleich. Also ist jede Cauchy-Folge konvergent. Bestimmte Divergenz und Konsequenzen (a) Wenn limn→∞ an = ∞ und (bn ) beschränkt ist, dann gilt Satz 3.14. bn = 0. n→∞ an lim (an + bn ) = ∞, lim n→∞ (b) Wenn limn→∞ an = 0, an > 0 und limn→∞ bn = b 6= 0, dann gilt bn =∞ n→∞ an bn = −∞ lim n→∞ an lim 3.2 b>0 b < 0. Grenzwerte von Funktionen Beispiele 1.5 1.0 0.5 -2 -1 1 2 1 2 lim (x3 − x) = 0 x→0 -0.5 -1.0 -1.5 1.5 1.0 0.5 -2 -1 lim f (x) = −1, x→0+ -0.5 lim f (x) = 1 -1.0 x→0− -1.5 1.5 1.0 0.5 -1.0 -0.5 0.5 lim sin(1/x) existiert nicht 1.0 -0.5 x→0 -1.0 -1.5 52 Eine Funktion f hat für x gegen a ≥ −∞ den rechtsseitigen Grenzwert c, in Zeichen: lim f (x) = c oder f (x) → c für x → a+, (16) x→a+ wenn xn → a, (n → ∞) xn > a ⇒ lim f (xn ) = c. n→∞ Dazu braucht f nur für a < x < a + ε definiert zu sein. Auch wenn f in a definiert ist, ist der Wert f (a) irrelevant für (16). Der linksseitige Grenzwert limx→a− f (x) = c ist analog definiert. Die Funktion f hat für x gegen a den Grenzwert c, in Zeichen: lim f (x) = c oder f (x) → c, x → a, x→a wenn limx→a+ f (x) = c = limx→a− f (x). Aus Satz 3.4 folgt: Satz 3.15 (Vergleichskriterien). (a) Wenn |f (x)| ≤ p(x) für x nahe a und limx→a p(x) = 0, dann gilt limx→a f (x) = 0. (b) Wenn f (x) ≤ g(x) ≤ h(x) für x nahe a und limx→a f (x) = c = limx→a h(x), dann gilt limx→a g(x) = c. (c) Wenn f (x) ≤ g(x) für x nahe a, limx→a f (x) = c und limx→a g(x) = d, dann gilt c ≤ d. Diese Aussagen gelten auch für einseitige Grenzwerte und wenn a = ±∞. 0.4 0.2 0.1 0.2 0.3 0.4 lim x sin 0.5 1 x→0 x = 0. -0.2 -0.4 Wichtige Beispiele: lim cos x = 1, x→0 lim sin x = 0, (17) sin x = 1. x→0 x (18) x→0 cos x − 1 = 0, x→0 x lim lim 1.5 1.0 0.5 -15 -10 -5 5 -0.5 -1.0 Graph von (sin x)/x 53 10 15 Aus Satz 3.6 folgt: Satz 3.16 (Rechenregeln). Aus limx→a f (x) = c und limx→a g(x) = d mit c, d ∈ R folgt (a) limx→a [f (x) + g(x)] = c + d (b) limx→a f (x)g(x) = cd (c) Falls d 6= 0, dann f (x) c = . x→a g(x) d lim Diese Aussagen gelten auch für einseitige Grenzwerte und wenn a = ±∞. Eine Funktion heißt monoton wachsend, wenn x1 < x2 ⇒ f (x1 ) ≤ f (x2 ). f heißt streng monoton wachsend, wenn x1 < x2 ⇒ f (x1 ) < f (x2 ). Monoton fallend und streng monoton fallend sind analog definiert. Eine Funktion heißt monoton, wenn sie entweder monoton wachsend oder monoton fallend ist. Satz 3.17 (Monotoniekriterium). Ist f : (a, b) → R monoton und beschränkt, dann existieren die einseitigen Grenzwerte f (a+) = lim f (x), f (b−) = lim f (x). x→a+ 3.3 x→b− Stetigkeit Sei I ⊂ R ein Intervall. Eine Funktion f : I → R heißt stetig in x0 ∈ I, wenn lim f (x) = f (x0 ). x→x0 Ist x0 ein Randpunkt von I, dann ist limx→x0 f (x) als einseitiger Grenzwert zu verstehen. Die Funktion f ist stetig auf I, wenn sie in jedem Punkt x0 ∈ I stetig ist. Eine Funktion heißt stetig, wenn sie auf ihrem Definitionsbereich stetig ist. Beispiele stetiger Funktionen von x: 1 , x |x|, xn , √ x. sin x, cos x. Die Stetigkeit dieser Funktionen folgt aus Satz 3.5, Satz 3.6 und (17). 54 Klassifikation von Unstetigkeiten f (x0 −) = f (x0 +) 6= f (x0 ) f (x0 −) 6= f (x0 +) (Sprungstelle) f (x0 −) oder f (x0 +) existiert nicht. (Unstetigkeit zweiter Art.) Satz 3.18. Sei I ⊂ R ein Intervall. (a) Sind f, g stetig auf I, dann auch f + g, αf (α ∈ R) und f g. Die Funktion f /g ist stetig auf {x ∈ I : g(x) 6= 0}. (b) Sind f : I → R und g : D → R stetig, wobei g(D) ⊂ I, dann ist auch die Komposition h : D → R, h(x) = f (g(x)) auf D stetig. Satz 3.18 (a) folgt aus Satz 3.16. Korollar 3.19. (a) Jedes Polynom p(x) = an xn + . . . + a1 x + a0 ist auf ganz R stetig. (b) Jede rationale Funktion p/q ist stetig in allen x ∈ R mit q(x) 6= 0. Theorem 3.20. Für jede auf einem abgeschlossenen, beschränkten Intervall [a, b] ⊂ R stetige Funktion f gilt: (a) Beschränktheit. Es gibt eine Schranke K mit |f (x)| ≤ K für alle x ∈ [a, b]. (b) Maximum und Minimum werden angenommen. Es gibt stets Punkte x0 , x1 ∈ [a, b] mit f (x0 ) ≤ f (x) ≤ f (x1 ), alle x ∈ [a, b]. (c) Zwischenwertsatz. Wenn f (x0 ) < c < f (x1 ) dann gibt es einen Punkt x̄ ∈ [a, b] mit f (x̄) = c. (d) Gleichmäßige Stetigkeit. Zu jedem ε > 0 gibt es ein δ > 0, so dass |x − x0 | < δ ⇒ 55 |f (x) − f (x0 )| < ε. Gegenbeispiele 10 8 Die Funktion f : (0, 1) → R, f (x) = 1/x, ist stetig aber sie hat keine der Eigenschaften (a),(b),(d) aus dem Theorem. Grund: (0, 1) ist nicht abgeschlossen. 6 4 2 0.0 0.2 0.4 0.6 0.8 1.0 1.0 0.8 Die Funktion f : [1, ∞) → R, f (x) = 1/x, ist stetig aber sie nimmt kein Minimum an. Grund: [1, ∞) ist unbeschränkt. 0.6 0.4 0.2 2 4 6 8 10 Die Funktion f : [−1, 1] → R mit −1, −1 ≤ x ≤ 0 f (x) = 1 , 0<x≤1 x 4 3 2 1 -1.0 -0.5 0.5 1.0 hat keine der Eigenschaften (a)-(d) aus Theorem 3.20. Grund: sie ist nicht stetig. Aus dem Zwischenwertsatz und der Stetigkeit von Polynomen folgt: -1 Satz 3.21. (a) Ist f : [a, b] → R stetig und haben f (a) und f (b) entgegengesetzte Vorzeichen, dann hat f mindestens eine Nullstelle x̄ ∈ (a, b). D.h. a < x̄ < b und f (x̄) = 0. (b) Jedes Polynom mit ungeradem Grad n ≥ 1 hat mindestens eine reelle Nullstelle. Nullstellenbestimmung: Sei f (a) < 0 < f (b). Definiere rekursiv Intervalle [an , bn ] durch [a0 , b0 ] = [a, b] und an + b n an + b n ) ≤ 0 dann an+1 := , bn+1 := bn , 2 2 an + b n an + b n wenn f ( ) > 0 dann bn+1 := , an+1 := an . 2 2 wenn f ( x̄ = limn→∞ an = limn→∞ bn ist eine Nullstelle von f . 56 4 4.1 Differentialrechnung Die Ableitung Vorbemerkungen Im folgenden ist es wichtig zu unterscheiden zwischen einer Funktion f : I → R und dem Funktionswert f (x): f ist die Funktion, f (x) ist der Wert der Funktion an der Stelle x, wobei x ∈ I fest aber beliebig ist, sofern nichts anderes gesagt wird. Mit der Sprechweise “die Funktion 1/x” meint man “die Funktion f gegeben durch f (x) = 1/x”.– Addition, Multiplikation und Division von zwei Funktionen f, g : I → R sind punktweise definiert. D.h. (f + g)(x) := f (x) + g(x) (f g)(x) := f (x)g(x) f (x) f (x) := g g(x) wobei f /g den Definitionsbereich {x ∈ I | g(x) 6= 0} hat. Die Ableitung Sei I ⊂ R ein Interval und sei x0 ∈ I. Eine Funktion f : I → R heißt in x0 differenzierbar, wenn der Grenzwert f (x) − f (x0 ) f (x0 + h) − f (x0 ) = lim x→x h→0 h x − x0 0 lim existiert und endlich ist. Dieser Grenzwert heißt Ableitung von f an der Stelle x0 und wird mit df (x0 ) f 0 (x0 ) oder dx bezeichnet. Die Funktion f ist auf I differenzierbar, wenn f in jedem Punkt von I differenzierbar ist. In diesem Fall wird durch x 7→ f 0 (x) eine neuen Funktion erklärt, welche mit df f 0 oder dx bezeichnet wird, und Ableitung von f heißt. Geometrische Interpretation der Ableitung f (x) − f (x0 ) = x − x0 0 f (x0 ) = Steigung der Sekante durch (x0 , f (x0 )) und (x, f (x)) Steigung der Tangente an den Graphen von f im Punkt (x0 , f (x0 )). 57 Gleichung der Tangente durch (x0 , f (x0 )): Tangente fHxL y = f (x0 ) + f 0 (x0 )(x − x0 ) fHx0 L Sekante x0 x Physikalische Interpretation der Ableitung Sei s(t) ∈ R die Position eines Teilchens zur Zeit t. Dann ist ṡ(t0 ) := ds s(t) − s(t0 ) (t0 ) = lim t→t0 dt t − t0 = Geschwindigkeit zur Zeit t0 . Wird das Argument eine Funktion f nicht mit x, sondern mit t bezeichnet, dann schreibt man oft f˙ statt f 0 für die Ableitung. Beispiel: g s(t) = v0 t − t2 ⇒ ṡ(t) = v0 − gt 2 Hier ist s(t) die Höhe eines Steins über Boden, wenn er zur Zeit t = 0 mit Geschwindigkeit v0 von der Höhe 0 aufgeworfen wird. g = 9.81m/s2 . Analytische Interpretation der Ableitung Wenn f in x0 differenzierbar ist, dann gilt f (x0 + h) = f (x0 ) + f 0 (x0 )h + R(h) wobei f (x0 + h) − f (x0 ) R(h) = − f 0 (x0 ) −→ 0, h h Also ist R(h) klein im Vergleich zu |h|, wenn |h| klein ist. In diesem Sinn gilt: f (x0 + h) ≈ f (x0 ) + f 0 (x0 )h, (h → 0). |h| klein Umgekehrt, wenn f (x0 + h) = f (x0 ) + mh + R(h) wobei m ∈ R und R(h)/h → 0 für h → 0, dann ist f in x0 differenzierbar mit Ableitung m. 58 Das Differential fHx0 +hL df=f'Hx0 Lh fHx0 L Df x0 x0 +h dx = ∆x = x − x0 = h ∆f = f (x) − f (x0 ) df = f 0 (x)h Zuwachs des Arguments tatsächlicher Zuwachs von f lineare Approximation des Zuwachses von f. Somit gilt: df = f 0 (x0 )dx. Die lineare Abbildung df : h 7→ f 0 (x0 )h heißt Differential von f an der Stelle x0 . Satz 4.1. Ist f : I → R ein x0 ∈ I differenzierbar, dann ist f dort auch stetig. Satz 4.2. Sind f, g : I → R differenzierbar und c ∈ R, dann sind auch f + g, cf , f g und f /g differenzierbar, und es gilt (a) (b) (c) (d) (f + g)0 (cf )0 (f g)0 0 f g = f 0 + g0 = cf 0 = f 0g + f g0 f 0g − f g0 , = g2 0 1 g0 = − 2. g g Ist nur bekannt, dass f, g in x0 ∈ I differenzierbar sind, dann sind f + g, f g und, falls g(x0 ) 6= 0, f /g an der Stelle x0 differenzierbar und es gelten (a)–(d) an der Stelle x0 . Korollar 4.3. Jedes Polynom und jede rationale Funktion ist differenzierbar und d (an xn + . . . + a1 x + a0 ) = nan xn−1 + . . . + a1 , dx d 1 n ( n ) = − n+1 , n ∈ N. dx x x Satz 4.4. sin, cos, tan, cot sind differenzierbar und sin0 x = cos x, 1 tan0 x = , (cos x)2 cos0 x = − sin x, 1 cot0 x = − , (sin x)2 59 Lemma 4.5. Für alle x < 1 gilt 1 + x ≤ ex ≤ 1 . 1−x H1-xL-1 1+x Theorem 4.6. Die Exponentialfunktion ist differenzierbar, es gilt ex+y = ex ey für alle x, y ∈ R und d x e = ex . dx Satz 4.7 (Kettenregel). Die Komposition f ◦ g : x 7→ f (g(x)) von zwei differenzierbaren Funktionen f und g ist ebenfalls differenzierbar und d f (g(x)) = f 0 (g(x))g 0 (x). dx (19) Folgerungen: • d f (g(x)) dx 6= f 0 (g(x)), ausser wenn g 0 (x) = 1, und somit auch d df f (g(x)) 6= (g(x)). dx dx • Sind f, g und h differenzierbar, dann auch x 7→ f (g(h(x))) und d d f (g(h(x))) = f 0 (g(h(x))) g(h(x)) = f 0 (g(h(x)))g 0 (h(x))h0 (x). dx dx Höhere Ableitungen Seien f : I → R und f 0 : I → R differenzierbar. Die Ableitung (f 0 )0 der Ableitung f 0 heißt zweite Ableitung von f und wird mit f 00 , f (2) oder d2 f d d := f dx2 dx dx bezeichnet. Die n-te Ableitung ist rekursiv definiert durch: f (0) := f, f (n) := dn f d := f (n−1) n dx dx Die Funktion f heißt n Mal differenzierbar, wenn alle Ableitungen von f bis zur n-ten Ableitung, f (n) , existieren. Die Funktion f heißt n Mal stetig differenzierbar, wenn sie n Mal differenzierbar ist und f (n) noch stetig ist. 60 Satz 4.8 (Leibnizsche Regel). Sind f, g : I → R n Mal differenzierbar, dann ist auch f g n Mal differenzierbar und es gilt (f g) (n) n X n (k) (n−k) = f g . k k=0 Beispiel: (f g)0 = f 0 g + f g 0 (f g)00 = f 00 g + 2f 0 g 0 + f g 00 (f g)000 = f 000 g + 3f 00 g 0 + 3f 0 g 00 + f g 000 . 4.2 Der Mittelwertsatz und Anwendungen der Differentialrechnung Maxima und Minima einer Funktion Die Zahl f (a) heißt globales Maximum von f : D → R, wenn f (x) ≤ f (a) für alle x ∈ D. Dann ist a ∈ D eine globale Maximalstelle. (Statt “global” sagt man auch “absolut”.) Die Zahl f (a) heißt lokales Maximum von f , wenn es ein δ > 0 gibt, so dass f (x) ≤ f (a) für x ∈ D, |x − a| < δ. Globales und lokales Minimum sind analog definiert. Extremum ist der gemeinsame Oberbegriff für Maximum und Minimum. Ein Punkt x0 ∈ D heißt stationärer Punkt (oder kritischer Punkt) von f , wenn f 0 (x0 ) = 0. x0 x1 x2 x3 61 x4 x5 x6 f (x1 ) f (x5 ) f (x1 ), f (x2 ), f (x4 ), f (x6 ) f (x0 ), f (x3 ), f (x5 ) x2 , x 3 , x 4 , x 5 = = = = = globales Minimum, globales Maximum, lokale Minima, lokale Maxima, stationäre Punkte. Satz 4.9. Sei f : (a, b) → R differenzierbar und a < x0 < b. Dann gilt: x0 ist lokale Extremstelle ⇒ f 0 (x0 ) = 0. Umgekehrt braucht ein stationärer Punkt keine Extremstelle zu sein. Z.B. ist x = 0 ist ein stationärer Punkt von f (x) = x3 aber keine lokale Extremstelle. Kandidaten für Extremstellen von f : I → R sind: (a) Die Randpunkte von I, (b) Die Punkte von I, wo f nicht differenzierbar ist, (c) die stationären Punkte aus dem Inneren von I. Der Mittelwertsatz Theorem 4.10 (Mittelwertsatz). Sei f : [a, b] → R stetig und in (a, b) differenzierbar. Dann gibt es einen inneren Punkt x0 ∈ (a, b) mit f (b) − f (a) = f 0 (x0 ). b−a a x0 b 62 Satz 4.11. Sei I ein Intervall und sei f : I → R differenzierbar. Dann gilt: f0 f0 f0 f0 f0 =0 ≥0 ≤0 >0 <0 ⇔ ⇔ ⇔ ⇒ ⇒ f f f f f ist ist ist ist ist konstant, monoton wachsend, monoton fallend, streng monoton wachsend, streng monoton fallend. Mit f 0 = 0 ist gemeint, dass f 0 (x) = 0 für alle x ∈ I, f 0 ≥ 0 bedeutet f 0 (x) ≥ 0 für alle x ∈ I, etc. • In den letzten beiden Aussagen ist die Umkehrung “⇐” im allgemeinen falsch. Das sieht man am Beispiel der Funktionen f (x) = ±x3 . Sie sind streng monoton obwohl f 0 (0) = 0. • Alle Aussagen sind falsch wenn I kein Intervall ist. Korollar 4.12. Ist I ein Interval und sind f, g : I → R differenzierbar, dann gilt: (a) f 0 = g 0 auf I ⇔ f = g + c wobei c eine Konstante ist. (b) f (n) = 0 ⇔ f ist ein Polynom vom Grad n − 1 oder kleiner. Theorem 4.13. Ist f : R → R differenzierbar, dann gilt f0 = f ⇒ f (x) = cex wobei c = f (0). Satz 4.14. Sei f : (a, b) → R differenzierbar, x0 ∈ (a, b) und f 0 (x0 ) = 0. Falls es ein δ > 0 gibt, so dass f 0 (x) < 0, f 0 (x) > 0, x0 − δ < x < x0 , x0 < x < x0 + δ, f'<0 dann hat f in x0 ein lokales Minimum. Eine analoge Aussage gilt über lokale Maxima. f'>0 x0 Satz 4.15. Sei f : (a, b) → R zwei Mal stetig differenzierbar und f 0 (x0 ) = 0. Dann gilt f 00 (x0 ) > 0 ⇒ f hat in x0 ein lokales Minimum, f 00 (x0 ) < 0 ⇒ f hat in x0 ein lokales Maximum. Satz 4.16 (Verallgemeinerter Mittelwertsatz). Seien f, g : [a, b] → R stetig und in (a, b) differenzierbar. Falls g 0 (x) 6= 0 für alle x ∈ I, dann gibt es einen Punkt t ∈ (a, b) mit f (b) − f (a) f 0 (t) = 0 . g(b) − g(a) g (t) 63 Theorem 4.17 (de l’Hospitalsche Regel). Seien f, g : (a, b) → R differenzierbar, b ≤ ∞, g 0 (x) 6= 0 für alle x ∈ (a, b) und zusätzlich (a) f (x) → 0, g(x) → 0 für x → b−, oder f (x) → ∞, g(x) → ∞ für x → b−, (b) limx→b− f 0 (x)/g 0 (x) existiert oder ist in {±∞}. Dann gilt: f (x) f 0 (x) = lim 0 . x→b− g(x) x→b− g (x) lim Das Newton-Verfahren xn+1 = xn − f (xn ) f 0 (xn ) x* x2 x1 x0 Ist x0 nahe genug an einer Nullstelle x∗ von f , dann xn → x∗ , (n → ∞) in vielen Fällen. Z.B. wenn f zwei Mal stetig differenzierbar ist und f 0 (x∗ ) 6= 0 (siehe Thm. 4.18). Wenn zusätzlich a ≤ xn ≤ b für alle n ≥ 0, dann gilt ∗ ∗ 2 |xn+1 − x | ≤ M |xn − x | , maxx∈[a,b] |f 00 (x)| . M := minx∈[a,b] |f 0 (x)| D.h. die Anzahl der richtigen Nachkommastellen verdoppelt sich in jedem Schritt, wenn x0 nahe genug bei x∗ ist. Fixpunkte Ein Punkt x∗ ∈ R heißt Fixpunkt der Abbildung f wenn f (x∗ ) = x∗ . Das Problem einen Fixpunkt zu finden ist äquivalent zum Problem eine Nullstelle zu finden denn: x ist Fixpunkt von f ⇔ x ist Nullstelle von f (x) − x, x ist Nullstelle von f ⇔ x ist Fixpunkt von f (x) + x. Eine Funktion f : [a, b] → [a, b] hat mindestens einen Fixpunkt wenn sie stetig ist (Aufgabe 70), und genau einen Fixpunkt wenn sie differenzierbar ist mit |f 0 (x)| < 1 für alle x, Theorem 4.18 64 Theorem 4.18. Ist f : [a, b] → [a, b] differenzierbar mit |f 0 (x)| ≤ K < 1 für alle x ∈ [a, b]. Dann gilt: Existenz Es gibt genau ein x∗ ∈ [a, b] mit f (x∗ ) = x∗ . Berechnung Die Iterationsfolge xn+1 = f (xn ) konvergiert gegen den Fixpunkt x∗ und zwar für jede Wahl des Startwerts x0 ∈ [a, b]. Abschätzung Für alle n ∈ N gilt |xn − x∗ | ≤ K |xn − xn−1 |. 1−K Definition von π Von einem analytischen Standpunkt ist es bequem π/2 als erste positive Nullstelle der Cosinusfunktion zu definieren wobei cos x definiert wird durch cos x = 1 − x2 x4 + − ... 2! 4! (siehe HM2). π/2 ist also ein Fixpunkt der Abbildung x 7→ x + cos x. Die Fixpunktiteration xn+1 = xn + cos xn mit Startwert x0 = 1.5 liefert x1 , x2 , x3 , . . . wobei: 2x1 = 3.141(474403335406), 2x2 = 3.1415926535897(24), 2x3 = 3.141592653589793. (falsche Nachkommastellen sind in Klammern.) 4.3 Umkehrfunktionen Ist f : D → R injektiv, dann sagt man auch f sei invertierbar oder umkehrbar, denn f : D → f (D) ist dann bijektiv. Somit existiert eine Umkehrfunktion g : f (D) → D mit f (x) = y ⇔ g(y) = x. Also gilt g(f (x)) = x für alle x ∈ D, f (g(y)) = y für alle y ∈ f (D), 65 f -1 Man bezeichnet die Umkehrfunktion einer Funktion f meist mit f −1 . Der Graph von f −1 ist die Spiegelung des Graphen von f an der Geraden y = x. f Satz 4.19. (a) Jede streng monotone Funktion f : D → R ist invertierbar. Jede differenzierbare Funktion f : I → R, I ein Intervall, mit f 0 (x) 6= 0 für alle x ∈ I, ist invertierbar. (b) Die Umkehrfunktion f −1 einer differenzierbaren Funktion f : I → R ist in einem Punkt y = f (x) genau dann differenzierbar, wenn f 0 (x) 6= 0, und dann gilt (f −1 )0 (y) = 1 f 0 (x) = 1 f 0 (f −1 (y)) . Arcussinus 1 - Die Sinusfunktion ist auf [−π/2, π/2] streng monoton wachsend und sin([−π/2, π/2]) = [−1, 1]. Π 2 Π 2 -1 Die Umkehrfunktion von sin [−π/2, π/2] heißt ArcussinusFunktion. Es gilt arcsin : [−1, 1] → [−π/2, π/2] π π y = arcsin x ⇔ x = sin y, − ≤ y ≤ 2 2 Π 2 -1 1 Arcussinus ist differenzierbar in (−1, 1) und d 1 arcsin x = √ , dx 1 − x2 −1 < x < 1. - Π 2 Arcuscosinus 1 Π Die Cosinusfunktion ist z.B. auf [0, π] streng monoton fallend und cos([0, π]) = [−1, 1]. -1 66 Die Umkehrfunktion von cos [0, π] heißt Arcuscosinus-Funktion. Es gilt Π arccos : [−1, 1] → [0, π] y = arccos x ⇔ x = cos y, 0 ≤ y ≤ π . Arcuscosinus ist differenzierbar in (−1, 1) und d 1 arccos x = − √ , dx 1 − x2 −1 < x < 1. -1 1 Arcustangens Die Tangensfunktion auf (−π/2, π/2) streng monoton wachsend und tan(−π/2, π/2) = R. Die Umkehrfunktion von tan (−π/2, π/2) heißt Arcustangens. Es gilt - arctan : R → (−π/2, π/2) π π . y = arctan x ⇔ x = tan y, − < y < 2 2 Π 2 Π 2 Π 2 Arcustangens ist differenzierbar in R und 1 d arctan x = . dx 1 + x2 - Π 2 Tschebyschev Polynome Zu jedem n ∈ N gibt es ein Polynom Tn vom Grad n mit Tn (x) = cos(n arccos x), |x| ≤ 1. Tn erfüllt die Differentialgleichung: (1 − x2 )Tn00 (x) − xTn0 (x) + n2 Tn (x) = 0. Aus T0 = 1, T1 (x) = x und der Rekursionsbeziehung Tn+1 (x) = 2xTn (x) − Tn−1 (x) folgt T0 T3 T0 (x) = 1, T1 (x) = x, T2 (x) = 2x2 − 1, T3 (x) = 4x3 − 3x, T4 (x) = 8x4 − 8x2 + 1. T4 T1 -1 1 T2 67 Übertragungsfunktion eines Tschebyschev-Tiefpassfilters: 2 U2 1 + ε2 (ω) = , (n gerade). U1 1 + ε2 Tn (ω) Graph für n = 8: 1+Ε2 1 Ω 1 4.4 Exponentialfunktion und Logarithmus Wichtigste Eigenschaften der Exponentialfunktion Definition x n , x ∈ R, ex := lim 1 + n→∞ n e0 = 1, ex > 0 für alle x ∈ R, und d x e = ex . dx ex+y = ex ey , Satz 4.20. lim ex = ∞, x→∞ lim ex = 0 x→−∞ 1 ex = ∞, n ∈ N. x→∞ xn Die Exponentialfunktion ist also streng monoton wachsend und exp(R) = (0, ∞). lim Der natürliche Logarithmus Die Umkehrfunktion der Exponentialfunktion exp : R → (0, ∞) heißt natürlicher Logarithmus und wird mit ln oder log bezeichnet: ln : (0, ∞) → R, y = ln x ⇔ ey = x. Aus dem Graph lesen wir ab, dass ln 1 = 0, ln x < 0 für 0 < x < 1, und ln x > 0 für x > 1. 68 Satz 4.21. (a) limx→0+ ln x = −∞, (b) limx→∞ ln x = ∞, (c) ln(xy) = ln x + ln y, ln( xy ) = ln x − ln y, 1 (d) d 1 ln x = . dx x Allgemeine Exponentialfunktionen und Logarithmen Für a > 0 und r ∈ Q gilt nach Satz 3.11 ar = (eln(a) )r = er ln(a) . Man definiert daher die Exponentialfunktion zur Basis a für alle x ∈ R durch: ax := ex ln a , a > 0. Eigenschaften: 10x ex 2x ax ay = ax+y , x (ab) = ax b x , ln(ax ) = x ln a, (ax )y = axy . n-te Wurzel von a > 0: 1 √ n a := a1/n . Die Exponentialfunktion x 7→ ax = ex ln a ist nicht zu verwechseln mit der Potenzfunktion x 7→ xα = eα ln x , wo x > 0, α ∈ R. d x a = ax ln a, dx x ∈ R, a > 0, d α x = αxα−1 , dx x > 0, α ∈ R. Α<0 Α>1 Graphen von x Α Satz 4.22. Für alle α > 0 gilt ln x = 0. x→∞ xα lim 0<Α<1 1 1 Die Funktion ax = exp(x ln a) ist streng monoton wachsend für a > 1 und streng monoton fallend für 0 < a < 1. Dabei werden alle Werte aus (0, ∞) angenommen. Die Inverse 69 von x 7→ ax heißt Logarithmus zur Basis a und wird mit loga bezeichnet. Es gilt loga x = ln x , ln a x > 0. Eigenschaften von loga : loga (xy) = loga x + loga y, d 1 loga x = . dx x ln a Die Hyperbolischen Funktionen sinh, cosh, tanh Jede Funktion f : R → R lässt sich zerlegen in f = u + g wobei 1 u(x) := (f (x) − f (−x)), u(−x) = −u(x), 2 1 g(−x) = g(x), g(x) := (f (x) + f (−x)), 2 der ungerade und der gerade Anteil von f sind. Im Fall f = exp erhält man sinh und cosh: cosh 1 := (ex − e−x ) 2 1 cosh x := (ex + e−x ) 2 sinh x . tanh x := cosh x sinh x tanh 1 -1 sinh Summenformeln: sinh(x + y) = sinh x cosh y + cosh x sinh y, cosh(x + y) = cosh x cosh y + sinh x sinh y, cosh2 x − sinh2 x = 1. Ableitungen: sinh0 x = cosh x, tanh0 x = 1 cosh2 x cosh0 x = sinh x. sinh ist umkehrbar auf ganz R, cosh ist umkehrbar auf [0, ∞). Die zugehörigen Umkehrfunktionen heißen area sinus hyperbolicus und area cosinus hyperbolicus. Es gilt √ d 1 arsinh x = ln(x + x2 + 1) arsinh x = √ dx x2 + 1 √ d 1 arcosh x = ln(x + x2 − 1) arcosh x = √ dx x2 − 1 70 4.5 Konvexe Funktionen Sei I ein Intervall. Eine Funktion f : I → R heißt konvex, wenn für alle x, y ∈ I gilt f (1 − λ)x + λy ≤ (1 − λ)f (x) + λf (y), 0 < λ < 1. Der Funktionswert am gewichteten Mittel ist kleiner oder gleich das gewichtete Mittel der Funktionswerte. f heißt strikt konvex, wenn “<” gilt für x 6= y. f heißt (strikt) konkav, wenn (−f ) (strikt) konvex ist. fHyL H1-ΛLfHxL+ΛfHyL fHxL H1-ΛLx+Λy x y Satz 4.23. Ist f : (a, b) → R differenzierbar, dann gilt: f ist konvex ⇔ f ist strikt konvex ⇔ f 0 ist monoton wachsend, f 0 ist streng monoton wachsend, Aus Satz 4.23 und Satz 4.11 folgt: Satz 4.24. Ist f : (a, b) → R zwei Mal differenzierbar, dann gilt: f 00 f 00 f 00 f 00 ≥0 ≤0 >0 <0 ⇔ ⇔ ⇒ ⇒ f f f f ist ist ist ist konvex, konkav, strikt konvex, strikt konkav. Mit f 00 ≥ 0 ist gemeint, dass f 00 (x) ≥ 0 für alle x, etc. Satz 4.25. Sei f : (a, b) → R differenzierbar und a < x0 < b. Dann gilt für alle x ∈ (a, b): f ist konvex ⇒ f ist konkav ⇒ f (x) ≥ f (x0 ) + f 0 (x0 )(x − x0 ), f (x) ≤ f (x0 ) + f 0 (x0 )(x − x0 ). Satz 4.26. Für alle x > −1 gilt (1 + x)α ≥ 1 + αx, (1 + x)α ≤ 1 + αx, falls α < 0 oder α > 1, falls 0 < α < 1. 71