Grundlagen und Zahlenmengen 1 1.1 Zahlenmengen Grundlagen und Zahlenmengen Zahlenmengen N die Menge der natürlichen Zahlen: {1, 2, 3, 4, . . .} Z die Menge der ganzen Zahlen: {. . � . , −3, −2, −1, 0, �1, 2, 3, . . .} m Q die Menge der rationalen Zahlen: ; m ∈ Z, n ∈ N n R die Menge der reellen Zahlen C die Menge der komplexen Zahlen Zur Veranschaulichung dient die Zahlengerade. −2 −1 0 1/2 1 √ 2 2 e3 Jedem Punkt auf der Zahlengeraden entspricht genau eine reelle Zahl, und umgekehrt. Höhere Mathematik 1 Grundlagen und Zahlenmengen 1.2 Summen- und Produktzeichen Summen- und Produktzeichen Für ganze Zahlen m ≤ n bedeutet: n � j=m aj = am + am+1 + · · · + an n � j=m aj = am · am+1 · · · an . Für jede reelle (oder komplexe) Zahl x definieren wir x 0 := 1. Als Sonderfall für m > n wird vereinbart: n � j=m Höhere Mathematik aj = 0, n � aj = 1. j=m 2 Grundlagen und Zahlenmengen 1.3 Fakultät und Binomialkoeffizient Fakultät und Binomialkoeffizient Für n ∈ N ist n! = 1 · 2 · 3 · · · · · n = n � j j=1 die Fakultät von n (kurz “n-Fakultät”); wir setzen außerdem 0! = 1. Für ganzzahlige n ≥ 0 und 0 ≤ k ≤ n ist � � n n! n(n − 1) · · · · · (n − k + 1) = = k k!(n − k)! k! der Binomialkoeffizient n über k. Höhere Mathematik 3 Grundlagen und Zahlenmengen Fakultät und Binomialkoeffizient Die Binomialkoeffizienten erfüllen die Regeln: � � � � � � � � n n n n (i) = ; speziell = =1 k n−k 0 n � � � � � � n n n+1 (ii) + = für 0 ≤ k ≤ n − 1 k k +1 k +1 Höhere Mathematik 4 Grundlagen und Zahlenmengen Das Prinzip der vollständigen Induktion Eine wichtige Beweismethode ist das folgende Prinzip. 1.4 Das Prinzip der vollständigen Induktion Für jede natürliche Zahl n sei eine Aussage A(n) formuliert. Wenn wir beweisen können, dass die folgenden beiden Aussagen gelten: (i) A(1) ist wahr. (Induktionsanfang) (ii) Wenn für eine natürliche Zahl n die Aussage A(n) wahr ist, dann ist auch A(n + 1) wahr. (Induktionsschluss von n auf n + 1) Dann ist bewiesen, dass die Aussage A(n) für jede natürliche Zahl n wahr ist. Höhere Mathematik 5 Grundlagen und Zahlenmengen 1.5 Beispiele: (a) Einfache Summenformeln Beispiele: (a) Einfache Summenformeln Behauptung: Für jede natürliche Zahl n gilt n � k=1 Höhere Mathematik n(n + 1) k= . 2 6 Grundlagen und Zahlenmengen 1.6 (b) Anzahl der Permutationen (b) Anzahl der Permutationen Behauptung: Für jede natürliche Zahl n gibt es genau n! verschiedene Möglichkeiten, die Zahlen 1, 2, 3, . . . , n anzuordnen. (Anders ausgedrückt: es gibt genau n! Permutationen von n verschiedenen Dingen.) 1.7 (c) Anzahl der Kombinationen Behauptung: Für jede natürliche Zahl n und jede ganze Zahl 0 ≤ k ≤ n gibt es � � n genau verschiedene Möglichkeiten, k k verschiedene natürliche Zahlen zwischen 1 und n auszuwählen (ohne Berücksichtigung der Reihenfolge; siehe Lotto 6 aus 49). � � n Mit anderen Worten: Eine Menge mit n Elementen hat genau Teilmengen k mit k Elementen. Höhere Mathematik 7 Grundlagen und Zahlenmengen 1.8 (d) Binomischer Satz (d) Binomischer Satz Für alle a, b ∈ R und n ∈ N gilt (a + b)n = n � � � n j=0 Höhere Mathematik j aj b n−j . 8 Grundlagen und Zahlenmengen 1.9 (e) Geometrische Summenformel (e) Geometrische Summenformel Für beliebiges a ∈ R, a �= 1, und n ∈ N ∪ {0} gilt n � k=0 Höhere Mathematik 1 − an+1 a = . 1−a k 9 Grundlagen und Zahlenmengen 1.10 (f) Varianten des Induktionsbeweises (f) Varianten des Induktionsbeweises Als Induktionsanfang beweist man A(n0 ) für ein n0 ∈ Z. Gilt dann der Induktionsschluss von n nach n + 1 für jedes n ≥ n0 , so ist die Aussage A(n) für alle n ≥ n0 bewiesen (siehe Übungen). Als Voraussetzung für den Induktionsschluss von n nach n + 1 darf man verwenden, dass A(k) wahr ist für alle n0 ≤ k ≤ n. Höhere Mathematik 10 Grundlagen und Zahlenmengen 1.11 Beweise Beweise Direkter Beweis Wir wollen beweisen, dass eine Aussage A wahr ist. Der direkte Beweis würde A aus einer (bekanntermassen) wahren Aussage B herleiten oder A äquivalent in eine wahre Aussage B überführen Schema 1: wahre Aussage B =⇒ Aussage A Schema 2: Aussage A ⇐⇒ wahre Aussage B Widerspruchsbeweis Man bezeichnet mit ¬A das Gegenteil der Aussage A. Schema : (¬A =⇒ Widerspruch zu ¬A)=⇒ A wahr Da aus etwas Wahrem nichts Falsches folgen kann, muss ¬A falsch sein und damit A wahr. Höhere Mathematik 11 Grundlagen und Zahlenmengen Beweise Indirekter Beweis Ist die Aussage B als wahr bekannt, und hat man ¬A =⇒ ¬B, so ist A wahr. (B wahr und (¬A =⇒ ¬B)=⇒ A wahr Diese Methode beweist man mit dem Widerspruchsbeweis: Ist A falsch, dann ist ¬A wahr, und damit auch ¬B. Dann müsste B falsch sein, was aber der Voraussetzung B wahr widerspricht. Höhere Mathematik 12 Grundlagen und Zahlenmengen 1.12 Beispiele Beispiele Behauptung: Sei n eine ganze Zahl und n2 durch 3 teilbar. Dann ist n durch 3 teilbar. Irrationale Zahlen Behauptung: Es gibt reelle Zahlen, die nicht rational (also keine Brüche ganzer Zahlen) sind. Solche Zahlen heißen irrational. Höhere Mathematik 13 Grundlagen und Zahlenmengen Beispiele Achtung: Das Aufstellen des Gegenteils der Aussage A ist häufig schwierig (“Negation”). Höhere Mathematik 14 Grundlagen und Zahlenmengen (R, +, ·) ist ein Körper Die Eigenschaften der reellen Zahlen 1.13 (R, +, ·) ist ein Körper Für die Addition reeller Zahlen gilt: (A1) Zu je zwei reellen Zahlen a, b gibt es genau eine reelle Zahl a + b, die Summe von a und b. Für alle reellen Zahlen a, b, c gilt: (A2) a+b =b+a (A3) (a + b) + c = a + (b + c) (Kommutativität) (Assoziativität) (A4) Es gibt genau eine reelle Zahl 0 mit der Eigenschaft: a + 0 = 0 + a = a für jede reelle Zahl a. (A5) Für jede reelle Zahl a gibt es genau eine reelle Zahl −a mit der Eigenschaft: a + (−a) = (−a) + a = 0. Höhere Mathematik 15 Grundlagen und Zahlenmengen (R, +, ·) ist ein Körper Für die Multiplikation reeller Zahlen gilt: (M1) Zu je zwei reellen Zahlen a, b gibt es genau eine reelle Zahl a · b (geschrieben ab), das Produkt von a und b. Für alle reellen Zahlen a, b, c gilt: (M2) ab = ba (M3) (ab)c = a(bc) (D) (a + b)c = ac + bc (Kommutativität) (Assoziativität) (Distributivität) (M4) Es gibt genau eine reelle Zahl 1 mit der Eigenschaft: a · 1 = 1 · a = a für jede reelle Zahl a (M5) Für jede reelle Zahl a �= 0 gibt es genau eine reelle Zahl a−1 (geschrieben 1a ) mit der Eigenschaft: a · a−1 = a−1 · a = 1. Höhere Mathematik 16 (R, +, ·) ist ein Körper Grundlagen und Zahlenmengen Bemerkungen: Schreibweise der Subtraktion: a + (−b) = a − b Schreibweise der Division und Brüche: ab −1 = a/b = ba , falls b �= 0. Das 2. Distributivgesetz a(b + c) = ab + ac folgt aus (D) und (M2). Höhere Mathematik 17 Die Axiome der Anordnung in R Grundlagen und Zahlenmengen 1.14 Die Axiome der Anordnung in R (O1) Es gibt eine Relation “ < ”(kleiner) in R, so dass für je zwei reelle Zahlen a, b genau eine der drei folgenden Aussagen gilt: a < b, a = b, oder b<a Die Relation “ < ”hat die folgenden Eigenschaften: (O2) Aus a < b und b < c folgt a<c (O3) Aus a < b folgt für alle reellen c : (Transitivität) a+c <b+c (O4) Aus a < b folgt für alle reellen c mit 0 < c : ac < bc Schreibweisen: b > a (b größer a) bedeutet a < b, entsprechend a ≤ b (a kleiner oder gleich b) und b ≥ a (b größer oder gleich a) Höhere Mathematik 18 Grundlagen und Zahlenmengen 1.15 Rechenregeln für Ungleichungen Rechenregeln für Ungleichungen Für reelle Zahlen a, b, c, d folgt aus den Axiomen (O1) bis (O4): (a) a<b ∧ c<d =⇒ a+c <b+d (b) a<b ∧ c<0 =⇒ ac > bc (c) 1>0 (d) 0<a<b (e) ab > 0 ab < 0 =⇒ ⇐⇒ ⇐⇒ 1 1 0< < b a (a > 0 ∧ b > 0) ∨ (a < 0 ∧ b < 0) (a > 0 ∧ b < 0) ∨ (a < 0 ∧ b > 0) (f) Für jede reelle Zahl a �= 0 ist a2 > 0. (g) Für a > 0 und b > 0 gilt: Die Symbole Höhere Mathematik a<b ⇐⇒ a2 < b 2 ∧ (“und”), ∨ (“oder”) sind Verknüpfungen aus der Aussagenlogik. 19 Grundlagen und Zahlenmengen Archimedisches Axiom Die Charakterisierung der reellen Zahlen 1.16 Archimedisches Axiom Zu jeder reellen Zahl a gibt es eine Zahl n ∈ N mit a < n. Oder gleichbedeutend damit: Zu jeder reellen Zahl � > 0 gibt es eine natürliche Zahl n mit 0 < n1 < �. 1.17 Vollständigkeitsaxiom, “Dedekindscher Schnitt” Die Mengen A und B seien nichtleere Mengen reeller Zahlen. Für jedes a ∈ A und jedes b ∈ B gelte a ≤ b (anschaulich: A liegt links auf der Zahlengeraden von B.) Dann gibt es mindestens eine reelle Zahl c, so dass für alle a ∈ A und alle b ∈ B gilt a ≤ c ≤ b. Die Körperaxiome 1.13, Anordnungsaxiome 1.14, sowie die beiden letzten Axiome charakterisieren die Menge R; d.h. R ist der einzige vollständige, archimedische angeordnete Körper. Frage: Q ist ein archimedischer angeordneter Körper. Man finde ein Beispiel von Mengen A, B ⊂ Q, die zeigen, dass das Vollständigkeitsaxiom für Q nicht gilt. Höhere Mathematik 20 Grundlagen und Zahlenmengen Ungleichung zwischen arithmetischem und geometrischem Mittel Wichtige Ungleichungen der Analysis 1.18 Ungleichung zwischen arithmetischem und geometrischem Mittel Sind a und b positive reelle Zahlen, so gilt √ ab ≤ Höhere Mathematik a+b . 2 r � �� a a+b = √ 2 h = ab r h �� �� � b 21 Grundlagen und Zahlenmengen 1.19 Bernoullische Ungleichung Bernoullische Ungleichung Für alle x ∈ R mit x ≥ −1 und alle n ∈ N gilt (1 + x)n ≥ 1 + nx. Höhere Mathematik 22 Grundlagen und Zahlenmengen 1.20 Cauchy-Schwarz Ungleichung Cauchy-Schwarz Ungleichung Für beliebige reelle Zahlen a1 , a2 , . . . , an und b1 , b2 , . . . , bn gilt n � i=1 Höhere Mathematik ai bi ≤ � � a12 + · · · + an2 b12 + · · · + bn2 23 Grundlagen und Zahlenmengen 1.21 Absolutbetrag und Signumsfunktion Absolutbetrag und Signumsfunktion Für jede reelle Zahl a definieren wir (i) den Absolutbetrag (ii) das Signum (Vorzeichen) � , wenn a ≥ 0, |a| = , wenn a < 0. , wenn a > 0, 1 sign(a) = 0 , wenn a = 0, −1 , wenn a < 0. a −a Der Absolutbetrag |a| ist der Abstand auf der Zahlengeraden von a zum Nullpunkt. Der Abstand von zwei Zahlen a und b auf der Zahlengeraden ist |a − b|. √ Für alle a ∈ R gilt |a| = a2 . Höhere Mathematik 24 Grundlagen und Zahlenmengen 1.22 Rechnen mit Beträgen Rechnen mit Beträgen Für alle reellen Zahlen a, b gilt (a) (b) (c) (d) (e) (f) |a| ≥ 0, und (|a| = 0 ⇔ a = 0); |ab| = |a| |b|; � a � |a| � � , � �= b |b| falls b �= 0; |a + b| ≤ |a| + |b| � � |a + b| ≥ �|a| − |b|� (|a| = |b| ⇔ a2 = b 2 ), (Dreiecksungleichung) (|a| < |b| ⇔ a2 < b 2 ) Für reelle Zahlen aj , 1 ≤ j ≤ n, folgt aus (d) per Induktion die verallgemeinerte Dreiecksungleichung � � �� � n � n � � � aj �� ≤ |aj | � � j=1 � j=1 Höhere Mathematik 25 Definition von C Grundlagen und Zahlenmengen Die komplexen Zahlen Die quadratische Gleichung x 2 + 1 = 0 hat keine reelle Lösung, denn für jede reelle Zahl x gilt x 2 + 1 > 0 (nach 1.15(c),(f)). 1.23 Definition von C Zu den reellen Zahlen fügen wir die “Zahl”i (=“imaginäre Einheit”) hinzu, für die gilt i 2 = −1. Dann ist die Menge C = {a + bi mit a, b ∈ R} der komplexen Zahlen abgeschlossen bezüglich der Addition und Multiplikation: Für komplexe Zahlen z = a + bi und w = c + di setzen wir Höhere Mathematik z +w = (a + bi) + (c + di) = (a + c) + (b + d)i, zw = (a + bi)(c + di) = (ac − bd) + (ad + bc)i. 26 Grundlagen und Zahlenmengen 1.24 Die Gaußsche Zahlenebene Die Gaußsche Zahlenebene Jede komplexe Zahl z = a + bi entspricht genau einem geordneten Paar (a, b) reeller Zahlen, mit a = Re (z) und b = Im (z). Dieses Paar (a, b) wird als Punkt in der Ebene dargestellt. Dabei sind (a, b) die kartesischen Koordinaten von z = a + bi. 1.25 Addition in C Die Addition z + w komplexer Zahlen entspricht der “Vektoraddition”: (a + bi) + (c + di) = (a + c) + (b + d)i ∼ (a, b) + (c, d) = (a + c, b + d) Im z (a + c, b + d) C Im z = 1 z =2+i (a, b) (c, d) 1 Höhere Mathematik Rez = 2 Re z 27 Grundlagen und Zahlenmengen Die Gaußsche Zahlenebene Es sei z = a + bi eine komplexe Zahl, a, b ∈ R. a = Re (z) heißt Realteil von z, b = Im (z) heißt Imaginärteil von z. Zwei komplexe Zahlen sind gleich, wenn Realteil und Imaginärteil übereinstimmen. z = a − bi heißt die konjugiert komplexe Zahl (sprich “z-quer”). Es gilt Re (z) = 12 (z + z), Im (z) = 2i1 (z − z). √ |z| = a2 + b 2 √ heißt der Absolutbetrag von z. Es gilt |z| = zz. Für z �= 0 ist |z| > 0. Durch die Gleichung z z · 2 = 1 (= 1 + 0i). |z| ist der Kehrwert von z �= 0 definiert als z −1 = 1 z = z |z|2 . Bemerkung: R ⊂ C wird durch die Identität a = a + 0i geklärt. Also ist z ∈ C genau dann reell, wenn z = z gilt. Höhere Mathematik 28 C ist Körper Grundlagen und Zahlenmengen 1.26 C ist Körper Die Menge C der komplexen Zahlen mit der Addition und Multiplikation aus 1.23 ist ein Körper. Das heißt im Einzelnen: es gelten die Kommutativ-, Assoziativ- und Distributivgesetze, das neutrale Element der Addition ist 0 = 0 + 0i, das der Multiplikation ist 1 = 1 + 0i, zu z = a + bi ist −z = −a − bi; falls z �= 0, so ist z −1 = Höhere Mathematik b 1 z a = 2 = 2 − i. 2 2 2 z |z| a +b a +b 29 Grundlagen und Zahlenmengen 1.27 Beispiele Beispiele (a) Berechnen von Real- und Imaginärteil: 3+i 3+i 3+i z= = = (1 − 3i)2 1 − 6i − 9 −8 − 6i (b) Es gilt |z| = 1 ⇔ Höhere Mathematik 1 z = z. 30 Weitere Rechenregeln in C Grundlagen und Zahlenmengen 1.28 Weitere Rechenregeln in C Für alle z, w ∈ C gilt (a) (b) (c) 0 · z = z · 0 = 0 und (zw = 0 ⇔ z = 0 ∨ w = 0). �z� z z + w = z + w , zw = z w , = w w , falls w �= 0. |z| = 0 ⇐⇒ z = 0. �z� � � = |z| , falls w �= 0. w |w | (d) |zw | = |z| |w |, (e) |z + w | ≤ |z| + |w | � � � |z ± w | ≥ |z| − |w |� (f) Höhere Mathematik (Dreiecksungleichung) 31 Polarkoordinaten in C Grundlagen und Zahlenmengen Für die Multiplikation, Division, Potenzen und Wurzeln eignet sich eine andere geometrische Beschreibung der komplexen Zahlen besser. 1.29 Polarkoordinaten in C Die komplexe Zahl z = a + bi hat die Polarkoordinaten � r = |z| = a2 + b 2 Betrag Das ist der Abstand zu 0 |z| = √ ϕ Argument Das ist der Winkel zwischen der positiven reellen Achse und der Strecke von 0 zu z. Dabei ist −π < ϕ <= π a2 + b 2 ϕ z = a + bi b = |z| sin ϕ a = |z| cos ϕ z = a − bi Die Darstellung von z in Polarkoordinaten lautet z = |z|(cos ϕ + i sin ϕ). Höhere Mathematik 32 Polarkoordinaten in C Grundlagen und Zahlenmengen Hierbei ist zu beachten: alle Winkel werden im Bogenmaß (Einheit rad) gemessen, wobei π rad dem Winkel 180o entspricht. Umrechnung: απ αo (α Grad) entspricht ϕ= rad 180 Die Zuordnung (a, b) ←→ (r , ϕ) ist für (a, b) �= (0, 0) eineindeutig. Die Umrechnungen lauten a b = = r = ϕ = r cos ϕ r sin ϕ √ 2 2 a + b arccos(a/r ), falls b ≥ 0, − arccos(a/r ), falls b < 0. Hierbei wird der Hauptwert des Arcus-Cosinus mit Werten 0 ≤ arccos x ≤ π verwendet. Höhere Mathematik 33 Rechenoperationen in C Grundlagen und Zahlenmengen 1.30 Rechenoperationen in C Für z, w ∈ C mit ϕ = arg (z), ψ = arg (w ), gilt: Multiplikation: z · w = |z| |w | (cos(ϕ + ψ) + i sin(ϕ + ψ)) . (Multiplikation der Beträge und Addition der Argumente) Division für w �= 0: z |z| = (cos(ϕ − ψ) + i sin(ϕ − ψ)) . w |w | (Division der Beträge und Subtraktion der Argumente) Konjugation: z = |z| (cos ϕ − i sin ϕ) = |z| (cos(−ϕ) + i sin(−ϕ)) . (Spiegelung an der reellen Achse) Höhere Mathematik 34 Rechenoperationen in C Grundlagen und Zahlenmengen z = 1 + 2i 2i z ·w i 1 2 w =1−i Höhere Mathematik 3 Mit z · w = (1 + 2i)(1 − i) = 3 + i ist √ |z| = 5, ϕz ≈ 63◦ √ |w | = 2, ϕw = −45◦ √ |zw | = 10, ϕzw ≈ 18◦ 35 Grundlagen und Zahlenmengen 1.31 Eulersche Formel Eulersche Formel Wir setzen zunächst nur formal (als Kurzschreibweise) e iϕ := cos ϕ + i sin ϕ, wobei e die Eulersche Zahl (≈ 2.7182...) ist. Dann ist durch z = |z|e iϕ , w = |w |e iψ =⇒ z · w = |z| |w |e i(ϕ+ψ) bereits eine Eigenschaft der “Exponentialfunktion” ausgedrückt, die wir später noch allgemein herleiten werden. Die Exponential-Schreibweise erleichtert den Umgang mit den Polarkoordinaten (verwende die üblichen Potenzgesetze). Höhere Mathematik 36 Grundlagen und Zahlenmengen Moivresche Formel Als direkte Folgerung der Multiplikationsregel ergibt sich: 1.32 Moivresche Formel Für z = |z|(cos ϕ + i sin ϕ) = |z|e iϕ und n ∈ N gilt � � n n z = |z| cos(nϕ) + i sin(nϕ) = |z|n e inϕ . Höhere Mathematik 37 Grundlagen und Zahlenmengen Die n-ten Einheitswurzeln Die komplexen Zahlen vom Betrag 1 haben die Form e iϕ = cos ϕ + i sin ϕ. Für spezielle Winkel ergeben sich die sogenannten Einheitswurzeln. 1.33 Die n-ten Einheitswurzeln Sei n eine natürliche Zahl. Die komplexen Zahlen ηk = e i2πk/n 2πk 2πk = cos + i sin , n n k = 0, 1, . . . , n − 1, heißen die n-ten Einheitswurzeln; durch sie sind sämtliche komplexe Lösungen der Gleichung zn = 1 gegeben. Höhere Mathematik 38 Grundlagen und Zahlenmengen Die n-ten Einheitswurzeln z1 z2 η2 η1 z0 η3 η0 z3 η4 η5 Die sechsten Einheitswurzeln η0 bis η5 und die Lösungen von z 6 = 8i. z5 z4 Höhere Mathematik 39 Grundlagen und Zahlenmengen 1.34 Die n-ten Wurzeln in C Die n-ten Wurzeln in C Satz: Zu w = |w |(cos ϕ + i sin ϕ) �= 0 und n ∈ N sind sämtliche Lösungen der Gleichung z n = w gegeben Zahlen � � durch die�n komplexen � �� ϕ 2πk ϕ 2πk 1/n zk = |w | cos + + i sin + mit k = 0, 1, . . . , n − 1. n n n n Ist z eine beliebige Zahl mit z n = w , so sind alle Lösungen durch zk = z · ηk gegeben. √ Schreibweise: Die komplexe Wurzel n w oder w 1/n bezeichnet die Gesamtheit aller n verschiedenen n-ten Wurzeln √ von w . (Im Gegensatz zum Reellen: 9 = 3, und nicht −3.) 1.35 Beispiel: Die 3-ten Wurzeln von w = i = e iπ/2 Höhere Mathematik 40 Mengen und Funktionen 2 2.1 Mengen und Funktionen Grundbegriffe der naiven Mengenlehre (Georg Cantor 1845-1918) Eine Menge ist die Zusammenfassung von verschiedenen Objekten (den Elementen) zu einem neuen Objekt. Eine Menge M wird definiert durch genaue Angabe ihrer Elemente: aufzählende Form: M1 = {1, 2, 3} (endliche Menge) M2 = {2, 4, 6, 8, . . .} (unendliche Menge) beschreibende Form (anhand eines “Prädikats”, das die Elemente charakterisiert: M2 = {n | n ∈ N ∧ n ist gerade} M3 = {z | z ∈ C ∧ Re(z) > 0} “rechte Halbebene” Die Menge ohne Elemente heißt die leere Menge und wird mit dem Symbol ∅ bezeichnet. Höhere Mathematik 41 Mengen und Funktionen 2.2 Mengentheoretische Begriffe x ∈ M bedeutet “x ist Element der Menge M”; x �∈ M bedeutet “x ist kein Element der Menge M” Die Menge M heißt Teilmenge der Menge N (geschrieben M ⊆ N), wenn gilt: x ∈ M ⇒ x ∈ N. M heißt echte Teilmenge von N (geschrieben M � N), falls M ⊆ N ∧ M �= N gilt. Man beachte: M = N ⇐⇒ (M ⊆ N ∧ N ⊆ M). Die Vereinigung der Mengen M und N ist M ∪ N = {x | x ∈ M ∨ x ∈ N} Der Durchschnitt der Mengen M und N ist M ∩ N = {x | x ∈ M ∧ x ∈ N} Die Mengendifferenz M “ohne”N (auch Komplement von N in M) ist M \ N = {x | x ∈ M ∧ x �∈ N} Höhere Mathematik 42 Mengen und Funktionen 2.3 Rechenregeln für Mengen Für Mengen A, B, C gelten die Distributivgesetze (A ∪ B) ∩ C = (A ∩ C ) ∪ (B ∩ C ), (A ∩ B) ∪ C = (A ∪ C ) ∩ (B ∪ C ) sowie die de Morganschen Regeln C \ (A ∪ B) = (C \ A) ∩ (C \ B), Höhere Mathematik C \ (A ∩ B) = (C \ A) ∪ (C \ B). 43 Mengen und Funktionen 2.4 Intervalle Intervalle Für a, b ∈ R mit a ≤ b sind das abgeschlossene Intervall [a, b] = {x ∈ R | a ≤ x ≤ b} das offene Intervall (a, b) = {x ∈ R | a < x < b} die halboffenen Intervalle (a, b] = {x ∈ R | a < x ≤ b} und [a, b) = {x ∈ R | a ≤ x < b} definiert. Weiterhin sind die unbeschränkten abgeschlossenen Intervalle [a, ∞) = {x ∈ R | x ≥ a} und (−∞, b] = {x ∈ R | x ≤ b}, die unbeschränkten offenen Intervalle (a, ∞) = {x ∈ R | x > a} und (−∞, b) = {x ∈ R | x < b} definiert. Höhere Mathematik 44 Mengen und Funktionen Intervalle Für a ∈ R und � > 0 heißt das offene Intervall U� (a) = (a − �, a + �) die �-Umgebung von a. Höhere Mathematik 45 Mengen und Funktionen 2.5 Definition: obere Schranke, Supremum Definition: obere Schranke, Supremum M sei eine nichtleere Teilmenge von R. Existiert eine Zahl b ∈ R so, dass x ≤ b für alle x ∈ M gilt, so heißt b eine obere Schranke von M, und M heißt nach oben beschränkt. Das Vollständigkeitsaxiom von R ist äquivalent zu der folgenden Aussage: Falls die Menge M ⊆ R nach oben beschränkt ist, so gibt es eine kleinste obere Schranke s von M. Die Zahl s heißt Supremum von M, geschrieben s = sup M. Es gilt x ≤ sup M für alle x ∈ M, jedoch existiert für jedes � > 0 mindestens ein x ∈ M mit x > sup M − �. Höhere Mathematik 46 Mengen und Funktionen Definition: Untere Schranken, Infimum Analog definiert man: 2.6 Definition: Untere Schranken, Infimum M sei eine nichtleere Teilmenge von R. Existiert eine Zahl a ∈ R so, dass x ≥ a für alle x ∈ M gilt, so heißt a eine untere Schranke von M, und M heißt nach unten beschränkt. Die größte untere Schranke von M heißt das Infimum von M, geschrieben inf M. Ist M nach oben und unten beschränkt, so heißt M beschränkt; dann gilt inf M ≤ x ≤ sup M Höhere Mathematik für alle x ∈ M. 47 Mengen und Funktionen 2.7 Definition: Kartesisches Produkt Definition: Kartesisches Produkt Zu nichtleeren Mengen A und B definieren wir das kartesische Produkt A × B = {(a, b) | a ∈ A, b ∈ B} (sprich “A kreuz B”) als die Menge der geordneten Paare (a, b) mit a ∈ A und b ∈ B. Es gilt (a, b) = (c, d) genau dann, wenn a = c und b = d gilt. Beispiele: Das Rechteck [0, 3] × [1, 2] enthält geordnete Zahlenpaare. Es ist eine Teilmenge von R2 := R × R. Die Menge M := {Sonntag, Montag, ..., Samstag} × {Sonne, Regen, Nebel} enthält 21 geordnete Paare der Form (Wochentag, Wetter). Höhere Mathematik 48 Mengen und Funktionen 2.8 Relation Relation Gegeben seien nichtleere Mengen A und B. Eine Teilmenge R ⊆ A × B nennen wir eine Relation von A nach B. Die Menge D(R) := {a ∈ A | es existiert mindestens ein Paar (a, b) ∈ R} heißt die Urbildmenge, und die Menge I (R) := {b ∈ B | es existiert mindestens ein Paar (a, b) ∈ R} heißt die Bildmenge der Relation. Höhere Mathematik 49 Mengen und Funktionen 2.9 Definition: Abbildung, Funktion Definition: Abbildung, Funktion Gegeben seien nichtleere Mengen A und B. Eine Funktion (oder Abbildung) f von A nach B ist eine Vorschrift, die jedem a ∈ A genau ein Element b = f (a) ∈ B zuordnet. Wir schreiben f : A → B, a �→ f (a). A heißt der Definitionsbereich, B heißt der Wertebereich von f . b = f (a) heißt das Bild von f an der Stelle a (oder auch Bild von a unter f ). Für eine Teilmenge M ⊆ A heißt f (M) = {f (x) | x ∈ M} ⊆ B das Bild von M unter f . Die Menge f (A) ist die Bildmenge von f . Für eine Teilmenge N ⊆ B heißt f −1 (N) = {x ∈ A | f (x) ∈ N} ⊆ A das Urbild von N unter f . Der Graph von f ist die Menge Graph(f ) = {(x, f (x)) | x ∈ A} ⊆ A × B. Höhere Mathematik 50 Mengen und Funktionen 2.10 Definition: Einschränkung, Verkettung Definition: Einschränkung, Verkettung Es seien f : A → B und g : C → D Funktionen. Für eine Teilmenge M ⊆ A definieren wir die Einschränkung von f f |M : M → B, x �→ f (x). f heißt dann Fortsetzung von f |M . Für den Fall B ⊆ C definieren wir die Hintereinanderausführung (oder Verkettung oder Komposition) g ◦ f : A → D, Höhere Mathematik x �→ g (f (x)). 51 Mengen und Funktionen 2.11 Definition: injektiv, surjektiv, bijektiv Definition: injektiv, surjektiv, bijektiv Eine Funktion f : A → B heißt (a) injektiv, wenn es zu jedem y ∈ B höchstens ein x ∈ A gibt mit f (x) = y , (b) surjektiv, wenn es zu jedem y ∈ B mindestens ein x ∈ A gibt mit f (x) = y , (c) bijektiv, wenn es zu jedem y ∈ B genau ein x ∈ A gibt mit f (x) = y . Höhere Mathematik 52 Mengen und Funktionen 2.12 Definition: Umkehrfunktion Definition: Umkehrfunktion Wenn f : A → B bijektiv ist, so ist die Umkehrfunktion f −1 : B → A definiert durch f −1 (b) = a ⇐⇒ f (a) = b. Der Graph der Umkehrfunktion ist Graph(f −1 ) = {(b, f −1 (b)) | b ∈ B} = {(f (a), a) | a ∈ A}. Für reelle Funktionen (also A, B ⊆ R) ist Graph(f −1 ) die Spiegelung von Graph(f ) an der 1. Winkelhalbierenden im (x, y )-Koordinatensystem. Höhere Mathematik 53 Mengen und Funktionen 2.13 Definition: Monotonie Definition: Monotonie A, B ⊂ R seien nichtleere Mengen. Eine Funktion f : A → B heißt streng monoton wachsend, wenn für alle x1 , x2 ∈ A gilt: x1 < x2 =⇒ f (x1 ) < f (x2 ), streng monoton fallend, wenn für alle x1 , x2 ∈ A gilt: x1 < x2 =⇒ f (x1 ) > f (x2 ). Die Funktion heißt monoton wachsend (bzw. fallend), wenn aus x1 < x2 die Beziehung f (x1 ) ≤ f (x2 ) (bzw. f (x1 ) ≥ f (x2 )) folgt. Höhere Mathematik 54 Mengen und Funktionen 2.15 Satz: Streng monotone Funktionen Satz: Streng monotone Funktionen Ist die reelle Funktion f : A → B streng monoton wachsend (oder streng monoton fallend), so ist sie injektiv. Höhere Mathematik 55 Mengen und Funktionen Polynome Einfache Funktionen auf C 2.16 Polynome Eine Funktion P : C → C mit der Zuordnungsvorschrift x �→ P(x) = an x n + an−1 x n−1 + · · · + a1 x + a0 = n � ak x k , k=0 wobei die aj gegebene komplexe Zahlen sind, heißt Polynom vom Grad ≤ n. Die ak , 0 ≤ k ≤ n, nennt man die Koeffizienten von P. Sind alle Koeffizienten reell, so nennt man P ein reelles Polynom. Als Definitionsund Wertebereich sind auch R sowie Teilmengen von C oder R zugelassen. an heißt Leitkoeffizient oder Höchstkoeffizient von P. Falls an �= 0, so hat P den (exakten) Grad n. Ist an = 1, so heißt P normiert. Höhere Mathematik 56 Mengen und Funktionen 2.17 Fundamentalsatz der Algebra Fundamentalsatz der Algebra Jedes Polynom P vom Grad n ≥ 1 hat mindestens eine Nullstelle in C, d.h. es gibt ein z ∈ C mit P(z) = 0. Als Folgerung ergibt sich: 2.18 Satz: Zerlegung in Linearfaktoren Jedes Polynom P vom Grad n ≥ 1 läßt sich schreiben als Produkt von n Linearfaktoren P(z) = an (z − z1 )(z − z2 ) · · · (z − zn ). Dabei sind die z1 , z2 , . . . , zn ∈ C die Nullstellen von P. Fasst man gleiche Nullstellen zusammen, so ergibt sich die Produktform P(z) = an (z − z1 )m1 · · · (z − zr )mr mit den paarweise verschiedenen Nullstellen z1 , . . . , � zr von P. Die Zahl r mk ∈ N heißt Ordnung der Nullstelle zk , und es ist k=1 mk = n. Höhere Mathematik 57 Mengen und Funktionen 2.19 Horner-Schema Horner-Schema Die Auswertung des Polynoms P(z) = an z n + an−1 z n−1 + · · · + a1 z + a0 an einer Stelle z erfolgt nach dem Horner-Schema: P(z) = (· · · ((an z + an−1 )z + an−2 )z + · · · )z + a0 . Höhere Mathematik 58 Mengen und Funktionen Horner-Schema Das Horner-Schema liefert eine Kurzform zur Polynomdivision durch den Linearfaktor (z − z0 ): Zum gegebenen Polynom P(z) = an z n + an−1 z n−1 + · · · + a1 z + a0 und zur Stelle z0 ist die Division mit Rest, also die Darstellung P(z) = (z − z0 ) · (bn z n−1 + bn−1 z n−2 + · · · + b2 z + b1 ) + b0 gesucht. Die Koeffizienten b0 , . . . , bn liest man aus der letzten Zeile des Hornerschemas ab: an z0 bn = an an−1 z0 · bn bn−1 an−2 z0 · bn−1 bn−2 ··· ··· ··· a1 z0 · b2 b1 a0 z0 · b1 b0 = P(z0 ) Hierbei ist bk = z0 · bk+1 + ak . Falls z0 eine Nullstelle von P ist, so gilt b0 = 0 und wir erhalten die “Abspaltung” des Linearfaktors (z − z0 ) P(z) = (z − z0 ) · (bn z n−1 + bn−1 z n−2 + · · · + b2 z + b1 ) Höhere Mathematik 59 Lineare Gleichungssysteme Einführendes Beispiel Kap. 3: Lineare Gleichungssysteme Wir beginnen mit der Behandlung linearer Gleichungssysteme. Im R2 sind z.B. “2 Gleichungen mit 2 Unbekannten” gegeben durch 2x −x − + 3y 2y = = 1 0 Dieses System von 2 Gleichungen hat die eindeutige Lösung (x, y )� = (2, 1)�. Es gibt aber Systeme, die keine Lösung besitzen, wie z.B. 2x −x − + 4y 2y = = 2 0 und auch solche, die unendlich viele Lösungen besitzen: 2x −x − + 4y 2y = = 2 −1 Hier sind alle Punkte der Geraden G : (x, y )� = (3 + 2t, 1 + t)�, t ∈ R, Lösungen. Höhere Mathematik 60 Lineare Gleichungssysteme 3.2 Definition Definition Der n-dimensionale euklidische Raum ist die Menge aller n-Tupel reeller Zahlen Rn = R × R × · · · × R = {(x1 , . . . , xn )� | x1 , . . . , xn ∈ R}. Ein Element �x = (x1 , . . . , xn )� ∈ Rn heißt ein Vektor, und für 1 ≤ k ≤ n heißt xk die k-te Koordinate oder Komponente von �x . Der Vektor �0 = (0, . . . , 0) heißt Nullvektor. Summe und Multiplikation mit Skalaren wird definiert durch (x1 , . . . , xn )�+ (y1 , . . . , yn )� = (x1 + y1 , . . . , xn + yn )� α(x1 , . . . , xn )� = (αx1 , . . . , αxn )� Analog wird Cn definiert. Höhere Mathematik 61 Lineare Gleichungssysteme 3.3 Definition Definition Ein lineares Gleichungssystem von m Gleichungen mit den n Unbekannten x1 , . . . , xn ist ein Gleichungssystem der Form a1,1 x1 a2,1 x1 + + a1,2 x2 a2,2 x2 + + ··· ··· .. . + + a1,n xn a2,n xn = = b1 b2 am,1 x1 + am,2 x2 + ··· + am,n xn = bm Die ai,k ∈ R heißen die Koeffizienten und die bi ∈ R heißen die rechten Seiten des Gleichungssystems. Eine Lösung des linearen Gleichungssystems ist ein Vektor �x = (x1 , . . . , xn )� ∈ Rn , dessen Komponenten xk alle m Gleichungen erfüllen. Das Gleichungssystem heißt lösbar (oder konsistent), wenn es mindestens eine Lösung besitzt, eindeutig lösbar, wenn es genau eine Lösung besitzt. Höhere Mathematik 62 Lineare Gleichungssysteme 3.4 Definition: homogenes lineares Gleichungssystem Definition: homogenes lineares Gleichungssystem Das lineare Gleichungssystem (geschrieben in Kurzform) n � ai,k xk = bi (i = 1, . . . , m), (∗) k=1 heißt homogen, falls alle rechten Seiten bi gleich 0 sind. Ansonsten heißt es inhomogen. Ein homogenes lineares Gleichungssystem ist stets lösbar: Es besitzt die triviale Lösung �x = (0, 0, . . . , 0)�. Das “zum linearen Gleichungssystem (*) gehörende homogene System” lautet n � ai,k xk = 0 (i = 1, . . . , m). (∗∗) k=1 Höhere Mathematik 63 Lineare Gleichungssysteme Definition: homogenes lineares Gleichungssystem Die Lösungsmenge eines homogenen linearen Gleichungssystems (**) hat die Struktur eines Vektorraums: Summen und skalare Vielfache von Lösungen sind selbst wieder Lösungen. Genauer: 3.5 Satz Die Lösungen eines homogenen linearen Gleichungssystems bilden einen Unter-Vektorraum V von Rn ; das heißt, zu zwei Lösungen �u = (u1 , . . . , un )� und �v = (v1 , . . . , vn )� ist auch der Vektor α�u + β�v mit beliebigen Zahlen α, β ∈ R eine Lösung. Höhere Mathematik 64 Lineare Gleichungssysteme Satz Die Linearität ergibt ein einfaches “Superpositions-Prinzip”: 3.6 Satz Gegeben sei ein lösbares inhomogenes lineares Gleichungssystem n � ai,k xk = bi (i = 1, . . . , m). (∗) k=1 a) Sind �p und �q Lösungen von (*), so ist �v := �p − �q eine Lösung des zugehörigen homogenen Systems (**). b) Ist �p eine (spezielle) Lösung von (*), so erhält man alle Lösungen, indem man zu �p alle Lösungen des zugehörigen homogenen Systems (**) addiert. Aus der Lösungsmenge Lh des homogenen Systems und der speziellen Lösung �p ergibt sich also die Lösungsmenge des inhomogenen Systems L = �p + Lh = {�x ∈ Rn | �x = �p + �v , �v ∈ Lh } Höhere Mathematik 65 Lineare Gleichungssysteme Satz: Elementare Umformungen des LGS Zur Lösung linearer Gleichungssysteme verwendet man einfache Äquivalenz-Umformungen des Gleichungssystems. 3.7 Satz: Elementare Umformungen des LGS Die Menge der Lösungen eines linearen Gleichungssystems bleibt unverändert, wenn man E1 die Reihenfolge der Gleichungen vertauscht, E2 beide Seiten einer Gleichung mit einer Zahl α �= 0 multipliziert, E3 eine Gleichung ersetzt durch die Summe dieser Gleichung und dem Vielfachen einer anderen Gleichung. E4 Vertauscht man die Reihenfolge der Unbekannten x1 , . . . , xn , setzt also (y1 , . . . , yn ) := (xσ1 , . . . , xσn ) mit einer Permutation (σ1 , . . . , σn ) der Zahlen (1, . . . , n), so erhält man die Lösungsmenge des neuen Systems (bzgl. �y ) aus der Lösungsmenge des alten (bzgl. �x ) durch entsprechende Vertauschung der Komponenten. Höhere Mathematik 66 Lineare Gleichungssysteme Drei Beispiele An drei Beispielen soll erklärt werden, wie man systematisch durch die Äquivalenz-Umformungen (E1)–(E3) sowie die Umformung (E4) eine reduzierte Stufenform des Gleichungssystems erhält, um die Lösungsmenge dann leicht zu bestimmen. 3.8 Drei Beispiele x1 2x1 −x1 −x1 x1 1 2 −1 −1 1 0 0 0 1 0 0 0 Höhere Mathematik + + + − x2 4 8 2 −4 4 0 6 0 4 1 0 0 4x2 8x2 2x2 4x2 + + + + x3 2 1 1 1 2 −3 3 3 2 1 2 −3 3 2x3 x3 x3 x3 x4 −1 −1 0 2 −1 1 −1 1 −1 − 16 1 1 − − x4 x4 + 2x4 r.S. 2 3 2 2 2 −1 4 4 2 2 3 −1 4 = = = = 2 3 −→ Kurzform 2 2 Elimination mit E3 Elimination mit E3 Elimination mit E3 Zeilentausch E1 (2 −→ 3) und Skalierung E2 Glück: keine Elim. erforderlich, nur E2 67 Lineare Gleichungssysteme Drei Beispiele 1 0 0 0 1 0 0 0 1 0 0 0 4 1 0 0 4 1 0 0 4 1 0 0 2 1 2 1 3 2 1 2 1 0 2 1 2 1 0 −1 − 16 − 13 1 −1 − 16 − 13 2 −1 − 16 − 13 1 2 2 3 1 3 4 2 Elimination mit E3 2 3 1 3 3 2 E2 2 3 1 3 3 2 Auflösen durch “Rücksubstitution” (von unten nach oben): Höhere Mathematik Gl. 4: x4 = 3 2 Gl. 3: x3 − 13 x4 = 1 3 =⇒ x3 = 5 6 Gl. 2: x2 + 12 x3 − 16 x4 = 2 3 =⇒ x2 = 1 2 Gl. 1: x1 + 4x2 + 2x3 − x4 = 2 =⇒ x1 = − 16 , Probe! 68 Lineare Gleichungssysteme Drei Beispiele Beispiel 2: x1 2x1 −x1 −x1 + + − − 4x2 8x2 4x2 4x2 x1 1 2 −1 −1 1 0 0 0 + + + + x2 4 8 −4 −4 4 0 0 0 2x3 x3 x3 x3 x3 2 1 1 1 2 −3 3 3 − − x4 x4 + 2x4 x4 −1 −1 0 2 −1 1 −1 1 r.S. 2 3 −1 2 2 −1 1 4 = = = = 2 3 −→ Kurzform −1 2 Elimination mit E3 Elimination mit E3 Elimination mit E3 Vertauschung von x2 und x3 (=Spaltentausch (2 ↔ 3)): x1 1 0 0 0 Höhere Mathematik x3 2 −3 3 3 x2 4 0 0 0 x4 −1 1 −1 1 r.S. 2 −1 1 4 Skalierung E2 69 Lineare Gleichungssysteme Drei Beispiele x1 1 0 0 0 1 0 0 0 x3 2 1 3 3 2 1 0 0 x2 4 0 0 0 4 0 0 0 x4 −1 − 13 −1 1 −1 − 13 0 2 2 1 3 1 4 2 Elimination mit E3 Elimination mit E3 1 3 0 3 Vertauschung von x2 und x4 (=Spaltentausch (3 ↔ 4)): x1 1 0 0 0 1 0 0 0 x3 2 1 0 0 2 1 0 0 x4 −1 − 13 0 2 −1 − 13 1 0 x2 4 0 0 0 4 0 0 0 r.S. 2 1 3 0 3 2 Zeilentausch E1 (3 ↔ 4) und Skalierung E2 1 3 3 2 0 1. Feststellung: Das Gleichungssystem ist lösbar (konsistent), weil die letzte Gleichung (Nullzeile) lösbar ist. Höhere Mathematik 70 Lineare Gleichungssysteme Drei Beispiele 2. Auflösen durch “Rücksubstitution” der Gleichungen 1–3, wobei die Komponente x2 (aus Spalte 4) als freie Variable verwendet wird: Gl. 3: x4 = 3 2 Gl. 2: x3 − 13 x4 = 1 3 Gl. 1: x1 + 2x3 − x4 + 4x2 = 2 =⇒ x1 = =⇒ x3 = 5 6 11 6 − 4x2 , Probe! Die Lösungsmenge ist eine Gerade im R4 , weil ein “freier” Parameter t = x2 vorliegt: 11 5 3 L = {�x = ( − 4t, t, , ) | t ∈ R}. 6 6 2 5 3 Eine spezielle Lösung ist �v = ( 11 6 , 0, 6 , 2 ). Die Lösungsmenge des zugehörigen homogenen Systems ist der Unter-Vektorraum Lh = {�x = t(−4, 1, 0, 0) | t ∈ R} ⊆ R4 . Höhere Mathematik 71 Lineare Gleichungssysteme Drei Beispiele Beispiel 3: Abändern der rechten Seite des Gleichungssystems x1 2x1 −x1 −x1 führt zu der Stufenform + + − − 4x2 8x2 4x2 4x2 + + + + 2x3 x3 x3 x3 − − x4 x4 + 2x4 x1 1 0 0 0 x3 2 1 0 0 x4 −1 − 13 1 0 x2 4 0 0 0 = = = = r.S. 2 2 3 −→ Kurzform 2 2 1 3 3 2 3 Feststellung: Das Gleichungssystem ist nicht lösbar (inkonsistent), weil die letzte Gleichung der Stufenform nicht lösbar ist: Nullkoeffizienten von x1 , . . . , x4 treffen auf eine rechte Seite ungleich 0. Höhere Mathematik 72 Lineare Gleichungssysteme Gauß-Algorithmus Die systematische Vorgehensweise führt zu folgendem Resultat: 3.9 Gauß-Algorithmus Jedes lineare Gleichungssystem von m Gleichungen mit n Unbekannten x1 , . . . , xn kann durch endlich viele Umformungen der Form (E1)–(E4) auf die reduzierte Stufenform gebracht werden: y1 1 0 .. . 0 0 0 .. . 0 y2 b1,2 1 .. . ··· ··· ··· ··· y3 b1,3 b2,3 .. . 0 0 ··· ··· ··· 1 0 ··· ··· yr b1,r b2,r .. . br −1,r 1 0 .. . 0 yr +1 b1,r +1 b2,r +1 .. . br −1,r +1 br ,r +1 0 .. . 0 ··· ··· ··· ··· ··· ··· ··· yn b1,n b2,n .. . br −1,n br ,n 0 .. . 0 r.S. c1 c2 .. . cr −1 cr cr +1 .. . cm Dabei ist (y1 , . . . , yn ) eine Permutation der Komponenten des Vektors (x1 , . . . , xn ). Die Zahl r ≤ min{m, n} heißt der Rang des linearen Gleichungssystems. Höhere Mathematik 73 Lineare Gleichungssysteme 3.9 Gauß-Algorithmus Gauß-Algorithmus (forts.) Das Gleichungssystem ist lösbar (konsistent) genau dann, wenn cr +1 = · · · = cm = 0 gilt; dann wählt man yr +1 , . . . , yn als “freie Variable” und bestimmt y1 , . . . , yr aus den ersten r Gleichungen der reduzierten Stufenform. Das Gleichungssystem ist eindeutig lösbar genau dann, wenn r = n und cr +1 = · · · = cm = 0 gilt. Höhere Mathematik 74 Lineare Gleichungssysteme Gauß-Algorithmus Bemerkungen: Die entscheidende Zahl ist der Rang r des Gleichungssystems. Von vornherein kennt man nur die Abschätzungen r ≤ m und r ≤ n. Wenn r = m gilt (“voller Zeilenrang”), so ist das Gleichungssystem lösbar; denn es gibt keine Gleichungen (Zeilen) mit lauter Null-Koeffizienten in der reduzierten Stufenform. Wenn r = n gilt (“voller Spaltenrang”), so existiert höchstens eine Lösung; denn alle Komponenten xk sind durch die ersten n Gleichungen bereits eindeutig festgelegt. Die weiteren Gleichungen (für m > n) entscheiden dann darüber, ob dieser Vektor �x eine Lösung ist oder nicht. Wenn r < n gilt und das Gleichungssystem lösbar ist, gibt es unendlich viele Lösungen. Die Lösungsmenge enthält n − r freie Parameter yr +1 , . . . , yn . Sie ist eine Gerade im Fall n − r = 1, Ebene im Fall n − r = 2, etc. Höhere Mathematik 75 Lineare Gleichungssysteme Alternativsatz Der Spezialfall m = n (Anzahl der Gleichungen ist gleich der Anzahl der Unbekannten) tritt besonders häufig auf. 3.10 Alternativsatz Für ein lineares Gleichungssystem von n Gleichungen mit n Unbekannten sind die folgenden Aussagen äquivalent: Das Gleichungssystem ist für beliebige rechte Seiten eindeutig lösbar (also universell eindeutig lösbar). Das zugehörige homogene System hat nur die triviale Lösung �x = �0. Das Gleichungssystem hat den Rang r = n. Beweis: durch Kombination der Aussagen in der vorherigen Bemerkung. Höhere Mathematik 76 Lineare Gleichungssysteme Alternativsatz Ein konstruktiver Beweis zur Existenz der reduzierten Stufenform wird durch die Beschreibung des Gauß-Algorithmus angegeben: Man führt (maximal) n Schritte zur Elimination nach folgenden Regeln durch (erklärt anhand der Kurzform mit Zeilen und Spalten): Im k-ten Schritt (1 ≤ k ≤ n) k1 : betrachte die k-te Spalte ab dem Diagonalelement bk,k nach unten (also Zeilen k ≤ i ≤ m). Stehen hier nur Nullen (incl. bk,k ), so können zwei Fälle auftreten: 1. Fall: es gibt eine weitere Spalte mit Index k + 1 ≤ � ≤ n, die ein von Null verschiedenes Element in mindestens einer Zeile k ≤ i ≤ m enthält. Dann tausche die beiden Spalten und nummeriere die Unbekannten um (E4). 2. Fall: alle weiteren Spalten mit Index k + 1 ≤ � ≤ n enthalten nur Nullen in den Zeilen k ≤ i ≤ m. Dann ist die reduzierte Stufenform erreicht und der Algorithmus beendet. k2 falls das (neue) Diagonalelement bk,k Null ist, dann tausche Zeile k mit einer Zeile i unterhalb (also k + 1 ≤ i ≤ m), deren Element bi,k derselben Spalte ungleich Null ist (E1). Höhere Mathematik 77 Lineare Gleichungssysteme Alternativsatz k3 : dividiere die k-te Zeile (incl. der k-ten Komponente der rechten Seite) durch das (neue) Diagonalelement bk,k �= 0 (E2). Dadurch entsteht das neue Diagonalelement bk,k = 1. k4 : subtrahiere das bi,k -fache der Zeile k von Zeile i für k + 1 ≤ i ≤ m (E3). Dadurch entstehen Nullen unterhalb des Diagonalelements bk,k = 1. 3.11 Komplexe Gleichungssysteme Alles gilt analog für komplexe Gleichungssysteme. Höhere Mathematik 78 Vektoren 4 4.1 Kartesische Koordinaten in Ebene und Raum Vektoren Kartesische Koordinaten in Ebene und Raum In der Ebene (mathematisch ist dies die Menge R2 ) ist ein kartesisches Koordinatensystem festgelegt durch den Nullpunkt 0 sowie zwei Zahlengeraden (die x- und die y -Achse), die sich senkrecht im Nullpunkt schneiden. Ein Punkt P ∈ R2 hat als x- und y -Koordinate jeweils den Wert, der sich durch orthogonale Projektion auf die entsprechende Achse ergibt. Im dreidimensionalen Raum (mathematisch ist dies die Menge R3 ) ist ein kartesisches Koordinatensystem festgelegt durch den Nullpunkt 0 sowie drei Zahlengeraden (die x-, y - und z-Achse), die sich im Nullpunkt schneiden, paarweise senkrecht stehen und ein Rechtssystem bilden. Ein Punkt P ∈ R3 hat als x-, y - und z-Koordinate jeweils den Wert, der sich durch orthogonale Projektion auf die entsprechende Achse ergibt. Höhere Mathematik 79 Vektoren 4.2 Kartesische Koordinaten in Ebene und Raum Definition: Vektor Ein Vektor �a ist eine Größe, die sowohl durch den Betrag |�a| ≥ 0 (=Länge des Vektors) als auch durch seine Richtung und den Richtungssinn festgelegt ist (z.B. Kraft, Geschwindigkeit). Sonderfall: Der Nullvektor �0 hat den Betrag 0, seine Richtung ist nicht definiert. Höhere Mathematik 80 Vektoren 4.3 Addition, Multiplikation mit einem Skalar Addition, Multiplikation mit einem Skalar Wird der Vektor �a dargestellt durch die gerichtete Strecke von P nach Q, und der Vektor �b durch die gerichtete Strecke von Q nach R, so ist die Summe �a + �b der Vektor, der durch die gerichtete Strecke von P nach R dargestellt wird. (Diagonalregel) Ist �a ein Vektor und α > 0, so ist α�a derjenige Vektor, der dieselbe Richtung und denselben Richtungssinn wie �a hat und dessen Betrag α|�a| ist. Für α < 0 ist α�a = −|α|�a derjenige Vektor, der dieselbe Richtung und den entgegengesetzten Richtungssinn wie �a hat und dessen Betrag |α| |�a| ist. Für α = 0 ist α�a der Nullvektor. Höhere Mathematik 81 Vektoren Addition, Multiplikation mit einem Skalar Es gelten die üblichen Rechengesetze: Kommutativgesetz, Assoziativgesetz, Distributivgesetz. Hinzu kommt die Regel zur Multiplikation mit Skalaren α, β ∈ R: α(β�a) = (αβ)�a. Die Summe von Vektoren erhält man durch Bilden einer “Vektorkette” und Verbinden des ersten Anfangspunktes mit dem letzten Endpunkt. Wir benutzen die platzsparende Schreibweise a (a, b, c)� := b c Höhere Mathematik 82 Vektoren 4.4 Vektoren im kartesischen Koordinatensystem Vektoren im kartesischen Koordinatensystem In einem kartesischen Koordinatensystem wird jedem Vektor �a ein fester Ortsvektor mit dem Anfangspunkt 0 zugeordnet. Ist A = (a1 , a2 , a3 )� der Endpunkt dieses Ortsvektors, so nennt man (a1 , a2 , a3 )� den Koordinatenvektor von �a und schreibt �a = (a1 , a2 , a3 )�. Die gewählten Koordinatenachsen definieren die Einheitsvektoren �e1 = (1, 0, 0)�, �e2 = (0, 1, 0)�, �e3 = (0, 0, 1)� mit Anfangspunkt 0 und Endpunkt bei der Längeneinheit auf der jeweiligen Koordinatenachse. Die “Kurzschreibweise” �a = (a1 , a2 , a3 ) wird mathematisch ausgedrückt durch die Vektorsumme �a = a1�e1 + a2�e2 + a3�e3 . Summe und Multiplikation mit Skalaren: �a = (a1 , a2 , a3 )�, �b = (b1 , b2 , b3 )� α ∈ R =⇒ �a + �b = (a1 + b1 , a2 + b2 , a3 + b3 )�, α�a = (αa1 , αa2 , αa3 )� Höhere Mathematik 83 Vektoren Vektoren im kartesischen Koordinatensystem Ebenso einfach ergibt sich der√Betrag: � �a = (a1 , a2 , a3 )� =⇒ |�a| = �a · �a = a12 + a22 + a32 . Es gilt die Betragsformel |α�a| = |α| |�a|, sowie α�a = �0 ⇐⇒ α = 0 ∨ �a = �0. � � |� �a + b| ≤� |�a| + |b| � � �|�a| − |�b|� ≤ |�a − �b| (1. Dreiecksungleichung) (2. Dreiecksungleichung) Vektoren der Länge |�a| = 1 heißen Einheitsvektoren. Zu beliebigem �a �= �0 erhält man durch “Normierung” den Einheitsvektor �b = |�1a| �a. �b �a �a − �b �a �a + �b �b 0 Höhere Mathematik 0 �b � � � � �|�a| − |�b|� 84 Vektoren 4.5 Winkel und Skalarprodukt Winkel und Skalarprodukt Stellen wir beide Vektoren �a, �b �= �0 mit dem gemeinsamen Anfangspunkt P dar, so ist 0 ≤ ∠(�a, �b) ≤ π der hierdurch definierte Winkel im Punkt P. Mit �a · �b := |a| |b| cos ∠(�a, �b) wird das Skalarprodukt der Vektoren �a und �b definiert. Zusätzlich setzen wir �0 · �a = �a · �0 = 0. Höhere Mathematik 85 Vektoren 4.6 Berechnungsformel für das Skalarprodukt mit Koordinatenvektoren Berechnungsformel für das Skalarprodukt mit Koordinatenvektoren �a = (a1 , a2 , a3 )�, �b = (b1 , b2 , b3 )� =⇒ �a · �b = a1 b1 + a2 b2 + a3 b3 . Kommutativgesetz und Distributivgesetz(e) �a · �b = �b · �a, �a · (�b + �c ) = �a · �b + �a · �c , (�a + �b) · �c = �a · �c + �b · �c . Assoziativität bezüglich der Multiplikation mit Skalaren (α�a) · �b = α(�a · �b) = �a · (α�b), Aber Vorsicht: (�a · �b)�c ist ein skalares Vielfaches des Vektors �c , während (�b · �c )�a ein skalares Vielfaches des Vektors �a, also im Allgemeinen verschieden davon ist. Höhere Mathematik 86 Vektoren Berechnungsformel für das Skalarprodukt mit Koordinatenvektoren √ Es gilt |a| = �a · �a, und |�a · �b| ≤ |�a| |�b| (Cauchy-Schwarz-Ungleichung) Das Gleichheitszeichen gilt genau dann, wenn die Vektoren kollinear sind, also einer der beiden Vektoren ein Vielfaches des anderen ist; d.h. wenn eine Zahl α ∈ R existiert mit �b = α�a ∨ �a = α�b. Aufgrund der Orthogonalität der Koordinatenachsen gilt � 1 für i = j �ei · �ej = 0 für i �= j. Die Dreiecksungleichung in 4.4 folgt direkt aus der Cauchy-Schwarz-Ungleichung: |�a + �b|2 Höhere Mathematik = = = (�a + �b) · (�a + �b) = �a · �a + �a · �b + �b · �a + �b · �b |�a|2 + 2(�a · �b) + |�b|2 ≤ |�a|2 + 2|�a| |�b| + |�b|2 (|�a| + |�b|)2 . 87 Vektoren 4.7 Orthogonalität von Vektoren Orthogonalität von Vektoren Zwei Vektoren �a, �b �= �0 sind zueinander orthogonal, wenn π ∠(�a, �b) = 2 gilt. Der Nullvektor �0 ist per Definition orthogonal zu jedem Vektor �a. Damit sind äquivalent: �a und �b orthogonal ⇐⇒ �a · �b = 0. 4.8 Beispiel Die Diagonalen eines Parallelogramms sind genau dann zueinander orthogonal, wenn alle vier Seiten die gleiche Länge haben. Höhere Mathematik 88 Vektoren Satz des Pythagoras, Parallelogrammgesetz Die Distributivgesetze ergeben zwei wichtige Rechenregeln: 4.9 Satz des Pythagoras, Parallelogrammgesetz a) Für Vektoren �a, �b ∈ Rn mit �a ⊥ �b gilt |�a + �b|2 = |�a|2 + |�b|2 . b) Für alle Vektoren �a, �b ∈ Rn gilt � � 1 2 2 �a · �b = |�a + �b| − |�a − �b| . 4 Höhere Mathematik 89 Vektoren Satz des Pythagoras, Parallelogrammgesetz Bemerkungen: Die “algebraische” Berechnung des Skalarprodukts dient oft der Winkelberechnung: Der Bruch �b � a · a1 b 1 + a2 b2 + a3 b3 � cos ∠(�a, �b) = =� 2 . 2 2 2 2 2 � a1 + a2 + a3 b1 + b2 + b3 |�a| |b| �a·� b |�a| |� b| liegt im Intervall [−1, 1] (siehe Cauchy-Schwarz-Ungl. in 4.6 oder 1.20). Daher ist der Winkel 0 ≤ ∠(�a, �b) ≤ π eindeutig bestimmt. Die Cauchy-Schwarz-Ungleichung |�a · �b| ≤ |�a| |�b| in 4.6 lautet in Koordinatenschreibweise genau wie in 1.20. Die geometrische Definition in 4.5 liefert sogar die genaue Charakterisierung, wann das Gleichheitszeichen gilt. Höhere Mathematik 90 Vektoren Definition: Vektorprodukt Zwei weitere Produkte für Vektoren werden definiert. Für Vektoren �a, �b ∈ R3 \ {�0} möchte man das Vektorprodukt �a × �b als denjenigen Vektor im R3 definieren, dessen Betrag |�a × �b| = |�a| |�b| sin ∠(�a, �b) ist, dessen Richtung senkrecht zu der von �a und �b aufgespannten Ebene ist und dessen Richtungssinn so gewählt ist, dass �a, �b,�a × �b ein Rechtssystem bilden. Zusätzlich setzt man �a × �0 = �0 × �a = �0. 4.10 Definition: Vektorprodukt Dieses kann man (eindeutig) durch folgende Bedingungen festlegen: 1 Stets sei �a × �b = −�b × �a 2 3 �e1 × �e2 = �e3 , �e2 × �e3 = �e1 und �e3 × �e1 = �e2 Es gelten Distributiv- and Assoziativgesetze analog zu 4.6 Höhere Mathematik 91 Vektoren Definition: Vektorprodukt Bemerkungen: Es ist �a × �a = �0 Für �a = (a1 , a2 , a3 )� und �b = (b1 , b2 , b3 )� erhält man �a × �b = (a2 b3 − a3 b2 , a3 b1 − a1 b3 , a1 b2 − a2 b1 )� Einfaches Nachrechnen ergibt |�a × �b|2 + (�a · �b)2 = |�a|2 |�b|2 ⇒ |�a × �b| = |�a| · |�b| · sin α Der Betrag |�a×�b| ist der Flächeninhalt des Parallelogramms mit den Seiten �a und �b, und die Richtung ist senkrecht (orthogonal) zu diesem Paralle� = �a × �b erfüllt logramm; der Vektor w also die Orthogonalitätsbedingungen � ⊥ �a, w Höhere Mathematik h �b α �a � ⊥ �b. w 92 Vektoren � � �e1 � � Merkregel von Sarrus �a × b = �� �e2 � �e3 oder für �c = �a × �b mit a1 b1 a2 b2 a3 a1 a2 Höhere Mathematik b3 b1 b2 a1 a2 a3 � b1 �� b2 �� b3 � Definition: Vektorprodukt c1 = a 2 b 3 − a 3 b 2 c2 = a 3 b 1 − a 1 b 3 c3 = a 1 b 2 − a 2 b 1 93 Vektoren 4.11 Definition: Spatprodukt Definition: Spatprodukt Für Vektoren �a, �b, �c ∈ R3 definiert man das Spatprodukt �a · (�b × �c ). Dies ist ein Skalar, dessen Absolutbetrag das Volumen des von den drei Vektoren �a, �b, �c aufgespannten Spates (auch Parallelepiped genannt) angibt. Höhere Mathematik 94 Geraden und Ebenen Parameterdarstellung von Geraden Kap. 5: Geraden und Ebenen Wir behandeln zunächst Geraden im R2 und R3 . Sei also n = 2 oder 3. 5.1 Parameterdarstellung von Geraden Die Gerade durch den Punkt �p ∈ Rn mit dem Richtungsvektor �v ∈ Rn , v �= �0, ist gegeben durch die Menge G = {�x ∈ Rn | �x = �p + t�v , t ∈ R}. Das Skalar t zum Punkt �x = �x (t) = �p + t�v ∈ G heißt der Parameterwert von �x . Um die Parameterdarstellung der Geraden G durch die Punkte �p und �q (mit �p �= �q ) zu bestimmen, berechnet man den Richtungsvektor �v = �q − �p . Höhere Mathematik 95 Geraden und Ebenen 5.2 Lot auf eine Gerade, Abstand Punkt-Gerade Lot auf eine Gerade, Abstand Punkt-Gerade Die Gerade G ⊆ Rn sei gegeben durch ihre Parameterdarstellung �x (t) = �p + t�v , t ∈ R (beachte �v �= �0). Zu einem weiteren Punkt �q ∈ Rn gibt es genau einen Punkt �x (t0 ) ∈ G , so dass �q − �x (t0 ) ⊥ �v gilt. Dieser Punkt �x (t0 ) heißt der Fußpunkt des Lots von �q auf die Gerade G . Weiter gilt: |�q − �x (t0 )| ist der Abstand des Punktes �q von G , d.h. dist (�q , G ) = |�q − �x (t0 )| < |�q − �x (t)| für alle t �= t0 �x (t0 ) �d �p G �v �q �0 Höhere Mathematik 96 Geraden und Ebenen Beispiel 5.3 Beispiel: Gerade G durch die Punkte (5, 1, −1)� und (3, −3, 3)�; Lot vom Punkt �q = (0, 0, 0)� auf G (ergibt den Abstand von G zum Nullpunkt) Höhere Mathematik 97 Geraden und Ebenen Normalenform, Hesse-Normalform Spezielle Darstellung von Geraden im R2 5.4 Normalenform, Hesse-Normalform Zu gegebenen Zahlen a, b, c ∈ R mit (a, b) �= (0, 0) definiert die Menge � � a G = {(x, y ) ∈ R2 | ax + by = c} = {�x ∈ R2 | �x · = c} b eine Gerade; der Vektor (a, b)� steht senkrecht auf jedem Richtungsvektor �v von G und heißt Normalenvektor von G . Für |(a, b)�| = 1 und c ≥ 0 heißt die gegebene Form die Hesse-Normalform von G . Die Zahl c ist dabei der Abstand von G zum Nullpunkt des R2 . Der Normalen-Einheitsvektor (a, b)� steht senkrecht auf G und zeigt vom Nullpunkt weg. G2 �0 �n Höhere Mathematik G1 G1 : �x · �n = c, G2 : �x · �n = d Für |�n| = 1 sind dann c und d die Abstände der Geraden vom Ursprung, |c − d| ist der Abstand der Geraden. 98 Geraden und Ebenen Beispiel Die Hesse-Normalform wird bei Abstandsberechnungen eingesetzt: 5.5 Beispiel: Die Gerade G ⊆ R2 durch die Punkte �p = (4, −1) und �q = (3, 1) Höhere Mathematik 99 Geraden und Ebenen Parameterdarstellung von Ebenen Ebenen im R3 5.6 Parameterdarstellung von Ebenen Die Ebene durch den Punkt �p ∈ R3 mit den nicht-kollinearen Richtungsvektoren �v , w � ∈ R3 ist gegeben durch die Menge � , s, t ∈ R}. E = {�x ∈ R3 | �x = �p + s�v + t w � ∈ E heißt das Das Paar (s, t) zum Punkt �x = �x (s, t) = �p + s�v + t w Parameterpaar zum Punkt �x . Um die Parameterdarstellung der Ebene E durch drei Punkte �p , �q und �r zu bestimmen, die nicht alle auf einer Geraden liegen, berechnet man die � = �r − �p . Diese sind dann nicht-kollinear. Richtungsvektoren �v = �q − �p und w � ∈ R3 sind genau dann nicht-kollinear, wenn Die Richtungsvektoren �v , w �n := �v × w � �= �0 gilt. �n ist Normalenvektor der Ebene (d.h. �n steht senkrecht auf E ). Höhere Mathematik 100 Normalenform, Hesse-Normalform von Ebenen im R3 Geraden und Ebenen 5.7 Normalenform, Hesse-Normalform von Ebenen im R3 Zu Zahlen a, b, c, d ∈ R mit �n� = (a, b, c)� �= (0, 0, 0)� definiert die Menge E = {(x, y , z)� ∈ R3 | ax + by + cz = d} = {�x | �x · �n = d} eine Ebene; der Vektor (a, b, c)� steht senkrecht auf allen Richtungsvektoren �v von E und heißt Normalenvektor von E . Für |�n| = 1 und d ≥ 0 heißt die gegebene Form die Hesse-Normalform von E . Die Zahl d ist dabei der Abstand von E zum Nullpunkt des R3 . Der Normalen-Einheitsvektor �n steht senkrecht auf E und zeigt vom Nullpunkt weg. Sei |�n| = 1. �n Höhere Mathematik E1 : �x · �n = d1 , E2 E1 E2 : �x · �n = d2 Dann ist der Abstand der Ebene Ei zum Ursprung gerade |di |. Der Abstand der Ebenen ist |d1 − d2 |. 101 Geraden und Ebenen Normalenform, Hesse-Normalform von Ebenen im R3 Die Umwandlung von der Parameterdarstellung in die Hesse-Normalform erfolgt so: � (beachte �n �= �0) und Mit dem Normalenvektor �n = (a, b, c)� = �v × w d := �p · �n ergibt sich die Normalenform �x · �n = ax + by + cz = d. Falls d < 0, ersetze �n durch −�n (und d durch −d). Für die Hesse-Normalform ersetzt man �n durch 1 �n. |�n| Die Umwandlung der Hesse-Normalform in die Parameterform erfolgt durch Bestimmung dreier Punkte �p , �q ,�r ∈ E (Einsetzen von x-, y - und z-Werten), die nicht auf einer Geraden liegen. Alternativ bestimmt man einen Punkt �p und bestimmt zwei nicht kollineare Richtungsvektoren, die beide auf �n senkrecht stehen. Höhere Mathematik 102 Geraden und Ebenen 5.8 Lot auf eine Ebene, Abstand Punkt-Ebene Lot auf eine Ebene, Abstand Punkt-Ebene Die Ebene E ⊆ R3 sei gegeben durch ihre Parameterdarstellung �x (s, t) = �p + s�v + t w � , s, t ∈ R. (beachte: �v × w � �= �0). Zu einem weiteren Punkt �q ∈ R3 gibt es genau einen Punkt �x (s0 , t0 ) ∈ E , so dass (�q − �x (s0 , t0 )) ⊥ �v ∧ � (�q − �x (s0 , t0 )) ⊥ w gilt. Dieser Punkt �x (s0 , t0 ) heißt der Fußpunkt des Lots von �q auf die Ebene E . Weiter gilt: |�q − �x (s0 , t0 )| ist der Abstand des Punktes �q von E , d.h. dist (�q , E ) = |�q − �x (s0 , t0 )| < |�q − �x (s, t)| für alle (s, t) �= (s0 , t0 ). �n � w E �x0 (s, t) �v �0 �p Höhere Mathematik �q 103 Geraden und Ebenen 5.9 Definition: windschief Definition: windschief Zwei Geraden G1 und G2 im R3 heißen windschief, wenn sie sich weder schneiden noch parallel sind. Die Geraden seien in Parameterform gegeben: G1 : �x (t) = �p + t�v , �, G2 : �x (u) = �q + u w t ∈ R, u ∈ R. Dann erfolgt die Berechnung des Abstands durch � zwischen beiden Geraden Bestimmung der Lot-Richtung �n = �v × w Bestimmung des Lot-Fußpunkts auf G2 : Schnittpunkt von G2 mit der Ebene durch �p mit den Richtungsvektoren �v und �n. Bestimmung des Lot-Fußpunkts auf G1 : Schnittpunkt von G1 mit der Ebene � und �n. durch �q mit den Richtungsvektoren w Höhere Mathematik 104 Geraden und Ebenen Definition: windschief Die Schnittmenge zweier Ebenen E1 und E2 ist häufig eine Gerade im R3 . Ihre Parameterdarstellung erhält man, indem man die Parameterdarstellung der einen Ebene in die Normalenform der anderen Ebene “einsetzt” und damit einen der Parameter eliminiert. Höhere Mathematik 105 Vektorräume Definition: Vektorraum Kap. 6: Vektorräume Als Verallgemeinerung des R2 und R3 betrachten wir allgemeine Vektorräume und Skalarprodukte. Da die Vektoren in allgemeinen Vektorräumen nicht mehr nur Zahlentupel sein müssen, schreiben wir sie ohne den Vektorpfeil. 6.1 Definition: Vektorraum Eine nichtleere Menge V , auf der eine Addition v +w ∈V für alle v, w ∈ V sowie eine Multiplikation mit Skalaren αv ∈ V für alle v ∈ V, α ∈ R (bzw. α ∈ C), definiert ist, heißt reeller (bzw. komplexer) Vektorraum, wenn die folgenden Gesetze erfüllt sind: Höhere Mathematik 106 Vektorräume Definition: Vektorraum Für alle u, v , w ∈ V und α, β ∈ R bzw. C gelte (a) u + v = v + u (Kommutativgesetz) (b) (u + v ) + w = u + (v + w ) (Assoziativgesetz) (c) Es gibt einen Nullvektor 0 mit der Eigenschaft u + 0 = 0 + u = u für alle u∈V (d) Zu jedem Vektor u gibt es einen Vektor −u mit der Eigenschaft u + (−u) = (−u) + u = 0. (e) (α + β)u = αu + βu α(u + v ) = αu + αv (Distributivgesetze) (f) (αβ)u = α(βu) 1u = u Höhere Mathematik 107 Satz: Rn und Cn Vektorräume 6.2 Satz: Rn und Cn Der n-dimensionale euklidische Raum ist die Menge aller n-Tupel reeller Zahlen Rn = R × R × · · · × R = {(x1 , . . . , xn ) | x1 , . . . , xn ∈ R}. Ein Element �x = (x1 , . . . , xn )� ∈ Rn heißt ein Vektor, und für 1 ≤ k ≤ n heißt xk die k-te Koordinate oder Komponente von �x . Der Vektor �0 = (0, . . . , 0) heißt Nullvektor. In einem kartesischen Koordinatensystem aus n paarweise senkrechten Koordinatenachsen definiert der Vektor �x ∈ Rn mit Anfangspunkt (0, . . . , 0) (=Koordinatenursprung) und Endpunkt P = (x1 , . . . , xn ) den Ortsvektor von P. Analog wird Cn definiert. Summe und Multiplikation mit Skalaren wird definiert durch (x1 , . . . , xn ) + (y1 , . . . , yn ) = (x1 + y1 , . . . , xn + yn ) α(x1 , . . . , xn ) = (αx1 , . . . , αxn ) Wichtigste Beispiele Rn ist ein reeller und Cn ein komplexer Vektorraum. Höhere Mathematik 108 Vektorräume 6.3 Unterraum Unterraum Eine Teilmenge U eines Vektorraums V heißt Unterraum, wenn U mit den Verknüpfungen von V selbst ein Vektorraum ist. Dazu reicht es aus, dass mit u und v stets αu und u + v wieder in U sind. 6.4 Definition: Skalarprodukt Sei V ein Vektorraum. Ein reelles (komplexes) Skalarprodukt auf V ist eine Abbildung �., .� : V × V → R (C) mit den Eigenschaften (a) �v , v � ≥ 0 und �v , v � = 0 ⇐⇒ v = 0 (b) �αv + βu, w � = α�v , w � + β�u, w � (c) �u, v � = �v , u� (�u, v � = �v , u�) Definitheit Linearität im ersten Faktor Symmetrie (Hermitizität) Ein Vektorraum mit Skalarprodukt heißt Skalarproduktraum. Aus (b) und (c) folgt unmittelbar �u, αv + βw � = α�u, v � + β�u, w � Im reellen Fall tritt die Konjugation natürlich nicht auf. Höhere Mathematik 109 Skalarprodukt im Rn und Cn Vektorräume 6.5 Skalarprodukt im Rn und Cn Für Vektoren �x = (x1 , . . . , xn ) und �y = (y1 , . . . , yn ) des Rn (Cn ) wird das Skalarprodukt auch mit dem Punkt geschrieben, und ist definiert als �x · �y = ��x , �y � = x1 y1 + . . . + xn yn 6.6 (�x · �y = ��x , �y � = x1 y1 + . . . + xn yn ) Cauchy-Schwarzsche Ungleichung Ist V ein Skalarproduktraum, so gilt � � |�u, v �| ≤ �u, u� �v , v � Höhere Mathematik 110 Vektorräume 6.7 Definition: Norm Definition: Norm Eine Norm �.� auf einem Vektorraum V ist eine Abbildung von V in die reellen Zahlen mit den Eigenschaften (a) �v � ≥ 0 und �v � = 0 ⇐⇒ v = 0 (b) �αv � = |α| �v � (c) �u + v � ≤ �u� + �v � Definitheit Homogenität Dreiecksungleichung Satz Ist �., � ein Skalarprodukt auf einem Vektorraum V , so ist durch �v � = eine Norm definiert. Höhere Mathematik � �v , v � 111 Vektorräume 6.8 Definition: Winkel Definition: Winkel Der Winkel α = ∠(�x , �y ) ∈ [0, π] zwischen Vektoren �x , �y ∈ Rn \ {�0} wird definiert durch die Festlegung �x · �y cos α = . |�x | |�y | Ist α = π/2, so heißen �x und �y orthogonal, und wir schreiben �x ⊥ �y . Beachte: Nach der Cauchy-Schwarz Ungleichung gilt �x · �y −1 ≤ ≤ 1, |�x | |�y | also ist der Winkel α ∈ [0, π] eindeutig bestimmt. Höhere Mathematik 112 Vektorräume Definition: Linearkombination, Aufspann Bemerkung: Ob im folgenden die Skalare α, β, . . . ∈ R oder α, β, . . . ∈ C gewählt werden, hängt davon ab, ob wir einen reellen oder einen komplexen Vektorraum betrachten. 6.9 Definition: Linearkombination, Aufspann Sei V ein reeller oder komplexer Vektorraum. a) Ein Vektor x = α1 v1 + · · · + αk vk ∈ V mit Skalaren α1 , . . . , αk (aus R bzw. C) heißt eine Linearkombination der Vektoren v1 , . . . , vk . b) Die Menge aller Linearkombinationen Span (v1 , . . . , vk ) := � x= k � j=1 αj vj | α1 , . . . , αk Skalare � heißt der Spann oder Aufspann der Vektoren v1 , . . . , vk (oder der von v1 , . . . , vk aufgespannte Unter-Vektorraum von V ). Höhere Mathematik 113 Vektorräume 6.10 Definition: Basis Definition: Basis Die Vektoren v1 , . . . , vn heißen eine Basis von V , wenn jeder Vektor x ∈ V eine eindeutige Darstellung x = α 1 v1 + · · · + α n v n besitzt. Dann heißt α1 a = ... ∈ Rn (Cn ) αn der Koordinatenvektor von x zur Basis v1 , . . . , vn . Höhere Mathematik 114 Basen im Rn und Cn Vektorräume Wichtiges Beispiel: Basen des Rn bzw. Cn 6.11 Basen im Rn und Cn Die Vektoren �v1 , . . . , �vn ∈ Rn (bzw. Cn ) bilden genau dann eine Basis von Rn (bzw. Cn ), wenn für jeden Vektor �x das Gleichungssystem λ1�v1 + · · · + λn�vn = �x eine eindeutige Lösung hat. In diesem Fall ist der Koordinatenvektor von �x ∈ Rn (bzw. Cn ) gegeben durch �a = (λ1 , . . . , λn )�. Wir sehen also, dass jede Basis von Rn (bzw. Cn ) aus genau n Vektoren besteht. Höhere Mathematik 115 Vektorräume 6.12 Definition und Satz Dimension Definition und Satz Dimension Hat der Vektorraum V eine Basis aus n Vektoren v1 , . . . , vn ∈ V , so besteht jede andere Basis von V ebenfalls aus n Vektoren. Die Zahl n heißt dann die Dimension von V , geschrieben dim V = n. Besitzt der Vektorraum V keine endliche Basis, so heißt V unendlich-dimensional, geschrieben dim V = ∞. Höhere Mathematik 116 Vektorräume Satz: Dimensionsformel Definition: Kern Die Lösungsmenge eines homogenen linearen Gleichungssystems wird mit Kern bezeichnet. 6.13 Satz: Dimensionsformel Für ein lineares homogenes Gleichungssystem mit m Gleichungen und n Variablen gelte Rang A = r . Dann ist die Lösungsmenge des LGS ein Unter-Vektorraum des Rn mit der Dimension n − r , d.h. dim(Kern A) = n − Rang A Höhere Mathematik (Dimensionsformel) 117 Vektorräume Satz: Dimensionsformel Beweis: Wir verwenden die spezielle reduzierte Stufenform des homogenen LGS y1 1 0 . .. 0 0 0 .. . 0 y2 0 1 .. . ··· ··· ··· ··· y3 ··· 0 .. . 0 0 ··· ··· ··· .. . 1 0 ··· ··· yr 0 0 .. . 0 1 0 .. . 0 yr +1 b1,r +1 b2,r +1 .. . br −1,r +1 br ,r +1 0 .. . 0 ··· ··· ··· ··· ··· ··· ··· yn b1,n b2,n .. . br −1,n br ,n 0 .. . 0 r.S. 0 0 .. . 0 0 0 .. . 0 m − r Gl. Dabei ist (y1 , . . . , yn ) eine Umnummerierung der Komponenten des Vektors (x1 , . . . , xn ), je nach durchgeführten Spaltenvertauschungen. Falls r = n ist, so ist die Lösungsmenge der Nullraum Kern A = {�0}. Falls r < n ist, so erhält man eine Basis von Kern A durch Einsetzen von Nullen und jeweils einer 1 für die freien Variablen yr +1 , . . . , yn : Höhere Mathematik 118 Vektorräume Satz: Dimensionsformel −b1,r +1 .. . −br ,r +1 1 �1 = w , 0 0 .. . 0 −b1,r +2 .. . −br ,r +2 0 �2 = w , 1 0 .. . 0 ..., � n−r w −b1,n . . . −br ,n 0 = . 0 .. . 0 1 Die Basis der Vektoren �vj ∈ Rn von Kern A ergibt sich dann durch Umnummerierung �j, 1 ≤ j ≤ n − r. (Zeilentausch) der Komponenten der Vektoren w Höhere Mathematik 119 Vektorräume 6.14 Definition: lineare Abhängigkeit Definition: lineare Abhängigkeit Die Elemente v1 , . . . , vk ∈ V eines Vektorraums V heißen linear abhängig, wenn es eine Linearkombination k � αj vj = �0 j=1 mit |α1 | + · · · + |αk | = � 0 gibt (das ist eine Linearkombination, in der nicht alle Skalare Null sind). Andernfalls heißen die Elemente v1 , . . . , vk ∈ V linear unabhängig. Höhere Mathematik 120 Vektorräume Existenz von Basen Die folgenden allgemeinen Aussagen helfen beim Umgang mit Vektorräumen und Unter-Vektorräumen. 6.15 Existenz von Basen Jeder Vektorraum besitzt eine Basis. Jede Familie v1 , . . . , vk ∈ V von linear unabhängigen Vektoren lässt sich zu einer Basis von V ergänzen. Höhere Mathematik 121 Vektorräume 6.16 Beispiel: Polynome Pn Beispiel: Polynome Pn Der Vektorraum Pn der Polynome vom Grad ≤ n mit komplexen Koeffizienten ist ein komplexer Vektorraum der Dimension n + 1. a) Die Basis der Monome ist m0 (x) = 1, m1 (x) = x, . . . , mn (x) = x n , � und der Koeffizientenvektor von p(x) = nk=0 ak x k ist (a0 , . . . , an )� ∈ Cn+1 . Höhere Mathematik 122 Vektorräume 6.17 Der Vektorraum der reellen Funktionen Der Vektorraum der reellen Funktionen Der Vektorraum V = {f | f : R → R ist eine Funktion} ist unendlich-dimensional. Höhere Mathematik 123 Vektorräume Orthonormalsysteme und -basen In Vektorräumen mit Skalarprodukt sind Basen mit einer Orthogonalitätsrelation besonders interessant: 6.18 Orthonormalsysteme und -basen Die Vektoren v1 bis vn bilden eine Orthonormalsystem (ONS), wenn gilt Für i �= j ist �vi , vj � = 0 � Stets ist �vi � = �vi , vi � = 1. � 1 i =j Mit dem Kroneckersymbol δij = schreibt sich das als �vi , vj � = δij . 0 i �= j Eine Orthonormalbasis (ONB) ist eine Basis, die eine ONS ist. Die Vektoren eines ONS stehen also paarweise senkrecht aufeinander und haben die Länge 1. Höhere Mathematik 124 Vektorräume Gram-Schmidt Orthogonalisierung Aus linear unabhängigen Vektoren u1 , . . . , uk ∈ V erhält man mit dem folgenden Algorithmus eine Orthonormalbasis w1 , . . . , wk 6.19 von Span(u1 , . . . , uk ) Gram-Schmidt Orthogonalisierung 1. Setze v1 = u1 (Initialisierung) 2. Für � = 2, 3, . . . , k setze (Iteration) �u� , v1 � �u� , v�−1 � v� = u � − v1 − · · · − v�−1 �v1 , v1 � �v�−1 , v�−1 � 3. Für � = 1, 2, . . . , k setze (Normierung) 1 w� = v� �v� � Höhere Mathematik 125 Vektorräume Besonderheiten bei ONS und ONB Der Hauptvorteil bei ONB liegt daran, dass man Koeffizienten in Linearkombinationen berechnen kann, ohne ein Gleichungssystem zu lösen. 6.20 Besonderheiten bei ONS und ONB Die Elemente eines ONS sind stets linear unabhängig. Sei v1 , . . . , vk eine ONB, w = α1 v1 + · · · + αk vk . Dann ist αj = �w , vj �. Ist v1 , . . . , vk eine � ONB und w = α1 v1 + · · · + αk vk . k Dann ist �w �2 = j=1 |αj |2 . Höhere Mathematik 126 Matrizen 7.1 Matrizen Matrizen Die Kurzschreibweise von LGS führt zum Begriff der Matrix. 7.1 Matrizen Eine (m, n)-Matrix ist ein mn-Tupel von Zahlen, die zu einem rechteckigen Schema aus m Zeilen und n Spalten angeordnet sind: a1,1 a1,2 · · · a1,n a2,1 a2,2 · · · a2,n A= . = (ai,k ) i=1,...,m . . .. .. .. k=1,...,n am,1 am,2 ··· am,n Die ai,k heißen die Koeffizienten (oder Einträge) der Matrix A. 0 := 0 . . . 0 Höhere Mathematik 0 . . . 0 ··· ··· 0 . . Nullmatrix . 0 m×n 1 0 En := . . . 0 1 ··· .. . .. .. 0 . ··· 0 . 0 . . . Einheitsmatrix 0 1 n×n 127 Matrizen Matrizen - Addition und Skalarmultiplikation Spaltenvektoren können als Matrizen mit einer Spalte, Zeilenvektoren als Matrizen mit einer Zeile betrachtet werden. 7.2 Matrizen - Addition und Skalarmultiplikation Die Menge aller (m, n)-Matrizen mit reellen Koeffizienten wird mit Mat(m, n) oder Rm×n bzw. Cm×n bezeichnet. Diese Menge ist ein Vektorraum mit den Operationen (ai,k )m×n + (bi,k )m×n = (ai,k + bi,k )m×n , α(ai,k )m×n = (αai,k )m×n Man kann nur Matrizen gleicher Dimensionen addieren. Die Nullmatrix (0)m×n ist das neutrale Element der Addition. Für Matrizen A, B ∈ Mat(m, n) bedeutet A = B, dass ai,k = bi,k für alle 1 ≤ i ≤ m, 1 ≤ k ≤ n gilt. Höhere Mathematik 128 Matrizen Produkte von Matrizen und Vektoren Wir schreiben eine Matrix A ∈ Mat(m, n) häufig mit Hilfe ihrer Spaltenvektoren a1,k �ak = ... . A = (�a1 , . . . ,�an ), am,k 7.3 Produkte von Matrizen und Vektoren Die Matrix A ∈ Mat(m, n) habe die Spalten �a1 bis �an . Das Produkt von A wird mit dem Vektor �x = (x1 , . . . , xn )� ist die Linearkombination der �ai mit den xi als Koeffizienten, also A�x = x1�a1 + · · · + xn�an . Hat die Matrix B ∈ Mat(n, p) die Spalten �b1 bis �bp , so hat das Matrizenprodukt AB die Spalten A�b1 bis A�bp . Für die einzelnen Einträge bedeutet dies: Höhere Mathematik 129 Matrizen 7.4 Matrizenprodukt Matrizenprodukt Es seien m, n, p ∈ N sowie A = (ai,k )m×n ∈ Mat(m, n) und B = (bk,j )n×p ∈ Mat(n, p). Dann ist das Matrixprodukt C := AB ∈ Mat(m, p) definiert mit den Komponenten ci,j = n � ai,k bk,j “Zeile i mal Spalte j” k=1 B → ∗ b1,j ∗ ∗ b2,j ∗ ∗ b3,j ∗ .. . ∗ ai,1 ∗ ai,2 ∗ ai,3 ∗ ∗ ∗ Höhere Mathematik A ··· ··· ··· .. . .. . ci,j C = AB 130 Matrizen Matrizenprodukt Bemerkung: Die Merkregel “Zeile mal Spalte” ergibt: Die i-te Zeile des Produkts AB hängt nur von der i-ten Zeile von A ab. Insbesondere gilt: Ist in (0, . . . , 0, 1, 0, . . . , 0) die 1 an der i-ten Stelle, so ergibt (0, . . . , 0, 1, 0, . . . , 0)B die i-te Zeile von B A�ej ergibt die j-te Spalte von A. Mit den obigen Beobachtungen ergibt sich: Die Einheitsmatrizen sind die neutralen Elemente des Matrixprodukts, d.h. für A ∈ Mat(m, n) gilt Em A = AEn = A. Höhere Mathematik 131 Matrizen 7.5 Rechenregeln Rechenregeln Gegeben seien Matrizen A, B, C so, dass die entsprechenden Produkte definiert sind. a) Es gelten das Assoziativ- und das Distributiv-Gesetz: A(BC ) = (AB)C , (A + B)C = AC + BC , A(B + C ) = AB + AC . b) Das Matrixprodukt ist nicht kommutativ. Bemerkung: zu (b): Wenn A ∈ Mat(m, n) und B ∈ Mat(n, p), so ist AB definiert, jedoch ist BA nur im Fall p = m definiert. Selbst wenn beide Produkte AB und BA definiert sind, so sind die Matrizen oft verschieden. Höhere Mathematik 132 Matrizen 7.6 Bemerkung zum Matrixprodukt Bemerkung zum Matrixprodukt Das Produkt mit der Nullmatrix ergibt die Nullmatrix. Aber: Aus AB = (0)m×p folgt nicht, dass A oder B eine Nullmatrix ist. Ebenso gilt im allgemeinen nicht die Kürzungsregel: aus AB = AC folgt i.a. nicht die Gleichheit von B und C . Hierzu muss A eine Zusatzbedingung erfüllen (siehe invertierbare Matrizen, reguläre Matrizen). Wenn man das Produkt eines Vektors mit einer Zahl als Matrizenprodukt auffassen will, muss die Zahl rechts vom Vektor stehen. Höhere Mathematik 133 Matrizen 7.7 Matrix-Form des linearen Gleichungssystems Matrix-Form des linearen Gleichungssystems Für A ∈ Mat(m, n), einen Spaltenvektor �b ∈ Rm sowie einen Spaltenvektor �x ∈ Rn lässt sich das inhomogene Gleichungssystem (*) in 3.4 schreiben als A�x = �b. A heißt die Koeffizientenmatrix des linearen Gleichungssystems und �b die rechte Seite. Das lineare Gleichungssystem A�x = �b ist genau dann lösbar, wenn die rechte Seite �b eine Linearkombination der Spaltenvektoren von A ist. Die elementaren Umformungen (E1)–(E4) lassen sich auf die Zeilen und Spalten der Matrix A anwenden, um eine reduzierte Stufenform von A zu erhalten. Der Rang der Matrix A ist dasselbe wie der Rang r der reduzierten Stufenform von A. Höhere Mathematik 134 Matrizen Matrix-Form des linearen Gleichungssystems Die Matrix à = (A, �b)m×(n+1) in der Kurzform des Gleichungssystems heißt die erweiterte Koeffizientenmatrix. Wir haben in 3.9 festgestellt, dass das inhomogene lineare Gleichungssystem genau dann lösbar ist, wenn Rang A = Rang à gilt. Weitere Aussagen in 3.9 erhalten nun die folgende Form: Rang A = m =⇒ das Gleichungssystem A�x = �b ist lösbar Rang A = n =⇒ das Gleichungssystem A�x = �b hat höchstens eine Lösung Rang A = m = n =⇒ das Gleichungssystem A�x = �b ist für jede rechte Seite �b eindeutig lösbar (universell eindeutig lösbar) Höhere Mathematik 135 Matrizen 7.8 Definition und Satz: Kern und Bildraum Definition und Satz: Kern und Bildraum Die Lösungsmenge des homogenen LGS A�x = �0 zur reellen Matrix A ∈ Mat(m, n) ist ein Vektorraum. Dieser Vektorraum ist ein Untervektorraum von Rn bzw. Cn und wird wie in 6.13 mit Kern bezeichnet. Kern A = {�x ∈ Rn | A�x = �0} Für eine Matrix A = (�a1 , . . . ,�an ) ∈ Mat(m, n) mit Spaltenvektoren �ak heißt der Unter-Vektorraum Bild A = Span(�a1 , . . . ,�an ) der Bildraum von A. Es gilt Rang A = dim(Bild A), also mit der Dimensionsformel dim(Kern A) + dim(Bild A) = n. Höhere Mathematik (∗) 136 Matrizen Definition und Satz: Kern und Bildraum Bemerkung: Hieraus folgt, dass sich der Rang einer Matrix auf zwei verschiedene Weisen darstellen lässt: r = Rang A ist die maximale Anzahl von linear unabhängigen Zeilen von A; das bedeutet dim(Kern A) = n − r . r = Rang A ist die maximale Anzahl von linear unabhängigen Spalten von A; das bedeutet dim(Bild A) = r . Höhere Mathematik 137 Matrizen Definition: Transponierte Eine weitere Operation für Matrizen: 7.9 Definition: Transponierte Die zu a1,1 a2,1 A= . .. am,1 a1,2 a2,2 .. . ··· ··· am,2 ··· transponierte Matrix ist a1,1 a1,2 A� = . .. a1,n a2,1 a2,2 .. . ··· ··· a2,n ··· a1,n a2,n .. ∈ Mat(m, n) . am,n am,1 am,2 .. ∈ Mat(n, m). . am,n Die Adjungierte A∗ einer komplexen Matrix ist definiert durch ∗ A = Höhere Mathematik A� = A � 138 Matrizen 7.10 Transponierte, Adjungierte und Skalarprodukt Transponierte, Adjungierte und Skalarprodukt Sei A ∈ Mat(m, n). Dann gibt es genau eine Matrix B ∈ Mat(n, m), so dass für alle �x ∈ Rn und �y ∈ Rm gilt �A�x , �y � = ��x , B�y �. Es ist B = A�. Eine entsprechende Aussage gilt für komplexe Vektorräume und B = A∗ . Höhere Mathematik 139 Matrizen 7.11 Rechenregeln Rechenregeln Addition: Für A, B ∈ Mat(m, n) und α ∈ R gilt (A + B)� = A�+ B �, (αA)� = αA�. (A + B)∗ = A∗ + B ∗ , (αA)∗ = αA∗ . Matrixprodukt: Für A ∈ Mat(m, n) und B ∈ Mat(n, p) gilt (AB)� = B � A� und (AB)∗ = B ∗ A∗ Für jede Matrix A gilt (A�)� = A und (A∗ )∗ = A. Es gilt Rang A = Rang A� und Rang A = Rang A∗ . Es ist ��x , �y � = �y ��x bzw. ��x , �y � = �y ∗�x (Skalarprodukt als Matrizenprodukt). Höhere Mathematik 140 Matrizen 7.12 Rang von Produkten Rang von Produkten Für alle A ∈ Mat(m, n) und B ∈ Mat(n, p) gilt Rang(AB) ≤ min{Rang A, Rang B}. Höhere Mathematik 141 Matrizen Definition und Satz: Inverse Wir betrachten ab jetzt quadratische Matrizen A ∈ Mat(n, n) (Zeilenzahl = Spaltenzahl) 7.13 Definition und Satz: Inverse Gegeben sei A ∈ Mat(n, n). Falls es eine Matrix X ∈ Mat(n, n) mit AX = XA = En gibt, so heißt A invertierbar (oder regulär) und X = A−1 heißt die Inverse von A. Satz: a) Die Matrix A ∈ Mat(n, n) besitzt genau dann eine Inverse A−1 , wenn Rang A = n gilt. b) Falls A invertierbar ist, so ist die Inverse A−1 eindeutig bestimmt. Bemerkung; Es gibt viele Matrizen A ∈ Mat(n, n), die keine Inverse besitzen (nämlich alle Matrizen vom Rang r < n). Wir werden später sehen, dass die Bedingung det A �= 0 notwendig und hinreichend für die Invertierbarkeit von A ist. Höhere Mathematik 142 Matrizen 7.14 Beispiel Beispiel 1 Bestimme die Inverse (falls möglich) zu A = 1 1 Höhere Mathematik 2 1 1 3 2 1 143 Matrizen 7.15 Zwei nützliche Hilfsaussagen Zwei nützliche Hilfsaussagen Die Umformungen (E1) - (E3) des Gauß-Algorithmus lassen sich durch Multiplikation der (erweiterten) Matrix von links mit invertierbaren Matrizen darstellen. Wichtige Konsequenz aus 7.12 Falls A ∈ Mat(n, n) regulär ist, so gilt Höhere Mathematik Rang(AB) = Rang B für alle B ∈ Mat(n, p), Rang(CA) = Rang C für alle C ∈ Mat(p, n). 144 Matrizen 7.16 Satz: Lösbarkeit von LGS Satz: Lösbarkeit von LGS a) Falls A ∈ Mat(n, n) regulär ist, so ist das lineare Gleichungssystem A�x = �b universell eindeutig lösbar und die Lösung lautet �x = A−1�b. b) Falls A ∈ Mat(n, n) regulär ist, so gilt für Matrizen B, C ∈ Mat(n, p) die Kürzungsregel AB = AC ⇐⇒ B = C . c) Falls A, B ∈ Mat(n, n) beide regulär sind, so ist auch C = AB regulär und es gilt (AB)−1 = B −1 A−1 . d) Für reguläre Matrizen A ∈ Mat(n, n) gilt (A�)−1 = (A−1 )�. Höhere Mathematik 145 Matrizen Satz: Lösbarkeit von LGS Die Kürzungsregel besagt: Multiplikation beider Seiten eines linearen Gleichungssystems mit einer regulären Matrix ist eine Äquivalenzumformung: A�x = �b ⇐⇒ MA�x = M�b, Höhere Mathematik falls M ∈ Mat(m, m) regulär 146 Matrizen 7.17 Satz: Die Gruppe der regulären Matrizen Satz: Die Gruppe der regulären Matrizen Die regulären (n, n)-Matrizen bilden mit der Multiplikation die Gruppe Gl(n): das heißt: (G1) das Produkt C = AB zweier regulärer (n, n)-Matrizen ist eine reguläre (n, n)-Matrix, (G2) es gilt das Assoziativgesetz der Matrix-Multiplikation, (G3) die Einheitsmatrix En ist das eindeutige “neutrale” Element der Multiplikation, also AEn = En A = A für jede reguläre (n, n)-Matrix, (G4) zu jeder regulären (n, n)-Matrix A gibt es genau eine reguläre (n, n)-Matrix X mit AX = XA = En , nämlich X = A−1 . Beachte: Das Kommutativgesetz der Multiplikation gilt in Mat(n, n) nicht (für n ≥ 1). En−1 = En , denn En En = En Höhere Mathematik 147 Matrizen 7.18 Definition der Determinante Definition der Determinante Es gibt genau eine Abbildung det : MatR (n, n) → R, die einer reellen (n, n)-Matrix A ihre Determinante det A zuordnet, so dass folgende Eigenschaften erfüllt sind: � , · · · , �vn )� = det ist linear in jeder Zeile, d.h. det(�v1 , · · · , α�u + β w � , · · · , �vn )� α det(�v1 , · · · , �u , · · · , �vn )�+ β det(�v1 , · · · , w Die Determinante ist alternierend, d.h. det(�v1 , . . . , �vi , . . . , �vj , . . . , �vn )� = − det(�v1 , . . . , �vj , . . . , �vi , . . . , �vn )� Die Determinante ist normiert: det(En ) = 1. Analog gibt es eine Determinante det : MatC (n, n) → C für komplexe Matrizen mit den gleichen Eigenschaften. Wir werden noch Methoden zur Berechnung der Determinante erörtern. Höhere Mathematik 148 Matrizen 7.19 Determinanten für kleine n Determinanten für kleine n Für eine (1, 1)-Matrix A = (a) ist det A = a. �a b � Für eine (2, 2)-Matrix A = c d ist det A = ad − bc. Für eine (3, 3)-Matrix ist die Determinante a b c det d e f = aei + bfg + cdh − ceg − afh − bdi g h i Die Formel für (3, 3)-Matrizen kann man mit der Merkregel von Sarrus bestimmen. a b c a b d e f d e g h i g h −ceg −afh −bdi Höhere Mathematik +aei +bfg +cdh 149 Matrizen Geometrische Bedeutung der Determinante für n = 2 und n = 3 Die Determinante von (2, 2) und (3, 3)-Matrizen läßt sich wie folgt geometrisch interpretieren: � � � n = 2 Seien��v1 = (a, c) und v = (b, d) die Spaltenvektoren der Matrix 2 � a b A= . c d Dann ist | det A| der Flächeninhalt des von �v1 und �v2 aufgespannten Parallelogramms. Ist det A > 0, so ist der (entgegen des Uhrzeigersinns) orientierte Winkel ∠(�v1 , �v2 ) zwischen 0 und π ∼ = 180◦ . Ist det A < 0, so ist der (entgegen des Uhrzeigersinns) orientierte Winkel ∠(�v1 , �v2 ) zwischen π ∼ = 180◦ und 2π ∼ = 360◦ . n = 3 Seien �v1 = (a, d,g )�, �v2 = (b, e, h)� und �v3 = (c, f , i)� die Spaltenvektoren a b c der Matrix A = d e f . g h i Dann ist | det A| das Volumen des von �v1 , �v2 und �v3 aufgespannten Parallelepipeds. Ist det A > 0, so ist das Tripel (�v1 , �v2 , �v3 ) rechtshändig. Ist det A < 0, so ist das Tripel (�v1 , �v2 , �v3 ) linkshändig. Höhere Mathematik 150 Matrizen Determinante und Gaußalgorithmus Wendet man auf eine Matrix A ∈ M(n, n) den Gauß-Algorithmus an, so ändert sich die Determinante wie folgt: 7.21 Determinante und Gaußalgorithmus Gegeben sei A ∈ Mat(n, n). a) Vertauschen zweier Zeilen (Umformung E1) ändert det A um den Faktor −1. b) Multiplikation einer Zeile von A mit einer Zahl α ändert die Determinante um diesen Faktor α (Umformung E2). c) Addition eines Vielfachen der i-ten Zeile zur j-ten Zeile (mit i �= j) ändert det A nicht (Umformung E3). d) Hat A eine Nullzeile oder sind zwei Zeilen gleich, so ist det A = 0. Höhere Mathematik 151 Matrizen Charakterisierung regulärer Matrizen Wir können nun die folgenden Aussagen zur Lösbarkeit des linearen Gleichungssystems A�x = �b mit einer (n, n)-Matrix A formulieren. 7.22 Charakterisierung regulärer Matrizen Für A ∈ Mat(n, n) sind folgende Aussagen äquivalent: (i) A ist regulär. (ii) Rang A = n. (iii) det A �= 0. (iv) Das homogene LGS A�x = �0 hat als einzige Lösung �x = �0. (v) Das LGS A�x = �b ist universell eindeutig lösbar. Höhere Mathematik 152 Matrizen Charakterisierung regulärer Matrizen Man nennt eine Matrix a1,1 a1,2 0 a2,2 .. .. . A= . .. . 0 ··· der Form a1,3 a2,3 .. . ··· ··· .. .. . ··· . 0 a1,n a2,n .. . , an−1,n an,n also ai,k = 0 für i > k, eine obere Dreiecksmatrix, und entsprechend definiert man eine untere Dreiecksmatrix als eine Matrix mit ai,k = 0 für i < k. 7.22 Charakterisierung regulärer Matrizen Für eine obere Dreiecksmatrix (oder untere Dreieksmatrix) A ∈ Mat(n, n) ist det A das Produkt der Diagonal-Elemente, also det A = a1,1 a2,2 · · · an,n . Um die Determinante mit dem Gauß-Algorithmus zu bestimmen, genügt es, die Matrix in obere Dreiecksform zu bringen, dann kann man die Determinante direkt ablesen. Höhere Mathematik 153 Matrizen Elementarmatrizen Als Elementarmatrizen bezeichnet man (n × n)-Matrizen von einer der folgenden drei Gestalten: Für i �= j ist Pij die Matrix, die entsteht, wenn in i-te und j-te Zeile vertauscht werden. 1 .. . λ Für i �= j und λ ∈ R ist Qij (λ) := .. . der Einheitsmatrix En die , d.h. auf der 1 Diagonalen sind alle Einträge 1, der Eintrag in der i-ten Zeile und j-ten Spalte ist λ, die übrigen Einträge sind 0. Für λ �= 0 ist Si (λ) die Matrix, die entsteht, wenn die i-te Zeile der Einheitsmatrix En mit λ multipliziert wird, d.h. 1 . . . λ Si (λ) := .. . 1 Höhere Mathematik 154 Matrizen Eigenschaften der Elementarmatrizen Für die Elementarmatrizen gelten folgende Eigenschaften: Jede Elementarmatrix ist regulär. Für die Determinante gilt: det Pij = −1, det Qij (λ) = 1, det Si (λ) = λ �= 0. Die Inverse einer Elementarmatrix ist wieder eine Elementarmatrix. Dabei gilt: (Pij )−1 = Pij , (Qij (λ))−1 = Qij (−λ), (Si (λ))−1 = Si (λ−1 ). Die Transponierte einer Elementarmatrix ist wieder eine Elementarmatrix. Dabei gilt: (Pij )� = Pij , (Qij (λ))� = Qji (λ), (Si (λ))� = Si (λ). Insbesondere gilt also für jede Elementarmatrix R: det R � = det R. Die Schritte des Gaußalgorithmus lassen sich deuten als Multiplikation mit Elementarmatrizen: Ist A ∈ M(n, n), so ist Pij A die Matrix, die aus A entsteht, wenn die i-te und j-te Zeile vertauscht werden. Qij (λ)A die Matrix, die aus A entsteht, wenn das λ-fache der j-ten Zeile zur i-ten Zeile addiert wird. Si (λ)A die Matrix, die aus A entsteht, wenn die i-te Zeile mit λ multipliziert wird. Höhere Mathematik 155 Matrizen Darstellung durch Elementarmatrizen Durch Anwendung des Gauß-Algorithmus kann man nun folgende wichtige Eigenschaft zeigen: 7.25 Darstellung durch Elementarmatrizen Ist A ∈ M(n, n) regulär, so lässt sich A als Produkt von Elementarmatrizen schreiben, d.h. A = R1 · . . . · Rk , wobei R1 , . . . , Rk Elementarmatrizen sind. Höhere Mathematik 156 Matrizen 7.26 Funktionalgleichung der Determinante Funktionalgleichung der Determinante Für Matrizen A, B ∈ M(n, n) gilt: a) det(AB) = det A det B. b) det(A�) = det A. c) Ist A regulär, so ist det(A−1 ) = Höhere Mathematik 1 det A . 157 Matrizen Funktionalgleichung der Determinante Die Identität det A� = det A hat folgende Konsequenzen: det ist linear in jeder Spalte, d.h.: det(�v1 , · · · , � , · · · , �vn ) = α�u + β w � , · · · , �vn ) α det(�v1 , · · · , �u , · · · , �vn ) + β det(�v1 , · · · , w Vertauscht man zwei Spalten einer Matrix, so wird die Determinante mit −1 multipliziert. Die Determinante einer Matrix ändert sich nicht, wenn man ein Vielfaches einer Spalte zu einer anderen Spalte addiert. Höhere Mathematik 158 Matrizen 7.27 Zeilenentwicklung und Spaltenentwicklung der Determinante Zeilenentwicklung und Spaltenentwicklung der Determinante Für eine (n, n)-Matrix A = (ai,k )n×n kann die Determinante det A durch folgende Formeln bestimmt werden: n � det A = (−1)j+k aj,k det(Aj,k ) (“Entwicklung nach der j-ten Zeile”) det A = k=1 n � (−1)i+� ai,� det(Ai,� ) (“Entwicklung nach der �-ten Spalte”) i=1 wobei die (n − 1, n − 1)-Matrix Aj,k aus A durch Streichen der j-ten Zeile und der k-ten Spalte hervorgeht. Höhere Mathematik 159 Matrizen Beispiele Beispiele: 1 5 Bestimme die Determinante der Matrix A = 3 6 Berechne det A mit dem Gauß-Algorithmus: 1 5 3 6 1 1 3 6 1 0 0 0 Höhere Mathematik −1 2 2 0 1 0 7 −2 2 0 5 −1 2 1 0 7 −2 2 0 5 − 75 2 − 15 0 23 −2 5 3 0 4 6 0 3 4 6 0 3 4 6 −1 2 1 7 2 0 0 −2 3 0 4 6 tausche Gl.1 und Gl.2 dividiere Gl.2 durch 5 subtrahiere Gl.1 subtrahiere 3*Gl.1 subtrahiere 6*Gl.1 tausche Gl.2 und Gl.3 multipliziere Gl.3 mit -5 160 Matrizen Beispiele 1 2 5 0 0 −20 0 1 0 0 − 75 2 0 1 0 0 0 1 0 0 0 23 5 2 5 1 0 0 2 5 1 0 0 −2 0 0 2 −2 0 0 2 0 3 6 0 −20 −25 98 0 −20 −25 73 7 *Gl.2 5 subtrahiere 23 *Gl.2 5 addiere addiere Gl.3 Mit 2 Vertauschungen und den Multiplikationen ergibt sich 1 det A = (−1)2 · 5 · (− ) · 146 = −146. 5 Höhere Mathematik 161 Matrizen Beispiele Berechne det A DurchZeilen- oder Spaltenentwicklung: Für 1 −1 2 3 5 2 0 0 ←− Entw. n. d. 2. Zeile A= 3 1 0 4 6 7 −2 6 ist det A = −5 det A2,1 + 2 det A2,2 = −5 · 30 + 2 · 2 = −146. Berechnet man die Determinante nach der Zeilen- bzw. Spaltenentwicklung, so erhält man eine Summe mit n! Summanden. Daher ist es in der Regel günstiger, ab n ≥ 5 den Gaußalgorithmus zu verwenden. Höhere Mathematik 162 Matrizen Cramersche Regel Für kleine Matrizen und weitere Anwendungen ist die folgende Regel wichtig. 7.29 Cramersche Regel Die Matrix A ∈ Mat(n, n) sei regulär. Die Komponenten des eindeutigen Lösungsvektors �x von A�x = �b haben die Darstellung a1,1 · · · a1,j−1 b1 a1,j+1 · · · a1,n 1 .. .. .. .. xj = det ... . . . . det A an,1 · · · an,j−1 bn an,j+1 · · · an,n Höhere Mathematik 163 Matrizen Satz: Adjunktenform der Inversen Mit der Cramerschen Regel kann man auch eine Darstellung für die Inverse von A erhalten. 7.30 Satz: Adjunktenform der Inversen Die Inverse einer regulären Matrix A hat die Form A Höhere Mathematik −1 1 � = (αj,k )n×n det A mit αj,k = (−1)j+k det Aj,k . 164 Matrizen Satz: Adjunktenform der Inversen Beispiel zur � Cramerschen � � Regel: � 1 3 Löse das LGS 2 �x = 4 7 . 8 � � 1 2 Es ist det = −2, also nach der Cramerschen Regel x1 = 3 4 � � 1 7 det 3 8 13 x2 = = −2 2 Weiter: � 1 3 Allgemein: 2 4 � a c invertierbar. Höhere Mathematik �−1 � � 1 4 −2 = 1 −2 −3 �−1 � 1 b d = d ad − bc −c � 7 det 8 −2 2 4 � = −6 � −b , falls ad − bc �= 0; sonst ist die Matrix nicht a 165 Lineare Abbildungen Definition: Lineare Abbildung Die wichtigste Klasse von Funktionen zwischen Vektorräumen sind die linearen Abbildungen. 8.1 Definition: Lineare Abbildung Eine Funktion f : V → W zwischen Vektorräumen V und W heißt linear, wenn für alle v1 , v2 ∈ V und alle Skalare α1 , α2 gilt f (α1 v1 + α2 v2 ) = α1 f (v1 ) + α2 f (v2 ). Höhere Mathematik 166 Lineare Abbildungen 8.2 Linearität und Basen Linearität und Basen Gegeben seien Vektorräume V und W sowie eine Basis v1 , . . . , vn von V . Jede lineare Abbildung f : V → W ist durch die Bilder der Basiselemente f (vk ) ∈ W , 1 ≤ k ≤ n, eindeutig festgelegt; denn für einen beliebigen Vektor x ∈ V mit der eindeutigen Darstellung x= n � α k vk n � αk f (vk ). k=1 gilt aufgrund der Linearität von f f (x) = k=1 Höhere Mathematik 167 Lineare Abbildungen 8.3 Matrixdarstellung linearer Abbildungen Matrixdarstellung linearer Abbildungen Sei v1 , . . . , vn eine Basis von V und w1 , . . . , wm eine Basis von W . Sei f : V → W eine lineare Abbildung. Für die Bilder f (vk ) existiert eine eindeutige Darstellung f (vk ) = β1,k w1 + · · · + βm,k wm mit Skalaren βi,k , 1 ≤ i ≤ m, 1 ≤ k ≤ n. Die Matrix β1,1 A = ... βm,1 ··· ··· β1,n .. . βm,n heißt die Darstellungsmatrix der linearen Abbildung f bzgl. der gegebenen Basen von V und W . Besitzt x ∈ V den Koordinatenvektor �a ∈ Rn (oder Cn ) bzgl. der Basis v1 , . . . , vn von V , so ist �b = A�a der Koordinatenvektor von f (x) bzgl. der Basis w1 , . . . , wm von W . Höhere Mathematik 168 Lineare Abbildungen Eigenschaften der Darstellungsmatrix Wie lassen sich Eigenschaften von f durch Eigenschaften der Darstellungsmatrix ausdrücken? 8.4 Eigenschaften der Darstellungsmatrix Gegeben seien Vektorräume V und W der Dimensionen dim V = n, dim W = m. Die lineare Abbildung f : V → W habe die Darstellungsmatrix A ∈ Mat(m, n) bzgl. gegebener Basen von V und W . Dann gilt: Der Bildraum Bild(f ) = {f (�v ) | �v ∈ V } ist ein Unter-Vektorraum von W der Dimension dim(Bild(f )) = Rang A. f ist genau dann surjektiv, wenn Rang A = m gilt. f ist genau dann injektiv, wenn Rang A = n gilt. f ist genau dann bijektiv, wenn m = n und Rang A = n gilt. (Dies ist äquivalent zu det A �= 0.) Höhere Mathematik 169 Lineare Abbildungen Basiswechsel Wir betrachten ab jetzt lineare Abbildungen f : V → V und V = Rn oder Cn . Im Definitions- und im Wertebereich verwenden wir die gleiche Basis �v1 , . . . , �vn zur Bestimmung der Matrixdarstellung von f . 8.5 Basiswechsel Gegeben sei eine lineare Abbildung f : V → V (mit V = Rn oder Cn ) sowie die Darstellungsmatrix A ∈ Mat(n, n) von f bzgl. der Basis �v1 , . . . , �vn (sowohl im Definitions- als auch im Wertebereich). � 1, . . . , w � n von V Dann ist die Darstellungsmatrix von f bzgl. einer weiteren Basis w gegeben durch B = S −1 AS. Hierbei ist S ∈ Mat(n, n) die reguläre Matrix, deren Spaltenvektor �sk = (s1,k , . . . , sn,k )� der Koordinatenvektor von w � k bzgl. der Basis �v1 , . . . , �vn ist, also � k = s1,k �v1 + · · · + sn,k �vn , w 1 ≤ k ≤ n. erfüllt. Die Darstellungsmatrizen A und B = S −1 AS heißen ähnlich. Höhere Mathematik 170 Lineare Abbildungen Basiswechsel Bemerkung: Ähnliche Matrizen haben den gleichen Rang und dieselbe Determinante: Rang(S −1 AS) = Rang(AS) = Rang A, weil die Multiplikation mit regulären Matrizen (hier S bzw. S −1 ) den Rang nicht verändert. Mit dem Multiplikationssatz (Bemerkung vor 5.33) folgt det(S Höhere Mathematik −1 AS) = det S −1 1 det A det S = det A det S = det A. det S 171 Lineare Abbildungen Basiswechsel Motivation für die Eigenvektoren Eine schöne Interpretation vieler linearer Abbildungen f erhält man dadurch, dass man durch geschickte Wahl der Basis eine Diagonalmatrix λ1 0 · · · 0 .. 0 λ2 . . . . , B= . also bi,k = 0 für i �= k, . . .. .. 0 .. 0 ··· 0 λn als Darstellungsmatrix erhält. Dann lässt f die Richtung der Basisvektoren �vk (bis auf Umkehrung für λk < 0) unverändert. Dadurch erhält man eine schöne geometrische Interpretation von f . Höhere Mathematik 172 Lineare Abbildungen 8.6 Definition: Eigenwert, Eigenvektor Definition: Eigenwert, Eigenvektor Gegeben sei eine lineare Abbildung f : V → V . Ein Vektor �v ∈ V , �v �= �0 heißt Eigenvektor (kurz: EV) von f , wenn es ein Skalar λ gibt mit f (�v ) = λ�v . Das Skalar λ heißt dann der Eigenwert (kurz EW) zum Eigenvektor �v �= �0. Höhere Mathematik 173 Lineare Abbildungen Satz: Berechnung von EW und EV Die Berechnung von Eigenwerten und Eigenvektoren erfolgt über eine Matrix-Darstellung von f in zwei Schritten. 8.7 Satz: Berechnung von EW und EV Gegeben sei eine lineare Abbildung f : V → V sowie eine Basis �v1 , . . . , �vn von V (also dim V = n). Das Skalar λ ist genau dann ein Eigenwert von f , wenn für die Darstellungsmatrix A ∈ Mat(n, n) von f gilt det(A − λEn ) = 0. (∗) Zu einem Eigenwert λ ist Kern(A − λEn ) der Unter-Vektorraum der Koordinatenvektoren aller Eigenvektoren von f zum Eigenwert λ (sowie zusätzlich �0): Vλ = {�x ∈ V | f (�x ) = λ�x } � � n � = �x ∈ V | �x = αk �vk , (α1 , . . . , αn )� ∈ Kern(A − λEn ) . k=1 Höhere Mathematik 174 Lineare Abbildungen Satz: Berechnung von EW und EV Bemerkung: Im ersten Schritt bestimmt man alle Eigenwerte von f , indem man alle Nullstellen des charakteristischen Polynoms pA (λ) = det(A − λEn ) der Darstellungsmatrix A berechnet. Nach dem Fundamentalsatz der Algebra gibt es (in C) genau n Eigenwerte unter Berücksichtigung der Vielfachheit mλ der Nullstelle λ. Die Zahl mλ heißt die algebraische Vielfachheit des Eigenwerts λ. Im zweiten Schritt berechnet man zu jedem Eigenwert λ eine Basis von Kern(A − λEn ) durch Lösen des homogenen LGS (A − λEn )�x = �0. Wegen det(A − λEn ) = 0 gibt es nicht-triviale Lösungen. Die Zahl � λ = dim(Kern(A − λEn )) = n − Rang(A − λEn ) m nennt man die geometrische Vielfachheit des Eigenwerts λ. � λ ≤ mλ . (o.B.) Es gilt stets m Höhere Mathematik 175 Lineare Abbildungen Lemma Weitere Eigenschaften des charakteristschen Polynoms Die Summe der Eigenwerte ist die� Spur der Matrix A: der Koeffizient von n (−1)n−1 λn−1 ist gleich spur A := i=1 aii . Für eine 2 × 2-Matrix ist stets p(λ) = λ2 − spur A · λ + det A. 8.8 Lemma Die Eigenwerte und Eigenvektoren der linearen Abbildung f : V → V hängen nicht von der gewählten Basis von V ab; insbesondere gilt für zwei ähnliche Matrizen A und B = S −1 AS (mit regulärer Matrix S) die Identität pA (λ) = pB (λ). Für die Koordinatenvektoren gilt: Ist �a der Koordinatenvektor des Eigenvektors �v zu der Basis, die die Darstellungsmatrix A von f definiert, so ist �b = S −1�a der Koordinatenvektor desselben Eigenvektors �v zu der Basis, die die Darstellungsmatrix B = S −1 AS definiert (siehe Basiswechsel 8.5). Höhere Mathematik 176 Lineare Abbildungen Definition: diagonalisierbar Die anfangs erwähnte “schöne” Darstellung einer linearen Abbildung durch eine Diagonalmatrix kann nur dann erzielt werden, wenn die folgende Eigenschaft gilt. 8.9 Definition: diagonalisierbar Eine lineare Abbildung f : V → V (mit dim V = n) heißt diagonalisierbar, wenn es eine Basis von Eigenvektoren �v1 , . . . , �vn von f gibt. Dann gilt: Die Darstellungsmatrix bzgl. der Basis der Eigenwerte λ1 0 J= .. . 0 Eigenvektoren ist die Diagonalmatrix der 0 λ2 .. . ··· ··· .. . .. . 0 0 .. . . 0 λn � 1, . . . , w � n ist ähnlich zu dieser Die Darstellungsmatrix A bzgl. irgendeiner Basis w Diagonalmatrix, d.h. es gibt eine reguläre Matrix S mit S −1 AS = J. Die hierzu äquivalente Beziehung AS = SJ drückt aus, dass die Spalten von S die Eigenvektoren der Matrix A mit zugehörigen Eigenwerten λ1 , . . . , λn sind. Höhere Mathematik 177 Lineare Abbildungen Kriterien für Diagonalisierbarkeit Wir behandeln zwei Fälle, in denen die Diagonalisierbarkeit vorliegt. 8.10 Kriterien für Diagonalisierbarkeit Gegeben sei eine lineare Abbildung f : V → V mit dim V = n. Besitzt f paarweise verschiedene Eigenwerte λ1 , . . . , λn , so ist f diagonalisierbar. Als Beweis dient die folgende Aussage: 8.11 Satz: lineare Unabhängigkeit der Eigenvektoren Eigenvektoren �v1 , . . . , �vk einer linearen Abbildung f : V → V zu paarweise verschiedenen Eigenwerten λ1 , . . . , λk sind linear unabhängig. Höhere Mathematik 178 Lineare Abbildungen Bemerkung: Weiteres Kriterium 8.12 Bemerkung: Weiteres Kriterium Eine Erweiterung von 8.11 ergibt die folgende Aussage: Die lineare Abbildung f : V → V (mit dim V = n) ist genau dann diagonalisierbar, wenn für jeden Eigenwert λ von f die algebraische Vielfachheit und die geometrische Vielfachheit übereinstimmen, wenn also mλ = m̃λ gilt. Eine Basis von Eigenvektoren von f erhält man, indem man für jeden Eigenraum Vλ eine Basis aus mλ Vektoren bestimmt. Die Gesamtheit dieser Vektoren ist dann eine Basis des Vektorraums V . Höhere Mathematik 179 Lineare Abbildungen Definition: symmetrische und hermitesche Matrizen Die zweite Klasse diagonalisierbarer Matrizen tritt in vielen Anwendungen auf. 8.13 Definition: symmetrische und hermitesche Matrizen Eine reelle n × n-Matrix A heißt symmetrisch, wenn A� = A gilt. Eine komplexe n × n-Matrix A heißt hermitesch, wenn A∗ = A gilt. Höhere Mathematik 180 Lineare Abbildungen 8.14 Diagonalisierbarkeit symmetrischer und hermitescher Matrizen Diagonalisierbarkeit symmetrischer und hermitescher Matrizen Alle Eigenwerte einer reell-symmetrischen oder einer komplex-hermiteschen n × n-Matrix A sind reell, und A ist diagonalisierbar: es existiert sogar eine Orthonormalbasis �v1 , . . . , �vn von Eigenvektoren von A. Das bedeutet, dass A eine Darstellung A = UDU � bzw. A = UDU ∗ mit einer reellen Diagonalmatrix D und einer orthogonalen bzw. unitären Matrix U hat. Orthogonal bzw. unitär nennt man Matrizen U, deren Spalten eine ONB bilden. Dann gilt, dass U � = U −1 bzw. U ∗ = U −1 ist. Dieses wird in 9.1 genauer behandelt. Höhere Mathematik 181 Lineare Abbildungen Weitere Eigenschaften Zur Berechnung der Eigenvektoren und zur Probe sind die folgenden Aussagen hilfreich, die eine Verschärfung von Satz 8.14 darstellen: 8.15 Weitere Eigenschaften (a) Eigenvektoren �v1 , . . . , �vk einer reell-symmetrischen (oder hermiteschen) Matrix zu paarweise verschiedenen Eigenwerten sind paarweise orthogonal. (b) Für einen Eigenwert λ einer reell-symmetrischen (oder hermiteschen) Matrix A ∈ Mat(n, n) bezeichne mλ die algebraische Vielfachheit (als Nullstelle des charakteristischen Polynoms). Dann gilt dim(Kern(A − λEn )) = mλ , d.h. die algebraische und die geometrische Vielfachheit des Eigenwerts stimmen überein. (o.B.) Höhere Mathematik 182 Lineare Abbildungen Entwicklungssatz Zusammenfassend erhalten wir 8.16 Entwicklungssatz Sei A eine symmetrische oder hermitesche Matrix. Dann lässt sich jeder Vektor des Rn (Cn ) nach den Eigenvektoren �v1 bis �vn von A entwicken: n � �x = < �x , v�k > �vk . k=1 Weiter ist dann mit den Eigenwerten λ1 bis λn A�x = n � λk < �x , v�k > �vk . k=1 Höhere Mathematik 183 Lineare Abbildungen Der Vektorraum der linearen Abbildungen Es folgen ergänzende Aussagen zu linearen Abbildungen. 8.17 Der Vektorraum der linearen Abbildungen Gegeben seien Vektorräume V und W . Die Menge aller linearen Abbildungen L(V , W ) = {f : V → W | f ist linear} ist ein Vektorraum. (Die Addition f + g und die Multiplikation mit Skalaren αf ist wie üblich bei Funktionen definiert.) Höhere Mathematik 184 Lineare Abbildungen 8.18 Verkettung linearer Abbildungen Verkettung linearer Abbildungen Es seien U, V , W Vektorräume und f : U → V sowie g : V → W lineare Abbildungen. Dann ist auch die Hintereinanderausführung g ◦ f : U → W, g ◦ f (�u ) = g (f (�u )) linear. Weiterhin sei U = �u1 , . . . , �un eine Basis von U, V = �v1 , . . . , �vm eine Basis von V � 1, . . . , w � p eine Basis von W . Mit den Darstellungsmatrizen sowie W = w A ∈ Mat(m, n) von f (bzgl. U , V) und B ∈ Mat(p, m) von g (bzgl. V, W) ist dann C = BA die Darstellungsmatrix von g ◦ f bzgl. der Basen U , W. Höhere Mathematik 185 Lineare Abbildungen Der Ring der linearen Abbildungen Als “Multiplikation” auf dem Vektorraum L(V , V ) der Endomorphismen (=lineare Abbildungen von V nach V ) verwenden wir die Hintereinanderausführung. Dann gilt: 8.19 Der Ring der linearen Abbildungen Der Vektorraum L(V , V ) ist ein Ring, d.h. die Hintereinanderausführung erfüllt das Assoziativ- und Distributivgesetz. Das neutrale Element dieser Multiplikation ist die Einheitsmatrix En . Höhere Mathematik 186 Spezielle Matrizen und Abbildungen Definition: orthogonale und unitäre Matrizen Interessant sind lineare Abbildungen, die die Länge von Vektoren nicht verändern. Wichtige Beispiele sind Drehungen und Spiegelungen. 9.1 Definition: orthogonale und unitäre Matrizen Eine (quadratische) relle Matrix heißt orthogonal, falls A� = A−1 ist. Eine (quadratische) komplexe Matrix heißt unitär, falls A∗ = A−1 ist. Äquivalent ist 9.2 Eigenschaften orthogonaler Matrizen (i) A ist orthogonal. (ii) A� = A−1 . (iii) Die Spalten von A bilden eine ONB. (iv) Die Zeilen von A bilden eine ONB. � ∈ Rn gilt < �v , w � >=< A�v , A� (v) Für �v , w w >. (vi) Für �v ∈ Rn gilt �A�v � = ��v �. Höhere Mathematik 187 Spezielle Matrizen und Abbildungen 9.3 Weitere Eigenschaften Weitere Eigenschaften Sei A orthogonal. � gilt < � ) =< Für �v , w ) (�v , w ) (A�v , A� w) Die Determinante von A ist ±1 Höhere Mathematik 188 Spezielle Matrizen und Abbildungen 9.4 Orthogonale Projektionen Orthogonale Projektionen Eine orthogonale Projektion P ist dadurch gekennzeichnet, dass gilt P 2 = P und P = P� �x �0 Spezialfall: Projektion auf eine Hyperebene. �n ist eine Vektor mit ��n� = 1, der senkrecht auf der Hyperebene steht. P�x = �x − < �x , �n > �n = (E − �n�n�)�x . Die Matrix ist also A = E − �n�n�. P�x E Die allgemeine Form einer orthogonalen Projektion ist so : Sei �v1 bis �vn eine ONB, so dass �v1 bis �vk Basis eines Unterraums U ist. Dann ist die orthogonale Projektion auf U gegeben durch PU �x = k � < �x , �vj > �vj j=1 Höhere Mathematik 189 Spezielle Matrizen und Abbildungen 9.5 Spiegelungen Spiegelungen �x �0 P�x Verdoppelt man die Strecke auf den Projektionspunkt, so sieht man die Form der Spiegelungsmatrix an einer Hyperebene: E S�x = (E − 2�n�n�)�x S = E − 2�n�n� S�x Mit denselben Voraussetzungen wie bei der Projektion ist die allgemeine Form SU �x = k � j=1 Höhere Mathematik < �x , �vj > �vj − n � < �x , �vj > �vj j=k+1 190 Spezielle Matrizen und Abbildungen 9.6 Drehungen Drehungen 2 Drehungen um den Winkel α im R haben die Matrixdarstellung � � cos α − sin α A= . sin α cos α Drehmatrizen sind orthogonal. A�e2 �e2 A�e1 sin α α cos α Höhere Mathematik �e1 191 Spezielle Matrizen und Abbildungen 9.7 Scherungen Scherungen Lineare Abbildungen, bei denen die geometrische Vielfachheit eines Eigenwerts kleiner als die algebraische ist, sind Scherungen. Beispiele für Scherungen: A1 1 0.5 A2 = 0 1 0 0 A2 0.5 0 1 0.3 A 1 = E3 0 1 1 0 0.5 Die Skizzen wurden mit der Projektionsmatrix P = 0 1 0.3 erstellt. 0 0 0 Höhere Mathematik 0 1 0 und A3 = 0 1 0 A3 192 Homogene Koordinaten im R3 Spezielle Matrizen und Abbildungen 9.8 Homogene Koordinaten im R3 Jedem Vektor v = (x, y , z)� des R3 werden alle Vektoren des R4 der Form (tx, ty , tz, t)� mit t �= 0 zugeordnet. Insbesondere wird v durch ṽ = (x, y , z, 1)� repräsentiert. Einerdurch A gegebenen linearen Abbildung wird die Matrix 0 A 0 zugeordnet à = 0 0 0 0 1 Dem Vektor 1 0 Sw = 0 0 w 0 1 0 0 � 3 = (w1 , w 2 , w3 ) ∈ R wird die Matrix 0 w1 0 w2 zugeordnet. 1 w3 0 1 Dem Vektor Av entspricht Ãṽ Dem Vektor v + w entspricht Sw v Höhere Mathematik 193 Folgen und Reihen Definition: Zahlenfolge Kap. 10: Folgen und Reihen 10.1 Definition: Zahlenfolge Eine Funktion a:N→R (oder C) heißt reelle (oder komplexe) Zahlenfolge. Man nennt an = a(n) das n-te Folgenglied und schreibt kurz (an )n∈N oder (an ). Ebenso sind (an )n∈N0 oder (an )n≥n0 mit festem n0 ∈ Z Zahlenfolgen. Eine Teilfolge entsteht, indem man (endlich oder unendlich viele) Folgenglieder weglässt, wobei noch unendlich viele Glieder übrigbleiben müsses: Für natürliche Zahlen 1 ≤ n1 < n2 < n3 < · · · ist (ank )k∈N eine Teilfolge von (an )n∈N . Höhere Mathematik 194 Folgen und Reihen Definition: Zahlenfolge Später behandeln wir auch Folgen von Vektoren (�vn )n∈N mit �vn ∈ Rd , Folgen von Matrizen (An )n∈N mit An ∈ Mat(p, q) oder Funktionenfolgen (fn )n∈N mit fn : [a, b] → R. 3 3 2 2 1 1 1 −1 2 3 4 5 6 7 9 N 8 −1 −2 1 2 3 4 5 6 7 8 9 N −2 a2 a4 a6 a9 a7 a 8 a5 −2 −1 0 1 Höhere Mathematik a3 a1 2 3 195 Folgen und Reihen 10.2 Konvergenz, Grenzwert Konvergenz, Grenzwert Eine Zahlenfolge (an )n∈N heißt konvergent, wenn es eine Zahl a ∈ R (oder C) mit der folgenden Eigenschaft gibt: zu jedem � > 0 gibt es ein n0 ∈ N, so dass für alle n ≥ n0 die Ungleichung |an − a| < � gilt. Dann heißt a der Grenzwert der Folge (an )n∈N , die Folge “konvergiert gegen a” und wir schreiben lim an = a oder an → a n→∞ Ist die Zahlenfolge (an )n∈N nicht konvergent, so heißt sie divergent. a+ε a a−ε 1 2 3 Höhere Mathematik n0 N 196 Folgen und Reihen Grenzwertsatz Einfache Hilfsmittel zur Berechnung von Grenzwerten: 10.3 Grenzwertsatz Die Zahlenfolgen (an )n∈N und (bn )n∈N seien konvergent, und a = lim an sowie n→∞ b = lim bn seien die Grenzwerte. Dann gilt: n→∞ a) (an + bn )n∈N ist konvergent und lim (an + bn ) = a + b. n→∞ b) Für beliebiges α ∈ C ist (αan )n∈N konvergent und lim (αan ) = αa. n→∞ c) (an bn )n∈N ist konvergent und lim (an bn ) = ab. n→∞ d) Sind alle bn �= 0 und gilt b �= 0, so ist � � an a lim = . n→∞ bn b Höhere Mathematik � an bn � konvergent und n∈N 197 Folgen und Reihen 10.4 Nullfolge, bestimmte Divergenz Nullfolge, bestimmte Divergenz a) Eine konvergente Folge (an )n∈N mit lim an = 0 heißt Nullfolge. n→∞ b) an → 0 ⇐⇒ |an | → 0 c) Eine reelle Zahlenfolge heißt bestimmt divergent gegen ∞ (bzw. gegen −∞), wenn für jedes r > 0 ein n0 ∈ N existiert, so dass für alle n ≥ n0 die Ungleichung an > r (bzw. an < −r ) gilt. Dann heißt ∞ ( bzw. −∞ ) der uneigentliche Grenzwert der Folge und wir schreiben lim an = ∞ n→∞ ( bzw. lim an = −∞) n→∞ oder an → ±∞. Bemerkung: (an )n∈N konvergiert gegen a genau dann, wenn (an − a)n∈N eine Nullfolge ist. 1 an → ∞ ⇐⇒ für n ≥ n0 ist an > 0 und → 0. an Höhere Mathematik 198 Folgen und Reihen 10.5 Konvergenz und Ordnung Konvergenz und Ordnung a) Sei lim an = a und lim bn = b. n→∞ n→∞ Ist für n ≥ n0 stets an ≤ bn , so ist auch a ≤ b. b) Gegeben seien drei reelle Zahlenfolgen (an ), (bn ) und (cn ) und es gelte lim an = lim cn = s. Falls es ein n0 ∈ N mit n→∞ n→∞ an ≤ b n ≤ cn für alle n ≥ n0 gibt, so ist auch (bn ) konvergent und lim bn = s. n→∞ (b) heißt Einschließungskriterium oder Sandwich-Lemma oder Schraubstock-Kriterium. Höhere Mathematik 199 Folgen und Reihen Wichtige Beispiele 10.6 Wichtige Beispiele a) b) c) d) �√ √ � n + 1 − n n∈N konvergiert gegen 0. �√ � n n n∈N konvergiert gegen 1. �√ � n Für jedes c > 0 konvergiert c n∈N gegen 1. �√ � n Für jedes feste � ∈ N konvergiert n� gegen 1 (folgt aus b) und dem n∈N Grenzwertsatz). e) Die Folge (z n )n∈N mit z ∈ C und |z| < 1 ist eine Nullfolge. Hilfreich ist die folgende Wachstumshierarchie. Weiter rechtsstehende Folgen n7 gehen schneller als linksstehende gegen unendlich, also z.B. ist lim n = 0. n→∞ 2 Dabei sei α > 0 und q > 1. 1 Höhere Mathematik ln n nα qn n! nn 200 Folgen und Reihen Wichtige Beispiele Wichtiges Hilfsmittel ist die Stirling-Formel � n �n √ n! ≈ 2πn e Der Quotient der beiden Terme hat den Grenzwert 1. Die Differenz geht gegen unendlich. Es gibt noch weit genauere Abschätzungen. Höhere Mathematik 201 Folgen und Reihen Satz Zur Klarstellung dient der folgende Satz. 10.7 Satz Die Folge (an )n∈N sei konvergent. a) Dann ist ihr Grenzwert a eindeutig bestimmt und b) jede Teilfolge (ank )k∈N ist konvergent und hat denselben Grenzwert a. Ein wichtiger Begriff im Zusammenhang mit Teilfolgen: 10.8 Definition Häufungswert Die Zahl b heißt ein Häufungswert der Folge (an )n∈N , wenn es eine konvergente Teilfolge (ank )k∈N mit Grenzwert b gibt, also lim ank = b k→∞ gilt. Höhere Mathematik 202 Folgen und Reihen Satz Beispiele Die durch an = sin 56 n definierte Folge hat jedes x ∈ [−1, 1] als Häufungswert. N Bei einer konvergenten Folge ist der Grenzwert der einzige Häufungswert. Höhere Mathematik 203 Folgen und Reihen 10.9 beschränkte und monotone Folge beschränkte und monotone Folge a) Eine Folge (an )n∈N heißt beschränkt, wenn es ein r > 0 gibt mit |an | ≤ r für alle n ∈ N. b) Eine reelle Zahlenfolge (an )n∈N heißt monoton wachsend, wenn an+1 ≥ an für alle n ∈ N gilt, monoton fallend, wenn an+1 ≤ an für alle n ∈ N gilt, monoton, wenn sie monoton wachsend oder monoton fallend ist. Höhere Mathematik 204 Folgen und Reihen Satz von Bolzano und Weierstraß Neben Satz 10.3 lautet das wichtigste “Konvergenz-Kriterium” wie folgt: 10.10 Satz von Bolzano und Weierstraß Jede monotone und beschränkte reelle Zahlenfolge ist konvergent. Bemerkung: Eine andere Formulierung, die auch für komplexe Zahlenfolgen gültig ist, lautet: Jede beschränkte Folge (in R oder C) besitzt eine konvergente Teilfolge. Genauer: Ist die Folge (an )n∈N beschränkt, so existiert eine Teilfolge (ank )k∈N und eine Zahl b mit lim ank = b. k∈N Höhere Mathematik 205 Folgen und Reihen 10.11 Intervallschachtelung Intervallschachtelung Gegeben seien eine monoton wachsende reelle Zahlenfolge (an )n∈N und eine monoton fallende reelle Zahlenfolge (bn )n∈N . Es gelte (i) an ≤ bn für alle n ∈ N und (ii) lim (bn − an ) = 0. n→∞ Man sagt, dass die abgeschlossenen Intervalle [an , bn ] ⊆ [an−1 , bn−1 ] eine Intervallschachtelung definieren. Dann enthält der Durchschnitt ∞ � [an , bn ] n=1 genau eine reelle Zahl s, nämlich s = lim an = lim bn . n→∞ Höhere Mathematik n→∞ 206 Folgen und Reihen 10.12 Beispiel: die Eulersche Zahl e Beispiel: die Eulersche Zahl e Die Eulersche Zahl e = 2.71828182845904... kann folgendermaßen definiert werden: Wir betrachten die Folgen (an )n∈N und (bn )n∈N mit den Folgengliedern an = � 1 1+ n �n , bn = � 1 1+ n �n+1 . Dann gilt: 1. Die Folge (an )n∈N ist monoton wachsend. 2. Die Folge (bn )n∈N ist monoton fallend. 3. Es ist bn − an ≥ 0 und lim (bn − an ) = 0. n→∞ 4. Das Prinzip der Intervallschachtelung ergibt: lim an = lim bn =: e. n→∞ Höhere Mathematik n→∞ 207 Folgen und Reihen Beispiel: die Eulersche Zahl e Zahlenwerte: “sehr langsame Konvergenz” gegen e n an bn 1 2 4 10 2.59374246010000 2.85311670611000 100 2.70481382942153 2.73186196771574 1000 2.71692393223559 2.71964085616783 1000000 2.71826823719230 2.71828318737622 Höhere Mathematik 208 Folgen und Reihen Limes superior und Limes inferior Zwei weitere Begriffe: 10.13 Limes superior und Limes inferior Gegeben sei eine reelle Zahlenfolge (an )n∈N . Falls (an )n∈N beschränkt ist, sind der größte Häufungswert (Limes superior) lim sup an := max{b|b ist Häufungswert von (an )n∈N } n→∞ und der kleinste Häufungswert (Limes inferior) lim inf an := min{b|b ist Häufungswert von (an )n∈N } n→∞ definiert. Falls (an )n∈N nicht nach oben beschränkt ist (d.h. zu jedem r > 0 existiert ein n ∈ N mit an > r ), so setzen wir lim sup an := ∞. n→∞ Falls (an )n∈N nicht nach unten beschränkt ist (d.h. zu jedem r > 0 existiert ein n ∈ N mit an < −r ), so setzen wir lim inf an := −∞. n→∞ Höhere Mathematik 209 Folgen und Reihen Aus konvergent folgt beschränkt Als partielle Umkehrung des Satzes von Bolzano-Weierstraß geben wir noch folgendes Resultat an: 10.14 Aus konvergent folgt beschränkt Jede konvergente Folge (an )n∈N ist beschränkt. Höhere Mathematik 210 Folgen und Reihen Cauchy-Kriterium Als wichtiges (abstraktes) Konvergenz-Kriterium dient: 10.15 Cauchy-Kriterium Eine Folge (an )n∈N ist genau dann konvergent, wenn zu jedem � > 0 ein n0 ∈ N existiert, so dass für alle n > m ≥ n0 die Ungleichung |an − am | < � gilt. Höhere Mathematik 211 Folgen und Reihen 10.16 Reihen Reihen Die zu einer gegebenen Zahlenfolge (an )n∈N gebildete Folge (sn )n∈N der Partialsummen n � sn = ak k=1 heißt eine unendliche Reihe. Der Summand ak heißt k-tes Reihenglied. Anstatt (sn )n∈N schreibt man kurz ∞ � an für die unendliche Reihe. n=1 Falls die unendliche Reihe schreiben wir ∞ � n=1 an gegen die Zahl s ∈ C konvergiert, so s = lim sn = n→∞ Eine Reihe heißt absolut konvergent, wenn ∞ � an . n=1 n � k=1 Höhere Mathematik |ak | konvergiert. 212 Folgen und Reihen Reihen Beispiel: 2 1 a1 a3 .5 a4 a2 −1 s1 s2 s3 s4 Mit a1 = 2, a2 = −1, a3 = 1, a4 = 0.5, . . . entspricht die Partialsumme sn dem orientierten Flächeninhalt unter den ersten n Kästchen. Man hat in diesem Beispiel s1 = 2, s2 = 1, s3 = 2, s4 = 2.5, s5 = . . .. Die Reihe konvergiert, wenn die Folge der Partialsummen einen Grenzwert hat. Höhere Mathematik 213 Folgen und Reihen Konvergenz und absolute Konvergenz Bemerkung: Unendliche Reihen sind also spezielle Zahlenfolgen. Die Begriffe Konvergenz und Grenzwert, Beschränktheit und Monotonie einer unendlichen Reihe beziehen sich immer auf die Folge der Partialsummen (sn )n∈N (bzw. (sn )n≥n0 mit n0 ∈ Z). Die Konvergenz kann mit allen bisherigen Methoden untersucht werden. Ist die unendliche Reihe z.B. monoton und beschränkt, so ist sie konvergent (Satz von Bolzano-Weierstraß). Insbesondere ist eine Reihe genau dann absolut konvergent, wenn die Reihe der Absolutbeträge konvergiert. Die unendliche Reihe ist genau dann konvergent, wenn das Cauchy-Kriterium gilt: Zu jedem � > 0 existiert ein n0 ∈ N so, dass für alle n > m ≥ n0 die Ungleichung � n � � � � � � |sn − sm | = � ak � < � gilt. � � k=m+1 10.17 Konvergenz und absolute Konvergenz Eine absolut konvergente Reihe konvergiert. Die Umkehrung gilt nicht. Höhere Mathematik 214 Folgen und Reihen 10.18 Harmonische und geometrische Reihe Harmonische und geometrische Reihe a) Die Reihe ∞ � 1 1 1 1 = 1 + + + + ··· n 2 3 4 n=1 nennt man die harmonische Reihe. Die harmonische Reihe divergiert. b) Die Reihe ∞ � n=0 zn = 1 + z + z2 + z3 + · · · mit z ∈ C nennt man die geometrische Reihe. Für z �= 1 lautet die Partialsumme (nach 1.9, geometrische Summenformel) sn = n � k=0 1 − z n+1 z = . 1−z k Die geometrische Reihe konvergiert genau für |z| < 1, der Grenzwert ist dann 1 . 1−z Höhere Mathematik 215 Folgen und Reihen Rechenregeln für konvergente Reihen Der Grenzwertsatz 10.3 ergibt: 10.19 Rechenregeln für konvergente Reihen Die unendlichen Reihen sa und sb . ∞ � an und n=1 ∞ � bn seien konvergent, ihre Grenzwerte seien n=1 Dann ist für beliebige α, β ∈ C die Reihe Grenzwert ist αsa + βsb , also ∞ � n=1 Höhere Mathematik ∞ � (αan + βbn ) konvergent und ihr n=1 (αan + βbn ) = α ∞ � n=1 an + β ∞ � bn . n=1 216 Folgen und Reihen Notwendiges Kriterium für die Konvergenz Weitere Kriterien zur Konvergenz- bzw. Divergenz-Untersuchung von Reihen 10.20 Notwendiges Kriterium für die Konvergenz Falls die Reihe ∞ � an konvergiert, so muss die Folge (an )n∈N der Reihenglieder n=1 eine Nullfolge sein. Beispiel: Die geometrische Reihe ∞ � n=1 Höhere Mathematik z n mit z ∈ C und |z| ≥ 1 ist divergent. 217 Folgen und Reihen Majorantenkriterium Das wichtigste Kriterium für Konvergenz bzw. Divergenz von Reihen: 10.21 Majorantenkriterium Für zwei Reihen ∞ � n=1 an und ∞ � n=1 bn und ein festes n0 ∈ N gelte |an | ≤ bn Falls dann ∞ � für alle n ≥ n0 . bn konvergiert, so konvergieren auch n=1 ∞ � n=1 Man beachte, dass die Reihe ∞ � an und ∞ � n=1 |an |. bn absolut konvergieren muss, da stets n=1 bn ≥ 0 und daher bn = |bn | ist. ∞ ∞ � � Die Reihe bn heißt eine Majorante von an . n=1 Höhere Mathematik n=1 218 Folgen und Reihen 10.22 Minorantenkriterium Minorantenkriterium Für zwei Reihen ∞ � n=1 an und ∞ � n=1 bn und ein festes n0 ∈ N gelte an ≥ b n ≥ 0 Falls dann ∞ � für alle bn divergiert, so divergiert auch n=1 Die Reihe ∞ � an . n=1 ∞ � bn heißt eine Minorante von n=1 ∞ � an . n=1 N Höhere Mathematik n ≥ n0 . Eine Folge mit positiven Gliedern konvergiert genau dann, wenn die Partialsummen beschränkt sind. Sind die Partialsummen bei der roten Majorante beschränkt, sind sie es bei der blauen Minorante auch, sind die Partialsummen der Minorante unbeschränkt, können die der Majorante nicht beschränkt sein. 219 Folgen und Reihen Vergleichskriterium Wichtige Konsequenz von Minoranten- und Majorantenkriterium ist das Vergleichskriterium. 10.23 Vergleichskriterium |an | Es gebe eine Zahl c > 0 mit lim =c n→∞ |bn | ∞ ∞ � � Dann konvergiert an genau dann absolut, wenn bn absolut konvergiert. n=1 Höhere Mathematik n=1 220 Folgen und Reihen Beispiele 10.24 Beispiele ∞ � 1 a) Die Reihe konvergiert. 2 n n=1 Der Grenzwert ∞ � 1 π2 s= = = 1.64493406684822... 2 n 6 n=1 kann erst viel später berechnet werden. ∞ � 1 √ divergiert. b) Die Reihe n n=1 c) Man merke sich schon jetzt als wichtige Reihen zum Vergleich: Die Reihe � ∞ � 1 konvergent, falls α > 1 ist, ist α n bestimmt divergent gegen ∞, falls 0 < α ≤ 1 ist. n=1 Höhere Mathematik 221 Folgen und Reihen Satz: 10.25 Wurzelkriterium Wurzelkriterium Falls ein q ∈ R mit 0 < q < 1 und ein n0 ∈ N existieren, so dass � n |an | ≤ q für alle n ≥ n0 , so konvergieren ∞ � an und n=1 Falls ∞ � n=1 � n |an | ≥ 1 gilt, so divergieren ∞ � n=1 an und (∗) |an |. für unendlich viele ∞ � n=1 n∈N |an |. Bemerkung: Falls die Bedingung (*) nur mit q = 1 gilt (z.B. harmonische Reihe), so kann nicht auf Konvergenz geschlossen werden. Dann muss die Reihe mit anderen Kriterien untersucht werden. Höhere Mathematik 222 Folgen und Reihen 10.26 Quotientenkriterium Quotientenkriterium Falls ein q ∈ R mit 0 < q < 1 und ein n0 ∈ N existieren, so dass � � � an+1 � � � an �= 0 und für alle n ≥ n0 � an � ≤ q gilt, so konvergieren ∞ � an und n=1 ∞ � n=1 |an |. Falls ein n0 ∈ N existiert, so dass � � � an+1 � � � an �= 0 und � an � ≥ 1 gilt, so divergieren ∞ � n=1 an und ∞ � n=1 (∗∗) für alle n ≥ n0 (∗∗) |an |. Bemerkung: Falls die Bedingung (**) nur mit q = 1 gilt, muss die Reihe wieder mit anderen Kriterien untersucht werden. Höhere Mathematik 223 Folgen und Reihen Beispiele Das Quotientenkriterium ist oft leichter zu handhaben als das Wurzelkriterium. Aber: es verlangt an �= 0 ab einem Index n0 . 10.27 Beispiele ∞ � 1 a) Die Reihe ist konvergent. n! n=0 Anmerkung: Der Grenzwert ist die Eulersche Zahl e = 2.71828182845904.... Die �Folge der � Partialsummen (sn )n≥0 konvergiert viel schneller gegen e als die Folge (1 + n1 )n n∈N in 10.12. Zahlenwerte: n 0 1 2 3 4 5 Höhere Mathematik sn 1 2 2.5 2.66666666666667 2.70833333333333 2.71666666666667 6 7 8 9 10 2.71805555555556 2.71825396825397 2.71827876984127 2.71828152557319 2.71828180114638 224 Folgen und Reihen Beispiele ∞ ∞ � � 1 1 b) Für die Reihen und ergibt sich jeweils 2 n n n=1 n=1 � � � an+1 � � = 1. lim �� n→∞ an � Also kann mit dem Quotientenkriterium keine Aussage zur Konvergenz der Reihen getroffen werden. Ebenso erhalten wir � lim n |an | = 1, n→∞ also hilft auch das Wurzelkriterium nicht weiter. Höhere Mathematik 225 Folgen und Reihen Limesversion Oft prüft man die Existenz von 0 < q < 1 in den Kriterien 10.25 und 10.26 so: 10.28 ∞ � Limesversion an sei eine Reihe mit n=1 lim sup n→∞ � n |an | < 1 Dann konvergieren die Reihen ∞ � n=1 oder an und ∞ � n=1 � � � an+1 � � < 1. lim sup�� an � n→∞ |an |. � n Beispiel: für k ∈ Z und 0 ≤ q < 1 ist limn→∞ nk q n = q < 1. Daher gilt nach 10.20 nk q n → 0. Höhere Mathematik 226 Folgen und Reihen Satz: Leibnizkriterium Wir nennen die reelle Zahlenreihe ∞ � an alternierend, wenn die Reihenglieder n=1 an ∈ R abwechselnd positiv und negativ sind, also sign (an ) = −sign (an+1 ) 10.29 für alle n ∈ N gilt. Satz: Leibnizkriterium Die Reihe ∞ � n=1 an sei alternierend. Falls die Folge der Absolutbeträge (|an |)n∈N eine monoton fallende Nullfolge ist, so konvergiert die Reihe ∞ � an . n=1 Zusatz: Der Grenzwert s erfüllt für jedes n ∈ N mit sign (an ) = 1 n−1 � k=1 Höhere Mathematik ak ≤ s ≤ n � ak . k=1 227 Folgen und Reihen Beispiel: 10.30 Leibniz’sche Reihe Leibniz’sche Reihe Die Reihe ∞ � (−1)n−1 n n=1 =1− 1 1 1 + − + ··· 2 3 4 heißt die Leibniz’sche Reihe. Sie ist alternierend und die Folge der Absolutbeträge �1� (|an |)n∈N = n n∈N ist eine monoton fallende Nullfolge. Also konvergiert die Leibniz’sche Reihe. Wir zeigen (viel) später: ∞ � (−1)n−1 n=1 Höhere Mathematik n = ln 2 = 0.6914718055994.... 228 Grenzwerte von Funktionen, Stetigkeit Festlegung Definitionsbereich 11.1 Festlegung Definitionsbereich Festlegung: Wir betrachten Funktionen f : D → R, deren Definitionsbereich eine endliche Vereinigung von Intervallen ist, also z.B. D = [a, b], D = [−5, 1) ∪ (3, ∞), D = R \ {0}. Der Abschluss D ist die Menge, die durch Hinzunahme der Intervallränder entsteht, in den obigen Beispielen also D = [a, b], Höhere Mathematik D = [−5, 1] ∪ [3, ∞), D = R. 229 Grenzwerte von Funktionen, Stetigkeit 11.2 Definition Grenzwert Definition Grenzwert Gegeben sei eine Funktion f : D → R und ein x0 ∈ D. (a) f besitzt den Grenzwert c ∈ R an der Stelle x0 , wenn zu jedem � > 0 ein δ > 0 existiert, so dass |f (x) − c| < � für alle x ∈ D \ {x0 } mit |x − x0 | < δ gilt. Schreibweise: lim f (x) = c. x→x0 c +ε c c −ε x0 − δ x0 x0 + δ Höhere Mathematik 230 Grenzwerte von Funktionen, Stetigkeit Definition Grenzwert Bemerkung: Der Funktionswert f (x0 ) taucht in der Bedingung an den Grenzwert von f an der Stelle x0 nicht auf! Dieser wird erst später für den Begriff der Stetigkeit von f verwendet. (b) f besitzt den uneigentlichen Grenzwert ∞ (bzw. −∞) an der Stelle x0 , wenn zu jedem r > 0 ein δ > 0 existiert, so dass f (x) > r (bzw. f (x) < −r ) für alle x ∈ D \ {x0 } mit |x − x0 | < δ gilt. Schreibweise: lim f (x) = ∞ (bzw. lim f (x) = −∞). x→x0 Höhere Mathematik x→x0 231 Grenzwerte von Funktionen, Stetigkeit Definition mit Folgen Äquivalent zur “�-δ-Definition” 11.2 des Grenzwerts ist die folgende 11.3 Definition mit Folgen Die Funktion f : D → R hat an der Stelle x0 ∈ D den Grenzwert c, wenn für jede Folge (xn )n∈N mit Folgengliedern xn ∈ D \ {x0 } und mit dem Grenzwert lim xn = x0 gilt n→∞ lim f (xn ) = c. n→∞ Höhere Mathematik 232 Grenzwerte von Funktionen, Stetigkeit Grenzwerte bei unendlich Zwei Varianten von Grenzwerten werden in den nächsten beiden Abschnitten definiert: 11.4 Definition: Grenzwert von f bei ∞ und −∞ Der Definitionsbereich D enthalte ein Intervall (a, ∞). Dann hat f in ∞ den Grenzwert c ∈ R, wenn zu jedem � > 0 ein r > a existiert, so dass |f (x) − c| < � für alle x >r gilt. Schreibweise: lim f (x) = c. x→∞ Entsprechend: lim f (x) = c sowie uneigentliche Grenzwerte lim f (x) = ∞ etc. x→−∞ x→∞ Bemerkung: Endliche Grenzwerte c für x → ∞ bzw. x → −∞ sind bei der Kurvendiskussion die horizontalen Asymptoten von f . Höhere Mathematik 233 Grenzwerte von Funktionen, Stetigkeit 11.5 rechtsseitiger und linksseitiger Grenzwert rechtsseitiger und linksseitiger Grenzwert a) f besitzt den rechtsseitigen Grenzwert c ∈ R an der Stelle x0 , wenn zu jedem � > 0 ein δ > 0 existiert, so dass |f (x) − c| < � für alle x ∈ D mit x0 < x < x0 + δ gilt. Schreibweise: lim f (x) = c. x→x0 + b) f besitzt den linksseitigen Grenzwert c ∈ R an der Stelle x0 , wenn zu jedem � > 0 ein δ > 0 existiert, so dass |f (x) − c| < � für alle x ∈ D mit x0 − δ < x < x0 gilt. Schreibweise: lim f (x) = c. x→x0 − Ebenso: lim f (x) = ∞ etc. x→x0 + Höhere Mathematik 234 Grenzwerte von Funktionen, Stetigkeit rechtsseitiger und linksseitiger Grenzwert Bemerkung: Am Randpunkt a eines Intervalls (a, b) oder [a, b] ist der Grenzwert aus Definition 11.2 das gleiche wie der rechtsseitige Grenzwert. An einer Stelle x0 ∈ (a, b) (also im Inneren des Intervalls) existiert der Grenzwert c von f genau dann, wenn sowohl der rechtsseitige als auch der linksseitige Grenzwert existieren und gleich c sind, also lim f (x) = lim f (x) = c x→x0 + x→x0 − gilt. Höhere Mathematik 235 Grenzwerte von Funktionen, Stetigkeit Rechenregeln für Grenzwerte Die Rechenregeln für Grenzwerte von Folgen lassen sich auf Grenzwerte von Funktionen übertragen. 11.6 Rechenregeln für Grenzwerte Gegeben seien zwei Funktionen f : D → R und g : D → R sowie ein x0 ∈ D. Weiter seien lim f (x) = c und lim g (x) = d. Dann gilt x→x0 x→x0 a) lim (αf (x) + βg (x)) = αc + βd für alle α, β ∈ R. x→x0 b) lim (f (x)g (x)) = cd. x→x0 f (x) c c) Falls g (x) �= 0 für alle x ∈ D und d = � 0 gilt, so ist lim = . x→x0 g (x) d Höhere Mathematik 236 Grenzwerte von Funktionen, Stetigkeit 11.7 Stetigkeit Stetigkeit Gegeben sei eine Funktion f : D → R. a) f heißt stetig an der Stelle x0 ∈ D (auch: “stetig in x0 ”), wenn lim f (x) = f (x0 ) gilt. x→x0 b) f heißt stetig, wenn f in jedem Punkt x0 ∈ D stetig ist. Beachte: Die Grenzwertdefinition 11.3 und 11.2 besagt: f : D → R ist stetig an der Stelle x0 ∈ D genau dann, wenn ∀� > 0 ∃δ > 0 ∀x ∈ D : (|x − x0 | < δ =⇒ |f (x) − f (x0 )| < �). f : D → R ist stetig an der Stelle x0 ∈ D genau dann, wenn für jede Folge (xn )n∈N mit Folgengliedern xn ∈ D und dem Grenzwert lim xn = x0 gilt: n→∞ lim f (xn ) = f (x0 ). n→∞ Höhere Mathematik 237 Grenzwerte von Funktionen, Stetigkeit Stetigkeit y −(x + 2) 1 1 − x +2 2 f (x) = 1 sin x � 1 − (x − 3)2 für − 3 < x ≤ −2 für − 2 < x ≤ 0 für 0 < x ≤ 2 für 2 < x < 4 1 −3 −2 2 4 Verschiedene Typen von Unstetigkeit Höhere Mathematik 238 Grenzwerte von Funktionen, Stetigkeit Rechenregeln für stetige Funktionen Bemerkung: Die letzte Aussage wird häufig zur Grenzwertberechnung von Folgen verwendet: Falls die Folge (an )n∈N gegen a konvergiert und f stetig an der Stelle a ist, so darf der Grenzwert “hineingezogen’ werden: � � lim f (an ) = f lim an = f (a). n→∞ n→∞ Als direkte Folgerung aus 11.6 ergibt sich 11.8 Rechenregeln für stetige Funktionen Die Funktionen f , g : D −→ R seien stetig in x0 . Dann gilt: a) Für beliebige Skalare α, β ∈ R ist die Funktion αf + βg stetig in x0 . b) Das Produkt fg ist stetig in x0 . c) Falls g (x) �= 0 für alle x ∈ D gilt, so ist der Quotient f g stetig in x0 . Die Summe von Funktionen ist wie in 6.2 definiert, Produkt und Quotient entsprechend. Höhere Mathematik 239 Grenzwerte von Funktionen, Stetigkeit 11.9 Der Vektorraum der stetigen Funktionen Der Vektorraum der stetigen Funktionen Die Menge aller stetigen Funktionen f : D → R bildet einen reellen Vektorraum, C (D) := {f : D → R | f ist stetig}. Hintereinanderausführung von Funktionen: Gegeben sind zwei Funktionen f : Df → R und g : Dg → R. Der Bildbereich f (Df ) sei eine Teilmenge von Dg . Dann ist die zusammengesetzte Funktion g ◦ f : Df → R, (g ◦ f )(x) = g (f (x)) definiert. 11.10 Zusammengesetzte Funktionen Falls f : Df → R stetig an der Stelle x0 und g : Dg → R stetig an der Stelle f (x0 ) ist, so ist die zusammengesetzte Funktion g ◦ f : Df → R stetig an der Stelle x0 . Höhere Mathematik 240 Grenzwerte von Funktionen, Stetigkeit Lemma Die folgende Aussage liegt vielen Untersuchungen zu Grunde. 11.11 Lemma Die Funktion f : D → R sei stetig an der Stelle x0 ∈ D und es gelte f (x0 ) > c für irgendeine Zahl c ∈ R. Dann existiert ein δ > 0 so, dass f (x) > c für alle x ∈ D mit |x − x0 | < δ gilt. (Entsprechende Aussagen gelten für f (x0 ) < c bzw. f (x0 ) �= c.) Bemerkung: Ist z.B. f (x0 ) �= 0, so gibt es sogar eine offene Umgebung (x0 − δ, x0 + δ) ∩ D von x0 , in der keine Nullstelle von f liegt. Höhere Mathematik 241 Grenzwerte von Funktionen, Stetigkeit 11.12 Zwischenwertsatz Zwischenwertsatz Sei f : D → R stetig und [a, b] ⊆ D ein abgeschlossenes beschränktes Intervall. Dann nimmt f auf dem Intervall [a, b] jeden Wert y ∈ R zwischen f (a) und f (b) an. y y = f (x) f (b) y f (a) a x0 b x Anwendung: Der Nullstellensatz von Bolzano Die Funktion f : [a, b] → R sei stetig und es gelte f (a)f (b) < 0 (d.h. f (a) und f (b) haben unterschiedliches Vorzeichen). Dann existiert ein x0 ∈ (a, b) mit f (x0 ) = 0. Höhere Mathematik 242 Grenzwerte von Funktionen, Stetigkeit Zwischenwertsatz Bemerkung: Der Zwischenwertsatz lässt sich auch so formulieren, dass unbeschränkte Intervalle zugelassen sind: Es sei D ein Intervall und f : D → R stetig. Dann nimmt f jeden reellen Wert y mit inf f (x) < y < sup f (x) x∈D x∈D an. Insbesondere ist der Bildbereich f (D) ebenfalls ein Intervall. Beispiel hierzu: Ist D = (a, ∞) und gilt lim f (x) = c sowie lim f (x) = d(incl. der x→a+ x→∞ uneigentlichen Grenzwerte für c und d), so nimmt f jeden Wert des offenen Intervalls (c, d) bzw. (d, c) an. Höhere Mathematik 243 Grenzwerte von Funktionen, Stetigkeit Satz vom Maximum Ein abgeschlossenes beschränktes Intervall [a, b] nennt man kompakt. 11.13 Satz vom Maximum D = [a, b] sei ein kompaktes Intervall und die Funktion f : D → R sei stetig. Dann nimmt f auf [a, b] sein Maximum und sein Minimum an; d.h. der Bildbereich f (D) ist das kompakte Intervall f (D) = [c, d] mit c = min f (x), x∈D Höhere Mathematik d = max f (x). x∈D 244 Grenzwerte von Funktionen, Stetigkeit Satz zur Umkehrfunktion D sei ein Intervall und f : D → R sei stetig. Der Bildbereich J = f (D) ist wiederum ein Intervall (siehe 8.12). Wir setzen f˜ : D → J mit f˜(x) = f (x) für alle x ∈ D und erhalten so eine surjektive Funktion. 11.14 Satz zur Umkehrfunktion D sei ein Intervall und f : D → J mit J = f (D) sei stetig. Dann gilt: a) Die Funktion f ist genau dann bijektiv, wenn sie streng monoton ist. b) Ist f streng monoton wachsend (also auch bijektiv), so ist die Umkehrfunktion f −1 ebenfalls streng monoton wachsend und stetig. Die entsprechende Aussage gilt für streng monoton fallendes f . Höhere Mathematik 245 Grenzwerte von Funktionen, Stetigkeit 11.15 Komplexe Grenzwerte Komplexe Grenzwerte Die Aussagen über Grenzwerte und Stetigkeit gelten analog für Funktionen, die auf geeigneten Teilmengen der komplexen Ebene definiert sind und oder komplexe Werte haben. Im Gegensatz zum reellen Fall gibt es aber keine einseitigen Grenzwerte bei Funktionen, die auf Teilmengen von C definiert sind. In C gibt es nur einen einzigen Grenzwert für unendlich: zn → ∞ :⇐⇒ |zn | → ∞ Höhere Mathematik 246 Potenzreihen Kap. 12: Potenzreihen Eine Potenzreihe ist (informell gesprochen) ein “Polynom von unendlichem Grad” f (z) = a0 + a1 z + a2 z 2 + . . . + an z n + . . . , wobei (a0 , a1 , . . .) vorgegebene (reelle oder komplexe) Zahlen sind. Die an bezeichnet man (wie bei Polynomen) als Koeffizienten der Potenzreihe. Man kann auch eine Potenzreihe mit Entwicklungspunkt z0 betrachten. Dann hat sie die Form f (z) = a0 + a1 (z − z0 ) + a2 (z − z0 )2 + . . . + an (z − z0 )n + . . . Höhere Mathematik 247 Potenzreihen 12.1 Definition: Potenzreihe Definition: Potenzreihe Es seien komplexe Zahlen an , n ∈ N0 , sowie ein Punkt z0 ∈ C gegeben. Dann heißt ∞ � n=0 an (z − z0 )n eine Potenzreihe mit dem Entwicklungspunkt z0 . Diejenigen Punkte z in C, für die die Reihe konvergiert, bilden den Konvergenzbereich D der Potenzreihe, und f : D → C, f (z) = ∞ � n=0 an (z − z0 )n ist die durch die Potenzreihe dargestellte Funktion. Diese Zahlenreihe konvergiert also für z ∈ D und divergiert für z �∈ D. Wir betrachten in vielen Fällen auch den reellen Konvergenzbereich D ∩ R. Höhere Mathematik 248 Potenzreihen Beispiele 12.2 Beispiele: a) Die geometrische Reihe ∞ � z n wurde bereits in 10.18 behandelt. Sie ist eine Potenzreihe n=0 mit dem Entwicklungspunkt z0 = 0 und die Koeffizienten an = 1 für alle n ∈ N0 . Ihr Konvergenzbereich (in C) ist der offene Einheitskreis (ohne den Rand) D = {z ∈ C | |z| < 1} und es gilt ∞ � 1 f (z) = = zn 1−z n=0 für alle z ∈ D. ∞ � zn b) Die Potenzreihe hat den Entwicklungspunkt z0 = 0 und die Koeffizienten a0 = 0, 2 n n=1 an = n12 für n ∈ N. Ihr Konvergenzbereich (in C) ist der abgeschlossene Einheitskreis (mit Rand) D = {z ∈ C | |z| ≤ 1}. Also ist durch die Potenzreihe eine Funktion definiert: g : D → C, ∞ � zn g (z) = . 2 n n=1 Wir zeigen später, dass diese Funktion stetig und sogar unendlich oft differenzierbar ist. Höhere Mathematik 249 Potenzreihen Satz und Definition: Konvergenzradius Der Konvergenzbereich D der Potenzreihe ∞ � n=0 an (z − z0 )n ist ein Kreis in C mit dem Mittelpunkt z0 (mit oder ohne einige Randpunkte), ein Intervall in R mit dem Mittelpunkt z0 (mit oder ohne Randpunkte). Denn es gilt: 12.3 Satz und Definition: Konvergenzradius Zu der Potenzreihe ∞ � n=0 an (z − z0 )n existiert eine eindeutig bestimmte reelle Zahl r ≥ 0 (oder r = ∞), so dass gilt: (i) Die Reihe konvergiert absolut für jedes z ∈ C (bzw. z ∈ R) mit |z − z0 | < r , (ii) Die Reihe divergiert für jedes z ∈ C (bzw. z ∈ R) mit |z − z0 | > r . r heißt der Konvergenzradius der Potenzreihe. Höhere Mathematik 250 Potenzreihen Berechnung des Konvergenzradius von Potenzreihen Der Konvergenzradius besitzt eine Berechnungsformel. 12.4 Berechnung des Konvergenzradius von Potenzreihen Der Konvergenzradius r der Potenzreihe an ∈ C kann wie folgt berechnet werden: ∞ � n=0 an (z − z0 )n mit den Koeffizienten |an | � r= oder r = lim (falls der Limes existiert und an �= 0). n n→∞ |a | n+1 lim sup |an | 1 n→∞ Hierin sind die Spezialfälle r = 0, also Konvergenz nur im Punkt z0 , falls lim sup n→∞ r = ∞, also Konvergenzbereich D = C, falls lim sup n→∞ mit eingeschlossen. Höhere Mathematik � n � n |an | = ∞, |an | = 0, 251 Potenzreihen Berechnung des Konvergenzradius von Potenzreihen Bemerkungen: � Konvergiert die Folge ( n |an |), so stimmt der lim sup mit dem Grenzwert überein. In der Regel ist der Grenzwert von (|an |/|an+1 |) einfacher zu bestimmen als � der von ( n |an |). Es kommt vor, dass für einige z auf dem Rand des Kreises (also für |z − z0 | = r ) Konvergenz und für andere Divergenz vorliegt. Beispiele für reelle Potenzreihen: ∞ � a) x n hat den Konvergenzradius 1. Der Konvergenzbereich (in R) ist n=0 (−1, 1). b) ∞ � xn n [−1, 1). hat den Konvergenzradius 1. Der Konvergenzbereich (in R) ist n=1 c) ∞ � xn n=1 n2 Höhere Mathematik hat den Konvergenzradius 1. Der Konvergenzbereich (in R) ist [−1, 1]. 252 Potenzreihen 12.5 Seien Das Cauchyprodukt Das Cauchyprodukt �∞ n=0 an und �∞ n=0 bn zwei absolut konvergente Reihen. Definiere cn := n � ai bn−i = i=0 Dann ist die Reihe �∞ ai bj . i+j=n n=1 cn ebenfalls absolut konvergent, und es gilt � ∞ �� ∞ � ∞ � � � an bn = cn . n=0 Höhere Mathematik � n=0 n=0 253 Potenzreihen 12.6 Das Cauchyprodukt für Potenzreihen Das Cauchyprodukt für Potenzreihen Es seien zwei Potenzreihen f (z) g (z) = = �∞ − z0 ) n , |z − z0 | < rf , bn (z − z0 )n , |z − z0 | < rg , n=0 an (z �∞ n=0 gegeben. Dann gilt für alle z im Durchschnitt der Konvergenzbereiche (also für |z − z0 | < min{rf , rg }): f (z)g (z) = ∞ � n=0 mit den Koeffizienten cn := cn (z − z0 )n , n � ai bn−i = i=0 |z − z0 | < r , � ai bj . i+j=n und einem Konvergenzradius r ≥ min{rf , rg }. Das Cauchyprodukt gilt sowohl für reelle als auch komplexe Potenzreihen. Höhere Mathematik 254 Potenzreihen 12.7 Die komplexe Exponentialfunktion Die komplexe Exponentialfunktion Durch f : C → C, f (z) = ∞ � zn n=0 n! wird die komplexe Exponentialfunktion f (z) = e z definiert. Der Konvergenzradius der Potenzreihe der Exponentialfunktion ist r = ∞, 1 denn für die Koeffizienten an = n! gilt |an | (n + 1)! = = n + 1 −→ ∞ |an+1 | n! für n → ∞. Also ist der Konvergenzbereich die gesamte komplexe Ebene C √ (Man erhält hier noch einmal als Folgerung limn→∞ n n! = ∞.) Funktionswerte: e 0 = 1, e 1 = e = 2.71828182845904..., e iπ = −1. Höhere Mathematik 255 Potenzreihen Die komplexe Exponentialfunktion Funktionalgleichung: Für alle z, w ∈ C gilt e z+w = e z e w . ez ew = = = = = � � �∞ � ∞ � � 1 k 1 k z w k! k! k=0 k=0 � n � ∞ � � 1 1 zk w n−k k! (n − k)! n=0 k=0 ∞ n � 1 � �n � k n−k z w n! k=0 k n=0 ∞ � 1 (z + w )n n! n=0 (Cauchyprodukt 1) (binomische Formel) e z+w . Hieraus folgt e −z e z = e 0 = 1, also e z �= 0 für alle z ∈ C, e −z = e1z für alle z ∈ C. Höhere Mathematik 256 Potenzreihen Bemerkung zur Eulerschen Formel 12.8 Bemerkung zur Eulerschen Formel: Die Eulersche Formel 1.31 e ix = cos x + i sin x für x ∈R impliziert nun Potenzreihen für sin x und cos x: e ix = ∞ � (ix)n n=0 n! = ∞ � (−1)n x 2n n=0 (2n)! +i ∞ � (−1)n x 2n+1 n=0 (2n + 1)! . Also haben wir sin x = ∞ � (−1)n x 2n+1 n=0 (2n + 1)! und cos x = ∞ � (−1)n x 2n n=0 (2n)! . Aus diesen Formeln sehen wir sofort: sin(−x) = − sin x und cos(−x) = cos x. Insbesondere ist e −ix = cos(−x) + i sin(−x) = cos x − i sin x = e ix . Wir erhalten ausserdem die Beziehungen � 1 � ix −ix cos x = e +e 2 und � 1 � ix −ix sin x = e +e . 2i Die Potenzreihen von sin x und cos x haben daher beide den Konvergenzradius ∞. Die Eulersche Formel gilt für alle x ∈ R (sogar in C). Höhere Mathematik 257 Exponentialfunktion in R Potenzreihen 12.9 Exponentialfunktion in R Die Exponentialfunktion exp : R → (0, ∞), x exp(x) = e = ∞ � xn n=0 x2 x3 =1+x + + + ··· n! 2 6 ist positiv, streng monoton wachsend. Ausserdem gilt für alle n ∈ N0 : x limx→∞ xe n = ∞ und limx→−∞ |x n |e x = 0. Positivität: Wir sehen aus der Potenzreihe unmittelbar, dass e 0 = 1 und e x > 1 für alle x > 0. Ausserdem ist e −x = 1/e x , und daher ist e x ∈ (0, 1) für x < 0. Monotonie: Ist x > y , so setze d := x − y > 0. Dann ist 1 < e d und Multiplikation mit e y > 0 ergibt: e y < e y e d = e y +d = e x , also e y < e x für y < x. Grenzwerte: Aus der Potenzreihe sehen wir sofort, dass für x > 0 und festes n ∈ N0 gilt: e x ≥ Damit folgt ex lim n = ∞, insbesondere lim e x = ∞.. x→∞ x x→∞ Mit e −x = 1/e x folgt ebenso lim |x|n e x = 0, x→−∞ Höhere Mathematik insbesondere x n+1 . (n+1)! lim e x = 0. x→−∞ 258