Mathematik I 15. Septmber 2006 2 Kapitel 1 Lineare Gleichungssysteme und Determinanten 1.1 Punkte und Vektoren Wie in der Literatur üblich sei die Menge aller reellen Zahlen mit IR bezeichnet. Entsprechend bezeichnen IN, Z und Q die Teilmengen von IR, welche aus allen natürlichen, ganzen, beziehungsweise rationalen Zahlen bestehen. Definition 1.1 Eine Gerade g wird zu einer Zahlengeraden, wenn gilt: • Jedem Punkt von g entspricht genau eine reelle Zahl x und umgekehrt. Schreibweise: x ∈ g. • Für alle x, y ∈ IR ist der Betrag |x − y| gleich dem Abstand von x und y auf g. Mit Hilfe von Zahlengeraden lassen sich leicht Koordinatensysteme von Ebenen oder vom Raum einführen. Für den letzteren Fall wird dies beschrieben durch die Definition 1.2 a) Ein räumliches Koordinatensystem ist gegeben durch drei Zahlengeraden (bezeichnet als x-, y- und z-Achse), die sich rechtwinklig schneiden im gemeinsamen 0-Punkt O (als Ursprung des Systems bezeichnet). Jeder Punkt P im Raum wird eindeutig dargestellt durch seine Koordinaten x, y und z ∈ IR: P = (x; y; z) b) Die Koordinatenachsen und -ebenen sind gegeben durch {(x; 0; 0) | x ∈ IR} x-Achse {(0; y; z) | y, z ∈ IR} y-z-Ebene {(0; y; 0) | y ∈ IR} y-Achse {(x; 0; z) | x, z ∈ IR} x-z-Ebene {(0; 0; z) | z ∈ IR} z-Achse {(x; y; 0) | x, y ∈ IR} x-y-Ebene Die zu diesen Ebenen parallelen Ebenen durch den Punkt P = (x; y; z) schneiden die Koordinatenachsen in (x; 0; 0), (0; y; 0) und (0; 0; z). Ein geordnetes Paar (A, B) von Punkten A und B im Raum kann als Vektor von A nach B angesehen werden. Genauer ist damit die Parallelverschiebung gemeint, die den Punkt A in den Punkt B überführt. Für die praktische Rechnung eignet sich mehr die nachfolgende Definition. Sie setzt voraus, dass ein Koordinatensystem festgelegt ist. 3 4 KAPITEL 1. LINEARE GLEICHUNGSSYSTEME UND DETERMINANTEN Definition 1.3 Sind die Punkte A = (a1 ; a2 ; a3 ) und B = (b1 ; b2 ; b3 ) gegeben, so heißt die Spalte b − a1 −−→ 1 b2 − a2 AB = b3 − a3 b1 −−→ der Vektor von A nach B. Der Vektor OB = b2 heißt der Ortsvektor des Punktes B. b3 Beispiel: A = (1; 0; 0), B = (0; 1; 0) −1 −−→ 1 AB = 0 −−→ −−→ −→ −−→ Bemerkung 1.1 Genau dann gilt AB = CD, wenn AC = BD ist. Liegt der Punkt C nicht auf der Geraden durch A und B, so bilden die vier Punkte ein Parallelogramm. −−→ −−→ Begründung: Sei AB = CD. Für i = 1, 2 und 3 gilt dann bi − ai = di − ci bi − ai + ci = di | + ci | − bi ci − ai = di − bi −→ −−→ Hieraus folgt schließlich AC = BD und genauso schließt man in der umgekehrten Richtung. Definition 1.4 (Rechenoperationen für Vektoren) Es seien zwei Vektoren u1 v1 ~u = u2 , ~v = v2 v3 u3 und eine Zahl t ∈ IR gegeben. u1 + v1 a) Vektoraddition: ~u + ~v = u2 + v2 u3 + v3 −2 0 2 Beispiel: 0 + 1 = 1 1 3 4 b) Skalarmultiplikation: tu1 t~u = tu2 tu3 −4 2 Beispiel (−2) 0 = 0 2 −1 c) Vektorlänge: |~u| = Folgerung 1.1 q u21 + u22 + u23 −−→ −−→ −→ a) AB + BC = AC 1 √ Beispiel −2 = 1 + 4 + 4 = 3 2 1.1. PUNKTE UND VEKTOREN 5 −−→ −→ b) Seien die Punkte A, B und C gegeben und bezeichne ~u = AB, ~v = AC. Der eindeutig bestimmte Punkt D mit −→ −−→ AC = BD ergänzt das 4ABC zu einem Parallelogramm. Die Summe von ~u und ~v ist eine Diagonale dieses Parallelogramms: −−→ ~u + ~v = AD −−→ c) |AB| ist der Abstand der Punkte A und B im Raum. Begründung: w1 −−→ −−→ zu a) Sei w ~ = w2 = AB + BC. Für i = 1, 2 und 3 gilt w3 wi = (bi − ai ) + (ci − bi ) = ci − ai −→ und hieraus folgt w ~ = AC. zu b) D ist eindeutig bestimmt: Für i = 1, 2 und 3 gilt di − bi = ci − ai di = ci + bi − ai Mit a) folgt −−→ −→ −−→ −−→ −−→ ~u + ~v = AB + AC = AB + BD = AD zu c) Es kann A = O angenommen werden. Bezeichnet C = (b1 ; 0; 0) und D = (b1 ; b2 ; 0), so folgt wegen der rechten Winkel bei C und D aus dem Satz von Pythagoras: −−→ −−→ −−→ −−→ −−→ −−→ |OB|2 = |OD|2 + |DB|2 = |OC|2 + |CD|2 + |DB|2 = b21 + b22 + b23 Bemerkung 1.2 a) Die für Vektoren in IR3 definierten Rechenoperationen lassen sich sinngemäß übertragen auf Vektoren in IRn (für jede natürliche Zahl n): u1 + v1 tu1 v1 u1 q .. .. .. .. |~ u | = t~ u = u21 + · · · + u2n . + . = . . tun un + vn un vn ~ b) Für das Rechnen mit Vektoren gelten die nachfolgenden Regeln. Dabei sind ~u, ~v und w beliebige Vektoren in IRn und s, t ∈ IR. 0 1~u = ~u 0~u = ~0 = ... 0 ~u + ~v = ~v + ~u : Kommutativgesetz (~u + ~v ) + w ~ = ~u + (~v + w) ~ : erstes und s(t~u) = (st)~u : zweites Assoziativgesetz (s + t)~u = s~u + t~u : erstes und t(~u + ~v ) = t~u + t~v : zweites Distributivgesetz 6 KAPITEL 1. LINEARE GLEICHUNGSSYSTEME UND DETERMINANTEN Definition 1.5 (Lineare Unabhängigkeit von Vektoren) Sei n ∈ IN gegeben. a) Der Vektor ~0 aus Bemerkung 2b heißt der Nullvektor von IRn . b) Die n Vektoren e1 = 1 0 .. . , e2 = 0 1 .. . ,··· , 0 0 0 .. en = . 0 1 heißen die kanonischen Basisvektoren von IRn . c) Sei auch k ∈ IN. Die k Vektoren ~a1 , . . . , ~ak in IRn heißen linear unabhängig, falls aus der Vektorgleichung t1~a1 + · · · + tk~ak = ~0 mit t1 , . . . , tk ∈ IR stets folgt t1 = t2 = · · · = tk = 0. Andernfalls heißen sie linear abhängig. Beispiele 1) Die beiden Vektoren 2 −3 und 1 0 t1 2 −3 sind linear unabhängig (n = k = 2): + t2 2t1 + t2 −3t1 = 1 0 0 0 = ~0 Es folgt −3t1 = 0 und hieraus t1 = 0 und 2 · 0 + t2 = 0, also ist auch t2 = 0. 2) Für jeden Vektor ~u und jede Zahl t sind ~a1 = ~u und ~a2 = t~u linear abhängig (k = 2): Wird t1 = −t und t2 = 1 6= 0 gesetzt, so gilt die nicht triviale Darstellung des Nullvektors: t1~a1 + t2~a2 = −t~u + t~u = (−t + t)~u = 0~u = ~0 3) Die kanonischen Basisvektoren sind linear unabhängig (k = n): Aus der Vektorgleichung t1 .. . = t1~e1 + · · · + tn~en = ~0 tn folgt, dass die Zahlen t1 , · · · , tn alle =0 sind. 1.2 Lineare Gleichungssysteme und Matrizen Beispiel Es seien die folgenden drei Gleichungen in x1 , x2 und x3 gegeben. x1 + 2x3 = 7 −x1 + x2 − x3 = 4 3x1 − 2x2 = 0 1.2. LINEARE GLEICHUNGSSYSTEME UND MATRIZEN 7 Gesucht ist die Lösungsmenge, d. h. die Menge L der Vektoren x in IR3 , die alle drei Gleichungen erfüllen. Letztere lassen sich zu einer einzigen Vektorgleichung zusammenfassen: Die Gleichungen sind nämlich äquivalent zu x1 + 0 · x2 + 2x3 = 7 −x1 + x2 − x3 = 4 3x1 − 2x2 + 0 · x3 = 0 und der Vektorgleichung 1 0 2 7 x1 −1 + x2 1 + x3 −1 = 4 3 −2 0 0 Der Begriff des linearen Gleichungssystems (LGS) wird nun beschrieben durch die Definition 1.6 i) Ein LGS mit m Gleichungen in x1 , · · · , xn ist gegeben durch n + 1 Spaltenvektoren ~a1 , · · · , ~an und ~b in IRm . Es lautet als Vektorgleichung x1~a1 + · · · + xn~an = ~b . (VG) Die Menge L = {~x | ~x erfüllt (VG)} heißt die Lösungsmenge des LGS. ii) Die Spaltenvektoren ~a1 , · · · , ~an bilden die Koeffizientenmatrix A = (~a1 , · · · , ~an ) und der Spaltenvektor ~b heißt die rechte Seite des LGS. Das LGS lautet in Matrizenform: A~x = ~b und in Tabellenform a1,j mit ~aj = ... für j = 1, · · · , n : am,j x1 a1,1 .. . x2 a1,2 .. . ··· ··· .. . xn a1,n .. . b1 .. . am,1 am,2 ··· am,n bm Das System des Einführungsbeispiels lautet in Tabellenform: x1 x2 x3 1 0 2 7 −1 1 −1 4 3 −2 0 0 Es werden nun einige Beispiele zur Bestimmung der Lösungsmenge gebracht. Einführungsbeispiel Es wird das Lösungsverfahren von Gauß angewendet. Seine Strategie besteht darin, das System schrittweise in Systeme umzuformen, welche dieselbe Lösungsmenge haben und Gleichungen enthalten, in denen jeweils eine Unbekannte weniger vorkommt. Die ersten Schritte führen so auf ein System, das zwei Gleichungen ohne die Unbekannte x1 enthält. Sie folgen jeweils durch Multiplikationen von zwei Gleichungen mit passenden Faktoren und anschließende Additionen. Da jede 8 KAPITEL 1. LINEARE GLEICHUNGSSYSTEME UND DETERMINANTEN solche Umformung mit Faktoren ungleich 0 wieder rückgängig gemacht werden kann, bleibt die Lösungsmenge erhalten. x1 x2 x3 1 0 2 7 3 1 −1 1 −1 4 1 3 −2 0 0 −1 Das neue System erhalten wir auf folgende Weise: Die neue erste Gleichung ist die erste Gleichung des alten Systems. Die neue zweite Gleichung folgt durch die beschriebenen Operationen mit den in der ersten ergänzten Spalte aufgeführten Faktoren 1 aus der alten ersten und der alten zweiten Gleichung. In diesem Fall werden die beiden Gleichungen einfach addiert. Die neue dritte Gleichung folgt auf analoge Weise aus der alten ersten und der alten dritten Gleichung mit den Faktoren in der zweiten ergänzten Spalte. x1 x2 x3 1 0 2 7 0 1 1 11 2 −1 0 2 6 21 Die beiden letzten Gleichungen bilden ein LGS in den Unbekannten x2 und x3 . Es wird als Restsystem bezeichnet. Wir tun gut daran, zunächst nur dessen Lösungsmenge zu bestimmen. Zur gesuchten Lösungsmenge des Ausgangssystems gelangen wir dann, indem wir für jedes Element x2 der Lösungsmenge des Restsystems die Unbekannte x1 mit der ersten Gleichung bestimx3 men. Das Restsystem wird nun so umgeformt, daß es eine Gleichung ohne x2 enthält. In dieser tritt dann nur x3 als Unbekannte auf, es kann also hiermit x3 bestimmt werden. Das erneut umgeformte System unterscheidet sich vom gegenwärtigen lediglich durch die letzte Gleichung und diese erhalten wir mit den angegeben Faktoren: −4x3 = 1 Die Lösungsmenge besteht aus genau einem Spaltenvektor ~x. Er kann leicht aus den passenden Gleichungen bestimmt werden: x3 = −0, 25 x2 + x3 = 11 x2 = 11, 25 x1 + 2x3 = 7 x1 = 7 + 0, 5 = 7, 5 7, 5 ~x = 11, 25 −0, 25 Beispiel 2 Es wird die Lösungsmenge des folgenden LGS bestimmt (n = 3, m = 2) 2x1 − x2 + 2x3 = −2 3x1 + 2x2 − x3 = 5 Es wird in Tabellenform übertragen und dann die Unbekannte x1 x1 x2 x1 x2 x3 2 −1 2 −1 2 −2 3 3 2 −1 5 0 −7 −2 eliminiert. x3 2 8 −2 −16 1.2. LINEARE GLEICHUNGSSYSTEME UND MATRIZEN 9 Die Lösungsmenge des umgeformten Systems kann leicht bestimmt werden: Offenbar gibt es zu x2 jeder reellen Zahl t einen Spaltenvektor mit x3 = t, welcher die zweite Gleichung erfüllt. x3 Es muss nur hierzu passend x2 bestimmt werden und mit der ersten Gleichung schließlich x1 , um die gesuchte Lösungsmenge L zu erhalten: x3 = t − 7x2 + 8t = −16 x2 = 16 8 t+ 7 7 2x1 − x2 + 2x3 = −2 16 8 t+ 2x1 − + 2t = −2 7 7 6 2 2x1 = − t + 7 7 1 3 x1 = − t + 7 7 Damit ist L gegeben durch −3t/7 + 1/7 L = 8t/7 + 16/7 | t ∈ IR t Es genügt wohl, das Ergebnis in der folgenden kurzen Form anzugeben: −3t/7 + 1/7 ~x = 8t/7 + 16/7 t Werden die Unbekannten x1 , . . . , x3 als räumliche Koordianten gedeutet, so beschreiben die beiden Gleichungen des Ausgangssystems zwei Ebenen im Raum. Die Schnittmenge dieser Ebenen ist eine Gerade. Die obige Vektorgleichung beschreibt diese Gerade in Parameterform. Zum Abschluss dieses Abschnitts sollen zwei wichtige Spezialfälle von linearen Gleichungssystemen diskutiert werden. Dies sind die homogenen Systme und die Systeme in Zeilenstufenform. Definition 1.7 Das LGS A~x = ~b heißt homogen, falls ~b der Nullvektor ist. Andernfalls heißt es inhomogen. Bemerkung 1.3 Unter einer Lösung eines LGS sei ein beliebiges Element seiner Lösungsmenge verstanden. a) Das homogenes System A~x = ~0 hat stets die triviale Lösung ~x = ~0. Die Spalten von A sind genau dann linear abhängig, wenn das System eine nicht triviale Lösung ~x 6= ~0 hat. b) Ist ~x0 eine Lösung des LGS A~x = ~b und L0 die Lösungsmenge des homogenen Systems A~x = ~0, so erhält man die folgende Darstellung der Lösungsmenge L des LGS A~x = ~b: L = ~x0 + L0 = {~x0 + ~z | ~z ∈ L0 } Die Aussage von Bemerkung 3b lautet in leicht zu merkender Form: Die allgemeine Lösung des LGS ist die Summe aus einer speziellen Lösung und der allgemeinen Lösung des (zugehörigen) homogenen Systems. Die Form des LGS nach Abschluss der Eliminationen verdient eine passende Beschreibung. Dies leistet die nachfolgende Definition. 10 KAPITEL 1. LINEARE GLEICHUNGSSYSTEME UND DETERMINANTEN Definition 1.8 Das LGS A~x = ~b mit m Gleichungen in x1 , . . . , xn befindet sich in Zeilenstufenform, falls gilt 1) In der Diagonalen ist jeder Koeffizient ungleich 0: m ≤ n und ai,i 6= 0 für i = 1, . . . , m 2) Die Koeffizienten unter der Diagonalen sind alle gleich 0: ai,j = 0 für m ≥ i > j Bemerkung 1.4 Ist die Lösungsmenge eines LGS nicht leer, so kann es in Zeilenstufenform gebracht werden. Dabei sind ggf. Gleichungen der Form 0=0 wegzulassen sowie Gleichungen und/oder Variable zu vertauschen. In der Koeffizientenmatrix sind dabei Zeilen bzw. Spalten zu vertauschen. Das nachfolgende Beispiel zeigt die Umwandlung in Zeilenstufenform: x1 x2 x3 x1 x2 x3 2 −1 3 0 2 2 −1 3 0 −4 2 −6 0 1 0 0 0 0 0 0 1 2 0 0 1 2 Die zweite Gleichung kann weggelassen werden. Die dritte Gleichung legt die Unbekannte x3 auf den Wert 2 fest, sie ist daher kein freier Parameter. Jedoch kann durch x2 = t die Unbekannte x2 als freier Parameter gewählt werden. Nach Auflösung der ersten Gleichung nach x1 ist die Lösungsmenge bestimmt. Das System befindet sich aber erst in Zeilenstufenform, wenn außer der Fortlassung der zweiten Gleichung die Unbekannten x2 und x3 vertauscht werden. Dabei sind die zweite und die dritte Spalte der Koeffizientenmatrix zu vertauschen: x1 x3 x2 2 3 −1 0 0 1 0 2 Mit x2 = t erhalten wir eine Darstellung der Lösungsmenge: 2x1 + 3x3 − x2 = 0 t x1 = − 3 2x1 + 6 − t = 0 2 t/2 − 3 −3 1/2 = 0 + t 1 t ~x = 2 2 0 1.3 Matrizenrechnung Definition 1.9 Seien natürliche Zahlen n und m gegeben. Eine (m, n)-Matrix A besteht aus n Spaltenvektoren ~a1 , . . . , ~an in IRm : a1,1 a1,2 · · · a1,n .. .. A = (~a1 , . . . , ~an ) = ... . . am,1 am,2 · · · am,n Dementsprechend hat A genau m Zeilen und n Spalten. In der i-ten Zeile und j-ten Spalte befindet sich die i-te Koordinate von ~aj . Sie wird bezeichnet mit ai,j . Diese reellen Zahlen ai,j heißen 1.3. MATRIZENRECHNUNG 11 die Koeffizienten der Matrix A. Dies wird durch die Schreibweise A = (ai,j ) zum Ausdruck gebracht. Die Matrix mit den kanonischen Basisvektoren ~e1 , . . . , ~en von IRn als Spalten (m = n, vgl. Definition 1.5) heißt die Einheitsmatrix vom Typ (n, n). Sie wird bezeichnet durch En : En = (~e1 , . . . , ~en ) = 1 0 0 1 .. .. . . 0 0 ··· ··· .. . 0 0 .. . ··· 1 Mit Matrizen kann man in eingeschränkter Form wie mit reellen Zahlen rechnen. Die Addition und die Multiplikation geschieht dabei wie in der nachfolgenden Definition beschrieben ist. Definition 1.10 a) Für gegebene (m, n)-Matrizen A = (ai,j ) und B = (bi,j ) ist die Summenmatrix definiert als die (m, n)-Matrix C = (ci,j ) mit den folgenden Koeffizienten: ci,j = ai,j + bi,j i = 1, . . . , m j = 1, . . . , n Beispiel: 2 0 −1 3 + −1 1 1 1 = 1 1 0 4 b) Seien m, n und r ∈ IN sowie eine (m, n)-Matrix A = (ai,j ) und eine (n, r)-Matrix B = (bj,k ) gegeben. Dann ist die Produktmatrix C = A · B definiert als die (m, r)-Matrix mit den folgenden Koeffizienten: ci,k = ai,1 b1,k + · · · + ai,n bn,k i = 1, . . . , m k = 1, . . . , r Die Anzahl der Spalten von A stimmt überein mit der Anzahl der Zeilen von B. Zur Berechnung von ci,k werden die Elemente der i-ten Zeile von A multipliziert mit den Elementen der (gleich langen!) k-ten Spalte von B und die erhaltenen n Produkte werden aufsummiert. Beispiel für das Produkt von zwei (2, 2)-Matrizen: 2 −1 −1 5 (2 · (−1) + (−1) · 4) (2 · 5 + (−1) · (−2)) −6 · = = −3 2 4 −2 ((−3) · (−1) + 2 · 4) ((−3) · 5 + 2 · (−2)) 11 12 −19 Mit Hilfe der Matrizenrechnung können lineare Gleichungssysteme als Matrizengleichungen geschrieben werden (vgl. nachfolgende Bemerkung 5a). Später wird sich zeigen, daß die Bestimmung eines eindeutigen Lösungsvektors der Auflösung einer Matrizengleichung entspricht. Bemerkung 1.5 a) Der Spaltenvektor ~x, aufgefaßt als (n, 1)-Matrix, gehört genau dann der Lösungsmenge des LGS A~x = ~b an, wenn er die Matrizengleichung A · ~x = ~b erfüllt. b) Seien die Matrizen A und B wie in Definition 1.10 gegeben und bezeichne ~b1 , . . . , ~br die Spalten von B. Dann gilt für die Produktmatrix C = A · B: C = (A · ~b1 , . . . , A · ~br ) Die nachfolgende Bemerkung zeigt, daß sich die Einheitsmatrizen ihrem Namen entsprechend neutral verhalten in Bezug auf die Multiplikation von Matrizen. 12 KAPITEL 1. LINEARE GLEICHUNGSSYSTEME UND DETERMINANTEN Bemerkung 1.6 Für jede (m, n)-Matrix A und En , Em gemäß Definition 1.9 gelten die (trivialen) Gleichungen Em · A = A A · En = A Insbesondere sind A · ~e1 , . . . , A · ~en die Spalten von A. Die wohl berechtigte Frage nach Rechenregeln für Matrizen wird vorläufig beantwortet durch den Satz 1.1 a) Das Matrizenprodukt ist assoziativ, d. h. das Ergebnis hängt nicht von der Reihenfolge der Ausführung der Multiplikationen ab (die Reihenfolge der Faktoren darf nicht geändert werden). Sind die Produkte jeweils definiert, so gilt: (A · B) · C = A · (B · C) b) Es gelten die beiden Distributivgesetze (die jeweilgen Rechenoperationen müssen definiert sein) (A + B) · C = A · C + B · C C · (A + B) = C · A + C · B Bemerkung: Es gilt kein Kommutativgesetz der Multiplikation: 1 1 1 1 2 1 1 1 1 = 0 1 1 0 1 0 1 0 0 1 1 = 1 1 2 1 Wie beim Rechnen mit Zahlen hat die Multiplikation Vorrang gegenüber der Addition. Daher können oft Klammern fortgelassen werden. Auf die Frage nach einer Division von Matrizen wird in der nachfolgenden Definition und im daran anschließenden Satz eingegangen. Definition 1.11 Eine (n, n)-Matrix A heißt regulär, wenn die Matrizengleichung A · X = En mit einer (n, n)-Matrix X gelöst werden kann. Andernmfalls hießt A singulär. Bemerkung 1.7 Genau dann ist A regulär, wenn alle n LGS.e A~x = ~ej (j = 1, . . . , n) Lösungen haben. Satz 1.2 Die Matrix X in Definition 1.11 ist eindeutig bestimmt durch die reguläre Matrix A. Sie heißt die zu A inverse Matrix und wird mit A−1 bezeichnet. Sie erfüllt die Matrizengleichungen A · A−1 = En A−1 · A = En Begründung: wird später nachgereicht mit Hilfe der Determinantenrechnung. Folgerung 1.2 Sei A eine reguläre (n, n)-Matrix. a) Für beliebige reelle Zahlen b1 , . . . , bn hat das LGS A~x = ~b genau eine Lösung. Sie ist gegeben durch ~x = A−1 · ~b. Insbesondere sind die Spalten von A linear unabhängig. b) Ist ~xj die Lösung des LGS A~x = ~ej für j = 1, . . . , n, so ist die inverse Matrix gegeben durch A−1 = (~x1 , . . . , ~xn ) . Zu ihrer Berechnung müssen also n lineare Gleichungssysteme gelöst werden. 1.3. MATRIZENRECHNUNG 13 Begründug: Zu a): Für ~x = A−1 · ~b gilt nach Satz 1.1: A · ~x = A · (A−1 · ~b) = (A · A−1 ) · ~b = En · ~b = ~b , es ist also A · ~x = ~b. Sei ~y eine beliebige Lösung. Es ist zu zeigen, dass sie mit der Lösung ~x übereinstimmt. Hierzu folgt aus Satz 1.1 A · (~x − ~y ) = A · ~x − A · ~y = ~b − ~b = ~0 ~x − ~y = En · (~x − ~y ) = A−1 · (A · (~x − ~y )) = A · ~0 = ~0 Zu b): Nach Bemerkung 1.5b gilt A · (~x1 , . . . , ~xn ) = (A · ~x1 , . . . , A · ~xn ) = (~e1 , . . . , ~en ) = En Die nachfolgende Bemerkung zeigt, daß die Berechnung der inversen Matrix einer (2, 2)-Matrix nur geringen Rechenaufwand erfordert. Bemerkung 1.8 Es sei die folgende allgemeine (2, 2)-Matrix gegeben a b A= c d und bezeichne δ = ad − bc. Falls δ 6= 0 ist, dann ist die Matrix A regulär und ihre Inverse ist gegeben durch 1 d −b −1 A = . −c a δ Im Fall δ = 0 sind die Spalten sowie die Zeilen von A linear abhängig und A ist nicht regulär. Begründung: 1.) Aus δ = 0 folgt die lineare Abhängigkeit der beiden Spalten sowie der beiden Zeilen: Im Fall a = c = 0 ist nichts mehr zu zeigen, da die erste Spalte der Nullvektor ist. Es sind noch die Fälle a 6= 0 und c 6= 0 zu behandeln. In beiden Fällen ist wegen ad = bc die lineare Abhängikeit leicht zu erkennen: b d b a b a Falls a 6= 0 : = Falls c 6= 0 . = d c d c a c Die Matrix A kann in diesem Fall also nicht regulär sein, da das homogene System nicht eindeutig lösbar ist. Auch die Zeilen von A sind linear abhängig: Für die als die Transponierte von A bezeichnete Matrix a c AT = b d ist ebenfalls δ = 0, also sind ihre Spalten linear abhängig. Letztere sind aber die Zeilen von A. 2.) Im Fall δ 6= 0 rechnet man leicht mit der obigen Matrix A−1 nach, dass A · A−1 = E2 ist: 1 1 a b d −b a b d −b A · A−1 = · = · c d −c a c d −c a δ δ 1 ad − bc −ab + ba = = E2 cd − dc −cb + da δ 14 KAPITEL 1. LINEARE GLEICHUNGSSYSTEME UND DETERMINANTEN Beispiel: Probe: 7 5 4 3 −1 7 5 4 3 3 · −5 1 = 7·3−5·4 −4 7 = 3 −5 −4 7 21 − 20 15 − 15 = 3 −5 −28 + 28 −20 + 21 −4 7 = E2 Beispiel 3 Die Folgerung 1.2b zeigt, wie die inverse Matrix berechnet werden kann. Es sind lineare Gleichungssysteme mit mehreren rechten Seiten zu lösen. Hierzu eignet sich das Verfahren von Gauß-Jordan. Seine Strategie läuft darauf hinaus, nach Erreichen der Zeilenstufenform nach Gauß durch Umwandlung auch der Koeffizienten über der Diagonalen in 0 eine Diagonalform zu erreichen. Nach Division durch die Diagonalelemente ist schließlich das Ziel erreicht: Die drei rechten Seiten sind dann genau die Spalten von A−1 . Ein anderes Beispiel wird in Papula Band 2, S. 90ff. behandelt. 1 2 −1 A= 0 3 2 0 1 1 In den nachfolgenden Tabellen sind die drei rechten Seiten als Spalten der Tabelle hinzugefügt. Im zweiten System ist nur die dritte Zeile neu. Sie ist daher kursiv gedruckt. 1 2 −1 1 0 0 0 1 2 −1 1 0 3 0 3 2 0 1 0 1 0 3 2 0 1 0 −2 0 1 1 0 0 1 0 0 −1 0 1 −3 −3 Außer der angedeuteten Umformung der ersten Zeile wird im nächsten Schritt auch die dritte Zeile durch ihr Diagonalelement -1 dividiert. Im übernächsten Schritt werden die zur Erreichung der Diagonalform nötigen Umwandlungen von Elementen der dritten Spalte durchgeführt. 1 3 0 −7 3 −2 0 3 0 0 3 −9 21 0 3 0 3 0 0 2 0 1 0 1 3 −6 0 0 1 0 −1 3 7 −2 0 0 1 0 −1 3 Schließlich brauchen nur noch die beiden ersten Zeilen durch 3 dividiert werden. Das Ergebnis wird noch einmal separat aufgeführt. 1 0 0 1 −3 7 1 −3 7 0 1 0 0 1 −2 A−1 = 0 1 −2 0 0 1 0 −1 3 0 −1 3 1.4 Determinanten Zur Einführung werden Determinanten von (2, 2)-Matrizen betrachtet. Definition 1.12 Für jede (2, 2)-Matrix wird ihre Determinante definiert als die Zahl δ aus der Bemerkung 1.6: a b det = ad − bc . c d Folgerung 1.3 (Cramersche Regel) Seien A wie in Definition 1.12 und b1 , b2 ∈ IR gegeben. Bezeichne b1 b a b1 Z1 = Z2 = , b2 d c b2 d. h. Z1 und Z2 gehen aus der Matrix A hervor, indem die erste bzw. zweite Spalte ersetzt wird durch die Spalte ~b. Dann gilt 1.4. DETERMINANTEN 15 a) Ist det(A) 6= 0 so ist die nach Bemerkung 1.7 und Folgerung 1.2 eindeutig bestimmte Lösung des LGS A~x = ~b gegeben durch x1 = det(Z1 ) det(A) x2 = det(Z2 ) det(A) b) Ist det(A) = 0, so hat das homogene LGS A~x = 0 nicht triviale Lösungen und es existieren Spaltenvektoren ~b, für die das LGS A~x = ~b keine Lösung hat. Begründung: Zu a) Da A nach Bemerkung 1.7 regulär ist, existiert genau eine Lösung: ~x = A−1 · ~b. Mit der Matrix A−1 aus Bemerkung 1.7 und δ = det(A) folgt also 1 1 1 d −b b1 b1 d − b2 b det(Z1 ) = = ~x = −c a b2 a − b1 c det(Z2 ) b2 det(A) det(A) det(A) Zu b) Für die so genannte zu A transponierte Matrix a c T A = b d gilt nach Voraussetzung ebenfalls det(AT ) = det(A) = 0 und damit sind die Spalten von AT linear abhängig. Daher gilt für ein ~λ 6= ~0 c 0 a + λ2 = λ1 d 0 b Wählt man ~b, so dass λ1 b1 + λ2 b2 6= 0 ist, so hat das LGS A~x = ~b keine Lösung: x1 x2 a b b1 λ 1 c d b2 λ2 Die angedeutet Umformung führen auf eine nicht erfüllte Gleichung, denn die linke Seite ist gleich 0 und die rechte Seite ist nach Wahl von ~b ungleich 0. Beispiel: x1 x2 3 5 −1 det(A) = 21 − 20 = 1 2 4 7 −1 5 3 −1 x1 = det(Z1 ) = det = −17 x2 = det(Z2 ) = det = 10 2 7 4 2 Satz 1.3 Seien A, B, C und D die Eckpunkte eines Parallelogramms in der x-y-Ebene mit den Diagonalen BC und AD . −−→ −→ a) Mit ~u = AB, ~v = AC ist der Flächeninhalt des Parallelogramms gegeben durch |2ABCD| = | det(~u, ~v )| b) Die Fläche des Dreiecks ist gegeben durch |4ABC| = 1 | det(~u, ~v )| 2 −−→ −→ Dabei ist genau dann det(AB, AC) > 0, wenn durch die Reihenfolge ABC der Eckpunkte der positive Drehsinn (Gegenuhrzeigersinn) beschrieben wird. 16 KAPITEL 1. LINEARE GLEICHUNGSSYSTEME UND DETERMINANTEN Begründung: Es sei vereinfachend angenommen: A = O, B = (b1 ; b2 ) und C = (c1 ; c2 ) mit 0 ≤ c1 ≤ b1 und 0 ≤ b2 ≤ c2 Insbesondere ist der Drehsinn zu der Reihenfolge ABC positiv. Es genügt nun, b) zu zeigen, da das Parallelogramm aus zwei flächengleichen Dreiecken besteht. Mit den beiden Punkten B 0 = (b1 ; 0) und C 0 = (c1 ; 0) auf der x-Achse gilt wegen der entsprechenden Flächenzerlegung (man zeichne hierzu eine Skizze!) |4ABC| = |4OC 0 C| + |2C 0 B 0 BC| − |4OB 0 B| 1 1 1 = c1 c2 + (b2 + c2 )(b1 − c1 ) − b1 b2 2 2 2 1 = (c1 c2 + b2 b1 + c2 b1 − b2 c1 − c2 c1 − b1 b2 ) 2 1 = (b1 c2 − c1 b2 ) 2 1 1 b1 c1 = det(~u, ~v ) = det b2 c2 2 2 Beispiel B = (−1; −1) C = (−2; 1) − → −3 −4 ~v = AC = −1 1 −3 −4 = −3 − 4 = −7 < 0 , det(~u, ~v ) = det −1 1 A = (2; 0) −−→ ~u = AB = es wird also der negative Drehsinn festgelegt durch die Reihenfolge ABC. Der Flächeninhalt des Dreiecks beträgt |4ABC| = 7/2 = 3, 5 Der nachfolgende Satz wird zunächst für (2, 2)-Matrizen ausgesprochen und ist für diese auch leicht einzusehen. Er gilt aber auch für die später betrachteten allgemeineren Determinanten von (n, n)-Matrizen. Satz 1.4 (Rechenregeln für Determinanten) (i) Bei Vertauschung von zwei Zeilen oder zwei Spalten wechselt die Determinante das Vorzeichen: c d a b det = − det a b c d (ii) Die Determinante wird mit einem Faktor λ ∈ IR multipliziert, indem alle Elemente einer Zeile (oder einer Spalte) mit λ multipliziert werden. a b λa b λ det = det c d λc d (iii) Die Determinante ändert sich nicht, wenn zu einer Zeile (Spalte) ein Vielfaches einer anderen Zeile (Spalte) addiert wird. a b a b det = det c d c + λa d + λb 1.4. DETERMINANTEN 17 Beispiel det 2 −2 1 3 = det 2 2 + (−2) 1 3+1 = det 2 0 1 4 =8 Auf diese Weise können leicht Matrixelemente in 0 umgewandelt werden zum Vorteil bei der weiteren Rechnung. (iv) det(E2 ) = 1 . Der nächste Satz sagt aus, dass es auch für (n, n)-Matrizen mit n > 2 Determinanten mit den passenden Eigenschaften gibt. Es existiert auch eine Formel hierfür, sie ist aber zur Berechnung völlig ungeeignet und ohne Kenntnisse der Gruppentheorie schwer zu verstehen. Für unsere Zwecke genügt es, die Determinante mit praktikablen Methoden berechnen zu können. Satz 1.5 Für jede natürliche Zahl n ≥ 2 gibt es eine Rechenvorschrift, die jeder (n, n)-Matrix A eine reelle Zahl det(A) zuordnet, so dass die Regeln (i)-(iv) aus Satz 1.4 sinngemäß erfüllt sind. Die Rechenvorschrift ist hierdurch eindeutig festgelegt. Die anschließende Folgerung zeigt häufig verwendete Eigenschaften der Determinante. Folgerung 1.4 Sei n ∈ IN mit n > 1 und A eine (n, n)-Matrix. a) Die Zeilen (Spalten) von A sind genau dann linear abhängig, wenn det(A) = 0 ist. Dies trifft insbesondere zu, wenn zwei Zeilen (Spalten) übereinstimmen oder wenn eine Zeile (Spalte) der Nullvektor ist. b) Sei A eine Dreiecksmatrix, d. h. entweder ist ai,j = 0 für i > j (rechte obere Dreiecksmatrix) oder es ist ai,j = 0 für j > i (linke untere Dreiecksmatrix). Dann gilt mit di = ai,i für i = 1, . . . , n det(A) = d1 · d2 · . . . · dn , d. h. die Determinante ist das (n-fache) Produkt aller Diagonalelemente. Begründung: Zu a) In den beiden Sonderfällen folgt det(A) = 0 leicht aus den Regeln (ii) und (iii). Bei linearer Abhängigkeit kann durch wiederholte Anwendung dieser Regeln eine Nullspalte (oder Nullzeile) hergestellt werden. Bei linearer Unabhängigkeit kann durch Umformungen nach den Regeln eine Dreiecksmatrix hergestellt werden, in der alle Diagonalelemente 6= 0 sind. Aus b) folgt dann det(A) 6= 0. Zu b) Sind alle dj 6= 0, so kann die Matrix in Diagonalform gebracht werden, wobei die Diagonalelemente erhalten bleiben: In geeigneter Reihenfolge lassen sich alle Elemente außerhalb der Diagonalen in 0 umwandeln. Die Formel für die Determinante folgt dann durch n-malige Anwendung der Regel (ii) und aus der Regel (iv). Sei nun mindestens ein Diagonalelement = 0 und A eine rechte obere Dreiecksmatrix. Für ein passendes j ist dann dj = 0, aber di 6= 0 für i < j. Durch Spaltenumformungen nach Regel (iii) können alle Elemente der j-ten Spalte in 0 umgewandelt werden. Hieraus folgt schließlich det(A) = 0. Beispiel 4 Es wird die Determinante der folgenden (4,4)-Matrix A berechnet. 2 2 A= 0 -2 1 −2 3 −1 2 0 1 1 3 −1 4 1 3 5 1 1 18 KAPITEL 1. LINEARE GLEICHUNGSSYSTEME UND DETERMINANTEN Durch Zeilenumformungen nach Regel (iii) gelingt die Umformung in eine rechte obere Dreiecksmatrix. Dabei werden die gerahmten Matrixelemente in 0 umgewandelt. Diese kennzeichnen zugleich auch die zu ersetzenden Zeilen. Im vorletzten Schritt wird außerdem von der Regel (ii) Gebrauch gemacht und wegen Vertauschung der beiden letzten Zeilen kommt eine Vorzeichenumkehr hinzu. In den angefügten Spalten sind die verwendeten Faktoren aufgeführt. Es ist darauf zu achten, daß der Faktor in der zu ersetzenden Zeile immer gleich 1 ist, damit die Regel (iii) überhaupt anwendbar ist. 2 1 −2 3 2 1 −2 3 0 1 0 1 2 −2 2 −2 −3 −2 det(A) = det = det 0 3 −1 4 1 0 0 −7 10 1 0 0 −3 12 0 2 1 8 2 1 −2 3 2 1 −2 3 0 1 0 1 2 2 −2 −2 = −(−3) det = 3 det 0 0 7 1 −4 0 0 1 −4 1 0 0 0 −18 0 0 -7 10 = 3 · (2 · 1 · 1 · (−18)) = −108 Entwicklung von Determinanten Zu Vorbereitung des Satzes über die Entwicklung nach einer Spalte (Zeile) werden die algebraischen Komplemente Ai,j der Elemente ai,j einer Matrix definiert (i, j = 1, . . . , n). Ein Zahlenbeispiel fördert das Verständnis dieser Definition. Definition 1.13 (algebraische Komplemente). Sei A = (ai,j ) eine (n, n)-Matrix (n > 1). Für i, j = 1, . . . , n bezeichne die Zahl Ai,j die Determinante der (n − 1, n − 1)-Matrix, die aus A durch Fortlassung von i-ter Zeile und j-ter Spalte entsteht, multipliziert mit dem Vorzeichenfaktor (−1)i+j . Beispiel (n = 3) −2 A= 2 −3 −1 7 1 3 −6 4 Die Vorzeichenfaktoren beginnen mit dem Faktor 1 und wechseln regelmäßig mit -1 und 1 ab. 7 −6 A1,1 = det = 28 + 6 = 34 i=j=1 1 4 2 −6 2 7 A1,2 = − det = −(8 − 18) = 10 A1,3 = det = 2 + 21 = 23 −3 4 −3 1 −1 3 −2 3 A2,1 = − det = −(−4 − 3) = 7 A2,2 = det = −8 + 9 = 1 1 4 −3 4 −2 −1 −1 3 A2,3 = − det = −(−2 − 3) = 5 A3,1 = det = 6 − 21 = −15 −3 1 7 −6 −2 3 −2 −1 A3,2 = − det = −(12 − 6) = −6 A3,3 = det = −14 + 2 = −12 2 −6 2 7 Satz 1.6 (Entwicklungssatz für Determinenten) Mit den algbraischen Komplementen aus Definition 1.13 gilt a) für j = 1, . . . , n (Entwicklung nach der j-ten Spalte) det(A) = a1,j A1,j + · · · + an,j An,j , 1.4. DETERMINANTEN 19 b) für i = 1, . . . , n (Entwicklung nach der i-ten Zeile) det(A) = ai,1 Ai,1 + · · · Ai, Ai,n . Im nachfolgenden Beispiel wird jeweils vorteilhaft nach der ersten Spalte entwickelt. Selbstverständlich werden die Berechnungen von algebraischen Komplementen zu Nullelementen der Matrix eingespart. 1 7 3 8 0 2 −1 9 A= 0 0 −1 5 2 0 0 1 −1 9 7 3 8 −1 5 − 2 det 2 −1 9 0 1 0 −1 5 −1 9 3 8 = −2 − 2 · 7 det − 2 det −1 5 −1 5 2 det(A) = det 0 0 = −2 − 2(7(9 − 5) − 2(15 + 8)) = −2 − 2(28 − 46) = −2 + 2 · 18 = 34 Satz 1.7 (Regel von Sarrus): Für die Berechnung der allgemeinen (3,3)-Matrix a1 b1 c1 A = a2 b2 c2 a3 b3 c3 gilt die Formel det(A) = a1 b2 c3 + b1 c2 a3 + c1 a2 b3 − a3 b2 c1 − b3 c2 a1 − c3 a2 b1 Man kann sich diese Regel leicht merken: Nach Anfügung der beiden ersten Spalten: a1 a2 a3 b1 b2 b3 c1 c2 c3 a1 a2 a3 b1 b2 b3 werden die drei Produkte mit Pluszeichen gebildet von der Diagonalen und zwei hierzu parallel verlaufenden Verbindungslinien und die drei Produkte mit Minuszeichen analog mit drei hierzu quer verlaufenden Verbindungslinien. Von der Verwendung dieser Regel ist jedoch abzuraten, wenn keine oder nur wenig Matrixelemente = 0 sind. Der Rechenaufwand ist nämlich i. a. geringer, wenn nach einer Zeile oder Spalte entwickelt wird: Sarrus: Entwiclungssatz: Beispiel: (vgl. Beispiel 5) 7 3 det 2 −1 0 −1 12 Mulitplikationen 9 Multiplikationen 8 9 = −35 + 0 − 16 − 0 + 63 − 30 = −18 5 20 KAPITEL 1. LINEARE GLEICHUNGSSYSTEME UND DETERMINANTEN Satz 1.8 (Multiplikationssatz für Determinanten): Für beliebige (n, n)-Matrizen A und B gilt det(A · B) = det(A) · det(B) . Das Kapitel wird beendet mit einer Anwendung der Determinanten auf lineare Gleichungssysteme und Berechnung der inversen Matrix analog zu der Situation für n = 2 zu Beginn der Determinantenrechnung. Zuvor wird noch der benötigte Begriff der Transponierten einer Matrix eingeführt. Definition 1.14 Sei A eine (n,n)-Matrix. Die neue Matrix mit den Spalten von A als Zeilen (und umgekehrt) heißt die zu A transponierte Matrix. Sie wird bezeichnet mit AT . Beispiel: 2 5 3 7 T = 2 3 5 7 Man erhält AT aus A auch durch ”Spiegelung” der Koeffizienten an der Diagonalen. Die Diagonalelemente bleiben dabei unverändert. Die Anwendungen der Determinantenrechnung auf lineare Gleichungssysteme werden im nachfolgenden Satz beschrieben. Er enthält die bereits bekannten Versionen für n = 2 als Spezialfall. Satz 1.9 Sei n ∈ IN, n > 1 und A eine (n, n)-Matrix. Genau dann ist A regulär, wenn det(A) 6= 0 ist. In b) - d) wird A als regulär vorausgesetzt. a) det(AT ) = det(A). b) det(A−1 ) = (det(A))−1 c) A−1 = 1 T det(A) (Ai,j ) , A−1 · A = En d) Es gilt die Cramersche Regel: Sei ein Spaltenvektor ~b in IRn gegeben. Bezeichne Zj die (n, n)Matrix mit ~b als j-te Spalte und sonst mit den Spalten von A. Dann ist die Lösung ~x des LGS A~x = ~b gegeben durch xj = det(Zj ) det(A) j = 1, . . . , n Begründung zu a) Dies folgt aus den gleich lautenden Regeln für Zeilen- und Spaltenumformungen und der Eindeutigkeit der Determinante. zu b) Die Behauptung folgt leicht aus dem Multiplikationssatz: 1 = det(En ) = det(A · A−1 ) = det(A) · det(A−1 ) , indem diese Gleichung durch det(A) dividiert wird. zu c) Bezeichne 1 X= (Ai,j )T det(A) C =A·X Dann gilt für i, k = 1, . . . , n: ci,k ai,1 Ak,1 + · · · + ai,n Ak,n = = det(A) 1 , falls i = k 0 sonst 1.4. DETERMINANTEN 21 Für i = k folgt dies durch Entwicklung der Determinante von A nach der i-ten Zeile. Im Fall i 6= k kann die k-te Zeile von A ersetzt werden durch die i-te Zeile, ohne dass sich die algebraischen Komplemente Ak,1 , . . . , Ak,n ändern. Folglich ist der Zähler von ci,k gleich der Determinante einer Matrix mit gleicher i-ter und k-ter Zeile, also = 0. Damit ist A · X = En gezeigt und durch Entwicklung nach Spalten folgt analog X · A = En . Zu d) Die Formel für die Lösung folgt aus c) und der Gleichung ~x = A−1 · ~b. Beispiel 6. Gegeben seien 2 −1 2 0 ~b = 3 , 3 A= 0 1 0 0 −1 −4 gesucht ist die inverse Matrix A−1 und es ist die Lösung ~x des LGS A~x = ~b mit der Cramerschen Regel zu berechnen. Da A eine (rechte obere) Dreiecksmatrix ist, folgt det(A) = −2. Berechnung von A−1 mit den algebraischen Komplementen: −1 −1 −5 A1,1 = −1 A1,2 = 0 A1,3 = 0 1 0 −2 −6 A2,1 = −1 A2,2 = −2 A2,3 = 0 A−1 = −2 0 0 2 A3,1 = −5 A3,2 = −6 A3,3 = 2 Berechnung von x1 , x2 und x3 mit der Cramerrschen Regel: 0 −1 2 1 3 = (−3 + 12) + 2 · 4 = 17 det(Z1 ) = det 3 −4 0 −1 2 0 2 3 = 2(−3 + 12) = 18 det(Z2 ) = det 0 3 0 −4 −1 2 −1 0 3 = −8 det(Z3 ) = 0 1 0 0 −4 17 −8, 5 1 18 = −9 ~x = −2 −8 4 22 KAPITEL 1. LINEARE GLEICHUNGSSYSTEME UND DETERMINANTEN Kapitel 2 Vektorrechnung im dreidimensionalen Raum Bisher wurden nur die einfacheren Rechenoperationen mit Vektoren behandelt. Dieses Kapitel vollendet die Vektorrechnung, indem die beiden Multiplikationen von Vektoren behandelt werden, nämlich das Skalarprodukt (oder Punkt-Produkt genannt) und das Vektorprodukt. 2.1 Das Skalarprodukt In diesem Abschnitt wird gezeigt, wie man Winkel und Abstände im Raum berechnet. Eine nützliche Hilfe hierbei sind die Begriffe in der Definition 2.1 Für beliebige Vektoren v1 ~v = v2 v3 u1 ~u = u2 u3 heißt die reelle Zahl ~u · ~v = u1 v1 + u2 v2 + u3 v3 das Skalrprodukt von ~u und ~v . Falls ~u · ~v = 0 ist, heißen ~u und ~v zueinander orthogonal (”senkrecht stehend”). Dies wird durch die Schreibweise ~u ⊥ ~v zum Ausdruck gebracht. Beispiel: 2 3 −1 · 5 = 2 · 3 + (−1) · 5 + 2 · (−1) = 6 − 5 − 2 = −1 −1 2 Satz 2.1 (Rechenregeln für das Skalarprodukt). Für alle t ∈ IR und beliebige Vektoren ~u, ~v und w ~ gilt a) |~u|2 = ~u · ~u b) ~u · ~v = ~v · ~u c) (t~u) · ~v = t(~u · ~v ) 23 24 KAPITEL 2. VEKTORRECHNUNG IM DREIDIMENSIONALEN RAUM d) (~u + w) ~ · ~v = ~u · ~v + w ~ · ~v Der nachfolgende Satz gibt eine anschauliche Vorstellung von der Orthogonalität. Satz 2.2 Seien A und B Punkte mit A 6= O und B 6= O. Dann gilt für den Winkel bei O −→ −−→ ∠(A, O, B) = 90◦ ⇐⇒ OA ⊥ OB −→ −−→ −→ Begründung: Es kann |OA| = 1 und |OB| = 1 angenommen werden. Bezeichne ~a = OA und − − → ~b = OB. Nun gilt −−→ |AB|2 = |~b − ~a|2 = (~b − ~a) · (~b − ~a) = |~b|2 − ~a · ~b − ~b · ~a + |~a|2 −−→ |AB|2 = 2 − 2~a · ~b Sei zunächst vorausgesetzt, dass das Dreieck 4AOB bei O rechtwinklig ist. Aus dem Satz von Pythagoras folgt dann −−→ |AB|2 = |~a|2 + |~b|2 = 1 + 1 = 2 , nach obiger Gleichung muss daher ~a · ~b = 0 sein, d. h. ~a ⊥ ~b. √ −−→ Sei umgekehrt ~a · ~b = 0 vorausgesetzt. Nach der obigen Gleichung ist nun |AB| = 2. Sei C −−→ irgendein Punkt mit |OC| = 1 und ∠(A, O, C) = 90◦ . Die beiden Dreiecke 4AOB und 4AOC stimmen in den Längen ihrer Seiten überein, also auch in ihren Winkeln. Insbesondere gilt ∠(A, O, B) = ∠(A, O, C) = 90◦ . Definition 2.2 (Winkelfunktionen). Für jeden Winkel α zwischen 0◦ und 360◦ bezeichne Pα = (xα , yα ) den Punkt in der x-y-Ebene, den man durch Drehung des Punktes (1; 0) im Gegenuhrzeigersinn mit Winkel α um den Punkt O = (0; 0) erhält. Dann sei sei definiert cos(α) = xα sin(α) = yα . Beispiele P90◦ = (0; 1) P180◦ = (−1; 0) P270◦ = (0; −1) 1√ 1√ 2, 2) P45◦ = ( 2 2 cos(90◦ ) = 0 sin(90◦ ) = 1 ◦ cos(180 ) = −1 sin(180◦ ) = 0 cos(270◦ ) = 0 sin(270◦ ) = −1 1√ 1√ cos(45◦ ) = 2 sin(45◦ ) = 2 2 2 Einige Eigenschaften der Funktionen cos und sin sind in der Bemerkung 1 zusammmengefasst. Für spitze Winkel (also zwischen 0◦ und 90◦ ) ist in b) eine gleichwertige Definition vorgestellt. Dabei bedeutet die Hypotenuse die dem rechten Winkel gegenüberliegende Seite, die Ankathete die am Winkel α anliegende und die Gegenkathete die dem Winkel α gegenüber liegende Seite. Bemerkung 2.1 a) Für alle Winkel α gilt cos2 (α) + sin2 (α) = 1 Der Exponent 2 am Funktionsnamen bedeutet, dass der Funktionswert zu quadrieren ist, d. h. beispielsweise cos2 (α) = (cos(α))2 . Durch diese Notation werden Klammern eingespart und dadurch die Lesbarkeit verbessert. 2.1. DAS SKALARPRODUKT 25 b) Sei das 4ABC rechtwinklig bei B und bezeichne α den Winkel bei A, d. h. α = ∠(B, A, C). Dann gilt −−→ −−→ |AB| Ankathete Gegenkathete |BC| cos(α) = −→ = sin(α) = −→ = Hypotenuse Hypotenuse |AC| |AC| c) Für α zwischen 0◦ und 180◦ gilt cos(180◦ − α) = − cos(α) sin(180◦ − α) = sin(α) Begründung: Zu a) Bei jeder Drehung um O bleibt der Abstand von O erhalten. Daher ist der Abstand des Punktes Pα von O gleich 1. Zu b) Das 4ABC sei auf folgende Weise in das Koordinatensystem eingefügt: A = O, B = (b; 0) auf der x-Achse mit b > 0 und C = (c1 ; c2 ) mit c2 > 0. Bezeichne Q = (xα ; 0) den Punkt unter Pα auf der x-Achse. Die beiden Gleichungen folgen aus den Strahlensätzen der Geometrie: Die beiden von O ausgehenden Strahlen OB und OC werden von den Parallelen QPα und BC geschnitten. Daher gelten die folgenden Gleichungen für Verhältnisse von Abschnitten auf Strahlen und Parallelen: OB OC BC OC = = OQ OPα QPα OPα Wegen OPα = 1 folgt hieraus cos(α) = OQ = OB OC sin(α) = QPα = BC OC Zu c) Durch Spiegelung an der y-Achse geht der Punkt Pα in den Punkt P180◦ −α über. Die Gleichungen folgen daher direkt aus der Definition. Folgerung 2.1 cos(30◦ ) = 1√ 3 2 sin(30◦ ) = 1 2 Begründung: Die Höhe eines gleichseitigen Dreiecks mit √ Seitenlänge 1 zerlegt dieses in zwei rechtwinklige Dreiecke mit den Seitenlängen 1, 1/2, und 3/2. Die Länge der Hypotenuse ist 1, also sind die Katheten gleich sin(30◦ ) und cos(30◦ ). Satz 2.3 (Orthogonale Projektion auf eine Gerade) Seien A, B und C drei verschiedene Punkte und g die Gerade durch A und B. Bezeichne −−→ −→ ~u = AB ~v = AC −−→ a) Es existiert genau ein Punkt F ∈ g mit F C ⊥ ~u. Er ist gegeben durch −→ AF = t~u mit t= ~u · ~v |~u|2 b) Für den Winkel α = ∠(B, A, C) = ∠(~u, ~v ) gilt ~u · ~v = |~u| |~v | cos(α) c) Der Punkt C hat den folgenden Abstand von der Geraden g s 2 ~u · ~v d = d(C, g) = |~v |2 − |~u| 26 KAPITEL 2. VEKTORRECHNUNG IM DREIDIMENSIONALEN RAUM Begründung: −→ −−→ Zu a) Der Punkt F mit AF = t~u liegt auf der Geraden g. Nach Wahl von t gilt auch F C ⊥ ~u: −−→ −→ −→ ~u · F C = ~u · (AC − AF ) = ~u · (~v − t~u) = ~u · ~v − t|~u|2 = 0 . −−→ Der Punkt F ist eindeutig bestimmt: Gelte HC ⊥ ~u für einen weiteren Punkt H ∈ g. Dann ist −−→ AH = s~u für ein s ∈ IR. Zu zeigen ist s = t und damit H = F . Es folgt w. o. −−→ ~u · ~v − t|~u|2 = 0 = ~u · HC = ~u · ~v − s|~u|2 ~u · ~v − t|~u|2 = ~u · ~v − s|~u|2 t=s −→ Zu b) Es kann |~u| = |~v | = 1 angenommen werden. Dann ist t = ~u · ~v und |AF | = |t|. Zu zeigen ist t = cos(α). Erster Fall t ≥ 0: F und B liegen ”rechts” von A und α ist Winkel im rechtwinkligen 4AF C. Aus Bemerkung 2.1b folgt −→ |t| |AF | = t. cos(α) = −→ = |~ v| |AC| Zweiter Fall t < 0: Nun liegt A zwischen F und B und ∠(F, A, C) = 180◦ − α. Aus Bemerkung 2.1c und Bemerkung 2.1b folgt cos(α) = t auch in diesem Fall: −→ |AF | |t| cos(α) = − cos(180◦ − α) = − −→ = − = −|t| = t |~v | |AC| wegen t < 0. −−→ Zu c) Der gesuchte Abstand ist definiert durch |F C|. Aus dem Satz von Pythagoras folgt mit der Definition von t s 2 q −→ 2 −→ 2 p 2 ~u · ~v 2 2 d = |AC| − |AF | = |~v | − (t|~u|) = |~v | − |~u| Folgerung 2.2 Für beliebige Vektoren ~u, ~v gilt ~u · ~v = |~u| |~v | cos(∠(~u, ~v ) Die jetzt bereitgestellten Hilsmittel gestatten die Berechnung von Abständen und Winkeln wie im nachfolgenden Beispiel beschrieben. Beispiel 1 Seien die Punkte A = (−2; −3; 0) B = (1; 1; 2) C = (0; 0; 4) gegeben. Man berechne: 1) den Winkel α = ∠(B, A, C) 2) Die Höhe hC des 4ABC zum Eckpunkt C 3) den Schnittpunkt F der Höhe aus 2) mit der Geraden AB 2.1. DAS SKALARPRODUKT 27 Berechnung des Winkels α 3 2 −−→ −→ ~u = AB = 4 ~v = AC = 3 2 4 6 + 12 + 8 26 ~u · ~v √ =√ = cos(α) = |~u| |~v | 29 9 + 16 + 4 4 + 9 + 16 ◦ α ≈ 26, 29 Berechnung der Höhe als Abstand des Punktes C von g = AB s 2 r ~ u · ~ v 262 hC = d = |~v |2 − = 29 − |~u| 29 r r 292 − 262 165 = = ≈ 2, 385 29 29 Berechnung von F . Nach der bisherigen Rechnung ist t= 26 ~u · ~v = |~u|2 29 Für den Ortsvektor von F folgt −2 3 −58 + 78 −−→ −→ −→ −→ 26 1 4 = −87 + 104 OF = OA + AF = OA + t~u = −3 + 29 29 0 2 52 20 1 17 = 29 52 Definition 2.3 a) Eine Ebene E ⊂ IR3 wird beschrieben durch eine Gleichung der Form a1 x + a2 y + a3 z = b . a1 Dabei ist b ∈ IR und der Vektor ~a = a2 6= ~0 gegeben. Genau dann ist (x; y; z) ∈ E, a3 wenn diese Gleichung erfüllt ist. −−→ b) Ein Vektor ~n heißt orthogonal zur Ebene E (Schreibweise ~n ⊥ E), wenn ~n ⊥ P Q ist für alle Punkte P , Q ∈ E. Satz 2.4 Sei E eine Ebene mit ~a und b wie in Definition 2.3. Dann gilt −−→ i) P ∈ E ⇐⇒ OP · ~a = b ii) ~a ⊥ E iii) ~n ⊥ E ⇐⇒ ~n = t~a für ein t ∈ IR −−→ −→ iv) Seien A, B, und C ∈ E nicht in einer Geraden. Bezeichne ~u = AB und ~v = AC. Dann gilt (a) ~n ⊥ E ⇐⇒ ~n ⊥ ~u und ~n ⊥ ~v 28 KAPITEL 2. VEKTORRECHNUNG IM DREIDIMENSIONALEN RAUM −→ (b) P ∈ E ⇐⇒ det(~u, ~v , AP ) = 0 Begründung: Die Aussage i) folgt direkt aus der Definition des Skalarproduktes. Zu ii) Seien P und Q ∈ E. Aus i) folgt dann −−→ −−→ −−→ −−→ −−→ ~a · P Q = ~a · (OQ − OP ) = ~a · OQ − ~a · OP = b − b = 0 , d. h. ~a ⊥ E. Zu iii) Sei ~n ⊥ E. Es wird gezeigt, dass ~n ein Vielfaches von ~a ist. Dies geschieht mit Hilfe von drei Punkten A, B und C wie in (iv). Existenz dieser drei Punkte: Falls a3 = 1 ist, kann A = (0; 0; b) B = (1; 0; b − a1 ) C = (0; 1; b − a2 ) gewählt werden und analog in den Fällen a1 = 1 und a2 = 1. −−→ −→ ~u = AB und ~v = AC sind linear unabhängig. Dies gilt auch für die drei Vektoren ~u, ~v und ~a: Sei r~u + s~v + t~a = ~0 . Zu zeigen ist r = s = t = 0. Zunächst folgt aus ~a ⊥ ~u und ~a ⊥ ~v durch skalare Multiplikation mit ~a: r~u · ~a + s~v · ~a + t|~a|2 = 0 t|~a|2 = 0 Wegen ~a 6= ~0 muss t = 0 sein, es folgt r~u + s~v = ~0 und r = s = 0. Es ist also det(~u, ~v , ~a) 6= 0. Mit der Auflösung eines LGS findet man r, s und t ∈ IR mit ~n = r~u + s~v + t~a . Zu zeigen ist w ~ = ~0 für w ~ = r~u + s~v . Dies folgt aus ~n ⊥ ~u und ~n ⊥ ~v mit der Rechnung |w| ~ 2=w ~ ·w ~ =w ~ · (~n − t~a) = 0 . Es sei zur Anwendung in der Begründung zu (iv) festgestellt, dass die gewünschte Darstellung allein aus der Orthogonalität von ~n zu ~u und ~v gefolgert wurde. Der Umkehrschluss zu (iii) ist trivial nach (ii). Zu iv) (a) Sei ~n ⊥ ~u und ~n ⊥ ~v vorausgesetzt. Wie am Ende der Begründung zu (iii) festgestellt, folgt ~n = t~a für ein t ∈ IR und hieraus ~n ⊥ E mit (ii). Für den Umkehrschluss von (a) ist nichts zu zeigen. −→ Zu iv) (b) Sei zunächst P ∈ E vorausgesetzt und det(~u, ~v , AP ) 6= 0 angenommen. Es existieren dannn r, s und t ∈ IR mit −→ ~a = r~u + s~v + tAP . Wegen P ∈ E und A ∈ E folgt der Widerspruch −→ |~a|2 = ~a · (r~u + s~v + tAP ) = 0 , −→ es muss daher det(~u, ~v , AP ) = 0 sein. −→ Sei nun umgekehrt det(~u, ~v , AP ) = 0 vorausgesetzt. Die drei Vektoren sind dann linear abhängig und da aber die beiden ersten linear unabhängig sind, gibt es s und t ∈ IR mit −→ AP = s~u + t~v −−→ −→ −→ −→ ~a · OP = ~a · (OA + AP ) = ~a · OA = b 2.1. DAS SKALARPRODUKT 29 wegen A ∈ E. Es ist also P ∈ E. Beispiel 2 Man stelle eine Gleichung auf für die Ebene durch die drei Punkte A=O B = (3; −1; 0) C = (0; 2; −1) Genau dann ist P = (x; y; z) ∈ E, wenn gilt −−→ −→ −→ det(AB, AC, AP ) = 0 3 0 x det −1 2 y = 0 0 −1 z (1 − 0)x + (0 + 3)y + (6 − 0)z = 0 Die Ergebnisse lauten: x + 3y + 6z = 0 1 ~a = 3 6 b = 0. Folgerung 2.3 Genau dann liegen die vier Punkte A, B, C und D in einer Ebene, wenn −−→ −→ −−→ det(AB, AC, AD) = 0 ist. Begründung: Falls A, B und C in einer Geraden liegen, sind die ersten beiden Spalten linear abhängig, andernfalls muss D in der Ebene durch A, B und C liegen. Satz 2.5 (orthogonale Projektion auf eine Ebene) Sei eine Ebene E und ein Punkt P gegeben. −→ −→ a) Es existiert genau ein Punkt R ∈ E mit RP ⊥ E. Mit d = |RP | gilt −→ d ≤ |AP | für alle A ∈ E Daher heißt d der Abstand des Punktes P von der Ebene E. −−→ b) Hat E die Gleichung ~n · OP − b = 0 und ist |~n| = 1, so folgt für den Abstand d aus a) −−→ −→ d = |~n · OP − b| = |~n · AP | für alle Punkte A ∈ E Ist |~n| = 1, so heißt die Gleichung n1 x + n2 y + n3 z − b = 0 eine Gleichung in Hessescher Normalform. Ihr Vorteil besteht darin, dass man durch Einsetzen eines beliebigen Punktes und Übergang zum Betrag seinen Abstand von der Ebene erhält. Begründung des Satzes: −→ −→ Zu a) Mit dem Ansatz RP = t~a wird dafür gesorgt, dass RP zu E orthogonal ist. Bei passender Wahl von t gilt zusätzlich R ∈ E: −−→ −−→ −→ −−→ b = OR · ~a = (OP − RP ) · ~a = (OP − t~a) · ~a −−→ b = OP · ~a − t|~a|2 −−→ OP · ~a − b t= |~a|2 30 KAPITEL 2. VEKTORRECHNUNG IM DREIDIMENSIONALEN RAUM −→ −→ Der Punkt R ist eindeutig bestimmt, denn wegen RP ⊥ E muss RP = t~a sein und die obige Rechnung zeigt, dass t eindeutig festgelegt ist durch die Forderung R ∈ E. −→ −→ Für alle A ∈ E gilt wegen AR ⊥ RP −→ −→ −→ −→ −→ −→ |AP |2 = |AR + RP |2 = |AR|2 + |RP |2 ≥ |RP |2 = d2 Zu b) In der Rechnung zu der Begründung von a) kann nun ~a = ~n gesetzt werden und es folgt aus |~n| = 1 −−→ −−→ −→ −→ t = OP · ~n − b = (OP − OA) · ~n = AP · ~n d = |t~n| = |t| und es folgen die gewünschten Gleichungen. Beispiel 3 Seien A, B und C wie in Beipiel 2 und S = (2; 1; 0). Man berechne die Höhe h der dreiseitigen Pyramide mit dem 4ABC als Grundfläche und S als Spitze. Für welchen Punkt R −→ der Grundfläche ist h = |RS|? Es kann ~n = ~a/|~a| gesetzt werden für ~a wie bereits berechnet: 1 1 √ √ 1 ~a = 3 |~a| = 1 + 9 + 36 = 46 ~n = √ 3 46 6 6 Division der Ebenengleichung durch |~a| ergibt die Hessesche Normalform: x + 3y + 6z − 0 √ =0 46 und durch Einsetzten von S folgt 5 1 h = d = √ |2 + 3 · 1| = √ ≈ 0, 737 46 46 −→ Berechnung von R: Es gilt RS = t~a und wegen b = 0 −→ 2 1 OS · ~a − b 1 −→ 1 5 1 · 3 = t= = 2 OS · ~a = |~a|2 |~a| 46 46 0 6 Mit Hilfe von t kann schließlich R berechnet werden: 2 1 92 − 5 87 −−→ −→ −→ 5 1 1 3 = 46 − 15 = 31 1 − OR = OS − RS = 46 46 46 0 6 −30 −30 2.2 Vektorprodukt und Spatprodukt Von dem bereits definierten Skalarprodukt zweier Vektoren ist das nun zu behandelnde Vektorprodukt zu unterscheiden. Wie der Name schon sagt, ist das Ergebnis ein Vektor. Er wird zunächst mit Hilfe eines Koordinatensystems definiert und später durch seine invarianten Eigenschaften beschrieben, d. h. durch Eigenschaften, die nicht auf ein bestimmtes Koordinatensystem Bezug nehmen. Dabei wird die ”Orientierung” bzw. der Drehsinn eines Koordinatensystems (s. u. b)) eine Rolle spielen. 2.2. VEKTORPRODUKT UND SPATPRODUKT Definition 2.4 a) Das Vektorprodukt der u1 ~u × ~v = ”det” u2 u3 31 Vektoren ~u, ~v ist definiert als der Vektor v1 ~e1 u2 v3 − u3 v2 v2 ~e2 = u3 v1 − u1 v3 v3 ~e3 u1 v2 − u2 v1 ~u × ~v ist eine Vektor! Zahlenbeispiel: 2 1 2−6 −4 −1 × 3 = 2 + 4 = 6 2 −2 6+1 7 Die ”Determinante” ist zu verstehen mit Hilfe der Entwicklung nach der dritten Spalte. Die eigentliche Definition bestreitet die Ergebnisspalte während die Determinante hier nur als ”Gedächtnisstütze” bemüht wurde. b) Das aus x-, y- und z-Achse bestehende rechtwinklige Koordinatensystem heißt rechtsdrehend, falls gilt: Von (0;0;1) aus gesehen verläuft die 90◦ -Drehung von der x- zur y-Achse (um die z-Achse) im Gegenuhrzeigersinn. Bemerkung 2.2 Genau dann ist ~u × ~v = ~0, wenn die Vektoren ~u und ~v linear abhängig sind. Begründung: Bei linearer Abhängigkeit ist die Determinate gleich 0, da die beiden Spalten ~u und ~v linear abhängig sind. Sei umgekehrt ~u × ~v = ~0 vorausgesetzt. Um nun ~v = t~u zu zeigen, kann ~u 6= ~0 angenommen werden. Für u1 6= 0 folgt dann leicht ~v = t~u für t = v1 /u1 . Analog kann in den Fällen u2 6= 0 und u3 6= 0 geschlossen werden. Satz 2.6 (Eigenschaften des Vektorprodukts). Das Koordinatensystem sei rechtsdrehend. Dann ist für gegebene Vektoren ~u und ~v der Produktvektor w ~ = ~u × ~v durch die drei folgenden Eigenschaften eindeutig bestimmt: (i) w ~ ⊥ ~u , w ~ ⊥ ~v (ii) |w| ~ = |~u| |~v | sin(∠(~u, ~v )) (iii) Die kürzere Drehung von ~u nach ~v erfolgt im Gegenuhrzeigersinn von der w-Richtung ~ aus gesehen. Insbesondere gilt ~v × ~u = −~u × ~v . Begründung: Die drei Eigenschaften legen den Vektor eindeutig fest. Es ist nur noch zu zeigen, daß (i)-(iii) für w = ~u × ~v erfüllt ist. Zu (i): Durch Entwicklung nach der dritten Spalte folgt 0 = det(~u, ~v , ~u) = w ~ · ~u . Analog folgt w ~ · ~v = 0. Zu (ii): Sind die Vektoren ~u und ~v linear abhängig, so sind nach Bemerkung 2.2 beide Seiten der Gleichung gleich 0. Seien sie nun linear unabhängig. Erster Fall ~u ⊥ ~v : 32 KAPITEL 2. VEKTORRECHNUNG IM DREIDIMENSIONALEN RAUM Bezeichne A die Matrix A = (~u, ~v , ~u × ~v ) . Da die Spalten von A paarweise orthogonal sind, folgt |~u|2 4 2 T T |~u × ~v | = det(A) = det(A ) det(A) = det(A A) = 0 0 0 |~v |2 0 0 . 0 |~u × ~v |2 Wegen der linearen Unabhängigkeit ist |~u × ~v | = 6 0. Mit Division durch |~u × ~v | folgt |~u × ~v |2 = |~u|2 |~v |2 = |~u|2 |~v |2 sin(90◦ ) Zweiter Fall ~u · ~v 6= 0: Es kann zusätzlich |~v | = 1 angenommen werden. Dann folgt aus Bemerkung 2.2 und dem ersten Fall wegen Orthogonalität der neuen Faktoren im Vekorprodukt |~u × ~v |2 = |(~u − (~u · ~v )~v ) × ~v |2 = |~u − (~u · ~v )~v |2 |~v |2 = |~u|2 − 2(~u · ~v )2 + (~u · ~v )2 = |~u|2 |~v |2 − (~u · ~v )2 Durch Ausklammern folgt schließlich |~u × ~v |2 = |~u|2 |~v |2 (1 − cos2 ∠(~u, ~v )) = |~u × ~v |2 sin2 ∠(~u, ~v ) Eine Anwendung des Vektorproduktes in der Mechanik beruht auf der Definition 2.5 (Drehmoment als Vektor). Bei festgehaltenem Punkt O greife im Punkt P eine ~ an. Das hierdurch erzeugte Drehmoment ist definert durch Kraft K −→ ~ ~ =− M OP × K , ~ ist zur Drehachse parallel und seine Richtung legt also als “Kraftarm”דKraft”. Der Vektor M den Drehsinn fest. Abweichend von den bisherigen Produkten ist das Spatprodukt eine reelle Zahl, die von drei Vektoren abhängt. Seine Definition lautet: Definition 2.6 Das Spatprodukt der (einschließlich Reihenfolge!) gegebenen drei Vektoren ~u, ~v , w ~ ist definiert durch [~u~v w] ~ = (~u × ~v ) · w ~ ∈ IR , also durch eine Kombination von Vektorprodukt und Skalarprodukt. Eine nützliche Symmetrie-Eigenschaft und verschiedene Anwendungen des Spatproduktes sind zusammengefasst in der Folgerung 2.4 a) [~u~v w] ~ = det(~u, ~v , w) ~ −−→ −−→ b) Sei AB = CD. Dann gilt für die Flächeninhalte −−→ −→ |2ABDC| = |AB × AC| |4ABC| = 1 −−→ −→ |AB × AC| 2 2.2. VEKTORPRODUKT UND SPATPRODUKT 33 c) Ein Parallelogramm mit den Seiten ~u und ~v werde mit einem dritten Vektor w ~ parallel verschoben. Dadurch entsteht eine räumliche Figur, die von sechs Parallelogrammen begrenzt wird. Sie wird bezeichnet als der von den drei Vektoren aufgespannte Parallelspat. Sein Volumen beträgt: V = |[~u~v w]| ~ d) Die dreiseitige Pyramide mit dem 4ABC als Grundfläche und Spitze im Punkt S hat das Volumen 1 −−→−→−→ V = |[AB AC AS]| 6 Begründung Zu a) Die Formel folgt durch Entwicklung der Determinante nach der dritten Spalte. Zu b) Die Höhe h des 4ABC zum Eckpunkt C kann mit der Länge der Seite AC und dem ~ AC) ~ berechnet werden: Winkel ∠(AB, −→ −−→ −→ h = |AC| sin(∠(AB, AC)) So folgt aus Satz 2.6(ii) für die Fläche des Dreiecks |4ABC| = −−→ −→ 1 −−→ 1 −−→ −→ 1 −−→ −→ |AB| h = |AB| |AC| sin(∠(AB, AC)) = |AB × AC| . 2 2 2 Damit ist auch die Formel für die Fläche des Parallelogramms gezeigt, denn sie ist doppelt so groß wie die Dreiecksfläche. Zu d) Das Volumen der Pyramide beträgt bekanntlich V = G · h/3. Dabei ist G = |4ABC| und die Höhe h ist genau der Abstand der Spitze S von der Ebene durch A, B und C. Als Normalvektor eignet sich −−→ −→ ~n = AB × AC . −→ Aus Satz 2.5b folgt also h = |AS · ~n|/|~n| und nach b) ist G = |~n|/2. Das Volumen errechnet sich nun wie folgt −→ −−→ −→ 1 1 1 −−→ −→ −→ 1 −−→ −→ −→ 1 Gh = |~n| |AS · (AB × AC)/|~n| = |(AB × AC) · AS| = |[AB AC AS]| 3 3 2 6 6 −−→ −→ −→ Zu c) Sei ~u = AB, ~v = AC und w ~ = AS. Das 4ABC werde durch den Punkt D zu einem Parallelogramm mit Diagonale BC ergänzt. Der Spat hat dann dasselbe Volumen wie der Zylinder mit Höhe h wie in der Begründung zu d) und dem Parallelogramm 2ABDC, also V = −−→ −→ −→ V = h |2ABDC| = h|~n| = |[AB AC AS]| = |[~u~v w]| ~ Folgerung 2.5 (Winkel zwischen Ebenen und Geraden) a) Sei der Vektor ~u 6= ~0 zur Geraden g parallel und der Vektor ~n 6= ~0 zur Ebene E orthogonal. Dann gilt für den Neigungswinkel α = ∠(g, E) im Intervall [0◦ , 90◦ ] sin(α) = |~u · ~n| . |~u |~n| b) Der von den Dreiecken 4ABC und 4ABD entlang der gemeinsamen Seite AB eingeschlossene Winkel β ist gegeben durch −−→ −→ −−→ −−→ β = ∠(AB × AC, AB × AD) 34 KAPITEL 2. VEKTORRECHNUNG IM DREIDIMENSIONALEN RAUM Begründung Zu a) Mit Hilfe einer Skizze ist leicht einzusehen, daß ∠(~u, ~n) = 90◦ − α ist. Zu b) Sei Q ein beliebiger Punkt auf der Seite AB. In der zu dieser Seite orthogonalen Ebene durch Q erscheinen die beiden Dreiecke als von Q ausgehende Strahlen. Sie schließen genau den gesuchten Winkel β ein. Die von einem Punkt R in dieser Ebene ausgehenden Lote auf die beiden Strahlen bilden mit diesen ein Viereck mit zwei rechten Winkeln. Daher ist der Innenwinkel β bei Q gleich einem Außenwinkel bei R. Eine Skizze zeigt, daß letzterer von den beiden Loten in den passenden Richtungen eingeschlossen wird. Beispiel. Eine dreiseitige Pyramide habe das 4ABC als Grundfläche und ihre Spitze im Punkt S: A=O B = (4; 0; 0) C = (2; 3; 0) S = (2; 1; 3) Zu berechnen ist a) der Winkel α der Seitenkante AS gegen die Grundfläche, b) der Winkel β, den das Seitendreieck 4ABS mit der Grundfläche einschließt, c) der Winkel γ zwischen den Seitendreiecken entlang AS. Zu a) Da alle drei Punkte A, B und C in der x-y-Ebene liegen, ist ~n = ~e3 ein Normalvektor der −→ Grundfläche. Nach a) in Folgerung 2.5 gilt also mit ~u = AS |~u · ~e3 | 3 0+0+3 =√ α ≈ 53, 3◦ =√ |~u| 4+1+9 14 −−→ −→ −−→ −→ Zu b) Nach b) in Folgerung 2.5 ist β = ∠(AB × AS, AB × AC). 4 2 0 −−→ −→ 0 × 3 = 0 = 12~e3 AB × AC = 0 0 12 4 2 0 0 −−→ −→ 0 × 1 = −12 = 4 −3 AB × AS = 0 3 4 1 0 0 1 1 β ≈ 71, 6◦ =√ β = ∠ 0 , −3 cos β = √ 9 + 1 10 1 1 sin(α) = −→ −−→ −→ Zu c) Nun ist AS die gemeinsame Seite. Nach b) in Folgerung 2.5 gilt also γ = ∠(AS × AB, AS × −→ AC). −9 2 −9 2 −→ −→ 1 × 3 = 6 = 6 AS × AC = 6−2 4 0 3 −9 0 0 + 18 − 4 14 cos γ = √ √ γ = ∠ 3 , 6 =√ γ ≈ 67, 43◦ 10 81 + 36 + 16 1330 4 −1 Satz 2.7 (Abstände und Lotpunkte von nicht parallelen Geraden). Seien die beiden Geraden g −−→ −−→ und h nicht parallel. Dann existieren eindeutig P ∈ g und Q ∈ h mit P Q ⊥ g und P Q ⊥ h. Die Vektorlänge −−→ d = d(g, h) = |P Q| 2.2. VEKTORPRODUKT UND SPATPRODUKT 35 heißt der Abstand der Geraden g und h. Für beliebige Punkte A ∈ g und C ∈ h erfüllt er die Bedingung −→ d ≤ |AC| . (2.1) −−→ −−→ Sind B ∈ g und Q ∈ h weitere Punkte mit ~u = AB 6= 0, ~v = CD 6= 0, so folgt −→ |[~u~v AC]| d= |~u × ~v | (2.2) Begründung: Bezeichne ~a = ~u × ~v . Es sind P ∈ g und Q ∈ h eindeutig bestimmt durch s, t ∈ IR −→ −−→ −−→ −−→ mit AP = s~u und QC = t~v . Die Bedingung P Q ⊥ g, h ist dann äquivalent zu P Q = r~a für ein r ∈ IR. So werden P und Q bestimmt durch das LGS −→ −→ −−→ −−→ AC = AP + P Q + QC = s~u + t~v + r~a . (2.3) Es hat genau eine Lösung (s, t, r) wegen det(~u, ~v , ~a) = |~u × ~v |2 > 0 . Aus (2.3) folgt durch skalare Multiplikation mit dem Vektor ~a −→ AC · ~a = s~u · ~a + t~v · ~a + r|~a|2 = r|~a|2 und hiermit die Formel (2.2): −→ −→ −→ |~a · AC| |[~u~v AC]| |AC · ~a| |~a| = = d = |r~a| = |~a|2 |~a| |~u × ~v | Aus ~a ⊥ ~u, ~a ⊥ ~v folgt r~a ⊥ (s~u + t~v ) und damit (2.1): −→ |AC|2 = |s~u + t~v |2 + |r~a|2 ≥ |r~a|2 = d2 Beispiel Die vier Punkte A = O = (0; 0; 0) , B = (1; 0; 0) , C = (0; 1; 0) , D = (1; 3; 1) legen die Gerade g durch A und B sowie die Gerade h durch C und D fest. Es sind P , Q und d zu berechnen. 1 −−→ 2 ~a = ~u × ~v = ~v = CD = 1 0 −→ − → 1 1 1 AC = d = √ |AC · ~a| = √ 5 5 0 1 −−→ 0 ~u = AB = 0 |~a| = √ 5 0 1 1 0 × 2 = −1 2 0 1 0 0 1 1 · −1 = √ 5 0 2 36 KAPITEL 2. VEKTORRECHNUNG IM DREIDIMENSIONALEN RAUM −→ Es ist r = AC · ~a/|~a|2 = −1/5. Die Unbekannten s und t können berechnet werden durch das LGS 0 0 0 −→ 1 1 s~u + t~v = AC − r~a = 1 + −1 = 4 5 5 0 2 2 s t 1 1 0 t = 2/5 s = −2/5 0 2 4/5 0 1 2/5 1 −0, 4 −−→ −→ −→ OP = OA + AP = s~u = −0, 4 0 = 0 0 0 0 1 −0, 4 −−→ −−→ OQ = OC − t~v = 1 − 0, 4 2 = 0, 2 0 1 −0, 4 Kapitel 3 Reelle Funktionen 3.1 Folgen und Reihen Definition 3.1 Eine reelle Zahlenfolge (an )n ist gegeben durch eine Vorschrift, die jeder natürlichen Zahl n eine reelle Zahl an zuordnet. Diese heißt das n-te Glied der Folge. Beispiele an = 1 : n n : n2 + 1 cn = n! = 1 · 2 · 3· . . . ·n : bn = 1 1 , a3 = , . . . 2 3 1 2 3 b1 = , b 2 = , b 3 = ,... 2 5 10 c1 = 1 , c2 = 2 , c3 = 6 , . . . a1 = 1 , a2 = Die Folge (cn )n wird oft definiert durch vollständige Induktion: Bemerkung 3.1 (Prinzip der vollständigen Induktion): Ist I eine Teilmenge der natürlichen Zahlen mit den beiden Eigenschaften • 1∈I • n∈I ⇒ n+1∈I , so gilt bereits I = IN. Bezeichnet nämlich I die Menge der natürlichen Zahlen n, für die cn durch die beiden Regeln: (i) c1 = 1 (ii) cn+1 = (n + 1)cn für alle n ∈ IN definiert ist, so erfüllt I die Voraussetzungen der Bemerkung 3.1, es ist also cn für alle n ∈ IN definiert. Auf diese Weise sei nun die Folge (dn )n definiert: d1 = 1 d2 = 0, 5 + 1 = 1, 5 1 1 dn + für n ∈ IN : 2 dn 1, 5 1 9+8 17 d3 = + = = = 1, 416̄ . . . 2 1, 5 12 12 dn+1 = 37 38 KAPITEL 3. REELLE FUNKTIONEN Mit Recht läßt sich einwenden, daß für die Definition von dn+1 ja die Bedingung dn 6= 0 vorauszusetzen ist. Eine korrekte Version der Regel (ii) könnte lauten: 1 1 , falls dn > 0 2 dn + dn dn+1 = 0 , falls dn ≤ 0 Die Bemerkung 3.1 kann auf die folgende Menge angewendet werden: I = {n ∈ IN | dn > 0} Es ist offenbar d1 > 0 und aus dn > 0 folgt mit der Regel (ii), daß dann auch dn+1 > 0 ist. Damit erfüllt I die beiden Voraussetzungen der Bemerkung und es folgt I = IN, d. h. dn > 0 für alle n ∈ IN. Bezeichnung ( Summenzeichen) Für die endliche Summe (n, m ∈ Z mit m ≤ n) am + am+1 + · · · + an sei abkürzend geschrieben: n X ai i=m Satz 3.1 Für n ∈ IN und q ∈ IR\{1} gilt die Summenformel für endliche geometrische Reihen 1 + q + q2 + · · · + qn = n X qi = i=0 q n+1 − 1 . q−1 Begründung: Die Formel wird mit vollständiger Induktion gezeigt. D. h. die Bemerkung 3.1 wird angewendet auf die Menge I aller natürlichen Zahlen n, für die diese Formel gültig ist (für alle q 6= 1). Zu zeigen ist also: • Die Formel gilt für n = 1 (Induktionsanfang) • Aus der Gültigkeit der Formel für n folgt die Gültigkeit für n + 1 (Induktionsschluss, hier Schluss von n auf n + 1) Induktionsanfang: q2 − 1 (q + 1)(q − 1) = =1+q q−1 q−1 Schluss von n auf n + 1: n+1 X qi = n X q i + q n+1 = i=0 n+1 i=0 = q q n+1 − 1 + q n+1 q−1 − 1 + q n+2 − q n+1 q n+2 − 1 q (n+1)+1 − 1 = = q−1 q−1 q−1 Ungleichungen zwischen reellen Zahlen Um Grenzwerte von reellen Zahlenfolgen behandeln zu können, sollten vorher Rechenregeln für Ungleichungen besprochen werden. Sie beruhen auf den beiden folgenden Eigenschaften (P1) und (P2) der Menge P aller positiven reellen Zahlen: (P1) Für jede reelle Zahl x trifft genau eine der folgenden Aussagen zu: x∈P oder x=0 oder −x∈P 3.1. FOLGEN UND REIHEN 39 (P2) a, b ∈ P a + b ∈ P und ab ∈ P =⇒ Definition 3.2 Für x, y ∈ IR bedeutet die Ungleichung x < y, dass y − x ∈ P ist. x ≤ y bedeutet x < y oder x = y. An Stelle von x < y bzw. x ≤ y kann auch y > x bzw. y ≥ x geschrieben werden. Folgerung 3.1 Für x, y, z ∈ IR gilt a) x < y und y < z =⇒ x<z b) Es trifft immer genau eine der folgenden Aussagen zu: y<z oder y=z oder y>z c) z ≤ y und y ≤ z =⇒ y=z Begründung: Zu a) Aus y − x ∈ P und z − y ∈ P folgt mit (P2) z − x = (z − y) + (y − x) ∈ P Zu b) Dies folgt aus (P1) mit x = z − y. Zu c) Die Annahme y 6= z führt auf einen Widerspruch zu b: Es müsste dann nämlich nach der Voraussetzung in c) zugleich z < y und y < z gelten. Definition. Für a ∈ IR bezeichne |a| den Betrag von a, d. h. |a| = a für a ≥ 0 und |a| = −a für a < 0. Es ist immer |a| ≥ 0 und |a| ist gleich dem Abstand der Zahlen a und 0 auf der Zahlengeraden. Es ist auch leicht zu sehen, dass | − a| = |a| und |a|2 = a2 für alle a ∈ IR gilt. Die wichtigsten Rechenregeln für Ungleichungen im Zusammenhang mit Rechenoperationen und dem Betrag sind zusammengestellt in der Folgerung 3.2 Seien x, y, u, v und r ∈ IR sowie n ∈ IN. Dann gilt (i) x<y =⇒ x+r <y+r (Addition einer reellen Zahl) (ii) x<y und u<v =⇒ x+u<y+v (Addition von Ungleichungen) (iii) x < y und r > 0 =⇒ rx < ry x < y und r < 0 =⇒ rx > ry (Multiplikation einer Ungleichung mit einer reellen Zahl 6= 0) (iv) 0 ≤ x < y und 0 ≤ u < v =⇒ xu < yv (Multiplikation von Ungleichungen zwischen reellen Zahlen ≥ 0) 40 KAPITEL 3. REELLE FUNKTIONEN (v) Für n ungerade oder x, y ≥ 0 gilt x<y xn < y n ⇐⇒ (vi) |x| < r ⇐⇒ −r < x < r (vii) |x + y| ≤ |x| + |y| Begründung: Zu (i): (y + r) − (x + r) = y + r − x − r = y − x ∈ P Zu (ii): (y + v) − (x + u) = (y − x) + (v − u) ∈ P nach (P2). Zu (iii): Für r > 0 gilt wegen r, y − x ∈ P und (P2) ry − rx = r(y − x) ∈ P und für r < 0 wegen −r, y − x ∈ P und (P2) rx − ry = −r(y − x) ∈ P Zu (iv): Es sind y, v ∈ P , also ist auch yv ∈ P . Für x = 0 oder u = 0 ist nichts mehr zu zeigen. Sei nun x > 0 und u > 0. Aus (iii) folgt nun mit r = u und r = y xu < yu < yv und schließlich die Behauptung xu < yv mit Folgerung 3.1a. Zu (v): Es genügt, den Schluss x<y =⇒ xn < y n zu zeigen. Dann gilt nämlich auch der Umkehrschlus: Sei xn < y n vorausgesetzt. Es ist x 6= y, sonst wäre xn = y n . Es ist auch x > y ausgeschlossen, sonst folgte xn > y n . Nach Folgerung 3.1a bleibt nur noch die Aussage x < y übrig. Sei nun x < y vorausgesetzt. Es wird xn < y n gezeigt, separat für die beiden Fälle n ungerade und x, y ≥ 0. Für x, y ≥ 0 folgt xn < y n aus (iv) durch vollständige Induktion: Für den Induktionsanfang n = 2 kann (iv) auf u = x und v = y und für den Schluss von n auf n + 1 kann (iv) auf u = xn und v = y n angewendet werden. Für n ungerade kann x < 0 angenommen werden, denn im Fall x ≥ 0 sind x und y ≥ 0. Wegen n ungerade ist auch xn < 0 und für y ≥ 0 ist die Behauptung xn < y n gezeigt: xn < 0 ≤ y n Für y < 0 kann auf folgende Weise geschlossen werden: Aus y < 0 folgt 0 < −y durch Addition von −y (mit r = −y in (i)) und aus x < y die Ungleichung −y < −x durch Addition von −x − y. Also gilt 0 < −y < −x und es folgt wegen −y ≥ 0 und −x ≥ 0 −y n = (−y)n < (−x)n = −xn xn < y n , 3.1. FOLGEN UND REIHEN 41 wobei die letzte Ungleichung durch Addition von xn + y n folgt. Zu (vi): Für jedes x ∈ IR gilt x ≤ |x|, denn im Fall x ≥ 0 ist x = |x| und im Fall x < 0 gilt sogar x < |x| wegen x < 0 < |x|. Sei |x| < r vorausgesetzt. Dann folgt x < r aus x ≤ |x| < r. Wegen | − x| = |x| gilt auch −x ≤ |x| < r. Mit r = −1 in (iii) folgt −r < x. Umgekehrt folgt aus −r < x < r: |x| = x < r im Fall x ≥ 0. Aus −r < x folgt im Fall x < 0, dass |x| = −x < r sein muss. Also gilt |x| < r in beiden Fällen. Zu (vii): Wegen |x + y| ≥ 0 und |x| + |y| ≥ 0 ist die Ungleichung in (vii) nach (v) mit n = 2 äquivalent zu den folgenden Ungleichungen (man beachte (x + y)2 = x2 + 2xy + y 2 ) |x + y|2 = (x + y)2 ≤ (|x| + |y|)2 x2 + 2xy + y 2 ≤ |x|2 + 2|x| |y| + |y|2 xy ≤ |xy| denn für x, y ∈ IR gilt |xy| = |x| |y| und |x|2 = x2 sowie |y|2 = y 2 . Da die Ungleichung xy ≤ |xy| erfüllt ist, gelten auch die beiden vorangehenden Ungleichungen. Eine wichtige Klasse von Folgen sind solche, die einen so genannten Grenzwert haben. Dies bedeutet anschaulich, dass sich die Glieder der Folge mit genügend großem Index alle “in der Nähe einer eindeutig bestimmten reellen Zahl” befinden. Diese soll Grenzwert der Folge heißen. Eine korrekte Definition lautet wie folgt Definition 3.3 (Grenzwert einer Folge). Eine reelle Zahl x heißt Grenzwert der Folge (an )n , falls zu jeder positiven reellen Zahl ε eine natürliche Zahl n0 existiert, für die gilt |an − x| < ε für alle n ∈ IN mit n ≥ n0 Schreibweisen: lim an = x n→∞ an −−−−→ x n→∞ Die Folge (an )n heißt konvergent, wenn ein Grenzwert existiert. Eine konvergente Folge heißt Nullfolge, wenn der Grenzwert gleich 0 ist. Bemerkung. Nach den Regeln (vi) und (ii) in Folgerung 3.2 ist die Bedingung |an − x| < ε äquivalent zu −ε < an − x < ε x − ε < an < x + ε , d. h. der Abschnitt der Folge ab Index n0 liegt ganz im Intervall von x − ε bis x + ε. Je nach Einführung der reellen Zahlen ist der nachfolgende Satz mehr oder weniger selbstverständlich. Bemerkung 3.2 (Satz von Archimedes) Zu jeder reellen Zahl x existiert eine natürliche Zahl n mit x < n. Bei der Bestimmung von Grenzwerten ist wohl die Anwendung von Rechenregeln (s. u.) die erste Wahl. Es sollten aber auch einfache Beispiele vorgestellt werden, die eine Bezugnahme auf die Definition erfordern. Folgerung 3.3 Die Folge (1/n)n der Stammbrüche ist eine Nullfolge. 42 KAPITEL 3. REELLE FUNKTIONEN Begründung: Zu ε > 0 sei gemäß Bemerkung 3.2 ein n0 ∈ IN gewählt mit n0 > 1/ε. Es folgt mit den Regeln (iii) und (i) von Folgerung 3.2 für alle n ∈ IN mit n ≥ n0 nε ≥ n0 ε > 1 1 |an − 0| = < ε n In speziellen Beispielen hilft die Betrachtung so genannter Teilfolgen bei der Untersuchung auf Konvergenz. Definition 3.4 (Teilfolgen) Es sei eine Folge (an )n von reellen Zahlen und eine Folge (nk )k von natürlichen Zahlen gegeben mit nk+1 > nk für alle k ∈ IN. Dann heißt die neue Folge (bk )k , welche definiert ist durch bk = ank , eine Teilfolge von (an )n . ¡ varepsilon Beispiele: nk = 2k : b1 = a2 , b2 = a4 , b3 = a6 , . . . nk = 2k − 1 : b1 = a1 , b2 = a3 , b3 = a5 , . . . Wichtige Eigenschaften von konvergenten Folgen sind im nachfolgenden Satz aufgezählt. Satz 3.2 Sei die Folge (an )n konvergent. Dann gilt a) Der Grenzwert von (an )n ist eindeutig bestimmt. b) Die Folge (an )n ist beschränkt, d. h. für eine reelle Zahl S > 0 gilt |an | < S für jedes n ∈ IN c) Für jede Teilfolge gilt lim ank = lim an n→∞ k→∞ Begründung: Zu a) Sei an −−−−→ x sowie an −−−−→ y und x 6= y angenommen. Dann ist ε = |x − y|/2 > 0 n→∞ n→∞ und es existiert nach Defintion der Grenzwerte ein n ∈ IN mit |an − x| < ε und |an − y| < ε . Mit Folgerung 3.2(vii) und (ii) folgt ein Widerspruch zu Folgerung 3.1b: 2ε = |x − y| = |(x − an ) + (an − y)| ≤ |x − an | + |an − y| < 2ε Zu b) Gemäß Definition des Grenzwertes sei n0 ∈ IN gewählt zu ε = 1. Ist dann x der Grenzwert und wird S ∈ IR so gewählt, dass S > |x| + 1 und S > |an | für alle n ∈ IN gilt mit 1 ≤ n ≤ n0 − 1, so folgt |an | < S für alle n ∈ IN: Für n < n0 gilt dies nämlich nach Wahl von S und für n ≥ n0 gilt nach Wahl von n0 |an | = |(an − x) + x| ≤ |an − x| + |x| < 1 + |x| < S . 3.1. FOLGEN UND REIHEN 43 Zu c) Sei an −−−−→ x und (nk )k wie in Definition 3.4. Insbesondere gilt dann offenbar nk ≥ k n→∞ für jedes k ∈ IN. Nun muss zu ε > 0 ein k0 ∈ IN gefunden werden mit |ank − x| < ε für k ∈ IN mit k ≥ k0 . Wegen an −−−−→ x existiert aber ein n0 ∈ IN mit |an − x| < ε für n ≥ n0 . n→∞ Es kann k0 = n0 gewählt werden, denn es gilt für k ≥ n0 : nk ≥ k ≥ n0 |ank − x| < ε Es gibt einfache Beispiele für nicht konvergente beschränkte Folgen: Folgerung 3.4 Die Folge (−1)n )n ist nicht konvergent. Begründung: Wäre sie nämlich konvergent, so müsste nach c) in Satz 3.3 jede Teilfolge denselben Grenzwert haben. Es gibt jedoch Teilfolgen mit Grenzwert 1 sowie mit Grenzwert -1: Bezeichnet an = (−1)n , so folgt a2k−1 = −1 −−−−→ −1 . a2k = 1 −−−−→ 1 k→∞ k→∞ Wie schon angedeutet, kann die Bestimmung von Grenzwerten in vielen Fällen mit Hilfe einfacher Regeln erfolgen und der mühsame Bezug auf die Defintion umgangen werden. Eine Zusammenfassung ist der Inhalt von Satz 3.3 (Rechenregeln für Grenzwerte) Seien (an )n und (bn )n konvergente Folgen und c ∈ IR. Bezeichnet a = limn→∞ an und b = limn→∞ bn und ist c ∈ IR, so gilt (i) can −−−−→ ca n→∞ (ii) an ± bn −−−−→ a ± b n→∞ (iii) an bn −−−−→ ab n→∞ Begründung: Zu (i): Es kann c 6= 0 angenommen werden. Zu ε > 0 sei n0 gewählt mit |an − a| < |ε/c| für n ≥ n0 . So folgt für n ≥ n0 : |can − ca| = |c| |an − a| < |c| |ε/c| = ε . Zu (ii): Sei n0 gewählt mit |an − a| < ε/2 und |bn − b| < ε/2 für alle n ≤ n0 . Nun folgt für n ≥ n0 ε ε |(an ± bn ) − (a ± b)| = |an − a ± (bb − b)| ≥ |an − a| + |bn − b| < + = ε . 2 2 Zu (iii): Es existiert S ∈ IR mit |an | < S und |bn | < S für alle n ∈ IN. Dann gilt auch |a| ≤ S und |b| ≤ S. Sei n0 so gewählt, dass für n ≥ n0 gilt |an − a| < ε 2S und |bn − b| < ε . 2S Es folgen für n ≥ n0 die Ungleichungen |an bn − ab| = |an bn − an b + an b − ab| ≤ |an | |bn − b| + |an − a| |b| ≤ S |bn − b| + |an − a| S ε ε < + =ε 2 2 44 KAPITEL 3. REELLE FUNKTIONEN Beispiele 1) 2 − n2 4n2 + 3n − 1/n Die Regel (iv) kann nicht auf den angegebenen Bruch angewendet werden, da da die Zähler- und Nennerfolgen nicht konvergent sind. Nach Kürzen durch eine Potenz von n kann diese Bedingung erfüllt werden. Bei der Wahl des Exponenten ist aber u. a. darauf zu achten, dass der Grenzwert des Nenners nicht gleich 0 ist. So folgt mit Kürzen durch n2 an = an = 4 2 n2 − 1 + n3 − n13 = 2( n1 )2 − 1 2 · 02 − 1 1 − − − − → 1 1 3 n→∞ 4 + 3 · 0 − 03 = − 4 4 + 3 · n − (n) Es sind dabei alle Regeln (i)-(iv) angewendet worden. 2) 1p 2 3n − 4n + 5 an = n √ √ √ Mit der Potenzregel xy = x y (auf x = 1/n2 und y = 3n2 − 4n + 5 angewendet) kann die Verwendung von Satz 3.4(v) ermöglicht werden für p = 1/2. 0,5 p p √ 4 5 an = (3n2 − 4n + 5)/n2 = 3 − 4/n + 5/n2 = 3 − + 2 −−−−→ (3−4·0+5·02 )0,5 = 3 n→∞ n n 3) an = p 1 + 1/n − p 1 − 1/n Die Regel (ii) ist unbrauchbar, denn es ist (an )n eine Differenz von Folgen, die nicht konvergent sind. In vielen solchen Fällen ist die neue Folge ebenfalls nicht konvergent. Dies trifft aber im vorliegenden Beispiel nicht zu. Eine erfolgreiche Umformung ist die “Erweiterung” mit der Summe der beiden Quadratwurzeln unter Beachtung der binomischen Formel (x − y)(x + y) = x2 − y 2 . So erhält an die Darstellung (n + n1 ) − (n − n1 ) q an = q =q n + n1 + n − n1 n+ 2 n 1 n + q . n− 1 n Man könnte den Bruch durch n kürzen, um zu erreichen, dass der Nenner konvergent wird mit einem Grenzwert 6= 0. Einfacher ist aber die Anwendung der Regel (vi). Denn der Nenner ist sicher größer als 1 für alle n ∈ IN und so gilt nach Folgerung 3.1(ii) 2 n für alle n ∈ IN. Aus Satz 3.3(vi) folgt schließlich an −−−−→ 0. 0 < an < n→∞ 4) Sei (dn )n die bereits induktiv definierte Folge: d1 = 1 und dn+1 = 0, 5dn + 1/dn (3.1) für n ∈ IN. Es kann gezeigt werden, dass diese Folge konvergent ist gegen einen Grenzwert x > 0. Einfacher ist jedoch die Berechnung von x: Aus (3.1) folgt mit Satz 3.3(i), (ii) und (iv) 1 = 0, 5x + 1/x limn→∞ dn 1 0, 5x = x √ x2 = 2 x= 2 x = lim dn+1 = 0, 5 lim dn + n→∞ n→∞ 3.1. FOLGEN UND REIHEN 45 Mit dieser Methode können auch höhere Wurzeln aus beliebigen positiven Zahlen mit vergleichsweise geringem Aufwand näherungsweise berechnet werden. Insbesondere liegt d3 schon erstaunlich √ nahe bei 2 und für das vierte Folgenglied gilt √ | 2 − d4 | < 2.2 · 10−6 Satz 3.4 (Ungleichung von Bernoulli) Für h ≥ −1 und n ∈ IN gilt (1 + h)n ≥ 1 + nh . Begründung durch vollständige Induktion: Der Induktionsanfang n = 1 ist trivial erfüllt. Schluss von n auf n + 1: Aus Satz ??(iii) mit r = 1 + h folgt (Für h = −1 ist nichts zu zeigen) (1 + h)n+1 = (1 + h)n (1 + h) ≥ (1 + nh)(1 + h) = 1 + nh + h + nh2 ≥ 1 + (n + 1)h Bezeichnung. Für a, b ∈ IR mit a ≤ b seien die folgenden Teilmengen von IR definiert (Intervalle): [a; b] = {x ∈ IR | a ≤ x ≤ b} [a; b[= {x ∈ IR | a ≤ x < b} und analog ]a; b[ sowie ]a; b]. Ein beachtlicher Fortschritt in der Sammlung konvergenter Folgen bringt die Folgerung 3.5 a) Für p ∈ [0; 1[ gilt √ npn −−−−→ 0. n→∞ b) Sei |q| < 1. Dann gilt für jedes x ∈ IR nx q n −−−−→ 0 n→∞ Insbesondere sind (q n )n und (n2 /2n )n Nullfolgen. Begründung zu a) h = 1/p − 1 > 0 erfüllt die Voraussetzung von Satz 3.5. Es gilt für alle n ∈ IN 1 = (1 + h)n ≥ 1 + nh pn Daher gilt nach Folgerung 3.1b 0< √ √ r √ n n 1 1 np ≤ < = −−−−→ 0 1 + nh nh h n n→∞ n Die Behauptung folgt aus Satz 3.3(vi). zu b) Es kann x > 0 angenommen werden. Dann werde a) angewendet auf p = |q|0,5/x . Dann ist pn = |q|0,5n/x und es folgt aus a) √ n n|q| 2x −−−−→ 0 n→∞ √ n 2x x n |n q | = n|q| 2x −−−−→ 02x = 0 n→∞ wegen x > 0. Leider kann auf die Folge (1/n)1/n der Satz 3.3(v) nicht angewendet werden, da x = limn→∞ 1/n gleich 0 ist und so die Voraussetzung x > 0 nicht erfüllt wird. Gleichwohl existiert der Grenzwert und er ist gleich 1: 46 KAPITEL 3. REELLE FUNKTIONEN Folgerung 3.6 √ n n −−−−→ 1 n→∞ Begründung: Es wird auf die Definition des Grenzwertes Bezug genommen. Sei ε > 0 gegeben. Für q = 1/(1 + ε) ist (nq n )n nach Folgerung 3.4b eine Nullfolge, also existiert n0 ∈ IN, so dass für n ∈ IN mit n ≥ n0 gilt n 1 <1 1+ε √ 1< nn<1+ε √ | n n − 1| < ε n In engem Zusammenhang mit Folgen steht der Begriff der unendlichen Reihe. Er gestattet in gewisser Weise eine Möglichkeit, Summen von unendlich vielen Summanden zu definieren. Es überrascht wohl nicht, dass hierfür der Grenzwert von Folgen einen Lösungsansatz bringt. Bezeichnung Werden die Folgenglieder an definiert für n ∈ Z mit n ≥ 0, so sei dies in der Notation (an )∞ n=0 zum Ausdruck gebracht. Definition 3.5 Es sei eine Folge (an )∞ n=0 gegeben. P a) Die zu der Folge (an )n gehörige Reihe n an ist definiert als die Folge ihrer Partialsummen sn . Diese sind definiert durch sn = n X n ∈ Z mit n ≥ 0 ai i=0 P b) Die Reihe n an heißt konvergent, falls die Folge (sn )n ihrer Partialsummen eine konvergente Folge ist. Dann wird als Reihenwert definiert ∞ X ai = lim sn = lim i=0 n→∞ n→∞ Ist (sn )n nicht konvergent, so heißt die Reihe P n n X ai i=0 an divergent. Es gibt viele Kriterien, die über Konvergenz und Divergenz einer Reihe entscheiden können. Man unterscheidet dabei • Notwendige Kriterien: Sie müssen erfüllt sein, wenn die Reihe konvergent ist. Der Umkehrschluss muss aber nicht gelten. • Hinreichende Kriterien: Ist das Kriterium erfüllt, so kann auf Konvergenz der Reihe geschlossen werden. Ein einfaches notwendiges Kriterium ist die Bemerkung 3.3 Für jede konvergente Reihe P n an ist die Folge (an )n eine Nullfolge. 3.1. FOLGEN UND REIHEN 47 Begründung: Aus der Regel (ii) in Satz 3.3 folgt an = sn − sn−1 −−−−→ n→∞ ∞ X ai − i=0 ∞ X ai = 0 . i=0 Wie später mit einem Beispiel gezeigt wird, ist dieses Kriterium nicht hinreichend: Es gibt Nullfolgen, für die die Reihe divergent ist. Zunächst wird eine wichtige Klasse von konvergenten Reihen vorgestellt, nämlich die konvergenten geometrischen Reihen: Satz 3.5 Für jedes q ∈ IR mit |q| < 1 gilt ∞ X qi = i=0 1 . 1−q Begründung: Die Folgerung 3.5b kann auf q und x = 0 angewendet werden. Also gilt nach Satz 3.1 sn = −1 1 q n+1 − 1 −−−−→ = . n→∞ q−1 q−1 1−q Der nachfolgende Satz bringt eine Verschärfung der Bemerkung 3.3 für abnehmende Folgen von Summanden und wird zeigen, dass sie kein hinreichendes Kriterium darstellt. P Satz 3.6 Sei n an konvergent und (an )n abnehmend, d. h. an+1 ≤ an für alle n ∈ IN. Dann ist (nan )n eine Nullfolge. Begründung: Alle an sind ≥ 0, da sonst die Reihe divergent wäre. Sei ε > 0. Es kann in zwei Schritten eine natürliche Zahl n1 gefunden werden mit nan < ε für n ≥ n1 . Wegen Konvergenz der Reihe existiert zunächst ein n0 ∈ IN mit ∞ X ai < i=n0 +1 ε . 2 Nach Bemerkung 3.3 gibt es hierzu ein n1 ∈ IN mit n1 > n0 und an < ε 2n0 für n ≥ n1 . Es kann nun für dieses n1 die verlangte Eigenschaft gezeigt werden. Dabei wird von der Voraussetzung Gebrauch gemacht, dass die Folge (an )n abnimmt. n X (n − n0 )an ≤ i=n0 +1 ai ≤ ∞ X i=n0 +1 0 ≤ nan = n0 an + (n − n0 )an < n0 an + ai < ε 2 ε ε ε < + =ε 2 2 2 Es lassen sich nun ganz leicht Nullfolgen angeben, deren Reihe divergiert. Folgerung 3.7 Die harmonische Reihe 1 n n P ist divergent. Begründung: Für an = 1/n gilt: (an )n ist abnehmend und (nan )n = (1)n ist keine Nullfolge. In den Anwendungen treten oft Reihen auf, bei denen die Reihenglieder regelmäßig das Vorzeichen wechseln. Sie sind durch die nachfolgende Definition ausgezeichnet. 48 Definition 3.6 Eine Reihe KAPITEL 3. REELLE FUNKTIONEN P n an heißt alternierend, falls für alle n ∈ IN gilt: an an+1 < 0 . Das wohl geläufigste hinreichende Kriterium für alternierende Reihen lautet: Satz 3.7 (Leibniz-Kriterium). Sei (|an |)n eine abnehmende Nullfolge und die Reihe nierend. Dann ist die Reihe konvergent. P n an alter-