Höhere Mathematik I für Ingenieure PD Dr. Swanhild Bernstein, TU Bergakdemie Freiberg, Wintersemester 2007/08 Inhaltsverzeichnis Kapitel 1. Komplexe Zahlen 1. Denition komplexer Zahlen 1.1. Wozu komplexe Zahlen? 1.2. Komplexe Zahlenebene 1.3. Grundrechenarten in C 1.4. Gleichheit 1.5. Konjugation und Betrag komplexer Zahlen 2. Darstellung in Polarkoordinaten 3. Potenzen und Wurzeln komplexer Zahlen 3.1. Multiplikation in Polarkoordinaten 3.2. Potenzen 3.3. Wurzeln 4. Losen quadratischer Gleichungen 5. Anwendungsbeispiel 7 7 7 8 9 10 10 12 13 13 14 15 19 23 Kapitel 2. Lineare Gleichungssysteme 1. Matrizen und Gleichungssysteme 1.1. Was ist eine Matrix? 1.2. Spezielle Matrizen 1.3. Addition, Subtraktion und Multiplikation mit einem Skalar 1.4. Matrizenmultiplikation 1.5. Lineare Gleichungssysteme und Matrizen 1.6. Gau-Algorithmus Gau-Algorithmus { Abfolge 1.7. Gau-Jordan-Algorithmus 1.8. Transponierte Matrix 1.9. Invertierbare Matrizen 2. Determinanten 2.1. 3 × 3-Matrizen 2.2. Rechenregeln fur Determinanten 2.3. Cramersche Regel 2.4. Ubersicht: Praktische Berechnung von Determinanten 2.4.1. Spezialfalle 2.4.2. Entwicklungssatz 25 25 25 26 28 29 31 35 37 41 44 45 54 55 57 61 64 64 64 Kapitel 3. Vektorraume 1. Allgemeine Vektorraume 2. Rang einer Matrix 67 67 75 3 4 INHALTSVERZEICHNIS 3. Lineare Optimierung { Simplex-Algorithmus 3.1. Simplex-Algorithmus 3.2. Beispiele 4. Der Vektorraum R3 4.1. Vektoren 4.2. Skalarprodukt 4.3. Vektorprodukt 4.4. Spatprodukt 5. Geraden und Ebenen 5.1. Parameterdarstellung einer Geraden 5.2. Abstand Punkt-Gerade 5.3. Parameterdarstellung einer Ebene 5.4. Parameterfreie Darstellung einer Ebene 78 82 87 102 102 104 107 111 115 115 116 118 119 Kapitel 4. Lineare Algebra 1. Der Vektorraum Rn 2. Lineare Abbildungen und Koordinatendarstellungen 2.1. Lineare Abbildungen und ihre Basisdarstellung 2.2. Basiswechsel 3. Eigenwerte und Eigenvektoren 3.1. Bestimmung von Eigenwerten 3.2. Algebraische Vielfachheit 3.3. Eigenvektoren, Eigenraume und geometrische Vielfachheit 3.4. Invarianten 3.5. Diagonalisierung 4. Positiv denite Matrizen 125 125 129 129 133 134 135 136 136 144 146 149 Kapitel 5. Zahlenfolgen, Grenzwerte und Zahlenreihen 1. Folgen 2. Grenzwertbestimmung 2.1. Rechenregeln 2.2. Grenzwertbestimmung durch Abschatzung 3. Zahlenreihen 3.1. Konvergenzkriterien 3.2. Absolute Konvergenz 3.3. Kriterien fur absolute Konvergenz 151 151 156 156 157 159 160 163 165 Kapitel 6. Stetigkeit und Dierentation von Funktionen einer Veranderlichen 1. Funktionengrenzwerte 1.1. Grenzwerte 1.2. Elementare Methoden der Grenzwertbestimmung 1.3. Stetigkeit 2. Dierentation 2.1. Denition der Ableitung 2.2. Geometrische Deutung der Ableitung: Tangentenanstieg 2.3. Analytische Deutung: lineare Approximation 169 169 169 170 171 175 175 175 175 INHALTSVERZEICHNIS 2.4. Totales Dierential 2.5. Anwendung: Fehlerrechnung 2.6. Dierentationsregeln 2.6.1. Polynome 2.6.2. Kreisfunktionen 2.6.3. Kettenregel 2.7. Hohere Ableitungen 2.8. Umkehrfunktionen 2.8.1. Grundlagen 2.8.2. Wurzelfunktionen 2.8.3. Arcussinus, Arcuscosinus, Arcustangens 2.8.4. Exponential- und Logarithmusfunktion 2.8.5. Allgemeine Exponential- und Logarithmenfunktionen. 3. Anwendung der Dierentialrechnung: Kurvendiskussion 3.1. Maxima und Minima einer Funktion 3.2. Mittelwertsatz 3.3. Hyperbelfunktionen und ihre Umkehrfunktionen 3.4. Kurvendiskussion 3.5. Kurvendiskussion eines Graphen 3.6. L'Hospitalsche Regel Kapitel 7. Integralrechnung im R1 1. Bestimmtes Integral 1.1. Denition des bestimmten Integral 1.2. Elementare Integrationsregeln 1.3. Dierentation und Integration 2. Integrationsregeln 2.1. Linearitat 2.2. Partielle Integration 2.3. Substitutionsmethode 2.4. Integration rationaler Funktionen 2.4.1. Partialbruchzerlegung 3. Uneigentliche Integrale 4. Anwendungen 4.1. Volumen von Rotationskorpern 4.2. Kurvenlange 4.3. Mantelache 5 176 176 177 178 179 179 180 182 182 184 185 188 190 191 191 193 195 197 199 201 205 205 205 208 208 210 210 210 211 213 214 219 221 221 223 223 KAPITEL 1 Komplexe Zahlen Lernziele dieses Abschnitts sind: (1) (2) (3) (4) (5) (6) Analytische und geometrische Darstellung komplexer Zahlen, Grundrechenarten fur komplexe Zahlen, Konjugation und Betrag komplexer Zahlen, Losung quadratischer Gleichungen in C, Formel von Moivre, Satz uber die Einheitswurzeln, Fundamentalsatz der Algebra und Identitatssatz (ohne Beweise). 1. Definition komplexer Zahlen 1.1. Wozu komplexe Zahlen? Als mathematische Begr undung fuhrt man gern an, dass man versucht fur die Gleichung x2 = −1, die in der Menge der reellen Zahlen keine Losung besitzt, Losungen zu nden. Historisch gesehen entsteht die Notwendigkeit komplexer Losungen interessanter Weise zunachst bei der Bestimmung von Losungen der kubischen Gleichung (Gleichung 3. Grades). Ein wesentlicher Vorteil besteht darin, dass man anstelle von Paaren von Elementen (x, y) ∈ R2 mit Zahlen x + iy ∈ C rechnen kann. Beispiel 1.1. In der x, y-Ebene bewege sich ein Punkt. Seine Koordinaten sind Funktionen der Zeit t : x = x(t) und y = y(t). Die Bewegung des Massenpunktes lasst sich dann uber die Ableitung beschreiben. Die Bedeutung von ~z0 (t) ergibt sich wie folgt: Der Vektor ~z(t + ∆t) − ~z(t) stellt die Verschiebung des Punktes z im Zeitintervall ∆t dar. Der Dierenzenquotient 1 (~z(t + ∆t) − ~z(t)) ∆t 7 8 1. KOMPLEXE ZAHLEN ist die mittlere Geschwindigkeit wahrend also die Ableitung ~z0 (t) = ∆t, x0 (t) y 0 (t) und der Grenzwert fur ∆t → 0, ! ist die Momentangeschwindigkeit von ~z(t) im Zeitpunkt t. Die zweite Ableitung von ~z(t) ist entsprechend ~z00 (t) = x00 (t) y 00 (t) ! Ihre Bewegungsbedeutung ist die Momentanbeschleunigung. Viel einfacher lasst sich alles mit komplexen Groen beschreiben, es ist z(t) = x(t) + iy(t) z 0 (t) = x0 (t) + iy 0 (t) z 00 (t) = x00 (t) + iy 00 (t) Koordinaten des Massenpunktes, Geschwindigkeit, Beschleunigung. Fur den Anwender ergibt sich der Sinn der komplexen Zahlen oft auch durch Moglichkeit einheitliche Schreibweisen fur physikalische Gesetze zu nden (siehe auch Beispiel 1.7). 1.2. Komplexe Zahlenebene. In der mit einem kartesischen (x, y)-Koordinatensystem versehenen Ebene stellen die Punkte der x-Achse die reellen Zahlen dar. Komplexe Zahlen ergeben sich nun dadurch, dass alle Punkte z = (x, y) als Zah- len\ aufgefasst werden und man schreibt " z = x + iy. Man nennt z komplexe Zahl mit dem Realteil Re z = x und dem Imaginarteil Im z = y. Man nennt die x-Achse reelle Achse und die y -Achse wird imagin are Achse genannt. Die Menge aller komplexen Zahlen wird mit C bezeichnet. C := {x + iy : x, y ∈ R}. Geometrisch lassen sich die komplexen Zahlen als Punkte bzw. Vektoren einer Ebene darstellen. Die Ebene, deren Punkte als komplexe Zahlen aufgefasst werden, heit komplexe Zahlenebene oder Gausche Zahlenebene. 1. DEFINITION KOMPLEXER ZAHLEN 9 iy z=(x,y) = x + iy (x,y) y ix π/2 π/2 x i(ix)=i2x=-x x x Komplexe bzw. Gaußsche Zahlenebene 1.3. Grundrechenarten in C. Die Summe und Dierenz komplexer Zahlen ist durch (x + iy) + (u + iv) := (x + u) + i(y + v) (x + iy) − (u + iv) := (x − u) + i(y − v). deniert. Die Zahl ix ∈ C entsteht aus x ∈ R ⊂ C durch eine positive Drehung (entgegen dem Uhrzeigersinn) um den Winkel π2 . Deniert man allgemein eine Multiplikation mit i als eine Drehung um den Winkel π2 , so ist i(ix) = −x und da man die Reihenfolge von Rotationen vertauschen kann ist, i(ix) = i2 x = −x bzw. i2 = −1. Deshalb wird das Produkt zweier komplexer Zahlen deniert als (x + iy)(u + iv) = x(u + iv) + iy(u + iv) = xu + ixv + iyu + iyiv = xu + i2 yu + i(xv + yu) = (xu − yv) + i(xv + yu). Bemerkung 1.1. Die Addition/Subtraktion/Multiplikation von komplexen Zah- len erfolgt formal wie fur reelle Zahlen; es ist nur zu beachten, dass i2 = −1 ist. Bei der Denition der Division benutzt man trickreich die binomische Formel: (u + iv)(u − iv) = u2 − (iv)2 = u2 + v 2 10 1. KOMPLEXE ZAHLEN und damit ist (x + iy) (x + iy)(u − iv) (xu + yv) + i(yu − xv) xu + yv yu − xv = = = 2 +i 2 . 2 2 2 (u + iv) (u + iv)(u − iv) u +v u +v u + v2 Bemerkung Beispiel 1.2. Durch Erweiterung mit u − iv wird der Nenner reell. 1.2. (8 + 2i)(7 + i) 56 − 2 + i(8 + 14) 54 22 8 + 2i = = = +i . 7−i (7 − i)(7 + i) 49 + 1 50 50 1.4. Gleichheit. Wir betrachten zwei komplexe Zahlen z1 = x + iy und z2 = u + iv, dann gilt ⇐⇒ x + iy = u + iv ⇐⇒ x − u = i(v − y) 2 ⇒ (x − u)(x − u) = (x − u) = i(v − y)i(v − y) = −(v − y)2 | {z } | {z } ≥0 ≤0 z1 = z2 und damit folgt (x − u)2 = (v − y)2 = 0, also x = u und y = v. Oensichtlich folgt umgekehrt aus x = u und y = v sofort z1 = z2 . Satz 1.1. Zwei komplexe Zahlen sind genau dann gleich, wenn ihr Real- und Imaginarteil ubereinstimmen. 1.5. Konjugation und Betrag komplexer Zahlen. 1.1. Die komplexe Zahl z = x−iy heit die zu z = x+iy konjugiert p 2 2 komplexe Zahl und |z| := x + y heit Betrag (oder auch Norm, Lange, Modul) Definition der komplexen Zahl z . Eigenschaften: (1) z = z, (2) z1 + z2 = z1 + z2 , (3) z1 · z2 = z1 · z2 , (4) Re z = 12 (z + z) , (5) Im z = 1 2i (z − z) , (6) z ∈ R ⇐⇒ z = z, √ (7) |z| = z · z bzw. z · z = x2 + y 2 , 1. DEFINITION KOMPLEXER ZAHLEN 11 (8) |z| ≥ 0 und |z| = 0 ⇐⇒ z = 0, (9) |z1 · z2 | = |z1 | · |z2 |, (10) |z1 + z2 | ≤ |z1 | + |z2 | (Dreiecksungleichung). Beweis: zu (3): Wir m ussen zeigen, dass die rechte und die linke Seite gleich sind. Es seien z1 = x + iy und z2 = u + iv beliebige komplexe Zahlen. Dann berechnen wir im ersten Schritt fur die linke Seite z1 · z2 = (x + iy)(u + iv), wenden die Regeln fur die Multiplikation an (Multiplikation wie bei reellen Zahlen, man beachte, dass i2 = −1 ist) und erhalten = (xu − yv) + i(yu + xv). Von dieser komplexen Zahl bilden wir nun die konjugiert komplexe Zahl (1) z1 · z2 = (xu − yv) − i(yu + xv). Nun berechnen wir die rechte Seite und benutzen als erstes die Vorschrift zum Bilden der konjugiert komplexen Zahl z1 · z2 = (x + iy) · (u + iv) = (x − iy)(u − iv), nun wiederum Ausmultiplizieren (2) = (xu − yv) − i(yu + xv). Aus (1) = (2) folgt die Behauptung, also z1 · z2 = z1 · z2 . # Beweis: zu (6): Es sei z = x + iy eine beliebige komplexe Zahl. Ist z eine reelle Zahl, so ist z = Re z = x und Im z = y = 0. Somit ist aber auch z = x − iy = x = z. Wir haben gezeigt, dass aus z ∈ R folgt z = z. Nehmen wir umgekehrt an, dass fur eine beliebe komplexe Zahl z gilt z = x + iy = z = x − iy. Dann impliziert dies, dass auch iy = −iy ⇐⇒ y = −y ist und damit muss y = 0 sein, das bedeutet aber, dass z = x = Re z ist und damit gilt z ∈ R. # Übungsaufgaben: Man beweise (1), (2), (4), (5), (7) und (9). Fur komplexe Zahlen gelten die binomischen Formeln: Fur beliebige komplexe Zahlen z1 , z2 gilt: (z1 + z2 )2 = z12 + 2z1 z2 + z22 , (z1 − z2 )2 = z12 − 2z1 z2 + z22 . 12 1. KOMPLEXE ZAHLEN Beweis: Es seien z1 = x + iy, z2 = u + iv zwei beliebige komplexe Zahlen. Dann gilt (z1 + z2 )2 = (x + iy + u + iv)2 = ((x + u) + i(y + v))2 Ausmultiplizieren = (x + u)2 + 2i(x + u)(y + v) − (y + v)2 da i2 = −1 = x2 + 2xu + u2 + 2i(xu + ixv + iyu − yv) + u2 + 2iuv − v 2 = {x2 + 2ixy − y 2 } + 2{xu + ixv + iuy − yv} + {u2 + 2iuv − v 2 } = (x + iy)2 + 2(x + iy)(u + iv) + (u + iv)2 = z12 + 2z1 z2 + z22 . Damit ist die erste Geleichung gezeigt. Die zweite Gleichung verbleibt als Übungsaufgabe. # 2. Darstellung in Polarkoordinaten Geht man in der komplexen Zahlenebene von den kartesischen Koordinaten (x, y), x, y ∈ R zu den Polarkoordinaten (r, ϕ), 0 ≤ r < ∞, 0 ≤ ϕ < 2π, u ber, so ist x = r cos ϕ und y = r sin ϕ, (3) d.h. die komplexe Zahl z = x + iy besitzt in Polarkoordinaten die Darstellung z = r(cos ϕ + i sin ϕ). Dabei heit r Betrag (Modul) und ϕ Argument (Phase) der komplexen Zahl z. Die Bezeichnung fur r ergibt sich aus |z| = √ p (r(cos ϕ + i sin ϕ))(r(cos ϕ − i sin ϕ)) q √ = r2 (cos2 ϕ + sin2 ϕ) = r2 = |r| = r, zz = da r als Radius immer groer oder gleich Null ist. Ist die komplexe Zahl in Polarkoordinaten gegeben, so folgt aus (3) automatisch die Darstellung in kartesischen Koordinaten. Die Umrechnung aus kartesischen in Polarkoordinaten ist etwas komplizierter. Als erstes ist p x2 + y 2 r= und damit x cos ϕ = p x2 + y 2 und sin ϕ = p y x2 + y 2 , y x bzw. tan ϕ = , fur z 6= 0. 3. POTENZEN UND WURZELN KOMPLEXER ZAHLEN 13 Zur Berechnung von ϕ muss man nun die Mehrdeutigkeit des Arcustangens berucksichtigen. y=tan x 2π y=Arctan x + 2π π y=Arctan x + π y=Arctan x Es ist ϕ= Arctan xy , π , 2 π + Arctan xy , 3π , 2 2π + Arctan xy , x > 0, x = 0, x < 0, x = 0, x > 0, y y y y y ≥ 0, > 0, beliebig, < 0, < 0, hierbei bezeichnet arctan den Zweig des Arcustangens mit Werten in − π2 , π 2 . y π/2<φ<π φ = Arctan(x/y)+ π 0<φ<π/2 φ = Arctan(x/y) x<0 y>0 x>0 y>0 x<0 y<0 x>0 y<0 x π<φ<3π/2 φ = Arctan(x/y)+ π 3π/2<φ<2π φ = Arctan(x/y)+ 2π 3. Potenzen und Wurzeln komplexer Zahlen Die Multiplikation/Division bzw. die Potenzen und Wurzeln komplexer Zahlen lassen sich besonders gunstig mit Hilfe der Darstellung in Polarkoordinaten berechnen. 3.1. Multiplikation in Polarkoordinaten. Es seien z1 = r1 (cos ϕ1 + i sin ϕ1 ) und z2 = r2 (cos ϕ2 + i sin ϕ2 ) zwei komplexe Zahlen in Polarkoordinatendarstellung, 14 1. KOMPLEXE ZAHLEN dann ist z1 · z2 = r1 (cos ϕ1 + i sin ϕ1 )r2 (cos ϕ2 + i sin ϕ2 ) = r1 r2 (cos ϕ1 cos ϕ2 − sin ϕ1 sin ϕ2 + i[cos ϕ1 sin ϕ2 + sin ϕ1 cos ϕ2 ]) = r1 r2 (cos(ϕ1 + ϕ2 ) + i sin(ϕ1 + ϕ2 )) Merkregel: Bei der Multiplikation komplexer Zahlen werden die Betrage multipliziert und die Argumente addiert. Analog ergibt sich fur z2 6= 0 : 1 z2 1 = = (cos ϕ2 − i sin ϕ2 ) 2 z2 |z2 | r2 Damit gilt fur die Division zweier komplexer Zahlen: z1 r1 = (cos(ϕ1 − ϕ2 ) + i sin(ϕ1 − ϕ2 )). z2 r2 3.2. Potenzen. Als Spezialfall der Multiplikation erhalt man f ur z = cos ϕ + i sin ϕ : z 2 = r2 (cos(2ϕ) + i sin(2ϕ)) und allgemein z n = rn (cos(nϕ) + i sin(nϕ)), n ∈ N. Weitere Spezialfalle ergeben sich fur r = 1 : Satz 1.2. Formel von Moivre: (cos ϕ + i sin ϕ)n = cos(nϕ) + i sin(nϕ), n ∈ N. und Formel von Euler: eiϕ = cos ϕ + i sin ϕ. Bemerkung: In der Funktionentheorie kann man nachweisen, dass eiϕ tatsachlich als 3. POTENZEN UND WURZELN KOMPLEXER ZAHLEN 15 Exponentialfunktion betrachtet werden kann. Insbesondere gelten die Rechenregeln fur die Exponentialfunktion, d.h. e−iϕ = ei(ϕ1 +ϕ2 ) = eiϕ1 · eiϕ2 , 1 . eiϕ Dies konnte man auch uber Additionstheoreme fur Sinus und Cosinus beweisen. Es gilt aber ganz allgemein fur eine beliebige komplexe Zahl z = x + iy : ez = ex+iy = ex · eiy und fur zwei beliebige komplexe Zahlen z1 = x1 + iy1 und z2 = x2 + iy2 : ez1 +z2 = ez1 · ez2 , e−z = 1 . ez 3.3. Wurzeln. Wie lost man eine Gleichung der Form z n = a? Wir betrachten zunachst den Fall a = 1 und bestimmen die n-ten Einheitswurzeln, also Losungen der Gleichung z n = 1. Hieraus folgt zunachst |z n | = |z|n = 1 ⇐⇒ |z| = 1. Somit hat z in Polarkoordinaten die Darstellung z = cos ϕ + i sin ϕ und damit ist z n = cos(nϕ) + i sin(nϕ) = 1 = cos 0 + i sin 0, da komplexe Zahlen genau dann gleich sind, wenn ihr Real- und imaginarteil uberstimmen, ist dies aquivalent zu cos(nϕ) = 1 und sin(nϕ) = 0 ⇐⇒ nϕ = 2kπ, ⇐⇒ ϕ = 2kπ , n k ∈ Z, k ∈ Z. Aufgrund der 2π -Periodizitat von Sinus- und Cosinusfunktion folgt: Satz 1.3. (Einheitswurzeln) Es gibt genau n verschiedene komplexe Zahlen z0 , z1 , . . . , zn−1 , die der Gleichung zn = 1 genugen, diese sind gegeben durch zk = ei 2kπ n , k = 0, 1, 2, . . . , n − 1. 16 1. KOMPLEXE ZAHLEN Beispiel 1.3. Die 5 komplexen Wurzeln der Gleichung z5 = 1 bilden in der Gauschen Zahlenebene eine Funfeck, dass den Punkt Eckpunkt hat. (1, 0) als iy = i Im z i z1 z2 α=72° z0 -1 1 x=Re z z3 z4 -i Die 5 komplexen Losungen sind zk = ei 2kπ 5 = cos 2kπ 2kπ + i sin , 5 5 k = 0, 1, 2, 3, 4. In Formeln erhalt man 2·0·π 5 2·1·π = cos 5 2·2·π = cos 5 2·3·π = cos 5 2·4·π = cos 5 z0 = cos z1 z2 z3 z4 2·0·π 5 2·1·π + i sin 5 2·2·π + i sin 5 2·3·π + i sin 5 2·4·π + i sin 5 + i sin = cos 0 + i sin 0 = 1, 2π 5 4π = cos 5 6π = cos 5 8π = cos 5 = cos 2π 5 4π + i sin 5 6π + i sin 5 8π + i sin 5 + i sin ≈ 0, 31 + 0, 95 i, ≈ −0, 81 + 0, 59 i, ≈ −0, 81 − 0, 59 i, ≈ 0, 31 − 0, 95 i. Wie man leicht sieht ergibt sich fur k = 5 z5 = cos 2·5·π 2·5·π + i sin = cos(2π) + i sin(2π) = 1 = z0 5 5 und es gibt folglich nur 5 voneinander verschiedene komplexe Losungen. Auerdem entspricht 2π5 einem Winkel von 72◦ . In analoger Weise gehen wir nun bei der allgemeinen Gleichung z n = a vor. Wir stellen beide komplexe Zahlen zunachst in Polarkoordinaten dar: z = r(cos ϕ + i sin ϕ) und a = R(cos Φ + i sin Φ). 3. POTENZEN UND WURZELN KOMPLEXER ZAHLEN 17 Damit geht die Gleichung z n = a uber in (Ausrechnen von z n und einsetzen in die Gl.) rn (cos(nϕ) + i sin(nϕ)) = R(cos Φ + i sin Φ). Wenn diese beiden komplexen Zahlen gleich sind, dann muss auch |z n | = |z|n = rn = |a| = R gelten und wir haben erhalten, dass gilt √ n r= R, da sowohl r als auch R nichtnegative reelle Zahlen sind. Weiterhin mussen Real- und Imaginarteil gleich sein, d.h. unter Berucksichtigung der Gleichheit der Betrage, dass die beiden folgenden Gleichungen erfullt sein mussen: ( cos(nϕ) = cos Φ sin(nϕ) = sin Φ ( ⇐⇒ cos(nϕ) − cos Φ = 0 . sin(nϕ) − sin Φ = 0 Unter Verwendung der Additionstheoreme ndet man, dass das aquivalent zu folgendem System ist: −2 sin 2 cos nϕ+Φ 2 nϕ+Φ 2 · sin · sin nϕ−Φ 2 nϕ−Φ 2 =0 = 0. Beide Gleichungen konnen gleichzeitig nur dann erfullt sein, wenn sin nϕ − Φ Φ + 2kπ nϕ − Φ = 0 ⇐⇒ = kπ ⇐⇒ ϕ = , 2 2 n k ∈ Z. Aufgrund der 2π -Periodizitat vom Sinus und Cosinus gibt es allerdings wiederum nur n voneinander verschiedene Losungen von z n = a : √ n zk = R Φ + 2kπ Φ + 2kπ cos + i sin , n n k = 0, 1, . . . , n − 1. bzw. zk = √ 2kπ √ Φ+2kπ Φ 2kπ n n R ei n = R ei n ei n = z0 · ei n , Beispiel k = 0, 1, 2, . . . , n − 1. 1.4. Man bestimme alle komplexen Losungen von z3 = Zunachst muss man a = und damit a=2 √ 2(1 + i). √ 2(1 + i) in die Form R (cos Φ + sin Φ) q √ 2 √ 2 √ R= 2 + 2 = 4=2 √ √ ! π 2 2 π +i = 2 sin + i cos , 2 2 4 4 bringen. Es ist 18 1. KOMPLEXE ZAHLEN also ist Φ = π4 z0 = √ 3 2 cos √ 3 z1 = 2 cos √ 3 z2 = 2 cos = 45◦ . Die drei voneinander verschiedenen L osungen lauten damit π 4 π 4 π 4 +2·0·π + i sin 3 +2·1·π + i sin 3 +2·2·π + i sin 3 π 4 π 4 π 4 √ +2·0·π π π 3 = 2 cos + i sin ≈ 1, 22 + 0, 33i, 3 12 12 √ +2·1·π 3π 3π 3 = 2 cos + i sin ≈ −0, 89 + 0, 89i, 3 4 4 √ +2·2·π 17π 17π 3 = 2 cos + i sin ≈ −0, 33 − 1, 22i. 3 12 12 iy = i Im z 3√2 i z1 3√ r= 2 ≈ 26 1, z0 α=π/12 = 15° -3√2 3√2 z2 x=Re z -3√2 i Es gibt ebenfalls n (in diesem Fall 3) voneinander verschiedene Lo√sungen, die ein regulares n-Eck bilden, nur hat der Umkreis jetzt den Radius R und das n-Eck ist um den Winkel Φn gedreht. n Beispiel 1.5. Man bestimme alle komplexen Losungen von (w − (1 + i))4 = −1. Wir substituieren zunachst z := w − (1 + i) und losen die Gleichung cos π + i sin π, d.h. R = 1 und Φ = π damit erh alt man z0 z1 z2 z3 π+2·0·π = cos 4 π+2·1·π = cos 4 π+2·2·π = cos 4 π+2·3·π = cos 4 π+2·0·π + i sin 4 π+2·1·π + i sin 4 π+2·2·π + i sin 4 π+2·3·π + i sin 4 z 4 = −1 = √ √ π π 2 2 = cos + i sin = +i , 4 4 2 √ 2 √ 3π 3π 2 2 = cos + i sin =− +i , 4 4 2 2 √ √ 5π 5π 2 2 = cos + i sin =− −i , 4 4 2 2 √ √ 7π 7π 2 2 = cos + i sin = −i . 4 4 2 2 4. LOSEN QUADRATISCHER GLEICHUNGEN und damit ist w0 = z0 + (1 + i) = 1 + w1 = z1 + (1 + i) = 1 − w2 = z2 + (1 + i) = 1 − w3 = z3 + (1 + i) = 1 + √ 2 2 √ 2 2 √ 2 2 √ 2 2 √ ! 2 1+ = 2 √ ! 2 1+ = 2 √ ! 2 1− = 2 √ ! 2 1− = 2 +i +i +i +i w1 19 √ √ 2+ 2 2+ 2 +i , 2 2 √ √ 2− 2 2+ 2 +i , 2 2 √ √ 2− 2 2− 2 +i , 2 2 √ √ 2+ 2 2− 2 +i . 2 2 w0 (w-(1+i))4=-1 i z0 z1 w2 w3 -1 1 z4=-1 z2 z3 -i √ Zusatzlich zu den (moglichen) Anderungen des Radius des Umkreises ( R) und der Drehung um Φn tritt hier eine Verschiebung des Umkreises um 1 + i auf. n 4. Lösen quadratischer Gleichungen Wir wollen die quadratische Gleichung z 2 + pz + q = 0, p, q ∈ C losen. Dazu benutzen wir zunachst die 1. binomische Formel, d.h. wir erganzen quadratisch: p 2 p2 p 2 p 2 z 2 + pz + q = z + − + q = 0 ⇐⇒ z + = − q. 2 4 2 4 Damit wir die Wurzeln bestimmen konnen schreiben wir die rechte Seite in Polarkoordinaten: p2 − q = R(cos Φ + i sin Φ) 4 20 1. KOMPLEXE ZAHLEN und erhalten als Losungen der quadratischen Gleichung: Φ+2kπ Φ p √ p √ Φ p √ zk+1 = − + R ei 2 = − + R e 2 +ikπ ⇐⇒ z1/2 = − ± R ei 2 . 2 2 2 Sind p und q reellwertig, so erhalten wir als Losung von z 2 + pz + q = 0, p, q ∈ R, ⇐⇒ p 2 p2 −q = 2 4 z+ im Falle p2 −q ≥0 4 zwei reellwertige Losungen (gegebenenfalls eine doppelte Nullstelle). Es ist p2 0≤ −q = 4 2 p2 p i·0 −q e = − q (cos 0 + i sin 0) 4 4 und wir erhalten die Losungen z1/2 r p =− ± 2 0 p2 p − q ei 2 = − ± 4 2 r p2 − q. 4 Ist dagegen p2 −q <0 4 so erhalten wir mit −1 = eiπ = cos π + i sin π zunachst die Darstellung p2 0> −q = 4 p2 q− 4 (−1) = p2 q− 4 eiπ und erhalten als Losungen z1/2 p =− ± 2 Damit haben wir erhalten r p2 π p q − ei 2 = − ± i 4 2 r q− p2 . 4 4. LOSEN QUADRATISCHER GLEICHUNGEN Satz 1.4. Die quadratische Gleichung z 2 + pz + q = 0, p, q ∈ C, hat zwei komplexwertige Losungen: z1/2 mit p √ Φ p √ iΦ Φ = − ± R e 2 = − ± R cos + i sin , 2 2 2 2 p2 − q = R(cos Φ + i sin Φ), 4 2 q reellwertig mit p4 − q ≥ 0 so besitzt die quadratische Glei2 reellwertige Losungen, sind p und q reellwertig mit p4 −q < 0, sind p und chung zwei sind die beiden Losungen konjugiert komplexe Zahlen. Beispiel 1.6. Man bestimme alle Losungen der quadratischen Gleichung 9 z 2 + (1 + i)z + (1 + i)2 = 0. 4 Losungsvariante 1: Anwendung der Losungsformel. Es ist p (1 + i) − =− 2 2 und p2 (1 + i)2 9 −q = − (1 + i)2 = −2(1 + i)2 = −2(1 + 2i + i2 ) = −4i 4 4 4 √ 3π 3π 3π 3π = 16 cos + i sin = 4 cos + i sin . 2 2 2 2 und damit ergeben sich die beiden Losungen: p √ Φ Φ (1 + i) √ 3π 3π =− + 4 cos + i sin z1 = − + R cos + i sin 2 2 2 2 4 4 ! √ √ ! √ ! √ (1 + i) 2 2 1+2 2 2 2−1 =− + i, =− +2 − +i 2 2 2 2 2 p √ Φ (1 + i) √ 3π Φ 3π z2 = − − R cos + i sin =− − 4 cos + i sin 2 2 2 2 4 4 ! √ √ ! √ ! √ (1 + i) 2 2 1−2 2 2 2+1 =− −2 − +i =− − i. 2 2 2 2 2 21 22 1. KOMPLEXE ZAHLEN Losungsvariante 2: Quadratisches Erganzen. 2 2 9 1+i 1+i 9 2 z + (1 + i)z + (1 + i) = z + − + (1 + i)2 = 0 4 2 2 4 1+i 2 3π 3π 2 ⇐⇒ (z + ) = −2(1 + i) = −4i = 4 cos + i sin 2 2 2 2 Nun werden die Wurzeln aus der rechten Seite bestimmt und man erhalt selbstverstandlich die gleiche Losung wie bei der Losungsvariante 1. Wir haben gesehen, dass die quadratische Gleichung im Bereich der komplexen Zahlen immer losbar ist. Es gilt aber noch mehr. Satz 1.5. (Fundamentalsatz der Algebra) Jedes Polynom p(z) vom Grad ≥ 1 hat in C eine Nullstelle. Folgerung: Jedes Polynom p(z) vom Grad n ≥ 1 lasst sich (uber C) in Linearfaktoren zerlegen: p(z) = an (z − z1 )(z − z2 ) · . . . · (z − zn ), wobei an eine beliebige aber feste komplexe Zahl ist und die zk , k = 1, 2, 3, . . . , n, nicht notwendig voneinander verschiedene Nullstellen von p(z) sind. Satz 1.6. (Identitätssatz) Stimmen zwei Polynome p(z) = n X j=0 aj z j und q(z) = n X bj z j j=0 (hochstens) n-ten Grades an (wenigstens) (n+1) Stellen uberein, so sind die Polynome gleich, d.h. aj = bj fur alle j . 5. ANWENDUNGSBEISPIEL 23 5. Anwendungsbeispiel Beispiel 1.7. Eine Standardanwendung der komplexen Zahlen in der Elektro- technik ist die Untersuchung von Wechselstromkreisen. Als einfaches Beispiel betrachten wir einen Wechselstromkreis mit Spule und Ohmschem Widerstand in Reihenschaltung. Dabei bezeichne R den Ohmschen Widerstand, L die Induktivitat und U (t) = U0 cos ωt, U0 > 0, die Spannung. Nach den Kirchhoschen Gesetzen genugt die Stromstarke I(t) der Dierentialgleichung L dI + R I = U. dt Der Trick besteht nun darin, Stromstarke und Spannung als komplexe Funktionen zu erweitern (bezeichnet mit I ∗ (t) bzw. U ∗ (t)), deren Realteile dann jeweils die eigentlichen physikalischen Groen darstellen. Man setzt also U ∗ (t) = U0 eiωt = U0 (cos(ωt) + i sin(ωt)) und I ∗ (t) = I0∗ eiωt , I0∗ ∈ C. Dies in die Dierentialgleichung eingesetzt, liefert L I0∗ i ω eiωt + R I0∗ eiωt = U0 eiωt . Hieraus erhalt man die Losung U0 R − iωL R − iωL = U0 = U0 2 R + iωL (R + iωL)(R − iωL) (R + ω 2 L2 ) U0 R − iωL U0 R ωL √ √ =√ =√ − i√ R2 + ω 2 L2 R2 + ω 2 L2 R 2 + ω 2 L2 R2 + ω 2 L2 R2 + ω 2 L2 I0∗ = In Polarkoordinaten hat man demgema I0∗ = I0 e−αt , U0 I0 = √ , R2 + ω 2 L2 tan α = ωL . R Mit der komplexen Stromstarke I ∗ (t) = I0 ei(ωt−α) folgt also fur die physikalische Stromstarke I(t) = Re I ∗ (t) = I0 cos(ωt − α), Die Groe √ R2 + ω 2 L2 , U0 I0 = √ , R2 + ω 2 L2 tan α = ωL . R also den Betrag des komplexen Widerstandes R = bezeichnet man auch als Wechselstromwiderstand (Impedanz). Man erhalt ihn, ebenso wie die Phasenverschiebung α aus der Darstellung von ∗ U∗ I∗ |R∗ | = = R +iωL, 24 R∗ 1. KOMPLEXE ZAHLEN in der Gauschen Zahlenebene ( Phasendiagramm): iy iωL |R*| α 0 R Phasendiagramm x KAPITEL 2 Lineare Gleichungssysteme Lernziele dieses Abschnitts sind: (1) Begrie: Matrix, Vektor = spezielle Matrix, transponierte Matrix, inverse Matrix (nur fur quadratische Matrizen erklart), Determinante, (2) Rechnen mit Matrizen: Addition, Subtraktion von Matrizen, Multiplikation mit Skalaren (reelle bzw. komplexe Zahlen), Matrizenmultiplikation, (3) Rechenregeln (man beachte, dass A · B6=B · A ist!), (4) Gau-Algorithmus, Gau-Jordan-Algorithmus, (5) Losbarkeitsentscheidung aus Trapezform\ ( Endzustand\ des " " Gau- bzw. Gau-Jordan-Algorithmus), (6) Berechnung der inversen Matrix mittels Gau-Jordan-Algorithmus, (7) Berechnung von Determinanten: Rechenregeln fur Determinanten, Entwicklungssatz, (8) Determinantenkriterium fur die Invertierbarkeit von (quadratischen) Matrizen, (9) Cramersche Regel zur Losung linearer Gleichungssysteme. 1. Matrizen und Gleichungssysteme 1.1. Was ist eine Matrix? Definition 2.1. Eine Matrix vom Typ m × n (oder eine m × n-Matrix) ist ein rechteckiges Zahlenschema mit m Zeilen und n Spalten: a11 a12 . . . a1n a21 a22 . . . a2n A= . .. .. .. . . am1 am2 . . . amn . Die Zahlen aij ∈ R heien Komponenten (oder Elemente) der Matrix A. Man schreibt abkurzend: n A = (aij )m i=1, j=1 = (aij )m×n . 25 26 2. LINEARE GLEICHUNGSSYSTEME Die m × 1-Matrizen (bzw. 1 × n-Matrizen) werden Spaltenmatrizen oder Spaltenvektoren (bzw. Zeilenmatrizen oder Zeilenvektoren) genannt, sie haben die Form a1 a2 ~s = . .. am bzw. ~z = a1 a2 . . . an . Die Matrix A = (aij )m×n besteht aus m Zeilenvektoren (mit je n Komponenten) ~zi := ai1 ai2 . . . ain 1 ≤ i ≤ m, , bzw. aus n Spaltenvektoren (mit je m Komponenten) a1j a2j ~sj := . , .. amj 1 ≤ j ≤ n. Je nachdem, ob wir die Zeilen oder die Spalten von A hervorheben wollen, schreiben wir ~z1 ~z2 A= . .. ~zm A = ~s1 ~s2 . . . ~sn (Zeilendarstellung bzw.) (Spaltendarstellung). Die Matrix, deren Komponenten alle gleich Null sind, heit Nullmatrix O. Definition 2.2. Zwei Matrizen A = (aij ) und B = (bij ) heien gleich (man schreibt dafur A = B ), wenn sie vom gleichen Typ m × n sind und fur ihre Komponenten gilt aij = bij fur alle 1 ≤ i ≤ m, 1 ≤ j ≤ n. 1.2. Spezielle Matrizen. Wir benotigen noch weitere spezielle Matrizen, wir kennen bereits die Nullmatrix O, deren Elemente alle Null sind und die Einheitsmatrix En . Die quadratische Matrix 1 0 ... 0 0 1 ... 0 .. . . . . . . . 0 0 ... 0 1 1. MATRIZEN UND GLEICHUNGSSYSTEME 27 auf deren Hauptdiagonale Einsen stehen und alle anderen Elemente Null sind heit Einheitsmatrix oder n × n-Einheitsmatrix wenn der Typ von Bedeutung ist und wird mit E bzw. En bezeichnet. Es sei A eine quadratische Matrix vom Typ n × n : a11 a12 . . . a1n a21 a22 . . . a2n A= . , . . . . . . . . an1 an2 . . . ann dann heit die Menge der Elemente {aii }ni=1 Hauptdiagonale von A und die Menge der Elemente {aj(n+1−j) }nj=1 Nebendiagonale von A. Die Matrix A ist eine obere Dreiecksmatrix, wenn von Null verschiedene Elemente nur auf bzw. uber der Hauptdiagonale stehen, d.h. aij = 0 fur i > j. Dagegen ist A eine untere Dreiecksmatix, wenn von Null verschiedene Elemente nur auf bzw. unterhalb der Hauptdiagonale stehen, d.h. aij = 0 fur i < j. Man kann noch starker unterteilen, indem man nicht nur von unterer/oberer Dreiecksmatrix sondern von rechter/linker unterer/oberer Dreiecksmatrix spricht. Eine Matrix, wo nur auf der Hauptdiagonale von Null verschiedene Elemente stehen, heit Diagonalmatrix.Graphisch kann man das wie folgt veranschaulichen: Ha Oberes up Dreieck td ia go na le Obere Dreiecksmatrix Ne be nd iag on ale Ha up td ia go na le Ha up td ia go na le Unteres Dreieck Untere Dreiecksmatrix Ha up td ia go n al e Diagonalmatrix Auch bei einer rechteckigen\ Matrix A vom Typ m × n wollen wir gelegentlich von " einer oberen Dreiecksmatrix sprechen, was bedeutet, dass alle Elemente aij = 0 fur i > j sind. 28 2. LINEARE GLEICHUNGSSYSTEME 1.3. Addition, Subtraktion und Multiplikation mit einem Skalar. 2.3. Fur Matrizen A = (aij ) und B = (bij ) gleichen Typs m × n und jede Zahl λ ∈ R ist die Summe A + B und das λ-fache von A Definition komponentenweise deniert: und λA = (λaij )m×n . Die Dierenz zweier Matrizen gleichen Typs ist deniert als A + B = (aij + bij )m×n A − B = A + (−1)B = (aij − bij )m×n . Hieraus folgen die Rechenregeln: Fur beliebige Matrizen A, B, C gleichen Typs m × n und beliebige reelle Zahlen λ, ν gilt: (1) A + B = B + A (Kommutativitat), (2) (A + B) + C = A + (B + C) (Assoziativitat), (3) A + O = A (Nullelement), (4) A + (−A) = O, (inverses Element der Addition), (5) (λµ)A = λ(µA), (6) 1 A = A (7) (λ + µ)A = λA + µA, (8) λ(A + B) = λA + λB. 1. MATRIZEN UND GLEICHUNGSSYSTEME 29 1.4. Matrizenmultiplikation. Definition 2.4. Das Produkt einer m × ~n-Matrix A = (aij )m×n ~z1 ~z2 = . .. ~zm (Zeilendarstellung) mit einer ~n × r-Matrix B = (bij )n×r = ~s1 ~s2 . . . ~sr ist deniert durch (Spaltendarstellung) ~z1~s1 ~z1~s2 . . . ~z1~sr ~z2~s1 ~z2~s2 . . . ~z2~sr , AB := . . . .. .. .. ~zm~s1 ~zm~s2 . . . ~zm~sr wobei das Produkt ~z~s eines Zeilenvektors ~z = α1 α2 . . . αn mit einem Spaltenvektor gleicher Lange β1 β2 ~s = . .. βn deniert ist durch: ~z~s = Beispiel α1 α2 β1 n β2 X αi βi . . . . αn . := α1 β1 + α2 β2 + . . . + αn βn = .. i=1 βn 2.1. Matrizenmultiplikation. Matrix A, vom Typ 3 × 3, 1. Zeile 2. Zeile 3. Zeile 1 2 3 2 1 2 4 21 1 1. Spalte 2. Spalte 3. Spalte 1 2 4 2 1 1 2 3 2 1 30 2. LINEARE GLEICHUNGSSYSTEME Matrix B vom Typ 3 × 2, 1 2 2 2 3 1 Dann ist A · B = C eine Matrix vom Typ 3 × 2 und wird wie folgt berechnet: 1 2 3 1 2 14 9 1·1+2·2+3·3 1·2+2·2+3·1 2 1 2 · 2 2 = 2 · 1 + 1 · 2 + 2 · 3 2 · 2 + 1 · 2 + 2 · 1 = 10 8 4 12 1 3 1 8 10 4 · 1 + 12 · 2 + 1 · 3 4 · 2 + 12 · 2 + 1 · 1 Man kann das ganze auch in einem Schema darstellen: den Typ der Matrix C sofort: B , A C hier sieht man 1 2 2 2 3 1 1 2 3 14 9 2 1 2 10 8 4 12 1 8 10 2.1. 1. Man beachte, dass das Produkt Zeile mal Spalte\ eine " Zahl ist. 2. Das Produkt AB zweier Matrizen ist nur dann erklart, wenn die Spaltenzahl von A gleich der Zeilenzahl von B ist. 3. Auf diese Weise stellt A~x = ~b tatsachlich das lineare Gleichungssystem (4)(siehe spater) dar. Bemerkung Fur die Multiplikation von Matrizen gelten die folgenden Rechenregeln: Fur beliebige m × n-Matrizen A, A1 , A2 , n × r-Matrizen B, B1 , B2 und r × s-Matrix C gilt: (1) (A1 + A2 )B = A1 B + A2 B, A(B1 + B2 ) = AB1 + AB2 , (Distributivgesetze), (2) α(AB) = (α A)B = A(α B), α ∈ R, (3) A(BC) = (AB)C, (Assoziativitat der Matrizenmultiplikation), (4) Em A = AEn = A. (5) Aber im Allgemeinen ist AB 6= BA. 1. MATRIZEN UND GLEICHUNGSSYSTEME Beispiel 31 2.2. Es sei 1 2 0 1 A= ! und 1 0 2 3 B= ! dann gilt A·B = 1 2 0 1 ! · 1 0 2 3 ! 5 6 2 3 = ! 1 2 2 7 6= ! = 1 0 2 3 ! · 1 2 0 1 ! = B ·A. 1.5. Lineare Gleichungssysteme und Matrizen. Definition 2.5. Ein lineares Gleichungssystem mit m linearen Gleichun- gen und n unbekannten x1 , x2 , . . . xn hat die Form a11 x1 + a12 x2 + . . . + a1n xn = b1 , a21 x1 + a22 x2 + . . . + a2n xn = b2 , ............... am1 x1 + am2 x2 + . . . + amn xn = bm , (4) mit den Koezienten aij ∈ R und den Absolutgliedern bi ∈ R. Hierfur schreibt man A~x = ~b mit der Koezientenmatrix A = (aij )m×n , dem unbekannten Spaltenvektor ~x und dem Spaltenvektor der rechten Seite ~b. Das lineare Gleichungssystem heit homogen, wenn ~b = O gilt, andernfalls heit es inhomogen. Beispiel 2.3. In einem Netzwerk mit bekannten Widerstanden Ri Ω, i = 1, 2, 3, 4, 5, gilt nach den bekannten Kirchhoschen Gesetzen fur die folgende Schaltung I2 R2 R4 I R3 R1 I1 I3 R5 I4 I5 I 32 2. LINEARE GLEICHUNGSSYSTEME Daraus ergibt sich das folgende lineare Gleichungssystem: I1 + I2 I2 − + I1 − I3 I3 I4 I4 − + I5 I5 −R1 I1 + R2 I2 + R3 I3 − R3 I3 + R4 I4 − R5 I5 = = = = = = I 0 0 I 0 0 mit der Koezientenmatrix A= 1 1 0 0 0 0 1 −1 −1 0 1 0 1 0 −1 0 0 0 1 1 −R1 R2 R3 0 0 0 0 −R3 R4 −R5 . Es zeigt sich, dass die 4. Gleichung redundant ist und deshalb weggelassen werden kann. Beispiel 2.4. Die Bewegung eines Massenpunktes P in einem kartesischen Koordinatensystem sei durch den Geschwindigkeitsvektor ẋ, ẏ, ż in Abhangigkeit von den Ortskoordinaten gegeben: ẋ(t) = 2x(t) + 3y(t) − z(t) ẏ(t) = x(t) + y(t) ż(t) = −3x(t) + 5y(t) + 7z(t). Diejenigen Punkte, in denen die Geschwindigkeit ẋ = v1 , ẏ = v2 , ż = v3 erreicht, wird errechnet aus 2 3 −1 x v1 1 1 0 y = v2 . −3 5 7 z v3 Definition 2.6. Ein Spaltenvektor chungssystems (4) bzw. von wenn fur xi = ci , i = 1, . . . , n, die dasselbe ist { A~c = ~b gilt. c1 c2 ~c = . .. cn heit Losung des Glei- A~x = ~b, m Gleichungen in (4) bzw. { was 1. MATRIZEN UND GLEICHUNGSSYSTEME 33 Haug wird eine Losung in der Form x1 = c1 , x2 = c2 , . . . , xn = cn angegeben. Handelt es sich um ein Gleichungssystem mit nur 2 oder 3 Unbekannten so schreibt man statt x1 , x2 , x3 auch oft x, y, z. Ein homogenes Gleichungssystem A~x = O besitzt stets mindestens eine Losung, namlich die triviale Losung bzw. Nulllosung x1 = x2 = . . . = xn = 0. Nicht jedes Gleichungssystem ist losbar. Im Allgemeinen treten folgende Falle auf: (1) Das Gleichungssystem besitzt keine Losung. Beispiel 2.5. −2x + y = 3, −4x + 2y = 2. Dies kann man sich dadurch veranschaulichen, dass man die beiden Gleichungen als Geradengleichungen interpretiert. Die Losung des Gleichungssystems sind dann der/die Schnittpunkt(e) der Geraden. Im vorliegenden Fall sind die beiden Geraden aber parallel und sie schneiden sich folglich nicht. Somit ist das Gleichungssystem nicht losbar. (2) Das Gleichungssystem besitzt genau eine Losung. Beispiel 2.6. x + 3y = 9, −2x + y = −4. Dies kann man sich dadurch veranschaulichen, dass man die beiden Gleichungen als Geradengleichungen interpretiert. Die Losung des Gleichungssystems sind dann der/die Schnittpunkt(e) der Geraden. Im vorliegenden Fall schneiden sich die Geraden in genau einem Punkt. Somit hat das Gleichungssystem die Losung x = 3 und y = 2. (3) Das Gleichungssystem besitzt unendlich viele Losungen. Beispiel 2.7. 4x − 2y = 6, −2x + y = −3. Dies kann man sich dadurch veranschaulichen, dass man die beiden Gleichungen als Geradengleichungen interpretiert. Die Losung des Gleichungssystems sind dann der/die Schnittpunkt(e) der Geraden. Im vorliegenden Fall sind die beiden Geraden aber identisch und damit ist jeder Punkt der Geraden Losung. Somit besitzt das Gleichungssystem unendlich viele Losungen . 34 2. LINEARE GLEICHUNGSSYSTEME Eine weitere Frage ist, ob es gunstige\ Darstellungen von Gleichungssystemen gibt. " Beispiel 2.8. Wie man leicht nachrechnet hat das Gleichungssystem x + 3y = 9, −2x + y = −4. die gleiche Losungsmenge wie das Gleichungssystem x + 3y = 9, y = 2. Dies fuhrt auf den Begri der Aquivalenz von linearen Gleichungssystemen: Definition 2.7. Zwei Gleichungssysteme und B~x = ~c heien aquivalent, wenn sie dieselbe Losungsmenge besitzen. A~x = ~b, Insbesondere ergeben die folgenden Umformungen eine aquivalentes Gleichungssystem: (1) Vertauschen zweier Gleichungen, (2) Multiplikation einer Gleichung mit einer Zahl α 6= 0, (3) Addition (bzw. Subtraktion) des Vielfachen einer Gleichung zu (bzw. von) einer anderen, da diese Umformungen mit Umformungen gleichen Typs ruckgangig gemacht werden konnen. Diese Umformungen werden ubersichtlicher, wenn sie an der sogenannten erweiterten Koezientenmatrix a11 a12 . . . a1n b1 a21 a22 . . . a2n b2 (A | ~b) := . .. .. .. .. . . . am1 am2 . . . amn bn ausgefuhrt werden. Man erweitert die Koezientenmatrix A um die Absolutglieder (rechte Seite) und trennt sie durch einen senkrechten Strich von der Koezientenmatrix. Die obigen Gleichungsumformungen entsprechen dann den elementaren Zeilenumformungen der erweiterten Koezientenmatrix (A | ~b) : (1) Vertauschen zweier Zeilen, (2) Multiplikation einer Zeile mit einer Zahl α 6= 0, (3) Addition (bzw. Subtraktion) des Vielfachen einer Zeile zu (bzw. von) einer anderen. Folglich gilt: 1. MATRIZEN UND GLEICHUNGSSYSTEME Satz 35 2.1. Entsteht (B | ~c) durch endlich viele elementare Zeilenumfor- mungen, dann sind A~x = ~b und B~x = ~c aquivalent. 1.6. Gauß-Algorithmus. Ziel des nach C. F. Gau benannten Gauschen Al- gorithmus ist es, die erweiterte Koezientenmatrix durch aquivalente Umformungen in eine obere Dreiecksmatrix zu uberfuhren. Es ist am einfachsten, den Algorithmus am Beispiel zu erlautern. Dazu betrachten wir das Gleichungssystem x1 + x2 + x3 = 2, 2x1 + 3x2 + x3 = 3 x1 − x2 − 2x3 = −6. Man hat 3 Moglichkeiten ein solches System in Schemaform\ zu losen: " 1. Gleichungsform x1 + x2 + x3 = 2 2x1 + 3x2 + x3 = 3 x1 − x2 − 2x3 = −6 1. Schritt: Wir vereinfachen unser Gleichungssystem dadurch, dass wir durch aquivalente Umformungen x1 aus der 2. und 3. Gleichung bzw. Zeile eliminieren. Wir be- halten die 1. Gleichung/Zeile bei und erzeugen neue 2. bzw. 3. Gleichungen/Zeilen. Die neue 2. Gleichung/Zeile entsteht durch Multiplikation der 1. Gleichung/Zeile mit (−2) und Addition des Ergebnisses zur 2. Gleichung/Zeile ((−2)erster Gleichung/Zeile + zweite Gleichung/Zeile = neue zweite Gleichung/Zeile). Analog verfahren wir mit der 3. Gleichung/Zeile indem wir die erste Gleichung/Zeile mit (−1) durchmultiplizieren und das Ergebnis zur 3. Gleichung/Zeile addieren: x1 + x2 + x3 = 2 x2 − x3 = −1 −2x2 − 3x3 = −8 2. Schritt: Wir vereinfachen unser Gleichungssystem weiter indem durch aquivalente Umformungen x2 aus der 3. Gleichung/Zeile eliminiert wird. Wir behalten die 1. Glei- chung/Zeile und die 2. Gleichung/Zeile bei und erzeugen eine neue 3. Gleichung/Zeile indem das 2-fache der 2. Gleichung/Zeile zur 3. Gleichung/Zeile addieren: 36 2. LINEARE GLEICHUNGSSYSTEME x1 + x2 + x3 = 2 x2 − x3 = −1 −5x3 = −10 Damit haben wir unser Gleichungssystem auf Dreiecksgestalt\ gebracht und konnen " daraus ablesen, dass x3 = 2 ist. Durch Ruckwartseinsetzen\ erhalten wir auch x1 und " x2 . Das konnen wir aber auch in diesem Schema machen indem wir nun r uckwarts\ " substituieren. 2. In Tabellenform sieht das wie folgt aus x1 |1| 2 1 1 0 0 1 0 0 x2 1 3 −1 1 |1| −2 1 1 0 x3 1 2 3 1 −2 −6 1 2 −1 −1 −3 −8 1 2 −1 −1 −5 −10 | · (−2) | · (−1) |·1 |·1 |·2 |·1 Man kann diese Tabelle noch weiter verkurzen: x1 |1| 2 1 0 0 0 x2 1 3 −1 |1| −2 0 x3 1 2 1 3 −2 −6 −1 −1 −3 −8 −5 −10 Die 3. Variante ist die Matrizenform: |1| 1 1 2 ∼ 1 1 1 2 1 1 1 2 ∼ 3 (−2) · ~z1 + ~z2 0 |1| −1 −1 3 1 2 0 1 −1 −1 2 · ~z2 + ~z3 1 −1 −2 −6 (−1) · ~z1 + ~z3 0 −2 −3 −8 0 0 −5 −10 Das Ergebnis kann weiter vereinfacht werden indem die 3. Gleichung/Zeile mit − 15 durchmultipliziert wird. 1. MATRIZEN UND GLEICHUNGSSYSTEME 37 Gauß-Algorithmus – Abfolge. Gau-Algorithmus (1) Man bringe, wenn notig, durch Zeilenvertauschen ein von Null verschiedenes Element an die Spitze der ersten Spalte (→ PivotElement) (2) Ist das Pivot-Element ungleich 1, so multipliziere man die Zeile 1 durch. pivot (3) Man erzeuge in der Spalte, in der sich das Pivot-Element befindet, unter diesem Nullen indem man geeignete Vielfache der in der sich das Pivot-Element befindet mit Zeile, die das Pivot-Element enthalt, zu allen anderen Zeilen addiert. (4) Man behalte die Zeile, die das Pivot-Element enthalt (und die Zeilen daruber) und wende die Schritte (1), (2) und (3) auf die Restmatrix an. Man kann nun das Ergebnis durch Ruckwartseinsetzen ausrechnen. Ausgangspunkt ist das als Dreiecksgestalt\ erhaltene Schema, x3 kennen wir. " In Gleichungsform geht man wie folgt vor: Wir behalten die 3. Gleichung/Zeile bei und eliminieren x3 aus der 2. Gleichung/Zeile und der 1. Gleichung/Zeile x3 . Dies geschieht indem man die 3. Gleichung/Zeile zur 2. Gleichung/Zeile addiert bzw. die 3. Gleichung/Zeile mit (−1) durchmultipliziert und das Ergebnis zur 1. Gleichung/Zeile addiert: x1 + x2 = 0 x2 = 1 x3 = 2 Nun behalten wir die 2. Gleichung/Zeile und die 3. Gleichung/Zeile bei und eliminieren aus der 1. Gleichung/Zeile x2 indem wir von der 1. Gleichung/Zeile die 2. Gleichung/Zeile abziehen: x1 = −1 x2 = 1 x3 = 2 38 2. LINEARE GLEICHUNGSSYSTEME Wir haben damit als Losung des Gleichungssystems x1 = −1, x2 = 1 und x3 = 2 erhalten. In Tabellenform sieht das wie folgt aus: x1 x2 1 1 0 1 0 0 1 1 0 1 0 0 1 1 0 |1| 0 0 1 0 0 1 0 0 x3 1 2 −1 −1 −5 −10 | ÷ (−5) 1 2 |·1 −1 −1 | · 1 |1| 2 |·1 ·(−1) 0 0 |·1 0 1 | · (−1) 1 2 0 −1 0 1 1 2 und in Matrixform 1 1 1 ∼ 1 1 0 0 1 0 0 −1 2 ∼ 0 1 −1 −1 1 · ~z3 + ~z2 0 |1| 0 1 0 1 0 1 (−1) · ~z2 + ~z1 0 0 |1| 2 (−1) · ~z3 + ~z1 0 0 1 2 0 0 1 2 Im nachsten Beispiel beantworten wir die Frage wie man am Gauschen Algorithmus sieht, dass das Gleichungssystem unlosbar ist. Beispiel 2.9. Wir betrachten des Gleichungssystem x1 − x2 + 2x3 2x1 − 2x2 + 5x3 x1 + 2x2 − x3 2x2 + 2x3 = 3 = 4 = −3 = 1 Wir formen zunachst aquivalent gema dem Gauschen Algorithmus um: Im ersten Schritt behalten wir die erste Zeile bei: 1 −1 2 3 2 −2 5 4 1 2 −1 −3 0 2 2 1 ≈ ~z2 + (−2)~z1 ~z3 + (−1)~z1 1 −1 2 3 0 0 1 −2 0 3 −3 −6 0 2 2 1 Jetzt vertauschen wir die 2. und die 3. Zeile und dividieren anschlieend die (neue) 2. Zeile durch 3 und behalten nun diese Zeile bei: ≈ ~z2 ↔ ~z3 1 −1 2 3 0 3 −3 −6 0 0 1 −2 0 2 2 1 ≈ 1 ~z 3 2 1 −1 2 3 0 1 −1 −2 0 0 1 −2 0 2 2 1 1. MATRIZEN UND GLEICHUNGSSYSTEME Im nachsten Schritt addieren wir halten die 3. Zeile bei: ≈ (−2)~z2 + ~z4 (−2)-fache 1 −1 2 3 0 1 −1 −2 0 0 1 −2 0 0 4 5 der 2. Zeile zur 4. Zeile und be- 39 ≈ (−4)~z3 + ~z4 3 1 −1 2 0 1 −1 −2 0 0 1 −2 0 0 0 13 Jetzt sieht man an der letzten Zeile, dass das Gleichungssystem nicht ist. Denn die letzte Zeile ausgeschrieben bedeutet nichts anderes als lösbar 0x1 + 0x2 + 0x3 = 13 was nie erfullt werden kann. Als nachstes betrachten wir das folgende homogene Gleichungssystem Beispiel 2.10. x1 + 2x2 − 5x3 = 0 −2x1 − 3x2 + 6x3 = 0 Hier sind die aquivalenten Umformungen zunachst sehr einfach, wir behalten die 1. Gleichung bei und addieren das 2-fache der ersten Gleichung zur 2. Gleichung, d.h. 1 2 −5 0 −2 −3 6 0 ! ≈ (−2)~z1 + ~z2 1 2 −5 0 0 1 −4 0 ! Wir fuhren zusatzlich einen Schritt der Ruckwartselimination aus: ≈ ~z1 + (−2)~z2 1 0 3 0 0 1 −4 0 ! Oensichtlich konnen wir nicht mehr eliminieren und oensichtlich gibt es min destens eine Losung, namlich die triviale Losung. Um uns einen Uberblick uber die Losungsmenge zu verschaen, schreiben wir die letzte Matrix wieder als Gleichungssystem auf: x1 x2 + 3x3 = 0 − 4x3 = 0 oder andres ausgedruckt, sowohl x1 als auch x2 konnen in Abhangigkeit von x3 dargestellt werden: x1 = −3x3 x2 = 4x3 . Setzt man nun x3 = r ∈ R, so sieht man, dass das Gleichungssystem unendlich viele L osungen besitzt: x1 = −3r, x2 = 4r, x3 = r, r ∈ R. 40 2. LINEARE GLEICHUNGSSYSTEME Oder anders geschrieben: −3 ~x = 4 r, 1 Definition r ∈ R. 2.8. Eine Matrix ist in Zeilenstufenform oder "Dreiecks- form\, wenn (1) Jede Zeile, die nur aus Nullen besteht, am unteren Ende der Matrix steht. (2) Das erste, von Null verschiedene Element einer Zeile, eine 1 ist. Dieses Element sei "fuhrende Eins\ genannt. (3) Die fuhrende Eins einer jeden Zeile nach der ersten Zeile bendet sich rechts von der fuhrenden Eins der vorherigen Zeile. Graphisch sieht Matrix vom Typ m × n in Zeilenstufenform wie folgt aus (∗ bedeutet eine beliebige reelle Zahl, die bei der Berechnung entsteht): 1 * * * * * ... * * ... * 0 1 0 * * * ... * * ... * 0 0 0 0 1 * ... * * ... * 0 0 0 0 0 1 ... * * ... * .................................. 0 0 0 0 0 0 ... 1 * ... * 0 0 0 0 0 0 ... 0 0 ...0 .................................... 0 0 0 0 0 0 ... 0 0 ...0 r Zeilen m-r Zeilen Durch Ruckwartssubstitution bzw. Ruckwartselimination erhalt man hieraus die " " Gau-Jordan-Normalform: 1 0 0 0 0 0 ... 0 * ... * 0 1 0 0 0 0 ... 0 * ... * 0 0 0 0 1 0 ... 0 * ... * 0 0 0 0 0 1 ... 0 * ... * .................................. 0 0 0 0 0 0 ... 1 * ... * 0 0 0 0 0 0 ... 0 0 ... 0 .................................... 0 0 0 0 0 0 ... 0 0 ... 0 r Zeilen m-r Zeilen 1. MATRIZEN UND GLEICHUNGSSYSTEME Definition 41 2.9. Eine Matrix ist in Gauss-Jordan-Normalform, wenn (1) Jede Zeile, die nur aus Nullen besteht, am unteren Ende der Matrix steht. (2) Das erste, von Null verschiedene Element einer Zeile, eine 1 ist. Dieses Element sei "fuhrende Eins\ genannt. (3) Die fuhrende Eins einer jeden Zeile nach der ersten Zeile bendet sich rechts von der fuhrenden Eins der vorherigen Zeile. (4) Alle anderen Elemente einer Spalte, die eine fuhrende Eins enthalt, sind Null. 1.7. Gauß-Jordan-Algorithmus. Es ist recht umstandlich den Gauss-Algorithmus zu verwenden, um eine Gauss-Jordan-Normalform zu erhalten, da zunachst die Eliminationsschritte ausgefuhrt werden und dann die Ruckwartselimination erfolgt. Man kann diese beiden Teile auch zu einem Algorithmus { den wir Gauss-JordanAlgorithmus nennen wollen { vereinen. Beispiel 2.11. Anwendung des Gauss-Jordan-Algorithmus: Wir betrachten das Gleichungssystem 3x1 + 3x2 4x1 + 4x2 bzw. in Matrixform 2x3 − 2x4 = 2 − 3x3 + 9x4 = 12 − 2x3 + 11x4 = 12 0 0 2 −2 2 3 3 −3 9 12 4 4 −2 11 12 1. Schritt: Man bringe, wenn notig, durch Zeilenvertauschen ein von Null ver- schiedenes Element an die Spitze der ersten Spalte. Dieses Element nennt man auch Pivotelement (vom frz. pivot = Angelpunkt) ≈ ~z1 ↔ ~z2 3 3 −3 9 12 0 0 2 −2 2 4 4 −2 11 12 2. Schritt: Wenn das Pivotelement ungleich 1 ist, so multipliziere man die Zeile 1 in der sich das Pivotelement bendet mit pivot durch: ≈ ~z1 1 3 1 1 −1 3 4 0 0 2 −2 2 4 4 −2 11 12 42 2. LINEARE GLEICHUNGSSYSTEME 3. Schritt: Man erzeuge in der Spalte in der sich das Pivotelement bendet uber und unter diesem Nullen indem man geeignete Vielfache der Zeile, die das Pivotelement enthalt, zu allen anderen Zeilen addiert. 1 1 −1 3 4 0 0 2 −2 2 0 0 2 −1 4 ≈ (−4)~z1 + ~z3 4. Schritt: Man behalte die Zeile, die das Pivotelement enthalt und alle Zeilen daruber bei und wende den 1. und den 2. Schritt auf die Restmatrix an. Dann wende man den 3. Schritt auf die gesamte Matrix an. Man wiederhole den 4. Schritt bis die Gauss-Jordan-Normalform entstanden ist. 1 1 −1 3 4 2 −2 2 0 0 0 0 2 −1 4 1 1 −1 3 4 0 0 1 −1 1 0 0 2 −1 4 ≈ (−4)~z1 + ~z3 ≈ (−2)~z2 + ~z3 ~z2 + ~z1 ≈ ~z2 1 2 1 1 0 2 5 ≈ ~z3 + ~z2 0 0 1 −1 1 0 0 0 1 2 (−2)~z3 + ~z1 1 1 0 0 1 0 0 1 0 3 0 0 0 1 2 Die Losung des Gleichungssystems ist damit x4 = 2, x3 = 3, x2 = t, x1 = 1 − t, bzw. x1 x2 x3 x4 = 1 0 3 2 + t −1 1 0 0 , t ∈ R. Allgemein gilt: Die erweiterte Koezientenmatrix (A|~b) wird mittels Gauss(~ aquivalent umgeformt, mit M in Zeilenstufenform: Jordan)-Algorithmus in (M |d) ~ (M |d) = 1 0 0 0 ∗ 1 0 0 ∗ ∗ 0 0 ∗ ∗ 1 0 ∗ ∗ ∗ 0 ∗ ∗ ∗ 0 ... ... ... ... ∗ ∗ ∗ ∗ ... ... ... ... ∗ ∗ ∗ ∗ .. .. .. .. .. .. . . . . . . . . . . . .. . . . .. d1 d2 d3 d4 .. . 0 0 0 0 0 0 . . . 1 . . . ∗ dr 0 0 0 0 0 0 . . . 0 . . . 0 dr+1 .. .. .. .. .. .. . . . . . . .. . .. . 0 0 0 0 0 0 ... 0 ... 0 .. . dm (5) 1. MATRIZEN UND GLEICHUNGSSYSTEME Satz m. 43 2.2. Sei A eine m × n Matrix und ~b ein Spaltenvektor der Lange Dann gilt: (1) Lösbarkeitsentscheidung: Ist eine der Zahlen dr+1 , . . . , dm von Null verschieden, so ist M~x = d~ nicht losbar, und damit ist auch das Ausgangsgleichungssystem A~x = ~b nicht losbar. (2) Anzahl der freien Variablen: Ist A~x = ~b losbar, dann enthalt die allgemeine Losung n−r freie Variable, dabei ist n die Anzahl der Unbekannten. (3) Lösungsstruktur: Ist das System A~x = ~b losbar, dann lasst sich die allgemeine Losung in der Form ~v = v~0 + ~u, darstellen. Dabei ist ~v0 eine spezielle Losung des inhomogenen Gleichungssystems und ~u die allgemeine Losung des zugeordneten homogenen Gleichungssystems. Beweis: (1) und (2) liest man aus (5) ab. (3): Mit A~u = ~0 und A~v0 = ~b gilt A(~v0 +~u = ~b, andererseits folgt aus A~v = ~b und A~v0 = ~b, dass die Dierenz ~u := ~v − ~v0 das homogene Gleichungssystem A~x = 0 lost. # Anwendungen: 1. Interpolation: Es sei eine Menge von Datenpunkten gegeben: (x1 , y1 ), (x2 , y2 ), . . . , (xn , yn ). Gesucht ist ein Polynom, dessen Graph durch die Datenpunkte verlauft. Man zeigen, dass es ein eindeutig bestimmtes Polynom (hochstens) (n − 1). Grades gibt, dessen Graph durch alle Datenpunkte verlauft: y = a0 + a1 x + . . . an−2 xn−2 + an−1 xn−1 . Die unbestimmten Koezienten a0 , a1 , . . . , an−1 werden durch einsetzten der Datenpunkte bestimmt. Beispiel 2.12. Datenpunkte: (1; 6), (2; 3), (3; 2). Zu bestimmen ist ein Poly- nom 2.Grades y(x) = a0 + a1 x + a2 x2 . Wir erhalten folgendes Gleichungssystem: y(1) = 6 = a0 + a1 + a2 y(2) = 3 = a0 + 2a1 + 4a2 y(3) = 2 = a0 + 3a1 + 9a2 44 2. LINEARE GLEICHUNGSSYSTEME Losung des Gleichungssystems: 1 1 1 6 ≈ 1 2 4 3 ~z2 − ~z1 1 3 9 2 ~z3 − ~z1 1 1 1 6 1 3 −3 0 0 2 8 −4 ≈ ~z3 1 2 1 0 −2 9 0 1 3 −3 0 0 1 1 Losung des Gleichungssystems ist Parabel ≈ (−2)~z2 + ~z3 ~z1 − ~z2 ≈ 2~z3 + ~z1 (−3)~z3 + ~z2 1 0 −2 9 0 1 3 −3 0 0 2 2 1 0 0 11 0 1 0 −6 0 0 1 1 a1 = 11, a2 = −6, a3 = 1, folglich verlauft die y(x) = 11 − 6x + x2 durch alle Datenpunkte. 1.8. Transponierte Matrix. 2.10. Jeder m × n Matrix A = (aij )m×n zugeordnet ist die transponierte Matrix AT := (aji )n×m , deren i-te Zeile aus den Koezien- Definition ten der i-ten Spalte von A besteht. Aus den Spalten von A werden die Zeilen von AT und gleichzeitig werden dabei aus den Zeilen von A die Spalten von AT . Beispiel 2.13. Sei A die folgende 4 × 3-Matrix A= 1 2 α 0 α 4 x β 0 β 2 x , dann ist 1 2 α 0 AT = α 4 x β 0 β 2 x eine 3 × 4-Matrix. Dabei gelten die folgenden Rechenregeln: (1) (2) (3) (4) (A + B)T = AT + B T f ur Matrizen m × n-Matrizen A und B, T T (αA) = α A f ur alle Matrizen A und α ∈ R, T T (A ) = A f ur alle Matrizen A, T T (AB) = B AT , f ur alle m × n-Matrizen A und n × r-Matrizen B. 1. MATRIZEN UND GLEICHUNGSSYSTEME 45 Beweis: (1) bis (3) ergibt sich sofort. Um (4) zu beweisen, beachte man, dass ~z~s = α1 α2 β1 α1 n β2 X α2 αk βk = β1 β2 . . . βn . = ~sT ~zT . # . . . αn . = .. k=1 .. βn αn 2.11. Eine n × n Matrix A heit symmetrisch, wenn A = AT gilt, sie heit schiefsymmetrisch, wenn A = −AT gilt. Definition Bemerkung 2.2. Jede symmetrische Matrix A = AT = (aij )n×n ist wegen symmetrisch zur Hauptdiagonalen der Matrix A. Fur jede n × n Matrix A, sind die Matrizen A + AT und Dagegen ist die Matrix A − AT schiefsymmetrisch. aij = aji AAT symmetrisch. 1.9. Invertierbare Matrizen. In diesem Abschnitt betrachten wir quadratische n × (n Matrizen. Mit E bezeichnen wir stets die Einheitsmatrix E = (eij )n×n 1, wenn i = j, mit eij = . 0, wenn i 6= j. Definition 2.12. Eine n × n- Matrix A heit invertierbar, wenn es eine n × n-Matrix B gibt, so dass gilt AB = BA = E. In diesem Fall ist die Matrix B eindeutig bestimmt, sie wird mit A−1 bezeichnet (d.h. B := A−1 ), und heit inverse Matrix oder die Inverse von A. Die inverse Matrix ist eindeutig bestimmt, denn es gilt: Satz 2.3. Wenn es zur n × n-Matrix A zwei n × n-Matrizen B, C gibt mit BA = AC = E, dann ist A invertierbar und B = C = A−1 . Beweis: Es ist B = BE = B(AC) = (BA)C = EC = C. Also gilt AB = AC = E und BA = CA = E und es gibt zu A keine andere Matrix mit dieser Eigenschaft; d.h. es ist B = A−1 . # 46 2. LINEARE GLEICHUNGSSYSTEME Beispiel 2.14. Die Einheitsmatrix E = EE ist invertierbar mit E −1 = E. Fur A= a b c d ! a, b, c, d ∈ R, mit ad − bc 6= 0 ist A−1 1 = ad − bc d −b −c a ! . Mit Hilfe des Gau-Jordan-Algorithmus kann man nun einen Algorithmus zur Berechnung inverser Matrizen angeben. Es sei die n×n-Matrix in Zeilenform gegeben: ~a1 ~a2 A= . . . ~an und wir suchen die inverse Matrix B = A−1 in Spaltenform B= ~b1 ~b2 . . . ~bn . Auerdem stellen wir die Einheitsmatrix E ebenfalls in Spaltenform dar: B= ~e1 ~e2 . . . ~en . Dann ist ~a1 ~a2 ~ AB = E ⇐⇒ Abk = . ~bk = ~ek , . . ~an k = 1, 2, . . . , n, d.h. die Spalten von A−1 sind die Losungen des Gleichungssystems A~x = ~ek , k= 1, 2, . . . , n. Zur Vereinfachung des Algorithmus kann man statt nur einen Vektor anzufugen und den Gau-Jordan-Algorithmus abzuarbeiten, sofort alle Spaltenvektoren der Einheitsmatrix anfugen, also die gesamte Einheitsmatrix anfugen. Das ergibt folgenden Algorithmus: 1. MATRIZEN UND GLEICHUNGSSYSTEME 47 Algorithmus zur Bestimmung der inversen Matrix: Es sei A eine n × n-Matrix. (1) Man fuge die n × n Einheitsmatrix an die Matrix A an, d.h. man bilde die Matrix (A|E). (2) Man erzeuge durch aquivalente Zeilenumformungen gema dem Gau-Jordan-Algorithmus die Gau-Jordan-Normalform der Matrix (A|E). Ist die erzeugte Gau-Jordan-Normalform von der Gestalt (E|B), so ist B die zu A inverse Matrix. Ist die erzeugte Gau-Jordan-Normalform nicht von der Gestalt (E|B), d.h ist die Matrix der ersten n Zeilen und Spalten nicht die Einheitsmatrix, dann ist A nicht invertierbar. Beispiel 2.15. Man untersuche, ob die Matrix 1 −1 −2 A = 2 −3 −5 −1 3 5 invertierbar ist. Wir beginnen damit die Einheitsmatrix anzufugen und den Gau-Jordan-Algorithmus abzuarbeiten: 1 −1 −2 1 0 [A|E] = 2 −3 −5 0 1 −1 3 5 0 0 1 −1 −2 1 0 ≈ 1 2 −1 0 1 (−1)~z2 0 2 3 1 0 0 0 1 0 0 1 ≈ ~z2 + (−2)~z1 ~z3 + ~z1 ≈ ~z1 + ~z2 ~z3 + (−2)~z2 ≈ ~z1 + ~z3 ~z2 + (−1)~z3 1 −1 −2 1 0 0 −1 −2 1 0 0 −1 0 2 3 1 0 1 1 0 −1 3 −1 0 2 −1 0 0 1 1 0 0 1 −3 2 1 1 0 0 0 1 1 0 1 0 5 −3 −1 0 0 1 −3 2 1 Mit Hilfe des Gau-Jordan-Algorithmus kann auf der rechten Seite eine Einheitsmatrix erzeugt werden und damit existiert A−1 und ist gleich A−1 0 1 1 = 5 −3 −1 . −3 2 1 48 2. LINEARE GLEICHUNGSSYSTEME Beispiel 2.16. Man uberprufe, ob die Matrix 1 1 5 A= 1 2 7 2 −1 4 invertierbar ist und gebe gegebenenfalls die inverse Matrix an. Wir beginnen wiederum mit dem Gau-Jordan-Algorithmus: 1 1 5 1 0 0 (A|E) = 1 2 7 0 1 0 2 −1 4 0 0 1 ≈ ~z2 + (−1)~z1 ~z3 + (−2)~z1 ≈ ~z1 + (−1)~z2 ~z3 + 3~z2 1 1 1 0 0 −3 1 0 0 1 0 0 1 0 0 5 2 −1 1 0 −6 −2 0 1 3 2 −1 0 2 −1 1 0 0 −5 3 1 In der letzten Zeile ist es unmoglich an der 3. Stelle eine "1\ zu erzeugen, deshalb bricht der Algorithmus hier ab und die Matrix A ist nicht invertierbar. Satz 2.4. Es sei A~x = ~b ein lineares Gleichungssystem mit n Gleichungen und n Unbekannten. Wenn die zu A inverse Matrix A−1 existiert, ist die Losung des Gleichungssystems eindeutig bestimmt durch ~x = A−1~b. Beweis: Wir beweisen zunachst, dass ~x = A−1~b eine Losung ist: A~x = A(A−1~b) = (AA−1 )~b = E~b = ~b. Folglich erfullt ~x = A−1~b das Gleichungssystem und ist damit eine Losung. Wir zeigen nun die Eindeutigkeit: Es sei ~y eine Losung des Gleichungssystems, d.h. A~y = ~b, A−1 (A~y ) = A~b, beide Seiten der Gleichung wurden mit der existierenden inversen Matrix A−1 multipliziert. (A−1 A)~y = A−1~b, die Matrizenmultiplikation ist transitiv E~y = A−1~b, A−1 A = E ~y = A−1~b. 1. MATRIZEN UND GLEICHUNGSSYSTEME Folglich gibt es nur diese eine Losung. 49 # Rechenregeln fur das Invertieren von quadratischen Matrizen: (1) Die Inverse einer invertierbaren n × n-Matrix A ist invertierbar; A−1 −1 = A. (2) Das Produkt AB zweier invertierbarer n × n-Matrizen ist invertierbar; (AB)−1 = B −1 A−1 . (3) Die transponierte AT einer n × n-Matrix ist genau dann invertierbar, wenn A invertierbar ist. In diesem Fall ist AT −1 = A−1 T . Beweis: zu (1): Die Denition der inversen Matrix besagt, dass es zur Matrix A eine Matrix B mit AB = BA = E gibt und diese eindeutig bestimmt ist, d.h. B = A−1 bzw. AA−1 = A−1 A = E. (6) Lesen wir diese Gleichung nun bezogen auf A−1 , so steht da, dass es eine Matrix gibt, die von rechts und von links mit A−1 multipliziert gerade die Einheitsmatrix ergibt, also ist diese Matrix gerade die inverse Matrix zu A−1 und die Gleichung (6) besagt gerade, dass (A−1 )−1 = A ist. zu (2): Wie man leicht sieht gilt: (B −1 A−1 )AB = B −1 (A−1 A)B = B −1 EB = B −1 B = E und auch AB(B −1 A−1 ) = A(BB −1 )A−1 = AEA−1 = AA−1 = E. Nach der Denition der inversen Matrix ist damit (AB)−1 = B −1 A−1 . zu (3): Wir haben nachzuweisen, dass falls A invertierbar ist, dann ist auch AT invertierbar und umgekehrt. Auerdem haben wir zu zeigen, dass dann (A−1 )T = (AT )−1 gilt. Wir nehmen daehalb zunachst an, dass A invertierbar ist und die inverse 50 2. LINEARE GLEICHUNGSSYSTEME Matrix ist A−1 , d.h. AA−1 = A−1 A = E | transponieren ⇐⇒ (AA−1 )T = (A−1 A)T = E T ⇐⇒ (A−1 )T AT = AT (A−1 )T = E d.h. auch AT ist invertierbar und (AT )−1 = (A−1 )T . Nehmen wir nun an, dass AT invertierbar ist, d.h. AT (AT )−1 = (AT )−1 AT = E | transponieren T T ⇐⇒ AT (AT )−1 = (AT )−1 AT = E T T T ⇐⇒ (AT )−1 A = A (AT )−1 = E. Folglich ist A invertierbar und es gilt A−1 = (AT )−1 # T ⇐⇒ (A−1 )T = (AT )−1 . Anwendungsbeispiel: Beispiel 2.17. Kryptographie: Unter der Kryptographie versteht man den Prozess des Ver- und Entschlusselung von Nachrichten. Das Wort kommt vom griechischen Wort kryptos, was soviel wie "versteckt\ bedeutet. Heutzutage werden komplizierte Methoden angewandt um Nachrichten zu ver- und entschlusseln. Ein ziemlich schwer zu brechender Kode entsteht bei der Verwendung riesiger Kodierungsmatrizen. Der Empfanger entschlusselt die Nachricht mit Hilfe der Dekodierungsmatrix, die die inverse Matrix zur Kodierungsmatrix ist. Wir erlautern das an folgendem einfachen Beispiel. Wir wollen die Nachricht Mathematik ist leicht verschlusseln. Dazu ordnen wir zunachst jedem Buchstaben des Alphabets eine Zahl zu, der Einfachheit halber sei das die Position des Buchstaben im Alphabet, also A ist 1, B ist 2, usw. Der Zwischenraum zwischen 2 Worten erhalte die Zahl 27. M A T H E M A T I K I S T L E I C H T 13 1 20 8 5 13 1 20 9 11 27 9 19 20 27 21 5 9 3 8 20 Diese Nachricht wird nun mit Hilfe der Kodierungsmatrix −3 −3 4 A= 0 1 1 4 3 4 1. MATRIZEN UND GLEICHUNGSSYSTEME 51 verschlusselt. Da wir eine 3 × 3-Matrix zur Kodierung verwenden wollen, unterteilen wir die in Zahlen ubertrage Nachricht in 3 × 1-Matrizen: 13 1 20 8 5 13 1 20 9 11 27 9 19 20 27 21 5 9 3 8 20 Wir multiplizieren nun jede der Spaltenmatrizen mit der Kodierungsmatrix, was in einem Schritt mittels Matrizenmultiplikation in der folgenden Weise gemacht werden kann: −3 −3 4 1 1 0 4 3 4 38 13 = 21 18 135 99 13 8 1 11 19 21 3 1 5 20 27 20 5 8 20 13 9 9 27 9 20 −27 −78 −9 −42 47 29 36 47 14 28 100 161 244 135 116 Die Nachricht wird somit als 38, 21, 135, 13, 18, 99, −27, 29, 100, −78, 36, 161, −9, 47, 244, −42, 14, 135, 47, 28, 116 ubetragen. Um die Nachricht zu dekodieren benotigen wir nun die inverse der Kodierungsmatrix. Berechnung der Dekodierungsmatrix: −3 −3 4 1 0 0 1 1 − 34 − 31 0 0 ≈ 1 1 0 1 0 0 1 0 0 0 1 1 − 13 ~z1 4 3 4 0 0 1 4 3 4 0 0 1 1 1 − 43 − 13 0 0 ≈ 1 0 − 37 − 13 −1 0 ≈ 1 0 1 0 ~z1 − ~z2 0 1 0 0 1 0 1 1 (−4)~z1 + ~z3 28 4 31 4 ~z3 − ~z2 0 −1 3 0 1 0 0 3 1 1 3 3 1 24 7 1 0 − 37 − 31 −1 0 ≈ 1 0 0 − 31 − 31 31 ≈ 4 28 3 0 1 0 ~z1 + 73 ~z3 − 31 0 1 1 0 1 0 − 31 3 31 ~ z 4 3 3 4 3 3 31 3 0 0 1 ~z2 − ~z3 0 0 1 31 31 31 31 31 31 und damit ist die Dekodierungsmatrix A−1 −1 −24 7 1 = −4 28 −3 31 4 3 3 Fasst man nun die kodierte Nachricht wieder in 3×1-Spaltenvektoren zusammen und wendet darauf die Dekodierungsmatrix an, so ergibt sich der ursprungliche Text der Nachricht. 52 2. LINEARE GLEICHUNGSSYSTEME Beispiel 2.18. Man berechne, so moglich, die inverse Matrix zu A= 4 1 1 0 3 1 0 1 4 1 3 1 ! . ! ! 1 41 14 0 ≈ ≈ 3 1 0 1 ! 1 41 14 0 ≈ ≈ 0 1 −3 4 und wir erhalten A−1 = 1 −1 −3 4 0 1 ! 1 0 1 −1 0 1 −3 4 ! 1 0 1 4 1 4 1 4 − 34 ! . Man berechne nun (AT )−1 . Wegen (AT )−1 = (A−1 )T ergibt sich (AT )−1 = Beispiel 1 −3 −1 4 ! . 2.19. Man lose das Gleichungssystem x1 + 2x2 − x3 = b1 x1 + x2 − 2x3 = b2 x 1 − x 2 − x 3 = b3 fur b1 1 0 5 b2 = 2 , 1 , 2 . b3 3 4 −3 Dazu ist es nicht erforderlich, dass das Gleichungssystem dreimal gelost wird. Man kann alle 3 rechten Seiten auf einmal einsetzen. Man schreibt zunachst wie ublich die Koezientenmatrix hin und fugt dann alle 3 rechten Seiten an: 1 2 −1 1 0 5 1 2 −1 1 0 5 1 1 −2 2 1 2 ≈ 0 −1 −1 1 1 −3 1 −1 −1 3 4 −3 0 −3 0 2 4 −8 1 2 −1 1 0 5 1 0 −3 3 2 −1 ≈ 0 1 1 −1 −1 3 ≈ 0 1 1 −1 −1 3 0 −3 0 2 4 −8 0 0 3 −1 1 1 1 0 0 2 3 0 1 0 0 2 3 0 ≈ 0 1 1 −1 −1 3 ≈ 0 1 0 − 23 − 43 83 0 0 1 − 13 13 13 0 0 1 − 13 13 13 1. MATRIZEN UND GLEICHUNGSSYSTEME 53 b1 1 x1 Folglich hat das Gleichungssystem fur osung b2 = 2 die L x2 = b3 3 x 3 6 9 b1 0 x1 1 1 , f ur b2 = 1 die Losung x2 = 3 −4 ur und f 3 −2 −1 1 b 4 x 3 3 0 b1 5 x1 1 osung x2 = 3 8 . b2 = 3 die L 1 b3 −2 x3 Die Ursache hierfur ist, dass die Eigenschaft des Gleichungssystems genau eine/unendlich viele/keine Losung besitzt nicht von der rechten Seite, sondern nur von der Koeffizientenmatrix abh angt. Beispiel 2.20. Man bestimmte die Losung des Gleichungssystems 2x1 + x1 + b1 b2 fur ! 2 1 = ! ! 0 1 , die rechten Seiten an 2 1 2 0 1 12 1 1 . ! ≈ x2 1 x 2 2 = b1 = b2 Wir bilden die Koezientenmatrix und hangen 1 2 1 1 1 2 1 2 0 ! 1 2 1 1 1 0 0 0 −2 ≈ Daraus kann man ablesen, dass das Gleichungssystem fur Losung 0 1 ! x1 x2 ! = 1 0 ! +t − 21 1 ! t ∈ R, , ! b1 b2 ! = besitzt, dagegen fur 2 1 ! b1 b2 die ! = keine Losung besitzt. Geometrische Interpretation: Das Gleichungssystem 2x1 + x1 + x2 1 x 2 2 = 2 = 1 besteht aus zwei identischen Geraden, da die erste Gleichung das Doppelte der zweiten Gleichung ist. Folglich sind alle Punkte der Geraden sind Losungen des Gleichungssystems. Das sieht man auch an der Losung, denn x1 x2 ! = 1 0 ! +t − 21 1 ! , ist gerade eine Parameterdarstellung der Geraden. t ∈ R, 54 2. LINEARE GLEICHUNGSSYSTEME Dagegen beschreibt das Gleichungssystem 2x1 + x1 + x2 1 x 2 2 = 0 = 1 zwei sich nicht schneidende, parallele Geraden. Der Anstieg der Geraden ist identisch, aber die erste Gerade verlauft durch den Ursprung, die zweite Gerade dagegen nicht. 2. Determinanten Anwendungen von Determinanten • Wann existiert die inverse Matrix zu einer gegebenen n × n Matrix • • • • • • A? Das Vektorprodukt kann als formale Determinante berechnet werden (→ siehe lineare Algebra) Mit Hilfe der Determinante kann man feststellen, ob Vektoren linear abhangig oder linear unabhangig sind (→ siehe lineare Algebra). Bestimmung der charakteristischen Gleichung bei Eigenwertproblemen (→ siehe lineare Algebra: Eigenwerte/Eigenvektoren). Berechnung von Flacheninhalten in der Computergraphik. Hesse-Matrix und Determinante zur Bestimmung von Minima und Maxima von Funktionen zweier Veranderlicher (→ siehe Hohere Mathematik II) Jacobi-Matrix und -Determinante (oder auch Funktionaldeterminante) bei der Transformation von mehrdimensionalen Integralen (→ siehe Hohere Mathematik II) 2. DETERMINANTEN 55 Man bestimmt Determinanten nur von quadratischen Matrizen. Wir werden die Berechnung von Determinanten rekursiv durchfuhren, d.h. wir denieren wie man eine 2×2-Determinante berechnet und fuhren dann die Berechnung von (n+1)×(n+1)Determinanten auf die Berechnung von n × n-Determinanten zuruck. Fur 1 × 1 ist |A| = det (a) = a. Betrachten wir nun 2 × 2-Matrizen: Definition 2.13. Die Determinante einer 2 × 2-Matrix A wird mit det A oder |A| bezeichnet und wird berechnet als det a11 a12 a21 a22 ! a11 a12 = a21 a22 = a11 a22 − a21 a12 . Nun zur Denition und Berechnung von n × n-Determinanten: Definition 2.14. Es sei A eine quadratische n × n-Matrix. Die (n − 1) × (n − 1)-Matrix, die aus der Matrix A entsteht, wenn man die i-te Zeile und die j -te Spalte streicht, sei mit Uij bezeichnet. Dann berechnet man die Determinante der n × n-Matrix A aus den Determinanten der (n − 1) × (n − 1)-Matrizen Uij : n X det A := (−1)1+i ai1 det Ui1 . i=1 2.1. 3 × 3-Matrizen. Es sei a11 a12 a13 A = a21 a22 a23 a31 a32 a33 Dann ist a a |A| = a11 22 23 a32 a33 a 12 a13 − a21 a32 a33 a 12 a13 + a31 a22 a23 = a11 (a22 a33 − a32 a23 ) − a21 (a12 a33 − a32 a13 ) + a31 (a12 a23 − a22 a13 ). Schreiben wir die Berechnung der Determinante noch einmal aus, so ist |A| = a11 a22 a33 − a32 a23 a11 − a33 a21 a12 + a13 a21 a32 + a12 a23 a31 − a31 a22 a13 ). 56 2. LINEARE GLEICHUNGSSYSTEME Dann sieht man, dass die Determinante wie folgt berechnet werden kann: + + - + - - Das ist die Sarrussche Regel Die Sarrussche Regel ist auf Determinanten höherer Ordnung nicht übertragbar. Beispiel 2.21. Man berechne die Determinante von 1 2 −1 A= 3 0 1 4 2 1 dann ist |A| = 1 · 0 · 1 + 2 · 1 · 4 + (−1) · 2 · 3 − 4 · 0 · (−1) − 2 · 1 · 1 − 1 · 3 · 2 = 8 − 6 − 2 − 6 = −6. Satz 2.5. Fur eine obere Dreiecksmatrix gilt a11 0 det .. . 0 ∗ ... ... ... ... a22 ... 0 ∗ .. . = a11 a22 · · · ann . ∗ ann Beweis: Man entwickle jede entstehende Determinante nach der ersten Spalte, da an der Spitze der jeweilige 1. Spalte immer ein Element der Hauptdiagonale steht und alle Elemente unterhalb der Hauptdiagonale gleich Null sind, ergibt sich die Behauptung. # Beispiel |A| = 7 0 0 0 0 3 0 0 0 0 2.22. 4 2 1 2 4 1 5 −1 2 = 7· 0 4 3 0 0 6 0 0 0 0 2 4 1 5 −1 2 4 3 5 −1 2 = 7·0· 0 4 3 = 7·0·5· 0 6 0 4 3 0 0 6 0 0 6 = 7·0·5·4·6 = 0. 2. DETERMINANTEN 57 2.2. Rechenregeln für Determinanten. Satz gen) 2.6. (Rechenregeln für Determinanten bei Zeilenumformun ~a1 ~a2 Die Matrix A sei in Zeilenform gegeben: A = .. . Dann gilt . ~an (1) Ein gemeinsamer Faktor einer Zeile kann aus det A herausgezogen werden, d.h. fur α ∈ R gilt ~a1 ~a1 ~a2 ~a2 .. .. . . det α~ai = αdet ~ai . .. .. . . ~an ~an (2) Besteht eine Zeile von A aus der Summe ai = bi +ci , dann besitzt det A die entsprechende Summenzerlegung, d.h. det ~a1 ~a2 .. .. . = det . + det ~ ~bi + ~ci bi .. .. . . ~a1 ~a2 ~an ~an ~a1 ~a2 .. . ~ci . .. . ~an (3) Ensteht die Matrix à aus der Matrix A durch vertauschen zweier Zeilen, so ist det à = −det A. Beweis: Der Beweis lasst sich leicht mittels vollstandiger Induktion f uhren und der Entwicklung der Determinante nach der ersten Spalte. # Folgerung aus (3): Sind zwei Zeilen einer Matrix A gleich, so ist ihre Determinante gleich Null. Beispiel 2.23. Wir werden die folgende Determinante zunachst nach der Sarrusschen Regel berechnen: 1 2 3 det 2 1 1 = 4 + 6 + 18 − 9 − 3 − 16 = 0. 3 3 4 58 2. LINEARE GLEICHUNGSSYSTEME Wir hatten dieses Ergebnis aber auch anders erkennen konnen. Es gilt namlich ~z3 = (3, 3, 4) = (1, 2, 3) + (2, 1, 1) = ~z1 + ~z3 . Daraus konnen wir sofort schlieen, dass die Determinante gleich Null ist. Weitere Eigenschaften: Satz 2.7. (Rechenregeln fur Determinanten): Fur alle n × n-Matrizen A und B gilt: (1) Symmetrie in Zeilen und Spalten det (AT ) = det A. (2) Multiplikationssatz det (AB) = det A · det B. (3) Invertierbarkeitstest A ist invertierbar ⇐⇒ det A 6= 0. (1), (2) ohne Beweis. Beweis zu (3): Ist A invertierbar, dann gibt es eine Matrix C mit AC = CA = E und nach (2) ist det AC = det Adet C = det E = 1. Folglich ist det A 6= 0. Die Umkehrung ist gerade die Cramersche Regel (siehe spater). # Folgerungen aus dem Multiplikationssatz: (1) det (AB) = det (BA). (2) det (Ak ) = (det A)k . (3) det (A−1 ) = (det A)−1 , falls A invertierbar ist. (4) det (C −1 AC) = det A, fur alle invertierbaren n × n-Matrizen C. Beweis: zu (1) det (AB) = det A · det B = det B · det A = det (BA). zu (2) det (Ak ) = det A = (det (Ak−1 ) = . . . = (det A)k . zu (3) det (AA−1 ) = det A · det (A−1 ) = det E = 1 und damit ist det (A−1 ) = zu (4) det (C −1 AC) = det (C −1 ) · det A−1 · det C = det A. # 1 . det A Folgerung aus der Symmetrie: Die Formeln von Satz 2.6 gelten analog fur die entsprechenden Spaltenumformungen. Wegen det AT = det A hat man ebenso die Entwicklung von det A nach der i-ten Spalte. Die Matrix à = (~aj ~a1 ~a2 . . . ~aj−1 ~aj+1 . . . ~an ) entsteht aus der Matrix 2. DETERMINANTEN 59 A = (~a1 ~a2 . . . ~aj−1 ~aj ~aj+1 . . . ~an ) durch j − 1 sukzessive Vertauschungen benachbarter Spalten. Also gilt det à = (−1)j−1 det A. Entwickelt man nun erneut det à nach der ersten Spalte, so ergibt sich der sogenannte Satz 2.8. (Entwicklung von det A nach der j-ten Spalte: det A = n X (−1)i+j aij det Uij , i=1 wobei Uij die (n−1)×(n−1)-Matrix bezeichnet, die aus A durch Streichen der i-ten Zeile und der j -ten Spalte entsteht. Beispiel 2.24. Man berechne die folgende Determinante: 1 1 2 3 0 0 1 2 −2 = 0 −1 −1 −1 3 2 ~z2 + ~z3 1 1 1 2 0 1 2 3 = 2+4 = (−1) (−2) −1 0 5 5~s1 + ~s3 1 1 2 2 8 2+1 = (−2)(−1) (−1) 1 7 Beispiel 2 1 0 1 3 0 2 −2 = 5 0 Entwickl. nach 4. Spalte 2 0 1 2 8 = (−2) −1 0 0 Entwickl. nach 2. 1 1 7 Zeile = (−2)(2 · 7 − 1 · 8) = −12. 2.25. Wir wollen die Determinante von A= 3 −2 0 −1 0 2 2 1 1 −2 −3 −2 0 1 2 1 berechnen. 1. Schritt: Wir versuchen in einer Zeile oder Spalte moglichst viele Nullen zu erzeugen, das konnen wir machen, da der Wert der Determinante dabei unverandert bleibt. Wir addieren das (−3)-fache der 3. Zeile zur 1. Zeile, d.h. ausfuhrlich: 60 2. LINEARE GLEICHUNGSSYSTEME det A = 3 −2 0 −1 −3 6 9 6 0 2 2 1 0 2 2 1 + = 1 −2 −3 −2 1 −2 −3 −2 0 1 2 1 0 1 2 1 {z } | = (−3) · 0 4 9 5 0 2 2 1 1 −2 −3 −2 0 1 2 1 1 −2 −3 −2 0 2 2 1 =0 1 −2 −3 −2 0 1 2 1 2. Schritt: Entwickeln nach der 1. Spalte: 4 9 5 = (+1) · 1 · 2 2 1 1 2 1 Addieren das (−4)-fache der 3. Zeile zur 1. Zeile dazu: 4 9 5 = 2 2 1 1 2 1 −4 −8 −4 0 1 1 2 1 = 2 2 1 + 2 1 2 1 1 2 1 | {z } =0 Addieren das (−2)-fache der 3. Zeile zur 2. Zeile dazu: 0 1 1 = 2 2 1 1 2 1 0 1 1 0 1 1 + −2 −4 −2 = 0 −2 −1 1 2 1 1 2 1 | {z } =0 3. Schritt: Entwickeln nach der 1. Spalte: 1 1 = 1 · 1 −2 −1 = (−1) − (−2) = 1. Alternativ, die direkte Entwicklung. Entwickeln nach der 1. Spalte (gunstig, da zwei Nullen): 2 −2 0 −1 2 1 det A = 1 · 3 · −2 −3 −2 + 1 · 1 · 2 2 1 = 1 1 2 1 2 1 2. DETERMINANTEN 61 Nun nach der 1. Spalte bzw. der 2. Zeile entwickeln: −3 −2 2 1 =3 1·2· + (−1)(−2) · 2 2 1 1 2 1 + 1 · 1 · −3 −2 ! + 0 −1 −2 −1 −2 0 +(−1) · 2 · +1·2· + (−1) · 1 · 2 1 1 1 2 1 = = 3(2((−3) − (−4)) + 0 + ((−4) − (−3))) + (−2)2 + 2((−2) + 1) + (−1)(−4) = = 3(2 − 1) − 4 − 2 + 4 = 1. 2.3. Cramersche Regel. Wir kommen nun zur Satz 2.9. Cramersche Regel: Gilt fur die Determinante der Matrix A = (~a1 ~a2 . . . ~an ) die Beziehung det A 6= 0, so hat das Gleichungssystem A~x = ~b mit einer rechten Seite ~b die L osung 1 xi = det (~a1 . . . ~ai−1 ~b ~ai+1 . . . ~an ), i = 1, 2 . . . , n. det A (Die i-te Spalte von A wird durch b ersetzt.) Beweis: Das Gleichungssystem A~x = ~b ist aquivalent zu a11 a12 . . . a1n x1 a21 a22 . . . ann x2 .. .. = . . . . . . . . an1 an2 . . . ann xn x1 a11 + x2 a12 + . . . + xn a1n x1 a21 + x2 a22 + . . . + xn a2n ⇐⇒ . .. x1 an1 + x2 an2 + . . . + xn ann b1 b2 .. . bn b1 b2 .. . bn ⇐⇒ x1~a1 + x2~a2 + . . . + xn~an = ~b. Damit ist det (~b ~a2 . . . ~an ) = det n X i=1 ! xi~ai ~a2 . . . ~an = n X xi det (~ai ~a2 . . . ~an ) i=1 = x1 det (~a1 ~a2 . . . ~an ) = x1 det A. 62 2. LINEARE GLEICHUNGSSYSTEME Die anderen Determinanten berechnen sich analog. Da det A 6= 0 gilt ergibt sich die Behauptung. # Bemerkung 2.3. Man sollte die Cramersche Regel i. Allg. nicht zur vollstandi- gen Auslosung eines Systems mit vielen Unbekannten verwenden (hoher Rechenaufwand!). Die Formel ist aber gut geeignet zur Berechnung einzelner Unbekannter und insbesondere zur Weiterverarbeitung, wenn im Gleichungssystem zusatzliche Parameter enthalten sind. Beispiel stems 2.26. Man bestimme die Losungskomponente x2 des Gleichungssy5x1 + 3x2 −3x1 + 5x2 3x2 5x1 + 3x2 + 2x3 + 6x3 − 5x4 + x3 − x4 + 4x3 + x4 = = = = 4 1 0 0 Nach der Cramerschen Regel gilt det x2 = 5 −3 0 5 2 0 6 −5 1 −1 4 1 2 0 6 −5 1 −1 4 1 4 1 0 0 5 3 −3 5 det 0 3 5 3 Wir berechnen die einzelnen Determinanten: 5 −3 0 5 4 1 0 0 2 0 6 −5 1 −1 4 1 5 4 2 = −3 1 1 5 0 5 = ~s3 + ~s4 5 −3 0 5 4 1 0 0 2 6 1 4 2 1 0 5 = Entwickl. nach 3. Zeile 17 0 −2 = = −3 1 1 (−4)~z2 + ~z1 Entwickl. nach 2. Spalte 5 0 5 17 −2 = = 17 · 5 − 5 · (−2) = 95. 5 5 2. DETERMINANTEN und 2 0 6 −5 1 −1 4 1 63 = (−2)~z3 + ~z1 (−6)~z3 + ~z2 (−4)~z3 + ~z4 5 −3 2 = −3 −13 1 (−2)~z2 + ~z1 5 −9 5 (−5)~z2 + ~z3 5 −3 0 5 3 5 3 3 = 5 −3 0 2 −3 −13 0 1 = 0 3 1 −1 Entwickl. nach 3. Spalte 5 −9 0 5 11 23 0 = −3 −13 1 Entwickl. nach 3. Spalte 20 56 0 11 23 = (−1) = (−1)(11 · 56 − 20 · 23) = −156. 20 56 95 . und damit ist x2 = − 156 Definition 2.15. Es sei A eine n × n Matrix, dann heit die Zahl i+j Aij := (−1) Adjunkte a11 a12 .. . ... .. . a1,j−1 a1,j+1 .. . .. . ai−1,1 ai−1,2 . . . ai−1,j−1 ai−1,j+1 ai+1,1 ai+1,2 . . . ai+1,j−1 ai+1,j+1 .. . .. . an1 an2 ... .. . .. . an,j−1 an,j+1 a1n .. . . . . ai−1,n . . . ai+1,n .. . . . . ann ... des Elements aij . Bemerkung 2.4. Die Adjunkte des Elements aij ist gleich (−1)i+j mal die Determinante der (n − 1) × (n − 1) Matrix, die man aus A erhalt, wenn man die i-te Zeile und die j -te Spalte streicht,d.h. Aij = (−1)i+j det Uij . Damit erhalt man aus der Cramerschen Regel: Satz 2.10. Ist die n × n Matrix A invertierbar, so ist A−1 A11 A21 . . . An1 1 A12 A22 . . . An2 = .. .. det A ... . . A1n A2n . . . Ann In Worten: Die Inverse von junktenmatrix von A. A ist A11 A12 . . . A1n 1 A21 A22 . . . A2n . = .. .. det A .. . . An1 An2 . . . Ann 1 det A T . mal die Transponierte der Ad- 64 2. LINEARE GLEICHUNGSSYSTEME 2.4. Übersicht: Praktische Berechnung von Determinanten. 2.4.1. Spezialfalle. Es sei A eine quadratische Matrix (vom Typ n × n), dann ist det (a11 ) = a11 und ! a11 a12 a21 a22 det a11 a12 = a21 a22 = a11 a22 − a21 a12 . Fur 3 × 3 Matrizen gilt die Sarrussche Regel: a 11 a12 a13 a21 a22 a23 a31 a32 a33 = a11 a22 a33 +a12 a23 a31 +a13 a21 a32 −a31 a22 a13 −a32 a23 a11 −a33 a21 a12 bzw. + + - + - - Für Determinanten höherer Ordnung gibt es keine analogen Formeln. 2.4.2. Entwicklungssatz. Berechnung nach dem (Laplaceschen) Entwicklungssatz det A = n X i+j (−1) aij det Aij = n X i=1 (−1)i+j aij det Aij . j=1 wobei das Vorzeichen nach der Schachbrettregel bestimmt wird: + − + − + ... − + − + − ... + − + − + ... .. . .. . .. . .. . .. . 2. DETERMINANTEN 65 und die Unterdeterminante durch Streichen der i-ten Zeile und j -ten Spalte entsteht: a11 a12 ... a1,j−1 a21 a22 ... a2,j−1 .. . .. . .. . ai−1,1 ai−1,2 . . . ai−1,j−1 ai1 ai2 ... ai,j−1 ai+1,1 ai+1,2 . . . ai+1,j−1 .. . .. . an1 an2 .. . ... an,j−1 a1j a2j . . . ai−1,j |aij | ai+1,j . . . anj a1,j+1 ... a2,j+1 ... .. . ai−1,j+1 . . . ai,j+1 ... ai+1,j+1 . . . .. . an,j+1 ... a1n a2n .. . ai−1,n ain ai+1,n .. . ann Rechenregeln: Es sei A eine n × n Matrix. (1) Alle Rechenregeln gelten analog fur Spalten bzw. Zeilen. (2) Vertauscht man eine Spalte (Zeile) von A mit einer anderen Spalte (Zeile) von A so andert sich das Vorzeichen der Determinante. (3) Hat die Matrix A zwei gleiche Spalten (Zeilen), so ist die Determinante von A gleich Null. (4) Addiert man das Vielfache einer Spalte (Zeile) zu eine anderen Spalte (Zeile), so bleibt die Determinante unverandert. KAPITEL 3 Vektorräume Lernziele dieses Abschnitts sind: (1) Begrie: Vektorraum, Basis, Dimension, linear abhangig, linear unabhangig, lineare Hulle, Rang einer Matrix, Skalarprodukt, Vektorprodukt, Spatprodukt, (2) Rangberechnung mittels Gau-Algorithmus, (3) Rangkriterium fur die Losbarkeit von Gleichungssystemen (Satz 3.5), (4) geometrische Bedeutung von Skalar-, Vektor- und Spatprodukt, (5) Parameter- und parameterfreie Darstellungen von Geraden und Ebenen, Hesse-Normalform, (6) Abstande und Schnittwinkel. 1. Allgemeine Vektorräume Viele Eigenschaften, die Vektoren im R2 und R3 erfullen, gelten auch fur eine Vielzahl anderer Objekte. Definition 3.1. Eine nichtleere Menge V, in der man zu je zwei Eleeine Summe ~a + ~b ∈ V und zu jedem Element ~a ∈ V mit menten ~a, ~b ∈ V einer reellen Zahl λ das λ-fache λ~a ∈ V bilden kann, heit Vektorraum über R oder auch R-Vektorraum oder linearer Raum u ber R, wenn gilt: (1) Die Addition ist kommutativ. (2) Die Addition ist assoziativ. (3) Es gibt ein Nullelement (Nullvektor) ~0 mit ~a + ~0 = ~a fur alle ~a ∈ V. Zu jedem ~a ∈ V gibt es ein Element −~a mit ~a + (−~a) = ~0. 1~a = ~a f ur alle ~a ∈ V. λ(µ~a) = (λµ)~a f ur alle λ, µ ∈ R und alle ~a ∈ V. ~ λ(~a + b) = λ~a + λ~b f ur alle λ ∈ R und alle ~a, ~b ∈ V. (λ + µ)~a = λ~a + µ~a f ur alle λ, µ ∈ R und alle ~a ∈ V. Die Elemente eines Vektorraumes nennt man Vektoren; die Dierenz zweier Vektoren ~a und ~b ist deniert als ~a − ~b := ~a + (−~b). (4) (5) (6) (7) (8) 67 3. VEKTORRAUME 68 Beispiel 3.1. Wir bezeichnen mit Rn den Raum aller Vektoren x1 x2 .. , xi ∈ . xn mit n Komponenten. Die ublichen Regeln der Vektoraddition und Multiplikation mit Skalaren R, i = 1, 2, . . . , n, x1 y1 x1 + y 1 x2 y 2 x2 + y 2 ~x + ~y = . + . = .. .. .. . xn yn xn + y n und λx1 x1 x2 λx2 λ~x = λ . = . . . . . . λxn xn machen Rn zum Vektorraum. Beispiel 3.2. Der Raum Rm×n aller m × n-Matrizen ist mit der bereits de- Beispiel 3.3. Fur jedes nichtleere Intervall I ⊆ R ist nierten Addition und Multiplikation mit Skalaren ein Vektorraum. C 0 (I) := {f : I → R; f ist stetig }, die Menge aller auf dem Intervall I denierten stetigen Funktionen mit der (1) punktweisen Addition (f + g)(x) := f (x) + g(x), (2) und der Multiplikation mit Skalaren (λf )(x) := λ · f (x) ist ein Vektorraum mit dem Nullvektor 0, d.h. der Funktion 0(x), die auf dem Intervall I identisch Null ist, also 0(x) = 0 fur alle x ∈ I, und dem zu f ∈ C 0 entgegengesetzten Vektor −f, wobei −f (x) = (−1)f (x) := (−1)·f (x) fur alle x ∈ I ist. 1. ALLGEMEINE VEKTORRAUME Definition 69 3.2. Jede aus endlich vielen Vektoren ~v1 , ~v2 , . . . , ~vk ∈ V ge- bildete Summe der Form k X αi~vi = α1~v1 + α2~v2 + . . . + αk~vk i=1 mit den Koezienten αi ∈ R heit Linearkombination der ~vi . Die Menge alle Linearkombinationen der ~vi Lin (~v1 , ~v2 , . . . , ~vk ) := heit lineare Definition Hülle der ~vi . ( k X ) αi~vi ; αi ∈ R, 1 ≤ i ≤ k , i=1 3.3. Endlich viele Vektoren ~v1 , ~v2 , . . . , ~vk des Vektorraumes heien linear abhängig, wenn es Zahlen nicht alle gleich Null sind, so dass gilt V α1 , α2 , . . . , αk ∈ R gibt, die α1~v1 + α2~v2 + . . . + αk~vk = ~0. Die Vektoren ~v1 , ~v2 , . . . , ~vk heien linear unabhängig, wenn aus α1~v1 + α2~v2 + . . . + αk~vk = ~0 ⇒ α1 = α2 = . . . = αk = 0. Um die Vektoren auf lineare Unabhangigkeit bzw. lineare Abhangigkeit zu prufen, betrachtet man die Gleichung (mit noch unbekannten xi ∈ R und ~x = (x1 x2 . . . xk )T als einen Spaltenvektor) x1~v1 + x2~v2 + . . . + xk~vk = ~0 ⇐⇒ (~v1 ~v2 ... ~vk )~x = ~0. (1) ~v1 , ~v2 , . . . , ~vk ∈ V sind linear abhangig ⇐⇒ die Gleichung eine Losung x1 = α1 , x2 = α2 , . . . , xk = αk mit wenigstens einem αi 6= 0 besitzt. (2) ~v1 , ~v2 , . . . , ~vk ∈ V sind linear unabhangig ⇐⇒ die Gleichung nur die Losung x1 = x2 = . . . = xk = 0 besitzt. Beispiel 3.4. Liegen die Vektoren 1 2 1 ~v1 = 1 , ~v2 = 1 , ~v3 = 2 1 3 0 in einer Ebene? (Oder anders gefragt, spannen diese 3 Vektoren ein 3D-Korper auf? Wie gro ist das Volumen? Ob ein 3D-Korper aufgespannt wird konnen wir sofort ermitteln, der Frage wie gro des Volumen ist, widmen wir uns spater. Sind die 3 Vektoren namlich linear unabhangig, so spannen sie ein Parallelepiped auf, wenn sie dagegen linear 3. VEKTORRAUME 70 abhangig sind, liegen sie in einer Ebene und es wird kein 3D-Korper aufgespannt. Wir mussen also das Gleichungssystem a1 + 2a2 + a3 1 2 1 a1 a1~v1 + a2~v2 + a3~v3 = a1 + a2 + 2a3 = 1 1 2 a2 = ~0 a2 + 3a3 0 1 3 a3 losen. Ist die einzige Losung, die es gibt die triviale Losung a1 = a2 = a3 = 0, so sind die Vektoren linear unabhangig. Da das Gleichungssystem genau dann nur die triviale Losung besitzt, wenn es eindeutig losbar ist, so genugt es die Determinante zu bestimmen: det (~v1 1 2 1 ~v3 ) = 1 1 2 0 1 3 ~v2 = 3 + 0 + 1 − 0 − 2 − 6 =6= 0, d.h. das Gleichungssystem ist eindeutig losbar, also ist a1 = a2 einzige Losung und folglich sind die Vektoren linear unabhangig. = a3 = 0 z 3 2 y 1 2 1 x 1 Definition 2 3.4. Ein System (~v1 , ~v2 , . . . , ~vn ) von Vektoren aus V ist eine des (reellen) Vektorraumes V, wenn gilt B.1: Die Vektoren (~v1 , ~v2 , . . . , ~vn ) sind linear unabh angig. B.2: Die Vektoren (~v1 , ~v2 , . . . , ~vn ) erzeugen V, d.h. Basis Lin (~v1 , ~v2 , . . . , ~vn ). Die Bedeutung einer Basis ergibt sich aus folgender Eigenschaft: V = die 1. ALLGEMEINE VEKTORRAUME Satz 71 3.1. Ist (~v1 , ~v2 , . . . , ~vn ) eine Basis von V, dann gibt es zu jedem Vektor ~a ∈ V eindeutig bestimmte reelle Zahlen α1 , α2 , . . . , αn , mit ~a = α1~v1 + α2~v2 + . . . + αn~vn . Ferner sind je m Vektoren aus V linear abhangig, falls m > n. Beweis: Nachweis der Eindeutigkeit der Darstellung: Es gelte ~a = n X αi~vi = i=1 dann ist n X βi~vi i=1 n X (αi − βi )~vi = ~0. i=1 Da die ~vi , 1 ≤ i ≤ n, linear unabhangig sind, folgt daraus, dass fur alle i = 1, 2, . . . , n. αi − βi = 0 ⇐⇒ αi = βi , Wir betrachten m Vektoren w~ 1 , . . . , w~ m aus V mit m > n. Da die (~v1 , ~v2 , . . . , ~vn ) eine Basis von V sind, lassen sich alle w~ 1 , . . . , w~ m als Linearkombination der Basis darstellen: n w ~j = X αij ~vi , 1 ≤ j ≤ m. i=1 Uberpr ufen wir nun die lineare Abhangigkeit/Unabhangigkeit durch die entsprechende Linearkombination λ1 w ~ 1 + . . . + λm w ~ m = (α11 λ1 + . . . α1m λm )~v1 + . . . + (αn1 λ1 + . . . αnm λm )~vn = ~0. Die Vektoren w~ 1 , . . . , w~ m sind linear abhangig, wenn es mindestens ein von Null verschiedenes λigibt, sodass die Gleichung erfullt ist. D.h. wir suchen eine nichttriviale λ1 λ2 des GS A~λ = ~0 mit der n × m-Matrix A = (αij )n×m . Wegen .. . λm m > n ist dies aber stets moglich, da das Gleichungssystem m − n freie Parameter besitzt. Also sind die Vektoren w~ 1 , . . . , w~ m aus V mit m > n linear abhangig. # ~ Losung λ = Beispiel 3.5. V = R2 , ~v1 = 1 0 ! und ~v2 = 0 3 ! sind eine Basis des dagegen sind ~v1 , ~v2 , ~v1 + ~v2 keine Basis des R2 . Allgemein ist die naturliche Basis ~e1 , ~e2 , . . . , ~en des Rn ist eine Basis. R2 , 3. VEKTORRAUME 72 1 2 Beispiel 3.6. Wir hatten gesehen, dass die Vektoren ~ v1 = 1 , ~v2 = 1 0 1 1 und ~v3 = 2 linear unabhangig sind. Bilden sie aber auch eine Basis des 3 x1 R3 ? Wir m ussen also noch uberprufen ob sich jeder Vektor ~x = x2 ∈ R3 x3 als Linearkombination von ~v1 , ~v2 und ~v3 darstellen lasst. Ist so eine Darstellung moglich, so gilt x1 1 2 1 1 2 1 xv1 x2 = xv1 1 + xv2 1 + xv3 2 = 1 1 2 xv2 , x3 0 1 3 0 1 3 xv3 xv1 d.h. wir haben ein inhomogenes Gleichungssystem mit den Unbekannten xv2 xv3 x1 osen. Diese Losung ist aber eindeutig beund der rechten Seite x2 zu l x3 1 2 1 stimmt, da die Determinante 1 1 2 6= 0 ist. Folglich bilden die Vektoren 0 1 3 3 ~v1 , ~v2 , ~v3 eine Basis des R . Beispiel 3.7. Man zeige, dass die Vektoren 1 ~v1 := 0 , 1 0 ~v2 := 1 , 1 0 ~v3 := 0 1 eine Basis des R3 bilden. Die Vektoren sind linear unabhangig, da aus 1 0 0 1 0 0 α1 α1~v1 + α2~v2 + α3~v3 = α1 0 + α2 1 + α3 0 = 0 1 0 α2 = 1 1 1 1 1 3 α3 α1 0 = α2 = 0 α1 + α2 + α3 0 1. ALLGEMEINE VEKTORRAUME 73 folgt, dass α1 = α2 = 0 ist und damit auch α3 = 0 sein muss. Wir zeigen nun, dass sich jeder Vektor ~x ∈ R3 als Linearkombination von ~v1 , ~v2 , ~v3 darstellen l asst. Dazu machen wir den Ansatz x1 1 0 0 x2 = c1~v1 + c2~v2 + c3~v3 = c1 0 + c2 1 + c3 0 = x3 1 1 1 1 0 0 c1 c1 = 0 1 0 c2 = c2 1 1 3 c3 c1 + c2 + c3 D.h. x1 = c1 , x2 = c2 Definition und x3 = c1 + c2 + c3 = x1 + x2 + c3 ⇐⇒ c3 = x3 − x2 − x1 . 3.5. Ein Vektorraum V heit endlichdimensional oder end- lich erzeugt, wenn es endlich viele Vektoren w~ 1 , . . . , w~ r gibt mit V = Lin (w ~ 1, . . . , w ~ r ). Satz 3.2. Jeder endlich erzeugte Vektorraum V 6= ~0 besitzt eine (endli- che) Basis (~v1 , . . . , ~vn ). Ist (w~ 1 , . . . , w~ m ) ebenfalls eine Basis von V, dann gilt m = n. Die gemeinsame Anzahl der Basisvektoren heit Dimension von V (Dim V ). Per Denition ist Dim {~0} = 0. Beispiel ~e1 = 3.8. Der Vektorraum Rn hat die Dimension n. Die Vektoren 1, 0, . . . 0 T , ~e2 = 0, 1, . . . 0 T , . . . , ~en = 0, 0, . . . 1 T bilden eine Basis des Rn . Definition 3.6. Eine nichtleere Teilmenge U ⊆ V heit Unterraum (oder auch linearer Teilraum) von V, wenn mit je zwei Elementen ~u, ~v ∈ U auch deren Summe ~u + ~v in U liegt und f ur jedes λ ∈ R das skalare Vielfache λ~u ebenfalls in U liegt. Bemerkung 3.1. Ein Vektorraum induziert in den Unterraum die Addition und skalare Multiplikation und damit ist der Unterraum selbst ein Vektorraum. 3. VEKTORRAUME 74 ("Der Unterraum U "erbt\ vom Vektorraum V die Addition und skalare Multiplikation.\) ~ Beispiel 3.9. Jeder Vektorraum besitzt die "trivialen\ Unterraume U = {0} (Nullraum) und U = V. Beispiel 3.10. U1 := x1 , x 2 , x 3 , x 4 ist ein Unterraumvon R4 . aber U2 := ist kein x1 , x 2 , x 3 , x 4 , Unterraum von R4 ! T ∈ R ; 2x1 + 3x2 + x4 = 0 T ∈ R ; 2x1 + 3x2 + x4 = 1 4 4 Das liegt daran, dass ~0 6∈ U2 gilt! Wo treten Unterraume auf? Beispiel 3.11. Computergraphik. Die dreidimensionale reale Welt bzw. nur ein Ausschnitt davon, wird auf einem zweidimensionalen Bildschirm dargestellt. Dazu wird das 3D-Objekt geeignet in einen zweidimensionalen Unterraum projiziert. Wie man diese Projektion berechnet, damit befassen wir uns spater. Beispiel 3.12. Ein spurgebundenes Fahrzeug (Eisenbahn, Straenbahn, Transrapid, ... ) ubt momentan eine Antriebskraft vom Betrag 4 aus und bewegt sich √ 1√ √ 1 1 dabei auf Schienen, die in Richtung ( 4 √2, 4 2,√− 2 √3) verlegt sind. Zusatzlich wirkt auf das Fahrzeug die Windkraft ( 34 2, − 54 2, 12 3). Wie gro ist die Gesamtkraft in Fahrtrichtung? Wie gro ist die vom Wind erzeugte Querkraft auf die Schiene (die Kraft, die senkrecht zur Schiene wirkt)? In dieser Aufgabe ist die Fahrtrichtung ein eindimensionaler Unterraum des R3 , die Querkraft wirkt in einem zweidimensionalen Unterraum, der orthogonal (senkrecht) zum Unterraum der Fahrtrichtung ist. Auf die Losung dieser Aufgabe gehen wir auch spater ein. 2. RANG EINER MATRIX 75 2. Rang einer Matrix Definition 3.7. Es sei A eine m × n-Matrix mit den Zeilen ~z1 , . . . , ~zm , und den Spalten ~a1 , ~a2 , . . . , ~an . Dann nennt man Lin (~z1 , . . . , ~zm ) = den Zeilenraum von A und Lin (~a1 , . . . , ~an ) = den Spaltenraum von A. Satz ( m X ) λi~zi ; λi ∈ R i=1 ( m X ) λi~ai ; λi ∈ R i=1 3.3. Der Zeilenraum und der Spaltenraum einer Matrix haben die gleiche Dimension. ohne Beweis 3.8. Die Dimension des Spaltenraumes bzw. Zeilenraumes der Matrix A heit Rang der Matrix A (rang A). Definition Es ergeben sich folgende Aussagen uber quadratische Matrizen bzw. Gleichungssysteme: Satz lent: 3.4. Es A eine n × n-Matrix. Die folgenden Aussagen sind aquiva- (1) A ist invertierbar. (2) det A 6= 0. (3) Das Gleichungssystem A~x = ~b besitzt eine eindeutig bestimmte Losung. (4) rang A = n. Beweis: A ist invertierbar. ⇔ det A 6= 0 ⇔ Das Gleichungssystem A~x = ~b besitzt eine eindeutig bestimmte Losung. 3. VEKTORRAUME 76 A ist invertierbar. ⇔ Spalten von A sind linear unabhangig. ⇔ rang A = n. Satz # 3.5. Rangkriterium. Wir betrachten ein Gleichungssystem mit n Unbekannten und m Gleichungen. Dann gilt: (1) Wenn die erweiterte Koezientenmatrix (A|~b) und die Koezientenmatrix A den gleichen Rang r haben und r = n ist, dann hat das Gleichungssystem eine eindeutig bestimmte Losung. (2) Wenn die erweiterte Koezientenmatrix (A|~b) und die Koezientenmatrix A den gleichen Rang r haben und r < n ist, dann hat das Gleichungssystem unendlich viele Losungen (und die Losung besitzt n − r freie Parameter). (3) Wenn die erweiterte Koezientenmatrix (A|~b) und die Koezientenmatrix A nicht den gleichen Rang haben, dann besitzt das Gleichungssystem keine Losung. Das Gleichungssystem kann geschrieben werden als a11 x1 + . . . + a1n xn .. . = b1 am1 x1 + . . . + amn xn = bn ⇐⇒ x1 a11 a1n b1 . . .. . + . . . + xn .. = .. am1 amn bn bzw. x1~a1 + . . . xn~an mit den Spaltenvektoren ~a1 , . . . , ~an . Die folgenden Falle konnen auftreten: (1) Sind der Rang der Koezientenmatrix und der erweiterten Koezientenmatrix gleich, so muss der Vektor ~b als Linearkombination der Spaltenvektoren darstellbar sein. Da der Rang der Koezientenmatrix gleich n ist, sind die Spaltenvektoren linear unabhangig und bilden deshalb eine Basis des Spaltenraumes. Deshalb hat das Gleichungssystem eine Losung und diese ist eindeutig bestimmt. (2) Sind der Rang der Koezientenmatrix und der erweiterten Koezientenmatrix gleich, so muss der Vektor ~b als Linearkombination der Spaltenvektoren darstellbar sein. Da der Rang der Koezientenmatrix kleiner als n ist, sind die Spaltenvektoren linear abhangig und es gibt mehr als eine Linearkombination der Spaltenvektoren, die gleich dem Vektor ~b ist. Deshalb ist die Losung nicht eindeutig. (3) Sind der Rang der Koezientenmatrix und der erweiterten Koezientenmatrix nicht gleich, so lasst sich der Vektor ~b nicht als Linearkombination der Vektoren ~a1 , . . . , ~an darstellen. Das Gleichungssystem ist nicht losbar. 2. RANG EINER MATRIX 77 Wird eine m×n-Matrix nach dem Gauss-(Jordan-)Verfahren mit elementaren Zeilenumformungen in eine Matrix M umgewandelt und in analoger Weise mit Spaltenumformungen (mit den Spalten von links nach rechts) in eine Matrix N umgewandelt, dann bilden die von Null verschiedenen Zeilen von M (bzw. Spalten von N ) eine Basis des Zeilenraumes von A (bzw. eine Basis des Spaltenraumes). 1 0 0 0 0 0 0 ∗ 1 0 0 0 0 0 ∗ ∗ 1 0 0 0 0 ∗ ∗ ∗ 1 0 0 0 ∗ ∗ ∗ ∗ 0 0 0 ∗ ∗ ∗ ∗ 0 0 0 ∗ ∗ ∗ ∗ 1 0 0 ∗ ∗ ∗ ∗ ∗ 0 0 ) r , m−r 1 ∗ ∗ ∗ ∗ ∗ ∗ | 0 1 ∗ ∗ ∗ ∗ ∗ 0 0 1 ∗ ∗ ∗ ∗ {z p 0 0 0 1 ∗ ∗ ∗ 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 } | {z } n−p Es gilt: r = Dimension des Zeilenraumes von A = Maximalzahl der linear unabhangigen Zeilen von A, p = Dimension des Spaltenraumes von A = Maximalzahl der linear unabhangigen Spalten von A. Auerdem ist r = p, da der Spaltenrang gleich dem Zeilenrang ist. Beispiel 3.13. Wir betrachten das Gleichungssystem x 1 + x 2 + x 3 = b1 , x 1 − x 2 − x 3 = b2 , x1 + 3x2 + 3x3 = b3 , fur 3 ~b1 = 4 1 und 3 ~b2 = 4 . 2 Wir bestimmen zunachst den Rang der Koezientenmatrix 1 1 1 ≈ rang A = rang 1 −1 −1 ~z1 + ~z3 1 3 3 1 1 1 ≈ ≈ rang 2 0 0 1 (−1) · ~z1 + ~z3 ~z1 − 2 ~z2 − 12 ~z3 0 2 2 1 1 1 rang 2 0 0 1 3 3 0 0 0 rang 2 0 0 0 2 2 . 3. VEKTORRAUME 78 Der Rang der Koezientenmatrix ist 2. Wir berechnen den Rang der erweiterten Koezientenmatrix 1 1 1 ~ rang (A|b1 ) = rang 1 −1 −1 1 3 3 1 1 1 3 ≈ rang 2 0 0 7 (−1) · ~z1 + ~z3 0 2 2 −2 0 0 0 1 ≈ rang 2 0 0 7 2 · ~z1 0 2 2 −2 3 4 1 ≈ ~z1 + ~z2 ≈ ~z1 − 1 ~z 2 2 − 1 ~z 2 3 ≈ (−7) · ~z1 + ~z2 2 · ~z1 + ~z3 1 1 1 3 rang 2 0 0 7 1 3 3 1 0 0 0 12 rang 2 0 0 7 0 2 2 −2 0 0 0 1 rang 2 0 0 0 0 2 2 0 Folglich ist der Rang der erweiterten Koezientenmatrix (A|~b1 ) gleich 3 und damit ungleich zum Rang der Koezientenmatrix. Folglich besitzt das Gleichungssystem keine Losung. Durch vollig analoge Umformungen erhalt man fur die erweiterte Koezientenmatrix 1 1 1 3 rang (A|~b2 ) = rang 1 −1 −1 4 ≈ 1 3 3 2 ... 0 0 0 0 ≈ rang 2 0 0 7 0 2 2 −1 Somit ist der Rang dieser erweiterten Koezientenmatrix gleich dem Rang der Koezientenmatrix. Da der Rang gleich 2 und damit um 1 kleiner als die Anzahl der Unbekannten ist, tritt in der Losung ein freier Parameter auf. Losung ist: x1 0 7 1 x2 = −1 + t −1 . 2 x3 0 1 3. Lineare Optimierung – Simplex-Algorithmus Wir beginnen mit einem Beispiel. Ein Investmentfond hat ein Kapital von 20 Millionen Euro zur Verfugung, das auf staatliche Pfandbriefe, festverzinsliche Wertpapiere und Aktien verteilt werden soll. Dabei muss folgendes beachtet werden: • Mindestens die Halfte des Kapitals muss in staatlichen Pfandbriefen oder festverzinslichen Wertpapieren angelegt werden. • Das Kapital, das in festverzinslichen Wertpapieren angelegt ist, darf hochstens doppelt so hoch sein, wie das Kapital, das in staatlichen Pfandbriefen angelegt ist. 3. LINEARE OPTIMIERUNG { SIMPLEX-ALGORITHMUS 79 Mathematische Formulierung der Aufgabe: Sei x1 das Kapital, das in Pfandbriefen, x2 das Kapital, das in festverzinslichen Wertpapieren und x3 das Kapital, das in Aktien angelegt wird. Es sollen 20 Millionen Euro angelegt werden, d.h. (7) x1 + x2 + x3 = 20. Da nur nichtnegative Geldbetrage angelegt werden konnen, muss x1 ≥ 0, x2 ≥ 0 und x3 ≥ 0 gelten. Andererseits kann mit Hilfe der Gleichung (8) eine Unbekannte, z.B. x3 durch die anderen beiden Unbekannten ausgedr uckt werden. Damit erhalten wir insgesamt die Bedingungen: x1 ≥ 0, x2 ≥ 0, x3 = 20 − x1 − x2 ≥ 0. Aus den zusatzlichen Bedingungen ergeben sich folgende Beziehungen. Mindestens die Halfte des Kapitals muss in Pfandbriefen oder festverzinslichen Wertpapieren angelegt werden, d.h. x1 + x2 ≥ 10. Auerdem darf der in festverzinslichen Wertpapieren angelegte Geldbetrag hochstens gleich dem doppelten des Geldbetrags sein, der in Pfandbriefen angelegt wird, d.h. x2 ≤ 2x1 . Es sind somit x1 und x2 so zu bestimmen, dass die folgenden Ungleichungen erfullt sind: x1 ≥ 0, x2 ≥ 0, x1 + x2 − 20 ≤ 0, −x1 − x2 ≤ 10, −2x1 + x2 ≤ 0. Definition 3.9. Ein System von linearen Ungleichungen mit reellen Koezienten aij und bi hat die Form: A~x ≤ ~b ⇐⇒ a11 x1 + . . . + a1n xn a21 x1 + . . . + a2n xn .. . ≤ ≤ b1 b2 .. . am1 x1 + . . . + amn xn ≤ bm . Ein Punkt (x1 , . . . , xn ) ∈ Rn , der alle Ungleichungen erf ullt, heit zulässiger Punkt. Die Menge aller zul assigen Punkte wird als zulässiger Bereich bezeichnet. 3. VEKTORRAUME 80 In unserem Beispiel ist der zulassige Bereich die Menge M := {(x1 , x2 ) ∈ R2 : −x1 ≤ 0, −x2 ≤ 0, x1 +x2 −20 ≤ 0, −x1 −x2 ≤ −10, −2x1 +x2 ≤ 0}. 25 y 24 23 22 21 20 x2=20-x1 19 18 x2=2x1 17 16 15 14 13 12 11 10 x2=10-x1 9 8 7 6 M 5 4 3 2 x2=0 1 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 x 24 25 −1 Er wird begrenzt von den Geraden x2 = 0, x2 = 20 − x1 , x2 = 10 − x1 , x2 = 2x1 . (Die Ungleichung x1 ≥ 0 ist automatisch erfullt, wenn alle anderen Ungleichungen erfullt sind, sie ist hier also redundant.) Der Wert fur x3 berechnet sich aus x3 = 20 − x2 − x1 . Bemerkung 3.2. In der Regel gilt fur die Veranderlichen x1 ≥ 0, . . . xn ≥ 0 und die zusatzlichen Bedingungen (=Nebenbedinungen) erscheinen in Ungleichungsform mit "kleiner gleich Null\. Man kann naturlich alle Bedingungen mit "kleiner gleich Null\ schreiben. Definition 3.10. Ein lineares Optimierungsproblem (LOP) besteht darin aus dem zulassigen Bereich eines linearen Ungleichungssystems einen Punkt (x∗1 , x∗2 , . . . , x∗n ) zu nden, fur den eine gegebene Funktion (Zielfunktion) f : Rn → R, f (x1 , x2 , . . . , xn ) = c1 x1 + c2 x2 + . . . + cn xn + d, mit c1 , c2 , . . . , cN , d ∈ R, ihr Maximum oder Minimum annimmt. Der Punkt (x∗1 , x∗2 , . . . , x∗n ) wird optimaler Punkt oder auch optimale Lösung genannt. Wie ndet man diese Minima bzw. Maxima? 3. LINEARE OPTIMIERUNG { SIMPLEX-ALGORITHMUS Satz 81 3.6. Ist der zulassige Bereich M eines linearen Optimierungspro- blems nichtleer und beschrankt, dann nimmt die Zielfunktion ihr Maximum oder Minimum in einem Eckpunkt von M an. Um das auszuprobieren benotigen wir eine Zielfunktion. Fur den Investmentfond sei der zu erwartende Gewinn bei staatlichen Pfandbriefen 5% bei festverzinslichen Wertpapieren 6% und in Aktien bei 9%. Bei welcher Aufteilung, unter Berucksichtigung der ubrigen Bedingungen, kann der zu erwartende Gewinn maximiert werden? Die Zielfunktion lautet also: f (x1 , x2 ) = 0, 05x1 + 0, 06x2 + (20 − x1 − x2 )0, 09 = 1, 8 − 0, 04x1 − 0, 03x2 . Definition 3.11. Eine Menge M ⊂ Rn heit beschränkt, wenn es eine Konstante C gibt mit v u n q uX 2 2 2 |x| = x1 + x2 + . . . + xn = t x2i ≤ C fur alle x ∈ M. i=1 In unserem Beispiel ist der zulassige Bereich M oensichtlich beschrankt. Betrachten wir deshalb die Werte der Zielfunktion in den Eckpunkten: 10 20 x1 20 10 3 3 20 40 x2 0 0 3 3 f (x1 , x2 ) 1, 46 1, 13 1 1, 4 Der maximale Gewinn wird also fur x1 = 103 , x2 = 203 und x3 = 20 − x1 − x2 = 10 erreicht. Man muss also alle Ecken\ untersuchen. Was ist eine Ecke\? " " Definition 3.12. Ein zulassiger Punkt, bei dem in n Ungleichungen Gleichheit auftritt, so dass die Koezientenmatrix dieser n Gleichungen den Rang n hat, heit Eckpunkt des zulassigen Bereichs M. Anschaulich gesprochen heit das, dass ein Eckpunkt auf dem Rand des zulassigen Bereichs liegt (Gleichheit!) und die volle Dimension\, es wird ein n-dimensionaler " " Korper aufgespannt\. 3. VEKTORRAUME 82 Der Simplex-Algorithmus besteht nun darin mit einer zulassigen Ecke zu starten und dann zu weiteren zulassigen Ecken zugelangen wobei der Wert der Zeilfunktion jedesmal verbessert wird. 3.1. Simplex-Algorithmus. 1. Schritt: Das Ungleichungssystem wird das Einf uhren sogenannter Schlupfvaria- blen (engl.: slack variables) in ein Gleichungssystem uberfuhrt. Die Idee dahinter ist, wenn z.B. gilt x1 + x2 ≤ 20, so gibt es ein (unbekanntes) u mit x1 + x2 + u = 20. In unserem Beispiel bedeutet das, dass wir 3 Schlupfvariable u, v, w einfuhren mussen, die auerdem alle nichtnegativ sein mussen. 3.3. Deshalb ist es sinnvoll die Nebenbedinungen mit kleiner " gleich Null\ zu schreiben, da dann die Gleichung durch die Addition nichtnegativer Schlupfvariabler erhalten wird, wir haben also, dass alle Variablen gr oer gleich Null sein sollen. Bemerkung Wir haben folglich das Gleichungssystem x1 + x2 + u = 20, −x1 − x2 + v = −10, −2x1 + x2 + w = 0 mit den Zusatzbedinungen x1 ≥ 0, x2 ≥ 0, x3 ≥ 0, u ≥ 0, v ≥ 0, w ≥ 0. Auerdem schreiben wir die Zielfunktion ebenfalls als Gleichung, d.h. mit einer weiteren Variablen z, z = 180 − 4x1 − 3x2 . (Wir haben hier die Zielfunktion mit 100 durchmultipliziert, um hassliche\ Kommas " zu vermeiden.) Nun bilden wir aus allen diesen Gleichungen das Simplextableau: 1 1 1 0 −1 −1 0 1 −2 1 0 0 4 3 0 0 0 0 1 0 0 20 0 −10 0 0 1 180 Wir mussen eine Ecke des zulassigen Bereichs als Startecke auswahlen. Die Variable z kommt nur in der Zielfunktion vor und wird deshalb nicht mit betrachtet. Die ubrigen Veranderlichen x1 , x2 , u, v, w ergeben ein 3 × 5 Schema, so dass der Rang der Zeilen bzw. Spalten nie groer als 3 sein kann. Zulassige Ecken ergeben sich also dann, wenn wir 2 Veranderliche gleich Null setzen und die eindeutig bestimmte Losung (Rang gleich 3!) fur die ubrigen Variablen nichtnegativ ist. 3. LINEARE OPTIMIERUNG { SIMPLEX-ALGORITHMUS 83 Wir versuchen es mit x1 = x2 = 0. Die Betrachtung des zulassigen Bereichs sagt uns, dass das keine zulassige Ecke ist und die Rechnung bestatigt es, 1 0 0 20 0 1 0 −10 , 0 0 1 0 die Losung ist u = 20, v = −10, w = 0. Mit x2 = 0 und v = 0 erhalten wir dagegen eine zulassige Ecke, das kann man im gesamten Simplextableau mittels GauAlgorithmus wie folgt erhalten: 1 1 −1 −1 −2 1 4 3 1 0 0 0 1 0 0 0 1 1 0 1 3 2 −1 −4 1 0 0 0 1 0 3 −1 0 1 0 0 0 1 0 0 0 0 1 0 0 20 0 −10 0 0 1 180 0 1 0 0 0 0 1 0 0 20 0 10 0 40 1 100 −1 1 −2 4 0 0 1 0 0 10 0 10 0 20 1 140 Die blauen Zahlen interessieren nicht, da sie zur Zielfunktion gehoren, die roten Zahlen interessieren nicht, da x2 = v = 0 gesetzt wurde. Man liest aus dem letzten Schema ab, dass die Ecke (x1 , x2 , u, v, w) = (10, 0, 10, 0, 20) eine zulassige Ecke ist. Der Wert der Zielfunktion fur diese Ecke ist 140. 2. Schritt: Wir suchen eine benachbarte Ecke, f ur die der Wert der Zielfunktion groer als der Wert in der ermittelten Ecke ist. Nehmen wir v hinzu (wird also als nichtnegativ und ungleich Null angenommen), so verkleinert sich der Wert der Zielfunktion wegen z = 140 + x2 − 4v. Das geht also nicht. Der Wert der Zielfunktion vergroert sich aber, wenn wir x2 vergroern! Also nehmen wir x2 dazu. Welche der Variablen x1 , u, w soll nun Null gesetzt werden? Dazu betrachten wir die Quotienten der Zahlen der rechten Spalte mit den entsprechenden Zahlen in der 2. Spalte, wir halten: 10 = ∞, 0 10 = 10, 1 20 = 6, 6. 3 Die kleinste dieser Zahlen ist 203 und wir wahlen deshalb die dritte Zeile, setzen also w = 0. (Hatten mehrere Quotienten denselben kleinsten Wert, so konnen wir uns eine Zeile bzw. Variable davon aussuchen.) Warum das eine gute Wahl ist, ist nicht so oensichtlich, bedeutet aber wie man uberprufen kann, dass wir wieder eine 3. VEKTORRAUME 84 zulassige Ecke erhalten. Um x1 , x2 , u bequem ablesen zu konnen benutzen wir wieder den Gau-Algorithmus: 1 1 0 0 0 3 0 −1 0 −1 1 1 0 −2 0 4 1 0 0 0 0 1 0 0 0 0 1 0 0 0 1 0 0 10 0 10 0 20 1 140 −1 3 −1 3 1 0 −2 3 10 3 1 3 1 3 10 3 0 0 0 1 10 20 3 440 3 (Die blaue Spalte interessiert nicht, da sie zur Zielfunktion gehort, die roten Spalten interessieren nicht, da die dazugehorigen Variablen gleich Null gesetzt sind.) Da in der letzten Zeile nur nichtnegative Zahlen stehen, konnen wir den Wert der Zielfunktion nicht mehr vergroern und sind im Maximum angekommen, d.h. fur (x1 , x2 , u) = , 20 , 10) ist z = 440 der maximale Wert der Zielfunktion. ( 10 3 3 3 Bemerkung 3.4. Wie man sieht haben sich die Zahlen in der zur Zielfunktion gehorenden Spalte nie verandert, deshalb lasst man diese Spalte (also die blaue Spalte) einfach weg. 25 y 24 23 22 21 20 f x 1, x 2=1,8−0,04 x1−0,03 x 2 c=0,8 19 c=1,8−0,04 x 1−0,03 x 2 18 17 16 (Niveaulinien) 15 14 13 für c=0,8; 1,3; 1,4; 1,468; 1,45; 1,5. 12 11 10 9 8 7 6 M 5 4 3 c=1,5 2 1 x 1 −1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 3. LINEARE OPTIMIERUNG { SIMPLEX-ALGORITHMUS 85 Allgemein gilt: Definition 3.13. Ein lineare Optimierungsproblem ist in Normalform, wenn die Funktion d, c1 , c2 , . . . , cn ∈ R, f (x1 , x2 , . . . , xn ) = c1 x1 + c2 x2 + . . . cn xn + d, und den m(< n) Nebenbedingungen ≤ b1 , ≤ b2 , a11 x1 + . . . + a1n xn a21 x1 + . . . + a2n xn .. . .. . am1 x1 + . . . + amn xn ≤ bm , und x1 ≥ 0, x2 ≥ 0, . . . xn ≥ 0 zu maximieren ist. Bemerkung 3.5. Die Eckpunkte des zulassigen Bereichs sind genau die zulassi- gen Losungen des Gleichungssystems, fur die mindestens n − m Variable verschwinden. Bemerkung 3.6. Die Funktion f nimmt genau dann ihr Maximum an, wenn die Funktion −f ihr Minimum annimmt und umgekehrt. Soll ein Minimierungsproblem fur die Funktion f gelost werden, so ist das aquivalent zur Maximierung von −f. Definition heit 3.14. Fur ein lineares Optimierungsproblem in Normalform a11 a21 .. . das zugehorige Definition a12 a22 .. . . . . a1n . . . a2n .. . b1 b2 .. . am1 am2 . . . amn bm −c1 −c2 . . . −cn d Simplextableau. 3.15. Eine Ecke ist durch das Verschwinden von mindestens Variablen charakterisiert. Das Simplextableau ist nach diesen Variablen aufgelöst, falls die ubrigen Spalten (bis auf die Reihenfolge) die Spalten der m × m Einheitsmatrix ergeben. n−m 3. VEKTORRAUME 86 Bemerkung 3.7. Ist das Simplextableau nach einer Ecke aufgelost, so ist die Ecke genau dann zulassig, wenn die Eintrage der letzten Spalte alle nichtnegativ sind. Bemerkung b1 , b2 , . . . , bm 3.8. In vielen Fallen erhalt man fur x1 = x2 = . . . = xm = 0 eine zulassige Startecke. Ist das nicht der Fall (wie in unserem Beispiel) so gibt es Algorithmen wie man zu einer zulassigen Startecke kommt. Simplex-Algorithmus. Der Simplex-Algorithmus ndet das Maximum eines linearen Optimierungsproblems ausgehend von einer zulassigen Startecke. (1) Man stelle das Simplextableau auf, wahle eine zulassige Startecke und lose nach dieser Ecke auf. (2) Sind alle Eintrage in der letzten Zeile (bis auf den in der letzten Spalte) nichtnegativ, dann ist das Maximum gefunden, STOP. Ist dagegen mindestens einer dieser Eintrage negativ, so gehe man zu Schritt 3). (3) Wahl der Pivot-Spalte: Wahle eine Spalte k (1 ≤ k ≤ n) mit kleinstem negativen Element (negatives Element mit dem groten Betrag) in der letzten Zeile. Weiter zu Schritt 4) (4) Wahl der Pivot-Zeile: Fur jeden positiven Eintrag in der Pivotspalte s bilde man den Quotienten absjj (1 ≤ j ≤ m). (Sind alle Elemente der Pivotspalte negativ, so ist der zulassige Bereich unbeschrankt: STOP.) Wahle eine Zeile z mit minimalem Quotienten. Das zugehorige Element azs ist das Pivot-Element. Weiter mit Schritt 5) (5) Austauschschritt: Raume durch elementare Zeilenumformungen (Gau-Algorithmus) die Pivot-Spalte aus, so dass in der Pivotzeile eine 1 und sonst uberall Nullen stehen. Weiter mit Schritt 2). Bemerkung 3.9. Es kann theoretisch passieren, dass an einer zulassigen Ecke mehr als n − m Variablen verschwinden. Man spricht dann von einer ausgearteten Ecke. In diesem Fall kann es notwendig sein, dass man mehr als 2 Variablen austauschen muss, um zu einer zulassigen Ecke mit groerem Wert der Zielfunktion zu kommen. Fur die Praxis ist dieser Fall aber in der Regel vernachlassigbar. 3. LINEARE OPTIMIERUNG { SIMPLEX-ALGORITHMUS 87 3.2. Beispiele. 3.14. Unser Ausgangsbeispiel noch einmal, in geschlossenerer\ " Darstellung: Aufgabenstellung: Ein Investmentfond hat ein Kapital von 20 Millionen Euro zur Verfugung, das auf staatliche Pfandbriefe, festverzinsliche Wertpapiere und Aktien verteilt werden soll. Dabei muss folgendes beachtet werden: • Mindestens die H alfte des Kapitals muss in staatlichen Pfandbriefen oder festverzinslichen Wertpapieren angelegt werden. • Das Kapital, das in festverzinslichen Wertpapieren angelegt ist, darf hochstens doppelt so hoch sein, wie das Kapital, das in staatlichen Pfandbriefen angelegt ist. Es sollen 20 Millionen Euro angelegt werden, d.h. Beispiel x1 + x2 + x3 = 20. (8) Da nur nichtnegative Geldbetrage angelegt werden konnen, muss x1 ≥ 0, x2 ≥ 0 und x3 ≥ 0 gelten. Andererseits kann mit Hilfe der Gleichung (8) eine Unbekannte, z.B. x3 durch die anderen beiden Unbekannten ausgedruckt werden. Damit erhalten wir insgesamt die Bedingungen: x1 ≥ 0, x2 ≥ 0, x3 = 20 − x1 − x2 ≥ 0. Aus den zusatzlichen Bedingungen ergeben sich folgende Beziehungen. Mindestens die Halfte des Kapitals muss in Pfandbriefen oder festverzinslichen Wertpapieren angelegt werden, d.h. x1 + x2 ≥ 10. Auerdem darf der in festverzinslichen Wertpapieren angelegte Geldbetrag hochstens gleich dem doppelten des Geldbetrags sein, der in Pfandbriefen angelegt wird, d.h. x2 ≤ 2x1 . Es sind somit erfullt sind: x1 und x2 so zu bestimmen, dass die folgenden Ungleichungen x1 ≥ 0, x2 ≥ 0, x1 + x2 − 20 ≤ 0, −x1 − x2 ≤ 10, −2x1 + x2 ≤ 0. 3. VEKTORRAUME 88 Fur den Investmentfond sei der zu erwartende Gewinn bei staatlichen Pfandbriefen 5% bei festverzinslichen Wertpapieren 6% und in Aktien bei 9%. Bei welcher Aufteilung, unter Berucksichtigung der ubrigen Bedingungen, kann der zu erwartende Gewinn maximiert werden? Der zu erwartende Gewinn (in Millionen Euro) ist folglich 0, 05x1 + 0, 06x2 + (20 − x1 − x2 )0, 09 = 1, 8 − 0, 04x1 − 0, 03x2 . Es ist aber vollig zulassig diese Gleichung mit 100 durchzumultiplizieren, um die Zielfunktion f (x1 , x2 ) = 180 − 4x1 − 3x2 zu maximieren. (Dann ist f (x1 , x2 ) der zu erwartende Gewinn in Euro = 10000 Euro.) 1 100 Millionen Beispielaufgabe in mathematischer Form: Es sind x1 und x2 so zu bestimmen, dass fur die Variablen (=Veranderlichen) gilt x1 ≥ 0, x2 ≥ 0, sowie die Nebenbedingungen x1 + x2 ≤ 20, −x1 − x2 ≤ −10, −2x1 + x2 ≤ 0. erfullt sind, und die Zielfunktion f (x1 , x2 ) = 180 − 4x1 − 3x2 maximiert wird. Das ist ein lineares Optimierungsproblem in Normalform. Als nachstes mussen wir Schlupfvariable einfuhren und das dazugehorige Simplextableau aufstellen. Wir erhalten: Es ist f (x1 , x2 ) = 180 − 4x1 − 3x2 fur x1 ≥ 0, x2 ≥ 0, x3 ≥ 0, x4 ≥ 0, x5 ≥ 0, unter den Nebenbedingungen: x1 + x2 + x3 = 20, −x1 − x2 + x4 = −10, −2x1 + x2 + x5 = 0, 3. LINEARE OPTIMIERUNG { SIMPLEX-ALGORITHMUS 89 zu maximieren. Das dazugehorige Simplextableau lautet: 1 1 1 0 −1 −1 0 1 −2 1 0 0 4 3 0 0 0 20 0 −10 1 0 0 180 Wir haben 5 Veranderliche und 3 Gleichungen. Zulassige Ecken sind also solche Punkte (x1 , x2 , x3 , x4 , x5 ), fur die • x1 ≥ 0, x2 ≥ 0, x3 ≥ 0, x4 ≥ 0, x5 ≥ 0 gilt, • die L osung des Gleichungssystems sind, • und 5 − 3 = 2 Ver anderliche Null sind. Dass benutzen wir, um 2 Veranderliche Null zu setzen, dann das Gleichungssystem fur die verbleibenden 3 Veranderlichen mittels Gau-Algorithmus zu losen, und nachzuschauen, ob man eine zulassige Ecke (alle Veranderlichen groer gleich Null) erhalten hat. Setzen wir x1 = x2 = 0, 1 1 1 0 −1 −1 0 1 −2 1 0 0 4 3 0 0 0 20 0 −10 1 0 0 180 so liegt keine zulassige Ecke vor, da dann x3 = 20, x4 = −10 < 0 und x5 = 0 Losung des Gleichungssystems ist. Deshalb versuchen wir 2 andere Variable Null zu setzen, um eine zulassige Ecke zu erhalten. Wir setzen x2 = x4 = 0. 1 1 1 0 0 20 0 0 |1| 1 0 10 0 3 2 0 1 40 0 −1 −4 0 0 100 1. Zeile minus 2. Zeile 3. Zeile minus 2 mal 2. Zeile 4. Zeile plus 4 mal 2. Zeile In den verbleiben drei Spalten (fur x1 , x3 , x5 ) wird nun mittels Gau-Algorithmus eine 3 × 3 Einheitsmatrix erzeugt (es werden aber alle Zeilen und Spalten mitgenommen, also auch die Zeile fur die Zielfunktion und die Spalten fur x2 und x4 ). Schaut man sich die ersten 3 Zeilen an, so kann x3 aus der 2. Zeile berechnet werden. 3. VEKTORRAUME 90 Wir erhalten: 1 1 0 0 0 3 0 −1 0 −1 0 10 1 1 0 10 0 −2 1 20 0 4 0 140 Die Spalten fur x1 , x3 , x5 sind nun die Einheitsmatrix und wir lesen ab, dass (x1 , x2 , x3 , x4 , x5 ) = (10, 0, 10, 0, 20) eine zulassige Ecke ist, da Veranderliche Null sind. xi ≥ 0 fur i = 1, 2, . . . , 5 gilt und (mindestens) 2 Wir haben also eine zulassige Startecke gefunden und das Schema ist nach dieser Ecke aufgelost. Wir konnen mit dem Simplex-Algorithmus beginnen. Da in der letzten Zeile (Zeile fur die Zielfunktion) eine negative Zahl steht, suchen wir die minimale Zahl in dieser Zeile, dass ist −1 in der 2. Spalte, deshalb ist die 2. Spalte die Pivot-Spalte. Um die Pivot-Zeile zu nden, mussen wir die Quotienten aus bi und den positiven Elementen ai2 der Pivot-Spalte bilden. Der minimale Wert ist min {i=1,2,3; ai2 >0} 20 bi = ai2 3 fur a32 , deshalb ist die Pivot-Zeile die 3. Zeile und das Pivot-Element a32 = 3. 1 1 0 0 0 3 0 | − 1| 0 −1 0 10 1 1 0 10 0 −2 1 20 0 4 0 140 10 1 = 10 20 3 < 10 Pivotspalte enthalt eine Null Nun erfolgt der Austauschschritt, d.h. mit Hilfe des Gau-Algorithmus wir die Pivot-Spalte ausgeraumt: 1 1 0 −1 0 10 0 0 1 0 10 0 3 0 −2 1 20 0 −1 0 1 4 0 140 die 3. Zeile mal (− 13 ) wird zur 1. Zeile addiert, erzeugt 0 in Pivot-Spalte, diese Zeile bleibt unverandert, da uber dem Pivot-Element schon eine 0 steht, Pivot-Element, Pivot-Zeile, Division durch 3 dieser Zeile, macht Pivot-Element zu 1. 3. Zeile mal 31 zu dieser Zeile addiert, erzeugt 0 in der Pivot-Spalte 3. LINEARE OPTIMIERUNG { SIMPLEX-ALGORITHMUS 91 Ergebnis: 1 0 0 −1 3 −1 3 10 3 0 0 1 1 0 10 0 1 0 −2 3 1 3 20 3 0 0 0 10 3 1 3 440 3 Da in der letzten Zeile nur nichtnegative Zahlen stehen (vorm Strich), konnen wir den Wert der Zielfunktion nicht mehr vergroern und sind im Maximum angekommen, d.h. fur (x1 , x2 , x3 , x4 , x5 ) = ( 103 , 203 , 10, 0, 0) ist z = 440 der maxi3 male Wert der Zielfunktion. Ergebnis: Fur x1 = 103 (Millionen Euro) und x2 = 203 (Millionen Euro) wird der zu erwartende Gewinn maximal, namlich f (x1 , x2 ) = 440 (10000 Euro). 3 Bemerkung: Die Drittel fuhren auf unendliche Dezimalzahlen, z.B.: 103 = 3, 3. Die mathematisch exakte Losung ist also so nicht umsetzbar, aber fur z.B. x1 = 3, 34 Millionen Euro und x2 = 6, 66 Millionen Euro ergibt sich ein zu erwartender Gewinn von 1465600 Euro. Die Variante x1 = 3, 33 und x2 = 6, 67 ist wegen der Bedingung x2 ≤ 2x1 nicht zulassig. Beispiel 3.15. Minimieren Sie f (x1 , x2 ) = 10 − 3x1 − 4x2 unter den Nebenbedingungen x1 ≥ 0, x2 ≥ 0, x1 + 2x2 ≤ 20, −2x1 − x2 ≥ −28. Minimieren von f bedeutet maximieren von −f = 3x1 + 4x2 − 10. Nach Einfuhrung der Schlupfvariablen u und v lautet das Simplextableau: 1 2 1 0 20 2 1 0 1 28 −3 −4 0 0 −10 Oensichtlich ergibt x1 = x2 = 0 die zulassige Ecke (x1 , x2 , u, v) = (0, 0, 20, 28) mit dem Wert -10 fur die Zielfunktion. Wegen −4 < −3 ist die zweite Spalte die Pivot-Spalte und wegen 202 = 10 < 28 = 28 ist die erste Zeile die Pivot-Zeile und das Pivot-Element ist a12 = 2. 1 3. VEKTORRAUME 92 Anwenden des Gau-Algorithmus: 1 |2| 2 1 −3 −4 1 2 3 2 20 2 28 1 0 20 1 28 0 −10 1 2 −1 2 1 0 0 −1 1 0 0 0 1 0 2 = 10 = 28 10 18 30 Da es in der letzen Zeile noch einen negativen Wert gibt, muss ein weiterer Schritt ausgefuhrt werden. 1 1 2 3 2 0 1 2 −1 2 0 10 1 18 −1 0 2 0 30 10 1/2 18 3/2 = 20 = 12 1 23 − 13 4 0 − 13 32 12 2 0 53 42 3 0 1 0 Nun gibt es in der letzten Zeile keine negativen Eintrage mehr (vorm Strich) und somit wir das Maximum 42 der Zielfunktion fur x1 = 12 und x2 = 4 angenommen. Ergebnis: Die Funktion f (x1 , x2 ) = 10 − 3x1 − 4x2 nimmt in (x1 , x2 ) = (12, 4) ein Minimum von −42 an. 29 y 28 27 26 25 f x 1, x 2=3x 14x 2 −10 24 23 c=3x 14x 2−10 22 21 20 x2=10 - 0,5x1 19 (Niveaulinien) 18 17 16 für c=0; 10; 20; 30; 40; 42; 50 15 14 13 12 11 10 9 8 c=50 7 6 5 M 4 3 2 x2=28 - 2x1 1 −1 x 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 c=0 Beispiel 3.16. siehe: http://de.wikipedia.org/wiki/Simplex-Verfahren 3. LINEARE OPTIMIERUNG { SIMPLEX-ALGORITHMUS 93 Ein Beispiel zur Produktionsplanung. Dabei reprasentieren x1 und x2 die zu bestimmenden Produktionsmengen zweier Produkte mit Stuckdeckungsbeitrag 300 bzw. 500 Euro. Der Zielfunktionswert G ist daher der Gesamtdeckungsbeitrag, der sich bei den Produktionsmengen x1 und x2 ergibt. Die Nebenbedingungen ergeben sich aus den beschrankten Laufzeiten dreier Maschinen A, B und C. Ziel ist es, unter allen Produktionsmengen, die unter Einhaltung der Nebenbedingungen moglich sind, solche mit maximalen Gesamtdeckungsbeitrag zu nden. Nebenbedingungen: 1 · x1 + 2 · x2 ≤ 170 (Maschine A) 1 · x1 + 1 · x2 ≤ 150 (Maschine B) 0 · x1 + 3 · x2 ≤ 180 (Maschine C) und x1 , x2 ≥ 0. Es ist G(x1 , x2 ) = 300x1 + 500x2 → max. Damit ist das Optimierungsproblem in Normalform. Wir fuhren 3 Schlupfvariable y1 , y2 , y3 ein und erhalten das Gleichungssystem 1 · x1 + 2 · x2 +1 · y1 +0 · y2 +0 · y3 = 170 1 · x1 + 1 · x2 +0 · y1 +1 · y2 +0 · y3 = 150 0 · x1 + 3 · x2 +0 · y1 +0 · y2 +1 · y3 = 180 und den Bedingungen x1 ≥ 0, x2 ≥ 0, y1 ≥ 0, y2 ≥ 0, y3 ≥ 0. Wir haben somit 5 Variable und 3 Gleichungen, eine Ecke ist also durch das Verschwinden (gleich Null sein) von 5 − 3 = 2 Variablen gekennzeichnet. Wir stellen das Simplextableau auf, das beinhaltet das Gleichungssystem und die Zielfunktion: G(x1 , x2 ) = 300x1 + 500x2 + 0 (die Schlupfvariablen kommen in der Zielfunktion nicht vor und die Konstante d der Normalform ist gleich Null.) 1 2 1 1 0 3 −300 −500 1 0 0 0 0 1 0 0 0 170 0 150 1 180 0 0 Setzt man x1 = x2 = 0, so sieht man, dass (x1 , x2 , y1 , y2 , y3 ) = (0, 0, 170, 150, 180) eine zulassige Ecke ist, da 2 Variable gleich Null sind und die ubrigen groer als Null sind. D.h. wir haben eine zulässige Startecke gefunden und des Simplextableau ist nach dieser Ecke aufgelöst. Wir beginnen mit der Optimierung nach dem Simplex-Algorithmus. Da in der Zeile der Zielfunktion negative Zahlen stehen, ist der Algorithmus nicht am Ende angelangt und wir such die kleinste Zahl, dies ist −500 und steht in der 2. Spalte, deshalb ist die 2. Spalte die Pivot-Spalte 3. VEKTORRAUME 94 und wir die Quotienten der rechten Seite mit den Elementen der Pivot-Spalte (nur ubern Strich, also nicht mit fur die Zeile der Zielfunktion), um die PivotZeile zu nden. 1 2 1 1 0 3 −300 | − 500| 1 0 0 0 0 1 0 0 0 170 0 150 1 180 0 0 170 = 85 2 150 = 150 1 180 = 60 3 Wir bilden alle Quotienten, da alle Elemente der Pivot-Spalte groer als Null sind. Der kleinste Wert der Quotienten ist 60 und deshalb ist die 3. Zeile, die Pivot-Zeile und a32 = 3 das Pivot-Element. 1 2 1 1 0 3 −300 | − 500| 1 0 0 0 0 1 0 0 0 170 0 150 1 180 0 0 Wir raumen nun mit Hilfe des Gau-Algorithmus die Pivot-Spalte aus (d.h. wir erzeugen durch Multiplikation der Pivot-Zeile mit 31 an der Stelle des PivotElements eine 1 und benutzen dann diese Zeile, um uber und unter dieser 1 Nullen zu erzeugen, dabei wird die Zeile fur die Zielfunktion mit einbezogen). 1 1 0 −300 0 0 1 0 1 0 0 0 0 − 23 50 1 1 −3 90 1 60 0 3 500 0 3 30000 Damit sind wir bei einer neuen Ecke fur den Simplex-Algorithmus angekommen und der Wert der Zielfunktion hat sich auf 30000 erhoht. Fur welche Ecke wird dieser Wert angenommen? Bei unserer Startecke waren x1 und x2 gleich Null gesetzt worden. Da die 2. Spalte die Pivot-Spalte ist, haben wir x2 hinzugenommen, hat jetzt also einen Wert groer Null. Welche Variable wird statt dessen Null gesetzt? Zur Auswahl stehen y1 , y2 und y3 . In der Pivot-Zeile hat aber nur y3 einen Wert ungleich Null, deshalb wird y3 gleich Null gesetzt. D.h. wir tauschen im Algorithmus, die Variable x2 , die jetzt größer Null sein soll, gegen die Variable y3 aus, die wir dafür gleich Null setzten. Die Ecke ist also (x1 , x2 , y1 , y2 , y3 ) = (0, 60, 50, 90, 0). Wie man leicht sieht ist das eine zulassige Ecke und das Simplextableau ist nach dieser Ecke aufgelost. Der Simplex-Algorithmus ist aber noch nicht beim maximalen Wert angelangt, da in der Zeile fur die Zielfunktion (vorm Strich) immer noch eine negative Zahl steht. Die kleinste Zahl ist −300 und deshalb ist die 1.Spalte die neue 3. LINEARE OPTIMIERUNG { SIMPLEX-ALGORITHMUS 95 Pivot-Spalte. 1 1 0 | − 300| 0 0 1 0 1 0 0 0 0 − 23 50 1 1 −3 90 1 60 0 3 500 0 3 30000 Um die dazugehorige Pivot-Zeile zu nden, bestimmen wir die Quotienten aus rechter Seite und der Pivot-Spalte fur alle positiven Elemente der Pivot-Spalte: 1 1 0 0 1 0 − 23 0 0 1 − 13 1 0 0 13 | − 300| 0 0 0 500 3 50 1 90 1 50 90 60 = 50 = 90 Quotient wird nicht gebildet, da kein positives Element in Pivot-Spalte 30000 Der kleinste Wert der Quotienten ist 50 und deshalb ist die 1. Zeile, die PivotZeile und a11 = 1 das Pivot-Element. Wir raumen nun mit Hilfe des GauAlgorithmus die Pivot-Spalte (einschlielich der Zeile fur die Zielfunktion) aus: 1 0 0 0 0 1 0 0 −1 1 1 0 0 0 300 0 − 23 1 3 1 3 −100 3 50 40 60 45000 Wir sind nun in einer weiteren Ecke angelangt und der Wert der Zielfunktion hat sich auf 45000 erhoht. Fur welche Ecke wird dieser Wert angenommen? Da die 1. Spalte die PivotSpalte ist, nehmen wir x1 hinzu. Welche Variable soll Null gesetzt werden. Neben x1 hatten wir y3 gleich Null gesetzt und y3 bleibt deshalb gleich Null. In der 1. Zeile (Pivot-Zeile) ist neben dem Wert fur y3 und x1 aber auch noch der Wert fur y1 ungleich Null und deshalb wird y1 gleich Null gesetzt. D.h. wir tauschen x1 gegen y1 aus. Die Ecke ist also (x1 , x2 , y1 , y2 , y3 ) = (50, 60, 0, 40, 0). Wie man leicht sieht ist das eine zulassige Ecke und das Simplextableau ist nach dieser Ecke aufgelost. Da die Zeile fur die Zielfunktion wieder (vorm Strich) eine negative Zahl enthalt ist der Simplex-Algorithmus noch nicht beendet. Die kleinste Zahl in der Zeile und steht in der 5. Spalte, deshalb fur die Zielfunktion (vorm Strich) ist − 100 3 ist die 5. Spalte die Pivot-Spalte. Zur Bestimmung der Pivot-Zeile bilden wir 3. VEKTORRAUME 96 die Quotienten der rechten Seite mit den positiven Elementen der 5. Spalte: 1 0 1 0 − 23 50 Quotient wird nicht gebildet, da negatives Element in Pivot-Spalte 0 0 −1 1 0 1 0 0 0 0 300 0 1 3 1 3 −100 | 3 | 40 60 40 1/3 60 1/3 = 120 = 180 45000 Den kleinsten Wert hat der Quotient in der 2. Zeile, deshalb ist die 2. Zeile die Pivot-Zeile und a25 = 13 das Pivot-Element. Wir raumen nun mit Hilfe des Gau-Algorithmus die Pivot-Spalte (einschlielich der Zeile fur die Zielfunktion) aus: 1 0 0 0 0 −1 2 0 −3 3 1 1 −1 0 200 100 0 130 1 120 0 20 0 49000 Da in der Zeile fur die Zielfunktion (vorm Strich) nur noch nichtnegative Zahlen stehen, ist der Algorithmus im Maximum angekommen und der maximale Wert der Zielfunktion ist 49000. Fur welche Ecke wird dieser Wert angenommen? Wir mussen y3 hinzunehmen, da die 5. Spalte die Pivot-Spalte ist. Bisher waren y3 und y1 Null gesetzt. Deshalb bleibt y1 gleich Null gesetzt. In der 2. Zeile (Pivot-Zeile) ist neben dem Wert fur y1 und y3 nur noch der Wert fur y2 ungleich Null, deshalb wird y2 gleich Null gesetzt. Wir tauschen also y3 gegen y2 aus. Insgesamt bedeutet das: • Wir sind in der Ecke (x1 , x2 , y1 , y2 , y3 ) = (130, 20, 0, 0, 120) angekommen und der Wert der Zielfunktion mit 49000 ist maximal. • Als Ergebnis unseres Optimierungsproblems erhalten wir: F ur x1 = 130 und x2 = 20 wird die Zielfunktion maximal. 3. LINEARE OPTIMIERUNG { SIMPLEX-ALGORITHMUS 97 Warum wählt man die Zeile mit dem kleinsten Quotienten? Dazu schauen wir uns das folgende Beispiel an: 3.17. Wir betrachten die folgenden 4 Ungleichungen zur Bestim- Beispiel mung von x1 , x2 ≥ 0 : x1 + x2 ≤ 2, x2 ≤ 2, −2x1 + x2 ≤ 2, 2x1 + x2 ≤ 2, x1 + 2x2 ≤ 2. Nehmen wir an, dass die erste Spalte (also die fur x1 ) eine Pivot-Spalte ware, welche Ungleichung konnen wir dann nicht weglassen oder anders ausgedruckt welches ist die wichtigste Bedingung fur x1 ? Der Zulassigkeitsbereich fur x1 und x2 kann wie folgt abgelesen werden: x2 2x1+x2=2 x2 2x1+x2=2 -2x1+x2=2 -2x1+x2=2 x2=2 x1+2x2=2 x2=2 2 x1+2x2=2 1 2 x1+x2=2 1 x1+x2=2 M x1 -1 1 2 x1,x2≥0 Zulässiger Bereich M: M={(x1,x2): x1,x2≥0, x1+2x2≤2, 2x1+x2≤2} x1 -1 1 2 x1,x2≥0 Einschränkungen, die diese (Un)gleichungen für x1 erzeugen. Unter Berücksichtigung von x1,x2≥0, ergibt die rote Gerade 2x1+x2=2 die strengste Einschränkung für x1. Die Bedingung 0 · x1 + x2 = x2 ≤ 2 wirkt sich auf x1 gar nicht aus, die Bedingung −2x1 + x2 ≤ 2 ergibt f ur x1 den nach rechts unbeschrankten Bereich x1 ≥ −1 bzw. x1 ≥ 0 fur zulassiges x1 . Die anderen beiden Bedingungen schranken den Bereich fur x1 nach rechts ein. Namlich fur x1 + 2x2 ≤ 2 durch x1 ≤ 2 und fur 2x1 + x2 ≤ 2 durch x1 ≤ 1. Die gr ote Einschrankung und damit die fur den zulassigen Bereich wesentliche Einschrankung liefert also die Bedingung 2x1 + x2 ≤ 2. 3. VEKTORRAUME 98 Betrachten wir die Quotienten zur Ermittlung der Pivot-Spalte: 2 = 2, 1 x1 + x2 ≤ 2, kein Quotient, da Faktor vor x1 Null ist, kein Quotient, da Faktor vor x1 negativ ist, x2 ≤ 2, −2x1 + x2 ≤ 2, 2 = 1, 2 2 = 2. 1 2x1 + x2 ≤ 2, x1 + 2x2 ≤ 2, Der kleinste gebildete Quotient entspricht also der Bedingung, die den Zulassigkeitsbereich beschrankt, und darf deshalb nicht weggelassen werden, deshalb ist die dazugehorige Zeile, die Pivot-Zeile. Es ist so schwer rauszukriegen welche Variable man Null setzen muss? Naja, da gibt’s noch einen Trick! Wir schreiben das letzte Beispiel noch einmal auf (in verkurzter Form) und fugen aber Namen von Variablen in folgender Weise an. Im Startschema suchen wir die (n − m) × (n − m) Einheitsmatrix und in der Zeile wo die 1 steht schreiben wir den Namen der zugehorigen Variablen in der entsprechenden Zeile vor das Schema: y1 y2 y3 x1 x2 y1 y2 y3 1 2 1 0 0 170 1 1 0 1 0 150 0 3 0 0 1 180 −300 −500 0 0 0 0 Dann bestimmen wir vorher die Pivot-Spalte und die Pivot-Zeile: y1 y2 y3 x1 x2 y1 y2 y3 1 2 1 0 0 170 1 1 0 1 0 150 0 3 0 0 1 180 −300 | − 500| 0 0 0 0 170 = 85 2 150 = 150 1 180 = 60 3 Die 2. Spalte ist die Pivot-Spalte, da kleinstes Element der Zielfunktionszeile in der 2. Spalte steht, die 3. Zeile ist die Pivot-Zeile, da der kleinste (positive) Quotient in der 3. Zeile steht. Der Austauschschritt besteht nun darin y3 gegen x2 auszutauschen, dies erfolgt durch den Gau-Algorithmus (Pivot-Spalte wird in Einheitsvektor 3. LINEARE OPTIMIERUNG { SIMPLEX-ALGORITHMUS 99 transformiert). Wir erhalten danach das Schema: y1 y2 x2 x1 x2 y 1 y 2 y 3 1 0 1 0 − 23 50 1 1 0 0 1 −3 90 1 0 1 0 0 60 3 500 −300 0 0 0 30000 3 In der ersten Spalte stehen alle die Variablen, die nicht Null gesetzt werden und das Simplextableau ist nach diesen Variablen aufgelost (korrespondieren zur Einheitsmatrix in der angegebenen Reihenfolge). Es folgt wieder ein Simplexschritt, da in der Zielfunktionszeile eine negative Zahl steht und die kleinste Zahl ist (diese) −300, deshalb ist die 1. Spalte, die PivotSpalte und die Pivot-Zeile wird entsprechend gewahlt: x1 1 1 0 y1 y2 x2 x2 y1 y2 y3 0 1 0 − 32 0 0 1 − 31 1 1 0 0 3 | − 300| 0 0 500 3 0 50 90 60 50 1 90 1 = 50 = 90 Quotient wird nicht gebildet, da kein positives Element in Pivot-Spalte 30000 Der kleinste Quotient steht in der 1. Zeile, deshalb ist die 1. Zeile die Pivot-Zeile. Der Ausstauschschritt besteht nun darin y1 gegen x1 auszutauschen. Das passiert durch Anwenden des Gau-Algorithmus (Pivot-Spalte wird in Einheitsvektor transformiert). Wir erhalten: x1 y2 x2 x1 x2 y1 y2 1 0 1 0 0 0 −1 1 0 1 0 0 0 0 300 0 y3 − 32 1 3 1 3 −100 3 50 40 60 45000 Das Simplextableau ist nach den Variablen x1 , y2 , x2 aufgelost. Da in der Zeile fur die Zielfunktion wieder eine negative Zahl steht, fuhren wir einen weiteren Simplexschritt aus. Der kleinste Wert in der Zeile der Zielfunktion ist − 100 und steht in der 5. Spalte, 3 also ist die 5. Spalte die Pivot-Spalte. Wir bestimmen die Pivot-Zeile: x1 x1 x2 1 0 y1 1 y2 0 y3 − 23 y2 x2 0 0 0 1 −1 0 1 0 0 0 300 0 1 3 1 3 −100 | 3 | 50 40 60 45000 Quotient wird nicht gebildet, da negatives Element in Pivot-Spalte 40 1/3 60 1/3 = 120 = 180 3. VEKTORRAUME 100 Der kleinste Quotient steht in der 2. Zeile, deshalb ist die 2. Zeile, die Pivot-Zeile. Der Austauschschritt besteht nun darin y2 mit y3 auszutauschen. Dazu wird der Gau-Algorithmus durchgefuhrt (Pivot-Spalte wird in Einheitsvektor transformiert) und als Ergebnis erhalten wir: x1 y3 x2 x1 x2 y1 y2 y3 1 0 −1 2 0 130 0 0 −3 3 1 120 0 1 1 −1 0 20 0 0 200 100 0 49000 Da in der Zeile fur die Zielfunktion nur nichtnegative Zahlen stehen, ist der SimplexAlgorithmus am Ende angekommen und wir lesen ab, dass die Zielfunktion fur x1 = 130 und x2 = 20 den maximalen Wert 49000 annimmt. 3.10. Da man alle diese Schritte in der Regel aber nicht per " Hand\ oder mit dem Taschenrechner lost. Ist das folgende Schema als Simplextableau sinnvoll: Es seien ~xB , die Variablen, die nicht Null gesetzt werden, die sogenannten Basisvariablen. Die u brigen Variablen seien ~xN , die Nichtbasisvariablen. Dann lasst sich die Gleichung A~x = ~b schreiben als Bemerkung " [AB und die Zielfunktion als schreiben als AN ] f (~x) = cT ~x + d. ~xB ~xB ~xN # Dann lasst sich das Simplextableau ~xTN AN ~b −~cT d Jeder "Endzustand\ eines Simplexschritts ist in von dieser Form, deshalb genugt es dieses Schema fur jeden Schritt aufzuschreiben. Fur unser Beispiel von vorhin sind das die Schemata: y1 y2 y3 x1 x2 1 2 170 1 1 150 0 3 180 −300 −500 0 3. LINEARE OPTIMIERUNG { SIMPLEX-ALGORITHMUS 101 Wir entfernen also die Einheitsmatrix. Haben wir den Simplex-Algorithmus nun einmal ausgefuhrt, so ergibt sich das neue Schema: y1 y2 x2 x1 y3 1 − 32 50 1 1 −3 90 1 0 60 3 500 −300 3 30000 Der Simplex-Algorithmus muss wiederum ausgefuhrt werden und das Ergebnis steht in folgendem Schema: x1 y2 x2 y1 1 −1 0 300 y3 − 23 1 3 1 3 −100 3 50 40 60 45000 Da der Algorithmus das Maximum immer noch nicht gefunden hat, wird der Simplex-Algorithmus wieder ausgefuhrt und wir erhalten: x1 y3 x2 y1 y2 −1 2 130 −3 3 120 1 −1 20 200 100 49000 Wie man sieht, stehen alle wesentlichen Informationen in diesen verkurzten Schemata. Bemerkung 3.11. Entarteter Fall. Ist in einem Simplex-Algorithmus nach Bemerkung 3.12. Haug ist es besonders bei einer groen Anzahl von Ne- erfolgter Wahl der Pivot-Spalte die Festlegung der Pivot-Zeile nicht eindeutig moglich, dann wird das Tableau eine "entartete Ecke\ darstellen. Geometrisch ist eine entartete Ecke als Zusammenfallen mehrerer Ecken in einem Punkt interpretierbar. Fur eine solche Ecke sind mehrere Basen moglich. Dadurch konnen (unendliche) Zyklen entstehen. benbedingungen schwierig, sofort eine zulassige Startecke und damit ein Simplextableau anzugeben. Es gibt Verfahren, deren Losung sich ein Simplextableau der ursprunglichen Aufgabe ergibt. 3. VEKTORRAUME 102 4. Der Vektorraum R3 4.1. Vektoren. Vektoren sind gerichtete Groen, die durch ihre und Richtung gekennzeichnet sind. Lange (Betrag, Norm ) Physikalische Beispiele fur Vektoren: Kraft, Geschwindigkeit, Beschleunigung, elektrische und magnetische Feldstarke. Zu je zwei Punkten P und Q des Raumes gibt es genau eine Parallelverschiebung −→ (des Raumes), die P nach Q bringt (abbildet). Diese Verschiebung wird mit ~v = P Q bezeichnet bzw. der Vektor hat den Anfangspunkt P und den Endpunkt Q. Vektoren, die durch Parallelverschiebung ineinander uberfuhrt werden konnen, werden als gleich angesehen (freie Vektoren). Den zu ~v gleich langen, aber entgegengesetzt gerichteten Vektor bezeichnet man mit −~v . Als Nullvektor bezeichnet man den Vektor → ~0 = − P P (nichts wird verschoben). −→ −→ Fuhrt man zwei Parallelverschiebungen, erst ~a = P Q und dann ~b = QR aus, so ergibt −→ sich wieder eine Parallelverschiebung, namlich ~c = P R. Wir nennen ~c die Summe von ~a und ~b und schreiben: ~c = ~a + ~b. Fur beliebige Vektoren ~a, ~b, ~c gelten die folgenden Rechenregeln: ~a + ~0 = ~a ~a + (−~a) = ~0, ~a + ~b = ~b + ~a (Kommmutativgesetz) ~a + (~b + ~c) = (~a + ~b) + ~c (Assoziativgesetz) Die Dierenz von Vektoren wird erklart durch ~a − ~b = ~a + (−~b). Zu jeder reellen Zahl α ≥ 0 und einem Vektor ~a bezeichnet α~a (das α-fache von ~a) den Vektor, der dieselbe Richtung hat wie ~a, aber die α-fache Lange. Im Fall α < 0 setzt man α~a = −(|α|~a). Sonderfalle: 0~a = ~0 und α~0 = ~0. 4. DER VEKTORRAUM R3 103 Rechenregeln: α(β~a) = (αβ)~a, α(~a + ~b) = α~a + β~b, (α + β)~a = α~a + β~b. −→ Die Lange eines Vektors ~a = P Q ist die Lange der Strecke P Q und nennt sie den Betrag des Vektors ~a. Man schreibt dafur |~a| (oder auch ||~a||). Rechenregeln: |α~a| = |α||~a|, insbesondere | − ~a| = |~a|, ~ ~ |~a + b| ≤ |~a| + |b| (Dreiecksungleichung Ein Vektor vom Betrag 1 heit Einheitsvektor. Zu jedem vom Nullvektor verschiedenen Vektor ~a 6= ~0 gehort der Einheitsvektor in Richtung ~a : |~a1|~a. Wir legen im Raum ein kartesisches Koordinatensystem mit dem Ursprung O fest. Dadurch werden gleichzeitig drei ausgezeichnete Vektoren gegeben, namlich die Einheitsvektoren ~e1 , ~e2 , ~e3 in Richtung der positiven x−, y− bzw. z− Achse. Wir nennen (~e1 , ~e2 , ~e3 ) eine kartesische Basis und bezeichnen das Koordinatensystem mit (O, ~e1 , ~e2 , ~e3 ). −−→ Der Vektor OA heit Ortsvektor des Punktes A = (a1 , a2 , a3 ); er ist eindeutig zerlegbar als Summe ~a = a1~e1 + a2~e2 + a3~e3 . Abkurzend schreibt man bei festgelegtem Koordinatensystem: a1 −−→ ~a = a2 ⇐⇒ ~a = a1~e1 + a2~e2 + a3~e3 = OA mit A = (a1 , a2 , a3 ). a3 Man nennt ai~ei die Komponente von ~a in ~ei -Richtung (i = 1, 2, 3) und die Zahlen 3. VEKTORRAUME 104 ai ∈ R die Koordinaten des Vektors p~a. Die Lange des Vektors lat sich mit dem Satz des Phythagoras berechnen: |~a| = a21 + a22 + a23 . 4.2. Skalarprodukt. Das Skalarprodukt ~a · ~b der Vektoren ~a und ~b ist deniert durch ( ~a · ~b := |~a||~b| cos ^(~a, ~b), falls ~a 6= ~0 und ~b 6= 0, 0, falls ~a = ~0 oder ~b = 0. Das Skalarprodukt, auch inneres Produkt genannt, ist eine Zahl (Skalar). Beispiel a3~e3 stets 3.18. Wegen ~ei = 1 gilt fur einen beliebigen Vektor ~a = a1~e1 + a2~e2 + ~a · ~ei = |~a| cos ^(~a, ~ei ) = ai , i = 1, 2, 3. Damit erhalt man ~a = (~a · ~e1 )~e1 + (~a · ~e2 )~e2 + (~a · ~e3 )~e3 . Die Faktoren cos ^(~a, ~ei ) nennt man Richtungskosinus von ~a. Rechenregeln fur das Skalarprodukt: ~a · ~b = ~b · ~a (α~a) · ~b = ~a · (α~b) = α(~a · ~b) (~a + ~b) · ~c = ~a · ~c + ~b · ~c ~a · ~b =√0 ⇐⇒ ~a orthogonal zu ~b |~a| = ~a · ~a. (Kommutativgesetz), (f ur α ∈ R), (Distributivgesetz), (Orthogonalitatstest), b1 a1 P P3 Die Koordinatendarstellung ~a = 3i=1 ai~ei = ei = b2 a2 , ~b = i=1 bi~ a3 b3 bezuglich einer kartesischen Basis (~e1 , ~e2 , ~e3 ) ermoglicht eine einfache Berechnung des Skalarprodukts und der Richtungscosinus: 4. DER VEKTORRAUM ~a · ~b = a1 b1 + a2 b2 + a3 b3 , cos ^(~a, ~b) = ~a·~b |~a||~b| =√ |~a| = R3 105 p a21 + a22 + a23 , falls ~a, ~b 6= 0, a1 b1 +a2 b√ 2 +a3 b3 , a21 +a22 +a23 b21 +b22 +b23 ai insbesondere Richtungscosinus cos ^(~a, ~ei ) = √a2 +a , i = 1, 2, 3, f ur die 2 +a2 1 2 3 1 0 0 Basisvektoren 0 , 1 , 0 . 0 0 1 Anwendung: Orthogonale Zerlegung von Vektoren: Orthogonale Zerlegung von ~a langs ~b, falls ~b 6= ~0. ~a = ~a~b + ~a~⊥ mit den Komponenten b ~a~b := ~a·~b ~ b |~b|2 in Richtung ~b und a ~a·~b ~ b |~b|2 orthogonal zu ~b. a T ~a~⊥ = ~a − b b b φ ab Beweis: Oensichtlich ist die Lange |~a~b | der Projektion des Vektors ~a auf den Vektor ~b gleich |~a~b | |~a · ~b| = | cos ϕ| = |~a| |~a| |~b| und damit |~a~b | = |~a| | cos ϕ| = |~a| |~a · ~b| |~a · ~b| = . |~a| |~b| |~b| Die Richtung ergibt sich aus den folgenden Uberlegungen. ~a~b zeigt in Richtung des π π Vektor ~b, wenn − 2 < ϕ < 2 ist, also wenn cos ϕ > 0. Dagegen zeigt ~a~b in die 3. VEKTORRAUME 106 entgegengesetzte Richtung, wenn ~a~b = (~a · ~b) |~b| | {z } π 2 <ϕ< · = |~a| cos ϕ · ~b |~b| | 3π , 2 d.h. falls cos ϕ < 0 ist. Deshalb gilt = {z (~a · ~b) ~ b |~b|2 } Richtung von ~b Oensichtlich ist # ~a = Beispiel ~a~b + ~a~Tb ⇐⇒ ~a~Tb = ~a − ~a~b . 3.19. Man berechne die Projektion des Vektors ~a = (1, 2, 3)T auf den Vektor ~b = (4, 5, 6)T . Es ist ~a · ~b = 3 X ai bi = 1 · 4 + 2 · 5 + 3 · 6 = 32. i=1 Weiterhin ist v u 3 uX √ √ √ |~b| = t b2i = 42 + 52 + 62 = 16 + 25 + 36 = 77 i=1 und damit Beispiel 4 (~a · ~b) ~ 32 ~a~b = b= 5 . 77 |~b|2 6 3.20. Ein spurgebundenes Fahrzeug (Eisenbahn, Straenbahn, Trans- rapid, ... ) ubt momentan eine Antriebskraft vom Betrag 4 aus und bewegt sich √ 1√ √ 1 1 dabei auf Schienen, die in Richtung ( 4 √2, 4 2,√− 2 √3) verlegt sind. Zusatzlich wirkt auf das Fahrzeug die Windkraft ( 34 2, − 54 2, 12 3). Wie gro ist die Gesamtkraft in Fahrtrichtung? Wie gro ist die vom Wind erzeugte Querkraft auf die Schiene (die Kraft, die senkrecht zur Schiene wirkt)? Die Gesamtkraft in Fahrtrichtung ergibt sich aus der Projektion der Windkraft in Fahrtrichtung plus der Antriebskraft. Die Querkraft ist die Dierenz aus Windkraft und der Projektion der Windkraft in Fahrtrichtung. 4. DER VEKTORRAUM R3 107 4.3. Vektorprodukt. Das Vektorprodukt ~a × ~b zweier Vektoren ~a und ~b ist der Vektor mit den Eigenschaften: ~a × ~b = ~0, falls ~a = ~0 oder ~b = ~0 oder ~a parallel zu~b. In allen anderen Fallen ist ~a × ~b derjenige Vektor, (1) der senkrecht auf ~a und ~b steht, (2) mit dem (~a, ~b, ~a × ~b) ein Rechtssystem darstellt und (3) dessen Betrag gleich dem Flacheninhalt F des von ~a und ~b aufgespannten Parallelogramms ist. |~a × ~b| = |~a||~b| sin ^(~a, ~b). Beispiel ~ei ×~ei = ~0, 3.21. Fur die Vektoren ~e1 , ~e2 , ~e3 einer kartesischen Basis gilt ~e1 ×~e2 = ~e3 = −~e2 ×~e1 , ~e2 ×~e3 = ~e1 = −~e3 ×~e2 , ~e3 ×~e1 = ~e2 = −~e1 ×~e3 . Die Multiplitation ist folglich nicht kommutativ, sie ist aber auch nicht assoziativ, da −~e2 = ~e1 × ~e3 = ~e1 × (~e1 × ~e2 ) 6= (~e1 × ~e1 ) × ~e2 = ~0! Rechenregeln: (1) (2) (3) (4) ~a × ~a = ~0, ~a × ~b = −~b × ~a (nicht kommutativ), Die Multiplikation ist nicht assoziativ, ~a × (~b + ~c) = ~a × ~b + ~a × ~b, (~a + ~b) × ~c = ~a × ~c + ~b × ~c. (Distributivgesetze), (5) ~a × ~b = ~0 ⇐⇒ falls ~a = ~0 oder ~b = ~0 oder ~a parallel zu~b. (Paralle- litatstest) (6) |~a × ~b|2 = |~a|2 |~b|2 − (~a · ~b)2 . Aufgrund der Distributivitat lassen sich Produkte in gewohnter Weise ausmultiplizieren. Insbesondere erhalt man in einer kartesischen Basis ~e1 , ~e2 , ~e3 fur ~a = 3. VEKTORRAUME 108 a1~e1 + a2~e2 + a3~e3 und ~b = b1~e1 + b2~e2 + b3~e3 : ~a × ~b = (a2 b3 − a3 b3 )~e1 + (a3 b1 − a1 b3 )~e2 + (a1 b2 − a2 b1 )~e3 . In anderer Schreibweise a1 b1 a2 b 3 − a3 b 2 a2 × b 2 = a3 b 1 − a1 b 3 . a3 b3 a2 b 1 − a1 b 3 Als Gedachtnisstutze kann man das Vektorprodukt zweier Vektoren auch als formale Determinante aufschreiben: ~e a b ~e ~e ~e a1 b1 1 1 1 1 2 3 a2 × b2 = ~e2 a2 b2 = a1 a2 a3 . ~e3 a3 b3 b1 b2 b3 a3 b3 Zwei nutzliche Beziehungen sind ~a × (~b × ~c) = (~a · ~c)~b − (~a · ~b)~c (Grassmann) ~ = (~a · ~c)(~b · d) ~ − (~b · ~c)(~a · d) ~ (Lagrange) (~a × ~b) · (~c × d) Insbesondere erhalt man, dass b ab T ab ~a~⊥ = ~a − b 1 ~ (~a · ~b) ~ b= b × (~a × ~b). 2 2 ~ ~ |b| |b| a Beispiel 3.22. 3 5 und ~b = 1 ~e ~e ~e 1 2 3 ~a×~b = a1 a2 a3 b1 b 2 b3 Man acheninhalt des von den Vektoren berechne den Fl ~a = 4 1 aufgespannten Paralellogramms. Es gilt 8 ~e ~e ~e 39 1 2 3 = 3 5 1 = (5·8−1·1)~ex +(1·4−8·3)~ey +(1·3−4·5)~ez = −20 . 4 1 8 −17 p √ Damit betr a gt der Fl a cheninhalt |~a×~b| = 392 + (−20)2 + (−17)2 = 1521 + 400 + 289 = √ 2210 ≈ 47, 11. 4. DER VEKTORRAUM Beispiel R3 109 3.23. Gesucht ist ein Vektor ~a = (ax , ay , az )T mit 3 ax 9 4 × ay = 1 . 5 az −8 Da das Vektorprodukt zweier Vektoren steht, gibt es keine Losung, da der auf jedem der Vektoren senkrecht 3 Vektor 4 nicht senkrecht auf dem 5 9 Vektor 1 steht, wie man mit Hilfe des Skalarprodukts −8 9 3 4 · 1 = 3 · 9 + 4 · 1 − 5 · 8 = 27 + 4 − 40 = −9 6= 0! −8 5 leicht ausrechnet: Wir modizieren nun die Aufgabe. Gesucht ist ein Vektor ~a = (ax , ay , az )T mit 3 ax 4 4 × ay = 7 . 5 az −8 In diesem Fall ist 3 4 4 · 7 = 3·4+4·7+5·(−8) = 12+28−40 = 0, 5 −8 d.h. die Vektoren stehen senktrecht aufeinander. Wir berechnen nun das Vektorprodukt: ax ~ex ~ey ~ez 4az − 5ay 3 4 × ay = 3 4 5 5ax − 3az . 5 az ax ay az 3ay − 4ax Gleichsetzen mit dem gegebenen Vektor 4az − 5ay 4 5ax − 3az = 7 3ay − 4ax −8 ergibt das lineare Gleichungssystem 4az − 5ay = 4 5ax − 3az = 7 3ay − 4ax = −8 3. VEKTORRAUME 110 und damit 0 −5 4 5 0 −3 7 5 0 −3 5 0 −3 7 4 7 0 −3 7 ∼ −4 3 0 −8 ∼ 0 15 −12 −12 ∼ 0 −5 4 4 5 4 4 −4 3 0 −8 0 −5 4 0 −5 4 0 0 0 0 mit der Losung Da 7 3 7 ax 3 5 54 54 ∗ 4 ay = − 5 + t 5 = − 5 + t 4 , az 0 1 0 5 ax ~a × ~b = ~0 f ur ~a parallel zu ~b ist, kann ay nur bis auf az t ∈ R. einen zu 3 4 5 parallelen Vektor bestimmt werden. Das wollen wir am folgenden (eher trivialen) Beispiel veranschaulichen. Gesucht ist ein Vektor ~a = (ax , ay , az )T mit 0 ax 3 1 × ay = 0 . 1 az 0 3 Vektor 1 senkrecht auf 0 Oensichtlich steht der 0 0 . 1 dem Vektor berechnen nun das Vektorprodukt: Wir ~ex ~ey ~ez az ax 3 1 × ay = 3 1 0 −3az . ax ay az 3ay − ax 0 az Gleichsetzen mit dem gegebenen Vektor az 0 −3az = 0 3ay − ax 1 mit der Losung Da ~a × ~b = ~0 fur −1 3 ax ay = 0 + t 1 , t ∈ R. 0 az 0 ax ~a parallel zu ~b ist, kann ay nur bis auf az parallelen Vektor bestimmt werden. 3 1 0 einen zu 4. DER VEKTORRAUM R3 111 Da alle Losungsvektoren in der x-y -Ebene liegen sind sie oensichtlich orthogonal zum Vektor 0 0 . 1 In der folgenden Skizze soll auerdem veranschaulicht werden, dass auch der Flacheninhalt 3 3 a −1 3 x F = 1 × ay = 1 × 0 + t 1 0 0 0 az 0 3 −1 3 3 3 −1 0 = 1 × 0 + 1 × t 1 = 1 × 0 = 0 = 1 0 1 0 0 0 0 0 erhalten bleibt. (0.5, 0.5, 0)T = (-1, 0, 0)T + 0.5*(3, 1, 0)T (-1, 0, 0)T (3, 1, 0)T (-2.5, -0.5, 0)T = (-1, 0, 0)T – 0.5*(3, 1, 0)T 4.4. Spatprodukt. Eine Kombination aus Skalar- und Vektorprodukt ist das aus je drei Vektoren gebildete Spatprodukt [~a, ~b, ~c] := ~a · (~b × ~c). 3. VEKTORRAUME 112 Satz 3.7. Der von den Vektoren ~a, ~b, ~c aufgespannte Spat (Parallelach oder Parallelepiped genannt) hat das Volumen: V = |[~a, ~b, ~c]|. Beweis: Das Volumen ist Grundache mal Hohe\. Die Grundache hat den Flachen- " inhalt F = |~b × ~c| und die Hohe ist die Projektion von ~a auf ~b × ~c : ~a · (~b × ~c) ~ (b × ~c) . h= 2 ~ |b × ~c| Unter Berucksichtigung Regeln |α~a| = |α||~a| und das ~a · (~b × ~c) ∈ R ist, erhalt man fur das Volumen: ~a · (~b × ~c) |~a · (~b × ~c)| ~ ~ V =h·F = (b × ~c) · |~b × ~c| = |b × ~c|2 = |~a · (~b × ~c)| 2 2 ~ ~ |b × ~c| |b × ~c| # axb c b a Das Volumen des Spats ist gerade |[a, b, c]|. Folgerungen: Das Volumen des Tetraeders mit dem Kanten ~a, ~b, ~c betragt 1 1 VTetr = VSpat = |[~a, ~b, ~c]|. 6 6 4. DER VEKTORRAUM R3 113 Test auf lineare Unabhangigkeit Die Vektoren ~a, ~b, ~c sind linear unabhangig, d.h. sie sind nicht parallel zu einer Ebene (sie spannen tatsachlich einen Spat auf) ⇐⇒ [~a, ~b, ~c] 6= 0. Test auf Rechtssystem (~a, ~b, ~c) ist ein Rechtssystem ⇐⇒ [~a, ~b, ~c] > 0. Wie berechnet man das Spatprodukt in Koordinaten? Wir erinnern daran wie man das Vektorprodukt ausrechnet, es gilt ~ex ~ey ~ez b2 c 3 − b3 c 2 ~b × ~c = b 1 b2 b3 = b3 c 1 − b1 c 3 . c1 c2 c3 b1 c 3 − b3 c 1 Folglich ist ~a · (~b × ~c) = a1 (b2 c3 − b3 c2 ) + a2 (b3 c1 − b1 c3 ) + a3 (b1 c3 − b3 c1 ) b c b c b c = a1 2 2 − a2 1 1 + a3 1 1 b3 c 3 b3 c 3 b3 c 3 a b c a a a 1 1 1 1 2 3 = a2 b 2 c 2 = b 1 b 2 b 3 . a3 b 3 c 3 c 1 c 2 c 3 2 3 ~ ~a = 2 , b = 1 2 1 Beispiel 1 ~c = 1 1 3.24. Man uberprufe, ob die Vektoren und einen Spat aufspannen. Falls ja, berechne man das Volumen und entscheide, ob die Vektoren ein Rechtssystem bilden. Alle 3 Fragen lassen sich durch die Berechnung des Spatprodukts beantworten, es ist 3 2 1 [~a, ~b, ~c] = 2 1 2 1 1 1 = 3 + 4 + 2 − 1 − 6 − 4 = −2 und damit ist das Volumen des Spats gleich |[~a, ~b, ~c]| = 2 und die Vektoren bilden ein Linkssystem aufgrund des negativen Vorzeichens des Spatprodukts. 3. VEKTORRAUME 114 Ergebnis ist das Produkt ist geometrische Interpretation Test auf ~a · ~b Skalarprodukt ein Vektor ~a × ~b Vektorprodukt eine Zahl [~a, ~b, ~c] = ~a · (~b × ~c) Spatprodukt Zusammenfassung: Produkte von Vektoren im R3 eine Zahl kommutativ nicht kommutativ (die Reihenfolge der Faktoren (die Reihenfolge der Faktoren ist spielt keine Rolle) wesentlich) nicht assoziativ (man muss Klammern setzen) distributiv (man darf ausmultiplizieren) lineare Abhangigkeit distributiv (man darf ausmultiplizieren) Parallelitat |~a × ~b| ist der Flacheninhalt des |[~a, ~b, ~c]| ist das Volumen des von von ~a und ~b aufgespannten Par- ~a, ~b und ~c aufgespannten Spats allelogramms Orthogonalitat [~a, ~b, ~c] = 0 ⇐⇒ ~a, ~b, ~c linear Rechtssystem [~a, ~b, ~c] > Linkssystem [~a, ~b, ~c] < 0 0, ~a × ~b = ~0 ⇐⇒ ~a k ~b ~a × ~b ⊥ ~a und ~a × ~b ⊥ ~b a1 a2 a3 [~a, ~b, ~c] = b1 b2 b3 c1 c2 c3 abhangig ~ex ~ey ~ez ~a × ~b = a1 a2 a3 b1 b2 b3 insbesondere gilt ~a · ~b = 0 ⇐⇒ ~a ⊥ ~b Berechnung in Ko- ~a · ~b = a1 b1 + a2 b2 + a3 b3 ordinaten 5. GERADEN UND EBENEN 115 5. Geraden und Ebenen 5.1. Parameterdarstellung einer Geraden. Eine Gerade g ist bestimmt durch eine Richtung, gegeben durch einen Vektor ~c, ~c 6= ~0, und einen Punkt A, der auf der Geraden liegt. Man nennt A den Aufpunkt. Ein Punkt X liegt genau dann auf der Geraden g durch A in Richtung ~c, ~c 6= ~0, wenn ~ parallel zu ~c ist, d.h. wenn es eine Zahl t ∈ R gibt mit AX ~ = t~c. Man sagt dazu: AX g hat die Punkt-Richtungsgleichung −−→ AX = t~c, (9) t ∈ R. Dabei nennt man t einen Parameter. −−→ Zu jedem Parameterwert t = t0 gehort genau ein Punkt X0 auf g mit AX0 = t~c und umgekehrt. g c B A X P O −−→ −−→ −→ Wegen AX = P X − P A lat sich g in Bezug auf einen beliebigen Punkt P darstellten als −−→ −→ P X = P A + t ~c, t ∈ R. (10) 3. VEKTORRAUME 116 Ist nun im Raum ein kartesisches Koordinatensystem (O; ~e1 , ~e2 , ~e3 ) gegeben und wird der Vektor ~c = c1~e1 + c2~e2 + c3~e3 durch 2 verschiedene Punkte A = (a1 , a2 , a3 ) und B = (b1 , b2 , b3 ) bestimmt, d.h. ci = bi − ai , i = 1, 2, 3, dann geht (10) mit P = O uber in −−→ −−→ −−→ −−→ −−→ OX = OA + t ~c = OA + t OB − OA , t ∈ R, (11) und ein Komponentenvergleich ergibt fur die Geradenpunkte X = (x1 , x2 , x3 ) die drei Gleichungen xi = ai + t ci , t ∈ R, (i = 1, 2, 3) Punkt-Richtungsgl. bzw. xi = ai + t (bi − ai ), t ∈ R, (i = 1, 2, 3) Zwei Punkte-Gl. (12) (13) Die Gleichungen (9) bis (13) sind Parameterdarstellungen der Geraden g. 5.2. Abstand Punkt-Gerade. Der Lotvektor vom Punkt P auf die Gerade g durch den Punkt A in Richtung ~c ist S A c PS P PA −→ −→ gerade der Vektor P A minus der Projektion des Vektors P A auf den Vektor ~c, d.h. −→ −→ −→ P A · ~c PS = PA − ~c. |~c|2 Mit Hilfe der Regeln fur das Vektorprodukt ergibt sich −→ −→ −→ −→ 1 1 P S = 2 (~c · ~c)P A − (P A · ~c)~c = 2 (~c × (P A × ~c)) |~c| |~c| und der Betrag gibt den Abstand d des Punktes P von der Geraden g an: d= −→ −→ −→ 1 1 1 −→ (|~c × (P A × ~c)|) = 2 (|~c| |P A × ~c| | sin ^(~c; P A × ~c)|) = (|P A × ~c|), 2 |~c| |~c| |~c| 5. GERADEN UND EBENEN 117 −→ da ~c senkrecht auf P A × ~c steht. E2 g S c x(PA x c) A c PS P E1 PA PA x c Der Abstand d des Punktes P von der Geraden g ist −→ |P A × ~c| d= . |~c| (14) Beispiel 3.25. Der Abstand des Punktes 1 x1 1 +t x2 = 2 | {z } x3 −→ OA g: 15 P = −2 6 1 −1 0 | {z } ~c von der Geraden 3. VEKTORRAUME 118 Dann ist −14 √ −→ −→ −→ |~c| = 2, P A = OA − OP = 3 −4 und damit ~e ~ e ~ e y z x −→ P A × ~c = −14 3 −4 = −4~ex − 4~ey + 11~ez 1 −1 0 −→ und |P A × ~c| = √ 153. Damit ist 1 −→ d = (|P A × ~c|) = |~c| r 153 ≈ 8, 75. 2 5.3. Parameterdarstellung einer Ebene. Eine Ebene E ist gegeben durch zwei nicht parallele (von ~0 verschiedene) Vektoren ~u und ~v und einem Punkt A, der in der Ebene liegt. Man sagt, die Vektoren ~u und ~v spannen die Ebene auf, der Punkt A wird auch Aufpunkt\ genannt. " E tv x= a+ + su tv X v A u su −−→ Ein Raumpunkt X liegt genau dann auf E, wenn sich der Vektor AX als Summe von Vielfachen der Vektoren ~u und ~v darstellen lat, d.h. man hat die Parameterdarstellung −−→ AX = t ~u + s ~v , t, s ∈ R. Wird ein kartesisches Koordinatensystem (O, ~e1 , ~e2 , ~e3 ) festgelegt, so dass A = (a1 , a2 , a3 ), ~u = u1~e1 +u2~e2 +u3~e3 , ~v = v1~e1 +v2~e2 +v3~e3 , dann ist die Parameterdarstellung aquivalent zu den drei Gleichungen: 5. GERADEN UND EBENEN 119 xi = ai + tui + svi , i = 1, 2, 3, t, s ∈ R. Werden ~u und ~v durch die drei verschiedenen Punkte A = (a1 , a2 , a3 ), B = (b1 , b2 , b3 ) −→ −→ und C = (c1 , c2 , c3 ) bestimmt, also ~u = AB und ~v = AC dann geht die Parameterdarstellung uber in die Drei-Punkte-Gleichung der Ebene E : xi = ai + t(bi − ai ) + s(ci − ai ), i = 1, 2, 3, t, s ∈ R, mit A = (a1 , a2 , a3 ), B = (b1 , b2 , b3 ), C = (c1 , c2 , c3 ). 5.4. Parameterfreie Darstellung einer Ebene. Ein Punkt X liegt genau dann auf der Ebene E, wenn −−→ −→ −→ AX = t~u + s~v = tAB + sAC, das impliziert aber, dass −−→ −→ −→ [AX, AB, AC] = 0 (15) sein muss. Ist umgekehrt (15) so bedeutet dies nach dem Parallelitatstest, dass die 3 Vektoren parallel zu einer Ebene sind, namlich gerade E. Deshalb ist parameterfreie Drei-Punkte-Formel fur E in Determinantenform gerade −−→ −→ −→ [AX, AB, AC] = 0. −→ −→ Insbesondere zeigt das, dass der Vektor ~n = AB × AC = ~u × ~v senkrecht auf der Ebene E steht. Man nennt deshalb ~n einen Normalenvektor von E und −−→ AX · ~n = 0, (A Aufpunkt, ~n Normalenvektor von E ). eine Normalengleichung von E . In kartesischen Koordinaten X = (x1 , x2 , x3 ), A = (a1 , a2 , a3 ) und ~n = n1~e1 + n2~e2 + n3~e3 wird hieraus die 3. VEKTORRAUME 120 Koordinatendarstellung von E n1 x1 + n2 x2 + n3 x3 = c mit Bemerkung −−→ c := a1 n1 + a2 n2 + a3 n3 = OA · ~n. 3.13. Durch Berechnung des Normalenvektors gelangt man von der Parameterdarstellung zur parameterfreien Darstellung. Umgekehrt gelangt man von der parameterfreien Darstellung zur Parameterdarstellung durch Bestimmung von 3 Punkten, die auf der Geraden liegen, und bildet dann die 3Punkt-Form einer Geraden. Wird die Ebene E durch einen Aufpunkt A und einen Normalenvektor ~n gegeben, so ist der Abstand eines beliebigen Raumpunktes P zur Ebene E gleich der Lange −→ des Vektors P S, wobei S der Fupunkt des Lots von P auf E ist und damit gleich −→ der Lange der Projektion des Vektors P A auf den Normalenvektor ~n, d.h. der Abstand des Punktes P von der Ebene E ist −→ −→ |P A · ~n| d = |P S| = . |~n| n E S . A n P −→ Ist |~n| = 1, so gibt bereits d = |P A · ~n| den Abstand des Punktes P von der Ebene E an. Man nennt diese Darstellung 5. GERADEN UND EBENEN 121 Hesse-Normalform der Ebene E wenn n21 + n22 + n23 = 1 und c ≥ 0. n1 x1 + n2 x2 + n3 x3 = c, Man gelangt von einer beliebigen Koordinatendarstellung von E zur Hesseschen Norp 2 2 2 malform mittles Division durch ±|~n| = ± n1 + n2 + n3 . Ist n1 x1 +n2 x2 +n3 x3 = c ≥ 0 in Hesse-Normalform, so gilt: (1) Der Normalenvektor ~n = n1~e1 +n2~e2 +n3~e3 weist, wenn er in einem Punkt der Ebene E angetragen wird, vom Ursprung weg, da ~n · ~x = |~n| |~x| cos ^(~n, ~x) = c ≥ 0 und damit muss gelten − π2 ≤ ^(~n, ~x) ≤ π2 : n . E E . n −→ (2) Es ist c der Abstand der Ebene E vom Ursprung, da OL parallel zu ~n ist −→ −→ und in dieselbe Richtung zeigt, gilt OL = k~n und k = |OL|, dann folgt aus der Hesse-Normalform ~n · (k~n) = k~n · ~n = k = c. −−→ (3) Ein beliebiger Punkt P hat von E den Abstand |c− OP ·~n|. Der Abstand −→ d = −→ −→ −→ von P zur Ebene ist die Lange |P S| = |OL| − |OT | , wobei |OL| = c der −→ −→ Abstand des Ursprungs von der Ebene und OT die Projektion von OP auf den Normalenvektor ~n ist. n L . T . E S P 3. VEKTORRAUME 122 (4) Falls O 6∈ E, dann gilt −−→ c − OP · ~n > 0 ⇐⇒ O, P liegen auf derselben Seite von E, −−→ c − OP · ~n < 0 ⇐⇒ E trennt O und P. P2 n S1 L S2 E P1 T . 1 P3 = 2 4 Beispiel 3.26. Man bestimme den Abstand des Punktes Ebene E, die durch die Punkte 1 P0 = 0 , 1 1 P1 = 1 0 von der 0 P2 = 1 1 und gegeben ist. Als erstes bestimmen wir als Parameterform die 3-Punkte-Gleichung der Ebene: x1 1 1−1 0−1 1 0 −1 x2 = 0 +s 1 − 0 +t 1 − 0 = 0 +s 1 +t 1 , s, t ∈ R. 0−1 1−1 1 −1 0 x3 1 Die parameterfreie Form ergibt sich aus der Bestimmung des Normalenvektors 0 −1 ~ex ~ey ~ez 1 ~n = 1 × 1 = 0 1 −1 = ~ey + ~ez + ~ex = 1 . −1 0 −1 1 0 1 D.h. die Ebenengleichung lautet x + y + z = c, wobei c durch das Einsetzen eines Punktes der Ebene berechnet wird, fur P0 ergibt sich 1 + 0 + 1 = c = 2, folglich ist die parameterfreie Form der Ebenengleichung x + y + z = 2. 5. GERADEN UND EBENEN √ Hieraus erhalt man wegen |~n| = 12 + 12 + 12 = ~n0 = |~~nn| und die Hesse-Normalform √ 3 123 den Einheitsnormalenvektor x y z 2 √ +√ +√ =√ . 3 3 3 3 Wir zwei Moglichkeiten den Abstand des Punktes P3 von der Ebene zu berechnen. Als erstes benutzen wir die Formel f ur den Abstand mit P0 als Aufpunkt der Ebene mit 0 −−→ −−→ −−→ P3 P0 = OP0 − OP3 = −2 durch −3 −−→ |0 − 2 − 3| 5 |P3 P0 · ~n| √ = =√ . d= |~n| 3 3 Das gleiche Ergebnis kann man mit Hilfe der Hesse-Normalform erhalten: da ist, −−→ x y z 2 1 2 4 5 d = |c − OP3 · ~n0 | = c − √ − √ − √ = √ − √ − √ − √ = √ , 3 3 3 3 3 3 3 3 −−→ y z 2 1 2 4 5 x c − OP3 · ~n0 = c − √ − √ − √ = √ − √ − √ − √ = − √ < 0 3 3 3 3 3 3 3 3 die trennt die Ebene E den Ursprung und den Punkt P3 . KAPITEL 4 Lineare Algebra 1. Der Vektorraum Rn Definition der Form Basis n 4.1 . Der Vektorraum R besteht aus allen Spaltenvektoren a1 a2 ~a = . . . an und wird von der kanonischen oder naturlichen 0 1 1 0 ~e1 = . , ~e2 = . .. .. 0 0 , 0 0 . . . , ~en = . . .. 1 Das Skalarprodukt zweier Vektoren ~a und ~b ist deniert als ~a · ~b = a1 b1 + a2 b2 + . . . + an bn Der Vektorraum Rn versehen mit diesem Skalarprodukt heit Euklidischer Raum. Der Vektor ~a besitzt die L ange (den Betrag, die Norm) v uX √ u n 2 |~a| := ~a · ~a = t aj j=1 und der Winkel zwischen den Vektoren ~a und ~b wird deniert als cos ^(~a, ~b) := Beispiel Satz ~a · ~b |~a| · |~b| 4.1. Gram-Schmidtsches Orthonormierungsverfahren. Es gilt n 4.1. Sind die ( Vektoren ~v1 , ~v2 , . . . , ~vn des R paarweise orthogonal, d.h. gilt ~vi · ~vj = 1, 0, i = j, i 6= j, so sind die Vektoren linear unabhangig. 125 126 4. LINEARE ALGEBRA Beweis: Es sei α1~v1 + . . . + αn~vn = ~0 ⇒ (α1~v1 + . . . + αn~vn ) · ~vj = αj ~vj · ~vj = αj |~vj2 | = 0. # 4.2. (Gram-Schmidtsches Orthonormierungsverfahren) Es sei~ en b1 , . . . , ~bk ∈ Rn (k ≤ n) linear unabhangige Vektoren des Rn . Hieraus wird nun eine Orthonormalbasis ~c1 , . . . , ~ck ∈ Rn (k ≤ n) der linearen Hulle Lin (~b1 , . . . , ~bk ) konstruiert: Satz (1) Man setzt 1 ~ b1 . ~ |b1 | (2) Der zweite Vektor soll nun zu ~c1 bzw. ~b1 orthogonal sein. Deshalb zerlegt man den Vektor ~b2 in die zu ~c1 parallele Komponente = Projektion von ~b2 auf ~c1 und den dazu orthogonalen Vektor: ~c1 = ~c20 = ~b2 − (~b2 · ~c1 )~c1 und normiert ~c2 = ~c20 . |~c20 | (3) Nun wird der Vektor ~c3 aus ~b3 so konstruiert, dass ~c3 orthogonal zu ~c1 und ~c2 ist, d.h. wir bilden zunachst die Projektionen von auf ~c1 und ~c2 und berechnen dann ~b3 ~c30 = ~b3 − (~b3 · ~c1 )~c1 − (~b3 · ~c2 )~c2 und normieren ~c3 = (4) Man fahrt so fort bis ~ck0 und normiert = ~bk − ~c30 . |~c30 | k−1 X (~bk · ~ci )~ci i=1 ~ck = ~ck0 . |~ck0 | 4.1. In jedem Schritt ist ein Element ~ci konstruierbar. Ware dem nicht so, so ware der Vektor ~bi linear abhangig von ~c1 , . . . , ~ci−1 und damit Bemerkung ~b1 , . . . , ~bi−1 . Das ist aber nach Voraussetzung ausgeschlossen! 1. DER VEKTORRAUM v Rn 127 vu┴ vu u Sind nur 2 linear unabhangige Vektoren ~u, ~v zu orthogonalisieren, so entsteht das orthogaonale System durch ~u1 = ~u und ~u2 = ~v~u⊥ der orthogonale Vektor zur Projektion von ~v auf ~u. Durch Normieren der Vektoren erhalt man orthonor- w w┴ u3 u2 wu2 E wu1 u1 male Vektoren. Im Fall von 3 Vektoren ~u, ~v, w~ gewinnt man zunachst 2 orthogonale bzw. orthonormale Vektoren von ~u, ~v wie bereits beschrieben. Der dritte Vektor w~ lasst sich in einen Anteil, der in der von ~u und ~v aufgespannten Ebene liegt, und einen dazu orthogonalen Anteil aufspalten. Dieser orthogonale Anteil ist die gesuchte dritte Richtung, durch Normieren erhalt man den 3. normierten Vektor. Es seien die folgenden 3 Vektoren gegeben: ~v1 = 1 2 0 3 , ~ v = 2 4 0 5 8 , ~ v = 3 8 1 5 6 . Man benutze das Gram-Schmidtsche-Orthonormierungsverfahren, um eine Basis fur Lin (~v1 , ~v2 , ~v3 ) zu konstruieren. 128 4. LINEARE ALGEBRA (1) ~u1 := 1 ~v |~v1 | 1 = √1 14 1 2 0 3 . (2) ~u02 := ~v2 − (~v2 )~u1 = ~v2 − (~v2 · ~u1 )~u1 = ~v2 − 2 −4 5 2 1 √ 2 14 und wir erhalten ~u2 = |~u1 | ~u02 = 17 0 2 · 28 2 −4 5 2 1 2 0 3 = 2 −4 1 28 − 72 · 49 = 5 2 4 1 ~u3 = |~u10 | ~u03 = √121 . 3 0 −2 8−2−2 1−4+4 5+0−5 6−6−2 = . (3) ~u03 := ~v3 − (~v3 )~u1 − (~v3 )~u2 = ~v3 − (~v3 · ~u1 )~u1 − (~v3 · ~u2 )~u2 = 1 2 0 3 4−2 0−4 5−0 8−6 = 4 1 0 −2 8 1 5 6 − √ 1 2 14 · und wir erhalten 2. LINEARE ABBILDUNGEN UND KOORDINATENDARSTELLUNGEN 129 2. Lineare Abbildungen und Koordinatendarstellungen 2.1. Lineare Abbildungen und ihre Basisdarstellung. Seien V, W Vektorraume uber R. Mit einer Abbildung f : V → W ( von V in W \) wird jedem Vektor ~v ∈ V " ein eindeutig bestimmter Vektor w~ = f (~v ) ∈ W, das sogenannte Bild von ~v unter f zugeordnet. Definition 4.2. Eine Abbildung heit linear, wenn gilt ist homogen; d.h. f (α~v) = α f (~v) fur alle α ∈ R, ~v ∈ V, ist additiv; d.h. f (~u + ~v) = f (~u) + f (~v) fur alle ~u, ~v ∈ V. Man nennt lineare Abbildungen auch lineare Transformationen oder auch lineare Operatoren. L.1: f L.2: f Beispiele fur lineare Abbildungen: Beispiel 4.2. Die Multipliaktion mit einer festen m × n-Matrix A l : Rn → Rm , Beispiel l(~x) := A~x. 4.3. Der Dierentialoperator d : C 1 (I) → C 0 (I), dx d f (x) := f 0 (x). dx Mit C 0 (I) bzw. C 1 (I) bezeichnet man den Vektorraum aller I ⊆ R stetigen bzw. stetig dierenzierbaren Funktionen. Beispiel auf dem Intervall 4.4. Das Integral Z f→ b f (x) dx, f ∈ C 0 (I). a 4.5. Die Werkstobeanspruchung eines elastischen Korpers, auf den von auen Krafte wirken, wird in der linearen Elastostatik durch den Spannungstensor S (3 × 3- Matrix) beschrieben. Beispiel Bemerkung Summe 4.2. Da zu linearen Abbildungen f, g : V → W und α ∈ R, die f + g : V → W, (f + g)(~v ) := f (~v ) + g(~v ) und das α-fache αf : V → W, (αf )(~v ) := αf (~v ) wieder lineare Abbildungen sind, bilden die linearen Abbildungen selbst wieder einen Vektorraum L(V, W ) := {f ; f : V → W ist linear.} 130 4. LINEARE ALGEBRA Im folgenden sei V = W = Rn . Wir betrachten also nur noch lineare Abbildungen des Rn in sich. Satz 4.3. Gegeben sei eine lineare Abbildung f : Rn → Rn . Mit der Matrix F = (f (~e1 , f (~e2 ), . . . , f (~en )), deren Spalten aus den Bildern der naturlichen Basisvektoren bestehen, gilt f (~x) = F ~x. Man nennt F die Abbildungsmatrix von f bezuglich der naturlichen Basis. Beweis: F ur ~x = x1~e1 + . . . + xn~en folgt ! n n X X f (~x) = f xi~ei = xi f (~ei ) = F ~x. i=1 Bemerkung # i=1 4.3. Man beachte, dass die Matrix F die Abbildungsmatrix der linearen Abbildung bzgl. der naturlichen Basis ist. In einer anderen Basis sieht die Matrix anders aus! Beispiel 4.6. Die Abbildung f : R3 → R3 , f ((x, y, z)T ) = (x, y + 2z, z)T ist linear, da x2 x1 x2 x1 αf y1 + βf y2 = α y1 + 2z1 + β y2 + 2z2 z2 z1 z2 z1 αx1 + βx2 αx1 + βx2 = αy1 + βy2 + 2(αz1 + βz2 ) = f αy1 + βy2 . αz1 + βz2 αz1 + βz2 Die Abbildung besitzt bezuglich der Basis 1 ~e1 = 0 , 0 0 ~e2 = 1 , 0 0 ~e3 = 0 1 die Abbildungsmatrix 1 0 0 F = (f (~e1 ) f (~e2 ) f (~e3 )) = 0 1 2 0 0 1 2. LINEARE ABBILDUNGEN UND KOORDINATENDARSTELLUNGEN 131 und damit ist 1 0 0 1 0 0 x x f (~x) = f ((x, y, z)T ) = 0 1 2 ~x = 0 1 2 y = y + 2z . 0 0 1 0 0 1 z z 4.3. Eine Basis B = {~b1 , ~b2 , . . . , ~bn } heit orthogonal, wenn die Vektoren ~bi , i = 1, 2, . . . , n, paarweise orthogonal sind, d.h. Definition ~bi · ~bj = 0 fur i 6= j. Die Basis B = {~b1 , ~b2 , . . . , ~bn } heit orthonormal, wenn sie orthogonal ist und alle Basisvektoren normiert sind. Beispiel 4.7. Die naturliche Basis ist orthonormal. Definition 4.4. Eine n × n-Matrix heit orthogonal, wenn gilt: AT A = E, (also AT = A−1 ). 4.4. Fur eine n × n-Matrix A sind aquivalent (1) A ist orthogonal. (2) Die Abbildung T (~x) = A~x ist isometrisch (langentreu), d.h. Satz fur alle ~x ∈ Rn . (3) Die Abbildung T (~x) = A~x ist kongruent (langen- und winkeltreu), d.h., T erhalt das Skalarprodukt (A~x) · (A~y ) = ~xT AT A~y = ~xT ~y = ~x · ~y , f ur alle ~x, ~y ∈ Rn . (4) Die Spalten (Zeilen) von A bilden eine orthonormale Basis des |A~x| = |~x|, Rn . Beweis: Wir beweisen nur (1) ⇐⇒ (4) : T ~a1 ( ~aT 0, 2 T T A A = E ⇔ . ~a1 ~a2 . . . ~an = E ⇐⇒ ~ai ~aj = ~ai ·~aj = . 1, . T ~an i 6= j, i = j. # 132 4. LINEARE ALGEBRA Beispiel 4.8. Drehungen in der Ebene um den Nullpunkt lauten in kartesi- schen Koordinaten: d : R2 → R2 , ! x y d x cos ϕ − y sin ϕ x sin ϕ + y cos ϕ = ! , mit dem Drehwinkel ϕ, wie man sich leicht uberzeugt, ist wegen |d(~x)| = |~x| : ~x = 0 d(~x) = x y0 ! x y ! |~x| cos ψ |~x| sin ψ = ! und ! ! |~x| cos(ϕ + ψ) |~x|(cos ϕ · cos ψ − sin ϕ · sin ψ) = |~x| sin(ϕ + ψ) |~x|(sin ϕ · cos ψ + cos ϕ · sin ψ) ! ! x cos ϕ − y sin ϕ −y ⊥ ⊥ = (cos ϕ) ~x + (sin ϕ) ~x , ~x = x sin ϕ + y cos ϕ x = = y' d x sinφ x ┴ y cos φ x φ ψ x' x x Die Abbildung d ist linear mit der orthogonalen Abbildungsmatrix D= cos ϕ − sin ϕ sin ϕ cos ϕ ! , det D = 1. 2. LINEARE ABBILDUNGEN UND KOORDINATENDARSTELLUNGEN 133 2.2. Basiswechsel. Definition 4.5. Es sei B = (~b1 , . . . , ~bn ) eine (beliebige) Basis des Rn , die wir gleichzeitig als invertierbare n × n-Matrix mit den Spalten ~b1 , . . . , ~bn ansehen. Die eindeutig bestimmten Koezienten x0i ∈ R der Zerlegung ~x = x01~b1 + . . . + x0n~bn heien Koordinaten des Vektors ~x ∈ Rn , und man nennt x01 x0 2 0 ~xB = ~x = . , .. x0n mit ~x = x01~b1 + . . . + x0n~bn den Koordinatenvektor von ~x bezuglich B. Es ist x01~b1 + . . . + x0n~bn = B~x0 = B~xB . Damit gilt fur die Koordinatentransformation beim Basiswechsel von (~e1 , . . . , ~en ) nach (~b1 , . . . , ~bn ) : Substitutionsformel: ~x = B~xB bzw. ~x = B~xB + ~v , Transformationsformel: ~xB = B −1~x bzw. ~xB = B −1 (~x − ~v ) , (~v , ~x, ~xB ∈ Rn ). Beispiel 4.9. Wir betrachten die Basis B = {(1, 2)T , (3, −1)T } und die Stan- dardbasis I = {(1, 0)T , (0, 1)T }. Wenn ~u die Koordinaten ~uB = Basis B hat, wie lauten die Koordinaten in der Standardbasis? Es gilt ~u = B~uB = I~uI = ~uI und damit sind die Koordinaten in der Standardbasis ! ! ~uI = B~uB = 3 2 e2 b1 15 e1 b 2 4 1 3 2 −1 3 4 = 15 2 ! . (3, 4)T in der 134 4. LINEARE ALGEBRA 3. Eigenwerte und Eigenvektoren Wozu benotigt man Eigenwerte und Eigenvektoren? • Diagonalmatrizen sind leicht zu handhaben. Eigenvektoren werden zur Diagonalisierung von Matrizen verwendet. (siehe spater) • Zur Analyse von Quadriken bzw. quadratischen Formen. Darauf gehen wir nicht ein. • F ur die Langzeitvorhersage von Wetter oder auch der Entwicklung einer Population basierend auf Wahrscheinlichkeitsmatrizen bzw. sogenannten Markovschen Ketten. Sollte in der Statistik/Stochastik behandelt werden. • F ur stochastische Modelle. • Matrizen reprasentieren lineare Abbildung (Drehung, Scherung, Spiegelung). Eigenvektoren geben die Geraden an, die dabei erhalten bleiben. Und Strecken auf diesen Geraden werden um die Eigenwerte gestreckt bzw. gestaucht. • Invarianten physikalischer Systeme: Eigenfrequenzen, Eigenformen und gegebenenfalls auch Dampfungscharakteristik eines schwingfahigen Systems, Knicklast eines Knickstabs (siehe Balkentheorie), Hauptspannungen in der Festigkeitslehre: Umrechnung der Spannungen in ein Koordinatensystem, in dem es keine Schubspannungen gibt. Eigenwerte spielen in der Quantenmechanik eine besondere Rolle. • Bestimmung von Drehachse und Drehwinkel. • Anwendung in der Bildverarbeitung: In der Bildverarbeitung werden Eigenvektoren gerne benutzt, um Objekte auszurichten. Wenn man beispielsweise Mikroskopbilder von ellipsenformigen Bakterien hat, gibt der grote Eigenvektor die Lage der Hauptachse an (daher auch Hauptachsentransformation). Mit dieser Hauptachse konnen alle Bilder gleich ausgerichtet (gedreht) werden. Die Eigenwerte geben die Verteilung entlang der Achsen an. Sie sind unabhanging von der Ausrichtung, so da man sie zum Vermessen oder Klassizieren benutzten kann, ohne das Bild vorher zu drehen. • Systeme gewohnlicher Dierentialgleichungen 1. Ordnung. 3. EIGENWERTE UND EIGENVEKTOREN Definition 135 4.6. Eine Zahl λ ∈ C heit Eigenwert der Matrix einer reellen oder komplexen n×n-Matrix A, wenn es mindestens einen Spaltenvektor ~b ∈ Cn , ~b 6= ~0, gibt mit A~b = λ~b. Jeder Vektor ~b 6= ~0, der diese Gleichung erfullt, heit Eigenvektor von A zum Eigenwert λ. 3.1. Bestimmung von Eigenwerten. Wenn λ ein Eigenwert der Matrix A ist, dann gibt es einen Spaltenvektor ~b 6= ~0 mit A~b = λ~b ⇔ (A − λE)~b = ~0. Folglich besitzt das Gleichungssystem (16) nichttriviale Losungen und damit ist die Determinante der Koezientenmatrix gleich Null, also det (A − λE) = 0. Umgekehrt, ist diese Determinate gleich Null, dann hat das Gleichungssystem nichttriviale Losungen (vgl. Rechenregeln fur Determinanten (2.7) bzw. Cramersche Regel 2.9). Insgesamt haben wir damit, λ ist ein Eigenwert der Matrix A genau dann wenn gilt: det (A − λE) = 0. Deshalb Zur Berechnung der Eigenwerte einer n×n-Matrix betrachtet man (mit einer Variablen λ) das charakteristische Polynom von A χA (λ) := det (A − λE). Die Nullstellen des charakteristischen Polynoms sind die Eigenwerte der Matrix A. Beispiel 4.10. Wir betrachten die Matrix 0 −1 0 A = −1 −1 1 , 0 1 0 es ist −λ −1 0 A − λE = −1 −1 − λ 1 0 1 −λ und damit det (A − λE) = (−λ)(−1 − λ)(−λ) + 0 + 0 − 0 − (−λ) − (−λ) = −λ2 − λ3 + 2λ = 0 ⇔ λ2 + λ3 − 2λ = λ(λ2 + λ − 2) = 0 136 4. LINEARE ALGEBRA und ergibt die Nullstellen λ1 = 0 sowie 2 λ + λ − 2 = 0 ⇐⇒ λ2,3 1 =− ± 2 r 1 +2 4 und die Nullstellen λ2 = 1 und λ3 = −2. Wenn man die Determinante det (A − λE) = χA (λ) berechnet und nach Potenzen von λ ordnet, so erhalt man χA (λ) = (−λ)n + (spur A)(−λ)n−1 + . . . + det A, wobei spur A = a11 + a22 + . . . + ann die Summe der Elemente der Hauptdiagonale ist. Beispiel 4.11. Fur obige Matrix 0 −1 0 A = −1 −1 1 0 1 0 ist spur A = 0 − 1 + 0 = −1 und Polynom det A = 0, was auch aus dem charakteristischen χA (λ) = (−λ)3 + (−1)λ2 + 2λ + 0 ablesbar ist. 3.2. Algebraische Vielfachheit. Das charakteristische Polynom χA (λ) = (−λ)n + (spur A)(−λ)n−1 + . . . + det A ist folglich ein Polynom n-ten Grades (fur eine n × n-Matrix) und hat deshalb n nicht notwendigerweise voneinander verschiedene komplexe Nullstellen λ1 , λ2 , . . . λn . D.h. wir haben die Nullstelle λ1 mit der Vielfachheit k1 , die Nullstelle λ2 mit der Vielfachheit k2 , . . . , die Nullstelle λr mit der Vielfachheit kr . Dabei kann man die Eigenwerte der Groe nach ordnen λ1 ≤ λ2 ≤ . . . λr und es ist k1 + k2 + . . . + kr = n. 4.7. Man bezeichnet die Vielfachheit ki der Nullstelle λi als die algebraische Vielfachheit des Eigenwertes λi . Definition 3.3. Eigenvektoren, Eigenräume und geometrische Vielfachheit. Hat man nun alle Eigenwerte der Matrix A bestimmt, so werden dann die Eigenvektoren be- rechnet, d.h. man lost das Gleichungssystem (A − λi E)~b = ~0, i = 1, 2, . . . , r. Da die Determinate der Koezientenmatrix gleich Null ist, besitzt das Gleichungssystem nichttriviale Losungen mit n − Rang (A − λi E) freien Parametern. 3. EIGENWERTE UND EIGENVEKTOREN Definition 137 4.8. Jede Losung ~b 6= ~0 von (A−λi E)~b = ~0 ist ein Eigenvektor zum Eigenwert λi . V (λi ) = {~b ∈ Cn : (A − λi E)~b = ~0} = Kern (A − λi E) heit Eigenraum zum Eigenwert λi , (1 ≤ i ≤ r). Man nennt die Dimension des Eigenraumes Dim V (λi ) die geometrische Vielfachheit des Eigenwertes λi . Die algebraische und die geometrische Vielfachheit stimmen i. Allg. nicht uberein! Wie man leicht sieht ist: Dim V (λi ) = n − Rang (A − λi E). Bemerkung 4.4. Da die Eigenwerte die Nullstellen des charakteristischen Polynoms sind, gilt χA (λ) = (−λ)n + (spur A)(−λ)n−1 + . . . + det A = (λ − λ1 )k1 (λ − λ2 )k2 · · · (λ − λr )kr = (−λ)n + (k1 λ1 + k2 λ2 + . . . + kr λr ) + . . . + λk11 λk22 · · · λkr r mit den algebraischen Vielfachheiten ki , i = 1, 2, . . . , r. Hieraus liest man ab, spur A = k1 λ1 + k2 λ2 + . . . + kr λr det A = λk11 λk22 · · · λkr r Diese Formeln sind nutzlich fur Rechenkontrollen, auerdem gestattet insbesondere die 2. Formel Eigenwerte zu erraten, da die Eigenwerte Teiler des Absolutgliedes des charakteristischen Polynoms sind. Beispiel 4.12. Es sei 5 4 2 A = 4 5 2 . 2 2 2 138 4. LINEARE ALGEBRA Wir bestimmen die Eigenwerte als Nullstellen des charakteristischen Polynoms: 5−λ 1 − λ −1 + λ 4 2 0 = det (A − λE) = 4 5−λ 2 5−λ 2 4 ~z1 − ~z2 2 2 2 2−λ 2 2−λ 1−λ 0 0 = 9−λ 2 = (1 − λ)[(9 − λ)(2 − λ) − 8] 4 ~s2 − ~s1 2 4 2−λ = (1 − λ)[18 − 11λ + λ2 − 8] = (1 − λ)(λ − 10)(λ − 1) = −(λ − 10)(λ − 1)2 . Folglich hat die 3 × 3-Matrix A den Eigenwert λ1 = 1 mit der algebraischen Vielfachheit k1 = 2 und den Eigenwert λ2 = 10 mit der algebraischen Vielfachheit k2 = 1. Wir bestimmen nun die Eigenvektoren, zunachst fur λ1 = 1. Dazu losen wir das Gleichungssystem 0 b1 4 4 2 (A − λ1 E)~b = ~0 ⇔ 4 4 2 b2 = 0 , 0 b3 2 2 1 das die Losung b1 = s, b2 = t, b3 = −2s − 2t mit Eigenraum zum Eigenvektor λ1 = 1 : t, s ∈ R besitzt. Folglich ist der 0 1 s V (λ1 ) = V (1) = t = s 0 + t 1 , −2s − 2t −2 −2 Die Vektoren 1 0 −2 s, t ∈ R . 0 und 1 bilden eine Basis von V (1). Deshalb hat −2 Dimension 2 und der Eigenwert λ1 = 1 die geometrische der Eigenraum die Vielfachheit 2. Nun zum Eigenwert λ2 = 10. b1 0 −5 4 2 ~ ~ (A − λ2 E)b = 0 ⇔ 4 −5 2 b2 = 0 2 2 −8 0 b3 3. EIGENWERTE UND EIGENVEKTOREN 139 und wird mittels Gau-Algorithmus umgeformt zu −5 4 2 4 −5 2 2 2 −8 ≈ 0 ~z1 + 5~z3 0 1 ~z2 − 4~z3 0 0 0 −5 4 2 ≈ 4 −5 2 1 ~z 2 3 1 1 −4 9 18 0 0 1 −2 −9 −18 0 ≈ 0 1 −2 1 −4 0 1 1 −4 0 0 0 0 0 0 und hat die Losung b3 = r, b2 = 2r und b1 = −b2 + 4b3 = −2r + 4r = 2r mit r ∈ R Folglich ist der Eigenraum zum Eigenvektor λ2 = 10 : 2 2r V (λ2 ) = V (10) = 2r = r 2 , r ∈ R . r 1 2 Eine Basis fur den Eigenraum V (10) ist der Vektor 2 und die Dimension 1 des Eigenraumes ist damit 1. Folglich hat der Eigenwert λ2 = 10 die geometrische Vielfachheit 1. In diesem Beispiel stimmen die algebraische und die geometrische Vielfachheit der Eigenwerte uberein, dass ist i.Allg. aber nicht so. In diesem Beispiel stimmen die algebraische und die geometrische Vielfachheit der Eigenwerte uberein, dass ist i.Allg. aber nicht so. Beispiel 4.13. Gegeben sei A= a b c d ! ∈ R2×2 . Es werden zunachst die Eigenwerte als Nullstellen des charakteristischen Polynoms bestimmt: a−λ b χA (λ) = c d−λ = (a − λ)(d − λ) − cb = λ2 − (a + d)λ + (ad − bc) = λ2 − (spur A)λ + det A = (λ − λ1 )(λ − λ2 ) = 0 Anschlieend wird fur jeden Eigenwert λi , i = 1, 2, der Eigenraum und eine Basis des Eigenraums bestimmt. Dazu lost man das Gleichungssystem a − λi b c d − λi ! b1 b2 ! = Im Fall n = 2 gibt es somit 4 verschiedene Falle: (1) λ1 , λ2 ∈ R, λ1 6= λ2 , 0 0 ! . 140 4. LINEARE ALGEBRA (2) λ1 = λ2 ∈ R algebraische = geometrische Vielfachheit = 2, (3) λ1 = λ2 ∈ R algebraische Vielfach. = 2 6= geometrische Vielfachheit = 1, (4) λ2 = λ1 ∈ C, λ1 6∈ R. Es seien konkrete Zahlenbeispiele fur alle 4 Falle angegeben: Es sei ! 1 2 2 1 A= . Wir bestimmen die Eigenwerte χA (λ) = det (A−λE) = 1−λ 2 2 1−λ hat die Nullstellen: λ1,2 = 1 ± ! = (1−λ)2 −4 = 1−2λ+λ2 −4 = λ2 −2λ−3 = 0 p 1 − (−3) = 1 ± 2. Folglich hat A die beiden Eigenwerte λ1 = −1 und λ2 = 3. Die algebraische Vielfachheit von λ1 = −1 und λ2 = 3 ist 1. Wir bestimmen nun die Eigenraume: Fur λ1 = −1 : ! x y (A − λ1 E) 2 2 2 2 = ! x y ! −1 1 ! ! 0 0 = ergibt die Losung y = t und x = −t, d.h. ( V (λ1 ) = V (−1) = −t t ! =t ) t∈R . , −1 1 Eine Basis fur den Eigenraum V (−1) ist der Vektor ! und die Dimension des Eigenraumes ist damit 1. Folglich hat der Eigenwert λ1 = −1 die geometrische Vielfachheit 1. Nun fur λ2 = 3 : (A − λ2 E) x y ! = −2 2 2 −2 ! x y ! = 0 0 ! ergibt die Losung y = t und x = t, d.h. ( V (λ2 ) = V (3) = t t ! 1 1 =t ! ) , t∈R . ! 1 Eine Basis fur den Eigenraum V (3) ist der Vektor und die Dimension 1 des Eigenraumes ist damit 1. Folglich hat der Eigenwert λ2 = 3 die geometrische Vielfachheit 1. Es sei A= 3 0 0 3 ! . 3. EIGENWERTE UND EIGENVEKTOREN 141 Wir bestimmen die Eigenwerte 3−λ 0 0 3−λ χA (λ) = det (A − λE) = ! = (3 − λ)2 = 0 hat die Nullstelle: λ1,2 = 3. Folglich hat A die beiden Eigenwerte λ = λ1 = λ2 = 3. Die algebraische Vielfachheit von λ = 3 ist 2. Wir bestimmen nun den Eigenraum: Fur λ = 3 : ! ! ! ! (A − λE) x y 0 0 0 0 = x y 0 0 = ist erfullt fur alle (x, y)T ∈ R2 , d.h. V (3) = R2 und der Eigenraum hat die Dimension 2. D.h. der Eigenwert λ = 3 hat die algebraische und geometrische Vielfachheit 2. Es sei ! 2 1 0 2 A= . Wir bestimmen die Eigenwerte 2−λ 1 0 2−λ χA (λ) = det (A − λE) = ! = (2 − λ)2 = 0 hat die Nullstelle: λ1,2 = 2. Folglich hat A die beiden Eigenwerte λ = λ1 = λ2 = 2. Die algebraische Vielfachheit von λ = 2 ist 2. Wir bestimmen nun den Eigenraum: Fur λ = 2 : ! ! ! ! (A − λE) x y = 0 1 0 0 x y ! ! 0 0 = und der Eigenraum ist ( V (λ) = V (2) = Eine Basis fur den Eigenraum t 0 V (2) =t 1 0 ) , ist der Vektor t∈R . 1 0 ! und die Dimension des Eigenraumes ist damit 1. Folglich hat der Eigenwert λ = 2 die geometrische Vielfachheit 1. Es sei ! A= cos ϕ − sin ϕ sin ϕ cos ϕ 142 4. LINEARE ALGEBRA Bestimmung der Eigenwerte: χA (λ) = det (A − λE) = det cos ϕ − λ − sin ϕ sin ϕ cos ϕ − λ ! = (cos ϕ − λ)2 + sin2 ϕ = 1 − 2λ cos ϕ + λ2 = 0 fur λ1,2 = cos ϕ ± p cos2 ϕ − 1 = cos ϕ ± i sin ϕ. Falls ϕ 6= kπ, k ∈ Z gibt es keine reellen Eigenwerte und damit auch keine reellen Eigenvektoren. Die komplexen Eigenraume sind: Fur λ1 = cos ϕ + i sin ϕ : x y (A − λ1 E) ! = ! cos ϕ − cos ϕ − i sin ϕ − sin ϕ sin ϕ cos ϕ − cos ϕ − i sin ϕ ! ! −i −1 x = sin ϕ = 1 −i y x y ! 0 0 ! und hat die Losung y = t und x = it, und der Eigenraum ist ( V (λ1 ) = V (cos ϕ + i sin ϕ) = Eine Basis fur den Eigenraum it t ! =t V (cos ϕ + i sin ϕ) i 1 ! ) t∈C . , ist der Vektor erhalt man fur λ2 = cos ϕ − i sin ϕ : (A − λ2 E) x y ! = i 1 ! . ! cos ϕ − cos ϕ + i sin ϕ − sin ϕ sin ϕ cos ϕ − cos ϕ + i sin ϕ ! ! i −1 x = sin ϕ = 1 i y x y ! 0 0 ! und hat die Losung y = t und x = −it, und der Eigenraum ist ( V (λ) = V (cos ϕ + i sin ϕ) = −it t ! =t −i 1 ! ) , t∈C . Eine Basis fur den Eigenraum V (cos ϕ − i sin ϕ) ist der Vektor Beispiel 4.14. Es sei 5 −7 7 A = 4 −3 4 4 −1 2 −i 1 Analog ! . 3. EIGENWERTE UND EIGENVEKTOREN 143 Bestimmung der Eigenwerte 5−λ −7 7 det (A − λE) = 4 −3 − λ 4 4 −1 2−λ = (5 − λ)(−3 − λ)(2 − λ) − 16 · 7 − 28 + 28(3 + λ) + 4(5 − λ) + 28(2 − λ) = (−15 − 2λ + λ2 )(2 − λ) − 112 − 28 + 28 · 5 + 20 − 4λ = −30 − 4λ + 2λ2 + 15λ + 2λ2 − λ3 − 140 + 140 + 20 − 4λ = −λ3 + 4λ2 + 7λ − 10 = 0. Wir mussen den ersten Eigenwert "erraten\. Man ndet schnell, dass λ1 ein Eigenwert ist, die ubrigen Eigenwerte ndet man durch abdividieren: (−λ3 + 4λ2 + 7λ− 10) : (λ − 1) = −λ2 + 3λ + 10 =1 −λ3 + λ2 3λ2 + 7λ 3λ2 − 3λ 10λ − 10 10λ − 10 0 Folglich ergeben sich die beiden anderen Eigenwerte aus zu λ2,3 also λ2 = 5 und sind fur λ1 = 1 : λ3 = −2. λ2 − 3λ + 10 = 0 r 3 3 7 9 = ± + 10 = ± , 2 4 2 2 Die dazugehorigen Eigenvektoren und Eigenraume (A − λ1 E)~x = ~0 ≈ 0 −6 6 0 ~z1 − ~z3 0 −3 3 0 ~z2 − ~z3 4 −1 1 0 Damit ist λ1 = 1 ist x3 = x2 = t und 4 −7 7 0 ⇐⇒ 4 −4 4 0 4 −1 1 0 0 −1 1 0 ≈ 0 −1 1 0 . 4 −1 1 0 x1 = 14 (t − t) = 0. Der Eigenraum zum Eigenvektor 0 0 V (λ1 ) = V (1) = t = t 1 , t 1 t∈R . 144 4. LINEARE ALGEBRA Fur λ2 = 5 : 0 −7 7 0 (A − λ2 E)~x = ~0 ⇐⇒ 4 −8 4 0 4 −1 −3 0 Damit ist λ2 = 5 ist x3 = x2 = t und x1 = 14 (t + 3t) = t. 0 −7 7 0 ≈ 0 −7 7 0 ~z2 − ~z4 4 −1 −3 0 Der Eigenraum zum Eigenvektor 1 t V (λ2 ) = V (5) = t = t 1 , t 1 t∈R . Fur λ3 = −2 : (A − λ3 E)~x = ~0 ≈ ~z2 − ~z3 Damit ist ist 1 −1 1 0 0 0 4 −1 4 x2 = 0, x1 = t und −1 1 0 −1 4 0 −1 4 0 0 1 0 0 0 0 . 1 0 0 x3 = −t. Der Eigenraum zum Eigenvektor 1 7 −7 7 0 ⇐⇒ 4 −1 4 0 ≈ 4 4 −1 4 0 4 1 −1 1 0 1 0 0 ≈ 0 0 0 0 ≈ 0 0 0 3 0 0 0 1 t V (λ3 ) = V (−2) = 0 = t 0 , −t −1 λ3 = −2 t∈R . Alle Eigenwerte λ1 , λ2 , λ3 haben die algebraische und die geometrische Vielfachheit 1. 3.4. Invarianten. 4.5. Es sei A eine reelle oder komplexe n × n-Matrix. Dann gilt: (1) A und die transponierte Matrix AT haben dasselbe charakteristische Polynom, deshalb besitzen sie dieselben Eigenwerte ( aber im Allg. andere Eigenraume). (2) Die ahnlichen Matrizen A und B −1 AB haben dasselbe charakte- Satz ristische Polynom und deshalb auch dieselben Eigenwerte; ~b ist ein Eigenvektor zu A genau dann wenn B −1~b Eigenvektor von B −1 AB ist. (3) Die Matrix A ist genau dann invertierbar, wenn alle Eigenwerte 6= 0 sind. Ist λ ein Eigenwert von A mit dem Eigenvektor ~b, dann ist λ−1 Eigenwert von A−1 mit demselben Eigenvektor ~b. 3. EIGENWERTE UND EIGENVEKTOREN 145 Beweis: zu (1): Es gilt (A − λE)T = AT − λE T = AT − λE und det (A − λE) = det (A − λE)T = det (AT − λE). Beide Polynome sind also identisch und haben damit dieselben Nullstellen = Eigenwerte. zu (2): Es gilt det (A−λE) = det B −1 ·det (A−λE)·det B = det (B −1 (A−λE)B) = det (B −1 AB−λE). Damit sind beide charakteristische Polynome identisch und haben dieselben Nullstelle = Eigenwerte. Weiterhin gilt A~b = λ~b ⇐⇒ ABB −1~b = λBB −1~b = B(λB −1~b) ⇐⇒ (B −1 AB)(B −1~b) = λ(B −1~b). zu (3): det A = λk11 λk22 · · · λkr r 6= 0 ⇐⇒ λi 6= 0 fur alle i = 1, 2, . . . , r. Auerdem ist 1 A~b = λ~b ⇐⇒ ~b = λA−1~b ⇐⇒ A−1~b = ~b. λ # 4.5. Die Koezienten des charakteristischen Polynoms χA (λ) sind Invarianten der n × n-Matrix A, bzw. Invarianten der zugehorigen linearen Bemerkung Abbildung ~x → A~x, da sie sich bei einem Basiswechsel nicht andern. Satz 4.6. Eigenvektoren ~b1 , ~b2 , . . . , ~br zu paarweise verschiedenen Eigen- werten sind linear unabhangig. Beweis: Aus α1~b1 + α2~b2 + . . . + αr~br = ~0 folgt nach Anwendung von A : α1 A~b1 + α2 A~b2 + . . . + αr A~br = α1 λ1~b1 + α2 λ~b2 + . . . + αr λr~br = ~0 und nach Subtraktion von λ1 (α1~b1 + α2~b2 + . . . + αr~br ) = ~0 erhalt man (λ1 − λ2 )α2~b2 + (λ1 − λr ) . . . + αr~br = ~0. Wendet man auf diese Gleichung wiederum A an und subtrahiert das λ2 -fache dieser Gleichung, so folgt: (λ1 − λ3 )(λ2 − λ) α3~b3 + . . . + (λ1 − λr )(λ2 − λr )αr~br = ~0. Sukzessive Fortsetzung ergibt (λ1 − λr )(λ2 − λr ) · · · (λr−1 − λr )αr~br = ~0 146 4. LINEARE ALGEBRA woraus αr = 0 folgt. Dies ergibt ruckwarts eingesetzt αr−1 = . . . = α2 = α1 = 0. # 3.5. Diagonalisierung. Besonders g unstig ist der Fall, wenn man eine Basis aus Eigenvektoren bilden kann: Satz 4.7. Besitzt eine reelle oder komplexe n × n-Matrix n linear un- abhangige Eigenvektoren ~b1 , ~b2 , . . . , ~bn mit A~bi = λi~bi , und den nicht notwendiger Weise verschiedenen Eigenwerten λi , dann bringt die Transformationsmatrix B = (~b1 ~b2 . . . ~bn ) (mit den Eigenvektoren als Spalten) die Matrix A auf Diagonalform, d.h., es gilt, wenn die Reihenfolge der λi mit den der ~bi ubereinstimmt, B −1 AB = Beweis: AB = (A~b1 Beispiel A~b2 . . . λ1 0 0 . . . 0 λ2 0 . . . 0 0 λ3 . . . 0 0 0 .. . .. . .. . . . .. . . 0 0 0 A~bn ) = (λ1~b1 =: D. . . . λn λ2~b2 . . . λn~bn ) = BD. # 4.15. Es sei −2 −8 −12 A= 1 4 4 . 0 0 1 Man berechne A100 . Es ist von sehr groem Nutzen, wenn es gelingt A durch eine entsprechende Transformation auf Diagonalgestalt zu bringen, denn dann gilt: Ak = (BDB −1 )k = (BDB −1 )(BDB −1 )(BDB −1 ) · · · (BDB −1 ) k λ1 0 . . . 0 0 λk . . . 0 2 −1 k −1 = BD B = B . B . . . . . . . . . . . . 0 0 . . . λkn 3. EIGENWERTE UND EIGENVEKTOREN 147 1. Wir bestimmen die Eigenwerte von A : −2 − λ −8 −12 det (A − λE) = 1 4−λ 4 0 0 1−λ = (−2 − λ)(4 − λ)(1 − λ) + 8(1 − λ) = (−2λ + λ2 )(1 − λ) = λ(λ − 2)(1 − λ) = 0 und wir erhalten die Eigenwerte λ1 = 0, λ2 = 1, λ3 = 2. 2. Wir bestimmen die Eigenvektoren: zu losen ist des GS (A − λi E)~b = ~0 : fur λ1 = 0 : −2 −8 −12 0 −2 −8 0 0 0 0 0 0 4 4 0 ≈ 1 4 0 0 ≈ 1 4 0 0 1 0 0 1 0 0 0 1 0 0 0 1 0 4 4 4t V (λ1 ) = V (0) = −t = t −1 , t ∈ R , ~b1 = −1 . 0 0 0 fur −3 −8 −12 0 0 1 3 4 0 ≈ 1 3 1 0 0 0 0 0 0 4 4t V (λ2 ) = V (1) = 0 = t 0 , −t −1 λ2 = 1 : 0 0 0 1 0 0 4 0 ≈ 1 0 4 0 0 0 0 0 0 0 4 t ∈ R , ~b2 = 0 . −1 fur λ3 = 2 : −4 −8 −12 0 −4 −8 0 0 0 0 0 0 2 4 0 ≈ 1 2 0 0 ≈ 1 2 0 0 1 0 0 −1 0 0 0 1 0 0 0 1 0 2t 2 2 V (λ1 ) = V (0) = −t = t −1 , t ∈ R , ~b1 = −1 . 0 0 0 3. Diagonalisierung: 4 4 2 B = −1 0 −1 0 −1 0 148 4. LINEARE ALGEBRA Wir bestimmen B −1 : 4 4 2 1 0 0 4 4 2 1 0 0 2 4 0 1 2 0 −1 0 −1 0 1 0 ≈ 1 0 1 0 −1 0 ≈ 1 0 1 0 −1 0 0 −1 0 0 0 1 0 1 0 0 0 −1 0 1 0 0 0 −1 4 1 2 2 0 0 1 2 1 0 0 12 ≈ 1 0 1 0 −1 0 ≈ 0 0 1 − 12 −2 2 0 1 0 0 0 1 0 0 0 −1 0 −1 Damit ist 1 2 B −1 = 0 − 21 und 1 2 0 −1 −2 2 4 4 2 0 0 0 100 100 −1 A = BD B = −1 0 −1 0 1 0 0 −1 0 0 0 2100 1 0 4 2101 1 2 −2100 2 0 −1 = 299 0 0 −2100 0 0 0 −1 0 − 21 −2 2 Satz 1 2 0 −1 0 − 21 −2 2 −2102 −4 − 2102 2101 2101 . 0 1 1 2 4.8. (Eigenwertproblem für symmetrische Matrizen) Fur jede reelle symmetrische n × n-Matrix gilt: (1) Alle Eigenwerte von A sind reell. (2) Eigenvektoren zu verschiedenen Eigenwerten von A sind orthogonal. (3) Algebraische und geometrische Vielfachheit jedes Eigenwertes sind gleich. Beweis: Wir beweisen nur die erste Eigenschaft. Ist λ ∈ C ein Eigenwert und ~b ∈ Cn ein Eigenvektor von A, so folgt A~b = λ ~b und durch komplexe Konjugation A~b = λ ~b ⇐⇒ A~b = λ~b ⇐⇒ A~b = λ~b, da A reell ist. Damit erhalt man λ~bT~b = (A~b)T~bT = ~bT AT~b = ~bT λ~b = λ~bT~b und wegen ~bT~b = n X i=1 bi bi = n X i=1 |bi |2 > 0 4. POSITIV DEFINITE MATRIZEN ergibt sich λ = λ und folglich ist λ eine reelle Zahl. 149 # 4. Positiv definite Matrizen Die Bestimmung der Extremwerte einer reellen Funktion in n Veranderlichen ist eng verbunden mit der Frage, wann eine quadratische Form q(~x) = ~xT A~x fur ~x 6= ~0 nur positive oder nur negative Werte annimmt. Definition 4.9. Eine quadratische Form q(~x) = ~xT A~x bzw. die zugehori- ge symmetrische Matrix A, heit positiv definit (negativ definit), wenn aus ~x 6= ~0 stets q(~x) = ~xT A~x > 0 (q(~x) = ~xT A~x < 0) folgt. Die quadratische Form heit indefinit, wenn sie sowohl positive als auch negative Werte annimmt. Sie heit positiv (negativ) semidenit, wenn stets q(~x) = ~xT A~x ≥ 0 (q(~x) = ~xT A~x ≤ 0) gilt. Bemerkung 4.6. In der speziellen Relativitatstheorie spielen die nach H.A.Lorentz benannten Transformationen x0 y0 z0 t0 =W x y z t , mit einer 4 × 4 Matrix W des Raum-Zeit-Kontinuums, so dass die quadratische Form q(x, y, z, t) = x2 + y 2 + z 2 − c2 t2 invariant bleibt, eine wichtige Rolle. Diese quadratische Form ist indenit; es gibt "raumartige\ Vektoren ~u ∈ R4 mit q(~u) > 0 und "zeitartige\ Vektoren ~v ∈ R4 mit q(~v) < 0. 4.9. Notwendige Bedinung: Wenn die symmetrische Matrix A positiv denit ist, so mussen alle Hauptdiagonalelemente positiv sein. Satz Beweis: Ist die Matrix A positiv denit, so muss insbesondere f ur die EinheitsvekT toren e~i gelten ~ei A~ei = aii > 0. # 150 4. LINEARE ALGEBRA Beispiel 4.16. Die Matrix 1 2 −2 A = 2 −5 −4 −2 −4 5 ist nicht positiv denit. 4.10. Positivitat reeller symmetrischer Matrizen: (1) D = diag (α1 , α2 , . . . , αn ) ist genau dann positiv denit, wenn Satz positiv sind. (2) Die reelle symmetrische Matrix A (also A = AT ) ist genau dann positiv denit, wenn W T AW fur irgend eine invertierbare n × n Matrix W positiv denit ist. (3) Die relle symmetrische Matrix A ist genau dann positiv denit, wenn samtliche Eigenwerte von A positiv sind. alle αi P ur alle ~x 6= ~0 ⇐⇒ alle αi > 0. Beweis: zu 1) q(~x) = ~xT D~x = ni=1 αi x2i > 0 f zu 2) A positiv denit, dann gilt ~xT (W T AW )~x = (~xW )T A(W ~x) > 0 fur alle ~x 6= ~0, ist dagegen W T AW positiv denit, so folgt (W −1 )T (W T AW )W −1 = A ist positiv denit. 3) folgt aus 1) und 2) mit einem Hauptachsensystem W. Beispiel # 4.17. Die Matrix 1 2 −2 A= 2 5 −4 −2 −4 5 ist positiv denit mit den Eigenwerten λ1 = 1, λ2 = 5 + √ 24 und λ3 = 5 − √ 24. KAPITEL 5 Zahlenfolgen, Grenzwerte und Zahlenreihen 1. Folgen Definition 5.1. Unter einer Folge reeller Zahlen (oder einer reellen Zah- lenfolge) versteht man eine auf N0 erklarte reellwertige Funktion, die jedem n ∈ N0 ein an ∈ R zuordnet: N0 3 n → an ∈ R. Man schreibt hierfur und (an )n≥0 , oder auch a0 , a1 , a2 , . . . . Die Zahlen an heien Glieder der Folge. Die direkte Vorschrift n → an wird als explizites Bildungsgesetz, die rekursive Denition der an als implizites Bildungsgesetz bezeichnet. Eine Zahlenfolge heit beschrankt, wenn es reelle Konstanten K1 und K2 gibt mit K1 ≤ an ≤ K2 f ur alle n ≥ 0. (an )n∈N Beispiel √ 5.1. an = n, n = 0, 1, 2, . . . , ist eine explizit angegebene Zahlenfolge (an )∞ n=0 . Beispiel 5.2. Dagegen ist an+1 = Beispiel 5.3. Eine implizite Bildungsvorschrift ist ebenfalls schrift. an+1 1 = 2 q a2n , a2n +1 a1 = 1, 1 an + , an eine implizize Bildungsvor- a1 = 2. Typisch fur die implizite Bildungsvorschrift ist die Vorgabe eines Startwertes, hier a1 = 2. 151 152 5. ZAHLENFOLGEN, GRENZWERTE UND ZAHLENREIHEN 5.2. Eine Zahlenfolge (an )n≥0 heit • monoton wachsend, wenn an ≤ an+1 f ur alle n gilt, • monoton fallend, wenn an ≥ an+1 f ur alle n gilt, • streng monoton wachsend bzw. streng monoton fallend, wenn < Definition • • • anstelle von ≤ bzw. > anstelle von ≥ fur alle n gilt, nach oben beschrankt, wenn es ein reelles K gibt, so dass an ≤ K fur alle n gilt, nach unten beschrankt, wenn es ein reelles k gibt, mit k ≤ an fur alle n, beschrankt, wenn sie sowohl nach oben als auch nach unten beschrankt ist, d.h. es gibt k, K ∈ R mit k ≤ an ≤ K fur alle n. Beispiel 5.4. Die Folge an := n1 , n ≥ 1, ist streng monoton fallend und be- schrankt, es gilt: Beispiel 1 n > 1 n+1 und 1 ≥ n1 ≥ 0. 5.5. Die Folge an := 1 − n1 , n ≥ 1, ist streng monoton wachsend und 1 beschrankt, es gilt 1 − n1 ≤ 1 − n+1 1 n+1 ≤ 1 n und 1 ≥ 1 − n1 ≥ 0. a 1 ist beschrankt, da 0 ≤ 1+a = 1− 1+a ≤ 1 gilt, auerdem ist die Folge monoton fallend, da a2n+1 − a2n = a a+1 − a2n = a (1−(a +1)) = − a a+1 ≤ 0 gilt, d.h. a2n+1 ≤ a2n ⇐⇒ an+1 ≤ an , da an ≥ 0 gilt. a +1 Mittels vollstandiger Induktion kann man zeigen, dass an = √1n ist. Induktionsstart: a1 = √11 . Induktionsannahme: ak = √1k . Beispiel 5.6. Die Folge an+1 = ⇐⇒ q 2 n a2n 1+a2n 2 n 2 n 2 n 2 n 2 n 2 n 2 n 4 n 2 n Induktionsschritt: ak+1 = q a2k a2k +1 r = 1 k 1 +1 k = q 1 . k+1 5.3. Eine Zahlenfolge (an )n≥0 , strebt oder konvergiert gegen den Grenzwert a ∈ R, wenn es zu jeder beliebig kleinen vorgegebenen Definition Schranke ε > 0 einen Index n0 ∈ N gibt, so dass gilt |an − a| < ε fur alle n ≥ n0 . Man schreibt: an → a fur n → ∞ oder kurz an → a bzw. limn→∞ an = a. Jede gegen Null konvergierende Folge heit Nullfolge. Nicht konvergente Folgen heien divergent. 1. FOLGEN Beispiel 153 5.7. Fur die Folge (an )n>0 mit an = nα , α ∈ R, gilt ∞, α > 0, α lim an = lim n = 1, α = 0, n→∞ n→∞ 0, α < 0, Der Fall fur α = 0 folgt unmittelbar aus n0 = 1. Nun zum Fall eine beliebige positive reelle Zahl, dann gilt nα > K ⇐⇒ n > √ α α > 0. Es sei K K. Es gibt folglich immer unendlich viele Glieder der Folge mit an > K und damit ist n→∞ lim nα = ∞ f ur α > 0. Im Fall α < 0, sei ε > 0 eine beliebige reelle Zahl. Dann gilt α 0<n =n −|α| = 1 n−|α| 1 < ε ⇐⇒ < n|α| ⇐⇒ n > ε r |α| 1 ε und deshalb ist n→∞ lim n−|α| = 0. zel Bemerkung √ α n 5.1. Man beachte, dass fur eine irrationale Zahl α > 0 die Wur- deniert ist als eα ln n . 5.1. Fur jede konvergente Zahlenfolge (an )n≥0 gilt (1) Der Grenzwert ist eindeutig bestimmt, d.h. aus lim an = a und Satz n→∞ folgt a = b. n→∞ (2) Konvergente Zahlenfolgen sind beschrankt, d.h. es gibt eine Konstante K mit |an | ≤ K fur alle n ∈ N0 . lim an = b Beweis: zu (1): Wir nehmen an, dass gilt lim an = a und lim an = b, d.h. es gilt n→∞ n→∞ |an − a| < ε f ur alle n ≥ n0 und |an − b| < ε fur alle n ≥ n1 . Damit ist aber auch |a − b| beliebig klein, da aus den Voraussetzungen folgt |a − b| = |a − an + an − b| ≤ |a − an | + |an − b| ≤ 2ε fur n ≥ max(n0 , n1 ). zu (2): Es sei ε = 1, da die Zahlenfolge konvergent ist, gilt |an − a| ≤ 1 ⇔ −1 ≤ an − a ≤ 1 ⇐⇒ a − 1 ≤ an ≤ a + 1 fur n ≥ n0 fur n ≥ n0 . D.h. alle Glieder der Zahlenfolge mit n ≥ n0 liegen zwischen a − 1 und a + 1. Es verbleiben damit endlich viele Glieder der Zahlenfolge, die u.U. auerhalb des Intervalls [a − 1, a + 1] liegen, deshalb mussen diese endlich vielen Glieder extra mit 154 5. ZAHLENFOLGEN, GRENZWERTE UND ZAHLENREIHEN einbezogen werden, es sei K1 := min(a − 1, a0 , a1 , . . . , an0 −1 ) und K2 := max(a + 1, a0 , a1 , . . . , an0 −1 ), dann gilt K1 ≤ an ≤ K2 fur alle n ≥ n0 . Definition # 5.4. Ist (an )n≥0 eine Folge und n0 < n1 < n2 < . . . < nm < . . . eine (unendliche) aufsteigende Indexfolge, an0 , an1 , an2 . . . , anm , . . . Teilfolge von (an )n≥0 . dann heit die Folge Unmittelbar aus der Denition folgt: Ist lim an = a, dann konvergiert auch jeder (unendliche) Teilfolge gegen a. n→∞ Definition 5.5. Man sagt, dass eine Folge (bestimmt) gegen den un- eigentlichen Grenzwert ∞ divergiert, wenn zu jedem noch so groem K ∈ R die Ungleichung an ≥ K f ur alle n > n0 (K) gilt. Analog deniert man die bestimmte Divergenz gegen den uneigentlichen Grenzwert −∞. Beispiel 5.8. Fur die Folge(an )n>0 mit an = xn , n ∈ N, gilt lim an = lim xn = n→∞ n→∞ ∞, 1, 0, x > 1, x = 1, |x| < 1, x ≤ −1. divergent fur Es ist x ∈ R fest gewahlt und wir betrachten die Folge x, x2 , x3 , x4 , . . . , xn , . . . . Wir untersuchen nur den Fall |x| < 1 genauer, wie man leicht sieht fallt die Folge in diesem Fall monoton (der Funktionsverlauf von xn , fur 0 ≤ x ≤ 1 und n = 2, 3, 5, 7, 10, 20 ist im folgenden Bild dargestellt). Um die Konvergenz nachzuweisen, mussen wir zeigen, dass für alle ε > 0 1. FOLGEN 155 existiert ein n0 (ε) (n0 darf und wird vom gew ahlten ε n n |an − a| = |x | < ε ist, für alle n > n0 . Es ist |x | = |x|n ≤ ε dann gilt |x|n < ε ⇐⇒ ln(|x|n ) = n ln |x| < ln ε ⇐⇒ n > ln ε ln |x| abhangen), so dass fur x = 0, falls x 6= 0, fur 0 < |x| < 1. Man beachte, dass der naturliche Logarithmus eine monoton wachsende Funktion ist, die fur 0 < x < 1 negative reelle Werte annimmt. Folglich wahlt man als n0 die kleinste naturliche Zahl mit n > lnln|x|ε fur |x| < 1. Mit diesem n0 ist die Konvergenz f ur |x| < 1 nachgewiesen. Satz 0 < 5.2. (Monotonie-Kriterium) Jede monoton wachsende oder mo- noton fallende beschrankte Zahlenfolge ist konvergent. ohne Beweis. Beispiel 5.9. Die Folge n X 1 1 1 1 an := = 1 + 2 + 2 + ... + 2 2 k 1 2 n k=1 ist oensichtlich monoton wachsend und beschrankt, da fur n > 1 gilt 0≤ 1 1 1 1 ≤ = − 2 n n(n − 1) n−1 n und damit 1 1 1 1 1 1 0 ≤ an ≤ 1 + 1 − + − + ... + − = 2 − ≤ 2. 2 2 3 n−1 n n Nach dem Monotonie-Kriterium existiert der Grenzwert limn→∞ an . Mittels FourierReihen kann man zeigen, dass lim an = n→∞ π2 . 6 156 5. ZAHLENFOLGEN, GRENZWERTE UND ZAHLENREIHEN 2. Grenzwertbestimmung 2.1. Rechenregeln. Aus gegebenen Folgen (an )n≥0 und (bn )n≥0 werden durch Addition, Subtraktion, Multiplikation und Division neue Folgen gewonnen. Satz 5.3. Sind (an )n≥0 und (bn )n≥0 konvergente Zahlenfolgen mit lim an = a n→∞ und n→∞ lim bn = b dann gilt (1) lim an ± bn = a ± b, n→∞ (2) lim an bn = ab, insbesondere ist lim can = ca, fur c ∈ R. n→∞ n→∞ (3) Ist a 6= 0, dann gibt es ein n1 ∈ N0 mit an 6= 0 fur alle n ≥ n1 und fur die Folgen (an )n≥n , (bn )n≥n gilt 1 lim n→∞ 1 1 1 = , an a lim n→∞ bn b = . an a (4) lim |an | = |a|. n→∞ (5) Ist a > 0, dann gibt es ein n2 ∈ N0 mit an > 0 fur alle n ≥ n2 und fur die Folge (an )n≥n gilt 2 lim n→∞ √ an = √ a. Beweisideen: (1) Aus |an − a| → 0 und |bn − b| → 0 folgt als Abschatzung mittels Dreiecksungleichung: |(an ± bn ) − (a ± b)| = |(an − a) ± (bn − b)| ≤ |an − a| + |bn − b| → 0. (2) Wieder Dreiecksungleichung: |an bn −ab| = |an (bn −b)+b(an −a)| ≤ |an | |bn −b|+|b| |an −a| ≤ A |bn −b|+|b| |an −a| → 0, insbesondere ist |an | ≤ A da jede konvergente Folge beschrankt ist (siehe Satz 5.1.) (3) Ist a 6= 0, dann enthalt a − |a|2 , a − |a|2 nicht die Null, aber alle Glieder der Folge ab einem gewissen Index n1 . Fur diese gilt 1 a − an 1 − = an a a an ≤ C |an − a|, fur n ≤ n1 . (4) ||an | − |a|| ≤ |an − a|. (5) Ist a = 0, dann sei ε > 0 beliebig klein gewahlt und es gibt einen Index √ n0 ∈ N0 , so dass an ≤ ε2 gilt f ur alle n ≥ n0 . Dann gilt aber auch an ≤ ε 2. GRENZWERTBESTIMMUNG fur diese n und damit 157 √ an → 0. Ist dagegen a > 0, dann gilt √ √ √ √ √ | an − a| | an + a| √ |an − a| |a − a| √ √ ≤ n√ | an − a| = = √ → 0. √ | an − a| | an + a| | a| 1 1 Beispiel 5.10. Die Folge an+1 = a + , a1 = 2, ist monoton fallend, da n 2 an 2 1 1 an+1 = 1+ (an2a−1) ≥ 1 und deshalb a −a = − a − ≤ 0 ist, d.h. an+1 ≤ an . n+1 n n 2 an n Damit ist die Folge ebenfalls beschrankt, da 2 = a1 ≥ an ≥ 1 fur alle n gilt. Nach dem Monotonie-Kriterium ist die Folge somit konvergent. Wegen 2 ≥ an ≥ 1 ist der Grenzwert limn→∞ an = a > 0 und es gilt und deshalb auch a1n → a1 fur n → ∞. Ebenso gilt limn→∞ an+1 = a, da (an+1 )n≥1 dieselben Folgenglieder hat wie (an )n≥2 . Deshalb ergibt sich nach Grenz ubergang n → ∞ : 1 1 1 1 1 ⇐⇒ a2 = 1 a = (a + ) ⇐⇒ a2 = (a2 + 1) ⇐⇒ a2 = 2 a 2 2 2 und wegen a > 0 ist a = 1 (und nicht a = −1.) Betrachten wir nun die Folge √ 1 √ x 1 x hn+1 := x an+1 = x an + √ = hn + . 2 2 hn x an √ √ limn→∞ hn = x limn→∞ an = x ist, folgt: Da Die Heron'sche Folge hn+1 1 = 2 x hn + , hn x > 0, konvergiert fur beliebigen Startwert h1 > 0 gegen √ x. 2.2. Grenzwertbestimmung durch Abschätzung. Die Grundidee besteht dar- in Folgenglieder so abzuschatzen, dass man den Grenzwert bekannter Folgen verwenden kann. Satz 5.4. (Vergleichskriterium) Lassen sich fur n ≥ n1 die Glieder der Zahlenfolge (an )n≥0 nach oben und unten abschatzen durch b n ≤ an ≤ c n mit n→∞ lim bn = lim cn = c, n→∞ dann ist die Folge (an )n≥0 konvergent und es gilt lim = c. n→∞ Beweis: F ur jedes ε > 0 gilt c − ε ≤ bn ≤ an ≤ cn ≤ c + ε fur alle hinreichend groen n, also an → c. # 158 5. ZAHLENFOLGEN, GRENZWERTE UND ZAHLENREIHEN Beispiel 5.11. Es ist (sin n)2 = 0, n→∞ n lim da 0 ≤ (sinnn) ≤ n1 . Weiterhin ist 2 lim n→∞ √ n n = 1, da √ √ √ n(n − 1) √ n = (( n n − 1) + 1)n = 1 + n( n n − 1) + ( n n − 1)2 + . . . + ( n n − 1)n 2 nach der Binomischen Formel ≥1+ da fur jedes feste n ∈ N gilt n(n − 1) √ ( n n − 1)2 2 √ n n ≥ 1 ⇐⇒ n ≥ 1 und damit √ n n − 1 ≥ 0. Damit ergibt sich die Ungleichung n ≥ 1+ und es √ n(n − 1) √ n(n − 1) √ 2 ( n n − 1)2 ⇐⇒ n − 1 ≥ ( n n − 1)2 ⇐⇒ ≥ ( n n − 1)2 ≥ 0 2 2 n √ gilt limn→∞ ( n n − 1)2 = 0. Damit ist aber auch q √ √ lim ( n n − 1)2 = lim ( n n − 1) = 0. n→∞ n→∞ und √ n √ √ lim ( n − 1) + 1 = lim (( n n − 1) + 1) = lim n n = 0 + 1 = 1. n→∞ Satz n→∞ n→∞ 5.5. (Grenzwertbildung erhält schwache Ungleichungen) Sind (an )n≥0 und (bn )n≥0 konvergente gilt a = lim an ≤ lim bn = b. n→∞ Bemerkung Folgen mit an ≤ bn fur alle n ≥ n1 , dann n→∞ 5.2. Die Grenzwertbildung erhalt aber i. Allg. keine strikten Ungleichungen. Aus an < bn fur alle n ≥ n1 , folgt nur a = n→∞ lim an ≤ lim bn = b n→∞ und nicht die strikte Ungleichung, wie das Beispiel an = 0 und bn = n1 belegt. 3. ZAHLENREIHEN Satz 159 5.6. (Cauchy-Kriterium) Eine Zahlenfolge (an )n≥0 ist genau dann konvergent, wenn fur alle hinreichend groen Indizes m, n der Betrag |an − am | beliebig klein wird, d.h. wenn es zu jeder (noch so kleinen) positiven Zahl ε > 0 eine naturliche Zahl N (ε) gibt, derart dass |an − am | < ε f ur alle m, n ≥ N (ε). 3. Zahlenreihen Definition mit 5.6. Die aus der Zahlenfolge (an )n≥0 gebildete Folge (sn )n≥0 sn := n X n ≥ 0, ak = a1 + a2 + . . . + ak , k=0 heit unendliche Reihe, sie wird mit ∞ k=0 ak bezeichnet. P Die Zahlen ai heien Glieder der Reihe und die Summen sn := nk=0 ak deren Partialsummen. Man sagt, dass die Reihe konvergiert bzw. divergiert, wenn die Folge der Partialsummen konvergiert bzw. divergiert. Im Fall n→∞ lim sn = s ∈ R ∪ {∞} ∪ {−∞} nennt man s den Wert oder die P Summe der unendlichen Reihe und schreibt ∞ k=0 ak = s. P Beispiel N0 , 5.12. Geometrische Reihe Fur die geometrische Reihe ist an := xn , n ∈ somit lautet die Folge der Partialsummen sn := n X k=0 an = n X ( k 2 3 n x = 1 + x + x + x + ... + x = k=0 1−xn+1 , 1−x n + 1, Mit dem Ergebnis fur n→∞ lim xn aus Beispiel 5.8 ergibt sich ∞ X xn := 1 + x + x2 + x3 + . . . + xn + . . . n=0 := lim N →∞ N X n=0 xn = falls ∞, falls divergent, falls 1 , 1−x |x| < 1, x ≥ 1, x ≤ −1. falls falls x 6= 1, x = 1. 160 5. ZAHLENFOLGEN, GRENZWERTE UND ZAHLENREIHEN Beispiel 5.13. Die Folge bn := n X 1 1 1 1 = 1 + + + ... + k! 1! 2! n! k=0 ist oensichtlich ebenfalls monoton wachsend und beschrankt, da fur k ≥ 2 gilt 0< 1 1 1 1 = ≤ = k−1 k! 1 · 2 · 3 · · · (k − 1) · k 1 · 2 · 2···2 · 2 2 Fur n = 0 ist b0 = 0!1 = 1 und fur n = 1 ist b1 = 1 + 1!1 = 2, fur n ≥ 2 gilt 2≤1+ 1 1 1 1 1 + + ... + ≤ 1 + 1 + + . . . n−1 1! 2! n! 2 2 1 − 21n 1 =1+ ≤ 3. 1 = 1+2 1− n 2 1− 2 Durch den Grenzwert dieser Folge ist die Eulersche Zahl e deniert: n ∞ X X 1 1 = lim . e := n→∞ k! k! k=0 k=0 Bemerkung 5.3. Es gilt ebenfalls lim n→∞ 1 1+ n n = e. Mehr noch kann man zeigen, dass die Exponentialfunktion durch den Grenzwert x n 1+ , n→∞ n ex := lim wohldeniert ist. x ∈ R, 3.1. Konvergenzkriterien. 5.7. (Konvergenzkriterien für Reihen) (1) P Cauchysche Konvergenzkriterium für Reihen: Die Reihe Satz ist genau dann konvergent, wenn es zu jeder noch so kleinen Zahl ε > 0 einen Index N (ε) gibt, so dass |sn − sm | = |am+1 + am+2 + . . . + an | < ε f ur alle m, n ≥ N (ε). Man kann ohne Einschrankung annehmen, dass n > m ist. (2) Notwendiges Konvergenzkriterium: Die Glieder einer konvergenten Reihe bilden eine Nullfolge. (3) Leibniz-Kriterium für alternierende Reihen: Fur jede monoton fallende Nullfolge a0 , a1 , a2 , . . . konvergiert die alternierende Reihe ∞ ∞ k=0 ak X k=0 (−1)k ak = a0 − a1 + a2 − a3 ± . . . . 3. ZAHLENREIHEN 161 Wir beweisen nur (2). Wir setzen m = n − 1 und erhalten wenn die Reihe konvergent ist fur alle ε > 0 : |sn − sn−1 | = |an | < ε f ur alle n > N (ε); d.h. an → 0. Bemerkung 5.4. Bei (2) handelt es sich um ein notwendiges Konvergenz- kriterium, d.h. auch wenn dieses Kriterium erfullt ist, muss die Reihe nicht konvergieren, ist es aber nicht erfullt, so divergiert die Reihe. Beispiel 5.14. Wir wenden das Cauchy-Kriterium auf die Folge der Parti- alsummen sn = ( = 1 m+1 Pn l+1 1 l=1 (−1) l an. Mit n = m + k ist m+k 2 3 k+1 1 (−1) (−1) (−1) X (−1)l+1 = |(−1)m | + + ... + |sn − sm | = l m + 1 m + 2 m + k l=m+1 1 1 1 1 1 1 + − m+2 + m+3 + m+k−1 , falls k gerade, + . . . + − m+k−2 − m+k m+1 1 1 1 1 1 1 + − m+2 + m+3 + . . . + − m+k−3 + m+k−2 + − m+k−1 + m+k , falls k ungerade, ≤ 1 . m+1 D.h. |sn − sm | < ε, fur alle n > m > 1ε − 1 bzw. n > m > 1ε − 1 = N (ε). Damit ist gezeigt, dass die alternierende harmonische Reihe konvergiert. Beispiel Beispiel 0 5.15. Die Reihe P∞ kk k=0 k! divergiert, da ak = kk! keine Nullfolge ist: k k · k · k···k k · k · k···k kk = ≥ = 1 6→ 0. k! 1 · 2 · 3···k k · k · k···k P∞ 1 5.16. Die harmonische Reihe k=1 k gilt. Man kann namlich wie folgt abschatzen: s2k+1 1 1 1 + ... + + + . . . k+1 2k + 1 2k + 2 2 1 1 1 k+3 . ≤ 1 + + 2 · + . . . + 2k · k+1 = 2 4 2 2 P∞ k+1 1 alternierende harmonische Reihe dagegen k=1 (−1) k P∞ k+1 1 Leibniz-Kriterium und es ist k=1 (−1) k = ln 2. 1 =1+ + 2 1 1 + 3 4 Beispiel 5.17. Die Beispiel 5.18. Auf die alternierende Reihe konvergiert nach dem ist divergent, obwohl k→∞ lim ak lim k1 k→∞ ∞ X 1 22 33 44 nn − 2 + 3 − 4 ± ... = (−1)n+1 2 3 4 5 (n + 1)n n=1 ist das Leibniz-Kriterium nicht anwendbar, da nn 1 1 1 = lim = = 6= 0 n n 1 1 n→∞ (n + 1)n n→∞ 1 + e lim 1 + n→∞ n n lim an = lim n→∞ ist. = 162 5. ZAHLENFOLGEN, GRENZWERTE UND ZAHLENREIHEN Beispiel 5.19. Auf die alternierende Reihe ∞ X 1 1 1 1 1 1 1 1− + − + − ± ... 3 − ± ... = (−1)n+1 an 2 8 3 27 4 n n+1 n=1 mit a2k−1 = 1 k3 und a2k = 1 , k = 1, 2, . . . , k+1 ist das Leibniz-Kriterium nicht anwendbar, da wegen Folge der Glieder (an )n≥1 nicht monoton fallend ist. Beispiel 1 k3 1 k+1 < fur k ≥ 2 die 5.20. Die alternierende Reihe ∞ X 1 1 1 1 (−1)n+1 − + ± ... = ln 2 ln 3 ln 4 ln(n + 1) n=1 ist konvergent nach dem Leibniz-Kriterium, da die Folge der Glieder 1 mit an = ln(n+1) eine monoton fallende Nullfolge ist. Satz (an )n≥1 5.8. (Rechenregeln für konvergente Reihen) Fur alle c ∈ R und konvergente Reihen P∞ ∞ X k=0 Bemerkung k=0 ak = a und (ak ± bk ) = a ± b P∞ k=0 bk und = b, a, b ∈ R, ∞ X gilt (c · ak ) = ca. k=0 5.5. Elementare Umformungen, die bei endlichen Summen den Summenwert nicht verandern, sind bei unendlichen Reihen ("unendlichen Summen\) nicht ungeschrankt erlaubt! (1) Es ist i. Allg. nicht erlaubt Klammern wegzulassen. P Beispiel: Die Reihe ∞ asst k=0 ak mit ak = (1 − 1) = 0 ist konvergent. L man aber die Klammern weg, so divergiert die Reihe 1−1+1−1+1−. . . = P∞ k k=0 bk mit bk = (−1) . (2) Man darf i. Allg. aber auch keine Klammern setzen. Im vorigen Beispiel kann man dadurch aus einer divergenten Reihe durch Klammerung eines konvergente Reihe. (3) Eine Umordnung der Reihenglieder ist ohne Zusatzvoraussetzungen nicht erlaubt. 3. ZAHLENREIHEN Beispiel 1 2 3 2 + 5.21. Wir betrachten das folgende Beispiel: 1 2 1 2 ln 2 = 1 − ln 2 = 0 + ln 2 = 1 + 0 + Umordnung 163 1 2 1 − = ln 2 + 1 3 − + 0 − + 1 3 1 3 − − 1 4 1 4 1 2 1 4 + 1 5 1 6 1 6 − + 0 + + + 1 5 1 5 + − + 0 − + 0 + 1 6 − 1 7 + 1 7 1 7 − − 1 8 1 8 1 4 1 8 ... ... ... ... Aber: Satz zen: 5.9. In einer konvergenten Reihe darf man beliebig Klammern sets = a0 + a1 + a2 + . . . = (a0 + . . . + ak1 ) + (ak1 +1 + . . . + ak2 ) + . . . . Beweis: Die Partialsummen s0n = (a0 + . . . + ak1 ) + . . . + (akn−1 +1 + . . . + akn ) der geklammerten\ Reihe bilden eine Teilfolge der konvergenten Folge der Partial" summen sn und konvergieren deshalb gegen denselben Grenzwert. # 3.2. Absolute Konvergenz. Eine Zusatzvoraussetzung, die die Sachlage ver- einfacht ist die absolut Konvergenz: Definition der Betrage 5.7. Die Reihe ∞ P k=0 ∞ X ak heit absolut konvergent, wenn die Reihe |ak | = |a0 | + |a1 | + |a2 | + . . . k=0 konvergiert. Reihen, die zwar konvergieren, aber nicht absolut konvergieren, nennt man bedingt konvergent. 5.22. Die alternierende harmonische Reihe ∞ P ist eine bedingt konvergente Reihe, da die Reihe selbst nach dem Leibniz-Kriterium konvergiert, die Reihe der Betrage, d.h. die harmonische Reihe, ist aber divergent. Beispiel Folgerungen: (1) Jede absolut konvergente Reihe ist konvergent. (−1)k+1 12 k=1 164 5. ZAHLENFOLGEN, GRENZWERTE UND ZAHLENREIHEN (2) Die Reihe ∞ P ak ist genau dann absolut konvergent, wenn die Folge der Par- k=0 tialsummen der Reihe ∞ P |ak | : k=0 Sn := n X |ak | = |a0 | + |a1 | + |a2 | + . . . + |an | k=0 beschrankt ist. Beispiel 5.23. Die Reihe konvergent, falls α > 1, divergent, falls α ≤ 1. Beweis: Wir betrachten zun achst den Fall α > 1. Zu gegebenem m gewahlt, dass n ≤ 2 − 1 gilt. Dann ist ∞ X 1 = α k k=1 ( 1 + ... + m + ... + sn ≤ s2m −1 = 1 + (2m−1 )α (2 − 1)α ∞ m X 4 2m−1 1 2 2α−1 . ≤ 1 + α + α + . . . + m−1 α ≤ = α−1 2 4 (2 ) 2α−1 2 −1 m=0 1 1 + α α 2 3 n sei m so 1 Ist dagegen α ≤ 1, so sind die entsprechenden Partialsummen groer oder gleich den entsprechenden Partialsummen der harmonischen Reihe und diese Reihen divergieren, da die harmonische Reihe divergent ist. # 3. ZAHLENREIHEN 165 3.3. Kriterien für absolute Konvergenz. Diese Kriterien sind die in der Pra- xis am haugsten angewandten zur Untersuchung von Reihen. 5.10. (Kriterien für absolute Konvergenz) (1) Vergleichskriterium: Besteht fur die Reihenglieder die Satz Abschatzung fur 0 ≤ |ak | ≤ bk dann gilt • Ist die Reihe he • ∞ P ak k=0 bk k=0 (absolut) konvergent, so ist auch die Rei- absolut konvergent. Gilt dagegen Eine Reihe ∞ P k ≥ k0 , ∞ P bk k=0 ∞ P |ak | = ∞, k=0 so ist auch ∞ P bk = ∞. k=0 die den Voraussetzungen des Vergleichskriteri∞ P ums genugt, heit Majorante der Reihe ak . k=0 (2) Quotientenkriterium: Ist ak 6= 0 fur alle k ≥ k0 und konvergiert die Folge der Quotienten aa , dann gilt: k+1 k • • Ist k→∞ gent. Ist dagegen gent. < 1, lim ak+1 ak dann ist die Reihe lim ak+1 > 1, ak k→∞ • k=0 ak absolut konver- dann ist die Reihe (3) Wurzelkriterium: • ∞ P ∞ P k=0 ak diver- ∞ P Ist k→∞ lim |ak | < 1, dann ist die Reihe ak absolut konverk=0 gent. ∞ p P Ist dagegen k→∞ lim |ak | > 1, dann ist die Reihe ak diverk=0 gent. Bemerkung p k k p 5.6. Im Fall lim ak+1 = 1 bzw. lim k |ak | = 1 kann man keine ak k→∞ k→∞ Aussage treen, die Reihe kann (bedingt) konvergent oder auch divergent sein. Dies kann leicht mit der alternierenden harmonischen bzw. der harmonischen Reihe belegt werden. Denn es ist k lim = lim k→∞ k + 1 k→∞ r k 1 1 √ = 1. = k limk→∞ k k 166 5. ZAHLENFOLGEN, GRENZWERTE UND ZAHLENREIHEN Wobei wie bereits gezeigt, die alterniernde harmonische Reihe konvergiert, die harmonische Reihe selbst aber divergiert. ak+1 Beweis: Wir weisen die Konvergenz nach. Gilt lim ak < 1, so gibt es eine k→∞ ak+1 reelle Zahl q mit 0 < q < 1, so dass ak < q fur alle k ≥ n0 ∈ N. Dann kann man aber abschatzen: |an0 +k | ≤ q|an0 +k−1 | ≤ q 2 |an0 +k−2 | ≤ . . . ≤ q k |an0 | und die Reihe mit dem allgemeinen Glied bn0 +k = q k |an0 | ist eine konvergente Majorante, da ∞ X nX 0 −1 ∞ X nX 0 −1 ∞ X nX 0 −1 |an0 | . 1 − q l=0 l=0 l=0 l=n0 l=0 l=0 p Fur das Wurzelkriterium ist die Argumentation noch einfacher. Gilt lim k |ak | < 1, k→∞ p so gibt es eine reelle Zahl q mit 0 < q < 1, so dass k |ak | < q ⇐⇒ |ak | < q k fur alle k ≥ n0 ∈ N und damit ist bl = ∞ X ak ≤ bl + |an0 | ∞ X |ak | ≤ |ak | + = = ∞ X bl + |an0 | qk = nX 0 −1 k=n0 k=0 k=0 k=0 nX 0 −1 q l−n0 nX 0 −1 l q = |ak | + q n0 k=0 |ak | + q n0 ∞ X k=0 qk = ∞ X q k−n0 k=n0 nX 0 −1 |ak | + k=0 k=0 bl + q n0 . 1−q Nachweis der Divergenz: Unter den obigen Annahmen ist (an )n≥0 keine Nullfolge. # Beispiel 5.24. Die Reihe ∞ P k=1 sin(k3 +3) 2k3 +2k+1 ist absolut konvergent, da sin(k 3 + 3) 1 2k 3 + 2k + 1 ≤ 2k 3 , ∞ P (da 2k3 + 2k + 1 > 2k3 ) ist und die Reihe Beispiel 5.25. Die Reihe k=0 fur 1 2k3 k≥1 gema Beispiel 5.23 konvergiert. ∞ X 1 1 1 1 + + + ... = 1·2 2·3 3·4 n(n + 1) n=1 1 ist nach dem Vergleichskriterium konvergent, da n(n+1) ≤ n1 ist und die Reihe ∞ P 1 konvergent ist. n n=1 Mit Hilfe der Folge der Partialsummen zeigt man, dass die Folge gegen 1 konvergiert. Es gilt 2 2 sn = n X k=1 ak = 1 − 1 1 1 1 1 1 1 1 + − + − + ... − =1− → 1. 2 2 3 3 4 n n+1 n+1 3. ZAHLENREIHEN Beispiel ∞ P 5.26. Die Reihe n=1 gent, da (n+1)n+2 (n+2)! lim nn+1 n→∞ (n+1)! Beispiel nn+1 (n+1)! 167 ist nach dem Quotientenkriterium diver- n 1 n+1 (n + 1)n+2 (n + 1)! 1 1+ = e > 1. = lim = lim 1 + n→∞ n→∞ (n + 2)!nn+1 n n n+2 5.27. Die Reihe ∞ X 2n 4 8 16 2 + + + + ... = 2! 3! 4! 5! (n + 1)! n=0 1+ ist nach dem Quotientenkriterium konvergent, da 2n+1 (n+2)! lim 2n n→∞ (n+1)! Beispiel 2n+1 (n + 1)! 2 = 0. = lim n→∞ (n + 2)!2n n→∞ n + 2 = lim 5.28. Die Reihe 1 + 3 2 3 4 n ∞ X 2 3 4 n + + + ... = 5 7 9 2n + 1 n=1 ist nach dem Wurzelkriterium konvergent, da s lim n n→∞ Beispiel n 2n + 1 5.29. Die Reihe divergent, da ∞ P k=1 n 1 n = < 1. n→∞ 2n + 1 2 = lim 2 k 3 1+ 2 1 (k ) k ist nach dem Wurzelkriterium s k (k2 ) k 2 1 2 1 2 k 1+ = lim 1+ = · e ≈ 1, 81 > 1. lim k→∞ k→∞ 3 k 3 k 3 Ohne Beweis zwei nur fur absolut konvergente Reihen gultige Rechenregeln: 5.11. Cauchy-Produkt. Fur absolut konvergente Reihen P Satz und ∞ X k=0 ∞ k=0 bk ! ak gilt die Produktformel ∞ X k=0 ! bk = ∞ n X X n=0 P∞ k=0 ak ! ak bn−k = a0 b0 +(a2 b0 +a0 b1 )+(a2 b0 +a1 b1 +a0 b2 )+. . . . k=0 absolut konvergent mit dem Summenwert s, dann konvergiert jede aus k=0 ak durch Umordnung der Glieder entstandene Reihe ebenfalls gegen s. Satz 5.12. Umordnungssatz. Ist die Reihe P∞ k=0 ak P∞ 168 5. ZAHLENFOLGEN, GRENZWERTE UND ZAHLENREIHEN KAPITEL 6 Stetigkeit und Differentation von Funktionen einer Veränderlichen 1. Funktionengrenzwerte 1.1. Grenzwerte. Gegeben sei I ⊆ R ein Intervall, a ∈ I ∪ {−∞, ∞} und f : I\{a} → R. Die Funktion f kann sehr wohl auch an der Stelle x = a erklart sein, wir wollen aber nur wissen wie sich die Funktion in der Umgebung des Punktes x = a verhalt. 6.1. Die Funktion f (x) hat fur x gegen a den rechtsseitigen Grenzwert (bzw. den linksseitigen Grenzwert) c (in Zeichen lim f (x) = c Definition x→a+ bzw. x→a− lim f (x) = c), wenn f ur jede Zahlenfolge (xn )n≥0 aus I mit xn → a und xn > a fur alle n ( bzw. xn → a und xn < a fur alle n) die Zahlenfolge (f (xn ))n≥0 gegen c strebt. f (x) hat f ur x gegen a den Grenzwert c, in Zeichen x→a lim f (x) = c, wenn gilt x→a+ lim f (x) = lim f (x) = c. x→a− Bemerkung 6.1. Diese Denition gilt nicht nur fur endliche Werte a und c, sondern auch fur a, c ∈ {−∞, ∞} Man schreibt x→∞ lim f (x) = c bzw. lim f (x) = c. x→−∞ Beispiel 6.1. Die Funktion sin x1 ist fur alle x 6= 0 erklart und hat fur x → 0 weder einen rechtsseitigen noch einen linksseitigen Grenzwert. Da fur 1 , n ∈ N gilt 2πn lim sin xn →0 xn = 1 = sin(2πn) = 0. xn 1 Dagegen ist aber fur xn = 2πn+ der Grenzwert π 2 lim sin xn →0 1 π = sin(2πn + ) = 1. xn 2 Folglich kann die Funktion sin x1 keinen rechtsseitigen Grenzwert zen. (Analog existiert der linksseitige Grenzwert nicht.) Beispiel x → 0+ besit- 6.2. Es existiert aber der Grenzwert von f (x) = x sin x1 fur x = 0. Dies liegt daran, dass man fur eine Folge xn → 0 und xn > 0 wie folgt abschatzen 169 6. STETIGKEIT UND DIFFERENTATION VON FUNKTIONEN EINER VERANDERLICHEN 170 kann; es ist man also 0 ≤ xn sin x1n ≤ |xn | und damit gilt lim x sin x→0 Satz limn→∞ xn sin x1n = 0. Damit hat 1 = 0. x 6.1. \Epsilon-Delta-Sprache\. Die Funktion f : I\{a} → R hat in x = a den Grenzwert c, wenn f ur alle ε > 0 ein δ = δ(ε) gibt, alle x ∈ I\{a} mit |x − a| < δ gilt |f (x) − c| < ε. In Zeichen: ∀ε > 0 ∃δ > 0 : so dass fur ∀x ∈ I\{a} : |x − a| < δ ⇒ |f (x) − c| < ε. 1.2. Elementare Methoden der Grenzwertbestimmung. 6.2. Aus lim f (x) = c und lim g(x) = d fur c, d ∈ R folgt: x→a x→a (1) lim (f (x) ± g(x)) = c ± d, x→a (2) lim (f (x) · g(x)) = c d, insbesondere ist lim αf (x) = α c fur α ∈ R. Satz x→a x→a falls d 6= 0. Diese Regeln gelten auch fur a = ±∞ aber nur fur endliche Grenzwerte c und d. (3) lim f (x) x→a g(x) Beispiel √ lim x→0 = c , d 6.3. √ √ x+1−1 ( x + 1 − 1)( x + 1 + 1) x+1−1 1 1 √ = lim = lim √ =√ = . x→0 x→0 x( x + 1 + 1) x 2 x( x + 1 + 1) x+1+1 Beispiel 6.4. Fur x 6= 0 gilt cos x − 1 (cos x − 1)(cos x + 1) cos2 x − 1 sin2 x sin x 1 = = =− =− · ·sin x. x x(cos x + 1) x(cos x + 1) x(cos x + 1) x cos x + 1 Fur x → 0 strebt auf der rechten Seite der erste Faktor gegen 1 (siehe Beispiel 6.5), der zweite gegen 12 und der dritte gegen 0. Also gilt cos x − 1 = 0. x→0 x lim 1. FUNKTIONENGRENZWERTE Satz 171 6.3. (Vergleichskriterium). Wenn g(x) ≤ f (x) ≤ h(x) fur alle x in der Nahe von a gilt (bzw. fur alle hinreichend groen x) und und h(x) → c fur x → a (bzw. x → ∞) gilt, dann ist lim f (x) = c (bzw. lim f (x) = c). x→a x→∞ Beispiel 6.5. g(x) → c sin x = 1. x→0 x lim Aus der folgenden Skizze tan x sin x x cos x 1 liest man die folgende Abschatzung fur die Flacheninhalte ab (x > 0): Damit ist fur x > 0 1 1 1 sin x 1 sin x cos x ≤ x ≤ tan x = . 2 2 2 2 cos x sin x 1 cos x x cos x x < 0 aus ⇐⇒ cos x ≤ sin x cos x ≤ x ≤ Analog kann man fur sin x 1 ≤ . x cos x 1 1 1 1 sin x sin x cos x ≥ x ≥ tan x = 2 2 2 2 cos x auf die gewunschte Ungleichung schlieen. Wegen x → 0 ergibt sich die Behauptung. cos x → 1 und 1 cos x →1 1.3. Stetigkeit. Sei I ⊆ R ein Intervall. Definition 6.2. Man nennt eine Funktion f : I → R in x0 ∈ I stetig, wenn bei der Annaherung f (x0 ) streben. Also f ist in x → x0 x0 die Funktionswerte fur stetig f (x) ⇐⇒ lim f (x) = f (x0 ). x→x0 gegen fur 172 6. STETIGKEIT UND DIFFERENTATION VON FUNKTIONEN EINER VERANDERLICHEN Ist x0 ein Randpunkt von I, so ist x → x0 nur als einseitige Annaherung (x < x0 bzw. x > x0 ) zu verstehen. Anschaulich bedeutet es, dass der Graph y = f (x) uber I als eine zusammenhangende Linie (ohne Lucken und Sprunge) dargestellt werden kann. Damit werden die folgenden Arten von Unstetigkeiten ausgeschlossen: Sprungstelle Polstellen Fehlstelle Hat eine in x0 ∈ I zunachst noch nicht denierte Funktion f dort einen Grenzwert lim f (x) = c, x→x0 dann kann diese Denitionslucke durch die Festsetzung f (x0 ) = c geschlossen werden und die so denierte Funktion ist in x = x0 stetig. 6.4. Epsilon-Delta-Sprache\. Eine Funktion f : I → R in x0 ∈ I " stetig, wenn fur alle ε > 0 ein δ = δ(ε, x0 ) existiert, so dass fur alle x ∈ I Satz mit |x − x0 | < δ gilt |f (x) − f (x0 )| < ε. Oder kurz ∀ε > 0 ∃δ > 0 : ∀x ∈ I : |x − x0 | < δ ⇒ |f (x) − f (x0 )| < ε. f(x0) f(x0) x0 Die Funktion f ist stetig in x0. x0 Die Funktion f ist nicht stetig in x0. 1. FUNKTIONENGRENZWERTE 173 6.5. (Stetigkeit) (1) Sind f und g auf einem Intervall I ⊆ R stetig, so gilt das auch Satz fur f + g, αf (α ∈ R) und f g. Ferner ist fg stetig in allen x ∈ I mit g(x) 6= 0. (2) Sind f : I → R und g : D → R stetig mit g(D) ⊆ I, dann ist auch die Verkettung (Komposition) h : D → R mit h(x) = f (g(x)) auf D stetig. 6.6. Die Funktion f (x) = ist stetig in allen sie nicht deniert und damit auch nicht stetig. Beispiel 1 x x 6= 0. Fur x=0 ist ist fur alle x 6= 0 deniert und stetig. In x = 0 ist sie nicht deniert, es exisitert aber der Grenzwert limx→0 sinx x = 1 (siehe Beispiel 6.5). Damit kann eine auf R stetige Funktion f (x) wie folgt deniert werden: ( Beispiel 6.7. Die Funktion f (x) = sin x x sin x , x f (x) = 1, x 6= 0, x = 0. Die "Lucke\ bei x = 0 kann also zu deniert werden. Beispiel 6.8. Ebenso ist die Funktion √ x2 + 1 − 1 g(x) = x2 fur alle x 6= 0 denert und stetig. Es gilt √ lim x→0 √ √ x2 + 1 − 1 ( x2 + 1 − 1)( x2 + 1 + 1) x2 + 1 − 1 1 √ √ = lim = lim = 2 2 2 2 2 x→0 x→0 x 2 x ( x + 1 + 1) x ( x + 1 + 1) und damit ist die Funktion ( g(x) = √ x2 +1−1 , x2 1 , 2 x 6= 0, x=0 auf R stetig. Beispiel 6.9. Auch die verschachtelte\ Funktion " √ x5 + 6x4 + sin4 x + sin x2 f (x) = p√ x + cos2 (3x + 4) · x2 ist fur x ≥ 0 stetig, wobei sie fur x = 0 entsprechend "zudeniert\ werden muss. √ q 4 2 ) x +6x +sin x + sin(x + + sin x + sin(x ) x4 x2 p√ = p√ . x + cos2 (3x + 4) · x2 x + cos2 (3x + 4) x5 6x4 4 2 5 4 174 6. STETIGKEIT UND DIFFERENTATION VON FUNKTIONEN EINER VERANDERLICHEN 6.6. Fur jede auf dem abgeschlossenen Intervall a ≤ x ≤ b stetige Funktion f gilt: (1) Schrankensatz. Es gibt eine Schranke (positive reelle Zahl) K mit |f (x)| ≤ K fur alle x ∈ [a, b]. Man sagt, die stetige Funktione f (x) ist auf dem abgeschlossenen Intervall beschrankt. (2) Minimum und Maximum. Es gibt stets Werte x0 und x1 in [a, b], so dass f (x0 ) ≤ f (x) ≤ f (x1 ) f ur alle x ∈ [a, b] gilt. Man sagt, dass die auf dem abgeschlossenen Intervall stetige Funktion f (x) ihr Minimum und Maximum annimmt. (3) Zwischenwertsatz. Zu jeder Zahl c, die zwischen dem Minimum f (x0 ) und dem Maximum f (x1 ) der stetigen Funktion f (x) liegt, d.h. f (x0 ) ≤ c ≤ f (x1 ), gibt es wenigstens ein x ∈ [a, b] mit Satz f (x) = c. (4) Gleichmäßige Stetigkeit. Zu jeder beliebig kleinen Zahl ε > 0 gibt es eine nur von ε und nicht von x0 abhangige Zahl δ = δ(ε) > 0, so dass f ur alle x, x0 ∈ [a, b] gilt: |x−x0 | ≤ δ ⇒ |f (x)−f (x0 )| < ε. Eine einfache Folgerung ist der 6.7. Nullstellensatz. (1) Ist f : [a, b] → R stetig und haben f (a) und f (b) entgegengesetzte Satz Vorzeichen (f (a)f (b) < 0), dann gibt es wenigstens eine Nullstelle x im Innern von [a, b], also a < x < b mit f (x) = 0. (2) Jedes Polynom ungeraden Grades (≥ 1) hat in R wenigstens eine Nullstelle. 2. DIFFERENTATION 175 2. Differentation 2.1. Definition der Ableitung. Definition 6.3. Ableitung. Die Funktion f sei auf dem Intervall I ⊆ R deniert und x0 ∈ I. (1) Die Funktion f ist in x0 dierenzierbar, wenn der Grenzwert lim x→x0 f (x) − f (x0 ) f (x0 + h) − f (x0 ) = lim h→0 x − x0 h existiert und endlich ist. Dieser Grenzwert wird (sofern er existiert) mit f 0 (x0 ) bezeichnet und heit Ableitung von f in x0 . Man bezeichnet f (x) − f (x0 ) ∆f (x) = ∆x x − x0 auch als Dierenzenquotienten. Ferner sagt man, f ist auf I dierenzierbar, wenn f 0 (x) in jedem Punkt x ∈ I existiert. (2) Die einseitigen Grenzwerte f (x) − f (x0 ) , x→x0 + x − x0 f (x) − f (x0 ) f 0 (x− , 0 ) := lim x→x0 − x − x0 f 0 (x+ 0 ) := lim heien rechtsseitige bzw. linksseitige Ableitung von f in x0 . 2.2. Geometrische Deutung der Ableitung: Tangentenanstieg. Die Tangente an den Graph y = f (x) in (x0 , f (x0 )) ist y = f 0 (x0 )(x − x0 ) + f (x0 ). 2.3. Analytische Deutung: lineare Approximation. Zu einer gegebenen differenzierbaren Funktion f : I → R wird diejenige Gerade g(x) = m(x − x0 ) + f (x0 ) durch (x0 , f (x0 ) gesucht, die f in der Nahe von x0 am besten approximiert. Dabei versteht man unter bester Approximation\, dass gilt " lim x→x0 f (x) − g(x) = 0, x − x0 d.h., dass der relative Fehler nahe x0 klein ist und fur x → x0 gegen 0 strebt. 6. STETIGKEIT UND DIFFERENTATION VON FUNKTIONEN EINER VERANDERLICHEN 176 Die beste lineare Approximation an f in x0 ist: g(x) = f 0 (x0 )(x − x0 ) + f (x0 ). (16) 2.4. Totales Differential. Definition heit 6.4. Ist f : I → R eine in x0 dierenzierbare Funktion, so dy = df (x0 ) = f 0 (x0 )(x − x0 ) totales Differential Beispiel von f an der Stelle x0 . 6.10. Fur die Funktion f (x) = x erhalt man dy = dx = 1 · (x − x0 ) = ∆x. dy=f'(xO)Δx=f'(xO)dx y Δy=y-yO y0 Δx=dx x0 Bemerkung x 6.2. Der Zusammenhang zwischen Ableitung und Dierential ist gegeben durch dy = df (x) = f 0 (x)dx. (Dies ist richtig an jeder Stelle x = x0 .) 2.5. Anwendung: Fehlerrechnung. Aus der Beziehung ∆y ≈ dy ergibt sich sofort |f (x0 + h) − f (x0 )| ≈ |f 0 (x0 )| · |h|. Mit dieser Beziehung ist es moglich, Aussagen uber den Fehler bei der Berechnung von f (x) zu machen, wenn das Argument x fehlerbehaftet bzw. nicht genau bekannt ist. Ist x̃ ein Naherungswert von x mit der Toleranz h, d.h. es gilt |x − x̃| < h, 2. DIFFERENTATION 177 dann gilt fur den absoluten Fehler des Naherungswerts f (x̃) = ỹ : |∆y| = |y − ỹ| ≈ |f 0 (x̃)| · |∆x| < f 0 (x̃)| · h. Beispiel √ 6.11. Fur f (x) = x ergibt sich nahe x0 > 0 : f (x0 + h) ≈ f 0 (x0 )h + f (x0 ) ⇐⇒ p √ 1 x0 + h ≈ x0 + √ h. 2 x0 Fur x0 = 1, 96 und h = 0, 04 erhalt man √ 2 ≈ 1, 4 + 1 0, 04 = 1, 4142857 . . . 2 · 1, 4 den auf 7 Stellen genauen Wert von Satz √ 2 = 1, 41421356 . . . . 6.8. Jede in x0 ∈ I dierenzierbare Funktion f : I → R ist dort stetig. Beweis: Ist f in x0 dierenzierbar, so gilt 0 lim [f (x) − f (x0 ) − f (x0 )(x − x0 )] = lim x→x0 x→x0 f (x) − f (x0 ) − f 0 (x0 ) (x − x0 ) x − x0 =0 und wegen lim f 0 (x0 )(x − x0 ) = 0 ist x→x0 lim (f (x) − f (x0 )) = lim [f (x) − f (x0 ) − f 0 (x0 )(x − x0 )] + lim f 0 (x0 )(x − x0 ) = 0, x→x0 x→x0 x→x0 also ist lim f (x) = f (x0 ). x→x0 # Die Stetigkeit der Funktion f in x0 ∈ I ist notwendig, aber nicht hinreichend für die Differenzierbarkeit von f in x0 ∈ I. D.h. es gilt (1) Ist f in x0 ∈ I unstetig, dann ist f in x0 auch nicht dierenzierbar. (2) Ist dagegen f in x0 ∈ I stetig, so muss f in x0 nicht dierenzierbar sein, wie das Beispiel f (x) = |x| fur x0 = 0 zeigt. 2.6. Differentationsregeln. 178 6. STETIGKEIT UND DIFFERENTATION VON FUNKTIONEN EINER VERANDERLICHEN Satz 6.9. Sind die Funktionen f, g : I → R in x ∈ I dierenzierbar, dann gilt: (1) [f (x) + g(x)]0 = f 0 (x) + g 0 (x), (2) [cf (x)]0 = cf 0 fur alle c ∈ R, (3) [f (x)g(x)]0 = f 0 (x)g(x) + f (x)g 0 (x) (Produktregel), (4) f (x) g(x) 0 = f 0 (x)g(x)−f (x)g 0 (x) g(x)2 sondere gilt 1 g(x) falls 0 =− g(x) 6= 0; g 0 (x) g(x)2 (Quotientenregel), insbe- falls g(x) 6= 0.) Beweis: Wir betrachten die entsprechenden Dierenzenquotienten und gehen dann zum grenzwert uber. zu (1): [f (x) + g(x)] − [f (x0 ) + g(x) ] ∆[f (x) + g(x)] ∆f (x) ∆g(x) = = + → f 0 (x0 ) + g 0 (x0 ), ∆x x − x0 ∆x ∆x zu (2): (2) ist ein Spezialfall von (3), zu (3): [f (x)g(x)] − [f (x0 )g(x0 )] [f (x)g(x)]−f (x0 )g(x) + f (x0 )g(x) − [f (x0 )g(x0 )] ∆[f (x)g(x)] = = ∆x ∆x ∆x ∆f (x) (f (x) − f (x0 ))g(x) + f (x0 )(g(x) − g(x0 ) ∆g(x) = = g(x) + f (x0 ) ∆x ∆x ∆x 0 → f (x0 )g(x0 ) − f (x0 )g 0 (x0 ) zu (4) wir betrachten zunachst ∆ 1 g(x) 1 g(x) − 1 g(x0 ) 0 )) − (g(x)−g(x g(x0 )g(x) = = ∆x ∆x ∆x g(x) − g(x0 ) 1 ∆g(x) 1 g 0 (x0 ) =− · =− · →− ∆x g(x0 )g(x) ∆x g(x0 )g(x) g(x0 )2 und dann folgt die Quotientenregel aus der Produktregel (3). # 2.6.1. Polynome. Fur f (x) = xn , n ∈ N, (n ≥ 1), gilt ∆xn xn − xn0 lim = lim = lim (xn−1 + xn−2 x0 + xn−3 x20 + . . . + x0n−1 ) x→x0 ∆x x→x0 x − x0 x→x0 n−1 X = lim xn−1−k xk0 = nxn−1 . 0 x→x0 k=0 2. DIFFERENTATION 179 Hieraus folgt mittels der Quotientenregel unmittelbar, dass fur x 6= 0 gilt 1 xn 0 =− (xn )0 nxn−1 n = − = − n+1 . 2n 2n x x x 2.6.2. Kreisfunktionen. Satz 6.10. Die Sinus- und Cosinusfunktion sind auf R dierenzierbar. Es gilt (1) (2) (3) (4) (sin x)0 = cos x, (cos x)0 = − sin x, (tan x)0 = (cos1x)2 , (cot x)0 = (sin−1x)2 , x 6= (2k + 1) π2 , x 6= kπ. Beweis: Wir erinnern zunachst an die folgenden Additionstheoreme f ur Sinus und Cosinus: cos(x ± y) = cos x cos y ∓ sin x sin y, sin(x ± y) = sin x cos y ± cos x sin y. und den Grenzwerten sin h = 1, h→0 h lim folgt cos h − 1 = 0, h→0 h lim 1 1 [sin(x + h) − sin x] = lim [sin x cos h ± cos x sin h − sin x] h→0 h h→0 h sin h cosh − 1 + cos x = cos x = lim sin x h→0 h h (sin x)0 = lim (2) analog, (3) und (4) mit Quotientenregel. Beispiel # 6.12. [(x2 + 5 sin x) cos x]0 = (2x + 5 cos x) cos x − (x2 + 5 sin x) sin x = 2x cos x + 5[(cos x)2 − (sin x)2 ] − x2 sin x = 2x cos x + 5 cos 2x − x2 sin x. 2.6.3. Kettenregel. Satz 6.11. Die Verkettung (Komposition) zweier Funktionen f (g(x)) zweier dierenzierbarer Funktionen ist ebenfalls dierenzierbar und es gilt (f (g(x)))0 = f 0 (g(x))g 0 (x). 180 6. STETIGKEIT UND DIFFERENTATION VON FUNKTIONEN EINER VERANDERLICHEN Beweis: Zunachst gilt f (g(x)) − f (g(x0 )) f (g(x)) − f (g(x0 )) g(x) − g(x0 ) f (y) − f (y0 ) g(x) − g(x0 ) = · = · x − x0 g(x) − g(x0 ) x − x0 y − y0 x − x0 mit y = g(x) und y0 = g(x0 ). Da g eine stetige Funktion ist, folgt, dass mit x → x0 auch y = g(x) → y0 = g(x0 ) gilt: D.h. ∆f (g(x)) f (y) − f (y0 ) g(x) − g(x0 ) = lim · x→x0 x→x0 ∆x y − y0 x − x0 f (y) − f (y0 ) g(x) − g(x0 ) = lim · lim = f 0 (y0 )g 0 (x0 ) = f 0 (g(x0 ))g 0 (x0 ). # y→y0 x→x0 y − y0 x − x0 lim Beispiel 6.13. h(x) = (x4 + 6x + 5)3 = f (g(x)) mit g(x) = x4 + 6x + 5 und f (x) = x3 . Damit ist h0 (x) = 3(x4 + 6x + 5)2 · (4x3 + 6) Beispiel 6.14. h(x) = [sin(x4 + 2x)2 ]5 ist mehrfach geschachtelt mit f (x) = x5 , g(x) = sin x, u(x) = x2 , x4 + 2x und muss deshalb schrittweise abgearbeitet werden: h0 (x) = (f (g(u(v(x)))))0 = f 0 (g(u(v(x)))) [g(u(v(x)))]0 = f 0 (g(u(v(x))))g 0 (u(v(x))) [u(v(x))]0 = f 0 (g(u(v(x))))g 0 (u(v(x)))u0 (v(x))v 0 (x), also ist [sin(x4 + 2x)2 ]5 0 = 5(sin(x4 + 2x)2 )4 · sin(x4 + 2x)2 0 = 5(sin(x4 + 2x)2 )4 cos(x4 + 2x)2 · (x4 + 2x)2 0 = 5(sin(x4 + 2x)2 )4 cos(x4 + 2x)2 · 2(x4 + 2x) · x4 + 2x 0 = 5(sin(x4 + 2x)2 )4 cos(x4 + 2x)2 · 2(x4 + 2x)(4x3 + 2). 2.7. Höhere Ableitungen. Die Ableitung der Ableitung von f bezeichnet man, 2 falls sie existiert, mit f 00 (x) oder f (2) (x) oder dxd dxd f (x) oder dxd 2 f (x) bzw. allgemein n fur die n-te Ableitung f (n) (x) oder dxd f (n−1) (x) oder dxd n f (x). Man sagt, dass f n-mal dierenzierbar bzw. stetig dierenzierbar ist, wenn die n-te Ableitung existiert bzw. existiert und stetig ist. Man beachte, dass eine dierenzierbare Funktion nicht notwendig zweimal dierenzierbar sein muss. 2. DIFFERENTATION Beispiel 6.15. Die Funktion 181 fur x ≥ 0, fur x < 0, ist fur alle x ∈ R dierenzierbar mit der Ableitung f 0 (x) = 2|x|. Die Funktion f 0 (x) = 2|x| ist aber f ur x = 0 nicht dierenzierbar. ( f (x) = x|x| = x2 , −x2 , 182 6. STETIGKEIT UND DIFFERENTATION VON FUNKTIONEN EINER VERANDERLICHEN 2.8. Umkehrfunktionen. Wir erweitern unsere Kenntnisse um die sogenannten Umkehrfunktionen: 2.8.1. Grundlagen. 6.5. Es sei f eine auf I ⊆ R erklarte Funktion und D ⊆ I. Man sagt, dass f uber D umkehrbar ist, wenn zu jedem y ∈ f (D) die Definition Gleichung y = f (x) genau eine Losung x ∈ D besitzt. In diesem Fall gibt es eine Umkehrfunktion g : f (D) → D, die jedem y ∈ f (D) das durch y = f (x) eindeutig bestimmte x ∈ D zu; d.h. x = g(y) ⇐⇒ y = f (x). Besitzt f uber D die Umkehrfunktion g : f (D) → D, dann gilt denitionsgema: f (g(y)) = y g(f (x)) = x Beispiel fur alle y ∈ f (D), fur alle x ∈ D. 6.16. Die lineare Funktion f (x) = ax + b mit a 6= 0 ist uber ganz R umkehrbar; die Umkehrfunktion ist 1 g(y) = (y − b), y ∈ R. a f x=3x2 y=x 1 g x = x−2 3 Beispiel 6.17. Dagegen hat die Gleichung y = x2 (y ≥ 0) i. Allg. zwei Losun- gen und deshalb besitzt die Funktion y = f (x) = x2 uber R keine Umkehrfunktion. Schrankt man dagegen die Funktion f (x) = x2 auf die nichtnegative (bzw. nichtpositive) Halbachse ein, so besitzt f (x) eine Umkehrfunktion. Es gilt: Uber √ R+ := {x ∈ R : x ≥ 0} hat f (x) die Umkehrfunktion g1 (y) = y und u ber √ R− := {x ∈ R : x ≤ 0} hat f (x) die Umkehrfunktion g2 (y) = − y. 2. DIFFERENTATION 183 2 f x= x y=x g 1 x = x g 2 =− x 6.12. Hauptsatz uber Umkehrfunktionen (1) Existenz Satz Jede strikt monotone Funktion f : D → R ist umkehrbar. Jede uber einem Intervall I stetig dierenzierbare Funktion f mit f 0 (x) 6= 0 f ur alle x ∈ I ist (uber I ) umkehrbar. (2) Graph Ist f uber D umkehrbar mit der Umkehrfunktion g : f (D) → R, dann liegen der Graph y = f (x), y = g(x) symmetrisch zur Geraden y = x. (3) Ableitung Die Umkehrfunktion g : f (I) → R einer uber dem Intervall I ⊆ R umkehrbaren Funktion f ist in allen x ∈ f (I) mit f 0 (g(x)) 6= 0 dierenzierbar und es gilt • • g 0 (x) = Lemma 1 f 0 (g(x)) . 6.1. Ist die Funktion f : I → R in x0 ∈ I dierenzierbar mit (bzw. f 0 (x0 ) < 0), dann ist f (x) in einer Umgebung von streng monoton wachsend (bzw. streng monoton fallend). 0 f (x0 ) > 0 x0 184 6. STETIGKEIT UND DIFFERENTATION VON FUNKTIONEN EINER VERANDERLICHEN Beweis: Laut Voraussetzung gilt lim x→x0 f (x) − f (x0 ) = f 0 (x0 ) > 0. x − x0 Das bedeutet, dass es ein δ > 0 gibt, so dass f (x) − f (x0 ) ≥γ>0 x − x0 fur |x − x0 | ≤ δ. Fur x > x0 ist deshalb f (x) − f (x0 ) ≥ γ(x − x0 ) > 0 ⇐⇒ f (x) ≥ f (x0 ) + γ(x − x0 ) > f (x0 ). Der Fall f 0 (x0 ) < 0 kann analog bewiesen werden. # Beweis: (des Satzes) zu (1): Ist f auf D strikt monoton, dann folgt aus x1 < x2 sofort f (x1 ) < f (x2 ) oder f (x1 ) > f (x2 ). Deshalb gibt es zu jedem y ∈ f (D) genau ein mit y = f (x). zu (2): Die Ableitung f 0 (x) ist auf I stets positiv oder stets negativ, da sie sonst nach dem Zwischenwertsatz (Satz 6.6) eine Nullstelle besitzen musste. Wegen Lemma 6.1 ist f strikt monoton und somit umkehrbar. zu (2): Im kartesischen Koordinatensystem ist der zu (a, b) an y = x gespiegelte Punkt gerade (b, a). Wegen y = f (x) ⇐⇒ x = g(y) gehort (x, f (x)) genau dann zum Graph der Funktion f, wenn (y, g(y)) = (f (x), x) zum Graphen der Umkehrfunktion g gehort. zu (3): Aus y = f (x) und x = g(y) folgt y = f (x) = f (g(y)) und mit Hilfe der Kettenregel ergibt sich (y)0 = 1 = f 0 (g(y)) · g 0 (y) ⇐⇒ g 0 (y) = .# hat uberall eine positive Ableitung: f (x) = 5x + 1 > 0 und ist deshalb umkehrbar. Auch wenn wir die Funktion g(y) nicht explizit angeben konnen, so wissen wir doch, dass gilt Beispiel 6.18. Die Funktion f (x) = x5 + x, 1 f 0 (g(y)) 0 x ∈ R, 4 g 0 (y) = 1 f 0 (g(y)) = 1 . 5g(y)4 + 1 In der Regel schreibt man g aber wieder als Funktion von x, d.h. g 0 (x) = 1 . 5g(x)4 + 1 2.8.2. Wurzelfunktionen. Zu n ∈ N betrachten wir die Potenzfunktion fn (x) = x , x ∈ R. Fallunterscheidung: n (1) n gerade, n = 2k. In diesem Fall ist fn nicht uber ganz R umkehrbar, da y = x2k = (−x)2k . Wegen fn0 (x) > 0 f ur x > 0 ist fn uber R+ := {x ∈ R; x ≥ 0} √ umkehrbar. Die Umkehrfunktion ist gn (x) = n x fur x ∈ R+ . 2. DIFFERENTATION 185 (2) n ungerade, n = 2k + 1. Mit einem ungeraden Exponenten ist die Potenzfunktion uber ganz R streng monoton wachsend und damit umkehrbar. Folglich gilt: √ y = n x ⇐⇒ y n = x f ur ( x ≥ 0, x ∈ R, n ∈ N, n ∈ N, n gerade, n ungerade, Fur jede nichtnegative reelle Zahl x ≥ 0, jedes n ∈ N und m ∈ Z setzt man √ x := n x, 1 n x m n = x 1 n m . Zur Vermeidung von Fallunterscheidungen wird einheitlich der Denitionsbereich R+ := {x ∈ R : x ≥ 0} festgelegt. Fur einen beliebigen rationalen Exponenten α = d α x = α xα−1 , dx Beweis: Mit f (x) = xn und g(x) = √ n n m ∈ Q gilt: x > 0. ur die Ableitung x = x n erhalt man f d 1 1 xn = 0 = dx f (g(x)) 1 1 n−1 = 1 n xn 1 1 −1 xn n und mit Hilfe der Kettenregel ergibt sich nun 1 m−1 d 1 1 m−1 1 1 d m d 1 m n n n n x = x =m x · x = m xn x n −1 = dx dx dx n m m x n −1 . n 2.8.3. Arcussinus, Arcuscosinus, Arcustangens. Die Sinus- und Cosinusfunktion sind oensichtlich nicht auf R umkehrbar, aber die Sinusfunktion ist uber dem und die zugehorige UmkehrGrundintervall − π2 ≤ x ≤ π2 strikt monoton wachsend π π funktion, deniert auf [−1, 1] mit Werten in − 2 , 2 , heit Arcussinus-Funktion. 186 6. STETIGKEIT UND DIFFERENTATION VON FUNKTIONEN EINER VERANDERLICHEN f (x) = arcsin x. Die Arcussinus-Funktion ist deniert durch h π πi arcsin x : [−1, 1] → − , , 2 2 π π y = arcsin x ⇐⇒ sin y = x und − ≤ y ≤ . 2 2 Fur die Ableitung gilt: d 1 , arcsin x = √ dx 1 − x2 −1 < x < 1. Beweis der Ableitung: Nach der Formel fur die Ableitung der Umkehrfunktion gilt 1 d arcsin x = . dx (cos(arcsin x)) Wir berechnen cos(arcsin x)). Es ist cos2 (arcsin x)) + sin2 (arcsin x)) = cos2 (arcsin x)) + (sin arcsin x)2 = cos2 (arcsin x)) + x2 = 1 √ ⇐⇒ cos2 (arcsin x) = 1 − x2 ⇐⇒ cos arcsin x = 1 − x2 .# Uber dem Intervall (2k − 1) π2 ≤ x ≤ (2k + 1) π2 , k ∈ Z, nennt man den k-ten Zweig des Arcussinus: π πi arcsink x : [−1, 1] → (2k − 1) , (2k + 1) , 2 2 π π y = arcsink x ⇐⇒ sin y = x und (2k − 1) ≤ y ≤ (2k + 1) . 2 2 h Den nullten Zweig des Arcussinus bezeichnet man als Hauptzweig oder auch als Hauptwerte. Die Cosinusfunktion ist uber dem Intervall 2kπ ≤ (2k + 1)π, k ∈ Z, strikt monoton und besitzt deshalb dort eine Umkehrfunktion, den k-ten Zweig des Arcuscosinus. Den nullten Zweig nennt wiederum Hauptzweig oder Hauptwert. 2. DIFFERENTATION 187 Die Arcussinus-Funktion ist deniert durch arccos x : [−1, 1] → [0, π] , y = arccos x ⇐⇒ cos y = x und 0 ≤ y ≤ π. Fur die Ableitung gilt: d −1 arccos x = √ , dx 1 − x2 −1 < x < 1. f (x) = arccos x. Desgleichen besitzen die Tangensund Cotangensfunktion uber den oenen Interval π π len (2k − 1) 2 , (2k + 1) 2 bzw. (2kπ, (2k + 1)π) jeweils eine Umkehrfunktion. Wir behandeln nur die Hauptwerte (k = 0). Die Umkehrfunktion des Tangens ist der Arcustangens π π , arctan x : R → − , 2 2 y = arctan x ⇐⇒ tan y = x und Fur die Ableitung gilt: d 1 arctan x = , dx 1 + x2 − π π ≤y≤ . 2 2 x ∈ R. 188 6. STETIGKEIT UND DIFFERENTATION VON FUNKTIONEN EINER VERANDERLICHEN y = arctan x Die Umkehrfunktion des Cotangens ist der Arcuscotangens arccot x : R → (0, π) , y = arccot x ⇐⇒ cot y = x und 0 ≤ y ≤ π. Fur die Ableitung gilt: d −1 arccot x = , dx 1 + x2 ist x ∈ R. 2.8.4. Exponential- und Logarithmusfunktion. Wie wir bereit gesehen hatten x e := exp(x) := lim n→∞ x n 1+ , x ∈∈ R. n 6.13. Eigenschaften der e-Funktion (1) Positivität. e0 = 1, ex > 0 fur alle x ∈ R. (2) Ableitung. Die e-Funktion ist uberall dierenzierbar und es gilt Satz d x e = ex , dx (3) Funktionalgleichung. x ∈ R. e−x = ex+y = ex · ey , 1 . ex Beweisidee: zu (1) Es ist e0 := limn→∞ 1 + n0 = 1. Aus der Denition folgt auerdem unmittelbar, dass ex ≤ 0 ist. Die strikte Positivitat folgt aus der Stetigkeit und n ex e−x = 1. 2. DIFFERENTATION 189 zu (2) Es ist naheliegend folgendermaen zu beweisen: d x d x n x n d x n−1 e = lim 1 + 1+ = lim = lim 1 + = ex . n→∞ dx n→∞ dx dx x→∞ n n n Das ist zwar richtig, es muss aber begründet werden, dass im vorliegenden d vertauscht werden Fall der Grenzübergang limn→∞ und die Differentation dx dürfen. Wie verzichten auf diesen Nachweis und den Beweis von (3). Eine Folgerung aus (3) ist: exp(rx) = [exp x]r fur x ∈ R, (17) r ∈ Q. Da die e-Funktion uber R strikt monoton wachst, besitzt sie eine auf exp(R) = (0, ∞) denierte Umkehrfunktion, den naturlichen Logarithmus ln: ln : (0, ∞) → R, y = ln x ⇐⇒ ey = x. Insbesondere gilt ln(ex ) = x f ur alle x ∈ R; eln x = x f ur alle x > 0. 6.14. Eigenschaften der Logarithmusfunktion (1) Ableitung.. Die ln-Funktion ist uberall dierenzierbar; fur alle Satz x>0 gilt d 1 ln x = . dx x (2) Funktionalgleichung. der ln-Funktion x ln(xy) = ln x + ln y, ln = ln x − ln y, y (x, y > 0). Beweis: zu (1): Aus den Dierentationsregeln ergibt sich d 1 1 1 ln x = = = . 0 dx exp (ln x) exp(ln x) x (2) ist eine Folgerung aus der Funktionalgleichung fur die e-Funktion (siehe Satz 6.13): Fur x, y ∈ (0, ∞) sei u := ln x, v := ln y, dann gilt x = eu und y = ev sowie ln(xy) = ln(eu ev ) = ln(eu+v ) = u + v = ln x + ln y. Der Sonderfall x = 1 y zeigt ln y1 = − ln y. 6. STETIGKEIT UND DIFFERENTATION VON FUNKTIONEN EINER VERANDERLICHEN 190 2.8.5. Allgemeine Exponential- und Logarithmenfunktionen. Es sei a > 0. Die Formel (ex )r = erx (siehe 17) mit x = ln a ergibt ar = er ln a fur jede rationale Zahl r ∈ Q. deshalb deniert man Definition 6.6. die Potenz ax fur beliebige x ∈ R durch ax = ex ln a , (a > 0). Man nennt x → ax die Exponentialfunktion zur Basis a. Die Eigenschaften dieser Funktion leitet man aus der Denition und den Eigeneigenschaften der Logarithmus- bzw. der Exponentialfunktion her: Fur jede Folge rationaler Funktionen mit rn → x ist ax = lim arn . n→∞ Weiterhin gilt: ax ay = ax+y ; (ab)x = ax bx ; ln(ax ) = x ln a d x a = ax ln a, dx (ax )y = axy ; (x, y ∈ R, a, b > 0). (x ∈ R, a > 0). Fur jede reelle Zahl α ∈ R erhalten wir als die Ableitung der Funktion f (x) = xalpha = eα ln x : 1 1 = αxα = αxα−1 . x x Zu jeder Basis a > 0 ist die Exponentialfunktion f (x) = ax = ex ln a umkehrbar, denn zu jedem y ∈ f (R) = (0, ∞) ist die Gleichung y = ex ln a eindeutig nach x ln y auosbar:x = ln . Nach Vertauschung von x mit y ergibt sich die explizite Form der a Umkehrfunktion loga { Logarithmus zur Basis a: f 0 (x) = eα ln x α loga x = ln x , ln a x ∈ (0, ∞). und die Rechenregeln: loga (xy) = loga x + loga y, d 1 loga x = . dx x ln a 3. ANWENDUNG DER DIFFERENTIALRECHNUNG: KURVENDISKUSSION 191 3. Anwendung der Differentialrechnung: Kurvendiskussion 3.1. Maxima und Minima einer Funktion. 6.7. Es sei f : R ⊇ D → R eine auf D erklarte Funktion. Die Funktion f hat in a ∈ D eine globales oder auch absolutes Maximum (bzw. Minimum) wenn f (x) ≤ f (a) (bzw. f (x) ≥ f (a)) fur alle x ∈ D gilt. Definition In diesem Fall heit a globale Maximalstelle (bzw. Minimalstelle) und f (a) globales Maximum (bzw. Minimum). b ∈ D heit lokales oder auch relatives Maximum (bzw. Minimum), wenn es ein (evtl. kleines) Intervall I um b gibt, so dass f (x) ≤ f (b) (bzw. f (x) ≥ f (b)) f ur alle x ∈ D ∩ I. Minima und Maxima sind Extrema. Lemma Satz 6.2. x0 ist Minimalstelle von f ⇔ x0 ist Maximalstelle von −f. 6.15. Ist f eine auf dem oenen Intervall I dierenzierbare Funk- tion, so gilt: Ist x0 ∈ I eine Extremstelle von f, dann ist f 0 (x0 ) = 0. Ein Punkt x ∈ D mit f 0 (x) = 0 heit stationarer Punkt. Beweis: Es sei x0 eine Maximalstelle in (x0 − ε, x0 + ε), ε > 0. D.h. f (x) ≤ f (x0 ) f ur alle x ∈ (x0 − ε, x0 + ε) und damit f (x) − f (x0 ) ≥ 0 f ur x0 − ε < x < x0 x − x0 ∆f (x) ≥ 0. x→x0 − ∆x gilt f 0 (x0 ) = lim Analog ergibt sich ∆f (x) ≤ 0 und damit x→x0 + ∆x f 0 (x0 ) = lim f 0 (x0 ) = 0.# Die Bedinung f 0 (x0 ) = 0 ist zwar notwendig fur ein Extremum, aber nicht hinreichend wie das Beispiel f (x) = x3 in x = 0 zeigt. Der Satz gibt auch keine Ausskunft uber Extremalstellen an den Intervallenden, an Spitzen oder anderen Stellen, in den f nicht dierenzierbar ist. D.h. 192 6. STETIGKEIT UND DIFFERENTATION VON FUNKTIONEN EINER VERANDERLICHEN Die Kandidaten fur Extremalstellen von f : I → R sind: (1) die Randpunkte des Intervalls I, (2) die Punkte, in denen f nicht dierenzierbar ist, (3) die stationaren Punkte aus dem Innern des Intervalls I. Beispiel 6.19. Es sei f (x) = | sin x| und I = 0, die Extremalstellen zu bestimmen, betrachten wir 5π 2 ⊆ R. Um die Extrema und (1) Randpunkte: | sin 0| = 0 und sin 5π2 = 1. (2) In x = π und x = 2π ist die Funktion | sin x| nicht dierenzierbar, da f 0 (π+) = − cos π = 1 aber f 0 (π−) = cos π = −1. Analog fur x = 2π. Es ist | sin π| = | sin(2π)| = 0. (3) In den Intervallen (0, π), (π, 2π) und (2π, 5π2 ) ist f (x) = | sin x| dierenzierbar und es gilt: ( f 0 (x) = (sin x)0 = cos x, (− sin x)0 = − cos x, fur fur x ∈ (0, π) und x ∈ (π, 2π). 2π, 5π 2 , Die stationaren Stellen sind die Nullstellen der ersten Ableitung in den Intervallen: cos x = 0 fur x= 2k + 1 π, 2 k ∈ Z, . davon liegen in den von uns betrachteten Intervallen: x = π2 und x = 3π 2 π 3π Die dazugehorigen Funktionswerte sind sin 2 = sin 2 = 1. Damit sind x = 0, π, 2π lokale und globale Minimalstellen mit dem Minimum 0 und x = π2 , 3π2 , 5π2 lokale und globale Maximalstellen mit dem Maximum 1. Wie 3. ANWENDUNG DER DIFFERENTIALRECHNUNG: KURVENDISKUSSION 193 man auch leicht an dem Graphen der Funktion ablesen kann y x=∣sin x ∣ 3.2. Mittelwertsatz. Die folgenden Beobachtungen bilden das Fundament f ur weiterfuhrende Betrachtungen. Satz 6.16. Mittelwertsatz. Ist die Funktion f auf dem abgeschlossenen Intervall [a, b] stetig und auf dem oenen Intervall (a, b) diferenzierbar, dann gibt es (wenigstens) einen inneren Punkt x0 ∈ (a, b) mit f 0 (x0 ) = f (b) − f (a) . b−a Beweis: Wir betrachten die Funktion F (x) = f (x) − (x − b) (f (b) − f (a)) . (b − a) Sie ist im abgeschlossenen Intervall [a, b] stetig und hat deshalb nach Satz 6.6 wenigstens eine Extremalstelle x0 wegen F (a) = F (b) = f (b) liegt diese in (a, b), somit gilt F 0 (x0 ) = 0 und das bedeutet: F 0 (x0 ) = f 0 (x0 ) − (f (b) − f (a)) = 0. (b − a) # Bemerkung: Anschaulich bedeutet der Mittelwertsatz, dass fur mindestens ein x0 ∈ (a, b) die Kurventangente parallel zur Sehne AB ist. 194 6. STETIGKEIT UND DIFFERENTATION VON FUNKTIONEN EINER VERANDERLICHEN Satz 6.17. Monotonieverhalten. Fur eine im Intervall I dierenzier- bare Funktion f gilt: (1) f 0 (x) > 0 auf I (2) f 0 (x) < 0 auf I (3) f 0 (x) ≥ 0 auf I (4) f 0 (x) ≤ 0 auf I (5) f 0 (x) = 0 auf I ⇒ ⇒ ⇒ ⇒ ⇒ f f f f f ist auf I ist auf I ist auf I ist auf I ist auf I echt monoton wachsend. echt monoton fallend. monoton wachsend. monoton fallend. konstant. Beweis: Wir beschranken uns auf die Aussagen f ur (1). Zu x1 < x2 ∈ I gibt es nach dem Mittelwertsatz 6.16 und der Voraussetzung ein x0 mit x1 < x0 < x2 mit f (x2 ) − f (x1 ) = f 0 (x0 ) > 0. x2 − x 1 Folglich ist f (x2 ) > f (x1 ). Alle anderen Falle lassen sich analog behandeln. # Folgerung: Fur zwei auf einem Intervall I dierenzierbare Funktionen f und g folgt: f 0 (x) = g 0 (x) f ur alle Beispiel 6.20. Fur die auf (−∞, ∞) denierte Funktion cosh x = ex − e−x f (x) = 2 0 fur alle x ∈ I mit einer Konstanten C ∈ R. x ∈ I ⇔ f (x) = g(x) + C > 0, e−x 2x = sinh x = (e − 1) < 0, 2 = 0, fur fur fur ex +e−x 2 (18) (19) gilt x > 0, x < 0, x = 0. Folglich ist die Funktion cosh x fur x < 0 streng monoton fallend und fur x > 0 streng monoton wachsend. Auderdem besitzt sie in x = 0 einen stationaren 3. ANWENDUNG DER DIFFERENTIALRECHNUNG: KURVENDISKUSSION 195 Punkt, hier liegt eine lokale (und globale) Minimalstelle vor. 3.3. Hyperbelfunktionen und ihre Umkehrfunktionen. Die Hyperbelfunktionen sind sinh x := ex − e−x , 2 ex + e−x , 2 cosh x := tanh x := sinh x , cosh x coth x := cosh x . sinh x Zur Aussprache der Funktionennamen, z.B. sinh wird ausgesprochen Sinus hyper" bolicus\, die ubrigen Namen analog. Den Namen verdanken diese Funktionen dem folgenden Zusammenhang mit der Hyperbel x2 − y 2 = 1 : Hyperbel 2 2 x − y =1 Punkt auf der Hyperbel: x=cosh t , y=sinht sinh t cosh t Flächenihalt t Insbesondere gilt somit cosh t 2−sinh t 2 =1 196 6. STETIGKEIT UND DIFFERENTATION VON FUNKTIONEN EINER VERANDERLICHEN Beispiel 6.21. Anwendung: Ein homogenes, nur durch das Eigengewicht be- lastetes Seil hat die Form einer Kettenlinie: y(x) = a cosh x−b a +c mit Konstanten a, b, c ∈ R. Aus der Darstellung der hyperbolischen Funktionen geweinnt man leicht die Formeln fur die Ableitungen, es ist sinh0 x = cosh x, cosh0 x = sinh x, tanh0 x = 1 . cosh2 x Die Die Funktion sinh x ist fur alle x ∈ R umkehrbar, dagegen ist die Funktion cosh x nur fur einen Zweig umkehrbar, in diesem Fall entscheidet man sich fur x ≥ 0 und erhalt fur sinh x : ex − e−x e−x 2x y = sinh x = = (e − 1) ⇐⇒ 2yex = e2x − 1 = (ex )2 − 1 ⇐⇒ 2 2 Wir losen diese quadratische Gleichung fur ex und erhalten ex = y ± p y2 + 1 Wegen ex > 0 fur alle x ∈ R entfallt die Losung mit dem Minus und wir haben ex = y + p y2 + 1 Logarithmieren ergibt nun x = ln(y + p y 2 + 1). Schreibt in die Funktion nun in ublicher Form als Funktion von x so erhalt man als Umkehrfunktionen: arsinh x := ln(x + √ x2 + 1), x ∈ R. Analog erhalt man fur cosh x als Umkehrfunktion arcosh x := ln(x + √ x2 − 1), x > 1. Zur Aussprache: arsinh\ wird ausgesprochen als area sinus hyperbolicus\ (arcosh " " 3. ANWENDUNG DER DIFFERENTIALRECHNUNG: KURVENDISKUSSION 197 analog.) Mit Hilfe der der Kettenregel berechnet man die Ableitungen der areaFunktionen: √ d 1 1 1 2 √ · 1+ √ · 2x arsinh x = ln(x + x − 1) = dx 2 x2 + 1 (x + x2 + 1) √ 1 (x + x2 + 1) √ =√ . = √ ( x2 + 1)(x + x2 + 1) x2 + 1 Analog erhalt man die Ableitung von arcosh x. Ableitungen: d 1 arsinh x = √ 2 dx x +1 d 1 arcosh x = √ 2 dx x −1 x ∈ R, x > 1. 3.4. Kurvendiskussion. Satz 6.18. 1. Extremwert-Test. Eine auf dem oenen Intervall (a, b) Satz 6.19. 2. Extremwert-Test. Ist f auf (a, b) zweimal stetig dieren- dierenzierbare Funktion f hat im stationaren Punkt x0 ∈ (a, b) ein lokales Maximum (bzw. lokales Minimum), wenn die Ableitung f 0 (x) unmittelbar links von x0 (also in einer kleinen einseitigen linken Umgebung (x0 − ε, x0 ) (ε > 0)) positiv, rechts von x0 negativ (bzw. links negativ, rechts positiv) ist. zierbar und x0 ∈ (a, b) ein stationarer Punkt, dann gilt (1) f 00 (x0 ) < 0 ⇒ f hat in x0 ein lokales Maximum, (2) f 00 (x0 ) > 0 ⇒ f hat in x0 ein lokales Minimum. Beweisidee: Die erste Ableitung f 0 ist in einer kleinen Umgebung von x0 streng monoton wachsend bzw. fallend und hat in x0 einen Vorzeichenwechsel. # Auch das Krummungsverhalten der Kurve y = f (x) kann man am Vorzeichen von f 00 erkennen. 6. STETIGKEIT UND DIFFERENTATION VON FUNKTIONEN EINER VERANDERLICHEN 198 6.20. Krümmungs-Test. (1) f 00 > 0 im Intervall I, so ist die Kurve y = f (x) konvex von unten Satz (Linkskrummung). (2) f 00 < 0 im Intervall I, so ist die Kurve y = f (x) konvex von oben (=konkav von unten) (Rechtskrummung). Definition 6.8. Diejenigen Punkte, in denen y = f (x) von einer Links- krummung in eine Rechtskrummung oder von einer Rechtskrummung in eine Linkskrummung ubergeht, heien Wendepunkte. Kandidaten fur Wendepunkte von f : I → R sind: (1) die Punkte aus I, in denen f 00 nicht existiert; (2) die Punkte aus I, in denen f 00 = 0 ist. Beispiele: f ' '=0 f ' '0 x0 f ' '0 f ' '0 f ' '0 f ' '0 Satz f ' '0 x0 x0 6.21. Wendepunkt-Test. f 00 (x0 ) = 0, f 000 (x0 ) 6= 0 ⇒ f hat in x0 einen Wendepunkt. Beweis: Nach Satz 6.19 ist in x0 eine Extremalstelle der Ableitung, also ein Wende- punkt. # 3. ANWENDUNG DER DIFFERENTIALRECHNUNG: KURVENDISKUSSION 199 3.5. Kurvendiskussion eines Graphen. Ziel einer Kurvendiskussion ist die Feststellung Verhaltens eines Graphen einer Funktion y = f (x). Im folgenden ge- ben wir eine Liste der Punkte an, die bei einer Kurendiskussion untersucht werden konnen: (1) Definitions- und Wertebereich. Hier ist der maximale Denitionsbereich fur die Funktion y = f (x) gemeint. Man achte insbesondere auf isolierte Singulariaten und untersuche diese dahingehend, ob die Funktione stetig erganzt werden kann ( zudeniniert\ werden kann). " (2) Symmetrie. Ist die Funktion f (x) symmetrisch zur y -Achse, d.h. gilt fur alle x : f (−x) = f (x), so nennt man f eine gerade Funktion. Ist f (x) symmetrisch zum Ursprung, d.h. es gilt fur alle x : f (−x) = −f (x), so nennt man f eine ungerade Funktion. g(x) (3) Pole. Hat f (x) die Form f (x) = (x−x k mit g(x) stetig und g(x0 ) 6= 0, so 0) besitzt f (x) fur ungerade k einen Pol mit Vorzeichenwechsel, fur gerade k eine Pol ohne Vorzeichenwechsel in x0 . (4) Verhalten im Unendlichen. Bestimmung der Grenzwerte lim f (x) und x→∞ lim f (x), falls sie existieren. x→−∞ Untersuchung auf Asymptoten. Eine Gerade y = ax + b heit Asymptote von f (x) fur x → ±∞, falls gilt lim [f (x) − ax − b] = 0. Dabei ist b = lim [f (x) − ax] und a = x→±∞ x→±∞ f (x) lim . x→±∞ x (5) Nullstellen. (6) Bestimmung der Extrema und Extremalstellen, Monotonieverhalten Man untersuche alle Kandidaten fur Extrema. (7) Wendepunkte und Krümmungsverhalten. Man untersuche alle Kandidaten fur Wendepunkte. (8) Skizze. Beispiel zufuhren: 6.22. Fur die folgende Funktion sei eine Kurvendiskussion durchy = f (x) = 2x2 + 3x − 4 . x2 (1) Denitionsbereich: R\{0}. Die Funktion kann fur x = 0 nicht stetig erganzt werden, da der Grenzwert 2x2 + 3x − 4 x→0 x2 lim nicht existiert, da 2x2 + 3x − 4 3x − 4 = lim 2 + = −∞. 2 x→0 x→0 x x2 lim Den Wertebereich erhalt man aus den spateren Resultaten zu (2) Symmetrie: Die Funktion ist weder gerade noch ungerade. −∞, f ( 38 ) ≈ 2.56 . 200 6. STETIGKEIT UND DIFFERENTATION VON FUNKTIONEN EINER VERANDERLICHEN (3) Pole: x0 = 0 ist eine Polstelle ohne Vorzeichenwechsel. (4) Asymptoten: 2x2 + 3x − 4 = 2, x→±∞ x2 lim (und 2x2 + 3x − 4 f (x) = lim = 0. x→±∞ x→±∞ x x3 Asymptote ist also y = 2. lim ) Die (5) Nullstellen: f (x) = 0 ⇔ 2x2 + 3x − 4 = 0 r √ 3 9 32 1 ⇔ x1/2 = − ± + = (−3 ± 41). 4 16 16 4 und x2 ≈ 0.85. (6) Extrema: 1. Randpunkte gibt es nicht zu untersuchen, da die gesamte reelle Achse betrachtet wird. 2. Die Funktion ist in x0 = 0 weder deniert noch stetig, noch dierenzierbar. 3. x1 ≈ −2.35 y0 = (4x + 3)x2 − 2x(2x2 + 3x − 4) 4x3 + 3x2 − 4x3 − 6x2 + 8x = (x2 )2 x4 8 −3x + 8 =0 fur x3 = . = 3 x 3 Weiterhin ist 6x − 24 8 −3x3 − 3x2 (−3x + 8) = y = 8 = 3 x6 x4 x= 8 x= 00 3 3 48 3 − 24 <0 8 4 3 Somit hat f (x) in x3 = ein lokales Maximum mit f (x3 ) ≈ 2.56. Monotonie: 8 < 0 : 3 < x < ∞, echt monoton fallend, y 0 (x) = > 0 : 0 < x < 83 , echt monoton wachsend, < 0 : −∞ < x < 0, echt monoton fallend. 8 3 (7) Wendepunkte: Die Funktion ist in x0 = 0 nicht deniert. Da aber rechts und links von x0 = 0 die zweite Ableitung existiert und dasselbe Vorzeichen hat, ist x0 = 0 kein Wendepunkt. Weiterhin ist y 00 = 0 ⇐⇒ x = x4 = 4 und es ist mit f (x4 ) = 5 2 6x4 − 4x3 (6x − 24) −18x4 + 96x3 y (x4 ) = = = 6 6= 0 x8 x8 x=4 x=4 000 3. ANWENDUNG DER DIFFERENTIALRECHNUNG: KURVENDISKUSSION 201 und deshalb ist x4 = 4 ein Wendepunkt. Krummungverhalten: > 0 : 4 < x < ∞, konvex von unten, 00 y (x) = < 0 : 0 < x < 4, konvex von oben, < 0 : −∞ < x < 0, konvex von oben. (8) Skizze 2 y= f x = 2x 3x−4 x2 Asymptote y=2 Wendepunkt bei x=4, globales Maximum bei x=x3=8/3. 3.6. L’Hospitalsche Regel. Hier geht es um die Bestimmung von Grenzwerten von sogenannten unbestimmten\ Ausdrucken, wie z.B. " sin x . x→0 x lim Dies ist ein unbestimmter Ausdruck der Form 00 , weil der Zahler und der Nenner gegen Null streben und man deshalb nicht wei, ob der Grenzwert existiert, nicht existiert, endlich oder unendlich ist. Wie wir bereits gezeigt haben gilt limx→0 sinx x = 1. Beispiel 6.23. Fur einen unbestimmten Ausdruck kann der Grenzwert exi- stieren, nicht existieren, endlich oder unendlich sein. Dazu geben wir jeweils ein Beispiel an. Der Grenzwert 3x =3 x→0 x lim existiert und ist endlich, der Grenzwert |x| x→0 x lim existiert nicht, da |x| −x = lim = −1, x→0−0 x x→0−0 x lim und der Grenzwert existiert nicht. Der |x| x = lim = 1. x→0+0 x x→0+0 x nachste Grenzwert ist +∞ : aber x = +∞. x→0 x3 lim lim 202 6. STETIGKEIT UND DIFFERENTATION VON FUNKTIONEN EINER VERANDERLICHEN ∞ Es gibt weitere unbestimmte Ausdrucke, namlich ∞ , ∞ − ∞, 0 · ∞, 1∞ . Zur Berechnung von Grenzwerten derartiger unbestimmter Ausdrucke ist die folgende Regel sehr hilfreich. Sie direkt auf die Falle 00 und ∞ und nach Umformung der entspre∞ chenden Ausdrucke auch auf alle anderen. Satz 6.22. Sind f und g auf dem Intervall a < x < b dierenzierbare Funktionen, g0 (x) 6= 0, mit den folgenden beiden Eigenschaften (1) f (x) → 0, g(x) → 0 oder f (x) → ∞, g(x) → ∞ fur (x) = L mit L ∈ R ∪ {−∞, ∞}, (2) lim fg (x) x→b− dann gilt x → b−. 0 0 f 0 (x) f (x) = lim 0 . x→b− g (x) x→b− g(x) x → a+, x → ∞, x → −∞. lim Entsprechendes gilt fur ohne Beweis. Bemerkung 6.3. Es kommt haug vor, dass man den zur Anwendung der (x) L'Hospitalschen Regel benotigten Wert limx→b− fg (x) selbst erst mit dieser Regel 0 0 ermittelt, sofern f , g anstelle f, g die Voraussetzungen des Satzes erfullen. 0 0 Beispiel 6.24. Bei der Anwendung der L'Hospitalschen Regel ist als erstes immer der Typ des unbestimmten Ausdruck zu bestimmen und dann auf die Form " 00\ bzw. " ∞ \. ∞ x3 − x2 − 5x − 3 x→3 3x2 − 7x − 6 lim ist vom Typ 0 . 0 Wir konnen die Regel also sofort anwenden: x3 − x2 − 5x − 3 3x2 − 2x − 5 16 = lim = . 2 x→3 x→3 3x − 7x − 6 6x − 7 11 lim Als nachstes wollen wir den Grenzwert lim x ln x→∞ x+1 x−1 vom Typ ∞·0 bestimmen, dazu mussen wir den Ausdruck aber erst umformen. Gilt limx→b− f (x) = ∞ und limx→b− g(x) = 0, dann formen wir wie folgt um: f (x) · g(x) = g(x) 1 f (x) und erhalten einen Ausdruck vom Typ " 00\. Man beachte, dass der gesamte 1 Nenner f (x) in der L'Hospitalschen Regel dierenziert werden muss. Fur unser 3. ANWENDUNG DER DIFFERENTIALRECHNUNG: KURVENDISKUSSION 203 Beispiel heit das: lim x ln x→∞ x+1 x−1 ln = lim x→∞ x+1 x−1 1 x x−1 x+1 = lim (x−1)−(x+1) (x−1)2 − x12 x→∞ 2x2 (−2)(−x2 ) = lim 2 = 2. x→∞ x − 1 x→∞ (x + 1)(x − 1) = lim Der Grenzwert lim x→0 1 1 − x sin x ist vom Typ "∞ − ∞\ und muss deshalb erst umgeformt werden. Es gilt fur limx→b− f (x) = ∞ und limx→b− g(x) = ∞ : f (x) − g(x) = f (x)g(x) 1 1 − g(x) f (x) Typ "∞ · 0\ und wird deshalb weiter umgeformt zu = 1 g(x) − 1 f (x) Typ " 00 .\ 1 f (x)g(x) Fur das Beispiel bedeutet dies: lim x→0 1 1 − x sin x 1 sin x − x cos x − 1 (sin x − x) = lim = lim x→0 x sin x x→0 x sin x x→0 sin x + x cos x = lim ist wieder vom Typ " 00\, deshalb nochmalige Anwendung der Regel: − sin x = 0. x→0 cos x + cos x − x sin x = lim Weitere unbestimmte Ausdrucke sind 00 und 0∞ . Beispiel 6.25. Es sei limx→0 xx zu berechnen. Es ist x xx = eln x = ex ln x und damit ist x x ln x lim x = lim e x→0 x→0 Beispiel = exp(lim x ln x) = exp x→0 ln x 1 x 6.26. Der Grenzwert limx→∞ 1 + x1 wir im vorigen Beispiel um: 1 1+ x x 1 x = exp x −x2 ) = 1. x→0 x = exp(lim − x12 ist vom Typ "1∞\. Wir formen 1 = exp x ln 1 + x Der letzte Ausdruck im Exponenten ist fur x → ∞ vom Typ "∞ · 0\, nach einer weiteren Umformung ergibt sich 1 exp x ln 1 + = exp x ln 1 + 1 x 1 x ! . 204 6. STETIGKEIT UND DIFFERENTATION VON FUNKTIONEN EINER VERANDERLICHEN Anwendung der L'Hospitalschen Regel ergibt nun: ! x ln 1 + x1 1 lim 1 + = exp lim = 1 x→∞ x→∞ x x ! x (−1) x 2 = exp lim exp lim x+1−1x = e1 = e. x→∞ x→∞ x+1 x2 Bemerkung 6.4. (1) Die L'Hospitalsche Regel ist nur auf unbestimmte Ausdrucke vom Typ ∞ 0 unbestimmte Ausdrucke vor, " 0\ bzw. " ∞\ anwendbar. Liegen andere 0 \ gebracht werden, damit so mussen sie erst auf die Gestalt " 0\ bzw. " ∞ ∞ die Regel angewandt werden kann. (2) Die Regel kann mehrfach hintereinander angewandt werden, wenn in in jedem Schritt die Vorrausetzungen fur die Anwendung der Regel erfüllt sind. (3) Man verwechsle die Anwendung der L'Hospitalschen Regel nicht mit der Dierentation von Quotienten. Bei der L'Hospitalschen Regel werden (so sie anwendbar ist) Zahler und Nenner dierenziert und dann der Grenzwert gebildet. KAPITEL 7 Integralrechnung im R1 1. Bestimmtes Integral 1.1. Definition des bestimmten Integral. Die Integration ist die Umkehr" operation\ zur Dierentation. Ist die Funktion f auf dem Intervall [a, x] dierentzierbar, so gibt es zu jeder Zerlegung a = x0 < x1 < . . . < xn−1 < xn = x Zwischenpunkte ξi ∈ [xi−1 , xi ], so dass nach dem Mittelwertsatz der Dierentialrechnung 6.16 gilt: f (xi ) − f (xi−1 ) = f 0 (ξ)(xi − xi−1 ), i = 1, 2, . . . , n. Die Summation dieser Gleichungen ergibt: f (x) − f (x0 ) = n X f 0 (ξ)(xi − xi−1 ) := Zn . i=1 Da man die ξi , i = 1, 2, . . . , n nicht kennt, ersetzt man sie durch beliebige Zwischenpunkte aus [xi−1 , xi ], und erreicht bei hinreichend feiner Zerlegung des Intervalls [a, x] eine gute Approximation durch die entsprechende (Zwischen)summe Zn . Zwischensummen Definition 7.1. Es sei f eine auf dem Intervall [a, b] denierte Funk- tion. Existiert unabhangig von der Wahl der Unterteilungspunkte und Zwischenpunkte der Grenzwert lim n→∞ n X Z f (ξi )(xi − xi−1 ) =: b f (x) dx, a i=1 so heit er das bestimmte Integral von f uber [a, b], die Randpunkte heien Integrationsgrenzen. 205 206 R1 7. INTEGRALRECHNUNG IM Satz 7.1. Es sei f eine auf dem Intervall [a, b] denierte, beschrankte Funktion, die an hochstens endlich vielen Stellen nicht stetig ist (ein solche Funktion nennt man stuckweise stetig), dann existiert das Integral Z b f (x) dx. a Beweis: Man betrachte die Folge Untersummen {sn } bzw. der Obersummen {Sn } mit mi = Minimum von f auf [xi−1 , xi ] und Mi = Maximum von f auf [xi−1 , xi ] und sn = n X mi (xi−1 − xi ), Sn = i=1 n X Mi (xi−1 − xi ). i=1 Untersummen Dann gilt m(b − a) ≤ sn ≤ Zn ≤ Sn ≤ M (b − a). Da die Folge der Untersummen monoton wachsend und beschrankt, und die Folge der Obersummen monoton fallend und beschrankt ist, konvergieren beide Folgen. Aufgrund der Stetigkeit von f gilt fur beliebig kleines ε > 0 die Abschatzung 0 ≤ Mi − mi ≤ ε f ur alle i, sobald nur alle Teilintervalle hinreichend klein sind (vgl. gleichmaige Stetigkeit von stetigen Funktionen uber einem abgeschlossenen Intervall, siehe Satz 6.6). Damit sieht man, dass Sn − sn → 0 fur n → ∞ und damit limn→∞ sn = limn→∞ Sn . Obersummen Mit dem Vergleichskriterium (Satz 6.3) folgt lim sn = lim Zn = lim Sn . n→∞ n→∞ n→∞ # 1. BESTIMMTES INTEGRAL Geometrische Deutung: Ist f ≥ 0 und stetig uber [a, b], dann ist b Z f (x) dx I= a der Flacheninhalt I des von der Kurve y = f (x), der x-Achse und den Geraden x = a bzw. x = b begrenzten Flachenstucks. y y= f x x=a b I =∫a f x dx x=b x Verlauft die Kurve y = f (x) ganz unterhalb der x-Achse, dann gilt entsprechend fur den Flacheninhalt I : Z b I=− f (x) dx. a y x x=a b I =−∫a f x dx x=b y= f x Begrenzt y = f (x) Flachenstucke oberhalb und unterhalb der x-Achse, ist Rb f (x) dx die Summe der vorzeichenbehafteten Flacheninhalte: +\ f ur ober- " halb der x-Achse liegende Teile und −\ fur unterhalb der x-Achse liegende " Teile. a y x=a + - y= f x - x=b x 207 208 7. INTEGRALRECHNUNG IM R1 1.2. Elementare Integrationsregeln. Die Funktionen f, g seien auf dem abgeschlossenen Intervall [a, b] stuckweise stetig, dann gilt: (1) Z b b Z [αf (x) + βg(x)] dx = α a Z g(x) dx, a (2) Z b a ≤ c ≤ b. f (x) dx, c a a b Z f (x) dx + f (x) dx = α, β ∈ R, a c Z b f (x) dx + β (3) Ist f (x) ≤ g(x) fur alle x ∈ (a, b), dann gilt Z b Z f (x) dx ≤ b g(x) dx. a a (4) Gilt fur die auf [a, b] stetige Funktion f : m ≤ f (x) ≤ m fur alle x ∈ [a, b], so ist Z m(b − a) ≤ b f (x) dx ≤ M (b − a). a (5) Ist die Funktion f stetig auf [a, b], so gilt Z b Z b ≤ |f (x)| dx, f (x) dx a ≤ b. a a (6) (Mittelwertsatz der Integralrechnung.) Sind die Funktionen f, g auf [a, b] stetig und g(x) ≥ 0 fur alle x ∈ [a, b], dann gibt es wenigstens ein ξ ∈ [a, b] mit Z b Z a b g(x) dx. f (x)g(x) dx = f (ξ) a Spezialfall g(x) = 1 : Z b f (x) dx = f (ξ)(b − a) mit einem ξ ∈ [a, b]. a 1.3. Differentation und Integration. Definition 7.2. Eine auf dem Intervall I dierenzierbare Funktion F heit Stammfunktion von f, wenn F 0 (x) = f (x) fur alle x ∈ I gilt. 1. BESTIMMTES INTEGRAL 209 7.2. Hauptsatz der Differential- und Integralrechnung. Es sei eine auf dem Intervall [a, b] stetige Funktion und x ∈ [a, b], dann gilt (1) Existenz von Stammfunktionen. Die durch Satz f Z Fa (x) := x f (t) dt, x ∈ [a, b], a denierte Funktion ist eine Stammfunktion von f. Jede andere Stammfunktion von f hat die Form F (x) = Fa (x) + c, c ∈ R. (2) Integralberechnung. Mit einer beliebigen Stammfunktion F von f gilt: Z b f (x) dx = F (x) |ba := F (b) − F (a). a Beweis: Es gilt Z Fa (x + h) − Fa (x) = x+h Z f (t) dt − a x Z x+h f (t) dt = a f (t) dt = f (ξh )h, x mit einer Zahl ξh , die mit h → 0 gegen x strebt. Deshalb gilt 1 Fa0 (x) = lim [Fa (x + h) − Fa (x)] = lim f (ξh ) = f (x). h→0 h→0 h 0 0 Jede weitere Funktion F mit F = f = Fa hat nach (18) (als Folgerung aus dem Mittelwertsatz der Dierentialrechnung, siehe Satz 6.16) die Form F (x) = Fa (x) + c mit c ∈ R. Rx Nach Teil (1) gilt F (x) = a f (t) dt + c f ur x ∈ [a, b]. Mit x = a folgt F (a) = c, bzw. Rx f (t) dt = F (x) − F (a) f ur alle x ∈ [a, b] und insbesondere a Z b f (t) dt = F (b) − F (a). # a 7.3. Die Menge aller Stammfunktionen von f wird mit f (x) dx bezeichnet und heit unbestimmtes Integral von f. Definition R 210 R1 7. INTEGRALRECHNUNG IM 2. Integrationsregeln 2.1. Linearität. Fur das unbestimmte Integral gilt Z Z (af (x) + bg(x)) dx = a Z f (x) dx + b g(x) dx, a, b ∈ R. 2.2. Partielle Integration. F ur je zwei auf einem Intervall I = (a, b) stetig differenzierbare Funktionen u und v ist wegen der Produktregel der Dierentialrechnung (uv)0 = u0 v − uv 0 die Funktion uv eine Stammfunktion von u0 v − uv 0 , d.h. Z u0 (x)v(x) − u(x)v 0 (x) dx = u(x)v(x) + C bzw. Formel der partiellen Integration. Z Z Z 0 u (x)v(x) dx = v(x) d(u(x)) = u(x)v(x) − u(x)v 0 (x) dx Z = u(x)v(x) − u(x) d(v(x)). Fur das bestimmte Integral lautet die entsprechende Formel: Z b 0 u (x)v(x) dx = u(x)v(x) a Bemerkung Beispiel Z Z − b u(x)v 0 (x) dx. a 7.1. Es gilt d(f (x)) = f 0 (x) dx. 7.1. Es seien a, b ∈ R, a 6= 0, Konstanten, dann gilt 1 e sin(bx) dx = eax sin(bx) − a 1 = eax sin(bx) − a 1 = eax sin(bx) − a ax |ba Z 1 ax e b cos(bx) dx a Z b 1 ax 1 ax e cos(bx) − e (−b) sin(bx) dx a a a Z b 1 ax b ax e cos(bx) + e sin(bx) dx , a a a a 6= 0. 2. INTEGRATIONSREGELN 211 Durch zweimalige partielle Integration entsteht wieder das Ausgangsintegral, aber mit einem anderen Vorfaktor, so dass man umformen kann zu: Z b2 b 1 1+ 2 eax sin(bx) dx = eax sin(bx) − 2 eax cos(bx) + c a a a Z ax ae sin(bx) − beax cos(bx) ax ⇐⇒ e sin(bx) dx = + C. a2 + b 2 Beispiel 7.2. Rekursionsformeln: Es sei Z π 2 (sin x)n dx, Sn := n = 0, 1 2 . . . . 0 Oensichtlich ist S0 = π2 und S1 = 1. Fur mit u0 (x) = sin x, v(x) = (sin x)n−1 : n−1 Sn (x) = (− cos x)(sin x) Z π 2 |0 + π 2 n≥2 ergibt die partielle Integration (n − 1)(cos x)2 (sin x)n − 2 dx 0 π 2 Z = (n − 1) (1 − (sin x)2 )(sin x)n−2 dx = (n − 1)(Sn−2 − Sn ). 0 und damit gilt Sn := n−1 Sn−2 n fur n ≥ 2. 2.3. Substitutionsmethode. Grundlage f ur die Substitutionsmethode der Integralrechnung ist die Kettenregel der Dierentation dxd F (g(x)) = F 0 (g(x))g 0 (x), d.h. mit f (x) = F 0 (x), ist F (g(x)) eine Stammfunktion von f (g(x))g 0 (x). Substitutionsregel I. Z f (g(x))g 0 (x) dx = F (g(x)) + C. Fur das bestimmte Integral erhalt man damit Z b f (g(x))g 0 (x) dx = F (g(b)) − F (g(a)). a Beispiel 7.3. Z sin x e Z cos x dx = esin x (sin x)0 dx Substitution sin x =: t, d.h. und damit Z = et dt = et + C 212 7. INTEGRALRECHNUNG IM R1 Rucksubstitution: t = sin x = esin x + C. Man kann diese Formel aber auch anders mit Hilfe des Dierentials dy = df (x) = f (x)dx aufschreiben. 0 Beispiel ax + b 7.4. Fur y = f (x) = sin x ist dy = f 0 (x)dx = (cos x) dx, fur y = f (x) = ist dy = a dx und fur y = cosh x ist dy = (sinh x) dx. R Substitutionsregel II. Berechnung des Integrals f (x)dx. Wir substituieren: x = h(t) mit einer umkehrbaren Funktion h, dann ist dx = h0 (t) dt und a = h(ta ) ⇐⇒ ta = h−1 (a) und b = h(tb ) ⇐⇒ tb = h−1 (b) und damit gilt fur das unbestimmte Integral: Z Z f (x) dx = Z f (h(t)) dh(t) = f (h(t)) h0 (t) dt = H(t) + C = H(h−1 (x)) + C und fur das bestimmte Integral: b Z Z h−1 (b) f (h(t)) h0 (t) dt. h−1 (a) h−1 (a) a h−1 (b) f (h(t)) dh(t) = f (x) dx = Beispiel Z 7.5. Z e3x dx e2x − 1 Substitution: x = ln t, dx = 1t dt und f uhrt auf ex = t sowie Z Z Z Z t2 t2 1 1 1 t − 1 = tdx = dt = 1+ 2 dt = t + dt = t + ln +C t2 − 1 t2 − 1 t −1 t2 − 1 2 t + 1 Rucksubstitution mit t = ex ergibt 1 ex − 1 + C. = e + ln x 2 e + 1 x Bemerkung 7.2. Man kann auch die Substitutionsregel I vorteilhaft mittels Dierentialen schreiben: Z Z 0 f (g(x))g (x) dx = Z f (g(x)) d(g(x)) = f (t) dt = F (t) + C = F (g(x)) + C, bzw. Z b 0 Z f (g(x))g (x) dx = a b Z g(b) f (t) dt = F (g(b)) − F (g(a)). f (g(x)) d(g(x)) = a g(a) 2. INTEGRATIONSREGELN Beispiel 213 7.6. Z 1 5 (ln x)2 dx = x Z 5 2 Z ln 5 (ln x) d ln x = 1 t2 dt 0=ln 1 ln 5 (ln 5)3 1 t3 (ln 5)3 − 0 = . = = 3 0 3 3 2.4. Integration rationaler Funktionen. Es geht hierbei um die Integration echt gebrochen rationaler Funktionen. Im Allgemeinen ist eine gebrochen rationale Funktion von der Gestalt f (x) = P (x) p(x) = g(x) + Q(x) Q(x) (20) mit Polynomen P, Q, g, p. Die Funktion heit echt gebrochen rational, wenn der Polynomgrad des Zahlerpolynoms kleiner als der Polynomgrad des Nennerpolynoms ist. Ist die gebrochen rationale Funktion nicht echt gebrochen rational, so kann man immer ein Polynom abdividieren, so dass die verbleibende gebrochen rationale Funktion echt gebrochen rational ist. Dies ist in der Formel (20) dargestellt. Die gebrochen raP (x) tionale Funktion Q(x) , wobei der Polynomgrad von P (x) groer als der Polynomgrad von Q(x), kann durch Division in ein Polynom g(x) und eine echt gebrochen ratiop(x) nale Funktion Q(x) zerlegt werden. Das Polynom g(x) kann leicht integriert werden, so dass wir nur echt gebrochen rationale Ausdrucke untersuchen mussen. 214 7. INTEGRALRECHNUNG IM R1 2.4.1. Partialbruchzerlegung. Ausgangpunkt fur die Partialbruchzerlegung ist eine echt gebrochen rationale Funktion f (x) = p(x) mit der Eigenschaft, dass der q(x) Grad des Zahlerpolynoms p(x) echt kleiner als der Grad des Nennerpolynoms q(x) ist. Dann besteht der 1. Schritt darin, eine Produktdarstellung des Nennerpolynoms der folgenden Form herzustellen: q(x) = c(x − a1 )k1 (x − a2 )k2 · · · (x − ar )kr (x2 + b1 x + c1 )l1 (x2 + b2 x + c2 )l2 · · · (x2 + bs x + cs )ls , dabei stehen die blauen\ Terme fur reelle Nullstellen des Nennerpolnoms und die " Exponenten ki geben die Vielfachheit der reellen Nullstelle ai an. Die roten\ Terme " stehen fur Paare konjugiert komplexer Nullstellen des Nennerpolynoms und der Exponent li gibt die Vielfachheit dieses Paares reeller Nullstellen an. Gema der im ersten Schritt erhaltenen Zerlegung des Nennerpolynoms macht man nun den folgenden 2. Schritt Ansatz: A11 A12 A1k1 + + ... + + (x − a1 ) (x − a1 )2 (x − a1 )k1 A21 A2k2 Arkr + + ... + + + . . . + k (x − a1 ) (x − a2 ) 2 (x − ar )kr B11 x + C11 B12 x + C12 B1l1 x + C1l1 + + + ... + 2 + (x2 + b1 x + c1 ) (x2 + b1 x + c1 )2 (x + b1 x + c1 )l1 B2l2 x + C2l2 B21 x + C21 Bsls x + Csls + ... + 2 + + ... + 2 (x2 + b2 x + c2 ) (x + b2 x + c2 )l2 (x + bs x + cs )ls p(x) =c q(x) mit unbekannten Koezienten Ajk , Bil , Cil . (Die Existenz der Partialbruchzerlegung kann mit Methoden der Funktionentheorie nachgewiesen werden.) Nun werden im 3. Schritt die unbekannten Koezienten Aj , Bk , Ck berechnet. Dazu wird zunachst die Ansatzgleichung mit dem Nennerpolynom q(x) multipliziert. Nun ergeben sich Bestimmungsgleichungen fur die unbekannten Koezienten entweder durch Koezientenvergleich oder durch Einsetzen spezieller x-Werte (z.B. x = a1 , a2 , . . .). Beispiel 7.7. Es sei f (x) = x2 + x + 1 , (x − 1)3 (x − 2) d.h. das Zahlerpolynom ist p(x) = x2 + x + 1 und hat den Grad 2, das Nennerpolynom ist (x − 1)3 (x − 2) und hat den Grad 4, folglich liegt eine echt gebrochen rationale Funktion vor. 2. INTEGRATIONSREGELN 215 1. Schritt: Das Nennerpolynom hat schon die gewunschte Zerlegung, es ist q(x) = (x − 1)3 (x − 2), d.h. x = 1 ist eine dreifache und x = 2 einfache Nullstelle von q(x). Damit macht man im 2. Schritt den Ansatz: A11 x2 + x + 1 A12 A13 A2 = . + + + 3 1 2 3 (x − 1) (x − 2) (x − 1) (x − 1) (x − 1) (x − 2) Im 3. Schritt wird nun mit q(x) die Ansatzgleichung multipliziert: 2 x +x+1= A11 A12 A13 A2 + + + 2 3 (x − 1) (x − 1) (x − 1) (x − 2) (x − 1)3 (x − 2) = A11 (x − 1)2 (x − 2) + A12 (x − 1)(x − 2) + A13 (x − 2) + A2 (x − 1)3 . (21) Wir bestimmen nun zunachst die unbekannten Koezienten mit der Einsetzmethode: Sie besteht darin, f ur x bestimmte Werte einzusetzen, um moglichst einfach, die Koezienten zu erhalten. Dabei ist es gunstig, die Nullstellen zu verwenden: Sei x = 1, dann wird (21) zu: 1 + 1 + 1 = 0 + 0 + A13 (−1) und damit ist A13 = −3. Wir setzen das Ergebnis in (21) ein und erhalten: x2 + x + 1 = A11 (x − 1)2 (x − 2) + A12 (x − 1)(x − 2) − 3(x − 2) + A2 (x − 1)3 . Setzen wir nun x = 2, ergibt sich: 4 + 2 + 1 = 0 + 0 + 0 + A2 , also ist A2 = 7. Einsetzen ergibt jetzt: x2 + x + 1 = A11 (x − 1)2 (x − 2) + A12 (x − 1)(x − 2) − 3(x − 2) + 7(x − 1)3 . Leider sind damit unsere Nullstellen verbraucht aber es verbleiben immer noch zwei unbekannte Koezienten. Um diese zu bestimmen, setzt man irgendwelche (geeignete) Werte fur x ein und erhalt ein Gleichungssystem zur Bestimmung der verbliebenen unbekannten Koezienten. Setzt man x = 3 so ergibt sich 9 + 3 + 1 = A11 · 4 + A12 · 2 − 3 + 7 · 8 und fur x = 0 ergibt sich 1 = A11 (−2) + A12 · 2 + 6 − 7. Also das Gleichungssystem 4A11 + 2A12 = −40 ⇐⇒ (−2)A11 + 2A12 = 2 4 2 −2 2 ! A11 A12 ! = −40 2 ! 216 7. INTEGRALRECHNUNG IM R1 mit der Losung A11 = −7 und A12 = −6. Alternativ kann man Koeffizientenvergleich zur Bestimmung der unbekannten Koezienten benutzen. Dazu wird auf der rechten und linken Seite von (21) (nach eventuellem Ausmultiplizieren) nach den Potenzen von x geordnet und die Koezienten der rechten und der linken Seite zu gleichen Potenzen von x gleichgesetzt: x2 + x + 1 = A11 (x − 1)2 (x − 2) + A12 (x − 1)(x − 2) + A13 (x − 2) + A2 (x − 1)3 = (A11 +A2 )x3 +(−4A11 +A12 −3A2 )x2 +(5A11 −3A12 +A13 +3A2 )x+(−2A11 +2A12 −2A13 −A2 ). Das ergibt das Gleichungssystem: A11 + A2 −4A11 + A12 − 3A2 5A11 − 3A12 + A13 + 3A2 −2A11 + 2A12 − 2A13 − A2 = = = = A11 1 0 0 1 0, 0 −3 A12 1, −4 1 ⇐⇒ 3 A13 1, 5 −3 1 A2 −2 2 −2 −1 1, = 0 1 1 1 mit der Losung A11 = −7, A12 = −6, A13 = −3 und A2 = 7. Bemerkung 7.3. In vielen Fallen ist eine Kombination aus Einsetzmethode und Koezientenvergleich am gunstigsten, also zunachst die Nullstellen einsetzen und dann die restlichen Koezienten uber einen Koezientenvergleich bestimmen. In unserem Beispiel hiee das, zunachst werden die Nullstellen eingesetzt und wir erhalten A13 = −3 und A2 = 7. Fur den Koezientenvergleich benutzen wir dann x2 + x + 1 = A11 (x − 1)2 (x − 2) + A12 (x − 1)(x − 2) − 3(x − 2) + 7(x − 1)3 . ⇐⇒ x2 + x + 1 + 3(x − 2) − 7(x − 1)3 = A11 (x − 1)2 (x − 2) + A12 (x − 1)(x − 2) ⇐⇒ (−7)x3 + 22 · x2 − 17 · x + 2 = A11 (x3 − 4x2 + 5x − 2) + A12 (x2 − 3x + 2) ⇐⇒ (−7)x3 + 22 · x2 − 17 · x + 2 = A11 x3 + (−4A11 + A12 )x2 + (5A11 − 3A12 )x − 2A11 + 2A12 . Der Koezientenvergleich bei x3 ergibt A11 = −7 und damit erhalt man aus dem Koezientenvergleich fur das Absolutglied 2 = (−2)(−7) + 2A12 ⇐⇒ A12 = −6. Beispiel 7.8. Es sei f (x) = x+1 . (x − 1)2 (x2 + 1)3 Wie man leicht sieht ist dies eine echt gebrochen rationale Funktion. Der Ansatz der Partialbruchzerlegung lautet x+1 A11 A12 B11 x + C11 B12 x + C12 B13 x + C13 = + + + + . 2 2 3 2 (x − 1) (x + 1) (x − 1) (x − 1) (x2 + 1)1 (x2 + 1)2 (x2 + 1)3 2. INTEGRATIONSREGELN 217 Multiplikation mit dem Nennerpolynom von f (x) ergibt: x + 1 = A11 (x − 1)(x2 + 1)3 + A12 (x2 + 1)3 + + (B11 x + C11 )(x − 1)2 (x2 + 1)2 + (B12 x + C12 )(x − 1)2 (x2 + 1) + (B13 x + C13 )(x − 1)2 . Mittels Einsetzmethode und/oder Koezientenvergleich berechnet man die unbekannten Koezienten zu 1 −5 5 3 3 1 1 −1 A12 = , A11 = , B11 = , C11 = , B12 = , C12 = , B13 = , C13 = . 4 8 8 8 4 4 2 2 Man erhalt: 1 x+1 = 2 2 3 (x − 1) (x + 1) 8 (−5) 2 6x + 2 5x + 3 4x − 4 + + 2 + 2 + 2 2 2 (x − 1) (x − 1) (x + 1) (x + 1) (x + 1)3 . Im Anschluss an die Partialbruchzerlegung erfolgt die Integration, wobei die Integrale der in der Partialbruchzerlegung entstehenden Ausdrucke wie folgt lauten: (1) R dx x−a (2) R dx (x−a)k = ln |x − a| + C, 1 1 = − (k−1) + C, (x−a)k−1 k ∈ N, k > 1, In den Formeln (3) bis (6) wird voraussgesetzt, dass p2 − 4q < 0 ist (komplexe Nullstellen). (3) R (4) R (5) R (6) R dx x2 +px+q ax+b x2 +px+q =√ = dx (x2 +px+q)k ax+b (x2 +px+q)k Beispiel 2 4q−p2 arctan √2x+p 2 + C, 4q−p a 2 ln |x2 + px + q| + b − ap 2 = 2x+p (k−1)(4q−p2 )(x2 +px+q)k−1 + R dx x2 +px+q 2(2k−3) (k−1)(4q−p2 ) a = − 2(k−1)(x2 +px+q) k−1 + b − R ap 2 R dx , (x2 +px+q)k−1 dx , (x2 +px+q)k k ∈ N, k > 1, k ∈ N. 7.9. Es sei f (x) = 3x5 − 2x4 + 4x3 + 4x2 − 7x + 6 (x − 1)2 (x2 + 1)2 Oensichtlich ist der Grad des Zahlerpolynoms kleiner als der Grad des Nennerpolynoms. Wir fuhren nun die Partialbruchzerlegung durch: f (x) = A11 A12 B11 x + C11 B12 x + C12 + + + . 2 (x − 1) (x − 1) (x2 + 1) (x2 + 1) Multipliaktion mit dem Nennerpolynom ergibt: 3x5 − 2x4 + 4x3 + 4x2 − 7x + 6 = A11 (x − 1)(x2 + 1)2 + A12 (x2 + 1)2 + (B11 x + C11 )(x − 1)2 (x2 + 1) + (B12 x + C12 )(x − 1)2 . Mit Hilfe der Einsetzmethode ergibt sich zunachst fur x = 1 : 3 − 2 + 4 + 4 − 7 + 6 = A12 · 4, 218 7. INTEGRALRECHNUNG IM R1 also A12 = 2. Die ubrigen Koezienten bestimmen wir durch Koezientenvergleich: 3x5 − 2x4 + 4x3 + 4x2 − 7x + 6 = A11 (x − 1)(x2 + 1)2 + 2(x2 + 1)2 + + (B11 x + C11 )(x − 1)2 (x2 + 1) + B12 x + C12 )(x − 1)2 3x5 − 4x4 + 4x3 − 7x + 4 = A11 (x − 1)(x2 + 1)2 + + (B11 x + C11 )(x − 1)2 (x2 + 1) + B12 x + C12 )(x − 1)2 =A11 (x − 1)(x2 + 1)2 + (B11 x + C11 )(x − 1)2 (x2 + 1) + (B12 x + C12 )(x − 1)2 =A11 (x5 − x4 + 2x3 − 2x2 + x − 1) + (B11 x + C11 )(x4 − 2x3 + 2x2 + 1)+ + (B12 x + C12 )(x2 − 2x + 1) =A11 (x5 − x4 + 2x3 − 2x2 + x − 1) + B11 (x5 − 2x4 + 2x3 − 2x2 + x)+ + C11 (x4 − 2x3 + 2x2 − 2x + 1) + B12 (x3 − 2x2 + x) + C12 (x2 − 2x + 1) =(A11 + B11 )x5 + (−A11 − 2B11 + C11 )x4 + (2A11 + 2B11 − 2C11 + B12 )x3 + + (−2A11 + 2C11 − 2B12 + C12 )x2 + (A11 + B11 + B12 − 2C12 )x + (−A11 + C11 + C12 ) Ist aquivalent zum System 1 1 0 0 0 −1 −2 1 0 0 2 2 −2 1 0 −2 −2 2 −2 1 1 1 −2 1 −2 −1 0 1 0 1 A11 B11 C11 B12 C12 = 3 −4 4 0 −7 4 Teilweise Ausfuhrung des Gauss-Algorithmus liefert: 1 1 −1 −2 2 2 −2 −2 1 1 −1 0 1 0 0 ∼ 0 0 0 0 0 0 3 1 1 0 0 −4 0 −2 1 0 4 0 ∼ 2 −2 1 0 0 −2 1 −2 −7 0 1 0 1 4 0 0 −1 0 −1 −4 0 2 0 1 6 0 −2 1 0 −2 ∼ 0 2 −2 1 6 0 −2 1 −2 −10 1 1 0 1 7 3 1 0 0 0 −1 1 0 0 −1 0 −2 1 0 −2 0 2 −2 1 6 0 −2 1 −2 −10 1 1 0 1 7 1 0 0 0 0 0 0 −1 0 −1 −4 0 2 0 1 6 0 0 1 1 4 0 0 −2 0 0 0 0 1 −1 −4 1 1 0 1 7 Aus der 4. Zeile von oben folgt B12 = 0, dies eingesetzt, erhalt man aus der 3. Zeile von oben und analog aus der 2. Zeile von unten, dass C12 = 4 ist. Auch dies eingesetzt ergibt aus der 2. Zeile von oben, dass C11 = 1 ist, eingesetzt folgt 3. UNEIGENTLICHE INTEGRALE 219 aus der 1. Zeile von unten, dass B11 = 2 und aus der 1. Zeile von oben, dass A11 = 1 ist. Die Partialbruchzerlegung hat folglich ergeben, dass gilt f (x) = 1 2 4 2x + 1 + + 2 + 2 . 2 x − 1 (x − 1) x + 1 (x + 1)2 Wir fuhren nun die Integration fur jeden Teilterm einzeln aus: Z dx = ln |x − 1| + C, x−1 Z Z Z 2 2 2 −2 1 + C = + C, dx = d(x − 1) = dt = −2 (x − 1)2 (x − 1)2 t2 t x−1 Z Z Z Z (x2 + 1)0 1 1 2x + 1 dx = dx + = dt + arctan x + C = ln |x2 + 1| + arctan x + C, 2 2 2 x +1 x +1 x +1 t Z 2x 4 dx = 2 + 2 arctan x + C 2 2 (x + 1) x +1 Bemerkung Z 7.4. Um das letzte Integral auszurechnen betrachte man: Z 1 x (−2x) dx = 2 − x 2 dx = 2 x +1 x +1 (x + 1)2 Z 2 Z Z x x +1−1 x 2 2 = 2 +2 dx = 2 + dx − dx 2 2 2 2 x +1 (x + 1) x +1 (x + 1) (x + 1)2 und damit ist Z 2 2 x dx = 2 2 +2 2 2 (x + 1) x +1 Z x2 1 dx. +1 Damit kann man nun das Integral hinschreiben, es ist: Z f (x)dx = ln |x − 1| + 2x (−2) + ln |x2 + 1| + arctan x + 2 + 2 arctan x + C. x−1 x +1 3. Uneigentliche Integrale Die Funktion f sei auf dem rechts oenen Intervall a ≤ x < b erklart und auf jedem abgeschlossenen Teilintervall [a, c], c < b, stuckweise stetig, b ∈ R ∪ {∞}. Dann der Integralbegri erweitert werden auf (1) Integranden f (x), die bei der Annaherung x → b− nicht beschrankt sind; (2) unbeschrankte Integrationsintervalle [a, ∞) durch die Denition Z b Z f (x) dx := lim a c→b− c f (x) dx, a bzw. Z ∞ Z f (x) dx := lim a c→∞ c f (x) dx. a 220 7. INTEGRALRECHNUNG IM R1 Vollig analog gilt b Z Z b f (x) dx, f (x) dx := lim c→a+ a b Z bzw. Z c→−∞ −∞ c b f (x) dx. f (x) dx := lim c Soll betont werden, dass keine Ausnahmesituation vorliegt, dann nennt man die bisher betrachteten bestimmten Integrale eigentlich. Man sagt, dass ein uneigentliches Integral konvergiert (bzw. divergiert ), wenn der zugehorige Grenzwert existiert (bzw. nicht existiert). Beispiel Z 7.10. Es sei α ∈ R, α 6= 1, dann gilt ∞ ( 1 dx 1 1 , α−1 = lim 1 − α−1 = α c→∞ x (α − 1) c ∞, falls falls α>1 α<1 (konvergent), (divergent). 1 ( dx 1 1 ∞, = lim −1 = 1 α α−1 c→0+ (α − 1) c , x 1−α falls falls α>1 α<1 (divergent), (konvergent). 1 und Z 0 Selbstverstandlich kann man auch ein an beiden Grenzen uneigentliches Integral betrachten. Es sei aber darauf hingewiesen, dass dann das Integral in zwei, nur an einer Grenze uneigentliches Integral zu zerlegen ist, und beide Grenzwerte unabhängig voneinander zu bestimmen sind. Beispiel Z ∞ −∞ 7.11. dx = 1 + x2 Z 0 −∞ dx + 1 + x2 Z 0 ∞ dx =2 1 + x2 ∞ Z 0 dx = 2 lim arctan c = π. c→∞ 1 + x2 Besitzt der Integrand im Innern des Denitionsintervalls endlich viele Ausnahmestellen (Unstetigkeitsstellen oder Lucken) a = x0 < x1 < . . . xn−1 < xn = b, dann zerlegt man das Integral in eine Summe eigentlicher oder uneigentlicher Teilintegrale: Z b f (x) dx = a n Z X i=1 xi f (x) dx. xi−1 gelegentlich arbeitet man auch dem Cauchyschen Hauptwert, wenn f nur in c im Innern eines Intervalls eine Ausnahmestelle besitzt. Dieser ist anders deniert als das uneigentliche Integral. 4. ANWENDUNGEN 221 7.4. Cauchyscher Hauptwert. Um deutlich zu machen, Definition dass der Cauchysche Hauptwert gemeint ist schreibt man b Z CHW f (x) dx = v.p. Z ε→0+ a 7.12. Das Funktion f (x) = liche Integral ist divergent, da Z 0 3 dx = x−1 Z 0 1 c−ε f (x) dx = lim a Beispiel b Z Z b f (x) dx + a f (x) dx . c+ε ist in x = 1 unstetig. Das uneigent- 1 x−1 Z 3 Z c Z 3 dx dx dx dx + = lim + lim c→1−0 d→1+0 d x − 1 x−1 1 x−1 0 x−1 c = lim ln |x − 1| |0 + lim ln |x − 1| |3d = ∞ + (ln 2 − ∞), c→1−0 d→1+0 d.h. keins der Teilintegrale existiert! Dagegen existiert der Cauchysche Hauptwert Z CHW 0 3 dx = lim x − 1 ε→0+ Z 1−ε 0 dx + x−1 Z 3 dx x−1 1+ε = lim (ln ε + ln 2 − ln ε) = ln 2. ε→0+ 4. Anwendungen 4.1. Volumen von Rotationskörpern. Von einem dreidimensionalen Korper sei nach Wahl eines geeigneten kartesischen Koordinatensystems fur jedes x ∈ [a, b] der Flacheninhalt F (x) des Querschnitts bekannt. y ΔX z x Das Volumen der Scheibe der Dicke ∆x betragt naherungsweise F (x)∆x. In Kurzform: dV = F (x)∆x; die Integration ergibt Z V = Z dV = F (x) dx. a Speziell gilt mit F (x) = π(f (x))2 : b 222 7. INTEGRALRECHNUNG IM Satz R1 7.3. Ein durch Drehung der Kurve (Kontur) y = f (x), um die x-Achse erzeugter Rotationskorper hat das Volumen a ≤ x ≤ b, b Z (f (x))2 dx. V =π a Beispiel 7.13. Volumen eines Torus (Reifen). y r R x Torus Der Torus entsteht durch Rotation des oberen Halbkreises y1 = R + √ r 2 − x2 um die x-Achse, wobei der "innere Korper\ entfernt wird. Der "innere Korper\ entsteht durch die Rotation des unteren Halbkreises y2 = R − √ r 2 − x2 um die x-Achse. Damit ergibt sich das Volumen des Torus zu Z r Z r Z dx − π y22 r dx = π (y12 − y22 ) dx −r −r −r Z r Z r√ √ √ =π (R2 + 2R r2 − x2 + r2 − x2 − R2 + 2R r2 − x2 − r2 + x2 dx = 4Rπ r2 − x2 dx V =π y12 −r Substitution: t = π2 ergibt −r x = r sin t, dx = r cos t dt, −r = r sin t ⇐⇒ t = Z π 2 = 4Rπ Z p 2 r2 − r2 sin t r cos t dt = 4Rπ − π2 2 Z π 2 = 4Rr π √ r = r sin t ⇐⇒ r2 cos2 t r cos t dt − π2 2 2 Z π 2 cos t dt = 4Rr π − π2 π 2 − π2 , 2 2 Z π 2 cos t dt = 2Rr π − π2 cos 2t + 1 dt − π2 2 = 2Rr π π2 1 sin 2t + t = 2Rr2 π 2 . 2 −π 2 4. ANWENDUNGEN 223 4.2. Kurvenlänge. Die Parameterdarstellung x = x(t), y = y(t) (a ≤ t ≤ b) einer Kurve heit regular, wenn die Funktionen t 7→ x(t), t 7→ y(t) uber [a, b] stetig dierenzierbar sind und ẋ(t)2 + ẏ(t)2 6= 0 fur a ≤ t ≤ b gilt, dabei sind ẋ(a) und ẋ(b) als einseitige Ableitungen zu verstehen. 7.4. Es gilt (1) Die Lange eines Kurvenbogens mit regularer Parameterdarstel- Satz lung betragt Z bp ẋ(t)2 + ẏ(t)2 dt. L= a (2) Der Graph y = f (x) einer stetig dierenzierbaren Funktion f : [a, b] → R hat die Lange Z bp L= 1 + f 0 (x)2 dx. a Beweis: Wir zerlegen das Parameterintervall [a, b] in (aquidistante) Zwischenpunkte ti+1 − ti = ∆t, a = t0 < t1 < . . . < tn = b, in n Teilintervalle. Uber jedem dieser Teilintervalle wird der Kurvenbogen ersetzt Δs Δy Δx durch die Sehne der Lange ∆s = p p (∆x)2 + (∆y)2 = ẋ(ξi )2 + ẏ(ηi )2 ∆t mit ξi , ηi zwischen ti und ti + ∆t. Dies ist eine Folgerung aus dem Mittelwertsatz 6.16. Summation und der Grenzubergang ∆t → 0 (bzw. n → ∞) ergeben die Behauptung a). b) ist ein Spezialfall von a), denn es ist x(t) = t und y(t) = f (t) eine stetig dierenzierbare Parameterdarstellung der Kurve y = f (x). # 4.3. Mantelfläche. Die Mantelache eines Rotationskorpers mit der Kontur y = f (x), a ≤ x ≤ b, berechnet man dadurch, dass die Mantelache dM einer d unnen Scheibe der Dicke dx angenahert wird durchpdie Mantelache eines Zylinders mit dem Radius f (x) und der Mantelhohe ds = 1 + f 0 (x)2 dx (vgl. Satz 7.4). Folglich 224 7. INTEGRALRECHNUNG IM gilt dM = 2π f (x) R1 p 1 + f 0 (x)2 dx und Integration ergibt Z b f (x) M = 2π p 1 + f 0 (x)2 dx. a Beispiel 7.14. Wir mochten die Matelache des in Beispiel 7.13 betrachte- ten Torus berechnen.√Die Mantelache setzt sich wieder aus der vom oberen Kreisbogen y1 = R + r2 − x√2 erzeugten Mantelache M1 und aus der vom unteren Kreisbogen y2 = R − r2 − x2 erzeugten Mantelache M2 zusammen. Es gilt wegen (y10 )2 = (y20 )2 Z rp p 0 2 1 + (y10 )2 dx M = M1 + M2 = 2π (y1 + y2 ) 1 + (y1 ) dx = 4πR −r −r Z rr Z r 2 r 1 √ = 4πR dx = 4πRr dx 2 2 r −x r 2 − x2 −r −r Z Substitution: t = π2 ergibt r x = r sin t, dx = r cos t dt, −r = r sin t ⇐⇒ t = − π2 , r = r sin t ⇐⇒ Z π 2 = 4πRr − π2 r cos t dt = 4π 2 R r. r cos t Die Rechung lasst sich erheblich verkurzen, wenn man berucksichtigt, dass Z r −r p 1 + (y10 )2 dx = πr die Lange des Halbkreisbogens ist.