Hochschule für Technik und Wirtschaft Dresden Fakultät Informatik/Mathematik Prof. Dr. B. Jung Skript zur Vorlesung Mathematik 1 für den Studiengang Elektrotechnik und Informationstechnik Stoffgebiete: 1. Komplexe Zahlen 2. Vektorrechnung und analytische Geometrie 3. Matrizen, Determinanten und lineare Gleichungssysteme 4. Folgen und Reihen 5. Differentialrechnung für Funktionen einer reellen Variablen Inhaltsverzeichnis 1 2 3 Komplexe Zahlen 1.1 Grundbegriffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.1.1 Imaginäre Einheit, Begriff der komplexen Zahl . . . . . . . . . . 1.1.2 Gaußsche Zahlenebene . . . . . . . . . . . . . . . . . . . . . . . 1.2 Grundrechenarten mit komplexen Zahlen . . . . . . . . . . . . . . . . . 1.3 Die trigonometrische Form einer komplexen Zahl . . . . . . . . . . . . . 1.3.1 Umrechnung zwischen arithmetischer und trigonometrischer Form 1.3.2 Multiplikation und Division in trigonometrischer Form . . . . . . 1.3.3 Potenzieren und Radizieren . . . . . . . . . . . . . . . . . . . . 1.4 Die Exponentialform einer komplexen Zahl . . . . . . . . . . . . . . . . 1.4.1 Umrechnung zwischen arithmetischer Form und Exponentialform 1.4.2 Rechnen mit komplexen Zahlen in der Exponentialform . . . . . 1.4.3 Der natürliche Logarithmus im Komplexen . . . . . . . . . . . . 1.5 Anwendungen der komplexen Rechnung . . . . . . . . . . . . . . . . . . 1.5.1 Darstellung von Schwingungen im Zeigerdiagramm . . . . . . . 1.5.2 Widerstände im Wechselstromkreis . . . . . . . . . . . . . . . . 1.6 Komplexe Funktionen (Einblick) . . . . . . . . . . . . . . . . . . . . . . 1.6.1 Einführung: Komplexe Funktionen . . . . . . . . . . . . . . . . . 1.6.2 Lineare komplexe Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 4 4 5 5 7 7 8 8 10 10 11 11 12 12 13 14 14 15 Vektorrechnung und analytische Geometrie 2.1 Grundbegriffe . . . . . . . . . . . . . . . . . . . . . . . 2.2 Vektoroperationen . . . . . . . . . . . . . . . . . . . . . 2.3 Vektoren im dreidimensionalen Raum . . . . . . . . . . 2.3.1 Darstellung von Vektoren . . . . . . . . . . . . 2.3.2 Darstellung der Vektoroperationen . . . . . . . . 2.4 Produkte von Vektoren und ihre Anwendungen . . . . . 2.4.1 Skalarprodukt (inneres Produkt) . . . . . . . . . 2.4.2 Vektorprodukt (Kreuzprodukt, äußeres Produkt) . 2.4.3 Spatprodukt (gemischtes Produkt) . . . . . . . . 2.5 Geraden und Ebenen . . . . . . . . . . . . . . . . . . . 2.5.1 Darstellung von Geraden . . . . . . . . . . . . . 2.5.2 Lagebeziehungen von Geraden . . . . . . . . . . 2.5.3 Darstellung von Ebenen . . . . . . . . . . . . . 2.6 Vektoren im Rn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 17 17 18 18 19 20 20 22 23 24 24 26 26 29 . . . . . . . . . . . . . . . . . 30 30 30 31 32 32 33 33 34 35 36 37 38 38 40 40 40 42 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Matrizen, Determinanten und lineare Gleichungssysteme 3.1 Grundbegriffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.1.1 Definition einer Matrix . . . . . . . . . . . . . . . . . . . . 3.1.2 Spezielle Matrizen . . . . . . . . . . . . . . . . . . . . . . 3.2 Rechenoperationen mit Matrizen . . . . . . . . . . . . . . . . . . . 3.2.1 Addition und Subtraktion von Matrizen . . . . . . . . . . . 3.2.2 Multiplikation einer Matrix mit einem Skalar . . . . . . . . 3.2.3 Multiplikation von Matrizen . . . . . . . . . . . . . . . . . 3.2.4 Blockzerlegung von Matrizen . . . . . . . . . . . . . . . . 3.3 Inverse Matrix . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.4 Rang einer Matrix . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.5 Komplexe Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . 3.6 Determinanten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.6.1 Definition der Determinante, Laplacescher Entwicklungssatz 3.6.2 Rechenregeln für Determinanten . . . . . . . . . . . . . . . 3.7 Lineare Gleichungssysteme . . . . . . . . . . . . . . . . . . . . . . 3.7.1 Einführung . . . . . . . . . . . . . . . . . . . . . . . . . . 3.7.2 Der Gaußsche Algorithmus . . . . . . . . . . . . . . . . . . 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.8 3.9 4 5 3.7.3 Lineare Gleichungssysteme mit quadratischer Koeffizientenmatrix, Cramersche Regel 3.7.4 Gauß-Jordan-Verfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Eigenwertprobleme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.8.1 Einführung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.8.2 Berechnung von Eigenwerten (EW) . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.8.3 Berechnung von Eigenvektoren (EV) . . . . . . . . . . . . . . . . . . . . . . . . . . Zusammenfassende Aussagen über quadratische Matrizen . . . . . . . . . . . . . . . . . . . Folgen und Reihen 4.1 Definition und Darstellung reeller Zahlenfolgen 4.2 Eigenschaften von Folgen und spezielle Folgen 4.2.1 Monotonie und Beschränktheit . . . . . 4.2.2 Arithmetische und geometrische Folgen 4.3 Grenzwerte von Folgen . . . . . . . . . . . . . 4.4 Unendliche Reihen . . . . . . . . . . . . . . . 4.4.1 Konvergenz unendlicher Reihen . . . . 4.4.2 Konvergenzkriterien für Reihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 45 45 45 45 47 48 . . . . . . . . 49 49 50 50 50 51 53 53 54 Differentialrechnung für Funktionen einer reellen Variablen 5.1 Darstellung ebener Kurven . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.1.1 Parameterdarstellung von Kurven . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.1.2 Darstellung von Kurven in Polarkoordinaten . . . . . . . . . . . . . . . . . . . . . . . 5.2 Grenzwert und Stetigkeit einer Funktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2.1 Grenzwerte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2.2 Asymptoten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2.3 Stetigkeit einer Funktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2.4 Eigenschaften gebrochenrationaler Funktionen . . . . . . . . . . . . . . . . . . . . . . 5.3 Differentialrechnung: Grundlagen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.3.1 Differenzierbarkeit und erste Ableitung . . . . . . . . . . . . . . . . . . . . . . . . . . 5.3.2 Das Differential einer Funktion und dessen Anwendung in der Fehlerrechnung . . . . . 5.3.3 Höhere Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.3.4 Der Mittelwertsatz der Differentialrechnung . . . . . . . . . . . . . . . . . . . . . . . . 5.4 Anwendungen der Differentialrechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.4.1 Anwendungen aus Physik und Technik . . . . . . . . . . . . . . . . . . . . . . . . . . 5.4.2 Untersuchung des Monotonieverhaltens und Bestimmung charakteristischer Kurvenpunkte 5.4.3 Extremwertaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.4.4 Regel von Bernoulli-de l’Hospital . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.4.5 Kurvendiskussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.4.6 Taylor-Polynome . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.5 Numerische Verfahren zur Lösung von Gleichungen . . . . . . . . . . . . . . . . . . . . . . . . 5.5.1 Das Newtonsche Iterationsverfahren (Newton-Verfahren) . . . . . . . . . . . . . . . . . 5.5.2 Fixpunktiteration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 57 57 57 58 60 60 63 64 65 68 68 71 72 73 73 73 74 77 78 79 81 84 84 86 1 Komplexe Zahlen 1.1 1.1.1 Grundbegriffe Imaginäre Einheit, Begriff der komplexen Zahl √ Die Gleichung x2 + 1 = 0 hat im Bereich der reellen Zahlen keine Lösung, da −1 nicht definiert ist. ⇒ Zahlenbereichserweiterung, so dass Quadratwurzeln aus negativen Radikanden definiert sind Definition 1.1: Die Zahl j mit der Eigenschaft j2 = −1 (1) wird imaginäre Einheit genannt. Mit Hilfe dieser Definition werden die komplexen Zahlen eingeführt: Definition 1.2: Unter einer komplexen Zahl versteht man eine Zahl mit der Darstellung z = a + b · j, (2) wobei a, b ∈ R und j aus (1). Dabei ist a der Realteil der komplexen Zahl z und b ist der Imaginärteil: a = Re(z), b = Im(z). Durch die Formel (2) ist die arithmetische Form (oder auch: kartesische Form) der komplexen Zahl gegeben; weitere Formen der komplexen Zahl: siehe Abschnitte 1.3, 1.4. Beispiel 1.1: Die Menge der komplexen Zahlen wird mit dem Symbol C bezeichnet. Es gilt: N ⊂ Z ⊂ Q ⊂ R ⊂ C (N: Menge der natürlichen Zahlen, Z: Menge der ganzen Zahlen, Q: Menge der rationalen Zahlen, R: Menge der reellen Zahlen). Zwei komplexe Zahlen z1 = a + bj und z2 = c + dj sind genau dann gleich (d.h. z1 = z2 ), wenn gilt: a = c und b = d. Die Zahl z ∗ = a − bj ist die zu z = a + bj konjugiert-komplexe Zahl, d.h. bei z und z ∗ stimmen die Realteile überein, die Imaginärteile haben zueinander entgegengesetzte Vorzeichen. Beispiel 1.2: Allgemein gilt: (z ∗ )∗ = z. Jede reelle Zahl ist zu sich selbst konjugiert-komplex, da ihr Imaginärteil gleich 0 ist. Bemerkungen: - Die imaginäre Einheit wird auch mit i bezeichnet. In der Elektrotechnik bevorzugt man die Bezeichnung j , um Verwechslungen mit dem Momentanwert der Stromstärke zu vermeiden. - Für komplexe Zahlen gibt es - im Unterschied zu den reellen Zahlen - keine Anordnung im Sinne von <“ ” bzw. >“. ” 4 1.1.2 Gaußsche Zahlenebene Während man zur Veranschaulichung reeller Zahlen eine Zahlengerade verwendet, ist für komplexe Zahlen die Darstellung in der Gaußschen Zahlenebene üblich. Eine komplexe Zahl wird in der Gaußschen Zahlenebene als Bildpunkt oder als Zeiger dargestellt (siehe Bild 1.1, 1.2): Im(z) 6 b s P (z) 0 a Im(z) 6 b 0 Re(z) Bild 1.1: Darstellung als Bildpunkt Der komplexen Zahl z = a + bj wird der Bildpunkt P (z) = (a, b) zugeordnet. z = a + bj a - Re(z) Bild 1.2: Darstellung als Zeiger Die komplexe Zahl z = a + bj wird in Form eines Pfeils dargestellt, der vom Koordinatenursprung aus zum Bildpunkt P (z) gerichtet ist. Bezeichnung: z Die Bildpunkte der reellen Zahlen z = a + 0 · j = a liegen auf der reellen Achse, da Im(z) = 0 gilt. Die Bildpunkte der imaginären Zahlen z = 0 + bj = bj liegen auf der imaginären Achse, denn Re(z) = 0. 1.2 Grundrechenarten mit komplexen Zahlen Bei der Herleitung der Rechengesetze für komplexe Zahlen erfolgt eine komponentenweise Anwendung der Grundrechenarten für reelle Zahlen. Außerdem wird die Relation (1) verwendet. Im weiteren seien z1 = a + bj und z2 = c + dj beliebige komplexe Zahlen. I. Addition und Subtraktion z1 + z2 = (a + bj) + (c + dj) = a + c + (b + d)j (d.h.: Realteil der Summe = Summe der Realteile beider Summanden, Imaginärteil der Summe = Summe der Imaginärteile beider Summanden) z1 − z2 = (a + bj) − (c + dj) = a − c + (b − d)j (Rechenregel analog zur Addition) Beispiel 1.3: Die Summe (bzw. Differenz) zweier komplexer Zahlen kann auch eine reelle bzw. imaginäre Zahl sein, wie das folgende Beispiel zeigt: Sei z = a + bj , dann gilt: z + z ∗ = a + bj + a − bj = 2a sowie z − z ∗ = a + bj − (a − bj) = 2bj . Addition und Subtraktion komplexer Zahlen lassen sich mit Hilfe von Zeigern in der Gaußschen Zahlenebene wie folgt veranschaulichen (Abbildungen siehe nächste Seite): 5 Im(z) Im(z) z3 z2 z2 1 −1 z1 1 z1 0 1 −1 Re(z) −1 0 1 z3 Re(z) −1 −z 2 Bild 1.3: Addition komplexer Zahlen z3 = z1 + z 2 (entspricht der Konstruktion eines Parallelogramms mit den Seiten z 1 und z 2 sowie der Diagonalen z 3 ) Bild 1.4: Subtraktion komplexer Zahlen: z3 = z1 − z2 (entspricht der Konstruktion eines Parallelogramms mit den Seiten z 1 und −z 2 sowie der Diagonalen z 3 ) II. Multiplikation Sei z1 = a + bj, z2 = c + dj, dann gilt: z1 · z2 = (a + bj) · (c + dj) = ac + adj + bcj + bdj2 = ac − bd + (ad + bc)j (Nutzung des Distributivgesetzes für die Multiplikation sowie der Relation (1)) Beispiel 1.4: Für weitere Berechnungen wird das Produkt einer komplexen Zahl z mit der konjugiert-komplexen Zahl z ∗ benötigt. Für z = a + bj gilt: z · z ∗ = (a + bj) · (a − bj) = a2 − abj + abj − b2 j2 = a2 + b2 (3) d.h. das Produkt z · z ∗ ist für beliebiges z ∈ C eine reelle Zahl. III. Division z Die Berechnung des Quotienten z1 : z2 zweier komplexer Zahlen erfolgt durch Erweitern des Bruches 1 mit der zum Nenner konjugiert-komplexen Zahl. Sei z1 = a + bj, z2 = c + dj (mit z2 6= 0), dann gilt gemäß Relation (3): z1 a + bj (a + bj)(c − dj) ac + bd + (bc − ad)j ac + bd bc − ad = = = = 2 + 2 j z2 c + dj (c + dj)(c − dj) c2 + d2 c + d2 c + d2 Beispiel 1.5: 6 z2 Zusammenfassung: Grundrechenarten für komplexe Zahlen Sei z1 = a + bj und z2 = c + dj. Addition: z1 + z2 = a + c + (b + d)j Subtraktion: z1 − z2 = a − c + (b − d)j Multiplikation: z1 · z2 = ac − bd + (ad + bc)j Division: z1 ac + bd bc − ad z · z∗ + 2 j (mit der zum Nenner konjug.-kompl. Zahl erweitern) = 1 2∗ = 2 z2 z2 · z2 c + d2 c + d2 Rechengesetze: Für beliebige Zahlen z1 , z2 , z3 ∈ C gilt: Kommutativgesetz: z1 + z 2 = z 2 + z1 , Assoziativgesetz: z1 + (z2 + z3 ) = (z1 + z2 ) + z3 , Distributivgesetz: z1 · (z2 + z3 ) = z1 · z2 + z1 · z3 1.3 z1 · z 2 = z 2 · z 1 z1 · (z2 · z3 ) = (z1 · z2 ) · z3 Die trigonometrische Form einer komplexen Zahl 1.3.1 Umrechnung zwischen arithmetischer und trigonometrischer Form Bisher wurde die arithmetische Form einer komplexen Zahl: z = a + bj betrachtet. In diesem Abschnitt wird die trigonometrische Form eingeführt. Dabei wird die komplexe Zahl z durch die folgenden Größen charakterisiert: r : Betrag oder Norm der komplexen Zahl ϕ : Argument oder Phase der komplexen Zahl (zur Veranschaulichung: siehe Bild 1.5) Im(z) 6 Bild 1.5: Betrag der komplexen Zahl z = a + bj: Abstand des Bildpunktes P = P (z) der Zahl z vom Koordinatenursprung, √ r = |z| = a2 + b2 sP b r Argument der komplexen Zahl z = a + bj: Winkel, den die Strecke 0P mit der positiven reellen Halbachse bildet, ] ϕ - a 0 ϕ = arg z mit tan ϕ = Re(z) b a (a > 0, b ≥ 0) Aus Bild 1.5 ist (durch Betrachtungen am rechtwinkligen Dreieck) sofort ersichtlich, dass gilt: a = r · cos ϕ, b = r · sin ϕ. Die trigonometrische Form (oder auch: goniometrische Form) der komplexen Zahl z = a + bj lautet dann: z = r(cos ϕ + j sin ϕ) . (4) Umrechnung: arithmetische → trigonometrische Form Wenn eine komplexe Zahl in der Form z = a + bj gegeben ist, so werden die Größen r und ϕ für die trigonometrische Form (4) wie folgt berechnet: p r = a2 + b2 a arccos , falls b ≥ 0 und r > 0 ar ϕ= , falls b < 0 und r > 0 − arccos r unbestimmt, falls r = 0 . (5) (6) Umrechnung: trigonometrische → arithmetische Form Bei gegebenen Werten für r und ϕ werden a und b folgendermaßen berechnet: a = r · cos ϕ, b = r · sin ϕ . (7) 7 Bei der Umrechnung ist folgendes zu beachten: - Das Argument arg z einer komplexen Zahl ist nur bis auf Vielfache von 2π eindeutig bestimmt. Daher wird für das Argument meist der Hauptwert: −π < ϕ ≤ π angegeben. - Die Berechnung des Argumentes kann auch mit Hilfe der arctan-Funktion erfolgen. Die entsprechende Formel (mit Fallunterscheidung bzgl. der Vorzeichen von a und b) findet man z.B. in: W. G ÖHLER. Formelsamm b , vgl. lung Höhere Mathematik, 16. Auflage, S. 1. Beispielsweise gilt im Fall a > 0, b ≥ 0: ϕ = arctan a dazu auch Bild 1.5. - Der Koordinatenursprung ist allein durch r = 0 bestimmt. Beispiel 1.6: Beispiel 1.7: Die Umrechnung zwischen arithmetischer und trigonometrischer Form kann auch direkt mit Hilfe des Taschenrechners erfolgen (siehe Repetitorium). 1.3.2 Multiplikation und Division in trigonometrischer Form In der trigonometrischen Form sind Multiplikation und Division komplexer Zahlen sehr einfach darstellbar. I. Multiplikation Sei z1 = r1 (cos ϕ1 + j sin ϕ1 ) und z2 = r2 (cos ϕ2 + j sin ϕ2 ), dann erhält man unter Anwendung eines Additionstheorems1 : z1 · z2 = r1 (cos ϕ1 + j sin ϕ1 ) · r2 (cos ϕ2 + j sin ϕ2 ) = r1 · r2 · [cos(ϕ1 + ϕ2 ) + j sin(ϕ1 + ϕ2 )] = r3 (cos ϕ3 + j sin ϕ3 ) = z3 ⇒ Regel für Multiplikation: Beträge multiplizieren, Argumente addieren (r3 = r1 · r2 , ϕ3 = ϕ1 + ϕ2 ) Daraus folgt sofort auch: |z1 · z2 | = |z1 | · |z2 | . Beispiel 1.8: II. Division Sei wiederum z1 = r1 (cos ϕ1 + j sin ϕ1 ), z2 = r2 (cos ϕ2 + j sin ϕ2 ) mit r2 6= 0 (d.h. z2 6= 0). Dann gilt: z1 r = 1 · [cos(ϕ1 − ϕ2 ) + j sin(ϕ1 − ϕ2 )] = r3 (cos ϕ3 + j sin ϕ3 ) = z3 z2 r2 r ⇒ Regel für Division: Beträge dividieren, Argumente subtrahieren (r3 = 1 , ϕ3 = ϕ1 − ϕ2 ) r2 z1 |z1 | Daraus folgt sofort auch: = . z2 |z2 | Beispiel 1.9: 1.3.3 Potenzieren und Radizieren Für die Ausführung dieser Rechenoperationen ist die trigonometrische Form der komplexen Zahlen besonders vorteilhaft. Zunächst wird noch der folgende Satz benötigt: 1 Additionstheoreme für trigonometrische Funktionen findet man z.B. in: H.-J. BARTSCH . Taschenbuch Mathematischer Formeln für Ingenieure und Naturwissenschaftler, 23. Auflage, S. 377ff. 8 Satz (Formel) von Moivre: (cos ϕ + j sin ϕ)n = cos(nϕ) + j sin(nϕ) (gültig für n ∈ Q) (8) I. Potenzieren mit ganzzahligem Exponenten Unter Verwendung von (8) ergibt sich für n ∈ Z: z n = [r(cos ϕ + j sin ϕ)]n = rn (cos ϕ + j sin ϕ)n = rn [cos(nϕ) + j sin(nϕ)] ⇒ Regel für Potenzieren: Betrag in n-te Potenz erheben, Argument mit n multiplizieren Beispiel 1.10: II. Radizieren (Wurzelziehen) Sei w ∈ C. Eine komplexe Zahl z heißt n-te Wurzel aus w, wenn sie der Gleichung z n = w genügt (n ∈ N∗ , mit N∗ = N \{0}). Die Gleichung z n = w besitzt im Komplexen genau n verschiedene Lösungen (Wurzeln). Berechnung der n-ten Wurzeln: 1) Zahl w in trigonometrischer Form darstellen (falls diese nicht schon vorliegt): w = r(cos ϕ + j sin ϕ) 2) Anwendung der Formel: √ ϕ + 2kπ zk = n r(cos ϕk + j sin ϕk ) für k = 0, 1, . . . , n − 1, mit ϕk = n ⇒ z0 , z1 , . . . , zn−1 sind die n-ten Wurzeln aus w (Hinweis: Falls die Berechnung im Gradmaß erfolgt, gilt: ϕk = ϕ + k · 360◦ n .) Beispiel 1.11: Gesucht sind alle komplexen Lösungen z der Gleichung z 4 = w mit w = −16. 1) Umwandlung der Zahl w = −16 in die trigonometrische Form p Es gilt: r = (−16)2 + 02 = 16 sowie ϕ = arccos −16 =π 16 ⇒ w = 16 · (cos π + j sin π). 2) Anwendung der Formel für die n-ten Wurzeln Mit n = 4 lautet die Formel für die n-ten Wurzeln: √ ϕ + 2kπ zk = 4 r · (cos ϕk + j sin ϕk ), k = 0, 1, 2, 3, mit ϕk = 4 Nun wird r = 16, ϕ = π sowie nacheinander k = 0, k = 1, k = 2 und k = 3 in diese Formel eingesetzt: h i √ √ √ π π π π+2·0·π 4 = , z0 = 16 · cos + j sin = 2 + 2j k = 0 : ϕ0 = 4 k=1: k=2: 4 4 4 h i √ √ √ π+2·1·π 3π 3π 3π 4 ϕ1 = = , z1 = 16 · cos + j sin = − 2 + 2j 4 4 4 4 h i √ π+2·2·π 5π 5π 5π 4 ϕ2 = = , z2 = 16 · cos + j sin 4 4 4 4 h i √ √ √ 3π 3π 4 = 16 · cos − + j sin − = − 2 − 2j 4 k=3: 4 √ 4 h i π+2·3·π 7π 7π 7π ϕ3 = = , z3 = 16 · cos + j sin 4 4 4 4 h i √ π π 4 + j sin − = 16 · cos − 4 4 = √ 2− √ 2j Bemerkungen: - Die Probe zur durchgeführten Rechnung lässt sich leicht durchführen, indem die Zahlen z0 , z1 , z2 und z3 jeweils in die vierte Potenz erhoben werden. - Die Gleichung x4 = −16 besitzt im Reellen keine Lösung, die Gleichung z 4 = −16 hat jedoch vier verschiedene komplexe Lösungen. Bild 1.6 (siehe nächste Seite) veranschaulicht die berechneten Wurzeln in der Gaußschen Zahlenebene. 9 Im(z) 6 z1 z0 @ I @ 1 @ @ @ @ −1 - −1 z2 Re(z) 1 @ @ @ @ @ R @ z3 Bild 1.6: Darstellung der Zeiger komplexen Zahlen z0 , z1 , z2 und z3 aus Beispiel 1.11 Die Bildpunkte der komplexen Zahlen z0 , z1 , z2 und z3 (Lösungen der Gleichung z 4 = −16) liegen alle auf einem Kreis mit dem Radius r = 2 um den Koordinatenursprung. Sie bilden die Eckpunkte eines regelmäßi” gen Vierecks“ (d.h. eines Quadrates). Beispiel 1.12: Zusammenfassung: Rechenoperationen mit komplexen Zahlen in der trigonometrischen Form Seien z, z1 , z2 ∈ C, mit z = r(cos ϕ + j sin ϕ) (für z1 , z2 : analoge Darstellung). Multiplikation: z1 · z2 = r1 · r2 · [cos(ϕ1 + ϕ2 ) + j sin(ϕ1 + ϕ2 )] Potenzieren: z1 r = 1 · [cos(ϕ1 − ϕ2 ) + j sin(ϕ1 − ϕ2 )] (mit r2 6= 0) z2 r2 z n = rn [cos(nϕ) + j sin(nϕ)] (n ∈ Z) Radizieren: zk = Division: 1.4 1.4.1 √ n r(cos ϕk + j sin ϕk ) für k = 0, 1, . . . , n − 1, mit ϕk = ϕ+2kπ n (n ∈ N∗ ) Die Exponentialform einer komplexen Zahl Umrechnung zwischen arithmetischer Form und Exponentialform Für die weiteren Betrachtungen wird die folgende Formel benötigt: Eulersche Formel: e jϕ = cos ϕ + j sin ϕ (9) Die Besonderheit dieser Formel besteht darin, dass der Exponent der e-Funktion eine imaginäre Zahl ist. Mit Hilfe der Formeln (7) und (9) erhält man: r · e jϕ = r · (cos ϕ + j sin ϕ) = a + bj . Die Exponentialform der komplexen Zahl z = a + bj lautet dann: z = r · e jϕ = |z| · e jϕ . (10) Die Exponentialform der komplexen Zahl kommt bei Berechnungen in der Elektrotechnik häufig zur Anwendung, siehe dazu auch Abschnitt 1.5. Umrechnung: arithmetische Form → Exponentialform Anwendung der Formeln (5) und (6) zur Berechnung von r und ϕ in (10) Umrechnung: Exponentialform → arithmetische Form Anwendung der Formel (7) mit r und ϕ aus (10) 10 Beispiel 1.13: Beispiel 1.14: Die Umrechnung zwischen arithmetischer und Exponentialform kann auch direkt mit Hilfe des Taschenrechners erfolgen (siehe Repetitorium). Die Versorform der komplexen Zahl ist eine abkürzende Schreibweise der Exponentialform. Man schreibt: z = r∠ϕ , wobei ∠ϕ für e jϕ steht (vgl. Formel (10)). 1.4.2 Rechnen mit komplexen Zahlen in der Exponentialform Auf Grund der Eulerschen Formel (9) und der Periodizität trigonometrischer Funktionen folgt die Periodizität der e-Funktion mit imaginärem Exponenten: e jϕ = cos ϕ + j sin ϕ = cos(ϕ + 2kπ) + j sin(ϕ + 2kπ) = e j(ϕ+2kπ) für k ∈ Z . (11) Weitere Rechenregeln für komplexe Zahlen in der Exponentialform folgen auf Grund des engen Zusammenhangs zwischen trigonometrischer Form und Exponentialform leicht aus den im Abschnitt 1.3 behandelten Regeln. Zusammenfassung: Rechenoperationen mit komplexen Zahlen in der Exponentialform Seien z, z1 , z2 ∈ C mit z = r · e jϕ (für z1 , z2 : analoge Darstellung). Multiplikation: z1 · z2 = r1 · r2 · e j(ϕ1 +ϕ2 ) Potenzieren: z1 r = 1 · e j(ϕ1 −ϕ2 ) (mit r2 6= 0) z2 r2 n z = rn · e jnϕ (n ∈ Z) Radizieren: zk = Division: 1.4.3 √ n r · e jϕk für k = 0, 1, . . . , n − 1, mit ϕk = ϕ + 2kπ n (n ∈ N∗ ) Der natürliche Logarithmus im Komplexen Im Bereich der reellen Zahlen gilt: x = ln a ⇔ ex = a (a, x ∈ R, a > 0), d.h. der natürliche Logarithmus ist die Umkehrfunktion der e-Funktion. Kann dies auf den Bereich der komplexen Zahlen übertragen werden? Dazu wird nochmals die Eigenschaft (11) der e-Funktion im Komplexen betrachtet. Auf Grund ihrer Periodizität kann diese Funktion keine Umkehrfunktion besitzen. Im Bereich der komplexen Zahlen ist der natürliche Logarithmus nicht eindeutig. Für z ∈ C mit z = r · e jϕ , r 6= 0, erhält man unter Verwendung von Logarithmengesetzen: ln z = ln(r · e jϕ ) = ln r + ln(e jϕ ) = ln r + jϕ sowie zusätzlich unter Berücksichtigung von (11): ln z = ln(r · e jϕ ) = ln(r · e j(ϕ+2kπ) ) = ln r + j(ϕ + 2kπ) (k ∈ Z) . Hauptwert und Nebenwerte des natürlichen Logarithmus Der Hauptwert des natürlichen Logarithmus einer komplexen Zahl z = r · e jϕ (r 6= 0) ist gegeben durch: ln0 z = ln z = ln r + jϕ mit ϕ ∈ (−π, π] . Der k-te Nebenwert des natürlichen Logarithmus dieser komplexen Zahl lautet: lnk z = ln r + j(ϕ + 2kπ) mit k ∈ Z \ {0} . Bei diesen Berechnungen ist das Argument ϕ stets im Bogenmaß zu nehmen. 11 Beispiel 1.15: Bemerkungen: - Auch im Komplexen ist ln 0 nicht definiert, da r = 0 für z = 0 gilt. - Für jede positive reelle Zahl stimmen der reelle natürliche Logarithmus und der Hauptwert des komplexen natürlichen Logarithmus überein, da ϕ = 0 gilt (vgl. auch Beispiel 1.15 a)). 1.5 Anwendungen der komplexen Rechnung 1.5.1 Darstellung von Schwingungen im Zeigerdiagramm Für praktische Anwendungen sind häufig Schwingungsvorgänge (z.B. mechanische oder elektromagnetische Schwingungen) zu untersuchen. Jede harmonische Schwingung wird durch eine Gleichung der Form y(t) = A · sin(ωt + ϕ) (12) beschrieben, mit den folgenden physikalischen Größen: y(t) A ω ϕ – – – – Auslenkung zur Zeit t Amplitude (Scheitelwert) Kreisfrequenz (ω > 0); es gilt: ω = Phasenwinkel (Nullphase). 2π T mit der Schwingungsdauer T Wie die nachfolgenden Überlegungen2 zeigen, kann eine solche harmonische Schwingung auch durch einen rotierenden komplexen Zeiger dargestellt werden. Diese Darstellung bietet Vorteile für Berechnungen z.B. in der Wechselstromtechnik (siehe dazu Abschnitt 1.5.2), da die Rechengesetze für komplexe Zahlen ausgenutzt werden können. y A 6 y(t) = A · sin(ωt + ϕ) - t Sei y(t) eine sich mit der Zeit t sinusförmig verändernde Größe (Schwingung). Bild 1.7 zeigt den zeitlichen Verlauf dieser Schwingung. −A Bild 1.7 ω 6 A·sin(ωt + ϕ) B B (2) B A B * (1) ωtI ϕ A·sin ϕ K - Ein Zeiger der Länge A rotiert mit Winkelgeschwindigkeit (Kreisfrequenz) ω entgegen dem Uhrzeigersinn um den Nullpunkt (siehe Bild 1.8). Die Ordinate der Zeigerspitze entspricht dem augenblicklichen Funktionswert von y(t) = A · sin(ωt + ϕ) (mit A > 0, ϕ > 0). Lage zur Zeit t = 0 (Position (1)): y(t) = A · sin ϕ Lage zur Zeit t > 0 (Position (2)): y(t) = A · sin(ωt + ϕ) Bild 1.8 2 Quelle: L. PAPULA . Mathematik für Ingenieure und Naturwissenschaftler, Band 1, 12. Auflage (2009), S. 683-687 12 Im(y) 6 y(t) = A·e jωt ω A * ωtI ϕK y(0) = A - Re(y) Die Ebene, in der die Rotation des Zeigers (siehe Bild 1.8) erfolgt, kann auch als Gaußsche Zahlenebene (siehe Bild 1.9) gedeutet werden. Bild 1.9 Dann kann die augenblickliche Lage des Zeigers durch die zeitabhängige komplexe Zahl y = A · [cos(ωt + ϕ) + j · sin(ωt + ϕ)] = A · e j(ωt+ϕ) = A · e jϕ · e jωt = A · e jωt (13) beschrieben werden. Es werden folgende Bezeichnungen eingeführt: A = A · e jϕ : e jωt : Komplexe Amplitude, legt Anfangslage des rotierenden Zeigers fest (zeitunabhängig!) Zeitfunktion, beschreibt die Rotation des Zeigers mit der Winkelgeschwindigkeit ω um den Nullpunkt der komplexen Zahlenebene. Der Momentanwert der Sinusschwingung ist gleich dem Imaginärteil der komplexen Größe y: y = Im(y) = Im(A · e jωt ) = A · sin(ωt + ϕ) . In dem nachfolgenden Beispiel werden (mit Hilfe der Relationen (12) und (13)) die Gleichungen für Wechselspannung und Wechselstrom jeweils in die komplexe Form gebracht. Beispiel 1.16: 1.5.2 Widerstände im Wechselstromkreis In einem Wechselstromkreis erzeuge die Wechselspannung u = û e jωt den Wechselstrom i = î e jωt . Der komplexe Widerstand Z ist definiert als Verhältnis von komplexer Spannung und komplexer Stromstärke: u Z = . Unter Verwendung der Relationen aus Beispiel 1.16 und der Bezeichnung ϕ = ϕu − ϕi erhält man: i u û · e jϕu · e jωt û · e jϕu û û = = = · e j(ϕu −ϕi ) = · e jϕ . (14) jϕ jωt jϕ i î · e i · e î · e i î î √ √ Mit Hilfe von û = 2 U und î = 2 I (U, I: Effektivwerte von Spannung bzw. Stromstärke) kann die Gleichung (14) für den komplexen Widerstand im Wechselstromkreis auch in der Form Z= Z= U · e jϕ = Ze jϕ I 13 geschrieben werden. Dabei wird Z = |Z| als Scheinwiderstand oder Impedanz und ϕ als Phasenwinkel bezeichnet. Aus (14) ist ersichtlich, dass der komplexe Widerstand Z ein zeitunabhängiger komplexer Zeiger ist. Z kann auch in Real- und Imaginärteil zerlegt werden: Z = R + jX , wobei R als Wirkwiderstand und X als Blindwiderstand bezeichnet werden. Beispiel 1.17: Beispiel 1.18: 1.6 1.6.1 Komplexe Funktionen (Einblick) Einführung: Komplexe Funktionen Komplexe Funktionen werden für Berechnungen in der Elektrotechnik benötigt; sie treten z.B. in der Vierpoltheorie auf. Definition 1.3: Unter einer komplexen Funktion w = f (z) versteht man eine Funktion einer komplexen Variablen z, die jedem Wert z = x + jy aus einer Teilmenge D der komplexen z-Ebene je einen komplexen Wert w = u + jv in einer Teilmenge W der komplexen w-Ebene zuordnet. Dabei heißt D der Definitionsbereich und W der Wertebereich von f . Beispiel 1.19: Sei w = f (z) = f (x + jy) eine komplexe Funktion. Nach Zerlegung in Real- und Imaginärteil kann diese Funktion auch in der Form w = f (z) = f (x + jy) = u(x, y) + jv(x, y) (15) geschrieben werden. Mit dem Realteil u(x, y) und dem Imaginärteil v(x, y) der Funktion f (z) sind zwei reellwertige Funktionen festgelegt, die jeweils von den beiden reellen Variablen x und y abhängen. Beispiel 1.20: Eine Darstellung der Funktion w = f (z) in nur einer Ebene ist nicht möglich. Aus diesem Grund werden zur Veranschaulichung einer komplexen Funktion w = f (z) zwei Ebenen verwendet (z-Ebene und w-Ebene, gemäß Definition 1.3). y6 v6 z w = f (z) D r W r - - x z-Ebene (Originalebene) u w-Ebene (Bildebene) Bild 1.10: Veranschaulichung einer komplexen Funktion Viele der elementaren reellen Funktionen lassen sich ins Komplexe übertragen ( in die komplexe Ebene fortset” zen“). Im weiteren werden jedoch nur lineare komplexe Funktionen behandelt. 14 1.6.2 Lineare komplexe Funktionen Definition 1.4: Seien a und b komplexe Konstanten mit a 6= 0. Die komplexe Funktion w = f (z) = az + b (16) ist eine lineare Funktion. Zunächst werden Spezialfälle linearer komplexer Funktionen betrachtet. (I) Sei a = 1. Die lineare Funktion (16) lautet dann: w = f (z) = z + b , d.h. zu der komplexen Zahl z wird eine Konstante addiert. Mit b = b1 + jb2 (b1 , b2 ∈ R) gilt: w = z + b = x + jy + b1 + jb2 = x + b1 + j(y + b2 ) = u + jv (siehe dazu auch (15)). Anschaulich bedeutet dies, dass eine Verschiebung (Translation) um den Zeiger b erfolgt, siehe Bild 1.11. y v y + b2 w =z+b z y z b2 0 0 x b b1 x + b1 u x z-Ebene w-Ebene Bild 1.11: Veranschaulichung des Zeigers der komplexen Zahl w = z + b Gilt speziell a = 1 und b = 0, so erhält man w = f (z) = z , d.h. die identische Abbildung. (II) Sei b = 0. Die lineare Funktion (16) lautet dann: w = f (z) = az . Zur Untersuchung der Eigenschaften dieser Funktion ist die Verwendung der Exponentialform der komplexen Zahlen (siehe (10)) zweckmäßig: mit a = |a|e jϕa und z = |z|e jϕz erhält man: w = az = |a|e jϕa · |z|e jϕz = |a||z| e j(ϕa +ϕz ) , d.h. es gilt: w = |w|e jϕw mit |w| = |a||z| sowie ϕw = ϕa + ϕz . Anschaulich bedeutet dies, dass eine Streckung um den Faktor |a| und eine Drehung um den Winkel ϕa , d.h. eine Drehstreckung, erfolgt (siehe dazu Bild 1.12). Für die spezielle Situation a ∈ R und a > 0 gilt: ϕa = 0, so dass ϕw = ϕz folgt. Hier liegt nur eine Streckung mit dem Faktor |a| = a vor. y v w z z |a||z| |z| ϕa ϕz 0 0 x z-Ebene u w-Ebene Bild 1.12: Veranschaulichung des Zeigers der komplexen Zahl w = az 15 Für die allgemeine lineare Funktion aus (16) gilt mit a = a1 + ja2 und b = b1 + jb2 : w = f (z) = (a1 + ja2 )(x + jy) + b1 + jb2 = a1 x + ja1 y + ja2 x − a2 y + b1 + jb2 = a1 x − a2 y + b1 + j(a1 y + a2 x + b2 ) = u + jv . Anschaulich bedeutet dies die Hintereinanderausführung der Drehstreckung w̃ = az (vgl. (II)) und der Verschiebung w = w̃ + b (vgl. (I)). Die grafische Darstellung derartiger Funktionen erfolgt häufig mit Hilfe von Gitternetzlinien. Beispiel 1.21: Auf das im Bild 1.13a) gegebene Gitternetz wird zunächst eine Drehstreckung um den Faktor |a| = 2 und den Winkel ϕa = π4 angewendet. Bild 1.13 b) zeigt das Resultat dieser Abbildung, welche durch √ √ π die lineare Funktion w̃ = f (z) = 2e j 4 z = ( 2 + 2j)z beschrieben wird. Auf das entstandene Gitternetz wird anschließend eine Verschiebung um 32 in Richtung der reellen Achse und 1 4 in Richtung der imaginären Achse angewendet. Bild 1.13c) zeigt das Resultat dieser Abbildung, welche sich durch die lineare Funktion w = f (w̃) = w̃ + 32 + 14 j beschreiben lässt. Zusammenfassend: √ Das im Bild 1.13a) dargestellte Gitternetz wird mit Hilfe der linearen Funktion √ 2 + j 2 z + 23 + 14 j auf das im Bild 1.13c) dargestellte Gitternetz abgebildet. w= y 1 −1 0 v ṽ 6 6 1 Bild 1.13a) x 6 @ @ @ @ @ @ @ @ @ @ @ @ @ @ @ @ @ @ @ @ −1 0 1 Bild 1.13b) @ @ @ @ @ @ @ @ @ @ @ @ @ @ @ @ @ 1 @ @ @ ũ −1 0 1 u Bild 1.13c) Durch jede lineare komplexe Funktion wird eine konforme Abbildung festgelegt. Eine konforme Abbildung3 zeichnet sich dadurch aus, dass sie winkeltreu ist (d.h. der Winkel zwischen zwei sich schneidenden Kurven bleibt bei der Abbildung unverändert) und dass die Längenverhältnisse im Kleinen erhalten bleiben. Bei der in den Bildern 1.13a)-c) dargestellten Abbildung ist die Winkeltreue dadurch erkennbar, dass aus den zueinander senkrechten Gitternetzlinien in der Originalebene (z-Ebene) wiederum zueinander senkrechte Gitternetzlinien in der Bildebene (w-Ebene) entstehen. Konforme Abbildungen spielen z.B. in der Geodäsie, in der Hydrodynamik sowie in der Aerodynamik eine wichtige Rolle. So lässt sich z.B. mit Hilfe einer speziellen konformen Abbildung die Umströmung eines Tragflügelprofils auf die Umströmung eines Kreises zurückführen. In der Elektrotechnik können konforme Abbildungen bei der Berechnung elektrostatischer Potentiale angewendet werden. 3 Es gibt auch konforme Abbildungen, die nicht durch lineare Funktionen beschrieben werden. So wird z.B. durch 1 w = (z 6= 0) eine konforme Abbildung festgelegt. Im Rahmen dieser Vorlesung soll darauf nicht näher eingegangen z werden. 16 2 Vektorrechnung und analytische Geometrie 2.1 Grundbegriffe In Naturwissenschaft und Technik treten skalare Größen und vektorielle Größen auf. Diese lassen sich folgendermaßen charakterisieren: skalare Größe vektorielle Größe durch Angabe von Maßzahl und Maßeinheit eindeutig bestimmt; z.B.: Masse m, Temperatur T , Widerstand R zusätzlich: Angabe der Richtung , in der diese Größe wirkt; z.B.: Geschwindigkeit ~v , Kraft F~ , ~ elektrische Feldstärke E Ein Vektor ist durch Angabe von Betrag (oder auch: Länge bzw. Maßzahl), Richtung und Richtungssinn (oder auch: Orientierung) eindeutig bestimmt. Ein dreidimensionaler Vektor kann durch einen Pfeil im dreidimensionalen Raum veranschaulicht werden, siehe Bild 2.1a). Die Länge des Pfeils entspricht dem Betrag dieses Vektors. Als Symbole für Vektoren benutzt man entweder: ~a, ~b, ~c, . . . oder fettgedruckte Kleinbuchstaben:4 a, b, c ,. . . bzw. unterstrichene Kleinbuchstaben: a, b, c, . . . . Der Betrag eines Vektors ~a wird mit |~a| bezeichnet. Auch durch Angabe von Anfangs- und Endpunkt lässt sich ein Vektor eindeutig festlegen, siehe Bild 2.1b). z z P s J −→ PQ J J ^ Js ~a : Q y y x x Bild 2.1a) Bild 2.1b) Gleichheit von Vektoren: Vektoren heißen gleich, wenn Sie durch Parallelverschiebung ineinander überführt werden können, d.h. diese Vektoren stimmen in Betrag, Richtung und Richtungssinn überein. Spezielle Vektoren Nullvektor ~0 : Einheitsvektor ~e : −→ Ortsvektor ~r(P ) = OP : 2.2 Vektor vom Betrag 0 (keine Richtung angebbar) jeder Vektor vom Betrag 1 Vektor vom Koordinatenursprung O zum Punkt P Vektoroperationen Zu den elementaren Vektoroperationen gehören: die Addition und die Subtraktion von Vektoren sowie die Multiplikation eines Vektors mit einer reellen Zahl. Diese werden im folgenden erläutert. a) Addition von Vektoren: aus zwei Vektoren ~a und ~b wird der Summenvektor ~s = ~a + ~b gebildet, zur Veranschaulichung siehe Bild 2.2. ~b ~b ~s ~a ~b ~s ~a ~a ~ Bild 2.2: Veranschaulichung der Addition der Vektoren ~a und b und Darstellung des Summenvektors ~s als gerichtete Diagonale im Parallelogramm 4 Diese Schreibweise wird im Rahmen der Vorlesung nicht verwendet. 17 Eine wichtige Anwendung der Addition von Vektoren ist das Kräfteparallelogramm in der Physik, mit dessen Hilfe die Resultierende zweier Kräfte ermittelt werden kann. b) Subtraktion von Vektoren: wird auf die Addition zurückgeführt, indem der Differenzvektor berechnet wird als d~ = ~a − ~b = ~a + (−~b ), siehe dazu Bild 2.3. ~b ~b d~ ~a ~a ~a d~ −~b Bild 2.3: Veranschaulichung der Subtraktion der Vektoren ~a und ~b und Darstellung des Differenzvektors d~ als gerichtete Diagonale im Parallelogramm c) Multiplikation eines Vektors mit einer reellen Zahl λ: es entsteht ein neuer Vektor ~b = λ~a mit folgenden Eigenschaften: (I) |~b| = |λ ~a| = |λ| · |~a| (II) Für λ > 0 sind ~a und ~b parallel, d.h. sie haben gleiche Richtung und gleichen Richtungssinn (siehe Bild 2.4a)); Schreibweise: ~a ↑↑ ~b. Für λ < 0 sind ~a und ~b antiparallel, d.h. sie haben zwar die gleiche Richtung, aber entgegengesetzten Richtungssinn (siehe Bild 2.4b)); Schreibweise: ~a ↑↓ ~b. Schließlich entsteht bei der Multiplikation mit λ = 0 der Nullvektor (folgt aus Eigenschaft (I)). λ~a ~a ~a λ~a Bild 2.4a): Multiplikation des Vektors ~a mit λ > 0 Bild 2.4b): Multiplikation des Vektors ~a mit λ < 0 Beispiel 2.1: 2.3 2.3.1 Vektoren im dreidimensionalen Raum Darstellung von Vektoren Ausgangspunkt der Betrachtungen ist ein rechtshändiges kartesisches Koordinatensystem mit x-, y- und zAchse. Dieses wird festgelegt durch drei Einheitsvektoren (Basisvektoren) ~ex , ~ey und ~ez , welche senkrecht aufeinander stehen, siehe Bild 2.5. Mit Hilfe dieser Basisvektoren kann ein vom Nullpunkt (Koordinatenursprung) ausgehender Vektor ~a in der Form ~a = ~ax + ~ay + ~az = ax~ex + ay ~ey + az ~ez (17) dargestellt werden (vgl. Bild 2.6), wobei die reellen Zahlen ax , ay und az als Vektorkoordinaten bezeichnet werden. Die Darstellung (17) nennt man Komponentendarstellung des Vektors. Üblicherweise schreibt man ~a in Form eines Spaltenvektors: ax ~a = ay . (18) az Beispiel 2.2: 18 z z ~az ~ez ~a ~ey ~ex y ~ax ~ay y x x Bild 2.5: Einheitsvektoren ~ex , ~ey und ~ez Bild 2.6: Darstellung ~a = ~ax + ~ay + ~az , mit ~ax , ~ay , ~az als Projektionen von ~a auf die Koordinatenachsen Gemäß der Darstellung (18) gilt: Betrag eines Vektors ~a im dreidimensionalen Raum: |~a| = q a2x + a2y + a2z Gleichheit zweier Vektoren: ~a = ~b ⇐⇒ ax = bx , ay = by und az = bz Bemerkung: Für die Basisvektoren im dreidimensionalen Raum sind auch die Bezeichnungen ~e1 , ~e2 , ~e3 bzw. ~i, ~j, ~k üblich. 2.3.2 Darstellung der Vektoroperationen Im Abschnitt 2.2 wurden die Vektoroperationen auf anschauliche Weise eingeführt. Nun sollen diese Operationen unter Verwendung der Komponentendarstellung von Vektoren erklärt werden. Weiterhin wird die Normierung eines Vektors definiert. Addition und Subtraktion von Vektoren: ax bx ax ± bx ~a ± ~b = ay ± by = ay ± by az bz az ± bz Multiplikation eines Vektors mit einer reellen Zahl: ax λax λ~a = λ ay = λay (λ ∈ R) az λaz (19) (20) Normierung eines Vektors ~ a (~a 6= ~0) : ~ea = 1 ~a |~a| (~ea ist der in die gleiche Richtung wie ~a weisende Einheitsvektor) Beispiel 2.3: Beispiel 2.4: 19 (21) Die Menge aller Vektoren ~a, die in der Form (18) mit ax , ay , az ∈ R dargestellt werden können, bildet mit den soeben erklärten Vektoroperationen (Addition und Multiplikation mit einer reellen Zahl) einen reellen Vektorraum5 . Mit Hilfe der genannten Rechenoperationen können Linearkombinationen von Vektoren gebildet werden. Seien λ1 , λ2 , . . . , λn ∈ R sowie ~a1 , ~a2 , . . . , ~an ∈ R3 , dann wird ein Ausdruck der Form λ1~a1 + λ2~a2 + . . . + λn~an als Linearkombination der Vektoren ~a1 , ~a2 , . . . , ~an bezeichnet. Definition 2.1: Die n Vektoren ~a1 , ~a2 , . . . , ~an sind linear unabhängig, wenn die Gleichung λ1~a1 + λ2~a2 + . . . + λn~an = ~0 nur die triviale Lösung λ1 = λ2 = . . . = λn = 0 hat. Anderenfalls sind diese Vektoren linear abhängig. Beispiel 2.5: 2.4 2.4.1 Produkte von Vektoren und ihre Anwendungen Skalarprodukt (inneres Produkt) Definition 2.2: Seien ~a und ~b zwei Vektoren und ϕ der von ihnen eingeschlossene Winkel (0 ≤ ϕ ≤ π). Unter dem Skalarprodukt von ~a und ~b versteht man die reelle Zahl c mit c = |~a| |~b| cos ϕ . (22) Die Schreibweise für das Skalarprodukt lautet: c = ~a · ~b . Es ist zu beachten, dass das Skalarprodukt zweier Vektoren eine reelle Zahl (kein Vektor!) ist. Rechengesetze für das Skalarprodukt: Kommutativgesetz: ~a · ~b = ~ Distributivgesetz: ~a · (b + ~c) = Multiplikation mit λ ∈ R: λ(~a · ~b) = ~b · ~a ~a · ~b + ~a · ~c (λ ~a) · ~b = ~a · (λ ~b) Skalarprodukte von Basisvektoren: ~ex · ~ey = ~ey · ~ez = ~ez · ~ex = 0, ~ex · ~ex = ~ey · ~ey = ~ez · ~ez = 1 Im folgenden wird eine Formel hergeleitet, welche die Berechnung des Skalarproduktes aus den Vektorkoordinaten ermöglicht. Dabei werden die soeben aufgeführten Gesetzmäßigkeiten genutzt. ~a · ~b = (ax ~ex + ay ~ey + az ~ez ) · (bx ~ex + by ~ey + bz ~ez ) = ax bx (~ex · ~ex ) + ax by (~ex · ~ey ) + ax bz (~ex · ~ez ) + ay bx (~ey · ~ex ) + ay by (~ey · ~ey ) + ay bz (~ey · ~ez ) + az bx (~ez · ~ex ) + az by (~ez · ~ey ) + az bz (~ez · ~ez ) Auf der rechten Seite dieser Gleichung entfallen alle Terme, in denen das Skalarprodukt zweier verschiedener Einheitsvektoren vorkommt, alle anderen Skalarprodukte haben den Wert 1. Damit entsteht die Gleichung ~a · ~b = ax bx + ay by + az bz . (23) 5 Ein Vektorraum zeichnet sich dadurch aus, dass die Rechenoperationen gewissen Gesetzmäßigkeiten unterliegen. Im Rahmen dieser Vorlesung soll darauf nicht näher eingegangen werden. Es sei auf die Literaturstelle: W. L EUPOLD . Mathematik - ein Studienbuch für Ingenieure (Band 1), 2. Auflage, S. 231 verwiesen. 20 Das Skalarprodukt zweier Vektoren ~a 6= ~0 und ~b 6= ~0 ist genau dann gleich 0, wenn diese Vektoren orthogonal sind; kurz: ~a ⊥ ~b ⇐⇒ ~a · ~b = 0. Beispiel 2.6: Aus Definition 2.2 folgt die Formel zur Berechnung des Winkels ϕ = ∠(~a, ~b) zwischen zwei Vektoren ~a und ~b : ~a · ~b ~ (~a 6= ~0, ~b 6= ~0 ). (24) ϕ = ∠(~a, b) = arccos |~a||~b| Beispiel 2.7: Für physikalische Berechnungen wird die Projektion eines Vektors auf einen anderen Vektor benötigt. Gegeben seien zwei Vektoren ~a und ~b, welche nicht die ~b gleiche Richtung besitzen. Gesucht ist die orthogonale Projektion von ~b auf ~a (siehe Bild 2.7), welche mit ~ba bezeichnet wird. Die Berechnung erfolgt mittels der q ϕ Formel ~a b~a ~b ~ a · ~ba = ~a . (25) Bild 2.7 |~a|2 Begründung für Formel (25): Beispiel 2.8: Eine weitere wichtige Anwendung des Skalarproduktes ist die Berechnung der mechanischen Arbeit. Ein Massepunkt werde durch die konstante Kraft F~ um die geradlinige Strecke ~s verschoben. Dann wird die an dem Massepunkt verrichtete mechanische Arbeit W berechnet nach: W = F~ · ~s . (26) Beispiel: siehe Übung 21 2.4.2 Vektorprodukt (Kreuzprodukt, äußeres Produkt) Definition 2.3: Das Vektorprodukt zweier Vektoren ~a und ~b ist ein Vektor ~c mit folgenden Eigenschaften: (I) ~c steht senkrecht auf ~a und auf ~b (II) |~c| = |~a||~b| sin ϕ (ϕ : von ~a und ~b eingeschlossener Winkel, wobei 0 ≤ ϕ ≤ π) (III) ~a, ~b und ~c bilden in dieser Reihenfolge ein rechtshändiges System. Die Schreibweise für das Vektorprodukt lautet: ~c = ~a × ~b . Es ist zu beachten, dass das Vektorprodukt zweier Vektoren ein Vektor (keine reelle Zahl!) ist. Zur geometrischen Deutung des Vektorproduktes: ~b Der Betrag |~a × ~b| des Vektorproduktes von ~a und ~b ist gleich b h dem Flächeninhalt des von diesen beiden Vektoren aufgespannten Parallelogramms (siehe Bild 2.8 und Definition 2.3): A = ah = ab sin ϕ = |~a||~b| sin ϕ = |~a × ~b| Rechengesetze für das Vektorprodukt: Anti-Kommutativgesetz: ~a × ~b Distributivgesetze: ~a × (~b + ~c) (~a + ~b) × ~c Multiplikation mit λ ∈ R: λ(~a × ~b) = = = = ϕ p a - ~a Bild 2.8: Veranschaulichung von |~a × ~b| −(~b × ~a) ~a × ~b + ~a × ~c ~a × ~c + ~b × ~c (λ ~a) × ~b = ~a × (λ ~b) Beziehungen zwischen den Basisvektoren: ~ex × ~ex = ~ey × ~ey = ~ez × ~ez = ~0 , ~ex × ~ey = ~ez , ~ey × ~ez = ~ex , ~ez × ~ex = ~ey Die Berechnung des Vektorproduktes aus den Vektorkoordinaten erfolgt nach der Formel: ax bx ay bz − az by ~a × ~b = ay × by = az bx − ax bz . az bz ax by − ay bx (27) Beispiel 2.9: Beispiel 2.10: Das Vektorprodukt lässt sich auch formal durch eine dreireihige Determinante darstellen: ~ex ~ey ~ez ~a × ~b = ax ay az b b b x y z (Determinanten werden ausführlich im Kapitel 3 behandelt). Das Vektorprodukt tritt bei der Berechnung zahlreicher physikalischer Größen auf. Im weiteren werden einige dieser Anwendungen des Vektorproduktes aufgeführt. a) Berechnung von Drehmomenten Betrachtet wird ein starrer Körper in Form einer Kreisscheibe, der um seine Symmetrieachse drehbar gelagert ist. Eine im Punkt P angreifende (in der Scheibenebene liegende) Kraft F~ erzeugt ein ~ , das in der Form Drehmoment M ~ = ~r × F~ M darstellbar ist. Dabei bezeichnet ~r den Ortsvektor des Angriffspunktes P . 22 ~ = ~r × F~ 6 M F~ 0 qQ 3 Q Q s Q p P b) Berechnung von Bahngeschwindigkeiten Die Bahngeschwindigkeit ~v eines Punktes eines rotierenden Körpers wird berechnet aus ~v = ω ~ × ~r . Dabei bezeichnet ω ~ die Winkelgeschwindigkeit und ~r den Ortsvektor. c) Berechnung der Lorentz-Kraft ~ eintritt, erfährt dort die Ein Elektron, das mit einer Geschwindigkeit ~v in ein Magnetfeld der Flussdichte B Lorentz-Kraft ~ , F~L = −e (~v × B) mit e = 1.6 · 10−19 C (Elementarladung). Beispiel 2.11: 2.4.3 Spatprodukt (gemischtes Produkt) Definition 2.4: Unter dem Spatprodukt dreier Vektoren ~a, ~b und ~c versteht man das Skalarprodukt aus den Vektoren ~a und ~b × ~c. Dafür wird die folgende Schreibweise verwendet: [ ~a ~b ~c ] = ~a · (~b × ~c). Zur geometrischen Deutung des Spatproduktes: Der Betrag des Spatproduktes [ ~a ~b ~c ] entspricht dem Volumen ~ b × ~c 6 des von den Vektoren ~a, ~b und ~c aufgespannten Spates, denn es gilt (siehe Bild 2.9 sowie Definitionen 2.2 und 2.4): V = Ah = |~b × ~c||~a| cos ϕ = |~a||~b × ~c| cos ϕ = |[ ~a ~b ~c ]| , wobei ϕ den Winkel bezeichnet, der von ~a und ~b ×~c eingeschlossen wird. Anstelle der Bezeichnung Spat“ sind auch die Bezeichnungen ” Parallelflach“ oder Parallelepiped“ üblich. ” ” ~a h ~c ϕ 3 A = |~b × ~c | - ~b Bild 2.9: Veranschaulichung von |[ ~a ~b ~c ]| Gesetzmäßigkeiten für das Spatprodukt: Bei einer zyklischen Vertauschung der drei Vektoren ~a, ~b und ~c ändert sich das Spatprodukt nicht: [~a ~b ~c ] = [~b ~c ~a] = [~c ~a ~b] Die Vertauschung zweier Vektoren bewirkt stets einen Vorzeichenwechsel, z.B.: [ ~a ~b ~c ] = −[~a ~c ~b] (Vertauschung von ~b und ~c) Bilden die Vektoren ~a, ~b, ~c in dieser Reihenfolge ein Rechtssystem (Linkssystem), so ist das aus ihnen gebildete Spatprodukt stets positiv (negativ). Unter Verwendung der Formeln (23) und (27) ergibt sich für die Berechnung des Spatproduktes aus den Vektorkoordinaten: ax by cz − bz cy [ ~a ~b ~c ] = ay · bz cx − bx cz = ax (by cz − bz cy ) + ay (bz cx − bx cz ) + az (bx cy − by cx ) . (28) az bx cy − by cx Eine einfachere Berechnung des Spatproduktes ist möglich, wenn es in Form einer dreireihigen Determinante geschrieben wird: ax ay az ax bx cx [ ~a ~b ~c ] = bx by bz = ay by cy (29) c c c a b c x y z z z z (d.h. die Vektoren ~a, ~b und ~c werden entweder als Zeilen oder als Spalten in die Determinante eingetragen). 23 Beispiel 2.12: Aus der geometrischen Deutung des Spatproduktes folgt sofort eine einfache geometrische Anwendung, nämlich die Berechnung des Volumens eines Spates, der von drei gegebenen Vektoren aufgespannt wird. In engem Zusammenhang damit steht die Berechnung des Volumens eines Tetraeders. Seien ~a, ~b und ~c drei Vektoren, die ein Tetraeder (d.h. eine dreiseitige ~a Pyramide) bestimmen, siehe Bild 2.10. Dann gilt für das Volumen VT dieses Tetraeders: ~c 1 1 VT = VSpat = |[ ~a ~b ~c ]| . 6 6 Dabei bezeichnet VSpat das Volumen des Spates, der von ~a, ~b und ~c aufgespannt wird. ~b Bild 2.10: Durch ~a, ~b und ~c bestimmtes Tetraeder Vektoren, die in einer gemeinsamen Ebene bzw. in parallelen Ebenen liegen, werden komplanare Vektoren genannt. Mit Hilfe des Spatproduktes kann entschieden werden, ob drei Vektoren komplanar sind. Es gilt die folgende Aussage: [ ~a ~b ~c ] = 0 ⇐⇒ ~a, ~b und ~c sind komplanar . Beispiel 2.13: Allgemein gilt: Drei komplanare Vektoren sind stets linear abhängig (vgl. Definition 2.1). Somit kann das Spatprodukt auch verwendet werden, um die lineare (Un)abhängigkeit von Vektoren festzustellen. Fortsetzung zu Beispiel 2.13: Abschließend wird ein physikalisches Anwendungsbeispiel für das Spatprodukt angegeben. Beispiel 2.14: Eine Flüssigkeit fließt mit konstanter Geschwindigkeit ~v (gemessen in m/s) durch eine von den Vektoren ~a und ~b (gemessen in m) aufgespannte Parallelogramm-Fläche. Dann hat die Flüssigkeitsmenge, welche in einer Sekunde durch diese Fläche strömt, das Volumen V = |[ ~a ~b ~v ]| m3 . 2.5 Geraden und Ebenen 2.5.1 Darstellung von Geraden Im folgenden werden zwei Möglichkeiten zur Darstellung von Geraden im dreidimensionalen Raum betrachtet. a) Punkt-Richtungs-Form einer Geraden Eine Gerade g soll durch den Punkt P1 mit dem Ortsvektor 24 x1 ~r1 = a (Richtungsvektor) verlaufen. y1 und parallel zu einem vorgegebenen Vektor ~ z1 Die vektorielle Punkt-Richtungs-Form der Geraden lautet dann: x x1 ax y = y1 + λ ay , ~r(P ) = ~r(λ) = ~r1 + λ~a oder z z1 az (30) wobei die folgenden Bezeichnungen gelten: ~r(P ) : ~r1 : ~a : λ: Ortsvektor des laufenden Punktes der Geraden Ortsvektor des gegebenen Punktes P1 der Geraden gegebener Richtungsvektor reeller Parameter. Begründung für Formel (30): Sei P der laufende Punkt der Geraden g, so gilt für den zugehörigen Ortsvektor (siehe Bild 2.11): P1 −→ ~a ~r1 ~r(P ) = ~r1 + P1 P . −→ λ~a P −→ ~r(P ) ~r(P ) = ~r1 + P1 P = ~r1 + λ~a . g 0 −→ Da die Vektoren P1 P und ~a die gleiche Richtung haben, gilt: P1 P = λ~a (λ: geeigneter reeller Parameter), d.h. Bild 2.11: Gerade mit Richtungsvektor Beispiel 2.15: b) Zwei-Punkte-Form einer Geraden x1 Eine Gerade g soll durch die beiden Punkte P1 und P2 mit den Ortsvektoren ~r1 = y1 z1 x2 und ~r2 = y2 verlaufen. z2 Die vektorielle Zwei-Punkte-Form der Geraden lautet dann: x x1 x2 − x1 y = y1 + λ y2 − y1 ~r(P ) = ~r(λ) = ~r1 + λ(~r2 − ~r1 ) oder z z1 z2 − z1 (Bezeichnungen siehe unter a)). Begründung für Formel (31): P1 ~r1 ~r2 − ~r1 P~2 ~r2 0 λ(~r2 − ~r1 ) P ~r(P ) g Sei P der laufende Punkt der Geraden g, so gilt für den zugehörigen Ortsvektor (siehe Bild 2.12): −→ ~r(P ) = ~r1 + P1 P . −→ −→ Da die Vektoren P1 P und P1 P2 = ~r2 − ~r1 die gleiche Richtung besitzen, −→ −→ gilt: P1 P = λ P1 P2 = λ(~r2 − ~r1 ) (λ: geeigneter reeller Parameter), d.h. −→ −→ ~r(P ) = ~r1 + P1 P = ~r1 + λ P1 P2 = ~r1 + λ(~r2 − ~r1 ). Bild 2.12: Gerade durch zwei Punkte Beispiel 2.16: 25 (31) 2.5.2 Lagebeziehungen von Geraden Die Geraden g1 und g2 seien gegeben durch: ~r(λ1 ) = ~r1 + λ1~a1 sowie ~r(λ2 ) = ~r2 + λ2~a2 (λ1,2 ∈ R). Diese Geraden können folgende Lagebeziehungen zueinander haben: a) g1 und g2 sind zueinander parallel a1) g1 und g2 fallen zusammen a2) g1 und g2 fallen nicht zusammen b) g1 und g2 schneiden sich in genau einem Punkt c) g1 und g2 sind windschief (nicht parallel, kein Schnittpunkt) zu a) Parallelität der Geraden liegt genau dann vor, wenn die Richtungsvektoren ~a1 und ~a2 die gleiche Richtung haben, d.h. wenn gilt: ~a1 × ~a2 = ~0 (vgl. dazu Definition 2.3) bzw. λ~a1 = ~a2 mit λ ∈ R \ {0}. Der Abstand d zweier paralleler Geraden wird berechnet nach: d= |~a1 × (~r2 − ~r1 )| . |~a1 | (32) Daraus folgt unmittelbar: Fall a1) tritt ein, wenn ~a1 × (~r2 − ~r1 ) = ~0. Fall a2) tritt ein, wenn ~a1 × (~r2 − ~r1 ) 6= ~0. Beispiel 2.17: zu b) Wenn die Richtungsvektoren ~a1 und ~a2 nicht die gleiche Richtung haben, dann kann durch Gleichsetzen der Vektorkoordinaten von ~r(λ1 ) und ~r(λ2 ) überprüft werden, ob die Geraden einen gemeinsamen Punkt besitzen. Hat das entstehende lineare Gleichungssystem zur Bestimmung von λ1 und λ2 eine Lösung ⇒ Die Geraden g1 und g2 schneiden sich in genau einem Punkt. Andere Möglichkeit: Falls ~a1 und ~a2 nicht die gleiche Richtung haben sowie [ ~a1 ~a2 (~r2 − ~r1 ) ] = 0 gilt ⇒ Die Geraden g1 und g2 schneiden sich in genau einem Punkt. Beispiel 2.18: zu c) Wenn die Richtungsvektoren ~a1 und ~a2 nicht die gleiche Richtung haben und das lineare Gleichungssystem zur Bestimmung von λ1 und λ2 (vgl. b)) keine Lösung besitzt ⇒ Die Geraden g1 und g2 sind windschief. Andere Möglichkeit: Falls ~a1 und ~a2 nicht die gleiche Richtung haben sowie [ ~a1 ~a2 (~r2 − ~r1 ) ] 6= 0 gilt ⇒ Die Geraden g1 und g2 sind windschief. Der Abstand d zweier windschiefer Geraden wird berechnet nach: d= |[ ~a1 ~a2 (~r2 − ~r1 ) ]| . |~a1 × ~a2 | (33) Beispiel 2.19: 2.5.3 Darstellung von Ebenen Es werden drei Möglichkeiten zur Darstellung von Ebenen im dreidimensionalen Raum betrachtet. a) Punkt-Richtungs-Form einer Ebene x1 Eine Ebene E soll durch den Punkt P1 mit dem Ortsvektor ~r1 = y1 und parallel zu zwei Vektoren z1 ~a und ~b (Richtungsvektoren) verlaufen. Dabei wird vorausgesetzt, dass ~a und ~b verschiedene Richtungen haben. Die vektorielle Punkt-Richtungs-Form der Ebene lautet dann: x x1 ax bx ~r(P ) = ~r(λ, µ) = ~r1 + λ~a + µ~b oder y = y1 + λ ay + µ by (34) z z1 az bz 26 mit den folgenden Bezeichnungen: ~r(P ) : ~r1 : ~a, ~b : λ, µ : Ortsvektor des laufenden Punktes der Ebene Ortsvektor des gegebenen Punktes P1 der Ebene gegebene Richtungsvektoren reelle Parameter. Begründung für Formel (34): µ~b ~b P1 P −→ P1 P ~a Sei P der laufende Punkt der Ebene E, so gilt für den −→ in der Ebene liegenden Vektor P1 P (siehe Bild 2.13): −→ P1 P = λ~a + µ~b ~r(P ) λ~a E ~r1 0 mit geeigneten, voneinander unabhängigen, reellen Parametern λ und µ. Der Ortsvektor von P ist dann darstellbar als: −→ ~r(P ) = ~r1 + P1 P = ~r1 + λ~a + µ~b. Bild 2.13: Ebene mit zwei Richtungsvektoren Beispiel 2.20: b) Drei-Punkte-Form einer Ebene Eine Ebene E soll durch drei voneinander verschiedene Punkte P1 , P2 und P3 mit den Ortsvektoren ~r1 , ~r2 und ~r3 verlaufen. Dabei wird vorausgesetzt, dass diese Punkte nicht auf einer gemeinsamen Geraden liegen (d.h. die Vektoren ~r2 − ~r1 und ~r3 − ~r1 dürfen nicht die gleiche Richtung haben). Die vektorielle Drei-PunkteForm der Ebene ist gegeben durch: ~r(P ) = ~r(λ, µ) = ~r1 + λ(~r2 − ~r1 ) + µ(~r3 − ~r1 ) (35) oder x x1 x2 − x1 x3 − x1 y = y1 + λ y2 − y1 + µ y3 − y1 z z1 z2 − z1 z3 − z 1 (36) (Bezeichnungen siehe unter a)). Begründung für Formel (35): P3 ~r3 P1 ~r1 P ~r(P ) Der Ortsvektor des laufenden Punktes P der Ebene E ist darstellbar in der Form (siehe Bild 2.14): P2 −→ E ~r2 −→ ~r(P ) = ~r1 + λ P1 P2 + µ P1 P3 mit geeigneten, voneinander unabhängigen, reellen Parametern λ und µ. Weiterhin gilt: −→ −→ P1 P2 = ~r2 − ~r1 , P1 P3 = ~r3 − ~r1 und somit 0 ~r(P ) = ~r1 + λ(~r2 − ~r1 ) + µ(~r3 − ~r1 ). Bild 2.14: Ebene, festgelegt durch drei Punkte Beispiel 2.21: 27 c) Gleichung einer Ebene senkrecht zu einem Vektor Eine Ebene E soll den Punkt P1 mit dem Ortsvektor ~r1 enthalten und senkrecht zu einem Vektor ~n verlaufen. Die Ebene kann in der parameterfreien Form ~n · (~r − ~r1 ) = 0 ax + by + cz + d = 0 oder (37) dargestellt werden. Der Vektor ~n wird Normalenvektor genannt, alle weiteren Bezeichnungen siehe unter a). Die Koeffizienten a, b und c in (37) sind die Koordinaten des Normalenvektors. Begründung für Formel (37): ~n P1 · ~r1 ~r − ~r1 P ~r E Sei ~r der Ortsvektor des laufenden Punktes P der Ebene E, −→ dann liegt der Vektor P1 P = ~r − ~r1 in dieser Ebene und steht daher senkrecht auf dem Normalenvektor ~n (siehe Bild 2.15). Somit muss das Skalarprodukt dieser Vektoren gleich 0 sein, d.h. ~n · (~r − ~r1 ) = 0 oder ~n · ~r = ~n · ~r1 . 0 Bild 2.15: Ebene mit Normalenvektor Beispiel 2.22: Wenn in (37) speziell ein Einheitsnormalenvektor ~n0 gewählt wird, dann erhält man die Hessesche Normalform der Ebenengleichung: ~n0 · (~r − ~r1 ) = 0 oder ax + by + cz + d √ = 0. a2 + b2 + c2 (38) Dabei ist |~n0 · ~r1 | der Abstand der Ebene vom Koordinatenursprung. Mit Hilfe der Hesseschen Normalform lässt sich der Abstand eines Punktes P ∗ zu einer Ebene E berechnen. Sei E in der Hesseschen Normalform ~n0 · (~r − ~r1 ) = 0 bzw. a0 x + b0 y + c0 z + d0 = 0 ∗ a0 x ∗ y ∗ der Ortsvektor von P ∗ . b0 mit ~n0 = gegeben und sei ~r = c0 z∗ Dann erhält man den gesuchten Abstand d(P ∗ , E) aus der folgenden Formel: d(P ∗ , E) = ~n0 · (~r ∗ − ~r1 ) bzw. d(P ∗ , E) = a0 x∗ + b0 y ∗ + c0 z ∗ + d0 , (39) d.h. der Ortsvektor des Punktes P ∗ wird in die linke Seite der Hesseschen Normalform eingesetzt. Fortsetzung zu Beispiel 2.22: Bemerkung: Bei der Berechnung des Abstandes d(P ∗ , E) entsteht ggf. ein negativer Zahlenwert. Falls d(P ∗ , E) < 0, liegen P ∗ und der Koordinatenursprung auf derselben Seite der Ebene E. Im Fall d(P ∗ , E) > 0 liegen P ∗ und der Koordinatenursprung auf verschiedenen Seiten der Ebene E. 28 2.6 Vektoren im Rn Vektoren mit mehr als drei Koordinaten werden z.B. bei der Multiplikation von Matrizen und bei der Lösung linearer Gleichungssysteme im Kapitel 3 benötigt. a1 a2 Seien a1 , a2 , . . . , an ∈ R (n ∈ N∗ ), dann ist durch die Darstellung ~a = . ein Vektor mit n reellen .. an Koordinaten gegeben. Die Addition und Subtraktion derartiger Vektoren sowie die Multiplikation mit einer reellen Zahl sind analog zu diesen Rechenoperationen mit Vektoren im R3 definiert (siehe Abschnitt 2.3.2). Addition und Subtraktion von Vektoren mit n reellen Koordinaten: a1 ± b1 b1 a1 a2 b2 a2 ± b2 ~a ± ~b = . ± . = .. .. .. . bn an an ± bn Multiplikation eines Vektors mit einer reellen Zahl: a1 λa1 a2 λa2 λ~a = λ . = . (λ ∈ R) .. .. an λan Die Menge aller Vektoren mit n reellen Koordinaten bildet zusammen mit den soeben erklärten Rechenoperationen einen reellen Vektorraum, welcher mit Rn bezeichnet wird (n ∈ N∗ ). Es ist zu beachten, dass für n ≥ 4 keine anschauliche Darstellung der Vektoren als Pfeile möglich ist. Die Basisvektoren im Rn sind gegeben durch: 1 0 0 0 0 1 0 0 ~e1 = 0 , ~e2 = 0 , . . . , ~en−1 = ... , ~en = ... . .. .. . . 1 0 0 0 0 1 Jeder Vektor aus dem Raum Rn lässt sich als Linearkombination (vgl. Abschnitt 2.3.2) dieser Basisvektoren darstellen. Analog zu den entsprechenden Definitionen für Vektoren im R3 können auch im Rn das Skalarprodukt und der Betrag eingeführt werden6 . Skalarprodukt von Vektoren im Rn : a1 b1 n a2 b2 X ak bk ~a · ~b = . · . = a1 b1 + a2 b2 + . . . + an bn = .. .. k=1 an bn Betrag eines Vektors ~ a ∈ Rn : v u n q uX 2 2 2 |~a| = a1 + a2 + . . . + an = t a2k k=1 Beispiel 2.23: Die Rechenregel (23) für Vektoren im R3 wird formal auf Vektoren im Rn , n ∈ N∗ , übertragen. Dagegen sind das Vektorprodukt und das Spatprodukt für Vektoren im Rn mit n ≥ 4 nicht definiert! 6 29 3 Matrizen, Determinanten und lineare Gleichungssysteme Matrizen und Determinanten sind wichtige Hilfsmittel bei der Lösung linearer Gleichungssysteme, wie sie z.B. in der Vierpoltheorie und bei der Berechnung elektrischer Netzwerke auftreten. 3.1 Grundbegriffe 3.1.1 Definition einer Matrix Definition 3.1: Unter einer Matrix A vom Typ (m, n) versteht man ein aus m·n reellen (bzw. komplexen) Zahlen bestehendes rechteckiges Schema mit m Zeilen und n Spalten: a11 a12 . . . a1k . . . a1n a21 a22 . . . a2k . . . a2n .. .. .. .. . . . . A= ai1 ai2 . . . aik . . . ain m Zeilen .. .. .. .. . . . . am1 am2 . . . amk . . . amn n Spalten Bezeichungen: i - Zeilenindex k - Spaltenindex aik - Matrixelement (Element in der i-ten Zeile und k-ten Spalte von A) Im Fall m = n nennt man die Matrix A eine n-reihige quadratische Matrix. Beispiel 3.1: A = −2 1 3 4 2 0 −5 7 ist eine Matrix vom Typ (2, 4). Matrixelemente von A sind z.B.: a11 = −2, a13 = 3, a24 = 7. −2 −3 B= ist eine 2-reihige quadratische Matrix. 1 5 2 Bemerkungen: - Als Bezeichnung für Matrizen können anstelle unterstrichener Großbuchstaben auch fettgedruckte Großbuchstaben verwendet werden7 . - In den Abschnitten 3.1 bis 3.4 werden zunächst reelle Matrizen betrachtet. Im Abschnitt 3.5 erfolgt eine gesonderte Behandlung komplexer Matrizen. Weitere Bezeichnungen im Zusammenhang mit Matrizen Spaltenmatrix: Matrix mit nur einer Spalte (auch Spaltenvektor genannt) a1 a2 Sie ist vom Typ (m, 1) und besitzt die Form: A = . .. . am Zeilenmatrix: Matrix mit nur einer Zeile (auch Zeilenvektor genannt) Sie ist vom Typ (1, n) und besitzt die Form: A = (a1 a2 . . . an ) . Die Zeilen einer Matrix werden auch als Zeilenvektoren, die Spalten auch als Spaltenvektoren bezeichnet. Eine Matrix vom Typ (m, n) enthält genau m Zeilenvektoren und n Spaltenvektoren: 7 Diese Schreibweise wird im Rahmen der Vorlesung nicht benutzt. 30 a11 a21 .. . a12 . . . a22 . . . .. . a1k . . . a2k . . . .. . a1n a2n .. . A= ai1 ai2 . . . aik . . . ain .. .. .. .. . . . . am1 am2 . . . amk . . . amn ↑ ↑ ↑ ↑ a1 a2 ak an ← a1 ← a2 Zeilenvektoren ← ai ← am Spaltenvektoren Es gilt: ak ∈ Rm für alle Spaltenvektoren und ai ∈ Rn für alle Zeilenvektoren einer Matrix vom Typ (m, n). Definition 3.2: Werden in einer Matrix A die Zeilen und Spalten miteinander vertauscht, so erhält man die Transponierte AT der Matrix A . −2 2 1 0 Beispiel 3.2: Für die Matrix A aus Beispiel 3.1 gilt: AT = 3 −5 4 7 (Matrix vom Typ (4, 2)) Allgemein gilt: A ist vom Typ (m, n) ⇒ AT ist vom Typ (n, m) . Zweimaliges Transponieren ergibt wieder die Ausgangsmatrix: AT Das Element aTik T = A. T der transponierten Matrix A ist gleich dem Element aki der Matrix A . Definition 3.3: Zwei Matrizen A = (aik ) und B = (bik ) vom gleichen Typ (m, n) heißen gleich: A = B , wenn alle Matrixelemente übereinstimmen, d.h. wenn aik = bik für alle i, k gilt (i = 1, 2, . . . , m; k = 1, 2, . . . , n). Beispiel 3.3: 3.1.2 Spezielle Matrizen Als Nullmatrix (Schreibweise: 0 ) bezeichnet man eine Matrix, bei der alle Elemente den Wert 0 haben. Eine Nullmatrix kann von beliebigem Typ sein. Die weiteren Aussagen beziehen sich ausschließlich auf n-reihige quadratische Matrizen. Diagonalmatrix: alle außerhalb der Hauptdiagonalen liegenden Elemente sind gleich 0, d.h. es gilt: aik = 0 für i 6= k (i, k = 1, 2, . . . , n) a11 0 . . . 0 2 0 0 0 0 a22 . . . 0 0 −1 0 0 allgemein: . .. .. , Beispiel: A = . 0 . . 0 5 0 . . . . 0 0 0 13 0 0 . . . ann Einheitsmatrix: Diagonalmatrix mit den Diagonalelementen aii = 1 (i = 1, 2, . . . , n) Schreibweise: E (auch: E n bzw. I oder I n ) 31 1 0 0 Beispiel für eine Einheitsmatrix: E = 0 1 0 0 0 1 Dreiecksmatrix: alle Elemente oberhalb der Hauptdiagonalen sind gleich 0 (untere Dreiecksmatrix) oder: alle Elemente unterhalb der Hauptdiagonalen sind gleich 0 (obere Dreiecksmatrix) −2 0 0 Beispiel für eine untere Dreiecksmatrix: A = 1 3 0 4 6 5 (Hier gilt: aik = 0 für i < k.) 2 −7 1 3 0 5 8 5 Beispiel für eine obere Dreiecksmatrix: A = 0 0 4 −6 0 0 0 −4 (Hier gilt: aik = 0 für i > k.) symmetrische Matrix: es gilt: aik = aki für alle i und k (i, k = 1, 2, . . . , n), d.h. die Matrixelemente sind spiegelsymmetrisch zur Hauptdiagonalen ⇒ AT = A 1 −2 5 8 0 Beispiel für eine symmetrische Matrix: A = −2 5 0 −3 antisymmetrische oder schiefsymmetrische Matrix: 3.2 3.2.1 es gilt: aik = −aki für alle i und k (i, k = 1, 2, . . . , n) ⇒ AT = −A , für k = i folgt speziell: aii = −aii , d.h. aii = 0 (i = 1, 2, . . . , n) 0 −4 3 0 −6 Beispiel für eine antisymmetrische Matrix: A = 4 −3 6 0 Rechenoperationen mit Matrizen Addition und Subtraktion von Matrizen Addition und Subtraktion erfolgen elementweise (wie bei Vektoren). Diese Rechenoperationen sind nur möglich unter der Voraussetzung, dass die entsprechenden Matrizen vom gleichen Typ sind. Addition und Subtraktion Seien A und B Matrizen vom Typ (m, n). Dann gilt für die Elemente cik der Matrix C = A + B : cik = aik + bik sowie für die Elemente dik der Matrix D = A − B : dik = aik − bik (i = 1, 2, . . . , m; k = 1, 2, . . . , n). Weiterhin gelten das Kommutativgesetz: A+B =B+A sowie das Assoziativgesetz: A + (B + C) = (A + B) + C . Beispiel 3.4: 32 3.2.2 Multiplikation einer Matrix mit einem Skalar Die Multiplikation einer Matrix mit einem Skalar (d.h. mit einer reellen Zahl) erfolgt so, dass jedes Element dieser Matrix mit diesem Skalar multipliziert wird. Multiplikation mit einem Skalar Sei A eine beliebige Matrix vom Typ (m, n). Durch Multiplikation dieser Matrix mit einer beliebigen Zahl λ ∈ R entsteht die Matrix λ · A , welche die Elemente λ · aik (i = 1, 2, . . . , m; k = 1, 2, . . . , n) hat. Besitzen alle Elemente einer Matrix einen gemeinsamen Faktor, so kann dieser vor die Matrix gezogen werden. Für die Multiplikation einer Matrix mit einem Skalar gelten folgende Gesetze Assoziativgesetz: λ(µA) = (λµ)A sowie die Distributivgesetze: (λ + µ)A = λA + µA und λ(A + B) = λA + λB . Beispiel 3.5: 3.2.3 Multiplikation von Matrizen Das Produkt A · B zweier Matrizen A und B kann nur dann gebildet werden, wenn gilt: Anzahl der Spalten von A = Anzahl der Zeilen von B . Matrizenmultiplikation Sei A eine Matrix vom Typ (m, p) und B eine Matrix vom Typ (p, n). Dann ergibt das Produkt C = A · B eine Matrix vom Typ (m, n). Die Elemente cik (i = 1, 2, . . . , m; k = 1, 2, . . . , n) dieses Matrizenproduktes sind jeweils das Skalarprodukt aus dem i-ten Zeilenvektor von A und dem k-ten Spaltenvektor von B. Für die Matrizenmultiplikation gelten das Assoziativgesetz: A(B C) = (A B)C sowie die Distributivgesetze: A(B + C) = A B + A C (A + B)C = A C + B C Weitere wichtige Regeln sind: (A B)T = B T AT und A E = E A = A. Die Multiplikation von Matrizen ist nicht kommutativ, d.h. es gilt i. allg.: A B 6= B A . Die praktische Berechnung von Matrizenprodukten A · B kann mit Hilfe des Falk-Schemas erfolgen: n z b11 .. . bp1 m a11 .. . ai1 .. . am1 | ··· .. . ··· .. . ··· {z p ··· .. . ··· ci1 .. . ··· .. . ··· .. . cm1 ··· a1p .. . c11 .. . aip .. . amp } }| ··· .. . ··· ··· .. . ··· { ··· .. . ··· b1k .. . bpk ··· .. . ··· ··· .. . ··· b1n .. . bpn c1n .. . cik = ai1 b1k + ai2 b2k + · · · + aip bpk .. . ··· .. . ··· .. . cmk ··· cmn c1k .. . | {z n 33 cin .. . } p m Beispiel 3.6: 3.2.4 Blockzerlegung von Matrizen Als Untermatrix einer Matrix A bezeichnet man jede Matrix, die durch Herausstreichen von Zeilen und/oder Spalten aus A hervorgeht. Eine Zerlegung einer Matrix in Untermatrizen (auch: Blöcke oder Kästchen) nennt man Blockzerlegung der Matrix. Beispiel 3.7: Nachfolgend ist jeweils eine mögliche Blockzerlegung für eine gegebene Matrix A bzw. B aufgezeigt: 1 0 0 2 1 3 4 0 0 ! ! 0 1 0 −1 3 2 0 0 0 A 12 E B 11 0 5 2 0 , B= A= = = 0 0 1 1 −2 0 A 0 0 B 22 2 2 1 0 21 0 0 0 4 1 1 1 2 0 0 0 0 1 −4 Die Blockzerlegung von Matrizen bietet folgende Vorteile: - Die spezielle Struktur von Teilen der Matrix kann ausgenutzt werden. Beispielsweise erweist es sich für durchzuführende Berechnungen als günstig, solche Blöcke zu bilden, die nur aus Nullen bestehen8 oder gleich einer Einheitsmatrix sind (siehe auch obiges Beispiel 3.7). - Die Berechnungen mit den Blöcken können formal so durchgeführt werden wie mit den tatsächlichen Matrixelementen. Voraussetzung ist natürlich, dass die entsprechenden Blockgrößen zusammenpassen. Fortsetzung zu Beispiel 3.7: Bei der Berechnung des Matrizenproduktes C = A · B kann die Blockstruktur ausgenutzt werden. Zunächst ist: ! ! ! A 12 E B 11 0 C 11 C 12 A·B = = =C. A 21 0 C 21 C 22 0 B 22 Nach den Gesetzen der Multiplikation von Matrizen gilt: C 11 = E B 11 + A 12 0 = B 11 , C 12 = E 0 + A 12 B 22 = A 12 B 22 , C 21 = A 21 B 11 + 0 0 = A 21 B 11 , C 22 = A 21 0 + 0 B 22 = 0 . ! B 11 A 12 B 22 Somit lautet die Produktmatrix: C = , A 21 B 11 0 und es sind lediglich noch die Produkte A 12 B 22 und A 21 B 11 zu berechnen. Man erhält: 9 −2 11 6 −1 −13 , A 21 B 11 = A 12 B 22 = , 7 0 22 −3 und die Produktmatrix C ergibt sich durch Einsetzen dieser Resultate in die obige Darstellung: 3 4 9 −2 ! 2 0 −1 −13 C 11 C 12 C= = 1 −2 22 −3 . C 21 C 22 11 6 0 0 7 0 0 0 Dieses Beispiel zeigt, wie mit Hilfe der Blockzerlegung die Anzahl notwendiger Rechenschritte reduziert werden kann. Ohne Blockzerlegung hätte die Multiplikation der Matrix A (vom Typ (5, 5)) mit der Matrix B (vom Typ (5, 4)) die Berechnung von 20 Elementen des Matrizenproduktes C = A · B erfordert (da die Matrix C vom Typ (5, 4) ist). Mit Hilfe der Blockzerlegung mussten jedoch nur die 6 Elemente des Matrizenproduktes A 12 B 22 und die 4 Elemente des Matrizenproduktes A 21 B 11 berechnet werden. 8 In praktischen Anwendungen entstehen häufig Matrizen, bei denen ein relativ hoher Anteil der Matrixelemente gleich Null ist. 34 3.3 Inverse Matrix Zunächst eine Vorbetrachtung: Wird im Bereich der reellen Zahlen die lineare Gleichung a · x = 1 1 (mit gegebenem a 6= 0) gelöst, so erhält man: x = = a−1 . Die Zahl x wird auch als Kehrwert von a oder als a die zu a inverse Zahl bezeichnet. Als Analogon zu dieser Gleichung kann man nun die Matrizengleichung: A · X = E betrachten. Dabei sind A eine gegebene Matrix vom Typ (n, n) und E die n-reihige Einheitsmatrix. Die Matrix X (ebenfalls vom Typ (n, n)) ist unbekannt. Es muss zudem die Frage gestellt werden, ob überhaupt eine Lösung der Matrizengleichung existiert. Die betrachtete Matrizengleichung führt auf die Definition der inversen Matrix. Definition 3.4: Existiert zu einer n-reihigen quadratischen Matrix A eine Matrix X mit der Eigenschaft: A·X =X ·A=E, (40) so heißt X die zu A inverse Matrix (oder Kehrmatrix). Sie wird durch das Symbol A−1 gekennzeichnet. Falls eine inverse Matrix (kurz: Inverse) existiert, so ist diese eindeutig. Es gilt dann: A · A−1 = A−1 · A = E (d.h. in diesem Fall dürfen die Faktoren im Matrizenprodukt vertauscht werden, obwohl die Multiplikation von Matrizen i.allg. nicht kommutativ ist, vgl. Abschnitt 3.2.3). Besitzt die Matrix A eine Inverse, nennt man A eine invertierbare Matrix. Beispiel 3.8: Im vorangegangenen Beispiel war die Inverse der Matrix A bereits gegeben, und es wurde nur das Erfülltsein der Eigenschaft (40) nachgeprüft. Für Matrizen vom Typ (2, 2) lässt sich eine sehr einfach zu handhabende Formel zur Berechnung der Inversen angeben. Berechnung der Inversen einer Matrix vom Typ (2, 2) a11 a12 Gegeben sei die Matrix A = . Unter der Voraussetzung a11 a22 − a12 a21 6= 0 existiert a21 a22 die zu A inverse Matrix. Sie kann nach der Formel a22 −a12 1 −1 mit D = a11 a22 − a12 a21 A = −a21 a11 D (41) berechnet werden. Falls a11 a22 − a12 a21 = 0 gilt, ist die Matrix A nicht invertierbar. Begründung für Formel (41): Die unbekannte Inverse sei zunächst mit X bezeichnet. a11 a12 x11 x12 1 0 Die Bedingung A X = E , d.h. · = a21 a22 x21 x22 0 1 führt auf die folgenden Gleichungen zur Bestimmung der Unbekannten x11 , x12 , x21 und x22 : a11 x11 + a12 x21 = 1, a11 x12 + a12 x22 = 0 a21 x11 + a22 x21 = 0, a21 x12 + a22 x22 = 1 . Dieses lineare Gleichungssystem ist genau dann lösbar, wenn die Voraussetzung a11 a22 − a12 a21 6= 0 erfüllt ist. In diesem Fall erhält man die Lösung (d.h. die gesuchten Matrixelemente): x11 = a22 a12 a21 a11 , x12 = − , x21 = − , x22 = D D D D Beispiel 3.9: 35 mit D aus (41). Auf die Berechnung der Inversen einer Matrix vom Typ (n, n) mit n ≥ 3 wird im Abschnitt 3.7.4 eingegangen. Nachfolgend werden allgemeingültige Rechenregeln für invertierbare Matrizen angegeben. Rechenregeln für invertierbare Matrizen Seien A und B invertierbare Matrizen vom Typ (n, n). Dann gilt: (A · B)−1 = B −1 · A−1 (d.h. das Produkt zweier invertierbarer Matrizen ist stets invertierbar) (λA)−1 = 1 −1 A λ (A−1 )−1 = A (AT )−1 = (A−1 )T 3.4 für λ ∈ R \ {0} (zweimaliges Invertieren ergibt wieder die Ausgangsmatrix) (Invertieren und Transponieren sind vertauschbar) Rang einer Matrix Für Aussagen zur Lösbarkeit linearer Gleichungssysteme (siehe Abschnitt 3.7) wird der Rang einer Matrix benötigt. Definition 3.5: Die Maximalzahl r der linear unabhängigen Zeilen- oder Spaltenvektoren einer Matrix A heißt Rang der Matrix A ; Schreibweise: r = r(A). Die Rangbestimmung einer Matrix erfolgt mit Hilfe elementarer Umformungen der Matrix. Der Rang r einer Matrix A bleibt erhalten, wenn sie den folgenden elementaren Umformungen unterworfen wird: (I) Vertauschung zweier Zeilen (Spalten) (II) Multiplikation aller Elemente einer Zeile (Spalte) mit einer von Null verschiedenen reellen Zahl (III) Addition eines Vielfachen einer Zeile (Spalte) zu einer anderen Zeile (Spalte). e von trapezförmiger Jede Matrix A vom Typ (m, n) mit dem Rang r lässt sich so in eine ranggleiche Matrix A 9 Gestalt überführen (mit Buchstaben sind alle diejenigen Matrixelemente bezeichnet, die von Null verschieden sein können): e a11 e a12 . . . e a1r e a1,r+1 . . . e a1n 0 e a22 . . . e a2r e a2,r+1 . . . e a2n .. .. .. .. .. r Zeilen . . . . . e A= 0 0 ... e arr e ar,r+1 . . . e arn 0 ... ... 0 0 ... 0 (m − r) Zeilen ( Nullzeilen“) . .. .. .. ” .. . . . 0 ... 0 0 ... ... 0 r Spalten n − r Spalten e = r = Anzahl der Nicht-Nullzeilen“ von A. e Es gilt dann: r(A) = r(A) ” Bei der praktischen Durchführung der Rangbestimmung müssen, beginnend mit der ersten Spalte, in jeder Spalte systematisch Nullen erzeugt werden, bis eine trapezförmige Matrix entstanden ist. Beispiel 3.10: 9 Anstelle der Bezeichnung Matrix von trapezförmiger Gestalt“ ist auch die Bezeichnung Matrix in Zeilenstufenform“ üblich. ” ” 36 Bemerkung: Die durch Umformungen entstehende trapezförmige Matrix kann ggf. auch folgendes Aussehen haben: e a11 e a12 . . . e a1r e a1,r+1 . . . e a1n 0 e a22 . . . e a2r e a2,r+1 . . . e a2n e = A .. .. .. .. .. . . . . . 0 0 ... e arr e ar,r+1 . . . e arn e = r = m = Anzahl der Zeilen von A). (d.h. es sind keine Nullzeilen entstanden; daher gilt: r(A) = r(A) Wenn die Matrix A quadratisch ist, d.h. wenn m = n gilt, dann kann bei den Umformungen ggf. eine obere Dreiecksmatrix entstehen (vgl. dazu Abschnitt 3.1.2). Das ist genau dann der Fall, wenn r = m = n gilt. 3.5 Komplexe Matrizen Bisher wurden nur solche Matrizen betrachtet, deren Elemente reelle Zahlen sind. In der Elektrotechnik werden jedoch auch Matrizen mit komplexen Elementen benötigt (z.B. komplexe Widerstandsmatrizen). Daher werden in diesem Abschnitt kurz einige Eigenschaften komplexer Matrizen dargestellt. Sei A eine Matrix vom Typ (m, n), bei der die Matrixelemente aik komplexe Zahlen sind. Dann können diese jeweils in der Form aik = bik + j · cik mit bik , cik ∈ R für i = 1, 2, . . . , m; k = 1, 2, . . . , n dargestellt werden, d.h. es wird für jedes Matrixelement eine Zerlegung in Realteil und Imaginärteil vorgenommen (vgl. auch Abschnitt 1.1.1). Werden nun die Realteile und Imaginärteile jeweils in einer Matrix zusammengefasst, dann erhält man die Zerlegung der komplexen Matrix A in Realteil und Imaginärteil: A=B+j·C (B : Realteil von A ; C : Imaginärteil von A) . (42) Dabei sind B und C reelle Matrizen vom Typ (m, n). Beispiel 3.11: Die zu A konjugiert-komplexe Matrix A∗ entsteht, indem jedes Element aik durch das konjugiert-komplexe Element a∗ik ersetzt wird. Mit Hilfe von (42) erhält man dann: A∗ = B − j · C . Fortsetzung zu Beispiel 3.11: Für komplexe Matrizen gelten sinngemäß die gleichen Rechenregeln wie für reelle Matrizen (siehe Abschnitt 3.2), wobei natürlich die Rechenregeln für komplexe Zahlen zu berücksichtigen sind. Beispiel 3.12: 37 3.6 Determinanten 3.6.1 Definition der Determinante, Laplacescher Entwicklungssatz Die Determinante kann nur für quadratische Matrizen gebildet werden. Die Determinante einer reellen quadratischen Matrix ist eine reelle Zahl. Man schreibt: det A oder |A| . Definition 3.6: Für eine 2-reihige quadratische Matrix A = a a det A = 11 12 a21 a22 a11 a12 a21 a22 wird die Determinante wie folgt berechnet: = a11 · a22 − a12 · a21 . (43) (Rechenregel: Produkt der Hauptdiagonalelemente minus Produkt der Nebendiagonalelemente“) ” Beispiel 3.13: Bemerkung: Bei der Berechnung der Inversen einer 2-reihigen quadratischen Matrix A trat der Ausdruck für det A bereits auf (siehe Formel (41)). Definition 3.7: a11 a12 a13 Die Determinante einer 3-reihigen quadratischen Matrix A = a21 a22 a23 ist gegeben durch: a31 a32 a33 a11 a12 a13 det A = a21 a22 a23 a31 a32 a33 = a11 a22 a33 + a12 a23 a31 + a13 a21 a32 − a13 a22 a31 − a11 a23 a32 − a12 a21 a33 . (44) Die praktische Berechnung der Determinante einer 3-reihigen quadratischen Matrix erfolgt vorteilhafterweise mit der Regel von Sarrus10 : − − − a12 a13 a11 a12 a11 a11 a12 a13 & % & % & % a21 a22 a23 = a21 a22 a23 a21 a22 a31 a32 a33 % % & % & & a31 a32 a33 a31 a32 + + + Beispiel 3.14: Es muss unbedingt beachtet werden, dass die Regel von Sarrus nur für 3-reihige Determinanten anwendbar ist! 10 Diese wurde auch im Beispiel 2.12 bereits angewendet. 38 Die allgemeine Regel zur Berechnung der Determinante einer n-reihigen quadratischen Matrix ist in der nachfolgenden Definition gegeben. Definition 3.8: Sei A eine n-reihige quadratische Matrix und U 1k die (n − 1)-reihige quadratische Matrix (Untermatrix), die aus A durch Streichen der 1. Zeile und k-ten Spalte entsteht (1 ≤ k ≤ n). Dann wird die Determinante von A wie folgt berechnet: a11 a12 . . . a1n a21 a22 . . . a2n 1+n det A = . · a1n · det U 1n (45) .. .. = a11 · det U 11 − a12 · det U 12 + . . . + (−1) . . . . an1 an2 . . . ann Beispiel 3.15: 3 1 0 4 −4 2 1 6 Zu berechnen sei die 4-reihige Determinante: det A = 2 1 5 3 4 0 2 −1 . Laut Definition der Determinante einer n-reihigen Matrix (siehe Formel (45), jetzt mit n = 4) gilt: det A = a11 · det U 11 − a12 · det U 12 + a13 · det U 13 − a14 · det U 14 = 3 · det U 11 − 1 · det U 12 + 0 · det U 13 − 4 · det U 14 . Dabei entsteht die Matrix U 1k (k = 1, 2, 3, 4) jeweils durch Streichen der 1. Zeile und k-ten Spalte von A. Man erhält unter Verwendung der Regel von Sarrus: 2 1 −4 1 −4 2 1 6 6 3 = −9, det U 12 = 2 5 3 = −38, det U 14 = 2 1 5 = 20 . det U 11 = 1 5 0 2 −1 4 2 −1 4 0 2 Die Determinante det U 13 muss nicht berechnet werden, da der Faktor a13 gleich Null ist. Einsetzen dieser Ergebnisse in die obige Gleichung liefert das Endergebnis: det A = 3 · (−9) − 1 · (−38) − 4 · 20 = −69. Laut Definition 3.8 kann die Berechnung einer n-reihigen Determinante auf die Berechnung von (n − 1)-reihigen Determinanten zurückgeführt werden. Anstelle der Elemente der 1. Zeile (wie in (45)) können auch die Elemente einer anderen Zeile oder Spalte mit den entsprechenden Untermatrizen benutzt werden. Diese Aussage ist in dem nachfolgenden Satz formuliert. Laplacescher Entwicklungssatz Sei A eine n-reihige quadratische Matrix und U ik die (n − 1)-reihige quadratische Matrix, die aus A durch Streichen der i-ten Zeile und k-ten Spalte entsteht (1 ≤ i, k ≤ n). Mit Aik = (−1)i+k · det U ik wird die Adjunkte von A zum Element aik bezeichnet. Dann gilt für die Determinante von A: det A = ai1 · Ai1 + ai2 · Ai2 + . . . + ain · Ain = n X aik · Aik (Entwicklung nach der i-ten Zeile), k=1 det A = a1k · A1k + a2k · A2k + . . . + ank · Ank = n X i=1 Beispiel 3.16: 39 aik · Aik (Entwicklung nach der k-ten Spalte) 3.6.2 Rechenregeln für Determinanten Regeln für die Berechnung von Determinanten Regel 1: Für eine n-reihige quadratische Matrix A gilt stets: det AT = det A. Regel 2: Beim Vertauschen zweier Zeilen (oder Spalten) kehrt sich das Vorzeichen der Determinante um. Regel 3: Werden die Elemente einer beliebigen Zeile (oder Spalte) mit einem reellen Skalar λ multipliziert, so multipliziert sich die Determinante mit λ. Regel 4: Besitzen die Elemente einer Zeile (oder Spalte) einen gemeinsamen Faktor λ, so darf dieser vor die Determinante gezogen werden. Regel 5: Eine Determinante besitzt den Wert Null, wenn mindestens eine der folgenden Bedingungen erfüllt ist: - Alle Elemente einer Zeile (oder Spalte) sind Null. Zwei Zeilen (oder Spalten) sind gleich. Zwei Zeilen (oder Spalten) sind zueinander proportional. Eine Zeile (oder Spalte) ist als Linearkombination anderer Zeilen (oder Spalten) darstellbar. Regel 6: Der Wert einer Determinante ändert sich nicht, wenn man zu einer Zeile (oder Spalte) ein beliebiges Vielfaches einer anderen Zeile (bzw. Spalte) addiert. Regel 7: Multiplikationssatz für Determinanten Für zwei n-reihige quadratische Matrizen A, B gilt stets: det(A · B) = det A · det B . Regel 8: Die Determinante einer n-reihigen Dreiecksmatrix A besitzt den Wert: det A = a11 · a22 · . . . · ann , d.h. die Determinante ist gleich dem Produkt der Hauptdiagonalelemente. Um die praktische Berechnung n-reihiger Determinanten (n ≥ 4) möglichst effektiv zu gestalten, überprüft man zunächst ob die Regel 5 oder 8 anwendbar ist. Wenn dies der Fall ist, kann der Wert der Determinante leicht ermittelt werden. In allen anderen Fällen geht man wie folgt vor: 1) Wenn möglich, werden gemeinsame Faktoren von Zeilen bzw. Spalten gemäß Regel 4 vor die Determinante gezogen. Außerdem werden mit Hilfe von Umformungen gemäß Regel 6 in einer Zeile oder Spalte (n − 1) Nullen erzeugt. 2) Die Entwicklung nach dieser Zeile bzw. Spalte (gemäß dem Laplaceschen Entwicklungssatz) führt auf eine (n − 1)-reihige Determinante (mit Vorfaktor). 3) Falls n = 4, ist in Schritt 2 eine 3-reihige Determinante entstanden, welche mit der Regel von Sarrus berechnet werden kann. Anderenfalls sind die Schritte 1 und 2 so lange zu wiederholen, bis eine 3-reihige Determinante entsteht. Beispiel 3.17: Alternativ zu der soeben beschriebenen Vorgehensweise zur Berechnung n-reihiger Determinanten ist auch folgendes möglich: 1) Mit Hilfe von Umformungen gemäß Regel 6 wird die Determinante in Dreiecksform überführt. 2) Entsprechend Regel 8 muss dann nur noch das Produkt der Hauptdiagonalelemente gebildet werden. 3.7 Lineare Gleichungssysteme 3.7.1 Einführung Einführend soll ein Anwendungsbeispiel11 für lineare Gleichungssysteme angegeben werden. Beispiel 3.18: Betrachtet wird ein Gleichstromkreis mit einer Spannungsquelle (Spannung: U ) sowie den drei Ohmschen Widerständen R1 , R2 und R3 (siehe Bild 3.1). 11 Quelle: L. PAPULA . Mathematik für Ingenieure und Naturwissenschaftler (Band 2), 12. Auflage, S. 5 40 R3 I3 - R1 r - r I1 I2 I1 6 R2 ? b- b U Bild 3.1 Aufgrund der Kirchhoffschen Regeln bestehen die folgenden Beziehungen - nach der Knotenpunktsregel: I1 − I2 − I3 = 0 R1 I1 + R2 I2 = U R2 I2 − R3 I3 = 0. - nach der Maschenregel: Somit ergibt sich ein lineares Gleichungssystem zur Berechnung der unbekannten Teilströme I1 , I2 und I3 : I1 − I2 − R1 I1 + R2 I2 I3 = 0 = U R2 I2 − R3 I3 = 0 . Im folgenden wird der Begriff des linearen Gleichungssystems allgemein eingeführt. Unter einer linearen Gleichung mit den n Variablen x1 , x2 , . . . , xn versteht man eine Gleichung der Form: a1 x1 + a2 x2 + . . . + an xn = b (xi , ai , b ∈ R). Liegen gleichzeitig m solcher Gleichungen vor, spricht man von einem linearen Gleichungssystem (LGS). Die allgemeine Schreibweise für ein LGS lautet: a11 x1 + a12 x2 + . . . + a1n xn = b1 .. .. .. .. . . . . (46) am1 x1 + am2 x2 + . . . + amn xn = bm , wobei aik als Koeffizienten des LGS und bi als rechte Seiten oder Störglieder bezeichnet werden (i = 1, 2, . . . , m; k = 1, 2, . . . , n). Das LGS (46) lässt sich in Matrizenschreibweise darstellen12 : A · x = b, (47) a11 a12 a21 a22 mit der Koeffizientenmatrix A = . .. .. . am1 am2 b1 .. sowie dem Vektor der rechten Seiten b = . ... ... a1n a2n .. . . . . amn , dem Lösungsvektor x = x1 .. . xn . bm Beispiel 3.19: a) System von Gleichungen → Matrizenschreibweise: Das LGS mit zwei Gleichungen und drei Unbekannten x1 − 2x2 + x3 = 1 x1 + x2 − 4x3 = 8 12 Im Zusammenhang mit LGS werden Vektoren aus dem Rn durch unterstrichene Kleinbuchstaben dargestellt, während im Abschnitt 2.6 die Schreibweise mit Pfeil verwendet wurde. 41 lautet in Matrizenschreibweise: b) Matrizenschreibweise → System von Gleichungen: Das in Matrizenform vorliegende LGS x1 0 1 −3 5 0 x2 1 2 8 = x3 3 5 7 0 lautet in der herkömmlichen Schreibweise: Falls der Vektor der rechten Seiten gleich dem Nullvektor ist, d.h. b = 0 , heißt das LGS homogen, anderenfalls inhomogen. Das Lösungsverhalten eines LGS lässt sich wie folgt charakterisieren: homogenes LGS inhomogenes LGS entweder genau eine Lösung: x = 0 (triviale Lösung) oder unendlich viele Lösungen (darunter x = 0 ) 3.7.2 entweder genau eine Lösung oder unendlich viele Lösungen oder keine Lösung Der Gaußsche Algorithmus Der Gaußsche Algorithmus ist ein in der Praxis häufig verwendetes Lösungsverfahren für LGS. Für die Anwendung dieses Verfahrens wird die erweiterte Koeffizientenmatrix benötigt: a11 a12 . . . a1n b1 a21 a22 . . . a2n b2 (A | b) = . .. .. .. . . . . ... . . am1 am2 . . . amn bm Der Gaußsche Algorithmus beruht auf elementaren Zeilenumformungen in der erweiterten Koeffizientenmatrix (A | b). Zulässige elementare Zeilenumformungen13 sind: (I) Vertauschung zweier Zeilen (II) Multiplikation einer Zeile mit einer von Null verschiedenen reellen Zahl (III) Addition eines Vielfachen einer Zeile zu einer anderen Zeile Dabei wird die Lösungsmenge des LGS nicht verändert. Der Rang der Matrizen A und (A | b) bleibt jeweils unverändert (siehe Abschnitt 3.4). 13 Während bei der Rangbestimmung von Matrizen (siehe Abschnitt 3.4) auch Spaltenumformungen möglich sind, werden beim Gaußschen Algorithmus ausschließlich Zeilenumformungen durchgeführt. Die Vertauschung von Spalten wäre beim Gaußschen Algorithmus zwar auch möglich, würde jedoch eine Umbenennung der Variablen erfordern. 42 Vorgehensweise bei der Lösung eines LGS mittels Gaußschem Algorithmus 1) Auf die erweiterte Koeffizientenmatrix (A | b) werden elementare Zeilenumformungen angewendet, so dass die Matrix A Trapezform (vgl. dazu Abschnitt 3.4) erhält. e x = eb vor. 2) Das LGS liegt nun in der (zum Ausgangssystem äquivalenten) Form A Falls dieses LGS widersprüchliche Gleichungen enthält (siehe unten), existiert keine Lösung. e x = eb sukzessiv von unten nach oben gelöst werden. Anderenfalls kann das LGS A Erläuterung: Nach Ausführung von Schritt 1) liegt die erweiterte Koeffizientenmatrix in folgender Form vor: e | eb) = (A e a11 e a12 0 e a22 .. .. . . 0 0 0 ... .. . 0 e e (A | b) = ... ... e a1r e a1,r+1 ... e a2r e a2,r+1 .. .. . . ... e arr e ar,r+1 ... 0 0 .. .. . . ... e a1n ... e a2n .. . ... ... 0 0 ... e arn ... 0 .. . 0 e a11 e a12 . . . e a1r e a1,r+1 . . . e a1n 0 e a22 . . . e a2r e a2,r+1 . . . e a2n .. .. .. .. .. . . . . . 0 0 ... e arr e ar,r+1 . . . e arn eb1 eb2 .. . ebr ebr+1 .. . ebm eb1 eb2 .. . ebr oder (48) . (49) Wenn in der Matrix (48) die Elemente ebr+1 , . . . , ebm (oder zumindest einige von ihnen) von Null verschieden sind, enthält das LGS widersprüchliche Gleichungen, da die linke Seite der entsprechenden Gleichung Null ergibt, die rechte Seite jedoch nicht. In diesem Fall besitzt das LGS keine Lösung. Falls sämtliche Elemente ebr+1 , . . . , ebm gleich Null sind, liegt ein lösbares LGS in gestaffelter Form vor (die Nullzeilen entfallen für e | eb) entspricht, wird zuerst die weiteren Lösungsschritte). Die Gleichung, welche der r-ten Zeile der Matrix (A gelöst, anschließend sukzessiv die verbleibenden Gleichungen. Wenn die entstandene Matrix die Gestalt (49) hat, ist das LGS auf jeden Fall lösbar. Beispiel 3.20: Die Aussagen zur Lösbarkeit eines LGS können auch als Rangkriterium“ formuliert werden: ” Das LGS A x = b ist lösbar genau dann, wenn der Rang der Koeffizientenmatrix A gleich dem Rang der erweiterten Koeffizientenmatrix (A | b) ist. oder kurz: A x = b ist lösbar ⇔ r(A) = r(A | b) e | eb) gilt (da r(A) und r(A | b) e = r(A Bei der praktischen Anwendung dieses Kriteriums wird geprüft, ob r(A) e sowie r(A | b) = r(A e | eb) genutzt. i.allg. nicht sofort erkennbar sind). Dann wird r(A) = r(A) Beispiel 3.21: Nun wird die Lösungsmenge des LGS A x = b unter der Voraussetzung r(A) = r(A | b) genauer betrachtet. Sei A vom Typ (m, n). Dann können die folgenden beiden Fälle unterschieden werden: a) Es gilt: r(A | b) = n , d.h. das gestaffelte LGS hat n Gleichungen und n Variable. ⇒ Das LGS besitzt genau eine Lösung (siehe dazu Beispiel 3.20a)). b) Es gilt: r(A | b) < n , d.h. das gestaffelte LGS hat weniger Gleichungen als Variable. ⇒ Das LGS besitzt unendlich viele Lösungen, die von n − r(A | b) freien Parametern abhängen. Eine solche Situation wurde im Beispiel 3.20b) betrachtet. Dort gilt: n = 3 sowie r(A | b) = 2. Daraus folgt, dass unendlich viele Lösungen existieren und dass die Anzahl der freien Parameter 3 - 2 = 1 beträgt. 43 3.7.3 Lineare Gleichungssysteme mit quadratischer Koeffizientenmatrix, Cramersche Regel Für LGS mit einer Koeffizientenmatrix A vom Typ (n, n) kann das Lösungsverhalten mit Hilfe der Determinante det A charakterisiert werden. Dabei sind die folgenden Fälle zu unterscheiden: a) Es gilt: det A 6= 0 ⇒ Das LGS hat genau eine Lösung. (Liegt ein homogenes LGS vor, ist dies die triviale Lösung.) b) Es gilt: det A = 0 ⇒ Ist das LGS homogen, dann besitzt es unendlich viele Lösungen. Handelt es sich um ein inhomogenes LGS, dann besitzt es entweder keine Lösung oder unendlich viele Lösungen. (Über die Lösbarkeit kann entschieden werden, indem die Bedingung r(A) = r(A | b) überprüft wird, siehe Abschnitt 3.7.2). Im Fall a) (eindeutige Lösbarkeit des LGS) kann die Cramersche Regel zur Berechnung der Lösung angewendet werden. Cramersche Regel Sei A vom Typ (n, n), wobei det A 6= 0. Dann gilt für die Lösung x des LGS A x = b : x1 Di x = ... mit xi = für i = 1, 2, . . . , n. D xn (50) Dabei bezeichnet D die Determinante der Koeffizientenmatrix, d.h. D = det A. Die Determinante Di entsteht, indem in der Determinante D die i-te Spalte durch den Vektor b der rechten Seiten ersetzt wird. Beispiel 3.22: Beispiel 3.23: Das LGS aus Beispiel 3.18 soll mit der Cramerschen Regel gelöst werden. In Matrixschreibweise lautet dieses LGS: I1 0 1 −1 −1 0 I2 = U . R1 R2 0 R2 −R3 I3 0 Es gilt: 1 −1 −1 0 D = det A = R1 R2 0 R2 −R3 = −(R1 R2 + R1 R3 + R2 R3 ) 6= 0, d.h. das Gleichungssystem besitzt eine eindeutige Lösung und daher kann die Cramersche Regel angewendet werden. Man erhält für die Hilfsdeterminanten Di : 1 0 0 −1 −1 −1 0 = −R3 U 0 = −R2 U − R3 U = −(R2 + R3 )U , D2 = R1 U D1 = U R2 0 0 −R3 0 R2 −R3 1 −1 0 D3 = R1 R2 U = −R2 U 0 R2 0 Die Lösung des LGS lautet somit: I1 = D1 (R2 + R3 )U = , D R1 R2 + R1 R3 + R2 R3 I3 = D3 R2 U = . D R1 R2 + R1 R3 + R2 R3 I2 = D2 R3 U = , D R1 R2 + R1 R3 + R2 R3 44 Bemerkung: Wenn ein LGS mit einer Koeffizientenmatrix vom Typ (n, n) mittels der Cramerschen Regel gelöst werden soll, dann ist die Berechnung von (n + 1) Determinanten erforderlich, d.h. mit steigendem n nimmt der Rechenaufwand erheblich zu. In der Praxis wird daher zur Lösung von LGS mit einer Koeffizientenmatrix vom Typ (n, n) mit n > 3 der Gaußsche Algorithmus bevorzugt. 3.7.4 Gauß-Jordan-Verfahren Das Gauß-Jordan-Verfahren ist eine Methode zur Berechnung der Inversen A−1 einer invertierbaren Matrix A. Es beruht auf den elementaren Zeilenumformungen einer Matrix (siehe Abschnitt 3.7.2). Gauß-Jordan-Verfahren zur Berechnung der Inversen einer Matrix A vom Typ (n, n) 1) Aus der Matrix A und der n-reihigen Einheitsmatrix E wird die neue Matrix (A | E) vom Typ (n, 2n) gebildet. 2) Auf die Matrix (A | E) werden elementare Zeilenumformungen angewendet, bis am ursprünglichen Platz von A die Matrix E entstanden ist. Die gesuchte Inverse A−1 befindet sich dann auf dem ursprünglichen Platz von E. Beispiel 3.24: Die Inverse einer Matrix A existiert genau dann, wenn det A 6= 0 gilt. Diese Eigenschaft sollte vor Ausführung des Gauß-Jordan-Verfahrens überprüft werden. Wird dieses Verfahren mit einer nicht invertierbaren Matrix angewendet, so gelingt es nicht, eine Einheitsmatrix am ursprünglichen Platz von A zu erzeugen (d.h. das oben beschriebene Verfahren muss im Schritt 2 ohne Ergebnis abgebrochen werden). 3.8 3.8.1 Eigenwertprobleme Einführung Zahlreiche naturwissenschaftlich-technische Aufgabenstellungen führen auf Eigenwertprobleme für Matrizen. Typische Anwendungsbereiche für Eigenwertprobleme sind z.B.: - Schwingungsprobleme (insbesondere: Berechnungen zur Vermeidung instabiler Schwingungen) - Untersuchung des Biege- und Knickverhaltens von Stäben und Balken. Definition 3.9: Sei A eine Matrix vom Typ (n, n). Eine Zahl λ ∈ C heißt ein Eigenwert von A und der Vektor x ∈ Rn ein zugehöriger Eigenvektor, wenn gilt: A x = λx 3.8.2 und x 6= 0. (51) Berechnung von Eigenwerten (EW) Die Gleichung (51) lässt sich wegen x = E x auch in der Form A x = λE x schreiben. Daraus resultiert die folgende Darstellung des Eigenwertproblems (51): (A − λE) x = 0 . (52) Das ist ein homogenes LGS mit der Koeffizientenmatrix A − λE und dem Lösungsvektor x. Gemäß der Untersuchungen im Abschnitt 3.7.3 ist zu unterscheiden: a) det (A − λE) 6= 0 ⇒ Das LGS (52) hat nur die triviale Lösung x = 0. Laut Definition 3.9 kann der Nullvektor jedoch kein Eigenvektor sein. b) det (A − λE) = 0 ⇒ Das LGS (52) besitzt unendlich viele Lösungen, d.h. auch solche mit x 6= 0. Somit ist die Gleichung det (A − λE) = 0 (53) geeignet zur Berechnung der EW der Matrix A. Man nennt (53) auch die charakteristische Gleichung der Matrix A. 45 Wird die Determinante det (A − λE) ausführlich geschrieben, dann erhält man: a11 − λ a12 a13 . . . a1n a21 a22 − λ a23 . . . a2n = 0. .. .. .. .. . . . . an1 an2 an3 . . . ann − λ (54) Die Determinante auf der linken Seite von (54) ergibt ein Polynom n-ten Grades in λ (dies folgt aus dem Laplaceschen Entwicklungssatz und den Regeln für die Berechnung von Determinanten). Somit sind die Nullstellen dieses Polynoms die gesuchten Eigenwerte. Nach dem Fundamentalsatz der Algebra besitzt jedes Polynom n-ten Grades genau n komplexe Nullstellen. Diese müssen nicht notwendig voneinander verschieden sein (mehrfache Nullstellen). Somit kann es auch mehrfache Eigenwerte geben. Beispiel 3.25: Beispiel 3.26: Normalschwingungen gekoppelter mechanischer Systeme14 k @@ c c @@ m m @@ @@ B B BB } B B B } B B BB @@ B B B B B B B B B @ @ @ x1 - @@ @@ @@ @@ @@ @ @ @ Kopplung zweier schwingungsfähiger Systeme (Masse m, Federkonstante c) über eine Kopplungsfeder (Federkonstante k) x2 System ist zu Normalschwingungen in Richtung der Systemachse fähig Massen schwingen dabei harmonisch mit Kreisfrequenz ω Lagekoordinaten x1 , x2 : periodische Funktionen mit Schwingungsdauer T = 2π/ω Kreisfrequenzen dieser Normalschwingungen sind die positiven Wurzeln aus den Eigenwerten der Systemmatrix A, wobei gilt: A= (c + k)/m −k/m −k/m (c + k)/m = α −β −β α , mit α := (c + k)/m, β := k/m. - Eigenwerte dieser Matrix sind (Berechnung siehe Übung): c c + 2k , λ2 = m m - Kreisfrequenzen der Normalschwingungen: r r p p c c + 2k ω1 = λ 1 = (Schwingung in Phase), ω2 = λ2 = (Schwingung in Gegenphase) m m λ1 = Für Diagonal- bzw. Dreiecksmatrizen gestaltet sich die Berechnung der EW besonders einfach. a11 a12 a13 . . . a1n 0 a22 a23 . . . a2n 0 a33 . . . a3n Sei A z.B. eine obere Dreiecksmatrix: A = 0 (siehe dazu auch Abschnitt 3.1.2). . . . . .. . . .. .. 0 0 0 . . . ann a11 − λ a12 a13 0 a − λ a 22 23 0 0 a33 − λ Nach (53), (54) berechnen sich die EW aus: det (A−λE) = .. .. . . 0 0 0 14 = 0. . . . ann − λ ... ... ... .. . Quelle: L. PAPULA . Mathematik für Ingenieure und Naturwissenschaftler (Band 2), 12. Auflage, S. 144-145 46 a1n a2n a3n .. . Gemäß Regel 8 aus Abschnitt 3.6.2 gilt: det (A − λE) = (a11 − λ)(a22 − λ) · . . . · (ann − λ) ⇒ det (A − λE) wird genau dann Null, wenn einer der Faktoren in diesem Produkt gleich Null ist ⇒ λ1 = a11 , λ2 = a22 , . . . , λn = ann sind die EW von A, d.h. die EW sind genau die Elemente der Hauptdiagonalen von A. Gleiches gilt für untere Dreiecksmatrizen sowie Diagonalmatrizen. Für Dreiecksmatrizen sowie für Diagonalmatrizen entfällt daher das Aufstellen und Lösen der charakteristischen Gleichung, die EW können sofort aus der Matrix abgelesen werden. Beispiel 3.27: 3.8.3 Berechnung von Eigenvektoren (EV) Zu jedem EW λi gehört ein EV x(i) , der als Lösung des homogenen LGS (A − λi E) x(i) = 0 (siehe auch (52)) berechnet werden kann. Wegen det (A − λi E) = 0 ist mindestens eine Gleichung des LGS linear abhängig von den anderen, so dass der Lösungsvektor mindestens einen freien Parameter enthält. EV sind daher nur bis auf einen konstanten Faktor eindeutig bestimmt. Sie werden meistens in normierter Form (d.h. |x(i) | = 1 ) angegeben. Beispiel 3.28: Zusammenfassung: Berechnung von Eigenwerten (EW) und Eigenvektoren (EV) Sei A eine Matrix vom Typ (n, n). Die Eigenwerte λi dieser Matrix werden berechnet als Lösungen der charakteristischen Gleichung det (A − λE) = 0 , d.h. sie sind die Nullstellen eines Polynoms n-ten Grades. Handelt es sich bei A um eine Diagonal- bzw. Dreiecksmatrix, sind die EW genau die Elemente der Hauptdiagonalen von A. Zu jedem EW λi gehört ein EV x(i) , welcher als Lösung des LGS (A − λi E) x(i) = 0 berechnet und anschließend normiert wird. Bemerkungen: - Die Berechnung von EV für Matrizen vom Typ (2, 2) (siehe Beispiel 3.28) ist leicht durchzuführen, da ein LGS entsteht, bei dem sich die beiden Gleichungen nur um einen Faktor unterscheiden. Allgemein entsteht für Matrizen vom Typ (n, n) ein LGS mit n Gleichungen, das mittels Gaußschem Algorithmus gelöst werden kann (für n = 3: siehe Übung). - Zu einem mehrfachen Eigenwert (vgl. Abschnitt 3.8.2) können mehrere linear unabhängige Eigenvektoren existieren. - Die EW und EV einer symmetrischen Matrix besitzen spezielle Eigenschaften: Sämtliche EW sind reell. Es gibt insgesamt genau n linear unabhängige EV. Die zu verschiedenen EW gehörigen EV sind orthogonal. - Für die Berechnung von EW größerer Matrizen erweist sich die im Abschnitt 3.8.2 beschriebene Vorgehensweise als ungeeignet, weil sie dann sehr aufwändig ist. Zudem können Instabilitäten bei der Berechnung der Lösungen der charakteristischen Gleichung auftreten. Aus diesem Grund werden bei größeren Matrizen zur Eigenwertberechnung numerische Verfahren angewendet, die auf geeigneten Transformationen der Matrix basieren. 47 3.9 Zusammenfassende Aussagen über quadratische Matrizen Eigenschaften quadratischer Matrizen Sei A eine quadratische Matrix vom Typ (n, n). Dann sind die folgenden Aussagen äquivalent. 1. Der Rang der Matrix A ist gleich n: r(A) = n. 2. Nach Überführung der Matrix A in Trapezform hat diese keine Zeilen, in denen nur Nullen stehen. 3. Es gilt: det A 6= 0. 4. Die inverse Matrix A−1 existiert. 5. Das homogene lineare Gleichungssystem A x = 0 hat als einzige Lösung: x = 0 (triviale Lösung). 6. Das inhomogene lineare Gleichungssystem A x = b hat für jedes beliebige b ∈ Rn eine eindeutige Lösung, nämlich x = A−1 b . 7. Die Eigenwerte der Matrix A sind von Null verschieden. 48 4 Folgen und Reihen Zahlenfolgen werden z.B. für die Definition des Grenzwertbegriffs von Funktionen (siehe Kapitel 5) benötigt. 4.1 Definition und Darstellung reeller Zahlenfolgen Definition 4.1: Unter einer reellen Zahlenfolge (Folge) versteht man eine geordnete Menge reeller Zahlen. Schreibweise: {an } = a0 , a1 , a2 , . . . , an , . . . (n ∈ N) a0 , a1 , a2 , . . . : Glieder der Folge, an : n-tes Glied der Folge Beispiel 4.1: Bezüglich der Darstellung von Folgen unterscheidet man unterscheidet man explizite und rekursive Folgen. an wird direkt aus n berechnet (unabhängig von anderen Gliedern der Folge) an wird aus vorigen Gliedern der Folge (z.B. aus an−1 ) berechnet explizit: rekursiv: Beispiel 4.2: (explizite Folgen) Beispiel 4.3: (rekursive Folgen) Die beiden folgenden Beispiele beinhalten praktische Anwendungssituationen für Zahlenfolgen. Beispiel 4.4: (Sprunghöhe einer Stahlkugel) Eine Stahlkugel fällt aus einer Höhe h0 auf eine Platte und prallt zurück. Infolge der Energieverluste beim Aufprall erreicht sie dann nur noch 43 der Höhe h0 . Die Folge der Sprunghöhen h1 , h2 , . . ., nachdem die Kugel einmal, zweimal, . . . aufgeprallt ist, lautet: n 2 3 o n 3 3 3 3 {hn } = h0 , h0 , h0 , . . . ⇒ hn = h0 (explizit definierte Folge). 4 4 4 4 Es handelt sich um eine geometrische Folge (siehe auch Abschnitt 4.2.2) mit dem Quotienten q = 34 . Beispiel 4.5: (zeitdiskrete Signale) Für die digitale Verarbeitung zeitkontinuierlicher Signale ist eine Umwandlung in zeitdiskrete Signale notwendig. Diese Diskretisierung erfolgt durch Abtastung des Signals zu äquidistanten Zeitpunkten. Dies bedeutet konkret : Das Zeitintervall [0, T ] wird in m gleichlange Teilintervalle [ n · T0 , (n + 1) · T0 ) (mit T0 = T , m n = 0, 1, . . . , m − 1) aufgeteilt. Infolge der Abtastung des zeitkontinuierlichen Signals x(t) entsteht eine endliche Folge {xn } von Signalwerten xn = x(n · T0 ), wobei n = 0, 1, . . . , m. 49 Bemerkungen: - Eine Folge {an } kann auch als eine Funktion f mit an = f (n) für n ∈ N, an ∈ R aufgefasst werden. - Anstelle der in Definition 4.1 eingeführten unendlichen Folgen (mit n ∈ N) können auch endliche Folgen betrachtet werden: a0 , a1 , a2 , . . . , am (vgl. dazu Beispiel 4.5). - In manchen Fällen wird das erste Glied einer Zahlenfolge {an } mit a1 (statt a0 ) bezeichnet, d.h. es gilt dann n ∈ N∗ (statt n ∈ N). 4.2 4.2.1 Eigenschaften von Folgen und spezielle Folgen Monotonie und Beschränktheit Definition 4.2: monoton wachsend, streng monoton wachsend, monoton fallend, Eine Folge {an } heißt streng monoton fallend, konstant, alternierend, falls an ≤ an+1 falls an < an+1 falls an ≥ an+1 falls an > an+1 falls an = an+1 falls an · an+1 < 0 für alle n ∈ N gilt. Bei Zahlenfolgen {an } mit n ∈ N∗ ist entsprechend n ∈ N∗ zu nehmen. Beispiel 4.6: Definition 4.3: Eine Zahlenfolge {an } , n ∈ N, heißt nach oben bzw. nach unten beschränkt, wenn es eine Zahl So ∈ R bzw. Su ∈ R gibt, so dass gilt: an ≤ So bzw. an ≥ Su für alle n ∈ N. (55) Die Zahl So bzw. Su wird als obere bzw. untere Schranke der Folge bezeichnet. Ist eine Folge nach oben und nach unten beschränkt, so heißt sie beschränkt. Beispiel 4.7: 4.2.2 Arithmetische und geometrische Folgen Bei einer arithmetischen Folge hat die Differenz zweier aufeinanderfolgender Glieder den konstanten Wert d, d.h. es gilt bei rekursiver Darstellung: an − an−1 = d bzw. an = an−1 + d für n ≥ 1, (56) bei expliziter Darstellung: an = a0 + nd für n ≥ 1. Beispiel 4.8: Bei einer geometrischen Folge hat der Quotient zweier aufeinanderfolgender Glieder den konstanten Wert q, d.h. es gilt bei rekursiver Darstellung: an an−1 bei expliziter Darstellung: an = a0 · q n = q bzw. an = q · an−1 für n ≥ 1, (57) für n ≥ 1. 50 Beispiel 4.9: Beispiel 4.10:15 Normzahlen dienen zur Vermeidung von willkürlichen Abstufungen bei der Typisierung von Bauteilen und Systemen hinsichtlich bestimmter Merkmale. Die Normzahlen sind gewöhnlich in einer geometrischen Folge gestuft, wobei der entsprechende Quotient q als Stufensprung bezeichnet wird. √ Als Beispiel sei die Normzahlreihe R5 genannt. Hier beträgt der Stufensprung: q = 5 10 = 101/5 ≈ 1.585. Gemäß der Berechnungsvorschrift für geometrische Folgen erhält man dann für den Bereich der Zahlen von 1 bis 10 die Folgenglieder: 1, 101/5 , 102/5 , 103/5 , 104/5 , 10. In diesem Fall handelt es sich um eine endliche geometrische Folge. In der Praxis werden die Glieder der Normzahlreihe R5 jeweils auf eine Nachkommastelle gerundet, so dass man erhält: 1, 1.6, 2.5, 4, 6.3, 10. Weitere gebräuchliche Normzahlreihen findet man in den entsprechenden DIN- bzw. ISO-Normen. 4.3 Grenzwerte von Folgen Bevor der Begriff des Grenzwertes eingeführt wird, soll die folgende Vorbetrachtung durchgeführt werden. 3 4 = 2, 2 , 3 , . . . mit n ∈ N∗ . Diese Folge ist streng monoton fallend Gegeben sei die Folge {an } = n+1 n (siehe Beispiel 4.6c)) und durch Su = 1 nach unten beschränkt. Berechnet man weitere Glieder dieser Folge, z.B.: a10 = 11 10 = 1.1, a100 = 101 100 = 1.01, a1000 = 1001 1000 = 1.001, so ist festzustellen, dass sich die Folgenglieder mit wachsendem n der Zahl a = 1 nähern. Für hinreichend großes n liegen an und alle nachfolgenden Glieder beliebig nahe bei 1“. ” Eine Verallgemeinerung dieser Betrachtungen führt zu der folgenden Definition des Grenzwertes einer Folge. Definition 4.4: Die reelle Zahl a heißt Grenzwert einer Folge {an }, wenn es zu jedem ε > 0 eine natürliche Zahl n0 gibt, so dass für alle n ≥ n0 gilt: |an − a| < ε . (58) Eine Folge, die gegen einen Grenzwert a strebt, heißt konvergent (gegen den Grenzwert a). Schreibweise: limn→∞ an = a . Bild 4.1 zeigt eine Veranschaulichung des Grenzwertbegriffes mit Hilfe der Zahlengeraden. a−ε a+ε s a0 a1 an0 −1 | a {z - } In diesem Intervall liegen alle Glieder an mit n ≥ n0 Bild 4.1 Beispiel 4.11: 15 Quelle: E. W ESTK ÄMPER , H.-J. WARNECKE. Einführung in die Fertigungstechnik, 4. Auflage, S. 27-28. 51 Eine Folge {an } mit limn→∞ an = 0 wird als Nullfolge bezeichnet. Beispiel 4.12: Definition 4.5: Eine Folge, die keinen Grenzwert besitzt (d.h. die nicht konvergiert), heißt divergent. Wenn zu jedem K ∈ R eine natürliche Zahl n0 existiert, so dass für alle n ≥ n0 gilt: an > K, dann heißt die Folge {an } bestimmt divergent. Man sagt auch, dass {an } den uneigentlichen Grenzwert +∞ besitzt; Schreibweise: limn→∞ an = +∞ . Analog ist der uneigentliche Grenzwert −∞ definiert. Beispiel 4.13: Definition 4.6: Eine Folge, die weder konvergent noch bestimmt divergent ist, heißt unbestimmt divergent. Beispiel 4.14: Bei der praktischen Berechnung von Grenzwerten nutzt man i.allg. nicht die Ungleichung (58), sondern versucht den entsprechenden Ausdruck für die Folgenglieder an geschickt umzuformen, damit dann auf bekannte oder leicht berechenbare Grenzwerte zurückgegriffen werden kann. Als hilfreich erweisen sich dabei Rechenregeln für Grenzwerte sowie Grenzwerte ausgewählter Zahlenfolgen. Rechenregeln für Grenzwerte Seien {an } und {bn } konvergente Folgen mit limn→∞ an = a und limn→∞ bn = b . Dann gilt: a) limn→∞ (an ± bn ) = limn→∞ an ± limn→∞ bn = a ± b b) limn→∞ (c · an ) = c · limn→∞ an = c · a für c ∈ R c) limn→∞ (an · bn ) = limn→∞ an · limn→∞ bn = a · b d) limn→∞ (an /bn ) = limn→∞ an / limn→∞ bn = a/b, falls bn 6= 0 und b 6= 0 e) limn→∞ (an )r = (limn→∞ an )r = ar mit r ∈ R, falls an ≥ 0 f) limn→∞ |an | = |a| Beispiel 4.15: Grenzwerte ausgewählter Zahlenfolgen 0 für − 1 < q < 1 n lim q = n→∞ 1 für q=1 Für q > 1 besitzt {q n } den uneigentlichen Grenzwert +∞. Für q ≤ −1 ist diese Folge divergent. 1 n lim 1 + = 2.71828 . . . = e (Eulersche Zahl) n→∞ n x n lim 1 + = ex n n→∞ n lim n→∞ lim n→∞ a =0 n! √ n a=1 (a > 0, fest) (a > 0, fest) , lim n→∞ √ n n=1 52 4.4 Unendliche Reihen 4.4.1 Konvergenz unendlicher Reihen Aus der Folge {an } kann mittels der Vorschrift: sn = a0 + a1 + . . . + an (d.h. s0 = a0 , s1 = a0 + a1 , s2 = a0 + a1 + a2 , . . .) eine neue Folge {sn } gebildet werden. Die Glieder sn werden auch Partialsummen der Folge {an } genannt. Mit Hilfe dieser Partialsummen wird die Konvergenz unendlicher Reihen erklärt. Definition 4.7: Sei {an } eine Folge und {sn } die Folge ihrer Partialsummen (n ∈ N oder n ∈ N∗ ). ∞ P Besitzt die Folge {sn } einen Grenzwert s, d.h. gilt limn→∞ sn = s, dann ist die unendliche Reihe an ∞ P (bzw. n=0 an ) konvergent und hat den Wert (die Summe) s. n=1 ∞ P Anderenfalls ist die unendliche Reihe ∞ P an (bzw. n=0 an ) divergent. n=1 Der Kürze halber wird im weiteren anstelle des Begriffes unendliche Reihe“ der Begriff Reihe“ verwendet. ” ” Beispiel 4.16: ∞ ∞ P P 1 1 1 1 a) Sei an = an = (n ∈ N∗ ). Die Reihe = + + . . . ist konvergent16 n(n + 1) 1·2 n=1 n(n + 1) n=1 2·3 und hat den Wert s = 1. b) Sei an = 1 n (n ∈ N∗ ). Die Reihe ∞ P an = n=1 ∞ P 1 n=1 n = 1 1 + 1 2 + 1 3 + . . . heißt harmonische Reihe. Für die Folge sn der Partialsummen dieser Reihe gilt: limn→∞ sn = ∞, d.h. diese Reihe ist divergent17 . c) Sei an = (−1)n für n ∈ N. Dann gilt: ∞ P an = 1 − 1 + 1 − 1 ± . . . . n=0 Wegen sn = 1 für n gerade 0 für n ungerade besitzt die Folge {sn } keinen Grenzwert, d.h. die Reihe ∞ P an n=0 ist divergent. Aus den im Abschnitt 4.2.2 behandelten geometrischen Folgen lässt sich der Begriff der geometrischen Reihe ableiten. Nachfolgend werden Konvergenzuntersuchungen für geometrische Reihen durchgeführt. Gegeben sei eine geometrische Folge {an } mit dem Anfangsglied a0 = 1 und dem Quotienten q, d.h. {an } = {1, q, q 2 , q 3 , . . .}. Aus dieser Folge kann die geometrische Reihe ∞ X an = n=0 ∞ X qn = 1 + q + q2 + q3 + . . . n=0 gebildet werden. Um zu untersuchen, ob diese Reihe konvergiert, wird die Folge {sn } der Partialsummen betrachtet. Zunächst werden die Partialsummen sn berechnet. Es gilt: sn = 1 + q + q 2 + q 3 + . . . + q n qsn = q + q 2 + q 3 + . . . + q n + q n+1 . Subtraktion dieser Gleichungen ergibt: (1 − q)sn = 1 − q n+1 , Umformen nach sn liefert für q 6= 1: sn = 1 − q n+1 1−q (Summenformel für die n-te Partialsumme der geometrischen Reihe). Für q = 1 gilt: sn = 1 + q + q 2 + q 3 + . . . + q n = 1 + 1 + 12 + 13 + . . . + 1n = n + 1 . Nun ist zu untersuchen, ob die Folge {sn } einen Grenzwert besitzt. 16 17 zum Beweis siehe z.B.: P. S TINGL . Mathematik für Fachhochschulen, 8. Auflage, S. 101 zum Beweis siehe z.B.: P. S TINGL . Mathematik für Fachhochschulen, 8. Auflage, S. 102 53 (59) 1. Fall: Sei |q| < 1. Dann gilt laut Summenformel (59): 1 − q n+1 1 1 1 = · lim (1 − q n+1 ) = · (1 − 0) = ⇒ Konvergenz! n→∞ 1 − q n→∞ 1−q 1−q 1−q lim sn = lim n→∞ 2. Fall: Sei q ≥ 1. Für q = 1 gilt: limn→∞ sn = limn→∞ (n + 1) = ∞, d.h. Divergenz. Für q > 1 gilt: 1 − q n+1 1 = · lim (1 − q n+1 ) = ∞ ⇒ ebenfalls Divergenz n→∞ 1 − q 1 − q n→∞ lim sn = lim n→∞ 3. Fall: Sei q ≤ −1. Gemäß Summenformel gilt zunächst wieder: 1 − q n+1 1 = · lim (1 − q n+1 ) n→∞ 1 − q 1 − q n→∞ lim sn = lim n→∞ Die Folge {q n+1 } ist unbestimmt divergent (da Vorzeichenwechsel und Beträge der Folgenglieder > 1) ⇒ die Folge {sn } ist ebenfalls unbestimmt divergent. Zusammmenfassung: Konvergenzverhalten geometrischer Reihen ∞ P Die geometrische Reihe q n ist nur für |q| < 1 konvergent. Sie hat dann den Wert n=0 1 1−q . Verallgemeinerung: Wird aus der geometrischen Folge {an } = {a0 , qa0 , q 2 a0 , . . .} (a0 ∈ R \ {0}) eine geometrische Reihe gebildet, so konvergiert diese ebenfalls nur für |q| < 1. Die Summe dieser Reihe ∞ ∞ ∞ P P P 1 kann dann wie folgt berechnet werden: an = (q n · a0 ) = a0 · q n = a0 · . n=0 n=0 n=0 1−q Beispiel 4.17: 4.4.2 Konvergenzkriterien für Reihen Nachdem im vorangegangenen Abschnitt das Konvergenzverhalten geometrischer Reihen untersucht wurde, sollen jetzt Konvergenzkriterien für allgemeine“ unendliche Reihen angegeben werden. ” Die Überprüfung der Konvergenz einer Reihe gemäß Definition 4.7 ist nicht immer leicht durchführbar, da sich die Untersuchung des Konvergenzverhaltens der Folge {sn } schwierig gestalten kann. Alternativ kann man (zumindest für Reihen mit nichtnegativen Gliedern) Aussagen über die Konvergenz gewinnen, indem ein Vergleich mit Reihen vorgenommen wird, deren Konvergenzverhalten bekannt ist. ∞ P Majorantenkriterium: Es gelte an , bn ≥ 0 für n ∈ N und die Reihe an sei konvergent. n=0 Falls 0 ≤ bn ≤ an für alle n (oder zumindest ab einem bestimmten Index n0 ) gilt, dann konvergiert ∞ P auch die Reihe bn . Die Reihe ∞ P n=0 an ist eine konvergente Majorante zu der Reihe n=0 ∞ P bn . n=0 Beispiel 4.18: Minorantenkriterium: Es gelte an ≥ 0 für n ∈ N und die Reihe für alle n (oder ab n0 ) gilt, dann ist auch die Reihe Die Reihe ∞ P ∞ P n=0 bn divergent. n=0 an ist eine divergente Minorante zu der Reihe n=0 ∞ P n=0 54 ∞ P bn . an sei divergent. Falls bn ≥ an Beispiel 4.19: Als Vergleichskriterium bei Anwendung des Majoranten- oder Minorantenkriteriums kann ggf. auch die Reihe ∞ X 1 a n n=1 (a ∈ R) herangezogen werden. Diese Reihe ist konvergent für a > 1 und divergent für a ≤ 1. (Für a = 1 ergibt sich genau die harmonische Reihe, siehe Beispiel 4.16b)). Weitere Konvergenzaussagen sind möglich mit Hilfe der folgenden Kriterien. Quotientenkriterium: ∞ X a Falls lim n+1 = q < 1 gilt, ist die Reihe an konvergent. n→∞ an Wenn gilt: q > 1, dann ist die Reihe n=0 ∞ X an divergent. n=0 In dem Fall q = 1 liefert das Kriterium keine Aussage. Beispiel 4.20: Wurzelkriterium: ∞ p X Falls lim n |an | = q < 1 gilt, ist die Reihe an konvergent. n→∞ Wenn gilt: q > 1, dann ist die Reihe n=0 ∞ X an divergent. n=0 In dem Fall q = 1 liefert das Kriterium keine Aussage. Beispiel 4.21: 55 Leibnizsches Konvergenzkriterium: ∞ P Sei an eine alternierende Reihe, d.h. ihre Glieder an besitzen abwechselnd positive und negative n=0 Vorzeichen. Wenn die Folge {|an |} eine monoton fallende Nullfolge ist, dann ist die Reihe konvergent. Beispiel 4.22: Bemerkungen: ∞ P - Die genannten Kriterien wurden für Reihen Weise für Reihen an (d.h. für den Fall n ∈ N) formuliert. Sie gelten in gleicher n=0 ∞ P an (d.h. für n ∈ N∗ ). n=1 - Mit Hilfe der aufgeführten Kriterien kann festgestellt werden, ob die entsprechende Reihe konvergiert. Die Berechnung der Summe der Reihe (falls diese gesucht ist) muss gesondert erfolgen. - Um die Divergenz einer Reihe zu begründen, kann die folgende Aussage herangezogen werden: ∞ P Falls limn→∞ an 6= 0 ⇒ an ist divergent (d.h. wenn die Glieder an der Reihe keine Nullfolge bilden, n=0 liegt zwangsläufig Divergenz der Reihe vor). - Bisher wurden nur solche Reihen untersucht, die aus reellen Zahlen gebildet werden. Im Kapitel 5 werden Potenzreihen und Taylorreihen eingeführt. Abschließend wird noch ein Beispiel für Folgen und Reihen betrachtet. Beispiel 4.23: ( Schneeflockenkurve“ oder KOCHsche Schneeflocke“)18 ” ” Simulation des Umrisses einer Schneeflocke: q q q Bild 4.2 Bildungsgesetz für die Folge der Figuren in Bild 4.2: jede Dreiecksseite in drei gleiche Teile teilen, an das mittlere Drittel ein neues gleichseitiges Dreieck anfügen n 4 Umfang der Figuren: die n-te Kurve (n ≥ 0) hat die Länge Un = 3 · (Voraussetzung: Ausgangsdreieck 3 habe die Seitenlänge 1). Dann gilt: limn→∞ Un = ∞ . Flächeninhalt: Der Inhalt Fn der Fläche, die von der n-ten Kurve eingeschlossen wird, beträgt: √ √ n−1 k 3 3 X 4 Fn = + · 4 12 9 k=0 (Flächeninhalt des Ausgangsdreiecks + Inhalte der neu hinzukommenden kleinen“ Dreiecke). ” 4 Damit gilt (nach der Summenformel für die unendliche geometrische Reihe mit q = und a1 = 1): 9 "√ √ n−1 k # √ √ √ √ ∞ k X X 3 3 4 3 3 4 3 3 2√ 1 lim Fn = lim + · = + · = + · = 3. n→∞ n→∞ 4 12 9 4 12 9 4 12 1 − 49 5 k=0 k=0 Es liegt also die bemerkenswerte Eigenschaft vor, dass für n → ∞ die Länge der n-ten Kurve unendlich, der Inhalt der eingeschlossenen Fläche jedoch endlich ist. 18 Quelle: K. D ÜRRSCHNABEL. Mathematik für Ingenieure, 2. Auflage, S. 378-379 56 5 Differentialrechnung für Funktionen einer reellen Variablen Die zentrale Fragestellung in der Differentialrechnung ist die Berechnung lokaler Veränderungen von Funktionen. Die Differentialrechnung - wie auch die Integralrechnung (siehe Kapitel 6) - finden vielfach Anwendung bei der Lösung naturwissenschaftlich-technischer Problemstellungen. 5.1 Darstellung ebener Kurven 5.1.1 Parameterdarstellung von Kurven Die Veranschaulichung einer Funktion y = f (x) in einem kartesischen Koordinatensystem erfolgt häufig so, dass die Kurve dieser Funktion als Menge von Punkten P mit den Koordinaten (x, y) = (x, f (x)) dargestellt wird. Eine andere - und in vielen Anwendungssituationen zweckmäßigere - Darstellungsmöglichkeit ist die folgende: Mittels der Hilfsvariablen t (t1 ≤ t ≤ t2 ) werden die Punkte der Kurve dargestellt als P = P (x(t), y(t)) . Das System der beiden Gleichungen x = x(t) , y = y(t) (t1 ≤ t ≤ t2 ) (60) heißt Parameterdarstellung der Kurve. Mit Hilfe von (60) kann z.B. die Bewegung eines Massepunktes auf einer Kurve beschrieben werden, wenn die Variable t als Zeit gedeutet wird. Die augenblickliche Lage des Punktes wird durch kartesische Koordinaten (x, y) angegeben, die jedoch zeitabhängig sind. Beispiel 5.1: (Parameterdarstellungen verschiedener Kurven) a) Die Gerade durch die Punkte P1 (x1 , y1 ) und P2 (x2 , y2 ) besitzt die Parameterdarstellung: x = x(t) = x1 + t(x2 − x1 ) , y = y(t) = y1 + t(y2 − y1 ) (t ∈ R) (vgl. auch Abschnitt 2.5.1, jetzt entfällt die z-Koordinate). b) Die Ellipse mit der Gleichung: x2 y2 + = 1 (siehe Bild 5.1) hat die Parameterdarstellung: a2 b2 x = x(t) = a cos t , y = y(t) = b sin t (0 ≤ t ≤ 2π) . y6 b P (x(t), y(t)) q t −a - a x 0 −b Bild 5.1: Ellipse mit Hauptkreis Dem Parameterwert t = 0 entspricht der Punkt der Ellipse, welcher die kartesischen Koordinaten (a, 0) besitzt, denn es gilt: x(0) = a cos 0 = a, y(0) = b sin 0 = 0. In dem speziellen Fall a = 1, b = 1 ergibt sich die Parameterdarstellung des Einheitskreises: x = x(t) = cos t , y = y(t) = sin t (0 ≤ t ≤ 2π) . c) Für einige technische Anwendungen sind Rollkurven“ von Interesse. Im folgenden wird der Fall betrachtet, ” dass ein Kreis vom Radius R auf einer Geraden abrollt (entspricht z.B. der Situation, dass ein Rad auf einer Ebene rollt, ohne zu gleiten)19 . 19 Quelle: A. F ETZER , H. F R ÄNKEL: Mathematik 2: Lehrbuch für ingenieurwissenschaftliche Studiengänge, 6. Auflage, S. 6 57 Sei P ein Punkt auf der Peripherie dieses Kreises. Seine Lage soll in Abhängigkeit vom Drehwinkel t beschrieben werden. Zu Beginn der Bewegung (d.h. für t = 0) sei P der Berührungspunkt von Kreis und Gerade. Das Koordinatensystem wird entsprechend Bild 5.2 gewählt. y 6 t=π v R P v v v πR t = 2π 2πR - x Bild 5.2 Wenn der Kreis auf der Geraden abrollt, dann hebt sich “ der Punkt von der x-Achse, hat nach einer hal” ben Umdrehung (t = π) einen maximalen y-Wert und ist nach einer vollen Umdrehung (t = 2π) wieder Berührungspunkt von Kreis und Gerade. Die entstehende Rollkurve“ wird als (gewöhnliche) Zykloide be” zeichnet. Die Position des Punktes P lässt sich mit Hilfe der Parameterdarstellung der Zykloide beschreiben: x = x(t) = R t − R sin t , y = y(t) = R − R cos t (t ≥ 0) . Von einer Parameterdarstellung x = x(t), y = y(t) kann man nur dann zu einer expliziten Darstellung (Funktionsgleichung) y = f (x) oder x = g(y) übergehen, wenn mindestens eine der beiden Gleichungen eindeutig nach t auflösbar ist. Beispiel 5.2: 5.1.2 Darstellung von Kurven in Polarkoordinaten Bisher wurde die Lage eines Punktes P der Ebene ausschließlich durch kartesische Koordinaten beschrieben. In bestimmten Fällen erweist es sich jedoch als günstiger, Polarkoordinaten zu verwenden. Die Polarkoordinaten eines Punktes P (x, y) der Ebene werden mit (r, ϕ) bezeichnet, wobei r und ϕ wie folgt anschaulich zu erklären sind. y6 y0 rP r ϕ O x0 r: Abstand des Punktes P vom Koordinatenursprung O - ϕ: Winkel zwischen dem vom Koordinatenursprung O zum Punkt P gerichteten Radiusvektor und der positiven x-Achse (siehe Bild 5.3) x Bild 5.3 58 Es gilt stets r ≥ 0. Der Winkel ϕ ist nur bis auf ganzzahlige Vielfache von 2π eindeutig bestimmt. In der Regel wählt man ϕ so, dass 0 ≤ ϕ < 2π gilt. Umrechnung: Polarkoordinaten → kartesische Koordinaten x = r · cos ϕ, y = r · sin ϕ Umrechnung: kartesische Koordinaten → Polarkoordinaten x , falls y ≥ 0 arccos r p x r = x2 + y 2 , ϕ = 2π − arccos , falls y < 0 r unbestimmt falls r = 0. Beispiel 5.3: Die Darstellung einer Kurve in Polarkoordinaten hat allgemein die Form: r = f (ϕ) (ϕ1 ≤ ϕ ≤ ϕ2 ) . oder r = r(ϕ) Daraus resultiert die folgende Parameterdarstellung mit dem Polarwinkel ϕ als Parameter: x = x(ϕ) = r(ϕ) · cos ϕ , y = y(ϕ) = r(ϕ) · sin ϕ (ϕ1 ≤ ϕ ≤ ϕ2 ) . Beispiel 5.4: a) Ein Kreis mit dem Mittelpunkt im Koordinatenursprung und dem Radius c (c ∈ R, c > 0) hat in Polarkoordinaten die Darstellung: r = c (d.h. in diesem Fall ist r eine konstante Funktion bezüglich ϕ). b) Archimedische Spirale y 6 Darstellung in Polarkoordinaten: r = aϕ , ϕ ∈ [0, ∞) , a > 0 , a ∈ R 2aπ Bei der Archimedischen Spirale vergrößert sich der Abstand vom Mittelpunkt mit jeder Umdrehung um die additive Konstante 2aπ (siehe Bild 5.4). - x Bild 5.4 c) Kardioide y Darstellung in Polarkoordinaten: 6 r = a(1 + cos ϕ) , a > 0 , ϕ ∈ [0, 2π) Eine Kardioide (siehe Bild 5.5) entsteht als Bahn eines Punktes P , wenn ein Kreis auf der Außenseite eines anderen, festen Kreises abrollt, wobei beide Kreise den gleichen Radius besitzen. 59 - x Bild 5.5 5.2 Grenzwert und Stetigkeit einer Funktion 5.2.1 Grenzwerte Durch das folgende Beispiel soll die Einführung des Grenzwertbegriffes motiviert werden. Beispiel 5.5: Es wird das Verhalten der Funktion f (x) = x2 bei einer beliebig feinen Annäherung an die Stelle x0 = 2 untersucht. Annäherung von links: Es wird eine Folge von x-Werten betrachtet, die von links gegen die Zahl 2 konvergiert: {xn } = {1.9, 1.99, 1.999, 1.9999, . . .}. Jedem Glied dieser Folge wird durch die Funktionsgleichung f (x) = x2 genau ein Funktionswert zugeordnet: f (xn ) = x2n . Dadurch entsteht die Wertetabelle: xn f (xn ) 1.9 3.61 1.99 3.9601 1.999 3.996001 1.9999 3.99960001 ... ... Man erkennt, dass die Folge der Funktionswerte {f (xn )} gegen den Wert 4 konvergiert. Für jede andere, von links gegen die Zahl 2 konvergierende Folge {xn } würde man dasselbe Ergebnis erhalten. Annäherung von rechts: Es wird eine Folge von x-Werten betrachtet, die von rechts gegen die Zahl 2 konvergiert: {xn } = {2.1, 2.01, 2.001, 2.0001, . . .}. Die zugehörigen Funktionswerte f (xn ) sind: xn f (xn ) 2.1 4.41 2.01 4.0401 2.001 4.004001 2.0001 4.00040001 ... ... Die Folge {f (xn )} strebt wiederum gegen den Wert 4. In diesem Beispiel stimmen die beiden Grenzwerte von links und von rechts überein. Man schreibt: limx→2 x2 = 4 und spricht von dem Grenzwert der Funktion f (x) = x2 an der Stelle x0 = 2. Im folgenden werden Grenzwerte von Funktionen für x → x0 (x0 ∈ R) sowie für x → ∞ (bzw. x → −∞) betrachtet. a) Grenzwert einer Funktion für x → x0 (x0 ∈ R) Definition 5.1: Eine Funktion f (x) sei in einer Umgebung der Stelle x0 definiert. Gilt dann für jede im Definitionsbereich dieser Funktion liegende und gegen x0 konvergierende Zahlenfolge {xn } stets: lim f (xn ) = g , n→∞ dann heißt g der Grenzwert von f (x) an der Stelle x0 . Schreibweise: limx→x0 f (x) = g Gilt für jede von links her gegen x0 strebende Folge {xn }: lim f (x) = gl , x→x0 −0 so heißt gl der linksseitige Grenzwert von f (x) für x → x0 . Analog dazu ist der rechtsseitige Grenzwert definiert: lim f (x) = gr . x→x0 +0 Die Funktion f (x) besitzt an der Stelle x0 den Grenzwert g, wenn gilt: lim f (x) = x→x0 −0 lim f (x) = g x→x0 +0 (d.h. wenn der links- und der rechtsseitige Grenzwert übereinstimmen). 60 Beispiel 5.6: (I) Die Funktion y = f (x) = 0 für x < 0 besitzt an der Stelle x0 = 0 keinen Grenzwert, 1 für x ≥ 0 da der linksseitige Grenzwert nicht mit dem rechtsseitigen Grenzwert übereinstimmt: gl = lim f (x) = x→0−0 gr = lim f (x) = x→0+0 y 6 lim 0 = 0 x→0−0 1r lim 1 = 1 x→0+0 x 0 (II) Die Funktion y = f (x) = x2 − 2x ist an der Stelle x0 = 2 nicht definiert. x−2 Sie besitzt an dieser Stelle jedoch einen Grenzwert: lim x→2 x(x − 2) x2 − 2x = lim = lim x = 2. x→2 x→2 x−2 x−2 (III) Die Funktion y = f (x) = tan x ist an der Stelle x0 = Dort ist auch kein Grenzwert vorhanden, denn es gilt: gl = lim tan x = ∞, x→ π2 −0 gr = π 2 y6 nicht definiert. lim tan x = −∞. x→ π2 +0 π 2 Außerdem sei bemerkt, dass es sich sowohl bei dem linksseitigen als auch bei dem rechtsseitigen Grenzwert dieser Funktion um uneigentliche Grenzwerte handelt. (IV) Die Funktion y = f (x) = sin 1 x ist an der Stelle x0 = 0 x y 6 1 nicht definiert und besitzt dort auch keinen Grenzwert, da die Funktionswerte bei Annäherung an x0 ständig zwischen −1 und 1 schwanken. −0.25 0 0.25 x −1 b) Grenzwert einer Funktion für x → ∞ bzw. x → −∞ Definition 5.2: Wenn für jede im Definitionsbereich der Funktion f (x) liegende Zahlenfolge {xn } mit limn→∞ xn = ∞ (bzw. limn→∞ xn = −∞) die Folge der Funktionswerte {f (xn )} gegen eine Zahl g strebt, dann heißt g der Grenzwert von f (x) für x → ∞ (bzw. x → −∞). Schreibweise: limx→∞ f (x) = g (bzw. limx→−∞ f (x) = g ) Beispiel 5.7: Bei der Berechnung von Grenzwerten von Funktionen (sowohl im Fall a) als auch im Fall b)) erweisen sich neben geeigneten Umformungen - die folgenden Rechenregeln für Grenzwerte (siehe nächste Seite) als hilfreich. 61 Rechenregeln für Grenzwerte von Funktionen Unter der Voraussetzung, dass die jeweiligen Grenzwerte existieren, gelten die folgenden Regeln (sie sind entsprechend auch für Grenzwerte mit x → ∞ bzw. x → −∞ gültig): 1. limx→x0 [C · f (x)] = C · (limx→x0 f (x)) (C: Konstante) 2. limx→x0 [f (x) ± g(x)] = limx→x0 f (x) ± limx→x0 g(x) 3. limx→x0 [f (x) · g(x)] = (limx→x0 f (x)) · (limx→x0 g(x)) f (x) limx→x0 f (x) = (limx→x0 g(x) 6= 0) 4. limx→x0 g(x) limx→x0 g(x) p p n f (x) = n limx→x0 f (x) (n ∈ N) 6. limx→x0 [f (x)]n = (limx→x0 f (x))n 7. limx→x0 af (x) = alimx→x0 f (x) (n ∈ N) 5. limx→x0 8. limx→x0 [loga f (x)] = loga (limx→x0 f (x)) Beispiel 5.8: Beispiel 5.9:20 Wenn an einen schwingfähigen Körper (Masse m, Eigenkreisfrequenz ω0 ) eine periodisch veränderliche Kraft (Erregerkreisfrequenz ω, Amplitude a0 ) angreift, so ist die Amplitude im stationären Zustand (nach der Einschwingzeit) gegeben durch: a = a(ω) = p a0 m2 (ω02 − ω 2 )2 + b2 ω 2 , ω > 0 ; b > 0 : Reibungskonstante . Es gilt dann: lim a(ω) = ω→0+0 limω→0+0 a0 a0 a0 p =p = mω02 m2 (ω02 − ω 2 )2 + b2 ω 2 limω→0+0 [m2 (ω02 − ω 2 )2 + b2 ω 2 ] sowie limω→∞ a(ω) = 0. Bei fehlender Dämpfung (d.h. b = 0) gilt: limω→ω0 a(ω) = ∞ , d.h. die Funktion a(ω) besitzt für b = 0 an der Stelle ω0 den uneigentlichen Grenzwert ∞ (physikalische Deutung: Resonanz). Grenzwerte ausgewählter Funktionen 1 x limx→±∞ 1 + =e limx→∞ √ x x p x = e p (p ∈ R) limx→±∞ 1 + x=1 limx→∞ limx→0 ex − 1 =1 x limx→0 limx→0 sin(ax) = a (a ∈ R) x limx→∞ 20 √ x x a = 1 (a > 0) ln(1 + x) =1 x sin x =0 x Quelle: A. F ETZER , H. F R ÄNKEL: Mathematik 1: Lehrbuch für ingenieurwiss. Studiengänge, 10. Auflage, S. 127-128 62 Bemerkung: Grenzwerte, die auf unbestimmte Ausdrücke der Form rechnung behandelt werden (siehe Abschnitt 5.4.4). 5.2.2 0 0 oder ∞ ∞ führen, können mit Mitteln der Differential- Asymptoten Wenn die Kurve einer Funktion sich einer Geraden beliebig nähert, so wird diese Gerade als Asymptote bezeichnet. Man unterscheidet dabei: a) vertikale Asymptoten Die Gerade x = x0 heißt vertikale Asymptote der Kurve y = f (x), wenn beim Grenzübergang x → x0 + 0 oder x → x0 − 0 die Funktionswerte gegen ∞ oder −∞ streben. Beispiel 5.10: π Die Gerade x = ist eine vertikale Asymptote der Funktion f (x) = tan x (siehe Beispiel 5.6(III)). 2 b) horizontale Asymptoten Die Gerade y = c wird horizontale Asymptote der Kurve y = f (x) genannt, wenn limx→∞ f (x) = c oder limx→−∞ f (x) = c (c ∈ R) gilt. Beispiel 5.11: c) schräge Asymptoten Als schräge Asymptote der Kurve y = f (x) bezeichnet man die Gerade y = ax + b, falls a 6= 0 und lim (f (x) − ax − b) = 0 (61) x→∞ gilt. Zur Berechnung der schrägen Asymptote nutzt man: f (x) b lim (f (x) − ax − b) = lim x −a− = 0. x→∞ x→∞ x x f (x) b b Da x gegen ∞ strebt, muss limx→∞ −a− = 0 gelten und wegen limx→∞ = 0 ergibt sich: x x f (x) = a. x→∞ x lim x (62) Nachdem a berechnet wurde, erhält man für b auf Grund von (61): lim (f (x) − ax) = b . (63) x→∞ Bezüglich der schrägen Asymptote für x → −∞ gelten analoge Überlegungen. In bestimmten Fällen kann die Berechnung der schrägen Asymptote auch mittels Polynomdivision erfolgen, siehe dazu Beispiel 5.12(II). Beispiel 5.12: Zusammenfassend kann die folgende Aussage getroffen werden: Um zu überprüfen, ob die Kurve einer Funktion y = f (x) horizontale oder schräge Asymptoten besitzt, muss das Verhalten der Funktion f (x) für x → ∞ und x → −∞ untersucht werden. Zur Bestimmung vertikaler Asymptoten einer Funktionskurve muss festgestellt werden, ob die Funktion an einer Stelle x0 (oder auch an mehreren Stellen) den uneigentlichen Grenzwert ∞ oder −∞ besitzt. (Darauf wird im Abschnitt 5.2.4 nochmals eingegangen.) 63 5.2.3 Stetigkeit einer Funktion Definition 5.3: Eine in x0 und in einer gewissen Umgebung von x0 definierte Funktion f (x) heißt an der Stelle x0 stetig, wenn der Grenzwert limx→x0 f (x) existiert und limx→x0 f (x) = f (x0 ) gilt. Eine Funktion, die an jeder Stelle ihres Definititionsbereiches stetig ist, wird als stetige Funktion bezeichnet. Beispiel 5.13: In den Fällen, wo nur ein einseitiger Grenzwert existiert (vgl. dazu auch Abschnitt 5.2.1), spricht man von einseitiger Stetigkeit der Funktion an der entsprechenden Stelle. Definition 5.4: Eine in x0 definierte Funktion f (x) heißt an der Stelle x0 linksseitig stetig (bzw. rechtsseitig stetig), wenn der linksseitige Grenzwert gl = limx→x0 −0 f (x) (bzw. der rechtsseitige Grenzwert gr = limx→x0 +0 f (x)) existiert und gl = f (x0 ) (bzw. gr = f (x0 )) gilt. Beispiel 5.14: Schließlich wird noch der Begriff der unstetigen Funktion eingeführt. Definition 5.5: Eine in x0 und in einer gewissen Umgebung von x0 definierte Funktion f (x) heißt an der Stelle x0 unstetig, wenn eine der folgenden Aussagen zutrifft: (1) Es gilt: limx→x0 f (x) 6= f (x0 ) (d.h. Grenzwert und Funktionswert in x0 sind verschieden). (2) Der Grenzwert von f (x) an der Stelle x0 ist nicht vorhanden. (Mit anderen Worten: eine Funktion ist unstetig an der Stelle x0 , wenn dort eine der Bedingungen für die Stetigkeit, siehe Definition 5.3, nicht erfüllt ist.) Beispiel 5.15: a) Die Funktion y = f (x) = 0 für x < 0 a für x ≥ 0 y 6 mit a ∈ R (siehe Bild 5.6) besitzt an der Stelle x0 = 0 keinen Grenzwert, da der linksseitige Grenzwert nicht mit dem rechtsseitigen Grenzwert übereinstimmt. Sie besitzt dort eine Sprungunstetigkeit. Die Funktion f (x) ist jedoch einseitig stetig, und zwar rechtsseitig stetig an der Stelle x0 = 0, denn es gilt: gr = limx→0+0 f (x) = limx→0+0 a = a = f (0). a r x 0 Bild 5.6 y 6 b) Die im Bild 5.7 dargestellte Funktion y = f (t) (in der Elektrotechnik als Sägezahnimpuls“ ” bezeichnet) besitzt an den Stellen T, 2T, 3T, . . . jeweils eine Sprungunstetigkeit. 0 T 2T Bild 5.7 64 3T t −1 für x < 0 0 für x = 0 c) Die Funktion y = f (x) = 1 für x > 0 y 6 (siehe Bild 5.8) ist an der Stelle x0 = 0 unstetig, da sie dort keinen Grenzwert besitzt: gl = lim f (x) = x→0−0 gr = lim f (x) = x→0+0 lim (−1) = −1 lim 1 = 1 r 0 x −1 x→0−0 x→0+0 1 ⇒ gl 6= gr . Bild 5.8 Die Funktion f (x) hat an dieser Stelle eine Sprungunstetigkeit. Diese Funktion ist in x0 = 0 weder rechtsseitig noch linksseitig stetig, denn es gilt: gl 6= f (0) sowie gr 6= f (0). Unter einer Definitionslücke einer Funktion f (x) versteht man eine nicht zum Definitionsbereich von f gehörige Stelle, wobei jedoch links und rechts dieser Stelle Funktionswerte definiert sind (siehe dazu auch Beispiel 5.16). Funktionen mit Definitionslücken können ggf. durch nachträgliche Festsetzung von Funktionswerten zu einer stetigen Funktion ergänzt werden. Beispiel 5.16: Allgemein gilt die folgende Aussage: Behebung von Definitionslücken Eine Definitionslücke einer Funktion f (x) an der Stelle x0 lässt sich beheben, wenn der Grenzwert von f (x) in x0 vorhanden ist. Der fehlende Funktionswert wird gleich diesem Grenzwert gesetzt. Beispiel 5.17: 5.2.4 Eigenschaften gebrochenrationaler Funktionen Definition 5.6: Funktionen, die als Quotient zweier Polynome darstellbar sind, heißen gebrochenrationale Funktionen: f (x) = am xm + am−1 xm−1 + . . . + a1 x + a0 g(x) = , h(x) bn xn + bn−1 xn−1 + . . . + b1 x + b0 wobei m, n ∈ N sowie ai , bj ∈ R für 0 ≤ i ≤ m und 0 ≤ j ≤ n. Gilt dabei: m < n, wird die Funktion als echt gebrochenrationale Funktion bezeichnet. Im Fall m ≥ n heißt die Funktion unecht gebrochenrational. Beispiel 5.18: 65 (64) Jede unecht gebrochenrationale Funktion kann durch Polynomdivision in ein Polynom vom Grad m − n und eine echt gebrochenrationale Funktion zerlegt werden. Fortsetzung zu Beispiel 5.18b): Definitionslücken (siehe auch Abschnitt 5.2.3) einer gebrochenrationalen Funktion sind alle diejenigen Stellen x0 mit h(x0 ) = 0, d.h. genau die Nullstellen des Nennerpolynoms. Gilt in einer Definitionslücke x0 zusätzlich: g(x0 ) = 0 (d.h. besitzt das Zählerpolynom in x0 ebenfalls eine Nullstelle), dann kann durch Kürzen des gemeinsamen Faktors (x − x0 ) die Definitionslücke ggf. behoben werden (siehe Beispiel 5.17 und Übung). Gilt jedoch h(x0 ) = 0 und g(x0 ) 6= 0, dann hat die Funktion f (x) in x0 einen Pol (auch Unendlichkeitsstelle genannt). In diesem Fall handelt es sich um eine nicht behebbare Definitionslücke. Definition 5.7: Eine Stelle, in deren unmittelbarer Umgebung die Funktionswerte über alle Grenzen hinaus wachsen oder fallen, heißt Pol. Als Nullstellen einer gebrochenrationalen Funktion bezeichnet man alle diejenigen Stellen x0 mit g(x0 ) = 0 und h(x0 ) 6= 0 (siehe auch (64)), d.h. das Zählerpolynom besitzt in x0 eine Nullstelle, während das Nennerpolynom einen von Null verschiedenen Wert hat. Beispiel 5.19: Bei der Funktion im Beispiel 5.19b) handelt es sich an der Stelle x0 = 0 um einen Pol mit Vorzeichenwechsel, während bei der Funktion im Beispiel 5.19c) ein Pol ohne Vorzeichenwechsel vorliegt. Allgemein gilt für einen Pol k-ter Ordnung (k-fache Nullstelle des Nennerpolynoms): falls k gerade ⇒ Pol ohne Vorzeichenwechsel falls k ungerade ⇒ Pol mit Vorzeichenwechsel. 66 Zusammenfassung: Definitionslücken, Pole und Nullstellen gebrochenrationaler Funktionen Sei f (x) = g(x) eine gebrochenrationale Funktion gemäß Definition 5.6. h(x) Um die Definitionslücken, Pole und Nullstellen dieser Funktion zu finden, empfiehlt es sich, für das Zählerpolynom g(x) und für das Nennerpolynom h(x) jeweils alle reellen Nullstellen zu ermitteln. Wenn zunächst vorausgesetzt wird, dass das Polynom g(x) die (nicht notwendigerweise verschiedenen) (g) (g) (g) reellen Nullstellen x1 , x2 , . . . , xm und das Polynom h(x) die (nicht notwendigerweise verschiedenen) (h) (h) (h) reellen Nullstellen x1 , x2 , . . . , xn besitzt, dann kann die daraus resultierende Produktdarstellung (Zerlegung in Linearfaktoren) von g(x) und h(x) genutzt werden, um die Funktion f (x) wie folgt darzustellen: (g) (g) (g) g(x) (x − x1 ) · (x − x2 ) · . . . · (x − xm ) f (x) = = . (h) (h) (h) h(x) (x − x1 ) · (x − x2 ) · . . . · (x − xn ) Daraus können die folgenden Aussagen abgeleitet werden: 1) Definitionslücken der Funktion f (x) befinden sich genau an den Nullstellen des Nennerpolynoms h(x), (h) (h) (h) d.h. an den Stellen x1 , x2 , . . . , xn . 2) Für jede Definitionslücke kann festgestellt werden, ob sie behebbar ist oder ob dort ein Pol vorliegt. (h) Diese Untersuchung wird beispielhaft für die Definitionslücke x1 erläutert. (h) (g) (g) (g) Wenn die Zahl x1 nicht zur Menge {x1 , x2 , . . . , xm } der Nullstellen des Zählerpolynoms g(x) (h) gehört, dann liegt an der Stelle x1 ein Pol vor, da die Berechnung des Grenzwertes limx→x(h) f (x) 1 (bzw. des entsprechenden links- oder rechtsseitigen Grenzwertes) auf ∞“ oder −∞“ führt. ” (h) (g) (g) (g) ” Wenn jedoch die Zahl x1 in der Menge {x1 , x2 , . . . , xm } der Nullstellen des Zählerpolynoms g(x) enthalten ist, dann kann bei der Berechnung des Grenzwertes limx→x(h) f (x) der Fak1 (h) (h) tor (x−x1 ) gekürzt werden (vgl. obige Darstellung von f (x)). Je nach Vielfachheit der Nullstelle x1 (h) im Zähler und im Nenner von f (x) kann an der Stelle x1 entweder eine behebbare Definitionslücke oder ein Pol vorliegen, siehe dazu Beispiel 5.17. (g) (g) (g) 3) Nullstellen der Funktion f (x) befinden sich an den Stellen x1 , x2 , . . . , xm (Nullstellen des Zählerpolynoms g(x)), sofern dort keine Definitionslücke vorliegt (prüfen!). Hinweis: Wenn das Zählerpolynom g(x) oder das Nennerpolynom h(x) nicht nur reelle, sondern auch komplexe Nullstellen besitzt (dieser Fall wurde bisher nicht betrachtet), dann kann für f (x) ebenfalls eine Darstellung mit Hilfe von Linearfaktoren (analog zur o.g. Darstellung) angegeben werden. Dabei gehören (g) (g) (g) (h) (h) (h) jedoch nicht alle Zahlen x1 , x2 , . . . , xm bzw. x1 , x2 , . . . , xn zur Menge der reellen Zahlen. Für die Feststellung der Definitionslücken, Pole und Nullstellen der Funktion f (x) sind jedoch nur die reellen Nullstellen des Zähler- und Nennerpolynoms entscheidend. Bemerkungen: - Ein Pol kann auch als Sprungstelle mit unendlicher Sprunghöhe angesehen werden. - Hat eine Funktion f (x) in x0 einen Pol, so besitzt die Kurve dieser Funktion in x0 eine vertikale Asymptote (vgl. Abschnitt 5.2.2). Im folgenden wird das Verhalten gebrochenrationaler Funktionen im Unendlichen betrachtet. a) echt gebrochenrationale Funktionen Jede echt gebrochenrationale Funktion nähert sich für x → ±∞ asymptotisch der x-Achse, da das Nennerpolynom infolge des höheren Polynomgrades betragsmäßig schneller anwächst als das Zählerpolynom. ⇒ horizontale Asymptote im Unendlichen: y = 0 (x-Achse) b) unecht gebrochenrationale Funktionen Jede unecht gebrochenrationale Funktion f (x) kann nach Polynomdivision als Summe einer ganzrationalen Funktion (Polynomfunktion) p(x) und einer echt gebrochenrationalen Funktion r(x) dargestellt werden: f (x) = p(x) + r(x). Für x → ±∞ strebt der Anteil r(x) gegen 0 (vgl. a)). ⇒ Für x → ±∞ nähert sich die Funktion f (x) der Polynomfunktion p(x). 67 Beispiel 5.20: a) Die echt gebrochenrationale Funktion f (x) = 2x + 8 nähert sich für x → ±∞ asymptotisch der x-Achse. x2 + 3 b) Für die unecht gebrochenrationale Funktion f (x) = f (x) = x3 gilt: 2(x − 1) x3 1 1 1 1 = (x2 + x + 1) + , d.h. p(x) = (x2 + x + 1) , r(x) = . 2(x − 1) 2 2(x − 1) 2 2(x − 1) Wegen limx→±∞ r(x) = 0 verhält sich die Funktion f (x) im Unendlichen annähend wie das Polynom p(x) = 21 (x2 + x + 1). 5.3 Differentialrechnung: Grundlagen 5.3.1 Differenzierbarkeit und erste Ableitung Definition 5.8: Die Funktion y = f (x) heißt an der Stelle x = x0 differenzierbar, wenn der Grenzwert limh→0 f (x0 + h) − f (x0 ) h existiert. Man bezeichnet ihn als erste Ableitung (oder Differentialquotient) von f (x) an der Stelle x = x0 . Schreibweise für die erste Ableitung von y = f (x): y 0 (x) oder dy dx bzw. f 0 (x) oder d f (x) dx häufig verwendete Schreibweise für die erste Ableitung von y = y(t): ẏ(t) Die ersten Ableitungen der elementaren Funktionen21 Funktion Ableitung Funktion c (Konstante) 0 arccos x Ableitung √ −1/ 1 − x2 xa (a ∈ R) axa−1 arctan x 1/(1 + x2 ) ex ex arccot x −1/(1 + x2 ) ax (a > 0) ax ln a sinh x cosh x ln x 1/x cosh x sinh x loga |x| 1/(x ln a) = (1/x) loga e tanh x 1/cosh2 x sin x cos x coth x cos x − sin x arsinh x tan x 1/ cos2 x = 1 + tan2 x arcosh x −1/sinh2 x √ 1/ 1 + x2 √ 1/ x2 − 1 cot x −1/ sin2 x = −(1 + cot2 x) √ 1/ 1 − x2 artanh x 1/(1 − x2 ) arcoth x −1/(x2 − 1) arcsin x 21 Dabei ist stets zu beachten, für welche reellen Zahlen x die Funktion bzw. ihre Ableitung definiert ist. 68 Die erste Ableitung einer Funktion kann auch geometrisch gedeutet werden. Dazu wird das folgende Tangentenproblem betrachtet: Gegeben sei eine Funktion f (x). Gesucht wird der Anstieg der Kurventangente an der Stelle x = x0 , d.h. im Kurvenpunkt P (x0 , f (x0 )). y 6 Sekante sQ f (x0 + h) Tangente in P f (x0 ) s x0 P x0 + h x Bild 5.9 Zur Lösung des Tangentenproblems: 1. In der Nachbarschaft von P wird ein weiterer Kurvenpunkt Q ausgewählt und die Sekante durch P und Q gezeichnet (siehe Bild 5.9). Der Anstieg dieser Sekante (nach der Zwei-Punkte-Gleichung der Geraden) ist: mS = f (x0 + h) − f (x0 ) f (x0 + h) − f (x0 ) = (x0 + h) − x0 h (Differenzenquotient) . 2. Wenn der Punkt Q entlang der Kurve auf den Punkt P zuwandert (Q → P ), so gilt gleichzeitig h → 0 und beim Grenzübergang fällt die Sekante in die (gesuchte) Tangente. ⇒ Anstieg mT der Tangente = Grenzwert der Sekantensteigung mS , d.h. f (x0 + h) − f (x0 ) h→0 h mT = lim (1. Ableitung oder Differentialquotient) Zwischen den Eigenschaften der Stetigkeit und der Differenzierbarkeit einer Funktion besteht der folgende Zusammenhang: Die Funktion f (x) ist in x0 differenzierbar ⇒ f (x) ist in x0 auch stetig. Aber: Die Umkehrung dieser Aussage gilt nicht, d.h. Stetigkeit ist nicht hinreichend für Differenzierbarkeit. Beispiel 5.21: 69 Ableitungsregeln für Funktionen einer reellen Variablen Faktorregel: (C · f (x))0 = C · f 0 (x) (C: Konstante) Summenregel: (f1 (x) + f2 (x) + . . . + fn (x))0 = f10 (x) + f20 (x) + . . . + fn0 (x) Produktregel: (u(x) · v(x))0 = u0 (x) · v(x) + u(x) · v 0 (x) Produktregel bei drei Faktorfunktionen: (u(x) · v(x) · w(x))0 = u0 (x) · v(x) · w(x) + u(x) · v 0 (x) · w(x) + u(x) · v(x) · w0 (x) 0 u0 (x) · v(x) − u(x) · v 0 (x) u(x) Quotientenregel: = 2 v(x) Kettenregel: [f (u(x))]0 = v (x) df du · = f 0 (u) · u0 (x) du dx (f 0 (u): äußere Ableitung, u0 (x): innere Ableitung) Ableitung der Umkehrfunktion: g 0 (y) = 1 , wobei f 0 (x) 6= 0 f 0 (x) (y = f (x) : umkehrbare Funktion, x = g(y) : nach x aufgelöste Form dieser Funktion) Ableitung einer in Parameterform gegebenen Funktion (Kurve): Die Kurve sei gegeben durch x = x(t), y = y(t) (t1 ≤ t ≤ t2 ), dann gilt: y 0 = Beispiel 5.22: 70 ẏ ẋ Wenn eine Funktion vom Typ f (x) = u(x)v(x) nach x differenziert werden soll, können die bisher aufgeführten Ableitungsregeln und Ableitungen elementarer Funktionen nicht angewendet werden, da die Variable x sowohl in der Basis als auch im Exponenten der Potenz auftritt. In solchen Fällen führt die logarithmische Differentiation zum Ziel. Formel für die logarithmische Differentiation Die Ableitung f 0 (x) einer Funktion f (x) = u(x)v(x) mit u(x) > 0 wird berechnet nach: u0 (x) 0 0 f (x) . f (x) = v (x) ln(u(x)) + v(x) u(x) (65) Begründung für Formel (65): Zunächst wird die Funktionsgleichung f (x) = u(x)v(x) logarithmiert, wodurch man unter Verwendung von Logarithmengesetzen erhält: ln(f (x)) = v(x) ln(u(x)) . Dann werden beide Seiten dieser Gleichung differenziert, wobei die Produktregel (auf der rechten Seite der Gleichung) und die Kettenregel (jeweils für die Ableitung der Terme ln(f (x)) und ln(u(x))) zur Anwendung kommt. Daraus ergibt sich f 0 (x) u0 (x) = v 0 (x) ln(u(x)) + v(x) f (x) u(x) und nach Multiplikation mit f (x) entsteht schließlich die Formel (65). Beispiel 5.23: 5.3.2 Das Differential einer Funktion und dessen Anwendung in der Fehlerrechnung Differential einer Funktion Die Funktion y = f (x) sei an der Stelle x0 differenzierbar. Für h 6= 0 nennt man das Produkt f 0 (x0 ) · h Differential der Funktion f an der Stelle x0 zum Zuwachs h. Schreibweise: dy = df (x0 ) = f 0 (x0 ) · h Das Differential dy einer differenzierbaren Funktion f mit y = f (x) an der Stelle x0 lässt sich als Zuwachs der Tangentenordinate für den Argumentzuwachs h deuten (siehe Bild 5.10). Das Differential einer an der Stelle x differenzierbaren Funktion kann auch in der Form df (x) = dy = f 0 (x) · dx geschrieben werden. y Q r 6 f (x0 + h) f (x) 6 f (x0 ) dy Pr ? h = dx x0 x0 + h x Bild 5.10 Für eine differenzierbare Funktion sei mit ∆y der Funktionszuwachs von f an der Stelle x bezeichnet, d.h. ∆y = f (x + h) − f (x) (vgl. auch Bild 5.10). Ersetzt man den Funktionszuwachs ∆y näherungsweise durch das Differential dy, dann erhält man: ∆y ≈ dy = f 0 (x)dx . Dieser Zusammenhang wird in der Fehlerrechnung genutzt. Die Zielstellung der Fehlerrechnung besteht darin, dass die Auswirkungen eines Fehlers der Messgröße x auf eine von x abhängige Größe untersucht werden (Fehlerfortpflanzung). 71 Anwendung des Differentials in der Fehlerrechnung Sei x eine Messgröße und y = f (x) eine von x abhängige (d.h. aus x zu berechnende) Größe. Die Messgröße x werde mit einem Messfehler von maximal |dx| gemessen. Dann gelten für den absoluten bzw. relativen Fehler von y die folgenden Schätzungen: absoluter Fehler: |∆y| ≈ |dy| ≤ |f 0 (x)| · |dx| ∆y dy f 0 (x) · |dx| relativer Fehler: ≈ ≤ y y y Beispiel 5.24: Bemerkung: Wenn die zu berechnende Größe von mehreren Messgrößen abhängt, ist ebenfalls eine Schätzung des absoluten und des relativen Fehlers möglich. Darauf wird im Kapitel 9 eingegangen. 5.3.3 Höhere Ableitungen Bisher wurden ausschließlich erste Ableitungen von Funktionen betrachtet. Falls die Ableitung f 0 (x) wiederum eine differenzierbare Funktion ist, dann erhält man durch nochmaliges Differenzieren die 2. Ableitung der Funktion f (x): f 00 (x) = d dx (f 0 (x)). Weiterhin ist auch die Schreibweise y 00 (x) oder d2 y dx2 oder d2 dx2 f (x) möglich. Falls die Funktion als y = y(t) gegeben ist, wird ihre 2. Ableitung auch mit ÿ bezeichnet. Allgemein gilt für die n-te Ableitung einer Funktion f (x): f (n) (x) = d dx (f (n−1) (x)). Für die n-te Ableitung einer Funktion ist auch die Schreibweise y (n) (x) oder Beispiel 5.25: 72 dn y dxn oder dn dxn f (x) möglich. 5.3.4 Der Mittelwertsatz der Differentialrechnung Mittelwertsatz der Differentialrechnung Die Funktion f (x) sei auf [a, b] stetig und auf (a, b) differenzierbar. Dann existiert mindestens eine Stelle ξ ∈ (a, b) mit f (b) − f (a) = f 0 (ξ) . b−a Der Mittelwertsatz kann geometrisch so gedeutet werden, dass im Intervall (a, b) mindestens ein Punkt P (ξ, f (ξ)) existiert, in dem die Steigung der Funktionskurve gleich der Steigung der Sekante durch die Punkte A(a, f (a)) und B(b, f (b)) ist. Beispiel 5.26: Es sei a > 0. Für die Funktion f (x) = 1 mit x ∈ [a, b] soll ein ξ ∈ (a, b) so bestimmt werden, dass x 1 √ −1 1 f (b) − f (a) = f 0 (ξ) ist. Man erhält b a = − 2 , woraus ξ = a · b folgt. b−a b−a ξ In diesem Fall ist ξ eindeutig bestimmt und gleich dem geometrischen Mittel der Abszissen der Randpunkte des Intervalls. Beispiel 5.27: Anwendung des Mittelwertsatzes in der Physik22 Sei s(t), t ∈ [t1 , t2 ], eine (auf diesem Intervall differenzierbare) Weg-Zeit-Funktion eines Massepunktes. Dann ist s(t2 ) − s(t1 ) die Durchschnittsgeschwindigkeit des Massepunktes während der Zeit von t1 bis t2 (vgl. t2 − t1 auch Beispiel 5.28). Der Mittelwertsatz besagt, dass es im Verlaufe der Bewegung des Massepunktes sicherlich einen Zeitpunkt ξ (t1 < ξ < t2 ) gab, zu dem die Momentangeschwindigkeit ṡ(ξ) gleich der Durchschnittsgeschwindigkeit war. Bemerkungen: - Über die genaue Lage der Stelle ξ kann im allgemeinen keine Aussage getroffen werden. Der Mittelwertsatz liefert nur eine Existenzaussage. - Der Mittelwertsatz wird des weiteren zum Nachweis von Aussagen zum Monotonieverhalten von Funktionen benötigt (siehe Abschnitt 5.4.2). 5.4 Anwendungen der Differentialrechnung 5.4.1 Anwendungen aus Physik und Technik Beispiel 5.28: Momentangeschwindigkeit eines Massepunktes23 Ein Massepunkt bewege sich entlang einer Geraden nach dem Gesetz s = s(t). Position zum Zeitpunkt t: s(t), Position zum Zeitpunkt t + ∆t: s(t + ∆t) = s(t) + ∆s (siehe Bild 5.11) t ∆t t + ∆t - s(t) ∆s s(t + ∆t) Bild 5.11 Die durchschnittliche Geschwindigkeit v in diesem Zeitraum beträgt ∆s s(t + ∆t) − s(t) = . ∆t ∆t Die Momentangeschwindigkeit zum Zeitpunkt t entsteht durch Grenzübergang ∆t → 0: v= v = lim ∆t→0 22 23 ∆s s(t + ∆t) − s(t) = lim = ṡ ∆t ∆t→0 ∆t Quelle: A. F ETZER , H. F R ÄNKEL, Mathematik 1: Lehrbuch für ingenieurwissenschaftliche Studiengänge, 10. Auflage, S. 391 Quelle: L. PAPULA . Mathematik für Ingenieure und Naturwissenschaftler (Band 1), 12. Auflage, S. 361-362 73 ⇒ Momentangeschwindigkeit = 1. Ableitung des Weges nach der Zeit. Beispiel 5.29: Momentanbeschleunigung eines Massepunktes Analog zu den Überlegungen im Beispiel 5.28 (jetzt mit a statt v und v statt s) erhält man: ∆v v(t + ∆t) − v(t) = ∆t ∆t ∆v v(t + ∆t) − v(t) Momentanbeschleunigung : a = lim = lim = v̇ = s̈ . ∆t→0 ∆t ∆t→0 ∆t durchschnittliche Beschleunigung : a = Beispiel 5.30: Stromstärke als Ableitung der elektrischen Ladung24 Als elektrische Stromstärke i bezeichnet man die in einer Zeiteinheit durch den Bezugsquerschnitt tretende Ladungsmenge q. Sei q(t) die Funktion, welche die Ladungsmenge angibt, die bis zur Zeit t durch den Bezugsquerschnitt geflossen ist. Dann ist q(t0 + ∆t) − q(t0 ), ∆t 6= 0, diejenige Ladungsmenge, die während des Zeitintervalls [t0 , t0 + ∆t] bzw. [t0 + ∆t, t0 ] durch den Bezugsquerschnitt floss. Als mittlere Stromstärke im in diesem Intervall erhält man: im = Durch Grenzübergang ∆t → 0 ergibt sich daraus: q(t0 + ∆t) − q(t0 ) dq i(t0 ) = lim = q̇(t0 ) . = ∆t→0 ∆t dt t=t0 5.4.2 q(t0 + ∆t) − q(t0 ) . ∆t Untersuchung des Monotonieverhaltens und Bestimmung charakteristischer Kurvenpunkte Definition 5.9: Eine Funktion f (x) heißt auf einem Intervall I monoton wachsend bzw. monoton fallend, wenn für alle x1 , x2 ∈ I mit x1 < x2 stets f (x1 ) ≤ f (x2 ) bzw. f (x1 ) ≥ f (x2 ) gilt. Wird Gleichheit ausgeschlossen, liegt strenge Monotonie vor. Mit Hilfe der ersten Ableitung einer Funktion kann entschieden werden, ob diese Funktion in einem gewissen Intervall (streng) monoton wachsend oder (streng) monoton fallend ist. Aussagen zum Monotonieverhalten einer Funktion Die Funktion y = f (x) sei auf [a, b] stetig und auf (a, b) differenzierbar. f (x) ist auf [a, b] monoton wachsend (bzw. streng monoton wachsend) genau dann, wenn f 0 (x) ≥ 0 (bzw. f 0 (x) > 0) für alle x ∈ (a, b) gilt. f (x) ist auf [a, b] monoton fallend (bzw. streng monoton fallend) genau dann, wenn f 0 (x) ≤ 0 (bzw. f 0 (x) < 0) für alle x ∈ (a, b) gilt. Die Begründung dieser Aussagen erfolgt mit Hilfe des Mittelwertsatzes der Differentialrechnung (siehe Abschnitt 5.3.4). Da die Differenzierbarkeit der Funktion auf dem betrachteten Intervall vorausgesetzt wurde, gibt es für beliebige Punkte x1 , x2 ∈ [a, b] mit x1 < x2 ein ξ ∈ (x1 , x2 ) derart, dass gilt: f (x2 ) − f (x1 ) = f 0 (ξ) · (x2 − x1 ) . Im Fall f 0 (ξ) ≥ 0 folgt wegen x2 − x1 > 0: f (x2 ) − f (x1 ) ≥ 0, d.h. die Funktion f ist monoton wachsend. Für f 0 (ξ) > 0 ergibt sich f (x2 ) − f (x1 ) > 0, d.h. die Funktion f ist streng monoton wachsend. Eine analoge Argumentation gilt in den Fällen f 0 (ξ) ≤ 0 sowie f 0 (ξ) < 0. Beispiel 5.31: Bei der Untersuchung von Funktionskurven ist es häufig von Interesse, solche Stellen aufzufinden, an denen minimale bzw. maximale Funktionswerte vorliegen (charakteristische Kurvenpunkte). Im weiteren wird die Lösung derartiger Problemstellungen erläutert. 24 Quelle: A. F ETZER , H. F R ÄNKEL, Mathematik 1: Lehrbuch für ingenieurwissenschaftliche Studiengänge, 10. Auflage, S. 349 74 Definition 5.10: Eine Funktion y = f (x) besitzt an einer Stelle x0 ein lokales Maximum bzw. lokales Minimum, wenn in einer gewissen Umgebung von x0 stets gilt: f (x0 ) > f (x) bzw. f (x0 ) < f (x) (x 6= x0 ) . Die lokalen Minima und Maxima einer Funktion werden unter dem Begriff lokale Extrema“ ” zusammengefasst. Die notwendige Bedingung für ein lokales Extremum der Funktion f (x) an der Stelle x0 lautet: f 0 (x0 ) = 0 (d.h. die Kurventangente hat in diesem Punkt den Anstieg 0 und verläuft somit waagerecht zur x-Achse). Diese Bedingung ist jedoch nicht hinreichend, wie das folgende einfache Beispiel zeigt. Beispiel 5.32: y6 Für die Funktion f (x) = x3 gilt an der Stelle x0 = 0: f 0 (x0 ) = 3x20 = 0. Jedoch liegt an dieser Stelle kein Extremum vor, denn es gilt f (0) = 0 und in der Umgebung der Stelle x0 = 0 gibt es sowohl negative als auch positive Funktionswerte (siehe Bild 5.12). 1 −1 0 1 - x −1 Bild 5.12 Um entscheiden zu können, ob an einer Stelle x0 mit f 0 (x0 ) = 0 tatsächlich ein Extremum vorliegt, muss der Wert der 2. Ableitung betrachtet werden. Hinreichende Bedingungen für das Vorliegen eines lokalen Extremums an der Stelle x0 Die Funktion f (x) sei in einer Umgebung von x0 ∈ (a, b) differenzierbar. Wenn f 0 (x0 ) = 0 und f 00 (x0 ) > 0 (bzw. f 00 (x0 ) < 0) gilt, dann besitzt f in x0 ein lokales Minimum (bzw. lokales Maximum). Beispiel 5.33: Gegeben ist die Funktion f (x) = x2 · e−0.5x . An welchen Stellen besitzt diese Funktion lokale Extrema? 1) Überprüfung der Bedingung: f 0 (x) = 0 f 0 (x) = 2x · e−0.5x + x2 · e−0.5x · (−0.5) = e−0.5x · (2x − 0.5x2 ) Es gilt f 0 (x) = 0, wenn 2x − 0.5x2 = 0 (da e−0.5x 6= 0 für alle x ∈ R) ⇒ x1 = 0 und x2 = 4 sind die extremwertverdächtigen Stellen. 2) Untersuchung von f 00 an den extremwertverdächtigen Stellen f 00 (x) = (2 − x) · e−0.5x + (2x − 0.5x2 ) · e−0.5x · (−0.5) = e−0.5x · (0.25x2 − 2x + 2) f 00 (x1 ) = f 00 (0) = e−0.5·0 · (0.25 · 02 − 2 · 0 + 2) = 2 > 0 00 00 f (x2 ) = f (4) = e −0.5·4 ⇒ lokales Minimum in x1 2 · (0.25 · 4 − 2 · 4 + 2) ≈ −0.2707 < 0 ⇒ lokales Maximum in x2 Es gilt: f (x1 ) = f (0) = 0 sowie f (x2 ) = f (4) = 2.165 (siehe auch Bild 5.13). 75 y Max. s 6 f (x) 1 s x Min. 1 −1 Bild 5.13 Das bisher behandelte Kriterium liefert jedoch noch keine Aussage bzgl. des Vorhandenseins eines lokalen Extremums, wenn an einer Stelle x0 sowohl f 0 (x0 ) = 0 als auch f 00 (x0 ) = 0 gilt. Das folgende, allgemeinere Kriterium ermöglicht es, auch in einem solchen Fall eine Entscheidung zu treffen. Allgemeines Kriterium für das Vorliegen eines lokalen Extremums an der Stelle x0 Die Funktion f (x) sei in einer Umgebung von x0 n-mal stetig differenzierbar (n ≥ 2) und es gelte: f 0 (x0 ) = f 00 (x0 ) = . . . = f (n−1) (x0 ) = 0, aber f (n) (x0 ) 6= 0. Dann folgt: a) Wenn n gerade ist, so hat f an der Stelle x0 ein lokales Extremum, und zwar für f (n) (x0 ) > 0 ein lokales Minimum und für f (n) (x0 ) < 0 ein lokales Maximum. b) Wenn n ungerade ist, dann hat f an der Stelle x0 kein lokales Extremum, sondern f ist in einer Umgebung von x0 streng monoton: für f (n) (x0 ) > 0 streng monoton wachsend und für f (n) (x0 ) < 0 streng monoton fallend. Beispiel 5.34: Bei der Untersuchung von Funktionskurven ist außerdem das Krümmungsverhalten von Interesse. Zunächst werden die Begriffe konkav“ und konvex“ erläutert. ” ” Die Kurve der Funktion f ist konvex (linksgekrümmt) auf (a, b) genau dann, wenn f 00 (x) ≥ 0 für alle x ∈ (a, b); anschaulich: jede Tangente t liegt unterhalb der Kurve (vgl. Bild 5.14a)). Die Kurve der Funktion f ist konkav (rechtsgekrümmt) auf (a, b), genau dann, wenn f 00 (x) ≤ 0 für alle x ∈ (a, b); anschaulich: jede Tangente t liegt oberhalb der Kurve (vgl. Bild 5.14b)). y y 6 y 6 6 f (x) t t f (x0 ) qW f (x) x Bild 5.14a) x Bild 5.14b) x0 x Bild 5.14c) Solche Punkte, in denen sich das Krümmungsverhalten der Kurve ändert, werden als Wendepunkte bezeichnet (vgl. dazu Bild 5.14c)). Wendepunkte sind ebenfalls charakteristische Kurvenpunkte. Allgemeines Kriterium für das Vorliegen eines Wendepunktes an der Stelle x0 Die Funktion f (x) sei in einer Umgebung von x0 ∈ (a, b) dreimal stetig differenzierbar. Wenn f 00 (x0 ) = 0 und f 000 (x0 ) 6= 0 gilt, dann besitzt f an der Stelle x0 einen Wendepunkt. 76 Beispiel 5.35: Bei der bisherigen Betrachtung von Wendepunkten einer Funktion wurde die erste Ableitung nicht untersucht. Gilt in einem Wendepunkt x0 zusätzlich f 0 (x0 ) = 0 (d.h. liegt ein Wendepunkt mit waagerechter Tangente vor), dann wird dieser Punkt als Sattelpunkt (oder Terrassenpunkt) bezeichnet. Beispiel 5.36: Die Funktion f (x) = x3 besitzt an der Stelle x0 = 0 einen Sattelpunkt, denn: f 0 (x0 ) = 3x20 = 0, f 00 (x0 ) = 6x0 = 0, f 000 (x0 ) = 6 6= 0 (siehe dazu auch Bild 5.12 in Beispiel 5.32). 5.4.3 Extremwertaufgaben In der Praxis gibt es zahlreiche Probleme, die auf sogenannte Extremwertaufgaben hinführen. Dabei ist von einer vorgegebenen Funktion (Zielfunktion) der größte oder kleinste Funktionswert in einem gewissen Intervall I zu bestimmen, d.h. es werden globale Maxima oder Minima gesucht. Anhand der im Bild 5.15 dargestellten Funktion wird deutlich, dass ein lokales Extremum nicht notwendigerweise auch ein globales Extremum ist. Wenn diese Funktion f (x) im Intervall [a, b] betrachtet wird, so hat sie an der Stelle x = c ein lokales Maximum. Da aber offensichtlich f (a) > f (c) gilt, befindet sich in x = c kein globales Maximum. y 6 f (x) a c b x Bild 5.15 Vorgehensweise bei der Lösung von Extremwertaufgaben 1) Berechnung lokaler Maxima bzw. lokaler Minima der Zielfunktion im Inneren des Intervalls I (mit der im Abschnitt 5.4.2 beschriebenen Methode) 2) Überprüfung, ob es sich um globale Maxima bzw. globale Minima handelt (z.B. durch Vergleich der Funktionswerte in diesen Punkten mit den Funktionswerten in den Randpunkten des Intervalls I oder durch Untersuchung des Krümmungsverhaltens der Funktionskurve) Beispiel 5.37:25 Aus einer rechtwinkligen Blechplatte mit den Seitenlängen 16 cm und 10 cm soll eine quaderförmige offene Wanne mit maximalem Volumen geformt werden (siehe dazu Bild 5.16). Zielfunktion: Volumen des Quaders mit Höhe x: V (x) = (16 − 2x)(10 − 2x)x = 4x3 − 52x2 + 160x, wobei 0 ≤ x ≤ 5, d.h. I = [0, 5]. 10 cm x x 16 cm Bild 5.16 Zur Lösung der Extremwertaufgabe sind nun die folgenden beiden Schritte auszuführen. 1) Berechnung der lokalen Maxima der Zielfunktion V (x): Die Bedingung V 0 (x) = 0 muss erfüllt sein, d.h. es sind die Lösungen der Gleichung V 0 (x) = 12x2 − 104x + 160 = 0 25 Quelle: K. M EYBERG , P. VACHENAUER, Höhere Mathematik 1, 5. Auflage, S. 122 77 zu ermitteln.26 Man erhält die beiden Lösungen: x1 = 2 und x2 = 20 3 . Die Lösung x2 braucht nicht weiter betrachtet zu werden, da sie die Bedingung 0 ≤ x ≤ 5 (s. oben) nicht erfüllt. Somit ist noch V 00 (x1 ) = 0 zu überprüfen. Es gilt: V 00 (x) = 24x − 104 sowie V 00 (2) = 48 − 104 < 0 ⇒ An der Stelle x1 = 2 hat die Zielfunktion ein lokales Maximum mit V (2) = 4 · 23 − 52 · 22 + 160 · 2 = 144. 2) Vergleich des Funktionswertes V (2) mit den Funktionswerten in den Randpunkten des Intervalls I: V (0) = 4 · 03 − 52 · 02 + 160 · 0 = 0 V (5) = 4 · 53 − 52 · 52 + 160 · 5 = 0 ⇒ Im Intervall I = [0, 5] hat die Zielfunktion V (x) in dem Punkt (2, 144) ihr globales Maximum. Ergebnis: Das Volumen der Wanne wird maximal, wenn x = 2 cm gewählt wird. Es beträgt dann 144 cm3 . 5.4.4 Regel von Bernoulli-de l’Hospital Diese Regel dient zur Berechnung von Grenzwerten vom Typ limx→0 0 0 oder ∞ (unbestimmte Ausdrücke), wie z.B.: ∞ ex − 1 (sowohl der Zähler als auch der Nenner streben für x → 0 gegen 0, so dass die im Abschnitt 5.2.1 x behandelten Rechenregeln für Grenzwerte kein Ergebnis liefern). Grenzwertregel von Bernoulli-de l’Hospital Seien f (x) und g(x) in einer Umgebung von x0 differenzierbar und gelte limx→x0 f (x) = 0 sowie limx→x0 g(x) = 0 (bzw. limx→x0 f (x) = ∞ sowie limx→x0 g(x) = ∞ ). Dann gilt: lim x→x0 f 0 (x) f (x) = lim 0 . g(x) x→x0 g (x) (66) Diese Aussage ist auch für x → ±∞ sowie für einseitige Grenzwerte gültig. Beispiel 5.38: In einigen Fällen führt erst eine mehrmalige Anwendung der Regel von Bernoulli-de l’Hospital zum Ziel. Beispiel 5.39: Es soll der Grenzwert limx→∞ x2 ∞ (unbestimmter Ausdruck vom Typ ) berechnet werden. x e ∞ Eine einmalige Anwendung von (66) ergibt zunächst: x2 2x = lim x . x x→∞ e x→∞ e lim Der Term innerhalb des Grenzwertes auf der rechten Seite dieser Gleichung ist wiederum ein unbestimmter ∞ Ausdruck vom Typ . Daher erfolgt eine nochmalige Anwendung von (66), welche jetzt zum Resultat führt: ∞ lim x→∞ 2x 2 = lim x = 0 . x→∞ e ex Für weitere unbestimmte Ausdrücke, wie z.B.: 0·(±∞) oder ∞−∞, kann die Regel von Bernoulli-de l’Hospital nach Durchführung zusätzlicher Umformungen verwendet werden (d.h. der Ausdruck innerhalb des Grenzwertes wird in einen Quotienten umgewandelt, so dass schließlich (66) anwendbar ist). 26 In diesen Rechenschritten wird die Maßeinheit zunächst weggelassen. 78 Beispiel 5.40: 5.4.5 Kurvendiskussion Ziel der Kurvendiskussion ist die Untersuchung und Feststellung der Funktionseigenschaften sowie des Funktionsverlaufes mit den Hilfsmitteln der Differentialrechnung. Arbeitsschritte bei der Kurvendiskussion a) Definitionsbereich D(f ) der Funktion bestimmen b) Untersuchung auf Symmetrien (gerade Funktion: f (−x) = f (x) für alle x ∈ D(f ), d.h.: spiegelsymmetrisch zur y-Achse, ungerade Funktion: f (−x) = −f (x) für alle x ∈ D(f ), d.h.: punktsymm. zum Koordinatenursprung) c) Verhalten im Unendlichen d) Definitionslücken untersuchen (behebbar oder nicht?) e) Achsenschnittpunkte bestimmen f) 1.-3. Ableitung ausrechnen g) charakteristische Kurvenpunkte bestimmen h) Skizze anfertigen Beispiel 5.41: Für die Funktion f (x) = −5x2 + 5 ist eine Kurvendiskussion durchzuführen, d.h. die soeben genannten Arbeitsx3 schritte werden auf diese Funktion angewendet. a) Definitionsbereich D(f ) bestimmen: f (x) ist definiert für x ∈ R \ {0} (da einzige Nullstelle des Nenners bei x = 0) b) Untersuchung auf Symmetrien Um eventuelle Symmetrien der Funktion festzustellen, wird die Relation zwischen f (x) und f (−x) untersucht. Es gilt für x 6= 0: f (−x) = −5(−x)2 + 5 −5x2 + 5 = = −f (x) (−x)3 −x3 ⇒ ungerade Funktion (punktsymmetrisch zum Koordinatenursprung). c) Verhalten im Unendlichen Die zu untersuchende Funktion ist eine echt gebrochenrationale Funktion. Gemäß der Aussagen im Abschnitt 5.2.4 nähert sich f (x) für x → ±∞ asymptotisch der x-Achse, d.h. der Geraden y = 0. Somit gilt: −5x2 + 5 = 0. x→±∞ x3 lim f (x) = lim x→±∞ Alternativ zu der o.g. Überlegung kann auch eine direkte Berechnung des Grenzwertes mit Hilfe der Rechenregeln für Grenzwerte erfolgen. 79 d) Definitionslücken untersuchen: Die einzige Definitionslücke ist bei x = 0 (vgl. a)). Das Nennerpolynom hat dort eine Nullstelle, das Zählerpolynom besitzt einen von 0 verschiedenen Wert ⇒ es liegt ein Pol, d.h. eine nicht behebbare Definitionslücke, vor. Es handelt sich um einen Pol mit Vorzeichenwechsel (da ungerade Vielfachhheit der Nullstelle des Nennerpolynoms). e) Achsenschnittpunkte bestimmen Die Schnittpunkte mit der x-Achse sind die Nullstellen der Funktion (da y = 0 gelten muss). Man erhält die Nullstellen von f (x) in diesem Fall als Nullstellen des Zählerpolynoms: x1 = 1 und x2 = −1. Ein Schnittpunkt mit der y-Achse existiert für diese Funktion nicht, da sie an der Stelle x = 0 nicht definiert ist. f) 1.-3. Ableitung ausrechnen Die Berechnung der Ableitungen erfolgt mittels Quotientenregel, wobei die entstehenden Ausdrücke möglichst vereinfacht werden sollten. Man erhält: f 0 (x) = −10x · x3 − 3x2 (−5x2 + 5) 5x4 − 15x2 5x2 − 15 = = 3 2 6 (x ) x x4 f 00 (x) = 10x · x4 − 4x3 (5x2 − 15) −10x5 + 60x3 −10x2 + 60 = = (x4 )2 x8 x5 f 000 (x) = −20x · x5 − 5x4 (−10x2 + 60) 30x6 − 300x4 30x2 − 300 = = . (x5 )2 x10 x6 g) Bestimmung charakteristischer Kurvenpunkte Zunächst werden lokale Extrema der Funktion f (x) gesucht. Die Bedingung f 0 (x) = 0 ist wegen √ √ 5x2 − 15 f 0 (x) = erfüllt, wenn 5x2 − 15 = 0 gilt. Das trifft für x3 = 3 und x4 = − 3 zu, so dass diese 4 x beiden Stellen extremwertverdächtig sind. Mit Hilfe von f 00 (x) wird überprüft, ob tatsächlich lokale Extrema vorliegen: √ √ −10x23 + 60 −10( 3)2 + 60 √ > 0 ⇒ lok. Minimum an d. Stelle x = = 3 ≈ 1.7321 f (x3 ) = 3 x53 ( 3)5 √ √ −10x24 + 60 −10(− 3)2 + 60 00 √ f (x4 ) = = < 0 ⇒ lok. Maximum an d. Stelle x = − 3 ≈ −1.7321 , 4 x54 (− 3)5 00 und die zugehörigen Funktionswerte sind: √ √ −5( 3)2 + 5 −5(− 3)2 + 5 √ √ f (x3 ) = ≈ −1.9245 sowie f (x4 ) = ≈ 1.9245. ( 3)3 (− 3)3 Nun werden Wendepunkte der Funktion f (x) gesucht. Die Bedingung f 00 (x) = 0 ist wegen √ √ −10x2 + 60 f 00 (x) = erfüllt, wenn −10x2 + 60 = 0 gilt. Das trifft für x5 = 6 und x6 = − 6 zu. 5 x Mit Hilfe von f 000 (x) wird überprüft, ob tatsächlich Wendepunkte vorliegen: √ √ 30x25 − 300 30( 6)2 − 300 √ f (x5 ) = = 6 0 ⇒ Wendepunkt an d. Stelle x5 = 6 ≈ 2.4495 = 6 6 x5 ( 6) √ √ 30x26 − 300 30(− 6)2 − 300 √ f 000 (x6 ) = = 6 0 ⇒ Wendepunkt an d. Stelle x6 = − 6 ≈ −2.4495 , = 6 6 x5 (− 6) 000 und die zugehörigen Funktionswerte sind: √ √ −5( 6)2 + 5 −5(− 6)2 + 5 √ √ f (x5 ) = ≈ −1.701 sowie f (x6 ) = ≈ 1.701. ( 6)3 (− 6)3 h) Skizze: Um eine Skizze der Funktion anzufertigen, werden die Resultate aus a) - g) genutzt und weitere Kurvenpunkte mit Hilfe einer Wertetabelle berechnet. Bild 5.17 (auf der nächsten Seite) zeigt den Verlauf der Funktion f (x). 80 y 6 f (x) Max. Wendep. r r −1 r 1 1 r r r Wendep. −1 x Min. Bild 5.17 Bemerkung: Bei der untersuchten Funktion f (x) stellt sich heraus, dass die Koordinaten der lokalen Extrempunkte (und auch die der Wendepunkte) zueinander entgegengesetzte Zahlen sind. Dies lässt sich dadurch erklären, dass die Funktion ungerade ist. 5.4.6 Taylor-Polynome Da Polynome besonders einfache und überschaubare Eigenschaften haben, besteht in praktischen Anwendungen häufig der Wunsch, eine gegebene Funktion möglichst gut“ durch Polynome zu approximieren (d.h. anzu” nähern). Eine solche Möglichkeit der Approximation bieten die Taylor-Polynome. Definition 5.11: Ist die Funktion f (x) an der Stelle x0 mindestens n-mal differenzierbar, dann heißt n X f (k) (x0 ) f 0 (x0 ) f (n) (x0 ) Tn (x) = f (x0 ) + (x − x0 )1 + . . . + (x − x0 )n = (x − x0 )k 1! n! k! (67) k=0 Taylor-Polynom n-ten Grades (oder: n-tes Taylor-Polynom) von f an der Stelle x0 . Beispiel 5.42: Berechnung des Taylor-Polynoms 2. Grades für die Funktion f (x) = ex an der Stelle x0 = 0 Das Bild 5.18 zeigt die Funktion f (x) = ex sowie ihr Taylor-Polynom 1. Grades an der Stelle x0 = 0 im Intervall [−1, 1]. Das Taylor-Polynom 1. Grades wird auch als Linearisierung“ oder 1. Näherung“ der Funk” ” tion f (x) bezeichnet. An der Stelle x0 = 0 haben T1 (x) und f (x) sowohl den gleichen Funktionswert als auch den gleichen Anstieg. Im Bild 5.19 sind die Funktion f (x) = ex sowie ihr Taylor-Polynom 2. Grades an der Stelle x0 = 0 im Intervall [−1, 1] dargestellt. Das Taylor-Polynom 2. Grades wird auch 2. Näherung“ der Funktion f (x) genannt. ” An der Stelle x0 = 0 haben T2 (x) und f (x) den gleichen Funktionswert, den gleichen Anstieg und die gleiche 81 Krümmung. Es ist zu erkennen, dass f (x) in der Umgebung der Stelle x0 = 0 sehr gut durch das TaylorPolynom T2 (x) approximiert wird. Bild 5.18 Bild 5.19 Beispiel 5.43: Berechnung des Taylor-Polynoms 4. Grades für die Funktion f (x) = ln x an der Stelle x0 = 1 82 Beispiel 5.44:27 Die magnetische Feldstärke in der Mitte einer stromdurchflossenen Zylinderspule wird nach der Formel H= NI 1 ·q l 1+ d 2 l (d << l) (68) ermittelt, wobei: N - Windungszahl der Spule, l - Länge, d - Durchmesser, I - Stromstärke. Es soll ein Näherungspolynom für H mit Hilfe des Taylor-Polynoms des Wurzelausdrucks berechnet werden (der Vorfaktor bleibt zunächst unberücksichtigt). 2 d Dafür sei x := . Die für die Taylor-Polynome benötigten Ableitungen der Funktion l 1 f (x) = √ = (1 + x)−1/2 lauten: 1+x 1 3 15 f 0 (x) = − (1 + x)−3/2 , f 00 (x) = (1 + x)−5/2 , f 000 (x) = − (1 + x)−7/2 , . . . . 2 4 8 Um das Näherungspolynom 1. Grades aufstellen zu können, wird in der Formel für das Taylor-Polynom gesetzt: n = 1 und x0 = 0. Dadurch erhält man T1 (x) = f (x0 ) + f 0 (x0 ) f 0 (0) 1 x = f (0) + (x − 0) = 1 − x , 1! 1! 2 und der Wurzelausdruck aus Gleichung (68) kann wie folgt angenähert werden: 1 q 1+ 1 ≈1− 2 d 2 2 d . l l Einsetzen in (68) liefert schließlich das Näherungspolynom für H: 2 NI N I(2l2 − d2 ) 1 d H≈ · 1− . = 2 l l 2l3 Wie aus den Bildern 5.18 und 5.19 ersichtlich ist, entsteht eine Abweichung (ein Fehler“), wenn eine Funk” tion f (x) durch ihr Taylor-Polynom n-ten Grades ersetzt wird. Die Größe dieses Fehlers kann formelmäßig beschrieben werden. Taylorsche Formel an der Stelle x0 (Taylorscher Satz): f (x) = Tn (x) + Rn (x) , (69) wobei Tn (x) das n-te Taylor-Polynom von f an der Stelle x0 bezeichnet (siehe auch (67)). Der Term Rn (x) wird Restglied genannt. Das Restglied entspricht dem Fehler, welcher entsteht, wenn f (x) durch das Taylor-Polynom Tn (x) ersetzt wird. Das Restglied Rn (x) ist i.allg. nicht exakt bestimmbar. Es existieren jedoch Darstellungen für das Restglied. Dadurch sind zumindest Abschätzungen des Restgliedes möglich, d.h. es kann eingeschätzt werden, wie gut die Approximation der Funktion durch ein Taylor-Polynom Tn (x) ist. Darstellung des Restgliedes nach Lagrange: Rn (x) = f (n+1) (ξ) (x − x0 )n+1 mit ξ zwischen x0 und x (n + 1)! Voraussetzung für diese Darstellung ist, dass die Funktion (n + 1)-mal differenzierbar ist auf einem Intervall [a, b] mit x, x0 ∈ [a, b]. Beispiel 5.45: 27 Quelle: L. PAPULA . Mathematik für Ingenieure und Naturwissenschaftler. Anwendungsbeispiele, 5. Auflage, S. 146 83 (70) Bemerkung: Außer (70) ist auch die folgende Darstellung für das Restglied nach Lagrange gebräuchlich: Rn (x) = 5.5 f (n+1) (x0 + ϑ(x − x0 )) (x − x0 )n+1 mit 0 < ϑ < 1. (n + 1)! Numerische Verfahren zur Lösung von Gleichungen Eine in den Anwendungen häufig vorkommende Aufgabe ist die Bestimmung der Lösungen der Gleichung f (x) = 0 (d.h. der Nullstellen der Funktion f (x)). Nur in wenigen Fällen ist die direkte Auflösung dieser Gleichung nach der Variablen x möglich. In allen anderen Fällen versucht man, mittels numerischer Verfahren die Gleichung zumindest näherungsweise zu lösen. Vorgehensweise bei der näherungsweisen Lösung der Gleichung f (x) = 0 1) Es wird ein Startwert x0 vorgegeben. 2) Mittels einer Rechenvorschrift (Iterationsvorschrift) wird aus x0 ein Wert x1 berechnet. Dann erfolgt eine fortgesetzte Anwendung dieser Rechenvorschrift, so dass schließlich eine Folge {xn } von Iterationswerten entsteht. In den folgenden beiden Unterabschnitten werden zwei numerische Verfahren, die nach dem genannten Prinzip arbeiten, vorgestellt. 5.5.1 Das Newtonsche Iterationsverfahren (Newton-Verfahren) Die Iterationsvorschrift für das Newton-Verfahren Bei gegebenem Startwert x0 werden die Iterationswerte für die Lösung der Gleichung f (x) = 0 nach der folgenden Vorschrift berechnet: xn+1 = xn − f (xn ) f 0 (xn ) für n = 0, 1, 2, . . . . (71) Der Abbruch des Verfahrens erfolgt bei n = n0 , wenn |xn0 − xn0 −1 | < ε oder |f (xn0 )| < ε gilt (ε : kleine positive Zahl). Begründung für das Newton-Verfahren: Bei der Berechnung einer Folge {xn } von Iterationswerten für die Lösung der Gleichung f (x) = 0 wird xn+1 als x-Koordinate des Schnittpunktes von tn mit der x-Achse bestimmt. Dabei bezeichnet tn die durch den Punkt (xn , f (xn )) verlaufende Kurventangente. (Aus diesem Grund wird das Verfahren auch Tangenten” verfahren von Newton“ genannt). Bei der Berechnung der Tangente tn im Punkt (xn , f (xn )) kann die PunktRichtungs-Gleichung der Geraden genutzt werden, da der Anstieg dieser Tangente gleich f 0 (xn ) ist. Man erhält: y − f (xn ) = f 0 (xn ) ⇒ y = f 0 (xn )(x − xn ) + f (xn ) . x − xn In dieser Gleichung wird x so bestimmt, dass y = 0 gilt (da der Schnittpunkt der Tangente mit der x-Achse gesucht ist). Dadurch ergibt sich: 0 = f 0 (xn )(xn+1 − xn ) + f (xn ) , und durch Umstellen dieser Gleichung nach xn+1 entsteht die Iterationsvorschrift (71) für das Newton-Verfahren. In Bild 5.20a), b) (siehe nächste Seite) ist das Newton-Verfahren für eine konkrete Situation veranschaulicht. Ausgehend von dem Startwert x0 = 2 entsteht x1 als x-Koordinate des Schnittpunktes der durch den Punkt (x0 , f (x0 )) verlaufenden Kurventangente t0 mit der x-Achse, siehe Bild 5.20a). Der nächste Schritt des NewtonVerfahrens wird im Bild 5.20b) dargestellt: x2 ist x-Koordinate des Schnittpunktes der durch den Punkt (x1 , f (x1 )) verlaufenden Kurventangente t1 mit der x-Achse. Es ist zu erkennen, dass x2 bereits näher an der exakten Nullstelle liegt als x1 . 84 y y x Bild 5.20a) x Bild 5.20b) Beispiel 5.46: Für die praktische Anwendung des Newton-Verfahrens werden Aussagen zur Konvergenz benötigt. Eine hinreichende Konvergenzbedingung für das Newton-Verfahren Die Folge der Iterationswerte x0 , x1 , x2 , . . . konvergiert gegen die exakte Lösung der Gleichung f (x) = 0, wenn gilt: f (x) · f 00 (x) (72) [f 0 (x)]2 < 1 für alle x ∈ [a, b] (Intervall, in dem sämtliche Iterationswerte liegen). Wichtig für eine erfolgreiche Anwendung des Newton-Verfahrens ist zudem die Wahl eines geeigneten Startwertes. Zur Wahl des Startwertes für das Newton-Verfahren Um einen geeigneten Startwert zu gewinnen, sind folgende Vorgehensweisen möglich: - Anfertigung einer Grobskizze der Funktion y = f (x) (diese vermittelt Aussagen zur ungefähren Lage der Nullstelle(n)) - rechnerische Bestimmung eines Intervalls [c, d] mit f (c) · f (d) < 0 (d.h.: Vorzeichenwechsel der Funktion f (x)), dann x0 ∈ (c, d) wählen - bei der Lösung von praktischen Problemen: aus dem Sachverhalt heraus kann man ggf. eine Vorstellung über die ungefähre Lage der Nullstelle(n) gewinnen Als Startwerte ungeeignet sind solche Werte x, für die die Bedingung (72) nicht erfüllt ist oder in deren unmittelbarer Umgebung f 0 (x) betragsmäßig sehr klein ist (in einem solchen Fall verläuft die Kurventangente fast parallel zur x-Achse ⇒ Schnittpunkt von Tangente und x-Achse i.allg. weit entfernt vom Startwert). In dem folgenden Beispiel führt ein ungünstig gewählter Startwert dazu, dass das Newton-Verfahren nicht konvergiert. 85 Beispiel 5.47: Bemerkung: Falls die Gleichung f (x) = 0 mehrere Lösungen besitzt, muss zu jeder (gesuchten) Lösung ein geeigneter Startwert bestimmt und dann das Newton-Verfahren für die einzelnen Startwerte getrennt angewendet werden. 5.5.2 Fixpunktiteration Die Idee der Fixpunktiteration besteht darin, dass aus der zu lösenden Gleichung f (x) = 0 durch äquivalente Umformungen eine Gleichung der Form x = g(x) (73) hergestellt wird. Diese Gleichung hat dieselbe Lösungsmenge wie die Ausgangsgleichung. Man nennt die Gleichung (73) auch eine Fixpunktgleichung. Wenn eine Lösung x dieser Gleichung existiert, so wird sie als Fixpunkt bezeichnet, da x durch g in sich selbst abgebildet wird. Es ist zubeachten, dass die Überführung der Gleichung f (x) = 0 in eine Fixpunktgleichung nicht unbedingt eindeutig ist (siehe dazu auch Beispiel 5.50). Ausgehend von der Gleichung (73) lässt sich die Iterationsvorschrift für die Fixpunktiteration formulieren. Die Iterationsvorschrift für die Fixpunktiteration Bei gegebenem Startwert x0 werden die Iterationswerte für die Lösung der Gleichung x = g(x) nach der folgenden Vorschrift berechnet: xn+1 = g(xn ) für n = 0, 1, 2, . . . . (74) Der Abbruch des Verfahrens erfolgt bei n = n0 , wenn |xn0 − xn0 −1 | < ε oder |f (xn0 )| < ε gilt (ε : kleine positive Zahl). Beispiel 5.48: Hinreichende Konvergenzbedingungen für die Fixpunktiteration Die Folge der Iterationswerte x0 , x1 , x2 , . . . konvergiert gegen die exakte Lösung der Gleichung x = g(x) (und somit auch gegen die exakte Lösung der Gleichung f (x) = 0) im Intervall [a, b], wenn gilt: 1) Für alle x ∈ [a, b] gilt: g(x) ∈ [a, b]. 2) Es gibt ein L mit 0 < L < 1, so dass für alle x ∈ [a, b] die Bedingung |g 0 (x)| ≤ L erfüllt ist. Auf die Überprüfung der Bedingung 1) kann verzichtet werden, wenn durch einen Vorzeichenwechsel der Funktion f (x) im Intervall [a, b] die Existenz einer Nullstelle von f (x) = 0 (und somit die Existenz einer Lösung von x = g(x)) gewährleistet ist. Beispiel 5.49: Falls die Gleichung f (x) = 0 mehrere Lösungen besitzt (was z.B. anhand einer Grobskizze der Funktion festgestellt werden kann), dann müssen für die verschiedenen Intervalle, in denen Nullstellen gesucht werden, ggf. unterschiedliche Iterationsvorschriften angewendet werden, um die Bedingung 2) zu erfüllen. Dies wird in dem nachfolgenden Beispiel deutlich gemacht. Beispiel 5.50: Bemerkung: Im Vergleich der beiden in 5.5.1 und 5.5.2 beschriebenen Verfahren lässt sich feststellen, dass das NewtonVerfahren (bei geeigneter Wahl des Startwertes) wesentlich schneller konvergiert als die Fixpunktiteration, d.h. zum Erreichen einer vorgegebenen Genauigkeit werden beim Newton-Verfahren deutlich weniger Iterationsschritte benötigt als bei der Fixpunktiteration (vgl. dazu auch die Beispiele 5.46 und 5.48). Jedoch ist der Rechenaufwand beim Newton-Verfahren höher, da in jedem Iterationsschritt eine Ableitung neu berechnet werden muss. Eine Alternative bietet das vereinfachte Newton-Verfahren, bei dem nur f 0 (x0 ) berechnet und in jedem Iterationsschritt anstelle von f 0 (xn ) verwendet wird. 86 Literaturverzeichnis Das Vorlesungsskript wurde unter Verwendung der nachfolgend aufgeführten Literatur erstellt: H.-J. BARTSCH: Taschenbuch Mathematischer Formeln für Ingenieure und Naturwissenschaftler. Fachbuchverlag Leipzig im Carl Hanser Verlag, 23. Auflage, 2014. K. D ÜRRSCHNABEL: Mathematik für Ingenieure - Eine Einführung mit Anwendungs- und Alltagsbeispielen. Springer Vieweg, 2. Auflage, 2012. A. F ETZER , H. F R ÄNKEL: Mathematik 1: Lehrbuch für ingenieurwissenschaftliche Studiengänge. Springer, 8. Auflage, 2005. A. F ETZER , H. F R ÄNKEL: Mathematik 2: Lehrbuch für ingenieurwissenschaftliche Studiengänge. Springer, 6. Auflage, 2009. W. G ÖHLER: Formelsammlung Höhere Mathematik. Verlag Harri Deutsch, 16. Auflage, 2005. O. G REUEL : Mathematische Ergänzungen und Aufgaben für Elektrotechniker. Hanser, 12. Auflage, 1990. W. L EUPOLD (Hrsg.): Mathematik - ein Studienbuch für Ingenieure (Band 1: Algebra - Geometrie - Analysis für eine Variable). Fachbuchverlag Leipzig im Carl Hanser Verlag, 2. Auflage, 2011. W. L EUPOLD (Hrsg.): Mathematik - ein Studienbuch für Ingenieure (Band 2: Reihen - Differentialgleichungen - Analysis für mehrere Variable - Stochastik). Fachbuchverlag Leipzig im Carl Hanser Verlag, 2. Auflage, 2006. K. M EYBERG , P. VACHENAUER. Höhere Mathematik 1 (Differential- und Integralrechnung, Vektor- und Matrizenrechnung), Springer, 5. Auflage, 1999. L. PAPULA : Mathematik für Ingenieure und Naturwissenschaftler: Ein Lehr- und Arbeitsbuch für das Grundstudium (Band 1). Vieweg+Teubner, 12. Auflage, 2009. L. PAPULA : Mathematik für Ingenieure und Naturwissenschaftler: Ein Lehr- und Arbeitsbuch für das Grundstudium (Band 2). Vieweg+Teubner, 12. Auflage, 2009. L. PAPULA : Mathematik für Ingenieure und Naturwissenschaftler. Anwendungsbeispiele. Vieweg, 5. Auflage, 2004. W. P REUSS: Funktionaltransformationen. Fachbuchverlag Leipzig im Carl Hanser Verlag, 2. Auflage, 2009. W. P REUSS , G. W ENISCH (Hrsg.): Lehr- und Übungsbuch Mathematik (Band 2: Analysis). Fachbuchverlag Leipzig im Carl Hanser Verlag, 3. Auflage, 2003. P. S TINGL : Mathematik für Fachhochschulen. Hanser, 8. Auflage, 2009. E. W ESTK ÄMPER , H.-J. WARNECKE: Einführung in die Fertigungstechnik, B. G. Teubner Verlag, 4. Auflage, 2001. 87