Hochschule für Technik und Wirtschaft Dresden Fakultät Informatik/Mathematik Prof. Dr. B. Jung Skript (Teil 1) zur Vorlesung Mathematik für den Studiengang Produktionstechnik (053) Stoffgebiete: 1. Grundbegriffe der Mengenlehre und Logik, Zahlenmengen und komplexe Zahlen 2. Analytische Geometrie und Lineare Algebra 3. Funktionen einer reellen Variablen (Grundlagen) 4. Differentialrechnung für Funktionen einer reellen Variablen 5. Integralrechnung für Funktionen einer reellen Variablen Inhaltsverzeichnis 1 2 3 Grundbegriffe der Mengenlehre und Logik, Zahlenmengen und komplexe Zahlen 1.1 Grundbegriffe der Mengenlehre und der mathematischen Logik . . . . . . . . . . 1.1.1 Definition und Darstellung von Mengen . . . . . . . . . . . . . . . . . . 1.1.2 Relationen zwischen Mengen . . . . . . . . . . . . . . . . . . . . . . . 1.1.3 Mengenoperationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.1.4 Einige Grundbegriffe der Logik . . . . . . . . . . . . . . . . . . . . . . 1.2 Zahlenmengen und komplexe Zahlen . . . . . . . . . . . . . . . . . . . . . . . . 1.2.1 Die Menge der reellen Zahlen . . . . . . . . . . . . . . . . . . . . . . . 1.2.2 Begriff der komplexen Zahl, Gaußsche Zahlenebene . . . . . . . . . . . 1.2.3 Grundrechenarten mit komplexen Zahlen . . . . . . . . . . . . . . . . . 1.2.4 Die Exponentialform einer komplexen Zahl . . . . . . . . . . . . . . . . 1.2.5 Rechnen mit komplexen Zahlen in der Exponentialform . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 4 4 4 5 6 8 8 8 10 12 13 Analytische Geometrie und Lineare Algebra 2.1 Skalare und vektorielle Größen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2 Vektoroperationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3 Vektoren im dreidimensionalen Raum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.1 Darstellung von Vektoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.2 Darstellung der Vektoroperationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4 Produkte von Vektoren und ihre Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . 2.4.1 Skalarprodukt (inneres Produkt) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4.2 Vektorprodukt (Kreuzprodukt, äußeres Produkt) . . . . . . . . . . . . . . . . . . . . . 2.4.3 Spatprodukt (gemischtes Produkt) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.5 Geraden und Ebenen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.5.1 Darstellung von Geraden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.5.2 Lagebeziehungen von Geraden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.5.3 Darstellung von Ebenen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.6 Vektoren im Rn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.7 Kurven 2. Ordnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.8 Matrizen: eine kurze Einführung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.8.1 Definition einer Matrix . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.8.2 Spezielle Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.9 Rechenoperationen mit Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.9.1 Addition und Subtraktion von Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . 2.9.2 Multiplikation einer Matrix mit einem Skalar . . . . . . . . . . . . . . . . . . . . . . 2.9.3 Multiplikation von Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.9.4 Beispiele für Anwendungen der Matrizenmultiplikation . . . . . . . . . . . . . . . . 2.10 Inverse Matrix . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.11 Determinanten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.12 Lineare Gleichungssysteme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.12.1 Einführung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.12.2 Der Gaußsche Algorithmus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.12.3 Lineare Gleichungssysteme mit quadratischer Koeffizientenmatrix, Cramersche Regel 2.13 Zusammenfassende Aussagen über quadratische Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 14 14 15 15 16 17 17 19 20 22 22 23 24 26 27 30 30 32 33 33 33 34 35 36 38 39 39 41 43 43 . . . . . . . . 44 44 44 45 46 48 48 52 54 Funktionen einer reellen Variablen (Grundlagen) 3.1 Zahlenfolgen . . . . . . . . . . . . . . . . . . . . . . 3.1.1 Definition und Darstellung reeller Zahlenfolgen 3.1.2 Eigenschaften von Folgen und spezielle Folgen 3.1.3 Grenzwerte von Folgen . . . . . . . . . . . . . 3.2 Grundlegendes über Funktionen . . . . . . . . . . . . 3.2.1 Definition und Darstellung von Funktionen . . 3.2.2 Allgemeine Eigenschaften von Funktionen . . 3.2.3 Einige spezielle Funktionen . . . . . . . . . . 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3 Grenzwert und Stetigkeit einer Funktion 3.3.1 Grenzwerte . . . . . . . . . . . 3.3.2 Asymptoten . . . . . . . . . . . 3.3.3 Stetigkeit einer Funktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57 57 60 61 4 Differentialrechnung für Funktionen einer reellen Variablen 4.1 Grundlegendes zur Differentialrechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.1.1 Differenzierbarkeit und erste Ableitung . . . . . . . . . . . . . . . . . . . . . . . . . . 4.1.2 Das Differential einer Funktion und dessen Anwendung in der Fehlerrechnung . . . . . 4.1.3 Höhere Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2 Anwendungen der Differentialrechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2.1 Anwendungen der Differentialrechnung in der Physik . . . . . . . . . . . . . . . . . . . 4.2.2 Untersuchung des Monotonieverhaltens und Bestimmung charakteristischer Kurvenpunkte 4.2.3 Extremwertaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2.4 Regel von Bernoulli-de l’Hospital . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2.5 Kurvendiskussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2.6 Taylor-Polynome . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2.7 Das Newton-Verfahren zur näherungsweisen Lösung von Gleichungen . . . . . . . . . . 63 63 63 65 66 66 66 67 70 71 72 75 77 5 Integralrechnung für Funktionen einer reellen Variablen 5.1 Integralbegriff und Integrierbarkeit . . . . . . . . . . . . . . . . . . . . . 5.1.1 Unbestimmtes Integral, Grundintegrale . . . . . . . . . . . . . . 5.1.2 Bestimmtes Integral und Eigenschaften integrierbarer Funktionen 5.2 Integrationsverfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2.1 Integration durch Substitution . . . . . . . . . . . . . . . . . . . 5.2.2 Partielle Integration ( Produktintegration“) . . . . . . . . . . . . ” 5.2.3 Integration durch Partialbruchzerlegung . . . . . . . . . . . . . . 5.2.4 Numerische Integration . . . . . . . . . . . . . . . . . . . . . . . 80 80 80 81 83 83 85 87 90 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 Grundbegriffe der Mengenlehre und Logik, Zahlenmengen und komplexe Zahlen 1.1 Grundbegriffe der Mengenlehre und der mathematischen Logik 1.1.1 Definition und Darstellung von Mengen Der Begriff Menge“ wird in der Umgangssprache häufig in einem anderen Sinne verwendet als in der Mathe” matik. Zunächst soll eine mathematische Definition des Mengenbegriffes angegeben werden. Definition 1.1: Unter einer Menge versteht man eine Zusammenfassung wohldefinierter, unterscheidbarer Objekte zu einem Ganzen. Diese Objekte heißen Elemente der Menge. Mengen können auf unterschiedliche Weise dargestellt werden: 1) Beschreibung mit Worten, z.B.: A ist die Menge aller Wochentage“ ” oder B ist die Menge aller natürlichen Zahlen“ ” (Die Elemente der Menge A sind nichtmathematische Objekte, die Elemente von B sind mathematische Objekte.) 2) Aufzählung der Elemente der Menge, z.B.: C = {1; 3; 5; 7; 9} 3) Darstellung mit Hilfe einer Aussageform1 , z.B.: D = {x | x ist eine Primzahl zwischen 1 und 10} Sei nun A eine beliebige Menge. Um zum Ausdruck zu bringen, dass das Objekt a ein Element der Menge A ist, wird die Schreibweise a ∈ A verwendet. Ist dagegen das Objekt b kein Element der Menge A, wird dies durch die Schreibweise b 6∈ A symbolisiert. Je nach Anzahl der Elemente, die in einer Menge enthalten sind, unterscheidet man endliche und unendliche Mengen. Eine Menge, die kein Element enthält, heißt leere Menge. Für eine leere Menge wird das Symbol ∅ oder { } verwendet. Beispiel 1.1: 1.1.2 Relationen zwischen Mengen Zwei Mengen heißen gleich, wenn sie die gleichen Elemente enthalten. Die Reihenfolge der Elemente spielt dabei keine Rolle. Beispiel 1.2: Definition 1.2: Eine Menge A heißt Teilmenge (oder: Untermenge) der Menge B, wenn jedes Element von A auch Element von B ist. Schreibweise: A ⊆ B Der Fall, dass beide Mengen gleich sind, ist hier mit eingeschlossen. Wenn A eine Teilmenge von B ist, wobei mindestens ein Element von B nicht zu A gehört, dann bezeichnet man A als echte Teilmenge von B. Schreibweise: A ⊂ B 1 Auf den Begriff der Aussageform wird im Abschnitt 1.1.4 nochmals eingegangen. 4 Allgemein gilt für jede Menge A: ∅ ⊆ A sowie A ⊆ A. Der Sachverhalt A ⊂ B kann mittels eines Mengendiagramms wie folgt veranschaulicht werden: A B Beispiel 1.3: 1.1.3 Mengenoperationen Bei der Anwendung von Mengenoperationen auf zwei Mengen wird diesen (gemäß einer gewissen Vorschrift) eine neue Menge zugeordnet. In der nachfolgenden Tabelle wird eine Übersicht über Mengenoperationen gegeben. Die Veranschaulichung erfolgt jeweils mit Hilfe von Mengendiagrammen. Mit A und B sind Mengen im Sinne der Definition 1.1 bezeichnet. Mengenoperation Bedeutung Vereinigung: A ∪ B Menge der Elemente, die zu A oder zu B gehören A B Menge der Elemente, die sowohl zu A als auch zu B gehören A B A B Durchschnitt: A ∩ B Differenz: A \ B Komplementärmenge von A bezüglich M : A Darstellung im Diagramm Menge derjenigen Elemente, die zu A, aber nicht zu B gehören Menge der Elemente von M , die nicht zu A gehören (dabei muss A ⊂ M gelten) M A A Beispiel 1.4: Die Produktmenge (oder: das kartesische Produkt) zweier Mengen A und B enthält alle geordneten Paare (a; b) von Elementen a ∈ A und b ∈ B. Dabei ist zu beachten, dass (a; b) 6= (b; a) gilt, falls a 6= b. Die Schreibweise für die Produktmenge von A und B lautet: A × B. Beispiel 1.5: 5 Die Produktmenge lässt sich auf n Mengen A1 , A2 , . . . , An verallgemeinern. Die Menge A1 × A2 × . . . × An enthält dann alle geordneten n-Tupel (a1 ; a2 ; . . . ; an ) mit a1 ∈ A1 , a2 ∈ A2 , . . . , an ∈ An . Rechenregeln für Mengenoperationen Für beliebige Mengen A, B, C gilt: Kommutativgesetze: Assoziativgesetze: A ∪ B = B ∪ A, A∩B =B∩A (A ∪ B) ∪ C = A ∪ (B ∪ C), (A ∩ B) ∩ C = A ∩ (B ∩ C) Distributivgesetze: A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C), A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C) de Morgansche Formeln: A ∪ B = A ∩ B, A∩B =A∪B 1.1.4 Einige Grundbegriffe der Logik Definition 1.3: Unter einer Aussage versteht man ein sinnvolles sprachliches oder formelmäßiges Gebilde, das entweder den Wahrheitswert wahr (symbolisiert durch w“ oder 1“) oder den Wahrheitswert falsch (symbolisiert ” ” durch f“ oder 0“) besitzt. ” ” Wenn man in einer Aussage die Zuordnung eines Wahrheitswertes offen lassen will, werden Variable eingeführt. Dadurch entsteht eine Aussageform. Beispiel 1.6: Durch die Verknüpfung von Aussagen entstehen neue Aussagen. Die wichtigsten Verknüpfungen von Aussagen sind in der folgenden Übersicht dargestellt. Mit p und q sind Aussagen im Sinne der Definition 1.3 bezeichnet. Verknüpfung Bedeutung Negation von p Verneinung der Aussage p, d.h. die Aussage: nicht p“ ” Aussage: p und q“ ” Aussage: p oder q“ ” ( oder“ im nicht ausschließenden Sinne) ” Aussage: wenn p, dann q“ ” (oder: aus p folgt q“) ” Aussage: p genau dann, wenn q“ ” Konjunktion von p und q Disjunktion von p und q Implikation von p und q Äquivalenz von p und q symbolische Darstellung p (oder ¬ p) p∧q p∨q p⇒q p⇔q Bei der Implikation p ⇒ q bezeichnet man die Aussage p als Voraussetzung (oder Prämisse) und die Aussage q als Folgerung (oder Konklusion). Die Aussage p ist eine hinreichende Bedingung für q und die Aussage q eine notwendige Bedingung für p. Die Äquivalenz p ⇔ q beinhaltet (wie auch das Symbol schon vermuten lässt) gleichzeitig die beiden Implikationen: p ⇒ q und q ⇒ p, d.h. man kann auch sagen: Aus p folgt q und umgekehrt.“ oder Die Aussage p ist ” ” notwendig und hinreichend für die Aussage q.“ 6 Beispiel 1.7: Da durch die Verknüpfung von Aussagen wiederum Aussagen entstehen, kann der Wahrheitswert der neu entstandenen Aussage festgestellt werden. Dieser hängt natürlich von den Wahrheitswerten der verknüpften Aussagen und auch von der Art der Verknüpfung ab. Häufig wird dies mit Hilfe von Wahrheitstafeln (oder: Wahrheitswerttabellen) veranschaulicht. In dem nachfolgenden Beispiel wird die Wahrheitstafel für die Konjunktion zweier Aussagen aufgestellt und erläutert. Für weitere Wahrheitstafeln sei auf die folgenden Literaturstellen verwiesen: W. L EUPOLD (Hrsg.): Mathematik - ein Studienbuch für Ingenieure (Band 1), 2. Auflage, S. 15-19 oder M. R ICHTER: Grundwissen Mathematik für Ingenieure, 2. Auflage, S. 17-18. Beispiel 1.8: Wahrheitstafel für die Verknüpfung p ∧ q p q p∧q w w w w f f f w f f f f Erläuterung: Die Konjunktion p ∧ q zweier wahrer Aussagen (d.h. die Aussagen p und q haben beide den Wahrheitswert w“, siehe erste ” und zweite Spalte der Wahrheitstafel) liefert wiederum eine wahre Aussage (siehe letzte Spalte der Wahrheitstafel). Dagegen entsteht bei allen weiteren Verknüpfungsmöglichkeiten (d.h.: eine wahre und eine falsche Aussage oder zwei falsche Aussagen werden miteinander durch Konjunktion verknüpft) stets eine falsche Aussage. 7 1.2 Zahlenmengen und komplexe Zahlen 1.2.1 Die Menge der reellen Zahlen Zunächst werden die Bezeichnungen für spezielle Zahlenmengen (Standard-Zahlenmengen) eingeführt: N = {0; 1; 2; . . .}: Menge der natürlichen Zahlen N∗ = {1; 2; 3; . . .}: Menge der natürlichen Zahlen außer 0 (oder: Menge der positiven ganzen Zahlen) Z = {0; ±1; ±2; . . .}: Menge der ganzen Zahlen n o a mit a ∈ Z, b ∈ N∗ : Q = x|x = Menge der rationalen Zahlen b R: Menge der reellen Zahlen, √ Elemente dieser Menge sind z.B.: 0.5, 2, e, π Für die genannten Zahlenmengen gilt die Teilmengenbeziehung: N∗ ⊂ N ⊂ Z ⊂ Q ⊂ R. Intervalle sind Teilmengen der Menge R. Sie werden insbesondere bei der Untersuchung von Funktionen (siehe Kapitel 3) benötigt. Bezeichnungen für Intervalle Endliche Intervalle (es sei a, b ∈ R mit a < b): [a, b] = {x | a ≤ x ≤ b} abgeschlossenes Intervall [a, b) = {x | a ≤ x < b} halboffenes (rechtsoffenes) Intervall (a, b] = {x | a < x ≤ b} halboffenes (linksoffenes) Intervall (a, b) = {x | a < x < b} offenes Intervall Unendliche Intervalle: [a, ∞) = {x | a ≤ x < ∞} (a, ∞) = {x | a < x < ∞} (−∞, b] = {x | − ∞ < x ≤ b} (−∞, b) = {x | − ∞ < x < b} (−∞, ∞) = R Beispiel 1.9: 1.2.2 Begriff der komplexen Zahl, Gaußsche Zahlenebene √ Die Gleichung x2 + 1 = 0 hat im Bereich der reellen Zahlen keine Lösung, da −1 nicht definiert ist. ⇒ Zahlenbereichserweiterung, so dass Quadratwurzeln aus negativen Radikanden definiert sind Definition 1.4: Die Zahl j mit der Eigenschaft j2 = −1 (1) wird imaginäre Einheit genannt. 8 Mit Hilfe dieser Definition werden die komplexen Zahlen eingeführt: Definition 1.5: Unter einer komplexen Zahl versteht man eine Zahl mit der Darstellung z = a + b · j, (2) wobei a, b ∈ R und j aus (1). Dabei ist a der Realteil der komplexen Zahl z und b ist der Imaginärteil: a = Re(z), b = Im(z). Durch die Formel (2) ist die arithmetische Form (oder auch: kartesische Form) der komplexen Zahl gegeben. Beispiel 1.10: Die Menge der komplexen Zahlen wird mit dem Symbol C bezeichnet. Es gilt: R ⊂ C. Zwei komplexe Zahlen z1 = a + bj und z2 = c + dj sind genau dann gleich (d.h. z1 = z2 ), wenn gilt: a = c und b = d. Die Zahl z ∗ = a − bj ist die zu z = a + bj konjugiert-komplexe Zahl, d.h. bei z und z ∗ stimmen die Realteile überein, die Imaginärteile haben zueinander entgegengesetzte Vorzeichen. Beispiel 1.11: Allgemein gilt: (z ∗ )∗ = z. Jede reelle Zahl ist zu sich selbst konjugiert-komplex, da ihr Imaginärteil gleich 0 ist. Bemerkungen: - Die imaginäre Einheit wird auch mit i bezeichnet. In der Elektrotechnik bevorzugt man die Bezeichnung j, um Verwechslungen mit dem Momentanwert der Stromstärke zu vermeiden. - Für komplexe Zahlen gibt es - im Unterschied zu den reellen Zahlen - keine Anordnung im Sinne von <“ ” bzw. >“. ” Während man zur Veranschaulichung reeller Zahlen eine Zahlengerade verwendet, ist für komplexe Zahlen die Darstellung in der Gaußschen Zahlenebene üblich. Eine komplexe Zahl wird in der Gaußschen Zahlenebene als Bildpunkt oder als Zeiger dargestellt (siehe Bild 1.1, 1.2): Im(z) 6 b s P (z) 0 a Im(z) 6 b 0 Re(z) Bild 1.1: Darstellung als Bildpunkt Der komplexen Zahl z = a + bj wird der Bildpunkt P (z) = (a, b) zugeordnet. z = a + bj a - Re(z) Bild 1.2: Darstellung als Zeiger Die komplexe Zahl z = a + bj wird in Form eines Pfeils dargestellt, der vom Koordinatenursprung aus zum Bildpunkt P (z) gerichtet ist. Bezeichnung: z Die Bildpunkte der reellen Zahlen z = a + 0 · j = a liegen auf der reellen Achse, da Im(z) = 0 gilt. Die Bildpunkte der imaginären Zahlen z = 0 + bj = bj liegen auf der imaginären Achse, denn Re(z) = 0. 9 1.2.3 Grundrechenarten mit komplexen Zahlen Bei der Herleitung der Rechengesetze für komplexe Zahlen erfolgt eine komponentenweise Anwendung der Grundrechenarten für reelle Zahlen. Außerdem wird die Relation (1) verwendet. Im weiteren seien z1 = a + bj und z2 = c + dj beliebige komplexe Zahlen. I. Addition und Subtraktion z1 + z2 = (a + bj) + (c + dj) = a + c + (b + d)j (d.h.: Realteil der Summe = Summe der Realteile beider Summanden, Imaginärteil der Summe = Summe der Imaginärteile beider Summanden) z1 − z2 = (a + bj) − (c + dj) = a − c + (b − d)j (Rechenregel analog zur Addition) Beispiel 1.12: Die Summe (bzw. Differenz) zweier komplexer Zahlen kann auch eine reelle bzw. imaginäre Zahl sein, wie das folgende Beispiel zeigt: Sei z = a + bj , dann gilt: z + z ∗ = a + bj + a − bj = 2a sowie z − z ∗ = a + bj − (a − bj) = 2bj . Addition und Subtraktion komplexer Zahlen lassen sich mit Hilfe von Zeigern in der Gaußschen Zahlenebene wie folgt veranschaulichen. Im(z) Im(z) z3 z2 z2 1 −1 z1 1 z1 0 1 −1 Re(z) −1 0 1 z3 Re(z) −1 −z 2 Bild 1.3: Addition komplexer Zahlen z3 = z1 + z2 (entspricht der Konstruktion eines Parallelogramms mit den Seiten z 1 und z 2 sowie der Diagonalen z 3 ) Bild 1.4: Subtraktion komplexer Zahlen: z3 = z1 − z2 (entspricht der Konstruktion eines Parallelogramms mit den Seiten z 1 und −z 2 sowie der Diagonalen z 3 ) II. Multiplikation Sei z1 = a + bj, z2 = c + dj, dann gilt: z1 · z2 = (a + bj) · (c + dj) = ac + adj + bcj + bdj2 = ac − bd + (ad + bc)j (Nutzung des Distributivgesetzes für die Multiplikation sowie der Relation (1)) 10 Beispiel 1.13: Für weitere Berechnungen wird das Produkt einer komplexen Zahl z mit der konjugiert-komplexen Zahl z ∗ benötigt. Für z = a + bj gilt: z · z ∗ = (a + bj) · (a − bj) = a2 − abj + abj − b2 j2 = a2 + b2 (3) d.h. das Produkt z · z ∗ ist für beliebiges z ∈ C eine reelle Zahl. III. Division z Die Berechnung des Quotienten z1 : z2 zweier komplexer Zahlen erfolgt durch Erweitern des Bruches 1 mit der zum Nenner konjugiert-komplexen Zahl. Sei z1 = a + bj, z2 = c + dj (mit z2 6= 0), dann gilt gemäß Relation (3): a + bj (a + bj)(c − dj) ac + bd + (bc − ad)j ac + bd bc − ad z1 = = = = 2 + 2 j 2 2 z2 c + dj (c + dj)(c − dj) c +d c + d2 c + d2 Beispiel 1.14: Zusammenfassung: Grundrechenarten für komplexe Zahlen in der arithmetischen Form Sei z1 = a + bj und z2 = c + dj. Addition: z1 + z2 = a + c + (b + d)j Subtraktion: z1 − z2 = a − c + (b − d)j Multiplikation: z1 · z2 = ac − bd + (ad + bc)j Division: z1 ac + bd bc − ad = 2 + 2 j z2 c + d2 c + d2 (mit der zum Nenner konjug.-kompl. Zahl erweitern) Rechengesetze: Für beliebige Zahlen z1 , z2 , z3 ∈ C gilt: Kommutativgesetz: z 1 + z 2 = z 2 + z1 , Assoziativgesetz: z1 + (z2 + z3 ) = (z1 + z2 ) + z3 , Distributivgesetz: z1 · (z2 + z3 ) = z1 · z2 + z1 · z3 11 z1 · z2 = z2 · z1 z1 · (z2 · z3 ) = (z1 · z2 ) · z3 z2 1.2.4 Die Exponentialform einer komplexen Zahl Umrechnung zwischen arithmetischer und Exponentialform Bisher wurde die arithmetische Form einer komplexen Zahl: z = a + bj betrachtet. In diesem Abschnitt wird die Exponentialform eingeführt. Dabei wird die komplexe Zahl z durch die folgenden Größen charakterisiert: r : Betrag oder Norm der komplexen Zahl ϕ : Argument oder Phase der komplexen Zahl (zur Veranschaulichung: siehe Bild 1.5). Bild 1.5: Betrag der komplexen Zahl z = a + bj: Im(z) 6 Abstand des Bildpunktes P = P (z) der Zahl z vom Koordinatenursprung, √ r = |z| = a2 + b2 sP b r Argument der komplexen Zahl z = a + bj: Winkel, den die Strecke 0P mit der positiven reellen Halbachse bildet, ] ϕ - a 0 ϕ = arg z mit tan ϕ = Re(z) b a (a > 0, b ≥ 0) Die Exponentialform der komplexen Zahl z = a + bj lautet dann: z = r · e jϕ = |z| · e jϕ . (4) Umrechnung: arithmetische Form → Exponentialform Wenn eine komplexe Zahl in der Form z = a + bj gegeben ist, so werden die Größen r und ϕ für die Exponentialform (4) wie folgt berechnet: p r = a2 + b2 (5) a , falls b ≥ 0 und r > 0 arccos r a (6) ϕ= − arccos , falls b < 0 und r > 0 r unbestimmt, falls r = 0 . b Falls a > 0 und b ≥ 0 gilt, kann man zur Berechnung von ϕ auch die Formel ϕ = arctan verwenden. a Umrechnung: Exponentialform → arithmetische Form Bei gegebenen Werten für r und ϕ werden a und b folgendermaßen berechnet: a = r · cos ϕ, b = r · sin ϕ . (7) Bei der Umrechnung ist folgendes zu beachten: - Das Argument arg z einer komplexen Zahl ist nur bis auf Vielfache von 2π (bzw. 360◦ ) eindeutig bestimmt. Daher wird für das Argument meist der Hauptwert: −π < ϕ ≤ π (bzw. −180◦ < ϕ ≤ 180◦ ) angegeben. - Die Berechnung des Argumentes kann auch generell mit Hilfe der arctan-Funktion erfolgen. Die entsprechende Formel (mit Fallunterscheidung bzgl. der Vorzeichen von a und b) findet man z.B. in: W. G ÖHLER. Formelsammlung Höhere Mathematik, 16. Auflage, S. 1. b Beispielsweise gilt im Fall a > 0, b ≥ 0: ϕ = arctan , vgl. dazu auch Bild 1.5. a - Der Koordinatenursprung ist allein durch r = 0 bestimmt. Beispiel 1.15: 12 Beispiel 1.16: 1.2.5 Rechnen mit komplexen Zahlen in der Exponentialform In der Exponentialform sind Multiplikation und Division komplexer Zahlen sehr einfach darstellbar. I. Multiplikation Sei z1 = r1 · e jϕ1 und z2 = r2 · e jϕ2 , dann gilt2 : z1 · z2 = r1 · e jϕ1 · r2 · e jϕ2 = r1 · r2 · e jϕ1 · e jϕ2 = r1 · r2 · e j(ϕ1 +ϕ2 ) = r3 · e jϕ3 = z3 ⇒ Regel für Multiplikation: Beträge multiplizieren, Argumente addieren (r3 = r1 · r2 , ϕ3 = ϕ1 + ϕ2 ) Daraus folgt sofort auch: |z1 · z2 | = |z1 | · |z2 | . Beispiel 1.17: II. Division Sei wiederum z1 = r1 · e jϕ1 und z2 = r2 · e jϕ2 mit z2 6= 0, d.h. r2 6= 0. Dann gilt: z1 r e jϕ1 r r · e jϕ1 = 1 jϕ2 = 1 · jϕ2 = 1 · e j(ϕ1 −ϕ2 ) = r3 · e jϕ3 = z3 z2 r2 · e r2 e r2 ⇒ Regel für Division: Beträge dividieren, Argumente subtrahieren (r3 = r1 , ϕ 3 = ϕ1 − ϕ2 ) r2 z |z | Daraus folgt sofort auch: 1 = 1 . z2 |z2 | Beispiel 1.18: Zusammenfassung: Multiplikation und Division komplexer Zahlen in der Exponentialform Seien z1 , z2 ∈ C mit z1 = r1 · e jϕ1 und z2 = r2 · e jϕ2 . Multiplikation: z1 · z2 = r1 · r2 · e j(ϕ1 +ϕ2 ) Division: z1 r = 1 · e j(ϕ1 −ϕ2 ) (mit r2 6= 0) z2 r2 Bemerkung: Während die Multiplikation und Division komplexer Zahlen in der Exponentialform sehr einfach durchzuführen sind, ist für die Addition und Subtraktion die arithmetische Form günstiger. 2 Bei der Herleitung der Formeln für die Multiplikation und die Division werden Potenzgesetze genutzt, die vom Rechnen mit reellen Zahlen bekannt sind. Diese Gesetze können auch auf den Bereich der komplexen Zahlen übertragen werden. 13 2 Analytische Geometrie und Lineare Algebra 2.1 Skalare und vektorielle Größen In Naturwissenschaft und Technik treten skalare Größen und vektorielle Größen auf. Diese lassen sich folgendermaßen charakterisieren: skalare Größe vektorielle Größe durch Angabe von Maßzahl und Maßeinheit eindeutig bestimmt; z.B.: Masse m, Temperatur T , Widerstand R zusätzlich: Angabe der Richtung , in der diese Größe wirkt; z.B.: Geschwindigkeit ~v , Kraft F~ , ~ elektrische Feldstärke E Ein Vektor ist durch Angabe von Betrag (oder auch: Länge bzw. Maßzahl), Richtung und Richtungssinn (oder auch: Orientierung) eindeutig bestimmt. Ein dreidimensionaler Vektor kann durch einen Pfeil im dreidimensionalen Raum veranschaulicht werden, siehe Bild 2.1a). Die Länge des Pfeils entspricht dem Betrag dieses Vektors. Als Symbole für Vektoren benutzt man entweder: ~a, ~b, ~c, . . . oder fettgedruckte Kleinbuchstaben:3 a, b, c , . . . bzw. unterstrichene Kleinbuchstaben: a, b, c, . . . . Der Betrag eines Vektors ~a wird mit |~a| bezeichnet. Auch durch Angabe von Anfangs- und Endpunkt lässt sich ein Vektor eindeutig festlegen, siehe Bild 2.1b). z z P s J −→ PQ J J ^ Js ~a : Q y y x x Bild 2.1a) Bild 2.1b) Gleichheit von Vektoren: Vektoren heißen gleich, wenn Sie durch Parallelverschiebung ineinander überführt werden können, d.h. diese Vektoren stimmen in Betrag, Richtung und Richtungssinn überein. Spezielle Vektoren Nullvektor ~0 : Einheitsvektor ~e : −→ Ortsvektor ~r(P ) = OP : 2.2 Vektor vom Betrag 0 (keine Richtung angebbar) jeder Vektor vom Betrag 1 Vektor vom Koordinatenursprung O zum Punkt P Vektoroperationen Zu den elementaren Vektoroperationen gehören: die Addition und die Subtraktion von Vektoren sowie die Multiplikation eines Vektors mit einer reellen Zahl. Diese werden im folgenden erläutert. a) Addition von Vektoren: aus zwei Vektoren ~a und ~b wird der Summenvektor ~s = ~a + ~b gebildet, zur Veranschaulichung siehe Bild 2.2. ~b ~b ~s ~a ~b ~s ~a ~a ~ Bild 2.2: Veranschaulichung der Addition der Vektoren ~a und b und Darstellung des Summenvektors ~s als gerichtete Diagonale im Parallelogramm 3 Diese Schreibweise wird im Rahmen der Vorlesung nicht verwendet. 14 Unter Verwendung der Addition von Vektoren können auch Zerlegungen von Vektoren vorgenommen werden, d.h. es erfolgt die Darstellung eines Vektors als Summe zweier anderer Vektoren, von denen jeder eine bestimmte Richtung besitzt bzw. in einer bestimmten Ebene liegt. Beispiel 2.1:4 In der Zerspantechnik wird die Zerspankraft F~ in Hauptschnittkraft F~c (vertikale Komponente) und Nebenkraft F~N (horizontale Komponente) zerlegt. Die Nebenkraft F~N lässt sich in die Komponenten F~f (Vorschubkraft) und F~p (Passivkraft) zerlegen. b) Subtraktion von Vektoren: wird auf die Addition zurückgeführt, indem der Differenzvektor berechnet wird als d~ = ~a − ~b = ~a + (−~b ), siehe dazu Bild 2.3. ~b ~b d~ ~a ~a ~a d~ −~b Bild 2.3: Veranschaulichung der Subtraktion der Vektoren ~a und ~b und Darstellung des Differenzvektors d~ als gerichtete Diagonale im Parallelogramm c) Multiplikation eines Vektors mit einer reellen Zahl λ: es entsteht ein neuer Vektor ~b = λ~a mit folgenden Eigenschaften: (I) |~b| = |λ ~a| = |λ| · |~a| (II) Für λ > 0 sind ~a und ~b parallel, d.h. sie haben gleiche Richtung und gleichen Richtungssinn (siehe Bild 2.4a)); Schreibweise: ~a ↑↑ ~b. Für λ < 0 sind ~a und ~b antiparallel, d.h. sie haben zwar die gleiche Richtung, aber entgegengesetzten Richtungssinn (siehe Bild 2.4b)); Schreibweise: ~a ↑↓ ~b. Schließlich entsteht bei der Multiplikation mit λ = 0 der Nullvektor (folgt aus Eigenschaft (I)). λ~a ~a ~a λ~a Bild 2.4a): Multiplikation des Vektors ~a mit λ > 0 Bild 2.4b): Multiplikation des Vektors ~a mit λ < 0 Beispiel 2.2: 2.3 Vektoren im dreidimensionalen Raum 2.3.1 Darstellung von Vektoren Ausgangspunkt der Betrachtungen ist ein rechtshändiges kartesisches Koordinatensystem mit x-, y- und zAchse. Dieses wird festgelegt durch drei Einheitsvektoren (Basisvektoren) ~ex , ~ey und ~ez , welche senkrecht aufeinander stehen, siehe Bild 2.5. 4 Quelle: H. T SCH ÄTSCH , J. D IETRICH. Praxis der Zerspantechnik, 10. Auflage, S. 15 15 Mit Hilfe dieser Basisvektoren kann ein vom Nullpunkt (Koordinatenursprung) ausgehender Vektor ~a in der Form ~a = ~ax + ~ay + ~az = ax~ex + ay ~ey + az ~ez (8) dargestellt werden (vgl. Bild 2.6), wobei die reellen Zahlen ax , ay und az als Vektorkoordinaten bezeichnet werden. Die Darstellung (8) nennt man Komponentendarstellung des Vektors. Üblicherweise schreibt man ~a in Form eines Spaltenvektors: ax (9) ~a = ay . az Beispiel 2.3: z z ~az ~ez ~a ~ex ~ey y ~ax ~ay y x x Bild 2.5: Einheitsvektoren ~ex , ~ey und ~ez Bild 2.6: Darstellung ~a = ~ax + ~ay + ~az , mit ~ax , ~ay , ~az als Projektionen von ~a auf die Koordinatenachsen Gemäß der Darstellung (9) gilt: Betrag eines Vektors ~a im dreidimensionalen Raum: |~a| = q a2x + a2y + a2z Gleichheit zweier Vektoren: ~a = ~b ⇐⇒ ax = bx , ay = by und az = bz Bemerkung: Für die Basisvektoren im dreidimensionalen Raum sind auch die Bezeichnungen ~e1 , ~e2 , ~e3 bzw. ~i, ~j, ~k üblich. 2.3.2 Darstellung der Vektoroperationen Im Abschnitt 2.2 wurden die Vektoroperationen auf anschauliche Weise eingeführt. Nun sollen diese Operationen unter Verwendung der Komponentendarstellung von Vektoren erklärt werden. Weiterhin wird die Normierung eines Vektors definiert. 16 Addition und Subtraktion von Vektoren: ax ± bx bx ax ~a ± ~b = ay ± by = ay ± by az ± bz bz az Multiplikation eines Vektors mit einer reellen Zahl: λax ax (λ ∈ R) λ~a = λ ay = λay λaz az (10) (11) Normierung eines Vektors ~ a (~a 6= ~0) : ~ea = 1 ~a |~a| (~ea ist der in die gleiche Richtung wie ~a weisende Einheitsvektor) (12) Beispiel 2.4: Beispiel 2.5: Die Menge aller Vektoren ~a, die in der Form (9) mit ax , ay , az ∈ R dargestellt werden können, bildet mit den soeben erklärten Vektoroperationen (Addition und Multiplikation mit einer reellen Zahl) einen reellen Vektorraum5 . Mit Hilfe der genannten Rechenoperationen können Linearkombinationen von Vektoren gebildet werden. Seien λ1 , λ2 , . . . , λn ∈ R sowie ~a1 , ~a2 , . . . , ~an ∈ R3 , dann wird ein Ausdruck der Form λ1~a1 + λ2~a2 + . . . + λn~an als Linearkombination der Vektoren ~a1 , ~a2 , . . . , ~an bezeichnet. Definition 2.1: Die n Vektoren ~a1 , ~a2 , . . . , ~an sind linear unabhängig, wenn die Gleichung λ1~a1 + λ2~a2 + . . . + λn~an = ~0 nur die triviale Lösung λ1 = λ2 = . . . = λn = 0 hat. Anderenfalls sind diese Vektoren linear abhängig. Beispiel 2.6: 2.4 2.4.1 Produkte von Vektoren und ihre Anwendungen Skalarprodukt (inneres Produkt) Definition 2.2: Seien ~a und ~b zwei Vektoren und ϕ der von ihnen eingeschlossene Winkel (0 ≤ ϕ ≤ π). Unter dem Skalarprodukt von ~a und ~b versteht man die reelle Zahl c mit c = |~a| |~b| cos ϕ . (13) Die Schreibweise für das Skalarprodukt lautet: c = ~a · ~b . Es ist zu beachten, dass das Skalarprodukt zweier Vektoren eine reelle Zahl (kein Vektor!) ist. 5 Ein Vektorraum zeichnet sich dadurch aus, dass die Rechenoperationen gewissen Gesetzmäßigkeiten unterliegen. Im Rahmen dieser Vorlesung soll darauf nicht näher eingegangen werden. Es sei auf die Literaturstelle: W. L EUPOLD . Mathematik - ein Studienbuch für Ingenieure (Band 1), 2. Auflage, S. 231 verwiesen. 17 Rechengesetze für das Skalarprodukt: Kommutativgesetz: ~a · ~b = ~ Distributivgesetz: ~a · (b + ~c) = Multiplikation mit λ ∈ R: λ(~a · ~b) = ~b · ~a ~a · ~b + ~a · ~c (λ ~a) · ~b = ~a · (λ ~b) Skalarprodukte von Basisvektoren: ~ex · ~ey = ~ey · ~ez = ~ez · ~ex = 0, ~ex · ~ex = ~ey · ~ey = ~ez · ~ez = 1 Im folgenden wird eine Formel hergeleitet, welche die Berechnung des Skalarproduktes aus den Vektorkoordinaten ermöglicht. Dabei werden die soeben aufgeführten Gesetzmäßigkeiten genutzt. ~a · ~b = (ax ~ex + ay ~ey + az ~ez ) · (bx ~ex + by ~ey + bz ~ez ) ax bx (~ex · ~ex ) + ax by (~ex · ~ey ) + ax bz (~ex · ~ez ) = + ay bx (~ey · ~ex ) + ay by (~ey · ~ey ) + ay bz (~ey · ~ez ) + az bx (~ez · ~ex ) + az by (~ez · ~ey ) + az bz (~ez · ~ez ) Auf der rechten Seite dieser Gleichung entfallen alle Terme, in denen das Skalarprodukt zweier verschiedener Einheitsvektoren vorkommt, alle anderen Skalarprodukte haben den Wert 1. Damit entsteht die Gleichung ~a · ~b = ax bx + ay by + az bz . (14) Das Skalarprodukt zweier Vektoren ~a 6= ~0 und ~b 6= ~0 ist genau dann gleich 0, wenn diese Vektoren orthogonal sind; kurz: ~a ⊥ ~b ⇐⇒ ~a · ~b = 0. Beispiel 2.7: Aus Definition 2.2 folgt die Formel zur Berechnung des Winkels ϕ = ∠(~a, ~b) zwischen zwei Vektoren ~a und ~b : ~b ~ a · ϕ = ∠(~a, ~b) = arccos (~a 6= ~0, ~b 6= ~0 ). (15) |~a||~b| Beispiel 2.8: Für physikalische Berechnungen wird die Projektion eines Vektors auf einen anderen Vektor benötigt. Gegeben seien zwei Vektoren ~a und ~b, welche nicht die ~b gleiche Richtung besitzen. Gesucht ist die orthogonale Projektion von ~b auf ~a (siehe Bild 2.7), welche mit ~ba bezeichnet wird. Die Berechnung erfolgt mittels der q ϕ Formel ~ba = ~a · ~b |~a|2 b~a ~a . (16) 18 Bild 2.7 ~a Begründung für Formel (16): Beispiel 2.9: Eine weitere wichtige Anwendung des Skalarproduktes ist die Berechnung der mechanischen Arbeit. Ein Massepunkt werde durch die konstante Kraft F~ um die geradlinige Strecke ~s verschoben. Dann wird die an dem Massepunkt verrichtete mechanische Arbeit W berechnet nach: W = F~ · ~s . 2.4.2 (17) Vektorprodukt (Kreuzprodukt, äußeres Produkt) Definition 2.3: Das Vektorprodukt zweier Vektoren ~a und ~b ist ein Vektor ~c mit folgenden Eigenschaften: (I) ~c steht senkrecht auf ~a und auf ~b (II) |~c| = |~a||~b| sin ϕ (ϕ : von ~a und ~b eingeschlossener Winkel, wobei 0 ≤ ϕ ≤ π) (III) ~a, ~b und ~c bilden in dieser Reihenfolge ein rechtshändiges System. Die Schreibweise für das Vektorprodukt lautet: ~c = ~a × ~b . Es ist zu beachten, dass das Vektorprodukt zweier Vektoren ein Vektor (keine reelle Zahl!) ist. Zur geometrischen Deutung des Vektorproduktes: ~b Der Betrag |~a × ~b| des Vektorproduktes von ~a und ~b ist gleich b h dem Flächeninhalt des von diesen beiden Vektoren aufgespannten ϕ Parallelogramms (siehe Bild 2.8 und Definition 2.3): A = ah = ab sin ϕ = |~a||~b| sin ϕ = |~a × ~b| Rechengesetze für das Vektorprodukt: Anti-Kommutativgesetz: ~a × ~b Distributivgesetze: ~a × (~b + ~c) (~a + ~b) × ~c Multiplikation mit λ ∈ R: λ(~a × ~b) = = = = p a - ~a Bild 2.8: Veranschaulichung von |~a × ~b| −(~b × ~a) ~a × ~b + ~a × ~c ~a × ~c + ~b × ~c (λ ~a) × ~b = ~a × (λ ~b) Beziehungen zwischen den Basisvektoren: ~ex × ~ex = ~ey × ~ey = ~ez × ~ez = ~0 , ~ex × ~ey = ~ez , ~ey × ~ez = ~ex , ~ez × ~ex = ~ey Die Berechnung des Vektorproduktes aus den Vektorkoordinaten erfolgt nach der Formel: ax bx ay bz − az by ~a × ~b = ay × by = az bx − ax bz . az bz ax by − ay bx 19 (18) Beispiel 2.10: Beispiel 2.11: Das Vektorprodukt lässt sich auch formal durch eine dreireihige Determinante darstellen: ~ex ~ey ~ez ~a × ~b = ax ay az b b b x y z (Determinanten werden im Abschnitt 2.11 behandelt). Das Vektorprodukt tritt bei der Berechnung zahlreicher physikalischer Größen auf. Im weiteren werden einige dieser Anwendungen des Vektorproduktes aufgeführt. a) Berechnung von Drehmomenten Betrachtet wird ein starrer Körper in Form einer Kreisscheibe, der um seine Symmetrieachse drehbar gelagert ist. Eine im Punkt P angreifende (in der Scheibenebene liegende) Kraft F~ erzeugt ein ~ , das in der Form Drehmoment M ~ = ~r × F~ M ~ = ~r × F~ 6 M F~ 0 qQ 3 Q Q s p Q P darstellbar ist. Dabei bezeichnet ~r den Ortsvektor des Angriffspunktes P . b) Berechnung von Bahngeschwindigkeiten Die Bahngeschwindigkeit ~v eines Punktes eines rotierenden Körpers wird berechnet aus ~v = ω ~ × ~r . Dabei bezeichnet ω ~ die Winkelgeschwindigkeit und ~r den Ortsvektor. 2.4.3 Spatprodukt (gemischtes Produkt) Definition 2.4: Unter dem Spatprodukt dreier Vektoren ~a, ~b und ~c versteht man das Skalarprodukt aus den Vektoren ~a und ~b × ~c. Dafür wird die folgende Schreibweise verwendet: [ ~a ~b ~c ] = ~a · (~b × ~c). Zur geometrischen Deutung des Spatproduktes: Der Betrag des Spatproduktes [ ~a ~b ~c ] entspricht dem Volumen ~ b × ~c 6 des von den Vektoren ~a, ~b und ~c aufgespannten Spates, denn es gilt (siehe Bild 2.9 sowie Definitionen 2.2 und 2.4): V = Ah = |~b × ~c||~a| cos ϕ = |~a||~b × ~c| cos ϕ = |[ ~a ~b ~c ]| , wobei ϕ den Winkel bezeichnet, der von ~a und ~b ×~c eingeschlossen wird. Anstelle der Bezeichnung Spat“ sind auch die Bezeichnungen ” Parallelflach“ oder Parallelepiped“ üblich. ” ” ~ a h ~c ϕ 3 A = |~b × ~c | - ~b Bild 2.9: Veranschaulichung von |[ ~a ~b ~c ]| Gesetzmäßigkeiten für das Spatprodukt: Bei einer zyklischen Vertauschung der drei Vektoren ~a, ~b und ~c ändert sich das Spatprodukt nicht: [~a ~b ~c ] = [~b ~c ~a] = [~c ~a ~b] Die Vertauschung zweier Vektoren bewirkt stets einen Vorzeichenwechsel, z.B.: [ ~a ~b ~c ] = −[~a ~c ~b] (Vertauschung von ~b und ~c) Bilden die Vektoren ~a, ~b, ~c in dieser Reihenfolge ein Rechtssystem (Linkssystem), so ist das aus ihnen gebildete Spatprodukt stets positiv (negativ). 20 Unter Verwendung der Formeln (14) und (18) ergibt sich für die Berechnung des Spatproduktes aus den Vektorkoordinaten: by cz − bz cy ax (19) [ ~a ~b ~c ] = ay · bz cx − bx cz = ax (by cz − bz cy ) + ay (bz cx − bx cz ) + az (bx cy − by cx ) . bx cy − by cx az Eine einfachere Berechnung des Spatproduktes ist möglich, wenn es in Form einer dreireihigen Determinante geschrieben wird: ax ay az ax bx cx (20) [ ~a ~b ~c ] = bx by bz = ay by cy c c c a b c z z z x y z (d.h. die Vektoren ~a, ~b und ~c werden entweder als Zeilen oder als Spalten in die Determinante eingetragen). Beispiel 2.12: Aus der geometrischen Deutung des Spatproduktes folgt sofort eine einfache geometrische Anwendung, nämlich die Berechnung des Volumens eines Spates, der von drei gegebenen Vektoren aufgespannt wird. In engem Zusammenhang damit steht die Berechnung des Volumens eines Tetraeders. Seien ~a, ~b und ~c drei Vektoren, die ein Tetraeder (d.h. eine dreiseitige ~a Pyramide) bestimmen, siehe Bild 2.10. Dann gilt für das Volumen VT dieses Tetraeders: ~c 1 1 VT = VSpat = |[ ~a ~b ~c ]| . 6 6 Dabei bezeichnet VSpat das Volumen des Spates, der von ~a, ~b und ~c aufgespannt wird. ~b Bild 2.10: Durch ~a, ~b und ~c bestimmtes Tetraeder Vektoren, die in einer gemeinsamen Ebene bzw. in parallelen Ebenen liegen, werden komplanare Vektoren genannt. Mit Hilfe des Spatproduktes kann entschieden werden, ob drei Vektoren komplanar sind. Es gilt die folgende Aussage: [ ~a ~b ~c ] = 0 ⇐⇒ ~a, ~b und ~c sind komplanar . Beispiel 2.13: Allgemein gilt: Drei komplanare Vektoren sind stets linear abhängig (vgl. Definition 2.1). Somit kann das Spatprodukt auch verwendet werden, um die lineare (Un)abhängigkeit von Vektoren festzustellen. Fortsetzung zu Beispiel 2.13: 21 Abschließend wird ein physikalisches Anwendungsbeispiel für das Spatprodukt angegeben. Beispiel 2.14: Eine Flüssigkeit fließt mit konstanter Geschwindigkeit ~v (gemessen in m/s) durch eine von den Vektoren ~a und ~b (gemessen in m) aufgespannte Parallelogramm-Fläche. Dann hat die Flüssigkeitsmenge, welche in einer Sekunde durch diese Fläche strömt, das Volumen V = |[ ~a ~b ~v ]| m3 . 2.5 Geraden und Ebenen 2.5.1 Darstellung von Geraden Im folgenden werden zwei Möglichkeiten zur Darstellung von Geraden im dreidimensionalen Raum betrachtet. a) Punkt-Richtungs-Form einer Geraden Eine Gerade g soll durch den Punkt P1 mit dem Ortsvektor x1 ~r1 = a (Richtungsvektor) verlaufen. y1 und parallel zu einem vorgegebenen Vektor ~ z1 Die vektorielle Punkt-Richtungs-Form der Geraden lautet dann: ~r(P ) = ~r(λ) = ~r1 + λ~a oder x x1 ax y = y1 + λ ay , z z1 az (21) wobei die folgenden Bezeichnungen gelten: ~r(P ) : ~r1 : ~a : λ: Ortsvektor des laufenden Punktes der Geraden Ortsvektor des gegebenen Punktes P1 der Geraden gegebener Richtungsvektor reeller Parameter. Begründung für Formel (21): Sei P der laufende Punkt der Geraden g, so gilt für den zugehörigen Ortsvektor (siehe Bild 2.11): P1 ~r1 −→ ~a ~r(P ) = ~r1 + P1 P . −→ λ~a P −→ ~r(P ) 0 −→ Da die Vektoren P1 P und ~a die gleiche Richtung haben, gilt: P1 P = λ~a (λ: geeigneter reeller Parameter), d.h. g ~r(P ) = ~r1 + P1 P = ~r1 + λ~a . Bild 2.11: Gerade mit Richtungsvektor Beispiel 2.15: b) Zwei-Punkte-Form einer Geraden x1 Eine Gerade g soll durch die beiden Punkte P1 und P2 mit den Ortsvektoren ~r1 = y1 z1 x2 und ~r2 = y2 verlaufen. z2 Die vektorielle Zwei-Punkte-Form der Geraden lautet dann: x x1 x2 − x1 y = y1 + λ y2 − y1 ~r(P ) = ~r(λ) = ~r1 + λ(~r2 − ~r1 ) oder z z1 z2 − z1 (Bezeichnungen siehe unter a)). 22 (22) Begründung für Formel (22): P1 ~r2 − ~r1 P~2 ~r1 ~r2 0 λ(~r2 − ~r1 ) P ~r(P ) g Sei P der laufende Punkt der Geraden g, so gilt für den zugehörigen Ortsvektor (siehe Bild 2.12): −→ ~r(P ) = ~r1 + P1 P . −→ −→ Da die Vektoren P1 P und P1 P2 = ~r2 − ~r1 die gleiche Richtung besitzen, −→ −→ gilt: P1 P = λ P1 P2 = λ(~r2 − ~r1 ) (λ: geeigneter reeller Parameter), d.h. −→ −→ ~r(P ) = ~r1 + P1 P = ~r1 + λ P1 P2 = ~r1 + λ(~r2 − ~r1 ). Bild 2.12: Gerade durch zwei Punkte Beispiel 2.16: 2.5.2 Lagebeziehungen von Geraden Die Geraden g1 und g2 seien gegeben durch: ~r(λ1 ) = ~r1 + λ1~a1 sowie ~r(λ2 ) = ~r2 + λ2~a2 (λ1,2 ∈ R). Diese Geraden können folgende Lagebeziehungen zueinander haben: a) g1 und g2 sind zueinander parallel a1) g1 und g2 fallen zusammen a2) g1 und g2 fallen nicht zusammen b) g1 und g2 schneiden sich in genau einem Punkt c) g1 und g2 sind windschief (nicht parallel, kein Schnittpunkt) zu a) Parallelität der Geraden liegt genau dann vor, wenn die Richtungsvektoren ~a1 und ~a2 die gleiche Richtung haben, d.h. wenn gilt: ~a1 × ~a2 = ~0 (vgl. dazu Definition 2.3) bzw. λ~a1 = ~a2 mit λ ∈ R \ {0}. Der Abstand d zweier paralleler Geraden wird berechnet nach: d= |~a1 × (~r2 − ~r1 )| . |~a1 | (23) Daraus folgt unmittelbar: Fall a1) tritt ein, wenn ~a1 × (~r2 − ~r1 ) = ~0. Fall a2) tritt ein, wenn ~a1 × (~r2 − ~r1 ) 6= ~0. Beispiel 2.17: zu b) Wenn die Richtungsvektoren ~a1 und ~a2 nicht die gleiche Richtung haben, dann kann durch Gleichsetzen der Vektorkoordinaten von ~r(λ1 ) und ~r(λ2 ) überprüft werden, ob die Geraden einen gemeinsamen Punkt besitzen. Hat das entstehende lineare Gleichungssystem zur Bestimmung von λ1 und λ2 eine Lösung ⇒ Die Geraden g1 und g2 schneiden sich in genau einem Punkt. Andere Möglichkeit: Falls ~a1 und ~a2 nicht die gleiche Richtung haben sowie [ ~a1 ~a2 (~r2 − ~r1 ) ] = 0 gilt ⇒ Die Geraden g1 und g2 schneiden sich in genau einem Punkt. Beispiel 2.18: zu c) Wenn die Richtungsvektoren ~a1 und ~a2 nicht die gleiche Richtung haben und das lineare Gleichungssystem zur Bestimmung von λ1 und λ2 (vgl. b)) keine Lösung besitzt ⇒ Die Geraden g1 und g2 sind windschief. Andere Möglichkeit: Falls ~a1 und ~a2 nicht die gleiche Richtung haben sowie [ ~a1 ~a2 (~r2 − ~r1 ) ] 6= 0 gilt ⇒ Die Geraden g1 und g2 sind windschief. Der Abstand d zweier windschiefer Geraden wird berechnet nach: d= |[ ~a1 ~a2 (~r2 − ~r1 ) ]| . |~a1 × ~a2 | Beispiel 2.19: (24) 23 2.5.3 Darstellung von Ebenen Es werden drei Möglichkeiten zur Darstellung von Ebenen im dreidimensionalen Raum betrachtet. a) Punkt-Richtungs-Form einer Ebene x1 Eine Ebene E soll durch den Punkt P1 mit dem Ortsvektor ~r1 = a y1 und parallel zu zwei Vektoren ~ z1 und ~b (Richtungsvektoren) verlaufen. Dabei wird vorausgesetzt, dass ~a und ~b verschiedene Richtungen haben. Die vektorielle Punkt-Richtungs-Form der Ebene lautet dann: x x1 ax bx ~r(P ) = ~r(λ, µ) = ~r1 + λ~a + µ~b oder y = y1 + λ ay + µ by (25) z z1 az bz mit den folgenden Bezeichnungen: ~r(P ) : ~r1 : ~a, ~b : λ, µ : Ortsvektor des laufenden Punktes der Ebene Ortsvektor des gegebenen Punktes P1 der Ebene gegebene Richtungsvektoren reelle Parameter. Begründung für Formel (25): µ~b ~b P1 P −→ P1 P ~a Sei P der laufende Punkt der Ebene E, so gilt für den −→ in der Ebene liegenden Vektor P1 P (siehe Bild 2.13): −→ P1 P = λ~a + µ~b ~r(P ) λ~a ~r1 0 E mit geeigneten, voneinander unabhängigen, reellen Parametern λ und µ. Der Ortsvektor von P ist dann darstellbar als: −→ ~r(P ) = ~r1 + P1 P = ~r1 + λ~a + µ~b. Bild 2.13: Ebene mit zwei Richtungsvektoren Beispiel 2.20: b) Drei-Punkte-Form einer Ebene Eine Ebene E soll durch drei voneinander verschiedene Punkte P1 , P2 und P3 mit den Ortsvektoren ~r1 , ~r2 und ~r3 verlaufen. Dabei wird vorausgesetzt, dass diese Punkte nicht auf einer gemeinsamen Geraden liegen (d.h. die Vektoren ~r2 − ~r1 und ~r3 − ~r1 dürfen nicht die gleiche Richtung haben). Die vektorielle Drei-Punkte-Form der Ebene ist gegeben durch: ~r(P ) = ~r(λ, µ) = ~r1 + λ(~r2 − ~r1 ) + µ(~r3 − ~r1 ) (26) oder x x1 x2 − x1 x3 − x1 y = y1 + λ y2 − y1 + µ y3 − y1 z z1 z2 − z1 z3 − z1 (Bezeichnungen siehe unter a)). 24 (27) Begründung für Formel (26): P3 ~r3 P1 ~r1 P ~r(P ) Der Ortsvektor des laufenden Punktes P der Ebene E ist darstellbar in der Form (siehe Bild 2.14): P2 −→ E −→ ~r(P ) = ~r1 + λ P1 P2 + µ P1 P3 mit geeigneten, voneinander unabhängigen, reellen Parametern λ und µ. Weiterhin gilt: −→ −→ P1 P2 = ~r2 − ~r1 , P1 P3 = ~r3 − ~r1 und somit ~r2 0 ~r(P ) = ~r1 + λ(~r2 − ~r1 ) + µ(~r3 − ~r1 ). Bild 2.14: Ebene, festgelegt durch drei Punkte Beispiel 2.21: c) Gleichung einer Ebene senkrecht zu einem Vektor Eine Ebene E soll den Punkt P1 mit dem Ortsvektor ~r1 enthalten und senkrecht zu einem Vektor ~n verlaufen. Die Ebene kann in der parameterfreien Form ~n · (~r − ~r1 ) = 0 oder ax + by + cz + d = 0 (28) dargestellt werden. Der Vektor ~n wird Normalenvektor genannt, alle weiteren Bezeichnungen siehe unter a). Die Koeffizienten a, b und c in (28) sind die Koordinaten des Normalenvektors. Begründung für Formel (28): ~n P1 · ~r1 ~r − ~r1 P ~r E Sei ~r der Ortsvektor des laufenden Punktes P der Ebene E, −→ dann liegt der Vektor P1 P = ~r − ~r1 in dieser Ebene und steht daher senkrecht auf dem Normalenvektor ~n (siehe Bild 2.15). Somit muss das Skalarprodukt dieser Vektoren gleich 0 sein, d.h. ~n · (~r − ~r1 ) = 0 oder ~n · ~r = ~n · ~r1 . 0 Bild 2.15: Ebene mit Normalenvektor Beispiel 2.22: Wenn in (28) speziell ein Einheitsnormalenvektor ~n0 gewählt wird, dann erhält man die Hessesche Normalform der Ebenengleichung: ~n0 · (~r − ~r1 ) = 0 oder ax + by + cz + d √ = 0. a2 + b2 + c2 Dabei ist |~n0 · ~r1 | der Abstand der Ebene vom Koordinatenursprung. 25 (29) Mit Hilfe der Hesseschen Normalform lässt sich der Abstand eines Punktes P ∗ zu einer Ebene E berechnen. Sei E in der Hesseschen Normalform ~n0 · (~r − ~r1 ) = 0 bzw. a0 x + b0 y + c0 z + d0 = 0 ∗ x a0 mit ~n0 = b0 gegeben und sei ~r ∗ = y ∗ der Ortsvektor von P ∗ . c0 z∗ Dann erhält man den gesuchten Abstand d(P ∗ , E) aus der folgenden Formel: d(P ∗ , E) = ~n0 · (~r ∗ − ~r1 ) bzw. d(P ∗ , E) = a0 x∗ + b0 y ∗ + c0 z ∗ + d0 , (30) d.h. der Ortsvektor des Punktes P ∗ wird in die linke Seite der Hesseschen Normalform eingesetzt. Fortsetzung zu Beispiel 2.22: Bemerkung: Bei der Berechnung des Abstandes d(P ∗ , E) entsteht ggf. ein negativer Zahlenwert. Falls d(P ∗ , E) < 0, liegen P ∗ und der Koordinatenursprung auf derselben Seite der Ebene E. Im Fall d(P ∗ , E) > 0 liegen P ∗ und der Koordinatenursprung auf verschiedenen Seiten der Ebene E. 2.6 Vektoren im Rn Vektoren mit mehr als drei Koordinaten werden z.B. bei der Multiplikation von Matrizen (siehe Abschnitt 2.9.3) und bei der Lösung linearer Gleichungssysteme (siehe Abschnitt 2.12) benötigt. a1 a2 Seien a1 , a2 , . . . , an ∈ R (n ∈ N∗ ), dann ist durch die Darstellung ~a = . ein Vektor mit n reellen .. an Koordinaten gegeben. Die Addition und Subtraktion derartiger Vektoren sowie die Multiplikation mit einer reellen Zahl sind analog zu diesen Rechenoperationen mit Vektoren im R3 definiert (siehe Abschnitt 2.3.2). Addition und Subtraktion von Vektoren mit n reellen Koordinaten: a1 b1 a1 ± b1 a2 b2 a2 ± b2 ~a ± ~b = . ± . = .. . . . . . an bn an ± bn Multiplikation eines Vektors mit einer reellen Zahl: a1 λa1 a2 λa2 λ~a = λ . = . (λ ∈ R) .. .. an λan Die Menge aller Vektoren mit n reellen Koordinaten bildet zusammen mit den soeben erklärten Rechenoperationen einen reellen Vektorraum, welcher mit Rn bezeichnet wird (n ∈ N∗ ). Es ist zu beachten, dass für n ≥ 4 keine anschauliche Darstellung der Vektoren als Pfeile möglich ist. Die Basisvektoren im Rn sind gegeben durch: 1 0 0 0 0 1 0 0 ~e1 = 0 , ~e2 = 0 , . . . , ~en−1 = ... , ~en = ... . .. .. . . 1 0 0 0 1 0 26 Jeder Vektor aus dem Raum Rn lässt sich als Linearkombination (vgl. Abschnitt 2.3.2) dieser Basisvektoren darstellen. Analog zu den entsprechenden Definitionen für Vektoren im R3 können auch im Rn das Skalarprodukt und der Betrag eingeführt werden6 . Skalarprodukt von Vektoren im Rn : b1 a1 n a2 b2 X ak bk ~a · ~b = . · . = a1 b1 + a2 b2 + . . . + an bn = .. .. k=1 an bn Betrag eines Vektors ~ a ∈ Rn : v u n q uX 2 2 2 |~a| = a1 + a2 + . . . + an = t a2k k=1 Beispiel 2.23: 2.7 Kurven 2. Ordnung Für praktische Anwendungen sind Kurven 2. Ordnung von besonderer Bedeutung. Derartige Kurven werden allgemein durch Gleichungen der Form Ax2 + Bxy + Cy 2 + Dx + Ey + F = 0 mit A2 + C 2 6= 0 (31) beschrieben. Man bezeichnet diese Kurven auch als Kegelschnitte, da sie als Schnittkurven auftreten, wenn ein gerader Kreiskegel von einer Ebene geschnitten wird. Je nach Wahl der Koeffizienten A, B, . . . , F in der Gleichung (31) entstehen verschiedene Kegelschnitte, die im folgenden erläutert werden. 1) Kreis Ein Kreis mit dem Mittelpunkt M und dem Radius r ist die Menge aller Punkte einer Ebene, die von dem Punkt M den konstanten Abstand r (r > 0) haben. Allgemeine Kreisgleichung Der Punkt M (xM , yM ) sei der Mittelpunkt eines Kreises mit dem Radius r (siehe Bild 2.16). Dann gilt für die Koordinaten (x, y) der Punkte, die auf diesem Kreis liegen, die Gleichung (x − xM )2 + (y − yM )2 = r2 . (32) Die Gleichung (32) erlangt eine besonders einfache Form, wenn der Mittelpunkt des Kreises im Koordinatenursprung liegt: x2 + y 2 = r2 . Eine Parameterdarstellung des Kreises mit dem Mittelpunkt im Koordinatenursprung und dem Radius r = 1 (Einheitskreis) wird im Beispiel 3.17b) angegeben. Die Rechenregel (14) für Vektoren im R3 wird formal auf Vektoren im Rn , n ∈ N∗ , übertragen. Dagegen sind das Vektorprodukt und das Spatprodukt für Vektoren im Rn mit n ≥ 4 nicht definiert! 6 27 y y 6 6 b r P r r yM −a M rz F1 e }| M { F2 a - x −b xM 0 x Bild 2.16 Bild 2.17 Beispiel 2.24: 2) Ellipse Eine Ellipse ist die Menge aller Punkte der Ebene, für die die Summe ihrer Abstände von zwei festen Punkten (den Brennpunkten F1 und F2 ) konstant ist. Allgemeine Ellipsengleichung Gegeben sei eine Ellipse in achsenparalleler Lage mit dem Mittelpunkt M (xM , yM ) sowie den Halbachsen a und b (siehe Bild 2.17; dort gilt speziell: xM = yM = 0). Dann gilt für die Koordinaten (x, y) der Punkte, die auf dieser Ellipse liegen, die Gleichung (x − xM )2 (y − yM )2 + = 1. a2 b2 (33) Wird der Abstand der beiden Brennpunkte mit 2e bezeichnet, besteht zwischen den Größen a, b und e die Beziehung: a2 − e2 = b2 . Wenn sich der Mittelpunkt der Ellipse im Koordinatenursprung befindet, vereinfacht sich die Gleichung (33) zu: x2 y2 + 2 a2 b = 1. Eine Parameterdarstellung einer solchen Ellipse wird im Beispiel 3.17b) betrachtet. Beispiel 2.25: 28 3) Hyperbel Eine Hyperbel ist die Menge aller Punkte der Ebene, für die die Differenz ihrer Abstände von zwei festen Punkten (den Brennpunkten F1 und F2 ) konstant ist. Allgemeine Hyperbelgleichung Gegeben sei eine Hyperbel in achsenparalleler Lage mit dem Mittelpunkt M (xM , yM ) sowie den Halbachsen a (reelle Halbachse) und b (imaginäre Halbachse), siehe Bild 2.18. Dann erfüllen die Koordinaten (x, y) der Punkte, die auf dieser Hyperbel liegen, die Gleichung (x − xM )2 (y − yM )2 − = 1. a2 b2 (34) Wird der Abstand der beiden Brennpunkte mit 2e bezeichnet, besteht zwischen den Größen a, b und e die Beziehung: e2 − a2 = b2 . Eine Hyperbel, deren Mittelpunkt im Koordinatenursprung liegt, wird durch die Gleichung x2 y2 − 2 2 a b =1 beschrieben (siehe Formel (34), jetzt mit xM = yM = 0). Die Asymptoten (siehe Abschnitt 3.3.2) einer b a solchen Hyperbel sind die beiden Geraden y = ± x. y y 6 6 Asymptoten HH Leitlinie HH b F1 r −a M F2 a p z}|{ r x S F x −b Bild 2.18: Hyperbel mit Asymptoten Bild 2.19: Parabel mit Leitlinie Beispiel 2.26: 4) Parabel Eine Parabel ist die Menge aller Punkte der Ebene, deren Abstände von einer festen Geraden (Leitlinie) und einem festen Punkt (dem Brennpunkt F ) gleich sind. Allgemeine Parabelgleichung Sei |p| der Abstand zwischen dem Brennpunkt und der Leitlinie einer Parabel, deren Scheitelpunkt im Punkt S(xS , yS ) liegt und deren Symmetrieachse parallel zur x-Achse verläuft (siehe Bild 2.19). Dann genügen die Koordinaten (x, y) der Punkte, die auf dieser Parabel liegen, der folgenden Gleichung: (y − yS )2 = 2p(x − xS ) . (35) Im Fall p > 0 ist die Parabel nach rechts geöffnet (wie im Bild 2.19 dargestellt). Für p < 0 ist die Parabel nach links geöffnet. 29 Eine Parabel, deren Scheitelpunkt im Koordinatenursprung liegt, wird durch die Gleichung y 2 = 2px beschrieben (siehe Formel (35), jetzt mit xS = yS = 0). Die Gleichung einer Parabel, deren Scheitelpunkt im Punkt S(xS , yS ) liegt und deren Symmetrieachse parallel zur y-Achse verläuft liegt, lautet: (x − xS )2 = 2p(y − yS ). Für p > 0 ist diese Parabel nach oben, für p < 0 nach unten geöffnet. Beispiel 2.27: Bemerkung: Bei den betrachteten Kegelschnitten galt stets B = 0 in der Gleichung (31), d.h. es existierte kein Summand, der das Produkt x · y enthält. Wenn in (31) jedoch B 6= 0 gilt, dann sind die Symmetrieachsen der betrachteten Kegelschnitte nicht mehr (wie bisher) parallel zu den Koordinatenachsen. Die Kegelschnitte können dann durch Drehung des Koordinatensystems in achsenparallele Lage gebracht werden. 2.8 2.8.1 Matrizen: eine kurze Einführung Definition einer Matrix Definition 2.5: Unter einer Matrix A vom Typ (m, n) versteht man ein aus m·n reellen (bzw. komplexen) Zahlen bestehendes rechteckiges Schema mit m Zeilen und n Spalten: a11 a12 . . . a1k . . . a1n a21 a22 . . . a2k . . . a2n .. .. .. .. . . . . A= ai1 ai2 . . . aik . . . ain m Zeilen .. .. .. .. . . . . am1 am2 . . . amk . . . amn n Spalten Bezeichungen: i - Zeilenindex k - Spaltenindex aik - Matrixelement (Element in der i-ten Zeile und k-ten Spalte von A) Im Fall m = n nennt man die Matrix A eine n-reihige quadratische Matrix. Beispiel 2.28: −2 1 3 4 a) A = ist eine Matrix vom Typ (2, 4). 2 0 −5 7 Matrixelemente von A sind z.B.: a11 = −2, a13 = 3, a24 = 7. −2 −3 B= ist eine 2-reihige quadratische Matrix. 1 5 2 30 b) In der Logistik haben Transportmengenmatrizen eine große Bedeutung. Es wird davon ausgegangen, dass für ein bestimmtes Fördergut m Angebotsorte A1 , A2 , . . . , Am und n Bedarfsorte B1 , B2 , . . . , Bn vorhanden sind. Das Element tij der Transportmengenmatrix T gibt an, wieviele Mengeneinheiten des Fördergutes vom Angebotsort Ai zum Bedarfsort Bj zu transportieren sind. Beispielsweise kann man aus der Transportmengenmatrix T : von \ nach B1 B2 B3 B4 A1 A2 A3 10 15 30 0 20 0 40 0 40 100 80 60 ablesen, dass vom Angebotsort A1 10 Mengeneinheiten zum Bedarfsort B1 zu transportieren sind, denn es gilt: t11 = 10. Dagegen kann aus t12 = 0 geschlussfolgert werden, dass kein Transport von A1 nach B2 erfolgt. Bemerkung: Als Bezeichnung für Matrizen können auch unterstrichene Großbuchstaben oder fettgedruckte Großbuchstaben verwendet werden7 . Weitere Bezeichnungen im Zusammenhang mit Matrizen Spaltenmatrix: Matrix mit nur einer Spalte (auch Spaltenvektor genannt) a1 a2 Sie ist vom Typ (m, 1) und besitzt die Form: A = . .. . am Zeilenmatrix: Matrix mit nur einer Zeile (auch Zeilenvektor genannt) Sie ist vom Typ (1, n) und besitzt die Form: A = (a1 a2 . . . an ) . Die Zeilen einer Matrix werden auch als Zeilenvektoren, die Spalten auch als Spaltenvektoren bezeichnet. Eine Matrix vom Typ (m, n) enthält genau m Zeilenvektoren und n Spaltenvektoren: a11 a12 . . . a1k . . . a1n ← ~a1 a21 a22 . . . a2k . . . a2n ← ~a2 .. .. .. .. . Zeilenvektoren . . . A= ai1 ai2 . . . aik . . . ain ← ~a i .. .. .. .. . . . . ← ~a m am1 am2 . . . amk . . . amn ↑ ↑ ↑ ↑ ~a1 ~a2 ~ak ~an Spaltenvektoren Es gilt: ~ak ∈ Rm für alle Spaltenvektoren und ~a i ∈ Rn für alle Zeilenvektoren einer Matrix vom Typ (m, n). Definition 2.6: Werden in einer Matrix A die Zeilen und Spalten miteinander vertauscht, so erhält man die Transponierte AT der Matrix A . Beispiel 2.29: −2 2 1 0 Für die Matrix A aus Beispiel 2.28a) gilt: AT = 3 −5 4 7 7 Diese Schreibweisen werden im Rahmen der Vorlesung nicht benutzt. 31 (Matrix vom Typ (4, 2)) Allgemein gilt: A ist vom Typ (m, n) ⇒ AT ist vom Typ (n, m) . T Zweimaliges Transponieren ergibt wieder die Ausgangsmatrix: AT = A . Das Element aTik der transponierten Matrix AT ist gleich dem Element aki der Matrix A . Definition 2.7: Zwei Matrizen A = (aik ) und B = (bik ) vom gleichen Typ (m, n) heißen gleich: A = B , wenn alle Matrixelemente übereinstimmen, d.h. wenn aik = bik für alle i, k gilt (i = 1, 2, . . . , m; k = 1, 2, . . . , n). Beispiel 2.30: 2.8.2 Spezielle Matrizen Als Nullmatrix (Schreibweise: 0 ) bezeichnet man eine Matrix, bei der alle Elemente den Wert 0 haben. Eine Nullmatrix kann von beliebigem Typ sein. Die weiteren Aussagen beziehen sich ausschließlich auf n-reihige quadratische Matrizen. Diagonalmatrix: alle außerhalb der Hauptdiagonalen liegenden Elemente sind gleich 0, d.h. es gilt: aik = 0 für i 6= k (i, k = 1, 2, . . . , n) a11 0 . . . 0 2 0 0 0 0 a22 . . . 0 0 −1 0 0 allgemein: . , Beispiel: A = . . . 0 .. .. .. 0 5 0 .. 0 0 0 13 0 0 . . . ann Einheitsmatrix: Diagonalmatrix mit den Diagonalelementen aii = 1 Schreibweise: E (auch: En bzw. I oder In ) 1 0 Beispiel für eine Einheitsmatrix: E = 0 1 0 0 (i = 1, 2, . . . , n) 0 0 1 Dreiecksmatrix: alle Elemente oberhalb der Hauptdiagonalen sind gleich 0 (untere Dreiecksmatrix) oder: alle Elemente unterhalb der Hauptdiagonalen sind gleich 0 (obere Dreiecksmatrix) −2 0 0 Beispiel für eine untere Dreiecksmatrix: A = 1 3 0 4 6 5 (Hier gilt: aik = 0 für i < k.) 2 −7 1 3 0 5 8 5 Beispiel für eine obere Dreiecksmatrix: A = 0 0 4 −6 0 0 0 −4 (Hier gilt: aik = 0 für i > k.) symmetrische Matrix: es gilt: aik = aki für alle i und k (i, k = 1, 2, . . . , n), d.h. die Matrixelemente sind spiegelsymmetrisch zur Hauptdiagonalen ⇒ AT = A 1 −2 5 8 0 Beispiel für eine symmetrische Matrix: A = −2 5 0 −3 32 antisymmetrische oder schiefsymmetrische Matrix: 2.9 2.9.1 es gilt: aik = −aki für alle i und k (i, k = 1, 2, . . . , n) ⇒ AT = −A , für k = i folgt speziell: aii = −aii , d.h. aii = 0 (i = 1, 2, . . . , n) 0 −4 3 0 −6 Beispiel für eine antisymmetrische Matrix: A = 4 −3 6 0 Rechenoperationen mit Matrizen Addition und Subtraktion von Matrizen Addition und Subtraktion erfolgen elementweise (wie bei Vektoren). Diese Rechenoperationen sind nur möglich unter der Voraussetzung, dass die entsprechenden Matrizen vom gleichen Typ sind. Addition und Subtraktion Seien A und B Matrizen vom Typ (m, n). Dann gilt für die Elemente cik der Matrix C = A + B : cik = aik + bik sowie für die Elemente dik der Matrix D = A − B : dik = aik − bik (i = 1, 2, . . . , m; k = 1, 2, . . . , n). Weiterhin gelten das Kommutativgesetz: A+B =B+A sowie das Assoziativgesetz: A + (B + C) = (A + B) + C . Beispiel 2.31: 2.9.2 Multiplikation einer Matrix mit einem Skalar Die Multiplikation einer Matrix mit einem Skalar (d.h. mit einer reellen Zahl) erfolgt so, dass jedes Element dieser Matrix mit diesem Skalar multipliziert wird. Multiplikation mit einem Skalar Sei A eine beliebige Matrix vom Typ (m, n). Durch Multiplikation dieser Matrix mit einer beliebigen Zahl λ ∈ R entsteht die Matrix λ · A , welche die Elemente λ · aik (i = 1, 2, . . . , m; k = 1, 2, . . . , n) hat. Besitzen alle Elemente einer Matrix einen gemeinsamen Faktor, so kann dieser vor die Matrix gezogen werden. Für die Multiplikation einer Matrix mit einem Skalar gelten folgende Gesetze Assoziativgesetz: λ(µA) = (λµ)A sowie die Distributivgesetze: (λ + µ)A = λA + µA und λ(A + B) = λA + λB . Beispiel 2.32: 33 2.9.3 Multiplikation von Matrizen Das Produkt A · B zweier Matrizen A und B kann nur dann gebildet werden, wenn gilt: Anzahl der Spalten von A = Anzahl der Zeilen von B . Matrizenmultiplikation Sei A eine Matrix vom Typ (m, p) und B eine Matrix vom Typ (p, n). Dann ergibt das Produkt C = A · B eine Matrix vom Typ (m, n). Die Elemente cik (i = 1, 2, . . . , m; k = 1, 2, . . . , n) dieses Matrizenproduktes sind jeweils das Skalarprodukt aus dem i-ten Zeilenvektor von A und dem k-ten Spaltenvektor von B. Für die Matrizenmultiplikation gelten das Assoziativgesetz: A(B C) = (A B)C sowie die Distributivgesetze: A(B + C) = A B + A C (A + B)C = A C + B C Weitere wichtige Regeln sind: (A B)T = B T AT und A E = E A = A. Die Multiplikation von Matrizen ist nicht kommutativ, d.h. es gilt i. allg.: A B 6= B A . Die praktische Berechnung von Matrizenprodukten A · B kann mit Hilfe des Falk-Schemas erfolgen: n }| z b11 .. . bp1 m a11 .. . ai1 .. . am1 | ··· .. . ··· .. . ··· {z p ci1 .. . ··· .. . ··· .. . cm1 ··· a1p .. . c11 .. . aip .. . amp } ··· .. . ··· ··· .. . ··· ··· .. . ··· { ··· .. . ··· b1k .. . bpk ··· .. . ··· ··· .. . ··· b1n .. . bpn c1n .. . cik = ai1 b1k + ai2 b2k + · · · + aip bpk .. . ··· .. . ··· .. . cmk ··· cmn c1k .. . | {z n Beispiel 2.33: 34 cin .. . } p m 2.9.4 Beispiele für Anwendungen der Matrizenmultiplikation Ein spezieller Fall der Matrizenmultiplikation ist die Multiplikation einer Matrix mit einem Vektor, d.h. mit einer Matrix, die nur eine Spalte besitzt. Dies wird im weiteren als Matrix-Vektor-Multiplikation bezeichnet. Die folgenden Anwendungssituationen beinhalten jeweils eine Matrix-Vektor-Multiplikation. 1) Abbildungen in der Ebene Mit Hilfe der Matrix-Vektor-Multiplikation können einfache Abbildungen, z.B. Spiegelungen oder Drehungen, beschrieben werden. Dabei wird eine Berechnungsvorschrift für die Koordinaten des jeweiligen Bildpunktes angegeben. Hier werden nur Abbildungen in der Ebene betrachtet, zur Beschreibung von Abbildungen im Raum sei auf die folgende Literaturstelle verwiesen: K. D ÜRRSCHNABEL. Mathematik für Ingenieure - Eine Einführung mit Anwendungs- und Alltagsbeispielen, 2. Auflage (2012), S. 207-210. a) Spiegelung eines Punktes an einer Koordinatenachse Der Punkt P (x, y) wird an der x-Achse gespiegelt, wodurch der Bildpunkt P 0 (x0 , y 0 ) entsteht (siehe Bild 2.20). Diese Abbildung lässt sich mit Hilfe der Matrizenmultiplikation 0 x 1 0 x x = = y0 0 −1 y −y beschreiben, denn es gilt: x0 = x, y 0 = −y. Durch Spiegelung des Punktes P (x, y) an der y-Achse entsteht der Bildpunkt P 00 (x00 , y 00 ) (siehe Bild 2.20). Diese Abbildung kann man mit Hilfe der Matrizenmultiplikation 00 −x x −1 0 x = = y y 0 1 y 00 darstellen, denn es gilt: x00 = −x, y 00 = y. y y 6 P s 6 P0 s sP 00 I - x 0 s sP 0 P ϕ - x 0 Bild 2.20 Bild 2.21 b) Drehung eines Punktes um den Koordinatenursprung Der Punkt P (x, y) wird mit dem Drehwinkel ϕ um den Koordinatenursprung gedreht, wodurch der Bildpunkt P 0 (x0 , y 0 ) entsteht (siehe Bild 2.21). Diese Abbildung lässt sich mit Hilfe der Matrizenmultiplikation 0 x cos ϕ − sin ϕ x = y0 sin ϕ cos ϕ y beschreiben. 2) Berechnung des Rohstoffbedarfs Es wird die folgende Situation betrachtet: In einem Betrieb werden zur Herstellung der Endprodukte E1 , E2 , E3 und E4 die Rohstoffe R1 , R2 und R3 eingesetzt. Der Aufwand an Rohstoffen pro t (Tonne) der 35 Endprodukte ist in der folgenden Tabelle angegeben (Angabe ebenfalls in t): R1 R2 R3 E1 E2 E3 E4 2 0 1.5 3 4 0 2 0.5 1 1 2 3 Aus dieser Tabelle kann man beispielsweise ablesen8 , dass zur Produktion von 1 t des Endproduktes E2 3 t des Rohstoffs R1 sowie 4 t des Rohstoffs R2 benötigt werden. Der Rohstoff R3 geht in die Produktion von E2 nicht ein. Es ist nun der Bedarf an Rohstoffen zu ermitteln, wenn 20 t, 10 t, 40 t bzw. 50 t der Endprodukte E1 , E2 , E3 bzw. E4 hergestellt werden sollen. Dazu wird die zu der o.g. Tabelle gehörige Aufwandsmatrix mit dem Vektor der Endproduktmengen multipliziert, d.h. 20 2 3 2 1 200 10 160 0 4 0.5 2 · 40 = 1.5 0 1 3 220 50 (die Maßeinheiten wurden hier weggelassen). Der als Ergebnis entstandene Vektor ist der Vektor der Rohstoffbedarfsmengen. Er liefert die Aussage, dass 200 t von dem Rohstoff R1 , 160 t von R2 und 220 t von R3 erforderlich sind, um die geforderten Mengen der Endprodukte E1 , E2 , E3 und E4 herzustellen. Erläuterung zur Berechnung: Um den Gesamtbedarf an dem Rohstoff R1 zu berechnen, müssen die Mengen von R1 , die zur Produktion von 20 t des Endproduktes E1 , 10 t des Endproduktes E2 , 40 t des Endproduktes E3 und 50 t des Endproduktes E4 erforderlich sind, addiert werden. Da laut der obigen Tabelle zur Herstellung von 1 t des Endproduktes E1 genau 2 t des Rohstoffs R1 gebraucht werden, beläuft sich der Bedarf an R1 bei der Produktion von 20 t des Endproduktes E1 auf 20 · 2 t. Bezüglich des Bedarfes an R1 bei der Herstellung von 10 t, 40 t bzw. 50 t der Endprodukte E2 , E3 bzw. E4 gelten analoge Überlegungen. Somit beträgt der Bedarf an dem Rohstoff R1 (in t) insgesamt: 2 · 20 + 3 · 10 + 2 · 40 + 1 · 50 = 200. Dies entspricht genau dem ersten Schritt der durchgeführten Matrix-Vektor-Multiplikation (s. oben), nämlich der Berechnung des Skalarproduktes der ersten Zeile der Aufwandsmatrix mit dem Vektor der Endproduktmengen. Für die Berechnung des Gesamtbedarfs an R2 und R3 gelten jeweils analoge Überlegungen. 2.10 Inverse Matrix Zunächst eine Vorbetrachtung: Wird im Bereich der reellen Zahlen die lineare Gleichung a · x = 1 1 (mit gegebenem a 6= 0) gelöst, so erhält man: x = = a−1 . Die Zahl x wird auch als Kehrwert von a oder als a die zu a inverse Zahl bezeichnet. Als Analogon zu dieser Gleichung kann man nun die Matrizengleichung: A · X = E betrachten. Dabei sind A eine gegebene Matrix vom Typ (n, n) und E die n-reihige Einheitsmatrix. Die Matrix X (ebenfalls vom Typ (n, n)) ist unbekannt. Es muss zudem die Frage gestellt werden, ob überhaupt eine Lösung der Matrizengleichung existiert. Die betrachtete Matrizengleichung führt auf die Definition der inversen Matrix. 8 Man beachte, dass eine gewisse Analogie zu der im Beispiel 2.28b) betrachteten Transportmengenmatrix besteht. 36 Definition 2.8: Existiert zu einer n-reihigen quadratischen Matrix A eine Matrix X mit der Eigenschaft: A·X =X ·A=E, (36) so heißt X die zu A inverse Matrix (oder Kehrmatrix). Sie wird durch das Symbol A−1 gekennzeichnet. Falls eine inverse Matrix (kurz: Inverse) existiert, so ist diese eindeutig. Es gilt dann: A · A−1 = A−1 · A = E (d.h. in diesem Fall dürfen die Faktoren im Matrizenprodukt vertauscht werden, obwohl die Multiplikation von Matrizen i.allg. nicht kommutativ ist, vgl. Abschnitt 2.9.3). Besitzt die Matrix A eine Inverse, nennt man A eine invertierbare Matrix. Beispiel 2.34: Im vorangegangenen Beispiel war die Inverse der Matrix A bereits gegeben, und es wurde nur das Erfülltsein der Eigenschaft (36) nachgeprüft. Für Matrizen vom Typ (2, 2) lässt sich eine sehr einfach zu handhabende Formel zur Berechnung der Inversen angeben. Berechnung der Inversen einer Matrix vom Typ (2, 2) a11 a12 Gegeben sei die Matrix A = . Unter der Voraussetzung a11 a22 − a12 a21 6= 0 existiert a21 a22 die zu A inverse Matrix. Sie kann nach der Formel a22 −a12 1 −1 mit D = a11 a22 − a12 a21 A = −a21 a11 D (37) berechnet werden. Falls a11 a22 − a12 a21 = 0 gilt, ist die Matrix A nicht invertierbar. Begründung für Formel (37): Die unbekannte Inverse sei zunächst mit X bezeichnet. a11 a12 x11 x12 1 0 Die Bedingung A X = E , d.h. · = a21 a22 x21 x22 0 1 führt auf die folgenden Gleichungen zur Bestimmung der Unbekannten x11 , x12 , x21 und x22 : a11 x11 + a12 x21 = 1, a11 x12 + a12 x22 = 0 a21 x11 + a22 x21 = 0, a21 x12 + a22 x22 = 1 . Dieses lineare Gleichungssystem ist genau dann lösbar, wenn die Voraussetzung a11 a22 − a12 a21 6= 0 erfüllt ist. In diesem Fall erhält man die Lösung (d.h. die gesuchten Matrixelemente): x11 = a12 a21 a11 a22 , x12 = − , x21 = − , x22 = D D D D mit D aus (37). Beispiel 2.35: Auf die Berechnung der Inversen einer Matrix vom Typ (n, n) mit n ≥ 3 wird im Rahmen dieser Lehrveranstaltung nicht eingegangen. Nachfolgend werden allgemeingültige Rechenregeln für invertierbare Matrizen angegeben. 37 Rechenregeln für invertierbare Matrizen Seien A und B invertierbare Matrizen vom Typ (n, n). Dann gilt: (A · B)−1 = B −1 · A−1 (d.h. das Produkt zweier invertierbarer Matrizen ist stets invertierbar) (λA)−1 = 1 −1 A λ (A−1 )−1 = A (zweimaliges Invertieren ergibt wieder die Ausgangsmatrix) (AT )−1 = (A−1 )T 2.11 für λ ∈ R \ {0} (Invertieren und Transponieren sind vertauschbar) Determinanten Eine Determinante ist eine reelle Zahl, welche einer quadratischen Matrix auf Grund bestimmter Rechenvorschriften zugeordnet wird. Für Matrizen, die nicht quadratisch sind, kann keine Determinante gebildet werden. Die Determinante einer quadratischen Matrix A bezeichnet man mit: det A oder |A| . Im Rahmen dieser Lehrveranstaltung wird nur auf die Berechnung der Determinanten 2-reihiger und 3-reihiger quadratischer Matrizen eingangen. Für die Berechnung von Determinanten n-reihiger quadratischer Matrizen sei auf die folgende Literaturstelle verwiesen: L. PAPULA . Mathematik für Ingenieure und Naturwissenschaftler (Band 2), 12. Auflage, S. 41-46. Definition 2.9: Für eine 2-reihige quadratische Matrix A = a a det A = 11 12 a21 a22 a11 a12 a21 a22 wird die Determinante wie folgt berechnet: = a11 · a22 − a12 · a21 . (38) (Rechenregel: Produkt der Hauptdiagonalelemente minus Produkt der Nebendiagonalelemente“) ” Beispiel 2.36: Bemerkung: Bei der Berechnung der Inversen einer 2-reihigen quadratischen Matrix A trat der Ausdruck für det A bereits auf (siehe Formel (37)). Definition 2.10: a11 a12 a13 Die Determinante einer 3-reihigen quadratischen Matrix A = a21 a22 a23 ist gegeben durch: a31 a32 a33 a11 a12 a13 det A = a21 a22 a23 a31 a32 a33 = a11 a22 a33 + a12 a23 a31 + a13 a21 a32 − a13 a22 a31 − a11 a23 a32 − a12 a21 a33 . 38 (39) Die praktische Berechnung der Determinante einer 3-reihigen quadratischen Matrix erfolgt vorteilhafterweise mit der Regel von Sarrus9 : − − − a12 a13 a11 a12 a11 a11 a12 a13 & % & % & % a21 a22 a23 = a21 a a a a 22 23 21 22 a31 a32 a33 % % & % & & a31 a32 a33 a31 a32 + + + Beispiel 2.37: Es muss unbedingt beachtet werden, dass die Regel von Sarrus nur für 3-reihige Determinanten anwendbar ist! Abschließend werden einige wichtige Rechenregeln für Determinanten angegeben. Diese gelten allgemein für n-reihige Determinanten. Rechenregeln für Determinanten Regel 1: Für eine n-reihige quadratische Matrix A gilt stets: det AT = det A. Regel 2: Beim Vertauschen zweier Zeilen (oder Spalten) kehrt sich das Vorzeichen der Determinante um. Regel 3: Werden die Elemente einer beliebigen Zeile (oder Spalte) mit einem reellen Skalar λ multipliziert, so multipliziert sich die Determinante mit λ. Regel 4: Besitzen die Elemente einer Zeile (oder Spalte) einen gemeinsamen Faktor λ, so darf dieser vor die Determinante gezogen werden. Regel 5: Eine Determinante besitzt den Wert Null, wenn mindestens eine der folgenden Bedingungen erfüllt ist: - Alle Elemente einer Zeile (oder Spalte) sind Null. Zwei Zeilen (oder Spalten) sind gleich. Zwei Zeilen (oder Spalten) sind zueinander proportional. Eine Zeile (oder Spalte) ist als Linearkombination anderer Zeilen (oder Spalten) darstellbar. Regel 6: Der Wert einer Determinante ändert sich nicht, wenn man zu einer Zeile (oder Spalte) ein beliebiges Vielfaches einer anderen Zeile (bzw. Spalte) addiert. Regel 7: Multiplikationssatz für Determinanten Für zwei n-reihige quadratische Matrizen A, B gilt stets: det(A · B) = det A · det B . Regel 8: Die Determinante einer n-reihigen Dreiecksmatrix A besitzt den Wert: det A = a11 · a22 · . . . · ann , d.h. die Determinante ist gleich dem Produkt der Hauptdiagonalelemente. 2.12 2.12.1 Lineare Gleichungssysteme Einführung Einführend wird ein Anwendungsbeispiel für lineare Gleichungssysteme angegeben. Beispiel 2.38: In einem Betrieb sollen aus drei Rohstoffen R1 , R2 und R3 die (zunächst unbekannten) Mengen x1 , x2 und x3 der Endprodukte E1 , E2 und E3 hergestellt werden. Der Rohstoffbedarf für die Herstellung dieser Endprodukte 9 Diese wurde auch im Beispiel 2.12 bereits angewendet. 39 sei folgendermaßen: Rohstoff R1 : 10 Mengeneinheiten (ME) dieses Rohstoffs für die Herstellung einer ME des Endproduktes E1 , 5 ME für die Herstellung einer ME des Endproduktes E2 , 4 ME für die Herstellung einer ME des Endproduktes E3 Rohstoff R2 : 8 ME dieses Rohstoffs für die Herstellung einer ME des Endproduktes E1 , 12 ME für die Herstellung einer ME des Endproduktes E2 Rohstoff R3 : 2 ME dieses Rohstoffs für die Herstellung einer ME des Endproduktes E2 , 3 ME für die Herstellung einer ME des Endproduktes E3 . Die aktuell verfügbaren Mengen der Rohstoffe R1 , R2 und R3 seien (in dieser Reihenfolge, Angabe in ME): 101, 108 und 22. Unter der Annahme, dass alle Rohstoffe restlos verbraucht werden sollen, sind die Endproduktmengen x1 , x2 und x3 zu ermitteln. Diese Problemstellung führt auf das folgende lineare Gleichungssystem zur Berechnung von x1 , x2 und x3 (der Einfachheit halber werden die Maßeinheiten weggelassen): 10x1 + 5x2 + 4x3 = 101 8x1 + 12x2 = 108 2x2 + 3x3 = (40) 22 . Im folgenden wird der Begriff des linearen Gleichungssystems allgemein eingeführt. Unter einer linearen Gleichung mit den n Variablen x1 , x2 , . . . , xn versteht man eine Gleichung der Form: a1 x1 + a2 x2 + . . . + an xn = b (xi , ai , b ∈ R). Liegen gleichzeitig m solcher Gleichungen vor, spricht man von einem linearen Gleichungssystem (LGS). Die allgemeine Schreibweise für ein LGS lautet: a11 x1 + a12 x2 + . . . + a1n xn = b1 .. .. .. .. . . . . (41) am1 x1 + am2 x2 + . . . + amn xn = bm , wobei aik als Koeffizienten des LGS und bi als rechte Seiten oder Störglieder bezeichnet werden (i = 1, 2, . . . , m; k = 1, 2, . . . , n). Das LGS (41) lässt sich in Matrizenschreibweise darstellen: A~x = ~b , (42) a11 a12 a21 a22 mit der Koeffizientenmatrix A = . .. .. . am1 am2 b1 .. ~ sowie dem Vektor der rechten Seiten b = . ... ... a1n a2n .. . . . . amn . bm Beispiel 2.39: a) System von Gleichungen → Matrizenschreibweise: Das LGS (40) lautet in Matrizenschreibweise: 40 , dem Lösungsvektor ~x = x1 .. . xn b) Matrizenschreibweise → System von Gleichungen: Das in Matrizenform vorliegende LGS x1 0 1 −3 5 x2 = 1 7 2 8 x3 lautet in der herkömmlichen Schreibweise: Falls der Vektor der rechten Seiten gleich dem Nullvektor ist, d.h. ~b = ~0 , heißt das LGS homogen, anderenfalls inhomogen. Das Lösungsverhalten eines LGS lässt sich wie folgt charakterisieren: homogenes LGS inhomogenes LGS entweder genau eine Lösung: ~x = ~0 (triviale Lösung) oder unendlich viele Lösungen (darunter ~x = ~0 ) 2.12.2 entweder genau eine Lösung oder unendlich viele Lösungen oder keine Lösung Der Gaußsche Algorithmus Der Gaußsche Algorithmus ist ein in der Praxis häufig verwendetes Lösungsverfahren für LGS. Für die Anwendung dieses Verfahrens wird die erweiterte Koeffizientenmatrix benötigt: a11 a12 . . . a1n b1 a21 a22 . . . a2n b2 (A | ~b) = . .. .. .. . .. . ... . . am1 am2 . . . amn bm Der Gaußsche Algorithmus beruht auf elementaren Zeilenumformungen in der erweiterten Koeffizientenmatrix (A | ~b). Zulässige elementare Zeilenumformungen sind: (I) Vertauschung zweier Zeilen (II) Multiplikation einer Zeile mit einer von Null verschiedenen reellen Zahl (III) Addition eines Vielfachen einer Zeile zu einer anderen Zeile. Dabei wird die Lösungsmenge des LGS nicht verändert10 . Vorgehensweise bei der Lösung eines LGS mittels Gaußschem Algorithmus 1) Auf die erweiterte Koeffizientenmatrix (A | ~b) werden elementare Zeilenumformungen angewendet, so dass die Matrix A Trapezform (oder Zeilenstufenform) erhält (siehe unter Erläuterung“). ” Dabei müssen, beginnend mit der ersten Spalte, in jeder Spalte systematisch Nullen erzeugt werden. 2) Das LGS liegt nun in der (zum Ausgangssystem äquivalenten) Form A∗ ~x = ~b∗ vor. Falls dieses LGS widersprüchliche Gleichungen enthält (siehe unter Erläuterung“), ” existiert keine Lösung. Anderenfalls kann das LGS A∗ ~x = ~b∗ sukzessiv von unten nach oben gelöst werden. Hinweis: Das Symbol *“ besagt, dass die Matrix A und der Vektor ~b bei der Durchführung der ” Zeilenumformungen verändert werden. Dieses Symbol steht hier nicht im Zusammenhang mit der im Abschnitt 1.2.2 verwendeten Symbolik für die konjugiert-komplexe Zahl. 10 Die o.g. Umformungen sind ausschließlich Zeilenumformungen. Prinzipiell wäre auch eine Vertauschung von Spalten möglich, diese würde jedoch eine Umbenennung der Variablen erfordern. 41 Erläuterung: Bei der Ausführung von Schritt 1) wird die erweiterte Koeffizientenmatrix (A | ~b) in die Form (A∗ | ~b∗ ) überführt: ∗ ~∗ (A | b ) = a∗11 a∗12 0 a∗22 .. .. . . 0 0 0 ... .. . 0 (A∗ | ~b∗ ) = ... . . . a∗1r a∗1,r+1 . . . a∗2r a∗2,r+1 .. .. . . ∗ ∗ . . . arr ar,r+1 ... 0 0 .. .. . . ... 0 0 . . . a∗1n . . . a∗2n .. . b∗1 b∗2 .. . . . . a∗rn b∗r . . . 0 b∗r+1 .. .. . . ... 0 b∗m oder a∗11 a∗12 . . . a∗1r a∗1,r+1 . . . a∗1n b∗1 0 a∗22 . . . a∗2r a∗2,r+1 . . . a∗2n b∗2 .. .. .. .. .. .. . . . . . . . ∗ ∗ ∗ 0 0 . . . arr ar,r+1 . . . arn b∗r (43) (44) Wenn in der Matrix (43) die Elemente b∗r+1 , . . . , b∗m (oder zumindest einige von ihnen) von Null verschieden sind, enthält das LGS widersprüchliche Gleichungen, da die linke Seite der entsprechenden Gleichung Null ergibt, die rechte Seite jedoch nicht. In diesem Fall besitzt das LGS keine Lösung. Falls sämtliche Elemente b∗r+1 , . . . , b∗m gleich Null sind, liegt ein lösbares LGS in gestaffelter Form vor (die Nullzeilen entfallen für die weiteren Lösungsschritte). Die Gleichung, welche der r-ten Zeile der Matrix (A∗ | ~b∗ ) entspricht, wird zuerst gelöst, anschließend sukzessiv die verbleibenden Gleichungen. Wenn die entstandene Matrix die Gestalt (44) hat, ist das LGS auf jeden Fall lösbar. Die Anzahl r der Nicht-Nullzeilen“ von A∗ (siehe (43) bzw. (44)) wird als Rang der Matrix A∗ bezeichnet und ” durch r(A∗ ) symbolisiert. Die soeben beschriebenen elementaren Zeilenumformungen ändern den Rang einer Matrix nicht, d.h. unter den genannten Voraussetzungen gilt: r(A) = r(A∗ ) sowie r(A | ~b) = r(A∗ | ~b∗ ) . Beispiel 2.40: Die Aussagen zur Lösbarkeit eines LGS können auch als Rangkriterium“ formuliert werden: ” ~ Das LGS A~x = b ist lösbar genau dann, wenn der Rang der Koeffizientenmatrix A gleich dem Rang der erweiterten Koeffizientenmatrix (A | ~b) ist. oder kurz: A~x = ~b ist lösbar ⇔ r(A) = r(A | ~b) Bei der praktischen Anwendung dieses Kriteriums wird geprüft, ob r(A∗ ) = r(A∗ | ~b∗ ) gilt (da r(A) und r(A | ~b) i.allg. nicht sofort erkennbar sind). Dann wird r(A) = r(A∗ ) sowie r(A | ~b) = r(A∗ | ~b∗ ) genutzt. Beispiel 2.41: Nun wird die Lösungsmenge des LGS A~x = ~b unter der Voraussetzung r(A) = r(A | ~b) genauer betrachtet. Sei A vom Typ (m, n). Dann können die folgenden beiden Fälle unterschieden werden: a) Es gilt: r(A | ~b) = n , d.h. das gestaffelte LGS hat n Gleichungen und n Variable. ⇒ Das LGS besitzt genau eine Lösung (siehe dazu Beispiel 2.40a)). b) Es gilt: r(A | ~b) < n , d.h. das gestaffelte LGS hat weniger Gleichungen als Variable. ⇒ Das LGS besitzt unendlich viele Lösungen, die von n − r(A | ~b) freien Parametern abhängen. Eine solche Situation wurde im Beispiel 2.40b) betrachtet. Dort gilt: n = 3 sowie r(A | ~b) = 2. Daraus folgt, dass unendlich viele Lösungen existieren und dass die Anzahl der freien Parameter 3 - 2 = 1 beträgt. 42 2.12.3 Lineare Gleichungssysteme mit quadratischer Koeffizientenmatrix, Cramersche Regel Für LGS mit einer Koeffizientenmatrix A vom Typ (n, n) kann das Lösungsverhalten mit Hilfe der Determinante det A charakterisiert werden. Dabei sind die folgenden Fälle zu unterscheiden: a) Es gilt: det A 6= 0 ⇒ Das LGS hat genau eine Lösung. (Liegt ein homogenes LGS vor, ist dies die triviale Lösung.) b) Es gilt: det A = 0 ⇒ Ist das LGS homogen, dann besitzt es unendlich viele Lösungen. Handelt es sich um ein inhomogenes LGS, dann besitzt es entweder keine Lösung oder unendlich viele Lösungen. (Über die Lösbarkeit kann entschieden werden, indem die Bedingung r(A) = r(A | ~b) überprüft wird, siehe Abschnitt 2.12.2). Im Fall a) (eindeutige Lösbarkeit des LGS) kann die Cramersche Regel zur Berechnung der Lösung angewendet werden. Cramersche Regel Sei A vom Typ (n, n), wobei det A 6= 0. Dann gilt für die Lösung ~x des LGS A~x = ~b : x1 Di ~x = ... mit xi = für i = 1, 2, . . . , n. D xn (45) Dabei bezeichnet D die Determinante der Koeffizientenmatrix, d.h. D = det A. Die Determinante Di entsteht, indem in der Determinante D die i-te Spalte durch den Vektor ~b der rechten Seiten ersetzt wird. Beispiel 2.42: Bemerkung: Wenn ein LGS mit einer Koeffizientenmatrix vom Typ (n, n) mittels der Cramerschen Regel gelöst werden soll, dann ist die Berechnung von (n + 1) Determinanten erforderlich, d.h. mit steigendem n nimmt der Rechenaufwand erheblich zu. In der Praxis wird daher zur Lösung von LGS mit einer Koeffizientenmatrix vom Typ (n, n) mit n > 3 der Gaußsche Algorithmus bevorzugt. 2.13 Zusammenfassende Aussagen über quadratische Matrizen Eigenschaften quadratischer Matrizen Sei A eine quadratische Matrix vom Typ (n, n). Dann sind die folgenden Aussagen äquivalent. 1. Der Rang der Matrix A ist gleich n: r(A) = n. 2. Nach Überführung der Matrix A in Trapezform hat diese keine Zeilen, in denen nur Nullen stehen. 3. Es gilt: det A 6= 0. 4. Die inverse Matrix A−1 existiert. 5. Das homogene lineare Gleichungssystem A~x = ~0 hat als einzige Lösung: ~x = ~0 (triviale Lösung). 6. Das inhomogene lineare Gleichungssystem A~x = ~b hat für jedes beliebige ~b ∈ Rn eine eindeutige Lösung, nämlich ~x = A−1~b . 43 3 Funktionen einer reellen Variablen (Grundlagen) 3.1 Zahlenfolgen Zahlenfolgen werden z.B. für die Definition des Grenzwertbegriffs von Funktionen (siehe Abschnitt 3.3) benötigt. 3.1.1 Definition und Darstellung reeller Zahlenfolgen Definition 3.1: Unter einer reellen Zahlenfolge (Folge) versteht man eine geordnete Menge reeller Zahlen. Schreibweise: {an } = a0 , a1 , a2 , . . . , an , . . . (n ∈ N) a0 , a1 , a2 , . . . : Glieder der Folge, an : n-tes Glied der Folge Beispiel 3.1: Bezüglich der Darstellung von Folgen unterscheidet man unterscheidet man explizite und rekursive Folgen. explizit: rekursiv: an wird direkt aus n berechnet (unabhängig von anderen Gliedern der Folge) an wird aus vorigen Gliedern der Folge (z.B. aus an−1 ) berechnet Beispiel 3.2: (explizite Folgen) Beispiel 3.3: (rekursive Folgen) Die beiden folgenden Beispiele beinhalten praktische Anwendungssituationen für Zahlenfolgen. Beispiel 3.4: (Sprunghöhe einer Stahlkugel) Eine Stahlkugel fällt aus einer Höhe h0 auf eine Platte und prallt zurück. Infolge der Energieverluste beim Aufprall erreicht sie dann nur noch 43 der Höhe h0 . Die Folge der Sprunghöhen h1 , h2 , . . ., nachdem die Kugel einmal, zweimal, . . . aufgeprallt ist, lautet: ( ) 2 3 n 3 3 3 3 {hn } = h0 , h0 , h0 , . . . ⇒ hn = h0 (explizit definierte Folge). 4 4 4 4 Es handelt sich um eine geometrische Folge (siehe auch Abschnitt 3.1.2) mit dem Quotienten q = 34 . Beispiel 3.5: (Modellierung in der Biologie)11 Der jährliche Bestand einer Population mit wachstumsbeschränkten Ressourcen kann durch eine Folge {an } modelliert werden, deren Glieder sich folgendermaßen berechnen: an−1 an = c 1 − an−1 (rekursiv definierte Folge). d Dabei sind c und d Konstante mit c > 1 und d > 0 (c: jährliche Vermehrungsrate ohne äußere Einflüsse, d: Begrenzung der Population aufgrund begrenzter Ressourcen). Sei a0 der Ausgangsbestand der Population, dann gilt nach der obigen Gleichung: a0 a1 a1 = c 1 − a0 , a2 = c 1 − a1 , . . . d d 11 Quelle: K. D ÜRRSCHNABEL. Mathematik für Ingenieure, 2. Auflage (2012), S. 240-241 44 Bemerkungen: - Eine Folge {an } kann auch als eine Funktion f mit an = f (n) für n ∈ N, an ∈ R aufgefasst werden. - Anstelle der in Definition 3.1 eingeführten unendlichen Folgen (mit n ∈ N) können auch endliche Folgen betrachtet werden: a0 , a1 , a2 , . . . , am . - In manchen Fällen wird das erste Glied einer Zahlenfolge {an } mit a1 (statt a0 ) bezeichnet, d.h. es gilt dann n ∈ N∗ (statt n ∈ N). 3.1.2 Eigenschaften von Folgen und spezielle Folgen Wichtige Eigenschaften von Folgen sind Monotonie und Beschränktheit. Nachfolgend werden diese Begriffe eingeführt. Definition 3.2: monoton wachsend, streng monoton wachsend, monoton fallend, Eine Folge {an } heißt streng monoton fallend, konstant, alternierend, falls an ≤ an+1 falls an < an+1 falls an ≥ an+1 falls an > an+1 falls an = an+1 falls an · an+1 < 0 für alle n ∈ N gilt. Bei Zahlenfolgen {an } mit n ∈ N∗ ist entsprechend n ∈ N∗ zu nehmen. Beispiel 3.6: Definition 3.3: Eine Zahlenfolge {an } , n ∈ N, heißt nach oben bzw. nach unten beschränkt, wenn es eine Zahl So ∈ R bzw. Su ∈ R gibt, so dass gilt: an ≤ So bzw. an ≥ Su für alle n ∈ N. (46) Die Zahl So bzw. Su wird als obere bzw. untere Schranke der Folge bezeichnet. Ist eine Folge nach oben und nach unten beschränkt, so heißt sie beschränkt. Beispiel 3.7: Im weiteren werden arithmetische und geometrische Folgen (als spezielle Folgen) betrachtet. Bei derartigen Folgen kann die Darstellung der Folgenglieder auf sehr einfache Weise erfolgen. Bei einer arithmetischen Folge hat die Differenz zweier aufeinanderfolgender Glieder den konstanten Wert d, d.h. es gilt bei rekursiver Darstellung: an − an−1 = d bzw. an = an−1 + d für n ≥ 1, (47) bei expliziter Darstellung: an = a0 + nd für n ≥ 1. Beispiel 3.8: Bei einer geometrischen Folge hat der Quotient zweier aufeinanderfolgender Glieder den konstanten Wert q, d.h. es gilt bei rekursiver Darstellung: an an−1 bei expliziter Darstellung: an = a0 · q n = q bzw. an = q · an−1 für n ≥ 1, (48) für n ≥ 1. 45 Beispiel 3.9: Beispiel 3.10:12 Normzahlen dienen zur Vermeidung von willkürlichen Abstufungen bei der Typisierung von Bauteilen und Systemen hinsichtlich bestimmter Merkmale. Die Normzahlen sind gewöhnlich in einer geometrischen Folge gestuft, wobei der entsprechende Quotient q als Stufensprung bezeichnet wird. √ Als Beispiel sei die Normzahlreihe R5 genannt. Hier beträgt der Stufensprung: q = 5 10 = 101/5 ≈ 1.585. Gemäß der Berechnungsvorschrift für geometrische Folgen erhält man dann für den Bereich der Zahlen von 1 bis 10 die Folgenglieder: 1, 101/5 , 102/5 , 103/5 , 104/5 , 10. In diesem Fall handelt es sich um eine endliche geometrische Folge. In der Praxis werden die Glieder der Normzahlreihe R5 jeweils auf eine Nachkommastelle gerundet, so dass man erhält: 1, 1.6, 2.5, 4, 6.3, 10. Weitere gebräuchliche Normzahlreihen findet man in den entsprechenden DIN- bzw. ISO-Normen. 3.1.3 Grenzwerte von Folgen Bevor der Begriff des Grenzwertes eingeführt wird, soll die folgende Vorbetrachtung durchgeführt werden. 3 4 Gegeben sei die Folge {an } = n+1 = 2, 2 , 3 , . . . mit n ∈ N∗ . Diese Folge ist streng monoton fallend n (siehe Beispiel 3.6c)) und durch Su = 1 nach unten beschränkt. Berechnet man weitere Glieder dieser Folge, z.B.: a10 = 11 10 = 1.1, a100 = 101 100 = 1.01, a1000 = 1001 1000 = 1.001, so ist festzustellen, dass sich die Folgenglieder mit wachsendem n der Zahl a = 1 nähern. Für hinreichend großes n liegen an und alle nachfolgenden Glieder beliebig nahe bei 1“. ” Eine Verallgemeinerung dieser Betrachtungen führt zu der folgenden Definition des Grenzwertes einer Folge. Definition 3.4: Die reelle Zahl a heißt Grenzwert einer Folge {an }, wenn es zu jedem ε > 0 eine natürliche Zahl n0 gibt, so dass für alle n ≥ n0 gilt: |an − a| < ε . (49) Eine Folge, die gegen einen Grenzwert a strebt, heißt konvergent (gegen den Grenzwert a). Schreibweise: limn→∞ an = a . Bild 3.1 zeigt eine Veranschaulichung des Grenzwertbegriffes mit Hilfe der Zahlengeraden. a−ε a+ε s a0 a1 an0 −1 | a {z - } In diesem Intervall liegen alle Glieder an mit n ≥ n0 Bild 3.1 Beispiel 3.11: 12 Quelle: E. W ESTK ÄMPER , H.-J. WARNECKE. Einführung in die Fertigungstechnik, 4. Auflage, S. 27-28. 46 Eine Folge {an } mit limn→∞ an = 0 wird als Nullfolge bezeichnet. Beispiel 3.12: Definition 3.5: Eine Folge, die keinen Grenzwert besitzt (d.h. die nicht konvergiert), heißt divergent. Wenn zu jedem K ∈ R eine natürliche Zahl n0 existiert, so dass für alle n ≥ n0 gilt: an > K, dann heißt die Folge {an } bestimmt divergent. Man sagt auch, dass {an } den uneigentlichen Grenzwert +∞ besitzt; Schreibweise: limn→∞ an = +∞ . Analog ist der uneigentliche Grenzwert −∞ definiert. Beispiel 3.13: Definition 3.6: Eine Folge, die weder konvergent noch bestimmt divergent ist, heißt unbestimmt divergent. Beispiel 3.14: Bei der praktischen Berechnung von Grenzwerten nutzt man i.allg. nicht die Ungleichung (49), sondern versucht den entsprechenden Ausdruck für die Folgenglieder an geschickt umzuformen, damit dann auf bekannte oder leicht berechenbare Grenzwerte zurückgegriffen werden kann. Als hilfreich erweisen sich dabei Rechenregeln für Grenzwerte sowie Grenzwerte ausgewählter Zahlenfolgen. Rechenregeln für Grenzwerte Seien {an } und {bn } konvergente Folgen mit limn→∞ an = a und limn→∞ bn = b . Dann gilt: a) limn→∞ (an ± bn ) = limn→∞ an ± limn→∞ bn = a ± b b) limn→∞ (c · an ) = c · limn→∞ an = c · a für c ∈ R c) limn→∞ (an · bn ) = limn→∞ an · limn→∞ bn = a · b d) limn→∞ (an /bn ) = limn→∞ an / limn→∞ bn = a/b, falls bn 6= 0 und b 6= 0 e) limn→∞ (an )r = (limn→∞ an )r = ar mit r ∈ R, falls an ≥ 0 f) limn→∞ |an | = |a| Beispiel 3.15: Grenzwerte ausgewählter Zahlenfolgen 0 für − 1 < q < 1 n lim q = n→∞ 1 für q=1 Für q > 1 besitzt {q n } den uneigentlichen Grenzwert +∞. Für q ≤ −1 ist diese Folge divergent. 1 n lim 1 + = 2.71828 . . . = e (Eulersche Zahl) n→∞ n x n lim 1 + = ex n an lim =0 n→∞ n! n→∞ lim n→∞ √ n a=1 (a > 0, fest) (a > 0, fest) , lim n→∞ √ n n=1 47 3.2 Grundlegendes über Funktionen 3.2.1 Definition und Darstellung von Funktionen Definition 3.7: Seien D und W zwei Mengen reeller Zahlen. Eine Vorschrift, die jedem Element x aus der Menge D genau ein Element y aus der Menge W zuordnet, wird als Funktion bezeichnet. Symbolische Schreibweise: y = f (x) (oder f : x 7→ y) Bezeichnungen: x : unabhängige Variable (Argument) y : abhängige Variable (Funktionswert) D : Definitionsbereich der Funktion W : Wertebereich der Funktion Beispiel 3.16: a) b) c) Mengenbezogene Kosten in der Materialwirtschaft13 Unter Berücksichtigung der Bestellkosten KB und der Lagerhaltungskosten KL ergibt sich für die Gesamtkosten KG der Bestellmenge b: KG (b) = KB (b) + KL (b) = kb · kl b M + · ·P . b 100 2 (50) Dabei gelten die folgenden Bezeichnungen (die nachfolgend genannten Größen sind Konstante): kb : fixe Kosten pro Bestellung M : Jahresbedarf kl : Lagerhaltungskosten in Prozent vom Einkaufspreis bzw. von den Herstellkosten P : Einkaufspreis bzw. Herstellkosten Die Formel (50) bringt den funktionalen Zusammenhang zwischen den Gesamtkosten KG (abhängige Variable) und der Bestellmenge b (unabhängige Variable) zum Ausdruck. Im weiteren sollen verschiedene Möglichkeiten zur Darstellung von Funktionen einer reellen Variablen aufgezeigt werden. Darstellungsformen von Funktionen einer reellen Variablen: 1) Funktionsgleichung Bei der Darstellung in Form einer Funktionsgleichung (siehe dazu auch Definition 3.7) wird noch die folgende Unterscheidung getroffen: explizite Darstellung (d.h. aufgelöst nach y): y = f (x), z.B.: y = sin x oder y = x2 − 2 · x implizite Darstellung (nicht nach y aufgelöst): F (x, y) = 0, z.B.: x2 + y 2 = 4 oder x · y − 2 · sin y = 0 2) Wertetabelle (Funktionstafel) Es wird eine Teilmenge M des Definitionsbereiches D der Funktion f gebildet. Für die Elemente dieser Teilmenge werden jeweils die Funktionswerte berechnet, dann erfolgt eine tabellarische Darstellung der Elemente von M und der zugehörigen Funktionswerte. Als Beispiel wird die Wertetabelle der Funktion y = x2 − 2 · x für M = {−2; −1.5; −1; −0.5; 0; 0.5; 1; 1.5; 2} angegeben. 13 x -2 -1.5 -1 -0.5 0 0.5 1 1.5 2 y 8 5.25 3 1.25 0 -0.75 -1 -0.75 0 siehe dazu: D. A RNOLD , K. F URMANS . Materialfluss in Logistiksystemen, 6. Auflage, S. 173-174 48 Wertetabellen werden häufig auch zur Darstellung von Messergebnissen verwendet. 3) Grafische Darstellung im kartesischen Koordinatensystem Die Darstellung von Funktionen einer reellen Variablen erfolgt häufig mit Hilfe eines rechtwinkligen (kartesischen) Koordinatensystems. Jedem Wertepaar (x, y) (mit x ∈ D und y = f (x)) entspricht dann ein Punkt P der (x, y)-Ebene und die Menge aller dieser Punkte bildet die Funktionskurve (auch Funktionsgraph genannt). Im Bild 3.2a) ist die Kurve der Funktion y = x2 − 2 · x (vgl. auch obige Wertetabelle) für −2 ≤ x ≤ 2 dargestellt. Bild 3.2b) zeigt die im Beispiel 3.16c) betrachtete Funktion KG (b) (Gesamtkosten in Abhängigkeit von der Bestellmenge), und zwar speziell für kb = 100, M = 10000, kl = 10 und P = 10 (siehe Formel (50); die Maßeinheiten wurden der Einfachheit halber weggelassen). KG (b) y 5000 6 86 4000 6 3000 4 2000 2 −2 −1 0 1000 2 x 1 0 Bild 3.2a) 1000 2000 3000 4000 - 5000 b Bild 3.2b) Weitere Möglichkeiten zur Darstellung ebener Kurven: 1) Parameterdarstellung In Anwendungssituationen erweist sich oft die folgende Darstellungsmöglichkeit als zweckmäßig: Mittels der Hilfsvariablen t (t1 ≤ t ≤ t2 ) werden die Punkte der Kurve dargestellt als P = P (x(t), y(t)) . Das System der beiden Gleichungen x = x(t) , y = y(t) (t1 ≤ t ≤ t2 ) (51) heißt Parameterdarstellung der Kurve. Mit Hilfe von (51) kann z.B. die Bewegung eines Massepunktes auf einer Kurve beschrieben werden, wenn die Variable t als Zeit gedeutet wird. Die augenblickliche Lage des Punktes wird durch kartesische Koordinaten (x, y) angegeben, die jedoch zeitabhängig sind. Beispiel 3.17: (Parameterdarstellungen verschiedener Kurven) a) Die Gerade durch die Punkte P1 (x1 , y1 ) und P2 (x2 , y2 ) besitzt die Parameterdarstellung: x = x(t) = x1 + t(x2 − x1 ) , y = y(t) = y1 + t(y2 − y1 ) (t ∈ R) (vgl. auch Abschnitt 2.5.1, jetzt entfällt die z-Koordinate). x2 y2 b) Die Ellipse mit der Gleichung: 2 + 2 = 1 (siehe Bild 3.3 auf der nächsten Seite) hat die Parametera b darstellung: x = x(t) = a cos t , y = y(t) = b sin t (0 ≤ t ≤ 2π) . Dem Parameterwert t = 0 entspricht der Punkt der Ellipse, welcher die kartesischen Koordinaten (a, 0) besitzt, denn es gilt: x(0) = a cos 0 = a, y(0) = b sin 0 = 0. In dem speziellen Fall a = 1, b = 1 ergibt sich die Parameterdarstellung des Einheitskreises: x = x(t) = cos t , y = y(t) = sin t (0 ≤ t ≤ 2π) . 49 y6 b P (x(t), y(t)) q t −a - a x 0 −b Bild 3.3: Ellipse mit Hauptkreis c) Für einige technische Anwendungen sind Rollkurven“ von Interesse. Im folgenden wird der Fall be” trachtet, dass ein Kreis vom Radius R auf einer Geraden abrollt (entspricht z.B. der Situation, dass ein Rad auf einer Ebene rollt, ohne zu gleiten)14 . Sei P ein Punkt auf der Peripherie dieses Kreises. Seine Lage soll in Abhängigkeit vom Drehwinkel t beschrieben werden. Zu Beginn der Bewegung (d.h. für t = 0) sei P der Berührungspunkt von Kreis und Gerade. Das Koordinatensystem wird entsprechend Bild 3.4 gewählt. y 6 t=π v R P v v v πR t = 2π 2πR - x Bild 3.4 Wenn der Kreis auf der Geraden abrollt, dann hebt sich “ der Punkt von der x-Achse, hat nach einer ” halben Umdrehung (t = π) einen maximalen y-Wert und ist nach einer vollen Umdrehung (t = 2π) wieder Berührungspunkt von Kreis und Gerade. Die entstehende Rollkurve“ wird als (gewöhnliche) ” Zykloide bezeichnet. Die Position des Punktes P lässt sich mit Hilfe der Parameterdarstellung der Zykloide beschreiben: x = x(t) = R t − R sin t , y = y(t) = R − R cos t (t ≥ 0) . Von einer Parameterdarstellung x = x(t), y = y(t) kann man nur dann zu einer expliziten Darstellung (Funktionsgleichung) y = f (x) oder x = g(y) übergehen, wenn mindestens eine der beiden Gleichungen eindeutig nach t auflösbar ist. 2) Darstellung in Polarkoordinaten Bisher wurde die Lage eines Punktes P der Ebene ausschließlich durch kartesische Koordinaten beschrieben. In bestimmten Fällen erweist es sich jedoch als günstiger, Polarkoordinaten zu verwenden. Die Polarkoordinaten eines Punktes P (x, y) der Ebene werden mit (r, ϕ) bezeichnet, wobei r und ϕ wie 14 Quelle: A. F ETZER , H. F R ÄNKEL: Mathematik 2: Lehrbuch für ingenieurwissenschaftliche Studiengänge, 6. Auflage, S. 6 50 folgt anschaulich zu erklären sind. y6 y0 rP r ϕ x0 O r: Abstand des Punktes P vom Koordinatenursprung O - ϕ: Winkel zwischen dem vom Koordinatenursprung O zum Punkt P gerichteten Radiusvektor und der positiven x-Achse (siehe Bild 3.5) x Bild 3.5 Es gilt stets r ≥ 0. Der Winkel ϕ ist nur bis auf ganzzahlige Vielfache von 2π eindeutig bestimmt. In der Regel wählt man ϕ so, dass 0 ≤ ϕ < 2π gilt. Umrechnung: Polarkoordinaten → kartesische Koordinaten x = r · cos ϕ, y = r · sin ϕ Umrechnung: kartesische Koordinaten → Polarkoordinaten x , falls y ≥ 0 arccos r p x r = x2 + y 2 , ϕ = 2π − arccos , falls y < 0 r unbestimmt falls r = 0. Beispiel 3.18: Die Darstellung einer Kurve in Polarkoordinaten hat allgemein die Form: r = f (ϕ) (ϕ1 ≤ ϕ ≤ ϕ2 ) . oder r = r(ϕ) Daraus resultiert die folgende Parameterdarstellung mit dem Polarwinkel ϕ als Parameter: x = x(ϕ) = r(ϕ) · cos ϕ , y = y(ϕ) = r(ϕ) · sin ϕ (ϕ1 ≤ ϕ ≤ ϕ2 ) . Beispiel 3.19: a) Ein Kreis mit dem Mittelpunkt im Koordinatenursprung und dem Radius c (c ∈ R, c > 0) hat in Polarkoordinaten die Darstellung: r = c (d.h. in diesem Fall ist r eine konstante Funktion bezüglich ϕ). b) Archimedische Spirale y 6 Darstellung in Polarkoordinaten: r = aϕ , ϕ ∈ [0, ∞) , a > 0 , a ∈ R 2aπ Bei der Archimedischen Spirale vergrößert sich der Abstand vom Mittelpunkt mit jeder Umdrehung um die additive Konstante 2aπ (siehe Bild 3.6). 51 - x Bild 3.6 c) Kardioide Darstellung in Polarkoordinaten: y 6 r = a(1 + cos ϕ) , a > 0 , ϕ ∈ [0, 2π) Eine Kardioide (siehe Bild 3.7) entsteht als Bahn eines Punktes P , wenn ein Kreis auf der Außenseite eines anderen, festen Kreises abrollt, wobei beide Kreise den gleichen Radius besitzen. 3.2.2 - x Bild 3.7 Allgemeine Eigenschaften von Funktionen Für Kurvendiskussionen (siehe dazu Abschnitt 4.2.5) werden einige allgemeine Funktionseigenschaften (wie z.B. Monotonieverhalten und Symmetrieeigenschaften) benötigt. Diese Eigenschaften werden jetzt erläutert und später wird nochmals darauf eingegangen. 1) Monotonieverhalten Definition 3.8: Eine Funktion f (x) heißt auf einem Intervall I monoton wachsend bzw. monoton fallend, wenn für alle x1 , x2 ∈ I mit x1 < x2 stets f (x1 ) ≤ f (x2 ) bzw. f (x1 ) ≥ f (x2 ) gilt. Wird Gleichheit ausgeschlossen, liegt strenge Monotonie vor. Beispiel 3.20: y y 6 6 1 1 −1 0 −1 1 Bild 3.8a) x −1 0 1 x Bild 3.8b) Im Bild 3.8a) ist die Funktion y = f1 (x) = x2 − 2x − 2 dargestellt. 0.5 für x < 0 x + 0.5 für 0 ≤ x < 1 Bild 3.8b) zeigt die Funktion y = f2 (x) = 1.5 für x ≥ 1. Im Beispiel 3.20 wurde das Monotonieverhalten der betrachteten Funktionen anschaulich begründet. Auf die Untersuchung der Monotonie unter Anwendung der Differentialrechnung wird im Abschnitt 4.2.2 eingegangen. 52 2) Symmetrieverhalten Das Symmetrieverhalten von Funktionen kann durch die Begriffe gerade Funktion bzw. ungerade Funktion charakterisiert werden. Definition 3.9: Eine Funktion y = f (x) wird als gerade Funktion bezeichnet, wenn sie die Eigenschaft f (−x) = f (x) für alle x ∈ D und − x ∈ D besitzt. Die Kurve einer geraden Funktion verläuft spiegelsymmetrisch zur y-Achse. Beispiel 3.21: Bei der Funktion y = cos x (siehe Bild 3.9a)) handelt es sich um eine gerade Funktion. Definition 3.10: Eine Funktion y = f (x) nennt man ungerade Funktion, wenn sie die Eigenschaft f (−x) = −f (x) für alle x ∈ D und − x ∈ D besitzt. Die Kurve einer ungeraden Funktion verläuft punktsymmetrisch zum Koordinatenursprung. Beispiel 3.22: Bei der Funktion y = sin x (siehe Bild 3.9b)) handelt es sich um eine ungerade Funktion. y 1 y 6 −π −2π 0 1 π 2π x −1 −2π −π 6 0 π - 2π x −1 Bild 3.9a) Bild 3.9b) Weiterhin gelten die folgenden Aussagen über gerade bzw. ungerade Funktionen. - Die Summe und die Differenz zweier gerader Funktionen ist wiederum eine gerade Funktion. - Die Summe und die Differenz zweier ungerader Funktionen ist wiederum eine ungerade Funktion. - Das Produkt zweier gerader oder zweier ungerader Funktionen ergibt stets eine gerade Funktion. - Das Produkt einer geraden mit einer ungeraden Funktion ergibt stets eine ungerade Funktion. Bemerkung: Viele Funktionen haben die Eigenschaft, weder gerade noch ungerade zu sein; z.B. besitzen die im Beispiel 3.20 betrachteten Funktionen (siehe vorige Seite) keine der genannten Symmetrieeigenschaften. 3) Periodizität Definition 3.11: Eine Funktion y = f (x) heißt periodisch mit der Periode p (p ∈ R), wenn für jedes x ∈ D auch die Zahlen x ± p zu D gehören und f (x ± p) = f (x) gilt. Anschaulich bedeutet dies, dass sich der Verlauf der Funktionskurve in regelmäßigen Abständen wiederholt. 53 Beispiel 3.23: a) b) Einfachstes Lagerhaltungsmodell in der Materialwirtschaft15 Bei diesem Lagerhaltungsmodell werden regelmäßige Bestandsverläufe und exakt eingehaltene Liefertermine vorausgesetzt. Der Lagerbestand b wird als Funktion der Zeit t betrachtet und hat einen säge” zahnartigen“ Verlauf (siehe Bild 3.10). Zu den Zeitpunkten t = T , t = 2T , t = 3T usw. erfolgen jeweils die Materiallieferungen. b(t) 6 bmax Q Q Q r Q Q Q Q 0 QQr T Q Q Q Q Q QQr 2T Q Q Q QQr 3T Q QQ 4T t Bild 3.10 4) Umkehrbare Funktionen Gemäß Definition 3.7 ordnet eine Funktion y = f (x) jedem Argument x ∈ D eindeutig einen Funktionswert y ∈ W zu, d.h. bei gegebenem x und f kann jeweils das zugehörige y berechnet werden. Nun soll die umgekehrte Fragestellung betrachtet werden: Gegeben sei ein Funktionswert y0 . Gibt es einen eindeutig bestimmten Wert x0 , so dass y0 = f (x0 ) gilt? Wenn ja, wie kann dieser Wert x0 ermittelt werden? Wenn jedem y ∈ W eindeutig ein x ∈ D zugeordnet werden kann, dann ist f (x) eine umkehrbare Funktion. Man überlegt sich leicht, dass f (x) nur dann umkehrbar sein kann, wenn jeder Funktionswert y ∈ W genau einmal vorkommt. Dies ist der Fall, wenn f eine streng monotone Funktion ist (vgl. Definition 3.8). Die Umkehrbarkeit muss nicht unbedingt auf den gesamten Definitionsbereich D bezogen werden, sondern es kann auch ein Intervall I ⊂ D betrachtet werden. Wenn die Funktion f (x) im Intervall I ⊆ D streng monoton (wachsend oder fallend) ist, dann ist diese Funktion umkehrbar. Das bedeutet, dass zu der Funktion f (x) die Umkehrfunktion f −1 (x) existiert. Die Umkehrfunktion f −1 (x) für eine gegebene Funktion f (x) kann wie folgt bestimmt werden: (I) Auflösung der Funktionsgleichung y = f (x) nach der Variablen x (falls möglich): x = g(y) = f −1 (y) (II) Formale Vertauschung der Variablenbezeichnungen in der Gleichung aus (I): y = f −1 (x) Die Umkehrfunktion f −1 (x) hat den Definitionsbereich W und den Wertebereich D. Beispiel 3.24: 3.2.3 Einige spezielle Funktionen In diesem Abschnitt werden einige spezielle, im weiteren benötigte Funktionstypen aufgezählt. Dabei werden auch einige Anwendungsgebiete dieser Funktionen genannt. Eine detaillierte Behandlung der Funktionseigenschaften erfolgt an dieser Stelle nicht; dazu sei auf die folgende Literatur verwiesen: H.-J. BARTSCH . Taschenbuch mathematischer Formeln für Ingenieure und Naturwissenschaftler, 23. Auflage (2014), Abschnitte 7.6 und 7.7 oder L. PAPULA . Mathematik für Ingenieure und Naturwissenschaftler (Band 1), 12. Auflage (2009), Kapitel III. 15 Quelle: D. A RNOLD , K. F URMANS . Materialfluss in Logistiksystemen, 6. Auflage, S. 174 54 1) Ganzrationale Funktionen (Polynome) Unter einer ganzrationalen Funktion (oder einem Polynom) versteht man eine Funktion, die folgendermaßen darstellbar ist: y = f (x) = an xn + an−1 xn−1 + . . . + a1 x1 + a0 (52) mit n ∈ N (Polynomgrad), x ∈ R und a0 , a1 , . . . , an ∈ R (Koeffizienten des Polynoms). Jede reelle Zahl x1 , für die f (x1 ) = 0 gilt, wird als Nullstelle des Polynoms bezeichnet. Besitzt das Polynom aus (52) genau n reelle Nullstellen x1 , x2 , . . . , xn , so ist die folgende Produktdarstellung möglich: y = f (x) = an (x − x1 )(x − x2 ) . . . (x − xn ). (53) Hierzu sind die folgenden Hinweise zu beachten: - Wenn nicht alle Nullstellen des Polynoms voneinander verschieden sind, können die entsprechenden Faktoren in (53) entsprechend zusammengefasst werden. - Besitzt das Polynom nur k reelle Nullstellen (mit 0 ≤ k < n), so gilt anstelle von (53) eine Darstellung der Form: y = an (x − x1 )(x − x2 ) . . . (x − xk )g(x), wobei g(x) ein Polynom ist, das keine reellen Nullstellen hat. Beispiel 3.25: Anwendungsbeispiele für Polynome sind: Weg-Zeit-Gesetz der geradlinig gleichförmigen oder der gleichmäßig beschleunigten Bewegung. 2) Gebrochenrationale Funktionen Funktionen, die als Quotient zweier Polynome darstellbar sind, heißen gebrochenrationale Funktionen: y= g(x) am xm + am−1 xm−1 + . . . + a1 x + a0 = , h(x) bn xn + bn−1 xn−1 + . . . + b1 x + b0 wobei m, n ∈ N sowie ai , bj ∈ R für 0 ≤ i ≤ m und 0 ≤ j ≤ n. Gilt dabei: m < n, wird die Funktion als echt gebrochenrationale Funktion bezeichnet. Im Fall m ≥ n heißt die Funktion unecht gebrochenrational. Jede unecht gebrochenrationale Funktion kann nach Polynomdivision als Summe eines Polynoms vom Grad m − n und einer echt gebrochenrationalen Funktion dargestellt werden. Beispiel 3.26: 3) Winkelfunktionen (trigonometrische Funktionen) und Arkusfunktionen Die Funktionen y = sin x, y = cos x (siehe Beispiel 3.22) sowie y = tan x und y = cot x sind trigonometrische Funktionen. Dabei gilt: tan x = π sin x (mit x 6= + kπ, k ∈ Z) und cos x 2 55 cot x = cos x (mit x 6= kπ, k ∈ Z). sin x (54) Daraus folgt: cot x = 1 π für x 6= + kπ und x 6= kπ, k ∈ Z. tan x 2 Eine sehr wichtige Beziehung zwischen der Sinus- und der Kosinusfunktion lautet: sin2 x + cos2 x = 1 (x ∈ R). Bei Berechnungen mit Winkelgrößen und trigonometrischen Funktionen ist sorgfältig zu unterscheiden, ob die Winkel im Gradmaß oder im Bogenmaß angegeben sind16 . Es gilt die folgende Umrechnungsformel für Gradmaß in Bogenmaß: x= π·α , wobei α : Winkelgröße im Gradmaß, x : Winkelgröße im Bogenmaß. 180◦ Trigonometrische Funktionen werden beispielsweise bei der Beschreibung physikalischer Prozesse, wie etwa Schwingungsvorgänge oder Wellenausbreitung, angewendet. Weiterhin werden sie für die Berechnung von Seitenlängen und Winkelgrößen in Dreiecken benötigt. Gemäß den Ausführungen im Abschnitt 3.2.2, Punkt 4) ist strenge Monotonie eine notwendige Voraussetzung für die Umkehrbarkeit einer Funktion. Auf Grund der Periodizität der trigonometrischen Funktionen (vgl. dazu auch Beispiel 3.23a)) ist diese Voraussetzung zunächst nicht erfüllt. Wenn die trigonometrischen Funktionen jedoch auf geeignete Intervalle eingeschränkt werden (d.h. auf solche Intervalle, in denen die jeweilige Funktion streng monoton verläuft und alle zum Wertebereich gehörigen Funktionswerte annimmt), können entsprechende Umkehrfunktionen gebildet werden. Diese werden zusammenfassend als Arkusfunktionen bezeichnet. Die Arkusfunktionen sind: g(x) = arcsin x, g(x) = arccos x (jeweils mit dem Definitionsbereich D = [−1, 1]) sowie g(x) = arctan x, g(x) = arccot x (jeweils mit dem Definitionsbereich D = R). 4) Exponential- und Logarithmusfunktion Als (allgemeine) Exponentialfunktionen bezeichnet man Funktionen vom Typ y = ax mit a > 0 und a 6= 1. (55) Wählt man als Basis der Potenz speziell: a = e (e: Eulersche Zahl), so erhält man die (spezielle) Exponentialfunktion: y = ex (auch e-Funktion“ genannt), welche in den Anwendungen der Mathematik eine ” außerordentlich wichtige Rolle spielt. Jede allgemeine Exponentialfunktion kann auch in der Form y = ax = eλx mit λ = ln a dargestellt werden. Exponentialfunktionen werden beispielsweise für die mathematische Beschreibung von Wachstums- oder Zerfallsprozessen sowie von gedämpften Schwingungen verwendet. Ebenso werden Exponentialfunktionen in der Wahrscheinlichkeitsrechnung benötigt. Da es sich bei den Exponentialfunktionen um streng monotone Funktionen handelt, sind diese umkehrbar. Die Umkehrfunktion der Exponentialfunktion y = ax aus (55) ist (bei festem a) die Logarithmusfunktion y = loga x. Für a = e erhält man die natürliche Logarithmusfunktion y = ln x (auch: ln-Funktion“). ” 5) Hyperbel- und Areafunktionen Mit Hilfe von Exponentialfunktionen werden die Hyperbelfunktionen (hyperbolischen Funktionen)17 definiert: y = sinh x = ex − e−x , 2 y = cosh x = y = coth x = ex + e−x ex − e−x für x ∈ R \ {0}. ex + e−x , 2 y = tanh x = ex − e−x (jeweils für x ∈ R), ex + e−x Ähnlich zu (54) gelten die folgenden Beziehungen: tanh x = sinh x für x ∈ R sowie cosh x coth x = 16 cosh x für x ∈ R \ {0}. sinh x Bei Benutzung des Taschenrechners muss die gewünschte Einstellung vorgenommen werden. Die Schreibweise sinh x bedeutet sinus hyperbolicus x“. Analog dazu lauten die anderen Hyperbelfunktionen: cosinus hyperboli” ” cus x“, tangens hyperbolicus x“ bzw. cotangens hyperbolicus x“. ” ” 17 56 Die Kurve der Funktion y = a · cosh xa (mit dem reellen Parameter a > 0) wird auch als Kettenlinie bezeichnet, da eine biegsame, an beiden Enden in gleicher Höhe befestigte Kette die Gestalt dieser Kurve annimmt, wenn sie nur durch die eigene Schwerkraft belastet ist. Die tanh-Funktion kommt beim Geschwindigkeits-Zeit-Gesetz für den freien Fall unter Berücksichtigung des Luftwiderstandes zur Anwendung. Die Umkehrfunktionen der Hyperbelfunktionen sind die Areafunktionen18 : y = arsinh x, y = arcosh x, y = artanh x und y = arcoth x. 3.3 Grenzwert und Stetigkeit einer Funktion 3.3.1 Grenzwerte Durch das folgende Beispiel soll die Einführung des Grenzwertbegriffes motiviert werden. Beispiel 3.27: Es wird das Verhalten der Funktion f (x) = x2 bei einer beliebig feinen Annäherung an die Stelle x0 = 2 untersucht. Annäherung von links: Es wird eine Folge von x-Werten betrachtet, die von links gegen die Zahl 2 konvergiert: {xn } = {1.9, 1.99, 1.999, 1.9999, . . .}. Jedem Glied dieser Folge wird durch die Funktionsgleichung f (x) = x2 genau ein Funktionswert zugeordnet: f (xn ) = x2n . Dadurch entsteht die Wertetabelle: xn f (xn ) 1.9 3.61 1.99 3.9601 1.999 3.996001 1.9999 3.99960001 ... ... Man erkennt, dass die Folge der Funktionswerte {f (xn )} gegen den Wert 4 konvergiert. Für jede andere, von links gegen die Zahl 2 konvergierende Folge {xn } würde man dasselbe Ergebnis erhalten. Annäherung von rechts: Es wird eine Folge von x-Werten betrachtet, die von rechts gegen die Zahl 2 konvergiert: {xn } = {2.1, 2.01, 2.001, 2.0001, . . .}. Die zugehörigen Funktionswerte f (xn ) sind: xn f (xn ) 2.1 4.41 2.01 4.0401 2.001 4.004001 2.0001 4.00040001 ... ... Die Folge {f (xn )} strebt wiederum gegen den Wert 4. In diesem Beispiel stimmen die beiden Grenzwerte von links und von rechts überein. Man schreibt: limx→2 x2 = 4 und spricht von dem Grenzwert der Funktion f (x) = x2 an der Stelle x0 = 2. Im folgenden werden Grenzwerte von Funktionen für x → x0 (x0 ∈ R) sowie für x → ∞ (bzw. x → −∞) betrachtet. a) Grenzwert einer Funktion für x → x0 (x0 ∈ R) Definition 3.12: Eine Funktion f (x) sei in einer Umgebung der Stelle x0 definiert. Gilt dann für jede im Definitionsbereich dieser Funktion liegende und gegen x0 konvergierende Zahlenfolge {xn } stets: lim f (xn ) = g , n→∞ dann heißt g der Grenzwert von f (x) an der Stelle x0 . Schreibweise: limx→x0 f (x) = g Gilt für jede von links her gegen x0 strebende Folge {xn }: lim f (x) = gl , x→x0 −0 so heißt gl der linksseitige Grenzwert von f (x) für x → x0 . Analog dazu ist der rechtsseitige Grenzwert definiert: lim f (x) = gr . x→x0 +0 18 Die Schreibweise arsinh x bedeutet area sinus hyperbolicus x“. Analog dazu lauten die anderen Areafunktionen: area cosinus ” ” hyperbolicus x“, area tangens hyperbolicus x“ bzw. area cotangens hyperbolicus x“. ” ” 57 Die Funktion f (x) besitzt an der Stelle x0 den Grenzwert g, wenn gilt: lim f (x) = x→x0 −0 lim f (x) = g x→x0 +0 (d.h. wenn der links- und der rechtsseitige Grenzwert übereinstimmen). Beispiel 3.28: (I) Die Funktion y = f (x) = 0 für x < 0 besitzt an der Stelle x0 = 0 keinen Grenzwert, 1 für x ≥ 0 da der linksseitige Grenzwert nicht mit dem rechtsseitigen Grenzwert übereinstimmt: gl = lim f (x) = x→0−0 gr = lim f (x) = x→0+0 y 6 lim 0 = 0 x→0−0 1r lim 1 = 1 x→0+0 x 0 (II) Die Funktion y = f (x) = x2 − 2x ist an der Stelle x0 = 2 nicht definiert. x−2 Sie besitzt an dieser Stelle jedoch einen Grenzwert: lim x→2 x(x − 2) x2 − 2x = lim = lim x = 2. x→2 x→2 x−2 x−2 (III) Die Funktion y = f (x) = tan x ist an der Stelle x0 = Dort ist auch kein Grenzwert vorhanden, denn es gilt: gl = lim tan x = ∞, x→ π2 −0 gr = π 2 nicht definiert. y6 lim tan x = −∞. x→ π2 +0 π 2 Außerdem sei bemerkt, dass es sich sowohl bei dem linksseitigen als auch bei dem rechtsseitigen Grenzwert dieser Funktion um uneigentliche Grenzwerte handelt. (IV) Die Funktion y = f (x) = sin 1 x x y 6 ist an der Stelle x0 = 0 1 nicht definiert und besitzt dort auch keinen Grenzwert, da die Funktionswerte bei Annäherung an x0 ständig zwischen −1 und 1 schwanken. −0.25 0 0.25 x −1 b) Grenzwert einer Funktion für x → ∞ bzw. x → −∞ Definition 3.13: Wenn für jede im Definitionsbereich der Funktion f (x) liegende Zahlenfolge {xn } mit limn→∞ xn = ∞ (bzw. limn→∞ xn = −∞) die Folge der Funktionswerte {f (xn )} gegen eine Zahl g strebt, dann heißt g der Grenzwert von f (x) für x → ∞ (bzw. x → −∞). Schreibweise: limx→∞ f (x) = g (bzw. limx→−∞ f (x) = g ) 58 Beispiel 3.29: Bei der Berechnung von Grenzwerten von Funktionen (sowohl im Fall a) als auch im Fall b)) erweisen sich neben geeigneten Umformungen - die folgenden Rechenregeln für Grenzwerte als hilfreich. Rechenregeln für Grenzwerte von Funktionen Unter der Voraussetzung, dass die jeweiligen Grenzwerte existieren, gelten die folgenden Regeln (sie sind entsprechend auch für Grenzwerte mit x → ∞ bzw. x → −∞ gültig): 1. limx→x0 [C · f (x)] = C · (limx→x0 f (x)) (C: Konstante) 2. limx→x0 [f (x) ± g(x)] = limx→x0 f (x) ± limx→x0 g(x) 3. limx→x0 [f (x) · g(x)] = (limx→x0 f (x)) · (limx→x0 g(x)) f (x) limx→x0 f (x) 4. limx→x0 = (limx→x0 g(x) 6= 0) g(x) limx→x0 g(x) p p n f (x) = n limx→x0 f (x) (n ∈ N) 6. limx→x0 [f (x)]n = (limx→x0 f (x))n 7. limx→x0 af (x) = alimx→x0 f (x) (n ∈ N) 5. limx→x0 8. limx→x0 [loga f (x)] = loga (limx→x0 f (x)) Beispiel 3.30: Beispiel 3.31:19 Wenn an einen schwingfähigen Körper (Masse m, Eigenkreisfrequenz ω0 ) eine periodisch veränderliche Kraft (Erregerkreisfrequenz ω, Amplitude a0 ) angreift, so ist die Amplitude im stationären Zustand (nach der Einschwingzeit) gegeben durch: a = a(ω) = p a0 m2 (ω02 − ω 2 )2 + b2 ω 2 , ω > 0 ; b > 0 : Reibungskonstante . Es gilt dann: lim a(ω) = ω→0+0 a0 a0 a0 p =p = 2 2 2 2 2 2 2 2 2 2 2 2 2 mω limω→0+0 m (ω0 − ω ) + b ω limω→0+0 [m (ω0 − ω ) + b ω ] 0 sowie limω→∞ a(ω) = 0. Bei fehlender Dämpfung (d.h. b = 0) gilt: limω→ω0 a(ω) = ∞ , d.h. die Funktion a(ω) besitzt für b = 0 an der Stelle ω0 den uneigentlichen Grenzwert ∞ (physikalische Deutung: Resonanz). 19 Quelle: A. F ETZER , H. F R ÄNKEL: Mathematik 1: Lehrbuch für ingenieurwiss. Studiengänge, 10. Auflage, S. 127-128 59 Grenzwerte ausgewählter Funktionen 1 x limx→±∞ 1 + =e limx→∞ √ x x p x = e p (p ∈ R) limx→±∞ 1 + x x=1 limx→∞ limx→0 ex − 1 =1 x limx→0 limx→0 sin(ax) = a (a ∈ R) x limx→∞ √ x a = 1 (a > 0) ln(1 + x) =1 x sin x =0 x Bemerkung: Grenzwerte, die auf unbestimmte Ausdrücke der Form rechnung behandelt werden (siehe Abschnitt 4.2.4). 3.3.2 0 0 oder ∞ ∞ führen, können mit Mitteln der Differential- Asymptoten Wenn die Kurve einer Funktion sich einer Geraden beliebig nähert, so wird diese Gerade als Asymptote bezeichnet. Man unterscheidet dabei: a) vertikale Asymptoten Die Gerade x = x0 heißt vertikale Asymptote der Kurve y = f (x), wenn beim Grenzübergang x → x0 + 0 oder x → x0 − 0 die Funktionswerte gegen ∞ oder −∞ streben. Beispiel 3.32: π Die Gerade x = ist eine vertikale Asymptote der Funktion f (x) = tan x (siehe Beispiel 3.28(III)). 2 b) horizontale Asymptoten Die Gerade y = c wird horizontale Asymptote der Kurve y = f (x) genannt, wenn limx→∞ f (x) = c oder limx→−∞ f (x) = c (c ∈ R) gilt. Beispiel 3.33: c) schräge Asymptoten Als schräge Asymptote der Kurve y = f (x) für x → ∞ bezeichnet man die Gerade y = ax + b, falls a 6= 0 und lim (f (x) − ax − b) = 0 (56) x→∞ gilt. Die Berechnung der Größen a und b aus der Geradengleichung erfolgt nach den Formeln f (x) , x→∞ x a = lim b = lim (f (x) − ax) . x→∞ Bezüglich der schrägen Asymptote für x → −∞ gelten analoge Überlegungen. In bestimmten Fällen kann die Berechnung der schrägen Asymptote auch mittels Polynomdivision erfolgen, siehe dazu Beispiel 3.34. 60 Beispiel 3.34: Zusammenfassend kann die folgende Aussage getroffen werden: Um zu überprüfen, ob die Kurve einer Funktion y = f (x) horizontale oder schräge Asymptoten besitzt, muss das Verhalten der Funktion f (x) für x → ∞ und x → −∞ untersucht werden. Zur Bestimmung vertikaler Asymptoten einer Funktionskurve muss festgestellt werden, ob die Funktion an einer Stelle x0 (oder auch an mehreren Stellen) den uneigentlichen Grenzwert ∞ oder −∞ besitzt. 3.3.3 Stetigkeit einer Funktion Definition 3.14: Eine in x0 und in einer gewissen Umgebung von x0 definierte Funktion f (x) heißt an der Stelle x0 stetig, wenn der Grenzwert limx→x0 f (x) existiert und limx→x0 f (x) = f (x0 ) gilt. Eine Funktion, die an jeder Stelle ihres Definititionsbereiches stetig ist, wird als stetige Funktion bezeichnet. Beispiel 3.35: In den Fällen, wo nur ein einseitiger Grenzwert existiert (vgl. dazu auch Abschnitt 3.3.1), spricht man von einseitiger Stetigkeit der Funktion an der entsprechenden Stelle. Definition 3.15: Eine in x0 definierte Funktion f (x) heißt an der Stelle x0 linksseitig stetig (bzw. rechtsseitig stetig), wenn der linksseitige Grenzwert gl = limx→x0 −0 f (x) (bzw. der rechtsseitige Grenzwert gr = limx→x0 +0 f (x)) existiert und gl = f (x0 ) (bzw. gr = f (x0 )) gilt. Beispiel 3.36: Schließlich wird noch der Begriff der unstetigen Funktion eingeführt. Definition 3.16: Eine in x0 und in einer gewissen Umgebung von x0 definierte Funktion f (x) heißt an der Stelle x0 unstetig, wenn eine der folgenden Aussagen zutrifft: (1) Es gilt: limx→x0 f (x) 6= f (x0 ) (d.h. Grenzwert und Funktionswert in x0 sind verschieden). (2) Der Grenzwert von f (x) an der Stelle x0 ist nicht vorhanden. (Mit anderen Worten: eine Funktion ist unstetig an der Stelle x0 , wenn dort eine der Bedingungen für die Stetigkeit, siehe Definition 3.14, nicht erfüllt ist.) 61 Beispiel 3.37: a) Die Funktion y = f (x) = 0 für x < 0 a für x ≥ 0 y 6 mit a ∈ R \ {0} besitzt an der Stelle x0 = 0 keinen Grenzwert, da der linksseitige Grenzwert nicht mit dem rechtsseitigen Grenzwert übereinstimmt. Sie besitzt dort eine Sprungunstetigkeit. Die Funktion f (x) ist jedoch einseitig stetig, und zwar rechtsseitig stetig an der Stelle x0 = 0, denn es gilt: gr = limx→0+0 f (x) = limx→0+0 a = a = f (0). −1 für x < 0 0 für x = 0 b) Die Funktion y = f (x) = 1 für x > 0 x→0−0 gr = lim f (x) = x→0+0 lim (−1) = −1 lim 1 = 1 1 r 0 x −1 x→0−0 x→0+0 x 0 y 6 ist an der Stelle x0 = 0 unstetig, da sie dort keinen Grenzwert besitzt: gl = lim f (x) = a r ⇒ gl 6= gr . Die Funktion f (x) hat an dieser Stelle eine Sprungunstetigkeit. Diese Funktion ist in x0 = 0 weder rechtsseitig noch linksseitig stetig, denn es gilt: gl 6= f (0) sowie gr 6= f (0). Unter einer Definitionslücke einer Funktion f (x) versteht man eine nicht zum Definitionsbereich von f gehörige Stelle, wobei jedoch links und rechts dieser Stelle Funktionswerte definiert sind (siehe dazu auch Beispiel 3.38). Funktionen mit Definitionslücken können ggf. durch nachträgliche Festsetzung von Funktionswerten zu einer stetigen Funktion ergänzt werden. Beispiel 3.38: Allgemein gilt die folgende Aussage: Behebung von Definitionslücken Eine Definitionslücke einer Funktion f (x) an der Stelle x0 lässt sich beheben, wenn der Grenzwert von f (x) in x0 vorhanden ist. Der fehlende Funktionswert wird gleich diesem Grenzwert gesetzt. Beispiel 3.39: 62 4 Differentialrechnung für Funktionen einer reellen Variablen 4.1 Grundlegendes zur Differentialrechnung 4.1.1 Differenzierbarkeit und erste Ableitung Definition 4.1: Die Funktion y = f (x) heißt an der Stelle x = x0 differenzierbar, wenn der Grenzwert limh→0 f (x0 + h) − f (x0 ) h existiert. Man bezeichnet ihn als erste Ableitung (oder Differentialquotient) von f (x) an der Stelle x = x0 . Schreibweise für die erste Ableitung von y = f (x): y 0 (x) oder dy dx bzw. f 0 (x) oder d f (x) dx häufig verwendete Schreibweise für die erste Ableitung von y = y(t): ẏ(t) Die ersten Ableitungen der elementaren Funktionen20 Funktion Ableitung Funktion c (Konstante) 0 arccos x Ableitung √ −1/ 1 − x2 xa (a ∈ R) axa−1 arctan x 1/(1 + x2 ) ex ex arccot x −1/(1 + x2 ) ax (a > 0) ax ln a sinh x cosh x ln x 1/x cosh x sinh x loga |x| 1/(x ln a) = (1/x) loga e tanh x 1/cosh2 x sin x cos x coth x cos x − sin x arsinh x tan x 1/ cos2 x = 1 + tan2 x arcosh x −1/sinh2 x √ 1/ 1 + x2 √ 1/ x2 − 1 cot x −1/ sin2 x = −(1 + cot2 x) √ 1/ 1 − x2 artanh x 1/(1 − x2 ) arcoth x −1/(x2 − 1) arcsin x Die erste Ableitung einer Funktion kann auch geometrisch gedeutet werden. Dazu wird das folgende Tangentenproblem betrachtet: Gegeben sei eine Funktion f (x). Gesucht wird der Anstieg der Kurventangente an der Stelle x = x0 , d.h. im Kurvenpunkt P = (x0 , f (x0 )). y 6 Sekante sQ f (x0 + h) Tangente in P f (x0 ) s P x0 x0 + h x Bild 4.1 20 Dabei ist stets zu beachten, für welche reellen Zahlen x die Funktion bzw. ihre Ableitung definiert ist. 63 Zur Lösung des Tangentenproblems: 1. In der Nachbarschaft von P wird ein weiterer Kurvenpunkt Q ausgewählt und die Sekante durch P und Q gezeichnet (siehe Bild 4.1). Der Anstieg dieser Sekante (nach der Zwei-Punkte-Gleichung der Geraden) ist: f (x0 + h) − f (x0 ) f (x0 + h) − f (x0 ) = (x0 + h) − x0 h mS = (Differenzenquotient) . 2. Wenn der Punkt Q entlang der Kurve auf den Punkt P zuwandert (Q → P ), so gilt gleichzeitig h → 0 und beim Grenzübergang fällt die Sekante in die (gesuchte) Tangente. ⇒ Anstieg mT der Tangente = Grenzwert der Sekantensteigung mS , d.h. f (x0 + h) − f (x0 ) h→0 h mT = lim (1. Ableitung oder Differentialquotient, siehe Definition 4.1) Zwischen den Eigenschaften der Stetigkeit und der Differenzierbarkeit einer Funktion besteht der folgende Zusammenhang: Die Funktion f (x) ist in x0 differenzierbar ⇒ f (x) ist in x0 auch stetig. Aber: Die Umkehrung dieser Aussage gilt nicht, d.h. Stetigkeit ist nicht hinreichend für Differenzierbarkeit. Beispiel 4.1: Ableitungsregeln für Funktionen einer reellen Variablen Faktorregel: (C · f (x))0 = C · f 0 (x) (C: Konstante) Summenregel: (f1 (x) + f2 (x) + . . . + fn (x))0 = f10 (x) + f20 (x) + . . . + fn0 (x) Produktregel: (u(x) · v(x))0 = u0 (x) · v(x) + u(x) · v 0 (x) Produktregel bei drei Faktorfunktionen: (u(x) · v(x) · w(x))0 = u0 (x) · v(x) · w(x) + u(x) · v 0 (x) · w(x) + u(x) · v(x) · w0 (x) 0 u0 (x) · v(x) − u(x) · v 0 (x) u(x) = Quotientenregel: 2 v(x) Kettenregel: [f (u(x))]0 = v (x) df du · = f 0 (u) · u0 (x) du dx (f 0 (u): äußere Ableitung, u0 (x): innere Ableitung) Ableitung der Umkehrfunktion: g 0 (y) = 1 f 0 (x) , wobei f 0 (x) 6= 0 (y = f (x) : umkehrbare Funktion, x = g(y) : nach x aufgelöste Form dieser Funktion) Ableitung einer in Parameterform gegebenen Funktion (Kurve): Die Kurve sei gegeben durch x = x(t), y = y(t) (t1 ≤ t ≤ t2 ), dann gilt: y 0 = 64 ẏ ẋ Beispiel 4.2: Wenn eine Funktion vom Typ f (x) = u(x)v(x) nach x differenziert werden soll, können die bisher aufgeführten Ableitungsregeln und Ableitungen elementarer Funktionen nicht angewendet werden, da die Variable x sowohl in der Basis als auch im Exponenten der Potenz auftritt. In solchen Fällen führt die logarithmische Differentiation zum Ziel. Formel für die logarithmische Differentiation Die Ableitung f 0 (x) einer Funktion f (x) = u(x)v(x) mit u(x) > 0 wird berechnet nach: u0 (x) 0 0 f (x) . f (x) = v (x) ln(u(x)) + v(x) u(x) (57) Begründung für Formel (57): Zunächst wird die Funktionsgleichung f (x) = u(x)v(x) logarithmiert, wodurch man unter Verwendung von Logarithmengesetzen erhält: ln(f (x)) = v(x) ln(u(x)) . Dann werden beide Seiten dieser Gleichung differenziert, wobei die Produktregel (auf der rechten Seite der Gleichung) und die Kettenregel (jeweils für die Ableitung der Terme ln(f (x)) und ln(u(x))) zur Anwendung kommt. Daraus ergibt sich f 0 (x) u0 (x) = v 0 (x) ln(u(x)) + v(x) f (x) u(x) und nach Multiplikation mit f (x) entsteht schließlich die Formel (57). Beispiel 4.3: 4.1.2 Das Differential einer Funktion und dessen Anwendung in der Fehlerrechnung Differential einer Funktion Die Funktion y = f (x) sei an der Stelle x0 differenzierbar. Für h 6= 0 nennt man das Produkt f 0 (x0 ) · h Differential der Funktion f an der Stelle x0 zum Zuwachs h. Schreibweise: dy = df (x0 ) = f 0 (x0 ) · h Das Differential dy einer differenzierbaren Funktion f mit y = f (x) an der Stelle x0 lässt sich als Zuwachs der Tangentenordinate für den Argumentzuwachs h deuten (siehe Bild 4.2). Das Differential einer an der Stelle x differenzierbaren Funktion kann auch in der Form df (x) = dy = f 0 (x) · dx geschrieben werden. y Q r 6 f (x0 + h) f (x) 6 f (x0 ) dy Pr ? h = dx x0 x0 + h x Bild 4.2 Für eine differenzierbare Funktion sei mit ∆y der Funktionszuwachs von f an der Stelle x bezeichnet, d.h. ∆y = f (x + h) − f (x) (vgl. auch Bild 4.2). Ersetzt man den Funktionszuwachs ∆y näherungsweise durch das Differential dy, dann erhält man: ∆y ≈ dy = f 0 (x)dx . Dieser Zusammenhang wird in der Fehlerrechnung genutzt. Die Zielstellung der Fehlerrechnung besteht darin, dass die Auswirkungen eines Fehlers der Messgröße x auf eine von x abhängige Größe untersucht werden (Fehlerfortpflanzung). 65 Anwendung des Differentials in der Fehlerrechnung Sei x eine Messgröße und y = f (x) eine von x abhängige (d.h. aus x zu berechnende) Größe. Die Messgröße x werde mit einem Messfehler von maximal |dx| gemessen. Dann gelten für den absoluten bzw. relativen Fehler von y die folgenden Schätzungen: absoluter Fehler: |∆y| ≈ |dy| ≤ |f 0 (x)| · |dx| ∆y relativer Fehler: ≈ y dy ≤ y 0 f (x) y · |dx| Beispiel 4.4: Bemerkung: Wenn die zu berechnende Größe von mehreren Messgrößen abhängt, ist ebenfalls eine Schätzung des absoluten und des relativen Fehlers möglich. Darauf wird in dem Kapitel Differentialrechnung für Funktionen mehrerer ” reeller Variabler“ eingegangen. 4.1.3 Höhere Ableitungen Bisher wurden ausschließlich erste Ableitungen von Funktionen betrachtet. Falls die Ableitung f 0 (x) wiederum eine differenzierbare Funktion ist, dann erhält man durch nochmaliges Differenzieren die 2. Ableitung der Funktion f (x): f 00 (x) = d dx (f 0 (x)). Weiterhin ist auch die Schreibweise y 00 (x) oder d2 y dx2 oder d2 dx2 f (x) möglich. Falls die Funktion als y = y(t) gegeben ist, wird ihre 2. Ableitung auch mit ÿ bezeichnet. Allgemein gilt für die n-te Ableitung einer Funktion f (x): f (n) (x) = d dx (f (n−1) (x)). Für die n-te Ableitung einer Funktion ist auch die Schreibweise y (n) (x) oder dn y dxn oder dn dxn f (x) möglich. Beispiel 4.5: 4.2 Anwendungen der Differentialrechnung 4.2.1 Anwendungen der Differentialrechnung in der Physik Beispiel 4.6 Momentangeschwindigkeit eines Massepunktes21 Ein Massepunkt bewege sich entlang einer Geraden nach dem Gesetz s = s(t). Position zum Zeitpunkt t: s(t), Position zum Zeitpunkt t + ∆t: s(t + ∆t) = s(t) + ∆s (siehe Bild 4.3) t ∆t t + ∆t - s(t) ∆s s(t + ∆t) Bild 4.3 Die durchschnittliche Geschwindigkeit v in diesem Zeitraum beträgt v= 21 ∆s s(t + ∆t) − s(t) = . ∆t ∆t Quelle: L. PAPULA . Mathematik für Ingenieure und Naturwissenschaftler (Band 2), 12. Auflage, S. 361-362 66 Die Momentangeschwindigkeit zum Zeitpunkt t entsteht durch Grenzübergang ∆t → 0: ∆s s(t + ∆t) − s(t) = lim = ṡ ∆t→0 ∆t ∆t→0 ∆t v = lim ⇒ Momentangeschwindigkeit = 1. Ableitung des Weges nach der Zeit. Beispiel 4.7: Momentanbeschleunigung eines Massepunktes Analog zu den Überlegungen im Beispiel 4.6 (jetzt mit a statt v und v statt s) erhält man: ∆v v(t + ∆t) − v(t) = ∆t ∆t ∆v v(t + ∆t) − v(t) Momentanbeschleunigung : a = lim = lim = v̇ = s̈ . ∆t→0 ∆t ∆t→0 ∆t durchschnittliche Beschleunigung : a = 4.2.2 Untersuchung des Monotonieverhaltens und Bestimmung charakteristischer Kurvenpunkte Auf das Monotonieverhalten als allgemeine Eigenschaft von Funktionen wurde bereits im Abschnitt 3.2.2 eingegangen (siehe Definition 3.8). Mit Hilfe der ersten Ableitung einer Funktion kann entschieden werden, ob diese Funktion in einem gewissen Intervall (streng) monoton wachsend oder (streng) monoton fallend ist. Aussagen zum Monotonieverhalten einer Funktion Die Funktion y = f (x) sei auf [a, b] stetig und auf (a, b) differenzierbar. f (x) ist auf [a, b] monoton wachsend (bzw. streng monoton wachsend) genau dann, wenn f 0 (x) ≥ 0 (bzw. f 0 (x) > 0) für alle x ∈ (a, b) gilt. f (x) ist auf [a, b] monoton fallend (bzw. streng monoton fallend) genau dann, wenn f 0 (x) ≤ 0 (bzw. f 0 (x) < 0) für alle x ∈ (a, b) gilt. Beispiel 4.8: Bei der Untersuchung von Funktionskurven ist es häufig von Interesse, solche Stellen zu finden, an denen minimale bzw. maximale Funktionswerte vorliegen (charakteristische Kurvenpunkte). Im weiteren wird die Lösung derartiger Problemstellungen erläutert. Definition 4.2: Eine Funktion y = f (x) besitzt an einer Stelle x0 ein lokales Maximum bzw. lokales Minimum, wenn in einer gewissen Umgebung von x0 stets gilt: f (x0 ) > f (x) bzw. f (x0 ) < f (x) (x 6= x0 ) . Die lokalen Minima und Maxima einer Funktion werden unter dem Begriff lokale Extrema“ ” zusammengefasst. Die notwendige Bedingung für ein lokales Extremum der Funktion f (x) an der Stelle x0 lautet: f 0 (x0 ) = 0 (d.h. die Kurventangente hat in diesem Punkt den Anstieg 0 und verläuft somit waagerecht zur x-Achse). Diese Bedingung ist jedoch nicht hinreichend, wie das folgende einfache Beispiel zeigt. 67 Beispiel 4.9: y6 x3 Für die Funktion f (x) = gilt an der Stelle x0 = 0: f 0 (x0 ) = 3x20 = 0. Jedoch liegt an dieser Stelle kein Extremum vor, denn es gilt f (0) = 0 und in der Umgebung der Stelle x0 = 0 gibt es sowohl negative als auch positive Funktionswerte (siehe Bild 4.4). 1 −1 0 1 - x −1 Bild 4.4 Um entscheiden zu können, ob an einer Stelle x0 mit f 0 (x0 ) = 0 tatsächlich ein Extremum vorliegt, muss der Wert der 2. Ableitung betrachtet werden. Hinreichende Bedingungen für das Vorliegen eines lokalen Extremums an der Stelle x0 Die Funktion f (x) sei in einer Umgebung von x0 ∈ (a, b) differenzierbar. Wenn f 0 (x0 ) = 0 und f 00 (x0 ) > 0 (bzw. f 00 (x0 ) < 0) gilt, dann besitzt f in x0 ein lokales Minimum (bzw. lokales Maximum). Beispiel 4.10: Gegeben ist die Funktion f (x) = x2 · e−0.5x (siehe dazu auch Bild 4.5). An welchen Stellen besitzt diese Funktion lokale Extrema? y Max. s 6 f (x) 1 s −1 x Min. 1 Bild 4.5 68 Beispiel 4.11: Im Beispiel 3.16c) (siehe Abschnitt 3.2.1) wurden die Gesamtkosten KG in Abhängigkeit von der Bestellmenge b betrachtet. Von besonderem Interesse ist dabei die Frage nach der optimalen (d.h. der kostengünstigsten) Bestellmenge. Ausgehend von der Formel (siehe dazu auch (50)) M kl b + · ·P b 100 2 kann die Funktion KG (b) auf lokale Minima untersucht werden. Man erhält als erste Ableitung dieser Funktion (wobei beachtet werden muss, dass die Größen kb , M , kl und P konstant, d.h. von b unabhängig, sind): KG (b) = kb · kl 1 M + · ·P . 2 b 100 2 0 (b) = 0 gesetzt und die entstehende Gleichung nach b umgestellt: Es wird KG 0 KG (b) = −kb · kl 1 M · ·P =0 −kb · 2 + b 100 2 ⇒ 2 · 100 · kb · M b2 = kl · P (58) s ⇒ b1,2 = ± 2 · 100 · kb · M , kl · P d.h. es gibt zwei extremwertverdächtige Stellen, von denen (auf Grund des Vorzeichens) jedoch nur b1 von Interesse ist und weiter untersucht wird. Aus (58) erhält man: M . b3 00 (b ) > 0, so dass an der Stelle Wegen b1 > 0 folgt sofort: KG 1 s 2 · 100 · kb · M b = b1 = kl · P 00 KG (b) = 2 · kb · (59) tatsächlich ein lokales Minimum der Funktion KG (b) vorliegt, d.h. bei der Bestellmenge b = b1 entstehen die geringsten Kosten. Die Formel (59) wird auch als A NDLERsche Formel bezeichnet. Ergänzende Hinweise zu diesem Beispiel: 1) Voraussetzungen für die Gültigkeit der A NDLERschen Formel: - Periodenbedarf bekannt und konstant Lagerabgang gleichmäßig keine Mengenrabatte, keine Teillieferungen alle Kosten im Planungszeitraum konstant 2) Wenn die Angabe von kl nicht in Prozent, sondern als Dezimalzahl vorliegt, dann entfällt der Faktor 100 unter der Quadratwurzel in der Formel (59). 3) Durch Untersuchung des Verhaltens der Funktion KG (b) für b → 0 und für b → ∞ stellt man fest, dass b = b1 nicht nur ein lokales, sondern auch ein globales Minimum der Funktion KG (b) liefert (vgl. dazu auch Bild 3.2b) im Abschnitt 3.2.1). Das bisher behandelte Kriterium liefert jedoch noch keine Aussage bzgl. des Vorhandenseins eines lokalen Extremums, wenn an einer Stelle x0 sowohl f 0 (x0 ) = 0 als auch f 00 (x0 ) = 0 gilt. Das folgende, allgemeinere Kriterium ermöglicht es, auch in einem solchen Fall eine Entscheidung zu treffen. Allgemeines Kriterium für das Vorliegen eines lokalen Extremums an der Stelle x0 Die Funktion f (x) sei in einer Umgebung von x0 n-mal stetig differenzierbar (n ≥ 2) und es gelte: f 0 (x0 ) = f 00 (x0 ) = . . . = f (n−1) (x0 ) = 0, aber f (n) (x0 ) 6= 0. Dann folgt: a) Wenn n gerade ist, so hat f an der Stelle x0 ein lokales Extremum, und zwar für f (n) (x0 ) > 0 ein lokales Minimum und für f (n) (x0 ) < 0 ein lokales Maximum. b) Wenn n ungerade ist, dann hat f an der Stelle x0 kein lokales Extremum, sondern f ist in einer Umgebung von x0 streng monoton: für f (n) (x0 ) > 0 streng monoton wachsend und für f (n) (x0 ) < 0 streng monoton fallend. Beispiel 4.12: 69 Bei der Untersuchung von Funktionskurven ist außerdem das Krümmungsverhalten von Interesse. Zunächst werden die Begriffe konkav“ und konvex“ erläutert. ” ” Die Kurve der Funktion f ist konvex (linksgekrümmt) auf (a, b) genau dann, wenn f 00 (x) ≥ 0 für alle x ∈ (a, b); anschaulich: jede Tangente t liegt unterhalb der Kurve (vgl. Bild 4.6a)). Die Kurve der Funktion f ist konkav (rechtsgekrümmt) auf (a, b), genau dann, wenn f 00 (x) ≤ 0 für alle x ∈ (a, b); anschaulich: jede Tangente t liegt oberhalb der Kurve (vgl. Bild 4.6b)). y y y 6 6 6 f (x) t t qW f (x0 ) f (x) x Bild 4.6a) x x x0 Bild 4.6b) Bild 4.6c) Solche Punkte, in denen sich das Krümmungsverhalten der Kurve ändert, werden als Wendepunkte bezeichnet (vgl. dazu Bild 4.6c)). Wendepunkte sind ebenfalls charakteristische Kurvenpunkte. Allgemeines Kriterium für das Vorliegen eines Wendepunktes an der Stelle x0 Die Funktion f (x) sei in einer Umgebung von x0 ∈ (a, b) dreimal stetig differenzierbar. Wenn f 00 (x0 ) = 0 und f 000 (x0 ) 6= 0 gilt, dann besitzt f an der Stelle x0 einen Wendepunkt. Beispiel 4.13: Bei der bisherigen Betrachtung von Wendepunkten einer Funktion wurde die erste Ableitung nicht untersucht. Gilt in einem Wendepunkt x0 zusätzlich f 0 (x0 ) = 0 (d.h. liegt ein Wendepunkt mit waagerechter Tangente vor), dann wird dieser Punkt als Sattelpunkt (oder Terrassenpunkt) bezeichnet. Beispiel 4.14: Die Funktion f (x) = x3 besitzt an der Stelle x0 = 0 einen Sattelpunkt, denn: f 0 (x0 ) = 3x20 = 0, f 00 (x0 ) = 6x0 = 0, f 000 (x0 ) = 6 6= 0 (siehe dazu auch Bild 4.4 im Beispiel 4.9). 4.2.3 Extremwertaufgaben In der Praxis gibt es zahlreiche Probleme, die auf sogenannte Extremwertaufgaben hinführen. Dabei ist von einer vorgegebenen Funktion (Zielfunktion) der größte oder kleinste Funktionswert in einem gewissen Intervall I zu bestimmen, d.h. es werden globale Maxima oder Minima gesucht. Anhand der im Bild 4.7 dargestellten Funktion wird deutlich, dass ein lokales Extremum nicht notwendigerweise auch ein globales Extremum ist. Wenn diese Funktion f (x) im Intervall [a, b] betrachtet wird, so hat sie an der Stelle x = c ein lokales Maximum. Da aber offensichtlich f (a) > f (c) gilt, befindet sich in x = c kein globales Maximum. y 6 f (x) a c Bild 4.7 70 b x Vorgehensweise bei der Lösung von Extremwertaufgaben 1) Berechnung lokaler Maxima bzw. lokaler Minima der Zielfunktion im Inneren des Intervalls I (mit der im Abschnitt 4.2.2 beschriebenen Methode) 2) Überprüfung, ob es sich um globale Maxima bzw. globale Minima handelt (z.B. durch Vergleich der Funktionswerte in diesen Punkten mit den Funktionswerten in den Randpunkten des Intervalls I oder durch Untersuchung des Krümmungsverhaltens der Funktionskurve) Beispiel 4.15:22 Aus einer rechtwinkligen Blechplatte mit den Seitenlängen 16 cm und 10 cm soll eine quaderförmige offene Wanne mit maximalem Volumen geformt werden (siehe dazu Bild 4.8). Zielfunktion: Volumen des Quaders mit Höhe x: 10 cm x V (x) = (16 − 2x)(10 − 2x)x = 4x3 − 52x2 + 160x, wobei 0 ≤ x ≤ 5, d.h. I = [0, 5]. x 16 cm Bild 4.8 Zur Lösung der Extremwertaufgabe sind nun die folgenden beiden Schritte auszuführen. 1) Berechnung der lokalen Maxima der Zielfunktion V (x): Die Bedingung V 0 (x) = 0 muss erfüllt sein, d.h. es sind die Lösungen der Gleichung V 0 (x) = 12x2 − 104x + 160 = 0 zu ermitteln.23 Man erhält die beiden Lösungen: x1 = 2 und x2 = 20 3 . Die Lösung x2 braucht nicht weiter betrachtet zu werden, da sie die Bedingung 0 ≤ x ≤ 5 (s. oben) nicht erfüllt. Somit ist noch V 00 (x1 ) = 0 zu überprüfen. Es gilt: V 00 (x) = 24x − 104 sowie V 00 (2) = 48 − 104 < 0 ⇒ An der Stelle x1 = 2 hat die Zielfunktion ein lokales Maximum mit V (2) = 4 · 23 − 52 · 22 + 160 · 2 = 144. 2) Vergleich des Funktionswertes V (2) mit den Funktionswerten in den Randpunkten des Intervalls I: V (0) = 4 · 03 − 52 · 02 + 160 · 0 = 0 V (5) = 4 · 53 − 52 · 52 + 160 · 5 = 0 ⇒ Im Intervall I = [0, 5] hat die Zielfunktion V (x) in dem Punkt (2, 144) ihr globales Maximum. Ergebnis: Das Volumen der Wanne wird maximal, wenn x = 2 cm gewählt wird. Es beträgt dann 144 cm3 . 4.2.4 Regel von Bernoulli-de l’Hospital Diese Regel dient zur Berechnung von Grenzwerten vom Typ limx→0 0 0 oder ∞ (unbestimmte Ausdrücke), wie z.B.: ∞ ex − 1 (sowohl der Zähler als auch der Nenner streben für x → 0 gegen 0, so dass die im Abschnitt 3.3.1 x behandelten Rechenregeln für Grenzwerte kein Ergebnis liefern). Grenzwertregel von Bernoulli-de l’Hospital Seien f (x) und g(x) in einer Umgebung von x0 differenzierbar und gelte limx→x0 f (x) = 0 sowie limx→x0 g(x) = 0 (bzw. limx→x0 f (x) = ∞ sowie limx→x0 g(x) = ∞ ). Dann gilt: lim x→x0 f (x) f 0 (x) = lim 0 . g(x) x→x0 g (x) (60) Diese Aussage ist auch für x → ±∞ sowie für einseitige Grenzwerte gültig. 22 23 Quelle: K. M EYBERG , P. VACHENAUER, Höhere Mathematik 1, 5. Auflage, S. 122 In diesen Rechenschritten wird die Maßeinheit zunächst weggelassen. 71 Beispiel 4.16: In einigen Fällen führt erst eine mehrmalige Anwendung der Regel von Bernoulli-de l’Hospital zum Ziel. Beispiel 4.17: Es soll der Grenzwert limx→∞ x2 ∞ (unbestimmter Ausdruck vom Typ ) berechnet werden. ex ∞ Eine einmalige Anwendung von (60) ergibt zunächst: x2 2x = lim x . x→∞ ex x→∞ e lim Der Term innerhalb des Grenzwertes auf der rechten Seite dieser Gleichung ist wiederum ein unbestimmter ∞ Ausdruck vom Typ . Daher erfolgt eine nochmalige Anwendung von (60), welche jetzt zum Resultat führt: ∞ lim x→∞ 2x 2 = lim x = 0 . x→∞ e ex Für weitere unbestimmte Ausdrücke, wie z.B.: 0·(±∞) oder ∞−∞, kann die Regel von Bernoulli-de l’Hospital nach Durchführung zusätzlicher Umformungen verwendet werden (d.h. der Ausdruck innerhalb des Grenzwertes wird in einen Quotienten umgewandelt, so dass schließlich (60) anwendbar ist). Beispiel 4.18: 4.2.5 Kurvendiskussion Ziel der Kurvendiskussion ist die Untersuchung und Feststellung der Funktionseigenschaften sowie des Funktionsverlaufes mit den Hilfsmitteln der Differentialrechnung. Arbeitsschritte bei der Kurvendiskussion a) b) c) d) e) f) g) h) Definitionsbereich D der Funktion bestimmen Untersuchung des Symmetrieverhaltens Verhalten im Unendlichen Definitionslücken untersuchen (behebbar oder nicht?) Achsenschnittpunkte bestimmen 1.-3. Ableitung ausrechnen charakteristische Kurvenpunkte bestimmen Skizze anfertigen 72 Beispiel 4.19: Für die Funktion f (x) = −5x2 + 5 ist eine Kurvendiskussion durchzuführen, d.h. die soeben genannten Arbeitsx3 schritte werden auf diese Funktion angewendet. a) Definitionsbereich D bestimmen f (x) ist definiert für x ∈ R mit x 6= 0 (da einzige Nullstelle des Nenners bei x = 0), d.h. D = R \ {0} b) Untersuchung des Symmetrieverhaltens Um eventuelle Symmetrien der Funktion festzustellen, wird die Relation zwischen f (x) und f (−x) untersucht. Es gilt für x 6= 0: f (−x) = −5(−x)2 + 5 −5x2 + 5 = = −f (x) ⇒ ungerade Funktion (vgl. Definition 3.10). (−x)3 −x3 c) Verhalten im Unendlichen Mit Hilfe der Grenzwertregel von Bernoulli-de l’Hospital (siehe (60)) erhält man: −10x 10 −5x2 + 5 1 10 = lim = − · lim = − · 0 = 0. 3 2 x→±∞ 3x x→±∞ x 3 x→±∞ x 3 lim f (x) = lim x→±∞ d) Definitionslücken untersuchen Die einzige Definitionslücke ist bei x = 0 (vgl. a)). Dort gilt: lim f (x) = x→0+0 limx→0+0 (−5x2 + 5) = ∞ sowie limx→0+0 x3 lim f (x) = x→0−0 limx→0−0 (−5x2 + 5) = −∞ . limx→0−0 x3 Somit hat die Funktion f (x) an der Stelle x = 0 keinen Grenzwert. Folglich ist die Definitionslücke nicht behebbar (vgl. dazu auch Abschnitt 3.3.3). e) Achsenschnittpunkte bestimmen Die Schnittpunkte mit der x-Achse sind die Nullstellen der Funktion (da y = 0 gelten muss). Man erhält die Nullstellen von f (x) in diesem Fall als Nullstellen des Zählerpolynoms: x1 = 1 und x2 = −1. Ein Schnittpunkt mit der y-Achse existiert für diese Funktion nicht, da sie für x = 0 nicht definiert ist. f) 1.-3. Ableitung ausrechnen Die Berechnung der Ableitungen erfolgt mittels Quotientenregel, wobei die entstehenden Ausdrücke möglichst vereinfacht werden sollten. Man erhält: f 0 (x) = −10x · x3 − 3x2 (−5x2 + 5) 5x4 − 15x2 5x2 − 15 = = (x3 )2 x6 x4 f 00 (x) = 10x · x4 − 4x3 (5x2 − 15) −10x5 + 60x3 −10x2 + 60 = = (x4 )2 x8 x5 f 000 (x) = −20x · x5 − 5x4 (−10x2 + 60) 30x6 − 300x4 30x2 − 300 = = . (x5 )2 x10 x6 g) Bestimmung charakteristischer Kurvenpunkte Zunächst werden lokale Extrema der Funktion f (x) gesucht. Die Bedingung f 0 (x) = 0 ist wegen √ √ 5x2 − 15 f 0 (x) = erfüllt, wenn 5x2 − 15 = 0 gilt. Das trifft für x3 = 3 und x4 = − 3 zu, so dass diese 4 x beiden Stellen extremwertverdächtig sind. Mit Hilfe von f 00 (x) wird überprüft, ob tatsächlich lokale Extrema vorliegen: √ √ −10x23 + 60 −10( 3)2 + 60 00 √ f (x3 ) = = > 0 ⇒ lok. Minimum an d. Stelle x3 = 3 ≈ 1.7321 5 x3 ( 3)5 √ √ −10x24 + 60 −10(− 3)2 + 60 00 √ f (x4 ) = = < 0 ⇒ lok. Maximum an d. Stelle x4 = − 3 ≈ −1.7321 , 5 x4 (− 3)5 73 und die zugehörigen Funktionswerte sind: f (x3 ) = √ √ −5(− 3)2 + 5 −5( 3)2 + 5 √ √ ≈ −1.9245 sowie f (x ) = ≈ 1.9245. 4 ( 3)3 (− 3)3 Nun werden Wendepunkte der Funktion f (x) gesucht. Die Bedingung f 00 (x) = 0 ist wegen √ √ −10x2 + 60 erfüllt, wenn −10x2 + 60 = 0 gilt. Das trifft für x5 = 6 und x6 = − 6 zu. f 00 (x) = 5 x Mit Hilfe von f 000 (x) wird überprüft, ob tatsächlich Wendepunkte vorliegen: √ √ 30( 6)2 − 300 30x25 − 300 √ = f (x5 ) = 6 0 ⇒ Wendepunkt an d. Stelle x5 = 6 ≈ 2.4495 = 6 x5 ( 6)6 √ √ 30x26 − 300 30(− 6)2 − 300 √ f 000 (x6 ) = = 6 0 ⇒ Wendepunkt an d. Stelle x6 = − 6 ≈ −2.4495 , = 6 x5 (− 6)6 000 und die zugehörigen Funktionswerte sind: √ √ −5( 6)2 + 5 −5(− 6)2 + 5 √ √ f (x5 ) = ≈ −1.701 sowie f (x6 ) = ≈ 1.701. ( 6)3 (− 6)3 h) Skizze: Um eine Skizze der Funktion anzufertigen, werden die Resultate aus a) - g) genutzt und weitere Kurvenpunkte mit Hilfe einer Wertetabelle berechnet. Bild 4.9 zeigt den Verlauf der Funktion f (x). y 6 f (x) Max. Wendep. r r −1 r 1 1 r −1 r r Wendep. x Min. Bild 4.9 Bemerkungen: - Bei der Untersuchung des Verhaltens der Funktion im Unendlichen (siehe c)) wurden die Fälle x → ∞ und x → −∞ nicht getrennt dargestellt, da die jeweiligen Grenzwerte gleich sind. Im allgemeinen kann jedoch nicht davon ausgegangen werden, dass das Verhalten einer Funktion für x → ∞ und für x → −∞ gleich ist. - Bei der betrachteten Funktion f (x) stellt sich heraus, dass die Koordinaten der lokalen Extrempunkte (und auch die der Wendepunkte) zueinander entgegengesetzte Zahlen sind. Dies lässt sich dadurch erklären, dass die Funktion ungerade ist. 74 4.2.6 Taylor-Polynome Da Polynome besonders einfache und überschaubare Eigenschaften haben, besteht in praktischen Anwendungen häufig der Wunsch, eine gegebene Funktion möglichst gut“ durch Polynome zu approximieren (d.h. anzu” nähern). Eine solche Möglichkeit der Approximation bieten die Taylor-Polynome. Definition 4.3: Ist die Funktion f (x) an der Stelle x0 mindestens n-mal differenzierbar, dann heißt n X f (k) (x0 ) f 0 (x0 ) f (n) (x0 ) Tn (x) = f (x0 ) + (x − x0 )1 + . . . + (x − x0 )n = (x − x0 )k 1! n! k! (61) k=0 Taylor-Polynom n-ten Grades (oder: n-tes Taylor-Polynom) von f an der Stelle x0 . Beispiel 4.20: Berechnung des Taylor-Polynoms 2. Grades für die Funktion f (x) = ex an der Stelle x0 = 0 Das Bild 4.10a) zeigt die Funktion f (x) = ex sowie ihr Taylor-Polynom 1. Grades an der Stelle x0 = 0 im Intervall [−1, 1]. Das Taylor-Polynom 1. Grades wird auch als Linearisierung“ oder 1. Näherung“ der ” ” Funktion f (x) bezeichnet. An der Stelle x0 = 0 haben T1 (x) und f (x) sowohl den gleichen Funktionswert als auch den gleichen Anstieg. Im Bild 4.10b) sind die Funktion f (x) = ex sowie ihr Taylor-Polynom 2. Grades an der Stelle x0 = 0 im Intervall [−1, 1] dargestellt. Das Taylor-Polynom 2. Grades wird auch 2. Näherung“ der Funktion f (x) genannt. ” An der Stelle x0 = 0 haben T2 (x) und f (x) den gleichen Funktionswert, den gleichen Anstieg und die gleiche Krümmung. Es ist zu erkennen, dass f (x) in der Umgebung der Stelle x0 = 0 sehr gut durch das TaylorPolynom T2 (x) approximiert wird. Bild 4.10a) Bild 4.10b) 75 Beispiel 4.21: Berechnung des Taylor-Polynoms 4. Grades für die Funktion f (x) = ln x an der Stelle x0 = 1 Beispiel 4.22: Beim Stauchen, einem speziellen Umformverfahren, liegt die Werkstücklängsachse in Richtung der Umformkraft. Im weiteren wird der Fall eines zur z-Achse axialsymmetrischen Werkstücks betrachtet. Der Verlauf der Spannung24 in Kraftrichtung (z-Richtung) kann nach der folgenden Formel berechnet werden25 : z 6 2µ d −r . σz = −kf · exp h0 h 2 Dabei gelten die folgenden Bezeichnungen: kf - Fließspannung µ - Reibungszahl h - Höhe d - Durchmesser r - Abstand von der z-Achse (siehe dazu auch Bild 4.11). 6 h ? r d0 d Bild 4.11 h0 : Ausgangshöhe, d0 : Ausgangsdurchmesser Häufig wird die Exponentialfunktion in der Formel für σz durch die Funktion 1 + 2µ h d −r 2 ersetzt, so dass die folgende Näherungsformel entsteht: 2µ d σz ≈ −kf · 1 + −r . h 2 Die Möglichkeit dieser Ersetzung lässt sich folgendermaßen begründen. Wenn zunächst gesetzt wird: a = 2µ , h x= d 2 2µ d − r, dann kann die Funktion exp −r in der Form h 2 eax exp(ax) = geschrieben werden (a: reelle Konstante). Für die Funktion f (x) = eax gilt: f 0 (x) = aeax und speziell mit x0 = 0: f (x0 ) = eax0 = ea·0 = 1, f 0 (x0 ) = aeax0 = aea·0 = a. Das Taylor-Polynom 1. Grades für f (x) an der Stelle x0 = 0 lautet dann gemäß Formel (61): a 2µ d (x − 0)1 = 1 + ax. Wenn nun a wieder durch und x durch − r ersetzt wird 1! h 2 2µ d 2µ d 1+ − r als (lineares) Näherungspolynom für die Funktion exp −r . h 2 h 2 T1 (x) = 1 + erhält man (siehe oben), Nach Multiplikation mit dem Faktor −kf entsteht schließlich die genannte Näherungsformel für σz . 24 25 Kraft pro Flächeneinheit, die in einer gedachten Schnittfläche auf den Körper wirkt Quelle: H. H OFFMANN , R. N EUGEBAUER , G. S PUR . Handbuch Umformen, Carl Hanser Verlag, 2012 76 Wie aus den Bildern 4.10a) und 4.10b) ersichtlich ist, entsteht eine Abweichung (ein Fehler“), wenn eine Funk” tion f (x) durch ihr Taylor-Polynom n-ten Grades ersetzt wird. Die Größe dieses Fehlers kann formelmäßig beschrieben werden. Taylorsche Formel an der Stelle x0 (Taylorscher Satz) Es gilt: f (x) = Tn (x) + Rn (x) , (62) wobei Tn (x) das n-te Taylor-Polynom von f an der Stelle x0 bezeichnet (siehe auch (61)). Der Term Rn (x) wird Restglied genannt. Das Restglied entspricht dem Fehler, welcher entsteht, wenn f (x) durch das Taylor-Polynom Tn (x) ersetzt wird. Das Restglied Rn (x) ist i.allg. nicht exakt bestimmbar. Es existieren jedoch Darstellungen für das Restglied. Dadurch sind zumindest Abschätzungen des Restgliedes möglich, d.h. es kann eingeschätzt werden, wie gut die Approximation der Funktion durch ein Taylor-Polynom Tn (x) ist. Darstellung des Restgliedes nach Lagrange: Rn (x) = f (n+1) (ξ) (x − x0 )n+1 mit ξ zwischen x0 und x (n + 1)! (63) Voraussetzung für diese Darstellung ist, dass die Funktion (n + 1)-mal differenzierbar ist auf einem Intervall [a, b] mit x, x0 ∈ [a, b]. Beispiel 4.23: 4.2.7 Das Newton-Verfahren zur näherungsweisen Lösung von Gleichungen Eine in den Anwendungen häufig vorkommende Aufgabe ist die Bestimmung der Lösungen der Gleichung f (x) = 0 (d.h. der Nullstellen der Funktion f (x)). Nur in wenigen Fällen ist die direkte Auflösung dieser Gleichung nach der Variablen x möglich. In allen anderen Fällen versucht man, mittels numerischer Verfahren die Gleichung zumindest näherungsweise zu lösen. Vorgehensweise bei der näherungsweisen Lösung der Gleichung f (x) = 0 1) Es wird ein Startwert x0 vorgegeben. 2) Mittels einer Rechenvorschrift (Iterationsvorschrift) wird aus x0 ein Wert x1 berechnet. Dann erfolgt eine fortgesetzte Anwendung dieser Rechenvorschrift, so dass schließlich eine Folge {xn } von Iterationswerten entsteht. Es gibt unterschiedliche Möglichkeiten zur Wahl der Iterationsvorschrift. Diese führen zu verschiedenen Lösungsverfahren. Ein sehr häufig angewendetes Verfahren zur näherungsweisen Lösung von Gleichungen ist das Newton-Verfahren. 77 Die Iterationsvorschrift für das Newton-Verfahren Bei gegebenem Startwert x0 werden die Iterationswerte für die Lösung der Gleichung f (x) = 0 nach der folgenden Vorschrift berechnet: xn+1 = xn − f (xn ) f 0 (xn ) für n = 0, 1, 2, . . . . (64) Der Abbruch des Verfahrens erfolgt bei n = n0 , wenn |xn0 − xn0 −1 | < ε oder |f (xn0 )| < ε gilt (ε : kleine positive Zahl). Begründung für das Newton-Verfahren: Bei der Berechnung einer Folge {xn } von Iterationswerten für die Lösung der Gleichung f (x) = 0 wird xn+1 als x-Koordinate des Schnittpunktes von tn mit der x-Achse bestimmt. Dabei bezeichnet tn die durch den Punkt (xn , f (xn )) verlaufende Kurventangente. (Aus diesem Grund wird das Verfahren auch Tangenten” verfahren von Newton“ genannt). Bei der Berechnung der Tangente tn im Punkt (xn , f (xn )) kann die PunktRichtungs-Gleichung der Geraden genutzt werden, da der Anstieg dieser Tangente gleich f 0 (xn ) ist. Man erhält: y − f (xn ) = f 0 (xn ) ⇒ y = f 0 (xn )(x − xn ) + f (xn ) . x − xn In dieser Gleichung wird x so bestimmt, dass y = 0 gilt (da der Schnittpunkt der Tangente mit der x-Achse gesucht ist). Dadurch ergibt sich: 0 = f 0 (xn )(xn+1 − xn ) + f (xn ) , und durch Umstellen dieser Gleichung nach xn+1 entsteht die Iterationsvorschrift (64) für das Newton-Verfahren. In den Bildern 4.12a), b) ist das Newton-Verfahren für eine konkrete Situation veranschaulicht. Ausgehend von dem Startwert x0 = 2 entsteht x1 als x-Koordinate des Schnittpunktes der durch den Punkt (x0 , f (x0 )) verlaufenden Kurventangente t0 mit der x-Achse, siehe Bild 4.12a). Der nächste Schritt des Newton-Verfahrens wird im Bild 4.12b) dargestellt: x2 ist x-Koordinate des Schnittpunktes der durch den Punkt (x1 , f (x1 )) verlaufenden Kurventangente t1 mit der x-Achse. Es ist zu erkennen, dass x2 bereits näher an der exakten Nullstelle liegt als x1 . y y x x Bild 4.12a) Bild 4.12b) Beispiel 4.24: 78 Für die praktische Anwendung des Newton-Verfahrens werden Aussagen zur Konvergenz benötigt. Eine hinreichende Konvergenzbedingung für das Newton-Verfahren Die Folge der Iterationswerte x0 , x1 , x2 , . . . konvergiert gegen die exakte Lösung der Gleichung f (x) = 0, wenn gilt: f (x) · f 00 (x) (65) [f 0 (x)]2 < 1 für alle x ∈ [a, b] (Intervall, in dem sämtliche Iterationswerte liegen). Wichtig für eine erfolgreiche Anwendung des Newton-Verfahrens ist zudem die Wahl eines geeigneten Startwertes. Zur Wahl des Startwertes für das Newton-Verfahren Um einen geeigneten Startwert zu gewinnen, sind folgende Vorgehensweisen möglich: - Anfertigung einer Grobskizze der Funktion y = f (x) (diese vermittelt Aussagen zur ungefähren Lage der Nullstelle(n)) - rechnerische Bestimmung eines Intervalls [c, d] mit f (c) · f (d) < 0 (d.h.: Vorzeichenwechsel der Funktion f (x)), dann x0 ∈ (c, d) wählen - bei der Lösung von praktischen Problemen: aus dem Sachverhalt heraus kann man ggf. eine Vorstellung über die ungefähre Lage der Nullstelle(n) gewinnen Als Startwerte ungeeignet sind solche Werte x, für die die Bedingung (65) nicht erfüllt ist oder in deren unmittelbarer Umgebung f 0 (x) betragsmäßig sehr klein ist (in einem solchen Fall verläuft die Kurventangente fast parallel zur x-Achse ⇒ Schnittpunkt von Tangente und x-Achse liegt i.allg. weit entfernt vom Startwert). In dem folgenden Beispiel führt ein ungünstig gewählter Startwert dazu, dass das Newton-Verfahren nicht konvergiert. Beispiel 4.25: Bemerkung: Falls die Gleichung f (x) = 0 mehrere Lösungen besitzt, muss zu jeder (gesuchten) Lösung ein geeigneter Startwert bestimmt und dann das Newton-Verfahren für die einzelnen Startwerte getrennt angewendet werden. 79 5 Integralrechnung für Funktionen einer reellen Variablen Während bei der Differentialrechnung die Ableitungsfunktion einer gegebenen Funktion ermittelt wird, sucht die Integralrechnung nach einer Funktion, deren Ableitung mit einer gegebenen Funktion übereinstimmt. 5.1 5.1.1 Integralbegriff und Integrierbarkeit Unbestimmtes Integral, Grundintegrale Definition 5.1: Die Funktion y = f (x) sei auf einem Intervall [a, b] definiert. Eine auf diesem Intervall differenzierbare Funktion F (x) heißt Stammfunktion von f (x), wenn gilt: F 0 (x) = f (x) . Zwei Stammfunktionen F1 (x), F2 (x) einer Funktion f (x) unterscheiden sich lediglich durch eine additive Konstante (vgl. dazu Definition 5.1 und die Differentiationsregeln im Abschnitt 4.1.1). Diese Aussage führt zu dem Begriff des unbestimmten Integrals. Definition 5.2: Das unbestimmte Integral einer Funktion f (x) ist die Gesamtheit aller Stammfunktionen F (x) + C (F (x): spezielle Stammfunktion, C: beliebige reelle Zahl, die sog. Integrationskonstante). Z Schreibweise für das unbestimmte Integral: f (x) dx = F (x) + C Beispiel 5.1: Z Z xn dx = 1 n+1 Einige unbestimmte Integrale (Grundintegrale) (C, C1 , C2 ∈ R: Integrationskonstanten) Z 1 n+1 x + C (n ∈ N) xa+1 + C (a 6= −1, x > 0) xa dx = a+1 1 dx = ln |x| + C x Z Z 1 dx = tan x + C cos2 x Z √ (a > 0, a 6= 1) 1 dx = 1 − x2 cos x dx = sin x + C Z 1 dx = − cot x + C sin2 x Z 1 dx = 1 + x2 arcsin x + C1 = − arccos x + C2 Z arctan x + C1 = − arccot x + C2 Z sinh(x) dx = cosh(x) + C Z 1 x a +C ln a Z sin x dx = − cos x + C Z ax dx = 1 dx = tanh(x) + C cosh2 (x) cosh(x) dx = sinh(x) + C Z 1 dx = −coth(x) + C sinh2 (x) 80 5.1.2 Bestimmtes Integral und Eigenschaften integrierbarer Funktionen Das bestimmte Integral wird als Flächeninhalt A unter der Kurve einer Funktion f (x) in einem vorgegebenen Intervall [a, b] definiert. Dabei wird zunächst angenommen, dass die Funktion in diesem Intervall monoton wachsend ist und sämtliche Funktionswerte positiv sind, d.h. die betrachtete Fläche wird durch die Geraden x = a und x = b, die x-Achse und die Kurve y = f (x) begrenzt, siehe Bild 5.1. Diese Fläche ist i.allg. nach oben krummlinig berandet, so dass der gesuchte Flächeninhalt nicht mit elementargeometrischen Mitteln bestimmt werden kann. Er wird als Grenzwert einer Folge von Näherungssummen ermittelt. Diese Vorgehensweise wird im folgenden genauer beschrieben26 . - Das Intervall [a, b] wird in n Teilintervalle [xk−1 , xk ] (k = 1, 2, . . . , n, wobei x0 = a und xn = b) zerlegt. Damit wird eine Unterteilung des Flächenstücks in n Streifen mit den Breiten ∆x1 , ∆x2 , . . . , ∆xn (∆xk = xk − xk−1 ) vorgenommen. - Diese Streifen werden durch Rechtecke ersetzt, deren Höhe gleich dem kleinsten bzw. größten Funktionswert in dem entsprechenden Teilintervall ist (siehe Bild 5.1). - Die Flächeninhalte der Rechtecke werden summiert: Un = n X f (xk−1 )∆xk , k=1 On = n X f (xk )∆xk k=1 Auf Grund der Voraussetzung, dass f (x) eine im Intervall [a, b] monoton wachsende Funktion ist, folgt sofort: Un ≤ A sowie On ≥ A. Daher wird Un auch als Untersumme und On als Obersumme bezeichnet. - Es erfolgt ein Grenzübergang n → ∞, wobei die Breite sämtlicher Streifen gegen Null gehen soll (d.h. die Unterteilung der Fläche wird immer feiner). - Wenn bei diesem Grenzübergang die Unter- und Obersumme gegen einen gemeinsamen Grenzwert streben, so wird dieser als das bestimmte Integral der Funktion f (x) in den Grenzen von a bis b bezeichnet. Schreibweise: Zb n X lim f (xk )∆xk = f (x) dx n→∞ k=1 a y 6 f (x) - a Bild 5.1 c b x Bild 5.2 Es soll nun die Frage untersucht werden, unter welchen Bedingungen das bestimmte Integral (d.h. der betrachtete Grenzwert) existiert. Eine notwendige Bedingung für die Integrierbarkeit einer Funktion f (x) im Intervall [a, b] ist die Beschränktheit dieser Funktion (da anderenfalls die betrachteten Summen nicht beschränkt wären und damit kein Grenzwert existieren würde). Eine hinreichende Bedingung für die Existenz des bestimmten Integrals der Funktion f (x) über [a, b] ist die Stetigkeit oder zumindest die stückweise Stetigkeit27 von f (x) auf [a, b]. So kann z.B. für die im Bild 5.2 dargestellte, stückweise stetige Funktion das bestimmte Integral über [a, b] berechnet werden, und zwar unter der Voraussetzung, dass bei jeder der oben beschriebenen Unterteilungen in x = c ein Anfangs- bzw. Endpunkt eines Teilintervalls liegt (siehe dazu auch: Eigenschaften integrierbarer Funktionen“, Punkt 4)). ” 26 Quelle: L. PAPULA . Mathematik für Ingenieure und Naturwissenschaftler (Band 1), 12. Auflage, S. 429-433 Das bedeutet, dass in dem betrachteten Intervall nur endlich viele Stellen existieren, an denen die Funktion unstetig ist. Die Eigenschaft der stückweisen Stetigkeit schließt die Beschränktheit mit ein. 27 81 Bei der praktischen Berechnung eines bestimmten Integrals wird man jedoch nicht die genannte Grenzwertbildung nutzen, sondern auf den folgenden Satz zurückgreifen. Hauptsatz der Differential- und Integralrechnung Ist f (x) auf [a, b] stetig und F (x) eine beliebige Stammfunktion von f (x), dann gilt: Zb f (x) dx = F (b) − F (a) . (66) a Somit ist bei der Berechnung des bestimmten Integrals zunächst eine Stammfunktion des Integranden f (x) zu suchen und dann das Einsetzen der Integrationsgrenzen gemäß der Formel (66) vorzunehmen. Beispiel 5.2: Eigenschaften integrierbarer Funktionen 1) Änderung der Integrationsvariablen: Zb Zb f (x) dx = f (t) dt a a 2) Vertauschung der Integrationsgrenzen: Zb Za f (x) dx = − f (x) dx a b 3) Zusammenfallen der Integrationsgrenzen: Za f (x) dx = 0 a 4) Zerlegung des Integrationsintervalls in Teilintervalle: Zb Zc f (x) dx = a Zb f (x) dx + a f (x) dx (a < c < b) c 5) Linearkombination mehrerer Funktionen: Zb Zb Zb (c1 f1 (x) + c2 f2 (x)) dx = c1 f1 (x) dx + c2 f2 (x) dx a a (c1 , c2 : reelle Konstante) a Diese Regel ist erweiterbar auf eine beliebige endliche Anzahl von Funktionen f1 , f2 , . . . , fn . 6) Majorisierung eines bestimmten Integrals: Zb f1 (x) dx ≤ a Zb f2 (x) dx , falls f1 (x) ≤ f2 (x) für alle x ∈ [a, b] a Beispiel 5.3: Beispiel 5.4: 82 5.2 Integrationsverfahren Beim Aufsuchen der Stammfunktion zu einer gegebenen Funktion f (x) führt die Anwendung der Grundintegrale und der elementaren Integrationsregeln nicht immer zum Ziel. Aus diesem Grund werden in den Abschnitten 5.2.1 bis 5.2.3 einige Integrationsverfahren vorgestellt, die als Hilfsmittel zum Auffinden von Stammfunktionen verwendet werden können. 5.2.1 Integration durch Substitution Als erstes Integrationsverfahren wird die Integration durch Substitution vorgestellt. Das Prinzip dieses Integrationsverfahrens besteht darin, einen Ausdruck mit der Variablen x auf geeignete Weise durch eine neue Variable zu ersetzen, um dadurch ein einfacher zu lösendes Integral (evtl. sogar ein Grundintegral) zu erhalten. Das nachfolgende Beispiel soll dieses Prinzip verdeutlichen (zunächst anhand eines unbestimmten Integrals). Z √ Beispiel 5.5: Zu berechnen ist das Integral 2x + 1 dx. In diesem Fall bietet sich die Substitution u = 2x + 1 an. Grundsätzlich ist bei der Anwendung von Substitutionen zu beachten, dass auch das alte“ Differential dx durch die neue“ Variable u und deren Differential du ” ” ausgedrückt werden muss. Im vorliegenden Fall ist die folgende Rechnung auszuführen: du du =2 ⇒ = dx dx 2 (d.h. Differentiation von u nach x gemäß der Ableitungsregeln und anschließendes Umstellen nach dx). Durch Einsetzen in das zu berechnende Integral ergibt sich schließlich: Z Z Z √ √ du 1 1 2 2x + 1 dx = u· = u1/2 du = · u3/2 + C , 2 2 2 3 u = 2x + 1 ⇒ und nachdem die Substitution rückgängig gemacht wurde: Z √ 1 2x + 1 dx = (2x + 1)3/2 + C . 3 Die allgemeine Vorgehensweise bei der Integration durch Substitution lässt sich wie folgt beschreiben. Vorgehensweise bei der Berechnung eines Integrals mittels einer geeigneten Substitution 1) Aufstellung der Substitutionsgleichungen u = g(x) , du du = g 0 (x) , dx = 0 dx g (x) 2) Durchführung der IntegralsubstitutionZ durch Einsetzen der Substitutionsgleichungen in das vorgegebene (unbestimmte) Integral Z f (x) dx : Z f (x) dx = ϕ(u) du . Das neue Integral enthält nur noch die neue Variable u und deren Differential du. Der neue Integrand ist die Funktion ϕ(u). 3) Integration (nach u): Z ϕ(u) du = Φ(u) + C wobei Φ(u) eine Stammfunktion von ϕ(u) ist, d.h. Φ0 (u) = ϕ(u) 4) Rücksubstitution: Z f (x) dx = Φ(u) + C = Φ(g(x)) + C = F (x) + C Ergänzung zu Beispiel 5.5: In diesem Beispiel war: g(x) = 2x + 1, ϕ(u) = 1√ 2 u, Φ(u) = 83 1 3 u3/2 , F (x) = 13 (2x + 1)3/2 . Besonders vorteilhaft ist die Anwendung des Substitutionsverfahrens bei Integranden von folgender Form: f (g(x))·g 0 (x) (d.h. der Integrand ist eine verkettete Funktion, multipliziert mit ihrer inneren Ableitung) oder f (x) · f 0 (x) (d.h. der Integrand ist das Produkt aus einer Funktion und ihrer Ableitung). In dem nachfolgenden Beispiel wird dies deutlich. Beispiel 5.6: Im folgenden sind einige häufig verwendete Substitutionen zusammengestellt.28 Einige Standard-Substitutionen bei der Berechnung von Integralen Mit R(a, b, . . .) wird ein rationaler Ausdruck in a, b bezeichnet. Integraltyp Substitution f (ax + b) dx u = ax + b f (x) · f 0 (x) dx u = f (x) Z Z Z Z Integraltyp Substitution R(sinh x, cosh x) dx u = ex √ n R x, ax + b dx u= p 2 2 R x, a + x dx x = a · sinh u p R x, x2 − a2 dx x = a · cosh u p 2 2 R x, a − x dx x = a · sin u Z Z f 0 (x) dx f (x) u = f (x) f (g(x)) · g 0 (x) dx u = g(x) Z Z Z R(sin x, cos x) dx u = tan x Z 2 √ n ax + b In der vorangegangenen Tabelle sind auch Substitutionen vom Typ x = h(u) aufgeführt. In diesen Fällen lauten die Substitutionsgleichungen: x = h(u) , dx = h0 (u) , dx = h0 (u)du. du Die weitere Vorgehensweise ist völlig analog zu dem Fall, dass eine Substitution der Form u = g(x) vorgenommen wurde (siehe vorige Seite). Beispiel 5.7: 28 Weitere Substitutionen sind zu finden in: H.J. BARTSCH, Taschenbuch Mathematischer Formeln für Ingenieure und Naturwissenschaftler, 23. Auflage (2014), S. 476-478. 84 Schließlich wird noch die Berechnung bestimmter Integrale mittels Substitution anhand eines Beispiels erläutert. Beispiel 5.8: Z2 Zu berechnen ist das bestimmte Integral e4−3x dx. 0 Zwei prinzipielle Vorgehensweisen sind möglich: 1) Stammfunktion mittels Substitution ermitteln (d.h. unbestimmte Integration), erst anschließend die Grenzen einsetzen 2) Bestimmte Integration mit substituierten Grenzen zu 1): Mittels Substitution u = 4 − 3x erhält man für das zugehörige unbestimmte Integral: Z Z du du 1 1 = −3 ⇒ dx = − ⇒ e4−3x dx = − eu du = − eu + C dx 3 3 3 Nach Rücksubstitution (in diesem Fall unbedingt erforderlich!) und Einsetzen der Grenzen für die Integrationsvariable x erhält man: Z2 e 4−3x 1 dx = − e4−3x 3 0 2 0 1 = (e4 − e−2 ) ≈ 18.1543 . 3 zu 2): Substitution der Integrationsvariablen wie bei 1), zusätzlich Substitution der Integrationsgrenzen: x1 = 0 wird durch u1 = 4 − 3x1 = 4 und x2 = 2 wird durch u2 = 4 − 3x2 = −2 ersetzt. Dann gilt: Z2 e 4−3x 1 dx = − 3 0 Z−2 1 eu du = (e4 − e−2 ) ≈ 18.1543 . 3 4 5.2.2 Partielle Integration ( Produktintegration“) ” Zur Herleitung der Formel für dieses Integrationsverfahren geht man von der Produktregel für die Differentiation einer Funktion aus (siehe dazu auch Abschnitt 4.1.1): d (u(x) · v(x)) = u0 (x) · v(x) + u(x) · v 0 (x) dx Nach Subtraktion des Terms u0 (x) · v(x) auf beiden Seiten dieser Gleichung und anschließender Integration beider Seiten der Gleichung nach x erhält man: Z Z Z d (u(x) · v(x)) dx − u0 (x) · v(x) dx = u(x) · v 0 (x) dx , dx und nach Auflösung des ersten Integrals auf der linken Seite ergibt sich schließlich die Formel für die partielle Integration. Formel für die partielle Integration: Z Z u(x) · v 0 (x) dx = u(x) · v(x) − u0 (x) · v(x) dx (67) Zur Durchführung der partiellen Integration ist es erforderlich, dass die zu integrierende Funktion als Produkt u(x) · v 0 (x) dargestellt wird. Dabei ist v 0 (x) die Ableitung einer (zunächst noch unbekannten) Funktion v(x). Da die partielle Integration das Auffinden einer Stammfunktion zu einer gegebenen Funktion erleichtern soll, sind folgende Voraussetzungen bei der Anwendung dieses Integrationsverfahrens zu beachten: (I) Zu v 0 (x) kann problemlos die Stammfunktion v(x) gefunden werden. Z (II) Das Integral u0 (x)v(x) dx ist elementar lösbar (oder mit Hilfe anderer Integrationsverfahren, z.B. Substitution). 85 Eine geeignete Wahl der Faktorzerlegung u(x)v 0 (x) hat wesentlichen Einfluss auf das Erfülltsein dieser Voraussetzungen. Beispiel 5.9: In manchen Fällen muss die partielle Integration mehrfach nacheinander angewendet werden, wie das folgende Beispiel zeigt. Beispiel 5.10: Z Zu berechnen ist das Integral x2 · cos x dx . Mit u = x2 , v 0 = cos x ⇒ u0 = 2x, v = sin x ergibt sich nach Anwendung der Formel (67): Z Z Z x2 · cos x dx = x2 · sin x − 2x · sin x dx = x2 · sin x − 2 x · sin x dx . (68) Das auf der rechten Seite dieser Gleichung entstandene Integral ist jedoch noch kein Grundintegral. Z Eine nochmalige Anwendung der partiellen Integration, diesmal auf das Integral x · sin x dx, führt zum Ziel. Man wählt: u = x, v 0 = sin x ⇒ u0 Z= 1, v = − cos x und erhält: Z x · sin x dx = −x · cos x − (−1 · cos x) dx = −x · cos x + sin x + C1 . Zusammen mit (68) ergibt sich schließlich für das gesuchte Integral: Z x2 · cos x dx = x2 · sin x − 2 (−x · cos x + sin x + C1 ) = x2 · sin x + 2x · cos x − 2 sin x + C2 (mit C2 = −2C1 ; C1 , C2 ∈ R). Bemerkungen: Z Z n x · cos x dx , - Integrale der Form Z n x · sin x dx oder xn · ex dx können durch n-malige partielle Integration gelöst werden (analog zu Beispiel 5.10, wo der Fall n = 2 betrachtet wurde). - Die Formel der partiellen Integration gilt sinngemäß auch für bestimmte Integrale. Sie lautet dann: Zb Zb f (x) dx = a Zb ib u(x) · v (x) dx = u(x) · v(x) − u0 (x) · v(x) dx . 0 h a a a Eine weitere Anwendung der partiellen Integration ist der sogenannte Rückwurf. Durch einmalige oder mehrmalige partielle Integration und geeignete Umformungen wird das gesuchte Integral so reproduziert, dass die gewonnene Beziehung nach diesem Integral aufgelöst werden kann. In dem folgenden Beispiel wird diese Methode genutzt. Beispiel 5.11: Z Das Integral sin2 x dx soll berechnet werden. Mit u = sin x, v 0 = sin x und u0 = cos x, v = − cos x ergibt sich nach Anwendung der Formel für die partielle Integration: Z Z Z 2 sin x dx = sin x · (− cos x) − cos x · (− cos x) dx = − sin x · cos x + cos2 x dx. (69) Eine nochmalige partielle Integration führt nicht zum Ziel, weil dadurch nur die triviale Identität Z sin2 x dx = Z sin2 x dx entstehen würde. Jedoch kann die trigonometrische Beziehung sin2 x + cos2 x = 1 genutzt werden, um die Beziehung (69) wie folgt umzuformen: Z Z Z 2 2 sin x dx = − sin x · cos x + (1 − sin x) dx = − sin x · cos x + x + C1 − sin2 x dx . Auf der rechten Seite dieser Gleichung hat sich das gesuchte Integral zwar reproduziert, aber mit dem Vorfaktor −1. Daher kann diese Gleichung nach dem gesuchten Integral aufgelöst werden: Z Z x 1 2 2 sin x dx = − sin x · cos x + x + C1 ⇒ sin2 x dx = − sin x · cos x + + C2 2 2 (mit C2 = 12 C1 ; C1 , C2 ∈ R). 86 5.2.3 Integration durch Partialbruchzerlegung Die bisher betrachteten Integrationsverfahren führen bei der Integration gebrochenrationaler Funktionen (siehe Abschnitt 3.2.3, Punkt 2)) nur in speziellen Fällen zum Ziel. Wenn es sich bei der zu integrierenden Funktion um eine unecht gebrochenrationale Funktion handelt, so kann diese zunächst als Summe eines Polynoms und einer echt gebrochenrationalen Funktion dargestellt werden. Der Polynom-Anteil kann elementar integriert werden (Integration von Potenzfunktionen). Für den echt gebrochenrationalen Anteil kann die Partialbruchzerlegung (im folgenden kurz PBZ “ genannt) angewendet werden. Die ” Grundidee der PBZ besteht darin, die echt gebrochenrationale Funktion als Summe einfacherer Brüche (sogenannter Partialbrüche) darzustellen, welche dann leichter zu integrieren sind. Zunächst wird diese Vorgehensweise anhand eines Beispiels erläutert und anschließend allgemein beschrieben. Beispiel 5.12: Z Berechnung des Integrals x2 5x + 11 dx mittels PBZ: + 3x − 10 Der Integrand ist eine echt gebrochenrationale Funktion, d.h. es kann sofort mit der PBZ begonnen werden. Zunächst wird eine Produktdarstellung des Nenners des Bruches (vgl. dazu auch Formel (53) aus Abschnitt 3.2.3) ermittelt. Der Nenner x2 +3x−10 besitzt die Nullstellen x1 = 2 und x2 = −5 ⇒ x2 +3x−10 = (x−2)(x+5) ist die gesuchte Produktdarstellung. Die Faktoren dieser Produktdarstellung werden unmittelbar für den Ansatz der PBZ genutzt: x2 5x + 11 5x + 11 A1 A2 = = + , + 3x − 10 (x − 2)(x + 5) x−2 x+5 (70) wobei die reellen Koeffizienten A1 und A2 zunächst noch unbekannt sind. Das nächste Ziel wird sein, diese Koeffizienten zu berechnen. Dazu wird die rechte Seite der Gleichung (70) auf den Hauptnenner (x − 2)(x + 5) (Nenner des Integranden) gebracht: 5x + 11 A1 (x + 5) + A2 (x − 2) = (x − 2)(x + 5) (x − 2)(x + 5) und nach Multiplikation mit diesem Hauptnenner entsteht die Gleichung 5x + 11 = A1 (x + 5) + A2 (x − 2) . (71) Da diese Gleichung für beliebiges x ∈ R gelten muss, kann durch Einsetzen spezieller Werte für x eine Berechnung der Koeffizienten A1 und A2 erfolgen. Als vorteilhaft erweist es sich, genau die Nullstellen des Nenners des Integranden einzusetzen, weil dann auf der rechten Seite der Gleichung (71) jeweils ein Term entfällt. Man erhält für x = 2 : für x = −5 : 21 = A1 · 7 + A2 · 0 = 7A1 ⇒ A1 = 3 , −14 = A1 · 0 + A2 · (−7) = −7A2 ⇒ A2 = 2 . Einsetzen der soeben berechneten Koeffizienten in den Ansatz (70) liefert: 5x + 11 3 2 = + , (x − 2)(x + 5) x−2 x+5 d.h. es gilt Z 5x + 11 dx = x2 + 3x − 10 Z 5x + 11 dx = (x − 2)(x + 5) Z 2 3 + x−2 x+5 Z dx = 3 dx +2 x−2 Z dx . x+5 Die beiden Integrale auf der rechten Seite dieser Gleichung lassen sich mittels Substitution berechnen (das erste Integral mit der Substitution u = x − 2, das zweite mit u = x + 5, siehe dazu Abschnitt 5.2.1), und man gelangt so zu dem Resultat: Z 5x + 11 dx = 3 ln |x − 2| + 2 ln |x + 5| + C (C ∈ R). x2 + 3x − 10 87 Für die Integration gebrochenrationaler Funktionen kann allgemein die folgende Vorgehensweise angewendet werden. Z Berechnung des Integrals f (x) dx mit einer gebrochenrationalen Funktion f (x) g(x) echt gebrochenrational ist, kann sofort mit Schritt 1 begonnen werden. h(x) g(x) Anderenfalls wird zuerst mittels Polynomdivision die Darstellung f (x) = p(x) + h(x) g(x) ermittelt, wobei p(x): Polynom, : echt gebrochenrationale Funktion. h(x) g(x) Die folgenden Schritte der PBZ werden nur mit durchgeführt. h(x) Falls f (x) = Schritt 1: Produktdarstellung des Nenners h(x) mittels Berechnung der reellen Nullstellen des Nenners (Faktoren der Form (x − xi )ki bzw. (x2 + pi x + qi )li , ki , li ≥ 1) Schritt 2: Aufstellen des Partialbruchansatzes (unter Berücksichtigung der Vielfachheit der Nullstellen) Schritt 3: Berechnung der Koeffizienten im Partialbruchansatz Schritt 4: Einsetzen der gefundenen Koeffizienten in den Ansatz und Integration der Partialbrüche mit Hilfe bekannter Integrationsregeln Schritt 5: Summation aller Teilresultate Bemerkung: Eine alternative Möglichkeit zur Berechnung von A1 und A2 im Beispiel 5.12 besteht darin, die Terme auf der rechten Seite der Gleichung (71) auszumultiplizieren, dann soweit wie möglich zusammenzufassen und einen Koeffizientenvergleich durchzuführen. Man würde bei dieser Vorgehensweise erhalten: 5x + 11 = A1 x + 5A1 + A2 x − 2A2 = (A1 + A2 )x + 5A1 − 2A2 . Der Vergleich der Koeffizienten von x auf beiden Seiten der Gleichung ergibt: 5 = A1 + A2 und der Vergleich der Koeffizienten von x0 (Absolutglieder) auf beiden Seiten der Gleichung liefert: 11 = 5A1 − 2A2 . Das aus diesen beiden Gleichungen gebildete lineare Gleichungssystem besitzt die Lösung A1 = 3, A2 = 2 (vgl. Beispiel 5.12). 88 Beim Aufstellen des Ansatzes für die PBZ sind die Art und die Vielfachheit der Nullstellen des Nenners des Integranden zu beachten. Dabei werden die folgenden Fälle unterschieden. Fallunterscheidung für die Ansätze bei der Partialbruchzerlegung von g(x) h(x) 1. Fall: Das Nennerpolynom h(x) hat nur einfache reelle Nullstellen. Es gilt die Darstellung: h(x) = (x − x1 )(x − x2 ) · . . . · (x − xn ). Der zugehörige Ansatz für die PBZ lautet: g(x) A2 An A1 + + ... + . = h(x) x − x1 x − x2 x − xn Die Integration für jeden dieser Summanden liefert (dabei bezeichnet C die Integrationskonstante) : Z Ai dx = Ai · ln |x − xi | + C (i = 1, 2, . . . , n). x − xi 2. Fall: Das Nennerpolynom h(x) hat auch mehrfache reelle Nullstellen. Sei xm eine reelle Nullstelle der Vielfachheit k, d.h. h(x) enthält den Faktor (x − xm )k , k ≥ 2. Dieser mehrfachen reellen Nullstelle entsprechen im Ansatz die Summanden B1 Bk B2 + ... + . + 2 x − xm (x − xm ) (x − xm )k Für jede weitere reelle Nullstelle mit Vielfachheit ≥ 2 wird analog vorgegangen. Die Integration dieser Summanden (außer für den ersten, der im 1. Fall erläutert wurde) ergibt: Z Bi Bi Bi 1 dx = · (x − xm )−i+1 + C = · + C (i = 2, 3, . . . , k). i (x − xm ) 1−i 1 − i (x − xm )i−1 3. Fall: Das Nennerpolynom h(x) enthält einfache komplexe Nullstellen, d.h. in der Produktdarstellung des Nenners treten Faktoren der Form (x2 + pi x + qi ) auf, die keine reelle Nullstelle besitzen. Jedem derartigen Faktor entspricht im Ansatz ein Summand der Form: Ci x + D i + p i x + qi x2 (linearen Term im Zähler beachten!). Die Integration dieser Summanden kann ggf. sofort mittels Substitution (siehe Beispiel 5.14) erfolgen, anderenfalls muss zunächst eine geeignete Zerlegung der linearen Terme im Zähler durchgeführt werden. 4. Fall: Das Nennerpolynom h(x) enthält mehrfache komplexe Nullstellen, d.h. in der Produktdarstellung des Nenners treten Faktoren der Form (x2 + pi x + qi )l mit l ≥ 2 auf, die keine reelle Nullstelle besitzen. Einem solchen Faktor entsprechen im Ansatz für die PBZ die Summanden E1 x + F1 E2 x + F2 El x + Fl + + ... + 2 . x2 + pi x + qi (x2 + pi x + qi )2 (x + pi x + qi )l Für jede weitere komplexe Nullstelle mit Vielfachheit ≥ 2 wird analog vorgegangen. Die Integration der o.g. Terme kann mit Hilfe von Rekursionsformeln erfolgen. Beispiel 5.13: Beispiel 5.14: 89 5.2.4 Numerische Integration Die Zielstellung der numerischen Integration besteht darin, eine Berechnung bestimmter Integrale mittels Näherungsformeln durchzuführen, wenn die exakte Berechnung sehr kompliziert oder sogar unmöglich ist. Zb f (x) dx entspricht bekanntlich dem Inhalt der Fläche unter der Funktions- Der Wert des bestimmten Integrals a kurve von f (x) im Intervall [a, b] (siehe dazu Abschnitt 5.1.2). Die Grundidee der numerischen Integration besteht darin, die zu berechnende Fläche in Teilflächen zu unterteilen und jede Teilfläche durch eine einfacher zu berechnende Fläche zu ersetzen. Im folgenden werden zwei Formeln zur numerischen Integration vorgestellt: die Trapezformel und die Simpsonsche Formel. Bei der Herleitung der Trapezformel wird wie folgt vorgegangen: - Die Fläche unter der Kurve f (x) wird in n Streifen gleicher Breite: h = b−a unterteilt n (n: vorgegebene Zahl; Bild 5.3 zeigt eine Unterteilung in n = 4 Streifen). - Die krummlinige Begrenzung der Flächenstreifen wird jeweils durch die zugehörige Sehne ersetzt. ⇒ Es entstehen n Trapezflächen. - Der Flächeninhalt des k-ten Trapezes Tk (k = 1, 2, . . . , n) berechnet sich nach: ATk = f (xk ) + f (xk−1 ) yk + yk−1 h = h 2 2 - Die Summation aller Trapezflächen ergibt die Trapezformel: IT = h (y0 + 2y1 + . . . + 2yn−1 + yn ) 2 (Bei der Summation kommen alle Werte y1 , y2 , . . . , yn−1 genau zweimal vor, die Randwerte“ y0 = f (a) ” und yn = f (b) hingegen nur einmal.) Bild 5.3 Zb Die Trapezformel zur näherungsweisen Berechung des bestimmten Integrals I = f (x) dx a IT = h (y0 + 2y1 + . . . + 2yn−1 + yn ) , 2 (72) wobei n : Anzahl der Streifen (Teilintervalle auf der x-Achse), h = und yi = f (xi ) (i = 0, 1, . . . , n), x0 = a, xi = a + ih, xn = b 90 b−a : Streifenbreite n Beispiel 5.15a): Z2 Das Integral dx soll mittels der Trapezformel (72) mit n = 8 näherungsweise berechnet werden. x 1 Diese lautet im genannten Fall: IT = da h = 1 (y0 + 2y1 + . . . + 2y7 + y8 ) , 16 b−a 2−1 = gilt. Die benötigten Werte xk und die zugehörigen Funktionswerte yk (jeweils auf n 8 6 Nachkommastellen gerundet) sind in der nachfolgenden Tabelle zusammengestellt: k xk yk = f (xk ) = 0 1.000 1.000000 1 1.125 0.888889 2 1.250 0.800000 3 1.375 0.727273 4 1.500 0.666667 5 1.625 0.615385 6 1.750 0.571429 7 1.875 0.533333 8 2.000 0.500000 1 xk Man erhält das Resultat: IT = 0.694122. Das betrachtete Integral kann auch exakt berechnet werden (Stammfunktion: ln |x| ), in diesem Fall lautet das (wiederum auf 6 Nachkommastellen gerundete) Ergebnis: I = 0.693147. Für den Fehler bei der näherungsweisen Berechnung des Integrals gilt daher: |IT − I| = 9.75 · 10−4 ≈ 10−3 . Um die Simpsonsche Formel zu erhalten, wird eine gerade Anzahl n von Teilintervallen gewählt und wiederum eine Unterteilung der zu berechnenden Fläche in n gleichbreite Streifen vorgenommen. Dann werden jeweils zwei benachbarte Streifen zusammengefasst und die krummlinige Begrenzung dieser Flächenstreifen wird jeweils durch ein Parabelstück ersetzt. Anschließend wird exakt integriert, d.h. die Flächeninhalte unter den Parabelstücken werden exakt berechnet. Zb Die Simpsonsche Formel zur näherungsweisen Berechung des bestimmten Integrals I = f (x) dx a IS = h [ y0 + 4(y1 + y3 + . . . + yn−1 ) + 2(y2 + y4 + . . . + yn−2 ) + yn ] 3 (73) (innerhalb der Klammer mit dem Vorfaktor 4 stehen alle yk mit ungeradem Index k und innerhalb der Klammer mit dem Vorfaktor 2 alle yk mit geradem Index k, außer y0 und yn ). Weiterhin gelten wieder die folgenden Bezeichnungen: n : Anzahl der Streifen (Teilintervalle auf der x-Achse), h = b−a : Streifenbreite n und yi = f (xi ) (i = 0, 1, . . . , n), x0 = a, xi = a + ih, xn = b. Beispiel 5.15b): Das im Beispiel 5.15a) betrachtete Integral soll nun mit Hilfe der Simpsonschen Formel (73) näherungsweise berechnet werden. Diese lautet im genannten Fall: IS = da h = 1 [ y0 + 4(y1 + y3 + y5 + y7 ) + 2(y2 + y4 + y6 ) + y8 ) ] , 24 b−a 2−1 = gilt. Die benötigten Werte xk und die zugehörigen Funktionswerte yk sind dieselben wie n 8 91 in der Tabelle im Beispiel 5.15a). Die Berechnung ergibt: IS = 0.693155 , womit der Fehler |IS −I| = 8·10−6 beträgt, d.h. die Simpsonsche Regel hat für dieses Beispiel einen genaueren Wert als die Trapezregel geliefert (diese Aussage gilt auch allgemein, siehe Bemerkungen). Bemerkungen: - Der mit der Näherungsformel (Trapezformel oder Simpsonsche Formel) berechnete Wert lässt sich verbessern, indem die Anzahl n der Teilintervalle vergrößert wird. Für n → ∞ streben die Näherungswerte gegen den exakten Wert des Integrals. - Der Fehler bei Verwendung der Trapezformel liegt in der Größenordnung von h2 , bei der Simpsonschen Formel in der Größenordnung von h4 . - Die numerische Integration ist auch dann geeignet, wenn die zu integrierende Funktion nicht in geschlossener Form vorliegt (sondern z.B. nur als Messwerte an einzelnen Stellen). - Weitere Formeln für die numerische Integration sind z.B. in: H.J. BARTSCH, Taschenbuch Mathematischer Formeln für Ingenieure und Naturwissenschaftler, 23. Auflage (2014), Abschnitt 9.4 zu finden. 92 Literaturverzeichnis Das Vorlesungsskript wurde unter Verwendung der nachfolgend aufgeführten Literatur erstellt: D. A RNOLD , K. F URMANS : Materialfluss in Logistiksystemen. Springer, 6. Auflage, 2009. H.-J. BARTSCH: Taschenbuch Mathematischer Formeln für Ingenieure und Naturwissenschaftler. Fachbuchverlag Leipzig im Carl Hanser Verlag, 23. Auflage, 2014. K. D ÜRRSCHNABEL: Mathematik für Ingenieure - Eine Einführung mit Anwendungs- und Alltagsbeispielen. Springer Vieweg, 2. Auflage, 2012. A. F ETZER , H. F R ÄNKEL: Mathematik 1: Lehrbuch für ingenieurwissenschaftliche Studiengänge. Springer, 8. Auflage, 2005. A. F ETZER , H. F R ÄNKEL: Mathematik 2: Lehrbuch für ingenieurwissenschaftliche Studiengänge. Springer, 6. Auflage, 2009. H. H OFFMANN , R. N EUGEBAUER , G. S PUR : Handbuch Umformen, Carl Hanser Verlag, 2012. J. KOCH , M. S T ÄMPFLE : Mathematik für das Ingenieurstudium. Carl Hanser Verlag München, 2010. W. L EUPOLD (Hrsg.): Mathematik - ein Studienbuch für Ingenieure (Band 1: Algebra - Geometrie - Analysis für eine Variable). Fachbuchverlag Leipzig im Carl Hanser Verlag, 2. Auflage, 2011. W. L EUPOLD (Hrsg.): Mathematik - ein Studienbuch für Ingenieure (Band 2: Reihen - Differentialgleichungen - Analysis für mehrere Variable - Stochastik). Fachbuchverlag Leipzig im Carl Hanser Verlag, 2. Auflage, 2006. B. L UDERER , U. W ÜRKER: Einstieg in die Wirtschaftsmathematik. Teubner, 6. Auflage, 2005. K. M EYBERG , P. VACHENAUER. Höhere Mathematik 1 (Differential- und Integralrechnung, Vektor- und Matrizenrechnung), Springer, 5. Auflage, 1999. L. PAPULA : Mathematik für Ingenieure und Naturwissenschaftler: Ein Lehr- und Arbeitsbuch für das Grundstudium (Band 1). Vieweg+Teubner, 12. Auflage, 2009. L. PAPULA : Mathematik für Ingenieure und Naturwissenschaftler: Ein Lehr- und Arbeitsbuch für das Grundstudium (Band 2). Vieweg+Teubner, 12. Auflage, 2009. L. PAPULA : Mathematik für Ingenieure und Naturwissenschaftler. Anwendungsbeispiele. Vieweg, 5. Auflage, 2004. W. P REUSS , G. W ENISCH (Hrsg.): Lehr- und Übungsbuch Mathematik (Band 2: Analysis). Fachbuchverlag Leipzig im Carl Hanser Verlag, 3. Auflage, 2003. M. R ICHTER : Grundwissen Mathematik für Ingenieure, Teubner, 2. Auflage, 2009. P. S TINGL : Mathematik für Fachhochschulen. Hanser, 8. Auflage, 2009. H. T SCH ÄTSCH , J. D IETRICH: Praxis der Zerspantechnik, Vieweg+Teubner, 10. Auflage, 2011. E. W ESTK ÄMPER , H.-J. WARNECKE: Einführung in die Fertigungstechnik, B. G. Teubner Verlag, 4. Auflage, 2001. 93