Inhaltsverzeichnis 1 Grundlagen 1.1 Elemente der Mengenlehre . . . . . . . . . . . . . 1.2 Zahlenbereiche . . . . . . . . . . . . . . . . . . . 1.3 Das Auflösen von Gleichungen und Ungleichungen 1.4 Induktionsprinzip und Anwendungen . . . . . . . 2 Vektorrechnung 2.1 Vektoren in der Ebene . . . . . . . . . . . . . 2.1.1 Rechenoperationen . . . . . . . . . . . 2.1.2 Geometrische Anwendungen . . . . . . 2.1.3 Winkel und Abstände . . . . . . . . . 2.2 Der Raum R3 . . . . . . . . . . . . . . . . . . 2.2.1 Rechenoperationen . . . . . . . . . . . 2.3 Projektionen, Abstände und Volumina . . . . 2.3.1 Projektionen und Abstandsberechnung 2.3.2 Flächen, Volumina und Schnittwinkel 2.3.3 Anhang: Determinanten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 Lineare Gleichungssysteme 3.1 Matrixkalkül . . . . . . . . . . . . . . . . . . . . . . 3.2 Das Eliminationsverfahren . . . . . . . . . . . . . . 3.2.1 Die Zeilenstufentransformation einer Matrix 3.2.2 Berechnung des Lösungsraumes . . . . 3.3 Anhang:Matrixmultiplikation . . . . . . . . . . . . 3.3.1 Matrixprodukt . . . . . . . . . . . . . . . . 3.3.2 Invertierbare Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 3 8 15 24 . . . . . . . . . . 33 33 33 40 44 50 50 61 61 65 68 . . . . . . . 73 75 78 78 83 92 92 93 4 Analysis - Folgen und Funktionen 101 4.1 Konvergenz bei Zahlenfolgen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101 4.1.1 Konvergenz von Reihen . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 4.2 Stetige Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115 1 2 INHALTSVERZEICHNIS 4.3 4.4 4.5 Rationale Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126 Trigonometrische Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137 Die Exponentialfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145 5 Differenzialrechnung 149 5.1 Definition und Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149 5.2 Lokale Extremalstellen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159 5.3 Taylorentwicklung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170 Kapitel 1 Grundlagen 1.1 Elemente der Mengenlehre Dem Mathematiker Georg Cantor (1845 - 1918) folgend, stellen wir uns unter einer Menge das folgende vor: Definition. Unter einer Menge verstehen wir die Zusammenfassung von bestimmten Objekten unserer Anschauung oder unseres Denkens zu einem Ganzen. Wir bezeichnen Mengen mit großen Buchstaben: M, N, X, Y, .... Ist M eine Menge, so sind die zu M gehörenden Elemente alle paarweise verschieden. Um auszudrücken, dass ein Objekt a zu M gehört, schreiben wir a ∈ M . Wollen wir ausdrücken, dass es nicht zu M gehört, schreiben wir a ∈ / M. Beispiele . a) Die ganzen Zahlen bilden eine Menge, die wir mit dem Symbol ZZ bezeichnen. Wir haben also 1 ∈ ZZ, oder 289 ∈ ZZ, aber 1/2 ∈ / ZZ. b) Diejenigen ganzen Zahlen, die sich als Quadrat einer ganzen Zahl schreiben lassen, bilden eine Menge. Bezeichnen wir diese mit S, so ist etwa 16, 25, 256, 1024, 56644 = 2382 ∈ S, aber 123 ∈ / S. Wenn M und X zwei Mengen sind, so schreiben wir X = M , wenn jedes Element von M zu X und jedes Element von X zu M gehört. Haben wir eine Menge M gegeben, so bezeichnen wir als Teilmenge von M jede Menge T , deren Elemente alle auch schon zu M gehören. Wir schreiben dann T ⊂ M. Wir notieren, dass genau dann T = M , wenn T ⊂ M und M ⊂ T gilt. Man kann den Sachverhalt T ⊂ M auch beschreiben durch M ⊃ T (M ist Obermenge von T ) 3 4 KAPITEL 1. GRUNDLAGEN Eine Menge M mit nur endlich vielen Elementen (wir sprechen dann von einer endlichen Menge) kann man durch Aufzählen ihrer Elemente darstellen: M = {x1 , ..., xn } wenn n die Anzahl der Elemente ist. Zum Beispiel steht {0, 2, 4, 6, 8, 10, 12} für die Menge aller geraden natürlichen Zahlen, die nicht größer sind als 12. Haben wir eine Menge M gegeben, so können wir jede Teilmenge T ⊂ M durch eine Eigenschaft kennzeichnen, die die Elemente von T haben müssen, wenn sie zu T gehören sollen. Diese Kennzeichnung ist vor allem sinnvoll, wenn T unendlich ist, d.h. unendlich viele Elemente hat. Zum Beispiel ist die Menge IN der natürlichen Zahlen zu kennzeichnen als Menge aller ganzen Zahlen, welche nicht-negativ sind: IN = {m ∈ ZZ | m nicht − negativ} Die Menge aller durch 3 teilbaren natürlichen Zahlen ist zu beschreiben durch {0, 3, 6, 9, 12, 15, 18, ....} = {n ∈ IN : Es gibt ein k ∈ IN mit n = 3k} Will man ausdrücken, dass in einer Menge M keine Elemente existieren, die eine gewisse Eigenschaft, nennen wir sie kurz E , besitzen, so schreiben wir {x ∈ M | x hat die Eigenschaft E } = ∅ Das Symbol ∅ steht für die sog. leere Menge. Sie ist eine Menge, die keine Elemente enthält. Beispiele. a) Es gibt keine ganze Quadratzahl, deren Einerziffer gleich 8 ist: {n ∈ ZZ | n2 hat Einerziffer 8} = ∅ b) Es gibt keine ganze Zahl n mit n2 = 7: {n ∈ ZZ | n2 = 7} = ∅ c) Es gibt keine Dezimalzahl x mit x2 = −1: {x | x Dezimalzahl und x2 = −1} = ∅ Mengenoperationen (Rechnen mit Mengen) Wie erhalten wir aus gegebenen Mengen neue Mengen ? 1.1. ELEMENTE DER MENGENLEHRE 5 Definition. Sei M eine Menge. a) (Vereinigung von Mengen) Sind A, B Teilmengen von M , so nennen wir die Menge A ∪ B := {x ∈ M | x ∈ A oder x ∈ B} die Vereinigung von A und B. Dabei ist zugelassen, dass ein Element aus A ∪ B sowohl zu A als auch zu B gehört. A B b) (Durchschnitt von Mengen) Sind A, B Teilmengen von M , so nennen wir die Menge A ∩ B := {x ∈ M | x ∈ A und x ∈ B} den Durchschnitt von A und B. A A∩B B Wenn A ∩ B = ∅, A und B also keine gemeinsamen Elemente haben, so nennen wir A und B disjunkt. 6 KAPITEL 1. GRUNDLAGEN c) (Komplement) Ist A ⊂ M , so definieren wir das Komplement von A in M als Ac := {x ∈ M | x ∈ / A} Ist B ⊂ M , so schreiben wir B \ A := B ∩ Ac A Ac Beispiele. a) Jede ganze Zahl ist gerade oder ungerade: ZZ := {x ∈ ZZ : es gibt k ∈ ZZ mit x = 2k} ∪ {x ∈ ZZ : es gibt k ∈ ZZ mit x = 2k + 1} b) Wenn x ganz ist und x2 > 4, so kann nicht x ∈ {−2, −1, 1, 2} sein: {x ∈ ZZ : x2 > 4} ∩ {−1, 1, −2, 2} = ∅ Weiter haben wir {x ∈ ZZ : x2 > 4} = {−2, −1, 0, 1, 2}c c) Ist eine ganze Zahl durch 2 und durch 3 teilbar, so auch durch 6. Die Umkehrung hierzu ist offensichtlich. Wir schreiben M2 := {x ∈ ZZ | x ist durch 2 teilbar}, entsprechende Bedeutung haben die Mengen M3 und M6 . Dann haben wir M2 ∩ M3 = M6 Denn: Ist x ∈ M2 ∩ M3 , so haben wir x = 2k = 3` für geeignete ganze Zahlen k und `. Dann ist aber x = 3x − 2x = 6k − 6` = 6(k − `), also x ∈ M6 . 1.1. ELEMENTE DER MENGENLEHRE 7 Wir notieren den folgenden Satz (Regeln für die Mengenoperationen). Sei M eine Menge. Dann gilt für alle Mengen A, B, C ⊂ M : a) (A ∪ B) ∪ C = A ∪ (B ∪ C), und (A ∩ B) ∩ C = A ∩ (B ∩ C) b) (A ∪ B) ∩ C = (A ∩ C) ∪ (B ∩ C) c) (A ∩ B) ∪ C = (A ∪ C) ∩ (B ∪ C) d) (Ac )c = A, e) (A ∪ B)c = Ac ∩ B c , und (A ∩ B)c = Ac ∪ B c f) Genau dann ist A ⊂ B, wenn A ∩ B = A g) Genau dann ist A ⊂ B, wenn A ∪ B = B Zu b): A B C A C B C Beispiele. In der Wahrscheinlichkeitsrechnung ist man an der Berechnung von Wahrscheinlichkeiten für das Eintreten gewisser Ereignisse interessiert. Diese werden als mögliche Ergebnisse von sog. Zufallsexperimenten interpretiert. Man führt dazu sog. Ergebnisräume ein: Alle möglichen Ausgänge eines solchen Zufallsexperimentes werden zu einer Menge Ω zusammengefasst. Darin bildet man Teilmengen A ⊂ Ω. Diese bezeichnet man als Ereignisse. Sind A, B ⊂ Ω Ereignisse, so entspricht A ∩ B dem gleizeitigen Eintreten der Ereignisse A und B, Ac dem Nichteintreten von A und A \ B dem Ereignis, dass A eintritt und B gleichzeitig nicht. Beispiel: Würfeln mit 2 Würfeln. Ist man an der Gesamtaugenzahl interessiert, so ist Ω = {2, ..., 12}. Eine gerade Zahl zu werfen entspricht dem ”Ereignis” A = {2, 4, 6, 8, 10, 12}, eine Zahl größer als 6 zu werfen, dem Ereignis B = {7, 8, 9, 10, 11, 12}. Eine gerade Zahl größer als 8 zu werfen entspricht dem Ereignis (A ∩ B) \ {8}. 8 KAPITEL 1. GRUNDLAGEN 1.2 Zahlenbereiche Natürliche, ganze und rationale Zahlen Jeder kennt die natürlichen Zahlen, d.h. die nicht-negativen ganzen Zahlen. Sie bilden eine Menge, die wir mit IN bezeichnen. In der Menge IN kann man nicht zwei beliebige Zahlen voneinander subtrahieren. Diesen Nachteil beseitigt man durch Erweiterung auf den Bereich der ganzen Zahlen, welche auch die negative Zahlen enthalten. Für sie haben wir schon das Symbol ZZ kennengelernt. Innerhalb der Menge ZZ lässt sich aber nicht jede Divisionsaufgabe lösen. Man überwindet dies durch nochmalige Erweiterung zum Bereich Q der rationalen Zahlen. Eine rationale Zahl x ∈ Q ist durch einen Bruch x = pq mit ganzzahligen p, q darstellbar, wobei q > 0. Eine andere Darstellung von x ist diejenige als Dezimalbruch, der endlich viele Stellen hinter dem Komma haben kann, wie 5/8 = 0, 625 oder unendlich viele, wobei sich eine gewisse Zahlenfolge stets wiederholt, etwa: 8 1 1 = 8, 142857142857142857......, = 0, 076923 076923 076923 .... 7 13 oder 1/3 = 0, 333333333333333333.... Jedermann rechnet mit dieser Art von Zahlen, insbesondere alle Computer, seien sie nun groß oder klein (Tianhe-2 (mit 33.800 TeraFLOPS) oder Taschenrechner). Rechnen mit Potenzen Definition. Für eine Zahl a ∈ Q und n ∈ ZZ setzen wir, wenn n > 0 ist: an := a · · · a} | · ·{z n−mal (So wird etwa ( 38 )4 = 81 ). 4096 Für negative Exponenten n definieren wir die Potenzen so: an := 1 a−n . Weiter vereinbaren wir, dass a0 = 1 sein soll. 1.2.1 Hilfssatz. (Potenzrechenregeln) i) Sei a ∈ Q. Dann gilt an · am = an+m , (am )n = amn 1.2. ZAHLENBEREICHE 9 für n, m ∈ ZZ. ii) Weiter wird (ab)n = an bn für alle n ∈ ZZ und a, b ∈ Q \ {0}. Beweis. i) Der Fall n, m ≥ 0 ist leicht nachzurechnen. Wenn n, m < 0, haben wir an am = 1 1 1 1 1 = −n −m = −n−m = −(n+m) = am+n |n| |m| a a a a a a Nun zum Fall m ≥ 0 > n. Ist jetzt m ≥ |n|, so gilt (wegen m − |n| = n + m ≥ 0) an am = am 1 = am−|n| = an+m a|n| Sei jetzt also m < |n|. Dann ist m + n < 0 und −(m + n) = |n| − m, und damit (Kürzen von Faktoren a) 1 1 an am = |n| am = |n|−m = am−|n| = an+m a a Der Fall n ≥ 0 > m wird in analoger Weise behandelt. Die zweite Behauptung zu zeigen, ist eine Übungsaufgabe. Zu ii). Ist n ≥ 0, so folgt es aus der Definition der Potenz. Sei n < 0. Dann ist (ab)n = 1 1 1 1 = −n −n = −n −n = an bn −n (ab) a b a b Reelle Zahlen Innerhalb der rationalen Zahlen lässt sich aber nicht jede Gleichung der Form x2 = r für r ∈ Q, r > 0, lösen. 10 KAPITEL 1. GRUNDLAGEN Beispiel. Angenommen, man will die Länge der Diagonalen d in einem Würfel mit einer Kantenlänge a bestimmen. d d1 a Nach dem Pythagorassatz finden wir d2 = d21 +a2 = 3a2 . Wir müssen also die Gleichung x2 = 3 lösen. Das ist aber innerhalb der rationalen Zahlen (also der Dezimalzahlen) nicht möglich. Warum nicht? Angenommen, es ginge doch. Dann fände man ganze Zahlen p, q > 0 mit p2 /q 2 = 3, oder, was dasselbe ist, p2 = 3q 2 . Wir dürfen annehmen, dass p und q keine gemeinsamen Teiler haben. Zunächst sehen wir, dass p2 durch 3 teilbar ist. Dann muss dasselbe auch schon für p gelten, anderenfalls wäre doch p = 3m+k mit einer ganzen Zahl m und einem Rest k ∈ {1, 2}. Aber dann hätten wir p2 = (3m + k)2 = 9m2 + 6mk + k 2 . Da p2 durch 3 teilbar ist, ist k 2 = p2 − (9m2 + 6mk) es ebenfalls. Stattdessen ist aber k 2 ∈ {1, 4}, ein Widerspruch. Ist aber p selbst schon durch 3 teilbar, haben wir p = 3m mit einer ganzen Zahl m. Aus 3q 2 = p2 = 9m2 folgt jetzt q 2 = 3m2 . Wie eben folgt jetzt, dass auch q durch 3 teilbar sein müsste, also mit der Zahl 3 ein gemeinsamer Teiler von p und q gefunden wäre. Das widerspricht der Annahme über p und q. Zwar kann man sich in dieser Lage mit Näherungslösungen für die Gleichung x2 = 3 helfen, etwa x0 = 1.732050807568877293527 (dann hat die Dezimalbruchdarstellung von x0 2 − 3 erst ab der 1 069 762 528.ten Nachkommastelle von Null verschiedene Einträge), doch das aufgezeigte mathematische Problem bleibt bestehen. Man erweitert den Bereich der rationalen Zahlen nochmals und gelangt zum Bereich der reellen Zahlen, den wir mit R bezeichnen wollen. Dieser Bereich von Zahlen ist anschaulich durch die Punkte auf der ”Zahlengeraden” darstellbar. Jede reelle Zahl entspricht einem Punkt auf dieser Geraden und umgekehrt. Für das Rechnen mit reellen Zahlen gelten dieselben Regeln wie im Bereich der rationalen Zahlen. Die Ordnungsrelation auf Q kann auf R erweitert werden. Jede reelle Zahl x besitzt eine 1.2. ZAHLENBEREICHE 11 Darstellung als endlicher oder unendlicher Dezimalbruch. Denn ist k ∈ IN beliebig, so ist xk := 10−k−1 [10k+1 x] ∈ Q und 0 ≤ x − xk ≤ 10−k−1 . Dabei ist für eine Zahl t ∈ R der ganzzahlige Teil [t] von t definiert als die größte ganze Zahl, die kleiner oder gleich t ist. Somit stellt xk die Zahl x bis auf k Nachkommastellen genau dar. Definition. Wir nennen eine Menge A ⊂ R nach oben (unten) beschränkt, wenn eine Zahl S ∈ R so gefunden werden kann, dass x ≤ S für alle x ∈ A ( bzw. x ≥ S für alle x ∈ A) gilt. In R gilt das folgende Archimedische Vollständigkeitsaxiom: Jede nach oben beschränkte Menge A ⊂ R hat in R eine kleinste obere Schranke. Jede nach unten beschränkte Menge B ⊂ R hat in R eine größte untere Schranke. Beispiel. Die Menge A := {x ∈ Q| x2 < 3} hat in Q eine obere Schranke, aber keine kleinste obere Schranke. Denn ist S ∈ Q eine obere Schranke für A, so ist S 2 > 3, also t := S 2 − 3 > 0. Nun bilden wir SN := S − N1 und rechnen aus, dass 2 SN = S2 − 1 2S 1 2S 2S + 2 =3+t− + 2 >3+t− N N N N N 2 Ist also N genügend groß, so wird SN > 3, da dann t > 2S wird. Dann ist also x < SN für jedes N x ∈ A. Auch SN ist eine obere Schranke für A und kleiner als S. Weitere irrationale Zahlen: a) Die Zahl π Bei Kreisen ist das Verhältnis von Umfang zu Durchmesser stets dasselbe. Die alten Griechen haben dies schon beobachtet. Es wurde 1706 erstmals mit dem Buchstaben π bezeichnet. Der Flächeninhalt eines Kreises mit Radius 1 ist π. Die Aufgabe, allein mit Zirkel und Lineal eine Strecke der Länge π zu konstruieren ist in der Vergangenheit als das Problem der Quadratur des Kreises bekannt geworden. Es ist unlösbar, was 1882 durch F. Lindemann bewiesen wurde. Diese Zahl lässt sich durch die Bruchzahlen niemals exakt, aber in guter Näherung, darstellen. Etwa approximiert der Bruch 22/7 die Zahl π auf 2 Kommastellen genau, beim Bruch 355/113 sind es 6 Stellen und bei 104 348/33 215 schon 9 Kommastellen. Man hat z. B. π 1 1 1 1 = 1 − + − + − .... 4 3 5 7 9 Auf 12 Stellen genau hat man π = 3, 141 592 653 589..... 12 KAPITEL 1. GRUNDLAGEN b) Die Eulersche Zahl e. n Man bilde die Zahlen xn = 1 + n1 . Mit immer größer werdendem n wird auch xn immer größer und strebt einer nach Euler benannten Zahl e zu, von der man ebenfalls zeigen kann, dass sie keine rationale Zahl ist. Man hat e=1+1+ 1 1 1 1 1 + + + + + ..... ≈ 2, 718281828..... 2 2·3 2·3·4 2·3·4·5 2·3·4·5·6 Diese Zahl tritt bei der Beschreibung von Wachstumsprozessen auf. Quadratwurzeln Innerhalb der reellen Zahlen kann man jede Gleichung x2 = a lösen, √ sofern a > 0√ist. Dabei gibt es eine positive und eine negative Lösung, die wir mit dem Symbol a (bzw. − a ) bezeichnen. 1 a a 1 a Das Rechteck√hat die Fläche a, und nach dem Höhensatz ebenso das Quadrat. Seine Seitenlänge ist also a. √ Wir können zu jeder vorgegebenen Approximationsgüte durch folgendes Verfahren a näherungsweise berechnen. √ √ Sei dazu a > 1. Wir wählen x1 so, dass a < x1 < a + 0.1 und weiter 1 a x2 = (x1 + ), 2 x1 1 a x3 = (x2 + ), 2 x2 1 a x4 = (x3 + ), ..... 2 x3 1.2. ZAHLENBEREICHE 13 Allgemein: Ist xk schon berechnet, so a 1 xk+1 = (xk + ) 2 xk für k ≥ 1. Dann gilt x2k − a = 1 (x2 − a)2 ≥ 0 4x2k−1 k−1 für alle k ≥ 2. Es folgt: xk+1 1 a = (1 + 2 ) ≤ 1 xk 2 xk √ a ≤ xk+1 ≤ xk ≤ x1 für alle k ≥ 1. Weiter haben wir aber √ √ √ √ 2 1 (xk + xak − 2 a) xk+1 − a x2k − 2 axk + a xk − a 2 √ = 1 √ √ √ = 2 = xk+1 + a xk + 2 axk + a xk + a (xk + xak + 2 a) 2 für k ≥ 1, also also 0 ≤ xk+1 − √ √ √ √ √ √ xk+1 + a (xk − a)2 (xk − a)2 (xk − a)2 √ √ ≤ √ ≤ √ a= ≤ (xk − a)2 xk + a xk + a xk + a 2 a für k ≥ 1. √ √ √ √ Da nun x1 − a < 0.1, folgt x2 − a ≤ 0.01, x3 − a < 0.0001 ,x4 − a < 0.00000001. Von Schritt zu Schritt verdoppelt sich die Zahl der korrekten Nachkommastellen nahezu: Ist xk bis auf 2k−2 − 1 Nachkommastellen korrekt, so ist es xk bis auf 2k−1 − 1 Nachkommastellen. Beispiele. 1)√Sei a = 3. Dann ist x1 := 1.74 eine Zahl mit x21 = 3.0276 > 3 und (x1 − 0.1)2 = √ 2.9929, also ist 3 < x1 < 3 + 0.1. Dann wird x2 = 1.7320689655, und x3 = 1.732050807664, x4 = 1.7320508075688. Schon x4 ist bis auf 10 Nachkommastellen korrekt. √ √ 2) Sei a = 235. Wir wählen x1 = 15.33. Dann ist 235 < x1 < 235 + 0.1. Nun rechnen wir aus x2 = 15.329709719505424, x3 = 15.32970971675589, x3 − x4 < 10−14 Also ist x3 bis auf 13 Nachkommastellen korrekt. Das oben für die Quadratwurzeln beschriebene Argument ist mit etwas technischem Aufwand verallgemeinerbar und eignet sich dann für den Nachweis der Existenz höherer Wurzeln aus positiven Zahlen. Zur praktischen Berechnung der n.-ten Wurzel : Sei x > 0. Dann geht man ähnlich vor wie bei der Quadratwurzel: • Man wähle einen Startwert x0 > 0, 14 KAPITEL 1. GRUNDLAGEN • Berechne x1 = n1 ((n − 1)x0 + x ) xn−1 0 , • Angenommen, es seien x1 , x2 , ..., xk schon gefunden. Dann berechne man xk+1 durch xk+1 = 1 x ((n − 1)xk + n−1 ) n xk Wenn irgendwann, (d.h.: für großes k) die Zahlen xk und xk+1 √ sich kaum noch voneinander unterscheiden, so hat man in xk einen guten Näherungswert für n x gefunden. Beispiele: a) x = 5, n = 5 und x0 = 2. Dann wird x1 = 1.6625 x2 = 1.460904141 x3 = 1.38826304 x4 = 1.379833925 x5 = 1.37972967 x6 = 1.379729661 x7 = 1.379729661 √ In guter Näherung gilt also 5 5 = 1.379729661. Es gilt in der Tat |x57 − 5| < 10−8 . 1.2.2 Satz. a) Ist t ≥ 1 ( bzw. t > 1), so auch tn ≥ 1 (bzw. tn > 1) für alle n ∈ IN . Wenn a ≥ b > 0 (bzw. a > b), so ist auch an ≥ bn (bzw. an > bn ) für alle n ∈ IN . b) Ist n√≥ 2 ganz und x > 0, so lässt sich aus x genau eine n-te Wurzel ziehen. Wir bezeichnen diese mit n x. Beweis. a) ist klar. Wenn (a/b) ≥ 1 ist, so an /bn = (a/b)n ≥ 1. Zu b) Ist x > 0 und sind a, b > 0 Lösungen zu an = bn = x, so kann nach a) nicht mehr a < b oder b < a sein. Es gilt wieder die folgende Regel: 1.2.3 Hilfssatz. Für positive Zahlen x, y und ganze Zahlen n, k > 1 wird: √ n √ √ xy = n x n y, q n √ k x= √ nk x √ √ √ Beweis. Denn n xy und n x n y lösen beide die Gleichung T n = xy, stimmen also überein. Analog begründet man die 2. Gleichung. 1.3. DAS AUFLÖSEN VON GLEICHUNGEN UND UNGLEICHUNGEN 1.3 15 Das Auflösen von Gleichungen und Ungleichungen Lineare Gleichungen Eine lineare Gleichung hat die Form ax + b = 0 wobei a und b reelle Zahlen sind und a 6= 0. Sie hat genau eine Lösung, diese ist leicht anzugeben: x = −b/a. Etwas weniger leicht ist der Fall der Gleichungen 2. Grades Das sind Gleichungen der Form ax2 + bx + c = 0, wobei wieder a, b, c ∈ R und a 6= 0. Setzen wir p = b/a und q = c/a, so ist x genau dann Lösung dieser Gleichung, wenn x2 + px + q = 0 (1.3.1) (Man nennt dies auch die Normalform einer quadratischen Gleichung, denn der Koeffizient bei x2 ist auf 1 normiert ). Wir formen (1.3.1) um, indem wir p2 /4 − q auf beiden Seiten hinzuaddieren und erhalten: x2 + px + p2 − 4q p2 = 4 4 oder p2 − 4q p (1.3.2) (x + )2 = 2 4 Hier sehen wir, dass unsere quadratische Gleichung nicht uneingeschränkt lösbar ist: Alles hängt von der Größe D1 := p2 − 4q ab, die man daher auch die Diskriminante der quadratischen Gleichung nennt. Wir finden i) Keine Lösung in R, wenn D1 < 0 ist, da die linke Seite von (1.3.2) immer ≥ 0 sein muss. ii) Genau eine Lösung, wenn D1 = 0 ist. Sie ist gegeben durch x = −p/2 iii) Genau zwei Lösungen x1 , x2 , wenn D1 > 0 ist. Es gilt x1 = − Ein kleines p 1p p 1p + D1 , x2 = − − D1 2 2 2 2 16 KAPITEL 1. GRUNDLAGEN Beispiel: Die Gleichung 35 176 x+1= 153 51 1600 und daher D1 = 23409 = r2 , wobei r = x2 − Hier ist p = − 176 ,q = 153 16 51 x1 = 40 . 153 Wir erhalten die Lösungen 12 68 4 108 = , x2 = = 153 17 153 9 Beispiel. Ein Auto mit einer Geschwindigkeit v ≥ 40 km/h hat je 100 km einen Benzinverbrauch B(v), der etwa durch B(v) = av 2 + bv + c berechnet werden kann. Angenommen, es sei B(v) = 0.0004v 2 − 0.03v + 5. Wie schnell ist das Auto gefahren, wenn es 8 Liter Benzin auf 100 km verbraucht hat? Wir müssen also eine quadratische Gleichung lösen, nämlich 0.0004v 2 − 0.03v + 5 = 8 √ 2 2 d.h. also √ v − 75v = 7500. Als rechnerische Lösungen haben wir v1,2 = 37.5 ± 37.5 + 7500 = 37.5 ± 8906.25, doch relevant ist v1 . Also war die Geschwindigkeit des Wagens v1 = 37.5 + 94.37 = 131.87. Wollen wir aber alle quadratischen Gleichungen lösen, müssen wir unseren Zahlenbereich R nochmals erweitern, was auf die komplexen Zahlen führt. Dazu später mehr. Einfache kubische Gleichungen Wir betrachten zunächst nur Gleichungen vom Typ x3 + px2 + qx = 0 (1.3.3) Offenbar ist 0 eine Lösung. Jede Lösung der quadratischen Gleichung x2 + px + q = 0 ist eine weitere Lösung der kubischen Gleichung. Nun kommen wir zur kubischen Gleichung x3 + px + q = 0 (1.3.4) Wir notieren zuerst, dass (a2 + ab + b2 )(a − b) = a3 − b3 für alle a, b ∈ R gilt. Angenommen, wir haben zu (1.3.4) eine Lösung x0 gefunden. Dann können wir durch Untersuchen der quadratischen Gleichung x2 + x0 x + p + x20 = 0 (1.3.5) 1.3. DAS AUFLÖSEN VON GLEICHUNGEN UND UNGLEICHUNGEN 17 entscheiden, ob es weitere Lösungen zu (1.3.4) gibt. Denn ist x1 eine Lösung zu (1.3.5), so ist wegen x30 + px0 = −q: x31 + px1 + q = x31 − x30 + p(x1 − x0 ) = (x21 + x0 x1 + x20 )(x1 − x0 ) + p(x1 − x0 ) = (x21 + x0 x1 + x20 + p)(x1 − x0 ) = 0 So lässt sich eine kubische Gleichung manchmal auf eine quadratische zurückführen. Beispiel: Die Gleichung x3 − 46 x 3 + 592 27 = 0 hat die Lösung x0 = 8/3. Die Gleichung 8 46 64 x2 + x − + =0 3 3 9 also 74 8 =0 x2 + x − 3 9 hat die Lösungen 4 √ 4 √ x2 = − + 10, x3 = − − 10 3 3 Unter günstigen Umständen kann man im Reellen eine Lösung der kubischen Gleichung x3 + px + q = 0 ausrechnen, nämlich dann, wenn p q ∆ := ( )3 + ( )2 ≥ 0 3 2 ist. Wir probieren jetzt x := t − 3tp . Einsetzen in x3 + px + q = 0 ergibt dann, dass t3 die quadratische Gleichung T 2 + qT = ( p3 )3 löst. Das führt auf q √ T =− ± ∆ 2 √ √ 3 Wir wählen T := − 2q + ∆ und bilden t0 := T . Das liefert uns r r p q √ q √ 3 x=t− = − + ∆− 3 + ∆ 3t 2 2 Beispiel: Die Gleichung x3 + 23 x − 32 = 0. 16 74375 Jetzt ist also p = 23 , q = − 32 . Das ergibt ∆ = 110592 = ( 25 )2 119 . Damit erhalten wir 16 64 27 s s r r 25 119 3 25 119 3 3 3 3 x= + − − + = 4 192 3 4 192 3 4 18 KAPITEL 1. GRUNDLAGEN Rückführung auf die Normalform Die allgemeine kubische Gleichung x3 + a2 x2 + a1 x + a0 = 0 kann durch die Substitution x=t− überführt werden in (t − a2 3 a2 a2 a2 3 ) + a2 (t − )2 + a1 (t − ) + a0 = 0 3 3 3 Das ist aber gerade a22 2a3 a1 a2 )t + 2 − + a0 = 0 3 27 3 Ist t0 eine Lösung dieser Gleichung, so wird x = t0 − a32 eine Lösung zur Gleichung x3 + a2 x2 + a1 x + a0 = 0. Beispiel. Die Gleichung x3 +6x2 +4x+5 = 0. Wir schreiben x = t−2 und finden t3 −8t+13 = 0. . Die Cardanosche Formel liefert x0 := −3, 43316 als Jetzt ist also q = 13, p = −8, also ∆ = 2515 108 gute Näherungslösung. Also ist x1 := −5, 43316 eine Lösung zu x3 + 6x2 + 4x + 5 = 0. t3 + (a1 − Beispiele. a) Aus einer rechteckigen Platte mit Breite a und Höhe b sollen an den 4 Ecken quadratische Stücke herausgeschnitten werden. Durch Hochbiegen der Seiten entsteht dann eine Wanne mit den Maßen a−2x, b−2x, x, also einem Volumen V = x(a−2x)(b−2x). Angenommen, a = 150cm,b = 90cm. Wie muss x gewählt werden, soll V = 91 Liter werden? Dazu müssen wir die Gleichung (90 − 2x)(150 − 2x)x = 91000 lösen, also erfüllt u = x/10 die Gleichung (9 − 2u)(15 − 2u)u = 91, also 4u3 − 48u2 + 135u − 91 = 0. Wir teilen durch 4 und finden u − 91 = 0. Nun schreiben wir u = v + 4 und setzen √ein. Es die Gleichung u3 − 12u2 + 135 4 4 57 63 3 entsteht √v − 4 v − 4 = 0. Eine Nullstelle liegt bei v1 = −3. Daraus folgt, dass v2 := 3−2 30 und √ v3 := 3+2 30 weitere Nullstellen sind. Zu ihnen gehören die x-Werte x1 = 10, x2 = 5(11 − 30) √ und x3 = 5(11 + 30). Aber x3 > 82 ist zu groß und scheidet aus. Technisch relevant sind nur x1 und x2 . Spannungsabfall an einer Glühlampe. Angenommen, der Spannungsabfall (in Volt) an einer Glühlampe sei durch U = 1000I 3 + 200I gegeben, wobei I die Stromstärke (in Ampère) bedeute. Dann kann man ausrechnen, welcher I-Wert auf U = 60 führt. Man löst nämlich die kubische Gleichung I 3 + 0.2 I − 0.06 = 0. Also ist hier p = 0.2 und q = −0.06. Das ergibt √ ∆ = 0.00119, ∆ = 0.0346. Mit der Cardanoformel folgt I = 0.23506 . Biquadratische Gleichungen Diese Gleichungen haben die Gestalt ax4 + bx2 + c = 0 (1.3.6) 1.3. DAS AUFLÖSEN VON GLEICHUNGEN UND UNGLEICHUNGEN 19 mit a, b, c ∈ R und a 6= 0. Man erhält nur dann Lösungen x ∈ R, wenn die quadratische Gleichung at2 + bt + c = 0 eine reelle nicht negative Lösung hat. Beispiel. Die Gleichung 3x4 − 2x2 − 5 = 0 kann in x4 − 23 x2 = 5 3 umgeformt werden. Es folgt q 1±4 5 2 (x2 − 13 )2 = 16 , also x = . Wir erhalten daher 2 reelle Lösungen: x = ± . 1,2 9 3 3 Ungleichungen Ordnungsrelation und Betrag Für zwei Zahlen x, y ∈ R, schreiben wir x < y, wenn x kleiner als y ist und x > y, wenn x größer als y ist. Wenn x kleiner oder gleich y gilt, so schreiben wir auch x ≤ y, entsprechende Bedeutung hat die Notation x ≥ y. Offenbar gilt stets eine der beiden Ungleichungen x ≤ y oder y ≤ x. Wir nennen eine Zahl x ∈ R positiv, wenn x > 0 und negativ, wenn x < 0. Als Betrag einer Zahl x ∈ R definieren wir |x| := x, wenn x ≥ 0 und |x| = −x, wenn x < 0. 1.3.1 Hilfssatz. Für Ungleichungen in R gelten folgende weitere Regeln: i) Aus a ≤ b und b ≤ c folgt: a ≤ c. Gilt hierbei a < b oder b < c, so ist stets a < c. ii) Genau dann ist a ≤ b (bzw. a < b), wenn −a ≥ −b (bzw. −a > −b) iii) a) x ≤ y impliziert x + z ≤ y + z für alle z ∈ R. Ist z ≥ 0, so folgt weiter xz ≤ yz. b) Wenn x ≤ y und z < 0, so hat man xz ≥ yz c) Sind x und y positiv, so gilt x2 < y 2 genau dann, wenn x < y iv) Genau dann besteht für a, b > 0 die Ungleichung a ≥ b, wenn 1/a ≤ 1/b. Entsprechend ist a > b mit 1/a < 1/b äquivalent. Die Betragsfunktion erfüllt folgende Regeln: v) |x|2 = x2 ; ist t ≥ 0, so ist |z| ≤ t genau dann, wenn −t ≤ z ≤ t, vi) |x| = 0 genau dann, wenn x = 0, |xy| = |x||y| und |x + y| ≤ |x| + |y| (Dreiecksungleichung) Beweis. Zu iii). Der erste Teil ist klar. Zum zweiten: Wenn z < 0, (insbesondere −z > 0, so folgt xz − yz = (−z)(y − x) ≥ 0, also xz ≥ yz. Sind x, y > 0, so ist y 2 − x2 = (y − x)(x + y) genau dann positiv, wenn y − x es ist. Zu iv). Man teile die Ungleichung a ≥ b (bzw. a < b) durch ab und benutze iii). Punkt v) folgt aus der Definition des Betrages einer Zahl. Zu vi) Die erste Behauptung ist klar. Zur zweiten: Wenn x = 0 oder y = 0 ist alles klar. Angenommen, es sei x, y 6= 0. Dann wird (|xy| − |x||y|)(|xy| + |x||y|) = |xy|2 − |x|2 |y|2 = (xy)2 − x2 y 2 = 0. Dann ist aber |xy| = |x||y|, denn |xy| + |x||y| > 0. 20 KAPITEL 1. GRUNDLAGEN Zur Dreiecksungleichung: Es gilt −|x| ≤ x ≤ |x| und −|y| ≤ y ≤ |y|, woraus durch Addieren der Ungleichungen folgt: −(|x|+|y|) = −|x|−|y| ≤ x+y ≤ |x|+|y|. Aus v) folgt die Behauptung. Intervalle Sind a, b ∈ R mit a < b, so sei (a, b) := {x ∈ R | a < x < b}, (a, b] := {x ∈ R | a < x ≤ b} , [a, b) := {x ∈ R | a ≤ x < b}, [a, b] := {x ∈ R | a ≤ x ≤ b} Analoge Bedeutung haben die Intervalle, wenn a durch −∞ oder b durch ∞ ersetzt wird. Beispiele für das Lösen von Ungleichungen Wir sehen uns dazu zwei Typen von Ungleichungen an: i) Seien a, b und c reell, a > 0. Wir untersuchen die Menge M := {x ∈ R | |ax + b| ≤ c} Ist c < 0, so ist M = ∅. Ist c ≥ 0, so ist x ∈ M ⇔ −c ≤ ax + b ≤ c ⇔ −c − b ≤ ax ≤ c − b ⇔ − c−b c+b ≤x≤ a a Das zeigt, dass c+b c−b , ] a a , 12+7 ] = [− 35 , 19 ] Beispiel: {x | |3x − 7| ≤ 12} = [− 12−7 3 3 3 M = [− ii) Sei M := {x | x2 + px + q ≥ s} für beliebige p, q und s. Nun gilt p 2 p2 x ∈ M ⇔ (x + ) ≥ s − q + 2 4 Wenn also s − q + M , wenn p2 4 ≤ 0, so ist M = R. Ist dagegen s − q + p2 4 > 0, so gehört x genau dann zu r p p2 |x + | ≥ s − q + 2 4 Dann wird aber M = M− ∪ M+ , wobei r r p p2 p p2 M− = {x | x + ≤ − s − q + } = (−∞ , − − s − q + ] 2 4 2 4 1.3. DAS AUFLÖSEN VON GLEICHUNGEN UND UNGLEICHUNGEN und p M+ = {x | x + ≥ 2 Graphische Darstellungen: r p p2 s − q + } = [− + 4 2 r s−q+ 21 p2 , +∞) 4 Zu (i) M = {x | |3x − 7| ≤ 12} |3x-7| 12 M x -5/3 0 7/3 19/3 22 KAPITEL 1. GRUNDLAGEN Zu (ii) mit p = 4, q = −3, s = 5. 10 5 M_ -4 M+ -2 -5 Weitere Beispiele. iii) Was ist M := {x ∈ R | |4x − 1| > |2x + 2|} ? Dazu überlegen wir x ∈ M ⇔ (4x − 1)2 > (2x + 2)2 ⇔ 16x2 − 8x + 1 > 4x2 + 8x + 4 ⇔ 12x2 − 16x > 3 1 4 ⇔ x2 − x > 3 4 2 2 4 1 5 ⇔ (x − ) > + = ( )2 3 9 4 6 2 5 ⇔ |x − | > 3 6 Das zeigt, dass 1 3 M = (−∞, − ) ∪ ( , ∞) 6 2 (iv) Was ist die Menge M := {x ∈ R | |3x − 2| > |x|} ? 1.3. DAS AUFLÖSEN VON GLEICHUNGEN UND UNGLEICHUNGEN 23 Wir zerlegen M als M = M+ ∪ M− , wobei M+ := {x ∈ M | 3x − 2 ≥ 0}, M− := {x ∈ M | 3x − 2 < 0} und bestimmen M+ und M− einzeln. Es gilt M+ = {x ∈ M | 2 − 3x < x < 3x − 2} = {x ∈ M | − 2x < −2 und 4x > 2} = {x ∈ M | x > 1} = (1, ∞) und M− = {x ∈ M | 3x − 2 < x < 2 − 3x} = {x ∈ M | 4x < 2 und 2x < 2} 1 1 = {x ∈ M | x < } = (−∞ , ) 2 2 1 Also ist M = (−∞ , 2 ) ∪ (1, ∞). 1 2x − 3 Beispiel. Berechne die Menge M := {x 6= ≤ x}. Zunächst ist M ⊂ (0, ∞) und 4 4x − 1 M = {x 6= 41 | |2x − 3| ≤ x|4x − 1|}. Wir zerlegen dann M = M1 ∪ M2 ∪ M3 , mit h3 1 3 1 , ), M2 := M ∩ , ∞), M3 := M ∩ (0, ) M1 := M ∩ 4 2 2 4 Dann rechnen wir aus: 1 M1 = {x > | 3 − 2x ≤ 4x2 − x} 4 1 1 3 1 = {x > | 4x2 + x ≥ 3} = {x > | x2 + x ≥ } 4 4 4 4 1 3 h 13 1 1 2 7 2 15 i = {x > | (x + ) ≥ ( ) } = , )∩ , ∞) ∪ (−∞, − =∅ 4 8 4 4 2 8 8 Weiter ist h3 h3 2 M2 = , ∞) ∩ {x 2x − 3 ≤ 4x − x} = , ∞) ∩ {x 4x2 − 3x ≥ −3} 2 2 h3 = , ∞) 2 und schließlich 1 M3 = (0, ) ∩ {x | 3 − 2x ≤ x − 4x2 } 4 1 = (0, ) ∩ {x | 4x2 − 3x ≤ −3} 4 1 3 3 = (0, ) ∩ {x | x2 − x ≤ − } 4 4 4 1 3 2 3 2 3 = (0, ) ∩ {x | (x − ) ≤ ( ) − } = ∅, 4 8 8 4 24 da KAPITEL 1. GRUNDLAGEN ( 38 )2 1.4 − 3 4 < 0. Also erhalten wir M = M2 = h 3 , ∞). 2 Induktionsprinzip und Anwendungen Das Induktionsprinzip ist der folgende Grundsatz: Ist n0 ∈ IN und E ⊂ IN eine Menge mit den beiden Eigenschaften: • n0 ∈ E und • Ist n ≥ n0 und n ∈ E, so ist auch n + 1 ∈ E, so besteht E aus allen natürlichen Zahlen, welche ≥ n0 sind. Das erlaubt es, Formeln über natürliche Zahlen zu beweisen. Beispiel. Es gilt für alle n ∈ IN die Beziehung: n(n + 1) (1.4.7) 2 Ein möglicher Beweis mit dem Induktionsprinzip (man sagt auch Induktion nach n) verläuft so: Hier ist E die Menge der natürlichen Zahlen n, für die (1.4.7) zutrifft: Sicherlich ist n0 := 1 ∈ E. Gilt nun (1.4.7) für n, so haben wir 1 + 2 + 3 + 4 + ... + n = 1 + 2 + 3 + 4 + ... + (n + 1) = (1 + ... + n) + (n + 1) n(n + 1) + 2n + 2 (n + 1)(n + 2) n(n + 1) +n+1= = = 2 2 2 Das ist gerade die Formel (1.4.7), wenn man n durch n + 1 ersetzt. Das zeigt: n + 1 ∈ E, wenn n ∈ E. Summennotation: Haben wir endlich viele Zahlen a1 , ...., an ∈ R gegeben, so schreiben wir ihre Summe a1 + a2 + a3 + ... + an als a1 + a2 + a3 + ... + an =: n X k=1 Die Formel (1.4.7) lässt sich also auch als n X k=1 schreiben. k= n(n + 1) 2 ak 1.4. INDUKTIONSPRINZIP UND ANWENDUNGEN 25 Man kann nun nach demselben Schema nachweisen, dass n X n(n + 1)(2n + 1) 6 k2 = k=1 und n X 3 k = k=1 n(n + 1) 2 2 Geometrische Summenformel 1.4.1 Hilfssatz. Ist q 6= 1, so haben wir für alle n ∈ IN : n X qk = k=0 q n+1 − 1 q−1 (1.4.8) Beweis. Auch das zeigen wir induktiv: Für n = n0 = 0 ist die Behauptung klar. Gilt sie für n, so auch für n + 1: n+1 X q k = n X q k + q n+1 k=0 n+1 k=0 −1 + q n+1 q−1 q n+1 − 1 + q n+1 (q − 1) q n+1 − 1 + q n+2 − q n+1 q n+2 − 1 = = = q−1 q−1 q−1 = q Das war zu zeigen. Als erste Anwendung erinnern wir uns an die Geschichte über die Erfindung des Schachspiels. Der Erfinder dieses Spiels, der Brahmane Sissa, soll von seinem Herrscher, dem König Shrihram, wie folgt belohnt worden sein: Auf das erste der 64 Felder des Schachbrettes kommt ein Weizenkorn, auf das 2. Feld 2, auf das 3. Feld 22 auf das 4. Feld 23 und immer so fort, allgemein auf das n.te Feld 2n−1 . Wie viele Weizenkörner kommen so zusammen? Die Antwort lautet N := 64 X n=1 n−1 2 = 63 X 2n = 264 − 1 n=0 = 18 446 744 073 709 551 615 Soviel Weizen wächst auf der ganzen Erde nicht! 26 KAPITEL 1. GRUNDLAGEN Angenommen, ein Weizenkorn wiegt ca. 0,05 Gramm. Dann erhalten wir als Weizenmenge N · 0.05 = 922337203685477580, 75 Gramm, also über 922, 337203 Milliarden Tonnen Weizen. Das ist etwa das 1300 - Fache der Weizenernte des Jahres 2013/14, als weltweit 709 Millionen Tonnen Weizen geerntet wurden. Wollte man diese Weizenmenge auf Lastwagen mit 10 Tonnen Nutzlast verladen, so bräuchte man 92,2337 Milliarden solcher LKWs. Hat jeder eine Länge von 10 Metern und führen die LKW Stoßstange an Stoßstange, so entstünde ein Konvoi von 922 Millionen km Länge, was das 6-fache Entfernung Erde-Sonne wäre. Er könnte etwa 23000 Mal um den Äquator gewickelt werden. Die Formel (1.4.8) ist verallgemeinerbar: 1.4.2 Hilfssatz. Ist n 6= 0 ganz, so haben wir für alle a 6= b: n−1 X ak bn−1−k = k=0 an − b n a−b (1.4.9) Beweis. Wenn wir in (1.4.8) mit n − 1 statt n setzen q := ab , so wird n−1 n−1 n−1 k n X X X an − b n a n−1 q − 1 n−1 k n−1 =b =b = ak bn−1−k q =b k a−b q−1 b k=0 k=0 k=0 Ein weiteres Beispiel: 1.4.3 Hilfssatz (Bernoulli-Ungleichung). Wenn x ≥ −1 und n ∈ IN , so gilt immer (1 + x)n ≥ 1 + nx Beweis. Auch das ist induktiv nachzuweisen: Für n = 1 ist nichts zu tun. Angenommen, die Ungleichung gilt für n ≥ 1. Dann gilt sie auch für n + 1, denn (1 + x)n+1 = (1 + x)n (1 + x) ≥ (1 + nx)(1 + x) = 1 + (n + 1)x + nx2 ≥ 1 + (n + 1)x wobei die Ungleichung (1 + x)n (1 + x) ≥ (1 + nx)(1 + x) aus der Induktionsannahme und der Voraussetzung 1 + x ≥ 0 folgt. Die geometrisch-arithmetische Ungleichung 1.4.4 Satz Sind x1 , ..., xn ≥ 0, so gilt (x1 · ... · xn )1/n ≤ x1 + ... + xn n 1.4. INDUKTIONSPRINZIP UND ANWENDUNGEN 27 Beweis. Auch das zeigen wir durch Induktion nach n. Für n = 1 ist nichts zu tun, da dann beide Seiten übereinstimmen. Angenommen, die Ungleichung gelte für n Zahlen. Sind dann x1 , ...., xn+1 ≥ 0, so dürfen wir n und schreiben annehmen, es sei xn+1 die größte unter ihnen. Dann setzen wir An := x1 +...+x n x1 + ... + xn+1 (n + 1)An n+1 = nAn + xn+1 (n + 1)An n+1 xn+1 − An = 1+ (n + 1)An xn+1 − An ≥ 1+ An xn+1 = An n+1 Damit folgt x1 + ... + xn+1 n+1 n+1 ≥ Ann xn+1 ≥ (x1 · ... · xn )xn+1 = x1 · ... · xn+1 da ja laut Induktionsannahme gilt Ann ≥ x1 · ... · xn . Das beweist die Behauptung für n + 1. Aus der Kombinatorik Fakultät und Binomialkoeffizienten Ist n ∈ IN , so definieren wir n! := 1, wenn n = 0 und sonst n! = 1 · 2 · 3 · ... · n (also ist n! für n ≥ 2 das Produkt der ersten n natürlichen Zahlen!) Beispiele. 4! = 24, 6! =720, 10! = 3628800, 15! = 1 307 674 368 000. Die Binomialkoeffizienten sind so definiert: Sind n und k ∈ IN , so setzen wir n k Ferner setzen wir n 0 := 1 und 0 0 = n! (n − k)!k! = 1. Wo kommen die Binomialkoeffizienten vor? Anwendungen der Binomialkoeffizienten Befinden sich in einer Urne n Kugeln, so gibt es nk verschiedene Möglichkeiten, k Kugeln herauszunehmen, (wobei natürlich die Zahl k nicht größer als n sein soll). n Allgemeiner gesagt: Eine n-elementige Menge hat k verschiedene k-elementige Teilmengen. 28 KAPITEL 1. GRUNDLAGEN Beim Lottospiel kann man auf 49 6 verschiedene Weisen 6 Zahlen ankreuzen, das sind 44 · 45 · 46 · 47 · 48 · 49 = 13 983 816 720 Möglichkeiten. So berechnen wir die Binomialkoeffizienten systematisch: 1.4.5 Hilfssatz. a) Die Binomialkoeffizienten sind symmetrisch: n n = k n−k n b) Man kann n+1 aus nk und k−1 berechnen: k n+1 k = n k + n k−1 Beweis. a) klar. Zu b) n n + 1 n n n n+1 k )= = + = (1 + k k−1 n+1−k k n+1−k k k Das folgende Schema zur Berechnung der Binomialkoeffizienten basiert auf diesem Hilfssatz und heißt (nach dem französischen Mathematiker Blaise Pascal) auch 1.4. INDUKTIONSPRINZIP UND ANWENDUNGEN 29 Pascalsches Dreieck: 0 k 1 k 2 k 3 k 4 k 5 k 6 k 7 k 1 1 1 2 1 1 1 1 1 7 3 4 5 6 1 3 6 10 15 21 1 4 10 20 35 1 1 5 15 35 1 6 21 1 7 1 Hier ist eine kombinatorische Anwendung des Binomialkoeffizienten: 1.4.6 Satz Gegeben sei eineMenge Sn = {x1 , ..., xn } mit n Elementen und k ∈ {0, 1, 2, ..., n}. n Dann findet man exakt Teilmengen in Sn , die k Elemente besitzen. k Beweis. Auch hier eignet sich ein Induktionsargument. Der Fall n = 1 ist klar. Angenommen, die Aussage gelte für n-elementige Mengen. Ist nun A ⊂ Sn+1 := {x1 , ..., xn+1 } eine Teilmenge mit k Elementen, so gehört A zu genau einer der beiden Teilmengensysteme: T1 := {L ⊂ Sn+1 | xn+1 ∈ / L}, T2 := {L ⊂ Sn+1 | xn+1 ∈ L} Aber T1 steht in 1-zu-1-Korrespondenz mit T := {Z ⊂ Sn | Z hat k Elemente} und T2 in 1zu-1-Korrespondenz mit T3 := {X ⊂ Sn | X hat k − 1 Elemente}, denn genau dann gehört eine Teilmenge A zu T2 , wenn X := A\{xn+1 } zu T 3 gehört. Aber dann hat T1 genau soviele Elemente n wie T , und das sind nach Induktionsannahme an der Zahl und T2 genau soviele Elemente k n n n wie T3 , und das sind an der Zahl. So finden wir, dass für A exakt + = k − 1 k k n+1 Möglichkeiten bestehen. k−1 Die Regel (a + b)2 = a2 + 2ab + b2 , (a − b)2 = a2 − 2ab + b2 lässt sich verallgemeinern zum Binomischen Lehrsatz: 30 KAPITEL 1. GRUNDLAGEN 1.4.7 Satz (Binomischer Lehrsatz). Für zwei Zahlen a, b ∈ R und n ∈ IN gilt: (a + b)n = n X n k=0 k an−k bk Auch dies ist mit Induktionsverfahren und der Rekursionsformel für die Binomialkoeffizienten zu zeigen. Der Induktionsanfang ist n = 1 ist klar. Nehmen wir an, die Formel gelte für n, so gilt sie auch für n + 1, denn n+1 (a + b) = (a + b) n X n l=0 = n X n l=0 n+1 X l a l an−l bl n−l+1 l b + n X n k k=0 n+1 X an−k bk+1 n n n+1−l l a b + an+1−l bl = l − 1 l l=1 l=0 n X n n n+1 = a + + an+1−l bl l l−1 l=1 n+1 X n+1 = an+1−k bk k k=0 Zwei kleine Anwendungen: 1.4.8 Folgerung. Es gilt n X n k=0 k = 2n , n X n k=0 k (−1)k = 0 Wähle im Binomialsatz einmal a = b = 1 und das andere Mal a = −1, b = 1. Kapitel 2 Vektorrechnung 2.1 2.1.1 Vektoren in der Ebene Rechenoperationen Die Punkte in der Ebene lassen sich durch ein Paar reeller Zahlen eindeutig beschreiben. Diese beiden Zahlen nennen wir auch die Koordinaten des Punktes. Die Ebene wird auch mit dem Symbol R2 bezeichnet. (x,y) Ist P ein Punkt der Ebene und sind x und y seine Koordinaten, so schreiben wir dies in der Form P = P (x, y). 33 34 KAPITEL 2. VEKTORRECHNUNG Defintion Unter einem Vektor verstehen wir einfach eine Spalte v1 ~v = v2 mit den reellen Zahlen v1 und v2 als Einträgen. Jedem Punkt P (x, y) ordnen wir seinen ”Ortsvektor” x P~ = y zu. Für Vektoren erklärtmandie folgenden Rechenoperationen: x a Ist ~v = ,w ~= , so setzen wir y b x+a ~v + w ~ := y+b und, wenn α ∈ R beliebig gewählt ist: α~v = αx αy v+w w 2v v Folgende Rechenregeln sind routinemäßig zu überprüfen: i)Assoziativgesetz: (~v + w) ~ + ~u = ~v + (w ~ + ~u), ii) Kommutativgesetz: ~v +w ~ =w ~ + ~v , 0 iii) ~v + ~0 = ~v , wobei ~0 := sein soll. 0 2.1. VEKTOREN IN DER EBENE 35 iv) ~v − ~v := ~v + (−1)~v = ~0. (Wir schreiben natürlich (−1)~v =: −~v ). v) (α + β)~v = α~v + β~v vi) α(~v + w) ~ = α~v + αw, ~ vii) (αβ)~v = α(β~v ), für alle ~v , w, ~ ~u ∈ R2 und α, β ∈ R. −→ ~ − A. ~ Wir sagen, zwei PunkteSind A und B Punkte in der Ebene, so schreiben wir AB := B −→ −→ paare (A, B) und (C, D) definieren denselben Vektor, wenn AB = CD. So können wir auch mit Vektoren arbeiten, die nicht vom Nullpunkt ”ausgehen”. Der Vektor, der von A ausgeht und nach B verläuft (Pfeilspitze in B) wird nicht mehr unterschieden von dem Vektor, welcher parallel zu −→ AB liegt und im Nullpunkt ansetzt. Definition. Wir nennen 2 Vektoren linear abhängig, wenn ~v = ~0 oder w ~ = ~0 gilt oder wenn ~v = tw ~ mit einer geeigneten reellen Zahl t. Entsprechend heißen ~v und w ~ linear unabhängig, wenn sie nicht linear abhängig sind. Wie überprüfen wir lineare Unabhängigkeit durch Nachrechnen ? 2.1.1 Satz. Genau dann sind zwei Vektoren ~v1 = a1 b1 und ~v2 = a2 b2 linear unabhängig, wenn a1 b2 − a2 b1 6= 0 gilt. Beweis. Angenommen, ~v1 und ~v2 seien linear unabhängig. Dann ist a1 6= 0 oder a2 6= 0. Sei etwa a1 6= 0. Wäre a1 b2 − a2 b1 = 0, so folgte b2 = aa21 b1 und damit ~v2 = aa21 ~v1 , was nicht sein sollte. Es muss also a1 b2 − a2 b1 6= 0 sein. Sind nun ~v1 und ~v2 linear abhängig, also etwa ~v1 = λ~v2 mit einer Zahl λ ∈ R, so folgte ja a1 = λa2 , b1 = λb2 , also a1 b2 − a2 b1 = λa2 b2 − λa2 b2 = 0. a b Definition. Sind ~v = ,w ~= ∈ R2 , so bezeichnen wir mit c d a b := ad − bc det(~v , w ~ ) = c d a b a c a b = . die Determinante der Matrix . Es gilt c d c d b d Für die Determinante gelten folgende Regeln: 2.1.2 Satz. Sind ~u, ~v , w ~ ∈ R2 und t ∈ R, so haben wir det(~u + ~v , w) ~ = det(~u, w) ~ + det(~v , w) ~ 36 KAPITEL 2. VEKTORRECHNUNG det(~v , ~u + w) ~ = det(~v , ~u) + det(~v , w) ~ det(t~v , w) ~ = det(~v , tw) ~ = t det(~v , w) ~ det(w, ~ ~v ) = − det(~v , w), ~ det(t~v , ~v ) = 0 Beispiele. a) 243 23 25 89 220 23 55 23 = −64 89 = 4 −16 89 32 23 = 4 −105 89 = 4(32 · 89 + 23 · 105) = 4 · 5263 = 21052 b) 562 28 112 82 = 2 281 28 56 82 1 28 = 2 56 − 820 82 1 14 = 4 −764 41 = 4(41 + 764 · 14) = 42948 1 28 = 2 −764 82 2.1.1.1 Satz. Sind die Vektoren ~v , w ~ ∈ R2 linear unabhängig, so ist jeder Vektor ~x ∈ R2 darstellbar als ~x = t~v + sw ~ mit geeigneten t, s ∈ R. v1 w1 Beweis. Wir schreiben ~v = und w ~= . Soll es für ein ~x ∈ R2 Koeffizienten t, s v2 w2 geben, für die ~x = t~v + sw ~ ist, so sind t und s festgelegt. Denn dann ist det(~x, w) ~ = t det(~v , w), ~ det(~v , ~x) = s det(~v , w) ~ Da nun det(~v , w) ~ 6= 0, haben wir dann t= det(~x, w) ~ , det(~v , w) ~ s= det(~v , ~x) det(~v , w) ~ 2.1. VEKTOREN IN DER EBENE 37 Umgekehrt ergibt die Rechenprobe, dass wirklich ~x = Beispiele. a) Die Vektoren 4 7 det(~v , ~x) det(~x, w) ~ ~v + w ~ det(~v , w) ~ det(~v , w) ~ und 1 9 sind linear unabhängig, denn 4 1 ∆ := 7 9 so dass man ~x := 8 5 = 29 als Linearkombination dieser beiden Vektoren schreiben kann, und zwar 8 1 5 9 8 = 5 29 6 b) Die Vektoren und 7 4 8 7 5 1 67 4 36 1 4 + = − 7 9 29 29 7 29 9 −2 sind linear unabhängig, da 12 6 −2 = 86 ∆ := 7 12 Es gilt 5 −2 4 12 5 = 4 86 6 + 7 6 5 7 4 29 −2 34 6 11 −2 = − 12 12 43 7 86 38 KAPITEL 2. VEKTORRECHNUNG Hier ist eine Veranschaulichung der Beweisidee: w sv v x=sv+tw tw Das Skalarprodukt y1 x1 definieren wir das ”Skalarprodukt” , ~y = Definition. Für ~x = y2 x2 h~x, ~y i := x1 y1 + x2 y2 2.1.1.2 Satz a) Für das Skalarprodukt gelten die Regeln: h~x, ~y i = h~y , ~xi h~x, ~y + ~ui = h~x, ~y i + h~x, ~ui h~x + ~u, ~y i = h~x, ~y i + h~u, ~y i b) Der Abstand eines Punktes x mit Ortsvektor ~x von Nullpunkt ist gegeben durch p k~xk := h~x, ~xi Weiter gilt für ~x, ~y ∈ R2 k~x + ~y k2 = k~xk2 + k~y k2 + 2h~x, ~y i c) Genau dann bilden 2 Vektoren ~x, ~y ∈ R2 \ {~0} einen Winkel von 90◦ , wenn h~x, ~y i = 0 ist. 2.1. VEKTOREN IN DER EBENE 39 Beweis. a) und b) rechnet man nach. Zu c) Bilden ~x und ~y einen Winkel von 90◦ , so gilt der Pythagorassatz: Der Pythagorassatz, den wir auf das Dreieck mit Ecken ~0, ~x und ~y anwenden können, lehrt k~xk2 + k~y k2 = k~x − ~y k2 x x-y y Andererseits ist aber auch k~x − ~y k2 = k~xk2 + k~y k2 − 2h~x, ~y i Vergleichen wir beides miteinander, erhalten wir h~x, ~y i = 0. ~ := 1 (~x +~y ) und R = 1 k~x −~y k. Umgekehrt nehmen wir an, es sei h~x, ~y i = 0. Dann setzen wir M 2 2 ~ k = k~x − M ~ k = k~x + ~y − M ~ k = R, so dass ~0, ~x und ~x + ~y auf Aus h~x, ~y i = 0 erhalten wir, dass kM ~ mit Radius R liegen. Der Satz von Thales sagt, dass nun ~x auf ~y senkrecht dem Halbkreis um M stehen muss. x + y x M 0 40 KAPITEL 2. VEKTORRECHNUNG Definition. Wir nennen 2 Vektoren ~v , w ~ ∈ R2 orthonormiert, wenn k~v k = kwk ~ = 1 und h~v , wi ~ = 0. 2.1.1.3 Satz Sind ~v , w ~ ∈ R2 orthonormiert, so gilt für jedes ~x ∈ R2 ~x = h~x, ~v i~v + h~x, wi ~ w ~ und k~xk2 = h~x, ~v i2 + h~x, wi ~ 2 Beweis. Es gilt ~v , w ~ 6= ~0 und wegen h~v , wi ~ = 0 kann nicht ~v = tw ~ für irgendein t ∈ R gelten. Also lässt sich jedes ~x ∈ R2 als ~x = t~v + sw ~ schreiben. Wir bilden die Skalarprodukte mit ~v und w ~ und finden h~x, ~v i = ht~v + sw, ~ ~v i = t, h~x, wi ~ = ht~v + sw, ~ wi ~ =s Weiter rechnen wir aus, dass k~xk2 = kt~v + swk ~ 2 = t2 + s2 + 2tsh~v , wi ~ = t2 + s2 Anmerkung. Ist ~v = a b −b ~ 6 0, so ist w = ~ senkrecht auf ~v genau dann, wenn w ~ =t a mit einer Zahl t ∈ R. Beispiel. Seien ~v = 5 7 und w ~ = 7 −5 . Dann ist h~v , wi ~ = 0, und √1 ~ v 74 und √1 w ~ 74 sind orthonormiert. Weiter ist 34 5 130 17 5 65 10 7 7 =− + =− + −12 −5 74 7 74 37 7 37 −5 Der oben behandelte Satz hat viele Anwendungen. 2.1.2 Geometrische Anwendungen Schnittpunkte bei Geraden ~ und B ~ 6= A ~ auf Man kann eine Gerade G ⊂ R2 eindeutig beschreiben, wenn man 2 Punkte A ~ und die Richtung ~v der Geraden angibt. So kommen ihr vorgibt, oder wenn man einen Punkt A wir zu den folgenden 2 Darstellungen für die Gerade G: (ZP F ) ~ + R(B ~ − A) ~ := {A ~ + t(B ~ − A) ~ | t ∈ R} G=A 2.1. VEKTOREN IN DER EBENE 41 oder alternativ (P RF ) ~ + R~v := {A ~ + t~v | t ∈ R} G=A ~ und B ~ −A ~ linear abhängig Nach (ZPF) liegt ein Punkt ~x genau dann auf G, wenn ~x − A sind. ~ und ~v linear abhängig sind. Nach (PRF) liegt ~x genau dann auf G, wenn ~x − A Wir untersuchen jetzt die Schnittmenge zweier Geraden G1 und G2 . ~ 1 + R~v1 und G2 = A ~ 2 + R~v2 zwei Geraden, so gilt folgendes 2.1.2.1 Satz. Sind G1 = A ~1 − A ~ 2 und ~v1 linear unabhängig, so ist G1 ∩ G2 = ∅, a) Sind ~v1 und ~v2 linear abhängig und A also G1 parallel zu G2 . ~1 − A ~ 2 und ~v1 linear abhängig, so ist G1 = G2 . Sind ~v1 und ~v2 linear abhängig und A ~ wobei b) Sind ~v1 und ~v2 linear unabhängig, so ist G1 ∩ G2 = {S}, ~ ~ ~=A ~ 1 + det(A2 − A1 , ~v2 ) ~v1 S det(~v1 , ~v2 ) Beweis. a) Angenommen, ~v2 = s~v1 mit einer reellen Zahl s 6= 0. Gäbe es einen Punkt ~x ∈ ~ 1 + t1~v1 = A ~ 2 + t2~v1 für geeignete t1 , t2 ∈ R. Dann wäre ja A ~1 − A ~ 2 = (t2 − t1 )~v1 , G1 ∩ G2 , so ~x = A ~ 1 und A ~ 2. Widerspruch zur Annahme über A ~1 − A ~ 2 = r~v1 , und ~x = A ~ 1 + t~v1 ∈ G1 , so folgt ~x = A ~ 2 + (r + t)~v1 = A ~ 2 + (r + t)s−1~v2 ∈ G2 . Ist A Also ist G1 ⊂ G2 . Entsprechend zeigt man G2 ⊂ G1 . Also folgt G1 = G2 . ~1 − A ~ 2 in der Form A ~1 − A ~ 2 = t1~v1 + t2~v2 schreiben. Dann b) Nach Satz 2.1.1.1 kann man A ist aber ~ 1 − t1~v1 = A ~ 2 + t2~v2 =: S ~ ∈ G1 ∩ G2 A ~ Die Formeln aus dem Beweis von Satz 2.1.1.1 ergeben den behaupteten Ausdruck für S. 2.1.2.2 Beispiel (Schwerpunkt im Dreieck). Angenommen, wir haben ein Dreieck mit Ecken A, B und C gegeben. Dann schneiden sich die Seitenhalbierenden in einem Punkt S. Zu den ~ B ~ und C. ~ Für den Schwerpunkt S und den zugehörigen Punkten A, B und C gehören Vektoren A, ~ haben wir Vektor S ~ = 1 (A ~+B ~ + C). ~ S 3 ~ − A, ~ w ~ − A. ~ Beweis. Wir schreiben ~v := B ~ := C 42 KAPITEL 2. VEKTORRECHNUNG Die Winkelhalbierenden sind dann die drei Geraden ~ + R(~v − 1 w), ~ WB = B 2 ~ + R(~v + w), WA := A ~ ~ + R( 1 ~v − w) WC = C ~ 2 C a b S x y B z c A Der vorherige Satz sagt dann WA ∩ WB = {SAB }, WA ∩ WC = {SAC }, WB ∩ WC = {SBC } mit SAB ~ − A, ~ ~v − 1 w) det(B ~ 2 ~ = A+ (~v + w) ~ 1 det(~v + w, ~ ~v − 2 w) ~ ~+ = A det(~v , ~v − 21 w) ~ (~v + w) ~ det(~v + w, ~ ~v − 12 w) ~ {z } | = 13 ~ + 1 (B ~ +C ~ − 2A) ~ = A 3 1 ~ ~ ~ = (A + B + C) 3 2.1. VEKTOREN IN DER EBENE 43 Ebenso errechnen wir ~ ~ 1 ~ ~ + det(C − A, 2 ~v − w) (~v + w) ~ SAC = A 1 det(~v + w, ~ 2 ~v − w) ~ ~+ = A det(w, ~ ~v − 12 w) ~ (~v + w) ~ det(~v + w, ~ ~v − 12 w) ~ {z } | = 13 = 1 ~ ~ ~ (A + B + C) 3 ~+B ~ + C) ~ ist. Entsprechend rechnen wir aus, dass SBC = 13 (A Ein weiteres Beispiel: Bestimmung von Teilungsverhältnissen. Gegeben sei ein Parallelogramm mit Ecken A, ..., D. Die Seite BC werde durch den Punkt P von B aus im Verhältnis 2:1 geteilt, und M sei Mittelpunkt der Seite CD. In welchem Verhältnis teilt dann der eingezeichnete Punkt S die Strecke AP ? M C D P w S B A v −→ Es sei ~v der zur Seite AB und w ~ der zu AD gehörige Vektor. Dann haben wir AP = ~v + 23 w ~ und −→ −→ −→ −→ ~ AM = 21 ~v + w. ~ Weiter folgt BM = AM − AB = − 21 ~v + w. ~ Die Gerade AP ist G1 = A+R(~ v + 32 w) ~ 1 ~ und die Gerade BM ist gegeben durch G2 = B + R(− ~v + w). ~ Ihr Schnittpunkt ist jetzt 2 ~=A ~+ S −→ det(~v , − 12 ~v + w) ~ 2 ~ + 3 AP (~ v + w) ~ = A 3 4 det(~v + 23 w, ~ − 21 ~v + w) ~ Damit lautet die Antwort auf die gestellte Frage so: Die Strecke AP wird durch S von A aus im Verhältnis 3:1 geteilt. 44 KAPITEL 2. VEKTORRECHNUNG Die Cramersche Regel Als weitere Anwendung sehen wir uns die sog. Cramer-Regel an: 2.1.2.3 Satz. Angenommen, wir haben ein Gleichungssystem gegeben in der Form ax + by = t cx + dy = s a b mit Matrix A = , so dass det A 6= 0. c d Dann existiert genau eine Lösung zu dem Gleichungssystem, nämlich t b a t s d c s x= , y= det(A ) det(A ) Beweis. Wir schreiben das Gleichungssystem als a c x+ b d y= t s und wenden Satz 2.1.1.1 an. 2.1.3 Winkel und Abstände Ist α ein Winkel, α < 90◦ , so bilden wir irgendein rechtwinkliges Dreieck, bei dem α als Winkel zwischen einer Kathete und der Hypotenuse auftritt. B c a α A b C Dann hängen die Verhältnisse ab. Wir schreiben a c und b c nicht von der Wahl des Dreiecks, sondern nur von α a b sin α = , cos α = c c Wir definieren für Winkel α zwischen 90◦ und 180◦ sin α = sin(180 − α), cos α = − cos(180 − α) 2.1. VEKTOREN IN DER EBENE 45 2.1.3 Hilfssatz Schließen α und ~y den Winkel α ein, so ist h~x, ~y i = k~xkk~y k cos(α) Beweis. Wir sehen uns die Zeichnung an: C C y B y β α x A α F A F x B Wir beobachten, dass für 0 < α < 90◦ gilt AF = k~y k cos α und für 90◦ < α < 180◦ die Beziehung AF = k~y k cos β = k~y k cos(180◦ − α) = −k~y k cos α besteht. In beiden Fällen ist F B = k~xk − k~y k cos α. Wenden wir den Pythagorassatz auf das Dreieck CF B an, so folgt mit sin β = sin α (k~xk − k~y k cos α)2 + k~y k2 sin2 α = k~x − ~y k2 Der Term auf der linken Seite ist aber genau k~xk2 + k~y k2 − 2k~xkk~y k cos α und der auf der rechten Seite gleich k~xk2 + k~y k2 − 2h~x, ~y i. Vergleichen wir beides, folgt h~x, ~y i = k~xkk~y k cos α. Das liefert die Behauptung. 1 −11 Beispiel. Der Winkel α zwischen den Vektoren und erfüllt die Gleichung −2 −12 cos α = 13 13 13 h~x, ~y i =√ √ = √ = = 0.357137 k~xkk~y k 36.4005 5 265 5 53 Das ergibt α = 69◦ 40 . Als weitere Anwendung finden wir einen Beweis des Cosinussatzes: 46 KAPITEL 2. VEKTORRECHNUNG 2.1.4 Satz. Bilden in einem Dreieck 2 Seiten ~x und ~y einen Winkel α, so ist das Quadrat über der dritten Seite gerade gleich k~x − ~y k2 = k~xk2 + k~y k2 − 2k~xkk~y k cos α Beweis. Denn k~x − ~y k2 = k~xk2 + k~y k2 − 2h~x, ~y i, und h~x, ~y i = k~xkk~y k cos α. Beispiel (Heronische Formel). Hat ein Dreieck die Seiten a, b und c und setzen wir S = so gilt für seinen Flächeninhalt F die Beziehung: p F = S(S − a)(S − b)(S − c) . a+b+c , 2 Wir beachten folgendes: b a α c a2 = k~ak2 = k~b − ~ck2 = b2 + c2 − 2bc cos α Mit 2F = bc sin α folgt 4F 2 = b2 c2 sin2 α = b2 c2 − b2 c2 cos2 α und damit 16F 2 = = = = = 4b2 c2 − 4b2 c2 cos2 α 4b2 c2 − (a2 − b2 − c2 )2 (2bc + a2 − b2 − c2 )(2bc − a2 + b2 + c2 ) = (a2 − (b − c)2 )((b + c)2 − a2 ) (a − b + c)(a + b − c)(b + c − a)(a + b + c) = 2(S − b) · 2(S − c) · 2(S − a) · 2S 16S(S − a)(S − b)(S − c) Daraus folgt alles. 2.1. VEKTOREN IN DER EBENE 47 Beispiel: Resultierende aus mehreren Kräften Angenommen, an einem Punkt greifen vier Kräfte an, wie im folgenden Bild gezeigt wird: F (2) F F (1) 45 61 30 20 F (3) 15 F (4) Dabei sind die Beträge der Kräfte gegeben durch kF~ (1) k = 500N, kF~ (2) k = 300N, kF~ (3) k = 250N, kF~ (4) k = 200N Dann ist die resultierende Kraft F~ gerade die Summe aus F~ (1) , ..., F~ (4) . Im einzelnen wird nun wegen cos(200◦ ) = − cos 20◦ = −0.939693, sin 20◦ = 0.342 und ◦ cos 15◦ = 0.965, sin 15 =◦ 0.258: cos 30 433N (1) F = 500N = sin 30◦ 250N ◦ cos 135 −212.1N (2) F = 300N = sin 135◦ 212.1N ◦ cos 20 −234.92N (3) F = −250N = sin 20◦ −85.5N ◦ cos 15 193.2N (4) F = 200N = . sin 15◦ −51.8N Es folgt also 4 X 433 − 212.1 − 234.92 + 193.2 179.18N (i) F~ = F = N= 250 + 212.1 − 85.5 − 51.8 324.8N i=1 Kraftzerlegung an einem Keil. Angenommen, auf einen Keil mit Öffnungswinkel 2α wirkt eine Kraft F~ . Wie groß sind die Komponenten F~1 und F~2 von F~ , die auf den Seitenflächen senkrecht stehen: 48 KAPITEL 2. VEKTORRECHNUNG α A F 1 F 2 2β F cos α − cos α ~ , F2 = und − sin α − sin α damit det(F~1 , F~2 ) = −2 sin α cos α. Weiter ist det(F~ , F~2 ) = det(F~1 , F~ ) = −kF~ k cos α. So finden ~k F wir mit Satz 2.1.1.1 heraus: F~ = 2ksin (F~1 + F~2 ) α Beispiel: Ist etwa kF~ k = 15N und α = 5◦ , so wird 2 sin α = 0.1743 und folglich kF~1 k = ~ kF k 15 = 0.1743 N = 86N. 2 sin α Zunächst beachten wir β = 90 − α. Es folgt F~1 = ◦ Abstandsberechnungen ~ + R~v und ein Punkt ~x ∈ R2 . 2.1.3.1 Satz. Gegeben sei eine Gerade G = A a) Dann gilt für jeden Punkt ~y ∈ G: k~x − ~y k ≥ d(~x, G) := ~+ b) Für den Punkt PG (~x) := A ~ ~v i h~ x−A, ~v k~v k2 ~ ~v )| | det(~x − A, k~v k gilt: PG (~x) ∈ G, ~x − PG (~x) ⊥ ~v und k~x − PG (~x)k = d(~x, G) Der Punkt PG (~x) wird daher die Senkrechtprojektion von ~x auf G genannt. ~ + t~v ∈ G beliebig, so gilt Beweis. Ist ~y = A ~ − t~v |2 k~x − ~y k2 = k~x − A ~ 2 + t2 k~v k2 − 2th~x − A, ~ ~v i = k~x − Ak !2 ~ ~v i2 ~ h~x − A, h~x − A, ~v i 2 ~ = k~x − Ak + tk~v k − − k~v k k~v k2 2 ~ ~ 2 − h~x − A, ~v i ≥ k~x − Ak k~v k2 2.1. VEKTOREN IN DER EBENE Schreiben wir ~u := 2.1.1.3 haben wir −v2 v1 49 , so sind ~v k~v k und ~ u k~v k eine Orthonormalbasis für R2 . Aus Satz 2 2 ~ ~ ~ 2 − h~x − A, ~v i = h~x − A, ~u i k~x − Ak k~v k2 k~v k2 ~ ~u i = − det(~x − A, ~ ~v ) folgt dann die erste Behauptung. Wählen wir Zusammen mit h~x − A, ~ vi h~ x−A,~ ~ + t~v = PG (~x) und t := k~vk2 , finden wir A k~x − PG (~x)k = d(~x, G) Weiter rechnen wir nach, dass ~ ~ ~v i − h~x − A, ~ ~v i = 0 ~ − h~x − A, ~v i ~v , ~v i = h~x − A, h~x − PG (~x), ~v i = h~x − A k~v k2 Flächenberechnung 2.1.3.2 Satz. Sei P ein Parallelogramm mit Ecken A, B, C und D, wie im 50 KAPITEL 2. VEKTORRECHNUNG Bild: C D w B A v Dann hat P den Flächeninhalt ~ − A, ~ B ~ − A)| ~ F (P) = | det(D ~ + R~v . Beweis. Denn die Grundseite von P ist k~v k und seine Höhe d(D, G), wobei G = A ~ − A: ~ Dann ist aber wegen ~v = B ~ − A, ~ B ~ − A)| ~ F (P) = k~v k · d(D, G) = | det(D 2.2 Der Raum R3 2.2.1 Rechenoperationen Ähnlich wie in der Ebene beschreiben wir die Punkte des Anschauungsraumes durch Zahlentripel, die Koordinaten, also x1 P~ = x2 , x3 weshalb man den Anschauungsraum auch als den R3 bezeichnet, und definieren für die Vektoren des Raumes die entsprechenden Rechenoperationen: 0 x1 x1 x1 + x01 x1 αx1 x2 + x02 := x2 + x02 , α x2 := αx2 x3 x03 x3 + x03 x3 αx3 2.2. DER RAUM R3 51 Ebenso erklären wir den Nullvektor als denjenigen Vektor, dessen 3 Komponenten Null sind. Die Rechenregeln, die für ebene Vektoren gelten, übertragen sich sinngemäß. Definition. Gegeben seien 3 Vektoren ~v , w, ~ ~u ∈ R3 a) Wir nennen ~v , w ~ und ~u linear unabhängig, wenn gilt: Sind t, s, r ∈ R reelle Zahlen, die nicht alle gleich 0 sind, so ist auch t~v + sw ~ + r~u 6= ~0. b) Ist es möglich, Zahlen t, s, r ∈ R zu finden, welche nicht alle gleich 0 sind, aber trotzdem t~v + sw ~ + r~u = ~0 wird, so heißen ~v , w ~ und ~u linear abhängig. c) Ist ~x als ~x = t~v + sw ~ + r~u darstellbar, so bezeichnen wir ~x als Linearkombination von ~v , w ~ und ~u. Man hat im R3 die ”kanonischen” Einheitsvektoren 1 0 0 0 , ~e2 = 1 , ~e3 = 0 ~e1 = 0 0 1 Sie sind linear unabhängig, und jeder Vektor ~x ∈ R3 ist Linearkombination dieser Vektoren. Im Raum R3 haben wir den entsprechenden Satz, den man ähnlich wie Satz 2.1.1.1 zeigt: 2.2.1.1 Satz. Sind ~v , w ~ und ~u linear unabhängige Vektoren in R3 , so ist jedes ~x ∈ R3 eine Linearkombination von ~v , w ~ und ~u. Beweis. (Skizze) Es kann nicht die 1. Koordinate aller 3 Vektoren ~v , w ~ und ~u gleich0 sein, v1 sonst wären diese Vektoren linear abhängig. Wir können daher annehmen, es sei ~v = v2 v3 u1 w1 ~ und v1 6= 0. Dann sind auch ~a := w ~ − v1 ~v und b := ~u − v1 ~v linear unabhängig. Beachten wir, 0 0 ~ a2 , b = b2 als linear unabhängig im R2 anzusehen sind. Ist ~x ∈ R3 beliebig, dass ~a = a3 b3 0 x1 x e2 . Nach Satz 2.1.1.1 gibt es also t, s ∈ R mit ~x − xv11 ~v = t~a + s~b. Das so ist auch ~x − v1 ~v = x e3 bedeutet aber, dass x1 w1 u1 ~v + t( w ~ − ~v ) + s( ~u − ~v ) v v1 v1 1 x1 w1 u1 = −t −s ~v + tw ~ + s~u v1 v1 v1 ~x = Definition. Ein System {~u, ~v , w} ~ aus 3 linear unabhängigen Vektoren heißt Basis von R3 . 52 KAPITEL 2. VEKTORRECHNUNG Ein Beispiel hierzu: Wir sehen uns das folgende Dreibein mit gelenkig gelagerten Stäben an. Das Gelenk liege 0 ~ = 0 ∈ R3 , die Fußpunkte der Stäbe sind die drei in einem Punkt S mit Ortsvektor S 2 2 −1 1 ~ = 1 ,B ~ = 1 und C ~ = −2 . In S greife eine Punkte mit Ortsvektoren A 0 0 0 0 ~ 0 an. Diese Kraft soll in ihre Komponenten in Richtung der Vektoren ~xA := Kraft G = −18 ~ − S, ~ ~xB = B ~ −S ~ und ~xC = C ~ −S ~ zerlegt werden, A S x C G x C B x A B A ~ als Linearkombination von ~xA , ~xB und ~xC darstellen. Die Koeffizienten Wir müssen dazu G in der Darstellung ~ = α~xA + β~xB + γ~xC G lösen das lineare Gleichungssystem 2α − β + γ = 0 α + β − 2γ = 0 −2α − 2β − 2γ = −18 Subtrahieren der 3. von der 2. Gleichung ergibt: 3α + 3β = 18, also α + β = 6. Einsetzen in die 3. Gleichung liefert γ = 9 − α − β = 3. Die 1. und 2. Gleichung ergeben dann 2α − β = −3 2.2. DER RAUM R3 53 und α = 1, β = 5. Durch Nachrechnen überprüft man leicht, dass ~ = ~xA + 5~xB + 3~xC G Geraden und Ebenen ~ B ~ ∈ R3 verschiedene Vektoren im R3 , so beschreibt Sind A, ~ + R(A ~ − B) ~ G := A ~ und B ~ verlaufende Gerade. Analog wie früher können wir eine Gerade in wieder die durch A ”Punkt-Richtungsform” ~ + R~v G=A darstellen, wobei ~v 6= ~0. ~ B ~ und C ~ festgelegt, wenn diese Eine Ebene wird eindeutig durch Vorgabe dreier Punkte A, ~ −A ~ und C ~ −A ~ linear nicht alle auf ein und derselben Geraden liegen. Das ist der Fall, wenn B unabhängig sind. Die Ebene E durch diese 3 Punkte wird dann durch ~ + R(B ~ − A) ~ + R(C ~ − A) ~ = {A ~ + t(B ~ − A) ~ + s(C ~ − A) ~ | t, s ∈ R} E=A dargestellt. ~ und zweier Alternativ hierzu kann man eine Ebene auch durch Vorgabe eines Punktes A linear unabhängiger Richtungen ~v und w ~ beschreiben: ~ + R~v + Rw ~ + t~v + sw E=A ~ = {A ~ | t, s ∈ R} 2 2 1 3 −3 1 verlaufenden Ebene. Was ist die Beispiel. Sei E die durch , und −4 8 5 0 2 Schnittmenge zwischen E und der durch 3 und 0 verlaufenden Geraden G? 1 9 Dazu schreiben wir 2 0 2 0 0 G = 3 + R 0 − 3 = 3 + R −3 1 9 1 1 8 54 KAPITEL 2. VEKTORRECHNUNG und 2 2 E = 3 + R −3 − −4 8 2 = 3 + R −4 2 3 + R −4 0 −1 1 + R −2 −2 9 1 2 1 − 3 5 −4 Wenn 2 0 −1 α −3 + β 1 + γ −2 = ~0 , 8 −2 9 so folgt γ = 2α und β = 7α. Aus dem Vergleich der dritten Koordinaten folgt 12α = 0, also α = β = γ = 0. ~ der die Darstellungen Daher existiert genau ein Schnittpunkt S, −1 0 0 2 2 ~ = 3 + t −3 = 3 + s1 1 + s2 −2 S 9 −2 1 8 −4 hat. Es folgt 2 2 0 0 −1 2 0 −1 t −3 = 3 − 3 +s1 1 +s2 −2 = 0 +s1 1 +s2 −2 8 −4 1 −2 9 −5 −2 9 Also 2 0 −1 2 t −3 − s1 1 − s2 −2 = 0 8 −2 9 −5 Das heißt 2t + s2 = 2 −3t − s1 + 2s2 = 0 8t + 2s1 − 9s2 = −5 Aus den ersten beiden Gleichungen folgt s2 = 2 − 2t, s1 = −7t + 4. Das, in die 3. Gleichung eingesetzt, ergibt 12t = 5. Wir erhalten also 2 10 0 ~ = 3 + 5 −3 = 1 21 S 12 12 8 −28 1 2.2. DER RAUM R3 55 Skalarprodukt Analog zum Skalarprodukt im R2 definieren wir das Skalarprodukt im R3 durch h~x, ~y i := x1 y1 + x2 y2 + x3 y3 x1 y1 x2 , ~y = y2 . für ~x = x3 y3 Durch Nachrechnen bestätigt man, dass dieselben Rechenregeln wie im Fall des R2 gelten. Der Winkel α zwischen ~x und ~y ist wieder aus der Gleichung h~x, ~y i = k~xkk~y k cos α p zu berechnen, wobei wieder k~xk = h~x, ~x i sein soll. 2 −3 Beispiel. Sei α der Winkel zwischen den Vektoren ~x = 4 und ~y = −1 . Dann ist −1 11 r 21 −21 = −0.400381, =− cos α = √ √ 131 21 131 also α = 113◦ , 360 . Definition. Unter einer Orthonormalbasis von R3 verstehen wir eine Basis {~u, ~v , w} ~ des R3 , so dass alle 3 Vektoren die Länge 1 haben und paarweise senkrecht aufeinander stehen. Analog zu dem entsprechenden Satz in der Ebene haben wir: 2.2.1.2 Satz. Sind ~u, ~v , w ~ eine Orthonormalbasis des R3 , so gilt für jeden Vektor ~x ∈ R3 ~x = h~x, ~ui~u + h~x, ~v i~v + h~x, wi ~ w ~ Beweis. Denn wir können schreiben: ~x = t1~b1 + t2~b2 + t3~b3 mit geeigneten t1 , t2 , t3 ∈ R. Es folgt dann t1 = h~x, ~b1 i. Analog finden wir die behaupteten Werte für t2 und t3 . Vektorprodukt Im R3 kann aber auch noch ein vektorielles Produkt zwischen 2 Vektoren gebildet werden, wir setzen nämlich : a2 b 3 − a3 b 2 ~a × ~b = a3 b1 − a1 b3 a1 b 2 − a2 b 1 Wir beachten zuerst folgendes: 56 KAPITEL 2. VEKTORRECHNUNG 2.2.1.3 Hilfssatz. Genau dann sind ~a und ~b 6= ~0 linear abhängig, wenn ~a × ~b = ~0 ist. Beweis. Denn ist ~a = t~b mit einer Zahl t, so finden wir ~a × ~b = t~a × ~a = ~0. Umgekehrt nehmen wir an, es sei ~a × ~b = ~0. Dann haben wir a1 ~ b1 b , wenn b1 6= 0 a2 ~ ~a = b , wenn b2 6= 0 b a23~b , wenn b 6= 0 3 b3 Es gilt weiter 2.2.1.4 Hilfssatz. a) Für ~a, ~b ∈ R3 wird ~a × ~b = −~b × ~a, h~a, ~a × ~bi = 0, h~b, ~a × ~bi = 0 Weiter gilt h~a × ~b, ~ci = h~a, ~b × ~ci = −h~a × ~c, ~bi b) Angenommen, ~a und ~b seien linear unabhängig. Dann ist jeder Vektor ~v ∈ R3 , der auf ~a und ~b gleichzeitig senkrecht steht, schon ein Vielfaches von ~a × ~b. Beweis. a) Nachrechnen. a,~bi~ b) Wir setzen ~a 0 := ~a − h~ b. Da ~a × ~b 6= ~0, ist auch ~a 0 × ~b = ~a × ~b 6= ~0 und damit k~bk2 ~a 0 k~a 0 k−1 , ~bk~bk−1 und ~a × ~bk~a × ~bk−1 eine Orthonormalbasis. Wir können also schreiben: ~v = h~v , ~a 0 ik~a 0 k−2~a 0 + h~v , ~bik~bk−2~b + h~v , ~a × ~bik~a × ~bk−2~a × ~b = h~v , ~a × ~bik~a × ~bk−2~a × ~b da ja h~v , ~a 0 i = h~v , ~bi = 0 ist. Wir notieren einige Rechenregeln für dieses ”Vektorprodukt”: 2.2.1.5 Satz. Seien ~a, ~a0 , ~a00 , ~b, ~c ∈ R3 und λ ∈ R. Das Vektorprodukt hat folgende Eigenschaften: i) (~a0 + ~a00 ) × ~b = ~a0 × ~b + ~a00 × ~b und ~a × (~b 0 + ~b 00 ) = ~a × ~b 0 + ~a × ~b 00 ii) λ(~a × ~b) = (λ~a) × ~b = ~a × (λ~b) iii) k~a × ~bk2 = k~ak2 k~bk2 − h~a, ~bi2 . Schließen also ~a und ~b den Winkel φ ein, so ist k~a × ~bk = k~akk~bk| sin φ| 2.2. DER RAUM R3 57 Beweis. i), ii) rechnet man einfach nach. Zu iii). Es gilt k~ak2 k~bk2 = (a21 + a22 + a23 )(b21 + b22 + b23 ) = (a1 b1 )2 + (a2 b2 )2 + (a3 b3 )2 +(a1 b2 )2 + (a2 b1 )2 +(a1 b3 )2 + (a3 b1 )2 + (a2 b3 )2 + (a3 b2 )2 und h~a, ~bi2 = (a1 b1 )2 + (a2 b2 )2 + (a3 b3 )2 +2(a1 b2 )(a2 b1 ) + 2(a1 b3 )(a3 b1 ) + 2(a2 b3 )(a3 b2 ) Subtrahieren wir beide Gleichungen voneinander, finden wir k~ak2 k~bk2 − h~a, ~bi2 = (a1 b2 )2 + (a2 b1 )2 + (a1 b3 )2 + (a3 b1 )2 + (a2 b3 )2 + (a3 b2 )2 −2(a1 b2 )(a2 b1 ) − 2(a1 b3 )(a3 b1 ) − 2(a2 b3 )(a3 b2 ) = (a2 b3 − a3 b2 )2 + (a3 b1 − a1 b3 )2 + (a1 b2 − a2 b1 )2 = k~a × ~bk2 3 −2 Beispiele. 1) Das Vektorprodukt von −6 mit 4 ist gegeben durch: −1 −1 10 −6 4 ~e1 − 3 −2 ~e2 + 3 −2 ~e3 = 5 ~a × ~b = −1 −1 −1 −1 −6 4 0 2) Physikalische Anwendung. In der Physik definiert man den Drehimpuls eines Teilchens als das Vektorprodukt aus Ortsvektor ~r und Impulsvektor p~: ~ = ~r × p~ L Greift an das Teilchen die Kraft F~ an, so definiert man das Drehmoment als das Vektorprodukt ~ = ~r × F~ . M ~ Auf ein Teilchen mit der Ladung q, das sich mit der Geschwindigkeit ~v in einem Magnetfeld B bewegt, wirkt die Lorentzkraft ~ F~ = q ~v × B 58 KAPITEL 2. VEKTORRECHNUNG ein. axb b φ a Beispiel: Die Vektoren 3 2 −11 ~v1 = 4 , ~v2 = 7 , ~v3 = 1 −2 −1 1 8 sind wegen ~v2 × ~v3 = 9 und 79 3 8 h 4 , 9 i = −98 −2 79 linear unabhängig. 2.2.1.6 Satz. Folgende Aussagen über die 3 Vektoren ~a, ~b, ~c sind äquivalent: i) h~a, ~b × ~ci = 0, ii) ~a, ~b, ~c sind linear abhängig 2.2. DER RAUM R3 59 Beweis. Ist ~a = t~b + s~c eine Linearkombination von ~b und ~c, so h~a, ~b ×~ci = th~b, ~b ×~ci + sh~c, ~b × ~ci = 0. Ist ~b = t~a + s~c, so ist h~a, ~b × ~ci = h~a, (t~a + s~c) × ~ci = 0. Analoges gilt, wenn ~c = t~a + s~b. Angenommen, es sei h~a, ~b × ~ci = 0 und weiter seien ~b und ~c linear unabhängig. Dann haben wir ~a = t~b + s~c + r~b × ~c Es folgt 0 = h~a, ~b × ~ci = rk~b × ~ck2 , also schon r = 0 und damit ~a = t~b + s~c, so dass ~a, ~b, ~c linear abhängig sein müssen. 2.2.1.7 Hilfssatz. Angenommen, G1 = P~1 + R~v1 und G2 = P~2 + R~v2 seien zwei Geraden. a) Wenn dann hP~1 − P~2 , ~v1 × ~v2 i = 6 0, so ist G1 ∩ G2 = ∅ und G1 verläuft nicht parallel zu G2 . (G1 und G2 liegen ”windschief” zueinander). b) Wenn hP~1 − P~2 , ~v1 × ~v2 i = 0, so liegen G1 und G2 parallel oder G1 ∩ G2 6= ∅. ~ ∈ G1 ∩ G2 , Beweis. a) Angenommen, es sei hP~1 − P~2 , ~v1 × ~v2 i = 6 0. Gäbe es einen Punkt S also wäre mit passenden Parametern λ, µ ∈ R : ~ = P~1 + λ~v1 = P~2 + µ~v2 S Das heißt aber: P~1 − P~2 = −λ~v1 + µ~v2 wäre dann Linearkombination von ~v1 und ~v2 , hP~1 − P~2 , ~v1 × ~v2 i = 0, Widerspruch! b) Wenn hP~1 − P~2 , ~v1 × ~v2 i = 0, so gilt mit Koeffizienten α, β, γ, die nicht alle verschwinden: α(P~1 − P~2 ) + β~v1 + γ~v2 = 0 Wenn nun α 6= 0, ist γ β P~1 + ~v1 = P~2 − ~v2 = 0 α α Ist aber α = 0, so liegen G1 und G2 zueinander parallel und G1 = G2 , wenn P~1 ∈ G2 . Anderenfalls ist G1 ∩ G2 = ∅. 60 KAPITEL 2. VEKTORRECHNUNG Im folgenden Bild liegen G1 und G2 zueinander windschief. G 1 90 o G 2 1 1 3 Beispiel. Wo schneiden sich die Ebenen E = −2 + R 0 + R −4 und die −1 1 3 0 3 −1 Ebene E 0 durch die Punkte −2 , 0 und 2 ? 5 −1 0 0 Wir schreiben E in der Form E0 0 = −2 + R 5 0 = −2 + R 5 3 0 −1 0 0 − −2 + R 2 − −2 −1 5 0 5 3 −1 2 4 +R −6 −5 Sei 3 −1 14 2 ~ν = 2 × 4 = 21 = 7 3 −6 −5 14 2 2.3. PROJEKTIONEN, ABSTÄNDE UND VOLUMINA 61 ~ ∈ E ∩ E 0 gibt es λ, λ0 , µ, µ0 ∈ R mit Für jeden Punkt S 1 1 3 0 3 −1 ~ = −2 + λ 0 + µ −4 = −2 + λ0 2 + µ0 4 S 3 −1 1 5 −6 −5 Es folgt 3 −1 1 3 0 1 λ 0 + µ −4 = −2 − −2 +λ0 2 + µ0 4 −6 −5 −1 1 5 3 {z } | −1 = 0 2 Wir bilden das Skalarprodukt mit ~ν und finden 1 3 −1 −28µ = λh 0 , ~ν i + µh −4 , ~ν i = h 0 , ~ν i = 14 −1 1 2 Das bedeutet aber µ = −2 und damit E ∩ E0 2.3 2.3.1 1 1 3 = { −2 + λ 0 − 2 −4 | λ ∈ R} 3 −1 1 −5 1 = 6 + R 0 1 −1 Projektionen, Abstände und Volumina Projektionen und Abstandsberechnung Projektion eines Vektors auf eine Richtung Ist eine Richtung G := R~v vorgegeben, so definieren wir für einen Vektor ~x ∈ R3 die Projektion in Richtung ~v als h~x, ~v i ~v ~x~v = k~v k2 62 KAPITEL 2. VEKTORRECHNUNG Da dann h~x − ~x~v , ~v i = 0 gilt, nennen wir ~x~v auch die Senkrechtprojektion von ~x auf ~v . x v PG ( x ) Die Länge von ~x − ~x~v ist dann s k~x − ~x~v k = k~xk2 − h~x, ~v i2 k~x × ~v k = 2 k~v k k~v k Projektion eines Punktes auf eine Ebene Definition. Es sei E eine Ebene. Ist dann ~x ∈ R3 , so sei der Projektionspunkt pE (~x) von p~ auf E derjenige Punkt in der Ebene E, für welchen ~x − pE (~x) auf E senkrecht steht. Wir berechnen den Projektionspunkt pE (~x). ~ + R~v1 + R~v2 mit linear unabhängigen Richtungsvektoren ~v1 , ~v2 . Dazu schreiben wir E = A Dann haben wir mit geeigneten Zahlen t, λ und µ: ~ + λ~v1 + µ~v2 ~x + t~v1 × ~v2 = pE (~x) = A also ~ − ~x + λ~v1 + µ~v2 . t~v1 × ~v2 = pE (~x) − ~x = A Wir bilden das Skalarprodukt mit ~n := ~v1 × ~v2 und erhalten ~ − ~x, ~ni tk~nk2 = hA und damit pE (~x) = ~x + ~ − ~x, ~ni hA ~ − ~x)~n . ~n = ~x + (A k~nk2 2.3. PROJEKTIONEN, ABSTÄNDE UND VOLUMINA 63 Projektion einer Geraden auf eine Ebene ~ + λ~v | λ ∈ R} und eine Ebene Definition. Gegeben sei eine Gerade in der Form G = {B ~ + R~v1 + R~v2 . Dann wollen wir unter der Projektion GE von G auf E die Bildmenge E = A pE (G) = {pE (~x) | ~x ∈ G} verstehen. Was entsteht bei der Projektion von G auf E? Ist λ ∈ R beliebig, so finden wir ~ ~ ~ + λ~v ) = B ~ + λ~v + hA − B − λ~v , ~ni ~n pE (B k~nk2 ~ ~ ~ + hA − B, ~ni ~n + λ(~v − h~v , ~ni ~n) = B k~nk2 k~nk2 ~ + λ(~v − ~v~n ) = pE (B) Somit ist GE = {~p}, wenn ~v ⊥ E (äquivalent mit ~v = ~v~n ) und eine Gerade, wenn ~v 6= ~v~n . ~ Die Projektionsgerade kann man aber auch so bestimmen: Wenn nicht schon pE (P~ ) = pE (Q) ~ ~ ~ ~ ist nimmt man 2 Punkte P , Q ∈ G und berechnet die Gerade durch pE (P ) und pE (Q). Abstand eines Punktes von einer Geraden ~ + R~v eine Gerade und P~ ein Punkt. Dann ergibt dieselbe Rechnung, die wir im Sei G = A Falle eines Punktes und einer Geraden in der Ebene angestellt haben, auf 2 ~ ~ ~ 2 − k(P~ − A) ~ ~v k2 = kP~ − Ak ~ 2 − |hP − A, ~v i| d(P~ , G)2 = kP~ − Ak k~v k2 also q ~ 2 − k(P~ − A) ~ ~v k2 = d(P~ , G) = kP~ − Ak s ~ 2− kP~ − Ak ~ ~v i|2 |hP~ − A, k~v k2 Das gilt für Geraden im R2 und im R3 . Im letzteren Fall lässt sich der Ausdruck für d(P~ , G) noch etwas weiter umformen, und zwar in d(P~ , G) = ~ × ~v k k(P~ − A) . k~v k Abstand eines Punktes von einer Ebene 2.3.5 Hilfssatz . Sei E eine Ebene, so ist für einen beliebigen Punkt P~ ∈ R3 kP~ − ~xk2 ≥ kP~ − pE (P~ )k2 , wenn ~x ∈ E. 64 KAPITEL 2. VEKTORRECHNUNG Beweis. In der Tat ist für jedes ~x ∈ E: kP~ − ~xk2 = kP~ − pE (P~ ) − (~x − pE (P~ ) )k2 = k~x − pE (P~ )k2 + k~p − pE (P~ ) )k2 , da P~ − pE (P~ ) ⊥ E, und ~x − pE (P~ ) parallel zu E, ≥ kP~ − pE (P~ )k2 ~ Wir bezeichnen den kleinsten Wert, den kP − ~xk haben kann, wenn ~x die Punkte aus E durchläuft, als den Abstand d(P~ , E) von P~ zu E. 2.3.6 Satz. Ist eine Ebene E in Punkt-Richtungsform gegeben, also ~ + λ~v1 + µ~v2 | λ, µ ∈ R}, E = {A so gilt für den Abstand eines beliebigen Punktes P~ ∈ R3 von der Ebene: d(P~ , E) = ~ ~v1 × ~v2 i| |hP~ − A, . k~v1 × ~v2 k Beweis. Mit der Formel für pE (P~ ) folgt: ~ ~v1 × ~v2 i| ~ ~v1 × ~v2 i| |hP~ − A, |hP~ − A, k~ v × ~ v k = . kP~ − pE (P~ )k = 1 2 k~v1 × ~v2 k2 k~v1 × ~v2 k 3 1 −5 Beispiele. Der Punkt P~ = −4 hat von der Geraden G durch 0 und 2 den 1 4 7 Abstand 2 −6 −6 k −4 × 2 k k 12 k −3 3 −20 2√ d= = 145 = 7 7 −6 k 2 k 3 2 1 5 Gegeben sei die Ebene E durch die Punkte −5 , 6 und −1 . Dann ist also 1 8 1 2.3. PROJEKTIONEN, ABSTÄNDE UND VOLUMINA 65 2 −2 4 E = −5 + R 11 + R −7 und damit der Abstand von P~ zu E gleich 1 7 −7 3 14 E 2 −2 4 D 1 D E 1 −4 − −5 , 11 × −7 21 , 0 1 15 1 7 −7 35 =√ = d= 4 862 −2 14 11 × −7 21 7 15 −7 2.3.2 Anwendung auf die Berechnung von Flächen und Volumina Fläche eines Parallelogramms Hier ist eine Anwendung auf das Problem der 2.3.1 Satz. Sind die Vektoren ~a und ~b linear unabhängig, so hat das von ihnen aufgespannte Parallelogramm den Flächeninhalt A = k~a × ~bk. a h α 0 b Beweis. Wir arbeiten in der Ebene E = R~a + R~b. Es gilt A = k~bk · h = k~bkk~ak| sin α| = k~a × ~bk. 4 3 ~ = 7 , B ~ = −2 und C ~ = Beispiel. Gegeben sei ein Dreieck mit den Ecken A 4 7 1 2 . −2 Was ist sein Flächeninhalt? −1 ~ −A ~ = −9 und Die ”aufspannenden Seiten” für das Dreieck sind ~x = B 3 66 KAPITEL 2. VEKTORRECHNUNG −3 −1 −3 69 ~ −A ~ = −5 . Dann erhalten wir ~x × ~y = −9 × −5 = −15 . Der ~y = C −6 3 −6 −22 1 Flächeninhalt des Dreiecks ist somit gleich 2 k~x × ~y k = 36, 97. Anwendung auf Volumenberechnungen: 2.3.2 Satz. Sind ~a, ~b und ~c linear unabhängig, so gilt: a) Das Parallelotop mit Kanten ~a, ~b und ~c hat das Volumen V0 = |h~a, ~b × ~ci|. b) Die Pyramide mit dem von ~b und ~c erzeugten Parallelogramm als Grundfläche und der Spitze ~a hat das Volumen VP = 31 V0 . c) Das Tetraeder mit den Kanten ~a, ~b und ~c hat das Volumen 1 VT = V0 . 6 Beweis. a) Denn seine Grundfläche ist F = k~b × ~ck und seine Höhe h gleich dem Abstand ~ B ~ und D ~ liegen, also h = |h~a, ~b × ~ci|/k~b × ~ck. Das ergibt von ~c zur Ebene V , in der die Punkte A, zusammen mit V0 = F · h die Behauptung. b) folgt aus a). Zu c): C D a E c A B b 2.3. PROJEKTIONEN, ABSTÄNDE UND VOLUMINA Die Pyramide mit Ecken A, B, C, D und E hat das Volumen V1 = 13 V0 , was gerade doppelte von VT ist. 3 1 2 −3 ~ = 2 , B ~ = 0 ,C ~ = 2 und D ~ = 1 , so hat Beispiel: Sind A 4 −1 1 4 1 ~ ..., D ~ das Volumen VT = V0 , mit Tetraeder mit Ecken A, 6 −1 −6 E D −2 −3 D −2 ~ ~ ~ ~ ~ ~ −2 , 0 −2 , 18 V0 = |hB−A, (C−A)×(D−A)i| = × −1 = −5 −3 0 −5 1 Also VT = 35 6 = 5.838 67 das das E 68 KAPITEL 2. VEKTORRECHNUNG 2.3.3 Anhang: Determinanten Folgendes technisches Hilfsmittel eignet sich zur schnellen Klärung der Frage, ob Vektoren linear unabhängig sind. Definition. Man definiert 3 × 3-Matrizen als Schema mit 3 Zeilen und Spalten, also a1 b 1 c 1 A = a2 b 2 c 2 a3 b 3 c 3 Wir wollen mit Determinanten solcher Matrizen rechnen. a1 b 1 c 1 a2 b2 c2 eine Matrix, so setzen wir Definition. Ist A = a3 b 3 c 3 a1 b 1 c 1 det A := a2 b2 c2 = h~a, ~b × ~ci a3 b 3 c 3 b2 c 2 b1 c 1 b 1 c1 − a2 = a1 b 3 c 3 + a3 b 2 c 2 b3 c 3 = a1 b2 c3 + b1 c2 a3 + c1 a2 b3 − c1 b2 a3 − a1 c2 b3 − b1 a2 c3 Die Berechnung der Determinante verläuft nach der (Regel von Sarrus): Man schreibt die drei Spalten von A hintereinander und dann dahinter nochmals die ersten beiden Spalten von A : a1 b 1 c 1 a1 b 1 a2 b2 c2 a2 b2 a3 b 3 c 3 a3 b 3 Man zieht 3 Diagonalen, die von links oben nach rechts unten gehen. Die auf jeder dieser Diagonalen liegenden Zahlen werden multipliziert und die entstehenden 3 Produkte addiert. Dann ziehen wir 3 weitere Diagonalen, die von links unten nach rechts oben verlaufen, multiplizieren wieder die auf jeder von ihnen liegenden Zahlen und subtrahieren die entstandenen 3 Produkte. Mit Hilfe der Determinante können wir lineare Unabhängigkeit 3er Vektoren ~ a, ~b und ~c überprüfen: Genau dann ist det(~a, ~b, ~c ) 6= 0, wenn ~a, ~b und ~c linear unabhängig sind. Beispiel. Die Matrix 23 7 −8 A = 12 −3 −11 4 3 10 2.3. PROJEKTIONEN, ABSTÄNDE UND VOLUMINA hat die Determinante 69 −1463. Das finden wir mit der Sarrusregel. det A = 23 · (−3) · 10 + 7 · (−11) · 4 + (−8) · 12 · 3 −(−8) · (−3) · 4 − 23 · (−11) · 3 − 7 · 12 · 10 = −690 − 308 − 288 − 96 + 759 − 840 = −1463 Wir sehen, dass im Laufe der Rechnung manchmal ”unhandlich große” Zahlen vorkommen. (Das wird erst recht zu erwarten sein, wenn die Einträge der Matrix komplizierter werden). Einfache Umformungsregeln für die Berechnung der Determinante sind also wünschenswert. Zunächst beobachten wir, dass durch geschicktes Umformen der Determinantenformel folgende neue Ausdrücke für die Determinante zu finden sind: 2.3.3.1 Hilfssatz. a) Sei A = (~a, ~b, ~c ) eine 3 × 3- Matrix mit den Spalten ~a, ~b und ~c. Dann gilt, wenn eine der Spalten von A der Nullvektor ist, so ist det(A ) = 0. b) Vertauschen wir in A irgendwelche 2 Spalten, so ist die Determinante der entstandenen Matrix gerade − det(A ), also z.B.: det(~b, ~a, ~c) = − det(A ). c) Ist ~a 0 ein Vektor, so ist det(~a + ~a 0 , ~b, ~c ) = det(~a, ~b, ~c ) + det(~a 0 , ~b, ~c ) Ist λ ∈ R ein Skalar, so folgt det(λ~a, ~b, ~c ) = λ det(~a, ~b, ~c ) und det(~a + λ~b + µ~c, ~b, ~c ) = det(~a, ~b, ~c ) Addiert man also zur ersten Spalte eine Linearkombination der anderen Spalten, so ändert sich die Determinante der Matrix nicht. d) Entsprechendes gilt bezüglich der 2. bezw. 3. Spalte. Beweis. a) und b) folgen sofort aus der Sarrusregel, ebenso c). Auch d) folgt jetzt leicht: det(~a + λ~b + µ~c, ~b, ~c ) = det(~a, ~b, ~c ) + det(λ~b, ~b, ~c ) + det(µ~c, ~b, ~c ) = det(~a, ~b, ~c ) + λ det(~b, ~b, ~c ) + µ det(~c, ~b, ~c ) = det(~a, ~b, ~c ) 70 KAPITEL 2. VEKTORRECHNUNG Beispiel. 4 2 19 3 7 11 4 3 10 4 2 3 0 2 = 3 7 −1 = −11 7 4 3 −6 −2 3 −11 13 + 7 −11 = −2 −2 −2 0 3 0 2 7 −1 = −11 7 13 −6 −2 3 0 7 = −52 − 7 · 19 = −185 3 Cramerregel Sind nun 3 Vektoren als linear unabhängig erkannt, so kann man jeden weiteren Vektor als Linearkombination von diesen darstellen. Jetzt wollen wir aber auch die benötigten Koeffizienten bestimmen. Dazu können wir etwa benützen wir Determinanten zur Lösung linearer Gleichungssysteme mit 3 Variablen. Das Ergebnis, die Cramerregel, ist eine Verallgemeinerung der Cramerregel für 2 Variablen: 2.3.3.2 Satz. Ist ein lineares Gleichungssystem in der Form a11 x1 + a12 x2 + a13 x3 = t1 a21 x1 + a22 x2 + a23 x3 = t2 a31 x1 + a32 x2 + a33 x3 = t3 a11 a12 a13 mit der Matrix A = a21 a22 a23 gegeben und ist det A 6= 0, so gibt es genau eine Lösung a31 a32 a33 x1 ~x = x2 des Gleichungssystems, nämlich x3 t1 a12 a13 t2 a22 a23 t3 a32 a33 x1 = det A a11 t1 a13 a21 t2 a23 a31 t3 a33 , x2 = det A a11 a12 t1 a21 a22 t3 a31 a32 t3 , x3 = . det A Beweis. Der Beweis geschieht durch (geduldiges) Nachrechnen. z1 Es kann aber auch keine weitere Lösung geben. Ist nämlich ~y eine Lösung, so erfüllt ~z := z2 := z3 ~x − ~y die Bedingungen: a11 z1 + a12 z2 + a13 z3 = 0 a21 z1 + a22 z2 + a23 z3 = 0 a31 z1 + a32 z2 + a33 z3 = 0 2.3. PROJEKTIONEN, ABSTÄNDE UND VOLUMINA 71 oder äquivalent a11 a12 a13 a21 z1 + a22 z2 + a23 z3 = ~0 a31 a32 a33 Da aber det A 6= 0, sind die Spalten von A linear unabhängig, also bleibt nur z1 = z2 = z3 = 0, d.h. ~y = ~x. Beispiel. Wir sehen uns die 3 Vektoren −2 12 −6 ~v1 = −1 , ~v2 = −1 , ~v3 = 0 3 4 9 an. Frage: Erzeugen diese 3 Vektoren den ganzen Raum? Dazu bilden wir die Matrix −2 12 −6 A = −1 −1 0 3 4 9 Ihre Determinante ist −1 0 det(A ) = (−2) 4 9 12 −6 + 3 12 −6 = 18 + 132 − 18 = 132 + −1 0 4 9 Die gegebenen Vektoren sind daher linear unabhängig. 4 Der Vektor ~v = 2 lässt sich als Linearkombination der Spalten von ~v1 , ~v2 und ~v3 schreiben, 11 also ~v = α~v1 + β~v2 + γ~v3 Die Koeffizienten sind nun und 4 12 −6 2 −1 0 11 4 9 366 61 =− =− α= det A 132 22 −2 4 −6 −1 2 0 3 11 9 102 17 β= = = det A 132 22 −2 12 4 −1 −1 2 3 4 11 238 119 γ= = = det A 132 66 Also ~v = − 61 17 119 ~v1 + ~v2 + ~v3 22 22 66 72 KAPITEL 2. VEKTORRECHNUNG Kapitel 3 Lineare Gleichungssysteme Beispiele 1) Schwingungsgleichung. In der Technik (elektrische Wechselstromkreise, gekoppelte Schwingungen) wird am auf sog. Differenzialgleichungen der Form y 00 + a(t)y 0 + b(t)y = f (t) geführt, wobei f, a und b ”vernünftige” Funktionen bedeuten. Gesucht ist die Gesamtheit aller Funktionen, die diese Gleichung lösen. Ein Ansatz ist die ”Diskretisierung”, d.h.: Man unterteilt das Definitionsintervall in äquidistante Teilpunkte t0 < t1 < ... < tn und ersetzt y durch die Werte yi = y(ti ), mit i = 0, ..., n und y 0 durch yi+1 − 2yi + yi−1 yi+1 − yi und y 00 durch . Dabei sei h = ti+1 − ti . Setzt man das in die Differenzialgleih h2 chung ein, erhält man yi+1 + yi−1 − 2yi + ai hyi+1 − ai hyi + h2 bi yi = fi , i = 1, ..., n − 1 Dabei ist ai = a(ti ), analog für bi und fi . Ordnen wir das nach den i-Werten, so finden wir yi−1 − (2 − ai h − bi h2 )yi + (1 + ai h)yi+1 = fi , i = 1, ..., n − 1 Für n = 5 wird daraus y0 − (2 − a1 h − b1 h2 )y1 + (1 + a1 h)y2 = f1 y1 − (2 − a2 h − b2 h2 )y2 + (1 + a2 h)y3 = f2 y2 − (2 − a3 h − b3 h2 )y3 + (1 + a3 h)y4 = f3 y3 − (2 − a4 h − b4 h2 )y4 + (1 + a4 h)y5 = f4 Das sind 4 lineare Gleichungen für die 6 Variablen y0 , ..., y5 . 73 74 KAPITEL 3. LINEARE GLEICHUNGSSYSTEME 2) Lineare Optimierung. In einem Unternehmen wurde die Produktion einer verlustbringenden Produktionslinie eingestellt. Hierdurch wurden 70 Maschinenstunden für eine Fräsmaschine, 21 Stunden für eine Drehbank und 48 Stunden für eine Schleifbank frei. Es sollen nun drei neue Produkte hergestellt werden, die wir A, B und C nennen wollen. Folgende Anzahl von Maschinenstunden werden pro Woche benötigt: Maschinentyp Produkt A Produkt B Produkt C Fräsmaschine 2 5 4 Drehbank 1 1 2 Schleifbank 3 1 2 Produkt A bringe 200 EUR Gewinn (je Einheit), B bringe 100 EUR Gewinn, bei C seien es 50 EUR (je Einheit). Wie viele Einheiten von A, B und C muss man produzieren, um maximalen Gewinn zu machen, wenn das Unternehmen davon ausgeht, dass von B und C maximal 10 Einheiten pro Woche und von A beliebig viele Einheiten verkauft werden können? Sei x1 die Anzahl der produzierten Einheiten zu Produkt A, x2 die Anzahl der produzierten Einheiten zu Produkt B und x3 die Anzahl der produzierten Einheiten zu Produkt C. Dann unterliegen x1 , x2 und x3 wegen der begrenzten Maschinenkapazitäten gewissen Einschränkungen. Im Einzelnen: i) x2 ≤ 10, da man einplant, pro Woche höchsten 10 Einheiten von B verkaufen zu können, ii) x3 ≤ 10, da man einplant, pro Woche höchsten 10 Einheiten von C verkaufen zu können, iii) 2x1 + 5x2 + 4x3 ≤ 70 (Bilanz für die Fräsmaschine) iv) x1 + x2 + 2x3 ≤ 21 (Bilanz für die Drehbank) v) 3x1 + x2 + 2x3 ≤ 48 (Bilanz für die Schleifbank) x1 Sei S die Menge der x2 , die i) -iv) erfüllen. Dann wird also der Punkt ~x0 ∈ S gesucht, für den x3 200x1 + 100x2 + 50x3 unter allen Punkten aus S den maximalen Wert annimmt. Eine Technik zur Behandlung dieses Problems ist dass ein lineares Gleichungssystem entsteht, nämlich 0 1 0 1 0 0 0 0 0 1 0 1 0 0 2 5 4 0 0 1 0 1 1 2 0 0 0 1 3 1 2 0 0 0 0 etwa, weitere Variable x4 , ..., x8 einzuführen, so 0 0 0 0 1 ~x = 10 10 70 21 48 Sei nun S1 der Durchschnitt von S 0 := {~x ∈ R8 | x1 , ..., x8 ≥ 0} mit der Lösungsmenge dieses linearen Gleichungssystems. Anschaulich ist dies ein (unregelmäßiges) Polyeder. Der gesuchte Punkt ~x0 ist einer der Punkte von S1 . (Bei nur 2 Variablen löst man das Optimierungsproblem graphisch, aber entsprechende Probleme mit mehr als 3 Produkten geht man ebenso mit der oben angedeuteten Methode an). In der Realität, etwa in der Strömungslehre (Navier-Stokes-DGL’s, Flugzeugbau, Wetterprognose) oder bei Kosten-Nutzenrechnungen ist n viel größer. 3.1. MATRIXKALKÜL 3.1 75 Matrixkalkül Jedes Gleichungssystem in den Unbekannten x1 , ..., xn lässt sich in der Form a11 x1 + a12 x2 + · · · + a1n xn = b1 a21 x1 + a22 x2 + · · · + a2n xn = b2 .. . ad1 x1 + ad2 x2 + · · · + adn xn = bd schreiben, wobei d und n natürliche Das Zahlenschema a11 , a21 , a31 , A = . . . ad1 , ganze Zahlen und aij ∈ R und b1 , ..., bd ∈ R vorgegeben sind. a12 , a22 , a32 , . . . ad2 , , , , . . . , ..., ..., ..., . . . ..., a1n a2n a3n . . . adn =: (aij ) i = 1, ..., d j = 1, ..., n wird als Koeffizientenmatrix des Gleichungssystems bezeichnet. Fragen: a) Welche Bedingungen müssen A und der Vektor b1 b2 ~b = .. . bd erfüllen, damit es eine Lösung ~x gibt? b) Angenommen, wir haben eine Lösung. diese? Beispiel: Zu a) Ist etwa 1 4 A = 0 2 0 4 Welche weiteren Lösungen gibt es und wie finden wir 3 1 1 und ~b = 2 , 2 3 so gibt es keine Lösung. 1 −5 Zu b) Ist A wie eben und ~b = 2 , so gibt es die Lösung ~x0 = 0 . Doch das ist nicht die 4 2 2 einzige Lösung: Weitere Lösungen sind etwa ~x0 + λ 1 , für beliebiges λ ∈ R. −2 Wir entwickeln nun einen Kalkül für lineare Gleichungssysteme, der es ermöglicht 76 KAPITEL 3. LINEARE GLEICHUNGSSYSTEME • zu entscheiden, ob eine Lösung existiert, • alle Lösungen auszurechnen Dazu führen wir das Rechnen mit Matrizen ein: Zwei natürliche Zahlen d und n seien gegeben. Dann ein Schema a11 , a12 , . . . , . . . , a1n a21 , a22 , . . . , . . . , a2n a31 , a32 , . . . , . . . , a3n . . . . A = . . . . . . . . . . . ad1 , ad2 , . . . , . . . , adn verstehen wir unter einer (d × n)-Matrix A =: (aij )1≤i≤d, 1≤j≤n bestehend aus d Zeilen und n Spalten reeller Zahlen. Sie bilden eine Menge, die wir mit M (d, n) a1j bezeichnen. Ist A eine Matrix, so bezeichnen wir den Vektor Sj (A ) := ... als den j.ten Spaltenadj vektor und Zi (A ) := (ai1 , ..., ain ) als i.ten Zeilenvektor von A . x1 Eine Matrix A ∈ M (d, n) kann mit einem Vektor ~x = ... multipliziert werden. Das Ergebnis xn ist A · ~x = a11 x1 + a12 x2 + · · · + a1n xn a21 x1 + a22 x2 + · · · + a2n xn .. . n X Sj (A ) · xj ∈ Rd = j=1 ad1 x1 + ad2 x2 + · · · + adn xn Ein Beispiel dazu: 4 3 −1 4 2 4 2 14 2 3 1 −1 −1 = 0 1 2 0 0 −1 Wir notieren folgende Rechenregel: 3.1.1 Hilfssatz. Für jede Matrix A ∈ M (d, n), alle Vektoren ~x, ~y ∈ Rn und Skalare λ, µ gilt A (λ~x + µ~y ) = λA ~x + µA ~y 3.1. MATRIXKALKÜL 77 Beweis. Nachrechnen. Jedes Gleichungssystem mit Koeffizientenmatrix A und rechter Seite ~b lässt sich jetzt in der Form schreiben: A · ~x = ~b Definition (Matrixprodukt). Sind B ∈ M (d, n) und B ∈ M (n, k) Matrizen, so sei A · B diejenige Matrix aus M (d, k), deren Spalten gerade A · S1 (B), ..., A · Sk (B) sind. Beispiel Es gilt 2 3 1 61 −1 12 1 5 4 −2 7 4 1 −7 17 3 a) 2 0 −1 3 · 5 −5 2 = −26 53 −12 1 2 −8 1 −2 2 1 1 5 4 −2 2 3 1 b) Das Produkt 2 0 −1 3 · 7 4 1 ist dagegen nicht definiert, da die rechts 1 2 −8 1 5 −5 2 stehende Matrix nicht soviele Zeilen hat, wie die linke Matrix Spalten besitzt. Für die Matrixmultiplikation gelten folgende Regeln: 3.1.2 Satz. Sind A ∈ M (d, n), B ∈ M (n, k) und C ∈ M (k, s) Matrizen, so haben wir das Assoziativgesetz (A · B) · C = A · (B · C ) und für S ∈ M (n, k) das Distributivgesetz A · (B + S ) = A · B + A · S Mit En bezeichnen wir diejenige Matrix 1 anderen Einträge 0 sind. (Beispiel E3 = 0 0 aus 0 1 0 M (n, n), in deren Diagonalen 1 steht, während alle 0 0 ).Dann ist A · En = A . Analog gilt Ed · A = A . 1 Zeilenvektoren. Man arbeitet zweckmäßigerweise manchmal auch mit Zeilenvektoren: x = (x1 , ..., xn ) Die Menge der Zeilenvektoren bezeichnen wir mit Rn . Die Begriffe ”Linearkombination” und ”linear unabhängig ” bzw. ”Unterraum” haben die entsprechende Bedeutung. Definition. Ist A ∈ M (d, n), so ist der Spaltenraum SR(A ) als SR (A ) := Lin (S1 (A ), ..., Sn (A )) 78 KAPITEL 3. LINEARE GLEICHUNGSSYSTEME und der Rang als rg(A ) := dim SR (A ) definiert. Es folgt jetzt, dass das Gleichungssystem genau dann lösbar ist, wenn ~b ∈ SR (A ). Das bedeutet, dass SR (A , ~b) = SR (A ) und letzteres ist mit rg (A , ~b) = rg (A ) äquivalent 3.2 3.2.1 Das Eliminationsverfahren von Gauß Die Zeilenstufentransformation einer Matrix Zunächst gilt es zu klären ob ein lineares Gleichungssystem mit vorgegebenen A ·~x = ~b A ∈ M (d, n) und ~b ∈ Rd lösbar ist. Dazu werden bestimmte Umformungen an der ”erweiterten Matrix” (A , ~b) vorgenommen, nämlich die elementare Zeilenumformungen: • Vertauschen der i.-ten und j.ten Zeile, • Addieren eines Vielfachen der i.-ten Zeile zur j.ten Zeile, wobei j 6= i. • Multiplizieren einer Zeile mit einer Zahl λ 6= 0 Elementare Zeilenumformungen lassen sich rückgängig machen, da jede Zeilenumformung durch eine geeignete andere wieder aufgehoben werden kann. Daraus resultiert der folgende einfache aber auch wichtige 3.2.1.1 Hilfssatz. Gegeben sei einlinearesGeichungssystemA · ~x = ~b mit einer Matrix A ∈ M (d, n) d ∗ ∗ und ~b ∈ R . Geht dann die Matrix A , ~b aus der Matrix A , ~b durch Zeilenoperationen hervor, so gilt (a) Der Vektor ~x ist genau dann Lösung zu A ~x = ~b , (1) wenn ~x das System 3.2. DAS ELIMINATIONSVERFAHREN 79 A ∗ ~x = ~b∗ (2) löst. (b) Es gilt rg (A , ~b) = rg (A ∗ , ~b∗ ). (c) Genau dann ist das Gleichungssystem lösbar, wenn rg (A ∗ , ~b∗ ) = rg (A ∗ ) gilt. Das systematische Verfahren zur Klärung der Frage, ob und gegebenenfalls welche Lösungen ein gegebenes lineares Gleichungssystem hat, wird auch Gauß - Algorithmus oder Eliminationsverfahren genannt. Dieses Verfahren sehen wir uns jetzt an: Angenommen, es sei A = ~ eine Matrix und b = b1 b2 .. . a11 , a21 , a31 , .. . .. . ad1 , a12 , a22 , a32 , .. . .. . ad2 , ... ... ... ... ... ... ... ... ... ... ... ... a1n a2n a3n .. . .. . adn ein Vektor. bd Dann schreiben wir die erweiterte Matrix (A | ~b ) an, also a11 , a12 , . . . ... a21 , a22 , . . . a31 , a32 , . . . . .. A |~b = . ... .. . .. . . ... . ad1 , ad2 , . . . ... ... ... ... ... a1n a2n a3n .. . .. . adn b1 b2 b3 .. . .. . bd Soll x1 in dem Gleichungssystem vorkommen, darf die erste Spalte nicht der Nullvektor sein. Nach Vertauschen geeigneter Zeilen sei also a11 6= 0. Dann subtrahieren wir für k = 2, ..., d von der k.-ten 80 KAPITEL 3. LINEARE GLEICHUNGSSYSTEME Zeile das a1k a11 - fache der 1. Zeile. Es entsteht eine neue Matrix A (2) ai1 1 , ai1 2 , . . . . . . . . . ai1 n 0 0 0 ... ... 0 A (2) = .. .. . . 0 0 0 ... ... 0 oder A (2) = a11 , a12 , . . . a1 j2 ... ... ... ... ... ... 0 0 ... a02 j2 0 0 ... a03 j2 ... ... .. . 0 ... ... ... ... .. . 0 ... ... ... ... 0 0 ... a0d j2 ... ... ... der Form b1 b02 .. . b0d a1n a02n a03n .. . .. . a0dn b1 b02 b03 .. . .. . b0d a02 j2 .. = . 6 ~0. a0d j2 eine gewünschte Zeilenstufenform von A |~b . Dabei ist j2 > 1 die Nummer der ersten Spalte mit Im Fall 1 ist A (2) Angenommen, der 2. Fall trete ein. Nach einer Zeilenvertauschung können wir annehmen, es sei a02 j2 6= 0. Dann verfahren wir mit der Kästchenmatrix 0 0 a2 j2 . . . . . . . . . a2n b02 0 0 0 . . . . . . a3n b3 a 3 j2 . . . . .. .. ... ... ... . a0d j2 . . . . . . . . . a0dn b0d genauso, wie zuvor mit A |~b und überführen sie in die Form a02 j2 . . . . . . . . . a02n b02 ... ... 0 b03 0 . .. .. . ... ... ... . . . 0 ... ... ... 0 b0d 3.2. DAS ELIMINATIONSVERFAHREN oder in die Form 81 a02 j2 ... ... 0 ... ... .. . ... ... 0 ... ... wobei j3 > j2 die Nummer der ersten Spalte mit a02n b02 a003 j3 . . . a003n b003 . ... . . . .. a00d j3 . . . a00dn b00d 00 a3 j3 .. ~ . 6= 0 ist. a02 j3 . . . a00d j3 Mit dem Kästchen a003 j3 .. . ... a00d j3 ... ... a003n .. . 00 adn b003 .. . b00d verfahren wir in ensprechender Weise wie zuvor. Nach spätestens d Schritten haben wir (A |~b) in eine neue Matrix A ZSF der Form ZSF A | ~b = A11 , ....................................................................................., A1 n A2 j2 , ....................................................................., A2 n . ....................................................... .. ... Ar−1 jr−1 , ....................., Ar−1 n Ar jr , ................., Ar n überführt, wobei 1 < j2 < j3 < ... < jr und A2 j2 6= 0, ..., Ar jr 6= 0. Nun folgt rg A = r und das Lösbarkeitskriterium Genau dann ist rg (A , ~b ) = r, wenn b∗r+1 = ... = b∗d = 0. Beispiele Wir untersuchen das System mit 5 Unbekannten: b∗1 b∗2 .. . b∗r−1 b∗r b∗r+1 .. . b∗d 82 KAPITEL 3. LINEARE GLEICHUNGSSYSTEME x1 −x1 2x1 x1 + − + + 2x2 2x2 4x2 2x2 + x3 − 2x3 + 3x4 + 2x3 + x4 + x5 + 2x4 + x5 − x4 − 2x4 − x5 = = = = 6 8 a3 a4 (3.2.1) Die zugehörigen Koeffizientenmatrix ist nun 1 2 1 1 1 −1 −2 −2 2 1 A = 2 4 3 −1 0 1 2 2 −2 −1 Wir verfolgen wieder die Idee aus dem 1. Beispiel 1. Schritt: Durch Zeilenumformungen überführe (3.2.1) in ein Gleichungssystem, dessen Koeffizientenmatrix in der 1. Spalte ab der 2. Stelle nur noch Nullen aufweist. Dazu müssen wir • die 1. Zeile zur 2. addieren • das 2-fache der 1. Zeile von der 3. Zeile subtrahieren • die 1. Zeile von der 4.Zeile subtrahieren Es entsteht A = 6 0 0 −1 3 2 14 0 0 1 −3 −2 a3 − 12 0 0 1 −3 −2 a4 − 14 1 1 6 0 0 −1 3 2 14 0 0 0 0 0 a3 + 2 0 0 0 0 0 a4 + 8 1 2 1 1 1 Zur Gewinnung von A ZSF wird • die 2. Gleichung zur 3. addiert • die 2. Gleichung zur 4. addiert Heraus kommt: A ZSF = 1 2 1 3.2. DAS ELIMINATIONSVERFAHREN 83 Das Gleichungssystem A · ~x = ~b ist überführt in A ∗ · ~x = ~b∗ , wobei 6 1 2 1 1 1 14 0 0 1 3 2 ∗ ∗ ~b = A = a3 + 2 0 0 0 0 0 , a4 + 8 0 0 0 0 0 Wir lesen ab, dass rg A = r = 2 und j2 = 3 ist. Soll A ∗ · ~x = ~b∗ gelten, muss a3 = −2 und a4 = −8 sein. Sonst kann es für dieses Gleichungssystem keine Lösung geben. 3.2.2 Berechnung des Lösungsraumes Wir beginnen mit linearen Gleichungssystemen, deren Matrix quadratisch mit oberer Dreiecksgestalt ist. b11 b12 . . . b1r 0 b22 . . . b2r 3.2.2.1 Hilfssatz Ist B = . .. mit b11 , ..., brr 6= 0, so ist das Gleichungssystem .. .. . . 0 ... ... B · ~y = ~c für jedes ~c ∈ Rr eindeutig lösbar. brr Beweis. Wir lösen das Gleichungssystem ”von unten nach oben”. Zunächst wählen wir yr := cr . Im brr cr−1 − cr−1 r yr . Angenommen, wir haben schon yr , ..., yk+1 gewählt, br−1 r−1 1 (ck − bk k+1 yk+1 − ... − bk r yr ). Dann stellen wir fest, dass der Vektor ~y mit den so setzen wir yk := bkk so definierten Koordinaten ein Lösungsvektor zu dem gegebenen Gleichungssystem ist. Umgekehrt zeigt man ebenfalls induktiv, dass, sollte ~z ein Lösungsvektor sein, dan ~y − ~z als Lösung zu B · ~v = ~0 bereits der Nullvektor sein muss. Ist A ∈ M (d, n), so bezeichnen wir als Nullraum von A die Menge nächsten Schritt setzen wir yr−1 := NA := {~x ∈ Rn | A · ~x = ~0} Dann ist NA ein Unterraum des Rn . 3.2.2.2 Hilfssatz Ist r der Rang von A , so hat NA die Dimension n − r. Beweis. Ist A ZSF eine Zeilenstufenform von A , so ist NA = NA ZSF . Nun haben wir ja A ZSF = AfZSF 0 , 84 KAPITEL 3. LINEARE GLEICHUNGSSYSTEME wobei AfZSF = A11 . . . 0 ... 0 ... .. . A 1 j2 A 2 j2 ... 0 ... ... ... ... ... A3 j3 ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... Ar jr ... ... A1n A2n A3n .. . Arn Wir ordnen die Elemente der Menge {1, ..., n}\{1, j2 , ..., jr } der Größe nach und schreiben {1, ..., n}\ {1, j2 , ..., jr } = {k1 , ..., kn−r }. Wir schreiben das Gleichungssystem A ZSF · ~x = ~0 um, indem wir alle Variablen xk1 , ..., xkn−r auf die rechte Seite bringen. Wir erhalten dann das Gleichungssystem A11 A1 j2 0 A2 j 2 0 0 .. . 0 ... ... ... A3 j 2 ... ... ... ... ... .. . A 1 jr A 2 jr A 3 jr .. . ... Ar jr x1 x j2 x j3 .. . n−r X AfZSF · ~ek` xk` =− `=1 xjr Wir lösen das Gleichungssystem auf nach x1 , xj2 , ..., xjr und erhalten x1 xj2 xj3 .. . n−r X = `=1 x jr mit irgendwelchen Vektoren v1` v2` .. . v1` v2` .. . xk` vr` x1 x2 .. . r . Dann setzen wir in ~ ∈ R x = vr` ein. Es entsteht dann eine Darstellung von ~x als ~x = = = r X + n−r X xk` ~ek` `=1 vm` xk` ~ejm + `=1 die Werte für x1 , xj2 , ..., xjr xn xjm ~ejm m=1 n−r r XX `=1 m=1 n−r r X X n−r X xk` ~ek` `=1 vm`~ejm + ~ek` xk` m=1 Linearkombination von gewissen n − r linear unabhängigen Vektoren aus NA . 3.2. DAS ELIMINATIONSVERFAHREN 85 1 2 1 1 1 −1 −2 −2 2 1 . Dann haben wir schon gesehen, dass A ZSF = Beispiel. Sei wieder A = 2 4 3 −1 0 1 2 2 −2 −1 1 2 1 1 1 0 0 −1 3 2 0 0 0 0 0 . Nun ist r = 2 und j2 = 3. Weiter ist k1 = 2, k2 = 4 und k3 = 5. Wir lösen das 0 0 0 0 0 Gleichungssystem 1 1 x1 2x2 + x4 + x5 =− 0 −1 x3 3x4 + 2x5 und finden x1 x3 = −2x2 − 4x4 − 3x5 3x4 + 2x5 = −2 0 x2 + −4 3 x4 + −3 2 x5 Also wird ~x = −2x2 − 4x4 − 3x5 x2 3x4 + 2x5 x4 x5 = −2 1 0 0 0 x2 + −4 0 3 1 0 x4 + −3 0 2 0 1 x5 Insbesondere sehen wir, dass dim(NA ) = 3 ist. Der folgende Struktursatz gilt für ein lineares Gleichungssystem: 3.2.1 Satz Ist A ∈ M (d, n) und ~b ∈ Rd , so gilt, eine Lösung ~x0 des linearen Gleichungssystems existiert: Genau dann ist ~x eine Lösung, wenn ~x − ~x0 ∈ NA . Der Lösungsraum L (A , ~b) des linearen Gleichungssystems ist also in der Form L (A , ~b) = ~x0 + NA darstellbar. Beweis. Sind ~x, ~x0 ∈ L (A , ~b), so ist A · (~x − ~x0 ) = ~0, also ~x − ~x0 ∈ NA . Umgekehrt ist für jedes ~v ∈ NA der Vektor ~x0 + ~v in L (A , ~b) gelegen. Die Berechnung einer speziellen Lösung ist nun nicht mehr schwer. ~ Wir bringen die erweiterte Matrix A , b auf Zeilenstufenform. Das zugehörige Gleichungssystem A11 x1 + . . . + A1j2 xj2 A2j2 xj2 + ... + ... ... ... ... Arjr xjr ... + A1n xn = b∗1 + A2n xn = b∗2 .. .. .. . . . .. .. .. . . . + Arn xn = b∗r ist zum vorgegebenen äquivalent. Wir setzen hierin xk` = 0 für alle ` = 1, ..., n − r. Es entsteht ein Gleichungssystem in x1 , xj2 , xj3 , ..., xjr , das wir lösen, wie es im Beweis zum Hilfssatz 3.2.2.1 beschrieben wurde. 86 KAPITEL 3. LINEARE GLEICHUNGSSYSTEME Beispiel. Wir sehen uns noch einmal das Gleichungssystem x1 −x1 2x1 x1 + − + + 2x2 2x2 4x2 2x2 + x3 − 2x3 + 3x4 + 2x3 + x4 + x5 + 2x4 + x5 − x4 − 2x4 − x5 = = = = 6 8 a3 a4 (3.2.2) an. Angenommen, es sei a3 = −2 und a4 = −8. Dann muss nur noch Gleichungssystem 1 1 x1 6 = 0 −1 x3 14 gelöst werden. Als Lösung erhalten wir: ~x0 = ~ L (A , b) = 20 0 −14 0 0 + R 20 0 −14 0 0 −2 1 0 0 0 und damit den Lösungsraum + R −4 0 3 1 0 + R −3 0 2 0 1 . Weitere Beispiele Beispiel 1. Wir studieren das Gleichungssystem 5x1 + 4x2 − 4x3 − x4 = 2 3x1 + 2x2 + 2x3 + 4x4 = t −14x1 − 12x2 + 20x3 + 12x4 = s 2 ~ t , und die erweiterte Koeffizientenmatrix ist Hier ist d = 3, n = 4 und b = s 5 4 −4 −1 2 2 2 4 t 3 A ~b = −14 −12 20 12 s Dieses Gleichungssystems ist genau dann lösbar, wenn s − 2t + 8 = 0. 3.2. DAS ELIMINATIONSVERFAHREN 87 Die Operation: 2.Zeile- 53 mal 1. Zeile überführt (A , ~b) in 5 4 −4 −1 2 23 A1 = 0 − 25 22 t− 5 5 −14 −12 20 12 s 6 5 Die Operation: 3.Zeile+ 14 5 mal 1. Zeile überführt A1 in 5 4 −4 −1 2 22 23 2 A2 = 0 − 5 5 t − 65 5 44 46 0 −4 s + 28 5 5 5 5 Schließlich subtrahieren wir von der 3. Zeile das 2-fache der 5 4 −4 −1 2 23 6 t − A ZSF := 0 − 52 22 = 5 5 5 6 0 0 0 0 s + 28 − 2(t − ) 5 5 2 2. Zeile und erhalten 5 4 −4 −1 23 0 − 25 22 5 5 0 0 0 0 die neue Matrix 2 t − 56 s − 2t + 8 Nun ist j1 = 1, j2 = 2, und r = 2. Ferner: ~b∗ = 14 5 . Daran können wir alles ablesen. s − 2t + 8 Für den Fall t = 4, s = 0 berechnen wir alle Lösungen. Wir müssen dazu das zu A ZSF gehörige Gleichungssystem 5x1 + 4x2 − − 52 x2 + 4x3 22 5 x3 − + x4 23 x 5 4 = 2 = 14 5 lösen. Wir bringen x3 und x4 auf die rechte Seite und erhalten 5x1 + 4x2 = 2 + 4x3 + x4 23 − 52 x2 = − 22 5 x3 − 5 x4 Es folgt x2 = −7 + 11x3 + 23 2 x4 x1 = 6 − 8x3 − 9x4 Also folgt 6 −8 −7 11 ~x = 0 + 1 0 0 −9 23 x3 + 2 x4 0 1 88 KAPITEL 3. LINEARE GLEICHUNGSSYSTEME Die Lösungsmenge L (A , ~b) unseres Gleichungssystems 6 −8 −7 11 L (A , ~b) = 0 +R 1 0 0 ist damit durch −9 23 +R 2 0 1 zu beschreiben. Beispiel 2: 2x1 6x1 −2x1 2x1 + 6x2 + 18x2 − 10x2 + x2 − 5x3 − 15x3 + 13x3 + 5x3 + + − − 12x4 36x4 32x4 13x4 = −15 = −45 = 43 = t Die erweiterte Koeffizientenmatrix dazu ist 2 6 −5 12 −15 18 −15 36 −45 6 ~ A b = −2 −10 13 −32 43 2 1 5 −13 t Vertauschen der 2. und 4. Zeile ergibt 1 5 −13 2 ~ A b = −2 −10 13 −32 6 18 −15 36 2 6 Folgen Umformungen werden nun ausgeführt: • 2. Zeile - 1. Zeile • 3. Zeile + 1. Zeile • 4. Zeile - 3× 1. Zeile −5 12 −15 t 43 −45 3.2. DAS ELIMINATIONSVERFAHREN 89 Wir gelangen zu 2 6 0 −5 A ~b = 0 −4 0 0 −5 10 8 0 −25 −20 0 12 −15 t + 15 28 0 Weitere Umformung: • 3. Zeile - 54 × 2. Zeile mit Resultat 2 6 0 −5 A ~b = 0 0 0 0 −5 10 0 0 −25 0 0 12 −15 t + 15 − 54 t + 16 0 Es ist damit L (A , ~b) 6= ∅ genau dann, wenn − 45 t + 16 = 0, also t = 20. Wir sehen, dass r = 2 und j2 = 2. Dann berechnen wir x1 , x2 in Abhängigkeit von x3 , x4 durch Lösen des Gleichungssystems 2x1 + 6x2 = −15 + 5x3 − 12x4 −4x2 = 28 − 8x3 + 20x4 Es folgt x2 = −7 + 2x3 − 5x4 , x1 = und damit 1 2 27 7 − 15 + 5x3 − 12x4 − 6(−7 + 2x3 − 5x4 ) = − x3 + 9x4 2 2 −7/2 27/2 −7 + x3 2 + x4 ~x = 1 0 0 0 9 −5 0 1 Ergebnis: 27/2 −7/2 −7 2 L (A , ~b) = 0 + R 1 + R 0 0 9 −5 0 1 90 KAPITEL 3. LINEARE GLEICHUNGSSYSTEME Beispiel 3. 9x1 6x1 12x1 −9x1 − 8x3 − 3x3 − 10x3 + 5x3 + 10x2 + 8x2 + 14x2 − 12x2 − x4 − 2x4 − 4x4 + 5x4 + + + − 2x5 2x5 3x5 3x5 = = = = 1 −1 0 t In der erweiterten Matrix ~ (A ,b) = 6 8 −3 −2 2 12 14 −10 −4 3 −9 −12 5 5 −3 9 10 −8 −1 2 1 −1 0 t führen die Zeilenoperationen: • 2. Zeile - 32 × 1. Zeile • 3. Zeile - 34 × 1. Zeile • 4. Zeile + 1. Zeile zu 9 10 −8 −1 7 − 43 0 43 3 ( A , ~b ) = 2 − 83 0 23 3 0 −2 −3 4 Die nächsten Zeilenoperationen sind: • 3. Zeile - 12 × 2. Zeile • 4. Zeile + 23 × 2. Zeile 2 3 1 3 −1 2 1 − 53 − 43 t+1 3.2. DAS ELIMINATIONSVERFAHREN 91 mit dem Ergebnis 9 10 −8 0 ~ (A ,b) = 0 0 und nach der Operation : 4. Zeile + 3. Zeile 9 0 ( A , ~b ) = 0 0 −1 4 3 7 3 − 43 0 − 21 −2 0 1 2 2 2 2 3 0 0 entsteht schließlich 10 −8 −1 2 7 4 2 4 − 3 3 3 3 0 − 21 −2 0 0 0 0 0 1 − 53 − 12 t− 3 2 1 − 53 − 12 t−2 Das Gleichungssystem hat genau eine Lösung, wenn t = 2. Es ist r = 3, j2 = 2, j3 = 3. Wir berechnen x1 , x2 und x3 in Abhängigkeit von x4 , x5 durch Lösen des Gleichungssystems 9x1 + 10x2 − 8x3 = 1 + x4 − 2x5 4 3 x2 + 37 x3 = − 53 + 43 x4 − 23 x5 − 21 x3 = − 12 + 2x4 und finden x1 = also 13 37 1 − x4 + x5 , 3 3 3 13 3 −3 ~x = 1 0 0 1 x2 = −3 + 8x4 − x5 , x3 = 1 − 4x4 , 2 37 1 −3 3 8 −1 2 + x4 −4 + x5 0 1 0 0 1 Ergebnis: 13 3 −3 ~ L (A , b) = 1 + R 0 0 − 37 3 8 −4 1 0 1 3 −1 2 + R 0 0 1 92 KAPITEL 3. LINEARE GLEICHUNGSSYSTEME 3.3 3.3.1 Anhang:Matrixmultiplikation Matrixprodukt Wir können zwei Matrizen miteinander multiplizieren: Ist A ∈ M (d, n) und B ∈ M (n, p), so ist A · B diejenige Matrix aus M (d, p), deren j .te Spalte gerade gleich A · (B~ ej ) ist, 1 ≤ j ≤ p. b1j b2j Ist (ai1 , ai2 , ..., ain ) die i.-te Zeile von A und . die j .-te Spalte von B , so steht in der i.-ten Zeile .. bnj und j .-ten Spalte von A B die Zahl ai1 b1j + ai2 b2j + .... + ain bnj Zur Berechnung des Produktes 2er Matrizen kann man das folgende (nach Falk benannte) Schema benutzen: B A AB Beispiel. Wenn A := so erhalten wir das 2 −9 −5 2 , B= 1 −4 −2 −2 3 0 , 3.3. ANHANG:MATRIXMULTIPLIKATION 93 Schema: 1 −4 −2 −2 3 0 2 −9 20 −35 −4 −5 2 −9 26 10 Also ist AB = 20 −35 −4 −9 26 10 Das Matrixprodukt genügt folgenden Regeln: 3.3.1 Hilfssatz. i) Wenn A ∈ M (d, n) und B, C ∈ M (n, p), so gilt: A (B + C ) = A B + A C ii) Wenn A ∈ M (d, n), B ∈ M (n, p) und C ∈ M (p, q), so gilt A (BC ) = (A B)C 3.3.2 Invertierbare Matrizen Sei n ≥ 1 ganz. Definition. Mit En bezeichnen wir die Matrix En = (eij )ni,j=1 ∈ M (n, n), deren Diagonalelemente eii gleich 1 sind, während eij = 0, für alle i 6= j . Es gilt En A = A für alle A ∈ M (n, p). Definition. Wir nennen eine n × n-Matrix A invertierbar, wenn es eine n × n-Matrix B mit A B = BA = En gibt. Man kann leicht zeigen, dass für eine invertierbare Matrix A diese Matrix B eindeutig bestimmt ist. Man verwendet dann das Symbol A −1 für sie. 3.3.1 Hilfssatz. a) Ist A invertierbar, so auch A −1 , und es ist (A −1 )−1 = A . b) Mit A und B ist auch A B invertierbar, und es gilt (A B)−1 = B −1 A −1 . 94 KAPITEL 3. LINEARE GLEICHUNGSSYSTEME Wie können wir Invertierbarkeit einer Matrix feststellen? 3.3.2 Hilfssatz. Folgende Aussagen über die Matrix A ∈ M (n, n) sind äquivalent: i) A ist invertierbar, ii) Die Spalten von A sind linear unabhängig, iii) Man kann A auf die Zeilenstufenform 1 a012 , . . . , . . . , a01n 0 1 a0 , . . . , a0 23 2n A ZST = . . .. .. .. . 0 0 ... ... 1 bringen. Folgendes ist einfach überprüft: 3.3.3 Hilfssatz. a) Sind A , B ∈ M (n, n) invertierbar, so auch A B, und (A B)−1 = B −1 A −1 . b) Ist die Matrix A invertierbar, so kann man sie mit Zeilenoperationen in die Einheitsmatrix überführen. Berechnung der Inversen Man überführe eine gegebene invertierbare Matrix A durch Zeilenumformungen in die Einheitsmatrix und nehme dieselben Umformungen auch an der Einheitsmatrix vor. 3.3. ANHANG:MATRIXMULTIPLIKATION 95 Ein Beispiel dazu: 1 4 2 −1 2 −1 A = 0 −1 2 3 2 −2 2. + 1.Z. 4. − 3 × 1.Z. 2.←→3.Z. 0 6 1 3 0 1 0 0 0 0 1 0 0 0 0 1 1 4 2 0 6 1 0 −1 2 0 −10 −8 0 6 1 3 1 1 0 −3 0 1 0 0 0 0 1 0 0 0 0 1 0 1 6 3 0 0 1 0 0 1 0 0 0 0 0 1 1 4 2 0 −1 2 0 6 1 0 −10 −8 1 0 10 4 0 −1 2 1 0 0 13 12 0 0 −28 −7 2.Z. × (−1) 3.Z. × 2 4.Z. × (−1) 1 0 0 0 1. + 4 × 2.Z 3. + 6 × 2.Z 4. − 10 × 2.Z 1 0 0 0 0 10 4 1 −2 −1 0 26 24 0 28 7 1 0 1 −3 1 0 1 −3 1 0 2 3 0 4 0 1 1 6 0 −10 0 0 0 1 0 4 0 0 −1 0 2 12 0 0 10 −1 96 KAPITEL 3. LINEARE GLEICHUNGSSYSTEME 3. − 4.Z. 4.Z+17×3.Z 1 0 0 0 0 10 4 1 −2 −1 0 −2 17 0 28 7 0 10 4 1 −2 −1 0 −2 17 0 0 245 1 0 0 0 2.Z. − 3.Z 1.Z. + 5 × 3.Z. 3.Z. × (−1/2) 1 0 0 0 0 1 0 0 0 4 0 0 −1 0 2 2 1 0 10 −1 1 0 −1 3 1 0 4 0 0 0 −1 0 −1 2 2 1 −11 28 38 13 0 89 0 −18 1 −17/2 0 245 −4 10 14 5 1 −2 −3 −1 1/2 −1 −1 −1/2 −11 28 38 13 89 1.Z.− 245 × 4.Z 18 2.Z.+ 245 × 4.Z. 17 × 4.Z. 3.Z.+ 490 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 −1 42 48 68 14 −51 −11 1 47 = A −1 245 29 −7 78 −12 −11 28 38 13 4.Z/245 Die Matrix 3 1 −1 A = 2 1 4 −1 2 −1 hat die Inverse A −1 9 1 −5 1 2 4 14 = 34 −5 7 −1 3.3. ANHANG:MATRIXMULTIPLIKATION 97 Das Schema zur Berechnung von A −1 : Vertausche 1. und 3.Z 2.Z.+2 × 1.Z 3.Z.+3 × 1.Z. −1 2 −1 2 1 4 3 1 −1 0 0 1 0 1 0 1 0 0 −1 2 −1 0 5 2 0 7 −4 0 0 1 0 1 2 1 0 3 (−1) × 1.Z. 3. Zeile − 75 × 2. Zeile 1 −2 1 0 5 2 0 0 − 34 5 0 0 0 1 1 − 75 5 (− 34 ) × 3.Z. 1 −2 1 0 5 2 0 0 1 1. Z. − 3.Z. 2. Z. − 2 × 3.Z. 2.Z. × 15 1. Z. + 2 × 2.Z. 0 0 5 − 34 1 −2 0 0 5 0 0 0 1 A 7 34 1 5 1 2 1 − 34 5 34 7 − 34 − 33 34 5 17 10 17 35 17 5 − 34 7 34 1 − 34 1 0 0 0 1 0 0 0 1 0 1 1 2 −1 5 34 1 34 − 33 34 = 1 17 2 17 7 17 9 34 1 34 5 − 34 98 KAPITEL 3. LINEARE GLEICHUNGSSYSTEME Kapitel 4 Analysis - Folgen und Funktionen 4.1 Konvergenz bei Zahlenfolgen Definition. Unter einer Folge von reellen Zahlen verstehen wir eine Familie (an )n≥n0 von reellen Zahlen, deren Glieder an nummeriert sind, wobei die Zählung von einer Zahl n0 ∈ IN 0 an beginnt. Hier sind einige Beispiele. a) Konstante Folge: Alle Glieder haben dengleichen Wert c ∈ R, also an = c, für alle n ≥ 1 b) Geometrische Folgen: Sei q > 0. Dann nennen wir eine Folge (an )n≥1 eine geometrische Folge, wenn an+1 /an = q für alle n gilt. Es ergibt sich nun an = a1 q n−1 . c) Rekursiv definierte Folgen. Das sind Folgen, bei denen zwar nicht an explizit definiert wird, wohl aber das erste Folgenglied a1 . Statt an explizit anzugeben, gibt man vor, wie man an+1 aus den Gliedern a1 , ..., an berechnen kann. √ √ Ein Beispiel haben wir früher gesehen: Ist a > 0, so wählen wir a1 zwischen a und a + 0.1 und definieren an+1 := 12 (an + aan ), wenn n ≥ 1. Das definiert eine Folge, so dass für großes n der Unterschied √ |an − a| verschwindend klein wird. Bei Folgen (an )n≥n0 interessiert uns vor allem, ob die an einem Wert zustreben (Wir werden das bald präzisieren). Definition. Gegeben sei eine Folge (an )n≥n0 und ein a ∈ R. Wir nennen a einen Grenzwert der Folge (an )n≥n0 , wenn gilt: Zu jedem ε > 0 gibt es ein n(ε) ≥ n0 , so dass |an − a| < ε, wenn n ≥ n(ε). (4.1.1) Wir sagen auch: Fast alle an liegen in (a − ε, a + ε). So klein auch ε ist, stets liegen höchstens endlich viele der an außerhalb (a − ε, a + ε). Die Zahl a heißt Häufungswert der Folge (an )n≥n0 , wenn für jedes ε > 0 die Menge {n ∈ IN | |an − a| < ε} unendlich viele Elemente hat. 101 102 KAPITEL 4. ANALYSIS - FOLGEN UND FUNKTIONEN a- ε a+ ε a Wichtig: 4.1.1 Hilfssatz. a) Eine Folge (an )n≥n0 kann nicht zwei verschiedenen Grenzwerte a, a0 haben. Es gibt also höchstens einen Grenzwert für diese Folge. b) Eine konvergente Folge ist immer beschränkt, das heißt: Es gibt eine Schranke S, so dass |an | ≤ S für alle n. c) Hat (an )n einen Grenzwert a, so ist a auch Häufungswert, und es existiert kein weiterer Häufungswert. Beweis. Sonst wäre ε := |a − a0 |/2 > 0. Nun gilt aber für fast alle n: |an − a| < ε/2, und |an − a0 | < ε/2 Das heißt aber für diese n: 2ε = |a − a0 | ≤ |an − a − (an − a0 )| ≤ |an − a| + |an − a0 | < ε/2 + ε/2 = ε Das ist ein Widerspruch. b) Sei a der Grenzwert der Folge (an )n . Für fast alle n gilt dann |an − a| < 1, also |an | ≤ |a| + 1. c) Ist a Grenzwert von (an )n , so ist sogar für jedes ε > 0 die Menge {n | |an − a| ≥ ε} endlich, also a ein Häufungswert. Angenommen, es sei a0 Häufungswert, aber a0 6= a. Wieder sei ε = 21 |a − a0 |. Dann existiert ein n0 ∈ IN mit |an − a| < ε für alle n ≥ n0 . Aber auch die Menge {n ∈ IN | |an − a0 | < ε} ist unendlich, so dass mindestens ein n1 > n0 in ihr vorkommt. Es folgt dann aber ε > |an1 − a| ≥ |a − a0 | − |an1 − a0 | = 2ε − |an1 − a0 | > ε ein Widerspruch. Notation. Hat eine Folge (an )n einen Grenzwert a, so sagen wir, sie konvergiere gegen a. Wir schreiben auch lim an = a n→∞ oder an −→ a, wenn n −→ ∞ und bezeichnen a als den Limes der Folge. Konvergiert eine Folge gegen 0, so nennen wir sie auch Nullfolge. Beispiele. a) Eine konstante Folge konvergiert stets Ihr Grenzwert ist gleich dem Wert dieser Konstanten. b) Die arithmetische Folge (a1 + (n − 1)d )n konvergiert genau dann, wenn d = 0. Für d ≥ 0 ist sie nach unten und für d < 0 nach oben beschränkt. c) Sei a1 6= 0. Die geometrische Folge (a1 q n )n konvergiert genau dann, wenn −1 < q ≤ 1 ist. 4.1. KONVERGENZ BEI ZAHLENFOLGEN 103 Für q = 1 ist dies klar. Sei |q| < 1. Dann haben wir (Bernoulli-Ungleichung) |q|−n = (1 + 1 1 − 1)n ≥ 1 + n( − 1) |q| |q| also n |q| ≤ 1 |q| −1 n −→ 0 mit n → ∞. Für |q| > 1 gilt entsprechend |q|n ≥ 1 + n(|q| − 1) d) Sei an = (−1)n n2 − n + 4 , f ür n ≥ 1 n3 Dann wird |an | ≤ n2 + n + 4 6 ≤ −→ 0 n3 n mit n → ∞. √ e) Für a > 0 setzen wir an = n a, für n ≥ 2. Dann ist (an )n≥2 konstant, wenn a = 1 und an+1 < an , wenn a > 1, an+1 > an , wenn a < 1. Die Folge konvergiert gegen 1. Denn es gilt, wenn a ≥ 1: a = (1 + √ √ n a − 1)n ≥ 1 + n( n a − 1) (Bernoulliungleichung!), also √ a−1 −→ 0, wenn n −→ ∞ | n a − 1| ≤ n Ist 0 < a < 1, so schreiben wir statt dessen: 0≤1− √ n a= √ n r a n 1 −1 a ! r1 n ≤ − 1 −→ 0, wenn n −→ ∞ a f) Rekursiv definierte Folgen: Man definiert ein Anfangsglied, etwa a1 und sagt, wie man aus an das Glied an+1 berechnen soll. Zum Beispiel sei a1 = 2, an+1 = a2n . Was ist dann an√? Oder: Sind a und b positiv und setzen wir a1 = ab, b1 := √ n an bn , bn+1 = an +b 2 . a+b 2 so definieren rekursiv an+1 = Wir kommen zu ein paar Regeln für konvergente Folgen. Der Grund hierfür ist beschrieben in: 104 KAPITEL 4. ANALYSIS - FOLGEN UND FUNKTIONEN 4.1.2 Hilfssatz. a) Unbeschränkte Folgen konvergieren niemals. Genau dann konvergiert (an )n≥n0 gegen a, wenn (an − a)n≥n0 eine Nullfolge ist. b) Ist (an )n≥n0 eine Folge und (bn )n≥n0 eine Nullfolge mit |an | ≤ bn für alle n ≥ n0 , so ist auch (an )n≥n0 eine Nullfolge. c) Sind (bn )n≥n0 und (cn )n≥n0 Folgen mit bn ≤ an ≤ cn f ür alle n, so gilt: Wenn (bn )n≥n0 und (cn )n≥n0 beide gegen eine Zahl a konvergieren so auch die Folge (an )n≥n0 . d) Ist (an )n≥n0 eine Nullfolge und ist die Folge (bn )n≥n0 beschränkt, so ist auch (an bn )n≥n0 eine Nullfolge. e) Wenn (an )n und (bn )n konvergente Folgen mit Grenzwerten a bzw. b sind, und gilt an ≤ bn für alle bis auf endlich viele n, so ist auch a ≤ b. Beweis. Zu c) Es gilt bn − a ≤ an − a ≤ cn − a für alle n. Es folgt hieraus: |an − a| ≤ |bn − a| + |cn − a| für alle n. Die Behauptung folgt jetzt aus b). Zu d) Ist S > 0 mit |bn | ≤ S für alle n ≥ n0 , so hat man |an bn | ≤ S|an |. Mit b) folgt die Behauptung. Zu e) Angenommen, es sei a > b. Dann wählen wir in der Definition der Konvergenz ε = (a − b)/2. Von einem geeigneten nε an gilt für alle n, dass |an − a| < ε und |bn − b| < ε. Also haben wir an − bn = a − b + an − a + b − bn ≥ 2ε − |an − a| − |bn − b| > 0, entgegen unserer Voraussetzung über die an und bn . Rechenregeln für Grenzwerte Für die Herleitung solcher Rechenregeln benötigen wir eine Folgerung aus der Dreiecksungleichung. 4.1.3 Hilfssatz. Für x, y ∈ R gilt ||x| − |y|| ≤ |x − y|. Beweis. Sei |x| ≥ |y|. Es gilt |x| = |x − y + y| ≤ |x − y| + |y|, also ||x| − |y|| = |x| − |y| ≤ |x − y|. Wenn |y| ≥ |x|, so wird entsprechend ||x| − |y|| = |y| − |x| ≤ |y − x| = |x − y|. 4.1.4 Satz. Sind (an )n≥n0 und (bn )n≥n0 konvergente Folgen mit Grenzwerten a bzw. b, so sind auch (an + bn )n≥n0 , (an bn )n≥n0 , und (|an |)n≥n0 konvergent. Unter der Voraussetzung b 6= 0 ist auch ( abnn )n≥n1 definiert für geeignetes n1 und konvergent. Es ist 4.1. KONVERGENZ BEI ZAHLENFOLGEN 105 a) lim (an + λbn ) = a + λb, f ür λ ∈ R n→∞ b) lim an bn = ab n→∞ c) lim n→∞ a an = , wenn b 6= 0 bn b d) lim |an | = |a| n→∞ Weiter gilt: e) Wenn k > 0 ganzzahlig ist, so gilt lim ak n→∞ n = ak f) Sind alle an nicht-negativ, so haben wir lim n→∞ √ k an = √ k a Beweis. a) Folgt aus |an + λbn − (a + λb)| ≤ |an − a| + |λ||bn − b|. b) Es gibt ein S > 0 mit |an | ≤ S für alle n. Die Behauptung folgt jetzt aus |an bn − ab| = |(an − a)b − an (b − bn )| ≤ |b||an − a| + |an ||b − bn | ≤ |b||an − a| + S|b − bn | c) Wenn bn −→ b 6= 0, so gilt |bn − b| < |b|/2 für fast alle n. Dann ist aber |bn | = |b − (b − bn )| ≥ |b| − |b − bn | ≥ |b|/2 > 0. Damit ist b1n für n ≥ n1 definiert. Nun schreiben wir 1 − bn |bn − b| |bbn | 2 |bn − b| −→ 0, wenn n −→ ∞ |b| 1 = b ≤ Dies zusammen mit b) beweist c). d) Folgt aus ||an | − |a|| ≤ |an − a|. e) Induktion nach k. Im Fall k = 1 ist nichts zu zeigen. Gilt der Satz für k, so auch für k + 1. Das sieht man mit Hilfe von b). Zu f). 1.Fall: a = 0. Dann wählen wir zu ε > 0 eine ganze Zahl n(ε) mit |an | < εk für alle n ≥ n(ε). √ Es folgt 0 ≤ k an < ε für diese n. √ √ 2.Fall: Sei nun a > 0. Wir schreiben bn := k an und b := k a und müssen zeigen, dass |bn − b| −→ 0 mit n −→ ∞. Dazu benutzen wir die verallgemeinerte geometrische Summenformel und erhalten |an − a| = |bkn k − b | = |bn − b| k−1 X bjn bk−1−j ≥ bk−1 |bn − b| j=0 | {z ≥bk−1 } 106 KAPITEL 4. ANALYSIS - FOLGEN UND FUNKTIONEN Das liefert |bn − b| ≤ b1−k |an − a| −→ 0, wenn n −→ ∞ Verfeinern wir die Bernoulliungleichung,was mit dem Binomialsatz möglich ist, so können wir weitere nicht offensichtliche Grenzwerte bestimmen. Beispiele. a) Es gilt für jedes q ∈ (−1, 1) und jedes ganzzahlige k ≥ 1 schon lim nk q n = 0 n→∞ 1 Dazu schreiben wir T := √ k |q| (dann ist T > 1 !) und benutzen den Binomialsatz: T n = (1 + T − 1)n = n X n j=0 j Tj ≥ also p n k |q| n = nT −n ≤ n 2 T2 = n(n − 1) 2 T 2 2 T −2 n−1 Bilden wir die k.-te Potenz hiervon, entsteht |nk q n | ≤ 2 T −2 n−1 k −→ 0, wenn n −→ ∞ √ b) Es gilt limn→∞ n n = 1. Dazu schreiben wir (ähnlich wie eben) n √ √ n = (1 + ( n n − 1) )n ≥ ( n n − 1)2 2 oder 0≤ c) Es gilt limn→∞ Denn n! ≥ 1 √ n n! n−1≤ √ n r 2 −→ 0, wenn n −→ ∞ n−1 = 0. n n/2 2 r √ n , n! ≥ n 1 , also √ ≤ n 2 n! r 2 −→ 0, wenn n −→ ∞ n d) Es sei an := 4n4 + 72n2 − 11n + 9 . 8n4 − 5n Dann ist limn→∞ an = 12 . Denn für großes n ist der Nenner nicht Null. Wir erweitern in Zähler und Nenner mit 1/n4 und finden 4 + 72n−2 − 11n−3 + 9 an = 8 − 5n−3 Die Regeln zur Grenzwertberechnung ergeben dann die Behauptung. 4.1. KONVERGENZ BEI ZAHLENFOLGEN 107 e) Die Folge an := 43n3 + 72n − 119 12n4 − 5n3 + 44 konvergiert gegen 0. Denn erweitern wir mit 1/n3 , so folgt 1 43 + 72n−2 − 119n−3 43 + 72n−2 − 119n−3 = 12n − 5 + 44n−3 n 12 − 5n−1 + 44n−4 −2 −119n−3 konvergiert, also erst recht beschränkt bleibt, aber 1/n gegen Null Da die Folge 43+72n 12−5n−1 +44n−4 n konvergent, gilt auch an −→ 0, wenn n −→ ∞. f) Die Folge 3n6 + 371n2 − n − 2 an := 7n4 − 59n3 + 414 an := wird unbeschränkt, wenn n −→ ∞. Denn wir klammern im Zähler n2 aus und finden −4 − n−5 − 2n−6 3n4 + 371 − n−1 − 2n−2 2 3 + 371n = n 7n4 − 59n3 + 414 7 − 59n−1 + 414n−4 −4 −n−5 −2n−6 Da nun 3+371n gegen 37 strebt, während n2 unbeschränkt wird, folgt die Behauptung. 7−59n−1 +414n−4 an = n2 Die Beobachtungen der letzten 3 Beispiele lassen sich verallgemeinern zu dem 4.1.5 Satz. Seien α0 , ..., αr , b0 , ..., bs ∈ R, und αr , bs 6= 0. Wir untersuchen die Folge (an )n≥n0 , wobei an := α0 + α1 n + · · · + αr nr b0 + b1 n + · · · + bs ns Dann gilt: a) Der Nenner wird für genügend großes n0 nicht Null. b) Die Folge ist unbeschränkt, wenn r > s, c) Ist r ≤ s, so konvergiert die Folge, und für r = s ist lim an = n→∞ αr br Im Falle r < s ist limn→∞ an = 0. Beispiel. Es gilt n 1 1 = k n→∞ k n k! lim Denn n 1 n(n − 1) · · · · · (n − (k − 1)) nk + αk−1 nk−1 + ... + α1 n = = k nk nk k! nk k! Die Folge ist von dem oben behandelten Typ, (αk−1 , ..., α1 sind irgendwelche Zahlen. Hier ist r = s = k und αk = 1, bk = k!). 108 KAPITEL 4. ANALYSIS - FOLGEN UND FUNKTIONEN Was haben die reellen Zahlen den rationalen voraus? Jede beschränkte F olge (an )n hat in R einen Häuf ungswert! (4.1.2) √ √ Das ist innerhalb Q im Allgemeinen nicht richtig: Die Folge xn := [n n 2] hat 2 als einzigen Häufungswert und der ist irrational. Dabei bedeutet [x] := maximale , ganze Zahl ≤ x den ganzzahligen Teil einer reellen Zahl x. 4.1.6 Hilfssatz. Ist (an )n eine Folge, so ist a0 ∈ R genau dann ein Häufungswert für (an )n , wenn eine Teilfolge (ank )k mit Grenzwert a0 aus (an )n ausgewählt werden kann. Beweis. (1) Kann eine Teilfolge (ank )k mit Grenzwert a0 aus (an )n ausgewählt werden, so gibt es zu jedem ε > 0 ein k0 mit |ank − a0 | < ε für alle k ≥ k0 . Somit ist {ν | |aν − a0 | < ε} ⊃ {nk | k ≥ k0 } eine unendliche Menge, also a0 ein Häufungswert für (an )n . (2) Angenommen umgekehrt, a0 sei ein Häufungswert für (an )n . Dann wählen wir ein n1 ∈ IN mit |an1 − a0 | < 1. Angenommen, wir haben schon Indizes nk > nk−1 > ... > n2 > 1 gefunden, so dass 1 |an` − a0 | < 1` für alle ` ∈ {1, ..., k} ist. Dann finden wir aber ein nk+1 > nk mit |ank+1 − a0 | < 1+n . Da k 1 1 0 aber nk ≥ k, folgt 1+nk ≤ k+1 . Dann ist aber (ank )k eine Teilfolge mit Grenzwert a . Definition. Wir nennen eine Teilmenge M ⊂ R nach oben beschränkt, wenn ein S ∈ R existiert, so dass M ⊂ (−∞, S], und nach unten beschränkt, wenn für eine geeignete Zahl T gilt M ⊂ [T, ∞). 4.1.7 Satz (Vollständigkeitsaxiom). In den reellen Zahlen hat jede nach oben (unten) beschränkte Menge M eine kleinste obere ( größte untere) Schranke, die man obere (untere) Grenze von M nennt. Manchmal trifft man auf Folgen, bei denen man durch Berechnen einiger Glieder den Eindruck von Konvergenz gewinnt, ohne aber keinen Kandidaten für einen möglichen Grenzwert angeben zu können. Das folgende Konvergenzkriterium kann hier von Nutzen sein. 4.1.8 Satz. a) Eine monoton wachsende (bzw. fallende) Folge (an )n konvergiert genau dann, wenn sie nach oben (bzw. unten) beschränkt ist. (Dabei heißt (an )n monoton wachsend, wenn gilt an ≤ an+1 für alle n und monoton fallend, wenn an ≥ an+1 für alle n.) Beweis. Sei (an )n eine Folge. Konvergiert sie, so muss sie beschränkt sein. Umgekehrt nehmen wir jetzt an, die Folge sei monoton wachsend und nach oben beschränkt. Dann hat die Menge M = {an | n ≥ 1} eine kleinste obere Schranke a. Wir beweisen jetzt, dass limn→∞ an = a. Dazu nehmen wir ein beliebiges ε > 0 her. Da a−ε keine obere Schranke mehr für M sein kann, muss es ein n(ε) ≥ 1 geben, so dass a − ε ≤ an(ε) . Nach Wahl von a ist nun an ≤ a für alle n. Wegen des monotonen Wachstums der Folge haben wir daher a − ε ≤ an ≤ a < a + ε, f ür alle n ≥ n(ε) 4.1. KONVERGENZ BEI ZAHLENFOLGEN 109 Das bedeutet aber |an − a| < ε, für solche n. Das war zu zeigen. Der Fall monoton fallender Folgen wird entsprechend behandelt. Beispiel: Die Eulersche Zahl Wir untersuchen die Folgen (en )n≥1 und (sn )n , wobei n X 1 1 en = (1 + )n , sn = n k! k=0 Zunächst ist en+1 ≥ en . Das sehen wir so ein: en+1 en n+1 n+2 n+1 n+1 n n (n + 2)n+1 nn (n + 1)2n+1 n+1 (n + 2)n n+1 n + 1 1 n+1 = = 1− 2 2 (n + 1) n (n + 1) n = = Die Bernoulliungleichung sagt aber, dass 1− 1 (n + 1)2 n+1 ≥ 1 − (n + 1) 1 n = 2 (n + 1) n+1 Setzen wir das ein, erhalten wir en+1 en ≥ 1. Der nächste Schritt ist: en ≤ sn ≤ 3 für alle n. Dazu beachten wir en = (1 + n X 1 n n 1 ) = k nk n k=0 = 2+ n X 1 1 2 k−1 (1 − )(1 − ) . . . (1 − ) ≤ sn k! n n n k=2 ≤ 2+ n X k=2 n X 1 1 1 =2+ − k(k − 1) k−1 k k=2 1 = 2+1− ≤3 n Es folgt en ≤ sn ≤ 3. Somit existieren die Grenzwerte e = lim en , s = lim sn n→∞ n→∞ und es gilt e ≤ s. Man nennt e die Eulersche Zahl. Die Konvergenz dieser Folge (en )n geht so langsam vonstatten, dass die en selbst für eine näherungsweise Berechnung von e nicht geeignet erscheinen. In der Tat haben wir e100 = 2.704813829, e500 = 2.715568521, e1000 = 2.716923932, e2000 = 2.717602569 110 KAPITEL 4. ANALYSIS - FOLGEN UND FUNKTIONEN e3000 = 2.71782892. Aber es gilt sogar e = s, und die Folge der sn konvergiert viel besser. Dazu beachten wir, dass für alle 2 ≤ k ≤ n gilt: (1 − 2 k−1 (k − 1)2 1 )(1 − ) . . . (1 − )≥1− n n n n Das zeigt man etwa mit der Bernoulliungleichung. (1 − 1 2 k−1 k − 1 k−1 k−1 (k − 1)2 )(1 − ) . . . (1 − ) ≥ (1 − ) ≥ 1 − (k − 1) =1− n n n n n n Damit erhalten wir aber : en = 2 + n X 1 1 2 k−1 (1 − )(1 − ) . . . (1 − ) k! n n n k=2 n n X (k − 1)2 1 X (k − 1)2 3 1 ≥ 2+ (1 − ) = sn − ≥ sn − k! n n k! n k=2 denn Pn k=2 (k−1)2 k! ≤ Pn 1 k=2 (k−2)! ≤ k=2 Pn 1 m=0 m! ≤ 3. Hieraus folgt s ≤ e. Weiter haben wir s10 = 2.718281801, s20 = 2.718281828, s30 = 2.7182818284 Ferner ist s30 − s20 < 10−19 . Beispiel: Die k.te Wurzel Sei a > 0 und k ≥ 2 ganz. Dann definieren wir rekursiv eine Folge: x1 = a, wenn a > 1, und x1 = 1, sonst und weiter xn+1 1 = k (k − 1)xn + a xk−1 n , n≥1 Ein einfaches Induktionsargument liefert, dass xn > 0 für alle n ∈ IN ist. Nun behaupten wir, es sei √ sogar xn ≥ k a . Für n = 1 ist dies richtig, da x1 so gewählt ist. Angenommen, es sei xkn ≥ a. Schreiben wir dann s := − k1 (1 − xak ), so wird n xn+1 = xn (1 + s) also mit der Bernoulliungleichung xkn+1 = xkn (1 + s)k ≥ xkn (1 + ks) = a 4.1. KONVERGENZ BEI ZAHLENFOLGEN 111 Gleichzeitig sehen wir: xn+1 1 = xn k a (k − 1) + k xn ≤ xn Die Folge ist also monoton fallend und nach unten beschränkt. Sie hat daher einen Grenzwert x0 . Die Rechenregeln für Grenzwerte greifen auch hier und liefern ! 1 a x0 = (k − 1)x0 + k−1 k x0 Lösen wir das nach x0 auf, so erhalten wir x0 = √ k a. Für Nichtkonvergenz einer Folge haben wir dieses Kriterium 4.1.9 Hilfssatz. Sei (an )n≥n0 eine Folge. Konvergiert sie gegen einen Wert a, so konvergiert auch jede Teilfolge (aνk )k gegen a. (Dabei ist (νk )k streng monoton wachsend und unbeschränkt). Insbesondere kann eine Folge nicht konvergieren, wenn es zwei Teilfolgen gibt, die gegen unterschiedliche Grenzwerte streben. Beweis. Zu ε > 0 wählen wir eine ganze Zahl n(ε) > 0, so dass |an − a| < ε, wenn n ≥ n(ε). Nun gibt es aber ein k(ε), so dass νk ≥ n(ε) für alle k ≥ k(ε). Folglich |aνk − a| < ε für alle k ≥ k(ε). Beispiele. 1) Die Folge ((−1)n )n konvergiert nicht. 2 −2 2) Die Folge an := (−1)n n2n+1 konvergiert gegen Null, die Folge an := (−1)n nn2 +1 hat keinen Grenzwert. 4.1.1 Konvergenz von Reihen Reihen sind Summen mit unendlich vielen Summanden. Wir überlegen in diesem Abschnitt, wann solche unendlichen Summen sinnvoll sind. P Definition. Sei (xn )n=0 eine Folge. Wir sagen die Reihe ∞ n=0 xn sei konvergent, wenn die Folge (sk )k der Pk Partialsummen sk = n=0 xn konvergiert. Ist s der Limes dieser Folge, so schreiben wir auch s= ∞ X xn . n=0 Die Reihe P∞ n=0 xn wird absolut konvergent genannt, wenn die Reihe P∞ n=0 |xn | konvergiert. P n Beispiel: a) Die geometrische Reihe. Ist −1 < q < 1, so konvergiert die Reihe P∞ n=0 qn absolut: Denn die geometrische Summenformel liefert uns für die Partialsummen von n=0 |q| bereits sk = k X n=0 |q|n = k X 1 − q k+1 1 − |q|k+1 , und qn = 1 − |q| 1−q n=0 112 KAPITEL 4. ANALYSIS - FOLGEN UND FUNKTIONEN Wir wissen schon, dass |q|k −→ 0, wenn k −→ ∞. Somit erhalten wir die absolute Konvergenz der geometrischen Reihe und zugleich ∞ X qn = n=0 b) Die Reihe (k ≥ 3): sk = P∞ k X n=2 1 n=2 n(n−1) . 1 1−q 1 1 − n1 . Es folgt für die k .te Partialsumme Wir beobachten, dass n(n−1) = n−1 k X 1 = n(n − 1) n=2 1 1 − n−1 n Dies ergibt ∞ X n=2 4.1.10 Hilfssatz. Ist die Reihe P∞ n=0 xn = k X n=2 k k−1 k n=2 n=1 n=2 X1 X1 X1 1 1 − = − =1− n−1 n n n k 1 =1 n(n − 1) konvergent, so muss (xn )n eine Nullfolge sein. Beweis. Denn xk = sk − sk−1 . Da beide Folgen gegen denselben Limes konvergieren, folgt die Behauptung. Beispiel: (Harmonische Reihe). Sind die Glieder einer Reihe Peine 1Nullfolge, so muss sie deshalb noch nicht konvergieren. Das zeigt sich bei ”harmonischen” Reihe ∞ n=0 n . Wäre sie konvergent, so müsste die Folge der Partialsummen (sk )k konvergieren. Stattdessen ist aber s2k − sk ≥ 1/2 für alle k. Folgender Satz erfordert wieder das Vollständigkeitsaxiom für R: 4.1.11 Satz. Jede absolut konvergente Reihe konvergiert. Indem wir die Rechenregeln über konvergente Folgen auf die Partialsummen konvergenter Reihen anwenden, können wir sofort folgende Rechenregeln für konvergente Reihen gewinnen: P P∞ 4.1.12 Satz. Angenommen, die Reihen ∞ n=0 xn und n=0 yn seien konvergent (bzw. absolut konvergent). Dann gilt P a) Auch die Reihe ∞ n=0 (xn + λyn ) konvergiert. Es gilt ∞ X (xn + λyn ) = n=0 ∞ X xn + λ n=0 ∞ X yn n=0 Pn b) Wenn beide Reihen absolut konvergieren, so auch das Cauchyprodukt ν=0 xν yn−ν , für n ≥ 0. Es gilt ! ∞ ! ∞ ∞ X X X zn = xn yn . n=0 n=0 n=0 P∞ n=0 zn , wobei zn = 4.1. KONVERGENZ BEI ZAHLENFOLGEN 113 Beweis. a) Klar. b) Die (2k).te Partialsumme s2k von 2k X ! |xn | n=0 2k X P∞ n=0 |zn | ist nicht größer als ! |yn | n=0 Da jeder Faktor nach oben beschränkt ist, ist es auch die Folge (s2k )k . Da weiter (sk )kP monoton wächst, existiert der Limes dieserP Folge. Damit haben P wir absolute Konvergenz der Reihe ∞ n=0 zn gesehen. n Schreiben wir jetzt Sn := k=0 |xk | und Tn := l=0 |yl |, so folgt | n X k=0 ! xk n X ! yl − n X zp | ≤ p=0 l=0 n X |yn−l | l=0 X ≤ l≤[n/2] ≤ n X |xj | j=l+1 n X |yn−l | |xj | + j=l+1 (Tn − T[n/2] ) ∞ X X |yn−l | n≥l>[n/2] |xj | + (Sn − S[n/2] ) j=0 n X |xj | j=[n/2]+1 ∞ X |yj | j=0 −→ o Konvergenzkriterien P 4.1.13 Satz. Sei ∞ n=0 an eine Reihe. P a) (Majorantenkriterium). Ist dann ∞ n=0 bn eine konvergente Reihe und |an | ≤ bn für alle n, so P∞ konvergiert die Reihe n=0 an absolut. P b) (Verdichtungskriterium) . Wenn an ≥ an+1 ≥ 0 für alle n, so konvergiert ∞ n=0 an genau dann, wenn die Reihe ∞ X 2n a2n n=0 konvergiert. c) (Quotientenkriterium). Wenn an 6= 0 für fast alle n und lim n→∞ |an+1 | < 1, |an | P so konvergiert die Reihe ∞ n=0 an absolut. d) (Wurzelkriterium). Wenn für fast alle n und lim n→∞ so konvergiert die Reihe P∞ n=0 an absolut. p n |an | < 1 , 114 KAPITEL 4. ANALYSIS - FOLGEN UND FUNKTIONEN Beweis. a) Es ist für alle k: k X |an | ≤ k X n=0 n=0 n+1 2X n bn ≤ S := ∞ X bn n=0 woraus alles folgt. b) Wir haben n 2 X aj ≤ 2 a2n ≤ 2 j=2n +1 aj , j=2n−1 +1 denn al ≤ a2n ≤ aj für alle j = 2n−1 + 1, ..., 2n und l = 2n + 1, ..., 2n+1 also k+1 2X n+1 am ≤ a0 + a1 + k 2X X aj n=0 j=2n +1 m=0 ≤ a0 + a1 + k X 2n a2n n=0 k X ≤ a0 + a1 + 2 n=0 n 2 X aj j=2n−1 +1 2k ≤ 2 X an n=0 Hieraus erhalten wir die Behauptung. 4.2. STETIGE FUNKTIONEN 4.2 115 Stetige Funktionen Der Funktionsbegriff Definition. Sind A und B Mengen, so verstehen wir unter einer Abbildung f : A −→ B eine Regel, nach der jedem Element a ∈ A ein eindeutig bestimmtes Element b ∈ B zugeordnet werden soll. Wir bezeichnen dieses Element b, da es durch a und f festgelegt ist, mit f (a). Wenn B ⊂ R, sprechen wir statt von Abbildungen von Funktionen. Bei uns wird A ⊂ R oder A ⊂ Rn sein. Beispiele. Weg-Zeit-Gesetz.Im freien Fall nimmt die Geschwindigkeit eines Körpers jede Sekunde um g = 9, 81m/s2 zu. Hatte der Körper eine Anfangsgeschwindigkeit v0 , so ist die nach t Sekunden erreichte Geschwindigkeit v = g · t + v0 Die vom Körper durchfallene Strecke ist gegeben durch 1 s = g t2 + v0 t 2 Wir sehen hier, dass die Geschwindigkeit und die zurückgelegte Strecke von der Zeit abhängen. Bei vorgegebener Zeit lassen sich beide durch die angegebenen Gleichungen berechnen. Energie Die Bewegungsenergie eines sich in gerader Richtung bewegenden Teilchens hängt von dessen Gechwindigkeit v ab: 1 E = mv 2 2 Ohmsches Gesetz. Hat ein Körper einen elektrischen Widerstand R, und wird er von Strom durchflossen, der von einer Spannungsquelle der Stärke U erzeugt wird, so ist die Stromstärke gerade I= U R Wieviel Strom durch den Körper fließt, hängt also von dessen elektrischem Widerstand ab. Pendel. Schwingt ein Pendel mit kleiner Auslenkung an einem Faden der Länge l, so ist die Schwingdauer T durch s l T = 2π g gegeben. Sie ist also eine Wurzelfunktion der Fadenlänge. Schwerkraft 116 KAPITEL 4. ANALYSIS - FOLGEN UND FUNKTIONEN Zwei Körper der Massen m1 und m2 mit Abstand r üben aufeinander eine Anziehungskraft F aus. Nach Newton ist diese durch m1 m2 F =γ 2 r gegeben. (Dabei ist γ die Gravitationskonstante). Relativistische Masse Nach Einsteins Relativitätstheorie hängt die Masse eines Teilchens von seiner Geschwindigkeit v ab: m= p m0 , 1 − ( vc )2 wobei c die Lichtgeschwindigkeit und m0 die Ruhemasse des Teilchens bedeuten. Schwingendes Teilchen Hängt ein Teilchen an einer Feder mit Federkonstanten k, so ist seine Auslenkung aus der Ruhelage durch √ x = x0 sin( kt) zu beschreiben, wobei x0 die Maximalauslenkung (Amplitude) bedeutet. Glühbirne Bei einer Glühbirne gilt das Ohmsche Gesetz für die Beziehung zwischen Spannung und Stromstärke nicht mehr. Stattdessen hat man U = AI 3 + BI 2 + CI + D mit geeigneten Konstanten A, ..., D. Zu einer Funktion f : I −→ R gehört ein Graph, das ist die folgende Menge in R2 : Graph(f ) := {(x, y) | y = f (x)} Beispiele: a) Lineare Funktionen. ( Sie spielen beim Geschwindigkeits-Zeit-Gesetz ( freier Fall) eine Rolle ). Das ist eine Funktion vom Typ f (x) = ax + b 4.2. STETIGE FUNKTIONEN 117 mit a 6= 0. a y 1 b x 0 Dabei bedeutet b den y-Achsenabschnitt und a die Steigung der Geraden. Folgende beiden Punkte liegen auf der Geraden und legen daher ihren Verlauf eindeutig fest: Durch b wird angegeben, wo die Gerade die y-Achse schneidet und a beschreibt die Steigung der Geraden. b)Parabeln Wir sehen uns die folgende Funktion an: f (x) = ax2 + bx + c Dabei ist a 6= 0. Ihr Schaubild sieht so aus: Ist a > 0, so ist die Parabel nach oben geöffnet 6 5 4 3 -2 -1 1 2 3 4 118 KAPITEL 4. ANALYSIS - FOLGEN UND FUNKTIONEN und für a < 0 nach unten: -2 -1 1 2 3 4 5 -2 -4 -6 -8 Ist a > 0, so können wir den tiefsten Punkt auf der Parabel ausrechnen: Eine kleine Rechnung liefert uns: f (x) = a(x + D b 2 ) − 2a 4a mit D = b2 − 4ac (Diskriminante). Der erste Term ist immer ≥ 0 und verschwindet, wenn x = xS = −b/2a. Dann wird f (xS ) = −D/4a. Der tiefste Punkt auf der Parabel, der sog. Scheitel der Parabel ist also b D S = (xS , f (xS )) = − , − . 2a 4a Entsprechendes gilt, wenn a < 0 ist. Dieselbe Rechnung führt wiederum auf den Punkt S. Er ist jetzt der höchstgelegene Punkt auf der Parabel. Wir können ausrechnen, ob und ggf. wo die Parabel die reelle Achse trifft. Wir müssen nur die Gleichung f (x) = 0 lösen. Lösungen gibt es genau dann, wenn D ≥ 0 ist. Diese sind gegeben durch x1,2 √ b D =− ± 2a 2a Man nennt x1 , x2 auch die Nullstellen der Funktion f . In den beiden Beispielen haben wir f (x) = 2x2 − 4x − 1 mit Nullstellen x1 = 1 + 1√ 6, 2 x2 = 1 − 1√ 6 2 und Scheitel bei S = (1 | − 3). Beim zweiten Beispiel ist f (x) = − 12 x2 + x + 3 mit Nullstellen bei x1 = 1 + und Scheitel bei S = (1 | − 7/2). c) Kurven 3. Grades: √ 7, x2 = 1 − √ 7 4.2. STETIGE FUNKTIONEN 119 Das sind die Graphen folgender Funktionen f (x) = ax3 + bx2 + cx + d, mit a 6= 0 Ihr Schaubild ist komplizierter. Je nach Größe von a, ..., d kann es drei oder nur eine Nullstelle geben (wie wir schon sahen, ist ihre Berechnung mühsam): 4 2 -2 4 2 -2 Schaubild von f (x) = 0.2x3 − 0.5x2 − 2x + 2. Oder: 60 40 20 -3 -2 -1 1 2 3 4 -20 c) Hyperbelfunktionen. Das sind Funktionen vom Typ a , wobei a 6= 0 x Man beachte, dass diese Funktionen in 0 nicht definiert sind. f (x) = 120 KAPITEL 4. ANALYSIS - FOLGEN UND FUNKTIONEN Das Schaubild sieht so aus: 40 20 -1 -0.5 1 0.5 -20 -40 d) Wurzelfunktionen: Diese haben die Gestalt f (x) = x1/k , x ≥ 0, mit k ∈ ZZ, k > 1 und sind nur auf R+ erklärt. 1.75 1.5 1.25 1 0.75 0.5 0.25 0.5 1 1.5 2 2.5 3 Dies ist der Graph für k = 2, und hier ist der Graph für k = 4: 1.2 1 0.8 0.6 0.4 0.2 0.5 1 1.5 2 2.5 3 Begriffsbildungen bei Funktionen Definition. Sei a > 0 und f : (−a, a) −→ R eine Funktion. Wir nennen f gerade (ungerade), wenn ihr Graph symmetrisch zur y-Achse (bzw. punktsymmetrisch zum Ursprung) ist, also: 4.2. STETIGE FUNKTIONEN 121 i) f ist gerade, wenn gilt: (−x, y) ∈ Graph(f ) genau dann, wenn (x, y) ∈ Graph(f ). ii) f ist ungerade, wenn gilt: (−x, −y) ∈ Graph(f ) genau dann, wenn (x, y) ∈ Graph(f ). a) Eine Funktion der Form f (x) = x2 + bx + c ist genau dann gerade, wenn b = 0. b) Eine Hyperbelfunktion: f (x) = a/x ist stets ungerade. c) Eine lineare Funktion f (x) = ax + b ist ungerade genau dann, wenn b = 0. Anders als bei Zahlen kann es vorkommen, dass eine Funktion f weder gerade noch ungerade ist, etwa die Funktion f (x) = x + 2. Definition. Ist I ein Intervall und f : I −→ R eine Funktion, so sagen wir a) Ein Wert x0 ∈ I sei eine Nullstelle von f , wenn f (x0 ) = 0 gilt, b) f sei monoton wachsend, wenn für x0 , x00 ∈ I gilt: Ist x0 < x00 , so ist f (x0 ) ≤ f (x00 ) c) f sei monoton fallend, wenn für x0 , x00 ∈ I gilt: Ist x0 < x00 , so ist f (x0 ) ≥ f (x00 ) d) f sei streng monoton wachsend, wenn für x0 , x00 ∈ I gilt: Ist x0 < x00 , so ist f (x0 ) < f (x00 ) e) f sei streng monoton fallend, wenn für x0 , x00 ∈ I gilt: Ist x0 < x00 , so ist f (x0 ) > f (x00 ). Beispiele. a) Lineare Funktionen f (x) = Ax + B mit A 6= 0 sind streng monoton wachsend, wenn A > 0 und streng monoton fallend, wenn A < 0. b) Die Parabelfunktion f (x) = x2 + x + 4 ist auf (−∞, −1/2) streng monoton fallend und streng monoton wachsend auf (−1/2, ∞). Definition. Eine Funktion f : R −→ R wird periodisch genannt, wenn eine Zahl p > 0 existiert, so dass f (x + p) = f (x) für alle x ∈ R gilt. Beispiel. Sei etwa f (x) = x − [x] − 1/2. Dann hat f die Periode 1. Rechnen mit Funktionen Definition. Sind f, g : I −→ R Funktionen und ist α ∈ R, so definieren wir die Funktionen f + g, αf und f g durch: (f + g)(x) := f (x) + g(x), (αf )(x) := αf (x) (f g)(x) := f (x)g(x) Wenn N die Menge der Nullstellen von g bedeutet, so setzen wir für x ∈ I \ N : f f (x) (x) := g g(x) p √ √ Ist f (x) ≥ 0 für alle x ∈ I, so können wir k f durch k f (x) := k f (x) erklären. Allgemeiner trifft man die folgende Definition. a) Sind I und J Intervalle und f : I −→ J und g : J −→ R Funktionen, so setzen wir g ◦ f (x) := g( f (x) ), f ür x ∈ I 122 KAPITEL 4. ANALYSIS - FOLGEN UND FUNKTIONEN und nennen g ◦ f die Hintereinanderschaltung oder auch Komposition von g mit f . b) Wenn I und J zwei Intervalle sind, so nennen wir eine Funktion f : I −→ J auch invertierbar (oder umkehrbar), wenn eine Funktion g : J −→ I existiert mit g◦f (x) = x für alle x ∈ I und f ◦g(y) = y für alle y ∈ J. Ist f invertierbar, so ist die zugehörige Abbildung g : J −→ I eindeutig bestimmt und wird als Umkehrfunktion von f bezeichnet. Man schreibt auch g = f −1 . Achtung: f −1 (y) darf nicht 1/f (y) verwechselt werden! Beispiel. Sei etwa I = (−1/2, ∞) und f : I −→ R definiert durch f (x) = x2 + x + 4. Dann wird f (x) = (x + 1/2)2 + 15/4, also ist f (x) > 15/4 für x ∈ I. Setzen wir J = (15/4, ∞), so wird f : I −→ J invertierbar, und es wird r 1 15 −1 . f (y) = − + y − 2 4 Stetigkeit Definition. a) Sei I ein offenes Intervall und f : I −→ R eine Funktion. Ist x0 ∈ I, so sagen wir, f strebe mit x −→ x0 gegen einen Wert c, wenn gilt: Für jede Folge (xn )n von Punkten aus I, die gegen x0 konvergiert, ist die Folge der Bilder (f (xn ))n gegen c konvergent. Wir schreiben auch einfach: lim f (x) = c x→x0 b) Wir nennen eine Funktion f : I −→ R in einem Punkte x0 ∈ I stetig, wenn gilt lim f (x) = f (x0 ) x→x0 f wird stetig auf I genannt, wenn es in jedem Punkt von I stetig ist. Entsprechend wird Unstetigkeit erklärt. Beispiele. i) Jede konstante Funktion ist überall stetig. ii) Die Funktion f (x) = [x], für I = R. Diese Funktion ist in allen Punkten x0 ∈ R \ ZZ stetig und unstetig in den Punkten x0 ∈ ZZ. Denn: Ist x0 ∈ R \ ZZ, so ist f auf einem kleinen x0 enthaltenenden offenen Intervall konstant, also stetig. Ist nun x0 ∈ ZZ, so sehen wir uns die Folge (xn )n an, wobei xn := x0 + (−1)n /n sein soll. Es gilt xn −→ x0 , aber die Folge (f (x2n ) )n ist konstant, alle Glieder sind gleich [x0 ], und die Folge (f (x2n+1 ))n ist ebenfalls konstant, alle ihre Glieder sind gleich [x0 ] − 1. Somit kann die Folge (f (xn ))n keinen Grenzwert haben. iii) Die Funktionen f (x) = xk sind für ganzzahlige k > 0 auf ganz R stetig. 4.2.1 Satz. Sei f : I −→ R eine Funktion und x0 ∈ I. Genau dann ist f in x0 stetig, wenn gilt (1) Zu jedem ε > 0 gibt es ein δ > 0, so dass |f (x) − f (x0 )| < ε, für alle x ∈ I mit |x − x0 | < δ. 4.2. STETIGE FUNKTIONEN f(x) f(x ) 0 123 2ε x x0 2δ Beweis. Angenommen, das Kriterium (1) sei erfüllt. Ist dann (xn )n ⊂ I eine Folge mit Limes x0 , so konvergiert (f (xn )n gegen f (x0 ). Zum Beweis sei ε > 0 beliebig gewählt und δ w, width=10cmie im Kriterium (1) zu ε. Es gibt ein n0 ∈ IN mit |xn − x0 | < δ für alle n ≥ n0 . Für diese n haben wir dann |f (xn ) − f (x0 )| < ε. Angenommen nun, das Kriterium (1) ist verletzt. Dann gibt es ein ε > 0 mit der folgenden Eigenschaft: Zu jedem k ≥ 1 (ganzzahlig) gibt es ein xk ∈ I mit |xk − x0 | < 1/k, aber |f (xk ) − f (x0 )| ≥ ε. Offenbar konvergiert (xk )k gegen x0 , aber (f (xk ))k nicht gegen f (x0 ), ein Widerspruch zur Stetigkeit von f in x0 . Beispiel. Ist etwa f (x) = 3x3 − 2x und x0 = 1, und ε = 0.1, so können wir δ = 1/70 wählen. Denn wegen f (1) = 1 ist |f (x) − f (1)| ≤ |3(x3 − 1) − 2(x − 1)| = |x − 1||3x2 + 3x + 3 − 2| = |x − 1||3x2 + 3x + 1| < 7|x − 1| wenn nur |x| < 1.25. Wenn daher |x − 1| < 1/70, wird |f (x) − 1| < 0.1. Folgerung.Ist f wie zuvor in x0 stetig und f (x0 ) 6= 0, so gibt es ein Intervall J ⊂ I mit f (x) 6= 0 für alle x ∈ J. Zum Beweis wende man das Kriterium (1) auf ε = |f (x0 )|/2 an. Rechenregeln für Stetigkeit 4.2.2 Satz. Sei I ein offenes Intervall und f, g : I −→ R stetig in einem Punkt x0 ∈ I. Dann sind f + g, αf (mit α ∈ R), und f g ebenfalls in x0 stetig, und es ist lim (f + g)(x) = f (x0 ) + g(x0 ), lim (αf )(x) = αf (x0 ), lim (f · g)(x) = f (x0 ) · g(x0 ) x→x0 x→x0 x→x0 Wenn g(x0 ) 6= 0, so ist weiter: f f (x0 ) lim ( )(x) = x→x0 g g(x0 ) 4.2.3 Satz. Sind I und J offene Intervalle und f : I −→ J und g : J −→ R Funktionen, so gilt: Ist f in x0 ∈ I stetig und g in y0 := f (x0 ), so ist auch g ◦ f in x0 stetig und lim (g ◦ f )(x) = g(f (x0 )) x→x0 124 KAPITEL 4. ANALYSIS - FOLGEN UND FUNKTIONEN Beweis. Dies alles folgt aus den Rechenregeln über Grenzwerte von Folgen. 4.2.4 Folgerung. Sei I ein offenes Intervall und x0 ∈ I. Ist f : I −→ R in x0 stetig, so auch |f |, und limx→x0 |f (x)| = |f (x0 )|. Definition. Ist I ein offenes Intervall und x0 ∈ I, so sagen wir, eine Funktion f : I \ {x0 } −→ R habe in x0 eine Definitionslücke. Man nennt f in x0 stetig fortsetzbar, wenn ein Wert c existiert, so dass die durch f (x) , wenn x ∈ I \ {x0 } fb(x) := c , wenn x = x0 nunmehr auf ganz I erklärte Funktion in x0 stetig wird. Ist f in x0 nicht stetig fortsetzbar, so nennen wir f wieder in x0 unstetig. Beispiele. Die Funktion f (x) = 1/x, ist auf R \ {0} erklärt mit einer Definitionslücke in 0. Man kann f in 0 nicht stetig fortsetzen. Denn: Für keinen Wert c ist limx→0 f (x) = c, da die Folge (f ((−1)n /n)n nicht konvergiert. 3 +1 b) Die Funktion g(x) = xx+1 ist auf R \ {−1} definiert, kann aber in x0 = −1 stetig fortgesetzt 3 2 werden: Denn x + 1 = (x + 1)(x − x + 1). Man wähle c = 3. Wichtige Sätze über stetige Funktionen Die folgenden Sätze beschreiben grundlegende Eigenschaften stetiger Funktionen und basieren auf der Eigenschaft (4.1.2)der reellen Zahlen. 4.2.5 Satz. Ist I = [a, b] ein beschränktes abgeschlossenes Intervall, so ist jede auf I stetige Funktion f dort beschränkt: Es gibt ein S > 0 mit |f (x)| ≤ S für alle x ∈ I und weiter Punkte xmin , xmax ∈ I mit f (xmin ) ≤ f (x) ≤ f (xmax ) für alle x ∈ I, insbesondere ist f (I) ⊂ [f (xmin ), f (xmax )]. Beweis. Anderenfalls gäbe es eine Folge (xn )n mit |f (xn )| > n. Wir können hieraus eine Teilfolge auswählen, die gegen einen Punkt x0 ∈ I konvergiert. Dann könnte aber limx→x0 |f (x)| nicht existieren, ein Widerspruch. Sei nun S+ die kleinste obere Schranke von f (I). Dann gibt es eine Folge (tj )j ⊂ I mit f (tj ) −→ S+ mit j −→ ∞. Aus dieser können wir eine konvergente Teilfolge auswählen. Ihren Limes nennen wir xmax . Dann ist f (xmax ) = S+ . Entsprechend argumentieren wir beim Nachweis von xmin . 4.2.6 Satz (Zwischenwertsatz). Sei I = [a, b] ein beschränktes abgeschlossenes Intervall und f : I −→ R stetig. Angenommen, es sei f (a) < f (b). Dann gibt es zu jedem t ∈ (f (a), f (b)) ein xt ∈ I mit f (xt ) = t. 4.2. STETIGE FUNKTIONEN 125 Beweis. (Bisektionsverfahren). Wir setzen a01 = (a + b)/2. Wenn f (a01 ) = t, sind wir fertig. Sonst gilt: 1.Fall: f (a01 ) < t. Dann sei a1 := a01 , b1 := b – 2.Fall: f (a01 ) > t. Dann sei a1 = a, b1 := a01 . Es folgt nun a ≤ a1 ≤ b1 ≤ b, und b1 − a1 = (b − a)/2, sowie (f (a1 ) − t)(f (b1 ) − t) < 0. Angenommen, wir haben schon a1 ≤ ... ≤ aj ≤ bj ≤ bj−1 ≤ ... ≤ b1 gefunden, so dass bj − aj = (b − a)/2j und (f (aj ) − t)(f (bj ) − t) < 0, dann setzen wir a0j+1 = (aj + bj )/2 und unterscheiden 3 Fälle: Wenn f (aj+1 ) = t, ist das Verfahren beendet. Wenn f (a0j+1 ) < t, sei aj+1 = a0j+1 , bj+1 = bj . Wenn f (a0j+1 ) > t, sei aj+1 = aj , bj+1 = a0j+1 . Dann ist bj+1 − aj+1 = (b − a)/2j+1 und (f (aj+1 ) − t)(f (bj+1 ) − t) < 0. Die Folgen (aj )j und (bj )j streben einem gemeinsamen Grenzwert xt zu, für den (f (xt ) − t)2 ≤ 0, also f (xt ) = t ist. Beispiel. Gesucht sind die Nullstellen von f (x) = x3 + x − 3. Da für x > y gilt: f (x) − f (y) = (x − y)(x2 + xy + y 2 + 1) > 0, kann es höchstens eine Nullstelle geben. Da f (1) < 0 < f (1.5), gibt es also genau eine Nullstelle für f . Im Bisektionsverfahren wählen wir a = 1 und b = 1.5, sowie a01 = (a + b)/2 = 1.25. Da f (a01 ) > 0, muss a1 = a, b1 = a01 = 1.25 genommen werden. Sei a02 := (a1 + b1 )/2 = 1.125. Da f (a02 ) < 0, wählen wir nun a2 = 1.125, b2 = b1 = 1.25. Sei a03 := (a2 + b2 )/2 = 1.1875. Da f (a03 ) > 0, wählen wir nun a3 = a2 = 1.125, b3 = a03 = 1.1875. Sei a04 := (a3 + b3 )/2 = 1.15625. Da f (a04 ) < 0, wählen wir a4 = a04 , b4 = b3 . So fahren wir fort. Irgendwann finden wir f (1.2134) ≈ −0.00006 und f (1.2135) ≈ 0.0004. 4.2.7 Folgerung: Ist f : I −→ R stetig und nicht-konstant, und haben xmin , xmax dieselbe Bedeutung wie bisher, so gilt f (I) = [f (xmin ), f (xmax )]. Anwendung auf quadratische Ungleichungen. a) Sei f : R −→ R stetig und habe genau 2 Nullstellen x1 , x2 . Wir setzen M := {x | f (x) < 0} und P := {x | f (x) > 0}. Es sei x1 < x2 . Angenommen, es gebe t, s1 , s2 ∈ R mit s1 < x1 < t < x2 < s2 mit f (t) < 0 < f (s1 ), f (s2 ). Dann ist M = (x1 , x2 ) und P = R \ [x1 , x2 ]. Denn es gilt t ∈ M . Wäre f (y) > 0 für ein y ∈ (x1 , x2 ), so hätte f zwischen t und y eine weitere Nullstelle, entgegen der Annahme, f habe nur die Nullstellen x1 und x2 . Somit ist (x1 , x2 ) ⊂ M . Umgekehrt sei x ∈ M . Wäre x ≤ x1 , so folgte wegen f (s1 ) > 0, dass eine Nullstelle für f zwischen x und s1 vorkommen müsste, Widerspruch. Also x > x1 . Genauso kann x ≥ x2 nicht sein. Das ergibt M = (x1 , x2 ). Klar ist nun P = R \ (M ∪ {x1 , x2 }) = R \ [x1 , x2 ]. b) Die Berechnung der Menge S := {x | |4x − 1| < |3x + 5|} vereinfacht sich nun. Zunächst haben wir M = {x | 16x2 − 8x + 1 < 9x2 + 30x + 25} = {x | 7x2 − 38x − 24 < 0} 24 38 < 0} = {x | x2 − x − 7 7 = {x | f (x) < 0}, 24 4 wobei f (x) = x2 − 38 7 x − 7 . Berechnen wir die Nullstellen x1 , x2 von f , so finden wir x1 = − 7 , x2 = 6. 4 Da f (−10), f (10) > 0 und f (0) < 0, folgt nun S = (− 7 , 6). 126 KAPITEL 4. ANALYSIS - FOLGEN UND FUNKTIONEN Schließlich zeigen wir noch, dass die Umkehrfunktion zu einer invertierbaren stetigen Funktion wieder stetig ist. 4.2.8 Satz. Sei f : [a, b] −→ [c, d] stetig und invertierbar. Dann ist auch die Umkehrfunktion g = f −1 : [c, d] −→ [a, b] stetig. Beweis. Sei y0 ∈ [c, d]. Angenommen, g sei in y0 unstetig. Dann gibt es ein ε > 0 und eine Folge (yn )n mit Limes y0 , so dass |g(yn ) − g(y0 )| ≥ ε für alle n. Wir schreiben xn = g(yn ) und x0 = g(y0 ). Wir finden eine konvergente Teilfolge (xnk )k von (xn )n mit einem Limes x0 . Es gilt f (x0 ) = lim f (xnk ) = lim ynk = y0 = f (x0 ) k→∞ k→∞ woraus folgt, dass x0 = x0 sein muss. Auf der anderen Seite ist aber |xnk − x0 | = |xnk − x0 | = |g(yn ) − g(y0 )| ≥ ε für alle k, ein Widerspruch. Der Graph der Umkehrfunktion zu einer stetigen Funktion entsteht aus dem Graphen von f durch Spiegeln an der Geraden y = x. -1 f (x) f( x ) x 4.3 Rationale Funktionen A) Polynome 4.3. RATIONALE FUNKTIONEN 127 Definition. Unter einer ganzrationalen Funktion oder einem Polynom verstehen wir eine Funktion f : R −→ R von der Form f (x) = an xn + an−1 xn−1 + ... + a1 x + a0 mit Koeffizienten an , ...., a0 , wobei an 6= 0. Man nennt n den Grad des Polynoms und an seinen Leitkoeffizienten. Beispiele. a) Sei U > 0. Der Flächeninhalt eines Rechtecks mit Umfang U , bei dem eine Seite die Länge x hat, ist gegeben durch 1 f (x) = x(U − 2x) : Polynom vom Grad 2 2 b) Wird ein Kapital K0 mit x Prozent pro Jahr verzinst, so wächst es in 10 Jahren auf K(x) = (1 + x 10 ) K0 : Polynom vom Grad 10 100 Der Nutzen der Polynome ist durch ihre guten Eigenschaften begründet: Z.B.: a) Polynome sind rechnerischen Methoden besonders gut zugänglich b) Die bei der Bearbeitung von Problem aus Naturwissenschaft und Technik auftretenden Funktionen lassen sich in guter Näherung durch Polynome ersetzen. (Man denke an Interpolationen) c) Alle stetigen Funktionen lassen sich auf beschränkten Intervallen ”gut” durch eine geeignete Polynomfolge (fk )k approximieren: √ Zum Beispiel kann man auf [−1, 1] für die Funktion g(t) = 1 − t die Polynome k fk (t) := 1 − 1 X 12 (1 − 21 )(2 − 12 ) . . . (n − 1 − 21 ) n t 2 n! n=1 verwenden. Das bedeutet, dass die Polynome fk (1 − x2 ) die Betragsfunktion x 7−→ |x| gut approximieren. Wir untersuchen zunächst elementare Eigenschaften von Polynomen. 4.3.1 Hilfssatz. a) Jedes Polynom f ist stetig auf ganz R. b) Ist f ein Polynom und k ≥ 0 ganz, so dass xk f (x) = 0 für alle x, so ist schon f (x) = 0 für alle x. c) Ist f (x) = an xn + an−1 xn−1 + ... + a1 x + a0 ein Polynom, so ist genau dann f (x) = 0 (wir sagen auch f = 0, oder f sei das Nullpolynom), wenn alle Koeffizienten von f Null sind. d) Sind f (x) = an xn + an−1 xn−1 + ... + a1 x + a0 und g(x) = bm xm + bm−1 xm−1 + ... + b1 x + b0 Polynome, so folgt aus f = g, dass m = n und ak = bk für alle k gilt. Beweis. a) Ein Polynom ist aus stetigen Funktionen zusammengesetzt. Die Rechenregeln für Stetigkeit greifen in diesem Falle. b) Für alle x 6= 0 folgt zuerst f (x) = 0. Weiter ist aber auch: f (0) = limn→∞ f (1/n) = 0, da ja f (1/n) = 0 für alle n. c) Wir argumentieren durch Induktion: a0 = f (0) = 0. Sei k < n. Angenommen, wir wissen schon, dass a0 = a1 = ... = ak = 0 ist. Dann haben wir aber xk+1 f1 (x) = f (x) = 0, mit f1 (x) = ak+1 + ak+2 x + ... + an xn−k−1 . Also folgt nach a) schon, dass f1 = 0, also ak+1 = f1 (0) = 0. 128 KAPITEL 4. ANALYSIS - FOLGEN UND FUNKTIONEN d) Man wende c) auf f − g an. Nullstellen bei Polynomen 4.3.2 Hilfssatz. a) Ist x0 ∈ R beliebig, so gilt: a) Zu jedem ganzen k ≥ 1 findet man ein Polynom hk vom Grad k − 1 mit xk − xk0 = (x − x0 )hk (x) b) Ist f ein Polynom, so gibt es (genau) ein Polynom f1 mit: f (x) = f (x0 ) + (x − x0 )f1 (x) Der Grad von f1 ist n − 1. Beweis. a) Mit der geometrischen Summenformel können wir direkt sehen, dass xk − xk0 k−1 = xk−1 + x0 xk−1 + x20 xk−2 + ... + xk−2 0 x + x0 x − x0 Das Polynom auf der rechten Seite eignet sich daher als hk (x). Zu b) Wir schreiben f (x) = an xn + an−1 xn−1 + ... + a1 x + a0 . Dann wird f (x) − f (x0 ) = n X k ak (x − xk0 ) = (x − x0 ) k=1 n X ak hk (x) k=1 P Das Polynom f1 = nk=1 ak hk leistet das Gewünschte. Ist g1 ein Polynom mit derselben Eigenschaft, so ist f1 (x) = g1 (x) für alle x 6= x0 . Analog zu früher erhalten wir daraus f1 = g1 . 4.3.3 Folgerung. a) Hat ein Polynom f in x0 eine Nullstelle, so ist f (x) = (x − x0 )f1 (x) mit einem geeigneten Polynom (n − 1).ten Grades. b) Es gibt eine Zahl ν0 ≤ n und ein (eindeutig bestimmtes) Polynom g1 vom Grade n − ν0 , so dass f (x) = (x − x0 )ν0 g1 (x) und weiter g1 (x0 ) 6= 0. c) Hat f die paarweise verschiedenen Nullstellen x1 , ..., xr , so gibt es ν1 , ..., νr ∈ {1, ..., n} und ein Polynom g vom Grade n − ν1 − ... − νr mit g(x) 6= 0, für alle x ∈ R und f (x) = (x − x1 )ν1 · · · · · (x − xr )νr g(x) Beweis. a) Klar. b) und c): Man iteriere das Resultat aus a). Definition. Man nennt die Zahlen ν1 , .., νr die Vielfachheiten der x1 , ..., xr . 4.3. RATIONALE FUNKTIONEN 129 4.3.4 Folgerung. Ein Polynom f vom Grad n kann niemals mehr als n Nullstellen (mit Vielfachheit gezählt) haben. Die systematische Berechnung der Nullstellen eines Polynoms ist stets möglich, solange dieses einen Grad von höchstens 4 hat. Für Polynome vom Grad ≥ 5 gibt es kein allgemein anwendbares Berechnungsverfahren. (Beispiel: f (x) = x5 − x − 1). Auswertung von Polynomfunktionen mit dem Hornerschen Schema Hier ist ein Beispiel einer Situation, in der man eine Polynomfunktion auswerten muss: Beispiel: Biegelinie eines Balkens Ein homogener Balken der Länge l mit konstanter Querschnittsfläche wird einseitig fest eingespannt und an freien Ende durch eine Kraft F auf Biegung beansprucht. x0 l x 0 y(x0 ) F Biegelinie y Ist E der Elastizitätsmodul des Materials und I das Flächenträgheitsmoment des Balkenquerschnitts, so ist für x ∈ [0, l] die Durchbiegung des Balken an der Stelle x durch: y(x) = F · l3 x 4 x x ( ) − 4( )3 + 6( )2 . 24E · I l l l gegeben. Es stellt sich die Frage, wie man jetzt mit möglichst kleinem Rechenaufwand Polynomfunktionen auswerten kann. Das Horner-Schema ist ein Rechenverfahren, das gerade dies erlaubt. Sei f (x) = an xn + an−1 xn−1 + ... + a1 x + a0 ein Polynom vom Grade n ≥ 1 und x0 ∈ R. Wir können f als f (x) = f (x0 ) + (x − x0 )f1 (x) 130 KAPITEL 4. ANALYSIS - FOLGEN UND FUNKTIONEN schreiben. Mit dem Hornerschema finden wir f (x0 ) und zusätzlich die Koeffizienten des Polynoms f1 . Das funktioniert so: Wenn wir f1 als f1 (x) = bn−1 xn−1 + bn−2 xn−2 + ... + b1 x + b0 schreiben, so folgt durch Ausmultiplizieren: f (x) − f (x0 ) = (x − x0 )(bn−1 xn−1 + bn−2 xn−2 + ... + b1 x + b0 ) = bn−1 xn + (bn−2 − x0 bn−1 )xn−1 + (bn−3 − x0 bn−2 )xn−2 + ... + (b0 − x0 b1 )x − x0 b0 Durch Koeffizientenvergleich finden wir: bn−1 = an bn−2 − x0 bn−1 = an−1 bn−3 − x0 bn−2 = an−2 .. .. .. . . . b0 − x0 b1 = a1 −x0 b0 = a0 − f (x0 ) also bn−1 = an bn−2 = an−1 + bn−1 x0 bn−3 = an−2 + x0 bn−2 .. .. .. . . . bn−k = an−k+1 + bn−k+1 x0 .. .. .. . . . b1 = a2 + b2 x0 b0 = a1 + b1 x0 f (x0 ) = a0 + b0 x0 = an−1 + an x0 = an x20 + an−1 x0 + an−2 .. . = an xk−1 + an−1 xk−2 + ... + an−k+1 0 0 .. . + ... + a2 = an x0n−2 + an−1 xn−3 0 + ... + a2 x0 + a1 = an x0n−1 + an−1 xn−2 0 Zum praktischen Ausrechnen von f (x0 ) verfahren wir so: • Wir legen wir ein Schema von zunächst 3 Zeilen und n + 1 Spalten an, • In die erste schreiben wir jetzt die Koeffizienten, angefangen bei an bis zum konstanten Term a0 . In der j. ten Spalte der ersten Zeile steht also an−j+1 . Die erste Stelle der zweiten Zeile bleibt leer. In die erste Stelle der dritten Zeile wird an ( = bn−1 ) eingesetzt. • An der zweiten Stelle der zweiten Zeile setzen wir x0 an ein. An der zweiten Stelle der dritten Zeile tragen wir die Summe aus der zweiten Stelle der ersten und zweiten Zeile ein. Das Ergebnis ist nichts anderes als bn−2 . • An der dritten Stelle der zweiten Zeile setzen wir x0 bn−2 ein An die dritte Stelle der dritten Zeile kommt die Summe aus den Einträgen der dritten Stelle der ersten und zweiten Zeile. Das ist gerade bn−3 . 4.3. RATIONALE FUNKTIONEN 131 So fahren wir fort und erhalten an der n.ten Stelle der dritten Zeile gerade den Koeffizienten b0 . Die (n + 1).te Stelle dieser Zeile aber enthält das gewünschte f (x0 ). an ·x0 + bn−1 an−1 an x0 = an−1 + an x0 bn−2 bn−3 an−2 bn−2 x0 = bn−2 x0 + an−2 ... ... ... ... ... ... ... ... b1 a1 b1 x0 b0 a0 b0 x0 f (x0 ) Ein Beispiel dazu: Sei f (x) = 2x4 − 3x3 + x + 4 und x0 = 3. Dann haben wir folgendes Hornerschema: 2 ·3 + 2 -3 6 3 0 9 9 1 27 28 4 84 88 Es folgt weiter: f (x) = 88 + (x − 3)(2x3 + 3x2 + 9x + 28) Wenn wir das Hornerschema nun für f1 (x) = 2x3 + 3x2 + 9x + 28 zu dem obigen Hornerschema hinzufügen, so erhalten wir: 2 ·3 + ·3 + 2 2 -3 6 3 6 9 0 9 9 27 36 1 27 28 108 136 4 84 88 Das bedeutet: f1 (x) = 136 + (x − 3)(2x2 + 9x + 136) Das Hornerschema für f2 (x) = 2x2 + 9x + 36 führt auf 2 ·3 + ·3 + ·3 + 2 2 2 -3 6 3 6 9 6 15 0 9 9 27 36 45 81 1 27 28 108 136 4 84 88 Es folgt f2 (x) = 81 + (x − 3)(2x + 15) und das Hornerschema für f3 (x) = 2x + 15 ergibt schließlich das sogenannte 132 KAPITEL 4. ANALYSIS - FOLGEN UND FUNKTIONEN vollständige Hornerschema: 2 -3 0 1 4 ·3 6 9 27 84 + 2 3 9 28 88 ·3 6 27 108 + 2 9 36 136 ·3 6 45 + 2 15 81 ·3 6 + 2 21 Damit haben wir gefunden: f (x) = 88 + (x − 3)f1 (x) = 88 + (x − 3)(136 + (x − 3)(2x2 + 9x + 36)) = 88 + (x − 3)(136 + (x − 3)(81 + (x − 3)(21 + 2(x − 3) ) ) = 2(x − 3)4 + 21(x − 3)3 + 81(x − 3)2 + 136(x − 3) + 88 Das heißt: f (x + 3) = 2x4 + 21x3 + 81x2 + 136x + 88. Das ist die Entwicklung von f um den Punkt x0 = 3. Wir kehren noch einmal zurück zu unserem Beispiel über die Biegung eines Balkens. Angenommen, der Balken sei 7.20m lang und habe einen rechteckigen Querschnitt von 25×15 cm. Wie stark ist die Durchbiegen bei x = 4, 20m ? (Dabei soll die Maßeinheit jedesmal cm sein.) Dazu beachten Sie, dass 1 3 das Flächenträgheitsmoment eines Balkens mit rechteckigem Querschnitt gerade I = 12 h b ist, wenn h die Höhe und b die Breite des Querschnitts ist. Bei x = l0 = 4.05m haben wir also eine Durchbiegung von F · 7203 y0 = 24 · 19531.25 E 405 4 405 3 405 2 796.262F ( ) − 4( ) + 6( ) = · f (x0 ) 720 720 720 E wobei f (x) = x4 − 4x3 + 6x2 und x0 = l0 /720 = 0.5625. Das Hornerschema für die Berechnung von f (x0 ) sieht so aus: 1 · 0.5625 + 1 Also wird y0 = -4 0.5625 -3.4375 796.262F E 6 -1.93359 4.06641 0 2.28736 2.28736 0 1.28664 1.28664 F · 1.28664 = 1024.5031 E . 4.3. RATIONALE FUNKTIONEN 133 Asymptotisches Verhalten eines Polynoms 4.3.5 Hilfssatz. Ist f (x) = an xn + an−1 xn−1 + ... + a1 x + a0 ein Polynom vom Grade n, so gilt: a) Zu jedem ε > 0 existiert ein r0 > 0, so dass f (x) −1 <ε an xn für |x| ≥ r0 . Für genügend großes |x| verhält sich also f wie an xn . b) Angenommen, an > 0. Dann haben wir: Ist n gerade, so f (x) −→ +∞ mit x −→ ±∞ und für ungerade n ist f (x) −→ +∞ mit x −→ +∞ f (x) −→ −∞ mit x −→ −∞ c) Angenommen, an < 0. Dann haben wir: Ist n gerade, so f (x) −→ −∞ mit x −→ ±∞ und für ungerade n ist f (x) −→ −∞ mit x −→ +∞ f (x) −→ +∞ mit x −→ −∞ d) Ist n ungerade, so hat f mindestens eine reelle Nullstelle. Beweis. Zu a) In der Tat ist n−1 n−1 j=0 j=0 X X |aj | |aj | f (x) − 1 ≤ < < ε, an xn |an ||x|n−j |an |r0n−j sofern nur r0 1 gemacht wird. Zu b) Wir können jetzt für große Werte von x die Ersetzung f (x) −→ an xn vornehmen. An dieser Darstellung lässt sich alles ablesen. Zu c) Man argumentiere für −f statt f . Zu d) Es gibt x1 , x2 , mit x1 6= x2 so dass f (x1 ) < −1 und f (x2 ) > 1. Der Zwischenwertsatz sagt, dass im Intervall mit Eckpunkten x1 , x2 jeder Wert zwischen −1 und 1 angenommen wird, also auch Null. Bem. Polynome geraden Grades müssen i. a. keine reelle Nullstelle haben. Man denke an f (x) = x2 + 1. 134 KAPITEL 4. ANALYSIS - FOLGEN UND FUNKTIONEN Gebrochen rationale Funktionen Definition. Wir nennen eine Funktion f : R \ M −→ R, wobei M = {x1 , ..., xr } mit beliebigen x1 < ... < xr oder M = ∅ sein soll, gebrochen rational, wenn sie als f (x) = g(x) h(x) darstellbar ist, mit Polynomen g und h, wobei h außerhalb der Menge M keine Nullstellen hat. Die Elemente von M heißen Definitionslücken von f . Die Polynome sind Spezialfälle hiervon: Hier ist M = ∅, h = 1. Wir untersuchen das Verhalten rationaler Funktionen für große Werte von |x| (Asymptotisches Verhalten) und für x nahe eines Poles. Das verläuft ähnlich wie bei Polynomen. Dabei reduzieren wir alles auf den Fall, dass der Grad des Zählers kleiner als der Nennergrad ist. Das wird möglich durch den Divisionsalgorithmus. 4.3.6 Satz (Divisionsalgorithmus). Sind g(x) = an xn + ...a1 x + a0 und h(x) = bk xk + ...b1 x + b0 Polynome, so gibt es eindeutig bestimmte Polynome p und r, wobei grad (r) < k, so dass g = ph + r. Beweis. Existenz: Ist n < k, so wählen wir p = 0, r = h. Sei also n ≥ k. Dann hat das Polynom r1 (x) = g(x) − abkn xn−k h(x) einen Grad n1 < n, und es ist g(x) = an n−k x h(x) + r1 (x) b | k {z } =:p1 (x) Wenn jetzt n1 < k, wählen wir p = p1 , r = r1 und sind fertig. Sonst schreiben wir p1 als p1 = an1 xn1 +.... a und erhalten mit r2 (x) = r1 (x) − bnk1 xn1 −k h(x) ein Polynom vom Grad n2 < n1 . Es gilt g(x) = p1 (x)h(x) + r1 (x) a an n = xn−k + 1 xn1 −k h(x) + r2 (x) b bk | {z k } =:p2 (x) Sollte jetzt n2 < k sein, sind wir fertig, da p = p2 , r = r2 das Gewünschte leisten. Anderenfalls fahren wir fort und nehmen mit r2 dasselbe vor wir zuvor mit r1 . Nach spätestens n − k + 1 Schritten endet das Verfahren und liefert gewünschte Polynome p und r. Eindeutigkeit: Angenommen p, pe, r und re seien Polynome mit g = ph + r = peh + re und Grad (r), Grad (e r) < k. Wir zeigen dann, dass p = pe und r = re sein muss. Es gilt r − re = (e p − p)h. Wenn p 6= pe, wäre, so hätte r − re einen Grad von mindestens k, Widerspruch! Daraus folgt alles. 4.3. RATIONALE FUNKTIONEN 135 Beispiele: Polynomdivision. a) Seien g(x) = x3 +2x2 −13x+10 und h(x) = x+5. Dann wird g = ph, mit p(x) = x2 − 3x + 2. Das finden wir so heraus: (x3 + 2x2 − 13x + 10) : (x + 5) = x2 − 3x + 2 x3 + 5x2 −3x2 − 13x −3x2 − 15x 2x + 10 2x + 10 0 b) Sei g(x) = x3 + 1 und h(x) = x2 + 2x. Dann wird g = ph + r mit p(x) = x − 2 und r(x) = 4x + 1, wie mit dem folgenden Rechenschema gefunden wurde: (x3 + 1) : (x2 + 2x) = x − 2 x3 + 2x2 −2x2 −2x2 − 4x 4x + 1 4.3.7 Hilfssatz. Seien g(x) = an xn +an−1 xn−1 +...+a1 x+a0 und h(x) = bk xk +bk−1 xk−1 +...+b1 x+b0 Polynome. Es sei g = ph + r die Darstellung von g mit Polynomen p und r, wobei Grad (r) < k. Dann gilt für das Verhalten von f = hg folgendes: a) Zu jedem ε > 0 gibt es ein r1 > 0, so dass |f (x) − p(x)| < ε für |x| ≥ r1 . Für genügend großes |x| verhält sich also f wie p. b) Angenommen, x0 sei eine Nullstelle von h, also h(x) = (x − x0 )s h1 (x), wobei h1 ein Polynom ist mit h1 (x0 ) 6= 0. Ist dann r(x) = (x − x0 )σ r1 (x), wobei r1 die entsprechende Bedeutung hat, dann gilt i) im Fall σ = s: r1 (x0 ) f (x) −→ p(x0 ) + mit x −→ x0 h1 (x0 ) ii) im Fall σ > s: f (x) −→ p(x0 ) mit x −→ x0 f ist damit in beiden Fällen in x0 stetig fortsetzbar. iii) im Fall σ < s und σ − s gerade: f (x) −→ ∞, wenn r1 (x0 ) > 0, x −→ x0 h1 (x0 ) und f (x) −→ −∞, wenn r1 (x0 ) < 0, x −→ x0 h1 (x0 ) 136 KAPITEL 4. ANALYSIS - FOLGEN UND FUNKTIONEN iv) im Fall σ < s und σ − s ungerade: f (x) −→ ∞, wenn und r1 (x0 ) > 0, x −→ x0 , x > x0 h1 (x0 ) f (x) −→ −∞, wenn r1 (x0 ) > 0, x −→ x0 , x < x0 h1 (x0 ) f (x) −→ −∞, wenn r1 (x0 ) < 0, x −→ x0 , x > x0 h1 (x0 ) und f (x) −→ ∞, wenn r1 (x0 ) < 0, x −→ x0 , x < x0 h1 (x0 ) Man spricht in den Fällen iii) und iv) von einem Pol der Ordnung |σ − s|. Beispiele. a) Zylindrische Dose mit vorgegebenem Volumen V0 . Eine zylindrische Dose mit Radius x > 0 und der Höhe h hat das Volumen V = πx2 h. Soll V = V0 werden, muss h = V0 /πx2 sein. Die Oberfläche der Dose ist f (x) = 2πx2 + 2πhx = 2πx2 + 2V0 , x eine rationale Funktion von x. Der Graph von f sieht so aus: 25 20 15 10 5 0.5 1 1.5 2 b) Sei f (x) = 0.5x3 − 1.5x + 1 1 x3 − 3x + 2 = x2 + 3x + 2 2 x2 + 3x + 2 Wir haben hier g(x) = x3 − 3x + 2 und h(x) = 2(x2 + 3x + 2) und finden, dass 1 und −2 Nullstellen von g und −1, −2 Nullstellen von h sind. Es gilt, wie wir etwa mit dem Hornerschema finden: g(x) = (x − 1)2 (x + 2), h(x) = 2(x + 1)(x + 2), also 4.4. TRIGONOMETRISCHE FUNKTIONEN f (x) = 137 2 (x − 1)2 = 0.5x − 1.5 + 2(x + 1) x+1 Für große Werte von |x| verhält sich f daher wie p(x) = 0.5x − 1.5 und −1 ist ein einfacher Pol von f . Es gilt lim f (x) = −∞, lim f (x) = ∞ x→−1,x<−1 x→−1,x>−1 Der Graph von f hat etwa das folgende Aussehen: f(x) 0 x 1 0 0 1 0 1 00 11 0 1 1 0 0 1 0 1 0 1 0 1 0 1 1 0 0 1 0 1 4.4 Trigonometrische Funktionen Wir haben die trigonometrischen Funktionen sin und cos schon für Winkel 0 < α < 90◦ definiert. Nun erweitern wir die Definition auf alle Winkel zwischen 0 und 360◦ : Dazu setzen wir: sin α := sin(180◦ − α) , wenn 90◦ < α ≤ 180◦ cos α := − cos(180◦ − α) und ferner: 138 KAPITEL 4. ANALYSIS - FOLGEN UND FUNKTIONEN sin α := − sin(360◦ − α) , wenn 180◦ < α ≤ 360◦ cos α := cos(360◦ − α) Wir beobachten, das sich aus diesen Definitionen ergibt: 4.4.1 Hilfssatz. Es gilt für alle α zwischen 0◦ und 90◦ : i) | sin α|, | cos α| ≤ 1, ii) sin α = cos(90◦ − α) und cos α = sin(90◦ − α) iii) Satz von Pythagoras: sin2 α + cos2 α = 1. Folgerung: Wir haben folgende spezielle Werte für sin und cos: √ ◦ ◦ i) sin 45 = cos 45 = 1/√ 2 ii) sin 60◦ = cos 30◦ = 21 3 iii) sin 30◦ = cos 60◦ = 12 . Wir streben jetzt an, sin und cos auf den reellen Zahlen zu definieren. Diese Definition basiert auf der folgenden Korrespondenz zwischen Winkel und Bogenmaß. Im Kreis um 0 mit Radius 1 schneidet ein Winkel α aus dem Kreisbogen ein Segment der Länge x(α) = π α 180 4.4. TRIGONOMETRISCHE FUNKTIONEN 139 aus. R=1 x α Umgekehrt gehört zu einem des Kreisbogensegment mit der Länge x der Winkel α(x) = 180 x π Mit dieser Korrespondenz identifizieren wir jede Zahl x ∈ [0, 2π] mit dem Winkel folgende kleine Tabelle: α 30◦ 45◦ 60◦ 90◦ 120◦ x π/6 π/4 π/3 π/2 2π/3 Für nicht-negative reelle Zahlen treffen wir nun die Definition: sin x := sin α(x), cos x := cos α(x), wenn 0 ≤ x ≤ 2π, Beide Funktionen werden auf R periodisch mit der Periode 2π fortgesetzt. Der Hilfssatz 4.4.1 bleibt sinngemäß richtig. Es gilt 4.4.2 Hilfssatz. Es gilt für alle x ∈ R: i) | sin x|, | cos x| ≤ 1, ii) sin x = cos( π2 − x) und cos x = sin( π2 − x) iii) Satz von Pythagoras: sin2 x + cos2 x = 1 iv) sin(−x) = − sin x, cos(−x) = cos x. v) | sin x| ≤ |x|, | sin x| ≥ |x| cos x, wenn |x| < 1. Beweis. Zu zeigen sind nur iv) und v). 180 π x. Wir haben 140 KAPITEL 4. ANALYSIS - FOLGEN UND FUNKTIONEN Zu iv) Wir können annehmen, es sei x ∈ (0, 2π). Angenommen, 0 ≤ x < π. Dann ist −π < −x ≤ 0, also π < −x + 2π ≤ 2π. Aus der getroffenen Definition für sin folgt jetzt sin(−x) = sin(−x + 2π) = − sin(2π − (−x + 2π) ) = − sin x cos(−x) = cos(−x + 2π) = cos(2π − (−x + 2π) ) = cos x Wenn π < x < 2π, haben wir −2π < −x < −π, also 0 < x0 = −x + 2π < π, und damit sin(−x) = sin(−x + 2π) = sin x0 = − sin(−x0 ) = − sin(x − 2π) = − sin x Entsprechend für cos. Zu v) Wir brauchen es nur für x ∈ (0, 1) zu zeigen, d.h.: sin x ≤ x, und sin x ≥ x cos x. Haben wir das gezeigt, so folgt die Behauptung im Fall x ∈ (−1, 0) aus | sin x| = − sin x = sin(−x) = sin |x| und cos |x| = cos x. Für positive x kann alles aus der Grafik abgelesen werden: 000 111 00 11 00000 11111 11 00 0 1 000 111 00 11 00000 11111 00 11 0 1 000 111 0 1 00 11 00000 11111 00 11 0 1 000 111 0 1 00000 11111 00 11 0 1 0 1 00000 11 00 sin11111 x 00 11 0 1 000 111 11 00 00 11 R=1 000 111 000 111 00 11 000 111 000 111 00 11 000 111 000 111 α 000 111 000 111 00 11 0 1 00 11 000 111 0 1 cos 000 111 0x 1 000 111 000 111 000 111 0 1 000 111 000 111 0 1 000 111 000 111 000 111 000 111 00 11 000 111 000 111 00 11 00 11 0000 1111 000 111 00 11 00 11 0 1 00 11 0000 1111 000 111 00 11 0 1 0000 1111 000 111 00 11 00 11 011 1 00 xcos x x Additionstheoreme Wir können für zwei Zahlen x, y die Werte sin(x + y) und cos(x + y) durch sin x, ..., cos y ausdrücken. 4.4.3 Satz. Für x, y ∈ R haben wir: a) sin(x + y) = sin x cos y + cos x sin y b) cos(x + y) = cos x cos y − sin x sin y 4.4. TRIGONOMETRISCHE FUNKTIONEN 141 x−y x+y sin x − sin y = 2 sin x−y c) sin x + sin y = 2 sin x+y 2 cos 2 , 2 cos 2 x−y x+y d) cos x + cos y = 2 cos x+y cos x − cos y = −2 sin x−y 2 cos 2 , 2 sin 2 e) sin(2x) = 2 sin x cos x f) cos(2x) = cos2 x − sin2 x = 1 − 2 sin2 x Beweis. Die schwierigsten Teile sind a) und b). Der Rest folgt aus a) und b). Beim Beweis von a) und b) beschränken wir uns auf solche Werte x, y > 0 mit x + y < π/2. Dann können wir die Behauptungen an der folgenden Grafik ablesen: Q x C P y x O A B Sei OQ = 1. In der Tat ist dann sin(x + y) = QA = QP + P A und cos(x + y) = OA = OB − BA. Nun ist aber QC = sin y und OC = cos y, also QP = QC cos x = sin y cos x P A = CB = OC sin x = sin x cos y OB = OC cos x = cos x cos y AB = P C = QC sin x = sin x sin y Zu c) Wir schreiben t = x+y 2 ,s = x−y 2 . Dann wird x = t + s und y = t − s. Mit a) erhalten wir sin(x) = sin(t + s) = sin t cos s + cos t sin s und sin(y) = sin(t − s) = sin t cos(−s) + cos t sin(−s) = sin t cos s − cos t sin s Addieren wir beides, folgt die Behauptung. 142 KAPITEL 4. ANALYSIS - FOLGEN UND FUNKTIONEN Zu d) Analog zu c). Zu e) und f) Man wähle in a) und b) jeweils y = x. Diese Formeln können wir zum Beweis der Stetigkeit der Sinus- und Cosinusfunktion benutzen. 4.4.4 Satz. Die Funktionen sin und cos sind überall stetig. Weiter gilt: a) Für |x| < 1 ist x2 , 0 ≤ 1 − cos x ≤ 2 x Die Funktion x 7−→ 1−cos ist durch 0 stetig in 0 fortsetzbar. x b) Für 0 < |x| < 1 ist 0≤1− Die Funktion x 7−→ sin x x x2 sin x ≤ . x 2 ist durch 1 stetig in 0 fortsetzbar. Beweis. In Satz 4.4.3, Teil c) wählen wir y = −x0 und erhalten mit v) von Hilfssatz 4.4.2 : x − x0 x + x0 cos ≤ |x − x0 | 2 2 Wenden wir dies an und beachten, dass cos(x) = sin( π2 + x), folgt | sin x − sin x0 | = 2 sin | cos x − cos x0 | = | sin( π π + x) − sin( + x0 )| ≤ |x − x0 | 2 2 Zu a) Mit f) von Satz 4.4.3 mit x/2 statt x folgt 1 − cos x = 1 − cos 2 · x x x2 = 2 sin2 ≤ 2 2 2 Zu b) Es genügt, das für 0 < x < 1 zu zeigen. Wir haben nach v) von Hilfssatz 4.4.2: 1≥ also 0≤1− sin x x2 ≥ cos x ≥ 1 − , x 2 sin x x2 x2 ≤ 1 − (1 − ) = x 2 2 Auf gewissen Intervallen in R sind sin und cos umkehrbar. 4.4.5 Satz. a) Auf [− π2 , π2 ] ist sin streng monoton wachsend und sin : [− π2 , π2 ] −→ [−1, 1] invertierbar. Ihre Umkehrfunktion wird Arkussinus arcsin genannt. b) Auf [0, π] ist cos streng monoton fallend und cos : [0, π] −→ [−1, 1] invertierbar. Ihre Umkehrfunktion wird Arkuskosinus arccos genannt. 4.4. TRIGONOMETRISCHE FUNKTIONEN 143 Beweis. a) Wenn − π2 < x0 < x00 < π2 , so folgt sin x00 − sin x0 = 2 sin( 00 x00 + x0 x00 − x0 ) cos( ) 2 2 0 00 0 Aber x −x ∈ (0, π), wo der sin positive Werte annimmt. Weiter ist x +x ∈ [− π2 , π2 ], wo die Werte 2 2 0 00 der cos-Funktion positiv sind. Also ist sin x < sin x . Mit sin(−π/2) = −1, sin(π/2) = 1 und dem Zwischenwertsatz erhalten wir die erste Behauptung. b) Ähnlich wie unter a) sehen, dass für π > x00 > x0 > 0 gilt 00 0 00 0 sin x +x < 0. Aus cos 0 = 1, cos π = −1 und dem Zwischenwertsatz cos x00 − cos x0 = −2 sin x −x 2 2 folgt die Behauptung. Weitere trigonometrische Funktionen: Tangens und Cotangens Neben den bisherigen Funktionen arbeitet man ferner mit den Funktionen tg x := sin x , cos x ctg x := cos x 1 = sin x tg x Diese Funktionen sind nicht auf ganz R definiert, sondern nur außerhalb der Nullstellen des Nenners, also: tg x ist definiert, solange cos x 6= 0, d.h. x 6= 2k+1 Z, 2 π für alle k ∈ Z ctg x ist definiert, solange sin x 6= 0, d.h. x 6= kπ für all k ∈ ZZ. Aus den Eigenschaften von sin und cos leiten sich folgende Eigenschaften von tg und ctg leicht ab: 4.4.6 Hilfssatz. Die Funktionen tg und ctg haben folgende Eigenschaften: a) Beide sind ungerade und haben die Periode π. b) Beide sind auf ihren Definitionsbereichen stetig c) Es gelten folgende Additionstheoreme: Wenn x, y ∈ R, cos x, cos y 6= 0 und tg xtg y 6= 1, so wird tg (x + y) = tg x + tg y 1 − tg xtg y Wenn x, y ∈ R, sin x, sin y 6= 0 und ctg x + ctg y 6= 0, so wird ctg (x + y) = ctg x ctg y − 1 ctg x + ctg y Beweis. a) Klar, da sin ungerade und cos gerade ist. Weiter ist sin(x + π) = − sin x, cos(x + π) = − cos x, woraus die Behauptung über die Perioden von tg und ctg folgt. c) und d) folgen aus den Additionstheoremen von sin und cos. Hier sind die Graphen von sin und cos: Graph von sin. 144 KAPITEL 4. ANALYSIS - FOLGEN UND FUNKTIONEN 1 0.5 -2 -0.5 -1 2 4 6 8 2 4 6 8 Graph von cos 1 0.5 -2 -0.5 -1 und hier von tg und ctg : ctg x ctg x tg x tg x π/2 0 π 3π/2 x 4.4.7 Satz. Die Tangensfunktion tg : (−π/(2 , π/2) −→ R ist streng monoton wachsend und invertierbar. Ihre Umkehrfunktion nennt man Arkustangens arctg. Beweis. Es gilt tg(x00 ) − tg(x0 ) = sin(x00 − x0 ) >0 cos(x0 ) cos(x00 ) wenn π/2 > x00 > x0 > π/2. Daraus erhalten wir alles, wie schon in den Beweisen zur Invertierbarkeit von sin oder cos . 4.5. DIE EXPONENTIALFUNKTION 4.5 145 Die Exponentialfunktion Wir gehen jetzt daran, Potenzen mit beliebigen (nicht nur rationalen) Exponenten zu definieren. Dazu studieren wir die Funktion x n ) n Dass diese Definition sinnvoll ist, überlegen wir uns zuerst: exp(x) := lim (1 + n→∞ x > −1 4.5.1 Hilfssatz. Für beliebiges x ∈ R setzen wir en (x) := (1+ nx )n . Ist nx ∈ IN so groß, dass n+x 1 für alle n ≥ nx ist, so wird en (x) ≤ en+1 (x) für alle n ≥ nx . Für x ≥ − 2 kann nx := 1 genommen werden. Ist |x| ≤ k, so ist |en (x)| ≤ ek für alle n ≥ 1. Insbesondere ist dann exp(x) für jedes x ∈ R definiert. Beweis. Wir gehen so vor wie bei der Einführung der Eulerzahl e. Für genügend große nx ist > −1 für alle n ≥ nx . Nun schreiben wir x n+x en+1 (x) en (x) = = = = ≥ (n + 1 + x)n+1 nn (n + x)n (n + 1)n+1 ( (n + 1 + x)n )n+1 n + x · ( (n + x)(n + 1) )n+1 n n+1 2 n + n + nx n+x · 2 n + n + nx + x n n+1 x n+x 1− · (n + x)(n + 1) n x n+x (1 − )· =1 n+x n Die letzte Abschätzung erhalten wir aus der Bernoulli-Ungleichung. Das liefert uns die Monotonieeigenschaft. Ist |x| ≤ k, so folgt en (x) ≤ (1 + k 1 |x| n ) ≤ (1 + )n ≤ (1 + )kn ≤ ek n n n (denn aus der Bernoulliungleichung folgt (1 + n1 )k ≥ 1 + nk . 4.5.2 Satz. Für alle x ∈ R gilt n X xk exp(x) = lim n→∞ k! k=0 146 KAPITEL 4. ANALYSIS - FOLGEN UND FUNKTIONEN Beweis. Es gilt zunächst n 1+ X 2 k − 1 xk x n 1 =1+x+ ) (1 − )(1 − ) . . . (1 − n n n n k! k=2 Nun ist (k − 1)2 1 2 k−1 1− ≤ (1 − )(1 − ) . . . (1 − )≤1 n n n n Das ermöglich den Beweis, dass n X x n Cx xk − 1+ ≤ k! n n k=0 mit einer nur von x nicht aber von n abhängigen Konstanten Cx > 0. Das liefert mit n → ∞ die Behauptung. 4.5.3 Satz. Die Exponentialfunktion genügt der Funktionalgleichung: exp(a + b) = exp(a) exp(b) für alle a, b ∈ R. Beweis. Wir beachten a n a + b ab n a+b n b n 1+ = 1+ + 2 = 1+ cn 1+ n n n n n mit cn = 1 + ab/n2 1 + (a + b)/n n Ab einem genügend großen n ist nun ab/n2 ≥ −1/3 und 1 + (a + b)/n ≥ 1/2. Damit folgt mit der Bernoulliungleichung 2 (1 + 2|ab|/n2 )n ≥ cn ≥ 1 − 3n Daraus kann man cn −→ 1 gewinnen, wenn n → ∞. Aus dieser Funktionalgleichung ergeben sich einige Folgerungen 4.5.4 Folgerung. a) Die Exponentialfunktion hat keine Nullstellen, es gilt exp(0) = 1 und exp(−x) = 1/ exp(x). Alle Werte der Exponentialfunktion sind positiv. b) Für die Exponentialfunktion bestehen die Abschätzungen: exp(x) ≥ 1 + x, f ür alle x und | exp(x) − (1 + x)| ≤ 3x2 , wenn |x| < 1 c) Die Exponentialfunktion ist überall stetig und streng monoton wachsend. 4.5. DIE EXPONENTIALFUNKTION 147 Beweis. a) Es ist exp(x) exp(−x) = exp(x − x) = exp(0) = 1 Es ist ferner exp(x) = ( exp(x/2) )2 ≥ 0. Negative Werte sind also nicht möglich. Da auch 0 als Wert nicht auftreten kann, folgt die erste Behauptung. Zu b) Wir zeigen zuerst, dass exp(x) ≥ 1 + x. Für x ≥ 0 ist das klar. Wenn aber −1 ≤ x < 0 ist, kann nx = 2 genommen werden, also ex ≥ e2 (x) ≥ 1 + x. Ist x < −1, wird schon 1 + x < 0, also die Behauptung trivial. Es gilt für alle x die Ungleichung e−x ≥ 1 − x, also auch (1 − x)ex ≤ 1. Da 1 + x ≥ 0, folgt (1 − x2 )ex ≤ 1 + x, also ex ≤ 1 + x + x2 ex . Das liefert uns 1 + x ≤ ex ≤ 1 + x + ex x2 ≤ 1 + x + 3x2 Zu c) Ist x0 beliebig, so schreiben wir für alle x ∈ R mit |x − x0 | < 1: exp(x) − exp(x0 ) = exp(x0 )(exp(x − x0 ) − 1 ) und mit Teil b) ergibt sich | exp(x) − exp(x0 )| ≤ exp(x0 )(|x − x0 | + 3(x − x0 )2 ) ≤ 4 exp(x0 )|x − x0 | −→ 0, wenn x −→ x0 Damit ist die Stetigkeit gezeigt. Ferner haben wir exp(b)/ exp(a) = exp(b − a) ≥ 1 + b − a > 1 wenn nur b > a ist. Zur Frage der Invertierbarkeit haben wir 4.5.5 Hilfssatz. Es gibt zu jedem positiven Wert t genau ein x ∈ R, so dass exp(x) = t. Zur Exponentialfunktion gibt es damit eine stetige Umkehrfunktion, die auf R+ erklärt ist. Beweis. In der Tat können wir den Zwischenwertsatz anwenden. Ist nämlich t ≥ 1, so gilt exp(t) > t 1 und exp(−t) = 1/ exp(t) ≤ 1+t < t. Es gibt also ein x ∈ (−t, t) mit exp(x) = t. Wenn 0 < t < 1, so ist 0 1/t > 1, und es gibt ein x mit exp(x0 ) = 1/t. Dann ist aber t = exp(−x0 ). So sehen wir, dass jedes t > 0 ein Urbild hat. Wegen der strengen Monotonie gibt es aber kein weiteres Urbild mehr. Die Umkehrfunktion zur exp-Funktion wird nun definiert wie folgt: Ist t > 0, so sei exp−1 (t) das eindeutig bestimmte Urbild xt zu t unter der exp-Funktion. Das definiert uns wieder eine stetige Funktion von R+ mit Werten in R. k Für alle k ∈ ZZ gilt jetzt aber exp(k) = e . Das überträgt sich auf rationale Zahlen r = k/m mit k, m ∈ ZZ, so dass m > 0: ( exp(r) )m = exp(mr) = exp(k) = ek 148 KAPITEL 4. ANALYSIS - FOLGEN UND FUNKTIONEN also exp(r) = er Wir verwenden daher ab jetzt die folgende Notation: Definition. Für x ∈ R setzen wir ex := exp(x). Die Umkehrfunktion zur Exponentialfunktion wird als natürlicher Logarithmus bezeichnet und als ln geschrieben. Wir haben also eln x = x, f ür x > 0, ln (ea ) = a, f ür alle a Erste Anwendungen a) Jemand legt Geld bei einer Bank an, etwa einen Betrag K0 . Als Zinssatz werde q% vereinbart. q 4 Es soll vierteljährlich verzinst werden. Dann ist nach einem Jahr das Guthaben auf K0 (1 + 400 ) , nach q 8 2 Jahren auf K0 (1 + 400 ) usw. angewachsen. Nach wieviel Jahren hat es sich verdoppelt? Man suche nach der Lösung der Gleichung (1 + q 4m ) =2 400 Es folgt m= 1 ln 2 q 4 ln (1 + 400 ) Ist nun q = 4, so findet man m = 17.415, also braucht man 17 Jahre und 5 Monate. b) Mit L(t) bezeichnen wir die Menge eines Lernstoffes, der in t Zeiteinheiten von einer Person aufgenommen werden kann. Je länger die Person lernt, desto weniger kann sie aufnehmen. Die Funktion L(t) hat, wie durch Experimente gut bestätigt wurde die Form L(t) = Lmax (1 − e−k t ) wobei k > 0 eine Konstante ist. c) Bei einer Serienschaltung von Widerstand R und Spule mit Induktivität L erreicht die Stromstärke i(t) erst nach einiger Zeit ihren Maximalwert I = U/R. Man hat nämlich i(t) = I(1 − e−Rt/L ) Wenn t = τ = L/R, wird i(τ ) = (1 − e−1 )I = 0.632I. d) Angenommen, ein Seil werde an 2 Masten gleicher Höhe frei aufgehängt. Dann hängt es durch und sieht aus wie der Graph der Funktion a cosh(x/a) = a x/a (e + e−x/a ) 2 Dabei ist a durch Seil-und Gewichtskräfte bestimmt. Zu jeder Basis a > 0 können wir jetzt mit beliebigem x ∈ R die Potenz ax definieren: 4.5. DIE EXPONENTIALFUNKTION 149 Wir setzen ax := ex·ln a , f ür x ∈ R Dann gilt wieder a0 = 1, ar+s = ar · as , f ür alle r, s ∈ R Auch die Funktion, die x nach ax abbildet, hat eine Umkehrfunktion, nämlich loga t := ln t ln a Man arbeitet in der Regel mit a = 2 und a = 10. Es gilt dabei log2 x = 1.4427 · ln x, log10 x = 0.43429 · ln x. 150 KAPITEL 4. ANALYSIS - FOLGEN UND FUNKTIONEN Graphen von Exponential-und Logarithmusfunktion Diese haben folgendes Aussehen: 3.5 3 2.5 2 1.5 1 0.5 -1.5 -2 -1 -0.5 0.5 1 für die Exponentialfunktion und 1 0.5 1 -0.5 -1 -1.5 für den Logarithmus. 2 3 4 Kapitel 5 Differenzialrechnung 5.1 Definition und Beispiele Beispiel. Eine zylindrische Dose soll ein festes Volumen V0 haben. Wie müssen ihre Maße gewählt werden, damit der Blechverbrauch möglich klein ausfällt? Wir haben früher gesehen, dass die Oberfläche einer solchen Dose durch f (r) = 2πr2 + 2V0 r gegeben ist, wobei r den Radius bedeutet. Die Frage ist also: Für welches r wird f (r) minimal? Der Graph von f sieht etwa so aus: 250 2*%pi*r2+20/r 200 150 100 50 0 0 1 2 3 4 r 149 5 6 150 KAPITEL 5. DIFFERENZIALRECHNUNG Wie können wir das Minimum von f , also die ”tiefste Stelle” im Graphen von f , berechnen? Der Mathematiker G.W. Leibniz hat ein Verfahren erdacht, mit dem das möglich wird: Die Differentiation einer Funktion. Definition. Es sei I ⊂ R ein offenes Intervall und f : I −→ R eine Funktion. Für zwei Punkte x 6= x0 ∈ I hat die Sekante zum Graphen von f durch die Punkte (x, f (x)) und (x0 , f (x0 )) die Steigung s(f ; x, x0 ) := f (x) − f (x0 ) x − x0 5 4.5 4 3.5 (x, f (x)) 3 2.5 2 1.5 (x0 , f (x0 )) 1 0.5 -0.5 0 0.5 1 1.5 2 2.5 Es ist nahegelegt, nun den Wert x gegen x0 streben zu lassen. Man kann erhoffen, dass dann s(f ; x, x0 ) sich einem Wert nähert, den man dann als Steigung der ”Tangente an den Graphen von f ” im Punkte (x0 , f (x0 )) ansehen kann. All dies gelingt für allgemeine Funktionen nicht immer. Wir befassen uns im Folgenden mit solchen Funktionen, bei denen der oben angedeutete Grenzwert existiert. Definition. Es sei I ⊂ R ein offenes Intervall und f : I −→ R eine Funktion. Wir nennen f in x0 ∈ I differenzierbar, wenn der Grenzwert f 0 (x0 ) := lim x→x0 f (x) − f (x0 ) x − x0 existiert. Der Wert f 0 (x0 ) heisst die Ableitung von f an der Stelle x0 . Wegen ihrer geometrischen Deutung wird die Gerade mit der Gleichung y = f (x0 ) + f 0 (x0 )(x − x0 ) als Tangente an den Graphen von f in (x0 , f (x0 )) bezeichnet. 5.1. DEFINITION UND BEISPIELE 151 Die Differenzierbarkeit von f in x0 ist gleichwertig mit der stetigen Fortsetzbarkeit der Funktion s(f ; x, x0 ) in x0 . Diese stetige Fortsetzung ist eindeutig bestimmt, und wir bezeichnen sie mit f1 (x; x0 ). 5.1.1 Hilfssatz. Ist die Funktion f : I −→ R in x0 differenzierbar, so ist sie dort auch stetig. Beweis. Denn wir können schreiben: f (x) = f (x0 ) + (x − x0 )f1 (x; x0 ), x ∈ I und auf der rechten Seite steht eine in x0 stetige Funktion. Wir untersuchen jetzt zur Differenzierbarkeit ein paar Beispiele. 0) Konstante Funktionen. Hier ist die Ableitung in jedem Punkt definiert und hat den Wert 0. 1) Die Funktionen f (x) := xn , für x ∈ R. Dabei sei n eine ganze Zahl ≥ 1. Ist jetzt x0 beliebig, so gilt (siehe Übungsaufgabe) f (x) − f (x0 ) = (x − x0 ) n−1 X x0n−1−k xk , k=0 also für alle x 6= x0 : s(f, x, x0 ) = n−1 X x0n−1−k xk k=0 Aber die rechte Seite ist überall stetig und wir können ablesen, dass lim s(f, x, x0 ) = nxn−1 0 x→x0 gilt. 2) Die Funktion f (x) = xn mit n ∈ ZZ, n < 0. Wir schreiben f (x) = erklärt, also erst recht nicht differenzierbar. Sei daher x0 6= 0. Dann ist |n|−1 s(f ; x, x0 ) = − −|n|x0 1 s(x|n| ; x, x0 ) −→ |n| 2|n| (xx0 ) x0 = −|n| 1 . x|n| 1 |n|+1 x0 In x0 := 0 ist f nicht = nx0n−1 3) Sei g die durch g(x) = x2 für x ≥ 0 und g(x) = −x2 für x < 0 erklärte Funktion. Für jedes x0 existiert die Ableitung. Ist x0 > 0, so haben wir für x nahe bei x0 : g(x) − g(x0 ) = x + x0 −→ 2x0 , wenn x −→ x0 x − x0 Ist x0 < 0, so wird g(x) − g(x0 ) = −x − x0 −→ −2x0 , wenn x −→ x0 x − x0 152 KAPITEL 5. DIFFERENZIALRECHNUNG Ist x0 = 0, so ist g(x) − g(x0 ) x − x0 = |x| −→ 0, wenn x −→ 0 Wir erhalten somit g 0 (x0 ) = 2|x0 | für alle x0 . 4) Die Funktion h(x) = |x|. Ist x0 > 0, so erhalten wir leicht h0 (x0 ) = 1 und für x0 < 0 wird ±1 h0 (x0 ) = −1. Ist aber x0 = 0, so gilt s(h; x, 0) = |x| x . Da s(h; n , 0) = ±1, kann s(h; x, 0) in 0 nicht stetig fortsetzbar sein. Trigonometrische Funktionen und Exponentialfunktion. 1) Es gilt sin0 = cos und cos0 = − sin. Denn ist x0 beliebig, so gilt sin x − sin x0 x − x0 = 2 = 0 sin( x−x x + x0 2 ) ) cos( x − x0 2 ! 0 sin( x−x x + x0 x + x0 2 ) ) + cos( ) − 1 cos( x−x0 2 2 2 Nun gilt aber sin( x−x0 ) (x − x )2 0 2 − 1 −→ 0 x−x0 ≤ 8 2 mit x −→ x0 . Das ergibt die Behauptung. Die Ableitung von cos finden wir nun leicht: Es gilt cos(x) = sin(x + π2 ), also sin(x + π2 ) − sin(x0 + π2 ) cos x − cos x0 π −→ cos(x0 + ) = − sin(x0 ) = π π x − x0 x + 2 − (x0 + 2 ) 2 2) Es gilt exp0 = exp. Denn ist x0 ∈ R, so haben wir ex−x0 − 1 ex − ex0 = e x0 x − x0 x − x0 Es genügt also zu zeigen, dass et − 1 = 1. t→0 t lim Dazu beachten wir: 1 + t ≤ et ≤ 1 + t + t2 et also für 1 > t > 0: 0≤ et − 1 − 1 ≤ tet ≤ 3|t| t 0≥ et − 1 − 1 ≥ tet ≥ −|t|, t und für −1 < t < 0: 5.1. DEFINITION UND BEISPIELE 153 also in jedem Fall t e − 1 − 1 ≤ 3|t| t für |t| < 1. Hieraus folgt die Behauptung. 5.1.2 Satz (Differentiationsregeln). Angenommen, f, g : I −→ R seien auf einem offenen Intervall I definiert und in x0 ∈ I differenzierbar. Dann gilt: a) Auch f + αg ist für jedes α ∈ R in x0 differenzierbar, mit (f + αg)0 (x0 ) = f 0 (x0 ) + αg 0 (x0 ) b) Das Produkt f g ist in x0 differenzierbar mit (f g)0 (x0 ) = f (x0 )g 0 (x0 ) + f 0 (x0 )g(x0 ) c) Wenn g(x0 ) 6= 0, so ist 1 g in x0 differenzierbar mit 0 1 g 0 (x0 ) (x0 ) = − g (g(x0 ))2 d) Weiter gilt unter den Voraussetzungen aus c): 0 f f 0 (x0 )g(x0 ) − f (x0 )g 0 (x0 ) (x0 ) = g (g(x0 ))2 Beweis. a) Es gilt auf I \ {x0 }: s(f + αg; x, x0 ) = s(f ; x, x0 ) + αs(g; x, x0 ) Daraus folgt die Behauptung. b) Wir haben auf I \ {x0 }: s(f g; x, x0 ) = f (x)s(g; x, x0 ) + g(x0 )s(f ; x, x0 ) und die rechte Seite ist in x0 stetig fortsetzbar, da f in x0 stetig ist. Aus der Formel lässt sich (f g)0 (x0 ) ablesen. c) Für x ∈ I \ {x0 }, und x nahe x0 ist g(x) 6= 0. Daher haben wir für solche x: 1 1 s(g; x, x0 ), s( ; x, x0 ) = − g g(x)g(x0 ) woraus wir alles ablesen können. d) Kombiniere b) mit c). Zusammengesetzte Funktionen 154 KAPITEL 5. DIFFERENZIALRECHNUNG 5.1.3 Satz (Kettenregel). Angenommen, f : I −→ J und g : J −→ R seien Funktionen, auf den offenen Intervallen I und J. a) Ist f in x0 ∈ I und g in y0 = f (x0 ) differenzierbar, so ist auch g ◦ f in x0 differenzierbar, und es ist (g ◦ f )0 (x0 ) = g 0 (f (x0 ))f 0 (x0 ) b) Ist f : I −→ J invertierbar, stetig und in x0 differenzierbar mit f 0 (x0 ) 6= 0, so ist f −1 in y0 differenzierbar, und es gilt: 1 (f −1 )0 (y0 ) = 0 f (x0 ) Beweis. a) Man beachte: f (x) = y0 + (x − x0 )f1 (x; x0 ), x ∈ I und g(y) = g(y0 ) + (y − y0 )g1 (y; y0 ), y ∈ J Nun wählen wir y = f (x). Was wir erhalten, ist: g ◦ f (x) − g ◦ f (x0 ) = g(y) − g(y0 ) = (y − y0 )g1 (y; y0 ) = (x − x0 )f1 (x; x0 )g1 (y; y0 ) (5.1.1) woraus folgt s(g ◦ f ; x, x0 ) = f1 (x; x0 ) g1 (y0 + (x − x0 )f1 (x; x0 ); y0 ) Da g1 (·; y0 ) in y0 stetig ist, ist die rechte Seite in x0 stetig, also können wir x −→ x0 streben lassen und erhalten als Grenzwert f 0 (x0 )g 0 (y0 ). Zu b). Wir wissen schon, dass f −1 im Punkt y0 stetig ist. Wenn f 0 (x0 ) 6= 0, so ist f1 (x; x0 ) 6= 0, wenn nur x nahe genug bei x0 liegt. Liegt nun y nahe genug bei y0 , so liegt f −1 (y) nahe bei x0 , also wird f1 (f −1 (y); x0 ) 6= 0 für solche y, und ferner ist y − y0 = f (f −1 (y)) − f (x0 ) = (f −1 (y) − x0 )f1 (f −1 (y); x0 ) = (f −1 (y) − f −1 (y0 ))f1 (f −1 (y); x0 ) Es folgt s(f −1 ; y, y0 ) = 1 1 1 −→ = 0 , wenn y −→ y0 f1 (f −1 (y); x0 ) f1 (x0 ; x0 ) f (x0 ) Beispiele. 1) Sei f (x) = x4 +2x+8 . x2 +2 Dann ist (x2 + 2)(4x3 + 2) − 2(x4 + 2x + 8)x (x2 + 2)2 x5 + 4x3 − x2 − 8x + 2 = 2 (x2 + 2)2 f 0 (x) = 5.1. DEFINITION UND BEISPIELE 155 2) Sei g(x) = x3 sin(2ex ). Dann ist g 0 (x) = 3x2 sin(2ex ) + 2x3 ex cos(2ex ) 3) tg 0 (x) = Denn 1 cos2 x für alle x ∈ R \ {(2m + 1)π/2 | m ∈ ZZ}. tg 0 (x) = cos2 x + sin2 x 1 sin0 (x) cos(x) − sin(x) cos0 (x) = = 2 2 cos x cos x cos2 x 4) ctg 0 x = − sin12 x für x ∈ / {mπ | m ∈ ZZ}. Das folgt aus der Quotientenregel. ctg 0 (x) = − tg 0 (x) 1 1 =− =− 2 2 2 tg (x) cos x tg x sin2 x Logarithmusfunktion Die Exponentialfunktion ist von R −→ R+ invertierbar, wie wir schon sehen konnten. Die Funktion ln : R+ −→ R, die jedem t ∈ R+ das Urbild unter der Exponentialfunktion zuordnet, ist sogar Umkehrfunktion von exp. Denn eln x = x per definitionem, und ln (ex ) und x selbst sind Urbilder zu ex unter exp, müssen also auch übereinstimmen. Damit ist auch ln differenzierbar auf R+ mit ln 0 x = 1 exp0 (ln x) = 1 . x Beispiel (Arcustangens). Die Funktion tg : I := (− π2 , π2 ) ist streng monoton wachsend, da tg 0 = cos−2 > 0 überall auf I. Da weiter tg (x) −→ ±∞ für x −→ ± π2 , hat die Funktion nach dem Zwischenwertsatz für jeden Wert t ∈ R ein Urbild in I, das wegen der strengen Monotonie eindeutig bestimmt ist. Es gibt damit eine Umkehrfunktion arctg : R −→ I der Tangensfunktion. Auch sie ist streng monoton wachsend. Wir berechnen ihre Ableitung: arctg0 (x) = 1 1 = cos2 (arctg(x)) = tg 0 (arctg(x) 1 + x2 Die letze Beziehung folgt aus der Identität: cos2 (s) = Hier ist der Graph von arctg. cos2 s 1 = . 2 2 1 + tg 2 s sin s + cos s 156 KAPITEL 5. DIFFERENZIALRECHNUNG 1.5 1 atan(x) 0.5 0 -0.5 -1 -1.5 -2 -1.5 -1 -0.5 0 x 0.5 1 1.5 2 Beispiel (Arcussinus). Auf dem Intervall I := (− π2 , π2 ) ist auch die Sinusfunktion streng monoton wachsend, da sin0 = cos positiv auf I ist. Es gilt sin(x) −→ ±1, wenn x −→ ± π2 . Mit dem selben Argument wie zuvor folgt: Es existiert auf J := (−1, 1) eine Umkehrfunktion von sin, die wir arcsin nennen. Ihre Ableitung ist: arcsin0 (x) = 1 1 1 = =√ . sin (arcsin(x) cos(arcsin(x) 1 − x2 0 5.1. DEFINITION UND BEISPIELE 157 Hier ist der Graph von arcsin. 2 1.5 1 asin(t) 0.5 0 -0.5 -1 -1.5 -2 -1 -0.5 0 t 0.5 1 Beispiel (Kurbeltrieb). Ein Kolben ist über eine Stange mit einer rotierenden Scheibe mit Radius r verbunden, wie im folgenden Bild dargestellt: D l r α φ A 0 B C x(t) Die Kurbelbewegung wird in eine geradlinige Bewegung eines Kolbens umgewandelt. Mit f (φ) bezeichnen wir den Kolbenweg (als Funktion des Winkels φ). Die Verbindung AD habe die Länge l. Dann wird f (φ) = 0C − AB − BC = r + l − l cos α − r cos φ Nun haben wir aber (Sinussatz) r l r = =⇒ sin α = sin φ sin α sin φ l also wird r q r 2 2 2 2 f (φ) = r + l − r cos φ − l 1 − ( ) sin φ = l 1 + λ − λ cos φ − 1 − λ sin φ , l wobei λ = r/l das Schubstangenverhältnis bedeutet. Angenommen, der Kurbel wird mit einer Winkelgeschwindigkeit ω gedreht, also φ(t) = ωt, wobei t die Zeit bedeutet. Schreiben wir s(t) = f (φ(t)), 158 KAPITEL 5. DIFFERENZIALRECHNUNG so erhalten wir 0 cos(ωt) ! s (t) = ωr sin(ωt) 1 + λ p 1 − λ2 sin2 (ωt) Der Term in den Klammern (...) wird nie Null, wenn 0 < λ < 1. Die Funktion s0 hat Nullstellen bei kπ/ω, wobei k ∈ {0, 1, 2}. Höhere Ableitungen Definition. Ist I ⊂ R ein offenes Intervall, x0 ∈ I und f : I −→ R eine auf ganz I differenzierbare Funktion, so nennen wir die Funktion x 7−→ f 0 (x), auch die Ableitung von f . Wir nennen eine Funktion f : I −→ R zweimal differenzierbar in x0 , wenn die Ableitung f 0 von f auf einem x0 enthaltenden Intervall definiert und ihrerseits in x0 differenzierbar ist. Die Ableitung von f 0 in x0 bezeichnen wir mit f 00 (x0 ). Analog zu f 0 nennen wir f 00 die zweite Ableitung von f , wenn f 00 (x) in jedem Punkt von I existiert. Dies lässt sich induktiv verallgemeinern: Man nennt eine Funktion f : I −→ R in x0 (k + 1)-mal differenzierbar, wenn sie in einem Intervall um x0 k-mal differenzierbar ist und die k.-te Ableitung f (k) in x0 differenzierbar ist. Wir schreiben: f (k+1) (x0 ) = (f (k) )0 (x0 ). Die Notation f (0) bedeutet die Funktion f selbst. Mitunter ist die folgende Schreibweise günstig: df dk f := f 0 , := f (k) . dx dxk Man bezeichnet f als k-mal stetig differenzierbar, wenn die k-te Ableitung von f stetig ist. Beispiele: 1) Die Funktionen f (x) = xn , mit n ∈ ZZ. Ist k ∈ ZZ + , so haben wir für n > 0: n(n − 1) · · · · · (n − k + 1)xn−k wenn k ≤ n f (k) (x) = 0 wenn k > n Ist n < 0, so ist für alle x 6= 0: f (k) (x) = n(n − 1) · · · · · (n − k + 1)xn−k 2) Die trigonometrischen Funktionen sin und cos. Hier ist sin(2k) = (−1)k sin, cos(2k) = (−1)k cos sin(2k+1) = (−1)k cos, cos(2k+1) = (−1)k+1 sin 3) Weiter gilt exp(k) = exp. Warnung: Nicht zu jeder differenzierbaren Funktion lassen sich Ableitungen beliebig hoher Ordnung bilden: Setzen wir etwa 2k+1 x sin x1 , wenn x 6= 0 f (x) = , 0 , wenn x = 0 so ist f k-mal differenzierbar auf ganz R, aber in 0 nicht (k + 1)-mal differenzierbar. 5.2. LOKALE EXTREMALSTELLEN 5.2 159 Lokale Extremalstellen Mit Hilfe der ersten und zweiten Ableitungen lässt sich untersuchen, ob und wo eine (zumindest 2-mal differenzierbare) Funktion f Extremwerte hat, und von welcher Art diese sind. Definition. Sei f : I −→ R eine auf dem Intervall I stetige Funktion und x0 ∈ I. Dann sagen wir, f habe in x0 lokales Maximum ( bzw. Minimum), wenn ein Intervall J ⊂ I um x0 existiert, so dass f (x) ≤ f (x0 ) für alle x ∈ J ist (bzw. f (x) ≥ f (x0 ) für alle x ∈ J). Entsprechend sagen wir, f habe in x0 ein absolutes Maximum (Minimum), wenn f (x) ≤ f (x0 ) (bzw. f (x) ≥ f (x0 )) für alle x ∈ I. 5.2.1 Hilfssatz. Sei f : (a, b) −→ R differenzierbar. Angenommen, x0 ∈ (a, b) sei ein Punkt, in dem f ein lokales Maximum annimmt, d.h. also, dass f (x) ≤ f (x0 ) für alle x ∈ (x0 − δ, x0 + δ) (mit einer kleinen Zahl δ > 0). Dann ist f 0 (x0 ) = 0. Entsprechendes gilt, wenn f bei x0 ein lokales Minimum annimmt. Beweis. Es gilt f 0 (x0 ) = lim n(f (x0 + n→∞ 1 1 ) − f (x0 )) = lim (−n)(f (x0 − ) − f (x0 )) n→∞ n n Der erste Limes ist ≤ 0 und der zweite ist ≥ 0. Als Folgerung haben den Satz von M. Rolle: 5.2.2 Satz. Ist f : [a, b] −→ R stetig und auf (a, b) differenzierbar und gilt f (a) = f (b), so hat f 0 auf (a, b) eine Nullstelle. Beweis. Ist f konstant, so ist dies klar. Sonst ist das Maximum von f über [a, b] größer als f (a) oder das Minimum von f über [a, b] kleiner als f (a). Die entsprechende Extremumsstelle t liegt in (a, b) und erfüllt f 0 (t) = 0. 5.2.3 Satz (1. Mittelwertsatz). Sei f : [a, b] −→ R stetig und auf (a, b) differenzierbar. Dann gibt es ein ξ ∈ (a, b) mit f (b) − f (a) f 0 (ξ) = . b−a Beweis. In der Tat erfüllt die Funktion g(x) = f (x) − f (b) − f (a) (x − a) b−a die Voraussetzungen des Satzes von Rolle: g(b) = g(a) = f (a). Ist g konstant, wählen wir t beliebig. Sonst wählen wir t ∈ (a, b) so, dass g ein Maximum oder Minimum bei t annimmt. Wir wollen nun Monotoniebereiche einer differenzierbaren Funktion f durch ihre erste Ableitung kennzeichnen. 160 KAPITEL 5. DIFFERENZIALRECHNUNG 5.2.4 Hilfssatz. Angenommen, f : I −→ R sei differenzierbar. i) Gilt dann f 0 > 0 auf I, so ist f auf I streng monoton wachsend. Ist f 0 ≥ 0, so ist f auf I monoton wachsend. ii) Gilt dann f 0 < 0 auf I, so ist f auf I streng monoton fallend. Ist f 0 ≤ 0, so ist f auf I monoton fallend. iii) Ist f 0 = 0 auf I, so ist f auf I konstant. iv) Ist f monoton wachsend (bzw. fallend), so ist f 0 ≥ 0 (bzw. f 0 ≤ 0) auf I. Beweis. i) Sind t, s ∈ I und t < s, so gibt es ein ξ ∈ (t, s) mit f (t) − f (s) = f 0 (ξ)(t − s). Aber f 0 (ξ)(t − s) < 0. Also ist f (t) < f (s). Der zweite Teil der Behauptung wird genauso bewiesen. ii) Man ersetze f durch −f . iii) Siehe i). iv) Wir behandeln den Fall, dass f monoton wachsend ist. Ist dann x0 ∈ I, so gilt f 0 (x0 ) = lim n(f (x0 + n−1 ) − f (x0 )) ≥ 0 n→∞ Zur Klassifikation der Extrema hat man folgendes 5.2.5 Satz. Ist f : (a, b) −→ R eine 2-mal stetig differenzierbare Funktion, so gilt an einer Stelle x0 mit f 0 (x0 ) = 0 folgendes: a) Ist nahe bei x0 schon f 00 ≥ 0, so hat f bei x0 ein lokales Minimum, b) Ist nahe bei x0 schon f 00 ≤ 0, so hat f bei x0 ein lokales Maximum, c) Ist f 00 (x0 ) > 0, so hat f bei x0 ein lokales Minimum, d) Ist f 00 (x0 ) < 0, so hat f bei x0 ein lokales Maximum Beweis. Wir behandeln nur a). Zunächst ist f 0 monoton wachsend. Da f 0 (x0 ) = 0, folgt auf einem kleinen Intervall [x0 − δ, x0 + δ] nun: f 0 ≤ 0 auf [x0 − δ, x0 ], also fällt f auf [x0 − δ, x0 ] mononton und f 0 ≥ 0 auf [x0 , x0 + δ], also wächst f hier monoton. Daraus folgt die Behauptung. Aus a) folgt c), denn wenn f 00 (x0 ) > 0 ist, so ist für eine kleine Zahl δ > 0 auch f 00 (t) > 0, wenn |t − x0 | ≤ δ. Nun wende man a) an. Man erhält b) und d) durch Anwenden von a) auf die Funktion −f an Stelle von f . Definition. Sei f : I −→ R 2-mal stetig differenzierbar. a) Wenn f 00 ≥ 0 auf I, so nennen wir f auch konvex, b) Ist f 00 ≤ 0, so heißt f auch konkav. c) Sei x0 ∈ I. Dann nennen wir x0 eine Wendestelle (bzw. (x0 , f (x0 )) einen Wendepunkt von f ), wenn ein δ > 0 existiert, so dass f 00 (x0 ) = 0 und f links von x0 konvex (bezw. konkav) und rechts von x0 konkav (bezw. konvex) ist. Die Funktion f 00 wechselt bei x0 das Vorzeichen. Es folgt: Anmerkung: Ist etwa f sogar 3-mal stetig differenzierbar mit f 00 (x0 ) = 0 und f 000 (x0 ) 6= 0, so muss f bei x0 einen Wendepunkt haben. 5.2. LOKALE EXTREMALSTELLEN 161 Beispiel: Die kubische Funktion f (x) = x3 + px + q. Ihre ersten beiden Ableitungen sind f 0 (x) = + p, und f 00 (x) = 6x. Es gibt genau eine Wendestelle und zwar bei 0. Auf R− ist f konkav, auf R+ konvex. p Wenn p ≥ 0, gibtpes keine Extrema für f . Ist dagegen p < 0, so hat f 0 Nullstellen genau bei x− = − |p|/3 und x+ = |p|/3. Bei x− hat f ein lokales Maximum, bei x+ ein lokales Minimum. 3x2 Die kubische Funktion f (x) = x3 − 6x2 + 8x − 2. Nun schreiben wir y = x − 2 und setzen ein: = y 3 + 3 · 2y 2 + 3 · 22 y + 23 = y 3 + 6y 2 + 12y + 8 Weiter ist x2 = y 2 + 4y + 4 und 8x = 8y + 16. Insgesamt x3 f (x) = y 3 + 6y 2 + 12y + 8 − 6y 2 − 24y − 24 + 8y + 16 − 2 = y 3 − 4y − 2 = g(x − 2), wobei g(y) = y 3 − 4y − 2 Wir lesen folgendes ab: f hat genau eine Wendestelle, und zwar bei x = 2, ist also auf (−∞, 2) p konkav p und auf (2, ∞) konvex. Es gibt bei x− = 2 − 4/3 ein lokales Maximum und bei x+ = 2 + 4/3 ein lokales Minimum. 162 KAPITEL 5. DIFFERENZIALRECHNUNG Hier ist der Graph: 50 40 30 t3-6*t2+8*t-2 20 10 0 -10 -20 -30 -40 -2 -1 0 1 2 t 3 4 5 6 Anwendungen der Extremumsberechnung Zunächst zum Anfangsbeispiel. Beispiel. Eine zylindrische Dose soll ein festes Volumen V0 haben. Wie müssen ihre Maße gewählt werden, damit der Blechverbrauch möglich klein ausfällt? Wir haben früher gesehen, dass die Oberfläche einer solchen Dose durch f (r) = 2πr2 + 2V0 r gegeben ist, wobei r den Radius bedeutet. Die Frage ist: Für welches r wird f (r) minimal? Dazu berechnen wir die 1. Ableitung und erhalten f 0 (r) = 4πr − 2V0 2πr3 − V0 = 2 r2 r2 p Wir sehen: f 0 (r) = 0 genau dann, wenn r3 = V0 /2π. Weiter ist f 0 (r) < 0, wenn r < r0 := 3 V0 /2π und f 0 (r) > 0, wenn r > r0 . Die Funktion f hat also bei r0 ein absolutes Minimum auf ganz R+ . Beleuchtung eines Punktes. Angenommen, auf einer Bühne befinde sich ein Punkt A, der von einer (als punktförmig angenommenen) Lichtquelle beleuchtet werden soll, welche in der Höhe x 5.2. LOKALE EXTREMALSTELLEN 163 über der Bühne angebracht ist. L α x O a A Für welches x ist die Beleuchtungsstärke, mit der der Lichtstrahl auf A trifft, maximal? Ist I0 die Leuchtstärke der Lichtquelle L, so ist nach dem Lambert-Gesetz die fragliche Beleuchtungsstärke B gerade I0 cos α B= r2 √ Wir drücken cos α und r durch x aus und erhalten wegen cos α = x/r und r = a2 + x2 : B(x) = I0 x . (a2 + x2 )3/2 Wir berechnen die Nullstellen von B 0 und erhalten √ a2 − 2x2 (a2 + x2 )3/2 − 3x2 a2 + x2 0 = I =0 B (x) = I0 0 2 (a2 + x2 )3 (a + x2 )5/2 √ √ √ genau dann, wenn x = a/ 2. Ferner ist B 0 > 0 auf (−∞, a/ 2) und B 0 < 0 auf (a/ 2, ∞). Damit sehen wir, dass √ √ 2I0 3 B ≤ B(a/ 2) = 9a2 Verbraucherwiderstand. Eine Stromquelle mit Spannung Uq hat einen inneren Widerstand Ri . Welche Leistung kann man ihr mit dem Verbraucherwiderstand R maximal entnehmen? Uq Das Ohmsche Gesetz sagt in diesem Falle, dass die zu entnehmende Stromstärke gerade I = Ri +R ist und die entnommene Leistung P (R) = R · I 2 = RUq2 (Ri + R)2 Die Ableitung von P nach R ist P 0 (R) = Uq2 (Ri + R)2 − 2R(Ri + R) Ri − R = Uq2 (Ri + R)4 (Ri + R)3 164 KAPITEL 5. DIFFERENZIALRECHNUNG Genau dann verschwindet P 0 (R), wenn R = Ri . Weiter ist P 0 (R) > 0, wenn R < Ri und P 0 (R) < 0, wenn R > Ri . Somit nimmt P sein Maximum bei R = Ri an. Es gilt Pmax = P (Ri ) = Uq2 4Ri Snelliussches Brechungsgesetz Tritt Licht von einem Medium I in ein anderes Medium II über, so werden seine Strahlen gebrochen. das Brechungsgesetz sagt, wie die Brechungswinkel und die Ausbreitungsgeschwindigkeiten des Lichtes in den beiden Medien miteinander zusammenhängen. Wenn cI die Lichtgeschwindigkeit im Medium I und cII die im Medium II ist, so ist der Brechungsindex von Medium I gerade nI = c/cI und der von Medium II ist nII = c/cII , wobei c die Vakuumlichtgeschwindigkeit ist. Das Prinzip von P. Fermat sagt, dass das Licht denjenigen Weg nimmt, zu dessen Durchlaufung es die kleinste Zeitspanne benötigt. Das wenden wir nun an. I a α d x β b II Mit dem Weg-Zeit-Gesetz erhalten wir für die Laufzeiten des Lichtes √ a2 + x2 = tI (x) · cI Medium I p 2 b + (d − x)2 = tII (x) · cII Medium II Gesucht ist der Wert x, für den t(x) = tI (x) + tII (x) minimal wird. Die Ableitung ist t0 (x) = cI √ x d−x p − 2 2 2 a +x cII b + (d − x)2 5.2. LOKALE EXTREMALSTELLEN 165 Aus t0 (x) = 0 folgt nun cI √ d−x x p = a2 + x2 cII b2 + (d − x)2 Beachten wir den Zusammenhang mit α und β: cI √ x = sin α, a2 + x2 d−x cII p b2 + (d − x)2 = sin β finden wir, dass 1 1 sin α = sin β cI cII oder sin α nII = : sin β nI das Snelliussche Brechungsgesetz . Konvexität f 00 Erinnerung. Wir nennen eine 2-mal stetig differenzierbare Funktion f : [a, b] −→ R konvex, wenn ≥ 0 gilt. Ist f 00 ≤ 0, so heißt f konkav. Beispiel. 1) Die Funktion f (x) = ax2 + bx + c ist genau dann konvex, wenn a ≥ 0. 2) Die Funktion x 7−→ ex ist überall konvex 3) Die Funktion g(x) = x3 − 4x2 + 3 hat als 2. Ableitung g 00 (x) = 6x − 8, ist also auf [4/3, ∞) konvex. 5.2.6 Satz. Ist eine Funktion f : [a, b] −→ R konvex, so gilt f (ty + (1 − t)x) ≤ t(f (y) + (1 − t)f (x) für alle x, y ∈ [a, b] und alle t ∈ [0, 1]. Das bedeutet: Sind (x, f (x)) und (y, f (y)) Punkte auf dem Graphen von f , so verläuft der Graph von f zwischen x und y stets unterhalb der Sekanten durch (x, f (x)) und (y, f (y)). Beweis. Halten wir nämlich x, y ∈ [a, b] fest, so ist die Funktion g(t) := f (ty + (1 − t)x) − t(f (y) − (1 − t)f (x) ebenfalls konvex, also ihre 1. Ableitung monoton wachsend. Wir müssen zeigen, dass g ≤ 0 auf [0, 1]. Dazu unterscheiden wir 3 Fälle: i) g 0 (1) ≤ 0. Dann ist g 0 ≤ 0 auf [0, 1], also g(t) ≤ g(0) = 0 für alle t, ii) g 0 (0) ≥ 0. Dann ist g(t) ≤ g(1) = 0, iii) Es gilt g 0 (0) < 0 < g 0 (1). Es gibt dann ein t0 ∈ (0, 1) mit g 0 (t0 ) = 0. Nun gilt links von t0 , dass g ≤ g(0) = 0 und rechts von t0 , dass g ≤ g(1) = 0. Also stets g ≤ 0. 5.2.7 Satz. Hat eine konvexe Funktion f : [a, b] −→ R bei x0 ein lokales Minimum, so ist hier schon ein absolutes Minimum. 166 KAPITEL 5. DIFFERENZIALRECHNUNG Beweis. Anderenfalls gäbe es ein z0 ∈ [a, b] mit f (z0 ) < f (x0 ). Dann hätte man aber f (tz0 + (1 − t)x0 ) ≤ tf (z0 ) + (1 − t)f (x0 ) für alle t ∈ (0, 1]. Aber die rechte Seite ist stets kleiner als f (x0 ), ein Widerspruch. 5.2.8 Satz. Ist f : [a, b] −→ R konvex und x0 ∈ (a, b), so ist f (x) ≥ f (x0 ) + f 0 (x0 )(x − x0 ) Beweis. Denn g(x) := f (x) − f (x0 ) − f 0 (x0 )(x − x0 ) ist konvex und hat wegen g 0 (x0 ) = 0 bei x0 ein lokales und damit absolutes Minimum mit g(x0 ) = 0, also ist g ≥ 0. Näherungsverfahren zur Nullstellenberechnung nach Newton Sei f : (a, b) −→ R eine zweimal stetig differenzierbare konvexe Funktion, mit f 0 (x) 6= 0 für x ∈ (a, b). Angenommen, f (a) < 0 < f (b) und f 0 (x) > 0 auf (a, b). Dann gibt es genau eine Nullstelle x0 ∈ (a, b). Wir wählen x1 < b mit f (x1 ) > 0. Dann ist x1 > x0 . Dann sehen wir uns die Tangente an die Kurve von f bei (x1 , f (x1 )) an. Sie hat die Gleichung y = f1 (x) := f 0 (x1 )(x − x1 ) + f (x1 ) Nun definieren wir x2 als die Nullstelle von f1 . Es folgt x2 = x1 − f (x1 ) < x1 f 0 (x1 ) Angenommen, wir haben xn schon definiert und f 0 (xn ) > 0. Dann setzen wir fn (x) = f 0 (xn )(x − xn ) + f (xn ) (Tangente an die Kurve von f bei (xn , f (xn )). Sie hat bei xn+1 = xn − f (xn ) f 0 (xn ) eine Nullstelle. Es gilt (wegen der Konvexität von f ): fn (xn+1 ) = 0 = f (x0 ) ≥ fn (x0 ), also xn+1 ≥ x0 . Weiter gilt: f 0 (xn+1 ) ≥ f 0 (x0 ) > 0. Damit ist auch xn+2 = xn+1 − (f /f 0 )(xn+1 ) wohldefiniert. So fortfahrend erhalten wir eine Folge (xn )n , die nach unten durch x0 beschränkt ist. Da n) xn+1 = xn − ff0(x (xn ) ≤ xn , konvergiert diese Folge. Ihr Grenzwert ist eine Nullstelle von f , also x0 selbst. Wenn f (a) > 0 > f (b) und f 0 (x) < 0 für x ∈ (a, b), so wird die Folge wie oben definiert, 5.2. LOKALE EXTREMALSTELLEN 167 nur wählen wir jetzt x1 ∈ (a, x0 ). Diesmal wächst (xn )n monoton gegen die Nullstelle x0 von f . f f 1 f2 0 x x0 5x4 x 3 x 2 x 1 Beispiele: a) Es sei f (x) = x5 − x − 1 und a = 1, b = 1.3. Nun gilt f 00 (x) = 20x3 > 0, f 0 (x) = − 1 > 4 auf [a, b]. Es sei x1 = 1.2 Wir müssen jetzt Werte der Iterationsfunktion g(x) = x − f (x) x5 − x − 1 4x5 + 1 = x − = f 0 (x) 5x4 − 1 5x4 − 1 berechnen. Wir erhalten x2 x3 x4 x5 = g(x1 ) = 1.169222 = g(x2 ) = 1.167311 = g(x3 ) = 1.167303 = g(x4 ) = 1.167303 In der Tat ist f (x5 ) = −0.000008. x b) Die erste Extremalstelle von f (x) = sinx x . Wir leiten ab und erhalten f 0 (x) = x cos x−sin . Damit x2 3 0 wird also f (x) = 0, wo tgx = x ist. Die erste positive Nullstelle liegt im Intervall [π, 2 π]. Wir bilden nun g(x) = tgx − x Dann ist g 0 (x) = 1 cos2 x − 1 > 0, also ist g monoton. Ferner haben wir g 00 (x) = 2 sin x >0 cos3 x auf [π, 32 π]. Es sei jetzt R(x) = x − g tgx − x sin x cos x − x cos2 x (x) = x − = x − = x − tgx + x (tgx)2 1 2 g0 sin x − 1 2 cos x 168 KAPITEL 5. DIFFERENZIALRECHNUNG Nun wählen wir x1 = 4.7 und erhalten x2 x3 x4 x5 x6 x7 x8 x9 = R(x1 ) = 4.68833 = R(x2 ) = 4.66698 = R(x3 ) = 4.63118 = R(x4 ) = 4.58047 = R(x5 ) = 4.52843 = R(x6 ) = 4.49914 = R(x7 ) = 4.49356 = R(x8 ) = 4.49341 |x10 − x9 | < 10−5 In der Tat ist f 0 (x9 ) = 1.177 · 10−7 . 1 0.8 sin(x)/x 0.6 0.4 0.2 0 -0.2 -0.4 -1 0 1 2 3 4 5 6 x Beispiel (Kurbeltrieb). Ein Kolben ist über eine Stange mit einer rotierenden Scheibe mit Radius r verbunden, wie im folgenden Bild dargestellt: D l r α A 0 φ B C x(t) Die Kurbelbewegung wird in eine geradlinige Bewegung eines Kolbens umgewandelt. Mit f (φ) bezeichnen wir den Kolbenweg (als Funktion des Winkels φ). Die Verbindung AD habe die Länge l. Dann wird 5.2. LOKALE EXTREMALSTELLEN 169 r q r 2 2 2 2 f (φ) = r + l − r cos φ − l 1 − ( ) sin φ = l 1 + λ − λ cos φ − 1 − λ sin φ , l wobei λ = r/l das Schubstangenverhältnis bedeutet. Angenommen, der Kurbel wird mit einer Winkelgeschwindigkeit ω gedreht, also φ(t) = ωt, wobei t die Zeit bedeutet. Schreiben wir s(t) = f (φ(t)), so erhalten wir für die Kolbengeschwindigkeit ! cos(ωt) v(t) := s0 (t) = ωr sin(ωt) 1 + λ p 1 − λ2 sin2 (ωt) Was ist die Maximalgeschwindigkeit des Kolbens? Wir schreiben nun X := λ2 sin2 (ωt) und finden √ v = ωl r X 1+ λ2 − X 1−X ! Die zeitliche Ableitung ist nun v 0 (t) = dv dv 0 X (t) = 2λ2 ω sin(ωt) cos(ωt) dX dX dv Dieser Term verschwindet bei t = 0, π/ω sowie t = π/2ω, 3π/2ω und dort, wo dX = 0 wird. Die ersten beiden Nullstellen führen auf v(t) = 0, sind also irrelevant. Die Nullstellen t = π/2ω, 3π/2ω ergeben dv |v| = ωr. Nun suchen wir Nullstellen für dX . Es gilt ! r 1 dv 1 λ2 − X 1 1√ 1 − λ2 q 1+ = √ − X 2 ωl dX 1−X 2 (1 − X) λ2 −X 2 X 1−X Setzen wir dv dX √ q = 0 und multiplizieren mit 2 X 1 − r 1−λ2 1−X , folgt λ2 − X X 2 − 2X + λ2 =− 1−X (1 − X)2 Wir quadieren und formen noch etwas um. Dann finden wir −X 3 + X 2 + X − λ2 = 0 Auf die Funktion f (X) = −X 3 + X 2 + X − λ2 kann über dem Intervall (0, 13 ) das Newtonverfahren p angewendet werden, sofern λ < 11/27 ist. Wir nehmen an, es sei λ = 0.2. Dann gilt f (0.04) > 0.001 und f (0) = −0.04. Also liegt zwischen 0 und 0.04 eine Nullstelle von f . Im Interval [0, 0.1] ist nun f 0 (x) = −3( (x − 13 )2 − 49 ) > 0, und ebenso ist f 00 (x) = −6x + 2 = −6(x − 13 ) > 0. Wir setzen wieder R(x) = x − f (x) f 0 (x) 170 KAPITEL 5. DIFFERENZIALRECHNUNG und x1 = 0.04, sowie xn+1 = R(xn ). Dann wird x2 = 0.0385714 und x3 = 0.0385698, die Werte x4 , x5 , ... unterscheiden sich nur noch in der 8. Nachkommastelle von x3 . Wir setzen daher X = 0.0385698 in die Gleichung für v ein und finden |v| = 1.02ωr 5.3 Taylorentwicklung Wir beginnen mit der folgenden Beobachtung: 5.3.1 Hilfssatz. Ist f : (x0 − a, x0 + a) −→ R eine k-mal stetig differenzierbare Funktion, so hat das Taylorpolynom k Tf,x (x) := 0 k X f (`) (x0 ) `=0 `! (x − x0 )` der Ordung k zum Entwicklungspunkt x0 die Eigenschaft: k f (j) (x0 ) = (Tf,x )(j) (x0 ), f ür alle j = 0, ..., k 0 k In x0 stimmen also alle Ableitungen von Tf,x mit den entsprechenden Ableitungen von f überein. 0 k Das hat zur Folge, dass sich die Schaubilder von f und Tf,x nahe x0 von hoher Ordnung aneinander 0 x schmiegen. Das Bild zeigt f (x) = e und das Taylorpolynom 2. Ordnung um den 5.3. TAYLORENTWICKLUNG 171 Entwicklungspunkt x0 = 1. 14 12 10 8 6 4 2 0 -1 -0.5 0 0.5 1 1.5 2 2.5 x Wir wenden uns der Frage zu, inwieweit man eine unendlich oft differenzierbare Funktion f durch ihre Taylorreihe darstellen kann. Der Satz von Taylor ist die folgende Verfeinerung des Mittelwertsatzes: 5.3.2 Satz. Angenommen, f : (x0 − a, x0 + a) −→ R sei (k + 1)-mal stetig differenzierbar. Dann gibt es zu jedem x ∈ (x0 − a, x0 + a) eine Zwischenstelle ξ zwischen x und x0 , so dass f (x) = k X f (j) (x0 ) j=0 Man nennt dabei den Term f (k+1) (ξ) (k+1)! (x j! (x − x0 )j + f (k+1) (ξ) (x − x0 )k+1 (k + 1)! − x0 )k+1 das Restglied . Wenn nun f unendlich oft differenzierbar ist und das Restglied gegen Null geht, so kann man f durch seine Taylorreihe ∞ X f (j) (x0 ) (x − x0 )j j! j=0 darstellen. Das ist der Inhalt des folgenden Satzes: 5.3.3 Satz (Konvergenzsatz). Angenommen, es sei f : (x0 − a, x0 + a) −→ R sei unendlich oft differenzierbar, und es gebe eine Zahl C > 0, so dass für jedes x ∈ (x0 − a, x0 + a) gilt: f (k) (x) k a ≤ C k! so konvergiert die Taylorreihe von f überall auf (x0 − a, x0 + a) gegen f . 172 KAPITEL 5. DIFFERENZIALRECHNUNG Beweis. In der Tat ist für jedes x ∈ (x0 − a, x0 + a) das Restglied nun durch f (k) (ξ) |x − x0 | k ) |x − x0 |k ≤ C( k! a abzuschätzen. Da aber |ξ−x0 | a < 1, strebt die rechte Seite gegen 0, wenn k −→ ∞. Der Konvergenzsatz lässt sich noch erweitern: 5.3.4 Satz. In der Situation des Konvergenzsatzes kann man die Taylorreihe von f gliedweise differenzieren und integrieren, um Ableitung und Stammfunktion von f zu finden. Beispiele (i) Polynome. Ist f ein Polynom vom Grade n, so gilt stets f (x) = Txn0 f (x) für jeden Entwicklungspunkt x0 . Die Taylorkoeffizienten sind durch das Hornerschema zu berechnen. Ist nämlich f (x) = f (x0 ) + (x − x0 )f1 (x) mit einem Polynom f1 , so wird f1 (x0 ) = f 0 (x0 ), und f1 (x0 ) ist mit dem Hornerschema zu berechnen. Wenn dann f1 (x) = f1 (x0 ) + (x − x0 )f2 (x) mit einem Polynom f2 , so wird f (x) = f (x0 ) + (x − x0 )f1 (x0 ) + (x − x0 )2 f2 (x) Das liefert f2 (x0 ) = f 00 (x0 ) 2! So fahre man fort. Ist etwa f (x) = x3 und x0 = 10, so wird 1 1 f (x) = f (10) + f 0 (10)(x − 10) + f 00 (10)(x − 10)2 + f 000 (10)(x − 10)3 2 6 = 1000 + 300(x − 10) + 30(x − 10)2 + (x − 10)3 (ii) Die Exponentialfunktion. Nun sei x0 ∈ R. Dann wird exp(j) (x0 ) e x0 = j! j! Für jedes k ∈ ZZ + und jedes a > 0 und ξ ∈ (x0 − a, x0 + a) ist dann exp(k) (ξ) k a ≤ Ca := ex0 +2a k! 5.3. TAYLORENTWICKLUNG 173 mit einer geeigneten Konstanten Ca . Es folgt n Texp ,x0 (x) x0 =e n X (x − x0 )k k! k=0 exp(x) = e x0 n lim Texp ,x0 (x) n→∞ (iii) Logarithmus. Sei f (x) = ln (1 + x). Dann ist für jedes j ≥ 1: f (j) (x) (−1)j−1 = j! j (1 + x)j Das ergibt für alle x, ξ ∈ (0, 1): f (j) (ξ) xj j x ≤ j! j Somit wird n (x)| ≤ |f (x) − Tf,0 Kombinieren wir das mit n Tln (1− ·),0 = − xn 1 ≤ n n n X 1 j=1 so folgt für h(x) := ln 1+x 1−x , j xj , dass 2n+1 Th,0 (x) = n X k=0 2 x2k+1 2k + 1 Als Beispiel bestimmen wir näherungsweise ln 6. Es gilt h(5/7) = ln 6, also 7 X 5 2 15 5 Th,0 ( ) = ( )2k+1 7 2k + 1 7 k=0 5 1 5 3 1 5 5 1 5 7 1 5 9 1 5 11 1 5 13 1 5 15 = 2 + ( ) + ( ) + ( ) + ( ) + ( ) + ( ) + ( ) 7 3 7 5 7 7 7 9 7 11 7 13 7 15 7 = 1.79104 (iv) Trigonometrische Funktionen. Sei x0 = 0 und f (x) = sin x. Dann ist f (k) (0) = 0, wenn k gerade ist und f (2k−1) (0) = (−1)k für alle k ≥ 1. Ist jetzt a > 0 beliebig, so gilt für jedes ξ ∈ (−a, a): f (2k−1) (ξ) 1 2k−1 ≤ a2k−1 C := ea . a (2k − 1)! (2k − 1)! Das ergibt 2n+1 Tsin,0 (x) = n X (−1)k 2k+1 x (2k + 1)! k=0 174 KAPITEL 5. DIFFERENZIALRECHNUNG In entsprechender Weise findet man 2n Tcos x,0 = n X (−1)k k=0 (2k)! x2k Beispiel. Gegeben sei ein Bogenstück s mit Winkel α. Man kenne die Längen der beiden Sehnen, die zu α/2 und α/4 gehören. Dann gilt näherungsweise 8b − a s= . 3 s a α/2 b α/2 Zunächst ist ja s = rb α, wobei α b= α 180◦ π und α b a = 2r sin( ), 2 also α b b = 2r sin( ) , 4 8b − a 2r α b α b = ( 8 sin( ) − sin( ) ) . 3 3 4 2 Nun setzen wir ein, dass sin α b α b 1 α b 1 α b = − ( )3 + ( )5 + R 1 4 4 6 4 120 4 sin α b α b 1 α b 1 α b = − ( )3 + ( )5 + R2 , 2 2 6 2 120 2 und wobei |R1 | ≤ 1 α b ( )6 , 720 4 |R2 | ≤ 1 α b ( )6 720 2 5.3. TAYLORENTWICKLUNG 175 Das ergibt 8b − a 3 2r 3b α 8 α b 1 α b 1 8 1 5 − ( )3 + ( )3 + ( 5 − 5 )b α + 8R1 − R2 3 2 6 4 6 2 120 4 2 r 2r = s− α b5 + (8R1 − R2 ) 7680 3 1 1 4 5 ≈ s 1+ α b + α b 7680 61440 = Für |α| ≤ 60◦ ist der Klammerterm ≈ 1.000170026, so dass der relative Fehler < 0.2% wird. 1 1 2 (v) Arcustangens. Es gilt (arctg )0 (x) = 1+x 2 und mit der Kettenregel, auf ϕ(t) := 1+t und x 7−→ x angewendet: (arctg )(2k+1) (0) = (−1)k (2k)! und 2n+1 Tarctg,0 (x) = n X (−1)k 2k+1 x 2k + 1 k=0 Das führt uns auf eine Formel für π, nämlich n X (−1)k π = lim 4 n→∞ 2k + 1 k=0 Aber die Folge auf der rechten Seite konvergiert nur langsam: Ab n = 2475 sind die ersten 3 Nachkommastellen korrekt, für 4 korrekte Nachkommastellen muss n > 30000 werden. Stattdessen kann man eine Formel von J. Machin (etwa 1700) benutzen, die aus dem Additionstheorem für die Tangensfunktion gewonnen werden kann: π 1 1 = 4arctg( ) − arctg( ) 4 5 239 (M ) Dazu beachten wir tg (4α) − tg (β) 1 − tg (4α)tg (β) 4tg (α) (1 − tg 2 (α) ) − tg (β) (tg 4 (α) − 6tg 2 (α) + 1) (tg 4 (α) − 6tg 2 (α) + 1) + 4tg (α)tg (β) (1 − tg 2 (α) ) tg (4α − β) = = Nun schreiben wir für festes x > 0 und n > 0 noch x = 1 wird aus x = tg (4α−β) die Gleichung (C) 1 tg (4α−β , 1 α = arctg ( x+n ) und t = tg (β). Dann 1 1 arctg ( ) = 4α − β = 4arctg ( ) − arctg t x x+n Setzen wir die Größen x, n und t in (B) ein, finden wir 1 = x 4 x+n (1 1 2 1 2 1 4 − ( x+n ) ) − t · (1 − 6( x+n ) + ( x+n ) ) 1 2 1 4 1 − 6( x+n ) + ( x+n ) + 4t x+n (1 (B) 1 2 − ( x+n ) ) 176 KAPITEL 5. DIFFERENZIALRECHNUNG Nun wählen wir x = 1 und n = 4. Dann entsteht 1= 4 5 (1 − ( 15 )2 ) − t · (1 − 6( 15 )2 + ( 15 )4 ) = 1 2 1 − 6( 15 )2 + ( 51 )4 + 4t 5 (1 − ( 5 ) ) 480−476t 625 476+480t 625 = 480 − 476t 476 + 480t 4 956 = 1 . So wird aus (C) die behauptete Gleichung (M). P10239(−1)k Setzen wir darin die Näherung arctg (x) = k=0 2k+1 ein, finden wir π bis auf 14 Nachkommastellen genau. Das kann nach t aufgelöst werden, mit t = (vi) Allgemeine Potenz. Wir betrachten für α ∈ R die Funktion fα (x) = (1 + x)α auf dem Intervall (−1, 1). Dann ist fα(k) (x) = α(α − 1) · · · · · (α − k + 1)xα−k , also (k) fα (0) α = , k! k wenn wir α k α 0 := α(α − 1) · · · · · (α − k + 1) k! für k ≥ 1 und = 1 setzen. Nun bilden wir fα(k+1) (0) k+1 |α − k| |α| (k+1)! a a≤( + 1)a = (k) fα (0) k k+1 k+1 a k! Die rechte Seite ist für genügend großes k nach oben durch eine Zahl b < 1 abzuschätzen. Das ergibt f (k+1) (0) f (k) (0) α k+1 α k ≤ b a a (k + 1)! k! oder, wie nun induktiv folgt f (k) (0) α k a ≤ bk < 1 k! Damit haben wir auf (−1, 1) sogar fα (x) = lim Tfnα ,0 (x) n→∞ √ Wir berechnen 3 6. Es gilt mit α = 1/3 nun √ 1 3 6 = 2f1/3 (−1/4) ≈ 2Tf4α ,0 (− ) 4 1 1 1 1 1/3 1/3 1/3 = 2 1− + − + 2 3 4 12 16 64 256 1 1 1 10 1 80 1 = 2 1− − + − 12 9 16 6 · 27 64 24 · 81 256 = 1, 817 5.3. TAYLORENTWICKLUNG 177 Die Regel von De L’ Hospital 5.3.5 Satz. Angenommen, es seien f, g : (a, b) −→ R 2-mal stetig differenzierbar und x0 ∈ (a, b) ein Punkt. a) Angenommen, es sei f (x0 ) = g(x0 ) = 0, aber g 0 (x0 ) 6= 0, Dann gilt lim x→x0 f f0 (x) = 0 (x0 ). g g b) Es seien f und g beliebig oft differenzierbar und f (x0 ) =, ..., = f (k−1) (x0 ) = 0, ebenso g(x0 ) = f0 f , ..., = g (k−1) (x0 ) = 0, während g (k) (x0 =6= 0, so wird lim (x) = 0 (x0 ). x→x0 g g 0 c) Wenn g auf (x0 , b) keine Nullstelle hat und f (x), g(x) −→ +∞ für x & x0 , und existiert der Grenzwert f0 c := lim 0 (x) , x&x0 g so ist wieder lim x→x0 f (x) = c. g Beweis. Zu a) Ist (tn )n eine Folge in I \ {x0 }, die gegen x0 konvergiert, so haben wir f (tn )/g(tn ) = f (x0 ) + f 0 (t0n )(tn − x0 ) f 0 (t0n ) = , wobei t0n und t00n zwischen tn und x0 liegen. Dann ist aber g(x0 ) + g 0 (t00n )(tn − x0 ) g 0 (t00n ) lim f 0 (tn )/g 0 (tn ) = f0 (x0 ). g0 f (k) (t0n ) (tn k! (k) 00 g (tn ) (tn k! = n→∞ Zu b) Nun schreiben wir f (tn )/g(tn ) = k−1 Tf,x (tn ) + 0 k−1 Tg,x 0 (tn ) + − x0 )k − x0 )k f (k) f (k) (t0n ) −→ (x0 ), g (k) (t00n ) g (k) wenn n → ∞. Zu b). Zu beliebigem ε > 0 finden wir ein δ > 0 mit c−ε< f0 (x) < c + ε g0 für alle x ∈ (x0 − δ, x0 + δ). Sei x1 ∈ (x0 , x0 + δ) fest gewählt. Wir überlegen uns, dass mit geeigenten Konstanten k1 , k2 und alle x ∈ (x0 , x1 ) gilt: (1) (c − ε)g(x) + k1 < f (x) < (c + ε)g(x) + k2 Denn der 2. Mittelwertsatz sagt, dass zu x ∈ (x0 , x1 ) eine Stelle tx ∈ (x0 , x) existiert, für die f (x) − f (x1 ) f 0 (tx ) = 0 g(x) − g(x1 ) g (tx ) 178 KAPITEL 5. DIFFERENZIALRECHNUNG Die rechte Seite liegt aber zwischen c − ε und c + ε, also haben wir c−ε< f (x) − f (x1 ) <c+ε g(x) − g(x1 ) Wegen der Annahme, es sei g 0 (x) 6= 0 überall folgt aus g(x) → ∞, dass g(x) > g(x1 ), somit (c − ε)g(x) − (c − ε)g(x1 ) + f (x1 ) < f (x) < (c + ε)g(x) − (c + ε)g(x1 ) + f (x1 ) Also können wir k1 = −(c − ε)g(x1 ) + f (x1 ), k2 = −(c + ε)g(x1 ) + f (x1 ) wählen. Teilen wir in (1) alles durch g(x) so erhalten wir f (x) k2 k1 < −c<ε+ −ε + g(x) g(x) g(x) Lassen wir dann noch x → x0 gehen, folgt die Behauptung. Beispiele. a) Freier Fall mit Berücksichtigung des Luftwiderstandes. Angenommen, ein Körper mit der Masse m fällt nach unten. Nach dem Fallweg s ist seine Geschwindigkeit bei einem Reibungskoeffizienten k > 0: r mg v(k) = 1 − e−2ks/m k Was ist der Grenzwert, wenn k −→ 0? Dazu setzen wir f (k) := mg 1 − e−2ks/m und g(k) = k. Dann ist die Regel von Bernoulli-L’Hospital anwendbar und ergibt f f0 (−2s) (k) = lim 0 (k) = lim f 0 (k) = lim mg · (−1)e−2ks/m · = 2gs k−→0 g k−→0 g k−→0 k−→0 m √ Es folgt limk−→0 v(k) = 2gs. b) 1 lim (1 + x) x = e lim x−→0 denn 1 ln (1 + x) x = also ln (1 + x) , x 1 ln (1 + x) 1 lim ln (1 + x) x = lim = lim = 1, x→0 x→0 x→0 1 + x x woraus folgt: 1 1 lim (1 + x) x = exp lim ln (1 + x) x =e x−→0 x→0 c) 1 − cos(x/2) 1 = x→0 1 − cos x 4 lim Wir wählen f (x) = 1 − cos(x/2), g(x) = 1 − cos x und erhalten f 0 (x) = 12 sin x2 , g 0 (x) = sin x. Wir sehen, dass 0 eine isolierte Nullstelle von g, g 0 und g 00 ist. Ferner haben wir f 00 (x) = 41 cos(x/2), g 00 (x) = 5.3. TAYLORENTWICKLUNG 179 cos x. Somit existiert limx→0 f 00 (x)/g 00 (x) und hat den Wert 1/4. Nach obiger Regel für f 0 , g 0 existiert auch limx→0 f 0 (x)/g 0 (x) = 1/4 und nach nochmaliger Anwendung der Regel sehen wir, dass limx→0 f (x)/g(x) = 1/4. d) Was ist limx→0 x ln x ? Dazu schreiben wir x ln x = − f (x) g(x) mit f (x) = −ln x und g(x) = x−1 . Dann ist Regel b) von De L’Hospital anwendbar, da g 0 (x) = −x−2 < 0 0 auf (0, ∞). Weiter gilt f (x), g(x) −→ +∞ mit x & 0 und f 0 (x) = −1/x, also fg0 (x) = x −→ 0 mit x → 0. Somit finden wir, dass lim x ln x = 0 . x→0