Mathematik für Geowissenschaftler 24. Januar 2012 Inhaltsverzeichnis 1 Vorlesung 1.1 1.2 1.3 F2 , der Körper mit zwei Elementen . . . . . 1.1.1 Drei Anwendungen . . . . . . . . . 1.1.2 One Time Pad . . . . . . . . . . . . . 1.1.3 RAID-5 . . . . . . . . . . . . . . . . . 1.1.4 Fehler korrigierende Codes . . . . . Die Körperaxiome und ihre Folgen . . . . . 1.2.1 Erste Folgerungen aus den Körperaxiomen . . . . . . . . . . . . . . . . . . . 1.2.2 Die binomischen Formeln . . . . . . 1.2.3 Die Regeln der Bruchrechnung . . . 1.2.4 Umformungen von Gleichungen . . 1.2.5 Potenzen in Körpern . . . . . . . . . Ordnung muß sein . . . . . . . . . . . . . . 1.3.1 Angeordnete Körper . . . . . . . . . 1.3.2 Folgerungen aus den Anordnungsaxiomen . . . . . . . . . . . . . . . . 1.3.3 Die Betragsfunktion . . . . . . . . . 1.3.4 Das Supremumsaxiom . . . . . . . . 1.3.5 Archimedizität . . . . . . . . . . . . 7 8 10 11 12 12 15 17 19 20 21 21 23 23 24 27 28 30 1.3.6 Wurzeln . . . . . . . . . . . . . . . . Aussagenlogik und Mengenlehre . . . . . . 1.4.1 Mengenlehre . . . . . . . . . . . . . 1.4.2 Quantoren . . . . . . . . . . . . . . . 1.5 Funktionen und Flächen . . . . . . . . . . . 1.5.1 Flächen . . . . . . . . . . . . . . . . . 1.5.2 Trigonometrische Funktionen . . . . 1.5.3 Eigenschaften von Funktionen . . . 1.5.4 Der natürliche Logarithmus . . . . . 1.6 Vektoren, Vektorräume, Abstände: 2D . . . 1.7 Polynome I . . . . . . . . . . . . . . . . . . . 1.7.1 Definition und Eigenschaften von Polynomen . . . . . . . . . . . . . . . . 1.7.2 Tangenten an Polynome . . . . . . . 1.8 Polynome II: Die Ableitungsregeln . . . . . 1.8.1 Konstante Faktoren Regel . . . . . . 1.8.2 Summenregel . . . . . . . . . . . . . 1.8.3 Produktregel . . . . . . . . . . . . . 1.8.4 Allgemeine Produktregel . . . . . . 1.8.5 Kettenregel . . . . . . . . . . . . . . 1.9 Polynome III: Analysis . . . . . . . . . . . . 1.9.1 Fundamentalsatz der Algebra . . . . 1.9.2 Zwischenwertsatz für Polynome . . 1.9.3 Satz von Rolle für Polynome . . . . 1.9.4 Mittelwertsatz für Polynome . . . . 1.10 Integration Teil I . . . . . . . . . . . . . . . . 1.10.1 Ein Integralbegriff (nicht nur für Polynome) . . . . . . . . . . . . . . . . 1.4 31 34 34 41 45 45 47 49 53 56 69 69 76 78 78 79 80 80 82 86 86 88 89 91 95 95 1.10.2 Die Integrationsregeln . . . . . . . . 106 1.10.3 Beispiele für Integrationstechniken . 108 1.10.4 Tangenten . . . . . . . . . . . . . . . 115 1.11 Jenseits der Polynome . . . . . . . . . . . . 128 1.11.1 Grundlegende Eigenschaften . . . . 128 1.11.2 Die Ableitungen und Stammfunktionen der trigonometrischen Funktionen . . . . . . . . . . . . . . . . . . . 133 1.11.3 Potenzreihenentwicklungen von Funktionen . . . . . . . . . . . . . . . . . 139 1.11.4 Formale Potenzreihen und Konvergenz . . . . . . . . . . . . . . . . . . 147 1.12 Anhang A: Eigenschaften von streng monotonen Funktionen . . . . . . . . . . . . . . . 156 1.13 Anhang B: Eigenschaften von Flächenfunktionen . . . . . . . . . . . . . . . . . . . . . . 161 2 Ergänzungen 2.0.1 2.0.2 2.0.3 2.0.4 167 E: Das Nim Spiel . . . . . . . . . . . 168 E: Die reellen Zahlen als Dezimalzahlen . . . . . . . . . . . . . . . . . 174 2.0.2.1 Der Wert von Dezimalzahlen179 2.0.2.2 Probleme mit Dezimalzahlen180 E:Kombinatorik, die Kunst des gepflegten Zählens . . . . . . . . . . . 182 2.0.3.1 Einfache Zählformeln . . . 182 2.0.3.2 Teilmengen . . . . . . . . . 184 E: Komplexe Zahlen . . . . . . . . . 189 2.0.5 2.0.6 2.0.7 2.0.8 E: Der Haupsatz der Mineralogie . . GPS und Verwandte . . . . . . . . . 2.0.6.1 2D . . . . . . . . . . . . . . E: Einführung in das Computeralgebrasystem Maxima . . . . . . . . . . 2.0.7.1 Einführung . . . . . . . . . 2.0.7.2 Rechnen mit Maxima . . . E: Stetigkeit . . . . . . . . . . . . . . 198 206 206 216 216 225 249 1 Vorlesung 1.1 F2 , der Körper mit zwei Elementen Wir betrachten eine Menge bestehend aus zwei Objekten: M := {, O} Wir definieren zwei Operationen auf dieser Menge: ⊕ ⊕ = = ⊕O = O O = O⊕ = O O = O⊕O = OO = O Bei einer Operation wird also jeder möglichen Kombination von Elementen der Menge ein “Ergebnis”, also wieder ein Element der Menge zugewiesen. Wir wollen nun die Eigenschaften dieser Operationen untersuchen. Zunächst einmal stellen wir fest, daß die Operationen unabhängig von der Reihenfolge sind: Beide Operationen sind kommutativ. Deshalb können wir die Verknüpfungen auch kürzer in den folgenden beiden Tabellen beschreiben: ⊕ O O O O O O O Die Kommutativität können wir auch wie folgt ausdrücken a b = b a und a ⊕ b = b ⊕ a für alle a, b ∈ M. Weiter stellen wir fest, daß beide Operationen ein Neutralelement haben, also ein Element, dessen Verknüpfung nichts bewirkt: a ⊕ = a und a O = a für alle a ∈ M. Es gilt das Assoziativgesetz für ⊕: a b c ( a ⊕ b) ⊕ c ⊕ = O ⊕O = O O O⊕ = O O O O⊕O = O O⊕ = O O O O⊕O = O O ⊕ = O O O ⊕O = O Man sieht also : a ⊕ (b ⊕ c) ⊕ = ⊕O = O ⊕O = O ⊕ = O⊕ = O O⊕O = O⊕O = O⊕ = O ( a ⊕ b) ⊕ c = a ⊕ (b ⊕ c) für alle a, b, c ∈ M Das alles Nachzurechnen ist etwas langatmig. Um die Assoziativität von einzusehen, versuchen wir mit etwas weniger Arbeit auszukommen. Behauptung: ( a b) c = a (b c) für alle a, b, c ∈ M Grund: Man sieht a = für alle a ∈ M. 1.Fall: a = : Dann ist ( a b) c = ( b) c = c = und (b c) = . 2.Fall: a = O: Dann ist ( a b) c = b c und a (b c) = bc Behauptung: a (b ⊕ c) = ( a b) ⊕ ( a c) Grund: 1.Fall: a = . Dann sind beide Seiten . 2. Fall: a = O: Dann sind beide Seiten b ⊕ c. Als besonders nützlich wird sich die folgende Eigenschaft erweisen: a ⊕ a = für alle a ∈ M Grund: O ⊕ O = , ⊕ = Folgerung: ( a ⊕ b) ⊕ a = b Grund: ( a ⊕ b) ⊕ a = a ⊕ ( a ⊕ b) = ( a ⊕ a) ⊕ b = ⊕ b = b 1.1.1 Drei Anwendungen Wir betrachten jetzt statt der einzelnen Zeichen und O Zeichenketten gleicher Länge aus diesen Symbolen. Zwei Zeichenketten werden stellenweise mit ⊕ bzw. verknüpft Diese Verknüpfungen bezeichnen wir wieder mit ⊕ und . OO Beispiel: ⊕OO = OO Wie oben gilt auch für Zeichenketten x, y: x ⊕ y = y ⊕ x, ( x ⊕ y) ⊕ z = x ⊕ (y ⊕ z), x ⊕ x = (Die Zeichenkette die nur aus lauter besteht), x ⊕ = x. 1.1.2 One Time Pad Alice möchte Bob eine verschlüsselte Botschaft schicken, die nur Bob entschlüsseln kann. Die Nachricht nennen wir x. Alice generiert einen gleich langen Schlüssel s, den Sie Bob auf sicherem Wege zukommen läßt. Nun berechnet Sie m = x⊕s m kann Sie nun über einen unsicheren Kanal (z.B. das Internet) an Bob verschicken. Bob berechnet nach Erhalt der Nachricht: m⊕s Er erhält m ⊕ s = ( x ⊕ s) ⊕ s = x ⊕ (s ⊕ s) = x ⊕ = x also die unverschlüsselte Nachricht. Beispiel: Alice x = OO, s = OO m = OO Bob m = OO, s = OO m ⊕ s = OO = x Bemerkung: Dieses Verfahren ist das einzig mathematisch beweisbar sichere Verschlüsselungsverfahren. 1.1.3 RAID-5 Wir stellen uns zwei Festplatten gleicher Größe vor, die beide mit Daten bestehend aus Zeichenketten von und O bestehen. Wie können wir uns dagegen absichern, daß eine Festplatte defekt wird und die Daten verloren gehen? Dazu nehmen wir noch eine dritte Festplatte und bezeichnen den Inhalt der ersten beiden Platten mit x und y. Auf der dritten Festplatte speichern wir z = x ⊕ y ab. Fällt jetzt die Platte mit Inhalt x aus, so berechnen wir: y ⊕ z = y ⊕ ( x + y) = y ⊕ (y ⊕ x ) = (y ⊕ y) ⊕ x = ⊕ x = x Damit ist der Platteninhalt x wieder hergestellt. Analog geht man beim Ausfall der Platte mit Inhalt y vor. Fällt z aus, so kann dies einfach wieder als x ⊕ y berechnet werden. 1.1.4 Fehler korrigierende Codes Wir wollen eine Nachricht über einen störungsanfälligen Kanal schicken. Wie kann der Empfänger erkennen, ob eine Nachricht einen Fehler enthält und diesen gegebenenfalls korrigieren? Eine Möglichkeit wäre, die Nachricht drei mal abzuschicken und der Empfänger macht eine Mehrheitsentscheidung. Zum einen verdreifacht das das Datenaufkommen, zum anderen weiß der Empfänger nicht, ob an der gleichen Stelle zweimal ein Fehler aufgetreten ist. Ein clevereres Verfahren ist das folgende. Wir nehmen an, daß wir die Symbole m1 , m2 , m3 , m4 ∈ M übertragen wollen. Weiter nehmen wir an, daß bei dieser Übertragung maximal ein Fehler auftritt. Wir generieren p1 , p2 und p3 so, daß in jedem Kreis gerade viele O stehen: K2 K1 p2 m3 m1 m4 p1 m2 p3 K3 Also: p1 = m1 ⊕ m2 ⊕ m4 p2 = m1 ⊕ m3 ⊕ m4 p3 = m2 ⊕ m3 ⊕ m4 Nun werden m1 , · · · , m4 , p1 , · · · , p3 überragen. Der Emp- fänger ordnet die empfangenen Symbole wieder in die obigen Kreise ein. Nun kann der Empfänger überprüfen, ob die Kreise eine gerade Anzahl von O enthalten. Wir sehen uns nun einmal an, was passiert, wenn bei dieser Übertragung maximal ein Fehler auftritt. Fehler in K1 K2 K3 m1 falsch falsch korrekt m2 falsch korrekt falsch m3 korrekt falsch falsch m4 falsch falsch falsch p1 falsch korrekt korrekt p2 korrekt falsch korrekt p2 korrekt korrekt falsch kein Fehler korrekt korrekt korrekt Damit kann der Empfänger erkennen, ob ein Fehler aufgetreten ist und wenn ja, an welcher Stelle. 1.2 Die Körperaxiome und ihre Folgen “Die ganzen Zahlen hat Gott gemacht, alles übrige ist Menschenwerk”, Leopold Kronecker. Definition: N := {1, 2, 3, . . .} N0 := {0, 1, 2, 3, . . .} Z := {. . . , −3, −2, −1, 0, 1, 2, 3, . . .} Zunächst wollen wir uns überlegen was vernünftige “Zahlen” ausmachen soll. Wir möchten sicherlich, daß wir zwei Operationen unbeschränkt ausführen können: Eine Addition und eine Multiplikation. + A+ : ( a + b) + c = a + (b + c) N+ : a + 0 = a K+ : a + b = b + a I + : zu a gibt es − a, mit: a + (− a) = 0 Des weiteren haben wir D : a · (b + c) = a · b + a · c NT : 1 6= 0 · A· : a · (b · c) = ( a · b) · c N· : a · 1 = a K· : a · b = b · a I · : zu a 6= 0 gibt es a−1 , a · a −1 = 1 Distributivität Nichttrivialität Bemerkung: Wir sind es gewohnt, Formeln von links nach rechts zu lesen. Deshalb lesen wir a + b + c als ( a + b) + c . Die Kommuta- tivität der Addition liefert dann: a + b + c = b + c + a = ( b + c ) + a = a + ( b + c ). Es sieht so aus, als benötige man die Assoziativität gar nicht. Beachten Sie aber bitte, daß wir a + b + c noch gar nicht definiert haben. Tun wir das zum Beispiel durch a + b + c := ( a + b) + c, so liefert uns die Kommutativität lediglich a + b + c = ( b + a ) + c = c + ( b + a ) = c + ( a + b ), aber nicht a + b + c = a + ( b + c ). Beispiele: 1) Die Menge F2 = {0, 1} o n p 2) Q = q | p ∈ Z und q ∈ N mit der Multiplikation r s p ·r q·s p q r s p · s +r · q q·s p q · = und der Addition + = (Genaueres dazu weiter unten). Nichtbeispiele: 1) N0 (mit der gewöhnlichen Addition und Multiplikation) da es im allgemeinen keine additiven Inversen gibt. 2) Z (mit der gewöhnlichen Addition und Multiplikation) da es im allgemeinen keine multiplikativen Inversen gibt. 1.2.1 Erste Folgerungen aus den Körperaxiomen F1) Neutralelemente sind eindeutig bestimmt denn: Seien 00 und 10 weitere Neutralelemente (NE). Dann ist 0 + 00 = 00 , da 0 Neutralelement ist, und 0 + 00 = 0 ,da 00 Neutralelement ist. Also ist 0 = 0 + 00 = 00 . Analog sieht man, daß multiplikative Neutralelemente eindeutig sind. F2) a + 0 · a = a Grund: N· N· N+ D a + 0 · a = 1 · a + 0 · a = (1 + 0) · a = 1 · a = a F3) a · 0 = 0 Grund: I+ F2) K+ I+ 0 = a + (− a) = ( a + 0 · a) + (− a) = a + (− a) + 0 · a = 0 + F4) Ist a · b = 0, so ist a = 0 oder b = 0 (oder beide). denn: Ist a 6= 0 und b 6= 0 , dann gibt es a−1 und b−1 , mit F3) (b−1 · a−1 ) · ( a · b) = (b−1 · a−1 ) · 0 = 0. Aber auch: A· I· N· I· ( b −1 · a −1 ) · ( a · b ) = b −1 · ( a −1 · a ) · b = b −1 · 1 · b = b −1 · b = Also wäre 1 = 0. F5) Inverse sind eindeutig und es gilt:−(− a) = a und ( a−1 )−1 = a für a 6= 0. Grund: a + (− a) = 0 , also ist a additives Inverses zu (− a), daher a Den zweiten Teil sieht man analog. F6) (−1) · a = − a Grund: N· D I+ F3) a + (−1) · a = 1 · a + (−1) · a = (1 + (−1)) · a = 0 · a = 0 also mit F5 die Behauptung. F7) (−1) · (−1) = 1 Grund: (−1) · (−1) + (−1) = (−1) · (−1) + 1 · (−1) = ((−1) + 1) · ( Damit ist (−1) · (−1) das additive Inverse von (−1), also (−1) · (−1) = −(−1) = 1 (nach F5). F8) (− a) · (− a) = a · a =: a2 Grund: (− a) · (− a) = (−1) · a · (−1) · a = (−1) · (−1) · a · a = 1 · a · a F9) −( a + b) = (− a) + (−b) und ( a · b)−1 = a−1 · b−1 Grund: (− a) + (−b) + a + b = (− a) + a + (−b) + b = 0 + 0 = 0 und a −1 · b −1 · a · b = a −1 · a · b −1 · b = 1 · 1 = 1 Einschub: Warum gibt es kein multiplikatives Inverses v Wir hätten: 0 · 0−1 = 1 nach Definition des multiplikativen Inversen und 0−1 · 0 = 0 nach F3. Definition: a − b := a + (−b) a = a · b−1 falls, b 6= 0 b 1.2.2 Die binomischen Formeln D D B1) ( a + b)2 = ( a + b) · ( a + b) = a · ( a + b) + b · ( a + b) = K+ a2 + a · b + b · a + b2 = a2 + 2 · a · b + b2 B1 B2) ( a − b)2 = ( a + (−b))2 = a2 + 2 · a · (−b) + (−b)2 = a2 + 2 · a · (−1) · b + b2 = a2 − 2 · a · b + b2 B3) ( a − b) · ( a + b) = ( a + (−b)) · ( a + b) = a · ( a + b) + (−b) · ( a + b) = a2 + a · b + (−1) · b · a + (−1) · b2 = a2 − b2 1.2.3 Die Regeln der Bruchrechnung Im folgenden seien alle auftretenden Nenner 6= 0. Br1) ba = Grund: a b · d d , speziell: d d =1 a d De f . a · = ( a · b −1 ) · ( d · d −1 ) = a · b −1 · 1 = a · b −1 = b d b Br2) ba · dc = Grund: a·c b·d a c De f . a·c · = ( a · b −1 ) · ( c · d −1 ) = ( a · c ) · ( b · d ) −1 = b d b·d Br3) ac + Grund: b c = a+b c a+b a b D + = ( a · c −1 ) + ( b · c −1 ) = ( a + b ) · c −1 = c c c Br4) ac + Grund: b d = a·d+b·c c·d a b Br1 a d b c Br2 a · d b · c Br3 a · d + b · c + = · + · = + = c d c d d c c·d c·d c·d Br5) a b c d = a·d b·c Grund: a b c d = a c −1 = ( a · b −1 ) · ( c · d −1 ) −1 = a · b −1 · c −1 · d = ( · b d 1.2.4 Umformungen von Gleichungen Klar ist: Gilt a = b, so auch a + c = b + c Ist umgekehrt: a + c = b + c, so können wir auf beiden Seiten (−c) addieren und erhalten: a + c + (−c) = b + c + (−c), also a = b. Für die Multiplikation gilt klarerweise: Ist a = b, so auch a · c = b · c. Ist umgekehrt a · c = b · c, so ist a · c · c−1 = b · c · c−1 und mithin a = b, falls c−1 existiert, falls also c 6= 0 ist. 1.2.5 Potenzen in Körpern Definition: Potenzen Sei n eine natürliche Zahl. Wir definieren für n ∈ N : an := |a · .{z . . · }a, a0 = 1 und für a 6= 0, a−n := ( a−1 )n n−mal 00 lassen wir undefiniert. Aus der Definition sieht man sofort die Potenzrechenregeln für n, m ∈ Z: an · am = an+m und ( an )m = an·m Satz (endliche geometrische Reihe): x n − 1 = ( x − 1 ) · (1 + x + . . . + x n −1 ) = ( x − 1 ) n −1 ∑ xk k =0 Grund: Die rechte Seite ergibt ausmultipliziert x n −1 n −1 n −1 k =0 k =0 k =0 ∑ x k − ∑ x k = ∑ x k +1 − x k = x n − 1 Folgerung: x n − yn = ( x − y) n −1 ∑ x k y n − k −1 k =0 Grund: Ist y 6= 0 so folgt mit der endlichen geometrischen Reihe n n −1 k x x x − 1 = y ( − 1 ) y n −1 ∑ = (x x n − yn = yn y y y k =0 1.3 Ordnung muÿ sein 1.3.1 Angeordnete Körper Wir nehmen einmal an, daß es in einem Körper Elemente gibt, die wir “positiv” nennen. Welche Eigenschaften sollen diese haben? O1) Wenn x und y positiv sind, dann auch x + y und x · y O2) Für jede Zahl x6= 0 ist entweder x positiv oder − x positiv (aber nicht beides) O3) 0 ist nicht positiv Definition: Besitzt ein Körper positive Elemente mit den Eigenschaften O1-O3, so heißt der Körper angeordnet. Definition: x < y bedeutet y − x ist positiv y > x bedeutet x < y x ≤ y bedeutet x < y oder x = y y ≥ x bedeutet x ≤ y Kurzschreibweise: x ≤ y ≤ z heißt x ≤ y und y ≤ z 1.3.2 Folgerungen aus den Anordnungsaxiomen OF1) Für beliebige “Zahlen” a, b gilt: Genau eine der folgenden drei Dinge gilt: a < b, b < a, a = b Grund: Sei x := b − a. Nach O2 gilt genau eines der drei folgenden: x > 0, x < 0, x = 0. Das entspricht der Behauptung. OF2) Wenn a < b und b < c, dann a < c Grund: a < b bedeutet b − a > 0 und b < c bedeutet c − b > 0. Also ist (b − a) + (c − b) > 0. Und damit c − a > 0 also a < c. OF3) Wenn a < b, dann a + c < b + c Grund: Sei x := a + c, y := b + c. Dann ist y − x = b − a > 0, also y > x. OF4) Wenn a < b und c > 0, dann ist a · c < b · c Grund: a < b bedeutet b − a > 0. Dann ist für c > 0 : c · (b − a) = c · b − c · a > 0 OF5) Wenn a 6= 0, dann ist a2 > 0 Grund: Ist a > 0, so ist a2 > 0. Ist a < 0, dann ist (− a) > 0 also (− a) · (− a) = (−1) · (−1) · a · a = a2 > 0. OF6) 1 > 0 Grund: Voriger Satz mit a = 1 OF7) Wenn a < b und c < 0, dann a · c > b · c Grund: a < b bedeutet b − a > 0 und c < 0 bedeutet (−c) > 0. Also ist (−c) · (b − a) > 0. Somit a · c − b · c > 0. OF8) Wenn a < b, dann − a > −b. Speziell: Wenn a < 0, dann (− a) > 0 Grund: Folgt aus vorigem Satz durch c = −1 OF9) Ist a · b > 0, dann sind entweder a und b beide positiv oder a und b beide negativ. Grund: Sei z.B a > 0 und b < 0. Dann wäre a · (−b) = −a · b > 0 OF10) Wenn a < c und b < d, dann a + b < c + d Grund: Mit c − a > 0 und d − b > 0 ist c − a + d − b = (c + d) − ( a + b) > 0 OF11) Wichtige Tatsache : Es ist a2 ≥ 0 für alle a. Ist a2 + b2 = 0, so gilt a = b = 0. Grund: Für a 6= 0 ist a2 > 0 und 02 = 0, also a2 ≥ 0. Daher ist a2 + b2 ≥ 0 für alle a, b. Ist nun a 6= 0 oder b 6= 0, so ist a2 + b2 > 0. OF12) Es gibt, in einem angeordneten Körper, keine Zahl i mit i2 = −1 denn i2 + 12 = 0 OF13) Ist 0 < a < b, so gilt 0 < an < bn und umgekehrt. Grund: Es ist bn − an = (b − a)(bn−1 + bn−2 a + . . . + ban−2 + an−1 ). Da die Ausdrücke der zweiten Klammer alle positiv sind, ist das Vorzeichen der rechten Seite identisch mit dem Vorzeichen von b − a > 0, also bn − an > 0. an > 0 ist wegen a > 0 klar. Die Umkehrung folgt ebenso aus der Tatsache, daß die beiden Seiten der obigen Gleichung dasselbe Vorzeichen haben. Bemerkung: OF11 sichert, daß 1 + 1 6= 0, 1 + 1 + 1 6= 0 usw. Damit ist aber auch −1 − 1 6= 0, −1 − 1 − 1 6= 0 usw. Damit liegen die ganzen Zahlen Z in jedem angeordneten Körper. Weiter sieht man daß damit die rationalen Zahlen p q mit p ∈ Z und q ∈ N in jedem angeordneten Körper liegen. Für F2 ist das offenbar falsch, denn 1 + 1 = 0. p Beispiel: Der Körper Q = { q | p ∈ Z und q ∈ N} ist ein angeordneter Körper. Es gilt: p >0 ⇔ p>0 q und damit p r p r p·s−r·q > ⇔ − >0 ⇔ > 0 ⇔ p·s−r·q > 0 q s q s q·s Definition (Intervalle):i) Für einen angeordneten Körper mit Elementen a ≤ b definieren wir: ( a, b) := { x | a < x < b} [ a, ∞) := { x | a ≤ x } ( a, b] := { x | a < x ≤ b} ( a, ∞) := { x | a < x } [ a, b) := { x | a ≤ x < b} (−∞, b] := { x | x ≤ b} [ a, b] := { x | a ≤ x ≤ b} (−∞, b) := { x | a < x } dabei heißt ( a, b) offenes Intervall und [ a, b] abgeschlossenes Intervall. Die anderen beiden Intervalltypen heißen halboffen. Übungen: 1) Die Summe zweier negativer Zahlen ist Negativ 2) Wenn a > 0 , dann 1 a > 0; wenn a < 0, dann b −1 1 a <0 a −1 3) Wenn 0 < a < b, dann 0 < < 4) Wenn a ≤ b und b ≤ c, dann a ≤ c 5) Wenn a ≤ b und b ≤ c und a = c, dann b = c 1.3.3 Die Betragsfunktion In einem angeordneten Körper können wir den Betrag eines Elementes wie folgt definieren: falls x positiv ist x | x | := 0 falls x = 0 − x falls x negativ ist Kürzer geht das durch (s.u.) | x | := √ x2 Definition: Der Abstand zweier Zahlen x, y ist | x − y|. Satz: | x · y| = | x | · |y| Grund Wenn x und y gleiches Vorzeichen haben, ist x · y positiv, also | x · y| = x · y. Wenn beide negativ sind ist | x | · |y| = (− x ) · (−y) = x · y = | x · y|. Sind beide positiv, so gilt: | x | · |y| = x · y = | x · y|. Ist x negativ und y positiv, so gilt: | x | · |y| = x · (−y) = − x · y = | x · y| , da dann das Produkt negativ ist. Analog geht der letzte verbliebene Fall. Satz (Dreiecksungleichung): | x + y| ≤ | x | + |y| Grund: Für x gilt x ≤ | x | und für y gilt y ≤ |y|. Also folgt x + y ≤ | x | + |y|. Außerdem gilt − x ≤ | x | und −y ≤ |y| und somit − x + (−y) = −( x + y) ≤ | x | + |y|. Insgesamt also die Behauptung. 1.3.4 Das Supremumsaxiom Bei Q handelt es sich zwar um einen angeordneten Kör√ per, er hat aber noch Lücken. Die Zahl 2, als die Länge der Diagonale eines Quadrates mit Seitenlänge 1 ist keine rationale Zahl. √ p Grund: Wir nehmen an: 2 = q mit teilerfremden p und √ q. Dann folgt q 2 = p und nach Quadrieren: 2q2 = p2 . Dann ist aber die rechte Seite ein Quadrat. Dann muß aber p durch 2 teilbar sein, also p = 2k, für ein k ∈ N. Dann ist aber 2q2 = 4k2 mithin q2 = 2k2 . Mit dem gleichen Argument wie oben ist dann aber auch q eine gerade Zahl und p und q haben den gemeinsamen Teiler 2. Definition: Sei S eine Menge von Zahlen eines angeordneten Körpers. Eine Zahl s heißt obere Schranke vom S, falls für ALLE Zahlen a in S gilt a ≤ s. Gibt es eine obere Schranke für S, so heißt S nach oben beschränkt. Definition Supremum: Eine Zahl s0 ist kleinste obere Schra ke (Supremum) einer Menge S 6= ∅, wenn gilt: i) s0 ist obere Schranke für S ii) Keine Zahl kleiner als s0 ist obere Schranke für S. Bemerkung: i) Wenn Sie sich einen Pegelstandsanzeiger am Rhein ansehen, sehen Sie lauter obere Schranken für den tatsächlichen Pegelstand. Dieser tatsächliche Pegelstand ist das Supremum dieser. ii) Analog zum Supremum ist das Infimum die größte untere Schranke einer nicht leeren, nach unten beschränkten Menge. Die Eigenschaften von Suprema gelten sinngemäß auch für Infima. Satz: Suprema und Infima sind eindeutig. Grund: Wir nehmen an, daß s0 und s1 beide Suprema der nach oben beschränkten Menge S sind. Weil s0 kleinste obere Schranke ist, gilt s0 ≤ s1 . Da s1 kleinste obere Schranke ist, gilt: s1 ≤ s0 . Also insgesamt s0 = s1 Bemerkung: Wir betrachten in einem angeordneten Kör- per für ein Element a die Mengen S0 := { x | x ≤ a} und S1 := { x | x < a} Offenbar sind beide Mengen nicht leer, da z.B. x − 1 in beiden liegt. Die beiden Mengen sind verschieden (a ∈ S0 und a ∈ / S1 ) haben aber das gleiche Supremum a. Im ersten Falle nennt man das Supremum auch Maximum. Lemma: Ist sup A = s, so gibt es zu jedem m ∈ N ein x ∈ A, mit s − m1 < x ≤ s. Grund: Es ist A = A\(s − m1 , s] ∪ (s − m1 , s] ∩ A . Jedes Element x der ersten Menge erfüllt also x ≤ s − m1 . Wäre die zweite Menge leer, so wäre s − m1 eine kleinere obere Schranke von A. .Definition: Ein angeordneter Körper erfüllt das Supremumsaxiom, wenn jede nach oben beschränkte, nicht leere Teilmenge ein Supremum hat. Satz: Die reellen Zahlen R sind ein angeordneter Körper der das Supremunsaxiom erfüllt. Bemerkung: Die reellen Zahlen sind sogar, in einem vernünftigen Sinne, der einzige angeordnete Körper mit Supremumsaxiom. 1.3.5 Archimedizität In diesem Abschnitt sei K ein angeordneter Körper, der das Supremumsaxiom erfüllt. Satz: Die Menge der natürlichen Zahlen 1, 1 + 1, 1 + 1 + 1, . . .ist in K nach oben unbeschränkt. D.h. , daß es zu jedem x ∈ K ein n ∈ N gibt, mit x < n. Grund: Wäre N beschränkt, so gäbe es nach dem Supremumsaxiom s = sup N. Nun ist s − 1 < s keine obere Schranke für N. Also gibt es ein n ∈ N, mit n > s − 1. Also ist n + 1 > s im Widerspruch dazu, daß s obere Schranke vom N ist. Folgerung: Ist x ∈ K und x > 0, dann existiert ein n ∈ N, mit n1 < x. Grund: Nach vorangehendem Satz gibt es ein n ∈ N, mit 1 1 x < n, also x > n Folgerung: Ist 0 ≤ x < 1 n für alle n ∈ N, so ist x = 0. 1.3.6 Wurzeln Sei K ein angeordneter Körper, der das Supremumsaxiom erfüllt. Satz: Sei a > 0. Dann gibt es zu jedem n ∈ N genau ein positives Element b, mit bn = a. Grund: Ist 0 < y < z, so gilt 0 < yn < zn . Zwei verschiedene positive Zahlen können also potenziert mit n nicht gleich werden. Dies zeigt die Eindeutigkeit. (*) Existenz: Sei zunächst a > 1. Wir betrachten die Menge S = { x > 0| x n ≤ a}. Zunächst gilt 1n = 1 < a, also 1 ∈ S und somit ist S nicht leer. Weiter gilt für x ∈ S: x n < a < an und somit an − x n > 0. Damit ist nach OF13) x < a. Die Menge S ist also durch a beschränkt. Nach dem Supremumsaxiom gibt es also s = sup S in K. Wegen 1 ∈ S ist s ≥ 1. Wegen s − m1 < s < s + m1 für alle m ∈ N mit m ≥ 2 gilt: 1 n 1 n s− < sn < s + m m Wegen der Supremumseigenschaft vom s und wegen s − 1 1 m < s gibt es ein b ∈ S mit s − m < b. Dann gilt aber 1 n s− < bn ≤ a m n Da s + m1 > s, ist s + m1 ∈ / also s + m1 > a. Insgesamt gilt also: 1 n 1 n n s− < b ≤ a < s+ m m Daher ist |b − a| < = 2 m 1 s+ m n 1 s+ m k n n −1 ∑ k =0 1 − s− m 1 s− m n n − k −1 ! Wegen 0 < s − kleiner als 1 m < s+ 1 m < s + 1 ist dieser Ausdruck 1 2n(s + 1)n−1 m wird also beliebig klein. Daher gilt bn = a. Ist nun a < 1, so gibt es ein b, mit bn = 1a . Dann ist n 1 = a. b 1 √ 1 n Definition: a n = n a = b, a m = ( an ) m . 1 bn = 1.4 Aussagenlogik und Mengenlehre 1.4.1 Mengenlehre Definition (Georg Cantor): Unter einer Menge verstehen wir jede Zusammenfassung M von bestimmten wohl unterschiedenen Objekten (m) unserer Anschauung oder unseres Denkens (welche die Elemente von M genannt werden) zu einem Ganzen. Notation: Wir beschreiben eine Menge durch Auflistung in geschweiften Klammern, wenn das Bildungsgesetz klar ist. Wir schreiben x ∈ M falls x ein Element der Menge ist, andernfalls x ∈ / M. ∅ die lee N = {1, 2, 3, . . .} die Menge aller natü N0 = {0, 1, 2, 3. . . .} die Menge der natü Beispiel: Z = {0, ±1, ±2, ±3, . . .} die Menge de A die Menge Definition: Zwei Mengen sind gleich, wenn sie dieselben Objekte/Elemente enthalten. Bemerkung: In einer Menge treten Elemente nicht mehrfach auf und die Reihenfolge ist gleichgültig. Also gilt z.B. {1, 2, 3} = {1, 2, 2, 3} = {3, 1, 1, 2}, aber {1} 6= {{1}}. Definition: 1) Eine Aussage ist ein sprachliches Konstrukt, welchem eindeutig entweder der Wahrheitswert “wahr” oder der Wahrheitswert “falsch” zugeordnet werden kann. 2) Eine Aussageform ist ein sprachliches Konstrukt mit Variable(n), aus dem nach Einsetzen in die Variable(n) (in jedes Vorkommen der Variablen gleichen Namens mit dem gleichen Wert) aus einer Grundmenge U (dem “Universum”) eine Aussage wird. Somit haben wir eine weitere Möglichkeit Teilmengen von U zu beschreiben, nämlich diejenigen Elemente von U für die eine Aussageform wahr ist: { x ∈ U | A( x )} gelesen als: “Die Menge aller Elemente in U , für die A( x ) wahr ist”. U = N, 1 = 2 U = Z, 1 < 3 wie geht es? Beispiel: U = N, x ist eine gerade Zahl x ist grün falsc wah kein Au keine Aussagef Bemerkung: Nun gibt es Elemente des Universums, für die eine Aussageform A( x ) wahr und Elemente für die A( x ) falsch ist. Zeichnerisch stellen wir die Situation wie folgt dar. Unser Universum U zeichnen wir als weißes Rechteck ein. Die Elemente von U , für die A( x ) wahr ist, werden eingefärbt und meist durch das Innere eines Kreises symbolisiert: M U Für eine Aussage(form) A( x ) bezeichnen wir die gegenteilige Aussage mit ¬ A( x ) (nicht A( x )). ¬ A( x ) ist also genau dann wahr, wenn A( x ) falsch ist und falsch, wenn A( x ) wahr ist. Entsprechungen von Mengenlehre und Aussagenlogik Mengenlehre A M U Die Allmenge U Menge die leere Menge U Das Komplement Mc M ∅ M Haben wir nun zwei Aussageformen A( x ) und B( x ) , so können wir diese zu einer neuen Aussageform verknüpfen: A( x ) ∧ B( x ) (A( x ) und B( x )) ist genau dann wahr, wenn A( x ) und B( x ) beide wahr sind. A( x ) ∨ B( x ) (A( x ) oder B( x )) ist genau falsch, wenn A( x ) und B( x ) beide falsch sind. A( x ) w w f f B( x ) w f w f A( x ) ∧ B( x ) w f f f A( x ) ∨ B( x ) w w w f ¬ A( x ) f f w w Zeichnerisch sieht das wie folgt aus: Die linke Menge sei M = { x ∈ U | A( x )} und die rechte Menge N = { x ∈ U | B( x )}. Mengenlehre Aussagenlogik M N U M∩N A( x ) ∧ B( x ) U M∪N A( x ) ∨ B( x ) M N Ist M = N , so stimmen die Wahrheitswerte von A( x ) und B( x ) in jedem x ∈ U überein, die beiden Aussageformen A( x ) und B( x ) heißen dann äquivalent und wir schreiben: A( x ) ⇔ B( x ) in U Wie können die beiden Mengen M und N nun verschieden sein? Es gibt vier verschiedene Fälle: M N N M UN⊂M M N M U M ∩ N 6= ∅ In den ersten beiden Fällen schreiben wir auch: B( x ) ⇒ A( x ) in U (oben links) (Der Wahrheitsbereich von B( x ) liegt komplett im Wahrheitsbereich von A( x ), { x ∈ U | B( x )} ⊂ { x ∈ U | A( x )}) A( x ) ⇒ B( x ) in U (oben rechts) (Der Wahrheitsbereich von A( x ) liegt komplett im Wahrheitsbereich von B( x ),{ x ∈ U | A( x )} ⊂ { x ∈ U | B( x )}) Wenn aus dem Kontext klar ist, welches Universum U gemeint ist, läßt man das “in U ” auch wegfallen. Beispiel: N M U Im Bild ist das Komplement von N grau eingezeichnet. Liegt nun M komplett in N ( M ⊂ N ) , so ist das Komplement von M “größer” als das Komplement von N. Es gilt also N c ⊂ Mc oder anders gesagt: ¬ B( x ) ⇒ ¬ A( x ) Umgekehrt gilt das natürlich auch. Also haben wir: [ A( x ) ⇒ B( x )] ⇔ [¬ B( x ) ⇒ ¬ A( x )] 1.4.2 Quantoren Sei M ⊂ U . Wenn wir ausdrücken wollen, daß eine Aussageform A( x ) wahr ist für (ausnahmslos) alle Elemente von M wahr ist, so schreiben wir: ∀ x ∈ M : A( x ) Die Verneinung hiervon ist die Tatsache, daß es (mindestens) ein x ∈ M gibt, so daß A( x ) falsch ist: ∃ x ∈ M : ¬ A( x ) Beispiel: Statt A( x ) ⇒ B( x ) in U können wir auch schreiben: ∀ x ∈ U : A( x ) → B( x ) Dabei ist A( x ) → B( x ) durch die folgende Wahrheitstabelle gegeben: A( x ) B( x ) A( x ) → B( x ) w w w w f f f f w f f w Das kann man nun wie folgt einsehen: A( x ) ⇒ B( x ) in U ist falsch, wenn es ein a gibt, so daß A( a) wahr und B( a) falsch ist: ∃ a : A( a) ∧ ¬ B( a) Die Verneinung hiervon ist: ∀ a : ¬( A( a) ∧ ¬ B( a)) Wenn man sich die Wahrheitstabelle ansieht, erkennt man, warum man → so definiert: A( a) B( a) A( a) ∧ ¬ B( a) ¬( A( a) ∧ ¬ B( a)) w w f w w f w f f w f w f f f w Funktionen Definition: Eine Funktion f ordnet jedem Element des Definitionsbereiches D genau ein Element des Wertebereiches W zu, dabei sind Definitions- und Wertebereiche Mengen (hier meist Teilmengen von R). Schreibweise: f :D→W x 7→ f ( x ) Definition: Für eine Funktion f mit Definitionsbereich D und Wertebereich W heißt: Bild( f ) := {w ∈ W | ∃ x ∈ D : f ( x ) = D } ⊂ W Graph( f ) := {( x, y) | y = f ( x )} Für eine Teilmenge U ⊂ U heißt f −1 (U ) : = { x ∈ D | ∃ y ∈ W : f ( x ) = y } Das Urbild von U unter f . Für jede Teilmenge V ⊂ D heißt die Abbildung f : V → W die Einschränkung von f auf V, f | D . Definition: Zwei Funktionen f 1 : D1 → W1 und f 2 : D2 → W2 sind gleich, wenn D1 = D2 und W1 = W2 und für alle x ∈ D1 gilt: f 1 ( x ) = f 2 ( x ). Definition: Sei f : D → W eine Funktion. Dann gilt: f ist injektiv :⇔ ∀ x1 , x2 ∈ D : f ( x1 ) = f ( x2 ) ⇒ x1 = x2 f ist surjektiv :⇔ ∀y ∈ W ∃ x ∈ D : y = f ( x ) f ist bijektiv :⇔ f ist surjektiv und injektiv Beispiel: Die Funktion f : R6=0 → R6=0 , x 7→ 1 x ist bijektiv, 1) injektiv: Ist f ( x1 ) = f ( x2 ), so ist x1 = x12 . Eindeutigkeit 1 der multiplikativen Inversen liefert: x1 = x2 2) surjektiv: Zu jedem a ∈ R6=0 gibt es das multiplikative Inverse a−1 = 1a . Dann ist f ( a−1 ) = a−1 1 = ( a−1 )−1 = a. Bemerkung: Ist f : D → W injektiv, so ist f : D → Bild( f ) bijektiv. Bijektive Abbildungen besitzen eine Umkehrabbildung f −1 : W → D, f −1 (y) = x :⇔ y = f ( x ) Definition: Ist K ein angeordneter Körper und D ⊂ K, so ist f : D → K (streng) monoton steigend/fallend, wenn für alle x1 , x2 ∈ D mit x1 < x2 gilt: f ( x1 ) ≤ (<) f ( x2 ) bzw. f ( x ) ≥ (>) f ( x2 ). (Siehe Anhang A). 1.5 Funktionen und Flächen 1.5.1 Flächen Definition: Die Ebene R2 ist definiert als Menge aller geordneten Paare von reellen Zahlen: R2 = {( x1 , x2 )| x1 , x2 ∈ R} Der erste Eintrag heißt dann auch x −Koordinate und der zweite y−Koordinate. Für zwei Punkte ( x1 , y1 ), ( x2 , y2 ) ∈ R2 ist der Abstand definiert als: q d(( x1 , y1 ), ( x2 , y2 )) := ( x2 − x1 )2 + (y2 − y1 )2 Definition: Ein Kreis mit Mittelpunkt a = ( x0 , y0 ) ∈ R2 und Radius r ∈ R ist die Menge: Ka,r := {( x, y) ∈ R2 |( x − x0 )2 + (y − y0 )2 = r2 } Analog ist die Kreisscheibe Ba,r := {( x, y) ∈ R2 |( x − x0 )2 + (y − y0 )2 ≤ r2 } (B für Ball). Speziell ist der Einheitskreis die Menge {( x, y) ∈ R2 | x2 + y2 = 12 = 1} dito Einheitskreisscheibe. Die Flächenaxiome: Sei D ⊂ R2 und D ⊂ Ba,r für einen Ball Ba,r (dies stellt sicher, daß D begrenzt ist). D wird eine nicht negative reelle Zahl zugeordnet, die Fläche. Es gelten die folgenden Axiome: i) Kongruenzen (Drehungen, Spiegelungen, Verschiebungen) ändern die Fläche von D nicht. ii) Wird D in endlich viele, nicht überlappende Bereiche aufgeteilt, so ist die Fläche von D die Summe der Teilflächen. iii) Ist E ⊂ D, so ist die Fläche von E höchstens so groß wie die von D. iii) Ein Quadrat der Seitenlänge 1 hat die Fläche 1. Definition (Flächeninhalt) Sei D ⊂ R2 und es existiere Ba,r mit D ⊂ Ba,r (d.h., daß D beschränkt ist). Es sei M := {∆ ⊂ R2 | ∆ ist nichtüberlappend aus Drei- und Rech Die Elemente von M haben also eine Fläche, die die Summe der Flächen der Dreiecke/Rechtecke sind, aus denen sie sich zusammensetzen. Wir betrachten U = {Fläche von M | ∆ ⊂ D } und O := {Fläche von ∆ ∈ M | D ⊂ ∆}. Existieren sup U und inf U und gilt sup U = inf O, dann ist dieser Wert der Flächeninhalt von D. Beispiel: Der Einheitskreis liegt komplett im Quadrat mit den 4 Eckpunkten (±1, ±1), welches den Flächeninhalt 4 hat. Wählt man nun beliebig viele Punkte auf dem Einheitsheitskreis und bildet aus zwei benachbarten Punkten und dem Mittelpunkt Dreiecke, so ist die Summe dieser Dreiecksflächen sicher kleiner als die Fläche des Einheitskreises. Das Supremum all dieser ist die Fläche des Einheitskreises und heißt π (und ist gleich dem Infimum aller Flächen, in denen der Kreis enthalten ist). Definition: Zu einem auf dem Einheitskreis gegebenen Punkt betrachten wir das Kreissegment, das von der Verbindungslinie von Punkt und Mittelpunkt und der positiven x − Achse gebildet wird. Das Zweifache von dessen Fläche ist der Winkel des Punktes. Insbesondere ist also der Vollwinkel 2π. 1.5.2 Trigonometrische Funktionen Definition Für den Punkt ( x, y) auf dem Einheitskreis mit Winkel φ ∈ [0, 2π ) ist: cos(φ) := x sin(φ) := y Diese seien 2π −periodisch fortgesetzt durch sin(φ + 2π ) = sin(φ) und cos(φ + 2π ) = cos(φ). Folgerungen: −1 ≤ cos( x ), sin( x ) ≤ 1 cos(φ)2 + sin(φ)2 = 1 sin(φ) = q 1 − cos(φ)2 für alle φ mit sin(φ) ≥ 0 sin(−φ) = − sin(φ) cos(−φ) = cos(φ) 0 π 2 π 4 π cos 1 0 √ 2 −1 sin 0 √1 2 0 Der Sinus ist auf [− π2 , π2 ] streng monoton steigend. Die Umkehrfunktion heißt arcsin:[−1, 1] → [− π2 , π2 ] Analog: arccos:[−1, 1] → [0, π ] Satz (Additionstheoreme): cos(α + β) = cos(α) · cos( β) − sin(α) · sin( β) sin(α + β) = sin( β) · cos(α) + sin(α) · cos( β) Grund: Wird bei den komplexen Zahlen gegeben. Folgerungen: π π π cos + x = cos sin( x ) − sin sin( x ) = − sin( x 2 2 2 sin π π π + x = cos sin( x ) + sin cos( x ) = cos( x ) 2 2 2 1.5.3 Eigenschaften von Funktionen Häufig sind Funktionen durch eine Abbildungsvorschrift definiert: f : R → R, x → x2 + 5. Es gibt aber auch andere Möglichkeiten eine Funktion zu beschreiben, z.B. durch Flächen. Dazu das folgende Beispiel: Sei f : R → R, f ( x ) = mx. F ( a) sei die Fläche unter zwischen der Geraden f ( x ) und der x −Achse und den Geraden x = a und x = 0. Also F ( a) = 21 ma2 . f (x) = m · x 1 ma2 2 a Beachten Sie: Für x < y gilt 2x < x + y < 2y und daher 2x (y − x ) < (y + x )(y − x ) < 2y(y − x ). Wir haben insgesamt: (y − x ) x < 1 2 1 2 y − x < (y − x )y 2 2 Ist also f ( x ) = x und F ( x ) = x2 , so gilt: (y − x ) f ( x ) < F (y) − F ( x ) < (y − x ) f (y) Klappt das auch bei krummlinig begrenzten Flächen? Beispiel: Es sei f ( x ) := x2 . Für alle 0 < x < y gilt: x2 + x2 + x2 < x2 + xy + y2 < y2 + y2 + y2 Mulitiplikation mit y − x liefert: x2 (y − x ) < 1 3 1 3 y − x < y2 ( x − y ) 3 3 also wieder obige Doppelungleichung, diesmal mit f ( x ) = x2 und F ( x ) = 31 x3 . Satz: Sei f : [ a, b] → R streng monoton und f ( x ) ≥ 0 für alle x ∈ [ a, b]. Dann existiert die Fläche zwischen x = a, x = b und dem Graph von f . Grund: Wir betrachten den Fall monoton steigend. Wir a unterteilen das Intervall wie folgt: Sei ti = a + i b− n . Dann a ist a = t0 < t1 < . . . < tn = b und ti+1 − ti = b− n . Dann liegt der Graph von f auf dem Intervall [ti , ti+1 ] überall oberhalb von f (ti ) und unterhalb von f (ti+1 ). Die Diffea renz dieser Flächen ist (ti+1 − ti )( f (ti+1 ) − f (ti )) = b− n ( f (t f (ti )). Aufsummieren liefert: b−a n n −1 ∑ ( f (ti+1 ) − f (ti )) = i =0 b−a ( f (b) − f ( a)) n Dieser Ausdruck wird für genügend große n beliebig klein und es gilt: n n −1 i =0 i =0 ∑ f (ti )(ti+1 − ti ) ≤ S ≤ I ≤ ∑ f ( t i +1 ) wenn S das Supremum aller meßbaren Flächen unterhalb des Graphen von f ist und I das Infimum aller meßbaren Flächen die die Graphenfläche enthalten. Somit ist die Fläche I = S. Beispiel:i) f : R>0 → R>0 , x 7→ 1x ist streng monoton fallend, denn für x2 > x1 gilt: x12 < x1 . Wie wir schon 1 gesehen hatten ist f ( x ) sogar bijektiv, da jedes x 6= 0 ein multiplikatives Inverses x −1 = 1x hat. Ist f streng monoton fallend, so ist f ( a) − x streng monoton steigend. Die Fläche zwischen dem Graph von f und [ a, b] ist dann (b − a)( f (b) − f ( a)) − F Dabei ist F die Fläche zwischen dem Graphen von f ( a) − x und [ a, b]. Definition: Sei f : [ a, b] → R eine streng monoton steigende Funktion und f ( x ) ≥ 0 für alle x ∈ [ a, b]. Gibt es eine Funktion F : [ a, b] → R, mit F ( a) = 0 und (y − x ) f ( x ) < F (y) − F ( x ) < (y − x ) f (y) für alle x, y ∈ [ a, b] mit x < y, so ist die Funktion F mit dieser Eigenschaft eindeutig bestimmt (siehe Anhang B). Eine solche (eindeutig bestimmte) Funktion nennen wir die Flächenfunktion von f (auf dem Intervall [ a, b]). f (x) (y − x) · f (y) (y − x) · f (x) x y Satz: Eine solche Flächenfunktion existiert und ist eindeutig bestimmt. Weiter ist die Flächenfunktion F : [ a, b] → [0, F (b)] einer nicht negativen, streng monotonen Funktion, streng monoton steigend und bijektiv auf ihr Bild. Grund: Anhang B 1.5.4 Der natürliche Logarithmus Definition: Für eine Zahl a > 1 ist ln( a) definiert als die Fläche zwischen den senkrechten Geraden x = 1 und x = a und der x −Achse und der Kurve y = 1x . Für 0 < a < 1 wird die Fläche negativ gezählt. y 2, 5 2 1 1, 5 0, 5 1 f (x) = 1 x x 1 1, 5 2 2, 5 −0, 5 y f (x) = ln(x) x 1 1, 5 2 2, 5 −1 Eigenschaften: 1) ln( x ) ist streng monoton steigend (als Flächenfunktion). 2) ln(1) = 0 3) 1 1 (y − x ) < ln(y) − ln( x ) < (y − x ) y x für alle y > x ≥ 1. Speziell gilt für x = 1 : 1− 1 < ln(y) < y − 1 y Folgerung: ln(c · x ) = ln(c) + ln( x ) Grund: Wir betrachten die für festes c > 1 die Funktionen L1 ( x ) := ln(c · x ) − ln(c). Dann ist L1 (1) = ln(c) − ln(c) = 0 Dann gilt: L1 (y) − L1 ( x ) = ln(c · y) − ln(c · x ). Es ist aber auch 1 ≤ c · x < c · y für x < y. Wir ersetzen in den obigen Ungleichungen alle x durch c · x und dito y durch c · y und erhalten: 1 (cy − xc) < ln(cy) − ln(cx ) = ln(cy) − ln(c) − ln(cx ) + ln cy also 1 1 ( y − x ) < L1 ( y ) − L1 ( x ) < ( y − x ) y x Es ist auch L1 (1) = ln(c · 1) − ln(c) = 0. Wegen der Eindeutigkeit gilt aber: L1 ( x ) = ln( x ) also ln(cx ) − ln(c) = ln( x ) und damit ln(cx ) = ln(c) + ln( x ). Folgerung: ln yx = ln( x ) − ln(y) für y 6= 0. Speziell: 1 x = − ln( x ). Grund: ln yx + ln(y) = ln yx y = ln( x ), also die Behauptung Folgerung: ln( x ) nimmt beliebig große (und kleine negative) Werte an. ln Grund: Es ist ln 2 > 0 und ln(2n ) = ln(2 · . . . · 2) = ln(2) + . . . + ln(2) = n · ln(2) und ln(2−n ) = −n ln(2) Definition: Die Abbildung ln : R>0 → R ist bijektiv. Ihre Umkehrabbildung exp : R → R>0 ist die Exponentialabbildung. Schreibweise e x := exp( x ). Rechenregeln:i) eln( x) = x für alle x ∈ R>0 und ln(e x ) = x für alle x ∈ R, da exp und ln Umkehrfunktionen voneinander sind. ii) Ist a = ln( x ) (d.h. e a = x ) und b = ln(y) (d.h. eb = y) , so gilt: e a+b = eln( x)+ln(y) = eln( x·y) = x · y = e a · eb Definition: Für a ∈ R>0 und x ∈ R definieren wir: a x := e x ln a Die Potenzregeln: i) a x · ay = a x+y ii) ( a x )y = a xy Grund: i) a x+y = e( x+y) ln a = e x ln a+y ln a = e x ln a ey ln a = a x ay y ii) ( a x )y = e x ln a ey( x ln a) = e( xy) ln a = a xy 1.6 Vektoren, Vektorräume, Abstände: 2D Definition: Die Menge aller (geordneten Paare) reeller Zahlen (oder allgemeiner: Elemente eines beliebigen Körpers), als Spalten geschrieben, bezeichnen wir als Vektoren: a 2 | a, b ∈ R R = b Die Elemente von R bezeichnet man, zur Unterscheidung von Vektoren, auch als Skalare. Vektorvariablen schreiben wir mit einem Pfeil, z.B. ~x. Variable für Skalare sind üblicherweise (aber nicht immer) griechische Buchstaben. Als Paare sind Vektoren genau dann gleich, wenn ihre Komponenten gleich sind: a c = ⇔ a = c∧b = d b d Auf ihnen ist natürlicherweise eine Addition und eine Multiplikation mit Skalaren definiert: a c a+c + := b d b+d λ· a b := λ·a λ·b Die Axiome für einen Vektorraum lauten: Die Vektorraumaxiome Sei V 6= ∅ eine Menge und K ein Körper. Weiter sei + : V × V → V eine innere Veknüpfung von V und · : K × V → V eine äußere Veknüpfung von Elementen aus K ~ und V. V heißt ein Vektorraum über K, wenn für alle ~u, ~v, w V und alle α, β ∈ K gilt: ~ =w ~ + ~v V1) ~v + w ~ ) + ~u = ~v + (~ V2) (~v + w w + ~u) V3) ∃~0 ∈ V : ~0 + ~v = ~v V4) zu ~v ex. −~v mit ~v + (−~v) = ~0 V5) (α + β) · ~v = α · ~v + β · ~v V6) (αβ) · ~v = α( β · ~v) ~ ) = α · ~v + α · w ~ V7) α · (~v + w V8) 1 · ~v = ~v 0 Eigenschaften: ~0 := ist das Neutralelement der 0 0 a a + = Addition: b b 0 kurz: ~0 + ~x = ~x. Die Addition von Vektoren ist kommutativ: ~x + ~y = ~y + ~x a Das additive Inverse eines Vektors ist der Vektor b −a a = (−1) · −b b Die Vektoraddition ist assoziativ: x1 y1 z1 + + = x2 y2 z2 x1 + ( y1 + z1 ) x1 = = + x2 + ( y2 + z2 ) x2 x1 + y1 x2 + y2 y1 + z1 y2 + z2 λ ( x1 + y1 ) λ ( x2 + y2 ) + = z1 z2 x1 x2 Weiter gilt: = x1 x2 + λx1 + λy1 λx2 + λy2 y1 y2 = λ· = λx1 λx2 x1 + y1 x2 + y2 + λy1 λy2 = =λ x1 x2 Übung: Beweisen Sie die restlichen Vektorraumaxiome Bemerkung:1.) Sei ~v 6= ~0. Dann ist {~a + t~v | t ∈ R} = { a − tv | t ~∈ R} die Gerade durch ~a in Richtung ~v. a 2) Jeder Vektor läßt sich eindeutig schreiben als b a 1 0 = a· +b· b 0 1 +λ Die Vektoren ~ e1 und ~ e2 heißen auch die kanonischen (natürlichen) Basisvektoren von R2 . x1 Definition: 1.) Die Länge eines Vektors ~x = ist x2 definiert als: q |~x | := x12 + x22 ∈ R≥0 2.) Der Abstand zweier Vektoren ~x und ~y ist definiert als |~x − ~y| 3.) Ein Vektor ~x mit |~x | = 1 heißt Einheitsvektor ~x = ~0 ⇔ |~x | = 0, |λ~x | = Unmittelbare Ergebnisse: q √ p (λx1 )2 + (λx2 )2 = λ2 ( x12 + x22 ) = λ2 |~x | = |λ||~x |. Für ~x 6= ~0 ist 1 |~x | |~x | =1 ~x |~x | ein Einheitsvektor, denn | |~~xx| | = | |~1x| ~x | = Bemerkung : Für Vektoren ~x und ~y ist Grund: | ~x +~y 2 x − ~x | = | y−~ 2 | = |− ~ ~x −~y 2 | ~x +~y 2 der Mittelpunkt y x +~y = | x−~ y| 2 | = | 2 −~ ~ ~ Bemerkung: Wir betrachten für ~x 6= ~0 den Ausdruck |~y − t · ~x |2 : |~y − t~x |2 = (y1 − tx1 )2 + (y2 − ty2 )2 x y + x y 2 |~x |2 |~y|2 − ( x1 y1 + x2 y2 )2 = |~x |2 · t − 1 1 2 2 2 + |~x | |~x |2 Übung: Nachrechnen Diese Gleichung zeigt uns: 1) Der Ausdruck wird minimal für t0 = 2) Es ist |~x |2 |~y|2 −( x1 y1 + x2 y2 )2 |~x |2 x1 y1 + x2 y2 |~x | ≥ 0, also |~x |2 |~y|2 − ( x1 y1 + x2 y2 )2 = |~x |2 |~y|2 − | x1 y1 + x2 y2 |2 = {|~x ||~y| − | x1 y1 + x2 y2 |} · {|~x ||~y| + | x1 y1 + x2 y2 |} ≥ 0 Daher ist |~x ||~y| − | x1 y1 + x2 y2 | ≥ 0 ⇒ |~x ||~y| ≥ | x1 y1 + x2 y2 | und schließlich: x1 y1 + x2 y2 ≤ | x1 y1 + x2 y2 | ≤ |~x ||~y| Satz:Dreiecksungleichung: |~x + ~y| ≤ |~x | + |~y| Grund: |~x +~y|2 = ( x1 + y1 )2 + ( x2 + y2 )2 = x12 + x22 + y21 + y22 + 2( x1 = |~x |2 + |~y|2 + 2( x1 y1 + x2 y2 ) ≤ |~x |2 + |~y|2 + 2|~x ||~y| = (|~x | + Definition: Für zwei Vektoren ~x = x1 x2 , ~y = y1 y2 ist das Skalarprodukt definiert als: ~x · ~y := x1 y1 + x2 y2 Warnung: Vektoren gilt nicht: = (~x· Für ~x, ~y, ~z ~x· (~y · ~z) 1 1 1 1 1 ~y) ·~z: · · = ·1 = 2 1 0 2 2 1 1 1 1 3 aber · · = 3· = 2 1 0 0 0 Bemerkung: Ist |~x |, |~y| = 1, so gilt (siehe Zeichnung): ~x · ~y = cos φ Insgesamt also: cos φ = ~x · ~y ~x ~y · = ∈ [0, π ] |~x | |~y| |~x | · |~y| und also für |~x | = 1 cos φ|~y| = ~x · ~y oder anders gesagt: Das Skalarprodukt ist die Länge der Projektion von ~y auf ~x, falls ~x ein Einheitsvektor ist. Folgerung:1) Ist einer der beiden am Skalarprodukt beteiligten Vektoren ein Einheitsvektor, so ist das Skalarprodukt die Länge der Projektion auf den Einheitsvektor. 2) ~x ⊥ ~y ⇔ ~x · ~y = 0 Definition: Für a, b, c, d ∈ R ist eine 2 × 2−Matrix ein quadratisches Schema der Form a b c d Eine solche Matrix definiert eine Abbildung R2 → R2 durch a b x ax + by · := c d y cx + dy Die Menge aller2 × 2−Matrizen bezeichnen wir mitM2 (R) a11 a12 b11 b12 Zwei Matrizen und b = sind a21 a22 b21 b22 dann und nur dann gleich, wenn aij = bij gilt. 1 0 Beispiel:i) Die Matrix beschreibt die Spiege0 −1 1 0 x x lung an der x −Achse, denn · = 0 −1 y −y 1 0 ii) Die Matrix beschreibt eine Streckung in y 0 2 1 0 x Richtung um den Faktor 2, denn · = 0 2 y x . 2y cos ϕ − sin ϕ iii) Die Matrix beschreibt eine Dresin ϕ cos ϕ hung um den Winkel ϕ gegen den Uhrzeigersinn um den Urpsrung. cos ϕ − sin ϕ x x cos ϕ − y sin ϕ Grund: = sin ϕ cos ϕ x sin ϕ + y cos ϕ y x Schließt nun der Vektor mit der positiven x −Achse y den Winkel ψ ein, so gilt: cos ψ x =r sin ψ y mit r = cos ϕ sin ϕ p x2 + y2 , ψ ∈ [0, 2π ). Also gilt: − sin ϕ x cos ϕ − sin ϕ r cos = cos ϕ y sin ϕ cos ϕ r sin r (cos ϕ cos ψ − sin ϕ sin ψ) = r (sin ϕ cos ψ + cos ϕ sin ψ) Wegen der Additionstheoreme für Sinus und Kosinus ist das gleich cos( ϕ + ψ) r sin( ϕ + ψ) x also der Vektor, mit derselben Länge wie , der mit y der positiven x −Achse den Winkel ϕ + ψ einschließt. Satz: Seien ~x, ~y ∈ R2 , λ ∈ R, A ∈ M2 (R), so gilt: A(~x + ~y) = A~x + A~y Grund: Sei ~x = A(λ~x ) = λ ( A~x ) x1 y1 a , ~y = , A = x2 y2 c b d , so ist x1 + y1 a ( x1 + y1 ) + b ( x2 A(~x +~y) = = c ( x1 + y1 ) + d ( x2 x2 + y2 ax1 + bx2 ay1 + by2 = + = A~x + A~y cx1 + dx2 cy1 + dy2 a c b d und A(λ~x ) = a c b d λx1 λx2 = λ ( ax1 + bx2 ) λ (cx1 + dx2 ) . Definition (Addition von Matrizen): a b e f a+e + = g h c+g c d b+ f d+h = λ (A oder anders gesagt: Die Addition von Matrizen erfolgt kom ponentenweise. Bemerkung: Einige Eigenschaften der Addition von Ma0 0 trizen sind unmittelbar klar: ist das Neutralele0 0 − a −b ment der Addition, das additive Inverse zu −c −d a b . Für A, B, C ∈ M2 (R) gilt: A + B = B + A und c d A + ( B + C ) = ( A + B) + C Definition (Multiplikation von Matrizen mit Skalaren): λ a c b d := λa λc λb λd Bemerkung: Auch hier sind einige Eigenschaften wieder unmittelbar klar: λ( A + B) = λA + λB, (λ + µ) A = λA + µA, (λµ) A = λ(µA) a b Definition: Für eine 2 × 2−Matrix A = definieren c d wir Spur( A) := a + d det( A) = ad − bc x1 y1 , ~y = ist Bemerkung: Für Vektoren ~x = x2 y2 x1 y1 | det | die Fläche des von ~x und ~y aufgespannx2 y2 ten Parallelogramms. Insbesondere ist die Determinante genau dann 0, wenn ~x und ~y auf einer Geraden liegen. a b Definition: i) Für zwei 2 × 2−Matrizen A = ,B= c d e g f h ist das Matrizenprodukt definiert als e ae + bg f = A · B = A · ,A· g ce + dg h | {z } | {z } 1. Spalte 2. Spalte a f + bh c f + dh ii) Für die Matrix A definieren wir: A−1 := 1 det( A) d − −c a falls det A 6= 0. Bemerkung:i) Das Matrizenprodukt Neu ist assoziativ. 1 0 . Für die Matralelement ist die Matrix E2 = 0 1 trizenoperationen + und · gilt das Distributivgesetz. Für A−1 gilt: A−1 · A = A · A−1 = E2 . ii) Zwei für Körper gültige Dinge gelten für Matrizen nicht: Die Matrizenmultiplikation ist nicht kommutativ: 1 0 1 1 1 1 = 0 2 0 1 0 2 1 0 1 2 = 0 2 0 2 0 0 Nicht jede Matrix A 6= hat ein Inverses bzgl. 0 0 1 0 1 1 der Matrizenmultiplikation: 1 0 a b a · = 0 0 c d 0 b 0 6= 1 0 0 1 , für alle Beispiel: Multiplizieren wir zwei Drehmatrizen miteinander cos(φ) − sin(φ) cos(ψ) sin(−ψ) · sin(φ) cos(φ) sin(ψ) cos(ψ) cos(φ) cos(ψ) − sin(φ) sin(ψ) − (cos(φ) sin(ψ) + sin = sin(φ) cos(ψ) + cos(φ) sin(ψ) − sin(φ) sin(ψ) + co cos(φ + ψ) − sin(φ + ψ) = , sin(φ + ψ) cos(φ + ψ) so erhalten wir die Drehmatrix für den Winkel φ + ψ. Satz: Für Matrizen A und B gilt: det( A · B) = det( A) · det( B), Spur( A · B) = Spur( B · A) Grund: Nachrechnen Folgerung: det( A−1 ) = det1( A) Grund: 1 = det( E2 ) = det( A−1 · A) = det( A−1 ) · det( A) a b Beispiel: Für A = ist c d a−x b det = x2 − Spur( A) x + det( A) c d−x Diesen Ausdruck nennt man auch das charakteristische Polynom von A. 1.7 Polynome I 1.7.1 Denition und Eigenschaften von Polynomen Definition: Ein Polynom über einem Körper K ist eine Ausdruck der Form a0 + a1 x + a2 x 2 + . . . + a n x n = n ∑ ak x k k =0 mit ai ∈ K. Ist an 6= 0 , so heißt n der Grad des Polynoms. Das Nullpolynom hat den Grad −∞. Zwei Polynome sind genau dann gleich, wenn alle ihre Koeffizienten gleich sind (Koeffizientenvergleich). k Definition: Seien f = ∑nk=0 ak x k und g( x ) = ∑m k = 0 bk x Polynome. Dann ist n+m f ( x ) g( x ) := ∑ ck x k , ck = k =0 k ∑ a l bk − l l =0 und ist n = m, so gilt: n f ( x ) + g( x ) := ∑ ( a k + bk ) x k k =0 Ist λ ∈ K, so ist n λ f ( x ) := ∑ λck xk k =0 Bemerkung: Polynome bilden mit der hier definierten Addition und Multiplikation mit Skalaren einen Vektorraum. Neutralelement der Addition ist das Nullpolynom. Die Multiplikation ist assoziativ und kommutativ, für die Addition und die Multiplikation gilt das Distributivgesetz. Oder anders gesagt: Die Polynome erfüllen alle Körperaxiome, bis auf die allgemeine Existenz multiplikativer Inverse. Definition: Es gibt für Polynome noch zwei weitere Operationen: i) Für n ∈ N ist f ( x )n := f ( x ) · . . . · f ( x ) | {z } n-mal ii) Für das Polynom g( x ) = ∑nk=0 bk x k ist n f ( g( x )) := ∑ bk f ( x ) k k =0 Grund: Nachrechnen Folgerung: Grad( f ( x ) · g( x )) = Grad( f ( x )) + Grad( g( x )) Grad( f ( x ) + g( x )) ≤ max{Grad( f ( x )), Grad( g( x ))} Grad( f ( g( x )) = Grad f ( x ) · Gradg( x ) Bemerkung: Zu jedem Polynom f ( x ) gehört eine Polynomfunktion (durch Einsetzen): fˆ : K → K, c 7→ f (c) . Hat der Körper K unendlich viele Elemente, so gilt f ( x ) = g( x ) (als Polynome) ist gleichbedeutend mit: f (c) = g(c) für alle c ∈ K (also Gleichheit als Funktionen). Der Grund findet sich in den Übungen: Sind zwei Polynome an mehr als Grad-vielen Stellen gleich, so sind sie gleich als Polynome. In F2 z.B. ist das falsch: x und x2 sind als Polynome verschieden, aber 0 = 02 und 1 = 12 also als Funktionen gleich. Definition: Ein Polynom g( x ) vom Grad ≥ 1 heißt Teiler/Faktor eines Polynoms f ( x ), wenn es ein Polynom h( x ) gibt, mit f ( x ) = g( x )h( x ) Lemma: i) Ist f ( x ) · g( x ) = 0, so ist f ( x ) = 0 oder g( x ) = 0 ii) (Kürzungsregel) Ist h( x ) · f ( x ) = h( x ) · g( x ) und h( x ) 6= 0, so ist f ( x ) = g( x ) Grund:i) Ist f ( x ), g( x ) 6= 0 dann haben f ( x ) und g( x ) die Grade n, m ∈ N0 . Dann gilt aber Grad( f ( x ) · g( x )) = n + m ≥ 0 > −∞. Also ist f ( x ) · g( x ) nicht das Nullpolynom. Die Kontraposition hiervon ist die Behauptung. ii) Gilt die Voraussetzung, so ist h( x ) · ( f ( x ) − g( x )) = 0. Wegen h( x ) 6= 0 muß also f ( x ) − g( x ) = 0 gelten. Lemma: Für jedes c ∈ K und jedes k ∈ N ist x − c Faktor von x k − ck . Grund: ( x − c ) · ( x k −1 + c · x k −2 + . . . + c k −2 · x + c k −1 ) = x k + c · x k −1 + . . . + c k −2 · x 2 + c k −1 · x − c · x k −1 − c 2 · x k −2 − . . . − c k −1 · x − c k = x k − ck Satz:Sei f ( x ) 6= 0 ein Polynom vom Grad n und c ∈ K. Dann existiert ein eindeutig bestimmtes Polynom q( x ) und k ∈ K, mit grad(q( x )) < n, so daß f ( x ) = ( x − c) · q( x ) + k Grund: 1) Existenz: Sei f ( x ) = am · x m + . . . + a0 . Dann ist f ( x ) − f ( c ) = a m · ( x m − c m ) + . . . + a1 ( x − c ) Nach obigem Lemma ist x − c ein Faktor jedes Summanden der rechten Seite, also auch ein Faktor von f ( x ) − f (c) : f ( x ) − f (c) = ( x − c) · q( x ) für ein Polynom q( x ). Also f ( x ) = ( x − c) · q( x ) + f (c) 2) Eindeutigkeit: Sei f ( x ) = ( x − c) · q1 ( x ) + k1 = ( x − c) · q2 ( x ) + k2 . Dann ist f (c) = k1 = k2 also folgt ( x − c) · q1 ( x ) = ( x − c) · q2 ( x ) und die Division auf beiden Seiten durch x − c liefert die Behauptung. Definition: Eine Zahl c ∈ K ist eine Nullstelle eines Polynoms f ( x ) genau dann, wenn gilt f (c) = 0. Korollar: c ∈ R ist genau dann eine Nullstelle von p( x ), wenn ( x − c) ein Faktor von p( x ) ist. Grund: Ist p(c) = 0, so gilt: p( x ) = ( x − c) · q( x ) + p(c) = ( x − c)q( x ) Ist p( x ) = ( x − c)q( x ), so gilt p(c) = 0. Korollar: 1)Ein Polynom vom Grad n ≥ 1 hat höchstens n Nullstellen 2) Stimmen zwei Polynome vom Grad n an n + 1 (oder mehr) Stellen überein, so sind sie gleich. Grund: 1) Jede Nullstelle kann man als Linearfaktor abspalten. Dabei sinkt der Grad um 1. 2) Für zwei Polynome f ( x ), g( x ) vom Grad n ist f ( x ) − g( x ) ein Polynom vom Grad ≤ n. Satz: Für ein Polynom f ( x ) = ∑nk=0 ak x k und eine Zahl c gibt es eindeutig bestimmte Polynome qi ( x ) vom Grad i, mit n f (x) = ∑ qi (c)(x − c)k k =0 Grund: Ist f ( x ) = ( x − c ) · q1 ( x ) + p ( c ) (Division mit Rest von f ( x ) durch ( x − c)) und ist q1 ( x ) = ( x − c ) · q2 ( x ) + q1 ( c ) (Division mit Rest von q1 ( x ) durch ( x − c)) so gilt: f ( x ) = ( x − c) · (( x − c) · q2 ( x ) + q1 (c)) + p(c) = ( x − c)2 · q allgemein gilt also mit q0 ( x ) = p( x ): n p( x ) = ∑ qi ( c ) · ( x − c )k k =0 mit eindeutig bestimmten Zahlen qi (c). Definition: Die obige Darstellung von f ( x ) heißt Taylorentwicklung von f ( x ) im Punkt c. Definition: Eine Zahl c ist zweifache Nullstelle des Polynoms f ( x ), falls es ein Polynom g( x ) gibt, mit: f ( x ) = ( x − a )2 g ( x ) (*)Polynomdivision: Zu Polynomen f ( x ) und g( x ) 6= 0 gibt es eindeutig bestimmte Polynome r ( x ) mit Grad(r ( x )) Grad( g( x ))und q( x ), mit: f ( x ) = q( x ) g( x ) + r ( x ) Grund: Existenz: Die Menge { f ( x ) − q( x ) g( x ) | q( x ) ist ein hat ein bzgl. des Grades kleinstes Element, welches wir mit r ( x ) bezeichnen. r ( x ) = f ( x ) − q( x ) g( x ) Ist r ( x ) = 0, so ist −∞ = Grad(r ( x )) < Grad( g( x )), da g( x ) 6= 0 und f ( x ) = q( x ) g( x ). Sei also r ( x ) 6= 0. Wir nehmen an, daß Grad(r ( x )) ≥ Grad( g( x )) gälte. Wir schreiben: r ( x ) = r n x n + · · · + r0 g( x ) = bm x m + . . . + b0 und es ist n ≥ m. Wir betrachten r(x) − rn n−m x g( x ) bm Für die höchsten Koeffizientengilt: rn x n − rn n−m x bm x m = 0 bm Da sich die Leitkoeffizienten wegheben, haben wir ein bzgl. des Grades kleineres Polynom gefunden. Andererseits gilt: r(x) − rn n−m rn n−m x g( x ) = f ( x ) − q( x ) g( x ) − x g( x ) = f ( bm bm Letzteres ist aber Element der Menge. Das widerspricht der Annahmen, daß r ( x ) gradkleinstes Element der Menge ist, also ist Grad(r ( x )) < Grad( g( x )). Eindeutigkeit: Ist f ( x ) = q1 ( x ) g ( x ) + r1 ( x ) f ( x ) = q2 ( x ) g ( x ) + r2 ( x ) so gilt: (q1 ( x ) − q2 ( x )) g = r1 ( x ) − r2 ( x ) Nun hat die rechte Seite aber einen Grad kleiner als Grad( g( Ist q1 ( x ) 6= q2 ( x ) , so kann diese Gleichung aus Gradgründen nicht gelten. Also ist q1 ( x ) = q2 ( x ) und daher auch r1 ( x ) = r2 ( x ). 1.7.2 Tangenten an Polynome Beispiel: Wir betrachten das Polynom p( x ) = x2 . Für beliebiges a gilt: x2 = (( x − a) + a)2 = ( x − a)2 + 2a( x − a) + a2 Analog lautet die Taylorentwicklung (s.u.) von x n im Punkt a: n n n−k n n x = (( x − a) + a) = ∑ a ( x − a)k k k =0 Definition: Ist p( x ) ein Polynom und ist n p( x ) = ∑ k =0 pk ( a)( x − a)k = p( a) + p1 ( a)( x − a) + n ∑ pk (a)( k =2 die Taylorentwicklung im Punkt a, so ist t a ( x ) := p( a) + p1 ( a)( x − a) die Tangente an p( x ) im Punkte a. p1 ( a) ist die Steigung der Tangenten und heißt die Ableitung von p( x ) in a. Schrei weise: p 0 ( a ) = p1 ( a ) Bemerkung: Die Intention dieser Definition ist die folgende: Sind wir in R oder Q und ist | x − a| klein, so sind sind die höheren Potenzen | x − a|n für n ≥ 2 noch sehr viel kleiner. Also ist die Tangente für x nahe bei a eine gute Näherung von p( x ). Man spricht auch von der Tangente als Linearisierung des Polynoms p( x ) bei a. 1.8 Polynome II: Die Ableitungsregeln 1.8.1 Konstante Faktoren Regel Sei p( x ) ein Polynom und c eine Zahl. Dann gilt: (c f )0 ( x ) = c · f 0 ( x ) Grund: Für eine Zahl a ist p( x ) = p( a) + p0 ( x )( x − a) + n ∑ bk ( x − a ) k k =2 Für eindeutig bestimmte b2 , . . . , bn . Die Tangente an p( x ) im Punkte a ist: p( x ) ta ( x ) = p( a) + p0 ( a)( x − a) Es ist cp( x ) = c n 0 p( a) + p ( a)( x − a) + = cp( a) + cp0 ( a)( x − a) + ∑ bk ( x − a ) k =2 n ∑ cbk (x − a)k k =2 Die Tangente hier ist: t˜a ( x ) = cp( a) + cp0 ( a)( x − a) ! k Also gilt: (cp)0 ( a) = cp0 ( a) 1.8.2 Summenregel Seien p( x )und q( x ) Polynome. Dann gilt ( p( x ) + q( x ))0 := p0 ( x ) + q0 ( x ) Grund: Es ist n ∑ bk ( x − a ) k p( x ) = p( a) + p0 ( a)( x − a) + k =2 q( x ) = q( a) + p0 ( a)( x − a) + ∑ ck ( x − a)k und n k =2 (sind die Grade unterschiedlich ist ensprechend mit Nullen aufzufüllen). Damit ist: p( x ) + q( x ) = ( p( a) + q( a)) + ( p0 ( a) + q0 ( a))( x − a) + Daher gilt für die Tangenten: p( x ) ta q( x ) (x) + ta p( x )+q( x ) (x) = ta n ∑ (b k =2 1.8.3 Produktregel Es seien p( x ) und q( x ) wie beider Summenregel. Dann gilt: ( p( x )q( x ))0 = p0 ( x )q( x ) + p( x )q0 ( x ) p( x )q( x ) = n 0 p( a) + p ( a)( x − a) + 0 ∑ bk ( x − a ) k =2 n q( a) + q ( a)( x − a) + ∑ ck ( x − a) ! k · ! k k =2 2n = p( a)q( a) + p0 ( a)q( a) + p( a)q0 ( a) ( x − a) + ∑ dk ( x − a) k =2 Also ist p( x )q( x ) ta ( x ) = p( a)q( a) + p0 ( a)q( a) + p( a)q0 ( a) ( x − a) 1.8.4 Allgemeine Produktregel Sind p1 ( x ), . . . , pm ( x ) Polynome, so gilt: " m ∏ pk ( x ) k =1 #0 = p10 ( x ) p2 · . . . · pm ( x ) + p1 ( x ) p20 ( x ) p3 ( x ) · . . . · 0 0 Grund: Nach der Produktregel gilt [∏m k =1 pk ( x )] = p1 ( x ) [ p 0 p1 ( x ) [ p2 ( x ) · . . . · pm ( x )] . Es ist aber [ p2 ( x ) · p3 ( x ) · . . . · pm ( x )]0 = p20 ( x ) [ p3 ( x ) · . . . · pm ( x )] + p2 usf. Potenzregel Sei p( x ) wie oben, n ∈ N. Dann ist 0 [ p( x )n ] = np( x )n−1 p0 ( x ) Grund: Es ist p( x )n = p( x ) · . . . · p( x ). Nach der Produktregel gilt: i0 h [ p ( x ) n ] 0 = p 0 ( x ) p ( x ) n −1 + p ( x ) p ( x ) n −1 = n ∑ p0 ( x ) p( x ) k =1 Speziell für p( x ) = x n : ( x n )0 = nx n−1 Daher haben wir für die allgemeine Ableitung eines Polynoms p( x ) = ∑nk=0 ak x k : " n ∑ ak x k k =0 #0 h i0 = a 0 + a 1 x + a 2 x 2 + . . . + a n −1 x n −1 + a n x n = a1 + 2a2 x + . . . + (n − 1) an−1 x n−2 nan x n−1 = n ∑ kak xk−1 k =1 1.8.5 Kettenregel Seien p( x ) und q( x ) Polynome. Dann ist [q( p( x )]0 = q0 ( p( x )) p0 ( x ) Grund: Sei q( x ) = ∑nk=0 bk x k . Dann gilt: " 0 q( p( x )) = n ∑ bk p ( x ) k =0 = p0 ( x ) #0 k n = ∑ bk h p( x )k k =0 i0 n = ∑ bk kp(x)k− k =1 n ∑ bk kp(x)k−1 = p0 (x)q0 ( p(x)) k =1 Definition (Höhere Ableitungen): Sei p( x ) ein Polynom. Dann definieren wir: p ( x ) (1) : = p 0 ( x ) p ( x ) (2) : = ( p ( x ) 0 ) 0 und allgemein 0 p ( x ) ( n ) : = p ( x ) ( n −1) Bemerkung: Ist n ∑ ak x k p( x ) = k =0 dann ist n ∑ kak xk−1 p0 ( x ) = k =1 und p00 ( x ) = n ∑ k ( k − 1 ) a k x k −2 k =2 Allgemein gilt für die j−te Ableitung: p( j) ( x ) = n ∑ k ( k − 1) · . . . · ( k − j + 1) a k x k − j k= j Wir betrachten nun die Taylorentwicklung n p( x ) = ∑ bk ( x − a ) k k =0 Dann gilt: p( j) ( x ) = n ∑ k ( k − 1 ) · . . . · ( k − j + 1 ) bk ( x − a ) k − j k= j Also ist p( j) ( a) = j! · b j Daher: bj = p( j) ( a ) j! Und damit ergibt sich die Taylorentwicklung zu: n p( x ) = ∑ k =0 p(k) ( a ) ( x − a)k k! Beispiel: Wir bestimmen die Taylorentwicklung von p( x ) = (1 + x )n in a = 0. Es ist p(k) ( x ) = n(n − 1) · . . . · (n − k + 1)(1 + x )n−k also ist p(k) (0) = lung: n! . (n−k)! Damit gilt für die Taylorentwick- n n! n k k (1 + x ) = ∑ x = ∑ x (n − k)!k! k k =0 k =0 n mit n n n! = k (n − k)!k! Erinnerung: n! := n(n − 1)(n − 2) · . . . · 2 · 1, 0! := 1 Folgerung: Allgemeiner binomischer Satz n n k n−k ( x + y) = ∑ x y k k =0 n Grund: Sei y 6= 0. Dann ist y n (1 + x n ) = ( x + y)n y Außerdem gilt: n k n n x n k n−k x n n x y y (1 + ) = y ∑ = ∑ k k y y k =0 k =0 n Der allgemeine binomische Satz ist aber auch richtig für y = 0. 1.9 Polynome III: Analysis Definition: Eine Eigenschaft A( x ) gilt nahe bei a ∈ R, falls es ein δ > 0 gibt mit A( x ) gilt für alle x ∈ ( a − δ, a + δ)\{ a} =: Uδ ( a) Beispiele: x2 ≤ 5 nahe bei 0 (richtig). Allgemeiner: sei e > 0 eine beliebige positive reelle Zahl. Dann gilt x2 < e nahe bei 0. − x2 ≥ 0 nahe bei 0 (falsch) x2 > 0 nahe bei 0 (richtig) x2 > 1 nahe bei 0 (falsch) 1.9.1 Fundamentalsatz der Algebra Ein Polynom f ( x ) hat r ≤ Grad( f ( x )) viele verschiedene reelle Nullstellen λ1 , . . . , λr . Dann läßt sich f ( x ) darstellen als: f ( x ) = ( x − λ1 ) · . . . · ( x − λr ) · ( a1 · ( x + b1 )2 + c1 ) · . . . · ( al · mit a j , b j , c j ∈ R mit a j · c j > 0 Die Faktoren a j · ( x + b j )2 + c j entsprechen den Paaren konjugiert komplexer Nullstellen. Beispiel: Das Polynom f ( x ) = x3 − 1 hat offensichtlich in x = 1 eine Nullstelle. Division mit Rest liefert: x3 − 1 = ( x − 1) · ( x2 + x + 1). Dabei ist ( x2 + x + 1) = (( x + 21 )2 + 3 4) Lemma: Ein Ausdruck der Form a( x + b)2 + c mit a · c > 0 hat überall ein konstantes Vorzeichen. √ Grund: Sind a, b > 0 so ist der Ausdruck gleich ( a( x + √ 2 b))2 + c . Eine Folgerung aus den Ordnungsaxiomen war aber, daß eine Summe von Quadraten, von denen eines echt positiv ist, selbst positiv sein muß. Analog schließt man für a, c < 0. Lemma: Sind λ j und λ j+1 zwei direkt nebeneinander liegende Nullstellen von f ( x ) mit λ j < λ j+1 , dann hat f ( x ) auf allen x ∈ (λ j , λ j+1 ) dasselbe Vorzeichen. Außerdem hat f ( x ) auf (−∞, λ1 ) und (λr , ∞) jeweils konstantes Vorzeichen. Grund: Es ist x − λk > 0 für k = 1 . . . j und x − λk < 0 für k = j + 1 . . . r für jedes x ∈ (λ j , λ j+1 ). Die Faktoren a · (b + x )2 + c haben auf ganz R dasselbe Vorzeichen. Folgerung: Gilt für ein Polynom f ( x ) an der Stelle a f ( a) > 0 (bzw. f ( a) < 0) , so gilt auch f ( x ) > 0 (bzw. f ( x ) < 0) für x nahe bei a. Grund: f ( a) > 0 bedeutet, daß a zwischen zwei Nullstellen oder jenseits der größten bzw. kleinsten Nullstelle liegt. Wähle δ wie folgt: δ := min{ a − λ j , λ j+1 − a} , falls λ j < a < λ j+1 δ := a − λr , falls a > λr δ := λ1 − a, falls a < λ1 Dann ist f ( x ) > 0 für alle x ∈ ( a − δ, a + δ), also f ( x ) > 0 für x nahe bei a. Zwischenwertsatz 1.Form (für Polynome): Ist f ( a) · f (b) < 0 für a < b, so gibt es ein x ∈ ( a, b) mit f ( x ) = 0. Grund: Wir nehmen an, es läge keine Nullstelle vom f ( x ) im Intervall ( a, b). Dann gilt nach dem Fundamentalsatz der Algebra: λ 0 : = − ∞ < λ 1 ≤ λ 2 ≤ . . . ≤ λ k < a < b < λ k +1 ≤ . . . ≤ λ (wegen f ( a) · f (b) < 0 sind a und b keine Nullstellen von f ( x )). Nach obiger Folgerung hat aber f ( x ) auf (λk , λk+1 ) konstantes Vorzeichen, also auch auf [ a, b] ⊂ (λk , λk+1 ) Insbesondere kann nicht f ( a) · f (b) < 0 gelten. 1.9.2 Zwischenwertsatz für Polynome Zwischenwertsatz 2. Form: Es sei c ein Wert zwischen f ( a) und f (b), (mit f ( a) 6= f (b)). Dann gibt es ein x ∈ ( a, b) mit f ( x ) = c. Grund: Es gibt die beiden Fälle f ( a) < f (b) und f (b) < f ( a ). In beiden Fällen gilt: f ( a) < c < f (b) ⇒ f ( a) − c < 0 < f (b) − c f (b) < c < f ( a) ⇒ f (b) − c < 0 < f ( a) − c Somit haben f ( a) − c und f (b) − c verschiedenes Vorzeichen. Deswegen gibt es ein x ∈ ( a, b), mit f ( x ) − c = 0 oder f ( x ) = c. Beispiel: f ( x ) = x3 − 1 Es ist f (0) = −1, f (1) = 0. D.h. es muß q ein c ∈ (0, 1) 1 geben, mit f (c) = − 2 . Dies gilt für c = 3 32 . Bemerkung: Insbesondere haben also Polynome keine Spru stellen. 1.9.3 Satz von Rolle für Polynome Satz (von Rolle): Ist f ( a) = f (b) für a < b, dann gibt es ein x ∈ ( a, b), mit f 0 ( x ) = 0 Grund: Sei O.E. (=ohne Einschränkung) : f (b) = f ( a) = 0 (sonst betrachtet man f ( x ) − c, mit c = f ( a) = f (b)). Wir nehmen O.E. an, daß a, b benachbarte Nullstellen sind, mit a < b (befindet sich eine weitere Nullstelle c in ( a, b), so betrachten wir eines der kleineren Intervalle ( a, c) oder (c, b)) . Dann hat f ( x ) auf ( a, b) konstantes Vorzeichen. Es sei f ( x ) = ( x − a)k · ( x − b)l · r ( x ) mit ( x − a), ( x − b) teilen r ( x ) nicht. r ( a) und r (b) haben nun dasselbe Vorzeichen (hätten sie verschiedene Vorzeichen, gäbe es nach dem Zwischenwertsatz eine Nullstelle von r ( x ) dazwischen, also auch eine von f ( x )). Mit dem gleichen Argument sieht man, daß r ( x ) und r ( a) das gleiche Vorzeichen haben. r ( x ) hat also auf dem gesamten Intervall [ a, b] ein konstantes Vorzeichen (Insbesondere haben r ( a) und r (b) dasselbe Vorzeichen). Nach der Produktregel ist f 0 ( x ) = k · ( x − a ) k −1 · ( x − b ) l · r ( x ) + ( x − a ) k · l · ( x − b ) l −1 = ( x − a ) k −1 · ( x − b ) l −1 · k · ( x − b ) · r ( x ) + l · ( x − a ) · r ( x Setze h( x ) := k · ( x − b) · r ( x ) + l · ( x − a) · r ( x ) + ( x − a) · ( X − b) · Dann ist h( a) = k · ( a − b) · r ( a) und h(b) = l · (b − a) · r (b). Da r ( a) und r (b) dasselbe Vorzeichen haben, müssen h( a) und h(b) verschiedene Vorzeichen haben. Also gibt es ein z ∈ ( a, b) mit h(z) = 0. Daher gilt : f 0 (z) = (z − a)k−1 · (z − b)l −1 · h(z) = 0. 1.9.4 Mittelwertsatz für Polynome (Mittelwert-) Satz: Für a < b gibt es ein x ∈ ( a, b) mit f 0 (x) = f (b) − f ( a) b−a Grund: Wir betrachten die Hilfsfunktion f (b) − f ( a) · ( x − a) F ( x ) := f ( x ) − f ( a) − b−a Dann ist F ( a) = F (b) = 0. Daher existiert nach dem Satz von Rolle ein z ∈ ( a, b) mit F 0 (z) = 0. Es ist aber F0 (x) = f 0 (x) − also f 0 (z) = f (b) − f ( a) b−a f (b) − f ( a) b−a Beispiel: Für das Polynom f ( x ) = x3 − 1 gilt: f (0) = −1 und f (1) = 0. f (1)− Die Steigung der Sekante durch die beiden Punkte ist: 1− 1 0 2 1 = 1. Die Ableitung ist f ( x ) = 3 · x . Die Gleichung 3 · x2 = 1 hat die beiden Lösungen ζ = ± √1 . D.h. die Tan- gente durch den Punkt ζ = √1 2 3 hat die gleiche Steigung wie die Sekante durch die Punkte (0, f (0)) und (1, f (1)). Lemma: Ist f 0 ( a) 6= 0, so ist f auf einem Intervall ( a − δ, a + δ) für ein δ > 0 streng monoton. Grund: Da auch f 0 ( x ) ein Polynom ist, gilt nach obiger Folgerung: f 0 (ζ ) 6= 0 für ein δ > 0 und alle ζ ∈ ( a − δ, a + δ). Nach dem Mittelwertsatz gilt aber für alle x1 , x2 ∈ ( a − δ, a + δ) mit x1 < x2 : f ( x2 ) = f ( x1 ) + f 0 (ζ )( x2 − x1 ) für ein ζ ∈ ( x1 , x2 ) ⊂ ( a − δ, a + δ). Also hat f ( x2 ) − f ( x1 ) konstantes Vorzeichen auf ( a − δ, a + δ). Definition: Eine Funktion f : D ⊂ R hat in a ∈ D ein (striktes) globales Minimum, falls gilt f ( x )(>) ≥ f ( a) (∗) für alle x ∈ D. f hat in a ∈ D ein (striktes) lokales Minimum falls (*) gilt für alle x ∈ D nahe bei a. (D.h. es gibt ein δ > 0, mit f ( x )(>) ≥ 0 für alle x ∈ (( a − δ, a + δ)\{ a}) ∩ D. Für ein Maximum gilt die sinngemäße Definition. Maxima und Minima heißen zusammengefaßt auch Extrema. Satz: Hat ein Polynom f ( x ) in einem Punkt a ∈ R ein Extremum, so gilt: f 0 ( a) = 0. Grund: Wir nehmen an, daß f 0 ( a) > 0. Dann ist nach obiger Folgerung f 0 (ζ ) > 0 für ζ nahe bei a. D.h. f 0 (ζ ) > 0 für alle ζ ∈ ( a − δ, a + δ) für ein δ > 0. Sei nun x ∈ ( a − δ, a + δ). Nach dem Mittelwertsatz gilt f ( x ) = f ( a) + f 0 (ζ ) · ( x − a) für ein ζ zwischen a und x. Dann ist ζ ∈ ( a − δ, a + δ) und somit f 0 (ζ )>0. Ist x > a, so ist f ( x ) > f ( a) und ist x < a, dann ist f ( x ) < f ( a). Also kann a kein Extremum von f ( x ) sein. Achtung: Die Umkehrung dieser Folgerung gilt nicht. f ( x ) x3 ist nahe bei 0 (sogar überall) streng monoton steigend, aber f 0 (0) = 0. Fazit:i) Polynome sind stückweise streng monoton. ii) Die Monotoniewechselstellen sind genau die (strengen,lo Minima und Maxima. Grund: i) Es sei f ( x ) ein Polynom und −∞ =: λ0 < λ1 < . . . < λr < λr+1 := +∞ die verschiedenen Nullstellen von f 0 ( x ). Dann hat f 0 ( x ) auf dem Intervall (λ j , λ j+1 ) konstantes Vorzeichen. Seien nun x1 , x2 ∈ (λ j , λ j+1 ) und x1 < x2 dann ist f ( x2 ) = f ( x1 ) + f 0 (ζ )( x2 − x1 ) für ein ζ ∈ ( x1 , x2 ) ⊂ (λ j , λ j+1 ). Also ist f ( x ) auf dem Intervall (λ j , λ j+ streng monoton steigend oder fallend, abhängig von dem Vorzeichen von f 0 ( x ) in diesem Intervall. ii) Hat f ( x ) beispielsweise ein Maximum in a, mit f ( a) > 0, so gibt es ein δ > 0, mit f ( x ) > 0 und f ( a) > f ( x ) auf ( a − δ, a + δ). Außerdem ist nach dem obigen Satz in einem Extremum die Ableitung f 0 ( a) = 0. Da f ( x ) zwischen den Nullstellen von f 0 ( x ) konstantes Monotonieverhalten hat, so kann f ( x ) nur streng monoton steigend auf ( a − δ, a] und streng monoton fallend auf [ a, a + δ). Hat umgekehrt f in a einen Monotoniewechsel, also ist f z.B. auf ( a − δ, a] streng monoton steigen und auf [ a, a + δ) streng monoton fallend, So ist f ( a) der größte Wert auf beiden Teilintervallen, also ein Maximum. Erinnerung: Eigenschaften der Betragsfunktion | a| ≤ |b| ⇒ | a|n ≤ |b|n für alle n ∈ N | a + b| ≤ | a| + |b| | a − b| ≥ | a| − |b| Beispiel : Gesucht ist eine obere Schranke von | f ( x )| für f ( x ) = x7 − 6 · x4 + x auf [−2, 1] Lösung: Auf [−2, 1] gilt: | x | ≤ 2 | x 7 − 6 · x 4 + x | ≤ | x 7 | + | − 6 · x 4 | + | x | = | x 7 | + |6 · x 4 | + |x| = | x |7 + 6 · | x |4 + | x | ≤ 27 + 6 · 24 + 2 = 226 Lemma: Auf einem Intervall [ a, b] gilt für ein Polynom f ( x ) = ∑nk=0 ak · x k : Es gibt eine Zahl M, mit : | f ( x )| ≤ M für alle x ∈ [ a, b]. Genauere Überlegung: Ein Polynom f ( x ) hat in einem Intervall [ a, b] seine absoluten Maxima und Minima in den Nullstellen von f 0 ( x ) oder in den Endpunkten a, b. Sei c ∈ [ a, b] das absolute Minimum mit f (c) = m und d ∈ [ a, b] das absolute Maximum mit f (d) = M. Dann gilt mit dem Zwischenwertsatz: f ([ a, b]) = [m, M ] 1.10 Integration Teil I 1.10.1 Ein Integralbegri (nicht nur für Polynome) Definition: Sei f : [ a, b] → R, mit a < b. i) Ist f ( x ) = c ∈ R für alle x ∈ [ a, b], so definieren wir: ˆ c = c(b − a) [ a,b] ii) Ist f ( x ) ≥ 0 für alle x ∈ [ a, b] (kurz: f |[ a,b] ≥ 0, analog: ≤, <, >) und f auf [ a, b] streng monoton steigend (kurz: f |[ a,b] ↑,analog ↓), und ist F ( x ) die Flächenfunktion von f auf [ a, b], mit F ( a) = 0, so ist ˆ f := F (b) [ a,b] Ist F ( a) > 0, so ist G ( x ) := F ( x ) − F ( a) eine ´ Flächenfunktion mit G ( a) = 0 und es ist und es ist [ a,b] f = G (b) = F ( b ) − F ( a ). Satz:i) Für f , g : [ a, b] → R und f , g ↑, ≥ 0 oder einer von beiden konstant, so gilt: ˆ ˆ ˆ f +g= f+ g [ a,b] [ a,b] [ a,b] und für c ≥ 0: ˆ ˆ cf = c [ a,b] f [ a,b] Grund: Sei beispielsweise g = c. Aus (y − x ) f ( x ) < F (y) − F ( x ) < (y − x ) f (y) erhält man durch Addition von c(y − x ): (y − x )( f + c)( x ) < ( F + c)(y) − ( F + c)( x ) < (y − x )( f + c Sind f und g ≥ 0, ↑ mit Flächenfunktionen F und G, so liefert eine Addition der beiden Doppelungleichungen: (y − x )( f ( x ) + g( x )) < ( F (y) + G (y)) − ( F ( x ) − G ( x )) < (y Wegen der Eindeutigkeit ist also F ( x ) + G ( x ) die Flächenfunktion von f ( x ) + g( x ). Multiplikation der Doppelungleichung mit c liefert die letzte Behauptung. Bemerkung: Analoge Aussagen gelten für f , g ↓ ., ≤ 0, da dann | f |, | g| ↑, ≥ 0. Definition: In diesem Falle definieren wir: ˆ ˆ f := − −f [ a,b] [ a,b] Satz: Für c ∈ [ a, b] gilt: ˆ ˆ f = [ a,b] ˆ f+ [ a,c] f [c,b] ´ ´ Grund: [ a,c] f + [c,b] f = F (c) − F ( a) + F (b) − F (c) = ´ F (b) − F ( a) = [ a,b] f Definition: Seien f , g : [ a, b] → R streng monoton und von konstantem Vorzeichen. Dann definieren wir ˆ ˆ ˆ f − g := f− g [ a.b] Es ist [ a,b] ˆ [ a,b] ˆ ˆ f := 0 und [ a,a] [b,a] f := − f [ a,b] Bemerkung: Wir haben nun einen Integralbegriff u.a. für stückweise streng monotone oder konstante Funktionen, die stückweise konstantes Vorzeichen haben, also insbesondere für Polynome. Bemerkung: Sei f : [ a, b] ⊂ R → R eine Funktion. Dann ist das bestimmte Integral ˆ f [ a,b] die Fläche zwischen der Kurve y = f ( x ) und dem Intervall [ a, b]. Oberhalb der x −Achse gelegene Flächen werden dabei positiv gezählt, unterhalb der x −Achse gelegene negativ. Beispiel: Man erhält sofort für Funktionen f , g : [ a, b] → R und λ ∈ R: I1) ´ [ a,b] f +g= ´ [ a,b] f+ ´ [ a,b] g Bemerkung: An dieser Stelle sehen wir, warum wir nega´ tiv gezählte Flächen zulassen: Sicher ist [ a,b] 0 = 0. Dann ´ ist aber wegen 0 = c + (−c) für c ∈ R>0 auch 0 = [ a,b] c + ´ ´ ´ [ a,b] − c = 0, also [ a,b] − c = − [ a,b] c ´ ´ ´ I2) [ a,b] λ · f = λ · [ a,b] f , speziell für λ = −1: [ a,b] − f = ´ − [a,b] f I3) Für c ∈ [ a, b] ist ´ [ a,b] f = ´ [ a,c] f+ ´ [c,b] f I4) | ´ [ a,b] f| ≤ ´ [ a,b] |f| Definition: Man schreibt auch: ˆ ˆ b f ( x )dx = a f [ a,b] ´b Bemerkung: Die Zeichen a und dx sind wie Klammern zu lesen. Statt des dx kann auch jede andere Variable ver´b ´b ´b wendet werden, also a f (τ )dτ = a f (y)dy = a f ( x )dx I6) Translationsinvarianz: Für alle s ∈ R gilt: ˆ b−s ˆ b f ( x + s)dx = f ( x )dx a−s a Beispiel 1: f ( x ) = x2 ist auf R≥0 streng monoton steigend. Wegen: y3 x3 x 2 + x · y + y2 − = (y − x ) · ( ) 3 3 3 gilt für x, y ≥ 0 und x < y : (y − x ) · x2 + x2 + x2 y3 x 3 y = (y − x ) · x2 < − < (y − x ) · 3 3 3 wegen der Eindeutigkeit haben wir: ˆ x x3 F(x) = t2 dt = 3 0 3 0 Man beachte: F 0 ( x ) = x3 = x 2 = f ( x ). Allgemein gilt für 0 ≤ x < y: ( y − x ) · ( x n + x n −1 · y + x n −2 · y 2 + . . . + x 2 · y n −2 + x · y n −1 + Deswegen gilt: (y − x ) · ( n + 1) · x n y n +1 x n +1 ( n + 1) · y < − < (y − x ) · n+1 n+1 n+1 n+1 also ist F ( x ) = x n +1 n +1 die Flächenfunktion für f ( x ) = x n n +1 Bemerkung:i) Es ist F ( x ) = xn+1 und damit : F 0 ( x ) = x n . Also sieht man, daß Flächenfunktionen bilden und Ableiten Umkehrungen voneinander sind (jedenfalls für Polynome der Form f ( x ) = x n ). ii) Ist F ( a) 6= 0, so ist F ( x ) − F ( a) = 0 und es gilt: (y − x ) f ( x ) < F (y) − F ( x ) = ( F (y) − F ( a)) − (( F ( x ) − F ( a) Insbesondere bedeutet dies, daß Flächenfunktionen (wenn man nicht F ( a) = 0 fordert) nur bis auf additive Konstante eindeutig bestimmt sind. Satz: Für ein allgemeines Polynom f ( x ) = ∑nk=0 ak x k gilt: ˆ n ak x k = F (b) − F ( a) ∑ [ a,b] k =0 mit n F(x) = a k k +1 x k +1 k =0 ∑ 1.10.2 Die Integrationsregeln Satz: Für Polynome f , g gilt: ´ ´ ´ [ a,b] ´f ± g = [ a,b]´f ± [ a,b] g [ a,b] λ f = λ [ a,b] f ´ ´ 0 = f (b) g(b) − f ( a) g( a) − 0 f · g [ a,b] [ a,b] f · g ´b ´ g(b) 0 a f ( g ( x )) · g ( x ) dx = g( a) f ( y ) dy ´b Grund: Wir haben gesehen: Ist F 0 = f , so ist a f ( x )dx = F ( b ) − F ( a ). i) Aus ( F · g)0 = f · g + F · g0 folgt F (b) g(b) − F ( a) g( a) = ´b ´b 0 a f ( x ) · g ( x ) dx + a F ( x ) · g ( x ). Also gilt ˆ ˆ b f ( x ) g( x ) = a F ( x ) g( x )|ba − b F ( x ) g0 ( x )dx a oder, wenn wir f durch f 0 ersetzen : ˆ b a f 0 ( x ) g( x )dx = f ( x ) g( x )|ba − ˆ f ( x ) g0 ( x )dx ii) Sei F ( x ) eine Flächenfunktion von f ( x ) auf [ g( a), g(b)], ´ g(b) also ist g(a) f (y)dy = F ( g(b)) − F ( g( a)). Weiter gilt F ( g( x ) ´ f ( g( x )) · g0 ( x ), also [ a,b] f ( g( x )) · g0 ( x ) = F ( g(b)) − F ( g( a) Definition: Sei f : [ a, b] → R und x0 := a < x1 < . . . < xn < xn+1 := b und f auf allen Teilintervallen streng monoton oder konstant. Sei x ∈ [ xi , xi+1 ]. Dann definieren wir: ˆ ˆ ˆ x := a i −1 ∑ x k +1 k =0 x k x f (t)dt + f (t)dt xi Bemerkung: Alles in diesem Kapitel gesagte gilt, da es in diesem Falle für alle für alle Teilintervalle gilt, auch für diese Integrale. 1.10.3 Beispiele für Integrationstechniken Aus der Kettenregel f (φ( x ))0 = f 0 (φ( x )) · φ0 ( x ) folgt, daß f 0 (φ( x )) · φ0 ( x ) eine Stammfunktion von f (φ( x )) ist. D.h. ˆ f (φ( x )) · φ0 ( x )dx = F (φ( x )) + C wenn F ( x ) eine Stammfunktion von f ( x ) ist. Dies ist die sogenannte Substitutionsregel. ´ 3 Beispiel 1: x2 · e x dx Wir wählen φ( x ) := x3 . Es ist φ0 ( x ) = 3x2 . Also ist ˆ ˆ ˆ 3 1 1 1 1 φ0 ( x ) · eφ( x) dx = eu du = eu + C = x2 · e x = 3 3 3 e Kurzschreibweise: u = x3 du = 3x2 dx du dx = 2 3x ˆ ˆ 3 x2 · e x dx = Probe: h 1 x3 3e +C i0 x2 · eu 3 du 1 = 3 3x2 ˆ = 13 e x · 3x2 = x2·e eu du = x3 1 x3 e +C 3 ´ Beispiel 2: √ 2√ x dx x Wähle u = φ( x ) = √ x. Dann ist φ0 ( x ) = u= √ 1 √ . 2 x x 1 du = √ dx 2 x √ dx = 2 xdu ˆ √ 2 x √ dx = x ˆ 2u √ √ 2 xdu = 2 x ˆ 2u du Stammfunktion für 2x : 2x = e x ln 2 ˆ e x ln 2 = e x ln 2 2x +C = +C ln 2 ln 2 Daher gilt: ˆ 2 √ 2u +1 2 x +1 2 du = +C = +C ln 2 ln 2 u Probe: ln(2) · h 2 √ x +1 ln 2 1 √ 2 x Beispiel 3: = ´ +C √ i0 2 √x ·2 2 x = = h i0 √ 1 ( x +1)·ln(2) e ln 2 √ = √ 1 e( x+1)·ln(2 ln(2) 2√ x x cos( x )e2·sin( x) dx u = 2 · sin( x ) du = 2 cos( x )dx dx = ˆ cos( x )e2·sin( x) dx = 1 du 2 cos( x ) ˆ cos( x )eu 1 1 du = 2 cos( x ) 2 ˆ eu du = Aus der Produktregel [ f ( x ) · g( x )]0 = f 0 ( x ) g( x ) + f ( x ) g0 ( x ) folgt: ˆ f ( x ) · g( x ) = f 0 ( x ) g( x ) + f ( x ) g0 ( x )dx oder ˆ f 0 ( x ) · g( x )dx = f ( x ) g( x ) − Beispiel 4: ´ sin( x )2 dx ˆ f ( x ) g0 ( x )dx Wir setzen: f 0 ( x ) = sin( x ) ⇒ f ( x ) = − cos( x ) und g( x ) = sin( x ) ⇒ g0 ( x ) = cos( x ) Also ˆ ˆ 2 sin( x ) dx = − cos( x ) sin( x ) + cos( x )2 dx = cos( x ) sin Daher gilt: ˆ sin( x )2 dx = 1 [ x − cos( x ) sin( x )] 2 sin( x ) Beispiel 5: Die Funktion tan( x ) = cos(X ) hat auf dem Intervall (− π2 , π2 ) die Umkehrfunktion arctan( x ). Die Ableitung von tan( x ) ist nach der Quotientenregel: tan( x )0 = cos( x )2 + sin( x )2 = 1 + tan( x )2 cos( x )2 Mit der Kettenregel folgt aus tan(arctan( x )) = x die Ableitung von arctan( x ): (1 + tan(arctan( x ))2 ) · arctan( x )0 = 1 als arctan( x )0 = 1 1 + x2 Damit berechnen wir ˆ ˆ arctan( x )dx = 1 · arctan( x )dx Wir setzen f 0 (x) = 1 ⇒ f (x) = x g( x ) = arctan( x ) ⇒ g0 ( x ) = 1 1 + x2 Daher ist ˆ ˆ 1 · arctan( x )dx = x · arctan( x ) − x dx 1 + x2 Das letzte Integral können wir wieder über Substitution lösen: ˆ x dx 1 + x2 u := 1 + x2 du = 2xdx ˆ x dx = 1 + x2 ˆ x 1 1 · du = u 2x 2 ˆ 1 1 1 du = ln(u) + C = l u 2 2 Insgesamt also ˆ 1 arctan( x )dx = x · arctan( x ) − ln( x2 + 1) + C 2 h i0 Probe: x · arctan( x ) − 12 ln( x2 + 1) + C = 1 · arctan( x ) + x· 1 1+ x 2 − 1 1 2 1+ x 2 · 2x = arctan( x ) Bemerkung: Durch dieses Beispiel wissen wir auch: ˆ 1 = arctan( x ) + C 1 + x2 Beispiel 6: ´ ln( x )dx Der gleiche Trick wie bei arctan( x ) liefert: ˆ 1 · ln( x )dx f 0 (x) = 1 ⇒ f (x) = x g( x ) = ln( x ) ⇒ g0 ( x ) = ˆ ˆ 1 · ln( x )dx = x · ln( x ) − x· 1 x 1 dx = x · ln( x ) − x + C x Probe: [ x · ln( x ) − x + C ]0 = 1 · ln( x ) + x · 1x − 1 = ln( x ) h i 1 1 1 = a−1 b · x− Beispiel 7: Es ist ( x− a)( a − x −b x −b) Daher gilt: ˆ 1 1 dx = ln ( x − a)( x − b) a−b x−a x−b +C Hinweis: In Maxima lautet der Befehl für die Integration: integrate(Ausdruck,Variable) Beispiele: integrate(1/(( x − a) ∗ ( x − b)), x ) = log ( x − b) log ( − b−a b Die Auswertung von bestimmten Integralen geschieht durc den Befehl integrate(Ausdruck,Variable,untere Grenze,ober Grenze) Beispiel: integrate(1/x, x, 1, 2) = log(2) 1.10.4 Tangenten Erinnerung: Gilt eine Eigenschaft A( x ) einer Zahl x ∈ R für alle x ∈ ( a − δ, a + δ)\{ a} mit einem δ > 0, so sagen wir: A( x ) gilt (für x) nahe bei a. Beispiel: x2 ≥ 0 nahe bei 0 (wahr), x2 < 1 nahe bei 0 (wahr), x2 > 0.1 nahe bei 0 (falsch) Anwendung: Gilt eine Eigenschaft A1 ( x ) nahe bei a und gilt eine Eigenschaft A2 ( x ) nahe bei a, so gilt A1 ( x ) ∧ A2 ( x ) nahe bei a. Grund: A1 ( x ) gilt für alle x ∈ ( a − δ1 , a + δ1 )\{ a} und A2 ( x ) gilt für alle x ∈ ( a − δ2 , a + δ2 )\{ a} dann gilt A1 ( x ) ∧ A2 ( x ) für alle x ∈ ( a − min(δ1 , δ2 ), a + min(δ1 , δ2 )\{ a}. Beispiel: x2 ≥ 0 nahe bei 0 und x2 ≤ 0.1 nahe bei 0, dann auch 0 ≤ x2 ≤ 0.1 nahe bei 0 Definition: Sei f : X → Y, X, Y ⊂ R eine Funktion. f heißt im Punkt x0 ∈ X stetig, wenn für jedes e > 0 gilt: Für x ∈ X ist | f ( x ) − f ( x0 )| < e für x nahe bei x0 . Oder anders formuliert: ∀e > 0∃δ > 0∀ x ∈ X : | x − x0 | < δ ⇒ | f ( x ) − f ( x0 )| < e Sei f : I ⊂ R → R, I ein offenes Intervall, a ∈ I. Eine Gerade durch den Punkt ( a, f ( a)) ist eine Funktion der Form: L( x ) = f ( a) + m · ( x − a) (*) Die Gerade beschrieben durch T ( x ) = f ( a) + t · ( x − a) heißt Tangente an f in a, wenn für jede Funktion L vom Typ (*) gilt: | f ( x ) − T ( x )| ≤ | f ( x ) − L( x )| für x nahe bei a Bemerkung: Geraden sind ihre eigenen Tangenten (an jeden Punkt) insbesondere sind Tangenten von Geraden eindeutig. Satz: Tangenten sind, falls sie existieren, eindeutig. Grund: Seien T1 und T2 zwei Tangenten an f im Punkte a. mit T1 6= T2 , d.h. es gibt ein x ∈ R mit T1 ( x ) 6= T2 ( x ). Insbesondere schneiden sich T1 und T2 genau in dem einen Punkt ( a, f ( a)). Da beide Tangenten sind, gibt es δ1 und δ2 mit | f ( x ) − T1 ( x )| ≤ | f ( x ) − T2 ( x )| für x ∈ ( a − δ1 , a + δ1 ) | f ( x ) − T2 ( x )| ≤ | f ( x ) − T1 ( x )| für x ∈ ( a − δ2 , a + δ2 ) also gilt: | f ( x ) − T1 ( x )| = | f ( x ) − T2 ( x )| für x ∈ ( a − min(δ1 , δ2 ), a + Kurz: Ist | f ( x ) − T1 ( x )| ≤ | f ( x ) − T2 ( x )| nahe bei a und | f ( x ) − T2 ( x )| ≤ | f ( x ) − T1 ( x )| nahe bei a, so ist | f ( x ) − T1 ( x )| = | f ( x ) − T2 ( x )| nahe bei a. Dann gilt aber für diese f (x) = 1 ( T ( x ) + T2 ( x )) 2 1 Dann ist aber f lokal um a eine Gerade und für diese sind Tangenten eindeutig. Definition: Eine Funktion f heißt in a differenzierbar, wenn eine Tangente in a an f existiert. Die Steigung dieser Tangente ist die Ableitung vom f in a: f 0 ( a) Beispiel: Ist die Funktion ( f ( x ) := in 0 differenzierbar? x2 sin 0 1 x für x 6= 0 für x = 0 Zunächst einmal stellen wir fest, daß wegen 1 −1 ≤ sin ≤1 x folgt, daß − x2 ≤ f ( x ) ≤ x2 Wir hatten aber früher gesehen, daß die x −Achse die Tangente an beide Funktionen x2 und − x2 im Ursprung ist. Also gilt für eine beliebige Gerade K ( x ) durch den Ursprung: | x2 − (0 · x + 0)| ≤ | x2 − K ( x )| ∧ | − x2 − (0 · x + 0)| ≤ | − x für x nahe bei 0. Es sind also x2 und − x2 näher an 0 als an K ( x ). Da aber f ( x ) zwischen x2 und − x2 liegt, ist es auch näher an 0 als K ( x ). Also gilt: | f ( x ) − (0 · x + 0)| ≤ | f ( x ) − K ( x )| Da aber K ( x )beliebig war, ist die x −Achse also Tangente an f ( x ) im Punkt 0. Lemma: Für Zahlen a, b, f ∈ R gilt: |a − f | ≤ 1 | a − b| ⇒ | a − f | ≤ |b − f | 2 Grund: Es gilt: | a − f | ≤ 12 | a − b| = 12 | a − f + f − b| ≤ 1 1 1 1 2 | a − f | + 2 |b − f | ⇒ 2 | a − f | ≤ 2 |b − f | ⇒ | a − f | ≤ | b − f |. Definition: x liegt zwischen a und b :⇔ min( a, b) < x < max( a, b) Folgerung: Liegt x zwischen a und b , dann liegt xy ay und by für y 6= 0. Satz: Für eine Funktion f : (c, d) → R sind äquivalent: i) f ist differenzierbar in a ∈ (c, d) mit Ableitung m ii) (Caratheodory) Es gibt eine Funktion ω : (c, d) → R, mit f ( x ) = f ( a) + ω ( x )( x − a) die stetig ist in a und ω ( a) = m. Grund:”i ) ⇒ ii )” Sei T ( x ) = f ( a) + m( x − a) Tangente an f in a. Für ein beliebiges ε > 0 betrachten wir die beiden folgenden Graden durch den Punkt ( a, f ( a)): L1 ( x ) := f ( a) + (m + ε)( x − a) = f ( a) + m( x − a) + ε( x − a) L2 ( x ) := f ( a) + (m − ε)( x − a) = f ( a) + m( x − a) − ε( x − a) Nun liegt m zwischen m − ε und m + ε. Also liegt m( x − a) zwischen (m − ε)( x − a) und (m + ε)( x − a). Durch Addition von f ( a) folgt, daß T ( x ) zwischen L1 ( x ) und L2 ( x ) liegt. Für x nahe bei a ist aber f ( x ) näher an T ( x ) als L1 ( x ) und L2 ( x ). Also liegt insbesondere f ( x ) zwischen L1 ( x ) und L2 ( x ). Wir setzen: ( ω ( x ) := f ( x )− f ( a) x−a m für x 6= a für x = a Also ist f ( x ) = f ( a) + ω ( x )( x − a) für alle x 6= a. Dann gilt nach Abzug der Tangenten : (ω ( x ) − m)( x − a) liegt zwischen ε( x − a) und −ε( x − a). Und schließlich nach Division durch x − a 6= 0: |ω ( x ) − m| < ε. “ii ) ⇒ i )” Sei f ( x ) = f ( a) + ω ( x )( x − a), mit ω stetig in a. Wir müssen zeigen: T ( x ) = f ( a) + ω ( a)( x − a) ist Tangente. Sei K ( x ) := f ( a) + r ( x − a). Es gilt: | f ( x ) − T ( x )| = |ω ( x ) − ω ( a)| · | x − a| Da ω in a stetig ist, gilt |ω ( x ) − ω ( a)| < 12 |ω ( a) − r | für x genügend nahe bei a. Speziell also für | x − a| < 1: | f ( x ) − T ( x )| < 1 1 |ω ( a) − r | · | x − a| = | T ( x ) − K ( x )| 2 2 Nach obigem Lemma gilt: | f ( x ) − T ( x )| ≤ | f ( x ) − K ( x )| Beispiel: Es sei f ( x ) ein Polynom und n f ( x ) = b0 + ∑ bk ( x − a ) k = k =1 n f ( a) + ( ∑ bk ( x − a)k−1 )( x − a k =1 seine Taylorentwicklung im Punkt a. Wir wollen nun einsehen, daß die Gerade T ( x ) = b0 + b1 ( x − a), die wir bei Polynomen als Tangente definiert hatten, auch in unserem neuen Sinne Tangente ist. Es ist offensichtlich ω ( x ) = ∑nk=1 bk ( x − a)k−1 stetig (siehe Ergänzungen) mit ω ( a) = b1 . Beispiel: Die Ableitung von f ( x ) = 1x Es ist für a, x > 0 1 1 1 1 1 1 = − ( x − a ) = − 2 ( x − a ) + 2 ( x − a )2 x a ax a a a x Wir setzen ω ( x ) := − a12 + a21x ( x − a) . Dann ist ω als Kompositum stetiger Funktionen wieder stetig und es gilt ω ( a) = − a12 . Also gilt für x 6= 0: 0 1 1 =− 2 x x Satz: Ist f in a differenzierbar, so ist f in a stetig. Grund: Es ist f ( x ) = f ( a) + ω ( x )( x − a) und ω ist in a stetig. Dann ist f ( x ) als Summe und Produkt stetiger Funktionen ebenfalls in a stetig. Ableitungen von Flächenfunktionen Wir haben schon gesehen, daß eine auf einem abgeschlossenen Intervall I = [c, d] streng monotone Funktion f eine eindeutige (bis auf additive Konstanten) Flächenfunktion F hat, wenn auf diesem Intervall für alle x, y gilt: F (y) − F ( x ) liegt zwischen (y − x ) f ( x ) und (y − x ) f (y). Sei a ∈ I fest und x ∈ I, mit x > a. Dann gilt: F ( x ) − F ( a) liegt zwischen ( x − a) f ( a) und ( x − a) f ( x ). Für x 6= a liegt F ( x )− F ( a) zwischen f ( a) und f ( x ). x−a Ist f nun stetig in a, so gilt: ( F ( x )− F ( a) für x 6= a x−a ω(x) = f ( a) für x = a F ( x )− f ( a) ist stetig in a. Denn: Wegen f ( x ) < < f ( a) wird x−a | f ( x ) − f ( a)| für x nahe bei a beliebig klein. Also wird weF ( x )− F ( a) gen f ( x ) − f ( a) < − f ( a) = ω ( x ) − f ( a) < 0, alx−a so 0 < |ω − f ( a)| < | f ( x ) − f ( a)| der Ausdruck |ω ( x ) − f ( a)| beliebig klein und ist wegen der Archimedizität von R gleich 0. Der Fall x < a verläuft analog. Wir haben also gezeigt: Hauptsatz der Differential- und Integralrechnung: Ist f : [ a, b] → R auf ( a, b) stetig und ist F ( x ) eine Flächenfunktion von f auf [ a, b], so gilt : F0 (x) = f (x) oder 0 x ˆ f (t)dt a = [ F ( x ) − F ( a)]0 = f ( x ) Kurz gesagt: Flächenfunktionen sind Stammfunktionen. Beispiel: Wir hatten früher den Logarithmus als Flächenfunktion von 1x =: f ( x ) definiert: ˆ x 1 ln( x ) = dt 1 t Wir behaupten nun f ( x ) ist stetig in a 6= 0: Sei a ∈ R > 0 und x ∈ R>0 mit | x | > 2a . Dann ist |1/x − 1/a| = | x − a|/| a|| x | < 2 | x − a| a2 und die rechte Seite wird nahe bei a beliebig klein. Oder kürzer: f ( x ) ist als Quotient stetiger Funktionen stetig (siehe Ergänzungen). Folgerung: Für x > 0 ist ln( x )0 = 1 x Bemerkung: Die Rechenregeln für die Ableitungen, die wir bei Polynomen gesehen haben gelten sinngemäß weiter für differenzierbare Funktionen: Sind f , g : I → R Funktionen, definiert auf dem offenen Intervall I und differenzierbar in a ∈ I, so gilt: f ± g und c · f , sind differenzierbar in a und es gilt: (c · f )0 ( a) = c · f 0 ( a) ( f ± g)0 ( a) = f 0 ( a) ± g0 ( a) ( f · g)0 ( a) = f 0 ( a) g( a) + f ( a) g0 ( a) Grund: Exemplarisch für die Produktregel: Es ist f ( x ) = f ( a) + ω ( x )( x − a) und g( x ) = g( a) + δ( x )( x − a) mit in a stetigen Funktionen ω und δund mit ω ( a) = f 0 ( a) und δ( a) = g0 ( a). Dann gilt: f ( x ) · g( x ) = f ( a) g( a) + ( f ( a)δ( x ) + ω ( x ) g( a) + ω ( x )δ( x )( Also ist f ( x ) · g( x ) = f ( a) g( a) + κ ( x )( x − a) mit κ ( x ) := f ( a)δ( x ) + ω ( x ) g( a) + ω ( x )δ( x )( x − a), welches als Kompositum von stetigen Funktionen stetig in a ist und κ ( a) = f ( a) g0 ( a) + f 0 ( a) g( a). Satz (Kettenregel): Sei g in a ∈ I1 differenzierbar und f in g( a) ∈ I2 differenzierbar (I1,2 offene Intervalle, g( I1 ) ⊂ g( I2 )), so gilt f ◦ g ist in a differenzierbar und ( f ◦ g)0 ( a) = f 0 ( g( a)) · g0 ( a) Grund: Da g in a differenzierbar ist, gibt es ϕ, mit g( x ) − g( a) = ϕ( x )( x − a) und ϕ( a) = g0 ( a). Sei b := g( a). Dann ist f ( x ) − f (b) = ψ( x )( x − b) und ψ(b) = f 0 (b) = f 0 ( g( a)). Daher gilt: f ( g( x )) − f ( g( a)) = ψ( g( x ))( g( x ) − g( a)) = ψ( g( x )) ϕ( x )( Dabei ist ψ( g( x )) ϕ( x ) stetig für x = a (siehe Ergänzungen) und der Wert an der Stelle a ist f 0 ( g( a)) g0 ( a). Anwendung: Ist f eine Funktion mit Umkehrfunktion f −1 , so folgt mit der Kettenregel aus f ( f −1 ( x )) = x die Formel für die Ableitung der Umkehrfunktion: f 0 ( f −1 ( x )) · ( f −1 )0 ( x ) = 1 Also ( f −1 ) 0 ( x ) = 1 f 0 ( f −1 ( x )) Also ist die Funktion e x ihre eigene Stammfunktion. Anwendung: Quotientenregel: Ist f ( x ) in a differenzierbar und f ( a) 6= 0, so folgt mit der Kettenregel 0 1 1 ( a) = − · f 0 ( a) f f ( a )2 Mit Hilfe der Produktregel erhalten wir 0 0 0 f 1 1 ( a) = f · ( a) = f 0 ( a) g( a) + f ( a) ( a) = f 0 g g g = f 0 ( a) g( a) − f ( a) g0 ( a) g ( a )2 Beispiel: Zu f ( x ) = ln( x ) ist f −1 ( x ) = e x die Umkehrfunktion. Daher gilt: (e x )0 = 1 1 ex = ex 1.11 Jenseits der Polynome 1.11.1 Grundlegende Eigenschaften Bemerkung: Wir hatten gesehen, daß Flächenfunktionen von streng monotonen Funktionen ohne Sprungstellen Stam funktionen sind. In diesem Abschnitt wollen wir uns mit der Umkehrung beschäftigen. Erinnerung: i) Für ε > 0 gilt: | x − a| < ε ⇔ x ∈ ( a − ε, a + ε) 2) f : [ a, b] → R ist ohne Sprungpunkt, wenn es zu jedem ε > 0 ein δ > 0 gibt, so daß gilt: | x − y| < δ ⇒ | f ( x ) − f (y)| Bemerkung: Ist f : [ a, b] → R ohne Sprungpunkte (oSP), so ist f stetig in jedem c ∈ [ a, b] Grund: Sei c ∈ [ a, b] dann gibt es zu jedem e > 0 ein δ > 0, mit | a − x | < δ ⇒ | f ( x ) − f ( a)| < e. Das ist aber die Definition der Stetigkeit im Punkt c. Lemma: Ist f : [ a, b] → R ↑,oSP . Dann gilt: Ist f (c) > 0 für ein c ∈ [ a, b] dann ist auch f (c1 ) > 0 für c1 ∈ [ a, b] nahe bei c f (c) Grund: Wir wählen ε = 2 . Dann gibt es δ > 0, mit | f ( x ) − f (c)| < f (c) 2 für x ∈ (c − δ, c + δ), also 0 < f (c) − f (c) f (c) = < f (x) 2 2 Zwischenwertsatz: Sei f : [ a, b] → [ f ( a), f (b)] eine streng monoton steigende Funktion ohne Sprungstellen. Dann gibt es zu u ∈ [ f ( a), f (b)] ein x0 ∈ [ a, b], mit f ( x0 ) = u. Genauer: Ist f ( a) < u < f (b), so gibt es ein x0 , mit a < x0 < b und f ( x0 ) = u. Grund: 1.) Ist u = f ( a), f (b) so ist x0 = a, b. 2) Sei u ∈ ( f ( a), f (b)), Wir betrachten S := { x ∈ [ a, b] | f ( x ) ≤ u} Die Menge ist nicht leer, da a ∈ S (Wegen der Monotonie ist f ( a) der kleinste Wert von f ). Außerdem ist die Menge durch b nach oben beschränkt. Also existiert nach dem Supremumsaxiom c := sup S Wir behaupten f (c) = u. Wäre nämlich f (c) < u, so gälte u − f (c) > 0. Da f keine Sprungstellen hat, gilt aber für ein beliebiges ε > 0: | f ( x ) − f (c)| < ε für x nahe bei c. Speziell also für ε = u − f (c): | f ( x ) − f (c)| < u − f (c) Dies bedeutet aber: ( f ( x ) − (u − f ( x )) <) f ( x ) < u − f (c) + f (c) = u für x nahe bei und rechts von c. Das bedeutet aber, daß c keine obere Schranke von S ist. Wäre andererseits f (c) > u, so gälte | f ( x ) − f (c)| < f (c) − u für x nahe bei (und links von) c. Dies bedeutet: f (c) − ( f (c) − u) = u < f ( x ) Speziell gibt es also ein c1 , mit c1 < c und für alle x ∈ S gilt: f ( x ) ≤ u < f ( c1 ) Wegen der Monotonie ist c1 obere Schranke von S mit c1 < c, womit c nicht die kleinste obere Schranke wäre. Die Ergänzung folgt, da das Minimum f ( a) nur an der Stelle a und das Maximum f (b) nur an der Stelle b angenommen wird. Satz: Sei f : [ a, b] → R streng monoton und stetig. Ist F : [ a, b] → R eine Stammfunktion von f (d.h. F 0 = f auf ( a, b) und ist F stetig in a und b , so ist F eine Flächenfunktion für f . Grund: Wir müssen zeigen: Für alle a ≤ x < y ≤ b gilt: (y − x ) f ( x ) < F (y) − F ( x ) < (y − x ) f (y) oder äquivalent dazu: f (x) < F (y) − F ( x ) < f (y) y−x Da nun f aber keine Sprungstellen hat, wir jeder beliebige Wert zwischen f ( x ) und f (y) angenommen, insbesondere der Wert F (y) − F ( x ) = f (c) y−x für ein c mit x < c < y. Wegen der Monotonie von f gilt aber f ( x ) < f (c) < f (y) und damit also f (x) < F (y) − F ( x ) < f (y) y−x Damit folgt für diese Funktionen der Haupsatz der Differen und Integralrechnung: Satz:Ist F eine Stammfunktion von f auf [ a, b], dann gilt ˆ b a f ( x )dx = F (b) − F ( a) Grund: Für Flächenfunktionen hatten wir das bereits gesehen. Nun sind aber in der hiesigen Situation Stammfunktionen auch Flächenfunktionen. Außerdem zeigt die obige Überlegung den Mittelwertsatz der Integralrechnung: Satz: Ist a < b, so gilt ˆ b a f ( x )dx = f (c)(b − a) für ein c, mit a < c < b. Grund: Es ist f (c) = ˆ F (b)− F ( a) b− a b a f ( x )dx = F (b) − F ( a) = für ein c ∈ ( a, b). Also ist F (b) − F ( a) (b − a) = f (c)(b − b−a Hieraus wiederum erhalten wir den Mittelwertsatz der Differentialrechnung: Satz:Ist f differenzierbar, so ist f eine Stammfunktion vom f 0 und wir haben ˆ f (b) − f ( a) = b a f 0 ( x )dx = f 0 (c)(b − a) für ein c, mit a < c < b. bf Bemerkung: Da das Bilden der Stammfunktion die Umkehrung der Ableitung ist, gelten auch weiterhin die Rechenregeln für Integrale, die sich ja aus den Rechenregeln für Ableitungen herleiten. 1.11.2 Die Ableitungen und Stammfunktionen der trigonometrischen Funktionen Erinnerung: Ist F die Fläche des Kreissektors ( D, 0, A) so ist der Winkel α definiert als: α = 2·F Daher gilt wegen der Flächenformel für Dreiecke: 1 1 1 sin(α) cos(α) + (1 − cos(α)) sin(α) < F < tan(α) 2 2 2 und daher sin(α) < α < tan(α) Bemerkung: Der Kosinus ist im Intervall [0, π2 ] streng monoton fallend, da ein Punkt, der eine größere Fläche als den Kreissektor ( D, 0, A) einschließt, auf dem Einheitskreis links (und oberhalb) des Punktes A liegen muß. Außerdem ist das Bild des Kosinus das gesamte Intervall [0, 1], √ da zu jedem x ∈ [0, 1] der Punkt ( x, 1 − x2 ) auf dem Einheitskreis liegt. Insbesondere hat also der Kosinus auf [0, π2 ] keine Sprungstellen. Erinnerung (Die Additionstheoreme): sin( x + y) = sin( x ) cos(y) + cos( x ) sin(y) cos( x + y) = cos( x ) cos(y) − sin( x ) sin(y) Aus dem ersten Additionstheorem erhalten wir mit −y statt y sin( x − y) = sin( x ) cos(y) − cos( x ) sin(y) Subtraktion der beiden Gleichungen liefert: sin( x + y) − sin( x − y) = 2 cos( x ) sin(y) Daraus ergibt sich mit a := x + y, b := x − y (also x = a+b a−b 2 , y = 2 ): sin( a) − sin(b) = 2 cos a+b 2 sin a−b 2 Bemerkung: Auf analoge Weise erhält man a+b a−b cos( a) + cos(b) = 2 cos cos 2 2 Wählen wir nun x und y im Intervall [0, π2 ] mit x < y und h := y − x > 0, so ist 2x + h sin(y) − sin( x ) = sin( x + h) − sin( x ) = 2 cos sin 2 π Da der Kosinus im Intervall [0, 2 ] streng monoton fallend ist , gilt cos x + h 2 < cos( x ), und die Abschätzung am Anfang des Kapitels ergibt sin 2h < 2h . Insgesamt haben wir also: sin( x + h) − sin( x ) < cos( x )(y − x ) sin( x ) Umgekehrt folgt aus x < tan( x ) = cos( x) wegen cos( x ) > 0 auf [0, π2 ): x cos( x ) < sin( x ) und damit: h h h h 2 sin > 2 · cos = h · cos 2 2 2 2 Schließlich haben wir: h h h 1 h sin > h · cos · cos x + = h· 2 cos x + 2 2 2 2 2 > h· 1 · [2 · cos( x + h)] = (y − x ) cos(y) 2 Dabei folgt die letzte Ungleichung aus der Monotonie des Kosinus: cos( x ) > cos( x + h). Insgesamt haben wir also: (y − x ) · cos(y) < sin(y) − sin( x ) < (y − x ) · cos( x ) Also ist sin( x ) die Flächenfunktion von cos( x ). Da, wie wir gesehen haben für stetige Funktionen Stammfunktionen und Flächenfunktionen identische Begriffe sind, gilt: sin( x )0 = cos( x ) auf (0, π2 ) Hiermit erhalten wir aus der Beziehung cos( x )2 + sin( x )2 = 1 mit Hilfe der Produktregel: 2 · cos( x ) · cos( x )0 + 2 · sin( x ) · cos( x ) = 0 und die Ableitung des Kosinus (für cos( x ) 6= 0, also x 6= π 2 ) als cos( x )0 = − sin( x ) Bemerkung: Wir werden im nächsten Abschnitt sehen, daß die Gleichung auch für x = 0, π2 gilt. 1.11.3 Potenzreihenentwicklungen von Funktionen Motivation: Für ein Polynom f ( x ) = ∑nk=0 ak x k gilt f (0) = a0 und wegen f 0 ( x ) = ∑nk=1 kak x k−1 ist f 0 (0) = 1 · a1 und allgemein liefert f ( j) ( x ) = ∑nk= j k (k − 1) · . . . · (k − j + 1) ak x k− j , daß f ( j) (0) = j!a j oder ak = f ( k ) (0) ∑nk=0 k! x k . f ( k ) (0) k! . Also ist f (x) = In diesem Abschnitt stellen wir uns der Frage, ob etwas ähnliches auch für beliebige Funktionen durchführbar ist. Definition: Ein Ausdruck der Form ∞ ∑ ak x k k =0 heißt McLaurin Reihe oder Potenzreihe. Wir wollen untersuchen inwieweit sich von uns bisher untersuchten Funktionen als Potenzreihe darstellen lassen. Beispiel: Sei f ( x ) = 1−1 x für x 6= 1. Dann ist 1 x 1 −1 = =x 1−x 1−x 1−x Also ist: 1 = 1+x 1−x 1 1−x 1 = 1+x 1 + x = 1 + x + x2 1−x Allgemein gilt also für beliebiges n ∈ N0 : n −1 1 = ∑ xk + xn 1−x k =0 1 1−x Man könnte nun versucht sein anzunehmen, daß ∞ 1 = ∑ xk 1−x k =0 für alle x ∈ R gilt. Aber z.B. für x = 2 gilt f ( x ) = −1 und k ∑∞ k =0 2 ist sicherlich kein endlicher Wert. Man muß sich also noch überzeugen, daß der Fehler Rn ( x ) := n −1 xn 1 − ∑ xk = 1 − x k =0 1−x für genügend große n beliebig klein wird. In unserem Bei| x |n spiel wird für | x | < 1 der Ausdruck | Rn ( x )| = 1− x beliebig klein. Wir haben also insgesamt: ∞ 1 = ∑ x k für | x | < 1 1−x k =0 Beispiel: Es ist ∞ 1.1̄ = ∑ k =0 1 10 k = 1 10 = 1 − 10 9 Beispiel: ln Aus n −1 1 tn = ∑ tk + 1−t 1−t k =0 folgt: ˆ ln(1 − x ) = = x 1 1 dt = 1−t n −1 ∑ k =0 ˆ x n −1 ∑t ˆ k dt + 1 k =0 x k +1 + 1 + k+1 ˆ 1 x 1 x tn dt 1−t tn dt 1−t Wegen der strengen Monotonie von tn für t ≥ 1 gilt ˆ x n ˆ x n ˆ x t x 1 dt ≤ dt = x n dt = x n · ln(1 − x ) 1 1−t 1 1−t 1 1−t Wie im obigen Beispiel wird | x n · ln( x )| beliebig klein für genügend große n, wenn | x | < 1 ist. Analoges gilt für 0 < x < 1. Das ergibt insgesamt: ∞ ln(1 − x ) = ∑ k =1 xk für | x | < 1 k Beispiel: e-Funktion: Sei x ∈ R6=0 fest. Wir betrachten ˆ 1 En := 0 tn e− xt dt Partielle Integration liefert für n > 0 ˆ 0 1 1 n tn e− xt dt = −tn e− xt |10 + x x also En = −e− x bzw. oder ˆ 1 tn−1 e− xt dt 0 n 1 + En−1 x x xEn = −e− x + nEn−1 x n e x En−1 xn x n+1 e x En = + ( n − 1) ! n! n! ´1 Direkte Integration von E0 = 0 e− xt dt liefert − 1x e− xt |10 = − 1x e− x + 1x . also; xe x E0 + 1 = e x Wir erhalten insgesamt ex = 1 + x1 e x E1−1 x1 x2 e x E2 = 1+ + (1 − 1) ! 1! 2! Setzt man das fort, so erhalten wir ex = n ∑ k =0 xk x n+1 e x En + k! n! x n+1 e x En . n! n − Funktion t e xt Wir definieren Rn := Sicher sind die auf dem Intervall [0, 1] beschränkt: Für x > 0 ist tn ↑ und e− xt ↓, also ist tn durch 1 ´1 begrenzt, e− xt durch e. Für positive x gilt also 0 tn e− xt dt ≤ e. Ist x < 0, so ist e− xt streng monoton steigend und somit durch e− x begrenzt. Halten wir nun x fest und lassen n gegen unendlich gehen, so sehen wir, daß n x k x e − ∑ <ε k! k =0 für jedes e > 0 und genügend großes n. Fazit: ∞ xk für alle x ∈ R ex = ∑ k! k =0 denn für x = 0 ist diese Gleichung mit der Konvention 00 = 1 trivialerweise richtig. Spezialfall: e = e1 = ∞ 1 = 2.718281828459 . . . k! k =0 ∑ Taylorentwiclung von sin und cos: Sei zunächst einmal x 6= 0. Wir betrachten ˆ 1 ˆ 1 Sn = (1 − t)n cos( xt)dt und Cn = (1 − t)n sin( xt)dt 0 0 Partielle Integration liefert für n ≥ 1: ˆ n 1 1 Sn = (1 − t)n sin( xt)|10 + (1 − t)n−1 sin( xt)dt x x 0 also xSn = nCn−1 . Direkte Integration liefert S0 = 1x sin( xt) 1 x sin( x ), also sin( x ) = xS0 . analog erhält man xCn = 1 − nSn−1 und cos( x ) = 1 − xC0 . Kombinieren wir diese beiden Formeln, so erhalten wir: xSn = nCn−1 = 1 [ n − n ( n − 1 ) S n −2 ] ⇒ x 2 S n = n − n ( n − x und xCn = 1 − nSn−1 = 1 − n · 1 · (n − 1)Cn−2 ⇒ x2 Cn = x − n x Diese beiden Gleichungen können auf die folgende Formen gebracht werden: x n −1 S n −2 x n −1 x n +1 S n = − ( n − 2) ! ( n − 1) ! n! und x n−1 Cn−2 xn x n+1 Cn = − ( n − 2) ! n! n! Damit erhalten wir: sin( x ) = xS0 = x 2 − 1 S2 − 2 x3 = x − S3 (2 − 2) ! 3! setzt man das fort, so erhält man sin( x ) = x x3 x5 x7 x2n−1 − + − + . . . + (−1)n−1 + (− 1! 3! 5! 7! (2n − 1)! Wir betrachten den Betrag des Fehlers R2n−1 ( x ) := (−1)n+1 ´1 Da S2n+1 = 0 (1 − t)2n+1 cos( xt)dt und (1 − t)2n+1 und cos( xt) beide auf dem Intervall [0, 1] nach oben durch 1 (und nach unten durch 0und -1) beschränkt sind, gilt |S2n+1 1. Ist x ∈ R, so wir gend großes n. Also gilt: | x |2n+1 |S | (2n+1)! 2n+1 ∞ sin( x ) = ∑ (−1)k k =0 beliebig klein für genü- x2k+1 für alle x ∈ R6=0 (2k + 1)! Diese Gleichung gilt aber offensichtlich auch für x = 0. Analog erhält man für den Kosinus: ∞ cos( x ) = x2k ∑ (−1)k (2k)! für alle x ∈ R k =0 Bemerkung: Offensichtlich ist die Tangente an den Sinus in 0 : 0 + 1( x − 0), der Sinushat also in 0 die Ableitung 1. Weiter ist wegen cos π2 + x = − sin( x ) hat de Kosinus im Punkt π2 die Steigung −1. Analog sieht man, daß 0 die Steigung des Kosinus in 0 ist. Man kann nun leicht überprüfen, daß für alle in diesem Kapitel behandelten Funktionen gilt: ∞ f (x) = ∑ k =0 f ( k ) (0) k x k! Wir wollen das hier nur exemplarisch für f ( x ) = 1−1 x tun. 0 Es ist (1 − x )−1 = −(1 − x )−2 · (−1) = (1−1x)2 und 0 (1 − x )−2 = −2(1 − x )−3 (−1) = (1−2x)3 und allgemein f (k) ( x ) = (1−k!x)k . Damit ist also f (k) (0) = k!, also ergibt sich die Behauptung. 1.11.4 Formale Potenzreihen und Konvergenz Erinnerung: Ein Ausdruck der Form ∞ ∑ ∞ ∑ ak ( x − a)k ak x k oder k =0 k =0 mit ak ∈ R heißt formale Potenzreihe oder unendlich langes Polynom. ∞ k k Seien a = ∑∞ k =0 ak x und b = ∑k =0 bk x zwei Potenzreihen. Wir definieren a = b :⇔ ak = bk für alle k ∈ N0 ∞ a + b := ∑ ( a k + bk ) x k k =0 und ∞ a · b := ∑ ck x k mit ck := ∑ a j bk − j j =0 k =0 sowie k ∞ λa := ∑ λak xk k =0 Wir rechnen also mit Potenzreihen im wesentlichen wie gewohnt. Bemerkung: Trotz des zuletzt gesagten können wir aber in eine formale Potenzreihe nicht mehr beliebig Einsetzen und erwarten, daß ein eindeutiger (endlicher) Wert geliefert wird. k Definition:1) Eine Potenzreihe ∑∞ k =0 ak x heißt absolut konvergent in x0 ∈ R, falls ∞ ∑ | a k x0 | k < ∞ k =0 2) Ist die obige Potenzreihe in x0 absolut konvergent, so existiert der Grenzwert der Reihe: Die Menge S := {| a0 |, | a0 | a1 x0 |, | a0 | + | a1 x0 | + | a2 x02 |, . . .} ist dann nach oben beschränkt und das Supremum ∞ ∑ |ak x0 |k := sup S k =0 existiert. Bemerkung: Leider werden eine Potenzreihe und ihr Grenz wert mit demselben Symbol bezeichnet. Daher muß dem Kontext entnommen werden, welche der beiden Bedeutungen jeweils gemeint ist. Beispiele: 1) Die geometrische Reihe ausgewertet an der 1 Stelle x0 = 10 ist absolut konvergent ∞ ∑ k =0 1 10 k = 1.111 . . . < ∞ Es ist ∞ ∑ k =0 1 10 k = 10 1 = 1 9 1 − 10 k 2) Die geometrische Reihe ∑∞ k =0 x ist absolut konvergent für | x | < 1. k Bemerkung: Ist die Potenzreihe ∑∞ k =0 ak x in x absolut konvergent, so läßt sich der Potenzreihe ein eindeutiger Wert k k zuordnen: Ist L := ∑∞ k =0 | ak x |, so ist, wegen 0 ≤ ak x + ∞ k k | ak x | ≤ 2| ak x |, 0 ≤ ∑k=0 ak + | ak | ≤ 2L. Daher ist ∞ ∞ ∞ k =0 k =0 k =0 ∑ ak x k := ∑ ak x k + | ak x k | − ∑ | ak x k | Dabei sind die beiden Potenzreihen auf der rechten Seite absolut konvergent. Bemerkung: Wir hatten bei Polynomen festgestellt, daß f (k) ( a ) f ( X ) = ∑nk=0 k! ( x − a)k (Taylorentwicklung) gilt. Ist nun nun f eine beliebige Funktion, die unendlich oft diffef (k) ( a ) k! ( x − f (k) ( a ) ∞ ∑k=0 k! ( x renzierbar ist, so kann man den Ausdruck ∑∞ k =0 a)k bilden. Die Hoffnung ist nun, daß f ( x ) = a)k gilt. Dies kann allerdings so nicht allgemein richtig sein, wie das obige Beispiel der geometrischen Reihe zeigt: k Für | x | > 1 ist 1−1 x 6= ∑∞ k =0 x . Haupsatz über formale Potenzreihen: Zu a ∈ R gibt es ein Intervall ( a − R, a + R), R ∈ [0, ∞] mit: ∞ ∑ ak (x − a)k konvergiert absolut für alle x ∈ (a − R, a + R) k =0 Über das Verhalten in den Randpunkten kann keine allgemeine Aussage gemacht werden. Wir begründen das hier nur für zwei wichtige Spezialfälle |a | Quotientenkriterium: Ist für alle k ∈ N0 | a k | < q für ein k −1 q, mit 0 ≤ q < 1, dann ist die Potenzreihe in dem Intervall ( a − 1q , a + 1q ) absolut konvergent. k Grund: Es sei die Potenzreihe ∑∞ k=0 ak x gegeben. Ist | ak | ≤ q| ak−1 | für alle k und ein 0 ≤ q < 1, so gilt; | ak | ≤ qk | a0 |. Damit gilt: ∞ ∑ k =0 | ak ( x − a)k | ≤ ∞ ∑ k =0 | a0 |qk |( x − a)k | = a0 ∞ ∑ |q · (x − a)|k k =0 Die rechte Seite ist a0 1−|q·(1x− a)| für |q( x − a)| < 1 bzw. | x − a| < 1q , also x ∈ ( a − 1q , a + 1q ). |a | Bemerkung: Es genügt, daß die Bedingung | a k | < q für k −1 alle k ≥ n0 gilt. Dann ist für b0 := an0 , . . . , bk := an0 +k ∞ n0 −1 k =0 k =0 ∑ | ak ( x − a)k | = ∑ | a k ( x − a ) k | + | x − a | n0 ∞ ∑ |bk (x − a)| k =0 Dann gilt also die obige Abschätzung für die Potenzreihe | ak | n0 ∑∞ k =0 | bk ( x − a ) |. Wird sogar | ak−1 | < ε für jedes beliebige ε > 0 ab einem nε ∈ N0 , so ist der Konvergenzradius ∞, also das Konvergenzintervall R. p Wurzelkriterium: Ist k | ak | < q für ein q, mit 0 ≤ q < 1, dann ist die Potenzreihe in dem Intervall ( a − 1q , a + 1q ) absolut konvergent. Grund: Es gilt: ∞ ∞ k =0 k =0 1 ∑ |ak (x − a)k | ≤ ∑ |q(x − a)|k = 1 − |q · (x − a)| für |q( x − a)| < 1, also | x − a| < 1q . Bemerkung: Es gilt sinngemäß die gleiche Bemerkung, wie die im Anschluß an das Quotientenkriterium. Bemerkung: 1) Achtung: Der Konvergenzradius R kann 0 sein. Pech gehabt. 2) Selbst wenn die Potenzreihe im Hauptsatz absolut konvergiert, muß kein Zusammenhang zur Funktion bestehen. Satz: Eine Potenzreihe ist in jedem Punkt, in dem sie absolut konvergiert, differenzierbar. Das Konvergenzintervall der abgeleiteten Potenzreihe ist identisch mit dem Intervall der Potenzreihe. k Grund: Sei f ( x ) := ∑∞ k =0 a k x . ∞ f (x) = ∑ k =0 ∞ = ∑ k =0 k ak (( x − a) + a)k = ak a + ∞ ∑ ! kak a k −1 k =0 ∞ ∑ k =0 k ak k ∑ l ( x − a )l ak−l l =0 ∞ k k ∑ l ( x − a)l ak− k =0 l =2 ( x − a) + ∑ k −1 ka a Wie bei Polynomen ist die Tangente f ( a) + ∑∞ k k =0 k −1 . Ist nun | a | < q | a a), also f 0 ( a) = ∑∞ k k −1 |, so gilt k =0 kak a mit dem Quotientenkriterium für die Reihe ∑∞ k =0 kak ( x − k | ak || x − a|k−1 (k−1)| ak−1 || x − a|k−2 = (kk|−ak1||)|xa−a| | < q| x − a| k−k 1 . Der k −1 letzte Ausdruck wird < 1 für alle k, genau dann wenn | x − a| < 1q . a ) k −1 : Bemerkung: Formal gibt es also zu jedem Punkt eine Tangente, allerdings macht es wenig Sinn von der Steigung einer Funktion zu sprechen, die an dieser Stelle gar nicht definiert ist. k Folgerung: Sei f ( x ) = ∑∞ k =0 ak x für | x | < r. Wir definieren ∞ a k k +1 G ( x ) := ∑ x k+1 k =0 Dann hat G ( x ) dasselbe Konvergenzintervall wie f ( x ) und G ist auf diesem Intervall eine Stammfunktion von f , also G 0 ( x ) = f ( x ) für | x | < r. Grund: G hat irgendein Konvergenzintervall. Nach obigem Satz hat f dasselbe Konvergenzintervall und G 0 ( x ) = f ( x ). Satz (Taylorentwicklung): Ist f : I ⊂ R → R eine unendlich oft differenzierbare und a ∈ I, so lautet die Potenzreihenentwicklung von f in a: ∞ f (x) = ∑ k =0 f (k) ( a ) ( x − a)k k! k Grund: Sei f ( x ) = ∑∞ k =0 ak ( x − a ) für | x | < r. Dann ist ∞ 0 f ( a) = a0 . Es ist f ( x ) = ∑k=1 kak ( x − a)k−1 für | x | < k −2 also r, also f 0 ( a) = a1 und f 00 ( x ) = ∑∞ k =2 k ( k − 1 ) a k x f 00 ( a) = 2 · 1 · a2 und allgemein f (k) ( a) = k!ak oder eben ak = f (k) ( a ) k! Beispiel: 1) Für die geometrische Reihe gilt: ∞ 1 = ∑ x k für alle x mit | x | < 1 1−x k =0 k Wegen ln(1 − x )0 = − 1−1 x = ∑∞ k =0 x für | x | < 1 gilt: ∞ ln(1 − x ) = − ∞ 1 xk x k +1 = − ∑ für | x | < 1 k+1 k k =0 k =1 ∑ bzw. ∞ ln(1 + x ) = ∑ (−1)k+1 k =1 xk x2 x3 x4 = x − + − ± . . . für | x | k 2 3 4 2) Wegen (e x )0 = e x gilt für a = 0 : ex = ∞ xk e0 ( x − 0) k = ∑ für alle x ∈ R k! k! k =0 k =0 ∞ ∑ 3) Wegen sin( x )0 = cos( x ), sin( x )(2) = − sin( x ), sin( x )(3) = − cos( x ) und sin( x )(4) = sin( x ) gilt mit a = 0 : ∞ sin( x ) = ∞ sin( x )(k) (0) x2k ( x − 0)k = ∑ (−1)k k! (2k!) k =0 k =0 ∑ Genauso erhält man ∞ cos( x ) = x2k+1 ∑ (−1)k (2k + 1)! k =0 beides gilt für alle x ∈ R. 4) Es ist ∞ ∞ 1 1 2 k = = (− x ) = (−1)k x2k für | x | < ∑ ∑ 1 + x2 1 − (− x2 ) k =0 k =0 Nun ist arctan( x )0 = 1 , 1+ x 2 sin( x ) cos( x ) cos( x )2 +sin( x )2 = cos( x )2 denn tan( x ) = und mit der Quotientenregel ist tan( x ) = 1 + tan( x ) Mit der Formel für die Ableitung der Umkehrfunktion er1 2 k = ∑∞ gibt sich: arctan( x )0 = 1+1x2 = 1−(− k =0 (− x ) = x2 ) k 2k ∑∞ k =0 (−1) x für | x | < 1. Termweise Integration liefert: ∞ arctan( x ) = x2k+1 ∑ (−1)k 2k + 1 für |x| < 1 k =0 5) Es ist arctan(1) = π 4 also gilt: ∞ π 1 1 1 (−1)k = ∑ = 1− + − ±... 4 2k + 1 3 5 7 k =0 1.12 Anhang A: Eigenschaften von streng monotonen Funktionen Beispiele: i) Sei m ∈ R.Der Graph der Funktion f : R → R, x 7→ m · x ist eine Gerade durch (0, 0). Die Funktion ist genau dann bijektiv, wenn m 6= 0. Grund: Ist x1 < x2 , so gilt f ( x1 ) = m · x1 und f ( x2 ) = m · x2 . Nun gilt aber für m > 0 : x1 < x2 ⇒ m · x1 < m · x2 bzw. für m < 0 : x1 < x2 ⇒ m · x1 > m · x2 . y Surjektivität: Ist y ∈ R, so definieren wir x := m . Damit ist f (y) = m mx = x. √ ii) Die Funktion f : R≥0 → R≥0 , x 7→ x ist streng mono√ √ ton steigend: Ist 0 ≤ x1 < x2 , so folgte aus x1 ≥ x2 ≥ 0 √ 2 √ 2 sofort x1 = x1 ≥ x2 = x2 . Die Funktion ist surjektiv, da jedes Element von R≥0 eine Wurzel besitzt. √ iii) Die Funktion f : [0, 1] → [0, 1], x 7→ 1 − x2 ist streng monoton fallend und bijektiv. Satz: Ist f : I → I 0 eine streng monotone und bijektive Funktion, so existiert die Umkehrabbildung f −1 : I 0 → I, f −1 (y) = x ⇔ y = f ( x ) und f −1 ist wieder streng monoton und bijektiv. Grund: Seien y1 , y2 ∈ I 0 , mit y1 < y2 . OE sei f streng monoton steigend. Da f surjektiv ist, gibt es x1 , x2 ∈ I, mit y1 = f ( x1 ), y2 = f ( x2 ). Wäre x1 ≥ x2 , so folgte mit der Monotonie von f : y1 = f ( x1 ) ≥ f ( x2 ) = y2 . Damit ist f −1 streng monoton steigend und somit injektiv. Für x ∈ I betrachten wir y = f ( x ), also x = f −1 (y), also ist f −1 surjektiv. Lemma: Ein streng monotone Funktion f : [ a, b] → R ist beschränkt. Grund: Für alle x ∈ [ a, b] gilt a ≤ x ≤ b ⇒ f ( a) ≤ f ( x ) ≤ f (b) Ist K ein angeordneter Körper und f : D → W, mit D, W ⊂ K, so heißt Bemerkung: Ist K ein angeordneter Körper, und f : D → W, mit D, W ⊂ K, so heißt f streng monoton, falls gilt: x1 < x2 ⇒ f ( x1 ) < f ( x2 ) (streng monoton steigend) bzw. x1 < x2 ⇒ f ( x1 ) > f ( x2 ) (streng monoton fallend). Eine streng monotone Funktion ist injektiv (x1 < x2 ⇒ f ( x1 ) 6= f ( x2 ) in beiden Fällen). Die Umkehrung gilt nicht. Beispiel: y 1 y 0, 5 1 x 0, 5 1 x 1 1, 5 −0, 5 −0, 5 −1 bijektiv, nicht streng monoton injektiv), nicht surjektiv. −1 streng monoton (also Bemerkung: Beide Beispiele oben haben einen „Sprungpunkt”, d.h., daß ein komplettes Intervall im Zielbereich fehlt. wir wollen daß präzisieren. Definition: Sei f : [a,b] → R eine streng monotone Funktion. Dann hat f in [ a, b] keinen Sprungpunkt, falls es zu jedem ε > 0 ein δ > 0 gibt, so daß | x − y| < δ ⇒ | f ( x ) − f (y)| < e gilt. Diese Eigenschaft von f nennt man auch gleichmäßige Stetigkeit. Lemma: Gilt für zwei nicht leere Mengen S1 , S2 : jedes Element von S1 ist kleiner als jedes Element von S2 , so gilt: sup inf S2 . Grund: Jedes Element von S2 ist obere Schranke von S1 und jedes Element von S1 ist untere Schranke von S2 . Das obige Supremum und Infimum existieren also. Wir nehmen an: sup S1 > inf S2 . Dann gibt es ein x0 , mit sup S1 > x0 > inf S2 . x0 ist also keine obere Schranke für S1 und keine untere Schranke für S2 . Also gibt es Punkte x1 ∈ S1 und x2 ∈ S2 , mit: x1 > x0 und x2 < x0 , also x2 < x0 < x1 , was aber nicht sein kann. Folgerung: Eine streng monoton steigende Funktion f : [ a, b] → R ohne Sprungpunkte ist bijektiv. Grund: Als streng monotone Funktion auf dem Intervall [ a, b] ist f injektiv. Sei nun ein y ∈ [ f ( a), f (b)], mit y ∈ / Bild( f ). Wir betrachten nun die Mengen Uy = { f ( x )| f ( x ) < y}, Oy = { f ( x )| f ( x ) > y} und Ux = { x | f ( x ) < y}, Ox = { x | f ( x ) > y} . Sicher gilt für x1 ∈ Ux und x2 ∈ Ox : f ( x1 ) < y < f ( x2 ) woraus wegen der strengen Monotonie x1 < x2 folgt. Weiter gilt Uy < Oy . Damit haben wir sup Ux ≤ inf Ox . Wäre sup Ux < inf Ox , so gäbe es x0 , mit sup Ux < x0 < inf Ox . Da f aber eine Funktion ist, muß f ( x0 ) existieren. Für x0 gilt nun f ( x0 ) < y oder f ( x0 ) > y, d.h. x0 ∈ Ux oder x0 ∈ Ux . Zwischen sup Ux und inf Ox liegen aber keine Punkte von Ux oder Ox : Punkte aus Ux sind kleiner oder gleich sup Ux und Punkte aus Ox sind größer oder gleich inf Ox . Fazit: sup Ux = inf Ox =: x0 Sicher ist sup Uy ≤ f ( x0 ) ≤ inf Oy (Wäre z.B. f ( x0 ) < sup Uy , So wäre f ( x0 ) keine obere Schranke von Uy , es gäbe also f ( x1 ) ∈ Uy , mit f ( x1 ) ≥ f ( x0 ), also x1 ≥ x0 . Damit wäre also x1 ≥ inf Ox . Damit ist x1 keine untere Schranke für Ox und es gibt x2 ∈ Ox , mit x2 < x1 . Daher ist f ( x2 ) > y und f ( x2 ) < f ( x1 ) < y, was nicht sein kann). Ist nun sup Uy = inf Oy = f ( x0 ) = y, was wegen y ∈ / Bild f nicht sein kann. Daher ist sup Uy < inf Oy . Dann hat f aber in [ a, b] einen Sprungpunkt. Also lautet die Kontraposition: f ohne Sprungpunkte =⇒ f surjektiv. 1.13 Anhang B: Eigenschaften von Flächenfunktionen Satz: Sei f : [ a, b] → R streng monoton steigend und f ( x ) ≥ 0. Gilt für alle x, y ∈ [ a, b]: (y − x ) f ( x ) < F (y) − F ( x ) < (y − x ) f (y) und ist F ( a) = 0, so ist F eindeutig bestimmt. F heißt dann Flächenfunktion von f . Grund: Wir betrachten den folgenden Fall: Sei f : [ a, b] → R streng monoton steigend und f ( x ) ≥ 0 für alle x ∈ [ a, b] Lemma: a < c < b ∧ a < d < b ⇒ |c − d| < b − a Grund: Nehmen wir an es gäbe eine eine weitere Funktion F̄ mit F̄ ( a) = 0, die obige Ungleichungen erfüllt. Dann ist F (c) 6= F̄ (c) für ein c mit a < c ≤ b. Setze: xk := a + k · Dann ist xk − xk−1 = c−a für k = 0, 1, . . . , n n c− a n , x0 = a, xn = c. Die obigen Ungleichungen lauten: ( x k − x k −1 ) · f ( x k −1 ) < F ( x k ) − F ( x k −1 ) < ( x k − x k −1 ) · f ( x k bzw.: c−a c−a · f ( x k −1 ) < F ( x k ) − F ( x k −1 ) < · f ( xk ) n n Summation über k = 1, . . . , n liefert: n c− c − a n −1 · ∑ f ( x k ) < ∑ F ( x k ) − F ( x k −1 ) = F ( c ) − F ( a ) < n n k =0 k =1 Genauso erhält man: n c − a n −1 c− · ∑ f ( xk ) < ∑ F̄ ( xk ) − F̄ ( xk−1 ) = F̄ (c) − F̄ ( a) < n n k =0 k =1 Daher gilt nach obigem Lemma: " # n c−a c−a · ∑ f ( x k ) − f ( x k −1 ) = · [ f (c | F̄ (c) − F (c)| < n n k =1 Und daher: n< (c − a) · [ f (c) − f ( a)] | F̄ (c) − F (c)| für alle natürlichen Zahlen n. Das kann aber wegen der Archimedizität von R nicht stimmen. Bemerkung: . Ist f ( x ) streng monoton fallend und nicht negativ gelten die obigen Ungleichungen mit > statt <. Für nicht positive Funktionen ergibt sich die Gültigkeit der analogen Ungleichungen aus: f ( x ) streng monoton steigend/fallend ⇔ − f ( x ) streng monoton fallend/steigend. Satz: Flächenfunktionen wie im obigen Satz sind streng monoton steigend. Grund: Seien x1 , x2 ∈ [ a, b] und x1 < x2 und F die zu f gehörende Flächenfunktion. Dann gilt wegen der Monotonie: f ( x1 ) < f ( x2 ) und 0 < ( x2 − x1 ) f ( x1 ) < F ( x2 ) − F ( x1 ) also F ( x2 ) > F ( x1 ). bf Satz: Jede Zahl y ∈ [ F ( a), F (b)] taucht als Wert einer Fläche auf, die Flächenfunktion F : [ a, b] → [0, F (b)] ist also surjektiv. bf Grund: Sei y ∈ (0, F (b)). Wir betrachten U := { x ∈ [ a, b] | F ( x ) ≤ y} und O := { x ∈ [ a, b] | F ( x ) ≥ y}. Wegen 0 = F ( a) ≤ y ≤ b gilt a ∈ U und b ∈ O, also sind beide Mengen nicht leer. Außerdem sind U nach unten durch a und O nach oben durch b beschränkt. Es gibt also sup U und inf O. Es gilt sup U ≤ inf O, denn jedes Element aus O ist obere Schranke von U: Ist x ∈ U, also F ( x ) ≤ y ≤ F (s) für alle s ∈ O. Wegen der Monotonie von F ist also x ≤ s für alle s ∈ O. Genauso sind alle Elemente von U untere Schranken von O. Da F aber Flächenfunktion einer Funktion f ist, gilt für alle u ∈ U und o ∈ O: F (u) ≤ y ≤ F (o ) und f ( a)(o − u) < f (u)(o − u) < F (o ) − F (u) < f (o )(o − u) < 2 Ergänzungen 2.0.1 E: Das Nim Spiel Es gibt n Haufen von Streichhölzern mit den Anzahlen x1 , . . . , xn . Der Spieler, der am Zug ist darf beliebig viele (aber mindestens eins) Streichhölzer aus einem (und nur einem Haufen) wegnehmen. Derjenige, der das letzte Streichholz nimmt hat gewonnen. Definition: Die Nimsumme zweier Zahlen x, y ∈ N0 ist wie folgt definiert: Seien x = ∑in=0 ai · 2i und x = ∑in=0 bi · 2i , ai , bi ∈ {0, 1} die Binärentwicklungen der beiden Zahlen (die kürzere mit führenden Nullen aufgefüllt, so daß beide gleich lang sind). Wir definieren die folgende Verknüpfung von Nullen und Einsen: ⊕ 0 1 0 0 1 1 1 0 und x ⊕ y := ∑in=1 ( ai ⊕ bi ) · 2i . Dezimal Binär 5 5 101 Beispiel: 7 7 111 5⊕7 2 010 Satz (Eigenschaften von ⊕): Seien x, y, z natürliche Zahlen (inklusive Null), und n x= ∑ a i · 2i , i =0 n y= ∑ bi · 2 i , i =0 n z= ∑ c i · 2i i =0 die Binärentwicklungen. Definition: Für x und y in der Binärentwicklung heißt n x ⊕ y := mit + 0 1 0 0 1 ∑ ( a i + bi ) 2 i i =0 1 1 die Nimsumme von x und y. 0 1) x ⊕ y = ∑in=0 ( ai + bi ) · 2i = ∑in=0 (bi + ai ) · 2i = y ⊕ x (⊕ ist kommutativ) 2)( x ⊕ y) ⊕ z = ∑in=0 [( ai + bi ) + ci ] · 2i = ∑in=0 [ ai + (bi + ci )] · 2i = x ⊕ (y ⊕ z) (⊕ ist assoziativ) 3) x ⊕ x = ∑in=0 ( ai ⊕ ai ) · 2i = ∑in=0 0 · 2i = 0 3) 0 ist Neutralelement: 0 ⊕ x = ∑in=0 (0 + ai ) · 2i = x Seien nun x1, , . . . , xn die Anzahlen vor dem Zug und y1 , . . . , die Anzahlen nach dem Zug. Weiter seien s = x1 ⊕ . . . ⊕ x n und t = y1 ⊕ . . . ⊕ y n die Nimsummen der Anzahlen. Wenn der Zug im Haufen k erfolgt ist, gilt: t = 0⊕t = s⊕s⊕t = s ⊕ ( x1 ⊕ . . . ⊕ x n ) ⊕ ( y1 ⊕ . . . ⊕ y n ) = s ⊕ ( x1 ⊕ y1 ) ⊕ . . . ⊕ ( x n ⊕ y n ) = s ⊕ 0 ⊕ . . . ⊕ 0 ⊕ ( xk ⊕ yk ) ⊕ 0 ⊕ . . . ⊕ 0 = s ⊕ xk ⊕ yk Also t = s ⊕ xk ⊕ yk (*). Lemma 1: Ist s = 0, so ist t 6= 0 unabhängig von der Art des Zuges Grund: t = 0 ⊕ xk ⊕ yk = xk ⊕ yk und xk 6= yk Lemma 2: Ist s 6= 0, dann gibt es einen Zug mit t = 0 Grund: Sei d die Position des höchsten Bits 6= 0 von s. Wähle k, so daß das d−te Bit von xk ebenfalls 6= 0 ist . So ein xk existiert: Wären alle d−ten Bits der xi = 0, so auch das d−te Bit der Nimsumme s. Setze: yk := s ⊕ xk (**). Da xk die Anzahl der Hölzer vor dem Zug und yk die nach dem Zug ist, muß noch sichergestellt werden, daß der Spieler yk erreichen kann. Behauptung: yk < xk Grund: Alle oberhalb der Stelle d in xk und yk sind gleich, da diese Bits der Nimsumme 0 sind. Bit d verringert sich von 1 auf 0 (das d−te Bit von xk und s ist 1, also muß das d−te Bit von yk 0 sein). Hierdurch wird die Zahl um 2d verkleinert. Die restlichen Bits machen aber maximal einen Unterschied von ∑id=−01 2i aus. Nun gilt (2 − 1)(1 + 2 + . . . + 2d−1 ) = (2 + . . . + 2d ) − (1 + 2 + . . . + 2 Daher gilt ∑id=−01 2i = 2d −1 2−1 Also gilt die Behauptung. = 2d − 1 < 2d . Der Spieler am Zuge kann also xk − yk Streichhölzer wegnehmen. Dann gilt: t = s ⊕ xk ⊕ yk (wegen (*)) = s ⊕ xk ⊕ (s ⊕ xk ) (wegen(**)) = (s ⊕ xk ) ⊕ (s ⊕ xk ) = 0 Fazit: Stellungen mit Nimsumme 0 sind für den Spieler, der an der Reihe ist, Verluststellungen. Grund: Verloren hat der Spieler, der, wenn er an der Reihe ist, ein leeres Spielfeld (Nimsumme 0) vorfindet. Sein Gegner kann in allen vorherigen Spielzügen ihm immer eine Situation mit Nimsumme 0 präsentieren, da er immer eine Nimsumme 6= 0 vorfindet. Beispiel: Das klassische Nimspiel startet mit 3 Haufen mit jeweils 3, 5 und 7 Streichhölzern Analyse des ersten Zuges: Startnimsumme 011 ⊕ 101 ⊕ 111 = 001 6= 0 2 5 7 ⊕ 3 4 7 ⊕ 3 5 6 ⊕ 010 101 111 000 011 100 111 000 011 101 110 000 1 5 7 ⊕ 3 3 7 ⊕ 3 5 5 ⊕ 001 101 111 011 011 011 111 111 011 101 101 011 0 5 7 ⊕ 3 2 7 ⊕ 3 5 4 ⊕ 000 101 111 010 011 010 111 110 011 101 010 100 3 1 7 ⊕ 3 5 3 ⊕ 011 001 111 101 011 101 011 101 3 0 7 ⊕ 3 5 2 ⊕ 011 000 111 100 011 101 010 100 3 5 1 ⊕ Für den ersten Spieler ist es also möglich, durch wegnehmen eines einzigen Streichholzes aus einem der drei Haufen, seinem Gegner eine Nimsumme 0 zu präsentieren. Der der anfängt, gewinnt also (wenn er richtig spielt). Zum praktischen Spiel ist es nützlich zu wissen, daß folgende Konstellationen Nimsumme 0 haben: zwei gleiche Reihen, 1-2-3, genau einer fehlt (unabhängig von der Reihenfolge). Sind das alle? Wir betrachten die Nimsumme von drei Zahlen: 0 b1 c1 a2 b2 c2 a3 b3 c3 In jedem Fall muß b1 = c1 sein.Ist a = 0, so muß b = c sein. Ist a = 3, so muß b1 = c1 , b2 6= c2 , b3 6= c3 . Dies lie- fert die Zahlentripel (3,3,0),(3,1,2) und (3,4,7),(3,5,6), welche unter die beschriebenen Fälle fallen. Ist a = 2, erhalten wir (2,3,1),(2,0,2),(2,7,5),(2,4,6). Ist a = 1, erhalten wir schließlich (1,1,0),(1,2,3),(1,5,4). Es fehlten also noch die Fälle (2,4,6) und (1,5,4). 2.0.2 E: Die reellen Zahlen als Dezimalzahlen Definition: Eine abbrechende Dezimalzahl ist ein Bruch der Form n 10k mit n ∈ Z und k ∈ N. Man beachte, daß die Division durch 10k nur eine Verschiebung des Dezimalpunktes (kommas) ist. Wir bezeichnen die Gesamtheit dieser Zahlen mit Da . Wir haben eine Addition und eine Multiplikation gegeben durch n2 10k2 n1 + 10k1 n2 n n2 n n2 n1 + = und 1k · k = k1 +k k k k + k 10 1 10 2 10 1 2 10 1 10 2 10 1 2 Bemerkung:i) Es gelten alle Rechengesetze eines Körpers (da sie in Q gelten). Die einzige Ausnahme ist die Existenz von multiplikativen Inversen: n −1 10k = ∈ / Da n 10k ii) Abbrechende Dezimalzahlen haben die Darstellung ± a0 .a1 a2 . . . an mit a0 ∈ N0 , a1, . . . an ∈ {0, 1, 2, . . . , 9} Bemerkung: i) Auf Da haben wir die lexikographische Ordnung (Telefonbuchordnung) für nicht negative Elemente: a0 .a1 a2 . . . an < b0 .b1 b2 . . . bm :⇔ Für ein i gilt:a0 = b0 , . . . , a Für negative Elemente a, b gilt a < b ⇔ − a > −b. ii) Ist l = ∑nk=0 ak 10k , so ist l 10 j = ∑nk=0 ak 10k− j Definition: Eine nicht abbrechende Dezimalzahl im Intervall [0, 1] ist ein Ausdruck der Form 0.a1 a2 a3 . . . mit ai ∈ {0, 1, . . . , 9}. Auf den Dezimalzahlen hat man auch die lexikographische Ordnung: 0.a1 a2 . . . ≤ 0.b1 b2 . . . :⇔ es existiert ein n ∈ N, mit a1 = b Zu jeder Dezimalzahl 0.a1 a2 . . . betrachten wir die Menge S := {0, 0.a1 , 0.a1 a2 , . . .} = {0, a1 a1 a2 , , . . .} ⊂ Q 10 100 Die Elemente dieser Menge sind nach oben durch 1 beschränkt, besitzen also nach dem Supremumsaxiom eine kleinste obere Schranke. a := sup S ist also eine reelle Zahl. Sie heißt die durch die Dezimalentwicklung beschriebene reelle Zahl. Bemerkung: Die lexikographische Ordnung stimmt mit der Ordnung von R fast überein: Beispielsweise ist 0.357 < 0.36 in beiden Ordnungen. Aber ist 0.9̄ < 1 als reelle Zahlen? Nein, denn das Supremum der Menge S = {0, 0.9, 0.99, . . .} ist gleich 1. Grund: Sei s < 1. Dann ist 1 − s > 0. Außerdem ist 1 − 0. 9| .{z . . 9} = 10−k , wird also beliebig klein. Also gilt irgendk wann 1 − s > 1 − 0. 9| .{z . . 9} = 10−k k oder s < 0. 9| .{z . . 9} k Damit kann s keine obere Schranke von S sein. Ein zweites Argument: Nach obiger Definition ist 0.3̄ eine Zahl. Wenn wir uns erlauben wie gewohnt zu rechnen gilt: 3 · 0.3̄ = 0.3̄ + 0.3̄ + 0.3̄ = 0.9̄ Nun ist aber 0.3̄ = 31 , also 3 · 0.3̄ = 3 · 1 3 =1 Folglich gilt in den reellen Zahlen 0.9̄ = 1. Ein drittes Argument: Wäre 0.9̄ < 1, so gälte 1 − 0.9̄ > 0, also insbesondere 6= 0. In einem Körper haben aber Elemente 6= 0 ein multiplikatives Inverses, d.h. 1−10.9̄ . Die zugehörige Menge S = {0, 10, 100, 1000, . . .} ist aber unbeschränkt, kann also keine reelle Zahl als Supremum haben. Wir werden also von nun an die Zahlen 0.49̄ und 0.5 (und ähnlich gelagerte Fälle) miteinander identifizieren. Darüber hinaus lassen wir bei Zahlen, die in lauter Nullen enden diese einfach weg, also 0.50̄ = 0.5. Daß wir nun für ein und dieselbe Zahl verschiedene Symbole haben, sollte uns nicht stören (schließlich ist ja auch 12 = 42 ). Fazit: 1 2 = = 0.50̄ = 0.5 = 0.49̄ 2 4 Eine beliebige reelle Zahl als Dezimalzahl erhalten wir durc natürliche Zahl+Dezimalzahl zwischen 0 und 1 Negative Dezimalzahlen sind dann einfach die additiven Inversen von positiven Dezimalzahlen. Definition: Eine beliebige nichtnegative Dezimalzahl ist ein Ausdruck der Form a0 + 0.a1 a2 . . . mit a0 ∈ N und a1 , a2 , . . . ∈ {0, 1, . . . , 9}. Wir ersetzen eine Dezimalzahl, die in einer unendlichen Folge von Neunen endet, also der Form a0 .a1 ....an 9̄ mit an < 9 durch die Dezimalzahl a0 .a1 a2 . . . an−1 ( an + 1)0̄. Satz: Die nicht negativen Dezimalzahlen erfüllen das Supremumsaxiom. Grund: Sei S eine nicht leere Teilmenge von Dezimalzahlen, welche nach oben beschränkt ist. Wir sammeln alle Vorkommastellen a0 ∈ N. Diese sind, da S beschränkt ist ebenfalls beschränkt. Eine nach oben beschränkte Menge von natürlichen Zahlen hat aber ein größtes Element. Dieses nennen wir b0 . Sei S0 die Menge der Dezimalzahlen in S, die mit b0 anfängt. Jede Zahl in S\S0 (also in S und nicht in S0 ) ist daher kleiner als jede Zahl in S0 . Als nächstes betrachten wir die Menge aller Dezimalzahlen mit derselben höchsten Dezimalstelle b1 und nennen diese S1 . D.h. alle Dezimalzahlen in S1 beginnen mit b0 .b1 . Wiederum ist jede Zahl in S kleiner als jede Zahl in S1 . Setzt man dies fort, so erhält man eine Sequenz von Mengen S ⊃ S0 ⊃ S1 ⊃ S2 ⊃ . . . ⊃ S n ⊃ . . . Man beachte, daß alle diese Mengen nicht leer sind und daß alle Zahlen in S\Sn kleiner kleiner als alle Zahlen in Sn sind. Der ganze Prozess beschreibt also nun die Dezimalentwicklung einer eindeutig bestimmten Zahl b = b0 .b1 b2 . . . bn bn+1 . . . (Gäbe es zwei verschiedene Zahlen b und b0 , so müßten Sichel an einer Stelle unterscheiden bn0 6= bn . Dann wäre aber eine von beiden kleiner, also im n − ten Schritt aussortiert worden). Wir zeigen nun, daß dieses b das Supremum von S ist. Zunächst einmal ist b eine obere Schranke für S: Sei a = a0 .a1 a2 . . . ∈ S. Ist a0 < b0 , so ist a < b. Ansonsten ist a0 = b0 und wir vergleichen die ersten beiden Nachkommastellen. Entweder ist a1 < b1 (und damit a < b) oder a1 = b1 und wir untersuchen die zweiten Nachkommastellen usw. Insgesamt ist also a < b oder a = b, also ist b eine obere Schranke für S. Um zu zeigen, daß b die kleinste obere Schranke von S ist, wählen wir ein t < b. Dann unterscheidet sich t an irgendeiner Stelle n von b, also t = b0 .b1 . . . bn−1 tn tn+1 . . . und tn < bn . Aber dann liegt t nicht in Sn und Sn enthält Zahlen größer als t. 2.0.2.1 Der Wert von Dezimalzahlen Wir betrachten die Dezimalzahl a = 0.a1 a2 . . . . Natürlich haben wir immer die folgende Interpretation vor Augen: ∞ a= ∑ ak · 10−k k =1 Nun ist dies eine unendliche Summe. Wie kann dadurch ein endlicher Wert definiert werden? Dazu betrachten wir allgemeiner die folgenden Ausdrücke: ∞ ∑ ak x k k =1 So etwas nennt man auch eine Potenzreihe. Offensichtlich kann man nicht erwarten, daß die für beliebige Werte von x ein endliches Ergebnis liefert. Wählen wir z.B. ak = 1 und x = 1, so erhalten wir ∑∞ k =1 1. Unendlich oft die 1 aufaddiert liefert aber sicherlich keine endliche Zahl. Erst recht natürlich nicht für x > 1. Wir müssen also für ak , x ≥ 0 fordern: ∞ ∑ ak x k < ∞ k =1 2.0.2.2 Probleme mit Dezimalzahlen Geben Sie einmal folgendes in Ihren Taschenrechner ein: √ 2 · 10−100 − 10−100 Jeder moderne Taschenrechner wird Ihnen mit ”0” antworten. Schauen wir uns mal die Konsequenzen an: √ √ 2 · 10−100 − 10−100 = ( 2 − 1) · 10−100 = 0 Division von 10−100 auf beiden Seiten liefert: √ √ 2 − 1 = 0, also 2 = 1 √ was natürlich völliger Unfug ist.√Was ist nun aber 2 ? Die beste Antwort darauf ist wohl: 2 , also die positive Zahl, die quadriert 2 ergibt. Oder noch deutlicher: die positive Nullstelle des Polynoms x2 − 2. √ Die Antwort 2 = 1.41421356 ist falsch, denn 1.414213562 = 1.999999993287874 6= 2 2.0.3 E:Kombinatorik, die Kunst des gepegten Zählens In diesem Abschnitt werden wir ausschließlich Mengen mit endlich vielen Elementen betrachten. Wir bezeichnen mit #A die Anzahl der Elemente der Menge A. 2.0.3.1 Einfache Zählformeln Satz: Für zwei Mengen A und B gilt: #( A ∪ B) = #A + #B − #( A ∩ B) Grund: Die Menge A ∪ B setzt sich aus den drei disjunkten (d.h. mit leerem Schnitt) Mengen zusammen: A\( A ∩ B), A ∩ B, B\( A ∩ B) . Es ist ; #( A ∪ B) = #( A\( A ∩ B)) + #( A ∩ B) + #( B\( A ∩ B)) = #A − #( A ∩ B) + #( A ∩ B) + #B − #( A ∩ B) = #A + #B − # Definition: i) Für zwei Mengen (auch unendlich große) M und N ist das Kreuzprodukt M × N definiert als Menge aller Paare, deren erster Eintrag ein Element aus M ist und deren zweiter Eintrag ein Element aus N ist. ii) Für Mengen M1 , . . . , Mn ist M1 × . . . × Mn := {(m1 , . . . , mn )|mi ∈ Mi füri = 1 . . . n} die Menge aller n−Tupel mit dem Eintrag an der i −ten Stelle in Mi . iii) Für eine Menge M ist Mn := M × . . . × M | {z } n−mal Beispiel: Ist A = {1, 2, 3}und B = { x, y}, so ist A × B = {(1, x ), (2, x ), (3, x ), (1, y), (2, y), (3, y)} Satz: #( A × B) = #A · #B Grund: Wählt man Element aus A an der ersten Stelle, so hat man #B viele Möglichkeiten für die zweite Stelle. Da man das für jedes Element an der ersten Stelle machen kann, hat man #A · #B viele Möglichkeiten. Satz: #( M1 × . . . × Mn ) = ∏nk=1 #Mi Beispiel: Die PIN einer EC-Karte besteht aus vier Ziffern 0 . . . 9. Es gibt also 10 · 10 · 10 · 10 = 10000 PINs. Definition:Sei B:={0,1}. Eine binäres n−Tupel ist eine Element aus Bn . Bemerkung: Binäre n−Tupel lassen sich leicht zählen. Es ist #Bn = 2n . Satz: n Objekte lassen sich auf n! viele Weisen anordnen Grund: Für die erste Position bestehen n Möglichkeiten, für die zweite n − 1 etc. Für die letzte Position besteht nur eine Möglichkeit. Insgesamt also n · (n − 1) · . . . · 1 = n! 2.0.3.2 Teilmengen Definition: Die Menge aller Teilmengen einer Menge A wird mit P ( A) bezeichnet und heißt Potenzmenge von A. bf Beispiel: Ist A = { a, b, c}, so ist P ( A) = {∅, { a}, {b}, {c} Satz: Jede n−elementige Menge hat genau 2n Teilmengen. Grund: Wir nummerieren die Elemente der Menge M beliebig: M = {m1 , m2 , . . . , mn } Sei M0 eine Teilmenge von M. Wir ordnen der Teilmenge M0 wie folgt ein binäre n−Tupel zu: (b1 , b2 , . . . , bn ) ∈ Bn mit ( bi = 1 falls mi ∈ M0 0 falls mi ∈ / M0 Umkehrt bestimmt so auch jedes binäre n−Tupel eine Teilmenge von M. Zwei binäre n−Tupel sind genau dann gleich wenn die so zugeordneten Teilmengen gleich sind. Teilmengen von M gibt es aber 2n viele. Definition: Die Anzahl der k−elementigen Teilmengen einer Menge mit n Elementen wird mit n k bezeichnet und heißt Binomialkoeffizient. Satz: n (1 + x ) = n ∑ k =0 n k xk (1 + x ) n Grund: Es ist = (1 + x )(1 + x ) · . . . · (1 + x ). Zum Ausmultiplizieren wählt man aus jedem Faktor einmal eine 1 oder ein x. Wir betrachten wieder das binäre n−Tupel (b1 , b2 , . . . , bn ) ∈ Bn mit ( 1 falls im i − ten Faktor xgewählt wurde bi = 0 falls im i − ten Faktor 1gewählt wurde Um also x k zu erhalten, muß man also genau k−mal x ausgewählt haben. Also muß das binäre n−Tupel genau k Einsen haben. Dies entspricht aber (s.o.) einer k−elementige n Teilmenge einer n−elementigen Menge. Also gibt es k viele. Allgemeiner binomischer Satz: n n k n−k ( x + y)n = ∑ x y k k =0 k Grund: Für y 6= 0 gilt yn (1 + yx )n = yn ∑nk=0 (nk) yx =∑ . Ist y = 0, so ist die Gleichung trivialerweise richtig. Satz: n! n = k (n − k)!k! Grund: Es sei M0 ⊂ M eine k−elementige Teilmenge einer n−elementigen Menge. Wir ordnen die Elemente von M0 beliebig an: M 0 = { m1 , . . . , m k } Da Elemente in einer Menge nicht mehrfach vorkommen, gibt es für m1 n Möglichkeiten, für m2 (n − 1) Möglichkeiten und schließlich für mk (n − k + 1) Möglichkeiten. Insgesamt also n · ( n − 1) · . . . · ( n − k + 1) = n! (n − k)! Da bei Mengen die Reihenfolge irrelevant ist, ergibt sich n k = n! (n−k)! k! = n! (n − k)!k! Beispiel: Beim Samstagslotto werden 6 Kugeln aus 49 gezogen. Die Kugeln werden nicht zurückgelegt, die Reihenfolge ist irrelevant. Es wird also eine 6−elementige Teilmenge aus einer 49−elementigen gezogen. Davon gibt es 49 = 13983816 6 viele. Die Wahrscheinlichkeit für sechs Richtige ist also ca. 1 zu 14 Millionen. Satz: Die Anzahl der ungeordneten Auswahlen mit Wiederholung von k Objekten aus einer Menge von n Objekten ist n+k−1 k Grund: Wir konstruieren eine eineindeutige Zuordnung (d.h. eine bijektive Abbildung) zwischen i) allen ungeordneten Auswahlen mit Wiederholung von k Objekten ii) der Menge aller binären (n + k − 1)−Tupel mit genau k Einsen Wir hatten gesehen, daß die Anzahl aller binären n−Tupel n mit genau k Einsen ist. k Die Anzahl aller binären (n+ k − 1)−Tupel mit genau k n+k−1 Einsen ist also k Nun zur Zuordnung. Es sei M = {m1 , m2 , . . . , mn }. Wir betrachten k−Tupel in Mk . In diesem k−Tupel sortieren wir die Objekte m1 nach ganz vorne, m2 dahinter usw. Zwischen die einzelnen Typen setzen wir jeweils eine 0 (gewissermaßen als Trennzeichen). Beispiel: (m1 , m1 , 0, m2 , m2 , m2 , 0, 0, m4 ) ∈ {m1 , m2 , m3 , m4 }9 Nun ersetzen wir die Objekte durch Einsen, im Beispiel ergibt sich also: (1, 1, 0, 1, 1, 1, 0, 0, 1) d.h. also Blöcke von Einsen entsprechen Objekten desselben Typs Nullen entsprechen Trennzeichen zwischen Objekten verschiedenen Typs Da man n − 1 Trennzeichen braucht um n Objekte zu trennen, hat jedes solche Tupel genau n − 1 Nullen. Da k Objekte ausgewählt werde, hat dieses Tupel genau k Einsen. Speziell handelt es sich also um ein n + k − 1−Tupel. Wir zählen also die Anzahl der n + k − 1−Tupel mit genau k Einsen. Die Ergebnisse werden häufig in der folgenden Form tabellarisch zusammengefaßt: ohne Zurücklegen mit Zurücklegen ohne Berücksichtigung der Reihenfolge n k n+k−1 k mi 2.0.4 E: Komplexe Zahlen Wir betrachten Zahlenpaare ( a, b), (c, d) ∈ R2 und definieren eine Addition und eine Multiplikation wie folgt: ( a, b) + (c, d) := ( a + c, b + d) ( a, b) · (c, d) := ( a · c − b · d, a · d + b · c) Satz: R2 mit dieser Addition und Multiplikation erfüllt alle Körperaxiome. Dabei ist (0, 0) das additive Neutralelement und (1, 0) das multiplikative Neutralelement. Das additive Inverse zu ( a, b) ist (− a,−b) und dasmultiplikative Inverse zu ( a, b) 6= (0, 0) ist a , −b a2 + b2 a2 + b2 . Definition: Den obigen Körper der komplexen Zahlen nennen wir C. Bemerkung: Wir finden die reellen Zahlen in den komplexen Zahlen wie folgt wieder: Wir betrachten die komplexen Zahlen ( a, 0) und (b, 0) mit a, b ∈ R. Dann ist mit der komplexen Addition und Multiplikation: ( a, 0) + (b, 0) = ( a + b, 0) und ( a, 0) · (b, 0) = ( a · b − 0 · 0, a · Wenn wir 1 = (1, 0) und i = (0, 1) definieren, so läßt sich jedes Paar ( a, b) eindeutig schreiben als ( a, b) = a · (1, 0) + b · (0, 1) = a · 1 + b · i = a + b · i Es ist i2 = (0, 1) · (0, 1) = (−1, 0) = −1. In dieser Schreibweise erhalten wir für die Addition und Multiplikation: a + b · i + c + d · i = a + c + (b + d) · i ( a + b · i ) · (c + d · i ) = a · c − b · d + ( a · d + b · c) · i Fazit: Wir können mit komplexen Zahlen im wesentlichen so rechnen, wie wir es gewohnt sind (unter Berücksichtigung von i2 = −1). Bemerkung: Der Körper der komplexen Zahlen kann nicht angeordnet werden. In einem angeordneten Körper gilt a2 + b2 = 0 ⇒ a = b = 0. In C gilt allerdings i2 + 12 = 0 und i, 1 6= 0. Definition: Für eine komplexe Zahl z = a + b · i ∈ C mit a, b ∈ R definieren wir die konjugiert komplexe Zahl z̄ := a − b · i, den Realteil Re(z) := a ∈√R, den Imaginärteil Im(z) := b ∈ R, den Betrag |z| := a2 + b2 Lemma : Sei z, z1 , z2 ∈ C. Dann gilt: z1 + z2 = z1 + z2 . z1 · z2 = z1 · z2 z∈R ⇔ z=z z=z Grund: Ist z1 = a + bi, z2 = c + di, so ist z1 + z2 = a + bi + c + di = a + c + (b + d)i = a + c − (b + d)i = a − bi + c − di = z1 + z2 und z1 · z2 = ( a − bi ) · (c − di ) = ac − bd − ( ad + bc)i = z1 · z2 . Die beiden restlichen Aussagen sind klar. Folgerung: Ist f ( x ) = ∑nk=0 ak · x k ein Polynom mit reellen Koeffizienten ak ∈ R und ist z ∈ C eine Nullstelle von f ( x ), also f (z) = 0, so gilt: n n n k =0 k =0 k =0 0 = f (z) = f (z) = ∑ ak · zk = ∑ ak · zk = ∑ ak · zk Also ist mit z auch z eine Nullstelle von f ( x ). Komplexe Nullstellen von reellen Polynomen treten also immer paarweise auf. Lemma: Sei z = a + b · i, z1 , z2 ∈ C. Dann gilt: √ |z| = z · z, |z1 · z2 | = |z1 | · |z2 |. |z|2 = a2 + b2 Re(z) = z+z z−z , Im(z) = 2 2i Grund: Für z = a + bi ist z · z = ( a + bi ) · ( a − bi ) = a2 + b2 √ √ und |z1 · z2 | = z1 · z2 · z1 · z2 = z1 · z1 · z2 · z2 = |z1 | · | z2 | (∗)Satz: Jedes Element von C ist ein Quadrat. Grund: √ 1.Fall: Ist z = a ∈ R, so ist (i · a)2 = a für a < 0 . √ 2 a = a für z ≥ 0, Ist z = a + b · i ∈ C, b 6= 0, mit |z| = 1 = a2 + b2 , so definieren wir: s √ a + a2 + b2 ζ := 2 s η := sgn(b) −a + √ a2 + b2 2 Dann ist = a+ ( ζ + η · i )2 = ζ 2 − η 2 + 2 · ζ · η · i r √ a2 + b2 − a + a2 + b2 b2 − + 2 · sgn(b) ·i = a+ 2 2 4 √ = a+b·i Weiter unten werden wir sehen, daß sich jede komplexe Zahl z schreiben läßt als z = r · z0 mit r ∈ R≥0 und |z0 | = 1. Dann ist aber √ ( r · (ζ + ηi ))2 = a + bi Warum diese Multiplikation? Wenn wir fordern, daß R2 mit einer Multiplikation zu einem Körper wird und |z1 · z2 | = |z1 | · |z2 | für alle z1 , z2 ∈ R2 gilt. dann erhalten wir: √ |√ 1| = |1 + 0 · i | = 12 + 02 = 1 und |i | = |0 + 1 · i | = 02 + 12 = 1 √ √ Weiter ist |1 ± i | = |1 ± 1 · i | = 12 + 12 = 2 Nun ist: i2 = a + b · i Wegen |i2 | = |i | · |i | = 1 · 1 = 1 ist a2 + b2 = 1 Wegen der Körperaxiome gilt aber: ( 1 − i ) · ( 1 + i ) = 12 − i 2 = 1 − a − b · i = ( 1 − a ) − b · i Norm bilden auf beiden Seiten liefert: √ p √ √ √ 2 · 2 = (1 − a )2 + b2 = 1 − 2 · a + a2 + b2 = 2 − 2 √ √ also 2 = 1 − a, mithin a = −1, was wiederum, wegen a2 + b2 = 1, b = 0 nach sich zieht. · e Damit haben wir folgende Multiplikationstabelle: i e e i Für die Multiplikation ergibt sich daher: ( a · e + b · i ) · ( c · e + d · i ) = a · c · e2 + a · d · e · i + b · c · i · e + b · d · i2 = ( a · c − b · d) · e + ( a · d + b · c) · i − (*) Matrizenrealisierung: Wir können komplexe Zahlen auch als 2 × 2−Matrizen darstellen: a b z = a+b·i ≈ −b a Dann ist a −b und a −b b a b a + c −d c · −d d c d c = = a+c −(b + c) ac − bd −( ad + bc) b+d a+c ad + bc ac − bd Polarkoordinaten Jede komplexe Zahl z = a + bi kann man als Punkt der Ebene betrachten. Dann hat diese Punkt den Abstand r := √ a2 + b2 = |z| zum Nullpunkt und schließt einen Winkel ϕ ∈ [0, 2π ) mit der positiven x −Achse ein. Es ist aus elemtargeometrischen Gründen: a = r · cos( ϕ) und b = r · sin( ϕ). Wir haben also insgesamt: z = |z| · (cos( ϕ) + sin( ϕ) · i ) Die Größen |z| und ϕ sind die Polarkoordinaten von z. Kurzschreibweise: ei· ϕ := cos( ϕ) + sin( ϕ) · i Additionstheoreme für sin und cos: cos(α + β) = cos(α) · cos( β) − sin(α) · sin( β) sin(α + β) = sin( β) · cos(α) + sin(α) · cos( β) Grund: Wir betrachten die folgende Konstruktion U = (cos(α + β), sin(α + β)) P = (cos(α), β α −β T = (1, 0) R = (cos(− Mit den folgenden Bezeichnungen gilt dann cos(α) =: p, sin(α) =: q cos(α + β) =: u, sin(α + β) =: v cos(− β) =: r, sin(− β) =: s p2 + q2 = 1 u2 + v2 = 1 r 2 + s2 = 1 Es gilt (Drehung um den Winkel β): 2 UT = PR 2 ⇔ ( u − 1)2 + v2 = ( p − r )2 + ( q − s )2 ⇔ u2 − 2u + 1 + v2 = p2 − 2pr + r2 + q2 − 2qs − s2 ⇔ −2u + 2 = 2 − 2pr − 2qs ⇔ u = pr + qs ⇔ cos(α + β) = cos(α) · cos( β) − sin(α) · sin( β) Die andere Beziehung erhält man aus sin(α + β) = cos Aus den Additionstheoremen erhält man: eiϕ · eiψ = (cos( ϕ) + i sin( ϕ)) · (cos(ψ) + i sin(ψ) π 2 − = cos( ϕ) · cos(ψ) − sin( ϕ) · sin(ψ) + i (cos( ϕ) · sin(ψ) + sin( = cos( ϕ + ψ) + i sin( ϕ + ψ) = ei ( ϕ+ψ) Beispiel n-te Einheitswurzeln: Sei ζ n := e 2π i n . Dann gilt: (ζ nk )n = ζ nkn = ek·2πi = cos(k2π ) + i sin(k2π ) = 1 für k = 1, . . . , n. Fundamentalsatz der Algebra: Sei f ( x ) = ∑nk=0 ak x k ein Polynom mit reellen Koeffizienten ak ∈ R. Dann läßt sich f ( x ) darstellen als: f ( x ) = ( x − λ1 ) · . . . · ( x − λk ) · ( a1 · ( x + b1 )2 + c1 ) · . . . · ( al · mit λ j ∈ R und a j , b j , c j ∈ R mit a j · c j > 0 Dabei sind λ1 , . . . , λk die reellen Nullstellen von f ( x ). Die Faktoren a j · ( x + b j )2 + c j entsprechen den Paaren konjugiert komplexer Nullstellen. Beispiel: Das Polynom f ( x ) = x3 − 1 hat offensichtlich in x = 1 eine Nullstelle. Division mit Rest liefert: x3 − 1 = ( x − 1) · ( x2 + x + 1). Dabei ist ( x2 + x + 1) = (( x + 12 )2 + 3 4) 2.0.5 E: Der Haupsatz der Mineralogie Satz: In einem Kristall gibt es nur 1,2,3,4 und 6-zählige Symmetrien. Definition: Seien ~u, ~v 6= ~0 zwei Vektoren, die nicht auf einer Geraden liegen. Die Menge G := { p · ~u + q · ~v | p, q ∈ Z} heißt Gitter. Satz:Die folgende Transformation T : R2 → R2 dreht einen Vektor ~x um den Winkel φ gegen den Uhrzeigersinn cos(φ) x − sin(φ)y T := sin(φ) x + cos(φ)y p cos(ψ) x , mit r = = r x 2 + y2 . Grund: Sei sin(ψ) y Dann ist r cos(ψ) cos(φ) cos(ψ) − sin(φ) sin(ψ) T =r r sin(ψ) sin(φ) cos(ψ) + cos(φ) sin(ψ) x y cos(φ + ψ) sin(φ + ψ) also ein Vektor mit derselben Länge r und dem Winkel φ + ψ mit der positiven x −Achse. Der ursprüngliche Vektor ist also um den Winkel φ gedreht worden. Das letzte ist nach den Additionstheoremen r Die Umkehrung hiervon ist offensichtlich die Drehung um den Winkel −φ : T −1 x y cos(−φ) x − sin(−φ)y sin(−φ) x + cos(−φ)y := = a Definition: Seien A, B 2 × 2−Matrizen, A = c e f g h a b x1 ax1 + bx2 · = c d x2 cx1 + dx2 a c b d e · g Für λ ∈ R ist λ· f h := a c b d ae + bg ce + gd | {z } ! e =A g = λa λc λb λd Die Spur eine Matrix ist definiert als: a b Spur( ) = a+d c d cos(φ − sin(φ b d a f + bh c f + dh | {z } ! f =A h ,B= Bemerkung: i) Mit der oben definierten Addition und Multiplikation mit Skalaren ist die Menge der 2 × 2−Matrizen ein Vektorraum. 1 0 2) Die Einheitsmatrix E2 := ist Neutralelement 0 1 der Matrizenmultiplikation: A · E2 = E2 · A = A für alle 2 × 2−Matrizen A. Satz: Das Matrizenprodukt ist assoziativ, d.h. für 2 × 2−Ma A, B, C gilt: A( BC ) = ( AB)C Grund: Nachrechnen Achtung: Das Matrizenprodukt ist nicht kommutativ: 1 0 1 1 1 1 = 0 2 0 1 0 2 1 0 1 1 1 0 0 2 = 1 0 2 2 Allerdings sind die Spuren gleich. Es gilt: a b e f Spur( · ) = ae + bg + c f + dh c d g h Spur( e g f h a · c b d ) = ea + f c + gb + hd Weiter gilt: a c b d Definition: d −c a c b d −b a = −1 := ad − bc 0 1 ad − bc 0 ad − bc d −c −b a − sin φ cos φ x y = d −c Mit der Matrizenschreibweise gilt: T x y = cos φ sin φ Definition Eine (Dreh)-Symmetrie eines Gitters ist eine Drehung, die Gitterpunkte wieder auf das Gitter abbildet. Es muß also für eine Symmetrie des Gitters gelten: Für alle p, q ∈ R gibt es r, s ∈ Z, mit: T ( p · ~u + q · ~v ) = r · ~u + s · ~v Speziell gelte: T (~u) = r1~u + s1~v T (~v) = r2~u + s2~v Es ist: cos φ sin φ − sin φ u1 · cos φ v1 u2 v2 = cos φ sin φ − sin φ cos φ u1 v1 cos φ sin φ − sin φ cos φ u2 v2 = ( T (~u)| T (~v)) = (r1~u + s1~v|r2~u + s2~v) = r1 u1 + s1 v1 r1 u2 + s1 v2 r2 u1 + s2 v1 r2 u2 + s2 v2 = u1 u2 v1 v2 r1 s1 r2 s2 Multiplizierenwir den ersten und den letzten Ausdruck u1 v1 von links mit , so erhalten wir: u2 v2 1 v2 − v1 cos φ − sin φ u1 v1 · − u2 u1 sin φ cos φ u2 v2 u1 v2 − v1 u2 Wir müssen allerdings noch sicherstellen, daß u1 v2 − v1 u2 6= 0 ist. Wäre u1 v2 − v1 u2 = 0 , ist im Falle v1 , u1 6= 0. v2 u = 2 v1 u1 die durch ~u und ~v beschriebenen Geraden haben dieselbe Steigung. Ist v1 = 0, so zeigt ~v parallel zur y−Achse. Dann ist aber u1 6= 0, da ~u und ~v nicht auf einer Geraden liegen. Daher folgt v2 = 0, also ~v = ~0. Eine analoge Argumentation gilt für ~u. Nun gilt: 1 v2 − v1 cos φ − sin φ u Spur · − u2 u1 sin φ cos φ u1 v2 − v1 u2 = Spur cos φ sin φ = Spur − sin φ cos φ cos φ sin φ 1 u1 v2 − v1 u2 − sin φ cos φ Aber die Spur der Matrix r1 s1 r2 s2 1 0 0 1 v2 − u2 − v1 u1 · = 2 cos φ ist r1 + s2 ∈ Z. Da gilt −1 ≤ cos φ ≤ 1 ist −2 ≤ 2 cos φ ≤ 2 Die ganzen Zahlen in diesem Bereich sind: {−2, −1, 0, 1, 2} Wir benötigen also die Winkel für cos φ ∈ {0, ± 21 , ±1}. Zum Punkt (1, 0) gibt es genau einen Punkt ( x, y). der auf dem Einheitskreis oberhalb der x −Achse liegt und vom Punkt (1, 0) den Abstand 1 hat. Diese beiden Punkte bilden, zusammen mit dem Ursprung ein gleichseitiges Dreieck der Seitenlänge 1. Also halbiert die Projektion des Punk tes auf die x −Achse das Intervall [0, 1]. Somit gilt x = cos(φ) = 21 . Der Punkt (− 12 , y) hat vom Punkt ( x, y) ebenfalls den Abstand 1. Es gilt (− 12 )2 + (y − 0)2 = x2 + y2 = 1. Wir haben also in den oberen Halbkreis drei solche Dreiecken eingeschrieben, was für den Vollkreis sechs Dreiπ ecke bedeutet. Der Winkel φ ist also 2π 6 = 3 (6-fache Symmetrie) . Eine ähnlich Konstruktion vom Punkt (−1, 0) aus liefert für cos φ = − 12 den Winkel φ = 2π 3 (3-fache Symπ metrie) . cos(φ) = 0 liefert die Winkel 2 = 2π 4 (4-fache (zu groß). cos ( φ ) = ± 1 gibt noch Symmetrie) und φ = 3π 2 die Winkel φ = 0 und φ = π (2-fache Symmetrie). 2.0.6 GPS und Verwandte 2.0.6.1 2D Die eigenen (zu ermittelnden) Koordinaten seien x und y. Zwei Signale gehen von dem Ort ( x, y) mit den Geschwindigkeiten v1 und v2 zum Zeitpunkt t1 und t2 aus. An den Orten ( x1 , y1 ) und ( x2 , y2 ) kommen Sie zu den Zeitpunkten t1 + ∆t1 und t2 + ∆t2 an. Symmetrisch dazu ist die Situation, daß die Signale von ( x1 , y1 ) und ( x2 , y2 ) ausgehen und bei ( x, y) ankommen. p Die Entfernung von ( x, y) zu ( xi , yi ) ist ( x − x2 )2 + (y − y . ( x − x1 )2 + (y − y1 )2 = (∆t1 · v1 )2 ∧ ( x − x2 )2 + (y − y2 )2 = (∆t2 · v2 )2 Dies sind also zwei Kreise in der Ebene, die sich schneiden müssen. Die Aufgabe ist es also ein Gleichungssystem der Form ( x − x1 )2 + (y − y1 )2 = b1 ∧ ( x − x2 )2 + (y − y2 )2 = b2 (∗). zu lösen. Nun ist es schwierig, ein nicht lineares Gleichungs system zu lösen (das ist Gegenstand aktueller Forschung). Glücklicherweise hat das Gleichungssystem (*) eine spezielle Gestalt, die wir ausnutzen können. Ausmultipliziert lautet es: x2 − 2xx1 + x12 + y2 − 2yy1 + y21 = b1 ∧ x2 − 2xx2 + x22 + y2 − Lemma: Ist f ( x, y) = b1 , g( x, y) = b2 ein Gleichungssystem, so hat das Gleichungssystem f ( x, y) = b1 , f ( x, y) − g( x, y) = b1 − b2 die gleiche Lösungsmenge. Grund: Sei ( a, b) eine Lösung des ersten System, dann ist auch sicher eine Lösung des zweiten Systems. Ist umgekehrt ( a, b) eine Lösung des zweiten Systems, so gilt f ( a, b) b1 und f ( a, b) − ( f ( a, b) − g( a, b)) = b1 − (b1 − g( a, b)) = g( a, b) und f ( a, b) − ( f ( a, b) − g( a, b)) = f ( a, b) − (b1 − b2 ). also ist g( a, b) = b1 − (b1 − b2 ) = b2 , womit ( a, b) auch das zweite Gleichungssystem löst. Angewandt auf das Gleichungssystem (*) bekommen wir: ( x − x1 )2 + (y − y2 )2 = b1 ∧ 2( x2 − x1 ) x + 2(y2 − y1 )y + x12 Die zweite Gleichung ist also eine Gleichung des Typs ax + by = c, also ohne höhere Potenzen von x oder y. Wir können nun diese zweite Gleichung nach y auflösen (fallsy2 − y1 6= 0), wobei wir zur Abkürzung ∆y := y2 − y1 , ∆x := x2 − x1 , ∆b = b1 − b2 = (∆t1 v1 )2 − (∆t2 v2 )2 und ∆ := x12 − x22 + y21 − y22 verwenden). Dann ist y= ∆b − ∆ ∆x −x 2∆y ∆y Wir nehmen die neuen Abkürzungen c = − ∆x ∆y , ∆b−∆ 2∆y und d = also ist y = c + dx. Einsetzen in die erste Gleichung liefert: ( x − x1 )2 + ((c + dx ) − y1 )2 = b1 also x1 2 − 2 x x1 + d2 x2 + x2 + 2 c d x − 2 y1 d x + c2 − 2 y1 c + y21 = b1 . Dies ist eine quadratische Gleichung in x, läßt sich also mit der p, q−Formel lösen: p x=− p −y1 2 + (2 d x1 + 2 c) y1 − d2 x1 2 − 2 c d x1 + b1 d2 − d2 + 1 −y1 2 + (2 d x1 + 2 c) y1 − d2 x1 2 − 2 c d x1 + b1 d2 − c d2 + 1 Das sieht kompliziert aus, läßt sich aber von einer Maschine leicht berechnen. Allgemein gilt, daß man hier zwei Lösungen bekommt. In der Praxis spielt das jedoch u.U. keine Rolle (s.u.). 1. Anwendung: Blitz und Donner Bei einem Blitz breiten sich zwei Signale nämlich Licht und Schall mit sehr unterschiedlichen Geschwindigkeiten aus. In unserem obigen Problem ist also ( x1 , y1 ) = ( x2 , y2 ). Wir wollen normalerweise auch nicht den genauen Ort des Blitzes wissen, sondern nur seine Entfernung d. Da sich in guter Näherung Lichtsignale von Blitzen unendlich schnell ausbreiten, können wir die Anzahl der Sekunden zählen, die nach dem Blitz vergehen bis der Donner zu hören ist. Der Abstand ist also d = ∆t · v, wobei v die Schallgeschwindigkeit ist. 2. Anwendung: Epizentrumsbestimmung: Ein Erdbeben schickt P− und S−Wellen aus, die sich mit unterschiedlix= chen Geschwindigkeiten v p und vS ausbreiten. Für die Koordinaten eines oberflächennahen Bebens ( x, y) muß gelten: ( x − xi )2 + (y − yi )2 = (∆t p,i · v P )2 , ( x − xi )2 + (y − yi )2 = ( Dabei sind ( xi , yi ) die Koordinaten von seismologischen Stationen und ∆t P,i und ∆tS,i die Laufzeit der P− uns S−We zu den Stationen. Das Problem hierbei ist, daß wir nur die Differenz der Laufzeiten ∆t P,i − ∆tS,i kennen (die Seismometer zeigen ja nur den Antreffzeitpunkt t0 + ∆t auf, wobei t0 der Zeitpunkt der Eruption ist), nicht aber die Laufzeiten selbst. Nun müssen aber die Wellen beim Antreffen den gleichen Weg zurückgelegt haben, also gilt: ∆t P,i · v p = ∆tS,i · vS (∗) also 1− ∆t P,i v = 1− S ∆tS,i vP Daher haben wir v ∆tS,i − ∆t P,i = ∆tS,i 1 − S vP und schließlich ∆tS,i = ∆tS,i − ∆t P,i 1 − vvPS Zwar unterscheiden sich die Geschwindigkeiten der P− uns S−Wellen weltweit erheblich, aber das Verhältnis vvPS ist sehr ähnlich und bekannt. Auf der rechten Seite der Gleichung stehen also nur bekannte Größen. Allerdings kann man bei zwei Stationen auch vS und v P direkt bestimmen: Aus den beiden Gleichungen (*) folgt: vP = ∆tS,1 − ∆tS,2 v ∆t P,1 − ∆t P,2 S Setzt man das in die erste Gleichung ein, so erhält man : ∆t −∆t vS = ∆tS,1 · vS , woraus man vS berech∆t P,1 · ∆t S,1 −∆tS,2 P,2 P,1 nen kann. Insgesamt erhalten wir: ( x − xi )2 + (y − yi )2 = (∆tS,i vS )2 Dieses Gleichungssystem läßt sich wieder wie oben lösen. Häufig wird klar sein, welche dieser beiden Lösungen die gesuchte ist, z.B. weil der zweite Punkt nicht in einem Erdbebengebiet liegt. Will man Sicherheit haben, so nimmt man eine dritte seismologische Station ( x3 , y3 ) hinzu. Man berechnet die Entfernung der beiden Lösungen zu ( x3 , y3 ) und berechnet, welche der Lösungen besser mit der beobachteten Laufzeit zu ( x3 , y3 ) übereinstimmt. 3. Anwendung: Ortsbestimmung mit Mobilfunkstationen: Zur Ortsbestimmung mit dem Handy wird das fol- gende Verfahren benutzt. Jede Funkzelle hat einen gewissen Durchmesser und eine eindeutige Kennung. Das Handy kennt also die ungefähre Entfernung zu einem Mobilfunkmasten, deren Positionen in einer Datenbank abgelegt sind. Zur genaueren Positionsangabe kann das Handy die Feldstärke und damit den Abstand zu Mobilfunkmasten messen. Das entsprechende Gleichungssystem wird (wie oben) gelöst und das Handy kann seinen Standort ermitteln. Diese Methode ist allerdings recht ungenau. In den letzten Jahren sind die Handybetreiber (und auch Apple und Google) für die Ortsbestimmung die Position von WLAN-Netzen zu bestimmen und in einer Datenbank zu speichern, was eine genauere Ortsbestimmung erlaubt (wegen der geringeren Reichweite von WLAN). 4. Anwendung: Ortsbestimmung auf der Erde und GPS: Wir machen uns zunächst einmal klar, wie man prinzipiell seine Position auf der Welt ermitteln kann. Zunächst einmal steht am Nordhimmel der Polarstern ziemlich genau im Norden. Man kann nun den Winkel zwischen Horizont und Polarstern messen. Nimmt die Entfernung des Sterns von der Erde als unendlich an (Was beim Vergleich von Erdumfang und Sternentfernung eine ziemlich gute Näherung darstellt). So würde der Polarstern vom Äquator aus gesehen genau am Horizont sein und vom Nordpol aus gesehen im Zenit. Die geographische Breite ist also gleich diesem Winkel. Die geographische Länge ist schwieriger zu bestimmen. Die Erde dreht sich einmal in 24 Stunden um 360o , also pro Stunde um 15o . Hat man nun ei- ne Uhr, die die genaue Zeit in Greenich bei London anzeigt (Position des Nullten Längengrads), so kann man den genauen Zeitpunkt des Mittags nach dieser Uhr ermitteln. Der lokale Mittag ist der Zeitpunkt des Höchstandes der Sonne. Tritt zum Beispiel der lokale Mittag 6 Stunden vor dem Mittag in Greenich ein, so befindet man sich in 6 · 15 = 75 Grad westlicher geographischer Länge, was übrigens auch die 6 Stunden Zeitunterschied zur amerikanischen Ostküste erklärt. Bei GPS wird folgendes gemacht. Jeder Satellit strahlt in regelmäßigen Abständen ein Signal aus, welches die folgenden Daten enthält: Seine Position ( xi , yi , zi ) und den genauen Zeitpunkt der Austrahlung ti . Ein GPS Empfänger kann nun mit der Formel d2i = ( x − xi )2 + (y − yi )2 + (z − zi )2 = ((tiE − ti ) · c)2 seine Entfernung di vom Satelliten bestimmen, dabei ist tiE der Zeitpunkt des Eintreffens des Signals und c die Lichtgeschwindigkeit. Der GPS Empfänger sendet also kein eigenes Signal aus. Nun ist die Lichtgeschwindigkeit sehr schnell, so daß die Zeitmessung von t und ti sehr genau sein muß. In den Satelliten sind dafür Atomuhren untergebracht. Nun kann man aber nicht in jedem GPS-Empfäng eine Atomuhr unterbringen. Dabei hilft der folgende Trick. Die Uhr im GPS-Empfänger geht falsch um die Zeit ∆t, es wird also nicht t gemessen, sondern t + ∆t. Wir betrachten das folgende Gleichungssystem mit den Unbekannten x, y, z und ∆t für i=1,2,3,4: ( x − xi )2 + (y − yi )2 + (z − zi )2 = tiE + ∆t − ti 2 c2 Ziehen wir die erste Gleichung von den anderen drei Gleichungen ab, so erhalten wir exemplarisch für die zweite Gleichung: x22 − x12 + y22 − y21 + z22 − z21 + 2 [ x ( x2 − x1 ) + y(y2 − y1 ) + z( h i = (t2E − t2 )2 − (t1E − t1 )2 + 2∆t((t2E + t2 ) − (t1E + t2 )) c2 Setzen wir − A2 := x22 − x12 + y22 − y21 + z22 − z21 − (t2E − t2 )2 − (t1E − t1 )2 , so gilt mit Ti := tiE + ti : 2 [ x ( x2 − x1 ) + y(y2 − y1 ) + z(z2 − z1 )] = 2∆t( T2 − T1 )c2 + Machen wir das für die anderen Gleichungen, so bekommen wir 2 [ x ( x2 − x1 ) + y(y2 − y1 ) + z(z2 − z1 )] = 2∆t( T2 − T1 )c2 2 [ x ( x3 − x1 ) + y(y3 − y1 ) + z(z3 − z1 )] = 2∆t( T3 − T1 )c2 2 [ x ( x4 − x1 ) + y(y2 − y1 ) + z(z4 − z1 )] = 2∆t( T4 − T1 )c2 Anleihe aus der Theorie linearer 3 × 3− Systeme: Das lineare Gleichungssystem a i x + bi y + c i z = d i für i = 1, 2, 3 hat die eindeutige Lösung d1 b1 c1 a1 1 1 x= det d2 b2 c2 , y = det a2 D D d3 b3 c3 a3 d1 d2 d3 c1 c2 , c3 a1 b1 c1 mit D = det a2 b2 c2 , falls D 6= 0. Dabei ist der a3 b3 c3 Betrag der Determinante das Volumen des von den drei Spaltenvektoren aufgespannten Parallelepipeds. Sie ist also genau dann 0, wenn sich die drei Spaltenvektoren in einer Ebene befinden. Damit können wir x, y und z durch Ausdrücke ersetzen, die nur noch ∆t enthalten (neben bekannter Größen). Die können wir wieder in die erste Gleichung einsetzen und erhalten einen quadratische Gleichung für ∆t. D 6= 0 ist bei GPS durch die Wahl der Satellitenorbits sichergestellt: Niemals befinden sich vier in Sichweite befindlichen Satelliten in einer Ebene. Denn 2 ( x2 − x1 ) 2 ( y2 − y1 ) 2 ( z2 − z1 ) det 2 ( x3 − x1 ) 2 (y3 − y1 ) 2 (z3 − z1 ) 2 ( x4 − x1 ) 2 ( y4 − y1 ) 2 ( z4 − z1 ) ist genau dann Null, die Verbindungvektoren von Satellit 1 und den anderen drei Satelliten alle in einer Ebene liegen, also wenn alle vier Satelliten in einer Ebene liegen. 2.0.7 E: Einführung in das Computeralgebrasystem Maxima Hinweise: Copyright (C) Robert Glöckner (unter GP-Lizenz 2.0.7.1 Einführung Maxima ist ein in Lisp geschriebenes freies Computer-Algebra System ( http://maxima.sour ). Es ist auf verschiedenen Betriebssystemen lauffähig. Es gibt mehrere Möglichkeiten das Programm zu verwenden: Starten von Maxima auf der Konsole (hierzu maxima, bzw. maxima.bat starten) eine rudimentäre grafische Oberfläche bietet xmaxima (mitgeliefert) eine grafische Formelausgabe bietet wxmaxima für Leute die LaTex benutzen ist texmax und emaxima interessant für Emacs-verrückte gibt es einen mitgelieferten maxima und emaxima Modus (Start im Emacs mit M-x maxima oder Öffnen einer .max Datei) Startet man Maxima (auf der Konsole) so erhält man folgende Meldung: Maxima 5 . 1 0 . 0 h t t p ://maxima . s o u r c e f o r g e . n e t Using Lisp GNU Common Lisp (GCL) GCL 2 . 6 . 8 D i s t r i b u t e d under t h e GNU P u b l i c L i c e n s e . S Dedicated t o t h e memory o f William S c h e l t e r This i s a development v e r s i o n o f Maxima . Th provides bug r e p o r t i n g i n f o r m a t i o n . (% i 1 ) Es erscheint eine Meldung über die freie Lizenz, die Widmung an Prof. W. Schelter (ihm haben wir die freie Version von Maxima zu verdanken) und ein sog. Label (%i1). Jede Eingabe wird mit einer Marke (Label) gekennzeichnet. Marken, welche mit einem i beginnen kennzeichnen Benutzereingaben, o-Markierungen kennzeichnen Ausgaben des Programms. Der Benutzer sollte dies bei der Namensgebung eigener Variablen oder Funktionen berücksichtigen, um Verwechslungen zu vermeiden. Kommandoeingabe Kommandos werden entweder mit einem Semikolon ; oder einem Dollarzeichen $ abgeschlossen. Es reicht nicht Return oder Enter zu drücken. Maxima wartet auf eines der beiden o.g. Zeichen, sont beginnt Maxima nicht mit der Auswertung der Eingabe. Ist das letzte Zeichen ein Semikolon, so wird das Ergebnis der Verarbeitung angezeigt, im Falle eines Dollarzeichens wird die Anzeige unterdrückt. Dies kann bei sehr langen Ergebnissen sinnvoll sein, um die Wartezeit zu reduzieren und die Übersicht zu wahren. Maxima unterscheidet Groß- und Kleinschreibung. Alle eingebauten Funktionen und Konstanten sind klein geschrieben (simp, solve, ode2, sin, cos, %e, %pi, inf etc). sImP oder SIMP werden von Maxima nicht den eingebauten Funktionen zugeordnet. Benutzerfunktionen und -variablen können klein und/oder groß geschrieben werden. Auf vorherige Ergebnisse und Aus- drücke kann mittels % zugegriffen werden. % bezeichnet das letzte Ergebnis, %i13 die 13. Eingabe und %o27 das 27. Ergebnis, ”%i42 wiederholt die Berechnung der 42. Eingabe, %th(2) ist das vorletzte Ergebnis. Zuweisungen Ausdrücke werden mit : einem Symbol zugewiesen. Funktionen werden mit := einem Symbol zugewiesen. Makro(expansions)funktionen werden mit ::= definiert. (% i 1 5 1 ) value : 3 ; (%o151 ) 3 (% i 1 5 2 ) e q u a t i o n : a + 2 = b ; (%o152 ) a + 2 = (% i 1 5 3 ) f u n c t i o n ( x ) : = x + 3 ; (%o153 ) function ( x ) := (% i 1 5 4 ) f u n c t i o n ( 3 ) ; (%o154 ) 6 (% i 1 5 5 ) f u n c t i o n ( b ) ; (%o155 ) b + 3 (% i 1 5 6 ) p r i n t q 1 ( x ) : : = b l o c k ( p r i n t ( " ( 1 ) ’ ( p r i n t ( " ( 2 ) x i s equal t o " , x ) ) ) ; (%156) p r i n t q 1 ( x ) : : = b l o c k ( p r i n t ( " ( 1 ) x i s ’ ( p r i n t ( " ( 2 ) x i s equal t o " , x ) ) ) Zuweisungen werden mit kill einzeln oder auch insgesamt gelöscht. (% i 1 5 0 ) k i l l ( e q u a t i o n ) ; (%o150 ) (% i 1 5 1 ) (%o151 ) (% i 1 5 2 ) (%o152 ) (% i 1 5 3 ) (%o154 ) (% i 1 5 5 ) (%o155 ) done equation ; equation function ( 3 ) ; 6 kill ( all ); done function ( 3 ) ; function ( Beenden von Maxima Zum Abbrechen eines Kommandos drückt man die Tastenkombination Strg-C oder StrgG. Meldet sich der Debugger, so beendet man diesen durch Eingabe von Q. Zum Beenden von Maxima gibt man quit(); ein (Bemerkung: unter xmaxima das Menue benutzen). (% i 3 ) apropos ( ’ p l o t ) ; (%o3 ) [ p l o t , plot2d , plot2dopen , plot2d_ps , p l o t h e i g h t , plotmode , p l o t t i n g , p l o t _ f o r m a t , (% i 4 ) d e s c r i b e ( " p l o t " ) ; Manchmal fragt describe auch nach, welcher Teilbereich beschrieben werden soll (hier nur ein kleiner Ausschnitt der angezeigten Informationen): 0 : ( maxima . i n f o ) P l o t t i n g . 1: Definitions for Plotting . 2 : OPENPLOT_CURVES : D e f i n i t i o n s f o r P l o t t i n g 3 : PLOT2D : D e f i n i t i o n s f o r P l o t t i n g . 4 : PLOT2D_PS : D e f i n i t i o n s f o r P l o t t i n g . 5 : PLOT3D : D e f i n i t i o n s f o r P l o t t i n g . 6 : PLOT_OPTIONS : D e f i n i t i o n s f o r P l o t t i n g . 7 : SET_PLOT_OPTION : D e f i n i t i o n s f o r P l o t t i n g E n t e r n , a l l , none , or m u l t i p l e c h o i c e s eg I n f o from f i l e /usr/ s h a r e / i n f o /maxima . i n f o : PLOT3D ( expr , xrange , yrange , . . . , options , . . ) −− Function : PLOT3D ( [ expr1 , expr2 , expr3 ] , x p l o t 3 d (2^( − u^2+v ^ 2 ) , [ u , − 5 , 5 ] , [ v , − 7 , 7 ] ) ; would p l o t z = 2^( − u^2+v ^2) with u and v va [ − 7 ,7] r e s p e c t i v e l y , and with u on t h e x a x An example o f t h e second p a t t e r n o f argumen p l o t 3 d ( [ cos ( x ) ∗ ( 3 + y∗ cos ( x / 2 ) ) , s i n ( x ) ∗ ( 3 + y∗ c [ x,−%pi ,% p i ] , [ y , − 1 , 1 ] , [ ’ grid , 5 0 , 1 5 which w i l l p l o t a moebius band , parametrized given as t h e f i r s t argument t o p l o t 3 d . An argument [ grid , 5 0 , 1 5 ] g i v e s t h e g r i d number d i r e c t i o n and y d i r e c t i o n . Mit der Funktion example können Beispiele zu einigen Funktionen von Maxima angezeigt werden (hier gekürzt): (% i 3 ) example ( i n t e g r a t e ) ; (% i 4 ) t e s t ( f ) : = b l o c k ( [ u ] , u : i n t e g r a t e ( f , x ) , r (%o4 ) t e s t ( f ) : = b l o c k ( [ u ] , u : i n t e g r a t e ( f ratsimp ( f − d i f f ( u , x ) ) ) (% i 5 ) (%o5 ) (% i 6 ) (%o6 ) (% i 7 ) (%o7 ) (% i 8 ) (%o8 ) t e s t ( sin ( x ) ) 0 t e s t (1/( x +1)) 0 t e s t (1/( x ^2+1)) 0 integrate ( sin ( x )^3 , x ) 3 cos ( x ) −−−−−−− − cos ( x ) 3 ... Die Darstellung der Ergebnisse von Maxima, ist im Wesentlichen von der verwendeten Oberfläche abhängig. Während die Ausgabe auf der Konsole und im einfachen Emacs-Modus auf die Darstellung von ASCII Zeichen begrenzt ist, zeigen der erweiterete Emacs-Modus, Imaxima, TexMacs und WxMaxima die Ergebnisse in grafischer Form an. D. h. es werden entsprechende Symbole für Pi, Integral, Summe usw. verwendet. Allgemein zeichnen sich die Ausgaben von Maxima durch exakte (rationale) Arithmetik aus: Darstellung der Ergebnisse (% i 3 8 ) 1/11 + 9 / 1 1 ; (%o38 ) 10 −− 11 Irrationale Zahlen werden in ihrer symbolischen Form beibehalten (mit % wurde auf das Ergebnis der letzten Berechnung zugegriffen): (% i 3 9 ) ( s q r t ( 3 ) − 1 ) ^ 4 ; (%o39 ) (% i 4 0 ) expand ( % ) ; (%o40 ) ( sqrt (3) − 28 − 16 s q r Mit ev(Ausdruck, numer); oder kurz: Ausdruck, numer; oder float(Ausdruck) kann eine Dezimaldarstellung erzwun gen werden (beachten Sie hier die Referenz auf das vorangegangene Ergebnis Nr. 40 via %o40): (% i 4 1 ) %o40 , numer ; (%o41 ) (% i 5 ) f l o a t (%e ) ; (%o5 ) 0.2871870788 2.7182818284 Die Voreinstellung der Genauigkeit bei Fließkommazahlen beträgt 16 Stellen, wobei die letzte Stelle unsicher ist. Die Genauigkeit kann beliebig eingestellt werden, wenn der Zahlentyp bfloat verwendet wird. Die Anzahl der angezeigten Stellen wird mit fpprec gesteuert. Man kann dazu fpprec nur für die Auswertung einer Zeile setzen, wie dies in Zeile %i46 geschieht, oder für alle folgenden Berechnungen setzen, wie dies in Zeile %i48 geschieht: (% i 4 5 ) b f l o a t (%o40 ) ; (%o45 ) 2.871870788979 (% i 4 6 ) b f l o a t (%o40 ) , f p p r e c = 1 0 0 ; (%o46 ) 2 . 8 7 1 8 7 0 7 8 8 9 7 9 6 3 3 0 3 5 6 0 8 5 8 5 3 5 9 0 # 60421289151159390339099511070883287690717# 294591994067016610118840227891B−1 (% i 4 7 ) f p p r e c ; (%o47 ) 16 (% i 4 8 ) f p p r e c : 2 0 ; (%o48 ) 20 (% i 4 9 ) b f l o a t (%o40 ) ; (%o49 ) 2.87187078897963 (% i 5 0 ) b f l o a t (%o40 ) , f p p r e c = 1 0 0 ; (%o50 ) 2 . 8 7 1 8 7 0 7 8 8 9 7 9 6 3 3 0 3 5 6 0 8 5 8 5 # 3590604212891511593903390995110708832876907 294591994067016610118840227891B−1 Die Eingabe von bestimmten Konstanten (e, i, pi, ...) erfolgt mit vorangestelltem % (%e, %i, %pi...). Die Darstellung von bestimmten Konstanten (e, i, pi, ...), Operatoren (Summe, Integral, Ableitungen, ...) und anderen Symbolen (Klammern, Brüche, ...) ist abhängig von der gewählten Oberfläche. Im Textmodus, der von der Konsole, dem einfachen Emacs-Modus und der mitgelieferten xmaxima Oberfläche geboten wird, werden Konstanten mit einem % vorangestellt (%e, %i, %pi, ...), Operatoren werden in ASCII-Grafik dargestellt, Klammern werden nicht in der Größe expandiert und Brüche mit Hilfe von - dargestellt: (% i 5 1 ) s q r t ( − 3 ) ; (%o51 ) (% i 5 2 ) exp ( 5 ∗ a ) ; sqrt (3) % 5 a (%o52 ) %e (% i 5 4 ) i n t e g r a t e ( f ( x ) , x , 0 , i n f ) ; inf / [ (%o54 ) I f (x) d ] / 0 Die Darstellung im erweiterten Emacs-Modus, in Imaxima und in TexMax ist grafisch, d. h. für %pi, %e, Integrale, Summen, ... werden entsprechende Symbole verwendet. Maxima kann natürlich auch Funktionen plotten. Die Funktion plot2d([Funktionsliste], [X-Var, Min, Max], [YVar, Min, Max]); kann eine Gruppe von Funktionen plotten. Hierzu gibt man die Liste von Funktionen in eckigen Klammern und durch Kommas getrennt als ersten Parameter an. Es folgt eine Liste, welche die abhängige Variable und den Plotbereich (x-Achse) angibt. Es gibt noch viele andere Plotmöglichkeiten (apropos(’plot), describe(plot)) (% i 5 5 ) p l o t 2 d ( [ s i n ( x ) , cos ( x ) ] , [ x , 0 , 5 ] ) (% i 5 8 ) apropos ( ’ p l o t ) ; (%o58 ) [ p l o t , plot2d , plot2dopen , plot2d_ps p l o t h e i g h t , plotmode , p l o t t i n g , p l o t _ f o r m a t , (% i 5 9 ) d e s c r i b e ( p l o t ) ; 0 : ( maxima . i n f o ) P l o t t i n g . 1: Definitions for Plotting . 2 : openplot_curves : D e f i n i t i o n s fo r P l o t t i n 3 : plot2d : D e f i n i t i o n s for P l o t t i n g . 4 : plot2d_ p s : D e f i n i t i o n s f o r P l o t t i n g . 5 : plot3d : D e f i n i t i o n s for P l o t t i n g . 6: plot_options : Definitions for Plotting . 7: set_plot_option : Definitions for Plottin E n t e r space −s e p a r a t e d numbers , ‘ a l l ’ or ‘ no 2.0.7.2 Rechnen mit Maxima Die üblichen arithmetischen Operatoren stehen zur Verfügung: + Addition, - Subtraktion, * skalare Multiplikation, . Skalarmultiplikation von Vektoren und Matrix-Multiplika / Division, ** oder ^ Potenzfunktion, sqrt() Wurzelfunktion, exp() Exponentialfunktion, Operatoren log() natürliche Logarithmusfunktion ... Niemand ist vor Flüchtigkeitsfehlern bei der Umformung, Transformation usw. von algebraischen Ausdruck gefeit. Hier eignet sich Maxima hervorragend bei der Untersützung analytischer Berechnungen. Hier ein einfaches Beispiel für die Behandlung von Polynomen. Zunächst wird via expand expandiert, anschließend eine Ersetzung vorgenommen, danach mittels ratsimp ein gemeinsamer Nenner gesucht und anschließend via factor faktorisiert: Algebra (% i 7 2 ) ( 5 ∗ a + 3∗ a ∗b ) ^ 3 ; (%o72 ) (% i 7 3 ) expand ( % ) ; (3 a b + 5 3 3 3 (%o73 ) 27 a b + 125 a (% i 7 4 ) %, a=1/x ; 3 b 3 + 135 a 2 b + 225 3 27 b 125 (%o74 ) 3 2 135 b 2 −−−−− + −−−−−− + −−− 3 3 3 x x x x (% i 7 5 ) ratsimp ( % ) ; (%o75 ) 3 2 27 b + 135 b + 2 −−−−−−−−−−−−−−−−−−− 3 x (% i 7 6 ) f a c t o r ( % ) ; (%o76 ) (3 b + 5) −−−−−−−−−− 3 x Es gibt keinen globalgalaktischen simplify Befehl. Für verschiedene Gebiete stehen spezifische Vereinfachungsfunktionen zur Verfügung. Hier eine Auswahl. Im Abschnitt "Wichtige Maxima Funktionen" sind Kurzbeschreibungen dieser Befehle verfügbar. Funktionen zur Vereinfachung von Ausdrücken fullratsimp, ratsimp, radcan, grind, trigsimp, trigreduce, trigexpand, foursimp, atensimp, vectorsimp. Es gibt zusätzlich Befehle zur benutzerdefinierten Vereinfachung. %i 7 7 ) eq1 : a + b + c = 6 ; (%o77 ) c + b + a (% i 7 8 ) eq2 : a ∗ b + c = 5 ; (%o78 ) c + a b = (% i 7 9 ) eq3 : a + b ∗ c = 7 ; (%o79 ) b c + a = (% i 9 3 ) s : s o l v e ( [ eq1 , eq2 , eq3 ] , [ a , b , c ] ) (%o93 ) [[ a = 1 , b = 3 , c = 2] , [a = 1 , b = Die Lösung wird in Form einer Liste, welche mit eckigen Klammern umschlossen ist, dargestellt. Im Folgenden wird gezeigt, wie auf die Elemente einer Liste zugegriffen wird und wie man Lösungen in Gleichungen einsetzt. (% i 9 4 ) s [ 1 ] ; (%o94 ) [a = 1, b = 3, (% i 9 5 ) s [ 2 ] ; (%o95 ) [a = 1, b = 2, (% i 9 8 ) eq4 : a ∗ a + 2 ∗ b ∗ b + c ∗ c ; 2 2 2 (%o98 ) c + 2 b + (% i 9 9 ) eq4 , s [ 1 ] ; (%o99 ) 23 (% i 1 0 0 ) eq4 , s [ 2 ] ; (%o100 ) 18 Es stehen u.a. tan, sin, cos, tanh, sinh, cosh und deren Umkehrfunktionen zur Verfügung. Trigonometrische Funktionen %i 1 0 2 ) example ( t r i g ) ; (% i 1 0 3 ) tan (% p i /6)+ s i n (% p i /12) %p i 1 (%o103 ) (% i 1 0 4 ) (%o104 ) (% i 1 0 5 ) (%o105 ) (% i 1 0 6 ) (%o106 ) (% i 1 0 7 ) (%o107 ) s i n (−−−) + −−− 12 sq ev (% ,numer ) 0.83616931429 sin (1) sin (1) ev ( s i n ( 1 ) , numer ) 0.84147098480 beta (1/2 ,2/5) 1 2 beta (−, − 2 5 (% i 1 0 8 ) ev (% ,numer ) (%o108 ) 3.67909398040 (% i 1 0 9 ) d i f f ( atanh ( s q r t ( x ) ) , x ) 1 (%o109 ) −−−−−−−−−−−−− 2 (1 − x ) sq (% i 1 1 0 ) f p p r e c : 2 5 (% i 1 1 1 ) s i n ( 5 . 0 B − 1) (%o111 ) 4.7942553860420300 (% i 1 1 2 ) cos ( x)^2 − s i n ( x )^2 2 2 (%o112 ) cos ( x ) − s i n (% i 1 1 3 ) ev (% , x:% p i /3) 1 (%o113 ) −− 2 (% i 1 1 4 ) d i f f (% th ( 2 ) , x ) (%o114 ) − 4 cos ( x ) s (% i 1 1 5 ) i n t e g r a t e (% th ( 3 ) , x ) sin (2 x ) sin (2 x ) −−−−−−−− + x x − 2 2 (%o115 ) −−−−−−−−−−−− − −−− 2 2 (% i 1 1 6 ) expand (%) sin (2 x ) (%o116 ) −−−−−−−− 2 Trigonometrische Ausdrücke lassen sich in Maxima leicht manipulieren. Die Funktion trigexpand benutzt die Summe der-Winkel-Funktion, um Argumente innerhalb jeder tri- gonometrischen Funktion so stark wie möglich zu vereinfachen. sin (2 x ) −−−−−−−− 2 (%o116 ) (% i 1 1 7 ) t r i g e x p a n d (%) (%o117 ) cos ( x ) s i n Die Funktion trigreduce konvertiert einen Ausdruck in eine Summe von Einzeltermen, bestehend aus jeweils einer sin- oder cos- Funktion. (%o117 ) (% i 1 1 8 ) t r i g r e d u c e (%) cos ( x ) s i n sin (2 x ) −−−−−−−− 2 (% i 1 1 9 ) sech ( x )^2∗ tanh ( x )/ c o t h ( x )^2+ cosh ( x )^ +sech ( x )^2∗ s i n h ( x ) ∗ tanh ( x )/ c o t h ( x )^2 (%o118 ) 2 2 2 sech ( x ) s i n h ( x ) tanh ( x ) cosh ( x ) (%o119 ) −−−−−−−−−−−−−−−−−−−−−−−− + −−−−−−−−− 2 2 coth ( x ) co th ( x ) 2 sech ( x ) tanh ( x ) + −−−−−−−−−−−−−−−− 2 co th ( x ) sech() ist eine hyperbolische Sekantenfunktion. trigsimp ist eine Vereinfachungsroutine, welche verschiedene trigonometrische Funktionen in sin und cos Equivalente umwandelt. (% i 1 2 0 ) t r i g s i m p (%) 5 4 3 (%o120 ) sinh ( x ) + sinh ( x ) −−−−−−−−−−−−−−−−−−−−− 5 cosh ( x ) exponentialize() transformiert trigonometrische Funktionen in ihre komplexen Exponentialfunktioen. (% i 1 2 1 ) ev ( s i n ( x ) , e x p o n e n t i a l i z e ) %i x − %i x ) (%o121 ) %i (%e −% − −−−−−−−−−−−−−−− 2 taylor(Funktion, Variable, Entwicklungspunkt, Grad); Generiert eine Taylorreihenentwicklung der angegebenen Fun tion nach einer Variable um den Entwicklungspunkt bis einschließlich des angegebenen Grades. (% i 1 2 2 ) t a y l o r ( s i n ( x )/ x , x , 0 , 4 ) 2 x (%o122 )/T/ 1 − −− + 6 (% i 1 2 3 ) ev ( cos ( x)^2 − s i n ( x ) ^ 2 , s i n ( x )^2 (%o123 ) (%o123 ) 4 x −−− + 120 = 1− c 2 2 cos ( x ) − done Komplexe Zahlen Die Funktionen realpart und imagpart geben den Real- bzw. Imaginärteil eines komplexen Ausdruckes zurück (% i 1 4 4 ) z : a + b ∗ %i ; (%o144 ) (% i 1 4 5 ) z ^ 2 ; (%o145 ) (% i 1 4 6 ) exp ( z ) ; %i b + a (% i b + a %i b + (%o146 ) %e trigrat() transformiert (komplexe) Exponentialfunktionen in entsprechende sin() und cos() Funktionen um. (% i 1 4 8 ) t r i g r a t ( exp ( z ) ) ; a a (%o148 ) cos ( b ) %i %e sin (b) + % Komplexe Zahlen lassen sich mit imagpart() und realpart() in die entsprechenden Real- und Imaginärteile aufspalten: (% i 1 4 9 ) imagpart ( % ) ; a (%o149 ) (% i 1 5 0 ) r e a l p a r t (% th ( 2 ) ) ; %e sin (b Ableitungen, Grenzwerte, Integrale Mit Maxima lassen sich u. a. Ableitungen, Integrale, Taylorentwicklungen, Gren werte, exakte Lösungen gewöhnlicher Differentialgleichungen berechnen. Zunächst definieren wir ein Symbol f als Funktion von x auf 2 Arten. Beachten Sie die Unterschiede bei der Auswertung der Ableitung. (% i 1 2 9 ) f : x ^ 3 ; 3 (%o129 ) x (% i 1 3 0 ) d i f f ( f , x ) ; 2 (%o130 ) (% i 1 3 1 ) k i l l ( f ) ; (%o131 ) (% i 1 3 2 ) f ( x ) : = x ^ 3 ; (%o132 ) (% i 1 3 3 ) d i f f ( f , x ) ; (%o133 ) (% i 1 3 4 ) d i f f ( f ( x ) , x ) ; 3 x done f ( x ) := x 0 2 (%o134 ) 3 x Ein Beispiel für eine Taylorreihenentwicklung und eine Grenzwertberechnung: (% i 1 4 0 ) f ( x ) : = s i n ( x ) / x ; (%o140 ) sin f ( x ) : = −−−− x (% i 1 4 1 ) t a y l o r ( f ( x ) , x , 0 , 5 ) ; (%o141 )/T/ (% i 1 4 2 ) l i m i t ( f ( x ) , x , 0 ) ; 2 4 x x 1 − −− + −−− + 6 120 (%o142 ) 1 Integrale lassen sich, sofern möglich, bestimmt und unbestimmt berechnen: (% i 1 0 9 ) i n t e g r a t e (%e^x/(2+%e^x ) , x ) x (%o109 ) l o g (%e + (% i 1 1 6 ) i n t e g r a t e ( x ^(5/4)/(1+ x ) ^ ( 5 / 2 ) , x , 0 , i 9 1 (%o116 ) beta (−, − 4 4 (% i 9 ) ’ d i f f ( y , x ) ; (%o9 ) (% i 1 0 ) d i f f ( y , x ) ; (%o10 ) dy −− dx 0 Zum Lösen von gewöhnlichen Differentialgleichungen stehen folgende Funktionen zur Verfügung: ode2, ic1, ic2, bc1, bc2. ic1, ic2 sind auf Anfangswertaufgaben 1. bzw. 2. Ordnung spezialisiert. bc1, bc2 sind auf Randwertaufgaben 1. bzw. 2. Ordnung spezialisiert. (% i 2 3 ) dgl1 : − ’ d i f f ( y , x ) ∗ s i n ( x ) + y ∗ cos (%o23 ) cos ( x ) y − s i n ( x (% i 2 4 ) ode2 ( dgl1 , y , x ) ; (%o24 ) (% i 2 5 ) t r i g s i m p ( % ) ; (%o25 ) 1 y = s i n ( x ) (−−−−− tan ( y = %c s i n ( x ) + Anfangswertaufgabe: Harmonische Schwingungen z.B. eines Pendels werden durch folgende Differentialgleichung beschrieben und mittels ode2 und ic2 gelöst: (% i 3 8 ) dgl2 : ’ d i f f ( y , x , 2 ) + y = 0 ; (%o38 ) 2 d y −−− + y = 2 dx (% i 3 9 ) ode2 ( dgl2 , y , x ) ; (%o39 ) y = %k1 s i n ( x ) + % (% i 4 0 ) i c 2 (% , x =0 , y=y0 , ’ d i f f ( y , x ) = 0 ) ; (%o40 ) y = cos ( x ) Randwertaufgabe: Bei gleichmäßiger Belastung lässt sich die Biegelinie eines auf 2 Sützen ruhenden Balkens unter bestimmten Umständen durch folgende Differentialgleichung beschreiben und mittels ode2 und bc2 lösen: (% i 4 1 ) dgl3 : ’ d i f f ( y , x , 2 ) = x − x ^2; 2 d y 2 (%o41 ) −−− = x − 2 dx (% i 4 2 ) ode2 ( dgl3 , y , x ) ; 4 3 x − 2 x (%o42 ) y = − −−−−−−−−− + % 12 (% i 4 3 ) bc2 (% , x =0 , y =0 , x =1 , y = 0 ) ; 4 3 x − 2 x x (%o43 ) y = − −−−−−−−−− 12 12 (% i 4 5 ) expand ( % ) ; 4 3 x x x (%o45 ) y = − −− + −− 12 6 12 Matrizenrechnung Mit Maxima lassen sich allgemeine Matrizenoperationen durchführen. (% i 7 9 ) m: matrix ( [ a , 0 ] , [ b , 1 ] ) [ a [ [ b (%o79 ) 0 ] ] 1 ] (% i 8 0 ) m^2 [ 2 ] [ a [ (%o80 ) ] [ 0 2 ] [ b (% i 8 1 ) m . m [ ] (%o81 ) 0 ] [ 2 a [ ] [ a b + b 1 ] 1 (% i 8 2 ) m[ 1 , 1 ] ∗m [ ] (%o82 ) 2 [ a [ 0 [ a b a ] (% i 8 3 ) 1−%th (2)+% (%o83 ) ] (% i 8 4 ) m^^( − 1) [ [ 1 1 [ 1 − b [ 1 [ [ − a a ] ] (%o84 ) ] 0 [ [ b ] [ −− [ a ] (% i 8 5 ) [ x , y ] . m (%o85 ) y ] 1 [ b y + a x (% i 8 6 ) matrix ( [ a , b , c ] , [ d , e , f ] , [ g , h , i ] ) [ a b c [ ] (%o86 ) [ d e f [ ] [ g h i (% i 8 7 ) %^^2 [ 2 ] [ c g + b d + a c h + b e + c i + b f + a c ] [ ] (%o87 ) [ 2 ] [ f g + d e + a d f h + e + f i + e f + c d ] [ ] [ 2 ] [ g i + d h + a g h i + e h + i + f h + c g ] (%o87 ) done Außerdem lassen sich u. a. die Determinante, die Inverse, die Eigenwerte und -vektoren einer Matrix berechnen. Die Matrix darf dabei auch symbolische Ausdrücke enthalten. eigenvalues(m) ergibt als Ergebnis eine Liste, bestehend aus 2 Unterlisten. Die erste Unterliste enthält die Eigenwerte, die zweite Unterliste die entsprechenden Multipliktaroren. %i 6 0 ) m : matrix ( [ 1 , 0 , 0 ] , [ 0 , 2 , [ [ ] (%o60 ) [ [ ] [ (% i 6 1 ) e i g e n v a l u e s (m) ; (%o61 ) [[1 , 2 , 0] , [0 , 1 0 0 0 2 0 0 0 3 3] , [1 , Die Funktion eigenvectors berechnet Eigenwerte, deren Multiplikatoren sowie die Eigenvektoren der gegebenen Matrix. Die Ergebnisse werden in Listen bzw. Unterlisten zusammengefasst. Es gibt verschiedene Möglichkeiten die Auswertung zu beeinflussen nondiagonalizable, hermitianmatrix, knowneigvals. Diese werden mit describe(eigenvec beschrieben. (% i 6 2 ) e i g e n v e c t o r s (m) ; (%o62 ) [[[1 , 2 , 3] , [1 , 1 , 1]] , [1 , 0 , (% i 7 1 ) p a r t ( %, 2 ) ; (%o71 ) [1 , 0 , 0 Weiterhin gibt es Funktionen zur Transponierung (transpose), Berechnung der Determinante (determinant), Berechnung des charakteristischen Polynomes charpoly(Matr Variable), Berechnung der Inversen (invert), etc. Das Schlüs selwort detout faktorisiert dabei die Determinante aus der Inversen. allroots(a) Findet alle (allgemein komplexen) Wurzeln einer Polynomialgleichung. Wichtige Maxima-Funktionen append(a,b) Fügt Liste b an a an. apropos(a); Liefert zu einem Stichwort mögliche Befehle/Funktionen. assume(a1, a2, ...); Annahmen über Symbole, welche Vereinfachungen und Auflösen von Gleichungen beeinflussen. Beispiel: assume( x >= 0); -> solve( x^2 = 4); -> x = 2. Ohne die Annahme [x = 2, x = -2] atensimp(a>) Vereinfacht algebraische Tensorausdrücke. batch(a) Lädt und startet Programm/File a. bc1, bc2 ( DGL, x=x0, y=y0, x=x1, y=y1) Lösung einer Randwertaufgabe einer DGL nach Behandlung mit ode2. charpoly(Matrix, Variable) Berechnet das charakteristische Polynom einer Matrix bzgl. der gegebenen Variable. coeff(a,b,c) Koeffizienten von b der Potenz C in Ausdruck a. concat(a,b) Generiert ein Symbol ab. cons(a,b) Fügt a in Liste b als erstes Element ein. demoivre(a) Transformiert alle komplexen Exponentialterme in trigonometrische. denom(a) Nenner von a. depends(a,b) Erklärt a als Funktion von b (nützlich für Differentialgleichungen). desolve(a,b) Versucht ein lineares System a von gew. DGLs nach unbekannten b mittels Laplace-Transformation zu lösen. describe(a) Beschreibt einen Befehl oder eine Funktion näher. Evtl. wird nachgefragt, welcher Aspekt eines Befehls oder einer Befehlsgruppe näher beschrieben werden soll. determinant(a) Determinante diff(a,b1,c1,b2,c2,...,bn,cn) Gemischte partielle Ableitung von a nach bi der Stufe ci. eigenvalues(a) Berechnet die Eigenwerte und ihre Multiplikatoren. eigenvectors(a) Berechnet Eigenvektoren, Eigenwerte und Multiplikatoren. entermatrix(a,b) Matrixeingabe ev(a,b1,b2,...,bn) Berechnet Ausdruck a unter Annahmen bi (Gleichungen, Zuweisungen, Schlüsselwörter (numer Zahlenwerte, detout - Matrixinverse ohne Determinante, diff - alle Ableitungen werden ausgeführt). NUR bei direkter Eingabe kann ev weggelassen werden. example(a) Zeigt Beispiele für die Verwendung eines Befehls oder einer Funktion an. Nicht für jede Funktion sind Beispiele vorhanden. expand(a) Algebraische Expansion (Distribution). exponentialize(a) Transformiert trigonometrische Funktionen in ihre komplexen Exponentialfunktioen. factor(a) Faktorisiert a. fortran(a) Konvertiert einen Ausdruck in einen Fortran-Ausdruck, soweit möglich. foursimp(a) Vereinfacht trigonometrische Funktionen, welche (ganzzahlige) Vielfache von Pi enthalten in Abhängigkeit verschiedener Flags. freeof(a,b) Ergibt wahr, wenn b nicht a enthält. fullratsimp(a) Wiederholte Ausführung von ratsimp, gefolgt von nicht-rationalen Vereinfachungen bis keine weitere Veränderung auftritt. grind(a) Darstellung einer Variable oder Funktion in einer kompakten eindimensionalen Form. ic1, ic2 ( dgl, x=x0, y=y0, dy0/dx = y1) Lösung einer Anfangswertaufgabe einer DGL (nach Behandlung mit ode2). ident(a) Einheitsmatrix a x a. imagpart(a) Imaginärteil von a. integrate(a,b) Berechnungsversuch des unbestimmten Integrals a nach b. integrate(a,b,c,d) Berechnung des Integrals a nach b in den Grenzen b=c und b=d. invert(a) Inverse der Matrix a. kill(a) Vernichtet Variable/Symbol a oder alle Variablen/Symbole (all). limit(a,b,c) Grenzwertbestimmung des Ausdrucks a für b gegen c. lhs(a) Linke Seite eines Ausdrucks. loadfile(a) Lädt eine Datei a und führt sie aus. makelist(a,b,c,d) Generiert eine Liste von a(b) mit b=c bis b=d. map(a,b) Wendet a auf b an. matrix(a1,a2,...,an) Generiert eine Matrix aus Zeilenvektoren. num(a) Zähler von a. ode2(a,b,c) Löst gewöhnliche Differentialgleichungen 1. un 2. Ordnung a für b als Funktion von c. part(a,b1,..,bn) Extrahiert aus a die Teile bi. playback(a) Zeigt die a letzten Labels an, wird a weggelassen, so werden alle Zeilen zurückgespielt. print( a1, a2, a3, ... ) Zeigt die Auswertung der Ausdrücke an. rat(a) Umwandlung von a in eine kanonische rationale Form. ratsimp(a) Vereinfacht a und gibt einen Quotienten zweier Polynome zurück. radcan(a) Vereinfacht Ausdrücke für log-, exp, Radikale in eine kanonische oder eine reguläre Form. Die Differenz gleicher Ausdrücke verschieden Aussehens kann so zu NU vereinfacht werden. realpart(a) Realteil von a rhs(a) Rechte Seite einer Gleichung a. save(a,b1,..., bn) Generiert eine Datei a (im Standardverzeichnis), welche Variablen, Funktionen oder Arrays bi enthält. So generierte Dateien lassen sich mit loadfile zurückspielen. Wenn b1 all ist, wird alles bis auf die Labels gespeichert. solve(a,b) Algebraischer Lösungsversuch für ein Gleichung system oder eine Gleichung a für eine Variable oder eine Liste von Variablen b. Gleichungen können =0 abkürzen. string(a) Konvertiert einen Ausdruck in Maximas lineare Notation. stringout(a,b1,..bn) Generiert eine Datei a im Standardverzeichnis, bestehend aus Symbolen bi. Die Datei ist im Textformat und nicht dazu geeignet von Maxima geladen zu werden. Die Ausdrücke können aber genutzt werden, um sie in Fortran, Basic oder C-Programmen zu verwenden. subst(a,b,c) Ersetzt a für b in c. taylor(a,b,c,d) Taylorreihenentwicklung von a nach b in Punkt c bis zur Ordnung d. translate_file(filename) Übersetzt ein Maxima-File in ein LISP-File (Abschnitt Infix-Prefix Konversion). transpose(a) Transponiert Matrix a. trigexpand(a) Eine Vereinfachungsroutine, welche trigonometrische Winkelsummen nutzt, um einen Ausdruck zu vereinfachen. trigreduce(a) Eine Vereinfachungsroutine für trigonometrische Produkte und Potenzen. trigsimp(a) Eine Vereinfachungsroutine, welche verschiedene trigonometrische Funktionen in sin und cos Equivalente umwandelt. vectorsimp(a) Wendet Vereinfachungen und Expansionen bzgl. Vektoroperationen in Abhängigkeit verschiedener glo baler Flags an. with_stdout( Datei, Ausdrücke); Leitet die Ausgabe der Ausdrücke in die angegebene Datei um. Hiebei kann kein variabler Dateinamen angegeben werden. 2.0.8 E: Stetigkeit Erinnerung: f : X → R , X ⊂ R ist in x0 ∈ X stetig, wenn gilt: ∀e > 0∃δ > 0∀ x ∈ X : | x − x0 | < δ ⇒ | f ( x ) − f ( x0 )| < δ f ist stetig (schlechthin), wenn f in jedem x0 ∈ X stetig ist. Beispiele: i) Die Funktion f : R → R. x 7→ x ist überall stetig Grund: Sei e > 0. Wähle δ = e. Ist nun | x − x0 | < δ = e, so ist | f ( x ) − f ( x0 )| = | x − x0 | < e √ ii) · : R≥0 → R ist überall stetig √ Grund: Sei e > 0. Wähle δ := e √ √ 2 √ 1. Fall: x ≥ x0 . Dann gilt: x − x√ = x − 2 √xx0 + 0 √ x0 ≤ x − 2x0 + x0 = x − x0 . Daher ist x − x0 ≤ x − x0 . √ √ √ √ Ist also | x − x0 | ≤ δ, so ist x − x0 ≤ x − x0 ≤ δ = e. Der 2. Fall verläuft analog. iii) Die Funktion sgn( x ) ist nicht stetig in 0, da | f ( x ) − f (0)| ≥ 1 für x 6= 0. iv) Die Funktion ( für x 6= 0 sin 1x f (x) = 0 für x = 0 ist in 0 nicht stetig. v) Die Funktion f : R → R, x 7→ x n ist stetig Grund: Sei 0 ≤ x ≤ x0 . Dann ist | x n − x0n | = −( x0n − x n ) = −( x0 − x )( x0n−1 + x0n−2 x + . . . + x0 x n−2 + x n−1 ) ≤ | x − x0 | · (n + 1) · x0n−1 . Dieser Ausdruck wird beliebieg klein für x nahe bei x0 . Alle anderen Fälle gehen analog. π Grund: Wir betrachten die Punkte xn := 2 + n · 2π. Es ist π sin 2 = 1 und wegen der 2π −Periodizität des Sinus gilt sin x1n = sin π2 = 1. Nun wird x1n beliebig klein. Also findet man beliebig nahe bei 0 ein xn0 . Aber | sin x1n − sin(0)| = 1, wird also nicht beliebig klein. 0 Satz: Sind f , g : X → R stetige Funktionen, X ⊂ R, so ist auch f + g : X → R eine stetige Funktion. Grund: Für alle e > 0 gibt es δ1 , δ2 > 0 , so daß | x − x0 | < δ1 ⇒ | f ( x ) − f ( x0 )| < 2e und | x − x0 | < δ2 ⇒ | g( x ) − g( x0 )| < 2e . Setze δ := min(δ1 , δ2 ). Dann gilt: |( f + g)( x ) − ( f + g)( x0 )| = | f ( x ) − f ( x0 ) + g( x ) − g( x0 )| e ≤ | f ( x ) − f ( x0 )| + | g( x ) − g( x0 )| < 2 = e 2 Satz: Sei f wie im vorigen Satz, λ ∈ R. Dann ist λ f stetig. Grund: Ist λ = 0, so ist das trivialerweise richtig. Sei also λ 6= 0. Zu e > 0 existiert δ > 0, mit | x − x0 | < δ ⇒ | f ( x ) − f ( x0 )| < |λe | . Es ist also |λ f ( x ) − λ f ( x0 )| < |λ| |λe | = e Bemerkung: Die letzen beiden Sätze zeigen, daß die stetigen Funktionen (mit gemeinsamer Definitionsmenge) einen Vektorraum bilden. Folgerung: Jedes Polynom definiert eine stetige Funktion. Satz: Sind f , g : X → R stetige Funktionen, X ⊂ R, so auch f · g. Grund: Es ist f ( x ) g( x ) − f ( x0 ) g( x0 ) = f ( x ) g( x ) − f ( x0 ) g( x f ( x0 ) g( x ) − f ( x0 ) g( x0 ) = g( x )( f ( x ) − f ( x0 )) + f ( x0 )( g( x ) g( x0 )) (*) Wähle δ1 > 0, so daß | f ( x0 )( g( x ) − g( x0 ))| < e/2 (oder äquivalent dazu: | g( x ) − g( x0 )| < |2 f (ex )| ) für alle x ∈ X, 0 mit | x − x0 | < δ1 . Weiter wählen wir δ2 > 0, so daß | g( x ) − g( x0 )| < 1 ist für alle x ∈ X, mit | x − x0 | < δ2 . Folglich gilt: | g( x )| < | g( x0 )| + 1 für alle x ∈ X, mit | x − x0 | < δ2 . Zum Schluß wählen wir δ3 , so daß | f ( x ) − f ( x0 )| < e für alle x ∈ X. mit | x − x0 | < δ3 gilt. Insgesamt 2| g( x0 )|+2 haben wir dann: |(∗)| < (| g( x0 )| + 1) · e e + =e 2(| g( x0 )| + 1) 2 für alle x ∈ X, mit | x − x0 | < min{δ1 , δ2 , δ3 }. Satz: Ist f : ( a, b) → R stetig und ist f (c) > 0 für ein c ∈ ( a, b), so ist f ( x ) > 0 für x nahe c. Grund: Sei d := f (c). Dann ist | f ( x ) − d| < bei c. Also 0 < 2d = d − d2 < f ( x ) < d + d2 . d 2 für x nahe Satz(Nullstellensatz von Bolzano): Ist f : [ a, b] → R stetig und ist f ( a) < 0 < f (b), so gibt es ein c ∈ ( a, b) mit f (c) = 0. Grund: Wir betrachten A := { x ∈ [ a, b] | f ( x ) ≤ 0}. Dann ist A oben beschränkt (durch b) und wegen a ∈ A ist A 6= ∅. Also existiert α = sup( A) ∈ R. Sicher gilt für jede Teilmenge B ⊂ [ a, b], da alle oberen Schranken für [ a, b] auch obere Schranken für B sind: sup B ≤ b. Also ist α ≤ b. Wäre f (α) > 0, so wäre auch f ( x ) > 0 für ein Intervall (α − δ, α + δ). Sei x0 ∈ (α − δ, α). Dann ist aber x0 keine obere Schranke von A mehr und es existierte x1 ∈ A, mit x1 > x0 . Also gälte x0 < x1 < α, also x1 ∈ (α − δ, α), mithin f ( x1 ) > 0 im Widerspruch zu x ∈ A. Also ist f (α) ≤ 0. Wäre nun f (α) < 0 , so auch f ( x ) < 0 für x0 nahe bei α und x0 > α, also x0 ∈ A und x0 > α und damit im Widerspruch dazu, daß α obere Schranke von A ist. Also ist f (α) = 0, was wiederum α 6= a, b impliziert. Zwischenwertsatz: Sei f : [ a, b] → R stetig. Dann wird jeder Wert zwischen f ( a) und f (b) angenommen. Grund: Ist f ( a) = f (b), so ist nichts zu zeigen. Sei also f ( a) 6= f (b). Für y echt zwischen g( a) und g(b) definieren f ( x )−y wir g( x ) := f (b)− f (a) . Dann hat g in a und b verschiedenes Vorzeichen. Also gibt es eine Nullstelle von g zwischen a und b. Diese sei c. Dann ist f (c) = y. Satz: Ist f : X → R stetig und f 6= 0 auf X, so ist auf X 1 f stetig Grund: Sei f ( a) > 0. Dann ist 1 1 f ( x ) − f ( a) = f ( a) − f ( x ) f ( x ) f ( a) | f ( a)| Wählen wir nun x nahe bei a, mit | f ( x )| > 2 , so gilt : f ( a) − f ( x ) 2 f ( x ) f ( a) < | f ( x ) − f ( a)| | f ( a)|2 was offensichtlich beliebig klein für x nahe nei a wird. Satz: Ist f : X → Y surjektiv uns stetig und g : Y → R stetig, so auch g ◦ f . Grund: g(b) und g(y) liegen beliebig nahe beieinander, wenn y nahe bei b ist. Nun ist y = f ( x ) und b = f ( a) für x, a ∈ X. Diese liegen nun wiederum beliebig nahe beiander, wenn x genügend nahe bei a ist.