Oliver Deiser Einführung in die Mathematik 1 Inhalt 1. Abschnitt Elementare Funktionen . . . . . . . . . . . . . . . . . . 9 1. Geraden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 Geraden und ihre Parameter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Die Gerade durch zwei gegebene Punkte . . . . . . . . . . . . . . . . . . . Die Steigungsform . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Die Tangente einer differenzierbaren Funktion . . . . . . . . . . . . . . Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 14 15 17 18 2. Parabeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Parabeln und ihre Parameter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Die Einheitsparabel und die Wurzelfunktion . . . . . . . . . . . . . . . . Parabeln mit Parameter b = 0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . Überführung in Scheitelform . . . . . . . . . . . . . . . . . . . . . . . . . . . . Bestimmung der Nullstellen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Parabeln mit vorgegebenen Nullstellen . . . . . . . . . . . . . . . . . . . . Die Parabel durch drei gegebene Punkte . . . . . . . . . . . . . . . . . . . Brennpunkt und Leitlinie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Das Problem der Winkeldrittelung . . . . . . . . . . . . . . . . . . . . . . . . Kreise, Ellipsen und Hyperbeln . . . . . . . . . . . . . . . . . . . . . . . . . . . Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3. Polynome . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Polynome und ihr Grad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Koeffizientenvergleich für Polynome . . . . . . . . . . . . . . . . . . . . . . Die Polynomdivision . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Abspalten von Linearfaktoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . Die geometrische Summe und die geometrische Reihe . . . . . . . . Entwicklung eines Polynoms in einem Punkt . . . . . . . . . . . . . . . . Polynome durch gegebene Punkte . . . . . . . . . . . . . . . . . . . . . . . . Grenzwertverhalten von Polynomen . . . . . . . . . . . . . . . . . . . . . . . Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . © Oliver Deiser 67 68 69 72 76 5. Die Exponentialfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Charakterisierung der Exponentialfunktion . . . . . . . . . . . . . . . . . Das Additionstheorem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 48 50 51 53 55 58 60 63 66 4. Rationale Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Rationale Funktionen und ihre Definitionsbereiche . . . . . . . . . . . Polstellen und stetig hebbare Definitionslücken . . . . . . . . . . . . . . Die Partialbruchzerlegung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 22 22 25 26 30 31 33 34 36 39 45 77 78 79 Einführung in die Mathematik 1 2 Inhalt Reihendarstellung der Exponentialfunktion . . . . . . . . . . . . . . . . . Die Limesdarstellung der Exponentialfunktion . . . . . . . . . . . . . . Der natürliche Logarithmus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Die allgemeine Exponentialfunktion . . . . . . . . . . . . . . . . . . . . . . . Die Potenzfunktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Die allgemeinen Logarithmen . . . . . . . . . . . . . . . . . . . . . . . . . . . . Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81 84 85 86 89 90 93 6. Die trigonometrischen Funktionen . . . . . . . . . . . . . . . . . . . . . . . Kosinus und Sinus am Einheitskreis . . . . . . . . . . . . . . . . . . . . . . . Eigenschaften von Kosinus und Sinus . . . . . . . . . . . . . . . . . . . . . . Drehungen und Additionstheoreme . . . . . . . . . . . . . . . . . . . . . . . Weitere trigonometrische Funktionen . . . . . . . . . . . . . . . . . . . . . Trigonometrische Größen in rechtwinkligen Dreiecken . . . . . . . Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 96 99 101 106 108 112 7. Arkusfunktionen und Polarkoordinaten . . . . . . . . . . . . . . . . . . . 115 Die Arkusfunktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Winkelberechnungen bei Geraden . . . . . . . . . . . . . . . . . . . . . . . . Polarkoordinaten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Die Koordinatenabbildungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116 122 123 126 128 8. Die hyperbolischen Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . 131 Paritäts-Zerlegung einer Funktion . . . . . . . . . . . . . . . . . . . . . . . . Kosinus und Sinus Hyperbolicus . . . . . . . . . . . . . . . . . . . . . . . . . . Weitere hyperbolische Funktionen . . . . . . . . . . . . . . . . . . . . . . . . Die Areafunktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132 133 135 136 139 2 . A b s c h n i t t D e r a n a l y t i s c h e K a l k ü l . . . . . . . . . . . . . . . . . . . 141 1. Differentialquotienten und lineare Approximation . . . . . . . . . 143 Differenzierbarkeit an einer Stelle . . . . . . . . . . . . . . . . . . . . . . . . . Der Approximationssatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Die Landau-Notation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Differenzierbarkeit an allen Stellen . . . . . . . . . . . . . . . . . . . . . . . . Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144 146 149 151 153 2. Ableitungsregeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155 Die Regeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Einfache Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Ableitung von Kosinus und Sinus . . . . . . . . . . . . . . . . . . . . . . . . . Ableitung der trigonometrischen Funktionen . . . . . . . . . . . . . . . . Ableitung der hyperbolischen Funktionen . . . . . . . . . . . . . . . . . . Einfache Differentialgleichungen . . . . . . . . . . . . . . . . . . . . . . . . . Potenzreihendarstellungen für den Kosinus und Sinus . . . . . . . . Die Ableitungen des Arkustangens . . . . . . . . . . . . . . . . . . . . . . . . Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Einführung in die Mathematik 1 156 157 158 161 162 163 166 169 172 © Oliver Deiser Inhalt 3 3. Die Taylor-Entwicklung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175 Schmiegeparabeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Taylor-Polynome . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Taylor-Reihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 176 180 182 191 4. Monotonie und Krümmung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193 Kritische Punkte und lokale Extrema . . . . . . . . . . . . . . . . . . . . . . Das Krümmungsverhalten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Krümmungskreise . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Die dritte Ableitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Nullstellensuche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 194 200 202 206 207 212 5. Integration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 215 Stammfunktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Das Riemann-Integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Eigenschaften des Integrals . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Der Hauptsatz der Differential- und Integralrechnung . . . . . . . . Zum Beweis des Hauptsatzes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Uneigentliche Integrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 216 217 221 222 224 225 226 6. Integrationsregeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 227 Unbestimmte Integrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Linearität . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Partielle Integration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Die Substitutionsregel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Elimination trigonometrischer Funktionen . . . . . . . . . . . . . . . . . Weitere Integrationsregeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Nichtelementare Integrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 228 229 230 233 239 242 243 245 3 . A b s c h n i t t R e e l l e u n d k o m p l e x e Z a h l e n . . . . . . . . . . . . . 249 1. Die Vollständigkeit der reellen Zahlen . . . . . . . . . . . . . . . . . . . . 251 Modellierung eines Linearkontinuums . . . . . . . . . . . . . . . . . . . . . Obere und untere Schranken . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Das Vollständigkeitsaxiom . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Das Archimedische Axiom . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Dichte Mengen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 252 253 256 258 259 260 268 2. Grenzwerte für Folgen und Reihen . . . . . . . . . . . . . . . . . . . . . . 271 Folgen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Die Epsilon-Definition des Grenzwerts einer Folge . . . . . . . . . . Die Limesregeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Eine Charakterisierung der konvergenten Folgen . . . . . . . . . . . . © Oliver Deiser 272 274 276 277 Einführung in die Mathematik 1 4 Inhalt Unendliche Reihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Die geometrische Reihe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Die harmonische Reihe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Konvergenzkriterien für unendliche Reihen . . . . . . . . . . . . . . . . . Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 278 280 282 284 287 3. Grenzwerte und Stetigkeit von Funktionen . . . . . . . . . . . . . . . . 289 Grenzwerte bei Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Stetigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Links- und rechtsseitige Grenzwerte . . . . . . . . . . . . . . . . . . . . . . . Uneigentliche Grenzwerte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Die Folgenstetigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Stetigkeits- und Unstetigkeitsbeweise . . . . . . . . . . . . . . . . . . . . . . Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 290 292 297 298 299 301 302 4. Komplexe Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 305 Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Die Gaußsche Zahlenebene . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Die geometrische Deutung der komplexen Multiplikation . . . . . Die imaginäre Einheit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Realteil, Imaginärteil, Betrag und Konjugation . . . . . . . . . . . . . . Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 306 309 310 312 313 315 5. Der Fundamentalsatz der Algebra . . . . . . . . . . . . . . . . . . . . . . . . 317 Komplexe Polynome . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Formulierungen des Fundamentalsatzes . . . . . . . . . . . . . . . . . . . . Komplexe Quadratwurzeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Die komplexen Einheitswurzeln . . . . . . . . . . . . . . . . . . . . . . . . . . Das regelmäßige Fünfeck . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Ein anschaulicher Beweis des Fundamentalsatzes . . . . . . . . . . . . . Komplexe Wurzelfunktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 318 322 323 326 328 330 333 335 6. Die komplexe Exponentialfunktion . . . . . . . . . . . . . . . . . . . . . . . 337 Übertragung analytischer Begriffe ins Komplexe . . . . . . . . . . . . . Die Exponentialfunktion im Komplexen . . . . . . . . . . . . . . . . . . . . Kreisaufwicklung und Eulersche Formel . . . . . . . . . . . . . . . . . . . Anwendungen der Eulerschen Formel . . . . . . . . . . . . . . . . . . . . . Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 338 340 342 350 352 4 . A b s c h n i t t E b e n e u n d R a u m . . . . . . . . . . . . . . . . . . . . . . . . . . 353 1. Reelle Vektoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 355 Reelle Vektoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Die Vektoraddition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Die Skalarmultiplikation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Der Satz des Pythagoras und die Euklidische Norm . . . . . . . . . . Das Euklidische Skalarprodukt . . . . . . . . . . . . . . . . . . . . . . . . . . . Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Einführung in die Mathematik 1 356 357 358 359 363 366 © Oliver Deiser Inhalt 5 2. Die Euklidische Ebene . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 369 Die Winkelformel für das Euklidische Skalarprodukt . . . . . . . . . Determinanten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Linearkombinationen und Koordinatenvektoren . . . . . . . . . . . . . Lineare Gleichungssysteme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Algebraische Kurven ersten und zweiten Grades . . . . . . . . . . . . . Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 370 375 378 380 384 387 3. (2 × 2)-Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 391 Matrizen und ihre Einträge . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Addition und Skalierung von Matrizen . . . . . . . . . . . . . . . . . . . . . Das Matrix-Vektor-Produkt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Die Matrizenmultiplikation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Matrizen als lineare Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . . Allgemeine Abbildungseigenschaften von Matrizen . . . . . . . . . . . Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 392 395 396 399 402 408 410 4. Invertierung und Orthogonalität . . . . . . . . . . . . . . . . . . . . . . . . . 413 Das Inverse einer Matrix . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Orthogonale Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Matrizen und Ellipsen, I . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 414 419 422 426 5. Eigenwerte und Spektralsatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . 429 Eigenwerte und Eigenvektoren . . . . . . . . . . . . . . . . . . . . . . . . . . . Der Spektralsatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Diagonalisierung symmetrischer Matrizen . . . . . . . . . . . . . . . . . . Matrizen und Ellipsen, II . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Die Singulärwertzerlegung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 430 433 434 437 440 443 6. Der Euklidische Raum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 447 Grundlegendes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Geraden und Ebenen im dreidimensionalen Raum . . . . . . . . . . . Lineare Unabhängigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Die Orthogonaldarstellung einer Ebene . . . . . . . . . . . . . . . . . . . . Eigenschaften des Kreuzprodukts . . . . . . . . . . . . . . . . . . . . . . . . . Determinanten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Linearkombinationen und Koordinatenvektoren . . . . . . . . . . . . . Lineare Gleichungssysteme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 448 449 450 452 455 459 462 463 465 7. (3 × 3)-Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 467 Grundlegendes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Matrizen als lineare Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . . Invertierbarkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Der Invertierungsalgorithmus . . . . . . . . . . . . . . . . . . . . . . . . . . . . Die Elementarmatrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Eigenwerte und Eigenvektoren . . . . . . . . . . . . . . . . . . . . . . . . . . . © Oliver Deiser 468 470 474 475 477 479 Einführung in die Mathematik 1 6 Inhalt Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 481 5 . A b s c h n i t t M e h r d i m e n s i o n a l e A n a l y s i s . . . . . . . . . . . . . . 483 1. Kurven . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 485 Vektoren als Funktionswerte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Parametrisierte Kurven . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tangentialvektoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Die Länge einer Kurve . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 486 488 489 493 497 2. Partielle Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 499 Mehrdimensionale Definitionsbereiche . . . . . . . . . . . . . . . . . . . . Richtungsableitung und partielle Differenzierbarkeit . . . . . . . . . Gradienten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Anwendungen des Gradienten . . . . . . . . . . . . . . . . . . . . . . . . . . . . Allgemeine mehrdimensionale Funktionen . . . . . . . . . . . . . . . . . . Vektorfelder und Differentialoperatoren . . . . . . . . . . . . . . . . . . . Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 500 504 506 509 511 513 516 3. Mehrdimensionale Integration . . . . . . . . . . . . . . . . . . . . . . . . . . 519 Mehrdimensionale Integrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Das Cavalierische Prinzip . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Integration in Polarkoordinaten . . . . . . . . . . . . . . . . . . . . . . . . . . Inhalte von Rotationsflächen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 520 524 527 531 536 6 . A b s c h n i t t A n h ä n g e . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 537 1. Grundlagen über reelle Funktionen . . . . . . . . . . . . . . . . . . . . . . 539 Der Funktionsbegriff . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Reelle Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Zur Definition von Funktionen durch Terme . . . . . . . . . . . . . . . . Punktweise Operationen mit reellen Funktionen . . . . . . . . . . . . . 539 541 544 545 2. Axiome für die reellen Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . 547 Axiome für die Addition und Multiplikation . . . . . . . . . . . . . . . . . 547 Ordnungaxiome . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 548 Das Vollständigkeitsaxiom . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 548 3. Vollständige Induktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 549 4. Notationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 551 5. Index . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 555 Einführung in die Mathematik 1 © Oliver Deiser Vorwort Das vorliegende zweiteilige Werk möchte eine Einführung in die Mathematik an der Schnittstelle zwischen Schule und Hochschule geben, sowohl für das Fachstudium als auch das Studium des gymnasialen Lehramts. Die traditionelle Zweiteilung in Lineare Algebra und Analysis wird ersetzt durch einen breiten Zugang zur Mathematik, der die unantastbaren Merkmale dieser Wissenschaft − exaktes fachsprachliches Definieren und Formulieren von Ergebnissen und Fragen, anschauliches und formales Argumentieren − wahrt, aber zugleich grundlegende Erkenntnisse der Lehr- und Lernforschung berücksichtigt: Wissensanbindung, Transformationsprozesse und Perspektivenwechsel, Wiederholung, schrittweiser Erwerb einer Sprache. Im ersten Band werden elementare reelle Funktionen, der analytische Kalkül, reelle und komplexe Zahlen und die auf die Euklidische Ebene und den dreidimensionalen Euklidischen Raum fokussierte Lineare Algebra und analytische Geometrie behandelt. Die Themen des zweiten Bandes umfassen elementare Zahlen- und Graphentheorie, mathematische Strukturen, endliche Kombinatorik und Elemente der unendlichen Mengenlehre. In Anhängen werden Grundlagen im Umfeld von Junktoren, Quantoren, Mengen, Relationen, Funktionen und vollständiger Induktion im Überblick vorgestellt sowie Materialien zum Nachschlagen versammelt. Die genannten Themen können in geeigneter Auswahl im Rahmen von zwei umfangreichen Modulen behandelt werden, die durch Zusatzangebote (Ergänzungsübungen, Diskussionstutorien, Brückenkurse) oder ein Grundlagenmodul vervollständigt werden. Diese Vervollständigung erscheint dem Autor sehr wichtig, um die Sprache der Mathematik sicher zu erlernen. © Oliver Deiser Einführung in die Mathematik 1 8 Vorwort Für das Fachstudium kann eine „Einführung in die Mathematik 1/2“ parallel gelesen werden, für das Studium des Lehramts bietet sich mit Blick auf das zweite Fach und die Erziehungswissenschaften eine auf zwei Semester verteilte Durchführung an. Sich anschließende systematische Module zur Analysis und Linearen Algebra können eine solide Grundlage sowie eine Bekanntschaft mit Leitmotiven der Disziplin voraussetzen und sich so stärker auf ihre eigentlichen Themen konzentrieren. Mein Dank gilt allen Leserinnen und Lesern, die durch ihre genaue Lektüre und ihre Rückmeldungen mitgeholfen haben, die Darstellung zu verbessern. München, im September 2017 Oliver Deiser Einführung in die Mathematik 1 © Oliver Deiser 1. Abschnitt Elementare Funktionen © Oliver Deiser Einführung in die Mathematik 1 1. Geraden Die elementaren Funktionen sind die Grundfunktionen der Analysis. Zu ihnen gehören Geraden, Parabeln, allgemeine Polynome beliebigen Grades, rationale Funktionen, Exponentialfunktionen und Logarithmen zu beliebigen Basen, trigonometrische Funktionen und weiter alle Funktionen, die aus diesen Funktionen durch Addition, Multiplikation, Bildung der Umkehrfunktion und Verknüpfung hervorgehen. Wir beginnen unsere Untersuchung der elementaren Funktionen mit den Geraden. Sie spielen in der Analysis eine Schlüsselrolle bei der lokalen Approximation von Funktionen. © Oliver Deiser Einführung in die Mathematik 1 12 1. Abschnitt Elementare Funktionen Geraden und ihre Parameter Definition (Gerade) Seien a, b P R. Dann heißt die Funktion g : R → R mit g(x) = ax + b für alle x P R die (funktionale) Gerade mit der Steigung a und der y-Verschiebung oder dem Nullwert b. 10 5 4x -3 x + 4 8 -2 -1 1 2 3 -5 Drei Geraden Der Graph einer funktionalen Geraden ist eine Gerade im Sinne der Geometrie. Bemerkung (1) Die geometrischen Geraden der Ebene, die parallel zur y-Achse verlaufen, lassen sich nicht durch eine Funktion darstellen. Der Zusatz „funktional“ kann aber weggelassen werden, wenn man sich bewusst ist, dass unsere Geraden nicht alle Geraden der Ebene im geometrischen Sinne darstellen. (2) Eine Gerade g : R → R wird auch oft als lineare Funktion bezeichnet. Da die Begriffe Funktion und Abbildung in der Mathematik prinzipiell gleichwertig sind, ist etwas Vorsicht geboten, da unsere Geraden im Allgemeinen keine linearen Abbildungen im Sinne der Linearen Algebra sind (dies ist nur dann der Fall, wenn b = g(0) = 0). Im Umfeld der elementaren Funktionen ist die Sprechweise aber weit verbreitet und ungefährlich. Eine einfache, aber wichtige Gerade ist: Einführung in die Mathematik 1 © Oliver Deiser 1. Geraden 13 Definition (Identität) Die Gerade id : R → R mit id(x) = x für alle x P R heißt die Identität oder (erste) Winkelhalbierende auf R. Allgemeiner sind Geraden g der Form g(x) = ax mit beliebigem a P R. Sie verlaufen wie die Identität durch den Nullpunkt, unterscheiden sich aber von der Identität durch ihre Steigung. Ist a > 0, so ist die Gerade streng monoton steigend, ist a < 0, so ist sie streng monoton fallend. Je größer der Betrag von a ist, desto steiler verläuft der Graph von g. Im Fall a = 0 ist die Gerade die Nullfunktion. Eine Gerade der allgemeinen Form g : R → R mit g(x) = ax + b für alle x P R geht aus der Geraden h mit h(x) = ax durch die Verschiebung von h um b entlang der y-Achse hervor. Es gilt g(0) = b, was die Benennung von b als Nullwert motiviert. Ist a = 0, so ist g konstant gleich b. Im Fall einer von Null verschiedenen Steigung a hat g die eindeutige Nullstelle x1 = − b . a Mit Hilfe der Steigung a können wir die Änderung einer Geraden zwischen zwei Punkten bestimmen. Ist g die Gerade ax + b und sind x1 , x2 P R so gilt g(x1 ) − g(x2 ) = ax1 + b − ax2 − b = a(x1 − x2 ). Speziell ändern sich die Funktionswerte von g um a, wenn wir von einer Stelle x1 zur Stelle x2 = x1 + 1 gehen. Graphisch lässt sich dies durch ein Steigungsdreieck mit den Punkten (x1 , g(x1 )), (x2 , g(x1 )), (x2 , g(x2 )) darstellen. Für alle x1 ≠ x2 gilt a = g(x1 ) − g(x2 ) x1 − x2 = g(x2 ) − g(x1 ) , x2 − x1 sodass sich die Steigung der Geraden leicht bestimmen lässt, wenn die Funktionswerte an zwei verschiedenen Stellen bekannt sind. g(x2 ) g(x1 ) - g(x2 ) g(x1 ) x1 - x2 g(x) x1 © Oliver Deiser x2 Einführung in die Mathematik 1 14 1. Abschnitt Elementare Funktionen Die Gerade durch zwei gegebene Punkte Sind zwei Punkte (x1 , y1 ) und (x2 , y2 ) der Ebene mit x1 ≠ x2 gegeben, so gibt es genau eine Gerade g durch diese Punkte, d. h. eine Gerade g mit g(x1 ) = y1 und g(x2 ) = y2 . Die Steigung dieser Geraden berechnet sich nach obigen Überlegungen zu a = y1 − y2 x1 − x2 y2 − y1 . x2 − x1 = Die y-Verschiebung b erhalten wir aus y1 = g(x1 ) = ax1 + b, sodass b = y1 − ax1 = x1 y1 − x2 y1 − x1 y1 + x1 y2 x1 − x2 = x1 y2 − x2 y1 . x1 − x2 Insgesamt gilt also g(x) = ax + b = y1 − y2 x + x1 − x2 x1 y2 − x2 y1 x1 − x2 für alle x P R. Die Größe x1 y2 − x2 y1 im Zähler von b wird uns später bei den Determinanten wieder begegnen. Beispiel Für die Gerade g : R → R durch die Punkte (2, 4) und (5, 1) gilt 4−1 x + 2−5 g(x) = 2⋅1 − 5⋅4 2−5 = − x + 6 für alle x P R. 6 5 4 g(x) 3 4 1 2 1 1 2 3 4 5 6 Die Gerade durch die Punkte (2, 4) und (5, 1) Einen alternativen Ansatz der Konstruktion einer Geraden durch zwei gegebene Punkte diskutieren wir in den Übungen und allgemeiner im folgenden Kapitel. Einführung in die Mathematik 1 © Oliver Deiser 1. Geraden 15 Die Steigungsform Sei g die Gerade ax + b. Ist nun p P R ein Punkt von Interesse, so ist oft eine Darstellung von g von Vorteil, die den Punkt p als „neuen Ursprung“ oder „Entwicklungspunkt“ ansieht. Hierzu fassen wir die Gerade g als die um p entlang der x1 -Achse und g(p) = ap + b entlang der y-Achse verschobene Gerade ax auf. Damit gilt g(x) = a(x − p) + g(p) für alle x P R. (Steigungsform im Punkt p) Anstelle von „Steigungsform“ spricht man gleichwertig auch von einer PunktRichtungsdarstellung. Die Gerade g verläuft durch den Punkt (p, g(p)) in der Richtung des Vektors (1, a). g(p+1) a g(p) g(x) 1 p+1 p Zur Steigungsform einer Geraden (I) Die Steigungsform lässt sich auch rechnerisch erhalten, da g(x) = ax + b = ax + b + g(p) − g(p) = ax + b + g(p) − ap − b = a(x − p) + g(p) für alle x P R. Mit Hilfe des anschaulichen Verschiebungsarguments lässt sich diese wichtige Form aber vielleicht leichter merken: Steigung mal x verschoben um p plus Funktionswert © Oliver Deiser Einführung in die Mathematik 1 16 1. Abschnitt Elementare Funktionen Beispiel Wir betrachten die Steigungsform nochmal anhand der konkreten Geraden g : R → R mit g(x) = 3(x − 1) + 8 für alle x P R. Die Gerade g hat die Steigung 3, x-Verschiebung 1 und relative y-Verschiebung 8 (relativ zur x-Verschiebung 1). Die y-Verschiebung relativ zur Stelle 0 ist 5, sodass g(x) = 3x + 5 für alle x P R. 10 3 (x - 1) + 8 8 11 5 g(x) = 3 (x - 1) + 8 -2 -1 1 2 3 15 10 5 3 (x - 1) + 8 g(x) = 3 (x - 1) + 8 3 (x - 1) 3x -2 -1 1 2 3 -5 -10 Zur Steigungsform einer Geraden (II). Das zweite Diagramm zeigt, wie g durch eine zweifache Achsenverschiebung einer Geraden erhalten werden kann, die durch den Ursprung verläuft und die Steigung von g besitzt. Einführung in die Mathematik 1 © Oliver Deiser 1. Geraden 17 Die Tangente einer differenzierbaren Funktion Die Steigungsform wird in der Differentialrechnung zur lokalen Approximation von Funktionen eingesetzt: Hat eine Funktion f : R → R an einer Stelle p P R die Ableitung f ′(p) = a, so heißt die Gerade g : R → R mit g(x) = f ′(p) (x − p) + f(p) für alle x P R die Tangente von f durch den Punkt (p, f(p)). An der Stelle p ist die Tangente die aus linearer Sicht bestmögliche Approximation an die Funktion f: Sie stimmt mit der Funktion f in Funktionswert und Steigung an der Stelle p überein. Wir betrachten Tangenten und ihre Approximationseigenschaften im zweiten Abschnitt genauer. g(x) f(x) f(p) p Die Tangente einer differenzierbaren Funktion f an einer Stelle p h(x) = f(x) - g(x) f(p) p Die Differenz h zwischen f und der Tangente g an der Stelle p © Oliver Deiser Einführung in die Mathematik 1 18 1. Abschnitt Elementare Funktionen Übungen Übung 1 (a) Bestimmen Sie die Steigungsform einer Geraden g : R → R durch zwei Punkte (x1 , y1 ) und (x2 , y2 ), x1 ≠ x2 in den Entwicklungspunkten x1 und x2 . (b) Nehmen Sie nun an, dass y1 und y2 die Werte einer Funktion f : R → R an den Stellen x1 und x2 sind. Schreiben Sie die Steigungsformen für diese Situation auf und erstellen ein zugehöriges Diagramm. Übung 2 Sei f : R → R eine Funktion. Es gebe eine Konstante c P R mit der Eigenschaft: (+) Für alle x, y P R mit x ≠ y ist f(x) − f(y) = c. x−y Zeigen Sie, dass f eine Gerade ist. Betrachten Sie nun die schwächere Eigenschaft (++) Für alle x P R ist f(x + 1) − f(x) = f(x + 1) − f(x) = c. 1 Folgt hieraus ebenfalls, dass f eine Gerade ist? Übung 3 Seien g, h : R → R Geraden. Weiter sei f = h + g, d. h. es gilt f(x) = h(g(x)) für alle x P R. Zeigen Sie, dass f eine Gerade ist. Finden Sie eine Bedingung für f(0) = 0. Übung 4 Für welche Geraden g : R → R gilt g(x + y) = g(x) + g(y) für alle x, y P R? Übung 5 Sei g : R → R eine Gerade. Bestimmen Sie: (a) die Gerade g1 : R → R, deren Graph der an der x-Achse gespiegelte Graph von g ist, (b) die Gerade g2 : R → R, deren Graph der an der y-Achse gespiegelte Graph von g ist, (c) die Gerade g3 : R → R, deren Graph der am Nullpunkt gespiegelte Graph von g ist. Einführung in die Mathematik 1 © Oliver Deiser 1. Geraden 19 Übung 6 Wann besitzen zwei Geraden g, h : R → R genau einen Schnittpunkt? Finden Sie ein Kriterium für die vier Parameter der Geraden und beweisen Sie es. Leiten Sie zudem im Fall der eindeutigen Existenz eine Formel für den Schnittpunkt her. Übung 7 Wie kann man feststellen, ob drei Punkte (x1 , y1 ), (x2 , y2 ), (x3 , y3 ) der Ebene mit paarweise verschiedenen x1 , x2 , x3 auf einer Geraden g : R → R liegen? Diskutieren Sie verschiedene Möglichkeiten. Übung 8 Sei g : R → R eine Gerade, und seien x1 , x2 P R mit x1 ≠ x2 . Zeigen Sie, dass sich g eindeutig als Summe zweier Geraden g1 , g2 : R → R mit g(x1 ) = 0 und g(x2 ) = 0 darstellen lässt. Bestimmen Sie zudem die Koeffizienten der Darstellung g(x) = c1 (x − x1 ) + c2 (x − x2 ) für alle x P R. Gewinnen Sie hieraus eine neue Konstruktionsmöglichkeit der eindeutigen Geraden durch zwei gegebene Punkte (x1 , y1 ) und (x2 , y2 ) mit x1 ≠ x2 . Zeichnen Sie ein Diagramm zur Illustration. © Oliver Deiser Einführung in die Mathematik 1 2. Parabeln Wir betrachten nun Parabeln, die bereits deutlich schwieriger zu beherrschen sind als Geraden. Wesentliches Hilfsmittel ist die Überführung in Scheitelform. Sie erlaubt uns, die geometrische Lage einer Parabel zu erkennen. Mit ihrer Hilfe gewinnen wir die Mitternachtsformel für die Nullstellen. © Oliver Deiser Einführung in die Mathematik 1 22 1. Abschnitt Elementare Funktionen Parabeln und ihre Parameter Definition (Parabel) Seien a, b, c P R mit a ≠ 0. Dann heißt die Funktion f : R → R mit f(x) = ax2 + bx + c für alle x P R die (funktionale) Parabel mit der Öffnung a, Nullpunktsteigung b und dem Nullwert c. Wie bei den Geraden fängt der Begriff nicht alle geometrischen Parabeln ein. Diesmal sind sogar nur sehr spezielle geometrische Parabeln funktional darstellbar, nämlich genau diejenigen, deren Mittelachse parallel zur y-Achse verläuft. Wir lassen dennoch den Zusatz „funktional“ wieder weg. Anstelle von einer „Parabel“ spricht man gleichwertig auch von einer quadratischen Funktion. 12 10 8 x2 - x + 1 6 x2 - 2 x + 1 x2 - 3 x + 1 4 2 -2 -1 1 2 3 4 -2 Die Einheitsparabel und die Wurzelfunktion Die einfachste Parabel ist: Definition (Einheitsparabel) Die Parabel sq : R → R mit sq(x) = x2 für alle x P R heißt die Einheitsparabel oder Normalparabel (mit sq für engl. square). Die Einheitsparabel ist eine gerade Funktion und verläuft durch die Punkte (0, 0), (1/2, 1/4), (1, 1), (2, 4). Einführung in die Mathematik 1 © Oliver Deiser 2. Parabeln 23 4 x2 3 2 1 -2 -1 1 2 Die Einheitsparabel Auf dem Intervall [0, ∞[ ist die Funktion streng monoton wachsend, sodass wir sie dort umkehren können: Definition (Quadratwurzel) Die Umkehrfunktion der auf das Intervall [ 0, ∞ [ eingeschränkten Einheitsparabel heißt die Quadratwurzelfunktion. Wir bezeichnen sie mit sqrt : [ 0, ∞ [ → [ 0, ∞ [ (für engl. square root). Weiter schreiben wir auch £x anstelle von sqrt(x). Für alle x ≥ 0 heißt sqrt(x) die Quadratwurzel oder kurz Wurzel von x. Die Wurzelfunktion ist nur für nichtnegative reelle Zahlen definiert und sie besitzt nur nichtnegative Werte. Nach Definition als Umkehrfunktion der auf [ 0, ∞ [ eingeschränkten Quadratfunktion gilt sqrt(sq(x)) = x = sq(sqrt(x)) für alle x P [ 0, ∞ [ oder gleichwertig £x2 = x = ( £x ) 2 für alle x P [ 0, ∞ [. Weiter ist die Wurzel aus x2 wegen x2 ≥ 0 zwar für alle reellen Zahlen x definiert, sie ergibt aber im Allgemeinen nicht x, sondern den Betrag von x: £x2 = |x| für alle x P R. (Formel vom nicht vergessenen Betrag) Es ist eine zeitlose Fehlerquelle, den Betrag zu vergessen. Der Leser möge sich die Beziehung anhand von Beispielen vor Augen führen: Für x = −2 gilt x2 = 4 und die Wurzel aus 4 ist 2 und nicht −2. © Oliver Deiser Einführung in die Mathematik 1 24 1. Abschnitt Elementare Funktionen 2.0 x 1.5 1.0 0.5 1 2 3 4 3.0 2.5 2.0 x 1.5 x2 x 1.0 0.5 0.0 0.5 1.0 1.5 2.0 2.5 3.0 Die Wurzelfunktion als Umkehrfunktion des rechten Astes der Einheitsparabel Beim Rechnen mit Wurzeln ist die Vorzeichenfunktion sgn : R → { −1, 0, 1 } hilfreich, die durch sgn(x) = 1 für x > 0, sgn(x) = −1 für x < 0, sgn(0) = 0 definiert ist (mit sgn für lateinisch signum oder engl. sign). Es gilt x = sgn(x) |x| und |x| = x sgn(x) für alle x P R. Für alle x P R und y ≥ 0 gilt damit £x2 y = £x2 £y = |x| £y = sgn(x) x £y. Einführung in die Mathematik 1 © Oliver Deiser 2. Parabeln 25 1.0 sgn(x) 0.5 -2 -1 1 2 -0.5 -1.0 Parabeln mit Parameter b = 0 Wir betrachten eine Parabel der Form ax2 mit einer von 0 verschiedenen reellen Zahl a. Eine derartige Parabel ist durch ihre Öffnung a charakterisiert: (1) Ist a positiv (negativ), so ist die Parabel nach oben (unten) geöffnet. (2) Die Parabel ax2 verläuft durch den Punkt (1, a). Je größer der Betrag von a ist, desto enger ist der Graph der Parabel. (3) Die Parabel ax2 ist eine gerade Funktion, da a(−x)2 = ax2 für alle x P R. Sie verläuft durch den Nullpunkt sowie durch (1/2, a/4), (1, a), (2, 4a). Unproblematisch ist der Parameter c: Eine Parabel der Form ax2 + c entsteht aus der Parabel ax2 durch Verschiebung um den Wert c entlang der y-Achse. Auch diese Funktionen sind gerade. 15 10 x2 +1 2 5 -x2 + 2 2 x2 - 2 -3 -2 -1 1 2 3 -5 © Oliver Deiser Einführung in die Mathematik 1 26 1. Abschnitt Elementare Funktionen Überführung in Scheitelform Wir betrachten nun eine allgemeine Parabel f : R → R der Form f(x) = ax2 + bx + c für alle x P R. Wie sieht der Graph von f aus? Besitzt der Graph überhaupt immer die geometrische Form einer Parabel? Dies ist zunächst keineswegs klar! Man würde f nicht eine Parabel nennen, wenn es anders wäre. Aber die Frage nach dem Warum bleibt. Die geometrische Wirkung einer Veränderung des Parameters b ist nicht so einfach zu erklären wie eine Veränderung von a oder c. Ansatz I: Geometrische Verschiebung Um zu zeigen, dass f die Form einer Parabel hat, können wir so vorgehen: Wir zeigen, dass f die Verschiebung der Parabel ax2 um eine gewisse Konstante x0 entlang der x-Achse und eine gewisse Konstante y0 entlang der y-Achse ist. Analytisch entspricht eine derartige Verschiebung dem Übergang von x zu x − x0 und der Addition von y0 . Es genügt also, den folgenden Satz zu beweisen: Satz (Verschiebungssatz für Parabeln) Eine Parabel ax2 + bx + c ist eine Verschiebung der Parabel ax entlang der Achsen: Es gibt x0 , y0 P R mit (+) ax2 + bx + c = a(x − x0 )2 + y0 für alle x P R. Beweis Die Aussage (+) ist äquivalent zu ax2 + bx + c = ax2 − 2ax0 x + ax0 2 + y0 für alle x P R. Durch Koeffizientenvergleich können wir x0 und y0 bestimmen: Aus b = −2ax0 , c = ax0 2 + y0 erhalten wir x0 = − b , 2a y0 = c − ax0 2 = c − a b2 4 a2 = c − b2 . 4a Einsetzen zeigt, dass x0 und y0 wie gewünscht sind. Wir können die x0 -y0 -Verschiebung in einer beliebigen Reihenfolge durchführen, also zuerst entlang der x-Achse und dann entlang der y-Achse verschieben oder umgekehrt. Die Öffnung a der Parabel bleibt dabei gleich. Die im Beweis gefundenen Werte für x0 und y0 halten wir in einer Definition fest: Einführung in die Mathematik 1 © Oliver Deiser 2. Parabeln 27 Definition (Scheitelpunkt, Scheitelform) Sei f : R → R, f(x) = ax2 + bx + c eine Parabel. Dann heißt der Punkt (x0 , y0 ) = (− b , c − 2a b2 4a ) der Ebene der Scheitelpunkt und die Darstellung f(x) = a(x − x0 )2 + y0 die Scheitelform der Parabel. 35 30 25 (x - 2)2 + 10 20 (x - 2)2 x2 15 10 5 -2 2 4 6 Achsenverschiebung von x2 um 2 nach rechts und 10 nach oben 5 -1 1 2 3 4 5 -2 (x - 2)2 + 5 5 -5 -10 Eine Parabel in Scheitelform. Der Scheitelpunkt ist (2, 5) © Oliver Deiser Einführung in die Mathematik 1 28 1. Abschnitt Elementare Funktionen Ansatz II: Quadratische Ergänzung Wir haben die Formel für den Scheitelpunkt durch einen geometrisch motivierten Ansatz gewonnen. Bei einer etwas anderen Herleitung, bekannt als quadratische Ergänzung, steht die algebraische Umformung mit Hilfe der binomischen Formel im Vordergrund. Ausgangspunkt ist ax2 + bx + c. Ausklammern von a liefert die Form ( a x2 + b x a )+c bzw. a(x2 − 2qx) + c, wobei q = − b . 2a Durch Einfügen von 0 = q2 − q2 können wir die binomische Formel anwenden: a(x2 − 2qx) + c = a(x2 − 2qx + q 2 − q 2 ) + c = a((x − q)2 − q 2 ) + c = a(x − q)2 + c − aq2 . Damit haben wir die Scheitelform wiedergefunden (mit x0 = q). Die quadratische Ergänzung hat den Vorteil, dass wir eine Parabel schnell in Scheitelform überführen können. Wir müssen nur den algebraischen Trick des Einschiebens der Null anwenden, der die binomische Formel ins Spiel bringt. Obige Definition von q ist motiviert durch den Wunsch nach einem Faktor 2 im mittleren Term (ob wir ein negatives oder positives Vorzeichen für diesen anstreben, ist Geschmackssache; der Buchstabe „q“ steht für „quadratisch“, man kann natürlich auch gleich mit x0 arbeiten). Wer eine direkte Rechnung bevorzugt, kann die quadratische Ergänzung so durchführen: ( ax2 + bx + c = a x2 + ( = a x+ b x a b 2a )2 )+c + c − ( = a x2 + b x + a b2 b2 − 4a2 4a2 )+c b2 . 4a Ansatz III: Verwendung der Ableitung Mit Methoden der Differentialrechnung lässt sich der Scheitelpunkt besonders elegant finden. Es gilt d ax2 + bx + c = 2ax + b. dx Die Ableitung wechselt an der Stelle x0 = −b/(2a) ihr Vorzeichen, sodass dort ein lokales Extremum vorliegt. Den Wert y0 erhalten wir durch y0 = ax0 2 + bx0 + c. Die Ableitung zeigt auch, warum wir den zweiten Koeffizienten b als Nullpunktsteigung bezeichnet haben: Es gilt f ′(0) = b. Wegen f(0) = c verläuft die Parabel also durch den Punkt (0, c) mit der Steigung b. Diese Information ist beim Zeichnen per Hand oft hilfreich. Einführung in die Mathematik 1 © Oliver Deiser 2. Parabeln 29 Ein Vergleich Die folgende Tabelle zeigt die polynomielle Darstellung ax2 + bx + c und die Scheitelform a(x − x0 ) + y0 einer Parabel im Vergleich. Beide Darstellungen haben drei Parameter und die Tabellen geben an, ob sich Öffnung und Verschiebung der Parabel bei einer Änderung der Parameter ändert oder nicht. Parameter Öffnung x-Verschiebung y-Verschiebung a ja ja ja b nein ja ja c nein nein ja 2 Wirkung einer Parameteränderung für die Form ax + bx + c Parameter Öffnung x-Verschiebung y-Verschiebung a ja nein nein x0 nein ja nein y0 nein nein ja Wirkung einer Parameteränderung für die Scheitelform a(x − x0 )2 + y0 15 10 5 -6 -4 -2 2 4 6 -5 -10 Die Parabeln x2 + bx für die dreizehn Parameter b = −6, −5,−4, …, 4, 5, 6. Die Scheitelpunkte der Parabeln befinden sich auf der Parabel −x2 . © Oliver Deiser Einführung in die Mathematik 1 30 1. Abschnitt Elementare Funktionen Bestimmung der Nullstellen Wir betrachten nun die Nullstellen einer Parabel. Auch hier ist die Scheitelform nützlich: Eine Parabel a(x − x0 )2 + y0 in Scheitelform hat die Nullstellen x1,2 = x0 ± £− y0 /a, y0 ≥ 0, a falls − wobei x1 dem positiven Vorzeichen und x2 dem negativen Vorzeichen entspricht, sodass x1 ≥ x2 . Mit Hilfe unserer Formel für den Scheitelpunkt (x0 , y0 ) = (− b , c − 2a b2 4a ) einer beliebigen Parabel ax2 + bx + c gewinnen wir eine allgemeine Formel für die Nullstellen. Sie berechnen sich zu s b2 − 4ac −b ± x1,2 = x0 ± £− y0 /a = 4a2 2a −b 2a ± £b2 − 4ac 2|a| = −b ± sgn(a) £b2 − 4ac , 2a falls b − 4ac ≥ 0. Der Wert b2 − 4ac heißt die Diskriminante der Parabel. Ihr Vorzeichen entscheidet über die Existenz von Nullstellen. Bei unserer Berechnung haben wir das Vorzeichen sgn(a) verwendet, um einen gemeinsamen Nenner zu erreichen. Für negative a wird ± zu . Damit ist immer x1 ≥ x2 , wie bei den Nullstellen einer Parabel in Scheitelform. Um die Formel zu vereinfachen, können wir aufgrund des Auftretens von ± das Signum auch unterdrücken. Dann gilt allerdings x1 ≤ x2 für a < 0. 2 ± y0 y0 a x0 y0 a Der Abstand der Nullstellen von der x-Koordinate des Scheitelpunktes Einführung in die Mathematik 1 © Oliver Deiser 2. Parabeln 31 Wir fassen unsere Ergebnisse in einem Satz zusammen. Satz (Nullstellen von Parabeln) Eine Parabel ax2 + bx + c hat im Fall einer nichtnegativen Diskriminante d = b2 − 4ac ≥ 0 genau die Nullstellen x1,2 = −b ± £b2 − 4ac . 2a (Lösungsformel, Mitternachtsformel) Ist d = 0, so gilt x1 = x2 . Andernfalls gilt x1 ≠ x2 . Im Fall d < 0 hat die Parabel keine Nullstellen. Ist x1 = x2 (d. h. y0 = 0), so sagen wir, dass die Parabel eine doppelte Nullstelle besitzt. Der Scheitelpunkt (x0 , y0 ) = (x0 , 0) berührt dann die x-Achse. Parabeln mit vorgegebenen Nullstellen Die Mitternachtsformel erlaubt die Berechnung der Nullstellen x1 , x2 mit Hilfe der Parameter a, b, c einer Parabel. Es stellt sich umgekehrt die Frage, ob und wie die Parameter mit Hilfe vorgegebener Nullstellen berechnet werden können. Da die Multiplikation einer Parabel mit einer Konstanten die Nullstellen unverändert lässt, sind die Parameter a, b, c durch die Nullstellen x1 , x2 nicht eindeutig bestimmt. Eindeutig erreichen wir, wenn wir normierte Parabeln (mit der Öffnung a = 1) betrachten: Satz (Vietascher Wurzelsatz) Seien b, c P R, und seien x1 , x2 die (nicht notwendig verschiedenen) Nullstellen von x2 + bx + c. Dann gilt: b = −(x1 + x2 ), c = x1 x2 . (Formeln von Vieta) Wir geben zwei Beweise des Satzes. Beweis mit Hilfe der Mitternachtsformel Nach der Mitternachtsformel gilt wegen a = 1: 2x1,2 = −b ± £b2 − 4c Wir setzen w = £b2 − 4c. Dann gilt −(x1 + x2 ) = x1 x2 = b−w+b+w 2 b2 − w2 4 © Oliver Deiser = b, = c. Einführung in die Mathematik 1 32 1. Abschnitt Elementare Funktionen Beweis durch Koeffizientenvergleich Da sich Nullstellen abspalten lassen, gilt: x2 + bx + c = (x − x1 )(x − x2 ) für alle x P R. Ausmultiplizieren der rechten Seite liefert x2 + bx + c = x2 − (x1 + x2 )x + x1 x2 für alle x P R. Die Formeln von Vieta ergeben sich nun durch Koeffizientenvergleich. Korollar (Parabeln mit vorgegebenen Nullstellen) Seien x1 , x2 P R und sei g = x2 − (x1 + x2 ) + x1 x2 . Dann sind die Parabeln, die x1 und x2 als Nullstellen besitzen, genau die Funktionen der Form a g = a (x − x1 ) (x − x2 ) mit a P R*. Eine Parabel der Öffnung 1, die zwei Nullstellen besitzt, lässt sich also eindeutig als Produkt zweier Geraden der Steigung schreiben. 10 f(x) 5 x2 - 6 x + 5 2 4 6 x-1 x-5 -5 -10 10 f(x) 5 2 x2 - 12 x + 10 2 4 6 x-1 2 (x - 5) -5 -10 Zwei Parabeln mit den Nullstellen 1 und 5, dargestellt als Produkt zweier Geraden Einführung in die Mathematik 1 © Oliver Deiser 2. Parabeln 33 Die Parabel durch drei gegebene Punkte Seien (x1 , y1 ), (x2 , y2 ), (x3 , y3 ) Punkte der Ebene mit paarweise verschiedenen x-Koordinaten x1 , x2 , x3 , die nicht auf einer Geraden liegen. Wir zeigen, dass es genau eine Parabel ax2 + bx + c gibt, die durch diese Punkte verläuft. Eine Möglichkeit ist, das Gleichungssystem a x1 2 + b x1 + c = y1 a x2 2 + b x2 + c = y2 a x3 2 + b x3 + c = y3 in den Unbekannten a,b,c zu lösen. Eleganter ist ein auf Lagrange zurückgehenden Ansatz, der auf der Beobachtung beruht, dass die Parabel (x − x2 )(x − x3 ) (x1 − x2 )(x1 − x3 ) Nullstellen bei x2 und x3 besitzt und an der Stelle x1 den Wert 1 annimmt. Durch Skalierung und symmetrische Summation erhalten wir die Funktion y1 (x − x2 )(x − x3 ) (x1 − x2 )(x1 − x3 ) + y2 (x − x1 )(x − x3 ) (x2 − x1 )(x2 − x3 ) + y3 (x − x1 )(x − x2 ) , (x3 − x1 )(x3 − x2 ) die per Konstruktion durch die drei Punkte verläuft. Ausmultiplizieren zeigt, dass diese Funktion eine Parabel oder eine Gerade ist. Da die drei Punkte nicht auf einer Geraden liegen, ist der zweite Fall unmöglich. Dies zeigt die Existenz. Die Eindeutigkeit können wir so einsehen: Verlaufen zwei Parabeln f und g durch die drei gegebenen Punkte, so ist f − g eine Funktion der Form ax2 + bx + c mit den drei verschiedenen Nullstellen x1 , x2 und x3 . Dann ist aber f − g die Nullfunktion, da alle anderen Funktionen der Form ax2 + bx + c höchstens zwei Nullstellen besitzen. Damit ist f = g. Beispiel Die eindeutige Parabel durch die Punkte (x1 , y1 ) = (0, 2), (x2 , y2 ) = (1, 1), (x3 , y3 ) = (3, 3) berechnet sich zu 2 (x − 1)(x − 3) (0 − 1)(0 − 3) + 1 = 2 (x − 1)(x − 3) − 3 = 1 2x2 − 5x + 6 . 3 ( © Oliver Deiser (x − 0)(x − 3) (1 − 0)(1 − 3) 1 x(x − 3) + 2 + 3 (x − 0)(x − 1) (3 − 0)(3 − 1) 1 x(x − 1) 2 ) Einführung in die Mathematik 1 34 1. Abschnitt Elementare Funktionen 5 4 3 1 2 x2 - 5 x + 6 3 2 (x - 3) (x - 1) 3 1 - (x - 3) x 2 1 (x - 1) x 2 2 1 -1 1 2 3 4 -1 Die eindeutige Parabel durch die drei Punkte (0, 2), (1, 1), (3, 3), dargestellt als Summe dreier Parabeln. Brennpunkt und Leitlinie Wir besprechen noch einige geometrische Eigenschaften von Parabeln. Dabei konzentrieren wir uns auf Parabeln der Form ax2 . Definition (Brennpunkt und Leitlinie) Der Brennpunkt einer Parabel ax2 ist der Punkt F = (0, a/4). Die Leitlinie L von ax2 ist die zur x-Achse parallele Gerade durch den Punkt −F. Statt Brennpunkt ist auch Fokuspunkt oder kurz Fokus üblich. Die Leitlinie ist auch als Direktrix bekannt. Die beiden Objekte sind durch die folgenden Eigenschaften ausgezeichnet: (1) Im Brennpunkt einer Parabel ax2 laufen alle zur y-Achse parallelen Strahlen zusammen, die an der Tangente der Parabel reflektiert werden. (2) Die Parabel ax2 ist die Menge aller Punkte P der Ebene, deren Abstand zu F gleich ihrem Abstand zu L ist. (Dabei ist der Abstand von P und L definiert als die Länge des Lotes von P auf L.) Einführung in die Mathematik 1 © Oliver Deiser 2. Parabeln 35 Die folgenden Diagramme illustrieren diese Eigenschaften. Ihr Beweis sei dem Leser zur Übung überlassen. 2 1 F -2 -1 1 2 Der Brennpunkt F = (0, 1/4) der Einheitsparabel 2 1 d d F -2 -1 1 2 L Die Leitlinie L der Einheitsparabel © Oliver Deiser Einführung in die Mathematik 1 36 1. Abschnitt Elementare Funktionen Das Problem der Winkeldrittelung In der Geschichte der Mathematik spielen die drei klassischen Probleme der antiken Geometrie eine wichtige Rolle: (A) Quadratur des Kreises (B) Winkeltrisektion (C) Würfelverdoppelung (Delisches Problem) Alle Probleme stellen die Frage, ob es möglich ist, eine bestimmte geometrische Größe mit Hilfe von Zirkel und Lineal zu konstruieren. Die Quadratur des Kreises ist die Aufgabe, einen Kreis mit Hilfe von Zirkel und Lineal in ein flächengleiches Quadrat zu verwandeln. Die Winkeltrisektion verlangt für einen beliebig vorgegebenen Winkel α die Konstruktion von α/3. Und bei der Würfelverdoppelung ist zu einem Würfel der Kantenlänge a ein zweiter Würfel mit dem doppelten Volumen (also der Kantenlänge 3 £2a) zu erzeugen. Erst im 19. Jahrhundert konnte gezeigt werden, dass die drei Konstruktionsaufgaben mit Zirkel und Lineal nicht lösbar sind. Beteiligt an den Unmöglichkeitsnachweisen waren insbesondere Carl Friedrich Gauß, Niels Henrik Abel, Évariste Galois, Pierre-Laurant Wantzel und Ferdinand von Lindemann. Die entwickelten algebraischen Methoden erlauben eine Detailanalyse der Problematik. So ergibt sich zum Beispiel, dass die Drittelung des in jedem gleichseitigen Dreieck auftauchenden Winkels π/3 nicht möglich ist. Bereits Descartes konnte jedoch zeigen, dass die Winkeltrisektion gelingt, wenn zusätzlich zu Zirkel und Lineal Parabeln verwendet werden dürfen (genauer genügt die Einheitsparabel). Die folgende Konstruktion verwendet die Parabel 2x2 : Wir starten mit einem Punkt P = (x, y) = (cos α, sin α) auf dem Einheitskreis mit x,y > 0. Ziel ist, den Winkel α zu dritteln. (1) Wir konstruieren den Punkt Q = (x/2, 1). (2) Nun bilden wir den Kreis mit dem Mittelpunkt Q durch den Nullpunkt. Der Schnitt dieses Kreises mit dem rechten Ast der Parabel 2x2 liefert den Punkt R. (3) Die Senkrechte durch R trifft den Einheitskreis im Punkt S. Man kann zeigen, dass der Punkt S den Winkel α/3 mit der positiven x-Achse einschließt. Das folgende Diagramm visualisiert die Konstruktion. Dabei ist α = π/3, sodass sich ein 20 Grad Winkel ergibt. Einführung in die Mathematik 1 © Oliver Deiser 2. Parabeln 37 2.0 2x2 R 1.5 Q 1.0 P 0.5 S -1.0 -0.5 0.5 1.0 Winkeldrittelung mit Hilfe der Parabel 2x2 Auch das Problem der Würfelverdoppelung lässt sich mit erweiterten Hilfsmitteln lösen. Gegeben a > 0 kann eine Strecke der Länge 3 £a mit Hilfe einer Parabel und einer Hyperbel konstruiert werden; eine derartige Konstruktion wird bereits dem antiken Mathematiker Menaichmos zugeschrieben. Wesentlich schwieriger ist dagegen das Problem der Quadratur des Kreises. Parabeln, Hyperbeln, Ellipsen und noch weitaus allgemeinere algebraische Kurven reichen nicht aus, eine Strecke der Länge π zu konstruieren. Näherungskonstruktionen Aus der Winkeldrittelung mit Hilfe einer Parabel lassen sich beliebig genaue Näherungslösungen gewinnen, die nur Zirkel und Lineal verwenden. Hierzu wird der rechte Ast der Parabel 2x2 für ein beliebiges n ≥ 1 durch den Streckenzug ersetzt, der durch die n + 1 Punkte (tk , 2tk 2 ) mit t0 = 0, t1 = 1/n, t2 = 2/n, …, tn = 1. definiert wird. Dieser Streckenzug ist mit Zirkel und Lineal konstruierbar. Eine Konstruktion, die für eine Parabel a x2 mit einer beliebigen Öffnung a geeignet ist, ist die folgende: (1) Gegeben sei ein Punkt P = (p, q) mit p > 0 und ein n ≥ 1. Wir konstruieren n + 1 Punkte auf der Parabel ax2 mit der Öffnung a = q/p2 . Zwei der Punkte sind der Nullpunkt O und der Punkt P. © Oliver Deiser Einführung in die Mathematik 1 38 1. Abschnitt Elementare Funktionen (2) Wir setzen P0 = (p, 0) und unterteilen die Strecken OP0 und P0 P in je n gleichlange Teile. (3) Wir zeichnen zur y-Achse parallele Geraden durch die Teilpunkte von OP0 . Weiter verbinden wir den Nullpunkt O mit den Teilpunkten von P0 P durch Geradenstücke. (4) Die Schnittpunkte der einander entsprechenden Geraden aus (3) und (4) liegen auf der Parabel a x2 (Beweis als Übung). q = ap2 P p Konstruktion von Punkten auf einer Parabel der Öffnung a bei gegebenem Punkt P. Auf der linken Seite ist gespiegelt der approximierende Steckenzug gezeigt. Führen wir die Winkeldrittelung für α = π/3 mit einer approximierten Parabel 2x2 durch, so erhalten wir in Grad angegeben die Winkel 20,854763… für n = 4 20,279338… für n = 8 20,009275… für n = 16 20,004528… für n = 32 20,002107… für n = 64 20,000884… für n = 128. Einführung in die Mathematik 1 © Oliver Deiser 2. Parabeln 39 Kreise, Ellipsen und Hyperbeln Mit Hilfe der Einheitsparabel und der Wurzelfunktion können wir Kreisbögen erzeugen. Für alle r > 0 stellen die beiden Funktionen fr , gr : [−r, r ] → R mit fr (x) = £r2 − x2 , gr (x) = − £r2 − x2 für alle x P [ −r, r ] die obere bzw. untere Hälfte des Kreises Kr = { (x, y) P R2 | x2 + y2 = r2 } mit Radius r und Mittelpunkt 0 dar. Zum Beweis lösen wir definierende Gleichung x2 + y2 = r2 des Kreises nach y auf. Wir erhalten: y = ±£r2 − x2 . Der Radikand ist genau dann größergleich 0, wenn x2 ≤ r2 , d. h. wenn |x| ≤ r. Dies liefert die Definition von fr und gr . 3 2 1 - x2 2 - x2 3 - x2 1 - 1 - x2 - 2 - x2 - 3 - x2 -2 -1 1 2 1 - x2 2 - x2 3 - x2 -1 -2 Verformung von Parabelbögen zu Kreisbögen durch Anwendung der Wurzelfunktion © Oliver Deiser Einführung in die Mathematik 1 40 1. Abschnitt Elementare Funktionen Ellipsen Durch Skalierung der Funktionswerte erhalten wir in y-Richtung gestauchte oder gestreckte Kreise und damit achsenparallele Ellipsen. Denn eine achsenparallele Ellipse mit den Halbachsen a, b > 0 ist definiert durch Ea, b = { (x, y) P R2 | (x/a)2 + (y/b)2 = 1 }. Auflösen der definierenden Gleichung nach y liefert y = ± b £a2 − x2 . a Damit stellen die Funktionen c fa und c ga mit c = b/a die obere bzw. untere Hälfte der Ellipse Ea, b dar. 2 1 -2 -1 1 -1 1 2 1 - x2 5 4 2 - x2 2 3 3 - x2 2 - 1 2 1 - x2 - 5 4 2 - x2 - 2 3 3 - x2 -2 Funktional dargestellte Ellipsen Um die geometrischen Eigenschaften einer Ellipse Ea, b mit den Halbachsen a ≥ b > 0 zu beschreiben, definieren wir: e = £a2 − b2 (lineare Exzentrizität) ε = e/a = £1 − (b/a) 2 (numerische Exzentrizität) F1, 2 = ± (e, 0) (Brennpunkte) Einführung in die Mathematik 1 © Oliver Deiser 2. Parabeln 41 Die beiden Exzentrizitäten messen die Abweichung der Ellipse von einem Kreis. Ist a = b und damit Ea, b der Kreis Ka , so gilt e = ε = 0. Die numerische Exzentrizität hängt nur vom Verhältnis der Halbachsen ab. Es gilt stets ε P [ 0, 1 [. Die Brennpunkte einer Ellipse verallgemeinern den Kreismittelpunkt: Eine Ellipse Ea, b ist die Menge aller Punkte der Ebene, deren Abstandssumme zu den beiden Brennpunkten gleich 2a ist, d. h. (+) Ea, b = { P P R2 | F1 P + F2 P = 2a }. Dabei bezeichnet PQ den Abstand zweier Punkte P und Q der Ebene. In einem Brennpunkt laufen alle vom anderen Brennpunkt ausgehenden Strahlen zusammen, die an der Ellipse tangential reflektiert werden. Ea, b a b a F2 F1 Ea, b a F2 b a F1 Brennpunkte und Abstandseigenschaft von Ellipsen Ea, b © Oliver Deiser Einführung in die Mathematik 1 42 1. Abschnitt Elementare Funktionen Hyperbeln Die Verformung einer Parabel zu einem Kreis erfolgte durch Anwendung der Wurzelfunktion auf eine nach unten geöffnete und nach oben verschobene Parabel. Wenden wir die Wurzelfunktion auf eine nach oben geöffnete und nach unten verschobene Parabel an, so erhalten wir Hyperbeln: Für alle r > 0 stellen die Funktionen fr , gr : R − ] −r, r [ → R mit fr (x) = £x2 − r2 , gr (x) = − £x2 − r2 für alle x mit |x| ≥ r die obere bzw. untere Hälfte der Hyperbel Hr = { (x, y) P R2 | x2 − y2 = r2 } dar. 4 x2 - 1 2 x2 - 2 x2 - 3 - x2 - 1 -4 -2 2 4 - x2 - 2 - x2 - 3 x2 - 1 -2 x2 - 2 x2 - 3 -4 Verformung von Parabelbögen zu Hyperbelbögen durch Anwendung der Wurzelfunktion Die Äste der Hyperbeln Hr besitzen die Winkelhalbierenden als Asymptoten. Dies lässt sich durch Auswerten der Funktionen fr und gr an im Betrag großen Stellen x einsehen. Durch eine Skalierung wie bei den Kreisen werden die Hyperbeln Hr gestaucht oder gestreckt und damit zu den allgemeineren Hyperbeln Einführung in die Mathematik 1 © Oliver Deiser 2. Parabeln 43 Ha, b = { (x, y) P R2 | (x/a)2 − (y/b)2 = 1 }. Auflösen nach y liefert y = ± b £x2 − a2 . a Die Funktionen c fa und c ga mit c = b/a stellen die obere bzw. untere Hälfte der Hyperbeln Ha, b dar. Der Parameter a ist der Abstand der Scheitelpunkte vom Ursprung, c = b/a der Betrag der Steigung der Asymptoten, b der Betrag der Asymptoten an den Stellen ± a. Wir setzen e = £a2 + b2 (lineare Exzentrizität) ε = e/a = £1 + (b/a) 2 (numerische Exzentrizität) F1, 2 = ± (e, 0) (Brennpunkte) Die Abstandseigenschaft lautet nun (++) Ha, b = { P P R2 | F1 P − F2 P = ± 2a }. Anstelle der Summen der Abstände zu den Brennpunkten haben nun also die Differenzen einen in ihrem Betrag konstanten Wert. Ha, b b a F2 F1 Brennpunkte und Abstandseigenschaft einer Hyperbel Ha, b © Oliver Deiser Einführung in die Mathematik 1 44 1. Abschnitt Elementare Funktionen Das folgende Diagramm fasst unsere Überlegungen noch einmal zusammen. Ein bemerkenswertes Zusammenspiel zwischen einer Funktion und ihrer Umkehrfunktion. 4 2 -4 -2 2 4 -2 -4 Die Ellipsen E1, b und Hyperbeln H1, b für b = 1/2, 1, 2 und ihre „Quadratparabeln“ Einführung in die Mathematik 1 © Oliver Deiser 2. Parabeln 45 Übungen Übung 1 Seien x, y ≥ 0. Zeigen Sie, dass sqrt(x y) = sqrt(x) sqrt(y). Übung 2 Seien ax2 + bx + c und a′x2 + b′x + c′ Parabeln mit ax2 + bx + c = a′x2 + b′x + c′ für alle x P R. Zeigen Sie, dass a = a′, b = b′ und c = c′. Übung 3 Seien f, g : R → R Parabeln, die dieselben Nullstellen x1 , x2 mit x1 ≠ x2 und zudem denselben Scheitelpunkt besitzen. Zeigen Sie, dass f = g. Übung 4 Seien g, h : R → R zwei Geraden mit von Null verschiedenen Steigungen. Zeigen Sie, dass das Produkt f : R → R, f(x) = g(x) h(x) für alle x P R eine Parabel ist. Welche Nullstellen und welchen Scheitelpunkt besitzt die Parabel f ? Illustrieren Sie die Situation durch ein Diagramm. Übung 5 Seien a, x1 , x2 P R mit a ≠ 0, und sei f = a (x − x1 ) (x − x2 ). Berechnen Sie den Scheitelpunkt von f sowie die Schnittpunkte von f mit den Geraden (x − x1 ) und (x − x2 ) in Abhängigkeit von der Öffnung a und den Nullstellen x1 und x2 . Übung 6 Seien s, t P R. Bestimmen Sie die Lösungen des Gleichungssystems x + y = s, x y = t in den reellen Unbekannten x, y. Übung 7 Bestimmen Sie die eindeutige Parabel durch die Punkte (0, 2), (1, 1) und (3, 9), die wir durch die Methode von Lagrange gefunden haben, durch Lösen eines Gleichungssystems in den Unbekannten a, b, c. Übung 8 Bestimmen Sie mit Hilfe Ihres Grundwissens über Differenzieren den qualitativen Verlauf eines Polynoms dritten Grades, also einer Funktion f : R → R der Form f(x) = ax3 + bx2 + cx + d für alle x P R © Oliver Deiser Einführung in die Mathematik 1 46 1. Abschnitt Elementare Funktionen mit Koeffizienten a, b, c, d P R, a ≠ 0. Unterscheiden Sie insbesondere, ob die Ableitung keine, eine doppelte oder zwei verschiedene Nullstellen besitzt. Fertigen Sie Diagramme zur Illustration Ihrer Analyse an. Übung 9 Betrachten Sie die Aussagen „Parabeln mit gleichen Nullstellen und gleicher Öffnung sind gleich“, „Parabeln mit gleichem Scheitelpunkt und gleicher Öffnung sind gleich“. „Parabeln mit einer gemeinsamen Nullstelle und dort übereinstimmender Steigung sind gleich“. „Parabeln mit gleichem Scheitelpunkt und einer gemeinsamen Nullstelle sind gleich“. Welche Aussagen sind zutreffend und welche nicht? Geben Sie sowohl anschauliche als auch formale Argumente. Übung 10 Beweisen Sie die angegebenen Eigenschaften des Brennpunkts und der Leitlinie einer Parabel ax2 . Welche weiteren geometrischen Eigenschaften können Sie feststellen? Übung 11 Zeigen Sie, dass die in der Näherungskonstruktion der Parabel a x2 konstruierten Schnittpunkte tatsächlich auf der Parabel a x2 liegen. Einführung in die Mathematik 1 © Oliver Deiser 3. Polynome Nach den Geraden und Parabeln betrachten wir nun allgemeine Polynome beliebigen Grades. Eine universelle Formel für die Nullstellen eines Polynoms steht nicht mehr zur Verfügung, aber dennoch können wir einige allgemeine Aussagen beweisen. Ein wichtiges Ergebnis, das wir mit Hilfe von Polynomdivision gewinnen, ist die Abspaltung eines Linearfaktors. © Oliver Deiser Einführung in die Mathematik 1 48 1. Abschnitt Elementare Funktionen Polynome und ihr Grad Definition (Polynom) Seien a0 , …, an P R. Dann heißt die Funktion f : R → R mit f(x) = an xn + an − 1 xn − 1 + … + a0 für alle x P R das (reelle) Polynom oder die (reelle) Polynomfunktion mit den Koeffizienten a0 , …, an . (a) Ist an ≠ 0, so heißt n der Grad und an der Leitkoeffizient des Polynoms. Gilt an = 1, so heißt das Polynom normiert. (b) Sind alle Koeffizienten gleich 0, so heißt f das Nullpolynom. Dem Nullpolynom ordnen wir den symbolischen Grad −∞ zu. (c) Ein Polynom vom Grad 0 oder −∞ heißt ein konstantes Polynom. 8 6 f(x) = 4 1 2 x -3 x3 + 14 x2 - 17 x + 6 10 2 -2 -1 1 2 3 4 -2 -4 0.06 0.05 f(x) = 0.04 1 2 x -3 x3 + 14 x2 - 17 x + 6 10 0.03 0.02 0.01 -0.2 0.2 0.4 0.6 0.8 1.0 1.2 -0.01 Zwei verschiedene Ausschnitte desselben Polynoms vom Grad 5 Einführung in die Mathematik 1 © Oliver Deiser 3. Polynome 49 Den Grad eines Polynoms f : R → R bezeichnen wir auch mit deg(f ) P N ∪ { −∞ } (für engl. degree). Der Grad ist ein Maß für die Komplexität des Polynoms. Das Nullpolynom hat den Grad −∞, konstante Funktionen ungleich der Nullfunktion haben den Grad 0. Geraden und Parabeln sind spezielle Polynome. Ein Polynom ist genau eine Gerade, wenn sein Grad kleiner oder gleich 1 ist, und genau dann eine Parabel, wenn sein Grad gleich 2 ist. Mit den üblichen Rechenregeln für den symbolischen Wert −∞ gelten für alle Polynome f und g die Gradformeln deg(f + g) ≤ max(deg(f ), deg(g)), deg(f ⋅ g) = deg(f ) + deg(g). Polynome eignen sich zur Approximation von Funktionen. Wir werden derartige Taylor-Polynome in Abschnitt 2 betrachten. Vorab ein visueller Eindruck: 1.0 f(x) 0.5 -10 -5 5 10 -0.5 -1.0 Die Funktion sieht aus wie die Sinusfunktion … 4 2 f(x) -15 -10 -5 5 10 15 -2 -4 … ist aber ein Polynom (vom Grad 29). © Oliver Deiser Einführung in die Mathematik 1 50 1. Abschnitt Elementare Funktionen Koeffizientenvergleich für Polynome Anschaulich klar oder zumindest nicht überraschend ist: Satz (Eindeutigkeit der Nullfunktion) Seien a0 , …, an P R. Es gelte an xn + … + a1 x + a0 = 0 für alle x P R. Dann ist ai = 0 für alle i ≤ n. Es gibt viele Beweise für diesen Satz, aber er ist dennoch nicht vollkommen elementar. In der Algebra werden Polynome nicht nur aus reellen Zahlen gebildet und es zeigt sich, dass der Satz nicht mehr in allen Fällen gültig ist. Man muss dann zwischen Polynomen (in der Algebra definiert als Folgen von Koeffizienten) und den durch sie definierten Auswertungsfunktionen unterscheiden. Wir betrachten einige Argumente für R: Beweis durch wiederholtes Ableiten Einsetzen von 0 zeigt a0 = 0. Bildung der ersten Ableitung und Einsetzen von 0 liefert a1 = 0. Durch Bildung der zweiten Ableitung und Einsetzen von 0 erhalten wir a2 = 0. So fortfahrend ergibt sich ai = 0 für alle i. Beweis durch Ausklammern und ein Stetigkeitsargument Einsetzen von 0 zeigt, dass a0 = 0. Ausklammern von x liefert, dass x (an xn − 1 + … + a1 ) = 0 für alle x P R, sodass an xn − 1 + … + a1 = 0 für alle x ≠ 0. Ein Polynom, das an allen von Null verschiedenen Stellen gleich 0 ist, muss aus Stetigkeitsgründen das Nullpolynom sein. Damit ist a1 = 0 (wieder durch Einsetzen von 0). So fortfahrend erhalten wir ai = 0 für alle i. Beweis durch Limesbildung Ein nichtkonstantes Polynom strebt gegen ∞ oder −∞, wenn x gegen ∞ strebt. Damit ist n ≤ 0. Aus a0 = 0 (Einsetzen der 0) folgt die Behauptung. Einen weiteren Beweis werden wir später kennenlernen. Eine wichtige Folgerung, die wir in einfachen Spezialfällen bereits verwendet haben, ist: Korollar (Koeffizientenvergleich) Seien a0 , …, an , b0 , …, bn P R. Es gelte an xn + … + a1 x + a0 = bn xn + … + b1 x + b0 für alle x P R. Dann ai = bi für alle i ≤ n. Einführung in die Mathematik 1 © Oliver Deiser 3. Polynome 51 Die Polynomdivision Sind f, g Polynome und ist c P R, so sind auch cf, f + g, f − g und f ⋅ g Polynome. Im Allgemeinen können wir zwei Polynome aber nicht dividieren, ohne die Menge der Polynome zu verlassen. Gibt es ein Polynom h mit f = h ⋅ g, so heißt g ein Teilerpolynom oder Teiler von f. Allgemein lässt sich eine Division mit Rest wie bei den ganzen Zahlen durchführen: Satz (Polynomdivision mit Rest) Seien f, g : R → R nichtkonstante Polynome. Dann gibt es eindeutig bestimmte Polynome h und r mit f = h g + r und deg(r) < deg(g). Der Grad von h ist die Differenz der Grade von f und g, da deg(f ) = deg(h g + r) = deg(h g) = deg(h) + deg(g) Beweis zur Existenz: Sei f = f0 . Wir werden Polynome hi und fi definieren mit f0 = h1 g + f 1 , deg(f1 ) < deg(f0 ), f1 = h2 g + f 2 , deg(f2 ) < deg(f1 ), … fm − 1 = hm g + fm , deg(fm ) < deg(g) ≤ deg(fm − 1 ). Dann gilt f0 = h1 g + f1 = (h1 + h2 ) g + f2 = … = (h1 + … + hm ) g + fm , sodass die Summe der hi ein Polynom h und r = fm wie gewünscht sind. Polynome hi und fi mit diesen Eigenschaften definieren wir rekursiv durch (+) hi = ci x k i , fi = fi − 1 − hi g, wobei ci der Quotient der Leitkoeffizienten und ki die Differenz der Grade von fi − 1 und g ist. zur Eindeutigkeit: Ist f = q g + s mit deg(s) < deg(g), so gilt (h − q) g = s − r und damit grad(h − q) + grad(g) = grad(s − r) < grad(g). Also ist h − q das Nullpolynom, sodass h = q und folglich r = s. © Oliver Deiser Einführung in die Mathematik 1 52 1. Abschnitt Elementare Funktionen Wir nennen das Polynom h den Quotienten und das Polynom r den Rest der Division von f durch g. Aus der Rekursion (+) hi = ci x k i , fi = fi − 1 − hi g, gewinnen wir einen Algorithmus zur Durchführung der Polynomdivision. Das folgende Beispiel zeigt eine von vielen denkbaren Möglichkeiten, wie die Durchführung notiert werden kann. Beispiel f = x 4 + 2x 3 − 2x + 1, g = x 2 + 1. x4 x3 x2 x1 1 1 2 0 −2 1 f0 2 1 0 1 0 0 x g 2 −1 −2 1 f1 2 0 2 0 2x g −1 −4 1 f2 −1 0 −1 −1 g −4 2 f3 Ergebnis der Polynomdivision mit Rest von f durch g: f = h g + r = (x2 + 2x − 1) g + (−4x + 2) Zum Aufbau der Tabelle: Wir tragen in jeder Zeile die Koeffizienten des betrachteten Polynoms fi bzw. hi g ein. Dabei ist hi definiert durch ci x k i wie in (+) und fi + 1 = fi − hi g die Differenz der beiden Vorgängerzeilen. Das Verfahren endet, sobald der Grad von fi kleiner als der Grad von g geworden ist. Der Quotient h ist die Summe der hi und der Rest r das letzte Differenzpolynom fm . Der Nenner der Koeffizienten ci in hi = ci x k i ist immer der Leitkoeffizient des Divisors g. Damit erhalten wir: Satz (Erhalt ganzzahliger Koeffizienten) Ist das Polynom g normiert und sind alle Koeffizienten des Polynoms f ganze Zahlen, so sind auch alle Koeffizienten des Quotienten und des Restes der Polynomdivision von f durch g ganze Zahlen. Einführung in die Mathematik 1 © Oliver Deiser 3. Polynome 53 Abspalten von Linearfaktoren Eine wichtige Anwendung der Polynomdivision ist: Satz (Abspaltung eines Linearfaktors) Sei f : R → R ein nichtkonstantes Polynom, und sei x0 eine Nullstelle von f. Dann gibt es ein Polynom h : R → R mit deg(h) = deg(f ) − 1 und f(x) = (x − x0 ) h(x) für alle x P R. Beweis Wir dividieren f durch das Polynom x − x0 . Nach dem Satz über die Polynomdivision gibt es Polynome von h und r mit (1) f = h (x − x0 ) + r, (2) deg(r) < deg(x − x0 ) = 1. (3) deg(h) = deg(f ) − 1. Nach (2) ist r ein konstantes Polynom. Nach (1) gilt 0 = f(x0 ) = h(x0 ) (x0 − x0 ) + r(x0 ) = r(x0 ). Da r konstant ist und in x0 eine Nullstelle besitzt, ist r das Nullpolynom. Nach (1) ist damit f = (x − x0 ) h. Etwas ungenauer spricht man auch vom „Abspalten einer Nullstelle“, obwohl ja nicht x0 , sondern eine Gerade x − x0 abgespalten wird. Folgerungen Da das Abspalten eines Linearfaktors den Grad um 1 reduziert, erhalten wir: Korollar (Anzahl der Nullstellen eines Polynoms) Ein Polynom f : R → R vom Grad n ≥ 0 hat höchstens n Nullstellen. Genauer gilt: Es gibt ein 0 ≤ k < n, reelle Zahlen x1 , …, xk und ein nullstellenfreies Polynom g mit (+) f = (x − x1 ) … (x − xk ) g. Ein besonders erfreulicher Fall tritt ein, wenn die Funktion g konstant ist: Definition (Zerfällung in Linearfaktoren) Ist das Polynom g in (+) konstant, so sagen wir, dass f in Linearfaktoren zerfällt. Die Nullstellen x1 , …, xk müssen nicht notwendig paarweise verschieden sein. Wir definieren hierzu: © Oliver Deiser Einführung in die Mathematik 1 54 1. Abschnitt Elementare Funktionen Definition (algebraische Vielfachheit einer Nullstelle) Sei f ein nichtkonstantes Polynom, und sei x0 eine Nullstelle von f. Weiter sei m ≥ 1 derart, dass ein Polynom g existiert mit f = (x − x0 )m g, g(x0 ) ≠ 0. Dann heißt m die algebraische Vielfachheit der Nullstelle x0 von f. Wir sagen auch, dass f bei x0 eine m-fache Nullstelle besitzt. Salopp formuliert: Wir zählen, wie oft wir x − x0 abspalten können. Beispiele (1) Ist f = (x − x1 )n , so ist die algebraische Vielfache von x1 gleich n. Die Funktion besitzt eine n-fache Nullstelle bei x1 . (2) Ist x1 ≠ x2 und f = (x − x1 )m (x − x2 )r , so besitzt die Funktion f eine m-fache Nullstelle bei x1 und eine r-fache Nullstelle bei x2 . 10 8 f(x) 6 f(x) 4 x-1 x-2 2 x-4 2 4 6 -2 -4 Die Funktion f(x) = (x − 1)2 (x − 2) (x − 4) zerfällt in Linearfaktoren und lässt sich damit als Produkt von Geraden auffassen. Aus dem Korollar über die Anzahl der Nullstellen eines Polynoms vom Grad n erhalten wir einen weiteren: Beweis des Satzes über die Eindeutigkeit der Nullfunktion Ist an xn + … + a1 x + a0 = 0 für alle x P R, so hat das Polynom n + 1 Nullstellen (etwa 0, …, n). Nach dem Korollar ist es also das Nullpolynom. Wie oben ergibt sich hieraus der Koeffizientenvergleich für Polynome: Sind zwei Polynome als Funktionen identisch, so stimmen auch die sie definierenden Koeffizienten überein. Explizit halten wir fest: Einführung in die Mathematik 1 © Oliver Deiser 3. Polynome 55 Korollar (Identitätssatz für Polynome) Sind f, g Polynome vom Grad kleinergleich n, die an n + 1 Stellen übereinstimmen, so ist f = g. Beweis Das Polynom h = f − g hat einen Grad kleinergleich n und zudem n + 1 Nullstellen. Damit ist h = 0 und folglich f = g. Ohne die Gradforderung ist das Ergebnis nicht richtig. Durch zwei Punkte der Ebene mit verschiedenen x-Koordinaten kann man sowohl eine Gerade als auch eine Parabel legen. Es gibt aber nur eine Gerade durch die beiden Punkte. Ein spezielles Beispiel für die Abspaltung einer Nullstelle verdient einen eigenen Abschnitt: Die geometrische Summe und die geometrische Reihe Sei q P R. Dann haben die Polynome x − q, x2 − q2 , x3 − q3 , …, xn − qn , … die Nullstelle q, sodass wir stets den Linearfaktor x − q abspalten können: x−q = (x − q) 1 2 2 = (x − q) (x + q) 3 3 x −q = (x − q) (x2 + x q + q2 ) x4 − q4 = (x − q) (x3 + x2 q + x q2 + q3 ) x −q … xn + 1 − qn + 1 = (x − q) (xn + xn − 1 q1 + … + x1 qn − 1 + qn ) … Der Leser multipliziere die rechten Seiten aus, um sich vor Augen zu führen, wie sich alle bis auf zwei Summanden gegenseitig aufheben. Es liegt eine sog. Teleskop-Summe vor. Setzen wir speziell x = 1, so erhalten wir 1 − qn + 1 = (1 − q) (1 + q1 + … + qn − 1 + qn ) für alle n P N. Dies zeigt: Satz (geometrische Summe) Für alle n P N und q P R mit q ≠ 1 gilt: 1 + q + q2 + … + qn = © Oliver Deiser 1 − qn + 1 . 1−q Einführung in die Mathematik 1 56 1. Abschnitt Elementare Funktionen Die Formel des Satzes können wir auch in Summennotation schreiben: ∑ k ≤ n qk = 1 − qn + 1 . 1−q Sei nun q P R mit |q| < 1. Dann gilt (+) limn →∞ qn + 1 = limn →∞ qn = 0. Damit erhalten wir: 1 + q + q2 + … + qn + … = limn = limn →∞ →∞ (1 + q + … + qn ) 1 − qn + 1 1−q = 1 . 1−q Das erste Gleichheitszeichen ist als Definition der unendlichen Summe auf der linken Seite zu lesen. Beim zweiten Gleichheitszeichen verwenden wir die Formel für die geometrische Summe und beim dritten den Grenzwert (+). Wir besprechen unendliche Summen später genauer, für jetzt genügt erneut ein intuitiver Grenzwertbegriff. Wir halten das Ergebnis als Satz fest: Satz (geometrische Reihe) Für alle q P R mit |q| < 1 gilt 1 . 1−q 1 + q + q2 + … + qn + … = 6 1 1-q 4 1-q3 1-q 1-q5 1-q 1-q8 1-q 2 -3 -2 1 + q + … + qn = Einführung in die Mathematik 1 -1 1 2 1 1 − qn + 1 approximiert für q P ] −1, 1 [ 1−q 1−q © Oliver Deiser 3. Polynome 57 In der unendlichen Summennotation können wir den Satz in der Form 1 1−q ∑ n P N qn = für alle q P ] −1, 1 [ notieren. Statt ∑ n P N schreiben wir auch ∑ n ≥ 0 , ∑ n oder ∑ ∞n = 0 . Ob man die Notation 1 + q + q2 + … + qn + … oder ∑ n qn bevorzugt, ist wie bei den endlichen Summen letztendlich Geschmackssache. Nützlich ist auch die Variante 1 −1 = 1−q ∑ n ≥ 1 qn = q 1−q für alle q P ] −1, 1 [ der Summation ab n = 1. Beispiele 1 ∑n n 2 = 1+ 1 1 + +… = 2 4 = 1+ 1 1 + +… = 4 16 ∑n 1 4n ∑n (−1)n 3n = 1− 1 1 − 1/2 = 2, ∑ n ≥ 1 1 1 − 1/4 1 1 1 + − +… = 3 9 27 = 1 2n = 1. 4 1 , ∑ n≥1 n 3 4 1 1 − (−1/3) = = 1 . 3 3 . 4 Zwei Visualisierungen der geometrischen Reihe (ab n = 1): 1 1 1 + + + … = 1 für q = 1/2, 2 4 8 1 1 1 + + +… = 4 16 64 © Oliver Deiser 1 3 für q = 1/4 Einführung in die Mathematik 1 58 1. Abschnitt Elementare Funktionen Entwicklung eines Polynoms in einem Punkt Für eine beliebige reelle Zahl p können wir ein Koordinatensystem mit Nullpunkt p betrachten. Der Wechsel in dieses Koordinatensystem wird durch den Übergang von x zu x′ = x − p beschrieben (die Null wird zu −p und p wird zu 0). Anschaulich ist klar, dass ein Polynom n-ten Grades auch in den neuen Koordinaten ein Polynom n-ten Grades ist. Der Beweis des folgenden Satzes zeigt, wie sich die Koeffizienten umrechnen lassen. Satz Sei an xn + … + a0 ein Polynom n-ten Grades und sei p P R. Dann gibt es eindeutig bestimmte b0 , …, bn P R mit (+) an xn + … + a0 = bn (x − p)n + … + b1 (x − p) + b0 für alle x P R. n Weiter gilt bn = an und b0 = an p + … + a1 p + a0 . Beweis Wir setzen x′ = x − p. Dann gilt an xn + … + a1 x + a0 = an (x′ + p)n + … + a1 (x′ + p) + a0 = bn x′ n + … + b1 x′ + b0 für gewisse reelle Koeffizienten bi , die wir durch Ausmultiplizieren der Terme (x′ + p)k erhalten. Speziell ergibt das Ausmultiplizieren bn = an und b0 = an pn + … + a1 p + a0 . Die Eindeutigkeit ergibt sich mit einem der Argumente des Falls p = 0. Die Formel für b0 erhalten wir alternativ auch durch Einsetzen von p in (+). Definition (Entwicklung an einer Stelle) In der Situation des Satzes heißt das Polynom bn (x − p)n + … + b1 (x − p) + b0 die Entwicklung des Polynoms an xn + … + a0 an der Stelle p. Beispiel Wir entwickeln das Polynom x3 + 2x2 − x + 1 an der Stelle 1. Mit x′ = x − 1 gilt: x3 + 2x2 − x + 1 = (x′ + 1)3 + 2(x′ + 1)2 − (x′ + 1) + 1 = x′ 3 + 3x′ 2 + 3x′ + 1 + 2x′ 2 + 4x′ + 2 − x′ = x′ 3 + 5x′ 2 + 6x′ + 3 = (x − 1) 3 + 5(x − 1) 2 + 6(x − 1) + 3 Einführung in die Mathematik 1 © Oliver Deiser 3. Polynome 59 Die Koeffizienten bi lassen sich auch elegant mit Hilfe von Differentialrechnung berechnen. Ist f : R → R mit f(x) = an xn + … + a0 = bn (x − p)n + … + b1 (x − p) + b0 für alle x P R, und x′ = x − p, so erhalten wir durch wiederholtes Ableiten f (x) = bn x′ n + … + b3 x′ 3 + b2 x′ 2 + b1 x′ + b0 , f ′(x) = n bn x′ n − 1 + … + 3 b3 x′ 2 + 2 b2 x′ + 1 b1 + 3 ⋅ 2 b3 x′ + 2 ⋅ 1 b2 f ″(x) = n (n − 1) bn x′ n − 2 + … f ′′′(x) = n (n − 1) (n − 2) bn x′ n − 3 + … + 3 ⋅ 2 ⋅ 1 b3 usw. Einsetzen von x = p liefert wegen x′ = x − p die zauberhafte Formel (#) bk = f (k) (p) k! für alle k ≤ n, wobei f (k) die k-te Ableitung von f bezeichnet (mit f (0) = f ). Beispiel Wir berechnen die Entwicklung das Polynoms f(x) = x3 + 2x2 − x + 1 an der Stelle 1 mit der Ableitungsmethode. Es gilt f ′(x) = 3x2 + 4x − 1, f ″(x) = 6x + 4, f ′′′(x) = 6. Damit ist f(1) = 3, f ′(1) = 6, f ″(p) = 10, f ′′′(p) = 6, sodass b0 = 3, b1 = 6, b2 = 10 2! = 5, b3 = 6 3! = 1. Wir erhalten also erneut das Polynom (x − 1) 3 + 5(x − 1) 2 + 6(x − 1) + 3. Darstellungen dieser Form spielen in der Analysis bei der lokalen Approximation von Funktionen eine Schlüsselrolle: Ziel ist, eine differenzierbare Funktion f an einem gegebenen Entwicklungspunkt p durch ein Polynom zu approximieren (je höher der Grad des Polynoms, desto besser ist in der Regel die Approximation). Dabei entstehen Polynome der Form bn (x − p)n + … + b1 (x − p) + b0 , wobei die Koeffizienten bk erneut durch (#) gegeben sind. Wir besprechen diese sogenannte Taylor-Entwicklung später genauer. Als Anwendung der Methode geben wir hier noch einen weiteren Beweis der Abspaltung von Linearfaktoren, der die Polynomdivision nicht heranzieht: © Oliver Deiser Einführung in die Mathematik 1 60 1. Abschnitt Elementare Funktionen Zweiter Beweis der Abspaltung eines Linearfaktors Sei x0 eine Nullstelle von an xn + … + a0 , n ≥ 1. Weiter sei an xn + … a1 x + a0 = bn (x − x0 )n + … + b1 (x − x0 ) + b0 . die Darstellung des Polynoms im Entwicklungspunkt x0 . Dann ist b0 = 0 und folglich an xn + … + a1 x + a0 = (x − x0 ) (bn (x − x0 )n − 1 + … + b1 ). Die Idee dieses Beweises lässt sich auch so formulieren: Das Abspalten ist im Fall x0 = 0 offensichtlich, da dann a0 = 0 gelten muss wir x = x − x0 einfach aus an xn + … + a1 x ausklammern können. Da alle Nullstellen gleichberechtigt sind, können wir eine beliebige Nullstelle x0 zum neuen Nullpunkt erklären und dann ausklammern. Der Beweis benötigt nur die Existenz, nicht die Eindeutigkeit der b-Koeffizienten (b0 = 0 ergibt sich durch Einsetzen von x0 ). Damit erhalten wir wie oben alle Folgerungen aus dem Abspalten eines Linearfaktors, einschließlich der Eindeutigkeit der Nullfunktion und des Koeffizientenvergleichs. Polynome durch gegebene Punkte Wir hatten in den vorangehenden Kapiteln gesehen, dass wir durch zwei Punkte genau ein Polynom vom Grad kleinergleich 1 und drei Punkte genau ein Polynom vom Grad kleinergleich 2 legen können. Allgemein gilt nun: Satz (Polynominterpolation) Sei n P N, und seien (x0 , y0 ), …, (xn , yn ) Punkte der Ebene mit paarweise verschiedenen x-Koordinaten. Dann gibt es genau ein Polynom f : R → R mit den Eigenschaften: (a) deg(f ) ≤ n, (b) f(xi ) = yi für alle i ≤ n. Gegeben sind n + 1 Punkte. Wir starten im Index mit 0, da „i ≤ n“ einfacher ist als „1 ≤ i ≤ n + 1“. Der Beweis des Satzes ist eine Verallgemeinerung unserer Argumentation bei den Parabeln. Beweis Die Eindeutigkeit folgt aus dem Identitätssatz für Polynome. Für die Existenz definieren für alle i ≤ n ein Polynom gi : R → R durch: gi (x) = ∏ j ≤ n, j ≠ i (x − xj ) = (x − x0 ) … (x − xi − 1 ) (x − xi + 1 ) … (x − xn ). Jedes gi ist das Produkt von n Geraden der Steigung 1, sodass deg(gi ) = n. Einführung in die Mathematik 1 © Oliver Deiser 3. Polynome 61 Für alle i gilt gi (xi ) ≠ 0. Weiter ist gi (xj ) = für alle i ≠ j. Wir setzen nun f = ∑i ≤ n yi gi (xi ) gi . Als Summe von Polynomen vom Grad n ist f ein Polynom vom Grad kleinergleich n. Einsetzen zeigt, dass f(xi ) = yi für alle i ≤ n. Die Bezeichnung als „Interpolation“ ist in der Numerik üblich: Gegeben sind die Daten (x0 , y0 ), …, (xn , yn ). Die Frage ist, zu welcher Funktion diese Daten am besten passen. Weiß oder wünscht man, dass die Funktion ein Polynom ist, so ist das konstruierte Polynom f das gemessen an seinem Grad einfachste Polynom, das die Daten interpoliert. Bemerkung Der Satz besagt nicht, dass es durch gegebene Punkte (x0 , y0 ), …, (xn , yn ) nur ein Polynom gibt. Für die Eindeutigkeit ist die Gradbedingung (a) wesentlich: Unter allen Polynomen vom Grad −∞, 0, 1, …, n gibt es genau ein Polynom f, das durch die n + 1 Punkte verläuft. Dagegen gibt es bereits unendlich viele Polynome des Grades n + 1 durch die gegebenen Punkte. Dies können wir beispielsweise durch Hinzufügen von eines Punktes der Form (x*, f(x*) + k), k = 1, 2, 3, … zur Punktliste einsehen. Beispiel: Mehrere Polynome dritten Grades durch drei Punkte Das Nullpolynom verläuft durch die Punkte (−1, 0), (0, 0), (1, 0) und ist das einzige Polynom vom Grad kleinergleich 2 mit dieser Eigenschaft. Es gibt keine andere Gerade und keine Parabel durch diese Punkte. Dagegen verlaufen alle Polynome dritten Grades der Form gc (x) = c x (x2 − 1) = c x3 − cx mit c P R* beliebig durch die Punkte (−1, 0), (0, 0) und (1, 0). 3 2 1 -1.5 -1.0 -0.5 x x2 - 1 0.5 -1 1.0 1.5 2 x x2 - 1 3 x x2 - 1 -2 -3 © Oliver Deiser Einführung in die Mathematik 1 62 1. Abschnitt Elementare Funktionen Beispiel Wir betrachten die sieben Punkte (−3, 1), (−2, 2), (−1, −2), (0, 0), (1, 2), (2, 1), (3, 4). Das eindeutige Polynom f : R → R von Grad kleinergleich 6 durch diese Punkte berechnet sich zu f(x) = − 1 720 ( 13 x6 − 81 x5 − 155 x4 + 945 x3 + 142 x2 − 2304 x ). f(x) 10 5 -4 -2 2 4 -5 -10 Ändern wir den ersten Punkt zu (−3, 3) ab, so erhalten wir das recht ähnliche Interpolationspolynom g : R → R mit gx) = − 1 720 ( 11 x6 − 75 x5 − 145 x4 + 915 x3 + 134 x2 − 2280 x ). 15 10 5 g(x) f(x) -4 -2 2 4 -5 -10 Einführung in die Mathematik 1 © Oliver Deiser 3. Polynome 63 Ersetzen wir dagegen den vierten Punkt durch (0, 1), so erhalten wir das sehr verschiedene Interpolationspolynom h : R → R mit h(x) = − 1 240 ( 11 x6 − 27 x5 − 145 x4 + 315 x3 + 374 x2 − 768 x − 240 ). 20 10 h(x) -4 -2 2 4 f(x) -10 -20 Grenzwertverhalten von Polynomen Polynome streben gegen ± ∞, wenn x gegen ± ∞ strebt. Genauer gilt: Satz (Grenzwertverhalten von Polynomen) Sei f : R → R ein Polynom vom Grad n ≥ 1. Dann gilt limx →∞ f(x) P { ∞, −∞ }, limx → −∞ f(x) P { ∞, −∞ }. Ist n gerade (ungerade), so haben die uneigentlichen Grenzwerte dasselbe (unterschiedliche) Vorzeichen. Dies ergibt sich aus ( limx → ∞ (an xn + … + a0 ) = an limx →∞ xn 1 + = an limx →∞ xn , a0 an − 1 +…+ an x an xn ) und analog für x → −∞. Nimmt ein Polynom an einer Stelle einen negativen und an einer anderen Stelle einen positiven Wert an, so existiert zwischen diesen beiden Stellen aus Stetigkeitsgründen eine Nullstelle (Zwischenwertsatz). Damit erhalten wir: © Oliver Deiser Einführung in die Mathematik 1 64 1. Abschnitt Elementare Funktionen Korollar (Existenz von Nullstellen bei ungeradem Grad)) Jedes Polynom f : R → R ungeraden Grades besitzt mindestens eine Nullstelle. Dass die Aussage bei geradem Grad nicht gilt, zeigt zum Beispiel die um 1 entlang der y-Achse verschobene Einheitsparabel, also das Polynom x2 + 1. 15 10 5 x3 + x + 1 x2 + 1 x4 + x 3 + x 2 + 2 x + 4 -2 -1 1 2 -5 -10 Zur gradabhängigen Existenz von Nullstellen Interessante Grenzwertphänomene lassen sich auch beobachten, wenn wir den Grad n als variabel betrachten. Ein instruktives Beispiel liefern die Funktionen fn : [ 0, 1 ] → [ 0, 1 ], die für alle n ≥ 1 definiert sind durch fn (x) = xn für alle x P [ 0, 1 ]. 1.0 0.8 x x2 0.6 x4 x8 0.4 x16 x64 0.2 0.2 0.4 0.6 0.8 1.0 Monome xn auf dem EInheitsintervall [ 0, 1 ] Einführung in die Mathematik 1 © Oliver Deiser 3. Polynome 65 Alle Funktionen fn verlaufen durch den Punkt (1, 1). Für alle x P [ 0, 1 [ gilt dagegen limn → ∞ fn (x) = 0. Die Grenzfunktion g : [ 0, 1 ] → [ 0, 1 ] mit g(1) = 1 und g(x) = 0 für x < 1 ist unstetig. Das Verhalten der Monome xn spiegelt sich im Verhalten ihrer Umkehrfunktionen, den n-ten Wurzeln n £x, wider. Diese Funktionen sind für gerade n auf [ 0, ∞ [ und für ungerade n auf ganz R definiert. Für ungerade n konvergieren die n-ten Wurzeln punktweise gegen die Vorzeichenfunktion sgn auf R. d. h. limn → ∞, n ungerade n £x = sgn(x) für alle x P R. 2 1 3 5 9 -10 -5 5 10 x x x 17 33 x x -1 -2 n-te Wurzeln auf R für ungerade n Die Idee lässt sich vielfach variieren. Das folgende Diagramm zeigt eine weitere Konstruktion. 1.0 0.8 1 - x2 0.6 0.4 4 1 - x2 8 1 - x2 16 1 - x2 32 1 - x2 0.2 -1.0 © Oliver Deiser -0.5 0.5 1.0 Einführung in die Mathematik 1 66 1. Abschnitt Elementare Funktionen Übungen Übung 1 Seien b, c, d P R und seien x1 , x2 , x3 die Nullstellen von x3 + bx2 + cx + d. Zeigen Sie: x1 + x2 + x3 = −b, x1 x2 + x1 x3 + x1 x3 = c, x1 x2 x3 = −d. Übung 2 Formulieren Sie die Beweise des Satzes über die Eindeutigkeit der Nullfunktion mit Hilfe von Ableiten bzw. Ausklammern induktiv. Übung 3 Zeigen Sie, dass ein Polynom f : R → R genau dann in Linearfaktoren zerfällt, wenn f ein Produkt von Geraden ist, d. h. wenn es Geraden g1 , … gn gibt mit f = g1 … gn . Übung 4 Sei f ein Polynom vom Grad 3 und es gelte f(x) = 1/x für x = 1, …, 4. Bestimmen Sie f(5). [ Hinweis: Wer keine Polynominterpolation berechnen möchte, kann das Polynom g = x f − 1 betrachten. ] Übung 5 Seien c P R und n P N ungerade. Ermitteln Sie einen Linearfaktor des Polynoms xn + cn und spalten Sie ihn ab. Übung 6 Sei f ein Polynom mit ganzzahligen Koeffizienten. Weiter seien a, b ganze Zahlen. Zeigen Sie, dass a − b ein Teiler von f(a) − f(b) ist, d. h.: Es gibt eine ganze Zahl d mit d(a − b) = f(a) − f(b). [ Hinweis: Spalten Sie eine Nullstelle eines geeignet definierten Polynoms ab.] Übung 7 Zeigen Sie, dass es kein Polynom f mit ganzzahligen Koeffizienten gibt mit f(1) = 2, f(2) = 3, f(3) = 1. Übung 8 Entwickeln Sie das Polynom x4 + 2x3 − x2 + 2x − 2 an den Stellen 1 und −1. Einführung in die Mathematik 1 © Oliver Deiser 4. Rationale Funktionen Wir betrachten nun rationale Funktionen, die durch Division zweier Polynome entstehen. Dabei kommt den Nullstellen des Zähler- und Nennerpolynoms eine besondere Bedeutung zu. Das Nullpolynom bezeichnen wir im Folgenden kurz mit 0, sodass g ≠ 0 für ein Polynom g bedeutet, dass g nicht das Nullpolynom ist. © Oliver Deiser Einführung in die Mathematik 1 68 1. Abschnitt Elementare Funktionen Rationale Funktionen und ihre Definitionsbereiche Definition (rationale Funktion, Definitionslücke) Seien f, g : R → R reelle Polynome, g ≠ 0, und sei P = { x P R | g(x) ≠ 0 }. Dann heißt die Funktion h : P → R mit h(x) = f(x) g(x) für alle x P P die durch f und g definierte (reelle) rationale Funktion. Wir bezeichnen sie mit f/g. Die Nullstellen von g heißen die Definitionslücken von f/g. Eine rationale Funktion f/g ist also genau an den Nullstellen des Nennerpolynoms g nicht definiert. Der Definitionsbereich P von f/g ist eine Vereinigung von offenen Intervallen. 40 30 h(x) = x x2 -2 x-3 20 (x-4) (x-2) 10 -5 5 10 -10 -20 -30 50 h(x) = x x2 -2 x-3 (x-4) (x-2) -40 -20 20 40 -50 Zwei verschiedene Ausschnitte derselben rationalen Funktion Einführung in die Mathematik 1 © Oliver Deiser 4. Rationale Funktionen 69 Beispiele (1) Jedes Polynom f ist eine rationale Funktion, da f = f /1. (2) 1/x ist eine rationale Funktion auf R − { 0 }. (3) 1/(x2 + 1) ist (oder genauer: definiert) eine rationale Funktion auf R. (4) (x2 − 1)/(x − 1) ist eine rationale Funktion auf R − { 1 }. (5) x + 1 ist eine rationale Funktion auf R. Für alle x ≠ 1 stimmt diese Funktion mit der Funktion aus dem letzten Beispiel überein, da x2 − 1 (x + 1) (x − 1) = x−1 x−1 = x + 1 für alle x ≠ 1. Polstellen und stetig hebbare Definitionslücken Das Verhalten einer rationalen Funktion f/g bei Annäherung an eine Definitionslücke x0 hängt vom Nullstellenverhalten des Zählers und Nenners bei x0 ab: (1) Ist x0 keine Nullstelle von f oder die algebraische Vielfachheit k von x0 bezüglich f kleiner als die algebraische Vielfachheit m von x0 bezüglich g, so gilt limx → x0 f(x)/g(x) P { ∞, −∞ }. (2) Ist die algebraische Vielfachheit von x0 bzgl. f größergleich derjenigen von x0 bzgl. g, so gilt limx → x0 f(x)/g(x) P R. Definition (Vielfachheit einer Polstelle, stetig hebbare Definitionslücke) Im Fall (1) heißt x0 eine (m − k)-fache Polstelle von f/g, wobei wir k = 0 setzen, falls x0 keine Nullstelle von f ist. Im Fall (2) heißt x0 eine stetig hebbare Definitionslücke von f/g. Die Vielfachheit einer Polstelle x0 ist ein Maß dafür, wie schnell eine rationale Funktion gegen ± ∞ strebt, wenn x gegen x0 strebt. Beispiele (1) Die rationale Funktion h : R − { 1, 2 } → R mit h(x) = x (x − 1)(x − 2)2 für alle x P R − { 1, 2 } besitzt eine einfache Polstelle bei 1 und eine 2-fache (doppelte) Polstelle bei 2. © Oliver Deiser Einführung in die Mathematik 1 70 1. Abschnitt Elementare Funktionen 50 h(x) = 40 x (x-1) (x-2)2 30 20 10 -1 1 2 3 4 5 -10 -20 Eine einfache und eine doppelte Polstelle (2) Die rationale Funktion f : R − { 1, 2 } → R mit f(x) = x2 − 1 (x − 1)(x − 2) = (x − 1) (x + 1) (x − 1)(x − 2) für alle x P R − { 1, 2 } besitzt eine stetig hebbare Definitionslücke bei 1 und eine einfache Polstelle bei 2. Durch Kürzen von (x − 1) ergibt sich die einfachere Darstellung (x + 1)/(x − 2) der Funktion f, die aber zunächst nur auf der Menge R − { 1, 2 } definiert ist. Wir können und werden sie durch die Setzung „f(1) = (1 + 1)/(1 − 2) = −2“ zu einer auf R − { 2 } definierten Funktion (die wir wieder f nennen) stetig fortsetzen, was die Bezeichnung „stetig hebbar“ motiviert. 30 h(x) = x2 -1 (x-1) (x-2) 20 10 -1 1 2 3 4 5 -10 Eine stetig hebbare Definitionslücke Einführung in die Mathematik 1 © Oliver Deiser 4. Rationale Funktionen 71 Haben zwei Polynome f und g keine gemeinsamen Nullstellen, so sagen wir, dass die rationale Funktion f/g einen vollständigen Definitionsbereich besitzt. Diese Eigenschaft können wir durch Kürzen von gemeinsamen Linearfaktoren immer erreichen. Alle stetig hebbaren Definitionslücken sind dann geschlossen, sodass jede verbleibende Definitionslücke eine Polstelle ist. Allgemeiner können wir in f/g nicht nur gemeinsame Linearfaktoren, sondern gemeinsame Teilerpolynome kürzen. Hat f/g bereits einen vollständigen Definitionsbereich P, so wird durch weiteres Kürzen nur noch eine Termdarstellung, aber nicht mehr die Funktion f/g : P → R verändert, da Definitionsbereich und Werte gleich bleiben. Haben f und g keine gemeinsamen Teilerpolynome, so nennen wir die rationale Funktion f/g vollständig gekürzt. Wir vereinbaren: Konvention Wir identifizieren im Folgenden rationale Funktionen f1 /g1 und f2 /g2 , die durch Kürzen ineinander übergehen. Beispiel Mit dieser Vereinbarung können wir schreiben x(x + 1) x = x+1 1 = x+1 = (x − 1) (x + 1)2 (x − 1) (x + 1) = (x − 1) (x + 1)2 . x2 − 1 Mit rationalen Funktionen können wir so rechnen wie mit rationalen Zahlen. Insbesondere stehen die vier Grundrechenarten zur Verfügung, wobei die Division zweier rationaler Funktionen genau dann erklärt ist, wenn der Divisor nicht das Nullpolynom ist. Es gilt f1 g1 f2 g2 ± f1 /g1 f2 /g2 = = f1 g2 ± f2 g1 , g1 g2 f1 g1 f2 g2 = f1 f2 , g1 g2 x+1−2 (x − 1)(x + 1) = x−1 (x − 1)(x + 1) ⋅ f1 g2 , falls f2 ≠ 0. f2 g1 Beispiel Es gilt 1 x−1 + −2 (x − 1)(x + 1) = = 1 . x+1 Das Beispiel zeigt, dass die nach der Summenformel berechnete Summe zweier gekürzter rationaler Funktionen nicht gekürzt sein muss. © Oliver Deiser Einführung in die Mathematik 1 72 1. Abschnitt Elementare Funktionen Die Partialbruchzerlegung Sind f und g Polynome mit g ≠ 0, so zeigt die Polynomdivision f = h g + r von f durch g, dass wir die rationale Funktion f/g schreiben können in der Form f/g = h + r/g, mit deg(r) < deg(g). Die rationale Funktion r/g lässt sich nun noch durch das additive Abspalten von Polstellen, bekannt als Partialbruchzerlegung, vereinfachen. Wir illustrieren das Verfahren durch einige instruktive Beispiele. Beispiele (1) Wir suchen für die rationale Funktion 1/(x(x + 1)) eine Darstellung 1 x (x + 1) = a x + b . x+1 Um a und b zu bestimmen, schreiben wir a x + b x+1 a(x + 1) + bx x(x + 1) = = (a + b)x + a . x(x + 1) Wir suchen also a, b mit (a + b)x + a = 1 = 0 x + 1. Durch Koeffizientenvergleich erhalten wir das Gleichungssystem a + b = 0, a = 1, das durch a = 1, b = −1 eindeutig gelöst wird. Wir erhalten also die Partialbruchzerlegung 1 x (x + 1) = 1 x + −1 . x+1 10 5 1 x (x+1) -2.0 -1.5 -1.0 -0.5 0.5 1 x 1.0 - 1 x+1 -5 -10 Die Partialbruchzerlegung einer rationalen Funktion (I) Einführung in die Mathematik 1 © Oliver Deiser 4. Rationale Funktionen 73 (2) Wir suchen a, b mit 2x + 1 (x − 1)(x − 2) a x−1 = + b . x−2 Erweitern liefert wie im ersten Beispiel a(x − 2) + b(x − 1) = (a + b)x − 2a − b = 2x + 1. Das Gleichungssystem a + b = 2, −2a − b = 1 wird durch a = −3, b = 5 eindeutig gelöst, sodass 2x + 1 (x − 1)(x − 2) −3 x−1 = + 5 . x−2 (3) Wir suchen a, b, c mit −x + 2 x (x + 1) (x + 2) = a x + b x+1 c . x+2 + Erweitern liefert a(x + 1)(x + 2) + b x (x + 2) + c x (x + 1) = a(x2 + 3x + 2) + b(x2 + 2x) + c(x2 + x) = (a + b + c)x2 + (3a + 2b + c)x + 2a = 0x2 − x + 2. Das Gleichungssystem a + b + c = 0, 3a + 2b + c = − 1, 2a = 2 wird durch a = 1, b = −3, c = 2 eindeutig gelöst, sodass −x + 2 x (x + 1) (x + 2) = 1 x − 3 x+1 + 2 . x+2 (4) Wir suchen a, b, c mit 2x2 + 1 (x − 1)3 = a (x − 1)3 + b (x − 1)2 + c x−1 Erweitern liefert a + b(x − 1) + c(x − 1)2 = cx2 + (b − 2c)x + a − b + c = 2x2 + 0x + 1. Die eindeutige Lösung ist a = 3, b = 4, c = 2, sodass 2x2 + 1 (x − 1)3 © Oliver Deiser = 3 (x − 1)3 + 4 (x − 1)2 + 2 . x−1 Einführung in die Mathematik 1 74 1. Abschnitt Elementare Funktionen (5) Wir suchen a, b, c mit 2x2 (x + 1)(x2 + 1) = a x+1 + bx + c . x2 + 1 Erweitern liefert a(x2 + 1) + (bx + c)(x + 1) = (a + b)x2 + (b + c)x + a + c = 2x2 + 0x + 0. Wir finden die Lösung a = 1, b = 1, c = −1, sodass 2x2 (x + 1)(x2 + 1) = 1 x+1 + x−1 . x2 + 1 10 5 -2.0 -1.5 -1.0 -0.5 0.5 -5 1.0 2 x2 (x+1) x2 +1 1 x+1 x-1 x2 +1 -10 -15 Die Partialbruchzerlegung einer rationalen Funktion (II) Allgemein gilt folgender Satz, den wir hier ohne Beweis angeben, der aber mit Blick auf die Beispiele plausibel ist: Einführung in die Mathematik 1 © Oliver Deiser 4. Rationale Funktionen 75 Satz (Partialbruchzerlegung, additive Abspaltung von Polstellen) Sei f/g eine rationale Funktion mit vollständigem Definitionsbereich und deg(f ) < deg(g). Weiter sei x0 eine k-fache Nullstelle von g, und es sei g = (x − x0 )k g*, g*(x0 ) ≠ 0. Dann gibt es eindeutig bestimmte a1 , …, ak P R und ein Polynom f * mit deg(f *) < deg(g*), sodass f g = f (x − x0 )k g* ak (x − x0 )k = + … + a1 x − x0 + f* . g* Das Verfahren lässt sich mit f */g* wiederholen, bis alle reellen Nullstellen des Nenners additiv abgespalten sind. Weiter lassen sich in ähnlicher Art und Weise auch nullstellenfreie Polynome zweiten Grades mit beliebigen Potenzen k aus dem Nenner abspalten, wobei nun lineare Funktionen anstelle von Konstanten in den Zählern auftauchen. Ein (mit Hilfe eines Computers berechnetes) Beispiel mit k = 4 ist 81 (x2 + x + 1)4 (x3 + x + 1) = −27 (x − 1) (x2 + x + 1)4 − 88x + 29 x2 + x + 1 9 (7x + 2) (x2 + x + 1)3 − + − 3 (25x + 11) (x2 + x + 1)2 88x2 − 59x + 134 . x3 + x + 1 Am klarsten wird die Partialbruchzerlegung bei Verwendung komplexer Zahlen, da jedes komplexe Polynom nach dem Fundamentalsatz der Algebra in Linearfaktoren zerfällt. Wir kommen später darauf zurück. Die Partialbruchzerlegung ist bei der Integration rationaler Funktionen unverzichtbar, da die Partialbrüche meistens leichter zu integrieren sind als eine in der Form f/g mit Polynomen f und g gegebene rationale Funktion. Durch das Auftreten linearer oder quadratischer Funktionen im Nenner der Partialbruchzerlegung kommt darüber hinaus der Logarithmusfunktion (mit Ableitung 1/x) und der Arkustangensfunktion (mit Ableitung 1/(x2 + 1)) bei der Integration rationaler Funktionen eine wichtige Rolle zu. © Oliver Deiser Einführung in die Mathematik 1 76 1. Abschnitt Elementare Funktionen Übungen Übung 1 Geben Sie eine rationale Funktion an, die in den Punkten 1, 2, 3 einfache Nullstellen, in 0 und 4 doppelte Polstellen und in 5 eine stetig hebbare Definitionslücke besitzt. Ist eine rationale Funktion durch diese Eigenschaften eindeutig bestimmt? Übung 2 Präzisieren Sie folgende Aussage: „Eine rationale Funktion verhält sich wie ein Polynom, wenn x gegen ∞ oder −∞ strebt.“ Übung 3 Skizzieren Sie den qualitativen Verlauf der rationalen Funktionen (a) (1 + x2 ) (x − 3) , (1 − x)2 (b) 1 + x2 . (1 − x) (x − 3) Übung 4 Zeigen oder widerlegen Sie, dass es eine rationale Funktion f gibt mit limx →∞ f(x) = 0, limx → −∞ f(x) = 1. Übung 5 Diskutieren sie die qualitativen Zusammenhänge zwischen einer rationalen Funktion h = f/g und der rationalen Funktion 1/h. Übung 6 Bestimmen Sie die Partialbruchzerlegung für (a) 1 , (x − 1) x (x + 1) (b) 1 , (x + 1) (2x3 + 1) (c) 6 , x (x + 1) (x + 2) (x + 3) (d) 1 (x2 + x + 1) (2x2 + x + 1) Einführung in die Mathematik 1 (= ax + b x2 + x + 1 + cx + d 2x2 + x + 1 ). © Oliver Deiser 5. Die Exponentialfunktion In diesem Kapitel betrachten wir die reelle Exponentialfunktion zur Basis der Eulerschen Zahl e. Mit Hilfe dieser fundamentalen Funktion − der vielleicht wichtigsten der Analysis − können wir viele weitere Funktionen einführen: Die Logarithmusfunktion zur Basis e, die allgemeinen Exponentialfunktionen zu einer positiven Basis, die allgemeinen Logarithmusfunktionen zu einer positiven von 1 verschiedenen Basis sowie die Potenzfunktionen für beliebige reelle Exponenten. © Oliver Deiser Einführung in die Mathematik 1 78 1. Abschnitt Elementare Funktionen Charakterisierung der Exponentialfunktion Wir gewinnen die Exponentialfunktion aus folgendem Satz: Satz (Existenz- und Eindeutigkeitssatz, Charakterisierungssatz) Es gibt genau eine Funktion f : R → R mit: (1) f ′ = f, (2) f(0) = 1. Wir verwenden diesen Satz in dieser Einführung ohne Beweis. Plausibel wird er durch die Betrachtung des Richtungsfeldes der Differentialgleichung f ′ = f, die auch oft in der Form y′ = y notiert wird. Eine Funktion f mit f ′ = f hat an einer Stelle x die Steigung y = f(x). Heften wir also an jeden Punkt (x, y) der Ebene den auf die Länge 1 skalierten Vektor (1, y) an, so läuft f derart durch dieses Vektorfeld, dass unsere Vektoren an jedem Punkt (x, f(x)) des Graphen von f in Richtung der Tangente von f zeigen. Umgekehrt können wir eine Funktion durch den Punkt (0, 1) in unser Richtungsfeld einzeichnen und so die Existenz und Eindeutigkeit einer Funktion f mit den Eigenschaften (1) und (2) glaubhaft machen. Das ist natürlich kein strenger Beweis, mindestens aber eine fruchtbare Anschauung. 6 4 2 0 -2 -4 -2 0 2 4 Das Richtungsfeld der Differentialgleichung y′ = y Einführung in die Mathematik 1 © Oliver Deiser 5. Die Exponentialfunktion 79 Definition (Exponentialfunktion) Die eindeutige Funktion des Satzes heißt die (reelle) Exponentialfunktion. Wir bezeichnen sie mit exp : R → R. Weiter setzen wir e = exp(1). Die reelle Zahl e heißt die Eulersche Zahl oder Eulersche Konstante. 60 50 40 30 exp(x) 20 10 -4 -2 2 4 Das Additionstheorem Als erstes zeigen wir, dass die Exponentialfunktion keine Nullstellen besitzt: Satz (Nullstellenfreiheit der Exponentialfunktion) Für alle x P R gilt exp(x) exp(−x) = 1, sodass exp(x) = 1/exp(−x). Insbesondere hat die Exponentialfunktion keine Nullstellen. Beweis Wir definieren g : R → R durch g(x) = exp(x) exp(−x). Dann gilt g′(x) = exp(x) exp(−x) − exp(x) exp(−x) = 0 für alle x. Damit ist g konstant gleich g(0) = exp(0) exp(−0) = 1 ⋅ 1 = 1. Damit können wir nun eineweitere sehr wichtige Eigenschaft zeigen, die wir durchgehend verwenden werden: Satz (Additionstheorem, Funktionalgleichung) Für alle x, y P R gilt exp(x + y) = exp(x) exp(y). © Oliver Deiser Einführung in die Mathematik 1 80 1. Abschnitt Elementare Funktionen Beweis Sei y P R. Wegen exp(y) ≠ 0 können wir f : R → R definieren durch f(x) = exp(x + y) exp(y) für alle x P R. Für die Funktion f gilt f(0) = 1 und f ′(x) = f(x) für alle x P R. Nach dem Existenz- und Eindeutigkeitsatz ist also f = exp. Durch Multiplikation mit der Konstanten reellen Zahl exp(y) erhalten wir exp(x) exp(y) = f(x) exp(y) = exp(x + y) für alle x P R. Es ist bemerkenswert, dass sich diese Eigenschaft aus dem Charakterisierungssatz gewinnen lässt. Beispiele Sei x P R. Wegen 1 = exp(0) = exp(x − x) = exp(x) exp(−x) ergibt sich noch einmal der Satz über die Nullstellenfreiheit. Weiter gilt: exp(2x) = exp(x + x) = exp(x) exp(x) = exp(x)2 , exp(x) = exp(x/2 + x/2) = exp(x/2) exp(x/2) = exp(x/2)2 . Damit ist exp(x) das Quadrat einer reellen Zahl. Wegen exp(x) ≠ 0 ist also exp(x) > 0. Damit haben wir gezeigt, dass die Exponentialfunktion nur positive Werte annimmt. Das Additionstheorem motiviert: Notation: Exponentialschreibweise Wir schreiben auch ex anstelle von exp(x). Das Additionstheorem lautet in der neuen Schreibweise: ex + y = ex ⋅ ey für alle x, y P R. Weiter ist e1 = exp(1) = e. Beispiele Sei x P R. Obige Beispiele lesen sich nun in der Form 1 = ex − x = ex e−x , sodass e−x = (ex )− 1 , e−1 = (e1 )−1 = 1/e, e2x = ex + x = ex ex = (ex )2 , ex = ex/2 + x/2 = ex/2 ex/2 = (ex/2 )2 , sodass ex/2 = £ex . Einführung in die Mathematik 1 © Oliver Deiser 5. Die Exponentialfunktion 81 Reihendarstellung der Exponentialfunktion Die Exponentialfunktion erlaubt eine Berechnung durch eine Potenzreihe. Eine Potenzreihe hat die Form (+) ∑ n an xn = a0 + a1 x + a2 x2 + … + an xn + … mit Koeffizienten an P R. Man kann sich eine solche Reihe als „unendliches Polynom“ vorstellen. Im Gegensatz zu Polynomen treten nun aber Konvergenzfragen auf, da eine unendliche Summe gebildet wird. Soll die Summe für alle reelle Zahlen x endlich sein, so müssen die Koeffizienten an in ihrem Betrag schnell gegen Null konvergieren, um die Potenzen xn , die für |x| > 1 in ihrem Betrag schnell wachsen, zu kompensieren. Ist die Konvergenz für alle reellen Zahlen gegeben, so kann man Potenzreihen in vielerlei Hinsicht so behandeln, als wären sie Polynome. Insbesondere darf man sie gliedweise differenzieren: Ist f : R → R definiert durch (+), so gilt (++) f ′(x) = ∑ n ≥ 1 n an xn − 1 = ∑ n (n + 1) an + 1 xn für alle x P R. Dies alles zu präzisieren und mit vollständigen Beweisen systematisch zu entwickeln erfordert viel Arbeit. Im Rahmen dieser Einführung werden wir Potenzreihen weitgehend naiv und spielerisch behandeln. Natürlich verwenden wir dabei nur Sätze, die sich in einem strengen Aufbau der Analysis auch beweisen lassen. Wir beginnen unsere spielerische Untersuchung mit der Frage, wie wir die Koeffizienten an einstellen müssen, damit durch f(x) = ∑ n an xn eine Funktion f : R → R definiert wird mit (1) f ′ = f, (2) f(0) = 1 Zunächst gilt f(0) = a0 . Wir setzen also a0 = 1. Aus dem Wunsch f ′ = f und gliedweisem Differenzieren (++) ergibt sich durch Koeffizientenvergleich an = (n + 1) an + 1 für alle n ≥ 0. Damit erhalten wir die Rekursionsgleichung a0 = 1, an + 1 = an 1 n+1 für alle n ≥ 0. Diese wird gelöst durch an = 1 n! = 1 1⋅2⋅…⋅n für alle n ≥ 0, wobei wir 0! = 1 verwenden. Diese Koeffizienten konvergieren extrem schnell gegen 0 und setzen sich gegen xn für eine im Betrag beliebig große feste reelle Zahl x durch. Insgesamt gilt: © Oliver Deiser Einführung in die Mathematik 1 82 1. Abschnitt Elementare Funktionen Satz (Reihendarstellung der Exponentialfunktion) Für alle x P R gilt exp(x) = 1 + x + x2 2! + x3 3! + … = ∑n xn . n! (Exponentialreihe) Die Exponentialreihe können wir zur effektiven Berechnung der Exponentialfunktion verwenden. Für alle n P N stellt die sogenannte n-te Partialsumme fn (x) = 1 + x + x2 2! + … + xn n! = ∑ k≤n xk k! der Exponentialreihe eine Approximation an die Exponentialfunktion dar. Je größer der Betrag von x ist, desto größer müssen wir n wählen, um eine gute Approximation zu erhalten. Die folgenden Diagramme geben einen Eindruck der Güte der Approximation. 2.5 2.0 1.5 exp(x) 1+x 1.0 0.5 -1.0 -0.5 0.5 1.0 15 10 exp(x) 1+x 1+x+ 5 1+x+ x2 2 x2 2 -4 -2 2 + x3 6 4 -5 Approximationen an die Exponentialfunktion im Nullpunkt Einführung in die Mathematik 1 © Oliver Deiser 5. Die Exponentialfunktion 83 2000 1500 exp(x) 1000 f(x) 500 -10 -5 5 10 Die Approximation f(x) = 1 + x + x2 /2 + … + x10 /10! Die Reihendarstellung der Exponentialfunktion erlaubt insbesondere auch eine schnelle numerische Berechnung von exp(x). Für die Eulersche Zahl e gilt e = exp(1) = 1 0! + = 1 + 1 + 1 1! 1 2! + 1 2 + 1 6 + + 1 3! 1 24 + 1 4! + … + … = 2,71828182845904523536028747135266249775… Berechnung der Koeffizienten durch mehrfaches Ableiten Die Koeffizienten der Exponentialreihe lassen sich auch durch Auswerten der mehrfach gebildeten Ableitung an der Stelle 0 gewinnen. Der Leser vergleiche dies mit der Diskussion der Entwicklung von Polynomen an einer Stelle. Für alle k P N gilt f (k) (x) = k! ak + (k + 1) … 2 ak + 1 x + (k + 2) … 3 ak + 2 x2 + …, sodass f (k) (0) = k! ak oder (#) ak = f (k) (0) . k! Diese Koeffizientenformel gilt allgemein für Potenzreihen. In unserem Fall gilt f (k) = f und f(0) = 1, sodass ak = 1 . k! © Oliver Deiser Einführung in die Mathematik 1 84 1. Abschnitt Elementare Funktionen Die Limesdarstellung der Exponentialfunktion Eine alternative Darstellung der Exponentialfunktion verwendet eine Grenzwertbildung, die sich durch das Problem einer stetigen Verzinsung motivieren lässt (wir diskutieren diese Motivation in den Übungen). Betrachten wir eine natürliche Zahl n ≥ 1, so gilt d dx (+) (1 + x n )n ( = n 1+ x n )n − 1 1 n ( = 1+ x n ) n − 1. Wenn n gegen unendlich strebt, wird der Unterschied zwischen n und n − 1 im Exponenten auf der rechten Seite bei beliebigem x unerheblich, da (1 + x n x n ) n − 1 = (1 + )n n . n+x Damit lässt sich vermuten, dass durch die Grenzwertbildung ( f(x) = lim n ≥ 1 1 + x n )n eine Funktion f : R → R definiert wird mit f ′ = f. Dies ist, wie man zeigen kann, tatsächlich der Fall. (Dass die Grenzfunktion überall definiert und zudem differenzierbar ist und ihre Ableitung der Grenzwert der Ableitungen in (+) ist, ist keineswegs selbstverständlich.) Damit haben wir erneut eine Funktion gefunden, die sich bei der Ableitung selbst reproduziert und zudem an der Stelle x = 0 den Wert 1 besitzt. Nach dem Eindeutigkeitssatz gilt: Satz (Limesdarstellung der Exponentialfunktion) Für alle x P R gilt ( exp(x) = lim n ≥ 1 1 + x n ) n. Speziell ist ( e = lim n ≥ 1 1 + 1 n ) n. Die Limesdarstellung ist theoretisch von Bedeutung, aus numerischer Sicht aber der Reihendarstellung unterlegen. Ist x P R und n P N, so sind sn (x) = ∑ k ≤ n xk , k! tn (x) = (1 + x n )n Approximationen an exp(x). Die Approximation sn ist im Allgemeinen deutlich besser als tn . Einführung in die Mathematik 1 © Oliver Deiser 5. Die Exponentialfunktion 85 Der natürliche Logarithmus Für alle x P R gilt exp′(x) = exp(x) > 0, sodass die Exponentialfunktion streng monoton steigend ist. Dies lässt sich anschaulich auch am Richtungsfeld der Differentialgleichung f ′ = f erkennen. Wie jede streng monotone Funktion besitzt die Exponentialfunktion eine Umkehrfunktion: Definition (natürlicher Logarithmus) Die Umkehrfunktion der Exponentialfunktion exp : R → R heißt der natürliche Logarithmus oder der Logarithmus zur Basis e. In Zeichen schreiben wir log : ] 0, ∞ [ → R oder ln : ] 0, ∞ [ → R. Wir bevorzugen im Folgenden die Bezeichnung „log“ statt „ln“. Letzteres steht für „logarithmus naturalis“. Nach Definition gilt: (1) log(exp(x)) = x für alle x P R, (2) exp(log(x)) = x für alle x > 0. 2 log(x) 1 1 2 3 4 5 6 -1 -2 Speziell gilt log(1) = 0, log(e) = 1, log(1/e) = −1, da exp(0) = 1 und exp(1) = e. Als Umkehrfunktion einer streng monoton steigenden Funktion ist der Logarithmus ebenfalls streng monoton steigend (und nicht etwa fallend!). Aus dem Additionstheorem der Exponentialfunktion wird ein Multiplikationstheorem: © Oliver Deiser Einführung in die Mathematik 1 86 1. Abschnitt Elementare Funktionen Satz (Multiplikationstheorem) Für alle x, y > 0 gilt log(x y) = log(x) + log(y). Beweis Seien x, y > 0, und seien a, b P R mit exp(a) = x, exp(b) = y. Dann gilt log(x ⋅ y) = log(exp(a) exp(b)) = log(exp(a + b)) = a + b = log(x) + log(y). Beispiele Für alle x > 0 gilt: (a) log(x2 ) = log(xx) = log(x) + log(x) = 2 log(x). (b) log(x) = log(£x £x) = 2 log(£x), sodass log(x1/2 ) = log(£x) = 1/2 log(x). Die allgemeine Exponentialfunktion Wir haben exp(x) aufgrund der sich aus dem Additionstheorem ergebenden Rechengesetze auch in der Exponentialschreibweise ex notiert. Eine natürliche Frage ist, ob und wie wir eine Exponentiation (Potenzbildung) zu einer anderen Basis gewinnen können. Für eine solche Exponentiation soll gelten (ey )x = ex y für alle x, y P R. Setzen wir a = ey , so gilt y = log(a) und wir erhalten ax = ex y = ex log(a) für alle x P R. Dies können wir zur Definition verwenden: Definition (Exponentialfunktion zu einer positiven Basis) Sei a > 0. Dann definieren wir expa : R → R durch expa (x) = exp(x log(a)) für alle x P R. Die Funktion expa heißt die Exponentialfunktion zur Basis a. Das Additionstheorem gilt auch für die allgemeinen Exponentialfunktionen, denn für alle x, y P R gilt: expa (x + y) = exp((x + y) log(a)) = exp(x log(a) + y log(a)) = exp(x log(a)) exp(y log(a)) = expa (x) expa (y). Wie für die Exponentialfunktion zur Basis e motiviert dies: Notation: allgemeine Exponentialschreibweise Wir schreiben auch ax anstelle von expa (x). Dabei ist a > 0 und x P R. Einführung in die Mathematik 1 © Oliver Deiser 5. Die Exponentialfunktion 87 Die Eigenschaften und den qualitativen Verlauf von expa kann man sich mit folgender Merkregel klarmachen: ax verhält sich wie ex , wobei x um den konstanten Faktor log(a) skaliert wird. Für die Skalierung sind vor allem die Intervalle ] 0, 1 [, { 1 }, ] 1, ∞ [ von Bedeutung, in denen der Logarithmus negativ, gleich null bzw. positiv ist. Die reelle Zahl ax ist für a > 0 und x P R durch die Exponentialfunktion definiert, in Fortsetzung bereits definierter Potenzen wie a2 oder a1/2 = £a. Weiter ist ax auch für gewisse a ≤ 0 und x erklärt, etwa (−8)1/3 = 3 £−8 = −2, 00 = 1, (−1)2 = 1. Es gibt aber keine allgemeine Exponentialfunktion expa : R → R zu einer negativen Basis. Denn für a < 0 würde nach dem Additionstheorem expa (1/2) im Quadrat gleich a ergeben, was wegen a < 0 nicht sein kann. 5 4 3 x 2x 10x 2 1 -1.0 -0.5 0.5 1.0 Exponentialfunktionen zu Basen größer als 1 5 4 1 x 3 1 x 2 2 1 x 10 1 -1.0 -0.5 0.5 1.0 Exponentialfunktionen zu Basen kleiner als 1 © Oliver Deiser Einführung in die Mathematik 1 88 1. Abschnitt Elementare Funktionen Fast schon „nach Konstruktion“ gelten: Satz (Rechenregeln für die allgemeine Exponentialfunktion) Seien a, b > 0. Dann gilt alle x, y P R: (a) ax ⋅ ay = ax + y , (b) (ay )x = ax y , (c) ax bx = (a b)x . Beweis zu (a): ax ⋅ ay = ex log(a) ⋅ ey log(a) = e(x + y) log(a) = ax + y . zu (b): (ax ) y = (ex log(a) ) y = ey log(exp(x log(a))) = ey x log(a) = ax y . zu (c): ax bx = ex log(a) ⋅ ex log(b) = ex (log(a) + log(b)) = ex log(a b) = (a b)x . Die Aussage (a) ist nichts anderes als das Additionstheorem für expa in der alternativen Notationen, aber es schadet nicht, das kurze Argument nochmal zu wiederholen. Teil (b) ist die Verallgemeinerung unseres Ansatzes (ey )x = ex y , der die Definition von ax motivierte. Weiter halten wir folgende allgemeine Logarithmusregel fest: Satz Für alle a > 0 und x P R gilt log(ax ) = x log(a). Beweis Es gilt log(ax ) = log(exp(x log(a))) = x log(a). Berechnung von Grenzwerten Mit Hilfe der allgemeinen Exponentialfunktion lassen sich viele Grenzwerte einfach berechnen. Einige Beispiele sind: Beispiele (a) Sei 0 < a < 1. Dann gilt log(a) < 0, sodass limn →∞ (b) limn →∞ an = limn n →∞ £n = limn en log(a) = 0. →∞ n1/n = limn →∞ elog(n)/n = e0 = 1. (c) Sei n > 0. Dann gilt: limx →∞ ex xn = limn →∞ ex e n log(x) = limx →∞ ex − n log(x) = ∞. Weitere Beispiele betrachten wir in den Übungen. Einführung in die Mathematik 1 © Oliver Deiser 5. Die Exponentialfunktion 89 Die Potenzfunktionen In der allgemeinen Exponentialfunktion ist die Basis fest und der Exponent variabel. Vertauschen wir die Rollen, erhalten wir. Definition (allgemeine Potenzfunktionen) Sei b P R. Dann definieren wir pot b : ] 0, ∞ [ → R durch pot b (x) = xb = expx (b) = eb log(x) für alle x > 0. Die Funktion potb heißt die Potenzfunktion zum Exponenten b. Beispiele für Potenzfunktionen sind die auf R+ erklärten Funktionen 1, x, x2 , x3 , … x− 1 = 1/x, x− 2 = 1/x2 , x− 3 = 1/x3 , … x1/2 = £x, x1/3 = 3 £x, x1/4 = 4 £x, … xn/m = m £xn für n P Z und m P N*. Für einen positiven Exponenten b können wir die Potenzfunktionen stetig durch potb (0) = 0 fortsetzen, und für manche Exponenten b kann die Potenzfunktion potb sogar auf ganz R erklärt werden, z. B. für b P N oder b = 1/3, nicht aber für b = −1 oder b = 1/2. Im Allgemeinen sind die Potenzfunktionen nur für positive reelle Zahlen definiert, da zu ihrer Definition die Logarithmusfunktion herangezogen wird. 2.5 2.0 x1 1.5 x 3 1.0 x x2 0.5 0.0 0.5 1.0 1.5 2.0 Potenzfunktionen zu positiven Exponenten © Oliver Deiser Einführung in die Mathematik 1 90 1. Abschnitt Elementare Funktionen 7 6 5 1 x 1 x 4 1 x2 1 x3 3 2 1 0.0 0.5 1.0 1.5 2.0 2.5 3.0 Potenzfunktionen zu negativen Exponenten Die beiden Welten der Potenzfunktionen für positive bzw. negative Exponenten werden durch die konstante Potenzfunktion pot0 mit pot0 (x) = x0 = 1 für alle x > 0 getrennt. Die Wurzelfunktionen pot1/n nähern sich punktweise von unten an pot0 an, wenn n gegen unendlich strebt. Ebenso nähern sich die Potenzfunktionen pot−1/n punktweise von oben an pot0 an. Beide Typen haben Besonderheiten an ihrer linken Definitionsgrenze 0: Die Wurzelfunktionen können stetig im Nullpunkt fortgesetzt werden, sind dort aber nicht differenzierbar. Und die Funktionen pot−1/n (x) streben gegen unendlich, wenn x gegen 0 strebt. Die allgemeinen Logarithmen Eine Exponentialfunktion expa ist im Fall a > 1 streng monoton steigend und im Fall 0 < a < 1 streng monoton fallend, sodass wir ihre Umkehrfunktion können (die wie immer das Monotonieverhalten erbt): Definition (Logarithmus zu einer positiven Basis a ≠ 1) Sei a > 0, a ≠ 1. Dann heißt die Umkehrfunktion der Exponentialfunktion zur Basis a der Logarithmus zur Basis a. In Zeichen schreiben wir loga : ] 0, +∞ [ → R. Ausgenommen in der Definition ist der Fall a = 1. Die Exponentialfunktion exp1 ist konstant gleich 1 und besitzt daher keine Umkehrfunktion: Ein Logarithmus zur Basis 1 ist nicht definiert. Einführung in die Mathematik 1 © Oliver Deiser 5. Die Exponentialfunktion 91 Nach Definition gilt für alle a > 0, a ≠ 1, x P R und y > 0: (+) y = a x = expa (x) genau dann, wenn loga (y) = x. Etwas salopp kann man dies so formulieren: Die Funktion log a holt den Exponenten aus a x . 1 0.5 1.0 1.5 2.0 2.5 3.0 log(x) log2 (x) log10 (x) -1 -2 Logarithmen zu Basen größer als 1 2 log 1 (x) e 1 log 1 (x) 2 0.5 1.0 1.5 2.0 2.5 3.0 log 1 (x) 10 -1 Logarithmen zu Basen kleiner als 1 Wie für den Logarithmus zur Basis e zeigt man: Satz (Multiplikationstheorem) Sei a > 0, a ≠ 1. Dann gilt für alle x, y > 0: loga (x y) = loga (x) + loga (y) für alle x, y > 0. Weitere Eigenschaften versammelt der folgende Satz: © Oliver Deiser Einführung in die Mathematik 1 92 1. Abschnitt Elementare Funktionen Satz (Rechenregeln für Logarithmen, Basisumrechnung) Seien a, b > 0 mit a, b ≠ 1. Weiter sei x > 0. Dann gilt: (1) loga (x) = log(x) , log(a) (2) loga (x) = logb (x) , logb (a) (3) loga (x) = − log1/a (x), (4) loga (b) = 1 . logb (a) Beweis zu (1): Es gilt x = elog(x) = e log(x)/log(a) ⋅ log(a) = alog(x)/log(a) . Anwendung von loga auf beiden Seiten liefert die Behauptung. zu (2): Nach (1) ist log(y) = logb (y) log(b) für alle y > 0, sodass loga (x) = log(x) log(a) logb (x) log(b) logb (a) log(b) = = logb (x) . logb (a) zu (3): loga (x) = log1/a (x) log1/a (a) = log1/a (x) −1 = − log1/a (x). zu (4): loga (b) = logb (b) logb (a) = 1 . logb (a) Beispiel Wir betrachten den Unterschied zwischen den Logarithmen zu den Basen 2 und 8. Wegen 8 = 23 gilt für alle x > 0: log8 (x) = log2 (x) log2 (8) = log2 (x) log2 (23 ) = log2 (x) 3 log2 (2) = 1 log2 (x). 3 Der Logarithmus zur Basis 8 entsteht also aus dem Logarithmus zur Basis 2 durch Skalierung um den Faktor 3. Einführung in die Mathematik 1 © Oliver Deiser 5. Die Exponentialfunktion 93 Übungen Übung 1 Seien a, c P R beliebig. Zeigen Sie, dass es genau eine Funktion f : R → R gibt mit f ′(x) = af(x) für alle x P R und f(0) = c. [ Verwenden Sie zum Beweis der Eindeutigkeit, dass Funktionen, deren Ableitung die Nullfunktion ist, konstant sind. ] Übung 2 Wir betrachten die Differentialgleichung f ′(x) = 1/f(x). (a) Zeichnen Sie das Richtungsfeld der Differentialgleichung. (b) Für welche x0 , y0 P R gibt es eine Lösung f : P → R mit f(x0 ) = y0 ? (Der Definitionsbereich P wird maximal gewählt, sodass die Funktion f auf ganz P differenzierbar ist.) (c) Geben Sie eine Lösung f : P → R mit f(x0 ) = y0 im Fall der Existenz in Abhängigkeit von x0 , y0 P R konkret an. Übung 3 Sei c P R. Zeigen Sie, dass es genau eine Funktion f : ] 0, ∞ [ → R gibt mit f ′(x) = − f(x)/x für alle x > 0 und f(1) = a. Übung 4 Zeigen Sie mit Hilfe des Additionstheorems: (1) exp(nx) = exp(x)n für alle n P N, (2) exp(−nx) = exp(x)−n für alle n P N, (3) exp(n/m x) = m £exp(x)n für alle n P Z, m ≥ 1. Übung 5 Werden k Euro zu einem jährlichen positiven Zinssatz von p Prozent angelegt, so erhält man mit a = p/100 nach einem Jahr k(1 + a) Euro, also zum Beispiel 106 Euro bei k = 100, 6% Zinsen und a = 0,06. Erfolgt bereits nach einem halben Jahr eine anteilige Verzinsung, so erhält man nach einem halben Jahr k(1 + a/2) Euro. Legt man dieses Kapitel ein weiteres halbes Jahr an, so erhält man k(1 + a/2)2 > k(1 + a). Modellieren Sie auf der Grundlage dieser Überlegungen eine stetige Verzinsung, bei der das angelegte Kapital kontinuierlich verzinst und die Zinsen kontinuierlich wieder angelegt werden. Welche Rolle spielt e in diesem Modell? © Oliver Deiser Einführung in die Mathematik 1 94 1. Abschnitt Elementare Funktionen Übung 6 Beweisen Sie das Additionstheorem für die Exponentialfunktion mit Hilfe der Limesdarstellung ( exp(x) = lim n ≥ 1 1 + x n )n für alle x P R. Übung 7 Für welche Paare (a, x) reeller Zahlen kann ax definiert werden? Geben Sie die Definitionen genau an. Vergleichen Sie verschiedene Definitionen und zeigen Sie, dass sie konsistent sind, zum Beispiel x2 = x x versus x2 = exp(2log(x)) für alle x > 0. Übung 8 Warum ist die Basis e gegenüber anderen Basen a > 0 ausgezeichnet? Übung 9 Skizzieren Sie die Funktionen expa : R → R und loga : ] 0, ∞ [ → R für einige Basen a, sodass der von der Basis abhängige qualitative Verlauf deutlich wird. Übung 10 Sei a > 0 mit a ≠ 1. Zeigen Sie: loga (x y ) = y loga (x) für alle x > 0 und y P R. Übung 11 Sei a > 0 mit a ≠ 1. Weiter sei c ≠ 0. Zeigen Sie: logac (x) = loga (x)/c für alle x > 0. Übung 12 Betrachten Sie die Aussage „Die Exponentialfunktion wächst schneller als jede Potenz xn .“ (a) Präzisieren Sie die Aussage. (b) Welche Wachstumsaussage ergibt sich für den Logarithmus? (c) Strebt log(x) besonders schnell oder besonders langsam gegen ∞, wenn x von rechts gegen 0 strebt? Begründen Sie Ihre Antwort. Übung 13 Bestimmen Sie für x > 0:. (a) lim x →0 x (log x)n mit n ≥ 1 beliebig. (b) lim x →0 xx . Einführung in die Mathematik 1 © Oliver Deiser 6. Die trigonometrischen Funktionen Wir führen den Kosinus und Sinus als Koordinatenfunktionen für Punkte des Einheitskreis ein. Als erste wichtige Anwendung beschreiben wir Drehungen in der Ebene. Danach diskutieren wir die klassische Bedeutung der trigonometrischen Funktionen an Dreiecken. Mit Hilfe der Umkehrfunktionen bestimmen wir schließlich Winkel und Polarkoordinaten. © Oliver Deiser Einführung in die Mathematik 1 96 1. Abschnitt Elementare Funktionen Kosinus und Sinus am Einheitskreis Wir definieren: Definition (Kreis) Sei r P R+0 . Dann heißt Kr = { (x, y) P R2 | x2 + y2 = r2 } der Kreis oder genauer die Kreislinie mit Radius r und Mittelpunkt 0 = (0, 0) der Ebene R2 . Der Kreis K = K1 heißt der Einheitskreis in R2 . Definition (Winkel im Bogenmaß) Ist P ein Punkt auf dem Einheitskreis K, so heißt die Länge α P [ 0, 2π [ des Kreisbogens von K, der gegen den Uhrzeigersinn von (1, 0) zu P führt, der von P und der x-Achse eingeschlossene Winkel (im Bogenmaß) im Intervall [ 0, 2π[. 1.0 K P 0.5 -1.0 -0.5 0.5 1.0 -0.5 -1.0 Ein Punkt auf dem Einheitskreis und Winkel im Bogenmaß Wir vereinbaren: Konvention Indem wir reelle Zahlen, die sich nur um ein ganzzahliges Vielfaches von 2π unterscheiden, miteinander identifizieren, können wir jede reelle Zahl als Winkel auffassen. Für alle α P R gibt es dann einen Punkt P auf dem Einheitskreis mit dem Winkel α. Zwei Winkel, die demselben Punkt P entsprechen, unterscheiden sich um ein ganzzahliges Vielfaches von 2π. Einführung in die Mathematik 1 © Oliver Deiser 6. Die trigonometrischen Funktionen 97 Anschaulich entspricht diese Identifizierung dem mehrfachen Durchlaufen des Einheitskreises für α ≥ 2π bzw. einem Durchlaufen des Einheitskreises im Uhrzeigersinn für α < 0. Oft ist es auch nützlich, Winkel standardmäßig im Intervall ] −π, π ] anstelle von [ 0, 2π [ zu wählen. Prinzipiell ist jedes halboffene Intervall der Länge 2π geeignet. Nach diesen Vorbereitungen können wir nun die Kosinus- und Sinusfunktion einführen: Definition (Sinus und Kosinus als Koordinatenfunktionen) Sei α P R, und sei P der Punkt des Einheitskreis K mit Winkel α. Dann setzen wir cos(α) = „die x-Koordinate von P“, sin(α) = „die y-Koordinate von P“. Die so definierten Funktionen cos : R → R und sin : R → R heißen die Kosinus-Funktion bzw. Sinus-Funktion auf R. Liegt also P auf K mit Winkel α, so gilt nach Definition P = (cos(α), sin(α)). K sin( ) P cos( ) Kosinus und Sinus als Koordinatenfunktionen für Punkte des Einheitskreises Aufgrund unserer Identifizierung von Winkeln sind die Kosinus- und Sinusfunktion 2π-periodisch, d. h. es gilt cos(α + k2π) = cos(α), sin(α + k2π) = sin(α) für alle α P R und k P Z. © Oliver Deiser Einführung in die Mathematik 1 98 1. Abschnitt Elementare Funktionen 1.0 cos(x) 0.5 -3 -2 - 2 3 2 3 -0.5 -1.0 1.0 sin(x) 0.5 -3 -2 - -0.5 -1.0 Wir können die Definition aus unterschiedlichen Gesichtspunkten betrachten. Zwei wichtige Interpretationen sind: Dynamische Interpretation: Gleichmäßige Kreisbewegung Bewegt sich ein Punkt P in der Zeit t auf dem Einheitskreis gleichmäßig gegen den Uhrzeigersinn mit der Winkelgeschwindigkeit 1 und gilt P(0) = (1, 0), so gilt P(t) = (cos(t), sin(t)) für alle t P R. Geometrische Interpretation: Längentreue Kreisaufwicklung Sei x P R. Wickeln wir eine Strecke von 0 bis x längentreu auf den Einheitskreis auf (gegen den Uhrzeigersinn für x ≥ 0, im Uhrzeigersinn für x < 0), so endet diese Kreisaufwicklung im Punkt P(x) = (cos(x), sin(x)) P K. Einführung in die Mathematik 1 © Oliver Deiser 6. Die trigonometrischen Funktionen 99 Im Umgang mit trigonometrischen Funktionen verwenden wir je nach Kontext und prinzipiell völlig frei die Variablen x,y,α,β, …,ϕ,ψ, … Um Klammern zu sparen, vereinbaren wir: Notation Wir lassen Funktionsklammern oft weg und schreiben sin x, cos x statt sin(x), cos(x). Weiter schreiben wir sin2 x, cos2 x statt (sin x)2 , (cos x)2 . Allgemein verwenden wir für jede Funktion f zusätzlich zu f(x) auch die alternative Notation fx , wo immer es der Übersichtlichkeit dient. Eigenschaften von Kosinus und Sinus Aus der Definition am Einheitskreis gewinnen wir: Satz (elementare Werte von cos und sin) Für alle k P Z gilt: (a) cos(π/2 + kπ) = 0, sin(kπ) = 0, k (Nullstellen) k (b) cos(kπ) = (−1) , sin(π/2 + kπ) = (−1) , (±1-Werte) (c) cos(π/4 + kπ) = sin(π/4 + kπ) = (−1)k £2/2. (gleiche Werte) Zudem gibt es keine weiteren Nullstellen, Stellen mit Wert ±1 und Stellen mit gleichem Wert. 1.0 0.5 cos(x) -3 -2 - 2 3 sin(x) -0.5 -1.0 Einige häufig verwendete Formeln versammelt der folgende Satz. © Oliver Deiser Einführung in die Mathematik 1 100 1. Abschnitt Elementare Funktionen Satz (elementare Eigenschaften von cos und sin) Für alle α P R gilt: (a) cos2 α + sin2 α = 1, (Satz des Pythagoras für Kosinus und Sinus) (b) cos α = cos (−α), sin α = − sin(−α), (Parität) (c) cos(π/2 − α) = sin α, sin(π/2 − α) = cos α, (Spiegelung) (d) cos(α + π/2) = − sin α, sin(α + π/2) = cos α, cos(α + π) = − cos α, sin(α + π) = − sin α, cos(α + 3π/2) = sin α, sin(α + 3π/2) = − cos α, cos(α + 2π) = cos α, sin(α + 2π) = sin α. (Verschiebungsformeln) Die erste Eigenschaft folgt aus dem Satz des Pythagoras, den wir an dieser Stelle voraussetzen. Die anderen Eigenschaften ergeben sich aus elementaren geometrischen Transformationen, die wir aufgrund ihrer Bedeutung allgemein formulieren: Spiegelung im Nullpunkt Bei der Spiegelung am Nullpunkt geht ein Punkt (x, y) über in den Punkt −(x, y) = (−x, −y). Spiegelung an den Achsen Bei der Spiegelung an der x-Achse geht ein Punkt (x, y) über in (x, −y). Bei der Spiegelung an der y-Achse geht (x, y) über in (−x, y). Spiegelungen an der ersten und zweiten Winkelhalbierenden Bei der Spiegelung an der Winkelhalbierenden (des ersten und dritten Quadranten) geht ein Punkt (x, y) über in (y, x). Bei der Spiegelung an der Winkelhalbierenden des zweiten und vierten Quadranten geht (x, y) über in (−y, −x). Drehungen um π/2 Bei der Drehung um π/2 (gegen den Uhrzeigersinn) geht ein Punkt (x, y) über in (−y, x). Bei der Drehung um π/2 im Uhrzeigersinn geht (x, y) über in (y, −x). Damit lässt sich eine Drehung um π/2 beispielsweise auch auffassen als eine Spiegelung an der x-Achse gefolgt von einer Spiegelung an der Winkelhalbierenden: (x, y) wird erst zu (x, −y) und dann zu (−y, x). Der Leser möge die Eigenschaften des Satzes mit Hilfe von Diagrammen visualisieren und sie mit Hilfe der Transformationsregeln für Spiegelungen und Drehungen um π/2 begründen. Einführung in die Mathematik 1 © Oliver Deiser 6. Die trigonometrischen Funktionen 101 (-y, x) x (x, y) y -x -y y x -y (-x, -y) -x (y, -x) Die beiden Drehungen um π/2 und die Spiegelung am Nullpunkt Drehungen und Additionstheoreme Seien P = (cos α, sin α) ein Punkt auf dem Einheitskreis und β P R. Drehen wir P um den Winkel β, so erhalten wir den Punkt Q = (cos(α + β), sin(α + β)) des Einheitskreises. Q K sin( ) P cos( ) Die Drehung eines Punktes P zum Punkt Q auf K (I) © Oliver Deiser Einführung in die Mathematik 1 102 1. Abschnitt Elementare Funktionen Den Punkt Q können wir aber auch so beschreiben: P ist die Summe der Vektoren v = (cos α, 0) und w = (0, sin α). Weiter ist Q die Summe der um β gedrehten Vektoren v und w, die wir v* und w* nennen wollen. Der Vektor v* ist ist der um cos α skalierte um β gedrehte Einheitsvektor e1 = (1, 0), sodass v* = cos(α) (cos β, sin β). Ebenso ist der Vektor w* der um sinα skalierte und um β gedrehte Einheitsvektor e2 = (0, 1), sodass w* = sin(α) (− sin β, cos β). Damit gilt: Q = cos α (cos β, sin β) + sin α (− sin β, cos β) = (cos α cos β − sin α sin β, cos α sin β + sin α cos β). K Q P w* w v* v Die Drehung eines Punktes P zum Punkt Q auf K (II) Durch Koordinatenvergleich erhalten wir: Satz (Additionstheoreme für Kosinus und Sinus) Für alle α, β P R gilt: (a) cos(α + β) = cos α cos β − sin α sin β, (b) sin(α + β) = cos α sin β + sin α cos β. Unsere Argumentation entspricht der Definition von Kosinus und Sinus als Koordinatenfunktionen für Punkte des Einheitskreises. Einen weiteren Beweis dieser fundamentalen Eigenschaften mit Hilfe von rechtwinkligen Dreiecken werden wir unten kennenlernen. Einführung in die Mathematik 1 © Oliver Deiser 6. Die trigonometrischen Funktionen 103 Für den Spezialfall α = β erhalten wir: Korollar (Verdopplungsformeln) Für alle α P R gilt: (a) sin(2α) = sin α cos α + cos α sin α = 2 sin α cos α, (b) cos(2α) = cos α cos α − sin α sin α = cos2 α − sin2 α. Im Fall β = π/4 erhalten mit Hilfe der Werte sin(π/4) = cos(π/4) = £2/2: Korollar (π/4-Formeln) Für alle α P R gilt: (a) cos α + sin α = £2 cos(α − π/4) = £2 sin(α + π/4), (b) cos α − sin α = £2 cos(α + π/4) = − £2 sin(α − π/4). 1.0 0.5 cos(2 x) cos2 (x) - sin2 (x) -0.5 -1.0 Zur Verdopplungsformel des Kosinus 1.5 1.0 0.5 cos(x) + sin(x) -2 - 2 cos(x) - sin(x) 2 -0.5 -1.0 -1.5 Summe und Differenz von Kosinus und Sinus © Oliver Deiser Einführung in die Mathematik 1 104 1. Abschnitt Elementare Funktionen Wir wollen die Additionstheoreme noch einmal in einem anderen Licht betrachten. Drehungen am Kreis in kartesischen Koordinaten Seien P1 = (x1 , y1 ) = (cos α, sin α) und P2 = (x2 , y2 ) = (cos β, sin β) Punkte auf dem Einheitskreis mit den Winkeln α bzw. β. Drehen wir P1 um den Winkel β oder gleichwertig P2 um den Winkel α, so erhalten wir nach den Additionstheoremen den Punkt Q = (cos α cos β − sin α sin β, cos α sin β + sin α cos β) = (x1 x2 − y1 y2 , x1 y2 + y1 x2 ). (Drehformel) Es ist bemerkenswert, dass sich die Koordinaten von Q in dieser relativ einfachen Form aus den Koordinaten von P1 und P2 berechnen lassen. Q P2 y2 P1 y1 K x2 x1 Q ergibt sich aus den Koordinaten von P1 und P2 : Q = (x1 x2 − y1 y2 , x1 y2 + y1 x2 ) Beispiel Sei λ = 1/£2, und sei P1 = λ (1, 1) der Punkt auf dem Einheitskreis mit dem Winkel π/4. Drehen wir P1 um den Winkel π/4, so erhalten wir den Einheitsvektor Q = e2 = (0, 1). Dieses anschaulich klare Ergebnis liefert auch die Drehformel mit P2 = P1 , da Q = (x1 x2 − y1 y2 , x1 y2 + y1 x2 ) = (λ2 − λ2 , λ2 + λ2 ) = (0, 1). Ist allgemein P2 = (x, y) ein Punkt auf K, so ist Q = (λx − λ y, λy + λx) = λ (x − y, x + y) der um π/4 gedrehte Punkt auf K. Dieses Ergebnis erhalten wir auch aus der folgenden allgemeinen Überlegung: Einführung in die Mathematik 1 © Oliver Deiser 6. Die trigonometrischen Funktionen 105 Drehungen als Transformationen der Ebene Sei α P R. Wir betrachten die Funktion rotα : R2 → R2 , die einen Vektor v = (x, y) der Ebene um den Winkel α dreht. Ist v = (x, y) P R2 und λ = £x2 + y2 die Länge von v, so gibt es ein β mit v = λ (cos β, sin β). Aus rotα (x, y) = λ rotα (cos β, sin β) und x = λ cos β, y = λ sin β erhalten wir rotα (x, y) = λ (cos(α + β), sin(α + β)) = λ (cos α cos β − sin α sin β, cos α sin β + sin α cos β) = (x cos α − y sin α, x sin α + y cos α). Der Leser setze (x1 , y1 ) = (cos α, sin α) und vergleiche das Ergebnis mit obiger Drehformel. Übersichtlicher wird die Formel für rotα (x, y), wenn wir Vektoren der Ebene als Spalten notieren (die Koordinaten untereinander schreiben) und die Abbildung rotα durch eine (2 × 2)-Matrix darstellen: rotα (x, y) = cos α − sin α x sin α cos α y = x cos α − y sin α x sin α + y cos α . Einsetzen von e1 = (1, 0) und e2 = (0, 1) zeigt, dass die beiden Spaltenvektoren der Matrix die Bilder der Einheitsvektoren e1 und e2 unter der Drehung um α sind. Die allgemeine Wirkung der Matrix auf einen Vektor (x, y) ist durch „Zeile mal Spalte“ (im Sinne einer Linearkombination) definiert. Mit diesen Regeln lässt sich die Darstellung leicht merken. An dieser Stelle ist alles nur ein Spiel mit Notationen. Wir werden Matrizen später genauer besprechen und auf Drehungen zurückkommen. rot (v) = 2 /7 v = 9 /7 v rot (v) Zwei Rotationen eines Vektors © Oliver Deiser Einführung in die Mathematik 1 106 1. Abschnitt Elementare Funktionen Weitere trigonometrische Funktionen Mit Hilfe der Kosinus- und Sinusfunktion lassen sich zahlreiche weitere Funktionen definieren. Vier davon sind: Definition (Tangens, Kotangens, Sekans, Kosekans) Wir definieren tan = cos , sec = sin sin , cot = cos 1 , csc = cos 1 . sin Die Funktionen heißen der Tangens, Kotangens, Sekans bzw. Kosekans. Wie bei den rationalen Funktion sind die Funktionen genau an den Nullstellen der Nenner nicht definiert. Damit gilt tan, sec : R − A → R mit A = { π/2 + k π | k P Z }, cot, csc : R − B → R mit B = { k π | k P Z }. Aus den elementaren Formeln für den Kosinus und Sinus ergeben sich viele Formeln für die anderen trigonometrischen Funktionen. Exemplarisch halten wir fest: tan(± π/4) = cot(± π/4) = ± 1, tan(π/2 − α) = cot α, cot(π/2 − α) = tan α, tan(α ± π) = tan α, cot(α ± π) = cot α. Diese Formeln gelten unter der Voraussetzung der Definiertheit, d. h. für alle Stellen α, an denen alle beteiligten Funktionen definiert sind. Die Additionstheoreme für den Kosinus und Sinus liefern: Satz (Additionstheoreme für Tangens, Kotangens) Für alle α, β P R gilt unter der Voraussetzung der Definiertheit: (a) tan(α + β) = tan α + tan β , 1 − tan α tan β (b) cot(α + β) = cot α cot β − 1 . cot α + cot β Die Beweise dieser Additionstheoreme seien dem Leser zur Übung überlassen. Einführung in die Mathematik 1 © Oliver Deiser 6. Die trigonometrischen Funktionen 107 6 tan(x) 4 2 -2 - 2 -2 -4 -6 cot(x) 5 -2 - 2 -5 sec(x) 5 -3 -2 - 2 3 2 3 -5 csc(x) 5 -3 -2 - -5 © Oliver Deiser Einführung in die Mathematik 1 108 1. Abschnitt Elementare Funktionen Trigonometrische Größen in rechtwinkligen Dreiecken Kosinus und Sinus spielen bei der Untersuchung rechtwinkliger Dreiecke eine Schlüsselrolle. Ist ein rechtwinkliges Dreieck ABC mit Seitenlängen a, b, c und Winkeln α, β, γ mit γ = π/2 gegeben, so können wir durch Verschieben, Drehen und Spiegeln annehmen, dass A der Nullpunkt ist, C auf der positiven x-Achse und B im ersten Quadranten liegt. Dann ist B = (b, a) ein Punkt auf dem Kreis Kc , dessen Radius der Hypotenuse c des Dreiecks ABC entspricht. Folglich ist (b, a) = B = c (cos α, sin α), b = c cos α, a = c sin α. Die anderen trigonometrischen Funktionen lassen sich ebenfalls mit Hilfe rechtwinkliger Dreiecke veranschaulichen. Auch die Additionstheoreme cos(α + β) = cos α cos β − sin α sin β, sin(α + β) = cos α sin β + sin α cos β für alle α, β P R können wir mit Hilfe rechtwinkliger Dreiecke beweisen: Zweiter Beweis der Additionstheoreme Seien α, β P R. Wir nehmen zunächst an, dass α, β > 0 und α + β < π/2. Alles weitere wird sich hieraus ergeben. Unter diesen Voraussetzungen ist α + β der Winkel eines rechtwinkligen Dreiecks. Ein solches Dreieck konstruieren wir wie folgt, wobei wir mit / ABC den zur Ecke B gehörigen Winkel eines Dreiecks mit den Ecken A, B, C bezeichnen: Sei P = (cos α, sin α). Weiter sei Q = (x0 , 0) der Punkt auf der x-Achse mit /0QP = β. Dann gilt /Q0P = α. Schließlich sei A der Punkt auf der Geraden QP mit /0AP = π/2. Dann ist /0PA = α + β. Das Dreieck 0PA ist also wie gewünscht. K A P + Q Zum trigonometrischen Beweis des Additionstheorems des Sinus Einführung in die Mathematik 1 © Oliver Deiser 6. Die trigonometrischen Funktionen 109 Damit können wir nun rechnen: sin(α + β) = 0A = x0 sin β = (cos α + cot β sin β) sin β = sin α cos β + cos α sin β. Das Kosinus-Theorem wird analog bewiesen (oder mit Hilfe des Satzes von Pythagoras aus dem Sinus-Theorem gefolgert). Wir betrachten nun allgemeinere Winkel. Die Additionstheoreme sind wegen sin 0 = cos(π/2) = 0 und sin (π/2) = cos 0 = 1 klar, wenn einer der beiden Winkel 0 oder π/2 ist. Sind α, β P [ 0, π/2 ] mit α + β ≥ π/2, so seien α* = π/2 − α, β* = π/2 − β. Dann gilt nach dem bereits Bewiesenen, dass sin(α + β) = sin(π − (α + β)) = sin(α* + β*) = sin α* cos β* + cos α* sin β* = cos α sin β + sin α cos β = sin α cos β + cos α sin β. Analog argumentiert man für den Kosinus. Damit haben wir die Additionstheoreme für alle α, β P [ 0, π/2 ] gezeigt (dies entspricht Punkten P und Q auf dem Einheitskreis im ersten Quadranten). Hieraus können wir die Theoreme für beliebige Winkel α, β P R folgern, indem wir α = α1 + k1 π/2, β = β1 + k2 π/2 mit k1 , k2 P Z und α1 , β1 P [ 0, π/2 ] schreiben und die Verschiebungsformeln anwenden. Identifikation der trigonometrischen Größen Die sechs trigonometrischen Größen cos α, sin α, tan α, cot α, sec α, csc α tauchen in zahlreichen geometrischen Figuren auf. Wir betrachten zwei typische Beispiele. Die Identifikation der Größen ergibt sich aus ihrer Definition durch Anwendung des Strahlensatzes. Im Folgenden bezeichnen wir die Länge der Strecke zwischen zwei Punkten A und B der Ebene mit AB. Ist A = (x1 , y1 ) und B = (x2 , y2 ), so gilt also AB = £(x1 − x2 )2 + (y1 − y2 )2 . In unserer ersten Figur betrachten wir einen Punkt P auf dem Einheitskreis mit Winkel α P ]0, π/2[ und den durch den Nullpunkt 0 und P definierten Halbstrahl der Ebene. Dieser Halbstrahl schneidet das kartesische Koordinatengitter in zwei Punkten R und S. In der entstehenden Figur sind alle sechs Größen enthalten. © Oliver Deiser Einführung in die Mathematik 1 110 1. Abschnitt Elementare Funktionen U = (0, 1) S R P O T = (1, 0) Q cos α = OQ, sin α = QP, tan α = TR, cot α = US, sec α = OR, csc α = OS Mit Hilfe der Figur können wir viele Eigenschaften der Funktionen veranschaulichen. So strebt zum Beispiel tan α = TR gegen unendlich, wenn der Winkel α gegen π/2 strebt. Weiter gilt R = S = (1, 1) und damit tan α = cot α, falls α = π/4. In der zweiten Figur betrachten wir die Tangente des Einheitskreises K bei P. Sie definiert zwei Punkte auf den Achsen: S U P R O Q T cos α = OQ, sin α = QP, tan α = PR, cot α = PS, sec α = OR, csc α = OS Einführung in die Mathematik 1 © Oliver Deiser 6. Die trigonometrischen Funktionen 111 Kombiniert erhalten wir folgende Figur, die die vier vielleicht weniger offensichtlichen Größen tan α, cot α, sec α und csc α in den Mittelpunkt rückt: cot K csc tan sec Die Figur lässt sich noch weiter analysieren. Der Schnittpunkt W der beiden Tangensstrecken definiert beispielsweise die Winkelhalbierende von α. © Oliver Deiser Einführung in die Mathematik 1 112 1. Abschnitt Elementare Funktionen Übungen Übung 1 Illustrieren und begründen Sie die elementaren Eigenschaften von Kosinus und Sinus mit Hilfe von Diagrammen. Übung 2 Erläutern und präzisieren Sie die folgende Aussage mit Hilfe der Definition von Kosinus und Sinus am Einheitskreis: „Kennt man den Kosinus oder den Sinus auf [ 0, π/4 ], so kennt man beide Funktionen auf ganz R.“ Übung 3 Finden Sie Formeln für sin(3x) und cos(3x). Übung 4 Zeigen Sie, dass für alle x, y P R unter der Voraussetzung der Definiertheit gilt: (a) tan(x + y) = tan x + tan y , 1 − tan x tan y (b) cot(x + y) = cot x cot y − 1 . cot x + cot y Übung 5 Zeigen Sie, dass für alle x P R unter der Voraussetzung der Definiertheit die folgenden Halbierungsformeln gelten: (a) cos2 (x/2) = 1 + cos x , 2 (b) sin2 (x/2) = 1 − cos x , 2 (c) tan(x/2) = 1 − cos x sin x = sin x . 1 + cos x Welche Vorzeichen sind beim Wurzelziehen in (a) und (b) abhängig von x zu wählen? Einführung in die Mathematik 1 © Oliver Deiser 6. Die trigonometrischen Funktionen 113 Übung 6 Seien x, y P R. Wir setzen s = (x − y)/2 und t = (x + y)/2. Zeigen Sie: (a) sin x + sin y = 2 sin t cos s, (b) cos x + cos y = 2 cos s cos t, (c) sin x − sin y = 2 sin s cos t, (d) cos x − cos y = −2 sin s sin t. Übung 7 Zeigen Sie: (a) sin ( π 4 ) = cos( π 4 )= (b) sin ( π 8 ) = cos( 3π 8 ) ( π 8 ) = sin( 3π 8 )= ( π 8 ) = cot( 3π 8 ) = £2 − 1, ( 3π 8 π 8 ) = £2 + 1, cos (c) tan tan ) = cot( 1 , tan ( π 4 £2 1 = £2 − £2 , 2 ) = cot( π 4 ) = 1, 1 £2 + £2 , 2 Übung 8 (a) Geben Sie Formeln für Drehungen um die Winkel π/4 und π/8 im und gegen den Uhrzeigersinn an, die nur die Grundrechenarten und die Wurzelfunktion verwenden. (b) Geben Sie ausgehend von der Drehformel rotπ/2 (x, y) = (−y, x) rekursiv Formeln für Drehungen um π/2n für alle n ≥ 1 an, die nur die Grundrechenarten und die Wurzelfunktion verwenden. Begründen Sie den Rekursionsschritt geometrisch und zeichnen Sie ein Diagramm zur Illustration. Übung 9 Erklären Sie geometrisch, warum der Betrag von cos α + sin α maximal den Wert £2 ergibt. Übung 10 Sei f : R → R. Zeigen Sie, dass die folgenden Aussagen äquivalent sind: (a) Es gibt c, t0 P R mit f(t) = c cos(t + t0 ) für alle t P R. (b) Es gibt a, b P R mit f(t) = a cos t + b sin t für alle t P R. © Oliver Deiser Einführung in die Mathematik 1 114 1. Abschnitt Elementare Funktionen Übung 11 Beweisen Sie das Additionstheorem für den Kosinus für α, β P ] 0, π/2 [ mit α + β < π/2 (a) mit Hilfe des im zweiten Beweis der Additionstheoreme konstruierten Dreiecks, (b) mit Hilfe des Additionstheorems für den Sinus und dem Satz des Pythagoras. Einführung in die Mathematik 1 © Oliver Deiser 7. Arkusfunktionen und Polarkoordinaten Wir betrachten nun die Umkehrfunktionen der auf geeignete Intervalle eingeschränkten trigonometrischen Funktionen. Die so erhaltenen Arkusfunktionen eignen sich zur Messung von Bogenlängen und damit von Winkeln im Bogenmaß. Eine wichtige Rolle kommt dabei dem Arkustangens zu. Mit seiner Hilfe führen wir Polarkoordinaten ein, bei denen die Ebene nicht durch ein achsenparalleles Gitter überzogen wird, sondern durch von Nullpunkt ausgehende Halbstrahlen und zentrische Kreise. © Oliver Deiser Einführung in die Mathematik 1 116 1. Abschnitt Elementare Funktionen Die Arkusfunktionen Um die trigonometrischen Funktionen umkehren zu können, schränken wir sie auf möglichst große Intervalle ein, auf denen die Funktionen keine Werte mehrfach annehmen (der Leser vergleiche die Definition der Quadratwurzelfunktion). Bei der Einschränkung bevorzugen wir Intervalle, die die Null als Mitte oder linke Grenze besitzen. Definition (Einschränkungen der trigonometrischen Funktionen) Wir definieren sin0 = sin | [− π/2, π/2] , cos0 = cos | [ 0, π ], tan0 = tan | ]− π/2, π/2 [, cot0 = cot | ] 0, π [, sec0 = sec|([0, π] − { π/2 }), csc0 = csc|([ − π/2, π/2 ] − { 0 }). Graphisch entsteht sin0 aus sin, indem wir den Sinus außerhalb des Intervalls [ −π/2, π/2 ] abdecken oder wegradieren. Analoges gilt für die anderen Funktionen. Damit können wir definieren: Definition (Arkusfunktionen) Die Arkusfunktionen arccos, arcsin, arctan, arccot, arcsec, arccsc sind definiert als die Umkehrfunktionen von cos0 , sin0 , tan0 , cot0 , sec0 , csc0 . Einen Überblick über Definitions- und Wertebereich der Arkusfunktion gibt die folgende Tabelle: Funktion Definitionsbereich Wertebereich arcsin [ −1, 1 ] [ − π/2, π/2 ] arccos [ −1, 1 ] [ 0, π ] arctan R ] − π/2, π/2 [ arccot R ] 0, π [ arcsec R − ] −1, 1 [ [ 0, π ] − { π/2 } arccsc R − ] −1, 1 [ [ − π/2, π/2 ] − { 0 } Einführung in die Mathematik 1 © Oliver Deiser 7. Arkusfunktionen und Polarkoordinaten 117 2 arcsin(x) 4 -1.0 -0.5 0.5 1.0 4 2 3 4 2 arccos(x) 4 -1.0 -0.5 0.5 1.0 2 4 -6 -4 -2 2 4 6 4 arctan(x) 2 © Oliver Deiser Einführung in die Mathematik 1 118 1. Abschnitt Elementare Funktionen arccot(x) 3 4 2 4 -6 -4 -2 2 4 6 3 4 arcsec(x) 2 4 -10 -5 5 10 5 10 2 4 -10 -5 arccsc(x) 4 2 Einführung in die Mathematik 1 © Oliver Deiser 7. Arkusfunktionen und Polarkoordinaten 119 Die Namensgebung geht auf „arcus“ = „Bogen“ und die mathematische Lesart als „Kreisbogen“ zurück. So wie Kosinus und Sinus eine Bogenlänge ϕ in Koordinaten umrechnen, so rechnet der Arkuskosinus eine x-Koordinate und der Arkussinus eine y-Koordinate in eine Bogenlänge um. Dabei wird die Bogenlänge immer in einem bestimmten Winkelintervall angegeben und im Allgemeinen folgt aus x = cos ϕ nicht, dass arccos x = ϕ. Richtig ist dies, wenn ϕ P [ 0, π ]. Analog zur Formel £x2 = |x| vom nichtvergessenen Betrag gibt es Formeln vom „nichtvergessenen Winkelintervall“. Nach Definition gilt zum Beispiel für den Arkussinus sin arcsin x = x für alle x P [ −1, 1 ], arcsin sin α = α für alle α P [ −π/2, π/2 ], arcsin sin α = π − α für alle α P [ π/2, 3π/2 ], arcsin sin α = α − 2π für alle α P [ 3π/2, 5π/2 ], arcsin sin(α + 2π) = arcsin sin α für alle α P R. Graphisch dargestellt ergeben sich periodische Sägezahnfunktionen: arcsin(sin x) arccos(cos x) -3 -2 - 2 3 2 4 arctan(tan x) -2 - 2 4 2 © Oliver Deiser Einführung in die Mathematik 1 120 1. Abschnitt Elementare Funktionen 3 4 arccot(cot x) 2 4 -2 - 2 In vielen Anwendungen − zum Beispiel in der Integrationstheorie − sind Verknüpfungen des Typs „trigo auf arkus“ bedeutsam. Einige Formeln sind: Satz (Kombinationsformeln) Für alle x P R gilt unter der Voraussetzung der Definiertheit: (a) sin arccos x = cos arcsin x = £1 − x2 , (b) tan arccot x = cot arctan x = 1 . x Beweis zu (a): Für alle y P [ 0, π ] ist sin y ≥ 0 und sin y = £1 − cos2 y . Ist nun x P [ −1, 1 ] beliebig und y = arccos x, so ist y P [ 0, π ], sodass sich wegen cos y = cos arccos x = x die Sinus-Formel ergibt. Die Kosinus-Formel wird analog bewiesen. zu (b): Für alle y P R gilt unter der Voraussetzung der Definiertheit tan y = 1 . cot y Für y = arccot x ergibt sich wegen cot arccot x = x die Tangens-Formel. Die Formel für den Kotangens wird analog bewiesen. Zur Visualisierung der Kombinationsformeln betrachten wir für ein gegebenes x > 0 rechtwinklige Dreiecke mit den Seitenlängen 1 und x. Davon gibt es sechs Typen, deren dritte Seite w gleich £1 − x2 , £1 + x2 oder £x2 − 1 ist: Einführung in die Mathematik 1 © Oliver Deiser 7. Arkusfunktionen und Polarkoordinaten Arccos 121 Arcsin 1 1 w x x w Arctan Arccot w w x 1 1 x Arcsec Arccsc x x w 1 1 w Aus den Figuren lassen sich die Kombinationsformeln der folgenden Tabelle ablesen: Bild α cos α sin α 1 arccos x x w = £1 - x2 2 arcsin x w = £ 1 − x2 x 3 arctan x 1/w = 1/ £1 + x2 x/w = x/ £1 + x2 4 arccot x x/w = x/ £1 + x2 1/w = 1/ £1 + x2 5 arcsec x 1/x w/x = £x2 − 1 /x 6 arccsc x w/x = £x2 − 1 /x 1/x © Oliver Deiser Einführung in die Mathematik 1 122 1. Abschnitt Elementare Funktionen Für die umgekehrte Kombinationen „arkus auf trigo“ gibt es keine einfachen Formeln. Neben Sägezahntypen wie oben entstehen Funktionen mit einem wellenartigen Verlauf: 4 arctan(cos x) -2 - 2 /4 cos x 4 Winkelberechnungen bei Geraden Der Arkustangens spielt eine prominente Rolle bei der Berechnung von Winkeln. Ist g = ax + b eine Gerade mit der Steigung a ≠ 0, so ist arctan(a) der im Intervall ] −π/2, π/2 [ gemessene Winkel, den die Gerade mit der x-Achse oder allgemeiner jeder konstanten Funktion einschließt. (Im Fall a = 0 gilt arctan(a) = 0, in Übereinstimmung mit der Parallelität der Geraden zur x-Achse.) Sind zwei Geraden g = ax + b und h = c x + d mit Steigungen a ≠ c gegeben, so berechnet sich der Winkel α im Intervall [ 0, π/2 ], in dem sich die Geraden schneiden, durch α = { |arctan a − arctan c| π − |arctan a − arctan c| dieser Wert in [ 0, π/2 ] liegt, falls sonst. Gilt ac = −1, so stehen die Vektoren (1, a) und (1, c) senkrecht aufeinander, sodass α = π/2. Sei also a c ≠ −1. Dann erhalten wir in beiden Fällen der Fallunterscheidung für α, dass tan α = |tan(arctan a + arctan(−c))| = a−c | 1 + ac |. Dabei haben wir das Additionstheorem des Tangens verwendet sowie die Formeln tan|β| = |tan β| für alle β P ]−π/2, π/2 [, tan(π − β) = |tan β| für alle β P ] π/2, π [, − arctan x = arctan(−x) für alle x P R. Einführung in die Mathematik 1 © Oliver Deiser 7. Arkusfunktionen und Polarkoordinaten a 1 123 Der Schnittwinkel zweier Geraden (einer von mehreren Fällen) c Polarkoordinaten Jeder vom Ursprung verschiedene Punkt der Ebene schließt einen eindeutigen gegen den Uhrzeigersinn gemessenen Winkel im Intervall [ 0, 2π [ mit der x-Achse ein: Definition (Argument) Wir definieren arg : R2 − { 0 } → [ 0, 2π [ durch: arg(x, y) = „das eindeutige α P [ 0, 2 π [ mit (x, y) = £x2 + y2 (cos α, sin α)“. Für alle (x, y) P R2 − { 0 } heißt arg(x, y) das Argument von (x, y) (bzgl. des Winkelintervalls [ 0, 2π [). Wir können die Argumentbildung so beschreiben: Wir projizieren den Punkt P = (x, y) auf den Einheitskreis K, d.h., wir suchen den eindeutigen Schnittpunkt P* der Halbgeraden von O durch P mit K (hier verwenden wir P ≠ O). Ist r = £x2 + y2 > 0 der Abstand OP von P zum Ursprung, so ist P* = 1/r (x, y). Das Argument von P ist die gegen den Uhrzeigersinn gemessene Bogenlänge des Kreisbogens von K, der von (1, 0) zu P* führt. Alle Punkte, die auf der Halbgeraden von O durch P liegen, haben das gleiche Argument. Andere Winkelintervalle Die Definition des Arguments hängt vom gewählten Winkelintervall ab. Genauer schreiben wir arg[ 0, 2π [ . Oft ist es nützlich, statt [ 0, 2π [ das Intervall ] −π, π ] zu betrachten, sodass das Argument stets diesem Intervall angehört. Prinzipiell ist jedes halboffene Intervall der Länge 2π geeignet. Mit Hilfe des Arguments können wir ein Koordinatensystem einführen, das Punkte durch ihren Abstand vom Ursprung und ihr Argument beschreibt: © Oliver Deiser Einführung in die Mathematik 1 124 1. Abschnitt Elementare Funktionen Definition (Polarkoordinaten) Für alle (x, y) P R2 − { 0 } heißt (r, α) P R2 mit r = £x2 + y2 , α = arg(x, y) der Polarkoordinatenvektor von (x, y) (bzgl. des Winkelintervalls [ 0, 2π [ ). Die Koordinate r heißt der Radius und die Koordinate α der Polarwinkel von (x, y). Wir sagen auch, dass r, α Polarkoordinaten von (x, y) sind. Q = (-6, 5) 5 Kartesisches Koordinatengitter P = (4, 3) -5 5 -5 7 12 2 5 2 12 3 3 3 4 4 5 Polares Koordinatengitter 6 6 11 P = (4, /6) 12 12 0 1 2 3 4 5 6 7 8 13 23 12 12 Q = (5, 5 /6) 7 11 6 6 5 7 4 4 4 3 5 17 12 Einführung in die Mathematik 1 3 2 19 3 12 © Oliver Deiser 7. Arkusfunktionen und Polarkoordinaten 125 Um die Sprechweise zu erleichtern, nennen wir auch (r, α) Polarkoordinaten von (x, y), obwohl das geordnete Paar (r, α) eigentlich keinen Plural rechtfertigt. Unter unserer Winkel-Identifizierung ist der Winkelanteil von Polarkoordinaten nur bis auf ganzzahlige Vielfache von 2π bestimmt, d. h. sind (r, α) Polarkoordinaten von (x, y), so auch (r, α + k2π) für alle k P Z. Wer den Nullpunkt zulassen möchte, kann arg(0, 0) = 0 definieren. Dann sind (0, α) für alle α P R Polarkoordinaten des Nullpunkts. Das Argument eines Punktes lässt sich mit Hilfe des Arkustangens berechnen. Dabei müssen wir außerhalb des ersten Quadranten geeignete Vielfache von π/2 addieren. Denn die Werte des Arkustangens liegen stets in ] −π/2, π/2 [, während das Argument in [ 0, 2π [ liegt. Es ergibt sich folgende Fallunterscheidung: arg(x, y) = { arctan(y/x), falls x > 0 und y ≥ 0 arctan(y/x) + 2π, arctan(y/x) + π, π/2, falls falls falls x > 0 und y < 0 x<0 x = 0 und y > 0 3 π/2, falls x = 0 und y < 0 Eine Möglichkeit, die Korrekturwinkel zu ermitteln, verwendet Drehungen und Spiegelungen: P2 x P1 y P3 P4 α = arctan(y/x), β = arctan(x/y) = π/2 − α arg(P1 ) = α mit P1 = (x, y) arg(P2 ) = π − β = π − arctan(x/y) = π + arctan(x/(−y)) mit P2 = (−y, x) Der Leser ist aufgefordert, sich die Korrekturwinkel auf seine Weise mit Hilfe eines Diagramms klar zu machen. © Oliver Deiser Einführung in die Mathematik 1 126 1. Abschnitt Elementare Funktionen Bemerkung (1) Wird für das Argument statt [ 0, 2π [ das Winkelintervall ] −π, π ] oder ein anderes Intervall gewählt, ist die Fallunterscheidung entsprechend anzupassen. Für ] −π, π ] ergibt sich arg(x, y) = { arctan(y/x), arctan(y/x) + sgn(y) π, arctan(y/x) + sgn(y) π, falls falls falls x>0 x < 0, y ≠ 0 x < 0, y = 0 sgn(y) π/2, falls x=0 Im ersten und vierten Quadranten (ohne der y-Achse) ist hier also kein Korrekturwinkel nötig. Der zweite und dritte Fall lässt sich zusammenfassen, wenn statt der Vorzeichenfunktion sgn die Variante sgn2 mit sgn2 (0) = 1 verwendet wird. (2) In vielen Programmiersprachen wird die Argument-Funktion auch mit arctan2 bezeichnet und als eine zweistellige Version des Arkustangens aufgefasst. Es gilt dann je nach Definition arg(x, y) = arctan2 (x, y) oder arg(x, y) = arctan2 (y, x). Die Rückrechnung von Polarkoordinaten (r, α) in kartesische Koordinaten ist gegeben durch x = r cos α, y = r sin α. Dabei spielt es aufgrund der Periodizität des Kosinus und Sinus keine Rolle, in welchem Winkelintervall das Argument α gewählt wurde. Die Koordinatenabbildungen Der Wechsel zwischen kartesischen und polaren Koordinaten lässt sich mit Hilfe von Abbildungen der Ebene präzisieren. Wir wählen wieder [ 0, 2π [ als Winkelintervall und setzen P = ] 0, ∞ [ × [ 0, 2π [ , R = R2 − { 0 }. Die Menge P ist ein waagrechter Halbstreifen der Ebene, die Menge R die gesamte Ebene ohne den Nullpunkt. Im Streifen P leben Polarkoordinatenvektoren mit Winkeln in [ 0, 2π [, wenn wir diese Vektoren wie üblich kartesisch als Punkte der Ebene lesen. Wir können einen Punkt (r, α) von P als Kode des Punktes (x, y) von R auffassen, der die Polarkoordinaten (r, α) besitzt. Die Kodierung und Dekodierung wird durch die Abbildungen Ψ : R → P und Φ : P → R mit ( Ψ(x, y) = £x2 + y2 , arg(x, y) Φ(r, α) = r (cos α, sin α) Einführung in die Mathematik 1 ) für alle (x, y) P R für alle (r, α) P P © Oliver Deiser 7. Arkusfunktionen und Polarkoordinaten 127 beschrieben. Die Abbildungen Φ und Ψ sind bijektiv und invers zueinander, d.h. Φ + Ψ ist die Identität auf P und Ψ + Φ die Identität auf R: Φ(Ψ(x, y)) = (x, y) für alle (x, y) P R, Ψ(Φ(r, α)) = (r, α) für alle (r, α) P P. Bemerkung Dem Nullpunkt werden bei dieser Konstruktion keine Polarkoordinaten zugeordnet. Will man ihn zulassen, so kann man P und R um den Nullpunkt erweitern und Ψ(0, 0) = Φ(0, 0) = (0, 0) definieren. Beim Rechnen mit Polarkoordinaten treten die Abbildungen Φ und Ψ oft in den Hintergrund. Ein Paar (r, α) wird als Punkt der Ebene empfunden und nicht als Element des Streifens P. Einander zugeordnete Paare (r, α) und (x, y) gelten als verschiedene Namen desselben Punktes. Mathematisch ist dieser Punkt identisch mit (x, y), d. h. der kartesische Name ist das Objekt. Das kartesische System ist durch die Definition R2 = R × R der Ebene ausgezeichnet. © Oliver Deiser Einführung in die Mathematik 1 128 1. Abschnitt Elementare Funktionen Übungen Übung 1 Zeigen Sie, dass für alle x im Definitionsbereich der Funktionen gilt: (a) arcsin(−x) = −arcsin(x), (b) arccos(−x) = π − arccos(x), (c) arccos(x) + arcsin(x) = π/2. Illustrieren Sie die Formeln durch Diagramme am Einheitskreis. Übung 2 Zeigen Sie, dass für alle x P R* gilt: arctan(x) = sgn(x) π/2 − arctan(1/x). Illustrieren Sie die Formel (a) am Einheitskreis, (b) mit Hilfe von Geraden einer von Null verschiedenen Steigung und ihrer Umkehrfunktion. Übung 3 Zeigen Sie, dass für alle x P R gilt: (a) arctan(x) + arccot(x) = π/2, (b) arccot x = { arctan(1/x) arctan(1/x) + π falls falls x>0 x < 0, arctan x = { arccot(1/x) arccot(1/x) − π falls falls x>0 x < 0. (c) Übung 4 Illustrieren Sie die Formeln (a) sin arccos x = cos arcsin x = £1 − x2 , (b) tan arccot x = cot arctan x = 1 x geometrisch mit Hilfe des Einheitskreises. Einführung in die Mathematik 1 © Oliver Deiser 7. Arkusfunktionen und Polarkoordinaten 129 Übung 5 Zeigen Sie algebraisch, dass für alle x P R unter der Voraussetzung der Definiertheit gilt: (a) sin arccot x = cos arctan x = (b) sin arctan x = cos arccot x = (c) tan arcsin x = cot arccos x = (d) tan arccos x = cot arcsin x = 1 £1 + x2 x £1 + x2 x £1 − x2 £1 − x2 x . . . . Übung 6 Berechnen Sie Polarkoordinaten der acht Punkte (a, b) mit a, b P { −1, 0, 1 }, (a, b) ≠ (0, 0). Übung 7 Zeichnen Sie ein Diagramm, das die quadrantenabhängige Berechnung des Arguments arg(x, y) eines Punktes (x, y) mit Hilfe des Arkustangens illustriert. Legen Sie dabei sowohl das Winkelintervall [ 0, 2π [ als auch das Winkelintervall ] −π, π ] zugrunde. Übung 8 In einem Buch finden Sie folgenden Graphen des Arkuskotangens: 2 4 -10 -5 5 10 4 2 Wie erklären Sie diesen Graphen? © Oliver Deiser Einführung in die Mathematik 1 8. Die hyperbolischen Funktionen Mit Hilfe der Exponentialfunktion führen wir die sogenannten hyperbolischen Funktionen ein, die viele Analogien zu den trigonometrischen Funktionen aufweisen. Diese Funktion sind für sich von Interesse und werden sich später in der Integrationstheorie als nützlich erweisen. © Oliver Deiser Einführung in die Mathematik 1 132 1. Abschnitt Elementare Funktionen Paritäts-Zerlegung einer Funktion Wir beginnen mit einer allgemeinen Konstruktion. Zur Erinnerung: Definition (gerade und ungerade Funktion) Sei P ⊆ R derart, dass für alle Elemente x von P auch −x ein Element von P ist. Weiter sei f : P → R. Dann heißt f gerade, falls f(−x) = f(x) für alle x P P. Analog heißt f ungerade, falls f(−x) = −f(x) für alle x P P. Diese Eigenschaften werden oft auch als Parität einer Funktion bezeichnet, in Analogie zur Parität gerade/ungerade bei den ganzen Zahlen. Beispielsweise ist der Kosinus gerade und der Sinus ungerade. Ist f : P → R eine beliebige Funktion mit einem zum Nullpunkt symmetrischen Definitionsbereich P, so können wir f+ , f− : P → R definieren durch f+ (x) = f(x) + f(−x) , f− (x) = 2 f(x) − f(−x) 2 für alle x P P. Dann ist f+ gerade und f− ungerade. Aufgrund des Faktors 1/2 gilt zudem f(x) = f+ (x) + f− (x) für alle x P P. Durch diese Konstruktion können wir jede Funktion als Summe einer geraden und ungeraden Funktion darstellen. Im Englischen spricht man von einer even and odd decomposition, in Deutschen von einer Paritäts-Zerlegung: Definition (Paritäts-Zerlegung) Die Darstellung f = f+ + f− heißt die Paritäts-Zerlegung von f. Weiter heißt die Funktion f+ der gerade und die Funktion f− der ungerade Anteil von f. f(x) f+ (x) f- (x) Die Paritätszerlegung einer Funktion Einführung in die Mathematik 1 © Oliver Deiser 8. Die hyperbolischen Funktionen 133 Kosinus und Sinus Hyperbolicus Ein natürlicher Kandidat für eine Paritäts-Zerlegung ist die Exponentialfunktion, die ja weder gerade noch ungerade ist. Sie besitzt in der Tat eine bemerkenswerte Zerlegung, deren Teile einen eigenen Namen verdienen: Definition (Kosinus und Sinus Hyperbolicus) Wir definieren den Kosinus Hyperbolicus cosh : R → R und den Sinus Hyperbolicus sinh : R → R durch ex + e−x , sinh x = 2 cosh x = ex − e−x 2 für alle x P R. Nach Konstruktion sind der Kosinus Hyperbolicus gerade und der Sinus Hyperbolicus ungerade. Weiter bilden die beiden Funktionen die Paritäts-Zerlegung der Exponentialfunktion: exp = cosh + sinh. 5 exp(x) -3 -2 -1 1 2 3 cosh(x) sinh(x) -5 Die Paritätszerlegung der Exponentialfunktion Die Namensgebung „hyperbolisch“ ist motiviert durch folgende Überlegung. Wir betrachten die Einheitshyperbel H1 = { (x, y) P R2 | x2 − y2 = 1 }. Der rechte Ast von H1 verläuft durch den Punkt (1, 0), liegt symmetrisch zur x-Achse und schmiegt sich asymptotisch an die Winkelhalbierenden des ersten und vierten Quadranten an. Setzen wir nun P(t) = (cosh t, sinh t) für alle t P R, so beschreibt P eine Bewegung auf einer dem rechten Ast von H1 , da cosh(t) > 0 für alle t und (+) cosh2 x − sinh2 x = 1 für alle x P R. © Oliver Deiser Einführung in die Mathematik 1 134 1. Abschnitt Elementare Funktionen Der Punkt P liegt für t < 0 im vierten Quadranten, erreicht zur Zeit t = 0 den Punkt (1, 0) und liegt für t > 0 im ersten Quadranten. Für alle t ist P(t) der an der x-Achse gespiegelte Punkt P(−t). Der Leser vergleiche dies mit der Kreisbewegung (cos t, sin t) auf dem Einheitskreis K1 = { (x, y) P R2 | x2 + y2 = 1 }. Dem Satz des Pythagoras cos2 x + sin2 x = 1 für alle x P R entspricht für die hyperbolischen Funktionen die Formel (+). 4 H1 2 Die Einheitshyperbel H1 -4 -2 2 4 -2 -4 Der Kosinus Hyperbolicus ist überraschenderweise auch im Alltag häufig zu finden: Eine zwischen zwei Punkten aufgehängte Kette wird durch diese Funktion beschrieben (und nicht etwa wie eine Wurfbahn durch eine Parabel). Man nennt die Form deswegen auch eine Kettenlinie. Aus der Potenzreihendarstellung exp x = ∑ n xn /n! erhalten wir (∑ n xn n! + ∑n = ∑ n gerade x2 n! = ∑n cosh x = 1 2 (−x)n n! ) x2n (2n)! = 1 xn + (−x)n ∑n 2 n! für alle x P R. Analog ist sinh x = ∑ n x2n + 1 (2n + 1)! für alle x P R. Aus exp′ = exp und den Definitionen von cosh und sinh ergibt sich cosh′ = sinh, sinh′ = cosh, cosh″ = cosh, sinh″ = sinh. Der Leser überzeuge sich davon, dass diese Ableitungen durch gliedweises Differenzieren der Potenzreihendarstellung von cosh und sinh reproduziert werden. Einführung in die Mathematik 1 © Oliver Deiser 8. Die hyperbolischen Funktionen 135 Weitere hyperbolische Funktionen Aus den hyperbolischen Grundfunktionen cosh und sinh lassen sich wie bei den trigonometrischen Funktion definieren: Definition (weitere hyperbolische Funktionen) Wir definieren den Tangens Hyperbolicus, Kotangens Hyperbolicus, Sekans Hyperbolicus und Kosekans Hyperbolicus durch sinh , coth = cosh tanh = cosh , sech = sinh 1 , csch = cosh 1 . sinh Da der Nullpunkt die einzige Nullstelle des Sinus Hyperbolicus ist und der Kosinus Hyperbolicus nur positive Werte annimmt, gilt tanh : R → R, coth : R* → R, sech : R → R, csch : R* → R. 4 2 tanh(x) -3 -2 -1 1 2 3 coth(x) -2 -4 3 2 1 sech(x) -4 -2 2 4 csch(x) -1 -2 -3 © Oliver Deiser Einführung in die Mathematik 1 136 1. Abschnitt Elementare Funktionen Die Areafunktionen In weiterer Analogie zu den trigonometrischen Funktionen können wir die Umkehrfunktion der hyperbolischen Funktionen erklären: Definition (Areafunktionen) Die Area-Funktionen arcosh, arsinh, artanh, arcoth, arsech, arcsch sind definiert als die Umkehrfunktionen von cosh0 , sinh, tanh, coth, sech0 , csch, wobei cosh0 und sech0 die Einschränkung von cosh und sech auf [ 0, ∞ [ ist. Es gilt arcosh : [1, ∞[ → R, arsinh : R → R, artanh : ]−1, 1[ → R, arcoth : ] −∞, 1 [ ∪ ] 1, ∞ [ → R, arsech : ]0, 1] → R, arcsch : R* → R. 3 2 1 arcosh(x) -5 5 arsinh(x) -1 -2 -3 2 1 artanh(x) -4 -2 2 4 arcoth(x) -1 -2 Einführung in die Mathematik 1 © Oliver Deiser 8. Die hyperbolischen Funktionen 137 4 2 arsech(x) -3 -2 -1 1 2 3 arcsch(x) -2 -4 Da die Hyperbelfunktionen über die Exponentialfunktion definiert sind, ist ein Zusammenhang der Areafunktionen mit der Logarithmusfunktion zu vermuten. Die genauen Beziehungen sind: Satz (Logarithmus-Darstellung der Areafunktionen) Es gilt: arcosh x = log ( x + £x2 − 1 ) für alle x ≥ 1, arsinh x = log ( x + £x2 + 1 ) für alle x P R, artanh x = 1 log 2 ( 1 + x 1 − x ) für alle x mit |x| < 1, arcoth x = 1 log 2 ( x + 1 x − 1 ) für alle x mit |x| > 1, arsech x = log ( 1 + £1 − x2 x ) für alle 0 < x ≤ 1, arcsch x = log ( 1 + £1 + x2 x ) für alle x ≠ 0. Beweis Wir zeigen die Darstellung des Area Kosinus Hyperbolicus. Die anderen Formeln werden ähnlich beweisen. Sei x ≥ 1, und sei y ≥ 0 derart, dass x = cosh y. Mit z = ey gilt 2x = 2 cosh y = ey + e−y = ey + © Oliver Deiser 1 ey = z + 1 . z Einführung in die Mathematik 1 138 1. Abschnitt Elementare Funktionen Multiplikation mit z liefert die quadratische Gleichung z2 − 2xz + 1 = 0 in z mit den Lösungen z1,2 = x ± £x2 − 1. Wegen z = ey ≥ 1 scheidet das negative Vorzeichen aus, sodass ey = z = x + £x2 − 1. Damit ist arcosh x = arcosh(cosh y) = log( x + £x2 − 1 ). Die Namensgebung „area“ für „Fläche“ ist wie folgt motiviert: Ist a P [ 0, 1 [ und sind P = (xa , ya ) und Q = (xa , − ya ) die Schnittpunkte des rechten Astes der Einheitshyperbel mit den Geraden durch den Nullpunkt der Steigung a bzw. -a, so wird durch die Punkte O, P, Q eine Fläche mit dem Inhalt A definiert. Man kann zeigen, dass xa = cosh A, ya = sinh A, sodass A = arcosh xa = arsinh ya . In diesem Sinne messen die Areafunktionen Flächen an der Einheitshyperbel so, wie die Arkusfunktionen Bogenlängen am Einheitskreis messen. Da eine Bogenlänge gleich der doppelten Fläche des zugehörigen Kreissektors ist, lassen sich auch die Arkusfunktionen als Flächeninhalte interpretieren. 2 P = (cosh A, sinh A) 1.0 P = (cos , sin ) = (cos A, sin A) 1 0.5 A A 0.5 1.0 1.5 2.0 2.5 -0.5 0.5 1.0 1.5 -0.5 -1 Q = (cos A, -sin A) -1.0 Q = (cosh A, sinh A) -2 Die Flächenmessung der Areafunktionen im Vergleich mit den Arkusfunktionen Einführung in die Mathematik 1 © Oliver Deiser 8. Die hyperbolischen Funktionen 139 Übungen Übung 1 Bestimmen und skizzieren Sie die Paritäts-Zerlegung für die Funktion f : R → R mit f(x) = (x − 1)2 + 1 für alle x P R. Übung 2 Formulieren und beweisen Sie einen allgemeinen Satz über die Paritätszerlegung eines Polynoms f : R → R. Übung 3 Zeigen Sie, dass für alle x, y P R gilt: (a) cosh(x + y) = cosh x cosh y + sinh x sinh y, (b) sinh(x + y) = cosh x sinh y + sinh x cosh y. Übung 4 Sei H = { (x, y) P R2 | x2 − y2 = 1, x ≥ 1 } der rechte Ast der Einheitshyperbel. Zeigen Sie: Für alle P = (x, y) P H gibt es genau ein t P R mit P = (cosh t, sinh t). Wie lässt sich eine Bewegung auf dem linken Ast definieren? Übung 5 Zeigen Sie, dass H = { (x, y) P R2 | x2 − y2 = 1, x ≥ 1 } (rechter Ast der Einheitshyperbel) und der Graph der Funktion f : R+ → R mit f(x) = 1/(2x) für alle x > 0 durch eine Drehung um π/4 gegen bzw. im Uhrzeigersinn auseinander hervorgehen. Erstellen Sie zudem ein Diagramm zur Illustration. Übung 6 Sei a > 0. Untersuchen Sie eine zu Einführung der hyperbolischen Funktionen analoge Definition von Funktionen, die auf der allgemeinen Exponentialfunktion expa zur Basis a anstelle von exp = expe beruht. Welche Unterschiede und Zusammenhänge können Sie feststellen? Übung 7 Wie lässt sich die Bewegung P(t) = (cosh t, sinh t) , t P R, auf dem rechten Ast von H1 mit Hilfe der Flächenmessung der Areafunktionen genauer beschreiben? © Oliver Deiser Einführung in die Mathematik 1 140 1. Abschnitt Elementare Funktionen Übung 8 Zeigen Sie: arsinh x = log ( x + £x2 + 1 ) für alle x P R, artanh x = 1 log 2 ( 1 + x 1 − x ) für alle x mit |x| < 1, arcoth x = 1 log 2 ( x + 1 x − 1 ) für alle x mit |x| > 1, arsech x = log ( 1 + £1 − x2 x ) für alle 0 < x ≤ 1, arcsch x = log ( 1 + £1 + x2 x ) für alle x ≠ 0. Einführung in die Mathematik 1 © Oliver Deiser 2. Abschnitt Der analytische Kalkül © Oliver Deiser Einführung in die Mathematik 1 1. Differentialquotienten und lineare Approximation Wir diskutieren die grundlegenden Begriffe im Umfeld der Ableitung einer reellen Funktion. Besonderes Gewicht liegt dabei auf der Idee der lokalen linearen Approximation einer Funktion durch eine Gerade. © Oliver Deiser Einführung in die Mathematik 1 144 2. Abschnitt Der analytische Kalkül Differenzierbarkeit an einer Stelle Geraden eignen sich zur lokalen Approximation von „guten“ Funktionen: Ist f : R → R eine Funktion und p P R ein Punkt von Interesse, so können wir versuchen, eine Gerade durch (p, f(p)) P R2 zu legen, die sich lokal, d. h. in der Nähe des betrachteten Punktes, möglichst gut an den Graphen von f anschmiegt. Das ist nicht immer möglich, man denke an Sprünge oder Knicke. Im Folgenden betrachten wir Funktionen der Form f : P → R, deren Definitionsbereich P entweder R, ein Intervall mit Grenzen a < b oder allgemeiner eine Vereinigung von Intervallen ist, die mehr als einen Punkten enthalten. Definition (Differenzenquotient, Sekante) Sei f : P → R, und sei p P P. Für alle x P P mit x ≠ p heißt die reelle Zahl a(p, x) = f(x) − f(p) x−p der Differenzenquotient von f für p und x. Die eindeutige Gerade g : R → R durch (p, f(p)) und (x, f(x)) heißt die durch die Stellen p und x definierte Sekante von f. Definition (Differentialquotient, Ableitung) Sei f : P → R, und sei p P P. Im Fall der Existenz von a = limx →p a(x, p) = limx →p f(x) − f(p) x−p heißt die Funktion f an der Stelle p differenzierbar und a die Ableitung oder der Differentialquotient von f an der Stelle p. Für die Ableitung sind verschiedene Schreibweisen in Gebrauch: Notation Ist a die Ableitung von f an der Stelle p, so schreiben wir a = f ′(p) = Df(p) = d f(x) dx x=p = df(x) dx x=p = df(x) (p). dx Definition (Tangente) Sei f : P → R differenzierbar an der Stelle p P P. Dann heißt die Gerade g: R → R mit g(x) = f(p) + f ′(p) (x − p) für alle x P R die durch die Stelle p definierte Tangente von f oder die Tangente von f durch den Punkt (p, f(p)). Einführung in die Mathematik 1 © Oliver Deiser 1. Differentialquotienten und lineare Approximation 145 f(x2 ) f(x1 ) f(x) f(p) g1 (x) g2 (x) g(x) p x2 x1 Zwei Sekanten g1 und g2 und die Tangente g von f an der Stelle p f'(p) f(x) a(p, x) f(p) p Der Differenzenquotient a(x, p) an der Stelle p als Funktion in x Beispiele (1) Ist f : R → R mit f(x) = c für alle x, so gilt für alle p P R: f ′(p) = limx →p f(x) − f(p) x−p = limx →p c−c x−p = 0. (2) Sei n ≥ 1 und f : R → R mit f(x) = xn für alle x. Weiter sei p P R. Dann gilt für alle x P R: xn − pn = (x − p)(xn − 1 p0 + … + x0 pn − 1 ). (vgl. unsere Ergebnisse zur geometrischen Summe). Damit ergibt sich f ′(p) = limx © Oliver Deiser →p xn − pn x−p = limx →p (xn − 1 p0 + … + x0 pn − 1 ) = n pn − 1 . Einführung in die Mathematik 1 146 2. Abschnitt Der analytische Kalkül (3) Ist f : R → R mit f(x) = |x| für alle x, so ist x an der Stelle p = 0 nicht differenzierbar, da |x| − 0 x−p = 1 für x > 0, |x| − 0 x−p = −1 für x < 0. Sehr nützlich ist die folgende Umformulierung des Differentialquotienten, die sich durch die Setzung h = x − p ergibt: h-Formulierung des Differentialquotienten limx f(x) − f(p) x−p →p = limh →0 f(p + h) − f(p) h Implizit ist im h-Limes immer h ≠ 0 und p + h P P enthalten. Der Approximationssatz Eine sehr wichtige Sicht auf die Ableitung wird ausgedrückt in: Satz (linearer Approximationssatz) Sei f : P → R, und sei p P P. Dann sind äquivalent: (1) f ist differenzierbar in p. (2) Es gibt ein a P R und eine Funktion r : P → R mit den Eigenschaften: (i) f(x) = f(p) + a (x − p) + r(x) für alle x P P, (ii) limx →p r(x) x−p = 0. Gilt (2), so ist a = f ′(p). Die Idee ist: In der Nähe von p ist die Funktion f ihre Tangente plus ein kleiner Rest. Was „kleiner Rest“ bedeuten soll, wird durch die Grenzwertbedingung (ii) präzisiert. Der Leser beachte, dass die Eigenschaft (i) für ein beliebiges a P R immer erreicht werden kann: Wir setzen einfach ra (x) = f(x) − f(p) − a (x − p) für alle x P P. Dann gilt f(x) = f(p) + a (x − p) + ra (x) für alle x P P nach Konstruktion. Die Bedingung (ii) ist aber in der Regel verletzt: Einführung in die Mathematik 1 © Oliver Deiser 1. Differentialquotienten und lineare Approximation 147 Beispiel Sei f die Betragsfunktion, d. h. f(x) = |x| für alle x. Weiter sei p = 0 und a P R beliebig. Dann gilt für alle xP P: ra (x) = f(x) − f(0) − a (x − 0) = |x| − ax = x(sgn(x) − a), sodass ra (x) x−p = x(sgn(x) − a) x = sgn(x) − a. Der Quotient konvergiert nicht gegen 0, wenn x gegen 0 strebt. Der rechtsseitige Grenzwert ist 1 − a, der linksseitige 1 + a. (Dies entspricht den einseitigen Ableitungen: Für a = 1 erhalten wir 0 wenn x von rechts gegen 0 konvergiert und für a = −1 erhalten wir 0, wenn x von links gegen 0 konvergiert.) Das Beispiel illustriert die Bedeutung der Bedingung (ii): Die Restfunktion r strebt nicht nur gegen Null, wenn x gegen p strebt. Sie strebt stärker immer noch gegen 0, wenn sie durch x − p geteilt wird. Anders formuliert: Die Restfunktion r konvergiert an der Stelle p schneller als eine lineare Funktion gegen 0. Der Leser denke zum Beispiel an die Einheitsparabel x2 und die Stelle 0. Die Konvergenz muss aber nicht unbedingt quadratisch sein. Auch die Funktion x3/2 konvergiert an der Stelle 0 auch nach einer Division durch x immer noch gegen gegen 0. Allgemeiner gilt dies für x1 + ε für ein beliebig kleines ε > 0. f(p) f(x) r(x) g(x) p Die Restfunktion r(x) = f(x) − g(x) an der Stelle p Nach diesen Vorbereitungen wollen wir nun den Approximationssatz beweisen. © Oliver Deiser Einführung in die Mathematik 1 148 2. Abschnitt Der analytische Kalkül Beweis (1) impliziert (2): Sei also f differenzierbar an der Stelle p. Wir setzen a = f ′(p) und definieren r : P → R durch r(x) = f(x) − f(p) − a (x − p) für alle x P P Dann gilt (i) nach Definition. Weiter gilt auch (ii), da limx → p r(x) x−p = limx →p = limx →p f(x) − f(p) x−p ( f(x) − f(p) x−p − a x−p x−p − a limx →p ) x−p x−p = a − a = 0. (2) impliziert (1) (und Zusatz): Sind a P R und r : P → R wie in (2), so gilt limx →p f(x) − f(p) x−p = limx →p (a + r(x) x−p ) = a + 0 = a. Dies zeigt, dass f an der Stelle p differenzierbar ist mit f ′(p) = a. Wir betrachten den Approximationssatzes noch einmal an einem konkreten Beispiel. Als Funktion wählen wir die Logarithmusfunktion. 1.0 0.5 log(x) r(x) 0.5 1.0 1.5 2.0 r(x) x-p g(x) -0.5 -1.0 Die Restfunktion r(x) = log(x) − g(x) und der Quotient r(x)/(x − p) an der Stelle 1 Einführung in die Mathematik 1 © Oliver Deiser 1. Differentialquotienten und lineare Approximation 149 Die Landau-Notation Die Bedingungen (i) und (ii) des Approximationssatzes sind etwas sperrig in der Formulierung und es ist wünschenswert, eine einfache und suggestive Notation zur Verfügung zu haben. Bewährt hat sich hier eine symbolische Notation, die auf den Zahlentheoretiker Edmund Landau zurückgeht. Sie wird heute in der Mathematik, Physik und Informatik (in zahlreichen Varianten) an vielen Stellen verwendet, um das asymptotische Verhalten von Funktionen zu beschreiben. Landau-Notation oder klein-o-Notation Ein Ausdruck o(x − p) für x → p steht für eine Funktion r : P → R (mit einem kontextabhängigen Definitionsbereich P) mit der Eigenschaft limx →p r(x) x−p = 0. Ist allgemeiner g : P → R eine Funktion mit g(x) ≠ 0 für alle x ≠ p, so steht o(g(x)) für x → p für eine Funktion r : P → R mit limx →p r(x) g(x) = 0. Damit können wir den Approximationssatz nun so formulieren: Satz (linearer Approximationssatz in Landau-Notation) Sei f : P → R, und sei p P P. Dann sind äquivalent: (1) f ist differenzierbar in p. (2) Es gibt ein a P R mit f(x) = f(p) + a (x − p) + o(x − p) für x → p. Gilt (2), so ist a = f ′(p). Dadurch wird die Idee „Tangente plus kleiner Rest“ besonders schön zum Ausdruck gebracht. © Oliver Deiser Einführung in die Mathematik 1 150 2. Abschnitt Der analytische Kalkül Kalkül der Landau-Notation Ein Ausdruck o(g(x)) verweist auf eine nicht weiter spezifizierte „namenlose“ Funktion r. Besonders gut zu handhaben wird die Landau-Notation nun durch die − für mathematische Verhältnisse ungewöhnlichen − Vereinbarung, dass zwei oder mehr identisch notierte Ausdrücke o(g(x)) auf verschiedene Funktionen r1 , r2 , … verweisen können. Dadurch entsteht ein Kalkül der o-Notation. So bedeutet zum Beispiel o(x − p) + o(x − x) = o(x − p) für x → p, dass die Summe zweier Funktionen r1 , r2 des Typs o(x − p) wieder eine Funktion r = r1 + r2 des Typs o(x − p) ergibt (für die betrachtete Konvergenz x → p). Analog bedeutet o(x − p) ⋅ o(x − p) = o((x − p)2 ) für x → p, dass das Produkt zweier Funktionen des Typs o(x − p) eine Funktion r = r1 ⋅ r2 des Typs o((x − p)2 ) darstellt, d. h. dass gilt limx →p r1 (x) r2 (x) (x − p)2 = 0. Weiter bedeutet o((x − p)2 ) impliziert o(x − p) für x → p, dass jede Funktion r des Typs o((x − p)2 ) auch eine Funktion des Typs o(x − p) ist. Damit ist zum Beispiel f(x) = f(p) + a (x − p) + o((x − p)2 ) für x → p eine Verstärkung der Differenzierbarkeit von f an der Stelle p: Die Restfunktion konvergiert hier schneller als für die Differenzierbarkeit gefordert gegen 0, nämlich „besser als quadratisch“ anstelle von „besser als linear“. Anschaulich bedeutet dies, dass sich die Tangente von f an der Stelle p besonders eng an die Funktion f anschmiegt. Beispiel Sei f : R → R mit f(x) = x3 für alle x P R. Weiter sei p = 1. Dann gilt f ′(p) = 3, sodass die Tangente g von f an der Stelle p gegeben ist durch g(x) = f(p) + f ′(p)(x − p) = 1 + 3(x − 1) = 3x − 2 für alle x P R. Damit ist f(x) = g(x) + o(x − 1) für x → 1. In Termnotation können wir schreiben: x3 = 3x − 2 + o(x − 1) für x → 1. Einführung in die Mathematik 1 © Oliver Deiser 1. Differentialquotienten und lineare Approximation 151 Differenzierbarkeit an allen Stellen Bisher haben wir die Differenzierbarkeit an einer festen Stelle p untersucht. Nun variieren wir die Stelle und fassen im Fall der Existenz alle Ableitungen zu einer Funktion zusammen: Definition (Differenzierbarkeit) Eine Funktion f : P → R heißt differenzierbar, falls f ′(x) für alle x P P existiert. Wir nennen die Funktion f ′ : P → R die erste Ableitung von f. Existiert die erste Ableitung, so stellt sich die Frage, ob f ′ : P → R wieder differenzierbar ist. Das folgende Beispiel zeigt, dass dies nicht immer der Fall ist: Beispiel Sei f : R → R definiert durch f(x) = x3 für x ≥ 0 und f(x) = x2 für x < 0. Dann ist f differenzierbar mit f ′(x) = 3x2 für x ≥ 0 und f(x) = 2x für x < 0. Aber die Funktion f ′ : R → R ist nicht differenzierbar an der Stelle 0. 15 10 f(x) 5 f (x) -2 -1 1 2 -5 Ein Knick in der Ableitung In vielen Fällen ist aber ein wiederholtes Ableiten möglich. Wir definieren hierzu allgemein: Definition (mehrfache Differenzierbarkeit) Sei f : P → R. Wir setzen f (0) = f und definieren rekursiv solange möglich f (n + 1) = f (n) ′ für alle n P N. Ist n P N und existiert f (n) , so heißt f n-mal differenzierbar und f (n) die n-te Ableitung von f. © Oliver Deiser Einführung in die Mathematik 1 152 2. Abschnitt Der analytische Kalkül Der Exponent wird in Klammern gesetzt, um die Notation von der Potenzierung zu unterscheiden. Im Fall der Existenz gilt f ′ = f (1) , f ″ = (f ′)′ = f (2) , f ″′ = (f ″)′ = f (3) . Die zweite Ableitung beschreibt die Änderung des Steigungsverhaltens von f, die sich anschaulich auf die Krümmung des Graphen von f auswirkt. Dabei ist aber f ″(p) kein direktes Maß für die Krümmung von f an der Stelle p: Die Parabel x2 hat eine konstante zweite Ableitung, aber anschaulich keine konstante Krümmung. Wir werden später eine Formel für den lokalen Krümmungsradius einer Funktion diskutieren, in der wie erwartet die zweite Ableitung eine wichtige Rolle spielt. 6 4 2 f(x) f (x) -3 -2 -1 1 2 3 f (x) f (3) (x) -2 -4 -6 Die ersten drei Ableitungen der Funktion f(x) = x2 /2 + cos(x) + arctan(x2 ) Einführung in die Mathematik 1 © Oliver Deiser 1. Differentialquotienten und lineare Approximation 153 Übungen Übung 1 Sei f : R* → R mit f(x) = 1/x. Weiter sei p P R*. Bestimmen Sie die Ableitung von f an der Stelle p durch Berechnung des Differentialquotienten. Übung 2 Sei f : R → R mit f(x) = x2 . Weiter sei p P R. (a) Bestimmen Sie die Tangente von f an der Stelle p. (b) Bestimmen Sie die Restfunktion r : R → R und weisen Sie die Limesbedingung des Approximationssatzes nach. (c) Zeichnen Sie f sowie die Tangenten und Restfunktionen für die Stellen p = 1 und p = 2. Übung 3 Seien f, g : P → R differenzierbar an der Stelle p P P. Weiter seien a, b P R und h = af + bg. Zeigen Sie (a) durch Berechnung des Differentialquotienten, (b) mit Hilfe des linearen Approximationssatzes und der LandauNotation, dass h an der Stelle p differenzierbar mit h′(p) = a f ′(p) + b g′(p). Übung 4 Geben Sie instruktive Beispiele verschiedener Art für Funktionen an, die an einer Stelle ihres Definitionsbereichs nicht differenzierbar sind. Übung 5 Sei f : R → R mit f(0) = 0. Welche geometrische Bedeutung hat das Verhältnis f(x)/x von Funktionswert und Stelle? Übung 6 Sei f : R → R mit f(p) = 0 differenzierbar an der Stelle p mit a = f ′(p). Welche qualitativen Aussagen über das lokale Verhalten von f an der Stelle p können Sie in Abhängigkeit von a treffen? Wie können Sie diese Aussagen begründen? © Oliver Deiser Einführung in die Mathematik 1 154 2. Abschnitt Der analytische Kalkül Übung 7 Seien a, b, c P R, und sei f : R → R mit f(x) = a x2 + b x + c für alle x P R. Welche anschauliche Bedeutung hat der Parameter b? Übung 8 Beschreiben Sie, wie Sie die Ableitung sin′(x) = cos(x) verwenden können, wenn Sie den Verlauf des Sinus per Hand skizzieren. Fertigen Sie eine entsprechende Skizze an. Übung 9 Begründen Sie, wie und warum sich die Ableitung physikalisch als Geschwindigkeit deuten lässt. Übung 10 Sei f : R → R, und sei p P R derart, dass y− = limx + y = limx → p, x < p f(x), (linksseitiger Grenzwert) → p, x > p f(x) (rechtsseitiger Grenzwert) existieren, aber y− ≠ y+ . Zeigen Sie, dass f an der Stelle p nicht differenzierbar ist. Übung 11 Seien a0 , …, an P R und sei f : R → R das Polynom mit den Koeffizienten a0 , …, an , d. h. f(x) = an xn + … + a1 x + a0 für alle x P R. Geben Sie eine Formel für die k-te Ableitung, k ≥ 0, von f an. (Die Ableitungsregel für Polynome dürfen Sie als bekannt voraussetzen.) Übung 12 Sei n ≥ 1. Geben Sie eine Funktion f : R → R an, die an der Stelle 0 n-mal, aber nicht (n + 1)-mal differenzierbar ist. Einführung in die Mathematik 1 © Oliver Deiser 2. Ableitungsregeln In diesem Kapitel stellen den den Kalkül des Differenzierens vor, mit dem wir die Ableitung jeder elementaren Funktion bestimmen können. Weiter betrachten wir einfache Differentialgleichungen und die sich aus ihnen ergebenden Potenzreihendarstellungen. © Oliver Deiser Einführung in die Mathematik 1 156 2. Abschnitt Der analytische Kalkül Die Regeln Satz (Ableitungsregeln) Unter der Voraussetzung der Existenz der beteiligten Ableitungen von f und g gilt: (a) (a f + b g)′(p) = a f ′(p) + b g′(p), (Linearität der Ableitung) (b) (f g)′(p) = f ′(p) g(p) + f(p) g′(p), (Produktregel) (c) (f/g)′(p) = f ′(p) g(p) − g′(p) f(p) , g2 (p) (Quotientenregel) (d) (g + f )′(p) = g′(f(p)) ⋅ f ′(p), (e) (f − 1 )′ (f(p)) = 1 , falls f ′(p) ≠ 0. f ′(p) (Kettenregel) (Ableitung der Umkehrfunktion) Es gibt zwei Möglichkeiten, die Ableitungsregeln zu beweisen: Möglichkeit 1: Wir berechnen die Differentialquotienten. Möglichkeit 2: Wir verwenden den linearen Approximationssatz. Die zweite Möglichkeit spiegelt die Grundidee der lokalen Ersetzung einer Funktion durch ihre Tangente besonders schön wider. Exemplarisch zeigen wir: Beweis der Produktregel mit Hilfe des Approximationssatzes Seien f und g differenzierbar an der Stelle p, sodass f(x) = f(p) + f ′(p) (x − p) + o(x − p), g(x) = g(p) + g′(p) (x − p) + o(x − p) für x → p. Dann gilt (f ⋅ g)(x) = f(x) ⋅ g(x) = f(p) g(p) + f(p) g′(p) (x − p) + f ′(p) g(p) (x − p) + o(x − p) = f(p) g(p) + (f(p)g′(p) + f ′(p) g(p))(x − p) + o(x − p) für x → p. Dabei enthält das „o“ in der zweiten Zeile die Summe ( f(p) + g(p) + f ′(p) (x − p) + g′(p) (x − p) ) o(x − p) + o((x − p)2 ). Nach dem Approximationssatz ist also die Produktfunktion fg differenzierbar an der Stelle p und es gilt (f g)′(p) = f ′(p) g(p) + f(p) g′(p). Einführung in die Mathematik 1 © Oliver Deiser 2. Ableitungsregeln 157 Einfache Ableitungen Im Folgenden bestimmen wir die Ableitungen aller im ersten Abschnitt betrachteten Funktionen. Wegen dxn /dx = n xn−1 können wir aufgrund der Linearität der Ableitung beliebige Polynome differenzieren: d an xn + … + a2 x2 + a1 x + a0 dx ( ) = n an xn − 1 + … + 2 a2 x + a1 . Die Ableitung einer rationalen Funktion f/g ergibt sich aus der Ableitungsregel für Polynome und der Quotientenregel: (f/g)′ = f ′ g − g′ f . g2 Für die Exponentialfunktion gilt nach unserer Charakterisierung exp′ = exp. Die Ableitung der Logarithmus erhalten wir mit Hilfe der Regel für die Ableitung der Umkehrfunktion: 1 exp′(log x) d log x = dx 1 exp(log x) = = 1 . x Die Ableitung der allgemeinen Exponentialfunktionen können wir mit der Kettenregel bestimmen. Für alle a > 0 gilt: d x a = dx d x log a d e = ex log a (x log a) = ax log a. dx dx Damit gilt expa ′ = log(a) expa . Für die Umkehrfunktionen erhalten wir d loga x = dx 1 expa ′(loga x) = 1 log(a) expa (loga x) = 1 . log(a) x Für die Potenzfunktionen gilt schließlich d xa = dx d a log x d a e = ea log x (a log x) = x a dx dx x = a xa − 1 , in Übereinstimmung und Verallgemeinerung der Ableitungsregel für die Monome xn . © Oliver Deiser Einführung in die Mathematik 1 158 2. Abschnitt Der analytische Kalkül Ableitung von Kosinus und Sinus Wir haben den Kosinus und Sinus als Koordinatenfunktionen für durch das Bogenmaß definierte Punkte des Einheitskreises eingeführt. Die Ableitungen der beiden Funktionen können wir raten, indem wir die elementaren Werte der beiden Funktionen betrachten: Die lokalen Extrema des Kosinus (die ±1-Werte) sind genau die Nullstellen des Sinus, und ebenso sind die lokalen Extrema des Sinus (die ±-Werte) genau die Nullstellen des Kosinus. Betrachtung der Vorzeichen führt zur Hypothese cos′ = − sin, sin′ = cos. Um diese Hypothese zu beweisen, zeigen wir zunächst einen Hilfssatz: Satz (Ableitungen vom Kosinus und Sinus im Nullpunkt) limx →0 sin x x = 1, limx →0 cos x − 1 x = 0. Damit ist sin′(0) = 1 und cos′(0) = 0. Beweis Wir zeigen die Aussage für den Sinus. Die Aussage für den Kosinus kann ähnlich bewiesen werden. Wegen sin(−x) = −sin x können wir uns auf positive x beschränken. Wir betrachten die Punkte A = (1, 0), P = (cos x, sin x) P K1 , Q = (1, tan x), sodass Q auf der Geraden OP liegt und OAQ ein rechtwinkliges Dreieck bildet. Es gilt (+) sin x x ≤ x 2 ≤ tan x , 2 denn die drei Größen sind der Reihe nach die Flächen des Dreiecks OAP, des Kreissegments OAP, des Dreiecks OAQ. Umformen liefert (++) cos x ≤ sin x x ≤ 1. Da cos x gegen 1 strebt, wenn x gegen 0 strebt, folgt die Behauptung. Wegen sin x = sinx − sin0 x −0 ist also sin′(0) = 1. Einführung in die Mathematik 1 © Oliver Deiser 2. Ableitungsregeln 159 K 1 Q tan(x) P sin(x) Sektorfläche: x/2 x cos(x) A Zur Ableitung des Sinus an der Stelle 0 Der Sinus-Grenzwert lässt sich auch durch folgende Argumentation veranschaulichen: Für kleine x ist die Bogenlänge x ungefähr gleich sin x, sodass das Verhältnis der beiden Größen ungefähr gleich 1 ist. Mit Hilfe der Additionstheoreme ergibt sich nun: Satz (Ableitungen des Kosinus und Sinus) Es gilt cos′ = − sin und sin′ = cos. Beweis Sei x P R beliebig. Dann gilt d sin x = limh dx →0 sin(x + h) − sin x h = limh →0 sin x cos h + cos x sinh − sin x h = limh →0 ( sin x cos h − 1 h + cos x sin h h ) = sin x ⋅ 0 + cos x ⋅ 1 = cos x. Die Kosinus-Ableitung wird analog bewiesen oder mit Hilfe der Formel cos x = sin(π/2 − x) und der Kettenregel aus der Sinus-Ableitung gewonnen. Nicht vorenthalten möchten wir dem Leser: © Oliver Deiser Einführung in die Mathematik 1 160 2. Abschnitt Der analytische Kalkül Dynamische Argumentation Bewegt sich ein Punkt P mit P(0) = (1, 0) in der Zeit t auf dem Einheitskreis K1 mit der Winkelgeschwindigkeit 1 gegen den Uhrzeigersinn, so gilt: P(t) = (cos t, sin t) für alle t P R. 1 Q(t) P(t) sin(t) K cos(t) Sei t P R beliebig. Dann ist Q(t) = (cos′ t, sin′ t) ist der Geschwindigkeitsvektor des Punktes zur Zeit t. Dieser Vektor steht senkrecht auf P(t) und hat die Länge 1. Genauer ist Q(t) um π/2 (gegen den Uhrzeigersinn) gedrehte Vektor P(t). Da (x, y) bei der Drehung um π/2 in (−y, x) übergeht, gilt (cos′ t, sin′ t) = Q(t) = (−sin t, cos t). Folglich ist cos′ t = −sin t und sin′ t = cos t. Insgesamt erhalten wir die periodische Ableitungsfolge cos, sin, −cos, −sin, cos, sin, −cos, −sin, … 1.0 0.5 cos(x) sin(x) - -cos(x) -sin(x) -0.5 -1.0 Einführung in die Mathematik 1 © Oliver Deiser 2. Ableitungsregeln 161 Ableitung der trigonometrischen Funktionen Die Ableitungen der anderen trigonometrischen Funktionen ergeben sich aus den Ableitungen von Kosinus und Sinus durch Anwendung der Ableitungsregeln. Wir stellen die Formeln tabellarisch zusammen. Die Beweise seien zur Übung überlassen. Funktion Ableitung Funktion Ableitung sin x cos x cos x −sin x tan x sec2 x cot x −csc2 x sec x sec x tan x csc x −csc x cot x arcsin x arctan x arcsec x © Oliver Deiser 1 £1 − x 2 1 1 + x2 1 x2 £1 − 1/x2 arccos x − arccot x arccsc x − − 1 £1 − x2 1 1 + x2 1 x2 £1 − 1/x2 Einführung in die Mathematik 1 162 2. Abschnitt Der analytische Kalkül Für den Tangens und Kotangens sind oft auch die folgenden äquivalenten Formen nützlich: d tan x = 1 + tan2 x, dx d cot x = − (1 + cot2 x) dx Bemerkung Als Merkregel kann man verwenden, dass genau die trigonometrischen Funktionen, die mit „c“ beginnen, ein negatives Vorzeichen in der Ableitung aufweisen. Ableitung der hyperbolischen Funktionen Für die hyperbolischen Funktionen ergeben sich die folgenden Ableitungen: Funktion Ableitung Funktion Ableitung sinh x cosh x cosh x sinh x tanh x sech2 coth x − csch2 x sech x − sech x tanh x csch x − csch x coth x 1 arsinh x £x + 1 1 1 − x2 artanh x arsech x − £x − 1 2 1 1 − x2 arcoth x 1 x £1 − x 1 arcosh x 2 2 arcsch x − 1 |x| £1 + x2 Der Leser lasse sich durch die identischen Terme der Ableitungen von artanh und arcoth nicht irritieren. Wie immer sind die Formeln nur unter der Voraussetzung der Definiertheit gültig, also für |x| < 1 für den artanh bzw. für |x| > 1 für den arcoth. Die Ableitungen des Tangens und Kotangens Hyperbolicus lassen sich auch wieder alternativ schreiben als d tanh x = 1 − tanh2 x, dx Einführung in die Mathematik 1 d coth x = 1 − coth2 x dx © Oliver Deiser 2. Ableitungsregeln 163 Einfache Differentialgleichungen Wir betrachten die ermittelten Ableitungen nun noch im Licht von Differentialgleichungen, also Gleichungen mit Funktionen und ihren Ableitungen als Unbekannten. Die Funktionen werden dabei wie üblich mit f,g,h, … bezeichnet, oft aber auch mit y. Die Differentialgleichung f ′ = f Die Exponentialfunktion erfüllt f ′ = f. Aber auch die Funktionen 2exp und allgemeiner c exp für eine beliebige reelle Zahl c sind Lösungen dieser Differentialgleichung. Eindeutig wird die Lösung erst durch Vorgabe eines Wertes an einer Stelle. Das sogenannte Anfangswertproblem (kurz AWP) (+) f ′ = f, f(0) = c bzw. y′ = y, y(0) = c hat für ein gegebenes c P R die Lösung f = c exp. 6 4 2 exp(x) - 2 exp(x) 2 0 -2 -4 -2 0 2 4 Zwei Anfangswertprobleme zu y′ = y und ihre Lösung: y0 = 2 bzw. y0 = −1/2 © Oliver Deiser Einführung in die Mathematik 1 164 2. Abschnitt Der analytische Kalkül Um zu zeigen, dass das AWP (+) für ein gegebenes c keine weiteren Lösungen besitzt, verwenden wir ohne Beweis den folgenden anschaulich klaren (aber keineswegs trivial zu beweisenden) Satz: Satz (Funktionen mit Ableitung 0) Sei I ein Intervall und f : I → R mit f ′ = 0. Dann ist f konstant, d. h. es gibt ein c P R mit f(x) = c für alle x P I. Der Leser beachte, dass die Voraussetzung, dass der Definitionsbereich von f ein Intervall ist, wesentlich ist: Beispiel Die Funktion f : [0, 1 ] ∪ [2, 3 ] → R mit f(x) = 0 für alle x P [0, 1 ] und f(x) = 2 für alle x P [ 2, 3 ] hat als Ableitung die Nullfunktion auf [ 0, 1 ] ∪ [ 2, 3 ]. Die Funktion f ist aber nicht konstant. Mit Hilfe des Satzes können wir die Eindeutigkeit der Lösung relativ einfach zeigen. Sei also f eine Lösung von (+). Wir definieren g : R → R durch g = f . exp Dann gilt g′ = f ′ exp − f exp′ exp2 = f ′ exp − f exp exp2 = 0, sodass g konstant gleich einer reellen Zahl c′ ist. Wegen c′ = g(0) = f(0) = c ist aber c′ = c und damit f = g exp = c exp. Das Argument zeigt insbesondere die Eindeutigkeit einer Funktion f mit f ′ = f und f(0) = 1, wobei die Existenz einer solchen Funktion vorausgesetzt wird. Die Differentialgleichung f ″ = f Differentialgleichungen können auch mehrfache Ableitungen involvieren, man spricht dann von Gleichungen höherer Ordnung. So erfüllen zum Beispiel sowohl der Kosinus Hyperbolicus als auch der Sinus Hyperbolicus die Differentialgleichung f ″ = f zweiter Ordnung. Allgemeiner gilt dies für die Funktionen a cosh x + b sinh x mit beliebigen Skalaren a,b P R, d.h. für Linearkombinationen des Kosinus und Sinus Hyperbolicus. Man kann zeigen, dass jede Lösung in dieser Form dargestellt werden kann. Alternativ können die Lösungen auch in der Form a ex + b e−x . angegeben werden. Einführung in die Mathematik 1 © Oliver Deiser 2. Ableitungsregeln 165 Die allgemeine Lösung einer Differentialgleichung zweiter Ordnung involviert zwei freie Parameter. Um Eindeutigkeit zu erreichen, wird ein Anfangswert für f und ein Anfangswert für f ′ vorgegeben (physikalisch: ein Startpunkt und eine Startgeschwindigkeit). Beispiel Das AWP f ″ = f, f(0) = 1, f ′(0) = 0 hat den Kosinus Hyperbolicus als eindeutige Lösung, das AWP f ″ = f, f(0) = 0, f ′(1) = 1 dagegen den Sinus Hyperbolicus. Die Differentialgleichung f ″ = −f Die Differentialgleichung f ″ = − f zweiter Ordnung hat die allgemeine Lösung a cos x + b sin x, mit a, b P R beliebig. Alternativ können die Lösungen auch durch Funktionen der Form c cos(x − x0 ) mit c ≥ 0 und x0 P R beschrieben werden. Im physikalischen Kontext ist c eine Amplitude und x0 eine Phasenverschiebung. Beispiel Das AWP f ″ = −f, f(0) = 1, f ′(0) = 1 hat die eindeutige Lösung cos x + sin x. Diese Lösung lässt sich auch in der Form £2 cos(x − π/4) schreiben. 1.5 1.0 0.5 cos(x) + sin(x) -3 -2 - 2 3 2 cos(x) -0.5 -1.0 -1.5 © Oliver Deiser Einführung in die Mathematik 1 166 2. Abschnitt Der analytische Kalkül Potenzreihendarstellungen für den Kosinus und Sinus Bisher haben wir, auf spielerischer Basis, die Potenzreihendarstellungen exp x = ∑ n P N xn n! = 1 + x + cosh x = ∑ n P N x(2n) (2n)! sinh x = ∑ n P N x(2n + 1) (2n + 1)! = 1 + x2 2 + x3 6 x2 2 + x4 24 = x + x3 6 + + …, + …, x5 120 + …, gefunden. Mit Hilfe der zweiten Ableitungen cos″ = −cos und sin″ = −sin können wir Potenzreihen für den Kosinus und Sinus ermitteln. Leiten wir eine Potenzreihe f(x) = a0 + a1 x + a2 x2 + … + an xn + … gliedweise zweimal ab, so ergibt sich f ′(x) = 1 ⋅ a1 + 2 a2 x + … + n an xn − 1 + …, f ″(x) = 2 ⋅ 1 ⋅ a2 + 3 ⋅ 2 a3 x + … + n (n − 1) an xn − 2 + … Soll die zweite Ableitung die Ausgangsreihe mit einem negativen Vorzeichen reproduzieren, so liefert ein Koeffizientenvergleich a0 = − 2 ⋅ 1 a2 , a1 = − 3 ⋅ 2 a3 , a2 = − 4 ⋅ 3 a4 und allgemein (+) an = − (n + 2) (n + 1) an + 2 für alle n P N. Wir betrachten nun den Kosinus, sodass f(x) = cos x, f ′(x) = − sin x, f ″(x) = − cos x. Wegen cos 0 = f(0) = 1 ist a0 = 1. Aus (+) ergibt sich a2 = − 1 , a4 = 2! 1 1 , a6 = − , a8 = 4! 6! 1 8! und allgemein a2n = (−1)n 1 (2n)! für alle n P N. Einführung in die Mathematik 1 © Oliver Deiser 2. Ableitungsregeln 167 Wegen cos′(0) = f ′(0) = 1 erhalten wir a1 = 0 und damit an = 0 für alle ungeraden Indizes n. Insgesamt ergibt sich cos x = 1 − x2 2! + x4 4! − x6 6! + … = ∑ n (−1)n x2n . (2n)! Damit unterscheidet sich die Potenzreihe des Kosinus von der des Kosinus Hyperbolicus nur durch abwechselnde Vorzeichen. Analoge Überlegungen (oder gliedweises Differenzieren der Kosinus-Reihe und Verwendung von cos′ = − sin x) liefern sin x = x − x3 3! + x5 5! − x7 7! + … = ∑ n (−1)n x2n + 1 . (2n + 1)! Man kann zeigen, dass diese Darstellungen in der Tat für alle reellen Zahlen gültig sind: Satz (Kosinus-Reihe und Sinus-Reihe) Für alle x P R gilt: cos x = 1 − x2 2! + x4 4! − x6 6! + … = ∑ n (−1)n x2n , (2n)! sin x = x − x3 3! + x5 5! − x7 7! + … = ∑ n (−1)n x2n + 1 . (2n + 1)! Speziell für im Betrag kleine Stellen x ergibt sich so eine Möglichkeit der effektiven Berechnung des Kosinus und des Sinus. Mit Hilfe der Landau-Notation können wir schreiben cos x = 1 + o(x), cos x = 1 − x2 /2 + o(x3 ), sin x = x + o(x2 ), sin x = x − x3 /6 + o(x4 ) für x → 0. Unsere Überlegungen zeigen, dass der Kosinus und der Sinus wie ihre hyperbolischen Verwandten eine der Exponentialfunktion formal ähnliche Darstellung als Potenzreihe besitzen. Während die hyperbolischen Funktionen mit Hilfe der Exponentialfunktion exp : R → R definiert werden können, ist ein Zusammenhang zwischen der Exponentialfunktion und den trigonometrischen Funktionen im Reellen aufgrund des Vorzeichenverhaltens der Koeffizienten nicht ersichtlich. Dieser Zusammenhang wird sich erst im Komplexen ergeben. © Oliver Deiser Einführung in die Mathematik 1 168 2. Abschnitt Der analytische Kalkül 4 2 sin(x) f3 (x) - f5 (x) -2 -4 4 2 sin(x) -2 f9 (x) - 2 f11 (x) -2 -4 4 2 sin(x) -4 f31 (x) -2 2 4 f33 (x) -2 -4 Die Sinusfunktion und einige Approximationen f2n + 1 mit f2n + 1 (x) = x − Einführung in die Mathematik 1 x3 3! + x5 5! − x7 7! + … + (−1)n x2n + 1 (2n + 1)! © Oliver Deiser 2. Ableitungsregeln 169 Die Ableitungen des Arkustangens Für viele elementare Funktionen lassen die höheren Ableitungen explizit leicht angeben. Die Exponentialfunktion reproduziert sich selbst: exp, exp, exp, … Der Sinus hat die periodische Ableitungsfolge sin, cos, − sin, − cos, sin, cos, − sin, − cos, … Für den Logarithmus ergibt sich log, 1 1 1 1 1 , − 2 , 2 3 , − 3! 4 , …, (−1)n − 1 (n − 1)! n , …, x x x x x was durch Induktion nach n leicht nachgewiesen werden kann. Deutlich schwieriger sind die höheren Ableitungen arctan, arctan′, …, arctan(n) , … des Arkustangens zu berechnen. Wir geben eine elementare Analyse dieser in der Literatur überraschenderweise kaum beachteten Problemstellung. Die ersten Ableitungen lauten: arctan′(x) = 1 1 + x2 =: g(x) arctan″(x) = −2x (1 + x2 )2 = −2x g(x)2 arctan(3) (x) = 2(3x2 − 1) (1 + x2 )3 = 2 (3x2 − 1) g(x)3 arctan(4) (x) = 6(−4x3 + 4x) (1 + x2 )4 = 3! (−4x3 + 4x) g(x)4 arctan(5) (x) = 24(5x4 − 10x2 + 1) (1 + x2 )5 = 4! (5x4 − 10x2 + 1) g(x)5 arctan(6) (x) = 120(−6x5 + 20x3 − 6x) (1 + x2 )6 = 5! (−6x5 + 20x3 − 6x) g(x)6 Die auf der rechten Seite der Tabelle isolierten Polynome haben alternierende Vorzeichen. Ihre Koeffizienten tauchen als Diagonalen im Pascalschen Dreieck auf: © Oliver Deiser Einführung in die Mathematik 1 170 2. Abschnitt Der analytische Kalkül 1 1 1 2 1 3 1 4 1 5 1 1 6 1 4 6 10 10 15 1 3 20 1 1 5 15 6 1 Diese Beobachtungen motivieren: Definition (Arkustangens-Polynome) Für alle n ≥ 0 ist das n-te Arkustangens-Polynom qn : R → R definiert durch { n+1 qn (x) = (−1)n ∑ 0 ≤ k ≤ n, k gerade k + 1 (−1)k/2 xn − k für alle x P R. Für alle x P R gilt q0 (x) = 1, q1 (x) = −2x, q2 (x) = 3x2 − 1, q3 (x) = −4x3 + 4x, … Mit Blick auf die oben berechneten Ableitungen ist folgendes Ergebnis nicht mehr überraschend: Satz (Ableitungen des Arkustangens) Für alle n ≥ 1 gilt arctan(n) (x) = (n − 1)! qn − 1 (x) (1 + x2 )n für alle x P R. Beim Versuch, den Satz durch Induktion nach n ohne weitere Vorbereitungen zu beweisen, verwickeln wir uns leicht in unüberschaubare Terme. Es ist daher nützlich, vorab einige Eigenschaften der Polynome zu isolieren: Satz (Eigenschaften der Arkustangens-Polynome) Sei n ≥ 0. Dann gilt: (a) qn ist ein Polynom vom Grad n. (b) qn (−x) = (−1)n qn (x) für alle x P R. (c) qn (0) = 0 für n ungerade, qn (0) = (−1)n/2 für n gerade. (d) qn ′ = − (n + 1) qn − 1 für n ≥ 1. (e) qn (x) + 2x qn − 1 (x) + (1 + x2 ) qn − 2 (x) = 0 für n ≥ 2. Einführung in die Mathematik 1 © Oliver Deiser 2. Ableitungsregeln 171 Beweis Die ersten vier Eigenschaften sind leicht einzusehen. Die fünfte Eigenschaft zeigen wir durch Induktion nach n ≥ 2. Der Induktionsanfang n = 2 ist klar. Im Induktionsschritt von n − 1 nach n berechnen wir d qn (x) + 2x qn − 1 (x) + (1 + x2 ) qn − 2 (x) dx ( ) = qn ′(x) + 2qn − 1 (x) + 2xqn − 1 ′(x) + 2x qn − 2 (x) + (1 + x2 ) qn − 2 ′(x) = ( 1 − n ) ( qn − 1(x) + 2x qn − 2(x) + (1 + x2) qn − 3(x) ) = I. V. 0. Damit ist das abgeleitete Polynom konstant. Nach (b) hat es an der Stelle 0 den Wert 0, sodass das Polynom das Nullpolynom ist. Problemlos ist nun: Beweis des Satzes über die Ableitungen des Arkustangens Wir zeigen die Behauptung durch Induktion nach n ≥ 1. Der Induktionsanfang n = 1 ist klar wegen q0 = 1 und arctan′(x) = 1/(1 + x2 ). Im Induktionsschritt von n nach n + 1 berechnen wir mit Hilfe von (d) und (e): arctan(n+1) = (n − 1)! = (n − 1)! = n! qn − 1 ′(x)(1 + x2 )n − 2 n x qn − 1 (x)(1 + x2 )n − 1 (1 + x2 )2n − n qn − 2 (x) (1 + x2 ) − 2 n x qn − 1 (x) (1 + x2 )n + 1 qn (x) (1 + x2 )n . Die Frage betrifft letztendlich die höheren Ableitungen der rationalen Funktion 1/(1 + x2 ). Der Arkustangens kommt „nur“ durch arctan′(x) = 1/(1 + x2 ) ins Spiel. Unabhängig davon haben die qn -Polynome interessante Eigenschaften. Normieren wir (Leitkoeffizient wird 1) die qn -Polynome durch pn (x) = (−1)n qn (x) für alle n ≥ 0 und x P R, n+1 so gilt (+) pn ′ = (−1)n − 1 qn − 1 = n pn − 1 für alle n ≥ 1. Der Leser vergleiche dies mit der Ableitung d/dx xn = n xn − 1 für die Monome. Eine Folge (rn )n ≥ 0 von Polynomen mit rn ′ = n rn−1 für alle n ≥ 1 ist in der Literatur als Appell-Folge bekannt. Nach (+) bilden die pn -Polynome wie die Monome xn eine Appell-Folge. © Oliver Deiser Einführung in die Mathematik 1 172 2. Abschnitt Der analytische Kalkül Übungen Übung 1 (a) Zeigen Sie d n x = n xn − 1 für alle n ≥ 1 dx induktiv mit Hilfe der Produktregel. (b) Leiten Sie die Quotientenregel aus der Produkt- und Kettenregel ab, unter Verwendung von d dx 1 x = − 1 . x2 Übung 2 Zeigen Sie die Kettenregel unter Verwendung der Ableitungsregel für Polynome für den Fall, dass eine der beiden beteiligten Funktionen eine Gerade und die andere eine Parabel ist. Übung 3 (a) Nehmen Sie an, dass die Umkehrfunktion einer differenzierbaren Funktion differenzierbar ist und gewinnen Sie die Ableitungsregel für die Umkehrfunktion aus der Kettenregel. (b) Visualisieren Sie die Ableitungsregel für die Umkehrfunktion durch ein Diagramm. Übung 4 Beweisen Sie, soweit noch nicht erfolgt, die tabellarisch angegebenen Formeln für die Ableitungen der trigonometrischen Funktionen (einschl. ihrer Umkehrfunktionen). Übung 5 Beweisen Sie, soweit noch nicht erfolgt, die tabellarisch angegebenen Formeln für die Ableitungen der hyperbolischen Funktionen (einschl. ihrer Umkehrfunktionen). Übung 6 In den Übungen zu den trigonometrischen Funktionen hatten wir gesehen, dass sich Funktionen der Formen (1) a cos x + b sin x mit a, b P R (2) c cos(x − x0 ) mit c, x0 P R Einführung in die Mathematik 1 © Oliver Deiser 2. Ableitungsregeln 173 ineinander umrechnen lassen. Gewinnen Sie dieses Resultat neu unter Verwendung der eindeutigen Lösbarkeit der Anfangswertprobleme f ″ = − f, f(0) = a, f ′(0) = b bzw. f ″ = − f, f(x0 ) = c, f ′(x0 ) = −c. Welche Umrechnungsformeln zwischen a, b und c, x0 ergeben sich? Übung 7 Bestimmen Sie in Analogie zur Ermittlung der Potenzreihendarstellung für den Kosinus die Potenzreihendarstellung einer Funktion f : R → R mit den Eigenschaften: f (3) = −f, f(0) = 1, f ′(0) = 0, f ″(0) = 0. Übung 8 Plotten Sie (mit Hilfe eines Computers) die Kosinus-Funktion und die fünf Polynome pn (x) = ∑ 0 ≤ k ≤ n (−1)k x2k (2k)! für n = 1, …, 5. Erstellen Sie zudem eine Tabelle, die den numerischen Unterschied zwischen cos(x) und pn (x) für n = 1, …, 5 und x = 1/10, 1, π/2 und 10π illustriert. Übung 9 Eine alternative Darstellung der Ableitungen des Arkustangens: Wir definieren h : R → R durch h(x) = 1 £1 + x2 = £arctan′(x) für alle x P R. Weiter sei gn : R → R für alle n ≥ 1 definiert durch gn (x) = (−1)n − 1 (n − 1)! h(x)n sin( n arccot x ) für alle x P R. Zeigen Sie: (1) gn (x) = (−sgn(x))n − 1 h(x)n sin( n arcsin h(x) ) für alle n ≥ 1, x P R. (2) g1 = h(x)2 = arctan′(x), gn ′ = gn + 1 für alle n ≥ 1. Nach (2) gilt arctan(n) = gn für alle n ≥ 1. © Oliver Deiser Einführung in die Mathematik 1 3. Die Taylor-Entwicklung Mit Hilfe der ersten Ableitung konnten wir eine differenzierbare Funktion lokal durch ihre Tangente approximieren. Wir betrachten nun Approximationen höherer Ordnung, bei denen wir eine hinreichend oft differenzierbare Funktion an einer gegebenen Stelle (einem Entwicklungspunkt) durch Parabeln und allgemeiner Polynome n-ten Grades annähern. Dabei stellt sich auch die Frage nach der Möglichkeit der Potenzreihenentwicklung einer Funktion. © Oliver Deiser Einführung in die Mathematik 1 176 2. Abschnitt Der analytische Kalkül Schmiegeparabeln Sei f : P → R eine an einer Stelle p P P differenzierbare Funktion. Nach dem linearen Approximationssatz gilt f(x) = f(p) + f ′(p) (x − p) + o(x − p) für x → p, wobei „o(x − p) für x → p“ für eine Funktion r : P → R steht mit limx →p r(x) x−p = 0. Eine natürliche Idee ist es nun, die Tangente g(x) = f(p) + f ′(p) (x − p) für alle x P R, durch eine Parabel zu ersetzen, um eine noch bessere lokale Approximation an f zu erhalten. Um die Form einer solchen Parabel zu finden, beobachten wir, dass die Tangente g durch folgende Eigenschaften charakterisiert ist: (a) Übereinstimmung an der Stelle p: f(p) = g(p). (b) Übereinstimmung der ersten Ableitung an der Stelle p: f ′(p) = g′(p). Dies legt es nahe, für die gesuchte Parabel h : R → R zusätzlich eine Übereinstimmung der zweiten Ableitung an der Stelle p zu fordern. Setzen wir h(x) = f(p) + f ′(p) (x − p) + c (x − p)2 , mit einer unbekannten Konstanten c, so gilt h″(p) = 2c. Soll h″(p) = f ″(p) gelten, muss also c = f ″(p)/2 sein. Diese Überlegung motiviert: Definition (Schmiegeparabel) Sei f : P → R zweimal differenzierbar an einer Stelle p P P. Dann heißt die Funktion h : R → R mit h(x) = f(p) + f ′(p) (x − p) + f ″(p) (x − p)2 für alle x P R 2 die Schmiegeparabel von f an der Stelle p. Eine Schmiegeparabel h stimmt nach Konstruktion an der Stelle p in der nullten, ersten und zweiten Ableitung mit der Funktion f, an die sie sich anschmiegt, überein (wobei die nullte Ableitung einer Funktion als die Funktion selbst definiert ist). Sie ist nur dann eine echte Parabel, wenn f ″(p) ≠ 0. In Fall f ″(p) = 0 fällt h mit der Tangente von f an der Stelle p zusammen. Um die Sprechweise zu vereinfachen, lassen wir diesen Fall zu. In Analogie zum linearen Approximationssatz gilt: Einführung in die Mathematik 1 © Oliver Deiser 3. Die Taylor-Entwicklung 177 2 1 -1 1 2 3 4 5 log(x) -1 h(x) -2 -3 -4 Die Schmiegeparabel des Logarithmus an der Stelle 1 Satz (quadratischer Approximationssatz) Sei f : P → R zweimal differenzierbar an der Stelle p P P. Weiter sei h die Schmiegeparabel von f an der Stelle p und r : P → R mit r(x) = f(x) − h(x) für alle x P P. Dann gilt limx →p r(x) (x − p)2 = 0. Der Beweis des Satzes ist nicht mehr so einfach wie im linearen Fall. Relativ problemlos lässt er sich mit den Regeln von l’Hospital führen, siehe etwa [Deiser, Analysis 1] für einen Beweis. Unter den Voraussetzungen des Satzes können wir also schreiben Satz (quadratischer Approximationssatz in Landau-Notation) Sei f : P → R zweimal differenzierbar an der Stelle p P P, und sei h die Schmiegeparabel von f an der Stelle p. Dann gilt f(x) = h(x) + o((x − p)2 ) = f(p) + f ′(p) (x − p) + f ″(p) (x − p)2 + o((x − p)2 ) für x → p. 2 Ein typisches Beispiel für eine Restfunktion des Typs o((x − p)2 ) ist das Polynom (x − p)3 dritten Grades. Aber auch (x − p)5/2 erfüllt die Bedingung. Die Konvergenz gegen 0 muss schneller sein als eine quadratische Konvergenz. Wir können die Ergebnisse etwas salopp so zusammenfassen: Eine Funktion ist lokal ihre Tangente plus ein kleiner Rest und weiter ihre Schmiegeparabel plus ein noch kleinerer Rest. Was „kleiner Rest“ bedeuten soll, wird durch die klein-o-Notation in kompakter Form zum Ausdruck gebracht. Anstelle dieser Notationen können wir immer auch konkrete Restfunktionen verwenden, die eine bestimmte Limesbedingung erfüllen. © Oliver Deiser Einführung in die Mathematik 1 178 2. Abschnitt Der analytische Kalkül 1.5 1.0 log(x) 0.5 h(x) r(x) r(x) (x-1)2 0.5 1.0 1.5 2.0 2.5 3.0 3.5 -0.5 -1.0 Zum quadratischen Approximationssatz: Schmiegeparabel und Restfunktion des Logarithmus an der Stelle 1 Im Gegensatz zu einer Tangente ist eine Schmiegeparabel h einer Funktion f an einer Stelle p nicht mehr so leicht in einen Graphen einer Funktion einzuzeichnen. Um die Lage von h zu bestimmen, nehmen wir f ″(p) ≠ 0 an. Dann ist a = f ″(p)/2 die Öffnung von h. Je größer also der Betrag der zweiten Ableitung von f an der Stelle p ist, desto steiler ist die Parabel. Ist |f ″(p)| klein, so ist die Parabel sehr flach. Mit unserer Formel (− b , c − 2a b2 4a ) für den Scheitelpunkt einer Parabel mit den Parametern a,b,c berechnet sich der Scheitelpunkt der Schmiegeparabel h zu (+) s(p) = ( p, f(p) ) − f ′(p) f ′(p) ( 1, f ″(p) 2 ) (Scheitelpunkt der Schmiegeparabel) (Dieses Ergebnis können wir auch leicht durch Ableiten von h erhalten, denn p − f ′(p)/f ″(p) ist die eindeutige Nullstelle von h′.) Genau im Fall f ′(p) = 0 fällt der Scheitelpunkt s(p) mit dem Punkt (p, f(p)) zusammen. Der Abstand der x-Koordinate des Scheitelpunkts von der Stelle p ist durch das Verhältnis der beiden ersten Ableitungen von f an der Stelle p bestimmt. Fassen wir nun p als Variable auf, so erhalten wir eine Kurve s : P → R2 , die jeder Stelle p des Definitionsbereichs von f einen Punkt der Ebene gemäß (+) zuweist. Diese Scheitelpunktskurve können wir am Allgemeinen nicht mehr als reellwertige Funktion auffassen. Die folgenden Diagramme zeigen einige Beispiele. Einführung in die Mathematik 1 © Oliver Deiser 3. Die Taylor-Entwicklung 179 1.0 0.5 -2 -1 1 2 -0.5 -1.0 Scheitelpunkte der Schmiegeparabeln von f(x) = x (x − 1) (x + 1) 2 1 2 4 6 8 10 -1 -2 Scheitelpunkte der Schmiegeparabeln des Logarithmus log © Oliver Deiser Einführung in die Mathematik 1 180 2. Abschnitt Der analytische Kalkül 6 4 2 -5 5 -2 -4 Scheitelpunkte der Schmiegeparabeln von cos auf [ −π, π ] Taylor-Polynome Noch allgemeiner können wir fragen, wie Polynome höheren Grades definiert werden können, die an einer bestimmten Stelle in mehr als zwei Ableitungen mit einer Funktion übereinstimmen. Ist eine an einer Stelle p ihres Definitionsbereichs n-mal differenzierbare Funktion f gegeben, so suchen wir also ein Polynom g : R → R höchstens n-ten Grades der Form g(x) = a0 + a1 (x − p) + a2 (x − p)2 + … + an (x − p)n für alle x P R mit der Eigenschaft f(p) = g(p), f ′(p) = g′(p), f ″(p) = g″(p), …, f (n) (p) = g(n) (p). Sei k ≤ n. Dann gilt für alle x P R g(k) (x) = k! ak + k! ak + 1 (x − p) + … + 1! k! an (x − p)n − k , (n − k)! sodass g(k) (p) = k! ak . Wenn g(k) (p) = f (k) (p) gelten soll, muss also ak = f (k) (p) k! sein. Die Fakultät im Nenner gleicht die Faktoren aus, die beim k-fachen Ableiten von (x − p)k entstehen. Wir definieren: Einführung in die Mathematik 1 © Oliver Deiser 3. Die Taylor-Entwicklung 181 Definition (Taylor-Polynome) Sei f : P → R n-mal differenzierbar an der Stelle p P P. Dann ist das n-te Taylor-Polynom T np f : R → R von f im Entwicklungspunkt p definiert durch T np f(x) = f(p) + f ′(p) (x − p) + = ∑k ≤ n f ″(p) (x − p)2 + … + 2! f (k) (p) (x − p)k k! f (n) (p) (x − p)n n! für alle x P R. Wir nennen das Polynom T np f auch die Taylor-Entwicklung der Ordnung n der Funktion f an der Stelle p. Das Taylor-Polynom der Ordnung 0 ist konstant gleich f(p). Die Taylor-Polynome der Ordnungen 1 und 2 sind die Tangente und die Schmiegeparabel von f an der Stelle p. Die Taylor-Entwicklung dritter Ordnung lautet T 3p (x) = f(p) + f ′(p) (x − p) + f ″(p) (x − p)2 + 2 f (3) (x − p)3 . 6 4 2 log(x) -1 1 2 3 4 h(x) r(x) -2 -4 Das Taylor-Polynom h(x) dritter Ordnung des Logarithmus an der Stelle 1 und die Restfunktion r(x) = log(x) − h(x) Wie erwartet kann man eine zu den bisherigen Ergebnissen analoge Approximationsgüte nachweisen: Satz (Satz von Peano) Sei f : P → R n-mal differenzierbar an der Stelle p P P. Weiter sei r : P → R die Funktion mit r(x) = f(x) − T np f (x) für alle x P P. Dann gilt limx →p r(x) (x − p)n © Oliver Deiser = 0. Einführung in die Mathematik 1 182 2. Abschnitt Der analytische Kalkül Gleichwertig in der Landau-Notation formuliert lautet der Satz: Satz (Satz von Peano in Landau-Notation) Sei f : P → R n-mal differenzierbar an der Stelle p P P. Dann gilt: f(x) = T np f (x) + o((x − p)n ) = f(p) + f ′(p)(x − p) + … + f (n) (p) (x − p)n + o((x − p)n ) für x → p. n! Taylor-Reihen Es ist verführerisch, die Taylor-Entwicklung nicht bei einer bestimmten Ordnung abzubrechen, sondern unendlich fortzusetzen: Definition (Taylor-Reihe) Sei f : P → R beliebig oft differenzierbar an der Stelle p P P. Dann ist die Taylor-Reihe T p f von f im Entwicklungspunkt p definiert durch T p f (x) = ∑ n f (n) (p) (x − p)n für alle x P R. n! Im Gegensatz zu den Taylor-Polynomen ist keineswegs garantiert, dass durch eine unendliche Taylor-Reihe eine auf ganz R oder auch nur auf P definierte Funktion erklärt ist (Konvergenzproblem). Weiter stellt sich die Frage, ob die erhoffte „perfekte Approximation“, bei der die Restfunktion Null geworden ist, tatsächlich erreicht wird: Stimmt die Taylor-Reihe auf P oder wenigstens auf gewissen Teilintervallen von P mit f überein? (Darstellungsproblem). Offensichtlich ist nur die Übereinstimmung im Entwicklungspunkt. Ob die Funktion f auch in anderen Punkten durch ihre Taylor-Reihe dargestellt wird, und welche Punkte dies genau sind, ist nicht klar. Die Untersuchung dieser Fragen ist eine nichttriviale Aufgabe der Analysis. Unseren spielerisch-experimentellen Ansatz fortsetzend behandeln wir diesen Problemkreis exemplarisch. Begegnet sind uns bisher die für alle x P R gültigen Potenzreihendarstellungen exp x = ∑ n cosh x = ∑ n xn , n! x(2n) , (2n)! cos x = ∑ n (−1)n x(2n) , (2n)! Einführung in die Mathematik 1 sinh x = ∑ n x(2n + 1) , (2n + 1)! sin x = ∑ n (−1)n x(2n + 1) . (2n + 1)! © Oliver Deiser 3. Die Taylor-Entwicklung 183 Die Reihen auf der rechten Seite sind die Taylor-Entwicklungen der Funktionen im Entwicklungspunkt 0. Dies lässt sich explizit durch Berechnung der TaylorReihen nachweisen oder allgemein aus der Eindeutigkeit einer Potenzreihendarstellung folgern: Satz (Eindeutigkeit einer Potenzreihendarstellung) Sei p P R, ε > 0 und f : ] p − ε, p + ε [ → R dargestellt durch zwei Potenzreihen, sodass f(x) = ∑ n an (x − p)n = ∑ n bn (x − p)n für alle x P ] p − ε, p + ε [. Dann gilt an = f (n) (p) n! = bn für alle n P N. Beweis Gliedweises Differenzieren der Potenzreihe ∑ n an (x − p)n zeigt, dass an = f (n) (p) n! für alle n P N. Ebenso gilt bn = f (n) (p)/n! für alle n P N. Ist eine Funktion f : P → R durch als Taylor-Reihe darstellbar, d. h. gilt f(x) = T p f(x) = ∑ n f (n) (p) (x − p)n für alle x P P, n! so bedeutet dies, dass die gesamte Funktion durch die Folge f (p), f ′(p), f ″(p), …, f (n) (p), … ihrer Ableitungen an der Stelle p festgelegt ist. Kennen wir nämlich diese Ableitungen, so kennen wir die Taylor-Reihe T p f und damit die Funktion f. Der Leser beachte, dass sich alle Ableitungen berechnen lassen, wenn die Funktion f auf einem winzigen Ausschnitt um den Entwicklungspunkt herum vorliegt: Aus f |] p − ε, p + ε [ lässt sich, für ein beliebig kleines ε > 0, die gesamte Funktion f : P → R rekonstruieren − immer vorausgesetzt, f ist durch T p f darstellbar. Der Verlauf von f ist in diesem Sinne durch den Verlauf von f im Intervall ] p − ε, p + ε [ determiniert. Die Folge der Ableitungen von f an der Stelle p trägt die gesamte Vergangenheit und Zukunft von f in sich. Die perfekte Darstellbarkeit wie bei den Funktionen exp, cosh, sinh, sin, cos ist aber nicht in allen Fällen zu erreichen. Wir betrachten hierzu vier Beispiele, die die auftretenden Phänomene illustrieren. © Oliver Deiser Einführung in die Mathematik 1 184 2. Abschnitt Der analytische Kalkül Beispiel 1: Die geometrische Reihe als Taylor-Reihe Sei f : R − { 1 } → R definiert durch f(x) = 1 1−x für alle x ≠ 1. Aufgrund unserer Überlegungen zur geometrischen Reihe wissen wir, dass f(x) = 1 1−x = ∑ n xn für alle x P ] −1, 1 [. Aufgrund des Eindeutigkeitssatzes ist die geometrische Reihe ∑ n xn die Taylor-Reihe von f im Entwicklungspunkt 0. Zur Illustration berechnen wir die Taylor-Reihe durch Bestimmung der Ableitungen. Für alle x ≠ 1 gilt f ′(x) = 1 , f ″(x) = (1 − x)2 2! , …, f (n) (x) = (1 − x)3 n! , … (1 − x)n Damit ist f (n) (0) = n! für alle n P N. 10 5 1 1-x f2 (x) -2 -1 1 2 f3 (x) -5 -10 40 20 1 1-x -2 -1 1 2 f6 (x) f7 (x) -20 -40 Die Funktion 1/(1 - x) und einige Taylor-Polynome fn der Ordnung n im Entwicklungspunkt p = 0 Einführung in die Mathematik 1 © Oliver Deiser 3. Die Taylor-Entwicklung 185 Für den Entwicklungspunkt p = 0 erhalten wir also n! (x − 0)n = ∑ n xn für alle x P R. n! T1 f(x) = ∑ n Damit haben wir die geometrische Reihe wiedergefunden. Es gilt f(x) = 1 1−x = ∑ n xn = T1 f(x) genau dann, wenn |x| < 1. Die Taylor-Entwicklung von f im Entwicklungspunkt p = 0 stimmt mit f nur in einem endlichen Intervall überein. Genauer ist dieses Intervall symmetrisch um den Entwicklungspunkt, und es reicht bis zur Polstelle von f. Der Definitionsbereich R − { 1 } von f ist wesentlich größer als der Konvergenzbereich der Taylor-Reihe. So gilt zum Beispiel f(−1) = 1/2, während ∑ n (−1)n = 1 − 1 + 1 − 1 + … nicht konvergiert, da die Summen 1, 1 − 1, 1 − 1 + 1, 1 − 1 + 1 − 1, … zwischen 1 und 0 hin und her pendeln. Besipiel 2: Die Taylor-Reihe des Logarithmus Es gilt log′(x) = 1 1 , log″(x) = − 2 , x x log(3) (x) = 2 1 1 , log(4) (x) = − 3! 4 , 3 x x und allgemein log(n) (x) = (−1)n − 1 (n − 1)! 1 xn für alle n ≥ 1, x > 0. Wir betrachten den Entwicklungspunkt p = 1, für den die Ableitungen besonders einfache Werte ergeben. Wegen log(1) = 0 erhalten wir: T1 log (x) = ∑ n ≥ 1 (−1)n − 1 (x − 1)n für alle x P R. n Die Taylor-Reihe divergiert zum Beispiel für x = 0, wie es im Hinblick auf den Logarithmus ja auch sein soll, aber auch für x = 3, wo der Logarithmus definiert ist. Man kann zeigen, dass die Taylor-Reihe genau für x P ] 0, 2 ] mit dem Logarithmus übereinstimmt. Speziell ergibt sich für x = 2 die bemerkenswerte Darstellung log 2 = 1 − © Oliver Deiser 1 2 + 1 3 − 1 4 + … (log(2)-Reihe) Einführung in die Mathematik 1 186 2. Abschnitt Der analytische Kalkül 3 2 1 log(x) f3 (x) -0.5 0.5 1 1.5 2 f4 (x) 2.5 f5 (x) -1 -2 -3 3 2 1 log(x) f20 (x) -0.5 0.5 1 1.5 2 f25 (x) 2.5 f30 (x) -1 -2 -3 Einige Taylor-Polynome fn = T n1 log 1 sn log(2) 0.5 0.25 5 Zur log(2)-Reihe: sn = 1 − Einführung in die Mathematik 1 10 1 2 + 1 3 15 − 1 4 + … + (−1)n + 1 1 n © Oliver Deiser 3. Die Taylor-Entwicklung 187 Wählen wir den Entwicklungspunkt p = 2, so erhalten wir eine Taylor-Reihe, die im Intervall ]0, 4] konvergiert und dort den Logarithmus darstellt. Allgemeiner erhalten wir für einen Entwicklungspunkt p > 0 eine Konvergenz und Übereinstimmung im Intervall ]0, 2p]. Dieses Verhalten ergibt sich auch bei der Quadratwurzelfunktion, die ja im Nullpunkt nicht differenzierbar ist. Im Gegensatz zur Taylor-Entwicklung der Funktion 1/(1 − x) aus dem ersten Beispiel ist nun der Konvergenzbereich ein halboffenes Intervall. Allgemein zeigt sich: Der Konvergenzbereich einer Taylor-Reihe ist immer symmetrisch um den Entwicklungspunkt p. Genauer ist er von der Form [ p − r, p + r ], ] p − r, p + r] , [ p − r, p + r [ oder ] p − r, p + r [ mit einem gewissen Konvergenzradius r ≤ ∞. Damit kann eine Taylor-Reihe global keine Funktion wie 1/x, sqrt x, log x oder tan x darstellen, deren Definitionsbereich nicht symmetrisch zum Entwicklungspunkt p ist. Salopp formuliert: Die Taylor-Entwicklung bleibt an kritischen Stellen hängen. Umgekehrt stellt sich die Frage, ob ein symmetrischer Definitionsbereich die Darstellbarkeit durch eine Taylor-Reihe garantiert. Wir betrachten hierzu: Beispiel 3: Taylor-Reihe des Arkustangens Der Arkustangens arctan : R → R hat für alle n ≥ 1 die Ableitungen qn − 1 (x) , wobei (1 + x2 )n { n+1 qn (x) = (−1)n ∑ 0 ≤ k ≤ n, k gerade k + 1 (−1)k/2 xn − k für alle x P R. arctan(n) (x) = (n − 1)! Damit ist arctan(2n) (0) = 0 und arctan(2n + 1) (0) = (−1)n /(2n + 1) für alle n, sodass x3 3 (+) T0 arctan (x) = x − + x5 5 − … = ∑ n (−1)n x2n + 1 . 2n + 1 Alternativ können wir die geometrische Reihe einsetzen. Es gilt arctan′(x) = 1 1 − (−x2 ) = ∑ n (−x2 )n = 1 − x2 + x4 − x6 + … für |x| < 1. Wegen arctan(0) = 0 ergibt sich (+), denn gliedweises Differenzieren der Reihe (+) liefert die geometrische Reihe für arctan′. Man kann zeigen, dass T0 arctan(x) = arctan(x) genau dann gilt, wenn |x| ≤ 1. Für x = 1 erhalten wir wegen arctan(1) = π/4: π 4 = 1 − © Oliver Deiser 1 3 + 1 5 − 1 7 + … (Leibniz-Reihe) Einführung in die Mathematik 1 188 2. Abschnitt Der analytische Kalkül 3 2 1 arctan(x) f3 (x) -2 -1 1 f5 (x) 2 f7 (x) -1 -2 -3 3 2 1 arctan(x) f20 (x) -1 -0.5 0.5 1 1.5 f30 (x) 2 f40 (x) -1 -2 -3 Einige Taylor-Polynome fn = T n1 arctan 1 sn /4 0.5 0.25 5 Zur Leibniz-Reihe: sn = 1 − Einführung in die Mathematik 1 10 1 3 + 1 5 15 − 1 7 + … + (−1)n − 1 1 2n − 1 © Oliver Deiser 3. Die Taylor-Entwicklung 189 Zu dieser überraschenden Darstellung von π/4 gesellt sich die ebenso überraschende Divergenz der Reihe für x mit |x| > 1. Wenn sich Kosinus und Sinus als Reihe auf ganz R darstellen lassen, warum nicht auch der Arkustangens? Das Phänomen klärt sich erst, wenn wir die reellen Zahlen zu den komplexen Zahlen erweitern: Die komplexwertige Arkustangens-Funktion besitzt eine Polstelle bei der imaginären Einheit i, die den Abstand 1 vom Entwicklungspunkt 0 besitzt. (Dies kann man durch Betrachtung der Ableitung 1/(1 + x2 ) erkennen, die eine Polstelle bei x aufweist, falls x2 = −1 gilt.) Erst durch eine Erweiterung des Zahlbereichs wird also der im Reellen überraschend kleine Konvergenzradius r = 1 befriedigend erklärt: Die Taylor-Entwicklung bleibt bei i hängen, wobei dieses Hindernis im Reellen nicht zu sehen ist. Bislang haben stets eine Übereinstimmung der Taylor-Reihe mit der Ausgangsfunktion auf einem echten Intervall, dessen Mittelpunkt der Entwicklungspunkt ist, gefunden und damit zumindest lokal eine „perfekte Approximation“ (mit Rest 0) gefunden. Das folgende Beispiel zeigt, dass dies nicht immer so ist: Beispiel 4: Das Gegenbeispiel von Cauchy Wir definieren f : R → R durch f(x) = 2 e−1/x 0 { falls x ≠ 0, falls x = 0. Man kann zeigen, das f (n) (0) = 0 für alle n. Damit ist die Taylor-Reihe von f im Entwicklungspunkt 0 die Nullfunktion. Sie stellt eine auf ganz R definierte Funktion dar, stimmt aber nur im Nullpunkt mit f überein. 3 2 f(x) 1 f (x) f (x) -3 -2 -1 1 2 3 -1 Die Funktion f von Cauchy und ihre erste und zweite Ableitung Wir müssen also wohl oder übel konstatieren: Es ist möglich, dass eine Taylor-Reihe überall konvergiert, aber nur im Entwicklungspunkt mit der Ausgangsfunktion übereinstimmt. © Oliver Deiser Einführung in die Mathematik 1 190 2. Abschnitt Der analytische Kalkül Eine Variante erhalten wir, indem wir f auf der negativen x-Achse gleich Null setzen. Die Taylor-Reihe dieser Funktion (erneut die auf ganz R definierte Nullfunktion) stimmt genau auf dem Intervall ] −∞, 0 ] mit der Funktion überein. Derartige Funktionen dürfen aber als Sonderfälle gelten. Auch hier bringt erst die komplexe Analysis Licht ins Dunkel, denn im Komplexen gilt: Eine komplex-differenzierbare Funktion lässt sich lokal (und etwas salopp formuliert: so weit als möglich) immer in eine Taylor-Reihe entwickeln. Hat also eine reelle Funktion eine differenzierbare komplexe Version, so kann eine Diskrepanz wie im Beispiel von Cauchy nicht auftreten. Die komplexe Variante der Funktion von Cauchy ist im Nullpunkt nicht mehr differenzierbar. Wie beim Arkustangens ist diese Eigenschaft der Funktion im Reellen nicht zu sehen. Positiv formuliert können wir feststellen, dass wir im Reellen Freiheiten haben, den Verlauf einer beliebig oft differenzierbaren Funktion zu gestalten, die in der determinierten Welt des Komplexen nicht vorhanden sind. Einführung in die Mathematik 1 © Oliver Deiser 3. Die Taylor-Entwicklung 191 Übungen Übung 1 Bestimmen Sie die Schmiegeparabel h : R → R im Punkt 1 für die Funktion f : R → R mit f(x) = x3 − 2x + x + 1 für alle x P R. Überzeugen Sie sich explizit von der Darstellung f(x) = h(x) + o((x − 1)2 ) für x → 1. Übung 2 Bestimmen Sie die Schmiegeparabel des Sinus in den Punkten 0, π/4 und π/2. Fertigen Sie zugehörige Skizzen an. Übung 3 Sei f : R → R ein Polynom n-ten Grades, und sei p P R beliebig. Zeigen Sie, dass T np f = f. (Hinweis: Zeigen Sie, dass zwei Polynome n-ten Grades, die an einer Stelle in allen Ableitungen übereinstimmen, gleich sind.) Übung 4 Sei f : R → R das Polynom dritten Grades mit f(x) = (x − 1)3 + 2(x − 1)2 − 3(x − 1) + 1 für alle x P R. Bestimmen sie die Taylor-Polynome dritten Grades von f in den Entwicklungspunkten p = 0 und p = 2. Wie können diese Darstellungen von f auch ohne Taylor-Entwicklung erhalten werden? Welche Vor- und Nachteile haben die verschiedenen Methoden? Übung 5 Bestimmen Sie das Taylor-Polynom dritten Grades für die Wurzelfunktion sqrt(x) in den Entwicklungspunkten p = 1 und p = 2. Übung 6 Bestimmen Sie das Taylor-Polynom fünften Grades des Tangens im Entwicklungspunkt 0. Übung 7 Zeigen Sie durch Berechnung der Ableitungen, dass die Taylor-Reihen von exp, cosh, sinh, cos und sin im Nullpunkt mit den Hilfe von Differentialgleichungen gewonnenen Potenzreihendarstellungen dieser Funktionen übereinstimmen. © Oliver Deiser Einführung in die Mathematik 1 192 2. Abschnitt Der analytische Kalkül Übung 8 Die Taylor-Reihe des Arkustangens konvergiert nur für x P [ −1, 1 ]. Zeigen Sie, dass arctan(x −1 ) = sgn(x) π/2 − arctan(x) für alle x ≠ 0, und beschreiben Sie, wie sich mit Hilfe dieses Ergebnisses der Wert arctan(x) für ein beliebiges x P R approximativ berechnen lässt. Einführung in die Mathematik 1 © Oliver Deiser 4. Monotonie und Krümmung Das übergeordnete Thema dieses Kapitels ist die Kurvendiskussion, die zu den prominentestes Anwendungen der Differentialrechnung gehört. Wir untersuchen (a) Monotonieverhalten (b) lokale Extremwerte (Hoch- und Tiefpunkte) (c) Krümmungseigenschaften (Links- und Rechtskrümmung, Krümmungskreise) (d) Nullstellen einer auf einem Intervall definierten hinreichend oft differenzierbaren reellen Funktion. Viele Ergebnisse haben Eingang in die Mathematik des Gymnasiums gefunden, sodass wir auf Schulwissen aufbauen können. © Oliver Deiser Einführung in die Mathematik 1 194 2. Abschnitt Der analytische Kalkül Kritische Punkte und lokale Extrema Neben der Ermittlung der Nullstellen einer reellen Funktion f : P → R ist die Ermittlung von lokalen Maxima und Minima von großer Bedeutung. Weiß man, dass eine Funktion den Wert c annimmt und dass alle Funktionswerte kleineroder größergleich c sind, so ist die Suche nach einer Stelle x, an der f den Extremwert c annimmt, gleichbedeutend mit dem Finden einer Nullstelle der Funktion f − c. In der Regel ist aber ein derartiger Extremwert nicht bekannt, sodass das Auffinden einer Extremalstelle x zunächst keine Nullstellensuche auf den Plan ruft. Dies ändert sich, wenn wir f als differenzierbar voraussetzen: An einer Extremalstelle x hat f eine waagrechte Tangente, sodass x eine Nullstelle der Ableitung von f ist. Wir suchen also ein x mit f ′(x) = 0. Ist f ein Polynom, so ist diese Aufgabe sogar einfacher als die Suche einer Nullstelle von f, da sich der Grad von f beim Differenzieren verringert. Leider sind Nullstellen der Ableitung nicht in allen Fällen Extremalstellen: Die streng monoton steigende Funktion x3 besitzt zum Beispiel im Nullpunkt die Ableitung 0, hat dort aber kein Extremum. Wir müssen also unter allen Nullstellen von f ′ die − im Hinblick auf das Problem − guten von den schlechten aussortieren. Dies geschieht durch eine Untersuchung des Monotonieverhaltens von f in der Umgebung von x, das sich aus dem Vorzeichenverhalten von f ′ ergibt; alternativ können wir die zweite Ableitung heranziehen. Insgesamt können wir mit den Methoden der Differentialrechnung alle lokalen Maxima und Minima von f ermitteln und unter diesen dann im Fall der Existenz den größen und kleinsten angenommenen Wert suchen (das globale Maximum bzw. Minimum von f ). Wir diskutieren diese Zusammenhänge im Folgenden in kompakter Form. Die Beweise der anschaulichen Sätze werden in der Analysis geführt. 4 f 2 -3 -2 -1 1 2 3 -2 Wir suchen die lokalen Maxima und Minima von f im Intervall [ −3, 3 ]. Hier und in den folgenden Diagrammen ist f das Polynom x5 /6 − x3 + x + 2. Einführung in die Mathematik 1 © Oliver Deiser 4. Monotonie und Krümmung 195 Zunächst präzisieren wir einige Begriffe. Definition (kritischer Punkt) Sei f : P → R differenzierbar, und sei p P P mit f ′(p) = 0. Dann heißt p ein kritischer Punkt von f. Die genauen Definitionen im Umfeld von Extremwerten sind oft recht schwerfällig. Um die Sprechweise zu erleichtern, definieren wir: Definition (links und rechts von einer Stelle) Sei f : P → R, und sei p P P. Wir sagen, dass f eine Eigenschaft %(x) links der Stelle p erfüllt, falls gilt: ∃ε > 0 ∀x P ] p − ε [ ∩ P %(x). Analog erfüllt f die Eigenschaft %(x) rechts der Stelle p, falls gilt: ∃ε > 0 ∀x P ] p + ε [ ∩ P %(x). „Links von p“ “ heißt also anschaulich genauer „in einem kleinen Bereich links von p“. Ist p der linke Randpunkt des Definitionsbereichs von f, so ist der Begriff nicht von Interesse; rein logisch ist %(x) dann für alle Eigenschaften richtig. Analoges gilt für „rechts von p“. Beispiel Die Sinusfunktion ist negativ links der Null und positiv rechts der Null. Zudem ist sie links und rechts der Null streng monoton steigend. Damit können wir nun definieren: Definition (lokales Extremum, Hochpunkt, Tiefpunkt) Sei f : P → R, und sei p P P. Dann besitzt f an der Stelle p ein (a) lokales Maximum, falls f ≤ f(p) links und rechts von p, (b) lokales Minimum, falls f ≥ f(p) links und rechts von p, (c) lokales Extremum, falls f in p ein lokales Maximum oder Maximum besitzt. Ist p eine lokale Maximalstelle (Minimalstelle) von f, so heißt der Punkt (p, f(p)) ein lokales Maximum (Minimum) oder ein Hochpunkt (Tiefpunkt) von f. Gilt < bzw. > statt ≤ bzw. < in (a) oder (b), so heißen die Extrema strikt. Wir beschränken uns ab jetzt auf Intervalle als Definitionsbereiche. Funktionen wie 1/x können in auf Intervallen definierte Funktionen zerlegt werden. Konvention Im Folgenden sei I stets ein reelles Intervall (beliebiger Art). © Oliver Deiser Einführung in die Mathematik 1 196 2. Abschnitt Der analytische Kalkül Lokale Extrema sind oft − aber nicht immer − mit einem Wechsel des Monotonieverhaltens verbunden. Ein derartiger Wechsel kann mit Hilfe des Vorzeichens der ersten Ableitung ermittelt werden: Satz (Monotoniesatz) Sei f : I → R differenzierbar. Dann gilt: (a) f ′ ≥ 0 genau dann, wenn f ist monoton steigend. (b) f ′ ≤ 0 genau dann, wenn f ist monoton fallend. (c) f ′ > 0 impliziert f ist streng monoton steigend. (d) f ′ < 0 impliziert f ist streng monoton fallend. 4 2 f(x) f (x) -3 -2 -1 1 2 3 -2 4 2 f(x) f (x) -3 -2 -1 1 2 3 -2 Das Vorzeichen von f ′ spiegelt das Monotonieverhalten von f Einführung in die Mathematik 1 © Oliver Deiser 4. Monotonie und Krümmung 197 Die streng monotonen Funktionen x3 und −x3 zeigen, dass die Umkehrungen in (c) und (d) nicht gelten. Sie gelten aber „fast“ in dem Sinne, dass die Ableitung einer streng monotonen Funktion nur an einzelnen Punkten gleich 0 sein kann. Aus der Definition der Ableitung und dem Monotoniesatz gewinnen wir: Satz (Extremwertbestimmung) Sei f : I → R und p P I. Dann gilt unter entsprechenden Differenzierbarkeitsvoraussetzungen: (a) Ist p kein Randpunkt von I und besitzt f in p ein lokales Extremum, so ist p ein kritischer Punkt von f. (b) Ist f ′ > 0 links von p und f ′ < 0 rechts von p, so besitzt f in p ein striktes lokales Maximum. (c) Ist f ′ < 0 links von p und f ′ > 0 rechts von p, so besitzt f in p ein striktes lokales Minimum. (d) Ist f ′(p) = 0 und f ″(p) < 0, so besitzt f in p ein striktes lokales Maximum. (e) Ist f ′(p) = 0 und f ″(p) > 0, so besitzt f in p ein striktes lokales Minimum. Beweis Wir zeigen (a). Es gelte f ′(p) = limx → p (f(x) − f(p))/(x − p) > 0. Da p nicht das Maximum von I ist, gibt es ein x > p in I, für das der Zähler des Differenzenquotienten positiv ist. Also ist p kein lokales Maximum von f. Ebenso gibt es ein x < p in I, für das der Zähler negativ ist, sodass p kein lokales Minimum von f ist. Analog argumentieren wir im Fall f ′(p) < 0. Die Beweise der anderen Aussagen mit Hilfe des Monotoniesatzes seien dem Leser zur Übung überlassen. 4 2 f(x) f (x) -3 -2 -1 1 2 3 f (x) -2 © Oliver Deiser Einführung in die Mathematik 1 198 2. Abschnitt Der analytische Kalkül Wir betrachten noch einige stark oszillierende Funktionen, die zeigen, dass lokale Extrema komplizierter sein können als man denken könnte: (a) Ein lokales Extremum ist nicht notwendig mit einem Wechsel des Monotonieverhaltens verbunden. (b) Es kann unendlich viele Extrema in einem beschränkten Intervall geben. (c) Ein nicht striktes lokale Extremum bedeutet nicht immer, dass die Funktion links und rechts der Stelle konstant ist. 0.025 f 0.020 0.015 0.010 0.005 -0.10 -0.05 0.00 0.05 0.10 f : R → R mit f(x) = x2 (2 + sin(1/x)) für x ≠ 0 und f(0) = 0. Die Funktion f ist differenzierbar mit f ′(0) = 0, besitzt bei 0 ein striktes (globales) Minimum, ist aber links und rechts der 0 nicht monoton. Das Minimum kann mit Teil (b) des Satzes nicht identifiziert werden. 2 1 -0.4 -0.2 0.2 0.4 f' -1 -2 Die erste Ableitung von f ist unstetig im Nullpunkt. Die zweite Ableitung f ″(0) existiert nicht, sodass Teil (d) des Satzes nicht anwendbar ist. Einführung in die Mathematik 1 © Oliver Deiser 4. Monotonie und Krümmung 199 0.020 g 0.015 0.010 0.005 -0.10 -0.05 0.00 0.05 0.10 g : R → R mit f(x) = x2 (1 + sin(1/x)) für x ≠ 0 und g(0) = 0. Die Funktion besitzt an der Stelle 0 ein nicht striktes lokales Minimum, ist aber links und rechts der 0 nicht konstant. 0.10 0.05 -0.10 -0.05 0.05 0.10 -0.05 h -0.10 h : R → R mit h(x) = x (1 + 10 x sin(1/x)) für x ≠ 0 und h(0) = 0. Die Funktion h ist differenzierbar mit h′(0) > 0, aber h ist links und rechts der Null nicht monoton steigend. Dies zeigt, dass ein einziger Punkt mit einer positiven Ableitung in Teil (c) des Monotoniesatzes nicht genügt. © Oliver Deiser Einführung in die Mathematik 1 200 2. Abschnitt Der analytische Kalkül Das Krümmungsverhalten Neben Monotonie und Extrema ist vor allem die Krümmung einer Funktion von Interesse. Sie wird durch die Lage der Funktion bzgl. ihrer Sekanten beschrieben: Definition (konvex, konkav) Sei f : I → R. Dann heißt f konvex (konkav), falls für alle a < b in I gilt: f ist auf ] a, b [ kleinergleich (größergleich) der Geraden durch (a, f(a)) und (b, f(b)). Gilt < (>) statt ≤ (≥) so heißt f streng konvex (streng konkav). Neben den international üblichen Begriffen konvex und konkav spricht man im Deutschen anschaulich auch von linksgekrümmten bzw. rechtsgekrümmten Funktionen. Die Richtung entspricht dem Abfahren des Graphen von f von −∞ nach ∞. 8 6 4 2 -3 -2 -1 1 2 3 Die Einheitsparabel x2 ist streng konvex. Sie liegt unterhalb jeder Strecke, die zwei ihrer Punkte miteinander verbinden. Beispiele Die Exponentialfunktion exp ist streng konvex. Die Quadratwurzelfunktion ist streng konkav. Die Identität x ist konvex und konkav. Die Funktion x3 ist weder konvex noch konkav. Ist die Funktion f konvex, so ist −f konkav und umgekehrt. Bei der Untersuchung der Krümmung können wir uns also auf einen Typ konzentrieren. Einführung in die Mathematik 1 © Oliver Deiser 4. Monotonie und Krümmung 201 Das Krümmungsverhalten einer Funktion verhält sich zur zweiten Ableitung so wie das Monotonieverhalten zur ersten Ableitung: Satz (zweite Ableitung und Krümmung) Sei f : I → R zweimal differenzierbar. Dann gilt: (a) f ″ ≥ 0 genau dann, wenn f ist konvex. (b) f ″ > 0 impliziert f ist streng konvex. (c) f ″ ≤ 0 genau dann, wenn f ist konkav. (d) f ″ < 0 impliziert f ist streng konkav. Ein Wechsel im Monotonieverhalten markiert ein lokales Extremum. Analog markiert ein Wechsel im Krümmungsverhalten einen Wendepunkt: Definition (Wendepunkt) Sei f : I → R stetig und p P I. Dann besitzt f an der Stelle p einen Wendepunkt, falls f links und rechts von p ein unterschiedliches Krümmungsverhalten aufweist, d. h. dort konkav bzw. konvex ist oder umgekehrt. Gilt zudem f ′(p) = 0, so besitzt f an der Stelle p einen Terassenpunkt. Der Arkustangens hat zum Beispiel bei 0 eine Wendestelle. Die Funktion x3 weist dort einen Terassenpunkt auf. Besitzt eine zweimal differenzierbare Funktion f in p einen Wendepunkt, so gilt notwendig f ″(p) = 0. Die Wendepunkte sind also unter den Nullstellen der zweiten Ableitung von f zu suchen. 4 2 f(x) f (x) -3 -2 -1 1 2 3 f (x) -2 Wendepunkte und zugehörige Tangenten unseres Polynoms f. In den vier durch die Wendestellen definierten Intervallen ist f rechts-, links, rechts bzw. links gekrümmt. © Oliver Deiser Einführung in die Mathematik 1 202 2. Abschnitt Der analytische Kalkül Krümmungskreise Die zweite Ableitung einer Funktion f spiegelt die Änderung des Steigungsverhaltens von f wider. Eine Änderung des Steigungsverhaltens bewirkt anschaulich eine Änderung der Krümmung des Graphen von f. Dass f ″(p) kein direktes Maß für die Krümmung von f an der Stelle p ist, zeigen zum Beispiel die Einheitsparabel oder der Kreisbogen £1 − x2 auf ] −1, 1 [: Die Parabel ist anschaulich nicht konstant gekrümmt, hat aber eine konstante zweite Ableitung. Und für den Kreisbogen ist es genau umgekehrt. Ein Maß für die Krümmung von f an der Stelle p erhalten wir, indem wir an den Graphen von f einen Kreis anlegen, der durch den Punkt (p, f(p)) verläuft und dort die Funktion f möglichst gut approximiert (der Leser vgl. Tangenten und Schmiegeparabeln). Einem Kreis mit Radius r ordnen wir die Krümmung 1/ r zu, da die Krümmung mit größeren Radien abnehmen soll. Hat also der approximierende Kreis den Radius r, so soll f an der Stelle p die Krümmung ±1/r zugeordnet werden, je nachdem, ob f links- oder rechtsgekrümmt ist. Der Kreismittelpunkt liegt entsprechend auf der linken bzw. rechten Seite von f. f M(r) r f(p) p Wir konstruieren den Punkt M(r) auf der Senkrechten der Tangente durch (p, f(p)) so, dass sich der Kreis mit Mittelpunkt M(r) und Radius r bestmöglich an f anschmiegt. Zur Berechnung des besten Radius nehmen wir f als konvex an und setzen v = (1, f ′(p)), c = £1 + f ′(p)2 , w = 1/c rotπ/2 (v) = 1/c (−f ′(p), 1). Der Vektor w hat die Länge 1 und er steht senkrecht auf dem Richtungsvektor v der Tangente von f an der Stelle p. Wir setzen nun Einführung in die Mathematik 1 © Oliver Deiser 4. Monotonie und Krümmung 203 M(r) = (xr , yr ) = (p, f(p)) + r w für alle r > 0. Die Aufgabe ist, r so einzustellen, dass sich der Kreis K(r) mit Mittelpunkt M(r) und Radius r bestmöglich an f im Punkt (p, f(p)) anschmiegt. Wir stellen hierzu die untere Hälfte von Kr die Funktion gr : I(r) → R dar mit gr (x) = yr − £r 2 − (x − xr )2 für alle x P I(r) = ] xr − r, xr + r [. Die Funktion gr stimmt für alle r > 0 an der Stelle mit f(p) überein. Weiter gilt gr ′(x) = − x − xr für alle x P I(r). £r − (x − xr )2 2 Wegen p − xr = r/c f ′(p) und c2 − f ′(p)2 = 1 gilt also gr (p)′ = f ′(p) für alle r > 0. Bis jetzt sind also alle Radien gleich gut. Den gesuchten optimalen Radius erhalten wir, indem wir gr ″(p) = f ″(p) fordern. Die Funktion hat dann an der Stelle p die Krümmung 1/r des Halbkreises gr . Ausrechnen liefert den erfreulich überschaubaren Wert f ″(p) = gr ″(p) = r2 ( r2 − (p − xr )2 )3/2 = c3 . r Im Fall f ″(p) ≠ 0 erhalten wir also r = c3 /f ″(p) und r ( −f ′(p), 1 ) = ( p, f(p) ) + c M(r) = ( p, f(p) ) + c2 ( −f ′(p), 1 ). f ″(p) Im Fall f ″(p) = 0 erhalten wir keinen Krümmungsradius, die Funktion ist in diesem Fall an der Stelle p nicht gekrümmt. Im Fall einer konkaven (rechtsgekrümmten) Funktion verfahren wir analog, wobei wir nun v im Uhrzeigersinn drehen, da der gesuchte Kreismittelpunkt rechts von f liegt. Wir erhalten f ″(p) = −c3 /r. Die rechte Seite der Formel für den Mittelpunkt M(r) bleibt gleich, da f ″(p) im Nenner negativ ist. Diese Überlegungen motivieren: Definition (Krümmung, Krümmungsradius, Krümmungskreis) Sei f : P → R zweimal differenzierbar, und sei p P P. Weiter sei c = £1 + f ′(p)2 . Dann ist die Krümmung κ und im Fall f ″(p) ≠ 0 der Krümmungsradius r und der Krümmungskreismittelpunkt M von f an der Stelle p definiert durch κ = f ″(p) , c3 r = 1 κ = c3 , M = ( p, f(p) ) + |f ″(p)| c2 ( −f ′(p), 1 ). f ″(p) In den Krümmungsradius geht neben der zweiten Ableitung f ″(p) also auch die erste Ableitung f ′(p) ein. © Oliver Deiser Einführung in die Mathematik 1 204 2. Abschnitt Der analytische Kalkül 2. 1.5 1. x2 g(x) 0.5 -1.0 -0.5 0.5 1.0 Krümmungskreise der Einheitsparabel an den Stellen p = 0, 1/4, 1/2. Die Krümmungskreismittelpunkte (Evolute) durchlaufen die Funktion g mit g(x) = 1/2 + 3/4 3 £4x2 . 5 4 3 2 1 -2 - 2 -1 -2 -3 -4 Krümmungskreise des Kosinus an den Stellen p = −π, −π/8, 3/4π Die Evolute lässt sich nicht mehr als Funktion darstellen. Einführung in die Mathematik 1 © Oliver Deiser 4. Monotonie und Krümmung 205 Zur Illustration der Formeln zeichnen wir noch die Krümmung κ = κf als Funktion für einige f, d. h. es gilt κ(x) = f ″(x)/(1 + f ′(x)2 )3/2 . 6 5 4 x2 3 (x) = 2 4 x2 +1 3/2 2 1 -3 -2 -1 0 1 2 3 1.0 0.5 cos(x) -2 - 2 (x) = - cos(x) sin2 (x)+1 3/2 -0.5 -1.0 1.4 1.2 1.0 x 0.8 (x) = 0.6 x 1+ 2 x 3/2 0.4 0.2 -3 -2 -1 0 1 2 3 Die κ-Funktion der Exponentialfunktion nimmt ihr Maximum an der Stelle p = − log(2)/2 an. Es gilt κ(p) = 2/(3£3). © Oliver Deiser Einführung in die Mathematik 1 206 2. Abschnitt Der analytische Kalkül Die dritte Ableitung Den Nullstellen der ersten und zweiten Ableitung einer Funktion f konnten wir eine geometrisch anschauliche Bedeutung zuweisen: (a) Lokale Extremalstellen von f sind Nullstellen von f ′. (b) Wendepunkte von f sind Nullstellen von f ″. Es stellt sich die Frage, ob eine ähnliche Interpretation auch für die dritte Ableitung möglich ist. Krümmungskreise sind hierzu weniger geeignet, da in den Krümmungsradius die erste Ableitung eingeht. Für die Schmiegeparabel g : R → R von f an der Stelle p gilt g(x) = f(x) + f ′(p) (x − p) + f ″(p)/2 (x − p)2 für alle x P R. Die erste Ableitung geht ein, aber nicht in die Öffnung der Parabel, die gleich der Hälfte der zweiten Ableitung von f ist. An Extremalstellen von f ″ haben die Schmiegeparabeln von f also eine maximale oder minimale Öffnung, sodass sie dort besonders eng oder weit verlaufen. Diese Extremalstellen sind Nullstellen der dritten Ableitung von f. Damit haben wir: (c) Stellen mit extremalen Schmiegeparabelöffnungen sind Nullstellen von f (3) . Analoge Überlegungen gelten für die Taylor-Polynome höherer Ordnung. Auch eine dynamische Interpretation ist möglich. Aus zeitlicher Sicht geben f ′(t) und f ″(t) die Geschwindigkeit und die Beschleunigung eines sich eindimensional in der Zeit t bewegenden Punktes wieder. Die dritte Ableitung f (3) (t) kann als Ruck (engl. jerk oder surge) aufgefasst werden. 8 6 4 f(x) 2 f (x) f (x) -3 -2 -1 1 2 3 f (3) (x) -2 -4 -6 Schmiegeparabeln unseres Polynoms f an den Nullstellen der dritten Ableitung Einführung in die Mathematik 1 © Oliver Deiser 4. Monotonie und Krümmung 207 Nullstellensuche Wir haben gesehen, dass viele Anwendungen der Differentialrechnung die Bestimmung von Nullstellen erfordern. In expliziter Form ist dies nur für sehr einfache Funktionen möglich. Bereits für Polynome fünften Grades existiert keine allgemeine Lösungsformel. Wir müssen uns also in vielen Fällen mit Näherungsverfahren begnügen. Ist f : P → R eine Funktion mit mindestens einer Nullstelle, so produziert ein derartiges Verfahren ausgehend von einem Startwert x0 P P eine Folge x0 , x1 , x2 , …, xn , … von Elementen von P, die gegen eine Nullstelle der Funktion konvergiert, d. h. es gilt f(x*) = 0 für x* = limn xn . Gute Verfahren konvergieren zudem schnell, d.h. die Abstände |x* − xn | zwischen der Nullstelle und den Approximationen xn konvergieren schnell gegen 0. Ein Verfahren, das ganz ohne Methoden der Differentialrechnung auskommt, beruht auf dem Zwischenwertsatz: Satz (Zwischenwertsatz) Sei f : [ a, b ] → R eine stetige Funktion. Dann nimmt f jeden Wert zwischen f(a) und f(b) an. Insbesondere besitzt f eine Nullstelle, wenn f(a) und f(b) verschiedene Vorzeichen haben. Ist f : [a, b] → R mit sgn(f(a)) ≠ sgn(f(b)), so liefert das folgende Verfahren eine Nullstelle von f. Zudem lässt es sich als konstruktiver Beweis des Zwischenwertsatzes lesen. Bisektionsverfahren Sei f : [ a, b ] → R stetig mit sgn(f(a)) ≠ sgn(f(b)) und f(a), f(b) ≠ 0. Wir setzen (x0 , y0 ) = (a, b). Nun definieren wir rekursiv xn , yn , cn wie folgt: Ist (xn , yn ) konstruiert, so setzen wir cn = (xn + yn )/2. Ist f(cn ) = 0, so stoppen wir mit Ausgabe von cn . Andernfalls setzen wir (xn + 1 , yn + 1 ) = { (xn , cn ) (cn , yn ) falls falls sgn(f(xn )) ≠ sgn(f(cn )) sgn(f(cn )) ≠ sgn(f(yn )). In jedem Schritt halbieren wir also das betrachtete Intervall unter Wahrung der „guten Voraussetzung“ der unterschiedlichen Vorzeichen. Das Verfahren stoppt mit einer Nullstelle cn = (xn + yn )/2 von f oder es produziert eine Folge (xn , yn ) mit limn xn = limn yn = limn cn = x* und f(x*) = 0. Der Beweis von f(x*) = 0 benutzt die Stetigkeit von f: Die Funktionswerte f(xn ) haben alle das gleiche Vorzeichen s1 , die Funktionswerte f(yn ) alle das gleiche Vorzeichen s2 . Nach Konstruktion gilt s1 ≠ s2 . Sei s1 = −1 und s2 = 1. Aus Stetigkeitsgründen gilt f(x*) = limn f(xn ) ≤ 0 und f(x*) = limn f(yn ) ≥ 0, sodass f(x*) = 0. Analoges gilt, wenn s1 = 1 und s2 = −1. © Oliver Deiser Einführung in die Mathematik 1 208 2. Abschnitt Der analytische Kalkül f a c0 c1 c2 c4 c3 b Die ersten Stellen c0 , c1 , c2 , … eines Bisektionsverfahrens Ein berühmtes Verfahren der Nullstellensuche beruht auf dem folgenden anschaulichen Satz: Satz (Nullstellensatz für konvexe Funktionen) Sei f : [ a, b ] → R differenzierbar und streng konvex mit f(a) < 0 < f(b). Dann gilt: (a) f besitzt eine eindeutige Nullstelle x*. (b) f < 0 auf [ a, x* [ , f > 0 auf ] x*, b ], f ′ > 0 auf [ x*, b ]. Eine analoge Aussage gilt für den Fall f(a) > 0 > f(b). Das Newton-Verfahren findet die Nullstelle x* durch wiederholtes Anlegen von Tangenten. Ist x0 > x*, so liegt die Tangente g(x) = f(x0 ) + f ′(x0 ) (x − x0 ) von f an der Stelle x0 aufgrund der Konvexität von f unterhalb von f. Sie schneidet die x-Achse an der Stelle x1 = x0 − f(x0 ) . f ′(x1 ) Es gilt x* < x1 < x0 , sodass x1 näher an x* liegt als x0 . Diese Beobachtung motiviert: Einführung in die Mathematik 1 © Oliver Deiser 4. Monotonie und Krümmung 209 Newton-Verfahren Sei f : [ a, b] → R differenzierbar und streng konvex mit sgn(f(a)) ≠ sgn(f(b)). Wir setzen x0 = { b a f(a) < 0 < f(b) f(b) < 0 < f(a). falls falls Nun definieren wir xn rekursiv durch xn + 1 = xn − f(xn ) f ′(xn ) für alle n ≥ 0. f x3 x2 x1 x0 Die ersten Stellen einer Newton-Iteration x0 , x1 , x2 , … Die Folge x0 , x1 , x2 , … wird auch als Newton-Iteration von f (zum Startwert x0 ) bezeichnet. Man kann wie erwartet zeigen, dass sie im Fall x0 = b streng monoton fallend und im Fall x0 = a streng monoton steigend gegen die eindeutige Nullstelle x* von f konvergiert. Analoge Ergebnisse gelten für streng konkave Funktionen. Durch Übergang von f zu −f können wir aber immer Konvexität erreichen, ohne die Nullstelle zu verändern. Das Newton-Verfahren eignet sich insbesondere zur Berechnung von Wurzeln. Seien also k ≥ 1 und c > 0. Wir berechnen x* = k £c. Hierzu wählen wir ein beliebiges b mit b > x*, etwa b = max(2, c). Dann ist x* die eindeutige Nullstelle der streng konvexen Funktion f : [ 0, b ] → R mit f(x) = xk − c © Oliver Deiser für alle x P [ 0, b ]. Einführung in die Mathematik 1 210 2. Abschnitt Der analytische Kalkül Die Newton-Iteration von f zum Startwert x0 = b ist gegeben durch xn + 1 = xn − xnk − c k xnk − 1 für alle n ≥ 0. Es gilt x* = limn xn . Speziell können wir eine Quadratwurzel x* = £c mit einem beliebigen Startwert x0 > x* approximativ durch xn + 1 = xn − x2n − c 2 xn xn + c/xn 2 = für alle n ≥ 0 berechnen. Diese lange vor Newton bekannte Rekursion ist auch als Heron-Verfahren bekannt. Ein Vergleich der beiden Verfahren Wir berechnen £2 = 1, 41421 35623 73095 04880 16887 24209 … mit Hilfe des Bisektions- und des Newton-Verfahrens. Wir verwenden wieder die Funktion f : [ 0, 2 ] → R mit f(x) = x2 − 2. Die beiden folgenden Tabellen zeigen die ersten Approximationen. Auf einen Kommentar dürfen wir verzichten… Newton/Heron-Verfahren zur Berechnung von £2 n xn als Bruch xn numerisch 0 2 2 1 3 2 1,5 2 17 12 1, 41666 … 3 577 408 1, 41421 56862 … 4 665857 470832 1, 41421 35623 74689 … 5 886731088897 627013566048 Einführung in die Mathematik 1 1, 41421 35623 73095 04880 16896 … © Oliver Deiser 4. Monotonie und Krümmung 211 Bisektionsverfahren zur Berechnung von £2 n cn als Bruch cn numerisch 0 1 1 1 3 2 1,5 2 5 4 1,25 3 11 8 1,375 4 23 16 1,4375 5 45 32 1,40625 © Oliver Deiser Einführung in die Mathematik 1 212 2. Abschnitt Der analytische Kalkül Übungen Übung 1 Zeigen Sie, dass die Funktion f : ] 0, ∞ [ → R mit f(x) = (1 + 1/x)x für alle x > 0 streng monoton steigend ist. Übung 2 Sei I ein reelles Intervall, und sei f : I → R differenzierbar. Wir nennen f quasipositiv, falls gilt (a) f(x) ≥ 0 für alle x P I. (b) es gibt kein Teilintervall [ a, b ] von I mit f(x) = 0 für alle x P [ a, b ]. Geben Sie Beispiele und Gegenbeispiele für diese Eigenschaft an. Begründen Sie zudem folgende Äquivalenz anschaulich oder beweisen Sie sie: f ist quasipositiv genau dann, wenn f ist streng monoton steigend. Formulieren Sie eine analoge Äquivalenz für streng monoton fallende Funktionen. Übung 3 Beweisen Sie die Aussagen (b) − (d) des Satzes über Extremwertbestimmung. Übung 4 In der Aussage (a) des Satzes über Extremwertbestimmung ist die Voraussetzung, dass p kein Randpunkt von I ist, wesentlich. Illustrieren Sie dies durch Beispiele. Wo geht diese Voraussetzung in den Beweis ein? Übung 5 Geben Sie ein Beispiel für eine beliebig oft differenzierbare Funktion f und eine lokale Maximalstelle p von f, für die (b) des Satzes über Extremwertbestimmung anwendbar ist, (d) jedoch nicht. Übung 6 Sei I ein offenes Intervall und f : P → I beliebig oft differenzierbar. Weiter seien p P I und n ≥ 1 derart, dass f (k) (p) = 0 für 1 ≤ k < n aber f (n) (p) ≠ 0 gilt. Wann besitzt f an der Stelle p ein lokales Maximum, wann ein lokales Minimum, wann kein lokales Extremum? Übung 7 Sei I ein Intervall und f : I → R stetig und streng monoton steigend oder streng monoton fallend. Welche Implikationen bestehen zwischen der Konvexität/Konkavität von f und f − 1 ? Formulieren Sie allgemeine Aussagen und geben Sie instruktive Beispiele an. Einführung in die Mathematik 1 © Oliver Deiser 4. Monotonie und Krümmung 213 Übung 8 Mit den Funktionen und Bezeichnungen wie bei der Herleitungen des Krümmungsradius: Verifizieren Sie, dass gr ″(p) = c3 . r Übung 9 Zeigen Sie, dass die Krümmungskreismittelpunkte der Einheitsparabel der Graph der Funktion g: R → R sind mit g(x) = 1/2 + 3/4 3 £4x2 für alle x P R. Übung 10 Bestimmen Sie die Menge der Krümmungskreismittelpunkte der Kosinusfunktion. © Oliver Deiser Einführung in die Mathematik 1 5. Integration Mit den Ableitungsregeln steht uns ein systematischer Kalkül zur Verfügung, mit dessen Hilfe wir die Ableitung einer gegebenen elementaren Funktion effektiv bestimmen können. Nun betrachten wir das umgekehrte Problem: Wie findet man, gegeben eine Funktion f, eine Funktion F mit F′ = f ? Dieses Problem des Auffindens einer Stammfunktion oder eines unbestimmten Integrals erweist sich als überraschend komplex. Weiter ist es eng mit dem geometrischen Problem der Berechnung von durch Funktionsgraphen definierten Flächen verbunden (Berechnung von bestimmten Integralen). In diesem Kapitel definieren wir die grundlegenden Konzepte, die mit diesen Fragen verbunden sind, einschl. des Hauptsatzes der Differential- und Integralrechnung. Der Frage der effektiven Berechnung von Integralen wenden wir uns im nächsten Kapitel zu. © Oliver Deiser Einführung in die Mathematik 1 216 2. Abschnitt Der analytische Kalkül Stammfunktionen Definition (Stammfunktion) Sei f : P → R. Dann heißt eine Funktion F : P → R eine Stammfunktion von f, falls F′ = f. Wir möchten zu einer gegebenen Funktion eine Stammfunktion finden. Für einfache Funktionen wie Polynome ist dies noch leicht möglich, aber im Allgemeinen ist diese Aufgabe weitaus schwieriger als das Problem der Bestimmung der Ableitung. Der Leser denke etwa an Funktionen wie f = log oder f = log + log, für die eine Stammfunktion nicht unmittelbar ersichtlich ist. Weiter zeigen Funktionen wie 1/x und 1/(1 + x2 ), dass relativ einfache Funktionen komplizierte Stammfunktionen besitzen können (in diesem Fall die Funktionen log und arctan). Während die Ableitung einer rationalen Funktion stets wieder eine rationale Funktion darstellt, ist eine Stammfunktion einer rationalen Funktion im Allgemeinen keine rationale Funktion mehr. Anders formuliert: Stammfunktionen rationaler Funktionen müssen auch außerhalb der rationalen Funktionen gesucht werden. Analog wird sich zeigen, dass nicht jede elementare Funktion eine elementare Stammfunktion besitzt. Damit müssen Stammfunktionen elementarer Funktionen auch außerhalb der elementaren Funktion gesucht werden. Zwei wichtige Beobachtungen sind: (1) Ist F eine Stammfunktion von f und c P R, so ist auch F + c eine Stammfunktion von f. (2) Sind F und G Stammfunktionen von f, so gilt (F − G)′ = f − f = 0, sodass ein c P R existiert mit F − G = c. Kurz: Eine Stammfunktion ist nur bis auf eine Konstante eindeutig bestimmt. 2 1 f(x) F1 (x) F2 (x) -2 -1 1 2 F3 (x) -1 Drei Stammfunktionen einer Funktion f Einführung in die Mathematik 1 © Oliver Deiser 5. Integration 217 Das Riemann-Integral Das Problem des Auffindens einer Stammfunktion ist eng verknüpft mit einer auf den ersten Blick ganz anderen Fragestellung: Wie bestimmt man den signierten Inhalt der Fläche, die eine auf einem Intervall [ a, b ] definierte reellwertige Funktion f mit der x-Achse einschließt? Signiert (vorzeichenbehaftet) bedeutet dabei, dass Flächenanteile unterhalb der x-Achse negativ zählen. Dies ermöglicht die folgende Sicht: Signierte Flächen als Mittelwerte Ist f : [ a, b ] → R auf einem Intervall der Länge 1 definiert, so ist der signierte Flächeninhalt c anschaulich der Mittelwert der Funktion f, denn die Funktion g : [ a, b ] → R mit konstantem Wert c definiert den gleichen signierten Flächeninhalt wie die Funktion f, nämlich 1 ⋅ c. Ist allgemeiner [ a, b ] ein Intervall der Länge m > 0, so ist der signierte Flächeninhalt c das m-fache des Mittelwerts von f. Damit lässt sich die geometrische Fragestellung der Flächenbestimmung in die Fragestellung der Mittelwertbildung übersetzen und umgekehrt: Signierte Fläche = Mittelwert mal Intervall-Länge. 1.0 0.5 f(x) c 0.2 0.4 0.6 0.8 1.0 -0.5 -1.0 Die signierte Fläche als Mittelwert c einer Funktion f : [ 0, 1 ] → R Der Zusammenhang zwischen dem Problem der Flächenbestimmung und dem Problem des Auffindens einer Stammfunktion ist schwieriger zu begründen. Wir werden diesen Zusammenhang im Hauptsatz der Differential- und Integralrechnung genau angeben und verschiedene Argumente diskutieren. Vorerst stellen wir aber die Stammfunktionen zurück und das Problem der signierten Flächenbestimmung (gleichwertig: Mittelwertbildung) an die Spitze. © Oliver Deiser Einführung in die Mathematik 1 218 2. Abschnitt Der analytische Kalkül Für eine Funktion f : [ a, b ] → R definieren wir I ba f = * a b f = * b f(x) dx = „signierter Flächeninhalt von f “. a Die so definierte reelle Zahl I ba nennen wir auch das (bestimmte) Integral über f (von a bis b). Approximation durch Riemann-Summen Wenn wir den Inhalt einer Fläche der Ebene nicht als gegebenen Begriff voraussetzen wollen, können wir das Integral durch eine Approximation über Rechtecksflächen (deren Flächeninhalt elementar bekannt ist) und eine Grenzwertbildung erklären. Hierzu definieren wir: Definition (Partition, Zerlegungspunkt, Stützstellen, Feinheit, äquidistant) Sei [ a, b ] ein reelles Intervall. Eine Folge p = (tk , xk )k ≤ n heißt eine Partition von [ a, b ] der Länge n + 1, falls gilt a = t0 ≤ x0 ≤ t1 ≤ x1 ≤ … ≤ tn ≤ xn ≤ b. Wir nennen die Zahlen tk auch die Zerlegungspunkte und die Zahlen xk die Stützstellen der Partition. Weiter setzen wir tn + 1 = b und nennen δ(p) = maxk ≤ n (tk + 1 − tk ) die Feinheit der Partition. Die Partition heißt äquidistant, falls tk + 1 − tk für alle k ≤ n gleich ist. Beispiel Wir betrachten das Intervall [ a, b ] = [ 0, 1 ] und setzen tk = xk = k/10 für alle 0 ≤ k ≤ 9. Dann ist p = (tk , xk )k ≤ n eine Partition von [ 0, 1 ] der Länge 10. Nach unserer Konvention ist t10 = b = 1, sodass die Zerlegungspunkte 0 = t0 , t1 , …, t9 , t10 = 1 das Intervall [ 0, 1 ] in 10 Teilintervalle zerlegen. Die Länge einer Partition ist damit gleich der Anzahl der erzeugten Teilintervalle. Die Partition p ist äquidistant und besitzt die Feinheit δ = 1/10. Da die Stützstellen xk mit den linken Intervallgrenzen der Teilintervalle [ tk , tk +1 ] zusammenfallen, sagen wir auch, dass die Partition linksseitige Stützstellen besitzt. Setzen wir dagegen xk = tk + 1 für alle k, so sprechen wir von rechtsseitigen Stützstellen. Schließlich sind mittige Stützstellen durch xk = (tk + 1 − tk )/2 definiert. Prinzipiell können die Stützstellen beliebig in den zugehörigen Teilintervallen gewählt werden. Links/rechts/mittig sind lediglich drei wichtige Typen. Einführung in die Mathematik 1 © Oliver Deiser 5. Integration 219 Mit Hilfe von Partitionen können wir nun Approximationen an den gesuchten Flächeninhalt einer gegebenen Funktion definieren: Definition (Riemann-Summe) Sei f : [ a, b ] → R und p = (tk , xk )k ≤ n eine Partition von [ a, b ]. Dann heißt ∑ p f = ∑ k ≤ n f(xk ) (tk + 1 − tk ) die Riemann-Summe von f bzgl. p. t0 t0 = x 0 x0 t1 = x 1 t1 t2 = x 2 x1 t3 = x 3 t4 = x 4 t2 t5 = x 5 x2 t6 = x 6 t3 x3 t4 x4 t5 t7 = x 7 t8 = x 8 t9 = x 9 x10 Dargestellt sind zwei Riemann-Summen einer Funktion der Länge 5 bzw. 10. Die zweite Partition ist äquidistant und besitzt linksseitige Stützstellen. © Oliver Deiser Einführung in die Mathematik 1 220 2. Abschnitt Der analytische Kalkül Je feiner eine Partition ist, desto besser approximiert eine Riemann-Summe den signierten Flächeninhalt. Dies motiviert: Definition (Riemann-Integral) Eine Funktion f : [ a, b ] → R heißt Riemann-integrierbar mit RiemannIntegral c P R, falls für jede Folge (pn )n P N von Partitionen von [ a, b ] mit limn → ∞ δ(pn ) = 0 gilt, dass limn → ∞ ∑ p f = c. Wir schreiben dann * Iba f = b * f = a b f(x) dx = c. a Die Limesbedingung der Definition notieren wir auch suggestiv in der Form lim δ(p) →0 ∑ p f = c. Bemerkung Ist f : [ a, b ] → R integrierbar und (pn )n P N eine Folge von Partitionen, deren Feinheiten gegen 0 konvergieren, so gilt nach Definition des Integrals, dass limn →∞ ∑ pn f = * b f. a Damit kann jede derartige Folge zur Berechnung des Integrals verwendet werden, insbesondere eine Folge äquidistanter Partitionen (mit linksseitigen, mittigen oder rechtsseitigen Stützstellen). Man kann zeigen: Satz (Integrierbarkeit der elementaren Funktionen) Jede elementare Funktion f : [ a, b ] → R ist Riemann-integrierbar. Ein ebenso berühmtes wie instruktives Beispiel für eine nicht Riemann-integrierbare Funktion ist: Definition (Dirichlet-Sprungfunktion) Die Dirichlet-Sprungfunktion f : [ 0, 1 ] → R ist definiert durch f(x) = { 1 falls x rational, 0 falls x irrational. Die Dirichletsche Sprungfunktion nimmt in jedem noch so kleinen Teilintervall [ a, b ] von [ 0, 1 ] mit a < b sowohl den Wert 1 als auch den Wert 0 an. Damit ist nicht klar, ob dieser Funktion überhaupt ein sinnvoller Flächeninhalt zugeordnet werden kann. In Sinne des Riemann-Integrals ist dies nicht möglich. Der explizite Nachweis, dass die Dirichletsche Sprungfunktion nicht Riemann-integrierbar ist, sei dem Leser zur Übung empfohlen. Einführung in die Mathematik 1 © Oliver Deiser 5. Integration 221 Intervallgrenzen und Rückwärtsintegrale Wir führen noch einige Notationen ein, die den Umgang mit Integralen erleichtern. Für ein Teilintervall [ c, d ] von [ a, b ] setzen wir * d f = * d g, c c wobei g : [c, d] → R die auf [c, d] eingeschränkte Funktion f ist, d.h. g = f |[c, d]. Weiter definieren wir * a * f = − b b für b < a f a (Rückwärtsintegral) Eigenschaften des Integrals Durchgehend gebraucht werden: Satz (elementare Eigenschaften des Integrals) Sei [ a, b ] ein reelles Intervall. Dann gilt für alle integrierbaren Funktionen f, g : [ a, b ] → R, alle c P R und alle s P [ a, b ]: (1) * b 1 = b − a, (Normierung) a (2) * c f = c * f, * b (f + g) = c * a (5) * * b f + d b f ≤ b f = a * * b g, (Additivität) a a a (4) (Skalierung) a a (3) b b b g, falls f(x) ≤ g(x) für alle x P [ a, b ], a s *f + * b f (Monotonie) (Aufspaltung) s a Zum Beweis zeigt man, dass die Eigenschaften für Riemann-Summen gelten und beim Grenzübergang zum Integral erhalten bleiben. Die zweite und dritte Eigenschaft können wir zusammenfassen zu * b (c f + d g) = c a © Oliver Deiser * a b f + d * b g. (Linearität) a Einführung in die Mathematik 1 222 2. Abschnitt Der analytische Kalkül Der Hauptsatz der Differential- und Integralrechnung Wir haben das Integral mit Hilfe von Flächeninhalten bzw. Mittelwerten eingeführt. Den Zusammenhang zum ursprünglichen Problem des Auffindens von Stammfunktion beschreibt: Satz (Hauptsatz der Differential- und Integralrechnung, HDI) Sei f : [ a, b ] → R integrierbar. Teil 1: Berechnung von Integralen Ist F eine Stammfunktion von f, so gilt * b f = F(b) − F(a). a Teil 2: Existenz von Stammfunktionen Sei s P [ a, b ] und F : [ a, b ] → R definiert durch F(x) = * x f für alle x P [ a, b ]. s Dann gilt: Ist f stetig, so ist F eine Stammfunktion von f. Kurz: (1) Mit Stammfunktionen können wir Integrale berechnen. (2) Mit Integralen können wir Stammfunktionen definieren. In diesem Sinne sind Integrieren und Differenzieren invers zueinander. Der erste Teil des Hauptsatzes erlaubt die Berechnung eines Integrals durch die Bestimmung (bei der auch das Raten erlaubt ist) einer Stammfunktion des Integranden. Hierbei ist folgende Notation nützlich: Definition (Auswertungsnotation) Wir setzen F b a F = b a = F(b) − F(a). Damit gilt also unter den Voraussetzungen des ersten Teils des Satzes * a b f = F b a . Der zweite Teil des Satzes garantiert die Existenz von Stammfunktionen für eine wichtige Klasse von Funktionen. Liegt keine Stammfunktion einer stetigen Funktion f vor, so erlaubt der Satz die approximative Berechnung einer solchen Einführung in die Mathematik 1 © Oliver Deiser 5. Integration 223 durch die approximative Berechnung von Integralen (z.B. durch Riemann-Summen). Der erste Teil des Satzes ergibt sich aus dem zweiten, wenn man sich auf stetige Funktionen f : [ a, b ] → R beschränkt. Wir diskutieren dies in den Übungen. Der erste Teil des Hauptsatzes erlaubt in vielen Fällen die mühelose Berechnung von Integralen. Die komplizierte Flächenberechnung durch einen Grenzübergang mit Riemann-Summen entfällt. Dennoch bleiben die Riemann-Summen wertvoll: Ist keine Stammfunktion von f bekannt, so kann mit ihrer Hilfe ein approximativer Wert sehr effektiv berechnet werden. Dies zeichnet die Riemann-Summen vor den aus der Schule vielleicht bekannten Ober- und Untersummen aus, die theoretisch wichtig und elegant sind, sich aber bei weitem nicht so einfach berechnen lassen wie die Riemann-Summen mit ihren konkreten Stützstellen. Beispiele (1) Für alle a, b P R gilt * b x2 dx = a x3 3 x=b x=a = b 3 − a3 . 3 Der Leser versuche, das Integral für den Spezialfall a = 0 und b = 1 mit Hilfe von Riemann-Summen zu berechnen! (2) * 2 1 (3) * 1 0 1 dx = log(x) x 2 1 = log 2 − log 1 = log 2. 1 dx = arctan(x) 1 + x2 1 0 = arctan 1 − arctan 0 = π . 4 (4) Das Integral * 2 log(arctan(x2 )) dx 1 lässt sich mit Hilfe von Riemann-Summen approximativ berechnen. Wir wählen äquidistante Partitionen der Länge n mit linksseitigen Stützstellen und erhalten gerundet auf fünf Nachkommastellen die Werte 0,07633 für n = 10, 0,10080 für n = 100, 0,10316 für n = 1000. 0,10340 für n = 10000. Eine genauere numerische Approximation liefert 0,1034225943675219… mit exakten Nachkommastellen. © Oliver Deiser Einführung in die Mathematik 1 224 2. Abschnitt Der analytische Kalkül Zum Beweis des Hauptsatzes Ein strenger Beweis des Hauptsatzes wird innerhalb einer systematischen Darstellung der Analysis geführt. Wir begnügen uns hier mit einer Argumentation, die den „magischen Zusammenhang“ zwischen Differentiation und Integration ans Licht bringt, und die sich zudem als Grundlage für einen vollständigen Beweis eignet. Argumentation mit Riemann-Summen Sei p = (tk , xk )k ≤ n eine sehr feine Partition von [ a, b ], d. h. δ(p) ist sehr klein. Dann gilt (mit , = „wird approximiert durch, ist ungefähr gleich“): * b a f , ∑ p f = ∑ k ≤ n f(xk ) (tk + 1 − tk ) = ∑ k ≤ n F′(xk ) (tk + 1 − tk ) F(tk + 1 ) − F(tk ) (tk + 1 − tk ) tk + 1 − tk , ∑k ≤ n = ∑ k ≤ n (F(tk + 1 ) − F(tk )) = F(tn + 1 ) − F(t0 ) = F(b) − F(a). Die Summe der drittletzten Zeile ist eine sog. Teleskop-Summe: Es bleiben nur die äußersten Summanden übrig, da sich alle anderen paarweise aufheben. Noch bestechender wird das Argument, wenn wir die Leibniz-Notation ernst nehmen und infinitesimal rechnen: Argumentation mit infinitesimalen Größen Wir fassen das Integral über f von a nach b als Summe von infinitesimalen Rechtecksflächen f(x) ⋅ dx auf und die Ableitung als Quotienten dF(x)/dx infinitesimaler Größen. Dann können wir schreiben * b f(x) dx = * b F′(x) dx = a a a = * * b b dF(x) dx dx dF(x) = F(b) − F(a). a Im letzten Schritt haben wir eine „infinitesimale Teleskop-Summe“ aufgelöst, die sich erneut auf die beiden äußersten Summanden reduziert. Einführung in die Mathematik 1 © Oliver Deiser 5. Integration 225 Das erste Argument lässt sich vergleichsweise leicht mit Hilfe eines Grenzübergangs zu einem vollständigen Beweis ausbauen. Ein Integral ist ja als Grenzwert von Riemann-Summen und eine Ableitung als Grenzwert von Differenzenquotienten definiert. Das zweite Argument benötigt die exakte Einführung infinitesimaler Größen, was zwar aufwendig, innerhalb der im 20. Jahrhundert entwickelten Nonstandard-Analysis aber möglich ist. Uneigentliche Integrale Wir haben bislang nur Funktionen betrachtet, die auf endlichen Intervallen definiert sind. Um auch andere Funktionen behandeln zu können, führt man zusätzliche Grenzübergänge ein. Im Fall der Existenz setzen wir * a ∞ f = limb →∞ * b * f, a b −∞ f = lima → −∞ * b f, a * ∞ f = −∞ * ∞ f + 0 * 0 f. −∞ Analog werden Polstellen behandelt. Dabei ist es allgemein üblich, ein uneigentliches Integral über f von a bis b nur dann zu erklären, wenn f auf jedem Teilintervall [ c, d ] mit a < c < d < b integrierbar im ursprünglichen Sinn ist. Damit kann man zum Beispiel nicht über Polstellen im Inneren der Integrationsgrenzen hinweg integrieren. Natürlich lässt sich das Integral für solche Fälle verallgemeinern, solange sich ein wohldefinierter Grenzwert ergibt. Beispiel * 1 0 1 log x dx = lima → 0 * log x dx = lima → 0 x(log(x) − 1) a = −1 − lima →0 x=1 x=a a(log(a) − 1) = −1 − 0 = −1. log(x) 0.2 0.4 0.6 0.8 1.0 1.2 1.4 -1 -2 -3 -4 © Oliver Deiser Ein uneigentliches Integral für den Logarithmus Einführung in die Mathematik 1 226 2. Abschnitt Der analytische Kalkül Übungen Übung 1 Sei f : [ 0, 1 ] → R mit f(x) = x für alle x. Für alle n sei pn eine äquidistante Partition von [ 0, 1 ] der Länge n (und beliebigen Stützstellen). Zeigen Sie limn →∞ ∑ pn f = 1 . 2 Übung 2 Zeigen Sie mit Hilfe der Definition des Riemann-Integrals, dass die Dirichletsche Sprungfunktion f : [ 0, 1 ] → R nicht Riemann-integrierbar ist. Übung 3 Geben Sie mit Hilfe von Skizzen anschauliche Argumente für die elementaren Eigenschaften des Integrals. Legen Sie dabei besonderes Augenmerk auf die Additivität. Übung 4 Zeigen Sie Teil 1 des Hauptsatzes mit Hilfe von Teil 2, unter der Voraussetzung der Stetigkeit von f. Übung 5 Berechnen Sie die Fläche des Einheitskreises mit Hilfe von Integration und der Funktion F : [ −1, 1 ] → R mit F(x) = x £1 − x2 + arcsin x für alle x P [ −1, 1 ]. Einführung in die Mathematik 1 © Oliver Deiser 6. Integrationsregeln Wir entwickeln nun einen Kalkül zur Bestimmung von Integralen. Dieser Kalkül besteht aus Integrationsregeln, die wir durch Umkehrung der Ableitungsregeln gewinnen. Der Kalkül erweist sich als sehr leistungsfähig, aber auch als deutlich komplizierter und subtiler als der Kalkül des Differenzierens. Seine theoretischen Grenzen findet er in der Tatsache, dass nicht jede elementare Funktion eine elementare Stammfunktion besitzt. © Oliver Deiser Einführung in die Mathematik 1 228 2. Abschnitt Der analytische Kalkül Unbestimmte Integrale Bevor wir die Integrationsregeln besprechen, führen wir noch eine nützliche Notation ein. Notation Sei I ⊆ R ein (beschränktes oder unbeschränktes) Intervall und sei f : I → R derart, dass f auf jedem beschränkten Intervall [ a, b ] ⊆ I integrierbar ist. Weiter besitze f eine Stammfunktion. Dann bezeichnen wir mit I(f ) = *f (unbestimmtes Integral) irgendeine Stammfunktion von f. Da eine Stammfunktion nur bis auf eine Konstante bestimmt ist, müsste man genauer das unbestimmte Integral als Menge aller Stammfunktionen definieren. Unsere Notation ist aber einfacher und in der Regel ungefährlich. Alternativ ist auch die „+ c“-Schreibweise möglich. Nach dem Hauptsatz gilt für alle a, b im Definitionsbereich von f: * b f = a ( *f ) b a = F(b) − F(a) für jede auf [ a, b ] definierte Stammfunktion F von f. Nach Definition gilt ( * f ) ′ = f. Ist f stetig differenzierbar (sodass f ′ stetig ist und damit eine Stammfunktion von f existiert), so gilt * f′ = f. In der alternativen Notation lesen sich die Zusammenhänge als I(f)′ = f und I(f ′) = f bzw. D(I(f)) = f und I(D(f)) = f. Beispiele (1) *0 (2) * 1 dx = x, (3) * sin x dx = − cos x. = 1, *0 = c für alle c P R. *x = x2 /2, Einführung in die Mathematik 1 © Oliver Deiser 6. Integrationsregeln 229 (4) Bei der Integration von Funktionen, die durch Terme definiert sind, ist die fehlende Angabe des Definitionsbereichs zuweilen gefährlich. So gilt zum Beispiel * { 1 dx = x falls x > 0, falls x < 0. log(x) log(−x) Man kann dies durch * 1 dx = log | x | x zusammenfassen. 4 2 -2 1 x -1 1 2 log( x ) -2 -4 Prinzipiell muss aber immer ein Intervall, auf dem die zu integrierende Funktion definiert ist, gegeben sein. Das unbestimmte Integral ist nur für Funktionen erklärt, die auf einem Intervall definiert sind. Ist kein Intervall explizit angegeben, so geht es aus dem Kontext hervor oder die Überlegungen gelten für jedes Intervall, auf dem der Integrationsterm eine Funktion definiert. Linearität Die einfachste Integrationsregel ist die Linearität: Existieren die unbestimmten Integrale für f, g : I → R und sind c, d P R, so gilt * c f(x) + d g(x) dx = c * f(x) dx + d * g(x) dx. Die Regel ergibt sich aus der Linearität der Ableitung: Sind F und G Stammfunktionen von f bzw. g, so gilt (c F + d G)′ = c F′ + d G′ = c f + d g. © Oliver Deiser Einführung in die Mathematik 1 230 2. Abschnitt Der analytische Kalkül Die Linearität ist bei der Berechnung von Integralen ständig im Einsatz. Besonders nützlich ist sie bei der Integration rationaler Funktionen im Zusammenspiel mit der Partialbruchzerlegung: Beispiel Mit Hilfe von Partialbruchzerlegung berechnen wir für x > 1: 2x2 + 1 dx (x − 1)3 * = * 3 (x − 1)3 4 (x − 1)2 = * 3 dx + (x − 1)3 + * −4 x−1 + 2 dx x−1 4 dx + (x − 1)2 = −3 2 (x − 1)2 + = −8x + 5 2 (x − 1)2 + 2 log(x − 1). * 2 dx x−1 + 2 log(x − 1) Partielle Integration Satz (partielle Integration) Seien f, g : I → R stetig differenzierbar. Dann gilt: *f′ g * a = fg − b f′g = fg b a * f g′, − * b f g′ für alle a, b P I. a Der Beweis ergibt sich aus der Ableitungsregel (fg)′ = f ′ g + g′f, denn fg = * (f g)′ = * (f ′ g + f g′) = * f ′ g + * f g′. Die Version für bestimmte Integrale ergibt sich durch Auswertung, denn für alle a, b P I gilt: * a b f′g = fg − * f g′ b a = fg b a − * f g′ b a = fg b a − * b f g′. a In Anwendungen verwendet man die partielle Integration, um die Ableitung eines Faktors eines Produkts auf den anderen Faktor zu übertragen − auf Kosten eines Produkts fg. Sehr sorgfältig muss man auf die Vorzeichen achten, die eine Fehlerquelle bei der partiellen Integration darstellen. Einführung in die Mathematik 1 © Oliver Deiser 6. Integrationsregeln 231 Beispiel: Einfügen der Eins-Funktion Auch wenn kein Produkt zu integrieren ist, lässt sich die partielle Integration manchmal gewinnbringend anwenden. Denn statt f können wir immer 1 ⋅ f schreiben. Damit lässt sich zum Beispiel eine Stammfunktion des Logarithmus finden: * log(x) dx = * 1 log(x) dx = x log(x) − *x ⋅ 1 dx x = x log(x) − x = x (log(x) − 1). 1.0 0.5 1 2 3 4 log(x) x (log(x) - 1) -0.5 -1.0 -1.5 Analog gilt für den Arkustangens * arctan(x) dx = * 1 arctan(x) dx = x arctan(x) − * x dx 1 + x2 1 log(1 + x2 ), 2 = x arctan(x) − wobei wir das Logarithmus-Integral an dieser Stelle raten. 2 arctan(x) x arctan(x) - 1 log 1 + x2 2 x -1 2 -6 -4 -2 2 4 6 - © Oliver Deiser Einführung in die Mathematik 1 232 2. Abschnitt Der analytische Kalkül Beispiel: Integration von cos2 In diesem Beispiel verwenden wir die partielle Integration zusammen mit einer trigonometrischen Identität. Es gilt * cos2(x) dx = * cos(x) cos(x) dx = * cos(x) sin′(x) dx = cos(x) sin(x) − * cos′(x) sin(x) dx = cos(x) sin(x) + * sin2(x) dx. Addition von * cos2 (x) auf beiden Seiten ergibt 2 * cos2(x) dx = cos(x) sin(x) + * (sin2(x) + cos2(x)) dx = cos(x) sin(x) + * 1 dx = cos(x) sin(x) + x. Division durch 2 liefert eine Stammfunktion von cos2 x. Eine solche lässt sich auch ohne partielle Integration finden, wenn man die Formel 2 cos2 (x) = cos(2x) + 1 verwendet, die sich aus cos(2x) = cos2 x − sin2 x = cos2 x − (1 − cos2 x) ergibt. Die Berechnung lautet dann: 2 * cos2(x) dx = * cos(2x) + 1 dx = sin(2x)/2 + x = cos(x) sin(x) + x. Gerade für die Integration gilt: Es gibt oft mehrere Wege, die ans Ziel führen. Neben den Integrationsregeln sind geeignete Termumformungen ein entscheidendes Hilfsmittel. 3 2 1 cos2 (x) -2 - 2 1 (cos(x) sin(x) + x) 2 -1 -2 -3 Einführung in die Mathematik 1 © Oliver Deiser 6. Integrationsregeln 233 Die Substitutionsregel Satz (Substitutionsregel) Seien f : J → R stetig und s : I → J stetig differenzierbar. Dann gilt * (f + s) s′ * ( *f) = b (f + s) s′ = * s(b) + s, f für alle a, b P I. s(a) a Nach den Voraussetzungen sind f : J → R und (f + s) ⋅ s′ : I → R stetig, sodass diese Funktionen Stammfunktionen besitzen. Sei F eine Stammfunktion von f, d. h. * f. F = Nach der Kettenregel ist (F + s)′ = (f + s) ⋅ s′, sodass (*f ) + s = F + s eine Stammfunktion von (f + s) ⋅ s′ ist. Dies zeigt die Version für unbestimmte Integrale. Auswertung liefert * b (f + s) s′ = F + s a b a = F s(b) s(a) = * s(b) f für alle a, b P I. s(a) In Anwendungen wird die Regel oft von rechts nach links (Einführen einer Substitution) statt von links nach rechts (Elimination einer Substitution) verwendet: Gesucht ist eine Stammfunktion von f. Um eine solche zu finden, führt man eine injektive Substitutionsfunktion s ein, sodass *f = ( * (f + s) s′ ) + s− 1 . Bei einer geschickt gewählten Funktion s kann der Integrand auf der rechten Seite deutlich einfacher sein als der Integrand f auf der linken Seite. Bei der Durchführung des Substitutions-Verfahrens bewährt sich die LeibnizNotation: © Oliver Deiser Einführung in die Mathematik 1 234 2. Abschnitt Der analytische Kalkül Anwendung der Substitutionsregel in der Leibniz-Notation (1) Zu bestimmen ist das Integral einer in der Variablen x gegebenen Funktion f. (2) Man setzt x = s(t) für eine frei gewählte stetig differenzierbare Substitutionsfunktion s, deren Werte im Definitionsbereich des Integranden liegen. (3) Aus dx dt = ds(t) dt = s′(t) gewinnen wir (+) dx = ds(t) = s′(t) dt. Folglich ist * f(x) dx = * f(s(t)) ds(t) = * f(s(t)) s′(t) dt. (4) Die Bestimmung des Integrals auf der rechten Seite in (3) (evtl. mit Hilfe weiterer Substitutionen) liefert eine Funktion F(t) in der Variablen t, die man zur Berechnung bestimmter Integrale über f verwenden kann: * x=b x=a −1 f(x) dx = * t = s (b) −1 t = s (a) t = s−1 (b) f(s(t)) s′(t) dt = F(t) t = s−1 (a) . Die Substitutionsfunktion s muss dabei nicht injektiv sein, in den Intervallgrenzen kann man beliebige Urbilder von a und b einsetzen. Ist s injektiv, so liefert das Einsetzen von t = s− 1 (x) (Rücksubstitution) in F(t) eine Funktion F(s− 1 (x)) in x. Diese Funktion ist eine Stammfunktion von f. Zuweilen wird im Schritt (2) auch ein funktionaler Zusammenhang der Form t = h(x), dt = dh(x) = h′(x) dx hergestellt, der der unmittelbaren Vereinfachung des Integranden dient: Terme der Form h(x) im Integranden werden zu t, h′(x)dx wird zu dt und die Integrationsgrenzen a und b werden zu h(a) und h(b) (dies entspricht der Anwendung der Regel von links nach rechts: Entfernen einer Substitution). Weiter verzichtet man oft darauf, den Substitutionsfunktionen Namen zu geben und rechnet statt dessen mit Variablen, die über bestimmte Terme miteinander zusammenhängen. Anders formuliert: Die Variablen t und x werden als Funktionen t(x) und x(t) aufgefasst. Die folgenden Beispiele erläutern das Verfahren. Einführung in die Mathematik 1 © Oliver Deiser 6. Integrationsregeln 235 Beispiel: Geraden als Substitution Seien c, d P R mit c ≠ 0. Wir betrachten das Integral * b f(c x + d) dx a für eine beliebige Funktion f, für die das Integral in den Grenzen von a bis b definiert ist. Mit t = c x + d, dt = c dx gilt * b f(cx + d) dx = a = 1 c * 1 c * x=b f(c x + d) c dx = x=a t = cb + d f(t) dt = t = ca + d 1 c * cb + d f(t) dt. ca + d In der unbestimmten Form können wir schreiben: * f(c x + d) dx 1 c = * f(t) dt = 1 F(t) = c 1 F(cx + d), c wobei F(t) eine in t = t(x) notierte Stammfunktion von f ist. Beispiel: Integral einer logarithmischen Ableitung Sei g : [ a, b ] → ] 0, ∞ [ stetig differenzierbar. Wir betrachten das Integral * b g′(x) g(x) a dx. Mit t = g(x), dt = g′(x) dx erhalten wir * x=b x=a g′(x) dx = g(x) * t = g(b) t = g(a) 1 dt = log(t) t t = g(b) t = g(a) x=a = log(g(x)) x=b . In unbestimmter Form gilt * g′(x) g(x) dx = * 1 dt = log(t) = log(g(x)) . t Die Stammfunktion log(g(x)) lässt sich in diesem einfachen Fall natürlich auch raten, vgl. obiges Beispiel zur Berechnung der Integrals des Arkustangens. Der Quotient L(g) = g′/g ist als logarithmische Ableitung der Funktion g bekannt. Er erfüllt die Ableitungsregel L(gh) = L(g) + L(h). © Oliver Deiser Einführung in die Mathematik 1 236 2. Abschnitt Der analytische Kalkül Beispiel: Berechnung von Kreisflächen, I Sei r > 0 und Kr = { (x, y) P R2 | x2 + y2 = r2 } der Kreis mit Mittelpunkt 0 und Radius r. Wir berechnen die Fläche dieses Kreises mit Hilfe von Integration. Hierzu betrachten wir die Funktion f : [ −r, r ] → R mit f(x) = £r2 − x2 für alle x P [ −r, r ], deren Graph die obere Hälfte des Kreises ist. r f(x) r 1 - x2 -r x r Das Integral über f von −r bis r ist die Hälfte der gesuchten Kreisfläche. Zur Berechnung dieses Integrals setzen wir x = r sin(t), dx = r cos(t) dt. Dann gilt * r −r f(x) dx = * x=r £r2 − x2 dx = * t = π/2 t = π/2 £r2 − r2 sin2 (t) r cos(t) dt t = −π/2 x = −r = r2 * £1 − sin2 (t) cos(t) dt t = −π/2 = r2 * t = π/2 £cos2 (t) cos(t) dt t = −π/2 = r2 * t = π/2 |cos(t)| cos(t) dt = r2 cos(t) sin(t) + t 2 t = π/2 cos2 (t) dt t = −π/2 t = −π/2 = r2 * t = π/2 t = −π/2 = r2 ( π π + 4 4 ) = r2 π , 2 wobei wir cos(t) ≥ 0 für t P [ −π/2, p/2 ] und das oben mit Hilfe partieller Integration berechnete Integral über cos2 verwendet haben. Damit berechnet sich die Kreisfläche zu r2 π. Einführung in die Mathematik 1 © Oliver Deiser 6. Integrationsregeln 237 Beispiel: Berechnung von Kreisflächen, II Sei r > 0. Wir bestimmen in Erweiterung des vorangehenden Beispiels eine Stammfunktion von f : [ −r, r ] → R mit f(x) = £r2 − x2 für alle x P [ −r, r ]. Sei wieder x = r sin(t), dx = r cos(t) dt, t = arcsin ( xr ). Dann gilt (wie in obiger Rechnung) * f(x) dx = r2 * cos2(t) dt = r2 cos(t) sin(t) + t 2 (Rücksubstitution) = r2 2 (cos(arcsin( xr )) = r2 2 ( £1 − x /r = 1 2 ( x £r − x 2 2 2 2 x x + arcsin r r ( )) x x + arcsin r r ( )) + r2 arcsin ( xr ) ) . Auswerten der Stammfunktion in den Grenzen von x = −r bis x = r liefert wegen arcsin(±1) = ± π/2 erneut den Wert r2 π/2 und damit die Hälfte der Fläche eines Kreises mit Radius r. Mit der Stammfunktion lassen sich aber allgemeiner aber auch Teilflächen eines Kreises und insbesondere Kreissegmente berechnen. Für r = 1 ergibt sich folgendes Bild: 4 1 - x2 -1.0 -0.5 0.5 1.0 1 x 2 1 - x2 + arcsin(x) 4 © Oliver Deiser Einführung in die Mathematik 1 238 2. Abschnitt Der analytische Kalkül Die Substitutionsregel kann bei der Berechnung eines Integrals mehrfach hintereinander angewendet werden. Nach einer Substitution t = s1 (x) können wir zum Beispiel u = s2 (t) setzen. Sind s1 und s2 injektiv, so lautet die Rücksubstitution x = s1 −1 (t) = s1 −1 (s2 −1 (u)). Erneut können wir die Notation zu t = t(x) und u = u(t) vereinfachen, sodass die Substitutionsfunktionen mit den Variablennamen verschmelzen. Beispiel: Mehrfache Substitution Mit den Substitutionen t = sin(x), dt = cos(x) dx, u = 2t, du = 2 dt gilt * cos x dx = 1 + 4 sin2 x * 1 dt 1 + 4t2 = * 1 1 + u2 1 du 2 1 arctan(2t) 2 = 1 arctan(u) = 2 = 1 arctan(2sin(x)). 2 Zur Illustration der Regel betrachten wir noch: Beispiel: Nichtinjektive Substitutionen Mit der Substitution x = sin(t), dx = cos(t) dt gilt * 2x dx = * 2 sin(t) cos(t) dt = sin2 (t). Wegen x2 = sin2 (t) erhalten wir die Stammfunktion x2 , formal aber nur auf dem Intervall [ −π/2, π/2 ], auf dem die Substitution injektiv ist: Auf diesem Intervall ist t = arcsin(x) und sin2 (t) = sin2 (arcsin(x)) = x2 . Zur Berechnung von bestimmten Integralen mit Intervallgrenzen im Wertebereich [ −1, 1 ] der Substitutionsfunktion können wir aber die Funktion sin2 (t) mit beliebigen Urbildern der Intervallgrenzen verwenden. Wegen sin(−2π) = 0 und sin(9π/2) = sin(π/2 + 4π) = 1 ist zum Beispiel * 0 1 2x dx = sin2 (t) t = 9π/2 t = −2π Einführung in die Mathematik 1 . © Oliver Deiser 6. Integrationsregeln 239 Die Frage nach der Injektivität der Substitutionsfunktion stellt sich in der Praxis eher selten, da eine nichtinjektive Substitution das Integrationsintervall unnötig mehrfach durchläuft. Benötigt wird die Injektivität zudem nur bei der Rücksubstitution, in bestimmten Integralen genügt es, beliebige Urbilder zu finden. Elimination trigonometrischer Funktionen Wir betrachten Substitutionen, die trigonometrische Funktionen aus Integranden entfernen. Grundlage hierzu ist eine Arkustangens-Substitution: (Sub1) x = arctan t, dx = 1 dt, t = tan x. 1 + t2 Für alle x P ] − π/2, π/2 [ gilt cos x = 1 £1 + tan2 x , sin x = tan x cos x. Wegen x = arctan t P ] −π/2, π/2 [ für alle x P R erhalten wir cos(arctan t) = 1 £1 + t 2 , sin(arctan t) = t £1 + t2 für alle t P R. Damit lassen sich alle Kosinus- und Sinusfunktionen eines Integranden mit Hilfe der Arkustangens-Substitution eliminieren. Durch eine auf den ersten Blick unscheinbare Variante können wir zudem auch noch die Wurzeln vermeiden: (Sub2) x = 2 arctan t, dx = 2 x dt, t = tan( ). 2 1+t 2 Bei dieser Substitution erhalten wir aufgrund der Verdopplungsformeln cos(2t) = cos2 t − sin2 t, sin(2t) = 2 cos t sin t, die rein rationalen Formeln cos ( 2 arctan t ) = 1 − t2 , 1 + t2 sin ( 2 arctan t ) = 2t 1 + t2 für alle t P R. Damit können wir trigonometrische Integranden in rationale Integranden verwandeln. Wir diskutieren hierzu einige Beispiele. © Oliver Deiser Einführung in die Mathematik 1 240 2. Abschnitt Der analytische Kalkül Beispiel Wir betrachten die Funktion f : ] −π, π [ → R mit f(x) = 1 1 + cos x für alle x P ] −π, π [. Mit der Substitution x = 2 arctan t gilt nach obigen Formeln * f(x) dx = * 1 1 + cos(x) = * 1 1 + cos(2 arctan t)) = * = * 1 dt = tan dx 2 1 + t2 2 2 (1 + (1 − t ) / (1 + t2 )) (1 + t2 ) ( x 2 = t dt dt (Rücksubstitution) ). 5 1 1+cos(x) tan x 2 - -5 Beispiel Sei f : ] −π/4, 3π/4 [ → R definiert durch f(x) = 1 sin(x) + cos(x) für alle x P ] −π/4, 3π/4 [. Wir setzen wieder x = 2 arctan(t). Dann gilt Einführung in die Mathematik 1 © Oliver Deiser 6. * f(x) dx = * 1 sin(x) + cos(x) = * 1 sin(2 arctan t) + cos(2 arctan t)) = * = * = * = * 241 dx 2 dt 1 + t2 1 2 2 2 2 1 + t2 2t / (1 + t ) + (1 − t ) / (1 + t ) 2 Integrationsregeln dt dt 2 − (t − 1)2 1 1 − (t − 1)2 /2 dt mit u = (t − 1)/£2 1 £2 du = £2 artanh(u) 1 − u2 = £2 artanh t−1 ( £2 ) ( = £2 artanh tan(x/2) − 1 £2 ). 6 4 2 1 sin(x)+cos(x) - 2 4 4 2 3 4 tan 2 arctanh x -1 2 2 -2 -4 -6 Zur Überprüfung der Definitionsbereiche verwenden wir die Werte sin ( π 8 ) = cos( 3π 8 )= 1 £2 − £2 , 2 ( π 8 ) = sin( 3π 8 )= 1 £2 + £2 , 2 ( π 8 ) = £2 − 1, cos tan ( tan 3π 8 ) = £2 + 1, die sich aus sin(π/4) = cos(π/4) = 1/£2 und den Halbierungsformeln ergeben. Damit ist |t − 1| ≤ £2 und |u| < 1, was wir für den artanh brauchen. © Oliver Deiser Einführung in die Mathematik 1 242 2. Abschnitt Der analytische Kalkül Weitere Integrationsregeln Jede Ableitungsregel führt zu einer Integrationsregel, durch die sich unser Integrationskalkül weiter anreichern lässt. So gilt nach der Quotientenregel (+) * f ′ g − g′ f g2 f . g = Beispiel Mit Hilfe der Regel (+) kann man sofort sehen, dass (x2 + 1) cos x − 2 x sin x dx = (x2 + 1)2 * sin x . x2 + 1 Der Integrand selbst ist keineswegs harmlos: Spalten des Bruchs in zwei Teile erzeugt Integranden, die keine elementaren Stammfunktionen besitzen. Aus (+) erhalten wir auch die Regel * f′ g = f g * + g′ f , g2 eine „partielle Integration für Quotienten“. Wegen f′ g = f′ ⋅ 1 g und ( 1 g′ ′ = − 2 f g ) liefert diese Regel im Vergleich zur partiellen Integration für Produkte aber nichts wesentlich Neues. Die geometrische Interpretation des Integrals ist für die Integration von Umkehrfunktionen nützlich. Exemplarisch betrachten wir: Beispiel Für alle x > 1 gilt log(x) x = * log x et dt + 0 * x log t dt, 1 da das Rechteck [ 0, log x ] × [ 0, x ] ⊆ R2 durch den Graphen der Exponentialfunktion in zwei Flächen aufgeteilt wird, deren Inhalt durch die beiden Integrale berechnet wird. Damit ist * x log t dt = log(x) x − et 1 log(x) 0 = log(x) x − x + 1. Damit haben wir die oben durch partielle Integration gewonnene Stammfunktion log(x) x − x des Logarithmus wiedergefunden. Einführung in die Mathematik 1 © Oliver Deiser 6. Integrationsregeln 243 Nichtelementare Integrale Während die Ableitung einer elementaren Funktion stets eine elementare Funktion ist, ist das Integral einer elementaren Funktion im Allgemeinen nicht mehr elementar. Die Situation ist vergleichbar mit den rationalen Funktionen: Die Ableitung einer rationalen Funktion ist stets eine rationale Funktion, bei Integration rationaler Funktionen tauchen aber nichtrationale Funktionen auf, allen voran der Logarithmus und Arkustangens. Analog reichen die elementaren Funktion nicht aus, um alle elementaren Funktionen integrieren zu können. Es müssen neue Funktionen eingeführt werden, so wie der Logarithmus und der Arkustangens neu für die Welt der rationalen Funktion sind. Man kann zeigen, dass die folgenden elementaren Funktionen keine elementaren Stammfunktionen besitzen: sin x , x sin x , sin(x2 ), x2 1 , log x exp(− x2 /2), (Gaußsche Glockenkurve) £1 − k2 sin2 x für k P ] 0, 1 [. Die Integration dieser und vieler weiterer Funktionen führt zur Einführung spezieller Funktionen (und zugehöriger numerischer Berechnungsverfahren), die die Klasse der elementaren Funktionen erweitern. Die folgenden Diagramme zeigen einige der genannten Funktionen samt nichtelementaren Stammfunktionen. 2 1 sin(x) x -4 -2 2 4 F(x) 2 -1 -2 Der Integral-Sinus F © Oliver Deiser Einführung in die Mathematik 1 244 2. Abschnitt Der analytische Kalkül 1.0 0.5 sin x2 F(x) -6 -4 -2 2 4 6 2 2 -0.5 -1.0 Das Fresnel-Integral F 1.0 0.5 exp - -4 x2 2 F(x) -2 2 4 2 -0.5 -1.0 Das (nicht normierte) Gaußsche Fehlerintegral F Die Gaußsche Glockenkurve und das zugehörige Fehlerintegral spielen in der Wahrscheinlichkeitstheorie eine sehr wichtige Rolle. Wir werden in Abschnitt 5 die Fläche unter der Glockenkurve als £2π berechnen. Bedeutsam in der Theorie der nichtelementaren Funktionen sind weiter Integranden der Form £1 − k2 sin2 x für k P ] 0, 1 [. Sie tauchen insbesondere bei der Berechnung des Umfangs von Ellipsen auf. Auch hierauf werden wir im fünften Abschnitt zurückkommen. Einführung in die Mathematik 1 © Oliver Deiser 6. Integrationsregeln 245 Übungen Übung 1 Zeichnen Sie Diagramme zur Erläuterung der Formeln (a) * b f(cx) dx = a (b) * b 1 c f(x + d) dx = * cb f(t) dt für c ≠ 0, f(t) dt für d P R. ca * b+d a+d a Übung 2 Sei E die achsenparallele Ellipse mit den Halbachsen a, b > 0, d. h. E = { (x, y) P R2 | (x/a)2 + (y/b)2 = 1 }. Skizzieren Sie E und bestimmen Sie die Fläche von E in Abhängigkeit von den Parametern a und b mit Hilfe von Integration. Übung 3 Bestimmen Sie durch Anwendung der Integrationsregeln: (a) * 1 dx für x > 0, x + x2 (b) * sin x cos x dx. 1 + 4sin2 x Übung 4 Bestimmen Sie durch Anwendung der Integrationsregeln: log(x) dx, x (a) * (b) * x log(x) dx, (c) * log2(x) dx, (d) * log3(x) dx, (e) * £x log(x) dx, (f ) * log(£x) dx. © Oliver Deiser Einführung in die Mathematik 1 246 2. Abschnitt Der analytische Kalkül Übung 5 Bestimmen Sie durch Anwendung der Integrationsregeln: (a) * x £1 − x2 dx, (b) * (c) * 1 £1 − x2 x £1 − x4 dx, dx. Übung 6 Seien a, b P R mit b > 0. Bestimmen Sie durch Anwendung der Integrationsregeln: * 1 − a ex dx. 1 + b ex Übung 7 Bestimmen Sie durch Anwendung der Integrationsregeln: (a) * arcsin x dx, * arccos x dx, (b) * arctan x dx, * arccot x dx, (c) * arsinh x dx, * arcosh x dx, (d) * artanh x dx, * arcoth x dx. Übung 8 Bestimmen Sie durch Anwendung der Integrationsregeln: (a) * tan x dx, * cot x dx, (b) * tanh x dx, * coth x dx. Einführung in die Mathematik 1 © Oliver Deiser 6. Integrationsregeln 247 Übung 9 Zeigen Sie mit Hilfe einer Arkustangens-Substitution und trigonometrischer Identitäten, dass * sec x dx * = 1 1 + tan(x/2) dx = log( cos x 1 − tan(x/2) ) = log(tan(x/2 + π/4)) = log(cos(x/2) + sin(x/2)) − log(cos(x/2) − sin(x/2)) = log(tan x + sec x). Übung 10 Bestimmen Sie durch Anwendung der Integrationsregeln (mit Hilfe der Stammfunktion des Sekans) aus vorangehenden Übung: * sec3 x dx = * 1 dx. cos3 x Übung 11 Sei f : [ a, b ] → [ 0, ∞ [ streng monoton wachsend und stetig differenzierbar. Weiter seien c = f(a) und d = f(b). (a) Finden Sie mit Hilfe eines Diagramms und der geometrischen Interpretation des Integrals als Flächeninhalt eine Formel für * d f − 1 (x) dx c b in Abhängigkeit von * f(x) dx. a (b) Beweisen Sie Ihre Formel mit Hilfe der Integrationsregeln. © Oliver Deiser Einführung in die Mathematik 1 3. Abschnitt Reelle und komplexe Zahlen © Oliver Deiser Einführung in die Mathematik 1 1. Die Vollständigkeit der reellen Zahlen Bisher haben wir die reellen Zahlen als gegeben betrachtet und Begriffe wie „Grenzwert“ und „Stetigkeit“ anschaulich verwendet. In diesem Abschnitt betrachten wir die reellen Zahlen und die Grundlagen der Analysis genauer. Dabei streben wir erneut keine vollständige Behandlung dieses Themas an, sondern eine Art „Wissensvertiefung erster Stufe“. Wir beginnen mit der Isolierung einer Eigenschaft, die die reellen Zahlen von den rationalen Zahlen unterscheidet. © Oliver Deiser Einführung in die Mathematik 1 252 3. Abschnitt Reelle und komplexe Zahlen Modellierung eines Linearkontinuums Neben einem Modell des Zählens ist ein Modell eines Linearkontinuums von grundlegender Bedeutung für die Mathematik. Ein solches Modell wird aus Punkten gebildet. Je zwei verschiedene Punkte sind durch ein „kleiner“ bzw. „größer“ miteinander vergleichbar (Linearität) und zwischen zwei Punkten liegt immer ein weiterer Punkt (Dichtheit). Weiter kann mit den Punkten gerechnet werden (arithmetisches Kontinuum). Alle diese Eigenschaften werden durch die rationalen Zahlen Q = { ± n/m | n P N, m ≥ 1 } erfüllt. Dennoch sind die rationalen Zahlen kein geeignetes Modell für ein Linearkontinuum. Warum nicht, zeigt der folgende Satz, der zum Grundbestand des mathematischen Wissens gehört. Satz (Irrationalität der Quadratwurzel aus 2) £2 ist irrational, d. h. es gibt keine natürlichen Zahlen n, m mit (n/m)2 = 2. Beweis Seien n, m P N. Wir betrachten die Primfaktorzerlegungen von n und m und schreiben n = 2a1 ⋅ 3a2 ⋅ 5a3 ⋅ … m = 2b1 ⋅ 3b2 ⋅ 5b3 ⋅ … mit Exponenten ak , bk ≥ 0. Nach den Potenzregeln gilt n2 = 22 a1 ⋅ 32 a2 ⋅ 52 a3 ⋅ … m2 = 22 b1 ⋅ 32 b2 ⋅ 52 b3 ⋅ … 2m2 = 22 b1 + 1 ⋅ 32 b2 ⋅ 52 b3 ⋅ … Dann sind die 2-Exponenten von n2 und 2m2 verschieden, da der erste der beiden Exponenten gerade, der zweite aber ungerade ist. Aufgrund der Eindeutigkeit der Primfaktorzerlegung ist also n2 ≠ 2m2 und damit (n/m)2 ≠ 2. Da (n/m)2 = 2 äquivalent zu 2n2 = m2 ist, lässt sich das Ergebnis auch so formulieren: Satz (Irrationalität der Quadratwurzel aus 2, zahlentheoretische Version) Das Doppelte einer Quadratzahl ist keine Quadratzahl. In dieser Version ist nur noch von natürlichen Zahlen und der Multiplikation die Rede. Es tauchen keine Wurzeln und Verhältnisse mehr auf. Eine wichtige Folgerung für die Analysis ist: Einführung in die Mathematik 1 © Oliver Deiser 1. Die Vollständigkeit der reellen Zahlen 253 Korollar Die Funktion f : Q → Q mit f(q) = q2 − 2 für alle q P Q hat keine Nullstelle. 2 f(x) 1 2 -2 -1 1 2 -1 -2 Die Funktion f : Q → Q besitzt keine Nullstellen Diese und verwandte Überlegungen zeigen, dass Q für die Analysis ungeeignet ist: Die rationalen Zahlen haben Lücken. Wie kann man den Unterschied von Q und R genau fassen? Eine Möglichkeit, die die Ordnungsstruktur der reellen Zahlen an die Spitze stellt, werden wir nun kennenlernen. Anschaulich besagt sie, dass jede in den rationalen Zahlen auftretende Lücke durch eine (irrationale) reelle Zahl geschlossen wird. Obere und untere Schranken Zur Formulierung der „Lückenlosigkeit“ von R brauchen wir eine Reihe von Ordnungsbegriffen. Die meisten von ihnen sind anschaulich und suggestiv in ihrer Namensgebung. Definition (obere und unter Schranke) Seien X ⊆ R und s P R. Dann heißt s eine obere Schranke von X, in Zeichen X ≤ s, falls für alle x P X gilt, dass x ≤ s. Analog heißt s eine untere Schranke von X, in Zeichen s ≤ X, falls für alle x P X gilt, dass s ≤ x. Die Menge X heißt nach oben (unten) beschränkt, falls eine obere (untere Schranke) von X existiert. Schließlich heißt X beschränkt, falls X nach oben und unten beschränkt ist. © Oliver Deiser Einführung in die Mathematik 1 254 3. Abschnitt Reelle und komplexe Zahlen Definition (Minimum und Maximum) Seien X ⊆ R und s P R. Dann heißt s das Maximum oder von X, in Zeichen s = max(X), falls s P X und X ≤ s. Analog heißt s das Minimum von X, in Zeichen s = min(X), falls s P X und s ≤ X. Für a1 , …, an P R setzen wir zur Vereinfachung der Notation max(a1 , …, an ) = max({ a1 , …, an }), min(a1 , …, an ) = min({ a1 , …, an }). Wir betrachten nun besonders ausgezeichnete obere und untere Schranken einer Menge: Definition (Supremum und Infimum) Seien X ⊆ R und s P R. Dann heißt s das Supremum oder die kleinste obere Schranke von X, in Zeichen s = sup(X), falls s = min { t | X ≤ t }. Analog heißt s das Infimum oder die größte untere Schranke von X, falls s = max { t | t ≤ X }. t inf(X) X sup(X) s Eine Menge X reeller Zahlen mit unterer Schranke t und oberer Schranke s Anschaulich erhalten wir das Infimum einer nach unten beschränkten nichtleeren Menge X reeller Zahlen, indem wir eine untere Schranke t von X betrachten und diese Schranke soweit nach rechts verschieben, bis sie die Menge X in folgendem Sinne berührt: Jede weitere Vergrößerung würde dazu führen, dass keine untere Schranke mehr vorliegt. Analoges gilt für das Supremum. Wir fassen die Definitionen in einer Tabelle zusammen. Begriff Ausdruck Definition s ist eine obere Schranke von X X≤s ∀x P X x ≤ s s ist eine untere Schranke von X s≤X ∀x P X s ≤ x s ist das Maximum von X s = max(X) sPX ∧ X ≤ s s ist das Minimum von X s = min(X) sPX ∧ s ≤ X s ist das Supremum von X s = sup(X) X ≤ s ∧ ∀t (X ≤ t → s ≤ t) s ist das Infimum von X s = inf(X) s ≤ X ∧ ∀t (t ≤ X → t ≤ s) Einführung in die Mathematik 1 © Oliver Deiser 1. Die Vollständigkeit der reellen Zahlen 255 Beispiele (1) [ 0, 1 ] ≤ 1, [ 0, 1 ] ≤ 2, [ 0, 1 [ ≤ 1, [ 0, 1 [ ≤ 2. (2) max([ 0, 1 ]) = 1, max([ 0, 1 [) existiert nicht. (3) sup([ 0, 1 ]) = 1, sup([ 0, 1 [) = 1. (4) N ⊆ R ist nach unten, aber nicht nach oben beschränkt. (5) max(N) und sup(N) existieren nicht, min(N) = inf(N) = 0. (6) Sei X = { 1 − 1/n | n P N* } ⊆ Q. Dann gilt max(X) existiert nicht, sup(X) = 1 P Q. Die Menge X ⊆ Q hat also ein Supremum in Q. (7) Sei X = { q P Q | q > 0 ∧ q2 ≤ 2 }. Dann ist X nach oben beschränkt (zum Beispiel durch 2). Es gilt max(X) existiert nicht, sup(X) = £2 ¸ Q. Die Teilmenge X der rationalen Zahlen hat also kein Supremum in Q. Anschaulich können wir dies so beschreiben: Ist s P Q eine obere Schranke von X, so können wir s durch Verkleinerung von rechts an X heranführen, wobei wir jederzeit in der Menge der rationalen Zahlen verbleiben müssen. Durch diese Einschränkung erreichen wir aufgrund der Irrationalität von £2 nie das Supremum von X. Wir steuern auf einen Punkt zu, den es in Q nicht gibt. Jede rationale obere Schranke von X lässt sich immer noch zu einer rationalen oberen Schranke von X verkleinern. Das Maximum und Minimum einer Menge ist immer ein Element der Menge. Das Supremum einer Menge kann der Menge angehören oder auch nicht, und das Gleiche gilt für das Infimum. Es gelten die folgenden Implikationen: (i) Existiert max(X), so ist sup(X) = max(X). (ii) Existiert min(X), so ist inf(X) = min(X). (iii) Ist s = sup(X), so ist s = max(X ∪ { s }). (iv) Ist s = inf(X), so ist s = min(X ∪ { s }). Nach diesen Vorbereitungen können wir nun die fundamentale Eigenschaft der reellen Zahlen, die sie von Q und anderen Zahlbereichen unterscheidet, axiomatisch fassen. © Oliver Deiser Einführung in die Mathematik 1 256 3. Abschnitt Reelle und komplexe Zahlen Das Vollständigkeitsaxiom Axiom (Vollständigkeitsaxiom für die reellen Zahlen) Jede nichtleere und nach oben beschränkte Menge reeller Zahlen besitzt ein Supremum in den reellen Zahlen. Wir bezeichnen die Aussage als Axiom, da wir die reellen Zahlen weiterhin als gegeben voraussetzen. Konstruiert man die Menge der reellen Zahlen (mit Hilfe der Axiome der Mengenlehre), so wird die Aussage zu einem beweisbaren Satz. Die in den obigen Beispielen betrachtete Menge X = { q P Q | q > 0 ∧ q2 ≤ 2 } ⊆ Q zeigt, dass die rationalen Zahlen ein analog formuliertes Vollständigkeitsaxiom verletzen: Die Menge X ist eine nichtleere und nach oben beschränkte Teilmenge von Q, die innerhalb der rationalen Zahlen kein Supremum besitzt. Sie markiert eine Lücke von Q, die in R durch £2 geschlossen wird. Um Rechenregeln für Suprema und Infima möglichst allgemein und unkompliziert formulieren zu können, ist es nützlich, auch leere und unbeschränkte Mengen zuzulassen. Hierzu vereinbaren wir: Konvention sup(∅) = −∞ inf(∅) = ∞ sup(X) = ∞, falls X ⊆ R nach oben unbeschränkt ist inf(X) = −∞, falls X ⊆ R nach unten unbeschränkt ist Für die symbolischen Werte ∞ und −∞ vereinbaren wir: −∞ < ∞ −∞ < x, x < ∞ für alle x P R ∞ + ∞ = ∞, −∞ − −∞ = −∞ x + ∞ = ∞, x − ∞ = −∞, x / ∞ = x / −∞ = 0 für alle x P R x ⋅ ∞ = ∞, x ⋅ −∞ = −∞ für alle x P ] 0, ∞ ] x ⋅ ∞ = −∞, x ⋅ −∞ = ∞ für alle x P [ − ∞, 0 [ Warnung Nicht erklärt sind ∞ − ∞, −∞ + ∞, 0 ⋅ ∞, 0 ⋅ −∞, ±∞/∞, ∞/±∞. Als nächstes führen wir arithmetische Operationen für Mengen reeller Zahlen ein: Einführung in die Mathematik 1 © Oliver Deiser 1. Die Vollständigkeit der reellen Zahlen 257 Definition (Addition und Skalierung von Teilmengen von R) Für alle X, Y ⊆ R und alle c P R setzen wir X + Y = { x + y | x P X und y P Y }, X ⋅ Y = X Y = { x y | x P X und y P Y }, cX = { c x | x P X }, −X = (−1) X = { −x | x P X }. Damit können wir nun Rechenregeln zusammenstellen: Satz (Rechenregeln für Suprema und Infima) Für alle nichtleeren X, Y ⊆ R gilt: (1) sup(X + Y) = sup(X) + sup(Y), (2) sup(c X) = c sup(X) für alle c > 0, (3) sup(X ⋅ Y) = sup(X) sup(Y), falls 0 ≤ X, Y, (4) X ⊆ Y impliziert sup(X) ≤ sup(Y), (5) inf(X) = −sup(−X), sup(X) = −inf(−X). Analoge Regeln gelten für Infima. Beweisskizze Wir zeigen exemplarisch die erste Eigenschaft für nach oben beschränkte und nichtleere Teilmengen X, Y von R. Seien also s = sup(X) und t = sup(Y). Für alle x P X und y P Y gilt x ≤ s und y ≤ t, sodass x + y ≤ s + t. Damit ist s + t eine obere Schranke von X + Y. Ist nun u P R beliebig mit u < s + t, so sei ε = s + t − u. Dann gilt ε > 0. Wegen s = sup(X) und t = sup(Y) gibt es x P X und y P Y mit x > s − ε/2 und y > t − ε/2 (sonst wären s − ε/2 bzw. t − ε/2 obere Schranken von X bzw. Y). Dann gilt x + y > s − ε/2 + t − ε/2 = s + t − ε = u, sodass u keine obere Schranke von X + Y ist. Dies zeigt, dass s + t die kleinste obere Schranke von X + Y ist. Aus der Eigenschaft (5) des Satzes folgt insbesondere: Korollar (Existenz von Infima) Sei X ⊆ R nichtleer und nach unten beschränkt. Dann existiert inf(X). Dass wir im Vollständigkeitsaxiom Suprema gegenüber Infima bevorzugt haben, hat keinen speziellen Grund. Fordert man die Existenz von Infima, so lässt sich die Existenz von Suprema folgern. © Oliver Deiser Einführung in die Mathematik 1 258 3. Abschnitt Reelle und komplexe Zahlen Das Archimedische Axiom Eine weitere wichtige Eigenschaft der reellen Zahlen lautet: Axiom (Archimedisches Axiom) Für alle reellen Zahlen x > 0 gibt es eine natürliche Zahl n ≥ 1 mit 1/n < x. ... 0.0 0.2 0.4 0.6 0.8 1.0 Das Infimum aller Zahlen 1/n, n ≥ 1, ist 0 Das Archimedische Axiom ist äquivalent zu inf({ 1/n | n ≥ 1 }) = 0. Damit sind infinitesimale Größen ausgeschlossen: Es gibt keine positive reelle Zahl, die kleiner ist als alle Zahlen 1/n mit n ≥ 1. Bemerkung Das Archimedische Axiom lässt sich aus dem Vollständigkeitsaxiom ableiten, sodass es in einer axiomatischen Charakterisierung der reellen Zahlen nicht explizit gefordert muss. Als exemplarische Anwendung des Axioms zeigen wir den folgenden nützlichen Satz: Satz (Identifikation von Suprema mit Hilfe des archimedischen Axioms) Sei X ⊆ R nichtleer und nach oben beschränkt. Weiter sei s P R. Dann sind äquivalent: (1) s = sup(X). (2) X ≤ s und für alle n P N* gibt es ein x P X mit x + 1/n > s. Die zweite Aussage können wir auch so formulieren: (2)′ X ≤ s und für alle n P N* gilt [ s − 1/n, x ] ∩ X ≠ ∅. Ein analoger Satz gilt natürlich auch für Infima. Beweis (1) impliziert (2) : Sei s = sup(X). Dann gilt X ≤ s. Sei also n ≥ 1 beliebig. Da s die kleinste obere Schranke von X ist, ist s − 1/n keine obere Schranke von X. Also gibt es ein x P X mit x > s − 1/n. Folglich ist x + 1/n > s. Einführung in die Mathematik 1 © Oliver Deiser 1. Die Vollständigkeit der reellen Zahlen 259 (2) impliziert (1) : Es gelte (2). Dann ist s eine obere Schranke von X. Sei nun t < s beliebig. Nach dem Archimedischen Axiom gibt es ein n ≥ 1 derart, dass 1/n ≤ s − t. Sei nun x P X mit x + 1/n > s (ein solches x existiert nach Voraussetzung). Dann ist aber x > s − 1/n ≥ t, sodass t keine obere Schranke von X ist. Dies zeigt, dass s die kleinste obere Schranke von X ist. Dichte Mengen Reelle Zahlen lassen sich durch rationale Zahlen beliebig genau approximieren. Es gilt: Satz (Dichtheit der rationalen Zahlen) Seien x, y P R mit x < y. Dann gibt es ein q P Q mit x < q < y. Beweis Wir setzen ε = y − x. Dann ist ε > 0. Folglich existiert ein n ≥ 1 mit 1/n < ε. Die Vielfachen m ⋅ 1/n P Q, m P N, von 1/n sind unbeschränkt in R und folgen aufeinander im Abstand 1/n, da (m + 1) 1/n − m 1/n = (m + 1 − m) 1/n = 1/n für alle m P N. Wegen 1/n < x − y muss also eines dieser Vielfachen zwischen x und y liegen. Allgemein definieren wir: Definition (dicht) Eine Menge D reeller Zahlen heißt dicht in R, falls für alle x < y in R ein z P D existiert mit x < z < y. Die rationalen Zahlen sind das Paradebeispiel für eine in R dichte Menge. Aber auch D = { ± n/2m | n, m P N } ist dicht in R. Und natürlich ist R selbst dicht in R. -1.0 -0.5 0.0 0.5 1.0 Visualisierung der dichten Menge D © Oliver Deiser Einführung in die Mathematik 1 260 3. Abschnitt Reelle und komplexe Zahlen Anwendungen Wir diskutieren nun einige Anwendungen der Vollständigkeit der reellen Zahlen. Sie zeigen die vielfältigen Einsatzmöglichkeiten von oberen und unteren Schranken. 1. Grenzwerte monotoner Folgen Als erstes betrachten wir den Zusammenhang zwischen Grenzwert und Supremum/Infimum für einfache Folgen x0 , x1 , x2 , …, xn , … reeller Zahlen. Dabei verwenden wir den Grenzwertbegriff (und den Begriff einer Folge selbst) nach wie vor anschaulich. Eine genaue Definition geben wir im nächsten Kapitel. Um die Notation zu vereinfachen, schreiben wir supn xn statt sup({ xn | n P N }), infn xn statt inf({ xn | n P N }). Der vielleicht einfachste Zusammenhang zwischen dem Grenzwert einer Folge und dem Supremum bzw. Infimum einer Menge ist: Satz (Grenzwerte monotoner Folgen) Sei x0 , x1 , …, xn , … eine Folge in R. Dann gilt (1) Ist die Folge monoton wachsend, d. h. xn ≤ xn + 1 für alle n, so gilt limn xn = supn xn P R ∪ { ∞ }. (2) Ist die Folge monoton fallend, d. h. xn > xn + 1 für alle n, so gilt limn xn = infn xn = R ∪ { −∞ }. Die Grenzwerte sind dabei genau dann Elemente von R, wenn die Folge beschränkt ist. Der Leser erstelle Diagramme zur Visualisierung dieser Zusammenhänge. Beispiele (1) Die Folge x0 , x1 , x2 , … mit xn = n für alle n ist monoton steigend. Es gilt limn xn = supn xn = ∞. (2) Die Folge x0 , x1 , x2 , … mit xn = 1/2n für alle n ist monoton fallend. Es gilt limn xn = infn xn = 0. (3) Die Folge x0 , x1 , x2 , … mit xn = (−1)n für alle n ist nicht monoton. Es gilt infn xn = −1 und supn xn = 1. Dagegen existiert limn xn nicht. Einführung in die Mathematik 1 © Oliver Deiser 1. Die Vollständigkeit der reellen Zahlen 261 2. Grenzwerte von Pendelfolgen Definition (Pendelfolge) Eine Folge x0 , x1 , …, xn , … reeller Zahlen heißt eine linksstartende Pendelfolge, falls gilt: x0 ≤ x2 ≤ … ≤ x2n ≤ … ≤ x2n + 1 ≤ … ≤ x3 ≤ x1 . Analog sind rechtsstartende Pendelfolgen definiert durch die Eigenschaft x1 ≤ x3 ≤ … ≤ x2n + 1 ≤ … ≤ x2n ≤ … ≤ x2 ≤ x0 . Wir beschränken uns im Folgenden auf linksstartende Pendelfolgen. Analoge Ergebnisse gelten für den zweiten Typ. Allgemein genügt es, sich auf einen Typ zu konzentrieren, denn die beiden Typen gehen durch das Streichen des ersten Folgengliedes ineinander über. Auch für Pendelfolgen können wir einen Zusammenhang zwischen Grenzwert und Supremum/Infimum herstellen: Satz (Grenzwerte von Pendelfolgen) Sei x0 , x1 , …, xn , …, eine linksstartende Pendelfolge in R. Dann existiert der Grenzwert der Folge genau dann, wenn gilt: infn (x2n + 1 − x2n ) = 0. (Konvergenzbedingung für Pendelfolgen) In diesem Fall ist limn xn = supn x2n = infn x2n + 1 . Ist nämlich s = supn x2n und t = infn x2n + 1 , so gilt s ≤ t. Die Konvergenzbedingung besagt, dass sich die geraden und ungeraden Glieder beliebig nahe kommen, sodass s = t. Genau dann ist s = t der Grenzwert der Folge. Die Folge x1 − x0 , x3 − x2 , …, x2n + 1 − x2n , … der Abstände der Paare einer linksstartenden Pendelfolge ist monoton fallend und nach unten beschränkt durch 0. Sie konvergiert also immer gegen ihr Infimum. Die Folge konvergiert genau dann, wenn dieses Infimum Null ist. Viele der Folgen, die uns in der Analysis begegnen, sind entweder monoton oder pendelnd (zumindest ab einer bestimmten Stelle n0 ). Damit decken die beiden Folgentypen bereits zahlreiche Fälle ab. Noch allgemeinere Folgen, die um ihren Grenzwert beliebig hin und her springen können, betrachten wir nächsten Kapitel. Beispiele (1) Die Folge x0 , x1 , x2 , … mit xn = (−1)n /2n für alle n ist eine rechtsstartende Pendelfolge mit 0 = limn xn = supn x2n + 1 = infn x2n . (2) Die Folge x0 , x1 , x2 , … mit xn = (−1)n + 1 für alle n ist eine linksstartende Pendelfolge, die die Konvergenzbedingung nicht erfüllt. © Oliver Deiser Einführung in die Mathematik 1 262 3. Abschnitt Reelle und komplexe Zahlen 3. Intervallschachtelungen Definition (Intervallschachtelung) Eine Folge I0 , I1 , …, In , … von reellen Intervallen In heißt eine Intervallschachtelung, falls gilt I0 ⊇ I1 ⊇ … ⊇ In ⊇ …. Für jede Intervallschachtelung können wir die Menge I = >n In = { x P R | x P In für alle n P N } aller Punkte betrachten, die in jedem der Intervalle als Element enthalten sind. Das wichtigste Ergebnis über diese Schnittmenge ist: Satz (Satz über Intervallschachtelungen) Sei I0 , I1 , …, In , … eine Intervallschachtelung bestehend aus abgeschlossenen und beschränkten Intervallen In = [ an , bn ]. Weiter sei I = >n In . Dann gilt I = [ supn an , infn bn ] ≠ ∅. Weiter gilt I = { supn an } = { infn bn } genau dann, wenn limn (bn − an ) = 0. Beweis Die monotonen Folgen a0 , a1 , … an , … und b0 , b1 , …, bn , … der linken und rechten Intervallgrenzen sind aufgrund der Schachtelung der Intervalle monoton steigend bzw. fallend und zudem beschränkt, sodass sie gegen ihr Supremum a bzw. Infimum b konvergieren. Das Intervall [ a, b ] ist ein Teilintervall jedes Intervalls In und somit im Durchschnitt I der Intervalle enthalten. Andererseits können wegen a = supn an und b = infn bn keine weiteren Punkte in I enthalten sein, sodass I = [ a, b ]. Aus der Äquivalenz von limn (an − bn ) = 0 und a = b ergibt sich der Zusatz. Der Durchschnitt einer Intervallschachtelung wie im Satz besteht genau dann aus genau einem Punkt, wenn die Folge der Intervall-Längen gegen Null konvergiert. Wir beobachten hierzu, dass die aus den Intervallgrenzen gebildete Folge a0 , b0 , a1 , b1 , …, an , bn , … eine linksstartende Pendelfolge ist. Gilt limn an = a = b = limn bn , so ist der Durchschnitt der Intervalle die einpunktige Menge { a } = { b }. Anschaulich ziehen sich die Intervalle auf den Punkt a = b zusammen. Einführung in die Mathematik 1 © Oliver Deiser 1. Die Vollständigkeit der reellen Zahlen 263 4. Die Dezimaldarstellung Wir betrachten endliche und unendliche Dezimalbrüche. Dabei beschränken wir uns auf nichtnegative reelle Zahlen. Für m P N und Nachkommaziffern d1 , …, dn P { 0, …, 9 } setzen wir m, d1 … dn = m + d1 10 + d2 100 + … + dn . 10n (endlicher Dezimalbruch) Lesen wir die Ziffernfolge d1 … dn als Dezimalzahl, so gilt m, d1 … dn = m + d1 …dn . 10n Wir erinnern an: Charakterisierung der endlichen Dezimalbrüche Genau die rationalen Zahlen q ≥ 0 der Form q = a/10n lassen sich als endlicher Dezimalbruch schreiben. In gekürzter Form sind dies genau die Brüche, deren Nenner nur die Primfaktoren 2 und 5 enthält. Beispielsweise lassen sich also 1/5 und 3/20, nicht aber 1/7 oder 2/15 als endlicher Dezimalbruch schreiben. Mit Hilfe des Supremumsbegriffs können wir unendliche Dezimalbrüche definieren: Definition (unendlicher Dezimalbruch) Für m P N und eine Folge (dn )n P N in { 0, …, 9 } setzen wir m,d1 d2 … = supn m,d1 …dn . (unendlicher Dezimalbruch) Statt „sup“ können wir auch „lim“ schreiben, da die Folge der endlichen Dezimalbrüche monoton steigend und nach oben beschränkt durch m + 1 ist. Jeder unendliche Dezimalbruch definiert eine eindeutige reelle Zahl x ≥ 0. Die Umkehrung ist im Allgemeinen nicht gültig. Dieses bedeutsame Phänomen lässt sich mit Hilfe der Definition als Supremum sehr einfach erklären: Beispiel: Neuner-Periode Es gilt 1 = 1,000… = 0,999… Denn nach Definition ist 0,999… = supn 0,9…9 (mit n Stellen) = supn (1 − 1/10n ) = 1 − infn 1/10n = 1 − 0 = 1. Der Einwand, dass zu 1 in 0,999… immer noch „etwas fehlen“ würde, ist damit entkräftet: 0,999… ist definiert als Supremum einer Menge (oder gleichwertig als Grenzwert einer Folge), und ein Supremum muss einer Menge nicht angehören (ein Grenzwert nicht von den Folgengliedern angenommen werden). © Oliver Deiser Einführung in die Mathematik 1 264 3. Abschnitt Reelle und komplexe Zahlen Allgemein gilt: Charakterisierung der Nichteindeutigkeit Jede reelle Zahl x ≥ 0 hat genau eine oder genau zwei unendliche Dezimaldarstellungen. Genauer gilt: (1) 0 hat die eindeutige unendliche Dezimaldarstellung 0 = 0,000… (2) Eine reelle Zahl x > 0 hat genau dann zwei unendliche Darstellungen, wenn x von der Form m, d1 … dn ist mit dn ≠ 0. In diesem Fall gilt x = m, d1 …dn 000… (Nullfortsetzung) x = m, d1 … (dn − 1)999… (Neuner-Periode) Aus der Charakterisierung folgt, dass die Darstellung einer irrationalen Zahl stets eindeutig ist. Aber auch rationale Zahlen wie 1/3 oder 1/7 haben eine eindeutige unendliche Dezimaldarstellung. Welche Zahlen dies sind ergibt sich aus der obigen Charakterisierung der endlichen Dezimalbrüche. Wir betrachten zwei Möglichkeiten der Veranschaulichung oder, wenn man so will, Interpretation von Dezimalbrüchen: Visualisierung 1: Abmessen am Zahlstrahl Die Dezimaldarstellung einer reellen Zahl x > 0 lässt sich anschaulich durch „Abmessen am Zahlenstrahl“ mit immer kleineren Maßstäben 1, 1/10, 1/100, … beschreiben. Mit den so produzierten endlichen Dezimalbrüchen entstehen rationale Approximationen an x, die monoton steigend gegen x konvergieren. Erlauben wir, dass eine Approximation exakt gleich x ist, so ist eine in 0 auslaufende Folge von Approximationen möglich. Fordern wir dagegen, dass jede Approximation echt kleiner als x sein muss, so erhalten wir immer eine streng monoton steigende Folge von endlichen Dezimalbrüchen, die in manchen Fällen in der Ziffer 9 terminiert. Visualisierung 2: Verwendung von Bäumen Ist x ein Element von [ 0, 1 [, so können wir [ 0, 1 ] in 10 Teilintervalle [ 0, 1/10 [, [ 1/10, 2/10[ , …, [ 9/10, 1 [ zerlegen und fragen, in welchem der Teile sich x befindet. So finden wir eine erste Dezimalstelle d1 . Nun wiederholen wir das Verfahren mit dem Intervall [ d1 /10, (d1 + 1)/10 [ und erhalten so d2 . So fortfahrend ergibt sich die Darstellung x = 0, d1 d2 …, wobei wir im zweideutigen Fall (x ist eine der auftretenden Intervallgrenzen) die in 0 terminierende Darstellung erzeugen, da wir nach rechts offene Intervalle verwenden. Die Darstellung lässt sich als unendlicher Pfad in einem Baum auffassen, dessen Knoten mit Intervallen beschriftet sind und der sich an jedem Knoten zehnfach verzweigt. Einführung in die Mathematik 1 © Oliver Deiser 1. Die Vollständigkeit der reellen Zahlen 265 5. b-adische Darstellungen Eine natürliche Verallgemeinerung der Dezimaldarstellung ist die b-adische Darstellung für eine beliebige natürliche Basis b ≥ 1. Obige Definitionen werden übernommen, wobei nun anstelle der Menge { 0, …, 9 } von Nachkommastellen die Menge { 0, …, b − 1 } tritt und die Nenner 10n durch bn ersetzt werden. Die Dezimaldarstellung entspricht dem Fall b = 10. In der Mathematik, Informatik und Kulturgeschichte sind neben b = 10 vor allem bedeutsam: b=2 Dualdarstellung b=3 Ternärdarstellung b = 16 Hexadezimaldarstellung b = 60 Hexagesimaldarstellung Für die Hexadezimaldarstellung verwendet man statt 0, …, 15 die Nachkommaziffern 0, …, 9, A, …, F, um keine Trennstellen in der Darstellung angeben zu müssen. Analoges gilt allgemein für b-adische Darstellungen mit b > 10. Beispiele (1) In Dualdarstellung gilt 1 = 1,000… = 0,111… = supn (1/2 + 1/4 + 1/8 + … + 1/2n ). (2) In 7-adischer Darstellung gilt 1 = 1,000… = 0,666… = supn (6/7 + 6/72 + 6/73 + … + 6/7n ). Die beiden oben geschilderten Möglichkeiten der Visualisierung lassen sich leicht an den Fall einer allgemeinen b-adischen Darstellung anpassen. An die Stelle der Maßstäbe 1/10k treten die Maßstäbe 1/bk . Und die Bäume aus Intervallen sind nun b-fach statt 10-fach verzweigt. [0, 1 [ 8 1 1 [ , [ 8 4 1 3 [ , [ 4 8 [0, 1 4 [ 3 1 [ , [ 8 2 1 5 [ , [ 2 8 5 3 [ , [ 8 4 1 1 [ , [ 4 2 1 3 [ , [ 2 4 3 [ , 1[ 4 [0, 1 3 7 [ , [ 4 8 7 [ , 1[ 8 1 [ , 1[ 2 [ 2 [0, 1[ Baumdiagramm zur Dualdarstellung © Oliver Deiser Einführung in die Mathematik 1 266 3. Abschnitt Reelle und komplexe Zahlen 6. Ober- und Unterintegral Das Integral einer Funktion f : [ a, b ] → R kann anstelle von Riemann-Summen mit Hilfe von Ober- und Unterintegralen definiert werden. Hierzu wird in jedem Intervall einer stützstellenfreien Partition p = (tk )k ≤ n von [ a, b ] das Supremum bzw. Infimum aller Funktionswerte des Intervalls gebildet. Dadurch entstehen Approximationen von oben und von unten: S p f = ∑ k ≤ n (t k + 1 − t k ) sup x P [ t k , t k + 1 ] f(x), (obere Darboux-Summe) s p f = ∑ k ≤ n (t k + 1 − t k ) inf x P [ t k , t k + 1 ] f(x). (untere Darboux-Summe) t0 t1 t2 t3 t4 t5 t0 t1 t2 t3 t4 t5 Die obere und untere Darboux-Summe einer Funktion für eine stützstellenfreie Partition Einführung in die Mathematik 1 © Oliver Deiser 1. Die Vollständigkeit der reellen Zahlen 267 Die Funktion f wird bei der Bildung einer Darboux-Summe als beschränkt vorausgesetzt, damit die Suprema und Infima definiert sind. Stützstellen und zugehörige Funktionswerte spielen keine Rolle. Wir setzen nun S f = infp Sp f, (Oberintegral) s f = supp sp f. (Unterintegral) Das Infimum bzw. Supremum wird über alle Partitionen p gebildet (wobei man sich auf äquidistante Partitionen beschränken kann). Es gilt stets s f ≤ S f. Man kann nun zeigen, dass f genau dann Riemann-integrierbar ist, wenn s f = S f gilt, d. h. wenn Ober- und Unterintegral übereinstimmen. Dieser Zugang zur Integration, oft auch Darboux-Integral genannt, ist also äquivalent zum Zugang über Riemann-Summen. Er ist theoretisch aufgrund des eleganten Kalküls mit Suprema und Infima ansprechend, aus numerischer Sicht aber weniger geeignet, da die Darboux-Summen im Vergleich zu den Riemann-Summen viel schwieriger zu berechnen sind. Wie so oft sind beide Wege wertvoll. © Oliver Deiser Einführung in die Mathematik 1 268 3. Abschnitt Reelle und komplexe Zahlen Übungen Übung 1 Zeigen Sie in Analogie zum Beweis der Irrationalität von £2, dass £3 irrational ist. Warum scheitert der Beweis bei £4? Auf welche Zahlen lässt sich das Argument allgemein anwenden? Übung 2 Recherchieren Sie den Beweis der Irrationalität von £2, der sich in den „Elementen“ des Euklid findet. Vergleichen Sie diesen Beweis mit unserem Argument. Übung 3 Bestimmen Sie die Infima und Suprema der folgenden Mengen: (a) [ 0, 1 ] ∪ { 2 }, (b) ] 0, 1 [ ∪ ] 2, 3 [, (c) { sin(x) | 0 ≤ x ≤ π/2 }, (d) { (−1)n /n | n ≥ 1 }, (e) { 3/10, 33/100, 333/1000, … }, (f ) { 1/2 + 1/4 + … + 1/2n | n ≥ 1 }, (g) sup({ 1 + 1/k | k ≥ n }) | n ≥ 1 }). Übung 4 Zeigen Sie, dass die Eigenschaft sup(X + Y) = sup(X) + sup(Y) unter den eingeführten Konventionen für alle nichtleeren (nicht notwendig beschränkten) X, Y ⊆ R gültig ist. Kann man auch leere Teilmengen zulassen? Übung 5 Sei X ⊆ R. Zeigen Sie: inf(X) = − sup(− X), sup(X) = − inf(− X). Übung 6 Zeigen Sie, dass das Archimedische Axiom äquivalent ist zur Aussage (+) N ist unbeschränkt in R. Einführung in die Mathematik 1 © Oliver Deiser 1. Die Vollständigkeit der reellen Zahlen 269 Übung 7 Nehmen Sie an, dass Q dicht in R ist und zeigen Sie mit Hilfe dieser Voraussetzung das Archimedische Axiom. Übung 8 Begründen Sie die Dichtheit der rationalen Zahlen in R mit Hilfe der Dezimalbruchentwicklung. Übung 9 Sei D = { ± n/2m | n, m P N } ⊆ Q. Geben Sie eine möglichst einfache beschränkte nichtleere Teilmenge von D an, deren Supremum in Q − D liegt. Stellen Sie eine Analogie zu £2 her. Übung 10 Definieren Sie die Menge D der vorangehenden Übung mit Hilfe von Dualdarstellung. Übung 11 Sei b eine natürliche Zahl mit b ≥ 2. (a) Geben Sie (ohne Begründung) alle möglichen b-adischen Darstellung der folgenden reellen Zahlen an: 1, 1 , b a für 1 ≤ a < b, b−1 1 . 2 (b) Charakterisieren Sie (mit kurzer Begründung) alle reellen Zahlen x > 0, die genau zwei b-adische Darstellungen besitzen. Geben Sie einige Beispiele an. Übung 12 Erstellen Sie Diagramme zu den im Text beschriebenen Visualisierungen der Dezimaldarstellung für eine reelle Zahl x P [ 0, 1 ]: (1) Approximation am Zahlenstrahl von links (2) wiederholte Intervallteilung (Baumstruktur) Erläutern Sie das Phänomen der Zweideutigkeit für beide Visualisierungen. Verallgemeinern Sie zudem die Visualisierungen auf b-adische Darstellungen und betrachten Sie speziell den Fall b = 2 für die Visualisierung (2). © Oliver Deiser Einführung in die Mathematik 1 2. Grenzwerte für Folgen und Reihen Wir definieren nun Grenzwerte von Folgen (xn )n P N = (x0 , x1 , x2 , …, xn , …) und unendlichen Reihen ∑ n xn = x0 + x1 + x2 + … + xn + … in R formal mit Hilfe der Epsilontik. Diese Definitionsform wird heute in der Analysis zur Präzisierung aller Arten von Grenzwertbegriffen verwendet. © Oliver Deiser Einführung in die Mathematik 1 272 3. Abschnitt Reelle und komplexe Zahlen Folgen Wir präzisieren zunächst den Begriff einer Folge. Allgemein definieren wir: Definition (Folge in einer Menge) Sei M eine Menge. Eine Folge in M (mit Definitionsbereich N) ist eine Funktion der Form f : N → M. Notation (Folgennotation) Wir notieren eine Folge f : N → M in einer Menge M oft als f = (xn )n P N , mit xn = f(n) für alle n P N. Einen Wert xn = f(n) nennen wir auch ein Glied der Folge und die Stelle n einen Index. Anstelle von (xn )n P N schreiben wir auch (x0 , x1 , x2 , …, xn , …) oder x0 , x1 , x2 , …, xn , … Eine Folge wird üblicherweise nicht mit einem Funktionsnamen wie f,g,h versehen (man kann dies natürlich tun, wenn man möchte), sondern einfach in der Form (xn )n P N angegeben. Besonders nützlich ist die Folgennotation, wenn die Funktionswerte durch Terme definiert sind. So ist zum Beispiel (n2 )n P N die Funktion f auf N mit f(n) = n2 für alle n P N. Folgen tauchen in vielen Varianten auf. Oft beginnt man mit dem Index 1 statt 0 und notiert eine solche Folge in der Form (xn )n ≥ 1 oder x1 , x2 , …, xn , … (n ≥ 1). Da eine Folge eine Funktion (einer bestimmten Form) ist, stehen ohne weitere Definitionen alle funktionalen Begriffe zur Verfügung: Beispiele (1) Die Folge (1)n P N ist die Folge (xn )n P N mit xn = 1 für alle n. In der alternativen Notation lautet sie 1, 1, 1, … (2) Die Folge (1/n)n ≥ 1 ist die Folge (xn )n ≥ 1 mit xn = 1/n für alle n ≥ 1. Wir können sie auch notieren als 1, 1/2, 1/3, …, 1/n, … (3) Eine Folge (xn )n P N ist injektiv, wenn alle Folgenglieder paarweise verschieden sind, d. h. wenn xn ≠ xm für alle n ≠ m. (4) Eine Folge (xn )n P N in R ist monoton wachsend, wenn xn ≤ xn + 1 für alle n gilt. Gilt stärker xn < xn + 1 für alle n, so ist sie streng monoton wachsend. (5) Ist (xn )n P N eine Folge in R und (nk )k P N eine Folge in N, so ist (xn )n P N + (nk )k P N = (xnk )k P N . Der besseren Lesbarkeit halber kann man den Index nk auch in der Form n(k) schreiben und die Komposition als (xn(k) )k P N angeben. Einführung in die Mathematik 1 © Oliver Deiser 2. Grenzwerte für Folgen und Reihen 273 Zur Visualisierung einer reellen Folge stehen verschiedene Möglichkeiten zur Verfügung. Zwei davon betrachten wir genauer. Visualisierung einer reellen Folge, Typ I Die Folge (xn )n P N wird als Punktfolge auf der x-Achse gezeichnet. Man trägt die Folgenglieder xn als Punkte auf der x-Achse ein und benennt die Punkte derart, dass die Indizes eindeutig aus dem Diagramm hervorgehen. Visualisierung einer reellen Folge, Typ II Die Folge (xn )n P N wird als Funktionsgraph (bestehend aus Punkten der Ebene) gezeichnet: Der Graph besteht aus den Punkten (n, xn ) P R2 , n P N. x2 n + 1 -2 x2 n -1 0 1 2 Typ I: Visualisierung der Folge 1, −1, 1, −1, 1, −1, … 1.0 0.5 1 2 3 4 5 6 7 8 9 10 -0.5 -1.0 Typ II: Visualisierung der Folge 1, −1, 1, −1, 1, −1, … 1.0 0.5 1 2 3 4 5 6 7 8 9 10 -0.5 Typ II: Visualisierung der Folge (xn )n ≥ 1 mit xn = (−1)n + 1 /n für alle n ≥ 1 © Oliver Deiser Einführung in die Mathematik 1 274 3. Abschnitt Reelle und komplexe Zahlen Die Epsilon-Definition des Grenzwerts einer Folge Anschaulich bedeutet x = limn P N xn , dass die Folgenglieder gegen x streben, wenn n gegen unendlich strebt. Wie lässt sich dies präzisieren? Der erste Ansatz ist vielleicht: „Die Folgenglieder xn kommen dem Wert x beliebig nahe.“ Dies ist notwendig für die Konvergenz gegen x, aber nicht ausreichend. Die Folge 1/2, 1, 1/4, 1, 1/8, 1, … kommt zum Beispiel der Null beliebig nahe, hat aber die Null nicht als Grenzwert. Wir müssen also die Bedingung verstärken: „Die Folgenglieder xn sind ab einer bestimmten Stelle beliebig nahe bei x.“ Mit dieser Formulierung sind wir schon fast am Ziel. Wir müssen nur noch die Abhängigkeitsverhältnisse zwischen „ab einer bestimmten Stelle“ und „beliebig nahe“ klären, um eine exakte Definition zu erhalten, mit der wir arbeiten können. Allen Ansprüchen an Genauigkeit gerecht wird: Definition (Grenzwert, Limes, Konvergenzbedingung) Sei (xn )n P N eine Folge in R, und sei x P R. Dann heißt x Grenzwert oder Limes der Folge (xn )n P N , falls gilt ∀ε > 0 ∃n0 ∀n ≥ n0 |x − xn | < ε. (Konvergenzbedingung) x+ x x- 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Visualisierung der Konvergenz-Bedingung für eine Folge (xn )n P N Einführung in die Mathematik 1 © Oliver Deiser 2. Grenzwerte für Folgen und Reihen 275 Die Konvergenzbedingung besagt, dass für jedes (noch so kleine) ε > 0 ein Index n0 existiert, sodass alle xn ab der Stelle n0 (d. h. für n ≥ n0 ) im Intervall I(x, ε) = ] x − ε, x + ε [ liegen. Mit der Konvention „fast alle“ = „alle bis auf höchstens endlich viele Ausnahmen“ können wir die Konvergenzbedingung so formulieren: Umformulierung der Konvergenzbedingung Für alle ε > 0 gilt: Fast alle Folgenglieder sind Elemente von I(x, ε) = ] x − ε, x + ε [. Diese Umformulierung lässt sich anschaulich so ausdrücken: „Jedes (noch so kleine) Intervall ] x − ε, x + ε [ fängt die Folge schließlich ein.“ Im Fall der Existenz ist ein Grenzwert eindeutig bestimmt (Beweis als Übung). Damit können wir einführen: Limesnotation Ist x P R der Grenzwert der Folge (xn )n P N , so schreiben wir x = limn →∞ xn oder kurz x = limn xn . Schließlich definieren wir: Definition (konvergent, divergent) Sei (xn )n P N eine Folge in R. Besitzt (xn )n P N einen Grenzwert x P R, so heißt die Folge konvergent. Andernfalls heißt sie divergent. Definition (Nullfolge) Gilt limn xn = 0, so nennen wir (xn )n P N auch eine Nullfolge. Uneigentliche Grenzwerte Wie für die Bildung von Supremum und Infimum ist es oft nützlich, auch die symbolischen Werte ∞ und −∞ als Grenzwerte zuzulassen. Definition (uneigentliche Konvergenz) Für eine Folge (xn )n P N in R definieren wir limn xn = ∞ falls limn xn = −∞ falls ∀k > 0 ∃n0 ∀n ≥ n0 xn ≥ k, ∀k > 0 ∃n0 ∀n ≥ n0 xn ≤ −k. Gilt limn xn = ± ∞, so nennen wir die Folge (xn )n P N uneigentlich konvergent. Die Bedingungen besagen anschaulich, dass fast alle Glieder der Folge größer- © Oliver Deiser Einführung in die Mathematik 1 276 3. Abschnitt Reelle und komplexe Zahlen gleich (bzw. kleinergleich) einer beliebigen vorgegebenen Schranke sind. Eine uneigentlich konvergente Folge ist nach wie vor divergent im Sinne der (eigentlichen) Konvergenz einer Folge in R. Beispiele (1) Es gilt limn ≥ 1 1/n = 0. Die Folge (1/n)n ≥ 1 ist eine Nullfolge. (2) Es gilt limn n = ∞. Die Folge (n)n P N ist uneigentlich konvergent. (3) limn (−1)n existiert nicht. Die Folge ((−1)n )n P N ist beschränkt und divergent. limn (−1)n n existiert nicht. Die Folge ((−1)n n)n P N konvergiert weder eigentlich noch uneigentlich. (4) Es gilt limn xn = ∞ genau dann, wenn limn −xn = −∞. Die Limesregeln Für die Berechnung von Grenzwerten sind die folgenden Regeln unentbehrlich, die wir hier ohne Beweis angeben: Satz (Limesregeln) Seien (xn )n P N und (yn )n P N (x n )n P N konvergente Folgen in R. Dann gilt: (a) lim n (x n + yn ) = lim n x n + lim n yn , (b) lim n (c x n ) = c lim n x n für alle c P R, (c) lim n (x n − yn ) = lim n x n − lim n yn , (d) lim n (x n yn ) = lim n x n lim n yn . (e) lim n ( xn yn ) = lim n xn , falls yn ≠ 0 für alle n und limn yn ≠ 0. lim n yn Beispiele (1) Es gelte lim n x n = x. Dann gilt lim n (xn2 ) = lim n (x n x n ) = (lim n x n ) ⋅ (lim n x n ) = x x = x2 . Analoges gilt für höhere Exponenten. (2) Es gilt lim n ≥ 1 ( 2 + n3 n3 2 lim n ≥ 1 1 n )3 Einführung in die Mathematik 1 = lim n ≥ 1 ( 2 n3 + n3 n3 ) = + lim n ≥ 1 1 = 2 ⋅ 0 3 + 1 = 1. © Oliver Deiser 2. Grenzwerte für Folgen und Reihen 277 Eine Charakterisierung der konvergenten Folgen Welche Folgen konvergieren und welche nicht? Für monotone Folgen und Pendelfolgen können wir einfache Kriterien angeben: Konvergenzkriterium für monotone Folgen Eine monotone Folge (xn )n P N konvergiert genau dann, wenn sie beschränkt ist. In diesem Fall gilt je nach Monotonietyp limn xn = supn xn bzw. (bei monotoner Zunahme) limn xn = infn xn . (bei monotoner Abnahme) Konvergenzkriterium für Pendelfolgen Eine Pendelfolge (xn )n P N konvergiert genau dann, wenn die Folge der Abstände gerader und ungerader Folgenglieder gegen Null konvergiert, d. h. wenn limn |x2n + 1 − x2n | = 0. In diesem Fall gilt je nach Typ limn xn = supn x2n = infn x2n + 1 bzw. (bei Linksstart) limn xn = supn x2n + 1 = infn x2n . (bei Rechtsstart) Was kann man über die Konvergenz allgemeiner Folgen sagen, die nicht notwendig diesen beiden Grundtypen angehören? Erstaunlicherweise gibt es eine Bedingung, die für alle Folgen geeignet ist. Sie besagt anschaulich, dass sich die Folgenglieder beliebig verdichten: Definition (Cauchy-Folge, Cauchy-Bedingung) Eine Folge (xn )n P N in R heißt Cauchy-Folge, falls gilt ∀ε > 0 ∃n0 ∀n, m ≥ n0 |xn − xm | < ε. (Cauchy-Bedingung) Diese Bedingung fängt genau die konvergenten Folgen ein: Satz (Charakterisierung der konvergenten Folgen) Sei (xn )n P N eine Folge in R. Dann konvergiert die Folge genau dann, wenn sie eine Cauchy-Folge ist. In diesem Fall ist limn xn = infn supk ≥ n xk = supn infk ≥ n xk . Der Beweis dieses Satzes wird in der Analysis geführt. Die Formeln für den Grenzwert zeigen, dass der Grenzwert auch im allgemeinen Fall mit Hilfe einer Supremums- und Infimums-Bildung identifiziert werden kann. Die Formeln sind deutlich komplizierter als die Formeln für monotone Folgen und Pendelfolgen, dafür aber für alle Folgen anwendbar. © Oliver Deiser Einführung in die Mathematik 1 278 3. Abschnitt Reelle und komplexe Zahlen Konvergenz von Cauchy-Folgen als Axiom Die Aussage „Jede Cauchy-Folge in R konvergiert.“ wird auch oft als Axiom für die reellen Zahlen verwendet und als (metrisches) Vollständigkeitsaxiom bezeichnet. Zusammen mit dem Archimedischen Axiom ist das metrische Vollständigkeitsaxiom äquivalent zu unserem linearen Vollständigkeitsaxiom, das die Existenz eines Supremums für nichtleere und beschränkte Teilmengen von R fordert. Welchen Zugang man für die reellen Zahlen bevorzugt, ist letztendlich Geschmackssache. Die Existenz eines Supremums einer nichtleeren beschränkten Teilmenge von R ist vielleicht etwas anschaulicher als die Existenz des Grenzwerts einer Cauchy-Folge. Ganz unabhängig davon ist der Begriff der Cauchy-Folge unverzichtbar zur Beschreibung der Vollständigkeit von Räumen, die eine Abstandsmessung zulassen, aber keine lineare Struktur mehr aufweisen. Unendliche Reihen Wir haben schon mehrfach unendliche Summen der Form (+) x0 + x1 + … + xn + … betrachtet, sog. unendliche Reihen. Mit Hilfe des Grenzwerts für Folgen können wir die Konvergenz unendlicher Reihen präzisieren ohne weitere Grenzwertdefinitionen einzuführen. Dies erfolgt durch Betrachtung der Partialsummen s0 = x0 , s1 = x0 + x1 , s2 = x0 + x1 + x2 , …, sn = x0 + … + xn , …, die auftreten, wenn wir die Summe (+) schrittweise berechnen. Definition (Partialsumme, unendliche Reihe, Summe, Wert) Sei (x n )n P N eine Folge in R. Für alle n P N sei sn = x0 + … + xn = ∑ k ≤ n x k die n-te Partialsumme der Folge. Wir setzen ∑ n P N x n = (sn )n P N und nennen ∑ n P N xn die unendliche Reihe mit den Summanden xn . Im Fall der Konvergenz der Folge der Partialsummen setzen wir zudem ∑ n P N x n = limn sn . Diesen Grenzwert nennen wir die Summe von (xn )n P N oder den Wert der unendlichen Reihe. Notation Neben ∑ n P N x n verwenden wir gleichwertig auch die Notationen ∞ ∑ n = 0 x n , ∑ n ≥ 0 x n , ∑ n x n , x0 + x1 + x2 + … + xn + … Einführung in die Mathematik 1 © Oliver Deiser 2. Grenzwerte für Folgen und Reihen 279 Das Summenzeichen hat eine Doppelbedeutung: Für jede Folge (xn )n P N ist die unendliche Reihe ∑ n xn definiert als die Folge (sn )n P N der Partialsummen der Folge. Konvergiert die Folge der Partialsummen, so bezeichnet ∑ n xn nun auch den Grenzwert der Folge der Partialsummen. Die Bedeutung geht in der Regel aus dem Kontext hervor: Beispiel 1. Bedeutung: „Die Reihe ∑ n 1/2n konvergiert.“ 2. Bedeutung: „Es gilt ∑ n 1/2n = 1 + 1/2 + 1/4 + … + 1/2n + … = 2.“ 1. Bedeutung: „Die Reihe ∑ n (−1)n divergiert.“ 2.0 1.5 1.0 0.5 0 1 2 3 4 5 6 7 8 9 10 Die Partialsummen sn der unendlichen Reihe ∑ n 1/2n . Es gilt limn sn = 2 und damit ∑ n 1/2n = 2. 1 0.5 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Die Partialsummen sn der unendlichen Reihe ∑ n (−1)n . Die Reihe ∑ n (−1)n divergiert, da die Folge der Partialsummen divergiert. © Oliver Deiser Einführung in die Mathematik 1 280 3. Abschnitt Reelle und komplexe Zahlen Die geometrische Reihe Sei q P R. Bei der Diskussion der Polynomdivision hatten wir bereits die geometrische Summe q0 + … + qn = 1 − qn + 1 , 1−q falls q ≠ 1 betrachtet, die sich aus der (auch für q = 1 gültigen) Teleskop-Summe (q0 + … + qn ) (1 − q) = q0 − q1 + q2 − q2 + … − qn + 1 = 1 − qn + 1 ergibt. Die zugehörige unendliche Reihe ist ∑ n qn = q0 + … + qn + … (geometrische Reihe) Ihr Konvergenzverhalten wird zusammengefasst in: Satz (Konvergenz der geometrischen Reihe) Sei q P R. Ist |q| < 1, so ist ∑ n qn konvergent und es gilt ∑ n qn = 1 . 1−q Ist |q| ≥ 1, so divergiert ∑ n qn . Wir erinnern an den Beweis. Ist |q| < 1, so gilt ∑ n qn = limn sn = limn 1 − qn + 1 1−q = 1 , 1−q wobei wir verwenden, dass limn qn + 1 = limn qn = 0 (da |q| < 1). Ist dagegen |q| > 1, so gilt |sn + 1 − sn | ≥ 1 für alle n, sodass die Folge (sn )n P N der Partialsummen divergent ist. Nützlich ist: Geometrische Reihe ab dem Index 1 ∑ n ≥ 1 qn = q 1−q für alle |q| < 1. Diese Formel ergibt sich aus 1 1−q − q0 = 1 1−q Einführung in die Mathematik 1 − 1 = q . 1−q © Oliver Deiser 2. Grenzwerte für Folgen und Reihen 281 1.0 0.8 0.6 0.4 0.2 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Die Folge Partialsummen sn der geometrischen Reihe ∑ n qn mit q = −2/3. Die Reihe konvergiert gegen 1/(1 − q) = 3/5. 1.0 0.8 0.6 0.4 0.2 0 5 10 15 20 25 30 35 40 45 50 Die Partialsummen sn der geometrischen Reihe ∑ n qn mit q = −9/10. Die Reihe konvergiert (deutlich langsamer als oben) gegen 1/(1 − q) = 10/19. Für positive q sind die Partialsummen der geometrischen Reihe ∑ n qn streng monoton wachsend. Für q P [ 0, 1 ] konvergiert die Reihe. Strebt q im Intervall [ 0, 1 ] gegen 1, wird der Wert der Reihe beliebig groß, da dann 1/(1 − q) gegen unendlich konvergiert. Ab einschließlich q = 1 ist die geometrische Reihe uneigentlich konvergent gegen ∞. Für negative q bilden die Partialsummen von ∑ n qn eine rechtsstartende Pendelfolge. Für q P ] −1, 0 [ konvergiert die Reihe mit Werten im Intervall ] 1/ 2, 1 [. Für q ≤ −1 ist die Reihe divergent und auch nicht uneigentlich konvergent. Für q = −1 ergibt sich 1, 0, 1, 0, … als Folge der Partialsummen. Die Formel 1/(1 − q) liefert für q = −1 den Wert 1/2, aber die Folge der Partialsummen divergiert. © Oliver Deiser Einführung in die Mathematik 1 282 3. Abschnitt Reelle und komplexe Zahlen Die harmonische Reihe Die harmonische Reihe ist die Reihe 1 n ∑n ≥ 1 1 2 = 1 + + 1 3 + 1 4 + … Die Partialsummen sn dieser Reihe sind aufgrund der positiven Summanden streng monoton steigend. Das Wachstum ist jedoch sehr langsam. Durch folgende geistreiche Zusammenfassung von Summanden können wir sehen, dass die harmonische Reihe divergiert: 1 + 1 2 = 1 + ≥ 1 2 + 1 3 1 + 2 1 2 + 1 4 + ( + … 1 1 + 3 4 + 1 2 )+( 1 1 +…+ 5 8 )+( 1 1 +…+ 9 16 )+… + … = ∞. Die harmonische Reihe zeigt: Eine Nullfolge aus positiven Summanden führt nicht immer eine endliche Summe. Man kann zeigen, dass die Folge der Partialsummen sn = 1 + … + 1/n der harmonischen Reihe bis auf eine Konstante so wächst wie der natürliche Logarithmus. Es gilt limn ( sn − log(n) ) = γ = 0,57721… (Euler-Mascheroni-Konstante) 5 4 3 log(x) 2 log(x) + 1 5 10 15 20 25 -1 Die Partialsummen der harmonischen Reihe im Vergleich mit dem Logarithmus Einführung in die Mathematik 1 © Oliver Deiser 2. Grenzwerte für Folgen und Reihen 283 In den Übungen werden wir sehen, dass ∑n ≥ 1 1 n2 = 1 + 1 4 1 9 + + 1 16 + … konvergiert. Euler zeigte, dass π2 /6 der Wert dieser Reihe ist. s 1.5 1 0.5 0 5 10 15 20 25 Die Partialsummen der Reihe ∑ n 1/n2 und ihr Wert s = π2 /6 = 1,6449… Allgemeiner konvergiert die Reihe ∑n ≥ 1 1 nk = 1 + 1 2k 1 3k + + … für jedes k ≥ 2. Die Werte dieser Reihen konnten für gerade Exponenten k berechnet werden. So gilt zum Beispiel ∑n ≥ 1 1 n4 = π4 , 90 ∑n ≥ 1 1 n6 = π6 . 945 Für ungerade Exponenten k ist dagegen nur wenig bekannt. Ein einfacher Zusammenhang zwischen ∑ n ≥ 1 1/n3 und π3 scheint nicht zu bestehen. Eine unendliche Reihe, die noch langsamer divergiert als die harmonische Reihe, ist ∑ p prim 1 p = 1 2 + 1 3 + 1 5 + 1 7 + 1 11 + … = ∞. Die Divergenz dieser Reihe kann mit Methoden der analytischen Zahlentheorie gezeigt werden. Das Wachstum entspricht dem von log(log(x)) und wieder taucht die Euler-Mascheroni-Konstante γ auf. Ein bemerkenswertes Ergebnis einer wunderbaren Theorie. © Oliver Deiser Einführung in die Mathematik 1 284 3. Abschnitt Reelle und komplexe Zahlen 2.0 1.5 1.0 log(log(x)) 0.5 log(log(x)) + 5 10 15 20 25 30 35 40 -0.5 -1.0 Die Partialsummen der Reihe ∑ p prim 1/p im Vergleich mit log(log(x)) Konvergenzkriterien für unendliche Reihen Wir betrachten drei klassische Kriterien, mit denen sich in vielen Fällen die Konvergenz einer Reihe feststellen lässt. Satz (Leibniz-Kriterium für alternierende Reihen) Sei (xn )n P N eine monoton fallende Nullfolge. Dann konvergiert ∑ n (−1)n xn = x0 − x1 + x2 − x3 + … Der einfache Beweis besteht in der Beobachtung dass die Partialsummen sn = ∑ k ≤ n (−1)k xk eine konvergente (in x0 rechtsstartende) Pendelfolge bilden. Beispiele Die unendlichen Reihen ∑n≥1 (−1)n − 1 n = 1 − 1 1 1 + − + … 2 3 4 (alternierende harm. Reihe) ∑n≥1 (−1)n − 1 2n − 1 = 1 − 1 1 1 + − + … 3 5 7 (Leibniz-Reihe) konvergieren nach dem Leibniz-Kriterium. Weitaus schwieriger als die Feststellung der Konvergenz ist die Berechnung der Grenzwerte. Man kann zeigen, dass die alternierende harmonische Reihe gegen log(2) und die Leibniz-Reihe π/4 konvergiert; der Leser vergleiche hierzu die TaylorEntwicklungen des Logarithmus und Arkustangens in Abschnitt 2. Einführung in die Mathematik 1 © Oliver Deiser 2. Grenzwerte für Folgen und Reihen 285 Unser zweites Kriterium ist: Satz (Majoranten-Kriterium) Sei ∑ n yn eine konvergente Reihe positiver reeller Zahlen. Weiter sei (xn )n P N eine Folge in R mit |xn | ≤ yn . Dann konvergiert ∑ n xn . Zum Beweis zeigt man, dass die Partialsummen der Folge (xn )n P N eine Cauchy-Folge bilden. Gelten die Voraussetzungen des Satzes, so sagen wir auch, dass die Reihe ∑ n xn durch die konvergente Reihe ∑ n yn majorisiert wird. 1.0 q q2 q3 0.5 1 2 3 4 5 6 7 8 9 10 11 12 -0.5 -1.0 Majorisierung durch eine geometrische Reihe ∑ n qn mit q = 9/10: Eine Reihe ∑ n xn konvergiert, falls jedes xn im n-ten grauen Intervall [ − qn , qn ] liegt. Das Kriterium führt im Zusammenspiel mit der geometrischen Reihe zu: Satz (Quotienten-Kriterium) Sei ∑ n xn eine unendliche Reihe mit xn ≠ 0 für alle n P N. Es gebe ein q P ] 0, 1 [ mit der Eigenschaft | xn + 1 xn |≤q für alle n P N. Dann konvergiert ∑ n xn . Beweis Sei q wie im Satz. Dann gilt |x1 | ≤ q |x0 |, |x2 | ≤ q |x1 | ≤ q2 |x0 |, … Induktiv ergibt sich |xn | ≤ |x0 | qn für alle n P N. Damit wird die Reihe ∑ n xn durch die (wegen q < 1 konvergente) skalierte geometrische Reihe | x0 | ∑ n qn majorisiert. © Oliver Deiser Einführung in die Mathematik 1 286 3. Abschnitt Reelle und komplexe Zahlen Warnung Im Quotientenkriterium ist es wichtig, dass q < 1. Es genügt nicht, dass alle Quotienten im Betrag kleiner als 1 sind. Die divergente Majorante ∑ n 1n beweist weder die Konvergenz noch die Divergenz von ∑ n xn . Entsprechende Beispiele diskutieren wir in den Übungen. Für Anwendungen ist nützlich: Gültigkeit ab einer Stelle im Quotienten-Kriterium Da die Konvergenz einer unendlichen Reihe nicht von endlich vielen Summanden abhängt, genügt es im Majoranten- und Quotientenkriterium, wenn die Bedingungen ab einer Stelle n0 gelten, also zum Beispiel | xn + 1 xn | ≤ 9 10 für alle n ≥ 5 erfüllt ist. Ein Beispiel für eine derartige Abschätzung der Quotienten ab einer Stelle liefert die folgende vielleicht wichtigste Anwendung des Quotientenkriteriums, mit der wir eine Hypothek einlösen können: Konvergenz der Exponentialreihe Sei x P R beliebig. Wir betrachten die Exponentialreihe ∑n xn n! = 1 + x + x2 2 + x3 3! + … Sei nun n0 eine natürliche Zahl mit n0 ≥ 2|x|. Dann gilt | xn + 1 /(n + 1)! xn /n! |= |x| n+1 < 1 2 für alle n ≥ n0 . Damit konvergiert die Exponentialreihe für alle x P R. Der Konvergenzbeweis verwendet letztendlich eine Majorisierung durch eine geometrische Reihe. Einführung in die Mathematik 1 © Oliver Deiser 2. Grenzwerte für Folgen und Reihen 287 Übungen Übung 1 Zeichnen Sie Diagramme des Typs I und II zu einigen Folgen Ihrer Wahl. Diskutieren Sie die Unterschiede der beiden Typen und die Frage, ob sich sich für gewisse Folgen ein Typ besser eignet als der andere. Übung 2 Erläutern Sie die Konvergenz und Divergenz von Folgen mit Hilfe der Folgendiagramme von Typ I und II. Betrachten Sie dabei zunächst einen anschaulichen Grenzwertbegriff und in einer zweiten Stufe die ε-Definition. Übung 3 Zeigen Sie mit Hilfe der ε-Definition, dass ein Grenzwert einer konvergenten Folge (xn )n P N eindeutig bestimmt ist. Zeichnen Sie ein Diagramm, das die Beweisidee erläutert. Übung 4 Seien (xn )n P N und (yn )n P N gegen x bzw. y konvergente Folgen in R. Zeigen Sie, dass limn (xn + yn ) = x + y. Erstellen Sie wieder ein Diagramm zur Illustration. Übung 5 Erstellen Sie ein Diagramm vom Typ II für die Partialsummen der alternierenden harmonischen Reihe. Übung 6 (a) Bestimmen Sie die Partialsummen sn und den Wert der Reihe ∑n ≥ 1 1 n(n + 1) = 1 1⋅2 + 1 2⋅3 + 1 3⋅4 + … (b) Zeigen Sie mit Hilfe von (a), dass die Reihe ∑ n ≥ 1 1/n2 konvergiert. (c) Lässt sich das Quotientenkriterium verwenden, um die Konvergenz der Reihe ∑ n ≥ 1 1/n2 zu beweisen? Übung 7 Untersuchen Sie die unendliche Reihe ∑n ≥ 1 n2 2n auf Konvergenz. © Oliver Deiser Einführung in die Mathematik 1 288 3. Abschnitt Reelle und komplexe Zahlen Übung 8 Visualisieren Sie die folgenden geometrischen Reihen: ∑n ≥ 1 1 2n = 1, ∑ n ≥ 1 1 4n = 1 1 , ∑ n ≥ 1 (− 3 2 )n = 2 . 3 Übung 9 Wir betrachten die unendliche Reihe ∑n ≥ 1 n 2n = 1 2 + 2 4 + 3 8 + 4 16 + 5 32 + … (a) Berechnen Sie einige Partialsummen sn und vermuten Sie, welchen Wert die Reihe besitzt. (b) Ordnen Sie die Summanden in der aufgespalteten Form 1 , 2 1 , 4 1 , 4 1 , 8 1 , 8 1 , … 8 so an, dass Sie den Wert der Reihe bestimmen können. Übung 10 Sei ∑ n xn eine unendliche Reihe wie im Leibniz-Kriterium. Zeigen Sie, dass die Partialsummen der Reihe eine konvergente Pendelfolge bilden. Erstellen Sie ein Diagramm zur Illustration. Übung 11 Recherchieren Sie nach weiteren Beweisen für die Divergenz der harmonischen Reihe. Vergleichen Sie einen der Beweise mit dem hier geführten Beweis durch Klammerung. Übung 12 Recherchieren Sie, was über die unendlichen Reihen der Form ∑ n ≥ 1 1/nk mit k P N* bekannt und nicht bekannt ist. Einführung in die Mathematik 1 © Oliver Deiser 3. Grenzwerte und Stetigkeit von Funktionen In diesem Kapitel präzisieren wir mit Hilfe der Epsilontik die Begriffe „Grenzwert“ und „Stetigkeit“ für Funktionen. Wir wählen einen anschaulichen Zugang, bei dem der Verlauf eines Funktionsgraphen innerhalb gewisser Rechtecke betont wird. © Oliver Deiser Einführung in die Mathematik 1 290 3. Abschnitt Reelle und komplexe Zahlen Grenzwerte bei Funktionen Wir haben den Grenzwert limx →p f(x) = a einer Funktion f : P → R und einer reellen Zahl a bislang anschaulich verwendet, vor allem bei der Untersuchung von Differentialquotienten. Unser Ziel ist es nun, diesen Grenzwert genau zu definieren. Dabei treffen wir folgende Vereinbarung über die Stelle p: Vereinbarung Wir nehmen im Folgenden an, dass für alle ε > 0 das Intervall ] p − ε, p + ε [ mindestens ein Element des Definitionsbereichs P von f enthält. Dies ist insbesondere dann erfüllt, wenn p ein Element von P ist oder wenn P ein Intervall und p eine Intervallgrenze von P ist (die nicht notwendig zu P gehören muss). Nach diesen Vorbereitungen definieren wir: Definition (Verlauf in einem Rechteck) Seien f : P → R und (p, a) P R2 . Weiter seien ε, δ > 0. Wir sagen, dass die Funktion f im ε-δ-Rechteck bei (p, a) verläuft, falls gilt: Für alle x P P mit |x − p| < δ gilt |f(x) − a| < ε. Anschaulich besagt die Bedingung, dass der Graph der Funktion f im Intervall ] p − δ, p + δ [ ganz innerhalb des Rechtecks R mit Mittelpunkt (p, a) und Seitenlängen 2δ und 2ε verläuft, d. h. Graph(f ) ∩ (Iδ (p) × R) ⊆ R = Iδ (P) × Iε (a), wobei Iδ (p) = ] p − δ, p + δ [, Iε (a) = ] a − ε, a + ε [. Im Folgenden ist stets ε mit der y-Achse und δ mit der x-Achse assoziiert. Definition (Grenzwert einer Funktion) Wir schreiben limx → p f(x) = a, falls gilt: Für alle ε > 0 gibt es ein δ > 0, sodass f im ε-δ-Rechteck bei (p, a) verläuft. Wir nennen dann a den Grenzwert von f an der Stelle p und sagen, dass f gegen a strebt, wenn x gegen p strebt. Statt „an der Stelle“ sagen wir gleichwertig auch „im Punkt“ oder „bei“. Dies gilt, wo immer anwendbar, auch bei den folgenden Begriffsbildungen. Einführung in die Mathematik 1 © Oliver Deiser 3. Grenzwerte und Stetigkeit von Funktionen 291 Beispiel Der Sinus cardinalis si : R* → R ist definiert durch sin(x) x si(x) = für alle x P R*. Die Funktion ist im Nullpunkt nicht definiert. Wir setzen p = 0 und a = 1 und fragen nach dem Verlauf von si in ε-δ-Rechtecken bei (p, a) = (0, 1). 1.0 0.5 si(x) -10 -5 5 10 1.0 0.5 si(x) -10 -5 5 10 Der Sinus cardinalis verläuft im ε-δ-Rechteck bei (0, 1) für ε = 3/10 und δ = 1, aber nicht im ε-δ-Rechteck bei (0, 1) für ε = 3/10 und δ = 2. Ist ε > 0 vorgegeben, so verläuft f im ε-δ-Rechteck bei (0, 1), wenn δ > 0 hinreichend klein gewählt wird. Damit gilt limx →0 si(x) = 1. Diesen Grenzwert kennen wir bereits von der Diskussion der Ableitung des Sinus: limx →0 sin(x) x © Oliver Deiser = limx →0 sin(x) − 0 x−0 = sin′(0) = 1. Einführung in die Mathematik 1 292 3. Abschnitt Reelle und komplexe Zahlen Stetigkeit Anschaulich lässt sich die Stetigkeit einer Funktion so beschreiben: Die Funktion macht keine Sprünge. Die Funktionswerte ändern sich wenig, wenn sich die Stelle hinreichend wenig ändert. Mit Hilfe des Grenzwertbegriffs für Funktionen können wir die Stetigkeit in einfacher Weise exakt definieren: Definition (Stetigkeit einer Funktion) Sei f : P → R, und sei p P P. Dann heißt f stetig an der Stelle p, falls gilt: limx →p f(x) = f(p). Andernfalls heißt f unstetig an der Stelle p. Weiter heißt f stetig, falls f stetig an allen Stellen p P P ist. Bemerkung (1) Eine Aussage „f ist stetig/unstetig bei p“ beinhaltet immer, dass p ein Element des Definitionsbereichs P von f ist. Die Funktion 1/x ist stetig (ergänze: überall auf ihrem Definitionsbereich R*). Es ergibt keinen Sinn zu sagen, dass 1/x unstetig im Nullpunkt ist, weil die Funktion dort nicht definiert ist. (2) Da p ein Element des Definitionsbereichs von f ist, liegt f(p) in allen betrachteten Rechtecken. Damit ist die Bedingung limx → p f(x) = f(p) äquivalent zur Existenz des Grenzwerts limx → p f(x). Wenn dieser Grenzwert existiert, muss er gleich p sein. Die Bedingung limx limx →p →p f(x) = f(limx f(x) = f(p) können wir in der Form →p x) schreiben, die eine suggestive Interpretation der Stetigkeit nahelegt: Limesbildung und Funktionsanwendung sind vertauschbar. Ausformuliert und mit Quantoren notiert lautet unsere Definition: Epsilon-Delta-Formulierung der Stetigkeit von f an der Stelle p ∀ε > 0 ∃δ > 0 ∀x P P (|x − p| < δ → |f(x) − f(p)| < ε). Gleichwertig: ∀ε > 0 ∃δ > 0 ∀x P P ∩ ] p − δ, p + δ [ |f(x) − f(p)| < ε. Für die Stetigkeit von f (an allen Stellen) kommt noch ein weiterer Allquantor „∀p P P“ davor. Die Reihenfolge der Quantoren ist genau zu beachten. Einführung in die Mathematik 1 © Oliver Deiser 3. Grenzwerte und Stetigkeit von Funktionen 293 p+ f(p) 2 f(p) 2 p- p p+ f(x) p+ 2 f(p) f(p) 2 p f(x) Zur ε-δ-Stetigkeit an der Stelle p: f verläuft im ε-δ-Rechteck bei (p, f(p)). Wird ε verkleinert, kann auch δ geeignet verkleinert werden, sodass der Verlauf im Rechteck erhalten bleibt. Aufgrund der Quantorenformulierung wird unsere Stetigkeitsdefinition auch ε-δ-Stetigkeit genannt. Daneben ist auch Umgebungsstetigkeit üblich, da für eine beliebig kleine Umgebung U von f(p) eine Umgebung V von p existiert derart, dass f die gesamte Umgebung V von p in die Umgebung U von f(p) abbildet. In dieser „topologischen Form“ wird die Stetigkeit in der Mathematik heute in allgemeineren Räumen erklärt, in denen ein Umgebungsbegriff definiert ist. Die Stetigkeit von f bedeutet nicht, dass man den Graphen von f ohne abzusetzen zeichnen kann. Der Stetigkeitsbegriff ist wesentlich allgemeiner. Zum einen haben wir bereits gesehen, dass etwa die Funktion f : R* → R mit f(x) = 1/x für alle x P R* stetig ist. Sie lässt sich aber nicht zeichnen, ohne abzusetzen, da sie im Nullpunkt nicht definiert ist. Nun könnte man einwenden, dass f natürlich auf einem Intervall definiert sein muss, damit die Anschauung greift. Aber auch dann ist die Anschauung nicht korrekt. Weierstraß zeigte, dass es stetige Funktionen gibt, die an keiner Stelle differenzierbar sind. Derartige Funktionen kann man nicht zeichnen ohne abzusetzen. Korrekt ist: Kann man den Graphen einer auf einem Intervall definierten Funktion f zeichnen, ohne abzusetzen, so ist f stetig. © Oliver Deiser Einführung in die Mathematik 1 294 3. Abschnitt Reelle und komplexe Zahlen 1 f 1 2 1 3 1 1 1 8 4 2 1 Eine Zackenfunktion f : [ 0, 1 ] → R mit Zacken der Höhe 1, 1/2, 1/3, …, 1/n, … Die Funktion ist stetig (auch im Nullpunkt), kann aber nicht ohne abzusetzen gezeichnet werden: Ihr Graph besitzt aufgrund der Divergenz der harmonischen Reihe eine unendliche Länge, da jeder Zacken länger als 1/n ist. 1.5 1.5 f1 1.0 f2 1.0 0.5 -1.0 -0.5 0.5 0.5 1.0 -1.0 -0.5 0.5 1.0 -0.5 -0.5 -1.0 -1.0 -1.5 -1.5 2 2 f4 1 -1.0 -0.5 0.5 f8 1 1.0 -1.0 -0.5 0.5 -1 -1 -2 -2 1.0 Partialsummen fn einer Weierstraß-Funktion f : R → R: f(x) = ∑ n (1/2n ) cos(3n π x), fn (x) = ∑ k ≤ n (1/2k ) cos(3k π x) für alle x P R. Die Funktion f ist überall stetig, aber nirgendwo differenzierbar. Einführung in die Mathematik 1 © Oliver Deiser 3. Grenzwerte und Stetigkeit von Funktionen 295 In der Analysis zeigt man: Satz (Stetigkeit der elementaren Funktionen) Alle elementaren Funktionen sind stetig. Zum Beweis dieses Satzes wird zuerst nachgewiesen, dass alle Grundfunktionen, aus denen die elementaren Funktionen aufgebaut werden (Polynome, Exponentialfunktionen, trigonometrische Funktionen) stetig sind. Weiter zeigt man, dass die Operationen der Addition, Subtraktion, Multiplikation, Division, Verknüpfung und Umkehrung stetige Funktionen ergeben, wenn sie auf stetige Funktionen angewendet werden. Damit ist der Satz bewiesen, denn die elementaren Funktionen werden aus den Grundfunktionen mit Hilfe dieser Operationen aufgebaut. Vieles ist also stetig, aber nicht alles: Beispiele für unstetige Funktionen (1) Die Vorzeichenfunktion sgn : R → R mit sgn(x) = −1 für x < 0, sgn(0) = 0, sgn(x) = 1 für x > 0. ist unstetig im Nullpunkt und in allen anderen Punkten stetig. Das Gleiche gilt für jede andere Definition der Funktion im Nullpunkt, etwa für die Variante, die im Nullpunkt den Wert 1 besitzt. (2) Die Funktion f : R → R mit f(x) = sin(1/x) für x ≠ 0, f(0) = 0 ist unstetig im Nullpunkt und in allen anderen Punkten stetig. (3) Die Dirichlet-Sprungfunktion f : [ 0, 1 ] → R mit f(x) = 1, falls x rational, f(x) = 0, falls x irrational ist an allen Stellen unstetig. (4) Die Funktion f : R → R mit f(x) = x, falls x rational, f(x) = − x, falls x irrational, ist im Nullpunkt stetig und an allen anderen Stellen unstetig. (5) Die Thomae-Funktion f : R → R mit f(x) = 0, falls x irrational, f(m/n) = 1/n für gekürzte Brüche m/n mit n ≥ 1 ist stetig an allen irrationalen und unstetig an allen rationalen Stellen. © Oliver Deiser Einführung in die Mathematik 1 296 3. Abschnitt Reelle und komplexe Zahlen 1.0 sgn(x) 0.5 -1.0 -0.5 0.5 1.0 -0.5 -1.0 Die sgn-Funktion ist unstetig an der Stelle p = 0: Für ε = 1/2 verläuft sgn nicht im ε-δ-Rechteck bei (0, 0) = (0, sgn(0)), wie klein δ > 0 auch gewählt wird. 1.0 0.5 -1.5 -1.0 -0.5 0.5 1.0 1.5 -0.5 -1.0 Die Funktion f mit f(x) = sin(1/x) für x ≠ 0 und f(0) = 0 ist an der Stelle 0 unstetig. 1 0.75 0.5 0.25 -1.0 -0.5 0.0 0.5 1.0 1.5 2.0 Die Thomae-Funktion ist genau an den irrationalen Stellen stetig. Einführung in die Mathematik 1 © Oliver Deiser 3. Grenzwerte und Stetigkeit von Funktionen 297 Links- und rechtsseitige Grenzwerte Oft möchte man „x strebt gegen p“ auf die linke oder rechte Seite der betrachteten Stelle p beschränken. Unsere Grenzwertdefinition kann leicht in dieser Hinsicht angepasst werden: Definition (Grenzwert einer Funktion mit Nebenbedingung) Der Grenzwert limx ↑p f(x) = limx → p, x < p f(x) = a ist wie oben definiert, wobei nun nur x-Werte betrachtet werden, die kleiner als p sind. Wir nennen dann a den linksseitigen Grenzwert von f an der Stelle p und sagen, dass f gegen a strebt, wenn x von links gegen p strebt. Analog ist der rechtsseitige Grenzwert limx ↓p f(x) = limx → p, x > p f(x) = a definiert, bei dem nur x-Werte größer als p betrachtet werden. Von der Stelle p wird bei einem linksseitigen Grenzwert immer vorausgesetzt, dass p ein linksseitiger Häufungspunkt von P ist, d. h. es gilt ∀δ > 0 P ∩ ] p − δ, p [ ≠ 0. Analog betrachten wir rechtsseitige Grenzwerte naturgemäß nur dann, wenn p ein rechtsseitiger Häufungspunkt von P ist. Eine Annäherung an p von links bzw. rechts ist andernfalls innerhalb des Definitionsbereichs P von f gar nicht möglich. Die einseitigen Grenzwerte erlauben die folgende Charakterisierung der Stetigkeit: Satz (Stetigkeit über einseitige Grenzwerte) Sei f : P → R und p P P. Dann sind äquivalent: (a) f ist stetig bei p. (b) limx ↑p f(x) = f(p) = limx ↓p f(x). Dabei ist in (b) ein einseitiger Grenzwert zu streichen, wenn p kein entsprechender Häufungspunkt von P ist. Ist also zum Beispiel P = [0, 1] und p = 1, so vereinfacht sich die Bedingung zu limx ↑1 f(x) = f(1). Die Aussage (b) können wir etwas salopp, aber dafür griffig, so formulieren: Linksseitiger Grenzwert gleich Funktionswert gleich rechtsseitiger Grenzwert. © Oliver Deiser Einführung in die Mathematik 1 298 3. Abschnitt Reelle und komplexe Zahlen Beispiele (1) Für die Vorzeichenfunktion sgn gilt limx ↑0 sgn(x) = −1, limx ↓0 sgn(x) = 1, sgn(0) = 0. (2) Sei f : R → R mit f(x) = 0 für alle x ≠ 0 und f(0) = 1. Dann gilt limx ↑0 f(x) = limx ↓0 f(x) = 0, f(0) = 1. Dass sowohl der linksseitige als auch der rechtsseitige Grenzwert gleich a ist, kann man durch limx → p, x ≠ p f(x) = a zum Ausdruck bringen. Bemerkung Nach unserer Definition wird in limx →p f(x) = a der Punkt p bei der „Annäherung an p“ zugelassen, sofern er sich im Definitionsbereich von f befindet. Die Literatur ist hier nicht einheitlich, manchmal wird der Punkt p explizit ausgeschlossen, sodass „x → p“ nach unserer Lesart bedeutet, dass „x → p, x ≠ p“. Uneigentliche Grenzwerte Auch bei Grenzwerten für Funktionen können wir für p und a die symbolischen Werte ∞ und −∞ zulassen. Hierzu setzen wir: limx →∞ f(x) = a, falls ∀ε > 0 ∃n ∀x P P (x ≥ n → |f(x) − a| < ε). limx →p f(x) = ∞, falls ∀m ∃δ > 0 ∀x P P (|x − p| < δ → f(x) > m). limx →∞ f(x) = ∞, falls ∀m ∃n ∀x P P (x ≥ n → f(x) > m). In „x → ∞“ nehmen wir immer an, dass P nach oben unbeschränkt ist. Grenzwerte, die den symbolischen Wert −∞ enthalten, werden analog definiert. Einen Grenzwert, der einen symbolischen Wert ∞ oder −∞ involviert, nennen wir auch einen uneigentlichen Grenzwert Der Leser möge sich uneigentliche Grenzwerte für Funktionen wieder mit Hilfe von Rechtecken veranschaulichen. Die Rechtecke sind nun unbeschränkte Teilmengen der Ebene. Die Idee bleibt gleich. Einführung in die Mathematik 1 © Oliver Deiser 3. Grenzwerte und Stetigkeit von Funktionen 299 Die Folgenstetigkeit Grenzwerte für Folgen und Grenzwerte für Funktionen hängen eng zusammen. In der Analysis zeigt man den folgenden Satz: Satz (Funktionsgrenzwerte über Folgengrenzwerte) Die folgenden Aussagen sind äquivalent: (a) limx →p f(x) = a. (b) Für jede Folge (xn )n P N in P mit limn xn = p gilt limn f(xn ) = a. Hieraus ergibt sich eine sehr bedeutsame Formulierung der Stetigkeit einer Funktion mit Hilfe von Folgen. Wir definieren hierzu: Definition (Folgenstetigkeit) Sei f : P → R, und sei p P P. Dann heißt f folgenstetig an der Stelle p, falls gilt: Für alle Folgen (xn )n P N in P mit limn xn = p gilt limn f(xn ) = f(p). Weiter heißt die Funktion f folgenstetig, falls f folgenstetig an allen Stellen p P P ist. f(x2 ) f(p) f(p) f(x1 ) f(x0 ) x0 x1 x2 p f(x) Zur Folgenstetigkeit an der Stelle p: Konvergiert x0 , x1 , x2 , … gegen p, so konvergieren die Funktionwerte f(x0 ), f(x1 ), f(x2 ), … gegen f(p). Nach dem obigen Satz sind die beiden Stetigkeitsbegriffe äquivalent. Wir halten dieses Ergebnis explizit fest: © Oliver Deiser Einführung in die Mathematik 1 300 3. Abschnitt Reelle und komplexe Zahlen Korollar (ε-δ-Stetigkeit und Folgenstetigkeit) Sei f : P → R, und sei p P P. Dann sind die folgenden Aussagen äquivalent: (a) f ist stetig an der Stelle p. (b) f ist folgenstetig an der Stelle p. Die Folgenstetigkeit einer Funktion f können wir auch so notieren: (+) Für alle konvergenten Folgen (xn )n P N in P gilt limn f(xn ) = f(limn xn ). Dadurch wird erneut die Vertauschbarkeit von Grenzwertbildung und Funktionsanwendung zum Ausdruck gebracht. 0 sgn(x2 ) sgn(x1 ) sgn(x0 ) x2 x1 x0 sgn(x) Zur Folgen-Unstetigkeit von sgn an der Stelle 0: Die Folge 1, 1/2, 1/4, … konvergiert gegen 0, aber die zugehörigen Funktionswerte konvergieren nicht gegen sgn(0) = 0. Unsere Überlegungen zeigen, dass sich der Grenzwertbegriff für Funktionen mit Hilfe des Grenzwertbegriffs für Folgen definieren lässt. Zum Abschluss der Diskussion halten wir fest, dass umgekehrt auch eine Definition des Grenzwerts für Folgen mit Hilfe der ε-δ-Grenzwertdefinition für Funktionen möglich ist. Hierzu müssen wir nur beobachten, dass Folgen spezielle Funktionen sind: Satz (Folgengrenzwerte über Funktionsgrenzwerte) Sei (xn )n P N ein Folge in R. Dann sind äquivalent: (a) limn xn = a. (b) limx →∞ f(x) = a, wobei f : N → R definiert ist durch f(n) = xn . Alternativ können wir in (b) zum Beispiel auch die Funktion g : P → R mit P = { 1/n | n ≥ 1 } und g(1/n) = xn für alle n ≥ 1 verwenden und limx → 0 g(x) = a fordern. Dadurch lassen sich uneigentliche Grenzwerte vermeiden. Einführung in die Mathematik 1 © Oliver Deiser 3. Grenzwerte und Stetigkeit von Funktionen 301 Stetigkeits- und Unstetigkeitsbeweise Die Stetigkeitsdefinitionen weisen komplexe Quantorenkombinationen auf. Wollen wir zeigen, dass eine Funktion f : P → R an einer Stelle p P P stetig ist, so können wir eine der beiden folgenden äquivalenten Methoden verwenden: Nachweis der Epsilon-Delta-Stetigkeit an einer Stelle p Wir müssen zeigen: ∀ε > 0 ∃δ > 0 ∀x P P (|x − p| < δ → |f(x) − f(p)| < ε). Hierzu betrachten wir ein beliebiges ε > 0. Nun ist es unsere Aufgabe, ein geeignetes δ > 0 (in Abhängigkeit von ε) zu definieren, sodass f im ε-δRechteck bei (p, f(p)) verläuft. Nachweis der Folgenstetigkeit an einer Stelle p Wir müssen zeigen: Für jede Folge (xn )n P N in P mit limn xn = p gilt limn f(xn ) = f(p). Hierzu betrachten wir eine beliebige Folge (xn )n P N in P mit limn xn = p. Für diese Folge müssen wir nun zeigen: ∀ε > 0 ∃n0 ∀n ≥ n0 |f(xn ) − f(p)| < ε. Zum Nachweis dieser Aussage betrachten wir ein beliebiges ε > 0. Nun müssen wir ein geeignetes n0 finden (in Abhängigkeit von ε), sodass alle Werte f(xn ) für n ≥ n0 im Intervall ] f(p) − ε, f(p) + ε [ liegen. Entsprechend verlaufen Nachweise der Unstetigkeit: Nachweis der Epsilon-Delta-Unstetigkeit an einer Stelle p Wir müssen zeigen: ∃ε > 0 ∀δ > 0 ∃x P P (|x − p| < δ ∧ |f(x) − f(p)| > ε). Wir müssen also ein geeignetes ε > 0 definieren, so dass f für ein beliebig kleines δ > 0 nicht im ε-δ-Rechteck bei (p, f(p)) verläuft, also jedes derartige Rechteck an mindestens einer Stelle x P ] p - δ, p + δ [ verlässt. Nachweis der Folgenunstetigkeit an einer Stelle p Wir müssen zeigen: Es gibt eine Folge (xn )n P N in P mit limn xn = p und limn f(xn ) ≠ f(p). Zum Beweis dieser Aussage müssen wir eine gegen p konvergente Folge (xn )n P N in P konstruieren derart, dass die Folge (f(xn ))n P N divergiert oder gegen ein a konvergiert mit a ≠ f(p). © Oliver Deiser Einführung in die Mathematik 1 302 3. Abschnitt Reelle und komplexe Zahlen Übungen Übung 1 Erläutern Sie den Verlauf einer Funktion in einem ε-δ-Rechteck und die ε-δ-Stetigkeit durch Diagramme. Achten Sie bei der Stetigkeit besonders auf die Abhängigkeitsverhältnisse zwischen ε und δ. Übung 2 Betrachten Sie zwei waagrechte Achsen (Kopien des reellen Zahlenstrahls). Eine Funktion f : R → R können wir als Abbildung der Punkte der ersten Achse auf Punkte der zweiten Achse auffassen. (a) Illustrieren Sie diese Interpretation einer Funktion durch Diagramme anhand einfacher Beispiele. (b) Erläutern Sie die ε-δ-Stetigkeit einer beliebigen Funktion f : R → R an einer Stelle p anhand dieser Interpretation. Übung 3 Die Stetigkeit hatten wir anschaulich formuliert durch: Die Funktionswerte ändern sich wenig, wenn sich die Stelle hinreichend wenig ändert. Erläutern Sie die Bedeutung des Wortes „hinreichend“ in dieser Formulierung. Übung 4 Sei f : P → R, und sei p P P. Die ε-δ-Stetigkeit von f an der Stelle p lautet: ∀ε > 0 ∃δ > 0 ∀x P P (|x − p| < δ → |f(x) − f(p)| < ε). (a) Welche Bedeutung hat die Aussage ∃δ > 0 ∀ε > 0 ∀x P P (|x − p| < δ → |f(x) − f(p)| < ε), bei der die Quantoren über ε und δ vertauscht sind? (b) Welche Bedeutung hat die Aussage ∃ε > 0 ∀δ > 0 ∀x P P (|x − p| < δ → |f(x) − f(p)| < ε), bei der die Quantoren über ε und δ verwechselt sind? (c) Welche Bedeutung hat die Aussage ∀ε > 0 ∃δ > 0 ∃x P P (|x − p| < δ → |f(x) − f(p)| < ε), bei der der letzte Allquantor zu einem Existenzquantor geworden ist? Einführung in die Mathematik 1 © Oliver Deiser 3. Grenzwerte und Stetigkeit von Funktionen 303 Übung 5 Sei f : R → R mit f(x) = x2 für alle x P R. Zeigen Sie sowohl mit Hilfe der ε-δ-Stetigkeit als auch mit Hilfe der Folgenstetigkeit, dass f stetig ist. Übung 6 Weisen Sie sowohl mit Hilfe der ε-δ-Stetigkeit als auch mit Hilfe der Folgenstetigkeit nach, dass die Vorzeichenfunktion sgn : R → R unstetig im Nullpunkt ist. Zeichnen Sie Diagramme zur Illustration Ihrer Beweise. Übung 7 Wir betrachten die Funktion f : R → R mit f(x) = { sin(1/x) falls 0 sonst. x≠0 (a) Bestimmen Sie die Nullstellen und lokalen Extrema von f. (b) Weisen Sie sowohl mit Hilfe der ε-δ-Stetigkeit als auch mit Hilfe der Folgenstetigkeit nach, dass die Funktion f im Nullpunkt unstetig ist. Übung 8 Zeigen Sie mit Hilfe der Folgenstetigkeit und der Limesregeln für Folgen, dass f + g, c f für c P R, f ⋅ g und f/g stetige Funktionen sind, wenn f und g stetig sind. Folgern Sie hieraus die Stetigkeit aller Polynome und rationalen Funktionen unter Verwendung der Stetigkeit der Identität. Übung 9 Zeigen Sie, dass die Verknüpfung g + f zweier stetiger miteinander verknüpfbarer Funktionen f und g stetig ist. Übung 10 Sei f : P → R differenzierbar an der Stelle p P P. Zeigen Sie, dass f stetig an der Stelle p ist. © Oliver Deiser Einführung in die Mathematik 1 4. Komplexe Zahlen Wir erweitern die reellen Zahlen R zu den komplexen Zahlen C, sodass unser Zahlsystem die Form N ⊆ Z ⊆ Q ⊆ R ⊆ C annimmt. Die komplexen Zahlen sind gegenüber den reellen Zahlen durch die uneingeschränkte Lösbarkeit von algebraischen Gleichungen ausgezeichnet. Dies wird durch die Hinzunahme einer neuen Zahl i, der sog. imaginären Einheit, erreicht, die die Eigenschaft i2 = −1 erfüllt. Überraschenderweise lässt sich der neue Zahlkörper C der komplexen Zahlen einfach als die euklidische Ebene R2 auffassen − und speziell i als der Punkt (0, 1) −, sodass die Zahlen von ihrem „imaginären Charakter“ befreit werden: Wir rechnen mit Punkten der Ebene, so wie wir mit Punkten einer Linie rechnen. © Oliver Deiser Einführung in die Mathematik 1 306 3. Abschnitt Reelle und komplexe Zahlen Motivation Die Geschichte des Zahlbegriffs ist durch schrittweise Erweiterungen geprägt, die alle einer gewissen Zeit bedurften, um als Erweiterungen des Zahlbegriffs anerkannt zu werden: Die Null, rationale Zahlen als Zahlen (nicht nur als Zahlverhältnisse), negative Zahlen, irrationale Zahlen. Einen Höhepunkt der Entwicklung stellen die reellen Zahlen dar, die sich aufgrund ihrer Vollständigkeit als Modell eines Linearkontinuums bewährt haben. Es stellt sich die Frage: Können die reellen Zahlen noch einmal erweitert werden oder ist R der Abschluss der Entwicklung? Eine mögliche Erweiterung ist bereits in der Frühgeschichte der Analysis angelegt: Infinitesimale Größen wie dx und df(x)/dx in der Leibniz-Notation. Das Modell R und die Fundierung der Analysis mit Hilfe der Epsilontik zeigt, dass infinitesimale Größen nicht nötig sind, um die Differential- und Integralrechnung aufbauen können. Dennoch blieb die Frage nach der Möglichkeit solcher Größen, und diese Frage ist im 20. Jahrhundert mit der Nonstandard-Analysis positiv beantwortet worden. Damit kann R (unter Preisgabe des Archimedischen Axioms und damit der linearen Vollständigkeit) tatsächlich noch einmal erweitert werden. Aber auch eine ganz andere Erweiterung ist möglich, und um diese Erweiterung soll es hier gehen. Wir betrachten hierzu zwei verschiedene Zugänge. Der erste entspricht grob der historischen Entwicklung, der zweite der mathematik-intrinsischen Suche nach Struktur. Der Leser, der die komplexen Zahlen möglichst schnell kennenlernen möchte, kann die Motivationen überschlagen. Motivation I: Wurzeln negativer Zahlen Die Gleichung x2 = −1 hat keine Lösung in R. Setzen wir rein formal i = £−1 und rechnen wir mit i wie üblich, so gilt i2 = −1 und (−i)2 = −1, sodass die Gleichung x2 = −1 zwei Lösungen besitzt, wie es ja für viele Gleichungen zweiten Grades der Fall ist. Wenn i eine Zahl sein soll, so sind auch x + i y für alle x, y P R Zahlen. Rechnen wir wie üblich, so gilt für alle x1 , x2 , y1 , y2 P R: (x1 + iy1 ) + (x2 + iy2 ) = (x1 + x2 ) + i (y1 + y2 ). (x1 + iy1 ) ⋅ (x2 + iy2 ) = x1 x2 + i x1 y2 + i y1 x2 + i2 y1 y2 = (x1 x2 − y1 y2 ) + i (x1 y2 + x2 y1 ). Je länger wir in dieser Weise rein formal rechnen, desto mehr entsteht der Eindruck, dass in den Ausdrücken x + i y neue Zahlen vorliegen, die sich von der ursprünglichen Motivation der „negativen Wurzeln“ lösen. Die neue Zahl i ist eine Einführung in die Mathematik 1 © Oliver Deiser 4. Komplexe Zahlen 307 Zahl, deren Quadrat −1 ergibt. Das ist ungewöhnlich, aber nicht offensichtlich widersprüchlich, da ja nicht behauptet wird, dass i eine reelle Zahl ist und dass die neuen Zahlen in allen Aspekten mit den reellen Zahlen übereinstimmen. Der Wunsch nach einer Präzisierung entsteht, um „vermutlich nicht widersprüchlich“ zu „nicht widersprüchlich“ zu verbessern. Da nun eine Zahl x + iy vollkommen durch die beiden beteiligten reellen Zahlen x, y bestimmt ist, kann man auf die Idee kommen, eine Zahl x + iy mit dem Punkt (oder Vektor) (x, y) P R2 der Ebene zu identifizieren. Diese Idee wird auch dadurch nahegelegt, dass die Formel für die Addition an eine Vektoraddition erinnert und die Formel für die Multiplikation zumindest den Kenner an die Drehformel für Vektoren der Ebene denken lässt. Fassen wir Größen x + i y als Punkte (x, y) der Ebene auf, so werden die Zahlen x + iy = (x, y) P R2 anschaulich und dem Reich des Imaginären entrückt. Wegen i = 0 + i 1 ist speziell i = (0, 1) der kanonische Einheitsvektor auf der y-Achse. Weiter lässt sich wie üblich die Menge R der reellen Zahlen als Teilmenge von R2 auffassen, indem eine reelle Zahl x mit dem Punkt (x, 0) identifiziert wird. (x, y) = x + iy iy = (0, y) i = (0, 1) 1 = (1,0) x = (x, 0) Eine komplexe Zahl x + iy als Punkt (x, y) der Ebene Damit haben wir eine Erweiterung der reellen Zahlen gefunden, die dem Zahlenstrahl keine neuen Punkte mehr hinzufügt, sondern eine zweite Dimension. Der entscheidende Unterschied zur Vektorrechnung der Ebene ist die eigenartige Multiplikation, die sich aber zum Glück geometrisch mit Hilfe von Drehungen anschaulich deuten lässt. © Oliver Deiser Einführung in die Mathematik 1 308 3. Abschnitt Reelle und komplexe Zahlen Motivation II: Eine „gute“ Multiplikation für die Ebene Für eine beliebige Dimension n ≥ 1 können wir zwei Vektoren des reellen Raumes Rn = { (x1 , …, xn ) | x1 , …, xn P R } durch Addition ihrer Komponenten addieren. Für den Fall n = 2 gilt für alle (x1 , y1 ), (x2 , y2 ) P R2 : (x1 , y1 ) + (x2 , y2 ) = (x1 + x2 , y1 + y2 ). (komponentenweise Addition) Diese Addition teilt mit der reellen Addition alle wesentlichen Eigenschaften. Beispielsweise gelten das Assoziativ- und Kommutativgesetz. Folgende Frage ist damit nur natürlich: Kann man Vektoren der Ebene (oder allgemeiner des Rn ) nicht nur addieren, sondern auch so multiplizieren, dass die üblichen Rechenregeln gelten? Die Aufgabe lautet also: Finde eine „gute Multiplikation“ für die Ebene. Der erste Ansatz ist (x1 , y1 ) ⋅ (x2 , y2 ) = (x1 x2 , y1 y2 ). (komponentenweise Multiplikation) Für diese Multiplikation gilt aber zum Beispiel (1, 0) ⋅ (0, 1) = (1 ⋅ 0, 0 ⋅ 1) = (0, 0), was im Vergleich zu R keine „gute“ Eigenschaft ist. Auch das Euklidische Skalarprodukt (x1 , y1 ) ⋅ (x2 , y2 ) = x1 x2 + y1 y2 ist als Analogon zur reellen Multiplikation nicht überzeugend, da als Werte nur reelle Zahlen auftreten und erneut (1, 0) ⋅ (0, 1) = 1 ⋅ 0 + 0 ⋅ 1 = 0 gilt. Wir brauchen also einen neuen Ansatz. Betrachten wir hierzu einen Punkt z = (x, y) auf dem Einheitskreis. Für den Punkt z soll das Inverse 1/z P R2 existieren und es soll z ⋅ 1/z = 1 = (1, 0) gelten, wenn 1 = (1, 0) die Rolle der 1 übernimmt. Bei der Betrachtung dieser Inversenbildung kann man auf die Idee kommen, den mit der x-Achse eingeschlossenen Winkel von z zu betrachten: Spiegeln wir den Vektor z P R2 an der x-Achse zu w P R2 , so ist w das Inverse von z, wenn die Multiplikation über die Addition von Winkeln erklärt wird. Eine genauere Überlegung zeigt, dass folgende Multiplikationsregel nicht nur für Punkte des Einheitskreises sondern für alle z P R2 „gut“ ist: Multipliziere die Längen und addiere die Winkel der beiden beteiligten Vektoren. Eine geometrische Analyse wie bei der Findung der Drehformel zeigt, dass diese Multiplikation in kartesischen Koordinaten durch (x1 , y1 ) ⋅ (x2 , y2 ) = (x1 x2 − y1 y2 , x1 y2 + x2 y1 ) definiert wird. Damit ist eine gute Multiplikation für die Ebene gefunden. Wie sieht es mit den anderen Dimensionen Rn , n ≥ 3, aus? Die Antwort hierauf ist viel schwieriger zu finden. Das überraschende Ergebnis lautet: Es gibt noch „einigermaßen gute“ Multiplikation im R4 und R8 , in den anderen Dimensionen jedoch nicht. Wir verweisen den Leser hierzu auf die Literatur. Einführung in die Mathematik 1 © Oliver Deiser 4. Komplexe Zahlen 309 Die Gaußsche Zahlenebene Motiviert durch obige Überlegungen definieren wir: Definition (komplexe Zahlen, Gaußsche Zahlenebene) Wir setzen C = R2 = { (x, y) | x, y P R }. Jedes Element z = (x, y) von C heißt eine komplexe Zahl. Für alle komplexen Zahlen z1 = (x1 , y1 ), z2 = (x2 , y2 ) setzen wir: z1 + z2 = (x1 + x2 , y1 + y2 ), (komplexe Addition) z1 ⋅ z2 = (x1 x2 − y1 y2 , x1 y2 + y1 x2 ), (komplexe Multiplikation) wobei auf der rechten Seite die reellen Operationen verwendet werden. Die mit den Operationen + und ⋅ ausgestattete Menge R2 nennen wir die Gaußsche Zahlenebene oder den Körper der komplexen Zahlen. Weiter sei C* = C − { 0 }. Wir identifizieren eine reelle Zahl x mit der komplexen Zahl (x, 0). Dadurch erreichen wir R ⊆ C, sodass die komplexen Zahlen die reellen Zahlen erweitern. Für alle c P R und z = (x, y) P C gilt c z = c (x, y) = (c, 0) (x, y) = (c x − 0 y, c y + 0 x) = (cx, c y), sodass die Multiplikation mit einem reellen ersten Faktor der üblichen Skalarmultiplikation von Vektoren entspricht. Unsere bevorzugten Zeichen für komplexe Zahlen sind z,w,u. Je nach Kontext nennen wir ein z P C eine Zahl, einen Punkt oder einen Vektor der Ebene. z1 +z2 z1 z2 z2 z1 u cu © Oliver Deiser Einführung in die Mathematik 1 310 3. Abschnitt Reelle und komplexe Zahlen Die geometrische Deutung der komplexen Multiplikation Die Addition komplexer Zahlen ist die vertraute Vektoraddition. Weiter hat sich die Multiplikation einer reellen Zahl mit einer komplexen Zahl als die übliche Skalierung eines Vektors herausgestellt. Eine anschauliche Bedeutung des Produkts zweier beliebiger komplexer Zahlen liegt dagegen noch nicht vor. Um eine solche zu finden, erinnern wir uns an die Drehformel: Bei unserer Diskussion der Additionstheoreme für den Kosinus und Sinus hatten wir für zwei Punkte P1 = (x1 , y1 ) = (cos α, sin α), P2 = (x2 , y2 ) = (cos β, sin β) des Einheitskreises gezeigt, dass Q = (x1 x2 − y1 y2 , x1 y2 + y1 x2 ). der Punkt auf dem Einheitskreis mit dem Winkel α + β (modulo 2π) ist. Das ist genau die Form der komplexen Multiplikation. Damit erhalten wir: Spezielle geometrische Multiplikationsregel Das Produkt zweier komplexer Zahlen auf dem Einheitskreis ist diejenige komplexe Zahl auf dem Einheitskreis, deren Winkel der Summe der Winkel der beiden Zahlen entspricht. Durch Skalierung gewinnen wir hieraus eine allgemeine Version: Sind (x1 , y1 ), (x2 , y2 ) P C* und r1 , r2 die Euklidischen Längen der Vektoren, so gilt (x1 , y1 ) ⋅ (x2 , y2 ) = r1 r2 ( 1 (x1 , y1 ) ⋅ r1 1 (x2 , y2 ) . r2 ) Die mit 1/r1 und 1/r2 skalierten Vektoren auf der rechten Seite sind die Projektionen der beiden Vektoren auf den Einheitskreis. Da der Winkel eines Vektors bei Projektion auf den Einheitskreis unverändert bleibt, erhalten wir mit Hilfe der speziellen Regel: Geometrische Multiplikationsregel Zwei komplexe Zahlen werden multipliziert, indem ihre Längen multipliziert und ihre (mit der positiven x-Achse eingeschlossenen und gegen den Uhrzeigersinn gemessenen) Winkel addiert werden. Hier und im Folgenden ordnen wir dem Nullvektor 0 = (0, 0) zur Vereinfachung der Sprechweise den Winkel 0 zu, wo immer dies nützlich ist. Dann gilt die Regel auch dann, wenn eine der komplexen Zahlen gleich 0 ist. Die Multiplikation komplexer Zahlen lässt sich mit Hilfe von Polarkoordinaten bestechend einfach formulieren: Einführung in die Mathematik 1 © Oliver Deiser 4. Komplexe Zahlen 311 Multiplikation komplexer Zahlen in Polarkoordinaten Für alle komplexen Zahlen (r1 , ϕ1 ), (r2 , ϕ2 ) in Polarkoordinaten gilt (r1 , ϕ1 ) ⋅ (r2 , ϕ2 ) = (r1 r2 , ϕ1 + ϕ2 ). Mit Hilfe der geometrischen Multiplikationsregel lassen sich viele komplexe Formeln anschaulich erklären. Man kann zum Beispiel direkt nachrechnen, dass die komplexe Multiplikation kommutativ ist, d. h. dass z w = w z für alle z, w P C gilt. Mit der geometrischen Deutung ist dies sofort klar, da die Multiplikation von Längen und die Addition von Winkeln kommutativ sind. Gleiches gilt für die Assoziativität, d. h. z (w v) = (z w) u für alle z, w, u. z1 z1 z2 1 z1 z2 1 z2 -1 -1 1 1 -1 -1 z1 z2 7 5 2 2 12 12 3 3 3 4 4 5 6 6 11 12 12 z1 0 1 2 3 4 5 6 7 13 23 z2 12 12 7 11 6 6 5 7 z1 z2 4 4 5 4 3 17 19 3 3 12 12 2 © Oliver Deiser Einführung in die Mathematik 1 312 3. Abschnitt Reelle und komplexe Zahlen Die imaginäre Einheit Definition (imaginäre Einheit) Wir setzen i = (0, 1) P C. Die komplexe Zahl i heißt die imaginäre Einheit. Nach Definition der Multiplikation gilt i = (0, 1) ⋅ (0, 1) = (0 ⋅ 0 − 1 ⋅ 1, 0 ⋅ −1 + 1 ⋅ 0) = (−1, 0) = −1. 2 Mit Hilfe der Multiplikationsregel können wir so argumentieren: Die komplexe Zahl i2 = i ⋅ i hat die Länge 1 ⋅ 1 und den Winkel π/2 + π/2 = π, sodass i2 = (−1, 0) = −1. Der Vektor i = (0, 1) wird durch Multiplikation mit i um π/2 gedreht, sodass sich (−1, 0) = −1 ergibt. Allgemeiner gilt für alle (x, y) P C i (x, y) = (0, 1) ⋅ (x, y) = (0 x − 1 y, 0 y + 1 x) = (−y, x). Damit ist i (x, y) der um π/2 gedrehte Vektor (x, y), was wir erneut auch ohne Rechnung geometrisch einsehen können: Die Länge von i(x, y) ist die Länge von (x, y) und der Winkel von i(x, y) ist der Winkel von (x, y) plus π/2. Wir halten fest: Drehungen um π/2 Die Multiplikation einer komplexen Zahl z mit i dreht z um π/2 gegen den Uhrzeigersinn. Die Multiplikation von z mit (−i) dreht z um π/2 im Uhrzeigersinn. Eine einfache Anwendung dieser Überlegungen st: Satz (Standarddarstellung komplexer Zahlen) Für alle z = (x, y) P C gilt z = x + i y. Beweis Sei z = (x, y) P C. Dann gilt z = (x, 0) + (0, y) = x + i (y, 0) = x + i y. Mit Hilfe der Standarddarstellung, i2 = −1 und den üblichen Rechenregeln lässt sich die Formel für die komplexe Multiplikation reproduzieren (vgl. obige Motivation I): (x1 , y1 ) ⋅ (x2 , y2 ) = (x1 + i y1 ) ⋅ (x2 + i y2 ) = x1 x2 + i x1 y2 + i y1 x2 + i2 y1 y2 = (x1 x2 − y1 y2 ) + i (x1 y2 + x2 y1 ) = (x1 x2 − y1 y2 , x1 y2 + x2 y1 ). Einführung in die Mathematik 1 © Oliver Deiser 4. Komplexe Zahlen 313 Realteil, Imaginärteil, Betrag und Konjugation Als Nächstes führen wir Koordinatenfunktionen einer komplexen Zahl ein: Definition (Real- und Imaginärteil, rein imaginär) Sei z = (x, y) P C. Dann setzen wir: Re(z) = x, Im(z) = y. Die reellen Zahlen Re(z) und Im(z) heißen der Realteil bzw. der Imaginärteil von z. Eine komplexe Zahl z heißt rein imaginär, falls Re(z) = 0. Zu beachten ist, dass auch der Imaginärteil stets eine reelle Zahl ist. Die imaginäre Einheit hat zum Beispiel den Realteil 0 und den Imaginärteil 1. Die Standarddarstellung einer komplexen Zahl liest sich nun in der Form z = Re(z) + i Im(z). Definition (Betrag einer komplexen Zahl) Sei z P C. Dann setzen wir |z| = £Re(z)2 + Im(z)2. Die reelle Zahl |z| heißt der Betrag von z. Der Betrag einer komplexen Zahl z = (x, y) ist die Euklidische Länge des Vektors (x, y). Die Eigenschaften des komplexen Betrags entsprechen den aus dem Reellen bekannten Eigenschaften: Satz (Eigenschaften des Betrags) Für alle z, w P C gilt: (a) |z| = 0 genau dann, wenn z = 0, (b) |z + w| ≤ |z| + |w|, (Dreiecksungleichung) (c) |z w| = |z| |w|. (Produktregel) Der Nachweis dieser Eigenschaften kann dem Leser überlassen werden. Eine sehr nützliche und häufig verwendete Funktion auf C ist: Definition (komplexe Konjugation) Sei z P C. Dann setzen wir: z = z* = Re(z) − i Im(z). Die komplexe Zahl z heißt die (komplex) Konjugierte von z. © Oliver Deiser Einführung in die Mathematik 1 314 3. Abschnitt Reelle und komplexe Zahlen Geometrisch entspricht die komplexe Konjugation der Spiegelung eines Vektors an der x-Achse. Die Notation z* ist vor allem in der Physik üblich. Für alle komplexen Zahlen gelten die Formeln |z|2 = z ⋅ z, Re(z) = z + z , 2 Im(z) = z − z . 2i Der Leser beweise diese Formeln sowohl algebraisch als auch mit Hilfe der Multiplikationsregel. Die komplexe Konjugation ist nützlich für die Inversenbildung. Dabei ist das Inverse z−1 von z P C definiert als das eindeutige w P C mit z ⋅ w = 1. Satz (multiplikative Inverse) Sei z P C mit z ≠ 0. Dann gilt z−1 = z |z|2 . Den Beweis durch Nachrechnen überlassen wir dem Leser als Übung. Geometrisch lässt sich die Formel für die Inversenbildung leicht einsehen (und merken!): Denn die komplexe Zahl w auf der rechten Seite hat die Länge |z|−1 und den negativen Winkel von z. Damit hat z ⋅ w die Länge |z||z|−1 = 1 und den Winkel 0. Das Inverse von z entsteht also durch Spiegelung an der x-Achse und Skalierung um das Inverse des Betragsquadrats von z. 1 z Im(z) z |z| |z| zw Re(z) 1 |z| -1 w z -1 Real- und Imaginärteil, Betrag, komplexe Konjugation und Inversenbildung Einführung in die Mathematik 1 © Oliver Deiser 4. Komplexe Zahlen 315 Übungen Übung 1 Zeigen Sie sowohl in kartesischen Koordinaten als auch in Polarkoordinaten, dass die komplexe Multiplikation kommutativ und assoziativ ist, d. h. dass z w = w z, z (w u) = (z w) u für alle z, w, u P C. Übung 2 Zeigen Sie, dass die komplexen Zahlen das Distributivgesetz erfüllen: z(w + u) = z w + z u für alle z, w, u P C. Begründen Sie das Distributivgesetz zudem geometrisch mit Hilfe eines Diagramms und der geometrischen Multiplikationsregel. Übung 3 Zeigen Sie, dass für alle z, w P C gilt: (a) |z| = 0 genau dann, wenn z = 0, (b) |z + w| ≤ |z| + |w|, (c) |z w| = |z| |w|. (Dreiecksungleichung) (Produktregel) Übung 4 Zeigen Sie (wahlweise in kartesischen Koordinaten oder in Polarkoordinaten), dass für alle z P C gilt: (a) Re(z) = z + z , 2 (b) Im(z) = z − z , 2i (c) |z|2 = z z, (d) z− 1 = z |z|2 , falls z ≠ 0. Illustrieren Sie die Formeln zudem mit Hilfe von Diagrammen. © Oliver Deiser Einführung in die Mathematik 1 5. Der Fundamentalsatz der Algebra Die komplexen Zahlen zeichnen sich vor den reellen Zahlen durch die universelle Lösbarkeit von algebraischen Gleichungen aus. Äquivalent formuliert: Jedes komplexe Polynom zerfällt in Linearfaktoren. Das Paradebeispiel ist x2 + 1 = (x − i) (x + i). Diese fundamentale Eigenschaft ist das Thema dieses Kapitels. Wir betrachten zunächst einige Spezialfälle und geben dann einen anschaulichen Beweis für den allgemeinen Fall. © Oliver Deiser Einführung in die Mathematik 1 318 3. Abschnitt Reelle und komplexe Zahlen Komplexe Polynome Im ersten Abschnitt hatten wir reelle Polynome betrachtet. Polynome und alle zugehörigen Begriffe wie Grad, Normiertheit, Nullstelle, algebraische Vielfachheit usw. lassen sich in analoger Weise auch für die komplexen Zahlen betrachten. Der Vollständigkeit halber definieren wir explizit: Definition (komplexes Polynom) Seien a0 , …, an P C. Dann heißt die Funktion f : C → C mit f(z) = an zn + an − 1 zn − 1 + … + a0 für alle z P C das (komplexe) Polynom oder die (komplexe) Polynomfunktion mit den Koeffizienten a0 , …, an . Genau wie für R wird der Grad deg(f) eines komplexen Polynoms erklärt. Auch die Definitionen der Begriffe Leitkoeffizient, normiert, Nullpolynom, konstantes Polynom, Nullstelle können übernommen werden. Ein komplexes Polynom lässt sich visualisieren, indem wir in ein Diagramm für einige z Pfeile von z nach f(z) eintragen. In den folgenden Diagrammen betrachten wir die Abbildungsdynamik zweier einfacher Polynome auf dem Einheitskreis. 1.0 0.5 -1.0 -0.5 0.5 1.0 -0.5 -1.0 Die Wirkung von f(z) = z2 /2 auf dem Einheitskreis Einführung in die Mathematik 1 © Oliver Deiser 5. Der Fundamentalsatz der Algebra 319 2 1 -1 1 2 3 -1 -2 Die Wirkung von f(z) = z2 + z + 1 auf dem Einheitskreis Die Visualisierung mit Hilfe von Pfeilen führt schnell zu unübersichtlichen Darstellungen. Eine Alternative, die prinzipiell die gesamte Information der Funktion zum Ausdruck bringen kann, ist: Die Farbkreismethode (color wheel method, domain coloring) Jeder komplexen Zahl im Polarkoordinaten (r, ϕ) wird eine von ϕ abhängige Farbe eines Farbkreises und eine von r abhängige Farbintensität zugeordnet. Zum Beispiel kann der Nullpunkt schwarz (alternativ: weiß) und komplexe Zahlen mit großem Radius r blass (alternativ: gesättigt) eingefärbt werden. Oft werden auch periodische Intensitäten verwendet, um die Darstellung optisch zu verbessern. Eine Funktion f : C → C können wir nun visualisieren, indem wir jeden Punkt z der Zahlenebene mit der Farbe f(z) einfärben. Die Nullstellen von f erscheinen dabei als schwarze (alternativ: weiße) Punkte. Da wir im Folgenden die Nullstellen einer Funktion betonen möchten, färben wir in den folgenden Beispielen den Nullpunkt schwarz. Weiter verwenden wir eine relativ starke Verblassung für komplexe Zahlen mit großen Beträgen. Zusätzlich zeichnen wir oft ein Gitter ein, das durch f auf ein polares Koordinatengitter abgebildet wird. Der Standard ist dabei ein „uhrartiges“ polares Gitter mit ganzzahligen Radien und zwölf Winkelstrahlen. © Oliver Deiser Einführung in die Mathematik 1 320 3. Abschnitt Reelle und komplexe Zahlen 3 2 Färbung der komplexen Ebene: Farbplot des Polynoms 1 f(z) = z 0 -1 -2 -3 -3 -2 -1 0 1 2 3 3 2 Farbplot des Polynoms 1 f(z) = z + 1 + i 0 Nullstellen: − 1 − i -1 -2 -3 -3 -2 -1 0 1 2 3 2 1 Farbplot des Polynoms f(z) = z2 0 Nullstellen: 0 (doppelt) -1 -2 -2 -1 0 Einführung in die Mathematik 1 1 2 © Oliver Deiser 5. Der Fundamentalsatz der Algebra 321 2 1 Farbplot des Polynoms f(z) = z2 + 1 0 Nullstellen: i, −i -1 -2 -2 -1 0 1 2 2 1 Farbplot des Polynoms f(z) = z2 + 0 1+i z−i 2 Nullstellen: (1 + i)/2, −1 − i -1 -2 -2 -1 0 1 2 2 1 Farbplot des Polynoms f(z) = z3 + z2 − 2 0 Nullstellen: 1, −1 + i, −1 − i Radiales Gitter: 1, 2, 4, 8, 16 -1 -2 -2 -1 © Oliver Deiser 0 1 2 Einführung in die Mathematik 1 322 3. Abschnitt Reelle und komplexe Zahlen Formulierungen des Fundamentalsatzes Die Sätze über den Koeffizientenvergleich, die Polynomdivision und das Abspalten von Linearfaktoren bleiben samt ihren Beweisen für komplexe Polynome gültig. Insbesondere kann ein Polynom n-ten Grades höchstens n Nullstellen besitzen. Der Fundamentalsatz der Algebra besagt nun, dass tatsächlich n in ihrer Vielfachheit gezählte Nullstellen existieren. Es gibt viele Möglichkeiten, dieses Ergebnis zu formulieren. Eine davon ist: Satz (Fundamentalsatz der Algebra) Seien a0 , …, an P C mit n ≥ 1 und an ≠ 0. Weiter sei f : C → C mit f(z) = an zn + … + a1 z + a0 für alle z P C das zugehörige komplexe Polynom. Dann gibt es (nicht notwendig paarweise verschiedene) w1 , …, wn P C mit f(z) = an (z − w1 ) ⋅ (z − w2 ) ⋅ … ⋅ (z − wn ) für alle z P C. Kurz: Jedes komplexe Polynom zerfällt vollständig in Linearfaktoren. Oder: Jedes komplexe Polynom ist das Produkt von komplexen Geraden. Ist das Polynom normiert, so lässt es sich als Produkt von Geraden der Steigung 1 schreiben. Alternativ können wir den Fundamentalsatz auch (scheinbar schwächer) so formulieren: Jedes komplexe Polynom von Grad größergleich 1 besitzt mindestens eine Nullstelle. Weiß man dies, so gewinnt man durch wiederholtes Abspalten von Linearfaktoren den Satz in der obigen Version. Schließlich können wir anstelle eines Polynoms auch eine algebraische Gleichung an zn + an − 1 zn − 1 + … + a0 = 0 mit komplexen Koeffizienten ak betrachten und den Fundamentalsatz so zum Ausdruck bringen: Jede algebraische Gleichung von Grad n ≥ 1 hat eine komplexe Lösung. In Analogie zu obiger Version für Polynome formulieren wir: Satz (Fundamentalsatz der Algebra, Version für algebraische Gleichungen) Sei an zn + … + a1 z + a0 = 0 eine algebraische Gleichung mit Koeffizienten a0 , …, an P C, an ≠ 0, n ≥ 1. Dann gibt es w1 , …, wn P C mit an zn + … + a1 z + a0 = an (z − w1 ) ⋅ (z − w2 ) ⋅ … ⋅ (z − wn ). Die Gleichung hat also genau die komplexen (nicht notwendig paarweise verschiedenen) komplexen Lösungen w1 , …, wn . Erfreulicherweise gibt es anschauliche Beweise des Fundamentalsatzes, die auf der geometrischen Bedeutung der Multiplikation beruhen. Bevor wir einen solchen Beweis vorstellen, betrachten wir aber einige Spezialfälle. Wir beginnen mit komplexen Quadratwurzeln und der komplexen Version der Lösungsformel für Gleichungen zweiten Grades. Einführung in die Mathematik 1 © Oliver Deiser 5. Der Fundamentalsatz der Algebra 323 Komplexe Quadratwurzeln Wir definieren: Definition (komplexe Quadratwurzel) Sei u P C. Eine komplexe Zahl w heißt eine komplexe Quadratwurzel von u, falls w2 = u gilt. Mit w ist immer auch −w eine komplexe Quadratwurzel von u. Beispiele (1) −1 hat die komplexen Quadratwurzeln i und −i. (2) i hat die komplexen Quadratwurzeln (cos π/4, sin π/4) = c (1, 1) und − c (1, 1), wobei c = 1/£2. Die komplexen Wurzeln von u sind die Nullstellen des Polynoms f mit f(z) = z2 − u für alle z P C. Diese Nullstellen können wir mit Hilfe der Multiplikationsregel sofort angeben: Satz (komplexe Quadratwurzeln in Polarkoordinaten) Sei u P C, und sei u = (r, ϕ) in Polarkoordinaten. Dann sind w = (£r, ϕ/2) und −w = (£r, ϕ/2 + π) die in Polarkoordinaten dargestellten komplexen Quadratwurzeln von u. 2 z 1 w -2 -1 1 2 -w -1 -2 Die komplexen Quadratwurzeln von z © Oliver Deiser Einführung in die Mathematik 1 324 3. Abschnitt Reelle und komplexe Zahlen Wir ziehen also die reelle Wurzel aus der Länge und halbieren den Winkel der Zahl u. Zusammen mit der am Nullpunkt gespiegelten komplexen Zahl haben wir dann die beiden komplexen Wurzeln von u vorliegen. Wir geben die Wurzeln noch in kartesischen Koordinaten an. Kartesisch ist w = £r (cos ϕ/2, sinϕ/2). Nach den Halbierungsformeln für den Kosinus und Sinus ist r + r cos ϕ , 2 r cos2 (ϕ/2) = r sin2 (ϕ/2) = r − r cos ϕ . 2 Wegen r cos ϕ = Re(u) erhalten wir Re(w)2 = r cos2 (ϕ/2) = r + Re(u) , 2 Im(w)2 = r sin2 (ϕ/2) = r − Re(u) . 2 Die Werte cos(ϕ/2) und sin(ϕ/2) haben genau dann verschiedene Vorzeichen, wenn ϕ einem der Intervall …, ] −π, 0 [, ] π, 2π [, ] 3π, 4π [, … angehört, d. h. wenn Im(u) < 0. Aus w = (Re(w), Im(w)) erhalten wir also: Satz (komplexe Quadratwurzeln in kartesischen Koordinaten) Sei u P C. Weiter seien r = |u| und σ = { 1 −1 falls Im(u) ≥ 0, falls Im(u) < 0. Dann sind w1/2 = ± ( s r + Re(u) , σ 2 s r − Re(u) 2 ) die komplexen Quadratwurzeln von u. Die Mitternachtsformel bleibt (mit gleicher Herleitung zum Beispiel durch quadratische Ergänzung) auch für die komplexen Zahlen gültig. Damit hat eine Gleichung a z2 + b z + c = 0, mit a, b, c P C, a ≠ 0 zweiten Grades in C genau die komplexen Lösungen w1,2 = −b ± £b2 − 4ac , 2a (Mitternachtsformel für C) wobei wir unter der Wurzel irgendeine der beiden komplexen Quadratwurzeln von u = b2 − 4ac verstehen (da ± vor der Wurzel steht, spielt die Wahl nur für die Numerierung der Lösungen eine Rolle). Eine solche Wurzel können wir Einführung in die Mathematik 1 © Oliver Deiser 5. Der Fundamentalsatz der Algebra 325 mit den obigen Sätzen berechnen. In den komplexen Zahlen entfällt die Beachtung eines Vorzeichens der Diskriminante u. In C führt jede Diskriminante zu Lösungen. Beispiel Wir betrachten die Funktion f : C → C mit f(z) = z2 /2 − z − i. Nach der Mitternachtsformel sind genau die komplexen Zahlen w1,2 = −b ± £b2 − 4ac 2a = 1 ± £1 + 2i die Nullstellen von f. Nach der Formel des Satzes ist s s £5 − 1 £5 + 1 , u = 2 2 ) ( eine der beiden komplexen Quadratwurzeln von u = 1 + 2i (mit σ = 1, Re(u) = 1, r = £5). In kartesischen Koordinaten lauten die Nullstellen also s s £5 − 1 £5 + 1 . , ± w1,2 = 1 ± u = 1 ± 2 2 ( ) Auf drei Nachkommastellen gerundet ist w1 = (2,272; 0,786), w2 = (0,272; − 0,786). Dreidimensionaler Plot der Funktion g : C → R mit g(z) = |f(z)|2 für alle z P C. Die Nullstellen von g sind genau die Nullstellen von f. © Oliver Deiser Einführung in die Mathematik 1 326 3. Abschnitt Reelle und komplexe Zahlen Die komplexen Einheitswurzeln Wir definieren nun spezielle n-te Wurzeln: Definition (n-te Einheitswurzel) Sei n ≥ 1. Dann heißt ein w P C eine n-te Einheitswurzel, falls wn = 1. Die n-ten Einheitswurzeln sind nach Definition genau die Nullstellen des Polynoms f : C → C mit f(z) = zn − 1 für alle z P C. Für eine n-te Einheitswurzel w gilt wn = 1, sodass w eine n-te Wurzel der 1 ist. Im algebraischen Jargon wird die 1 auch als (multiplikative) Einheit bezeichnet, was die Namensgebung als Einheitswurzel motiviert. Mit der geometrischen Deutung der Multiplikation können wir die n-ten Einheitswurzeln leicht angeben, wodurch der Fundamentalsatz der Algebra für wichtige Spezialfälle bereits bewiesen ist. Schreiben wir eine komplexe Zahl w in Polarkoordinaten (r, ϕ), so gilt wn = (rn , nϕ). Damit gilt wn = (1, 0) genau dann, wenn eine ganze Zahl k existiert mit (rn , nϕ) = (1, k 2π). Damit sind genau die komplexen Zahlen wk = (1, k2π/n) für alle k P Z n-te Einheitswurzeln. Beschränken wir k auf 0, …, n − 1, so erhalten wir alle paarweise verschiedenen Wurzeln. Damit haben wir gezeigt: Satz (n-te Einheitswurzeln) Sei n ≥ 1. Dann sind für k = 0, …, n − 1 die komplexen Zahlen wk = (1, k 2π/n) in Polarkoordinaten, wk = (cos(k2π/n), sin(k2π/n)) in kartesischen Koordinaten alle n-ten Einheitswurzeln. Sie bilden das regelmäßige in den Einheitskreis einbeschriebene n-Eck, dem der Punkt w0 = 1 = (1, 0) angehört. Traditionell werden die komplexen Einheitswurzeln mit dem griechischen Buchstaben Zeta bezeichnet. Wir setzen also ( ζ nk = cos ( k 2π k 2π ), sin ( n n )) für alle n ≥ 1 und k P Z. Ist n fest, schreiben wir nur ζk . Bei festem n gilt für alle k, m P Z: 1 = ζ 0 = ζ kn , ζ k ζ m = ζ k + m , (ζ1 )k = ζk , (ζk )m = ζ m k . Einführung in die Mathematik 1 © Oliver Deiser 5. Der Fundamentalsatz der Algebra 327 3 1 2 4 1 5 0 -1 1 6 10 7 -1 9 8 Die elften Einheitswurzeln ζk = ζ11 k am Einheitskreis i 0 1 i 1 i 10 i 2 i 9 -1 1 i 3 i 8 i 4 i 7 i 5 -1 i 6 Die Multiplikation der Einheitswurzeln mit i bewirkt eine Drehung der Figur um π/2. © Oliver Deiser Einführung in die Mathematik 1 328 3. Abschnitt Reelle und komplexe Zahlen Das regelmäßige Fünfeck Als Anwendung der komplexen Einheitswurzeln analysieren wir das regelmäßige Fünfeck (Pentagon). Sei hierzu z = ζ51 = (cos(2π/5), sin(2π/5)). Dann sind 1, z, z2 , z3 , z4 die Ecken des regelmäßigen in den Einheitskreis einbeschriebenen Fünfecks, dem der Punkt (1, 0) angehört. Es gilt (+) 1 + z + z2 + z3 + z4 = 1 − z5 1−z = 0, wobei wir beim ersten Gleichheitszeichen die auch in C gültige Formel für die geometrische Summe bzw. konkret (1 − z) (1 + z + z2 + z3 + z4 ) = 1 − z5 verwenden und beim zweiten Gleichheitszeichen beobachten, dass z5 = z0 = 1. Wir setzen nun w = z + z4 . Dann ist w reell und weiter positiv, da w = z + z4 = z + z−1 = z + z = 2 Re(z) = 2 cos(2π/5) > 0. Weiter gilt w2 + w − 1 = z2 + 2zz4 + z8 + z + z4 − 1 = 1 + z + z2 + z3 + z4 = 0. Die Mitternachtsformel liefert wegen w > 0, dass w = £5 − 1 , 2 d.h. w ist das Inverse des goldenen Schnitts (1 + £5)/2. Wegen w = 2 Re(z) erhalten wir den Wert cos(2π/5) = £5 − 1 . 4 Da sich der Punkt P = ((£5 − 1)/4, 0) und damit ζ1 geometrisch mit Zirkel und Lineal konstruieren lässt (Übung), haben wir unter Verwendung komplexer Zahlen gezeigt, dass Re(z) und damit z und in der Folge auch das ganze regelmäßige Pentagon mit Zirkel und Lineal konstruierbar ist. Dies ist keineswegs klar. Ein regelmäßiges Siebeneck kann zum Beispiel nicht mehr mit Hilfe von Zirkel und Lineal konstruiert werden. Der Wert cos(2π/7) lässt sich im Gegensatz zu cos(2π/5) nicht mehr als Wurzelausdruck schreiben. Einführung in die Mathematik 1 © Oliver Deiser 5. Der Fundamentalsatz der Algebra 1 329 1 2 P 0 -1 1 Die fünften Einheitswurzeln mit Pentagon (Fünfeck) und Pentagramm (Fünfstern). Im Pentagramm findet sich ein zweites kleineres Pentagon. 3 -1 4 Dreidimensionaler Plot der Funktion g : C → R mit g(z) = |z5 − 1|2 . Die fünften Einheitswurzeln sind die Nullstellen dieser Funktion. 1.5 1.0 Farbplot des Polynoms 0.5 f(z) = z5 − 1 0.0 Radiales Gitter: 1, 2, 4, 8, 16, 32 -0.5 -1.0 -1.5 -1.5 -1.0 © Oliver Deiser -0.5 0.0 0.5 1.0 1.5 Einführung in die Mathematik 1 330 3. Abschnitt Reelle und komplexe Zahlen Ein anschaulicher Beweis des Fundamentalsatzes Wir haben den Fundamentalsatz der Algebra für komplexe Polynome zweiten Grades und weiter für die Polynome zn − 1 mit einem beliebigen Grad n ≥ 1 bewiesen. Ein vollständiger Beweis des Fundamentalsatzes ist nicht Ziel dieses Textes. Wir können aber mit einer durch Felix Klein verbreiteten Argumentation zeigen, dass sich der Fundamentalsatz in voller Allgemeinheit anschaulich einsehen lässt. Sei also f : C → C, f(z) = zn + an − 1 zn − 1 + … + a1 z + a0 für alle z P C, ein ohne Einschränkung normiertes Polynom n-ten Grades mit komplexen Koeffizienten (die Nullstellen eines Polynoms ändern sich bei der Division durch seinen Leitkoeffizienten nicht). Eine Nullstelle z des Polynoms f ist charakterisiert durch die Eigenschaft (+) Re(f(z)) = 0 und Im(f(z)) = 0. Die Nullstellen von f sind also genau die gemeinsamen Nullstellen der reellwertigen Funktionen Re(f(z)) und Im(f(z)) mit Definitionsbereich C. Wir setzen nun An = { z P C | Re(zn ) = 0 }, Bn = { z P C | Im(zn ) = 0 }. Diese Mengen können wir mit Hilfe der geometrischen Multiplikationsregel visualisieren. Sie sind regelmäßige Sterne, die aus n Geraden durch den Nullpunkt bestehen und so 2n unendliche Kreissektoren mit dem Winkel π/n definieren. Der Menge Bn gehört die x-Achse an, An entsteht aus Bn (und umgekehrt Bn aus An ) durch eine Drehung um den halben Winkel π/(2n) eines Sektors. Die Geraden, aus denen An und Bn bestehen, wechseln sich ab. Für komplexe Zahlen z mit einem sehr großen Betrag r = |z| ist f(z) ungefähr gleich zn , da der Leitterm zn das Polynom dominiert. Damit haben die Mengen Af = { z P C | Re(f(z)) = 0 }, Bf = { z P C | Im(f(z)) = 0 } außerhalb eines Kreises K mit dem Mittelpunkt 0 und einem hinreichend großen Radius r recht genau die sternförmige Gestalt der Mengen An und Bn . Innerhalb des Kreises K verlaufen die Linien von Af und Bf nicht mehr geradlinig wie in An und Bn , aber ein Schnittpunkt von Af und K wird aus Stetigkeitsgründen mit einem weiteren solchen Schnittpunkt verbunden. Gleiches gilt für Bf . Da sich nun die Schnittpunkte von Af und K mit den Schnittpunkten von Bf und K abwechseln, müssen sich die betrachteten Verbindungslinien innerhalb von K schneiden. Jeder solche Schnittpunkt ist aber nach (+) und den Definitionen von Af und Bf eine Nullstelle von f. Da es je 2n Schnittpunkte für Af und Bf mit K gibt, erhalten wir genau n (nicht notwendig paarweise verschiedene) Nullstellen von f. Einführung in die Mathematik 1 © Oliver Deiser 5. Der Fundamentalsatz der Algebra 10 10 5 5 0 0 -5 -5 -10 -10 -5 0 5 10 -10 -10 -5 0 5 331 10 Die Mengen An (mit y-Achse) und Bn (mit x-Achse) für n = 3 und n = 5 10 10 5 5 0 0 -5 -5 -10 -10 -5 0 5 10 -10 -10 -5 0 5 10 Af und Bf für f(z) = z3 + 2z2 + z + 1 (links) und f(z) = z5 + 2 i z3 − i z2 + 2 z − 1 (rechts) 10 10 5 5 0 0 -5 -5 -10 -10 -5 0 5 2 10 -10 -10 -5 0 5 10 3 Af und Bf für f(z) = (z − i + 3) (z + i − 2) (links) und ein Polynom vom Grad 6 (rechts) © Oliver Deiser Einführung in die Mathematik 1 332 3. Abschnitt Reelle und komplexe Zahlen Die Struktur der Mengen An und Bn lässt sich auch mit Hilfe von 3D-Plots visualisieren. Hierzu verwenden wir die Funktionen re*, im* : C → C mit re*(z) = 2/π arctan(Re(z)2 ), im*(z) = 2/π arctan(Im(z)2 ) für alle z P C. Der Wertebereich der beiden Funktionen ist das Intervall [ 0, 1 ]. Die Arkustangens-Funktion bildet alle Funktionswerte in das Intervall [ 0, π/2 ] ab, der Faktor 2/π führt zu Werten in [ 0, 1 ]. Diese Transformation dient der Übersichtlichkeit der Darstellung. Für jedes Polynom f : C → C sind die Mengen Af und Bf genau die Nullstellen von re* + f und im* + f. Im Plot erscheinen diese Mengen als Canyons, die in einem hinreichend großen Abstand vom Ursprung eine sternförmige Gestalt annehmen. Die Funktionen re*(f(z)) und im*(f(z)) samt den Mengen Af bzw. Bf für das Polynom f(z) = z5 Einführung in die Mathematik 1 © Oliver Deiser 5. Der Fundamentalsatz der Algebra 333 Die Funktionen re*(f(z)) und im*(f(z)) samt den Mengen Af bzw. Bf für das Polynom f(z) = z3 + 2z2 + z + 1. Komplexe Wurzelfunktionen Wir hatten unter £z irgendeine der beiden komplexen Wurzeln von z verstanden. Wenn wir eine komplexe Wurzelfunktion sqrt : C → C definieren wollen, müssen wir uns auf eine der beiden Wurzeln festlegen, da Funktionswerte eindeutig sind. Wir arbeiten in Polarkoordinaten mit Winkeln in [ 0, 2π [ (Variante 1) bzw. ] −π, π ] (Variante 2). Die Wurzeln einer komplexen Zahl z = (r, ϕ) sind w = (£r, ϕ/2) und −w. Wir wählen w und setzen also sqrt(z) = (£r, ϕ/2) für alle z = (r, ϕ) P C (polar). © Oliver Deiser Einführung in die Mathematik 1 334 3. Abschnitt Reelle und komplexe Zahlen Bei Variante 1 erhalten wir Winkel in [0, π[, bei Variante 2 Winkel in ]−π/2, π/2]. In ersten Fall ist sqrt unstetig auf der positiven x-Achse, im zweiten unstetig auf der negativen x-Achse. Der beschränkte Wertebereich und die Unstetigkeitshalbstahlen lassen sich durch Farbplots veranschaulichen: 10 5 Farbplot der komplexen Quadratwurzelfunktion sqrt bei Variante 1 (Winkelfarben in [ 0, π[ ) 0 -5 -10 -10 -5 0 5 10 10 5 Farbplot der komplexen Quadratwurzelfunktion sqrt bei Variante 2 (Winkelfarben in ] −π/2, π/2]) 0 -5 -10 -10 -5 0 5 10 In der Funktionentheorie wird die Variante 2 bevorzugt. Dort wählt man das Winkelintervall ] −π, π ] als Standard. Analoge Überlegungen gelten für dritte und höhere Wurzeln und viele andere Funktionen. Eine dritte Wurzelfunktion root3 : C → C kann beispielsweise durch root3 (z) = (r1/3 , ϕ/3) für alle z = (r, ϕ) P C (polar). definiert werden. Bei Variante 2 ergeben sich Winkel in ]−π/3, π/3]. Erneut ist die Funktion unstetig auf der negativen x-Achse. Einführung in die Mathematik 1 © Oliver Deiser 5. Der Fundamentalsatz der Algebra 335 Übungen Übung 1 Eine komplexe Funktion f : C → C lässt sich wie beschrieben mit der Farbkreismethode visualisieren, indem wir jedem Winkel ϕ P [ 0, 2π [ eine Farbe und jedem r ≥ 0 eine Farbintensität (weiß für r = 0, dunkel für große r) zuweisen. Jedes z = (r, ϕ) in Polarkoordinaten wird dann mit der Farbe f(z) gefärbt. Diskutieren Sie qualitativ eine derartige Färbung für die Funktionen (a) f(z) = z − c mit einer Konstanten c P C, (b) f(z) = z, (c) f(z) = 1/z für alle z ≠ 0, (d) f(z) = z2 , (e) f(z) = z3 − 1. Übung 2 Geben Sie die komplexen Lösungen der Gleichung 3z2 − 2z + 1 = 0 in kartesischen Koordinaten an. Übung 3 Sei n ≥ 1. Zeigen Sie: (a) Das Produkt zweier n-ter Einheitswurzeln ist eine n-te Einheitswurzel. (b) Das multiplikative Inverse einer n-ten Einheitswurzel ist eine n-te Einheitswurzel. Übung 4 Seien n, m ≥ 1. In welchem Fall ist jede n-te Einheitswurzel auch eine m-te Einheitswurzel? Übung 5 Sei n ≥ 1. Geben Sie alle Nullstellen des Polynoms f : C → C mit f(z) = zn + 1 für alle z P C polar und kartesisch an. Zeichnen Sie die Nullstellen und beschreiben Sie ihren Zusammenhang mit den komplexen Einheitswurzeln. © Oliver Deiser Einführung in die Mathematik 1 336 3. Abschnitt Reelle und komplexe Zahlen Übung 6 Seien n ≥ 1 und d P C. Geben Sie (in Verallgemeinerung der vorangehenden Übung) alle Nullstellen des Polynoms f : C → C mit f(z) = zn − d für alle z P C polar und kartesisch an und erstellen sie ein erläuterndes Diagramm. Übung 7 Konstruieren Sie mit Zirkel und Lineal den Punkt P = (x1 , 0) mit x1 = cos(2π/5) = £5 − 1 . 4 Konstruieren Sie weiter mit Hilfe von P ein regelmäßiges Pentagon. Übung 8 Wie bei der Diskussion des regelmäßigen Fünfecks sei z = ζ51 = (cos(2π/5), sin(2π/5)). Wir setzen a = |1 − z|, b = |1 − z2 |, sodass a die Länge der Seite und b die Länge der Diagonalen des Pentagons 1, z, z2 , z3 , z4 ist. Erstellen Sie eine Skizze und zeigen Sie mit Hilfe komplexer Zahlen, dass s b 5 − £5 1 + £5 , = (goldener Schnitt). a = 2 a 2 Einführung in die Mathematik 1 © Oliver Deiser 6. Die komplexe Exponentialfunktion Zum Abschluss unserer Einführung in die Welt der komplexen Zahlen betrachten wir die komplexe Exponentialfunktion, die manchmal als die wichtigste Funktion der Mathematik bezeichnet wird. Dass die Exponentialfunktion als Generator für viele Funktionen dienen kann, ist uns aus dem Reellen schon bekannt. Im Reellen ist aber kein Zusammenhang mit den trigonometrischen Funktionen zu sehen. Dies ändert sich im Komplexen in einer wunderbaren Art und Weise. © Oliver Deiser Einführung in die Mathematik 1 338 3. Abschnitt Reelle und komplexe Zahlen Übertragung analytischer Begriffe ins Komplexe Mit den komplexen Zahlen können wir so arbeiten wie mit den reellen Zahlen. Lediglich eine lineare Ordnung, mit der zwei Zahlen nach ihrer Größe verglichen werden können, steht in der Zahlenebene C = R2 nicht mehr zur Verfügung. Eine solche Ordnung wird aber für viele grundlegende Konzepte der Analysis nicht gebraucht. So können wir zum Beispiel den Limes limn zn = z einer Folge (zn )n P N komplexer Zahlen wie in R definieren durch ∀ε > 0 ∃n0 ∀n ≥ n0 |z − zn | < ε (mit ε P R wie bisher). Die Konvergenz von (zn )n PN gegen z bedeutet, dass für alle ε > 0 fast alle (alle bis auf höchstens endlich viele) Folgenglieder in der offenen ε-Umgebung Uε (z) = { w P C | |z − w| < ε } von z liegen. Kurz: Jeder Kreis um z fängt die Folge die schließlich ein. 2 z2 z1 z8 z7 U (z) z9 z3 z0 1 z6 z4 z5 1 2 Eine spiralförmige Konvergenz in C: (zn )n P N konvergiert gegen z = (1, 1) = 1 + i Alternativ lässt sich der Grenzwert einer Folge in C auch über reelle Grenzwerte ausdrücken: Die Konvergenz von (zn )n P N gegen z ist gleichwertig mit der Konvergenz der beiden reellen Folgen (Re(zn ))n P N und (Im(zn ))n P N gegen die reellen Zahlen Re(z) bzw. Im(z). Eine Folge komplexer Zahlen konvergiert also genau dann, wenn sie koordinatenweise konvergiert. Einführung in die Mathematik 1 © Oliver Deiser 6. Die komplexe Exponentialfunktion 339 Aus dem Konvergenzbegriff für Folgen ergibt sich genau wie früher der Konvergenzbegriff für unendliche Reihen in C: Im Fall der Existenz ist ∑ n zn = z0 + … + zn + … = limn sn , wobei sn = z0 + … + zn wieder die n-te Partialsumme der Folge (zn )n P N in C ist. Auch die Definition des Grenzwerts für Funktionen können wir übernehmen: limz →p f(z) = a ist für eine Funktion f : C → C, eine Stelle p P C und ein a P C definiert durch ∀ε > 0 ∃δ > 0 ∀w P C (|w − p| < δ → |f(w) − a| < ε) Gilt limz dingung →p (mit ε,δ P R wie bisher). f(z) = f(p), so nennen wir wieder f stetig an der Stelle p. Die ε-δ-Be- ∀ε > 0 ∃δ > 0 ∀w P C (|w − p| < δ → |f(w) − f(p)| < ε) der Stetigkeit von f an der Stelle p können wir mit Hilfe von Umgebungen auch kompakt notieren als (+) ∀ε > 0 ∃δ > 0 f [ Uδ (p) ] ⊆ Uε (f(p)). Dabei ist f [ X ] = { f(x) | x P X } das Bild der Menge X unter f. Die Formulierung (+) besagt also, dass für jedes vorgegebene ε > 0 ein geeignetes (von ε abhängiges) δ > 0 gewählt werden kann, sodass das Bild der δ-Umgebung von p unter f eine Teilmenge der ε-Umgebung von f(p) ist. U (f(p)) f(p) f U (p) p Zur ε-δ-Stetigkeit von f an der Stelle p: Zu jedem ε > 0 gibt es ein δ > 0 derart, dass f die δ-Umgebung Uδ (p) in die ε-Umgebung Uε (f(p)) abbildet. © Oliver Deiser Einführung in die Mathematik 1 340 3. Abschnitt Reelle und komplexe Zahlen Die Stetigkeit lässt sich erneut gleichwertig als Folgenstetigkeit formulieren: Für alle Folgen (zn )n P N in C mit limn zn = p gilt limn f(zn ) = f(p). Diese Definitionen lassen sich an Funktionen f : P → C anpassen, die nur auf einer gewissen Teilmenge P der komplexen Zahlenebene definiert sind. Differentialquotienten können ebenfalls unverändert ins Komplexe übertragen werden: Für f : P → C und p P P heißt im Fall der Existenz f ′(p) = limz f(z) − f(p) PC z−p →p die Ableitung von f an der Stelle p. Die üblichen Notationen werden übernommen. Wie in R gilt zum Beispiel d n z = n zn − 1 . dz Die Exponentialfunktion im Komplexen Die reelle Exponentialfunktion exp : R → R hatten wir über ihre Ableitung und ihren Wert an der Stelle 0 charakterisiert: Sie ist die eindeutige Funktion f : R → R mit f ′ = f und f(0) = 1. Wesentliche Eigenschaften sind das Additionstheorem exp(x + y) = exp(x) exp(y) für alle x, y P R und die für alle x P R gültige Reihendarstellung exp(x) = ∑ n xn n! = 1 + x + x2 2 + … + xn n! + …, die durch gliedweises Differenzieren die Ableitungsregel exp′ = exp reproduziert. All dies lässt sich nach C übertragen, sodass folgende Definition möglich ist: Definition (komplexe Exponentialfunktion) Die komplexe Exponentialfunktion exp : C → C ist die eindeutige Funktion f : C → C mit (a) f ′ = f, (b) f(0) = 1. Erneut folgt hieraus das Additionstheorem exp(z + w) = exp(z) exp(w) für alle z, w P C, welches die Notation ez für exp(z) (Exponentialschreibweise im Komplexen) motiviert. Einführung in die Mathematik 1 © Oliver Deiser 6. Die komplexe Exponentialfunktion 341 Für alle z P C gilt die Reihendarstellung exp(z) = ∑ n z2 zn zn = 1+z+ +…+ +… n! 2 n! (komplexe Exponentialreihe) Die komplexe Exponentialfunktion setzt die reelle Exponentialfunktion fort, d. h. für alle x P R ⊆ C stimmen die Werte der beiden Funktionen überein. Die Konvergenz der komplexen Exponentialreihe lässt sich wieder mit Hilfe des Quotientenkriteriums und der geometrischen Reihe nachweisen. Letztere wird wie in R eingeführt. Für die komplexe geometrische Summe gilt ∑ k ≤ n zk = 1 + z + z2 + … + zn = 1 − zn + 1 1−z für alle z ≠ 1, sodass die komplexe geometrische Reihe im Inneren des Einheitskreises konvergiert: ∑ n zn = 1 + z + z2 + … + zn + … = 1 1−z für alle z mit |z| < 1. Beispiel Wir setzen c = 19/20 ⋅ 1/£2 und q = c (1 + I). Die geometrische Reihe für q konvergiert, da |q| = 19/20 < 1. Der Grenzwert berechnet sich zu 1 1−q = 1 c2 + (1 − c)2 ( 1 − c, c ) = ( 0,587…, 1,201… ). Die Konvergenz ist aufgrund der Nähe von q zum Rand des Einheitskreises recht langsam. s4 s3 2 s12 s11 s5 s2 s13 s6 1 s10 s14 s9 s15 s7 s1 s8 s0 1 2 Die Partialsummen der geometrischen Reihe für q = 95/100 (1 + I)/£2 © Oliver Deiser Einführung in die Mathematik 1 342 3. Abschnitt Reelle und komplexe Zahlen Kreisaufwicklung und Eulersche Formel Während die komplexe Exponentialfunktion formal der reellen gleicht, sind ihre Abbildungseigenschaften zunächst noch weitgehend unbekannt. Wir kennen die Funktion zunächst nur auf der x-Achse, da sie dort mit der reellen Exponentialfunktion zusammenfällt. Schreiben wir eine beliebige komplexe Zahl z in der Standardzerlegung z = x + i y mit x = Re(z) und y = Im(z), so gilt aufgrund des Additionstheorems exp(z) = exp(x + iy) = exp(x) exp(i y). Damit bleibt die Aufgabe, die Funktionswerte exp(i y) P C für alle y P R zu ermitteln: Wir müssen die Exponentialfunktion auf der imaginären Achse untersuchen. Ein allgemeiner Wert exp(z) = exp(x + iy) lässt sich als die Skalierung der komplexen Zahl exp(i y) mit dem reellen Skalar exp(x) auffassen. Sei also y P R. Wo in der komplexen Ebene liegt exp(iy)? Erneut ist es das Additionstheorem, das uns weiterhilft. Aus der Reihenentwicklung gewinnen wir exp(z) = exp( z ) für alle z P C. Die Betragsformel |z|2 = z z für komplexe Zahlen liefert im Zusammenspiel mit dem Additionstheorem |exp(iy)|2 = exp(i y) exp(i y) = exp(i y) exp(− i y) = exp(iy − i y) = exp(0) = 1. Mit anderen Worten: Die komplexe Exponentialfunktion bildet die imaginäre Achse auf den Einheitskreis ab. Da dies in stetiger Form geschieht, wird die imaginäre Achse in einer noch näher zu ergründenden Art und Weise auf den Einheitskreis aufgewickelt, wobei ei 0 = e0 = 1 = (1, 0). Das Einfachste und Beste wäre eine längentreue Aufwicklung, sodass sich ei y gleichmäßig in y auf dem Einheitskreis bewegt und dabei ein Kreisbogen der Länge , durchlaufen wird, wenn y ein Intervall der Länge , durchläuft. Nehmen wir zusätzlich eine Kreisbewegung im und gegen den Uhrzeigersinn für monoton steigende bzw. fallende y an, so würde einfach ei y = (cos y, sin y) = cos y + i sin y für alle y P R, gelten. Denn wie wir wissen stellt (cos y, sin y) eine Kreisbewegung in der Variablen y mit den beschriebenen Eigenschaften dar. Der folgende Satz besagt, dass all dies in der Tat der Fall ist. Es gilt (wobei wir wieder x anstelle von y als Variable verwenden): Einführung in die Mathematik 1 © Oliver Deiser 6. Die komplexe Exponentialfunktion 343 Satz (Kreisaufwicklung, Eulersche Formel) Für alle x P R gilt exp(i x) = (cos x, sin x) = cos(x) + i sin(x). (Eulersche Formel) Wir geben zwei Beweise dieses fundamentalen Satzes. Beweis 1: Potenzreihenentwicklung Für alle x P R gilt unter Verwendung der Potenzreihenentwicklungen des Kosinus und Sinus: eix = ∑ n (ix)n n! = 1 + i x + i2 = 1 + ix − x2 2 = ∑ n (−1)n x2n (2n)! − i x3 3! x2 2 x4 4! + + i ∑ n (−1)n + … + in + i xn n! x5 x6 x − 5! 6! + … − i 73 7! + … x2n + 1 (2n + 1)! = cos x + i sin x. Beweis 2: Ableiten Wir wissen bereits, dass eix für alle x P R auf dem Einheitskreis liegt. Damit gibt es für alle x P R ein ϕ(x) P R mit (+) eix = (cos ϕ(x), sin ϕ(x)) = cos ϕ(x) + i sin ϕ(x). Dann gilt (unter Verwendung der auch in C gültigen elementaren Ableitungsregeln): −sinϕ(x) + i cosϕ(x) = i eix = d ix e = dx d dx ( cos ϕ(x) + i sin(ϕ(x) ) = − sin ϕ(x) ϕ′(x) + i cosϕ(x) ϕ′(x) = ( −sin ϕ(x) + i cosϕ(x) ) ϕ′(x). Damit ist ϕ′(x) = 1 für alle x P R. Folglich gibt es ein c P R mit ϕ(x) = x + c für alle x P R. Speziell ist ϕ(0) = c. Nach (+) gilt für x = 0 1 = ei0 = cos c + i sin c, sodass c ein ganzzahliges Vielfaches von 2π ist. Sei also k P Z mit c = k2π. Dann gilt für alle x P R: eix = cos ϕ(x) + i sin ϕ(x) = cos(x + k2π) + i sin(x + k2π) = cos x + i sin x. © Oliver Deiser Einführung in die Mathematik 1 344 3. Abschnitt Reelle und komplexe Zahlen Spezielle Werte der Kreisaufwicklung sind: exp(0) = 1, exp(i π/2) = i, exp(i π) = −1, exp(i 3π/2) = −i, exp(i 2π) = 1. Die dritte Aussage ist die berühmte Eulersche Identität. Leicht umformuliert lautet sie: Korollar (Eulersche Identität) ei π + 1 = 0. Damit sind die fünf fundamentalen mathematischen Größen 0, 1, i, π und e in einer Aussage vereint. exp 2 exp 3 exp 4 exp( 4 ) exp(0) exp 5 exp 4 7 4 exp 3 2 Werte der komplexen Exponentialfunktion am Einheitskreis Aus exp(i 2π) = 1 erhalten wir Korollar (Periodizität) Für alle z P C und k P Z gilt exp(z + i k2π) = exp(z). Beweis exp(z + i k 2π) = exp(z) exp(i k 2π) = exp(z) exp(i 2π)k = exp(z) 1k = exp(z). Aufgrund ihrer Periodizität ist die komplexe Exponentialfunktion durch ihre Werte auf dem Streifen R × [ 0, 2π [ bestimmt. Die Funktion wiederholt sich, wenn wir mehrere derartige Streifen übereinander oder untereinander legen. Wir fassen zusammen: Einführung in die Mathematik 1 © Oliver Deiser 6. Die komplexe Exponentialfunktion 345 Anschauliche Beschreibung der komplexen Exponentialfunktion Sei p P C ein Punkt der Ebene, und sei exp(p) P C sein Bild unter der komplexen Exponentialfunktion. Bewegen wir uns, in p startend, in der Variablen z parallel zur x-Achse, so bewegt sich exp(z) auf der Halbgeraden, die von 0 durch exp(p) führt (Skalierung von exp(p)). Dabei erreicht exp(z) bei einer Bewegung nach links nie die Null, entfernt sich dagegen bei einer Bewegung nach rechts mit exponentieller Geschwindigkeit. Bewegen wir uns in p startend in der Variablen z parallel zur y-Achse, so dreht sich f(z) auf dem Kreis mit Radius r = |f(p)| durch den Nullpunkt. Die Kreisbewegung erfolgt gegen den Uhrzeigersinn bei einer Bewegung nach oben und im Uhrzeigersinn bei einer Bewegung nach unten. Ein Kreisdurchlauf von f(z) der Länge 2r π benötigt das Durchlaufen eines Intervalls der Länge 2π in z. Von p ausgehende Bewegungen in der Variablen z, die sowohl einen waagrechten als auch einen senkrechten Anteil besitzen, führen zu in f(p) ihren Ausgang nehmenden Spiralbewegungen von f(z). -10 10 10 5 5 -5 5 10 -10 -5 5 -5 -5 -10 -10 10 Die Verzerrung des kartesischen Gitters durch die komplexe Exponentialfunktion und das Bild zweier Geraden unter exp © Oliver Deiser Einführung in die Mathematik 1 346 3. Abschnitt Reelle und komplexe Zahlen n=1 n=2 n=3 n=4 n=5 n=6 n=8 n = 11 n = 15 n = 20 n = 25 n = 30 Visualisierung der Kreisaufwicklung mit Hilfe der Exponentialreihe: Für die angegebenen n ist das Bild von [ 0, ∞ [ unter den Partialsummen sn (i x) = ∑ k ≤ n (ix)k /k! für alle x P R gezeigt. Ab etwa n = 20 ist eine sehr gute Aufwicklung des Intervalls [ 0, 2π ] erreicht. Bemerkenswert sind relativ scharfe Wendungen wie bei n = 11. Einführung in die Mathematik 1 © Oliver Deiser 6. Die komplexe Exponentialfunktion 347 3 2 1 -3 -2 -1 1 2 3 -1 -2 -3 Visualisierung der Kreisaufwicklung durch ein Pfeildiagramm: Wirkung der Exponentialfunktion auf der Menge { ix | x P [ −π, π ] } 1.0 0.5 -1.0 -0.5 0.5 1.0 1.5 2.0 2.5 -0.5 -1.0 Zum Kontrast: Wirkung der Exponentialfunktion auf dem Einheitskreis © Oliver Deiser Einführung in die Mathematik 1 348 3. Abschnitt Reelle und komplexe Zahlen 10 10 5 5 0 0 -5 -5 -10 -10 -10 -5 0 5 -10 10 -5 0 5 10 15 10 10 5 5 0 0 -5 -5 -10 -10 -15 -10 -5 0 5 -15 10 20 20 10 10 0 0 -10 -10 -20 -20 -10 0 10 20 -20 -20 -10 -10 -5 0 5 10 0 10 15 20 Die Mengen Asn = { z | Re(sn (z)) = 0 } und Bsn = { z | Im(sn (z)) = 0 } für die Polynome sn (z) = ∑ k ≤ n zk /k! für alle z P C, mit n = 5, 10, 15, 20, 25. Im letzten Bild sind Aexp = { z | Re(exp(z)) = 0 } und Bexp = { z | Im(exp(z)) = 0 } gezeigt. Die waagrechten Linien verlaufen im Abstand π/2 voneinander. Einführung in die Mathematik 1 © Oliver Deiser 6. Die komplexe Exponentialfunktion 349 Farbplot der komplexen Exponentialfunktion exp(z) = ∑ n ≥ 0 zn /n! 0 Radiales Gitter: exp(−3), exp(−2), …, exp(3) - -3 -2 -1 0 1 2 3 3 2 Farbplot des Polynoms 1 s3 (z) = 1 + z + z2 /2 + z3 /6 0 Radiales Gitter wie oben -1 -2 -3 -3 -2 -1 0 1 2 3 4 2 Farbplot des Polynoms s5 (z) = ∑ k ≤ 5 zk /k! 0 Radiales Gitter wie oben -2 -4 -4 -2 © Oliver Deiser 0 2 4 Einführung in die Mathematik 1 350 3. Abschnitt Reelle und komplexe Zahlen Anwendungen der Eulerschen Formel Wir diskutieren einige Anwendungen der Eulerschen Formel e ix = cos x + i sin x für alle x P R. 1. Additionstheoreme für Kosinus und Sinus Zu den bestechendsten Anwendungen der Eulerschen Formel gehört die simultane Herleitung der Additionstheoreme für den Kosinus und Sinus. Für alle x, y P R gilt: cos(x + y) + i sin(x + y) = ei (x + y) = ei x + i y = ei x ei y = (cos x + i sin x) (cos y + i sin y) = cos x cos y − sin x sin y + i (cos x sin y + cos y sin x) Vergleich von Real- und Imaginärteil liefert cos(x + y) = cos x cos y − sin x sin y, sin(x + y) = cos x sin y + cos y sin x. Damit haben wir beide Additionstheoreme in wenigen Zeilen erhalten. Das Argument ist ein wunderbares Beispiel dafür, wie der Einsatz der komplexen Zahlen den reellen Kalkül vereinfachen kann. Effizient, elegant, magisch. 2. Angabe der Einheitswurzeln Sei n ≥ 1, und seien wieder ζ nk = ( cos ( k 2π n ), sin ( k 2π n )) für k P Z, sodass ζ n0 , …, ζ nn − 1 die n-ten Einheitswurzeln sind. Dann gilt ζ nk = ei k 2π/n für alle k P Z. Durch diese Darstellung wird das Rechnen mit den Einheitswurzeln vereinfacht. So gilt zum Beispiel für alle ganzzahligen k und m ζ nk ζ nm = exp(i k 2π/n) exp(i m 2π/n) = exp(i (k + m) 2π/n) = ζ nk + m . Einführung in die Mathematik 1 © Oliver Deiser 6. Die komplexe Exponentialfunktion 351 3. Reihenentwicklungen des Kosinus und Sinus Kennt man die komplexe Exponentialreihe, so lassen sich die Reihenentwicklungen des Kosinus und Sinus jederzeit leicht reproduzieren (vgl. die Argumentation im ersten Beweis): cos x + i sin x = ei x = ∑ n (ix)n n! = = 1 + ix − x3 x4 x5 x6 73 x2 − i + + i x − − i + … 2 3! 4! 5! 6! 7! = ∑ n (−1)n x2n (2n)! + i ∑ n (−1)n x2n + 1 . (2n + 1)! 4. Ableitungen des Kosinus und Sinus Die Ableitungen des Kosinus und Sinus lassen sich ebenfalls mit der Eulerschen Formel reproduzieren (vgl. die Argumentation im zweiten Beweis): cos′ x + i sin′ x = d dx ( cos x + i sin x ) = d ix e = i eix = dx = i (cos x + i sin x) = − sin x + i cos x. Vergleich von Real- und Imaginärteil ergibt cos′ = − sin und sin′ = cos. Das Argument ist die komplexe Version unserer dynamischen Ermittlung der Ableitungen des Kosinus und Sinus über eine gleichmäßige Bewegung auf dem Einheitskreis. Die Drehung des Koordinatenvektors (cos x, sin x) um π/2 zum Geschwindigkeitsvektor (−sin x, cos x) entspricht der Multiplikation mit i bei der Ableitung von eix . Bemerkung Es ist möglich, die komplexe Exponentialfunktion bei einem Aufbau der Analysis an die Spitze zu stellen und die trigonometrischen Funktionen durch cos(x) = Re(eix ), sin(x) = Im(eix ) für alle x P R zu definieren. Bei diesem Vorgehen lassen sich die Additionstheoreme, die Reihenentwicklungen und die Ableitungen des Kosinus und Sinus mit obigen Argumenten beweisen. Weiter ergibt sich eine analytische Definition von π, indem π/2 als die erste positive Nullstelle des Kosinus oder alternativ 2π als die Periode von exp festlegt wird. Dann ist aber zu zeigen, dass die analytische Größe π mit der geometrischen Größe π übereinstimmt. Allgemeiner muss die Längentreue der Kreisaufwicklung nachgewiesen werden, die bei diesem Ansatz keineswegs klar ist. © Oliver Deiser Einführung in die Mathematik 1 352 3. Abschnitt Reelle und komplexe Zahlen Übungen Übung 1 Visualisieren Sie den Grenzwert limn zn = z einer Folge (zn )n P N in den komplexen Zahlen, indem Sie Kreise mit Mittelpunkt z der Ebene C = R2 betrachten. Übung 2 Visualisieren Sie die ε-δ-Stetigkeit einer Funktion f : C → C an der Stelle p P C. Betrachten Sie hierzu Kreise der Ebene. Übung 3 Überzeugen Sie sich davon, dass d n z = n zn − 1 für alle z P C dz genau wie im Reellen bewiesen werden kann. Übung 4 Zeigen Sie, dass für alle n P N und x P R gilt: (cos x + i sin x)n = cos(nx) + i sin(nx). (Formel von de Moivre) Leiten Sie hieraus die Verdopplungsformeln für cos(2x) und sin(2x) ab. Übung 5 Skizzieren Sie die Mengen A = { exp(1 + ix) | x P [ −π/2, π/2 ] }, B = { exp(log x + ix) | x P ] 0, 2π ] }. Übung 6 Skizzieren Sie die Mengen A = { (x, y) P C | x P [ 0, 1 ], y P [ 0, π ] }, B = exp [ A ] = { exp(x + i y) | (x, y) P A }. Übung 7 Wie für R gilt für alle z P C und alle gegen z konvergenten Folgen (zn )n PN in C: ( (+) exp(z) = limn 1 + zn n ) n. Leiten Sie aus (+) aus Additionstheorem für exp : C → C ab. Einführung in die Mathematik 1 © Oliver Deiser 4. Abschnitt Ebene und Raum © Oliver Deiser Einführung in die Mathematik 1 1. Reelle Vektoren In diesem Abschnitt untersuchen wir die Euklidische Ebene R2 = R × R = { (x, y) | x, y P R } und den Euklidischen Raum R3 = R × R × R = { (x, y, z) | x, y, z P R }. Allgemeiner betrachten wir auch die n-dimensionalen Euklidischen Räume Rn = { (v1 , …, vn ) | v1 , …, vn P R }, n ≥ 1, die sich zwar für eine Dimension n ≥ 4 unserer geometrischen Anschauung entziehen, sich aber über weite Strecken so behandeln lassen wie die vertraute zweidimensionale Ebene und der dreidimensionale Raum. Im Zentrum stehen aber R2 und R3 . Größtmögliche Allgemeinheit streben wir hier nicht an, und der Leser kann sich immer an den Fällen n = 2 und n = 3 orientieren, wenn er möchte. Die vier Hauptthemen Vektoraddition, Skalarmultiplikation, Euklidische Norm, Euklidisches Skalarprodukt, die wir im ersten Kapitel behandeln, bilden die Basis für alles Weitere. © Oliver Deiser Einführung in die Mathematik 1 356 4. Abschnitt Ebene und Raum Reelle Vektoren Definition (die Räume Rn , n-dimensionaler reeller Vektor) Sei n ≥ 1. Dann setzen wir Rn = { (v1 , …, vn ) | v1 , …, vn P R }. Die Elemente des Rn heißen n-dimensionale reelle Vektoren oder reelle Vektoren der Länge oder Dimension n. Ist v = (v1 , …, vn ) P Rn , so heißen die reellen Zahlen v1 , …, vn die Komponenten des Vektors v. Genauer heißt vi die i-te Komponente von v für alle 1 ≤ i ≤ n. Wir betrachten vor allem die Räume 2 (reelle Ebene) 3 (dreidimensionaler reeller Raum) R = { (v1 , v2 ) | v1 , v2 P R }, R = { (v1 , v2 , v3 ) | v1 , v2 , v3 P R }. Viele (nicht alle) Definitionen lassen sich aber allgemein für den Rn einführen. Notation Wie notieren Vektoren ohne Pfeile oder Striche. Bevorzugt verwenden wir die Zeichen v, w, u für Vektoren. Ein Index i bezeichnet, wenn nichts anderes gesagt ist, die i-te Komponente eines Vektors. Damit gilt für eine gegebene Dimension n zum Beispiel v = (v1 , …, vn ), w = (w1 , …, wn ), u = (u1 , …, un ). Vektoren des R2 und R3 notieren wir oft auch in der Form v = (x, y) bzw. v = (x, y, z). Den Raum R1 identifizieren wir mit R. Die Index-Notation ist auch möglich, wenn mehrere Vektoren betrachtet werden. Sind zum Beispiel v1 , v2 , v3 drei Vektoren des R3 , so ist v2, 3 die dritte Komponente des Vektors v2 . Wir schreiben auch kurz vij statt vi, j . Definition (Nullvektor, kanonische Einheitsvektoren) Sei n ≥ 1. Der Vektor 0 = (0, …, 0) P Rn heißt der Nullvektor oder Nullpunkt des Rn . Wir bezeichnen ihn mit 0. Weiter setzen wir e1 = (1, 0, …, 0), e2 = (0, 1, 0, …, 0), … en = (0, …, 0, 1). Die Vektoren e1 , …, en P Rn heißen die kanonischen Einheits- oder Basisvektoren des Rn . Die mehrfache Bedeutung der 0 führt in der Regel nicht zu Verwechslungen. Wer möchte, kann 0 statt 0 schreiben. Einführung in die Mathematik 1 © Oliver Deiser 1. Reelle Vektoren 357 Die Vektoraddition Definition (Vektoraddition) Sei n ≥ 1. Dann setzen wir für alle v, w P Rn : v + w = (v1 + w1 , …, vn + wn ) (Addition von v und w) Die Vektoraddition ist eine Abbildung von Rn × Rn nach Rn : Je zwei Vektoren des Rn wird ein Vektor des Rn zugeordnet. In der Ebene und im Raum lässt sie sich in der bekannten Weise durch das Aneinanderfügen zweier Pfeile visualisieren. Für n = 2 stimmt die Vektoraddition mit der Addition komplexer Zahlen überein. Weiter definieren wir: Definition (inverser Vektor, Vektorsubtraktion) Sei n ≥ 1. Dann setzen wir für alle v, w P Rn : −v = (− v1 , …, − vn ), v − w = v + (−w) = (v1 − w1 , …, vn − wn ). Der Vektor − v P Rn heißt der zu v additiv inverse Vektor. Der Vektor v − w heißt der Differenzvektor der Vektoren v und w. Die Bildung von −v lässt sich anschaulich durch die Spiegelung des Vektors v am Nullpunkt darstellen. Die Differenz v − w können wir durch den Pfeil, der von der Spitze von w zur Spitze von v zeigt, repräsentieren. Wesentliche Eigenschaften der Vektoraddition sind: Satz (Eigenschaften der Vektoraddition) Sei n ≥ 1. Dann gilt für alle v, w, u P Rn : v + (w + u) = (v + w) + u, v + 0 = 0 + v = v, (Assoziativität) (Neutralität des Nullvektors) v + (− v) = (− v) + v = 0, (Inversenbildung) v + w = w + v. (Kommutativität) Der Beweis kann dem Leser zur Übung überlassen bleiben. Insgesamt gelten die vertrauten Gesetze der Addition reeller Zahlen, und wir übernehmen entsprechende Konventionen. Aufgrund des Assoziativität können wir zum Beispiel Klammern weglassen und aufgrund der Kommutativität Vektoren einer Summe v1 + … + vn beliebig umordnen. Beispiel Im R5 gilt −(1, 1, 2, 0, −1) = (−1, −1, −2, 0, 1), −e2 = (0, −1, 0, 0, 0). © Oliver Deiser Einführung in die Mathematik 1 358 4. Abschnitt Ebene und Raum Die Skalarmultiplikation Einen Vektor können wir um einen beliebigen reellen Faktor strecken oder stauchen, wobei ein negatives Vorzeichen zusätzlich eine Spiegelung am Nullpunkt bewirkt. Dieser Vorgang wird als Skalierung oder Skalarmultiplikation bezeichnet und die beteiligten reellen Faktoren nennt man entsprechend Skalare. Wir bezeichnen Skalare meistens mit griechischen Buchstaben, um sie von Vektoren zu unterscheiden. Da α, β, γ, δ oft für Winkel verwendet werden, bevorzugen wir andere Buchstaben. Häufig verwendet werden vor allem λ und µ. Definition (Skalarmultiplikation) Sei n ≥ 1. Dann setzen wir für alle λ P R und alle v P Rn : λ v = (λ v1 , …, λ vn ). (Multiplikation des Vektors v mit dem Skalar λ) Die Skalarmultiplikation ist eine Abbildung von R × Rn nach Rn : Jedem Skalar λ P R und jedem Vektor v P Rn wird ein Vektor λ v P Rn zugeordnet. Die folgenden Eigenschaften lassen sich wieder durch Nachrechnen beweisen: Satz (Eigenschaften der Skalarmultiplikation) Sei n ≥ 1. Dann gilt für alle λ, µ P R und alle v, w P Rn : (i) 1 v = v, (ii) λ (µ v) = (λ µ) v, (iii) λ (v + w) = λ v + λ w, (iv) (λ + µ) v = λ v + µ v. Weiter bemerken wir, dass − v = (−1) v für alle n ≥ 1 und alle v P Rn gilt. Allgemein lässt sich die Multiplikation eines Vektors mit einem negativen Skalar λ als eine Skalierung um |λ| gefolgt von einer Spiegelung am Nullpunkt auffassen oder umgekehrt als Spiegelung am Nullpunkt gefolgt von einer Skalierung um |λ|. Beispiele (1) Im R2 gilt e1 = 2(1, 0) = (2, 0), −3v = (−3v1 , −3v2 ) für alle v P R2 . (2) Für alle v = (v1 , v2 , v3 ) P R3 gilt v = v1 (1, 0, 0) + v2 (0, 1, 0) + v3 (0, 0, 1) = v1 e1 + v2 e2 + v3 e3 . (3) Allgemein gilt für alle n ≥ 1 und v P Rn v = v1 e1 + … + vn en = ∑ 1 ≤ k ≤ n vk ek . Einführung in die Mathematik 1 © Oliver Deiser 1. Reelle Vektoren 359 Der Satz des Pythagoras und die Euklidische Norm Wir setzen den Satz des Pythagoras als bekannt voraus. Die beiden folgenden Diagramme illustrieren das zeitlose Ergebnis und zeigen Möglichkeiten auf, den Satz mit Hilfe von Flächeninhalten bzw. Streckenverhältnissen zu beweisen. a c b a b Die Fläche des großen Quadrats ist (a + b)2 und die Fläche der vier Dreiecke ist 2ab. Damit ist c2 = (a + b)2 − 2ab = a2 + b2 . P c Q c b a R c-a S Die Dreiecke PQR und PSR sind ähnlich, sodass c+a b = . b c−a Folglich ist c2 − a2 = (c + a) (c − a) = b2 und damit a2 + b2 = c2 . © Oliver Deiser Einführung in die Mathematik 1 360 4. Abschnitt Ebene und Raum Motiviert durch den Satz des Pythagoras definieren wir: Definition (Euklidische Norm bzw. Länge) Sei n ≥ 1. Dann setzen wir für alle v P Rn : i v i = £v1 2 + … + vn 2 . Die reelle Zahl i v i heißt die Euklidische Norm oder Euklidische Länge des Vektors v. v = (x, y) y v x 2 2 i v i = £x + y Beispiele (1) Für die Dimension n = 2 gilt i (3, 4) i = £9 + 16 = £25 = 5. (2) Für die Dimension n = 2 gilt i (1, 1) i = £2. Für die Dimension n = 3 gilt i (1, 1, 1) i = £3. Allgemein gilt im Rn , dass i (1, …, 1) i = £n. (3) Für jede Dimension n und alle 1 ≤ k ≤ n gilt i ek i = 1. Wir sagen auch kurz Norm oder Länge, weisen aber darauf hin, dass es auch andere Möglichkeiten gibt, einen Vektor zu messen: Beispiel Die Maximumsnorm auf dem Rn ist definiert durch i v i max = max(|v1 |, …, |vn |) für alle v P Rn . Für die Dimension n = 2 gilt zum Beispiel i (1, 1) i = £2, i (1, 1) i max = 1. Beim Rechnen mit der Euklidischen Norm führen die auftretenden Wurzeln oft zu unübersichtlichen Termen. Oft ist es hilfreich, das Quadrat i v i2 = v1 2 + … + vn 2 der Norm der Vektors zu berechnen und erst am Ende die Wurzel zu ziehen. Einführung in die Mathematik 1 © Oliver Deiser 1. Reelle Vektoren 361 Vektoren der Länge Eins spielen an vielen Stellen eine besondere Rolle: Definition (normiert, Normierung) Sei n ≥ 1. Ein Vektor v P Rn heißt normiert, falls i v i = 1. Für alle v P Rn mit v ≠ 0 definieren wir die Normierung von v durch: v̂ = v . ivi Weiter setzen wir v̂ = v = 0 P Rn , falls v = 0. Beispiele (1) Im Rn sind alle Einheitsvektoren e1 , …, en normiert. (2) Für n = 2 ist ein Vektor v genau dann normiert, wenn er auf dem Einheitskreis K liegt. Für alle α P R ist (cos α, sin α) normiert. Für alle Vektoren v ≠ 0 ist der Vektor v̂ (gelesen: „v Hut“ oder „v Dach“) normiert. Es gilt (+) v = i v i v̂ für alle v P Rn . v v v w w w K Die Normierung lässt sich als Projektion eines Vektors auf den Einheitskreis K ansehen Bei vielen Argumenten kann man sich darauf beschränken, die gewünschte Eigenschaft nur für normierte Vektoren zu zeigen. Für allgemeine Vektoren folgt sie dann durch die Skalierung (+). Zudem vereinfacht die Verwendung von v̂ auch viele Formeln, bei denen durch die Norm dividiert wird. Die grundlegenden Eigenschaften der Euklidischen Norm sind: © Oliver Deiser Einführung in die Mathematik 1 362 4. Abschnitt Ebene und Raum Satz (Eigenschaften der Euklidischen Norm) Sei n ≥ 1. Dann gilt für alle λ P R und alle v, w P Rn : (i) i v i = 0 genau dann, wenn v = 0, (ii) i λ v i = |λ| i v i, (iii) i v + w i ≤ i v i + i w i. (Dreiecksungleichung) Die dritte Eigenschaft besagt anschaulich, dass der direkte Weg von 0 nach v + w höchstens so lang ist wie der direkte Weg von 0 nach v gefolgt vom Weg von v nach v + w. v+w w v+w w v v Zur Dreiecksungleichung Die anschaulich klare Aussage, dass der kürzeste Weg zwischen zwei Punkten eine Gerade ist, ist keineswegs leicht zu beweisen. Im folgenden Beweis verwenden wir eine fundamentale Abschätzung, die sich aus der zweiten binomischen Formel ergibt. Beweis Die Eigenschaften (i) und (ii) ergeben sich unschwer aus den Definitionen. Zum Beweis der Dreiecksungleichung verwenden wir: (+) 2 x y ≤ x2 + y2 für alle x, y P R. Diese Ungleichung folgt aus 0 ≤ (x − y)2 = x2 − 2xy + y2 für alle x, y P R. Seien nun v, w P Rn beliebig. Dann ergibt eine n-fache Anwendung von (+): ( 2 v̂1 ŵ1 + … + v̂n ŵn ) ≤ v̂1 2 + ŵ1 2 + … + v̂n 2 + ŵn 2 = i v̂ i 2 + i ŵ i 2 = 1 + 1 = 2. Einführung in die Mathematik 1 © Oliver Deiser 1. Reelle Vektoren 363 Division durch 2 und Multiplikation mit den Normen von v und w liefert: (♦) v1 w1 + … + vn wn ≤ i v i i w i. Damit können wir nun rechnen: iv + wi 2 = (v1 + w1 )2 + … + (vn + wn )2 ( = i v i 2 + i w i 2 + 2 v1 w1 + … + vn wn ) ≤ ivi + iwi + 2 ivi iwi 2 ≤ 2 ( i v i + i w i ) 2. Wurzelziehen erhält die Ungleichung (da die Wurzelfunktion monoton steigt) und liefert die Behauptung. Die Ungleichung (♦), aus der wir die Dreiecksungleichung gewinnen konnten, leitet über zu unserem nächsten Zwischenabschnitt: Das Euklidische Skalarprodukt Im Beweis der Dreiecksungleichung ist uns die Summe v 1 w1 + … + v n wn begegnet, bei der die Komponenten zweier Vektoren paarweise multipliziert und die Produkte anschließend aufsummiert werden. Wir untersuchen dieses „Wunder der linearen Algebra“ nun genauer. Definition (Euklidisches Skalarprodukt) Sei n ≥ 1. Dann setzen wir für alle v, w P Rn : 〈v, w〉 = v • w = v1 w1 + … + vn wn . Die reelle Zahl 〈v, w〉 heißt das Euklidische Skalarprodukt der Vektoren v und w. Das Euklidische Skalarprodukt ist eine Abbildung von Rn × Rn nach R: Je zwei Vektoren des Rn wird eine reelle Zahl (ein Skalar) zugeordnet. Das Produkt der beiden Vektoren ist also ein Skalar, was die Namensgebung Skalarprodukt motiviert. Im Folgenden bevorzugen wir die Klammernotation 〈v, w〉 gegenüber der in der Schule vielleicht bevorzugten Punkt-Notation. In der mathematischen Physik ist zudem auch die Dirac-Notation 〈v w〉 statt 〈v, w〉 üblich. © Oliver Deiser Einführung in die Mathematik 1 364 4. Abschnitt Ebene und Raum Direkt aus den Definitionen des Skalarprodukts und der Norm ergibt sich: Satz (Skalarprodukt und Norm) Für alle v P Rn gilt: i v i 2 = 〈v, v〉. Durch Nachrechnen zeigt man die folgenden Eigenschaften, die pausenlos im Einsatz sind: Satz (Eigenschaften des Euklidischen Skalarprodukts) Sei n ≥ 1. Dann gilt für alle λ P R und alle v, w, v′, w′ P Rn : (i) 〈v + λ v′, w〉 = 〈v, w〉 + λ 〈v′, w〉, 〈v, w + λ w′〉 = 〈v, w〉 + λ 〈v, w′〉, (ii) 〈v, w〉 = 〈w, v〉, (Bilinearität) (Symmetrie) (iii) 〈v, v〉 > 0 für alle v ≠ 0. (positive Definitheit) Mit Hilfe der Bilinearität und Symmetrie zeigen wir: Satz (binomische Formeln und Polarisation) Sei n ≥ 1. Dann gilt für alle v, w P Rn : (a) i v ± w i 2 = i v i 2 + i w i 2 ± 2 〈v, w〉, (b) 4 〈v, w〉 = i v + w i − i v − w i . 2 2 (binomische Formeln) (Polarisation) Beweis Seien v, w P Rn . Dann gilt: iv + wi 2 = 〈v + w, v + w〉 = 〈v, v + w〉 + 〈w, v + w〉 = 〈v, v〉 + 〈v, w〉 + 〈w, v〉 + 〈w, w〉 = 〈v, v〉 + 2 〈v, w〉 + 〈w, w〉 = i v i 2 + i w i 2 + 2 〈v, w〉. Die zweite binomische Formel wird analog bewiesen. Der Beweis der Polarisationsformel (b) sei dem Leser zur Übung überlassen. Unserem Beweis der Dreiecksungleichung entnehmen wir folgende Abschätzung, die allgemein als eine der wichtigsten Ungleichungen der gesamten Mathematik anerkannt ist: Einführung in die Mathematik 1 © Oliver Deiser 1. Reelle Vektoren 365 Satz (Ungleichung von Cauchy-Schwarz) Sei n ≥ 1. Dann gilt für alle v, w P Rn : |〈v, w〉| ≤ i v i i w i. Beweis Seien v, w P Rn . Wir wissen schon (nach (♦) oben), dass 〈v, w〉 ≤ i v i i w i. Ist 〈v, w〉 < 0, so ist 〈−v, w〉 > 0 und |〈v, w〉| = 〈−v, w〉 ≤ i −v i i w i = i v i i w i. Wir geben noch einen zweiten Beweis, der nur die grundlegenden Eigenschaften des Skalarprodukts verwendet. Zweiter Beweis der Ungleichung von Cauchy-Schwarz Es genügt, normierte Vektoren zu betrachten. Denn für v = 0 oder w = 0 ist die Ungleichung klar und für Längen ungleich 1 folgt sie durch Skalierung aus der Version für normierte Vektoren. Seien also v,w P Rn normiert. Dann gilt für alle λ P R nach den binomischen Formeln: 0 ≤ i v − λ w i 2 = i v i 2 + λ2 i w i 2 − 2λ 〈v, w〉 = 1 + λ2 − 2λ 〈v, w〉. Für den Spezialfall λ = 〈v, w〉 erhalten wir 0 ≤ 1 − 〈v, w〉2 , sodass |〈v, w〉| ≤ 1 = 1 ⋅ 1 = i v i i w i. w w v- w w v- w v Zum zweiten Beweis der Cauchy-Schwarz-Ungleichung Aus den Beweisen der Cauchy-Schwarz-Ungleichung ergibt sich, dass die Ungleichung von Cauchy-Schwarz genau dann zu einer Gleichung wird, wenn die Vektoren auf einer Geraden des Rn liegen. Wir diskutieren dies in den Übungen. © Oliver Deiser Einführung in die Mathematik 1 366 4. Abschnitt Ebene und Raum Übungen Übung 1 Visualisieren Sie die Vektoraddition, Vektorsubtraktion und Skalarmultiplikation durch Diagramme für den Fall n = 2. Übung 2 Sei n ≥ 1. Zeigen Sie, dass für alle v, w, u P Rn gilt: v + (w + u) = (v + w) + u, v + 0 = 0 + v = v, (Assoziativität) (Neutralität des Nullvektors) v + (− v) = (− v) + v = 0, (Inversenbildung) v + w = w + v. (Kommutativität) Übung 3 Sei n ≥ 1. Zeigen Sie, dass für alle λ, µ P R und alle v, w P Rn gilt: (i) 1 v = v, (ii) λ (µ v) = (λ µ) v, (iii) λ (v + w) = λ v + λ w, (iv) (λ + µ) v = λ v + µ v. Übung 4 Welche Größenbeziehung besteht zwischen der Euklidischen Norm und der Maximumsnorm im Rn ? Formulieren Sie eine Hypothese und beweisen Sie sie. Welche Form hat Kn = { v P Rn mit i v i max = 1 } für n = 2 und n = 3? Übung 5 Sei n ≥ 1. Zeigen Sie, dass für alle λ P R und alle v P Rn gilt: (i) i v i = 0 genau dann, wenn v = 0, (ii) i λ v i = |λ| i v i. Übung 6 Sei n ≥ 1. Beweisen Sie mit Hilfe der Dreiecksungleichung für die Euklidische Norm, dass für alle v, w P Rn gilt: (a) i v − w i ≤ i v i + i w i, (b) i v i − i w i ≤ i v + w i, (c) i v i − i w i ≤ i v − w i. Einführung in die Mathematik 1 © Oliver Deiser 1. Reelle Vektoren 367 Übung 7 Sei n ≥ 1. Zeigen Sie, dass für alle λ P R und alle v, w, v′, w′ P Rn gilt: (i) 〈v + λ v′, w〉 = 〈v, w〉 + λ 〈v′, w〉, 〈v, w + λ w′〉 = 〈v, w〉 + λ 〈v, w′〉, (ii) 〈v, w〉 = 〈w, v〉, (Bilinearität) (Symmetrie) (iii) 〈v, v〉 > 0 für alle v ≠ 0. (positive Definitheit) Übung 8 Sei n ≥ 1. Zeigen Sie, dass für alle v P Rn gilt: v = 〈e1 , v〉 e1 + … + 〈en , v〉 en wobei e1 = (1, 0, …, 0), …, en = (0, …, 0, 1) die kanonischen Einheitsvektoren des Rn sind. Übung 9 Sei n ≥ 1. Formulieren und beweisen Sie eine dritte binomische Formel für das Euklidische Skalarprodukt im Rn . Übung 10 Sei n ≥ 1. Zeigen Sie, dass für alle v, w P Rn gilt: 4 〈v, w〉 = i v + w i 2 − i v − w i 2 . (Polarisation) Übung 11 Sei n ≥ 1. Zeigen Sie, dass für alle v, w P Rn gilt: ( ) iv + wi2 + iv − wi2 = 2 ivi2 + iwi2 . (Parallelogrammgleichung) Erläutern Sie den Namen „Parallelogrammgleichung“ durch ein Diagramm für den Fall n = 2. Übung 12 Sei n ≥ 1. Wir setzen d(v, w) = i v − w i für alle v, w P Rn . Die reelle Zahl d(v, w) heißt der Euklidische Abstand der Vektoren v und w. Zeigen Sie, dass für alle v, w, u P Rn gilt: (i) d(v, w) = 0 genau dann, wenn v = w, (ii) d(v, w) = d(w, v), (iii) d(v, w) ≤ d(v, u) + d(u, w). © Oliver Deiser Einführung in die Mathematik 1 368 4. Abschnitt Ebene und Raum Übung 13 Sei n ≥ 1. Zeigen Sie, dass für alle v, w P Rn äquivalent sind: (a) |〈v, w〉| = i v i i w i. (b) w = 0 oder es gibt ein λ P R mit v = λw. Übung 14 Seien v, w P R2 . Veranschaulichen Sie die Vektoren v − λ w für λ P R durch ein Diagramm. Motivieren Sie die Wahl von λ = 〈v, w〉 für normierte Vektoren v, w im zweiten Beweis der Ungleichung von Cauchy-Schwarz. Verwenden Sie hierzu, dass zwei Vektoren der Ebene aufeinander senkrecht stehen, wenn ihr Skalarprodukt Null ist. Wie muss λ gewählt werden, wenn v, w nicht notwendig normiert sind? Übung 15 Sei n ≥ 1. Wir betrachten Vektoren z = (z1 , …, zn ) der Dimension n mit komplexen Komponenten zn P C, also Elemente des Cn . Die Vektoraddition und Skalarmultiplikation (mit Skalaren λ P C) wird für Cn wie für Rn definiert. Für die Norm verwenden wir den komplexen Betrag der Komponenten, d. h. wir setzen i z i = £|z1 |2 + … + |zn |2 für alle z P Cn . Wir definieren nun für alle z, w P Cn : 〈z, w〉* = z1 w1 + … + zn wn , 〈z, w〉 = z1 w1 + … + zn wn . Untersuchen diese Versionen eines komplexen Skalarprodukts (die beide für reelle Vektoren mit dem Euklidischen Skalarprodukt übereinstimmen). Betrachten Sie hierzu insbesondere die elementaren Eigenschaften und den Zusammenhang zur Norm. Was ändert sich, wenn man die komplexe Konjugation auf die Komponenten von w anstelle von z anwendet? Übung 16 Sei s : Rn × Rn → R eine Funktion mit den Eigenschaften: s(ei , w) = wi für alle 1 ≤ i ≤ n und alle w P Rn , s(λ v + µ u, w) = λ s(v, w) + µ s(u, w) für alle v, u P Rn , λ, µ P R, wobei wieder e1 = (1, 0, …, 0), …, en = (0, … 0, 1). Zeigen Sie, dass s(v, w) = 〈v, w〉 für alle v, w P Rn . Einführung in die Mathematik 1 © Oliver Deiser 2. Die Euklidische Ebene Wir betrachten nun speziell die Ebene R2 , also die Dimension n = 2. Anhand dieses Spezialfalls untersuchen wir Winkel zwischen Vektoren, Orthogonalität und Kollinearität, Determinanten, Koordinatenvektoren und lineare Gleichungssysteme. Zum Abschluss des Kapitels werfen wir noch einen Blick auf algebraische Kurven ersten und zweiten Grades. Einen Vektor v der Ebene notieren wir oft auch in der durch das vertraute Koordinatensystem nahegelegten Form v = (x, y). Daneben gilt stets auch wieder v = (v1 , v2 ), w = (w1 , w2 ), u = (u1 , u2 ). © Oliver Deiser Einführung in die Mathematik 1 370 4. Abschnitt Ebene und Raum Die Winkelformel für das Euklidische Skalarprodukt Unsere erste Aufgabe ist die Ermittlung der geometrischen Bedeutung des Euklidischen Skalarprodukts. Wir definieren hierzu: Definition (eingeschlossener Winkel) Seien v, w P R2 mit v, w ≠ 0. Dann setzen wir ](v, w) = „der von v und w eingeschlossene Winkel in [ 0, π ]“. Der Winkel ](v, w) hat keine Orientierung und liegt immer zwischen 0 und π. Es gilt ](v, w) = ](w, v) und ](v, w) = ](v̂, ŵ). Der Winkel zwischen zwei Vektoren ist nicht definiert, wenn einer der Vektoren der Nullvektor ist. Von großer Bedeutung ist: Satz (Winkelformel) Seien v, w P R2 von 0 verschieden, und sei ϕ = ](v, w). Dann gilt: 〈v, w〉 , ϕ = arccos(〈v̂, ŵ〉). iviiwi cos ϕ = 〈v̂, ŵ〉 = (Winkelformel) v v v 1 w w w cos( ) Zur Winkelformel: cos ϕ = 〈v̂, ŵ〉 Für alle v, w P R2 mit v, w ≠ 0 gilt also 〈v, w〉 = cos(ϕ) i v i i w i. Einführung in die Mathematik 1 © Oliver Deiser 2. Die Euklidische Ebene 371 Wir geben zwei Beweise für die Winkelformel. Der erste kombiniert den Kosinussatz mit der zweiten binomischen Formel für das Skalarprodukt. Beweis mit Hilfe des Kosinussatzes Seien v, w P R2 mit v, w ≠ 0. In einem Dreieck ABC mit Seiten a, b, c und Winkeln α, β, γ gilt: a2 = b2 + c2 − 2 cos(α) b c. (Kosinussatz) Für das Dreieck mit den Ecken A = 0, B = w und C = v gilt (i) a = i v − w i, b = i v i, c = i w i, (ii) α = ](v, w) = ϕ. Der Kosinussatz für dieses Dreieck liest sich nun in der Form (1) i v − w i 2 = i v i 2 + iw i 2 − 2 cos(α) iv i iw i. Nach der zweiten binomischen Formel für das Skalarprodukt gilt aber (2) i v − w i 2 = i v i 2 + i w i 2 − 2 〈v, w〉. Durch Vergleich von (1) und (2) erhalten wir cos(ϕ) iv ii wi = 〈v, w〉. C b v a A B c v-w v 0 w w Zum Beweis der Winkelformel mit Hilfe des Kosinussatzes Der Kosinussatz lässt sich mit Hilfe des Satzes von Pythagoras beweisen (das linke Diagramm enthält zwei rechtwinklige Dreiecke. Wir überlassen den Beweis dem Leser als Übung. Dabei sind neben spitzwinkligen auch stumpfwinklige Dreiecke zu betrachten. Der Kosinussatz ist für alle Dreiecke gültig. © Oliver Deiser Einführung in die Mathematik 1 372 4. Abschnitt Ebene und Raum Unser zweiter Beweis verwendet des Additionstheorem: Beweis mit Hilfe des Additionstheorems für den Kosinus Seien v, w P R2 mit v, w ≠ 0. Wir dürfen annehmen (nach evtl. Vertauschung von v und w), dass es x1 , y1 , x2 , y2 , ϕ1 , ϕ2 P R gibt mit (i) v̂ = (x1 , y1 ) = (cos ϕ1 , sin ϕ1 ), (ii) ŵ = (x2 , y2 ) = (cos ϕ2 , sin ϕ2 ), (iii) ϕ1 ≤ ϕ2 ≤ ϕ1 + π. Dann ist ϕ = ϕ2 − ϕ1 = ](v, w). Nach dem Additionstheorem für den Kosinus gilt cos ϕ = cos(ϕ2 − ϕ1 ) = cos ϕ2 cos ϕ1 − sin ϕ2 sin (−ϕ1 ) = cos ϕ1 cos ϕ2 + sin ϕ1 sin ϕ2 = x1 x2 + y1 y2 = 〈v̂, ŵ〉. Wir betrachten nun einige Anwendungen der Winkelformel. 1. Die Ungleichung von Cauchy-Schwarz Aus der Winkelformel ergibt sich wegen cos ϕ P [ −1, 1 ] noch einmal die Ungleichung von Cauchy-Schwarz. Denn für v = 0 oder w = 0 ist die Ungleichung klar und für v, w ≠ 0 ist |〈v, w〉| = |cos ϕ| i v i i w i ≤ i v i i w i. 2. Der Kosinussatz Ist die Winkelformel in irgendeiner Art und Weise einmal bewiesen, so ergibt sich aus ihr der Kosinussatz. Denn mit den Bezeichnungen des obigen Beweises gilt für ein Dreieck ABC mit den Ecken A = 0, B = w und C = v: a2 = i v − w i 2 = i v i 2 + i w i 2 − 2 〈v, w〉. = i v i 2 + i w i 2 − 2 cos(α) i v i iw i = b2 + c2 − 2 cos(α) b c. Einführung in die Mathematik 1 © Oliver Deiser 2. Die Euklidische Ebene 373 3. Orthogonalität Definition (orthogonal, aufeinander senkrecht stehen) Seien v, w P R2 . Wir sagen, dass v und w orthogonal sind oder aufeinander senkrecht stehen, falls 〈v, w〉 = 0. Die Orthogonalität ist auch für Nullvektoren erklärt. Der Nullvektor ist orthogonal zu jedem Vektor der Ebene. Für vom Nullvektor verschiedene Vektoren v, w mit eingeschlossenem Winkel ϕ P [ 0, π ] ist die Orthogonalität nach der Winkelformel äquivalent zu cos ϕ = 0 und damit zu ϕ = π/2. 4. Kollinearität Definition (kollinear, parallel, antiparallel) Seien v, w P R2 . Wir sagen, v und w sind kollinear, falls |〈v, w〉| = i v i i w i, parallel, falls 〈v, w〉 = i v i i w i, antiparallel, falls 〈v, w〉 = − i v i i w i. Die Ungleichung von Cauchy-Schwarz ist also genau für kollineare Vektoren eine Gleichung. Für v, w ≠ 0 entsprechen die drei Begriffe „kollinear, parallel, antiparallel“ nach der Winkelformel genau den eingeschlossenen Winkeln ϕ P { 0, π }, ϕ = 0, ϕ = π. Beispiele (1) Der Nullvektor ist mit jedem v P R2 kollinear. (2) Die Vektoren (1, 4) und (−2, −8) sind antiparallel und damit kollinear. Für alle y ≠ 8 sind die Vektoren (1, 4) und (2, y) nicht kollinear. Der folgende Satz, dessen Beweis wir dem Leser zur Übung überlassen, versammelt einige Äquivalenzen zur Kollinearität zweier Vektoren. Satz (Kriterien für Kollinearität) Seien v, w P R2 . Dann sind die folgenden Aussagen äquivalent: (a) Die Vektoren v, w sind kollinear. (b) v = 0 ∨ ∃λ P R λv = w. (c) ∃λ, µ P R (λv + µ w = 0 ∧ (λ ≠ 0 ∨ µ ≠ 0)). (d) v, w liegen auf einer gemeinsamen Geraden durch 0, d. h. es gibt ein u P R2 mit u ≠ 0 und v, w P G(u) = { λu | λ P R }. Sind v,w ≠ 0, so sind v,w genau kollinear, wenn G(v) = G(w). Da der Nullvektor keine Gerade definiert, ist die Voraussetzung v, w ≠ 0 wichtig. © Oliver Deiser Einführung in die Mathematik 1 374 4. Abschnitt Ebene und Raum 5. Die orthogonale Projektion Definition (orthogonale Projektion) Wir setzen für alle u, v P R2 : pru (v) = 〈û, v〉 û. (Projektionsformel) 2 Der Vektor pru (v) P R heißt die (orthogonale) Projektion des Vektors v auf den Vektor u. v1 u 1 pru (v2 ) pru (v1 ) 2 v2 Die Projektionen der Vektoren v1 und v2 auf den Vektor u Die Vektoren u und pru (v) sind nach Definition kollinear. Die Bezeichnung als orthogonale Projektion wird dadurch erklärt, dass pru (v) und w = v − pru (v) aufeinander senkrecht stehen: 〈pru (v), w〉 = 〈pru (v), v〉 − 〈pru (v), pru (v)〉 = 〈〈û, v〉 û, v〉 − 〈〈û, v〉 û, 〈û, v〉 û〉 = 〈û, v〉 〈û, v〉 − 〈û, v〉 〈û, v〉 〈û, û〉 = 〈û, v〉2 − 〈û, v〉2 = 0. Als Merkhilfe kann man verwenden: Zur Struktur der Projektionsformel (1) Die Projektion von v auf u ist unabhängig von der Länge von u und damit ein skalares Vielfaches von û. (2) Die Projektion von λv auf u ist das λ-fache der Projektion von v auf u. Dies erklärt das Vorhandensein bzw. Fehlen der Normen bei u bzw. v. Einführung in die Mathematik 1 © Oliver Deiser 2. Die Euklidische Ebene 375 Ist der Vektor u normiert, so gilt pru (v) = 〈u, v〉 u und damit i pru (v) i = |〈u, v〉|. Der Betrag des Skalarprodukts von u und v ist in diesem wichtigen Fall also die Euklidische Länge der Projektion von v auf u. Allgemein gilt ipru (v)i = |〈û, v〉|. Wir halten noch fest: Die Vektoren u und v sind genau dann orthogonal, wenn pru (v) = prv (u) = 0, und genau dann kollinear, wenn pru (v) = v und prv (u) = u. Determinanten Je zwei Vektoren der Ebene definieren in natürlicher Weise ein Parallelogramm: Definition (aufgespanntes Parallelogramm) Seien v, w P R2 . Dann heißt die Menge P = { λ v + µ w | λ, µ P [ 0, 1 ] } ⊆ R2 das von v und w aufgespannte Parallelogramm. Natürlich ist P nur dann ein echtes Parallelogramm, wenn v und w nicht kollinear sind. Es schadet aber im Folgenden nicht, den kollinearen Fall zuzulassen. v P u w Das von v und w aufgespannte Parallelogramm P und der Vektor u = 1/2 v + 2/3 w © Oliver Deiser Einführung in die Mathematik 1 376 4. Abschnitt Ebene und Raum Wir wollen nun eine Formel für die Fläche des von zwei Vektoren v und w aufgespannten Parallelogramms P in Abhängigkeit von den Koordinaten der Vektoren entwickeln. Dabei tauchen in natürlicher Weise orientierte Flächen auf, die ein der geometrischen Lage von v und w entsprechendes Vorzeichen tragen. Hierzu definieren wir: Definition (Orientierung eines Vektorpaars) Seien v, w P R2 nicht kollinear, und sei v ⊥ = rotπ/2 (v) = (− v2 , v1 ). Weiter sei ψ = ](v ⊥ , w). Dann heißt (v, w) positiv orientiert, wenn ψ P [ 0, π/2 [, und negativ orientiert, wenn ψ P ] π/2, π ]. Kollinearen Vektoren wird keine Orientierung zugewiesen. Die positive Orientierung von (v, w) besagt, dass w in der gleichen Halbebene wie v ⊥ liegt, wenn wir die Ebene gemäß v in zwei Halbebenen aufteilen. Anders formuliert: Wir gelangen von v nach w durch eine Drehung gegen den Uhrzeigersinn um den eingeschlossenen Winkel ϕ = ](v, w). Bei einer negativen Orientierung gelangen wir von v nach w durch eine Drehung um ϕ im Uhrzeigersinn. Ist (v, w) positiv orientiert, so ist (w, v) negativ orientiert und umgekehrt. rot /2 (v) w A(P) v u (v, w) ist positiv orientiert, (v, u) negativ Nach diesen Vorbereitungen können wir die orientierte Fläche A = A(P) bestimmen, wobei das Vorzeichen von A der Orientierung von v, w entsprechen soll. Wir betrachten s = i v i als Grundseite von P. Dann berechnet sich die signierte Höhe von P zu h = cos ψ i w i, wobei ψ = ](v ⊥ , w) P [ 0, π ] mit v ⊥ = rotπ/2 (v) = (−v2 , v1 ). Wegen i v ⊥ i = i v i ist A = s h = i v i cos ψ i w i = 〈v ⊥ , w〉 = 〈(−v2 , v1 ), (w1 , w2 )〉 = v1 w2 − v2 w1 . Einführung in die Mathematik 1 © Oliver Deiser 2. Die Euklidische Ebene 377 Diese Überlegungen motivieren die folgende Definition: Definition (Determinante) Seien v, w P R2 . Dann heißt die reelle Zahl det(v, w) = v1 w2 − v2 w1 die Determinante des Vektorenpaars (v, w). Nützlich ist eine quadratische Notation der Koordinaten: Notation Wir notieren die Determinante auch in Matrix-Schreibweise in der Form det x1 x2 y1 y2 statt det((x1 , y1 ), (x2 , y2 )). Die Vektoren werden als Spalten in die Matrix geschrieben. Direktes Nachrechnen zeigt: Satz (Eigenschaften der Determinante) Für alle v, w, v1 , v2 , w1 , w2 P R2 und alle λ P R gilt: (i) det(e1 , e2 ) = 1, (ii) det(v, v) = 0, (iii) det(v, w) = − det(w, v), (iv) det(λ v, w) = det(v, λ w) = λ det(v, w), (v) det(v1 + v2 , w) = det(v1 , w) + det(v2 , w), det(v, w1 + w2 ) = det(v, w1 ) + det(v, w2 ). In Matrix-Notation halten wir noch eine weitere Eigenschaft fest, die sich durch Ausrechnen sofort ergibt: det x1 x2 y1 y2 = det x1 y1 x2 y2 . In der rechten Matrix sind die Vektoren als Zeilen eingetragen. Obige Diskussion zeigt: Flächeninhalt Die reelle Zahl det(v, w) ist die orientierte Fläche des von den Vektoren v und w aufgespannten Parallelogramms. Weiter ist |det(v, w)|/2 die Fläche des Dreiecks mit den Ecken 0, v, w. © Oliver Deiser Einführung in die Mathematik 1 378 4. Abschnitt Ebene und Raum Vorzeichen Für alle v, w P R2 gilt: det(v, w) { > 0 = 0 < 0 falls (v, w) positiv orientiert, falls (v, w) kollinear, falls (v, w) negativ orientiert. Zusammenhang mit Skalarprodukt Für alle v, w P R2 gilt: det(v, w) = v1 w2 − v2 w1 = 〈(v1 , w1 ), (w2 , −v2 )〉 = 〈v, rot−π/2 (w)〉 = 〈(−w1 , v1 ), (v2 , w2 )〉 = 〈rotπ/2 (v), w〉. Trigonometrische Funktionen Ist ϕ = ](v, w), so gilt 〈v, w〉 = cos ϕ iv i i wi, |det(v, w)| = sinϕ i v i i wi. Für normierte Vektoren v und w gilt cos ϕ = 〈v, w〉, sin ϕ = |det(v, w)|. Die Werte cos ϕ, sin ϕ, tan ϕ, cot ϕ lassen sich also aus den Koordinaten von v und w leicht berechnen. Insbesondere sind diese trigonometrischen Werte rationale Wurzelausdrücke, wenn die Koordinaten von v und y rational sind. Quadratwurzeln entstehen dabei durch Normierung. Linearkombinationen und Koordinatenvektoren In dem von zwei Vektoren v und w der Ebene aufgespannten Parallelogramm P = { λ v + µ w | λ, µ P [ 0, 1 ] } ⊆ R2 sind die Skalare auf das Intervall [ 0, 1 ] beschränkt. Lassen wir diese Beschränkung fallen, so erhalten wir folgenden Begriff: Definition (Spann, Linearkombination) Seien v, w P R2 . Dann heißt span(v, w) = { λ v + µ w | λ, µ P R } der Spann von v und w. Für alle λ, µ P R heißt der Vektor λ v + µ w eine Linearkombination von v und w. Einführung in die Mathematik 1 © Oliver Deiser 2. Die Euklidische Ebene 379 Die folgende Tabelle gibt einen Überblick der Möglichkeiten. v,w span(v, w) det(v, w) nicht kollinear R2 ≠0 kollinear, v ≠ 0 { λv | λ P R } 0 kollinear, w ≠ 0 { λw | λ P R } 0 kollinear, v = w = 0 {0} 0 Der linken Spalte entsprechend ist der Spann zweier Vektoren der Ebene also die ganze Ebene, eine Gerade durch den Nullpunkt oder die Menge, die nur den Nullpunkt als Element enthält. In jedem Fall ist der Nullpunkt ein Element des Spanns (da 0 = 0 v + 0 w), sodass der Spann stets von der leeren Menge verschieden ist. Von Interesse sind die Skalare λ,µ einer Linearkombination u = λ v + µw von v und w. Wir definieren hierzu: Definition (Koordinaten, Koordinatenvektor) Seien v, w P R2 nicht kollinear, u P R2 und λ, µ P R mit u = λ v + µ w. Dann heißen λ, µ die Koordinaten von u bzgl. v, w. Wir nennen (λ, µ) P R2 auch den Koordinatenvektor des Vektors u bzgl. der Basis (v, w). Die Koordinaten sind in der Tat eindeutig bestimmt (Übung), sodass es gerechtfertigt ist, von den Koordinaten bzgl. v, w zu reden. u w v Der Vektor u = −2v + 3w hat den Koordinatenvektor (−2, 3) bzgl. der Basis (v, w) © Oliver Deiser Einführung in die Mathematik 1 380 4. Abschnitt Ebene und Raum Koordinatenvektoren lassen sich durch Vergleich mit der für jeden Vektor u der Ebene gültigen Darstellung u = u1 e1 + u2 e2 mit e1 = (1, 0), e2 = (0, 1) illustrieren. Diese Darstellung zeigt, dass u = (u1 , u2 ) der Koordinatenvektor von u bzgl. der Basis (e1 , e2 ) ist. Allgemein gibt ein Koordinatenvektor (λ,µ) die Position von u an, wenn das übliche Basissystem (e1 , e2 ) durch ein beliebiges Basissystem (v, w) ersetzt wird, das aus zwei nicht kollinearen Vektoren besteht: u = λ v + µ w. Bei Koordinaten ist die Reihenfolge der Basisvektoren zu beachten. Sind λ,µ die Koordinaten von u bzgl. v, w, so sind µ, λdie Koordinaten von u bzgl. w, v. Koordinatenvektoren sind nur für nicht kollineare Vektoren definiert. Zwei Vektoren v, w P R2 sind nach obigen Ergebnissen genau dann nicht kollinear, wenn det(v, w) ≠ 0. Dies werden wir im Folgenden häufig verwenden. Lineare Gleichungssysteme Wir betrachten nun reelle lineare Gleichungssysteme mit zwei Gleichungen und zwei Unbekannten (oder Unbestimmten). Ein solches System hat die Form (+) a x + b y = u1 c x + d y = u2 mit Koeffizienten a, b, c, d P R, Unbekannten x, y P R, rechter Seite u = (u1 , u2 ) P R2 , Lösungsmenge L = { (x, y) P R2 | a x + b y = u1 , c x + d y = u2 }. Ist L ≠ ∅, so heißt das System (+) lösbar. Andernfalls heißt es unlösbar. Besitzt die Menge L genau ein Element, so heißt das System eindeutig lösbar. Wir notieren im Folgenden Vektoren (v1 , v2 ) der Ebene oft als Spaltenvektoren, d. h. in der Form v1 . v2 (v1 , v2 ) = Damit können wir ein Gleichungssystem (+) schreiben als (++) x a c + y b d = u1 u2 = u. In dieser Form ist besonders schön zu sehen, dass auf der linken Seite LinearEinführung in die Mathematik 1 © Oliver Deiser 2. Die Euklidische Ebene 381 kombinationen der aus den Koeffizienten des Systems gebildeten Vektoren v = (a, c) = a , w = (b, d) = c b d stehen, also Elemente des Spanns dieser beiden Vektoren. Mit Hilfe unserer Ergebnisse über Determinanten und Koordinaten erhalten wir: Grundlegende Eigenschaften der Lösungsmenge (1) L ≠ ∅ genau dann, wenn u = (u1 , u2 ) P span(v, w). (2) Ist det(v, w) = a d − b c ≠ 0, so hat L genau ein Element (x, y). Genauer ist dann (x, y) der Koordinatenvektor von u = (u1 , u2 ) bzgl. (v, w). (3) Ist det(v, w) = 0, so kann L die Ebene, eine Gerade (nicht notwendig durch 0) oder die leere Menge sein. Die eindeutige Lösbarkeit des Systems ist also äquivalent dazu, dass die Determinante der Koeffizienten-Matrix a b c d des Systems von Null verschieden ist. Die folgenden Beispiele illustrieren den Fall einer verschwindenden Determinante. Beispiele (1) Sei v = w = 0. Für u = 0 ist L = R2 . Für u ≠ 0 ist L = ∅. (2) Seien v = (1, 1), w = (−1, −1), d. h. wir betrachten ein System der Form x − y = u1 x − y = u2 Für die rechte Seite u = (0, 0) ist L = { (x, x) | x P R } eine Gerade durch 0. Für u = (−1, −1) ist L = { (x, x + 1) | x P R } eine Gerade durch (0, 1). Für u = (0, 1) und allgemein für alle u mit u1 ≠ u2 ist L = ∅. Im zweiten Beispiel fällt auf, dass die Lösungsgerade durch Änderung der rechten Seite nur verschoben wird. Dieses Translationsphänomen ist in der Tat allgemein gültig. Hierzu definieren wir: Definition (homogen, inhomogen) Ist die rechte Seite u = (u1 , u2 ) eines Gleichungssystems der Nullvektor, so nennen wir das System homogen. Andernfalls heißt es inhomogen. Ein homogenes Gleichungssystem ist immer lösbar, nämlich durch den Null- © Oliver Deiser Einführung in die Mathematik 1 382 4. Abschnitt Ebene und Raum vektor. Umgekehrt ist ein System, das durch den Nullvektor gelöst wird, homogen. Damit ist ein System genau dann homogen, wenn 0 P L. Jedem System (1) a x + b y = u1 c x + d y = u2 können wir das homogene System (2) ax + by = 0 cx + dy = 0 zuordnen. Ist L die Lösungsmenge von (1), (x*, y*) P L beliebig und L0 die Lösungsmenge des zugeordneten homogenen Systems (2), so gilt (Übung): L = (x*, y*) + L0 = { (x*, y*) + (x, y) | (x, y) P L0 }. Man drückt diese fundamentale Tatsache auch so aus: Lösung = spezielle Lösung + homogene Lösung Die Lösungsmenge eines Systems ergibt sich durch Finden einer beliebigen Lösung und der Lösungsmenge des zugehörigen homogenen Systems. In L = (x*, y*) + L0 steht links eine Menge und rechts die Summe eines Vektors und einer Menge. Genauer sollten wir also sagen: Lösungsmenge = spezielle Lösung + homogene Lösungsmenge. 5 L 4 w 3 2 L0 v 1 -5 -4 -3 -2 -1 1 2 3 4 5 -1 -2 Die Lösungsmenge des Systems −x + 2y = 5, x − 2y = −5: L = w + L0 = w + { λ v | λ P R } = (1, 3) + { λ (2, 1) | λ P R } Die Lösungsmenge ist eine affine Gerade der Ebene. Einführung in die Mathematik 1 © Oliver Deiser 2. Die Euklidische Ebene 383 w 1 0 1 2 3 Die Lösungsmenge des Systems x − y = 1, 2x − y = 3: L = w + L0 = w + { 0 } = { w } = { (2, 1) } Die Lösungsmenge besteht aus einem Punkt der Ebene. Im Fall einer von Null verschiedenen Determinante der Koeffizienten-Matrix ist L = { (x*, y*) } und L0 = { 0 }. Ist L eine Gerade, so ist L0 eine Gerade durch den Nullpunkt und L = (x*, y*) + L0 die um den Vektor (x*, y*) verschobene Gerade L0 , eine sog. affine Gerade der Ebene. Ist L die gesamte Ebene, so gilt dies auch für L0 . Aus der Lösbarkeit des homogenen Systems folgt keineswegs die Lösbarkeit des inhomogenen Systems (speziell kann L0 = R2 und L = ∅ gelten). Ist aber das inhomogene System lösbar, so hat seine Lösungsmenge bis auf eine Verschiebung die geometrische Form der Lösungsmenge des homogenen Systems. Wir fassen zusammen: Struktur der Lösungsmenge eines linearen Gleichungssystems Für die Lösungsmenge L eines linearen Gleichungssystems mit zwei Gleichungen und zwei Unbekannten sind folgende Fälle möglich: 1. Fall: Die Determinante der Koeffizientenmatrix ist von Null verschieden In diesem Fall besitzt L genau ein Element. Die eindeutige Lösung ist genau dann gleich 0, wenn das System homogen ist. 2. Fall: Die Determinante der Koeffizientenmatrix ist gleich Null In diesem Fall gilt genau eine der folgenden Aussagen: (a) L ist leer. Das System ist notwendig inhomogen. (b) L ist eine affine Gerade. Diese Gerade verläuft genau dann durch Null, wenn das System homogen ist. (c) L ist die gesamte Ebene. Der Fall 2(c) darf als Sonderfall gelten: Ist L = R2 , so liegt das homogene Nullsystem vor, dessen Koeffizienten alle gleich Null sind. © Oliver Deiser Einführung in die Mathematik 1 384 4. Abschnitt Ebene und Raum Algebraische Kurven ersten und zweiten Grades Ist G = G(u) = { λu | λ P R } die von einem Vektor u ≠ 0 der Ebene erzeugte Gerade, so besteht G aus genau den Vektoren des R2 , die senkrecht auf dem Vektor u ⊥ = rotπ/2 (u) stehen. Setzen wir also (a, b) = u ⊥ = (−u2 , u1 ), so gilt (a, b) ≠ 0 und G = { v P R2 | 〈u ⊥ , v〉 = 0 } = { (x, y) P R2 | ax + by = 0 }. (Orthogonaldarstellung einer Geraden) Ist nun w P R2 und H = w + G = { w + λu | λ P R } eine affine Gerade, die nicht durch den Nullpunkt verläuft, so sind die Vektoren u, w nicht kollinear. Folglich sind u ⊥ und w nicht orthogonal. Setzen wir also s = 〈u ⊥ , w〉 = a w1 + b w2 , c = −s, so gilt s, c ≠ 0 und wir erhalten die Darstellung H = { v P R | 〈u ⊥ , v〉 = s } = { (x, y) P R2 | ax + by = s } = { (x, y) P R2 | ax + by + c = 0 }. Es ist bemerkenswert, dass sich eine affine Gerade als Menge aller Vektoren schreiben lässt, für die das Skalarprodukt mit einem gewissen Vektor einen konstanten Wert s ergibt. Dem konstanten Wert s = 0 entsprechen Geraden durch 0, eine Änderung von s bewirkt eine Parallelverschiebung. Umgekehrt ist leicht zu sehen, dass jede Gleichung der Form ax + by + c = 0 mit (a, b) ≠ 0 in den Unbestimmten x, y eine affine Gerade definiert, die genau dann durch den Nullpunkt verläuft, wenn c = 0. Wir halten die Lösungen derartiger bivariater Gleichungen in einer Definition fest: Definition (algebraische Kurve ersten Grades) Eine Menge C ⊆ R2 heißt eine algebraische Kurve ersten Grades, falls es a, b, c P R gibt mit (a, b) ≠ 0 und C = { (x, y) P R2 | ax + by + c = 0 }. Wir sagen dann, dass die Kurve C durch die Gleichung ax + bx + c = 0 definiert wird. Da a ≠ 0 oder b ≠ 0 gilt, können wir eine definierende Gleichung einer Kurve C hinsichtlich x oder y normieren. Ist c ≠ 0, so können wir durch c dividieren und damit die Konstante der Gleichung normieren. Obige Überlegungen zeigen: Satz (Klassifikation der algebraischen Kurven ersten Grades) Die algebraischen Kurven ersten Grades sind genau die affinen Geraden der Ebene. Einführung in die Mathematik 1 © Oliver Deiser 2. Die Euklidische Ebene 385 Deutlich komplizierter werden die Verhältnisse, wenn wir bivariate Gleichungen zweiten Grades betrachten: Definition (algebraische Kurve zweiten Grades) Eine Menge C ⊆ R2 heißt eine algebraische Kurve zweiten Grades, falls es a, b, c, d, e, f P R gibt mit (a, b, c) ≠ 0 und C = { (x, y) P R2 | a x2 + b y2 + c x y + d x + e y + f = 0 }. Wir sagen dann wieder, dass die Kurve C durch die Gleichung der Mengendefinition definiert wird. Algebraische Kurven zweiten Grades sind uns schon oft begegnet. In der folgenden Tabelle geben wir definierende Gleichungen für die Kurven an. Beispiele für algebraischen Kurven zweiten Grades x2 + y2 − 1 = 0 Einheitskreis x2 + y2 − r2 = 0 2 zentrischer Kreis mit Radius r 2 2 (x − x0 ) + (y − y0 ) − r = 0 2 x −y = 0 2 2 2 Einheitsparabel 2 x /a + y /b − 1 = 0 2 Kreis mit Radius r und Mittelpunkt (x0 , y0 ) achsenparallele Ellipse mit Halbachsen a, b 2 x −y −1 = 0 Einheitshyperbel xy − 1 = 0 Hyperbel, Graph von f : R* → R, f(x) = 1/x 10 5 x2 - x y - y 2 + 1 0 0 -x2 - x y - y 2 - 6 y x2 + 5 x - 2 y 0 0 -5 -10 -10 -5 0 5 10 Algebraische Kurven zweiten Grades (Kegelschnitte) © Oliver Deiser Einführung in die Mathematik 1 386 4. Abschnitt Ebene und Raum Man kann zeigen, dass die algebraischen Kurven zweiter Ordnung genau die (beliebig skalierten, gedrehten und verschobenen) Ellipsen, Parabeln und Hyperbeln der Ebene sind, wobei noch einige Sonderfälle zu beachten sind (für eine durch x2 + c = 0 definierte Kurve C ist zum Beispiel C die leere Menge, falls c > 0, C die y-Achse, falls c = 0 und C ein Geradenpaar, falls c < 0). Aus Sicht der klassischen Geometrie sind die algebraischen Kurven zweiten Grades die Kegelschnitte, also die Figuren der Ebene, die wir durch den Schnitt eines unendlichen Doppelkegels mit einer Ebene des Raumes erhalten. Dieser Klassifikationssatz ist keineswegs leicht zu zeigen, und wir begnügen uns an dieser Stelle mit den obigen Beispielen und der Schilderung der Ergebnisse. Aus Sicht der klassischen Geometrie sind die algebraischen Kurven zweiten Grades die Kegelschnitte, also die Figuren der Ebene, die wir durch den Schnitt eines unendlichen Doppelkegels mit einer Ebene des Raumes erhalten. Dieser Klassifikationssatz ist keineswegs leicht zu zeigen, und wir begnügen uns an dieser Stelle mit den obigen Beispielen und der Schilderung der Ergebnisse. Der Leser wird sich fragen, wie es weitergeht. Algebraische Kurven dritten Grades werden durch Gleichungen der Form a1 x3 + a2 y3 + a3 x2 y + a4 x y2 + a5 x2 + a6 y2 + a7 x y + a8 x + a9 y + a10 = 0 definiert, wobei einer der ersten vier Koeffizienten von Null verschieden sein muss. Es ergibt sich eine sehr reichhaltige Kurvenwelt, zu der insbesondere das repräsentative Gebiet der elliptischen Kurven gehört. Diese spezielleren Kurven dritten Grades werden definiert durch Gleichungen der Form y2 = x3 + ax + b. 4 2 x3 - x - y 2 0 0 x3 - x - y 2 + 1 x3 - 3 x - y 2 + 2 0 0 -2 -4 -4 -2 0 2 4 Elliptische Kurven Einführung in die Mathematik 1 © Oliver Deiser 2. Die Euklidische Ebene 387 Übungen Übung 1 Sei v P R2 . Zeigen Sie ohne Verwendung der Winkelformel, dass 〈v, rot± π/2 (v)〉 = 0. Übung 2 In einem Dreieck ABC mit Seiten a, b, c und Winkeln α, β, γ gilt: a2 = b2 + c2 − 2 cos(α) b c. (Kosinussatz) Geben Sie einen trigonometrischen Beweis des Kosinussatzes mit Hilfe des Satzes von Pythagoras. Übung 3 Illustrieren Sie den Beweis der Winkelformel mit Hilfe des Kosinussatzes durch Diagramme. Übung 4 Seien v, w P R2 . Zeigen Sie, dass die folgenden Aussagen äquivalent sind: (a) Die Vektoren v, w sind nicht kollinear. (b) ∀λ, µ P R (λ v + µ w = 0 → λ = µ = 0). Übung 5 Sei u P R2 . Für welche Vektoren v P R2 gilt pru (v) = u? Zeichnen Sie ein erklärendes Diagramm. Übung 6 Zeigen Sie, dass für alle u, v P R2 gilt: (i) pru (u) = u, (ii) pru (pru (v)) = pru (v), (iii) 〈pru (v), u〉 = 〈v, u〉, (iv) prv (pru (v)) = cos2 (ϕ) v, falls v, w ≠ 0 und ϕ = ](u, v). Zeichnen Sie ein Diagramm zur Illustration von (iv) und ergänzen Sie es, sodass die Größen cosn (ϕ) für n ≥ 1 sichtbar werden. Nehmen Sie dabei an, dass u und v normiert sind. Übung 7 Wie lässt sich mit Hilfe der Koordinaten dreier Punkte der Ebene möglichst einfach feststellen, ob die drei Punkte auf einer gemeinsamen Geraden (nicht notwendig durch 0) liegen? © Oliver Deiser Einführung in die Mathematik 1 388 4. Abschnitt Ebene und Raum Übung 8 Illustrieren Sie die positive bzw. negative Orientierung zweier Vektoren der Ebene durch Diagramme. Übung 9 Untersuchen Sie die Wirkung von Rotationen, Spiegelungen am Nullpunkt und Spiegelungen an Geraden durch den Nullpunkt auf die Orientierung zweier Vektoren der Ebene. Übung 10 Zeigen Sie, dass für alle v, w, v1 , v2 , w1 , w2 P R2 und alle λ P R gilt: (i) det(e1 , e2 ) = 1, (ii) det(v, v) = 0, (iii) det(v, w) = − det(w, v), (iv) det(λ v, w) = det(v, λ w) = λ det(v, w), (v) det(v1 + v2 , w) = det(v1 , w) + det(v2 , w), det(v, w1 + w2 ) = det(v, w1 ) + det(v, w2 ). Übung 11 Illustrieren Sie den Begriff des Koordinatenvektors (λ, µ) eines Vektors u P R2 bzgl. einer Basis (v, w) durch Diagramme. Argumentieren Sie anschaulich, warum jeder Vektor u der Ebene einen eindeutigen Koordinatenvektor bzgl. (v, w) besitzt und warum die Forderung „v, w sind nicht kollinear“ notwendig ist. Übung 12 Seien v, w P R2 nicht kollinear. (a) Zeigen Sie, dass span(v, w) = R2 . (b) Sei u P R2 . Beweisen Sie, dass u einen eindeutigen Koordinatenvektor (λ, v) bzgl. der Basis (v, w) besitzt. Übung 13 Sei L die Lösungsmenge eines linearen Gleichungssystems der Form (+), und sei L0 die Lösungsmenge des zugeordneten homogenen Systems. Weiter sei (x*, y*) P L0 . Zeigen Sie: L = (x*, y*) + L0 = { (x*, y*) + (x, y) | (x, y) P L0 }. Einführung in die Mathematik 1 © Oliver Deiser 2. Die Euklidische Ebene 389 Übung 14 Zeigen Sie, dass für ein lineares Gleichungssystem der Form (+) die folgenden Aussagen äquivalent sind: (a) L = R2 , (b) a = b = c = d = u1 = u2 = 0. Übung 15 (a) Sei (x*, y*) P R2 beliebig. Geben Sie ein lineares Gleichungssystem an mit L = { (x*, y*) }. (b) Sei G ⊆ R2 eine beliebige Gerade der Ebene (nicht notwendig durch den Nullpunkt). Geben Sie ein lineares Gleichungssystem an mit L = G. (c) Geben Sie ein lineares Gleichungssystem an mit L = ∅ und L0 = R2 . Alle Gleichungssysteme sollen hierbei die Form (+) haben, als aus zwei Gleichungen mit zwei Unbekannten bestehen. Übung 16 Sei u P R2 normiert, und sei G = G(u) = { λu | λ P R }. Weiter sei w P R2 orthogonal zu u, und es sei H = w + G die durch w und G definierte affine Gerade. Schließlich sei s = 〈w, u ⊥ 〉 mit u ⊥ = rotπ/2 (u). (a) Erklären die die Darstellung H = { v P R2 | 〈u ⊥ , v〉 = s } geometrisch mit Hilfe der Winkelformel für das Skalarprodukt. Welche Bedeutung haben die Länge und das Vorzeichen von s? (b) Sei nun w′ P H beliebig und s′ = 〈u ⊥ , w′〉. Zeigen Sie, dass s = s′ und illustrieren Sie die Situation durch ein Diagramm. Übung 17 Welche algebraischen Kurven zweiten Grades werden durch Gleichungen der folgenden Formen definiert? (a) a x2 + b x2 = 0 (b) a x2 − b y2 = 0 (c) a x2 + c = 0 (d) b y2 + c = 0 © Oliver Deiser Einführung in die Mathematik 1 3. (2 × 2)-Matrizen Matrizen sind rechteckige Gebilde aus Zahlen (zumeist reell oder komplex). Wir können sie als Erweiterung des Begriffs einer endlichen Folge (a1 , …, an ) ins Zweidimensionale auffassen. Für alle natürlichen Zahlen m, n ≥ 1 hat eine reelle (m × n)-Matrix die Form A = a1,1 a1,2 … a1,n a2,1 a1,2 … a2,n … … … … am,1 a1,2 … am,n mit Einträgen ai,j P R für 1 ≤ i ≤ m, 1 ≤ j ≤ n. Matrizen tauchen in der Mathematik an vielen Stellen auf, und ihre vielfältigen Einsatzmöglichkeiten lassen sich genauso wenig in einem Satz beschreiben wie die der endlichen Folgen. In der linearen Algebra werden sie vor allem zur Beschreibung linearer Abbildungen und zur Lösung linearer Gleichungssysteme eingesetzt. In diesem Kapitel stellen wir einige grundlegende Dinge für den einfachen, aber bereits sehr reichhaltigen Fall n = m = 2 zusammen. Im Sinne von Abbildungen und Gleichungssystemen bleiben wir damit bei unserer Untersuchung der Ebene R2 . © Oliver Deiser Einführung in die Mathematik 1 392 4. Abschnitt Ebene und Raum Matrizen und ihre Einträge Definition (2×2-Matrizen) Eine doppelt indizierte Folge reeller Zahlen der Form (a1,1 , a1,2 , a2,1 , a2,2 ) heißt eine reelle 2 × 2-Matrix. Wir notieren eine Matrix A in den Formen a1,1 a1,2 A = a2,1 a2,2 = a11 a12 a21 a22 = (aij )1 ≤ i,j ≤ 2 = (aij )i, j . Die Elemente a11 , a12 , a21 , a22 heißen die Einträge der Matrix A. Weiter heißen a11 und a22 die Diagonaleinträge, (a11 , a22 ) die (Haupt-) Diagonale und a11 + a22 die Spur von A. Ist a12 = a21 = 0, so heißt A eine Diagonalmatrix. Wir setzen A(i, j) = aij für alle 1 ≤ i, j ≤ 2. Die Vektoren (a11 , a12 ), (a21 , a22 ) P R2 heißen die Zeilenvektoren von A, die Vektoren (a11 , a21 ), (a12 , a22 ) P R2 die Spaltenvektoren von A. Wir setzen R2 × 2 = { A | A ist eine reelle 2 × 2-Matrix }. Bei einer quadratischen Matrix-Darstellung werden zwischen den Einträgen keine Kommata gesetzt. In den Indizes können wir „i, j“ oder kürzer „ij“ schreiben, solange klar ist, dass keine Multiplikation i ⋅ j vorliegt. Formal kann man eine 2 × 2-Matrix als eine Funktion von { 1, 2 } × { 1, 2 } = { (1, 1), (1, 2), (2, 1), (2, 2) } nach R auffassen, die als Folge oder Familie (a(1,1) , a(1,2) , a(2,1) , a(2,2) ) = (a1,1 , a1,2 , a2,1 , a2,2 ) notiert wird: ai, j ist der Funktionswert an der Stelle (i, j). Im Umgang mit Matrizen tritt dieser formale Aspekt in den Hintergrund. Wichtig sind die quadratische Darstellung und die Eigenschaften der Operationen mit Matrizen. In der indizierten Form A = a11 a12 a21 a22 ist der erste Index immer ein Zeilenindex und der zweite Index immer ein Spaltenindex. Der Eintrag A(i, j) = aij der Matrix A steht in der i-ten Zeile und der j-ten Spalte von A. Da 2×2-Matrizen nur vier Einträge besitzen, geben wir sie oft an in der Form A = a b c d . Einführung in die Mathematik 1 © Oliver Deiser 3. (2 × 2)-Matrizen 393 Es gilt dann automatisch A(1, 1) = a11 = a, …, A(2, 2) = a22 = d. Der Leser vergleiche dies mit der Vektornotation v = (x, y) = (v1 , v2 ) P R2 . Konvention: Strichpunkt und Komma Jedes Paar von Vektoren der Ebene lässt sich als 2 × 2-Matrix auffassen. Um Zeilen und Spalten zu unterscheiden, verwenden wir ein Komma bzw. einen Strichpunkt: Sind v, w P R2 , so ist A = (v, w) die 2 × 2 Matrix mit den Zeilenvektoren v und w und B = (v; w) die 2 × 2-Matrix mit den Spaltenvektoren v und w. Der Unterschied zwischen den Matrizen A = (v, w) und B = (v; w) lässt sich durch folgende Operation beschreiben: Definition (Transposition, symmetrisch) Sei A P R2 × 2 . Dann ist die zu A transponierte Matrix At definiert durch At (i, j) = A(j, i) für alle 1 ≤ i, j ≤ 2. Gilt A = At , so heißt A symmetrisch. Die zu A transponierte Matrix entsteht durch Spiegelung an der Hauptdiagonalen. Wegen At (1, 1) = A(1, 1) und At (2, 2) = A(2, 2) hat At die gleiche Diagonale wie A. Die beiden anderen Einträge sind vertauscht: At (1, 2) = A(2, 1), At (2, 1) = A(1, 2). Ist A = (v, w), so ist At = (v; w). Ist umgekehrt A = (v; w), so ist At = (v, w). Für alle A gilt (At )t = A. Die Symmetrie einer Matrix A ist durch A(1, 2) = A(2, 1) charakterisiert; die Diagonaleinträge sind beliebig. Beispiele ((1, 2), (3, 4)) = ((1, 3); (2, 4)) = 1 0 0 1 0 1 1 0 1 0 0 2 0 1 2 0 © Oliver Deiser , , , , 1 0 0 2 0 1 2 0 1 2 2 4 2 1 4 2 1 2 3 4 , sind Diagonalmatrizen, sind keine Diagonalmatrizen, sind symmetrisch, sind nicht symmetrisch. Einführung in die Mathematik 1 394 4. Abschnitt Ebene und Raum Zwei wichtige spezielle Matrizen sind: Definition (Nullmatrix, Einheitsmatrix) Die Nullmatrix 0 P R2 × 2 und die Einheitsmatrix E2 P R2 × 2 sind definiert durch 0 = ((0, 0); (0, 0)) = 0 0 0 0 , E2 = ((1, 0); (0, 1)) = 1 0 0 1 . Beide Matrizen sind symmetrisch, sodass wir die Strichpunkte in der Definition auch durch Kommata ersetzen könnten. Die Einträge der Nullmatrix sind alle gleich 0. Bei der Einheitsmatrix sind die Diagonaleinträge gleich 1, die anderen Einträge gleich 0. Die Zeilen und Spalten von E2 bestehen aus den kanonischen Einheitsvektoren e1 = (1, 0) und e2 = (0, 1) der Ebene. Wir werden gleich sehen, dass die Nullmatrix die additive Rolle der Null und die Einheitsmatrix die multiplikative Rolle der Eins übernimmt. Wir führen noch eine Notation ein, die nicht nur bei Umgang mit Matrizen nützlich ist: Notation: Kronecker-Delta Für zwei Indizes i, j ist das Kronecker-Delta δij definiert durch δij = { 1 0 falls i = j falls i ≠ j. Die bei einem Kronecker-Delta verwendeten Indizes i, j sind dabei beliebige mathematische Objekte. Für reelle Zahlen x,y ist zum Beispiel δxx = 1 und δxy = 0, falls x ≠ y. Die durch δx0 definierte Funktion f : R → R ist genau an der Stelle 0 gleich 1 und für alle reellen Zahlen x ≠ 0 gleich 0. Die Einheitsmatrix E2 P R2 × 2 lässt sich mit Hilfe des Kronecker-Deltas nun definieren durch E2 (i, j) = δij für alle 1 ≤ i, j ≤ 2. Schließlich führen wir noch eine Notation für Diagonalmatrizen ein: Notation Für alle d1 , d2 P R setzen wir diag(d1 , d2 ) = d1 0 0 d2 . Damit gilt 0 = diag(0, 0) und E2 = diag(1, 1). Einführung in die Mathematik 1 © Oliver Deiser 3. (2 × 2)-Matrizen 395 Addition und Skalierung von Matrizen Matrizen lassen sich in natürlicher Weise addieren und skalieren: Definition (Addition von Matrizen) Seien A, B P R2 × 2 . Dann setzen wir A+B = a11 a12 a21 a22 + b11 b12 b21 b22 = a11 + b11 a12 + b12 a21 + b21 a22 + b22 . Die Matrix A + B P R2 × 2 heißt die Summe der Matrizen A und B. Definition (Subtraktion von Matrizen) Seien A, B P R2 × 2 . Dann setzen wir −A = −a11 −a12 −a21 −a22 , A − B = A + (−B). Die Matrix A − B P R2 × 2 heißt die Differenz der Matrizen A und B. Definition (Skalierung von Matrizen) Seien A P R2 × 2 und λ P R. Dann setzen wir λA = λ a11 a12 a21 a22 = λa11 λa12 λa21 λa22 . Die Matrix λ A P R2 × 2 heißt das Produkt der Matrix A mit dem Skalar λ. Es gelten alle vertrauten Rechenregeln. Einige davon sind: Satz (Rechenregeln für Matrizen) Für alle A, B, C P R2 × 2 und λ, µ P R gilt: (a) A + (B + C) = (A + B) + C, (b) A + 0 = 0 + A = A, (c) A + (− A) = (− A) + A = 0, (d) A + B = B + A, (e) 1 A = A, − A = (− 1) A, (f ) λ (A + B) = λ A + λ B, (g) λ (µ A) = (λ µ) A = µ (λ A). © Oliver Deiser Einführung in die Mathematik 1 396 4. Abschnitt Ebene und Raum Das Matrix-Vektor-Produkt Als nächstes führen wir ein Produkt einer Matrix A mit einem Vektor (x, y) der Ebene ein. Wir vereinbaren hierzu: Konvention Einen Vektor (x, y) notieren bei einer Multiplikation mit einer Matrix in Spaltenform. Anders formuliert: Wir fassen (x, y) als (2 × 1)-Matrix mit zwei Zeilen und einer Spalte auf. Damit können wir nun definieren: Definition (Matrix-Vektor-Produkt) Seien A P R2 × 2 und v = (x, y) P R2 . Dann setzen wir A v = A (x, y) = a b x c d y = ax + by P R2 . cx + dy Der Vektor A v P R2 heißt das Matrix-Vektor-Produkt von A mit v. Beispiele (a) (b) 1 2 1 3 4 2 1 2 1 3 4 0 = = 5 11 1 3 , , 1 3 1 2 4 2 1 2 0 3 4 1 = = 7 10 2 4 . . Allgemein gilt für alle A = (v; w) = ((a, b), (c, d)) P R2 × 2 : A e1 = v = (a, c), A e2 = w = (b, d). (Spaltenextraktion) Die Multiplikation mit den Einheitsvektoren liefert also die Spaltenvektoren einer Matrix. Die Zeilen erhalten wir durch Transposition: At e1 = (a, b), At e2 = (c, d). (Zeilenextraktion) Die Einträge einer Matrix A lassen sich mit Hilfe des Euklidischen Skalarprodukts gewinnen: 〈e1 , Ae1 〉 = a11 , 〈e1 , Ae2 〉 = a12 , 〈e2 , Ae1 〉 = a21 , 〈e2 , Ae2 〉 = a22 . (Extraktion der Einträge) Es gilt also 〈ei , Aej 〉 = aij für alle i, j. Einführung in die Mathematik 1 © Oliver Deiser 3. (2 × 2)-Matrizen 397 Matrizen als Abbildungen Sei A P R2 × 2 . Dann können wir das Matrix-Vektor-Produkt als Abbildung von R2 nach R2 auffassen: Jedem v P R2 wird der Vektor fA (v) = Av P R2 zugeordnet. Wir werden den Sichtweise „Matrizen als Abbildungen“ und die Abbildungen fA : R2 → R2 später genauer untersuchen. Für jetzt genügt es, den funktionalen Zusammenhang zwischen v und Av bei festgehaltener Matrix A wahrzunehmen. So können wir zum Beispiel sagen, dass v auf Av abgebildet wird, oder dass A gewisse Abbildungseigenschaften besitzt. Die vielleicht wichtigste Eigenschaft des Produkts ist: Satz (Linearität des Matrix-Vektor-Produkts) Sei A P R2 × 2 . Dann gilt für alle v, w P R2 und λ, µ P R: A(λ v + µ w) = λ A v + µ A w. Der Leser verifiziere dies durch Nachrechnen. Zusammenhang mit linearen Gleichungssystemen Das Matrix-Vektor-Produkt lässt sich durch lineare Gleichungssysteme illustrieren. Ein System (+) a x + b y = u1 c x + d y = u2 können wir mit Hilfe des Produkts notieren als a b x c d y = u1 u2 = u. Ist A die Koeffizientenmatrix des Systems, so gilt L = { v P R2 | A v = u }. Das System (+) selbst können wir damit sehr kompakt angeben als A (x, y) = u. (Matrix-Form eines linearen Gleichungssystems) Ist A = ((a, b), (c, d)) P R(2 × 2) , so ist die Determinante det(A) = ad − bc = 〈(a, b), (d, −c)〉 = 〈(a, b), rot−π/2 (c, d)〉 = ad − cb = 〈(a, c), (d, −b)〉 = 〈(a, c), rot−π/2 (b, d)〉 genau dann gleich Null, wenn die Zeilenvektoren (gleichwertig: Spaltenvektoren) von A kollinear sind. Das lineare Gleichungssystem A (x, y) = u ist genau dann eindeutig lösbar, wenn det(A) ≠ 0. © Oliver Deiser Einführung in die Mathematik 1 398 4. Abschnitt Ebene und Raum Die Struktur „Lösung = spezielle Lösung + homogene Lösung“ der Lösungsmenge eines lösbaren Systems können wir in der Matrizenformulierung sehr elegant beweisen. Denn seien L = { v | A v = u }, L0 = { v | Av = 0 } und v* P L. Dann gilt für alle v die Äquivalenzenkette vPL genau dann, wenn Av = u genau dann, wenn Av − Av* = u − u genau dann, wenn A(v − v*) = 0 genau dann, wenn v − v* P L0 genau dann, wenn v P v* + L0 . Linearkombinationen der Spalten Sei A P R2×2 . Für alle v = (x, y) P R2 ist Av eine Linearkombination der Spalten von A, da Av = a b x c d y = ax + by cx + dy = x a c b + y d . Umgekehrt ist auch jede Linearkombination der Spalten von A von der Form Av. Ist also A = ((a, c); (b, d)), so gilt span((a, c), (b, d)) = { Av | v P R2 }. Ist det(A) ≠ 0, so ist v der Koordinatenvektor von A v bzgl. der Basis (a, c), (b, d), die aus den Spaltenvektoren von A gebildet ist. Zusammenhang mit dem Euklidischen Skalarprodukt Das Matrix-Vektor-Produkt Av mit v = (x, y) können wir mit Hilfe des Euklidischen Skalarprodukts in der folgenden Form schreiben: Av = a b x c d y = ax + by cx + dy = 〈(a, b), v〉 〈(c, d), v〉 . Wir lesen ab, dass A v genau dann gleich 0 ist, wenn v auf beiden Zeilenvektoren von A senkrecht steht. Allgemeiner liegt Av auf der x-Achse (y-Achse), wenn v auf der zweiten (ersten) Zeile von A senkrecht steht. Eine weitere sehr wichtige Eigenschaft ist: Satz (Seitenwechsel im Skalarprodukt) Sei A P R2 × 2 . Dann gilt 〈v, Aw〉 = 〈At v, w〉 für alle v, w P R2 . Der Leser beweise diese Eigenschaft durch Nachrechnen. Ist A symmetrisch, so gilt also 〈v, Aw〉 = 〈Av, w〉 für alle A P R2 × 2 und v, w P R2 . Einführung in die Mathematik 1 © Oliver Deiser 3. (2 × 2)-Matrizen 399 Die Matrizenmultiplikation Mit Hilfe des Matrix-Vektor-Produkts führen wir nun eine Multiplikation für Matrizen ein: Definition (Produkt zweier Matrizen) Seien A, B P R2 × 2 , und sei B = (b1 ; b2 ). Dann setzen wir A ⋅ B = (A b1 ; A b2 ). Die Matrix A ⋅ B P R2 × 2 heißt das Produkt der Matrizen A und B. Wir erhalten also die Produktmatrix A ⋅ B, indem wir die beiden Matrix-Vektor-Produkte Ab1 und Ab2 als Spalten in eine Matrix schreiben. In Langform notiert ergibt sich A⋅B = a11 a12 a21 a22 = ⋅ b11 b12 b21 b22 a11 b11 + a12 b21 a11 b12 + a12 b22 a21 b11 + a22 b21 a21 b12 + a22 b22 . Die Berechnung lässt sich kompakt als Zeile mal Spalte zusammenfassen. Notation Wir schreiben auch kurz A B statt A ⋅ B. Beispiele (1) 1 2 1 3 3 4 2 4 1 0 0 0 0 0 0 1 1 1 2 −1 1 2 −1 1 0 1 0 1 1 0 1 0 (2) (3) (4) © Oliver Deiser = = = = 5 11 11 25 0 0 0 0 1 0 0 1 1 0 0 1 = 0 = E2 = E2 Einführung in die Mathematik 1 400 4. Abschnitt Ebene und Raum Das Matrizenprodukt lässt sich auch mit Hilfe der Summennotation elegant beschreiben. Für das Produkt C = AB zweier Matrizen A und B gilt nach Definition cij = ∑ 1 ≤ k ≤ 2 aik bkj für alle 1 ≤ i, j ≤ 2. Dabei durchläuft aik die i-te Zeile von A, während bkj die j-te Spalte von B durchläuft. Die Matrizenmultiplikation lässt sich durch ein kombiniertes lineares Gleichungssystem illustrieren (Übung): Komposition von Gleichungssystemen Seien A, B P R2 × 2 , u P R2 . Das kombinierte Gleichungssystem B (x, y) = (x′, y′), A (x′, y′) = u wird von (x, y) P R2 genau dann gelöst, wenn (A B) (x, y) = u. Durch Nachrechnen zeigt man: Satz (Eigenschaften der Matrizenmultiplikation) Für alle A, B, C P R2 × 2 und alle v = (x, y) P R2 gilt: (a) A (Bv) = (AB) v, (b) A (BC) = (A B) C, (Assoziativität) (c) A E2 = E2 A = A, (Neutralität von E2 ) (d) A (B + C) = A B + A C, (A + B) C = A C + B C. (Distributivität) Der Leser hat vielleicht die Kommutativität A B = B A in der Liste vermisst. Diese ist aber im Allgemeinen nicht gültig: Beispiele (1) 1 0 1 1 1 1 0 1 1 1 1 0 0 1 1 1 a b 0 1 c d 1 0 0 1 a b 1 0 c d (2) Einführung in die Mathematik 1 = = = = 1 1 1 2 2 1 1 1 b a d c c d a b (Spaltentausch) (Zeilentausch) © Oliver Deiser 3. (2 × 2)-Matrizen 401 Ist A = (v; w), so ist die Determinante von A definiert als det(A) = det(v, w). Nachrechnen zeigt den folgenden wichtigen Satz: Satz (Multiplikationssatz für Determinanten) Seien A, B P R2 × 2 . Dann gilt det(AB) = det(A) det(B). Beispiel Seien A = 1 1 −1 2 , B = 1 2 2 −1 , C = AB = 3 1 3 −4 Dann gilt det(A) = 3, det(B) = −5 und det(C) = −15 = det(A) det(B). Schließlich definieren wir noch: Definition (Potenzen für Matrizen) Sei A P R2 × 2 . Dann setzen wir: A0 = E2 , A1 = A, A2 = A A, A3 = A2 A, … Beispiele (1) Sei A = ((1, 0); (1, 1)). Dann gilt A2 = 1 1 1 1 0 1 0 1 = 1 2 0 1 , A3 = 1 3 0 1 , … (2) Für die Matrix A = 0 1 1 0 erhalten wir die periodischen Potenzen A2 = E2 , A3 = A, A4 = E2 , …, A2n = E2 , A2n + 1 = A, … (3) Für die Matrix A = 0 1 0 0 gilt A2 = 0 und allgemein An = 0 für alle n ≥ 2. Wiederholte Anwendung des Multiplikationsssatzes für Determinanten ergibt, dass det(An ) = det(A)n für alle n ≥ 1 gilt. Aus der Assoziativität der Matrizenmultiplikation folgt An Am = An + m = Am An für alle n, m P N. © Oliver Deiser Einführung in die Mathematik 1 402 4. Abschnitt Ebene und Raum Matrizen als lineare Abbildungen Wir verfolgen nun das Motiv, dass eine Matrix A vermöge „v wird abgebildet auf Av“ eine Abbildung der Ebene in sich selbst definiert, genauer. Hierzu definieren wir den grundlegenden Begriff einer linearen Abbildung f : R2 → R2 und zeigen, dass die linearen Abbildungen den durch die Matrizen definieren Abbildungen entsprechen. Die Matrizenmultiplikation entspricht dabei der Komposition von Abbildungen. Wir erinnern an: Definition (zugeordnete Abbildung) Sei A P R2 × 2 . Dann ist die Abbildung fA : R2 → R2 definiert durch fA (v) = A v für alle v P R2 . Die Abbildung fA heißt die der Matrix A zugeordnete Abbildung. Wir haben schon verwendet, dass für alle A P R2 × 2 , Vektoren v, w P R2 und Skalare λ, µ P R gilt: A (λ v + µ w) = λ A v + µ A w, d. h. fA (λ v + µ w) = λ fA (v) + µ fA (w). Speziell gilt für alle v = (x, y) P R2 : fA (v) = Av = A(x, y) = A(xe1 + ye2 ) = x Ae1 + y Ae2 . Der Funktionswert fA (v) ist also eine Linearkombination der Spaltenvektoren Ae1 und Ae2 der Matrix A. Die Skalare der Kombination sind die Komponenten von v. Damit können wir die Abbildungseigenschaften einer Matrix mit nichtverschwindender Determinante veranschaulichen: Visualisierung der Abbildungsdynamik einer Matrix A Wir zeichnen die Spaltenvektoren von A in eine Diagramm ein und fassen sie als neue Basisvektoren auf. Dadurch erzeugen wir ein neues Koordinatengitter. Für alle v = (x, y) ist Av der Punkt des Gitters mit den Koordinaten (x, y). Ist die Determinante von A gleich 0, so sind die Spaltenvektoren von A kollinear. Wir können sie erneut in ein Diagramm einzeichnen, aber die beiden Vektoren erzeugen nun nur noch den Nullpunkt (im Fall A = 0) oder eine Gerade in der Ebene (im Fall A ≠ 0). Daneben stehen uns alle Visualisierungsmöglichkeiten zur Verfügung, die wir für eine Funktion von C nach C diskutiert haben. Denn fA : R2 → R2 ist eine Abbildung der Ebene in sich selbst. Beispielsweise können wir versuchen, die Wirkung von fA durch Pfeile von v nach Av für einige v zu veranschaulichen. Einführung in die Mathematik 1 © Oliver Deiser 3. (2 × 2)-Matrizen 403 A(-2, 3) Ae2 Ae1 A(-1, -3/2) A(2, -4) Eine Matrix A mit det(A) ≠ 0 verformt das kartesische Gitter zu einem neuen Gitter. Mit Hilfe des neuen Gitters können wir die Vektoren fA (v) = A v bestimmen. Beispiele (1) Für die Nullmatrix 0 ist f0 (v) = 0 P R2 für alle v P R2 , d. h. f0 bildet jeden Vektor der Ebene auf den Nullvektor der Ebene ab. (2) Für die Einheitsmatrix E2 gilt fE2 (v) = v für alle v P R2 , sodass die zugeordnete Abbildung die Identität auf R2 ist. (3) Sei A = ((1, 0); (0, 0)). Dann gilt Av = (v1 , 0) für alle v P R2 . Die Abbildung fA ist also die orthogonale Projektion eines Vektors v auf die x-Achse, d. h. es gilt fA = pre1 . Die Abbildung fA : R2 → R2 erlaubt eine neue Sicht auf ein lineares Gleichungssystem: Die Lösungsmenge eines linearen Gleichungssystems A v = u ist das Urbild der Menge { u } unter der Abbildung fA . Genau diejenigen Vektoren der Ebene, die durch fA auf u abgebildet werden, lösen das Gleichungssystem. Die Urbildmenge einer einelementigen Menge ist auch als Faser der Abbildung bekannt. Damit ist also L die Faser von u unter der Abbildung fA . Der enge Zusammenhang zwischen A und fA wird weiter vertieft durch: Satz (Matrizenmultiplikation als Komposition) Für alle A, B P R2 × 2 gilt f A B = f A + f B . Der Beweis des Satzes sei dem Leser zur Übung empfohlen. Wichtig ist die Reihenfolge der Komposition: f A B = f A + f B , aber f B A = f B + f A . © Oliver Deiser Einführung in die Mathematik 1 404 4. Abschnitt Ebene und Raum Lineare Abbildungen Wir betrachten nun allgemein: Definition (lineare Abbildung) Eine Abbildung f : R2 → R2 heißt linear, falls für alle v, w P R2 und alle λ, µ P R gilt: f(λ v + µ w) = λ f(v) + µ f(w). (Linearitätsbedingung) Alle Abbildungen der Form fA : R2 → R2 sind linear. Der folgende grundlegende Satz besagt, dass es keine weiteren Beispiele gibt: Satz (Hauptsatz über lineare Abbildungen und Matrizen) Sei f : R2 → R2 linear. Dann gibt es genau ein A P R2 × 2 mit f = fA . Beweis zur Existenz: Wir setzen A = (f(e1 ); f(e2 )), d. h. die Spalten von A sind die Bilder der kanonischen Basisvektoren e1 und e2 unter f. Dann gilt A e1 = f(e1 ) und A e2 = f(e2 ). Folglich gilt für alle v = (x, y) P R2 : fA (v) = fA (x e1 + y e2 ) = x fA (e1 ) + y fA (e2 ) = x f(e1 ) + y f(e2 ) = f(x e1 + y e2 ) = f(v). zur Eindeutigkeit: Seien A, B P R2 × 2 mit fA = f = fB . Dann gilt A e1 = fA (e1 ) = fB (e1 ) = B e1 , sodass die erste Spalte von A mit der ersten Spalte von B übereinstimmt. Anlog zeigt eine Multiplikation mit e2 , dass die zweiten Spalten der Matrizen A und B übereinstimmen. Damit gilt A = B. Mit Hilfe des Ergebnisses lässt sich die Assoziativität der Matrizenmultiplikation elegant aus der Assoziativität der Komposition von Abbildungen folgern. Für alle Matrizen A, B, C gilt fA(BC) = fA + (fBC ) = fA + (fB + fC ) = (fA + fB ) + fC = fAB + fC = f(AB)C . Aus der Eindeutigkeit der Darstellung folgt A(BC) = (AB)C. Damit wird der Beweis durch Nachrechnen durch ein Argument vom höheren Standpunkt ergänzt. Wichtig ist nicht nur der Satz, sondern sein Beweis: Wir können die darstellende Matrix einer linearen Abbildung finden, indem wir die Bilder der kanonischen Basisvektoren bestimmen und als Spalten in eine Matrix schreiben. Wir betrachten einige Beispiele hierzu. Einführung in die Mathematik 1 © Oliver Deiser 3. (2 × 2)-Matrizen 405 Projektionsmatrizen Sei u P R2 mit u ≠ 0. Dann ist die orthogonale Projektion pru : R2 → R2 , die einen Vektor v auf pru (v) = 〈û, v〉 û abbildet, linear. Wir nehmen zur Vereinfachung der Notation an, dass u normiert ist. Dann gilt pru (e1 ) = 〈u, e1 〉 u = u1 u = (u1 2 , u1 u2 ), pru (e2 ) = 〈u, e2 〉 u = u2 u = (u1 u2 , u2 2 ). Damit erhalten wir die symmetrische Matrix Au = u1 2 u1 u2 u1 u2 u2 2 als darstellende Matrix. Matrizen dieser Form heißen Projektionsmatrizen. Wir können diese Matrizen auch anders gewinnen, indem wir schreiben pru (v) = 〈u, v〉 u = (u1 v1 + u2 v2 ) u1 u2 = u1 2 u1 u2 u1 u2 u2 v1 2 v2 . Eine Projektionsmatrix Au besitzt die Determinante 0. Alle Vektoren der Ebene werden durch Au auf die von u erzeugte Gerade abgebildet. 3 2 1 -3 -2 -1 1 2 3 -1 -2 -3 Die Projektion Au auf den Vektor u = (2, 2/3) visualisiert als Pfeildiagramm. Mit λ = 1/10 gilt û = £λ(3, 1), Au e1 = λ (3, 9) und Au e2 = λ (3, 1). © Oliver Deiser Einführung in die Mathematik 1 406 4. Abschnitt Ebene und Raum Rotationsmatrizen Sei ϕ P R. Die Abbildung rotϕ : R2 → R2 , die einen Vektor v P R2 um einen Winkel ϕ gegen den Uhrzeigersinn dreht, ist linear. Es gilt f(e1 ) = (cos ϕ, sin ϕ), f(e2 ) = rotπ/2 (f(e1 )) = (−sin ϕ, cos ϕ). Für die darstellende Matrix Aϕ = Arotϕ gilt also Aϕ = cosϕ −sinϕ sinϕ cosϕ . Ae1 Ae2 e1 A(-2, -1) 1 0.5 -1 -0.5 0.5 1 -0.5 -1 Die Rotation A = Aϕ um den Winkel ϕ = 2π/7 Einführung in die Mathematik 1 © Oliver Deiser 3. (2 × 2)-Matrizen 407 Weitere wichtige Beispiele sind die Punktspiegelung am Nullpunkt und die Spiegelungen an Geraden durch den Ursprung. Wir diskutierenden die darstellenden Matrizen dieser Abbildungen in den Übungen. Durch den Übergang von A zu fA können wir die Determinante einer Matrix A anschaulich interpretieren: In den Spalten von A stehen die Bilder der kanonischen Basisvektoren. Die Basisvektoren e1 und e2 spannen ein Parallelogramm der Fläche 1 auf (ein Quadrat). Ihre Bilder fA (e1 ) und fA (e2 ) unter fA spannen ein Parallelogramm der signierten Fläche det(A) auf, wobei wir eine negative Fläche als negative Orientierung der Bildvektoren interpretieren. Damit können wir zusammenfassen: Die Determinante einer Matrix A ist ein Maß für die von der linearen Abbildung fA bewirkte Flächenverzerrung. Diese Verzerrung kann durch die Skalierung der Basisvektoren, durch die Veränderung des eingeschlossenen rechten Winkels und durch die Umkehr der Orientierung entstehen. 1.5 det(A) Ae2 1 0.5 Ae1 0.5 1 1.5 Die Determinante einer Matrix A als Maß für die Flächenverzerrung Beispiele (1) Eine Projektion erzeugt ein degeneriertes Parallelogramm. Die Determinante einer Projektionsmatrix ist 0. (2) Eine Rotation erhält sowohl die Fläche als auch die Orientierung. Die Determinante einer Rotationsmatrix ist 1. © Oliver Deiser Einführung in die Mathematik 1 408 4. Abschnitt Ebene und Raum Allgemeine Abbildungseigenschaften von Matrizen Wir haben gesehen, dass zwischen linearen Abbildungen und Matrizen eine eindeutige Beziehung besteht. Im Folgenden identifizieren wir, wo immer es die Sprechweise erleichtert, eine Matrix A P R2 × 2 mit der zugeordneten Abbildung f A : R2 → R2 . Um die Abbildungseigenschaften einer Matrix A weiter zu beschreiben, betrachten wir die Wirkung von A auf geometrische Figuren der Ebene: Ist P ⊆ R2 , so wird jeder Punkt v von P durch A auf Av abgebildet. Sammeln wir alle Punkte Av, so erhalten wir ein neues geometrisches Gebilde: Definition (Bild einer Menge unter einer Matrix) Sei A P R2 × 2 . Dann setzen wir A[ P ] = { Av | v P P } für alle P ⊆ R2 . Wir nennen die Menge A[ P ] das Bild von P unter A. Ein exemplarisches Ergebnis ist, dass eine Matrix eine affine Gerade in eine affine Gerade überführt: Satz (Bilder von Geraden unter linearen Abbildungen) Seien A P R2 × 2 und G = w + span(v) eine affine Gerade im R2 . Dann ist A[ G ] die affine Gerade Aw + span(Av). Beweis A[ G ] = { A(w + λv) | λ P R } = { Aw + λAv | λ P R } = Aw + span(Av). G A[G] Aw w v Av Die Transformation einer affinen Geraden unter einer Matrix A Einführung in die Mathematik 1 © Oliver Deiser 3. (2 × 2)-Matrizen 409 Allgemein zeigt das Argument, dass A[ v + P ] = Av + A [ P ] für alle v P R2 und P ⊆ R2 . Das Ergebnis lässt sich vielfach verallgemeinern. So wird die Strecke S = { v + λ (w − v) | λ P [ 0, 1 ] } zwischen zwei Punkten v, w P R2 durch eine Matrix A auf die Strecke A[ S ] = { Av + λ (Aw − Av) | λ P [ 0, 1 ] } abgebildet, die die Bildpunkte Av und Aw verbindet. Damit werden Dreiecke in Dreiecke übersetzt (die genau dann degeneriert sind, wenn die Determinante von A gleich 0 ist). Seitenlängen, Winkel und Orientierung können dabei verändert werden. Ebenso wird ein Parallelogramm mit den Punkten p1 , p2 , p3 , p4 in das Parallelogramm mit den Bildpunkten q1 = Ap1 , …, q4 = Ap4 überführt (denn der einer Ecke gegenüberliegende Punkt errechnet sich linear aus den anderen Punkten). Rechtecke werden genau dann in Rechtecke überführt, wenn die Spaltenvektoren von A aufeinander senkrecht stehen. Und Quadrate genau dann in Quadrate, wenn die Spaltenvektoren von A orthogonal zueinander und zudem normiert sind. Derartige Matrizen werden wir im nächsten Kapitel untersuchen. Nachdem Quadrate auf Parallelogramme abgebildet werden, ist zu vermuten, dass ein in ein Quadrat einbeschriebener Kreis auf eine Ellipse abgebildet wird, die das Parallelogramm in den Mittelpunkten seiner Seiten tangential berührt. Diese Vermutung ist richtig, aber nicht mehr so leicht zu zeigen. Weiter sind die Halbachsen der Ellipse weder in ihrer Länge noch in ihrer Richtung einfach zu berechnen. Wir werden die Frage im nächsten Kapitel aufgreifen und eine vertiefte Analyse innerhalb der Eigenwerttheorie geben. A(1, 1) 3 2 Ae2 Ae1 1 -4 -3 -2 E -1 1 -1 2 3 4 A(1, -1) -2 -3 Das Bild des Einheitskreises K und des umgebenden Quadrats unter A = ((3, 1); (1, 2)). Die Halbachsenrichtungen und -längen der Ellipse E = A[ K ] sind nicht klar. © Oliver Deiser Einführung in die Mathematik 1 410 4. Abschnitt Ebene und Raum Übungen Übung 1 Zeigen Sie, dass für alle A, B, C P R2 × 2 und λ, µ P R gilt: (a) A + (B + C) = (A + B) + C, (b) A + 0 = 0 + A = A, (c) A + (− A) = (− A) + A = 0, (d) A + B = B + A, (e) 1 A = A, − A = (− 1) A, (f ) λ (A + B) = λ A + λ B, (g) λ (µ A) = (λ µ) A = µ (λ A). Übung 2 Sei A P R2 × 2 . Zeigen Sie, dass für alle v, w P R2 und λ, µ P R gilt: A(λ v + µ w) = λ A v + µ A w. Übung 3 Sei A P R2 × 2 symmetrisch. Zeigen Sie, dass es eindeutig bestimmte λ P R und B P R2 × 2 gibt mit den Eigenschaften: A = λ E2 + B, spur(B) = 0. Übung 4 Sei A P R2 × 2 gegeben mit det(A) = 0. Geben Sie ein v P R2 an mit v ≠ 0 und A v = 0. Übung 5 Sei A P R2 × 2 . Zeigen Sie, dass für alle v, w P R2 gilt: (a) 〈v, Aw〉 = 〈At v, w〉, 〈Av, w〉 = 〈v, At w〉, (b) i A v i 2 = 〈v, At Av〉, i At v i 2 = 〈v, A At v〉. Übung 6 Zeigen Sie, dass für alle A, B, C P R2 × 2 und v P R2 gilt: (a) A (Bv) = (AB) v, (b) A (BC) = (A B) C, (c) A E2 = E2 A = A, (d) A (B + C) = A B + A C, (A + B) C = A C + B C. Einführung in die Mathematik 1 © Oliver Deiser 3. (2 × 2)-Matrizen 411 Übung 7 Seien A, B P R2 × 2 . Zeigen Sie, dass det(AB) = det(A) det(B). Übung 8 (a) Sei A P R2 × 2 . Zeigen Sie, dass A At symmetrisch ist. (b) Gilt immer At A = A At ? Übung 9 Seien A, B P R2 × 2 . Zeigen Sie, dass (AB)t = Bt At . Übung 10 Seien A, B P R2 × 2 , u P R2 . Wir betrachten das Gleichungssystem (+) B (x, y) = (x′, y′), A (x′, y′) = u (a) Notieren Sie das System in Variablenform. (b) Zeigen Sie (wahlweise in Matrizen- oder Variablenform), dass (x, y) P R2 genau dann eine Lösung von (+) ist, wenn (A B) (x, y) = u. Übung 11 Zeigen Sie: (a) Das Produkt zweier Diagonalmatrizen ist eine Diagonalmatrix. (b) Das Produkt zweier symmetrischer Matrizen ist eine symmetrische Matrix. (c) Das Produkt zweier oberer (unterer) Dreiecksmatrizen ist eine obere (untere) Dreiecksmatrix. Dabei heißt eine Matrix A P R2 × 2 eine obere bzw. untere Dreiecksmatrix, falls A(2, 1) = 0 bzw. A(1, 2) = 0. Übung 12 Eine Matrix A P R2 × 2 heißt idempotent, falls A2 = A. Zeigen Sie: (a) Jede Projektionsmatrix ist idempotent. (b) Ist A idempotent und keine Diagonalmatrix, so ist spur(A) = 1. Übung 13 (a) Geben Sie Beispiele für Matrizen A P R2 × 2 an mit A ≠ 0 und A2 = 0. (b) Sei A P R2 × 2 mit A2 = 0. Zeigen Sie, dass spur(A) = 0. (c) Sei A P R2 × 2 symmetrisch mit A ≠ 0. Zeigen Sie, dass A2 ≠ 0. © Oliver Deiser Einführung in die Mathematik 1 412 4. Abschnitt Ebene und Raum Übung 14 Seien A, B P R2 × 2 . Zeigen Sie, dass fA B = fA + fB . Übung 15 Welche linearen Abbildungen werden durch Diagonalmatrizen, obere Dreiecksmatrizen bzw. untere Dreiecksmatrizen beschrieben? Geben Sie Beispiele und zeichnen Sie Diagramme zur Illustration. Übung 16 Seien A, B P R2 × 2 Rotationsmatrizen. Dann gilt: (+) A B = B A. (a) Begründen Sie (+) anschaulich durch Betrachtung von Rotationen der Ebene. (b) Beweisen Sie (+) durch Berechnung der Produkte. Übung 17 Seien ϕ, ψ P R und seien rotϕ , rotψ : R2 → R2 die Rotationen der Ebene um die Winkel ϕ bzw. ψ. Neben Sie an, dass rotϕ + rotψ = rotϕ + ψ und leiten Sie hieraus mit Hilfe von Matrizen die Additionstheoreme für den Kosinus und Sinus ab. Übung 18 Sei f : R2 → R2 die Spiegelung am Nullpunkt. Bestimmen Sie die darstellende Matrix A von f. Übung 19 Sei u P R2 normiert und sei f : R2 → R2 die Spiegelung an der durch u definierten Geraden durch den Nullpunkt. Bestimmen Sie die darstellende Matrix A von f. Zeigen Sie zudem, dass A2 = E2 . Wie lässt sich diese Eigenschaft anschaulich erklären? Übung 20 Sei A P R2 × 2 . Zeigen Sie, dass die folgenden Aussagen äquivalent sind: (a) Die Abbildung fA : R2 → R2 ist bijektiv, d. h. für alle u P R2 gibt es genau v P R2 mit fA (v) = u. (b) Die Abbildung fA : R2 → R2 ist surjektiv, d. h. für alle u P R2 gibt es mindestens ein v P R2 mit fA (v) = u. (c) Die Abbildung fA : R2 → R2 ist injektiv, d. h. für alle u P R2 gibt es höchstens ein v P R2 mit fA (v) = u. Einführung in die Mathematik 1 © Oliver Deiser 4. Invertierung und Orthogonalität Wir setzen unsere Untersuchung der (2 × 2)-Matrizen fort. Zunächst betrachten wir inverse Matrizen, mit deren Hilfe wir eindeutig lösbare Gleichungssysteme mit variabler rechter Seite elegant lösen können. Wichtige Beispiele für invertierbare Matrizen stellen die orthogonalen Matrizen dar, die sich durch den Erhalt der Euklidischen Länge auszeichnen. Mit Hilfe der Invertierung können zeigen wir elementar zeigen, dass eine Matrix einen Kreis in eine Ellipse überführt. © Oliver Deiser Einführung in die Mathematik 1 414 4. Abschnitt Ebene und Raum Das Inverse einer Matrix Wir betrachten wieder ein lineares Gleichungssystem (+) a x + b y = u1 c x + d y = u2 das wir mit Hilfe des Matrix-Vektor-Produkts in der Form (++) A v = u, A = ((a, b), (c, d)) notieren. Es ist verführerisch, durch A zu „dividieren“, sodass wir v = A−1 u erhalten und damit das System durch eine einfache Matrix-Vektor-Multiplikation für beliebige rechte Seiten u lösen können. Wir benötigen hierzu eine Matrix B mit BA = E2 = AB. Dann gilt für alle u, v P R2 : A v = u genau dann, wenn v = B u. Denn ist A v = u, so ist v = E2 v = BAv = Bu, und ist v = Bu, so ist Av = ABu = E2 u = u. Diese Überlegungen motivieren: Definition (invertierbar, invers, singulär) Sei A P R2 × 2 . Gibt es ein B P R2 × 2 mit B A = E2 = B A, so heißt A invertierbar und B invers zu A. Andernfalls heißt A singulär. Eine inverse Matrix ist im Fall der Existenz eindeutig bestimmt, denn sind B und C invers zu A, so gilt C = CE2 = C(AB) = (CA)B = E2 B = B. Wir können deswegen folgende Notation einführen: Notation Ist A P R2 × 2 invertierbar, so bezeichnen wir das eindeutige Inverse von A mit A−1 . Für invertierbare A gilt also A A−1 = A−1 A = E2 . Während man für reelle und komplexe Zahlen x ≠ 0 neben x−1 auch 1/x schreibt, ist für Matrizen die Bruchnotation 1/A mangels Kommutativität nicht üblich: B/A = B ⋅ 1/A ist im Allgemeinen von 1/A ⋅ B verschieden, was zu Fehlern führen kann, wenn der Kalkül der Bruchnotation verwendet wird. Beim Rechnen mit inversen Matrizen sind unentbehrlich: Einführung in die Mathematik 1 © Oliver Deiser 4. Invertierung und Orthogonalität 415 Satz (Inversenregeln) Seien A,B P R2×2 invertierbar. Dann sind A−1 und AB invertierbar und es gilt (A−1 )−1 = A, (A B)−1 = B−1 A−1 . Beweis Es gilt AA−1 = E2 = A−1 A, sodass nach Definition des Inversen A invers zu A−1 ist, d.h. (A−1 )−1 = A. Zur zweiten Regel berechnen wir (B−1 A−1 ) (AB) = B−1 A−1 A B = B−1 E2 B = B−1 B = E2 . Ebenso zeigt man, dass (AB)(B−1 A−1 ) = E2 . Damit ist B−1 A−1 invers zu AB. Der Leser beachte, dass sich bei der Invertierung von AB die Reihenfolge umkehrt. Im Allgemeinen ist (AB)−1 ≠ A−1 B−1 . Für Gleichungssysteme zeigt obige Überlegung: Lösung durch Invertierung Ist A invertierbar, so wird für alle rechten Seiten u das System A (x, y) = u eindeutig durch den Vektor A−1 u gelöst. Ist das System nicht eindeutig lösbar (d.h. det(A) = 0), so ist also A singulär. Im eindeutig lösbaren Fall (d. h. det(A) ≠ 0) erweist sich umkehrt A als invertierbar, sodass die eindeutige Lösbarkeit äquivalent zur Invertierbarkeit von A ist. Es gibt verschiedene Möglichkeiten, dies zu zeigen. Eine davon verwendet: Definition (Komplementärmatrix) Sei A P R2 × 2 . Dann setzen wir A# = d −b −c a , wobei A = a b c d . Die Matrix A# heißt die Komplementärmatrix von A. Mit Hilfe der Komplementärmatrix können wir das Inverse einer Matrix im Fall der Existenz leicht ermitteln und einen Zusammenhang zur Determinante herstellen: Satz (Komplementärmatrix und Determinante) Sei A P R2 × 2 . Dann gilt: (a) A# A = A A# = det(A) E2 . (b) A ist genau dann invertierbar, wenn det(A) ≠ 0. In diesem Fall ist A−1 = det(A)−1 A# . © Oliver Deiser Einführung in die Mathematik 1 416 4. Abschnitt Ebene und Raum Beweis Es gilt A A# = a b d −b c d −c a = ad − bc ab − ab cd − cd ad − bc = det(A) E2 . Analog ist A# A = det(A) E2 . Ist det(A) ≠ 0, so ist det(A)−1 A# das Inverse von A nach (a). Ist det(A) = 0, so ist A nach obigen Überlegungen nicht invertierbar. Dies zeigt (b). Zum Beweis von (b) kann man auch den Multiplikationssatz für Determinanten verwenden: Ist A invertierbar, so gilt det(A) det(A−1 ) = det(AA−1 ) = det(E2 ) = 1, sodass det(A) ≠ 0. Die Berechnung zeigt auch, dass det(A−1 ) = det(A)−1 . Beispiel zur Invertierung 2 −1 Für A = 1 gilt det(A) = 3 und A# = 1 1 1 −1 2 , sodass A−1 = 1 3 1 1 −1 2 . Ae2 Ae1 Be2 Be1 Die zu A und B = A−1 gehörigen Koordinatensysteme Einführung in die Mathematik 1 © Oliver Deiser 4. Invertierung und Orthogonalität 417 Beispiel zur Lösung eines Gleichungssystems durch Invertierung Das Gleichungssystem (+) x + y = 1 2 x + 3 y = −1 besitzt die Koeffizientenmatrix A = ((1, 2); (1, 3)) mit det(A) = 1. Damit ist A invertierbar mit A−1 = det(A)−1 A# = A# , sodass 3 −1 A−1 = A# = −2 1 . Die eindeutige Lösung des Systems ist A−1 1 = −1 3 −1 1 −2 1 −1 = 4 −3 . Der Vektor (4, −3) ist (1) der Schnittpunkt der beiden durch die Gleichungen des Systems (+) definierten Geraden, (2) der Koordinatenvektor von (1, −1) bzgl. (Ae1 , Ae2 ), (3) der Vektor mit den Koordinaten (1, −1) bzgl. A−1 e1 und A−1 e2 . 4 Ae2 3 2 Ae1 A-1 e2 1 -3 -2 -1 1 2 3 4 5 -1 -2 A-1 e1 -3 -4 Mit Hilfe von A−1 lässt sich das System (+) nun auch für beliebige andere rechte Seiten ohne Neuberechnung lösen. © Oliver Deiser Einführung in die Mathematik 1 418 4. Abschnitt Ebene und Raum Charakterisierungen der Invertierbarkeit Wir sammeln die Äquivalenzen, die im Verlauf unserer Untersuchungen aufgetreten sind oder sich aus ihnen mehr oder weniger direkt ergeben: Satz (Äquivalenzen zur Invertierbarkeit) Sei A P R2 × 2 . Dann sind äquivalent: (a) A ist invertierbar. (b) det(A) ≠ 0. (c) Die Spalten von A sind nicht kollinear. (d) Die Zeilen von A sind nicht kollinear. (e) Für alle u ist das System Av = u eindeutig lösbar in v. (f ) Für alle u ist das System Av = u lösbar in v. (g) Das homogene System Av = 0 ist eindeutig lösbar (durch den Nullvektor). (h) Der Nullvektor ist der einzige Vektor, der durch fA : R2 → R2 auf den Nullvektor abgebildet wird. (i) fA : R2 → R2 ist injektiv. (j) fA : R2 → R2 ist surjektiv. (k) fA : R2 → R2 ist bijektiv. Explizit hervorheben möchten wir noch: Satz (einseitige Inverse genügen) Sei A P R2 × 2 . Es gebe ein B P R2 × 2 mit AB = E2 . Dann ist A invertierbar und es gilt B = A−1 . Eine analoge Aussage gilt, wenn ein C P R2 × 2 existiert mit CA = E2 . Beweis Nach dem Multiplikationssatz für Determinanten gilt 1 = det(E2 ) = det(AB) = det(A) det(B), sodass det(A) ≠ 0. Folglich ist A invertierbar. Weiter folgt aus der Voraussetzung AB = E2 , dass B = E2 B = A−1 A B = A−1 E2 = A−1 . Die Behauptung über linksseitige Inverse C wird analog bewiesen. Einführung in die Mathematik 1 © Oliver Deiser 4. Invertierung und Orthogonalität 419 Orthogonale Matrizen Gilt A = (a1 , a2 ) und B = (b1 ; b2 ), so können wir das durch „Zeile mal Spalte“ gebildete Matrizenprodukt AB schreiben als AB = 〈a1 , b1 〉 〈a1 , b2 〉 〈a2 , b1 〉 〈a2 , b2 〉 = ( 〈ai, bj 〉 )1 ≤ i, j ≤ 2. Speziell gilt wegen At = (a1 ; a2 ), dass A At = 〈a1 , a1 〉 〈a1 , a2 〉 〈a2 , a1 〉 〈a2 , a2 〉 . Hieraus lesen wir ab: (1) A At ist genau dann eine Diagonalmatrix, wenn die Spaltenvektoren von A senkrecht aufeinander stehen. (2) A At ist genau dann die Einheitsmatrix E2 , wenn die Spaltenvektoren von A senkrecht aufeinander stehen und zudem normiert sind. Im Fall (2) ist also A invertierbar und At invers zu A. Wir definieren: Definition (orthogonal) Eine Matrix A P R2 × 2 heißt orthogonal, wenn die Spaltenvektoren von A orthogonal zueinander und normiert sind. Eine Matrix A = (v1 , v2 ) ist also genau dann orthogonal, wenn 〈vi , vj 〉 = δij für alle 1 ≤ i, j ≤ 2. Dabei ist δij wieder das Kronecker-Delta, also δij = 0 falls i ≠ j und δij = 1, falls i = j. Der folgende Satz gibt eine Reihe von Charakterisierungen der Orthogonalität: Satz (Charakterisierungen der Orthogonalität) Sei A P R2 × 2 . Dann sind äquivalent: (a) A ist orthogonal. (b) A−1 = At , d. h. A und At sind invers zueinander. (c) At ist orthogonal, d. h. die Zeilenvektoren von A sind orthogonal und normiert. (d) Für alle v P R2 gilt i A v i = i v i. (e) Für alle v, w P R gilt 〈A v, A w〉 = 〈v, w〉. 2 © Oliver Deiser (Erhalt der Länge) (Erhalt des Skalarprodukts) Einführung in die Mathematik 1 420 4. Abschnitt Ebene und Raum Beweis Die Äquivalenz von (a) und (b) haben wir oben schon gezeigt. Damit ist At genau dann orthogonal, wenn At und (At )t = A invers zueinander sind, d. h. wenn A orthogonal ist. (b) impliziert (d): Es gelte A−1 = At . Dann gilt für alle v P R2 . i Av i 2 = 〈Av, Av〉 = 〈v, At A v〉 = 〈v, E2 v〉 = 〈v, v〉 = i v i 2 . (d) impliziert (e): Es gelte i A v i = i v i für alle v P R2 . Dann gilt für alle v, w P R2 unter zweimaliger Verwendung der Polarisationsformel: 4 〈v, w〉 = i v + w i 2 − i v − w i 2 = i A(v + w) i 2 − i A(v − w) i 2 = i A v + A w i 2 − i A v − A w i 2 = 4 〈Av, Aw〉. (e) impliziert (a): Gilt (e), so gilt 〈A ei , A ej 〉 = 〈ei , ej 〉 = δij für 1 ≤ i, j ≤ 2. Damit sind die Spalten A e1 und A e2 von A orthogonal und normiert. Die Orthogonalität einer Matrix ist nach dem Satz äquivalent dazu, dass das Matrix-Vektor-Produkt das Skalarprodukt erhält. Daraus folgt, dass Längen und Winkel erhalten bleiben. Während der Erhalt der Länge äquivalent zur Orthogonalität ist, ist der Erhalt der Winkel nicht hinreichend für die Orthogonalität. Ist zum Beispiel A = 2E2 , also Av die Streckung von v um den Faktor 2, so bleiben Winkel erhalten, aber A ist nicht orthogonal. Ist A = (v; w) orthogonal, so ist v normiert und folglich gibt es ein ϕ P [ 0, 2π [ mit v = (cos ϕ, sin ϕ). Da w ebenfalls normiert ist und senkrecht auf v steht, gilt w = rotπ/2 (v) oder w = rot−π/2 (v). Damit ist w = (−sin ϕ, cos ϕ) oder w = (sin ϕ, −cos ϕ). Die Überlegung zeigt: Satz (Klassifikation der orthogonalen Matrizen) Sei A P R2 × 2 orthogonal. Dann gibt es ein ϕ P [ 0, 2π [ mit A = cos ϕ −sinϕ sin ϕ cosϕ oder A = cos ϕ sinϕ sin ϕ −cosϕ . Im ersten Fall gilt det(A) = 1, im zweiten det(A) = −1. Ist A orthogonal und det(A) = 1, so ist A v für alle v P R2 der um den Winkel ϕ gedrehte Vektor v. Im Fall det(A) = −1 ist A v für alle v P R2 der an der Geraden durch 0 mit Winkel ϕ/2 gespiegelte Vektor v (Übung). Wir nennen die Matrix A entsprechend eine Rotationsmatrix oder Spiegelungsmatrix. Spiegelungsmatrizen sind nicht nur orthogonal, sondern auch symmetrisch. Eine Rotationsmatrix ist nur dann symmetrisch, wenn ϕ = 0 oder ϕ = π. Einführung in die Mathematik 1 © Oliver Deiser 4. Invertierung und Orthogonalität e2 421 Ae1 /2 /2 e1 Ae2 A= cos ϕ sinϕ sin ϕ −cosϕ bewirkt eine Spiegelung an der Geraden mit Winkel ϕ/2 Die Spiegelung an der Geraden mit Winkel ϕ/2 lässt sich auch auffassen als eine Spiegelung an der x-Achse gefolgt von der Rotation um den Winkel ϕ. Denn die Spiegelung an der x-Achse wird dargestellt durch die Matrix (e1 ; −e2 ) und es gilt cos ϕ −sinϕ 1 0 sin ϕ 0 −1 cosϕ = cos ϕ sinϕ sin ϕ −cosϕ . Das Produkt C = A B zweier orthogonaler Matrizen A und B ist stets wieder eine orthogonale Matrix, da Ct = (AB)t = Bt At = B−1 A−1 = (AB)−1 = C−1 . Nach dem Multiplikationssatz für Determinanten ist C eine Rotation, wenn sowohl A und B von gleichen Typ sind (beide Rotationen oder beide Spiegelungen). Sind die Typen von A und B gemischt, so ist C eine Spiegelung. Mit Hilfe der Additionstheoreme berechnet sich das Produkt zweier Spiegelungen zu cos ϕ sinϕ sin ϕ −cosϕ © Oliver Deiser cos ψ sinψ sin ψ −cosψ = cos χ sinχ sin χ −cosχ mit χ = ϕ − ψ. Einführung in die Mathematik 1 422 4. Abschnitt Ebene und Raum Matrizen und Ellipsen, I Wir zeigen nun so elementar wie möglich, dass das Bild des Einheitskreises unter einer Matrix eine Ellipse ist. Satz (Bild des Einheitskreises unter einer Matrix) Sei A = ((a, c); (b, d)) = (u1 , u2 ) P R2 × 2 invertierbar, und sei K der Einheitskreis. Dann ist E = A[ K ] eine Ellipse. Es gilt die Kegelschnittdarstellung (+) E = { (x, y) P R2 | (c2 + d2 )x2 − 2(ac + bd) x y + (a2 + b2 )y2 = det(A)2 }. Beweis Sei A−1 = det(A)−1 A# , mit A# = ((d, −b), (−c, a)). Dann gilt E = { Av | v P K } = { v | A−1 v P K } = { v | i A−1 v i = 1 }. Für alle v = (x, y) P R2 gilt det(A)2 iA−1 vi 2 = iA# vi 2 = (dx − by)2 + (−cx + ay)2 = (c2 + d2 )x2 − 2(ac + bd) x y + (a2 + b2 )y2 . Damit ist die Darstellung (+) von E gezeigt. Als ein in ein Parallelogramm einbeschriebener Kegelschnitt ist E notwendig eine Ellipse. Im nächsten Kapitel werden wir einen zweiten Beweis kennenlernen, der Kegelschnitte nicht heranzieht. Die Ellipse E = A[ K ] ist genau dann achsenparallel, wenn die Zeilen der Matrix senkrecht aufeinander stehen (was nicht notwendig die Orthogonalität der Spalten nach sich zieht), und genau dann ein Kreis, wenn zusätzlich ihre Längen übereinstimmen. Der singuläre Fall Ist A singulär und R das K umgebende achsenparallele Quadrat, so ist A[ R ] ein Geradenstück (ein degeneriertes Parallelogramm) und A [ K ] ein Teilstück von A [ R ] (eine degenerierte Ellipse, bei der eine Halbachse 0 ist). Die Darstellung (+) ist dann nicht mehr gültig. Für A = ((1, 0); (1, 0)) ist zum Beispiel A[ R ] das Geradenstück auf der x-Achse von −2 bis 2 und A[ K ] das Geradenstück auf der x-Achse von −£2 bis £2, während die Menge { (x, y) P R2 | 2y2 = 0 } in (+) die gesamte x-Achse ist. Die folgenden Berechnungen gelten auch für det(A) = 0, und wir bezeichnen zur Vereinfachung die Menge A [ K ] stets als Ellipse. Die Darstellung (+) wird nicht benötigt. Einführung in die Mathematik 1 © Oliver Deiser 4. Invertierung und Orthogonalität 423 Bestimmung der Halbachsen Die Halbachsen von E sind im Allgemeinen nicht durch Ae1 und Ae2 gegeben: Das Beispiel a = 2, b = −2, c = d = 1 zeigt, dass dies selbst für achsenparallele Ellipsen nicht gelten muss: 2 Ae2 -4 -3 Ae1 1 -2 -1 E 1 2 3 4 -1 -2 A[R] Um die Lage von E zu bestimmen, durchlaufen wir den Einheitskreis K mit der Funktion f : [ 0, 2π[ → K, f(t) = (cos t, sin t), und die Ellipse E = A[ K ] mit der Funktion g : [ 0, 2π [ → E, g(t) = A f(t) = A cos t sin t = a cos t + b sin t c cos t + d sin t . Der Durchlauf der Ellipse startet im Punkt g(0) = Ae1 = (a, c) und verläuft über g(π/2) = A e2 = (b, d), g(π) = −A e1 , g(3π/2) = −A e2 , sodass g(t) das Parallelogramm A[ R ] zu den Zeiten 0, π/2, π, 3π/2 berührt. Die Durchlaufrichtung entspricht der Orientierung der Spaltenvektoren von A. Bei den als Vektoren aufgefassten Halbachsen von E erreicht die Euklidische Norm von g(t) bzw. gleichwertig ihr Quadrat ein lokales Extremum. Um die Nullstellen der Ableitung von i g(t) i 2 zu ermitteln, stellen wir diese Norm zuerst in einer geeigneten Form dar. Unter Verwendung der Verdopplungsformeln cos2 t − sin2 t = cos(2t), 2 cos t sin t = sin(2t), 2 cos2 t = cos(2t) + 1 berechnen wir © Oliver Deiser Einführung in die Mathematik 1 424 4. Abschnitt Ebene und Raum ig(t)i 2 = (a cos t + b sin t)2 + (c cos t + d sin t)2 = a2 cos2 t + 2ab cos t sin t + c2 cos2 t + 2cd cos t sin t + d2 sin2 t = (a2 + c2 ) cos2 t + (b2 + d2 ) sin2 t + (ab + cd) sin(2t) = (a2 + c2 − b2 − d2 ) cos2 t + (ab + cd) sin(2t) + b2 + d2 = (a2 + c2 − b2 − d2 )/2 cos(2t) + (ab + cd) sin(2t) + (a2 + b2 + c2 + d2 )/2 = τ + w1 cos(2t) + w2 sin(2t) = τ + 〈w, f(2t)〉, wobei (++) a2 + c2 − b2 − d2 , w2 = ab + cd, 2 w1 = τ = a2 + b2 + c2 + d2 . 2 Damit können wir nun die Ableitung sehr einfach berechnen. Mit der Drehung rot−π/2 (w) = (w2 , −w1 ) im Uhrzeigersinn ist 1 2 d i g(t) i 2 = − w1 sin(2t) + w2 cos(2t) = 〈rot−π/2 (w), f(2t)〉. dt Im Fall w = 0 ist i g(t) i 2 konstant gleich τ und die Ellipse E ein Kreis mit Radius £τ. Sei also w ≠ 0. Dann ist die berechnete Ableitung genau dann 0, wenn die Vektoren rot−π/2 (w) und f(2t) orthogonal und damit w und f(2t) kollinear sind. Seien also t1 , t2 derart, dass f(2t1 ) = (cos(2t1 ), sin(2t1 )) = ŵ, f(2t2 ) = (cos(2t2 ), sin(2t2 )) = − ŵ. Einsetzen in i g(t) i 2 = τ + 〈w, f(2t)〉 zeigt, dass sich die Längen h1 und h2 der Halbachsen von E wie folgt berechnen lassen: (+++) h1 = i g(t1 ) i = £τ + 〈w, ŵ〉 = £τ + i w i , h2 = i g(t2 ) i = £τ − 〈w, ŵ〉 = £τ − i w i . Die Halbachsen von E werden zu den Zeiten s1 = arg(σ w)/2 P [ 0, π/2 [, s2 = s1 + π/2, s3 = s1 + π, s4 = s2 + π erreicht, wobei wir σ P { 1, −1 } so wählen, dass σ w im ersten oder zweiten Quadranten liegt (d.h. σ = 1 genau dann, wenn w2 ≥ 0). Dann sind t1 und t2 zwei dieser Zeiten und die Halbachsen lassen sich darstellen als g(s1 ) = A cos s1 sin s1 = −A Einführung in die Mathematik 1 cos s3 sin s3 , g(s2 ) = A cos s2 sin s2 = −A cos s4 sin s4 . © Oliver Deiser 4. Invertierung und Orthogonalität 425 Beispiel Wir bestimmen die Ellipse E = A [ K ] der Matrix A = 4 1 1 2 . Mit obigen Bezeichnungen gilt: w1 = 6, w2 = 5, τ = 11, i w i = 6£2, s s h1 = 11 + 6£2 , 4,41, h1 = 11 − 6£2 , 1,59, s1 = π/8, s2 = s1 + π/2. 3 Ae2 = g( /2) 2 g(s1 ) g(s2 ) h1 1 Ae1 = g(0) h2 -5 -4 -3 -2 -1 1 E 2 3 4 5 -1 g(s3 ) -2 g(s4 ) -3 Verschiedene Matrizen können die gleiche Ellipse erzeugen. Die Ellipse E des Beispiels können wir zum Beispiel auch erhalten, indem wir die achsenparallele Ellipse mit den Halbachsenlängen h1 und h2 um das Argument ϕ von g(s1 ) gegen den Uhrzeigersinn drehen. Damit ist E auch die Ellipse der Matrix B = cos ϕ sinϕ sin ϕ −cosϕ h1 0 0 h2 = h1 cos ϕ h2 sin ϕ h1 sin ϕ −h2 cosϕ . Im Gegensatz zu A startet der Durchlauf gB von E bzgl. B in einem Halbachsenvektor, nämlich in Be1 = gA (s1 ). s © Oliver Deiser Einführung in die Mathematik 1 426 4. Abschnitt Ebene und Raum Übungen Übung 1 Lösen Sie sowohl durch Elimination als auch durch Invertierung der Koeffizientenmatrix das Gleichungssystem 4x + 2 y = 1 2 x + 3 y = −1 Übung 2 Sei A P R2 × 2 . Zeigen Sie, dass A genau dann invertierbar ist, wenn fA : R2 → R2 eine Umkehrfunktion besitzt, und dass in diesem Fall fA−1 = (fA )−1 . Übung 3 Geben Sie möglichst einfache Kriterien dafür an, wann eine Diagonalmatrix, eine obere Dreiecksmatrix bzw. eine untere Dreiecksmatrix invertierbar ist. Begründen Sie ihre Antwort und geben Sie Formeln für die Inversen an. Dabei heißt eine Matrix A P R2 × 2 eine obere (untere) Dreiecksmatrix, falls a21 = 0 (a12 = 0). Übung 4 Zeigen oder widerlegen Sie, dass für alle A, B, C P R2 × 2 gilt: (a) Sind A, B invertierbar und ist C = A + B, so ist C invertierbar. (b) Sind A, B invertierbar und ist C = AB, so ist C invertierbar. (c) Ist C = A + B und ist C invertierbar, so sind A und B invertierbar. (d) Ist C = AB und ist C invertierbar, so sind A und B invertierbar. Übung 5 Sei A P R2 × 2 invertierbar. Zeigen Sie, dass At invertierbar ist mit (At )−1 = (At )−1 . Übung 6 Sei A P R2 × 2 eine symmetrische Matrix, deren Diagonaleinträge von Null verschieden sind und unterschiedliche Vorzeichen haben. Zeigen Sie, dass A invertierbar ist. Einführung in die Mathematik 1 © Oliver Deiser 4. Invertierung und Orthogonalität 427 Übung 7 Sei A P R2 × 2 . Zeigen Sie, dass die folgenden Aussagen äquivalent sind: (a) A ist invertierbar. (b) Es gibt ein n ≥ 1 derart, dass An invertierbar ist. (c) Für alle n ≥ 1 ist An invertierbar. Übung 8 Sei A P R2 × 2 invertierbar. Zeigen Sie, dass die Spaltenvektoren von A genau dann positiv orientiert sind, wenn dies für A−1 gilt. Zeigen Sie zudem, dass diese Äquivalenz auch für die Zeilenvektoren gilt. Übung 9 Bestimmen Sie alle invertierbaren Matrizen A P R2 × 2 mit A = A−1 . Übung 10 Seien A, B P R2 × 2 mit A = 2B − E2 . Zeigen Sie, dass die folgenden Aussagen äquivalent sind: (a) A2 = A (d. h. A = A−1 ). (b) B2 = B. Übung 11 Geben Sie eine Matrix A P R2 × 2 an, die orthogonale Zeilen und nicht orthogonale Spalten besitzt. Übung 12 Sei A = ((a, b), (c, d)) P R2 × 2 orthogonal, und sei ϕ P [ 0, 2π [ mit (a, c) = (cos ϕ, sin ϕ). Zeigen Sie, dass für alle v P R2 gilt: (a) Ist det(A) = 1, so ist A v der um den Winkel ϕ (gegen den Uhrzeigersinn) gedrehte Vektor v. (b) Ist det(A) = −1, so ist A v der an der Geraden durch 0 mit Winkel ϕ/2 gespiegelte Vektor v. Übung 13 Sei A P R2 × 2 . Zeigen Sie, dass die folgenden Aussagen äquivalent sind: (a) Die Spalten von A sind orthogonal und haben die gleiche Länge λ>0. (b) A ist winkeltreu, d. h. es gilt ](v, w) = ](Av, Aw) für alle v, w P R2 mit v, w ≠ 0. © Oliver Deiser Einführung in die Mathematik 1 428 4. Abschnitt Ebene und Raum Übung 14 Seien A und w wie bei der Analyse von E = A[ K ]. Zeigen Sie, dass 2 i w i 2 = ( (a + d)2 + (b − c)2 ) ( (a − d)2 + (b + c)2 ) . Folgern Sie hieraus, dass die Längen der Halbachsen der zu A und At gehörigen Ellipsen übereinstimmen. Übung 15 Sei A = ((a, c); (b, d)) = (u1 , u2 ) P R2 × 2 invertierbar, und sei E = A[ K ] das Bild des Einheitskreises unter A. Zeigen Sie: E = { (x, y) P R2 | i At rotπ/2 (x, y) i 2 = det(A)2 }. Übung 16 Sei A P R2 ×2 , und sei g : [ 0, 2π [ → E die betrachtete Parametrisierung der Ellipse E = A[ K ]. Weiter seien g1 , g2 : [ 0, 2π [ → R definiert durch (g1 (t), g2 (t)) = g(t) = A (cos t, sin t). Berechnen Sie g′(t) = (g1 ′(t), g2 ′(t)) und zeigen Sie, dass der Vektor g′(t) zu den Zeitpunkten 0, π/2, π und 3π/2 in Richtung der Seiten des E umschließenden Parallelogramms A[ R ] zeigt. Dabei ist R wieder das K umschließende achsenparallele Quadrat. Einführung in die Mathematik 1 © Oliver Deiser 5. Eigenwerte und Spektralsatz Wir untersuchen nun diejenigen vom Nullvektor verschiedenen Vektoren, die bei der Multiplikation mit einer gegebenen Matrix nur skaliert werden, sodass ihre Richtung abgesehen vom einem Vorzeichen unverändert bleibt. Vektoren mit dieser Eigenschaft heißen Eigenvektoren der Matrix und die zugehörigen Skalare ihre Eigenwerte. Ein fundamentales Ergebnis über Eigenvektoren und Eigenwerte ist der Spektralsatz. Er besagt, dass jede symmetrische Matrix zwei zueinander orthogonale Eigenvektoren besitzt. Aus dem Spektralsatz gewinnen wir die Singulärwertzerlegung, mit deren Hilfe wir jede Matrix multiplikativ in drei Matrizen aufspalten können, die die Abbildungsdynamik der Matrix übersichtlich und anschaulich beschreiben. © Oliver Deiser Einführung in die Mathematik 1 430 4. Abschnitt Ebene und Raum Eigenwerte und Eigenvektoren Sei A P R2×2 . Für jeden Vektor v der Ebene ist Av wieder ein Vektor der Ebene und zudem eine Linearkombination der Spaltenvektoren von A. Für manche Vektoren v kann ein besonders einfacher Zusammenhang zwischen v und Av bestehen. Beispiele sind: Av = v Fixpunkt Av = −v Spiegelung am Nullpunkt Av = rotπ/2 (v) = (−v2 , v1 ) Drehung um π/2 gegen den Uhrzeigersinn Für die Theorie der Matrizen ist der Fall einer Skalierung, d. h. A v = λv für ein λ P R, von großer Bedeutung. Wir definieren: Definition (Eigenwert, Eigenvektor, Eigenpaar) Seien A P R2 × 2 , λ P R und v P R2 mit v ≠ 0. Dann heißt λ ein Eigenwert und v ein zu λ gehöriger Eigenvektor von A, falls A v = λ v. Weiter heißt (λ, v) ein Eigenpaar von A. Ein Eigenwert kann der Skalar 0 sein, ein Eigenvektor ist nach Definition dagegen immer vom Nullvektor verschieden. Der Grund für diese Einschränkung ist, dass A 0 = 0 = λ 0 für alle λ P R gilt, sodass jeder Skalar ein Eigenwert von A wäre, wenn wir den Nullvektor als Eigenvektor zulassen würden. Ist v ein Eigenvektor von A zum Eigenwert λ, so gilt A(µv) = µ A v = µ λ v = λ (µ v) für alle µ P R, sodass für µ ≠ 0 auch µv ein Eigenvektor von A zum Eigenwert λ ist. Insbesondere ist der normierte Vektor v̂ ein Eigenvektor von A zum Eigenwert λ. 3 Av = 2v w 2 v 1 -5 -4 -3 -2 -1 1 2 3 4 5 -1 -2 Aw = -w -3 (2, v) und (−1, w) sind Eigenpaare von A Einführung in die Mathematik 1 © Oliver Deiser 5. Eigenwerte und Spektralsatz 431 Beispiele (1) Für die Einheitsmatrix E2 ist jeder Vektor v ≠ 0 ein Eigenvektor zum Eigenwert 1. (2) Für eine Diagonalmatrix A = ((a, 0), (0, d) ist e1 ein Eigenvektor zum Eigenwert a und e2 ein Eigenvektor zum Eigenwert d. (3) Ist A eine Rotationsmatrix um den Winkel ϕ P ] 0, 2π [ mit ϕ ≠ π, so hat A keine Eigenwerte und Eigenvektoren. (4) Beschreibt A die Spiegelung an einer Geraden G(v) = span(v), so ist v ein Eigenvektor von A zum Eigenwert 1 und rotπ/2 (v) = (−v2 , v1 ) ein Eigenvektor von A zum Eigenwert −1. (5) Ist Av = 0 und v ≠ 0, so ist v ein Eigenvektor zum Eigenwert 0. Damit ist 0 genau dann ein Eigenwert von A, wenn A singulär ist. Berechnung der Eigenwerte und Eigenvektoren Sei nun A = ((a, b), (c, d)) P R2 × 2 . Wie stellt man fest, ob A Eigenwerte besitzt und wie berechnet man Eigenwerte und Eigenvektoren im Fall der Existenz? Wir beobachten hierzu, dass für alle λ P R und alle v P R2 gilt: Av = λv genau dann, wenn (A − λE2 ) v = 0. Setzen wir also A λ = A − λ E2 = a b c d − λ 0 0 λ = a−λ b c d−λ für alle λ P R, so ist λ genau dann ein Eigenwert von A, wenn das homogene Gleichungssystem Aλ v = 0 eine vom Nullvektor verschiedene Lösung v besitzt, also nicht eindeutig lösbar ist. Dies ist äquivalent dazu, dass det(A λ ) = 0. Für alle λ P R gilt: det(A λ ) = (a − λ)(d − λ) − bc = λ2 − (a + d) λ + ad − bc = λ2 − spur(A) λ + det(A). Diese Überlegung motiviert: Definition (charakteristisches Polynom) Sei A P R2 × 2 . Dann heißt das Polynom pA : R → R zweiten Grades mit pA (λ) = λ2 − spur(A) λ + det(A) für alle λ P R das charakteristische Polynom von A. Die Eigenwerte von A sind genau die reellen Nullstellen des charakteristischen Polynoms von A. Die Lösungsformel für quadratische Gleichungen und die Formeln von Vieta liefern: © Oliver Deiser Einführung in die Mathematik 1 432 4. Abschnitt Ebene und Raum Satz (Existenz von Eigenwerten) Sei A P R2 × 2 . Dann besitzt A genau dann reelle Eigenwerte, wenn (+) D = spur(A)2 − 4det(A) = (a − d)2 + 4bc ≥ 0. In diesem Fall sind die Eigenwerte gegeben durch λ1,2 = spur(A) ± £D . 2 Es gilt λ1 + λ2 = spur(A) und λ1 λ2 = det(A). Weiter gilt λ1 = λ2 = spur(A)/2 genau dann, wenn D = 0. Zugehörige Eigenvektoren finden wir durch Lösen der Gleichungssysteme A λ1 v = 0 und A λ2 v = 0, die im Fall λ1 = λ2 zusammenfallen. Beispiel: Bestimmung von Eigenpaaren 1 1 Sei A = . Dann gilt 2 1 pA (λ) = λ2 − 2λ − 1, D = 8, £D = 2£2, λ1,2 = 1 ± £2. Nichttriviale Lösungen der homogen Gleichungssysteme Aλ1 v = −£2 1 2 −£2 = 0, Aλ2 v = £2 1 2 £2 = 0 sind v1 = (1, £2) und v2 = (1 , −£2). Damit sind (λ1 , v1 ) und (λ2 , v2 ) Eigenpaare von A. 6 pA ( ) 4 2 2 -3 -2 -1 1 1 2 3 4 5 -2 Das charakteristische Polynom von A Einführung in die Mathematik 1 © Oliver Deiser 5. Eigenwerte und Spektralsatz 433 Der Spektralsatz Aus der Form (+) der Diskriminante D des obigen Satzes lesen wir ab, dass Eigenwerte existieren, falls det(A) ≤ 0 oder bc ≥ 0. Letztere Bedingung ist für jede symmetrische Matrix erfüllt, da dann bc = b2 ≥ 0. Damit besitzt jede symmetrische Matrix A P R2 × 2 reelle Eigenwerte λ1 und λ2 . Diese Eigenwerte sind genau dann gleich, wenn D = (a − d)2 + b2 = 0, d. h. wenn a = d und b = 0 (sodass A ein skalares Vielfaches von E2 ist). Damit können wir den folgenden fundamentalen Satz beweisen: Satz (Spektralsatz) Sei A P R2 × 2 . Dann sind äquivalent: (a) A ist symmetrisch. (b) Es gibt zueinander orthogonale Eigenvektoren v und w von A. Beweis (a) impliziert (b): Sei A symmetrisch. Nach obigen Überlegungen besitzt A reelle Eigenwerte λ1 und λ2 . Gilt λ1 = λ2 = λ, so gilt A = λ E2 und v = e1 = (1, 0) und w = e2 = (0, 1) sind orthogonale Eigenvektoren von A. Es gelte also λ1 ≠ λ2 . Seien v und w Eigenvektoren von A zu λ1 bzw. λ2 . Da A symmetrisch ist, gilt At = A. Damit erhalten wir λ1 〈v, w〉 = 〈λ1 v, w〉 = 〈Av, w〉 = 〈v, At w〉 = 〈v, Aw〉 = 〈v, λ2 w〉 = λ2 〈v, w〉. Folglich ist (λ1 − λ2 ) 〈v, w〉 = λ1 〈v, w〉 − λ2 〈v, w〉 = 0. Wegen λ1 ≠ λ2 gilt also 〈v, w〉 = 0, sodass v und w orthogonal sind. (b) impliziert (a): Seien v und w orthogonale und ohne Einschränkung normierte Eigenvektoren von A zu den Eigenwerten λ1 bzw. λ2 . Seien (α, β), (γ , δ) die Koordinatenvektoren von e1 , e2 bzgl. der Basis (v, w), d. h. e1 = αv + βw, e2 = γ v + δw. Dann gilt wegen 〈v, w〉 = 〈w, v〉 = 0, dass a12 = 〈e1 , Ae2 〉 = 〈e1 , A(γ v + δw)〉 = 〈αv + βw, λ1 γ v + λ2 δ w〉 = λ1 α γ 〈v, v〉 + λ2 β δ 〈w, w〉 = λ1 αγ + λ2 βδ, a21 = 〈Ae1 , e2 〉 = 〈A(αv + βw), e2 〉 = 〈λ1 α v + λ2 β w, γ v + δw〉 = λ1 α γ 〈v, v〉 + λ2 β δ 〈w, w〉 = λ1 α γ + λ2 β δ. Dies zeigt, dass a12 = a21 . Folglich ist A symmetrisch. © Oliver Deiser Einführung in die Mathematik 1 434 4. Abschnitt Ebene und Raum Beispiel: Bestimmung von Eigenpaaren für eine symmetrische Matrix Wir betrachten die symmetrische Matrix A = a b b d = 4 2 2 1 . Es gilt D = (a − d)2 + 4b2 = 25, £D = 5. Damit besitzt A die Eigenwerte λ1,2 = spur(A) ± £D 2 = 5±5 , 2 sodass λ1 = 5 und λ2 = 0. Nichttriviale Lösungen von Aλ1 v = −1 2 2 −4 v = 0, Aλ2 w = 4 2 2 1 w = 0 sind v = (2, 1) und w = (−1, 2). Damit sind (λ1 , v) und (λ2 , w) Eigenpaare der Matrix A. Es gilt 〈v, w〉 = 〈(2, 1), (−1, 2)〉 = 0, sodass v und w orthogonal sind, wie es nach dem Spektralsatz sein muss. Diese Ergebnisse lassen sich auch anders gewinnen: Wegen det(A) = 0 ist A singulär und 0 ein Eigenwert von A. Für das homogene Gleichungssystem Aw = 0 können wir w = (−1, 2) als eine nichttriviale Lösung ablesen. Nach dem Spektralsatz muss der zu v orthogonale Vektor v = rot−π/2 (w) = (2, 1) ein weiterer Eigenvektor von A sein. Wegen Av = (10, 5) = 5v ist 5 der zweite Eigenwert von A. Allgemein gilt für jede symmetrische Matrix A P R2 × 2 : Ist v ein Eigenvektor von A, so auch rotπ/2 (v) (oder rot−π/2 (v)). Die Berechnung von Av und Arotπ/2 (v) ergibt die zugehörigen Eigenwerte. Diese Argumentation ist aber auf die Dimension n = 2 beschränkt, da nur hier die Menge aller zu einem Vektor v ≠ 0 orthogonalen Vektoren der Spann eines einzigen Vektors ist. Diagonalisierung symmetrischer Matrizen Der Spektralsatz besagt, dass sich jede symmetrische Matrix hinsichtlich gewisser orthogonaler und normierter Vektoren so verhält wie eine Diagonalmatrix hinsichtlich der kanonischen Basisvektoren. Um dies zu präzisieren, betrachten wir eine symmetrische Matrix A mit Eigenwerten λ1 und λ2 und zugehörigen normierten Eigenvektoren v und w. Wir setzen D = diag(λ1 , λ2 ) = λ1 0 0 λ2 Einführung in die Mathematik 1 , S = (v, w) = v1 v2 w1 w2 . © Oliver Deiser 5. Eigenwerte und Spektralsatz 435 Dann ist S orthogonal, sodass S−1 = St = (v; w). Durch einen Austausch von w durch −w können wir das Vorzeichen von det(S) nach Wunsch einstellen. Es gilt A S−1 = A (v; w) = (Av; Aw) = (λ1 v; λ2 w), sodass S A S−1 = (v, w) (λ1 v; λ2 w) = λ1 〈v, v〉 λ2 〈v, w〉 λ1 〈w, v〉 λ2 〈w, w〉 = λ1 0 0 λ2 = D. Durch Multiplikation mit S−1 von links und S von rechts erhalten wir A = S−1 D S = St D S. Diese Zerlegung können wir anschaulich interpretieren: Da S orthogonal ist, ist S je nach Vorzeichen von det(S) eine Drehung um einen Winkel ϕ oder eine Spiegelung an einer Geraden G. Im Fall einer Drehung können wir die Wirkung von A = S−1 DS auf einen beliebigen Vektor v der Ebene so beschreiben: (1) Der Vektor v wird um den Winkel ϕ gegen den Uhrzeigersinn gedreht. (2) Der gedrehte Vektor wird in x-Richtung um den Faktor λ1 und in y-Richtung um den Faktor λ2 skaliert. (3) Der so erhaltene Vektor wird um den Winkel ϕ zurückgedreht. Ist S eine Spiegelung, so gilt eine analoge Dreiteilung. Da für eine Spiegelung S = S−1 gilt, ist die Rückspiegelung identisch mit der ersten Spiegelung. Wir fassen zusammen: Satz (Diagonalisierung symmetrischer Matrizen) Sei A P R2 × 2 symmetrisch und σ P { −1, 1 }. Dann gibt es eine orthogonale Matrix S mit det(S) = σ und eine Diagonalmatrix D derart, dass A = S−1 DS, D = SAS−1 . Eine Zerlegung A = S−1 DS wie im Satz heißt eine Diagonalisierung von A. In der Diagonale von D stehen die Eigenwerte und die Zeilen von S sind zugehörige normierte Eigenvektoren von A (Übung). Damit ist die Existenz einer Diagonalisierung nach dem Spektralsatz äquivalent zur Symmetrie von A. Fassen wir normierten und orthogonalen Eigenvektoren v, w von A als die Basisvektoren eines Koordinatensystems auf, so hat ein Vektor u = (x, y) in diesem System die Koordinaten x′, y′ mit u = x′ v + y′ w, sodass (+) x e1 + y e2 = u = x′ v + y′ w. Dann gilt (x, y) = u = (v; w) (x′, y′) = S−1 (x′, y′), (x′, y′) = S (x, y), sodass S und S−1 die Koordinaten (x, y) und (x′, y′) ineinander umrechnen. Wegen S−1 D (x′, y′) = S−1 D S (x, y) = A (x, y) hat A(x, y) bzgl. der Basis (v, w) die Koordinaten D(x′, y′) = (λ1 x′, λ2 y′). Aus der © Oliver Deiser Einführung in die Mathematik 1 436 4. Abschnitt Ebene und Raum Sicht der Basis (v, w) bewirkt A also eine Streckung um λ1 entlang der Achse von v und λ2 entlang der Achse von w. Der Spektralsatz besagt damit, dass jede symmetrische Matrix von der sympathischen Schlichtheit einer Diagonalmatrix ist, wenn wir ein geeignetes Koordinatensystem aus orthogonalen und normierten Basisvektoren wählen. Beispiel 1: Diagonalisierung einer singulären Matrix Wir betrachten wie oben die symmetrische Matrix A = a b b d = 4 2 2 1 . Nach unseren Berechnungen sind v = α(2, 1), w = α(−1, 2), mit α = 1/£5. orthogonale und normierte Eigenvektoren von A zu den Eigenwerten λ1 = 5 und λ2 = 0. Bzgl. der Basis v, w lässt sich die Wirkung von A relativ einfach beschreiben: Ein Vektor u wird wird auf den Vektor v orthogonal projiziert und anschließend um den Faktor 5 gestreckt. Mit obigen Bezeichnungen gilt D = λ1 0 0 λ2 = 5 0 0 0 , S = (v, w) = α 2 1 −1 2 , S−1 = St . Der Leser rechne nach, dass A = S−1 DS und D = SAS−1 . Der Vektor u = α (−3, 7/2) hat bzgl. (v, w) die Koordinaten Su = (−1/2, 2). Damit hat Au = (−2, −1) = £5 (−1, −1/2) bzgl. (v, w) die Koordinaten DSu = (−5/2, 0), wie nach „Projektion auf v und Streckung um 5“ auch sein muss. 2 u w 1 v -3 -2 Au -1 1 2 3 -1 -2 Einführung in die Mathematik 1 © Oliver Deiser 5. Eigenwerte und Spektralsatz 437 Beispiel 2: Diagonalisierung einer invertierbaren Matrix Wir betrachten die invertierbare symmetrische Matrix A = a b b d = 3 1 1 1 . Eine Berechnung wie in den vorangehenden Beispielen liefert die Eigenwerte λ1,2 = 2 ± £2 und zugehörige normierte Eigenvektoren v = α (1 + £2, 1), w = α (1 − £2, 1) mit α−1 = £4 − 2£2. Bzgl. der Basis v, w verhält sich A wie die Diagonalmatrix D = diag(λ1 , λ2 ) bzgl. e1 , e2 . 3 2 Au u Av 1 w Aw v -2 -1 1 2 3 4 -1 Matrizen und Ellipsen, II Mit Hilfe der Diagonalisierung können wir die Eigenvektoren und Eigenwerte einer invertierbaren symmetrischen Matrix geometrisch als Richtungen und Längen der Halbachsen der von A erzeugten Ellipse interpretieren und damit zwei Welten zusammenbringen. Im Folgenden seien EA = A [ K ] = { Av | i v i = 1 } das Bild des Einheitskreises K unter einer Matrix A und Ea, b = { (x, y) P R2 | (x/a)2 + (y/b)2 = 1 } die achsenparallele Ellipse mit Halbachsen a, b > 0. Wir erhalten: © Oliver Deiser Einführung in die Mathematik 1 438 4. Abschnitt Ebene und Raum Satz (Ellipsensatz für symmetrische Matrizen aus Spektralsatz) Sei A P R2 × 2 invertierbar und symmetrisch, und sei A = S−1 D S mit S orthogonal und D = diag(λ1 , λ2 ). Dann gilt EA = S−1 [ E|λ1|, |λ2| ]. Damit sind die Eigenwerte von A die Längen der Halbachsen von EA und zugehörige Eigenvektoren sind Halbachsenrichtungen von EA . Wenn wir die Matrix S als Drehung annehmen und A = S−1 D S als Abfolge der Drehung S, x-y-Skalierung D und Rückdrehung S−1 um den gleichen Drehwinkel auffassen, wird das Ergebnis sehr anschaulich: Durch S = (v, w) werden die orthogonalen und normierten Eigenvektoren v und w von A auf e1 und e2 abgebildet. Der Kreis K bleibt invariant. Anwendung von D verformt K zur achsenparallelen Ellipse E|λ1 |, |λ2 | . Die Anwendung von S−1 dreht diese Ellipse zur Ellipse EA ; die Halbachsenlängen |λ1 | und |λ2 | bleiben dabei gleich, die Achsenrichtungen e1 und e2 werden zu den Eigenvektoren v = S−1 e1 und w = S−1 e2 von A. Die Vektoren v und w sind damit Halbachsenrichtungen von EA . Analoges gilt, wenn S eine Spiegelung ist. Beispiel Für die oben untersuchte symmetrische Matrix A = a b b d = 2 1 1 1 . mit Eigenwerten λ1,2 = 2 ± £2 und normierten Eigenvektoren v = α (1 + £2, 1), w = α (1 − £2, 1), α−1 = £4 − 2£2. ergibt sich folgendes Bild: 1v 1 Ae2 Ae1 2w -3 -2 EA -1 1 2 3 -1 Visualisierung der Eigenwerte und Eigenvektoren der symmetrischen Matrix A Einführung in die Mathematik 1 © Oliver Deiser 5. Eigenwerte und Spektralsatz 439 Formal lässt sich der Satz wie folgt beweisen: Beweis des Satzes Für alle v P R2 gilt die Äquivalenzenkette: v P EA genau dann, wenn i A−1 v i 2 = 1 genau dann, wenn 〈A−1 v, A−1 v〉 = 1 genau dann, wenn 〈S−1 D−1 Sv, S−1 D−1 Sv〉 = 1 genau dann, wenn 〈D−1 S v, D−1 S v〉 = 1. Mit D−1 = diag(1/λ1 , 1/λ2 ) ist EA = { v | 〈D−1 S v, D−1 S v〉 = 1 } = { S−1 w | 〈D−1 w, D−1 w〉 = 1 } = { S−1 (x, y) | (x/λ1 )2 + (y/λ2 )2 = 1 } = S−1 [ E|λ1|, |λ2| ]. Um den Ellipsensatz auch für nichtsymmetrische Matrizen A zu erhalten, verwenden wir, dass für jede Matrix A die Matrix AAt symmetrisch ist, sodass wir den Spektralsatz auf AAt anwenden können: Satz (allgemeiner Ellipsensatz aus Spektralsatz) Sei A P R2 × 2 invertierbar, und sei A At = S−1 DS mit S orthogonal und D = diag(λ1 , λ2 ). Dann gilt λ1 , λ2 > 0 und EA = S−1 [ Eσ1, σ2 ], wobei σ1 = £λ1 , σ2 = £λ2 . Die Eigenvektoren der symmetrischen Matrix AAt sind also Halbachsenrichtungen der Ellipse EA und die Wurzeln der zugehörigen Eigenwerte sind die Längen der Halbachsen. Beweis Da mit A auch At invertierbar ist, gilt 〈v, A At v〉 = 〈At v, At v〉 = i At v i 2 > 0 für alle v ≠ 0. Dies zeigt, dass die Eigenwerte λ1 , λ2 der symmetrischen Matrix A At positiv sind. Der Rest des Beweises verläuft analog zum obigen Beweis (Ausführung des Arguments als Übung). Wir bemerken schließlich, dass wir den spezielleren Satz für eine symmetrische Matrix A aus dem allgemeinen Satz gewinnen können, indem wir AAt = A A = A2 diagonalisieren. Denn die Matrix A2 hat die gleichen Eigenvektoren wie A und die Eigenwerte von A2 sind die Quadrate der Eigenwerte von A. © Oliver Deiser Einführung in die Mathematik 1 440 4. Abschnitt Ebene und Raum Die Singulärwertzerlegung Aus der Diagonalisierung AAt = S−1 DS = St DS der symmetrischen Matrix AAt können wir trickreich, aber ohne großen Aufwand eine dreiteilige Zerlegung von A selbst gewinnnen, bei der in der Mitte eine Diagonalmatrix und links und rechts orthogonale Matrizen verwendet werden: Satz (Singulärwertzerlegung) Sei A P R2 × 2 invertierbar. Weiter sei AAt = S−1 DS mit S orthogonal und D = diag(λ1 , λ2 ). Weiter sei T = D1/2 SA−t , wobei A−t = (A−1 )t , D1/2 = diag(σ1 , σ2 ) = diag(£λ1 , £λ2 ). Dann ist T orthogonal und es gilt A = S−1 D1/2 T. (Singulärwertzerlegung von A) Wir können dieses sehr bedeutsame Ergebnis als Version des Spektralsatzes für nichtsymmetrische Matrizen ansehen. Beweis Die Matrix T ist orthogonal, da T t T = A−1 S−1 D1/2 D1/2 S A−t = A−1 A At A−t = E2 E2 = E2 . Weiter ist A = S−1 DSA−t = S−1 D1/2 D1/2 SA−t = S−1 D1/2 T. Die Zerlegung A = S−1 D1/2 T ist als Singulärwertzerlegung von A bekannt und die Diagonaleinträge σ1 , σ2 von D1/2 heißen die Singulärwerte von A. Die Matrix A wird in drei Teile wie bei der Diagonalisierung zerlegt, wobei die äußeren Matrizen immer noch orthogonal, aber im Allgemeinen nicht mehr invers zueinander sind. Mehr können wir nicht erreichen, da wir A nicht als symmetrisch voraussetzen. Dass das Bild des Einheitskreises unter A eine Ellipse ist, lässt sich mit Hilfe der Singulärwertzerlegung A = S−1 D1/2 T wie oben bei der Diagonalisierung so einsehen: Wir nehmen an, dass S und T Drehungen sind. Dann wird der Einheitskreis zunächst mit T gedreht. Seine Form bleibt dabei unverändert. Nun wird der gedrehte Kreis durch Anwendung von D1/2 in x- und y-Richtung um die positiven Skalare σ1 bzw. σ2 gestreckt und damit zur achsenparallelen Ellipse Eσ1, σ2 . Schließlich wird diese Ellipse mit S−1 zur Ellipse E = A[ K ] gedreht. Die Spaltenvektoren von S−1 sind damit Halbachsenrichtungen und die Singulärwerte von A die Längen der Halbachsen von E. Die Ellipse E ist damit vollständig durch die Matrizen S−1 und D bestimmt. Da die orthogonale Matrix S−1 wiederum durch ihre erste Spalte bestimmt ist, legen die vier Parameter S−1 (1, 1), S−1 (2, 1), σ1 , σ2 die zentrische Ellipse E fest. Die Rolle der vorge- Einführung in die Mathematik 1 © Oliver Deiser 5. Eigenwerte und Spektralsatz 441 schalteten Drehung T lässt sich so beschreiben: Durchlaufen wir den Einheitskreis K mit f(t) = (cos t, sin t), t P [ 0, 2π ], so durchläuft Af(t) die Ellipse E. Die Matrix T beeinflusst dabei den Startpunkt Ae1 des Durchlaufs. Im Fall T = E2 beginnt der Durchlauf von E bei einem Halbachsenvektor von E (genauer bei σ1 S−1 e1 ). Durch Änderung des Drehwinkels von T kann der Startpunkt des Durchlaufs beliebig eingestellt werden, ohne die Ellipse EA zu verändern. Beispiel Seien σ1 = 2, σ2 = 1, ϕ = π/3, ψ = π/8, D = diag(σ1 , σ2 ), S−1 = rotψ , T = rotϕ . Wir setzen A = S−1 D T (Drehung um ψ, Skalierung mit D, Drehung um ϕ). Die Anwendung von T gefolgt von D ergibt zunächst: 1 DTe2 Te2 Te1 DTe1 2 -2 E -1 1, 2 1 2 1 K -1 Anwendung von S−1 dreht die achsenparallele Ellipse um den Winkel ψ: Ae1 2 S-1 e 2 1 1S -1 e 1 2 1 Ae2 -2 -1 1 2 EA -1 © Oliver Deiser Einführung in die Mathematik 1 442 4. Abschnitt Ebene und Raum Analoge Überlegungen gelten, wenn S oder T eine Spiegelung ist. Die Determinante von S oder von T kann dabei frei als 1 oder −1 gewählt werden: Multiplizieren wir die zweiten Spalten von S und T mit −1, so erhalten wir eine Singulärwertzerlegung von A, bei der die Determinanten der beiden äußeren Matrizen ihr Vorzeichen gewechselt haben. Ist S eine Drehung, so entspricht das Vorzeichen von det(T) wegen det(A) = det(S−1 ) det(D1/2 ) det(T) = σ1 σ2 det(T) mit σ1 , σ2 > 0 der Orientierung der Spalten von A, also der Bilder von e1 und e2 unter A. Ist die Determinante von A negativ, so durchläuft Af(t)) mit obiger Parametrisierung f(t) von K die Ellipse E im Uhrzeigersinn. Subtile Beziehungen bestehen zwischen den zu A und At gehörigen Ellipsen E = A[ K ] und Et = At [ K ]. Wegen At = T −1 D1/2 S haben A und At die gleichen Singulärwerte, sodass die Ellipsen E und Et die gleichen Halbachsenlängen σ1 und σ2 aufweisen. Ist vi = S−1 ei , i = 1,2, ein normierter Halbachsenvektor von E, so ist At vi = T −1 D1/2 SS−1 ei = T −1 D1/2 ei = σi T −1 ei ein Halbachsenvektor von Et . 3 2 1 -3 -2 -1 1 2 3 E -1 -2 Et -3 Die Ellipsen von A und At für A = ((1, −1); (3, 2/3)) Einführung in die Mathematik 1 © Oliver Deiser 5. Eigenwerte und Spektralsatz 443 Übungen Übung 1 Illustrieren Sie die Begriffe Eigenwert und Eigenvektor durch Diagramme. Übung 2 Sei A P R2 × 2 , und seien v, w Eigenvektoren von A zum gleichen Eigenwert λ. Weiter sei u P span(v, w) mit u ≠ 0. Zeigen Sie, dass u ein Eigenvektor von A zum Eigenwert λ ist. Übung 3 Was lässt sich über die Existenz von Eigenwerten (immer, manchmal, nie) einer Matrix A unter den folgenden Bedingungen sagen? Begründen Sie Ihre Antworten. (a) det(A) = 0. (b) det(A) > 0. (c) det(A) < 0. (d) spur(A) = 0. (e) A ist eine Diagonalmatrix. (f ) Die Einträge von A außerhalb der Hauptdiagonalen haben das gleiche Vorzeichen. (g) Die Einträge von A außerhalb der Hauptdiagonalen haben verschiedene Vorzeichen. Übung 4 Bestimmen Sie alle symmetrischen Matrizen A = ((a, b), (b, d)), für die (1, 1) ein Eigenvektor zum Eigenwert 1 ist. Übung 5 Sei A = rotϕ P R2 × 2 eine Rotationsmatrix um einen Winkel ϕ P [ 0, 2π [. Zeigen Sie, dass A genau dann Eigenwerte besitzt, wenn ϕ = 0 oder ϕ = π. Übung 6 Sei u P R2 mit u ≠ 0, und sei A die Spiegelung an der Geraden G(u) = span(u). Bestimmen Sie die Eigenwerte und Eigenvektoren von A sowohl durch anschauliche Argumentation als auch durch Berechnung. Zeichnen Sie ein Diagramm zur Illustration. © Oliver Deiser Einführung in die Mathematik 1 444 4. Abschnitt Ebene und Raum Übung 7 Sei u P R2 mit u ≠ 0, und sei A = Apru die Projektionsmatrix bzgl. u. Bestimmen Sie die Eigenwerte und Eigenvektoren von A sowohl durch anschauliche Argumentation als auch durch Berechnung. Zeichnen Sie ein Diagramm zur Illustration. Übung 8 Sei A P R2 × 2 invertierbar. Welche Beziehungen bestehen im Fall der Existenz zwischen den Eigenvektoren und zugehörigen Eigenwerten von A und A−1 ? Beweisen Sie Ihre Behauptungen. Übung 9 Beweisen oder widerlegen Sie die folgenden Aussagen: (a) Für alle A P R2 × 2 gilt: Besitzt A einen Eigenwert, so auch A2 . (b) Für alle A P R2 × 2 gilt: Besitzt A2 einen Eigenwert, so auch A. (c) Für alle A P R2 × 2 gilt: Besitzt A2 einen Eigenwert, so auch A3 . Übung 10 Sei A P R2 × 2 eine obere oder untere Dreiecksmatrix mit voneinander verschiedenen Diagonaleinträgen. Zeigen Sie, dass A keine Eigenwerte besitzt. Übung 11 Sei B = ((s, b), (b, −s)) P R2 × 2 , B ≠ 0, eine spurfreie Matrix, und sei (s, b) = λ (cos(ϕ, sinϕ)) mit λ = i (s, b) i, ϕ P R. Zeigen Sie unter Verwendung der Additionstheoreme für den Kosinus und Sinus, dass v = (cos(ϕ/2), sin(ϕ/2)) und w = (−sin(ϕ/2), cos(ϕ/2)). Eigenvektoren von B zu den Eigenwerten λ und −λ sind. Illustrieren Sie das Ergebnis durch eine Skizze. Übung 12 Sei A P R2 × 2 symmetrisch, und sei A = S−1 DS, D = SAS−1 mit einer orthogonalen Matrix S und einer Diagonalmatrix D. Zeigen Sie, dass die Zeilenvektoren von S (und damit die Spaltenvektoren von S−1 ) orthogonale und normierte Eigenvektoren von A mit den zugehörigen Eigenwerten λ1 = d11 und λ2 = d22 sind. Einführung in die Mathematik 1 © Oliver Deiser 5. Eigenwerte und Spektralsatz 445 Übung 13 Sei A P R2 × 2 symmetrisch. (a) Illustrieren Sie die Aussage, dass A eine Diagonalmatrix D bzgl. eines Koordinatensystems bestehend aus orthogonalen und normierten Eigenvektoren v, w von A ist, durch Diagramme. (b) Betrachten Sie nun eine konkrete symmetrische nichtdiagonale Matrix A ihrer Wahl, und führen Sie das Umrechnen von (x,y)Koordinaten im System e1 , e2 und (x′, y′)-Koordinaten im System v,w für einige Vektoren v = xe1 + ye2 = x′v + y′w der Ebene durch. Übung 14 Seien Ea, b eine achsenparallele Ellipse und S orthogonal. Zeigen Sie, dass die Ellipse E = S[ Ea, b ] auch im Fall det(S) = −1 durch eine Drehung aus Ea, b hervorgeht. Wie lässt sich der Drehwinkel aus S gewinnen? Illustrieren Sie Ihre Argumentation durch eine Skizze. Übung 15 Führen Sie den Beweis des allgemeinen Ellipsensatzes vollständig aus (in Analogie zum Beweis des Ellipsensatzes für symmetrische Matrizen). Übung 16 Sei (v1 ; v2 ) diag(σ1 , σ2 ) (w1 , w2 ) eine Singulärwertzerlegung von A P R2 × 2 . (a) Zeigen Sie, dass auch (±v1 ; ±v2 ) diag(σ1 , σ2 ) (±w1 , ±w2 ), (±v2 ; ±v1 ) diag(σ2 , σ1 ) (±w2 , ±w1 ) Singulärwertzerlegungen von A sind (mit beliebiger Vorzeichenkombination bei den Vektoren). (b) Zeigen Sie, dass jede Singulärwertzerlegung von A eine der Zerlegungen in (a) ist. © Oliver Deiser Einführung in die Mathematik 1 6. Der Euklidische Raum Gegenstand dieses Kapitels ist der dreidimensionale Raum R3 = { (v1 , v2 , v3 ) | v1 , v2 , v3 P R } = { (x, y, z) | x, y, z P R }. Eine Besonderheit des dreidimensionalen Raumes ist das Vorhandensein eines speziellen Vektorprodukts v × w (Kreuzprodukt), das zwei Vektoren v und w des Raumes einen bestimmten Vektor u = v × w zuordnet, der auf v und w senkrecht steht. Wir motivieren dieses Produkt über die Darstellung von Ebenen. Schließlich betrachten wir auch wieder Determinanten und lineare Gleichungssysteme. © Oliver Deiser Einführung in die Mathematik 1 448 4. Abschnitt Ebene und Raum Grundlegendes Wir erinnern an die für alle v, w P R3 und λ P R definierten Vektoren bzw. Skalare: v + w = (v1 + w1 , v2 + w2 , v3 + w3 ) P R3 , (Vektoraddition) λ v = (λ v1 , λ v2 , λ v3 ) P R3 , (Skalarmultiplikation) i v i = £v1 2 + v2 2 + v3 2 P R, 〈v, w〉 = v1 w1 + v2 w2 + v3 w3 P R. (Euklidische Norm) (Euklidisches Skalarprodukt) Unsere Beweise der Winkelformel bleiben gültig, da sie nur allgemeine Eigenschaften des Skalarprodukts und geometrische Größen eines Dreiecks verwenden, die von der räumlichen Lage unabhängig sind. Damit gilt für alle Vektoren v,w P R3 mit v, w ≠ 0: cos ϕ = 〈v̂, ŵ〉 = 〈v, w 〉 ivi iwi mit ϕ = ](v, w) P [ 0, π ]. (Winkelformel) Wie in der Ebene definieren wir die Orthogonalität und die Kollinearität zweier Vektoren: Zwei Vektoren v, w P R3 sind orthogonal, falls 〈v, w〉 = 0 und kollinear, falls |〈v, w〉| = i v i i w i. Der Nullvektor ist kollinear mit jedem Vektor des R3 . Sind v,w P R3 mit v ≠ 0, so sind v,w genau dann kollinear, wenn es ein λ P R gibt mit w = λv. Die Vektoren v = (4, 1, 1) und w = (1, 2, 3) im R3 Einführung in die Mathematik 1 © Oliver Deiser 6. Der Euklidische Raum 449 Geraden und Ebenen im dreidimensionalen Raum Geraden und Ebenen des Raumes, denen der Nullpunkt angehört, können wir über den Spann von Vektoren einführen: Definition (Gerade) Sei v P R3 mit v ≠ 0. Dann setzen wir G(v) = span(v) = { λ v | λ P R }. Die Menge G(v) ⊆ R3 heißt die von v aufgespannte oder erzeugte Gerade des R3 . Eine Teilmenge G ⊆ R3 heißt eine Gerade (durch 0), falls es ein v P R3 gibt mit G = G(v). Definition (Ebene) Seien v, w P R3 nicht kollinear. Dann setzen wir E(v, w) = span(v, w) = { λ v + µ w | λ, w P R }. Die Menge E(v, w) ⊆ R3 heißt die von v, w aufgespannte oder erzeugte Ebene des R3 . Eine Teilmenge E ⊆ R3 heißt eine Ebene (durch 0), falls es v, w P R3 gibt mit E = E(v, w). Allgemeinere geometrische Geraden und Ebenen entstehen durch die Verschiebung von Geraden und Ebenen durch den Nullpunkt um einen Vektor: Definition (Translation) Seien P ⊆ R3 und u P R3 . Dann setzen wir P + u = { v + u | v P P }. Die Menge P + u heißt die Translation oder Verschiebung von P um den Vektor u. Definition (affine Gerade, affine Ebene) Eine Menge G ⊆ R3 heißt eine affine Gerade, falls es v, u P R3 gibt mit G = u + G(v). Analog heißt eine Menge E ⊆ R3 eine affine Ebene, falls es v, w, u P R3 gibt mit E = u + E(v, w). Affine Gerade und Ebenen haben also die Form G = u + span(v) = { u + λv | λ P R }, v ≠ 0, E = u + span(v, w) = { u + λv + µ w | λ, µ P R }, v, w nicht kollinear. Die Vektoren v, w, u sind dabei nicht eindeutig bestimmt und der Fall u = 0 ist möglich. Im Folgenden bedeutet „Gerade“ und „Ebene“ immer „Gerade durch 0“ und “Ebene durch 0“, wenn der Zusatz „affin“ nicht explizit dabei steht. © Oliver Deiser Einführung in die Mathematik 1 450 4. Abschnitt Ebene und Raum Lineare Unabhängigkeit Drei Vektoren des R3 liegen genau dann in einer Ebene E, wenn einer der drei Vektoren im Spann der beiden anderen Vektoren liegt. Eine äquivalente Bedingung gibt der folgende Satz. Satz (triviale Nulldarstellung)) Seien v, w, u P R3 . Dann sind äquivalent: (a) Die Vektoren v, w, u liegen nicht in einer Ebene E ⊆ R3 . (b) ∀λ1 , λ2 , λ3 P R (λ1 v + λ2 w + λ3 u = 0 → λ1 = λ2 = λ3 = 0). Die zweite Aussage besagt, dass sich der Nullvektor nur trivial in der Form 0 = 0 v + 0 w + 0 u mit Hilfe der drei Vektoren kombinieren lässt. Beweis (a) impliziert (b): Wir zeigen die Implikation indirekt. Seien also λ1 , λ2 , λ3 P R nicht alle gleich 0 derart, dass λ1 v + λ2 w + λ3 u = 0. Ist λ1 ≠ 0, so gilt v = −1 λ1 ( λ2 w + λ3 u ) = −λ2 w + λ1 −λ3 u P span(w, u), λ1 sodass v, w, u in der Ebene E(w, u) liegen. Analoges gilt, falls λ2 ≠ 0 oder λ3 ≠ 0. (b) impliziert (a): Wir zeigen die Implikation wieder indirekt. Wir nehmen also an, dass v, w, u in einer gemeinsamen Ebene liegen. Ist v P spann(w, u), so gibt es λ2 , λ3 P R mit v = λ2 w + λ3 u. Dann ist aber 1 v + (−λ2 ) w + (−λ3 ) u = 0 eine Darstellung des Nullvektors, deren Koeffizienten nicht alle gleich Null sind. Analoges gilt, falls w P spann(v, u) oder u P spann(v, w). Die elegante Bedingung (b) wird in der Linearen Algebra verwendet, um zum Ausdruck zu bringen, dass zwischen Vektoren keine linearen Abhängigkeitsverhältnisse bestehen. Wir definieren allgemein: Einführung in die Mathematik 1 © Oliver Deiser 6. Der Euklidische Raum 451 Definition (linear unabhängig) Sei n ≥ 1, und seien v1 , …, vk P Rn . Dann heißen die Vektoren v1 , …, vk linear unabhängig, falls gilt: ∀λ1 , …, λk P R (λ1 v1 + … + λk vk = 0 → λ1 = … = λk = 0). Andernfalls heißen sie linear abhängig. Genauer sollten wir sagen: „Das k-Tupel (v1 , …, vk ) ist linear unabhängig.“ Denn die lineare Unabhängigkeit kommt den Vektoren v1 , …, vk als Ganzes zu und nicht jedem einzelnen Vektor. Die Sprechweise „Die Vektoren v1 , …, vk sind linear unabhängig“ ist also etwas ungenau, aber sprachlich einfacher. Lineare Unabhängigkeit in der Ebene (1) Ein Vektor v P R2 ist genau dann linear unabhängig, wenn v ≠ 0. (2) Zwei Vektoren v, w P R2 sind genau dann linear unabhängig, wenn v, w nicht kollinear sind, d. h. nicht auf einer Geraden liegen. (3) Drei Vektoren v, w, u P R2 sind stets linear abhängig. Lineare Unabhängigkeit im dreidimensionalen Raum (1) Ein Vektor v P R3 ist genau dann linear unabhängig, wenn v ≠ 0. (2) Zwei Vektoren v, w P R3 sind genau dann linear unabhängig, wenn v, w nicht kollinear sind, d. h. nicht auf einer Geraden liegen. (3) Drei Vektoren v, w, u P R3 sind genau dann linear unabhängig, wenn v, w, u nicht in einer Ebene liegen. (4) Vier Vektoren v, w, u, u′ P R3 sind stets linear abhängig. Eine nichtriviale Nulldarstellung: v + w + 3u = 0 © Oliver Deiser Einführung in die Mathematik 1 452 4. Abschnitt Ebene und Raum Zur linearen Abhängigkeit des Nullvektors beobachten wir, dass 1 ⋅ 0 = 0 eine nichttriviale Darstellung des Nullvektors ist. Im R2 sind drei und mehr Vektoren immer linear abhängig, da zwei linear unabhängige Vektoren die gesamte Ebene aufspannen. Ebenso sind im R3 vier und mehr Vektoren stets linear abhängig. Die Orthogonaldarstellung einer Ebene Ist E eine Ebene des R3 , so gibt es nach unserer Definition einer Ebene linear unabhängige Vektoren v und w des R3 , die die Ebene aufspannen: Spanndarstellung E = E(v, w) = span(v, w) = { λ v + µ w | λ, µ P R }. Anschaulich ist klar, dass wir eine Ebene E auch als Menge aller Vektoren darstellen können, die senkrecht auf einem Vektor s P R3 , s ≠ 0, stehen („s“ steht hier für „senkrecht“). Eine solche Menge hat die Form: Orthogonaldarstellung E = Es = { v P R3 | v und s sind orthogonal } = { v P R3 | 〈v, s〉 = 0 } = { v P R3 | v1 s1 + v2 s2 + v3 s3 = 0 }. Es stellt sich die Frage: Wie rechnet man die beiden Darstellungen ineinander um? Ist E ⊆ R2 gegeben in der Orthogonaldarstellung E = Es = { v P R3 | s und v sind orthogonal }, s = (a, b, c), so können wir aus den Komponenten a, b, c von s zwei linear unabhängige Lösungen v = (x1 , y1 , z1 ) und w = (x2 , y2 , z2 ) der Gleichung ax + by + cz = 0 in den Unbekannten x,y,z gewinnen (Übung). Es gilt dann E = E(v, w). Ist umgekehrt E ⊆ R2 gegeben in der Spanndarstellung E = E(v, w) = span(v, w) = { λ v + µ w | λ, µ P R }, so suchen wir einen Vektor s = (a, b, c) ≠ 0, der auf den linear unabhängigen Vektoren v und w senkrecht steht. Ist v = (x1 , y1 , z1 ) und w = (x2 , y2 , z2 ), so muss für a, b, c gelten: (+) ax1 + by1 + cz1 = 0 ax2 + by2 + cz2 = 0 Einführung in die Mathematik 1 © Oliver Deiser 6. Der Euklidische Raum 453 Das homogene System (+) in den Unbestimmten a, b, c lässt sich mit Hilfe von (2 × 2)-Matrizen und unserer Lösungstheorie für (2 × 2)-Systeme lösen, ohne dass dabei unangenehme Fallunterscheidungen nach x1 ≠ 0, x2 ≠ 0, … auftreten würden. Wir formen das System hierzu um: Ein Vektor s = (a, b, c) ist genau dann eine Lösung von (+), wenn gilt: (I) (II) (III) y1 z1 b y2 z2 c x1 z1 a x2 z2 c x1 y1 a x2 y2 b = −a x1 y1 = −b = −c , y2 , y2 z1 . z2 Wir bezeichnen die (2 × 2)-Matrizen von (I), (II) und (III) mit A1 , A2 bzw. A3 und setzen d1 = det(A1 ) = y1 z2 − z1 y2 , d2 = det(A2 ) = x1 z2 − z1 x2 , d3 = det(A3 ) = x1 y2 − y1 x2 . Für alle Matrizen A P R2 × 2 und alle v P R2 gilt det(A) v = A# A v. Sei nun (a, b, c) eine Lösung von (I), (II), (III). Dann gilt: d1 b c = det(A1 ) = −a b c = A1 # A1 z2 −z1 x1 −y2 y1 x2 b = − a A1 # c = a −d2 d3 x1 x2 . Analog erhalten wir d2 d3 a c a b = − b A2 # = − c A3 # © Oliver Deiser y1 y2 z1 z2 = −b = −c z2 −z1 y1 −x2 x1 y2 y2 −y1 z1 −x2 x1 z2 = −b = c d1 d3 d1 −d2 , . Einführung in die Mathematik 1 454 4. Abschnitt Ebene und Raum Die drei Gleichungen werden offenbar erfüllt durch (#) a = d1 , b = −d2 , c = d3 . Einsetzen zeigt, dass durch (#) eine Lösung von (I), (II), (III) definiert wird. Unsere Überlegungen motivieren: Definition (Kreuzprodukt) Für alle v, w P R3 setzen wir x2 x1 v × w = y1 × z1 y2 d1 = z2 − d2 d3 y 1 z2 − y 2 z1 = x2 z1 − x1 z2 . x1 y2 − x2 y1 Der Vektor v × w P R3 heißt das Kreuzprodukt oder Vektorprodukt von v und w. Das Kreuzprodukt ist eine Abbildung von R3 × R3 nach R3 . Je zwei Vektoren des Raumes wird ein Vektor des Raumes zugeordnet. Für linear unabhängige Vektoren v und w und v × w = (a, b, c) gilt E(v, w) = { λ v + µ w | λ, µ P R } = { (x, y, z) | a x + b y + c z = 0 } = { u P R3 | 〈v × w, u〉 = 0 }. Damit können wir die Orthogonaldarstellung einer Ebene E(v, w) einfach durch eine Berechnung des Kreuzprodukts v × w finden. Für v = (3, 2, 2) und w = (−2, 1, 1) ist v × w = (0, −7, 7) und w × v = − (v × w) Einführung in die Mathematik 1 © Oliver Deiser 6. Der Euklidische Raum 455 Eigenschaften des Kreuzprodukts Das Kreuzprodukt erfüllt eine Reihe von bemerkenswerten Eigenschaften. Der folgende Satz, dessen „Beweis durch umfangreiches Nachrechnen“ dem Leser zur Übung überlassen sei, versammelt einige davon. Satz (Eigenschaften des Kreuzprodukts) Für alle v, w, u P R3 und λ P R gilt: (i) 〈v × w, v〉 = 〈v × w, w〉 = 0, (Orthogonalität) (ii) v × w = − (w × v), (Antikommutativität) (iii) (λv) × w = λ (v × w), (v + u) × w = v × w + u × w, v × (λw) = λ (v × w), v × (w + u) = v × w + v × u, (Bilinearität) (iv) v × v = 0, (Alternation) (v) v × (w × u) = 〈v, u〉 w − 〈v, w〉 u, (Grassmann-Identität) (vi) v × (w × u) + u × (v × w) + w × (u × v) = 0, (vii) i v × w i 2 = i v i 2 i w i 2 − 〈v, w〉2 . (Jacobi-Identität) (Lagrange-Identität) Das Kreuzprodukt ist also weder kommutativ noch assoziativ. Die Grassmann-Identität ist aus mnemotechnischen Gründen auch als bac-cab−Regel bekannt: Schreiben wir a, b, c statt v, w, u, so gilt a × (b × c) = 〈a, c〉 b − 〈a, b〉 c = b 〈a, c〉 − c 〈a, b〉 mit ungewöhnlichen rechtsseitigen Skalaren an den Vektoren b und c. In der Jacobi-Identität werden die Vektoren v, w, u zyklisch vertauscht, was ebenfalls helfen kann, sich diese Formel zu merken. Explizit bemerken wir, dass die Lagrange-Identität die Ungleichung von Cauchy-Schwarz (für den R3 ) impliziert. Für Liebhaber des Kreuzprodukts halten wir noch fest (Beweis als Übung): Satz (allgemeine Lagrange-Identität, Binet-Cauchy-Identität) Für alle v1 , v2 , w1 , w2 P R3 gilt: 〈v1 × v2 , w1 × w2 〉 = 〈v1 , v2 〉 〈w1 , w2 〉 − 〈v1 , w2 〉 〈w1 , v2 〉 = det © Oliver Deiser 〈v1 , v2 〉 〈v1 , w2 〉 〈w1 , v2 〉 〈w1 , w2 〉 . Einführung in die Mathematik 1 456 4. Abschnitt Ebene und Raum Die Lagrange-Identität ergibt sich für v = v1 = v2 und w = w1 = w2 als Spezialfall der Binet-Cauchy-Identität. Nach Konstruktion steht das Kreuzprodukt von v und w senkrecht auf den Vektoren v und w. Zu klären bleibt noch die Länge und die Richtung des Vektors v × w. Für die Länge gilt: Satz (Länge des Kreuzprodukts: Parallelogrammfläche) Für alle v, w P R3 ist i v × w i die Fläche des von v und w im R3 aufgespannten Parallelogramms P = { λ v + µ w | λ, µ P [ 0, 1 ] }. Für v, w ≠ 0 gilt also i v × w i = i v i i w i sin(ϕ) mit ϕ = ](v, w) P [ 0, π ]. Beweis Gilt v = 0 oder w = 0, so ist v × w der Nullvektor mit Länge 0, und die Fläche von P ist ebenfalls gleich 0. Seien also v, w ≠ 0 und ϕ = ](v, w), sodass sin ϕ ≥ 0. Nach der Lagrange-Identität gilt iv × wi 2 = i v i 2 i w i 2 − 〈v, w〉2 = iv i 2 iw i 2 − cos2 ϕ i v i 2 iw i 2 = i v i 2 i w i 2 (1 − cos2 ϕ) = ivi 2 iwi 2 sin2 ϕ. Das von v und w aufgespannte Parallelogramm P mit der Höhe h = sin ϕ i w i Einführung in die Mathematik 1 © Oliver Deiser 6. Der Euklidische Raum 457 Damit gilt für alle v, w P R3 mit v, w ≠ 0 und ϕ = ](v, w): cos ϕ = 〈v̂, ŵ〉, sin ϕ = i v̂ × ŵ i. Um die Richtung von v × w zu ermitteln, betrachten wir zunächst die kanonischen Einheitsvektoren. Ausrechnen zeigt: Satz (Richtung des Kreuzprodukts) Für e1 = (1, 0, 0), e2 = (0, 1, 0), e3 = (0, 0, 1) gilt: e1 × e1 = 0, e2 × e2 = 0, e3 × e3 = 0, e1 × e2 = e3 , e2 × e3 = e1 , e3 × e1 = e2 , e2 × e1 = −e3 , e3 × e2 = −e1 , e1 × e3 = − e2 . Als Merkregel kann man verwenden, dass die zyklische bzw. azyklische Anordnung der Indizes zu einem positiven bzw. negativen Vorzeichen führt. Das Ergebnis ei × ej lässt sich damit ablesen an der Aufzählung: e1 , e2 , e3 , e1 , e2 Sind v, w linear unabhängig, so gilt allgemeiner, dass die räumliche Lage der drei Vektoren v, w, v × w stets der Lage von e1 , e2 , e3 entspricht (und nicht etwa der Lage von e1 , e3 , e2 ); bei diesem Lagebegriff wird von den Längen und dem eingeschlossenen Winkel der Vektoren v und w abgesehen. Anschaulich lässt sich dies wie folgt formulieren: Richtung des Kreuzprodukts: Rechte-Hand-Regel Zeigt v in Richtung des Daumens und w in Richtung des Zeigefingers der rechten Hand, so zeigt v × w in Richtung des Mittelfingers der rechten Hand, wenn dieser senkrecht auf Daumen und Zeigefinger steht. Die Regel kann in dieser anschaulichen Form nicht bewiesen werden, da wir in mathematischen Beweisen nicht von einer rechten Hand reden können. Um sie mathematisch zu formulieren, betrachten wir drei linear unabhängige Vektoren a, b, c des Raumes derart, dass a auf der positiven x-Achse und b in der x-y-Ebene liegt (c muss nicht notwendig senkrecht auf a und b stehen). Dann bildet anschaulich a, b, c genau dann ein System, das wir mit der rechten Hand (bei sehr beweglichen Fingern) richtungsmäßig nachbilden können, wenn das Vorzeichen der y-Komponente von b mit dem Vorzeichen der z-Komponente von c übereinstimmt. Zwei Beispiele sind (2, 0, 0), (1, 1, 0), (−1, −1, 2), (1, 0, 0), (0, −1, 0), (−1, 0, −1). Allgemeine Vektoren u, v, w P R3 erlauben diese Nachbildung mit der rechten Hand, wenn sie durch eine Rotation um den Nullpunkt in ein derartiges System a, b, c übergeführt werden können. © Oliver Deiser Einführung in die Mathematik 1 458 4. Abschnitt Ebene und Raum Diese Überlegungen führen zu einer Definition, die durch die Anschauung motiviert, aber von ihr unabhängig ist: Definition (Rechtssystem) Seien v, w, u P R3 linear unabhängig. Dann ist (v, w, u) ein Rechtssystem, falls es eine Rotation f : R3 → R3 um den Nullpunkt gibt, sodass für die Vektoren a = f(v), b = f(w), c = f(u) gilt: (i) a = (a1 , 0, 0), b = (b1 , b2 , 0), c = (c1 , c2 , c3 ), (ii) a1 > 0, sgn(b2 ) = sgn(c3 ). Analog ist ein Linkssystem definiert, wobei in (ii) nun sgn(b2 ) ≠ sgn(c3 ) gefordert wird. Damit können wir nun eine formale Version der Rechte-Hand-Regel beweisen. Hierzu verwenden wir, dass eine Rotation f : R3 → R3 um den Nullpunkt das Kreuzprodukt respektiert, d. h. dass f(u × v) = f(u) × f(v) für alle u, v P R3 gilt. Um dies streng zu beweisen, müssten wir Rotationen genauer untersuchen. Die Aussage ist aber plausibel, da eine Rotation eine stetige Abbildung ist und wir das Kreuzprodukt bereits bis auf ein Vorzeichen in Länge und Richtung festgelegt haben. Und dieses Vorzeichen kann bei einer stetigen Abbildung nicht wechseln. Satz (Richtung des Kreuzprodukts) Seien v, w P R3 linear unabhängig, und sei u = v × w. Dann ist (v, w, u) ein Rechtssystem. Beweis Sei a1 = i v i. Sei f : R3 → R3 eine Rotation um den Nullpunkt, die v auf a = (a1 , 0, 0) und w auf einen Vektor b der x-y-Ebene abbildet, sodass f(w) = b = (b1 , b2 , 0). Weiter sei c = f(u). Dann gilt b1 a1 c = f(v × w) = f(v) × f(w) = 0 0 × b2 0 = 0 0 , a1 b2 sodass c3 = a1 b2 . Wegen a1 > 0 ist sgn(c3 ) = sgn(b2 ). Aus dieser Argumentation ergibt sich noch einmal, dass die Länge von v × w die Fläche des von v und w aufgespannten Parallelogramms ist. Denn diese Fläche bleibt bei Rotationen unverändert, und die Fläche des von a und b aufgespannten Parallelogramms ist |a1 b2| = i c i = i f(u) i = i v × w i. Einführung in die Mathematik 1 © Oliver Deiser 6. Der Euklidische Raum 459 Determinanten Wir führen nun Determinanten in Analogie zur Ebene ein. Das dreidimensionale Analogon zu dem von zwei Vektoren der Ebene aufgespannten Parallelogramm ist: Definition (aufgespanntes Parallelepiped, Spat) Seien v, w, u P R3 . Dann heißt die Menge P = { λ1 v + λ2 w + λ3 u | λ1 , λ2 , λ3 P [ 0, 1 ] } ⊆ R3 das von v, w, u aufgespannte Parallelepiped oder der von v, w, u aufgespannte Spat. Der von v, w, u aufgespannte Spat P Wir bestimmen nun das orientierte Volumen V(P) des von v, w, u aufgespannten Parallelepipeds P. Das Vorzeichen von V(P) soll dabei wieder der Orientierung der drei Vektoren entsprechen, die wir in Analogie zur Ebene so erklären können: Definition (Orientierung im R3 ) Seien v, w, u P R3 linear unabhängig, und sei ψ = ](v × w, u). Dann heißt (v, w, u) positiv orientiert, wenn ψ P [ 0, π/2 [, und negativ orientiert, wenn ψ P ] π/2, π ]. Die positive Orientierung von (v, w, u) besagt anschaulich, dass die Vektoren u und v × w im gleichen durch die Ebene span(v, w) definierten Halbraum des © Oliver Deiser Einführung in die Mathematik 1 460 4. Abschnitt Ebene und Raum R3 liegen. Das Kreuzprodukt v × w spielt in der Begriffsbildung die Rolle des Vektors v ⊥ = rotπ/2 (v) der Orientierung in der Ebene. Die positive Orientierung von (v, w, u) ist äquivalent dazu, dass das Tripel (v, w, u) ein Rechtssystem ist. Die Orientierung lässt sich aber ohne Verwendung von Rotationen erklären. Für die Grundfläche f und die gemäß dem Vektor v × w orientierte Höhe h des Spats P gilt f = iv × wi, h = cos(ψ) i u i, wobei ψ = ](v × w, u). Damit erhalten wir das orientierte Volumen V(P) = f h = i v × w i cos(ψ) i u i = 〈v × w, u〉. Wir definieren: Definition (Determinante) Seien v, w, u P R3 . Dann heißt die reelle Zahl det(v, w, u) = 〈v × w, u〉 die Determinante von (v, w, u). Unsere Diskussion zeigt: Volumen und lineare Abhängigkeit Die reelle Zahl det(v, w, u) ist das orientierte Volumen des von v, w, u aufgespannten Parallelepipeds. Insbesondere ist det(v, w, u) genau dann gleich 0, wenn v, w, u linear abhängig sind. Im Fall det(v, w, u) ≠ 0 entspricht das Vorzeichen der Determinante der Orientierung von (v, w, u). Damit ist das Volumen V(P) positiv bei einem Rechtssystem und negativ bei einem Linkssystem. Nachrechnen zeigt: Satz (Eigenschaften der Determinante) Für alle v, w, v1 ,v2 , w1 , w2 , u1 , u2 P R3 und alle λ P R gilt: (i) det(e1 , e2 , e3 ) = 1, (ii) det(v, w, u) = 0, falls v = w oder v = u oder w = u, (iii) det(v, w, u) = − det(w, v, u) = − det(u, w, v) = − det(v, u, w), (iv) det(λ v, w, u) = det(v, λ w, u) = det(v, w, λ u) = λ det(v, w, u), det(v1 + v2 , w, u) = det(v1 , w, u) + det(v2 , w, u), det(v, w1 + w2 , u) = det(v, w1 , u) + det(v, w2 , u), det(v, w, u1 + u2 ) = det(v, w, u1 ) + det(v, w, u2 ). Einführung in die Mathematik 1 © Oliver Deiser 6. Der Euklidische Raum 461 Die Determinante ist also normiert im Hinblick auf die kanonischen Einheitsvektoren und gleich 0, wenn zwei der drei Vektoren gleich sind. Sie ändert das Vorzeichen, wenn wir zwei Vektoren vertauschen. Weiter ist sie linear in allen drei Komponenten. Notation Wir notieren Determinanten auch wieder in Matrix-Schreibweise: x1 x2 x3 det y1 y2 y3 statt det((x1 , y1 , z1 ), (x2 , y2 , z2 ), (x3 , y3 , z3 )). z1 z2 z3 Die Vektoren werden als Spalten in die Matrix geschrieben. Wie im zweidimensionalen Fall bleibt die Determinante unverändert, wenn wir die Vektoren als Zeilen eintragen: x1 x2 x3 det y1 y2 y3 x1 y1 z1 = det z1 z2 z3 x2 y2 z2 . x3 y3 z3 Diese keineswegs offensichtliche Eigenschaft lässt sich zum Beispiel mit der folgenden Regel einsehen, die allgemein für die Berechnung von Determinanten nützlich ist: Satz (Regel von Sarrus) Seien v = (x1 , y1 , z1 ), w = (x2 , y2 , z2 ), u = (x3 , y3 , z3 ) P R3 . Dann gilt det(v, w, u) = x1 y2 z3 + x2 y3 z1 + x3 y1 z2 − x3 y2 z1 − x1 y3 z2 − x2 y1 z3 x1 x2 x3 x1 x2 y1 y2 y3 y1 y2 z1 z2 z3 z1 z2 Zur Regel von Sarrus: Bestimmung der Vorzeichen der sechs Summanden © Oliver Deiser Einführung in die Mathematik 1 462 4. Abschnitt Ebene und Raum Beweis Mit den in der Motivation des Kreuzprodukts verwendeten (2 × 2)Determinanten d1 , d2 , d3 gilt det(v, w, u) = 〈v × w, u〉 = 〈(d1 , −d2 , d3 ), (x3 , y3 , z3 )〉. Ausrechnen und Umordnen liefert die sechs Summanden, wobei jede Determinante ein positives und ein negatives Vorzeichen beiträgt. Als Merkregel kann man verwenden: Das Vorzeichen des Summanden xi yj zk in der Regel von Sarrus ist bestimmt durch die zyklische bzw. azyklische Anordnung der Indizes i, j, k. Beispiele (1) Für v = (1, 2, 3), w = (1, 0, −1), u = (0, 1, 2) gilt det(v, w, u) = det 1 1 0 2 0 1 = 0 + 3 + 0 − 0 − 4 + 1 = 0. 3 −1 2 Damit sind v, w, u linear abhängig. Es gilt v − w − 2u = 0. (2) det det 0 1 1 1 0 1 1 1 0 1 0 1 0 1 1 1 1 0 = 0 + 1 + 1 − 0 − 0 − 0 = 2. = 0 + 0 + 0 − 1 − 0 − 1 = −2. Die zweite Matrix entsteht durch Spaltentausch aus der ersten. Linearkombinationen und Koordinatenvektoren Erneut in Analogie zur Ebene definieren wir: Definition (Spann, Linearkombination) Seien v, w, u P R3 . Dann heißt span(v, w, u) = { λ1 v + λ2 w + λ3 u | λ1 , λ2 , λ3 P R } der Spann von v, w, u. Für alle λ1 , λ2 , λ3 P R heißt λ1 v + λ2 w + λ3 w eine Linearkombination von v, w, u. Einführung in die Mathematik 1 © Oliver Deiser 6. Der Euklidische Raum 463 Der Spann dreier Vektoren kann { 0 }, eine Gerade, eine Ebene oder der ganze Raum R3 sein. In jedem Fall enthält der Spann den Nullvektor als Element. Definition (Koordinaten, Koordinatenvektor bzgl. einer Basis) Seien v, w, u P R3 linear unabhängig, s P R3 und λ1 , λ2 , λ3 P R mit s = λ1 v + λ2 w + λ3 u. Dann heißt (λ1 , λ2 , λ3 ) der Koordinatenvektor von s bzgl. der Basis (v, w, u). Die Eindeutigkeit des Koordinatenvektors ergibt sich elegant aus der eindeutigen Nulldarstellung bei linearer Unabhängigkeit: Gilt s = λ1 v + λ2 w + λ3 u = µ1 v + µ2 w + µ3 u, so ist 0 = (λ1 − µ1 ) v + (λ2 − µ2 ) w + (λ3 − µ3 ) u. Da die Vektoren v, w, u linear unabhängig sind, gilt λi − µi = 0 und also λi = µi für alle i = 1, 2, 3. Lineare Gleichungssysteme Wir betrachten nun reelle lineare Gleichungssysteme mit drei Gleichungen und drei Unbekannten. Ein solches System hat die Form: (+) a1 x + b1 y + c1 z = u1 a2 x + b2 y + c2 z = u2 a3 x + b3 y + c3 z = u3 mit Koeffizienten a1 , a2 , a3 , b1 , b2 , b3 , c1 , c2 , c3 P R, Unbekannten x, y, z P R, rechter Seite u = (u1 , u2 , u3 ) P R3 , Lösungsmenge L = { (x, y, z) P R3 | ai x + bi y + ci z = ui für alle i = 1, 2, 3 }. Ist L ≠ ∅, so heißt das System lösbar. Andernfalls heißt es unlösbar. Besitzt L genau ein Element, so heißt das System eindeutig lösbar. Notieren wir Vektoren des Raumes als Spaltenvektoren, so schreibt sich das System (+) in der Form (++) a1 b1 c1 x a + y b + z c = x a2 + y b2 + z c2 a3 b3 c3 © Oliver Deiser u1 = u2 = u. u3 Einführung in die Mathematik 1 464 4. Abschnitt Ebene und Raum Auf der linken Seite stehen Linearkombinationen der aus den Koeffizienten des Systems gebildeten Vektoren a, b, c. Diese Vektoren sind genau dann linear unabhängig, wenn det(a, b, c) ≠ 0. Grundlegende Eigenschaften der Lösungsmenge (1) L ≠ ∅ genau dann, wenn u P span(a, b, c). (2) Ist det(a, b, c) ≠ 0, so ist der Koordinatenvektor von u bzgl. der Basis (a, b, c) die eindeutige Lösung des Systems. (3) Ist det(a, b, c) = 0, so kann L die leere Menge, eine affine Gerade, eine affine Ebene oder der ganze Raum R3 sein. Erneut ist folgende Unterscheidung nützlich: Definition (homogen, inhomogen) Ist die rechte Seite u eines Gleichungssystems der Nullvektor, so nennen wir das System homogen. Andernfalls heißt es inhomogen. Ein Gleichungssystem ist genau dann homogen, wenn es durch den Nullvektor gelöst wird. Im Gegensatz zu einem inhomogenen System ist also ein homogenes System immer lösbar. Jedem System können wir ein homogenes System durch Nullsetzen der rechten Seite zuordnen. Ist das System lösbar, L seine Lösungsmenge, (x*, y*, z*) P L beliebig und L0 die Lösungsmenge des zugeordneten homogenen Systems, so gilt erneut L = (x*, y*, z*) + L0 = { (x*, y*, z*) + (x, y, z) | (x, y, z) P L0 }. Im Fall der Lösbarkeit gilt also wie im zweidimensionalen Fall: Lösung = spezielle Lösung + homogene Lösung Struktur der Lösungsmenge (1) Es gilt det(a, b, c) ≠ 0 genau dann, wenn das System eindeutig lösbar ist. In diesem Fall ist L = { (x*, y*, z*) } und L0 = { 0 }. (2) Ist L eine affine Gerade oder Ebene, so ist L0 eine Gerade bzw. Ebene durch den Nullpunkt und L die um (x*, y*, z*) verschobene Menge L0 . (3) Ist L der gesamte Raum, so gilt dies auch für L0 . Dieser Fall tritt nur für a = b = c = u = 0 auf. (4) Aus L0 ≠ ∅ folgt nicht, dass L ≠ ∅. Der Fall a = b = c = 0 und u ≠ 0 zeigt, dass L = ∅ und L0 = R3 gelten kann. Einführung in die Mathematik 1 © Oliver Deiser 6. Der Euklidische Raum 465 Übungen Übung 1 Sei σ P R3 , s ≠ 0, und sei E = { v P R3 | 〈v, s〉 = 0 }. Diskutieren Sie, wie Sie mit Hilfe der Komponenten von s eine Spanndarstellung von E erhalten können. Führen Sie Ihre Konstruktion an konkreten Beispielen durch. Übung 2 Sei E ⊆ R3 eine Ebene, und seien v, w P E linear unabhängig. Zeigen Sie, dass E = E(v, w). Übung 3 Zeigen Sie, dass für alle v, w, u P R3 und λ P R gilt: (i) 〈v × w, v〉 = 〈v × w, w〉 = 0, (Orthogonalität) (ii) v × w = − (w × v), (Antikommutativität) (iii) (λv) × w = λ (v × w), (v + u) × w = v × w + u × w, v × (λw) = λ (v × w), v × (w + u) = v × w + v × u, (iv) v × v = 0, (Alternation) (v) v × (w × u) = 〈v, u〉 w − 〈v, w〉 u, (Grassmann-Identität) (vi) v × (w × u) + u × (v × w) + w × (u × v) = 0, (vii) i v × w i = i v i i w i − 〈v, w〉 . 2 (Bilinearität) 2 2 2 (Jacobi-Identität) (Lagrange-Identität) Übung 4 Zeigen Sie, dass für alle v, w, u, s P R3 gilt: (v × w) × (u × s) = det(v, w, s) u − det(v, w, u) s. Übung 5 Seien E1 und E2 zwei Ebenen des R3 in Orthogonaldarstellung mit E1 ≠ E2 . Bestimmen Sie die Gerade G = E1 ∩ E2 . Übung 6 Zeigen Sie, dass für alle v1 , v2 , w1 , w2 P R3 gilt: 〈v1 × v2 , w1 × w2 〉 = 〈v1 , v2 〉 〈w1 , w2 〉 − 〈v1 , w2 〉 〈w1 , v2 〉. Übung 7 Illustrieren Sie den von v, w, u P R3 aufgespannten Spat P und die Formel V(P) = f h = i v × w i cos(ψ) i u i = 〈v × w, u〉 für das orientierte Volumen von P durch ein Diagramm. © Oliver Deiser Einführung in die Mathematik 1 466 4. Abschnitt Ebene und Raum Übung 8 Zeigen Sie, dass für alle v, w, v1 ,v2 , w1 , w2 , u1 , u2 P R3 und alle λ P R gilt: (i) det(e1 , e2 , e3 ) = 1, (ii) det(v, w, u) = 0, falls v = w oder v = u oder w = u, (iii) det(v, w, u) = − det(w, v, u) = − det(u, w, v) = − det(v, u, w), (iv) det(λ v, w, u) = det(v, λ w, u) = det(v, w, λ u) = λ det(v, w, u), det(v1 + v2 , w, u) = det(v1 , w, u) + det(v2 , w, u), det(v, w1 + w2 , u) = det(v, w1 , u) + det(v, w2 , u), det(v, w, u1 + u2 ) = det(v, w, u1 ) + det(v, w, u2 ). Übung 9 Seien G1 = u1 + { λ v1 | λ P R } und G2 = u2 + { λ v2 | λ P R } affine Geraden im R3 mit linear unabhängigen Vektoren v1 , v2 . Geben Sie mit Hilfe des Skalar- und Kreuzprodukts eine Bedingung an, die genau dann zutrifft, wenn sich G1 und G2 schneiden. Übung 10 Sei T das räumliche Tetraeder mit den Ecken 0, v, w, u P R3 . Geben Sie mit Hilfe des Skalar- und Kreuzprodukts eine Formel für das Volumen von T an (unter Verwendung der Volumenformel „1/3 Grundfläche mal Höhe“). Übung 11 Seien v* P R3 , G eine affine Gerade und E eine affine Ebene des R3 . Geben Sie drei lineare Gleichungssysteme an, die { v* }, G bzw. E als Lösungsmenge besitzen. Übung 12 Sei K : R3 × R3 → R3 eine Funktion mit den Eigenschaften: (a) K(e1 , e2 ) = e3 , K(e2 , e3 ) = e1 , K(e3 , e1 ) = e2 . (b) K(v, w) = − K(w, v) für alle v, w P R3 . (c) K ist bilinear, d. h. für alle v, w, u P R3 und λ P R gilt K(λ v, w) = K(v, λ w) = λ K(v, w), K(v + u, w) = K(v, w) + K(u, w), K(v, w + u) = K(v, w) + K(v, u). Zeigen Sie, dass K(v, w) = v × w für alle v, w P R3 gilt. Einführung in die Mathematik 1 © Oliver Deiser 7. (3 × 3)-Matrizen In Analogie zu den reellen 2 × 2-Matrizen betrachten wir nun reelle 3 × 3-Matrizen, also quadratische Gebilde aus neun reellen Zahlen. Erneut eignen sich diese Matrizen zur Lösung von Gleichungssystemen (mit drei Gleichungen und drei Unbekannten) und zur Beschreibung von linearen Abbildungen (des dreidimensionalen Raumes). Nicht mehr ganz so einfach wie im Fall n = 2 ist die Invertierung. Wir diskutieren hierzu einen Algorithmus, der das Inverse einer Matrix durch wiederholte Multiplikation mit Elementarmatrizen erzeugt und sich ohne Schwierigkeiten auf höhere Dimensionen verallgemeinern lässt. © Oliver Deiser Einführung in die Mathematik 1 468 4. Abschnitt Ebene und Raum Grundlegendes Eine reelle 3 × 3-Matrix hat die Form a11 a12 a13 A = a21 a22 a23 = (aij )1 ≤ i,j ≤ 3 a31 a32 a33 mit reellen Zahlen A(i, j) = aij , den Einträgen der Matrix. Formal können wir A wieder als eine Funktion von { 1, 2, 3 } × { 1, 2, 3 } nach R ansehen. Viele Begriffsbildungen, Notationen und Konventionen lassen sich von 2 × 2-Matrizen auf 3 × 3-Matrizen in natürlicher Weise übertragen. So sind zum Beispiel der Vektor (a11 , a22 , a33 ) P R3 die (Haupt-) Diagonale und der Skalar a11 + a22 + a33 die Spur von A. Sind alle Einträge außerhalb der Hauptdiagonalen gleich 0, so heißt die Matrix A eine Diagonalmatrix. Die Diagonalmatrix mit der Diagonale (a, b, c) bezeichnen wir wieder mit diag(a, b, c). Die Vektoren (a11 , a12 , a13 ), (a21 , a22 , a23 ), (a31 , a32 , a33 ) P R3 heißen die Zeilenvektoren von A, die Vektoren (a11 , a21 , a31 ), (a12 , a22 , a32 ), (a13 , a23 , a33 ) P R3 die Spaltenvektoren von A. Wir verwenden wieder ein Komma bzw. einen Strichpunkt zur Unterscheidung von Zeilen und Spalten. Für drei Vektoren u, v, w des R3 ist also A = (v, w, u) die Matrix mit den Zeilen v, w, u, während B = (v; w; u) die Matrix mit den Spalten v, w, u ist. Ist A = (v, w, u), so heißt At = (v; w; u) die zu A transponierte Matrix. Es gilt also At (i, j) = A(j, i) für alle 1 ≤ i, j ≤ 3. Gilt A = At , so heißt A symmetrisch. Matrix-Operationen Wir setzen R 3×3 = { A | A ist eine reelle 3 × 3-Matrix }. Sind A, B P R3 × 3 , v P R3 und λ P R, so setzen wir A + B = (aij + bij )1 ≤ i,j ≤ 3 , λA = (λaij )1 ≤ i,j ≤ 3 , A v = (ai1 v1 + ai2 v2 + ai3 v3 )1 ≤ i ≤ 3 , AB = (ai1 b1j + ai2 b2j + ai3 b3j )1 ≤ i,j ≤ 3 . Einführung in die Mathematik 1 (Matrizenaddition) (Skalarmultiplikation) (Matrix-Vektor-Produkt) (Matrizenprodukt) © Oliver Deiser 7. (3 × 3)-Matrizen 469 Weiter seien −A = (−1)A und A − B = A + (−B). Es gilt Av P R3 und AB P R3 × 3 . Die Matrizenprodukte lassen sich wieder durch „Zeile mal Spalte“ beschreiben. Ist B = (b1 ; b2 ; b3 ), so gilt AB = (Ab1 ; Ab2 ; Ab3 ). Nützlich ist die Darstellung AB = C mit cij = ∑ 1 ≤ k ≤ 3 aik bkj für alle 1 ≤ i, j ≤ 3. Zur Berechnung von AB sind neun Einträge zu berechnen, die alle die Form eines reellen Skalarprodukts haben. Es gilt wieder A(BC) = (AB)C (Assoziativität), während die Kommutativität AB = BA im Allgemeinen verletzt ist. Die Nullmatrix 0 ist die Matrix, deren Einträge alle gleich 0 sind. Die Rolle der 1 übernimmt die Einheitsmatrix E3 = (e1 , e2 , e3 ) = (e1 ; e2 ; e3 ), mit den kanonischen Basisvektoren e1 = (1, 0, 0), e2 = (0, 1, 0), e3 = (0, 0, 1). Es gilt A + 0 = 0 + A = A, A E3 = E3 A = A für alle A P R3 × 3 . Beispiele (1) 0 = (2) (3) (4) 0 0 0 0 0 0 0 0 0 , E3 = diag(1, 1, 1) = 1 0 1 0 1 0 1 0 1 0 1 1 0 0 1 0 0 0 1 0 1 1 1 0 0 1 2 1 1 2 1 0 1 1 0 1 1 0 0 −1 1 0 2 1 1 1 (5) 1 Ist A = © Oliver Deiser + 2 = 5 6 7 8 9 0 0 0 1 0 0 0 1 1 1 2 0 1 1 1 0 1 3 = 1 5 = 1 −1 3 4 1 t , so gilt A = 2 1 0 1 0 1 2 2 1 1 4 7 2 5 8 3 6 9 . Einführung in die Mathematik 1 470 4. Abschnitt Ebene und Raum Matrizen als lineare Abbildungen Wie für 2 × 2-Matrizen definieren wir: Definition (zugeordnete Abbildung) Sei A P R3 × 3 . Dann ist die A zugeordnete Abbildung fA : R3 → R3 definiert durch fA (v) = A v für alle v P R3 . Es gilt wieder fA B = fA + fB für alle A, B P R3 × 3 . Die Abbildungen fA entsprechen erneut den linearen Abbildungen des Raumes: Definition (lineare Abbildung) Eine Abbildung f : R3 → R3 heißt linear, falls für alle v, w P R3 und alle λ, µ P R gilt: f(λ v + µ w) = λ f(v) + µ f(w). (Linearitätsbedingung) Jede Abbildung fA : R3 → R3 ist linear und umgekehrt lässt sich jede lineare Abbildung f : R3 → R3 eindeutig durch eine Matrix A darstellen, d. h., es gibt genau ein A P R3 × 3 mit f = fA . Der für die Ebene geführte Beweis kann übernommen werden. Die darstellende Matrix A einer linearen Abbildung f erhalten wir, indem wir die Bilder der kanonischen Basisvektoren unter f bestimmen und als Spalten in eine Matrix schreiben: A = (f(e1 ); f(e2 ); f(e3 )). Wir betrachten wieder Projektionen und Rotationen als Beispiele. Projektionsmatrizen Im dreidimensionalen Raum können wir einen Vektor v orthogonal auf eine Gerade G oder eine Ebene E projizieren. Wie in der Ebene ist das Euklidische Skalarprodukt das entscheidende Hilfsmittel. 1. Die Projektion auf eine Gerade Sei G = G(u) die von einen normierten Vektor u P R3 aufgespannte Gerade. Dann ist die orthogonale Projektion prG : R3 → R3 auf die Gerade G definiert durch prG (v) = 〈u, v〉 u für alle v P R3 . Es gilt prG (v) P G und 〈u, v − prG (v)〉 = 0, sodass der Vektor v − prG (v) senkrecht auf u steht. Die darstellende Matrix AG von prG hat die Spalten prG (ei ) = 〈u, ei 〉 u = ui u für i = 1, 2, 3, sodass Einführung in die Mathematik 1 © Oliver Deiser 7. (3 × 3)-Matrizen u1 u1 AG = u2 u1 u1 2 u3 u1 u1 u2 u2 u2 u3 u2 u1 u3 u2 u3 u3 u3 = u1 u2 2 u1 u2 u2 u1 u3 u2 u3 471 u1 u3 u2 u3 . u3 2 Die Projektion des Vektors v auf die von u erzeugte Gerade G 2. Die Projektion auf eine Ebene Sei E = E(u, w) die von den linear unabhängigen Vektoren u, w P R3 aufgespannte Ebene. Wir nehmen an, dass die Vektoren u und w orthogonal und normiert sind. Dann ist die orthogonale Projektion prE : R3 → R3 auf die Ebene E definiert durch prE (v) = prG(u) (v) + prG(w) (v) = 〈u, v〉 u + 〈w, v〉 w für alle v P R3 mit den von u und w aufgespannten Geraden G(u) und G(w). Ist v P R3 , so gilt prE (v) P E und 〈u, v − prE (v)〉 = 〈w, v − prE (v)〉 = 0, sodass der Vektor v − prE (v) senkrecht auf u und w steht und damit kollinear zu u × w ist. Die darstellende Matrix AE von prE ist die Summe der darstellenden Matrizen von prG(u) und prG(w) , sodass u1 u1 + w1 w1 u2 u1 + w2 w1 u3 u1 + w3 w1 AE = AG(u) + AG(w) = u1 u2 + w1 w2 u2 u2 + w2 w2 u3 u2 + w3 w2 . u1 u3 + w1 w3 u2 u3 + w2 w3 u3 u3 + w3 w3 © Oliver Deiser Einführung in die Mathematik 1 472 4. Abschnitt Ebene und Raum Die Projektion von v auf die von u und w erzeugte Ebene lässt sich als Summe der Projektionen auf die erzeugten Geraden G(u) und G(w) auffassen. Alle Projektionsmatrizen sind symmetrisch. Der Leser vergleiche die Ergebnisse mit den Projektionsmatrizen der Ebene. Rotationsmatrizen Sei ϕ P R. Dann stellt die Matrix Aϕ = 1 0 0 0 cosϕ −sinϕ 0 sinϕ cosϕ die Rotation im R3 um den Winkel ϕ (gegen den Uhrzeigersinn) mit der x-Achse als Drehachse dar. In den Spalten stehen die Bilder von e1 , e2 , e3 unter der Rotation. Analog beschreiben Bψ = cos ψ 0 sinψ 0 1 0 −sinψ 0 cosψ , Cχ = cosχ −sinχ 0 sinχ cosχ 0 0 0 1 die Rotationen um die Winkel ϕ um die y-Achse bzw. χ um die z-Achse. Da die Komposition von Rotationen wieder eine Rotation ergibt, sind auch alle Produkte dieser Matrizen wieder Rotationen. Man kann zeigen, dass sich jede Rotation des R3 als Produkt der Form Aϕ Bψ Cχ darstellen lässt. Dieses Produkt berechnet sich zu Einführung in die Mathematik 1 © Oliver Deiser 7. (3 × 3)-Matrizen cos χ cos ψ −cos ψ sin χ 473 sin ψ cos ϕ sin χ + cos χ sin ϕ sin ψ cos χ cos ϕ − sin χ sin ϕ sin ψ −cos ψ sin ϕ sin χ sin ϕ − cos χ cos ϕ sin ψ cos χ sin ϕ + cos ϕ sin χ sin ψ cos ϕ cos ψ . Eine Rotation f : R3 → R3 lässt sich auch als Drehung um einen Winkel ϕ mit einer durch einen normierten Vektor s P R3 definierten Achse G = G(s) beschreiben. Eine geometrische Analyse zeigt, dass f(v) = 〈s, v〉 s + cos ϕ (s × v) × s + sin ϕ (s × v) für alle v P R3 . Dabei ist der erste Summand die Projektion von v auf die Drehachse G. Die Vektoren v1 = (s × v) × s und v2 = (s × v) liegen in der zu G orthogonalen Ebene E und die beiden zugehörigen Summanden beschreiben die Drehung von v1 = prE (v) um ϕ in E. Genaueres besprechen wir in den Übungen. Die Rotation f(v) von v um die Drehachse G und den Winkel ϕ = π/4 Die darstellende Matrix A = (f(e1 ); f(e2 ); f(e3 )) der Rotation f berechnet sich mit w(ϕ) = 1 − cos ϕ zu s1 2 w(ϕ) + cos ϕ s1 s2 w(ϕ) − s3 sin ϕ s1 s3 w(ϕ) + s2 sin ϕ s1 s2 w(ϕ) + s3 sin ϕ s2 2 w(ϕ) + cos ϕ s2 s3 w(ϕ) − s1 sin ϕ s1 s3 w(ϕ) − s2 sin ϕ s2 s3 w(ϕ) + s1 sin ϕ s3 w(ϕ) + cos ϕ © Oliver Deiser . 2 Einführung in die Mathematik 1 474 4. Abschnitt Ebene und Raum Invertierbarkeit Wie für 2 × 2-Matrizen definieren wir: Definition (invertierbar, invers, singulär) Sei A P R3 × 3 . Gibt es ein B P R3 × 3 mit BA = E3 = BA, so heißt A invertierbar und B invers zu A. Andernfalls heißt A singulär. Eine inverse Matrix ist im Fall der Existenz erneut eindeutig bestimmt, sodass wir das Inverse einer invertierbaren Matrix A mit A−1 bezeichnen können. Für alle invertierbaren Matrizen A, B P R3 × 3 gelten die Invertierungsregeln (A−1 )−1 = A, (A B)−1 = B−1 A−1 . Die für 2 × 2-Matrizen geführten Beweise können übernommen werden. Beispiel Hat A eine Nullzeile, so ist A singulär. Denn aus „Zeile mal Spalte“ folgt, dass für jede Matrix B auch A B eine Nullzeile besitzt, sodass AB ≠ E3 . Analog ist A singulär, wenn A eine Nullspalte besitzt. Ein Gleichungssystem (+) a1 x + b1 y + c1 z = u1 a2 x + b2 y + c2 z = u2 a3 x + b3 y + c3 z = u3 können wir wieder kompakt in der Form A (x, y, z) = u notieren, mit der Koeffizientenmatrix A = (a; b; c) P R3 × 3 des Systems. Wie früher gilt: Lösung durch Invertierung Ist A invertierbar, so wird für alle rechten Seiten u P R3 das Gleichungssystem A (x, y, z) = u eindeutig durch den Vektor A−1 u gelöst. Die eindeutige Lösbarkeit von Av = u ist erneut äquivalent zu det(A) ≠ 0. Damit ist A genau dann invertierbar, wenn det(A) ≠ 0. Im Fall n = 2 konnten wir das Inverse einer Matrix mit Hilfe der Komplementärmatrix relativ leicht direkt angeben. Für 3 × 3-Matrizen ist eine explizite Formel für das Inverse komplizierter. Anstelle einer solchen Formel betrachten wir einen Invertierungsalgorithmus, der sich leicht auf beliebige (n × n)-Matrizen verallgemeinern lässt. Einführung in die Mathematik 1 © Oliver Deiser 7. (3 × 3)-Matrizen 475 Der Invertierungsalgorithmus Wir beschreiben zunächst den Algorithmus und illustrieren ihn durch Beispiele. Anschließend zeigen wir, dass der Algorithmus korrekt ist. Invertierungsalgorithmus Gegeben ist eine beliebige Matrix A P R3 × 3 . Wir versuchen, A durch schrittweise elementare Zeilenoperationen in die Einheitsmatrix E3 zu überführen. Dadurch entsteht eine endliche Folge A = A0 , …, Ak von 3 × 3-Matrizen. An Zeilenoperationen sind dabei erlaubt: (a) Multiplikation einer Zeile mit λ ≠ 0. (b) Addition des λ-fachen einer Zeile zu einer anderen Zeile. Parallel hierzu führen wir die Zeilenoperationen an der Einheitsmatrix E3 durch, sodass eine zweite endliche Folge von 3 × 3-Matrizen E3 = B0 , …, Bk entsteht. Wird beim Versuch, A in E3 zu überführen eine Nullzeile oder Nullspalte produziert, so stoppen wir das Verfahren mit dem Ergebnis „A ist singulär“. Andernfalls geben wir die Matrix Bk als Ergebnis aus. Die Zeilenoperationen werden mit dem Ziel durchgeführt, die Matrix unterhalb und oberhalb der Diagonalen auszuräumen (Nulleinträge zu erzeugen) und die Diagonaleinträge gleich 1 zu setzen. Beispiel: Erzeugung einer Nullzeile A0 = A1 = A2 = 1 1 0 1 0 1 0 1 1 0 0 0 1 0 2 −2 0 0 1 1 1 0 0 −1 1 0 B0 = 0 0 −1 1 B1 = 0 2 −2 0 0 1 1 1 1 0 0 −1 1 0 −2 2 1 0 0 −1 1 0 0 0 B2 = Im ersten Schritt addieren wir das (−1)-Fache der ersten Zeile zur zweiten, d. h. wir subtrahieren die erste Zeile von der zweiten. Im zweiten Schritt addieren wir das 2-Fache der zweite Zeile zur dritten. Da A3 eine Nullzeile besitzt, ist das Ergebnis der Berechnung „nicht invertierbar“. © Oliver Deiser Einführung in die Mathematik 1 476 4. Abschnitt Ebene und Raum Beispiel: Überführung in die Einheitsmatrix A0 = A1 = A2 = A3 = A4 = A5 = A6 = A7 = 1 1 0 1 0 1 1 0 0 0 1 0 1 −1 1 0 0 1 1 1 0 0 −1 1 0 1 −1 1 0 0 1 1 1 0 0 −1 1 0 0 −2 1 −1 0 1 1 1 0 0 −1 1 0 1 0 0 −1 1 1 B1 = 0 0 −1 1 1 B0 = B2 = 0 0 −1 1 B3 = 0 0 −1 1 −2 1 1 1 1 0 0 −1 0 B4 = 0 0 0 −1 1 0 0 −1 1 −2 1 1 0 1 −1 1 0 0 −1 0 B5 = 0 −1 1 0 0 −1 1 −2 1 1 0 0 1 −1 1 0 1 0 0 0 −1 1 −2 1 1 0 0 1 −1 1 0 1 0 0 0 1 B6 = B7 = 0 0 1 −1 1 −1 −1 2 −1 Die ersten fünf Operationen sind Zeilenadditionen, die beiden letzten Zeilenmultiplikationen. Es gilt A7 = E3 . Das Ergebnis der Berechnung ist also B = B7 . Nachrechnen zeigt, dass BA = E3 , sodass B = A−1 . Einführung in die Mathematik 1 © Oliver Deiser 7. (3 × 3)-Matrizen 477 Die Elementarmatrizen Wir zeigen nun, dass der Invertierungsalgorithmus korrekt ist: Er eignet sich als Test auf Invertierbarkeit und er produziert im invertierbaren Fall das Inverse der Ausgangsmatrix. Hierzu führen wir spezielle Matrizen ein, mit deren Hilfe wir die elementaren Zeilenoperationen als Matrizenmultiplikation von links darstellen können. Definition (Elementarmatrix, Additionstyp, Multiplikationstyp) Seien 1 ≤ i, j ≤ 3 und λ P R. Dann ist Wij (λ) P R3 × 3 definiert als die Matrix, die mit der Einheitsmatrix E3 übereinstimmt, aber an der Stelle (i, j) den Eintrag λ besitzt. Eine solche Matrix W heißt eine Elementarmatrix, falls W = Wi j (λ) mit λ P R, i ≠ j, oder (Additionstyp) W = Wi j (λ) mit λ P R*, i = j. (Multiplikationstyp) Die Matrix Wij (λ) entsteht, indem wir den Eintrag der Einheitsmatrix an der Stelle (i, j) mit dem Skalar λ überschreiben. Befindet sich der neue Eintrag außerhalb der Hauptdiagonalen, so erhalten wir einen Additionstyp. Wird eine Eins der Diagonalen durch λ ≠ 0 ersetzt, so erhalten wir einen Multiplikationstyp. Die Namensgebung wird erklärt durch: (1) Ist A P R3 × 3 und W = Wij (λ) ein Additionstyp, so ist WA die Matrix, die entsteht, wenn wir das λ-Fache der j-ten Zeile zur i-ten Zeile von A addieren. (2) Ist A P R3 × 3 und W = Wii (λ) ein Multiplikationstyp, so ist WA die Matrix, die entsteht, wenn wir die i-te Zeile von A mit λ multiplizieren. Beispiel W23 (5) = W32 (5) = 1 0 0 0 1 5 0 0 1 1 2 1 0 0 1 1 0 1 0 0 5 1 1 , , W23 (5) W32 (5) 1 2 1 1 2 5 8 4 1 1 2 1 2 1 1 2 0 −2 −1 0 −2 −1 1 2 1 = = 0 −2 1 1 −8 −4 Für die Multiplikation AW einer Matrix A mit einer Elementarmatrix W von rechts gelten analoge Aussagen für die Spalten von A. Für einen Additionstyp W vertauschen sich dabei die Indizes, sodass AW entsteht, indem wir das λ-Fache der i-ten Spalte zur j-ten Spalte von A addieren. © Oliver Deiser Einführung in die Mathematik 1 478 4. Abschnitt Ebene und Raum Eine Elementarmatrix ist invertierbar und ihr Inverses ist wieder eine Elementarmatrix: (1) Das Inverse eines Additionstyps Wij (λ) ist Wij (−λ). (2) Das Inverse eines Multiplikationstyps Wii (λ) ist Wii (1/λ). Den Invertierungsalgorithmus können wir nun so beschreiben: Gegeben A, versuchen wir, Elementarmatrizen L1 , …, L k zu finden, sodass (+) L k … L1 A = E3 . Gelingt dies, so ist B = L k … L1 = A−1 , da B A = Lk … L1 A = E3 nach (+). Wegen B = B E3 = L k … L1 E3 erzeugt unser Algorithmus im invertierbaren Fall also das Inverse von A in der parallel ausgeführten Zeilenmanipulation von E3 . Mit obigen Notationen gilt A0 = A, A1 = L1 A0 , A2 = L2 A1 = L2 L1 A, … B0 = E3 , B1 = L1 B0 = L1 , B2 = L2 B1 = L2 L1 , … Wird eine Nullzeile oder Nullspalte erzeugt, so ist die Matrix Ak = Lk … L1 A nicht invertierbar. Da alle Li invertierbar sind, ist notwendig A singulär. Damit ist die Korrektheit des Algorithmus vollständig bewiesen. Unsere Überlegungen zeigen (angewendet auf B = A−1 ), dass jede invertierbare Matrix A als ein Produkt von Elementarmatrizen dargestellt werden kann: Satz (Zerlegung einer invertierbaren Matrix in Elementarmatrizen) Sei A P R3 × 3 invertierbar. Dann gibt es ein k ≥ 1 und Elementarmatrizen L1 , …, Lk mit A = Lk … L1 . Dieser bemerkenswerte Satz gilt analog auch für höhere Dimensionen. Bemerkung: Deterministische Version des Invertierungs-Algorithmus Wir haben bei unserer Formulierung des Algorithmus keine Strategie vorgegeben, wie der Versuch der Umwandlung von A in E3 durchzuführen ist. Es gibt verschiedene Möglichkeiten, dies zu organisieren. Eine deterministische Version erhalten wir zum Beispiel, indem wir solange möglich (1) A Spalte für Spalte unterhalb der Hauptdiagonalen ausräumen, (2) A Spalte für Spalte oberhalb der Hauptdiagonalen ausräumen, (3) die Diagonale normieren. Alternativ können wir die Spalten von A auch gleich unter- und oberhalb der Diagonalen ausräumen und dabei auch die Normierung der Diagonaleinträge durchführen. Einführung in die Mathematik 1 © Oliver Deiser 7. (3 × 3)-Matrizen 479 Eigenwerte und Eigenvektoren Wie für die Dimension n = 2 definieren wir: Definition (Eigenwerte und Eigenvektoren) Seien A P R3 × 3 , λ P R und v P R2 mit v ≠ 0. Dann heißt λ ein Eigenwert und v ein zu λ gehöriger Eigenvektor von A, falls A v = λ v. Erneut gilt für alle A P R3 × 3 , λ P R und v P R3 die Äquivalenz: A v = λ genau dann, wenn (A − λE2 ) v = 0. Mit Aλ = A − λ E3 , ist also λ genau dann ein Eigenwert von A, wenn das homogene Gleichungssystem Aλ v = 0 eine vom Nullvektor verschiedene Lösung v besitzt. Dies ist genau dann der Fall, wenn det(Aλ ) = 0. Wir definieren: Definition (charakteristisches Polynom) Sei A P R3 × 3 . Dann heißt das Polynom pA : R → R dritten Grades mit pA (λ) = det(Aλ ) = det(A − λE3 ) für alle λ P R das charakteristische Polynom von A. Die Eigenwerte von A sind genau die reellen Nullstellen von pλ . Eine Berechnung der Determinante von Aλ zeigt, dass pA (λ) = −λ3 + spur(A) λ2 − (det(A′11 ) + det(A′22 ) + det(A′33 )) λ + det(A) für alle λ P R, wobei A′ij die (2 × 2)-Matrix ist, die aus A durch Streichen der i-ten Zeile und j-ten Spalte hervorgeht. Beispiel Für die obere Dreiecksmatrix A = ((1, 2, 3), (0, 1, 1), (0, 0, 1)) gilt A′11 = 1 1 0 1 , A′22 = 1 3 0 1 , A′33 = 1 2 0 1 , pA (λ) = −λ3 + 3λ2 − 3λ + 1 = − (λ − 1)3 für alle λ P R. Damit ist λ = 1 eine dreifache Nullstelle von A. Lösen von (A − E3 ) v = 0 zeigt, dass genau die Vektoren µe1 mit µ P R* Eigenvektoren von A zum Eigenwert 1 sind. Die Matrix A ist ein Beispiel dafür, dass zu einem mehrfachen Eigenwert nicht notwendig zwei oder mehr linear unabhängige Eigenvektoren gehören müssen. Das charakteristische Polynom einer (3×3) Matrix hat stets den Grad 3. Da ein reelles Polynom ungeraden Grades eine reelle Nullstelle besitzt, erhalten wir: © Oliver Deiser Einführung in die Mathematik 1 480 4. Abschnitt Ebene und Raum Satz (Existenz von Eigenwerten) Jede reelle (3 × 3)-Matrix besitzt mindestens einen reellen Eigenwert. Beschreibt zum Beispiel A eine Rotation des dreidimensionalen Raumes, so sind die von Null verschiedenen Vektoren der Drehachse Eingenvektoren von A zum Eigenwert 1. Ist die Rotation echt (also nicht die Identität auf R3 ), so gibt es keine weiteren Eigenwerte und Eigenvektoren. Erneut gilt (mit einem etwas komplizierteren Beweis) der fundamentale: Satz (Spektralsatz) Sei A P R3 × 3 . Dann sind äquivalent: (a) A ist symmetrisch. (b) Es gibt paarweise zueinander orthogonale Eigenvektoren v,w,u von A. Hieraus ergibt sich erneut die Diagonalisierung A = S−1 D S einer symmetrischen Matrix A und die Singulärwertzerlegung A = S−1 D1/2 T einer beliebigen Matrix A, mit D diagonal und S, T orthogonal, d. h. S−1 = St , T−1 = Tt . Die Einheitssphäre S = { v P R3 | i v i = 1 } wird durch A in ein Ellipsoid E transformiert (das degeneriert ist, wenn A singulär ist). Die Singulärwerte von A sind die Halbachsen von E und die Spalten von S−1 sind normierte Halbachsenrichtungen. Beispiel Seien B die Rotationsmatrix der Drehung um die x-Achse und ϕ = π/4 und D = diag(3, 2, 1). Dann gilt cos ϕ = sin ϕ = 1/£2 und 0 3 0 cosϕ −sinϕ D = 0 £2 −1/£2 0 sinϕ cosϕ 0 £2 1 A = BD = 0 0 0 1/£2 beschreibt die Achsenskalierung gemäß D gefolgt von der Drehung B. Die Einheitssphäre wird zu einem Ellipsoid mit den Halbachsen 3, 2, 1. Einführung in die Mathematik 1 © Oliver Deiser 7. (3 × 3)-Matrizen 481 Übungen Übung 1 Seien G = span(u) und E = span(u, w) mit normierten und orthogonalen Vektoren u, w P R3 . Zeigen Sie, dass für alle v P R3 gilt: (a) prG (prG (v)) = prG (prE (v)) = prE (prG (v)) = prG (v), (b) prE (prE (v)) = prE (v). Was bedeuten diese Eigenschaften für die darstellenden Matrizen? Übung 2 Sei G = span(u) für einen normierten Vektor u P R3 . Weiter sei v P R3 . Zeigen Sie, dass der Vektor prG (v) P G den kleinsten Euklidischen Abstand zu v unter allen Vektoren von G besitzt. Übung 3 Formulieren und beweisen Sie eine zur vorangehenden Übung analoge Aussage für die orthogonale Projektion auf eine Ebene. Übung 4 Seien Aϕ , Bψ die Rotationsmatrizen für Drehungen um die x- bzw. y-Achse. Berechnen Sie Aϕ Bψ − Bψ Aϕ . Was lässt sich für im Betrag kleine Winkel ϕ und ψ feststellen? Betrachten Sie hierzu eine Taylor-Entwicklung der Einträge. Übung 5 Sei f : R3 → R3 die Rotation um den Winkel ϕ (gegen den Uhrzeigersinn) um eine durch einen normierten Vektor s P R3 gegebene Achse. (a) Begründen Sie die Formel f(v) = 〈s, v〉 s + cos ϕ (s × v) × s + sin ϕ (s × v) für alle v P R3 geometrisch. (b) Berechnen Sie mit Hilfe von (a) die darstellende Matrix von f. Übung 6 Was lässt sich über die Determinante einer Rotationsmatrix und einer Projektionsmatrix sagen? © Oliver Deiser Einführung in die Mathematik 1 482 4. Abschnitt Ebene und Raum Übung 7 Lösen Sie für eine beliebige rechte Seite u P R3 das Gleichungssystem x + 2y + 3z = u1 x + y + z = u2 2x + 2y + z = u3 durch Invertierung der Koeffizientenmatrix A = (a; b; c). Verwenden Sie dabei den Invertierungsalgorithmus zur Berechnung von A−1 . Übung 8 Wie lässt sich die Vertauschung zweier Zeilen einer Matrix durch Linksmultiplikation mit Elementarmatrizen gewinnen? Übung 9 Sei A P R3 × 3 invertierbar. Zeigen Sie, dass es Additionstypen L1 , …, Lk gibt derart, dass Lk … L1 A eine Diagonalmatrix ist. Einführung in die Mathematik 1 © Oliver Deiser 5. Abschnitt Mehrdimensionale Analysis © Oliver Deiser Einführung in die Mathematik 1 1. Kurven Wir betrachten nun stetige Funktionen der Form f : [a, b] → Rm , mit einem reellen Intervall [ a, b ] und einer beliebigen Dimension m ≥ 1, sog. Kurven. Für die analytische Untersuchung von Kurven genügt die eindimensionale Differentialund Integralrechnung: Die Ableitungen der Komponentenfunktionen einer Kurve liefern Tangentialvektoren und die Länge einer Kurve können wir mit Hilfe des Riemann-Integrals im Zusammenspiel mit der Euklidischen Norm berechnen. © Oliver Deiser Einführung in die Mathematik 1 486 5. Abschnitt Mehrdimensionale Analysis Vektoren als Funktionswerte Wir betrachten nun Funktionen der Form f : R → Rm oder allgemeiner f : P → Rm mit P ⊆ R. Dabei ist m eine beliebige natürliche Zahl größer oder gleich Eins. Der Definitionsbereich besteht aus reellen Zahlen, während die Funktionswerte Vektoren des Rm sind. Wichtige Spezialfälle sind wieder m = 2 und m = 3. In Erweiterung des Grenzwertbegriffs für reelle Folgen definieren wir: Definition (Grenzwerte im Rm ) Seien m ≥ 1, (xn )n P N eine Folge im Rm und y P Rm . Dann heißt y Grenzwert von (xn )n P N , falls gilt ∀ε > 0 ∃n0 ∀n ≥ n0 i y − xn i < ε. Im Vergleich zum eindimensionalen Begriff ist also lediglich der Abstand zweier reeller Zahlen durch den Abstand zweier Vektoren ersetzt. Dabei wird der Abstand zweier Vektoren mit Hilfe der Euklidischen Norm berechnet. Im Fall der Existenz ist der Grenzwert einer Folge erneut eindeutig bestimmt und wir schreiben wieder limn → ∞ xn oder limn xn für diesen Grenzwert. Ist (xn )n P N = ((xn, 1 , …, xn, m ))n P N eine Folge im Rm und y = (y1 ,…, ym ) P Rm , so sind äquivalent: (1) limn xn = y. (2) limn xn, k = yk für alle 1 ≤ k ≤ m. (komponentenweise Konvergenz) m Eine konvergente Folge im R besteht also aus m konvergenten reellen Folgen (der Leser vergleiche dies mit der Konvergenz einer Folge in C = R2 ). Hieraus ergeben sich Limesregeln für Folgen im Rm , z. B. limn (xn + yn ) = limn xn + limn yn . Auch die Stetigkeitsbegriffe können wir leicht erweitern: Definition (Stetigkeit für mehrdimensionale Funktionswerte) Seien m ≥ 1, P ⊆ R und f : P → Rm . Weiter sei p P P. Dann heißt f ε-δ-stetig oder umgebungsstetig an der Stelle p, falls gilt: ∀ε > 0 ∃δ > 0 ∀x P P (|x − p| < δ → i f(x) − f(p) i < ε). Weiter heißt f folgenstetig an der Stelle p, falls für jede Folge (xn )n P N in P gilt, dass limn xn = p → limn f(xn ) = f(p). Ist f umgebungs- bzw. folgenstetig an allen Stellen p P P, so heißt f umgebungsstetig bzw. folgenstetig. Einführung in die Mathematik 1 © Oliver Deiser 1. Kurven 487 Für die Dimension m = 2 besagt die ε-δ-Stetigkeit von f an der Stelle p, dass für jedes (noch so kleine) ε > 0 ein δ > 0 existiert derart, dass die Menge ] p − δ, p + δ [ ∩ P ⊆ R durch die Funktion f in die offene Kreisscheibe Uε (f(p)) = { (x, y) P R2 | i (x, y) − f(p) i < ε } ⊆ R2 mit Mittelpunkt f(p) und Radius ε abgebildet wird. Erneut ist ε mit dem Wertebereich und δ mit dem Definitionsbereich von f assoziiert. Die beiden Stetigkeitsbegriffe erweisen sich wie im eindimensionalen Fall als äquivalent, sodass wir auch kurz von Stetigkeit ohne Zusatz sprechen können. So wie wir eine Folge im Rm in m reelle Folgen aufspalten können, so können wir eine Funktion f : P → Rm in m reelle Funktionen zerlegen: Definition (Komponentenfunktionen) Seien m ≥ 1, P ⊆ R und f : P → Rm . Dann heißen die reellen Funktionen f1 , …, fm : P → R mit f(x) = (f1 (x), …, fm (x)) für alle x P P die Komponenten- oder Koordinatenfunktionen von f. Beispiele (1) Sei m = 2 und f : P → R2 . Dann können wir f als komplexwertige Funktion auffassen. Es gilt f1 (x) = Re(f(x)), f2 (x) = Im(f(x)) für alle x P P. (2) Sei m = 3 und f : R → R3 mit f(x) = (x, ex , sin x) für alle x P R. Dann ist f1 die Identität, f2 die Exponentialfunktion und f3 die Sinusfunktion auf R. Für alle m ≥ 1, P ⊆ R, f : P → Rm und p P P sind äquivalent: (1) f ist stetig an der Stelle p. (2) f1 , …, fm sind stetig an der Stelle p. (komponentenweise Stetigkeit) In dieser Weise kann der Stetigkeitsbegriff für vektorwertige Funktionen auf den skalarwertigen Fall zurückgeführt werden. Bemerkung Anstelle von „komponentenweiser Konvergenz/Stetigkeit“ und „Komponentenfunktionen“ sprechen wir gleichwertig auch von „koordinatenweiser Konvergenz/Stetigkeit“ bzw. „Koordinatenfunktionen“. Nach diesen technischen Vorbereitungen können wir uns dem eigentlichen Thema dieses Kapitels zuwenden. © Oliver Deiser Einführung in die Mathematik 1 488 5. Abschnitt Mehrdimensionale Analysis Parametrisierte Kurven Definition (Kurve, Parameter, Bahn, Spur) Sei m ≥ 1, und sei [ a, b ] ⊆ R ein reelles Intervall. Weiter sei f : [ a, b ] → Rm stetig. Dann heißt f eine (parametrisierte) Kurve im Rm und jedes t P [ a, b ] heißt ein Parameter von f. Der Wertebereich spur(f) = { f(t) | t P [ a, b ] } von f heißt auch die Bahn oder Spur von f. Wir bevorzugen hier die Variable t anstelle von x, um die in vielen Fällen nützliche dynamische Interpretation einer Kurve zu unterstützen. Dabei wird t als Zeitvariable und f(t) als der Ort eines sich in der Zeit t P [ a, b ] bewegenden Punktes interpretiert. Wir betonen, dass es sich um eine für die Dimensionen m = 2 und m = 3 anschauliche Interpretation handelt, die rein mathematisch nicht relevant ist. Wir können als Variable zum Beispiel auch x, y oder u verwenden, wenn wir möchten. Wichtig ist es, eine Kurve von ihrer Spur zu unterscheiden. Aus einer Kurve ergibt sich die Spur, aber nicht umgekehrt. Beim Übergang von f zu spur(f ) geht die Information verloren, wie die Spur durchlaufen wird: Durchlaufrichtung, Geschwindigkeit und Wiederholungen sind nicht mehr erkennbar. Oft liegt eine „linienartige“ Menge P ⊆ Rm vor, die man mit Hilfe einer Kurve analytisch beschreiben möchte. Gesucht ist eine Parametrisierung von P, d. h. eine Kurve f : [ a, b ] → Rm , deren Spur gleich P ist. Das Standardbeispiel ist die Parametrisierung des Einheitskreises K = { (x, y) P R2 | x2 + y2 = 1 }. Der Kreis K wird durch die Kurve f : [ 0, 2π ] → R2 mit f(t) = (cos t, sin t) für alle t P [ 0, 2π ] parametrisiert. Aber auch g : [ 0, 2π ] → R2 mit g(t) = (sin t, cos t) für alle t P [ 0, 2π ] ist eine Parametrisierung von K. Wir führen noch einige suggestive Sprechweisen ein. Definition (Startpunkt, Endpunkt, geschlossen, offen) Sei f : [ a, b ] → Rm eine Kurve. Dann heißt f(a) der Startpunkt und f(b) der Endpunkt von f. Gilt f(a) = f(b), so heißt die Kurve geschlossen. Andernfalls heißt sie offen. Einführung in die Mathematik 1 © Oliver Deiser 1. Kurven 489 Tangentialvektoren Mit Hilfe der Komponentenfunktionen können wir die Grundbegriffe der Differentialrechnung ohne Schwierigkeit auf Kurven übertragen: Definition (differenzierbar, Ableitung, Tangentialvektor, regulär, singulär) Sei f : [ a, b ] → Rm eine Kurve. Weiter sei t P [ a, b ]. Dann heißt f (stetig) differenzierbar an der Stelle t, falls alle Komponenten f1 , …, fm von f an der Stelle t (stetig) differenzierbar sind. Wir setzen dann f ′(t) = (f1 ′(t), …, fm ′(t)) P Rm . Der Vektor f ′(t) heißt die Ableitung oder der Tangentialvektor von f an der Stelle t. Ist f ′(t) ≠ 0, so heißt der Parameter t regulär. Ist f ′(t) = 0, so heißt t singulär. Schließlich heißt f (stetig) differenzierbar, falls f (stetig) differenzierbar für alle t P [ a, b ] ist. Unter der dynamischen Interpretation ist f ′(t) der Geschwindigkeitsvektor der Kurve f zum Zeitpunkt t. Der Betrag der Geschwindigkeit ist λ = i f ′(t) i = £f1 ′(t)2 + … + fm ′(t)2 . Ist λ ≠ 0, d.h. t ein regulärer Parameter, so ist f ′(v)/λ die normierte Richtung der Geschwindigkeit, und diese Richtung ist tangential zur Spur von f. Ist λ = 0, so steht ein sich gemäß f(t) bewegender Punkt zum Zeitpunkt t still. Beispiele (1) Sei f : [ 0, 2π ] → R2 definiert durch f(t) = ei t = (cos t, sin t) für alle t P [ 0, 2π ]. Dann ist f eine geschlossene Kurve, die die gleichmäßige Bewegung eines Punktes auf dem Einheitskreis gegen den Uhrzeigersinn mit Startpunkt 1 = (1, 0) beschreibt. Die Spur von f ist der Einheitskreis K. Die Kurve ist stetig differenzierbar mit f ′(t) = (cos′ t, sin′ t) = (−sin t, cos t) für alle t P [ 0, 2π]. Der Tangentialvektor f ′(t) hat für alle t P [ 0, 2π ] die Länge 1 und er steht senkrecht auf dem Vektor f(t), da 〈f(t), f ′(t)〉 = 〈(cos t, sin ), (−sin t, cos t)〉 = 0. (2) Sei f : [ 0, 4π ] → R2 definiert durch f(t) = ei t = (cos t, sin t) für alle t P [ 0, 4π ]. Der Einheitskreis wird nun zweimal durchlaufen. Die Spur von f ist erneut der Einheitskreis K. © Oliver Deiser Einführung in die Mathematik 1 490 5. Abschnitt Mehrdimensionale Analysis (3) Sei c ≠ 0, b = 2π/|c|, und sei f : [ 0, b ] → R2 definiert durch f(t) = ei c t = (cos(ct), sin(ct)) für alle t P [ 0, b ]. Der Einheitskreis wird nun mit der Geschwindigkeit c durchlaufen, gegen den Uhrzeigersinn für c > 0 und im Uhrzeigersinn für c < 0. (4) Sei k P N*, und f : [ 0, k2π ] → R3 mit f(t) = (cos t, sin t, t) für alle t P [ 0, k2π ]. Die Kurve f beschreibt eine k-fache Schraubbewegung im dreidimensionalen Raum. (5) Sei g : [ a, b ] → R eine stetige reelle Funktion. Wir definieren die Kurve f : [ a, b ] → R2 durch f(t) = (t, g(t)) für alle t P [ a, b ]. Dann ist f eine Kurve in der Ebene, deren Spur der Graph von g ist. Ist g (stetig) differenzierbar, so gilt dies auch für die Kurve f mit f ′(t) = (1, g′(t)) für alle t P [ a, b ]. Der Leser beachte, dass der Graph von f (den wir wie immer mit f identifizieren) von g zu unterscheiden ist. Es gilt f = graph(f ) = { (t, f(t)) | t P [ a, b ] } = { (t, (t, g(t))) | t P [ a, b ] }, g = graph(g) = { (t, g(t)) | t P [ a, b ] } = { f(t) | t P [ a, b ] } = spur(f ). Das folgende Diagramm veranschaulicht die Situation für die Funktion g : [ 0, 3 ] → R mit g(t) = arctan(t) für alle t P [ 0, 3 ]. 1.5 f (2) f (1) f (0) 1 f(2) arctan(x) 1 x2 +1 f(1) 0.5 f(0) 0.5 1 1.5 2 2.5 3 Der Graph von g ist die Spur von f. Die Ableitung von g entspricht der y-Komponente der Tangentialvektoren von f. Wir betrachten nun die Visualisierung der Kurvenbegriffe an einem Beispiel noch genauer. Einführung in die Mathematik 1 © Oliver Deiser 1. Kurven 491 Visualisierung Sei f : [ 0, 2π ] → R2 mit f(t) = (cos t, sin t) + 1/4 (cos(4t), sin(4t)) für alle t P [ 0, 2π ]. Die Kurve f ist geschlossen und differenzierbar mit f ′(t) = (−sin t, cos t) + (− sin(4t), cos(4t)) für alle t P [ 0, 2π ]. f(t4 ) f(t3 ) 1 f(t1 ) f(t2 ) 0.5 f(t5 ) f(0) = f(2 ) f(t6 ) -1 -0.5 0.5 1 f(t7 ) -0.5 f(t10 ) f(t11 ) -1 f(t9 ) f(t8 ) Die Spur von f und die Werte f(tk ) für die Parameter tk = k π/6, k = 0, …, 12 1 0.5 f1 (t) 3 2 3 4 3 5 3 2 f2 (t) -0.5 -1 Die Komponenten f1 und f2 von f © Oliver Deiser Einführung in die Mathematik 1 492 5. Abschnitt Mehrdimensionale Analysis 2 1 -2 -1 1 2 -1 -2 Die Tangentialvektoren von f für obige Parameter. Drei der Vektoren sind 0. g(0) = g(2 ) 2 g(t3 ) g(t9 ) 1 g(t1 ) -2 g(t11 ) -1 1 2 -1 g(t4 ) g(t8 ) g(t7 ) g(t5 ) -2 Die Ableitung g = f ′ als Kurve. Es gilt g(t4 ) = g(t7 ) = g(t10 ) = 0, sodass die Parameter t4 , t7 und t10 singulär sind. Alle anderen Parameter sind regulär. Einführung in die Mathematik 1 © Oliver Deiser 1. Kurven 493 Die Länge einer Kurve Ähnlich wie „Fläche zwischen Graph und x-Achse“ können wir „Länge einer Kurve“ für Kurven mit hinreichend guten Eigenschaften definieren. Wie so oft in der Analysis geschieht dies durch Approximation und Grenzwertbildung. Zur Approximation verwenden wir Polygon-Züge: Definition (Polygon-Approximation) Sei f : [ a, b ] → Rm eine Kurve, und sei p = (tk )k ≤ n eine (stützstellenfreie) Partition von [ a, b ]. Dann setzen wir Lp f = ∑ k ≤ n i f(tk + 1 ) − f(tk ) i (wobei wieder tn + 1 = b). Die reelle Zahl Lp f ist die Euklidische Länge des durch die Punkte f(a) = f(t0 ), f(t1 ), f(t2 ), …, f(tn ), f(tn + 1 ) = f(b) definierten Polygon-Zugs im Rm . Je feiner die Partition p ist, desto mehr nähert sich Lp f anschaulich der Länge der Kurve f an. f(t4 ) f(t3 ) 1 f(t1 ) 0.5 f(t2 ) f(t5 ) f(0) = f(2 ) f(t6 ) -1 -0.5 0.5 1 f(t7 ) -0.5 f(t10 ) f(t11 ) -1 f(t9 ) f(t8 ) Zwei Polygon-Approximationen an die Kurve des obigen Beispiels. In der zweiten Approximation werden die Zerlegungspunkte k π/12, k = 0, …, 24 verwendet. © Oliver Deiser Einführung in die Mathematik 1 494 5. Abschnitt Mehrdimensionale Analysis Diese Überlegungen motivieren: Definition (rektifizierbar, Länge) Sei f : [ a, b ] → Rm eine Kurve. Dann heißt f rektifizierbar, falls L(f) = limδ(p) →0 Lp f existiert. In diesem Fall heißt L(f) die (Euklidische) Länge von f. Der Grenzwert c = limδ(p) →0 Lp f bedeutet, dass für jede Folge (pn )n P N von Partitionen von [ a, b ], deren Feinheiten gegen Null konvergieren, die Folge (Lpn f )n P N der Längen der zugehörigen Polygon-Approximationen gegen den gleichen reellen Wert c konvergiert. Der Leser vergleiche dies mit der Definition des Riemann-Integrals. Der Hauptsatz zur Längenberechnung einer Kurve lautet: Satz (Längenformel für stetig differenzierbare Kurven) Sei f : [ a, b ] → Rm eine stetig differenzierbare Kurve. Dann ist f rektifizierbar und es gilt L(f) = * b a i f ′(t) i dt. (Längenformel) Der Beweis wird in der Analysis geführt. Wir begnügen uns hier mit einem dynamischen Argument, durch das die Formel plausibel wird: Nach der Formel „Weg ist Geschwindigkeit mal Zeit“ können wir i f ′(t) i dt als den infinitesimal zurückgelegten Weg auffassen. Im Integral werden diese infinitesimalen Wege zur Gesamtlänge des zurückgelegten Weges aufsummiert. Beispiel 1: Kreisumfang Seien r > 0 und [ a, b ] ein reelles Intervall. Wir definieren die stetig differenzierbare Kurve f : [ a, b ] → R2 durch f(t) = r eit = r (cos t, sin t) für alle t P [ a, b ]. Dann gilt i f ′(t) i = r für alle t P [ a, b ]. Damit ist L(f ) = * a b i f ′(t) i dt = * b r dt = r(b − a). a Für [ a, b ] = [ 0, 2π ] ergibt sich der Umfang r2π eines Kreises mit Radius r. Die Längenberechnung berücksichtigt allgemeiner aber auch teilweise und mehrfache Durchläufe des Kreises. So ergibt sich zum Beispiel die Länge 2krπ für Intervalle der Form [ 0, 2kπ ]. Einführung in die Mathematik 1 © Oliver Deiser 1. Kurven 495 Beispiel 2: Parabelbogen Wir berechnen die Länge eines Parabelbogens. Sei hierzu [ a, b ] ein reelles Intervall, und sei f : [ a, b ] → R2 definiert durch f(t) = (t, t2 ) für alle t P [ a, b ]. Die stetig differenzierbare Kurve f durchläuft den durch das Intervall [ a, b ] definierten Bogen der Einheitsparabel. Es gilt f ′(t) = (1, 2t), i f ′(t) i 2 = 1 + 4t2 für alle t P [ a, b ]. Zur Berechnung der Länge von f verwenden wir, dass * £c2 + t2 dt 1 2 = ( t £c2 + t2 + c2 log( t + £c2 + t2 ) ) für alle c P R. Mit c = 1/2 erhalten wir L(f ) = * b a * i f ′(t) i dt = b £1 + 4t2 dt a b = 2 * £(1/2)2 + t2 a = t £1/4 + t2 + 1 log( t + £1/4 + t2 ) 4 t=b . t=a Für das Intervall [ a, b ] = [ 0, 1 ] ergibt sich L(f ) = £5 2 + 1 £5 log( 1 + 4 2 = £5 2 + 1 log( 2 + £5 ) = 1,4789… 4 ) − 1 1 log( 4 2 ) Zum Vergleich: Die Länge der Diagonalen des Einheitsquadrats ist gleich £2 = 1,4142… Wir machen also keinen allzu großen Umweg, wenn wir anstelle der Diagonalen auf dem Parabelbogen von (0, 0) nach (1, 1) laufen. Beispiel 3: Umfang einer Ellipse Seien a ≥ b > 0. Wir berechnen den Umfang der achsenparallelen Ellipse Ea, b = { (x, y) P R2 | (x/a)2 + (y/b)2 = 1 } mit den Halbachsen a und b. Eine (traditionelle) Parametrisierung von Ea, b ist gegeben durch die Kurve f : [ 0, 2π ] → R2 mit f(t) = (a sin t, b cos t) für alle t P [ 0, 2π ]. Die Kurve durchläuft die Ellipse startend im Punkt (0, b) im Uhrzeigersinn. Sie ist stetig differenzierbar mit f ′(t) = (a cos t, − b sin t) für alle t P [ 0, 2π ]. © Oliver Deiser Einführung in die Mathematik 1 496 5. Abschnitt Mehrdimensionale Analysis Für alle ϕ P [ 0, 2π ] gilt L(f|[0, ϕ]) * = ϕ 0 i f ′(t) i dt = * ϕ £a2 cos2 t + b2 sin2 t dt 0 ϕ = a * £1 − ε2 sin2 t dt, 0 2 2 wobei wir a cos t = a2 (1 − sin2 t) verwendet und ε = £1 − b2 /a2 P [ 0, 1 [ (numerische Exzentrizität von Ea,b ) gesetzt haben. Man kann zeigen, dass für ε ≠ 0 keine elementare Stammfunktion des Integranden £1 − ε2 sin2 t existiert. Der Versuch, die Länge der Bögen einer Ellipse Ea, b mit den Halbachsen a ≠ b zu berechnen, gibt also Anlass zur Einführung einer neuen nichtelementaren Funktion. Für ε P [ 0, 1 [ und ϕ P R ist das elliptische Integral zweiter Art definiert durch E(ϕ, ε) = * 0 ϕ £1 − ε2 sin2 t dt. Der Umfang der Ellipse Ea, b berechnet sich zu a E(2π, ε). Im Gegensatz zur Flächenberechnung ist das Problem der Umfangsberechnung einer Ellipse also deutlich schwieriger. Es sprengt den Rahmen der elementaren Funktionen. 2 E( , 0) E( , 2/3) E( , 0.9) E( , 0.999) 2 Das elliptische Integral E(ϕ, ε) zweiter Art auf [ 0, 2π ] für einige ε Einführung in die Mathematik 1 © Oliver Deiser 1. Kurven 497 Übungen Übung 1 Seien a, ϕ > 0. Wir definieren die Archimedische Spirale f : [ 0, ϕ ] → R2 durch f(t) = a t (cos t, sin t) für alle t P [ 0, ϕ ]. (a) Skizzieren Sie spur(f) für a = 1 und ϕ = 2π. (b) Beschreiben Sie qualitativ die Bedeutung der Parameter a und ϕ für die Kurve f. (c) Berechnen Sie L(f ) in Abhängigkeit von a und ϕ. Übung 2 Wir definieren die Zykloide f : [ 0, 2π ] → R2 durch f(t) = (t − sin(t), 1 − cos(t)) für alle t P [ 0, 2π ]. (a) Begründen Sie, dass die Zykloide die Bewegung des Punktes p = (0, 0) auf dem Kreis K = { (x, y) P R2 | x2 + (y − 1)2 = 1 } mit Radius 1 und Mittelpunkt (0, 1) beschreibt, wenn K auf der x-Achse im vollen Umfang abrollt ohne zu rutschen. Erstellen Sie eine Skizze, die Ihre Argumentation erläutert. (b) Skizzieren Sie die Spur von f und markieren Sie einige Werte f(t). (c) Berechnen Sie L(f ) mit Hilfe der Integrationsregeln. Übung 3 Seien a ≥ b > 0, und sei Ea, b = { (x, y) P R2 | (x/a)2 + (y/b)2 = 1 } die achsenparallele Ellipse mit den Halbachsen a und b. Wir definieren f : [ 0, 2π ] → R2 durch f(t) = (a cos t, b sin t) für alle t P [ 0, 2π ]. Zeigen Sie, dass Ea, b = spur(f ). © Oliver Deiser Einführung in die Mathematik 1 498 5. Abschnitt Mehrdimensionale Analysis Übung 4 Seien a ≥ b > 0, und sei Ea, b = { (x, y) P R2 | (x/a)2 + (y/b)2 = 1 }. Wir setzen p = £a2 − b2 , F1 = (p, 0), F2 = (−p, 0), E = { (x, y) P R2 | i (x, y) − F1 i + i (x, y) − F2 i = 2a }. Zeigen Sie, dass Ea, b = E. Übung 5 Sei a > 0. Wir definieren die Lemniskate von Bernoulli (zum Parameter a) f : [ 0, 2π ] → R2 durch f(t) = a cos t 1 + sin2 t (1, sin t) für alle t P [ 0, 2π ]. Weiter setzen wir p = a/£2, F1 = (p, 0), F2 = (−p, 0). (a) Skizzieren Sie spur(f ), F1 und F2 für a = 1/2, 1, 3/2. (b) Zeigen Sie, dass spur(f ) = { (x, y) P R2 | (x2 + y2 )2 = a2 (x2 − y2 ) } = { (x, y) P R2 | i (x, y) − F1 i i (x, y) − F2 i = p2 }. (c) Bringen Sie L(f ) mit geeignet definierten c, ε P R in die Form L(f ) = c * π/2 0 1 £1 + ε2 sin2 t dt. (Der Integrand besitzt keine elementare Stammfunktion.) Einführung in die Mathematik 1 © Oliver Deiser 2. Partielle Ableitungen Wir betrachten nun Funktionen der Form f : Rn → R oder allgemeiner f : P → R mit P ⊆ Rn , für eine beliebige Dimension n ≥ 1. Im Gegensatz zu den Kurven sind nun die Funktionswerte reelle Skalare, während die Stellen reelle Vektoren sind. Erneut genügt die eindimensionale Differentialrechnung, um einen Ableitungsbegriff für diesen Funktionstyp zu etablieren. Schließlich betrachten wir noch allgemeiner Funktionen des Typs f : Rn → Rm mit beliebigen Dimensionen n, m ≥ 1. In dieser Klasse sind vor allem die zwei bzw. dreidimensionalen Vektorfelder f : R2 → R2 bzw. f : R3 → R3 von Bedeutung. © Oliver Deiser Einführung in die Mathematik 1 500 5. Abschnitt Mehrdimensionale Analysis Mehrdimensionale Definitionsbereiche Im Folgenden sei immer n ≥ 1, P ⊆ Rn und f : P → R, wenn nichts anderes gesagt wird. Der Leser denke in erster Linie an die Spezialfälle n = 2 und n = 3. Im Fall n = 2 ist also P eine Teilmenge der Ebene, im Fall n = 3 eine Teilmenge des dreidimensionalen Raumes. Die Funktionswerte sind immer Skalare. Ein Standardbeispiel ist die Funktion f : Rn → R, die jedem Vektor x = x1 , …, xn einer gegebenen Dimension n seine Euklidische Länge f(x) = i x i zuweist. Ist x = (x1 , …, xn ) P P, so schreiben wir kurz f(x) = f(x1 , …, xn ) anstelle der korrekteren Version f(x) = f((x1 , …, xn )). Im Fall n = 2 verwenden wir oft auch die Variablen x, y und im Fall n = 3 die Variablen x, y, z, sodass die Funktionswerte die Form f(x, y) bzw. f(x, y, z) annehmen. Für die Dimension n = 2 stehen uns verschiedene Visualisierungsmöglichkeiten zur Verfügung. Eine davon ist: Visualisierung durch Höhenlandschaften (3-D-Plots) Wir tragen f(x, y) für alle (x, y) P P in eine dreidimensionale Graphik ein, d. h., wir visualisieren den dreidimensionalen Graphen von f. Diese Form der Visualisierung entspricht der üblichen graphischen Darstellung einer reellen Funktion. Da sie aufwendig zu zeichnen ist, eignet sie sich vor allem für Computervisualisierungen. 3D-Plot der Funktion f mit f(x, y) = arctan(y/x) für x ≠ 0 Einführung in die Mathematik 1 © Oliver Deiser 2. Partielle Ableitungen 501 Eine Alternative, die sich zumindest für einfache Funktion auch zur Visualisierung per Hand eignet, besteht darin, einen sog. Kontur-Plot der Funktion zu erstellen. Hierzu definieren wir allgemein für jede Dimension n: Definition (Niveau-Menge, Höhenlinie) Sei f : P → R. Für alle c P R setzen wir nivf (c) = { v P P | f(v) = c }. Die Teilmenge nivf (c) von P ⊆ Rn heißt die Niveaumenge von f zum Wert c. Im Fall n = 2 nennen wir eine Niveaumenge auch eine Höhenlinie. Für die Dimension n = 2 ergibt sich nun folgende Möglichkeit der Visualisierung: Visualisierung durch Höhenliniendiagramme (Kontur-Plots) Wir tragen die Niveaumengen nivf (c) für einige Werte c in ein zweidimensionales Diagramm ein und versehen sie mit dem Wert c. Zusätzlich können die Bereiche zwischen den Höhnenlinien eingefärbt werden. Für viele Funktionen sind die Niveaumengen in der Tat Linien, sodass sich ein Bild ergibt, das an klassische Landkarten mit Höhenlinien und eingetragenen Höhen erinnert. Kontur-Plot der Funktion f mit f(x, y) = arctan(y/x) für x ≠ 0 © Oliver Deiser Einführung in die Mathematik 1 502 5. Abschnitt Mehrdimensionale Analysis Beispiele (1) Sei f : R2 → R definiert durch f(x, y) = x2 + y2 für alle (x, y) P R2 . Visualisiert als 3-D-Plot ist f ein Paraboloid. Für alle c P R gilt nivf (c) = { (x, y) P R2 | x2 + y2 = c } = { (x, y) P R2 | i(x, y) i 2 = c }. Im Fall c < 0 ist nivf (c) die leere Menge. Für c = 0 ist nivf (c) die einpunktige Menge { 0 }. Ist c > 0, so ist nivf (c) ein Kreis mit Mittelpunkt 0 und Radius £c. Einführung in die Mathematik 1 © Oliver Deiser 2. Partielle Ableitungen 503 (2) Sei f : R2 → R definiert durch f(x, y) = x2 − y2 für alle (x, y) P R2 . Im 3-D-Plot erscheint f als Sattelfläche. Für alle c P R gilt nivf (c) = { (x, y) P R2 | x2 − y2 = c }. Für c = 0 besteht die Menge nivf (0) = { (x, y) P R2 | |x| = |y| } aus den beiden sich im Nullpunkt schneidenden Winkelhalbierenden. Für Werte c ≠ 0 erhalten wir Hyperbeln in Hauptlage, d. h. die Winkelhalbierenden sind Asymptoten der Äste der Hyperbeln. Im Fall c > 0 schneiden die Äste die x-Achse, im Fall c < 0 die y-Achse. © Oliver Deiser Einführung in die Mathematik 1 504 5. Abschnitt Mehrdimensionale Analysis Die Stetigkeit lässt sich wieder in zwei äquivalenten Versionen definieren: Definition (Stetigkeit für mehrdimensionale Definitionsbereiche) Sei f : P → R, und sei p P P. Dann heißt f ε-δ-stetig oder umgebungsstetig an der Stelle p, falls gilt: ∀ε > 0 ∃δ > 0 ∀x P P (i x − p i < δ → |f(x) − f(p)| < ε). Weiter heißt f folgenstetig an der Stelle p, falls für jede gegen p konvergente Folge (xn )n P N in P gilt, dass limn f(xn ) = f(p). Ist f umgebungs- bzw. folgenstetig an allen Stellen p P P, so heißt f umgebungsstetig bzw. folgenstetig. In der ε-δ-Stetigkeit steht die Euklidische Norm im Vergleich zu den Kurven nun auf der linken Seite der Implikation. Die logische Struktur (und Idee) der Definition bleibt gleich. Aufgrund der Äquivalenz der beiden Stetigkeitsdefinitionen können wieder kurz von Stetigkeit sprechen. Richtungsableitung und partielle Differenzierbarkeit Sei w P Rn ein normierter Vektor. Wir fassen w als Richtungsvektor auf und fragen, für einen gegebenen Punkt p P P, nach der Steigung von f : P → R an der Stelle p in Richtung w. Ist n = 2 und f visualisiert als 3-D-Plot, so ist dies die Steigung der durch f erzeugten Höhenlandschaft, die wir sehen, wenn wir von f(p) aus in Richtung w blicken. Allgemein definieren wir: Definition (Richtungsableitung) Sei f : P → R. Weiter sei w P Rn mit i w i = 1. Für jedes p P P heißt, im Fall der Existenz, die reelle Zahl ∂w f (p) = limh →0 f(p + hw) − f(p) h die Ableitung von f an der Stelle p in Richtung w. Existiert ∂w f (p), so heißt f an der Stelle p in Richtung w differenzierbar. Besonders ausgezeichnete Richtungen werden durch die Koordinatenachsen definiert. Für ein gegebenes n ≥ 1 seien wieder e1 = (1, 0, …, 0), …, en = (0, …, 0, 1). die kanonischen Basisvektoren des Rn . Die Richtungsableitungen bzgl. dieser Vektoren haben einen eigenen Namen und eigene Bezeichnungen: Einführung in die Mathematik 1 © Oliver Deiser 2. Partielle Ableitungen 505 Definition (Ableitung in Achsenrichtung, partielle Differenzierbarkeit) Sei f : P → R. Für jedes p P P und j = 1, …, n heißt, im Fall der Existenz, ∂j f (p) = ∂ej f (p) = limh →0 f(p + hej ) − f(p) h die j-te partielle Ableitung von f an der Stelle p. Existieren alle Ableitungen ∂1 f (p), …, ∂n f (p), so heißt f partiell differenzierbar an der Stelle p. Ist f an allen Stellen p P P partiell differenzierbar, so heißt f partiell differenzierbar. Sind zudem alle Ableitungsfunktionen ∂j f : P → R stetig, so heißt f stetig partiell differenzierbar oder kurz stetig differenzierbar. Oft ist es nützlich, eine partielle Ableitung nicht durch eine Koordinate, sondern durch eine Variable anzugeben: Notation Ist f(x) = f(x1 , …, xn ) so schreiben wir auch ∂xj f(x), ∂f(x) ∂xj oder ∂ f (x) anstelle von ∂j f (x). ∂xj Ist f(x) = f(x1 , …, xn ) durch einen Term definiert, so können wir f partiell nach einer Variable xj ableiten, indem wir alle anderen Variablen wie Konstanten behandeln und die üblichen eindimensionalen Ableitungsregeln auf die betrachtete Variable anwenden. Beispiele (1) Sei f : R2 → R mit f(x, y) = y e2x für alle (x, y) P R2 . Dann gilt für alle (x, y) P R: ∂1 f (x, y) = ∂x f (x, y) = ∂ ∂x ( y e2x ) = 2 y e2x , ∂2 f (x, y) = ∂y f (x, y) = ∂ ∂y ( y e2x ) = e2x . (2) Sei P = { (x, y, z) P R3 | z > 0 } , und sei f : P → R mit f(x, y, z) = x + 2x y + x z für alle (x, y, z) P P. Dann gilt für alle (x, y, z) P R3 mit z > 0: ∂x f (x, y, z) = 1 + 2y + © Oliver Deiser 1 x , ∂y f (x, y, z) = 2x, ∂z f (x, y, z) = − 2 . z z Einführung in die Mathematik 1 506 5. Abschnitt Mehrdimensionale Analysis (3) Sei n ≥ 1 und f : Rn → R definiert durch f(x) = i x i 2 = x1 2 + … + xn 2 für alle x = (x1 , …, xn ) P Rn . Dann gilt für alle 1 ≤ j ≤ n und alle x P Rn ∂j f (x) = ∂ f(x) = ∂xj ∂ ∂xj ( x1 2 + … + xn 2 ) = 2xj . Wie im eindimensionalen Fall können wir auch die mehrfache Differenzierbarkeit von f : P → R betrachten. Es gilt der wichtige Vertauschungssatz: Satz (Satz von Schwarz) Sei f : P → R zweimal stetig differenzierbar. Dann gilt ∂i ∂j f = ∂j ∂i f für alle i, j P { 1, …, n }. Der Leser überzeuge sich anhand der obigen Beispiele, dass die zweifachen partiellen Ableitungen nach x,y bzw. z immer die gleiche Funktion ergeben, egal, in welcher Reihenfolge sie durchgeführt werden. Für Beispiel 1 ist etwa ∂x ∂y f (x, y) = 2e2x = ∂y ∂x f (x, y) für alle (x, y) P R2 . Gradienten Die partiellen Ableitungen lassen sich zu einem Vektor zusammenfassen: Definition (Gradient) Seien n ≥ 1, P ⊆ Pn und f : P → R partiell differenzierbar an der Stelle p P P. Dann heißt der Vektor grad f (p) = (∂1 f (p), …, ∂n f (p)) P Rn der Gradient von f an der Stelle p. Beispiel Sei f : R2 → R definiert durch f(x, y) = x2 + y2 für alle (x, y) P R2 . Dann gilt grad f (x, y) = (2x, 2y) = 2(x, y) für alle (x, y) P R2 . Um die geometrische Bedeutung des Gradienten zu ermitteln, betrachten wir den Spezialfall n = 2. In Analogie zur Tangente definieren wir: Definition (Tangentialebene) Seien P ⊆ R2 und f : P → R partiell differenzierbar an der Stelle p = (x0 , y0 ) P P. Dann heißt die Funktion g : R2 → R mit g(x, y) = f(p) + ∂1 f (p) (x − x0 ) + ∂2 f (p) (y − y0 ) für alle (x, y) P P die Tangentialebene von f an der Stelle p. Einführung in die Mathematik 1 © Oliver Deiser 2. Partielle Ableitungen 507 Beispiel Sei f : R2 → R mit f(x, y) = −3(x2 + y2 ). Weiter sei p = (0, 1). Dann berechnet sich die Tangentialebene g von f an der Stelle p zu g(x, y) = −3 − 0(x − 0) − 6(y − 1) = −6y + 3 für alle (x, y) P R2 . 3D-Plot von f und der Tangentialebene g an der Stelle p = (0, 1) Die Tangentialebene können wir mit Hilfe des Skalarprodukts in der Form g(x, y) = f(p) + ∂1 f(p) (x − x0 ) + ∂2 f(p) (y − y0 ) = f(p) + 〈grad f (p), (x, y) − (x0 , y0 )〉 = f(p) + 〈grad f (p), (x, y) − p〉 schreiben. Aus den geometrischen Eigenschaften des Euklidischen Skalarprodukts ergibt sich: Geometrische Bedeutung des Gradienten Der Gradient grad f (p) zeigt in die Richtung des stärksten Abstiegs von f an der Stelle p. Er steht senkrecht auf der Niveau-Linie nivf (c) für c = f(p). Wir können uns den Gradienten als „Steigungskompass“ vorstellen. Dabei ist der Gradient im Fall n = 2 ein Vektor der Ebene, nicht des dreidimensionalen Raumes. Er zeigt in der Ebene (im Definitionsbereich von f ) in Richtung des stärksten Anstiegs (des Graphen) von f. Analoge Überlegungen gelten für andere Dimensionen, sodass die geometrische Bedeutung für alle n ≥ 1 gültig bleibt. © Oliver Deiser Einführung in die Mathematik 1 508 5. Abschnitt Mehrdimensionale Analysis Gradienten im 3D-Plot für die Funktion f mit f(x, y) = x2 + y2 Gradienten im Kontur-Plot für die Funktion f mit f(x, y) = xy Einführung in die Mathematik 1 © Oliver Deiser 2. Partielle Ableitungen 509 Anwendungen des Gradienten Mit Hilfe des Gradienten können wir die Richtungsableitung einer Funktion in einfacher Weise berechnen: Satz (Gradient und Richtungsableitung) Sei f : P → R partiell differenzierbar an der Stelle p P P. Dann gilt für alle normierten w = (w1 , …, wn ) P Rn , dass ∂w f (p) = 〈grad f (p), w〉 = ∑ 1 ≤ j ≤ n ∂j f(p) wj . Zur Begründung betrachten wir wieder den Spezialfall n = 2. Hier ergibt sich die Formel aus folgenden Beobachtungen: (1) Sei g die Tangentialebene von f an der Stelle p. Dann stimmt die Ableitung von f an der Stelle p in Richtung w mit der Ableitung von g an der Stelle p in Richtung w überein. (2) Für eine Tangentialebene g : R2 → R gilt ∂w g (p) = 〈grad g (p), w〉. Eine weitere wichtige Anwendung des Gradienten betrifft Extremwerte: Definition (lokale Extremalstelle) Sei f : P → R. Dann heißt ein p P P eine lokale Maximalstelle von f, falls gilt: ∃ε > 0 ∀x P P ( i x − p i < ε → f(x) ≤ f(p) ). Gilt stärker ∃ε > 0 ∀x P P ( i x − p i < ε ∧ x ≠ p → f(x) < f(p) ), so heißt p eine strikte lokale Maximalstelle. Analog ist eine (strikte) lokale Minimalstelle definiert. Ist p eine (strikte) lokale Minimal- oder Maximalstelle, so heißt p eine (strikte) lokale Extremalstelle und f(p) ein zugehöriger lokaler Extremwert von f. Ist p eine lokale Extremalstelle einer partiell differenzierbaren Funktion, so ist die Richtungsableitung von f an der Stelle p für alle Richtungen w gleich Null, da andernfalls f in einer gewissen Richtung w steigen oder fallen würde. Damit gilt: Satz (notwendige Bedingung für ein lokales Extremum) Sei f : P → R partiell differenzierbar an der lokalen Extremalstelle p P P. Dann gilt grad f (p) = 0. Das Ergebnis erweitert die klassische notwendige Bedingung f ′(p) = 0 für lokale Extrema einer reellen Funktion. Das Verschwinden des Gradienten ist keine hinreichende Bedingung: Das eindimensionale Beispiel f : R → R mit f(x) = x3 und f ′(0) = 0 wird im Mehrdimensionalen ergänzt durch die Sattelflä- © Oliver Deiser Einführung in die Mathematik 1 510 5. Abschnitt Mehrdimensionale Analysis che f : R2 → R mit f(x, y) = x2 − y2 . Hier gilt gradf (0) = 0, aber die Funktion besitzt im Nullpunkt weder ein lokales Maximum noch ein lokales Minimum. Ein hinreichendes Kriterium für ein striktes lokales Minimum einer reellen Funktion an einer kritischen Stelle p (d. h. f ′(p) = 0) ist, dass f ″(p) > 0. Um ein mehrdimensionales Analogon dieses Kriteriums formulieren zu können, brauchen wir eine mehrdimensionale Version einer „zweiten Ableitung“: Definition (Hesse-Matrix) Sei f : P → R zweimal partiell differenzierbar, und sei p P P. Dann ist die Hesse-Matrix H f (p) von f an der Stelle p definiert durch H f (p) = ( ∂i ∂j f (p) )1 ≤ i, j ≤ n. Die Hesse-Matrix Hf (p) ist eine reelle (n × n)-Matrix, deren Einträge aus allen zweiten partiellen Ableitungen von f an der Stelle p bestehen. Ist f zweimal stetig differenzierbar, so ist die Hesse-Matrix symmetrisch nach dem Satz von Schwarz. In der Analysis zeigt man den folgenden Satz: Satz (hinreichende Bedingung für ein lokales Extremum) Sei f : P → R zweimal stetig differenzierbar, und sei p P P mit grad f (p) = 0. Weiter sei die Hesse-Matrix H = Hf (p) positiv definit, d. h. es gelte 〈x, H x〉 > 0 für alle x P Rn mit x ≠ 0. Dann ist p eine strikte lokale Minimalstelle von f. An die Stelle von f ″(p) > 0 tritt also positive Definitheit der Hesse-Matrix H = Hf (p). Um letztere festzustellen, stehen verschiedene Möglichkeiten zur Verfügung. Für den Fall n = 2 sind zum Beispiel äquivalent: (a) H ist positiv definit, d. h. 〈(x, y), H(x, y)〉 > 0 für alle (x, y) ≠ 0. (b) H(1, 1) = ∂11 f (p) > 0 und det(H) = ∂11 f(p) ∂22 f(p) − 2∂12 f(p) > 0. (c) Alle Eigenwerte von H sind positiv. Beispiel Sei f : R2 → R mit f(x, y) = x2 + y2 − 2x + 2y + 2. Dann gilt grad f (x, y) = (2x − 2, 2y + 2). Damit hat f höchstens im Punkt p = (1, −1) ein lokales Extremum. Die Hesse-Matrix Hf (p) = ((2, 0); (0, 2)) ist positiv definit, sodass p eine strikte lokale Minimalstelle von f ist. Dies lässt sich auch geometrisch einsehen, da f(x, y) = (x − 1)2 + (y + 1)2 ein nach oben geöffnetes Paraboloid ist. Strikte lokale Maximalstellen können wir durch Übergang zu −f untersuchen oder analoge Ergebnisse mit „die Hess-Matrix H ist negativ definit“ formulieren (d. h. 〈x, H x〉 < 0 für alle x P Rn mit x ≠ 0). Einführung in die Mathematik 1 © Oliver Deiser 2. Partielle Ableitungen 511 Allgemeine mehrdimensionale Funktionen Bisher haben wir Funktionen mit reellen Stellen und mehrdimensionalen Werten sowie Funktionen mit mehrdimensionalen Stellen und reellen Werten untersucht. Nun betrachten wir Funktionen, bei denen sowohl die Stellen als auch die Werte reelle Vektoren sein können. Eine derartige Funktion hat die Form f : Rn → Rm bzw. f : P → Rm mit n, m ≥ 1 und einem Definitionsbereich P ⊆ Rn . Die Stetigkeitsbegriffe können wieder leicht angepasst werden: Definition (Stetigkeit für mehrdimensionale Definitionsbereiche) Sei f : P → Rm mit P ⊆ Rn , und sei p P P. Dann heißt f ε-δ-stetig oder umgebungsstetig an der Stelle p, falls gilt: ∀ε > 0 ∃δ > 0 ∀x P P (i x − p i < δ → i f(x) − f(p) i < ε). Weiter heißt f folgenstetig an der Stelle p, falls für jede gegen p konvergente Folge (xn )n P N in P ⊆ Rn gilt, dass limn f(xn ) = f(p) in Rm . Ist f umgebungs- bzw. folgenstetig an allen Stellen p P P, so heißt f umgebungsstetig bzw. folgenstetig. In der ε-δ-Stetigkeit wird auf der linken Seite der Implikation die Euklidische Norm im Rn verwendet, auf der rechten Seite die Euklidische Norm im Rm . Im Fall n = m = 2 stimmt die Definition mit der Stetigkeit einer komplexen Funktion überein, da der komplexe Betrag über die Euklidische Norm erklärt ist. Wir sprechen wieder kurz von Stetigkeit, da beide Definitionen äquivalent sind. Wie bei einer Kurve können wir eine Funktion f : P → Rm , P ⊆ Rn , in die reellwertigen Komponenten f1 , …, fm : P → R zerlegen, sodass f(x) = f(x1 , …, xn ) = (f1 (x1 , …, xn ), …, fm (x1 , …, xn )) P Rm für alle x P P. Die Funktion f ist genau dann stetig in p, wenn alle Komponentenfunktionen f1 , …, fm stetig in p sind. Im Fall der Existenz können wir für alle Komponentenfunktionen die n-dimensionalen Gradienten bilden: grad f1 (p) = (∂1 f1 (p), …, ∂n f1 (p)) grad f2 (p) = (∂1 f2 (p), …, ∂n f2 (p)) … grad fm (p) = (∂1 fm (p), …, ∂n fm (p)) Alle Gradienten sind Vektoren des Rn . Schreiben wir die Gradienten als Zeilen in eine Matrix mit m Zeilen und n Spalten, so erhalten wir die sog. Jakobi-Matrix © Oliver Deiser Einführung in die Mathematik 1 512 5. Abschnitt Mehrdimensionale Analysis Jf (p) = ∂i fj (p))1 ≤ i ≤ m, 1 ≤ j ≤ n = ∂f1 (p) ∂x1 ∂f1 (p) ∂x2 … ∂f1 (p) ∂xn ∂f2 (p) ∂x1 ∂f2 (p) ∂x2 … ∂f2 (p) ∂xn … … … … ∂fm (p) ∂x1 ∂fm (p) ∂x2 … ∂fm (p) ∂xn von f an der Stelle p P P. Für die Dimensionen n = m = 1 hat die Jakobi-Matrix Jf (p) nur eine Zeile und Spalte und den Eintrag f ′(p). Im Kurvenfall n = 1 stimmt Jf (p) mit dem als Spaltenvektor notierten Tangentialvektor f ′(p) von f an der Stelle p überein. Im Fall m = 1 einer reellwertigen Funktion ist Jf (p) der als einzeilige Matrix notierte Gradient von f an der Stelle p. Definition (stetige Differenzierbarkeit) Eine Funktion f : P → Rm , P ⊆ Rn , heißt (stetig) partiell differenzierbar, falls alle Komponenten f1 , …, fm : P → R dies sind. Analog ist die mehrfache (stetige) partielle Differenzierbarkeit definiert. Statt „stetig partiell differenzierbar“ sagen wir auch kurz „stetig differenzierbar“. Für eine stetig differenzierbare Funktion lässt sich das folgende Analogon zum Linearen Approximationssatz der eindimensionalen Differentialrechnung beweisen: (+) f(x) = f(p) + Jf (p) (x − p) + o(i x − p i) für x → p, wobei o(i x − p i) für eine Funktion r : P → Rm steht mit limx →p i r(x) i ix − pi = 0. Das Ergebnis unterstützt noch einmal die Stellung der Jakobi-Matrix als Verallgemeinerung des eindimensionalen Ableitungsbegriffs. Bemerkung Es stellt sich heraus, dass die Gültigkeit von (+) etwas stärker ist als die partielle Differenzierbarkeit, aber auch etwas schwächer als die stetige partielle Differenzierbarkeit von f an der Stelle p ist. In der Analysis wird deswegen ein weiterer Differenzierbarkeitsbegriff eingeführt, die sog. totale Differenzierbarkeit einer Funktion f : P → Rm an einer Stelle p. Sie bedeutet genau, dass sich f in der Form (+) schreiben lässt. Einführung in die Mathematik 1 © Oliver Deiser 2. Partielle Ableitungen 513 Vektorfelder und Differentialoperatoren Zu den wichtigsten mehrdimensionalen Funktionen gehören die Vektorfelder, bei denen die beiden beteiligten Dimensionen übereinstimmen: Definition (Vektorfeld) Seien n ≥ 1 und P ⊆ Rn . Dann heißt eine Funktion f : P → Rn ein n-dimensionales (reelles) Vektorfeld. Ein zweidimensionales ein Vektorfeld f : P → R2 können wir visualisieren, indem wir an jeden Punkt p des Definitionsbereichs P von f den Vektor f(p) der Ebene anheften. Analoges gilt für dreidimensionale Vektorfelder. 2 Das Vektorfeld f : R2 → R2 mit 1 f(x, y) = (y, x) für alle (x, y). Der Übersichtlichkeit halber werden die Vektoren skaliert. 0 -1 -2 -2 -1 0 1 2 Das Vektorfeld f : R3 → R3 mit f(x, y, z) = (−y, x, 0) für alle (x, y, z) © Oliver Deiser Einführung in die Mathematik 1 514 5. Abschnitt Mehrdimensionale Analysis Ein wichtiges Vektorfeld ist uns implizit schon begegnet: Definition (Gradientenfeld) Seien n ≥ 1, P ⊆ Rn und f : P → R differenzierbar. Dann heißt das n-dimensionale Vektorfeld grad f : P → Rn mit grad f (x) = ( ∂1 f (x), … , ∂n f (x) ) für alle x = (x1 , …, xn ) P P das Gradientenfeld von f. Wir stellen nun noch einige wichtige Operatoren für skalar- und vektorwertige Funktionen im Überblick vor. Diese Operatoren sind vor allem in der Physik von Bedeutung und werden dort genauer diskutiert. Die Gradientenbildung erzeugt ein Vektorfeld aus einer skalarwertigen Funktion. Die folgende Operation liefert umgekehrt eine skalarwertige Funktion aus einem Vektorfeld: Definition (Divergenz) Sei g : P → Rn ein differenzierbares Vektorfeld. Dann definieren wir die Divergenz div g : P → R des Vektorfeldes g durch div g (x) = ∑ 1 ≤ j ≤ n ∂j gj (x) = ∂1 g1 (x) + … + ∂n gn (x) für alle x P P. Ist p P P und gilt div g (p) > 0 bzw. div g (p) < 0, so heißt p eine Quelle bzw. Senke von g. Gilt div(g)(p) = 0, so heißt g quellfrei an der Stelle p. Ein Beispiel für eine Operation, die ein Vektorfeld in ein Vektorfeld überführt, ist: Definition (Rotation) Sei P ⊆ R3 und g : P → R3 ein dreidimensionales differenzierbares Vektorfeld. Dann definieren wir die Rotation oder das Wirbelfeld rot g : P → R3 von g durch rot g (x) = ( ∂2 g3(x) − ∂3 g2(x), ∂3 g1 (x) − ∂1 g3 (x), ∂1 g2 (x) − ∂2 g1 (x) ) für alle x P P. Ist p P P mit rot g (p) = 0, so heißt g wirbelfrei an der Stelle p. Der Nabla-Operator Das Rechnen mit Gradient, Divergenz und Rotation wird oft übersichtlicher, wenn wir, für eine gegebene Dimension n ≥ 1, den sog. n-dimensionalen NablaOperator = = ( ∂1, …, ∂n ) = ( ∂x∂ , …, 1 ∂ ∂xn ) verwenden. Wir setzen Einführung in die Mathematik 1 © Oliver Deiser 2. Partielle Ableitungen 515 = f = (∂1 f, …, ∂n f ) = grad f, 〈=, g〉 = 〈(∂1 , …, ∂n ), (g1 , …, gn )〉 = div g, = × g = (∂1 , ∂2 , ∂3 ) × (g1 , g2 , g3 ) = rot g, falls n = 3. Dabei ist f : P → R mit P ⊆ Rn eine partiell differenzierbare skalarwertige Funktion, während g : P → Rn , P ⊆ Rn ein differenzierbares Vektorfeld ist. Die Rotation = × g ist nur für die Dimension 3 erklärt. Schließlich definieren wir noch: Definition (Laplace-Operator) Seien n ≥ 1, P ⊆ Rn und f : P → R zweimal differenzierbar. Dann ist der Laplace-Operator (angewendet auf f ) definiert durch D f = =2 f = div grad f = 〈=, = f 〉. Angewendet auf eine skalarwertige Funktion erzeugt der Laplace-Operator wieder eine skalarwertige Funktion (über den „Umweg“ des Gradientenfeldes). Es gilt D f = ∑ 1 ≤ j ≤ n ∂j ∂j f = ∂1 ∂1 f + … + ∂n ∂n f, sodass D f (p) = spur(Hf (p)). Die Quadrat-Notation =2 ist motiviert durch Df = 〈(∂1 ∂1 , …, ∂n ∂n ), f 〉 = 〈(∂1 , …, ∂n ), (∂1 , …, ∂n )〉 f = 〈=, =〉 f. © Oliver Deiser Einführung in die Mathematik 1 516 5. Abschnitt Mehrdimensionale Analysis Übungen Übung 1 Visualisieren Sie die folgenden Funktionen f : R2 → R durch Höhenliniendiagramme (Kontur-Plots): (a) f(x, y) = x + y, (b) f(x, y) = i (x, y) i, (c) f(x, y) = max(x, y), (d) f(x, y) = x y. Übung 2 Sei f : R2 → R mit f(x, y) = x2 + y2 für alle (x, y) P R2 . Weiter seien w P R2 normiert und p P R2 . Berechnen Sie die Richtungsableitung ∂w f (p) (a) durch Berechnung des Differentialquotienten wie in der Definition der Richtungsableitung, (b) durch Anwendung der Formel ∂w f (p) = 〈grad f (p), w〉. Übung 3 Zeigen Sie unter der Voraussetzung der Definiertheit: (a) grad(f g) = f grad g + g grad f für f, g, : Rn → R, (b) div(f g) = 〈grad f, g〉 + f div g für f : Rn → R, g : Rn → Rn . Übung 4 Skizzieren Sie das Gradientenfeld der Funktion f : R2 − { 0 } → R2 mit f(x, y) = i (x, y) i für alle (x, y) P R2 − { 0 }. Übung 5 Sei f : R2 → R mit f(x, y) = x2 − y2 für alle (x, y) P R2 . Skizzieren Sie das Gradientenfeld von f und berechnen Sie D f = div grad f. Einführung in die Mathematik 1 © Oliver Deiser 2. Partielle Ableitungen 517 Übung 6 Sei f : R2 → R definiert durch f(x, y) = { 2xy/(x2 + y2 ) 0 falls sonst. (x, y) ≠ 0 (a) Erstellen Sie ein Höhenlinien-Diagramm (Kontur-Plot) für f. (b) Untersuchen Sie f auf Stetigkeit und partielle Differenzierbarkeit. Übung 7 Sei f : R3 → R3 zweimal stetig differenzierbar. Zeigen Sie: div rot f = 0. © Oliver Deiser Einführung in die Mathematik 1 3. Mehrdimensionale Integration Wir schließen unseren Überblick über die mehrdimensionale Differential- und Integralrechnung mit einer kurzen Diskussion der Berechnung von Volumina und Oberflächen einfacher geometrischer Gebilde ab. Der eindimensionale Integrationskalkül genügt, um diese Berechnungen durchzuführen. © Oliver Deiser Einführung in die Mathematik 1 520 5. Abschnitt Mehrdimensionale Analysis Mehrdimensionale Integrale In Analogie zum Riemann-Integral I(f ) einer reellen integrierbaren Funktion f : [ a, b ] → R lässt sich ein Riemann-Integral für Funktionen des Typs f : P → R mit P ⊆ Rn , P = [a1 , b1 ] × … × [an , bn ], einführen. Hierzu werden die Begriffe der Partition und der Riemann-Summe verallgemeinert. Das Integral wird dann erneut durch I(f ) = limδ(p) →0 ∑p f P R definiert, vorausgesetzt, der Grenzwert existiert. Für die Dimension n = 2 besteht eine Partition p eines Rechtecks P = [ a, b ] × [ c, d ] zum Beispiel aus achsenparallelen Rechtecken und zugehörigen Stützstellen in diesen Rechtecken. Bei der Bildung einer Riemann-Summe ∑ p f einer Funktion f : [ a, b ] × [ c, d ] → R summieren wir die Produkte der Rechtecksflächen mit den Funktionswerten an den Stützstellen. Es zeigt sich, dass wir das Integral einer Funktion f : P → R mit einem n-dimensionalen Definitionsbereich P in vielen Fällen durch n hintereinander ausgeführte eindimensionale Integrale berechnen können. Wir definieren hierzu: Definition (schnittweise integrierbar) Eine Funktion f : [ a, b ] × [ c, d ] → R heißt schnittweise integrierbar, wenn für alle x P [ a, b ] die Funktion f x : [ c, d ] → R, f x (y) = f(x, y), und für alle y P [ c, d ] die Funktion f y : [ a, b ] → R, f y (x) = f(x, y), integrierbar ist. Analog wird der Begriff für höhere Dimensionen erklärt. Ist y P [c, d], so erhalten wir die reelle Funktion fy : [a, b] → R, indem wir den dreidimensionalen Graphen von f mit der Ebene Ey = R × { y } × R schneiden und diesen Schnitt als Funktion auf [ a, b ] lesen. Analoges gilt für die Schnitte fx . Man kann zeigen, dass jede stetige Funktion schnittweise integrierbar ist. Weiter gilt: Satz (Berechnung als Mehrfachintegral) Sei f : [ a, b ] × [ c, d ] → R schnittweise integrierbar. Dann gilt I(f ) = d * * c b f(x, y) dx dy = a b * * a d f(x, y) dy dx. c Eine analoge Aussage gilt für höhere Dimensionen. Für den Fall n = 2 erlaubt der Satz die Berechnung von I(f ) durch die Berechnung zweier eindimensionaler Integrale. Dabei können wir frei wählen, ob wir zuerst nach der ersten oder zweiten Variablen integrieren. Abhängig vom Integranden kann die eine Variante einfacher sein als die andere. Einführung in die Mathematik 1 © Oliver Deiser 3. Mehrdimensionale Integration 521 0.8 0.6 g 0.4 0.2 -1.0 -0.5 0.5 1.0 -0.2 Der y-Schnitt g : [ −1, 1 ] → R für y = −1/2 der Funktion f : [−1, 1 ]2 → R mit f(x, y) = 1 − x2 − y2 für alle (x, y) P [ −1, 1 ]2 . Wir schneiden f mit R × { −1/2 } × R und lesen den Schnitt als Funktion auf [ −1, 1 ]. © Oliver Deiser Einführung in die Mathematik 1 522 5. Abschnitt Mehrdimensionale Analysis Beispiel 1: Vertauschung der Integrationsreihenfolge Sei f : [ 0, 1 ] × [ 0, 2 ] → R definiert durch x2 y 3 f(x, y) = für alle (x, y) P [ 0, 1 ] × [ 0, 2 ]. Dann gilt I(f) = 2 ** 0 1 x2 y/3 dx dy = 2 * x3 y 0 0 x=1 x=0 * dy = 2 y dy = 2. 0 Mit der anderen Integrationsreihenfolge ergibt sich I(f) = 1 ** 0 2 x2 y/3 dy dx = 0 1 * x2 y2 /6 0 y=2 * dx = y=0 1 2x2 /3 dy = 2. 0 Interessanter ist: Beispiel 2: Kugelvolumen Sei r ≥ 0, und sei K = { (x, y, z) P R3 | x2 + y2 + z2 ≤ r2 } ⊆ R3 die Vollkugel im R3 mit Radius r und Mittelpunkt 0. Zur Berechnung des Volumens V(K) von K betrachten wir die Funktion f : [ −r, r ]2 → R mit f(x, y) = { £r2 − (x2 + y2) , 0 falls x2 + y2 ≤ r2 , sonst. Der Graph der Funktion f besteht aus der Nullfortsetzung der oberen Hälfte der Kugeloberfläche auf das Quadrat [ −r, r ]2 . Es gilt V(K) = 2I(f). Für jedes y P [ −r, r ] ist das Integral über den Schnitt f y : [ −r, r ] → R der Flächeninhalt eines Halbkreises mit dem von y abhängigen Radius ry = £r2 − y2 . Damit gilt * r −r fy (x) dx = * r f(x, y) dx = −r 1 2 (r − y2 ) π 2 für alle y P [ −r, r ]. Wir erhalten also V(K) = 2 I(f ) = 2 * r −r = π r2 y − y3 /3 Einführung in die Mathematik 1 * r −r y=r y = −r f(x, y) dx dy = π ( = π 2 r3 − 3 2r 3 * r r2 − y2 dy −r ) = 4 3 r π. 3 © Oliver Deiser 3. Mehrdimensionale Integration 523 Die obere Hälfte der Oberfläche der Kugel mit dem Radius r = 1 wird dargestellt durch f(x, y) = 1 − x2 − y2 für alle (x, y) mit x2 + y2 ≤ 1. Ein y-Schnitt ist ein Halbkreis mit Radius ry = © Oliver Deiser £1 − y2 . Einführung in die Mathematik 1 524 5. Abschnitt Mehrdimensionale Analysis Das Cavalierische Prinzip Viele Volumenberechnungen werden einfacher, wenn wir die zu messende Menge nicht funktional darstellen, sondern die Flächeninhalte der (als Teilmengen der Ebene aufgefassten) Schnitte der Menge mit achsenparallelen Ebenen aufintegrieren. Für jede Menge A ⊆ R3 und alle x, y, z P R setzen wir S1 (A, x) = { (y, z) P R2 | (x, y, z) P A }, (x-Schnitt) 2 S2 (A, y) = { (x, z) P R | (x, y, z) P A }, (y-Schnitt) 2 S3 (A, z) = { (x, y) P R | (x, y, z) P A }. (z-Schnitt) So ist zum Beispiel die oben betrachtete Kugel K ⊆ R mit Radius r aus Kreisscheiben zusammengesetzt. Der x-Schnitt 3 S1 (K, x) = { (y, z) P R2 | y2 + z2 ≤ r2 − x2 } der Kugel K ist für jedes x P [ −r, r ] ein Vollkreis mit Radius rx = £r2 − x2 und Flächeninhalt (r2 − x2 ) π . Integrieren wir diese Flächeninhalte von −r bis r, so erhalten wir * r −r (r2 − x2 ) π dx = ( 2 r3 − 2 r3 3 )π = 4 3 r π, 3 also das Volumen V(K) der Kugel K. Der Leser vergleiche die Methode mit obigem Beispiel. Eine funktionale Darstellung der Kugeloberfläche entfällt. Man kann zeigen, dass dieses „Aufintegrieren von Flächeninhalten“ ein korrektes Verfahren zur Berechnung von Volumina darstellt. Eine wichtige Folgerung ist: Cavalierisches Prinzip Seien A, B Teilmengen des R3 mit den Volumina V(A) bzw. V(B). Für alle x P R gelte, dass die x-Schnitte von A und B denselben Flächeninhalt besitzen. Dann gilt V(A) = V(B). Eine analoge Aussage gilt, wenn die Flächeninhalte aller y- bzw. z-Schnitte übereinstimmen. Allgemeiner bleiben diese Überlegungen für jede Dimension n ≥ 2 gültig. So lässt sich zum Beispiel der Flächeninhalt F(A) einer Teilmenge A der Ebene R2 dadurch berechnen, dass die Längen der x-Schnitte S1 (A, x) = { y P R | (x, y) P A } von A aufintegriert werden. Voraussetzung ist, dass A einen wohldefinierten Flächeninhalt und alle x-Schnitte von A eine wohldefinierte Länge besitzen. Einführung in die Mathematik 1 © Oliver Deiser 3. Mehrdimensionale Integration 525 Beispiel 1: Volumen eines Rotationskörpers Sei f : [ a, b ] → R eine stetige Funktion. Wir betrachten die Menge A = { (x, y, z) P R3 | x P [ a, b ], y2 + z2 ≤ f(x)2 } die entsteht, wenn wir den Graphen von f im dreidimensionalen Raum um die x-Achse rotieren. Für alle x P [ a, b ] ist der x-Schnitt S1 (A, x) ein Kreis mit Radius f(x) und Fläche f(x)2 π. Damit berechnet sich des Volumen von A zu V(A) = π * b f(x)2 dx. a Ist konkret f : [ 0, h ] → R mit f(x) = a x für alle x P [ 0, h ], wobei a, h > 0, so ist der Rotationskörper A ein Kreiskegel mit Höhe h und Schnittflächen (ax)2 π für x P [ 0, h ]. Damit gilt V(A) = π * 0 h (ax)2 dx = π a2 h 3 3 = Fh 3 mit F = (ah)2 π, in Übereinstimmung mit der Formel „1/3 mal Grundfläche mal Höhe“ der Elementargeometrie. Der Rotationskörper A für f : [ −3, 3 ] → R mit f(x) = arctan(x) für alle x P [ −3, 3 ]. Eine numerische Berechnung des nichtelementaren Integrals ergibt das Volumen V(A) = 16,36… © Oliver Deiser Einführung in die Mathematik 1 526 5. Abschnitt Mehrdimensionale Analysis Beispiel 2: Volumen eines Torus Seien R ≥ r > 0 und 2 T = { (x, y, z) P R3 | ( R − £x2 + y2 ) + z2 ≤ r2 } der Torus mit den Radien R ≥ r > 0. Der Torus T entsteht, wenn wenn wir den in der x-z-Ebene liegenden Kreis mit Mittelpunkt (R, 0, 0) und Radius r um die z-Achse rotieren. Zur Berechnung des Volumens verwenden wir die z-Schnitte S3 (T, z) von T. Für alle z P [ −r, r ] ist S3 (T, z) ein Kreisring mit dem Flächeninhalt (+) ( R + £r2 − z2 ) 2 π − ( R − £r2 − z2 ) 2 π = 4 R π £r2 − z2 . Damit berechnet sich das Volumen des Torus zu V(T) = * r −r 4 R π £r2 − z2 dz = 4R π r2 π/2 = 2π2 Rr2 , wobei wir verwenden, dass das Integral von −r bis r über £r2 − z2 in der Variablen z den halben Flächeninhalt eines Kreises mit Radius r ergibt. Der Torus T für R = 2 und r = 1. Der Schnitt mit der x-y-Ebene ergibt einen Kreisring mit innerem Radius R − r = 1 und äußerem Radius R + r = 3. Verschieben wir die Schnittebene entlang der z-Achse, erhalten wir einen Kreisring mit den in der Formel (+) verwendeten Radien (vgl. die folgende Abbildung). Einführung in die Mathematik 1 © Oliver Deiser 3. Mehrdimensionale Integration 527 Zur Formel (+): Der innere Radius des Schnitts ist R − rz , der äußere R + rz , wobei rz = £r2 − z2 . Integration in Polarkoordinaten Polarkoordinaten stellen eine weitere Möglichkeit dar, die Berechnung von mehrdimensionalen Integralen zu vereinfachen. Anstelle einen zweidimensionalen Definitionsbereich waagrecht oder senkrecht abzutasten, können wir ihn auch Kreis für Kreis oder Radius für Radius durchlaufen. Dies entspricht der Verwendung von Polarkoordinaten (r, ϕ) anstelle der kartesischen Koordinaten (x, y). Im Folgenden nehmen wir zur Vereinfachung an, dass der Definitionsbereich der zu integrierenden Funktion ein Vollkreis KR mit Mittelpunkt 0 und Radius R ist. Durch Nullfortsetzung der Funktion können wir einen solchen Definitionsbereich in ein Rechteck verwandeln, sodass der Begriff der Integrierbarkeit erklärt ist. In Analogie zur schnittweisen Integrierbarkeit setzen wir zudem die polare Integrierbarkeit voraus, d. h., die Existenz der Integrale aller Kreis- und Radialschnitte der Funktion. Diese technische Voraussetzung ist in allen einfachen Beispielen erfüllt. Es gilt nun der folgende Integrationssatz: © Oliver Deiser Einführung in die Mathematik 1 528 5. Abschnitt Mehrdimensionale Analysis Satz (Integration in ebenen Polarkoordinaten) Sei f : KR → R eine polarintegrierbare Funktion. Dann gilt: I(f) = R * * 0 = 2π 0 2π * * 0 f (r cos ϕ, r sin ϕ) r dϕ dr R 0 f (r cos ϕ, r sin ϕ) r dr dϕ. Anstelle ein Doppelintegral mit kartesischen Koordinaten x und y zu berechnen, können wir also mit gleichem Ergebnis ein Doppelintegral mit Polarkoordinaten r und ϕ bestimmen, wobei wir dem polar berechneten Integral den Korrekturfaktor r hinzufügen müssen. Er entspricht der Tatsache, dass der Umfang eines Kreises mit Radius r das r-Fache des Umfangs des Einheitskreises ist. Integrieren wir bei festem r über alle Winkel ϕ, so hat dieser Beitrag zum Integral das r-fache Gewicht. Beispiel 1: Kreisfläche Sei R > 0, und sei f : KR → R konstant gleich 1 auf KR . Dann ist das Integral I(f) die Fläche eines Kreises mit Radius R. Eine polare Berechnung des Integrals ergibt I(f) = R * * 0 2π 1 r dϕ dr = * 0 0 R 2π r dr = π r2 r=R r=0 = R2 π. Beispiel 2: Die Gaußsche Glockenkurve Die Gaußsche Glockenkurve g : R → R ist definiert durch 2 g(x) = e− x /2 für alle x P R. 1.0 g 0.8 0.6 0.4 0.2 -4 -2 Einführung in die Mathematik 1 2 4 © Oliver Deiser 3. Mehrdimensionale Integration 529 Die Glockenkurve spielt in der Wahrscheinlichkeitstheorie eine fundamentale Rolle bei der Untersuchung normalverteilter Zufallsvariablen. Das uneigentliche Integral γ = * ∞ 2 e− x /2 dx −∞ ist nicht leicht zu berechnen, da die Gaußsche Glockenkurve keine elementare Stammfunktion besitzt. Mit Hilfe einer auf unbestimmte Integrale erweiterten Integration in Polarkoordinaten gelingt die Berechnung des Quadrats von γ vergleichsweise leicht: γ2 = = (* ∞ 2 e− x /2 dx −∞ )( * ∞ 2 e− y /2 dy −∞ ∞ * * ∞ 2 2 e− x /2 e−y /2 dx dy = −∞ −∞ = ∞ * * 0 0 2π ) = ∞ ∞ −∞ −∞ * (* ∞ * * ∞ 2 e− (x 2 ) 2 e− x /2 dx e−y /2 dy + y2 )/2 dx dy −∞ −∞ 2 e−r /2 r dϕ dr = 2π limR = 2π limR → ∞ 2 −e−r /2 r=R r=0 →∞ * R 2 e−r /2 r dr 0 = 2π ⋅ 1 = 2π. Damit ist also γ = £2π. Die Schnitte der Funktion f : R2 → R mit f(x, y) = exp(−(x2 + y2 )/2) = g(x) g(y) sind skalierte Glockenkurven. © Oliver Deiser Einführung in die Mathematik 1 530 5. Abschnitt Mehrdimensionale Analysis Räumliche Polarkoordinaten Eine dreidimensionale Variante der ebenen Polarkoordinaten verwendet zur Beschreibung eines Punktes (x, y, z) P R3 die Koordinaten r, θ, ϕ mit der folgenden Bedeutung: (1) Die Koordinate r ≥ 0 ist die Euklidische Länge von (x, y, z). (2) Die Koordinate θ P [ 0, π ] ist der Winkel, den (x, y, z) mit der positiven z-Achse einschließt. (3) Die Koordinate ϕ P [ 0, 2π [ ist der Winkel der Projektion (x, y, 0) von (x, y, z) auf die x-y-Ebene wie bei ebenen Polarkoordinaten. Den Winkel θ können wir als (mathematischen) Breitengrad und den Winkel ϕ als Längengrad eines Punktes auf der Oberfläche einer Kugel mit Radius r und Mittelpunkt 0 auffassen. Räumlichen Polarkoordinaten (r, θ, ϕ) entsprechen die kartesischen Koordinaten (x, y, z) = r (sin θ cos ϕ, sin θ sin ϕ, cos θ). Die Berechnung von r, θ, ϕ aus x, y, z erfolgt wie bei den ebenen Polarkoordinaten mit Hilfe der Euklidischen Norm und der Arkustangens-Funktion. Der Punkt P hat die räumlichen Polarkoordinaten (r, θ, ϕ). Einführung in die Mathematik 1 © Oliver Deiser 3. Mehrdimensionale Integration 531 Das Integral einer auf einer Kugel KR ⊆ R3 mit Radius R und Mittelpunkt 0 definierten Funktion lässt sich mit räumlichen Polarkoordinaten wie folgt berechnen: Satz (Integration in räumlichen Polarkoordinaten) Sei f : KR → R eine polarintegrierbare Funktion. Dann gilt I(f) = π R 2π * * * f ( r sin θ cos ϕ, r sin θ sin ϕ, r cos θ ) r2 sin θ dϕ dθ dr. 0 0 0 Erneut sind auch andere Reihenfolgen der Integrale gleichwertig. Bei festem Radius r und festem Winkel θ durchläuft der durch die räumlichen Polarkoordinaten (r, θ, ϕ) spezifizierte Punkt des Raumes im Winkel ϕ den durch θ definierten Breitenkreis der Kugel Kr . Variiert nun θ von 0 bis π, so überstreichen diese Breitenkreise die gesamte Oberfläche von Kr . Variieren wir nun den Radius r von 0 bis R, so schöpfen wir die Vollkugel mit Radius R vollständig durch Kugeloberflächen aus. Der erste Korrekturfaktor r2 entspricht der Tatsache, dass die Oberfläche einer Kugel quadratisch in ihrem Radius wächst. Analog ist der zweite Korrekturfaktor sin(θ) darauf zurückzuführen, dass in den Umfängen der durch θ definierten Breitenkreise der Sinus des Winkels θ einfließt. Die Berechnung des Kugelvolumens ist nun besonders einfach: Beispiel: Berechnung der Kugelvolumens Sei K ⊆ R3 die Vollkugel mit Mittelpunkt 0 und Radius R > 0. Dann gilt V(K) = 0 = π R * * * 0 R * * 0 2π 0 π 0 R 1 ⋅ r2 sin θ dϕ dθ dr 2π r2 sin θ dθ dr = 2π * r2 − cos θ 0 π 0 dr = * 0 R 4 π r2 dr = 4 3 R π. 3 Inhalte von Rotationsflächen Zum Abschluss diskutieren wir noch eine Formel für den Flächeninhalt einer dreidimensionalen Rotationsfläche. Eine solche Fläche erhalten wir, indem wir die Spur einer in einer Ebene verlaufenden Kurve um eine Achse rotieren. Wir beschränken uns im Folgenden auf Kurven, die in der rechten Hälfte der x-zEbene verlaufen und um die z-Achse rotiert werden. Der Leser denke an das Töpfern zur Visualisierung der entstehenden Rotationsflächen. © Oliver Deiser Einführung in die Mathematik 1 532 5. Abschnitt Mehrdimensionale Analysis Definition (Rotationsfläche einer Kurve) Sei f : [ a, b ] → R3 eine Kurve mit f1 (t) ≥ 0 und f2 (t) = 0 für alle t P [ a, b ]. Weiter sei f injektiv auf ] a, b [. Dann heißt f eine Rotationskurve und ρ(f ) = { (x, y, f3(t)) P R3 | t P [ a, b ], x2 + y2 = f1 (t) 2 } . die durch f erzeugte Rotationsfläche. Rotationsfläche der Kurve f : [ 0, 2π] → R3 mit f(t) = (t, 0, cos t + 1/4 cos(4t) + 5/4) Unser Ziel ist die Berechnung der Oberfläche (genauer: des Oberflächeninhalts) Ar(ρ(f )) der Fläche ρ(f ). Warnung Ein naives Aufintegrieren von Kreisumfängen führt in der Regel zu falschen Ergebnissen. Integrieren wir zum Beispiel die Umfänge der Breitenkreise einer Kugel K mit Radius r und Mittelpunkt 0, so erhalten wir * r −r 2π £r2 − z2 dz = 2π r2 π/2 = π2 r2 , also nicht den korrekten Wert 4r2 π. Die Grundmethode „Approximation und Grenzwertbildung“ der Analysis liefert eine korrekte Formel. Approximieren wir eine Rotationskurve f : [a, b] → R3 durch einen Polygonzug, so ist das zugehörige Rotationsgebilde aus den Mantelflächen von Kegelstümpfen (abgeschnittene Kreiskegel) zusammengesetzt. Die Mantelfläche eines Kegelstumpfes der Höhe h mit den Radien r1 und r2 berechnet sich elementargeometrisch zu Einführung in die Mathematik 1 © Oliver Deiser 3. Mehrdimensionale Integration (+) π (r1 + r2 ) s, wobei s = £(r1 − r2)2 + h2. 533 (Mantelflächenformel) Die Größe s ist dabei die Länge einer Mantellinie des Kegelstumpfes. Ein Kegelstumpf mit Radien r1 > r2 und Höhe h. Im Fall r1 < r2 verjüngt sich der Stumpf nach unten. Im Fall r1 = r2 ergibt sich ein Zylinder, im Fall h = 0 ein Kreisring. Bemerkung Die Formel (+) liefert im degenerierten Fall h = 0 die Fläche π (r1 + r2 ) s = π (r1 + r2 )|r1 − r2 | = π max(r1 , r2 )2 − π min(r1 , r2 )2 eines Kreisrings mit den Radien r1 und r2 . Ist nun p = (tk )k ≤ n eine stützstellenfreie Partition von [ a, b ], so ist nach (+) Ar(p, f) = ∑ k ≤ n π ( f1 (tk ) + f1 (tk + 1 ) ) i f(tk + 1 ) − f(tk ) i eine Approximation an Ar(ρ(f )). Ist p sehr fein, so ist π (f1 (tk + 1 ) + f1 (tk )) für alle t P [ tk , k + 1 ] ungefähr gleich 2π f1 (t). Fügen wir 1/∆k ⋅ ∆k mit ∆k = tk + 1 − tk an die Norm an, so wird folgendes Ergebnis plausibel: Satz (Inhalt der Rotationsfläche einer Kurve) Sei f : [ a, b ] → R3 eine stetig differenzierbare Rotationskurve. Dann gilt Ar(ρ(f )) = * a © Oliver Deiser b 2 π f1 (t) i f ′(t) i dt. Einführung in die Mathematik 1 534 5. Abschnitt Mehrdimensionale Analysis Ist die Kurve f durch einen Graphen auf der z-Achse definiert, d.h. gibt es eine Funktion g : [ a, b ] → [ 0, ∞ [ mit f(t) = (g(t), 0, t) für alle t P [ a, b ], so erhalten wir die speziellere Formel Ar(ρ(f )) = * a b 2 π g(t) £1 + g′(t)2 dt. Der Leser vergleiche die Formeln mit den entsprechenden Ergebnissen für die Längen von Kurven. Beispiel 1: Kugeloberfläche Sei r > 0 und f : [ 0, π ] → R3 definiert durch f(t) = r (sin t, 0, cos t) für alle t P [ 0, π ]. Dann ist ρ(f) die Oberfläche einer Kugel K mit Radius r. Die Norm der Ableitung der Kurve f ist konstant gleich r, sodass Ar(ρ(f )) = * π 0 2 π r sin(t) r dt = − 2 r2 π cos t t=π t=0 = 4 r2 π. Beispiel 2: Oberfläche eines Torus Seien R ≥ r > 0, und sei f : [ 0, 2π ] → R3 mit f(t) = (r cos(t) + R, 0, r sin(t)) für alle t P [ 0, 2π ]. Die Spur von f ist ein Kreis in der rechten Hälfte der x-z-Ebene mit Radius r und Mittelpunkt (R, 0, 0). Die Norm der Ableitung von f ist erneut konstant gleich r. Der durch Rotation der Kurve um die z-Achse entstehende Torus T = ρ(f ) hat damit die Oberfläche Ar(ρ(f )) = * 0 2π 2 π (r cos(t) + R) r dt = 2 π r r sin(t) + Rt t=2π t=0 = 2π r 2 π R = 4 π2 r R. Eine numerische Approximation Zum Abschluss möchten wir die Oberfläche der Einheitssphäre S2 = { (x, y, z) P R3 | x2 + y2 + z2 = 1 } noch numerisch mit Hilfe der entwickelten Theorie berechnen. Sei hierzu n ≥ 1 gegeben. Wir setzen δ = 2/n und teilen das Intervall [ −1, −1 ] der z-Achse durch die Zerlegungspunkte t0 = −1, t1 = −1 + δ, t2 = −1 + 2δ, …, tn = 1 Einführung in die Mathematik 1 © Oliver Deiser 3. Mehrdimensionale Integration 535 in n gleichlange Intervalle der Länge δ auf. Nun betrachten wir die n Kegelstümpfe der Höhe δ, deren Radien durch die Funktion g : [ −1, 1 ] → R mit g(z) = £1 − z2 für alle z P [ −1, 1 ] definiert sind. Sei also rk = g(tk ) für alle k ≤ n. Dann ist An = ∑ 0 ≤ k < n π (rk + rk + 1 ) £(rk − rk + 1 )2 + δ2 eine Approximation an die Oberfläche von S2 . Es gilt limn An = 4π = 12,56637061… Die folgende Tabelle zeigt einige gerundete Werte von An und 4π − An . n An 4π − An 4 6 8 10 20 50 100 11,51049 12,06174 12,26840 12,36866 12,51150 12,55644 12,56367 1,0559 0,50463 0,29797 0,19771 0,054871 0,0099308 0,0027004 Approximation der Einheitssphäre durch 4, 6, 8 und 10 gleichhohe Kegelstümpfe © Oliver Deiser Einführung in die Mathematik 1 536 5. Abschnitt Mehrdimensionale Analysis Übungen Übung 1 Berechnen Sie das Volumen eines Kegels der Höhe h und Grundfläche F mit Hilfe des Cavalierischen Prinzips. Übung 2 Begründen Sie die Additivität I(f + g) = I(f) + I(g) des Riemann-Integrals mit Hilfe des Cavalierischen Prinzips. Übung 3 Seien a, b, c > 0, und sei E = { (x, y, z) P R | ( xa ) + ( by ) + ( zc ) 3 2 2 2 ≤ 1 } das achsenparallele Ellipsoid mit den Halbachsen a, b, c. Berechnen Sie das Volumen von E mit Hilfe des Cavalierischen Prinzips. Übung 4 Einen Torus T mit Radien R ≥ r ≥ 0 erhalten wir, indem wir einen Kreis der x-z-Ebene mit Radius r und Mittelpunkt (R, 0, 0) um die z-Achse rotieren. Jeder Drehwinkel ϕ P [ 0, 2π ] erzeugt dabei einen Kreis mit der Fläche r2 π. Integrieren wir alle diese Flächen auf, so erhalten wir 2πr2 π = 4π2 r2 . Begründen Sie, warum diese Argumentation nicht das Torusvolumen liefert. Übung 5 Sei f : [ a, b ] → R3 eine Rotationskurve. Erklären Sie die Definition ρ(f ) = { (x, y, f3(t)) P R3 | t P [ a, b ], x2 + y2 = f1 (t) 2 } . der durch f erzeugten Rotationsfläche mit Hilfe einer Skizze. Übung 6 Begründen Sie die Formel für die Mantelfläche eines Kegelstumpfes elementargeometrisch. Übung 7 Berechnen Sie die Oberfläche eines Kreiskegels der Höhe h und Grundfläche F mit Hilfe der Oberflächenformel für Rotationsflächen. Einführung in die Mathematik 1 © Oliver Deiser 6. Abschnitt Anhänge © Oliver Deiser Einführung in die Mathematik 1 1. Grundlagen über reelle Funktionen Wir stellen einige allgemeine Grundbegriffe über Funktionen zusammen und betrachten dann speziell Funktionen, die auf einer Menge von reellen Zahlen definiert sind und reelle Werte annehmen. Der Funktionsbegriff Unter einer Funktion oder Abbildung der Form f : A → B verstehen wir ein mathematisches Objekt, das jedem Element a der Menge A (dem Definitionsbereich von f ) ein bestimmtes Element b der Menge B (dem Wertevorrat von f ) zuordnet. Wird dem Element a von A das Element b von B zugeordnet, so schreiben wir f(a) = b und nennen b den Wert von f an der Stelle a. Diese klassische Beschreibung ist keine strenge mathematische Definition, solange der Begriff der Zuordnung nicht erklärt ist. Zu einer Definition gelangen wir, indem wir eine Funktion als zweispaltige Tabelle auffassen, bei der die Elemente der linken Spalte als Stellen und die Elemente der rechten Spalte als zugehörige Funktionswerte eingetragen sind. Dass ein Element b dem Element a zugeordnet ist, heißt dann einfach, dass (a, b) eine Zeile der Tabelle ist. Kein a darf in der linken Spalte mehrfach erscheinen, dagegen ist es möglich, dass in der rechten Spalte Wiederholungen auftreten. Diese Tabellen-Sicht lässt sich relativ direkt in eine präzise mengentheoretische Definition des Funktionsbegriffs übersetzen. Wir begnügen uns hier mit diesen Bemerkungen, folgen aber der dieser Sichtweise entsprechenden Konvention, eine Funktion mit ihrem Graphen zu identifizieren: f = Graph(f ) = { (a, f(a)) | a P A }. Unter dieser Identifizierung ist der Wertevorrat B einer in der Form f : A → B notierten Funktion kein fester Bestandteil von f, sondern eine zweite Menge, die uns mehr oder weniger genau beschreibt, in welcher Menge die Funktionswerte liegen. Für die reelle Sinusfunktion können wir also sin : R → [ −1, 1 ] oder sin : R → R, schreiben, nicht aber sin : R → [ 0, 2 ]. Ist f : A → B, so heißt Def(f ) der Definitionsbereich und B ein (nicht eindeutig bestimmter) Wertevorrat von f. Weiter heißt die Menge f [ A ] = { f(a) | a P A } der (eindeutig bestimmte) Wertebereich oder das Bild von f. Es gilt f [ A ] ⊆ B. © Oliver Deiser Einführung in die Mathematik 1 540 6. Abschnitt Anhänge Weiter definieren wir f [ X ] = { f(a) | a P X } für X ⊆ A, f −1 [ Y ] = { a P A | f(a) P Y } für Y ⊆ B. (Bild der Menge X unter f) (Urbild der Menge Y unter f) Ist f : A → B, so können Elemente von B mehrfach als Funktionswert auftreten oder nicht. Weiter kann jedes Element des Wertevorrats B als Funktionswert erscheinen oder nicht. Die folgenden grundlegenden Abbildungsbegriffe beschreiben diese Verhältnisse. Definition (injektiv, surjektiv, bijektiv) Eine Funktion f : A → B heißt (a) injektiv, falls für alle a, b P A gilt: f(a) = f(b) impliziert a = b, (b) surjektiv (auf B), falls f [ A ] = B, (c) bijektiv (auf B), falls f injektiv und surjektiv ist. Entsprechend nennen wir dann f eine Injektion, Surjektion oder Bijektion. Anschaulich bedeutet „injektiv“, dass kein Wert mehrfach angenommen wird und „surjektiv“, dass jeder Werte des betrachteten Wertevorrats angenommen wird. Eine Bijektion stellt eine 1-1 Korrespondenz zwischen den Elementen von A und den Elementen von B her. Injektive Funktionen lassen sich umkehren: Definition (Umkehrfunktion) Sei f : A → B injektiv. Dann heißt die eindeutige Funktion g : f [ A ] → B mit g(b) = „das a P A mit f(a) = b“ für alle b P f [ A ] die Umkehrfunktion von f. Wir bezeichnen sie mit f − 1 . Eine nichtinjektive Funktion lässt sich nicht umkehren. In vielen Fällen lässt sich aber Injektivität durch eine Verkleinerung des Definitionsbereichs erreichen. Wir definieren hierzu: Definition (Einschränkung) Sei f : A → B eine Funktion, und sei C ⊆ A. Dann ist die Einschränkung f|C von f auf C die eindeutige Funktion g : C → B mit g(a) = f(a) für alle a P C. Ein Paradebeispiel für den Einsatz der Einschränkung ist die Definition der reellen Quadratwurzelfunktion. Wir betrachten hierzu die reellen Quadratfunktion sq : R → R (Einheitsparabel) mit sq(x) = x2 für alle x P R. Diese Funktion ist nicht injektiv und damit nicht umkehrbar. Ist R+0 die Menge aller nichtnegativen reellen Zahlen und g = sq|C, so ist g injektiv (g ist der rechte Ast der Einheitsparabel). Die Umkehrfunktion von g ist die Quadratwurzelfunktion sqrt : R+0 → R. Insgesamt gilt also sqrt = (sq|R+0 )−1 . Einführung in die Mathematik 1 © Oliver Deiser 1. Grundlagen über reelle Funktionen 541 Ständig im Einsatz ist: Definition (Komposition) Seien f : A → B und g : B → C. Dann ist die Komposition h = g + f von f und g die Funktion h : A → C mit h(a) = g(f(a)) für alle a P A. Die Komposition h = g + f wird auch als Verkettung oder Verknüpfung von g und f bezeichnet. Siebeschreibt die Hintereinanderausführung der Funktionen: Zuerst f, dann g. Entsprechend wird g + f gelesen als „g nach f “. Reelle Funktionen Definition (reelle Funktion) Eine Funktion f der Form f : A → R mit A ⊆ R heißt reelle Funktion. Da wir eine Funktion mit ihrem Graphen identifizieren, gilt f = Graph(f ) ⊆ A × f[ A ] ⊆ R × R = R2 = { (x, y) | x, y P R }. Eine reelle Funktion können wir also mit Hilfe der graphischen Methode visualisieren, indem wir sie als Teilmenge der Anschauungsebene zeichnen. Zu den wichtigsten Stellen einer Funktion gehören die Nullstellen: Definition (Nullstelle) Sei f : A → R eine reelle Funktion. Ist x P A mit f(x) = 0, so heißt x eine Nullstelle von f. Oft ist auch das Wachstum einer reellen Funktion von Interesse. Es beschreibt, ob und wie die Ordnung zwischen zwei Stellen beim Übergang zu den Funktionswerten erhalten bleibt: Definition (Monotoniebegriffe) Sei f : A → R eine reelle Funktion. Dann heißt f streng monoton steigend, falls f(x) < f(y) monoton steigend, falls f(x) ≤ f(y) streng monoton fallend, falls f(x) > f(y) monoton fallend, falls f(x) ≥ f(y) für alle x, y P A mit x < y gilt. Statt „steigend“ sagt man gleichwertig auch „wachsend“, wobei dies nicht so gut zu „fallend“ passt. Streng monotone Funktionen sind injektiv und lassen sich daher umkehren. © Oliver Deiser Einführung in die Mathematik 1 542 6. Abschnitt Anhänge Wichtig sind die folgenden Symmetrieeigenschaften: Definition (gerade und ungerade Funktionen) Sei f : A → R eine reelle Funktion. Dann heißt f gerade, falls für alle x P A gilt, dass f(x) = f(−x). Weiter heißt f ungerade, falls für alle x P A gilt, dass f(x) = −f(−x). Ein Ausdruck f(x) = y beinhaltet immer, dass x ein Element des Definitionsbereichs der Funktion f ist. Für eine gerade oder ungerade Funktion f : A → R ist als mit x immer auch −x ein Element von A. Intervalle Der Definitionsbereich A einer reellen Funktion f : A → R kann eine beliebige Mengen reeller Zahlen sein. Oft hat A aber eine einfache Struktur. Wir definieren hierzu und für vieles andere: Definition (Intervall) Eine Teilmenge I von R heißt ein Intervall, falls für alle a,b P I mit a < b gilt: Für alle c P R mit a < c < b ist c P I. Mit je zwei Punkten enthält ein Intervall auch alle dazwischen liegenden Punkte. Es treten die folgenden Typen auf: Definition (Intervalltypen) Wir setzen für alle a, b P R: [a, b] = { x P R | a ≤ x ≤ b }, [a, b[ = { x P R | a ≤ x < b }, ]a, b] = { x P R | a < x ≤ b }, ]a, b[ = { x P R | a < x < b }, [a, ∞[ = { x P R | a ≤ x }, ]a, ∞[ = { x P R | a < x }, ]−∞, a] = { x P R | x ≤ a }, ]−∞, a[= { x P R | x < a }, ]−∞, ∞[ = R. Intervalle der Form ] a, b [, [ a, b ], ] a, b ] und [ a, b [ mit a, b P R ∪ { ∞, ± ∞ } heißen offen, abgeschlossen bzw. halboffen. In allen Fällen heißen a und b die Grenzen des Intervalls. Ist eine Grenze ein symbolischer Unendlichkeitswert, so spricht man auch von einem uneigentlichen Intervall. Spezialfälle sind abgeschlossene Intervalle der Form [a, a] = { a }, die nur aus einem Punkt bestehen. Auch die leere Menge gilt als Intervall. Einführung in die Mathematik 1 © Oliver Deiser 1. Grundlagen über reelle Funktionen 543 Definition (spezielle Mengen reeller Zahlen) Wir setzen: R+0 = [ 0, ∞ [ = { x P R | x > 0 }, + = ] 0, ∞ [ = { x P R | x ≥ 0 }, R R* = ] − ∞, 0 [ ∪ ] 0, ∞ [ = { x P R | x ≠ 0 }. Die Definitions- und Wertebereiche aller elementaren Funktionen der Analysis sind entweder Intervalle oder Vereinigungen von Intervallen wie die Menge R*. Betrag und Vorzeichen Wir definieren noch zwei spezielle reelle auf ganz R definierte Funktionen. Definition (Betrag und Vorzeichen) Die Betragsfunktion | ? | : R → R und die Vorzeichenfunktion sgn : R → R sind definiert durch |x| = { sgn(x) = falls x ≥ 0, sonst. x −x { falls x > 0, falls x = 0, sonst. 1 0 −1 Die reellen Zahlen |x| und sgn(x) heißen der Betrag bzw. das Vorzeichen oder Signum von x. Die Betragsfunktion haben wir hier mit Hilfe der Punkt- oder Platzhalternotation in der Form | ? | : R → R definiert, da ihre Funktionswerte nicht in der Form f(x) notiert werden. Die Betragsfunktion ist gerade, die Signumsfunktion ungerade. Für alle reellen Zahlen x, y gilt: (a) x = sgn(x) |x|, (b) |x y| = |x| |y|, (c) |x + y| ≤ |x| + |y|. (Dreiecksungleichung). Nützlich ist zuweilen die Version sgn2 : R → R der Vorzeichenfunktion mit sgn2 (x) = { © Oliver Deiser 1 −1 falls x ≥ 0, sonst. Einführung in die Mathematik 1 544 6. Abschnitt Anhänge Eine weitere Funktion im Umfeld der Vorzeichenfunktion ist die HeavisideFunktion Θ : R → R, die definiert ist durch Θ(x) = { 1 0 falls x ≥ 0, sonst. In der Literatur wird die Heaviside-Funktion an der Stelle 0 oft nicht oder durch Θ(0) = 1/2 definiert. Bei dieser Konvention gilt Θ(−x) = 1 − Θ(x) für alle x P R. Zur Definition von Funktionen durch Terme Eine reelle Funktion wird oft durch Terme definiert. Wir können zum Beispiel f : R → R definieren durch (+) f(x) = x2 + 2x − 1 für alle x P R. Ein Term ist ein aus Variablen, Konstanten und bestimmten kontextabhängigen Grundfunktionen (wie +, ⋅, sin, cos, …) aufgebauter syntaktischer Ausdruck (eine Zeichenkette), den wir für bestimmte (vom Term abhängige) reelle Zahlen auswerten können. Zwischen Variablensymbolen, reellen Zahlen, Termen, Termauswertung und den dadurch erklärten Funktionen wird speziell in der Analysis oft nicht streng unterschieden. Statt „die durch den Term 1/x durch Termauswertung definierte Funktion auf R − { 0 }“ sagt man zum Beispiel oft einfach „die Funktion 1/x“. Dies ist aus zweierlei Hinsicht problematisch: (1) 1/x ist ein Term (ein syntaktischer Ausdruck) und keine Funktion. (2) Der Definitionsbereich der Funktion ist nicht eindeutig spezifiziert. Wenn man sich dieser Probleme bewusst ist (und nur dann), kann man zur Vereinfachung der Sprechweise vereinbaren, dass eine Funktion mit einem Term verwechselt werden darf. Wichtig ist dabei: Konvention Wird ein Term als reelle Funktion bezeichnet, so ist die durch den Term definierte Funktion mit maximalem reellen Definitionsbereich gemeint. Ein kleinerer Definitionsbereich muss explizit durch einen Zusatz „auf A“ angegeben werden. Einführung in die Mathematik 1 © Oliver Deiser 1. Grundlagen über reelle Funktionen 545 Beispiele (1) Die Funktion sin(x2 ) ist die Funktion f : R → R mit f(x) = sin(x2 ) für alle x P R. (2) Die Funktion 1/x ist die Funktion g : R − { 0 } → R mit g(x) = 1/x für alle x ≠ 0. (3) Die Funktion 1/x auf R+ ist die Funktion h : R+ → R mit h(x) = 1/x für alle x > 0. Punktweise Operationen mit reellen Funktionen Für reelle Funktionen sind die folgenden arithmetischen Operationen erklärt: Definition (punktweise Operationen) Seien f, g : A → R reelle Funktionen, und sei c P R. Dann sind die Funktionen cf, f + g, f − g, f ⋅ g : A → R definiert durch (cf )(x) = c f(x), (f + g)(x) = f(x) + g(x), (f − g)(x) = f(x) − g(x), (f ⋅ g)(x) = f(x) ⋅ g(x) für alle x P A. Ist B = { x P A | g(x) = 0 } die Menge der Nullstellen von B, so ist die Funktion f/g : A − B → R definiert durch (f/g)(x) = f(x)/g(x) für alle x P A − B. © Oliver Deiser Einführung in die Mathematik 1 2. Axiome für die reellen Zahlen Die reellen Zahlen lassen sich axiomatisch beschreiben. Die Axiome lassen sich dabei in algebraische Axiome und Ordnungsaxiome aufteilen. Die erste Gruppe beschreibt die Arithmetik, die zweite die lineare Struktur der reellen Zahlen und ihre Verbindung zur Arithmetik. Von fundamentaler Bedeutung ist das Vollständigkeitsaxiom, das den Unterschied zwischen den rationalen Zahlen − und anderen „lückenhaften“ Zahlbereichen − und den reellen Zahlen zum Ausdruck bringt. Axiome für die Addition und Multiplikation Die reellen Zahlen R sind eine Menge, auf der eine Addition + und eine Multiplikation ⋅ erklärt ist. Die Addition und Multiplikation sind zweistellige Operationen auf R, d. h. für alle reellen Zahlen x und y ist x + y und x ⋅ y wieder eine reelle Zahl. Weiter gibt es es zwei ausgezeichnete Elemente 0 und 1 in R. Mit dieser Beschreibung der arithmetischen Struktur der reellen Zahlen können angeben, die beschreiben, welche Eigenschaften in der Struktur gelten. Für alle x, y, z P R gilt: (K1) x + (y + z) = (x + y) + z Assoziativgesetz für + (K2) x+0 = x Neutralität von 0 (K3) ∃x′ x + x′ = 0 Inverse für + (K4) x+y = y+x Kommutativgesetz für + (K5) x ⋅ (y ⋅ z) = (x ⋅ y) ⋅ z Assoziativgesetz für ⋅ (K6) x⋅1 = x Neutralität von 1 (K7) x ≠ 0 → ∃x′ x ⋅ x′ = 1 Inverse für ⋅ (K8) x⋅y = y⋅x Kommutativgesetz für ⋅ (K9) x ⋅ (y + z) = (x ⋅ y) + (x ⋅ z) Distributivgesetz (K10) 0 ≠ 1 Verschiedenheit von 0 und 1 Die Aussagen (K1) − (K10) werden auch als Körperaxiome für R bezeichnet. Wir sagen auch, dass R mit + und ⋅ und den Elementen 0, 1 einen Körper bildet. © Oliver Deiser Einführung in die Mathematik 1 548 6. Abschnitt Anhänge Ordnungaxiome Auf den reellen Zahlen steht uns neben der Arithmetik auch eine Ordnungsrelation < zur Verfügung. Die Eigenschaften dieser Ordnung werden durch weitere Axiome beschrieben. Für alle x, y, z P R gilt: (K11) ¬x<x Irreflexivität (K12) x<y∧y<z → x<z Transitivität (K13) x<y ∨ x=y ∨ y<x Vergleichbarkeit (K14) x<y → x+z<y+z Addition und Ordnung (K15) 0 < x ∧ 0<y → 0 < x⋅y Multiplikation und Ordnung Durch diese Axiome wird R ein angeordneter Körper. Das Vollständigkeitsaxiom Die bisherigen Axiome legen R nicht eindeutig fest: Alle Axiome gelten auch für die rationalen Zahlen (und weiter auch für die algebraischen Zahlen). Der wesentliche Unterschied wird erst durch Aussagen erfasst, die die Nichtexistenz von Lücken in R zum Ausdruck bringen. Eine Möglichkeit ist das folgende Axiom. (K16) Jede nichtleere und nach oben beschränkte Teilmenge von R besitzt ein Supremum. lineare Vollständigkeit Das Axiom (K16) kann äquivalent durch die beiden folgenden Axiome ersetzt werden: (K16) ′ Ist (xn )n P N eine Cauchy-Folge, so existiert limn xn . (metrische) Vollständigkeit (K17) ∀x, y > 0 ∃n P N n x > y Archimedisches Axiom Einführung in die Mathematik 1 © Oliver Deiser 3. Vollständige Induktion Die natürlichen Zahlen 0, 1, 2, 3, 4, …, n, n + 1, … sind durch die Nachfolgerbildung ausgezeichnet, die ausgehend von einem Anfangselement 0 (alternativ: 1) jeder natürlichen Zahl n einen eindeutigen Nachfolger n + 1 zuordnet. Das Anfangselement ist die einzige natürliche Zahl, die kein Nachfolger einer anderen natürlichen Zahl ist. Die Nachfolgeroperation ist zudem injektiv, d. h. haben zwei Zahlen den gleichen Nachfolger, so sind sie gleich. Um nun zu zeigen, dass eine Eigenschaft %(n) für alle natürlichen Zahlen n gilt, können wir so vorgehen: Wir zeigen, dass die Eigenschaft für das Anfangselement gültig ist und dass sie sich von jeder natürlichen Zahl auf ihren Nachfolger vererbt, d. h. dass aus %(n) stets auch %(n + 1) folgt. Ein solcher Beweis heißt ein Beweis durch (vollständige) Induktion. Als Schema notiert: Beweis durch Induktion Induktionsanfang (I. A.): Es gilt %(0). Induktionsschritt (I. S.) von n nach n + 1: Es gelte %(n) (Induktionsvoraussetzung I.V.). Dann gilt %(n + 1). In dieses Schema ist der Beweis von %(0) und der Beweis von %(n + 1) (mit Hilfe von %(n)) einzufügen. Sind diese beiden Beweise erbracht, so ist gezeigt, dass jede natürliche Zahl n die Eigenschaft %(n) besitzt. Beispiel Das Paradebeispiel ist die sog. Gaußsumme. Wir wollen zeigen: (+) Für alle natürlichen Zahlen n gilt 0 + 1 + … + n = n(n + 1)/2. Die Eigenschaft %(n) ist also 0 + … + n = n(n + 1)/2. Ein induktiver Beweis von (+) nach obigem Schema lautet: Induktionsanfang: Es gilt 0 = 0 (0 + 1)/2. Also gilt %(0). Induktionsschritt von n nach n + 1: Es gelte %(n), d. h. 0 + … + n = n (n + 1)/2 (I.V.). Dann gilt 0 + … + (n + 1) = (0 + … + n) + (n + 1) =I. V. n(n+ 1)/2 + (n+ 1) = (n + 1)(n+ 2)/2. Dies zeigt, dass %(n + 1). © Oliver Deiser Einführung in die Mathematik 1 4. Notationen Wir stellen zunächst einige Notationen tabellarisch zusammen und listen dann die in diesem Text verwendeten Notationen nach ihrem Auftreten auf. Notationen und Sprechweisen im Überblick ¬A (Negation, non A, nicht A) A∧B (Konjunktion, A und B) A∨B (Disjunktion, A oder B) A→B (Implikation, A impliziert B) A↔B (Äquivalenz, A und B sind äquivalent; A genau dann, wenn B) A∧B (Konjunktion, A und B ∀a %(a) (Allquantor, für alle x gilt %(a)) ∃a %(a) (Existenzquantor, es gibt (mindestens) ein x mit %(a)) aPA A = { a | %(a) } (Elementbeziehung, a ist ein Element der Menge a) (Mengenkomprehension, Menge aller a mit der Eigenschaft %(a)) A⊆B (Inklusion, A ist eine Teilmenge von B) A⊂B (echte Inklusion, A ist eine echte Teilmenge von B) { a, b } (Paarmenge) { a1 , …, an } (a, b) (a, b, c) (a1 , …, an ) A × B = { (a, b) | a P A und b P B } A2 = A × A, A3 = A2 × A usw. © Oliver Deiser (endliche Menge mit den Elementen a1 , … an ) (geordnetes Paar) (Tripel) (Tupel der Länge n) (kartesisches Produkt) (Mengenpotenzen) Einführung in die Mathematik 1 552 6. Abschnitt Anhänge N = { 0, 1, 2, 3, … } (natürliche Zahlen) Z = { …, −2, −1, 0, 1, 2, 3, … } (ganze Zahlen) Q = { ± n/m | n P N, m P N* } (rationale Zahlen) R = { ± n,d1 d2 d3 … (dezimal) | n P N, 0 ≤ dk ≤ 9 für alle k } (reelle Zahlen) N* = N − { 0 }, Z* = Z − { 0 }, Q* = Q − { 0 }, R* = R − { 0 } f:A →B ( f ist eine Funktion von A (Definitionsbereich) nach B (Wertevorrat)) f(a) = b (b ist der Wert von f an der Stelle oder im Punkt b) Def(f) ( Definitionsbereich von f) Bild(f ) = f[ A ] = { f(a) | a P A } f|C ( Bild oder Wertebereich von f) ( Einschränkung von f : A → B auf die Menge C ⊆ A) Lesarten der Implikation Eine Implikation A → B wird gelesen als: A impliziert B, aus A folgt B, B folgt aus A, wenn A, so auch B, A ist hinreichend für B, B ist notwendig für A, A zieht B nach sich. Griechisches Alphabet Alpha Α α Beta Β β Gamma Γ γ Delta ∆ δ Epsilon Ε ε Zeta Ζ ζ Eta Η η Theta Θ θ, ϑ Jota Ι ι Kappa Κ κ Lambda Λ λ My Μ µ Einführung in die Mathematik 1 Ny Xsi Omikron Pi Rho Sigma Tau Ypsilon Phi Chi Psi Omega Ν Ξ Ο Π Ρ Σ Τ Υ Φ Χ Ψ Ω ν ξ ο π ρ σ, ς τ υ ϕ χ ψ ω © Oliver Deiser 4. Notationen 553 Index der Notationen £x 23 sinh 111 z 261 272 282 sgn 24 H1 111 ζnk f/g 56 tanh 113 limn zn x 68 coth 113 log : ] 0, ∞ [ → R 73 sech 113 ln : ] 0, ∞ [ → R 73 csch 113 limz expa 74 arcosh 114 Rn ax 74 arsinh 114 ivi 302 potb : ] 0, ∞ [ → R 77 artanh 114 ivimax 302 loga : ] 0, +∞ [ → R 78 arcoth 114 v̂ 303 Kr 84 arsech 114 〈v, w〉 305 K 84 arcsch 114 v•w 305 cos 85 cosh0 114 〈v w〉 305 sin 85 sech0 114 izi 310 rotα 93 T np f 153 〈z, w〉 310 tan 94 Tp f 154 ] 312 cot 94 I(f) 178 A(i, j) 334 sec 94 X≤s 203 R2×2 334 csc 94 s = max(X) 204 At 335 e Uε (z) 282 ∑ n zn →p 283 f(z) 283 298 / 96 s = sup(X) 204 E2 336 sin0 97 X+Y 207 δij 336 cos0 97 X⋅Y 207 diag(d1 , d2 ) 336 tan0 97 cX 207 fA 339 cot0 97 −X 207 A[P] 350 sec0 97 Sp f 216 G(v) 391 csc0 97 sp f 216 span(v) 391 arccos 98 Sf 217 E(v, w) 391 arcsin 98 sf 217 span(v, w) 391 arctan 98 P + u 391 98 ∑ n P N xn ∞ ∑n = 0 xn 228 arccot 228 A(i, j) 410 240 diag(a, b, c) 410 241 At 410 246 R3×3 410 fA 412 98 limx arg 102 si(x) arctan2 105 limx Ψ 105 C 257 Φ 105 i 260 prG 412 f+ 110 Re(z) 261 prE 413 f− 110 Im(z) 261 A−1 416 cosh 111 |z| 261 Wij (λ) 419 arcsec © Oliver Deiser →p ↑p f(x) f(x) Einführung in die Mathematik 1 554 limn →∞ 6. Abschnitt Anhänge xn 428 spur(f) 430 f ′(t) 431 Lp f 435 L(f) 436 nivf 443 ∂w f(p) 446 ∂j f(p) 447 gradf 448 Hf 452 divg 456 rotg 456 = 456 =f 457 〈=, g〉 457 =×g 457 D 457 =2 457 I(f) 462 S1 (A, x) 466 S2 (A, y) 466 S3 (A, z) 466 ρ(f) 474 Ar(ρ(f)) 474 S2 476 Def(f) 482 f[A] 482 f −1 483 f |C 483 [ a, b ] 485 [ a, b [ 485 ] a, b ] 485 ] a, b [ 485 R+0 485 R+ 485 R* 485 |x| 486 sgn(x) 486 sgn2 (x) 486 Θ(x) 486 Einführung in die Mathematik 1 © Oliver Deiser 5. Index A Abbildung 482 abgeschlossen 485 Ableitung 122 , 284 , 431 , 446 Ableitung der Umkehrfunktion 134 Abspalten einer Nullstelle 41 Abstand 309 Achsenrichtung 447 Addition 257 , 299 Additionstheorem 67 Additionstyp 419 additiv inverse Vektor 299 Additivität 171 affine Ebene 391 affine Gerade 325 , 331 , 391 algebraische Kurve 326 f algebraische Vielfachheit 42 allgemeine Potenz 77 Alternation 397 , 407 alternierende harmonische Reihe 234 analytische Definition von π 292 Anfangswertproblem 141 angeordneter Körper 491 Anteil 110 Antikommutativität 397 , 407 antiparallel 315 äquidistant 168 Archimedische Spirale 439 Archimedisches Axiom 491 Area-Funktionen 114 Argument 102 Arkusfunktionen 98 Assoziativität 299 , 308 , 342 aufeinander senkrecht 315 aufgespannte Parallelogramm 317 Aufspaltung 171 AWP 141 B bac-cab−Regel 397 b-adische Darstellung 215 Bahn 430 © Oliver Deiser Basis 74 , 78 , 215 Basis e 73 Basisvektoren 298 beschränkt 203 Betrag 261 , 486 Betragsfunktion 486 Bijektion 483 bijektiv 483 Bild 350 , 482 Bilinearität 306 , 309 , 397 , 407 Binet-Cauchy-Identität 397 binomische Formeln 306 C Cauchy-Bedingung 227 Cauchy-Folge 227 Cavalierisches Prinzip 466 charakteristische Polynom 373 , 421 D Darboux-Integral 217 Darboux-Summe 216 Darstellungsproblem 154 Definitionsbereich 482 Definitionslücke 56 Determinante 319 , 343 , 402 Diagonale 334 , 410 Diagonaleinträge 334 Diagonalisierung 377 Diagonalmatrix 334 , 410 dicht 209 Differentialquotient 122 Differenz 337 Differenzenquotient 122 differenzierbar 122 , 129 , 431 , 446 , 454 Differenzvektor 299 Dirac-Notation 305 Dirichlet-Sprungfunktion 170 , 244 Diskriminante 30 Distributivität 342 divergent 225 Einführung in die Mathematik 1 556 6. Abschnitt Anhänge Divergenz 456 Division 40 domain coloring 267 doppelte Nullstelle 31 Drehformel 92 Drehung 89 Drehung um π/2 88 dreidimensionaler reeller Raum 298 Dreiecksmatrix 353 , 368 Dreiecksungleichung 304 , 486 dynamische Interpretation 430 E Ebene 391 Eigenpaar 372 Eigenvektor 372 , 421 Eigenwert 372 , 421 eindeutig lösbar 322 , 405 Einheitshyperbel 111 , 327 Einheitskreis 84 , 327 Einheitsmatrix 336 , 411 Einheitsparabel 22 , 327 Einheitssphäre 476 Einheitsvektoren 298 Einheitswurzel 272 Einschränkung 483 Einträge 334 Einträgen 410 Elementarmatrix 419 Ellipse 327 elliptische Integral 438 elliptischen Kurve 328 endlicher Dezimalbruch 213 Endpunkt 430 Entwicklung 46 Entwicklungspunkt 153 f Erhalt der Länge 361 Erhalt des Skalarprodukts 361 erste Ableitung 129 Euklidische Länge 302 Euklidische Norm 302 , 390 Euklidische Skalarprodukt 305 Euklidisches Skalarprodukt 390 Euler-Mascheroni-Konstante 232 Eulersche Formel 287 Eulersche Identität 288 Eulersche Konstante 67 Eulersche Zahl 67 Exponenten 77 Exponentialfunktion 67 , 74 Einführung in die Mathematik 1 Exponentialreihe 70 , 285 Exponentialschreibweise 68 , 74 , 284 Extraktion der Einträge 338 Extremalstelle 451 F Farbkreismethode 267 Faser 345 fast alle 225 Fehlerintegral 194 Feinheit 168 Folge 222 folgenstetig 248 , 428 , 446 , 453 Folgenstetigkeit 284 Formel vom nicht vergessenen Betrag 23 Formel von de Moivre 293 Fresnel-Integral 194 Fundamentalsatz der Algebra 268 Funktion 482 (funktionale) Gerade 12 Funktionalgleichung 67 G Gaußsche Glockenkurve 193 , 470 Gaußsche Zahlenebene 257 gekürzt 59 geometrische Reihe 230 , 285 geometrische Summe 285 Gerade 391 gerade 110 , 484 geschlossen 430 Glied 222 Glockenkurve 470 goldener Schnitt 279 Grad 36 Gradformeln 37 Gradient 448 Gradientenfeld 456 graphischen Methode 484 Grassmann-Identität 397 , 407 Grenzen 485 Grenzwert 224 , 240 , 283 , 428 größte untere Schranke 204 Grundfläche mal Höhe 467 H Halbierungsformeln 106 halboffen 485 harmonische Reihe 232 © Oliver Deiser 5. Häufungspunkt 246 Hauptlage 445 Heaviside-Funktion 486 Hesse-Matrix 452 Höhenlandschaften 442 Höhenlinie 443 Höhenliniendiagramme 443 homogen 323 , 406 Hyperbel 327 , 445 I idempotent 353 Identität 13 imaginäre Einheit 260 Imaginärteil 261 Index 222 Infimum 204 inhomogen 323 , 406 Injektion 483 injektiv 483 Integral 168 Integral-Sinus 193 Integration in Polarkoordinaten 469 Integration in räumlichen Polarkoordinaten 473 integrierbar 462 Intervall 485 Intervallschachtelung 212 invers 356 , 416 Inverse 262 Inversenbildung 299 , 308 invertierbar 356 , 416 Invertierungsregeln 416 J Jacobi-Identität 397 , 407 Jakobi-Matrix 453 K Kegelschnitt 328 Kettenlinie 112 Kettenregel 134 kleinste obere Schranke 204 Koeffizienten 36 , 266 , 322 , 405 Koeffizientenformel 71 Koeffizienten-Matrix 323 Koeffizientenvergleich 26 , 42 kollinear 315 , 390 Kommutativität 299 , 308 Komplementärmatrix 357 © Oliver Deiser Index 557 komplexe Exponentialfunktion 284 komplexe Exponentialreihe 285 komplexe Quadratwurzel 269 komplexe Zahl 257 Komponenten 298 , 429 , 453 komponentenweise Addition 256 komponentenweise Konvergenz 428 komponentenweise Multiplikation 256 komponentenweise Stetigkeit 429 Konjugation 261 Konjugierte 261 konstantes Polynom 36 , 266 Kontur-Plot 443 konvergent 225 Konvergenzbedingung 224 Konvergenzbedingung für Pendelfolgen 211 Konvergenzkriterien 234 Konvergenzproblem 154 Konvergenzradius 158 Koordinaten 321 Koordinatenfunktionen 429 Koordinatenvektor 321 , 405 koordinatenweise 429 Körper der komplexen Zahlen 257 Körperaxiome 490 Kosekans 94 Kosekans Hyperbolicus 113 Kosinus Hyperbolicus 111 Kosinus-Funktion 85 Kosinus-Reihe 145 Kosinussatz 313 , 329 Kotangens 94 Kotangens Hyperbolicus 113 Kreis 84 , 327 Kreisaufwicklung 86 Kreiskegel 467 Kreislinie 84 Kreisring 468 Kreissegment 187 Kreuzprodukt 389 , 396 Kronecker-Delta 336 , 361 Krümmung 130 Kugeloberfläche 476 Kugelvolumen 464 Kurve 430 L Lagrange-Identität 397 , 407 Landau-Notation 127 Einführung in die Mathematik 1 558 6. Abschnitt Anhänge Länge 168 , 302 , 436 Längenformel 436 Laplace-Operator 457 Leibniz-Kriterium 234 Leibniz-Reihe 160 , 234 Leitkoeffizient 36 , 266 Lemniskate von Bernoulli 440 Limes 224 Limesdarstellung der Exponentialfunktion 72 linear 346 , 412 linear abhängig 393 linear unabhängig 393 lineare Funktion 12 Linearfaktoren 41 Linearität 134 , 171 Linearitätsbedingung 346 , 412 Linearkombination 320 , 404 linksseitige Stützstellen 168 linksseitigen Grenzwert 246 linksseitiger Grenzwert 132 Linkssystem 400 log(2)-Reihe 157 Logarithmus 73 , 78 lokale Maximalstelle 451 lokale Minimalstelle 451 lokaler Extremwert 451 lösbar 322 , 405 Lösungsformel 31 Lösungsmenge 322 , 405 M Majoranten-Kriterium 235 majorisiert 235 Mantelflächenformel 475 Matrix 334 , 410 Matrix-Form eines linearen Gleichungssystems 339 Matrix-Schreibweise 319 , 403 Matrix-Vektor-Produkt 338 , 410 Matrizenaddition 410 Matrizenprodukt 410 Maximum 204 Maximumsnorm 302 Mehrfachintegral 462 (metrisches) Vollständigkeitsaxiom 228 m-fache Nullstelle 42 Minimum 204 Mittelpunkt 84 , 327 Mittelwert 167 Einführung in die Mathematik 1 Mitternachtsformel 31 , 270 mittige Stützstellen 168 monoton fallend 484 monoton steigend 484 Monotonie 171 Multiplikation 257 , 300 Multiplikationssatz 343 Multiplikationstheorem 74 Multiplikationstyp 419 N Nabla-Operator 456 nach oben (unten) beschränkt 203 Nachkommaziffern 213 natürliche Logarithmus 73 negativ definit 452 negativ orientiert 318 , 401 Neuner-Periode 213 f Neutralität des Nullvektors 299 , 308 Neutralität von E2 342 Niveaumenge 443 Norm 302 Normalparabel 22 normiert 36 , 266 , 303 Normierung 171 , 303 n-te Ableitung 129 Nullfolge 225 Nullfortsetzung 214 Nullmatrix 336 , 411 Nullpolynom 36 , 266 Nullpunktsteigung 22 Nullstelle 87 , 266 , 484 Nullvektor 298 Nullwert 12 , 22 numerische Exzentrizität 438 O obere Schranke 203 Oberintegral 217 offen 430 , 485 Öffnung 22 orthogonal 315 , 361 , 390 Orthogonaldarstellung einer Geraden 326 orthogonale Projektion 412 f Orthogonalität 397 , 407 P Parabel 22 , 328 Paraboloid 444 © Oliver Deiser 5. parallel 315 Parallelepiped 401 Parallelogramm 317 Parallelogrammgleichung 309 Parameter 430 Parametrisierung 430 Parität 88 , 110 Paritäts-Zerlegung 110 Partialbruchzerlegung 60 Partialsumme 70 , 228 , 283 partiell differenzierbar 447 partielle Ableitung 447 partielle Integration 180 Partition 168 , 462 Pendelfolge 211 Pentagon 274 periodisch 85 Platzhalternotation 486 Plot 442 polare Integrierbarkeit 469 Polarisation 306 , 309 Polarkoordinaten 102 , 469 , 472 Polarkoordinatenvektor 102 Polarwinkel 102 Polstelle 57 Polygon-Approximation 435 Polynom 36 , 266 Polynomdivision 39 Polynomfunktion 36 , 266 positiv definit 452 positiv orientiert 318 , 401 positive Definitheit 306 , 309 Potenzfunktion 77 Potenzreihe 69 Produkt 337 , 341 Produktregel 134 Projektion 316 Projektionsformel 316 Projektionsmatrizen 347 Punkt-Richtungsdarstellung 15 Q quadratische Ergänzung 28 quadratischen Funktion 22 Quadratwurzel 23 Quadratwurzelfunktion 23 Quelle 456 quellfrei 456 Quotient 40 Quotienten-Kriterium 235 © Oliver Deiser Index 559 Quotientenregel 134 R Radius 84 , 102 rationale Funktion 56 Räumliche Polarkoordinaten 472 Realteil 261 Rechteck 240 rechter Seite 322 , 405 rechtsseitigen Stützstellen 168 rechtsseitiger Grenzwert 132 Rechtssystem 400 reelle Ebene 298 reelle Funktion 484 reeller Vektor 298 regulär 431 Reihendarstellung 69 rein imaginär 261 rektifizierbar 436 Rest 40 Richtungsableitung 446 Richtungsfeld 66 Richtungsvektor 446 Riemann-Integral 170 Riemann-integrierbar 170 Riemann-Summe 169 , 462 Rotation 456 Rotationsfläche 474 f Rotationskörper 467 Rotationskurve 474 Rotationsmatrix 362 Rücksubstitution 184 Rückwärtsintegral 171 S Sattelfläche 445 Satz des Pythagoras 88 Satz von Schwarz 448 Scheitelform 27 Scheitelpunkt 27 Schmiegeparabel 150 Schnitt 466 schnittweise integrierbar 462 Sekans 94 Sekans Hyperbolicus 113 Sekante 122 Senke 456 Signum 486 singulär 356 , 416 , 431 Singulärwertzerlegung 382 Einführung in die Mathematik 1 560 6. Abschnitt Anhänge Sinus cardinalis 241 Sinus Hyperbolicus 111 Sinus-Funktion 85 Sinus-Reihe 145 Skalar 300 Skalarmultiplikation 300 , 390 , 410 Skalierung 171 , 300 Spaltenextraktion 338 Spaltentausch 342 Spaltenvektoren 322 , 334 , 410 Spann 320 , 404 Spat 401 Spektralsatz 375 , 422 Spiegelung 88 Spiegelungsmatrix 362 Spur 334 , 410 , 430 Stammfunktion 166 Startpunkt 430 Steigung 12 , 446 Steigungsdreieck 13 Steigungsform 15 stetig 242 , 283 , 428 , 446 , 453 stetig differenzierbar 447 stetig hebbar 57 stetig partiell differenzierbar 447 Stetigkeit 243 , 429 , 446 , 453 strebt 240 , 246 streng monoton fallend 484 streng monoton steigend 484 strikte lokale Maximalstelle 451 Stützstellen 168 Substitutionsregel 183 Summanden 228 Summe 228 , 337 Supremum 204 Surjektion 483 surjektiv 483 Symmetrie 306 , 309 symmetrisch 335 , 410 T Tangens 94 Tangens Hyperbolicus 113 Tangente 17 , 122 Tangentialebene 448 Tangentialvektor 431 Taylor-Entwicklung 47 , 153 Taylor-Polynom 37 , 153 Taylor-Reihe 154 Teiler 39 Einführung in die Mathematik 1 Teilerpolynom 39 Teleskop-Summe 43 , 174 Term 487 Thomae-Funktion 244 Torus 468 , 476 totale Differenzierbarkeit 454 Translation 391 transponierte Matrix 335 , 410 U Umgebung 282 umgebungsstetig 428 , 446 , 453 Umgebungsstetigkeit 243 Umkehrfunktion 483 Unbekannte 322 , 405 unbestimmten Integrals 165 unbestimmtes Integral 178 uneigentlich konvergent 225 uneigentlichen Grenzwert 247 uneigentlichen Intervall 485 unendliche Reihe 228 unendlicher Dezimalbruch 213 ungerade 110 , 484 unlösbar 322 , 405 unstetig 242 untere Schranke 203 Unterintegral 217 Urbild 482 V Vektoraddition 390 Vektorfeld 455 Vektorprodukt 389 , 396 Verdopplungsformeln 91 Verlauf in einem Rechteck 240 Verschiebung 12 , 391 Verschiebungsformeln 88 Vertauschung der Integrationsreihenfolge 464 Vietascher Wurzelsatz 33 vollständigen Definitionsbereich 59 von links 246 Vorzeichen 486 Vorzeichenfunktion 24 , 486 W Wert 228 Wertebereich 482 Wertevorrat 482 Winkel 84 © Oliver Deiser 5. Index 561 Winkelformel 312 , 390 Winkelhalbierende 13 winkeltreu 369 Wirbelfeld 456 wirbelfrei 456 Wurzel 23 Z Zeile mal Spalte 93 , 341 Zeilenextraktion 338 Zeilentausch 342 Zeilenvektoren 334 , 410 zerfällt 41 Zerlegungspunkte 168 zugeordnete Abbildung 344 , 412 Zuordnung 482 Zwischenwertsatz 51 Zykloide 439 © Oliver Deiser Einführung in die Mathematik 1