Vorkurs Mathematik für Wirtschaftsingenieure und Wirtschaftsinformatiker Vorlesungsskript Fabian Groß, Marius Altmannsberger Wintersemester 2017/18 Fachbereich Rechtsund Wirtschaftswissenschaften Vorwort Im Vorkurs Mathematik für Wirtschaftsingenieure und Wirtschaftsinformatiker sollen die Studenten des ersten Semesters eines Wirtschaftsingenieurstudiums an der Technischen Universität Darmstadt auf die wesentlichen Elemente einer erstsemestrigen Mathematik-Veranstaltung des jeweiligen Fachbereichs vorbereitet werden. Außerdem soll der Vorkurs dazu dienen, auch mathematische Fragestellungen im wirtschaftswissenschaftlichen Bereich zu beantworten. Gegenstand dieses Kurses wird es also sein, das Wissen der gymnasialen Oberstufe zu wiederholen und Einblicke in die mathematischen Themenbereiche an einer Universität zu bekommen, sprich Themen vorzugreifen. Die größte Veränderung zur Schulmathematik wird wohl die mathematische Strenge sein, auf die an einer Universität erhöhter Wert gelegt wird. Des Weiteren werden manche Themen zunehmend abstrakter – nicht immer ist es möglich, einen Bezug zu realen Anwendungsgebieten zu knüpfen bzw. den Nutzen hinter der gelernten Technik einzuordnen. Dieser Kurs soll Studenten helfen die Belastung während des ersten Semesters durch eine frühe Auseinandersetzung mit der Thematik reduzieren zu können. Weiterhin haben wir es uns zum Ziel gesetzt, die Inhalte anwendungsorientiert zu gestalten. Gegenstand dieses Kurses soll es also sein, den Studenten Themen, die in der Vergangenheit oft als schwierig und unverständlich eingestuft wurden, anschaulicher näher zu bringen, da die Mathematik-Vorlesungen je nach Dozent sehr formell und somit abstrakt ablaufen können. Die Themen dieses Kurses orientieren sich größtenteils an nachfolgend genannten, für Wirtschaftsingenieure/-informatiker relevanten, Mathematik-Veranstaltungen: • Mathematik I für Bauwesen • Mathematik I für Elektrotechnik • Mathematik I für Informatik und Wirtschaftsinformatik • Mathematik I für Maschinenbau Ziel dieses Kurses ist es, den Studenten erste Eindrücke zu vermitteln. Keinesfalls wird von den Studenten verlangt, dass sämtliche Themen unmittelbar nach dem Kurs vollständig verstanden worden sind! Da der Kurs auf wenige Tage beschränkt ist, ist es somit auch gar nicht möglich, alle Themen tiefergehend durchzusprechen. Auch verfügen die Vorlesungs- und Übungsleiter dieses Kurses nicht über die nötige Zeit, um Themen von Grund auf zu erklären bzw. Zusammenhänge herzuleiten. Aufgabe des Skripts soll es daher sein, sich schon etwas mit der „mathematischen Sprache“ auseinanderzusetzen und einige Beispiele aufzuführen, für die in der Vorlesung keine Zeit bleibt. Die Übungen zu den Vorlesungen sollen möglichst viele Themenbereiche abdecken, weshalb die angesetzten 90 Minuten wahrscheinlich nicht ausreichen werden, um alle Aufgaben in der verfügbaren Zeit zu lösen. Die Studenten sollten sich also vorab mit den Übungsblättern auseinandersetzen und abwägen, welche Themen sie dann in den Übungen behandeln. Zu allen Übungen werden spätestens gegen Ende des jeweiligen Übungstages Lösungsvorschläge veröffentlicht. Auch wenn es Lösungen geben wird, sei an dieser Stelle dennoch betont, dass die Übungen im Rahmen eines Universitätsstudiums einen sehr hohen Stellenwert einnehmen, denn durch sie soll das Gelernte vertieft und angewandt werden. Es wird deshalb empfohlen, die Übungen kontinuierlich zu besuchen! 1 Inhaltsverzeichnis 1 Griechisches Alphabet 3 2 Aussagenlogik 4 3 Mengen 6 4 Vektoren und Matrizen 11 5 Komplexe Zahlen 21 6 Funktionen 26 7 Grenzwerte 36 8 Stetigkeit 37 9 Differentialrechnung 41 10 Partielle Differentiation 45 11 Integralrechnung 47 12 Summenalgebra 51 13 Vollständige Induktion 53 2 1 Griechisches Alphabet Um noch einmal auf die Wichtigkeit der bereits angesprochenen „mathematischen Sprache“ einzugehen, sei darauf hingewiesen, dass die mathematisch-naturwissenschaftliche Notation häufig auf griechische Buchstaben zurückgreift. Einfachstes Beispiel dafür ist die Kreiszahl π (gesprochen „Pi“ ). Aus der Schule müsste außerdem bekannt sein, dass Winkel in der Regel mit griechischen Kleinbuchstaben beschriftet werden. Im Laufe des Studiums wird beinahe jedem griechischen Buchstaben eine oder gar viele Bedeutungen zugewiesen. Um Missverständnissen vorzubeugen, möchten wir deshalb bereits an dieser Stelle ein kleines Nachschlagewerk einrichten. Ziel ist ein besseres Verständnis der Sprache des Dozenten oder der Studenten untereinander. Konkret soll erreicht werden, dass beispielsweise das ψ wieder „Psi“ und nicht „Dreizack“ genannt wird. Deutlich soll werden, dass das Verständnis und die eigene Anwendung einer mathematisch korrekten Ausdrucksweise wichtige Bestandteile der universitären Mathematiklehre sind. Name Al pha Bet a Gamma Del t a E psil on Z et a Eta T het a I ot a Kappa Lambd a My Ny Xi Omikr on Pi Rho Si g ma Tau Y psil on Phi Chi Psi Ome g a Kleinbuchstabe Großbuchstabe α β γ δ ε ζ η ϑ ι κ λ µ ν ξ o π ρ σ τ u ϕ χ ψ ω A B Γ ∆ E Z H Θ I K Λ M N Ξ O Π P Σ T Y Φ X Ψ Ω 3 2 Aussagenlogik Bevor es mit dem ersten Thema losgehen kann, noch eine wichtige Anmerkung: mathematische Skripte sind fast immer nach der folgenden Struktur aufgebaut: Definition, Satz, Beweis. In der Definition wird ein neues Thema eingeführt, Notationen festgelegt, etc. Ein wichtiges Symbol hierbei ist „:=“ (bzw. „=:“) welches bei Definitionen häufig verwendet wird. Das was definiert wird, steht auf der Seite, auf der sich der Doppelpunkt befindet. In den einzelnen Sätzen werden Sachverhalte genannt, die aus den Definitionen ableitbar sind, welche anschließend mit den Beweisen belegt werden. Die Beweise spielen in der Mathematik eine zentrale Rolle und sind nicht wegzudenken. Um anzuzeigen, dass der Beweis zu Ende ist, macht man an das untere rechte Ende ein kleines Quadrat oder schreibt q.e.d. (Abkürzung für das lateinische „quod erat demonstrandum“) bzw. das deutsche Äquivalent w.z.b.w. („was zu beweisen war“). Allerdings soll in diesem Skript die mathematische Strenge an manchen Stellen der besseren Veranschaulichung weichen. Nun also zur Aussagenlogik, die sich im Wesentlichen mit der Frage beschäftigt, ob eine Aussage wahr oder falsch ist. Zuerst werden die sogenannten Quantoren eingeführt, welche Operatoren sind und Abkürzungen darstellen: Definition 2.1. Quantoren 1. Der Allquantor ∀ bedeutet „für alle ...“ und bezieht sich auf den nachfolgenden Ausdruck; salopp formuliert bedeutet er „egal welches“. 2. Der Existenzquantor ∃ bedeutet „es existiert mindestens ein/eine ...“ und bezieht sich auf den nachfolgenden Ausdruck. 3. ∃! bedeutet „es existiert exakt ein/eine ...“ und bezieht sich auf den nachfolgenden Ausdruck. 4. Möchte man „es existiert kein/keine ...“ zum Ausdruck bringen, dann verwendet man den durchgestrichenen Existenzquantor: > Um zwei Aussagen verknüpfen zu können sind Junktoren nötig, die nachfolgend definiert werden: Definition 2.2. Junktoren Seien A und B zwei Aussagen, dann nutzt man die Junktoren wie folgt: 1. Die Negation entspricht der Verneinung der Aussage. Wenn A wahr ist, dann ist ¬A unwahr. 2. Die Konjunktion entspricht einem logischen „und“ : Wenn sowohl die Aussage A gilt, als auch die Aussage B , so schreibt man dies als A ∧ B . 3. Die Disjunktion entspricht einem logischen „oder“, d.h. entweder die Aussage A gilt, oder die Aussage B gilt, oder beide Aussagen gelten. Man schreibt: A ∨ B 4 Definition 2.3. Aussagen-Pfeile / Implikationen 1. ⇒ bedeutet „wenn die linke Seite gilt, dann auch die rechte Seite“. 2. ⇐ bedeutet „wenn die rechte Seite gilt, dann auch die linke Seite“. 3. ⇔ ist der Äquivalenzpfeil. Zwei Aussagen sind äquivalent, wenn sowohl aus der ersten die zweite, als auch aus der zweiten die erste folgt. 4. Wenn etwas nicht direkt aus etwas anderem folgt (aber auch nicht ausgeschlossen ist) verwendet man das Symbol ; bzw. : bzw. <. Satz 2.4. wichtige Äquivalenz Seien A und B zwei allgemeine Aussagen, dann ist äquivalent: (A ⇒ B) ⇔ (¬B ⇒ ¬A) Beispiel: Aussagenlogik • Sei Aussage F definiert als F :=„Ich wohne in Frankfurt am Main.“ • Sei Aussage H definiert als H :=„Ich wohne in Hessen.“ Dann folgt zunächst: • ¬F =„Ich wohne nicht in Frankfurt am Main.“ • ¬H =„Ich wohne nicht in Hessen.“ Darüber hinaus gelten folgende Zusammenhänge: • F ⇒ H (Wenn ich in Frankfurt am Main wohne, wohne ich folglich auch in Hessen.) • ¬H ⇒ ¬F (Wenn ich in nicht in Hessen wohne, dann kann ich nicht in Frankfurt am Main wohnen.) • ¬F ; H bzw. ¬F ; ¬H (Wenn ich nicht in Frankfurt am Main wohne, ist noch nichts darüber gesagt ob ich in Hessen oder in einem anderen Bundesland wohne.) • H ; F bzw. H ; ¬F (Wenn ich in Hessen wohne, ist noch nichts darüber gesagt in welcher Stadt ich wohne.) 5 3 Mengen Um mit dem abstrakten Begriff der Menge zu arbeiten, muss dieser zunächst definiert werden: Definition 3.1. Menge Unter einer Menge verstehen wir jede Zusammenfassung M von bestimmten wohlunterschiedenen Objekten m unserer Anschauung oder unseres Denkens (welche die Elemente von M genannt werden) zu einem Ganzen. (Definition nach Georg Cantor, 1895) Definition 3.2. Leere Menge ; := leere Menge Die leere Menge enthält keine Elemente. Sie ist allerdings nicht „nichts“, sondern ein existentes Objekt, nämlich diejenige Menge, die nichts enthält. Mengen kennzeichnet man durch geschweifte Klammern. Sie schließen die Menge ab. Dazwischen befinden sich die Elemente, welche in der Regel durch Kommata getrennt werden. Sollte man Zahlen in Dezimalschreibweise auflisten wollen, kann man alternativ auch Semikolons verwenden. Ein Beispiel wäre {1, 3, 4, a, b, z}. Die Menge enthält die Elemente 1, 3, 4, a, b und z , die Elemente bestehen also aus Zahlen und Buchstaben – solch eine Mischung ist vollkommen legitim. Eine Menge kann auch Mengen als Elemente haben, welche ihrerseits wieder Mengen beinhalten können, usw. Ein Beispiel ist die Menge A, die hier wie folgt definiert wird: A := {3, {2, 5}, 6, {3, 4, 5, 6}, ;}. Die leere Menge kann ebenfalls mit geschweiften Klammern dargestellt werden: ; = { }. Es werden nun einige wichtige Symbole im Zusammenhang mit Mengen erklärt: Definition 3.3. Mächtigkeit / Kardinalität Als die Mächtigkeit oder die Kardinalität einer Menge bezeichnet man die Anzahl der Elemente in dieser. Man verwendet zur Kennzeichnung zwei senkrechte Striche. Sei A := {1, 2, 3, ..., n} eine Menge, dann schreibt man die Mächtigkeit von A als |A|. Es gilt in diesem Fall |A| = n. Definition 3.4. Teilmengen Befinden sich alle Elemente einer Menge A in einer Menge B , so ist A eine Teilmenge von B , man schreibt dann kurz: A ⊆ B Kann man sich sogar sicher sein, dass B noch weitere Elemente besitzt als in A enthalten sind, so schreibt man: A ⊂ B oder A $ B . Satz 3.5. Einfache Implikationen 1. A ⊆ B ⇒ |A| ≤ |B| aber |A| ≤ |B| ; A ⊆ B 2. A ⊂ B ⇒ |A| < |B| aber |A| < |B| ; A ⊂ B 6 Definition 3.6. Verknüpfen von Mengen 1. Bildet man eine neue Menge C , die alle Elemente der Menge A und alle Elemente der Menge B beinhaltet, jedoch mehrfach auftretende Elemente nur einmal listet, so spricht man von der Vereinigung. Man schreibt kurz: C = A ∪ B 2. Bildet man eine neue Menge D, die nur jene Elemente listet, die sowohl in der Menge A als auch in der Menge B enthalten sind, so spricht man von dem Schnitt zweier Mengen. Man schreibt kurz: D = A∩B 3. Bildet man eine neue Menge E , die nur jene Elemente aus Menge A listet, die nicht in der Menge B vorkommen, so bildet man die Differenz. Man schreibt kurz: E = A \ B 4. Befindet sich die Menge A in einer Umgebung M, so bezeichnet man die Menge F, die alle Elemente dieser Umgebung M mit Ausnahme der Elemente beinhaltet, die in Menge A enthalten sind, als das Komplement von A. Man schreibt kurz: F = AC = M \ A . Man kann sich zum besseren Verständnis die nachfolgenden Abbildungen ansehen, man muss jedoch beachten, dass diese Abbildungen Spezialfälle sind und nicht die gesamte Definition umfassen: Abbildung 3.1: Verschiedene Beispiele für zwei Mengen A (linke Ellipse) und B (rechte Ellipse) in einer Umgebung M (Rechteck). Die Punkte stellen Elemente dar, die Linien sind die Mengenbzw. Umgebungsbegrenzungen. Das Angegebene ist hervorgehoben. 7 Beispiel: Verknüpfungen von Mengen 1. {1, 2, 3, 4} ∪ {3, 4, 5, 6} = {1, 2, 3, 4, 5, 6} 2. {1, 2, 3, 4} ∩ {3, 4, 5, 6} = {3, 4} 3. {1, 2, 3, 4} \ {3, 4, 5, 6} = {1, 2} Definition 3.7. Mengen mit Bedingungen Beim Definieren von Mengen verwendet man einen senkrechten Strich oder einen Doppelpunkt innerhalb der Menge um das eben Genannte an weitere Bedingungen zu knüpfen. Man schreibt es wie folgt: {x| Bedingung von x} Beispiel: Bedingungen einer Menge Die Menge A sei definiert als die Menge, die nur positive gerade Zahlen beinhaltet. ⇔ A := {x|x ist eine positive gerade Zahl} ⇔ A := {2, 4, 6, 8, ...} ⇔ A := {2k |k ∈ (N \ {0}) } Durch Nutzen der Bedingungen-Schreibweise kann das uneindeutige Formulieren mittels „...“ vermieden werden. Nun seien noch ein paar wichtige Mengen definiert: Definition 3.8. Wichtige Mengen 1. Die Menge der natürlichen Zahlen1 ist die Null, die Eins und alle Zahlen, die durch genügend häufiges Addieren von Eins zu Eins erzeugt werden können. N := {0, 1, 2, 3, 4, ...} 2. Die Menge der ganzen Zahlen enthält alle natürlichen Zahlen sowie deren negative Zahlen. Z := {..., −3, −2, −1, 0, 1, 2, 3, ...} 3. Die Menge enthält neben allen ganzen Zahlen noch alle Brüche. n der rationalen Zahlen o p Q := q p ∈ Z, q ∈ N\{0} 4. Die Menge der reellen Zahlen R besteht aus allen endlich und unendlich langen Dezimalzahlen. (Die rationalen Zahlen bestehen nur aus allen endlichen Dezimalzahlen und jenen unendlich langen Dezimalzahlen, die eine Periodizität aufweisen. Die reellen Zahlen erweitern also die rationalen Zahlen um solche Dezimalzahlen, die unendlich lange sind und zugleich keine Periodizität aufweisen; Beispiele p hierfür sind 2, π, e) 5. Die Menge der irrationalen Zahlen besteht aus allen reellen Zahlen, die keine rationale Zahlen sind, und wird somit als R \ Q bezeichnet. (Die irrationalen Zahlen erhalten kein eigenes Symbol.) 6. Die Menge der komplexen Zahlen C enthält zusätzlich die Lösungen aller quadratischen Gleichungen (insbesondere auch x 2 + 1 = 0). 1 Nicht jeder zählt die Null zu den natürlichen Zahlen, dann steht meist das Zeichen N0 oder N ∪ {0} für die natürlichen Zahlen mit Null. Dieses Skript hält sich jedoch an die DIN 5473, nach der die Null zu den natürlichen Zahlen gehört. Wird die Menge der natürlichen Zahlen ohne Null verwendet, so wird in diesem Skript die bereits eingeführte DifferenzSchreibweise N \ {0} verwendet. 8 Satz 3.9. Beziehungen der wichtigen Mengen 1. N ⊂ Z ⊂ Q ⊂ R ⊂ C 2. (R \ Q) ⊂ R ⊂ C 3. (R \ Q) ∪ Q = R 4. (R \ Q) ∩ Q = ; Satz 3.10. Besondere Einschränkungen von Mengen 1. Sei K eine Menge, dann bezeichnet man mit K+ nur die positiven Elemente dieser Menge. Es gilt also K+ := {x ∈ K | x > 0}. 2. Sei K eine Menge, dann bezeichnet man mit K− nur die negativen Elemente dieser Menge. Es gilt also K− := {x ∈ K | x < 0}. 3. Sei K eine Menge, dann bezeichnet man mit K0 die Menge K ergänzt um das Element 0. Es gilt also K0 := K ∪ {0}. + 4. Es gilt K+ 0 := K ∪ {0}. − 5. Es gilt K− 0 := K ∪ {0}. Als besonders wichtig haben sich auch folgende Teilmengen von R herausgestellt, die insbesondere im Zusammenhang mit Funktionen auftauchen: Definition 3.11. reelle Intervalle • Ein Intervall in R (oder reelles Intervall) ist eine Teilmenge I von R, für die gilt: a, b ∈ I, a ≤ c ≤ b =⇒ c ∈ I (∀a, b, c ∈ R) • Gibt es zwei reelle Zahlen a und b mit I = {x ∈ R | a < x < b}, so heißt I offenes reelles Intervall. Man schreibt ]a, b[:= (a, b) := {x ∈ R | a < x < b}. • Gibt es zwei reelle Zahlen a und b mit I = {x ∈ R | a ≤ x ≤ b}, so heißt I abgeschlossenes reelles Intervall. Man schreibt [a, b] := {x ∈ R | a ≤ x ≤ b}. • Gilt I = {x ∈ R | a < x ≤ b} oder I = {x ∈ R | a ≤ x < b} für zwei reelle Zahlen a und b so heißt I halboffenes reelles Intervall. Man schreibt ]a, b] := (a, b] := {x ∈ R | a < x ≤ b} bzw. [a, b[:= [a, b) := {x ∈ R | a ≤ x < b}. Zwar sind −∞ und ∞ keine Elemente von R, dennoch gelten folgende Schreibweisen: • ] − ∞, ∞[:= (−∞, ∞) := R • ] − ∞, b] := (−∞, b] := {x ∈ R | x ≤ b} • ] − ∞, b[:= (−∞, b) := {x ∈ R | x < b} • [a, ∞[:= [a, ∞) := {x ∈ R | a ≤ x} • ]a, ∞[:= (a, ∞) := {x ∈ R | a < x} 9 Beispiel: Aufschreiben komplizierter Mengen Es gibt einige Mengen die sehr kompliziert aussehen. Ein Beispiel wäre zum Beispiel die Lösungsmenge der Funktion π 4 sin 2x + = 0. 2 Um eine Vorstellung der Lösungsmenge zu bekommen, wird hier ein Ausschnitt gezeigt: § 3 1 5 Lösungsmenge = ... , − π , − π , − π , 4 4 4 1 π , 4 3 π , 4 5 π , ... 4 ª Dies ist aber eben nur ein Ausschnitt, man vermag die Regel dahinter zu erkennen, jedoch ist das nicht immer möglich, und deshalb ist die „...“-Schreibweise wie oben bereits erwähnt sehr ungeschickt. Eine eindeutige Variante für die eben beschriebene Lösungsmenge sieht z.B. wie folgt aus: n o π Lösungsmenge = (2k + 1) · k ∈ Z 4 Beispiel: Die reellen Zahlen mit einer Lücke Die Lösung der Gleichung x 2 − 16 ≥ 0 ist darstellbar als: ] − ∞, −4] ∪ [4, ∞[ = (−∞, −4] ∪ [4, ∞) = R\] − 4, 4[ = R \ (−4, 4) 10 4 Vektoren und Matrizen Vektoren sind eigentlich abstrakte Konstrukte, wir werden uns hier aber nur mit der anschaulichen Bedeutung, den Pfeilen im Raum, beschäftigen. Dann sind alle Pfeile, die in dieselbe Richtung zeigen und gleichlang sind, derselbe Vektor. Man kann diese Vektoren leicht grafisch addieren, indem man die Vektoren hintereinander setzt. Man kann sie skalieren (Skalarmultiplikation), sodass ein Vektor ensteht, der in die selbe Richtung zeigt, aber eine andere Länge hat. Dieses Verhalten kann man natürlich auch mit Zahlen beschreiben: Definition 4.1. Vektor, Addition, Multiplikation, Skalarprodukt 1. Ein (reeller) Vektor ist ein aus n reellen Zahlen x 1 , x 2 , ... , x n bestehendes Zahlentupel 1 : x1 x2 T x~ := ... = (x 1 x 2 · · · x n ) (4.1) xn Wenn die Zahlen in einer Spalte stehen, dann nennt man den Vektor auch Spaltenvektor, während ein Vektor mit den Einträgen in einer Zeile (x 1 x 2 · · · x n ) als Zeilenvektor bezeichnet wird. Um einen Zeilenvektor in einen Spaltenvektor und umgekehrt umzuwandeln, transponiert man den Vektor. Dies wird durch ein hochgestelltes großes T dargestellt. 2. Addition und Subtraktion: Sind x~ = (x 1 x 2 · · · x n ) T und ~y = ( y1 y2 · · · yn ) T zwei Vektoren gleicher Dimension, so heißt x1 y1 x 1 + y1 x 2 y2 x + y + . := 2 . 2 x~ + ~y := . .. .. .. xn yn (4.2) x n + yn die Summe und x1 y1 x 1 − y1 x 2 y2 x − y − . := 2 . 2 x~ − ~y := . .. .. .. yn xn (4.3) x n − yn die Differenz von x~ und ~y . 3. Skalarmultiplikation: Sei x~ = (x 1 x 2 · · · x n ) T ein Vektor und λ ∈ R ein Skalar, dann setzen wir: x1 λ · x1 x2 λ · x := . 2 λ · x~ := λ · . .. .. xn 1 (4.4) λ · xn Ein Tupel ist eine geordnete Zusammenstellung von Objekten. So ist, anders als bei Mengen, (1, 2) ein anderes Zahlentupel als (2, 1). 11 4. Die Menge aller Vektoren mit n reellen Einträgen zusammen mit den Operationen Vektoraddition und Skalarmultiplikation nennen wir den Vektorraum Rn . 5. Sind x~ = (x 1 x 2 · · · x n ) T und ~y = ( y1 y2 · · · yn ) T zwei Vektoren, dann heißt x~ · ~y := x 1 y1 + x 2 y2 + . . . + x n yn das innere Produkt oder Skalarprodukt von x~ und ~y . Das Ergebnis ist dabei ein Skalar und kein Vektor mehr - daher der Name. Beispiel: Anwendung Vektorrechnung Die Firma Fürstenhof, ein Zulieferer der Pilsstube Herkules, kauft im Januar 2016 für ihre Büroausstattung 20 Kugelschreiber, 100 Bleistifte, 5 Radierer und 200 Pakete Papier ein. Im Februar erhält die Firma einen neuen Auftrag und kauft doppelt soviel Büromaterial wie im Januar. Im März kauft die Firma nur 1 5 der im Januar benötigten Produkte. Die Rechnung für das Büromaterial wird über Januar, Februar und März ausgestellt. Wie viel muss die Firma Fürstenhof bezahlen, wenn ein Kugelschreiber 20 Cent, ein Bleistift 10 Cent, ein Radierer 15 Cent und ein Paket Papier 3 Euro kostet? Mit Hilfe der oben definierten Vektoren und Operationen auf Vektoren lässt sich dies sehr leicht berechnen: 1. Material der Firma im Januar: (20 100 5 200) T . 2. Material der Firma im Februar: 2 · (20 100 5 200) T = (40 200 10 400) T . 3. Material der Firma im März: 1 5 · (20 100 5 200) T = (4 20 1 40) T . 4. In den drei Monaten: (20 100 5 200) T + (40 200 10 400) T + (4 20 1 40) T = (64 320 16 640) T . 5. Preis des Materials (in Euro): (0, 2 0, 1 0, 15 3) · (64 320 16 640) T = 12, 80 + 32 + 2, 40 + 1920 = 1967, 20 Interpretation des Ergebnisses: Die Firma muss 1967,20 Euro für ihr Büromaterial bezahlen. Ein Problem, dass mit den bisherigen Kenntnissen noch nicht gelöst werden kann: Nehmen wir an, dass die Firma nach dem ersten Quartal des Jahres berechnen will, wie viel sie pro Monat für Büromaterial ausgegeben hat. Hier können wir folgende Begriffe der linearen Algebra verwenden: Definition 4.2. Matrizenrechnung 1. Ein m × n-Zahlenfeld a11 . A := .. ··· am1 · · · a1n .. . amn heißt m × n-Matrix. Man schreibt auch häufig kurz A ∈ Rm×n und (ai j )i=1...m, j=1...n . Letztere Schreibweise gibt an, dass es einfach das Feld über alle Elemente ist. Um das Element aus der i -ten Zeile und j -ten Spalte zu bezeichnen, verwendet man ai j . 2. Sei A, B ∈ Rm×n , dann ist durch folgende Gleichung die Summe bzw. die Differenz beider Matrizen definiert. a11 · · · a1n b11 · · · b1n . .. .. .. A ± B := .. ± . . . am1 · · · amn bm1 · · · bmn (4.5) a11 ± b11 · · · a1n ± b1n .. .. := . . am1 ± bm1 · · · amn ± bmn 12 3. Sei A ∈ Rm×n und λ ∈ R, dann ist durch a11 . λ · A := λ · .. ··· am1 · · · a1n λ · a11 .. . := .. . amn ··· λ · am1 · · · λ · a1n .. . (4.6) λ · amn die Multiplikation einer Matrix mit einem Skalar definiert. Pm 4. Sei A ∈ Rl×m und B ∈ Rm×n , dann ist das Produkt A · B = (ci j )i=1...l, j=1...n durch ci j = k=1 aik · bk j definiert. Einfach ausgedrückt ergibt sich das Element ci j des Produkts durch das Skalarprodukt der i -ten Zeile der Matrix A und der j -ten Spalte der Matrix B . Daraus resultiert natürlich, dass die Matrix A genauso viele Spalten, wie die Matrix B Zeilen haben muss. 5. Sei A eine m × n-Matrix und x~ ein Vektor mit n Einträgen. Dann wird der Vektor als n × 1-Matrix aufgefasst und das Produkt zwischen Matrix und Vektor durch das Matrixprodukt definiert: a11 ... a12 ··· am1 am2 · · · x1 a1n a11 x 1 + a12 x 2 + · · · x2 .. .. · . . ... := amn am1 x 1 + am2 x 2 + · · · xn + .. . a1n x n (4.7) + amn x n Gerade die Multiplikation zweier Matrizen ist am Anfang eine sehr eigenartige Sache. Man braucht sie aber sehr häufig, deshalb ist es wichtig, sie auch anwenden zu können. Wir rechnen zur Demonstration ein paar Beispiele vor: Beispiel: Multiplikation zweier 2 × 2-Matrizen 1 2 5 6 1·5+2·7 1·6+2·8 19 22 · = = 3 4 7 8 3·5+4·7 3·6+4·8 43 50 (4.8) Beispiel: Multiplikation einer 2 × 3 Matrix mit einer 3 × 2 Matrix 4 5 1 2 0 1·4+2·1+0·4 1·5+2·0+0·5 6 5 · 1 0 = = 3 0 1 3·4+0·1+1·4 3·5+0·0+1·5 16 20 4 5 (4.9) Wie man hier schön sehen kann, ist das Produkt zweier Matrizen A ∈ Rl×m und B ∈ Rm×n eine l × n-Matrix. Beispiel: Multiplikation eines Zeilenvektors mit einem Spaltenvektor 1 3 2 3 4 2 · = (2 · 1 + 3 · 3 + 4 · 2 + 2 · 1) = (21) 2 1 (4.10) Eine 1 × 1-Matrix kann man auch als Zahl auffassen. Wie man an dieser Stelle erkennen kann, könnte man das Skalarprodukt auch alternativ über eine Multiplikation zweier Matrizen definieren. 13 Beispiel: Multiplikation eines Spaltenvektors mit einem Zeilenvektor 1 2 3 6 2 · 2 3 4 2 = 4 2 1 3 4 2 9 12 6 6 8 4 3 4 2 (4.11) An diesem Beispiel sieht man, dass für Matrizen im Allgemeinen, auch wenn beide Matrizen nicht quadratisch sind, nicht A · B = B · A gilt! Man sagt auch, dass die Matrixmultiplikation nicht kommutativ ist. Definition 4.3. Transposition von Matrizen Da wir festgestellt haben, dass Vektoren spezielle Matrizen sind, lässt sich die Transposition auch auf diese übertragen. Die Transponierte einer (m × n)-Matrix A ist eine (n × m)-Matrix mit der Bezeichnung AT . T Folglich führt eine doppelte Transponierung wieder auf die Ausgangsmatrix A zurück: AT = A. Beispiel: Transponierung einer Matrix 2 6 A= 4 2 3 4 2 2 6 4 9 12 6 3 9 6 , AT = 6 8 4 4 12 8 3 4 2 2 6 4 2 2 3 3 2 6 4 , B= , B T = 6 9 4 3 9 6 4 6 2 (4.12) Definition 4.4. Einheitsmatrix und Invertierung von Matrizen Die Einheitsmatrix ist das neutrale Element der quadratischen Matrizenmultiplikation. Sie besitzt folgende Form: 1 0 0 0 0 1 0 0 E4 = , (4.13) 0 0 1 0 0 0 0 1 Wird eine (n × n)-Matrix A mit der Einheitsmatrix En multipliziert, so bleibt diese vollständig unverändert, ähnlich wie die Multiplikation einer skalaren Zahl mit der Eins. A· E = E · A = A (4.14) Die Inverse einer Matrix A−1 erfüllt folgende Gleichung und sei der Vollständigkeit halber erwähnt. A · A−1 = A−1 · A = E (4.15) Sie ist damit das inverse Element und vergleichbar mit dem Kehrwert einer skalaren Zahl. Auch bei der −1 Invertierung führt eine doppelte Anwendung zurück zur Ausgansmatrix: A−1 = A. Für den speziellen Fall einer (2x2)-Matrix gilt folgende Formel: A= a b c d ⇒ A−1 = 1 d −b a det(A) −c (4.16) 14 Beispiel: Fortsetzung des obigen Beispiels Matrizen kann man auch als Abbildungen auffassen, die von einem Raum Rn in einen anderen Raum Rm gehen, so war die Multiplikation mit den Vektoren (Euro pro Stück) eine Abbildung von dem Raum der Waren in den Raum des Geldes. Natürlich kann man jetzt auch das Matrizenkalkül verwenden, um kompliziertere Geschehnisse zu bestimmen. Wenn wir jetzt, anstatt für jeden Monat einen Vektor zu verwenden, alle Einkäufe in eine Matrix schreiben, wobei wir für jeden neuen Monat eine neue Zeile nehmen, dann bekommen wir nach der Multiplikation dieser Matrix mit dem Kostenvektor einen Vektor, in dem die Kosten pro Monat stehen: 0, 2 20 100 5 200 0, 1 = ... A · x~ = 40 200 10 400 · 0, 15 4 20 1 40 3 (4.17) Matrizen sind aber nicht nur für solche Rechnungen nützlich. Man kann mit ihnen auch sehr gut lineare Gleichungssysteme lösen. Dafür muss man aber erst einmal wissen, wie man lineare Gleichungssysteme in Matrizen umschreibt. Um es nicht zu theoretisch zu erklären, werden wir das Beispiel weiterführen. Beispiel: Letzte Fortsetzung des obigen Beispiels Als die Firma die Rechnungen für die Kugelschreiber, die Bleistifte und die Radierer für die Monate des zweiten Quartals erhält, muss sie feststellen, dass die Preise erhöht wurden, denn sie muss für April 15,50 Euro, für Mai 24,50 Euro und für Juni 18,50 Euro bezahlen. 30 30 Wie viel kosten die jeweiligen Materialien, wenn im April 100 Einheiten, im Mai 150 Einhei5 10 10 100 Einheiten zu den unbekannten Preisen x, y, z gekauft wurden? ten und im Juni 15 Wir können hier drei Gleichungen aufstellen: (I) (II) (III) (für April) : (für Mai) : (für Juni) : 30x + 100 y + 5z = 15, 50 30x + 150 y + 10z = 24, 50 10x + 100 y + 15z = 18, 50 (4.18) mit x = ˆ Preis der Kugelschreiber, y = ˆ Preis der Bleistifte und z = ˆ Preis der Radierer. Dieses Gleichungssystem können wir schnell in eine Matrixgleichung umstellen, indem wir den linken Teil als ein Produkt einer Matrix mit dem Vektor (x y z) T betrachten: 30 100 5 x 15, 5 30 150 10 · y = 24, 5 10 100 15 z 18, 5 (4.19) Wäre es da nicht viel besser, wenn diese Gleichung in der Form 30 100 5 x 15, 5 0 50 5 · y = 9 0 0 5 z 1 (4.20) 15 gegeben wäre? Wir könnten jetzt einfach den Wert für z ablesen 5z = 1 ⇒ z = 15 , diesen Wert in die zweite Zeile einsetzen und so den Wert für y bekommen. Genauso könnten wir den Wert für x mit Hilfe der zuvor bestimmen Werte y und z berechnen. Um eine Matrix auf eine obere Dreiecksmatrix (so heißt eine Matrix, in der alle Einträge unterhalb der Hauptdiagonalen Null sind) zu bringen, verwendet man das Gaußverfahren. Es wird ihnen vielleicht als Additionsverfahren von Gleichungen aus der Schule bekannt vorkommen: Satz 4.5. Gaußverfahren Sei A ∈ Rm×n und ~b ∈ Rn . Dann lässt sich mit Hilfe der folgenden beiden Operationen die Matrix A in eine obere Dreiecksmatrix A0 überführen: 1. Addition eines Vielfachen einer Zeile zu einer anderen Zeile. 2. Vertauschung zweier Zeilen. 3. (Multiplikation einer Zeile mit einer Zahl2 .) Werden die selben Operationen auf den Vektor ~b angewandt, dann hat die Gleichung A · x~ = ~b die gleiche Lösung für x~ wie die Gleichung A0 · x~ = ~b0 . Um damit zurecht zu kommen, rechnen wir ein kleines Beispiel vor: Beispiel: Eliminationsverfahren Wir nehmen ein einfacheres Gleichungssystem, das man schnell lösen kann: x + 2 y + 3z = 2 x + y + z = 2 3x + 3 y + z = 0 Das ergibt natürlich sofort folgende übersichtlicher wird: 1 2 1 1 3 3 (4.21) Matrixgleichung, die wir gleich umschreiben, damit das Rechnen 3 x 2 1 2 3 2 1 · y = 2 1 1 1 2 1 z 0 3 3 1 0 (4.22) Wir arbeiten uns spaltenweise durch: Wir fangen mit der ersten Spalte an, in der alle, bis auf das erste Element Null sein sollen; dafür tauschen wir, wenn das erste Element Null ist, die Zeilen. In unserem Fall ist dies nicht so. Wir addieren im ersten Schritt das (-1)-fache der 1. Zeile auf die 2. Zeile ((−1) · I + I I =: I I 0 ): 1 2 3 2 1 2 3 2 1 1 1 2 0 −1 −2 0 3 3 1 0 3 3 1 0 (4.23) Als nächstes nehmen wir das (-3)-fache der 1. Zeile und addieren dies auf die 3. Zeile ((−3) · I + I I I =: I I I 0 ): 1 2 3 2 1 2 3 2 0 −1 −2 0 0 −1 −2 0 3 3 1 0 0 −3 −8 −6 2 (4.24) Dieser Schritt ist eigentlich nicht notwendig, um eine Matrix in eine obere Dreiecksmatrix zu bringen, jedoch macht es die weiteren Rechnungen wesentlich leichter, da man sich so nicht mit komplizierten Brüchen herumschlagen muss. 16 Als letzten Schritt addieren wir das (-3)-fache der 2’. Zeile auf die 3’. Zeile ((−3) · I I 0 + I I I 0 =: I I I 00 ): 1 2 3 2 1 2 3 2 0 −1 −2 0 0 −1 −2 0 0 0 −2 −6 0 −3 −8 −6 Wir sind jetzt fertig und können die Lösung beinahe ablesen: z = 3 , y = −6 , (4.25) x = 5. Definition 4.6. Determinante Die Determinante einer Matrix A wird als det(A) oder |A| geschrieben und entspricht einer für die Matrix spezifischen Zahl. Die Determinante kann nur für quadratische Matrizen berechnet werden. 1. Die Determinante einer 2 × 2-Matrix ist gegeben durch: a 11 a12 det(A) := := a11 · a22 − a21 · a12 a21 a22 2. Die Determinante einer 3 × 3-Matrix ist gegeben duch: a 11 a12 a13 det(A) := a21 a22 a23 := a11 a22 a33 + a12 a23 a31 + a13 a21 a32 − a13 a22 a31 − a11 a23 a32 − a12 a21 a33 a31 a32 a33 Eine leichte Methode sich die Berechung der Determinante einer 3 × 3-Matrix zu merken ist die Regel von Sarrus. Dabei schreibt man rechts neben die drei Spalten einer Matrix noch einmal die erste und zweite Spalte. Dann summiert man die drei Produkte, welche durch multiplizieren der Elemente auf einer Diagonalen von oben links nach unten rechts entstehen, und subtrahiert dann die drei Produkte, welche durch multiplizieren der Elemente auf einer Diagonalen von oben rechts nach unten links entstehen. Die beteiligten Diagonalen sind in der nachfolgenden Darstellung markiert; sie soll die Regel verdeutlichen: 3. Die Determinante einer n × n-Matrix (ideal für n ≥ 4) kann man mit Hilfe des Laplace’schen Entwicklungssatzes bestimmen. Dabei wird die n × n-Matrix nach einer beliebigen Zeile (oder beliebigen Spalte) entwickelt. Für jedes Element dieser Zeile (bzw. Spalte) wird dann eine Determinante einer entsprechenden Untermatrix (genannt Ai, j ) berechnet, welche dann eine (n − 1) × (n − 1)-Matrix ist. Um die Determinante der Ursprungsmatrix zu erhalten, summiert man die Determinanten der n-fach vorkommenden (n − 1) × (n − 1)-Matrizen, multipliziert mit dem Faktor f i, j auf. Der Faktor f i, j einer Untermatrix Ai, j ist definiert als f i, j := (−1)i+ j · ai, j . In der Sprache der Mathematik lautet der letzte Absatz für eine Entwicklung nach Zeilen (erste Formel) bzw. nach Spalten (zweite Formel): n X det(A) = (−1)i+ j · ai, j · det Ai, j (4.26) j=1 17 det(A) = n X (−1)i+ j · ai, j · det Ai, j (4.27) i=1 Nun stellt sich noch die Frage, wie die Untermatrizen aussehen: Zum erstellen einer (n − 1) × (n − 1)Untermatrix des Elements ai, j der n × n-Matrix legt man ein Kreuz über ebendieses Element ai, j und bildet die Untermatrix mit den Elementen, die durch das Kreuz nicht verdeckt werden, wobei die Positionen beibehalten werden. Ein Beispiel soll das zuletzt genannte Verfahren etwas verständlicher machen: Beispiel: Laplace’scher Entwicklungssatz Sei A eine 4 × 4-Matrix mit 1 2 3 6 −1 0 A := 0 −3 0 5 2 −1 0 3 7 7 Zunächst sollte man sich vorab überlegen nach welcher Zeile oder Spalte man entwickelt. (Clever sind hier Zeilen bzw. Spalten mit einfachen Zahlen, allerdings muss man dann auch beachten, dass schwierige Zahlen häufiger vorkommen.) Die schnellste Variante beim Berechnen der Determinante dieser Beispielmatrix ist das Entwickeln nach der dritten Spalte ( j = 3), da dieses zwei Nullen enthält, und somit eine Menge Rechnerei erspart (Bedenke: Ein Produkt ist dann Null, wenn mindestens ein Faktor Null ist). Zunächst werden die Untermatrizen erstellt: Nun folgt also nach Formel (4.27) und Definition 4.6.2: 18 det(A) (4.27) = = 4.6.2 6 −1 3 1 2 (−1)1+3 · 3 · det 0 −3 7 + (−1)2+3 · 0 · det 0 −3 5 2 7 5 2 1 2 0 1 +(−1)3+3 · 0 · det 6 −1 3 + (−1)4+3 · (−1) · det 6 5 2 7 0 0 7 7 2 0 −1 3 −3 7 6 −1 3 1 2 0 3 · det 0 −3 7 + det 6 −1 3 5 2 7 0 −3 7 = 3 · [6 · (−3) · 7 + (−1) · 7 · 5 + 3 · 0 · 2 − 5 · (−3) · 3 − 2 · 7 · 6 − 7 · 0 · (−1)] +[1 · (−1) · 7 + 2 · 3 · 0 + 0 · 6 · (−3) − 0 · (−1) · 0 − (−3) · 3 · 1 − 7 · 6 · 2] = −682 Der Laplace’sche Entwicklungssatz ist beliebig oft anwendbar. Somit kann eine große Matrix bis hin zu 1 × 1-Matrizen entwickelt werden. Wendet man ihn auf eine 2 × 2-Matrix oder eine 3 × 3-Matrix an, so erhält man die in Definition 4.6 genannten Formeln. Satz 4.7. Rechenregeln für Matrizen und Determinanten Seien A, B, C Matrizen, die die jeweiligen Zeilen- und Spalten-Bedingungen erfüllen (für jede folgende Zeile individuell) und λ ∈ C, dann gelten folgende Rechenregeln für Matrizen: 1. A ± B = B ± A 2. (A ± B) ± C = A ± (B ± C) 3. A · λ := λ · A 4. A · B ist in der Regel nicht B · A 5. (A · B) · C = A · (B · C) 6. (λ · B) · C = λ · (B · C) 7. (A ± B) · C = A · C ± B · C 8. A · (B ± C) = A · B ± A · C 9. λ · (B ± C) = λ · B ± λ · C Seien A, B ∈ Cn×n und λ ∈ C. Dann gelten folgende Rechenregeln für Determinanten: 10. |A · B| = |A| · |B| 11. |λ · B| = λn · |B| Wir haben am Anfang des Kapitels gesagt, dass man sich Vektoren als Pfeile vorstellen kann. Pfeile haben eigentlich eine Länge, die wir auch für Vektoren definieren können. Nur reden wir hier normalerweise vom Betrag oder der Norm des Vektors. 19 Definition 4.8. Betrag eines Vektors q T x ||2 := Sei x~ = x 1 x 2 . . . x n ein Vektor. ||~ x 12 + x 22 + . . . + x n2 heißt der Betrag oder die Norm des Vektors x~ . Manchmal spricht man auch von der Länge eines Vektors. Definition 4.9. Kreuzprodukt Seien a~ = a1 a2 a3 niert ist als T und ~b = b1 b2 b3 T zwei Vektoren. Dann beschreibt der Vektor ~c , der defi- a2 b3 − a3 b2 ~c := a~ × ~b := a3 b1 − a1 b3 a1 b2 − a2 b1 das sogenannte Kreuz- oder Vektorprodukt. Das Kreuzprodukt ist ausschließlich für dreidimensionale Vektoren definiert! Sind die beiden Vektoren a~ und ~b linear unabhängig, so steht der neu gebildete Vektor ~c senkrecht auf a~ und senkrecht auf ~b, d.h. es gilt ~c · a~ = 0 und ~c · ~b = 0. Sind die beiden Vektoren a~ und ~b ~. nicht linear unabhängig, so ist der neu gebildete Vektor ~c der Nullvektor 0 Satz 4.10. Rechtshändigkeit des Kreuzprodukts Für zwei dreidimensionale Vektoren a~ und ~b gilt: a~ × ~b = − ~b × a~ Definition 4.11. Spatprodukt und Volumen Drei dreidimensionale, linear unabhängige Vektoren a~, ~b, ~c spannen ein dreidimensionales Volumen, genannt T Spat, auf. Das sogenannte Spatprodukt ist definiert als a~ × ~b · ~c . Für das Volumen V des Spats gilt: T ~ V = a~ × b · ~c Sind die drei Vektoren nicht linear unabhängig, so ist das Volumen 0. 20 5 Komplexe Zahlen Die komplexen Zahlen sind eine Erweiterung des bisher bekannten Zahlenmodells der reellen Zahlen. Die komplexen Zahlen wurden eingeführt um für Gleichungen wie beispielsweise x 2 + 1 = 0 eine Lösung finden zu können, für die es im Bereich der reellen Zahlen eben keine Lösung gibt. Alle bisher gelernten Rechengesetze behalten im Bereich der komplexen Zahlen weiterhin ihre Gültigkeit. Definition 5.1. Komplexe Zahlen und Konjugation 1. Unter einer komplexen Zahl z ∈ C versteht man eine Zahl der Form z = a + i b, mit a, b ∈ R wobei i 2 = −1. 2. a nennt man den Realteil Re(z) und b den Imaginärteil Im(z) der komplexen Zahl z . 3. Zu einer komplexen Zahl z := a + i b heißt z := a + i b := a − i b die konjugiert komplexe Zahl. Bemerkungen: Sowohl der Realteil als auch der Imaginärteil einer komplexen Zahl sind stets reell! Nun müssen wir überlegen, ob unsere Rechengesetze wirklich erhalten bleiben und ob wir bei den möglichen Verknüpfungen immer in C bleiben. Das bedeutet, dass wir nachprüfen müssen, ob C bezüglich der Addition, Subtraktion, Multiplikation und Division (ohne die Null) abgeschlossen ist. Definition 5.2. Rechengesetze für komplexe Zahlen Gegeben seien zwei komplexe Zahlen c := a + i b und z := x + i y , d.h. c, z ∈ C und a, b, x, y ∈ R. Dann gilt: 1. Addition: c + z = (a + i b) + (x + i y) := (a + x) + i(b + y) 2. Subtraktion: c − z = (a + i b) − (x + i y) := (a − x) + i(b − y) 3. Multiplikation: 4. Division: c z = 4.1.1 (a + i b) · (x + i y) = ax + ai y + i bx + i 2 · b y = ax + ai y + i bx + (−1) · b y (a x − b y) + i(a y + bx) c · z := = a+i b x+i y = a+i b x+i y · x−i y x−i y = (a+i b)(x−i y) x 2+ y2 = cz , zz falls z 6= 0 Satz 5.3. Rechenregeln für die komplexe Konjugation Seien c, z ∈ C und n ∈ N, dann gilt • c±z = c±z • c·z = c·z • daraus folgend: (c n ) = (c)n • gilt zusätzlich z 6= 0, so ist c z = c z 21 Anschauung: Eine komplexe Zahl z = a + i b lässt sich als Punkt mit den Koordinaten (a, b) der sogenannten Gauß’schen Zahlenebene auffassen. Man betrachtet eine komplexe Zahl z somit nicht zwingend nur als z ∈ C sondernwie in diesem Fall als a ∈ R2 Element des R2 : z = a + i b 7→ b Nun können wir uns auch die Addition zweier komplexer Zahlen z und c und die Multiplikation einer komplexen Zahl z mit einer reellen Zahl λ veranschaulichen: Bei der Addition wird einer der Vektoren (im Beispiel der Vektor zur komplexen Zahl c ) so in der Gauß’schen Zahlenebene verschoben, dass sein Ende an der Spitze des anderen Vektors ansetzt, er jedoch seine Richtung beibehält (Vektor c wird zu c 0 verschoben). Nun ist die Summe der beiden komplexen Zahlen die Spitze des neu entstanden Vektors, welcher durch einen Streckenzug der Vektoren z und c 0 entstanden ist. Bei der Multiplikation einer komplexen Zahl mit einer reellen Zahl wird der zur komplexen Zahl gehörige Vektor einfach um den Faktor (=reelle Zahl) gestreckt (falls der Betrag des Faktors größer als 1 ist) bzw. gestaucht (falls der Betrag des Faktors kleiner als 1 ist). Ein negativer Faktor spiegelt den am Ursprung beginnenden Vektor am Ursprung. Abbildung 5.1: Veranschaulichung der komplexen Addition (links) und der Multiplikation einer komplexen Zahl mit einer reellen Zahl (rechts). Die Multiplikation zweier komplexer Zahlen lässt sich mit dem bisherigen Modell nicht veranschaulichen – eine andere Darstellungsform der komplexen Zahlen liefert jedoch eine Anschauung: 22 Definition 5.4. Betrag, Argument, komplexe Exponentialfunktion, Polardarstellung Gegeben sei eine komplexe Zahl z = a + i b 1. Der Betrag r einer komplexen Zahl ist definiert durch r := |z| := p = p zz = Æ (a + i b)(a − i b) Æ a2 + b2 = Re(z)2 + Im(z)2 2. Das Argument von z wird mit Arg(z) abgekürzt und ist der gerichtete Winkel φ zwischen der positiven reellen Achse und dem Strahl vom Ursprung nach z (die positive Drehrichtung in der Mathematik ist gegen den Uhrzeigersinn). Das Argument wird zumeist im Bogenmaß angegeben. Da wir bei Addition/Subtraktion von 2π denselben Strahl erhalten, wollen wir jeden Winkel der Form φ 0 = φ + 2π · k , k ∈ Z als Argument von z bezeichnen. 3. Die komplexe Exponentialfunktion ist über eine so genannte Reihendarstellung definiert, die hier nur kurz dargestellt, jedoch nicht weiter erläutert werden soll: ∞ k X z z exp(z) := e := k! k=0 Diese Reihe wird dann später in der Erstsemester-Mathematik-Veranstaltung genauer erläutert. Wichtig ist es erst einmal nur zu verstehen, dass die Exponentialfunktion auch für komplexe Zahlen definiert ist. Setzt man eine komplexe Zahl in die komplexe Exponentialfunktion ein, ist das Ergebnis wieder eine komplexe Zahl. Jede komplexe Zahl ist durch die komplexe Exponentialfunktion und einen Vorfaktor darstellbar. (Ist das Funktionsargument reell, so ist die komplexe Exponentialfunktion gleich der reellen Exponentialfunktion.) Nun lässt sich jede komplexe Zahl anstatt durch Real- und Imaginärteil auch durch ihren Betrag und ihr Argument darstellen, was der Polardarstellung entspricht. Statt Polarkoordinaten in Form eines Vektors anzugeben, kann die komplexe Exponentialfunktion dazu benutzt werden. Alle Darstellungen lassen sich ineinander überführen, deshalb ist die Beschreibung in allen Fällen vollständig (nur die komplexe Zahl z = 0 hat kein eindeutiges Argument, deshalb definiert man hier meist das Argument als Null. Um die Eindeutigkeit der restlichen Zahlen zu gewährleisten vereinbart man, dass das Argument nur im Intervall [0, 2π) liegen darf). Die Exponentialfunktion verkörpert dabei nur das Argument und gehört zu einem Vektor der Länge Eins, weshalb die Exponentialfunktion noch mit dem Betrag der komplexen Zahl multipliziert werden muss: z = a + i b = |z| · e i·Arg(z) Der Vorteil der Exponentialfunktion-Darstellung liegt darin, dass man damit nach den bekannten Rechengesetzen rechnen kann. 23 Beispiel: Multiplikation zweier komplexer Zahlen Seien c = a + i b und z = x + i y zwei komplexe Zahlen mit den Argumenten Arg(c) = φ und Arg(z) = ψ. Dann gilt für das Produkt der beiden komplexen Zahlen: c · z = (a + i b) · (x + i y) = |c|e i·φ · |z|e i·ψ = |c| · |z| · e i·φ+i·ψ = |c| · |z| · e i·(φ+ψ) Abbildung 5.2: Mit Hilfe der Polardarstellung kann man nun leicht veranschaulichen, wie zwei komplexe Zahlen multipliziert werden: Die Beträge werden multipliziert und die Winkel addiert. Satz 5.5. Übergang von einer Darstellung zur anderen: 1. Von der kartesischen Darstellung zur Polardarstellung: r ist leicht zu berechnen als Betrag von a + i b. Für φ ist ein wenig Überlegung nötig. Alle Zahlen auf dem Kreis mit dem Abstand 1 zum Ursprung (auch Einheitskreis genannt) können wir mit den trigonometrischen Funktionen darstellen. Teilen wir eine Zahl durch ihren Betrag, liegt das Ergebnis auf dem Einheitskreis, somit lassen sich alle Winkel bestimmen. Wir erhalten: p a2 + b2 (Satz des Pythagoras) r = b , falls a > 0 arctan a b arctan a + π , falls a < 0 π φ = , falls a = 0 und b > 0 2 π −2 , falls a = 0 und b < 0 0 , falls a = b = 0 24 2. Von der Polardarstellung zur kartesischen Darstellung: Sei z = (r, φ) eine komplexe Zahl in Polardarstellung. Dann gilt z = a + i b mit a = cos(φ) und b = sin(φ). Es gilt also mit Arg(z) = φ : z = |z| · e i·φ = |z| · (cos (φ) + i · sin (φ)) Die letzte Formel ist auch bekannt als die Euler’sche Formel. 25 6 Funktionen In diesem Abschnitt beschäftigen wir uns mit „Funktionen“, einem zentralen Begriff der mathematischen Sprache. Die Idee ist, jedem Objekt aus einer Ansammlung von „Dingen“ genau ein bestimmtes anderes „Ding“ – beispielsweise einen Wert – zuzuordnen. Notiere ich z.B. für eine Gruppe von Menschen das jeweilige Alter oder fragt man nach den Hauptstädten einiger Länder, so sind dies aus mathematischer Sicht Funktionen. Definition 6.1. Funktionen Es seien X und Y Mengen mit den Elementen x 1 , x 2 , ..., x m ∈ X und y1 , y2 , ..., yn ∈ Y . Eine Zuordnung f : X → Y nennen wir Funktion, wenn folgendes gilt: (∀x ∈ X ) (∃! y ∈ Y ) : f (x) = y Zur Notation einer Funktion: „ f : X → Y : x 7→ y “ ist die vollständige Beschreibung einer Funktion, dabei gibt f den Namen der Funktion an, X bezeichnet den Definitionsbereich, also die Menge aller Elemente x 1 , x 2 , ..., x m , die in die Funktion eingesetzt werden können und für die ein eindeutiger Funktionswert y1 , y2 , ..., yn existiert und Y bezeichnet die Zielmenge, das ist die Menge, in der mindestens alle Funktionswerte liegen. Liegen in Y nur die Funktionswerte der Funktion f und keine weiteren Elemente, so nennt man Y den Bildbereich oder „das Bild von f auf X “ und schreibt Y = f (X ). Es gilt also f (X ) ⊆ Y . Die Schreibweise X → Y bedeutet, die Elemente aus X werden durch die Funktion auf Elemente aus Y abgebildet. x 7→ y gibt die Funktionsvorschrift an, sie beschreibt, was mit jedem einzelnen Element aus X genau passiert. Die Elemente aus X bezeichnet man auch als (Funktions-)Argumente. Wird die Funktion f auf ein Element x der Menge X angewandt, so schreibt man f (x). Der Funktionswert in Y , der durch die Abbildung von x ∈ X mittels f nach Y angenommen wird, wird mit y bezeichnet; man schreibt dann f (x) = y . Die Variablen x und y sind dabei Platzhalter für die x 1 , x 2 , ..., x m und y1 , y2 , ..., yn . Aus dieser Definition lassen sich folgende Zusammenhänge ableiten: Egal welches x aus X man wählt, es gibt stets ein zugeordnetes y in Y , d.h. jedem x ist exakt ein y zugeschrieben. Die Definition schließt dabei nicht aus, dass mehreren Werten aus X dasselbe y ∈ Y zugewiesen wird. Kann man die Elemente von X und Y sinnvoll in eine Reihenfolge bringen (für reelle Zahlen beispielsweise nach ihrer Größe), so erweist sich oft die Darstellung in einem Koordinatensystem als günstig. Dabei entspricht üblicherweise X der horizontalen und Y der vertikalen Achse. x 7→ y wird dabei als Punkt P mit den Koordinaten (x| y) im Koordinatensystem markiert. 26 Beispiel: Funktionen und keine Funktionen a) X sei eine Menge von Kraftfahrzeugen, Y die Menge aller mögli- chen Kennzeichen, f eine Vorschrift, die jedem Kfz sein Kennzei- chen zuordnet. b) X sei eine Ansammlung von Personen, Y die Menge der auftre- tenden Körpergrößen, f die Vorschrift, die jeder Person die Größe zuordnet. c) d) e) X sei eine Menge von Häusern, Y die Menge aller Personen, die in Häusern wohnen. f ordne jedem Haus seine Bewohner zu. f) g) Funktionen Keine Funktionen 27 Übung: Funktionen 1. Man betrachte die Vorschrift, die jedem Bundesbürger die Nummer seines Personalausweises zuordnet. Unter welchen Voraussetzungen ist dies eine Funktion? 2. Man begründe formal, d.h. mit Hilfe der Definition, warum die einzelnen Beispiele Funktionen sind bzw. nicht sind. Funktionen können wichtige Eigenschaften verkörpern, so ist es z.B. von hohem Interesse, ob Y der Bildbereich ist, oder ob mehrere Werte aus X auf dasselbe y ∈ Y abgebildet werden. Diese Überlegungen führen zu folgender Definition: Definition 6.2. Injektivität, Surjektivität und Bijektivität Es seien f : X → Y eine Funktion, x 1 , x 2 ∈ X . Dann heißt die Funktion f 1. injektiv, wenn gilt f (x 1 ) = f (x 2 ) ⇒ x 1 = x 2 , 2. surjektiv, wenn gilt (∀ y ∈ Y ) (∃x ∈ X ) : f (x) = y , 3. bijektiv, wenn f sowohl injektiv als auch surjektiv ist. Statt injektiv sagt man auch eineindeutig. Beispiel: Injektivität, Surjektivität und Bijektivität 28 Als nächstes werden Rechenoperationen für Funktionen definiert: Definition 6.3. Summe, Differenz, Produkt und Quotient von Funktionen Es seien f , g : X → Y Funktionen und Y eine Menge, in der Addition, Subtraktion, Multiplikation und Division definiert sind. 1. Die Funktion ( f ±g) : X → Y gegeben durch ( f ±g)(x) := f (x)±g(x) heißt Summe (bzw. Differenz) der Funktionen f und g . 2. Die Funktion ( f · g) : X → Y gegeben durch ( f · g)(x) := f (x) · g(x) heißt Produkt der Funktionen f und g . 3. Ist g(x) 6= 0 für alle x ∈ X , so heißt die Funktion der Funktionen f und g . f g f : X → Y gegeben durch g (x) := f (x) g(x) der Quotient Anmerkung: Elemente x ∈ X , für die g(x) = 0 gilt, heißen Nullstellen der Funktion g. Man betrachtet auch oft den Quotienten von f und g zumindest für die Elemente x ∈ X , für die g(x) 6= 0 gilt. Sei die Menge dieser f Elemente bezeichnet mit X ∗ := {x ∈ X |g(x) 6= 0}, so ist das also die Funktion g : X ∗ → Y . Definition 6.4. Verkettung von Funktionen Es seien f : W → X und g : X → Y Funktionen. Dann heißt die Funktion g ◦ f : W → Y (sprich „ g ◦ f “ als „g verkettet mit f“ oder „g nach f“), definiert durch (g ◦ f )(x) := g( f (x)) , die Verkettung oder Hintereinanderausführung von g und f. 29 Beispiel: Verkettungen 1. Seien f (x) = 2 und g(x) = x 3 zwei Funktionen. Dann ist (g ◦ f )(x) = 23 = 8 und ( f ◦ g)(x) = 2. 2. Seien f (x) = sin(x) und g(x) = x 2 zwei Funktionen. Dann ist (g ◦ f )(x) = (sin(x))2 und ( f ◦ g)(x) = sin(x 2 ). Anmerkung: Wie man an diesen Beispielen erkennen kann, gilt in der Regel (g ◦ f )(x) 6= ( f ◦ g)(x). Nun werden einige sehr häufig auftretende Funktionen definiert: Definition 6.5. Polynome und rationale Funktionen • Eine Funktion f : R → R mit f (x) = an x n + an−1 x n−1 + . . . + a0 x 0 (ai ∈ R für alle i ∈ {0, . . . , n}) heißt Polynom (oder auch ganzrationale Funktion). Der Faktor an wird als Leitkoeffizient bezeichnet und n gibt den Grad des Polynoms an. • Seien p und q Polynome und D := {x ∈ R | q(x) 6= 0} (die Menge der reellen Zahlen, für die q nicht p(x) Null wird). Dann heißt f : D → R gegeben durch f (x) := q(x) gebrochen rationale Funktion. Definition 6.6. Wurzelfunktion p n + Eine Funktion f : R+ x, n ∈ N \ {0} heißt Wurzelfunktion. 0 → R0 mit f (x) = Beispiel: 30 Definition 6.7. Exponentialfunktion und Logarithmus Die Funktion f : R → R+ mit f (x) = e x = exp(x), e ≈ 2, 718281 . . . , heißt (natürliche) Exponentialfunktion. Ihre Umkehrfunktion f −1 : R+ → R mit f −1 (x) = ln(x), definiert durch eln(x) = ln(e x ) = x , heißt (natürlicher) Logarithmus. Definition 6.8. Trigonometrische Funktionen Die nachfolgenden vier Funktionen sind trigonometrische Funktionen: 1. Sinus-Funktion f (x) = sin(x), x ∈ R 2. Cosinus-Funktion f (x) = cos(x), x ∈ R 31 3. Tangens-Funktion sin(x) f (x) = tan(x) := cos(x) , x ∈ {x ∈ R| cos(x) 6= 0} 4. Cotangens-Funktion 1 f (x) = cot(x) := tan(x) := cos(x) sin(x) , x ∈ {x ∈ R| sin(x) 6= 0} Satz 6.9. Additionstheoreme und weitere Eigenschaften 1. sin2 (x) + cos2 (x) = 1 2. sin(x ± y) = sin(x) cos( y) ± sin( y) cos(x) 3. insbesondere sin(2x) = 2 sin(x) cos(x) 4. cos(x ± y) = cos(x) cos( y) ∓ sin(x) sin( y) 5.9.1 5. insbesondere cos(2x) = cos2 (x) − sin2 (x) = cos2 (x) − sin2 (x) − cos2 (x) + cos2 (x) = 2 cos2 (x) − 1 | {z } 2 2 =−(sin (x)+cos (x)) 6. tan(x ± y) = tan(x)±tan( y) 1∓tan(x) tan( y) 7. sin(x) = cos π 2 −x 8. cos(x) = sin π 2 ±x 9. sin(x) + sin( y) = 2 sin 10. cos(x) + cos( y) = 2 cos x+ y 2 x+ y 2 cos cos x− y 2 x− y 2 32 Beispiel: Vergleich des normalen Sinus mit einem modifizierten Sinus Der modifizierte Sinus hat die allgemeine Form g(x) = A·sin(B · x + C)+ D, dabei gibt A die Amplitude ma x{g(x)}−min{g(x)} . Ist der Betrag der Amplitude größer als 1, so ist der modifizierte Sinus an, d.h. |A| = 2 gegenüber dem normalen Sinus in y -Richtung gestreckt, ist der Betrag kleiner als 1, so ist er gestaucht. Ist der Betrag von B größer als 1, so ist der modifizierte Sinus gegenüber dem normalen Sinus in x -Richtung gestaucht, ist der Betrag kleiner als 1, so ist er gestreckt. Der Parameter C gibt eine Verschiebung in x -Richtung an, der Parameter D beschreibt eine Verschiebung in y -Richtung. Abbildung 6.1: Gezeigt sind die Funktionen f (x) = sin(x) und g(x) = 2 sin 4x + π4 + 1 . Anmerkung: Bei den trigonometrischen Funktionen fallen bestimmte Symmetrieeigenschaften des Graphen auf, die wir ebenfalls benennen wollen: Definition 6.10. Symmetrie Eine Funktion f : D → R heißt 1. symmetrisch zur y -Achse, falls f (x) = f (−x) für alle x ∈ D gilt. 2. punktsymmetrisch zum Ursprung, falls f (x) = − f (−x) für alle x ∈ D gilt. Bemerkung: Symmetrische Funktionen nennt man auch gerade, Funktionen punktsymmetrisch zum Ursprung auch ungerade Funktionen. Beispiel: symmetrische Funktionen • Die Sinus-, Tangens-, und Cotangens-Funktion sind punktsymmetrisch zum Ursprung. • Die Cosinus-Funktion ist symmetrisch zur y -Achse. 33 Um den qualitativen Verlauf einer Funktion anzugeben, benutzt man noch weitere Begriffe, die nachfolgend definiert werden: Definition 6.11. Monotonie Sei f : D → R eine Funktion und I ⊆ D ein reelles Intervall. • Gilt für alle a, b aus I a < b ⇒ f (a) ≤ f (b) ( bzw. a < b ⇒ f (a) ≥ f (b)), so heißt f auf I monoton steigend (bzw. monoton fallend ). • Gilt sogar für alle a, b aus I a < b ⇒ f (a) < f (b) (bzw. a < b ⇒ f (a) > f (b)), so heißt f auf I streng monoton steigend (bzw. streng monoton fallend ). • f heißt auf I monoton, wenn f auf I monoton wachsend oder monoton fallend ist. • f heißt auf I streng monoton, wenn f auf I streng monoton wachsend oder streng monoton fallend ist. Beispiel: Monotonie • Ein Beispiel für eine monoton fallende Funktion ist die abschnittsweise definierte Funktion −x − 1 , x < −1 0 , −1 ≤ x ≤ 1 f1 (x) = −x + 1 , 1 < x • Ein Beispiel für eine streng monoton steigende Funktion ist die Funktion f2 (x) = x 3 Abbildung 6.2: Veranschaulichung verschiedener Monotonieverhalten. Links ein Beispiel für eine monoton fallende Funktion, rechts ein Beispiel für eine streng monoton steigende Funktion. Die Funktionen sind f1 (x) und f2 (x) aus dem Beispiel. 34 Definition 6.12. Polstellen, Minima und Maxima Sei f : D ⊆ R \ {x 0 } → R eine Funktion. Wir sagen 1. f hat eine Polstelle an der Stelle x 0 , wenn der Betrag von f in jedem offenen Intervall I um x 0 (d. h. x 0 ∈ I ) beliebig große Werte annimmt. 2. f hat ein (lokales) Maximum ((lokales) Minimum) an der Stelle x 1 ∈ D, wenn in einem genügend kleinen offenen Intervall I um x 1 gilt f (x 1 ) ≥ f (x) ( f (x 1 ) ≤ f (x)) für alle x ∈ I . Hat f an der Stelle x 1 ein Maximum oder ein Minimum, so sagen wir auch, f hat dort ein (lokales) Extremum. 3. f hat in x 1 ∈ D ein globales Maximum (globales Minimum), wenn f (x 1 ) ≥ f (x) ( f (x 1 ) ≤ f (x)) für alle x ∈ D gilt. Abbildung 6.3: Die Funktionen f1 (x) weist an der Stelle x 0 eine Polstelle auf, die Funktion f2 (x) besitzt an der Stelle x 1 ein Maximum. 35 7 Grenzwerte An dieser Stelle soll keine ausführliche Einführung in die Mathematik der Grenzwertrechnung erfolgen. Insbesondere sollen keine Rechenregeln für Grenzwerte aufgeführt werden, da sie in diesem Vorkurs nicht behandelt werden; dies wird dann in der kommenden Mathematik I Veranstaltung geschehen. Es soll hier lediglich auf die Schreibweise eingegangen werden: Oft ist das Verhalten einer Funktion für x → ∞ (sprich „ x gegen unendlich“) oder x → −∞ von Interesse. Damit ist dann das Verhalten der Funktion für sehr große (oder betragsmäßig sehr große negative) Argumente gemeint. Man spricht von Konvergenz, wenn die Funktionswerte einer Funktion gegen einen fixen Wert streben, was als Grenzwert bezeichnet wird. Konvergiert eine Funktion nicht, so spricht man von Divergenz. Beispielsweise konvergieren die Funktionswerte der Exponentialfunktion f (x) = e x gegen 0, wenn man die x -Argumente immer kleiner wählt (wenn man sich also „auf dem Zahlenstrahl in Richtung −∞ bewegt“). Dagegen divergiert die Funktion, wenn man die x -Argumente immer größer wählt (wenn man also „den Zahlenstrahl in Richtung ∞ läuft“). Man schreibt kompakt: e x → 0 für x → −∞ e x → ∞ für x → ∞ Konvergiert eine Funktion f (x) gegen einen Grenzwert g , wenn sich das Argument x dem Argument k nähert, so verwendet man häufig statt der Schreibweise f (x) → g für x → k die Limes-Schreibweise: lim f (x) = g x→k Dabei darf k auch ±∞ sein, g jedoch nicht, denn dann würde die Funktion divergieren, und dafür ist die Limes-Schreibweise nicht gültig. 36 8 Stetigkeit Für das Kapitel „Differentialrechnung“ ist der Begriff der Stetigkeit von grundlegender Bedeutung. Manch einer wird den Begriff aus der Schule kennen, die wenigsten werden ihn jedoch derart präzise formuliert haben, wie es für die Hochschul-Mathematik relevant ist. Mathematische Theorien werden üblicherweise anhand bestimmter Fragestellungen entwickelt. Hoher Abstraktionsgrad und der Wunsch nach allgemein anwendbaren Ergebnissen haben im vergangenen Jahrhundert jedoch zu einer weitgehenden Formalisierung der mathematischen Sprache geführt und allzu häufig fällt es sehr schwer, die Vorstellung hinter den formalen Sätzen und Definitionen zu erfassen. Für ein tieferes Verständnis und wesentlich leichteren Umgang mit den dargestellten Sachverhalten ist eine eigene Vorstellung aber unverzichtbar! Das soll keineswegs bedeuten, dass man die strenge mathematische Formulierung dadurch verständlicher macht, indem man sie lockerer formuliert, denn dann hat man das Konzept nicht vollständig verinnerlicht. Wir wollen versuchen, anhand einer geläufigen Definition der Stetigkeit von Funktionen eine Anschauung für einen komplexeren Sachverhalt so zu erarbeiten, dass die Definition verständlich wird und zugleich aus der Anschauung wieder die Definition ableitbar ist. Wir definieren hier die Stetigkeit von Funktionen über das sogenannte " -δ-Kriterium: Definition 8.1. Stetigkeit von Funktionen Sei f : D ⊆ R → R eine Funktion. f heißt stetig im Punkt x 0 , falls gilt: (∀" > 0)(∃δ > 0)(∀ξ ∈ D) |x 0 − ξ| < δ ⇒ | f (x 0 ) − f (ξ)| < " f heißt stetig auf D, falls f stetig in jedem Punkt x ∈ D ist. Wer die vorangegangenen Zeilen gelesen hat und dabei nicht das geringste verstanden hat, sollte sich an dieser Stelle nicht entmutigen lassen. Dies wird nicht die einzige schwere mathematische Definition im Studium bleiben. Jedoch hat es seine Gründe, warum die Definition genau so lautet und warum z.B. „(∀" > 0)(∃δ > 0)“ statt „(∃δ > 0)(∀" > 0)“ da steht. Als erstes sollte man – sofern man noch Probleme mit den mathematische Kurzschreibweisen hat – die Definition in Prosa wiedergeben: „Für alle " , welche stets größer als Null sind, existiert mindestens ein δ, welches ebenfalls größer als Null sein soll, sodass alle reellen Zahlen ξ aus dem Definitionsbereich die nachfolgende Bedingung erfüllen: Ist die betragsmäßige Differenz von x 0 und ξ kleiner als δ so folgt daraus, dass die betragsmäßige Differenz von f (x 0 ) und f (ξ) kleiner als " ist.“ 37 Und, verständlicher geworden? Wohl kaum. Das reine Übersetzen der mathematischen Symbole in Prosa langt den meisten nicht, um die Definition direkt zu erschließen. Wir formulieren den Prosa-Text etwas um: Zunächst sieht man sich die mathematische Definition an und zieht alle sofort erschließbaren Informationen heraus, sodass diese einmal genannt sind und im folgenden Text weggelassen werden können, damit dieser leichter zu interpretieren ist. Als letzte Änderung benutzen wir verständlichere Synonyme: „" ist größer als Null. δ ist größer als Null. ξ ist eine reelle Zahl aus dem Definitionsbereich. Alle Differenzen sind wegen des Betrages positiv, entsprechen also ‚Abständen‘. Dann gilt verkürzt: Für jedes " existiert mindestens ein δ, sodass alle ξ die nachfolgende Bedingung erfüllen: Ist der Abstand von x 0 und ξ kleiner als δ so folgt daraus, dass der Abstand von f (x 0 ) und f (ξ) kleiner als " ist.“ Diese verkürzte Form geht schon leichter über die Lippen und ist vielleicht etwas verständlicher als die Definition mit ausschließlich mathematischen Symbolen. Diese Definition wird nun ausführlich erläutert: Oben wurde erwähnt, dass es einen Unterschied macht, ob der Ausdruck „(∀" > 0)(∃δ > 0)“ anstelle von „(∃δ > 0)(∀" > 0)“ da steht. Und in der Tat bedeutet die bei unserer Definition verwendete Form, dass eben erst das " vorgegeben wird und davon abhängig das δ gewählt wird. " ist dabei eine Größe die beliebig gewählt werden soll, insbesondere beliebig klein, und der Definition entnimmt man, dass diese Größe den Abstand der Funktionswerte auf der y -Achse angibt, d.h. wir suchen uns einen Punkt x 0 , bilden den Funktionswert f (x 0 ) und definieren uns um diesen Funktionswert die " -Umgebung, in diesem Fall also eine untere Schranke unterhalb von f (x 0 ) (entspricht „ f (x 0 )−" “) und eine obere Schranke oberhalb von f (x 0 ) (entspricht „ f (x 0 ) + " “). Durch die Wahl dieser " -Umgebung wird zugleich die Anzahl möglicher δ-Umgebungen eingeschränkt („∃δ > 0“ bedeutet ja es gibt mindestens ein δ, dass ...). Die durch das " eingeschränkte (aber nicht eindeutig bestimmte) δ-Umgebung wird nun (aus der Definition ablesbar) den Abstand auf der x -Achse vom Punkt x 0 angeben, d.h. in diesem Fall also als eine linke Grenze (entspricht „ x 0 −δ“) und eine rechte Grenze (entspricht „ x 0 + δ“) angegeben. Dass die δ-Umgebung aus der " -Umgebung folgt und nicht umgekehrt, folgt aus der Reihenfolge in der Definition. Nun muss gelten, dass alle Punkte ξ, die sich in dieser δ-Umgebung befinden (entspricht „|x 0 − ξ| < δ“) sich nach einsetzen in die Funktion (entspricht „ f (ξ)“) in der " -Umgebung befinden (entspricht „| f (x 0 ) − f (ξ)| < " “). Ist diese Bedingung für alle ξ innerhalb der δ-Umgebung erfüllt, so ist die Funktion an der Stelle x 0 stetig. Ist die Funktion an allen Stellen innerhalb des Definitionsbereichs stetig, so sagt man die Funktion ist auf ihrem gesamten Definitionsbereich stetig oder kurz: die Funktion ist stetig. Beispiel: " -δ-Kriterium bei einer stetigen und einer unstetigen Funktion Betrachte die Funktionen in der Abbildung 7.1. Wir möchten anschaulich erklären, warum die Funktion f1 (x) an der Stelle x 0 nach der obigen Definition stetig ist, die Funktion f2 (x) an der Stelle x 0 jedoch nach obiger Definition unstetig ist. 38 Abbildung 8.1: Zwei Funktionen im Vergleich: die linke Funktion ist im Punkt x 0 stetig, denn egal wie klein man die " -Umgebung wählt, man findet eine passende δ-Umgebung dazu, sodass für alle ξ aus der δ-Umgebung dann f1 (ξ) innerhalb der " -Umgebung liegt. Die rechte Funktion hingegen ist im Punkt x 0 nicht stetig, denn es gibt eine genügend kleine " -Umgebung, sodass – egal wie klein man dann die δ-Umgebung wählt – nicht mehr für alle ξ aus der δ-Umgebung dann f2 (ξ) innerhalb der " -Umgebung liegt. (Nach der Definition gilt stets δ 6= 0.) Satz 8.2. Verknüpfungen stetiger Funktionen sind ebenfalls stetig Seien D ⊆ R der Definitionsbereich und f : D → R und g : D → R stetige Funktionen, dann sind folgende Verknüpfungen ebenfalls stetig: • f (x) ± g(x) • c · f (x) mit c ∈ R • f (x) · g(x) • f (x) g(x) falls g(x) 6= 0 für alle x ∈ D • ( f ◦ g)(x) := f (g(x)) Beispiel: einige stetige Funktionen Viele bekannte Funktionen sind auf ihrem Definitionsbereich stetig und nach Satz 6.2 auch ihre Verknüpfungen miteinander. Einige von ihnen sind: • x k mit k ∈ Q • sin(x), cos(x), tan(x), cot(x) • a x mit a ∈ R+ • loga (x) mit a ∈ R+ 39 Warum so eine komplizierte Definition für die Stetigkeit? In der Schule hat man doch leicht verständlich beigebracht bekommen: „Eine Funktion ist dann stetig, wenn man den zugehörigen Graphen zeichnen kann ohne den Stift absetzen zu müssen, d.h. wenn die Funktionswerte keine Sprünge machen.“ Nun zum einen ist diese „Definition“ nicht ganz präzise, da vorab nicht definiert wurde was genau man unter „ohne den Stift absetzen zu müssen“ zu verstehen hat. Wäre dies bekannt, so würde sich die Definition aus der Schule von der hier präsentierten trotzdem unterscheiden, denn nach der Schul-Definition wäre beispielsweise die Funktion f (x) = 1x nicht stetig, ist sie aber sehr wohl – denn eine Funktion ist nach unserer Definition stetig, wenn sie auf ihrem gesamten Definitionsbereich stetig ist, und das ist für f : R \ {0} → R : x 7→ 1x der Fall, obwohl man zum Zeichnen des Graphen „den Stift absetzen muss“! Des Weiteren gibt es Funktionen, deren Graph man zwar zeichnen kann „ohne den Stift absetzen zu müssen“, die aber dennoch nicht stetig sind (vergleiche Abbildung 7.2)! Solche Funktionen können z.B. bei Abbildungen von R2 nach R auftreten, wie sie im zweiten Semester in Mathematik II behandelt werden. f Hx,yL 1 0 -1 -2 2 1 -1 0 x 0 y -1 1 2 -2 Abbildung 8.2: Graph einer unstetigen Funktion, welchen man jedoch zeichnen könnte „ohne den Stift absetzen zu müssen“. Der gezeigte p Graph gehört zu der zweidimensionalen Funktion f : R2 → R : (x, y) 7→ Im x + i · y . Diese Funktion ist an den Stellen v0 mit v0 ∈ (−∞, 0] × {0} unstetig. Salopp kann man sagen: Nur für Funktionen im eindimensionalen Raum, sprich Funktionen mit nur einer Variablen, ist die Bedingung „man kann den Graph einer Funktion zeichnen ohne den Stift absetzen zu müssen“ hinreichend um auf eine stetige Funktion schließen zu können, jedoch keinesfalls notwendig! 40 9 Differentialrechnung Anhand dieses Kapitels wollen wir uns noch einmal verdeutlichen, wie eine mathematische Theorie oft entsteht: Um irgendein (Alltags-)Problem mithilfe mathematischer Methoden besser beschreiben und lösen zu können, wird die Theorie (hier die der Funktionen) um geeignete Begriffe erweitert (hier den der Ableitung), dann wird untersucht, durch welche Gesetzmäßigkeiten sich die Handhabung der Erweiterung vereinfacht (hier durch die Ableitungsregeln), um nicht jedes Mal auf die Definition zurückgreifen zu müssen. Schließlich stellt man (hoffentlich) fest, dass sich mit dem neuen Teil der Theorie auch andere Probleme lösen lassen (hier das der Ermitteln der Extremstellen). Beispiel: Bierbestandsfunktion Wir befinden uns in der aus der Übung bekannten Pilsstube Herkules. Hier betrachten wir die Bier+ bestandsfunktion f : R+ 0 → R0 , die jedem Zeitpunkt t die aktuell noch vorhandene Biermenge zuordnet. Klar ist, dass man den aktuellen Bierbestand zum Zeitpunkt t 0 einfach am Funktionsgraphen ablesen kann. Nun möchte aber der interessierte amerikanische Austauschstudent gerne das Trinkverhalten der Deutschen anhand des Graphen der Bierbestandsfunktion des Herkules studieren. Wie könnte er dabei vorgehen? Überlege dir, wie sich erhöhter Bierfluss zu den Stoßzeiten auf die Bestandsfunktion auswirkt. Was geschieht, wenn die Pilsstube tatsächlich einmal leer ist? Was geschieht zwischen 5:00 und 6:00 Uhr, wenn der Bestand wieder (stetig) aufgefüllt wird? 41 Definition 9.1. Ableitung, Differenzierbarkeit • Gegeben sei eine Funktion f : D ⊆ R → R. Die Steigung der Funktion f in dem Punkt x 0 ∈ D wird als Ableitung von f in x 0 bezeichnet und ist definiert als der Grenzwert einer Sekantensteigung. Man schreibt f 0 für die Ableitung der Funktion f : f 0 (x 0 ) := lim h→0 f (x 0 + h) − f (x 0 ) (x 0 + h) − (x 0 ) • Die Funktion f heißt in x 0 differenzierbar, wenn dieser Grenzwert existiert. • Ist f in jedem Punkt x 0 ∈ D differenzierbar, so heißt f auf D differenzierbar. Durch f 0 : D → R : x 7→ f 0 (x) wird eine neue Funktion, die Ableitungsfunktion definiert. Beispiel: Ableitungen f ist in x 0 nicht differenzierbar. 1. Sei f : R → R gegeben durch f (x) = |x|. Betrachten wir den Grenzwert der Sekantensteigungen, so finden wir: |x 0 + h| − |x 0 | |h| = lim = lim h→0 h→0 h h 2. § 1, wenn h & 0 −1, wenn h % 0 Dieser Grenzwert ist nicht eindeutig bestimmt, demnach ist f in x 0 = 0 nicht differenzierbar. 3. Man betrachte f : R → R mit f (x) = x 2 an der Stelle x 0 : x 02 + 2hx 0 + h2 − x 02 f (x 0 + h) − f (x 0 ) 2x 0 + h f (x 0 ) = lim = lim = lim = 2x 0 h→0 h→0 h→0 h h 1 0 also gilt f 0 (x) = 2x . 42 Um nicht jedes Mal die Ableitung über den Grenzwert der Sekantensteigungen ermitteln zu müssen, zeigen wir im folgenden einige Rechenregeln, mit denen sich aus wenigen bekannten Ableitungsfunktionen sehr viele andere bestimmen lassen: Satz 9.2. Ableitungsregeln Seien die Funktionen u : R → R und v : R → R differenzierbar. Dann gilt: 1. Faktorregel: Sei f (x) = c · u(x) (c ∈ R und c = konst.), dann ist f differenzierbar und es gilt f 0 (x) = c · u0 (x). 2. Summenregel: Sei f (x) = u(x) ± v (x), dann ist f differenzierbar und es gilt f 0 (x) = u0 (x) ± v 0 (x). 3. Produktregel: Sei f (x) = u(x) · v (x), dann ist f differenzierbar und es gilt f 0 (x) = u0 (x) · v (x) + u(x) · v 0 (x). u(x) v (x) , dann ist f differenzierbar u0 (x)·v (x)−u(x)·v 0 (x) 0 (x) = . (v (x))2 4. Quotientenregel: Sei f (x) = und für diese Punkte gilt f in allen Punkten x ∈ R \ {x|v (x) = 0} 5. Kettenregel: Sei f (x) = v (u(x)). Dann ist f differenzierbar und es gilt f 0 (x) = v 0 (u(x)) · u0 (x). Lemma 9.3. Häufig auftretende Ableitungen f (x) f 0 (x) 1 (c ∈ R) a x (a ∈ R) ax (a ∈ R+ ) ex ln(x) sin(x) cos(x) tan(x) 0 a · x a−1 ln(a) · a x ex Anmerkungen: x −a = x1a p 1 xa = a x 1 x cos(x) − sin(x) 1 cos2 (x) Beispiel: Quotientenregel 5 4 +1 Sei f (x) = x +3x . Setze u(x) = x 5 + 3x 4 + 1 und v (x) = x 2 + 3 x 2 +3 Dann ist u0 f 0 (x) = v u v0 z }| { z }| { z }| { z }| { 5 4 0 2 5 4 (x + 3x + 1) · (x + 3) − (x + 3x + 1) · (x 2 + 3)0 (x 2 + 3)2 | {z } v2 = (5x + 12x ) · (x + 3) − (x 5 + 3x 4 + 1) · 2x = ... (x 2 + 3)2 4 3 2 43 Beispiel: Kettenregel Sei f (x) = 3(x 3 + 2x 2 + 4)4 . Setze v (u) = 3u4 und u(x) = x 3 + 2x 2 + 4 Dann ist f = (v ◦ u)(x) = v (u(x)) und f 0 (x) = 4 · 3(x 3 + 2x 2 + 4)3 · (3x 2 + 4x) = . . . {z } | {z } | v 0 (u(x)) u0 (x) Mit diesem neuen Werkzeug des Differenzierens haben wir nun ein Mittel zur Bestimmung von Extremstellen gewonnen: Satz 9.4. Extremstellen Gegeben sei eine differenzierbare Funktion f : D ⊆ R → R. f hat genau dann ein lokales Minimum (bzw. Maximum) in x 0 ∈ D, wenn f 0 (x 0 ) = 0 und f 00 (x 0 ) > 0 (bzw. f 00 (x 0 ) < 0) gilt oder wenn alle Ableitungen von f an der Stelle x 0 verschwinden (d.h. f ist in einer Umgebung von x 0 konstant).1 Beispiel: Extremstellen Wir betrachten die Funktion f (x) = 13 x 3 − x . Als erstes suchen wir die Punkte, die als Extremstellen in Frage kommen: Hierzu muss die erste Ableitung 0 sein. Die Ableitung ist f 0 (x) = x 2 − 1 = (x + 1)(x − 1) und hat somit ihre Nullstellen bei x 1 = 1 und x 2 = −1. Setzen wir diese in die zweite Ableitung ein, finden wir f 00 (x 1 ) = 2x 1 = 2 > 0, also ein Minimum und f 00 (x 2 ) = 2x 2 = −2 < 0, also ein Maximum. Implikationen Der vorangegangene Satz ist ein gutes Anschauungsbeispiel für die Handhabung von Implikationen („wenn, dann“). Wir spalten den Satz auf: a) x 0 ist relatives Extremum b) f 0 (x 0 ) = 0 und f 00 (x 0 ) 6= 0 =⇒ =⇒ f 0 (x 0 ) = 0 x 0 ist relatives Extremum Bedingung a) ist notwendig, damit x 0 ein Extremum ist. Die Aussage „ f 0 (x 0 ) = 0 ⇒ x 0 ist relatives Extremum“ wäre nun natürlich falsch: b) besagt ja gerade, dass zusätzlich noch f 00 (x 0 ) 6= 0 benötigt wird. Bedingung b) ist somit eine hinreichende Bedingung dafür, dass x 0 eine Extremstelle ist. Wir können aber aus a) auf c) f 0 (x 0 ) 6= 0 =⇒ x0 ist kein relatives Extremum schließen. 1 Das bedeutet u.a., dass eine konstante Funktion an jeder Stelle ein (sogar globales) Maximum und Minimum besitzt! 44 10 Partielle Differentiation Partielle Differentiation ist ein Thema, welches in Mathematik II behandelt wird, allerdings bereits in früheren Vorlesungen vorausgesetzt wird. Da dieser spezielle Fall der Differentialrechnung bei Studierenden in der Regel keine besonderen Schwierigkeiten auslöst, werden wir an dieser Stelle eine kleine Einführung in das Thema geben. Partielle Differentiation ist im Prinzip eine Erweiterung von bereits vorhandenen Kenntnissen und Regeln um ein paar weiterführende Gedankengänge. Definition 10.1. Funktionen in mehreren Veränderlichen Sei f : Rm → R eine mehrdimensionale Funktion in m Veränderlichen.1 Beispiel: Funktionen der Form f : Rm → R • f (x, y) = x + 3 y • g(x, y, z) = x − l n(2z + x) y p • h(x, y, z) = f (x, y) − g(x, y, z) Definition 10.2. Gradient und partielle Ableitung Die partielle Ableitung beschreibt die Ableitung einer Funktion in mehreren Veränderlichen nach einem Argument. Gebündelt werden alle partiellen Ableitungen in einem Vektor ∇, dem Gradienten von f. Für eine fest gewählte Stelle X~ ∈ Rm und die Funktion f (x 1 , x 2 , ..., x m ) sind die partiellen Ableitungen für i = 1, ..., m gegeben durch ∂f (X~ ). (10.1) ∂ xi Die Funktion heißt dann partiell differenzierbar und der Gradient von f an der Stelle X~ wird definiert als der Spaltenvektor der partiellen Ableitungen ∂f ~ ∂ x 1 (X ) ∂ f (X~ ) ∂ x2 ∇ f (X~ ) = Geometrisch wird ∂f ∂ xi . .. . ∂f ~ ∂ x m (X ) (10.2) auch als Richtungsableitung von f in Richtung x~ bezeichnet. Satz 10.3. Schreibweisen • ∇ f = g r ad f • 1 ∂f ∂x = ∂x f = f x siehe Abbildung 8.2 45 Beispiel: Gradient und partielle Ableitung Beim partiellen Ableiten ist es hilfreich, sich die Argumente nach denen gerade nicht abgeleitet wird, als Konstanten vorzustellen. • f (x, y) = x − l n(3 y + x 2 ) ∂f 2x (x, y) = 1 − , ∂x 3 y + x2 ∂f 3 (x, y) = − , ∂y 3 y + x2 2x 1 − 3 y+x 2 ∇ f (x, y) = 3 − 3 y+x 2 y • g(x, y, z) = x 2 y − 3 z g x (x, y, z) = 2x y, 3 g y (x, y, z) = x 2 − , z gz (x, y, z) = 3 y , z2 6 ∇g(1, 3, 3) = 0 1 Definition 10.4. Partielle Ableitung zweiter Ordnung Der Vollständigkeit halber sei noch erwähnt, dass die Ableitung zweiter Ordnung einer Funktion f : Rm → R für i, j = 1, ..., m durch ∂f ∂2f ∂ := (10.3) ∂ xi∂ x j ∂ xi ∂ x j definiert ist, wobei auch hier die Schreibweise f x i x j beibehalten werden kann. Außerdem sind die zweiten partiellen Ableitungen nach dem Satz von Schwarz vertauschbar, wenn diese stetig sind. f xi x j = f x j xi (10.4) Das Äquivalent zum Gradienten nennt sich auf Ebene der zweiten Ordnung Hesse-Matrix. Dabei handelt es sich um eine (m × m)-Matrix. Beispiel: Hesse-Matrix T • f (X~ ) = f (x, y) = 3x 2 y mit ∇ f (X~ ) = 6x y, 3x 2 ∂2f (X~ ) = f x x (X~ ) = 6 y ∂ x2 ∂2f ∂2f (X~ ) = f x y (X~ ) = f y x (X~ ) = (X~ ) = 6x ∂ x∂ y ∂ y∂ x ∂2f (X~ ) = f y y (X~ ) = 0 ∂ y2 H(X~ ) = ∂2f ∂ x2 ∂2f ∂ y∂ x ∂2f ∂ x∂ y ∂2f ∂ y2 ! 6 y 6x = 6x 0 46 11 Integralrechnung Die Integralrechnung hat sich unter anderem wegen den folgenden zwei Problemstellungen herausgebildet: 1.) Wie berechnet man den Flächeninhalt der von der Funktion und der x -Achse begrenzt wird? Für Flächen die durch gerade Strecken berandet sind, stellt dies meist kein Problem dar, für krummlinig berandete Flächen ist die Berechnung weniger einfach. Wir wollen uns hier mit dem Flächeninhalt unter dem Graphen einer Funktion f : [a, b] → R beschäftigen. 2.) Wie kehre ich die Differenzierung um? Die Fragestellung beinhaltet, ob es für jede Funktion f eine Funktion F mit F 0 = f gibt und ob diese eindeutig zu bestimmen ist. Wir wollen uns zunächst dem ersten Problem widmen: Verkürzt formuliert wird versucht, die komplizierte Fläche durch Flächen, deren Flächenberechnung einfacher ist, anzunähern. Sinnvollerweise werden Rechtecke benutzt, die immer schmaler gemacht werden. Das Integral entsteht also als Grenzwert eines Annäherungsprozesses durch Rechtecksflächen. Man kann herleiten, dass dieser Vorgang der Integration gerade der Umkehrvorgang zur Differenzierung ist (dies besagt der Hauptsatz der Differentialund Integralrechnung). Um es einfacher zu machen, definieren wir daher die Integration gleich über die Differenzierung statt über die Flächeninhalte. (Diese Freiheit hat man beim Definieren!) Definition 11.1. Stammfunktion, Integration, unbestimmtes Integral 1. Eine differenzierbare Funktion F : D ⊆ R → R heißt Stammfunktion der Funktion f : D ⊆ R → R, falls für jedes x ∈ D gilt: F 0 (x) = f (x) ; sie ist nur bis auf eine Konstante c ∈ R eindeutig bestimmt. f nennt man dann auch integrierbar auf D. 2. Die Operation, die einer Funktion eine Stammfunktion zuordnet, heißt Integration. 3. Die Menge aller Stammfunktionen einer Funktion f : D ⊆ R → R heißt unbestimmtes Integral R von f und wird notiert als f (x)d x . 47 Beispiel: einige wichtige Integrale • R x αd x = 1 α+1 α+1 x • R 1 x dx • R e a·x d x = 1a e a·x + c für a ∈ R \ {0} • R sin(a · x)d x = − 1a cos(a · x) + c für a ∈ R \ {0} • R cos(a · x)d x = 1a sin(a · x) + c für a ∈ R \ {0} + c für α ∈ R \ {−1} = ln |x| + c Definition 11.2. Bestimmtes Integral Sei f : D ⊆ R → R integrierbar, a, b ∈ D , F : D ⊆ R → R eine beliebige Stammfunktion von f . Wir definieren Z b f (x)d x := [F (x)]ab := F (b) − F (a) a und nennen Rb a f (x)d x das bestimmte Integral von f von a bis b . Dieses bestimmte Integral von f ist unabhängig von der Wahl der Stammfunktion F . Es ist keine Funktion mehr, sondern eine reelle Zahl. Der Betrag dieser Zahl entspricht dem Flächeninhalt zwischen dem Graphen der Funktion f und der x -Achse auf dem Intervall [a, b]. Durch unsere Wahl der Definition einer Stammfunktion müssten wir dies zwar erst noch beweisen, da der Zusammenhang zwischen Flächeninhalt und Integral nicht wirklich offensichtlich ist. Wir belassen es hier aber bei dieser Anmerkung. Nun folgen einige Rechenregeln um mit bestimmten Integralen arbeiten zu können: Satz 11.3. Rechenregeln für bestimmte Integrale Gegeben sei eine integrierbare Funktion f : D ⊆ R → R, sowie die Zahlen a, b, c ∈ D mit a < b < c . Dann gilt: Ra 1. a f (x)d x = 0 2. Rb 3. Rb a a f (x)d x = − f (x)d x + Ra Rc b b f (x)d x f (x)d x = Rc a f (x)d x 48 Zuletzt wollen wir uns noch mit Methoden zum Lösen „schwieriger“ Integrale beschäftigen1 . Es lässt sich leicht zeigen, dass sich die Ableitungsregeln auf die Integrationsregeln übertragen lassen: Satz 11.4. Integrationsregeln Voraussetzung: f , u, v seien integrierbare Funktionen, c ∈ R. 1. Faktorregel: R R c · f (x)d x = c · f (x)d x 2. Summenregel: R R R (u(x) ± v (x))d x = u(x)d x ± v (x)d x 3. Partielle Integration oder Produktintegration (Umkehrung der Produktregel): R 0 R u (x) · v (x)d x = u(x) · v (x) − u(x) · v 0 (x)d x 4. Substitutionsregel (Umkehrung der Kettenregel): R R f (g(x)) · g 0 (x)d x = f (t)d t t=g(x) Beispiel: Partielle Integration Z 1 ln x − x · |{z} ln x d x = x 2 |{z} |{z} 2 |{z} 0 u (x) v (x) u(x) Z v (x) 1 2 1 x · dx 2 x |{z} |{z} u(x) v 0 (x) Z 1 2 1 x ln x − xdx 2 2 1 1 = x 2 ln x − x 2 + c mit c ∈ R 2 4 = Beispiel: Integration durch Substitution Z Wir haben hier f (g(x)) = Z 1 g(x) tan(x)d x = Z sin(x) dx cos(x) und g(x) = cos(x) . Da g 0 (x) = − sin(x) folgt: sin(x) dx = − cos(x) Z 1 · cos(x)0 d x = − cos(x) Z 1 dt t t=cos(x) = (− ln |t| + c)| t=cos(x) = − ln | cos(x)| + c 1 Bei äußerst komplizierten Integralen lohnt sich auch häufig mal ein Blick in ein Nachschlagewerk, z.B.: Merziger et al.: „FORMELN + HILFEN, HÖHERE MATHEMATIK“, 6 2010, Binomi Verlag, Barsinghausen. Bronstein et al.: „Taschenbuch der Mathematik“, 7 2008, Harri Deutsch Verlag, Frankfurt am Main. Im Internet gibt es eine Vielzahl kostenloser Integratoren, z.B. einen unter http://integrals.wolfram.com/index.jsp 49 Wem diese Methode zu mathematisch ist oder für diejenigen, die nicht direkt sehen, welche Verknüpfung vorliegt, bietet sich eine „mathematisch lockerere“ Methode an, welche zwar etwas leichter nachzuvollziehen und zu berechnen ist, jedoch aufgrund einer ungültigen Operation eigentlich nicht legitim ist! Man geht beim Verwenden dieser Methode wie folgt vor: Man nutzt sie um eine Stammfunktion zu ermitteln, verwirft die Rechnung, behauptet man habe die gefundene Stammfunktion geraten und beweist durch Differenzieren, dass es sich um eine gültige Stammfunktion handelt! Die Methode soll am obigen Beispiel verdeutlich werden: Z tan(x)d x = Z sin(x) dx cos(x) Wähle eine geschickte Substitution: z = z(x) = cos(x) ⇒ z 0 (x) = dz = − sin(x) dx ⇒ dx = dz − sin(x) Ersetze im ursprünglichen Integral nun so, dass alle x verschwinden, und ersetze d x ebenfalls, sodass nun wegen dz über die Variable z integriert wird. Nach der Integration wird re-substituiert: Z sin(x) dx = cos(x) Z sin(x) dz · = z − sin(x) Z 1 dz = − −z Z 1 dz = − ln |z| + c = − ln | cos(x)| + c z Die ungültige Operation war dabei „ ddzx “ (sprich „dz nach d x “) als Bruch zu betrachten und die Variablen zu trennen. Das ist eigentlich nicht möglich, da „ ddzx “ eine feste, alternative Bezeichnung für die Ableitung ist, welche häufiger als „z 0 (x)“ benutzt wird, da man hier erkennen kann, nach welcher Variablen abgeleitet wurde, was bei mehrdimensionalen Funktion durch die „ f 0 (x, y)“-Schreibweise nicht ersichtlich ist. In unserem Beispiel wird also die Funktion z nach der Variablen x abgeleitet. Irrwitzigerweise erhält man also ein Ergebnis, wenn man „ ddzx “ trotz Verbot umschreibt. Dieses Verfahren bezeichnet man als „Trennung der Variablen“ und es wird häufig beim Lösen von Differentialgleichungen genutzt. 50 12 Summenalgebra Um sich einigen Rechenaufwand beiPder Benutzung von bestimmten Rechenoperationen zu ersparen, führen wir nun das Summenzeichen ein. P Der Vorteil einer Benutzung des Symbols besteht darin, dass umfangreiche und komplexe Summenausdrücke in eine kurze und übersichtliche Form überführt werden können. Somit lassen sich einige Rechenoperationen wesentlich schneller anwenden. Definition 12.1. Das Summenzeichen Die Menge X = [x 1 , x 2 , ..., x n ] bestehe aus n Elementen. Wir können die Summe aller Elemente der Menge X mit n X x 1 + x 2 + ... + x n = xi i=1 definieren. i wird als Laufindex bezeichnet. Die Bezeichnung i=1 ist hier der untere Summationsindex und n der obere Summationsindex. Häufiger werden die Summationsindizes auch als Start- und Endwert bezeichnet. Es folgen nun einige Rechenregeln, um mit dem Summenzeichen arbeiten zu können: Satz 12.2. Wichtige Rechenregeln für das Summenzeichen • n P x i = x m + ... + x n mit Laufvariable x i , Laufindex i, Startwert m, Endwert n > m. i=m • n P xi = i=1 • m P i=1 n P m P xi j = i=1 j=1 • ∞ P n P xi + i=m+1 m P n P n P i=1 xi = x j + n P i=1,i6= j xi xi j j=1 i=1 x i = lim n P n→∞ i=1 i=1 x i und xi n n ∂ f (x) P ∂ P i f i (x) = • ∂x ∂ x i=1 i=1 • n P 1 = 1 + 1 + ... + 1 = n i=1 • n P x = (n − m + 1) · x i=m 51 Satz 12.3. Wichtige Umformungen für das Summenzeichen • a+b ( n P x i ) = a + b x 1 + b x 2 + ... + bx n = a + i=1 • n P n P (a + b x i ) = na + b ( n P n P (x i ± yi ) = xi ± i=1 (ax i ± b yi ) = a( i=1 • ( n P i=1 n P xi) i=1 i=1 • bx i i=1 i=1 • n P n P yi i=1 n P x i ) ± b( i=1 x i )2 = ( n P i=1 xi) · ( n P i=1 n P yi ) i=1 xi) = n P n P xi x j i=1 j=1 52 13 Vollständige Induktion Als letztes soll noch der Vollständigkeit halber – da es sich hierbei immerhin um eine MathematikVeranstaltung handelt – eine grundlegende Beweis-Technik vorgestellt werden. Eine sehr häufig verwendete Methode zum Beweisen von Gleichungen bzw. Ungleichungen ist die vollständige Induktion, wie sie auch in der Veranstaltung Mathematik I behandelt wird. Ein einleitendes Beispiel soll an die Thematik heranführen: Möchte man die Summe der ersten n natürlichen Zahlen ohne die 0 bilden, d.h. 1 + 2 + 3 + ... + n, so muss man insgesamt (n − 1)-Additionen durchführen. Wir nutzen im Folgenden die kompakte Schreibweise mittels Summenzeichen 1+2+3+...+ Pn n = k=1 k. Für sehr viele Zahlen, beispielsweise die ersten 1 Mio. natürlichen Zahlen ohne die 0 muss man folglich 999 999 Additionen ausführen. Auch für einen Computer ist das ein hoher Rechenaufwand und je nach Umfang solcher Aufgabenstellungen muss man sehr lange auf ein Ergebnis warten. Im Zeitalter in dem „Zeit Geld ist“ besteht also ein hohes Interesse eine schnellere Rechnung zu finden. Und in der Tat: Es gibt eine sehr kompakte Formel für oben beschriebenes Problem! Mit dieser kann man die Rechnung, egal wie viele Zahlen man addieren möchte, d.h. egal wie groß das n ist, auf lediglich 3 Operationen reduzieren: Eine Addition, eine Multiplikation und eine Division. Die Formel hierfür lautet: n X k=1 k= n(n + 1) 2 Nun ist das aber eine ziemlich vage Behauptung, dass diese kurze Formel tatsächlich für alle n gelten soll. Man kann probeweise einmal einige Werte für n einsetzen und wird sehen, dass die Formel gilt. Leider ist das noch kein Beweis dafür, dass die Formel tatsächlich für jedes n gilt. Hier hilft uns die angesprochene vollständige Induktion weiter. Wir wollen sie direkt an der eben genannten Formel exemplarisch vorstellen. Bei der vollständigen Induktion geht man wie folgt vor: Man zeigt, dass die Formel für ein Startglied gilt, in unserem Beispiel das kleinste n, und man zeigt, dass die Formel, falls sie für n gilt, auch für n + 1, also für alle Folgeglieder, gelten muss. Man kann sich das ähnlich zum sogenannten Domino-Effekt vorstellen: Unser Startglied ist der erste Stein, der umgeworfen wird, und unser Folgeglied ist die Tatsache „fällt irgendein Stein, so setzt er den nachfolgenden in Bewegung, ergo fällt dieser auch um“. Die vollständige Induktion kann nur als Beweistechnik für Formeln mit diskreten Variablen genutzt werden, d.h. die Variable (hier n) muss eine ganze Zahl sein (was in unserem Beispiel erfüllt ist, da n ∈ (N \ {0}) ⊆ Z). Nun gehen wir wieder in die mathematische Sprache über: Satz 13.1. Gauß’sche Summenformel Für die Aufsummierung der ersten n natürlichen Zahlen ohne die 0 ergibt sich folgende kompakte Formel (genannt Gauß’sche Summenformel): Es gilt n X k=1 k= n(n + 1) für alle n ∈ N \ {0}. 2 53 Beweis 10.2. Gauß’sche Summenformel Beweis mittels vollständiger Induktion über n: Induktionsanfang P1 (IA): 1(1+1) Für n = 1 gilt k=1 k = 1 und 2 = 22 = 1. Da 1 = 1 gilt die Formel für das Startglied. P1 1(1+1) 2 Man schreibt das gewöhnlich in kompakter Form: k = 1 = = 2 2 k=1 Induktionsvoraussetzung (IV): Pn n(n+1) Wir nehmen nun an, die Formel gilt allgemein, d.h. es wird angenommen, dass k=1 k= 2 für alle n ≥ 1 gilt. Induktionsschritt (IS): Es gilt die Formel für die Folgeglieder zu zeigen, d.h.: z.z.: Pn+1 k=1 k= (n+1)((n+1)+1) 2 ⇒ n+1 X k k=1 = n X k + (n + 1) (IV) = k=1 = = = = = ⇒ Pn+1 k=1 k= (n+1)((n+1)+1) 2 n(n + 1) 2 + (n + 1) n(n + 1) 2(n + 1) + 2 2 n(n + 1) + 2(n + 1) 2 n2 + n + 2n + 2 2 (n + 1)(n + 2) 2 (n + 1)((n + 1) + 1) 2 , was zu zeigen war. Anmerkung: In der Definition des Summenzeichens ist folgender Zusammenhang ebenfalls mit eingeschlossen: y X ak = 0 , falls y < x gilt. k=x Deshalb gilt die Gauß’sche Summenformel sogar für n = 0 und somit für alle n ∈ N. 54