Mathematik für Wirtschaftswissenschaftler I Herbsttrimester 2010 Vorlesung Gabriel Frahm Helmut-Schmidt-Universität Lehrstuhl für Angewandte Stochastik Fächergruppe Mathematik/Statistik 22043 Hamburg Zu meiner Person Personalien: PD Dr. Gabriel Frahm Lehrstuhl für Angewandte Stochastik E-Mail: [email protected] URL: www.hsu-hh.de/stochastik Sprechstunde: Dienstags, 14:00 Uhr Ort: Geb. H01, Eb. 1, Raum 1372 Laufbahn: Universität zu Köln: – Lehrstuhl für Finanzierungslehre sowie – Lehrstuhl für Statistik & Ökonometrie. Universität Münster: – Lehrstuhl für Ökonometrie und empirische WiFo. 1 Zu meiner Person Laufbahn: Forschungsinstitute / Praxiserfahrung: – Center of Advanced European Studies and Research, – NEC Laboratories Europe, – WestLB sowie diverse Beratungsprojekte. Forschung: Copulas, Extremwerttheorie, Random Matrix Theory, Portfoliooptimierung, robuste Kovarianzmatrizen, Missing-Data Analysis, multiples Testen. Lehre: Econometrics, Time Series Analysis, Panel Data Analysis, Statistik, Mathematik, Entscheidungs- und Spieltheorie. 2 Zur Veranstaltung Name: Mathematik für Wirtschaftswissenschaftler I. Zielgruppe: Bachelor BWL und VWL im 1. Trimester. Vorlesung: Montags, 9:45 – 11:15 Uhr in HS 1 und Montags, 14:00 – 15:30 Uhr in HS 1. Übungen: Ab 11.10.2010 (Übersicht auf der nächsten Seite). Prüfung: Klausur. Termin bitte beim Prüfungsamt erfragen. 3 Übungen Gruppe Wochentag Uhrzeit Raum Mitarbeiter 1 Montag 11:30 – 13:00 Aula 2 Dr. Schäfer 2 Montag 15:45 – 17:15 101/103 Dr. Sever 3 Montag 15:45 – 17:15 301/303 Dr. Bondarenko 4 Montag 15:45 – 17:15 Aula 2 Blendek 5 Montag 17:30 – 19:00 Aula 2 Blendek 6 Dienstag 08:00 – 09:30 108 Dr. Schäfer 7 Mittwoch 11:30 – 13:00 108 Dr. Sever 8 Donnerstag 09:45 – 11:15 204 Dr. Bondarenko 4 Inhaltsverzeichnis 1 Funktionen 1.1 Grundbegriffe 8 . . . . . . . . . . . . . . . . . . . . . 1.2 Umkehrfunktion und Verkettung 8 . . . . . . . . . . . . 33 1.3 Bivariate Funktionen . . . . . . . . . . . . . . . . . . 44 1.4 Multivariate Funktionen . . . . . . . . . . . . . . . . . 57 2 Folgen und Reihen 65 2.1 Zahlenfolgen . . . . . . . . . . . . . . . . . . . . . . 65 2.2 Reihen . . . . . . . . . . . . . . . . . . . . . . . . . 96 5 2.2.1 Die geometrische Reihe . . . . . . . . . . . . . 98 2.2.2 Finanzmathematik . . . . . . . . . . . . . . . 104 2.2.3 Konvergenzkriterien für Reihen . . . . . . . . . 118 2.3 Stetigkeit von Funktionen . . . . . . . . . . . . . . . . 127 3 Matrixalgebra 137 3.1 Elementare Matrixoperationen . . . . . . . . . . . . . 137 3.2 Die Inverse . . . . . . . . . . . . . . . . . . . . . . . 149 3.3 Die Determinante . . . . . . . . . . . . . . . . . . . 157 3.4 Vektoren . . . . . . . . . . . . . . . . . . . . . . . . 169 3.5 Lineare Gleichungssysteme 6 . . . . . . . . . . . . . . 203 Literatur • M OSLER , K., DYCKERHOFF , R. und S CHEICHER , C. (2009). Mathematische Methoden für Ökonomen. • A LLEN , R.G.D. (1972). Mathematical Economics, 2. Auflage. • C HIANG , A.C. und WAINWRIGHT, K. (2005). Fundamental Methods of Mathematical Economics, 4. Auflage. • S IMON , C.P. und B LUME , L. (1994). Mathematics for Economists. • S YDSÆTER , K. und H AMMOND, P. (2006). Mathematik für Wirtschaftswissenschaftler , 2. Auflage. • S YDSÆTER , K., H AMMOND, P., S EIERSTAD, A. und S TRØM , A. (2008). Further Mathematics for Economic Analysis, 2. Auflage. 7 1 Funktionen 1.1 Grundbegriffe • Ein Betrieb stellt einen Milchdrink aus zwei Zutaten, nämlich Vollmilch und Milchpulver, her. • Dabei entstehen aus x1 Litern Vollmilch und x2 Kilogramm Milchpulver q = 0.7x1 + 0.1x2 Liter des Drinks. • Die Anteile von Vollmilch und Milchpulver sind frei wählbar. 8 • Unter einer Isoquante versteht man den Ort aller Input-Kombinationen in der (x1 , x2 )-Ebene, mit denen eine bestimmte Menge q produziert werden kann. x2 3000 2000 1000 x1 100 200 300 400 Isoquanten einer Produktionsfunktion. 9 • Etwas allgemeiner: Ein Gut wird aus einem oder mehreren Produktionsfaktoren hergestellt. • Wenn die technischen Bedingungen der Produktion gegeben sind, hängt die produzierte Menge (Output) nur von den Mengen der eingesetzten Faktoren (Inputs) ab. • Um wie viel verändert sich der Output, wenn alle Inputs um ein Prozent erhöht werden? • Wie kann man einen Produktionsfaktor durch einen anderen ersetzen, um den selben Output zu erhalten? • Wie kann ein gegebener Output zu minimalen Kosten produziert werden? 10 Definition (Funktion): Seien A und B nichtleere Mengen. Jedem ∈ A sei genau ein Element y = f (x) ∈ B zugeordnet. Diese Zuordnung bezeichnet man als Funktion f von A nach B und Element x man schreibt formal: f: A → B x 7→ f (x) . Die Menge A wird Definitionsbereich und die Menge B wird Wertebereich von f genannt. Die Größe x bezeichnet man als Argument und f (x) als Funktionswert von f an der Stelle x . 11 • Bei den meisten uns interessierenden Funktionen ist der Funktionswert f (x) eine reelle Zahl. • Das Argument x besteht aus einer oder mehreren reellen Zahlen. • Eine solche Funktion wird kurz reelle Funktion genannt. • Im Folgenden bezeichnet R die Menge der reellen Zahlen. • Sie entspricht den Punkten der Zahlengeraden. • R2 steht für die Menge aller Paare (x1 , x2 ) von reellen Zahlen, also die Punkte der Zahlenebene. • R+ bezeichnet die Menge aller nichtnegativen reellen Zahlen und R2+ die Menge aller Paare solcher Zahlen. 12 • N steht für die Menge der natürlichen Zahlen (N = {1, 2, . . .}). • Z steht für die Menge der ganzen Zahlen (Z = {0, ±1, . . .}). • Ein abgeschlossenes Intervall der Zahlengeraden wird mit [ a, b ] und ein offenes Intervall mit ] a, b [ bezeichnet. • Halboffene Intervalle sind ] a, b ] und [ a, b [ . • Dabei sind a und b Zahlen aus R mit a < b . • Gehen Definitions- und Wertebereich klar aus dem Kontext hervor, schreibt man kurzerhand f (x) . √ • Beispiel: Die Funktion f (x) = x bezeichnet man als Wurzelfunktion und es gilt a priori A = R+ und B = R . 13 Definition (Graph und Bild): Bei einer gegebenen Funktion f : A → B wird die Menge Gf = (x, y) : x ∈ A, y = f (x) Graph von f und die Menge f (A) = y ∈ B : x ∈ A, y = f (x) Bild(-menge) von A unter f genannt. • Das Bild einer Funktion ist also eine Teilmenge ihres Wertebereichs. • Der Graph einer reellen Funktion mit einem Argument ist eine Teilmenge des R2 und wird als Kurve bezeichnet. 14 y 1 x 1 √ Graph der Wurzelfunktion f (x) = x . 15 • Zwei reelle Funktionen, deren Definitionsbereiche übereinstimmen, kann man addieren, indem man die entsprechenden Funktionswerte addiert. • Aus den beiden Funktionen f : A → R und g : A → R entsteht so die Funktion f +g : A → R x 7→ f (x) + g(x) . • Beispiel: Die Funktion h(x) = x2 − 2x + 1 ergibt sich als Summe der Funktionen f (x) = x2 und g(x) = −2x + 1 . Gemeinsamer Definitionsbereich ist hierbei R . 16 y f f +g g 1 x 1 Summe zweier Funktionen f (x) 17 = x2 und g(x) = −2x + 1 . • Ebenso kann man zwei Funktionen mit einem gemeinsamen Definitionsbereich A subtrahieren, multiplizieren und dividieren: f −g : A → R, x 7→ f (x) − g(x) , f ·g : A → R, x 7→ f (x) · g(x) , f /g : A → R, x 7→ f (x)/g(x) . • Den Quotienten f /g darf man natürlich nur unter der Voraussetzung g(x) 6= 0 für alle x ∈ A bilden. • Ansonsten muss der Definitionsbereich A geeignet eingeschränkt werden, d.h. man wählt den Definitionsbereich für f und g gerade so, dass g(x) 6= 0 für alle x ∈ A . 18 • Ähnlich sind das Minimum und das Maximum von f und g definiert: min{f, g} : A → R, max{f, g} : A → R, x 7→ min f (x), g(x) , x 7→ max f (x), g(x) . • Beispiel: Betrachte die Funktionen f (x) = x und g(x) = −x für x ∈ R . Ihr Maximum ist die für x ∈ R definierte Betragsfunktion a(x) = max{x, −x} = |x| = 19 x , falls x ≥ 0, −x , falls x < 0 . y 1 x −1 1 Betragsfunktion a(x) 20 = |x| . Beispiel:[Polynom] Eine Funktion der Form p(x) = αr xr + αr−1 xr−1 + . . . + α1 x + α0 mit Koeffizienten α0 , α1 , . . . , αr−1 ∈ R , αr 6= 0 und r ∈ N wird als Polynom r -ten Grades bezeichnet. • Die Funktion p(x) = −5x4 + x ist ein Polynom vierten Grades. • Die Quadratunktion f (x) = x2 ist ein Polynom zweiten Grades. • Die Wurzelfunktion ist jedoch kein Polynom. 21 Definition (Monotonie): Sei f : A → B mit A, B ⊂ R. Die Funktion f steigt monoton, wenn sich der Funktionswert bei jeder Erhöhung von x ebenfalls erhöht oder gleich bleibt. Formal: Wenn für alle x, x′ ∈ A die Implikation x < x′ f (x) ≤ f (x′ ) =⇒ erfüllt ist. Die Funktion f steigt streng monoton, wenn sich der Funktionswert bei jeder Erhöhung von x ebenfalls erhöht. Formal: x < x′ f (x) < f (x′ ) . =⇒ Die Funktion f fällt monoton bzw. fällt streng monoton, wenn aus x < x′ die Ungleichung f (x) ≥ f (x′ ) bzw. f (x) > f (x′ ) folgt. 22 f (x) 4 3 2 1 x -1 1 2 3 4 ∈ R wird die größte ganze Zahl ⌊x⌋ zugeordnet, die kleiner oder gleich x ist. Gauß-Klammer: Jedem x 23 • Ob eine gegebene Funktion monoton steigt oder fällt, kann man häufig direkt an ihrem Graphen ablesen. • So ist z.B. die Wurzelfunktion eine streng monoton steigende Funktion. • Die Funktion h(x) = x2 − 2x + 1 ist hingegen weder monoton steigend noch monoton fallend. • Schränkt man jedoch ihren Definitionsbereich auf das Intervall [ 1, ∞ [ ein, so erhält man eine monoton steigende Funktion. • Entsprechend liefert ihre Einschränkung auf den Definitionsbereich ] − ∞, 1 ] eine monoton fallende Funktion. 24 • Die gerade Verbindung zweier Punkte des Graphen der Wurzelfunktion liegt stets unterhalb des Graphen. • Eine solche Funktion nennt man konkav. • Beim Graphen der Quadratfunktion f (x) = x2 verhält es sich umgekehrt: Die Verbindungsstrecke von je zwei Punkten liegt oberhalb des Graphen. • Eine Funktion mit dieser Eigenschaft heißt konvex. • Sei f eine auf einem Intervall A definierte Funktion. • Nun betrachten wir zwei beliebige Punkte des Graphen von f , (x, f (x)) und (z, f (z)), als auch die Strecke, die sie verbindet. 25 • Jeder Punkt der Verbindungsstrecke hat die Form αx + (1 − α)z, αf (x) + (1 − α)f (z) mit einer Zahl α ∈ [ 0, 1 ] . A→R heißt konkav, falls für alle x, z ∈ A und für alle α ∈ ] 0, 1 [ gilt: Definition (Konvexität und Konkavität): Die Funktion f : f (αx + (1 − α)z) ≥ αf (x) + (1 − α)f (z) . Die Funktion f heißt konvex, falls für alle x, z α ∈ ] 0, 1 [ gilt: ∈ A und für alle f (αx + (1 − α)z) ≤ αf (x) + (1 − α)f (z) . 26 f (x) f (xα ) yα x z xα Definition einer konkaven Funktion. 27 x • Manche Funktionen, etwa die – Wurzelfunktion und die – Logarithmusfunktion ln (x), nehmen beliebig große und/oder kleine Werte an. • Andere dagegen nicht, z.B. der – Sinus sin(x) für alle x ∈ R und die – negativ-exponentielle Funktion f (x) = 1 − exp(−λx) , für alle x > 0. 28 λ > 0, f (x) 1 x Negativ-exponentielle Funktion mit λ 29 = 2. A → R heißt beschränkt, wenn es eine Zahl M gibt, so dass |f (x)| ≤ M für alle x ∈ A. Definition (Beschränktheit): Eine Funktion f : • Dies ist für die negativ-exponentielle Funktion mit M = 1 erfüllt, aber auch mit jeder anderen Zahl M > 1. • Die Wurzelfunktion und die Logarithmusfunktion sind dagegen nicht beschränkt. • Grund: Man betrachte eine beliebige Schranke M > 0 . Die Wurzel- bzw. Logarithmusfunktion nimmt an allen Stellen 2 x > M bzw. x > e ln (eM ) = M an. M √ Werte größer als M 2 = M bzw. 30 • Die Einschränkung der Wurzelfunktion auf ein endliches Intervall (etwa [ 0, 100 ]) ist beschränkt. Hier liegen nämlich alle √ √ Funktionswerte zwischen 0 = 0 und 100 = 10 . • Die Hyperbelfunktion 1 f (x) = x ist für alle x 6= 0 , d.h. x ∈ R \ {0}, definiert. • Sie ist nicht beschränkt, da sie für x > 0 beliebig große und für x < 0 beliebig kleine Werte annimmt. 31 1 x √ x 1 M= 10 x 1 x 100 Eingeschränkte Wurzelfunktion und Hyperbelfunktion. 32 1.2 Umkehrfunktion und Verkettung A → B eine Funktion. Diese heißt umkehrbar, wenn es für jedes y ∈ B genau ein x ∈ A gibt, für das f (x) = y gilt. Die Funktion Definition (Umkehrfunktion): Sei f : f −1 : B → A y 7→ f −1 (x) wird dann als Umkehrfunktion von f bezeichnet. • Umkehrbar bedeutet also, dass jeder Punkt des Wertebereichs einen Funktionswert darstellt und außerdem keine zwei Argumente denselben Funktionswert besitzen. 33 • Das ist insbesondere dann gegeben, wenn die Funktion in ihrem gesamten Definitionsbereich streng monoton steigt oder dort streng monoton fällt. • Wenn es eine Umkehrfunktion f −1 gibt, ist diese wiederum umkehrbar, und ihre Umkehrfunktion ist die ursprüngliche Funktion f . • Der Graph Gf einer umkehrbaren Funktion f muss für jedes y des Wertebereichs von f die horizontale Gerade der Höhe y genau einmal schneiden. • Der Graph der Umkehrfunktion ergibt sich dann durch Vertauschung der x- mit der y -Achse. 34 • Die Quadratfunktion f (x) = x2 ist umkehrbar, wenn man den Definitionsbereich und den Wertebereich auf die nichtnegativen Zahlen beschränkt. • Ihre Umkehrfunktion ist dann die Wurzelfunktion. f f −1 1 x 1 Quadratfunktion und Wurzelfunktion. 35 • Der natürliche Logarithmus ln (x) ist jene Zahl, mit der man die Eulersche Konstante e ≈ 2.71828 potenzieren muss, um x zu erhalten. • D.h. ln (x) ist gerade so definiert, dass eln (x) = x gilt. Der natürliche Logarithmus ist streng monoton steigend und umkehrbar. • Seine Umkehrfunktion ist die Exponentialfunktion ln −1 (x) = exp(x) = ex . 36 f −1 (x) = exp(x) f (x) = ln(x) x Logarithmusfunktion und Exponentialfunktion. 37 • Gegeben sei z.B. die Funktion f (x) = (x2 + 1)−1 mit x ≥ 0 . • Die Umkehrfunktion wird wie folgt bestimmt: 1 y = 2 x +1 1 = x2 + 1 y 1 − 1 = x2 y r 1 − 1 = x. y p −1 • Der Definitionsbereich von f (y) = 1/y − 1 ist durch 0 < y ≤ 1 gegeben und entspricht dem Bild von f . 38 f (x) 1 0.8 0.6 0.4 0.2 0 0 2 Ursprungsfunktion f (x) 4 6 10 8 x = (x2 + 1)−1 mit x ≥ 0 . 39 10 8 6 4 2 0 0 0.2 Umkehrfunktion f −1 (y) f −1 (y) p 0.4 = 40 y 0.6 0.8 1 1/y − 1 mit 0 < y ≤ 1 . • Das Argument einer Funktion kann selbst wiederum eine Funktion sein. • Zwei Funktionen werden verkettet, indem man die Funktionswerte der einen Funktion in die andere einsetzt. • Voraussetzung: Das Bild der ersten Funktion ist im Definitionsbereich der zweiten Funktion enthalten. • Man erhält dann eine neue Funktion, nämlich die Verkettung (oder Komposition) der beiden ursprünglichen Funktionen. 41 Definition (Verkettung): Sei f : B ∗ ⊂ B . Man definiert A → B ∗ und g : B → C mit (g ◦ f )(x) := g(f (x)) für alle x ∈ A und erhält so die Funktion g ◦ f („ g nach f “). f A g C B∗ B Verkettete Funktion g 42 ◦ f. √ • Seien f (x) = x + 1 und g(y) = y . Dann ist √ (g ◦ f )(x) = x2 + 1 2 die Funktion g nach f . • Seien h(x) = x2 (x ≥ 0) und g wie zuvor die Wurzelfunktion. Die möglichen Verkettungen sind √ x2 = x , (g ◦ h)(x) = √ 2 (h ◦ g)(y) = ( y) = y . • Es gilt also f −1 (f (x)) = x und f (f −1 (y)) = y . • Die Komposition einer Funktion mit ihrer Umkehrfunktion ist also die identische Funktion (oder Identität) id(x) = x . 43 • Die allgemeine Potenzfunktion zur Basis a > 0 ist durch ax = ex·ln (a) = exp(x ln (a)) für alle x > 0 definiert. Sie ist also die Komposition der Funktion f (x) = x ln (a) mit der Exponentialfunktion. 1.3 Bivariate Funktionen • Bisher haben wir hauptsächlich univariate Funktionen betrachtet. • Dabei handelt es sich um reelle Funktionen eines Arguments. 44 • Unter einer bivariaten Funktion versteht man eine reelle Funktion von zwei Argumenten. • Auch eine bivariate Funktion f : A → R mit A ⊂ R2 lässt sich graphisch darstellen. • Ihr Graph hat die Form Gf = (x1 , x2 , f (x1 , x2 )) : (x1 , x2 ) ∈ A , wobei A ⊂ R2 ist. • Gf ist eine Teilmenge des R3 . • Der R3 entspricht anschaulich unserem physikalischen Raum und wird daher als Anschauungsraum bezeichnet. 45 • Der Graph Gf lässt sich durch seine Höhenlinien (oder Isoquanten) beschreiben. • Die Höhenlinie Hf (y) ist der Ort aller Punkte (x1 , x2 ), welche den gleichen Funktionswert f (x1 , x2 ) = y besitzen: 2 Hf (y) = (x1 , x2 ) ∈ R : f (x1 , x2 ) = y . • Die Höhenlinie der Höhe Null ist die Menge der Nullstellen der Funktion. • An der Lage der Höhenlinien kann man das Steigungsverhalten der Funktion erkennen und feststellen, wo sich Maxima und Minima ungefähr befinden. 46 r79m r69m Bredenberg Reilerberg r74m Wulmsberg Höhenlinien einer Landkarte. 47 • Die sogenannte Cobb-Douglas-Funktion f (x1 , x2 ) = γ xα1 xβ2 mit α, β, γ > 0 wird in den Wirtschaftswissenschaften häufig als Produktions- oder Nutzenfunktion verwendet. • Eine Funktion kann wie im Falle der Cobb-Douglas-Funktion zusätzlich von Parametern abhängen. • Wählt man speziell α = 1, β = √ Funktion f (x1 , x2 ) = x1 x2 . 1 2 und γ = 1, entsteht die • Betrachtet man hierbei f (x1 , x2 ) nur in Abhängigkeit von x2 bei konstant gehaltenem x1 = 1, so erhält man die Wurzelfunktion. 48 1,0 0,75 0,5 0,25 1,0 0,0 1,0 0,75 0,75 0,5 0,5 x1 0,25 0,25 0,0 x2 0,0 √ Graph der Cobb-Douglas-Funktion f (x1 , x2 ) = x1 x2 . 49 Beispiel: Die bivariate Funktion (x1 + 2)2 (x2 + 1)2 + −1 f (x1 , x2 ) = 4 9 ist auf R2 definiert. • Die Menge der Nullstellen von f , 2 2 (x1 + 2) (x2 + 1) (x1 , x2 ) : + −1=0 , 4 9 ist eine Ellipse um (−2, −1) mit Hauptachsen der Länge 2 bzw. 3, die zu den Koordinatenachsen parallel verlaufen. 50 -0,6 -0,7 -0,8 -0,9 -1,0 -3 -2 -1 x2 0 1 -4 Graph der Funktion f (x1 , x2 ) 51 = -3 -2 -1 0 x1 (x1 +2)2 4 + (x2 +1)2 9 − 1. x2 f (x1 , x2 ) = 0 x1 Höhenlinien der Funktion f (x1 , x2 ) 52 = (x1 +2)2 4 + (x2 +1)2 9 − 1. • Man betrachte die drei Funktionen f (x1 , x2 ) = x1 x2 , g(x1 , x2 ) = x1 + x2 , h(x1 , x2 ) = min{x1 , x2 } mit x1 , x2 ≥ 0. • Alle drei Funktionen nehmen an der Stelle (x1 , x2 ) = (0, 0) ihren kleinsten Wert an. 53 x2 x2 x2 4 3 2 1 5 4 3 2 1 4 3 2 1 x1 x1 1 2 3 4 1 2 3 4 4 4 3 3 3 0 1,5 4 0,5 0,0 0,5 1,0 x2 1,5 2,0 0,0 2,0 1,5 1 1,0 x1 3 0 2 2,0 1,5 1 1,0 x1 2 0 2 2,0 1 3 1 2 3 4 5 4 2 4 x1 4 0,5 2 0,5 1,0 x2 1,5 2,0 0,0 2,0 1,5 1 1,0 x1 1,5 1 1,0 x1 0,0 2,0 3 0 1,0 x1 0,5 0,0 2 0,5 1,0 x2 1,5 0,5 0,5 1,0 x2 1,5 2,0 0,0 0 0,5 0,0 0,5 1,0 x2 1,5 54 2,0 0,0 0 0,0 2,0 1,5 1 1,0 x1 Höhenlinien der Funktionen f , g und h . 0,0 2,0 0,0 0,5 0,5 1,0 x2 1,5 2,0 0,0 Definition (Monotonie): Eine bivariate reelle Funktion steigt monoton, wenn sie bezüglich jedes Arguments monoton steigt (wobei das jeweils andere Argument konstant gehalten wird). Sie steigt streng monoton, wenn sie bezüglich jedes Arguments streng monoton steigt. Entsprechend sagt man, die Funktion fällt (streng) monoton, wenn sie bezüglich der einzelnen Argumente (streng) monoton fällt. • Die Funktionen f (x1 , x2 ) = x1 x2 und g(x1 , x2 ) = x1 + x2 sind streng monoton steigend. • Die Funktion h(x1 , x2 ) = min{x1 , x2 } ist hingegen nur monoton, jedoch nicht streng monoton steigend. 55 Definition (Konvexität und Konkavität): Eine bivariate reelle Funktion heißt konkav, wenn die gerade Verbindungslinie zweier Punkte ihres Graphen stets unterhalb des Graphen liegt. Die Funktion heißt konvex, wenn diese Verbindungslinie stets oberhalb des Graphen liegt. • Die Funktion (x1 + 2)2 (x2 + 1)2 f (x1 , x2 ) = + −1 4 9 ist konvex. • Die Funktionen f (x1 , x2 ) = x1 x2 und h(x1 , x2 ) = min{x1 , x2 } sind hingegen konkav. 56 1.4 Multivariate Funktionen • Die in ökonomischen Modellen auftretenden Funktionen sind häufig Funktionen von mehr als zwei Argumenten. • Beispiel: Die Produktion eines Gutes erfordert den Einsatz von n Faktoren, wobei n eine beliebige natürliche Zahl darstellt. • Eine solche reelle Funktion von mehreren Argumenten bezeichnet man als multivariate Funktion. • Analog zu den Punkten (x1 , x2 ) im R2 und (x1 , x2 , x3 ) im R3 fasst man n reelle Zahlen gemeinsam als Punkt auf. 57 • Man bezeichnet die Menge aller solchen Punkte als n-dimensionalen Euklidischen Raum Rn : Rn = {(x1 , x2 , . . . , xn ) : xi ∈ R , i = 1, 2, . . . , n} . • Eine reelle Funktion mit n Argumenten hat als Definitionsbereich eine Teilmenge A ⊂ Rn , d.h. f: A → R (x1 , . . . , xn ) 7→ y = f (x1 , . . . , xn ) . • Ökonomische Variablen sind meist positiv (z.B. Mengen, Preise, Lagerbestände, etc.). 58 • Darum tritt der nichtnegative Orthant des Rn , d.h. Rn+ = {(x1 , x2 , . . . , xn ) ∈ Rn : xi ≥ 0, i = 1, 2, . . . , n} als Definitionsbereich zahlreicher n-variater ökonomischer Funktionen auf. • Häufig ist jede einzelne Komponente xi auf ein offenes Intervall ] ai , bi [ beschränkt. • Dann bilden die entsprechenden Punkte ein offenes n-dimensionales Intervall der Form ] a, b [ = ] a1 , b1 [ × · · · × ] an , bn [ . 59 • Analog bildet man n-dimensionale abgeschlossene und halboffene Intervalle. • Solche Intervalle können endlich oder unendlich sein. Z.B. stellen Rn und ebenso Rn+ Intervalle dar. 2 b2 a2 1 a1 b1 Zweidimensionales abgeschlossenes Intervall. 60 • Die allgemeine Form der Cobb-Douglas-Funktion lautet f (x1 , x2 , . . . , xn ) = γxα1 1 xα2 2 · . . . · xnαn mit (x1 , x2 , . . . , xn ) ∈ Rn+ und γ, α1 , . . . , αn > 0 . • Sei f (x1 , . . . , xn ) der Nutzen, den ein Konsument aus den Mengen x1 des Gutes 1 bis xn des Gutes n erzielt. Eine spezielle Nutzenfunktion ist die additiv-logarithmische Funktion f (x1 , . . . , xn ) = b1 ln (x1 ) + . . . + bn ln (xn ) mit (x1 , x2 , . . . , xn ) ∈ Rn+ und b1 , . . . , bn > 0 . • Es gilt f (x1 , . . . , xn ) = ln (xb11 · . . . · xbnn ). Also ist diese Nutzenfunktion eine logarithmierte Cobb-Douglas-Funktion. 61 Definition (Monotonie): Eine reelle Funktion von mehreren Argumenten steigt bzw. fällt (streng) monoton, wenn sie bezüglich jeder einzelnen Argumente (streng) monoton steigt bzw. fällt (wobei die jeweils anderen Argumente konstant gehalten werden). • Die Cobb-Douglas-Funktion ist offenbar streng monoton steigend. • Sie nimmt ihr Minimum bei (x1 , x2 , . . . , xn ) = (0, 0, . . . , 0) an. • Ein Maximum existiert hingegen nicht. • Die Isoquante zu einem vorgegebenen Output q besteht aus allen Input-Bündeln (x1 , x2 , . . . , xn ), mit denen der Output q erzielt werden kann. 62 5 5 4 4 3 3 5 2 4 3 1 2 0 0 2 3 x2 4 5 4 3 1 x1 0 1 1 5 2 0 2 0 1 1 2 3 x2 4 5 0 √ √ Graph der Cobb-Douglas-Funktion f (x1 , x2 ) = x1 x2 (links) und der Nutzenfunktion f (x1 , x2 ) = ln (x1 ) + ln (x2 ) (rechts). 63 x1 Wiederholung • Funktionen • Treppenfunktionen, beschränkte Funktionen • Monoton steigende und fallende Funktionen • Konvexe und konkave Funktionen • Umkehrung und Verkettung von Funktionen • Exponentialfunktion, Logarithmus • Bivariate und multivariate Funktionen • Höhenlinien einer bivariaten Funktion • Cobb-Douglas-Funktion 64 2 Folgen und Reihen 2.1 Zahlenfolgen • Das Spinnwebmodell (Englisch: Cobweb Model) beschreibt die wechselseitige Anpassung von Angebot und Nachfrage auf einem Gütermarkt. • Es handelt sich um ein dynamisches Periodenmodell für den Preis und die Menge des Gutes. • Der Hersteller des Gutes bestimmt in jeder Periode den Preis. • Der Preis des Gutes in Periode n ∈ N wird mit pn bezeichnet. • Gegeben sei zunächst ein Startpreis p0 . 65 • Die Nachfrage in Periode 0 hänge nun linear von p0 ab. Genauer: Es gelte q0 = a + bp0 mit b < 0 . • Darüber hinaus gelte qn = a + bpn in jeder Periode n ∈ N . • Der Produzent passt den Preis in der darauf folgenden Periode anhand der Formel p1 = c + dq0 mit d > 0 an. • Allgemein stellt sich der Preis in jeder Periode n ∈ N gemäß pn = c + dqn−1 ein. • Er reagiert also stets mit einer zeitlichen Verzögerung (Lag) von einer Periode. 66 • Setzt man die Nachfragegleichung qn = a + bpn in die Angebotsgleichung pn = c + dqn−1 ein, so erhält man die Rekursionsgleichung pn = c + d(a + bpn−1 ) = c + ad + bdpn−1 = α + βpn−1 mit α = c + ad und β = bd . • Ersetzt man nun pn−1 durch α + βpn−2 , so ergibt sich pn = α + β(α + βpn−2 ) = α + αβ + β 2 pn−2 . 67 • Wiederholt man diesen Vorgang so lange, bis auf der rechten Seite der Startpreis p0 erscheint, erhält man pn = α + αβ + . . . + αβ n−1 + β n p0 ! n n X α X i i−1 n β − 1 + β n p0 . = α β + β p0 = β i=0 i=1 • Daraus ergeben sich nun z.B. folgende Fragen: 1. Unter welchen Bedingungen „strebt der Preis pn mit fortschreitender Zeit n gegen einen Gleichgewichtspreis“? 2. Welcher Preis stellt sich im Gleichgewicht ein? 3. Hängt dieser Gleichgewichtspreis vom Startwert p0 ab? 68 Definition (Folge): Eine Funktion N → R, n 7→ an , heißt Zahlenfolge oder kurz Folge in R. Als Symbol für die Folge schreibt man {an }n∈N oder auch kurz {an }. Die Zahl an wird als n-tes Folgenglied bezeichnet. a) 1, 4, 9, 16, . . . , d.h. an = n2 . b) −1, 1, −1, 1, −1, 1, . . . , d.h. an = (−1)n . c) 1 , . . . , d.h. an = 1, 41 , 19 , 16 1 n2 . {β n p0 } mit β ∈ R und p0 > 0 . Pn e) { i=0 β i } mit β ∈ R . d) 69 • Die Folge {1/n} = 1, 12 , 31 , 14 , . . . „konvergiert“ oder „strebt“ gegen Null. 1 • Gleiches gilt z.B. auch für die Folge {2−n } = 12 , 14 , 18 , 16 ,.... • Es ist zunächst nicht eindeutig klar, was es bedeutet, dass eine Folge einen „Grenzwert“ (z.B. Null) besitzt. • D.h. die Begriffe Konvergenz und Grenzwert müssen zunächst präzise definiert werden. 70 Definition (Konvergenz): Eine Folge {an }n∈N reeller Zahlen konvergiert gegen eine reelle Zahl a , wenn es für jedes beliebig gewählte ε > 0 eine Zahl Nε ∈ N gibt, so dass |an − a| < ε für alle n ≥ Nε . Die Zahl a heißt dann Grenzwert der Folge und man schreibt limn→∞ an = a oder kurz lim an = a . Weitere Schreibweisen sind n→∞ an −−−→ a oder auch einfach nur an → a . Eine Folge {an }n∈N heißt konvergent, wenn sie gegen eine reelle Zahl a konvergiert. Eine Folge heißt divergent, wenn sie nicht konvergent ist. Eine Folge mit Grenzwert Null nennt man Nullfolge. 71 • Ob eine Folge konvergent ist oder nicht, hängt nicht davon ab, welche Werte die ersten Folgenglieder haben, sondern nur davon, wie sich die späteren Folgenglieder „verhalten“. • Ändert man also bei einer konvergenten Folge mit Grenzwert a z.B. die ersten zehn Folgenglieder ab, so ist die entstehende Folge nach wie vor konvergent gegen a . • Allgemein kann man bei einer Folge eine endliche Anzahl von Folgengliedern ändern, ohne dass sich das Konvergenzverhalten dieser Folge ändert. 72 an 1.0 0.5 a+ε n a−ε -0.5 -1.0 Zwei konvergente Folgen. 73 • Bei einfachen Folgen lässt sich mit Hilfe dieser Definition nachweisen, dass diese einen bestimmten Grenzwert besitzt. • Dazu muss man allerdings den möglichen Grenzwert kennen oder zumindest vermuten. • Bei komplizierteren Folgen ermittelt man den Grenzwert mit Hilfe von Rechenregeln, die später erläutert werden. Beispiel: Wir betrachten die Folge { n1 } = 1, 12 , 13 , . . . . Wie bereits erwähnt, konvergiert diese Folge gegen Null. Um das zu beweisen, muss man zeigen, dass zu jedem ε dass > 0 eine Zahl Nε existiert, so 1 − 0 < ε für alle n ≥ Nε . n 74 Es gilt 1 − 0 = 1 = 1 . n n n D.h. n1 < ε genau dann, wenn n > 1/ε . Wählt man also Nε als die kleinste natürliche Zahl, die größer als 1/ε ist, so erfüllt dieses Nε gerade unsere Forderung. Z.B. ist für ε = 0.1 die gesuchte Zahl Nε = 11. Ab dieser Zahl haben alle weiteren Folgenglieder einen kleineren Abstand als 0.1 von Null. Für ε = 0.000001 ist das gesuchte Nǫ = 1000001. Ab dieser Zahl haben alle Folgenglieder einen Abstand von Null, der geringer als 0.000001 ist. 75 • Die Folge {n} = 1, 2, 3, . . . konvergiert offenbar nicht. • Die Folgenglieder werden immer größer und übersteigen schließlich jede beliebig vorgegebene reelle Zahl. • Eine solche Folge nennt man bestimmt divergent. 76 Definition (Bestimmte Divergenz): Eine Folge {an }n∈N heißt bestimmt divergent gegen ∞, wenn es zu jeder reellen Zahl M eine Zahl NM ∈ N gibt, so dass an > M für alle n ≥ NM . Sie heißt bestimmt divergent gegen −∞, wenn es zu jeder reellen Zahl M eine Zahl NM gibt, so dass an < M für alle n ≥ NM . Ist {an }n∈N bestimmt divergent gegen ∞, so schreibt man n→∞ limn→∞ an = ∞ , lim an = ∞ , an −−−→ ∞ oder auch einfach nur an → ∞ . Entsprechende Schreibweisen verwendet man für Folgen, welche bestimmt gegen −∞ divergieren. 77 • Diese Schreibweise soll nicht darüber hinweg täuschen, dass solche Folgen nicht konvergieren! • Insofern kann ∞ bzw. −∞ nicht als Grenzwert einer bestimmt divergenten Folge angesehen werden. • Da Folgen nichts anderes als Funktionen von N nach R sind, kann man die Begriffe Beschränktheit und Monotonie unmittelbar auf Folgen übertragen. • Eine Folge {an }n∈N ist also beschränkt, wenn es eine reelle Zahl M gibt, so dass |an | ≤ M für alle n ∈ N. • Eine Folge {an }n∈N heißt monoton steigend, wenn an ≤ an+1 für alle n ∈ N gilt. 78 • Entsprechend sind monoton fallende Folgen definiert. • Eine Folge heißt monoton, wenn sie monoton steigt oder monoton fällt. Satz 1 (Konvergenz und Beschränktheit I) Jede konvergente Folge reeller Zahlen ist beschränkt. • Der Umkehrschluss gilt nicht, d.h. nicht jede beschränkte Folge reeller Zahlen ist konvergent! • Man betrachte z.B. die Folge {(−1)n } = −1, 1, −1, 1, . . . . • Diese Folge springt zwischen den Punkten −1 und +1 hin und her. Es handelt sich um eine sogenannte alternierende Folge. 79 • Wenn eine beschränkte Folge monoton steigt, so werden die Folgenglieder immer größer (oder zumindest nicht kleiner). • Nach oben hin ist dann nicht mehr genug Platz, so dass sich die Folgenglieder schließlich bei einem Wert a ≤ M häufen müssen. Satz 2 (Konvergenz und Beschränktheit II) Jede beschränkte und monotone Folge reeller Zahlen ist also konvergent. 80 an M a n 1 2 3 4 5 6 7 8 9 10 11 12 −M Eine beschränkte, monoton steigende Folge, die gegen a konvergiert. 81 Beispiel: Man betrachte die geometrische Folge {q n }. < 1): In diesem Fall ist die Folge {q n } konvergent und es gilt limn→∞ q n = 0 . Fall 1 (|q| Fall 2 (q = 1): Dann ist q n = 1 für alle n ∈ N. Die Folge ist also konvergent mit Grenzwert Eins. = −1): Die Folge ist divergent und nimmt abwechselnd die Werte 1 und −1 an. Fall 3 (q Fall 4 (q > 1): Die Folge ist bestimmt divergent gegen ∞ . Fall 5 (q < −1): Die Folge ist unbestimmt divergent. Sie ist unbeschränkt mit alternierendem Vorzeichen. 82 (0.5)n 1 0.5 0 1500 1000 500 0 0 0 5 5 n 10 10 (−1)n 1 0 -1 2000 1000 0 0 0 -1000 (−2)n 83 5 n 5 10 10 Die vier nicht-trivialen Fälle einer geometrischen Folge. 2n Satz 3 (Einschließungskriterium) Seien {an }, {bn } und {cn } Folgen in R, so dass limn→∞ an eine Zahl N0 , so dass = limn→∞ cn = x ∈ R. Existiert an ≤ bn ≤ cn so gilt auch limn→∞ bn für alle n ≥ N0 , = x. • Man sagt, die Folge {bn } wird von den Folgen {an } und {cn } eingeschlossen. • Mit diesem Einschließungskriterium kann man die Konvergenz von Folgen nachweisen und deren Grenzwert bestimmen. 84 Beispiel: Man betrachte die Folge {bn } mit bn = 2−n . Zu zeigen ist, dass {bn } eine Nullfolge ist. Zu diesem Zweck werden zwei Folgen {an } und {cn } gesucht, von denen man bereits weiß, dass 1. diese gegen Null konvergieren und 2. an ≤ bn ≤ cn für alle hinreichend großen n ∈ N gilt. Man mache sich klar, dass 1 1 für alle n ∈ N . 0≤ n ≤ 2 n D.h. mit an = 0 und cn = n−1 folgt limn→∞ 2−n = 0 . 85 Satz 4 (Grenzwert einer arithmetischen Operation I) Seien {an } und {bn } zwei konvergente Folgen mit lim an = a n→∞ und lim bn = b . n→∞ Dann gilt (i) limn→∞ (an + bn ) = a + b , (ii) limn→∞ (an − bn ) = a − b , (iii) limn→∞ (an · bn ) = a · b und (iv) limn→∞ (an /bn ) = a/b , sofern b 6= 0 . 86 Satz 5 (Grenzwert einer arithmetischen Operation II) Seien {an } und {bn } zwei Folgen mit lim an = ∞ n→∞ und lim bn = b . n→∞ Dann gilt (i) limn→∞ (an + bn ) = ∞ , (ii) limn→∞ (an − bn ) = ∞ , (iii) limn→∞ (an · bn ) = sign(b) ∞ für b 6= 0 und (iv) limn→∞ (an /bn ) = sign(b) ∞ für b 6= 0 . 87 Satz 6 (Grenzwert einer arithmetischen Operation III) Seien {an } und {bn } zwei Folgen mit lim an = a n→∞ und lim bn = ∞ . n→∞ Dann gilt (i) limn→∞ (an + bn ) = ∞ , (ii) limn→∞ (an − bn ) = −∞ , (iii) limn→∞ (an · bn ) = sign(a) ∞ für a 6= 0 und (iv) limn→∞ (an /bn ) = 0 für b 6= 0 . 88 Beispiel: Zu bestimmen sei der Grenzwert der Folge {an } mit 5 7 1 1 1 an = − 10 + √ = 5 · · n − 10 − 7 · √ . n n2 n 2 n n Wegen 1 lim = 0 , n→∞ n 1 lim n = 0 und n→∞ 2 1 lim √ = 0 n→∞ n erhält man lim an = 5 · 0 · 0 − 10 − 7 · 0 = −10 . n→∞ 89 Beispiel: Gesucht ist nun der Grenzwert der Folge {an } mit 6n5 − 3n 6 − 3n−4 . an = √ = −9/2 −5 5 n +n −2 n + 1 − 2n Jetzt befinden sich im Zähler und Nenner konvergente Folgen und man erhält 6−0 lim an = = −3 . n→∞ 0+0−2 Achtung: Die Sätze über die Konvergenz arithmetischer Operationen setzen voraus, dass {an } oder {bn } konvergieren! Falls {an } und {bn } divergieren, kann keine allgemeine Aussage getroffen werden. 90 Beispiele • Gegeben seien {an } und {bn } mit an = 2n und bn = n . Es gilt offenbar an → ∞ und bn → ∞ . Man erhält jedoch nicht etwa „ ∞ − ∞ = 0 “ als Grenzwert, sondern an − bn = 2n − n = n → ∞ . • Nun seien {an } und {bn } gegeben durch an = (−1)n und bn = (−1)n−1 . Beide Folgen divergieren, jedoch gilt nun an + bn = (−1)n + (−1)n−1 = (1 + (−1)−1 )(−1)n = (1 − 1)(−1)n = 0 d.h. {an − bn } ist tatsächlich eine Nullfolge. 91 Proposition 1 Seien {an } und {bn } zwei Folgen. Ist {an } eine Nullfolge und {bn } beschränkt, so ist auch {an bn } eine Nullfolge. • Wenn {an } eine Nullfolge, jedoch {bn } nicht beschränkt ist, kann man über die Konvergenz der Folge {an bn } keine allgemeine Aussage treffen. • Ob die Folge {an bn } konvergiert oder nicht, hängt davon ab, ob „{an } schneller gegen Null, als {bn } gegen unendlich geht“. • Sei z.B. an = 1/n2 und damit {an } eine Nullfolge. Ferner sei bn = n , {bn } also unbeschränkt. Dann gilt an bn = 1/n → 0 . • Für alle bn = nk mit k > 2 erhält man hingegen an bn → ∞ . 92 Definition (Asymptotische Äquivalenz): Zwei Folgen {an } und {bn } sind asymptotisch äquivalent (kurz: an ∼ bn ), falls an = 1. lim n→∞ bn √ Beispiel: Man betrachte −2n + n − 2 ∼ −2n2 und 1/n − n2 ∼ −n2 . Daraus folgt √ √ 2 2 2 −2n (−2n + n − 2)/(−2n2 ) −2n + n − 2 = → 2. 2 2 2 2 1/n − n −n (1/n − n )/(−n ) | {z } 2 →1 Die Terme mit der höchsten Potenz bestimmen also das Konvergenzverhalten der Quotientenfolge. 93 Satz 7 (Cauchy-Kriterium) Eine Folge {an } konvergiert genau dann, wenn es für jedes ε > 0 eine natürliche Zahl Nε gibt, so dass |am − an | < ε für alle m, n ≥ Nε . • Das Cauchy-Kriterium ist eine notwendige und hinreichende Bedingung für die Konvergenz einer Folge. • D.h. dieses Kriterium muss zwangsläufig erfüllt sein, damit eine Folge {an } konvergiert. • Umgekehrt garantiert dieses Kriterium die Konvergenz von {an } . • Mit Hilfe des Cauchy-Kriteriums kann man die Konvergenz einer Folge nachweisen, ohne ihren Grenzwert zu kennen. 94 • Nun betrachten wir wieder das Spinnweb-Modell. • Zur Erinnerung: Der Güterpreis in Periode n ∈ N beträgt ! n α X i pn = β − 1 + β n p0 . β i=0 • Bei {β n p0 } handelt es sich um eine geometrische Folge. Diese konvergiert gegen Null, falls |β| < 1 . • In diesem Fall hängt der Grenzwert von {β n p0 } also nicht vom Startpreis p0 ab. • Zu klären ist nun noch die Frage, gegen welchen Wert Pn i gegebenenfalls {α/β β − 1} konvergiert. i=0 95 2.2 Reihen Definition (Reihe): Sei {an } eine Folge reeller Zahlen. Die Größe sn = a1 + a2 + . . . + an = n X ai . i=1 heißt n-te Partialsumme der Folge {an }. Die Folge {sn } der Partialsummen heißt Reihe. Konvergiert diese Reihe gegen eine reelle Zahl s , so schreibt man s = lim n→∞ n X i=1 ai = ∞ X ai i=1 für den Grenzwert. 96 • Wenn die untere Summationsgrenze einer Reihe nicht gleich Eins ist (d.h. i 6= 1), so lässt sich eine Partialsumme stets in eine äquivalente Darstellung mit i = 1 überführen. • Beispiel: n n X X 1 1 1 = − . i i 2 2 2 i=1 i=2 • Aus diesem Grund spricht man unabhängig von der gewählten Summationsgrenze immer von einer Reihe. Pn i • Ein typisches Beispiel ist die geometrische Reihe { i=0 q } mit q ∈ R . 97 2.2.1 Die geometrische Reihe • Um das Konvergenzverhalten der geometrischen Reihe zu bestimmen, untersuchen wir zunächst die Partialsummen n X qi = 1 + q + q2 + . . . + qn . i=0 • Es gilt (1 − q) n X q i = 1 + q + q 2 + . . . + q n−1 + q n i=0 − q − q 2 − . . . − q n−1 − q n − q n+1 = 1 − q n+1 . 98 • Daraus folgt n X i=0 1 − q n+1 , = 1−q q 6= 1 . • Man bezeichnet diese Gleichung als Summenformel für die geometrische Reihe. • Mit Hilfe der Summenformel lässt sich das Konvergenzverhalten der geometrischen Reihe untersuchen. • Ist |q| < 1, so erhält man mit den bekannten Rechenregeln für Grenzwerte lim n→∞ n X i=0 1 − q n+1 1 − lim q n+1 1 q = lim = = . n→∞ 1 − q 1−q 1−q i 99 • Das vorhergehende Resultat ist nur für |q| < 1 gültig! • Für |q| ≥ 1 divergiert die geometrische Reihe. • Das folgt aus den bereits bekannten Eigenschaften für geometrische Folgen. • Gelegentlich ist die untere Summationsgrenze der geometrischen Reihe nicht Null, sondern Eins. • Man erhält dann die alternativen Formeln n X i=1 falls |q| n+1 q − q qi = 1−q und ∞ X i=1 < 1. 100 q q = 1−q i • Das lässt sich wie folgt zeigen: n X qi = i=1 und weiterhin n X i=0 n+1 n+1 1 − q q − q qi − 1 = −1= 1−q 1−q 1 − qn 1 q q − q n+1 =q· −→ q · = . 1−q 1−q 1−q 1−q • Zur Erinnerung: Der Güterpreis in Periode n ∈ N beträgt ! n α X i pn = β − 1 + β n p0 . β i=0 • Die geometrische Folge {β n p0 } konvergiert im Fall |β| < 1 gegen Null. 101 Pn • Offenbar ist { i=0 β i } eine geometrische Reihe und besitzt den Grenzwert lim n→∞ n X i=0 1 β = . 1−β i • Das bedeutet, der Güterpreis pn strebt mit fortschreitender Zeit gegen den Wert n X ! α p = lim β i − 1 + β n p0 n→∞ β i=0 α 1 α = −1 = . β 1−β 1−β • Wenn wir vorher gewusst hätten, dass {pn } konvergiert, hätten wir den Grenzwert einfacher ausrechnen können. 102 • Man erinnere sich, dass pn = α + βpn−1 . • Da sich pn und pn−1 für große n ∈ N nicht mehr wesentlich vom Grenzwert p unterscheiden, folgt daraus α p = α + βp =⇒ p= . 1−β • Ergo: 1. Der Preis pn strebt gegen einen Gleichgewichtspreis p genau dann, wenn |β| < 1. 2. Der Gleichgewichtspreis beträgt p = α/(1 − β). 3. Ferner hängt dieser nicht vom Startpreis p0 ab. 103 2.2.2 Finanzmathematik • Ein Konto habe ein Anfangsguthaben von K0 ∈ R . • Das Konto wird über n Perioden verzinst. • Dabei kann eine solche Periode ein Jahr, ein Quartal, ein Monat oder auch nur ein Tag sein. • Innerhalb einer Periode erfolgen keine Ein- oder Auszahlungen, sondern lediglich am Ende einer Periode. • Dann bezeichne Zi die Höhe der Ein- oder Auszahlung am Ende der i-ten Periode. • Das Guthaben am Ende der i-ten Periode inklusive der Ein- oder Auszahlungen und etwaiger Zinszahlungen sei Ki . 104 • Der Zinssatz pro Periode sei p , d.h. ein Zinssatz von p = 0.08 entspricht einer Verzinsung von 8%. • Der Zinssatz bleibe in allen Perioden gleich. • Insgesamt verwenden wir also die folgenden Bezeichnungen: K0 Anfangsguthaben, n Anzahl der Perioden, Zi Ein- bzw. Auszahlung am Ende der i-ten Periode, Ki Guthaben am Ende der i-ten Periode, p Zinssatz. • Bei der nachschüssigen Verzinsung werden dem Konto am Ende jeder Periode Zinsen gutgeschrieben. 105 • Die Zinszahlung erfolgt hierbei anhand des zu Beginn der Periode vorhandenen Guthabens. • Die Zinsen werden in den folgenden Perioden mit dem Konto verzinst (Zinseszinsen). • Neben der nachschüssigen Verzinsung gibt es auch die – in der Praxis sehr selten angewandte – vorschüssige Verzinsung. • Hierbei werden die Zinsen auf das vorhandene Guthaben bereits zu Beginn einer Periode gutgeschrieben. 106 • Bei nachschüssiger Verzinsung setzt sich somit das Guthaben am Ende der ersten Periode aus dem Anfangsguthaben K0 , der Zinszahlung pK0 und der Einzahlung Z1 zusammen: K1 = K0 + pK0 + Z1 = (1 + p)K0 + Z1 . • Entsprechend gilt für die i-ten Periode: Ki = (1 + p)Ki−1 + Zi . • Die allgemeine Zinseszinsformel lautet nun n X Kn = (1 + p)n K0 + (1 + p)n−i Zi . i=1 • Der Faktor 1 + p heißt Aufzinsungsfaktor. 107 • Gegeben sei eine Menge von Zahlungen Z1 , . . . , Zn . • Nach Ablauf von n Perioden soll eine Schuld W durch diese Zahlungen vollständig getilgt sein, d.h. Kn = 0 gelten. • Gesucht ist nun der Wert der Anfangsschuld W , die durch die Zahlungen vollständig getilgt wird. • Setzt man K0 = −W und Kn = 0 in die Zinseszinsformel ein, so erhält man n X 0 = −(1 + p)n W + (1 + p)n−i Zi . i=1 108 • Auflösen dieser Gleichung nach W ergibt dann n n X X W = (1 + p)−n (1 + p)n−i Zi = (1 + p)−i Zi . i=1 i=1 • Man erhält also die Barwertformel n X Zi . W = i (1 + p) i=1 • Der Faktor 1/(1 + p) heißt Abzinsungsfaktor oder Diskontierungsfaktor und der Wert W wird als Barwert der Zahlungsreihe Z1 , . . . , Zn bezeichnet. • Der Barwert einer Zahlungsreihe kann je nach Sichtweise unterschiedlich interpretiert werden. 109 • Aus der Sicht eines Gläubigers ist W derjenige Kredit, der durch die Zahlungen Z1 , . . . , Zn abgetragen wird. • Aus der Sicht eines Investors ist W der Wert einer Investition, welche die Einzahlungen Z1 , . . . , Zn erwirtschaftet. • Aus Sicht eines Rentenbeziehers wird W als Barwert der künftigen Rentenzahlungen Z1 , . . . , Zn interpretiert. • Der Barwert einer Einzahlung Zn , welche erst in Zeitpunkt n erfolgt, beträgt Zn W = . n (1 + p) 110 • Beispiel: Der Barwert von 10000 E in fünf Jahren, bei einem Zinssatz von 6%, beträgt 10000 E = 7472.58 E . W = 5 1.06 • Eine Rente besteht aus gleich bleibenden Einzahlungen der Höhe R am Ende der Perioden 1, . . . , n . • Der Barwert einer solchen Rente beträgt i n X 1 W = R= 1+p i=1 1 1+p − 1− 1 1+p n+1 1 1+p ·R. • Das folgt aus der Summenformel für die geometrische Reihe, indem man q = 1/(1 + p) setzt. 111 • Durch eine Erweiterung mit 1 + p erhält man die etwas kompaktere Formel n R 1 W = 1− . p 1+p • Der Ausdruck in der Klammer ist kleiner als Eins, d.h. W < R/p . 112 Beispiel • Gegeben sei eine monatliche Rente in Höhe von 1000 E. • Die Laufzeit betrage sechs Jahre bei einem jährlichen Zinssatz von 6%. • D.h. R = 1000, p = 0.06/12 = 0.005 und n = 6 · 12 = 72 . • Daraus ergibt sich als Barwert 1000 E 1 W = 1− = 60339.51 E . 72 0.005 1.005 113 • Nun soll eine Schuld W innerhalb von n Perioden vollständig durch eine gleich bleibende Zahlung der Höhe A am Ende jeder Periode getilgt werden. • Der Betrag A wird Annuität genannt und man bezeichnet den entsprechenden Kredit als Annuitätendarlehen. • Um zu bestimmen, wie hoch die Annuität sein muss, setzt man in die Barwertformel alle Zahlungen Z1 = . . . = Zn gleich A. • Daraus ergibt sich der Rentenbarwert n A 1 1− W = . p 1+p 114 • Stellt man diese nach A um, so ergibt sich pW A= n . 1 − (1/(1 + p)) • Beispiel: Es soll eine Schuld in Höhe von 100000 E bei einem Zinssatz von 7% in 25 Jahren getilgt werden. Die Annuität beträgt dann 0.07 · 100000 E A= 25 = 8581.05 E . 1 − (1/1.07) • Sind die Schuld W , der Zinssatz p und die Annuität A gegeben, so lässt sich die (Rest-)Laufzeit des Annuitätendarlehens berechnen. • Dazu löst man die Barwertformel nach n auf. 115 • Zunächst erhält man 1 1+p n pW =1− . A • Logarithmieren liefert nun 1 pW n ln = ln 1 − 1+p A und schließlich ln (1 − pW/A) n= . ln (1/(1 + p)) 116 Beispiel Jahr Restschuld Zinsen Tilgung Annuität 1 100000 7000 1581.05 8581.05 2 98418.95 6889.33 1691.72 8581.05 3 .. . 96727.23 .. . 6770.91 .. . 1810.14 .. . 8581.05 .. . 25 8019.67 561.38 8019.67 8581.05 Tilgungsplan 117 2.2.3 Konvergenzkriterien für Reihen • In den meisten Fällen lassen sich für Reihen keine geschlossenen Ausdrücke finden, wie etwa im Beispiel der geometrischen Reihe. • Im Folgenden werden Kriterien vorgestellt, anhand derer man gegebenenfalls überprüfen kann, ob eine Reihe konvergiert. Satz 8 (Notwendige Bedingung für die Konvergenz einer Reihe) Pn Wenn { i=1 ai } konvergent ist, dann ist {an } eine Nullfolge. Pn • D.h. { i=1 ai } kann nicht konvergieren, wenn an 9 0 . • Mit Satz 8 kann lediglich gezeigt werden, dass eine gegebene Reihe nicht konvergiert. 118 • Beispiel: Gegeben sei die Folge {an } mit an = 1 + 1/n → 1 . Pn Die Reihe { i=1 (1 + 1/i)} kann also nicht konvergieren. • Achtung: Der Umkehrschluss ist nicht erlaubt! • Beispiel: Aus 1/n → 0 folgt nicht etwa, dass die sogenannte Pn harmonische Reihe { i=1 1/i} konvergiert. Pn • Aus dem Cauchy-Kriterium folgt unmittelbar, dass { i=1 ai } genau dann konvergiert, wenn für jedes ε > 0 , m m n X X X ai < ε ai − ai = i=1 für alle m i=1 i=n+1 > n ≥ Nε ab einem hinreichend großen Nε . 119 Pn Beispiel: Man betrachte die harmonische Reihe, d.h. { i=1 1/i} und beachte, dass 2 X 1 i=2 i 4 X 1 i=3 i 8 X 1 i=5 i 16 X 1 i=9 i 1 = , 2 1 1 1 = + ≥ , 3 4 2 1 1 1 1 1 = + + + ≥ , 5 6 7 8 2 1 1 1 1 1 1 1 1 1 = + + + + + + + ≥ . 9 10 11 12 13 14 15 16 2 120 D.h. für jedes n Zahl m ≥ N ∈ N lässt sich ein Index i ≥ n + 1 und eine ≥ i finden, so dass m X 1 1 ≥ . i 2 i≥n+1 Damit ist das Cauchy-Kriterium für die harmonische Reihe verletzt. Pn Satz 9 (Absolute Konvergenz) Sei { i=1 ai } eine absolut konvergente Reihe, d.h. ( n X i=1 ) |ai | Pn besitzt einen Grenzwert. Dann ist auch { i=1 ai } konvergent. 121 Pn Satz 10 (Majorantenkriterium) Sei { i=1 bi } eine konvergente Reihe mit bi ≥ 0 für alle i ∈ N. Existiert eine Zahl N ∈ N, so dass |am | ≤ bm Pn Pn für alle m ≥ N , so ist { i=1 |ai |} und damit auch { i=1 ai } konvergent. 6 0 für alle i ∈ N. Existiert = eine Zahl N ∈ N und eine reelle Zahl q mit 0 < q < 1, so dass ai+1 ≤ q für alle i ≥ N , ai Pn so ist die Reihe { i=1 ai } konvergent. Satz 11 (Quotientenkriterium) Sei ai 122 Beispiel: Man betrachte die Reihe n X xi i=0 für ein gegebenes x i! ∈ R . Hierbei ist also ai = xi /i! . Für die Quotienten ai+1 /ai erhält man i+1 i+1 ai+1 x /(i + 1)! x · i! = ai = xi /i! xi · (i + 1)! |x| 1 = < für alle i > 2|x| − 1 . i+1 2 P∞ i Folglich konvergiert i=0 x /i! gegen einen bestimmten Grenzwert. Es handelt sich um ex mit der Eulerschen Zahl e = 2.71828 . 123 Spezielle Reihen und deren Grenzwerte ∞ X 1 1. =e i! i=0 ∞ X 1 i1 2. (−1) = i! e i=0 ∞ X i−1 1 3. (−1) = ln (2) (alternierende harmonische Reihe) i i=1 ∞ X 1 1 4. = 2 (geometrische Reihe, q = ) 2 i 2 i=0 124 ∞ X 2 i 1 5. (−1) i = (geometrische Reihe, q = − 12 ) 2 3 i=0 ∞ X 6. (−1)i−1 i=1 7. ∞ X i=1 8. ∞ X i=1 9. ∞ X i=2 1 π = 2i − 1 4 1 =1 i(i + 1) 1 1 = (2i − 1)(2i + 1) 2 1 3 = (i − 1)(i + 1) 4 125 ∞ X 1 π2 = 10. 2 i 6 i=1 ∞ 2 X 1 π 11. (−1)i 2 = i 12 i=1 126 2.3 Stetigkeit von Funktionen • Einer stetige Funktion ist eine, deren Graph man „ohne abzusetzen“ zeichnen kann. • Eine stetige Funktion darf also insbesondere keine „Sprünge“ haben. • Problem: Es gibt neben Sprüngen weitere Typen sogenannter Unstetigkeitsstellen. • Umgekehrt sind auch manche Funktionen, die man intuitiv als unstetig bezeichnen würde, im mathematischen Sinne stetig. 127 Definition (Grenzwert einer Funktion): Gegeben sei ein ⊂ R und eine Funktion f : D → R . Ferner sei a ∈ R und {xn } eine Folge in D \ {a}, so dass xn → a . Gilt für alle dementsprechenden Folgen f (xn ) → c ∈ R , so schreiben wir Definitionsbereich D lim f (x) = c . x→a Für a sind auch +∞ und −∞ zugelassen. • Man beachte, dass bei der vorliegenden Definition die Folgen {xn } niemals den Wert a annehmen dürfen. • Damit ist z.B. die konstante Folge mit xn = a ausgeschlossen. • Insbesondere muss der Grenzwert c nicht dem Funktionswert f (a) entsprechen! 128 Beispiel: Gegeben sei die abschnittsweise definierte Funktion siehe Abbildung 3.4. 0 f (x) = 1 für x ≤ a, für x > a. f (x) 1 a x Die Funktion f besitzt im Punkt a keinen Grenzwert. 129 • Man kann nun auch einseitige Grenzwerte einer Funktion definieren. • Wir schreiben lim f (x) = c , xրa wenn für jede Folge {xn } mit xn ∈ D, xn < a und xn → a gilt: lim f (xn ) = c . n→∞ • Der Grenzwert limxրa f (x) = c heißt linksseitiger Grenzwert von f an der Stelle a. • Statt limxրa f (x) = c schreibt man auch kürzer f (a−) = c . 130 • Entsprechend schreiben wir lim f (x) = c , xցa wenn für jede Folge {xn } mit xn ∈ D, xn > a und xn → a gilt: lim f (xn ) = c . n→∞ • In diesem Fall heißt der Grenzwert rechtsseitiger Grenzwert von f an der Stelle a, und man schreibt kürzer f (a+) = c . • Hierbei ist für a− der Wert +∞ und für a+ der Wert −∞ zugelassen. 131 ⊂ R eine Teilmenge der reellen Zahlen, f : D → R eine reelle Funktion und a ∈ D . Die Funktion f heißt stetig in a, wenn gilt: Definition (Stetigkeit): Sei D lim f (x) = f (a) . x→a Die Funktion f heißt stetig, wenn f in jedem Punkt des Definitionsbereichs stetig ist. ⊂ R ein Intervall und a ∈ D kein Randpunkt von D . Die Funktion f : D → R ist genau dann stetig in a, wenn Satz 12 (Stetigkeit einer reellen Funktion) Es sei D f (a−) = f (a) = f (a+) . 132 Satz 13 (Erhaltungseigenschaft stetiger Funktionen) Seien f, g : D → R Funktionen, die in a ∈ D stetig sind und sei λ ∈ R. Dann sind auch die Funktionen • f ± g, • λf , • f g, • max{f, g} und • min{f, g} stetig in a. Die Funktion f /g ist stetig in a, sofern g(a) 133 6= 0 ist. ⊂ R und f : A → B sowie g : B → R. Ist f stetig im Punkt a ∈ A und ist g stetig im Punkt f (a), so ist auch die Funktion Satz 14 (Stetigkeit einer Verkettung) Seien A, B g◦f:A→R stetig im Punkt a. Mit Hilfe der Sätze 13 und 14 kann man nun für viele Funktionen die Stetigkeit nachweisen. = xr für alle r ∈ N stetig ist, ist auch jedes Polynom p(x) = αr xr + αr−1 xr−1 + . . . + α1 x + α0 stetig. Beispiel: Da f (x) = x2 und g(y) = 1/y sind stetig. Damit ist auch die Verkettung g ◦ f (x) = 1/x2 stetig. Beispiel: Die Funktionen f (x) 134 Schwieriger ist es, die Stetigkeit der folgenden Funktionen zu zeigen: • Die trigonometrischen Funktionen sin x, cos x, tan x, cot x . • Die Umkehrfunktionen der trigonometrischen Funktionen arcsin x, arccos x, arctan x, arccot x . • Die Exponentialfunktion exp(x) = ex . • Der natürliche Logarithmus ln (x) . 135 D → R eine Funktion und a ∈ D . Die Funktion f ist genau dann stetig in a, wenn es zu jedem ǫ > 0 ein δ > 0 gibt, so dass Satz 15 (Stetigkeit anhand von ǫ und δ ) Sei f : |f (x) − f (a)| < ǫ für alle x ∈ D mit |x − a| < δ . 6 6 .......... .......... ↑| ε | f (a) ↓↑ | ε ↓| . . . . . . . . . .. . ↑| .. .. . . . ..... ε ................ ...... . . ... | ..... ....q....... . . . . . . f (a) ↓↑ . .. ..... | ..... ........... . . . . . . ..... ε .... ... . ... ↓| . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . ←− δ −→←− δ −→ a ...... ... ... .. .... .. ... . .. . ............. .... . . ...... .. .. .. .. q a - . .......... . ..... . . ............................... ....... . . . . . . . ←− δ −→←− δ −→ a Äquivalente ε-δ -Bedingung für Stetigkeit. 136 . . . . . . . . . . . . . - 3 Matrixalgebra 3.1 Elementare Matrixoperationen • Eine Matrix ist ein rechteckiges Schema reeller Zahlen, z.B. 8 4 3 1 2 2 2 0 1 1 . 4 3 4 1 1 137 • Allgemein schreibt man A= a11 a12 . . . a1n .. . .. . am1 am2 . . . amn . • A ist eine sogenannte (m × n)-Matrix. • Sie besitzt also m Zeilen und n Spalten. • Rm×n symbolisiert die Menge aller (m × n)-Matrizen. 138 • Die transponierte Matrix A′ erhält man mittels a11 . . . am1 a a 12 m2 A′ = . . . .. .. a1n . . . amn • Es handelt sich hierbei um eine (n × m)-Matrix. Beispiel: Die zu 1 4 A= 2 5 3 6 139 transponierte Matrix lautet ′ A = 1 2 3 4 5 6 . • Man kann Matrizen miteinander addieren. 140 • Es gilt A+B = = a11 . . . a1n .. . .. . am1 . . . amn a11 + b11 .. . am1 + bm1 + b11 .. . . . . b1n .. . bm1 . . . bmn . . . a1n + b1n .. . . . . . amn + bmn • Die Addition von Matrizen vollzieht sich also elementweise. 141 • Aus diesem Grund kann man nur Matrizen mit gleicher Dimension addieren, d.h. zu einer Matrix A ∈ Rm×n kann nur eine Matrix B ∈ Rm×n addiert werden. • Eine Matrix A kann mit einer reellen Zahl α multipliziert werden. • Es gilt αA = αa11 . . . αa1n .. . .. . αam1 . . . αamn • Die Zahl α wird als Skalar bezeichnet. 142 . Beispiel: • Man betrachte die beiden Matrizen A= 1 2 3 4 5 6 und −1 B= 3 0 2 −4 . 1 • Die Summe A + B ist nicht definiert. • Allerdings existiert A + B ′ und es gilt 1 + (−1) 2+3 3+0 0 5 3 ′ . A+B = = 4+2 5 + (−4) 6 + 1 6 1 7 143 • Weiterhin erhält man für α = 2 das Produkt 2·1 2·2 2·3 2 4 6 . 2A = = 2·4 2·5 2·6 8 10 12 • Matrizen können außerdem miteinander multipliziert werden. • Seien A ∈ Rm×n und B ∈ Rn×k , d.h. die Anzahl der Spalten in A entspricht der Anzahl der Zeilen in B . 144 • Dann ist das Produkt AB gegeben durch a11 b11 + . . . + a1n bn1 . . . a11 b1k + . . . + a1n bnk .. .. AB = . . am1 b11 + . . . + amn bn1 . . . am1 b1k + . . . + amn bnk Beispiel: • Gegeben seien die Matrizen 1 0 −1 2 . A = 0 1 und B = −3 0 2 1 • Die Matrix A besitzt 2 Spalten und die Matrix B hat 2 Zeilen. 145 . • Damit können die beiden Matrizen wie folgt multipliziert werden: 146 • Achtung: Im Fall A ∈ Rm×n und B ∈ Rn×m sind zwar die Produkte AB und BA definiert. Es gilt jedoch selbst für m = n im Allgemeinen AB 6= BA . • D.h. bei der Multiplikation von Matrizen sind die Faktoren im Allgemeinen nicht vertauschbar. Beispiel: Seien A= 2 −3 1 0 und B = 147 4 5 −2 1 . Auf der einen Seite gilt 2 · 4 + (−3)(−2) 2 · 5 + (−3) · 1 14 7 AB = = 1 · 4 + 0 · (−2) 1·5+0·1 4 5 und auf der anderen Seite erhält man 4·2+5·1 4 · (−3) + 5 · 0 13 −12 . BA = = −2 · 2 + 1 · 1 (−2)(−3) + 1 · 0 −3 6 148 3.2 Die Inverse • Grundidee: Man hat ein lineares Gleichungssystem Ax = y . • Hierbei ist A eine (m × n)-Matrix und x, y sind zwei (m × 1)-Matrizen. Beispiel: Mit 1 3 x1 5 A= , x= , y= −2 0 x2 −1 149 erhält man das lineare Gleichungssystem 1 · x1 + 3 · x2 = 5 −2 · x1 + 0 · x2 = −1 . Hierbei stellen x1 und x2 unbekannte Parameter dar. • Frage: Kann man A auf der linken Seite von Ax = y „auflösen“ und eine Lösung für das lineare Gleichungssystem finden? 150 Definition (Einheitsmatrix): Die (n × n)-Matrix 1 0 ... 0 .. 0 1 . n×n ∈ R I = . .. .. .. . . 0 ... ... 1 wird als (n-dimensionale) Einheitsmatrix bezeichnet. • Exkurs: Die reelle Zahl „1“ wird als neutrales Element bezüglich der Multiplikation bezeichnet, denn 1 · x = x für alle x ∈ R . • Dementsprechend gilt für alle Matrizen A ∈ Rn×k : IA = A . 151 • D.h. I ist das neutrale Element bezüglich der Multiplikation von Matrizen und repräsentiert die „Eins“ bei Matrizen. • Aus diesem Grund wird I als Einheitsmatrix bezeichnet. • Es gilt außerdem IA = AI = A für alle Matrizen A ∈ Rn×n . Definition (Inverse): Sei A eine (n × n)-Matrix. Existiert eine (n × n)-Matrix B , so dass AB = I , dann wird diese Matrix als Inverse von A bezeichnet und mit A−1 symbolisiert. • Falls die Matrix A−1 existiert, so gilt auch A−1 A = I , d.h. die Inverse von A−1 ist gerade A. • Achtung: Die Inverse A−1 muss nicht zwangsläufig existieren! 152 • Man kann die Inverse auf verschiedene Weisen berechnen. • Eine Möglichkeit ist das sogenannte Gaußsche Eliminationsverfahren (wird später behandelt). • Mit Hilfe der Inversen kann ein lineares Gleichungssystem wie folgt umgeformt werden: Ax = y ⇒ −1 −1 x = Ix = x = A y. A A | {z } =I • Man bezeichnet die Spaltenmatrix x als Lösung des linearen Gleichungssystems. 153 • Eine Nullmatrix ist gegeben durch 0 0 ··· . .. 0= 0 0 ··· 0 .. m×n ∈ R . . 0 • Exkurs: Die reelle Zahl „0“ wird als neutrales Element bezüglich der Addition bezeichnet, denn x + 0 = x für alle x ∈ R . • Dementsprechend gilt A + 0 = 0 + A = A , d.h. die Nullmatrix ist das neutrale Element bezüglich der Addition von Matrizen. 154 Rechenregeln für Matrizen ∈ Rm×n . (A + B) + C = A + (B + C) A+B =B+A A+0=0+A=A A + (−A) = 0 I. Addition: Seien A, B, 0 (1) (2) (3) (4) (1. Assoziativgesetz) (1. Kommutativgesetz) (0 ist neutral für „+“) (−A ist invers für „+“) II. Multiplikation mit einem Skalar: Seien α, β (1) (2) (3) (4) (5) αA = Aα (αβ)A = α (βA) (α + β)A = αA + βA α (A + B) = αA + αB 1·A=A ∈ R und A, B ∈ Rm×n . (2. Kommutativgesetz) (2. Assoziativgesetz) (1. Distributivgesetz) (2. Distributivgesetz) (1 ist neutral für „·“) 155 Rechenregeln für Matrizen III. Multiplikation von Matrizen: Seien A, B, C kompatible Matrizen und α ∈ R . Ferner sei D ∈ Rn×n eine invertierbare Matrix. (3. Assoziativgesetz) (1) (AB)C = A(BC) (2) (A + B)C = AC + BC (3. Distributivgesetz) (3) A(B + C) = AB + AC (4. Distributivgesetz) (4) IA = AI = A (I ist neutral für „·“) (5) DD −1 = D −1 D = I (D −1 ist invers für „·“) (6) α (AB) = A (αB) = (AB) α (4. Assoziativgesetz) (7) (AB)′ = B ′ A′ („Socke-Schuh-Regel“) Merke: Im Allgemeinen gilt AB 156 6= BA ! 3.3 Die Determinante • Jede quadratische Matrix A ∈ Rn×n besitzt eine Determinante det A (oder |A| ). • Für n = 1 ist die Determinante gerade der Absolutbetrag, d.h. es gilt det A = |a11 | . • Im Fall n = 2 kann die Determinante wie folgt berechnet werden: a11 a12 = a11 a22 − a21 a12 . det A = det a21 a22 • Für n = 3 kann die Determinante immer noch „per Hand“ mit Hilfe der Regel von Sarrus berechnet werden. 157 Definition (Minor und Kofaktor): Gegeben sei eine Matrix A ∈ Rn×n . Für alle 1 ≤ i, j ≤ n wird jene Matrix, die durch Streichen der i-ten Zeile und j -ten Spalte entsteht, als Submatrix bezeichnet und mit Aij symbolisiert. Ferner werden det Aij als Minor und a∗ij = (−1)i+j det Aij als Kofaktor bezeichnet. Satz 16 (Laplacescher Entwicklungssatz) Für jede Matrix A ∈ Rn×n gilt det A = n X aij a∗ij = i=1 n X j=1 158 aij a∗ij . • Die Determinante einer Matrix A ∈ Rn×n kann also rekursiv anhand der Determinanten von Submatrizen in R(n−1)×(n−1) berechnet werden. • Letztere werden wiederum anhand der vorhergehenden Determinanten berechnet, bis man am Ende nur noch Absolutbeträge berechnen muss. • Dabei ist es gleichgültig, welche Zeile oder Spalte von A man für die Entwicklung der Determinante verwendet. 159 Beispiel: • Gegeben sei die folgende Matrix: 1 2 0 3 A= 1 1 3 2 4 0 2 3 0 0 . 1 0 • Die Determinante soll nun nach der 2. Zeile entwickelt werden. 160 • Die erste Submatrix beträgt also 2 4 0 1 2 1 . 2 3 0 • Deren Determinante kann mit Hilfe der Regel von Sarrus ermittelt werden und beträgt 2. • Auf die selbe Weise erhält man für die übrigen (3 × 3)-Submatrizen die Determinanten 9, 4 und 1. 161 • Aus dem Entwicklungssatz folgt damit det A = 0 · (−1)2+1 · 2 + 3 · (−1)2+2 · 9 + 0 · (−1)2+3 · 4 + 0 · (−1)2+4 · 1 = 27 . Satz 17 (Rechenregeln für Determinanten) Seien A, B und α ∈ R . Dann gilt 1. det(AB) = det A · det B , 2. det(αA) = αn det A . 162 ∈ Rn×n • Die Determinante jeder Einheitsmatrix I beträgt 1. • Gegeben sei eine invertierbare Matrix A ∈ Rn×n . Dann gilt 1 = det I = det(AA−1 ) = det A · det A−1 und somit det A −1 1 = , det A det A 6= 0 . ∈ Rn×n eine Matrix. Die Inverse von A existiert genau dann, wenn det A 6= 0 . Darüber Satz 18 (Determinante und Inverse) Sei A hinaus gilt dann det A −1 1 = . det A 163 ∈ Rn×n eine Matrix und a∗11 a∗12 . . . a∗1n . a∗ ∗ .. a 21 2n ∗ A = . . . .. .. .. a∗n1 . . . . . . a∗nn Definition (Adjunkte): Sei A die dazugehörige Matrix der Kofaktoren. Man bezeichnet die Matrix adjA = (A∗ )′ als Adjunkte (oder Adjungierte) von A . 164 Satz 19 (Berechnung der Inversen über die Adjunkte) Sei A ∈ Rn×n eine Matrix mit det A 6= 0 . Dann gilt A −1 adjA . = det A Beispiel: • Man betrachte die Matrix 1 2 −1 . A= −3 5 0 0 3 0 165 • Eine Entwicklung nach der dritten Zeile liefert die Determinante det A = 3 · (−1)3+2 · (−3) = 9 . • Die Matrix der Kofaktoren lautet 0 0 −9 ∗ A = −3 0 −3 5 3 11 166 • Damit gilt also A −1 0 −3 5 0 − 13 1 0 = = 0 0 0 3 9 −9 −3 11 −1 − 13 5 9 1 . 3 11 9 Beispiel: • Nun betrachte man noch einmal das lineare Gleichungssystem Ax = y 167 mit 1 3 A= −2 0 und • Die Inverse von A lautet A−1 y= 5 . −1 ′ 0 2 0 −3 1 1 = · = · 2+1 −2 · (−1) · 3 −3 1 6 2 1 0 − 21 . = 1 3 1 6 168 • Daraus ergibt sich die Lösung 1 0 − 5 2 −1 · x=A y = 1 1 −1 3 6 1 0 · 5 + (− 12 )(−1) = 2 . = 1 1 3 · 5 + · (−1) 3 6 2 169 3.4 Vektoren • Eine (m × 1)-Matrix wird als Spaltenvektor und eine (1 × n)-Matrix als Zeilenvektor bezeichnet. • Im Allgemeinen versteht man unter einen Vektor einen Spaltenvektor. • Eine Matrix A ∈ Rm×n kann als Ansammlung von n Spaltenvekoren der Länge m angesehen werden. 170 2 x | {z x1 } Ein Vektor in R2 . 171 x2 1 3 2 1 -1 1 2 3 -1 Der Betrag der Determinanten einer Matrix A ∈ Rm×m entspricht dem Volumen des durch die Spaltenvektoren erfassten Trapezoiden. 172 • Der Vektor 0 0 0 = . ∈ Rm .. 0 wird als (m-dimensionaler) Nullvektor bezeichnet und entspricht dem Koordinatenursprung in Rm . Definition (Vektorraum): Die Menge Rm wird als m-dimensionaler Euklidischer Vektorraum bezeichnet, wenn für die Elemente von Rm die Rechenregeln I und II für Matrizen gelten. 173 • Man beachte, dass für die Menge Rm und deren Elemente (die sogenannten m-Tupel) zunächst keine Addition oder Multiplikation mit einem Skalar definiert sein muss. • Erst durch diese Definitionen entsteht ein Vektorraum und die dazugehörigen Elemente heißen dann sinngemäß Vektoren. • Sei x = (x1 , x2 , . . . , xm ) ∈ Rm ein m-dimensionaler Spaltenvektor. Dann wird xi (i = 1, . . . , m) als i-te Komponente oder i-te Koordinate von x bezeichnet. 174 2 x+y y x 1 Addition von zwei Vektoren. 175 2 λx x2 x x1 1 −x Multiplikation eines Vektors mit einem Skalar. 176 Definition (Skalarprodukt und Norm): Seien x, y bezeichnet das Produkt ∈ Rm . Man x′ y ∈ R als Skalarprodukt von x und y . Die Zahl q √ kxk = x′ x = x21 + . . . + x2m wird ferner als (Euklidische) Norm von x bezeichnet. • Die Norm eines Vektors x entspricht der Länge dieses Vektors im m-dimensionalen Koordinatensystem. • Das folgt aus dem Satz von Pythagoras. 177 2 x | {z x1 } Ein Vektor in R2 . 178 x2 1 Definition (Winkel zwischen zwei Vektoren): Der Winkel α(x, y) zwischen zwei Vektoren x, y über die Beziehung ∈ Rm mit kxk, kyk 6= 0 ist definiert x′ y cos α(x, y) = . kxk · kyk • Hierbei hat cos die übliche Definition „Ankathete durch Hypothenuse“ auf Basis eines rechtwinkligen Dreiecks. • Der Kosinus kann nur Werte zwischen −1 und 1 annehmen. 179 • Wegen der sogenannten Cauchy-Schwarzschen Ungleichung ′ ′ xy x y −1 ≤ = ≤1 kxk · kyk kxk kyk ist die vorhergehende Definition „erlaubt“. • Aus der Definition folgt unmittelbar x′ y = cos α(x, y) · kxk · kyk . • Liegen die beiden Vektoren x und y in einem rechten Winkel zueinander, so gilt cos α(x, y) = 0 und folglich x′ y = 0 . Man sagt dann, x ist orthogonal zu y und schreibt x ⊥ y . 180 Beispiel: • Gegeben sei 2 . x= 1 1 • Gesuch wird nun ein Vektor y ∈ R3 , so dass x ⊥ y . • D.h. es muss gelten x′ y = x1 y 1 + x2 y 2 + x3 y 3 = 2 y 1 + y 2 + y 3 = 0 . • Es handelt sich um eine Gleichung mit drei Unbekannten. 181 • Damit sind zwei Unbekannte frei wählbar, z.B. y2 = α und y3 = β . • Daraus folgt α+β . y1 = − 2 • D.h. für alle α, β ∈ R ist der Vektor − 12 −(α + β)/2 − 12 0 . y= = α + β α 1 β 0 1 182 Satz 20 (Dreiecksungleichung) Für alle x, y ∈ Rm gilt kx + yk ≤ kxk + kyk . 2 6 x+y kyk r xr kxk kx + yk r y r Dreiecksungleichung 183 -1 ⊂ Rm heißt Unterraum von Rm , wenn für alle x, y ∈ U und α ∈ R Definition (Unterraum): Eine nichtleere Teilmenge U 1. x + y ∈ U und 2. αx ∈ U . • M.a.W.: Sowohl Addition als auch Multiplikation produzieren keinen Vektor, der jenseits des Unterraums liegt. • Unterräume sind also abgeschlossen bezüglich der Addition und Multiplikation und damit im geometrischen Sinne linear. • Jeder Unterraum ist wiederum ein Vektorraum. 184 • Die Menge x, y ∈ R : x + y = 1 , 2 2 d.h. alle Punkte auf dem Einheitskreis bilden z.B. keinen Unterraum. • Ebenso ist {x, y ∈ R : y ≤ 0} , d.h. die untere Halbebene im R2 kein Unterraum. • Die Menge {x, y ∈ R : y = 1 − x} , d.h. eine Gerade mit Achsenabschnitt 1 und Steigung −1 ist ebenfalls kein Unterraum. 185 • Die Menge {x, y ∈ R : y = −x} ist allerdings ein Unterraum. • Merke: Der Nullvektor 0 ∈ Rm muss stets Bestandteil des Unterraums sein! • Sei x ∈ Rm und x 6= 0 . Die Menge der Vektoren αx für alle α ∈ R ist eine Gerade, die durch den Nullpunkt verläuft und damit ein Unterraum. • Das gleiche Konzept lässt sich nun auf beliebig viele Vektoren x1 , x2 , . . . in Rm übertragen. 186 Definition (Linearkombination und Erzeugnis): Gegeben seien die Vektoren x1 , . . . , xk ∈ Rm . Man sagt, die Vektoren x1 , . . . , xk erzeugen oder spannen den Unterraum U = {α1 x1 + . . . + αk xk : α1 , . . . , αk ∈ R} auf. Ferner wird α1 x1 + . . . + αk xk als Linearkombination von x1 , . . . , xk bezeichnet. • Es kann sein, dass sich ein Vektor xi (i = 1, . . . , k ) als Linearkombination der anderen Vektoren darstellen lässt. • In diesem Fall ist xi redundant, d.h. die restlichen Vektoren spannen den gleichen Unterraum wie x1 , . . . , xk auf. 187 Definition (Lineare Unabhängigkeit): Man sagt die Vektoren x1 , . . . , xk ∈ Rm sind linear unabhängig, wenn α 1 x1 + . . . + α k xk = 0 lediglich mit α1 , . . . , αk = 0 erfüllt ist. • Sind x1 , . . . , xk linear abhängig, so lässt sich ein Vektor stets als Linearkombination der restlichen Vektoren darstellen. • Sei z.B. ohne Beschränkung der Allgemeinheit αk 6= 0 . Dann gilt αk−1 α1 · xk−1 xk = − · x1 − . . . − αk αk und damit ist xk redundant. 188 Beispiel: • Gegeben seien die beiden Vektoren 1 1 1. x1 = und x = 1 2 1 −1 • Bei linearer Abhängigkeit muss 0 α1 + α2 1 1 + α2 1 = α1 + α2 = 0 α1 1 α1 − α2 0 1 −1 mit α1 6= 0 oder α2 6= 0 gelten. 189 • Daraus folgt α1 = −α2 und α1 = α2 . • Beide Gleichungen können jedoch nur für α1 = α2 = 0 erfüllt sein. D.h. die Vektoren x1 und x2 sind linear unabhängig. Definition (Basis und Dimension): Gegeben sei ein Unterraum U ⊂ Rm . Eine Menge von Vektoren x1 , . . . , xk ∈ Rm heißt Basis von U , wenn 1. die Vektoren x1 , . . . , xk ∈ Rm linear unabhängig sind und 2. den Unterraum U aufspannen. Der Unterraum U besitzt dann k Dimensionen und man schreibt dim U = k . 190 Satz 21 (Gleichmächtigkeit von Basen) Wenn {x1 , . . . , xk } und {y1 , . . . , yl } zwei Basen von U sind, so gilt k = l . • Eine Basis von R3 ist z.B. die Menge der Vektoren 0 0 1 0 . 0 , 1 , 1 0 0 • Nun betrachte man die Vektoren 0 1 1 , 1 , 1 0 191 1 2 . 1 Es gilt 1 0 1 1 + 1 = 2 . 0 1 1 Damit sind die betrachteten Vektoren nicht linear unabhängig und können daher keine Basis bilden. • Was passiert, wenn man statt dessen die Vektoren 1 0 0 1 , 1 1 , 1 0 0 nimmt? 192 • Die Relation 0 0 1 0 = 0 α 1 + β 1 + γ 1 0 0 1 0 kann lediglich für α = 0 und β = 0 gelten. In diesem Fall muss aber auch zwangsläufig γ = 0 gelten. • Sei {a1 , . . . , am } eine Basis von Rm . • Zu jedem Vektor y ∈ Rm existieren dann genau m Skalare x1 , . . . , xm ∈ R, so dass x1 a1 + . . . + xm am = y . 193 • Außerdem gibt es keine anderen Skalare, mit denen man y ∈ Rm als Linearkombination von a1 , . . . , am darstellen könnte. • Die Skalare x1 , . . . , xm werden als Koordinaten von y (bezüglich der Basis {a1 , . . . , am }) bezeichnet. • Die kanonische (d.h. „natürliche“) Basis von Rm ist gegeben durch 0 0 1 0 1 0 e1 = . , e2 = . , . . . , em = . . .. .. .. 1 0 0 194 • Damit lässt sich jeder Vektor x = (x1 , . . . , xm ) ∈ Rm als Linearkombination x = x1 e 1 + x2 e 2 + . . . + xm e m der Einheitsvektoren e1 , e2 , . . . , em darstellen. • Hierbei sind x1 , x2 , . . . , xm gerade die Koordinaten von x bezüglich der kanonischen Basis. • Die kanonische Basis wird wiederum durch die Einheitsmatrix I = [e1 e2 . . . em ] ∈ Rm repräsentiert. • Die entsprechende Linearkombination mit den Einheitsvektoren lässt sich dann einfach mittels Ix = x ausdrücken. 195 • Man betrachte nun eine Matrix A ∈ Rm×m mit linear unabhängigen Spaltenvektoren a1 , a2 , . . . , am , sowie einen beliebigen Vektor y ∈ Rm . • Gesucht seien die Koordinaten x1 , x2 , . . . , xm von y , d.h. x = (x1 , x2 , . . . , xm ) , so dass Ax = y . • Damit ist x die Lösung eines linearen Gleichungssystems! Definition (Zeilen- und Spaltenrang): Die maximale Anzahl linear unabhängiger Spaltenvektoren einer Matrix A ∈ Rm×n heißt Spaltenrang von A. Die maximale Anzahl linear unabhängiger Zeilenvektoren der Matrix A ∈ Rm×n heißt Zeilenrang von A. 196 ∈ Rm×n sind gleich. Man spricht daher einfach vom Rang rgA der Matrix A. Satz 22 (Rang) Zeilen- und Spaltenrang einer Matrix A Beispiel: Man betrachte die Matrix 1 0 0 1 1 0 A= 0 1 1 0 0 1 197 1 2 . 2 1 Da die letzte Spalte eine Summe der ersten drei Spalten ist, kann A nicht regulär sein. Die ersten drei Spalten sind linear unabhängig und damit rgA = 3. Definition (Elementare Zeilen- und Spaltenumformungen): 1. Das Vertauschen zweier Zeilen, 2. das Vertauschen zweier Spalten, 3. die Multiplikation einer Zeile oder Spalte mit λ 6= 0 , 4. die Addition einer Zeile zu einer anderen Zeile und 5. die Addition einer Spalte zu einer anderen Spalte. 198 ∈ Rm×n werde durch elementare Umformungen in eine Matrix B ∈ Rm×n transformiert. Dann gilt rgB = rgA . Satz 23 (Elementare Umformungen I) Eine Matrix A • Jede Matrix A ∈ Rm×n kann durch elementare Umformungen in eine Matrix B = [bij ] ∈ Rm×n überführt werden, so dass bij = 0 für alle i > j mit i = 1, . . . , m und j = 1, . . . , n . • Aus der Gestalt von B lässt sich deren Rang einfach ablesen. • Der Rang von B ist m minus der Anzahl der Nullzeilen. • Zur Erinnerung: Der Rang von B entspricht dem Rang von A . 199 Beispiel: Gegeben sei die Matrix 0 0 2 6 0 0 1 3 A= . 9 13 3 18 5 13 4 7 Man bestimme den Rang von A mittels elementaren Umformungen. ∈ Rm×m werde durch elementare Umformungen in eine Matrix B ∈ Rm×m Satz 24 (Elementare Umformungen II) Eine Matrix A transformiert. 200 Dann gilt 1. det B = − det A im Falle einer Zeilen- oder Spaltenvertauschung, 2. det B = λ det A im Falle der Multiplikation einer Zeile oder Spalte mit einem Skalar λ 6= 0 , 3. det B = det A falls zwei Zeilen oder Spalten addiert werden. Definition (Dreiecksmatrix): Eine Matrix A = [aij ] ∈ Rm×m mit aij = 0 für alle i > j mit i, j = 1, . . . , m wird als Dreiecksmatrix bezeichnet. 201 Satz 25 (Determinante einer Dreiecksmatrix) Sei A Dreiecksmatrix. Dann gilt det A = m Y ∈ Rm×m eine aii . i=1 Beispiel: Gegeben sei die Matrix 8 0 −4 A= 4 3 3 . −2 −1 0 Man bestimme die Determinante von A mittels elementaren Umformungen. 202 ∈ Rm×m heißt regulär, wenn rgA = m und singulär, wenn rgA < m . Definition (Regularität): Eine Matrix A Satz 26 (Regularität) Eine Matrix Am×m ist genau dann regulär, wenn det A 6= 0 , d.h. genau dann, wenn die Inverse A−1 existiert. 3.5 Lineare Gleichungssysteme Definition (Lineares Gleichungssystem): Sei A y ∈ Rm . Dann ist ∈ Rm×n und Ax = y ein lineares Gleichungssystem (LGS) in x ∈ Rn . Im Falle y = 0 wird das LGS als homogen bezeichnet und sonst als inhomogen. 203 Die Menge L(A, y) = {x ∈ Rn : Ax = y} ist die Lösungsmenge des LGS und ein Element von L(A, y) ist eine Lösung. Beispiel: Man betrachte z.B. das LGS 4x1 + 6x2 + 16x3 = 4 x4 = 5 2x1 + 6x2 + 11x3 + 3x4 = 5 3x1 + 9x2 + 15x3 − 3x4 = 6 , 4x1 + 12x2 + 17x3 + 204 d.h. 4 6 16 0 4 12 17 1 A= 2 6 11 3 3 9 15 −3 und 4 5 y = . 5 6 • Die Lösung eines LGS kann ebenso mit Hilfe elementarer Umformungen ermittelt werden (Gaußsche Elimination). • Hierbei darf man allerdings nur Zeilenumformungen durchführen. Spaltenumformungen führen lediglich zu einer Vertauschung der Komponenten von x 205 = (x1 , . . . , xn ). Beispiel: Zeigen Sie, dass das LGS mit 4 6 16 0 4 12 17 1 A= 2 6 11 3 3 9 15 −3 die Lösung x = (−3, 0, 1, 0) besitzt. und 4 5 y= 5 6 • Eine Matrix A ∈ Rm×n kann höchstens Rang min{m, n} haben. • Im Falle rgA = min{m, n} sagt man A habe einen vollen Rang. 206 • Angenommen x ist eine Lösung eines inhomogenen LGS Ax = y . • Ferner sei x0 eine Lösung des dazugehörigen homogenen LGS Ax0 = 0 . • Dann ist x + x0 ebenso eine Lösung des LGS Ax = y , denn A (x + x0 ) = Ax + Ax0 = y . |{z} =0 • Sei nun L(A, 0) die Lösungsmenge des homogenen LGS Ax = 0 und x eine Lösung des inhomogenen LGS Ax = y . • Die Lösungsmenge L(A, y) ist dann gerade die Menge L(A, y) = {x + x0 : x0 ∈ L(A, 0)} . 207 Satz 27 (Lösungsmenge eines homogenen LGS) Die Lösungsmenge L(A, 0) eines homogenen LGS Ax = 0 mit A ∈ Rm×n und rgA = r ist ein Unterraum in Rn mit dim L(A, 0) = n − rgA . • Dementsprechend ist die Lösungsmenge L(A, y) ein linearer Raum mit Dimension n − rgA . • Allerdings handelt es sich nicht um einen Unterraum. • Im Spezialfall rgA = n ist die Lösung des homogenen LGS eindeutig. • Ansonsten muss die Lösung nicht zwangsläufig existieren. 208 A ∈ Rm×n , Ax = y 6= 0 , ges.: x 6= 0 m>n m=n m<n rgA = n : x kann existieren, muss es aber nicht. Falls x existiert, dann ist es eindeutig. rgA < n : x kann existieren, muss es aber nicht. Falls x existiert, dann ist es mehrdeutig. rgA = n : x muss existieren und ist dabei eindeutig. rgA < n : x kann existieren, muss es aber nicht. Falls x existiert, dann ist es mehrdeutig. rgA = m : x muss existieren und ist dabei mehrdeutig. rgA < m : x kann existieren, muss es aber nicht. Falls x existiert, dann ist es mehrdeutig. Mögliche Fälle eines LGS. 209 Beispiel: Gegeben sei das LGS Ax 3 6 12 A= 2 −3 −6 1 0 0 = y mit und 1 . y= 2 3 Man zeige, dass dieses LGS keine Lösung besitzt. Beispiel: Man bestimme die Lösung des LGS Ax 4 5 A = 2 −1 1 0 und 210 = y mit 3 . y= 5 2 • Falls die Lösungsmenge des LGS Ax = y mehrdimensional ist, kann man diese mit dem Ansatz Ax0 = AN α = 0 bestimmen, wobei N • Die Menge ∈ Rn×(n−rgA) und α ∈ Rn−rgA . n−rgA L(A, 0) = N α : AN α = 0 mit α ∈ R wird auch als Nullraum oder Kern von A bezeichnet. • Die Lösungsmenge L(A, y) ist dann gerade die Menge aller x + N α mit α ∈ Rn−rgA , wobei x eine beliebige Lösung von Ax 211 = y darstellt. Beispiel: Man bestimme die Lösungsmenge des LGS Ax 3 6 12 A= 2 −3 −6 1 0 0 und = y mit 9 . y= 6 3 • Mittels elementarer Zeilen- und Spaltenumformungen lässt sich die Inverse einer regulären Matrix A ∈ Rm×m bestimmen. • Zu diesem Zweck schreibt man A und I nebeneinander und formt beide Matrizen simultan um. • Am Ende bleiben die Matrizen I und A−1 übrig. 212