Skript zur Vorlesung Mathematik II für Informationswirtschaft Markus Richter Institut für Angewandte und Numerische Mathematik Karlsruher Institut für Technologie (KIT) Sommersemester 2011 Dieses Skript unterliegt dem Urheberrecht und ist ausschließlich für den privaten Gebrauch bestimmt. Vervielfältigungen jeder Art, auch auszugsweise, sind nur mit Erlaubnis des Autors gestattet. Inhaltsverzeichnis 1 Normen und Skalarprodukte 1.1 Normen . . . . . . . . . . . . . . . 1.2 Skalarprodukte . . . . . . . . . . . 1.3 Induzierte Normen . . . . . . . . . 1.4 Orthonormalbasen . . . . . . . . . 1.5 Definitheit symmetrischer Matrizen 2 Grundbegriffe der Analysis 2.1 Folgen und Familien . . . . . . 2.2 Algebren . . . . . . . . . . . . . 2.3 Infimum, Supremum, Minimum 2.4 Monotonie . . . . . . . . . . . . 2.5 Grenzwerte von Folgen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . und Maximum . . . . . . . . . . . . . . . . . . 3 Topologische Begriffe 3.1 Inneres, Rand und Abschluss von Mengen 3.2 Offene und abgeschlossene Mengen . . . . 3.3 Beschränktheit . . . . . . . . . . . . . . . 3.4 Kompakte Mengen . . . . . . . . . . . . . 3.5 Vollständigkeit . . . . . . . . . . . . . . . 3.6 Zusammenhängende Mengen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 8 14 17 20 25 . . . . . 30 30 34 37 44 47 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 53 56 59 62 65 67 4 Konvergenzbegriffe und Konvergenzkriterien 4.1 Konvergenz reeller Zahlenfolgen . . . . . . . . . 4.2 Konvergenz von Reihen . . . . . . . . . . . . . 4.3 Absolute Konvergenz von Reihen . . . . . . . . 4.4 Punktweise Konvergenz von Funktionenfolgen . 4.5 Gleichmäßige Konvergenz von Funktionenfolgen 4.6 Konvergenz von Potenzreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70 70 75 82 87 90 93 . . . . . 99 99 105 111 114 115 5 Stetige Funktionen 5.1 Grenzwerte von Funktionen . . . . . . . 5.2 Stetigkeit . . . . . . . . . . . . . . . . . 5.3 Der Zwischenwertsatz . . . . . . . . . . 5.4 Der Satz vom Minimum und Maximum 5.5 Äquivalenz von Normen . . . . . . . . . 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . INHALTSVERZEICHNIS 6 Differentialrechnung 6.1 Differenzierbarkeit . . . . . 6.2 Der Mittelwertsatz . . . . . 6.3 Stetige Differenzierbarkeit . 6.4 Der Satz von Taylor . . . . 6.5 Partielle Differenzierbarkeit 6.6 Gradient und Hesse–Matrix 6.7 Totale Differenzierbarkeit . 7 Integralrechnung 7.1 Das Lebesgue–Maß . . . . . 7.2 Das Lebesgue–Integral . . . 7.3 Berechnung von Integralen . 7.4 Der Transformationssatz . . 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119 . 119 . 127 . 131 . 134 . 139 . 147 . 154 . . . . 159 . 159 . 168 . 177 . 186 A Wichtige Resultate 193 Symbolverzeichnis 198 Index 200 4 INHALTSVERZEICHNIS Vorbemerkungen Zahlenmengen Mit N bezeichnen wir die Menge der natürlichen Zahlen. Die Menge N enthält die Zahl 1 und mit jeder Zahl n auch die Zahl n + 1, d.h. N = {1, 2, 3, . . . }. Die Zahl 0 ist in der Menge N nicht enthalten. Wir definieren daher die Menge N0 := N ∪ {0}. Mit Z bezeichnen wir die Menge der ganzen Zahlen, mit Q die Menge der rationalen Zahlen und mit R die Menge der reellen Zahlen. Mit C bezeichnen wir schließlich die Menge der komplexen Zahlen. Für jede komplexe Zahl z ∈ C existieren zwei eindeutig bestimmte reelle Zahlen x = <(z) ∈ R und y = =(z) ∈ R, so dass z = x + yi gilt, wobei i die imaginäre Einheit bezeichnet. Die imaginäre Einheit erfüllt die Gleichung i2 = −1. In den folgenden Kapiteln verwenden wir das Symbol K als Platzhalter für R oder C. Der Ausdruck α ∈ K besagt also, dass α entweder eine reelle oder eine komplexe Zahl ist. Betrags- und Signumfunktion Die reelle Betragsfunktion R → R, x 7→ |x| ist durch ( x falls x ≥ 0, |x| := −x falls x < 0 für alle x ∈ R definiert. Ist x ∈ R eine reelle Zahl, so heißt |x| der Betrag von x. Man kann √ 2 zeigen, dass |x| = x für alle x ∈ R gilt. Die Signum- oder Vorzeichenfunktion sgn : R → R ist durch 1 falls x > 0, sgn(x) := 0 falls x = 0, −1 falls x < 0 für alle x ∈ R definiert. Ist x ∈ R eine reelle Zahl, so heißt sgn(x) das Vorzeichen von x. Für jede reelle Zahl x ∈ R gilt x = sgn(x)|x|. Die komplexe Betragsfunktion C → R, z 7→ |z| ist durch p |z| := <(z)2 + =(z)2 für alle z ∈ C definiert. Man rechnet leicht nach, dass für jede komplexe Zahl z ∈ C die √ Identität |z| = zz gilt, wobei z := <(z) − =(z)i die konjugierte komplexe Zahl zu z bezeichnet. Intervalle Seien a, b ∈ R zwei reelle Zahlen. Dann nennt man die Mengen (a, b) := {x ∈ R | a < x < b}, [a, b] := {x ∈ R | a ≤ x ≤ b}, (a, b] := {x ∈ R | a < x ≤ b}, [a, b) := {x ∈ R | a ≤ x < b}, (−∞, b) := {x ∈ R | x < b}, INHALTSVERZEICHNIS 5 (−∞, b] := {x ∈ R | x ≤ b}, (a, ∞) := {x ∈ R | a < x}, [a, ∞) := {x ∈ R | a ≤ x} (reelle) Intervalle. Insbesondere wird die Menge (a, b) ein offenes Intervall und die Menge [a, b] ein abgeschlossenes Intervall genannt. Die Intervalle (a, b), (a, b] und [a, b) sind genau dann nichtleere Mengen, wenn a < b gilt. Ein abgeschlossenes Intervall [a, b] ist genau dann nichtleer, wenn a ≤ b gilt. Im Fall a = b gilt [a, b] := {a}. Die Zahlen a und b werden auch als Intervallgrenzen bezeichnet. Gelegentlich wird auch die Menge der reellen Zahlen R durch (−∞, ∞) als Intervall dargestellt. Vektoren und Matrizen Ist n ∈ N eine natürliche Zahl und x ∈ Kn ein Vektor, dann bezeichnen wir mit xi oder mit (x)i die i-te Komponente von x, wobei i ∈ {1, 2, . . . , n} gelte. Es gilt also ganz allgemein x1 x2 x = . . .. xn Für einen Vektor x mit den Komponenten x1 , x2 , . . . , xn wählen wir gelegentlich auch die etwas kompaktere Darstellung (x1 , x2 , . . . , xn )T . Sind m ∈ N und n ∈ N zwei natürliche Zahlen, und ist A ∈ Km×n eine Matrix mit m Zeilen und n Spalten über K, dann bezeichnen wir mit Aij oder (A)ij die Komponente in der i-ten Zeile und der j-ten Spalte von A, wobei i ∈ {1, 2, . . . , m} und j ∈ {1, 2, . . . , n} gelte. Es gilt also ganz allgemein A11 A12 . . . A1n A21 A22 . . . A2n A= . .. .. . .. . . Am1 Am2 . . . Amn Mit AT bezeichnen wir die transponierte Matrix zu einer Matrix A ∈ Rm×n . Es gilt dann AT ∈ Rn×m und (AT )ij = Aji für alle i = 1, 2, . . . , n und alle j = 1, 2, . . . , m. Vektorwertige Funktionen Sei X eine nichtleere Menge und m ∈ N eine natürliche Zahl. Dann heißt eine Funktion f : X → Km eine vektorwertige Funktion. Für jeden Index i ∈ {1, 2, . . . , m} bezeichnen wir dann mit fi oder (f )i die i-te Komponente von f . Die i-te Komponente von f ist dabei die Funktion fi : X → K, welche durch fi (x) := (f (x))i für alle x ∈ X definiert ist. Man betrachte hierzu folgendes Beispiel: Die vektorwertige Funktion γ : [0, 2π] → R2 sei durch cos(t) γ(t) := sin(t) für alle t ∈ [0, 2π] definiert. Die beiden Komponenten γ1 : [0, 2π] → R und γ2 : [0, 2π] → R sind dann durch γ1 (t) = cos(t) und γ2 (t) = sin(t) für alle t ∈ [0, 2π] gegeben. 6 INHALTSVERZEICHNIS Gruppen Sei G eine nichtleere Menge. Unter einer Verknüpfung auf G versteht man eine Funktion G × G → G, (g, h) 7→ g ∗ h, welche man mit ∗ bezeichnet. Ein Element e ∈ G heißt neutrales Element bezüglich ∗, wenn g ∗ e = e ∗ g = g für alle g ∈ G gilt. Sind ferner g ∈ G und h ∈ G zwei Elemente für die g ∗ h = h ∗ g = e gilt, so heißt h das inverse Element zu g bezüglich ∗. Man bezeichnet das Element h dann mit g −1 . Die Verknüpfung ∗ wird assoziativ genannt, wenn (g ∗ h) ∗ i = g ∗ (h ∗ i) für alle g, h, i ∈ G gilt. Falls g ∗ h = h ∗ g für alle g, h ∈ G gilt, nennt man die Verknüpfung kommutativ. Eine nichtleere Menge G wird eine Gruppe bezüglich einer Verknüfung ∗ auf G genannt, wenn die Verknüpfung ∗ assoziativ ist, wenn ein neutrales Element bezüglich der Verknüpfung ∗ existiert, und wenn für jedes Element von G ein inverses Element bezüglich der Verknüpfung ∗ existiert. Ist die Verknüpfung ∗ zusätzlich kommutativ, so spricht man von einer kommutativen Gruppe. Die Mengen Z, Q, R und C sind beispielsweise kommutative Gruppen bezüglich der Addition. Das neutrale Element ist dabei die Zahl 0, und zu jeder Zahl z ist −z das inverse Element. Für jede natürliche Zahl n ∈ N mit n ≥ 2 ist die Menge der regulären (n × n)Matrizen über R eine nichtkommutative Gruppe bezüglich der Matrixmultiplikation. Das neutrale Element ist hierbei die n-zeilige Einheitsmatrix 1n . Das zu einer regulären Matrix A ∈ Rn×n inverse Element ist die so genannte inverse Matrix A−1 . Körper Sei K eine Menge, auf der zwei Verknüpfungen K × K → K, (k, l) 7→ k ⊕ l und K × K → K, (k, l) 7→ k l definiert sind, so dass K und K \ {0} kommutative Gruppen bezüglich ⊕ bzw. sind. Hierbei bezeichne 0 das neutrale Element bezüglich der Verknüpfung ⊕. Die Menge K wird ein Körper bezüglich ⊕ und genannt, wenn außerdem k (l ⊕ m) = (k l) ⊕ (k m) für alle k, l, m ∈ K gilt. Die Verknüpfung ⊕ nennt man üblicherweise die Addition auf K, und die Verknüpfung nennt man die Multiplikation auf K. Die Mengen Q, R und C sind Körper bezüglich der gewöhnlichen Addition + und der gewöhnlichen Multiplikation · . Vektorräume Sei K ein Körper. Eine nichtleere Menge V heißt ein Vektorraum über K, wenn zwei Verknüpfungen V × V → V, (v, w) 7→ v + w und K × V → V, (α, v) 7→ α · v existieren, so dass V bezüglich der Verknüpfung + eine kommutative Gruppe ist, und sowohl α·(v+w) = (α · v) + (α · w) als auch α · (β · v) = (αβ) · v für alle v, w ∈ V und alle α, β ∈ K gilt. Die Verknüpfung + nennt man dann die Addition oder Vektoraddition auf V , und die Verknüpfung · nennt man die skalare Multiplikation auf V . Die Elemente von V werden ganz allgemein als Vektoren bezeichnet. Die Elemente des Körpers K nennt man auch Skalare. Eine Menge U ⊆ V wird Untervektorraum von V genannt, wenn U selbst ein Vektorraum ist. Man nennt eine endliche Anzahl von Vektoren v1 , v2 , . . . , vn ∈ V linear unabhängig, wenn für alle α1 , α2 , . . . , αn ∈ K aus α1 v1 + α2 v2 + · · · + αn vn = 0 stets α1 = α2 = · · · = αn = 0 folgt. Andernfalls werden die Vektoren linear abhängig genannt. Eine Menge linear unabhängiger Vektoren {v1 , v2 , . . . , vn } wird eine Basis von V genannt, wenn für jeden Vektor v ∈ V eindeutig bestimmte Skalare α1 , α2 , . . . , αn ∈ K existieren, so dass v = α1 v1 + α2 v2 + . . . + αn vn gilt. Existiert für einen Vektorraum V eine solche Basis {v1 , v2 , . . . , vn }, so heißt der Vektorraum endlichdimensional. Die natürliche INHALTSVERZEICHNIS 7 Zahl n ∈ N nennt man dann auch die Dimension von V , und bezeichnet sie mit dim(V ). Ein endlichdimensionaler Vektorraum der Dimension n wird auch n-dimensional genannt. Für jede natürliche Zahl n ∈ N ist die Menge Rn ein n-dimensionaler Vektorraum über R. Die Menge Cn ist ein n-dimensionaler Vektorraum über C. Jeweils zwei Vektoren x, y ∈ Kn sind genau dann linear abhängig, wenn ein α ∈ K existiert, so dass y = αx gilt. Lineare Funktionen Seien V und W zwei Vektorräume über demselben Körper K. Eine Funktion f : V → W wird linear genannt, wenn f (v+w) = f (v)+f (w) und f (αv) = αf (v) für alle v, w ∈ V und alle α ∈ K gilt. Das Bild Bild(f ) := {w ∈ W | ∃v ∈ V : f (v) = w} einer linearen Funktion f : V → W ist ein Untervektorraum von W , und der Kern Kern(f ) := {v ∈ V | f (v) = 0} ist ein Untervektorraum von V . Sind die Vektorräume V und W endlichdimensional, so gilt darüber hinaus die Gleichung dim(Bild(f )) + dim(Kern(f )) = dim(V ). Eine lineare Funktion f ist genau dann injektiv, wenn Kern(f ) = {0} gilt. Für je zwei natürliche Zahlen m ∈ N und n ∈ N ist eine Funktion f : Rn → Rm genau dann linear, wenn eine Matrix A ∈ Rm×n existiert, so dass f (x) = Ax für alle x ∈ Rn gilt. Äquivalenz- und Ordnungsrelationen Sei X eine nichtleere Menge. Unter einer (zweistelligen) Relation auf X versteht man eine Teilmenge R von X × X. Sind x, y ∈ X zwei Elemente, für die (x, y) ∈ R gilt, so sagt man, dass zwischen x und y die Relation R besteht und schreibt x R y. Eine Relation R auf X wird reflexiv genannt, wenn x R x für alle x ∈ X gilt. Die Relation R heißt symmetrisch, wenn für alle x, y ∈ X aus x R y stets auch y R x folgt. Die Relation heißt antisymmetrisch, wenn für alle x, y ∈ X aus x R y und y R x stets x = y folgt. Schließlich wird eine Relation R auf X transitiv genannt, wenn für alle x, y, z ∈ X aus x R y und y R z stets auch x R z folgt. Eine Relation reflexive, symmetrische und transitive Relation heißt Äquivalenzrelation. Ist ∼ eine Äquivalenzrelation auf einer nichtleeren Menge X, so nennt man für jedes Element x ∈ X die Menge [x]∼ := {y ∈ X | x ∼ y} die Äquivalenzklasse von x bezüglich ∼. Die Menge aller Äquivalenzklassen wird die Faktormenge bezüglich ∼ genannt und mit X/ ∼ bezeichnet. Auf jeder nichtleeren Menge ist die Relation = ( ist gleich“) eine Äquivalenzrelation. ” Die Relation k ( ist parallel zu“) ist eine Äquivalenzrelation auf der Menge aller Geraden ” in R2 . Eine reflexive, antisymmetrische und transitive Relation heißt Ordnungsrelation. Eine Ordnungsrelation auf einer nichtleeren Menge X wird Totalordnung genannt, wenn für je zwei Elemente x, y ∈ X stets x y oder y x gilt. Die Relation ≤ ( ist kleiner oder gleich“) ist eine Totalordnung auf N, Z, Q und R. Die ” Relation ⊆ ( ist Teilmenge von“) ist eine Ordnungsrelation, jedoch keine Totalordnung auf ” P(R), der Potenzmenge von R. Die Potenzmenge P(X) zu einer Menge X ist dabei als die Menge aller Teilmengen von X definiert. Kapitel 1 Normen und Skalarprodukte 1.1 Normen Definition (Norm). Sei V ein Vektorraum über K. Eine Funktion V → R, v 7→ kvk heißt eine Norm auf V , wenn sie die nachfolgenden vier Eigenschaften erfüllt: (1) Nichtnegativität: Für alle v ∈ V gilt kvk ≥ 0. (2) Definitheit: Für alle v ∈ V gilt kvk = 0 ⇐⇒ v = 0. (3) Homogenität: Für alle v ∈ V und alle α ∈ K gilt kαvk = |α| kvk. (4) Dreiecksungleichung: Für alle v, w ∈ V gilt kv + wk ≤ kvk + kwk. Es ist allgemein üblich, eine Norm V → R, v 7→ kvk vereinfachend mit k · k zu bezeichnen. Da eine solche Norm eine Funktion von V nach R ist, kann man sie auch als k·k : V → R in Funktionsschreibweise darstellen. Der Punkt deutet hierbei die Stelle der Variable an. Ist v ∈ V ein beliebiger Vektor, so nennt man die reelle Zahl kvk üblichweise die Norm von v. Der Begriff Norm“ wird also sowohl als Bezeichnung für die Funktion k · k als auch ” für einzelne Funktionswerte von k · k verwendet. Nachfolgend geben wir einige wichtige Beispiele für Normen an. Beispiele. (a) Die reelle Betragsfunktion R → R, a 7→ |a| ist eine Norm auf R. (b) Die komplexe Betragsfunktion C → R, z 7→ |z| ist eine Norm auf C. 8 1.1. NORMEN 9 (c) Für jede natürliche Zahl n ∈ N definiert man auf dem Vektorraum Rn die so genannte euklidische Norm | · | : Rn → R durch n X |x| := !1/2 x2i = q x21 + x22 + . . . + x2n i=1 für alle x = (x1 , x2 , . . . , xn )T ∈ Rn . Die euklidische Norm auf Rn wird gelegentlich auch als die Standardnorm auf Rn bezeichnet. Man beachte, dass für n√= 1 die euklidische Norm genau der Betragsfunktion auf R = R1 entspricht, da x2 = |x| für alle x ∈ R gilt. Die euklidische Norm kann also als Verallgemeinerung der Betragsfunktion angesehen werden, weshalb wir auch Betragsstriche zur Kennzeichnung dieser Norm verwenden. Im Mathematikunterricht der Oberstufe wird die euklidische Norm eines Vektors im R3 als der Betrag des ” Vektors“ eingeführt. (d) Für jede natürliche Zahl n ∈ N definiert man auf dem Vektorraum Cn die so genannte Standardnorm | · | : Cn → R durch |x| := n X !1/2 2 |xi | = p |x1 |2 + |x2 |2 + . . . + |xn |2 i=1 für alle x = (x1 , x2 , . . . , xn )T ∈ Cn . Für n = 1 entspricht die Standardnorm auf Cn genau der komplexen Betragsfunktion. (e) Für jede natürliche Zahl n ∈ N definiert man auf Kn die so genannte Betragssummennorm k · k1 : Kn → R durch kxk1 := n X |xi | = |x1 | + |x2 | + . . . + |xn | i=1 für alle x = (x1 , x2 , . . . , xn )T ∈ Kn . Die Betragssummennorm wird gelegentlich auch als Einsnorm bezeichnet. (f) Für jede natürliche Zahl n ∈ N definiert man auf Kn die so genannte Maximumnorm k · k∞ : Kn → R durch kxk∞ := max |xi | = max |x1 |, |x2 |, . . . , |xn | i=1,...,n für alle x = (x1 , x2 , . . . , xn)T ∈ Kn . Hierbei bezeichnet max |x1 |, |x2 |, . . . , |xn | das größte Element der Menge |x1 |, |x2 |, . . . , |xn | . Die Maximumnorm wird gelegentlich auch als Tschebyschev–Norm oder als Unendlichnorm bezeichnet. (g) Für jede natürliche Zahl n ∈ N und jede reelle Zahl p ≥ 1 definiert man auf dem Vektorraum Rn die so genannte p-Norm k · kp : Kn → R durch kxkp := n X !1/p |xi |p i=1 für alle x = (x1 , x2 , . . . , xn )T ∈ Kn . = q p |x1 |p + |x2 |p + . . . + |xn |p 10 KAPITEL 1. NORMEN UND SKALARPRODUKTE Abbildung 1.1: Die Bedeutung der Dreiecksungleichung: Der Abstand zwischen v und w ist stets kleiner oder gleich der Summe der Abstände zwischen v und u sowie zwischen u und w. Für p = 1 entspricht die p-Norm genau der Betragssummennorm, und für p = 2 genau der euklidischen Norm auf Rn bzw. der Standardnorm auf Cn . Die Betragssummennorm, die euklidische Norm auf Rn und die Standardnorm auf Cn sind also spezielle p-Normen. (h) Sei n ∈ N eine natürliche Zahl, und sei w = (w1 , w2 , . . . , wn )T ∈ Rn ein Vektor mit positiven Komponenten, d.h. es gelte wi > 0 für alle i = 1, 2, . . . , n. Dann ist die Abbildung k · kw : Rn → R, definiert durch !1/2 q n X kxkw := wi x2i = w1 x21 + w2 x22 + . . . + wn x2n i=1 für alle x = (x1 , x2 , . . . , xn )T ∈ Rn , eine Norm auf Rn . Man beachte, dass für w = (1, 1, . . . , 1)T die Norm k · kw genau der euklidischen Norm entspricht. ♦ Definition (normierter Raum). Sei V ein Vektorraum über K, und sei k · k eine Norm auf V . Dann heißt das Paar (V, k · k) ein normierter Raum über K. Der Begriff normierter Raum“ ist ähnlich allgemein wie der Begriff Gruppe“ oder der ” ” Begriff Vektorraum“. Die Aussage, dass ein Paar (V, k · k) ein normierter Raum über K ” ist, bedeutet nicht mehr und nicht weniger als dass V ein Vektorraum über K ist, und dass k · k eine Norm auf V ist. Man sagt auch, dass der Vektorraum V mit der Norm k · k versehen und so zum normierten Raum (V, k · k) wird. In der Regel gibt es eine Vielzahl unterschiedlicher Normen, mit denen ein gegebener Vektorraum versehen werden kann. Man betrachte dazu etwa die zuvor genannten Beispiele. Für manche Vektorräume ist es jedoch in gewisser Weise natürlich“, diese mit einer ” ganz bestimmten Norm zu versehen. Das gilt auch für die Vektorräume Rn , n ∈ N, für die man die folgende Vereinbarung trifft. Vereinbarung. Ist nichts gegenteiliges ausgesagt, so ist für alle n ∈ N der Vektorraum Rn mit der euklidischen Norm versehen. Wir wenden uns nun einigen Begriffen zu, die man in einem normierten Raum definieren kann. Ist (V, k · k) ein normierter Raum über K, so kann man auf V den Abstand d(v, w) zwischen je zwei Vektoren v, w ∈ V gemäß d(v, w) := kw − vk 1.1. NORMEN (a) 11 (b) (c) Abbildung 1.2: (a) Die offene Kugel Br (v) in R2 bezüglich der euklidischen Norm. (b) Die abgeschlossene Kugel Br (v) in R2 bezüglich der euklidischen Norm. (c) Die Sphäre Sr (v) in R2 bezüglich der euklidischen Norm. definieren. Aufgrund der Nichtnegativität der Norm k · k, ist der Abstand zwischen zwei beliebigen Vektoren stets größer oder gleich Null. Aufgrund der Definitheit von k · k beträgt der Abstand zwischen zwei Vektoren genau dann Null, wenn die beiden Vektoren identisch sind. Die Homogenität von k · k garantiert außerdem, dass d(v, w) = d(w, v) für alle v, w ∈ V gilt. Die Dreiecksungleichung impliziert schließlich, dass d(v, w) ≤ d(v, u) + d(u, w) für alle Vektoren u, v, w ∈ V gilt. Anschaulich bedeutet dies, dass die Länge der Verbindungsstrecke zwischen den Punkten“ v und w stets kleiner oder gleich groß ist wie die ” Summe der Längen zweier Verbindungsstrecken, welche den Punkt v bzw. den Punkt w mit einem beliebigen dritten Punkt u verbinden. Die Verbindungsstreck zwischen v und w gibt also den kürzesten Weg zwischen beiden Punkten an. Man beachte, dass die hier diskutierten Eigenschaften des Abstandes zwischen zwei Vektoren oder Punkten unabhängig von der Norm gelten, durch die der Abstand definiert ist. Die Norm bestimmt lediglich die Größe des Abstandes zwischen zwei gegebenen Vektoren. Es zeigt sich, dass in den Vektorräumen R1 , R2 und R3 der Abstand, welchen man für die euklidische Norm erhält, genau dem geometrischen Abstand entspricht. Dies ist mit ein Grund dafür, weshalb man zu gegebenem n ∈ N den Vektorraum Rn standardmäßig mit der euklidischen Norm versieht. Betrachtet man zu einem vorgegebenen Punkt x ∈ R2 sowie zu einer vorgegebenen Zahl r > 0 die Menge aller Punkte, deren Abstand (bezüglich der euklidischen Norm) zum Punkt x kleiner oder gleich r ist, so stellt man fest, dass diese Menge eine Kreisscheibe mit Mittelpunkt x und Radius r ist. Im Vektorraum R3 ist eine solche Menge eine Kugel mit Mittelpunkt x und Radius r. Man kann also Kreisscheiben und Kugeln anhand von Abständen zwischen Punkten in R2 und R3 definieren. In gleicher Weise kann man auch in beliebigen normierten Räumen so genannte Kugeln definieren. Definition (offene Kugel). Sei (V, k · k) ein normierter Raum. Zu jedem Vektor v ∈ V und jeder positiven Zahl r > 0 definiert man die Menge Br (v) := w ∈ V kw − vk < r . Diese Menge heißt die offene Kugel in V mit Mittelpunkt v und Radius r. Definition (abgeschlossene Kugel). Sei (V, k · k) ein normierter Raum. Zu jedem Vektor v ∈ V und jeder positiven Zahl r > 0 definiert man die Menge Br (v) := w ∈ V kw − vk ≤ r . 12 KAPITEL 1. NORMEN UND SKALARPRODUKTE (a) (b) (c) Abbildung 1.3: Offene Einheitskugeln um den Ursprung in R2 bezüglich (a) der Betragssummennorm k · k1 , (b) der euklidische Norm | · | und (c) der Maximumnorm k · k∞ . Diese Menge heißt die abgeschlossene Kugel in V mit Mittelpunkt v und Radius r. Die Menge aller Punkte im Vektorraum R2 , welche denselben Abstand r > 0 (bezüglich der euklidischen Norm) zu einem vorgegebenen Punkt x haben, ist bekanntlich ein Kreis mit Radius r und Mittelpunkt x. Im Vektorraum R3 ist bildet eine solche Menge die Oberfläche einer Kugel. Eine solche Menge wird auch Sphäre genannt. Solche Sphären kann man auch in allgemeinen normierten Räumen definieren. Definition (Sphäre). Sei (V, k · k) ein normierter Raum. Zu jedem Vektor v ∈ V und jeder positiven Zahl r > 0 definiert man die Menge Sr (v) := w ∈ V kw − vk = r . Man nennt diese Menge die Sphäre in V mit Mittelpunkt v und Radius r. Offenbar gilt Br (v) = Br (v) \ Sr (v), Br (v) = Br (v) ∪ Sr (v), Sr (v) = Br (v) \ Br (v) für alle positiven Radien r > 0 und für alle Vektoren v eines normierten Raums. Von besonderer Bedeutung sind oft Kugeln und Sphären mit dem Radius 1. Solche Kugeln und Sphären werden als Einheitskugeln bzw. als Einheitssphären bezeichnet. Ist der Mittelpunkt einer Kugel oder einer Sphäre der Nullvektor, so spricht man von einer Kugel bzw. einer Sphäre um den Ursprung. Man sollte sich klar machen, dass die geometrische Gestalt einer Kugel oder einer Sphäre stets von der Norm abhängt, mit der ein Vektorraum versehen wurde. So sind beispielsweise alle in Abbildung 1.3 skizzierten Mengen offene Kugeln in R2 , jede jedoch bezüglich einer anderen Norm auf R2 . Man erkennt, dass die nur die offene Kugel bezüglich der euklidischen Norm die geometrische Gestalt einer Kreisscheibe besitzt. Am Ende dieses Abschnitts geben wir noch ein nützliches Resultat an, welches als umgekehrte Dreieckungleichung bekannt ist. Satz 1.1 (Umgekehrte Dreiecksungleichung). Sei (V, k · k) ein normierter Raum. Dann gilt kvk − kwk ≤ kv − wk für alle Vektoren v, w ∈ V . 1.1. NORMEN 13 Da bekanntlich x ≤ |x| für alle x ∈ R gilt, folgt aus der umgekehrten Dreiecksungleichung auch, dass für alle Vektoren v und w eines mit einer Norm k · k versehenden Vektorraums die Ungleichung kvk − kwk ≤ kv − wk gilt. Ersetzt man w durch −w, so erhält man außerdem die Ungleichung kvk − kwk ≤ kv + wk. Da jede Norm die Dreiecksungleichung erfüllt, erhält man somit die Ungleichungskette kvk − kwk ≤ kv ± wk ≤ kvk + kwk für alle Vektoren v, w ∈ V . Übungsaufgaben 1. Berechnen Sie die euklidische Norm, die Maximumnorm und die Betragssummennorm der folgenden Vektoren: 2 1 1 0 a := −1 , b := 0 , c := 1 , d := −4 . 5 0 1 3 2. Skizzieren Sie die Einheitssphären S1 (0) in R2 bezüglich der Betragssummennorm, der euklidischen Norm und der Maximumnorm. 3. Sei V ein reeller Vektorraum, und sei k · k eine Norm auf V . Zeigen Sie, dass die nachfolgenden Gleichung und Ungleichungen für alle Vektoren u, v, w ∈ V und alle nichtnegativen Zahlen α, β ≥ 0 gelten. • k−vk = kvk. • kv − wk ≤ kv − uk + ku − wk. • kαv + βwk ≤ αkvk + βkwk. 4. Berechnen Sie (evtl. unter Zuhilfenahme eines Rechners) die p-Norm des Vektors 1 x= 2 für p = 1, p = 2, p = 4, p = 8 und p = 16, sowie dessen Maximumnorm. Was fällt Ihnen auf? 5. Sei (V, k · k) ein normierter Raum. Zeigen Sie, dass für alle Vektoren v, w ∈ V und alle positiven Zahlen r, s > 0 die folgenden Aussagen gelten: • kv − wk ≤ s − r =⇒ Br (v) ⊆ Bs (w). • kv − wk ≥ r + s =⇒ Br (v) ∩ Bs (w) = ∅. Hierbei bezeichnen Br (v) und Bs (w) die offenen Kugeln in V mit den Mittelpunkten v bzw. w und den Radien r bzw. s. 6. Weisen Sie nach, dass die Betragsfunktion eine Norm auf R ist. 7. Weisen Sie nach, dass die Betragssummennorm für alle n ∈ N eine Norm auf Rn ist. 14 1.2 KAPITEL 1. NORMEN UND SKALARPRODUKTE Skalarprodukte Definition (Skalarprodukt, inneres Produkt). Sei V ein reeller Vektorraum. Eine Funktion V × V → R, (v, w) 7→ hv , wi heißt ein Skalarprodukt oder ein inneres Produkt auf V , wenn die nachfolgenden vier Eigenschaften gelten: (1) Bilinearität: Für alle v, v1 , v2 , w, w1 , w2 ∈ V und alle α, β ∈ R gilt hv1 + v2 , wi = hv1 , wi + hv2 , wi, hαv , wi = αhv , wi, hv , w1 + w2 i = hv , w1 i + hv , w2 i, hv , βwi = βhv , wi. (2) Nichtnegativität: Für alle v ∈ V gilt hv , vi ≥ 0. (3) Definitheit: Für alle v ∈ V gilt hv , vi = 0 ⇐⇒ v = 0. (4) Symmetrie: Für alle v, w ∈ V gilt hv , wi = hw , vi. Gemäß obiger Definition ist ein Skalarprodukt auf einem reellen Vektorraum eine Funktion, welche von zwei Variablen (oder Argumenten) abhängt, und welche bilinear, nichtnegativ, definit und symmetrisch ist. Bilinear“ bedeutet hierbei, dass die Funktion linear bezüglich ” der ersten wie auch bezüglich der zweiten Variable ist. Symmetrisch“ bedeutet, dass sich ” der Wert eines Skalarprodukts nicht ändert, wenn man beide Variablen vertauscht. Es ist allgemein üblich, ein Skalarprodukt V × V → R, (v, w) 7→ hv , wi vereinfachend mit h · , · i zu bezeichnen. Da ein solches Skalarprodukt eine Funktion von V × V nach R ist, kann man es auch in Funktionsschreibweise gemäß h· , ·i : V × V → R darstellen. Die Punkte deuten hierbei die Stellen an, an denen die Variablen des Skalarprodukts stehen. Nachfolgend geben wir einige wichtige Beispiele für Skalarprodukte an. Beispiele. (a) Die gewöhnliche Multiplikation R × R → R, (a, b) 7→ ab ist ein Skalarprodukt auf R. (b) Für alle n ∈ N definiert man auf dem Vektorraum Rn das so genannte euklidische Skalarprodukt Rn × Rn → R, (x, y) 7→ x · y durch x · y := n X xi yi = x1 y1 + x2 y2 + · · · + xn yn i=1 für alle x = (x1 , x2 , . . . , xn )T ∈ Rn und alle y = (y1 , y2 , . . . , yn )T ∈ Rn . Das euklidische Skalarprodukt auf Rn wird gelegentlich auch als das Standardskalarprodukt auf Rn bezeichnet. Man beachte, dass für n = 1 das euklidische Skalarprodukt genau der gewöhnlichen Multiplikation auf R = R1 entspricht. Das euklidische Skalarprodukt kann also als 1.2. SKALARPRODUKTE 15 Verallgemeinerung der gewöhnlichen Multiplikation angesehen werden. Daher verwenden wir auch den Malpunkt · zur Kennzeichnung dieses Skalarprodukts. Im Mathematikunterricht der Oberstufe wird das euklidische Skalarprodukt auf R3 als das ” Skalarprodukt“ eingeführt. Tatsächlich ist es aber eines von vielen Skalarprodukten, die man auf dem Vektorraum R3 definieren kann. (c) Sei n ∈ N vorgegeben, und sei w = (w1 , w2 , . . . , wn )T ∈ Rn ein Vektor mit positiven Komponenten, d.h. es gelte wi > 0 für alle i = 1, 2, . . . , n. Dann ist die Abbildung Rn × Rn → R, (x, y) 7→ hx , yiw , welche durch hx , yiw := n X wi x i y i i=1 für alle x = (x1 , x2 , . . . , xn )T ∈ Rn und alle y = (y1 , y2 , . . . , yn )T ∈ Rn definiert ist, ein Skalarprodukt auf Rn . Für w = (1, 1, . . . , 1)T entspricht das Skalarprodukt h · , · iw genau dem euklidischen Skalarprodukt. (d) Die Abbildung h · , · i# : R2 → R2 → R, welche durch hx , yi# := 2x1 y1 − x1 y2 − x2 y1 + 2x2 y2 für alle x = (x1 , x2 )T ∈ R2 und alle y = (y1 , y2 )T ∈ R2 definiert ist, ist ein Skalarprodukt auf R2 . ♦ Definition (Innenproduktraum). Sei V ein reeller Vektorraum und sei h · , · i ein Skalarprodukt auf V . Dann heißt das Paar (V, h · , · i) ein reeller Innenproduktraum. Die Aussage, dass ein Paar (V, h · , · i) ein reeller Innenproduktraum ist, bedeutet nicht mehr und nicht weniger als dass V ein Vektorraum über R ist, und dass h · , · i ein Skalarprodukt auf V ist. Man sagt auch, dass der Vektorraum V mit dem Skalarprodukt h · , · i versehen und so zum Innenproduktraum (V, h · , · i) wird. Ähnlich wie bei den normierten Räumen, ist es üblich gewisse Vektorräume mit ganz bestimmten Normen standardmäßig zu versehen. Insbesondere trifft man die nachfolgende Vereinbarung. Vereinbarung. Ist nichts gegenteiliges ausgesagt, so ist für alle n ∈ N der Vektorraum Rn mit dem euklidischen Skalarprodukt versehen. Abschließend erwähnen wir noch eine wichtige Eigenschaft transponierter Matrizen in Bezug auf das euklidische Skalarprodukt. Satz 1.2. Seien m, n ∈ N zwei natürliche Zahlen, sei A ∈ Rm×n eine beliebige Matrix, und sei AT ∈ Rn×m die Transponierte zu A. Dann gilt x · Ay = (AT x) · y für alle x ∈ Rm und alle y ∈ Rn . 16 KAPITEL 1. NORMEN UND SKALARPRODUKTE Übungsaufgaben 1. Geben seien die Vektoren −2 a := −5 , 3 1 b := 2 , 4 0 c := 1 . −1 Berechnen Sie a · b, a · c und b · c, sowie a · a, b · b und c · c. 2. Sei V ein reeller Vektorraum, und sei h · , · i ein Skalarprodukt auf V . Weisen Sie nach, dass die nachfolgenden Rechenregeln für alle v, w, x, y ∈ V und alle α, β ∈ R gelten: • hαv + βw , xi = αhv , xi + βhw , xi. • hv , αx + βyi = αhv , xi + βhv , yi. • hv + w , x + yi = hv , xi + hv , yi + hw , xi + hw , yi. • h−v , −wi = hv , wi. • h−v , wi = −hv , wi = hv , −wi. • hv , 0i = h0 , wi = 0. 1.3. INDUZIERTE NORMEN 1.3 17 Induzierte Normen Bislang wurden Innenprodukträume und normierte Räume separat eingeführt. In diesem Abschnitt wird gezeigt, dass jeder Innenproduktraum auch als normierter Raum aufgefasst werden kann. Satz und Definition 1.3 (induzierte Norm). Sei (V, h · , · i) ein reeller Innenproduktraum. Dann kann man V mit einer Norm V → R, v 7→ kvk versehen, welche durch p kvk := hv , vi für alle v ∈ V definiert ist. Diese Norm wird als die vom Skalarprodukt h · , · i induzierte Norm auf V bezeichnet. Da jedes Skalarprodukt auf einem Vektorraum gemäß Satz und Definition 1.3 auch eine Norm auf dem Vektorraum induziert, ist jeder Innenproduktraum in natürlicher Weise auch ein normierter Raum. Man versieht einen Innenproduktraum nämlich standardmäßig mit der Norm, die vom jeweiligen Skalarprodukt induziert wird. Beispiele. (a) Die reelle Betragsfunktion wird als √ Norm auf R von der gewöhnlichen Multiplikation auf R induziert, da bekanntlich x2 = |x| für alle x ∈ R gilt. (b) Die euklidische Norm wird vom euklidischen Skalarprodukt induziert, d.h. es gilt |x| = √ x·x für alle x ∈ Rn und alle n ∈ N, wie man leicht nachrechnet. (c) Für jedes fest gewählte n ∈ N und jeden fest gewählten Vektor w ∈ Rn mit positiven Komponenten, wird die Norm k · kw (siehe Beispiel (f) auf Seite 10) vom Skalarprodukt h · , · iw (Beispiel (c) auf Seite 15) induziert. ♦ Für Normen, die von Skalarprodukten induziert werden, gelten eine Reihe wichtiger Gleichungen und Ungleichungen, die im nachfolgenden Satz zusammengetragen wurden. Satz 1.4. Sei (V, h · , · i) ein Innenproduktraum über R, und sei k · k die vom Skalarprodukt h · , · i induzierte Norm auf V . Dann gelten die folgenden Resultate: (1) Binomische Formeln: Für alle v, w ∈ V gilt kv + wk2 = kvk2 + 2hv , wi + kwk2 , kv − wk2 = kvk2 − 2hv , wi + kwk2 , hv − w , v + wi = kvk2 − kwk2 . (2) Für alle v, w ∈ V gilt 1 1 |hv , wi| ≤ kvk2 + kwk2 . 2 2 18 KAPITEL 1. NORMEN UND SKALARPRODUKTE (3) Cauchy–Schwarzsche Ungleichung: Für alle v, w ∈ V gilt |hv , wi| ≤ kvk kwk. (4) Dreiecksungleichung: Für alle v, w ∈ V gilt kv + wk ≤ kvk + kwk. (5) Parallelogrammgleichung: Für alle v, w ∈ V gilt kv + wk2 + kv − wk2 = 2kvk2 + 2kwk2 . (6) Für alle v, w ∈ V gilt hv , wi = 1 kv + wk2 − kv − wk2 . 4 Die Cauchy–Schwarzsche Ungleichung und die Dreiecksungleichung sind wichtige Hilfsmittel der Analysis. Hinsichtlich der Frage, ob eine gegebene Norm auf einem Vektorraum von einem Skalarprodukt induziert wird, kommt der Parallelogrammgleichung kommt eine besondere Bedeutung zu. Man kann nämlich zeigen, dass eine Norm genau dann von einem Skalarprodukt induziert wird, wenn sie die Parallelogrammgleichung erfüllt. Auf reellen Innenprodukträumen kann man in der folgenden Weise Winkel zwischen zwei Vektoren definieren. Definition (Winkel). Sei (V, h · , · i) ein Innenproduktraum über R, und sei k · k die von h · , · i induzierte Norm auf V . Dann definiert man zu je zwei Vektoren v, w ∈ V \ {0} die Zahl ∠(v, w) ∈ [0, π] durch hv , wi ∠(v, w) := arccos . kvk kwk Die Zahl ∠(v, w) heißt der Winkel zwischen v und w bezüglich h · , · i. Es muss betont werden, dass der Winkel zwischen zwei gegebenen Vektoren eines reellen Vektorraums V von dem Skalarprodukt abhängt, mit dem V versehen ist. Man betrachte beispielsweise die Vektoren 1 1 x := , y := √ 0 3 des R2 . Der Winkel zwischen beiden Vektoren bezüglich dem euklidischen Skalarprodukt beträgt x·y 1 π = arccos = (= 60◦ ). ∠(x, y) = arccos |x| |y| 2 3 Bezüglich dem Skalarprodukt h · , · iw auf R2 mit w := (3, 1)T (siehe Beispiel (c) auf Seite 15) hingegen, gilt √ hx , yiw 2 π ∠(x, y) = arccos = arccos = (= 45◦ ). kxkw kykw 2 4 Man stellt fest, dass der Winkel zwischen je zwei Vektoren des R2 bzw. des R3 bezüglich euklidischen Skalarprodukt genau dem geometrischen Winkel entspricht, den man beispielsweise mit Hilfe eines Geodreiecks messen kann. Dies ist mit ein Grund dafür, weshalb man für jede natürliche Zahl n ∈ N den Vektorraum Rn standardmäßig mit dem euklidische Skalarprodukt versieht. 1.3. INDUZIERTE NORMEN 19 Übungsaufgaben 1. Zeigen Sie mit Hilfe der Cauchy–Schwarzschen Ungleichung, dass (x1 y1 + x2 y2 + · · · + xn yn )2 ≤ x21 + x22 + · · · + x2n y12 + y22 + · · · + yn2 für beliebige reelle Zahlen x1 , x2 , . . . , xn , y1 , y2 , . . . , yn ∈ R gilt. 2. Geben Sie die Norm k · k# : R2 → R an, die vom Skalarprodukt h · , · i# induziert wird (siehe Beispiel (d) auf Seite 15). Berechnen Sie anschließend kak# , kbk# und kck# , wobei √ 1 2 1 √2 . a := , b := , c := −1 0 2 2 3. Berechnen Sie für die Vektoren a := 4 , 0 b := √ √2 , 2 c := −1 1 die Winkel ∠(a, a), ∠(a, b), ∠(−a, b), ∠(a, c) und ∠(b, c). Der Vektorraum R2 sei hierbei mit dem euklidischen Skalarprodukt versehen. 4. Sei (V, h · , · i) ein Innenproduktraum über R. Zeigen Sie, dass ∠(αv, βw) = ∠(v, w) für alle Vektoren v, w ∈ V \ {0} und alle positiven reellen Zahlen α, β > 0 gilt. 20 KAPITEL 1. NORMEN UND SKALARPRODUKTE Abbildung 1.4: Die Vektoren v, w und v + w bzw. v − w bilden die Kanten eines rechtwinkligen Dreiecks. Für die entsprechenden Kantenlängen 1.4 Orthonormalbasen Ein wichtiger Begriff, den man in Innenprodukträumen definieren kann, ist der Begriff der Orthogonalität. Definition (Orthogonalität). Sei (V, h · , · i) ein Innenproduktraum über R. Man sagt dass zwei Vektoren v, w ∈ V zueinander orthogonal sind, wenn hv , wi = 0 gilt. In diesem Fall schreibt man v ⊥ w. Bekanntlich gilt cos(π/2) = 0. Daher sind zwei von Null verschiedene Vektoren w und v eines reellen Vektorraums V genau dann orthogonal zueinander bezüglich einem Skalarprodukt h · , · i auf V , wenn hv , wi π ∠(v, w) = arccos = (= 90◦ ) kvk kwk 2 gilt, wobei k · k die von h · , · i induzierte Norm auf V bezeichnet. Die Vektoren sind also genau dann zueinander orthogonal, wenn sie im rechten Winkel zueinander stehen. Man muss sich jedoch immer wieder klar machen, dass der Winkel zwischen zwei Vekoren ebenso wie die Eigenschaft der Orthogonalität von dem Skalarprodukt abhängig sind, mit dem ein reeller Vektorraum versehen ist. Bezüglich dem euklidischen Skalarprodukt gilt beispielsweise, dass zwei von Null verschiedene Vektoren des R2 bzw. des R3 genau dann zueinander orthogonal sind, wenn sie im geometrischen Sinne senkrecht zueinander stehen. Versieht man die Räume R2 bzw. R3 mit anderen Skalarprodukten, gilt diese Aussage im allgemeinen jedoch nicht. Ein wichtiges Resultat, welches für orthogonale Vektoren gilt, ist der berühmte Satz des Pythagoras. Man betrachte dazu auch die Abbildung 1.4. Satz 1.5 (Pythagoras). Sei (V, h · , · i) ein Innenproduktraum über R, und sei k · k die von h · , · i induzierte Norm. Seien außerdem v, w ∈ V zwei zueinander orthogonale Vektoren. Dann gilt kv + wk2 = kvk2 + kwk2 = kv − wk2 . Mit dem Satz des Pythagoras kann man insbesondere das folgende Lemma beweisen. 1.4. ORTHONORMALBASEN 21 Lemma 1.6. Sei (V, h · , · i) ein Innenproduktraum über R, und seien v1 , v2 , . . . , vn ∈ V \ {0} von Null verschiedene Vektoren, die paarweise zueinander orthogonal sind, d.h. es gelte hvi , vj i = 0 für alle i, j ∈ {1, 2, . . . , n} mit i 6= j. Dann sind diese Vektoren linear unabhängig. Als nächstes betrachten wir Basen von endlichdimensionalen Vektorräumen, die aus zueinander orthogonalen Vektoren bestehen. Definition (Orthogonalbasis). Sei U ein Untervektorraum eines reellen Vektorraums V , welcher mit einem Skalarprodukt h · , · i versehen ist. Eine Basis {p1 , p2 , . . . , pm } von U heißt Orthogonalbasis bezüglich h · , · i, wenn hpi , pj i = 0 für alle i, j ∈ {1, 2, . . . , m} mit i 6= j gilt, d.h. wenn die Basisvektoren paarweise orthogonal zueinander sind. Im Rest dieses Abschnitts wenden wir uns eine speziellen Klasse von Orthogonalbasen, den so genannten Orthonormalbasen, zu. Definition (Orthonormalbasis). Sei U ein Untervektorraum eines reellen Vektorraums V , welcher mit einem Skalarprodukt h · , · i versehen ist. Eine Basis {q1 , q2 , . . . , qm } von U heißt Orthonormalbasis (abgekürzt ONB ) bezüglich h · , · i, wenn ( 1 falls i = j, hqi , qj i = für alle i, j = 1, 2, . . . , m 0 falls i 6= j gilt. Man vergegenwärtige sich noch einmal, dass für alle Vektoren v eines reellen Vektorraums V , welcher mit einem Skalarprodukt h · , · i versehen ist, die Gleichung hv , vi = kvk2 gilt, wobei k · k die von h · , · i induzierte Norm auf V bezeichnet. Daher ist die Basis {q1 , q2 , . . . , qm } eines Untervektorraums genau dann eine Orthonormalbasis, wenn sie eine Orthogonal basis ist, und wenn alle Basisvektoren bezüglich der induzierten Norm auf Eins normiert sind, d.h. wenn kqi k = 1 für alle i = 1, 2, . . . , m gilt. Nachfolgend geben wir einige Beispiele für Orthonormalbasen endlichdimensionale Vektorräume über R an. Beispiele. (a) Für jede natürliche Zahl n ∈ N ist die so genannte Standardbasis {e(1) , e(2) , . . . , e(n) } des Rn , welche durch 0 1 0 1 0 0 e(1) := 0 , e(2) := 0 , . . . , e(n) := ... .. .. 0 . . 1 0 0 gegeben ist, eine Orthonormalbasis bezüglich dem euklidischen Skalarprodukt. 22 KAPITEL 1. NORMEN UND SKALARPRODUKTE (b) Die Vektoren √ v (1) 1 2 −1 , := 2 0 v (2) √ 1 3 1 , := 3 1 √ v (3) 1 6 1 := 6 −2 bilden eine Orthonormalbasis des R3 bezüglich dem euklidischen Skalarprodukt. Für Orthonormalbasen gelten eine Reihe wichtiger Resultate, welche im folgenden Satz zusammengefasst sind. Satz 1.7. Sei (V, h · , · i) ein endlichdimensionaler, reeller Innenproduktraum, und sei k · k die von h · , · i induzierte Norm. Sei außerdem {q1 , q2 , . . . , qn } eine Orthonormalbasis von V . Dann gelten die folgenden Aussagen. (1) Orthogonalentwicklung: Für alle v ∈ V gilt v = hq1 , viq1 + hq2 , viq2 + · · · + hqn , viqn . (2) Parsevalsche Gleichung: Für alle v ∈ V gilt kvk2 = |hq1 , vi|2 + |hq2 , vi|2 + · · · + |hqn , vi|2 . (3) Äquidistanz: Für alle i, j ∈ {1, 2, . . . , n} gilt ( 0 falls i = j, kqi − qj k = √ 2 falls i 6= j. Abschließend soll hier noch diskutiert werden, wie man zu einem gegebenen Vektorraum eine Orthonormalbasis konstruieren kann. Wichtigstes Hilfsmittel einer solchen Konstruktion ist das so genannte Gram–Schmidtsche Orthogonalsierungsverfahren, welches durch das nachfolgende Lemma motiviert ist. Lemma 1.8. Sei (V, h · , · i) ein reeller Innenproduktraum und {p1 , p2 , . . . , pm } ⊆ V \ {0} eine Menge von Vektoren, die paarweise zueinander orthogonal sind. Sei außerdem v ∈ V ein beliebiger Vektor. Dann ist der Vektor p := v − hp1 , vi hp2 , vi hpm , vi p1 − p2 − · · · − pm hp1 , p1 i hp2 , p2 i hpm , pm i zu jedem Vektor der Menge {p1 , p2 , . . . , pm } orthogonal. Algorithmus (Gram–Schmidtsches Orthogonalisierungsverfahren). Sei (V, h · , · i) ein reeller Innenproduktraum, und seien v1 , v2 , . . . , vm ∈ V linear unabhängige Vektoren. Berechnet man die Vektoren p1 , p2 , . . . , pm ∈ V gemäß p1 := v1 , p2 := v2 − hp1 , v2 i p1 , hp1 , p1 i 1.4. ORTHONORMALBASEN p3 := v3 − 23 hp1 , v3 i hp2 , v3 i p1 − p2 , hp1 , p1 i hp2 , p2 i .. . pm := vm − hp1 , vm i hp2 , vm i hpm−1 , vm i p1 − p2 − · · · − pm−1 , hp1 , p1 i hp2 , p2 i hpm−1 , pm−1 i dann ist {p1 , p2 , . . . , pm } eine Orthogonalbasis von span{v1 , v2 , . . . , vm }. Mit Hilfe des Gram–Schmidtschen Orthogonalisierungsverfahrens kann man aus einer gegebenen Basis {v1 , v2 , . . . , vm } eines Vektorraums eine Orthogonalbasis {p1 , p2 , . . . , pm } desselben Vektorraums konstruieren. Normiert man die Vektoren dieser Orthogonalbasis auf Eins, so erhält man eine Orthonormalbasis des Vektorraums. Beispiel. Gegeben seien die linear unabhängigen Vektoren 2 −1 v (1) := 1 , v (2) := 2 . −1 2 Gesucht ist eine Orthonormalbasis {q (1) , q (2) } von span{v (1) , v (2) } bezüglich des euklidischen Skalarprodukts. • Orthogonalisierung (Gram–Schmidtsches Orthogonalisierungsverfahren): 2 (1) (1) 1 , p := v = −1 2 −1/3 −1 −1 (1) (2) p ·v 1 (−2) (2) (2) (1) 1 = 7/3 = 7 . 2 − p := v − (1) (1) p = 6 3 p ·p −1 5/3 5 2 • Normierung: q (1) := q (2) := 1 |p(1) | 1 |p(2) | √ p(1) p(2) 2 6 1 , = 6 −1 √ √ −1 −1 3 1 3 7 = 7 . = · 5 3 15 5 5 ♦ Zum Abschluss dieses Abschnitts wenden wird uns nun noch einer besonderen Klasse von Funktionen zu, die eine besondere Rolle in vielen Teilbereichen der Mathematik spielen. Definition (Funktional). Sei V ein Vektorraum über K. Eine Funktion f : V → K heißt ein Funktional auf V . Ein Funktional ist also eine Funktion, welche die Vektoren eines Vektorraums auf Elemente des Körpers abbildet, über dem der Vektorraum definiert ist. Für lineare Funktionale auf den Vektorräumen Rn gilt ein wichtiger Satz, der als Rieszscher Darstellungssatz bekannt ist. 24 KAPITEL 1. NORMEN UND SKALARPRODUKTE Satz 1.9 (Rieszscher Darstellungssatz). Sei n ∈ N eine natürliche Zahl, f : Rn → R ein lineares Funktional auf Rn und h · , · i ein Skalarprodukt auf Rn . Dann existiert ein eindeutig bestimmter Vektor vf ∈ Rn , so dass f (x) = hvf , xi für alle x ∈ Rn gilt. Der Rieszsche Darstellungssatz besagt, dass jedes lineare Funktional auf Rn durch ein beliebig gewähltes Skalarprodukt dargestellt werden kann. Insbesondere existiert zu jedem linearen Funktional f : Rn → R ein eindeutig bestimmter Vektor vf ∈ V , so dass f (x) = vf · x für alle x ∈ Rn gilt. Übungsaufgaben 1. Bestimmen Sie die Orthogonalentwicklungen der Vektoren 1 1 1 x := 2 , y := 0 , z := −1 3 0 0 bezüglich der Orthormalbasis {q (1) , q (2) , q (3) } des R3 , welche durch √ √ √ 1 1 1 3 2 6 1 , q (2) := −1 , q (3) := 1 q (1) := 3 2 6 1 0 −2 gegeben ist. 2. Bestimmen Sie zwei Orthonormalbasen des R3 bezüglich dem euklidischen Skalarprodukt, indem Sie die folgenden Basen unter Verwendung des Gram–Schmidtschen Orthogonalisierungsverfahrens orthonormalsieren: 1 1 −1 1 −1 2 1 , 1 1 . 1 , 5 , 1 , 2 1 1 1 2 2 3. Bestimmen Sie eine Orthonormalbasis des R2 bezüglich h · , · i# (siehe Beispiel (d) auf Seite 15), indem Sie die Standardbasis des R2 entsprechend orthonormalisieren. 4. Sei n ∈ N eine natürliche Zahl. Für jedes j = 1, 2, . . . , n sei das lineare Funktional pj : Rn → R durch pj (x) = xj für alle x = (x1 , x2 , . . . , xn )T ∈ Rn definiert. Geben Sie für jedes j = 1, 2, . . . , n einen Vektor vpj ∈ Rn an, so dass pj (x) = vpj · x für alle x ∈ Rn gilt. 1.5. DEFINITHEIT SYMMETRISCHER MATRIZEN 1.5 25 Definitheit symmetrischer Matrizen Definition (symmetrische Matrix). Zu einer gegebenen natürlichen Zahl n ∈ N heißt eine Matrix A ∈ Rn×n symmetrisch, wenn AT = A gilt. Die Menge aller symmetrischen n×n bezeichnet. n × n-Matrizen mit reellen Matrixkomponenten wird gelegentlich mit Rsym Beispiele. (a) Die folgenden Matrizen 1 0 0 sind symmetrisch: 0 0 2 1 0 2 0 , 1 2 1 , 0 3 0 1 2 1 2 3 2 4 5 . 3 5 6 (b) Die folgenden Matrizen sind nicht symmetrisch: 1 2 3 1 2 0 0 4 5 , 3 1 2 . 0 0 6 0 2 1 Ist n ∈ N eine natürliche Zahl und A ∈ Rn×n sym eine symmetrische Matrix, so gilt nach Satz 1.2 insbesondere x · Ay = (Ax) · y für alle Vektoren x, y ∈ Rn . Der folgende Satz macht weiterhin Aussagen darüber, welche Matrixoperationen die Symmetrie einer Matrix erhalten. Satz 1.10. Sei n ∈ N eine beliebige natürliche Zahl. Dann gelten für alle symmetrischen Matrizen A, B ∈ Rn×n sym und für alle reellen Zahlen α ∈ R die folgenden Aussagen (1) A + B ∈ Rn×n sym . (2) αA ∈ Rn×n sym . (3) A−1 ∈ Rn×n sym , falls A regulär ist. (4) Ak ∈ Rn×n sym für alle k ∈ N0 . n×n ein Die Aussagen in Teil (1) und (2) von Satz 1.10 implizieren, dass die Menge Rsym n×n n×n Untervektorraum von R ist. Die Menge Rsym ist jedoch keine Gruppe bezüglich der Matrixmultiplikation, da das Produkt zweier symmetrischer Matrizen im allgemeinen keine symmetrische Matrix ist. Man betrachte etwa die beiden Matrix A, B ∈ R2×2 sym , welche durch 0 0 2 1 A := , B := 0 1 1 2 gegeben sind. Für das Produkt der beiden Matrizen gilt 0 0 0 1 AB = 6= = (AB)T , 1 2 0 2 was AB 6∈ R2×2 sym impliziert. Als nächstes führen wir das Konzept der positiven bzw. negativen Definitheit für quadratische Matrizen ein. Dieses spielt eine wichtige Rolle bei der Identifikation lokaler Extrema von Funktionalen auf Rn (siehe Abschnitt 6.6). 26 KAPITEL 1. NORMEN UND SKALARPRODUKTE Definition (positiv definite Matrix). Sei n ∈ N eine natürliche Zahl. Eine quadratische Matrix A ∈ Rn×n heißt positiv definit, wenn x · Ax > 0 für alle x ∈ Rn \ {0} gilt. Definition (negativ definite Matrix). Sei n ∈ N eine beliebige natürliche Zahl. Eine quadratische Matrix A ∈ Rn×n heißt negativ definit, wenn −A positiv definit ist, d.h. wenn x · Ax < 0 für alle x ∈ Rn \ {0} gilt. Im allgemeinen ist es nicht leicht zu erkennen, ob eine Matrix positiv bzw. negativ definit ist. Für symmetrische Matrizen kann man jedoch ein hinreichendes Kriterium für die positive Definitheit wie auch für die negative Definitheit angeben, welches auf den so genannten Hauptminoren der Matrix beruht. Definition (Hauptminor). Sei n ∈ N eine natürliche Zahl und A ∈ Rn×n eine quadratische Matrix. Für jede natürliche Zahl k ∈ {1, 2, . . . , n} definiert man die reelle Zahl A[k] ∈ R durch A11 A12 . . . A1k A21 A22 . . . A2k A[k] := det . .. .. . . . . . Ak1 Ak2 . . . Akk Die Zahl A[k] wird der k-te Hauptminor von A genannt. Offenbar gilt A[1] = A11 und A[n] = det A für jede natürliche Zahl n ∈ N und jede quadratische Matrix A ∈ Rn×n . Alle übrigen Hauptminoren berechnet man, indem man die Determinante einer quadratischen Teilmatrix“ von A berechnet, welche die Matrixkom” ponente A11 enthält. Man betrachte dazu die nachfolgenden Beispiele. Beispiele. (a) Die beiden Hauptminoren der Matrix −4 1 A := −2 −1 lauten A[1] = det −4 = −4, A[2] −4 1 = det = 6. −2 −1 (b) Die drei Hauptminoren der Matrix 2 1 0 B := −2 3 1 −1 0 2 sind durch B[1] = det 2 = 2, gegeben. B[2] = det 2 1 −2 3 2 1 0 = det −2 3 1 = 15 −1 0 2 = 8, B[3] ♦ 1.5. DEFINITHEIT SYMMETRISCHER MATRIZEN 27 Es sollte noch erwähnt werden, dass in der mathematischen Fachliteratur keine einheitliche Bezeichnungsweise für die Hauptminoren einer Matrix existiert. Auch die hier gewählte Schreibweise A[k] ist keinesfalls allgemein üblich. Als nächstes zeigen wir, wie man mit Hilfe von Hauptminoren die positive bzw. die negative Definitheit einer symmetrischen Matrix nachweisen kann. n×n Satz 1.11 (Hauptminorenkriterium). Sei n ∈ N eine natürliche Zahl und A ∈ Rsym eine symmetrische Matrix. Dann gelten die folgenden Aussagen. (1) A ist genau dann positiv definit, wenn alle Hauptminoren von A positiv sind, d.h. wenn sgn(A[k] ) = 1 für alle k = 1, 2, . . . , n gilt. (2) A ist genau dann negativ definit, wenn die Vorzeichen der Hauptminoren von A mit Minus beginnend alternieren, d.h. wenn sgn(A[k] ) = (−1)k für alle k = 1, 2, . . . , n gilt. In den nachfolgenden Beispielen wird gezeigt, wie man das Hauptminorenkriterium anwendet. Beispiele. (a) Für die Hauptminoren der symmetrischen Matrix 2 −1 0 2 −1 A := −1 0 −1 2 gilt A[1] = 2 > 0, A[2] = 3 > 0 und A[3] = 4 > 0. Daher ist A positiv definit. (b) Für die Hauptminoren der symmetrischen Matrix −4 0 1 0 B := 0 −2 1 0 −3 gilt B[1] = −4 < 0, B[2] = 8 > 0 und B[3] = −22 < 0. Daher ist B negativ definit. (c) Für die Hauptminoren der symmetrischen Matrix 3 2 3 C := 2 −2 0 3 0 1 gilt C[1] = 3 > 0, C[2] = −10 < 0 und C[3] = 8 > 0. Die Matrix C ist daher weder positiv definit noch negativ definit. Tatsächlich gilt e(1) · Ce(1) = 3 > 0 und e(2) · Ce(2) = −2 < 0, wobei e(1) = (1, 0, 0)T und e(2) = (0, 1, 0)T . Der Vollständigkeit halber geben wir zum Abschluss diese Abschnitts noch das folgende Resultat an, welches es einem erlaubt, auch nicht-symmetrische Matrizen mit dem Hauptminorenkriterium auf positive oder negative Definitheit hin zu untersuchen. Lemma 1.12. Eine quadratische Matrix A ∈ Rn×n ist genau dann positiv definit bzw. negativ definit, wenn die symmetrische Matrix A + AT positiv definit bzw. negativ definit ist. 28 KAPITEL 1. NORMEN UND SKALARPRODUKTE Übungsaufgaben 1. Sei n ∈ N eine natürliche Zahl, und sei A ∈ Rn×n eine quadratische Matrix. Zeigen Sie, dass die Matrizen AT A und AAT symmetrisch sind. 2. Zeigen Sie, dass für jede natürliche Zahl n ∈ N eine Matrix A ∈ Rn×n genau dann symmetrisch ist, wenn 1 A = A + AT 2 gilt. 3. Untersuchen Sie die folgenden symmetrischen Matrizen auf positive oder negative Definitheit. −4 2 0 1 1 2 4 −1 −1 3 −1 , C := −1 4 −1 . A := 2 −3 −2 , B := 1 0 −2 −1 2 −1 5 −1 −1 4 4. Sei n ∈ N eine natürliche Zahl, und sei A ∈ Rn×n eine symmetrische und positiv definite Matrix. Zeigen Sie, dass dann die Funktion h · , · iA : Rn × Rn → R, welche durch hx , yiA := x · Ay für alle x, y ∈ Rn definiert ist, ein Skalarprodukt auf Rn ist. Lernzielkontrolle Nach dem Durcharbeiten dieses Kapitels sollten Sie ... ... die definierenden Eigenschaften von Normen und Skalarprodukten kennen. ... wissen, wie offene Kugeln, abgeschlossene Kugeln und Sphären in einem normierten Raum definiert sind. ... wissen, auf welche Weise ein Skalarprodukt eine Norm induziert. ... wichtige Gleichungen und Ungleichungen für Normen und Skalarprodukte kennen. Sie sollten insbesondere die Dreiecksungleichung, die umgekehrte Dreiecksungleichung und die Cauchy–Schwarzsche Ungleichung kennen. ... das euklidische Skalarprodukt, die euklidische Norm, die Betragssummennorm und die Maximumnorm kennen. ... wissen, dass die euklidische Norm vom euklidischen Skalarprodukt induziert wird. ... wissen, was eine Orthonormalbasis ist. ... das Gram–Schmidtsche Orthogonalisierungsverfahren anwenden können. ... wissen, was eine positiv definite und was eine negativ definite, symmetrische Matrix ist. ... die Hauptminoren einer quadratischen Matrix berechnen können. ... das Hauptminorenkriterium für die positive bzw. die negative Definitheit einer symmetrischen Matrix kennen. 29 Kapitel 2 Grundbegriffe der Analysis 2.1 Folgen und Familien Definition (Folge). Sei X eine nichtleere Menge. Unter einer Folge in X versteht man eine Abbildung x : N → X. Üblicherweise nennt man für eine gegebene Zahl n ∈ N den Funktionswert x(n) das n-te Glied der Folge und bezeichnet ihn mit xn oder x(n) . Die Zahl n wird hierbei als der Index des Folgenglieds bezeichnet. Die Folge x : N → X selbst wird üblichweise mit (xn )n∈N , (xn )∞ n=1 , (xn ) oder x bezeichnet. Es ist darüber hinaus üblich eine Folge durch Angabe der ersten Folgenglieder in der Form (x1 , x2 , . . . ) darzustellen. Die Menge aller Folgen in X wird mit X N bezeichnet. Eine Folge ist tatsächlich nichts anderes als eine Funktion, deren Definitionsmenge die Menge der natürlichen Zahlen N ist. Mit einer Folge (xn )n∈N verbindet man oft die Vorstellung einer Anordnung von abzählbar unendlich vielen Elementen einer gegebenen Menge X. Das erste Folgenglied ist dabei das erste Element in der Anordnung, das zweite Folgenglied ist das zweite Element usw. Oft ist es sinnvoll, auch solche Funktionen als Folgen zu betrachten, deren Definitionsbereich die Menge N0 = N ∪ {0} oder eine Menge von der Form N ∪ {0, −1, −2, . . . , −m} mit m ∈ N ist. Eine Folge mit einer solchen Indexmenge stellt man üblicherweise durch (vn )∞ n=−m dar. Wir geben nun einige Beispiele für Folgen an. Beispiele. (a) Die Folge der ungeraden Zahlen (un )n∈N ist eine Folge in N, welche durch un := 2n−1 für alle n ∈ N definiert ist. Die ersten vier Folgenglieder lauten u1 = 1, u2 = 3, u3 = 5 und u4 = 7. Man stellt die Folge (un )n∈N darher gelegentlich auch als (1, 3, 5, 7, . . . ) dar. (b) Ist X eine nichtleere Menge, so wird eine Folge (cn )n∈N , welche durch cn := x für alle n ∈ N und ein fest gewähltes Element x ∈ X definiert ist, als eine konstante Folge bezeichnet. (c) Für jede natürliche Zahl k ∈ N definiert man die Folge e(k) ∈ {0, 1}N durch ( 1 falls n = k, e(k) n := 0 falls n 6= k für alle n ∈ N. Es gilt also e(1) = (1, 0, 0, 0, . . . ), e(2) = (0, 1, 0, 0, . . . ), e(3) = (0, 0, 1, 0, . . . ) usw. ♦ 30 2.1. FOLGEN UND FAMILIEN 31 Grundsätzlich gibt es zwei Möglichkeiten, eine Folge zu definieren. Die erste Möglichkeit ist die so genannte explizite Definition oder explizite Darstellung, bei der jedes Folgenglied unabhängig von allen übrigen Folgengliedern definiert wird. Eine explizite Definition einer Folge (xn )n∈N ist dabei von der Form xn := F (n) für alle n ∈ N, wobei F (n) ein Ausdruck ist, der lediglich vom Index n abhängig sein darf. Die Folgen in den zuvor genannten Beispielen etwa wurden alle explizit definiert. Die zweite Möglichkeit eine Folge zu definieren ist die so genannte rekursive Definition oder rekursive Darstellung. Bei der rekursiven Darstellung gibt man die ersten Glieder der Folge explizit an. Alle übrigen Folgenglieder werde in Abhängigkeit von anderen, bereits bekannten Folgengliedern definiert. Ist X eine nichtleere Menge, so ist eine rekursive Definition einer Folge (xn )n∈N in X von der Form x1 := y1 , x2 := y2 , .. . xk := yk , für alle n ∈ N mit n ≥ k + 1, xn := F (n, xn−1 , xn−2 , . . . , xn−k ) wobei k ∈ N eine natürliche Zahl und y1 , y2 , . . . , yk ∈ X vorgegebene Elemente sind. In der rekursiven Definition bezeichnet F (n, xn−1 , xn−2 , . . . , xn−k+1 ) einen Ausdruck, der lediglich vom Index n des Folgenglieds sowie von den Folgendgliedern xn−1 , xn−2 , . . . , xn−k+1 abhängig sein darf. Im Fall k = 1 wird eine Folge (xn )n∈N in X oftmals auch in der Form x1 := y1 , für alle n ∈ N xn+1 := F (n, xn ) mit y1 ∈ X rekursiv definiert. Hierbei bezeichnet F (n, xn ) einen Ausdruck, der nur von n und xn abhängen darf. Oft ist es von Vorteil, wenn man die explizite Darstellung einer Folge kennt. Ist jedoch nur eine rekursive Definition der Folge bekannt, so kann man versuchen, eine explizite Darstellung zu erraten. Dafür ist es oft hilfreich, einige Folgenglieder mit Hilfe der rekursiven Definition auszurechnen. Die geratene explizite Darstellung kann dannn mittels vollständiger Induktion und unter Verwendung der rekursiven Definition bewiesen werden. Man betrachte dazu auch die nachfolgenden Beispiele. Beispiele. (a) Gegeben sei die Folge (rn )n∈N in N, welche gemäß r1 := 2, rn := rn−1 + 2n für alle n ∈ N mit n ≥ 2 rekursiv definiert ist. Die ersten Glieder dieser Folge lauten r1 = 2, r2 = 6, r3 = 12 und r4 = 20. Mit etwas Nachdenken erkennt man, dass r1 = 1 · 2, r2 = 2 · 3, r3 = 3 · 4 und r4 = 4 · 5 gilt. Die Vermutung ist also, dass rn = n(n + 1) für alle n ∈ N 32 KAPITEL 2. GRUNDBEGRIFFE DER ANALYSIS gilt. Dies wäre eine explizite Darstellung der Folge (rn )n∈N . Wir beweisen diese Vermutung nun mittels vollständiger Induktion nach n. Für den Induktionsanfang erhält man r1 = 1 · (1 + 1) = 2, was offenbar richtig ist. Für den Induktionsschritt von n − 1 nach n nehmen wir an, dass rn−1 = (n−1)n für irgendeine natürliche Zahl n ∈ N gilt. Man erhält dann rn = rn−1 + 2n = (n − 1)n + 2n = n2 − n + 2n = n2 + n = n(n + 1). Damit ist die Vermutung bewiesen. (b) Gegeben sei die Folge (an )n∈N in Q, welche gemäß a1 := 1, an := an−1 an−1 + 2 für alle n ∈ N mit n ≥ 2 rekursiv definiert ist. Die ersten Glieder dieser Folge lauten a1 = 1, a2 = 1/3, a3 = 1/7 und a4 = 1/15. Betrachtet man die Nenner der Brüche, so fällt auf, dass 3 = 4 − 1 = 22 − 1 sowie 7 = 8 − 1 = 23 − 1 und 15 = 16 − 1 = 24 − 1 gilt. Eine naheliegende Vermutung ist also, dass an = 1 2n − 1 für alle n ∈ N gilt. Tatsächlich kann man dies mittels vollständiger Induktion nach n beweisen. Für den Induktionsanfang erhält man a1 = 1/(21 − 1) = 1/1 = 1. Für den Induktionsschritt nimmt man an, dass an−1 = 1/(2n−1 −1) für irgendeine natürliche Zahl n ∈ N gilt. Man erhält dann an = an−1 = an−1 + 2 1 2n−1 −1 1 + 2n−1 −1 2 = 1 1+ 2(2n−1 − 1) = 1 1 = n n 1+2 −2 2 −1 Damit ist die Vermutung bewiesen. ♦ Zum Abschluss dieses Kapitels führen wir noch den nützlichen Begriff der Familie ein. Definition (Familie). Ist X eine nichtleere Menge, so versteht man unter einer Familie in X eine Funktion x : I → X, wobei I eine nichtleere Menge ist. Die Menge I wird als die Indexmenge der Familie bezeichnet. Es ist üblich, für jeden Index i ∈ I den zugehörigen Funktionswert x(i) ∈ X mit xi oder x(i) zu bezeichnen und ihn das i-te Mitglied der Familie zu nennen. Die Familie x : I → X selbst wird üblicherweise mit (xi )i∈I bezeichnet. In der Regel stellt man sich eine Familie als Zusammenfassung einer beliebigen Anzahl von gleichartigen Objekten (wie z.B. Zahlen, Mengen oder Funktionen) zu einem Ganzen vor. Jedes Objekt wird dabei mit einem Index versehen, so dass es eindeutig identifiziert werden kann. Im Unterschied zu Mengen können Familien ein und dasselbe Objekt mehrfach enthalten. Wir wollen dies anhand einiger Beispiele verdeutlichen. Beispiele. (a) Sei I := {1, 2, 3} und F := {4, }. Dann ist (fi )i∈I mit f1 := 4, f2 := , f3 := 4 eine Familie in F , welche aus genau drei Mitgliedern besteht. Das Element 4 tritt genau zweimal als Mitglied in dieser Familie auf, das Element genau einmal. (b) Für jede ganze Zahl k ∈ Z sei σk := sgn(k) das Vorzeichen von k. Dann ist (σk )k∈Z eine Familie in {−1, 0, 1}, welche aus abzählbar unendlich vielen Mitgliedern besteht. Die Zahlen −1 und 1 treten jeweils abzählbar unendlich oft in dieser Familie auf, die Zahl 0 jedoch nur genau einmal. 2.1. FOLGEN UND FAMILIEN 33 (c) Für jede natürliche Zahl k ∈ N definieren wir die Menge Nk := {1, 2, . . . , k}. Dann ist (Nk )k∈N eine Familie bestehend aus Teilmengen von N. Die Mitglieder dieser Familie sind paarweise verschieden, d.h. es gilt Ni 6= Nj für alle i, j ∈ N mit i 6= j. (d) Für jede reelle Zahl α ∈ R sei die Funktion fα : R → R, x 7→ αx definiert. Dann ist (fα )α∈R eine Familie bestehend aus linearen Funktionen von R nach R. Diese Familie besteht aus überabzahlbar unendlich vielen Mitgliedern, welche paarweise verschieden sind. ♦ Oft ist es sinnvoll, bestimmte Mitglieder einer gegebenen Familie zu einer neuen Familie zusammenzufassen. Dies führt dann auf den Begriff der Teilfamilie. Definition (Teilfamilie). Sei X eine nichtleere Menge und (xi )i∈I eine Familie in X. Sei ferner J ⊆ I eine Teilmenge der Indexmenge von (xi )i∈I und (yj )j∈J eine Familie in X, so dass für jeden Index j ∈ J ein Index i ∈ I mit yj = xi existiert. Dann heißt (yj )j∈J eine Teilfamilie von (xi )i∈I . Man bezeichnet eine solche Teilfamilie in der Regel mit (xi )i∈J . Übungsaufgaben 1. Geben Sie die ersten 10 Folgenglieder der so genannten Fibonacci–Folge (fn )n∈N an, die folgendermaßen definiert ist f1 := 1, f2 := 1, für alle n ∈ N mit n ≥ 3. fn := fn−1 + fn−2 2. Geben Sie für die reellen Zahlenfolgen (an )n∈N , (bn )n∈N , (cn )n∈N und (dn )n∈N jeweils eine explizite Darstellung an. Die Folgen sind gemäß a1 := 1, b1 := 2, c1 := 1/2, d1 := 1, an := an−1 + 2n − 1, bn−1 , 2 1 cn := cn−1 + bn := 2 n , dn := n2 − dn−1 − (n − 2)2 für alle n ≥ N mit n ≥ 2 rekursiv definiert. Beweisen Sie mittels vollständiger Induktion, dass die jeweilige explizite Darstellung korrekt ist. 3. Sei (pα )α∈R eine Familie von Polynomen, welche gemäß pα (x) = x2 + (1 − α2 )x − 1 für alle x ∈ R und alle α ∈ R definiert sind. Untersuchen Sie, ob die Polynome f1 : R → R, x 7→ x2 , f2 : R → R, x 7→ x2 + x − 1, f3 : R → R, x 7→ x2 + 2x − 1, f4 : R → R, x 7→ (x − 1)(x + 1), Mitglieder dieser Familie sind. Untersuchen Sie auch, wie oft das jeweilige Polynom als Mitglied in der Familie (pα )α∈R auftritt. 34 2.2 KAPITEL 2. GRUNDBEGRIFFE DER ANALYSIS Algebren Definition (Algebra). Ein Vektorraum V über K wird eine Algebra über K genannt, wenn auf V eine bilineare Funktion V × V → V, (v, w) 7→ vw definiert ist, welche die Multiplikation auf V genannt wird. Ist V eine Algebra über K, so folgt aus der Bilinearität der Multiplikation auf V , dass für alle Vektoren v, v1 , v2 , w, w1 , w2 ∈ V und für alle Skalare α, β ∈ K die Gleichungen (v1 + v2 )w = v1 w + v2 w, (αv)w = α(vw), v(w1 + w2 ) = vw1 + vw2 , v(βw) = β(vw) gelten. Die Multiplikation auf einer Algebra erfüllt also insbesondere die Distributivgesetze. Es wird jedoch nicht gefordert, dass die Multiplation assoziativ oder gar kommutativ ist. Nachfolgend geben wir einige Beispiele für Algebren an. Beispiele. (a) Die Menge der reellen Zahlen ist eine Algebra über R. (b) Die Menge der komplexen Zahlen ist sowohl eine Algebra über C als auch eine Algebra über R. (c) Für jede natürliche Zahl n ∈ N ist die Menge Rn×n eine Algebra über R. Die Multiplikation auf dieser Algebra ist die gewöhnliche Matrixmultiplikation. Diese ist bekanntlich assoziativ, aber nicht kommutativ. (d) Ist V eine Algebra über K, so ist auch die Menge V N aller Folgen in V eine Algebra über K. Addition, skalare Multiplikation und Multiplikation auf V N werden dabei folgengliedweise definiert, d.h. für je zwei Folgen (vn )n∈N und (wn )n∈N in V und jedes Element α ∈ K definiert man (vn )n∈N + (wn )n∈N := (vn + wn )n∈N , α(vn )n∈N := (αvn )n∈N , (vn )n∈N (wn )n∈N := (vn wn )n∈N . (e) Ist V eine Algebra über K und X eine nichtleere Menge, so ist die Menge aller Funktionen von X nach V eine Algebra über K. Addition, skalare Multiplikation und Multiplikation werden dabei punktweise definiert, d.h. für je zwei Folgen f : X → V und g : X → V und für jedes Element α ∈ K definiert man die Funktionen f + g : X → V , αf : X → V und f g : X → V durch (f + g)(x) := f (x) + g(x), (αf )(x) := αf (x), (f g)(x) := f (x)g(x) für alle x ∈ X. 2.2. ALGEBREN 35 (f) Die Menge aller Polynome R → R, x 7→ α0 + α1 x + α2 x2 + · · · + αn xn mit reellen Koeffizienten α1 , α2 , . . . , αn ∈ R ist eine Algebra über R. Die Multiplikation auf dieser Algebra ist die punktweise Multiplikation, welche sowohl assoziativ als auch kommutativ ist. ♦ Wie man anhand der obigen Beispiele sieht, gibt es zahlreiche Mengen, auf denen man eine Addition, eine skalare Multiplikation und eine Multiplikation definieren kann, so dass die Menge zu einer Algebra über K wird. Ist die Multiplikation eine assoziative Verknüpfung, für die ein neutrales Element existiert, so kann man die Elemente der Algebra insbesondere in Polynome einsetzen. Man betrachte etwa die Algebra R2 . Die Funktion p : R2×2 → R2×2 , welche durch p(X) = X 2 + 2X − 3 := X 2 + 2X 1 − 3X 0 für alle X ∈ R2×2 definiert ist, ist ein Polynom vom Grad 2. Setzt man beispielsweise die Matrix A ∈ R2×2 , welche durch 0 1 A := 0 0 gegeben ist, in das Polynom ein, so erhält man die Matrix −3 2 2 . p(A) = A + 2A − 312 = 0 −3 Definition (submultiplikative Norm). Sei V eine Algebra über K. Eine k · k auf V , heißt submultiplikativ, wenn kvwk ≤ kvk kwk für alle v, w ∈ V gilt. Wird ein Vektorraum über K mit einer Norm versehen, so erhält man einen normierten Raum über K. Analog dazu kann man auch eine Algebra über K mit einer Norm versehen. Ist diese submultiplikativ, so erhält man eine normierte Algebra. Definition (normierte Algebra). Sei V eine Algebra über K und k · k eine submultiplikative Norm auf V . Dann heißt das Paar (V, k · k) eine normierte Algebra über K. Die Submultiplikativität der Norm auf einer normierten Algebra ist quasi das multiplikative Pendant zur Dreiecksungleichung. Nachfolgend geben wir noch einige Beispiele für normierte Algebren an. Beispiele. (a) Die Menge der reellen Zahlen R, versehen mit der Betragsfunktion | · | : R → R, ist eine normierte Algebra über R. (b) Die Menge der komplexen Zahlen C, versehen mit der komplexen Betragsfunktion | · | : C → R, ist sowohl eine normierte Algebra über R als auch eine normierte Algebra über C. ♦ 36 KAPITEL 2. GRUNDBEGRIFFE DER ANALYSIS Übungsaufgabe 1. Zeigen Sie, dass der Vektorraum R2 zusammen mit der Funktion R2 × R2 → R2 , welche durch x1 y2 + x2 y1 x ~ y := x2 y2 für alle x = (x1 , x2 )T ∈ R2 und alle y = (y1 , y2 )T ∈ R2 definiert ist, eine Algebra über R ist. 2. Die Funktion k · kmax : R2×2 → R, welche durch kAkmax := max |A11 |, |A12 |, |A21 |, |A22 | für alle A ∈ R2×2 ist, ist eine Norm auf R2×2 . Zeigen Sie anhand eines Gegenbeispiels, dass diese Norm nicht submultiplikativ ist. 3. Wir betrachten die Menge a M := b −b a ∈R a, b ∈ R 2×2 und die Funktion k · kM : M → R, welche durch kAk2M := a2 + b2 für alle A ∈ M mit a −b A= b a definiert ist. • Zeigen Sie, dass M eine Algebra auf R ist. • Zeigen Sie, dass k · kM eine Norm auf M ist. • Zeigen Sie, dass (M, k · kM ) eine normierte Algebra ist. 2.3. INFIMUM, SUPREMUM, MINIMUM UND MAXIMUM 2.3 37 Infimum, Supremum, Minimum und Maximum Definition (nach unten beschränke Menge). Sei M eine Teilmenge von R. Ein reelle Zahl u ∈ R heißt eine untere Schranke von M , wenn u ≤ x für alle x ∈ M gilt. Existiert eine solche untere Schranke, so nennt man die Menge M nach unten beschränkt. Definition (nach oben beschränkte Menge). Sei M eine Teilmenge von R. Ein reelle Zahl o ∈ R heißt eine obere Schranke von M , wenn x ≤ o für alle x ∈ M gilt. Existiert eine solche obere Schranke, so nennt man die Menge M nach oben beschränkt. Eine Menge M ⊆ R ist offenbar nicht nach unten beschränkt, wenn für jede reelle Zahl y ∈ R ein Element x ∈ M existiert, so dass x < y gilt. Ebenso die Menge M nicht nach oben beschränkt, wenn für jede reelle Zahl y ∈ R ein Element x ∈ M existiert, so dass y < x gilt. Nachfolgend geben wir einige Beispiele für Teilmengen von R an, welche nach unten oder nach oben beschränkt sind. Beispiele. (a) Offenbar gilt für jede reelle Zahl a ≤ 1 und jede natürliche Zahl n ∈ N die Ungleichung a ≤ 1. Daher ist jede reelle Zahl a ≤ 1 eine untere Schranke von N, und N ist somit nach unten beschränkt. Die Menge N ist jedoch nicht nach oben beschränkt, da man zu jeder reellen Zahl x ∈ R eine natürliche Zahl n ∈ N finden kann, so dass n > x gilt. Daher existiert keine obere Schranke von N. (b) Sei (a, b) ein nichtleeres, offenes Intervall mit Intervallgrenzen a, b ∈ R. Dann ist jede reelle Zahl u ≤ a eine untere Schranke von (a, b). Ebenso ist jede reelle Zahl o ≥ b eine obere Schranke für (a, b). Das Intervall (a, b) ist also eine nach unten und nach oben beschränkte Menge. Dasselbe gilt für nichtleere, abgeschlossene Intervalle [a, b], sowie für Intervalle der Form [a, b) und (a, b] mit a, b ∈ R. (c) Intervalle der Form (−∞, b) und (−∞, b] mit b ∈ R sind durch jede reelle Zahl o ≥ b nach oben, nicht aber nach unten beschränkt. (d) Intervalle der Form (a, ∞) und [a, ∞) mit a ∈ R sind durch jede reelle Zahl u ≤ a nach unten, nicht aber nach oben beschränkt. Ist u ∈ R untere Schranke einer Menge M ⊂ R, so ist jede reelle Zahl v ≤ u ebenfalls eine untere Schranke von M . Ebenso ist jede reelle Zahl p ≥ o obere Schranke einer Menge M ⊂ R, wenn die Zahl o ∈ R eine obere Schranke von M ist. Daher macht es keinen Sinn, von der oberen Schranke“ oder der unteren Schranke“ einer Menge zu sprechen. Sinnvoll ” ” ist jedoch die Suche nach einer möglichst großen unteren Schranke bzw. einer möglichst kleinen oberen Schranke. Definition (Infimum). Sei M ⊂ R eine nach unten beschränkte Menge, und sei u∗ ∈ R eine untere Schranke von M mit der Eigenschaft, dass für jede positive Zahl ε > 0 die Zahl u∗ + ε keine untere Schranke von M ist. Dann heißt u∗ das Infimum von M , und man bezeichnet u∗ mit inf M . Definition (Supremum). Sei M ⊂ R eine nach oben beschränkte Menge, und sei o∗ ∈ R eine obere Schranke von M mit der Eigenschaft, dass für jede positive Zahl ε > 0 die Zahl o∗ − ε keine obere Schranke von M ist. Dann heißt o∗ das Supremum von M , und man bezeichnet o∗ mit sup M . 38 KAPITEL 2. GRUNDBEGRIFFE DER ANALYSIS Gemäß Definition ist das Infimum die größte untere Schranke einer Menge, und das Supremum die kleinste obere Schranke. Die Existenz eines Infimums und eines Supremums wird für nichtleere, nach unten bzw. nach oben beschränkte Teilmengen der reellen Zahlen axiomatisch festgelegt. Axiom (Vollständigkeitsaxiom). Jede nichtleere, nach unten beschränkte Teilmenge von R besitzt ein Infimum. Jede nichtleere, nach oben beschränkte Teilmenge von R besitzt ein Supremum. Es sollte hier noch erwähnt werden, dass man für eine Teilmenge M der reellen Zahlen oft inf M = −∞ schreibt, falls M nicht nach unten beschränkt ist. Analog dazu schreibt man sup M = ∞, falls M nicht nach oben beschränkt ist. Nachfolgend geben wir einige Beispiele für Infima und Suprema von Mengen an. Beispiele. (a) Betrachtet man die Menge der natürlichen Zahlen N als Teilmenge von R, so ist N nach unten beschränkt. Genauer: Jede reelle Zahl u ≤ 1 ist eine untere Schranke von N. Für jede positive Zahl ε > 0 hingegen existiert eine natürliche Zahl n ∈ N, so dass 1 + ε > n gilt, nämlich n = 1. Also ist 1 die größte untere Schranke und damit das Infimum von N, d.h. inf N = 1. (b) Für jedes nichtleere, offene Intervall (a, b), für jedes nichtleere, abgeschlossene Intervall [a, b] und für alle nichtleeren Intervalle der Form [a, b) oder (a, b] mit Intervallgrenzen a, b ∈ R gilt inf (a, b) = inf [a, b] = inf [a, b) = inf (a, b] = a, sup (a, b) = sup [a, b] = sup [a, b) = sup (a, b] = b. Man beachte, dass die Zahl a kein Element der Intervalle (a, b) und (a, b] ist, und dass die Zahl b kein Element der Intervalle (a, b) und [a, b) ist. ♦ Anhand der zuletzt aufgeführten Beispiele erkennt man, dass das Infimum einer Menge M ⊂ R nicht notwendigerweise ein Element von M sein muss. Dasselbe gilt für das Supremum von M . Es gibt jedoch auch Mengen M ⊆ R für die inf M ∈ M bzw. sup M ∈ M gilt. In diesem Fall bezeichnet man das Infimum bzw. das Supremum als das Minimum“ ” bzw. das Maximum“ der Menge. ” Definition (Minimum). Sei M ⊂ R eine nach unten beschränkte Menge. Eine reelle Zahl x∗ ∈ R wird das Minimum von M genannt, wenn x∗ ∈ M und x∗ = inf M gilt. Das Minimum von M wird mit min M bezeichnet. Definition (Maximum). Sei M ⊂ R eine nach oben beschränkte Menge. Eine reelle Zahl x∗ ∈ R wird das Maximum von M genannt, wenn x∗ ∈ M und x∗ = sup M gilt. Das Maximum von M wird mit max M bezeichnet. 2.3. INFIMUM, SUPREMUM, MINIMUM UND MAXIMUM (a) 39 (b) Abbildung 2.1: (a) Infimum und Supremum eines nichtleeren, offenen Intervalls (a, b). (b) Minimum und Maximum eines nichtleeren, abgeschlossenen Intervalls [a, b] Das Minimum einer nach unten beschränkten Menge M ⊆ R ist also ein Element von M , welches gleichzeitig eine untere Schranke von M ist. Es folgt daher, dass min M das kleinste Element von M ist. Ebenso ist max M das größte Element von M . Es muss betont werden, dass eine nach unten bzw. nach oben beschränkte Menge M ⊂ R nicht notwendigerweise ein kleinstes bzw. größtes Element besitzt. Es existiert lediglich eine größte untere bzw. eine kleinste obere Schranke. Daher besitzt jede nichtleere, nach unten beschränkte Teilmenge von R zwar ein Infimum, nicht aber unbedingt ein Minimum. Ebenso besitzt jede nichtleere, nach oben beschränkte Teilmenge von R ein Supremum, nicht aber unbedingt ein Maximum. Man betrachte dazu die Abbildung 2.1 wie auch die nachfolgenden Beispiele. Beispiele. (a) Wir haben bereits gezeigt, dass inf N = 1 gilt. Da auch 1 ∈ N gilt, ist die Zahl 1 nicht nur die größte untere Schranke von N sondern auch das kleinste Element von N, d.h. es gilt min N = 1. (b) Seien x1 , x2 , . . . , xn ∈ R reelle Zahlen mit x1 ≤ x2 ≤ · · · ≤ xn . Dann gilt min {x1 , x2 , . . . , xn } = x1 , max {x1 , x2 , . . . , xn } = xn . (c) Sei [a, b] ein nichtleeres, abgeschlossenes Intervall mit a, b ∈ R. Dann gilt min [a, b] = a, max [a, b] = b. (d) Für nichtleere Intervalle der Form [a, b) und (a, b] mit Intervallgrenzen a, b ∈ R gilt min [a, b) = a, max (a, b] = b. Außerdem gilt sup [a, b) = b und inf (a, b] = a. Da jedoch b 6∈ [a, b) und a 6∈ (a, b] gilt, besitzt das Intervall [a, b) kein Maximum und das Intervall (a, b] kein Minimum. (e) Jedes nichtleere, offene Intervall (a, b) mit Intervallgrenzen a, b ∈ R besitzt weder ein Mininum noch ein Maximum. ♦ Man überlegt sich leicht, dass jede nach unten beschränkte Teilmenge von Z ein Minimum besitzt. Ebenso offensichtlich ist, dass jede nach oben beschränkte Teilmenge von Z ein Maximum besitzt. Daher kann man die folgenden beiden Funktionen definieren. 40 KAPITEL 2. GRUNDBEGRIFFE DER ANALYSIS Definition (Abrundungsfunktion, Gauß–Klammer). Die Abrundungsfunktion oder Gaußklammer R → Z, x 7→ bxc ist durch bxc := max{k ∈ Z | k ≤ x} für alle x ∈ R definiert. Definition (Aufrundungsfunktion). Die Aufrundungsfunktion R → Z, x 7→ dxe ist durch dxe := min{k ∈ Z | x ≤ k} für alle x ∈ R definiert. Die Abrundungsfunktion b · c wird gelegentlich auch mit [ · ] bezeichnet. Für jede reelle Zahl x ∈ R nennt man den zugehörigen Funktionswert der Abrundungsfunktion bxc den Ganzteil von x. Die Zahl x − bxc nennt man den Nachkommaanteil von x. Offenbar ist eine Zahl k ∈ R genau dann Element von Z, wenn ihr Nachkommaanteil verschwindet, d.h. wenn k = bkc bzw. k − bkc = 0 gilt. Für jede reelle Zahl x ∈ R gilt ferner die Abschätzung bxc ≤ x ≤ dxe. Daraus folgt insbesondere, dass man für jede noch so große, positive nichtnegative Zahl R ≥ 0 eine natürliche Zahl N ∈ N wählen kann, so dass N > R gilt: Man wählt einfach die Zahl N := dRe + 1. Außerdem existiert für jede noch so kleine, positive reelle Zahl ε > 0 eine natürliche Zahl n ∈ N, so dass 1 <ε n gilt, nämlich n := d1/εe + 1. Obwohl diese Überlegungen trivial erscheinen, werden sie doch häufig in Beweisen benötigt. Beschränktheit nach unten und Beschränktheit nach oben kann man auch für reellwertige Funktionen definieren. Definition (nach unten beschränkte Funktion). Sei X eine nichtleere Menge. Eine Funktion f : X → R heißt nach unten beschränkt, wenn ihre Wertemenge nach unten beschränkt ist. Definition (nach oben beschränkte Funktion). Sei X eine nichtleere Menge. Eine Funktion f : X → R heißt nach oben beschränkt, wenn ihre Wertemenge nach oben beschränkt ist. Die Wertemenge f (X) einer Funktion f : X → R ist bekanntlich durch f (X) := y ∈ R ∃x ∈ X : f (x) = y gegeben. Entsprechend definiert man das Infimum einer nach unten beschränkten Funktion f : X → R als inf f (x) := inf f (X) x∈X Wenn außerdem ein Element x∗ ∈ X existiert, so dass f (x∗ ) = inf f (X) gilt, definiert man das Minimum der Funktion f als min f (x) := f (x∗ ). x∈X 2.3. INFIMUM, SUPREMUM, MINIMUM UND MAXIMUM 41 Das Element x∗ wird dann ein Minimierer der Funktion f genannt. Für eine nach oben beschränkte Funktion f : X → R definiert man das Supremum durch sup f (x) := sup f (X). x∈X Falls außerdem ein Element x∗ ∈ X existiert, für dass f (x∗ ) = sup f (X) gilt, so definiert man das Maximum der Funktion f als max f (x) := f (x∗ ). x∈X Das Element x∗ wird dann ein Maximierer von f genannt. Beispiele. (a) Die Funktion f : R → R, welche durch f (x) := x2 für alle x ∈ R definiert ist, ist beispielsweise durch 0 nach unten beschränkt, und es gilt inf f (x) = min f (x) = 0 x∈X x∈R Wegen f (0) = 0 ist die Zahl 0 ein Minimierer von f . Tatsächlich ist 0 der einzige Minimierer von f , wie man leicht zeigen kann. Die Funktion f ist nicht nach oben beschränkt. (b) Die Funktion g : R\{0} → R, welche durch g(x) := 1/x2 für alle x ∈ R\{0} definiert ist, ist nach unten beschränkt, und es gilt inf g(x) = 0. x∈R\{0} Allerdings besitzt die Funktion g kein Minimum, da g(x) > 0 für alle x ∈ R \ {0} gilt. Die Funktion g ist außerdem nicht nach oben beschränkt. ♦ Reelle Zahlenfolgen sind bekanntlich nichts anderes als Funktionen von N nach R. Daher definiert man nach unten bzw. nach oben beschränkte Folgen in R wie folgt. Definition (nach unten beschränkte Folge). Eine Folge in R heißt nach unten beschränkt, wenn die Menge ihrer Folgenglieder nach unten beschränkt ist. Definition (nach oben beschränkte Folge). Eine Folge in R heißt nach oben beschränkt, wenn die Menge ihrer Folgenglieder nach oben beschränkt ist. Die Menge der Folgenglieder einer reellen Zahlenfolge (an )n∈N ist durch {an | n ∈ N} = {a1 , a2 , a3 , . . . } gegeben. In Analogie zu den nach unten beschränkten Teilmengen von R definiert man das Infimum einer nach unten beschränkten reellen Zahlenfolge (an )n∈N als das Infimum der Menge aller Folgenglieder, d.h. man definiert inf an := inf{an | n ∈ N}. n∈N 42 KAPITEL 2. GRUNDBEGRIFFE DER ANALYSIS Falls außerdem eine natürliche Zahl n∗ ∈ N existiert, so dass an∗ = inf{an | n ∈ N} gilt, definiert man das Minimum der Folge (an )n∈N als min an := an∗ . n∈N Das Supremum einer nach oben beschränkten reellen Zahlenfolge (an )n∈N definiert man gemäß sup an := sup{an | n ∈ N}. n∈N Wenn außerdem eine natürliche Zahl n∗ ∈ N existiert, für die an∗ = sup{an | n ∈ N} gilt, dann definiert man das Maximum der Folge als max an := an∗ . n∈N Gelegentlich werden das Infimum, das Minimum, das Supremum und das Maximum einer reellen Zahlenfolge (an )n∈N auch mit inf (an )n∈N , min (an )n∈N , sup (an )n∈N und max (an )n∈N bezeichnet. Beispiele. (a) Die so genannte Folge der Quadratzahlen (qn )n∈N , welche durch qn := n2 für alle n ∈ N definiert ist, ist beispielsweise durch 1 nach unten beschränkt, und es gilt inf qn = min qn = 1. n∈N n∈N Die Folge (qn )n∈N ist jedoch nicht nach oben beschränkt. (b) Die so genannte Folge der Stammbrüche (sn )n∈N , welche durch sn := 1/n für alle n ∈ N definiert ist, ist nach oben beschränkt, und es gilt sup sn = max sn = 1. n∈N n∈N Die Folge (sn )n∈N ist außerdem nach unten beschränkt mit inf sn = 0. n∈N Da jedoch 1/n 6= 0 für alle n ∈ N gilt, besitzt die Folge der Stammbrüche kein Minimum. ♦ Übungsaufgaben 1. Gegeben seien die reellen Zahlen x1 := −3/2, x2 := π, x3 := Berechnen Sie die ganzen Zahlen bxi c und dxi e für i = 1, 2, 3, 4. √ 2 und x4 := log10 (124). 2. Skizzieren Sie die Funktionsgraphen der Funktionen [−3, 3] → R, x 7→ bxc und [−3, 3] → R, x − bxc. 3. Bestimmen Sie, falls dieses existiert, das Infimum, das Supremum, das Minimum und das Maximum der folgenden Teilmengen von R. M1 = {x2 | x ∈ (0, 1]} M2 = {−12, 1, 0, −4}, M3 = [−2, −1) ∪ (1, ∞), M4 = {2k | k ∈ Z} 2.3. INFIMUM, SUPREMUM, MINIMUM UND MAXIMUM 43 4. Bestimmen Sie, falls dieses existiert, das Infimum, das Supremum, das Minimum und das Maximum der reellen Zahlenfolgen (an )n∈N , (bn )n∈N , (cn )n∈N und (dn )n∈N , welche durch an := 4n − n2 , (−1)n , n πn , cn := sin 2 d1 := 4, dn+1 := dn /2 bn := für alle n ∈ N definiert sind. 5. Bestimmen Sie, falls dieses existiert, das Infimum, das Supremum, das Minimum und das Maximum der nachfolgend angegebenen Funktionen. f1 : [1, 2) → R, x 7→ 3x, f2 : R → R, x 7→ −x3 , √ f3 : [0, ∞) → R, x 7→ x, f4 : (0, 1] → R, x 7→ 1/x. 44 2.4 KAPITEL 2. GRUNDBEGRIFFE DER ANALYSIS Monotonie Definition (monoton wachsende Funktion). Sei D ⊆ R eine nichtleere Menge. Eine Funktion f : D → R heißt monoton wachsend, wenn f (x) ≤ f (y) für alle x, y ∈ D mit x ≤ y gilt. Definition (streng monoton wachsende Funktion). Sei D ⊆ R eine nichtleere Menge. Eine Funktion f : D → R heißt streng monoton wachsend, wenn f (x) < f (y) für alle x, y ∈ D mit x < y gilt. Definition (monoton fallende Funktion). Sei D ⊆ R eine nichtleere Menge. Eine Funktion f : D → R heißt monoton wachsend, wenn f (x) ≥ f (y) für alle x, y ∈ D mit x ≤ y gilt. Definition (streng monoton fallende Funktion). Sei D ⊆ R eine nichtleere Menge. Eine Funktion f : D → R heißt streng monoton fallend, wenn f (x) > f (y) für alle x, y ∈ D mit x < y gilt. Die Monotonie einer Funktion f : D → R, wobei D ⊆ R eine nichtleere Menge ist, lässt sich bekannterweise am Funktionsgraphen graph(f ) := {(x, y)T ∈ R2 | x ∈ D, y = f (x)} ablesen. Falls eine solcher Graph von links nach rechts stets ansteigt, so ist die Funktion monoton wachsend. Verläuft der Graph dabei an keiner Stelle waagrecht, so ist die Funktion streng monoton wachsend. Falls der Graph von links nach rechts stets abfällt, ist die Funktion monoton fallend. Verläuft der Graph dabei an keiner Stelle waagrecht, so ist die Funktion streng monoton fallend (siehe auch Abbildun 2.2). Beispiele. (a) Eine affine Funktion g : R → R, welche für gegebene reelle Zahlen m, c ∈ R durch g(x) = mx + c für alle x ∈ R definiert ist, ist genau dann streng monoton wachsend bzw. streng monoton fallend, wenn m > 0 bzw. m < 0 gilt. (b) Jede konstante Funktion ist sowohl monoton wachsend als auch monoton fallend. Ist D ⊆ R eine nichtleere Menge, so wird eine Funktion f : D → R konstant genannt, wenn eine Zahl y0 ∈ R existiert, so dass f (x) = y0 für alle x ∈ D gilt. Wir erinnern uns, dass Folgen nichts anderes sind als Funktionen, deren Definitionsmenge die Menge der natürlichen Zahlen N ist. Daher kann man den Monotoniebegriff auch auf Folgen übertragen. Dementsprechend heißt eine Folge (an )n∈N in R monoton wachsend, wenn an ≤ an+1 für alle n ∈ N gilt. Die Folge heißt streng monoton wachsend, wenn an < an+1 für alle n ∈ N gilt. Die Folge wird monoton fallend genannt, wenn an ≥ an+1 2.4. MONOTONIE 45 (a) (b) (c) (d) Abbildung 2.2: Funktionsgraphen einer (a) monoton wachsenden, (b) streng monoton wachsenden, (c) monoton fallenden, (d) streng monoton fallenden Funktion von R nach R. für alle n ∈ N gilt. Falls an > an+1 für alle n ∈ N gilt, wird die Folge streng monoton fallend genannt. Die Monotonie einer Folge in R wird letztlich von der Ordnungsrelation ≤ auf R bestimmt. Man kann den Monotoniebegriff jedoch auch auf Folgen in einer beliebigen Menge X übertragen, sofern auf X eine Ordnungsrelation definiert ist. Wir geben hier zwei Beispiele dafür an. Beispiele. (a) Die Teilmengenrelation ⊆ ist bekanntlich eine Ordnungsrelation auf P(N), der Potenzmenge von N. Definiert man die Folge (Nn )n∈N in P(N) gemäß Nn := {1, 2, . . . , n} für alle n ∈ N, so ist (Nn )n∈N eine monoton wachsende Folge bezüglich der Teilmengenrelation. Es gilt nämlich Mn ⊆ Mn+1 für alle n ∈ N. (b) Die Teilbarkeitsrelation | ist eine Ordnungsrelation auf N. Definiert man die Folge (fn )n∈N gemäß fn := n! = n(n − 1) · · · 1 für alle n ∈ N, so gilt fn | fn+1 (fn ist ein Teiler von fn+1 ) für alle n ∈ N. Also ist (fn )n∈N eine monoton wachsende Folge bezüglich der Teilbarkeitsrelation. ♦ Zum Abschluss dieses Abschnitts führen wir noch den Begriff der Teilfolge ein. Definition (Teilfolge). Sei X eine nichtleere Menge und (xn )n∈N eine Folge in X. Eine Folge (yn )n∈N in X heißt eine Teilfolge von (xn )n∈N , wenn eine streng monoton wachsende Funktion ϕ : N → N existiert, so dass yn = xϕ(n) für alle n ∈ N gilt. Die Folge (yn )n∈N wird dann auch mit (xϕ(n) )n∈N bezeichnet. 46 KAPITEL 2. GRUNDBEGRIFFE DER ANALYSIS Beispiele. (a) Sei (sn )n∈N die Folge R, welche durch sn := (−1)n für alle n ∈ N gegeben ist. Dann ist beispielsweise die Folge (en )n∈N , welche durch en := 1 für alle n ∈ N gegeben ist, eine Teilfolge von (sn )n∈N . Es gilt nämlich en = s2n für alle n ∈ N. (b) Die Folge (sn )n∈N aus Teil (a) ist eine Teilfolge der Folge (zn )n∈N in C, welche durch zn := in für alle n ∈ N definiert ist. Hierbei bezeichnet i die imaginäre Einheit. Es gilt nämlich sn = z2n für alle n ∈ N. Auch die Folge (en )n∈N aus Teil (a) ist eine Teilfolge von (zn )n∈N . Es gilt nämlich en = s2n = z4n für alle n ∈ N. ♦ Übungsaufgaben 1. Untersuchen Sie die reellen Zahlenfolgen (an )n∈N , (bn )n∈N , (cn )n∈N und (dn )n∈N hinsichtlich ihrer Monotonie. Die Folgen sind dabei durch 1 2n bn := 2n , an := πn , cn := cos 2 d1 := 1, dn+1 := 1 + 2dn für alle n ∈ N definiert. 2. Geben Sie jeweils die ersten 5 Folgenglieder der Teilfolgen (a2n )n∈N , (an2 )n∈N , (a6n+1 )n∈N und (an! )n∈N der Folge (an )n∈N an, welche durch 1 falls n ≡ 0 mod 3, an := 2 falls n ≡ 1 mod 3, 3 falls n ≡ 2 mod 3 für alle n ∈ N definiert ist. 3. Entscheiden Sie, ob die Folgen (an )n∈N , (bn )n∈N , (cn )n∈N und (dn )n∈N Teilfolgen der Folge (xn )n∈N in R sind. Die Folge (xn )n∈N ist dabei durch xn := dn/2e für alle n ∈ N definiert. Die übrigen Folgen sind gemäß an := n, bn := dn/3e, cn := n2 , dn := 4n − n2 für alle n ∈ N definiert. Für jede reelle Zahl α ∈ R bezeichnet hierbei dαe die kleinste ganze Zahl, welche größer oder gleich α ist. Die ersten Glieder der Folge (xn )n∈N lauten dementsprechend x1 = x2 = 1, x3 = x4 = 2, x5 = x6 = 3 u.s.w. 2.5. GRENZWERTE VON FOLGEN 2.5 47 Grenzwerte von Folgen Definition (konvergente Folge, Grenzwert). Sei (V, k · k) ein normierter Raum über K. Eine Folge (vn )n∈N in V heißt konvergent, wenn ein Vektor v ∈ V existiert, so dass für jede positive Zahl ε > 0 eine natürliche Zahl N ∈ N existiert, so dass kvn − vk < ε für alle n ≥ N gilt. Der Vektor v heißt in diesem Fall der Grenzwert der Folge, und man sagt, dass die Folge (vn )n∈N gegen v konvergiert. Außerdem schreibt man lim vn = v n→∞ oder auch vn → v (n → ∞). Definition (divergente Folge). Sei (V, k · k) ein normierter Raum über K. Eine Folge in V heißt divergent, wenn sie nicht konvergent ist. Anschaulich gesprochen konvergiert eine Folge genau dann gegen einen bestimmten Grenzwert, wenn die Folgenglieder für wachsende Indizes diesem Grenzwert immer näher kommen. Man sagt auch, dass die Folgenglieder einer konvergenten Folge, dem Grenzwert beliebig nahe kommen. Dabei ist zu beachten, dass der Grenzwert selbst ein Folgenglied sein kann. Im allgemeinen ist dies jedoch nicht der Fall. Der nachfolgende Satz zeigt, weshalb es sinnvoll ist, von dem Grenzwert einer konvergenten Folge zu sprechen. Satz 2.1. Der Grenzwert einer konvergenten Folge ist eindeutig bestimmt. Eine spezielle Klasse konvergenter Folgen bilden die so genannten Nullfolgen. Definition (Nullfolge). Sei (V, k · k) ein normierter Raum über K. Eine Folge in V heißt Nullfolge, wenn sie gegen den Nullvektor 0 ∈ V konvergiert. Ist (V, k · k) ein normierter Raum, so konvergiert eine Folge (vn )n∈N offenbar genau dann gegen einen Vektor v ∈ V , wenn (kvn − vk)n∈N eine Nullfolge ist, d.h. wenn lim kvn − vk = 0 n→∞ gilt. In den nachfolgenden Beispielen geben wir die Grenzwerte einiger grundlegender Zahlenfolgen an. Vereinzelt geben wir eine kurze Begründung für das Resultat an. Beispiele. (a) Für jede reelle Zahl α ∈ R, und für jede reelle Zahl β ∈ R, welche n + β 6= 0 für alle n ∈ N erfüllt, gilt α lim = 0. n→∞ n + β Ist nämlich ε > 0 eine beliebig gewählte, positive Zahl, so existiert eine natürliche Zahl N ∈ N, so dass n + β > α/ε für alle n ∈ N mit n ≥ N gilt. Daraus folgt, dass |α/(n + β) − 0| < ε für alle n ∈ N mit n ≥ N gilt. Also ist die Folge (an )n∈N , definiert durch an := α/(n + β) für alle n ∈ N, eine Nullfolge in R. 48 KAPITEL 2. GRUNDBEGRIFFE DER ANALYSIS (b) Für jede reelle Zahl β ∈ R und für jede reelle Zahl α ∈ R, welche n + β 6= 0 für alle n ∈ N erfüllt, gilt n+α lim = 1. n→∞ n + β Es gilt nämlich α − β n + α n + β − 1 = n + β , und in Beispiel (a) wurde gezeigt, dass die Folge (bn )n∈N , definiert durch bn := (α − β)/(n + β) für alle n ∈ N, eine Nullfolge in R ist. (c) Für jede komplexe Zahl q ∈ C mit |q| < 1 gilt lim q n = 0. n→∞ (d) Für jede Nullfolge (an )n∈N in C und für jede natürliche Zahl p ∈ N gilt p lim p |an | = 0. n→∞ Wählt man nämlich eine beliebige, positive Zahl ε > 0, dann gilt auch εp > 0. Da (an )n∈N eine Nullfolge ist, existiert eine natürliche Zahl N ∈ N, so dass |an | < εp für alle n ∈ N mit n ≥ Npgilt. Zieht man p auf beiden Seiten der Ungleichung die p-te Wurzel, so erhält man | p |an | − 0| = |an | < εp für alle n ∈ N mit n ≥ N . (e) Es gilt lim n→∞ √ n n = 1. (f) Für jede komplexe Zahl q ∈ C mit |q| < 1 und jede natürliche Zahl p ∈ N gilt lim np q n = 0. n→∞ (g) Sei (V, k · k) ein normierter Raum über K, und sei (vn )n∈N eine konstante Folge in V , d.h. es existiere ein Vektor v0 ∈ V , so dass vn := v0 für alle n ∈ N gilt. Dann konvergiert (vn )n∈N gegen v0 . ♦ Die Eigenschaft einer Folge, konvergent oder nicht konvergent zu sein, wird oft als das Konvergenzverhalten der Folge bezeichnet. Der folgende Satz liefert ein wichtiges Resultat hinsichtlich des Konvergenzverhaltens der Teilfolgen einer konvergenten Folge. Satz 2.2. Sei (V, k · k) ein normierter Raum über K. Eine Folge (vn )n∈N in V konvergiert genau dann gegen einen Grenzwert v ∈ V , wenn alle Teilfolgen von (vn )n∈N gegen v konvergieren. Satz 2.2 liefert offenbar auch ein notwendiges Kriterium für die Konvergenz einer Folge. Falls man nämlich aus einer beliebigen Folge zwei Teilfolgen extrahieren kann, die gegen unterschiedliche Grenzwerte konvergieren, so folgt aus Satz 2.2, dass die ursprüngliche Folge nicht konvergent sein kann. Als nächstes untersuchen wir, was man über die Normen der Folgenglieder einer konvergenten Folge aussagen kann. 2.5. GRENZWERTE VON FOLGEN 49 Satz 2.3. Sei (V, k · k) ein normierter Raum, und sei (vn )n∈N eine konvergente Folge in V . Dann gilt lim kvn k = lim vn . n→∞ n→∞ Als nächstes wollen wir einige Resultate zusammengestellen, die es erlauben, Grenzwerte von bestimmten Folgen aus bereits bekannten Grenzwerten zu berechnen. Die nachfolgenden zwei Sätze liefern solche Rechenregeln für Grenzwerte. Satz 2.4. Sei (V, k · k) ein normierter Raum über K. Seien außerdem (vn )n∈N und (wn )n∈N zwei konvergente Folgen in V , und sei (αn )n∈N eine konvergente Folge in K. Dann gilt (1) lim vn + wn = lim vn + lim wn . n→∞ (2) lim αn vn = n→∞ n→∞ lim αn n→∞ n→∞ lim vn . n→∞ Ist (V, k · k) eine normierte Algebra über K, so gilt außerdem (3) lim vn wn = lim vn lim wn . n→∞ n→∞ n→∞ Man beachte, dass die Aussage in Teil (2) von Satz 2.4 insbesondere auch für jede konstante Folge in K gilt. Eine konstante Folgen (αn )n∈N ist bekanntlich durch αn := α für alle n ∈ N gegeben, wobei α ∈ K eine fest gewählte Zahl ist. Diese Zahl ist dann auch der Grenzwert von (αn )n∈N . Aus Teil (2) von Satz 2.4 folgt daher, dass lim αvn = α lim vn n→∞ n→∞ für jede konvergente Folge (vn )n∈N und für jede Zahl α ∈ K gilt. Da außerdem v − w = v + (−1)w für beliebige Vektoren v, w ∈ V gilt, implizieren die Teile (1) und (2) von Satz 2.4 auch, dass lim vn − wn = lim vn − lim wn n→∞ n→∞ n→∞ für alle konvergenten Folge (vn )n∈N und (wn )n∈N gilt. Die bisher eingeführten Rechenregeln für die Addition, die skalare Multiplikation und die Multiplikation von Grenzwerten gelten alle konvergenten Folgen in einer normierten Algebra V über K. Im Fall V = R oder V = C kann man darüber hinaus eine Rechenregel für die Division von Grenzwerten beweisen. Satz 2.5. Sei (αn )n∈N eine konvergente Folge in K \ {0}, deren Grenzwert ebenfalls ein Element von K \ {0} ist. Dann gilt lim n→∞ 1 1 = . αn lim αn n→∞ Laut Satz 2.5 konvergiert die Folge der Kehrbrüche einer konvergenten Folge in K gegen den Kehrbruch des Grenzwertes. Da bekanntlich α/β = α · (1/β) für alle α, β ∈ K gilt, folgt aus Teil (3) von Satz 2.4 und Satz 2.5 die Rechenregel lim αn αn = n→∞ n→∞ βn lim βn lim n→∞ 50 KAPITEL 2. GRUNDBEGRIFFE DER ANALYSIS für alle konvergenten Folgen (αn )n∈N in K und alle konvergenten Folgen (βn )n∈N in K\{0}, sofern der Grenzwert der Folge (βn )n∈N von Null verschieden ist. Zum Abschluss dieses Kapitels wenden wir uns noch zwei Spezialfällen von Divergenz zu, die man für reelle Zahlenfolgen definiert. Definition (gegen ∞ bestimmt divergente Folge). Eine Folge (an )n∈N in R heißt gegen ∞ bestimmt divergent, wenn für jede reelle Zahl R ∈ R eine natürliche Zahl N ∈ N existiert, so dass an > R für alle n ∈ N mit n ≥ N gilt. In diesem Fall schreibt man lim an = ∞ n→∞ oder an → ∞ (n → ∞). Definition (gegen −∞ bestimmt divergente Folge). Eine Folge (an )n∈N in R heißt gegen −∞ bestimmt divergent, wenn für jede reelle Zahl R ∈ R eine natürliche Zahl N ∈ N existiert, so dass an < R für alle n ∈ N mit n ≥ N gilt. In diesem Fall schreibt man lim an = −∞ n→∞ oder an → −∞ (n → ∞). Man nennt eine reelle Zahlenfolge ganz allgemein bestimmt divergent, wenn sie entweder gegen ∞ oder gegen −∞ bestimmt divergent ist. Man sollte sich klar machen, dass jede nach ∞ bestimmt divergente Folge nach unten, nicht aber nach oben beschränkt ist. Die Umkehrung dieser Aussage gilt jedoch nicht. Es gibt nämlich reelle Zahlenfolgen die nach unten, nicht aber nach oben beschränkt sind, und die nicht gegen ∞ bestimmt divergieren. Man betrachte hierzu auch die nachfolgenden Beispiele. Beispiele. (a) Die reelle Zahlenfolge (an )n∈N , welche durch an := −n für alle n ∈ N definiert ist, ist gegen −∞ bestimmt divergent. (b) Die reelle Zahlenfolge (bn )n∈N , welche durch bn := (−2)n für alle n ∈ N definiert ist, ist divergent, aber nicht bestimmt divergent. (c) Die nach unten, nicht aber nach oben beschränkte reelle Zahlenfolge (cn )n∈N , welche durch ( 1 falls n gerade ist, cn := 2 n falls n ungerade ist für alle n ∈ N definiert ist, ist divergent, aber nicht bestimmt divergent. Das nachfolgende Lemma ist oft hilfreich, wenn man reelle Zahlenfolgen auf Konvergenz hin untersucht. Lemma 2.6. Sei (an )n∈N eine bestimmt divergente Zahlenfolge in R \ {0}. Dann gilt lim n→∞ 1 = 0. an 2.5. GRENZWERTE VON FOLGEN 51 Beweis. Da die Folge (an )n∈N bestimmt divergiert, ist die Folge (|an |)n∈N gegen ∞ bestimmt divergent. Wählt man eine beliebige positive Zahl ε > 0, dann existiert demnach eine natürliche Zahl N ∈ N derart, dass |an | > 1/ε für alle n ∈ N mit n ≥ N gilt. Entsprechend gilt dann 1/|an | < ε für alle n ∈ N mit n ≥ N . Damit ist gezeigt, dass die Folge (1/an )n∈N eine Nullfolge ist. Die Frage ob eine Folge konvergiert oder divergiert ist nicht immer leicht zu beantworten. Wir werden im Kapitel 4 auf diese Frage näher eingehen. Übungsaufgaben 1. Die konvergenten, reellen Zahlenfolgen (an )n∈N , (bn )n∈N , (cn )n∈N , (dn )n∈N und (en )n∈N sind durch an := bn := cn := dn := en := 2n + 1 , 3n2 + 2n + 1 √ n n2 , 1 + 2 + ··· + n , 2 √n n+ n , 3n (2n − 1)(3n − 2)(n + 1) (5n − 1)(2n + 1)(3n − 1) für alle n ∈ N definiert. Berechnen Sie die Grenzwerte dieser Folgen. Um den Grenzwert der Folge (cn )n∈N zu berechnen, sollten Sie zunächst mittels vollständiger Induktion nach n zeigen, dass 1 + 2 + . . . + n = n(n + 1)/2 für alle n ∈ N gilt. 2. Untersuchen Sie die reellen Zahlenfolgen (an )n∈N , (bn )n∈N , (cn )n∈N und (dn )n∈N auf Konvergenz hin, und bestimmen Sie gegebenenfalls den Grenzwert. Die Folgen seien dabei durch √ √ an := n − 1 − n, n n , bn := − 2 2 n 4 cn := , 4 n √ p dn := n(n2 + 1) − n3 für alle n ∈ N definiert. 3. Sei (V, k · k) eine normierte Algebra über K, sei (vn )n∈N eine konvergente Folge in V mit Grenzwert v, und sei p : V → V, x 7→ α0 + α1 x + α2 x2 + . . . + αn xn ein Polynom mit Koeffizienten in α0 , α1 , . . . , αn ∈ K. Begründen Sie, weshalb die Folge (p(vn ))n∈N gegen p(v) konvergiert. 4. Zeigen Sie, dass die reellen Zahlenfolgen (an )n∈N , (bn )n∈N und (cn )n∈N , definiert durch an := (−1)n , ( 1 falls n ungerade ist, bn := n/2 falls n gerade ist, cn := für alle n ∈ N, divergent sind. n2 − 2 n−1 Lernzielkontrolle Nach dem Durcharbeiten diese Kapitels sollten Sie... ... wissen, was eine Folge und was eine Teilfolge ist. ... zu einer gegebenen rekursiven Definition die explizite Darstellung einer reellen Zahlenfolge bestimmen können. ... wissen, was eine Familie und was eine Teilfamilie ist. ... wissen, was eine Algebra und was eine normierte Algebra ist. ... wissen, was das nach unten beschränkte und nach oben beschränkte Teilmengen von R sind. ... wissen, was das Infimum und das Minimum einer nach unten beschränkten Menge, Folge oder Funktion ist. Insbesondere sollten Sie den Unterschied zwischen Infima und Minima kennen. ... wissen, was das Supremum und das Maximum einer nach oben beschränkten Menge, Folge oder Funktion ist. Insbesondere sollten Sie den Unterschied zwischen Suprema und Maxima kennen. ... das Vollständigkeitsaxiom kennen. ... wissen, was monoton wachsende, streng monoton wachsende, monoton fallende und streng monoton fallende Funktionen und Folgen sind. ... wissen, was konvergente und divergente Folgen sind. ... wissen, was eine Nullfolge ist. ... wissen, was bestimmt divergente Folgen sind. ... die Rechenregeln für Grenzwerte von Folgen kennen, und mit Hilfe dieser Regeln Grenzwerte von konvergenten Folgen berechnen können, wo dies möglich ist. 52 Kapitel 3 Topologische Begriffe 3.1 Inneres, Rand und Abschluss von Mengen Definition (innerer Punkt und Inneres). Sei (V, k · k) ein normierter Raum über K, und sei M ⊆ V eine Menge. Ein Vektor v ∈ M heißt innerer Punkt von M , falls eine positive Zahl ε > 0 existiert, so dass Bε (v) ⊆ M gilt. Die Menge aller inneren Punkte von M wird das Innere von M genannt und mit M ◦ bezeichnet. Wir erinnern uns, dass mit Bε (v) die offene Kugel in einem normierten Raum mit Mittelpunkt v und Radius ε bezeichnet wird. Gemäß Definition sind die inneren Punkte einer Menge M stets Element von M . Daher gilt M◦ ⊆ M für jede eine Teilmenge M eines normierten Raums über K. Zu beachten ist, dass das Innere einer Menge leer sein kann. Das ist bespielsweise für einpunktige Mengen der Fall. Unter einpunktigen Mengen versteht man dabei Mengen von der Form {v} mit v ∈ V . Definition (Randpunkt und Rand). Sei (V, k · k) ein normierter Raum über K, und sei M ⊆ V eine Menge. Ein Vektor v ∈ V heißt Randpunkt von M , für jede positive Zahl ε > 0 zwei Vektoren v0 , v1 ∈ Bε (v) existieren, so dass v0 6∈ M und v1 ∈ M gilt. Die Menge aller Randpunkte von M wird der Rand von M genannt und mit ∂M bezeichnet. Man beachte, dass die Randpunkte einer Menge M nicht notwendigerweise Elemente von M sind. Daher ist ∂M in der Regel keine Teilmenge von M . Man kann leicht zeigen, dass das Innere einer Menge und der Rand einer Menge disjunkt sind, d.h. dass M ◦ ∩ ∂M = ∅ für jede Menge M gilt. Außerdem überlegt man sich leicht, dass der Rand einer Menge selbst keine inneren Punkte enthält, d.h. dass (∂M )◦ = ∅ für jede Menge M gilt. Schließlich kann man zeigen, dass für jede Menge M die Identität ∂(∂M ) = ∂M gilt. Neben dem Inneren und dem Rand einer Menge betrachtet man häufig auch den so genannten Abschluss einer Menge. 53 54 KAPITEL 3. TOPOLOGISCHE BEGRIFFE (a) (b) (c) (d) Abbildung 3.1: (a) Eine Teilmenge M des R2 . (b) Das Innere von M . (c) Der Rand von M . (d) Der Abschluss von M . Definition (Abschluss, abgeschlossene Hülle). Sei (V, k · k) ein normierter Raum über K, und sei M ⊆ V eine Menge. Dann heißt die Menge M := M ∪ ∂M der Abschluss oder die abgeschlossene Hülle von M . Da der Abschluss einer Menge M die Vereinigung von M selbst und dem Rand von M ist, folgt unmittelbar, dass M ⊆M für jede eine Teilmenge M eines reellen oder komplexen normierten Raums. In Abbildung 3.1 werden das Innere, der Rand und der Abschluss einer Menge durch Skizzen veranschaulicht. Nachfolgend geben wir außerdem einige wichtige Beispiele an. Beispiele. (a) Wir betrachten den normierten Raum (R, | · |). Inneres, Rand und Abschluss eines nichtleeren Intervalls [a, b) = {x ∈ R | a ≤ x < b} mit Intervallgrenzen a, b ∈ R sind dann durch [a, b)◦ = (a, b), ∂[a, b) = {a, b}, [a, b) = [a, b] gegeben. Die Randpunkte des Intervalls [a, b) sind also genau die Intervallgrenzen a und b. Man beachte außerdem, dass man für die Intervalle (a, b), [a, b] und (a, b] dasselbe Innere, denselben Rand sowie denselben Abschluss erhält wie für das hier betrachtete Intervall [a, b). (b) Für jede offene Kugel Br (v) in einem normierten Raum gilt Br (v)◦ = Br (v), ∂Br (v) = Sr (v). 3.1. INNERES, RAND UND ABSCHLUSS VON MENGEN 55 (c) In jedem normierten Raum ist die abgeschlossene Kugel Br (v) der Abschluss der offenen Kugel Br (v). (d) Im normierten Raum (R2 , | · |) betrachten wir die Verbindungsstrecke S := {x = (x1 , x2 )T ∈ R2 | x1 ∈ [0, 1], x2 = x1 }, zwischen den Punkten (0, 0)T und (1, 1)T . Dann gilt S ◦ = ∅, ∂S = S und S = S. (e) Ist (V, k · k) ein normierter Raum über K, so überlegt man sich leicht, dass V ◦ = V, ∂V = ∅, V = V. gilt. Fass man die leere Menge ∅ als Teilmenge von V auf, so erhält man außerdem ∅◦ = ∂∅ = ∅ = ∅. ♦ Übungsaufgaben 1. Bestimmen Sie für i = 1, 2, 3, 4 die Mengen (Mi )◦ und Mi ∩ ∂Mi , wobei M1 := (−1, 0), M2 := [1, 2], M3 := (−2, 0) ∪ (0, 2), M4 := Z. Fassen Sie dabei alle Mengen als Teilmengen von R auf. 2. Bestimmen Sie ∂S \ S für die Menge S := {1/n | n ∈ N} ⊂ R. 3. Sei (V, k · k) ein normierter Raum über K. Zeigen Sie, dass für jede Teilmenge M ⊆ V die folgenden Aussagen gelten: • M ◦ ∩ ∂M = ∅ • (∂M )◦ = ∅ • ∂(∂M ) = ∂M 4. Sei (V, k · k) ein normierter Raum über K. Zeigen Sie, dass für je zwei Teilmengen A, B ⊆ V die Identität ∂(A ∩ B) = (∂A ∩ B) ∪ (A ∩ ∂B) gilt. 56 KAPITEL 3. TOPOLOGISCHE BEGRIFFE (a) (b) (c) Abbildung 3.2: (a) Offene Teilmengen des R2 . (b) Abgeschlossene Teilmengen des R2 (c) Teilmengen des R2 , welche weder offen noch abgeschlossen sind. 3.2 Offene und abgeschlossene Mengen Definition (offene Menge). Sei (V, k · k) ein normierter Raum über K. Eine Menge O ⊆ V heißt offen, wenn jedes Element v ∈ O ein innerer Punkt von O ist. Definition (abgeschlossene Menge). Sei (V, k · k) ein normierter Raum über K. Eine Menge A ⊆ V heißt abgeschlossen, wenn die Menge V \ A offen ist. Die Adjektive offen“ und abgeschlossen“ legen nahe, dass eine Menge genau dann offen ” ” ist, wenn sie nicht abgeschlossen ist. Dies ist aber nicht der Fall! Wie wir anhand einzelner Beispiele sehen werden, gibt es Mengen, die weder offen noch abgeschlossen sind. Ferner gibt es Mengen, die sowohl offen als auch abgeschlossen sind. Für die Identifizierung offener und abgeschlossener Mengen ist der nachfolgende Satz sehr hilfreich. Satz 3.1 (Charakterisierung offener und abgeschlossener Mengen). Sei (V, k · k) ein normierter Raum über K, und sei M eine Teilmenge von V eine Menge. Dann gelten die folgenden Aussagen. (1) M ist genau dann offen, wenn M = M ◦ gilt. (2) M ist genau dann abgeschlossen, wenn M = M gilt. Aus Satz 3.1 folgt insbesondere, dass das Innere einer Menge offen, und dass der Abschluss einer Menge abgeschlossen ist. Ferner gilt ∂M = ∂M ∪ ∂(∂M ) = ∂M ∪ ∂M = ∂M, für jede Menge M , weshalb der Rand einer Menge abgeschlossen ist. Wir geben nun noch einige Beispiele für offene und abgeschlossene Mengen an, wie auch Beispiel für Mengen, die weder offen noch abgeschlossen sind. Beispiele. (a) Jedes offene Intervall (a, b) mit Intervallgrenzen a, b ∈ R ist eine offene Teilmenge von R, und jedes abgeschlossene Intervall [a, b] ist eine abgeschlossene Teilmenge von R. (b) Unbeschränkte Intervalle der Form (a, ∞) und (−∞, b) mit a, b ∈ R sind offene Teilmengen von R. Unbeschränkte Intervalle der Form [a, ∞) und (−∞, b] sind abgeschlossene Teilmengen von R. 3.2. OFFENE UND ABGESCHLOSSENE MENGEN 57 (c) Intervalle der Form [a, b) und (a, b] mit Intervallgrenzen a, b ∈ R sind weder offen noch abgeschlossen. (d) Jede offene Kugel Br (v) in einem normierten Raum ist offen. Wegen Sr (v) = ∂Br (v) ist jede Sphäre in einem normierten Raum abgeschlossen. Ferner ist jede abgeschlossene Kugel Br (v) in einem normierten Raum abgeschlossen. (e) Sei (V, k · k) ein normierter Raum über K. Fasst man die leere Menge ∅ als Teilmenge von V auf, so gilt ∅ = ∅◦ . Also ist ∅ offen. Außerdem gilt V ◦ = V , weshalb V offen ist. Offenbar gilt aber auch V \ ∅ = V und V \ V = ∅, woraus folgt, dass die Mengen ∅ und V sowohl offen als auch abgeschlossen sind. Die Abgeschlossenheit einer Menge A kann auch über das Konvergenzverhalten der Folgen in A charakterisiert werden. Satz 3.2 (Folgenkriterium für Abgeschlossenheit). Sei (V, k · k) ein normierter Raum über K. Eine Teilmenge A ⊆ V ist genau dann abgeschlossen, wenn der Grenzwert jeder konvergenten Folge in A ein Element von A ist. Mit Hilfe des von Satz 3.2 bereit gestellten Folgenkriteriums, kann man oft die Abgeschlossenheit einer Menge widerlegen. Man betracht dazu das folgende Beispiel. Beispiel. Wir betrachten das Intervall (0, 1] ⊂ R. Die Folge (an )n∈N , definiert durch an := 1/n für alle n ∈ N, ist offenbar eine Folge in (0, 1], die gegen Null konvergiert. Da die Zahl 0 jedoch kein Element von (0, 1] ist, kann das Intervall (0, 1] nach Satz 3.2 nicht abgeschlossen sein. Als nächstes untersuchen wir, was man über Vereinigungen oder Durchschnitte offener bzw. abgeschlossener Mengen aussagen kann. Satz 3.3. Sei (V, k · k) ein normierter Raum über K. Dann gelten die folgenden Aussagen. (1) Sei (Oi )i∈I eine Familie offener Teilmengen von V . Dann ist die Vereinigung [ Oi := v ∈ V ∃i ∈ I : v ∈ Oi i∈I ebenfalls eine offene Teilmenge von V . (2) Sei O1 , O2 , . . . , Om eine endliche Anzahl offener Teilmengen von V . Dann ist der Durchschnitt O1 ∩ O2 ∩ · · · ∩ Om ebenfalls eine offene Teilmenge von V . (3) Sei (Ai )i∈I eine Familie abgeschlossener Teilmengen von V . Dann ist der Durchschnitt \ Ai := v ∈ V ∀i ∈ I : v ∈ Ai i∈I ebenfalls eine abgeschlossene Teilmenge von V . (4) Sei A1 , A2 , . . . , Am eine endliche Anzahl abgeschlossener Teilmengen von V . Dann ist die Vereinigung A1 ∪ A2 ∪ · · · ∪ Am ebenfalls eine abgeschlossene Teilmenge von V. 58 KAPITEL 3. TOPOLOGISCHE BEGRIFFE Die Aussagen von Satz 3.3 können folgendermaßen zusammengefasst werden: Die Vereinigung beliebig vieler, sowie der Durschnitt endlich vieler offenen Mengen ist offen, und der Durchschnitt beliebig vieler, sowie die Vereinigung endlich vieler abgeschlossener Mengen ist abgeschlossen. Dass die Aussagen (2) und (4) von Satz 3.3 tatsächlich nur für endlich viele offene bzw. abgeschlossene Mengen gelten können, soll anhand der folgenden Beispiele verdeutlicht werden. Beispiele. (a) Für jedes n ∈ N sei das offene Intervall In ⊂ R durch In := (−1/n, 1/n) definiert. Man kann leicht zeigen, dass \ In = {0} n∈N gilt. Die einpunktige Menge {0} ist eine abgeschlossene Teilmenge von R. (b) Für jedes n ∈ N sei das abgeschlossene Intervall In ⊂ R durch In := [−n, n] definiert. Man überlegt sich leicht, dass dann [ In = R n∈N gilt. Offenbar ist R eine offene Menge. Übungsaufgaben 1. Zeigen Sie, dass die folgenden Mengen offene Teilmengen von R sind. O1 := (−1, 1) \ {0}, [ O2 := (α, α + 1), α∈[0,1] O3 := R \ [−3, −2] ∪ [2, 3] , O4 := {1/x | x > 0}. 2. Sei (V, k · k) ein normierter Raum über K, und sei O ⊆ V eine offene und A ⊆ V eine abgeschlossene Menge. Zeigen Sie, dass O \ A offen und A \ O abgeschlossen ist. 3. Zeigen Sie mit Hilfe des Folgenkriteriums für Abgeschlossenheit, dass jede nach unten beschränkte, abgeschlossene Teilmenge von R ein Minimum besitzt. Zeigen Sie außerdem, dass jede nach oben beschränkte, abgeschlossene Menge ein Maximum besitzt. 4. Untersuchen Sie die folgenden Mengen Teilmengen von R2 auf Offenheit und Abgeschlossenheit. M1 := [0, 1] × (0, 1], M2 := B1 (0) \ {0}, M3 := (x1 , x2 )T ∈ R2 x2 > 1 , M4 := R2 \ Z2 . Der Vektorraum R2 sei dabei mit der euklidischen Norm versehen. 3.3. BESCHRÄNKTHEIT 3.3 59 Beschränktheit Definition (beschränkte Menge). Sei (V, k · k) ein normierter Raum über K. Eine Menge B ⊆ V heißt beschränkt, wenn es eine positive Zahl R > 0 gibt, so dass kbk ≤ R für alle b ∈ B gilt. Ist (V, k · k) ein normierter Raum, so ist eine Teilmenge B ⊆ V offenbar genau dann beschränkt, wenn eine nichtnegative Zahl R ≥ 0 existiert, so dass B ⊆ BR (0) gilt, wobei BR (0) die abgeschlossene Kugel um den Ursprung in V mit Radius R bezeichnet. Dies bedeutet insbesondere, dass die leere Menge ∅ eine beschränkte Menge ist. Eine Menge B ⊆ V ist auch dann beschränkt, wenn ein Vektor v ∈ V und eine nichtnegative Zahl r ≥ 0 existiert, so dass B ⊆ Br (v) gilt. Man kann nämlich leicht zeigen, dass dann Br (v) ⊆ Bkvk+r (0) für alle v ∈ V und alle r > 0 gilt. Da kvk+r eine nichtnegative Zahl ist, hat man somit eine abgeschlossene Kugel um den Ursprung in V gefunden, welcher die Menge B als Teilmenge enthält. In Abschnitt 2.3 wurden bereits das Konzept der Beschränktheit nach oben sowie das Konzept der Beschränktheit nach unten für Teilmengen von R eingeführt. Das folgende Lemma bringt diese Konzepte mit dem Konzept der Beschränktheit für Teilmengen normierter Räume in Verbindung. Lemma 3.4. Eine nichtleere Teilmenge von R ist genau dann beschränkt, wenn sie nach unten und nach oben beschränkt ist. Als nächstes gehen wir der Frage nach, was man über Vereinigungen und Durchschnitte beschränkter Mengen aussagen kann. Satz 3.5. Sei (V, k · k) ein normierter Raum über K. Dann gelten die folgenden Aussagen. (1) Sei (Bi )i∈I eine Familie beschränkter Teilmengen von V . Dann ist der Durchschnitt \ Bi i∈I ebenfalls eine beschränkte Teilmenge von V . (2) Sei B1 , B2 , . . . , Bm eine endliche Anzahl beschränkter Teilmengen von V . Dann ist die Vereinigung B1 ∪ B2 ∪ · · · ∪ Bm ebenfalls eine beschränkte Teilmenge von V . Satz 3.5 besagt, dass der Durchschnitt beliebig vieler und die Vereinigung endlich vieler beschränkter Mengen wieder beschränkt ist. Die Vereinigung unendlich vieler beschränkter Mengen, muss hingegen nicht beschränkt sein, wie das nachfolgende Beispiel verdeutlicht. 60 KAPITEL 3. TOPOLOGISCHE BEGRIFFE (a) (b) Abbildung 3.3: (a) Beschränkte Teilmengen des R2 . (b) Die Gerade M1 und der Halbraum M2 sind Teilmengen des R2 , welche nicht beschränkt sind. Beispiel. Für jede ganze Zahl k ∈ Z sei das abgeschlossene Intervall Ik := [k, k + 1] definiert. Offenbar ist jedes dieser Intervalle beschränkt. Als Vereinigung aller Intervalle erhält man jedoch die Menge [ Ik = R, k∈Z welche nicht beschränkt ist. ♦ Als nächsten übertragen wir das Konzept der Beschränktheit auf Folgen in einem normierten Raum. Definition (beschränkte Folge). Sei (V, k · k) ein normierter Raum über K. Eine Folge (vn )n∈N in V heißt beschränkt, wenn die Menge aller Folgenglieder beschränkt ist. Offenbar ist eine Folge genau dann beschränkt, wenn man eine positive Zahl R > 0 finden kann, so dass alle Folgenglieder Elemente der abgeschlossenen Kugel BR (v) sind. Dies ist genau dann der Fall, wenn kvn k ≤ R für alle n ∈ N gilt. Eine reelle Zahlenfolge ist nach Lemma 3.4 genau dann beschränkt, wenn sie sowohl nach oben als auch nach unten beschränkt ist. Man betrachte hierzu auch die folgenden Beispiele. Beispiele. (a) Jede konstante Folge ist beschränkt. (b) Die reelle Zahlenfolge (an )n∈N , definiert durch an := 1 − 1/n für alle n ∈ N, ist durch 0 nach unten und durch 1 nach oben beschränkt. Also ist (an )n∈N eine beschränkte Folge in R. (c) Die Folge (x(k) )k∈N in R2 sei durch (k) x := sin(k) cos(k) für alle k ∈ N definiert. Man rechnet leicht nach, dass |x(k) | = 1 für alle k ∈ N gilt, weshalb die Folge (x(k) )k∈N beschränkt ist. 3.3. BESCHRÄNKTHEIT 61 (d) Die Folge (y (k) )k∈N in R2 , welche durch y (k) := k 1/k für alle k ∈ N definiert ist, ist nicht beschränkt. Man kann nämlich leicht zeigen, dass |y (k) | > k für alle k ∈ N gilt. Entsprechend findet man zu jeder positiven Zahl R > 0 eine natürliche Zahl k ∈ N, so dass x(k) 6∈ BR (0) gilt. Für konvergente Folgen gilt die folgende Aussage. Lemma 3.6. Jede konvergente Folge ist beschränkt. Beschränktheit ist also ein notwendiges Kriterium für die Konvergenz von Folgen. Abschließend führen wir noch das Konzept beschränkter Funktionen ein. Definition (beschränkte Funktion). Sei X eine nichtleere Menge, und sei (W, k · k) ein normierter Raum. Eine Funktion f : X → W heißt beschränkt, wenn ihre Wertemenge beschränkt ist. Die Menge aller beschränkten Funktionen von X nach W wird mit B(X, W ) bezeichnet. Falls W = R gilt, bezeichnet man diese Menge auch mit B(X). Übungsaufgaben 1. Sei (V, k · k) ein normierter Raum über K. Zeigen Sie, dass Br (v) ⊆ Bkvk+r (0) für jeden Vektor v ∈ V und jede positive Zahl r > 0 gilt. 2. Untersuchen Sie die reellen Zahlenfolgen (an )n∈N , (bn )n∈N , (cn )n∈N und (dn )n∈N auf Beschränktheit. Die Folgen sind durch an := (−1)n , 2n3 + n , n3 + 1 n4 − 3 , cn := − 2 n +2 dn := sin(n) bn := für alle n ∈ N definiert. 3. Untersuchen Sie die folgenden Funktionen auf Beschränktheit. f1 : (−1, 1] → R, x 7→ x2 , 1 − x1 f2 : R2 → R2 , x 7→ x22 f3 : R2 \ {0} → R, x 7→ 1/|x|, sin(t) f4 : R → R2 , t 7→ . cos(t) 4. Sei (V, k · k) ein normierter Raum über K und M ⊆ V eine Menge, die nicht beschränkt ist. Zeigen Sie, dass dann eine Folge (vn )n∈N in M existiert, so dass kvn k ≥ n für alle n ∈ N gilt. 62 3.4 KAPITEL 3. TOPOLOGISCHE BEGRIFFE Kompakte Mengen Definition (Überdeckung). Sei X eine beliebige Menge, und sei M ⊆ X eine Teilmenge von X. Eine Familie (Mi )i∈I bestehend aus Teilmengen von X wird eine Überdeckung von M genannt, wenn [ M⊆ Mi i∈I gilt, d.h. wenn die Vereinigung aller zur Familie gehörenden Mengen die Menge M überdeckt. Definition (offene Überdeckung). Sei (V, k · k) ein normierter Raum über K, und sei M eine Teilmenge von V . Eine Überdeckung (Oi )i∈I von M heißt offen, wenn für jeden Index i ∈ I die Menge Oi offen ist. Definition (kompakte Menge). Sei (V, k · k) ein normierter Raum über K. Eine Menge K ⊆ V heißt kompakt, wenn man aus jeder offenen Überdeckung (Oi )i∈I der Menge K endlich viele offene Mengen Oi1 , Oi2 , . . . , Oim auswählen kann, so dass K ⊆ Oi1 ∪ Oi2 ∪ · · · ∪ Oim gilt. Die definierende Eigenschaft kompakter Mengen kann nur schwer veranschaulicht werden. Es genügt nicht sich vorzustellen, dass eine Menge kompakt ist, wenn sie mit einer endlichen Anzahl offener Mengen überdeckt werden kann. Das gilt nämlich für jede Teilmenge eines normierten Raums. Vielmehr ist eine Menge M genau dann kompakt, wenn man aus jeder Familie offener Mengen, deren Vereinigung M überdeckt, eine endliche Teilfamilie auswählen kann, deren Vereinigung die Menge M ebenfalls überdeckt. Im allgemeinen ist es schwierig zu entscheiden, ob eine Menge kompakt ist oder nicht. Wir wollen hier zwei sehr einfache Fälle betrachten, in denen dies möglich ist. Beispiel. (a) Sei (V, k · k) ein normierter Raum, und sei v ∈ V ein beliebiger Vektor. Dann ist die einpunktige Menge {v} kompakt. Ist nämlich (Oi )i∈I eine beliebige offene Überdeckung von {v}, so gilt [ {v} ⊆ Oi , i∈I und somit auch v∈ [ Oi . i∈I Daraus folgt wiederum, dass mindestens ein Index i1 ∈ I existiert, so dass v ∈ Oi1 gilt. Dann gilt aber auch {v} ⊆ Oi1 , was bedeutet, dass Oi1 die Menge {v} bereits überdeckt. (b) Die Menge der ganzen Zahlen Z ist eine Teilmenge von R. Definiert man zu jeder ganzen Zahl k ∈ Z das offene Intervall Ik := (k − 1/3, k + 1/3), so ist (Ik )k∈Z eine offene Überdeckung von Z, welche aus unendlich vielen Intervallen besteht. Man erkennt leicht, dass für jede nichtleere Teilmenge N ⊆ Z die Familie (Ik )k∈Z\N keine Überdeckung von Z ist. Daher kann es keine endliche Anzahl von Intervallen Ik1 , Ik2 , . . . , Ikm geben, so dass Ik1 ∪ Ik2 ∪ · · · ∪ Ikm die Menge Z überdeckt. Also ist Z keine kompakte Teilmenge von R. 3.4. KOMPAKTE MENGEN (a) 63 (b) Abbildung 3.4: (a) Kompakte Teilmengen des R2 . (b) Teilmengen des R2 , welche nicht kompakt sind. Die Kompaktheit einer Menge K kann man auch über das Konvergenzverhalten aller Folgen in K charakterisieren. Satz 3.7 (Folgenkriterium für Kompaktheit). Sei (V, k · k) ein normierter Raum über K. Eine Teilmenge K ⊆ V ist genau dann kompakt, wenn jede Folge in K eine konvergente Teilfolge mit Grenzwert in K besitzt. Als nächstes untersuchen wir die Eigenschaften kompakter Mengen. Satz 3.8. Sei (V, k · k) ein normierter Raum über K, und sei K ⊆ V eine kompakte Teilmenge. Dann ist K beschränkt und abgeschlossen. Satz 3.8 besagt, dass Abgeschlossenheit und Beschränktheit notwendige Bedingungen für die Kompaktheit sind. Entsprechend kann man diesen Satz verwenden, um zu zeigen, dass bestimmte Mengen nicht kompakt sind. Beispiele. (a) Offene Intervalle (a, b), sowie Intervalle der Form (a, b] und [a, b) mit Intervallgrenzen a, b ∈ R sind nicht abgeschlossen. Daher sind sie auch nicht kompakt. (b) Intervalle der Form [a, ∞) und (−∞, b] mit Intervallgrenzen a, b ∈ R sind nicht beschränkt, weshalb sie auch nicht kompakt sind. ♦ Für Teilmengen der Vektorräume Rn kann man zeigen, dass Beschränktheit und Abgeschlossenheit nicht nur notwendige, sondern auch hinreichende Bedingungen für Kompaktheit sind. Der entsprechende Satz ist als Satz von Heine–Borel bekannt. Satz 3.9 (Heine–Borel). Eine Teilmenge des Kn ist genau dann kompakt, wenn sie beschränkt und abgeschlossen ist. Dies gilt für alle n ∈ N. Die praktische Anwendung des Satzes von Heine–Borel soll hier durch einige Beispiele verdeutlicht werden. Beispiele. (a) Die Menge der reellen Zahlen R kann als eindimensionaler Vektorraum über R aufgefasst werden. Abgeschlossene Intervalle [a, b] mit Intervallgrenzen a, b ∈ R sind sowohl abgeschlossen als auch beschränkt. Nach dem Satz von Heine–Borel sind solche Intervalle also kompakt. 64 KAPITEL 3. TOPOLOGISCHE BEGRIFFE (b) Für jede natürliche Zahl n ∈ N sind die abgeschlossenen Kugeln Br (x) und die Sphären Sr (x) in Kn sowohl abgeschlossen als auch beschränkt. Nach dem Satz von Heine–Borel sind diese Mengen also kompakt. ♦ Eine wichtige Folgerung aus dem Folgenkriterium für Kompaktheit (siehe Satz 3.7) und dem Satz von Heine–Borel (siehe Satz 3.9) ist der Satz von Bolzano–Weierstraß. Satz 3.10 (Bolzano–Weierstraß). Jede beschränkte Folge in Kn besitzt eine konvergente Teilfolge. Dies gilt für alle n ∈ N. Übungsaufgaben 1. Untersuchen Sie die folgenden Teilmengen von R auf Kompaktheit: M1 := [1, 2] ∪ [3, 4], M2 := [−1, 1] \ {0}, M3 := {1/n | n ∈ N} ∪ {0}, M4 := N. 2. Zeigen Sie unter Verwendung der Sätze 3.3, 3.5 und 3.9, dass für jede natürliche Zahl n ∈ N der Durchschnitt beliebig vieler und die Vereinigung endlich vieler kompakter Teilmengen von Kn ebenfalls kompakt ist. 3.5. VOLLSTÄNDIGKEIT 3.5 65 Vollständigkeit Definition (Cauchy–Folge). Sei (V, k · k) ein normierter Raum über K. Eine Folge (vn )n∈N in V heißt Cauchy–Folge, wenn für jede positive Zahl ε > 0 eine natürliche Zahl N ∈ N existiert, so dass kvn − vm k < ε für alle m, n ∈ N mit n ≥ m ≥ N gilt. Anschaulich gesprochen ist eine Folge genau dann eine Cauchy–Folge, wenn ihre Folgenglieder für wachsende Indizes immer enger zusammenrücken. Oft ist die folgende Charakterisierung von Cauchy–Folgen hilfreich: Eine Folge (vn )n∈N in einem normierten Raum (V, k · k) über K ist genau dann eine Cauchy–Folge, wenn für jede positive Zahl ε > 0 eine natürliche Zahl N ∈ N existiert, so dass für alle m, n ∈ N aus min{m, n} ≥ N stets kvn − vm k < ε folgt. Das nachfolgende Lemma besagt, dass dies insbesondere dann der Fall ist, wenn die Folge gegen einen Grenzwert konvergiert. Lemma 3.11. Jede konvergente Folge ist eine Cauchy–Folge. Wir wissen bereits, dass jede konvergente Folge beschränkt ist. Das folgende Lemma liefert eine analoge Aussage für Cauchy–Folgen und somit eine notwendige Bedingung dafür, dass eine Folge eine Cauchy–Folge sein kann. Lemma 3.12. Jede Cauchy–Folge ist beschränkt. Es stellt sich nun die folgende Frage: Angenommen, man hat eine Cauchy–Folge, deren Glieder allesamt Elemente einer nichtleeren Teilmenge M eines normierten Raums sind. Kann man dann schließen, dass die Folge einen Grenzwert besitzt, der ebenfalls ein Element von M ist? Es zeigt sich, dass dies im Allgemeinen nicht der Fall ist. Aus diesem Grund führt man die Eigenschaft der Vollständigkeit für Teilmengen eines normierten Raums ein. Definition (vollständige Menge). Sei (V, k · k) ein normierter Raum über K. Eine Teilmenge M ⊆ V heißt vollständig, wenn jede Cauchy–Folge in M gegen ein Element von M konvergiert. Eine nicht vollständige Teilmenge eines normierten Raums wird unvollständig genannt. Ist (V, k · k) ein normierter Raum über K, dann ist der Vektorraum V selbst ebenfalls eine Teilmenge von V . Daher kann man die Eigenschaft der Vollständigkeit auch für V definieren. Dies führt auf den wichtigen Begriff eines Banach–Raums bzw. den eines Hilbert–Raums. Definition (Banach–Raum). Ein normierter Raum (V, k · k) über K heißt Banach– Raum über K, wenn V vollständig ist. Definition (Hilbert–Raum). Ein Innenproduktraum (V, h · , · i) über K heißt Hilbert– Raum über K, wenn V bezüglich der vom Skalarprodukt h · , · i induzierten Norm k · k vollständig ist, d.h. wenn (V, k · k) ein Banach–Raum über K ist. Da jede normierte Algebra insbesondere auch ein normierter Raum ist, kann man den Begriff der Vollständigkeit auch auf normierte Algebren übertragen. Man kommt dann zu so genannten Banach–Algebren. 66 KAPITEL 3. TOPOLOGISCHE BEGRIFFE Definition (Banach–Algebra). Eine normierte Algebra (V, k · k) über K heißt Banach– Algebra über K, wenn V vollständig ist. Wir geben hier noch ein hinreichendes Kriterium für die Vollständigkeit einer Menge an. Satz 3.13. Jede kompakte Menge ist vollständig. Von besonderem Interesse sind die vollständigen Teilmengen der normierten Räume Rn und Cn mit n ∈ N. Der folgende Satz liefert eine entsprechende Charakterisierung. Satz 3.14. Eine Teilmenge von Kn ist genau dann vollständig, wenn sie abgeschlossen ist. Dies gilt für alle n ∈ N. Wie wir bereits wissen, ist der normierte Raum Kn für jede natürliche Zahl n ∈ N abgeschlossen. Nach Satz 3.14 ist Kn also vollständig und somit ein Banach–Raum über K. Versieht den Vektorraum Rn darüber hinaus mit einem Skalarprodukt, so erhält man einen Hilbert–Raum über R. Es ist wichtig zu wissen, dass in allgemeinen normierten Räumen über K die Abgeschlossenheit einer Menge nicht gleichbedeutend mit deren Vollständigkeit ist. Die Teilmengen der normierten Räume Kn nehmen in dieser Hinsicht also eine Sonderstellung ein. Als nächstes wollen wir noch ein wichtiges Beispiel für eine unvollständige Teilmenge von R kennen lernen. Beispiel. Die Menge der rationalen Zahlen Q ist eine unvollständige Teilmenge von R. Man betrachte dazu die Folge (an )n∈N , welche gemäß a1 := 1, an+1 := a2n + 2 2an für alle n ∈ N rekursiv definiert ist. Da jedes Glied dieser Folge durch Addition, Multiplikation und Division von Bruchzahlen entsteht, ist (an )n∈N eine Folge √ in Q. Man kann außerdem zeigen, dass die Folge (an )n∈N gegen die irrationale Zahl 2 konvergiert. Da die Folge konvergent ist, ist sie auch eine Cauchy–Folge. Die Folge (an )n∈N ist also eine Cauchy–Folge in Q, die gegen einen Grenzwert konvergiert, der nicht Element von Q ist. Man beachte, dass aufgrund von Satz 3.14 die Menge Q auch nicht abgeschlossen ist. Dies kann man auch mit Hilfe des Folgenkriteriums für die Abgeschlossenheit einer Menge zeigen (siehe Satz 3.2). Übungsaufgaben 1. Zeigen Sie, dass die reellen Zahlenfolgen (an )n∈N und (bn )n∈N Cauchy–Folgen in R sind. Die Folgen seien dabei durch (−1)n , n 1 bn := n 3 für alle n ∈ N definiert. Lösen Sie diese Aufgabe ohne Verwendung von Lemma 3.11, indem Sie die definierende Eigenschaft von Cauchy–Folgen nachweisen. an := 2. Sei (V, k · k) ein normierter Raum über K, seien (vn )n∈N und (wn )n∈N zwei Cauchy–Folgen in V , und sei α ∈ K ein beliebiger Skalar. Zeigen Sie, dass die Folgen (vn + wn )n∈N und (αvn )n∈N ebenfalls Cauchy–Folgen in V sind. 3.6. ZUSAMMENHÄNGENDE MENGEN (a) 67 (b) Abbildung 3.5: (a) Zusammenhängende Teilmengen des R2 (b) Eine nicht zusammenhängende Teilmenge des R2 . 3.6 Zusammenhängende Mengen Definition (zusammenhängende Menge). Sei (V, k · k) ein normierter Raum über K. Eine Menge M ⊆ V wird nicht zusammenhängend genannt, wenn es zwei offene Mengen O1 , O2 ⊆ V gibt, so dass M ⊆ O1 ∪ O2 und O1 ∩ M 6= ∅ und O2 ∩ M 6= ∅ und O1 ∩ O2 = ∅ gilt. Anderfalls heißt die Menge M zusammenhängend. Die mathematische Definition zusammenhängender Mengen ist auf den ersten Blick eher unanschaulich. In den meisten Fällen genügt die Vorstellung, dass eine Menge genau dann zusammenhängend ist, wenn sie nicht aus mehreren separaten, nichtleeren Teilmengen besteht (siehe Abbdildung 3.5). Was genau mit separat“ gemeint ist, wird durch die ma” thematische Definition präzisiert: Zwei nichtleere Teilmengen werden als separat angesehen, wenn sie in verschiedenen, disjunkten, offenen Mengen enthalten sind. Man betrachte hierzu auch die nachfolgenden Beispiele. Beispiele. (a) Jede offene Kugel Br (v) und jede abgeschlossene Kugel Br (v) in einem normierten Raum über K ist zusammenhängend. (b) Die Menge M = [−2, −1] ∪ [1, 2] ist nicht zusammenhängend. Definiert man nämlich die offenen Intervalle O1 := (−3, 0) und O2 := (0, 3), so gilt M ⊆ O1 ∪ O2 , O1 ∩ M = [−2, 1], O2 ∩ M = [1, 2] und O1 ∩ O2 6= ∅. Das folgende Lemma ist oft nützlich, um zusammenhängende Mengen zu identifizieren. Lemma 3.15. Sei (V, k · k) ein normierter Raum über K, sei M ⊂ V eine zusammenhängende Menge, und sei Z ⊆ V eine weitere Menge, so dass M ⊆ Z ⊆ M gilt. Dann ist Z ebenfalls zusammenhängend. Der folgende wichtige Satz charakterisiert die nichtleeren, zusammenhängenden Teilmengen von R. Satz 3.16. Eine nichtleere Teilmenge von R ist genau dann zusammenhängend, wenn sie ein Intervall ist. Wir erinnern daran, dass der Begriff Intervall“ sämtliche Teilmengen von R einschließt, ” welche von der Form (a, b), [a, b], (a, b], [a, b), (−∞, b), (−∞, b], (a, ∞) und [a, ∞) sind. Auch die Menge der reellen Zahlen R selbst ist ein Intervall, welches gelegentlich als (−∞, ∞) bezeichnet wird. Der Satz 3.16 besagt also auch, dass die Menge R zusammenhängend ist. 68 KAPITEL 3. TOPOLOGISCHE BEGRIFFE Übungsaufgaben 1. Untersuchen Sie, ob die folgenden Teilmengen von R zusammenhängend sind. M1 := (−∞, 2) ∩ (−2, ∞), M2 := Z, M3 := (−1, 1) \ {0}, [ M4 := [n − 1, n). n∈N Verwenden Sie nach Möglichkeit Satz 3.16. 2. Zeigen Sie durch Angabe jeweils eines Gegenbeispiels, dass die Vereinigung und der Durchschnitt von zwei zusammenhängenden Mengen im Allgemeinen nicht zusammenhängend ist. 3. Sei (V, k · k) ein normierter Raum über K. Zeigen Sie, dass jede einpunktige Menge {v}, mit v ∈ V , zusammenhängend ist. 4. Zeigen Sie, dass jede abgeschlossene und zusammenhängende Teilmenge von R, welche nach oben, nicht aber nach unten beschränkt ist, ein Intervall von der Form (−∞, b] mit b ∈ R ist. Lernzielkontrolle Nach dem Durcharbeiten diese Kapitels sollten Sie... ... wissen, was ein innerer Punkt und was das Innere einer Menge ist. ... wissen, was ein Randpunkt und was der Rand einer Menge ist. ... wissen, was der Abschluss einer Menge ist. ... wissen, was eine offene und was eine abgeschlossene Menge ist. ... wissen, was beschränkte Mengen, Folgen und Funktionen sind. ... den Satz von Heine–Borel kennen. ... wissen, was eine Cauchy–Folge ist. ... wissen, dass jede konvergente Folge eine Cauchy–Folge ist. ... wissen, dass jede konvergente Folge und jede Cauchy–Folge beschränkt ist. ... wissen, was es bedeutet, dass die Menge R vollständig ist, und dass die Menge Q nicht vollständig ist. ... wissen, was ein Banach–Raum und was ein Hilbert–Raum ist. ... wissen, was eine zusammenhängende Menge ist. ... wissen, dass Intervalle die einzigen zusammenhängenden Teilmengen von R sind. 69 Kapitel 4 Konvergenzbegriffe und Konvergenzkriterien 4.1 Konvergenz reeller Zahlenfolgen Im Abschnitt 2.5 haben wir bereits den Begriff des Grenzwerts einer Folge eingeführt und Rechenregeln für Folgengrenzwerte aufgestellt. In diesem Abschnitt widmen wir uns speziell den Folgen in R. Im Mittelpunkt unserer Untersuchungen steht dabei die Frage, ob eine gegebene Folge in R konvergiert oder divergiert. Insbesondere wollen wir hinreichende Bedingungen für die Konvergenz einer reellen Zahlenfolge zusammenstellen. Solche Bedingungen nennt man Konvergenzkriterien. Das erste Konvergenzkriterium, welches wir betrachten, ist als Cauchy–Kriterium bekannt. Das Cauchy–Kriterium folgt direkt aus der Tatsache, dass R ein vollständiger normierter Raum ist (siehe Satz 3.14). Satz 4.1 (Cauchy–Kriterium). Eine Folge (an )n∈N in R ist genau dann konvergent, wenn sie eine Cauchy–Folge ist, d.h. wenn zu jeder positiven Zahl ε > 0 eine natürliche Zahl N ∈ N existiert, so dass |an − am | < ε für alle m, n ∈ N mit n ≥ m ≥ N gilt. Das Cauchy–Kriterium liefert sowohl ein notwendiges als auch ein hinreichendes Kriterium für die Konvergenz einer reellen Zahlenfolge. Es ist jedoch nur selten geeignet, um die Konvergenz einer gegebenen Folge nachzuweisen. Deshalb geben wir noch zwei weitere Konvergenzkriterien an, welche auf der Tatsache beruhen, dass R ein angeordneter Körper ist (und zwar durch die Ordnungsrelation ≤). Dem nachfolgenden Satz kommt dabei eine zentrale Rolle zu. Satz 4.2. Seien (an )n∈N und (bn )n∈N zwei konvergente Folgen in R derart, dass eine natürliche Zahl N ∈ N existiert, so dass an ≤ bn für alle n ∈ N mit n ≥ N gilt. Dann gilt lim an ≤ lim bn . n→∞ n→∞ Gemäß Satz 4.2 bleibt die Ordnungsrelation ≤ beim Grenzübergang von reellen Zahlenfolgen erhalten. Seien also (an )n∈N und (bn )n∈N zwei reelle Zahlenfolgen, die 70 4.1. KONVERGENZ REELLER ZAHLENFOLGEN 71 gegen Grenzwerte a ∈ R bzw. b ∈ R konvergieren, und deren Folgenglieder die Ungleichung an ≤ bn für alle n ∈ N erfüllen, dann gilt auch a ≤ b. Die strikte Ordnungsrelation < bleibt im Allgemeinen jedoch nicht erhalten! Selbst wenn also die Glieder der Zahlenfolgen (an )n∈N und (bn )n∈N die strikte Ungleichung an < bn für alle n ∈ N erfüllen, gilt für die Grenzwerte im Allgemeinen nur noch a ≤ b. So erfüllen beispielsweise die Glieder der Folgen (an )n∈N und (bn )n∈N , welche durch an := 1/(n + 1) und bn := 1/n für alle n ∈ N definiert sind, die strikte Ungleichung an < bn für alle n ∈ N. Die Grenzwerte a = 0 und b = 0 dieser Folgen erfüllt jedoch nur noch die Ungleichung a ≤ b. Eine wichtige Folgerung aus Satz 4.2 ist das folgende Konvergenzkriterium für reelle Zahlenfolgen, welches unter dem Namen Sandwichtheorem bekannt ist. Satz 4.3 (Sandwichtheorem). Seien (pn )n∈N und (qn )n∈N zwei Folgen in R, die gegen denselben Grenzwert a ∈ R konvergieren. Sei außerdem (an )n∈N eine Folge in R mit der Eigenschaft, dass eine natürliche Zahl N ∈ N existiert, so dass pn ≤ an ≤ qn für alle n ∈ N mit n ≥ N gilt. Dann konvergiert die Folge (an )n∈N ebenfalls gegen a. Das folgende Beispiel verdeutlicht, wie man das Sandwichtheorem bei bestimmten reellen Zahlenfolgen dazu verwenden kann, den Grenzwert zu bestimmen. Beispiel. Wir betrachten die reelle Zahlenfolge (an )n∈N , welche durch an := für alle n ∈ N definiert ist. Offenbar gilt n 1 2n 2 1 = n ≤ an ≤ 2 = 2 2 n n sowie 2n 2n für alle n ∈ N mit n ≥ 4, n 1 2 = lim = 0. n→∞ 2 n→∞ n lim Nach dem Sandwichtheorem konvergiert die Folge (an )n∈N also ebenfalls gegen Null. ♦ Ein weiteres wichtiges Konvergenzkriterium für reelle Zahlenfolgen ist das so genannte Monotoniekriterium. Satz 4.4 (Monotoniekriterium). Sei (an )n∈N eine Folge in R, welche monoton wachsend und nach oben beschränkt ist. Dann konvergiert die Folge (an )n∈N gegen ihr Supremum. Falls die Folge (an )n∈N monoton fallend und nach unten beschränkt ist, konvergiert sie gegen ihr Infimum. Eine monoton wachsende oder monoton fallende Zahlenfolge (an )n∈N , welche gegen einen Grenzwert a ∈ R konvergiert, wird gelegentlich auch monoton konvergent genannt. Falls die Folge monoton wachsend ist, schreibt man häufig an % a (n → ∞), um die monotone Konvergenz anzudeuten. Ist die Folge monoton fallend, so schreibt man auch an & a (n → ∞). Aus dem Monotoniekriterium kann man noch ein weiteres, etwas schwächeres“ Konver” genzkriterium für reelle Zahlenfolgen herleiten. 72 KAPITEL 4. KONVERGENZBEGRIFFE UND KONVERGENZKRITERIEN Satz 4.5. Sei (an )n∈N eine Folge in R, welche nach oben beschränkt und ab einem bestimmten Index monoton wachsend ist. Dann ist die Folge konvergent. Dasselbe gilt, wenn die Folge nach unten beschränkt und ab einem bestimmten Index monoton fallend ist. Im nachfolgenden Beispiel demonstrieren wir, wie man das Monotoniekriterium verwenden kann, um die Existenz der so genannten Eulerschen Zahl e zu beweisen. Beispiel (Die Eulersche Zahl e). Wir betrachten die Folge (an )n∈N in R, welche durch 1 n an := 1 + n für alle n ∈ N definiert ist. Gemäß der verallgemeinerten ersten binomischen Formel gilt n X n 1 n n 1 n 1 n 1 an = = + + + ··· + . 2 k k n 0 1 n 2 n n nn k=0 Als erstes zeigen wir, dass die Folge (an )n∈N streng monoton wachsend ist. Dabei verwenden wir die Tatsache, dass für je zwei positive Zahlen p > 0 und q > 0 mit p ≤ q die Ungleichung p/q ≤ (p + 1)/(q + 1) gilt. Man erhält daher die Abschätzung n! n 1 = k k n k!(n − k)!nk 1 n n−1 n−2 n−k+1 = · · · ··· k! n n n n n n−1 n−k+2 1 n+1 · · · ··· ≤ k! n + 1 n + 1 n + 1 n+1 (n + 1)! = k!(n − k + 1)!(n + 1)k n+1 1 = . k (n + 1)k für alle n ∈ N und für alle k ∈ {1, 2, . . . , n}. Daraus folgt wiederum n n n+1 X X X n + 1 n 1 1 1 n+1 an = ≤ < = an+1 k k k n k k (n + 1) (n + 1)k k=0 k=0 k=0 für alle n ∈ N. Als nächstes zeigen wir, dass die Folge (an )n∈N durch die Zahl 3 nach oben beschränkt ist. Für jede natürliche Zahl k ∈ {1, 2, . . . , n} gilt offenbar n! 1 n n−1 n−k+1 1 n 1 = = · · ··· ≤ . k k k n k! n n n k! k!(n − k)!n Daher erhält man die Abschätzung 1 1 1 1 1 + + + ... + + 1! 2! 3! (n − 1)! n! 1 1 1 1 1 ≤1+ + + + ··· + + 1 1·2 2·3 (n − 2)(n − 1) (n − 1)n 1 1 1 1 1 1 1 1 =1+1+ − + − + ··· + − + − 1 2 2 3 n−2 n−1 n−1 n an ≤ 1 + 4.1. KONVERGENZ REELLER ZAHLENFOLGEN =1+1+ =3− 73 1 1 − 1 n 1 n ≤3 für alle n ∈ N. Nach dem Monotoniekriterium konvergiert die Folge (an )n∈N also gegen eine reelle Zahl. Diese Zahl wird die Eulersche Zahl genannt, und mit e bezeichnet. Es gilt also 1 n e := lim 1 + n→∞ n Die Eulersche Zahl e ist irrational, und es gilt e ≈ 2,7182818. ♦ Die im voran gegangenen Beispiel untersuchte Folge (an )n∈N gehört zu einer ganzen Familie konvergenter Folgen in R, deren Grenzwerte durch Potenzen der Eulerschen Zahl gegeben sind. Lemma 4.6. Für jede rationale Zahl x ∈ Q gilt x n lim 1 + = ex . n→∞ n Man kann die Aussage von Lemma 4.6 dazu verwenden, um die Exponentialfunktion x 7→ ex für alle rationalen Zahlen x ∈ Q zu definieren. Darüber hinaus kann man zeigen, dass die Aussage von Lemma 4.6 auch für irrationale Zahlen x ∈ R \ Q gilt. Übungsaufgaben 1. Bestimmen Sie die Grenzwerte der Folgen (an )n∈N , (bn )n∈N , (cn )n∈N und (dn )n∈N in R. Die Folgen sind durch n+1 1 an := 1 + , n n n bn := , n+1 n 1 cn := 1 − 2 , n n 0 + 2 + 4 + · · · + 2(n − 1) dn := n2 für alle n ∈ N definiert. Verwenden Sie das Lemma 4.6. 2. Bestimmen Sie die Grenzwerte der reellen Zahlenfolgen (an )n∈N , (bn )n∈N , (cn )n∈N , (dn )n∈N . Die Folgen sind durch √ n an := 100, p n bn := 1 + n2 , 3n cn := n , 3 √ 3 n dn := √ 3 n +n für alle n ∈ N definiert. Verwenden Sie das Sandwichtheorem. 74 KAPITEL 4. KONVERGENZBEGRIFFE UND KONVERGENZKRITERIEN 3. Beweisen Sie mit Hilfe des Sandwich–Theorems die folgende Aussage. Ist (an )n∈N eine Nullfolge in R und (bn )n∈N eine beschränkte Folge in R, dann konvergiert die Folge (an bn )n∈N gegen Null. 4. Sei n ∈ N eine natürliche Zahl und x ∈ Kn ein beliebiger Vektor. Die reelle Zahlenfolge (ap )p∈N sei durch ap := kxkp für alle p ∈ N definiert, wobei kxkp die p-Norm von x bezeichnet (siehe Beispiel (g) auf Seite 9). Zeigen Sie mit Hilfe des Sandwichtheorems, dass die Folge (ap )p∈N gegen kxk∞ konvergiert. Hierbei bezeichnet kxk∞ die Maximumnorm von x. 5. Untersuchen Sie, ob die reellen Zahlenfolgen (an )n∈N , (bn )n∈N , (cn )n∈N und (dn )n∈N konvergent sind. Die Folgen sind durch 1 1 1 + + ··· + , n+1 n+2 2n p b1 := 0, bn+1 = 2 + bn 1 1 c1 := , cn+1 := cn 1 − , 2 n+1 1 d1 := 1, dn+1 = d1 + d2 + · · · + dn an := für alle n ∈ N definiert. Verwenden Sie das Monotoniekriterium. 4.2. KONVERGENZ VON REIHEN 4.2 75 Konvergenz von Reihen Definition (Reihe). Sei V ein Vektorraum über K, und sei (vn )n∈N eine Folge in V . Dann heißt die Folge (sN )N ∈N in V , welche durch sN := N X vn = v1 + v2 + . . . + vN n=1 für alle N ∈ N gegeben ist, die von (vn )n∈N erzeugte Reihe in V . Für jeden Index N ∈ N nennt man das Folgenglied sN die N -te Partialsumme der Reihe (sN )N ∈N , und für jeden Index n ∈ N heißt das Folgenglied vn der n-te Summand der Reihe (sN )N ∈N . Die Reihe (sN )N ∈N wird üblicherweise durch die Schreibweise ∞ X vn n=1 dargestellt. Manchmal stellt man die Reihe auch durch Angabe der ersten Summanden in der Form v1 + v2 + · · · + vN + · · · dar. Eine Reihe ist also nichts anderes als eine Folge, deren Glieder durch sukzessives Aufsummieren der Glieder einer anderen Folge entstehen. Jedes Glied einer Reihe ist somit eine Summe, welche aus endlich vielen Summanden besteht. Dennoch ist die Vorstellung weit verbreitet, eine Reihe seiPeine Summe mit unendlich vielen Summanden, was vor allem durch die Schreibweise ∞ n=1 vn nahegelegt wird. Wie wir noch sehen werden, hat diese Vorstellung sogar eine gewisse Berechtigung, wenn es sich bei der Reihe um eine konvergente Reihe (s.u.) handelt. Ähnlich wie bei Folgen, ist es bei Reihen oft nützlich die Menge N0 oder eine Menge von der Form N ∪ {0, −1, −2, . . . , −m} mit m ∈ N als Indexmenge zu wählen. Man stellt die von einer Folge (vn )∞ n=−m erzeugte Reihe dann durch ∞ X vn n=−m dar. Im folgenden geben wir einige Beispiele für Reihen in R an. Beispiele. (a) Die Reihe ∞ X 1 = 1 + 1 + 1 + 1 + ··· k=1 wird von der konstanten Folge (an )n∈N erzeugt, welche durch an := 1 für alle n ∈ N definiert ist. Man erkennt leicht, dass für jeden Index N ∈ N die N -te Partialsumme P dieser Reihe durch N 1 k=1 = N gegeben ist. (b) Die Reihe ∞ X 1 1 1 1 = 1 + + + + ··· n 2 3 4 n=1 wird P1 die harmonische P2 Reihe genannt. Die ersten P3 Partialsummen dieser Reihe lauten n=1 1/n = 1, n=1 1/n = 1 + 1/2 = 3/2, n=1 1/n = 1 + 1/2 + 1/3 = 11/6. 76 KAPITEL 4. KONVERGENZBEGRIFFE UND KONVERGENZKRITERIEN (c) Sei q ∈ C eine komplexe Zahl. Dann heißt die Reihe ∞ X qn = 1 + q + q2 + q3 + · · · n=0 die geometrische Reihe zu q. ♦ Eine wichtige Rolle in der Analysis spielen so genannte konvergente Reihen. Definition (konvergente Reihe). Sei (V, k · k) ein normierter Raum über K. Eine Reihe P∞ n=1 vn in V heißt konvergent, wenn ein Vektor v ∈ V existiert, so dass lim N →∞ N X vn = v n=1 gilt. Der Vektor v heißt dann der Grenzwert von ∞ X P∞ n=1 vn , und man schreibt vn = v. n=1 Definition (divergente Reihe). Sei (V, k · k) ein normierter Raum über K. Eine Reihe in V heißt divergent, wenn sie nicht konvergent ist. P Man beachte, dass das Symbol ∞ n=1 vn tatsächlich zwei Bedeutungen hat. Zunächst bezeichnet es die Reihe, welche von einer Folge (vn )n∈N erzeugt wird. Ist diese Reihe konvergent, so bezeichnet das Symbol jedoch auch den Grenzwert der Reihe. Welche Bedeutung dem Symbol zukommt muss jeweils aus dem Kontext erschlossen werden, was im Allgemeinen jedoch keine Schwierigkeiten bereitet. PN Um eine Verwechselung gänzlich auszuschließen, kann man die Reihe auch durch n=1 vn N ∈N darstellen, und das Symbol P∞ v ausschließlich für den Grenzwert der Reihe verwenden, was jedoch eher unüblich n=1 n ist. Nachfolgend geben wir einige wichtige Beispiele für konvergente Reihen in R an. Beispiele. (a) Der Mathematiker Leonhard Euler konnte zeigen, dass die Reihe ∞ X 1 1 1 1 =1+ + + + ··· 2 n 4 9 16 n=1 gegen die Zahl π 2 /6 konvergiert. (b) Die Reihe ∞ X 1 1 1 1 = 1 + + + + ··· n! 1 2 6 n=0 konvergiert gegen die Eulersche Zahl e. (c) Die so genannte alternierende harmonische Reihe ∞ X (−1)n+1 n=1 n konvergiert gegen die Zahl ln(2). =1− 1 1 1 + − ± ··· 2 3 4 4.2. KONVERGENZ VON REIHEN 77 (d) Die so genannte Leibniz–Reihe ∞ X (−1)n 1 1 1 = 1 − + − ± ··· 2n + 1 3 5 7 n=0 konvergiert gegen die Zahl π/4. ♦ Als nächstes wollen wir einige Rechenregeln für die Grenzwerte konvergenter Reihen zusammenstellen. P P∞ Satz 4.7. Sei (V, k · k) ein normierter Raum über K, seien ∞ n=1 vn und n=1 wn zwei konvergente Reihen in V , und sei α ∈ K ein beliebiger Skalar. Dann gelten die folgenden Aussagen. (1) ∞ X (vn + wn ) = n=1 (2) ∞ X (αvn ) = α n=1 ∞ X vn + n=1 ∞ X ∞ X wn . n=1 vn . n=1 Wir kommen nun zur Untersuchung des Konvergenzverhaltens von Reihen. Im allgemeinen ist es schwierig zu erkennen, ob eine gegebene Reihe konvergiert oder divergiert. Das folgende Lemma liefert zunächst eine notwendige Bedingung für die Konvergenz einer Reihe. P Lemma 4.8. Sei (V, k · k) ein normierter Raum über K, und sei ∞ n=1 vn eine konvergente Reihe in V . Dann bildet die Folge der Reihensummanden (vn )n∈N eine Nullfolge in V . Es muss noch einmal betont werden, dass das Lemma 4.8 lediglich ein notwendiges, nicht aber ein hinreichendes Kriterium für die Konvergenz einer Reihe liefert. Es gibt nämlich auch divergente Reihen, deren Summanden eine Nullfolge bilden. Eine wichtige Klasse konvergenter Reihen bilden die geometrischen Reihen zu den komplexen Zahlen, welche betragsmäßig echt kleiner als Eins sind. Die Grenzwerte dieser Reihen können darüber hinaus explizit berechnet werden, wie der nachfolgende Satz zeigt. Satz 4.9. Die geometrische Reihe zu einer komplexen Zahl q ∈ C ist genau dann konvergent, wenn |q| < 1 gilt. Für den Grenzwert der Reihe gilt dann ∞ X qn = n=0 1 . 1−q Man betrachte die nachfolgenden Beispiele. Beispiele. (a) Nach Satz 4.9 gilt ∞ ∞ n X X 1 1 1 = = n 3 3 1− n=0 n=0 1 3 3 = . 2 78 KAPITEL 4. KONVERGENZBEGRIFFE UND KONVERGENZKRITERIEN Abbildung 4.1: Die Reihe P∞ n=1 1/2n konvergiert gegen die Zahl 1. (b) Für die komplexe Zahl z = i/2 gilt |z| = 1/2 < 1. Also konvergiert die geometrische Reihe zu z, und wir erhalten die komplexe Zahl ∞ X n=0 zn = 1 1− i 2 = 4 2 + i 5 5 als Grenzwert der Reihe. ♦ Ein besonders interessantes Ergebnis erhält man, wenn man die Reihe ∞ X 1 1 1 1 1 = + + + + ··· n 2 2 4 8 16 n=1 auf Konvergenz hin untersucht. Fasst man nämlich jede N -te Partialsumme sN := 1/2 + 1/4 + · · · + 1/2N dieser Reihe als die Position eines Punktes P auf der reellen Zahlengerade auf, so erkennt man, dass sich der Punkt P der Zahl 1 immer weiter annähert. Beim Übergang von einem Index N ∈ N zum jeweils nächsten Index N + 1 legt der Punkt P dabei immer genau die Hälfte der Distanz zurück, die zwischen ihm und der Zahl 1 liegt (siehe Abbildung 4.1). Eine solche Bewegung“ des Punktes P bezeichnen wir im folgenden ” als Annäherungsschritt“. Es stellt sich die Frage, ob der Punkt jemals die Zahl 1 erreicht. ” Mit Hilfe von Satz 4.9 kann man diese Frage beantworten. Es gilt nämlich ! ∞ ∞ n X X 1 1 1 = −1= − 1 = 1. n 2 2 1 − 12 n=1 n=0 Der Punkt P kommt der Zahl 1 also beliebig nahe, d.h. für jede positive Zahl ε > 0 existiert eine natürliche Zahl N ∈ N, so dass nach N Annäherungsschritten der Abstand zwischen dem Punkt P und der Zahl 1 kleiner als ε ist. Da die Zahl 1 der Grenzwert der Folge (sN )n∈N ist, kommt man leicht zu der Vorstellung, der Punkt P würde die Zahl 1 nach unendlich vielen Annäherungsschritten erreichen. Es ist dabei allerdings nicht wirklich klar, was genau unter nach unendlich vielen Annäherungsschritten“ zu verstehen ” sein soll. Daher ist eine gewisse Vorsicht bei dieser Interpretation des Ergebnisses geboten. Betrachtet man die alternierende harmonische Reihe sowie die Leibniz–Reihe, so fällt auf, dass die Summanden beider Reihen abwechselnd positiv und negativ sind. Reihen in R mit dieser Eigenschaft werden alternierend genannt. Die genaue Definition lautet folgendermaßen: P Definition (alternierende Reihe). Eine Reihe ∞ n=1 an in R wird alternierend genannt, n wenn sgn(an ) = (−1) für alle n ∈ N oder sgn(an ) = (−1)n+1 für alle n ∈ N gilt. 4.2. KONVERGENZ VON REIHEN 79 Für alternierende Reihen gilt das folgende Konvergenzkriterium, welches unter dem Namen Leibniz–Kriterium bekannt ist. P Satz 4.10 (Leibniz–Kriterium). Sei ∞ n=1 an eine alternierende Reihe in R mit der Eigenschaft, dass die Folge (|an |)n∈N der Beträge der Reihensummanden monoton gegen Null konvergiert. Dann ist die Reihe konvergent. Das Leibniz–Kriterium garantiert offenbar insbesondere die Konvergenz der Leibniz–Reihe (siehe Beispiel (d) auf Seite 77). Zu ist, dass das Leibniz–Kriterium für die KonPbeachten ∞ vergenz einer alternierende Reihe n=1 an in R voraussetzt, dass die Folge (|an |)n∈N monoton gegen Null konvergiert. Tatsächlich gibt es divergente, alternierende Reihen in R, bei denen die Folge der Beträge der Reihesummanden nichtmonoton gegen Null konvergiert. Man betrachte dazu die nachfolgenden zwei Beispiele. Beispiele. (a) Die Reihe √ √ √ ∞ X (−1)n 2 3 4 √ = −1 + − + ∓ ··· 2 3 4 n n=1 erfüllt die Voraussetzungen des Leibniz–Kriteriums und ist daher konvergent. (b) Sei (an )n∈N die reelle Zahlenfolge, welche durch ( 1/n falls n ungerade, an := −1/n2 falls n gerade für alle n ∈ N definiert ist, und sei ∞ X n=1 an = 1 − 1 1 1 + − ± ··· , 4 3 16 die zugehörige Reihe. Dann konvergiert die Folge (|an |)n∈N zwar gegen Null, jedoch nicht monoton. Daher sind die Voraussetzungen fürPdas Leibniz–Kriterium nicht erfüllt. Tatsächlich kann man zeigen, dass die Reihe ∞ ♦ n=1 an divergent ist. Mit dem Satz 4.9 und dem Leibniz–Kriterium stehen uns zwei Werkzeuge zur Verfügung, um die Konvergenz von geometrischen und alternierenden Reihen nachzuweisen. Als nächstes befassen wir uns mit der Frage, wie man die Divergenz von Reihen nachweisen kann. Zunächst geben wir zwei wichtige Beispiele für divergente Reihen in R an. Beispiele. (a) Die harmonische Reihe ist divergent. Betrachtet man nämlich die Partialsummen sN := 1 + 1/2 + 1/3 + . . . + 1/N der harmonischen Reihe, so erhält man die Abschätzung |s2N − sN | = 1 1 1 1 1 + + ··· + ≥N· = N +1 N +2 2N 2N 2 für alle N ∈ N. Dies bedeutet aber, dass die Folge (sn )n∈N der Partialsummen der harmonischen Reihe keine Cauchy–Folge sein kann. Nach dem Cauchy–Kriterium (siehe Satz 4.1) ist die Folge (sn )n∈N und damit die harmonische Reihe also divergent. 80 KAPITEL 4. KONVERGENZBEGRIFFE UND KONVERGENZKRITERIEN (b) Die geometrische Reihe zu jeder komplexen Zahl q ∈ C mit |q| ≥ 1 ist divergent. ♦ Als nächstes führen wir den Begriff der Minorante ein. Dieser wird benötigt, um ein Kriterium für die Divergenz einer Reihe in R zu formulieren. P∞ P∞ Definition (Minorante). Sei a eine Reihe in R. Eine Reihe n n=1 n=1 mn in R heißt P∞ eine Minorante für n=1 an , wenn eine natürliche Zahl N ∈ N existiert, so dass 0 ≤ mn ≤ an für alle n ∈ N mit n ≥ N gilt. Eine Minorante ist also eine Reihe, deren Summanden bis auf endlich viele Ausnahmen nichtnegativ und indexweise kleiner oder gleich wie die Summanden einer gegebenen Reihe in R sind. Entsprechend ist jede N -te Partialsumme der Minorante kleiner oder gleich wie die N -te Partialsumme der ursprünglichen Reihe für N ∈ N. Daraus ergibt sich aber, dass die Divergenz der Minorante auch die Divergenz der ursprünglichen Reihe impliziert. Dies ist die Idee, die dem so genannten Minorantenkriterium zugrunde liegt. Satz 4.11 (Minorantenkriterium). Jede Reihe in R, für die eine divergente Minorante existiert, divergiert bestimmt gegen ∞. Aus dem Minorantenkriterium folgt auch, dass jede divergente Reihe in R mit nichtnegativen Summanden gegen ∞ bestimmt divergeriert. Jede solche Reihe ist nämlich eine divergente Majorante für sich selbst. Das nachfolgende Beispiel verdeutlicht, wie man mit Hilfe des Minorantenkriteriums die bestimmte Divergenz einer Reihe in R beweisen kann. Beispiel. Wir betrachten die Reihe ∞ X n=1 √ 1 n2 +1 . Bezeichnet man den n-ten Summanden der Reihe mit an , so gilt an = √ 1 n2 +1 ≥√ 1 1 =√ 2 2n +n n2 für alle n ∈ N. √ √ P P∞ Die Reihe ∞ Minorante für die Reihe 1/ n2 + 1. n=1 1/( 2n) ist also eine divergente n=1 √ P∞ 2 Nach dem Minorantenkriterium ist die Reihe n=1 1/ n + 1 somit gegen ∞ bestimmt divergent. ♦ Übungsaufgaben 1. Geben Sie die ersten vier Partialsummen der nachfolgenden Reihen in R an. ∞ X n=1 n, ∞ X 1 , 2 n n=1 ∞ X (−1)n , 2n + 1 n=0 ∞ X (−2)n . n=1 2. Zeigen Sie, dass die folgenden Reihen konvergent sind, und bestimmen Sie den Grenzwert jeder Reihe. ∞ ∞ ∞ X X X 1 1 n−1 n 3 − , − , . 2 2 2+n n n + 1 n (n + 1) n n=1 n=1 n=1 Hinweis: Leiten Sie allgemeine Formeln für die Partialsummen der Reihen her. 4.2. KONVERGENZ VON REIHEN 81 3. Untersuchen Sie die folgenden Reihen auf Konvergenz und berechnen Sie gegebenenfalls die Grenzwerte. ∞ ∞ ∞ √ n ∞ ∞ ∞ X X X X X X 6 6n 2 1 n , , , , (1 + i) , (1 + i)−n . n n n 4 5 5 2 n=0 n=0 n=2 n=1 n=0 n=0 4. Für jede natürliche Zahl z ∈ {0, 1, 2, . . . , 9} bezeichne 0,z die Dezimaldarstellung einer reellen Zahl mit periodischer Nachkommastelle z. Zeigen Sie mit Hilfe von Satz 4.9, dass 0,z = z 9 für alle z ∈ {0, 1, 2, . . . , 9} gilt. Beachten Sie, dass dies insbesondere die Identität 0,9 = 1 beweist. 5. Zeigen Sie, dass die folgenden Reihen divergent sind. ∞ √ X n , n n=1 ∞ X (n + 1)(n − 1) , n2 n=1 ∞ X n , 2 n +4 n=1 ∞ X 1 √ . n+ n n=1 6. Sei q ∈ C eine komplexe Zahl, für die |q| < 1 gilt. Zeigen Sie, dass dann ∞ X n=k für alle k ∈ N0 gilt. qn = qk 1−q 82 4.3 KAPITEL 4. KONVERGENZBEGRIFFE UND KONVERGENZKRITERIEN Absolute Konvergenz von Reihen Neben der Konvergenz und der Divergenz definiert man für Reihen noch ein weiteres Konvergenzverhalten, welches als absolute Konvergenz bezeichnet wird. Es zeigt sich, dass absolut konvergente Reihen im wesentlichen wie gewöhnliche Summen behandelt werden können. Definition (absolut konvergente Reihe). Sei (V, k · k) ein normierter Raum. Eine ReiP P∞ he ∞ v in V heißt absolut konvergent, wenn die Reihe n=1 n n=1 kvn k konvergent ist. P Man beachte, dass die Reihe ∞ n=1 kvn k in der obigen Definition stets eine Reihe in R ist. Wir erinnern außerdem daran, dass die Menge der reellen Zahlen R sowie die Menge der komplexen Zahlen C standardmäßig mit der jeweiligen Betragsfunktion als Norm verseP a absolute Konvergenz hen sind. Will man also beispielsweise eine Reihe ∞ n=1 n in R aufP hin untersuchen, so muss man das Konvergenzverhalten der Reihe ∞ n=1 |an | bestimmen. Nachfolgend geben wir einige Beispiele für absolut konvergente Reihen an. Beispiele. (a) Die geometrische Reihe zu jeder komplexen Zahl q ∈ C mit |q| < 1 ist absolut konvergent. (b) Man kann zeigen, dass für jede reelle Zahl α > 1 die Reihe ∞ X 1 nα n=1 absolut konvergent ist. Für α ≤ 1 ist die Reihe hingegen divergent. (c) Jede konvergente Reihe in R mit nichtnegativen Summanden ist trivialerweise auch absolut konvergent. (d) Nach dem Leibniz–Kriterium ist die Reihe ∞ X (−1)n n=0 n konvergent. Die Reihe ist jedoch nicht absolut konvergent, da die harmonische Reihe divergent ist. ♦ Der nachfolgende Satz klärt, wie die Konvergenz und die absolute Konvergenz einer Reihe in einem Banach–Raum (d.h. in einem vollständigen normierten Raum) zusammenhängen. Satz 4.12. Jede absolut konvergente Reihe in einem Banach–Raum ist konvergent. Man beachte, dass für jede natürliche Zahl n ∈ N die mit einer Norm versehenen Vektorräume Rn und Cn nach Satz 3.14 vollständig und somit Banach–Räume über R bzw. C sind. Gemäß Satz 4.12 ist daher insbesondere jede absolut konvergente Reihe in R und in C konvergent. Wie eingangs bereits erwähnt wurde, können absolut konvergente Reihen in vielerlei Hinsicht wie gewöhnliche Summen behandelt werden. Einen erster Hinweis hierauf liefert der nachfolgende Satz, der besagt, dass für absolut konvergente Reihen eine Variante der Dreiecksungleichung gilt. 4.3. ABSOLUTE KONVERGENZ VON REIHEN 83 Satz 4.13 (Dreiecksungleichung P∞ für absolut konvergente Reihen). Sei (V, k · k) ein Banach–Raum über K, und sei n=1 vn eine absolut konvergente Reihe in V . Dann gilt ∞ ∞ X X vn ≤ kvn k. n=1 n=1 Die Addition in einem Vektorraum ist bekanntlich eine kommutative Verknüpfung. Dies bedeutet, dass sich die Summe endlich vieler Vektoren nicht ändert, wenn man die Reihenfolge der Vektoren vertauscht. Ein analoges Resultat kann für absolut konvergente Reihen gezeigt werden. Der entsprechende Satz ist als Umordnungssatz bekannt. P Satz 4.14 (Umordnungssatz). Sei (V, k · k) ein Banach–Raum über K, sei ∞ n=1 vn eine absolutPkonvergente Reihe in V , und sei ϕ : N → N eine bijektive Abbildung. Dann ist die Reihe ∞ n=1 vϕ(n) ebenfalls absolut konvergent, und es gilt lim N →∞ N X n=1 vϕ(n) = lim N →∞ N X vn . n=1 Der Umordnungssatz besagt, dass der Grenzwert einer absolut konvergenten Reihe invariant gegenüber einer Umordnung der Reihensummanden ist. Es stellt sich die Frage, ob diese Aussage auch für solche Reihen gilt, die zwar konvergent, nicht aber absolut konvergent sind. Die überraschende Antwort lautet: Nein! Tatsächlich kann man zeigen, dass sich der Grenzwert einer nicht absolut konvergenten Reihe in der Regel ändert, wenn man die Reihenfolge der Reihensummanden ändert. Mehr noch: Durch Umordnung der Reihensummanden kann man die Reihe gegen jeden beliebigen Grenzwert konvergieren und sogar bestimmt divergieren lassen. Diese Aussage ist als Riemannscher Umordnungssatz bekannt. Im Rest dieses Abschnitts stellen wir einige hinreichende Kriterien für die absolute Konvergenz von Reihen zusammen. Zu diesem Zweck führen wir zunächst den Begriff der Majorante ein. P Definition (Majorante). Sei ∞ n=1 an eine Reihe P∞in R mit nichtnegativen Summanden, d.h. es gelte an ≥ 0 für alle n ∈ N. Eine Reihe n=1 Mn in R heißt eine Majorante für P ∞ n=1 an , wenn eine natürliche Zahl N ∈ N existiert, so dass an ≤ Mn für alle n ∈ N mit n ≥ N gilt. Existiert für eine Reihe in R mit nichtnegativen Summanden eine absolut konvergente Majorante, so kann man zeigen, dass auch die ursprüngliche Reihe absolut konvergiert. Auf diesem Prinzip beruht das so genannte Majorantenkriterium. Satz normierter Raum über K, und sei P∞ 4.15 (Majorantenkriterium). Sei (V, k · k) Pein ∞ dass für die Reihe n=1 kvn k eine konvergente Majorante n=1 vn eine Reihe in V , soP existiert. Dann ist die Reihe ∞ n=0 vn absolut konvergent. Das nachfolgende Beispiel verdeutlicht, wie man das Majorantenkriterium anwendet. 84 KAPITEL 4. KONVERGENZBEGRIFFE UND KONVERGENZKRITERIEN Beispiel. Wir betrachten die Reihe ∞ X √ n=1 1 n3 +1 . Bezeichnet man den n-ten Summanden der Reihe mit an , so gilt |an | = √ 1 n3 1 1 ≤ √ = 3/2 3 n +1 n für alle n ∈ N. √ P∞ P∞ 3/2 ) ist also Majorante für die Reihe Die Reihe 1/(n |1/ n3 + 1|. Da diese n=1 n=1 √ P∞ 3 Majorante konvergent ist, ist die Reihe n=1 1/ n + 1 absolut konvergent nach dem Majorantenkriterium . ♦ Um mit dem Majorantenkriterium arbeiten zu können, muss man natürlich wissen, welche Reihen in R absolut konvergieren. Wir erinnern uns, dass beispielsweise sämtliche geometrische Reihen reellen Zahlen q ∈ (0, 1) absolut konvergieren. Auch die Reihen P P∞ zu−α ∞ mit α > 1 sind absolut konvergent. n=1 1/n! und n=1 n Ein weiteres Kriterium, mit dem man entweder die absolute Konvergenz oder aber die Divergenz einer Reihe nachweisen kann, ist das so genannte Wurzelkriterium. Satz P∞ 4.16 (Wurzelkriterium). Sei (V, k · k) ein normierter Raum über K. Eine Reihe n=0 vn in V ist absolut konvergent, wenn eine Zahl q ∈ (0, 1) und eine natürliche Zahl N ∈ N existiert, so dass p n kvn k ≤ q für alle n ∈ N mit n ≥ N gilt. Falls hingegen eine natürliche Zahl N ∈ N existiert, so dass p n kvn k ≥ 1 für alle n ∈ N mit n ≥ N gilt, dann ist die Reihe divergent. In den nachfolgenden Beispielen demonstrieren wir die Anwendung des Wurzelkriteriums. Beispiele. (a) Wir betrachten die Reihe ∞ X n=1 n 2n + 1 n . Bezeichnet man den n-ten Summanden der Reihe mit an für n ∈ N, so erhält man p n n 1 n ≤ = für alle n ∈ N. |an | = 2n + 1 2n 2 Nach dem Wurzelkriterium ist die Reihe also absolut konvergent. (b) Das Konvergenzverhalten der Reihe ∞ X 2n n . n+4 n=1 soll untersucht werden. Bezeichnet man den n-ten Summanden der Reihe mit an für n ∈ N, so erhält man die Abschnätzung p 2n n |an | = ≥ 1 für alle n ∈ N mit n ≥ 4. n+4 Nach dem Wurzelkriterium ist die Reihe demzufolge divergent. ♦ 4.3. ABSOLUTE KONVERGENZ VON REIHEN 85 Bei der Verwendung des Wurzelkriteriums ist eine gewisse Vorsicht geboten. P∞ Will man nämlich mit Hilfe dieses Kriteriums die absolute Konvergenz einer Reihe n=1 vn nachweisen, so genügt es nicht zu zeigen, dass die strikte Ungleichung p n kvn k < 1 ab einem bestimmten P Index N ∈ N gilt. Dies gilt nämlich beispielsweise auch für die divergente Reihe ∞ n=1 1/2. Neben dem Wurzelkriterium gibt es noch ein zweites Kriterium, mit dem man die absolute Konvergenz oder aber die Divergenz einer Reihe nachweisen kann. Dieses Kriterium wird das Quotientenkriterium genannt. Satz 4.17 P∞ (Quotientenkriterium). Sei (V, k · k) ein normierter Raum über K. Eine Reihe n=0 vn in V ist absolut konvergent, wenn eine reelle Zahl q ∈ (0, 1) und eine natürliche Zahl N ∈ N existiert, so dass kvn+1 k ≤q kvn k für alle n ∈ N mit n ≥ N gilt. Falls hingegen eine natürliche Zahl N ∈ N existiert, so dass kvn+1 k ≥1 kvn k für alle n ∈ N mit n ≥ N gilt, dann ist die Reihe divergent. In den nachfolgenden Beispielen wird das Quotientenkriterium angewendet. Beispiele. (a) Wir betrachten die Reihe ∞ X n=1 2n (n + 1)! in R. Bezeichnet man den jeweils n-ten Summanden der Reihe mit an für n ∈ N, so erhält man |an+1 | 2n+1 (n + 1)! 2 2 = n = ≤ für alle n ∈ N. |an | 2 (n + 2)! n+2 3 Nach dem Quotientenkriterium ist die Reihe also absolut konvergent. (b) Sei an der n-te Summand der Reihe ∞ X n=1 n! (n + 1)2 in R für n ∈ N. Dann erhält man die Abschnätzung |an+1 | (n + 1)! (n + 1)2 (n + 1)3 = = ≥1 |an | (n + 2)2 n! (n + 2)2 für alle n ∈ N mit n ≥ 2, weshalb die Reihe nach dem Quotientenkriterium divergent ist. ♦ 86 KAPITEL 4. KONVERGENZBEGRIFFE UND KONVERGENZKRITERIEN Man beachte, dass es für die Anwendung P∞ des Quotientenkriteriums nicht genügt zu zeigen, dass die Summanden einer Reihe n=1 vn die strikte Ungleichung kvn+1 k <1 kvn k ab einem bestimmten Index N ∈ N erfüllen. Dies ist nämlich auch für die Summanden der harmonischen Reihe der Fall. Die harmonische Reihe ist jedoch bekanntlich divergent. Zum Abschluss dieses Abschnitts geben noch ein Lemma an, welches sich oft als nützlich erweist, wenn man eine Reihe mittels dem Quotienten- oder dem Wurzelkriterium auf absolute Konvergenz hin untersucht. Lemma 4.18. Sei (an )n∈N eine konvergente Reihe in R mit Grenzwert a. Weiterhin seien p ∈ R und q ∈ R zwei reelle Zahlen, so dass p < a < q gilt. Dann existiert eine natürliche Zahl N ∈ N, so dass p ≤ an ≤ q für alle n ∈ N mit n ≥ N gilt. P∞ Warum ist dieses Lemma nützlich? Man stelle sich vor, dass man eine Reihe n=1 vn p auf absolute Konvergenz hin untersucht und dabei feststellt, dass die Folge ( n kvn k)n∈N konvergent ist. Wenn nun p lim n kvn k < 1 n→∞ gilt, dann folgt aus Lemma 4.18, dass die Voraussetzungen für die absolute Konvergenz der Reihe aus dem Wurzelkriterium erfüllt sind. Wenn hingegen p lim n kvn k > 1 n→∞ gilt, dann folgt aus Lemma 4.18, dass die Voraussetzungen für die Divergenz der Reihe aus dem Wurzelkriterium erfüllt sind. Ähnlich verhält es sich mit dem Quotientenkriterium. Wenn also die Folge (kvn+1 k/kvn k)n∈N konvergent ist, und darüber hinaus lim n→∞ kvn+1 k <1 kvn k gilt, dann kann man mit Hilfe des Quotientenkriteriums folgern, dass die Reihe absolut konvergent ist. Wenn hingegen kvn+1 k lim >1 n→∞ kvn k gilt, dann folgt aus Lemma 4.18 und dem Quotientenkriterium die Divergenz der Reihe. Ist einer der zuvor behandelten Grenzwerte genau gleich 1, dann ist keine Aussage möglich. Übungsaufgaben 1. Untersuchen Sie die folgenden Reihen auf absolute Konvergenz. ∞ X 1 √ , n n +1 n=1 ∞ X (−1)n+1 , 2n − 1 n=1 P∞ ∞ X n2 , 2n n=1 ! ∞ n X X 1 , 3k n=1 k=1 ∞ X n=1 2n . +1 n3 2. Zeigen Sie, dass die Reihe n=1 cos(n)/2n absolut konvergent ist, und dass für den Grenzwert s dieser Reihe die Ungleichung |s| ≤ 1 gilt. P∞ 3. Zeigen Sie, dass die Reihe n=1 4−n−cos(πn) absolut konvergent ist, und bestimmen Sie den Grenzwert dieser Reihe. Verwenden Sie dazu den Umordnungssatz. 4.4. PUNKTWEISE KONVERGENZ VON FUNKTIONENFOLGEN 4.4 87 Punktweise Konvergenz von Funktionenfolgen Definition (Funktionenfolge). Seien X und Y zwei nichtleere Mengen. Eine Folge (fn )n∈N heißt eine Funktionenfolge von X nach Y , wenn für jeden Index n ∈ N das n-te Folgenglied fn eine Funktion von X nach Y ist. Unter einer Funktionenfolge versteht man also eine Folge, deren Glieder allesamt Funktionen mit sind, welche einen gemeinsamen Definitions- und Wertebereich besitzen. Im folgenden geben wir einige Beispiele für Funktionenfolgen an. Beispiele. n (a) Die Funktionenfolge (fn )∞ n=0 von R nach R, deren Glieder durch fn (x) := x für alle x ∈ R und alle n ∈ N definiert sind, wird die Folge der Monome genannt. Die ersten drei Glieder dieser Funktionenfolge sind offenbar durch f0 (x) = 1, f1 (x) = x und f2 (x) = x2 für alle x ∈ R gegeben. (b) Die Funktionenfolgen (sn )n∈N und (cn )n∈N von [0, 2π] nach R, welche durch sn (x) := sin(nx) und cn (x) := cos(nx) für alle x ∈ [0, 2π] und alle n ∈ N gegeben sind, sind für die Analyse bestimmter Schwingungsvorgänge von entscheidender Bedeutung. (c) Betrachtet man die Glieder der Funktionenfolge (δn )n∈N von R nach R, welche durch 2 n x + n x ∈ [−1/n, 0) δn (x) := −n2 x + n x ∈ [0, 1/n] 0 sonst für alle x ∈ R und alle n ∈ N definiert sind, so stellt man folgendes fest: Für jede natürliche Zahl n ∈ N schließt der Graph von δn mit der x-Achse ein gleichschenkliges Dreieck mit einer Grundseite der Länge 2/n und einer Höhe von n ein. Der Flächeninhalt eines solchen Dreiecks beträgt bekanntlich 1. ♦ Ist (fn )n∈N eine Funktionenfolge von X nach Y , wobei X und Y zwei nichtleere Mengen sind, so kann man zu jeder fest gewählten Stelle x ∈ X eine Folge (fn (x))n∈N in Y , dem Wertebereich der Funktionenfolge, definieren. Die Glieder der Folge (fn (x))n∈N sind dabei durch die Funktionswerte der Glieder von (fn )n∈N an der Stelle x gegeben. Man beachte: (fn )n∈N bezeichnet eine Folge von Funktionen, (fn (x))n∈N bezeichnet eine Folge von Funktionswerten. Ist der Wertebereich einer Funktionenfolge ein normierter Raum, so gelangt man in natürlicher Weise zu einem Konvergenzbegriff, welcher als punktweise Konvergenz bezeichnet wird. Definition (punktweise Konvergenz, Grenzfunktion). Sei X eine nichtleere Menge, sei x ∈ X ein Element dieser Menge, und sei (W, k · k) ein normierter Raum über K. Eine Funktionenfolge (fn )n∈N von X nach W heißt konvergent an der Stelle x, wenn die Folge (fn (x))n∈N in W konvergent ist. Ist D ⊆ X eine nichtleere Menge, so heißt die Funktionenfolge punktweise konvergent auf D, falls sie an jeder Stelle x ∈ D konvergent ist. In diesem Fall definiert man die so genannte Grenzfunktion f : D → W von (fn )n∈N auf D durch f (x) := lim fn (x) n→∞ für alle x ∈ D. 88 KAPITEL 4. KONVERGENZBEGRIFFE UND KONVERGENZKRITERIEN (a) (b) Abbildung 4.2: (a) Graphen der ersten vier Glieder der Funktionenfolge (pn )n∈N von [0, 1] nach R, welche durch pn (x) := xn für alle x ∈ [0, 1] und alle n ∈ N definiert ist. (b) Graph der zugehörigen Grenzfunktion. Definition (divergente Funktionenfolge). Eine Funktionenfolge heißt an einer Stelle ihres Definitionsbereichs divergent, wenn sie an jener Stelle nicht punktweise konvergent ist. Ist M eine nichtleere Teilmenge des Definitionsbereichs, so heißt die Funktionenfolge divergent auf M , wenn sie an jeder Stelle x ∈ M divergent ist. Ist X eine nichtleere Menge, D ⊆ X eine nichtleere Teilmenge, und (W, k · k) ein normierter Raum, so konvergiert eine Funktionenfolge (fn )n∈N von X nach W offenbar genau dann punktweise gegen eine Grenzfunktion f : D → W , wenn für jede Stelle x ∈ D die folgende Aussage wahr ist: Zu jeder positiven Zahl ε > 0 existiert eine natürliche Zahl N ∈ N, so dass kfn (x) − f (x)k < ε für alle n ∈ N mit n ≥ N gilt. Die punktweise Konvergenz einer Funktionenfolge auf wird also über die Konvergenz der Funktionswerte ihrer Glieder auf der Menge D definiert. Als nächstes führen wir den Begriff des Konvergenzbereiches einer Funktionenfolge ein. Definition (Konvergenzbereich). Sei X eine nichtleere Menge, sei (W, k · k) ein normierter Raum über K, und sei (fn )n∈N eine Funktionenfolge von X nach W . Sei außerdem D ⊆ X eine nichtleere Menge, so dass (fn )n∈N auf punktweise konvergent auf D und divergent auf jeder Teilmenge von X \ D ist. Dann heißt D der Konvergenzbereich von (fn )n∈N . Der Konvergenzbereich einer Funktionenfolge ist also die größtmögliche Teilmenge des Definitionsbereichs, auf der die Funktionenfolge punktweise konvergent ist. Im folgenden geben wir einige Beispiele für Funktionenfolgen und deren Konvergenzbereiche an. Beispiele. √ (a) Die Funktionenfolge (fn )n∈N von R nach R, welche durch fn (x) := x2 − x/ n + 1/n für alle x ∈ R und alle n ∈ N definiert ist, konvergiert punktweise auf ganz R gegen die Grenzfunktion f : R → R, welche durch f (x) := x2 für alle x ∈ R definiert ist. Der Konvergenzbereich der Funktionenfolge ist also R. (b) Die Funktionenfolge (pn )n∈N von [0, ∞] nach R, welche durch pn (x) := xn für alle x ∈ R und alle n ∈ N definiert ist, konvergiert punktweise im Intervall [0, 1] gegen die Grenzfunktion p : [0, 1] → R, welche durch ( 0 falls x ∈ [0, 1), p(x) := 1 falls x = 1 4.4. PUNKTWEISE KONVERGENZ VON FUNKTIONENFOLGEN 89 für alle x ∈ [0, 1] definiert ist (siehe auch Abbildung 4.2). Für jede reelle Zahl x > 1 divergiert die Folge (pn (x))n∈N bestimmt gegen ∞. Das Intervall [0, 1] ist demnach Konvergenzbereich der Funktionenfolge (pn )n∈N . (c) Die Funktionenfolge (hn )n∈N von R nach R, welche durch ( 1 falls x ∈ [n − 1, n], hn (x) := 0 sonst für alle x ∈ R und alle n ∈ N definiert ist, konvergiert punktweise auf ganz R gegen die Nullfunktion auf R. Wählt man nämlich eine beliebige Stelle x ∈ R aus, so gilt offenbar hn (x) = 0 für alle n ≥ dxe + 1. Der Konvergenzbereich der Funktionenfolge (hn )n∈N ist also R, und die Grenzfunktion h : R → R ist durch h(x) = 0 für alle x ∈ R gegeben. ♦ Übungsaufgaben 1. Die Funktionenfolgen (sn )n∈N und (cn )n∈N von [0, 2π] nach R seien durch sn (x) := sin(nx) und cn (x) := cos(nx) für alle x ∈ [0, 2π] und alle n ∈ N definiert. Skizzieren Sie die Graphen der ersten drei Glieder beider Funktionenfolgen. 2. Die Funktionenfolge von R nach R der so genannten Legendre–Polynome (Pn )∞ n=0 ist rekursiv durch P0 (x) := 1, P1 (x) := x und nPn (x) := (2n − 1)xPn−1 (x) − (n − 1)Pn−2 (x) für alle x ∈ R und alle n ∈ N mit n ≥ 2 definiert. Geben Sie die Polynome P2 , P3 und P4 dieser Funktionenfolge an. 3. Bestimmen Sie den Konvergenzbereich der Funktionenfolgen (fn )n∈N , (gn )n∈N , (hn )n∈N und (rn )n∈N von R nach R, und geben Sie die jeweilige Grenzfunktion an. Die Funktionenfolgen sind durch fn : R → R, x 7→ nx/(n + 1), p gn : R → R, x 7→ n |x|, hn : R → R, x 7→ (2x)n + 1, ( n/2 falls x ∈ [−1/n, 1/n], rn : R → R, x 7→ 0 sonst für alle n ∈ N definiert. 4. Die Funktionenfolge (fn )∞ n=0 von R nach R ist rekursiv durch f0 (x) := 1 und fn (x) := fn−1 (x) + xn für alle x ∈ R und alle n ∈ N definiert. Geben Sie den Konvergenzbereich und die Grenzfunktion dieser Funktionenfolge an. 90 4.5 KAPITEL 4. KONVERGENZBEGRIFFE UND KONVERGENZKRITERIEN Gleichmäßige Konvergenz von Funktionenfolgen Im voran gegangenen Abschnitt haben wir die punktweise Konvergenz bei Funktionenfolgen kennen gelernt. Neben diesem Konvergenzbegriff gibt es bei Funktionenfolgen noch den Begriff der gleichmäßigen Konvergenz, den wir im folgenden einführen. Definition (gleichmäßige Konvergenz). Seien X und D ⊆ X zwei nichtleere Mengen, und sei (W, k · k) ein normierter Raum über K. Eine Funktionenfolge (fn )n∈N von X nach W heißt gleichmäßig konvergent auf D, wenn eine Funktion f : D → W existiert, so dass folgendes gilt: Für jede positive Zahl ε > 0 existiert eine natürliche Zahl N ∈ N, so dass kfn (x) − f (x)k < ε für alle n ∈ N mit n ≥ N und für alle x ∈ D gilt. Das nachfolgende Lemma besagt, dass die gleichmäßige Konvergenz stets auch die punktweise Konvergenz einer Funktionenfolge impliziert. Gleichmäßige Konvergenz ist also eine stärkere“ Eigenschaft als punktweise Konvergenz. ” Lemma 4.19. Jede Funktionenfolge, die auf einer bestimmten Menge gleichmäßig konvergent ist, ist auf derselben Menge auch punktweise konvergent. Betrachtet man noch einmal die Definitionen für punktweise und gleichmäßige Konvergenz, so stellt man fest, dass eine Funktionenfolge (fn )n∈N genau dann punktweise bzw. gleichmäßig auf einer Menge D gegen eine Grenzfunktion f konvergiert, wenn man für jede Stelle x ∈ D und für jede positive Zahl ε > 0 eine natürliche Zahl N ∈ N wählen kann, so dass kfn (x) − f (x)k < ε für alle n ∈ N mit n ≥ N gilt. Der wesentliche Unterschied besteht nun darin, dass man bei gleichmäßiger Konvergenz die Zahl N unabhängig von der Stelle x wählen kann. Die Zahl N ist bei gleichmäßiger Konvergenz also eine Funktion von ε. Bei punktweiser Konvergenz ist die Zahl N hingegen eine Funktion von ε und x. Will man gleichmäßige Konvergenz nachweisen, so ist die folgende Beobachtung hilfreich: Eine Funktionenfolge (fn )n∈N konvergiert gleichmäßig auf einer Menge D gegen eine Grenzfunktion f , wenn der Abstand kfn (x) − f (x)k durch einen Ausdruck nach oben abgeschätzt werden kann, der von n, nicht aber von x abhängt, und für n → ∞ gegen Null konvergiert. Man betrachte dazu auch die nachfolgenden Beispiele. Beispiele. (a) Die Funktionenfolge (fn )n∈N von R nach R, die durch fn (x) := x + sin(nx)/n für alle x ∈ R und alle n ∈ N definiert ist, konvergiert gleichmäßig auf ganz R gegen die Grenzfunktion f : R → R, welche durch f (x) := x für alle x ∈ R definiert ist. Es gilt nämlich |sin(nx)| 1 |fn (x) − f (x)| = ≤ n n für alle x ∈ R und alle n ∈ N. Es ist also möglich, zu jeder positive Zahl ε > 0 einen Index N ∈ N zu wählen, so dass |fn (x) − f (x)| < 1/n < ε für alle n ∈ N mit n ≥ N und alle x ∈ R gilt. 4.5. GLEICHMÄSSIGE KONVERGENZ VON FUNKTIONENFOLGEN 91 (b) Die Funktionenfolge (gn )n∈N von R nach R, die durch gn (x) := x/n für alle x ∈ R und alle n ∈ N definiert ist, konvergiert auf jeder nichtleeren, beschränkten Menge M ⊂ R gleichmäßig gegen die Nullfunktion g : M → R auf M , welche durch g(x) := 0 für alle x ∈ M definiert ist. Es gilt nämlich |gn (x) − g(x)| = |x| 1 ≤ sup {|x| | x ∈ M } n n für alle x ∈ M und alle n ∈ N. Man beachte hierbei, dass sup {|x| | x ∈ M } eine reelle Zahl ist, die nicht von der Stelle x abhängt. Im Rest dieses Abschnitts wollen wir einen weiteren Zugang zur gleichmäßigen Konvergenz von Funktionenfolgen vorstellen. Dazu nehmen wir im folgenden an, dass D eine nichtleere Menge und (W, k · k) ein normierter Raum über K ist. Die Menge aller beschränkten Folgen von D nach W wird dann bekanntlich mit B(D, W ) bezeichnet. Man zeigt leicht, dass die Menge B(D, W ) ein Vektorraum über K ist. Die Menge B(D, W ) wird darüber hinaus zu einem normierten Raum über K, wenn man sie mit der so genannten Supremumsnorm k · k∞,D : B(D, W ) → R versieht. Die Supremumsnorm ist dabei durch kf k∞,D := sup kf (x)k x∈D für alle f ∈ B(D, W ) definiert. Im normierten Raum (B(D, W ), k · k∞,D ) ist dann die Konvergenz von Folgen in gewohnter Weise definiert: Eine Folge (fn )n∈N in B(D, W ) konvergiert genau dann gegen einen Grenzwert f ∈ B(D, W ), wenn für jede positive Zahl ε > 0 eine natürliche Zahl N ∈ N existiert, so dass kfn − f k∞,D < ε für alle n ∈ N mit n ≥ N gilt. Man beachte hierbei, dass die Folge (fn )n∈N eine Funktionenfolge von D nach W ist. Daher stellt sich die Frage, inwieweit die Konvergenz im normierten Raum (B(D, W ), k · k∞,D ) mit der punktweisen oder der gleichmäßigen Konvergenz auf der Menge D zusammenhängen. Das nachfolgende Lemma gibt hierauf eine abschließende Antwort. Lemma 4.20. Sei D eine nichtleere Menge und (W, k · k) ein normierter Raum über K. Eine Folge beschränkter Funktionen (fn )n∈N von D nach W konvergiert genau dann gleichmäßig auf D gegen eine Grenzfunktion f : D → W , wenn sie bezüglich der Supremumsnorm gegen f konvergiert, d.h. wenn für jede positive Zahl ε > 0 eine natürliche Zahl N ∈ N existiert, so dass kfn − f k∞,D < ε für alle n ∈ N mit n ≥ N gilt. Betrachtet man die Aussage von Lemma 4.20 sowie die voran gegangenen Überlegungen, so erkennt man, dass gleichmäßige Konvergenz verglichen mit punktweiser Konvergenz der natürlichere“ Konvergenzbegriff für Funktionenfolgen ist. Die gleichmäßige Konver” genz entspricht nämlich genau dem üblichen Konvergenzbegriff, den man für Folgen im normierten Raum (B(D, W ), k · k∞,D ) hat. 92 KAPITEL 4. KONVERGENZBEGRIFFE UND KONVERGENZKRITERIEN Übungsaufgaben 1. Bestimmen Sie für die Funktionenfolgen (fn )n∈N , (gn )n∈N , (hn )n∈N und (pn )n∈N von [0, 1] nach R die jeweilige Grenzfunktion. Zeigen Sie außerdem, dass die Funktionenfolgen gleichmäßig auf [0, 1] gegen ihre Grenzfunktionen konvergieren. Die Funktionenfolgen sind durch fn : [0, 1] → R, x 7→ x , x+n r 1 , n n sin(πx) + cos(nπx) hn : [0, 1] → R, x 7→ , n nx2 pn : [0, 1] → R, x 7→ nx + 1 gn : [0, 1] → R, x 7→ x+ für alle n ∈ N definiert. 2. Sei D eine nichtleere Menge, und sei (W, k · k) ein normierter Raum über K. Zeigen Sie dass die Menge B(D, W ) aller beschränkten Funktionen von D nach W ein Vektorraum über K ist. 3. Sei D eine nichtleere Menge, sei (W, k · k) ein normierter Raum über K, und sei B(D, W ) die Menge aller beschränkten Funktionen von D nach W . Zeigen Sie, dass die Supremumsnorm eine Norm auf B(D, W ) ist. 4.6. KONVERGENZ VON POTENZREIHEN 4.6 93 Konvergenz von Potenzreihen Definition (Potenzreihe). Sei (an )∞ n=0 eine Folge in K. Dann heißt die Funktionenfolge (fN )∞ von K nach K, deren Glieder gemäß N =0 fN (v) := N X an (x − x0 )n = a0 + a1 (x − x0 ) + a2 (x − x0 )2 + · · · + aN (x − x0 )N n=0 für alle x ∈ V und alle N ∈ N definiert sind, die zur Folge (an )∞ n=0 gehörende Potenzreihe auf K mit der Entwicklungsstelle x0 . Die Glieder der Folge (an )∞ n=0 werden die Koeffizienten der Potenzreihe genannt. Für jeden Index N ∈ N bezeichnet man die Funktion fN als das N -te Partialpolynom der Potenzreihe. Die Potenzreihe selbst wird oft durch die Schreibweise ∞ X an (x − x0 )n n=0 dargestellt, wobei man vereinbart, dass x die Variable der Potenzreihe sei. Es ist auch üblich, eine Potenzreihe durch Angabe der ersten Terme als a0 +a1 (x−x0 )+a2 (x−x0 )2 +· · · darzustellen. Wie der Begriff Partialpolynom bereits andeutet, ist jedes Glied fN einer Potenzreihe (fN )∞ N =0 ein Polynom vom Grad N . Dies erkennt man besonders gut, wenn die Entwicklungsstelle der Potenzreihe der Nullvektor ist. Die Potenzreihe ist dann nämlich von der Form ∞ X an xn , n=0 wobei x die Variable der Potenzreihe bezeichnet. Für jede Zahl N ∈ N0 ist das N -te Partialpolynom der Potenzreihe dann durch N X an xn = a0 + a1 x + a2 x2 + · · · + aN xN n=0 gegeben. Es sollte noch erwähnt werden, dass der Begriff Partialpolynom in der mathematischen Fachliteratur keineswegs üblich ist. Wir verwenden ihn dennoch, da er deutlich macht, dass eine Potenzreihe im wesentlichen eine Folge von Polynomen ist. Wie bei allen Funktionenfolgen stellt sich auch bei Potenzreihen die Frage nach Konvergenzbereichen. Der nachfolgende Satz macht dazu eine erste Aussage. Satz 4.21. Sei P∞ n=0 an (x − x0 )n eine Potenzreihe auf K mit der Variable x, so dass lim n→∞ p n |an | = 0 gilt. Dann konvergiert die Potenzreihe punktweise auf ganz K. Das nachfolgende Beispiel verdeutlicht die Anwendung von Satz 4.21. Darüber hinaus liefert es eine wichtige Darstellung der Exponentialfunktion x 7→ ex . 94 KAPITEL 4. KONVERGENZBEGRIFFE UND KONVERGENZKRITERIEN Beispiel (Die Exponentialfunktion). Wir betrachten die Potenzreihe ∞ X xn n=0 n! =1+x+ x2 x3 + + ··· 2! 3! auf R mit der Variable x. Die Entwicklungsstelle dieser Potenzreihe ist die Zahl Null, und die Folge der Koeffizienten lautet (1/n!)∞ n=0 . Unser Ziel ist es zu zeigen, dass die Potenzreihe auf ganz R punktweise konvergiert. Dazu untersuchen wir zunächst die Zahlenfolge (cn )n∈N , welche durch cn := nn /(n!en ) für alle n ∈ N definiert ist. Man rechnet leicht nach, dass cn+1 1 1 n 1 1 n e = 1+ ≤ lim 1 + = =1 cn e n e n→∞ n e für alle n ∈ N gilt. Die Folge (cn )n∈N ist also monoton fallend. Daher gilt insbesondere c1 ≥ cn für alle n ∈ N. Da außerdem 1 ≥ c1 gilt, erhält man 1 ≥ cn für alle n ∈ N. Durch Umformung der letzten Ungleichung erhält man die Abschätzung n n n! ≥ e √ für alle n ∈ N. Entsprechend gilt n n! ≥ n/e für alle n ∈ N, woraus folgt, dass die Folge √ ( n n!)n∈N gegen ∞ bestimmt divergiert. Man erhält daher s 1 1 lim n = lim √ = 0. n n→∞ n→∞ n! n! Nach Satz 4.21 konvergiert die Potenzreihe also punktweise auf ganz R. Die Grenzfunktion ist dabei die Exponentialfunktion exp : R → R, welche durch exp(x) := ex für alle x ∈ R definiert ist. ♦ Im Allgemeinen ist der Konvergenzbereich einer Potenzreihe auf K eine echte Teilmenge von K. Man überlegt sich leicht, dass jede Potenzreihe an ihrer Entwicklungsstelle gegen Null konvergiert. Daher ist die Entwicklungsstelle immer ein Element des Konvergenzbereichs. Mit Hilfe des nachfolgenden Satzes lässt sich darüber hinaus eine Teilmenge des Konvergenzbereichs angeben. P n Satz 4.22. Sei ∞ n=0 an (x − x0 ) eine Potenzreihe auf K mit der Variable x. Sei außerdem s > 0 eine positive Zahl mit der Eigenschaft, dass eine natürliche Zahl N ∈ N existiert, so dass p n |an | ≤ s für alle n ∈ N mit n ≥ N gilt. Dann konvergiert die Potenzreihe punktweise auf der offenen Kugel Br (x0 ) in K, wobei r := 1/s gilt. Die Anwendung von Satz 4.22 wird im nachfolgenden Beispiel verdeutlicht. Beispiel. Wir betrachten die Potenzreihe ∞ X n + (−1)n n=0 n+2 (x − 2)n 4.6. KONVERGENZ VON POTENZREIHEN 95 in R mit der Variable x und der Entwicklungsstelle 2. Offenbar gilt s r n √ n n n + 1 n n + (−1) ≤ 1≤1 n+2 ≤ n+2 für alle n ∈ N. Nach Satz 4.22 konvergiert die Potenzreihe also punktweise auf dem Intervall (1, 3) = B1 (2). ♦ Satz 4.22 legt nahe, dass der Konvergenzbereich einer Potenzreihe stets die Obermenge einer offenen Kugel ist. Der Mittelpunkt der Kugel ist dabei durch die Entwicklungsstelle der Potenzreihe gegeben. Der Radius der Kugel hängt von der Rate ab, mit der die Absolutbeträge der Koeffizienten der Potenzreihe gegen Null konvergieren. Man kann zeigen, dass für jede Potenzreihe auf K, die nicht auf ganz K konvergiert, eine größte offene Kugel existiert, auf der die Potenzreihe punktweise konvergiert. Der Radius dieser Kugel wird der Konvergenzradius der Potenzreihe genannt. P n Definition (Konvergenzradius). Sei ∞ n=0 an (x − x0 ) eine Potenzreihe auf K mit der Variable x. Eine positive Zahl R > 0 wird der Konvergenzradius der Potenzreihe genannt, wenn die Potenzreihe auf der offenen Kugel BR (x0 ) in K punktweise konvergiert, und auf jeder Teilmenge von K \ BR (x0 ) divergiert. Falls die Potenzreihe auf ganz K punktweise konvergiert, sagt man, dass ihr Konvergenzradius ∞ sei. Wie der nachfolgende Satz zeigt, kann der Konvergenzradius bestimmter Potenzreihen auf K, die nicht auf ganz K punktweise konvergieren, explizit berechnet werden. Satz 4.23. Sei P∞ n=0 an (x − x0 )n eine Potenzreihe auf K mit der Variable x, so dass p S := lim n |an | > 0 n→∞ gilt. Dann ist R := 1/S der Konvergenzradius der Potenzreihe. Die Anwendung des Satzes 4.23 wird im nachfolgenden Beispiel demonstriert. Beispiel. Betrachtet man die Koeffizienten der Potenzreihe ∞ X n3n (x − 1)n n=0 in R mit der Variable x und der Entwicklungsstelle 1, so stellt man fest, dass p √ lim n |n3n | = lim 3 n n = 3 n→∞ n→∞ gilt. Nach Satz 4.23 konvergiert die Potenzreihe also punktweise auf dem offenen Intervall (2/3, 4/3) = B1/3 (1) und divergiert außerhalb des abgeschlossenen Intervalls [2/3, 4/3]. ♦ Mit Hilfe von Potenzreihen werden eine Reihe wichtiger Funktionen in der Mathematik definiert. Wir haben bereits gesehen, dass die Exponentialfunktion exp : R → R, x 7→ ex als Grenzfunktion der Potenzreihe ∞ X xn n=0 n! definiert werden kann. Nachfolgend geben wir weitere wichtige Beispiele für Potenzreihen an, deren Grenzfunktionen explizit bekannt sind. 96 KAPITEL 4. KONVERGENZBEGRIFFE UND KONVERGENZKRITERIEN (b) (a) Abbildung 4.3: (a) Die Graphen der Funktionen Sinus Hyperbolicus und Cosinus Hyperbolicus. (b) der Funktion Logarithmus Naturalis. Der Konvergenzbereich PGraph ∞ der Potenzreihe n=1 (−1)n+1 (x − 1)n /n ist grau dargestellt. Beispiele. (a) Die Sinusfunktion sin : R → R ist die Grenzfunktion der Potenzreihe ∞ X (−1)n x3 x5 x7 x2n+1 = x − + − ± ··· (2n + 1)! 3! 5! 7! n=0 auf R mit der Variable x. Anhand der Potenzreihe erkennt man insbesondere, dass sin(0) = 0 gilt. (b) Die Cosinusfunktion cos : R → R ist die Grenzfunktion der Potenzreihe ∞ X (−1)n n=0 (2n)! x2n = 1 − x2 x4 x6 + − ± ··· 2! 4! 6! auf R mit der Variable x. Anhand der Potenzreihe erkennt man insbesondere, dass cos(0) = 1 gilt. (c) Die so genannte hyperbolische Sinusfunktion sinh : R → R, welche auch Sinus Hyperbolicus genannt wird, ist durch ex − e−x 2 für alle x ∈ R definiert (siehe auch Abbildung 4.3(a)). Man kann zeigen, dass der Sinus Hyperbolicus die Grenzfunktion der Potenzreihe sinh(x) := ∞ X x2n+1 x3 x5 x7 =x+ + + + ··· (2n + 1)! 3! 5! 7! n=0 auf R mit der Variable x ist. (d) Die so genannte hyperbolische Cosinusfunktion cosh : R → R, welche auch Cosinus Hyperbolicus genannt wird, ist durch ex + e−x 2 für alle x ∈ R definiert (siehe auch Abbildung 4.3(a)). Der Cosinus Hyperbolicus ist die Grenzfunktion der Potenzreihe ∞ X x2n x2 x4 x6 =1+ + + + ··· (2n)! 2! 4! 6! cosh(x) := n=0 auf R mit der Variable x. 4.6. KONVERGENZ VON POTENZREIHEN 97 (e) Die Potenzreihe n X (−1)n+1 n n=1 1 1 1 (x − 1)n = (x − 1) − (x − 1)2 + (x − 1)3 − (x − 1)4 ± · · · 2 3 4 mit der Variable x konvergiert punktweise auf dem Intervall (0, 2] gegen den Logarithmus Naturalis, also gegen die Funktion f : (0, 2] → R, welche duch f (x) := ln(x) für alle x ∈ (0, 2] definiert ist (siehe auch Abbildung 4.3(b)). ♦ Mit Hilfe der Potenzreihendarstellungen der Sinusfunktion, der Cosinusfunktion und der Exponentialfunktion kann man sehr leicht die Eulersche Formel eix = cos(x) + i sin(x) für alle x ∈ R nachweisen. Es gilt nämlich eix = = ∞ X (ix)n n=0 ∞ X k=0 = n! (ix)2k+1 (ix)2k + (2k)! (2k + 1)! ∞ X (ix)2k+1 + (2k)! (2k + 1)! ∞ X (ix)2k k=0 k=0 ∞ ∞ X (i2 )k 2k X i(i2 )k 2k+1 x + x = (2k)! (2k + 1)! k=0 = ∞ X (−1)k k=0 (2k)! k=0 ∞ X x2k + i k=0 (−1)k 2k+1 x (2k + 1)! = cos(x) + i sin(x). Desweiteren kann man die die Potenzreihendarstellungen verwenden, um beispielsweise die Exponentialfunktion auf normierten Algebren zu definieren. Übungsaufgaben 1. Bestimmen Sie die Konvergenzradien der folgenden Potenzreihen auf R. ! n n2 ∞ ∞ ∞ ∞ ∞ n X X X X X X 1 n2 n 1 1 n n n n 2 x , 1+ x , x , x , xn . 1− n n! n k n=1 n=1 n=0 n=1 n=0 k=1 Hierbei bezeichnet x jeweils die Variable der Potenzreihe. 2. Bestimmen Sie für jede der nachfolgend angegebenen Potenzreihen auf R eine möglichst große Zahl r > 0, so dass die jeweilige Potenzreihe auf dem Intervall (−r, r) punktweise konvergiert. ∞ X n=0 2n cos(n)xn , ∞ X n=0 4n + (−1)n xn , ∞ X x2n , n=0 ∞ X sin(n) cos(n)xn . n=0 Hierbei bezeichnet x jeweils die Variable der Potenzreihe. 3. Weisen Sie mit Hilfe der Potenzreihendarstellungen der hyperbolischen Sinusfunktion, der hyperbolischen Cosinusfunktion und der Exponentialfunktion die Formel ex = cosh(x) + sinh(x) nach. Die Formel folgt übrigens direkt aus der Definition von sinh und cosh. Lernzielkontrolle Nach dem Durcharbeiten dieses Kapitels sollten Sie ... ... die folgenden Kriterien für die Konvergenz einer reellen Zahlenfolgen kennen: Das Cauchy–Kriterium, das Sandwichtheorem und das Monotoniekriterium. ... wissen, was eine Reihe ist. ... wissen, was man unter einer konvergenten und unter einer absolut konvergenten Reihe versteht. ... den Grenzwert der geometrischen Reihe zu einer komplexen Zahl q ∈ C mit |q| < 1 berechnen können. ... das Leibniz–Kriterium für die Konvergenz und das Minorantenkriterium für die Divergenz einer Reihe kennen. ... wissen, dass die harmonische Reihe divergent ist. ... sie folgenden Kriterien für die absolute Konvergenz einer Reihe kennen und anwenden können: Das Majorantenkriterium, das Wurzelkriterium und das Quotientenkriterium. ... wissen, was eine Funktionenfolge ist. ... wissen, was man unter einer punktweise konvergenten und unter einer gleichmäßig konvergenten Funktionenfolge versteht. ... wissen, was der Konvergenzbereich einer Funktionenfolge ist. ... wissen, was eine Potenzreihe ist. ... wissen, was man unter dem Konvergenzradius einer Potenzreihe versteht. ... den Konvergenzradius einer Potenzreihe bestimmen können, falls dies möglich ist. ... die Potenzreihen der Exponentialfunktion, der Sinusfunktion und der Cosinusfunktion kennen. 98 Kapitel 5 Stetige Funktionen 5.1 Grenzwerte von Funktionen In diesem Abschnitt soll der Grenzwertbegriff auf Funktionen erweitert werden. Im Unterschied zu den Gliedern einer Folge sind die Funktionswerte einer Funktion im Allgemeinen nicht durch Indizes in aufsteigender Folge angeordnet. Daher muss man einen anderen Zugang wählen, um den Grenzwert einer Funktion zu definieren. Definition (Grenzwert einer Funktion). Seien (V, k · kV ) und (W, k · kW ) zwei normierte Räume über K, sei D ⊆ V eine nichtleere Menge, sei v0 ∈ D ein Punkt des Abschlusses dieser Menge, und sei f : D → W eine Funktion. Ein Vektor w0 ∈ W wird der Grenzwert von f in v0 genannt, wenn für jede positive Zahl ε > 0 eine positive Zahl δ > 0 existiert, so dass kf (v) − w0 kW < ε für alle v ∈ (Bδ (v0 ) ∩ D) \ {v0 } gilt. Man schreibt dann lim f (v) = w0 v→v0 oder auch f (v) → w0 (v → v0 ). Anschaulich gesprochen ist ein Element w0 ∈ W genau dann Grenzwert einer Funktion f : D → W im Punkt v0 ∈ D, wenn folgendes gilt: Wenn sich ein Punkt v ∈ D dem Punkt v0 immer weiter annähert, ohne dabei die Definitionsmenge D zu verlassen, dann nähern sich die zugehörigen Funktionswerte f (v) dem Wert w0 immer weiter an. Zu beachten ist, dass der Grenzwert w0 selbst kein Funktionswert von f sein muss. Die Funktion f muss an der Stelle v0 nicht einmal definiert sein. Man betrachte dazu die nachfolgenden Beispiele. Beispiele. (a) Wir betrachten die Funktion f : [0, 1) → R, welche durch f (x) = (x2 − 1)/(x − 1) für alle x ∈ (0, 1) definiert ist. Es gilt lim f (x) = 2. x→1 Für alle x ∈ [0, 1) gilt nämlich 2 f (x) − 2 = x − 1 − 2 = (x + 1)(x − 1) − 2 = |(x + 1) − 2| = |x − 1|. x−1 x−1 Ist ε > 0 vorgegeben, so wählt man δ = ε. Für alle x ∈ (Bδ (1)∩[0, 1))\{1} ⊆ (1−δ, 1) gilt dann |x − 1| < δ und somit |f (x) − 2| < ε. Man beachte, dass die Funktion f an der Stelle x = 1 nicht definiert ist, da dort x − 1 = 0 gilt. 99 100 KAPITEL 5. STETIGE FUNKTIONEN Abbildung 5.1: Eine Funktion f : D → W besitzt in v0 ∈ D den Grenzwert w0 , wenn für alle ε > 0 ein δ > 0 existiert, so dass das Bild von (Bδ (v0 ) ∩ D) \ {v0 } unter f eine Teilmenge von Bε (w0 ) ist. (b) Die Funktion g : R → R sei durch ( x2 g(x) = 1 falls x 6= 0, falls x = 0 für alle x ∈ R definiert. Es gilt lim g(x) = 0. x→0 √ Ist nämlich eine positive Zahl ε > 0 vorgegeben, so kann man beispielsweise δ = ε wählen. Für alle x ∈ (Bδ (0) ∩ R) \ {0} = (−δ, 0) ∪ (0, δ) gilt dann die Abschätzung |g(x) − 0| = |x2 | < δ 2 = ε. Man beachte, dass der Grenzwert der Funktion g in x = 0 nicht mit dem Funktionswert von g an der Stelle x = 0 übereinstimmt. Der Grenzwert ist nämlich 0, wie wir gezeigt haben, und der Funktionswert ist 1. Lässt sich der Grenzwertbegriff für Funktionen auf den Grenzwertbegriff für Folgen zurückführen? In gewisser Weise ja. Man betrachte dazu das nachfolgende Lemma. Lemma 5.1. Seien (V, k · kV ) und (W, k · kW ) zwei normierte Räume über K, sei D ⊆ V eine nichtleere Menge, sei v0 ∈ D ein Punkt des Abschlusses von D, und sei f : D → W eine Funktion. Ein Vektor w0 ∈ W ist genau dann Grenzwert von f in v0 , wenn für jede gegen v0 konvergente Folge (vn )n∈N in D \ {v0 } die Folge der Funktionswerte (f (vn ))n∈N gegen w0 konvergiert. Mit Hilfe von Lemma 5.1, sowie den Sätzen 2.4 und 2.5 kann man leicht zeigen, dass die folgenden Rechenregeln für Funktionsgrenzwerte gelten. Satz 5.2. Seien (V, k · kV ) und (W, k · kW ) zwei normierte Räume über K, sei D ⊆ V eine nichtleere Menge und sei v0 ∈ D ein Punkt des Abschlusses von D. Seien außerdem f : D → W , g : D → W und α : D → W Funktionen, welche einen Grenzwert in v0 besitzen. Dann gilt (1) lim f (v) + g(v) = lim f (v) + lim g(v). v→v0 (2) lim α(v)f (v) = v→v0 v→v0 v→v0 lim α(v) lim f (v) . v→v0 v→v0 Ist (W, k · kW ) eine normierte Algebra über K, so gilt außerdem (3) lim f (v)g(v) = lim f (v) lim g(v) . v→v0 v→v0 v→v0 5.1. GRENZWERTE VON FUNKTIONEN 101 (b) (a) Abbildung 5.2: (a) Graph der Funktion f : R → R \ {0}, x 7→ sin(x)/x. (b) Graph der Heaviside–Funktion. Satz 5.3. Sei (V, k · k) ein normierter Raum über K, sei D eine nichtleere Menge und sei v0 ∈ D ein Punkt des Abschlusses von D. Sei ferner f : V → K \ {0} eine Funktion, welche einen Grenzwert in v0 besitzt, der von Null verschieden ist. Dann gilt lim v→v0 1 1 = . f (v) lim f (v) v→v0 Für die Bestimmung von Funktionsgrenzwerten ist es oft hilfreich, die Potenzreihendarstellungen bestimmter Funktionen zu kennen. Dies ist insbesondere dann der Fall, wenn eine Funktion in Abhängigkeit der Sinus-, Cosinus- oder Exponentialfunktion definiert ist. Man betrachte hierzu die nachfolgenden Beispiele. Beispiele. (a) Wir betrachten die Funktion f : R \ {0} → R, welche durch f (x) = sin(x)/x für alle x ∈ R \ {0} definiert ist (siehe auch Abbildung 5.2(a)). Mit der Potenzreihendarstellung der Sinusfunktion ergibt sich x3 x5 x7 x2 x4 x6 1 x− + − ± ··· = 1 − + − ± ··· f (x) = x 3! 5! 7! 3! 5! 7! Anhand dieser Darstellung von f als Potenzreihe erkennt man, dass lim f (x) = 1 x→0 gilt. Setzt man nämlich in der Potenzreihendarstellung für x die Zahl 0 ein, so verschwinden alle Potenzen von x, und es bleibt lediglich die Zahl 1 stehen. (b) Gegeben sei die Funktion g : R\{1} → R, definiert durch g(x) = (x−1)/ ln(x) für alle x ∈ R \ {1}. Mit der Potenzreihendarstellung der natürlichen Logarithmusfunktion erhält man 1 1 (x − 1)2 (x − 1)3 x − 1 (x − 1)2 = (x − 1) − + ∓ ··· = 1 − + ∓ ··· g(x) x−1 2 3 2 3 Demnach gilt lim g(x) = x→1 1 lim x→1 g(x) −1 = 1. In der Potenzreihendarstellung der Funktion 1/g verschwinden nämlich die Potenzen von (x − 1), wenn man für x die Zahl 1 einsetzt. ♦ 102 KAPITEL 5. STETIGE FUNKTIONEN Für Funktionen, die auf Teilmengen der reellen Zahlen definiert sind, betrachtet man gelegentlich so genannte einseitige Grenzwerte. Je nachdem, ob man sich von links“ oder ” von rechts“ dem Punkt annähert, an dem der Grenzwert bestimmt werden soll, spricht ” man von linksseitigen bzw. rechtsseitigen Grenzwerten. Definition (linksseitiger Grenzwert). Sei (W, k · k) ein normierter Raum, sei D ⊂ R eine nichtleere Menge, sei x0 ∈ D ein Punkt des Abschlusses von D, und sei f : D → W eine Funktion. Ein Vektor w0 ∈ W heißt linksseitiger Grenzwert von f in x0 , wenn für jede positive Zahl ε > 0 eine positive Zahl δ > 0 existiert, so dass kf (x) − w0 k < ε für alle x ∈ (x0 − δ, x0 ) ∩ D gilt. Man schreibt dann lim f (x) = w0 x→x0 − oder auch f (x) → w0 (x → x0 −). Definition (rechtsseitiger Grenzwert). Sei (W, k · k) ein normierter Raum, sei D ⊂ R eine nichtleere Menge, sei x0 ∈ D ein Punkt des Abschlusses von D, und sei f : D → W eine Funktion. Ein Vektor w0 ∈ W heißt rechtsseitiger Grenzwert von f in x0 , wenn für jede positive Zahl ε > 0 eine positive Zahl δ > 0 existiert, so dass kf (x) − w0 k < ε für alle x ∈ (x0 , x0 + δ) ∩ D gilt. Man schreibt dann lim f (x) = w0 x→x0 + oder auch f (x) → w0 (x → x0 +). Der linksseitige und der rechtsseitige Grenzwert einer Funktion f an einem gegebenen Punkt x ∈ R können verschieden sein. Es kann auch vorkommen, dass einer der beiden einseitigen Grenzwerte existiert, während der andere Grenzwert nicht existiert. Man betrachte dazu die nachfolgenden Beispiele. Beispiele. (a) Wir betrachten die Funktion f : R \ {0} → R, welche durch f (x) := xsgn(x) für alle x ∈ R\{0} definiert ist. Gesucht sind die einseitigen Grenzwerte von f in 0. Offenbar gilt f (x) = x−1 = 1/x = −1/|x| für alle x < 0. Daher erhält man lim f (x) = −∞. x→0− Der linksseitige Grenzwert von f in 0 existiert also nicht. Für x > 0 erhält man hingegen f (x) = x1 = x = |x|. Daher gilt lim f (x) = 0. x→0+ (b) Die so genannte Heaviside–Funktion H : R → R ist durch ( 0 falls x < 0, H(x) := 1 falls x ≥ 0 5.1. GRENZWERTE VON FUNKTIONEN 103 für alle x ∈ R definiert (siehe auch Abbildung 5.2(b)). Man erkennt leicht, dass lim H(x) = 0, x→0− sowie lim H(x) = 1 x→0+ gilt. Die Heaviside–Funktion besitzt also an der Stelle 0 unterschiedliche links- und rechtsseitige Grenzwerte. ♦ Existiert für eine Funktion f , die auf einer Teilmenge von R definiert ist, der Grenzwert an einer Stelle x0 , so existieren auch der linksseitige und der rechtsseitige Grenzwert von f in x0 , und es gilt lim f (x) = lim f (x) = lim f (x). x→x0 x→x0 − x→x0 + Existiert einer der beiden einseitigen Grenzwerte nicht, oder gilt lim f (x) 6= lim f (x), x→x0 + x→x0 − dann existiert kein Grenzwert von f in x0 . Bei Funktionen, die auf unbeschränkten Teilmengen von R definiert sind, interessiert man sich gelegentlich für das Verhalten sehr weit links bzw. sehr weit rechts vom Ursprung. Man untersucht dann das Konvergenzverhalten solcher Funktionen, wenn deren Argument gegen −∞ bzw. gegen ∞ strebt. Definition (Grenzwert gegen −∞). Sei (W, k · k) ein normierter Raum, sei D ⊂ R eine Menge, die nicht nach unten beschränkt ist, und sei f : D → W eine Funktion. Ein Vektor w0 ∈ W wird der Grenzwert von f gegen −∞ genannt, wenn für jede positive Zahl ε > 0 eine reelle Zahl R ∈ R existiert, so dass kf (x) − w0 k < ε für alle x ∈ (−∞, R] ∩ D gilt. Man schreibt dann lim f (x) = w0 x→−∞ oder auch f (x) → w0 (x → −∞). Definition (Grenzwert gegen ∞). Sei (W, k · k) ein normierter Raum, sei D ⊂ R eine Menge, die nicht nach oben beschränkt ist, und sei f : D → W eine Funktion. Ein Vektor w0 ∈ W wird der Grenzwert von f gegen ∞ genannt, wenn für jede positive Zahl ε > 0 eine reelle Zahl R ∈ R existiert, so dass kf (x) − w0 k < ε für alle x ∈ [R, ∞) ∩ D gilt. Man schreibt dann lim f (x) = w0 x→∞ oder auch f (x) → w0 (x → ∞). Man betrachte die nachfolgenden Beispiele. 104 KAPITEL 5. STETIGE FUNKTIONEN Beispiele. (a) Wir betrachten die Funktion f : R → R, welche durch f (x) := (3x2 + 2x + 1)/(4x2 + x + 2) für alle x ∈ R definiert ist. Es gilt dann 3+ 3x2 + 2x + 1 lim f (x) = lim = lim x→∞ x→∞ 4x2 + x + 2 x→∞ 4 + 2 x 1 x + + 1 x2 2 x2 3 = . 4 (b) Sei p : R → R irgendein Polynom. Dann gilt p(x) = 0. x→∞ ex lim Die Exponentialfunktion wächst also stärker als jedes Polynom, wenn ihr Argument gegen ∞. Außerdem gilt lim p(x)ex = 0. x→−∞ Die Exponentialfunktion dominiert also auch hier das Konvergenzverhalten. ♦ Ist D eine Teilmenge von R, welche nicht nach oben beschränkt ist, ist f : D → R eine reellwertige Funktion, und ist y0 ∈ R eine reelle Zahl, dann ist die Aussage lim f (x) = y0 x→∞ gleichbedeutend damit, dass die Gerade {(x, y)T ∈ R2 | y = y0 } waagrechte Asymptote für den Funktionsgraphen von f ist, wenn x gegen ∞ strebt. Übungsaufgaben 1. Bestimmen Sie die folgenden Grenzwerte: 1 − x2 1 x3 + 6x2 + 11x + 6 lim , lim x sin , lim , x→−1 3x + 3 x→0 x→−2 x x2 + x − 2 √ lim x→0 2x + 1 − x √ x+1 . 2. Bestimmen Sie die folgenden Grenzwerte: ex − cos(x) , x→0 x lim lim x→1 2 ln(x) , x−1 lim x→0 1 − cos(x) , x2 lim x→0 2x . e2x − 1 Verwenden Sie Potenzreihendarstellungen, wo dies möglich ist. 3. Untersuchen Sie, ob für die folgenden Funktionen ein links- bzw. rechtsseitiger Grenzwert in x0 = 0 existiert, und bestimmen Sie diesen gegebenenfalls: x f1 : R → R, x 7→ p , |x| f2 : R → R, x 7→ bxc − 2x, bxc , x |x| sin(x) f4 : R → R, x 7→ . x2 f3 : R → R, x 7→ 4. Bestimmen Sie die nachfolgenden Grenzwerte 3x3 + 4x2 + 5 , x→∞ 1 + 10x − 7x2 lim lim (x10 + 4x2 ) e−x , x→∞ x5 + 4x3 + 8 , x→−∞ 2x7 − 4x6 + 13 lim sin(x) . x→∞ x lim 5.2. STETIGKEIT 5.2 105 Stetigkeit In diesem Abschnitt führen wir den wichtigen Begriff der Stetigkeit für Funktionen ein. Wie sich zeigen wird, ist dieser Begriff eng mit dem Grenzwertbegriff für Funktionen verbunden. Definition (stetige Funktion). Seien (V, k · kV ) und (W, k · kW ) zwei normierte Räume über K, sei D ⊆ V eine nichtleere Menge, und sei v0 ∈ D ein Punkt dieser Menge. Eine Funktion f : D → W heißt stetig an der Stelle v0 , wenn für jede positive Zahl ε > 0 eine positive Zahl δ > 0 existiert, so dass kf (v) − f (v0 )kW < ε für alle v ∈ Bδ (v0 ) ∩ D gilt. Hierbei bezeichnet Bδ (v0 ) die offene Kugel in V mit Mittelpunkt v0 und Radius δ. Die Funktion heißt stetig, wenn sie an jeder Stelle in D stetig ist. Die Menge aller stetigen Funktionen von D nach W wird mit C(D, W ) bezeichnet. Falls W = R gilt, bezeichnet man diese Menge auch mit C(D). Nachfolgend geben wir einige einfache Beispiele für stetige Funktionen an. Beispiele. (a) Seien (V, k · kV ) und (W, k · kW ) zwei normierte Räume über K, und sei D ⊆ V eine nichtleere Menge. Dann ist jede konstante Funktion von D nach W stetig. (b) Sei (V, k · k) ein normierter Raum über K. Dann ist die identische Funktion auf V stetig. Die identische Funktion idV : V → V auf V ist bekanntlich durch idV (v) := v für alle v ∈ V definiert. (c) Die Exponentialfunktion und der natürliche Logarithmus sind stetige Funktionen von R nach R bzw. von (0, ∞) nach R. (d) Die Sinusfunktion und die Cosinusfunktion sind stetige Funktionen von R nach R. Die Tangensfunktion ist an jeder Stelle ihres Definitionsbereichs stetig. (e) Jede lineare Abbildung von Km nach Kn , wobei m ∈ N und n ∈ N zwei natürliche Zahlen sind, ist stetig. Betrachtet man die Definition für die Stetigkeit einer Funktion f an einer Stelle v0 genauer, so erkennt man, dass diese große Ähnlichkeit mit der Definition des Grenzwertes von f in v0 hat. Tatsächlich kann man die Stetigkeit einer Funktion auch mit Hilfe von Funktionsgrenzwerten charakterisieren, wie das nachfolgende Lemma zeigt. Lemma 5.4. Seien (V, k · kV ) und (W, k · kW ) zwei normierte Räume über K, sei D ⊆ V eine nichtleere Menge, und sei v0 ∈ D ein Punkt dieser Menge. Eine Funktion f : D → W ist genau dann stetig an der Stelle v0 , wenn lim f (v) = f (v0 ) v→v0 gilt. 106 KAPITEL 5. STETIGE FUNKTIONEN Abbildung 5.3: Eine Funktion f : D → W ist an einer Stelle v0 ∈ D stetig, wenn für alle ε > 0 ein δ > 0 existiert, so dass das Bild von Bδ (v0 ) ∩ D unter f eine Teilmenge von Bε (f (v0 )) ist. Gemäß Lemma 5.4 ist eine Funktion f also genau dann an einer Stelle v0 ihres Definitionsbereichs stetig, wenn der Grenzwert von f in v0 mit dem Funktionswert von f in v0 übereinstimmt. Mit diesem Prinzip kann man sehr leicht die Stetigkeit einer Funktion zeigen bzw. widerlegen. Man betrachte dazu auch die folgenden Beispiele. Beispiele. √ (a) Die Quadratwurzelfunktion · : [0, ∞) → R ist stetig. Ist nämlich x0 > 0 eine beliebige Stelle, so erhält man √ |x − x0 | 0 f (x) − f (x0 ) = x − √x0 = √x − x x + √x0 ≤ √x0 für alle x ∈ R. Daher gilt lim f (x) − f (x0 ) = 0, x→x0 d.h. der Funktionswert f (x0 ) ist auch der Grenzwert von f in x0 . Für x0 = 0 lässt sich dies ebenfalls zeigen. (b) Die Funktion sinc : R → R, welche durch ( sin(x)/x sinc(x) := 1 falls x 6= 0, falls x = 0 für alle x ∈ R definiert ist, wird Sinus Cardinalis genannt. Sie ist an der Stelle x0 = 0 stetig, da sin(x) lim sinc(x) = lim = 1 = sinc(0) x→0 x→0 x gilt. An allen übrigen Stellen ist sinc ebenfalls stetig. (c) Die Funktion f : R → R, welche durch ( x2 f (x) := 1 falls x 6= 0, falls x = 0 für alle x ∈ R definiert ist, ist an der Stelle x0 = 0 nicht stetig. Es gilt nämlich lim f (x) = lim x2 = 0 6= 1 = f (0). x→0 x→0 An allen übrigen Stellen ist die Funktion f jedoch stetig. ♦ 5.2. STETIGKEIT 107 Bei Funktionen, die auf Teilmengen D von R definiert sind, kann man bekanntlich einseitige Grenzwerte an einer Stelle x0 ∈ D betrachten. Der Grenzwert von f in x0 existiert in diesem Fall genau dann, wenn der linksseitige und der rechtsseitige Grenzwert von f in x0 existieren, und wenn beide einseitigen Grenzwerte übereinstimmen. Entsprechend ist die Funktion f genau dann an der Stelle x0 stetig, wenn lim f (x) = lim f (x) = f (x0 ) x→x0 + x→0− gilt. Dieses Kriterium ist nützlich, wenn man abschnittsweise definierte Funktionen auf Stetigkeit hin untersucht. Man betrachte dazu die nachfolgenden Beispiele. Beispiele. (a) Für die Heaviside–Funktion (siehe Beispiel (b) auf Seite 2) gilt bekanntlich lim H(x) = 0 6= 1 = lim H(x). x→0− x→0+ Daher ist die Heaviside–Funktion an der Stelle x0 = 0 nicht stetig. (b) Betrachtet man die Funktion f : R → R, welche durch ( x falls x < 0, f (x) := −x 1−e falls x ≥ 0 für alle x ∈ R definiert ist, so stellt man fest, dass lim f (x) = lim x = 0 = lim 1 − e−x = lim f (x) x→0− x→0− x→0+ x→0+ gilt. Die Funktion ist also an der Stelle x0 = 0 stetig. ♦ Wir kommen nun zu einem weiteren Kriterium für die Stetigkeit von Funktionen. Satz 5.5 (Folgenkriterium für Stetigkeit). Seien (V, k · kV ) und (W, k · kW ) zwei normierte Räume über K, und sei D ⊆ V eine nichtleere Menge. Eine Funktion f : D → W ist genau dann stetig an einer Stelle v0 ∈ D, wenn für jede Folge (vn )n∈N in D, welche gegen v0 konvergiert, die Folge der Funktionswerte (f (vn ))n∈N gegen f (v0 ) konvergiert. Aus dem Folgenkriterium für Stetigkeit folgt insbesondere, dass die Gleichung lim f (vn ) = f lim vn n→∞ n→∞ für jede stetige Funktion f und jede konvergente Folge (vn )n∈N gilt. Diese Tatsache kann man unter anderem dazu verwenden, die Grenzwerte bestimmter Folgen zu berechnen. Man betrachte dazu die nachfolgenden Beispiele. Beispiele. (a) Man betrachte die Folge (an )n∈N , welche durch 1 1 1 an := ln 1 + + + · · · + 1! 2! n! für alle n ∈ N definiert ist. Offenbar gilt dann an = ln(sn ) für alle n ∈PN, wobei ∞ sn := 1 + 1/1! + 1/2! + · · · + 1/n! die n-te Partialsumme der Reihe k=1 1/k! bezeichnet. Wir wissen bereits, dass die Folge (sn )n∈N gegen die Eulersche Zahl e konvergiert. Da der natürliche Logarithmus eine stetige Funktion ist, gilt demnach lim an = lim ln(sn ) = ln lim sn = ln(e) = 1. n→∞ n→∞ n→∞ 108 KAPITEL 5. STETIGE FUNKTIONEN Abbildung 5.4: Die Verkettung zweier Funktionen f und g, welche an den Stellen u0 und v0 = f (u0 ) stetig sind, ist an der Stelle u0 stetig. (b) Aus Satz 2.3 und dem Folgenkriterium für Stetigkeit ergibt sich, dass jede Norm eine stetige Funktion ist. ♦ Mit dem Folgenkriterium für Stetigkeit (d.h. mit Satz 5.5), sowie mit den Sätzen 2.4 und 2.5 kann man weiterhin ganz leicht die nachfolgenden beiden Sätze beweisen. Satz 5.6. Seien (V, k · kV ) und (W, k · kW ) normierte Räume über K, und sei D ⊆ V eine nichtleere Menge. Seien außerdem f : D → W , g : D → W und α : D → K Funktionen, die an einer Stelle v0 ∈ D stetig sind. Dann gelten die folgenden Aussagen. (1) Die Funktion f + g : D → W ist an der Stelle v0 stetig. (2) Die Funktion αf : D → W ist an der Stelle v0 stetig. Ist (W, k · kW ) eine normierte Algebra über K, so gilt außerdem (3) Die Funktion f g : D → W ist an der Stelle v0 stetig. Satz 5.7. Sei (V, k · k) ein normierter Raum über K, sei D ⊆ V eine nichtleere Menge, und sei f : D → K \ {0} eine Funktion, welche an einer Stelle v0 ∈ D stetig ist. Dann ist die Funktion 1 :D→K f ebenfalls an der Stelle v0 stetig. Man beachte dass die Vektoraddition, die skalare Multiplikation, die Multiplikation, sowie die Division in den Sätzen 5.6 und 5.7 jeweils punktweise zu verstehen ist (siehe Beispiel (e) auf Seite 34). Ist D eine nichtleere Teilmenge eines normierten Raumes, und ist W ein normierter Raum über K, so folgt aus den Teilen (1) und (2) von Satz 5.6, dass die Menge aller stetigen Funktionen von D nach W ein Vektorraum über K ist. Wie bereits erwähnt, wird die Menge aller stetigen Funktionen von D nach W mit C(D, W ) bezeichnet. Ist W eine normierte Algebra über K, dann folgt aus Teil (3) von Satz 5.6, dass C(D, W ) eine Algebra über K ist. Der nachfolgende Satz macht eine Aussage über die Verkettung von Funktionen, die an bestimmten Stellen ihrer Definitionsbereiche stetig sind. Satz 5.8. Seien (U, k · kU ), (V, k · kV ) und (W, k · kW ) normierte Räume über K, und seien C ⊆ U und D ⊆ V zwei nichtleere Mengen. Sei außerdem g : C → D eine Funktion, die an einer Stelle u0 ∈ U stetig ist, und f : D → E eine Funktion, die an der Stelle v0 := g(u0 ) stetig ist. Dann ist die Funktion f ◦ g : C → W ebenfalls an der Stelle u0 stetig. 5.2. STETIGKEIT 109 Die Voraussetzungen für Satz 5.8 sind in Abbildung 5.4 noch einmal anschaulich dargestellt. Die Sätze 5.6, 5.7 und 5.8 werden in der Regel dazu verwendet, die Stetigkeit von gegebenen Funktionen nachzuweisen. Der Nachweis gelingt, wenn man zeigen kann, dass sich eine gegebene Funktion als Addition, Subtraktion, Multiplikation, Division oder Verkettung von stetigen Funktionen darstellen lässt. Eine weitere Möglichkeit, die Stetigkeit einer Funktion nachzuweisen, liefert der nachfolgende Satz. Satz 5.9. Seien (V, k · kV ) und (W, k · kW ) zwei normierte Räume, sei D ⊆ V eine nichtleere Menge, und sei (fn )n∈N eine Folge stetiger Funktionen von D nach W , welche gleichmäßig auf D gegen eine Grenzfunktion f : D → W konvergiert. Dann ist f ebenfalls stetig. Die Aussage von Satz 5.9 kann auch dazu verwendet werden, die gleichmäßige Konvergenz einer Funktionenfolge zu widerlegen. Man betrachte dazu das nachfolgende Beispiel. Beispiel. Die Funktionenfolge (pn )n∈N von [0, 1] nach R, welche durch pn (x) := xn für alle x ∈ [0, 1] und alle n ∈ N definiert ist, konvergiert bekanntlich punktweise gegen die Grenzfunktion p : [0, 1] → R, welche durch ( 0 falls x ∈ [0, 1), p(x) := 1 falls x = 1 für alle x ∈ R definiert ist. Jedes Glied der Folge (pn )n∈N ist eine stetige Funktion. Die Grenzfunktion p ist hingegen nicht stetig. Gemäß Satz 5.9 kann die Konvergenz von (pn )n∈N gegen p also nicht gleichmäßig sein. ♦. Wir beschließen diesen Abschnitt mit einer weiteren Charakterisierung stetiger Funktionen, die in den nachfolgenden Abschnitten von großer Bedeutung sein wird. Satz 5.10. Seien (V, k · kV ) und (W, k · kW ) zwei normierte Räume über K, und sei D ⊆ V eine nichtleere Menge. Eine Funktion f : D → W ist genau dann stetig, wenn für jede offene Menge Θ ⊆ W eine offene Menge O ⊆ V existiert, so dass f −1 (Θ) = D ∩ O gilt. Übungsaufgaben 1. Geben seien die stetigen Funktionen f1 : R → R, x 7→ 1, f2 : R → R, x 7→ x, f3 : [0, ∞) → R, x 7→ √ x, x f4 : R → R, x 7→ e , f5 : (0, ∞) → R, x 7→ ln(x). Stellen Sie die nachfolgend angegebenen Funktionen als Verknüpfungen (d.h. als Summen, Differenzen, Produkte, Quotienten, Vielfache oder Verkettungen) von f1 , f2 , . . . , f5 dar: 2 g1 : R → R, x 7→ e−x , g2 : R → R, x 7→ 2x2 − 3x + 2, g3 : R → R, x 7→ 2x , 110 KAPITEL 5. STETIGE FUNKTIONEN g4 : [0, ∞) → R, x3/2 , g5 : (0, ∞) → R, x 7→ xx . Verwenden Sie dabei, dass ab = eb ln(a) für alle a > 0 und alle b ∈ R gilt. Sind die Funktionen g1 , g2 , . . . , g5 stetig? 2. Zeigen Sie mit Hilfe von Satz 5.6, dass jedes Polynom eine stetige Funktion von R nach R ist. Verwenden Sie dabei die Tatsache, dass die Funktionen f : R → R und g : R → R, welche durch f (x) = x bzw. g(x) = 1 für alle x ∈ R definiert sind, stetig sind. 3. Wie muss α ∈ R gewählt werden, damit die Funktion fα : R → R, definiert durch ( 2 (1 + x2 − ex )/x4 falls x 6= 0, fα (x) := α falls x = 0 für alle x ∈ R, stetig ist? 4. Bestimmen Sie jeweils Menge aller Stellen, an denen die folgenden Funktionen stetig sind. ( (x3 − 1)/(x − 1) falls x 6= 1, f1 : R → R, x 7→ 3 falls x = 1 ( (cos(x) − 1)/x falls x 6= 0, f2 : R → R, x 7→ 0 falls x = 0 ( √ x + 1 falls x ≥ 0, √ , f3 : R → R, x 7→ − 1 − x falls x < 0, ( 0 falls x ∈ Q, f4 : R → R, x 7→ . 1 falls x 6∈ Q 5. Bestimmen Sie die Grenzwerte der reellen Zahlenfolgen (an )n∈N , (bn )n∈N , (cn )n∈N und (dn )n∈N . Die Folgen sind durch nπ π an = sin cos π + , 2n + π n 1 1 1 (−1)n+1 bn = tan 1 − + − ± · · · + , 3 5 7 2n − 1 2 cn = n ln 1 + , n d1 := e, n dn+1 := dn e(−1) /(n+1) für alle n ∈ N definiert. Verwenden Sie dabei die Tatsache, dass der natürliche Logarithmus, die Funktionen Sinus und Tangens, sowie die Exponentialfunktion stetige Funktionen sind. 5.3. DER ZWISCHENWERTSATZ 5.3 111 Der Zwischenwertsatz In diesem Abschnitt lernen wir den wichtigen Zwischenwertsatz kennen der für jede stetige Funktion gilt, die auf einer zusammenhängenden Menge definiert ist. Aus dem Zwischenwertsatz lassen sich eine Reihe wichtiger Folgerungen ableiten. Ein paar davon stellen wir in diesem Abschnitt vor. Die Grundlage für alle Resultate in diesem Abschnitt bildet der nachfolgende Satz. Satz 5.11. Seien (V, k · kV ) und (W, k · kW ) zwei normierte Räume über K, sei D ⊆ V eine nichtleere, zusammenhängende Menge, und sei f : D → W eine stetige Funktion. Dann ist f (D) ebenfalls zusammenhängend. Umgangssprachlich kann die Aussage von Satz 5.11 wie folgt formuliert werden: Eine stetige Funktion bildet zusammenhängende Mengen auf zusammenhängende Mengen ab. Dies ist in der Tat eine bemerkenswerte Eigenschaft stetiger Funktionen. Erinnert man sich nun daran, dass die nichtleeren, zusammenhängenden Teilmengen von R genau die Intervalle sind (siehe Satz 3.16), dann kommt man leicht zum so genannten Zwischenwertsatz für stetige Funktionen. Satz 5.12 (Zwischenwertsatz). Sei (V, k · k) ein normierter Raum über K, D ⊆ V eine nichtleere, zusammenhängende Menge, f : D → R eine stetige Funktion. Seien ferner y1 , y2 ∈ f (D) zwei Funktionswerte von f mit y1 < y2 . Dann existiert zu jedem Zwischenwert y ∈ [y1 , y2 ] eine Stelle v ∈ D, so dass f (v) = y gilt. Die Aussage des Zwischenwertsatzes kann man folgendermaßen ausdrücken: Eine stetige Funktion, welche auf einer zusammenhängenden Menge definiert ist und zwei Funktionswerte y1 und y2 annimmt, nimmt auch jeden Funktionswert zwischen y1 und y2 an. In den nachfolgenden Beispielen wird die Aussage des Zwischenwertsatzes noch einmal verdeutlicht. Ferner wird eine mögliche Anwendung des Zwischenwertsatzes demonstriert. Beispiele. (a) Wir betrachten Funktion f : [−π, π] → R, welche durch f (x) := x cos(x cos(x))/π für alle x ∈ R definiert ist. Offenbar ist f als Verknüpfung stetiger Funktionen stetig. Das Intervall [−π, π] ist zusammenhängend. Wir interessieren uns für die Bildmenge von f . Man rechnet leicht nach, dass f (−π) = 1 und f (π) = −1 gilt. Nach dem Zwischenwertsatz nimmt f daher jeden Funktionswert zwischen −1 und 1 an. Das Intervall [−1, 1] ist somit eine Teilmenge der Bildmenge von f . (b) Die Funktion g : [0, 1] × [0, 1] → R sei durch g(x, y) = x2 − 6xy + 2y definiert. Die Funktion g kann als Verknüpfung stetiger Funktionen dargestellt werden, weshalb sie stetig ist. Das Quadrat [0, 1] × [0, 1] ist eine zusammenhängende Teilmenge des R2 . Ferner gilt g(1, 1) = −3 und g(0, 1) = 2. Aufgrund des Zwischenwertsatzes nimmt die Funktion g auf [0, 1] × [0, 1] alle Funktionswerte zwischen −3 und 2 an. Die Funktion g besitzt also insbesondere eine Nullstelle. (c) Besitzt die Gleichung sin(2x) − ex = −5 für x eine Lösung im Intervall [0, π]? Um diese Frage zu beantworten, kann man die linke Seite der Gleichung als Funktion f : R → R auffassen, welche durch f (x) := sin(2x) − ex für alle x ∈ R definiert ist. Die Funktion f ist als Verknüpfung 112 KAPITEL 5. STETIGE FUNKTIONEN stetiger Funktionen stetig. Ferner gilt f (0) = −1 und f (π) = −eπ . Nach dem Zwischenwertsatz nimmt die Funktion f auf dem Intervall [0, π] jeden Funktionswert zwischen −eπ und −1 an. Wegen −eπ < −2π < −23 = −8 gilt −5 ∈ [−eπ , −1]. Daher existiert eine Stelle x ∈ [0, π], für die f (x) = −5 gilt. Die obige Gleichung besitzt also eine Lösung im Intervall [0, π]. ♦ Eine wichtige Folgerung aus dem Zwischenwertsatz ist der so genannte Nullstellensatz von Bolzano. Satz 5.13 (Nullstellensatz von Bolzano). Sei I ⊆ R ein reelles Intervall, und sei f : I → R eine stetige Funktion. Seien ferner a, b ∈ I zwei reelle Zahlen, so dass a < b und f (a)f (b) < 0 gilt. Dann besitzt die Funktion f eine Nullstelle im offenen Intervall (a, b), d.h. es existiert eine reelle Zahl z ∈ (a, b) mit f (z) = 0. Der Nullstellensatz von Bolzano bildet die theoretische Grundlage für ein einfaches numerisches Verfahren, mit dem Näherungswerte für die Nullstelle einer stetigen Funktion berechnet werden können. Dieses Verfahren beruht auf der Konstruktion immer kleine” rer“Intervalle, welche mindestens eine Nullstelle der Funktion enthalten. Es wird Bisektionsverfahren genannt. Algorithmus (Bisektionsverfahren). Gegeben sei ein reelles Intervall I ⊆ R, eine stetige Funktion f : I → R sowie zwei Stellen a0 , b0 ∈ I mit a < b, für die f (a0 )f (b0 ) < 0 gilt. Zu einer vorgegebenen positiven Zahl ε > 0 sind zwei Zahlen a, b ∈ I mit a < b und b − a < ε gesucht, so dass f in dem Intervall [a, b] eine Nullstelle besitzt. Man berechnet dann die Intervalle [a0 , b0 ], [a1 , b1 ], [a2 , b2 ], . . . gemäß ak−1 + bk−1 , 2 ( [ak−1 , ck ] falls f (ak−1 )f (ck ) < 0, [ak , bk ] := [ck , bk−1 ] sonst ck := für k = 1, 2, 3, . . . , solange bis bn − an < ε für ein n ∈ N gilt. Das gesuchte Intervall ist dann durch [a, b] := [an , bn ] gegeben. Der Parameter ε im Bisektionsverfahren gibt die Genauigkeit vor, mit der eine Nullstelle der Funktion f angenähert werden soll. Je kleiner ε gewählt wird, desto genauer ist die Näherung. Allerdings wächst mit kleiner werdendem ε auch die Anzahl der Schritte, die das Bisektionsverfahren benötigt, um die geforderte Genauigkeit zu erreichen. Im Vergleich zu anderen numerischen Verfahren, mit denen Näherungswerte für Nullstellen von Funktionen berechnet werden können, ist das Bisektionsverfahren eher ineffizient bzw. langsam“. Die ” Vorteil des Bisektionsverfahrens besteht jedoch darin, dass nur wenige Voraussetzungen an die Funktion f stellt, und dass es relativ leicht implementiert werden kann. Übungsaufgaben 1. Gibt es eine stetige und surjektive Funktion, die vom Intervall (0, 1) in die Menge M1 := (0, ∞) bzw. in die Menge M2 := (−1, 1) \ {0} abbildet? Geben Sie ggf. eine entsprechende Funktion an. 5.3. DER ZWISCHENWERTSATZ 113 2. Zeigen Sie mit Hilfe des Zwischenwertsatzes, dass die Gleichung e2x − ln(1 + x) = 2 eine Lösung x im Intervall [0, 1] besitzt. 3. Man betrachte die Funktion f : (−1, 1) \ {0} → R, welche durch f (x) := sgn(x) für alle x ∈ [−1, 1] \ {0} definiert ist. Zeigen Sie, dass f stetig ist. Erfüllt f die Voraussetzungen des Zwischenwertsatzes? 4. Berechnen Sie von Hand die ersten drei Intervalle [a1 , b1 ], [a2 , b2 ], [a3 , b3 ], welche das Bisektionsverfahren für die Funktion f : R → R, x 7→ x5 − 3x3 + 1 und die Startwerte a1 := 0 und b1 := 1 liefert. 114 5.4 KAPITEL 5. STETIGE FUNKTIONEN Der Satz vom Minimum und Maximum Neben dem Zwischenwertsatz gibt es noch einen weiteren wichtigen Satz, der für alle stetigen Funktionen gilt. Dieser Satz als der Satz vom Minimum und Maximum bekannt. Der Satz vom Minimum und Maximum beruht auf der folgenden wichtigen Aussage über das Abbildungsverhalten stetiger Funktionen. Satz 5.14. Seien (V, k · kV ) und (W, k · kW ) zwei normierte Räume über K, sei D ⊂ V eine nichtleere, kompakte Menge, und sei f : D → R eine stetige Funktion. Dann ist f (D) kompakt. Satz 5.14 besagt, dass stetige Funktionen kompakte Mengen auf kompakte Mengen abbilden. Dieses Wissen benötigt man, um den nachfolgenden Satz zu beweisen. Satz 5.15 (Satz vom Minimum und Maximum). Sei (V, k · k) ein normierter Raum über K, sei D ⊂ V eine nichtleere, kompakte Menge, und sei f : D → R eine stetige Funktion. Dann existieren zwei Vektoren v∗ , v ∗ ∈ D mit f (v∗ ) = min f (v), v∈D ∗ f (v ) = max f (v). v∈D Umgangssprachlich kann der Satz vom Minimum und Maximum folgendermaßen formuliert werden: Jede stetige Funktion nimmt auf einer kompakten Menge ihr Minimum und ihr Maximum an. Die Kompaktheit der Definitionsmenge ist hierbei von entscheidender Bedeutung, wie man anhand der nachfolgenden Beispiele erkennt. Beispiele. (a) Die Funktion f : [−1, 1] → R, welche durch f (x) := x7 − 4x6 + 3x − 5 für alle x ∈ [−1, 1] definiert ist, ist offenbar ein Polynom und somit stetig. Die Definitionsmenge von f ist abgeschlossen und beschränkt, und nach dem Satz von Heine–Borel (siehe Satz 3.9) somit kompakt. Nach dem Satz vom Minimum und Maximum besitzt die Funktion f also einen minimalen und einen maximalen Funktionswert. (b) Die Funktion g : (0, 1) → R, welche durch g(x) := 1/x für alle x ∈ (0, 1) definiert ist, ist zwar stetig, ihre Definitionsmenge ist aber nicht kompakt. Daher kann man den Satz von Minimum und Maximum nicht auf die Funktion g anwenden. Wie man leicht zeigt, besitzt die Funktion g tatsächlich kein Minimum und auch kein Maximum. Mit dem Satz vom Minimum und Maximum lassen sich eine Reihe wichtiger Aussagen beweisen. Im folgenden Abschnitt werden wir eine solche wichtige Aussage kennen lernen. Übungsaufgaben 1. Gibt es eine stetige und surjektive Funktion, die vom Intervall [0, 1] in die Menge M1 := [−1, 1] bzw. in die Menge M2 := (0, 1) abbildet? Geben Sie ggf. eine entsprechende Funktion an. 2. Zeigen Sie, dass die Funktion f : [−1, 1] → R2 , definiert durch 3 −t + 2t − t f (t) := et − t2 für alle t ∈ [−1, 1] beschränkt ist. 5.5. ÄQUIVALENZ VON NORMEN 5.5 115 Äquivalenz von Normen In den zurück liegenden Abschnitten wurden zahlreiche Begriffe und Eigenschaften mit Hilfe von Normen definiert. Insbesondere die Konzepte von Konvergenz und Stetigkeit wurden in normierten Räumen (V, k · k) und somit in Abhängigkeit einer Norm k · k definiert. Bereits im Abschnitt 1.1 haben wir aber gesehen, dass man auf einem Vektorraum V im Allgemeinen unterschiedliche Normen definieren kann. Es stellt sich daher die folgende Frage: Angenommen, k · k(1) und k · k(2) sind zwei unterschiedliche Normen auf einem Vektorraum V . Ferner sei (vn )n∈N eine Folge in V , von der man weiß, dass sie bezüglich der Norm k · k(1) konvergent ist. Ist diese Folge dann auch bezüglich der Norm k · k(2) konvergent? Am Ende dieses Abschnitts werden wir darauf folgende Antwort geben können: Ja, sofern V = Kn gilt oder die Normen k · k(1) und k · k(2) äquivalent sind. Definition (äquivalente Normen). Sei V ein Vektorraum über K. Zwei Normen k · k(1) und k · k(2) auf V heißen zueinander äquivalent, wenn zwei positive Konstanten c > 0 und C > 0 existieren, so dass ckvk(2) ≤ kvk(1) ≤ Ckvk(2) für alle v ∈ V gilt. Man kann leicht zeigen, dass die Äquivalenz von Normen tatsächlich eine Äquivalenzrelation auf der Menge aller Normen auf einem gegebenen Vektorraum ist. Für die offenen Kugeln äquivalenter Normen gilt das folgende wichtige Lemma. Lemma 5.16. Sei V ein normierter Raum über K, und seien k · k(1) und k · k(2) zwei äquivalente Normen auf V . Sei außerdem v ∈ V ein beliebiger Vektor und r > 0 eine beliebige, positive Zahl. Dann existieren positive Zahlen s > 0 und S > 0, so dass (2) Bs(2) (v) ⊆ Br(1) (v) ⊆ BS (v) (1) gilt. Hierbei bezeichnet Br (v) die offene Kugel in V mit Mittelpunkt v und Radius (2) (2) r bezüglich der Norm k · k(1) . Mit Bs (v) und BS (v) werden die offenen Kugeln mit Mittelpunkt v und den Radien s bzw. S bezüglich der Norm k · k(2) bezeichnet. Vergegenwärtigen wir uns die Bedeutung von Lemma 5.16. In den zurück liegenden Abschnitten dieses Skripts wurden sämtliche topologische Begriffe wie auch sämtlich Konvergenzbegriffe letztlich über offene Kugeln definiert. Eine Folge (vn )n∈N in einem normierten Raum wird beispielsweise konvergent gegen einen Vektor v genannt, wenn für alle ε > 0 ein N ∈ N existiert, so dass kvn − vk < ε für alle n ∈ N mit n ≥ N gilt. Die strikte Ungleichung bedeutet jedoch nichts anderes, als dass vn ∈ Bε (v) gilt, wobei Bε (v) die offene Kugel mit Mittelpunkt v und Radius ε bezüglich der Norm k · k bezeichnet. Ein typisches Beispiel für einen topologischen Begriff, der mit Hilfe von offenen Kugeln definiert wird, ist die Offenheit von Mengen. Eine Teilmenge O eines normierten Raumes wird bekanntlich als offen bezeichnet, wenn für jeden Punkt v der Menge eine offene Kugel Bε (v) existiert, so dass Bε (x) ⊆ O gilt. Lemma 5.16 besagt nun folgendes: Wenn eine Folge bezüglich einer gegebenen Norm k · k konvergent ist, dann ist sie auch bezüglich jeder zu k · k äquivalenten Norm konvergent. Man kann nämlich zu jeder offenen Kugel Bε (v) bezüglich k · k eine offene Kugel bezüglich der äquivalenten Norm finden, so dass diese eine Teimenge von Bε (v) ist. Aus 116 KAPITEL 5. STETIGE FUNKTIONEN demselben Grund ist jede Menge, die bezüglich einer gegebenen Norm k · k offen ist, auch bezüglich jeder anderen, zu k · k äquivalenten Norm offen. Grundsätzlich kann man also folgendes sagen: Sämtliche Konvergenzeigenschaften von Folgen, Reihen, etc. und sämtliche topologischen Eigenschaften von Mengen bleiben für äquivalente Normen erhalten. Welche in diesem Skript bereits eingeführten Normen sind zueinander äquivalent? Das folgende Lemma macht dazu eine wichtige Aussage. Lemma 5.17. Jede Norm auf Kn ist zur Maximumnorm k · k∞ auf Kn äquivalent. Diese Aussage gilt für alle n ∈ N. Da die Äquivalenz von Normen eine Äquivalenzrelation auf der Menge aller Normen eines Vektorraums ist, folgt aus Lemma 5.17 unmittelbar der nachfolgende Satz. Satz 5.18. Alle Normen auf Kn sind zueinander äquivalent. Diese Aussage gilt für alle n ∈ N. Eine weitere wichtige Folgerung aus Lemma 5.17 ist der nachfolgende Satz, der eine Aussage über die Konvergenz vektorwertiger Folgen und Funktionen macht. Mit vektorwertig“ ” ist hierbei gemeint, dass die Glieder einer Folge Elemente des Vektorraums Kn sind, bzw. dass eine Funktion in diesen Vektorraum abbildet, wobei man implizit n > 1 voraussetzt. Satz 5.19. Eine Folge (x(k) )k∈N in Kn konvergiert genau dann gegen einen Vektor x ∈ Kn , wenn die Komponenten der Folgenglieder gegen die Komponenten von x konvergieren. Eine Funktion f mit Bild in Kn besitzt genau dann in einem Punkt v0 den Grenzwert w0 ∈ Kn , wenn die Komponenten von w0 die Grenzwerte der Komponenten von f in v0 sind. Umgangssprachlich können die Aussagen von Satz 5.19 folgendermaßen formuliert werden: Eine vektorwertige Folge konvergiert genau dann gegen einen bestimmten Vektor, wenn sie komponentenweise gegen diesen konvergiert. Der Grenzwert einer Funktion ist genau dann ein bestimmter Vektor, wenn dies komponentenweise der Fall ist. Zur Erläuterung dieser Aussagen betrachte man die nachfolgenden Beispiele. Beispiele. (a) Die Folge (x(k) )k∈N in R2 , deren Glieder durch √ n n (k) x := 1/n für alle k ∈ N gegeben sind, soll auf Konvergenz hin untersucht werden. Laut Satz 5.19 kann diese Untersuchung komponentenweise erfolgen. Die erste Komponente der Folgenglieder konvergiert offenbar gegen 1, während die zweite Komponente gegen 0 konvergiert. Also gilt 1 (k) lim x = . 0 k→∞ (b) Die Funktion f : R \ {0} → R2 sei durch sin(x)/x f (x) = (x2 − 2x)/(2x) 5.5. ÄQUIVALENZ VON NORMEN 117 für alle x ∈ R \ {0} definiert. Es soll der Grenzwert von f in 0 bestimmt werden. Wieder geht man komponentenweise vor und erhält so 1 lim f (x) = −1 x→0 als Grenzwert. ♦ Übungsaufgaben 1. Für je zwei Normen k · k(1) und k · k(2) auf einem Vektorraum V über K gelte k · k(1) ∼ k · k(2) genau dann, wenn die Normen zueinander äquivalent sind. Zeigen Sie, dass ∼ eine Äquivalenzrelation auf der Menge aller Normen auf V ist. 2. Sei V ein Vektorraum über K, und sei k · k(0) eine Norm auf V mit der Eigenschaft, dass alle Normen auf V zu k · k(0) äquivalent sind. Zeigen Sie, dass dann alle Normen auf V zueinander äquivalent sind. 3. Es seien | · | und k · k∞ die euklidischen Norm bzw. die Maximumnorm auf Rn , wobei n ∈ N beliebig, aber fest gewählt sei. Bestimmen Sie zwei Zahlen c > 0 und C > 0 in Abhängigkeit von n, so dass ckxk∞ ≤ |x| ≤ Ckxk∞ für alle x ∈ Rn gilt. 4. Bestimmen Sie die folgenden Funktionsgrenzwerte: 5 (3x − 3)/(2x5 + 7) sin(x2 )/x 2 lim , lim , 2 x→∞ x→0 x + 3x + 1 x4 e−x lim x→1 (x2 − 1)/(x3 − 1) . x ln(x) Lernzielkontrolle Nach dem Durcharbeiten dieses Kapitels sollten Sie ... ... Grenzwerte von Funktionen bestimmen können. ... einseitige Grenzwerte von Funktionen bestimmen können. ... Grenzwerte von Funktionen gegen ∞ und gegen −∞ bestimmen können. ... wissen, dass eine Funktion genau dann an einer Stelle ihres Definitionsbereichs stetig ist, wenn der Grenzwert an der Stelle mit dem Funktionswert übereinstimmt. ... stetige Funktionen anhand ihrer Definition erkennen können. ... das Folgenkriterium für Stetigkeit kennen. ... den Zwischenwertsatz sowie den Nullstellensatz von Bolzano kennen. ... den Satz vom Minimum und Maximum kennen. ... wissen, dass eine vektorwertige Folge bzw. eine vektorwertige Funktion genau dann gegen einen bestimmten Grenzwert konvergiert, wenn sie gegen diesen komponentenweise konvergiert. 118 Kapitel 6 Differentialrechnung 6.1 Differenzierbarkeit Definition (differenzierbare Funktion, Ableitung). Sei (W, k · k) ein normierter Raum über K, sei D ⊆ R eine nichtleere Menge und x0 ∈ D◦ ein innerer Punkt dieser Menge. Eine Funktion f : D → W wird differenzierbar an der Stelle x0 genannt, wenn der Grenzwert f (x0 + h) − f (x0 ) h→0 h f 0 (x0 ) := lim existiert. Der Grenzwert f 0 (x0 ) ∈ Rm wird dann die Ableitung von f an der Stelle x0 genannt. Die Funktion f wird differenzierbar genannt, wenn der Grenzwert f 0 (x0 ) an jeder Stelle x0 ∈ D◦ existiert. Die Funktion f 0 : D◦ → W, x 7→ f 0 (x) wird dann die Ableitung von f genannt. Bei in der obigen Definition ist zu beachten, dass die Ableitung einer Funktion an einer gegebenen Stelle und die Ableitung einer Funktion zwei unterschiedliche Klassen von Objekten bezeichnen. Der erstgenannte Begriff bezeichnet nämlich ein Element des Wertebereichs der Funktion, während der zweite Begriff eine Funktion bezeichnet. Die Bestimmung der Ableitung f 0 einer Funktion f wird auch als Ableiten von f bezeichnet. Ist D eine Teilmenge von R und f eine auf D definierte, differenzierbare Funktion, so ist der Ableitung f 0 von f zunächst nur auf dem Inneren von D definiert. Unter gewissen Voraussetzungen ist es jedoch möglich, den Definitionsbereich von f 0 auf ganz D zu erweitern. Dies ist beispielsweise dann der Fall, wenn die Funktion f auf einem abgeschlossenen Intervall [a, b] definiert ist, und die einseitigen Grenzwerte f 0 (a) := lim f (a + h) − f (a) h f 0 (b) := lim f (b + h) − f (b) h h→a+ und h→b− existieren. Ableitungen von Funktionen, die von einer Teilmenge D der reellen Zahlen nach R abbilden, sind aus dem Schulunterricht bereits gut bekannt. Ist f : D → R eine solche Funktion, die an einer Stelle x0 ∈ D◦ differenzierbar ist, dann interpretiert man die Ableitung f 0 (x0 ) als Steigung des Graphen von f an der Stelle x0 . Man betrachte beispielsweise eine affine Funktion g : R → R, welche durch g(x) := mx + c 119 120 KAPITEL 6. DIFFERENTIALRECHNUNG (a) (b) Abbildung 6.1: (a) Sekante an den Graph der Funktion f an den Stellen x0 und x0 +h. (b) Tangente an den Graph von f an der Stelle x0 . für alle x ∈ R gegeben ist. Hierbei sein m ∈ R und c ∈ R zwei fest gewählte, reelle Zahlen sind. Der Graph von g ist bekanntlich eine Gerade mit der Steigung m. Die Ableitung g 0 : R → R von g ist an jeder Stelle x0 ∈ R durch g(x0 + h) − g(x0 ) m(x0 + h) + c − mx0 − c mh = lim = lim =m h→0 h→0 h→0 h h h g 0 (x0 ) = lim gegeben. An jeder Stelle x0 ∈ R entspricht die Ableitung von g an der Stelle x0 also genau der Steigung der Gerade. Allgemein kann man den so genannten Differenzenquotienten f (x0 + h) − f (x0 ) h einer Funktion f : D → R an der Stelle x0 ∈ D als die Steigung einer Sekante interpretieren, welche die Punkte des Funktionsgraphen an den Stellen x0 und x0 + h verbindet. Wenn h gegen Null strebt, wird die Sekante einer Tangente immer ähnlicher, welche den Funktionsgraphen an der Stelle x0 berührt. Die Steigung dieser Tangente ist genau durch f 0 (x0 ) gegeben, und man definiert diese Steigung als Steigung des Funktionsgraphen an der Stelle x0 . Man betrachte dazu auch Abbildung 6.1. Nachfolgend geben wir einige Beispiele für differenzierbare Funktionen und deren Ableitungen an. Man beachte, dass der Ableitungsbegriff auch für vektorwertige Funktionen definiert ist. Beispiele. (a) Für jede Zahl n ∈ N sei die Funktion pn : R → R durch pn (x) := xn für alle x ∈ R definiert. Gemäß der verallgemeinerten binomischen Formel gilt dann pn (x0 + h) − pn (x0 ) h→0 h (x0 + h)n − xn0 = lim h→0 h ! n 1 X n n−k k = lim x h − x0 h→0 h k 0 k=0 ! 1 n n−2 2 n−1 n n−1 n = lim x0 + nx0 h + x h + · · · + nx0 h + h − x0 h→0 h 2 0 ! 1 n = lim nxn−1 h+ xn−2 h2 + · · · + nx0 hn−1 + hn 0 h→0 h 2 0 p0n (x0 ) = lim 6.1. DIFFERENZIERBARKEIT = lim h→0 nxn−1 0 121 ! n n−2 1 n−2 n−1 + x h + · · · + nx0 h +h 2 0 | {z } | {z } | {z } →0 →0 →0 = nxn−1 0 an jeder Stelle x0 ∈ R. Für jede Zahl n ∈ N ist die Funktion pn also differenzierbar. Die Ableitung von pn ist durch p0n : R → R, x 7→ nxn−1 gegeben. (b) Jede konstante Funktion f : R → Rm , wobei m ∈ N eine natürliche Zahl bezeichnet, ist differenzierbar. Wie man leicht nachrechnet, ist die Ableitung f 0 : R → Rm ebenfalls eine konstante Funktion, welche jede Stelle x ∈ R auf den Nullvektor 0 ∈ Rm abbildet. (c) Wir betrachten die Funktion g : R → R2 , welche durch t g(t) := 2 t für alle t ∈ R definiert ist. Mit dem Resultat von Beispiel (a) weist man leicht nach, dass g differenziertbar ist, und dass die Ableitung g 0 : R → R2 durch 1 g 0 (t) := 2t für alle t ∈ R gegeben ist. ♦ Am Beispiel (c) wird deutlich, dass man die Ableitung einer vektorwertigen Funktion berechnet, indem man diese komponentenweise ableitet. Das nachfolgende Lemma ist grundlegend für das Verständnis von Ableitungen. Lemma 6.1. Sei (W, k · k) ein normierter Raum über K, und sei D ⊆ R eine nichtleere Menge. Eine Funktion f : D → W ist genau dann an einer Stelle x0 ∈ D◦ differenzierbar, wenn es einen Vektor w0 ∈ W , eine positive Zahl r > 0 und eine Funktion ε : Br (0) → W gibt, so dass Br (x0 ) ⊆ D, sowie f (x0 + h) = f (x0 ) + w0 h + ε(h)h für alle h ∈ Br (0) und lim ε(h) = 0 h→0 gilt. Es ist dann w0 = f 0 (x0 ). Ist f eine Funktion, die an einer Stelle x0 im Innern ihres Definitionsbereichs differenzierbar ist, so kann die Funktion h 7→ f (x0 +h) gemäß Lemma 6.1 als Summe der affinen Funktion h 7→ f (x0 ) + f 0 (x0 )h und der Funktion h 7→ hε(h) dargestellt werden. Die Funktion h 7→ f (x0 ) + f 0 (x0 )h nennt man auch die Linearisierung von f in der Nähe von x0 . In der Physik und den Ingenieurwissenschaften wird die Linearisierung einer Funktion f häufig dazu verwendet, um das Änderungsverhalten von f nahe einer gegebenen Stelle x0 zu untersuchen. Oft stellt der Funktionswert f (x0 ) dabei den Zustand eines Systems und f (x0 + h) den Zustand nach einer Störung des Systems dar. Die Funktion h 7→ ε(h)h kann bei einer Untersuchung des Änderungsverhaltens oft vernachlässigt werden, da sie sehr schnell gegen Null konvergiert, wenn h gegen Null strebt. Wir wiederholen nun einige bekannte Resultate über die Differenzierbarkeit von Funktionen. Zunächst geht es um den Zusammenhang zwischen der Stetigkeit und der Differenzierbarkeit einer Funktion. 122 KAPITEL 6. DIFFERENTIALRECHNUNG (b) (a) (c) Abbildung 6.2: (a) Graph der Signum–Funktion. (b) Graph der Betragsfunktion. (c) p Graph der Funktion f : R → R, x 7→ sgn(x) |x|. Keine der drei Funktionen ist an der Stelle x0 = 0 differenzierbar. Lemma 6.2. Sei (W, k · k) ein normierter Raum über K, sei D ⊆ R eine nichtleere Menge, und sei f : D → W eine Funktion, die an einer Stelle x0 ∈ D◦ differenzierbar ist. Dann ist f an der Stelle x0 auch stetig. Laut Lemma 6.2 impliziert die Differenzierbarkeit einer Funktion an einer bestimmten Stelle ihres Definitionsbereichs auch die Stetigkeit der Funktion an dieser Stelle. Damit liefert das Lemma ein notwendiges Kriterium für die Differenzierbarkeit: Eine Funktion kann nur dann an einer gegebenen Stelle differenzierbar sein, wenn sie an dieser Stelle auch stetig ist. Dass Lemma 6.2 kein hinreichendes Kriterium für die Differenzierbarkeit einer Funktion liefert, wird anhand der nachfolgenden Beispiele deutlich. Beispiele. (a) Die Signum–Funktion sgn : R → R ist an jeder Stelle x0 ∈ R\{0} stetig und differenzierbar. An der Stelle x0 = 0 ist die Signum–Funktion jedoch nicht stetig, weshalb sie an dieser Stelle auch nicht differenzierbar sein kann (siehe auch Abbildung 6.2 (a)). (b) Die Betragsfunktion | · | : R → R ist an der Stelle x0 = 0 zwar stetig, aber nicht differenzierbar. Es gilt nämlich |0 + h| − |0| |h| −h = lim = lim = −1, h→0− h→0− h h→0− h h lim sowie |0 + h| − |0| |h| h = lim = lim = 1. h→0+ h→0+ h h→0+ h h lim Da sich der rechtsseitige und linksseitige Grenzwert unterscheiden, existiert der Grenzwert, der die Ableitung an der Stelle x0 = 0 definiert, nicht (siehe auch Abbildung 6.2 (b)). (c) Wir betrachten die Funktion f : R → R, welche durch f (x) := sgn(x)|x| für alle x ∈ R definiert ist. Die Funktion f ist an der Stelle x0 = 0 offenbar stetig, da p lim f (x) = lim sgn(x) |x| = 0 = f (0) x→0 x→0 6.1. DIFFERENZIERBARKEIT 123 gilt. Sie ist an der Stelle x0 = 0 jedoch nicht differenzierbar. Es gilt nämlich p p sgn(h) |h| sgn(h) |h| 1 f (0 + h) − f (0) = lim = lim = lim p = ∞. lim h→0 h→0 sgn(h)|h| h→0 h→0 h h |h| Der Differenzenquotient divergiert also bestimmt gegen ∞, wenn h gegen 0 strebt. Anschaulich gesprochen, wird der Graph der Funktion f an der Stelle x0 = 0 un” endlich steil“ (siehe auch Abbildung 6.2 (c)). ♦ Als nächstes kommen wir zu den bekannten Rechenregeln für differenzierbare Funktionen, welche in den nachfolgenden Sätzen zusammengefasst sind. Satz 6.3. Seien (W, k · k) ein normierter Raum über K, und sei D ⊆ R eine nichtleere Menge. Seien außerdem f : D → W , g : D → W und α : D → K Funktionen, die an einer Stelle x0 ∈ D◦ differenzierbar sind. Dann gelten die folgenden Aussagen. (1) Die Funktion f + g : D → W ist an der Stelle x0 differenzierbar, und es gilt (f + g)0 (x0 ) = f 0 (x0 ) + g 0 (x0 ). (2) Die Funktion αf : D → W ist an der Stelle x0 differenzierbar, und es gilt (αf )0 (x0 ) = α0 (x0 )f (x0 ) + α(x0 )f 0 (x0 ) Ist (W, k · k) eine normierte Algebra über K, so gilt außerdem (3) Die Funktion f g : D → W ist an der Stelle x0 differenzierbar, und es gilt (f g)0 (x0 ) = f 0 (x0 )g(x0 ) + f (x0 )g 0 (x0 ). Die Aussagen von Satz 6.3 sind auch als Summen- und Produktregeln der Differentialrechnung bekannt. Da für jede konstante Funktion α : D → K, x 7→ α0 stets α0 (x) = 0 für alle x ∈ D gilt, folgt aus der Aussage (2) auch die Regel des konstanten Faktors. Diese besagt folgendes: Ist f : D → W eine Funktion, welche an einer Stelle x0 ∈ D◦ differenzierbar ist, und ist α0 ∈ K eine Konstante, dann ist die Funktion α0 f : D → W ebenfalls an der Stelle x0 differenzierbar, und es gilt (α0 f )0 (x0 ) = α0 f 0 (x0 ). Den nachfolgenden Satz nennt man auch die Quotientenregel der Differentialrechnung. Satz 6.4. Sei D ⊆ R eine nichtleere Menge, und seien f : D → K und g : D → K \ {0} zwei Funktionen, welche an einer Stelle x0 ∈ D◦ differenzierbar sind. Dann ist die Funktion f :D→K g an der Stelle x0 ebenfalls differenzierbar, und es gilt 0 f f 0 (x0 )g(x0 ) − f (x0 )g 0 (x0 ) (x0 ) = 2 g g(x0 ) 124 KAPITEL 6. DIFFERENTIALRECHNUNG Die Liste der Rechenregeln für Ableitungen wird komplettiert durch die so genannte Kettenregel. Satz 6.5. Sei (W, k · k) ein normierter Raum über K, und seien C ⊆ R und D ⊆ R zwei nichtleere Mengen. Seien ferner f : D → W und g : C → D zwei Funktionen, so dass g an einer Stelle x0 ∈ C ◦ differenzierbar ist, und so dass f an der Stelle g(x0 ) differenzierbar ist. Dann ist die Funktion f ◦ g : C → W an der Stelle x0 ebenfalls differenzierbar, und es gilt (f ◦ g)0 (x0 ) = (f 0 ◦ g)(x0 )g 0 (x0 ). Mit Hilfe der Sätze 6.3, 6.4 und 6.5 kann man die Ableitungen zahlreicher Funktionen berechnen. Besonders wichtig ist dabei die Kettenregel, da sich viele Funktionen als Verkettung einfacherer Funktionen schreiben lassen, deren Ableitungen man kennt. Beispiele. (a) Wir betrachten die Funktion f : R → R, welche durch f (x) := x6 (7 + x + x2 )4 für alle x ∈ R definiert ist. Als Verknüpfung differenzierbarer Funktionen ist f differenzierbar. Durch Anwendung der Summen-, Produkt- und Kettenregel (Satz 6.3 und Satz 6.5) ergibt sich für die Ableitung f : R → R die Zuordnungsvorschrift f 0 (x) = 6x5 (7 + x + x2 )4 + 4x6 (7 + x + x2 )3 (1 + 2x) für alle x ∈ R. (b) Die Funktion g : R → R sei durch g(x) := x + x3 1 + x2 für alle x ∈ R definiert. Als Verknüpfung differenzierbarer Funktionen ist g differenzierbar. Zur Bestimmung der Ableitung g 0 : R → R verwendet man die Quotientenregel (Satz 6.3 und Satz 6.4) und erhält g 0 (x) = (1 + x3 )(1 + x2 ) − 2x(x + x3 ) (1 + x2 )2 für alle x ∈ R. ♦ Wir kommen nun noch zu einem wichtigen Satz, der es uns erlaubt, Ableitungen von solchen Funktionen zu bestimmen, die als Grenzfunktionen von Potenzreihen definiert sind. P n Satz 6.6. Sei ∞ n=0 an (x − x0 ) eine Potenzreihe auf R mit der Variable x, welche auf einer offenen Kugel Br (x0 ) gegen eine Grenzfunktion f : Br (x0 ) konvergiert. Dann ist f differenzierbar, und die Ableitung f 0 : Br (x0 ) → R ist durch 0 f (x) = n X n=1 für alle x ∈ Br (x0 ) gegeben. nan (x − x0 )n−1 6.1. DIFFERENZIERBARKEIT 125 Beispiele. (a) Wir betrachten die Exponentialfunktion exp : R → R, x 7→ ex . Diese ist bekanntlich die Grenzfunktion der Potenzreihe ∞ X xn n! n=0 =1+x+ x2 x3 + + ··· , 2! 3! welche auf ganz R konvergiert. Gemäß Satz 6.6 gilt exp0 (x) = ∞ ∞ ∞ X X xn−1 X xn−1 xn = = = exp(x) n n! (n − 1)! n! n=1 n=1 n=0 für alle x ∈ R. Die Ableitung der Exponentialfunktion ist also die Exponentialfunktion selbst. (b) Mit Hilfe von Satz 6.6 kann man ebenfalls zeigen, dass sin0 = cos und cos0 = − sin gilt. Bekanntlich ist der natürliche Logarithmus ln : (0, ∞) → R die Umkehrfunktion der Exponentialfunktion exp : R → R, d.h. es gilt x = exp(ln(x)) für alle x > 0. Diese Identität kann bei der Bestimmung gewisser Ableitungen hilfreich sein. Beispiele. (a) Sei f : (0, ∞) → R die identische Funktion auf (0, ∞), welche gemäß f (x) = x für alle x > 0 definiert ist. Die Ableitung f 0 : (0, ∞) → R dieser Funktion ist dann durch f 0 (x) = 1 für alle x > 0 definiert. Nun stellt man fest, dass auch f (x) = exp(ln(x)) für alle x > 0 gilt. Nach der Kettenregel muss also 1 = f 0 (x) = ln0 (x) exp(ln(x)) = ln0 (x)x für alle x > 0 gelten. Daraus folgt, dass ln0 (x) = 1/x für alle x > 0 gilt. (b) Für jede Zahl α ∈ R sei die Funktion fα : (0, ∞) → R durch fα (x) = xα für alle x > 0 definiert. Aufgrund der Identität x = exp(ln(x)) erhält man für die Funktion fα die Darstellung fα (x) = exp(α ln(x)). Die Kettenregel liefert entsprechend fα0 (x) = αx−1 exp(α ln(x)) = αx−1 xα = αxα−1 für alle x > 0. (c) Für jede reelle Zahl α > 0 sei die Funktion gα : R → R durch gα (x) = αx für alle x ∈ R definiert. Wegen α = exp(ln(α)) ist kann die Funktion gα auch durch gα (x) = exp(x ln(α)) dargestellt werden. Mit der Kettenregel ergibt sich somit g 0 (x) = ln(α) exp(x ln(α)) = ln(α)αx für alle x ∈ R. Übungsaufgaben 1. Berechnen Sie die Ableitungen der folgenden Funktionen: f1 : R → R, x 7→ 3x4 + 2x2 − 5x + 1, f2 : (−∞, 0) → R, x 7→ √ 1 − x, f5 : (0, π) → R, x 7→ cot(x) = cos(x) , sin(x) f6 : R → R → R, x 7→ 4x ln(x2 + 1), e3x f3 : (0, ∞) → R, x 7→ √ , x f7 : (0, ∞) → R, x 7→ xx , f4 : R → R, x 7→ sin(x) cos(2x), f8 : R \ Z → R, x 7→ x − bxc. 126 KAPITEL 6. DIFFERENTIALRECHNUNG 2. Berechnen Sie die Ableitungen der vektorwertigen Funktionen f : (0, 2π) → R2 , g : [0, 1] → R2 und h : R → R2 , welche durch √ te2t t cos(t) 4t √ f (t) = √ , g(t) = , h(t) = 1 − t2 1 + t2 t sin(t) definiert sind. 3. Bestimmen Sie die Menge aller Stellen, an denen die folgenden Funktionen differenzierbar sind: ( sin(x)/x falls x 6= 0, f1 : R → R, x 7→ 1 falls x = 0, ( (x − 1)2 falls x < 0, f2 : R → R, x 7→ (x + 1)2 falls x ≥ 0, ( √ sin( −x) falls x < 0, f3 : R → R, x 7→ √ − sin( x) falls x ≥ 0, ( (2x − 2)/(1 + x2 ) falls x < 1, f4 : R → R, x 7→ ln(x) falls x ≥ 1, 4. Weisen Sie mit Hilfe von Satz 6.6 die folgenden Identitäten nach: sin0 = cos, cos0 = − sin, sinh = cosh und cosh0 = sinh. 5. Weisen Sie mit Hilfe von Satz 6.6 nach, dass ln(x) = 1/x für alle x ∈ (0, 2) gilt. Verwenden Sie dazu die Potenzreihendarstellung des natürlichen Logarithmus zur Entwicklungsstelle 1 (siehe Beispiel (e) auf Seite 5). 6. Berechnen Sie die Ableitung der Funktion f : (0, 2) → R, welche durch f (x) = für alle x ∈ (0, 2) definiert ist. ∞ X (−1)n (x − 1)n 2−n n n=2 6.2. DER MITTELWERTSATZ 6.2 127 Der Mittelwertsatz In diesem Abschnitt kommen wir zu einem wichtigen Satz, der für alle differenzierbaren Funktionen gilt, die auf Teilmengen der reellen Zahlen definiert sind. Dieser Satz ist als Mittelwertsatz der Differentialrechnung oder einfach als Mittelwertsatz bekannt. Zunächst benötigen wir jedoch das folgende Lemma. Lemma 6.7. Sei D ⊆ R ein nichtleere Menge, und sei f : D → R eine differenzierbare Funktion, die an einer Stelle ξ ∈ D◦ ihr Minimum bzw. ihr Maximum annimmt. Dann gilt f 0 (ξ) = 0. Man beachte dass im Lemma 6.7 vorausgesetzt wird, dass ξ ein innerer Punkt der Definitionsmenge D von f ist. Wenn die Funktion f ihr Minimum bzw. ihr Maximum an einem Randpunkt ξ von D annimmt, dann gilt f 0 (ξ) = 0 im Allgemeinen nicht. Die Funktion f : [0, 1] → R, x 7→ x nimmt ihr Minimum beispielsweise an der Stelle x = 0 und ihr Maximum an der Stelle x = 1 an. Es gilt jedoch f 0 (0) = f 0 (1) = 1. Mit Lemma 6.7 und dem Satz von Minimum und Maximum (Satz 5.15) kann man den folgenden Satz beweisen, der als Satz von Rolle bekannt ist. Satz 6.8 (Satz von Rolle). Sei D ⊆ R eine nichtleere Menge, und sei f : D → R eine differenzierbare Funktion. Seien ferner a, b ∈ R zwei reelle Zahlen, so dass a < b, [a, b] ⊆ D und f (a) = f (b) gilt. Dann existiert eine Zahl ξ ∈ (a, b), so dass f 0 (ξ) = 0 gilt. Die Aussage des Satzes von Rolle kann folgendermaßen formuliert werden: Jede differenzierbare Funktion, die auf einem abgeschlossenen Intervall definiert ist, und die an den Intervallgrenzen dieselben Funktionswerte aufweist, besitzt mindestens eine stationäre Stelle im Innern des Intervalls. Ähnlich wie der Nullstellensatz von Bolzano (Satz 5.13) nur die Existenz von mindestens einer Nullstelle sichert, sichert der Satz von Rolle lediglich die Existenz von mindestens einer stationären Stelle. Darüber hinausgehende Informationen, etwa zur genauen Anzahl stationärer Stellen oder zu deren Lage, liefert der Satz von Rolle nicht. Dennoch ist er oft nützlich, weshalb er hier erwähnt wird. Außerdem folgt aus dem Satz von Rolle der Mittelwertsatz der Differentialrechnung. Satz 6.9 (Mittelwertsatz). Sei D ⊆ R eine nichtleere Menge, und sei f : D → R eine differenzierbare Funktion. Seien ferner a, b ∈ R zwei reelle Zahlen, so dass a < b und [a, b] ⊆ D gilt. Dann existiert eine Zahl ξ ∈ (a, b), so dass f (b) − f (a) = f 0 (ξ) b−a gilt. Der Mittelwertsatz bedeutet anschaulich folgendes: Ist die reellwertige Funktion f auf einem abgeschlossenen Intervall [a, b] definiert, dann existiert eine Stelle ξ ∈ (a, b) derart, dass die Tangente an den Graphen von f an der Stelle ξ dieselbe Steigung besitzt wie die Sekante an den Graphen von f an den Stellen a und b. Der Mittelwertsatz zählt neben dem Zwischenwertsatz und dem Satz vom Minimum und Maximum zu den bekanntesten und wichtigsten Sätzen der Analysis. Eine wichtige Folgerung aus dem Mittelwertsatz der Differentialrechnung ist die so genannte Regel von de l’Hôpital (alternative Schreibweise: Regel von de l’Hospital). 128 KAPITEL 6. DIFFERENTIALRECHNUNG (b) (a) Abbildung 6.3: (a) Veranschaulichung des Satzes von Rolle: Die Funktion f besitzt im Intervall (a, b) eine stationäre Stelle ξ. (b) Veranschaulichung des Mittelwertsatzes: Die Tangente an den Graphen von f an der Stelle ξ besitzt dieselbe Steigung wie die Sekante durch die Punkte (a, f (a)) und (b, f (b)). Satz 6.10 (Regel von de l’Hôpital). Sei D ⊆ R eine nichtleere Menge, und sei x0 ∈ D ein Punkt dieser Menge. Ferner seien f : D → R und g : D → R zwei Funktionen, für die entweder lim f (x) = lim g(x) = 0 x→x0 x→x0 oder lim |f (x)| = lim |g(x)| = ∞ x→x0 gilt. Dann gilt lim x→x0 x→x0 f 0 (x) f (x) = lim 0 , g(x) x→x0 g (x) wenn der Grenzwert auf der rechten Seite existiert. Wenn die Funktion f 0 /g 0 für x → x0 bestimmt divergiert, dann divergiert auch die Funktion f /g. Dieser Satz gilt auch, wenn man den Ausdruck x → x0 jeweils durch x → x0 +, x → x0 −, x → ∞ oder x → −∞ ersetzt. Die Regel von de l’Hôpital kann verwendet werden, um gewisse Funktionsgrenzwerte zu bestimmen. Man betrachte dazu die nachfolgenden Beispiele. Beispiele. (a) Bei der Bestimmung des Grenzwerts ex − e lim √ x→1 x−1 kann die Regel von de l’Hôpital angewendet werden, da sowohl der Zähler als auch der Nenner des Bruchs gegen Null konvergiert, wenn x gegen 1 strebt. Man erhält √ ex − e l’H ex lim √ = lim 1 −1/2 = lim 2 xex = 2e. x→1 x→1 x x→1 x−1 2 Mit l’H“ wird hierbei die Stelle angedeutet, an der die Regel von de l’Hôpital ver” wendet wird. (b) Auch der Grenzwert lim x ln(x) x→0+ 6.2. DER MITTELWERTSATZ 129 kann mit der Regel von de l’Hôpital bestimmt werden. Es gilt nämlich x ln(x) = ln(x) . x−1 Der Zähler des Bruchs auf der rechten Seite divergiert bestimmt gegen −∞, während der Nenner gegen ∞ bestimmt divergiert, wenn x von rechts gegen Null strebt. Man erhält daher ln(x) l’H x−1 = lim = lim −x = 0 x→0+ x−1 x→0+ −x−2 x→0+ lim x ln(x) = lim x→0+ als rechtsseitigen Grenzwert. (c) Manchmal muss die Regel von de l’Hôpital mehrfach angewendet werden, um den Grenzwert bestimmter Funktionen zu bestimmen. Man betrachte etwa den Grenzwert sin(x2 ) − x2 lim x→0 x3 Durch zweimaliges Anwenden der Regel von de l’Hôpital erhält man 2x cos(x2 ) − 2x 2 cos(x2 ) − 2 sin(x2 ) − x2 l’H = lim = lim x→0 x→0 x→0 x3 3x2 3x 2 −4x sin(x ) l’H = 0. = lim x→0 3 lim Dasselbe Ergebnis erhält man, wenn man die Funktion x 7→ sin(x2 ) als Potenzreihe darstellt. ♦ Die Regel von de l’Hôpital ist eine Rechenregel, mit der Funktionsgrenzwerte bestimmt werden können. Sie darf keinesfalls mit der Quotientenregel der Differentialrechnung verwechselt werden. Außerdem muss man bei der Bestimmung von Funktionsgrenzwerten immer genau nachprüfen, ob die Voraussetzungen für die Regel von de l’Hôpital erfüllt sind. Oft wird dies nicht beachtet. Man betrachte dazu das nachfolgende Beispiel Beispiel. Bei der Bestimmung des einseitigen Grenzwerts ln(x) x→0+ x lim kann die Regel von de l’Hôpital nicht angewendet werden. Der Zähler des Bruches konvergiert nämlich bestimmt gegen −∞, während der Nenner gegen Null konvergiert. Wendet man die Regel von de l’Hôpital dennoch an, erhält man das falsche Ergebnis, dass die Funktion gegen ∞ bestimmt divergiert. Tatsächlich divergiert die Funktion bestimmt gegen −∞. Dies erkennt man, wenn man den Ansatz x = 1/t mit t > 0 verwendet. Man erhält dann nämlich ln(x) ln(1/t) = lim = lim −t ln(t) = −∞. t→∞ 1/t t→∞ x→0+ x lim Hierbei wurde verwendet, dass ln(1/t) = ln(1) − ln(t) = − ln(t) für alle t > 0 gilt. ♦ 130 KAPITEL 6. DIFFERENTIALRECHNUNG Übungsaufgaben 1. Zeigen Sie: Eine differenzierbare Funktion f : R → R, die n ∈ N verschiedene Nullstellen besitzt, besitzt auch mindestens n − 1 verschiedene stationäre Stellen. 2. Berechnen Sie die folgenden Grenzwerte mit der Regel von de l’Hôpital: √ 2 ln(x) x2 − ex−1 x−1 , lim x ln(x) , lim x lim , lim √ . x→0+ x→1 x→1 x3 − 1 x→1+ e −e x−1 3. Zeigen Sie, dass xα − 1 α = x→1 xβ − 1 β lim für alle α ∈ R und alle β ∈ R \ {0} gilt. 4. Zeigen Sie, dass die Funktion f : R → R, welche durch ( x1/x falls x > 0, f (x) := 0 falls x ≤ 0 für alle x ∈ R definiert ist, an jeder Stelle ihres Definitionsbereichs stetig und differenzierbar ist. 6.3. STETIGE DIFFERENZIERBARKEIT 6.3 131 Stetige Differenzierbarkeit Im letzten Abschnitt wurde gezeigt, dass eine Funktion nur dann differenzierbar sein kann, wenn sie auch stetig ist. Es stellt sich nun die Frage, ob die Ableitung einer differenzierbaren Funktion selbst wieder eine stetige Funktion ist. Tatsächlich ist dies im Allgemeinen nicht der Fall. Daher führt man die Eigenschaft der Stetigen Differenzierbarkeit ein. Definition (stetig differenzierbare Funktion). Sei (W, k · k) ein normierter Raum, und sei D ⊆ R ein nichtleere, offene Menge. Eine Funktion f : D → W heißt stetig differenzierbar, wenn sie differenzierbar ist, und wenn ihre Ableitung f 0 : D → W stetig ist. Wie die nachfolgenden Beispiele zeigen, ist nicht jede differenzierbare Funktion auch stetig differenzierbar. Beispiele. (a) Die Funktion f : R → R sei durch ( −x2 f (x) := x3 falls x < 0, falls x ≥ 0 für alle x ∈ R definiert. Man kann sehr leicht zeigen, dass die Funktion f differenzierbar ist. Die Ableitung f 0 : R → R ist durch ( −2x falls x < 0, f (x) := 3x2 falls x ≥ 0 für alle x ∈ R gegeben. Wie man leicht nachweist, ist die Ableitung f 0 stetig. Die Funktion f ist also stetig differenzierbar. (b) Die Funktion g : R → R, welche durch ( x2 cos(1/x) falls x 6= 0, g(x) := 0 falls x = 0 für alle x ∈ R definiert ist, ist differenzierbar. Ihre Ableitung g 0 : R → R ist durch ( 2x cos(1/x) + sin(1/x) falls x 6= 0, g 0 (x) := 0 falls x = 0 für alle x ∈ R definiert. Da der Grenzwert der Ableitung g 0 in x0 = 0 jedoch nicht existiert, ist g 0 nicht stetig. Die Funktion g ist also differenzierbar, aber nicht stetig differenzierbar. ♦ Im folgenden nehmen wir an, dass D eine offene Teilmenge von R ist, und dass (W, k · k) ein normierter Raum ist. Wenn eine Funktion f : D → W stetig differenzierbar ist, und wenn die Ableitung f 0 : D → W sogar differenzierbar ist, dann kann man bekanntlich die so genannte zweite Ableitung f 00 : D → W von f bestimmen. An jeder Stelle x0 ∈ D ist die zweite Ableitung durch f 0 (x0 + h) − f 0 (x0 ) h→0 h f 00 (x0 ) := lim 132 KAPITEL 6. DIFFERENTIALRECHNUNG definiert. Für k ∈ N definiert man allgemein die k-te Ableitung f (k) : D → W einer Funktion f : D → W durch f (k−1) (x0 + h) − f (k−1) (x0 ) h→0 h f (k) (x0 ) := lim für alle x0 ∈ D, wobei man f (0) := f setzt. Man erhält die k-te Ableitung von f also, indem man jeweils die (k − 1)-te Ableitung von f erneut ableitet. Dies setzt natürlich voraus, dass die (k − 1)-te Ableitung eine differenzierbare Funktion ist. In diesem Fall nennt man f eine k-mal differenzierbare Funktion. Definition (k-mal differenzierbare Funktion). Sei (W, k · k) ein normierter Raum, sei D ⊆ R ein nichtleere, offene Menge, und sei k ∈ N eine natürliche Zahl. Eine Funktion f : D → W heißt k-mal differenzierbar, wenn die ersten k Ableitungen f 0 : D → W , f 00 : D → W , . . . , f (k) : D → W von f existieren. Die k-te Ableitung f (k) einer k-mal differenzierbaren Funktion f kann stetig sein oder auch nicht. Man kommt daher zu der folgenden Definition. Definition (k-mal stetig differenzierbare Funktion). Sei (W, k · k) ein normierter Raum, sei D ⊆ R ein nichtleere, offene Menge, und sei k ∈ N eine natürliche Zahl. Eine Funktion f : D → W heißt k-mal stetig differenzierbar, wenn sie k-mal differenzierbar ist, und wenn die k-te Ableitung von f stetig ist. Die Menge aller k-mal stetig differenzierbaren Funktionen von D nach W wird üblicherweise mit C k (D, W ) bezeichnet. Falls W = R gilt, bezeichnet man die Menge C k (D, W ) auch mit C k (D). Gemäß der obigen Definition besteht für jede natürliche Zahl k ∈ N die Menge C k (D, W ) aus allen Funktionen von D nach W , die k-mal stetig differenzierbar sind. Es sollte noch erwähnt werden, dass mit C 0 (D, W ) gelegentlich die Menge aller stetigen Funktionen von D nach W bezeichnet wird. Man macht sich leicht klar, dass C(D, W ) = C 0 (D, W ) ⊃ C 1 (D, W ) ⊃ C 2 (D, W ) ⊃ . . . gilt. Mit wachsendem k gibt es also immer weniger Funktionen, die Elemente der Menge C k (D, W ) sind. Sind f : D → W und g : D → W zwei Funktionen, für die eine natürliche Zahl m ∈ N existiert, so dass f ∈ C k+m (D, W ) und g ∈ C k (D, W ) \ C k+m (D, W ) gilt, so sagt man, dass f regulärer sei als g. Es stellt sich die Frage, ob es Funktionen gibt, die in allen Mengen C 0 (D, W ), C 1 (D, W ), C 2 (D, W ), . . . . Solche Funktionen gibt es in der Tat, und man nennt sie glatte Funktionen. Definition (glatte Funktion). Sei (W, k · k) ein normierter Raum, und sei D ⊆ R ein nichtleere, offene Menge. Eine Funktion f : D → W heißt glatt, wenn für jede natürliche Zahl k die k-te Ableitungen f (k) : D → W von f existieren, und wenn f (k) stetig ist. Die Menge aller glatten Funktionen von D nach W wird üblicherweise mit C ∞ (D, W ) bezeichnet. Falls W = R gilt, bezeichnet man die Menge C ∞ (D, W ) auch mit C ∞ (D). Ist D eine nichtleere, offene Teilmenge der reellen Zahlen und (W, k · k) ein normierter Raum, so ist die Menge aller glatten Funktionen von D nach W genau die Schnittmenge aller Mengen C k (D, W ) mit k ∈ N, d.h. es gilt ∞ C (D, W ) = ∞ \ C k (D, W ). k=1 Abschließend geben wir einige wichtige Beispiele für glatte Funktionen an. 6.3. STETIGE DIFFERENZIERBARKEIT 133 Beispiele. (a) Jedes Polynom vom Grad n ∈ N ist stetig und differenzierbar. Die Ableitung eines solchen Polynoms ist wieder ein Polynom vom Grad n − 1. Ferner ist die Ableitung eines Polynoms vom Grad Null ist immer die Nullfunktion, welche ebenfalls stetig und differenzierbar ist. Daher ist jedes Polynom eine glatte Funktion. (b) Die Exponentialfunktion exp : R → R, x 7→ ex ist stetig und differenzierbar. Die Ableitung der Exponentialfunktion ist die Exponentialfunktion selbst. Dementsprechend ist die Exponentialfunktion glatt. (c) Die Funktionen Sinus und Cosinus sind glatt. ♦ Übungsaufgaben 1. Bestimmen Sie die ersten drei Ableitungen der folgenden Funktionen: f1 : R → R, x 7→ x3 + 2x2 − 3x + 4, 2 f2 : R → R, x 7→ e−x , f3 : R → R, x 7→ sin(2πx), f4 : R → R, x 7→ x ln(x2 + 1). 2. Für jede natürliche Zahl n ∈ N sei die Funktion pn : R → R durch pn (x) := xn für alle n ∈ N definiert. Geben Sie allgemein die k-te Ableitung von pn für k ∈ {1, . . . , n} an. Wie lautet jeweils die (n + 1)-te Ableitung von pn ? 3. Zeigen Sie, dass die Funktion f : R → R, definiert durch ( x3 sin(1/x) falls x 6= 0, f (x) := 0 falls x = 0 für alle x ∈ R, stetig differenzierbar ist. 4. Zeigen Sie, dass die Funktion f : R → R, welche durch ( x3 sin(1/x2 ) falls x 6= 0, f (x) := 0 falls x = 0 für alle x ∈ R, differenzierbar, aber nicht stetig differenzierbar ist. 5. Für jede natürliche Zahl n ∈ N, sei die Funktion fn : R → R durch ( xn+1 falls x ≥ 0, fn (x) := 0 falls x < 0 für alle x ∈ R definiert. Zeigen Sie, dass f ∈ C n (R) \ C n+1 (R) für alle n ∈ N gilt. 134 6.4 KAPITEL 6. DIFFERENTIALRECHNUNG Der Satz von Taylor Funktionen von der Form f : D → R, wobei D eine nichtleere Teilmenge der reellen Zahlen ist, dienen oft zur Modellierung von physikalischen oder wirtschaftswissenschaftlichen Zusammenhängen. Da solche Zusammenhänge sehr komplex sein können, ist auch die Funktion f in der Regel nicht von einfacher Form, also insbesondere kein Polynom oder keine einfache Exponentialfunktion. Man ist daher oft bestrebt, eine komplizierte Funktion, zumindest in der Nähe einer bestimmten Stelle ihres Definitionsbereichs, durch ein Polynom anzunähern. Eine wichtige Rolle spielt dabei der so genannte Satz von Taylor, um den es in diesem Abschnitt gehen soll. Zunächst machen wir die folgende Beobachtung. P n Lemma 6.11. Sei ∞ n=0 an (x − x0 ) eine Potenzreihe auf R, die in einer offenen Kugel Br (x0 ) gegen eine Grenzfunktion f : Br (x0 ) → R konvergiert. Dann gilt f ∈ C ∞ (Br (x0 )), sowie ∞ X f (n) (x0 ) f (x) = (x − x0 )n n! n=0 für alle x ∈ Br (x0 ). Gemäß 6.11 sind alle Ableitungen f 0 , f 00 , f 000 , . . . der Grenzfunktion f einer PotenzPLemma ∞ reihe n=0 an (x − x0 )n an der Entwicklungsstelle x0 durch die Koeffizienten a1 , a2 , a3 , . . . der Potenzreihe bestimmt. Es gilt nämlich an = f (n) (x0 ) n! für alle n ∈ N0 . Hierbei bezeichnet f (n) die n-te Ableitung von f . Wie üblich definiert man f (0) := f . Es fällt auf, dass die Ausdrücke auf der rechten Seite des Gleichheitszeichens nicht nur für solche Funktionen f gebildet werden können, die Grenzfunktionen einen Potenzreihe sind. Tatsächlich können die Ausdrücke für alle glatten Funktionen f gebildet werden. Fasst man diese Ausdrücke dann als Koeffizienten einer Potenzreihe auf, so gelangt man zu den so genannten Taylor–Reihen. Definition (Taylor–Reihe). Sei D ⊆ R eine nichtleere, offene Menge, sei x0 ∈ D ein Punkt dieser Menge, und sei f ∈ C ∞ (D) eine glatte, reellwertige Funktion. Dann heißt die Potenzreihe ∞ X f (n) (x0 ) (x − x0 )n n! n=0 auf R mit der Variable x die Taylor–Reihe von f zur Entwicklungsstelle x0 . Eine Potenzreihe ist bekanntlich zunächst nichts anderes als eine Folge von Polynomen, den so genannten Partialpolynomen der Potenzreihe. Wir erinnernPuns, dass zu jeder Zahl n N ∈ N0 das N -te Partialpolynom fN : R → R einer Potenzreihe ∞ n=0 an (x − x0 ) auf R durch fN (x) = a0 + a1 (x − x0 ) + a2 (x − x0 )2 + · · · + aN (x − x0 )N für alle x ∈ R gegeben ist. Die Partialpolynome einer Taylor–Reihe bezeichnet man als Taylor–Polynome. Solche Taylor–Polynome können auch für nichtglatte Funktionen definiert werden. 6.4. DER SATZ VON TAYLOR 135 Definition (Taylor–Polynom). Sei D ⊆ R eine nichtleere Menge, sei x0 ∈ D◦ ein innerer Punkt dieser Menge, sei N ∈ N0 eine natürliche Zahl, und sei f : D → R eine N -mal differenzierbare Funktion. Dann heißt das Polynom TN,x0 : R → R, welches durch TN,x0 (x) := N X f (n) (x0 ) n=0 n! (x − x0 )n = f (x0 ) + f 0 (x0 )(x − x0 ) + f 00 (x0 ) f N (x0 ) (x − x0 )2 + · · · + (x − x0 )N 2! N! für alle x ∈ R definiert ist, das N -te Taylor–Polynom von f zur Entwicklungsstelle x0 . In den nachfolgenden Beispielen wird verdeutlicht, wie man Taylor–Polynome zu gegebenen Funktionen bestimmt. Beispiele. √ (a) Wir betrachten die Funktion f : (−1, ∞) → R, welche durch f (x) := 1 + x für alle x ∈ (−1, 1) definiert ist. Es soll das dritte Taylor–Polynom T3,0 : R → R von f zur Entwicklungsstelle x0 = 0 bestimmt werden. Für alle x ∈ R gilt T3,0 (x) = f (0) + f 0 (0)x + f 00 (0) 2 f 000 (0) 3 x + x . 2 3! Die ersten drei Ableitungen der Funktion f sind durch 1 , f 0 (x) = √ 2 x+1 1 f 00 (x) = − p , 4 (x + 1)3 3 f 000 (x) = p 8 (x + 1)5 für alle x ∈ (−1, 1) gegeben. Es gilt also f (0) = 1, f 0 (0) = 1/2, f 00 (0) = −1/4, sowie f 000 (0) = 3/8. Demzufolge erhält man T3,0 (x) = 1 + x x2 x3 − + 2 8 16 für alle x ∈ R. (b) Wir bestimmen das dritte Taylor–Polynom T3,1 : R → R des natürlichen Logarithmus ln : (0, ∞) → R zur Entwicklungsstelle x0 = 1. Dieses ist durch T3,1 (x) = ln(1) + ln0 (1)(x − 1) + ln00 (1) ln000 (1) (x − 1)2 + (x − 1)3 2 3! für alle x ∈ R gegeben. Offenbar gilt ln0 (x) = 1 , x ln00 (x) = − 1 , x2 ln000 (x) = 2 x3 für alle x ∈ (0, ∞), und so erhält man ln(1) = 0, ln0 (1) = 1, ln00 (1) = −1 und ln000 (1) = 2. Das Taylor–Polynom besitzt also die Darstellung T3,1 (x) = (x − 1) − für alle x ∈ R. (x − 1)2 (x − 1)3 + 2 3 136 KAPITEL 6. DIFFERENTIALRECHNUNG (c) Zu jeder Zahl N ∈ N0 soll das jeweilige N -te Taylor–Polynom der Exponentialfunktion exp : R → R, x 7→ ex zur Entwicklungsstelle x0 = 0 bestimmt werden. Zunächst erhält man, dass die N -te Ableitung der Exponentialfunktion wieder die Exponentialfunktion ist. Entsprechend gilt exp(n) (x0 ) = exp(0) = 1 für alle N ∈ N0 . Das N -te Taylor–Polynom TN,0 : R → R ist also durch TN,0 (x) = 1 + x + x2 xN + ··· + 2! N! P n gegeben. Offenbar ist TN,0 das N -te Partialpolynom der Potenzreihe ∞ n=0 x /n!, die ja bekanntlich auf ganz R punktweise gegen die Exponentialfunktion konvergiert. Wegen Lemma 6.11 war dies auch zu erwarten. ♦ Im Beispiel (c) wurde deutlich, dass die Taylor–Polynome der Exponentialfunktion zur P∞ n Entwicklungsstelle Null genau den Partialpolynomen der Potenzreihe x /n! entn=0 sprechen. Demzufolge entspricht auch die Taylor–Reihe der Exponentialfunktion zur Entwicklungsstelle Null genau dieser Potenzreihe. Das Beispiel verdeutlicht ein allgemeines Prinzip, das im nachfolgenden Lemma formuliert ist. P n Lemma 6.12. Sei ∞ n=0 an (x − x0 ) eine Potenzreihe auf R, die in einer offenen Kugel Br (x0 ) gegen eine Grenzfunktion f : Br (x0 ) → R konvergiert. Dann ist die Taylor–Reihe P a (x − x0 )n . von f zur Entwicklungsstelle x0 genau die Potenzreihe ∞ n n=0 Kennt man also die Potenzreihendarstellung einer Funktion f für eine bestimmte Entwicklungsstelle x0 , so kennt man laut Lemma 6.12 auch die Taylor–Reihe sowie sämtliche Taylor–Polynome von f zur Entwicklungsstelle x0 . Wir wissen nun, wie man Taylor–Polynome zu einer gegebenen Funktion f berechnet. Ist f die Grenzfunktion einer Potenzreihe auf R mit der Entwicklungsstelle x0 , so sind die Taylor–Polynome zur Entwicklungsstelle x0 genau die Partialpolynome der Potenzreihe. Mit wachsendem N approximiert das N -te Taylor–Polynom die Funktion f also immer besser. Es stellt sich nun die Frage, ob dies auch für die Taylor–Polynome von Funktionen gilt, die nicht als Grenzfunktionen von Potenzreihen dargestellt werden können. Eine Aussage dazu liefert der wichtige Satz von Taylor. Satz 6.13 (Taylor). Sei D ⊆ R eine nichtleere, offene Menge, sei x0 ∈ D ein Punkt dieser Menge, und sei r > 0 eine reelle Zahl, so dass Br (x0 ) ⊆ D gilt. Sei außerdem N ∈ N0 eine natürliche Zahl und f ∈ C N +1 (D) eine (N + 1)-mal stetig differenzierbare Funktion. Dann existiert für alle x ∈ Br (x0 ) eine Stelle ξ ∈ Br (x0 ), mit ( (x0 , x) falls x > x0 , ξ∈ (x, x0 ) falls x < x0 , so dass f (x) = TN,x0 (x) + f (N +1) (ξ) (x − x0 )N +1 (N + 1)! gilt. Hierbei bezeichnet TN,x0 das N -te Taylor–Polynom von f zur Entwicklungsstelle x0 . Die Bedeutung des Satzes von Taylor wird klar, wenn man sich vorstellt, dass man eine gegebene Funktion f ∈ C N +1 (D), wobei D eine offene Teilmenge von R ist, nahe einer Stelle x0 ∈ D durch das entsprechende Taylor–Polynom TN,x0 approximieren will. Die 6.4. DER SATZ VON TAYLOR 137 Abbildung 6.4: Graph der Funktion f : (−1, ∞) → R, x 7→ drei Taylor–Polynome T0,0 , T1,0 und T2,0 . √ 1 + x so wie der ersten Frage ist dann nämlich, wie gut diese Approximation ist. Wertet man nämlich anstatt der Funktion f das Taylor–Polynom TN,x0 an einer Stelle x aus, so erhält man einen Funktionswert TN,x0 (x), der sich in der Regel von Funktionswert f (x) unterscheidet. Der Approximationsfehler beträgt ist dabei durch |f (x) − TN,x0 (x)| gegeben. Der Satz von Taylor ermöglicht nun eine Abschätzung dieses Fehlers nach oben. Es gilt nämlich f (N +1) (ξ) f (x) − TN,x (x) = |x − x0 |N +1 0 (N + 1)! für eine Stelle ξ die zwischen x und der Entwicklungsstelle x0 liegt. Anhand dieser Darstellung des Approximationsfehlers erkennt man, dass der Funktionswert f (x) durch den Funktionswert TN,x0 (x) des Taylor–Polynoms umso besser approximiert wird, je größer N ist, je kleiner |f (N +1) (ξ)| ist, und je näher x an der Entwicklungsstelle x0 liegt. Oftmals kann der Ausdruck auf der rechten Seite des Gleichheitszeichens nach oben abgeschätzt werden, wodurch man eine obere Schranke für den Approximationsfehler erhält. Man betrachte dazu die nachfolgenden Beispiele. Beispiele. (a) In den Ingenieurswissenschaften wird häufig die Näherungsformel √ 1+x≈1+ x 2 verwendet. Betrachtet man noch einmal das Beispiel (a) auf Seite 135, so erkennt man, dass hier offenbar die Funktion f : (−1, ∞) → R, definiert durch f (x) := √ 1 + x für alle x > −1, durch das erste Taylor–Polynom T1,0 : R → R zur Entwicklungsstelle x0 = 0 approximiert wurde. Wie groß ist der maximale Approximationsfehler, wenn beispielsweise −0, 5 ≤ x ≤ 0, 5 gilt? Nach dem Satz von Taylor existiert für jedes x ∈ (−1, 1) eine Stelle ξ ∈ R, die zwischen x und x0 liegt, so dass 2 00 f (x) − T1,0 (x) = |f (ξ)| |x|2 = p |x| 2! 8 (ξ + 1)3 gilt. Der Ausdruck auf der rechten Seite wird also für x = ξ = −0, 5 maximal. Daher gilt 2 f (x) − T1,0 (x) ≤ p |−0, 5| ≈ 0, 0884 8 (−0, 5 + 1)3 für −0, 5 ≤ x ≤ 0, 5. Je nach Anwendung muss ein Ingenieur nun entscheiden, ob ein maximaler Approximationsfehler von 0, 0884 akzeptabel ist oder nicht. 138 KAPITEL 6. DIFFERENTIALRECHNUNG (b) Die Cosinusfunktion soll in der Nähe der Stelle x0 = 0 durch ihr zweites Taylor– Polynom T2,0 : R → R approximiert werden, welches durch T2,0 (x) = 1 − x2 2 für alle x ∈ R gegeben ist. Aus welcher Menge kann dann x gewählt werden, so dass der Approximationsfehler |cos(x) − T2,0 (x)| garantiert kleiner als eine vorgegebene Fehlerschranke ε > 0 ist? Nach dem Satz von Taylor existiert für jedes x ∈ R eine Zahl ξ zwischen 0 und x, so dass 000 cos(x) − T2,0 (x) = |cos (ξ)| |x|3 = |sin(ξ)| |x|3 3! 3! gilt. Eine Abschätzung der rechten Seite nach oben erhält man, wenn man die Un3 /6. gleichung |sin(ξ)| ≤ 1 verwendet. Es ergibt sich dann |cos(x) − T2,0 (x)| ≤ |x|√ Wenn der Approximationsfehler kleiner als ε bleiben soll, muss man also |x| ≤ 3 6ε wählen. Übungsaufgaben 1. Bestimmen Sie die jeweils das dritte Taylor–Polynom zur Entwicklungsstelle x0 = 0 der folgenden Funktionen: f1 : R → R, x 7→ 2x , f2 : (−1, 1) → R, x 7→ 1/(1 − x), f3 : (−1, 1) → R, x 7→ 1/(1 − x)2 , f4 : R → R, x 7→ xex . Bestimmen Sie außerdem das dritte Taylor–Polynom der Tangensfunktion zur Entwicklungsstelle x0 = 0. 2. Bestimmen Sie die ersten drei Taylor–Polynome zur Entwicklungsstelle x0 = 0 der Funktion f : R → R, welche durch f (x) = 3x2 − x + 4 für alle x ∈ R gegeben ist. Was fällt Ihnen auf? Wie lautet die Taylor–Reihe der Funktion f zur Entwicklungsstelle x0 = 0? 3. Geben Sie die sechs Taylor–Polynome der Sinusfunktion zur Entwicklungsstelle x0 = 0 an. Wie lautet die Taylor–Reihe der Sinusfunktion zur Entwicklungsstelle x0 = 0? 4. Zeigen Sie mit Hilfe des Satzes von Taylor, dass lim h→0+ f (x − h) − 2f (x) + f (x + h) = f 00 (x) h2 für jede Funktion f ∈ C 3 (R) und jede Stelle x ∈ R gilt. 5. Zur Herleitung der Schwingungsgleichung für ein idealisiertes Pendel verwendet man die Näherungsformel sin(x) ≈ x. Geben Sie eine obere Schranke für den Approximationsfehler an, wenn −1 ≤ x ≤ 1 gilt? Wie groß darf |x| maximal werden, wenn der Approximationsfehler garantiert durch 10−1 nach oben beschränkt sein soll? 6.5. PARTIELLE DIFFERENZIERBARKEIT 6.5 139 Partielle Differenzierbarkeit Bisher haben wir Ableitung von Funktionen betrachtet, die auf Teilmengen von R definiert waren. In diesem Abschnitt wenden wir uns Funktionen zu, die auf Teilmengen von Rn mit n ∈ N definiert sind. Für solche Funktionen führen wir zunächst das Konzept der partiellen Differenzierbarkeit ein. Definition (partiell differenzierbare Funktion, partielle Ableitung). Seien n ∈ N und k ∈ {1, 2, . . . , n} zwei natürliche Zahlen. Sei ferner D ⊆ Rn eine nichtleere Menge, sei x(0) ∈ D◦ ein innerer Punkt dieser Menge, und sei (W, k · k) ein normierter Raum über K. Eine Funktion f : D → W heißt nach der k-ten Koordinate partiell differenzierbar an der Stelle x(0) , wenn der Grenzwert f x(0) + he(k) − f x(0) (0) ∂k f x := lim h→0 h existiert. Hierbei bezeichnet e(k) den k-ten Vektor der Standardbasis des Rn . Die Zahl ∂k f (x) heißt dann die partielle Ableitung von f nach der k-ten Koordinate an der Stelle x(0) . Die Funktion f wird partiell differenzierbar an der Stelle x(0) genannt, wenn alle partiellen Ableitungen ∂1 f (x(0) ), ∂2 f (x(0) ), . . . , ∂n f (x(0) ) von f an der Stelle x(0) existieren. Die Funktion wird schließlich partiell differenzierbar genannt, wenn alle partiellen Ableitungen von f an jeder Stelle x(0) ∈ D existieren. In diesem Fall definiert man für jede Zahl k ∈ {1, 2, . . . , n} die Funktion ∂k f : D◦ → W, x 7→ ∂k f (x), welche die partielle Ableitung von f nach der k-ten Koordinate genannt wird. Wir wollen einige der soeben eingeführten Begriffe anhand eines einfachen Beispiels erläutern. Beispiel. Die Funktion f : R2 → R sei durch f (x) = x21 + x1 x2 + 3x2 für alle Vektoren x = (x1 , x2 )T ∈ R2 definiert. An der Stelle x(0) = (0, 0)T gilt dann f x(0) + he(1) − f x(0) f (0, 0)T + h(1, 0)T − f (0, 0)T (0) ∂1 f (x ) = lim = lim h→0 h→0 h h T T 2 f (h, 0) − f (0, 0) h = lim = lim = lim h h→0 h→0 h h→0 h = 0. Die Funktion f ist also an der Stelle x(0) = (0, 0)T nach der ersten Koordinate partiell differenzierbar. Die partielle Ableitung von f nach der ersten Koordinate an der Stelle x(0) = (0, 0)T ist Null. Es gilt außerdem f x(0) + he(2) − f x(0) f (0, h)T − f (0, 0)T (0) ∂2 f (x ) = lim = lim h→0 h→0 h h = 3. Also ist die Funktion f an der Stelle x(0) = (0, 0)T auch nach der zweiten Koordinate partiell differenzierbar, und die partielle Ableitung nach der zweiten Koordinate an dieser Stelle beträgt 3. Da die partiellen Ableitungen nach beiden Koordinaten existieren, ist f an der Stelle x(0) = (0, 0)T partiell differenzierbar. ♦ 140 KAPITEL 6. DIFFERENTIALRECHNUNG Als nächstes wenden wir uns der Frage zu, wie man partielle Ableitungen einer Funktion berechnen kann. Das folgende Lemma liefert dazu die Grundlage. Lemma 6.14. Seien n ∈ N und k ∈ {1, 2, . . . , n} zwei natürliche Zahlen. Sei ferner (0) (0) (0) T D ⊆ Rn eine nichtleere Menge, sei x(0) = x1 , x2 , . . . , xn ∈ D◦ ein innerer Punkt dieser Menge, und sei (W, k · k) ein normierter Raum über K. Weiterhin sei r > 0 eine (0) (0) positive Zahl derart, dass Br (x(0) ) ⊆ D gilt, und I := (xk − r, xk + r) ein offenes Intervall. Sei außerdem f : D → W eine Funktion, welche an der Stelle x(0) nach der k-ten Koordinate partiell differenzierbar ist, und sei g : I → W diejenige Funktion, welche durch T (0) (0) (0) g(z) := f x1 , . . . , xk−1 , z, xk−1 , . . . , x(0) n (0) für alle z ∈ I definiert ist. Dann gilt ∂k f x(0) = g 0 xk . Man mache sich folgendes klar: Die Funktion g in Lemma 6.14 gibt die Abhängigkeit der Funktion f bezüglich der k-ten Komponente der vektorwertigen Variable in der Nähe der Stelle x(0) wieder. Die partielle Ableitung von f nach der k-ten Koordinate an der Stelle x(0) ist dann genau durch die Ableitung von g an der entsprechenden Stelle gegeben. Das Lemma 6.14 stellt also einen Zusammenhang zwischen den partiellen Ableitungen einer Funktion mit vektorwertiger Variable und der gewöhnlichen Ableitung von Funktionen mit reellwertiger Variable her. Hinsichtlich der Berechnung von partiellen Ableitungen besagt das Lemma 6.14 folgendes: Ist eine Funktion f gegeben, welche von den Komponenten x1 , x2 , . . . , xn eines Vektors x ∈ Rn abhängt, so berechnet man zu gegebenem k ∈ {1, 2, . . . , n} die partielle Ableitung nach der k-Koordinate ∂k f , indem man die Funktion f nach xk ableitet. Man betrachtet also lediglich die Komponente xk als Variable und alle übrigen Komponenten x1 , . . . , xk−1 , xk+1 , . . . , xn als Konstanten. Bei der Bestimmung der partiellen Ableitung ∂k f spielen also nur solche Terme eine Rolle, die von der Vektorkomponente xk abhängen. Dabei gelten wieder alle bekannten Ableitungsregeln. Beispiele. (a) Die Funktion f : R2 → R sei durch f (x) := 3 sin(x1 ) sin(x2 ) + x1 + 2x2 für alle Vektoren x = (x1 , x2 )T ∈ R2 definiert. Die Funktion f ist partiell differenzierbar. Ihre partiellen Ableitungen ∂1 f : R2 → R und ∂2 f : R2 → R sind durch ∂1 f (x) = 3 cos(x1 ) sin(x2 ) + 1, ∂2 f (x) = 3 sin(x1 ) cos(x2 ) + 2 für alle x = (x1 , x2 )T ∈ R2 gegeben. Man erhält die partielle Ableitung ∂1 f , indem man f nach der Variable x1 ableitet. In gleicher Weise erhält man die partielle Ableitung ∂2 f , indem man f nach der Variable x2 ableitet. (b) Die Funktion g : R3 → R sei durch g(x) := x1 x2 + x2 x3 + x3 x1 für alle Vektoren x = (x1 , x2 , x3 )T ∈ R3 definiert. Die partiellen Ableitungen von f sind dann durch ∂1 g(x) = x2 + x3 , ∂2 g(x) = x1 + x3 , ∂3 g(x) = x2 + x1 für alle x = (x1 , x2 , x3 )T ∈ R3 gegeben. ♦ 6.5. PARTIELLE DIFFERENZIERBARKEIT 141 Der Begriff der partiellen Ableitung wird auch auf Funktionen übertragen, welche von mehreren reellwertigen Variablen abhängen. Sind beispielsweise X ⊆ R und Y ⊆ R zwei nichtleere Mengen, ist (W, k · k) ein normierter Raum über K, und ist f : X × Y → W eine Funktion, deren Variablen mit x und y bezeichnet werden, so definiert man zu je zwei vorgegebenen Punkten x0 ∈ X ◦ und y0 ∈ Y die so genannte partielle Ableitung von f nach x an der Stelle x = x0 und y = y0 durch ∂f f (x0 + h, y0 ) − f (x0 , y0 ) (x0 , y0 ) := lim . h→0 ∂x h In gleicher Weise definiert man zu je zwei vorgegebenen Punkten x0 ∈ X und y0 ∈ Y ◦ man die so genannte partielle Ableitung von f nach y an der Stelle x = x0 und y = y0 durch f (x0 , y0 + h) − f (x0 , y0 ) ∂f (x0 , y0 ) := lim . h→0 ∂y h Man erkennt, dass die partielle Ableitung von f nach x an der Stelle x = x0 und y = y0 ähnlich definiert ist, wie die Ableitung einer Funktion, die nur von einer reellwertigen Variable abhängt. Dasselbe gilt für die partielle Ableitung von f nach y an der Stelle x = x0 und y = y0 . Wenn die partiellen Ableitungen von f nach x bzw. nach y an jeder möglichen Stelle existieren, so definiert man die Funktionen ∂f : X ◦ × Y → W, (x, y) 7→ ∂x ∂f : X × Y ◦ → W, (x, y) 7→ ∂y ∂f (x, y), ∂x ∂f (x, y), ∂y welche die partiellen Ableitungen von f nach x bzw. nach y genannt werden. Partielle Ableitungen nach den Variablen einer Funktion tauchen oft in der Physik und in den Ingenieurswissenschaften auf. Die Variablen einer Funktion stellen dabei häufig bestimmte physikalische Größen dar. Leitet man eine Funktion partiell nach einer bestimmten Variable ab, so erhält Informationen über das Änderungsverhalten der Funktion bezüglich der jeweiligen physikalischen Größe. Von besonderer Wichtigkeit ist oft die partielle Ableitung einer Funktion f nach einer Zeitvariable, welche oft mit t bezeichnet wird. Eine solche partiellen Ableitungen nach der Zeit“ wird oft mit f˙ bezeichnet. Man betrachte ” dazu die nachfolgenden Beispiele. Beispiele. (a) Die Funktion f : R × R × R → R sei durch f (x, y, z) := x2 y + sin(x + πz) für alle x ∈ R, alle y ∈ R und alle z ∈ R definiert. Die partiellen Ableitungen ∂f /∂x, ∂f /∂y und ∂f /∂z von f sind dann durch ∂f (x, y, z) = 2xy + cos(x + πz), ∂x ∂f (x, y, z) = x2 , ∂y ∂f (x, y, z) = π cos(x + πz) ∂z für alle x ∈ R, alle y ∈ R und alle z ∈ R gegeben sind. (b) Die kinetische Energie T eines Körpers mit der Masse m und der konstanten Geschwindigkeit v ist durch 1 T = mv 2 2 142 KAPITEL 6. DIFFERENTIALRECHNUNG gegeben. Die kinetische Energie kann also als eine Funktion T : [0, ∞) × [0, ∞) → R betrachtet werden, welche durch T (m, v) := mv 2 /2 für alle m ≥ 0 und alle v ≥ 0 definiert ist. Die Änderungsraten der kinetischen Energie bezüglich der Masse m bzw. bezüglich der Geschwindigkeit v werden durch die partiellen Ableitungen von T nach m bzw. nach v beschrieben. Die partiellen Ableitungen ∂T /∂m : [0, ∞) × [0, ∞) → R und ∂T /∂v : [0, ∞) × [0, ∞) → R sind dabei durch ∂T /∂m (m, v) = v 2 /2 und ∂T /∂v (m, v) = mv für alle m ≥ 0 und alle v ≥ 0 gegeben. Oftmals werden lediglich die Formeln ∂T v2 = , ∂m 2 ∂T = mv ∂v für die Änderungsraten angegeben. (c) Ein Körper, der sich während einer Zeitspanne t mit einer konstanten Geschwindigkeit v fortbewegt, legt die Strecke s = vt zurück. Die zeitliche Änderungsrate der Strecke ist durch die partielle Ableitung ṡ = v, also durch die Geschwindigkeit gegeben. ♦ Wie man leicht erkennt, sind die partiellen Ableitungen in den zuvor genannten Beispielen allesamt stetige Funktionen. Im Allgemeinen kann man jedoch nicht erwarten, die eine partielle Ableitung einer Funktion stetig ist. Man führt daher, ähnlich wie bei den gewöhnlichen Ableitungen, den Begriff der stetigen partiellen Differenzierbarkeit ein. Definition (stetig partiell differenzierbare Funktion). Sei n ∈ N eine natürliche Zahl, sei D ⊆ Rn eine nichtleere, offene Menge, sei x(0) ∈ D◦ ein Punkt dieser Menge, und sei (W, k · k) ein normierter Raum über K. Eine Funktion f : D → W heißt stetig partiell differenzierbar, wenn sie partiell differenzierbar ist, und wenn die partiellen Ableitungen ∂1 f, ∂2 f, . . . , ∂n f stetige Funktionen sind. Ähnlich wie man höhere Ableitungen f 00 , f 000 , . . . einer Funktion f bilden kann, die auf einer Teilmenge von R definiert ist, kann man unter gewissen Voraussetzungen auch partielle Ableitungen höherer Ordnung von Funktion bilden, die auf Teilmengen des Rn mit n ∈ N definiert sind. Sei n ∈ N eine natürliche Zahl, (W, k · k) ein normierter Raum und f : D → W eine partiell differenzierbare Funktion, wobei D eine nichtleere, offene Teilmenge des Rn ist. Dann nennt man ∂1 f, ∂2 f, . . . , ∂n f die partiellen Ableitungen der Ordnung 1 von f . Eine partielle Ableitung der Ordnung 2 von f erhält man, indem man eine partielle Ableitung der Ordnung 1 erneut partiell ableitet. Die so entstehenden partiellen Ableitungen ∂1 ∂1 f, ∂2 ∂1 f, . . . , ∂n ∂1 f, ∂1 ∂2 f, ∂2 ∂2 f, . . . , ∂n ∂2 f, ∂1 ∂n f, ∂2 ∂n f, . . . , ∂n ∂n f sind an jeder Stelle x(0) ∈ D durch ∂l f x(0) + he(k) − ∂l f x(0) (0) ∂k ∂l f x := lim , h→0 h also durch ∂k ∂l f x(0) := ∂k (∂l f ) x(0) für alle k, l ∈ {1, 2, . . . , n} definiert. Dies setzt natürlich voraus, dass die partielle Ableitung ∂l f an der Stelle x(0) nach der k-ten Koordinate partiell differenzierbar ist. Allgemein erhält man eine partielle Ableitung der Ordnung k einer Funktion f , indem man eine partielle Ableitung der Ordnung k−1 von f erneut partiell ableitet. Hierbei ist k ∈ N eine natürliche Zahl mit n ≥ 2. Man überlegt sich leicht, dass es zu einer Funktion, die auf einer Teilmenge des Rn definiert ist, maximal nk partielle Ableitungen der Ordnung k gibt. Dies setzt jedoch voraus, dass alle Ableitungen der Ordnungen k −1 partiell differenzierbar sind. Man spricht in diesem Fall von einer k-mal partiell differenzierbaren Funktion. 6.5. PARTIELLE DIFFERENZIERBARKEIT 143 Definition (k-mal partiell differenzierbare Funktion). Seien n ∈ N und k ∈ N zwei natürliche Zahlen. Sei außerdem D ⊆ Rn eine nichtleere, offene Menge und (W, k · k) ein normierter Raum. Eine Funktion f : D → W heißt k-mal partiell differenzierbar, wenn alle partiellen Ableitungen der Ordnung k von f existieren. Die partiellen Ableitungen der Ordnung k einer k-mal partiell differenzierbaren Funktion f können stetig sein oder auch nicht. Falls alle partiellen Ableitungen stetige Funktionen sind, so nennt man f eine k-mal stetig partiell differenzierbare Funktion. Definition (k-mal stetig partiell differenzierbare Funktion). Seien n ∈ N und k ∈ N zwei natürliche Zahlen. Sei außerdem D ⊆ Rn eine nichtleere, offene Menge und (W, k · k) ein normierter Raum. Eine Funktion f : D → W heißt k-mal stetig partiell differenzierbar, wenn sie k-mal partiell differenzierbar ist, und wenn alle partiellen Ableitungen der Ordnung k von f stetig sind. Die Menge alle k-mal stetig partiell differenzierbaren Funktionen von D nach W wird mit C k (D, W ) bezeichnet. Falls W = R gilt, bezeichnet man die Menge C k (D, W ) auch mit C k (D). In den nachfolgenden Beispielen werden partielle Ableitungen höherer Ordnung von zwei Funktionen bestimmt. Dabei werden die folgenden Konventionen verwendet: Um anzudeuten, dass eine Funktion p-mal nach der k-ten Koordinate partiell abgeleitet wurde, verwendet man das Symbol ∂km . Es ist gilt also ∂km f := ∂k · · · ∂k f | {z } p-mal für jede Funktion f . Die partielle Ableitung, die durch p-maliges partielles Ableiten einer Funktion f nach einer Variable x entsteht, wird mit ∂ p f /∂xp bezeichnet, d.h. ∂pf ∂ ∂ f := ··· p ∂x |∂x {z ∂x} p-mal Ferner bezeichnet man die partielle Ableitung, welche durch q-maliges partielles Ableiten einer Funktion f nach einer Variable y und anschließendes p-maliges partielles Ableiten von f nach einer zweiten Variable x entsteht, mit ∂ p+q f /(∂xp ∂y q ), also ∂ p+q f ∂ ∂ ∂ ∂ := ··· ··· f. ∂xp ∂y q ∂x ∂x ∂y ∂y | {z } | {z } p-mal q-mal Man beachte, dass bei einer solchen Ableitung zuerst nach y und dann nach x partiell abgeleitet wird. Beispiele. (a) Die Funktion f : R2 → R sei durch f (x) := x31 x2 − x1 x42 für alle x ∈ R2 definiert. Die beiden partiellen Ableitungen der Ordnung 1 von f sind durch ∂1 f (x) = 3x21 x2 − x42 , ∂2 f (x) = x31 − 4x1 x32 144 KAPITEL 6. DIFFERENTIALRECHNUNG für alle x ∈ R2 gegeben. Die vier partiellen Ableitungen der Ordnung 2 von f sind durch ∂12 f (x) = 6x1 x2 , ∂2 ∂1 f (x) = 3x21 − 4x32 , ∂1 ∂2 f (x) = 3x21 − 4x32 ∂22 f (x) = −12x1 x22 für alle x ∈ R2 gegeben. Die acht partiellen Ableitungen der Ordnung 3 von f sind schließlich durch ∂13 f (x) = 6x2 , ∂12 ∂2 f (x) = 6x1 , ∂2 ∂12 f (x) = 6x1 , ∂2 ∂1 ∂2 f (x) = −12x22 , ∂1 ∂2 ∂1 f (x) = 6x1 , ∂1 ∂22 f (x) = −12x22 , ∂22 ∂1 f (x) = −12x22 , ∂23 f (x) = −24x1 x2 für alle x ∈ R2 gegeben. Da alle partiellen Ableitungen bis zur Ordnung 3 stetige Funktionen sind, ist f mindestens dreimal stetig partiell differenzierbar. (b) Es sei z : [0, 1] × [0, 2π) → R die Funktion, die durch z(r, ϕ) := sin(πr) cos(4ϕ) für alle r ∈ [0, 1] und alle ϕ ∈ [0, 2π) definiert ist. Die beiden partiellen Ableitungen der Ordnung 1 von z sind dann durch ∂z (r, ϕ) = π cos(πr) cos(4ϕ), ∂r ∂z (r, ϕ) = −4 sin(πr) sin(4ϕ) ∂ϕ für alle r ∈ [0, 1] und alle ϕ ∈ [0, 2π) gegeben. Die partiellen Ableitungen der Ordnung 2 sind durch ∂2z (r, ϕ) = −π 2 sin(πr) cos(4ϕ), ∂r2 ∂2z (r, ϕ) = −4π cos(πr) sin(4ϕ) ∂ϕ∂r ∂2z (r, ϕ) = −4π cos(πr) sin(4ϕ), ∂r∂ϕ ∂2z (r, ϕ) = −16 sin(πr) cos(4ϕ) ∂ϕ2 für alle für alle r ∈ [0, 1] und alle ϕ ∈ [0, 2π) gegeben. Da alle partiellen Ableitungen bis zur Ordnung 2 stetige Funktionen sind, ist g mindestens zweimal stetig partiell differenzierbar. ♦ In den zuvor genannten Beispielen fällt auf, dass einige partielle Ableitungen höherer Ordnung identisch sind. So gilt in Beispiel (a) etwa ∂1 ∂2 f = ∂2 ∂1 f , wie auch ∂1 ∂22 f = ∂2 ∂1 ∂2 f = ∂22 ∂1 f und ∂2 ∂12 f = ∂1 ∂2 ∂1 f = ∂12 ∂2 f . Im Beispiel (b) erkennt man, dass ∂ 2 g/(∂r∂ϕ) = ∂ 2 g/(∂ϕ∂r) gilt. Dies ist kein Zufall. Vielmehr steckt dahinter ein allgemeines Prinzip, welches durch den Satz von Schwarz formuliert wird. 6.5. PARTIELLE DIFFERENZIERBARKEIT 145 Satz 6.15 (Schwarz). Sei n ∈ N eine natürliche Zahl, sei D ⊆ Rn eine nichtleere, offene Menge, sei (W, k · k) ein normierter Raum, und sei f ∈ C 2 (D, W ) eine zweimal stetig partiell differenzierbare Funktion. Dann gilt ∂k ∂l f = ∂l ∂k f für alle k, l ∈ {1, 2, . . . , n}. Umgangssprachlich kann die Aussage des Satzes von Schwarz folgendermaßen wieder gegeben werden: Ist eine Funktion zweimal stetig partiell differenzierbar, so spielt es bei der Bestimmung einer Ableitung der Ordnung 2 keine Rolle, in welcher Reihenfolge die partiellen Ableitungen nach den jeweiligen Koordinate gebildet werden. Man überlegt sich leicht, dass diese Aussage verallgemeinert werden kann. Für eine dreimal stetig partiell differenzierbare Funktion f , die auf einer Teilmenge des Rn definiert ist, gilt also ∂k ∂l ∂m f = ∂k ∂m ∂l f = ∂m ∂l ∂k f = ∂l ∂k ∂m f = ∂l ∂m ∂k f = ∂m ∂k ∂l f für alle k, l, m ∈ {1, 2, . . . , m}. Mit dem Satz von Schwarz kann man sich beim Berechnen von partiellen Ableitungen höherer Ordnung ein gewisses Maß an Arbeit ersparen. Hat man nämlich beispielsweise von einer zweimal stetig partiell differenzierbaren Funktion f die partielle Ableitung ∂1 ∂2 f berechnet, so muss man die partielle Ableitung ∂2 ∂1 f nicht gesondert berechnen. Nach dem Satz von Schwarz gilt nämlich ∂1 ∂2 f = ∂2 ∂1 f . Wir wollen dies noch anhand eines abschließenden Beispiels verdeutlichen. Beispiel. Die Funktion f : R × R × R → R sei durch f (x, y, z) := xy 3 − y 2 z 4 + x2 z für alle x ∈ R, alle y ∈ R und alle z ∈ R definiert. Diese Funktion ist beliebig oft stetig partiell differenzierbar. Sie besitzt genau 9 (= 32 ) partielle Ableitungen der Ordnung 2. Die partiellen Ableitungen nach nur einer Variable sind dabei durch ∂2f (x, y, z) = 2z, ∂x2 ∂2f (x, y, z) = 6xy − 2z 4 , ∂y 2 ∂2f (x, y, z) = −12y 2 z 2 ∂z 2 für alle x ∈ R, alle y ∈ R und alle z ∈ R gegeben. Von den gemischten partiellen Ableitungen müssen nur genau drei explizit berechnet werden. Nach dem Satz von Schwarz gilt nämlich ∂2f (x, y, z) = ∂x∂y ∂2f (x, y, z) = ∂x∂z ∂2f (x, y, z) = ∂y∂z ∂2f (x, y, z) = 3y 2 , ∂y∂x ∂2f (x, y, z) = 2x, ∂z∂x ∂2f (x, y, z) = −8yz 3 ∂z∂y für alle x ∈ R, alle y ∈ R und alle z ∈ R Übungsaufgaben 1. Berechnen Sie alle partiellen Ableitungen der Ordnung 1 der folgenden Funktionen: f1 : R2 → R, x 7→ x31 x2 + ex1 −3x3 , q f2 : R3 → R, x 7→ x41 + x43 + x1 x2 sin(2πx3 ), ♦ 146 KAPITEL 6. DIFFERENTIALRECHNUNG f3 : R × R → R, (x, y) 7→ ex−y + ln(1 + y 2 ), f4 : R × R × R → R, (x, y, z) 7→ z/(1 + x2 + y 2 ). 2. Geben Sie alle partiellen Ableitungen der Ordnung 2 der folgenden Funktionen an: f : R3 → R, x 7→ x41 x32 − 2x21 x2 + x1 x32 , g : R × [0, 2π) × [0, π) → R, (r, ϕ, θ) 7→ e−r sin(ϕ)(π 2 − θ2 ). 3. Für jede natürliche Zahl n ∈ N ist die Funktion fn : Rn \ {0} → R, welche durch fn (x) := |x| für alle Vektoren x ∈ Rn definiert ist, partiell differenzierbar. Hierbei bezeichnet |x| die euklidische Norm des Vektors x. Bestimmen Sie ∂k fn für alle k ∈ {1, 2, . . . , n}. 4. Für die Wirkleistung P , die Stromstärke I und den Widerstand R an einem elektrischen Verbraucher gilt die Formel P = RI 2 . Bestimmen Sie für jede der drei Größen P , I und R die Änderungsraten bezüglich der jeweiligen anderen Größen. 6.6. GRADIENT UND HESSE–MATRIX 6.6 147 Gradient und Hesse–Matrix Definition (Gradient). Sei n ∈ N eine natürliche Zahl, sei D ⊆ Rn eine nichtleere Menge, und sei x(0) ∈ D◦ ein innerer Punkt dieser Menge. Sei außerdem f : D →R eine an der Stelle x(0) partiell differenzierbare Funktion. Dann heißt der Vektor ∇f x(0) ∈ Rn , welcher durch ∂1 f x(0) ∂2 f x(0) ∇f x(0) := .. . ∂n f x(0) definiert ist, der Gradient von f an der Stelle x(0) . Ist f partiell differenzierbar, so definiert man die Funktion ∇f : D◦ → Rn , x 7→ ∇f (x), welche der Gradient oder das Gradientenfeld von f genannt wird. Offenbar ist der Gradient einer Funktion f an einer Stelle x(0) derjenige Vektor, dessen Komponenten genau den partiellen Ableitungen der Ordnung 1 von f an der Stelle x(0) entsprechen. Das Gradientenfeld von f ist eine Vektorwertige Funktion. Das Symbol ∇ wird übrigens Nabla genannt. Der Gradient wird auch für solche Funktionen definiert, die von mehreren reellwertigen Variablen abhängen. Seien beispielsweise X ⊆ R, Y ⊆ R und Z ⊆ R drei nichtleere Mengen, und sei f : X ×Y ×Z → R eine partiell differenzierbare Funktion, deren Variablen mit x, y und z bezeichnet werden. Dann ist der Gradient ∇f : X ◦ × Y ◦ × Z ◦ → R3 durch ∂f ∂x (x, y, z) ∂f ∇f (x, y, z) := ∂y (x, y, z) ∂f (x, y, z) ∂z ◦ ◦ ◦ für alle x ∈ X , alle y ∈ Y und alle z ∈ Z definiert. In den nachfolgenden Beispielen wird sowohl der Gradient einer Funktion mit einer vektorwertigen Variable als auch der Gradient einer Funktion mit mehreren reellwertigen Variablen berechnet. Beispiele. (a) Die Funktion f : R3 → R sei durch f (x) := 3x1 x32 −x22 x43 +x31 x3 für alle Vektoren x = (x1 , x2 )T ∈ R2 definiert. Die Funktion ist partiell differenzierbar, und ihr Gradient ist durch 3x32 + 3x21 x3 ∇f (x) = 9x1 x22 − 2x2 x43 −4x22 x33 + x31 für alle x = (x1 , x2 )T ∈ R2 gegeben. (b) Die Funktion g : R × R × R → R sei durch g(x, y, z) := cos(x)ey + z sin(x) für alle x ∈ R, alle y ∈ R und alle z ∈ R definiert. Der Gradient von g ist dann durch − sin(x)ey + z cos(x) cos(x)ey ∇g(x, y, z) = sin(x) für alle x ∈ R, alle y ∈ R und alle z ∈ R gegeben. ♦ 148 KAPITEL 6. DIFFERENTIALRECHNUNG Welche Informationen liefert das Gradientenfeld einer Funktion? Das folgende Lemma gibt eine erste Antwort auf diese Frage. Lemma 6.16. Sei n ∈ N eine natürliche Zahl, sei D ⊆ Rn eine nichtleere, offene Menge, und sei f ∈ C 1 (D) eine stetig partiell differenzierbare Funktion von D nach R. Dann existiert zu jeder Stelle x(0) ∈ D eine positive Zahl r > 0 und eine Funktion ε : Br x(0) → R, so dass Br x(0) ⊆ D, sowie f x(0) + h = f x(0) ) + ∇f (x(0) ) · h + ε(h)|h| für alle h ∈ Br (0) und lim ε(h) = 0 h→0 gilt. Man beachte, dass das h in Lemma 6.16 einen Vektor aus dem Rn bezeichnet. Entsprechend bezeichnet ∇f (x(0) ) · h das euklidische Skalarprodukt von h mit dem Gradienten von f an der Stelle x(0) , und |h| bezeichnet die euklidische Norm des Vektors h. Das Lemma 6.16 macht eine Aussage darüber, wie eine stetig partiell differenzierbare Funktion in der Nähe einer Stelle ihres Definitionsbereichs mit Hilfe des Gradientenfeldes dargestellt werden. Das Lemma besitzt dabei eine gewisse Ähnlichkeit zum Lemma 6.1. (0) Offenbar ist die Funktion h 7→ f x + h in der Nähe der Stelle h = 0 als Summe der affinen Funktion h 7→ f x(0) ) + ∇f (x(0) ) · h und der Funktion h 7→ ε(h)|h| darstellbar. Das Gradientenfeld ermöglicht also lokale Linearisierungen einer stetig partiell differenzierbaren Funktion. Das Gradientenfeld spielt außerdem eine wichtige Rolle bei der Identifikation so genannter lokaler Extremalstellen einer reellwertigen Funktion. Eine lokale Extremalstelle ist ein Stelle, an der eine Funktion ein lokales Extremum annimmt. Man unterscheidet dabei die folgenden zwei Arten lokaler Extrema. Definition (lokales Minimum). Sei n ∈ N eine natürliche Zahl, sei D ⊆ Rn eine nichtleere Menge, und sei f : D → R eine Funktion. Ein Punkt x(0) ∈ D◦ heißt eine lokale Minimalstelle von f , wenn eine positive Zahl r > 0 existiert, so dass Br (x(0) ) ⊆ D und f x(0) = min f (x) x∈Br (x(0) ) gilt. Der Funktionswert f x(0) wird dann ein lokales Minimum von f genannt. Definition (lokales Maximum). Sei n ∈ N eine natürliche Zahl, sei D ⊆ Rn eine nichtleere Menge, und sei f : D → R eine Funktion. Ein Punkt x(0) ∈ D◦ heißt eine lokale Maximalstelle von f , wenn eine positive Zahl r > 0 existiert, so dass Br (x(0) ) ⊆ D und f x(0) = max f (x) x∈Br (x(0) ) gilt. Der Funktionswert f x(0) wird dann ein lokales Maximum von f genannt. Für lokale Extremalstellen einer Funktion gilt der folgende, wichtige Satz. Satz 6.17 (notwendiges Kriterium für lokale Extrema). Sei n ∈ N eine natürliche Zahl, sei D ⊆ Rn eine nichtleere, offene Menge, und sei f ∈ C 1 (D) eine stetig partiell differenzierbare Funktion von D nach R, die an einer Stelle x(0) ∈ D ein lokales Extremum besitzt. Dann gilt ∇f x(0) ) = 0. 6.6. GRADIENT UND HESSE–MATRIX 149 Der Satz 6.17 ist offenbar die mehrdimensionale Version eines bekannten Resultats aus dem Mathematikunterricht der Oberstufe: Eine reellwertige, differenzierbare Funktion f , die auf einer nichtleeren Teilmenge D der reellen Zahlen definiert ist, kann nur dann an einer Stelle x0 ∈ D◦ ein lokales Extremum aufweisen, wenn f 0 (x0 ) = 0 gilt. Für reellwertige, stetig partiell differenzierbare Funktionen, die auf nichtleeren Teilmengen des Rn definiert sind, wird die Forderung f 0 (x0 ) = 0 durch ∇f (x(0) ) = 0 ersetzt. In diesem Zusammenhang führt man auch den Begriff der stationären Stelle für Funktionen ein, die auf Teilmengen des Rn definiert sind. Definition (stationäre Stelle). Sei n ∈ N eine natürliche Zahl, sei D ⊆ Rn eine nichtleere, offene Menge, und sei und sei f ∈ C 1 (D) eine stetig partiell differenzierbare Funktion von D nach R. Ein Punkt x(0) ∈ D wird eine stationäre Stelle von f genannt, wenn ∇f (x(0) ) = 0 gilt. Wie kann man nun entscheiden, ob an einer stationären Stelle einer stetig partiell differenzierbaren Funktion ein lokales Extremum dieser Funktion vorliegt oder nicht? Im Falle einer zweimal differenzierbaren Funktion f , die auf einer Teilmenge der reellen Zahlen definiert ist, kann man bekanntlich die zweite Ableitung f 00 verwenden. An einer Stelle x0 im Innern des Definitionsbereichs von f liegt nämlich genau dann ein lokales Minimum vor, wenn f 0 (x0 ) = 0 und f 00 (x0 ) > 0 gilt. Ein lokales Maximum liegt genau dann vor, wenn f 0 (x0 ) = 0 und f 00 (x0 ) < 0 gilt. Für Funktionen, die auf Teilmengen des Rn definiert sind, benötigt man ein Äquivalent zur zweiten Ableitung. Ein solches Äquivalent ist durch die so genannte Hesse–Matrix gegeben. Definition (Hesse–Matrix). Sei n ∈ N eine natürliche Zahl, sei D ⊆ Rn eine nichtleere Menge, und sei x(0) ∈ D◦ ein innerer Punkt dieser Menge. Sei außerdem f : D → R eine an der x(0) zweimal partiell differenzierbare Funktion. Dann heißt die Matrix Stelle 2 (0) n×n ∇ f x ∈R , welche durch ∂12 f x(0) ∂1 ∂2 f x(0) . . . ∂1 ∂n f x(0) ∂2 ∂1 f x(0) ∂22 f x(0) . . . ∂2 ∂n f x(0) 2 ∇ f (x) := .. .. .. . . . ∂n ∂1 f x(0) ∂n ∂2 f x(0) . . . ∂n2 f x(0) definiert ist, die Hesse–Matrix von f an der Stelle x(0) . Ist f zweimal partiell differenzierbar, so definiert man die Funktion ∇2 f : D◦ → Rn×n , x 7→ ∇2 f (x). Die Funktion ∇2 f heißt die Hesse–Matrix von f . Die Hesse-Matrix einer Funktion, die von mehreren reellwertigen Variablen abhängt, wird folgendermaßen gebildet: Ist f beispielsweise eine zweimal partiell differenzierbare Funktion, die nach R abbildet, und die von drei Variablen x, y und z abhängt. Dann ist die Hesse-Matrix von f durch 2 ∂ f ∂2f ∂2f ∂x2 (x, y, z) ∂x∂y (x, y, z) ∂x∂z (x, y, z) 2 2f 2f ∂ f ∂ ∂ ∇2 f (x, y, z) := (x, y, z) (x, y, z) (x, y, z) 2 ∂y∂x ∂y ∂y∂z 2 2 2 ∂ f ∂ f ∂ f (x, y, z) (x, y, z) (x, y, z) ∂z∂x ∂z∂y ∂z 2 150 KAPITEL 6. DIFFERENTIALRECHNUNG gegeben. Aus dem Satz von Schwarz (Satz 6.15) folgt, dass die Hesse–Matrix jeder zweimal stetig partiell differenzierbaren Funktion symmetrisch ist. In den nachfolgenden Beispielen sind die Hesse–Matrizen von zwei solcher Funktionen angegeben. Beispiele. (a) Die Funktion f : R3 → R sei durch f (x) := x31 x2 − x32 x3 + x33 x1 für alle Vektoren x = (x1 , x2 , x3 )T ∈ R3 definiert. Offenbar ist f zweimal partiell differenzierbar. Die Hesse–Matrix von f ist durch 3x21 6x1 x2 ∇2 f (x) := 3x21 3x23 −6x2 x3 −3x22 3x23 −3x22 6x3 x1 für alle x = (x1 , x2 , x3 )T ∈ R3 gegeben. (b) Die Funktion g : R × R → R sei durch g(x, y) := sin(πx) sin(2πy) für alle x ∈ R und alle y ∈ R definiert. Die Hesse–Matrix von g ist durch ! −π 2 sin(πx) sin(2πy) 2π 2 cos(πx) cos(2πy) 2 ∇ g(x, y) := 2π 2 cos(πx) cos(2πy) −4π 2 sin(πx) sin(2πy) für alle x ∈ R und alle y ∈ R gegeben. ♦ Für das Gradientenfeld und die Hesse–Matrix einer zweimal stetig partiell differenzierbaren Funktion gilt das folgende Lemma. Lemma 6.18. Sei n ∈ N eine natürliche Zahl, sei D ⊆ Rn eine nichtleere, offene Menge, und sei f ∈ C 2 (D) eine zweimal stetig partiell differenzierbare Funktion von D nach R. Dann existiert zu jeder Stellex(0) ∈ D eine positive Zahl r > 0 und eine Funktion ε : Br x(0) → R, so dass Br x(0) ⊆ D, sowie f x(0) + h = f x(0) + ∇f x(0) · h + h · ∇2 f x(0) h + ε(h)|h|2 für alle h ∈ Br (0) und lim ε(h) = 0 h→0 gilt. Der nachfolgende Satz, welcher hinreichende Kriterien für die Existenz lokaler Extremalstellen einer zweimal stetig partiell differenzierbaren liefert, ist eine einfache Folgerung aus Satz 6.17 und Lemma 6.18. Satz 6.19 (hinreichende Kriterien für lokale Extrema). Sei n ∈ N eine natürliche Zahl, sei D ⊆ Rn eine nichtleere, offene Menge, und sei x(0) ∈ D stationäre Stelle einer zweimal stetig partiell differenzierbaren Funktion f ∈ C 2 (D). Dann gelten die folgenden Aussagen: (1) Die Funktion f besitzt an der Stelle x(0) ein lokales Minimum, wenn die Hesse–Matrix ∇2 f x(0) positiv definit ist. 6.6. GRADIENT UND HESSE–MATRIX 151 (2) Die Funktion f besitzt an der Stelle x(0) ein lokales Maximum, wenn die Hesse– Matrix ∇2 f x(0) negativ definit ist. Die Sätze 6.17 und 6.19 dazu verwendet werden, lokale Extremalstellen einer Funktion zu bestimmen. Man betrachte dazu die nachfolgenden Beispiele. Beispiele. (a) Sei f : R2 → R diejenige Funktion, die durch f (x) = −3x21 −2x1 x2 −x22 +2x1 +2x2 für alle Vektoren x = (x1 , x2 )T ∈ R2 definiert ist. Besitzt diese Funktion lokale Extremalstellen? Zur Beantwortung dieser Frage bestimmt man zunächst den Gradienten ∇f : R2 → R2 und die Hesse–Matrix ∇2 f : R2 → R2×2 von f . Wie man leicht nachrechnet, gilt −6x1 − 2x2 + 2 −6 −2 ∇f (x) = , ∇2 f (x) = −2x1 − 2x2 + 2 −2 −2 für alle x = (x1 , x2 )T ∈ R2 . Die Hesse–Matrix von f ist also eine konstante, matrixwertige Funktion. Als nächstes bestimmt man die stationären Stelle von f , d.h. man sucht Vektoren x ∈ R2 , für die ∇f (x) = 0 gilt. Offenbar führt dies auf das lineare Gleichungssystem −6x1 − 2x2 = −2, −2x1 − 2x2 = −2. Die eindeutige Lösung dieses Gleichungssystems lautet x1 = 0 und x2 = 1. Der Punkt x(0) := (0, 1)T ist also die einzige stationäre Stelle von f . Gemaß Satz 6.17 kann nur an dieser Stelle ein lokales Extremum von f vorliegen. Da die Hesse–Matrix ∇2 f x(0) negativ definit ist, liegt gemäß Satz 6.19 an der Stelle x(0) ein lokales Maximum von f vor. (b) Die Funktion g : [0, 1] × [0, 1] → R, welche durch g(x, y) := sin(2πx) + 2y 2 − y für alle x ∈ [0, 1] und alle y ∈ [0, 1] definiert ist, soll auf lokale Extremalstellen hin untersucht werden. Der Gradient und die Hesse–Matrix von g sind durch ! ! 2π cos(2πx) −4π 2 sin(2πx) 0 2 ∇g(x, y) = , ∇ g(x, y) = 4y − 1 0 4 für alle x ∈ [0, 1] und alle y ∈ [0, 1] gegeben. Zunächst sucht man nach stationären Stellen, d.h. nach Stellen (x, y) ∈ [0, 1] × [0, 1] für die ∇g(x, y) = 0 gilt. Die erste Komponente des Gradienten ist offenbar genau dann Null, wenn x = 1/4 oder x = 3/4 gilt. Die zweite Komponente verschwindet genau dann, wenn y = 1/4 gilt. Also sind (x, y) = (1/4, 1/4) und (x, y) = (3/4, 1/4) die einzigen stationären Stellen von g. Nur an diesen Stellen kann ein lokales Extremum von g vorliegen. Ob an einer stationären Stelle tatsächlich ein lokales Extremum vorliegt, erkennt man an der Hesse–Matrix. An der Stelle (x, y) = (1/4, 1/4) ist diese durch −4π 2 0 ∇2 g(1/4, 1/4) = 0 4 152 KAPITEL 6. DIFFERENTIALRECHNUNG 1 1 0 −1 x2 −2 0 −3 −4 −5 1 1 0.5 0 0 −1 −1 −0.5 x2 (a) −1 −1 x1 0 1 x1 (b) Abbildung 6.5: (a) Graph der Funktion f : R2 → R, x 7→ 1−2x21 −3x22 . (b) Darstellung des Gradientenfeldes ∇f . gegeben. Die Hesse–Matrix ∇2 g(1/4, 1/4) ist weder positiv noch negativ definit. Ein hinreichendes Kriterium für eine lokale Extremalstelle ist also nicht erfüllt. Tatsächlich besitzt die Funktion g an der Stelle (x, y) = (1/4, 1/4) kein lokales Extremum. An (x, y) = (3/4, 1/4) der Stelle gilt hingegen 2 4π 0 2 . ∇ g(3/4, 1/4) = 0 4 Die Hesse–Matrix ∇2 g(3/4, 1/4) ist positiv definit. Damit liegt an der stationären Stelle (x, y) = (3/4, 1/4) ein lokales Minimum von g vor. ♦ Zum Abschluss dieses Abschnitts geben wir noch eine recht anschauliche Charakterisierung des Gradientenfeldes einer stetig partiell differenzierbaren Funktion an. Satz 6.20. Sei n ∈ N eine natürliche Zahl, sei D ⊆ Rn eine nichtleere, offene Menge, und (0) sei f ∈ C 1 (D) eine stetig partiell differenzierbare Funktion. Sei weiterhin x ∈ D eine (0) nichtstationäre Stelle von f . Dann zeigt der Gradient ∇f x in diejenige Richtung, in (0) die f am steilsten anwächst. Der negative Gradient −∇f x zeigt in diejenige Richtung, in die f am steilsten abfällt. Die Tatsache, dass der negative Gradient einer Funktion immer in die Richtung des steilsten Abfalls einer Funktion zeigt, macht man sich unter anderem in bestimmten numerischen Verfahren zunutze, mit denen lokale Minima einer Funktion bestimmt werden. Solche Verfahren werden ganz allgemein Gradientenverfahren genannt. Darüber hinaus nutzt man die in Satz 6.20 formulierte Eigenschaft des Gradientenfelds für die Entwicklung zahlreicher physikalischer und ingenieurswissenschaftlicher Modelle. Übungsaufgaben 1. Bestimmen Sie den Gradient und die Hesse–Matrix der folgenden Funktionen: f1 : R3 → R, x 7→ x41 x2 + x21 x2 + x2 x23 , 6.6. GRADIENT UND HESSE–MATRIX 153 f2 : R2 → R, x 7→ x1 x2 + 1, f3 : R2 → R, x 7→ sin(x1 ) cos(2x2 ), f4 : R3 → R, x 7→ exp(x21 + x22 − x23 ). 2. Für jede natürliche Zahl n ∈ N ist die Funktion fn : Rn \ {0} → R, welche durch fn (x) := |x| für alle Vektoren x ∈ Rn definiert ist, partiell differenzierbar. Hierbei bezeichnet |x| die euklidische Norm des Vektors x. Bestimmen Sie das Gradientenfeld von fn . 3. Bestimmen Sie alle stationären Stellen und alle Extremalstellen der folgenden Funktionen: f1 : R2 → R, x 7→ (2x31 + 3x21 − 36x1 ) exp(−x22 ), f2 : R2 → R, x 7→ (1 − x22 )/(1 + x21 ), f3 : R2 → R, x 7→ x1 (1 − exp(1 − x22 )), f4 : (0, π) × (0, π) → R, (x, y) 7→ sin(x) sin(y/2). 4. Sei n ∈ N eine natürliche Zahl, sei d ∈ Rn ein Vektor mit |d| = 1, und sei f : Rn → R eine stetig partiell differenzierbare Funktion. Zeigen Sie, dass dann f x(0) + td − f x(0) = ∇f x(0) · d lim t→0 t für alle x(0) ∈ Rn gilt. Verwenden Sie dazu das Lemma 6.16. Der Grenzwert auf der linken Seite der Gleichung wird übrigens die Richtungsableitung von f an der Stelle x(0) in Richtung d genannt. 154 6.7 KAPITEL 6. DIFFERENTIALRECHNUNG Totale Differenzierbarkeit Zum Abschluss dieses Kapitels führend wir noch kurz den Begriff der totalen Differenzierbarkeit ein. Totale Differenzierbarkeit ist eine Eigenschaft, die bestimmten Funktionen von Rn nach Rm mit n ∈ N und m ∈ N zukommt. Falls n = 1 und m = 1 gilt, so entspricht die totale Differenzierbarkeit genau der gewöhnlichen Differenzierbarkeit. In diesem Sinne ist die totale Differenzierbarkeit der natürliche Differenzierbarkeitsbegriff für vektorwertige Funktionen, die von einer vektorwertigen Variable abhängen. Definition (total differenzierbare Funktion, totale Ableitung). Seien m ∈ N und n ∈ N zwei natürliche Zahlen, sei D ⊆ Rn eine nichtleere Menge, und sei x(0) ∈ D◦ ein innerer Punkt dieser Menge. Eine Funktion f : D → Rm wird total differenzierbar an der Stelle x(0) genannt, wenn eine lineare Funktion ϕ : Rn → Rm existiert, so dass f x(0) + h −f x(0) − ϕ(h) lim =0 h→0 |h| gilt. Die lineare Funktion ϕ wird dann die totale Ableitung von f an der Stelle x(0) genannt (0) und mit Df x bezeichnet. Die Funktion f heißt total differenzierbar, wenn sie an jeder ◦ Stelle in D total differenzierbar ist. Die Funktion Df : D◦ → Lin(Rn , Rm ), x 7→ Df (x) wird dann die totale Ableitung von f genannt. Hierbei bezeichnet Lin(Rn , Rm ) die Menge aller linearen Abbildungen von Rn nach Rm . Es muss betont werden, dass für jede Stelle x(0) im Innern des Definitionsbereichs einer total differenzierbaren Funktion f die totale Ableitung Df x(0) eine lineare Abbildung ist. Das bedeutet, dass die totale Ableitung Df x(0) selber von einer vektorwertigen Variable abhängig ist. Welche Rolle die totale Ableitung einer total differenzierbaren Funktion spielt, wird anhand des nachfolgenden Lemmas deutlich. Lemma 6.21. Seien n ∈ N und m ∈ N zwei natürliche Zahlen, und sei D ⊆ Rn eine nichtleere Menge. Eine Funktion f : D → W ist genau dann an einer Stelle x(0) ∈ D◦ total differenzierbar, wenn es eine lineare Abbildung ϕ : Rn → Rm , eine positive Zahl r > 0 und eine Funktion ε : Br (0) → Rm gibt, so dass Br (x0 ) ⊆ D, sowie f x(0) + h = f x(0) + ϕ(h) + ε(h)|h| für alle h ∈ Br (0) und lim ε(h) = 0 h→0 gilt. Es ist dann ϕ = Df x(0) . Nach Lemma 6.21 kann man eine total differenzierbare Funktion f : D → Rm , die auf einer Teilmenge D des Rn definiert ist, in der Nähe einer Stelle x(0) ∈ D◦ mit Hilfe der totalen Ableitung linearisieren. Dies bedeutet, dass man die Funktion h 7→ f x(0) + h in der Nähe von Null durch die affine Funktion h 7→ f x(0) + Df x(0) (h) approximiert. Da die Funktion h 7→ ε(h)|h| sehr schnell gegen Null geht, wenn h gegen den Nullvektor strebt, kann sie in der Regel vernachlässigt werden. Dasselbe Prinzip haben wir bereits bei der Ableitung und dem Gradienten einer Funktion kennen gelernt (siehe Lemma 6.1 und 6.16). Die Funktion h 7→ f x(0) + Df x(0) (h) wird entsprechend die Linearisierung von f an der Stelle x(0) genannt. 6.7. TOTALE DIFFERENZIERBARKEIT 155 Wie kann die totale Ableitung einer total differenzierbaren Funktion f : D → Rm mit n (0) ◦ (0) D ⊆ R bestimmt werden? Da für jede Stelle x ∈ D die totale Ableitung Df x eine lineare Abbildung von Rn nach Rm ist, muss es eine Matrix A ∈ Rm×n geben, so dass Df x(0) (h) = Ah für alle h ∈ Rn gilt. Wir werden sehen, dass diese Matrix A durch die so genannte Jacobi– Matrix von f an der Stelle x(0) gegeben ist. Definition (Jacobi–Matrix). Seien m ∈ N und n ∈ N zwei natürliche Zahlen, sei D ⊆ Rn eine nichtleere Menge, und sei x(0) ∈ D◦ ein innerer Punkt dieser Menge. Sei außerdem f : D → Rm eine an der Stelle x(0) partiell differenzierbare Funktion mit den Komponenten f1 : D → R, f2 : D → R, . . . , fm : D → R. Dann heißt die Matrix f 0 x(0) ∈ Rm×n , welche durch ∂1 f1 x(0) ∂2 f1 x(0) . . . ∂n f1 x(0) ∂1 f2 x(0) ∂2 f2 x(0) . . . ∂n f2 x(0) f 0 x(0) := .. .. .. . . . (0) (0) (0) ∂1 fm x ∂2 fm x . . . ∂n fm x definiert ist, die Jacobi–Matrix von f an der Stelle x(0) . Ist f partiell differenzierbar, so definiert man die Funktion f 0 : D◦ → Rm×n , x 7→ f 0 (x), welche die Jacobi–Matrix von f genannt wird. Man erkennt, dass in der jeweils j-ten Spalte der Jacobi–Matrix einer Funktion f die partielle Ableitung nach der j-ten Koordinate von f steht. Natürlich definiert man die Jacobi–Matrix auch für solche Funktionen, die von mehreren reellwertigen Variablen abhängen. Sind beispielsweise X ⊆ R, Y ⊆ R und Z ⊆ R drei nichtleere Mengen, und ist f : X × Y × Z → Rm eine partiell differenzierbare, vektorwertige Funktion, die von drei Variablen x, y und z abhängt, dann ist die Jacobi–Matrix f 0 : X ◦ × Y ◦ × Z ◦ → Rm von f durch ∂f1 ∂f1 ∂f1 (x, y, z) (x, y, z) (x, y, z) ∂x ∂y ∂z ∂f2 ∂f ∂f 2 2 (x, y, z) (x, y, z) (x, y, z) ∂x ∂y ∂z 0 f (x, y, z) = .. .. .. . . . ∂fm ∂fm ∂fm (x, y, z) (x, y, z) (x, y, z) ∂x ∂y ∂z ◦ ◦ ◦ für alle x ∈ X , y ∈ Y und z ∈ Z gegeben. Nachfolgend sind einige Beispiele für Jacobi–Matrizen angegeben. Beispiele. (a) Die Funktion f : R3 → R2 sei durch x21 + x22 − x3 x1 − 4x2 + x23 f (x) := für alle x = (x1 , x2 , x3 )T ∈ R3 gegeben. Die Jacobi–Matrix f 0 : R3 → R2×3 von f ist dann durch 2x1 2x2 −1 f 0 (x) = 1 −4 2x3 für alle x = (x1 , x2 , x3 )T ∈ R3 gegeben. 156 KAPITEL 6. DIFFERENTIALRECHNUNG (b) Die Funktion g : [0, ∞) × [0, 2π) → R2 sei durch r cos(ϕ) g(r, ϕ) := r sin(ϕ) für alle r ∈ [0, ∞) und alle ϕ ∈ [0, 2π) definiert. Als Jacobi–Matrix erhält man die matrixwertige Funktion g 0 : [0, ∞) × [0, 2π) → R2×2 , welche gemäß cos(ϕ) −r sin(ϕ) 0 g (r, ϕ) = sin(ϕ) r cos(ϕ) für alle r ∈ [0, ∞) und alle ϕ ∈ [0, 2π) definiert ist. (c) Das Funktional ϕ : R2 → R sei durch ϕ(x) := x41 + x42 für alle x = (x1 , x2 )T ∈ R2 definiert. Die zugehörige Jacobi–Matrix ϕ0 : R2 → R1×2 ist dann an jeder Stelle x = (x1 , x2 )T ∈ R2 eine einzeilige Matrix, welche durch ϕ0 (x) = 4x31 4x32 gegeben ist. ♦ Für die Jacobi–Matrix gilt nun der folgende, wichtige Satz. Satz 6.22. Seien m ∈ N und n ∈ N zwei natürliche Zahlen, sei D ⊆ Rn eine nichtleere Menge, und sei x(0) ∈ D◦ ein innerer Punkt dieser Menge. Sei außerdem f : D → Rm eine Funktion, welche an der Stelle x(0) total differenzierbar ist. Dann ist f an der Stelle x(0) auch partiell differenzierbar und stetig, und es gilt Df x(0) (h) = f 0 x(0) h für alle h ∈ Rn . Hierbei bezeichnet f 0 x(0) die Jacobi–Matrix von f an der Stelle x(0) . Laut 6.22 impliziert die totale Differenzierbarkeit die partielle Differenzierbarkeit einer Funktion, die von einer vektorwertigen Variable abhängt. Man kann darüber hinaus zeigen, dass es Funktionen gibt, die an einer Stelle im Innern ihres Definitionsbereichs zwar partiell differenzierbar, nicht aber total differenzierbar sind. Also ist totale Differenzierbarkeit eine stärkere Eigenschaft als partielle Differenzierbarkeit. Schließlich gilt noch der folgende Satz. Satz 6.23. Seien m ∈ N und n ∈ N zwei natürliche Zahlen, sei D ⊆ Rn eine nichtleere, offene Menge, und sei f ∈ C 1 (D, Rm ) eine stetig partiell differenzierbare Funktion von D nach Rm . Dann ist f total differenzierbar. Die Aussage von Satz 6.23 hat eine praktische Konsequenz. Angenommen, man berechnet die Jacobi–Matrix f 0 einer Funktion f und stellt fest, dass jede Komponente von f 0 eine stetige Funktion ist. Dann ist f stetig partiell differenzierbar nach Satz 6.23 somit auch total differenzierbar. In einem solchen Fall erkennt man also die totale Differenzierbarkeit einer Funktion anhand ihrer Jacobi–Matrix. Beispiel. Die Funktion f : R2 → R2 sei durch f (x) := x21 − x1 x2 + x22 x31 x2 − x1 x32 ! 6.7. TOTALE DIFFERENZIERBARKEIT 157 für alle x = (x1 , x2 )T ∈ R2 definiert. Die Jacobi–Matrix von f ist dann durch ! 2x − x −x + 2x 1 2 1 2 f 0 (x) := 3x21 x2 − x32 x31 − 3x1 x22 für alle x = (x1 , x2 )T ∈ R2 gegeben. Offenbar sind alle Komponenten der Jacobi–Matrix stetige Funktionen. Nach Satz 6.23 ist f also total differenzierbar, und nach Satz 6.22 ist die Ableitung Df : R2 → Lin(R2 , R2 ) durch ! ! 2x1 − x2 −x1 + 2x2 h1 Df (x)(h) = 3x21 x2 − x32 x31 − 3x1 x22 h2 für alle x = (x1 , x2 )T ∈ R2 und alle h = (h1 , h2 )T ∈ R2 gegeben. Übungsaufgaben 1. Bestimmen Sie die Jacobi–Matrix und die totale Ableitung der folgenden Funktionen: ! −4x21 + 5x32 − x3 3 2 f : R → R , x 7→ , 2x1 + 3x22 − 3x53 ! sin(x1 )x2 + x1 cos(x2 ) 2 2 g : R → R , x 7→ , exp(−x1 + x2 ) x21 + x22 p u : R2 → R3 , x 7→ 1 + x21 − x2 , x1 x2 2x1 x2 + x23 − 1 v : R3 → R3 , x 7→ 3x1 − 4x2 + 5x3 x1 x2 x3 − 1 2. Sei n ∈ N eine natürliche Zahl, und sei f : Rn → R eine partiell differenzierbare Funktion. Zeigen Sie, dass dann T ∇f x(0) = f 0 x(0) für alle x(0) ∈ Rn gilt, wobei f 0 x(0) die Jacobi–Matrix von f an der Stelle x(0) bezeichnet. 3. Sei n ∈ N eine natürliche Zahl, und sei f : Rn → R eine stetig partiell differenzierbare Funktion. Zeigen Sie, dass f total differenzierbar ist, und dass Df x(0) (h) = ∇f x(0) · h für alle x(0) ∈ Rn und alle h ∈ Rn gilt. Verwenden Sie dazu die Definition der totalen Differenzierbarkeit sowie Lemma 6.16. 4. Sei f : R → R eine differenzierbare Funktion. Zeigen Sie, dass f total differenzierbar ist, und dass Df (x0 )(h) = f 0 (x0 )h für alle x0 ∈ R und alle h ∈ Rn gilt, wobei f 0 (x0 ) die gewöhnliche Ableitung von f an der Stelle x0 bezeichnet. Verwenden Sie dazu die Definition der totalen Differenzierbarkeit sowie Lemma 6.1. 5. Sei n ∈ N eine natürliche Zahl, und sei f : Rn → R diejenige Funktion, die durch f (x) := |x|2 ist, wobei |x| die euklidische Norm von x bezeichnet. Zeigen Sie, für alle x ∈ Rn gegeben dass dann Df x(0) (h) := 2x(0) · h für alle x(0) ∈ Rn und alle h ∈ Rn gilt. Verwenden Sie dazu die Definition der totalen Differenzierbarkeit, sowie die Identität |x|2 = x · x, welche bekanntlich für alle x ∈ Rn gilt. Lernzielkontrolle Nach dem Durcharbeiten dieses Kapitels sollten Sie ... ... wissen, was eine differenzierbare Funktion ist. ... wissen, wie die Ableitung einer Funktion an einer Stelle im Innern ihres Definitionsbereichs definiert ist. ... sämtliche Ableitungsregeln (Summenregel, Produktregel, Regel des konstanten Faktors, Quotientenregel, Kettenregel) beherrschen. ... die Ableitung einer Potenzreihe bestimmen können. ... wissen, dass jede Funktion, die an einer Stelle ihres Definitionsbereichs differenzierbar ist, an dieser Stelle auch stetig ist. ... den Satz von Rolle und den Mittelwertsatz der Differentialrechnung kennen. ... Funktionsgrenzwerte mit Hilfe der Regel von de l’Hôpital berechnen können. ... wissen, was eine k-mal differenzierbare Funktion, und was eine k-mal stetig differenzierbare Funktion ist. ... zu einer gegebenen Zahl N ∈ N und einer gegebenen Stelle x0 das N -te Taylor– Polynom zur Entwicklungsstelle x0 einer N -mal differenzierbaren Funktion bestimmen können. ... den Satz von Taylor kennen. ... wissen, was eine partiell differenzierbare Funktion ist. ... partielle Ableitungen einer Funktion berechnen können. ... wissen, was eine k-mal partiell differenzierbare Funktion, und was eine k-mal stetig partiell differenzierbare Funktion ist. ... den Satz von Schwarz kennen. ... den Gradienten einer partiell differenzierbaren Funktion bestimmen können. ... die Hesse–Matrix einer zweimal partiell differenzierbaren Funktion bestimmen können. ... wissen, dass jede lokale Extremalstelle einer reellwertigen Funktion eine stationäre Stelle der Funktion ist. ... lokale Extremalstellen einer reellwertigen Funktion bestimmen können, die entweder von einer vektorwertigen Variable oder von mehreren reellwertigen Variablen abhängt. ... wissen, was eine total differenzierbare Funktion ist. ... wissen, dass jede Funktion, die an einer Stelle ihres Definitionsbereichs total differenzierbar ist, an dieser Stelle auch partiell differenzierbar und stetig ist. ... wissen, dass jede stetig partiell differenzierbare Funktion auch total differenzierbar ist. ... die Jacobi–Matrix einer partiell differenzierbaren Funktion bestimmen können. 158 Kapitel 7 Integralrechnung 7.1 Das Lebesgue–Maß In diesem wie auch im nächsten Abschnitt soll geklärt werden, was man unter dem Integral Z f (x) dx Ω einer reellwertigen Funktion f : D → R über einer Menge Ω ⊆ D versteht, wobei D eine Teilmenge des Vektorraums Rn ist. Falls n = 1 gilt, und Ω ein nichtleeres Intervall [a, b] mit Intervallgrenzen a ∈ R und b ∈ R ist, bezeichnet man das Integral von f über Ω üblicherweise mit Z b f (x) dx. a Wenn die Funktion f stetig ist und darüber hinaus nur nichtnegative Funktionswerte besitzt, interpretiert man das Integral als den Flächeninhalt der Fläche, die vom Graph von f , der Abszisse (also der x-Achse) und den beiden senkrechten Graden x = a und x = b eingeschlossen wird. Eine analoge Interpretation des Integrals wird auch für den Fall, dass n > 1 gilt, angestrebt: Das Integral soll den Inhalt derjenigen Menge widerspiegeln, die von dem Graph von f , der Menge Ω × {0} und der Menge ∂Ω × R begrenzt wird. Daher macht es Sinn, zunächst einmal zu klären, was man unter dem Inhalt bzw. dem Volumen einer Menge verstehen soll. Es ist tatsächlich nicht leicht, einen sinnvollen Inhalts- oder Volumenbegriff für Teilmengen des Rn zu definieren. Von einem sinnvollen Volumenbegriff würde man beispielsweise erwarten, dass sich das Volumen einer Menge nicht ändert, wenn man die Menge verschiebt. Auch sollte die Summe der Volumina zweier disjunkter Mengen genau gleich dem Volumen der Vereinigung beider Mengen sein. Weiterhin sollte das Volumen einer Menge stets größer oder gleich dem Volumen jeder Teilmenge sein. In der Mathematik wird der Inhalt oder das Volumen einer Menge ganz allgemein als das Maß der Menge bezeichnet. Es hat sich gezeigt, dass es ganz unterschiedliche Möglichkeiten gibt, ein solches Maß zu definieren. Die heutzutage gebräuchlichste Definition des Maßbegriffs geht auf den französischen Mathematiker Henri Léon Lebesgue (1875–1941) zurück. In diesem Abschnitt soll dieses so genannte Lebesgue–Maß (gesprochen: Lebäk– ” Maß“) eingeführt werden. Es wird sich zeigen, dass man nur bestimmten Teilmengen des Rn in sinnvoller Weise ein Lebesgue–Maß zuordnen kann. Diese Mengen werden dann Lebesgue–messbar genannt. Das Mengensystem aller Lebesgue–messbaren Teilmengen der Rn spielt eine wichtige Rolle bei der Definition von Integralen. 159 160 KAPITEL 7. INTEGRALRECHNUNG Abbildung 7.1: Ein zweidimensionales, rechtsoffenes Intervall. Bevor wir definieren können, was eine Lebesgue–messbare Menge und was das Lebesgue– Maß einer solchen Menge ist, benötigen wir noch einige grundlegende Begriffe. Zunächst erweitern wir den Intervallbegriff auf bestimmte Teilmengen des Rn . Definition (n-dimensionales, rechtsoffenes Intervall). Sei n ∈ N eine natürliche Zahl, und seien a = (a1 , a2 , . . . , an )T ∈ Rn und b = (b1 , b2 , . . . , bn )T ∈ Rn zwei Vektoren. Dann nennt man die Menge [a, b) := [a1 , b1 ) × [a2 , b2 ) × · · · × [an , bn ) = x = (x1 , x2 , . . . , xn )T ∈ Rn ai ≤ xi < bi für alle i = 1, 2, . . . , n ein n-dimensionales, rechtsoffenes Intervall. Die Menge aller n-dimensionalen, rechtsoffenen Intervalle wird im Folgenden mit J (Rn ) bezeichnet. Eine Menge, deren Elemente ebenfalls Mengen sind, wird üblicherweise als Mengensystem bezeichnet, so auch J (Rn ). Man beachte, dass für jede natürliche Zahl n ∈ N das Mengensystem J (Rn ) insbesondere die leere Menge ∅ enthält, da beispielsweise [a, a) = ∅ für alle Vektoren a ∈ Rn gilt. Für n = 1 besteht J (Rn ) aus allen rechtsoffenen Intervallen [a, b) mit Intervallgrenzen a, b ∈ R. Für n = 2 besteht J (Rn ) aus sämtlichen Rechtecken, deren Seiten parallel zu den Koordinatenachsen verlaufen, und die jeweils nur die linke und die untere Seite als Teilmenge enthalten (siehe auch Abbildung 7.1). Für n = 3 besteht J (Rn ) aus Quadern, deren Kanten parallel zu den Koordinatenachsen verlaufen. Für rechtsoffene Intervalle kann man sehr leicht einen Volumenbegriff definieren. Definition (Volumen eines rechtsoffenen Intervalls). Sei n ∈ N eine natürliche Zahl, und seien a = (a1 , a2 , . . . , an )T ∈ Rn und b = (b1 , b2 , . . . , bn )T ∈ Rn zwei Vektoren. Dann nennt man die Zahl falls [a, b) = ∅, 0 n Y vol [a, b) := (bi − ai ) sonst i=1 das n-dimensionale Volumen von [a, b). Die so definierte Funktion vol : J (Rn ) → R wird die n-dimensionale Volumenfunktion genannt. Für n = 1 entspricht vol([a, b)) genau der Länge b−a des Intervalls [a, b) ⊂ R. Für n = 2 ist vol([a, b)) genau der Flächeninhalt (b1 −a1 )(b2 −a2 ) des Rechtecks [a, b) ⊂ R2 , und für n = 3 ist vol([a, b)) genau der Rauminhalt (b1 − a1 )(b2 − a2 )(b3 − a3 ) des Quaders [a, b) ⊆ R3 . Die n-dimensionale Volumenfunktion ordnet also jedem rechtsoffenen Intervall ein Volumen 7.1. DAS LEBESGUE–MASS 161 zu, welches für n ∈ {1, 2, 3} genau der geometrischen Länge bzw. dem geometrischen Flächeninhalt bzw. dem geometrischen Rauminhalt entspricht. Man betrachte dazu auch die nachfolgenden Beispiele. Beispiele. (a) Für das rechtsoffene Intervall [1, 3) ⊆ R gilt vol([1, 3)) = 3 − 1 = 2. Das Volumen vol([1, 3)) entspricht offenbar genau der Länge des Intervalls. (b) Für a = (−1, −1)T ∈ R2 und b = (1, 1)T ∈ R2 gilt vol([a, b)) = (1 − (−1))2 = 4. Tatsächlich ist das rechtsoffene Intervall [a, b) ein Quadrat, dessen Seiten die Länge 2 besitzen. Das Volumen vol([a, b)) entspricht somit genau dem Flächeninhalt des Quadrats. Mit Hilfe der n-dimensionale Volumenfunktion kann man für jede Teilmenge des Rn ein so genanntes äußeres Lebesgue–Maß definieren. Die Definition des äußeren Lebesgue–Maßen bildet eine wichtige Vorstufe für die Definition eines allgemeinen Volumenbegriffs. Definition (äußeres Lebesgue–Maß). Sei n ∈ N eine natürliche Zahl, und sei P(Rn ) die Potenzmenge von Rn . Dann heißt die Funktion meas∗ : P(Rn ) → R ∪ {∞}, welche durch ) (∞ ∞ [ X ∗ n Jk ⊇ A meas (A) := inf vol(Jk ) (Jk )k∈N ist eine Folge in J (R ) mit k=1 k=1 P(Rn ) für alle A ∈ definiert ist, die n-dimensionale, äußere Lebesgue–Maßfunktion. Für jede Menge A ∈ P(Rn ) nennt man meas∗ (A) das n-dimensionale, äußere Lebesgue–Maß von A. Die Definition des n-dimensionalen äußeren Lebesgue–Maßes kann folgendermaßen motiviert werden: Durch die äußere Lebesgue–Maßfunktion meas∗ soll jeder Teilmenge A des Rn genau eine nichtnegative Zahl meas∗ (A) zugeordnet werden, die einen möglichen Wert für das Volumen von A darstellt. Dabei lässt man die Frage außer Acht, ob der Menge A tatsächlich in sinnvoller Weise ein Volumen zugeordnet werden kann. Zu dem möglichen Wert für das Volumen von A gelangt man durch folgende Überlegung: Wenn eine Folge rechtsoffener Intervalle (Jk )k∈N eine Überdeckung (siehe Abschnitt 3.4) von A bildet, dann muss die Summe aller Intervallvolumina größer oder gleich dem Volumen von A sein. Kann man die Überdeckung (Jk )k∈N so wählen, dass die Summe der Intervallvolumina möglichst klein ist, so hat man das mögliche Volumen von A gut approximiert. Man sucht also das Infimum der Menge (∞ ) ∞ X [ n vol(Jk ) (Jk )k∈N ist eine Folge in J (R ) mit Jk ⊇ A . k=1 k=1 Da jedes Intervallvolumen größer oder gleich Null ist, ist auch die Summe aller Intervallvolumina größer oder gleich Null. Dies gilt für jede Folge rechtsoffener Intervalle (Jk )k∈N , die eine Überdeckung von A bildet. Die obige Menge ist also durch Null nach unten beschränkt, weshalb sie ein Infimum besitzt. Dieses Infimum, welches die Zahl meas∗ (A) definiert, ist die größte untere Schranke für alle Volumensummen von Intervallfolgen, welche die Menge A überdecken. Das äußere Lebesgue–Maß besitzt eine Reihe von Eigenschaften, die man von einem Volumenbegriff erwarten würde. Der nachfolgende Satz listet die wichtigsten Eigenschaften des äußeren Lebesgue–Maßes auf. 162 KAPITEL 7. INTEGRALRECHNUNG Satz 7.1. Sei n ∈ N eine natürliche Zahl. Dann gelten die folgenden Aussagen. (1) meas∗ (∅) = 0. (2) Seien A ∈ P(Rn ) und B ∈ P(Rn ) zwei Mengen mit A ⊆ B. Dann gilt meas∗ (A) ≤ meas∗ (B). (3) Sei (Ak )k∈N eine Folge in P(Rn ). Dann gilt ! ∞ ∞ [ X ∗ meas Ak ≤ meas∗ (Ak ). k=1 k=1 (4) Sei A ∈ P(Rn ) eine Menge und x ∈ Rn ein Vektor. Dann gilt meas∗ (A + x) = meas∗ (A). Hierbei ist A + x := {a + x | a ∈ A}. Weiterhin kann man zeigen, dass das n-dimensionale äußere Lebesgue–Maß meas∗ (J) eines rechtsoffenen Intervalls J ∈ J (Rn ) mit dem Volumen vol(J) des Intervalls überein. Dies ist der Inhalt des nachfolgenden Satzes. Satz 7.2. Sei n ∈ N eine natürliche Zahl und J ∈ J (Rn ) ein rechtsoffenes Intervall. Dann gilt meas∗ (J) = vol(J). Mit Hilfe des äußeren Lebesgue–Maßes wird eine wichtige Klasse von Mengen definiert, welche man die Lebesgue–Nullmengen nennt. Definition (Lebesgue–Nullmenge). Eine Menge N ⊆ Rn wird Lebesgue–Nullmenge genannt, wenn meas∗ (N ) = 0 gilt. Die Menge aller Teilmengen des Rn , welche Lebesgue– Nullmengen sind, wird mit N (Rn ) bezeichnet. Nach Definition des n-dimensionalen äußeren Lebesgue–Maßes ist eine Teilmenge N des Rn genau dann eine Lebesgue–Nullmenge, wenn es zu jeder positiven Zahl ε > 0 eine Folge (Jk )k∈N in J gibt, so dass ∞ [ Jk ⊇ N k=1 und ∞ X vol(Jk ) < ε k=1 gilt. Nachfolgend geben wir einige wichtige Beispiele für Lebesgue–Nullmengen an. Beispiele. (a) Laut Aussage (1) in Satz 7.1 ist die leere Menge ∅ eine Lebesgue–Nullmenge. (b) Jede einpunktige Menge {x} mit x ∈ Rn ist eine Lebesgue–Nullmenge. 7.1. DAS LEBESGUE–MASS 163 (c) Man kann zeigen dass jede Vereinigung abzählbar vieler Lebesgue–Nullmengen ebenfalls eine Lebesgue–Nullmenge ist. Daher sind auch die Mengen N, Z und sogar Q als Teilmengen von R Lebesgue–Nullmengen. (d) Jede Gerade im Vektorraum Rn mit n ≥ 2 und jede Ebene im Vektorraum Rn mit n ≥ 3 eine Lebesgue–Nullmenge. ♦ Wie bereits angedeutet wurde, wird das n-dimensionale äußere Lebesgue–Maß letztendlich nicht dazu verwendet, einen Volumenbegriff für Teilmengen des Rn zu definieren. Der Grund hierfür ist, dass die Funktion meas∗ im Allgemeinen nicht additiv ist. Man kann nämlich zeigen, dass es Teilmengen A des Rn gibt, für die jeweils mindestens eine Menge E ⊆ Rn existiert, so dass meas∗ (E) < meas∗ (E ∩ A) + meas∗ (E \ A) gilt. Definiert man nun die Menge B := E \ A, so sind A und B offenbar zwei disjunkte Mengen, für die A ∪ B = E gilt. Würde man das äußere Lebesgue–Maß dazu verwenden, die Volumina der Mengen A, B und A∪B zu definieren, so würde dies zu einem paradoxen Resultat führen. Aus der obigen Ungleichung und der Tatsache, dass E ∩ A ⊆ A gilt, folgt nämlich die Ungleichungskette meas∗ (A ∪ B) = meas∗ (E) < meas∗ (E ∩ A) + meas∗ (B) ≤ meas∗ (A) + meas∗ (B). Die Summe der Volumina von A und B wäre somit echt größer als das Volumen der disjunkten Vereinigung von A und B. Dies widerspricht jedoch einer fundamentalen Vorstellung, die man üblicherweise von einem Volumenbegriff hat. Die Summe der Volumina zweier disjunkter Mengen sollte nach dieser Vorstellung nämlich stets gleich dem Volumen der Vereinigung beider Mengen sein. Was ist also zu tun? Einerseits besitzt das n-dimensionale äußere Lebesgue–Maß eine Reihe wichtiger Eigenschaften, die man von einem Volumenbegriff erwarten würde. Andererseits führt das n-dimensionale äußere Lebesgue–Maß für gewisse Teilmengen des Rn zu Resultaten, die mit einem Volumenbegriff nicht vereinbar sind. Einerseits ist das Lebesgue–Maß also ein natürlicher Kandidat für einen Volumenbegriff, andererseits liefert es für bestimmte Mengen paradoxe Resultate. Aus diesem Grund geht man folgendermaßen vor: Zunächst gibt man das Ziel auf, für jede Teilmenge des Rn ein Volumen zu definieren. Mit Hilfe des äußeren Lebesgue–Maßes definiert man dann nur für jene Teilmengen des Rn ein Volumen, für die sich keine paradoxen Resultate ergeben. Solche Mengen werden Lebesgue–messbar genannt. Definition (Lebesgue–messbare Menge). Sei n ∈ N eine natürliche Zahl. Eine Menge A ⊆ Rn wird Lebesgue–messbar genannt, wenn meas∗ (E) = meas∗ (E ∩ A) + meas∗ (E \ A) für alle E ⊆ Rn gilt. Das Mengensystem aller Lebesgue–messbaren Teilmengen des Rn wird mit L(Rn ) bezeichnet. Das Mengensystem L(Rn ) besteht genau aus den Teilmengen des Rn , für die man mit Hilfe des äußeren Lebesgue–Maßes einen sinnvollen Volumenbegriff definieren kann. Wie die nachfolgenden beiden Sätze zeigen, ist das Mengensystem L(Rn ) sehr groß, d.h. es enthält sehr viele Teilmengen des Rn . 164 KAPITEL 7. INTEGRALRECHNUNG Satz 7.3. Sei n ∈ N eine natürliche Zahl. Dann gelten die folgenden Aussagen. (1) Rn ⊆ L(Rn ). (2) Für jede Menge A ⊆ L(Rn ) gilt auch Rn \ A ∈ L(Rn ). (3) Sei (Ak )k∈N eine Folge in L(Rn ). Dann gilt ∞ [ Ak ∈ L(Rn ). k=1 Sei (Ak )k∈N eine Folge in L(Rn ). Dann gilt ∞ \ Ak ∈ L(Rn ). k=1 Im wesentlichen besagt der Satz 7.3, dass man aus gegebenen Lebesgue–messbaren Mengen durch Bildung des Komplements, der Vereinigung und des Durchschnitts weitere Lebesgue–messbare Mengen konstruieren kann. Der nachfolgende Satz listet einige Klassen Lebesgue–messbarer Mengen auf. Satz 7.4. Sei n ∈ N eine natürliche Zahl. Dann gelten die folgenden Aussagen. (1) Für jede offene Menge O ⊆ Rn gilt O ∈ L(Rn ). (2) Für jede abgeschlossene Menge A ⊆ Rn gilt A ∈ L(Rn ). (3) Für jedes rechtsoffene Intervall J ⊆ J (Rn ) gilt J ∈ L(Rn ). (4) Für jede Nullmenge N ⊆ N (Rn ) gilt N ∈ L(Rn ). Für alle Lebesgue–messbaren Teilmengen des Rn definiert man nun in folgender Weise das so genannte n-dimensionale Lebesgue–Maß. Definition (Lebesgue–Maß). Sei n ∈ N eine natürliche Zahl, und sei L(Rn ) das Mengensystem aller Lebesgue–messbaren Teilmengen von Rn . Dann heißt die Funktion meas : L(Rn ) → R ∪ {∞}, welche durch meas(A) := meas∗ (A) für alle A ∈ L(Rn ) definiert ist, die n-dimensionale, Lebesgue–Maßfunktion. Für jede Menge A ∈ L(Rn ) nennt man meas(A) das n-dimensionale, Lebesgue–Maß von A. Per Definition stimmt das Lebesgue–Maß meas(A) jeder Lebesgue–messbaren Menge A stets mit dem äußeren Lebesgue–Maß meas∗ (A) der Menge überein. Die Funktionen meas und meas∗ unterscheiden sich nämlich lediglich in ihren Definitionsbereichen. Während die äußere Lebesgue–Maßfunktion meas∗ auf der Potenzmenge P(Rn ) definiert ist, ist die Lebesgue–Maßfunktion meas nur auf dem Mengensystem aller Lebesgue–messbaren Mengen L(Rn ) definiert. Da L(Rn ) eine Teilmenge von P(Rn ) ist, gilt der folgende Grundsatz: Sämtliche Aussagen in Satz 7.1 bleiben gültig, wenn man P(Rn ) durch L(Rn ) und meas∗ durch meas ersetzt. Darüber hinaus besitzt das n-dimensionale Lebesgue– Maß weitere wichtige Eigenschaften, die im nachfolgenden Satz aufgelistet werden. 7.1. DAS LEBESGUE–MASS 165 Satz 7.5. Sei n ∈ N eine natürliche Zahl. Dann gelten die folgenden Aussagen. (1) Sei J ∈ J (Rn ) ein rechtsoffenes Intervall. Dann gilt meas(J) = vol(J). (2) Sei (Ak )k∈N eine Folge paarweise disjunkter Mengen in L(Rn ). Dann gilt ! ∞ ∞ [ X meas Ak = meas(Ak ). k=1 k=1 (3) Seien A ∈ L(Rn ) und B ∈ L(Rn ) zwei Lebesgue–messbare Mengen. Dann gilt meas(A ∪ B) + meas(A ∩ B) = meas(A) + meas(B). Die Aussage (2) in Satz 7.5 impliziert, dass das Lebesgue–Maß additiv ist. Sind nämlich A und B zwei disjunkte, Lebesgue–messbare Teilmengen des Rn , so kann man eine Folge paarweise disjunkter Mengen (Ak )k∈N in L(Rn ) durch A1 := A, A2 := B und Ak := ∅ für alle k ∈ N mit k ≥ 3 definieren. Es gilt dann ! ∞ ∞ [ X meas(A ∪ B) = meas Ak = meas(Ak ) = meas(A) + meas(B). k=1 k=1 Die Summe der Lebesgue–Maße zweier disjunkter Mengen ist somit immer gleich dem Lebesgue–Maß der Vereinigung beider Mengen. Diese Eigenschaft war für das äußere Lebesgue–Maß nicht gegeben. Das Lebesgue–Maß erfüllt indes alle wichtigen Eigenschaften eines Volumens. Daher definiert man für jede Lebesgue–messbare Teilmenge A des Rn das n-dimensionale Lebesgue–Maß meas(A) als das Volumen von A. Laut Aussage (1) in Satz 7.5 kann das Lebesgue–Maß eines rechtsoffenen Intervalls explizit berechnet werden. Kann man weiterhin eine gegebene Menge A ⊆ Rn als disjunkte Vereinigung einer Folge paarweise disjunkter, rechtsoffener Intervalle (Jk )k∈N und einer Lebesgue–Nullmenge N darstellen, so kann man auch das Lebesgue–Maß von A explizit berechnen. Es gilt dann nämlich ! ! ∞ ∞ ∞ [ [ X meas(A) = meas N ∪ Ak = meas(N ) + meas Ak = 0 + meas(Ak ). k=1 k=1 k=1 Man betrachte dazu auch die nachfolgenden Beispiele. Beispiele. (a) Es soll das eindimensionale Lebesgue–Maß eines nichtleeren, abgeschlossenen Intervalls [a, b] mit den Intervallgrenzen a, b ∈ R bestimmt werden. Offenbar ist [a, b] die disjunkte Vereinigung des rechtsoffenen Intervalls [a, b) und der Lebesgue–Nullmenge {b}. Es gilt demnach meas [a, b] = meas [a, b) ∪ {b} = meas [a, b) + meas {b} = meas [a, b) = b − a. 166 KAPITEL 7. INTEGRALRECHNUNG (a) (b) Abbildung 7.2: (a) Das Dreieck ∆ := {x ∈ R2 | x1 ≥ 0, x2 ≥ 0, x1 + x2 < 1}. (b) Eine (l) mögliche Kachelung“ von ∆ mit rechtsoffenen Intervallen Jk . ” (b) Sei (a, b) ein nichtleeres, offenes Intervall mit den Intervallgrenzen a, b ∈ R. Dann ist das rechtsoffene Intervall [a, b) offenbar die disjunkte Vereinigung von (a, b) und der Lebesgue–Nullmenge {a}. Man erhält also meas (a, b) = meas {a} + meas (a, b) = meas {a} ∪ (a, b) = meas [a, b) = b − a. (c) Die Menge ∆ := {x = (x1 , x2 )T ∈ R2 |x1 ≥ 0, x2 ≥ 0, x1 +x2 < 1} besitzt die Gestalt eines rechtwinkligen Dreiecks, dessen Katheten parallel zu den Koordinatenachsen im R2 verlaufen (siehe Abbildung 7.2(a)). Das zweidimensionale Lebesgue–Maß dieser Menge kann folgendermaßen bestimmt werden: Für jeden Index l ∈ N0 und jeden Index k ∈ {0, 1, . . . , 2l − 1} definiert man das zweidimensionale, rechtsoffene Intervall l k 2k + 1 2 − k − 1 2l+1 − 2k − 1 (l) Jk := l , l+1 × , . 2 2 2l 2l+1 (l) Man kann zeigen, dass ∆ die disjunkte Vereinigung all dieser Intervalle Jk ist (siehe Abbildung 7.2(b)). Man rechnet außerdem leicht nach, dass (l) meas Jk = 1 22l+2 für alle l ∈ N0 und alle k ∈ {0, 1, . . . , 2l − 1} gilt. Entsprechende erhält man !! ! l −1 l −1 ∞ 2[ ∞ 2X [ X (l) (l) meas(∆) = meas Jk = meas Jk = ∞ X l=0 l=0 l 2 22l+2 k=0 = 1 4 ∞ X l=0 l=0 1 2 l = k=0 1 1 · 4 1− 1 2 1 = . 2 Wie erwartet, entspricht das Lebesgue–Maß von ∆ genau dem Flächeninhalt eines rechtwinkligen Dreiecks, dessen Katheten beide die Länge 1 haben. ♦ Zum Abschluss dieses Kapitels kommen wir noch auf eine Formulierung zu sprechen, die häufig in der Integrationstheorie wie auch in der Stochastik verwendet wird. 7.1. DAS LEBESGUE–MASS 167 Definition (Lebesgue–fast überall). Sei n ∈ N eine natürliche Zahl, und sei A ⊆ Rn eine beliebige Menge. Man sagt, dass eine Eigenschaft Lebesgue–fast überall oder einfach nur fast überall auf A gilt, wenn die Menge N aller Punkte von A, für die die Eigenschaft nicht gilt, eine Lebesgue–Nullmenge ist. Die nachfolgenden Beispiele sollen verdeutlichen, wie die Formulierung fast überall“ üb” licherweise verwendet wird. Beispiele. (a) Die Signumfunktion sgn : R → R ist an jeder Stelle x ∈ R \ {0} stetig. An der Stelle x = 0 ist sie nicht stetig. Die Menge aller Punkte in R, an denen die Signumfunktion nicht stetig ist, ist also die einpunktige Menge {0}. Da {0} eine Lebesgue–Nullmenge ist, ist die Signumfunktion fast überall auf R stetig. (b) Die Betragsfunktion | · | : R → R ist an jeder Stelle x ∈ R \ {0} differenzierbar. Also ist die Betragsfunktion fast überall auf R differenzierbar. (c) Die so genannte Dirichlet–Funktion D : R → R ist durch ( 1 falls x ∈ Q, D(x) := 0 sonst für alle x ∈ R definiert. Da die Menge aller rationalen Zahlen Q eine Lebesgue– Nullmenge ist, besitzt die Dirichlet–Funktion fast überall auf R den Funktionswert Null. ♦ Übungsaufgaben 1. Sei n ∈ N eine natürliche Zahl, und seien A ∈ L(Rn ) und B ∈ L(Rn ) zwei Lebesgue–messbare Mengen. Zeigen Sie, dass dann auch A ∪ B ∈ L(Rn ), A ∩ B ∈ L(Rn ) und B \ A ∈ L(Rn ) gilt. Verwenden Sie dazu die Aussagen in Satz 7.3. Dabei kann es hilfreich sein, die Folge (Ak )k∈N in L(Rn ) zu betrachten, welche durch A1 := A, A2 := B und Ak := ∅ für alle k ≥ 3 definiert ist. 2. Sei n ∈ N eine natürliche Zahl, und seien A ∈ L(Rn ) und B ∈ L(Rn ) zwei Lebesgue– messbare Mengen mit A ⊆ B. Zeigen Sie, dass dann meas(B \ A) = meas(B) − meas(A) gilt. Verwenden Sie dazu die definierende Eigenschaft Lebesgue–messbarer Mengen, sowie die Tatsache, dass meas(M ) = meas∗ (M ) für alle M ∈ L(Rn ) gilt. 3. Bestimmen Sie die zweidimensionalen Lebesgue–Maße der folgenden Mengen: M1 := [3, 5) × [1, 2) ∪ [3, 4) × [2, 3) M2 := [0, 3) × [0, 2) ∪ [1, 3) × [1, 4) , M3 := [1, 4) × [3, 7) \ [2, 3) × [4, 6) , k ! ∞ [ 2 − 1 2k+1 − 1 1 M4 := , × 0, k+1 2k 2k+1 2 k=0 Verwenden Sie dazu die Aussagen in Satz 7.5. Es kann hilfreich sein, die Mengen zu skizzieren. 4. Zeigen Sie, dass die Strecke S := {x = (x1 , x2 )T ∈ R2 | 0 ≤ x1 < 1, x2 = x1 } eine Lebesgue– Nullmenge ist. Konstruieren Sie dazu für jede natürliche Zahl n ∈ N genau n rechtsoffene (n) (n) (n) (n) (n) (n) Intervalle J1 , J2 , . . . , Jn ∈ J (R2 ) derart, dass die Vereinigung J1 ∪ J2 ∪ · · · ∪ Jn die Strecke S überdeckt und die Summe der Intervallvolumina genau 1/n beträgt. 168 7.2 KAPITEL 7. INTEGRALRECHNUNG Das Lebesgue–Integral Nachdem wir im voran gegangenen Abschnitt das Lebesgue–Maß eingeführt haben, wenden wir uns in diesem Abschnitt dem so genannten Lebesgue–Integral zu. Es hat sich gezeigt, dass es verschiedene Möglichkeiten gibt, das Integral Z f (x) dx Ω einer Funktion f : D → R über einer Menge Ω ⊆ D mit D ⊆ Rn sinnvoll zu definieren. Verwendet man die Definition, die im wesentlichen auf Henri Léon Lebesgue zurück geht, erhält man das so genannte Lebesgue–Integral von f über Ω. Andere Definitionen des Integrals gehen auf den deutschen Mathematiker Bernhard Riemann (1826–1866) bzw. auf den französischen Mathematiker Marie Ennemond Camille Jordan (1838–1922) zurück. Verwendet man deren Definitionen, so erhält man das Riemann–Integral bzw. das Jordan– Integral von f über Ω. Heutzutage verwendet man in der Regel die Definition des Integrals nach Lebesgue. Wie wir noch sehen werden, kann das Lebesgue–Integral von f über Ω nur für bestimmte Funktionen f und nur für bestimmte Mengen Ω definiert werden. Die Menge Ω muss nämlich Lebesgue–messbar sein. Die Funktion f wiederum muss ebenfalls Lebesgue-messbar sein. Was dies bedeutet soll nachfolgend erläutert werden. Zunächst jedoch definieren wir einige grundlegende Begriffe. Definition (charakteristische Funktion). Sei n ∈ N eine natürliche Zahl, und seien D ⊆ Rn und A ⊆ Rn zwei beliebige Mengen. Dann heißt die Funktion χA : D → R, welche durch ( 1 falls x ∈ D ∩ A, χA (x) := 0 falls x ∈ D \ A für alle x ∈ D definiert ist, die charakteristische Funktion oder die Indikatorfunktion von A auf D genannt. Gemäß Definition nimmt jede charakteristische Funktion χA auf einer Menge D maximal zwei verschiedene Funktionswerte an, nämlich 0 und 1. Für die zugehörigen Urbilder gilt −1 χ−1 A ({0}) = D \ A und χA ({1}) = D ∩ A. Wir kennen bereits einige Funktionen, die als charakteristische Funktionen bestimmter Teilmengen von R aufgefasst werden können. Man betrachte dazu die nachfolgenden Beispiele. Beispiele. (a) Die charakteristische Funktion χ[0,∞) : R → R der Menge aller nichtnegativen Zahlen auf R entspricht genau der Heaviside–Funktion (siehe Beispiel (b) auf Seite 102). (b) Die charakteristische Funktion χQ : R → R der Menge aller rationalen Zahlen auf R entspricht genau der Dirichlet–Funktion (siehe Beispiel (c) auf Seite 167). ♦ Mit Hilfe der charakteristischen Funktionen kann man eine bestimmte Klasse reellwertiger Funktionen definieren, die als einfache Funktionen bezeichnet werden. 7.2. DAS LEBESGUE–INTEGRAL 169 Definition (einfache Funktion). Sei n ∈ N eine natürliche Zahl und D ∈ L(Rn ) eine nichtleere, Lebesgue–messbare Menge. Eine Funktion f : D → R wird einfach genannt, wenn es endlich viele Lebesgue–messbare Mengen A1 , A2 , . . . , AN ∈ L(Rn ) und ebenso viele von Null verschiedene Zahlen a1 , a2 , . . . , aN ∈ R \ {0} gibt, so dass f= N X ak χAk k=1 gilt, wobei χAk für alle k = 1, 2, . . . , N die charakteristische Funktion der Menge Ak auf D bezeichnet. Die Menge aller einfachen Funktionen von D nach R wird im folgenden mit E(D) bezeichnet. Einfache Funktionen sind also Linearkombinationen endlich vieler charakteristischer Funktionen von Lebesgue–messbaren Mengen. Aus diesem Grund besitzt jede einfache Funktion nur endlich viele unterschiedliche Funktionswerte. Nachfolgend geben wir einige Beispiele für einfache Funktionen an. Beispiele. (a) Für je zwei Lebesgue–messbare Mengen D ∈ L(Rn ) und A ∈ L(Rn ) ist die charakteristische Funktion χA von A auf D einfach. (b) Jede Nullfunktion f : Rn → {0} ist einfach. Es gilt nämlich f = χ∅ , wobei χ∅ die charakteristische Funktion der leeren Menge auf Rn bezeichnet. Die leere Menge ist eine Lebesgue–Nullmenge und somit Lebesgue–messbar laut Satz 7.4(4). (c) Jede konstante Funktion f : Rn → {a} mit a > 0 ist einfach. Es gilt nämlich f = aχRn . Hierbei bezeichnet χRn die charakteristische Funktion von Rn auf Rn . Der Vektorraum Rn ist laut Satz 7.3(1) eine Lebesgue–messbare Menge. (d) Die Signumfunktion sgn : R → R ist einfach. Es gilt nämlich sgn = χ(0,∞) − χ(−∞,0) , wobei χ(−∞,0) und χ(0,∞) die charakteristischen Funktionen der Mengen aller negativen bzw. aller positiven Zahlen auf R bezeichnen. Die Mengen (−∞, 0) und (0, ∞) sind offen und damit auch Lebesgue–messbar laut Satz 7.4(1). ♦ Für einfache Funktionen, deren Funktionswerte nichtnegativ sind, definiert man das Lebesgue– Integral in folgender Weise. Definition (Lebesgue–Integral einer nichtnegativen, einfachen Funktion). Sei n ∈ N eine natürliche Zahl, sei D ∈ L(Rn ) eine nichtleere, Lebesgue–messbare Menge, PN und sei f ∈ E(D) eine einfache Funktion mit der Darstellung f = k=1 ak χAk , wobei die Zahlen a1 , a2 , . . . , aN alle positiv seien. Sei ferner Ω ∈ L(Rn ) eine Lebesgue–messbare Menge mit Ω ⊆ D. Dann nennt man Z f (x) dx := Ω das Lebesgue–Integral von f über Ω. N X k=1 ak meas(Ak ∩ Ω) 170 KAPITEL 7. INTEGRALRECHNUNG (a) (b) Abbildung 7.3: (a) Graph der einfachen Funktion f = 2χ[−1,1] +χ[2,3) +3χ[3,5] . (b) Das Lebesgue–Integral von f über dem Intervall [0, 4] entspricht genau dem Flächeninhalt der grau unterlegten Fläche. Um das Lebesgue–Integrals einer nichtnegativen, einfachen Funktion f zu berechnen, muss man lediglich zu jedem positiven Funktionswert ak von f die Teilmenge Ak ∩ Ω des Integrationsbereichs kennen, auf der dieser Funktionswert angenommen wird. Das Lebesgue– Integral wird dann berechnet, indem man jeden positiven Funktionswert mit dem Maß der entsprechenden Menge multipliziert und anschließend alle Produkte aufsummiert. Da das Lebesgue–Maß einer Menge auch ∞ sein kann, ist es durchaus möglich, dass Z f (x) dx = ∞ Ω gilt. Das Integral wird in diesem Fall unbeschränkt genannt. Die Berechnung des Lebesgue– Integrals einer nichtnegativen, einfachen Funktion soll noch anhand eines Beispiels verdeutlicht werden. Beispiel. Die einfache Funktion f ∈ E(R) sei durch f := 2χ[−1,1] + χ[2,3) + 3χ[3,5] definiert (siehe Abbildung 7.3(a)). Offenbar besitzt f nur nichtnegative Funktionswerte, weshalb das Lebesgue–Integral von f über jeder Lebesgue–messbaren Teilmenge Ω von R definiert ist. Im Fall Ω = [0, 4] erhält man insbesondere Z f (x) dx = 2 meas [−1, 1] ∩ [0, 4] + meas [2, 3) ∩ [0, 4] + 3 meas [3, 5] ∩ [0, 4] [0,4] = 2 meas [0, 1] + meas [2, 3) + 3 meas [3, 4] =2·1+1+3·1 = 6. Das Lebesgue–Integral entspricht genau dem Flächeninhalt der Menge aller Punkte, die sich unterhalb des Graphen von f und oberhalb der x-Achse, sowie innerhalb des Intervalls [0, 4] befinden (siehe Abbildung 7.3(b)). ♦ Bislang wurde das Lebesgue–Integral lediglich für nichtnegative, einfache Funktionen definiert. Unser nächstes Ziel ist es, das Lebesgue–Integral darüber hinaus für möglichst viele Funktionen zu definieren. Zu diesem Zwecken führen wir den sogenannten Positivteil und den Negativteil einer reellwertigen Funktion ein. Definition (Positivteil). Sei X eine nichtleere Menge und f : X → R eine Funktion. Dann heißt die Funktion f + : X → R, welche durch f + (x) := max{f (x), 0} für alle x ∈ X definiert ist, der Positivteil von f . 7.2. DAS LEBESGUE–INTEGRAL (a) 171 (b) (c) Abbildung 7.4: (a) Graph einer Funktion f : R → R. (b) Graph des Positivteils f + von f . (c) Graph des Negativteils f − von f . Definition (Negativteil). Sei X eine nichtleere Menge und f : X → R eine Funktion. Dann heißt die Funktion f − : X → R, welche durch f − (x) := max{−f (x), 0} für alle x ∈ X definiert ist, der Negativteil von f . Man macht sich leicht klar, dass für jede reellwertige Funktion f die Identität f = f+ − f− gilt. Zu beachten ist, dass sowohl der Positivteil f + als auch der Negativteil f − nichtnegative Funktionen sind. Es ist daher möglich, jede reellwertige Funktion als Differenz zweier nichtnegativer Funktionen darzustellen. Man überlegt sich außerdem leicht, dass der Positivteil und der Negativteil jeder einfachen Funktion ebenfalls einfache Funktionen sind. Als nächstes definieren wir eine Klasse von Funktionen, die als Grenzfunktionen bestimmter Folgen von einfachen Funktionen darstellbar sind. Diese Funktionen werden Lebesgue–messbar genannt. Definition (Lebesgue–messbare Funktion). Sei n ∈ N eine natürliche Zahl, und sei D ∈ L(Rn ) eine nichtleere, Lebesgue–messbare Menge. Eine Funktion f : D → R wird Lebesgue–messbar genannt, wenn eine Funktionenfolge (fm )m∈N in E(D) existiert, so dass + (x)) − für jedes x ∈ D die Folgen (fm m∈N und (fm (x))m∈N monoton wachsend sind und gegen f + (x) bzw. gegen f − (x) konvergieren. Die Menge aller Lebesgue–messbaren Funktionen, die auf einer Lebesgue–messbaren Menge D definiert sind, ist sehr groß. Wie der nachfolgende Satz zeigt, umfasst diese Menge insbesondere alle stetigen Funktionen auf D. Satz 7.6. Sei n ∈ N eine natürliche Zahl, sei D ∈ L(Rn ) eine Lebesgue–messbare Menge, und sei f : D → R eine stetige Funktion. Dann ist f Lebesgue–messbar. Da der Positivteil f + wie auch der Negativteil f − einer Lebesgue–messbaren Funktion f Grenzfunktionen zweier Folgen nichtnegativer, einfacher Funktionen sind, und da für jede nichtnegative, einfache Funktion das Lebesgue–Integral über einer Lebesgue–messbaren Menge Ω definiert ist, kann man in folgender Weise das Lebesgue–Integral von f + und f − über Ω definieren. 172 KAPITEL 7. INTEGRALRECHNUNG Definition (Lebesgue–Integral des Positivteils). Sei n ∈ N eine natürliche Zahl, sei D ∈ L(Rn ) eine nichtleere, Lebesgue–messbare Menge, und sei f : D → R eine Lebesgue– messbare Funktion. Sei außerdem (fm )m∈N eine Funktionenfolge in E(D), so dass für jedes + (x)) + x ∈ D die Folge (fm m∈N streng monoton wachsend gegen f (x) konvergiert. Für jede n Lebesgue–messbare Menge Ω ∈ L(R ) mit Ω ⊆ D heißt dann Z Z + fm (x) dx f + (x) dx := lim m→∞ Ω Ω das Lebesgue–Integral von f + über Ω. Definition (Lebesgue–Integral des Negativteils). Sei n ∈ N eine natürliche Zahl, sei D ∈ L(Rn ) eine nichtleere, Lebesgue–messbare Menge, und sei f : D → R eine Lebesgue– messbare Funktion. Sei außerdem (fm )m∈N eine Funktionenfolge in E(D), so dass für jedes − (x)) − x ∈ D die Folge (fm m∈N streng monoton wachsend gegen f (x) konvergiert. Für jede Lebesgue–messbare Menge Ω ∈ L(Rn ) mit Ω ⊆ D heißt dann Z Z − − fm (x) dx f (x) dx := lim m→∞ Ω Ω das Lebesgue–Integral von f − über Ω. Man beachte, dass die Integrale der einfachen Funktionen in den obigen Definition unbeschränkt sein können. Außerdem können sie gegen ∞ bestimmt divergieren, wenn m gegen ∞ strebt. In beiden Fällen wäre dann das Integral des Positivteils bzw. des Negativteils unbeschränkt. Ist hingegen f eine Funktion derart, dass jedes Integral des Positivteils f + und jedes Integral des Negativteils f − beschränkt ist, so nennt man die Funktion f Lebesgue–integrierbar. Definition (Lebesgue–integrierbare Funktion). Sei n ∈ N eine natürliche Zahl, und sei D ∈ L(Rn ) eine nichtleere, Lebesgue–messbare Menge. Eine Funktion f : D → R wird Lebesgue–integrierbar genannt, wenn sie Lebesgue–messbar ist, und wenn Z f + (x) dx < ∞ D und Z f − (x) dx < ∞ D gilt. Die Menge aller Lebesgue–integrierbaren Funktionen von D nach R wird üblicherweise mit L1 (D) bezeichnet. Für jede Lebesgue–integrierbare Funktion kann nun in folgender Weise das Lebesgue– Integral definiert werden. Definition (Lebesgue–Integral). Sei n ∈ N eine natürliche Zahl, und sei D ∈ L(Rn ) eine nichtleere, Lebesgue–messbare Menge, und sei f ∈ L1 (D) eine Lebesgue–messbare Funktion. Sei ferner Ω ∈ L(Rn ) eine Lebesgue-messbare Menge mit Ω ⊆ D. Dann heißt Z Z Z + f (x) dx := f (x) dx − f − (x) dx Ω das Lebesgue–Integral von f über Ω. Ω Ω 7.2. DAS LEBESGUE–INTEGRAL (a) 173 (b) (c) Abbildung 7.5: (a)–(c) Die Folge nichtnegativer, einfacher Funktionen (fm )m∈N konvergiert punktweise monoton wachsend gegen die Funktion f : [0, 1] → R, x 7→ x2 . Die Flächeninhalte der grau unterlegten Bereiche entsprechen jeweils genau den Lebesgue– Integralen der Folgenglieder von (fm )m∈N . Das nachfolgende Beispiel dient dazu, die Definition des Lebesgue–Integrals noch einmal zu verdeutlichen. Außerdem zeigt das Beispiel, wie man das Lebesgue–Integral bestimmter Funktionen streng nach Definition“ berechnen kann. ” Beispiel. Wir betrachten die Funktion f : [0, 1] → R, welche durch f (x) := x2 für alle x ∈ Rn definiert ist. Da die Funktion f ausschließlich nichtnegative Funktionswerte besitzt, gilt f + = f und f − = 0. Für jede natürliche Zahl m ∈ N und jeden Index k ∈ {1, 2, . . . , 2m − 1} definieren wir das rechtsoffene Intervall k k+1 (m) Jk := m , m 2 2 (m) (m) sowie die Zahl ak := k 2 /22m . Es gilt dann meas(Jk ) = 1/2m für alle m ∈ N und jeden Index k ∈ {1, 2, . . . , 2m − 1}. Als nächstes definieren wir die Funktionenfolge (fm )m∈N in E([0, 1]) durch m−1 2X (m) fm := ak χJ (m) k=1 k für alle m ∈ N (siehe Abbildung 7.5). Man überlegt sich leicht, dass m 2 b2 xc + fm (x) = fm (x) = 2m für alle m ∈ N und alle x ∈ [0, 1] gilt. Verwendet man die Tatsache, dass ba+bc ≥ bac+bbc + (x)) für alle a, b ∈ R gilt, so kann man zeigen, dass die Folge (fm m∈N für jedes x ∈ [0, 1] monoton wächst. Mit Hilfe des Sandwichtheorems (siehe Satz 4.3) zeigt man außerdem leicht, + (x)) 2 dass die Folge (fm m∈N für jedes x ∈ [0, 1] gegen x und somit gegen den Funktions+ + wert f (x) konvergiert. Die Folge (fm )m∈N konvergiert also punktweise monoton wachsend gegen f + . Die Funktion f ist demnach Lebesgue–messbar. Weiterhin gilt Z Z + f (x) dx = lim [0,1] m→∞ [0,1] = lim m→∞ = lim m→∞ m −1 2X k=1 1 23m + fm (x) dx = lim m→∞ 1 k2 = lim 23m m→∞ 23m m −1 2X k=1 m −1 2X (m) ak k2 k=1 (2m − 1)2m (2m+1 − 1) · 6 (m) meas Jk 174 KAPITEL 7. INTEGRALRECHNUNG 2 · 23m − 3 · 22m + 2m m→∞ 6 · 23m 2 − 3 · 2−m + 2−2m = lim m→∞ 6 1 = , 3 = lim sowie Z f − (x) dx = 0, [0,1] da der Negativteil f − von f die Nullfunktion ist. Die Funktion f ist also Lebesgue– integrierbar, und ihr Lebesgue–Integral über dem Intervall [0, 1] ist durch Z Z Z 1 + f − (x) dx = f (x) dx − f (x) dx = 3 [0,1] [0,1] [0,1] gegeben. ♦ Natürlich ist die im Beispiel verwendete Methode zur Berechnung des Lebesgue–Integrals für die meisten Funktionen eher ungeeignet. In vielen Fällen kann man ein Lebesgue– Integral nämlich mittels bestimmter Integrationsregeln berechnen. Einige dieser Integrationsregeln werden wir im nachfolgenden Abschnitt kennen lernen. Im Folgenden gehen wir zunächst auf grundlegende Eigenschaften des Lebesgue–Integrals ein. Der nachfolgende Satz zählt die wichtigsten Eigenschaften auf. Satz 7.7. Sei n ∈ N eine natürliche Zahl, und seien D ∈ L(Rn ) und Ω ∈ L(Rn ) zwei Lebesgue–messbare Mengen mit Ω ⊆ D. Seien ferner f ∈ L1 (D) und g ∈ L1 (D) zwei Lebesgue–integrierbare Funktionen, und sei α ∈ R eine reelle Zahl. Dann gelten die folgenden Aussagen: (1) Das Lebesgue–Integral ist linear, d.h. es gilt Z Z Z f (x) + g(x) dx = f (x) dx + g(x) dx, Ω Ω Ω Z Z αf (x) dx = α f (x) dx. Ω Ω (2) Wenn eine Lebesgue–Nullmenge N ∈ L(Rn ) mit N ⊆ D existiert, so dass f (x) ≤ g(x) für alle x ∈ Ω \ N gilt, dann gilt auch Z Z f (x) dx = g(x) dx. Ω Ω (3) Sei (Ωk )k∈N eine Folge paarweise disjunkter Mengen in L(Rn ), d.h. es gelte Ωk ∩Ωl = ∅ für alle k, l ∈ N mit k 6= l. Wenn außerdem Ω= ∞ [ Ωk k=1 gilt, dann gilt auch Z f (x) dx = Ω ∞ Z X k=1 Ωk f (x) dx. 7.2. DAS LEBESGUE–INTEGRAL 175 (4) Für jede Lebesgue–Nullmenge N ∈ L(Rn ) mit N ⊆ D gilt Z f (x) dx = 0. N Die Aussage (1) in Satz 7.7 ( Das Lebesgue–Integral ist linear.“) kann noch etwas präziser ” gefasst werden: Definiert man zu je zwei Lebesgue–messbaren Mengen D ∈ L(Rn ) und Ω ∈ L(Rn ) mit Ω ⊆ D die Abbildung I : L1 (D) → R durch Z f (x) dx I(f ) := Ω für alle Lebesgue–integrierbaren Funktionen f ∈ L1 (D), so ist I eine lineare Abbildung. Die Aussage impliziert auch, dass die Menge L1 (D) ein Vektorraum über R ist. Gemäß Aussage (2) in Satz 7.7 ist die Abbildung I im folgenden Sinn monoton wach˙ definieren, indem man send: Auf der Menge L1 (D) kann man eine Ordnungsrelation ≤ 1 für jede zwei Lebesgue–integrierbare Funktionen f ∈ L (D) und g ∈ L1 (D) festlegt, dass ˙ g genau dann gelten soll, wenn eine Lebesgue–Nullmenge N ∈ L(Rn ) mit N ⊆ D f ≤ ˙ g besteht also existiert, so dass f (x) ≤ g(x) für alle x ∈ D \ N gilt. Die Relation f ≤ genau dann, wenn die Funktionswerte von f fast überall auf D kleiner oder gleich den ˙ g folgt dann stets I(f ) ≤ I(g). entsprechenden Funktionswerten von g sind. Aus f ≤ Die Aussagen (3) und (4) in Satz 7.7 sind für die Berechnung von Lebesgue–Integralen oft nützlich. Aus der Aussage (3) folgt insbesondere, dass für je zwei disjunkte Mengen A ⊆ L(Rn ) und B ⊆ L(Rn ) mit A ⊆ D und B ⊆ D stets Z Z Z f (x) dx = f (x) dx + f (x) dx A∪B A B gilt. Um dies zu sehen, definiert man die Menge Ω in Aussage (3) einfach durch Ω := A∪B und die Folge (Ωk )k∈N durch Ω1 := A, Ω2 := B und Ωk := ∅ für alle k ≥ 3. Dann nutzt man aus, dass gemäß Aussage (4) die Gleichung Z f (x) dx = 0 ∅ gilt. Eine weitere wichtige Folgerung aus Satz 7.7 ist durch das nachfolgende Lemma gegeben. Lemma 7.8. Sei n ∈ N eine natürliche Zahl, und sei D ∈ L(Rn ) eine Lebesgue–messbare Menge. Seien fernen f ∈ L1 (D) und g ∈ L1 (D) zwei Lebesgue–integrierbare Funktionen derart, dass eine Lebesgue–Nullmenge N ∈ L(Rn ) mit N ⊆ D existiert, so dass f (x) = g(x) für alle x ∈ D \ N gilt. Dann gilt Z Z f (x) dx = g(x) dx. Ω Ω Das Lebesgue–Integral zweier Funktionen stimmt also immer dann überein, wenn die Funktionen fast überall dieselben Funktionswerte annehmen. Zum Abschluss dieses Abschnitts führen wir noch einige häufig verwendete Schreibweise für Lebesgue–Integrale über eindimensionalen Intervallen ein. Sind a ∈ R ∪ {−∞} und b ∈ R ∪ {∞} zwei Zahlen, für die a ≤ b gilt, so definiert man Z b Z f (x) dx := f (x) dx. a (a,b) 176 KAPITEL 7. INTEGRALRECHNUNG Den Ausdruck auf der linken Seite bezeichnet man als das Integral von f von a nach b. Laut den Aussagen (3) und (4) von Satz 7.7 stimmt dieses Integral mit dem Integral von f über dem abgeschlossenen Intervall [a, b] überein, sofern a und b reelle Zahlen sind. Es gilt dann nämlich Z Z Z Z Z f (x) dx = f (x) dx + f (x) dx + f (x) dx = f (x) dx, {a} [a,b] {b} (a,b) (a,b) da die einpunktigen Mengen {a} und {b} Lebesgue–Nullmengen sind. Falls a < b gilt, definiert man außerdem Z b Z a f (x) dx. f (x) dx := − a b Übungsaufgaben 1. Die einfache Funktion f : R → R sei durch f := χ[0,1) + 2χ[1,2) + 3χ[2,3) + 4χ[3,4] definiert. Berechnen Sie das (Lebesgue–)Integral Z f (x) dx. R 2. Die Heaviside–Funktion H : R → R, die charakteristische Funktion χ{0} : R → R, die Dirichlet–Funktion D : R → R und die Signumfunktion sgn : R → R sind einfache Funktionen. Berechnen die die folgenden (Lebesgue–)Integrale: Z 1 Z 1 H(x) dx, −1 Z χ{0} (x) dx, 1 Z 1 D(x) dx, −1 sgn(x) dx. −1 0 3. Sei n ∈ N eine natürliche Zahl, sei D ∈ L(Rn ) eine Lebesgue–messbare Menge, und sei f : D → R eine Lebesgue–messbare Funktion. Zeigen Sie, dass f genau dann Lebesgue– integrierbar ist, wenn die Funktion |f | Lebesgue–integrierbar ist. 4. Seien n ∈ N eine natürliche Zahl, seien A ∈ L(Rn ) und B ∈ L(Rn ) zwei Lebesgue–messbare Mengen, und sei f ∈ L1 (A ∪ B) eine Lebesgue–integrierbare Funktion. Zeigen Sie, dass dann Z Z Z Z f (x) dx = f (x) dx + f (x) dx − f (x) dx A∪B A B A∩B gilt. 5. Sei n ∈ N eine natürliche Zahl, und sei D ∈ L(Rn ) eine Lebesgue–messbare Menge. Sei außerdem f ∈ L1 (D) eine Lebesgue–integrierbare Funktion mit der Eigenschaft, dass die Menge S := {x ∈ D | f (x) 6= 0} eine Lebesgue–Nullmenge ist. Zeigen Sie, dass dann Z |f (x)| dx = 0 D gilt. 7.3. BERECHNUNG VON INTEGRALEN 7.3 177 Berechnung von Integralen Nachdem in den voran gegangenen beiden Abschnitten definiert wurde, was das Lebesgue– Integral einer Lebesgue–integrierbaren Funktion über einer Lebesgue-messbaren Menge ist, wenden wir uns in diesem Abschnitt einigen Methoden zu, mit denen bestimmte Lebesgue– Integrale explizit berechnet werden können. Im Folgenden wird dabei nur noch von Inte” gralen“, integrierbaren Funktionen“ und messbaren Mengen“ die Rede sein. Gemeint sind ” ” damit jeweils Lebesgue–Integrale“, Lebesgue–integrierbare Funktionen“ und Lebesgue– ” ” ” messbare Mengen“. Es ist wichtig zu wissen, dass ist es nicht immer möglich ist, das Integral einer integrierbaren Funktion explizit zu berechnen. Auch die in diesem Abschnitt vorgestellten Integrationsmethoden lassen sich bei weitem nicht auf alle integrierbaren Funktionen anwenden. Das wichtigste Hilfsmittel für die explizite Berechnung von Integralen ist der so genannt Fundamentalsatz der Analysis. Bevor wir diesen Satz jedoch formulieren können, müssen wir zunächst definieren, was Stammfunktionen sind. Definition (Stammfunktion). Sei D ⊆ R eine nichtleere, offene Menge. Seien außerdem f : D → R und F : D → R zwei Funktionen, so dass F 0 = f gilt. Dann heißt F eine Stammfunktion von f . Man beachte, dass Stammfunktionen nicht eindeutig bestimmt sind. Sei beispielsweise F eine Stammfunktion von f , und sei α ∈ R eine reelle Zahl. Dann ist die Funktion G := F +α ebenfalls eine Stammfunktion von f . Es gilt nämlich G0 = (F + α)0 = F 0 = f. Stammfunktionen sind also nur bis auf additive Konstanten eindeutig bestimmt. Dies bereitet in der Regel jedoch keine Schwierigkeiten. Tatsächlich eröffnet sich dadurch die Möglichkeit, eine solche Konstante passend“ zur jeweiligen Anwendung zu wählen. ” Satz 7.9 (Fundamentalsatz der Analysis). Sei [a, b] ⊂ R ein nichtleeres, abgeschlossenes Intervall. Sei außerdem f ∈ L1 ([a, b]) eine integrierbare Funktion, und sei F : [a, b] → R eine Stammfunktion von f . Dann gilt Z b h ib f (x) dx = F (x) := F (b) − F (a). a x=a Üblicherweise bezeichnet man die Funktion, deren Integral berechnet werden soll, als Integrand. Der Fundamentalsatz der Analysis besagt, dass man das Integral einer integrierbaren Funktion über einem eindimensionalen Intervall immer dann explizit berechnen kann, wenn eine Stammfunktion des Integranden existiert. Es ist dabei üblich, die Differenz der Funktionswerte der Stammfunktion an den Integrationsgrenzen a und b mit h ib F (x) x=a zu bezeichnen. Oft wird auch einfach die Schreibweise h ib F (x) a verwendet, wenn klar ist, dass x die Variable der Stammfunktion ist. In den nachfolgenden Beispielen wird demonstriert, wie der Fundamentalsatz der Analysis angewendet wird. 178 KAPITEL 7. INTEGRALRECHNUNG Beispiele. (a) Es soll das Integral π Z sin(3x + π) dx 0 berechnet werden. Die Funktion f : R → R, welche durch f (x) := sin(3x + π) für alle x ∈ R gegeben ist, kann hierbei als Integrand angesehen werden. Wie man leicht erkennt, ist die Funktion F : R → R, welche durch F (x) := − cos(3x + π)/3 für alle x ∈ R definiert ist, eine Stammfunktion von f . Es gilt nämlich F 0 = f . Nach dem Fundamentalsatz der Analysis erhält man also Z π cos(3x + π) π cos(3π + π) cos(0 + π) sin(3x + π) dx = − =− − − 3 3 3 0 x=0 1 1 cos(4π) cos(π) =− + =− − 3 3 3 3 2 =− . 3 (b) Man betrachte das Integral Z 1 3x2 − 1 dx. −1 Der Integrand ist offenbar durch das Polynom f : R → R gegeben, welches durch f (x) := 3x2 − 1 für alle x ∈ R definiert ist. Man rechnet leicht nach, dass das Polynom F : R → R, welches durch F (x) = x3 − x für alle x ∈ R definiert ist, eine Stammfunktion von f ist. Daher erhält man 1 Z 1 = 13 − 1 − (−1)3 − (−1) = 1 − 1 + 1 − 1 = 0 3x2 − 1 dx = x3 − x −1 −1 nach dem Fundamentalsatz der Analysis. ♦ Es gibt bestimmte Klassen von Funktionen, für die man immer eine Stammfunktion angeben kann. Das bekannteste Beispiel für eine solche Klasse von Funktionen sind die Polynome. Für jedes Polynom f : R → R, welches durch f (x) := a0 + a1 x + a2 x2 + · · · + an xn für alle x ∈ R gegeben ist, ist nämlich das Polynom F : R → R, welches durch a1 a2 an n+1 F (x) := a0 x + x2 + x3 + · · · + x 2 3 n+1 für alle x ∈ R gegeben ist, eine Stammfunktion. Für Polynome existiert also eine Regel für die Bildung von Stammfunktionen. In den nachfolgenden Beispielen werden weitere Regeln für die Bildung von Stammfunktionen aufgeführt. Beispiele. (a) Für jede reelle Zahl α ∈ R\{−1} sei die Funktion pα : (0, ∞) → R durch pα (x) := xα für alle x ∈ R definiert. Wie man leicht nachrechnet, ist für alle α ∈ R \ {−1} die Funktion Pα : R → R, welche durch Pα (x) := xα+1 /(α + 1) für alle x ∈ R definiert ist, eine Stammfunktion von pα . Nach dem Fundamentalsatz der Analysis gilt also α+1 b Z b x α x dx = α + 1 x=a a für alle a, b ∈ R mit 0 < a ≤ b. 7.3. BERECHNUNG VON INTEGRALEN 179 (b) Für jede positive Zahl α > 0 sei die Funktion fα : R → R durch fα (x) := αx für alle x ∈ R definiert. Für alle α > 0 ist dann die Funktion Fα : R → R, welche durch Fα (x) := αx / ln(α) für alle x ∈ R definiert ist, eine Stammfunktion von fα . Laut Fundamentalsatz der Analysis gilt somit b Z αx α dx = ln(α) x a b x=a für alle a, b ∈ R mit a ≤ b. Insbesondere erhält man für den Fall, dass α = e gilt, die Gleichung Z b h ib ex dx = ex x=a a für alle a, b ∈ R mit a ≤ b. (c) Sei D ⊆ R eine nichtleere, offene Menge, und sei f ∈ C 1 (D) eine stetig differenzierbare Funktion, welche ausschließlich positive Funktionswerte besitzt. Die Funktion g : D → R sei durch g(x) := f 0 (x)/f (x) für alle x ∈ D definiert. Dann ist die Funktion G : D → R, welche durch G(x) := ln(f (x)) für alle x ∈ R definiert ist, eine Stammfunktion von g. Entsprechend gilt Z b a h i b f 0 (x) dx = ln f (x) f (x) x=a für alle a, b ∈ R mit a ≤ b und [a, b] ⊆ D. Wenn D = (0, ∞) und f (x) = x für alle x ∈ D gilt, erhält man insbesondere Z a b h ib 1 dx = ln x x x=a für alle a, b ∈ R mit 0 < a ≤ b. (d) Die Funktionen − cos und sin sind Stammfunktionen von sin bzw. cos. ♦ Für die Berechnung von Integralen über unbeschränkten Intervallen ist das nachfolgende Lemma nützlich. Lemma 7.10. Sei (a, b) ⊂ R ein nichtleeres, offenes Intervall, wobei auch a = −∞ oder b = ∞ zugelassen sei. Seien außerdem f ∈ L1 ((a, b)) eine integrierbare Funktionen. Dann gilt Z b Z z Z b f (x) dx = lim f (x) dx = lim f (x) dx. z→b− a a z→a+ z Aus Lemma 7.10 und dem Fundamentalsatz der Analysis kann man sehr leicht die folgende Aussage herleiten: Ist (a, b) ⊆ R ein offenes Intervall, und ist f ∈ L1 ((a, b)) eine integrierbare Funktion, die eine Stammfunktion F : (a, b) → R besitzt. Dann gilt Z b f (x) dx = lim F (x) − lim F (x). a x→b− x→a+ Die Stammfunktion F muss also an denen Intervallgrenzen a und b nicht notwendigerweise definiert sein. Sie muss dort lediglich einen Grenzwert besitzen. Diese Tatsache macht 180 KAPITEL 7. INTEGRALRECHNUNG man sich insbesondere bei der Berechnung von Integralen über unbeschränkten Intervallen zunutze. Es gilt nämlich Z ∞ h i∞ := lim F (x) − F (a), f (x) dx = f (x) bzw. Z b x→∞ a a h i∞ f (x) dx = f (x) := F (b) − lim F (x), x→∞− −∞ −∞ sofern die die Funktion f auf dem Intervall [a, ∞) bzw. (−∞, b] definiert und integrierbar ist. Man betrachte dazu die nachfolgenden Beispiele. Beispiele. (a) Das Integral Z ∞ e−x dx 0 soll berechnet werden. Der Integrand ist offenbar durch die Funktion f : R → R gegeben, welche durch f (x) := e−x für alle x ∈ R definiert ist. Die Funktion F : R → R, welche durch F (x) := −ex für alle x ∈ R definiert ist, ist eine Stammfunktion von f . Nach Lemma 7.10 erhält man Z ∞ i∞ h e−x dx = −e−x = lim −e−x − −e0 = 0 + 1 = 1. 0 0 x→∞ √ (b) Wie man leicht erkennt, ist die Funktion f : (0, 1) → R, welche durch f (x) := 1/ x für alle x ∈ (0, 1) definiert ist, nicht beschränkt. Sie ist aber dennoch integrierbar, denn nach Lemma 7.10 gilt Z 0 1 1 √ dx = lim z→0+ x Z z 1 h √ i1 √ √ 1 √ dx = lim 2 x = 2 1 − lim 2 z = 2. z→0+ z→0+ x z (c) Es soll untersucht werden, ob die Funktion f : (1, ∞) → R, welche durch f (x) := 1/x für alle x ∈ R definiert ist, integrierbar ist. Dies ist genau dann der Fall, wenn das Integral von f über dem Definitionsbereich (1, ∞) endlich. Tatsächlich erhält man aber Z ∞ h i∞ 1 dx = ln(x) = lim ln(x) − ln(1) = lim ln(x) − 0 = ∞. x→∞ x→∞ x 1 1 Die Funktion f ist demnach nicht integrierbar. ♦ Als nächstes betrachten wir eine Integrationsmethode, die oft hilfreich ist, wenn der Integrand als Produkt zweier Funktionen darstellbar ist. Diese Methode wird die Methode der partiellen Integration genannt. Die Grundlage für diese Methode liefert der folgende Satz. Satz 7.11. Sei (a, b) ⊆ R ein nichtleeres, offenes Intervall, und seien u ∈ C 1 ((a, b)) und v ∈ C 1 ((a, b)) zwei stetig differenzierbare Funktionen. Dann gilt Z a b h ib u0 (x)v(x) dx = u(x)v(x) x=a Z − a b u(x)v 0 (x) dx. 7.3. BERECHNUNG VON INTEGRALEN 181 Grundsätzlich ist es bei der Berechnung eines Integrals Z b f (x) dx a immer dann sinnvoll, die Methode der partiellen Integration anzuwenden, wenn sich der Integrand f als Produkt zweier Funktionen w und v schreiben lässt, so dass w eine Stammfunktion W besitzt und die Ableitung v 0 von v einfacher“ ist als die Funktion v selbst. ” Man erhält dann die Gleichung Z b Z b Z b h ib W (x)v 0 (x) dx, w(x)v(x) dx = W (x)v(x) − f (x) dx = a x=a a a v0 und hofft, dass man das Integral des Produkts von W und explizit bestimmen kann. Sollte dies nicht möglich sein, kann man erneut versuchen partiell zu integrieren. Es kann auch vorkommen, dass die Methode der partiellen Integration eine Gleichung für das gesuchte Integral liefert, die man entsprechend lösen kann. In den nachfolgenden Beispielen wird die Methode der partiellen Integration demonstriert. Beispiele. (a) Es soll das Integral Z 1 ex x dx 0 bestimmt werden. Da sich der Integrand als Produkt zweier Funktionen darstellen lässt, ist es nahe liegend die Methode der partiellen Integration anzuwenden. Definiert man die Funktionen u ∈ C 1 (R) und v ∈ C 1 (R) durch u(x) := ex und v(x) := x für alle x ∈ R, so ist der Integrand gerade durch das Produkt von u0 und v gegeben. Man erhält also Z 1 Z 1 h i1 Z 1 ex x dx = u0 (x)v(x) dx = u(x)v(x) − u(x)v 0 (x) dx 0 0 0 0 h i1 h i1 h i1 Z 1 ex · 1 dx = ex x − ex = ex x − 0 0 0 0 = 1. (b) Mit der Methode der partiellen Integration können auch Integrale der Form Z b ln(x) dx a mit a > 0 und b ≥ 0 bestimmt werden. Definiert man nämlich die Funktionen u ∈ C 1 ([a, b]) und v ∈ C 1 ([a, b]) durch u(x) := x und v(x) := ln(x) für alle x ∈ [a, b], so erhält man Z b Z b Z b h ib Z b 0 ln(x) dx = 1 · ln(x) dx = u (x)v(x) dx = u(x)v(x) − u(x)v 0 (x) dx a a a a a h ib Z b h ib h ib = x ln(x) − 1 dx = x ln(x) − x a a a a Insgesamt erhält man also Z a b h ib ln(x) dx = x(ln(x) − 1) . a 182 KAPITEL 7. INTEGRALRECHNUNG (c) In bestimmten Fällen kann man mit der Methode der partiellen Integration auch eine Gleichung für ein Integral herleiten. Man betrachte etwa das Integral 2π Z sin(x) cos(x) dx. 0 Wir definieren zunächst die Funktionen u ∈ C 1 (R) und v ∈ C 1 (R) durch u(x) := − cos(x) und v(x) := cos(x) für alle x ∈ R. Es gilt dann Z 0 2π h i2π Z 2π u(x)v 0 (x) dx − u (x)v(x) dx = u(x)v(x) sin(x) cos(x) dx = 0 0 0 h i2π Z 2π cos(x) sin(x) dx − = − cos(x) cos(x) 0 0 Z 2π =− sin(x) cos(x) dx. Z 2π 0 0 Wie man sieht, liefert die Methode der partiellen Integration eine Gleichung von der Form I = −I, wobei I das gesuchte Integral ist. Löst man diese Gleichung nach I auf, so erhält man I = 0 und somit Z 2π sin(x) cos(x) dx = 0. 0 (d) Manchmal ist es notwendig, die Methode der partiellen Integration mehrfach anzuwenden, um ein Integral zu bestimmen. Dies ist beispielsweise beim Integral Z π cos(x)x2 dx 0 der Fall. Durch einmaliges partielles Integrieren erhält man Z π Z π 2 cos(x)x dx = −2 sin(x)x dx 0 0 Integriert man die rechte Seite der Gleichung erneut partiell, so erhält man h Z π iπ Z π 2 cos(x)x dx = −2 − cos(x)x − − cos(x) dx 0 0 0 h iπ h iπ = −2 − cos(x)x + 2 − sin(x) 0 0 = 2π cos(π) = −2π als Ergebnis. ♦ Am Ende dieses Abschnitts wollen wir uns noch mit der Berechnung von Integralen über mehrdimensionalen Intervallen befassen. Dazu definieren wir zunächst die so genannten mehrdimensionalen, abgeschlossenen Intervalle wie folgt. 7.3. BERECHNUNG VON INTEGRALEN 183 Definition (n-dimensionales, abgeschlossenes Intervall). Sei n ∈ N eine natürliche Zahl, und seien a = (a1 , a2 , . . . , an )T ∈ Rn und b = (b1 , b2 , . . . , bn )T ∈ Rn zwei Vektoren. Dann nennt man die Menge [a, b] := [a1 , b1 ] × [a2 , b2 ] × · · · × [an , bn ] = x = (x1 , x2 , . . . , xn )T ∈ Rn ai ≤ xi ≤ bi für alle i = 1, 2, . . . , n ein n-dimensionales, offenes Intervall. Für die Berechnung von Integralen über mehrdimensionalen Intervallen ist der folgende Satz entscheidend, welcher als Satz von Fubini bekannt ist. Satz 7.12 (Fubini). Sei n ∈ N eine natürliche Zahl, seien a = (a1 , a2 , . . . , an )T ∈ Rn und b = (b1 , b2 , . . . , bn )T ∈ Rn zwei Vektoren, und sei f ∈ L1 ((a, b)) eine integrierbare Funktion. Dann gilt Z Z bπ(n) Z bπ(n−1) Z bπ(1) ··· f (x) dx = aπ(n) [a,b] bπ(2) Z f (x) dxπ(1) dxπ(2) · · · dxπ(n−1) dxπ(n) aπ(n−1) aπ(2) aπ(1) für jede n-stellige Permutation π ∈ Sn . Die Aussage des Satzes von Fubini kann man folgendermaßen zusammenfassen: Man berechnet das Integral einer Funktion mit vektorwertiger Variable, indem man nacheinander nach jeder einzelnen Vektorkomponente integriert. Die Reihenfolge, in welcher man nach den einzelnen Vektorkomponenten integriert, spielt dabei keine Rolle. Es gilt also insbesondere die Identität Z bn Z bn−1 Z b2 Z b1 Z ··· f (x) dx = f (x) dx1 dx2 · · · dxn−1 dxn , [a,b] an an−1 a2 a1 wobei die eindimensionalen Integrale von innen nach außen“ zu berechnen sind. ” Natürlich gilt eine analoge Regel auch für Integrale von Funktionen, die von mehreren reellwertigen Variablen abhängen. Seien etwa a, b, c, d ∈ R reelle Zahlen, und sei f : (a, b)× (c, d) → R eine Funktion, deren Variablen mit x und y bezeichnet werden, so gilt Z dZ b Z f (x, y) d(x, y) = [a,b]×[c,d] Z bZ f (x, y) dxdy = c a d f (x, y) dydx. a c Die eindimensionalen Integrale werden wiederum falls möglich mit Hilfe des Fundamentalsatzes der Analysis, oder aber mit der Methode der partiellen Integration bestimmt. Bei der Bestimmung von Stammfunktionen wird nur diejenige Variable berücksichtigt, nach der jeweils integriert wird. Die Anwendung des Satzes von Fubini wird in den nachfolgenden Beispielen erläutert. Beispiele. (a) Das Integral Z [a,b] 2x1 x22 + 4x32 dx 184 KAPITEL 7. INTEGRALRECHNUNG soll berechnet werden, wobei die Vektoren a ∈ R2 und b ∈ R2 durch a := (1, 2)T und b := (3, 4)T gegeben seien. Nach dem Satz von Fubini gilt Z 2x1 x22 + 4x32 dx Z 4Z 2 = 3 [a,b] Z 2x1 x22 + 4x32 dx1 dx2 Z 4h i2 = x21 x22 + 4x1 x32 x1 =1 3 1 dx2 4 22 x22 + 4 · 2x32 − 12 x22 + 4 · 1x32 dx2 = 3 Z 4 h i4 3x22 + 4x32 dx2 = x32 + x42 = x2 =3 3 = 43 + 4 4 − 33 + 3 4 = 212. (b) Wir betrachten das Integral Z sin(x + y) d(x, y). [−π,π]×[0,π] Nach dem Satz von Fubini gilt Z Z πZ π Z πh iπ sin(x + y) d(x, y) = sin(x + y) dxdy = − cos(x + y) dy x=−π [−π,π]×[0,π] 0 −π 0 Z π = − cos(π + y) + cos(−π + y) dy 0 h = − sin(π + y) + sin(−π + y) iπ y=0 = − sin(2π) + sin(0) − − sin(π) + sin(−π) = 0. Das Integral verschwindet also. ♦ Übungsaufgaben 1. Berechnen Sie die folgenden Integrale: Z 1 Z 3 x − 5x dx, −1 Z √ 0 1 Z 2x dx, 2 x +1 e−2x dx, cos(πx + π/2) dx, 0 e−1 √ ln( 2) Z 0 π/3 Z tan(x) dx, 0 0 √ Z 2 2x3 − x2 dx, 1 7 √ 3x dx, 3x2 + 4 2. Untersuchen Sie, ob die folgenden Funktionen integrierbar sind: f1 : [1, ∞) → R, x 7→ 1/x, f2 : [1, ∞) → R, x 7→ 1/x2 , f3 : (0, 1] → R, x 7→ 1/x, √ f4 : (0, 1] → R, x 7→ 1/ 3 x. Z 0 1/2 x dx. 2x + 1 7.3. BERECHNUNG VON INTEGRALEN 185 3. Berechnen Sie die folgenden Integrale mit der Methode der partiellen Integration: Z π/2 Z x sin(x) dx, 0 2 Z x ln(x) dx, 1 2 −x x e 1 0 Z 2π dx, sin2 (x) dx. 0 4. Zeigen Sie mittels vollständiger Induktion, sowie der Methode der partiellen Integration, dass die Gleichung Z ∞ n! xn e−αx dx = n+1 α 0 für alle positiven Zahlen α > 0 und alle natürlichen Zahlen n ∈ N gilt. 5. Berechnen Sie die folgenden Integrale: Z 2 − x2 − y 2 d(x, y), [−1,1]×[−1,1] Z 4x3 y − y d(x, y), [−1,1]×[0,2] Z sin(x) sin(y) d(x, y), [0,π]×[0,π] Z x(1 − x)(y − 1)(y − 2) d(x, y). [0,1]×[1,2] 186 7.4 KAPITEL 7. INTEGRALRECHNUNG Der Transformationssatz Bisher haben wir lediglich Methoden für die Berechnung von Integralen über eindimensionalen und mehrdimensionalen Intervallen kennen gelernt. In diesem Abschnitt wenden wir uns der Berechnung von Integralen über allgemeineren Mengen zu. Das wichtigste Hilfsmittel ist hierbei der so genannte Transformationssatz. Um diesen formulieren zu können, führen wir zunächst den Begriff des Diffeomorphismus ein. Definition (Diffeomorphismus). Sei n ∈ N eine natürliche Zahl, und seien D ⊆ Rn und E ⊆ Rn zwei nichtleere Mengen. Eine Funktion f : D → E wird ein Diffeomorphismus von D nach E genannt, wenn f bijektiv ist, und wenn sowohl f als auch die Umkehrabbildung f −1 : E → D stetig differenzierbar sind. Nachfolgend geben wir einige wichtige Beispiele für Diffeomorphismen an. Beispiele. (a) Seien [a, b] ⊂ R und [c, d] ⊂ R zwei nichtleere, beschränkte Intervalle. Dann ist die Funktion g : [a, b] → [c, d], welche durch g(x) := d−c (x − a) + c b−a für alle x ∈ [a, b] definiert ist, ein Diffeomorphismus von [a, b] nach [c, d]. Die Umkehrabbildung g −1 : [c, d] → [a, b] ist durch g −1 (x) = b−a (x − c) + a d−c für alle x ∈ [c, d] gegeben. (b) Die Menge P ⊆ R2 sei durch P := ((0, ∞) × (−π, π]) ∪ {0} gegeben. Ferner sei die Funktion g : I → R2 durch x1 cos(x2 ) g(x) := x1 sin(x2 ) für alle x = (x1 , x2 )T ∈ I definiert. Man kann zeigen, dass g bijektiv ist, und dass die entsprechende Umkehrabbildung g −1 : R2 → P durch 2 x1 + x22 −1 g (x) = Φ(x1 , x2 ) für alle x = (x1 , x2 )T ∈ B1 (0) gegeben ist. Die Funktion Φ : R × R → R ist hierbei durch arctan(x2 /x1 ) falls x1 > 0, arctan(x /x ) + π falls x < 0, x ≥ 0, 2 1 1 2 Φ(x1 , x2 ) := arctan(x2 /x1 ) − π falls x1 < 0, x2 < 0, sgn(x )π/2 sonst 2 für alle x1 ∈ R und alle x2 ∈ R definiert. Die Funktionen g und g −1 sind beide stetig differenzierbar, weshalb g ein Diffeomorphismus ist. Die Funktion g spielt in verschiedenen Anwendungen eine wichtige Rolle. Sie realisiert nämlich die Koordinatentransformation von Polarkoordinaten in kartesische Koordinaten. Die Umkehrabbildung realisiert entsprechend die Rücktransformation von kartesischen Koordinaten in Polarkoordinaten. 7.4. DER TRANSFORMATIONSSATZ 187 (c) Sei n ∈ N eine natürliche Zahl, sei A ∈ Rn×n eine reguläre (d.h. invertierbare) Matrix, und sei b ∈ Rn ein beliebiger Vektor. Dann ist die affine Abbildung g : Rn → Rn , welche durch g(x) := Ax + b für alle x ∈ Rn bestimmt ist, ein Diffeomorphismus von Rn nach Rn . Die Umkehrabbildung g −1 : Rn → Rn ist durch g −1 (x) = A−1 x − A−1 b für alle x ∈ Rn gegeben. Die Jacobi–Matrizen beider Abbildungen sind durch g 0 (x) = A bzw. (g −1 )0 (x) = A−1 für alle x ∈ Rn gegeben. ♦ Wie im Beispiel (b) bereits angedeutet wurde, treten Diffeomorphismen häufig bei so genannten Koordinatentransformationen auf. In zwei Raumdimensionen kann man die Lage eines Punktes beispielsweise mit dem kartesischen Koordinatensystem durch Angabe zweier Zahlen x ∈ R und y ∈ R definieren. Diese beiden Zahlen bestimmen die horizontale und die vertikale Position des Punktes relativ zum Ursprung des Koordinatensystems. Eine weitere Möglichkeit die Lage des Punktes zu definieren besteht in der Verwendung des so genannten Polarkoordinatensystems. Im Polarkoordinatensystem wird die Lage des Punktes durch zwei Zahlen r ≥ 0 und ϕ ∈ (−π, π] definiert, wobei r den Abstand des Punktes zum Ursprung angibt, und ϕ den Winkel zwischen der x-Achse und der Verbindungsstrecke zwischen dem Punkt und dem Ursprung (siehe Abbdilung ??). Die Umrechnung zwischen kartesischen Koordinaten und Polarkoordinaten erfolgt mittels dem im Beispiel (b) definierten Diffeomorphismus g gemäß g((r, ϕ)T ) = (x, y)T bzw. g −1 ((x, y)T ) = (r, ϕ)T . Im folgenden soll noch auf eine weitere Aufgabe von Diffeomorphismen eingegangen werden. Definiert man die Menge I ⊆ R2 durch I := ((0, 1) × (−π, π]) ∪ {0}), und die Funktion g : I → B1 (0) durch g(x) := x1 cos(x2 ) x1 sin(x2 ) für alle x ∈ R2 , so ist g ein Diffeomorphismus von I nach B1 (0), wobei B1 (0) die offene Einheitskugel in R2 bezüglich der euklidischen Norm bezeichnet. Die Einheitskugel kann also als das Bild der Menge I unter dem Diffeomorphismus g charakterisiert werden. Die Menge I ist dabei im wesentlichen ein zweidimensionales Intervall. Wir erinnern uns, dass Integrale über mehrdimensionalen Intervallen mit Hilfe des Satzes von Fubini (siehe Satz 7.12) berechnet werden können. Die Frage ist, ob man den Diffeomorphismus g dazu verwenden kann, Integrale über der Einheitskugel B1 (0) zu berechnen. Die Antwort darauf lautet: Ja. Man muss dazu lediglich den folgenden Satz anwenden, der als Transformationssatz bekannt ist. Satz 7.13 (Transformationssatz). Sei n ∈ N eine natürliche Zahl, seien D ⊆ Rn und E ⊆ Rn zwei nichtleere, offene Mengen, und sei g : D → E ein Diffeomorphismus von D nach E. Sei ferner f ∈ L1 (E) eine integrierbare Funktion. Dann gilt Z Z f (x) dx = (f ◦ g)(x)|det g 0 (x)| dx. E D Hierbei bezeichnet g 0 die Jacobi–Matrix von g. 188 KAPITEL 7. INTEGRALRECHNUNG Der Transformationssatz wird in der Regel wie folgt angewendet: Gesucht sei das Integral einer Funktion f über einer Menge E, die kein mehrdimensionales Intervall ist. Man überlegt sich dann, ob ein Intervall I und ein Diffeomorphismus g existiert, so dass E = g(I) gilt. Wenn ja, kann das Integral von f über E gemäß dem Transformationssatz als Integral der Funktion h über I berechnet werden, wobei die Funktion h durch h(x) := (f ◦ g)(x)|det g 0 (x)| für alle x ∈ I definiert ist. Dieses Vorgehen wird noch einmal in den nachfolgenden zwei Beispielen demonstriert. Beispiele. (a) Es soll das Integral Z x1 + 1 dx B1 (0) berechnet werden, wobei B1 (0) die offene Einheitskugel in R2 bezüglich der euklidischen Norm bezeichnet. Der Integrand ist hierbei durch die Funktion f : R2 → R gegeben, welche durch f (x) := x1 + 1 für alle x = (x1 , x2 )T ∈ R2 definiert ist. Sei I := ((0, 1) × (−π, π]) ∪ {0}. Wir wissen bereits, dass die Funktion g : I → B1 (0), welche durch x1 cos(x2 ) g(x) := x1 sin(x2 ) für alle x = (x1 , x2 )T ∈ R2 definiert ist, ein Diffeomorphismus von I nach B1 (0) ist. Man rechnet außerdem leicht nach, dass |det g 0 (x)| = x1 für alle x = (x1 , x2 )T ∈ R2 gilt. Nach dem Transformationssatz erhält man also Z Z Z x1 + 1 dx = f (x) dx = (f ◦ g)(x)|det g 0 (x)| dx B1 (0) B1 (0) Z = I x21 cos(x2 ) I Z 1Z π + x1 dx = 0 −π x21 cos(x2 ) + x1 dx2 dx1 Z 1h Z 1 iπ 2 = x1 sin(x2 ) + x1 x2 dx1 = 2πx1 dx1 x2 =−π 0 0 h i1 = πx21 x1 =0 = π. (b) Es soll das Integral Z x21 − 2x2 dx, P berechnet werden. Die Menge P := {α1 p(1) + α2 p(2) | α1 , α2 ∈ [0, 1]} ist dabei das von den Vektoren u(1) := (3, 0)T und u(2) := (1, 1)T aufgespannte Parallelogramm. Der Integrand ist durch die Funktion f : R2 → R gegeben, welche durch f (x) := x21 − 2x2 für alle x = (x1 , x2 )T ∈ R2 definiert ist. Man erkennt leicht, dass P das Bild des Einheitsquadrats [0, 1]2 ⊂ R2 unter dem Diffeomorphismus g : [0, 1]2 → P ist, welcher durch 3 1 α1 g(α) := 0 1 α2 7.4. DER TRANSFORMATIONSSATZ 189 für alle α = (α1 , α2 )T ∈ [0, 1]2 definiert ist. Ferner gilt |det g 0 (α)| = 3 für alle α ∈ (0, 1)2 . Man erhält also Z Z Z 2 (f ◦ g)(α)|det g 0 (α)| dα f (x) dx = x1 − 2x2 dx = 2 (0,1) P P Z 3(2α1 + α2 )2 − 6α2 dα = (0,1)2 1Z 1 Z = 0 12α12 + 12α1 α2 + 3α22 − 6α2 dα1 dα2 0 Z 1h i1 = dα2 4α13 + 6α12 α2 + 3α1 α22 − 6α1 α2 α1 =0 0 Z 1 = 4 + 12α2 + 3α22 dα2 0 h i1 = 4α2 + 6α22 + α23 0 = 11 nach dem Transformationssatz. ♦ Wird der Transformationssatz auf Integrale über eindimensionalen Intervallen angewendet, so ergeben sich gewisse Vereinfachungen. Man erhält dann die so genannte Substitutionsregel für Integrale. Satz 7.14. Seien a ∈ R und b ∈ R zwei reelle Zahlen mit a ≤ b, sei I ⊆ R ein Intervall, sei g : I → [a, b] ein Diffeomorphismus, und sei f ∈ L1 ((a, b)) eine integrierbare Funktion. Dann gilt Z b Z g−1 (b) f (x) dx = (f ◦ g)(x) g 0 (x) dx. g −1 (a) a Hierbei bezeichnet g 0 die erste Ableitung von g. Die Substitutionsregel kann bei der Berechnung bestimmter Integrale hilfreich sein, wie die nachfolgenden Beispiele zeigen. Beispiele. (a) Das Integral Z π2 sin √ x dx 0 √ soll berechnet werden. Offenbar bereitet dabei vor allem der Ausdruck xp Schwierigkeiten. Es ist daher sinnvoll, einen Diffeomorphismus g zu finden, so dass g(x) = x gilt. Ein solcher Diffeomorphismus g : [0, π] → [0, π 2 ] ist durch g(x) := x2 für alle x ∈ [0, π] gegeben. Die entsprechende Umkehrabbildung g −1 : [0, π 2 ] → [0, π] ist √ durch g −1 (x) := x für alle x ∈ [0, π 2 ] definiert. Gemäß Substitutionsregel (siehe Satz 7.14) erhält man Z π2 Z g−1 (π2 ) Z π p 0 √ sin x dx = sin g(x) g (x) dx = 2x sin(x) dx. 0 g −1 (0) 0 190 KAPITEL 7. INTEGRALRECHNUNG Das Integral auf der rechten Seite kann mit Hilfe der Methode der partiellen Integration bestimmt werden. Man erhält Z π2 √ sin( x) dx = 2π. 0 (b) Wir betrachten das Integral Z 1p 1 − x2 dx. 0 Definiert man den Diffeomorphismus g : [0, π/2] → [0, 1] durch g(x) := sin(x) für alle x ∈ [0, π/2], so erhält man gemäß Substitutionsregel (siehe Satz 7.14) die Gleichung Z π/2 p Z π/2 p Z 1p 2 2 1 + x dx = 1 − (sin(x)) cos(x) dx = (cos(x))2 cos(x) dx 0 0 Z = 0 π/2 (cos(x))2 dx. 0 Hierbei wurde das Additionstheorem für die Sinus- und die Cosinusfunktion verwendet, welches besagt, dass für alle x ∈ R die Identität (sin(x))2 + (cos(x))2 = 1 gilt. Das Integral über die quadrierte Cosinusfunktion kann mit Hilfe der Methode der partiellen Integration berechnet werden. Als Ergebnis erhält man Z 1p π 1 + x2 dx = . 4 0 (c) Für a, b ∈ R mit a ≤ b soll das Integral Z b a 1 dx 1 + x2 bestimmt werden. Die Tangensfunktion tan : (−π/2, π/2) → R ist bekanntlich streng monoton wachsend und stetig differenzierbar, wobei tan0 = 1 + tan2 gilt. Ferner ist sie ein Diffeomorphismus von (−π/2, π/2) nach R, wobei die Umkehrabbildung durch die Arcustangensfunktion arctan : R → (−π/2, π/2) gegeben ist. Nach der Substitutionsregel erhält man daher Z b Z arctan(b) Z arctan(b) 1 tan0 (x) dx = dx = 1 dx 2 2 a 1+x arctan(a) 1 + (tan(x)) arctan(a) = arctan(b) − arctan(a). Offenbar ist das gesuchte Integral also durch Z b h ib 1 dx = arctan(x) 2 x=a a 1+x gegeben. ♦ Bei der Anwendung der Substitutionsregel ist es nicht immer offensichtlich, wie der Diffeomorphismus g gewählt werden muss, damit das resultierende Integral explizit berechnet werden kann. Eine Standardvorgehensweise besteht darin, im Integranden einen Ausdruck auszuwählen, den man gerne durch die Integrationsvariable ersetzen möchte. Diesen Ausdruck nutzt man zu Definition von g −1 und wendet damit die Substitutionsregel an. Diese Vorgehensweise wurde auch im zuvor genannten Beispiel (a) gewählt. 7.4. DER TRANSFORMATIONSSATZ 191 Übungsaufgaben 1. Berechnen Sie mit Hilfe des Transformationssatzes die folgenden Integrale: Z Z q 2 2 1 − x1 − x2 dx, cos π x21 + x22 dx, B (0) B (0) Z 1 Z 1 2 2 e−x1 −x2 dx, 2 − x2 dx. R2 P Hierbei bezeichnet B1 (0) die offene Einheitskugel in R2 , und P := α1 u(1) + α2 u(2) α1 , α2 ∈ [0, 1] das von den Vektoren u(1) := (1, 1)T und u(2) = (−1, 1)T aufgespannte Parallelogramm. 2. Berechnen Sie die folgenden Integrale: Z 0 π 2 /4 √ cos x dx, Z √ 3 π x5 sin(x3 ) dx, 0 Verwenden Sie dazu die Substitutionsregel. Z 0 1 1 √ dx, 1+ x Z 1 √ e 0 2x dx. Lernzielkontrolle Nach dem Durcharbeiten dieses Kapitels sollten Sie ... ... wissen, dass man das Volumen bestimmter Teilmengen des Rn durch das n-dimensionalen Lebesgue–Maßes definiert. ... wissen, dass nur den Lebesgue–messbaren Teilmengen des Rn in sinnvoller Weise ein Volumen zugeordnet werden kann. ... wissen, dass alle Intervalle, alle offenen Mengen und alle abgeschlossenen Mengen Lebesgue–messbar sind. ... wissen, wie das Lebesgue–Maß eines n-dimensionalen Intervalls definiert ist. ... wissen, was eine Lebesgue–Nullmenge ist. ... wissen, was die Formulierung fast überall“ bedeutet. ” ... wissen, was die charakteristische Funktion einer Teilmenge des Rn ist. ... wissen, was eine Lebesgue–messbare Funktion, und was eine Lebesgue–integrierbare Funktion ist. ... wissen, dass jede stetige Funktion Lebesgue–messbar ist. ... den Fundamentalsatz der Analysis kennen und anwenden können. ... die Methode der partiellen Integration anwenden können. ... Integrale über mehrdimensionalen Intervallen berechnen können. ... den Transformationssatz und die Substitutionsregel kennen. 192 Anhang A Wichtige Resultate Wichtige Gleichungen und Ungleichungen Dreiecksungleichung: Für jede Norm k · k gilt kx + yk ≤ kxk + kyk (siehe Seite 8) Umgekehrte Dreiecksungleichung: Für jede Norm k · k gilt kxk − kyk ≤ kx − yk (siehe Seite 12) Orthogonalentwicklung: Für jede Orthonormalbasis {q1 , q2 , . . . , qn } gilt x = hx , q1 iq1 + hx , q2 iq2 + · · · + hx , qn iqn (siehe Seite 22) Konvergenzverhalten wichtiger Folgen α = 0, α, β ∈ R n→∞ n + β n+α lim = 1, α, β ∈ R n→∞ n + β √ lim n n = 1 n→∞ √ n lim n! = ∞ n→∞ x n lim 1 + = ex , x ∈ R n→∞ n =0 falls = 1 falls lim q n n→∞ =∞ falls existiert nicht falls lim (siehe Seite 47) (siehe Seite 48) (siehe Seite 48) (siehe Seite 94) (siehe Seite 73) |q| < 1, q = 1, q > 1, q ≤ −1 (siehe Seite 48) 193 194 ANHANG A. WICHTIGE RESULTATE Konvergenzverhalten wichtiger Reihen ( ∞ X konvergiert falls α > 1, 1 1 1 1 = 1 + α + α + α + ··· nα 2 3 4 =∞ falls α ≤ 1 n=1 (siehe Seite 82) ∞ X 1 1 1 1 = 1 + + + + ··· = e n! 1! 2! 3! (siehe Seite 76) n=0 Harmonische Reihe: ∞ X 1 1 1 1 = 1 + + + + ··· = ∞ n 2 3 4 (siehe Seite 79) n=1 Alternierende harmonische Reihe: ∞ X (−1)n+1 =1− n n=1 1 1 1 + − ± · · · = ln(2) 2 3 4 (siehe Seite 76) Geometrische Reihe: 1 falls |q| < 1, 1−q n 2 3 q = 1 + q + q + q + ··· = ∞ falls q ≥ 1, n=0 divergiert falls q ≤ −1 = ∞ X (siehe Seite 77) Wichtige Potenzreihen ex = ∞ X xn n=0 sin(x) = cos(x) = n! =1+x+ x2 x3 + + ··· 2! 3! (siehe Seite 94) ∞ X (−1)n x3 x5 x7 x2n+1 = x − + − ± ··· (2n + 1)! 3! 5! 7! (siehe Seite 96) (−1)n 2n x2 x4 x6 x =1− + − ± ··· (2n)! 2! 4! 6! (siehe Seite 96) n=0 ∞ X n=0 Wichtige Funktionsgrenzwerte sin(x) = 1, x→0 x lim lim xn e−x = 0, x→∞ lim x ln(x) = 0 x→0+ lim x→0+ ln(x) = −∞ x (siehe Seite 101) n ∈ N0 (siehe Seite 104) (siehe Seite 128) (siehe Seite 129) 195 Wichtige Aussagen über stetige Funktionen f ist an der Stelle x0 stetig ⇐⇒ f (x0 ) = lim f (x). (siehe Seite 105) Zwischenwertsatz (siehe Seite 111) Nullstellensatz von Bolzano (siehe Seite 112) Satz vom Minimum und Maximum (siehe Seite 114) D ∈ L(Rn ) und f ∈ C(D) =⇒ f ist Lebesgue–messbar. (siehe Seite 171) x→x0 Wichtige Aussagen über differenzierbare Funktionen f ist an der Stelle x0 differenzierbar =⇒ f ist an der Stelle x0 stetig. (siehe Seite 122) Satz von Rolle (siehe Seite 127) Mittelwertsatz (siehe Seite 127) Wichtige Ableitungen f (x) = xα , f 0 (x) = αxα−1 , α∈R (siehe Seite 125) f (x) = αx , f 0 (x) = ln(α)αx , α>0 (siehe Seite 125) f (x) = ln(x), f 0 (x) = f (x) = sin(x), f 0 (x) = cos(x), (siehe Seite 125) f (x) = cos(x), f 0 (x) = − sin(x), (siehe Seite 125) 1 , x (siehe Seite 125) Ableitungsregeln Summenregel: (f + g)0 = f 0 + g 0 Regel des konstanten Faktors: (αf )0 = αf 0 , Produktregel: (f g)0 = f 0 g + f g 0 0 f 0g − f g0 f Quotientenregel: = g g2 (siehe Seite 123) α∈R (siehe Seite 123) (siehe Seite 123) (siehe Seite 123) 196 ANHANG A. WICHTIGE RESULTATE Kettenregel: (f ◦ g)0 = (f 0 ◦ g)g 0 (siehe Seite 124) Wichtige Stammfunktionen f (x) = xα , f (x) = αx , xα+1 + c, α+1 αx F (x) = + c, ln(α) F (x) = α ∈ R \ {−1}, c ∈ R (siehe Seite 178) α > 0, c ∈ R (siehe Seite 179) f (x) = ln(x), F (x) = x(ln(x) − 1) + c, c∈R (siehe Seite 181) f (x) = sin(x), F (x) = − cos(x) + c, c∈R (siehe Seite 179) f (x) = cos(x), F (x) = sin(x) + c, c∈R (siehe Seite 179) F (x) = arctan(x) + c, c∈R (siehe Seite 190) F (x) = ln(|g(x)|) + c, c∈R (siehe Seite 179) 1 , 1 + x2 g 0 (x) f (x) = , g(x) f (x) = Integrationsregeln Summenregel: Z Z Z f (x) + g(x) dx = f (x) dx + g(x) dx Ω Ω Regel des konstanten Faktors: Z Z αf (x) dx = α f (x) dx, Ω (siehe Seite 174) Ω α∈R (siehe Seite 174) Ω Additivität: Z Z Z f (x) dx = f (x) dx + f (x) dx A∪B A falls A ∩ B = ∅ (siehe Seite 174) B Integrale über Nullmengen: Z f (x) dx = 0 falls meas(N ) = 0 (siehe Seite 174) N Vertauschen der Integrationsgrenzen: Z a Z f (x) dx = − b b f (x) dx, a (siehe Seite 175) 197 Methode der partiellen Integration: Z b Z ib u (x)v(x) dx = u(x)v(x) h 0 x=a a b − u(x)v 0 (x) dx (siehe Seite 180) a Satz von Fubini: Z bZ Z a [a,b]×[c,d] d Z dZ b f (x, y) dxdy f (x, y) dy dx = f (x, y) d(x, y) = c c (siehe Seite 183) a Transformationssatz: Für jeden Diffeomorphismus g : D → E gilt Z Z (f ◦ g)(x)|det g 0 (x)|dx f (x) dx = (siehe Seite 187) D E Substitutionsregel: Für jeden Diffeomorphismus g : I → [a, b] gilt Z b Z g −1 (b) f (x) dx = a (f ◦ g)(x)g 0 (x)dx (siehe Seite 187) g −1 (a) Weitere wichtige Resultate Satz des Pythagoras (siehe Seite 20) Satz von Heine–Borel (siehe Seite 63) Satz von Taylor (siehe Seite 136) Satz von Schwarz (siehe Seite 145) Symbolverzeichnis N Menge der natürlichen Zahlen, 4 N0 Menge der natürlichen Zahlen mit Null, 4 Z Menge der ganzen Zahlen, 4 Q Menge der rationalen Zahlen, 4 R Menge der reellen Zahlen, 4 C Menge der komplexen Zahlen, 4 K Platzhalter für R oder C, 4 Rn×n sym Menge aller symmetrischen Matrizen in Rn×n , 25 XN Menge aller Folgen in X, 30 B(X, W ) Menge aller beschränkten Funktionen von X nach W , 61 C(D, W ) Menge aller stetigen Funktionen von D nach W , 105 C k (D, W ) Menge aller k-mal stetig (partiell) differenzierbaren Funktionen von D nach W , 132 C ∞ (D, W ) Menge aller glatten Funktionen von D nach W , 132 E(D) Menge aller einfachen Funktionen von D nach R, 169 L1 (D) Menge aller Lebesgue–integrierbaren Funktionen von D nach R, 172 Lin(Rn , Rm ) Menge aller Linearen Abbildungen von Rn nach Rm , 154 k·k Allgemeine Norm, 8 |·| Betragsfunktion, euklidische Norm oder Standardnorm, 9 k · k1 Betragssummennorm, 9 k · k∞ Maximumnorm, 9 Br (v) Offene Kugel mit Mittelpunkt v und Radius r, 11 Br (v) Abgeschlossene Kugel mit Mittelpunkt v und Radius r, 11 Sr (v) Sphäre mit Mittelpunkt v und Radius r, 12 h· , ·i Allgemeines Skalarprodukt, 14 198 199 · Multiplikation oder euklidisches Skalarprodukt, 14 ∠(v, w) Winkel zwischen den Vektoren v und w, 18 inf M Infimum der Menge M , 37 max M Maximum der Menge M , 38 min M Minimum der Menge M , 38 sup M Supremum der Menge M , 37 lim vn Grenzwert einer Folge (vn )n∈N , 47 lim f (x) Grenzwert einer Funktion f in x0 , 99 n→∞ x→x0 lim f (x) Linksseitiger Grenzwert einer Funktion f in x0 , 102 lim f (x) Rechtsseitiger Grenzwert einer Funktion f in x0 , 102 x→x0 − x→x0 + M◦ Inneres der Menge M , 53 ∂M Rand der Menge M , 53 M Abschluss der Menge M , 54 f 0 (x0 ) Ableitung von f an der Stelle x0 , 119 f (k) (x0 ) k-te Ableitung von f an der Stelle x0 , 132 ∂k f x(0) ∂f (x0 , y0 , . . . ) ∂x ∇f x(0) ∇2 f x(0) Df x(0) f 0 x(0) Z f (x) dx Ω Partielle Ableitung von f nach der k-ten Koordinate an der Stelle x(0) , 139 Partielle Ableitung von f nach der Variable x an der Stelle x = x0 , y = y0 , . . . , 141 Gradient von f an der Stelle x(0) , 147 Hesse–Matrix von f an der Stelle x(0) , 149 Totale Ableitung von f an der Stelle x(0) , 154 Jacobi–Matrix von f an der Stelle x(0) , 155 Lebesgue–Integral von f über Ω, 172 Index ableiten, 119 Ableitung, 119 partielle, 139 partielle der Ordnung k, 142 totale, 154 Abrundungsfunktion, 40 Abschluss, 54 Abstand, 10 Addition, 6 Äquivalenzklasse, 7 Äquivalenzrelation, 7 Algebra, 34 Banach–Algebra, 66 normierte, 35 Approximationsfehler, 136 Aufrundungsfunktion, 40 Axiom Vollständigkeitsaxiom, 38 Einsnorm, 9 Element inverses, 6 neutrales, 6 Entwicklungsstelle einer Potenzreihe, 93 Eulersche Zahl, 72 Exponentialfunktion, 94 Extremalstelle lokale, 148 Extremum lokales, 148 Faktormenge, 7 Familie, 32 fast überall, 167 Folge, 30 beschränkte, 60 bestimmt divergente, 50 Cauchy–Folge, 65 divergente, 47 explizit definierte, 31 gegen −∞ bestimmt divergente, 50 gegen ∞ bestimmt divergente, 50 konvergente, 47 monoton fallende, 44 monoton konvergente, 71 monoton wachsende, 44 nach oben beschränkte, 41 nach unten beschränkte, 41 Nullfolge, 47 rekursiv definierte, 31 streng monoton fallende, 45 streng monoton wachsende, 44 Folgenkriterium für Abgeschlossenheit, 57 für Kompaktheit, 63 für Stetigkeit, 107 Formel Eulersche, 97 Fundamentalsatz Banach–Algebra, 66 Banach–Raum, 65 Basis, 6 Betrag, 4 Betragsfunktion, 4 Betragssummennorm, 9 Bild einer linearen Funktion, 7 Cauchy–Folge, 65 Cauchy–Kriterium, 70 Cosinusfunktion, 96 hyperbolische, 96 Diffeomorphismus, 186 Dimension, 6 Dirichlet–Funktion, 167 Dreiecksungleichung, 8 für absolut konvergente Reihen, 83 umgekehrte, 12 Einheitskugel, 12 Einheitssphäre, 12 200 INDEX der Analysis, 177 Funktion k-mal differenzierbare, 132 k-mal partiell differenzierbare, 143 k-mal stetig differenzierbare, 132 k-mal stetig partiell differenzierbare, 143 Abrundungsfunktion, 40 Aufrundungsfunktion, 40 beschränkte, 61 Betragsfunktion, 4 charakteristische, 168 Cosinus, 96 Cosinus Hyperbolicus, 96 differenzierbare, 119 Dirichlet–Funktion, 167 einfache, 169 Exponentialfunktion, 94 glatte, 132 Heaviside–Funktion, 102 Lebesgue–integrierbare, 172 Lebesgue–messbare, 171 lineare, 7 Logarithmus, 97 monoton fallende, 44 monoton wachsende, 44 nach oben beschränkte, 40 nach unten beschränkte, 40 partiell differenzierbare, 139 Signumfunktion, 4 Sinus, 96 Sinus Cardinalis, 106 Sinus Hyperbolicus, 96 Stammfunktion, 177 stetig differenzierbare, 131 stetig partiell differenzierbare, 142 stetige, 105 streng monoton fallende, 44 streng monoton wachsende, 44 total differenzierbare, 154 vektorwertige, 5 Funktional, 23 Funktionenfolge divergente, 88 gleichmäßig konvergente, 90 punktweise konvergente, 87 Ganzteil, 40 Gauß–Klammer, 40 Gleichung 201 Parallelogrammgleichung, 18 Parsevalsche, 22 Gradient, 147 Grenzfunktion, 87 Grenzwert einer Folge, 47 einer Funktion, 99 einer Reihe, 76 gegen −∞, 103 gegen ∞, 103 linksseitiger, 102 rechtsseitiger, 102 Gruppe, 6 Hauptminor, 26 Heaviside–Funktion, 102 Hesse–Matrix, 149 Hilbert–Raum, 65 Hülle abgeschlossene, 54 Infimum einer Folge, 41 einer Funktion, 40 einer Menge, 37 Innenproduktraum, 15 Inneres, 53 Integrand, 177 Integration partielle, 180 Intervall, 4 n-dimensionales, abgeschlossenes, 183 n-dimensionales, rechtsoffenes, 160 abgeschlossenes, 5 offenes, 5 Jacobi–Matrix, 155 Kern einer linearen Funktion, 7 Kettenregel, 124 Koeffizient einer Potenzreihe, 93 Körper, 6 Komponente einer Matrix, 5 einer vektorwertigen Funktion, 5 eines Vektors, 5 Konvergenzbereich, 88 Konvergenzkriterium Cauchy–Kriterium, 70 202 Leibniz–Kriterium, 79 Majorantenkriterium, 83 Monotoniekriterium, 71 Quotientenkriterium, 85 Wurzelkriterium, 84 Konvergenzradius einer Potenzreihe, 95 Konvergenzverhalten, 48 Koordinatentransformation, 186 Kugel abgeschlossene, 11 offene, 11 Lebesgue–fast überall, 167 Lebesgue–Integral des Negativteils, 172 des Positivteils, 172 einer nichtnegativen, einfachen Funktion, 169 Lebesgue–Maß äußeres, 161 Lebesgue–Nullmenge, 162 Leibniz–Kriterium, 79 linear abhängig, 6 linear unabhängig, 6 Linearisierung einer Funktion, 121 Logarithmusfunktion, 97 Majorante, 83 Majorantenkriterium, 83 Matrix, 5 Hesse–Matrix, 149 Jacobi–Matrix, 155 negativ definite, 26 positiv definite, 26 symmetrische, 25 Maximalstelle lokale, 148 Maximierer, 41 Maximum einer Folge, 42 einer Funktion, 41 einer Menge, 38 lokales, 148 Maximumnorm, 9 Menge abgeschlossene, 56 beschränkte, 59 kompakte, 62 INDEX Lebesgue–messbare, 163 nach oben beschränkte, 37 nach unten beschränkte, 37 offene, 56 unvollständige, 65 vollständige, 65 zusammenhängende, 67 Minimalstelle lokale, 148 Minimierer, 41 Minimum einer Folge, 42 einer Funktion, 40 einer Menge, 38 lokales, 148 Minorante, 80 Minorantenkriterium, 80 Mittelwertsatz, 127 Monotoniekriterium, 71 Multiplikation, 6 skalare, 6 Nabla, 147 Nachkommaanteil, 40 Negativteil, 171 Norm, 8 Betragssummennorm, 9 Einsnorm, 9 euklidische, 9 Maximumnorm, 9 p-Norm, 9 Standardnorm auf Cn , 9 Standardnorm auf Rn , 9 submultiplikative, 35 Supremumsnorm, 91 Tschebychev–Norm, 9 Unendlichnorm, 9 Nullfolge, 47 Nullmenge, 162 Nullstellensatz von Bolzano, 112 Ordnungsrelation, 7 orthogonal, 20 Orthogonalbasis, 21 Orthogonalität, 20 Orthonormalbasis, 21 Parallelogrammgleichung, 18 Partialpolynom, 93 Partialsumme, 75 INDEX p-Norm, 9 Polarkoordinaten, 186 Polynom Taylor–Polynom, 134 Positivteil, 170 Potenzreihe, 93 Produkt inneres, 14 Produktregel, 123 Punkt innerer, 53 Randpunkt, 53 Quotientenkriterium, 85 Quotientenregel, 123 Rand, 53 Randpunkt, 53 Raum Banach–Raum, 65 Hilbert–Raum, 65 Innenproduktraum, 15 normierter, 10 Untervektorraum, 6 Vektorraum, 6 Regel des konstanten Faktors, 123 Kettenregel, 124 Produktregel, 123 Quotientenregel, 123 Summenregel, 123 von de l’Hôpital, 128 Reihe, 75 absolut konvergente, 82 alternierende, 78 alternierende harmonische, 76 divergente, 76 geometrische, 76 harmonische, 75 konvergente, 76 Leibniz–Reihe, 77 Taylor–Reihe, 134 Relation, 7 Äquivalenzrelation, 7 antisymmetrische, 7 Ordnungsrelation, 7 reflexive, 7 symmetrische, 7 Totalordnung, 7 transitive, 7 203 Rieszscher Darstellungssatz, 24 Sandwichtheorem, 71 Satz des Pythagoras, 20 Fundamentalsatz der Analysis, 177 Mittelwertsatz, 127 Nullstellensatz von Bolzano, 112 Riemannscher Umordnungssatz, 83 Rieszscher Darstellungssatz, 24 Sandwichtheorem, 71 Umordnungssatz, 83 vom Minimum und Maximum, 114 von Bolzano–Weierstraß, 64 von Fubini, 183 von Heine–Borel, 63 von Rolle, 127 von Schwarz, 145 von Taylor, 136 Zwischenwertsatz, 111 Schranke obere, 37 untere, 37 Signumfunktion, 4 Sinusfunktion, 96 hyperbolische, 96 Skalarprodukt, 14 euklidisches, 14 Sphäre, 12 Stammfunktion, 177 Standardnorm auf Cn , 9 auf Rn , 9 Standardskalarprodukt auf Rn , 14 Steigung, 119 Stelle stationäre, 149 Subtitutionsregel, 189 Summenregel, 123 Supremum einer Folge, 42 einer Funktion, 41 einer Menge, 37 Supremumsnorm, 91 Taylor–Polynom, 134 Taylor–Reihe, 134 Teilfamilie, 33 Teilfolge, 45 204 Totalordnung, 7 Tschebychev–Norm, 9 Überdeckung, 62 offene, 62 Umordnungssatz, 83 Riemannscher, 83 Unendlichnorm, 9 Ungleichung Cauchy–Schwarzsche, 18 Dreiecksungleichung, 8 umgekehrte Dreiecksungleichung, 12 Untervektorraum, 6 Variable einer Potenzreihe, 93 Vektor, 5 Vektoraddition, 6 Vektorraum, 6 endlichdimensionaler, 6 Verknüpfung, 6 Vollständigkeitsaxiom, 38 Volumen eines rechtsoffenen Intervalls, 160 Vorzeichen, 4 Winkel, 18 Wurzelkriterium, 84 Zahl Eulersche, 72 Zwischenwertsatz, 111 INDEX