Kapitel 2 Funktionen 2.1 2.2 2.3 2.4 2.5 Funktionen Monotone Funktionen Polynome Rationale Funktionen Abzählbarkeit von Mengen 2.1 Funktionen Der Begriff der Funktion oder Abbildung ist von zentraler Bedeutung für die gesamte Mathematik. Wir führen ihn in der nachstehenden Definition ein. Definition 2.1 Seien X, Y zwei gegebene Mengen. (a) Eine Vorschrift f , die jedem Element x ∈ X genau ein Element y = f (x) ∈ Y zuordnet, heißt Funktion oder Abbildung von X nach Y . Wir schreiben hierfür f : X → Y. (b) Für eine Funktion f : X → Y heißen X der Definitionsbereich, Y der Wertebereich und f (X) := {f (x) | x ∈ X} der Bildbereich von f . (c) Zwei Funktionen f1 : X → Y und f2 : X → Y mit demselben Definitionsbereich heißen gleich, wenn f1 (x) = f2 (x) für alle x ∈ X gilt. (d) Die Menge Graph(f ) := (x, f (x)) | x ∈ X heißt der Graph von einer Funktion f : X →Y. Als Warnung sei an dieser Stelle erwähnt, dass in der Literatur zwischen dem Bildbereich und dem Wertebereich einer Funktion manchmal nicht unterschieden wird. Bei der Angabe einer Funktion hat man stets den Definitionsbereich und den Wertebereich mit aufzuführen (sofern diese nicht aus dem jeweiligen Zusammenhang klar sind), während man den Bildbereich gegebenenfalls erst bestimmen muss. Wir geben als Nächstes einige Beispiele von Funktionen an. 39 40 KAPITEL 2. FUNKTIONEN Beispiel 2.2 (a) Für ein c ∈ R bezeichnet man die Abbildung f : R → R mit f (x) := c als eine konstante Funktion. Definitions– und Wertebereich sind jeweils R, der Bildbereich besteht nur aus dem einen Element {c}. (b) Die Abbildung f : R → R mit f (x) := x wird als Identität bezeichnet. Definitions–, Werte– und Bildbereich ist ganz R, (c) Die Betragsfunktion ist definiert durch f : R → R, f (x) := |x|. Der Definitionsbereich ist R, der Wertebereich R, der Bildbereich hingegen nur R+ := {x ∈ R | x ≥ 0}. √ (d) Die Quadratwurzel ist definiert durch f : R+ → R, f (x) := x. Der Definitionsbereich ist R+ , der Wertebereich ist R. Wegen Satz 1.35 ist der Bildbereich gegeben durch R+ . (e) Unter einem Polynom vom Grad n in R versteht man eine Abbildung der Gestalt f : R → R, f (x) := an xn + an−1 xn−1 + . . . + a1 x + a0 mit gewissen Koeffizienten a0 , a1 , . . . , an−1 , an ∈ R, wobei für den so genannten Leitkoeffizienten an 6= 0 gelte. Der Definitionsbereich ist R, ebenso der Wertebereich. Der Bildbereich hängt vom konkreten Aussehen des Polynoms p ab. Für f (x) := x3 ist der Bildbereich der gesamte R, für f (x) := x4 hingegen ist der Bildbereich lediglich R+ . (f) Seien p(x) := an xn + . . . + a1 x + a0 und q(x) := bm xm + . . . + b1 x + b0 zwei Polynome vom Grad n und m sowie X := {x ∈ R | q(x) 6= 0}. Dann bezeichnet man die durch p(x) r : X → R, r(x) := q(x) definierte Abbildung als eine rationale Funktion. Der Definitionsbereich von r besteht also gerade aus allen reellen Zahlen mit Ausnahme der Nullstellen von q, der Wertebereich hingegen ist R. (g) Seien a < b zwei reelle Zahlen. Eine Abbildung f : [a, b] → R heißt Treppenfunktion, wenn es eine Unterteilung a = t0 < t1 < . . . < tn−1 < tn = b des Intervalls [a, b] := {x ∈ R | a ≤ x ≤ b} und Konstanten c1 , c2 , . . . , cn ∈ R gibt mit f (x) = ck für alle x ∈ (tk−1 , tk ) := {x ∈ R | tk−1 < x < tk } (1 ≤ k ≤ n). Die Funktionswerte f (tk ) in den Teilpunkten tk sind hierbei beliebig (aber endliche Werte aus R). 41 2.1. FUNKTIONEN a = t0 t1 t2 t3 b = t4 Abbildung 2.1: Beispiel einer Treppenfunktion (h) Die Abbildung f : R → R mit f (x) := 0, 1, falls x ∈ Q, falls x ∈ /Q ist etwas unangenehm und lässt sich graphisch nicht leicht veranschaulichen, da Q nach Satz 1.34 dicht in R liegt. Der Definitionsbereich dieser Funktion ist wieder ganz R, der Bildbereich hingegen besteht nur aus den beiden Punkten 0 und 1. 3 Funktionen werden oft mit dem Symbol f bezeichnet. Liegen mehrere Abbildungen vor, nummeriert man sie häufig in der Gestalt f1 , f2 , . . .. Treten nur zwei Funktionen auf, nennt man diese häufig f und g, bei drei Funktionen wählt man gerne die Buchstaben f, g und h. Polynome hingegen tragen im Allgemeinen die Namen p oder q, rationale Funktionen dagegen die Bezeichnung r. Auch die entsprechenden Großbuchstaben werden gerne benutzt. In der folgenden Definition führen wir die Verknüpfung zweier Abbildungen ein. Definition 2.3 Gegeben seien drei Mengen X1 , X2 und X3 sowie zwei Abbildungen f1 : X1 → X2 und f2 : X2 → X3 . Unter dem Kompositum (oder Verknüpfung oder Hintereinanderschaltung) von f1 und f2 verstehen wir die Funktion f : X1 → X3 , welche durch f := f2 ◦ f1 mit (f2 ◦ f1 )(x) := f2 (f1 (x)) für alle x ∈ X1 definiert ist. Man beachte, dass man zwei Funktionen f1 und f2 natürlich nur dann miteinander verknüpfen kann, wenn der Bildbereich von f1 im Definitionsbereich von f2 liegt, da anderenfalls die Funktion f2 im Punkte f1 (x) eventuell nicht erklärt ist. Unser nächstes Resultat besagt, dass das Kompositum von Abbildungen stets assoziativ ist. 42 KAPITEL 2. FUNKTIONEN Satz 2.4 Seien X1 , X2 , X3 , X4 gewisse Mengen und f1 : X1 → X2 , f2 : X2 → X3 und f3 : X3 → X4 gegebene Funktionen. Dann gilt f3 ◦ (f2 ◦ f1 ) (x) = (f3 ◦ f2 ) ◦ f1 (x) für alle x ∈ X1 , d.h., die beiden Abbildungen f3 ◦ (f2 ◦ f1 ) und (f3 ◦ f2 ) ◦ f1 sind gleich. Beweis: Gemäß Definition 2.3 gilt einerseits f3 ◦ (f2 ◦ f1 ) (x) = f3 (f2 ◦ f1 ) (x) = f3 f2 (f1 (x)) und andererseits (f3 ◦ f2 ) ◦ f1 (x) = (f3 ◦ f2 )(f1 (x)) = f3 f2 (f1 (x)) für alle x ∈ X1 , womit die Behauptung auch schon bewiesen ist. 2 Eine Abbildung f : X → Y zwischen zwei Mengen X und Y war dadurch definiert, das jedem Element x ∈ X auf eindeutige Weise ein Wert y = f (x) ∈ Y zugeordnet wurde. Umgekehrt kann es aber vorkommen, dass es zu einem y ∈ Y entweder überhaupt kein x ∈ X mit f (x) = y gibt oder sogar zwei (bzw. mehr) verschiedene Elemente x1 , x2 ∈ X existieren mit f (x1 ) = y und f (x2 ) = y. Will man diese Fälle ausschließen, so gelangt man zu den Begriffen einer surjektiven und einer injektiven Abbildung. Definition 2.5 Seien X, Y zwei beliebige Mengen und f : X → Y eine gegebene Funktion. (a) f heißt surjektiv, wenn f (X) = Y ist, es also zu jedem y ∈ Y mindestens ein Element x ∈ X mit f (x) = y gibt. (b) f heißt injektiv, wenn für alle x1 , x2 ∈ X mit f (x1 ) = f (x2 ) stets x1 = x2 folgt. (c) f heißt bijektiv, wenn f sowohl surjektiv als auch injektiv ist. Als Beispiel betrachten wir die einfache Abbildung f : R → R, x 7→ f (x) := x2 . Diese Abbildung ist weder surjektiv noch injektiv, denn wegen f (x) ≥ 0 für alle x ∈ R ist der Bildbereich f (R) = R+ von R verschieden, außerdem gilt f (x) = x2 = (−x)2 = f (−x). Hingegen ist die Abbildung f : R → R+ , x 7→ f (x) := x2 offenbar surjektiv, allerdings nach wie vor nicht injektiv. Dagegen ist f : R+ → R+ , x 7→ f (x) := x2 (2.1) 43 2.1. FUNKTIONEN ganz offensichtlich sowohl surjektiv als auch injektiv, also bijektiv. Diese Ausführungen verdeutlichen noch einmal, warum man bei der Angabe einer Funktion f : X → Y stets den Definitionsbereich X und die Menge Y mit erwähnen sollte. Später werden wir hierauf allerdings manchmal verzichten, wenn die Mengen X und Y aus dem Zusammenhang klar sind. Sei nun f : X → Y eine injektive Abbildung. Betrachten wir f : X → f (X) dann nur als Funktion von X auf ihrem Bildbereich f (X) ⊆ Y , so ist f per Definition auch surjektiv und damit bijektiv. Also existiert zu jedem Element y ∈ f (X) genau ein Element x ∈ X mit f (x) = y. Auf diese Weise erhalten wir also eine Vorschrift, die jedem Element y ∈ f (X) auf eindeutige Weise ein x ∈ X zuordnet. Diese Vorschrift wird als Umkehrabbildung von f bezeichnet und als f −1 geschrieben. Wir führen diese jetzt allgemein für bijektive Abbildungen ein. Definition 2.6 Seien X, Y zwei Mengen und f : X → Y eine bijektive Abbildung. Dann heißt die Abbildung f −1 : Y → X, y 7→ f −1 (y) := x, falls f (x) = y, die Umkehrfunktion von f . Zum Beispiel besitzt die als bijektiv erkannte Abbildung f aus (2.1) die Umkehrfunktion √ f −1 : R+ → R+ , x 7→ f −1 (x) := x. Speziell für eine bijektive Abbildung f : D → R mit Definitionsbereich D ⊆ R besitzt die Umkehrfunktion eine einfache geometrische Interpretation: Zunächst ist Graph(f ) = (x, f (x)) | x ∈ D Schreiben wir y := f (x) für x ∈ D, so erhalten wir als Graphen der Umkehrfunktion den Ausdruck Graph(f −1 ) = (y, f −1(y)) | y ∈ f (D) = (f (x), x) | x ∈ D . Anschaulich ergibt sich der Graph der Umkehrfunktion somit aus dem Graphen der Ausgangsfunktion f durch Spiegelung an der Winkelhalbierenden. Die Abbildung 2.2 veranschaulicht diesen Sachverhalt. Die gerade Linie ist die Winkelhalbierende. Durch Spielgelung der Abbildung f (x) = x2 an dieser Winkelhalbierenden erhält man die Wurzelfunktion √ f −1 (x) = x als Umkehrfunktion (und umgekehrt). Für die Umkehrfunktion gelten die nachstehend zusammengefassten Eigenschaften. Satz 2.7 ( Eigenschaften der Umkehrfunktion ) Seien X, Y zwei Mengen und f : X → Y eine bijektive Abbildung mit der Umkehrfunktion f −1 : Y → X. Dann gelten: 44 KAPITEL 2. FUNKTIONEN 4.0 3.5 3.0 2.5 2.0 1.5 1.0 0.5 0.0 0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0 Abbildung 2.2: Veranschaulichung der Umkehrfunktion. (a) Es ist f −1 f (x) = x für alle x ∈ X. (b) Es ist f f −1 (y) = y für alle y ∈ Y . (c) f −1 ist bijektiv mit (f −1 )−1 (x) = f (x) für alle x ∈ X, d.h., die Umkehrfunktion von f −1 ist wieder die Abbildung f . Beweis: (a) Sei x ∈ X beliebig. Setze y := f (x). Dann ist f −1 f (x) = f −1 (y) = x. (b) Sei y ∈ Y beliebig und setze x := f −1 (y), also f (x) = y. Dann ist f f −1 (y) = f (x) = y. (c) Sei x ∈ X beliebig. Setze y := f (x). Mit g := f −1 ist dann (f −1 )−1 (x) = g −1(x) = y = f (x) aufgrund der Definition der Umkehrfunktion. 2 Das Symbol f −1 wird oft auch in einem anderen Zusammenhang verwendet. Bezeichnet f : X → Y nämlich eine nicht notwendig bijektive Abbildung, so versteht man für ein gegebenes y ∈ Y unter der Menge f −1 (y) := {x ∈ X | f (x) = y} das Urbild von y unter der Abbildung f . Im Falle einer bijektiven Abbildung ist dieses Urbild einelementig und ergibt gerade das Element im vorher definierten Sinne. Etwas allgemeiner definiert man für eine Menge M ⊆ Y das Urbild von M unter der Abbildung f als f −1 (M) := {x ∈ X | f (x) ∈ M}. Abschließend sei noch erwähnt, dass man für zwei Abbildungen f1 , f2 : X → Y die Summe, das Produkt und den Quotienten definiert durch (f1 + f2 )(x) := f1 (x) + f2 (x), (f1 · f2 )(x) := f1 (x) · f2 (x), f f1 (x) 1 (x) := f2 f2 (x) für alle x ∈ X, wobei natürlich f2 (x) 6= 0 im Falle des Quotienten gelten muss. 45 2.2. MONOTONE FUNKTIONEN 2.2 Monotone Funktionen Die Klasse der (streng) monotonen Funktionen ist von einiger Bedeutung und wird in der nachstehenden Definition eingeführt. Definition 2.8 Sei D ⊆ R gegeben. Eine Funktion f : D → R heißt (a) monoton wachsend, wenn f (x1 ) ≤ f (x2 ) für alle x1 , x2 ∈ D mit x1 < x2 gilt. (b) monoton fallend, wenn f (x1 ) ≥ f (x2 ) für alle x1 , x2 ∈ D mit x1 < x2 gilt. (c) streng monoton wachsend, wenn f (x1 ) < f (x2 ) für alle x1 , x2 ∈ D mit x1 < x2 gilt. (d) streng monoton fallend, wenn f (x1 ) > f (x2 ) für alle x1 , x2 ∈ D mit x1 < x2 gilt. Häufig werden wir nur von einer monotonen Funktion sprechen, wenn diese entweder monoton wachsend oder monoton fallend ist, es aber vom Zusammenhang her nicht weiter wichtig ist, ob diese Funktion nun wächst oder fällt. Ebenso verwenden wir den Begriff einer streng monotonen Funktion, wenn die Funktion streng monoton wächst oder streng monoton fällt. Die Abbildung 2.3 enthält den Graphen dreier Funktionen, von denen eine in dem angegebenen Intervall [−1, 3] strikt monoton wachsend ist, eine andere monoton (aber nicht strikt monoton) wächst und eine dritte Funktion strikt monoton fällt. 3 2 1 1 -1 2 3 -1 -2 Abbildung 2.3: Der Graph einiger (strikt) monotoner Funktionen im Intervall [−1, +3]. Wir zeigen als Nächstes, dass eine streng monotone Funktion stets injektiv ist. Satz 2.9 Seien D ⊆ R und f : D → R streng monoton (wachsend oder fallend). Dann ist f injektiv. 46 KAPITEL 2. FUNKTIONEN Beweis: Ohne Beschränkung der Allgemeinheit gehen wir davon aus, dass f streng monoton wächst. Seien dann x1 , x2 ∈ D zwei gegebene Punkte mit f (x1 ) = f (x2 ). Wäre x1 < x2 , so folgte f (x1 ) < f (x2 ) wegen der strengen Monotonie von f . Wäre hingegen x1 > x2 , so wäre f (x1 ) > f (x2 ), und zwar ebenfalls wegen der strengen Monotonie von f . Also muss x1 = x2 sein, so dass f tatsächlich injektiv ist. 2 Eine streng monotone Funktion f : D → R muss natürlich nicht bijektiv sein. Beispielsweise ist die Abbildung f : [0, ∞) → R, f (x) := x2 , streng monoton steigend, nimmt aber keine negativen Werte an. Allerdings ist eine injektive Funktion auf ihrem Bildbereich natürlich bijektiv. Eine streng monotone Funktion f : D → R, aufgefasst als Abbildung f : D → f (D) mit f (D) := {y ∈ R | ∃x ∈ D : y = f (x)} besitzt daher stets eine Umkehrfunktion f −1 : f (D) → D. Für diese gilt das nachstehende Resultat. Satz 2.10 ( Monotonie der Umkehrfunktion ) Seien D ⊆ R und f : D → R streng monoton wachsend (fallend) mit Bildbereich f (D) := {y ∈ R | ∃x ∈ D : y = f (x)}. Dann ist die Umkehrfunktion f −1 : f (D) → D ebenfalls streng monoton wachsend (fallend). Beweis: Die Existenz der Umkehrfunktion wurde schon im Vorwege begründet. Seien nun y1 , y2 ∈ f (D) mit y1 < y2 beliebig gegeben. Dann existieren eindeutig bestimmte Elemente x1 , x2 ∈ D mit f (x1 ) = y1 und f (x2 ) = y2 . Setzen wir f ohne Einschränkung als streng monoton wachsend voraus, so müssen wir x1 < x2 zeigen. Wäre x1 ≥ x2 , so würde y1 = f (x1 ) ≥ f (x2 ) = y2 gelten im Widerspruch zu y1 < y2 . Damit ist bereits alles gezeigt. 2 Wir betrachten noch ein einfaches Beispiel. Beispiel 2.11 Sei k ∈ N beliebig gegeben (wobei letztlich nur der Fall k ≥ 2 von Interesse ist). Die Funktion f : R+ → R, x 7→ xk , ist offenbar streng monoton wachsend und bildet √ −1 k R+ auf R+ ab. Die zugehörige Umkehrfunktion f : R+ → R+ , x 7→ x, ist daher ebenfalls streng monoton wachsend und wird als k-te Wurzel bezeichnet. Ist k ∈ N ungerade, so ist die Funktion f : R → R, x 7→ xk , sogar bijektiv als Abbildung √ von R in R. In diesem Fall kann die k-te Wurzel daher als Funktion f −1 : R → R, x 7→ k x, auf ganz R definiert werden. 3 2.3 Polynome Bei den Polynomen handelt es sich um spezielle Abbildungen, denen in der Analysis eine besondere Bedeutung zukommt. Wir widmen ihnen daher einen eigenen Abschnitt. Dazu bezeichnen wir mit K im Folgenden stets den reellen oder komplexen Körper. Wir haben also K = R oder K = C. 47 2.3. POLYNOME In der Analysis bezeichnet man eine Funktion der Gestalt p(x) := an xn + an−1 xn−1 + . . . + a1 x + a0 (2.2) als ein Polynom, wobei a0 , a1 , . . . , an ∈ K gewisse Koeffizienten sind, vergleiche Beispiel 2.2 (e). Speziell für K = R spricht man von einem reellen Polynom. Die Menge aller solchen Polynome wird mit K[x] bezeichnet. Ist der so genannte Leitkoeffizient an von Null verschieden, so handelt es sich bei der Abbildung (2.2) um ein Polynom vom Grad n. Dem Nullpolynom p ≡ 0 wird hierbei kein Grad zugeordnet. In der Definition (2.2) haben wir den Definitionsbereich des Polynoms nicht mit angegeben. In der Analysis wird dies im Allgemeinen R oder C sein, so dass die Unbekannte x eine reelle oder komplexe Zahl repräsentiert. In der Algebra werden für x aber häufig auch andere Objekte eingesetzt wie beispielsweise Matrizen. Bevor wir zu dem ersten Resultat dieses Abschnittes gelangen, wollen wir als Motivation zunächst an die aus der Schule (hoffentlich) bekannte Polynomdivision erinnern, die auch unter dem Namen Euklidischer Algorithmus in allgemeineren Zusammenhängen auftritt. Die Aufgabe besteht darin, ein gegebenes Polynom p durch ein anderes Polynon q (von meist kleinerem Grad) zu dividieren. Das Ergebnis sollte ein weiteres Polynom s sein, ggf. bleibt als Rest“ r übrig, bei dem es sich ebenfalls um ein Polynom handelt, welches sich ” nicht mehr durch q teilen lässt. Wir suchen also Polynome s und r mit p(x) r(x) = s(x) + q(x) q(x) ⇐⇒ p(x) = s(x)q(x) + r(x). (2.3) Zunächst also das angekündigte einfache Beispiel. Beispiel 2.12 ( Polynomdivision ) Gegeben seien die beiden Polynome p(x) := 4x5 − x4 + 2x3 + x2 − 1 und q(x) := x2 + 1. Polynomdivision liefert (+4x5 −x4 +2x3 +x2 −1) : −4x3 −4x5 −x4 −2x3 +x2 +x4 −2x3 +2x2 +2x +2x3 2 +2x +2x −2x2 +2x (x2 + 1) = 4x3 − x2 − 2x + 2 −1 −2 −3 Wir erhalten damit die gewünschte Zerlegung (2.3) mit s(x) := 4x3 − x2 − 2x + 2 und dem Restpolynom r(x) := 2x − 3. 3 48 KAPITEL 2. FUNKTIONEN Ein erstes wichtiges Resultat für Polynome ist in dem nachfolgenden Resultat enthalten. Satz 2.13 ( Division mit Rest ) Seien g ein von Null verschiedenes Polynom. Dann gibt es zu jedem Polynom f eindeutig bestimmte Polynome q und r mit f = qg + r, (2.4) wobei r ≡ 0 oder Grad r < Grad g gilt. Beweis: Seien f (x) = an xn + an−1 xn−1 + . . . + a1 x + a0 mit an 6= 0 g(x) = bm xm + bm−1 xm−1 + . . . + b1 x + b0 mit bm 6= 0 und die beiden gegebenen Polynome. Wir beweisen zunächst die Existenz einer Zerlegung der Gestalt (2.4). Gilt bereits Grad f < Grad g, so sind wir wegen f = 0 · g + f fertig, indem wir q ≡ 0 und r ≡ f setzen. Sei daher n ≥ m vorausgesetzt. Subtrahieren wir von f das Polynom bamn xn−m g(x), so erhält man mit an n−m x g(x) f1 (x) := f (x) − bm ein Polynom f1 mit f1 ≡ 0 oder n1 := Grad f1 < n. Ist nun n1 < m, so sind wir fertig, indem wir q := bamn xn−m und r := f1 setzen. Gilt dagegen n1 ≥ m, so fahren wir auf diese Weise fort und subtrahieren von f1 nochmals ein geeignetes Vielfaches von g, um ein Polynom f2 mit f2 ≡ 0 oder n2 := Grad f2 < n1 zu erhalten. Nach endlich vielen Schritten bricht dieser Prozess ab und wir gelangen zu einer Darstellung der Gestalt (2.4). Zum Nachweis der Eindeutigkeit der Zerlegung (2.4) nehmen wir an, dass wir eine weitere Darstellung f = q ′ g + r ′ mit q ′ 6= q (für q ′ = q wäre zwangsläufig auch r ′ = r) haben, wobei r ′ ≡ 0 oder Grad r ′ < Grad g gilt. Dann folgt (q ′ − q)g = r − r ′ und somit der Widerspruch Grad(g) ≤ Grad (q ′ − q)g = Grad(r − r ′ ) < Grad(g), | {z } ≥1 wegen q ′ 6=q womit alles bewiesen ist. 2 Sei nun p(x) = a0 + a1 x + . . . + an xn mit an 6= 0 ein Polynom vom Grad n. Sei ferner x1 eine Nullstelle von p, also p(x1 ) = 0. Dann lässt sich der Faktor x − x1 von p abdividieren. Genauer gilt wegen xk − xk1 = (x − x1 ) (xk−1 + xk−2 x1 + . . . + xx1k−2 + x1k−1 ) = (x − x1 )qk (x) | {z } =:qk (x) 49 2.3. POLYNOME für alle k ≥ 2 nämlich p(x) = p(x) − p(x1 ) = a1 (x − x1 ) + a2 (x2 − x21 ) + . . . + an (xn − xn1 ) = (x − x1 ) a1 + a2 q2 (x) + . . . + an qn (x) | {z } =:b0 +b1 x+...+bn−2 xn−2 +bn−1 xn−1 =:p1 (x) = (x − x1 )p1 (x), wobei das Polynom p1 wegen bn−1 = an 6= 0 den Grad n − 1 besitzt. Ist jetzt noch Grad p1 ≥ 1 und x1 eine Nullstelle von p1 , so lässt sich x − x1 auch von p1 abdividieren, und man erhält die Gleichung p(x) = (x − x1 )2 p2 (x) mit einem Polynom p2 vom Grad n − 2. Indem man so fortfährt, gelangt man schließlich zu einer Darstellung p(x) = (x − x1 )n1 pn1 (x) mit einem Polynom pn1 vom Grade n−n1 , für welches pn1 (x1 ) 6= 0 ist. Besitzt das ursprüngliche Polynom p eine weitere Nullstelle x2 6= x1 , so ist x2 natürlich auch eine Nullstelle von pn1 . Also kann man eine möglichst hohe Potenz des Linearfaktors x − x2 abspalten. So fortfahrend, gelangt man zu dem nachstehenden Resultat. Satz 2.14 Ein Polynom p vom Grad n ≥ 1 besitzt höchstens m ≤ n verschiedene Nullstellen x1 , x2 , . . . , xm , mit deren Hilfe es sich schreiben lässt als p(x) = (x − x1 )n1 · . . . · (x − xm )nm q(x) mit einem Polynom q vom Grad n − (n1 + . . . + nm ), das seinerseits keine Nullstellen mehr besitzt. Als unmittelbare Konsequenz aus dem Satz 2.14 notieren wir ein wichtiges Resultat über die Gleichheit zweier Polynome. Satz 2.15 ( Identitätssatz für Polynome ) Stimmen zwei Polynome p(x) = an xn + . . . + a1 x + a0 und q(x) = bn xn + . . . + b2 x + b0 an n + 1 verschiedenen Stellen überein, so gilt ak = bk für alle k = 0, 1, . . . , n und daher p(x) = q(x) für alle x ∈ K. Beweis: Aus ak = bk für alle k = 0, 1, . . . , n folgt natürlich p(x) = q(x) für alle x ∈ K, so dass nur noch die Gleichheit aller Koeffizienten bewiesen werden muss. Der Beweis geschieht durch Widerspruch. Angenommen, es gibt einen (größten) Index m ∈ {0, 1, . . . , n} mit am 6= bm und ak = bk für alle k = m + 1, . . . , n. Das Differenzpolynom m X r(x) := p(x) − q(x) = (ak − bk )xk k=0 50 KAPITEL 2. FUNKTIONEN hat dann den Grad m und besitzt n + 1 > m Nullstellen. Im Fall m ≥ 1 liefert dies einen Widerspruch zum Satz 2.14, und im Fall m = 0 (konstantes Polynom 6= 0) ist dies sowieso nicht möglich. 2 Den Satz 2.14 kann man verschärfen, indem man komplexe Nullstellen zulässt. Dann besitzt jedes (reelle oder komplexe) Polynom vom Grad n genau n Nullstellen, die allerdings auch bei reellen Polynomen komplex sein können. Dies ist die Aussage des folgenden Satzes, den wir allerdings erst zu einem späteren Zeitpunkt beweisen werden, siehe Satz 5.26. Satz 2.16 ( Fundamentalsatz der Algebra ) Jedes Polynom p ∈ K[x] vom Grad n ≥ 1 hat eine Darstellung p(x) = a(x − x1 )n1 · . . . · (x − xs )ns mit einem Faktor a ∈ K und (eventuell komplexen) paarweise verschiedenen Nullstellen xi ∈ C, wobei xi eine ni -fache Nullstelle von p ist und n1 + . . . + ns = n gilt. Für reelle Polynome können wir aus dem Satz 2.16 eine interessante Beobachtung herleiten. Sei dazu p(x) = an xn + . . . + a1 x + a0 mit ai ∈ R für alle i = 0, 1, . . . , n ein beliebiges reelles Polynom. Ist z ∈ C dann ein Nullstelle dieses reellen Polynoms p, so folgt aus n n n X X X p(z) = ak z k = ak z k = ak z k = p(z) = 0 = 0, k=0 k=0 k=0 dass die konjugiert–komplexe Zahl ebenfalls eine Nullstelle von p ist. Die nicht reellen Nullstellen treten also in Paaren konjugiert–komplexer Nullstellen auf. Durch Multiplikation der zugehörigen Linearfaktoren x − z und x − z erhalten wir ein reelles Polynom zweiten Grades: (x − z)(x − z) = x2 − 2Re(z)x + zz. Daher kann jedes reelle Polynom als Produkt von reellen Polynomen vom Grad 1 (für die reellen Nullstellen) und vom Grad 2 (für die konjugiert–komplexen Nullstellen) dargestellt werden. 2.4 Rationale Funktionen Unter einer rationalen Funktion verstehen wir den Quotienten aus zwei Polynomen, also R(x) = p(x) q(x) (2.5) 51 2.4. RATIONALE FUNKTIONEN für gewisse Polynome p, q ∈ K[x], wobei K ∈ {R, C} wieder den Körper der reellen oder komplexen Zahlen bezeichnet. Nun ist die Darstellung einer rationalen Funktion nicht eindeutig, beispielsweise ist x−1 R(x) = 2 x −1 eine rationale Funktion, deren Definitionsbereich zunächst nur die Menge K\{±1} ist, da wir für x = 1 und x = −1 durch Null dividieren würden. Andererseits besitzt das Nennerpolynom wegen x2 − 1 = (x + 1)(x − 1) einen gemeinsamen Faktor mit dem Zählerpolynom, so dass wir nach Kürzung dieses Faktors 1 R(x) = x+1 erhalten, wobei der Definitionsbereich jetzt K\{−1} lautet. Wir können im Folgenden deshalb davon ausgehen, dass in der Darstellung (2.5) alle gemeinsamen Teilerpolynome von p und q bereits gekürzt sind. Der vollständige Definitionsbereich der rationalen Funktion (2.5) besteht dann aus der Menge aller x ∈ K, für die das (gekürzte) Nennerpolynom keine Nullstelle hat. Ein z ∈ K heißt n-facher Pol der rationalen Funktion (2.5), wenn p(z) 6= 0 ist und z eine Nullstelle von q der Vielfachheit n ist. Wegen Satz 2.14 existiert dann ein Polynom h mit h(z) 6= 0 und p(x) p(x) R(x) = = . (2.6) q(x) (x − z)n h(x) Die rationale Funktion 1 (x − z)n heißt dann Partialbruch. Für einen solchen Partialbruch gibt es auch eine additive Zerlegung, die wir in dem folgenden Resultat beschreiben. Lemma 2.17 ( Zerlegung einer rationalen Funktion ) Sei z ein n-facher Pol der rationalen Funktion R. Dann gibt es genau eine Zerlegung R(x) = H(x) + R0 (x) mit den folgenden Eigenschaften: (a) R0 ist eine rationale Funktion, die in z keinen Pol mehr hat. (b) der so genannte Hauptteil H ist von der Gestalt H(x) = mit an 6= 0. an an−1 a1 + + . . . + (x − z)n (x − z)n−1 x−z 52 KAPITEL 2. FUNKTIONEN Beweis: Wir beginnen zunächst mit einer Vorbetrachtung: Da z nach Voraussetzung ein n-facher Pol von R ist, haben wir für die rationale Funktion R eine Darstellung der Form (2.6). Hieraus folgt p(x)h(z) − p(z)h(x) (x − z)P (x) p(x) p(z) − = = h(x) h(z) h(x)h(z) h(x) mit einem Polynom P , dessen Existenz daraus folgt, dass das Zählerpolynom Q(x) := p(x)h(z) − p(z)h(x) in x = z offenbar eine Nullstelle hat. Damit erhalten wir aus (2.6) 1 (x − z)n 1 = (x − z)n an = (x − z)n R(x) = p(x) h(x) p(z) (x − z)P (x) · + h(z) h(x) P (x) p(z) + mit a := . n (x − z)n−1 h(x) h(z) · (2.7) Wir kommen nun zum eigentlichen Beweis und zeigen zunächst die Existenz der gewünschten Zerlegung. Dies erfolgt durch Induktion nach n. Im Fall n = 1 ist (2.7) bereits die gesuchte Zerlegung, da R0 := P/h wegen h(z) 6= 0 keinen Pol in z hat. In der Induktionsannahme können wir deshalb davon ausgehen, dass die Aussage für alle rationalen Funktionen richtig ist, die in x = z höchstens einen (n − 1)-fachen Pol haben. Für den Induktionsschluss von (n − 1) auf n betrachten wir nun die Zerlegung (2.7) und setzen hierzu P (x) . Rn−1 (x) := (x − z)n−1 h(x) Auf die Funktion Rn−1 können wir dann die Induktionsannahme anwenden, da diese in z keinen Pol oder höchstens einen (n − 1)-fachen Pol hat. Im erstgenannten Fall wählen wir einfach R0 := Rn−1 , ihm zweitgenannten Fall zerlege man Rn−1 dagegen gemäß Induktionsannahme. Zusammenfassend ergibt sich eine Darstellung von R der gewünschten Gestalt. Zum Nachweis der Eindeutigkeitsaussage nehmen wir an, dass wir zwei Zerlegungen der Gestalt n n X X ak bk + R (x) = + S0 (x) (2.8) 0 k k (x − z) (x − z) k=1 k=1 haben. Multiplikation beider Seiten mit (x − z)n und anschließendes Einsetzen von x = z bn an liefert dann an = bn . Nach Entfernen von (x−z) n = (x−z)n auf beiden Seiten der Identität (2.8) zeigt man auf analoge Weise an−1 = bn−1 . So fortfahrend erhält man auch die Eindeutigkeitsaussage. 2 Das Lemma 2.17 können wir natürlich auf jede Polstelle anwenden. Betrachte dazu die rationale Funktion R aus (2.5). Wegen des Fundamentalsatzes der Algebra lässt sich das Nennerpolynom schreiben als q(x) = (x − z1 )n1 · (x − z2 )n2 · . . . · (x − zs )ns 53 2.4. RATIONALE FUNKTIONEN für gewisse Nullstellen z1 , . . . , zs von q mit den Vielfachheiten n1 , . . . , ns (der in q eventuell auftretende konstante Faktor kann als Teil des Zählerpolynoms p genommen werden). Da gemeinsame Teilpolynome von p und q bereits rausgekürzt sind, handelt es sich bei z1 , . . . , zs dann um keine Nullstellen des Zählerpolynoms p. Folglich sind die zi Polstellen der rationalen Funktion R mit der Vielfachheit ni (i = 1, . . . , s). Anwendung des Lemmas 2.17 auf diese Polstellen liefert gewisse Hauptteile H1 , . . . , Hs von R und somit insgesamt eine Darstellung der Form R(x) = H1 (x) + . . . + Hs (x) + Q(x). Dabei handelt es sich bei Q um eine rationale Funktion ohne irgendwelche Pole. Nach dem Fundamentalsatz der Algebra ist Q somit der Quotient aus einem Polynom und einer Konstanten, folglich ein Polynom. Man bezeichnet Q als den Polynom–Anteil von R. Insgesamt haben wir damit das folgende Resultat bewiesen. Satz 2.18 ( Partialbruchzerlegung ) Jede rationale Funktion ist die Summe ihrer Hauptteile und ihres Polynom–Anteils. Die Partialbruchzerlegung wird später eine wichtige Rolle bei der Integration von rationalen Funktionen spielen. Dabei ist es wichtig, dass man die Partialbruchzerlegung einer rationalen Funktion auch konkret durchführen kann. Den Polynom–Anteil erhält man hierbei aus der Division mit Rest, die Partialbrüche aus der Linearfaktorzerlegung der verbleibenden rationalen Funktion, die Koeffizienten der Hauptteile schließlich durch einen Koeffizientenvergleich. Wir illustrieren das allgemeine Vorgehen kurz an einem Beispiel. Beispiel 2.19 Wir betrachten die rationale Funktion R(x) := x+1 . x(x − 1)2 (2.9) Hier ist der Grad des Zählerpolynoms bereits kleiner als der des Nennerpolynoms, so dass wir keinen Polynom–Anteil erhalten. Das Nennerpolynom ist außerdem schon in seine Linearfaktoren zerlegt mit den beiden Nullstellen z1 := 0 und z2 := 1 mit den zugehörigen Vielfachheiten n1 := 1 und n2 := 2. Der Ansatz für die Partialbruchzerlegung lautet somit R(x) := b2 b1 a + + 2 x − 0 (x − 1) x−1 (2.10) für gewisse a, b2 , b1 ∈ R. Zur Bestimmung von a, b1 und b2 multiplizieren wir die beiden Darstellungen (2.9) und (2.10) jeweils mit dem Nennerpolynom x(x − 1)2 und erhalten somit die Identität x + 1 = x(x − 1)2 R(x) = a(x − 1)2 + b2 x + b1 x(x − 1). Sortieren nach den Potenzen von x ergibt die Gleichheit x + 1 = ax2 − 2ax + a + b2 x + b1 x2 − b1 x = (a + b1 )x2 + (b2 − b1 − 2a)x + a. 54 KAPITEL 2. FUNKTIONEN Wegen Satz 2.15 können wir jetzt einen Koeffizientenvergleich durchführen und erhalten auf diese Weise das lineare Gleichungssystem a + b1 = 0, b2 − b1 − 2a = 1, a = 1. Dieses hat offenbar die eindeutig bestimmte Lösung a = 1, b1 = −1, b2 = 2, so dass wir für R die Partialbruchzerlegung R(x) = 1 2 1 + − x (x − 1)2 x − 1 erhalten. 2.5 3 Abzählbarkeit von Mengen Wir untersuchen in diesem Abschnitt die so genannte Mächtigkeit von Mengen. Dazu ist die nachstehende Definition von zentraler Bedeutung. Definition 2.20 Eine nichtleere Menge A heißt (höchstens) abzählbar, wenn eine surjektive Abbildung f : N0 → A existiert. Eine nichtleere Menge heißt überabzählbar, wenn sie nicht abzählbar ist. Wir geben als Nächstes einige Beispiele von (höchstens) abzählbaren Mengen an. Beispiel 2.21 (a) Jede endliche Menge A = {a0 , a1 , . . . , am } ist (höchstens) abzählbar. Dazu definiere man beispielsweise f : N0 → A durch an , falls 0 ≤ n ≤ m, f (n) := am , falls n > m. Offenbar ist f dann surjektiv (allerdings nicht bijektiv). (b) Die Menge A := N0 der natürlichen Zahlen (mit Null) ist abzählbar, denn die identische Abbildung f : N0 → N0 , f (n) := n, ist natürlich surjektiv (und selbstverständlich auch injektiv). (c) Die Menge A := Z der ganzen Zahlen ist ebenfalls abzählbar. Um dies einzusehen, werde f : N0 → Z definiert durch f (0) := 0, f (1) := +1, f (2) := −1, f (3) := +2, f (4) := −2, . . . Allgemein gilt also f (0) := 0, f (2n − 1) := n und f (2n) = −n für alle n ∈ N. Die so definierte Abbildung f ist offenbar surjektiv (sogar bijektiv). 3 Teilmengen von abzählbaren Mengen sind offenbar wieder (höchstens) abzählbar. Wegen Beispiel 2.21 (b) ist damit die Menge N der natürlichen Zahlen (ohne Null) abzählbar. Ein manchmal sehr nützliches Resultat über die Abzählbarkeit von Mengen ist in dem nächsten Satz enthalten. 55 2.5. ABZÄHLBARKEIT VON MENGEN Satz 2.22 Die Vereinigung (höchstens) abzählbar vieler abzählbarer Mengen ist wieder abzählbar. Beweis: Seien Mn (n ∈ N0 ) die abzählbaren Mengen. Wir bezeichnen die Elemente von Mn mit xnm , m ∈ N0 , also Mn = xnm m ∈ N0 } = {xn0 , xn1 , xn2 , . . . (n ∈ N0 ). Die Elemente der Vereinigungsmenge M := [ Mn n∈N0 schreiben wir in Form eines quadratisch unendlichen Schemas: M0 : x00 −→ ւ M1 : x10 ↓ ր M2 : x20 ւ M3 : x30 ↓ ր .. . x40 x01 x11 x21 x31 x02 −→ x03 ր ւ x12 x13 ւ ր x22 x23 ր x32 x33 ··· ր ··· ··· ··· ··· Die durch die Pfeile angedeutete Abbildung f (0) := x00 , f (1) := x01 , f (2) := x10 , f (3) := x20 , f (4) := x11 , . . . liefert offenbar eine Bijektion von N0 in die Vereinigungsmenge M. Also ist M abzählbar. 2 Eine unmittelbare Folgerung des Satzes 2.22 ist die Abzählbarkeit der rationalen Zahlen. Korollar 2.23 Die Menge Q aller rationalen Zahlen ist abzählbar. Beweis: Für jedes n ∈ N sind die beiden Mengen An := k k k ∈ N0 und Bn := − k ∈ N0 n n offenbar abzählbar. Nach Satz 2.22 ist dann auch k k ∈ Z = An ∪ Bn Cn := n abzählbar für jedes n ∈ N. Erneut wegen Satz 2.22 ist somit Q = Menge. S n∈N Cn eine abzählbare 2 Wir beweisen als Nächstes, dass die Menge der reellen Zahlen hingegen nicht abzählbar ist. 56 KAPITEL 2. FUNKTIONEN Satz 2.24 Die Menge R aller reellen Zahlen ist überabzählbar. Beweis: Zum Beweis verwenden wir das so genannte Cantorsche Diagonalverfahren. Dazu beweisen wir, dass das offene Intervall (0, 1) überabzählbar ist, was die eigentliche Behauptung offenbar impliziert. Angenommen, (0, 1) ist abzählbar. Dann existieren reelle Zahlen {xn }n∈N0 mit (0, 1) = {xn | n ∈ N0 } (hierbei ist xn = f (n) für eine geeignete surjektive Abbildung f : N0 → (0, 1) gesetzt worden). Die Dezimalbruchentwicklungen der Zahlen xn seien x1 = 0.a11 a12 a13 . . . x2 = 0.a21 a22 a23 . . . x3 = 0.a31 a32 a33 . . . .. .. . . Wir definieren nun eine Zahl c ∈ (0, 1) durch die Dezimalbruchentwicklung c = 0.c1 c2 c3 . . . , wobei ck := 5, 4, falls akk = 6 5, falls akk = 5. Insbesondere gilt ck 6= akk für alle k ∈ N. Nach Annahme existiert ein n ∈ N mit c = xn . Daraus folgt aber cn = ann im Widerspruch zur Konstruktion von c. Also ist (0, 1) überabzählbar. 2 Zwei Mengen M1 und M2 haben die gleiche Mächtigkeit, wenn es eine bijektive Abbildung f : M1 → M2 gibt. Offenbar hat eine endliche Menge dann niemals die gleiche Mächtigkeit wie die Menge N0 . Hingegen hat N0 wegen Beispiel 2.21 (c) die gleiche Mächtigkeit wie die Menge der ganzen Zahlen Z, obwohl N0 eine echte Teilmenge von Z ist. Dagegen folgt aus dem Satz 2.24, dass weder N noch Z die gleiche Mächtigkeit wie die reellen Zahlen R haben können. Es seien noch einige weitere Beispiele erwähnt. x ist offenbar bijektiv. Beispiel 2.25 (a) Die Abbildung f : (0, 1) → R, f (x) := 1−|x| Also hat das Intervall (0, 1) die gleiche Mächtigkeit wie R und ist daher ebenfalls überabzählbar. (b) In Verallgemeinerung von Beispiel (a) hat auch jedes Intervall (a, b) die gleiche Mächtigkeit wie R und ist daher überabzählbar, denn die Abbildung h(x) := g(f (x)) mit f wie in (a) und t−a g : (a, b) → (0, 1), g(t) := b−a ist als Kompositum von bijektiven Abbildungen wieder bijektiv. Hieraus folgt beispielsweise die Aussage, dass zwischen zwei reellen Zahlen x, y ∈ R mit x < y stets 2.5. ABZÄHLBARKEIT VON MENGEN 57 eine irrationale Zahl liegt, denn sonst bestünde das gesamte Intervall (x, y) aus rationalen Zahlen, so dass Q insbesondere überabzählbar wäre im Widerspruch zum Korollar 2.23. (c) Die Menge R \ Q der irrationalen Zahlen ist überabzählbar. Denn anderenfalls wäre R = Q ∪ (R \ Q) ebenfalls abzählbar wegen Satz 2.22, so dass wir einen Widerspruch zum Satz 2.24 erhalten. (d) Eine Zahl x ∈ R heißt algebraisch, wenn sie Nullstelle eines Polynoms p(x) := an xn + . . . + a1 x + a0 mit Koeffizienten a0 , a1 , . . . , an ∈ Q (wir könnten sogar a0 , a1 , . . . , an ∈ Z fordern) ist. Wegen Satz 2.14 hat jedes solche Polynom höchstens n Nullstellen. Sei An := x x ist Nullstelle eines Polynoms p ∈ Q[x] vom Grad n . Aufgrund des Satzes 2.22 ist jedes An und damit auch die Menge aller algebraischen Zahlen A := A1 ∪ A2 ∪ A3 ∪ . . . abzählbar. (e) Sei A wieder die Menge aller algebraischen Zahlen. Die Elemente von T := R \ A bezeichnet man dann als transzendente Zahlen. Wegen (d) und Satz 2.24 ist T überabzählbar. 3 58 KAPITEL 2. FUNKTIONEN