Einführung in die Mathematik Franz Hofbauer Leo Summerer Eine Vorlesung für das Lehramtstudium Inhaltsverzeichnis Kapitel 1. Mengen und Funktionen 1. Mengen 2. Die natürlichen Zahlen 3. Variablen, Summen, Indices 4. Funktionen 5. Beweisen (Logik) 6. Vollständige Induktion 7. Binomialkoeffizient und binomischer Lehrsatz 8. Abzählbarkeit 1 1 3 4 7 10 12 13 14 Kapitel 2. Die ganzen Zahlen 1. Erweiterung der natürlichen Zahlen 2. Gruppen, Ringe, Körper 3. Division mit Rest und Euklidischer Algorithmus 4. Primzahlen 17 17 19 21 24 Kapitel 3. Rationale und reelle Zahlen 1. Brüche 2. Die Zahlengerade 3. Umrechnen der Brüche in Dezimalzahlen 4. Ordnungsrelation und Ungleichungen 5. Indirekter Beweis 6. Komplexe Zahlen 29 29 30 31 33 35 36 Kapitel 4. Restklassen 1. Äquivalenzrelationen 2. Restklassen modulo m 39 39 40 Kapitel 5. Polynome 1. Der Ring der Polynome 2. Polynome über Körpern 3. Zerlegung von Polynomen 43 43 44 47 KAPITEL 1 Mengen und Funktionen 1. Mengen Eine Menge ist eine Zusammenfassung von Objekten, wobei jedes Objekt nur einmal vorkommt. Diese Objekte nennt man die Elemente der Menge. Man schreibt sie in geschwungene Klammern, zum Beispiel {a, b, u, r}. Die Reihenfolge, in der man die Elemente der Menge aufschreibt, ist egal. Teilmengen. Eine Menge, die kein Element enthält, nennt man die leere Menge und bezeichnet sie mit ∅. Definition. Ist x ein Element einer Menge M , dann schreibt man x ∈ M . Ist x kein Element der Menge M , dann schreibt man x ∈ / M . Man nennt A eine Teilmenge der Menge B, wenn jedes Element von A auch Element von B ist. Man schreibt A ⊆ B. Manchmal schreibt man ⊂ anstelle von ⊆, jedoch kann mit A ⊂ B auch gemeint sein, dass A eine strikte Teilmenge von B ist, das heißt eine Teilmenge, die nicht gleich B ist. Dafür gibt es auch die Schreibweise A ( B. Beispiel. Sei B = {1, 2, 3, 4, 5}. Die zweielementigen Teilmengen der Menge B sind {1, 2}, {1, 3}, {1, 4}, {1, 5}, {2, 3}, {2, 4}, {2, 5}, {3, 4}, {3, 5}, {4, 5}. Man kann die Teilmengen einer Menge ebenfalls zu einer Menge zusammenfassen. Definition. Sei M eine Menge. Die Menge aller Teilmengen von M nennt man die Potenzmenge von M . Wir bezeichnen sie mit P(M ). Man kann diese Definition auch so aufschreiben: P(M ) = {A : A ⊆ M }. { Beispiel. Sei M = {a, b, c, d}. Die Potenzmenge P(M ) von M ist ∅, {a}, {b}, {c}, {d}, } {a, b}, {a, c}, {a, d}, {b, c}, {b, d}, {c, d}, {a, b, c}, {a, b, d}, {a, c, d}, {b, c, d}, {a, b, c, d} . Durchschnitt und Vereinigung. Aus Mengen kann man neue Mengen bilden. Wir führen die wichtigsten dieser Mengenoperationen ein. Definition. Seien A und B Mengen. Der Durchschnitt A ∩ B ist die Menge aller Elemente, die sowohl in A als auch in B liegen. Die Vereinigung A ∪ B ist die Menge aller Elemente, die in A oder in B (oder in beiden Mengen) liegen. Die Differenzmenge A \ B ist die Menge aller Elemente, die in A, aber nicht in B liegen. Man kann diese Definitionen auch so aufschreiben: A ∩ B = {x : x ∈ A und x ∈ B}, A ∪ B = {x : x ∈ A oder x ∈ B}, A \ B = {x : x ∈ A und x ∈ / B}. Beispiel. A = {2, 3, 5, 7, 11, 13} und B = {1, 2, 3, 5, 8, 13}. Dann A ∩ B = {2, 3, 5, 13}, A ∪ B = {1, 2, 3, 5, 7, 8, 11, 13} und A \ B = {7, 11}. Satz 1. Seien A, B und C Mengen. Dann gilt A ∩ B = B ∩ A und A ∪ B = B ∪ A (Kommutativgesetze) (A ∩ B) ∩ C = A ∩ (B ∩ C) und (A ∪ B) ∪ C = A ∪ (B ∪ C) 1 (Assoziativgesetze) 2 1. MENGEN UND FUNKTIONEN Beweis. folgt sofort aus der Definition. Die Assoziativgesetze erlauben das klammerfreie Aufschreiben von Vereinigung und Durchschnitt beliebig vieler Mengen. Satz 2. Seien A, B und C Mengen. Dann gelten die Distributivgesetze (A ∪ B) ∩ C = (A ∩ C) ∪ (B ∩ C) und (A ∩ B) ∪ C = (A ∪ C) ∩ (B ∪ C) Beweis. Für ein Element x gibt es die beiden Möglichkeiten x ∈ A und x ∈ / A. Dasselbe gilt auch für die Mengen B und C. Insgesamt ergibt das acht Möglichkeiten. Diese sind in den ersten drei Spalten der folgenden Tabelle angegeben. Die anderen Spalten folgen dann daraus mit Hilfe der Definition von Durchschnitt und Vereinigung A x∈ x∈ x∈ x∈ x∈ / x∈ / x∈ / x∈ / B x∈ x∈ x∈ / x∈ / x∈ x∈ x∈ / x∈ / C A ∪ B (A ∪ B) ∩ C A ∩ C B ∩ C (A ∩ C) ∪ (B ∩ C) x∈ x∈ x∈ x∈ x∈ x∈ x∈ / x∈ x∈ / x∈ / x∈ / x∈ / x∈ x∈ x∈ x∈ x∈ / x∈ x∈ / x∈ x∈ / x∈ / x∈ / x∈ / x∈ x∈ x∈ x∈ / x∈ x∈ x∈ / x∈ x∈ / x∈ / x∈ / x∈ / x∈ x∈ / x∈ / x∈ / x∈ / x∈ / x∈ / x∈ / x∈ / x∈ / x∈ / x∈ / In allen Fällen gilt x ∈ (A ∪ B) ∩ C genau dann, wenn x ∈ (A ∩ C) ∪ (B ∩ C) gilt. Damit ist (A∪B)∩C = (A∩C)∪(B∩C) gezeigt. Genauso zeigt man (A∩B)∪C = (A∪C)∩(B∪C). Komplementärmenge. Wir führen eine Grundmenge (Universalmenge) ein, die wir Ω nennen. (Diese Bezeichnung stammt aus der Stochastik.) Alle Mengen, die wir betrachten, sind Teilmengen von Ω. Dann kann man das Komplement einer Menge definieren. Definition. Sei M eine Menge, die in Ω enthalten ist. Das Komplement der Menge M (bezüglich Ω) enthält alle Elemente von Ω, die nicht in A liegen. Es wird mit M ′ bezeichnet. Man kann diese Definition auch so aufschreiben: M ′ = {x ∈ Ω : x ∈ / M }. Es gilt M ′ = Ω \ M . Satz 3. Seien A, B und C Teilmengen von Ω. Dann gelten die de Morganschen Regeln (A ∪ B)′ = A′ ∩ B ′ und (A ∩ B)′ = A′ ∪ B ′ Beweis. Wir führen einen Tabellenbeweis A B A ∪ B (A ∪ B)′ x∈ x∈ x∈ x∈ / x∈ x∈ / x∈ x∈ / x∈ / x∈ x∈ x∈ / x∈ / x∈ / x∈ / x∈ A′ x∈ / x∈ / x∈ x∈ B ′ A′ ∩ B ′ x∈ / x∈ / x∈ x∈ / x∈ / x∈ / x∈ x∈ In allen Fällen gilt x ∈ (A∪B)′ genau dann, wenn x ∈ A′ ∩B ′ gilt. Damit ist (A∪B)′ = A′ ∩B ′ gezeigt. Genauso zeigt man (A ∩ B)′ = A′ ∪ B ′ . Produktmenge. Eine andere Art, Mengen zu verknüpfen, ist die Produktmenge. Definition. Sind A und B Mengen, dann definiert man das Mengenprodukt A × B als Menge aller Paare (a, b) mit a ∈ A und b ∈ B, das heißt A × B = {(a, b) : a ∈ A, b ∈ B} Analog definiert man A × B × C = {(a, b, c) : a ∈ A, b ∈ B, c ∈ C}. 2. DIE NATÜRLICHEN ZAHLEN 3 Es ist darauf zu achten, dass ein Paar (a, b) oder ein Tripel (a, b, c) im Gegensatz zu einer Menge geordnet ist und auch gleiche Elemente enthalten kann. Es gilt (a, b) ̸= (b, a), aber {a, b} = {b, a}. Außerdem kann man das Paar (a, a) bilden, aber nicht die Menge {a, a}. Beispiel. Sei A = {1, 2} und B = {p, q}. Dann gilt A × B = {(1, p), (2, p), (1, q), (2, q)}, B × A = {(p, 1), (p, 2), (q, 1), (q, 2)}, A × A = {(1, 1), (2, 1), (1, 2), (2, 2)} und schließlich A × B × B = {(1, p, p), (2, p, p), (1, q, p), (2, q, p), (1, p, q), (2, p, q), (1, q, q), (2, q, q)}. Satz 4. Seien A, B und C Mengen. Dann gilt (A ∪ B) × C = (A × C) ∪ (B × C). Beweis. Wir A B x∈ x∈ x∈ x∈ x∈ x∈ / x∈ x∈ / x∈ / x∈ x∈ / x∈ x∈ / x∈ / x∈ / x∈ / führen den Beweis mit Hilfe einer Tabelle C A ∪ B (A ∪ B) × C A × C B × C (A × C) ∪ (B × C) y∈ x∈ (x, y) ∈ (x, y) ∈ (x, y) ∈ (x, y) ∈ y∈ / x∈ (x, y) ∈ / (x, y) ∈ / (x, y) ∈ / (x, y) ∈ / y∈ x∈ (x, y) ∈ (x, y) ∈ (x, y) ∈ / (x, y) ∈ y∈ / x∈ (x, y) ∈ / (x, y) ∈ / (x, y) ∈ / (x, y) ∈ / y∈ x∈ (x, y) ∈ (x, y) ∈ / (x, y) ∈ (x, y) ∈ y∈ / x∈ (x, y) ∈ / (x, y) ∈ / (x, y) ∈ / (x, y) ∈ / y∈ x∈ / (x, y) ∈ / (x, y) ∈ / (x, y) ∈ / (x, y) ∈ / y∈ / x∈ / (x, y) ∈ / (x, y) ∈ / (x, y) ∈ / (x, y) ∈ / In allen Fällen gilt (x, y) ∈ (A ∪ B) × C genau dann, wenn (x, y) ∈ (A × C) ∪ (B × C) gilt. Damit ist (A ∪ B) × C = (A × C) ∪ (B × C) gezeigt. Im folgenden Beweis verwenden wir den Doppelpfeil ⇐⇒. Er bedeutet, dass die davor und danach stehende Aussage äquivalent sind. Die eine Aussage gilt genau dann, wenn die andere gilt. Satz 5. Seien A, B, C und D Mengen. Dann gilt (A∩B)×(C ∩D) = (A×C)∩(B ×D). Beweis. Für alle x und alle y gilt (x, y) ∈ (A ∩ B) × (C ∩ D) ⇐⇒ x ∈ A ∩ B und y ∈ C ∩ D ⇐⇒ x ∈ A und x ∈ B und y ∈ C und y ∈ D ⇐⇒ x ∈ A und y ∈ C und x ∈ B und y ∈ D ⇐⇒ (x, y) ∈ A × C und (x, y) ∈ B × D ⇐⇒ (x, y) ∈ (A × C) ∩ (B × D) Es gilt (x, y) ∈ (A ∩ B) × (C ∩ D) genau dann, wenn (x, y) ∈ (A × C) ∩ (B × D) gilt. Damit ist (A ∩ B) × (C ∩ D) = (A × C) ∩ (B × D) gezeigt. 2. Die natürlichen Zahlen Die natürlichen Zahlen erhält man durch Abzählen der Elemente von Mengen. Die leere Menge hat 0 Elemente, die Menge {a} hat ein Element, die Menge {a, b} hat zwei Elemente, und so weiter. Durch Hinzufügen eines weiteren Elements erhält man die nächste Zahl. Man kann diese Zahlen auf einer Zahlengeraden anordnen. 0 1 2 3 4 5 6 7 8 Wir fassen die natürlichen Zahlen zur Menge N0 = {0, 1, 2, 3, . . . } zusammen. Die natürlichen Zahlen ohne Null bezeichnen wir mit N. Ist A eine endliche Menge, dann bezeichnet |A| die Anzahl der Elemente der Menge A. 4 1. MENGEN UND FUNKTIONEN Die Addition ergibt sich aus der Vereinigung disjunkter Mengen. Seien m und n in N0 . Wir wählen disjunkte Mengen A und B mit |A| = m und |B| = n. Dann ist m+n die Anzahl der Elemente von A ∪ B, das heißt m + n = |A ∪ B|. Da (A ∪ B) ∪ C = A ∪ (B ∪ C) für alle Mengen A, B und C gilt, ergibt sich (k + m) + n = k + (m + n) für alle Zahlen k, m und n in N0 Für die Addition gilt das Assoziativgesetz. Ebenso gilt A ∪ B = B ∪ A für alle Mengen A und B. Es folgt für alle Zahlen m und n in N0 m+n=n+m Für die Addition gilt das Kommutativgesetz. Die Multiplikation ergibt sich aus dem Mengenprodukt. Seien m und n in N0 . Wir wählen Mengen A und B mit |A| = m und |B| = n. Dann ist m · n die Anzahl der Elemente von A × B, das heißt m · n = |A × B|. Für Mengen A, B und C gilt (A × B) × C = {((a, b), c) : a ∈ A, b ∈ B, c ∈ C} und A×(B ×C) = {(a, (b, c)) : a ∈ A, b ∈ B, c ∈ C}. Wir sehen, dass (A×B)×C und A×(B ×C) die gleiche Anzahl von Elementen enthalten, also |(A × B) × C| = |A × (B × C)|. Es folgt (k · m) · n = k · (m · n) für alle Zahlen k, m und n in N0 Für die Multiplikation gilt das Assoziativgesetz. Wegen A × B = {(a, b) : a ∈ A, b ∈ B} und B × A = {(b, a) : a ∈ A, b ∈ B} gilt auch |A × B| = |B × A|. Es folgt m·n=n·m für alle Zahlen m und n in N0 Für die Multiplikation gilt das Kommutativgesetz. Für Mengen A, B und C gilt schließlich auch (A ∪ B) × C = (A × C) ∪ (B × C). Es folgt (k + m) · n = k · n + m · n für alle Zahlen k, m und n in N0 Es gilt das Distributivgesetz. 3. Variablen, Summen, Indices Variablen sind in der Mathematik allgegenwärtig. Wir sehen uns einige der wichtigsten Verwendungsarten an. Variablen werden oft verwendet, um allgemeine Aussagen zu machen. Um auszudrücken, dass zum Beispiel das Distributivgestz für alle natürlichen Zahlen gilt, schreibt man (k + m) · n = k · n + m · n für alle Zahlen k, m und n in N0 Die Variablen k, m und n stehen hier stellvertretend für Zahlen aus N0 . Man kann sie durch beliebige natürliche Zahlen ersetzen, zum Beispiel (3 + 7) · 2 = 3 · 2 + 7 · 2 oder (21 + 17) · 33 = 21 · 33 + 17 · 33 und so fort. Das gilt nicht nur für Zahlen, sondern zum Beispiel auch für Mengen. Für alle Mengen A und B gilt A ∪ B = B ∪ A. Welche Mengen man für A und B auch einsetzt, diese Gleichung ist richtig. Es sei noch ein Beispiel aus der Geometrie erwähnt. Für alle Rechtecke gilt F = ab, wobei F die Fläche und a und b die Längen der Seiten des Rechtecks bezeichnen. Im nächsten Kapitel werden wir Funktionen kennenlernen. Um Funktionen aufzuschreiben, verwendet man oft Variable. Zum Beispiel schreibt man n 7→ n2 + 1 und meint damit, dass der Zahl n die Zahl n2 + 1 zugeornet wird. Natürlich muss man auch angeben, für welche Zahlenmenge die Funktion definiert wird. Will man auch der Funktion eine Bezeichnung geben, zum Beispiel den Buchstaben f , dann schreibt manf : n 7→ n2 + 1 oder f (n) = n2 + 1. 3. VARIABLEN, SUMMEN, INDICES 5 Eine etwas andere Verwendung von Variablen tritt beim Lösen von Gleichungen (oder Ungleichungen) auf. Es liegt eine Gleichung vor, die eine oder mehrere Variable enthält. Gesucht sind Zahlen, für die die Gleichung gilt. Nehmen wir zum Beispiel an, dass die Gleichung x2 + x − 2 = 0 vorliegt. Für welche Zahlen x gilt diese Gleichung? Man sollte auch den Zahlenbereich angeben, in dem die Gleichung zu lösen ist, zum Beispiel die natürlichen Zahlen N oder die ganzen Zahlen Z, die später eingeführt werden. Die Lösungsmenge kann man schreiben als L = {x ∈ N : x2 + x − 2 = 0}, das ist die Menge aller Zahlen in N, für die die Gleichung gilt. Es folgt L = {1}. Oder es ist L = {x ∈ Z : x2 + x − 2 = 0} gesucht, die Menge aller Zahlen in Z, für die die Gleichung gilt. Dann ergibt sich L = {−2, 1}. Laufvariable. Kleine Mengen kann man auflisten. Zum Beispiel ist {1, 4, 9, 16, 25} die Menge der ersten fünf Quadratzahlen. Bei größeren Mengen ist das nicht mehr möglich. Will man die Menge der ersten fünfzig Quadratzahlen aufschreiben, dann kann man sich mit Punkten helfen {1, 4, 9, 16, 25, . . . , 2500} Hoffentlich ist zu erkennen, welche Menge gemeint ist. Oder man schreibt die Menge mit Hilfe einer sogenannten Laufvariable auf {n2 : n ∈ N, 1 ≤ n ≤ 50} Das ist die Menge aller Zahlen n2 , wobei n die natürlichen Zahlen von 1 bis 50 durchläuft. (Eine etwas schlampige Schreibweise ist {n2 : 1 ≤ n ≤ 50}.) Man kann natürlich auch die Menge aller Qudratzahlen aufschreiben. Diese ist {n2 : n ∈ N}. Hier durchläuft die Variable n alle natürlichen Zahlen, also eine unendliche Menge. Ganz analog verwendet man Laufvariable, um Summen aufzuschreiben. Die Summe der ersten fünfzig Quadratzahlen kann man ebenfalls mit Hilfe von Punkten schreiben 1 + 4 + 9 + 16 + · · · + 2500 oder mit Hilfe des Summenzeichens und einer Laufvariable (Summationsvariable) 50 ∑ n2 n=1 ∑∞ n Man lässt auch Summen bis Unendlich laufen, zum Beispiel n=1 q , aber das ist keine eigentliche Summe mehr, sondern ein Grenzwert. Dieser wird in der Analysis behandelt. Indices. Um allgemeine Aussagen zu machen, werden Variable verwendet, zum Beispiel (a + b) · u = a · u + b · u für alle a, b, u ∈ N0 Das ist wieder das Distributivgesetz. Es spielt keine Rolle, welche Buchstaben wir verwenden. Oben waren es andere. Durch zweimaliges Anwenden dieser Gleichung erhalten wir daraus ein Distributivgesetz für drei Summanden (a + b + c) · u = (a + b) · u + c · u = a · u + b · u + c · u für alle a, b, c, u ∈ N0 Das können wir fortsetzen. Aus der Gleichung für drei Summanden erhalten wir die für vier (a + b + c + d) · u = (a + b + c) · u + d · u = a · u + b · u + c · u + d · u für a, b, c, d, u ∈ N0 So können wir immer weitermachen und das Distributivgesetz für beliebig viele Summanden beweisen. Das war jetzt ein einfacher Beweis durch vollständige Induktion, die später behandelt wird. Aber wie sollen wir dieses Distributivgesetz aufschreiben, zum Beispiel für 37 Summanden? So viele Buchstaben gibt es nicht. Man verwendet immer den selben Buchstaben, aber 6 1. MENGEN UND FUNKTIONEN mit tiefgestellten Nummern, zum Beispiel a1 , a2 , a3 und so weiter. Diese tiefgestellten Nummern heißen Indices (Einzahl: Index). Das Distributivgesetz für 37 Summanden lautet dann (a1 + a2 + · · · + a37 ) · u = a1 · u + a2 · u + · · · + a37 · u für a1 , a2 , . . . , a37 , u ∈ N0 Wir schreiben das dann gleich allgemein hin. Ist n ≥ 2, dann gilt (a1 + a2 + · · · + an ) · u = a1 · u + a2 · u + · · · + an · u für a1 , a2 , . . . , an , u ∈ N0 ∑n Wir haben wieder ∑nPunkte verwendet. Man könnte auch k=1 ak anstelle von a1 +a2 +· · ·+an schreiben und k=1 ak · u anstelle von a1 · u + a2 · u + · · · + an · u. Die Summationsvariable (in diesem Fall auch Summationsindex genannt) ist jetzt k, da n bereits anders verwendet wurde. (Den Multiplikationspunkt lässt man oft weg.) Wir kommen noch einmal zum Mengenprodukt zurück. Wir haben A × B als Menge aller Paare (a, b) mit a ∈ A und b ∈ B definiert, das heißt A × B = {(a, b) : a ∈ A, b ∈ B}. Ebenso wurde A × B × C = {(a, b, c) : a ∈ A, b ∈ B, c ∈ C} definiert. Es sei noch einmal auf den Unterschied zu Mengen hingewiesen. Paare und Tripel sind geordnet, das heißt (a, b) ̸= (b, a), (a, b, c) ̸= (c, a, b) und so fort, während Mengen nicht geordnet sind. Es gilt {a, b} = {b, a}, {a, b, c} = {b, c, a} und so weiter. Außerdem können Paare und Tripel gleiche Elemente enthalten, Mengen aber nicht. Man kann (a, a) schreiben, nicht aber {a, a}. Jetzt verwenden wir wieder die Indexschreibweise. Das Mengenprodukt A1 ×A2 ×· · ·×An ist die Menge aller n-Tupel (a1 , a2 , . . . , an ) mit a1 ∈ A1 , a2 ∈ A2 , . . . , an ∈ An , das heißt A1 × A2 × · · · × An = {(a1 , a2 , . . . , an ) : a1 ∈ A1 , a2 ∈ A2 , . . . , an ∈ An }. Die Bezeichnung Tupel ist eine Verallgemeinerung von Paar und Tripel. Seien mk = |Ak | für 1 ≤ k ≤ n die Anzahlen der Elemente der Mengen A1 , A2 , . . . , An . Wir berechnen |A1 × A2 × · · · × An |, die Anzahl der Elemente des Mengenprodukts. Wir wissen bereits, dass |A1 × A2 | = m1 m2 gilt. So wurde ja das Produkt zweier natürlicher Zahlen definiert. Das können wir jetzt auf drei Mengen ausdehnen. Es gilt |A1 × A2 × A3 | = |(A1 × A2 ) × A3 | = |A1 × A2 | · |A3 | = (m1 m2 )m3 = m1 m2 m3 Wir können fortsetzen. Für vier Mengen ergibt sich |A1 × A2 × A3 × A4 | = |(A1 × A2 × A3 ) × A4 | = (m1 m2 m3 )m4 = m1 m2 m3 m4 Und so geht das immer weiter. Schließlich erhalten wir für alle n ≥ 2 |A1 × A2 × · · · × An | = m1 m2 · · · mn Das ist dieselbe Vorgangsweise wie oben beim Distributivgesetz, die wir in einem späteren Kapitel als Vollständige Induktion kennenlernen werden. Wir haben zum Aufschreiben eines n-Tupels wieder die Schreibweise mit Punkten benutzt. Auch hier gibt es die Möglichkeit, eine Laufvariable zu verwenden. Anstelle von (a1 , a2 , . . . , an ) schreibt man (ak )1≤k≤n . In der Mathematik treten oft auch Folgen auf. Das sind Tupel, die unendlich viele Zahlen enthalten. Auch hier gibt es beide Schreibweisen. Die Schreibweise mit Punkten ist (a1 , a2 , a3 , . . .). Die Schreibweise mit einer Laufvariable ist (ak )k≥1 oder (ak )k∈N . Durchschnitt und Vereinigung. Dieselbe Schreibweise wie für Summen ist auch bei Durchschnitt und Vereinigung von Mengen üblich. Anstelle von A1 ∩ A2 ∩ · · · ∩ An schreibt ∩n man k=1 Ak . Bezeichnet man ∩ die Menge {1, 2, . . . , n} aller Indices mit I, dann schreibt man diese Vereinigung auch als k∈I Ak . Anders als bei Summen darf hier I auch eine unendliche Menge sein. Den Durchschnitt über beliebige Indexmengen I definieren wir folgendermaßen ∩ x∈ Ak ⇐⇒ x ∈ Ak für alle k ∈ I k∈I 4. FUNKTIONEN 7 Entsprechendes gilt auch für die Vereinigung von Mengen ∪ x∈ Ak ⇐⇒ x ∈ Ak für ein k ∈ I k∈I Wir können dann die Distributivgesetze und die de Morgansche Regel für beliebige Durchschnitte und Vereinigungen beweisen. Satz 6. (Verallgemeinerte Distributivgesetze) Sei B eine ∩ Menge. Weiters ∩ sei I eine Indexmenge und A seien Mengen für alle k ∈ I. Dann gilt ( A ) ∪ B = k ∪ k∈I k k∈I (Ak ∪ B) ∪ und ( k∈I Ak ) ∩ B = k∈I (Ak ∩ B). Beweis. Für alle x gilt ∩ ∩ x ∈ ( k∈I Ak ) ∪ B ⇐⇒ x ∈ ( k∈I Ak ) oder x ∈ B ⇐⇒ x ∈ Ak für alle k ∈ I oder x ∈ B ⇐⇒ x ∈ Ak ∪ B für alle k ∈ I ∩ ⇐⇒ x ∈ k∈I (Ak ∪ B) Damit ist die erste Gleichung gezeigt. Die zweite beweist man analog. Satz 7. (Verallgemeinerte de Morgansche und ∩ seien Ak ∩ Regel) Sei∪I eine Indexmenge ∪ Teilmengen von Ω für alle k ∈ I. Dann gilt ( k∈I Ak )′ = k∈I A′k und ( k∈I Ak )′ = k∈I A′k . Beweis. Für alle x ∈ Ω gilt ∩ ∩ x ∈ ( k∈I Ak )′ ⇐⇒ x ∈ / k∈I Ak ⇐⇒ es gibt ein k ∈ I mit x ∈ / Ak ⇐⇒ es gibt ein k ∈ I mit x ∈ A′k ∪ ⇐⇒ x ∈ k∈I A′k Damit ist die erste Gleichung gezeigt. Die zweite beweist man analog. 4. Funktionen Eine Funktion (Abbildung) f ist eine Vorschrift, die jedem Element einer Menge A genau ein Element einer Menge B zuordnet. Man schreibt f : A → B und nennt A die Definitionsmenge und B die Zielmenge der Funktion f . Wird das Element y der Menge B durch die Funktion f dem Element x der Menge A zugeordnet, dann nennt man y das Bild von x unter f und schreibt y = f (x) oder x 7→ y. Es gibt verschiedene Möglichkeiten, eine Funktion anzugeben, zum Beispiel durch eine Wertetabelle oder durch eine Formel. Beispiel. Eine Funktion f : N → N könnte durch f (n) = n2 + 1 definiert werden. Definition. Sei f : A → B eine Funktion. Ist C eine Teilmenge von A, dann nennt man die Menge {f (x) : x ∈ C} das Bild von C unter f und bezeichnet es mit f (C). Ist D eine Teilmenge von B, dann nennt man die Menge {x ∈ A : f (x) ∈ D} das Urbild von D unter f und bezeichnet es mit f −1 (D). Beispiel. Sei f : {1, 2, 3, 4, 5, 6} → {a, b, c, d} definiert durch 1 7→ a, 2 7→ c, 3 7→ a, 4 7→ a, 5 7→ d und 6 7→ c. Dann gilt f ({1, 2, 3}) = {a, c} und f −1 ({a}) = {1, 3, 4}. Satz 8. Sei f : A → B eine Funktion. Seien R und S Teilmengen von A mit R ⊆ S. Dann gilt f (R) ⊆ f (S). 8 1. MENGEN UND FUNKTIONEN Beweis. Sei y ∈ f (R). Nach Definition des Bildes existiert ein x ∈ R mit f (x) = y. Wegen R ⊆ S gilt auch x ∈ S. Nach Definition des Bildes folgt y = f (x) ∈ f (S). Wir haben gezeigt, dass jedes Element von f (R) auch Element von f (S) ist. Also gilt f (R) ⊆ f (S). Satz 9. Sei f : A → B eine Funktion. Seien U und V Teilmengen von A. Dann gilt f (U ∪ V ) = f (U ) ∪ f (V ) und f (U ∩ V ) ⊆ f (U ) ∩ f (V ). Beweis. Wegen U ⊆ U ∪ V und V ⊆ U ∪ V erhalten wir f (U ) ⊆ f (U ∪ V ) und f (V ) ⊆ f (U ∪ V ) aus Satz 8. Daraus folgt f (U ) ∪ f (V ) ⊆ f (U ∪ V ). Wegen U ∩ V ⊆ U und U ∩ V ⊆ V erhalten wir f (U ∩ V ) ⊆ f (U ) und f (U ∩ V ) ⊆ f (V ) aus Satz 8. Daraus folgt f (U ∩ V ) ⊆ f (U ) ∩ f (V ). Es bleibt noch f (U ∪ V ) ⊆ f (U ) ∪ f (V ) zu zeigen. Sei y ∈ f (U ∪ V ). Nach Definition des Bildes existiert ein x ∈ U ∪ V mit f (x) = y. Es gilt x ∈ U oder x ∈ V (oder beides). Es folgt y ∈ f (U ) oder y ∈ f (V ) und somit y ∈ f (U ) ∪ f (V ). Wir haben gezeigt, dass jedes Element von f (U ∪ V ) auch Element von f (U ) ∪ f (V ) ist. Also gilt f (U ∪ V ) ⊆ f (U ) ∪ f (V ). Beispiel. Sei f : {1, 2, 3, 4, 5, 6} → {a, b, c, d} definiert durch folgende Wertetabelle x 1 2 3 4 5 6 f (x) a c a a d c Sei U = {1, 2, 3, 4} und V = {4, 5, 6}. Dann gilt U ∩ V = {4} und f (U ∩ V ) = {a}. Weiters gilt f (U ) = {a, c}, f (V ) = {a, d, c} und f (U ) ∩ f (V ) = {a, c}. Dieses Beispiel zeigt, dass f (U ∩ V ) = f (U ) ∩ f (V ) nicht gelten muss. Satz 10. Sei f : A → B eine Funktion und U und V Teilmengen von B. Dann gilt f −1 (U ∪ V ) = f −1 (U ) ∪ f −1 (V ) und f −1 (U ∩ V ) = f −1 (U ) ∩ f −1 (V ). Beweis. Diese beiden Aussagen zeigt man am besten durch Äquivalenzumformungen: x ∈ f −1 (U ∪ V ) ⇐⇒ f (x) ∈ U ∪ V ⇐⇒ f (x) ∈ U oder f (x) ∈ V ⇐⇒ x ∈ f −1 (U ) oder x ∈ f −1 (V ) ⇐⇒ x ∈ f −1 (U ) ∪ f −1 (V ) Damit ist f −1 (U ∪ V ) = f −1 (U ) ∪ f −1 (V ) gezeigt. Durch eine ganz analoge Vorgangsweise zeigt man auch f −1 (U ∩ V ) = f −1 (U ) ∩ f −1 (V ). Satz 11. Sei f : A → B eine Funktion. Sei C eine Teilmenge von A und D eine Teilmenge von B. Dann gilt f (f −1 (D)) ⊆ D und C ⊆ f −1 (f (C)). Beweis. Sei y ∈ f (f −1 (D)). Nach Definition des Bildes existiert ein x ∈ f −1 (D) mit f (x) = y. Wegen x ∈ f −1 (D) gilt f (x) ∈ D nach Definition des Urbildes und somit y ∈ D. Jedes Element von f (f −1 (D)) ist auch Element von D. Damit ist f (f −1 (D)) ⊆ D bewiesen. Sei x ∈ C. Nach Definition des Bildes gilt f (x) ∈ f (C). Nach Definition des Urbildes folgt jetzt x ∈ f −1 (f (C)). Jedes Element von C ist auch Element von f −1 (f (C)). Also gilt C ⊆ f −1 (f (C)). Beispiel. Sei f : {1, 2, 3, 4, 5, 6} → {a, b, c, d} definiert durch folgende Wertetabelle x 1 2 3 4 5 6 f (x) a c a a d c Sei D = {b, d}. Dann gilt f −1 (D) = {5} und f (f −1 (D)) = {d}. Das zeigt, dass f (f −1 (D)) = D nicht gelten muss. Sei C = {1}. Dann gilt f (C) = {a} und f −1 (f (C)) = {1, 3, 4}. Das zeigt, dass C = f −1 (f (C)) nicht gelten muss. 4. FUNKTIONEN 9 Definition. Sei f : A → B eine Funktion. Sie heißt injektiv, wenn für alle x und y in A, für die f (x) = f (y) gilt, auch x = y erfüllt ist. Sie heißt surjektiv, wenn für alle y ∈ B ein x ∈ A existiert mit f (x) = y. Sie heißt bijektiv, wenn sie sowohl injektiv als auch surjektiv ist. Beispiel. Sei f : {1, 2, 3, 4, 5, 6} → {a, b, c, d} definiert durch folgende Wertetabelle x 1 2 3 4 5 6 f (x) a c a a d c Die Funktion f ist nicht injektiv, da f (1) = f (3) gilt, aber natürlich 1 ̸= 3. Sie ist auch nicht surjektiv, da kein x ∈ {1, 2, 3, 4, 5, 6} existiert mit f (x) = b. Definiert man g : {1, 2, 3, 4, 5, 6} → {a, c, d} durch dieselbe Wertetabelle wie f (man lässt einfach b aus der Zielmenge weg), dann ist g surjektiv wegen g(1) = a, g(2) = c und g(5) = d. Sei f : {1, 2, 3, 4} → {a, b, c, d, e} definiert durch folgende Wertetabelle 1 2 3 4 x f (x) a c e d Die Funktion f ist injektiv, da jedes Element der Zielmenge {a, b, c, d, e} nur einmal als Bild auftritt. Sie ist aber nicht surjektiv, da b überhaupt nicht als Bild auftritt. Definiert man g : {1, 2, 3, 4} → {a, c, d, e} durch dieselbe Wertetabelle wie f (man lässt einfach b aus der Zielmenge weg), dann ist g bijektiv. Bemerkung. Seien A und B endliche Mengen und f : A → B eine Funktion. Ist f injektiv, dann gilt |A| ≤ |B|. Ist f surjektiv, dann gilt |A| ≥ |B|. Ist f bijektiv, dann gilt |A| = |B|. Beispiel. Sei f : N → N definiert durch f (n) = n2 . Diese Funktion ist injektiv, aber nicht surjektiv. Gilt f (m) = f (n), das heißt m2 = n2 , dann folgt m = n. Damit ist gezeigt, dass f injektiv ist. Es existiert kein n ∈ N mit f (n) = 3. Damit ist gezeigt, dass f nicht surjektiv ist. Sei f : N → N definiert durch f (n) = |n − 5| + 1. Diese Funktion ist surjektiv, aber nicht injektiv. Ist m ∈ N, dann ist auch n = m + 4 in N und es gilt f (n) = |m − 1| + 1 = m − 1 + 1 = m. Damit ist gezeigt, dass f surjektiv ist. Es gilt f (1) = | − 4| + 1 = 5 und f (9) = |4| + 1 = 5, das heißt f (1) = f (9). Damit ist gezeigt, dass f nicht injektiv ist. Satz 12. Sei f : A → B eine Funktion. Sei C eine Teilmenge von A und D eine Teilmenge von B. Ist f surjektiv, dann gilt f (f −1 (D)) = D. Ist f injektiv, dann gilt C = f −1 (f (C)). Beweis. Wir zeigen die erste Aussage. Sei y ∈ D. Da f surjektiv ist, existiert ein x ∈ A mit f (x) = y. Nach Definition des Urbildes folgt x ∈ f −1 (D). Nach Definition des Bildes folgt jetzt y ∈ f (f −1 (D). Damit ist D ⊆ f (f −1 (D) gezeigt. Wegen Satz 11 gilt Gleichheit. Wir zeigen die zweite Aussage. Sei x ∈ f −1 (f (C)). Nach Definition des Urbildes gilt f (x) ∈ f (C). Nach Definition des Bildes existiert ein u ∈ C mit f (u) = f (x). Da f injektiv ist, muss u = x gelten. Es gilt also auch x ∈ C. Damit ist f −1 (f (C)) ⊆ C gezeigt. Wegen Satz 11 gilt Gleichheit. Satz 13. Sei f : A → B eine bijektive Funktion. Für jedes y ∈ B existiert genau ein x ∈ A mit f (x) = y. Beweis. Da f surjektiv ist, existiert ein x ∈ A mit f (x) = y. Ist u ∈ A und gilt auch f (u) = y, dann folgt u = x, da f injektiv ist. Somit gibt es genau ein x ∈ A mit f (x) = y. 10 1. MENGEN UND FUNKTIONEN Definition. Sei f : A → B eine bijektive Funktion. Die Funktion g : B → A heißt Umkehrfunktion der Funktion f , wenn sie jedem y ∈ B das eindeutig bestimmte x ∈ A mit f (x) = y zuordnet. Beispiel. Die Funktion g : {1, 2, 3, 4, 5, 6, 7} → {a, b, c, d, u, v, w} sei durch die folgende Wertetabelle definiert x 1 2 3 4 5 6 7 g(x) a w u d c b v Sie ist bijektiv. Für die Umkehrfunktion g −1 : {a, b, c, d, u, v, w} → {1, 2, 3, 4, 5, 6, 7} ist x a b c d u v w g (x) 1 6 5 4 3 7 2 −1 die Wertetabelle. Definition. Seien f : A → B und g : B → C Funktionen. Die Funktion h : A → C definiert durch h(x) = g(f (x)) nennt man dann die Verkettung der Funktionen f und g. Man schreibt h = g ◦ f . Beispiel. Die Funktionen f : {1, 2, 3, 4, 5, 6, 7} → {a, b, c, d, e} und g : {a, b, c, d, e} → {p, q, r, s, t, u, v} seien durch folgende Wertetabellen definiert 1 2 3 4 5 6 7 x f (x) c e d d c b d und x a b c d e g(x) q p r u p Für die Verkettung h = g ◦ f : {1, 2, 3, 4, 5, 6, 7} → {p, q, r, s, t, u, v} ist dann x 1 2 3 4 5 6 7 h(x) r p u u r p u die Wertetabelle. Die Funktion iA : A → A definiert durch iA (x) = x für alle x ∈ A heißt Identität auf der Menge A. Sei g : B → A die Umkehrfunktion der bijektiven Funktion f : A → B. Gilt f (x) = y, dann gilt g(y) = x nach Definition. Es folgt g(f (x)) = x für alle x ∈ A und f (g(y)) = y für alle y ∈ B, das heißt g ◦ f = iA und f ◦ g = iB . 5. Beweisen (Logik) Eine mathematische Aussage wird als Satz (Theorem) formuliert, zum Beispiel Satz. Sei f : A → B eine Funktion. Seien U und V Teilmengen von A. Dann gilt f (U ∪ V ) = f (U ) ∪ f (V ) und f (U ∩ V ) ⊆ f (U ) ∩ f (V ). Zuerst werden die sogenannten Voraussetzungen formuliert und dann die eigentliche Aussage des Satzes. Weniger wichtige Sätze, die oft zur Vorbereitung eines anderen Satzes dienen, werden Hilfssatz (Lemma) genannt. Einen Satz muss man beweisen, sonst ist es kein Satz. Die Aussage des Satzes muss aus bereits bekannten Resultaten nach den Gesetzen der Logik hergeleitet werden. Beweise werden üblicherweise in der Umgangssprache formuliert. Es gibt auch eine logische Sprache, die in der Mathematik aber eher sparsam verwendet wird. Ein wenig wollen wir jedoch darauf eingehen. Die wichtigsten logischen Zeichen sind =⇒ und ⇐⇒ die wir auch schon verwendet haben. Mit A =⇒ B ist gemeint, dass die Aussage B aus der Aussage A folgt. Man sagt auch A impliziert B. Der Doppelpfeil ist die Zusammensetzung zweier einfacher Pfeile. Mit 5. BEWEISEN (LOGIK) 11 A ⇐⇒ B ist gemeint, dass sowohl A =⇒ B als auch B =⇒ A gilt. Die Aussagen A und B sind äquivalent. Um die Gleichheit von zwei Mengen, nennen wir sie K und M , zu zeigen, zeigt man x ∈ K ⇐⇒ x ∈ M . Das kann durch aufeinanderfolgende Äquivalenzumformungen geschehen, wie zum Beispiel bei Satz 5 oder Satz 10. Auch die Tabellenbeweise sind von dieser Art. Man geht alle möglichen Fälle durch und zeigt, dass immer x ∈ K ⇐⇒ x ∈ M gilt. In weniger einfachen Fällen beschreibt man den Beweis mit Hilfe der Umgangssprache. Das ist bei den meisten Beweisen in Kapitel 4 geschehen. Will man nur zeigen, dass K Teilmenge von M ist, dann zeigt man x ∈ K =⇒ x ∈ M . Und die Gleichheit zweier Mengen K und M kann man auch dadurch zeigen, dass man die beiden Implikationen x ∈ K =⇒ x ∈ M und x ∈ M =⇒ x ∈ K beweist. Ein Beweis dieser Art, bei dem aus einer Aussage A, zum Beispiel x ∈ K, eine andere Aussage B, zum Beispiel x ∈ M , gefolgert wird, heißt direkter Beweis. Man könnte auch anders vorgehen. Anstatt A =⇒ B zu beweisen, kann man ¬ B =⇒ ¬ A beweisen (das logische Zeichen ¬ bedeutet “nicht”). Folgt nämlich aus ¬ B ein Widerspruch zur Aussage A, die vorausgesetzt wird, dann ist ¬ B falsch. Damit ist die Gültigkeit von B gezeigt. Mit indirekten Beweisen werden wir uns in einem späteren Kapitel genauer befassen. Zwei weitere logische Zeichen sind ∧ für “und” und ∨ für “oder”. Den Beweis von Satz 5 könnte man so aufschreiben (x, y) ∈ (A ∩ B) × (C ∩ D) ⇐⇒ x ∈ A ∩ B ∧ y ∈ C ∩ D ⇐⇒ x ∈ A ∧ x ∈ B ∧ y ∈ C ∧ y ∈ D ⇐⇒ x ∈ A ∧ y ∈ C ∧ x ∈ B ∧ y ∈ D ⇐⇒ (x, y) ∈ A × C ∧ (x, y) ∈ B × D ⇐⇒ (x, y) ∈ (A × C) ∩ (B × D) Es macht jedoch keinen großen Unterschied, ob man das Wort oder das logische Zeichen schreibt. Es sollte noch erwähnt werden, dass ∨ ein nichtausschließendes “oder” bedeutet. Mit A ∨ B meint man “A oder B oder beides”. Schließlich kommen wir zu den Quantoren ∃ und ∀. Die Bedeutung von ∃ ist “für ein” oder “es existiert ein”. Die Bedeutung von ∀ ist “für alle”. Als Beispiel für die Verwendung von ∀ sehen wir uns den Beweis des Satzes 6 an. Man liest ∀ k ∈ I : als “für alle k ∈ I gilt”. ∩ ∩ x ∈ ( k∈I Ak ) ∪ B ⇐⇒ x ∈ ( k∈I Ak ) ∨ x ∈ B ⇐⇒ ∀ k ∈ I : x ∈ Ak ∨ x ∈ B ⇐⇒ ∀ k ∈ I : x ∈ Ak ∪ B ∩ ⇐⇒ x ∈ k∈I (Ak ∪ B) Als Beispiel für die Verwendung von ∃ sehen wir uns den Beweis des Satzes 7 an. Man liest ∃ k ∈ I : als “für ein k ∈ I gilt” oder als “es existiert ein k ∈ I mit”. ∩ ∩ x ∈ ( k∈I Ak )′ ⇐⇒ x ∈ / k∈I Ak ⇐⇒ ∃ k ∈ I : x ∈ / Ak ⇐⇒ ∃ k ∈ I : x ∈ A′k ∪ ⇐⇒ x ∈ k∈I A′k Logische Zeichen werden natürlich nicht nur in Beweisen verwendet, sondern zum Beispiel auch in Definitionen. Wir hatten ∩ ∪ x ∈ k∈I Ak ⇐⇒ ∀k ∈ I : x ∈ Ak und x ∈ k∈I Ak ⇐⇒ ∃k ∈ I : x ∈ Ak 12 1. MENGEN UND FUNKTIONEN Da logische Zeichen in der Mathematik eher selten verwendet werden, ist es nicht notwendig, mehr darüber zu wissen. 6. Vollständige Induktion Es liegt eine Aussage A(n) vor, die von einer Zahl n abhängt. Sie soll für alle n ∈ N (oder für n in einer Teilmenge von N) bewiesen werden. Zum Beispiel kann A(n) die Gleichung sein oder die Ungleichung n2 < 2n . 1 + 2 + 3 + · · · + n = n(n+1) 2 Bei einem Induktionsbeweis geht man so vor: Zuerst wird die Aussage A(1) bewiesen. Das ist der sogenannte Induktionsbeginn. Dann wird für alle n ≥ 1 gezeigt, dass aus der Gültigkeit der Aussage A(n) die Gültigkeit der Aussage A(n+1) folgt. Das ist der sogenannte Induktionsschritt: A(n) =⇒ A(n + 1). Damit hat man die Aussage A(n) für alle n ≥ 1 bewiesen: Die Aussage A(1) wurde im Induktionsbeginn gezeigt. Wegen des Induktionsschrittes gilt dann auch A(2). Da jetzt A(2) gezeigt ist, erhält man A(3) wieder wegen des Induktionsschrittes. Aus A(3) folgt dann A(4) und immer so weiter. Die Aussage A(n) gilt für alle n ∈ N. Wir beweisen die oben angeführten Beispiele mit Hilfe der vollständigen Induktion. Beispiel. Die zu beweisende Aussage A(n) ist die Gleichung 1 + 2 + 3 + · · · + n = n(n+1) . 2 Induktionsbeginn: Für n = 1 wird die Gleichung zu 1 = 22 . Das ist offensichtlich richtig. Somit ist A(1) gezeigt. . Wir Induktionsschritt: Wir nehmen an, dass A(n) gilt, das ist 1 + 2 + 3 + · · · + n = n(n+1) 2 n(n+1) (n+2)(n+1) addieren n + 1 auf beiden Seiten dieser Gleichung. Wegen 2 + n + 1 = erhalten 2 (n+1)(n+2) wir 1 + 2 + 3 + · · · + n + (n + 1) = . Das ist A(n + 1). Wir haben A(n) =⇒ A(n + 1) 2 gezeigt. Damit ist auch der Induktionsschritt erledigt. für alle n ∈ N durch vollständige Induktion bewiesen. Somit ist 1 + 2 + 3 + · · · + n = n(n+1) 2 Es kann auch vorkommen, dass die Aussage A(n) für alle n ≥ n0 zu beweisen ist, wobei n0 nicht 1 ist. Der Induktionsbeginn ist dann der Beweis der Aussage A(n0 ) und im Induktionsschritt ist A(n) =⇒ A(n + 1) für alle n ≥ n0 zu beweisen. Im folgenden Beispiel ist n0 = 5. Beispiel. Es ist n2 < 2n für alle n ∈ {5, 6, 7, . . . } zu beweisen. Die Aussage A(n) ist die Ungleichung n2 < 2n . Induktionsbeginn: Für n = 5 wird die Ungleichung zu 25 < 32. Das ist offensichtlich richtig. Somit ist A(5) gezeigt. Induktionsschritt: Wir nehmen an, dass n ≥ 5 ist und dass A(n) gilt, das ist die Ungleichung n2 < 2n . Wir multiplizieren diese Ungleichung mit 2 und erhalten 2n2 < 2n+1 . Wegen n ≥ 5 gilt (n − 1)2 ≥ 16 > 2. Es folgt 2n2 > n2 + 2n + 1, das heißt (n + 1)2 < 2n2 . Damit ergibt sich (n + 1)2 < 2n+1 . Das ist A(n + 1). Wir haben A(n) =⇒ A(n + 1) gezeigt. Der Induktionsschritt ist gelungen. Damit ist n2 < 2n für alle n ∈ {5, 6, 7, . . . } durch vollständige Induktion bewiesen. Die Aussage A(n) muss keine Gleichung oder Ungleichung sein. Wir behandeln ein Beispiel aus der Kombinatorik. Zuerst führen wir eine Bezeichnung ein. Sei n ∈ N. Das Produkt 1 · 2 · 3 · 4 · . . . · n wird mit n! bezeichnet und n-Faktorielle genannt. Beispiel. Wir beweisen folgende Aussage A(n) mit vollständiger Induktion: Die Zahlen 1, 2, 3, 4, . . . , n lassen sich auf n! verschiedene Arten anordnen. Induktionsbeginn: Wegen 1! = 1 lautet die Aussage A(1): Die Zahl 1 lässt sich auf eine Art anordnen. Das ist offensichtlich richtig. Somit ist A(1) gezeigt. 7. BINOMIALKOEFFIZIENT UND BINOMISCHER LEHRSATZ 13 Induktionsschritt: Wir nehmen an, dass A(n) gilt, das heißt die Zahlen 1, 2, 3, 4, . . . , n lassen sich auf n! verschiedene Arten anordnen. Greifen wir eine dieser Anordnungen heraus, dann haben wir n + 1 Möglichkeiten, die Zahl n + 1 hinzuzufügen, nämlich vor der ersten Zahl, zwischen der ersten und zweiten Zahl, zwischen der zweiten und dritten Zahl, und so weiter bis nach der letzten Zahl. So wird jede Anordnung der Zahlen 1, 2, 3, 4, . . . , n zu n + 1 verschiedenen Anordnungen der Zahlen 1, 2, 3, 4, . . . , n, n + 1 erweitert, die die Zahlen 1, 2, 3, 4, . . . , n in unveränderter Reihenfolge enthalten. Da es n! verschiedene Anordnungen der Zahlen 1, 2, 3, 4, . . . , n gibt, erhalten wir n! · (n + 1) = (n + 1)! Anordnungen der Zahlen 1, 2, 3, 4, . . . , n, n + 1. Damit ist auch der Induktionsschritt erledigt. 7. Binomialkoeffizient und binomischer Lehrsatz Wir definieren den Binomialkoeffizient. Definition. Sei 0! = 1 und . · n für n ≥ 1. Für n ∈ N0 und 0 ≤ k ≤ n ( ) n! = 1 · 2 ·n!3 · 4 · . .n(n−1)...(n−k+1) wird der Binomialkoeffizient nk durch k!(n−k)! = definiert. k! ( ) ( n ) . Ganz wesentlich sind folgende Gleichungen Es gilt dann nk = n−k ( ) ( ) ( n ) (n) (n+1) Satz 14. Für n ∈ N gilt n0 = 1 und nn = 1. Für 1 ≤ k ≤ n gilt auch k−1 + k = k . ( ) ( ) Beweis. Wir erhalten n0 = 1 und nn = 1 direkt aus der Definition. Wir rechnen nach ( n ) (n) ( ) (n−k+1)n! (n+1)·n! n! k·n! n! + k = (k−1)!(n−k+1)! + k!(n−k)! = k!(n−k+1)! + k!(n−k+1)! = k!(n−k+1)! = n+1 k−1 k Damit ist auch die dritte Gleichung gezeigt. Man kann die Gleichungen aus dem letzten darstellen. Wir ordnen die Binomialkoeffizienten (1) (2) 0 (2) (3) 0 (3) 1 (4) 0 (4) 1 (4) (5) 0 (5) 1 (5) 2 0 1 2 Satz im sogenannten Pascalschen Dreieck folgendermaßen in Dreiecksform an ( 1) 1 (2) (3) 2 (3) 2 (4) 3 (4) (5) 3 (5) 4 (5) 3 4 5 Das kann man so fortsetzen. Man kann diese Dreieckstabelle zum Berechnen der Binomialkoeffizienten verwenden. Wegen Satz 14 steht 1 am Anfang und am Ende jeder Zeile. Jeden anderen Binomialkoeffizienten erhält man wieder wegen Satz 14 als Summe der beiden schräg darüber stehenden Binomialkoeffizienten. So kann man Zeile für Zeile berechnen: 1 1 1 1 1 3 4 5 1 2 1 3 6 10 1 4 10 1 5 1 und immer so weiter. Wir beweisen den binomischen Lehrsatz. Wir nehmen dabei an, dass a und b reelle Zahlen sind. Außer den Rechenregeln, die in allen Zahlenbereichen gelten, wird jedoch nichts über reelle Zahlen benötigt. ( ) ( ) ( ) ( ) Satz 15. Es gilt (a + b)n = n0 an + n1 an−1 b + n2 an−2 b2 + · · · + nn bn für alle a, b ∈ R und n ∈ N. 14 1. MENGEN UND FUNKTIONEN Beweis. Wir (führen ) (den ) Beweis mit ( ) vollständiger (1) Induktion. Für n = 1 wird die Gleichung zu a + b = 10 a + 11 b. Wegen ( 10) = 1 und = 1(ist 1 ) sie richtig. ( ) (n) n−1 n n−2 2 n n n Wir nehmen an, dass (a + b) = 0 a + 1 a b + 2 a b + · · · + nn bn richtig ist. Wir multiplizieren die Gleichung mit a + b und erhalten ( ) ( ) ( ) ( ) (a+b)n+1 = n0 an (a + b) + n1 an−1 b(a + b) + n2 an−2 b2 (a + b) + · · · + nn bn (a + b) ( ) ( ) ( ) ( ) = n0 (an+1 + an b) + n1 (an b + an−1 b2 ) + n2 (an−1 b2 + an−2 b3 ) + · · · + nn (abn + bn+1 ) ( ) (( ) ( )) (( ) ( )) (( n ) (n)) n (n) n+1 = n0 an+1 + n0 + n1 an b + n1 + n2 an−1 b2 + · · · + n−1 + n ab + n b (n+1) n+1 (n+1) n (n+1) n−1 2 (n+1) n (n+1) n+1 = 0 a + 1 a b + 2 a b + · · · + n ab + n+1 b wobei für die letzte Gleichung (n+1Satz ) n+114 angewendet (n+1) n (wurde. ) n−1 2 (n+1) n (n+1) n+1 n+1 Damit ist (a + b) = 0 a + 1 a b + n+1 a b + · · · + ab + n+1 b 2 n gezeigt. Der Induktionsschritt ist gelungen. Der Satz ist durch vollständige Induktion bewiesen. Der Binomialkoeffizient tritt auch bei der Berechnung der Anzahl der Teilmengen auf. Satz 16. Sei n ≥ 1( und ) 0 ≤n!k ≤ n. Die Anzahl der k-elementigen Teilmengen der Menge . Sn = {1, 2, . . . , n} ist nk = k!(n−k)! Beweis. Wir bezeichnen die (zu) berechnende Anzahl der k-elementigen Teilmengen der Menge Sn mit hn,k . Es ist hn,k = nk für n ≥ 1 und 0 ≤ k ≤ n zu zeigen. Die leere Menge ist die einzige 0-elementige und Sn selbst ( ) ( )ist die einzige n-elementige Teilmenge von Sn . Daher gilt hn,0 = 1 = n0 und hn,n = 1 = nn für alle n ∈ N. Wir beweisen eine Rekursionsformel für hn+1,k mit 1 ≤ k ≤ n. Die k-elementigen Teilmengen von Sn+1 = {1, 2, . . . , n, n + 1}, deren Anzahl hn+1,k ist, lassen sich aufteilen in die, die in Sn = {1, 2, . . . , n} enthalten sind – ihre Anzahl ist hn,k – und in die, die das Element n + 1 enthalten und deren übrige k − 1 Elemente in Sn = {1, 2, . . . , n} enthalten sind – ihre Anzahl ist hn,k−1 . Daher gilt hn+1,k = hn,k + hn,k−1 . (n) Wir zeigen mit vollständiger Induktion, dass h n,k = k für n ∈ N und 0 ≤ k ≤ n gilt. () () () Induktionsbeginn: Oben wurde h1,0 = 10 und h1,1 = 11 , also h1,k = k1 für 0 ≤ k ≤ 1 gezeigt. Das ist die Aussage für n = 1. (n) Induktionsschritt: Wir nehmen an, dass h = ist. Für n,k (n) ( n )k für 0 ≤ k ≤ n (bereits ) ( bekannt ) n n 1 ≤ k ≤ n gilt dann hn,k = k und hn,k−1 = k−1 , woraus hn+1,k = k + k−1 mit Hilfe der ( ) Rekursionsformel folgt. Wegen Satz 14 erhalten wir hn+1,k = n+1 . Für k = 0 und k = (n + 1) k wurde diese Gleichung bereits zu Beginn des Beweises gezeigt. Es gilt also hn+1,k = n+1 k für 0 ≤ k ≤ n + 1. 8. Abzählbarkeit Endliche Mengen kann man abzählen. Dadurch erhält man die natürlichen Zahlen. Zwei Mengen sind gleich groß, man sagt sie haben die gleiche Mächtigkeit, wenn sie dieselbe Anzahl von Elementen besitzen. Das ist äquivalent dazu, dass eine bijektive Abbildung von der einen Menge auf die andere existiert. Diese Eigenschaft verwenden wir als Definition. Sie kann nämlich auch auf unendliche Mengen angewendet werden. Definition. Die Mengen K und M heißen gleichmächtig, wenn eine bijektive Abbildung φ : K → M existiert. Wir beschäftigen uns vor allem mit Mengen, die gleichmächtig zu den natürlichen Zahlen sind. 8. ABZÄHLBARKEIT 15 Definition. Eine Menge M heißt abzählbar, wenn eine bijektive Abbildung φ : N → M existiert. Eine Menge M ist genau dann abzählbar, wenn man ihre Elemente in einer Folge anordnen kann: Ist φ : N → M bijektiv, dann ist (φ(k))k∈N eine Folge, die genau die Elemente der Menge M enthält. Ist umgekehrt (ak )k∈N eine Anordnung der Elemente der Menge M als Folge, dann ist die durch φ(k) = ak von N nach M definierte Abbildung bijektiv. Wir sehen uns Beispiele für abzählbare Mengen an. Satz 17. Eine unendliche Teilmenge einer abzählbaren Menge ist abzählbar. Beweis. Sei M abzählbar und L eine unendliche Teilmenge von M . Da M abzählbar ist, können wir die Elemente von M als Folge a1 , a2 , a3 , a4 , . . . anordnen. Wir streichen alle Elemente in dieser Folge, die nicht zur Teilmenge L gehören. Es bleiben unendlich viele Elemente übrig, da L unendlich ist. Damit haben wir bereits eine Anordnung der Elemente von L als Folge gefunden. Somit ist L abzählbar. Aus diesem Satz folgt, dass die Menge G der geraden Zahlen abzählbar ist. Sie hat die gleiche Mächtigkeit wie die Menge N aller natürlichen Zahlen. Satz 18. Sei M eine abzählbare Menge. Ist K endlich oder abzählbar, dann ist M ∪ K abzählbar. Beweis. Sei K̃ = K \ M . Da M abzählbar ist, können wir die Elemente von M als Folge a1 , a2 , a3 , a4 , . . . anordnen. Ist K̃ endlich, dann fügen wir die endlich vielen Elemente von K̃ vorne an diese Folge an. Dadurch erhalten wir eine Folge, die genau die Elemente von M ∪ K̃ = M ∪ K enthält. Somit ist M ∪ K abzählbar. Ist K̃ abzählbar, dann können wir die Elemente von K̃ als Folge b1 , b2 , b3 , b4 , . . . anordnen. Die Folge a1 , b1 , a2 , b2 , a3 , b3 , a4 , b4 , . . . enthält genau die Elemente von M ∪ K̃ = M ∪K. Somit ist M ∪ K abzählbar. Aus diesem Satz folgt, dass die Menge Z der ganzen Zahlen abzählbar ist. Die Mengen N0 = {0, 1, 2, 3, . . .} und Z− = {−1, −2, −3, . . .} sind klarerweise abzählbar. Sie stehen ja schon als Folge da. Wegen Z = Z− ∪ N0 ist dann auch Z abzählbar. Satz 19. Seien K und M abzählbare Mengen. Dann ist K × M ebenfalls abzählbar. Beweis. Wir können die Menge K als Folge a1 , a2 , a3 , a4 , . . . und die Menge M als Folge b1 , b2 , b3 , b4 , . . . anordnen. Die Elemente der Menge K × M lassen sich dann in einem zweidimensionalen Raster anschreiben: (a1 , b1 ) (a2 , b1 ) (a3 , b1 ) (a4 , b1 ) (a5 , b1 ) (a6 , b1 ) (a7 , b1 ) .. . (a1 , b2 ) (a2 , b2 ) (a3 , b2 ) (a4 , b2 ) (a5 , b2 ) (a6 , b2 ) (a7 , b2 ) .. . (a1 , b3 ) (a2 , b3 ) (a3 , b3 ) (a4 , b3 ) (a5 , b3 ) (a6 , b3 ) (a7 , b3 ) .. . (a1 , b4 ) (a2 , b4 ) (a3 , b4 ) (a4 , b4 ) (a5 , b4 ) (a6 , b4 ) (a7 , b4 ) .. . (a1 , b5 ) (a2 , b5 ) (a3 , b5 ) (a4 , b5 ) (a5 , b5 ) (a6 , b5 ) (a7 , b5 ) .. . (a1 , b6 ) (a2 , b6 ) (a3 , b6 ) (a4 , b6 ) (a5 , b6 ) (a6 , b6 ) (a7 , b6 ) .. . (a1 , b7 ) (a2 , b7 ) (a3 , b7 ) (a4 , b7 ) (a5 , b7 ) (a6 , b7 ) (a7 , b7 ) .. . ... ... ... ... ... ... ... ... Daraus können wir eine Folge bilden, indem wir die Elemente in den Diagonalen (von links unten nach rechts oben) der Reihe nach anschreiben. Die erste Diagonale enthält nur das Element (a1 , b1 ). Die zweite Diagonale enthält die beiden Elemente (a2 , b1 ) und (a1 , b2 ). Die 16 1. MENGEN UND FUNKTIONEN dritte Diagonale enthält die drei Elemente (a3 , b1 ), (a2 , b2 ) und (a1 , b3 ). Und so geht es weiter. Schreibt man die Diagonalen in eine Folge, so ergibt sich (a1 , b1 ), (a2 , b1 ), (a1 , b2 ), (a3 , b1 ), (a2 , b2 ), (a1 , b3 ), (a4 , b1 ), (a3 , b2 ), (a2 , b3 ), (a1 , b4 ), . . . . . . Somit ist K × M abzählbar. Aus diesem Satz folgt, dass die Mengen N×N und Z×Z abzählbar sind. Sie haben dieselbe Mächtigkeit wie N. Die Menge Q der rationalen Zahlen ist die Menge aller gekürzten Brüche, wobei der Zähler in Z und der Nenner in N liegt. Man kann Q daher als Teilmenge von Z × Z auffassen. Wegen Satz 17 ist dann auch Q abzählbar. Bemerkung. Im letzten Beweis wurden die Elemente der Menge K × M als Folge angeschrieben. Man kann auch eine Funktion angeben, die jedem dieser Elemente den Platz zuordnet, auf dem es steht. Diese Funktion ist gegeben durch (ai , aj ) 7→ 21 (i + j − 1)(i + j − 2) + j Zum Beispiel ergibt sich (a1 , a1 ) 7→ 1, (a2 , a2 ) 7→ 5 und (a1 , a4 ) 7→ 10. Das sind die Plätze, auf denen diese Elemente stehen. Es gilt auch (a7 , a4 ) 7→ 49, das heißt (a7 , a4 ) steht auf Platz 49. Satz 20. Seien M1 , M2 , . . . , Mn abzählbare Mengen. Dann ist M1 × M2 × . . . × Mn ebenfalls abzählbar. Beweis. Wir beweisen diesen Satz mit vollständiger Induktion. Es wurde bereits in Satz 19 gezeigt, dass M1 × M2 abzählbar ist. Sei K = M1 × M2 × . . . × Mn−1 . Wir nehmen an, dass die Abzählbarkeit von K bereits gezeigt ist. Aus Satz 19 erhalten wir dann, dass die Menge K × Mn abzählbar ist. Nun ist K × Mn = {((a1 , a2 , . . . , an−1 ), an ) : a1 ∈ M1 , a2 ∈ M2 , . . . , an−1 ∈ Mn−1 , an ∈ Mn } und M1 ×M2 ×. . .×Mn = {(a1 , a2 , . . . , an−1 , an ) : a1 ∈ M1 , a2 ∈ M2 , . . . , an−1 ∈ Mn−1 , an ∈ Mn }. Klarerweise existiert eine bijektive Abbildung zwischen diesen Mengen. Sie sind gleichmächtig. Daher ist auch die Menge M1 × M2 × . . . × Mn abzählbar. Bemerkung. Mit derselben Methode wie im Beweis von Satz 19 ∪ kann man zeigen: Sind die Mengen M1 , M2 , M3 , . . . abzählbar, dann ist auch die Menge ∞ k=1 Mk abzählbar. Nicht jede unendliche Menge ist abzählbar. Dazu beweisen wir folgenden Satz. Satz 21. Eine Menge M und ihre Potenzmenge P(M ) sind nicht gleichmächtig. Beweis. Sei φ : M → P(M ) eine beliebige Abbildung. Für jedes x ∈ M ist φ(x) eine Teilmenge von M , die wir Ax nennen. Sei B = {x ∈ M : x ∈ / Ax }. Sei x ∈ M beliebig. Wir zeigen Ax ̸= B. Gilt x ∈ Ax , dann erhalten wir x ∈ / B aufgrund der Definition der Menge B. Gilt aber x ∈ / Ax , dann erhalten wir x ∈ B wieder aufgrund der Definition der Menge B. In jedem Fall gilt, dass x in einer der beiden Mengen Ax oder B liegt, in der anderen nicht. Damit ist Ax ̸= B gezeigt. Die Menge B ist Teilmenge von M und daher ein Element von P(M ). Aber B ist keine der Mengen Ax . Somit gibt es kein x ∈ M mit φ(x) = B. Die Abbildung φ ist nicht surjektiv und daher auch nicht injektiv. Damit ist gezeigt, dass es keine bijektive Abbildung von M nach P(M ) gibt. Die Mengen M und P(M ) sind nicht gleichmächtig. Eine unendliche Menge, die nicht abzählbar ist, nennt man überabzählbar. Ein Beispiel für eine überabzählbare Menge ist P(N). Natürlich ist P(N) eine unendliche Menge und sie ist wegen Satz 21 nicht gleichmächtig zu N, also nicht abzählbar. Wir werden später zeigen, dass auch die Menge R der reellen Zahlen überabzählbar ist. KAPITEL 2 Die ganzen Zahlen 1. Erweiterung der natürlichen Zahlen Durch Hinzufügen der negativen Zahlen zu den natürlichen Zahlen erhalten wir den Zahlenbereich Z der ganzen Zahlen. Wir können Z auf der Zahlengerade darstellen −3 −2 −1 0 1 2 3 4 5 6 7 8 Die Addition übernehmen wir von den natürlichen Zahlen. Anstatt Mengen abzuzählen, machen wir jetzt Schritte auf der Zahlengerade. Um m + n zu bestimmen, machen wir von 0 ausgehend zuerst m Schritte (nach rechts, wenn m positiv, und nach links, wenn m negativ) und daran anschließend n Schritte (ebenfalls nach links oder rechts entsprechend dem Vorzeichen von n). So erhalten wir die Zahl m + n. Da das Ergebnis nicht von der Reihenfolge abhängt, in der die Schritte ausgeführt werden, gelten wieder das Kommutativund das Assoziativgesetz. Im Zahlenbereich der ganzen Zahlen lässt sich auch die Subtraktion, das ist die zur Addition inverse Operation, uneingeschränkt ausführen. Zu jeder Zahl n in Z gibt es die inverse Zahl, das ist die Zahl n mit geändertem Vorzeichen. Sie wird mit −n bezeichnet. Es gilt n+(−n) = 0 und durch diese Gleichung ist die inverse Zahl −n auch eindeutig bestimmt. Zum Beispiel ist −5 die inverse Zahl zu 5 und 2 ist die inverse Zahl zu −2. Die Subtraktion einer Zahl wird dann als Addition der inversen Zahl definiert, das heißt m−n = m+(−n). Aus dem Assoziativ- und dem Kommutativgesetz für die Addition folgt dann, dass (−m) + (−n) die inverse Zahl zu m + n ist, da m + n + (−m) + (−n) = m + (−m) + n + (−n) = 0 + 0 = 0 gilt. Das Produkt zweier ganzer Zahlen m und n erhält man, indem man zuerst die beiden Zahlen ohne Vorzeichen multipliziert und dann das Produkt mit einem positiven Vorzeichen versieht, wenn m und n gleiches Vorzeichen haben, und mit einem negativen Vorzeichen, wenn sie verschiedenes Vorzeichen haben. Für die Multiplikation gelten das Kommutativund das Assoziativgesetz, da sie für natürliche Zahlen gelten. Direkt aus der Definition der Multiplikation folgt auch, dass m(−n) = −mn und (−m)n = −mn gilt. Etwas schwieriger ist es, das Distributivgesetz von N0 auf Z zu übertragen. Seien m, n und k in N0 . Dann gilt ja (m+n)k = mk +nk. Wir formen diese Gleichung um. Addiert man die zu nk inverse Zahl, so erhält man die Gleichung −nk + (m + n)k = mk. Addiert man die zu mk und (m + n)k inversen Zahlen, so erhält man die Gleichung −mk = −(m + n)k + nk. Addiert man die zu mk, nk und (m + n)k inversen Zahlen, so erhält man schließlich die Gleichung −mk − nk = −(m + n)k. Wir wenden die oben besprochenen Regeln für das Rechnen mit inversen Zahlen an: Aus −mk − nk = −(m + n)k folgt (−m)k + (−n)k = (−(m + n))k = ((−m) + (−n))k. Indem wir j = m + n in −nk + (m + n)k = mk einsetzen, erhalten wir −nk + jk = ((−n) + j)k, das heißt (−n)k + jk = ((−n) + j)k. Indem wir j = m + n in −mk = −(m + n)k + nk einsetzen, erhalten wir −(j + (−n))k = −jk + nk, das heißt ((−j) + n)k = (−j)k + nk. 17 18 2. DIE GANZEN ZAHLEN Damit ist (m + n)k = mk + nk für alle m und n in Z und alle k in N0 gezeigt. Addiert man wie oben die zu mk, nk und (m + n)k inversen Zahlen, so erhält man die Gleichung −mk − nk = −(m + n)k. Daraus ergibt sich m(−k) + n(−k) = (m + n)(−k). Damit ist dann (m + n)k = mk + nk für alle m, n und k in Z gezeigt. Wir haben gezeigt, das das Assoziativ- und das Kommutativgesetz für Addition und Multiplikation, sowie das Distributivgesetz auch im Zahlenbereich der ganzen Zahlen gelten. Außerdem existiert zu jeder ganzen Zahl die inverse Zahl. Die Subtraktion ist uneingeschränkt ausführbar. Insbesondere sind Gleichungen der Form x + m = n immer lösbar. Die Lösung ist ja x = n + (−m) = n − m. Bemerkung. Um die Rechenregeln für ganze Zahlen exakter behandeln zu können, führen wir eine Darstellung der ganzen Zahlen durch Paare (u, v) von natürlichen Zahlen ein. Analog zu den Brüchen, die man sich als nicht ausgeführte Division vorstellen kann, interpretieren wir das Zahlenpaar (u, v) als nicht ausgeführte Subtraktion. Durch (u, v) wird die ganze Zahl u − v dargestellt. Wir nennen das Zahlenpaar (u, v) reduziert (analog zu gekürzten Brüchen), wenn mindestens eine der beiden Zahlen null ist. Dann entspricht jeder ganzen Zahl genau eine reduzierte Darstellung. Es steht (n, 0) für n und (0, m) für −m. Man kann dann schreiben Z = {(u, v) : u ∈ N0 , v ∈ N0 , nicht beide > 0} Ist (u, v) die reduzierte Darstellung einer Zahl, dann sind (u + k, v + k) für k ≥ 1 die nichtreduzierten Darstellungen derselben Zahl (analog zu den nichtgekürzten Brüchen). Die Differenz der ersten minus der zweiten Zahl bleibt ja unverändert. Ist (p, q) ein Paar von natürlichen Zahlen, dann gewinnt man die reduzierte Darstellung, indem man die kleinere von beiden Zahlen subtrahiert. Die Addition für Zahlenpaare definieren wir folgendermaßen (u, v) + (p, q) = (u + p, v + q) wobei man das Ergebnis (u + p, v + q) gegebenenfalls noch reduziert. Dadurch erhält man die richtige Addition auf Z: (n, 0) + (m, 0) = (n + m, 0) ist die Addition zweier positiver Zahlen, (n, 0) + (0, m) = (n, m) ist die Addition einer positiven und einer negativen Zahl und (0, n) + (0, m) = (0, n + m) ist die Addition zweier negativer Zahlen. Außerdem ist es unerheblich, welche Darstellung man verwendet. Es muss nicht die reduzierte sein. Es gilt ja (u + k, v + k) + (p + l, q + l) = (u + p + k + l, v + q + k + l) Das Ergebnis ist dasselbe wie oben, nur in einer anderen Darstellung. Es ist dann auch klar, dass Assoziativ- und Kommutativgesetz für die Addition gelten, da ja mit natürlichen Zahlen gerechnet wird, für die beide Gesetze gelten. Die Zahlen 3 und −7 werden durch die Paare (3, 0) und (0, 7) dargestellt. Wir erhalten (3, 0) + (0, 7) = (3, 7). Die reduzierte Darstellung des Ergebnisses ist (0, 4), also −4. Wir können aber zum Beispiel auch 3 durch (9, 6) und −7 durch (1, 8) darstellen. Die Rechnung ergibt (9, 6) + (1, 8) = (10, 14). Die reduzierte Darstellung des Ergebnisses ist wieder (0, 4). Die Multiplkation für Zahlenpaare definieren wir folgendermaßen (u, v) · (p, q) = (up + vq, uq + vp) wobei man das Ergebnis (up + vq, uq + vp) gegebenenfalls noch reduziert. Das ergibt die richtige Multiplikation: (n, 0)·(m, 0) = (nm, 0) ist die Multiplikation zweier positiver Zahlen, (n, 0) · (0, m) = (0, nm) ist die Multiplikation einer positiven und einer negativen Zahl und (0, n)·(0, m) = (nm, 0) ist die Multiplikation zweier negativer Zahlen. Außerdem ist es wieder 2. GRUPPEN, RINGE, KÖRPER 19 unerheblich, welche Darstellung man bei der Multiplikation verwendet. Es gilt ja (u+k, v+k)·(p+l, q+l) = (up+kp+ul+kl+vq+kq+vl+kl, uq+kq+ul+kl+vp+kp+vl+kl) Das Ergebnis ist dasselbe wie oben, nur in einer anderen Darstellung. Man kann dann auch zeigen, dass Assoziativ- und Kommutativgesetz für die Multiplikation gelten, da ja mit natürlichen Zahlen gerechnet wird, für die beide Gesetze gelten. Die Zahlen 3 und −7 werden durch die Paare (3, 0) und (0, 7) dargestellt. Wir erhalten (3, 0) · (0, 7) = (0, 21), also −21. Wir können aber zum Beispiel auch 3 durch (9, 6) und −7 durch (1, 8) darstellen. Die Rechnung ergibt dann (9, 6) · (1, 8) = (57, 78). Die reduzierte Darstellung des Ergebnisses ist wieder (0, 21). Auch das Distributivgesetz lässt sich jetzt einfach nachrechnen. Es gilt ( ) (p, q) + (r, s) · (u, v) = (p + r, q + s) · (u, v) = (pu + ru + qv + sv, pv + rv + qu + su) Andererseits gilt auch (p, q) · (u, v) = (pu + qv, pv + qu) und (r, s) · (u, v) = (ru + sv, rv + su) ( ) Daraus folgt (p, q) + (r, s) · (u, v) = (p, q) · (u, v) + (r, s) · (u, v), das Distributivgesetz. 2. Gruppen, Ringe, Körper Im Zahlenbereich Z sind Gleichungen der Form x + a = b immer lösbar. Dies ist eng mit der Tatsache verknüpft, dass die ganzen Zahlen eine sog. Gruppe bilden. Um dies zu erklären, benötigen wir zunächst den Begriff der Verknüpfung (auch Operation) auf einer Menge, der im Fall der Menge der ganzen Zahlen der Addition entspricht. Definition. Eine Verküpfung auf einer Menge M ist eine Funktion ◦, die jedem Paar (a, b) von Elementen aus M ein eindeutig bestimmtes Element a ◦ b aus M zuordnet. Beispiel. Für M = Z sind + und · zwei verschiedene Verknüpfungen. Beispiel. Ist M die Menge aller Teilmengen von {1, 2, 3, 4}, so ist ∪ eine Verknüpfung auf M . Definition. Eine Gruppe besteht aus einer Menge G zusammen mit einer Verknüpfung ◦ : G × G → G, für die folgende Regeln gelten: 1) ∀a, b, c ∈ G gilt (a ◦ b) ◦ c = a ◦ (b ◦ c). 2) Es existiert ein e ∈ G, sodass für alle a ∈ G gilt e ◦ a = a ◦ e = a. 3) Für alle a ∈ G existiert ein b ∈ G mit a ◦ b = b ◦ a = e. Gilt überdies noch 4) ∀a, b ∈ G gilt a ◦ b = b ◦ a, so heisst die Gruppe kommutativ (oder abelsch). Bevor wir zu Beispielen kommen noch einige Anmerkungen zur Definition der Gruppe: das in Punkt 2) beschriebene Element e heisst neutrales Element der Gruppe. Es ist eindeutig bestimmt, denn wäre e′ ein weiteres solches, so folgte e = e ◦ e′ = e′ ◦ e = e′ . Daher ist auch die Bedingung 3) wohldefiniert, schliesslich wird das neutrale Element e darin als eindeutig vorausgesetzt. Das in 3) zu a ∈ G gehörige Element b mit a ◦ b = b ◦ a = e wird als das Inverse von a bezeichnet. Man bezeichnet es gewöhnlich mit a−1 , es sei denn, die Verknüpfung ist +, dann 20 2. DIE GANZEN ZAHLEN schreibt man für das Inverse von a immer −a. Auch das Inverse von a ist in einer Gruppe eindeutig bestimmt. Wären nämlich b und c Inverse von a, so folgte a ◦ b = e = a ◦ c ⇒ b ◦ (a ◦ b) = b ◦ (a ◦ c). Mit Hilfe von 1), also der Assoziativität, liefert dies (b ◦ a) ◦ b = (b ◦ a) ◦ c ⇒ e ◦ b = e ◦ c ⇒ b = c. Beispiel. Die ganzen Zahlen Z bilden bez. der Verknüpfung + eine abelsche Gruppe mit neutralem Element 0 und a−1 = −a. Mit der Verknüpfung · bilden sie keine Gruppe, da der einzige Kandidat für ein neutrales Element 1 ist und a · b = 1 z.B. für a = 2 keine ganze Lösung b besitzt. Damit wären wir aber auch schon zurück bei unserer Gleichung x+a = b. Ihre Lösbarkeit für alle a, b ∈ Z ist gleichbedeutend damit, dass jedes a ∈ Z ein Inverses besitzt, denn ist (−a) das Inverse zu a, so erhält man durch seine Addition auf beiden Seiten der Gleichung (x+a)+(−a) = b+(−a). Mit Hilfe des Assoziativgesetzes und der Tatsache, dass a+(−a) = e gilt, erhält man als Lösung der Gleichung x = b + (−a), was man kurz x = b − a schreibt. Umgekehrt, hat x + a = b für jedes a, b ∈ Z eine Lösung, so ist diese Lösung im Fall b = 0 ein Inverses von a. Der Vorteil dieser abstrakten Herangehensweise an die Addition auf den ganzen Zahlen ist, dass sie auf viele andere Mengen und Verknüpfungen anwendbar ist und man so nur nachweisen muss, dass eine bestimmte Menge zusammen mit einer Verknüpfung eine Gruppe bildet, um alle abstrakt hergeleiteten Eigenschaften dieser Struktur nachzuprüfen. Ganz nebenbei haben wir so auch die Subtraktion auf Z einfach durch Addition des Inversen eingeführt, ohne eine neue Verknüpfung definieren zu müssen. Wie sieht es nun mit der Multiplikation aus? Innerhalb der ganzen Zahlen kann man multiplizieren, hat ein diesbez. neutrales Element, aber die Tatsache, dass nicht zu jeder ganzen Zahl die multiplikativ Inverse wieder ganzzahlig ist, verhindert, dass Z auch bez. · eine Gruppe wird. Dennoch lohnt es sich, auch diesen Sachverhalt zu abstrahieren. Definition. Ein Ring besteht aus einer Menge R zusammen mit zwei Verknüpfungen +,·: R × R → R, für die folgende Regeln gelten: 1) R bildet mit der Verküpfung + eine abelsche Gruppe. 2) ∀a, b, c ∈ R gilt (a · b) · c = a · (b · c). 3) ∀a, b, c ∈ R gilt a · (b + c) = a · b + a · c und (a + b) · c = a · c + b · c. Gilt überdies noch 4) Es existiert ein Element 1 ∈ R, sodass für alle a ∈ R gilt 1 · a = a · 1, so heisst R ein Ring mit Eins (oder unitär). Gilt 5) ∀a, b ∈ R gilt a · b = b · a, so heisst der Ring kommutativ. Wieder wollen wir einige einfache Folgerungen aus dieser Definition ziehen und betonen, dass uns diese natürlich aus den ganzen Zahlen bekannt sind, denn Z ist klarerweise ein Ring (und Vorbild für dessen Definition), und dennoch alleine aus den Bedingungen der Definition abgeleitet werden können. Wie allgemein üblich lassen wir in der Folge das · bei Multiplikationen zweier Parameter weg. 1) 0 · a = a · 0 = 0 für alle a ∈ R. In der Tat ist a · 0 = a · (0 + 0) = a · 0 + a · 0 und durch Addition von −(a · 0) folgt a · 0 = 0. 3. DIVISION MIT REST UND EUKLIDISCHER ALGORITHMUS 21 2) (−a)b = a(−b) = −(ab) für alle a, b ∈ R. Es ist einerseits (−a)b + ab = (a + (−a))b = 0 · b = 0 und andererseits −(ab) + ab = 0, sodass aus der Eindeutigkeit des additiven Inversen folgt, dass (−a)b = −(ab) gelten muss. 3) (−a)(−b) = ab zeigt man auf ähnliche Weise, genauso wie 4) a(b − c) = ab − ac. Ausständig ist nun noch Beispiel. R = Z ist mit den zwei Verknüpfungen + und · ein kommutativer Ring mit Eins. Beispiel. Der kleinste Ring ist der Ring R = {0}, der nur aus der Null besteht. Er ist kommutativ und hat ein Einselement (!), nämlich 0. Dieser Ring, genannt Nullring, ist der einzige, bei dem Nullelement und Einselement übereinstimmen. Damit haben wir das maximal mögliche an algebraischer Struktur der ganzen Zahlen abstrahiert. Um auch ein Beispiel einer Menge zu geben, die bezüglich zweier Verknüpfungen eine Gruppe bildet, und zwar derart, dass die beiden Verknüpfungen wie im Falle eines Rings miteinander verträglich sind, müssen wir auf die im nächsten Kapitel ausführlicher behandelten rationalen Zahlen oder die aus der Schule bekannten reellen Zahlen verweisen. Dennoch wollen wir im folgenden schon vorab die algebraische Struktur definieren, die durch die beschriebenen Anforderungen definiert ist. Definition. Ein Körper besteht aus einer Menge K zusammen mit zwei Verknüpfungen +,·: K × K → K, für die folgende Regeln gelten: 1) K bildet mit der Verküpfung + eine abelsche Gruppe (mit neutralem Element 0). 2) K \ {0} bildet mit der Verküpfung · eine abelsche Gruppe (mit neutralem Element 1). 3) ∀a, b, c ∈ K gilt a · (b + c) = a · b + a · c und (a + b) · c = a · c + b · c. Wieder sind einige Bemerkungen zu dieser Definition angebracht. Zunächst fällt auf, dass die Definition nicht vollkommen symmetrisch in Hinblick auf beide Verknüpfungen ist: bei der zweiten muss das neutrale Element bez. der ersten aus der Menge entfernt werden, um die Gruppenstruktur zu erfüllen. Salopp gesagt ist das der Grund für die bekannte Regel: “durch Null darf man nicht dividieren”, denn wie bereits bei der Addition erwähnt, ist die Division durch a ∈ K \ {0} nicht eine weitere Verknüpfung, sondern entspricht lediglich der Multiplikation mit dem multiplikativen Inversen a−1 . Eine weitere, äquivalente Definition eines Körpers erhält man, indem man für K fordert, dass es bez. der beiden Verknüpfungen ein kommutativer Ring mit Einselement ist, der nicht der Nullring ist, und für den jedes Element ungleich 0 ein multiplikatives Inverses besitzt. Die Tatsache, dass der Nullring ausgeschlossen wird, garantiert, dass 1 ̸= 0 in jedem Körper gilt. Beispiel. K = Q und K = R sind mit den zwei Verknüpfungen + und · jeweils Körper. Beispiel. K = {0, 1} ist der kleinstmögliche Körper. Wir werden später sehen, dass eine Vielzahl endlicher Körper existiert. 3. Division mit Rest und Euklidischer Algorithmus Nachdem wir im letzten Abschnitt mehrmals festgestellt haben, dass eine ganze Zahl nicht notwendig ein multiplikatives Inverses besitzt und dass dies bewirkt, dass nicht alle Divisionen in Z zu Ergebnissen führen, die wieder ganzzahlig sind, wollen wir nun eine Methode der Division einführen, die nicht aus Z herausführt, die sog. Division mit Rest. 22 2. DIE GANZEN ZAHLEN Gegeben seien dazu zunächst zwei natürliche Zahlen, der Dividend a und der Divisor b ̸= 0 und a soll durch b mit Rest dividiert werden: dies ist äquivalent zu der Frage, wie man die Zahl a als Vielfaches von b mit möglichst kleinem Rest darstellen kann: a = qb + r, wobei q der sogenannte Ganzzahlquotient und r der Rest ist. Entscheidende Nebenbedingung ist, dass 0 ≤ r < b ist, denn dadurch wird r eindeutig bestimmt. Wir erhalten den Satz von der Division mit Rest Satz 22. Seien a ∈ Z, b ∈ N. Dann gibt es eindeutig bestimmte ganze Zahlen q, r ∈ Z mit a = qb + r und 0 ≤ r < b. Beweis. Wir bezeichnen mit [x] die grösste ganze Zahl kleiner oder gleich x. Setzt man q := [a/b], so ist offensichtlich a q ≤ < q + 1 ⇔ qb ≤ a < qb + b ⇔ 0 ≤ a − qb < b. b r := a − qb erfüllt also die Nebenbedingung. Angenommen q, r und q ′ , r′ wären zwei Paare ganzer Zahlen, die den Bedingungen der Behauptung genügen, so hätten wir qb + r = q ′ b + r′ mir 0 ≤ r, r′ < b. Es folgte |r − r′ | < b und daher b|q − q ′ | < b, was bei ganzen Zahlen nur mit q = q ′ und in der Folge r = r′ möglich ist. Die Bedeutung des soeben bewiesen Ergebnisses wird klar, wenn man sich überlegt, dass darauf die Existenz der Zifferndarstellung der ganzen Zahlen beruht. Wir wollen nun auf eine weitere wichtige Anwendung näher eingehen, die mit der Teilbarkeit ganzer Zahlen zusammenhängt. Definition. Seien a, b ganze Zahlen. Dann heisst b ein Teiler von a (man schreibt dafür b|a), wenn ein ganzzahliges q existiert mit a = qb. Dies entspricht gerade dem Spezialfall der Division mit Rest, in dem der Rest r gleich Null ist. Insbesondere muss jeder Teiler b von a die Ungleichung |b| ≤ |a| erfüllen, sodass jedes ganze a nur endlich viele Teiler besitzt. Beschränkt man sich auf natürliche Zahlen, so kann man die Beträge natürlich weglassen. Der Einfachheit halber bleiben wir im folgenden bei natürlichen Zahlen a und b und interessieren uns für die Menge ihrer gemeinsamen Teiler. Diese muss ein grösstes Element besitzen, den sogenannten grössten gemeinsamen Teiler, kurz ggT (a, b) oder nur (a, b). Definition. Seien a, b ∈ Z, nicht beide gleich 0. d ∈ Z heisst ggT (a, b) von a und b, falls 1) d > 0, 2) d|a und d|b, 3) Für alle t mit t|a und t|b folgt t|d. Die Existenz des ggT folgt aus der Tatsache, dass a und b nur endlich viele, und daher nur endlich viele gemeinsame Teiler besitzen, mindestens aber einen, nämlich 1. Der ggT ist darüberhinaus eindeutig bestimmt, denn sind d und d′ grösste gemeinsame Teiler von a und b, so folgt aus 3), dass d|d′ und d′ |d, woraus d = ±d′ folgt und mit 1) schliesslich d = d′ . Interessant ist nun, wie man bei gegebenen a und b den ggT explizit bestimmt. Der dazu im folgenden Satz beschriebene Algorithmus basiert im wesentlichen auf dem Prinzip des wechselseitigen Abziehens von ganzzahligen Vielfachen der kleineren von der grösseren Zahl und somit auf der Division mit Rest. 3. DIVISION MIT REST UND EUKLIDISCHER ALGORITHMUS 23 Satz 23. Euklidischer Algorithmus Seien a, b natürliche Zahlen und a ≥ b. Die ganzen Zahlen qi und ri seien rekursiv bestimmt durch die Gleichungen a = q 0 b + r1 r0 = q1 r1 + r2 r1 = q2 r2 + r3 .. . ri−1 = qi ri + ri+1 .. . mit mit mit mit 0 ≤ r1 < b ( 0 ≤ r2 < r 1 , 0 ≤ r3 < r 2 , .. . 0 ≤ ri+1 < ri , .. . = r0 ), Dann gibt es ein kleinstes n mit rn+1 = 0 und es gilt: rn = ggT (a, b). Beweis. Wir bemerken zunächst, dass laut Konstruktion die Folge der Reste b = r0 , r1 , r2 , . . . streng monoton fallend ist und nach unten durch 0 beschränkt. Also muss ein n existieren mit rn+1 = 0. Ist d := ggT (a, b), so gilt d|a − q0 b, also d|r1 . Daraus folgt aber d|b − q1 r1 , also d|r2 und so weiter, sodass man nach n Schritten d|rn erhält. Umgekehrt gilt aber rn−1 = qn rn , sodass rn |rn−1 . Daraus folgt aber rn |qn−1 rn−1 + rn , also rn |rn−2 und so weiter, was nach n Schritten auf rn |r0 = b sowie rn |q0 r0 + r1 = a führt. Insgesamt gilt also ggt(a, b) = d|rn und rn |d, sodass wegen rn > 0 die Gleichheit wie behauptet folgt. Beispiel. Wir ermitteln nun mit Hilfe des angegebenen Algorithmus ggT (31031, 10013). 31031 10013 992 93 62 = = = = = 3 · 10013 + 992 10 · 992 + 93 10 · 93 + 62 1 · 62 + 31 2 · 31 + 0 und es folgt ggT (31031, 10013) = 31. Ist der ggT von zwei Zahlen a und b gleich 1, so heissen a und b teilerfremd oder relativ prim. Man überlegt sich leicht, dass zwei aufeinanderfolgende ganze Zahlen stets teilerfremd sein müssen. Zum Abschluss dieses Abschnitts wollen wir noch den Euklidischen Algorithmus verwenden, um die Existenz ganzzahliger Lösungen von gewissen linearen Gleichungen zu untersuchen. Satz 24. Seien a, b ∈ Z, nicht beide Null und d := ggT (a, b). Dann existieren x, y ∈ Z mit ax + by = d. Man kann dies auch so ausdrücken: ggT (a, b) ist als ganzzahlige Linearkombination von a und b darstellbar. 24 2. DIE GANZEN ZAHLEN Beweis. Wir nehmen an, es sei b ≤ a und wenden den Euklidischen Algorithmus auf a und b an. Dann ist a = q 0 b + r1 , r0 = q1 r1 + r2 , .. .. . . rn−1 = qn rn und rn = ggT (a, b) = d. Nun sind aber r0 = 0 · a + 1 · b sowie r1 = 1 · a − q0 · b beide Linearkombinationen von a und b. Dann ist aber auch r2 = r0 − q1 r1 als Linearkombination von Linearkombinationen von a und b wieder eine solche und nach weiteren n − 2 Schritten folgt zu guter Letzt, dass auch d = rn eine Linearkombination von a und b ist. Der Vorteil dieses Verfahrens ist, dass es konstruktiv ist, wie wir gleich an folgendem Beispiel sehen werden: Beispiel. Bestimme eine Lösung (x, y) ∈ Z × Z von 111x + 39y = 3( es ist 3 = ggT (111, 39)). Wir wenden zunächst den Euklidischen Algorithmus auf 111 und 39 an: 111 39 33 6 = = = = 2 · 39 + 33 1 · 33 + 6 5·6+3 2·3 Nun rollen wir die Ungleichungskette quasi von der vorletzten Zeile ausgehend von unten auf: 3 = = = = = 33 − 5 · 6 33 − 5(39 − 1 · 33) 6 · 33 − 5 · 39 6(111 − 2 · 39) − 5 · 39 6 · 111 − 17 · 39 Mit dem Paar (6, −17) ist also eine Lösung der angegebenen Gleichung gefunden. Diese ist übrigens nicht eindeutig bestimmt, man kann sogar zeigen, dass es unendlich viele ganzzahlige Lösungen gibt und diese genau beschreiben. 4. Primzahlen Wir beginnen diesen Abschnitt mit der bereits aus der Schule bekannten Begriff der Primzahl. Definition. Eine ganze Zahl p > 1 heisst prim, falls für jeden Teiler d von p gilt: d = p oder d = 1 (man sagt, p habe keine echten Teiler). Die Menge aller Primzahlen wird mit P bezeichnet. So geläufig diese Definition auch sein mag, sie bedarf einiger Bemerkungen. Zunächst fällt auf, dass man alternativ auch fordern könnte, dass p ganz ist und genau zwei positive Teiler hat. Damit ist nämlich der Fall p = 1 ausgeschlossen und es wird dieselbe Menge P definiert. Weit weniger offensichtlich ist allerdings, dass auch folgende Definition genau die Primzahlen charakterisiert: 4. PRIMZAHLEN 25 Definition. Eine ganze Zahl p > 1 heisst prim, falls für alle m, n ∈ Z mit p|mn gilt: p|m oder p|n. Kurz gesagt, Primzahlen sind diejenigen ganzen Zahlen grösser als 1, die wenn sie ein Produkt teilen, immer mindestens einen der Faktoren teilen. Um die Äquivalenz der beiden Definitionen zu zeigen, benötigen wir ein Resultat, das häufig als Fundamentalsatz der Arithmetik bezeichnet wird. Satz 25. Seien a1 , a2 , . . . , an ∈ Z, p ∈ P und p ein Teiler von a1 a2 · · · an . Dann existiert ein i ∈ {1, . . . , n} mit p|ai . Beweis. Es genügt, die Aussage für n = 2 zu zeigen, da man bei mehreren Faktoren immer zwei zusammenfassen kann und so die Anzahl der Faktoren um einen reduziert. Dies ermöglicht den Induktionsschritt in einem Induktionsbeweis falls n > 2. Sei also p|a1 a2 und o.B.d.A. gelte p ̸ |a1 . Dann ist ggT (p, a1 ) = 1 wegen der ersten Definition von Primzahlen und laut vorigem Abschnitt existieren ganze x und y mit px + a1 y = 1. Multipliziert man diese Gleichung nun mit a2 , so sieht man, dass p als Teiler von p und von a1 a2 die linke Seite der Gleichung teilt, und somit auch die rechte Seite, also a2 teilen muss. Damit ist gezeigt, dass einer der beiden Faktoren von p geteilt werden muss. Wir wissen demnach, dass jede Zahl, die prim ist laut Definition 1 auch prim laut Definition 2 ist. Umgekehrt, erfüllt ein p die Voraussetzungen der zweiten Definition, so kann p keinen Teiler haben, der ungleich 1 oder p ist. Dies sieht man am leichtesten indirekt (siehe dazu auch Kapitel IV.3, wo indirekte Beweise näher untersucht werden): wäre nämlich d ein echter Teiler von p, so gäbe es ein 1 < q < p mit p = dq und für die Wahl m = d, n = q wäre die Schlussfolgerung der zweiten Definition falsch. Insgrsamt folgt, dass beide Definitionen dieselbe Zahlenmenge beschreiben. Beispiel. Der kleinste positive Teiler jeder ganzen Zahl a ist stets eine Primzahl. Der Beweis wird dem Leser als Übung überlassen. Nun, da wir Primzahlen definiert haben, stellt sich als nächstes die Frage, ob es überhaupt solche Zahlen gibt (na klar, sonst wäre die Definition wertlos) und wenn ja, wieviele. Euklid hat bereits gezeigt, dass die Menge der Primzahlen unendlich ist und sein Beweis wird in Kapitel IV, Abschnitt 3 ausführlich diskutiert. Damit tauchen weitere Fragen auf: wie bestimmt man alle Primzahlen und wie stellt man von einer gegebenen Zahl fest, ob sie prim ist? Dazu gibt es ein sehr einfaches Verfahren, das sog. Sieb des Erathostenes. Dabei schreibt man alle natürlichen Zahlen hintereinander auf und streicht nun auf folgende Weise die zusammengesetzten Zahlen heraus: man beginne bei 2, und streiche danach alle Vielfachen von 2 ausser 2 selbst, das damit als Primzahl identifiziert ist. Von den übriggebliebenen Zahlen grösser als 2 wähle man die kleinste, also 3 und streiche wieder alle Vielfachen von 3 ausser 3 selbst, das sich so ebenfalls als prim herausgestellt hat. Dazu streicht man einfach jede dritte Zahl nach 3, muss aber die schon weggestrichenen Vielfachen von 2 miteinbeziehen in die Streichung. Die nächstgrösste noch nicht gestrichene Zahl ist dann 5, das daher als Primzahl erkannt wurde und man streicht alle Vielfachen von 5, die danach kommen. Dieses Verfahren wird ad infinitum fortgesetzt: die nicht gestrichenen Zahlen ausser 1 sind genau die Primzahlen. Damit ist wohl die erste Frage beantwortet und theoretisch auch die zweite (man sehe nach, ob die gegebene Zahl in der Liste der Primzahlen vorkommt), aber dies ist praktisch nicht hilfreich, da das Erstellen der Liste aufwendig ist, zumal man eigentlich alle Zahlen bis zur gegebenen auf Primalität untersucht. 26 2. DIE GANZEN ZAHLEN Beispiel. Will man überprüfen, ob 71 eine Primzahl ist, so schreibt man alle Zahlen bis 71 in eine Liste und wendet das Sieb des Erathostenes an. Man streicht also alle Vielfachen von 2,3,5 und 7. Es stellt sich heraus, dass 71 noch nicht gestrichen ist und wir behaupten, dass es nun auch nicht mehr gestrichen werden kann, also prim sein muss. Die nächste √ Primzahl nach 7 ist nämlich 11, und dies ist bereits grösser als 71. Wäre 71 also Vielfaches einer Primzahl p > 7, so folgte 71 = pq mit einem q < 7 und 71 hätte schon als ein Vielfaches eines Primteilers von q gestrichen werden müssen. Mit dem Bestreben, möglichst zeitsparende Primzahltests zu finden, beschäftigt sich die Kryptographie in Hinblick auf deren Bedeutung für die Entschlüsselung von Codes. Einige bekannte Verfahren sind der Miller-Rabin oder Solovay-Strassen Algorithmus. In der Zahlentheorie ist vor allem folgende Eigenschaft der Primzahlen von grosser Bedeutung: Satz 26. Eindeutigkeit der Primfaktorzerlegung Sei n eine natürliche Zahl. Dann gibt es für jedes p ∈ P genau ein νp ≥ 0, sodass νp = 0 für alle bis auf endlich viele p, und ∏ n= pνp . p∈P Beweis. Wir haben Existenz und Eindeutigkeit der Produktdarstellung zu zeigen. Die Existenz zeigen wir mittels Induktion nach n: für n = 1 wählen wir νp = 0 für alle p. Falls n > 1, so hat n mindestens einen Primteiler q. Aus q|n folgt n/q < n und nach Induktionsvoraussetzung gibt es eine Darstellung n ∏ µp = p . q p∈P Setze nun νq = µq + 1 und νp = µp für alle p ̸= q. Dann gilt ∏ n= pνp . p∈P Nun zur Eindeutigkeit: angenommen es gelte ∏ ∏ pνp = pµp p∈P p∈P mit νq ̸= µq . Sei o.B.d.A. νq < µq . Dann ist ∏ ∏ pνp q νq = pµp q µq p̸=q und nach Division durch q νq folgt q µq −νq p̸=q ∏ p̸=q pµ p = ∏ pνp . p̸=q Es ist µq − νq > 0 laut Voraussetzung, also ist q ein Teiler des Ausdrucks rechts und somit als Primzahl Teiler eines der Faktoren dieses Produkts. Es gilt also q|p für ein p ̸= q, ein Widerspruch zu p ist prim. Warum dieses Ergebnis so wichtig ist, sieht man sofort, wenn man sich die Auswirkungen auf den Teilbarkeitsbegriff vor Augen hält. ∏ ∏ Beispiel. Sie a = p∈P pαp und b = p∈P pβp . Dann gilt a|b ⇔ αp ≤ βp ∀p ∈ P. 4. PRIMZAHLEN 27 Beispiel. Man überlege sich, dass ∏ ∏ ggT (a, b) = pmin(αp ,βp ) und kgV (a, b) = pmax(αp ,βp ) p∈P p∈P und folgere daraus ggT (a, b)kgV (a, b) = ab. Beispiel. Seien a, b, c, n natürliche Zahlen, ggT (a, b) = 1 und ab = cn . Dann sind sowohl a als auch b selbst ∏ n-te Potenzen einer ganzen Zahl. Setze dazu c = p∈P pγp . Dann folgt aus ab = cn für die Exponenten in der Primfaktorzerlegung αp + βp = nγp und aus der Teilerfremdheit von a und b, dass min(αp , βp ) = 0. Also gilt αp + βp = max(αp , βp ), sodass n| min(αp , βp ) und n| max(αp , βp ). Somit teilt n αp und βp und da dies für alle p ∈ P gilt, sind a bzw. b n-te Potenzen. Beispiel. Verwende das Ergebnis des vorigen Beispiels,√ um zu zeigen, dass √folgende Aussage richtig ist: sind n ≥ 2 und k natürliche Zahlen und n k rational, so muss n k sogar ganzzahlig sein. KAPITEL 3 Rationale und reelle Zahlen 1. Brüche Ein Bruch m besteht aus dem Zähler m und dem Nenner n, wobei der Zähler ein Elen ment von Z und der Nenner ein Element von N ist. Einen Bruch nennen wir gekürzt, wenn ggT (m, n) = 1 gilt. Die Menge Q der rationalen Zahlen ist die Menge aller gekürzten Brüche, das heißt Q = { m : m ∈ Z, n ∈ N, ggT (m, n) = 1}. (Jede natürliche Zahl ist Teiler von 0.) n kann man sich als nicht ausgeführte Division vorstellen. Zu jedem gekürzten Einen Bruch m n m Bruch n gibt es die nicht gekürzten Brüche mk mit k ∈ {2, 3, 4, 5, . . . }, die dieselbe rationale nk m Zahl darstellen wie n . Denkt man sich die Division ausgeführt, dann erhält man ja für m n und mk dasselbe Ergebnis. nk Man kann Brüche nur addieren, wenn sie gleichen Nenner haben. Es gilt nj + m = j+m . n n Haben sie nicht den gleichen Nenner, dann muss man sie erweitern, um den gleichen Nenner zu erhalten. Sind ab und dc zwei Brüche, dann ist n = kgV (b, d) der kleinste gemeinsame Nenner. Sind u und v aus N so gewählt, dass bu = n und dv = n gilt, dann erweitern wir den Bruch ab mit u zu au und den Bruch dc mit v zu cv . Es gilt dann ab + dc = au + cv = au+cv . n n n n n Wenn möglich, wird dieser Bruch noch gekürzt. Das Ergebnis der Addition ist dann wieder ein Element von Q. Wir können aber auch andere gemeinsame Nenner wählen. Das sind die Vielfachen des kleinsten gemeinsamen Nenners n. Es sind die Zahlen nk mit k ∈ N. Wir erhalten dann a + dc = auk + cvk = auk+cvk = (au+cv)k . Durch Kürzen erhält man wieder au+cv . Das Ergebnis b nk nk nk nk n der Addition ist also von der Wahl des gemeinsamen Nenners unabhängig. Ein einfach zu findender gemeinsamer Nenner der Brüche ab und dc ist bd. Die Addition cb sieht dann so aus ab + dc = ad + db = ad+bc . bd bd Die Multiplikation der Brüche ab und dc ist definiert durch ab · dc = ac . Wenn möglich, wird bd dieser Bruch noch gekürzt. Das Ergebnis der Multiplikation ist dann wieder ein Element cv von Q. Wählt man nicht gekürzte Versionen dieser Brüche, dann hat man au · dv = aucv . bu budv ac Durch Kürzen erhält man wieder bd . Man kann auch bei der Multiplikation mit ungekürzten Brüchen rechnen. Die Menge Q der rationalen Zahlen mit Addition und Multiplikation ist ein Körper. Wir zeigen zuerst, dass Q mit der Addition eine kommutative Gruppe bildet. +(bd)e +bde + fe = (ad+bc)f = adf +bcf und Für alle ab , dc und fe in Q gilt ( ab + dc ) + fe = ad+bc bd (bd)f bdf +de) +de +bde + ( dc + fe ) = ab + cfdf = a(df )+b(cf = adf +bcf . Somit ist die Addition assoziativ. b(df ) bdf Das neutrale Element für die Addition ist die Null. Es gilt ab + 0 = ab für alle ab ∈ Q. Die . Es gilt ja ab + −a = a−a = 0. additive inverse Zahl zu ab ist −a b b b a c ad+bc bc+ad c a Schließlich gilt noch b + d = bd = db = d + b für alle ab und dc in Q. Somit ist die Addition auch kommutativ. Wir zeigen, dass Q mit der Multiplikation eine kommutative Gruppe bildet. ce Für alle ab , dc und fe in Q gilt ( ab · dc ) · fe = ac · e = ace und ab · ( dc · fe ) = ab · df = ace . Somit bd f bdf bdf ist die Multiplikation assoziativ. a b 29 30 3. RATIONALE UND REELLE ZAHLEN Das neutrale Element für die Multiplikation ist die Eins. Es gilt ab · 1 = ab für alle ab ∈ Q. −b Für ab ̸= 0, das heißt a ̸= 0, ist ab die multiplikative inverse Zahl (oder −a , um einen Nenner a b ab in N zu haben). Es gilt ja b · a = ba = 1. Schließlich gilt noch ab · dc = ac = ca = dc · ab für alle ab und dc in Q. Somit ist die bd db Multiplikation auch kommutativ. Als letztes Gesetz bleibt noch das Distributivgesetz zeigen. Für alle ab , dc und fe in Q gilt ae ce ( ab + dc )· fe = ad+bc · fe = ade+bce und ab · fe + dc · fe = bf + df = ade+bce , also ( ab + dc )· fe = ab · fe + dc · fe . bd bdf bdf Damit ist gezeigt, dass die Menge Q der rationalen Zahlen mit Addition und Multiplikation einen Körper bildet. Die Subtraktion und die Division, das sind die Umkehroperationen zu Addition und Multiplikation, sind uneingeschränkt ausführbar (außer natürlich die Division durch 0). Insbesondere ist die Gleichung x + p = q für alle Zahlen p und q in Q lösbar. Die Gleichung x · p = q ist für p ∈ Q \ {0} und q ∈ Q lösbar. 2. Die Zahlengerade Jedem Punkt auf der Zahlengerade soll eine Zahl zugeordnet werden. Wir wählen einen Punkt x und ordnen ihm eine Zahl zu, indem wir die Zahlenskala immer weiter verfeinern. Wir gehen von den ganzen Zahlen Z aus, die wir auf der Zahlengerade anordnen −3 −2 −1 0 1 2 3 4 5 6 7 8 Ist x ein ganzzahliger Punkt, dann sind wir schon fertig. Ansonten liegt x zwischen zwei ganzen Zahlen, zum Beispiel zwischen 1 und 2. Wir gehen über zu einer genaueren Skala, indem wir die Intervalle zwischen den Zahlen in zehn gleiche Teile unterteilen. Das ergibt die einstellige Dezimalskala. 0.9 1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2.0 2.1 Entspricht x einer einstelligen Dezimalzahl, dann sind wir fertig. Ansonten liegt x zwischen zwei einstelligen Dezimalzahlen, zum Beispiel zwischen 1.2 und 1.3. Wir gehen über zur zweistelligen Dezimalskala, indem wir die Intervalle zwischen aufeinanderfolgenden einstelligen Dezimalzahlen wieder in zehn gleiche Teile unterteilen. 1.19 1.20 1.21 1.22 1.23 1.24 1.25 1.26 1.27 1.28 1.29 1.30 1.31 Entspricht x einer zweistelligen Dezimalzahl, dann sind wir fertig. Ansonsten können wir dieses Verfahren fortsetzen. Für jedes k ∈ N0 erhalten wir eine k-stellige Dezimalskala. Es gibt zwei Möglichkeiten. Entweder wir erhalten für x eine k-stellige Dezimalzahl, oder dieses Verfahren liefert eine Dezimalzahl mit unendlich vielen Dezimalstellen, die den Punkt x festlegt. Wir haben jedem Punkt der Zahlengerade eine Dezimalzahl zugeordnet. Eine Dezimalzahl besteht aus einem ganzzahligen Teil (mit Vorzeichen) und nach dem Dezimalpunkt aus einer endlichen oder unendlichen Folge von Ziffern, den Dezimalstellen. Die Dezimalzahlen fassen wir zur Menge R der reellen Zahlen zusammen. Allerdings ist darauf zu achten, dass eine Dezimalzahl, die ab einer Stelle lauter Neuner hat, auf der Zahlengeraden mit der Dezimalzahl zusammenfällt, die man erhält, wenn man die Neuner weglässt und die letzte Stelle vor den Neunern um 1 erhöht. Daher definiert man R als die Menge aller Dezimalzahlen, die nicht ab einer Stelle lauter Neuner haben. Die Dezimalzahlen mit edlich vielen Dezimalstellen kann man als rationale Zahlen auffassen. Nehmen wir zum Beispiel x = 3.754. Zur ganzen Zahl 3 werden 7 Einheiten der 3. UMRECHNEN DER BRÜCHE IN DEZIMALZAHLEN 31 7 einstelligen Dezimalskala hinzugefügt, das sind 10 , dann 5 Einheiten der zweistelligen Dezi5 malskala, das sind 102 , und schließlich 4 Einheiten der dreistelligen Dezimalskala, das sind 4 7 . Somit gilt x = 3 + 10 + 1052 + 1043 = 3754 . Sei jetzt x = a0 . a1 a2 a3 . . . ak mit positivem 103 103 ak a1 a2 a3 m Vorzeichen. Dann gilt x = a0 + 10 + 102 + 103 + · · · + 10 k = 10k , wobei m = a0 a1 a2 a3 . . . ak ist, die obige Zahl ohne Dezimalpunkt. Hat x negatives Vorzeichen, dann erhält m ebenfalls ein negatives Vorzeichen. Dezimalzahlen mit edlich vielen Dezimalstellen sind also rationale Zahlen. Für diese sind die Rechenoperationen bereits definiert und es gelten die üblichen Rechenregeln. Ist x eine beliebige Dezimalzahl, dann bezeichnen wir mit xk die auf k Stellen gerundete Zahl x. Die gerundete Zahl xk ist diejenige auf der k-stelligen Dezimalskala, die der Zahl x am nächsten liegt. Ist εk = 0.0 . . . 001 der Abstand zweier Zahlen in der k-stelligen Dezimalskala, dann haben xk und x höchstens Abstand 21 εk . (Ist x eine k + 1-stellige Dezimalzahl, deren letzte Dezimalstelle 5 ist, dann ist die auf k Dezimalstellen gerundete Zahl xk nicht eindeutig bestimmt.) Die Addition auf der k-stelligen Dezimalskala ist bereits definiert. Will man zwei Dezimalzahlen x und y addieren, dann addiert man die gerundeten Zahlen xk und yk . Die Summe xk + yk hat dann höchstens Abstand εk von der Summe x + y. Beispiel. Sei x = 2.31745576 . . . und y = 1.22253522 . . . . Rundet man auf 5 Stellen, so erhält man x5 = 2.31746 und y5 = 1.22254. Es folgt x5 + y5 = 3.54000. Die Summe von x und y liegt daher zwischen 3.53999 und 3.54001. Durch Vergrößern von k kann man immer mehr Stellen der Summe bestimmen, sodass x + y dadurch eindeutig definiert wird. Auf dieselbe Art erhält man auch x − y. Das ist ja die Addition einer Zahl mit geändertem Vorzeichen. Ganz ähnlich kann man die Multiplikation und die Division definieren, wobei man bei der Division der gerundeten Zahlen einen Bruch erhält, den man in eine Dezimalzahl entwickeln muss (siehe nächstes Kapitel). Die reellen Zahlen mit Addition und Multiplikation bilden einen Körper. Dieser wird in der Vorlesung über Analysis genauer behandelt. 3. Umrechnen der Brüche in Dezimalzahlen Sei m eine positive rationale Zahl. Wir entwickeln diesen Bruch in eine Dezimalzahl. Die n ganzen Zahlen ai und ri seien rekursiv bestimmt durch die Gleichungen m = a0 n + r 0 10r0 = a1 n + r1 10r1 = a2 n + r2 10r2 = a3 n + r3 ············ 10rk−1 = ak n + rk ············ mit mit mit mit mit 0 ≤ r0 < n, 0 ≤ r1 < n, 0 ≤ r2 < n, 0 ≤ r3 < n, ············ 0 ≤ rk < n ············ Diese Gleichungen geben an, was man beim Dividieren der Zahl m durch die Zahl n tut. Der ganzzahlige Teil a0 kann eine beliebige natürliche Zahl sein, aber ai für i ≥ 1 ist eine der Ziffern 0, 1, . . . , 9 wegen ai = 10rni−1 − rni ≤ 10rni−1 < 10. Es sind die Ziffern, die man beim Divisionsvorgang anschreibt, während ri die sich ergebenden Reste sind. 32 3. RATIONALE UND REELLE ZAHLEN Aus diesen Gleichungen folgt m n r0 n r1 10n r2 102 n rk−1 10k−1 n = a0 + a1 10 a2 102 a3 103 = = + + r0 n r1 10n r2 102 n r3 103 n = + ············ ak rk = 10 k + 10k n ············ und 0≤ und 0≤ und 0≤ und 0≤ ············ 0 ≤ 10rkk n < 101k ············ und r0 < 1, n r1 1 < 10 , 10n r2 1 < 102 , 102 n r3 < 1013 , 103 n Setzt man diese Gleichungen ineinander ein, so ergibt sich m n = a0 + a1 10 + a2 102 + a3 103 + ··· + ak 10k + rk 10k n mit 0≤ rk 10k n < 1 10k ak a3 a2 Die Zahl a0 + a101 + 10 2 + 103 + · · · + 10k ist die Dezimalzahl a0 . a1 a2 a3 . . . ak . Weiters ist εk = 101k der Skalenabstand auf der k-stelligen Dezimalskala. Wir erhalten a0 . a 1 a2 a3 . . . a k ≤ m n < a 0 . a 1 a2 a3 . . . a k + ε k Somit gibt a0 . a1 a2 a3 . . . ak die ersten k Dezimalstellen der Dezimalzahl von m an. n Es können zwei Fälle auftreten. Im ersten Fall tritt rj = 0 für ein j ein. Dann gilt ai = 0 für alle i ≥ j + 1. Wir erhalten m = a0 . a1 a2 a3 . . . aj , eine Dezimalzahl mit endlich vielen n Dezimalstellen. Das passiert genau dann, wenn man m zu einem Bruch mit Nenner 10j n erweitern kann, das heißt die Primzahlzerlegung von n enthält nur die Primzahlen 2 und 5. Im zweiten Fall gilt ri ̸= 0 für alle i ≥ 0. Da als Reste nur die Zahlen 0, 1, . . . , n − 1 auftreten können, existieren j und k mit j < k, sodass rj = rk gilt. Es folgt aj+i = ak+i für alle i ≥ 1. Die Dezimaldarstellung von m ist periodisch. Man nennt a1 a2 . . . aj die Vorperiode. n Anschließend kommt dann der periodische Teil aj+1 aj+2 aj+3 . . . der Dezimaldarstellung. Beispiel. Wir wandeln x = 807 370 in eine Dezimalzahl um. Wir führen die Division durch 807 670 3000 400 300 = = = = = 2 · 370 + 67 1 · 370 + 300 8 · 370 + 40 1 · 370 + 30 0 · 370 + 300 Wir sehen, dass der Rest 300 in der zweiten und fünften Zeile auftritt. Die berechneten Dezimalstellen sind 2.1810. Dann geht es periodisch weiter und zwar mit Periode drei. Die fünfte Stelle ist gleich der zweiten, die sechste gleich der dritten und so weiter. Wir erhalten 807 = 2.1810810810810 . . . 370 Eine Dezimalzahl, die ab einer gewissen Stelle periodisch ist, kann man in einen Bruch verwandeln. Wir sehen uns das an einem Beispiel an. Beispiel. Wir wandeln x = 0.4292929 . . . in einen Bruch um. Da eine Stelle Vorperiode ist und zwei Stellen Periode, bilden wir 10x = 4.292929 . . . und 1000x = 429.292929 . . . . 425 85 Durch Subtrahieren erhalten wir 990x = 1000x − 10x = 425. Es folgt x = 990 = 198 . Mit dieser Methode kann man auch ausprobieren, was passiert, wenn eine Dezimalzahl ab einer Stelle lauter Neuner hat. 4. ORDNUNGSRELATION UND UNGLEICHUNGEN 33 Beispiel. Wir wandeln x = 1.729999 . . . in einen Bruch um. Es gilt 100x = 172.9999 . . . und 1000x = 1729.9999 . . . . Durch Subtrahieren erhalten wir 900x = 1557 oder x = 1557 = 900 173 . Somit gilt auch x = 1.73. 100 4. Ordnungsrelation und Ungleichungen Man kann die Ordnungsrelation in R (oder in Q) so definieren: Es gilt a < b, wenn a auf der Zahlengerade links von b liegt, das heißt, wenn b − a positives Vorzeichen hat. Ebenso gilt a ≤ b, wenn b − a positives Vorzeichen hat oder null ist. Wir bezeichnen die Menge der positiven reellen Zahlen mit R+ und die Menge der positiven reellen Zahlen einschließlich der Null mit R+ 0 . Dann haben wir und a < b ⇐⇒ b − a ∈ R+ (A) a ≤ b ⇐⇒ b − a ∈ R+ 0 Für Summe und Produkt zweier Zahlen gilt + + (B) a ∈ R+ und a ∈ R+ , b ∈ R+ =⇒ a + b ∈ R+ 0 , b ∈ R0 =⇒ a + b ∈ R0 + + + und a ∈ R+ , b ∈ R+ =⇒ ab ∈ R+ (C) a ∈ R0 , b ∈ R0 =⇒ ab ∈ R0 Aus diesen einfachen Eigenschaften lassen sich alle weitere Regeln für das Rechnen mit der Ordnungsrelation herleiten. Wir beginnen mit einigen einfachen Überlegungen. Aus (A) mit a = 0 folgt + 0 ≤ b ⇐⇒ b ∈ R+ 0 und 0 < b ⇐⇒ b ∈ R Aus (A) mit b = 0 folgt + a ≤ 0 ⇐⇒ −a ∈ R+ 0 und a < 0 ⇐⇒ −a ∈ R Aus (C) mit a = b folgt a > 0 =⇒ a ∈ R+ =⇒ a2 = a · a > 0 und a < 0 =⇒ −a ∈ R+ =⇒ a2 = (−a) · (−a) > 0 Es gilt also a2 > 0 für alle a ̸= 0. Ist c > 0, dann gilt ( 1c )2 > 0. Beide sind in R+ . Aus (C) folgt c > 0 =⇒ 1c > 0 gezeigt. 1 c = c · ( 1c )2 > 0. Wir haben Satz 27. Seien a, b, c, d ∈ R. Dann gilt (1) a ≤ b ⇐⇒ a + c ≤ b + c (2) a ≤ b =⇒ ac ≤ bc, wenn c ≥ 0, und ac ≤ bc =⇒ a ≤ b, wenn c > 0 (3) a ≤ b =⇒ ac ≥ bc, wenn c ≤ 0, und ac ≥ cb =⇒ a ≤ b, wenn c < 0 (4) a ≤ b, b ≤ c =⇒ a ≤ c (5) a ≤ b, c ≤ d =⇒ a + c ≤ b + d (6) 0 ≤ a ≤ b, 0 ≤ c ≤ d =⇒ ac ≤ bd (7) a ≤ b ⇐⇒ a2 ≤ b2 , wenn a ≥ 0 und b ≥ 0 + Beweis. Es gilt a ≤ b ⇐⇒ b − a ∈ R+ 0 und a + c ≤ b + c ⇐⇒ b + c − (a + c) ∈ R0 nach (A). Wegen b − a = b + c − (a + c) ist damit bereits (1) gezeigt. + Wir zeigen (2). Gilt c ≥ 0, dann gilt auch c ∈ R+ 0 . Aus a ≤ b folgt b − a ∈ R0 wegen (A). + Wir erhalten (b − a)c = bc − ac ∈ R0 wegen (C) und daraus dann ac ≤ bc wieder wegen (A). Somit ist a ≤ b =⇒ ac ≤ bc für c ≥ 0 gezeigt. Gilt c > 0, dann gilt auch 1c > 0 und somit 1c ≥ 0. Aus der soeben gezeigten Implikation folgt dann ac ≤ bc =⇒ ac 1c ≤ bc 1c , das heißt ac ≤ bc =⇒ a ≤ b. Damit sind beide Implikationen in (2) gezeigt. Wir beweisen (3) mit Hilfe von (2). Gilt c ≤ 0, dann gilt auch −c ∈ R+ 0 . Wir erhalten a ≤ b =⇒ a(−c) ≤ b(−c) wegen (2) und a(−c) ≤ b(−c) =⇒ a(−c) + d ≤ b(−c) + d wegen (1). Setzt man das zusammen und d = ac + bc, dann hat man a ≤ b =⇒ bc ≤ ac. 34 3. RATIONALE UND REELLE ZAHLEN Gilt c < 0, dann gilt auch −c ∈ R+ . Es folgt a(−c) ≤ b(−c) =⇒ a ≤ b wegen (2) und a(−c) + d ≤ b(−c) + d =⇒ a(−c) ≤ b(−c) wegen (1). Setzt man das zusammen und d = ac + bc, dann hat man bc ≤ ac =⇒ a ≤ b. Damit sind beide Implikationen in (3) gezeigt. + + Es gilt a ≤ b, b ≤ c =⇒ b−a ∈ R+ 0 , c−b ∈ R0 =⇒ b−a+c−b = c−a ∈ R0 =⇒ a ≤ c, wobei wir zuerst (A), dann (B) und schließlich nochmals (A) anwenden. Damit ist (4) gezeigt. Aus (1) und (4) folgt a ≤ b, c ≤ d =⇒ a + c ≤ b + c, c + b ≤ d + b =⇒ a + c ≤ d + b. Das ist (5). Aus (2) und (4) folgt 0 ≤ a ≤ b, 0 ≤ c ≤ d =⇒ ac ≤ bc, cb ≤ db =⇒ ac ≤ db. Damit ist (6) bewiesen. Wir beweisen (7). Ist a = b = 0, dann gilt (7). Gilt a > 0 und b ≥ 0, dann folgt b + a ≥ 0 + a > 0. Gilt b > 0 und a ≥ 0, dann folgt a + b ≥ 0 + b > 0, beides aus (1). Sei c = b + a. Wegen c > 0 erhalten wir dann a ≤ b ⇐⇒ 0 ≤ b − a ⇐⇒ 0 · c ≤ (b − a)c ⇐⇒ 0 ≤ b2 − a2 ⇐⇒ b2 ≤ a2 mit Hilfe von (1) und (2). Damit ist (7) gezeigt. In Satz 27 sind einige Äquivalenzumformungen von Ungleichungen enthalten, die man verwendet, um Ungleichungen zu beweisen oder die Lösungsmenge einer Ungleichung zu suchen. Wir geben dazu Beispiele. Beispiel. Wir zeigen, dass das harmonische Mittel kleiner oder gleich dem arithmeti2xy schen Mittel ist, also x+y ≤ x+y für x, y > 0 gilt. Wir versuchen durch Äquivalenzumfor2 mungen eine Ungleichung zu erhalten, deren Richtigkeit klar ist: 2xy x+y ≤ 2xy ≤ | · (x + y) x+y 2 x2 +2xy+y 2 2 4xy ≤ x2 + 2xy + y 2 |·2 | − 4xy 0 ≤ x2 − 2xy + y 2 0 ≤ (x − y)2 Diese letzte Ungleichung ist richtig, da quadrierte Zahlen immer ≥ 0 sind. Da die erste Ungleichung dazu äquivalent ist, haben wir diese bewiesen. Eigentlich braucht man die Äquivalenz dieser Ungleichungen nicht. Es würde genügen, zu zeigen, dass aus jeder Ungleichung die darüberstehende folgt. 2x−3 Beispiel. Für welche x ∈ R gilt 3x+2 < 2. Wir unterscheiden zwei Fälle entsprechend dem Vorzeichen des Nenners. Erster Fall: Es gelte x > − 23 , woraus 3x + 2 > 0 folgt. Wir erhalten dann 2x−3 3x+2 < 2 ⇐⇒ 2x − 3 < 6x + 4 ⇐⇒ −7 < 4x ⇐⇒ − 47 < x Es gilt x > − 23 , daher auch x > − 47 . In diesem ersten Fall ist die Ungleichung immer erfüllt. Zweiter Fall: Es gelte x < − 23 , woraus 3x + 2 < 0 folgt. Wir erhalten dann 2x−3 3x+2 2x−3 3x+2 < 2 < 2 ⇐⇒ 2x − 3 > 6x + 4 ⇐⇒ −7 > 4x ⇐⇒ − 47 > x < 2 genau dann erfüllt, wenn x < − 74 gilt. Im zweiten Fall ist die Ungleichung 2x−3 3x+2 Die Lösungsmenge dieser Ungleichung erhalten wir, indem wir die Lösungen in den beiden Fällen zusammenfassen: {x ∈ R : x < − 74 } ∪ {x ∈ R : x > − 23 }. Verwendet man Intervalle, dann ist das (−∞, − 47 ) ∪ (− 32 , ∞). 5. INDIREKTER BEWEIS 35 5. Indirekter Beweis Bei einem direkten Beweis wird eine Aussage B bewiesen unter Verwendung bekannter oder vorausgesetzter Aussagen. Beim indirekten Beweis geht man vom Gegenteil ¬ B der zu beweisenden Aussage B aus und leitet daraus einen Widerspruch her. Damit ist gezeigt, dass ¬ B falsch ist. Es muss also B gelten. Die Aussage B ist bewiesen. Es folgen einige indirekte Beweise. Satz 28. Es gibt unendlich viele Primzahlen. Beweis. Wir nehmen das Gegenteil der zu beweisenden Aussage an: Es gibt nur endlich viele Primzahlen. Diese seien p1 , p2 , p3 , . . . , pn . Wir bilden die Zahl a = p1 · p2 · p3 · . . . · pn + 1. Es existiert eine Primzahl p, die a teilt. Wäre p eine der Primzahlen p1 , p2 , p3 , . . . , pn , dann würde p die Zahl a − p1 · p2 · p3 · . . . · pn teilen. Diese Zahl ist aber 1 und somit nicht durch p teilbar. Wir haben eine Primzahl p gefunden, die unter den Primzahlen p1 , p2 , p3 , . . . , pn nicht vorkommt. Wir haben einen Widerspruch erhalten zur Annahme, dass p1 , p2 , p3 , . . . , pn alle Primzahlen sind. Die Aussage, es gibt nur endlich viele Primzahlen, ist falsch. Der Satz ist bewiesen. Satz 29. Die Menge aller positiven Dezimalzahlen, die kleiner als 1 sind, ist nicht abzählbar. Beweis. Sei R die Menge aller positiven Dezimalzahlen, die kleiner als 1 sind. Wir nehmen das Gegenteil der zu beweisenden Aussage an: Die Menge R ist abzählbar. Wir können die Zahlen in der Menge R als Folge anordnen und mit x1 , x2 , x3 , . . . bezeichnen. Wir schreiben sie als Dezimalzahlen auf x1 = 0.a11 a12 a13 a14 a15 a16 . . . . . . x2 = 0.a21 a22 a23 a24 a25 a26 . . . . . . x3 = 0.a31 a32 a33 a34 a35 a36 . . . . . . x4 = 0.a41 a42 a43 a44 a45 a46 . . . . . . x5 = 0.a51 a52 a53 a54 a55 a56 . . . . . . ·················· Es ist sinnvoll, Doppelindices zu verwenden. Die Ziffer aij ist die j-te Dezimalstelle der i-ten Zahl. Wir zeigen, dass es eine positive Dezimalzahl gibt, die kleiner als 1 ist, aber nicht in R vorkommt. Für j ∈ N sei bj eine Ziffer ̸= ajj und ̸= 9, zum Beispiel bj = ajj − 1, wenn ajj > 0 ist, und bj = 1, wenn ajj = 0 ist. Sei x = 0.b1 b2 b3 b4 b5 b6 . . . . . . Es kann nicht sein, dass ab einer Stelle nur mehr die Ziffer 9 auftritt, wir haben sie ja überhaupt vermieden. Daher ist x eine reelle Zahl. Für alle j ∈ N gilt x ̸= xj , da sich diese beiden Zahlen wegen bj ̸= ajj in der j-ten Dezimalstelle unterscheiden. Somit kommt x nicht in R vor, sodass R nicht die Menge aller positiven Dezimalzahlen kleiner als 1 ist. Wir haben einen Widerspruch erhalten. Die Menge R kann nicht abzählbar sein. √ Satz 30. Die Gleichung x2 = 2 ist in Q nicht lösbar, das heißt 2 ist keine rationale Zahl. 36 3. RATIONALE UND REELLE ZAHLEN Beweis. Wir nehmen das Gegenteil der zu beweisenden Aussage an: Es gibt eine rationale Zahl x mit x2 = 2. Wir können x als gekürzten Bruch m schreiben. Es gilt m ∈ Z, n 2 2 2 n ∈ N und ggT (m, n) = 1. Wegen x = 2 erhalten wir m = 2n . Das Quadrat einer ungeraden Zahl ist ungerade, da (2u + 1)2 = 4u2 + 4u + 1 gilt. Da m2 gleich 2n2 und somit gerade ist, muss auch m eine gerade Zahl sein. Es gilt m = 2j für ein j ∈ Z. Es folgt m2 = 4j 2 und daher 4j 2 = 2n2 . Wir kürzen durch 2 und erhalten 2j 2 = n2 . Wir sehen, dass n2 eine gerade Zahl ist. Daher muss auch n eine gerade Zahl sein. Es gilt n = 2k für ein k ∈ N. Das ergibt ggT (m, n) = ggT (2j, 2k) ≥ 2. Wir haben einen Widerspruch zu ggT (m, n) = 1 erhalten. Die Aussage, dass eine rationale Zahl x existiert mit x2 = 2, ist falsch. Der Satz ist bewiesen. Satz 31. Sei a eine positve reelle Zahl. Dann existiert eine positive reelle Zahl b, für die b = a gilt. 2 Beweis. Wir gehen von den Quadratzahlen 0, 1, 4, 9, 16, . . . aus. Ist a eine dieser Zahlen, dann sind wir fertig. Ansonsten liegt a zwischen zwei dieser Zahlen. Die Wurzeln dieser Zahlen nennen wir u0 und v0 . Es gilt v0 = u0 + 1 und u20 < a < v02 . Wir bilden die Zahlen u20 , (u0 + 0.1)2 , (u0 + 0.2)2 , . . . , (u0 + 0.9)2 , v02 . Ist a eine dieser Zahlen, dann sind wir fertig. Ansonsten liegt a zwischen zwei dieser Zahlen. Die Wurzeln dieser Zahlen nennen wir u1 und v1 . Es gilt v1 = u1 + 0.1 und u21 < a < v12 . Wir bilden die Zahlen u21 , (u1 + 0.01)2 , (u1 + 0.02)2 , . . . , (u1 + 0.09)2 , v12 . Ist a eine dieser Zahlen, dann sind wir fertig. Ansonsten liegt a zwischen zwei dieser Zahlen. Die Wurzeln dieser Zahlen nennen wir u2 und v2 . Es gilt v2 = u2 + 0.01 und u22 < a < v22 . So tun wir immer weiter. Es gilt dann vk = uk + 101k und u2k < a < vk2 für alle k ≥ 0. Jede der Zahlen uk entsteht aus der vorhergehenden Zahl uk−1 durch Hinzufügen einer weiteren Dezimalstelle. Dadurch entsteht eine Dezimalzahl b. Es gilt uk ≤ b ≤ vk für alle k ≥ 0. Wir wählen r ∈ N so, dass 2v0 ≤ 10r gilt. Dann erhalten wir vk2 −u2k = (vk +uk )(vk −uk ) ≤ 1 2vk (vk − uk ) ≤ 2v0 (vk − uk ) ≤ 10r 101k = 10k−r für alle k ≥ 0. 2 Wir zeigen b = a durch einen indirekten Beweis. Wir nehmen an, dass b2 ̸= a gilt, das heißt b2 und a sind verschiedene Punkte auf der Zahlengerade. Es existiert eine Zahl m, sodass a und b2 Abstand > 101m haben. 2 2 2 Da u2m+r ≤ a ≤ vm+r und u2m+r ≤ b ≤ vm+r gelten, haben auch u2m+r und vm+r Abstand 1 1 1 1 2 2 2 2 > 10m , das heißt vm+r − um+r > 10m . Wegen 10m = 10m+r−r ≥ vm+r − um+r ergibt sich ein Widerspruch. Damit ist b2 = a gezeigt. 6. Komplexe Zahlen Rechnet man mit reellen Zahlen, dann hat man das Problem, dass nicht jedes Polynom eine Nullstelle hat. Das Polynom x2 + 1 hat zum Beispiel keine. Um dieses Problem zu beseitigen, führt man die komplexen Zahlen ein. Komplexe Zahlen kann man mit Polynomen ersten Grades vergleichen. Ein Polynom ersten Grades ist eine Funktion P (x) = a + bx in der Variablen x, wobei die Koeffizienten a und b reelle Zahlen sind. Polynome kann man addieren und multiplizieren. Ist Q(x) = c + dx ebenfalls ein Polynom ersten Grades, dann gilt P (x) + Q(x) = (a + c) + (b + d)x und P (x)Q(x) = ac + (ad + bc)x + bdx2 . Das Produkt ist bereits ein Polynom zweiten Grades. Um komplexe Zahlen zu erhalten, ersetzen wir die Variable x durch das Symbol i, für das wir die Konvention i2 = −1 einführen. Die Menge der komplexen Zahlen ist dann C = {a + bi : a ∈ R, b ∈ R} 6. KOMPLEXE ZAHLEN 37 Bezeichnet man die komplexe Zahl a + bi mit z, dann nennt man a den Realteil von z und b den Imaginärteil von z. Die Addition zweier komplexer Zahlen ist wie für Polynome definiert (a + bi) + (c + di) = a + c + (b + d)i Bei der Definition der Multiplikation verwenden wir die Konvention i2 = −1 (a + bi)(c + di) = ac + adi + bci + bdi2 = ac − bd + (ad + bc)i Zu jeder komplexen Zahl a + bi ̸= 0 existiert die inverse Zahl 1 a+bi = a−bi (a+bi)(a−bi) = a−bi a2 −abi+abi−b2 i2 = a−bi a2 +b2 = a a2 +b2 + −b i a2 +b2 1 die man erhält, indem man den Bruch a+bi mit a − bi erweitert. Man prüft leicht nach, dass die Addition und die Multiplikation komplexer Zahlen assoziativ und kommutativ sind und dass das Distributivgesetz gilt. Die komplexen Zahlen bilden einen Körper. Die Ordnung geht allerdings verloren. Satz 32. Aus jeder komplexen Zahl p + qi lässt sich √ die Wurzel ziehen. Ist die Zahl reell, √ das heißt q = 0, dann sind ± p im Fall p ≥ 0 und ± −p i im Fall p < 0 Wurzeln der Zahl √ √ p. Ist q ̸= 0, dann sind a+bi und −a−bi Wurzeln der Zahl p+qi, wobei a = p2 + 12 p2 + q 2 q und b = 2a zu setzen sind. √ √ Beweis. Ist q = 0 und p ≥ 0, dann sind ± p Wurzeln von p, da (± p)2 = p gilt. Ist √ √ q = 0 und p < 0, dann sind ± −p i Wurzeln, da (± −p i)2 = −p i2 = p gilt. Wir nehmen jetzt q ̸= 0 an und berechnen die Wurzel aus p + qi, das heißt wir lösen die Gleichung (a + bi)2 = p + qi. Es folgt a2 − b2 + 2abi = p + qi. Diese Gleichung gilt genau dann, wenn die auf den beiden Seiten der Gleichung stehenden komplexen Zahlen gleichen Real- und gleichen Imaginärteil haben. Es muss also a2 − b2 = p und 2ab = q gelten. Wir multiplizieren die erste Gleichung mit a2 und erhalten a4 − a2 b2 − pa2 = 0. Aus der 2 zweiten Gleichung folgt a2 b2 = q4 . Setzt man in die vorherige Gleichung ein, so erhält man √ 2 a4 − pa2 − q4 = 0. Als Lösungen ergeben sich a2 = p2 ± 21 p2 + q 2 . Da a eine reelle Zahl √ √ ist, muss a2 ≥ 0 gelten. Es kommt also nur a2 = p2 + 12 p2 + q 2 in Frage, da p < p2 + q 2 √ √ gilt. Wir erhalten die beiden Lösungen a = ± p2 + 21 p2 + q 2 . Die zugehörigen Werte für b q ergeben sich aus b = 2a . Beispiel. Um die Wurzel aus 3 + 4i zu ziehen, können wir die Gleichung a2 − b2 + 2abi = 3 + 4i, das heißt a2 − b2 √ = 3 und 2ab = 4, lösen oder in die Formeln aus Satz 32 einsetzen. 4 = 1. Die Wurzeln aus 3 + 4i Wir erhalten a2 = 32 + 12 9 + 16 = 4, also a = 2, und b = 2a sind daher 2 + i und −2 − i. Man kann ein viel stärkeres Resultat zeigen als Satz 32. Der Fundamentalsatz der Algebra besagt, dass jedes Polynom mit komplexen Koeffizienten eine Nullstelle in C besitzt. KAPITEL 4 Restklassen 1. Äquivalenzrelationen Um die Elemente einer Menge untereinander in Beziehung zu setzen, definiert man in der Mathematik den Begriff der Relation. Wir schicken dazu gleich ein anschauliches Beispiel voraus: in der Menge aller Menschen sei die Relation hat dieselbe Nationalität wie definiert. Offensichtlich stehen dann zwei Menschen in Relation zueinander, wenn sie, salopp gesprochen, Landsleute sind. Mathematisch ist der Begriff der Relation folgendermassen definiert: Definition. Seien X und Y Mengen. Eine Relation zwischen X und Y ist ein Tripel (X, Y, R) bestehend aus den Mengen X, Y und einer Teilmenge R ⊆ X × Y . Falls X = Y , so sprechen wir von einer Relation auf X. Für (x, y) ∈ R schreiben wir kurz xRy, was verdeutlicht, dass x genau dann in Relation steht mit y, wenn (x, y) in R liegt. In unserem Beispiel von vorher besteht R aus der Menge aller Paare von Menschen, die dieselbe Nationalität haben. Wir wollen nun ganz allgemein auf einige Eigenschaften eingehen, die bei Relationen auf einer Menge X häufig auftreten und daher mit speziellen Bezeichnungen versehen sind. Definition. Sei X eine Menge und R ⊆ X × X eine Relation auf X. R heisst 1) reflexiv :⇔ ∀x ∈ X : xRx, 2) symmetrisch :⇔ ∀x, y ∈ X : xRy ⇒ yRx, 3) transitiv :⇔ ∀x, y, z ∈ X : xRy ∧ yRz ⇒ xRz. Erfüllt eine Relation die Bedingungen 1),2),3) simultan, so heisst sie Äquivalenzrelation. Im Nationalitätenbeispiel scheint die Relation auf den ersten Blick reflexiv und symmetrisch zu sein, allerdings stimmt dies nur, wenn man annimmt, dass es keine staatenlosen Menschen gibt, denn wer keine Nationalität besitzt, hat auch nicht dieselbe Nationalität wie er selbst, im Widerspruch zu 1). Wie sieht es nun mit der Transitivität aus? Auch hier gibt es ungeahnte Probleme, nämlich mit Doppelstaatsbürgerschaften. Hat eine Person die Nationalitäten A und B, eine zweite die Nationalitäten B und C, eine dritte die Nationalitäten C und D, so steht die erste in Relation mit der zweiten, die zweite in Relation mit der Dritten, diese aber nicht in Relation mit der ersten. Nun aber zu Beispielen aud der Mathematik: Beispiel. Sei X die Menge aller Teilmengen von {1, 2, 3, 4}. Für zwei solche Teilmengen M und N gelte: (M, N ) ∈ R :⇔ |M | = |N |. Dann definiert R eine Äquivalenzrelation. Zwei Teilmengen von X sind also äquivalent, wenn sie gleich viele Elemente haben. Beispiel. Sei X = R und für reelle Zahlen x, y gelte xRy :⇔ x ≤ y, das heisst, R ist die Relation ≤. Diese Relation ist reflexiv und transitiv, aber definitiv nicht symmetrisch, also keine Äquivalenzrelation. Vielmehr gilt die zur Symmetrie fast entgegengesetzte Bedingung x ≤ y ∧ y ≤ x ⇒ x = y. 39 40 4. RESTKLASSEN Man nennt diese Eigenschaft Antisymmetrie und Relationen die 1),3) erfüllen und antisymmetrisch sind, heissen Ordnungsrelationen. Wir kehren aber wieder zum Spezialfall der Äquivalenzrelationen auf einer Menge X zurück und nennen die Relation ∼. Für jedes x ∈ X können wir die Menge aller Elemente aus X betrachten, die zu x in Relation stehen und bezeichnen diese Menge als Äquivalenzklasse des Elements x. Wir schreiben dafür: [x]( oder x̄) = {y ∈ X : x ∼ y}. Diese Äquivalenzklassen haben folgende Eigenschaften: sie sind stets nichtleer (jedes x ∈ X liegt in seiner eigenen Äquivalenzklasse), sie überdecken ganz X und je zwei Äquivalenzklassen sind entweder disjunkt oder ident. Sind nämlich [x] und [y] zwei Äquivalenzklassen, die z enthalten, so gilt x ∼ z sowie z ∼ y und die Transitivität impliziert, dass x ∼ y, also [x] = [y]. 2. Restklassen modulo m In diesem Abschnitt kommen wir zu einem Beispiel einer Äquivalenzrelation auf der Menge Z, das uns in Zukunft viele Rechnungen enorm vereinfachen wird. Dazu fixieren wir eine natürliche Zahl m ≥ 2 und erinnern uns an die Division mit Rest. Wir setzen zwei ganze Zahlen x und y in Relation, wenn ihr kleinster positiver Rest bei Division durch m derselbe ist, also wenn x = qm + r und y = q ′ m + r mit 0 ≤ r < m, schreiben dafür x≡y mod m und sagen: x ist kongruent zu y modulo m. Zunächst gilt es nachzuprüfen, dass es sich bei ≡ wirklich um eine Äquivalenzrelation handelt: dies ist allerdings aus der Definition offensichtlich. Anschliessend bestimmen wir die Äquivalenzklassen: die möglichen Reste bei Division durch m sind 0, 1, 2, . . . , m−1 und daher gibt es genau m Äquivalenzklassen, nämlich 0̄, 1̄, 2̄, . . . , m − 1, deren disjunkte Vereinigung ganz Z liefert. Man spricht in diesem Fall von Restklassen modulo m. Beispiel. Sei m = 7. Dann gilt etwa 0̄ = {. . . , −14, −7, 0, 7, 14, . . .} und 3̄ = {. . . , −11, −4, 3, 10, 17, . . .} Dies allein rechtferigt allerdings noch lange nicht die Bedeutung dieser Relation. Vielmehr ist es die Tatsache, dass ≡ auch mit den Verknüpfungen + und · auf Z verträglich ist, die ausschlaggebend ist. Es gilt nämlich für beliebige x, x′ , y, y ′ ∈ Z: x ≡ x′ mod m ∧ y ≡ y ′ mod m ⇒ x + y ≡ x′ + y ′ mod m sowie xy ≡ x′ y ′ mod m. Äquivalenzrelationen auf einem kommutativen Ring mit Eins, die derart mit den beiden Ringverknüpfungen verträglich sind, heissen Kongruenzrelationen, daher auch die obige Bezeichnung für die Relation ≡. Erst durch diese Eigenschaft wird es möglich, auf der Menge der Restklassen modulo m auch Operationen + und · zu definieren, die diese wiederum zu einem kommutativen Ring mit Eins machen, der mit Zm bezeichnet wird. Konkret sefiniert man die Addition bzw. Multiplikation zweier Restklassen x̄ und ȳ durch x̄ + ȳ := x + y, bzw. x̄ȳ := xy. Diese Definition liegt auf der Hand, allerdings gilt es nachzuprüfen, ob nicht vielleicht verschiedene Wahlen der Repräsentanten der einzelnen Restklassen zu verschiedenen Ergebnissen führen können, was die Definition sinnlos machen würde. 2. RESTKLASSEN MODULO m 41 Seien also x und x′ sowie y und y ′ jeweils in derselben Restklasse, also x̄ = x̄′ und ȳ = ȳ ′ . Dann ist laut Definition x̄ + ȳ = x + y einerseits und x̄ + ȳ = x̄′ + ȳ ′ = x′ + y ′ andererseits. Da aber ≡ eine Kongruenzrelation ist, gilt x+y ≡ x+y ′ ≡ x′ +y ′ mod m, sodass x + y = x′ + y ′ ist und die Definition von + ist unabhängig von der Wahl der Repräsentanten der Restklassen. Selbiges gilt auch für das Produkt, man sagt dann, die Operationen seien wohldefiniert auf der Menge Zm der Restklassen. Beispiel. Um die Kongruenz 3x ≡ 5 mod 7 zu lösen, multiplizieren wir sie auf beiden Seiten mit einer ganzen Zahl derart, dass der Koeffizient von x auf der linken Seite in der Restklasse 1̄ modulo 7 liegt und ersetzen ihn dann durch 1, was die Kongruenz nicht ändert. In diesem Fall ist 5 die richtige Wahl, denn 3 · 5 = 15 ≡ 1 mod 7 und die Kongruenz wird zu 15x ≡ 25 mod 7 oder einfacher x ≡ 4 mod 7. Die Menge der Lösungen ist also {. . . , −3, 4, 11, 18, . . .}, oder kürzer die Äquivalenzklasse 4̄ modulo 7. Beispiel. Löse auf ähnliche Art die Kongruenzen 5x + 3 ≡ 2 mod 11 und 6x + 4 ≡ 1 mod 12. Das letzte Beispiel zeigt, dass auch lineare Kongruenzen mitunter keine Lösungen besitzen müssen. Dieser Sache wollen wir nun näher auf den Grund gehen: Satz 33. Seien a, b ∈ Z und m ≥ 2 eine natürliche Zahl. Dann ist die Kongruenz ax ≡ b mod m genau dann lösbar, wenn ggT (a, m)|b. Beweis. ax ≡ b mod m ist äquivalent zu ax − b ≡ 0 mod m und dies ist genau dann lösbar, wenn ein x ∈ Z existiert, für das m ein Teiler von ax − b ist. Diese Bedingung ist gleichbedeutend mit ∃x ∈ Z∃y ∈ Z : ax − my = b. Damit haben wir das Problem auf die Lösbarkeit einer linearen Gleichung in zwei Variablen zurückgeführt. Wir wissen bereits, dass ax − my = ggT (a, m) stets lösbar ist und daraus folgt unmittelbar, dass die Gleichung auch für jedes Vielfache von d := ggT (a, m) eine Lösung besitzt, denn ist (x0 , y0 ) eine Lösung von ax − my = d, so ist (kx0 , ky0 ) eine von ax − my = kd. Umgekehrt muss jede ganze Zahl r, die als Linearkombination ax − my = r dargestellt werden kann, durch d teilbar sein, denn d|a, d|b, also teilt d die linke Seite der Gleichung und somit auch die rechte. Um einige der vielen Vorteile des Rechnens mit Restklassen zu illustrieren, untersuchen wir nun einige Teilbarkeitsregeln. Dazu schreiben wir positive ganze Zahlen n als n= ∞ ∑ ai 10i , i=0 sodass die ai gerade die Ziffern von n sind. (ab einer Stelle sind alle ai = 0, die Summe ist nur formal unendlich) So ist z.B. 364 = 4 · 1 + 6 · 10 + 3 · 100. Beispiel. n ist genau dann durch 2 bzw. 5 teilbar, wenn a0 es ist. Dies ist offensichtlich, denn da 2 und 5 Teiler von 10 sind, ist ∞ ∑ ai 10i ≡ a0 mod 2 bzw. mod 5. i=0 Beispiel. n ist genau dann durch 4 teilbar, wenn a0 + 10a1 es ist. Das folgt wie im vorigen Beispiel, da 100, 1000, usw. alle durch 4 teilbar sind. 42 4. RESTKLASSEN ∑ Beispiel. n ist genau dann durch 3 bzw. 9 teilbar, wenn ∞ i=0 ai es ist. In der Tat kann man wegen 10 ≡ 1 mod 3 bzw. mod 9 die Restklasse 10 durch die Restklasse 1̄ ersetzen und erhält ∞ ∞ ∑ ∑ i ai 10 ≡ ai 1i , i=0 i=0 was unmittelbar zum Ergebnis führt. ∑ i Beispiel. n ist genau dann durch 7 teilbar, wenn 3|i (−1) (100ai+2 + 10ai+1 + ai ) es ist. Dazu bemerken wir zunächst, dass 7|1001, d.h. 103 + 1 ≡ 0 mod 7 oder anders aufgeschrieben: 103 ≡ −1 mod 7. Daraus folgt aber für alle positiven ganzen k, dass 103k ≡ (−1)k mod 7. Nun unterteilen wir unsere Darstellung von n in Dreierblöcke und heben in jedem die grösstmögliche Zehnerpotenz heraus: ∞ ∑ ∑ ai 10i = 10i (100ai+2 + 10ai+1 + ai ). i=0 3|i Der Vorteil davon ist, dass alle Indizes i in der letzteren Darstellung durch 3 teilbar sind und wir daher aufgrund unserer obigen Überlegung 10i durch (−1)i ersetzen können. Um zu untersuchen, ob 4739902737849588995 durch 7 teilbar ist, genügt es also zu überprüfen, ob 995 − 588 + 849 − 737 + 902 − 739 + 4 = 686 durch 7 teilbar ist. Ja! Auf ähnliche Art und Weise kann man auch Teilbarkeitsregeln durch 11,13, etc. aufstellen. Bleibt noch die Frage zu beantworten, warum wir etwa keine Regel für die Teilbarkeit duch 6 aufgestellt haben. Ganz einfach: eine Zahl ist genau dann durch 6 teilbar, wenn sie durch 2 und durch 3 teilbar ist und für die beiden haben wir schon Regeln! Zum Abschluss diese Abschnitts wollen wir nun nochmals die algebraische Sichtweise in den Vordergrund rücken und den Ring der Restklassen (Zm , +, ·) näher untersuchen. Insbesondere wollen wir die Multiplikation unter die Lupe nehmen und beginnen dazu mit einem Beispiel: Beispiel. Sei m = 10. Dann gilt 1̄ · 1̄ = 1̄, 3̄ · 7̄ = 1̄ und 9̄ · 9̄ = 1̄. Also haben 1̄, 3̄, 7̄ und 9̄ sogar multiplikative Inverse, 0̄, 2̄, 4̄, 5̄, 6̄, 8̄ hingegen nicht. Wenn man das Beispiel näher analysiert, stellt sich heraus, dass abgesehen von 0̄, welches das neutrale Element bez. der Adddition ist, genau diejenigen Restklassen invertierbar sind, deren Repräsentanten zum Modul (im Beispiel 10) teilerfremd sind. Damit liegt die Behauptung nahe, dass (Zm , +, ·) sogar ein Körper ist, falls alle Restklasse ausser 0̄ zu m teilerfremde Repräsentanten besitzen. Diese Eigenschaft hängt nicht von der speziellen Wahl der Repräsentanten ab (nachrechnen!) und ist genau dann erfüllt, wenn m eine Primzahl ist. Wir erhalten daher: Satz 34. (Zm , +, ·) ist genau dann ein Körper, wenn m ∈ P. Beweis. Sei zunächst m keine Primzahl. Dann gibt es eine Darstellung m = ab in der a und b echte Teiler von m sind, sodass āb̄ = m̄ = 0̄ und ā sowie b̄ können kein multiplikatives Inverses besitzen. Wäre nämlich āx̄ = 1̄, so folgte durch Multiplikation mit b̄ unmittelbar b̄ = 0̄, was nicht sein kann. Ist umgekehrt m prim, so müssen wir zu beliebigem ā ̸= 0̄ ein Inverses finden. wegen ggT (a, m) = 1 existieren ganzu x, y mit ax + my = 1, oder anders ausgedrückt: ax = 1 − my. Damit ist aber āx̄ = 1̄ und x̄ ist das gesuchte Inverse zu ā. KAPITEL 5 Polynome 1. Der Ring der Polynome Der Begriff eines Polynoms ist vielen schon aus der Schule bekannt, ebenso wie die Bezeichnungen Grad eines Polynoms oder führender Koeffizient eines Polynoms. Salopp gesagt sind Polynome Ausdrücke P der Gestalt P (X) = n ∑ pi X i , i=0 wobei die sogenannten Koeffizienten pi in einem vorgegebenen Körper K (oder auch Ring R) liegen und X eine sogenannte Unbestimmte ist, für die man beliebige Werte aus einem Körper (oder Ring) einsetzen darf, der den Bereich, aus dem die Koeffizienten sind, enthalten muss, damit alle Summen und Produkte in obigem Ausdruck ausführbar sind. Das grösste i mit pi ̸= 0 heisst dann der Grad von P und der zugehörige Koeffizient der führende Koeffizient von P . Man sagt auch, P sei ein Polynom über K (bzw. über R), um anzudeuten, dass alle Koeffizienten aus K bzw. R sind. So weit so gut, aber was genau ist nun eine Unbestimmte? Und warum kann ich ein Polynom P nur definieren durch P (X), also durch seine Auswertung an der Stelle X. Wer sich diese Fragen stellt oder zumindest ihre Sinnhaftigkeit erkennt, hat in diesem Kapitel schon viel gelernt! Wir werden künftig zwischen Polynomen P und den zugeordneten Polynomfunktionen P (X) unterscheiden und brauchen daher eine alternative Methode, Polynome einzuführen. Wir werden dazu einen naiven Zugang wählen, der mit wenig Aufwand ganz exakt zur abstrakten Definition von Polynomen gemacht werden könnte. Dazu wählen wir einen Ring R und betrachten alle Folgen endlicher Länge deren Folgenglieder sämtlich aus R sind. Für R = Z wären z.B. (1, 0, −3) oder (4, −1, 0, 0, 6, −2, 5) zwei solche Folgen. Der Hintergedanke dabei ist, Polynome durch ihre Koeffizientenvektoren zu definieren, unabhängig von den Werten, die sie liefern bei Auswertung an verschiedenen Stellen. Dazu müssen wir allerdings auf der Menge aller solcher Folgen eine Addition und eine Multiplikation definieren, die mit unserer üblichen Definition von Polynomen übereinstimmt. Für die Addition liegt dies auf der Hand, im Falle m < n setzen wir: (a0 , a1 , . . . , am ) + (b0 , b1 , . . . , bn ) := (a0 + b0 , a2 + b2 , . . . , am + bm , bm+1 , . . . , bn ) indem wir einfach die kürzere der beiden Folgen durch Nullen ergänzen, bis die Länge der anderen erreicht ist. Für die Multiplikation verknüpfen wir die Koeffizienten so wie beim Zusammenfassen gleicher Potenzen von X beim Ausmultiplizieren der Summen ( m ∑ i=0 n ∑ ai X )( bj X j ) = (a0 + a1 X + a2 X 2 + . . . + am X m )(b0 + b1 X + . . . + bn X n ) i j=0 = a0 b0 + a0 b1 X + . . . + a0 bn X n + a1 b0 X + . . . + a1 bn X n+1 + . . . +an b0 X m + . . . + am bn X m+n = a0 b0 + (a0 b1 + a1 b0 )X + (a0 b2 + a1 b1 + a2 b0 )X 2 + . . . + am bm X m+n . 43 44 5. POLYNOME Vergisst man bei dieser Multiplikation die Unbestimmte X, so kann man formal (a0 , a1 , . . . , am ) ⋆ (b0 , b1 , . . . , bn ) := (a0 b0 , a0 b1 + a1 b0 , a0 b2 + a1 b1 + a2 b0 , . . . , am bm ) definieren. Man nennt dieses Produkt das Faltungsprodukt der beiden Folgen. Die i-te Komponente in der entstehenden Folge ist dann ∑ ak b l , ai b0 + ai−1 b1 + ai−2 b2 + . . . + a0 bi = k+l=i wobei i die Werte 0, 1, . . . , m + n annehmen kann. Beispiel. Bilde das Faltungsprodukt der beiden Folgen (1, 0, −3) und (4, −1, 0, 0, 6, −2, 5). Vergleiche das Ergebnis mit den Koeffizienten des Polynoms (−3X 2 + 1)(5X 6 − 2X 5 + 6X 4 − X + 4). An dieser Stelle sei ohne Beweis angemerkt, dass die Faltung kommutativ ist, d.h. P ⋆Q = Q⋆P , das Assoziativgesetz erfüllt, d.h. (P ⋆Q)⋆R = P ⋆(Q⋆R) und auch distributiv bezüglich der Addition von endlichen Folgen ist. Das neutrale Element bez. der Addition ist (0), bez. der Faltung ist (1) neutral, somit bildet die Menge der endlichen Folgen zusammen mit diesen beiden Verknüpfungen einen Ring Eine besondere Rolle spielt in diesem Zusammenhang die Folge (0, 1). Man rechnet leicht nach, dass (0, 1) ⋆ (0, 1) = (0, 0, 1), (0, 1) ⋆ (0, 1) ⋆ (0, 1) = (0, 0, 0, 1) usw. Schreibt man (0, 1)n für (0, 1) ⋆ (0, 1) ⋆ · · · ⋆ (0, 1), so kann man die Folge (p0 , p1 , . . . , pn ) auch als p0 + p1 ⋆ (0, 1) + p2 ⋆ (0, 1)2 + . . . + pn ⋆ (0, 1)n schreiben. Ersetzt man nun noch (0, 1) durch X, so erhält man den altbekannten Ausdruck für Polynome, der denselben Rechenregeln genügt und gänzlich ohne Verwendung von Unbestimmten und daher ohne die zugeordnete Polynomfunktion eingeführt wurde. Definition. Der Ring aller endlichen Folgen mit Folgengliedern aus dem Koeffizientenring R zusammen mit der Addition + und der Faltung ⋆ heisst Polynomring über R. Seine Elemente heissen Polynome und können alle in der Form P = p0 + p1 ⋆ (0, 1) + p2 ⋆ (0, 1)2 + . . . + pn ⋆ (0, 1)n für geeignetes n ∈ N geschrieben werden. Schreibt man für das Polynom (0, 1) einfach X und schreibt man die Faltung als Multiplikation, so erhält man P = n ∑ pi X i i=0 und der Polynomring wird mit R[X] bezeichnet. p0 heisst der konstante Koeffizient, pn ̸= 0 der führende Koeffizient und n =: deg P der Grad des Polynoms P . Falls alle pi = 0, also P das Nullpolynom ist, so setzt man deg P := −∞. Von nun an wollen wir die abstrakte Einführung des Konzepts der Polynome beiseite lassen und im nächsten Abschnitt grundlegende Aussagen über Polynome herleiten, deren Koeffizienten in einem Körper liegen. 2. Polynome über Körpern In diesem Abschnitt bezeichne K stets einen Körper. Typische Beispiele für die Wahl von K sind R, C, Zp für Primzahlen p. 2. POLYNOME ÜBER KÖRPERN 45 Satz 35. Die Abbildung deg : K[X] → N ∪ {−∞} hat die Eigenschaften 1) deg(P Q) = deg P + deg Q, 2) deg(P + Q) ≤ max{deg P, deg Q}. ∑ ∑n i j Beweis. Sei P = m i=0 ai X und Q = j=0 bj X mit am bn ̸= 0, also deg P = m, deg Q = n. Dann gilt ∑ ∑ PQ = ( ai bj )X i+j , k i+j=k wobei der grösstmögliche Wert von k = i + j gerade m + n ist, und wegen am bn ̸= 0 ist m + n der Grad von P Q. Es ist ∑ P +Q= (ak + bk )X k , k wobei ak = 0 falls k ≥ m und bk = 0 falls f ≥ n. Daher ist der grösstmögliche Wert von k gerade max{m, n}. Um Polynome näher zu untersuchen, ist es oft günstig sie an bestimmten Stellen eines geeigneten Definitionsbereichs auszuwerten. Dieser Definitionsbereich muss jedenfalls K enthalten, wir werden hier gleich K selbst wählen. Man definiert daher die sogenannte Evaluationsabbildung eva : K → K, P 7→ P (a), die jedem Polynom aus K[X] seinen Wert an der Stelle a zuordnet. Durch Auswerten eines Polynoms P an allen a ∈ K erhalten wir eine Funktion fP : K → K, a 7→eva (P ), die P zugeordnete Polynomfunktion. An dieser Stelle sind wir nun klar, warum wir im ersten Abschnitt diese Kapitels mit soviel Mühe Polynome unabhängig von ihren Werten bei Evaluation an gewissen Stellen definiert haben. Dazu betrachten wir folgendes Beispiel. Sei K = Z5 und P = X 5 + X, Q = 2X. Ohne Zweifel sind P und Q zwei verschiedene Polynome (sie haben ja nicht einmal denselben Grad!). Wenn man allerdings P an den Restklassen 0̄, 1̄, 2̄, 3̄, 4̄ auswertet, so erhält man die Werte 0̄, 2̄, 4̄, 1̄, 3̄, also genau dieselben, die sich auch bei Auswertung von Q an diesen Stellen ergeben. Das heisst, dass beide Polynome dieselbe zugeordnete Polynomfunktion besitzen! Mit Hilfe der eben vorgestellten Evaluationsabbildung ist nun die Definition des Begriffs Nullstelle eines Polynoms möglich. Definition. Das Polynom P ∈ K[X] hat eine Nullstelle in a ∈ K genau dann, wenn P im Kern von eva liegt. Um diejenigen Polynome zu charakterisieren, die eine Nullstelle in a besitzen, also kern(eva ) zu bestimmen, wollen wir nun die Division mit Rest für Polynome einführen. Satz 36. Seien f, g zwei Polynome aus K[X]. Dann existieren eindeutig bestimmte Polynome q, r ∈ K[X] mit deg r < deg f oder r = 0, sodass g = qf + r. Beweis. Ist g = 0 oder deg g < deg f , so wähle q := 0 und r := g, also q = 0 · f + g. Wir führen einen Beweis durch Induktion nach n := deg g. Ist n = 0, so ist g = c mit c ∈ K \ {0} und daher ist q = c(c−1 f ) + 0 die gesuchte Darstellung. Angenommen, die Aussage sei für Polynome g vom Grad < n bereits bewiesen. Wir setzen: f = am X m + am−1 X m−1 + . . . + a0 , g = bn X n + bn−1 X n−1 + . . . + b0 , 46 5. POLYNOME wobei m ≤ n. Betrachte n−m g1 := g − bn a−1 f m X n n−1 n−m = (bn X + bn−1 X + . . . + b0 ) − bn a−1 (am X m + am−1 X m−1 + . . . + a0 ) m X n−1 + .... = 0 · X n + (bn−1 a−1 n an−1 )X Also ist g1 = 0 oder deg g1 < n, sodass nach Induktionsvoraussetzung Polynome q1 und r mit r = 0 oder deg r < deg f existieren mit g1 = q1 f + r. Dann gilt n−m n−m )f + r, f = (q1 + bn a−1 g = g1 + −bn a−1 m X m X was zu zeigen war. Nun zur Eindeutigkeit. Sei g = q1 f + r1 eine weitere Darstellung von g, bei der q1 und r1 den geforderten Bedingungen genügen. Dann ist r − r1 = (q1 − q)f . Falls q1 − q ̸= 0, so ist auch (q1 − q)f ̸= 0 und es gilt: deg((q1 − q)f ) = deg(q1 − q) + deg(f ). Es folgte deg(r − r1 ) ≥ deg(f ), ein Widerspruch. Also ist q1 = q und daher auch r1 = r. Mit Hilfe der Division mit Rest können wir nun zeigen, dass die Polynome, die eine Nullstelle in a besitzen, also den Kern von eva bilden, genau diejenigen sind, die das Polynom (X − a) als Faktor besitzen. Satz 37. Sei f ∈ K[X]. Dann gilt: f (a) = 0 ⇔ f (X) = (X − a)g(X) für ein g ∈ K[X]. Beweis. Wir wenden die Division mit Rest auf die Polynome f und X − a an und erhalten f (X) = (X − a)q(X) + r(X) mit q, r ∈ K[X] und deg r < deg(X − a) = 1 oder r = 0. Also ist r eine Konstante, d.h. r(X) = c und wir erhalten f (X) = (X − a)q(X) + b. Setzt man nun a für X ein (d.h. man wendet eva an), so folgt 0 = f (a) = b und b muss selbst Null sein. Also ist f (X) = (X − a)q(X), wie behauptet. Die Umkehrung folgt aus f (a) = (a − a)g(a) = 0. Ganz wesentlich haben wir für dieses Ergebnis die Tatsache verwendet, dass jeder Körper K kommutativ ist. Betrachtet man nämlich das Polynom P (X) = X 2 + (a − b)X − ab über einem nicht kommutativen Ring R in dem ab ̸= ba, so ist P (b) = 0, aber P kann nicht als Produkt von (X − b) mit einem weiteren linearen Faktor geschrieben werden. (Nachprüfen!) Wenn man den Beweis des Satzes von der Division mit Rest genauer untersucht, fällt einem ausserdem auf, dass die Existenz einer Gradfunktion deg und deren Eigenschaften die Induktion überhaupt erst möglich machen. Damit eröffnet sich eine Analogie zu den ganzen Zahlen, wo die Möglichkeit einer Division mit Rest ganz einfach auf den Eigenschaften der Betragsfunktion |.| beruht. In beiden Situationen wird damit die Grundlage gelegt, um in Z resp. in K[X] Zahlentheorie betreiben zu können. Ganz analog zu Z kann man nun auch in K[X] den Euklidischen Algorithmus einführen und mit dessen Hilfe den Begriff des grössten gemeinsamen Teilers zweier Polynome definieren. Beispiel. Bestimme ggT (X 5 +X 2 −X +1, X 4 −X 3 +2X 2 −X +1) in R[X]. Anwendung des Euklidischen Algorithmus, d.h. wechselweises Dividieren mit Rest, liefert: X 5 + X 2 − X + 1 = (X + 1)(X 4 − X 3 + 2X 2 − X + 1) − (X 3 + X), X 4 − X 3 + 2X 2 − X + 1 = (X − 2)(X 3 + X) + (X 2 + 1), 3. ZERLEGUNG VON POLYNOMEN 47 X 3 + X = X(X 2 + 1) + 0, also ist der letzte von Null verschiedene Rest, nämlich X 2 +1 der gesuchte grösste gemeinsame Teiler. 3. Zerlegung von Polynomen Um in K[X] noch weiter Zahlentheorie betreiben zu können, benötigen wir ein Analogon zu den Primzahlen in Z. Wenn wir uns an die Definition der Primzahlen dort erinnern, so waren das jene positiven ganzen Zahlen, die keine echte Zerlegung besitzen. Sie bilden bezüglich der Multiplikation die elementarsten Bausteine der ganzen Zahlen. Dies führt im Bereich der Polynome auf Definition. Ein Polynom 0 ̸= f ∈ K[X] heisst irreduzibel, falls aus f (X) = g(X)h(X) mit g, h ∈ K[X] folgt, deg g = deg f oder deg h = deg f . Unter einer echten Zerlegung eines Polynoms versteht man also eine in Faktoren von echt kleinerem Grad. Beispiel. Sei wieder K = R. Eine √ Zerlegung√in irreduzible Faktoren von X 5 − X 4 − X 3 + X 2 − 2X + 2 lautet (X − 1)(X − 2)(X + 2)(X 2 + 1). Es fällt auf, dass man z. B. auch (2X 2 + 2) als letzten Faktor wählen hätte können und noch mit 1/2 multiplizieren. Dies liegt daran, dass alle Körperelemente ausser 0 invertierbar sind, dies entspricht der Eindeutigkeit der Primfaktorzerlegung bis aufs Vorzeichen, denn auch −1 ist in den ganzen Zahlen invertierbar. Man kann zeigen, dass abgesehen von der Multiplikation mit Körperelementen ungleich Null und der Reihenfolge die Zerlegung jedes Polynoms aus K[X] in irreduzible Faktoren eindeutig ist. Damit ist die Analogie zur Primfaktorzerlegung in Z perfekt und weiteren Anwendungen der Methoden aus der Zahlentheorie Tür und Tor geöffnet. Eine wichtige Bemerkung ist, dass die Zerlegung in irreduzible Faktoren eines Polynoms sehr von dem Körper abhängt, über dem wir das Polynom betrachten. Man könnte etwa das Polynom aus dem vorhergehenden Beispiel auch als Polynom über Q resp. als Polynom über 2 2 C betrachten. Die √ Zerlegung √ in irreduzible Elemente würde dann (X − 1)(X − 2)(X + 1) resp. (X − 1)(X − 2)(X + 2)(X − i)(X + i) lauten. Es fällt auf, dass in letzterer Zerlegung alle Faktoren Grad 1 besitzen. Dies ist nicht nur zufällig für das gewählte Polynom der Fall, sondern gilt für alle Polynome aus C[X]. Das heisst, dass in C[X] die irreduziblen Polynome Grad 1 haben und (bis auf Multiplikation mit Konstanten) genau die Polynome der Gestalt (X − a) (a ∈ C) sind. Dies folgt aus dem sog. Fundamentalsatz der Algebra, der besagt, dass jedes komplexe Polynom vom Grad ≥ 1 mindestens eine Nullstelle besitzt. Da man diese dann laut obigem Satz abspalten kann, ist somit kein Polynom vom Grad > 1 irreduzibel. Halten wir insbesondere fest: hat ein Polynom aus K[X] eine Nullstelle in K, so kann es nicht irreduzibel sein. Die Umkehrung dieser Tatsache ist im Allgemeinen FALSCH ! Beispiel. X 4 + 3X 2 + 2 ∈ R[X] besitzt offensichtlich keine reelle Nullstelle (warum?), kann aber in (X 2 + 1)(X 2 + 2) zerlegt werden. X 2 + X + 1 besitzt ebenfalls keine reelle Nullstelle, da die Diskriminante der quadratischen Gleichung X 2 + X + 1 = 0 negativ ist. Über dem Körper Z3 ist aber die Restklasse 1̄ eine Nullstelle, wie man leicht nachrechnet und es ergibt sich X 2 +X +1 = (X −1)2 als Zerlegung. Allgemein gibt es für das Zerlegen von Polynomen aus K[X], bzw. das Nachweisen der Unzerlegbarkeit, keine universelle Methode, die in allen Körpern K funktioniert, sodass man für spezielle Polynome im Einzelfall entscheiden muss, wie man vorgeht. Hier dennoch eine kleine Hilfe, wenn der Grad der Polynome klein ist. 48 5. POLYNOME Satz 38. Sei f ∈ K[X] ein Polynom mit deg(f ) ∈ {2, 3}. Dann ist f genau dann reduzibel, wenn f eine Nullstelle besitzt. Beweis. Wir müssen nur noch zeigen, dass aus der Tatsache, dass f reduzibel ist, die Existenz einer Nullstelle folgt. Nun tritt aber in jeder echten Zerlegung eines Polynoms vom Grad 2 oder 3 sicher mindestens ein Faktor vom Grad 1 auf. Setzt man diesen gleich Null, so erhält man die gesuchte Nullstelle. Diese Beweismethode funktioniert schon ab Grad 4 nicht mehr, denn da könnten zwei Faktoren vom Grad 2 in der Zerlegung auftreten, ein solches Beispiel hatten wir ja bereits. Weit mehr kann man aussagen, wenn man den Körper spezifiziert. In C[X] etwa ist, wie bereits erwähnt, jedes Polynom in ein Produkt von Linearfaktoren zerlegbar. Nicht viel komplizierter ist die Situation in R[X]. Satz 39. Sei f ein Polynom mit reellen Koeffizienten. Dann ist f in ein Produkt von Faktoren vom Grad höchstens zwei zerlegbar. Alle Faktoren vom Grad 2 in der Zerlegung haben negative Diskriminante. Beweis. Da R ein Teilkörper von C ist, können wir F auch als Polynom in C[X] auffassen. Als solches kann f in ein Produkt von Linearfaktoren zerlegt werden, wobei einige dieser Linearfaktoren in R[X] liegen können, andere womöglich nicht reelle Koeffizienten haben, sodass diese nicht für die Zerlegung in R[X] verwendet werden können. Allerdings werden wir gleich zeigen, dass letztere immer paarweise auftreten, und durch Multiplikation mit einem jeweils geeigneten zweiten Faktor ein quadratisches Polynom aus R[X] entsteht. Dazu betrachten wir irgendeine nichtreelle Nullstelle c von f (hat f nur reelle Nullstellen, so ist die obige Zerlegung in R[X] und wir sind fertig). Dann ist evc (f ) = f (c) = 0 und durch komplex Konjugieren erhalten wir f (c) = 0̄ = 0. Da f selbst nur reelle Koeffizienten besitzt, gilt f (c) = f (c̄) = 0 (überlege diesen Schritt ausführlich!) und wir haben somit gezeigt, dass mit jeder nichtreellen Nullstelle c := a + bi von f auch c̄ = a − bi Nullstelle von f ist. Daher ist mit jedem Faktor (X − c) von f auch (X − c̄) unter den Faktoren und deren Produkt (X − c)(X − c̄) = X 2 − 2aX + (a2 + b2 ) hat reelle Koeffizienten und Diskriminante −4b2 < 0, da nach Voraussetzung b ̸= 0 ist. Beispiel. Finde die Zerlegung des Polynoms f (X) = X 4 + 1 über R. Dazu zerlegen wir f zunächst über C, wofür wir die Nullstellen von X 4 + 1 = 0 in C finden müssen. Die Substitution Y := X 2 führt auf die Gleichung Y 2 + 1 = 0, deren Lösungen i, −i sind. Also sind die jeweils zwei Lösungen von X 2 = i resp. X 2 = −i die gesuchten vier Nullstellen von f , die die Zerlegung in Linearfaktoren über C liefern. Durch Koeffizientenvergleich in (a + bi)2 = ±i√mit a, b√∈ R erhält a2 − b2 = 0 und √ man √ 2ab = ±1, woraus a = ±b und weiter (a, b) ∈ {( 2/2, ± 2/2), (− 2/2, ± 2/2)} folgt. Die reelle Zerlegung erält man durch Multiplizieren der Linearfaktoren √ √ √ √ √ (X − 2/2 − 2/2i)(X − 2/2 + 2/2i) = X 2 − 2X + 1 und √ √ √ √ √ (X + 2/2 − 2/2i)(X + 2/2 + 2/2i) = X 2 + 2X + 1. Die reelle Zerlegung lautet also √ √ X 4 + 1 = (X 2 − 2X + 1)(X 2 + 2X + 1).