Elementare Zahlentheorie Vorlesung von Prof. Dr. W. Kohnen Universität Heidelberg Mitschrieb von Chris Kowall im Sommersemester 2012 Inhaltsverzeichnis 1 Einleitung 2 Teilbarkeitslehre 2.1 Der Fundamentalsatz der Arithmetik 2.2 Ideale von Z . . . . . . . . . . . . . . 2.3 Zahlentheoretische Funktionen . . . . 2.4 Primzahlsatz und Primzahlen . . . . 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 . 3 . 10 . 13 . 18 3 Kongruenzen und Restklassen 3.1 Einführung . . . . . . . . . . . . . . . . . . . . . 3.2 Polynomiale Kongruenzen modulo einer Primzahl 3.3 Simultane Kongruenzen . . . . . . . . . . . . . . 3.4 Primitivwurzeln . . . . . . . . . . . . . . . . . . . 3.5 Darstellung als Summe von Quadraten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 27 33 38 44 49 . . . . . 53 53 56 60 63 69 . . . . . . . . . . . . . . . . . . . . . . . . 4 Quadratische Reste 4.1 Das Legendre-Symbol . . . . . . . . . . . . . . . . . . . . . . . . . 4.2 Das Jacobi-Symbol . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.3 Das Quadratische Reziprozitätsgesetz . . . . . . . . . . . . . . . . . 4.4 Ein zweiter Beweis des Quadratischen Reziprozitätsgesetzes . . . . 4.5 Theoretische Anwendungen des Quadratischen Reziprozitätsgesetzes . . . . . . . . . . . . . . . 5 Ganzzahlige binäre quadratische Formen 73 5.1 Klassen binärer quadratischer Formen . . . . . . . . . . . . . . . . . . . . 73 5.2 Automorphismen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81 5.3 Darstellungsanzahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89 6 Approximation reeller Zahlen durch rationale Zahlen 6.1 Der Dirichletsche Approximationssatz . . . . . . . . 6.2 Der Kroneckersche Approximationssatz . . . . . . . 6.3 Der Liouvillesche Approximationssatz . . . . . . . . 6.4 Die Transzendenz der Eulerschen Zahl . . . . . . . Literaturverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99 99 102 104 108 113 i Das vorliegende Skript ist eine überarbeitete und ausgearbeitete Version der Vorlesungsmitschrift von Katja Roos [3] aus dem Sommersemester 2004 bei Prof. Dr. W. Kohnen. Mithilfe von eigenen Mitschrieben aus der gleichen Vorlesung im Sommersemester 2012 wurde das Skript im Frühjahr 2016 mit einigen Ergänzungen erstellt. ii 1 Einleitung Die Zahlentheorie befasst sich mit dem Studium der natürlichen Zahlen N = {1, 2, 3, . . . } oder allgemeiner der ganzen Zahlen Z und deren gegenseitigen Wechselbeziehungen und Eigenschaften wie Teilbarkeit und Darstellung durch Primelemente sowie dem Lösen von ganzzahligen Gleichungen. Man unterscheidet dabei elementare Zahlentheorie, wobei für die Beweise der Sätze elementare Methoden aus der Analysis und Linearer Algebra verwendet werden, und nichtelementare Zahlentheorie, welche Methoden der höheren Algebra, algebraischen Geometrie und Funktionentheorie benutzt. In der Zahlentheorie lassen sich viele Probleme oft einfach finden und formulieren, während deren Lösung sehr raffinierte Überlegungen und auch tiefliegende Theorien aus dem Bereich der Algebra, Geometrie oder Funktionentheorie erfordert. Dabei haben solche Probleme und deren Lösungen in der Regel keine direkte Anwendung innerhalb sowie außerhalb der Mathematik. Dennoch sind die Methoden und Theorien, die zur Lösung entwickelt wurden und werden, von großer Bedeutung, um analoge Schlüsse in anderen Disziplinen zu vollziehen. Einige dieser Probleme seien im Folgenden als Motivation vorgestellt. Pythagoräische Zahlen Der Satz des Pythagoras besagt, dass ein Dreieck genau dann rechtwinklig ist, wenn das Quadrat der Hypothenuse mit der Summe der Kathetenquadrate übereinstimmt. Zur geometrischen Konstruktion rechtwinkliger Dreiecke sind nun Zahlentripel (x, y, z) ∈ N3 gesucht mit x2 + y 2 = z 2 , sogenannte Pythagoräische Zahlen. Es lässt sich zeigen, dass alle Lösungen bis auf Vertauschung in der Gestalt x = t(a2 − b2 ), y = 2tab und z = t(a2 + b2 ) mit t, a, b ∈ N, wobei a > b teilerfremd seien mit a + b ungerade, vorliegen. Offensichtlich ist dabei ein Vielfaches eines pythagoräischen Zahlentripels wieder ein solches. Eine Verallgemeinerung dieser einfachen Gleichung ist das folgende Problem. Großer Fermatscher Satz Bereits 1637 vermutete Fermat, dass es für alle n ∈ N, n ≥ 3, keine Lösungen (x, y, z) ∈ Z3 mit xyz ̸= 0 der diophantischen Gleichung xn + y n = z n 1 2 Einleitung vom Grad n gibt. Diese Vermutung wurde erst im Jahre 1994 nach Vorarbeiten anderer Mathematiker von Wiles und Taylor bewiesen. Dieser Beweis ist einer der raffiniertesten, längsten und tiefliegendsten Beweise der Mathematik. Primzahlverteilung Aus den Grundvorlesungen ist bereits bekannt, dass es unendlich viele Primzahlen gibt. Wie sind jedoch diese kleinsten Bausteine der natürlichen Zahlen in N verteilt? Setzt man für x ∈ R, x ≥ 1, π(x) := |{p ∈ P | p ≤ x}|, so gilt offensichtlich π(x) → ∞ für x → ∞. Aber lässt sich diese Primzahlfunktion durch eine einfache Funktion für x → ∞ approximieren? Hierfür gibt der Primzahlsatz 2.4.4 eine Antwort: x ∼ ln(x) π(x) (x → ∞), d.h. lim x→∞ x π(x) ln(x) = 1. Dies wurde bereits von Gauß im Jahr 1792 vermutet, jedoch erst 1896 mit funktionentheoretischen Mitteln wie der Riemannschen ζ-Funktion von Hadamard und de la Vallée Poussin bewiesen. In dieser Vorlesung werden wir mit elementaren Mitteln zeigen, dass es Konstanten c1 < 1 < c2 gibt, sodass für hinreichend großes x ∈ R gilt π(x) c1 < x < c 2 . ln(x) 2 Teilbarkeitslehre Zur Erarbeitung grundlegender Techniken und erster einfacher Ergebnisse der Zahlentheorie sowie des Primzahlsatzes sei die Notation N0 := N ∪ {0} der Einfachheit halber eingeführt. Ferner seien aus den Vorlesungen der Analysis der Satz vom kleinsten Element, das Prinzip der Vollständigen Induktion sowie das Dirichletsche Schubfachprinzip als bekannt vorausgesetzt. Die Addition und Multiplikation von Elementen aus N bzw. Z sowie deren Anordnung seien durch die üblichen Axiome festgelegt. Im ersten Abschnitt werden Grundlagen zur Teilbarkeit und die Darstellbarkeit natürlicher Zahlen als Produkt von Primzahlen bewiesen. 2.1 Der Fundamentalsatz der Arithmetik Zunächst definiert man die Teilbarkeit gemäß Definition 2.1.1. Seien a, b ∈ Z. Dann heißt b ein Teiler von a bzw. a heißt Vielfaches von b, falls es ein n ∈ Z gibt mit a = bn. Man schreibt in diesem Fall b | a. Unmittelbar aus der Definition werden folgende Eigenschaften klar. Lemma 2.1.2. Seien a, b, c, ai , bi , m, n ∈ Z für i = 1, 2. Dann gilt • ±a | a, ±1 | a und a | 0. • 0 | a ⇔ a = 0. • a | ±1 ⇔ a = ±1. • Transitivität: b | a, a | c impliziert b | c. • b1 | a1 , b2 | a2 ergibt b1 b2 | a1 a2 . • Für c ̸= 0 gilt: b | a ⇔ cb | ca. • Ist b Teiler von ai , i = 1, 2, d.h. b | ai , so gilt auch b | (ma1 + na2 ). • Gilt b | a und umgekehrt a | b, ist bereits b = ±a. Beweis. Man beachte, dass ±1 die einzigen Einheiten in Z sind. 3 4 Teilbarkeitslehre Definition 2.1.3. Sei a ∈ Z. Gilt t | a und t ̸= ±a, so heißt t ∈ Z echter Teiler von a. Lemma 2.1.4. Jedes a ∈ Z \ {0} hat nur endlich viele Teiler. Beweis. Für b | a sei n ∈ Z mit a = bn ̸= 0, d.h. b, n ̸= 0. Damit ist b aber beschränkt gemäß a |b| = ≤ |a|. n Im Folgenden beschränken wir uns auf die Teilbarkeitslehre in N, da mit b | a stets (±b) | a gilt. Ziel des vorliegenden Abschnitts ist das Studium des Aufbaus der natürlichen Zahlen. Hierfür ist der Begriff der Primzahl, das Pendant des Primelements in Z, essentiell. Definition 2.1.5. Eine Zahl p ∈ N heißt Primzahl, falls p > 1 gilt und p nur die positiven Teiler p und 1 besitzt. Die Menge der Primzahlen sei im Folgenden mit P bezeichnet. Eine Zahl p ∈ P mit p | n heißt Primteiler von n ∈ N. Satz 2.1.6. Jedes n ∈ N mit n > 1 besitzt mindestens einen Primteiler. Beweis. Sei die Menge der Teiler t > 1 von n mit T = {t ∈ N | t > 1, t | n} bezeichnet. Dann ist n ∈ T ̸= ∅ und nach dem Satz vom kleinsten Element der Analysis besitzt T ein solches kleinstes Element p ∈ T . Wir zeigen p ∈ P: Zunächst ist p > 1, denn p ∈ T . Angenommen, p wäre nicht prim, dann hätte p einen Teiler q | p mit 1 < q < p. Dann ist aber nach Lemma 2.1.2 q ∈ T ein Teiler von n und kleiner als p im Widerspruch zur Wahl von p. Mit diesen Mitteln zeigt sich der bereits von Euklid um 300 v.Chr. bewiesene Satz 2.1.7. (Euklid) Es gibt unendlich viele Primzahlen. Beweis. Angenommen, es gäbe nur endlich viele, verschiedene Primzahlen p1 , . . . , pn . Definiere n ∏ M := pi + 1 > 1, i=1 dann hat M nach Satz 2.1.6 einen Primteiler p | M . Nach Annahme muss es ein Index j ∈ {1, . . . , n} geben mit p = pj . Damit folgt aber ( ) n ∏ p| M− pi = 1 i=1 gemäß Lemma 2.1.2. Das heißt p = 1 im Widerspruch zu p ∈ P. 2.1 Der Fundamentalsatz der Arithmetik 5 Theorem 2.1.8. (Fundamentalsatz der Arithmetik) Jede natürliche Zahl n ∈ N lässt sich als Produkt von Primzahlen darstellen n= s ∏ pi ∈ P, s ∈ N0 , pi , i=1 wobei das leere Produkt (s = 0) per Definition 1 sei. Diese Darstellung ist bis auf die Reihenfolge eindeutig. Beweis. Zunächst zeigt man die Existenz per vollständiger Induktion über n. (IA) n = 1 ist klar. (IV) Existiere für alle m ∈ N, 1 ≤ m < n, eine Primfaktorzerlegung für ein n > 1. (IS) Wegen n > 1 gibt es nach Satz 2.1.6 einen Primteiler p ∈ P mit n = pm für ein m ∈ N. Wegen p > 1 ist auch m < n und besitzt nach Induktionsvoraussetzung eine Darstellung als Produkt von Primzahlen. Folglich auch n = pm. Die Eindeutigkeit der Darstellung bis auf Reihenfolge zeigt man ebenfalls per Induktion. (IA) n = 1 ist klar. (IV) Existiere für alle m ∈ N, 1 ≤ m < n, eine bis auf Reihenfolge eindeutige Primfaktorzerlegung für ein n > 1. (IS) Wegen n > 1 gibt es nach Satz 2.1.6 einen kleinsten Primteiler p ∈ P mit p | n. Seien n = p1 · . . . · pr = q1 · . . . · qs zwei Primfaktorzerlegungen von n. Dann gilt p | pi für ein i ∈ {1, . . . , r} und p | qj für ein j ∈ {1, . . . , s}, denn für ein festes pk gilt entweder p | pk oder p ∤ pk . Im letzteren Fall ist pk > p, da p minimaler Primteiler von n ist. Das heißt 1 ≤ m := (pk − p) r ∏ pi = n − p i=1, i̸=k r ∏ pi < n. i=1, i̸=k Offensichtlich ist p ein Primteiler von m mit p ∤ (pk − p), d.h. p teilt das restliche Produkt, das bis auf Reihenfolge eindeutig ist. Aufgrund der Primeigenschaft ist sogar p = pi = qj . Division mit p ergibt r ∏ k=1, k̸=i pk = s ∏ k=1, k̸=j qk = n =: mp < n p und per Induktionsvoraussetzung ist die Anzahl der Primzahlen dieser beiden Darstellungen von mp identisch und die auftretenden Primzahlen pk stimmen bis auf Permutation mit qk überein. Daraus folgt die Behauptung für n = pmp . 6 Teilbarkeitslehre Der Beweis des Fundamentalsatzes liefert ein effektives Verfahren zur Bestimmung der Primfaktorzerlegung einer natürlichen Zahl n > 1 durch Zerlegen mithilfe des jeweils kleinsten Primfaktors p1 mit n = p1 n1 . Nochmaliges Anwenden auf n1 ergibt n = p1 p2 n2 und das Verfahren lässt sich mit n2 fortführen bis man schließlich durch Zusammenfassen gleicher Primzahlen die kanonische Primfaktorzerlegung n= r ∏ p1 < · · · < pr , αi ∈ N. pαi i , i=1 erhält. Diese Darstellung ist nach dem Fundamentalsatz 2.1.8 eindeutig. Teiler dieser natürlichen Zahl n > 1 sind von der Form m= r ∏ pβi i , 0 ≤ βi ≤ α i , i=1 denn m teilt offensichtlich n. Ist umgekehrt t ein Teiler von n, so kann t aufgrund der Eindeutigkeit der Primfaktorzerlegung keine von pi verschiedenen Primteiler enthalten. Zudem darf der Exponent von pi nicht αi überschreiten, denn sonst folgt ein Widerspruch gemäß r ∏ α αi +1 pi |n ⇒ pi | pj j . j=1, j̸=i Wie im Beweis des Theorems bereits angedeutet, gilt Korollar 2.1.9. Sei n = ab > 1 mit a, b ∈ N und p | n ein Primteiler von n. Dann gilt bereits p | a oder p | b. Beweis. Nach Satz 2.1.6 existiert dieses Element p ∈ P. Gilt a = 1 oder p | a ist nichts zu zeigen. Sei also p ∤ a > 1 der Primteiler von n. Dann haben n sowie a und b nach dem Fundamentalsatz eine kanonische Darstellung n= r ∏ pαi i = ab. i=1 Da p nach Annahme keinen der Primfaktoren von a teilt, so taucht p in der Darstellung für b auf, folglich gilt p | b. Satz 2.1.10. (ggT) Seien a, b ∈ N. Dann gibt es genau ein d ∈ N mit (i) d | a, d | b, (ii) t | a und t | b impliziert stets t | d. Dieses eindeutig bestimmte d heißt größter gemeinsamer Teiler von a und b. Man schreibt d = ggT(a, b) = (a, b). 2.1 Der Fundamentalsatz der Arithmetik 7 Beweis. Seien p1 , . . . , pr alle Primzahlen, die in den Primfaktorzerlegungen von a sowie b vorkommen. Dann besitzen die Zahlen a, b die Darstellung a= r ∏ pαi i , αi = 0 ⇔ pi ∤ a, sowie b = i=1 r ∏ pβi i , βi = 0 ⇔ pi ∤ b. i=1 Setzt man δi := min(αi , βi ), so ist für d= r ∏ pδi i i=1 die Eigenschaft (i) klar. Sei also t = pγ11 · . . . · pγr r ein weiterer Teiler von a und b, dann ist nach obiger Bemerkung zur kanonischen Primfaktorzerlegung γi ≤ αi und γi ≤ βi . Folglich auch γi ≤ min(αi , βi ) für alle i = 1, . . . , r und man hat t | d, also (ii) gezeigt. Damit ist die Existenz gezeigt. Für die Eindeutigkeit seien d, d′ zwei größte gemeinsame Teiler, dann gilt mit (ii), dass sich die Teiler gegenseitig teilen, d | d′ und d′ | d. Da beide positiv sind, folgt damit d = d′ . Analog zur Definition in Satz 2.1.10 definiert man den größten gemeinsamen Teiler d = ggT(a1 , . . . , an ) = (a1 , . . . , an ) endlich vieler natürlicher Zahlen a1 , . . . , an . Allgemeiner lässt sich sogar für ganze Zahlen a1 , . . . , an , nicht alle Null, formal d = ggT(a1 , . . . , an ) := (|ai1 |, . . . , |ain |) definieren, wobei aij ̸= 0 ausgewählt wird. Satz 2.1.11. (kgV) Seien a, b ∈ N. Dann gibt es genau ein e ∈ N mit (i) a | e, b | e, (ii) a | v und b | v impliziert stets e | v. Dieses eindeutig bestimmte e heißt kleinstes gemeinsames Vielfaches von a und b. Man schreibt e = kgV(a, b) = [a, b]. Beweis. Seien wiederum p1 , . . . , pr alle Primzahlen, die in den Primfaktorzerlegungen von a sowie b vorkommen und a= r ∏ i=1 pαi i , αi = 0 ⇔ pi ∤ a, sowie b = r ∏ i=1 pβi i , βi = 0 ⇔ pi ∤ b. 8 Teilbarkeitslehre Setzt man εi := max(αi , βi ), so ist für e= r ∏ pεi i i=1 die Eigenschaft (i) klar. Sei also v = p1γ1 · . . . · pγr r ein weiteres Vielfaches von a und b, dann ist nach obiger Bemerkung zur kanonischen Primfaktorzerlegung γi ≥ αi und γi ≥ βi . Folglich auch γi ≥ max(αi , βi ) für alle i = 1, . . . , r und man hat e | v, also (ii) gezeigt. Damit ist die Existenz gezeigt. Für die Eindeutigkeit seien e, e′ zwei kleinste gemeinsame Vielfache, dann gilt mit (ii), dass sich die Vielfache gegenseitig teilen und damit ist e = e′ . Ähnlich zur Verallgemeinerung des ggT auf mehr als zwei Zahlen, lässt sich das kgV erweitern gemäß der Definition in Satz 2.1.11. Damit erhält man folgende Rechenregeln. Korollar 2.1.12. Seien a1 , . . . , an ∈ Z nicht alle Null. Dann gilt (i) (a1 , . . . , an ) = (a1 , (a2 , . . . , an )) und [a1 , . . . , an ] = [a1 , [a2 , . . . , an ]]. (ii) (ta1 , . . . , tan ) = |t|(a1 , . . . , an ) und [ta1 , . . . , tan ] = |t|[a1 , . . . , an ] für t ∈ Z. (iii) (1, a2 , . . . , an ) = 1 und [1, a2 , . . . , an ] = [a2 , . . . , an ]. (iv) Für a1 , a2 ∈ N ist a1 a2 = (a1 , a2 ) · [a1 , a2 ]. Beweis. Man macht sich mit den im Beweis verwendeten kanonischen Darstellungen und der Eindeutigkeit von ggT und kgV leicht klar, dass (i) gilt, dies impliziert sofort (iii). (ii) ist mithilfe der Primfaktorzerlegung ebenfalls klar. Zum Beweis der letzten Aussage beachte man die Identität min(α, β) + max(α, β) = α + β ∀ α, β ∈ N0 . Definition 2.1.13. Seien a1 , . . . , an ∈ Z nicht alle Null. Dann heißen a1 , . . . , an teilerfremd, falls (a1 , . . . , an ) = 1 ist. Die Zahlen a1 , . . . , an heißen paarweise teilerfremd, falls für alle i ̸= j ∈ {1, . . . , n} gilt (ai , aj ) = 1. Aus dieser Definition lassen sich direkt einige wichtige Folgerungen festhalten. Satz 2.1.14. Seien a1 , . . . , an ∈ Z nicht alle Null. Dann gilt (a) Die Zahlen a1 , . . . , an sind genau dann teilerfremd wenn sie keinen gemeinsamen Primteiler besitzen. 2.1 Der Fundamentalsatz der Arithmetik 9 (b) Die Zahlen a1 , . . . , an sind genau dann paarweise teilerfremd wenn sie nur verschiedene Primteiler besitzen. (c) Für a, b, c ∈ N gilt (i) a | bc und (a, b) = 1 implizieren a | c. (ii) (a, b) = 1 = (a, c) impliziert (a, bc) = 1 und umgekehrt. Beweis. Die ersten beiden Aussagen werden direkt mithilfe der kanonischen Primfaktorzerlegung und der Darstellung des ggT klar. Für (c) wählen wir für die gemeinsamen Primfaktoren von b und c die kanonischen Darstellungen b= r ∏ pβi i , βi = 0 ⇔ pi ∤ b, sowie c= i=1 r ∏ pγi i , γi = 0 ⇔ pi ∤ c. i=1 In (i) ergibt sich mit 0 ≤ αi ≤ βi + γi a= r ∏ pαi i . i=1 Ist (a, b) = 1, so folgt min(αi , βi ) = 0 für i = 1, . . . , r. Gilt αi = 0, ist nichts zu zeigen. Im Fall βi = 0 folgt aufgrund der Teilereigenschaft αi ≤ γi und somit insgesamt a | c. Für den Beweis von (ii) hat aufgrund der Teilerfremdheit a in beiden Fällen nur von b und c verschiedene Primteiler, d.h. a= s ∏ i=1 Damit zeigt sich leicht die Äquivalenz. qiαi . 10 Teilbarkeitslehre 2.2 Ideale von Z Zwei ganze Zahlen lassen sich stets mit Rest teilen. Dies zeigt Satz 2.2.1. Seien m ∈ N0 und n ∈ N. Dann gibt es genau eine Darstellung m = qn + r mit q, r ∈ N0 und einem Rest r < n. Beweis. Für den Existenzbeweis setze man [ ] { q := m := max k ∈ Z | k ≤ n m n } ≥0 als die Gauß-Klammer des Bruchs. Dann ist q durch den Bruch nach oben beschränkt und somit r := m − qn ≥ 0. Angenommen, es gälte r ≥ n, folgte m − qn ≥ n ⇔ q+1≤ m n im Widerspruch zur Maximalität von q. Für die Eindeutigkeit nehmen wir an, es gäbe zwei Darstellungen m = qn + r = q ′ n + r′ , 0 ≤ r, r′ < n. Dann ist n(q − q ′ ) = r − r′ mit |r − r′ | < n. Wegen q − q ′ ∈ Z folgt r = r′ und damit q = q ′ aufgrund der Voraussetzung n ∈ N. Ist der Rest der Division Null, kommt man zum Begriff des Hauptideals, der nun entwickelt werden soll. Definition 2.2.2. Eine Teilmenge I ⊂ Z heißt Ideal von Z, falls gilt (i) I ist additive Untergruppe von Z. (ii) Für a ∈ Z, b ∈ I gilt stets ab ∈ I. Beispiel 2.2.3. Seien a1 , . . . , an ∈ Z gegeben. Dann ist Za1 + · · · + Zan := {x1 a1 + · · · + xn an | x1 , . . . , xn ∈ Z} ein Ideal, das von a1 , . . . , an erzeugte Ideal. Ist speziell I = Za = {na | n ∈ Z} für ein a ∈ Z, so nennt man I ein Hauptideal. Es zeigt sich folgender Satz 2.2.4. Jedes Ideal I ⊂ Z ist ein Hauptideal. 2.2 Ideale von Z 11 Beweis. Ist I = {0}, ist nichts zu zeigen. Gebe es also ein a ∈ I \ {0}. Da mit a ∈ I per Definition auch −a ∈ I gilt, sei ohne Einschränkung a ∈ N. Dann gibt es auch eine kleinste natürliche Zahl n ∈ I. Sei m ∈ I, m ≥ 0. Dann gibt es nach Satz 2.2.1 eine Darstellung m = qn + r ∈ I. Da I eine additive Untergruppe ist, folgt r = m − qn ∈ I. Wegen r < n gilt aufgrund der Wahl von n bereits r = 0. Ist m ∈ I, m < 0, so folgt −m = qn nach eben Gezeigtem. Folglich gilt I = Zn. Die im Beweis verwendete Minimalität des erzeugenden Elements n ∈ N ergibt weitere wichtige Eigenschaften, die allgemeiner in jedem Hauptidealring gelten. Korollar 2.2.5. (Lemma von Bézout) Seien a1 , . . . , an ∈ Z nicht alle Null und sei d = ggT(a1 , . . . , an ). Dann wird das von den Zahlen erzeugte Ideal von d erzeugt, d.h. Za1 + · · · + Zan = Zd. Insbesondere gibt es eine Darstellung d= n ∑ xi ai mit xi ∈ Z. i=1 Beweis. Da nicht alle Zahlen Null sind, hat das erzeugte Ideal nach Satz 2.2.4 die Gestalt Zn mit n ∈ N. Weil n alle Zahlen a1 , . . . , an darstellt, ist n ein gemeinsamer Teiler aller a1 , . . . , an . Aufgrund der umgekehrten Darstellung n = x1 a1 + · · · + xn an ist ein Teiler aller a1 , . . . , an auch ein Teiler von n. Per Definition 2.1.10 ist dann n = d. Hieraus lässt sich die Grundlage des Euklidschen Algorithmus bilden. Korollar 2.2.6. Seien a1 , . . . , an ∈ Z mit a1 ̸= 0. Sind y2 , . . . , yn ∈ Z, so gilt d := ggT(a1 , . . . , an ) = ggT(a1 , a2 − y2 a1 , . . . , an − yn a1 ) =: d′ . Beweis. Zunächst sei bi := ai − yi a1 für i = 2, . . . , n. Dann ist a1 , b2 , . . . , bn ∈ Zd, dem von a1 , . . . , an erzeugten Ideal nach obigem Korollar 2.2.5. Umgekehrt ist a1 , ai = yi a1 + bi ∈ Zd′ . Das heißt aufgrund der beiden Inklusionen Zd = Zd′ . Da sich die beiden Zahlen gegenseitig teilen müssen, folgt mit d, d′ ∈ N die Gleichheit. Für n = 2 ergibt sich hieraus der bekannte Euklidsche Algorithmus zur Berechnung des größten gemeinsamen Teilers. Seien hierzu b ≥ a ∈ N gegeben. Man schreibt mit Satz 2.2.1 b = q1 a + r1 mit 0 ≤ r1 < a 12 Teilbarkeitslehre und es folgt aus Korollar 2.2.6 für den ggT (b, a) = (q1 a + r1 , a) = (r1 , a) = (a, r1 ). Ist r1 = 0, so ist bereits ggT(a, b) = a. Ist r1 ̸= 0 schreibt man a = q2 r1 + r2 mit 0 ≤ r2 < r 1 und erhält (a, r1 ) = (r1 , r2 ). Dieser Algorithmus endet nach endlich vielen Schritten und man erhält (b, a) = (a, r1 ) = (r1 , r2 ) = · · · = (d, 0) = d mit d ∈ N. 2.3 Zahlentheoretische Funktionen 13 2.3 Zahlentheoretische Funktionen In der (nicht-elementaren) Zahlentheorie kommen oft komplexwertige Funktionen vor, deren Definitionsbereich natürliche Zahlen sind. Einige dieser zahlentheoretisch wichtigen Funktionen werden in diesem Abschnitt für die Verwendung in späteren Beweisen genauer studiert. Definition 2.3.1. Eine zahlentheoretische Funktion ist eine Abbildung f : N → C. Sie heißt multiplikativ, falls f (n1 n2 ) = f (n1 ) · f (n2 ) für alle n1 , n2 ∈ N mit ggT(n1 , n2 ) = 1 gilt. Aus dieser Definition folgen direkt einige wichtige Eigenschaften einer multiplikativen zahlentheoretischen Funktion. Lemma 2.3.2. Sei f : N → C einer multiplikative zahlentheoretische Funktion, dann gilt (i) f ist durch die Funktionswerte der Primzahlpotenzen pα , α ∈ N0 , eindeutig bestimmt. Denn r r ∏ ∏ αi n= pi ⇒ f (n) = f (pαi i ). i=1 i=1 (ii) Es gilt entweder f ≡ 0 oder f (1) = 1. Die zahlentheoretischen Funktionen bilden mit der punktweisen Addition und skalaren Multiplikation für allgemeine Funktionen einen komplexen Vektorraum Z. Beweis. Aufgrund des Fundamentalsatzes 2.1.8 der elementaren Zahlentheorie ist (i) klar und mit dem Vorwissen über Funktionenräume genügt es (ii) zu beweisen. Offensichtlich gilt f (1) = f (1) · f (1), d.h. f (1) = 1 oder f (1) = 0. Im ersten Fall ist nichts zu zeigen. Gilt f (1) = 0, so folgt aber wegen ggT(n, 1) = 1 f (n) = f (n) · f (1) = 0 Beispiel 2.3.3. tion durch ∀ n ∈ N. (a) Die Eulersche ϕ-Funktion definiert eine zahlentheoretische Funkϕ(n) := ∑ 1. 1≤m≤n, ggT(m,n)=1 (b) Die Funktion f (n) = nz ist für alle z ∈ C eine multiplikative zahlentheoretische Funktion, denn nz := ez ln(n) . 14 Teilbarkeitslehre (c) Die Möbiussche Funktion µ : N → {0, ±1} ist multiplikativ definiert durch falls n = 1, 1 r µ(n) := (−1) falls n = p1 · . . . · pr , pi ̸= pj für i ̸= j, 0 sonst. (d) Für zwei multiplikative zahlentheoretische Funktionen f, g ist offensichtlich auch deren Produkt und mit g(n) ̸= 0 für alle n ∈ N auch deren Quotient multiplikativ. Satz 2.3.4. Ist f : N → C eine multiplikative Funktion, so ist auch ihre zugeordnete summatorische Funktion F : N → C mit ∑ F (n) := f (d) d|n, d>0 multiplikativ. Beweis. Seien n1 , n2 ∈ N mit ggT(n1 , n2 ) = 1. Gemäß dem Fundamentalsatz 2.1.8 der Arithmetik lässt sich jeder Teiler d ∈ N von n1 n2 eindeutig als d = d1 d2 , wobei d1 | n1 , d2 | n2 und ggT(d1 , d2 ) = 1, schreiben. Es ist hierbei di = ggT(d, ni ) für i = 1, 2. Durchläuft also d alle Teiler des Produkts n1 n2 , so durchläuft d1 die Teiler von n1 und entsprechend d2 die von n2 . Dies ergibt ∑ ∑ ∑ ∑ ∑ F (n1 n2 ) = f (d) = f (d1 d2 ) = f (d1 )f (d2 ) = f (d1 ) f (d2 ) d|(n1 n2 ), d>0 d1 |n1 , d2 |n2 d1 |n1 , d2 |n2 d1 |n1 , d1 >0 d2 |n2 , d2 >0 = F (n1 )F (n2 ). Beispiel 2.3.5. (a) Für ν ∈ N0 definiert man die Teilerfunktionen σν (n) := ∑ dν . d|n, d>0 σ0 (n) beschreibt dabei die Anzahl der Teiler von n und σ1 (n) die Summe der Teiler. Schreibt man n = pα1 1 · . . . · pαr r , so folgt σ0 (n) = r ∏ i=1 (αi + 1). 2.3 Zahlentheoretische Funktionen 15 Mit der geometrischen Summenformel schließt man für ν ∈ N, α ∈ N0 und p prim aus α α ∑ ( i )ν ∑ pν(α+1) − 1 α σν (p ) = p = (pν )i = pν − 1 i=0 i=0 die Produktdarstellung σν (n) = r ν(α +1) ∏ p i −1 i i=1 pνi − 1 . (b) Die summatorische Funktion der Möbius-Funktion ist die charakteristische Funktion zur Menge {1} ⊂ N, d.h. { ∑ 1 falls n = 1, µ(d) = 0 sonst. d|n, d>0 In der Tat, für n = 1 ist die Aussage klar. Sei also α ∈ N, p prim, dann folgt ∑ d|pα , d>0 µ(d) = α ∑ µ(pi ) = 1 + (−1) + 0 = 0. i=0 Theorem 2.3.6. (Möbiussche Umkehrformel) Sei Z wie in Lemma 2.3.2 der Vektorraum der zahlentheoretischen Funktionen. Die Abbildung ∑ T : Z → Z, f 7→ F mit F (n) = f (d), d|n, d>0 die f ihre summatorische Funktion zuordnet, ist linear und bijektiv mit Umkehrabbildung (n) ∑ −1 T : Z → Z, F 7→ f mit f (n) = µ(d)F . d d|n, d>0 Beweis. Die Linearität ist klar, da die Summation linear ist. Daher genügt es für die Injektivität allein den Kern der Abbildung zu betrachten, d.h. sei T (f ) = 0, also F (n) = 0 für alle n ∈ N. Per Induktion zeigt man f ≡ 0: Zunächst folgt 0 = F (1) = f (1). Da f im Allgemeinen nicht multiplikativ ist, folgt hieraus nicht direkt f ≡ 0. Sei die Behauptung daher für alle n < n0 gezeigt. So impliziert dies ∑ f (n0 ) = f (n0 ) + f (d) = F (n0 ) = 0 d|n0 , 0<d<n0 und damit den Induktionsschluss. Zum Beweis der Surjektivität sei F ∈ Z gegeben und man prüft die Wahl der Umkehrabbildung. Mit der abkürzenden Schreibweise einer Summation über alle Paare (d1 , d2 ) ∈ N2 16 Teilbarkeitslehre mit d1 d2 = n ist f (n) := ∑ µ(d)F (n) d d|n, d>0 ∑ (n) µ(d1 )F (d2 ) = µ F (d). d =n ∑ = d1 d2 d|n, d>0 Daraus folgt mit ähnlichen Überlegungen ∑ ∑ ∑ ∑ T (f )(n) = f (d1 ) = µ(t1 )F (t2 ) = µ(t1 )F (t2 ) d1 |n, d1 >0 = ∑ d1 |n, t1 t2 =d1 d1 >0 F (t2 ) ∑ µ(t1 ) = n t1 t3 = t2 t2 |n, t2 >0 t1 t2 t3 =n ∑ t|n, t>0 F (t) ∑ n m , µ(m) = F (n) t m>0 nach Beispiel 2.3.5 (b). Diese wichtige Umkehrformel wird nun auf die Eulersche ϕ-Funktion angewendet. Korollar 2.3.7. Die in Beispiel 2.3.3 (a) definierte Eulersche ϕ-Funktion ist multiplikativ und es gilt für alle n ∈ N ∑ ∑ n (2.1) n= ϕ(d) bzw. ϕ(n) = µ(d) d d|n, d>0 sowie d|n, d>0 ) ∏ ( 1 1− ϕ(n) = n . p (2.2) p|n, p prim Beweis. Ist die linke Gleichheit von (2.1) gezeigt, so folgt mit der Funktion F (n) = n aus eben bewiesener Umkehrformel (n) ∑ ∑ n −1 ϕ(n) = T (F )(n) = µ(d)F = µ(d) . d d d|n, d>0 d|n, d>0 Wie in Beispiel 2.3.3 gezeigt wurde, ist der Quotient der multiplikativen Funktionen µ und F (n) = n ebenfalls multiplikativ. Satz 2.3.4 liefert die Multiplikativität der summatorischen Funktion ϕ(n) ∑ µ(d) = . n 7→ n d d|n, d>0 Als Produkt dieses Quotienten und der identischen Abbildung F (n) = n ist ϕ multiplikativ. Zum Beweis der linken Gleichung von (2.1) betrachte man die disjunkte Zerlegung {1, . . . , n} = • ∪ d|n, d>0 Ad mit Ad := {1 ≤ x ≤ n | ggT(x, n) = d}. 2.3 Zahlentheoretische Funktionen 17 Ist x ∈ Ad für einen natürlichen Teiler d von n, so lässt sich x = qd mit q ∈ N schreiben und es folgt mit den Rechenregeln für den ggT ( ) ( ) ( n) d = (x, n) = qd, n dd = d q, nd ⇔ q, d = 1. Damit ergibt sich für die Mächtigkeit der Menge Ad |Ad | = |{1 ≤ x ≤ n | (x, n) = d}| = |{1 ≤ q ≤ n d | (q, nd ) = 1}| = ϕ( nd ) und somit (2.1), denn n = |{1, . . . , n}| = ∑ d|n, d>0 ∑ (n) ∑ |Ad | = ϕ ϕ(d). = d d|n, d>0 d|n, d>0 Für den Beweis von (2.2) betrachte man die multiplikative Funktion n 7→ ϕ(n) ∑ µ(d) = , n d d|n, d>0 d.h. es genügt für einen Primteiler p | n mit pα | n, α ∈ N maximal, folgendes zu zeigen: α ∑ µ(d) ∑ µ(pi ) µ(1) µ(p) 1 = = + +0=1− . i d p 1 p p α i=0 d|p , d>0 Zur Berechnung folgt aus (2.2) bzw. abschließend Gezeigtem für α ∈ N, p prim ϕ(pα ) = pα−1 (p − 1). Damit lässt sich ein weiterer kurzer Beweis für die Unendlichkeit der Primzahlen (siehe Satz 2.1.7) geben. Bemerkung. Angenommen, es gäbe nur endlich viele, verschiedene Primzahlen p1 , . . . , pn . Dann gilt n n n ∏ ∏ ∏ M := pi ⇒ ϕ(M ) = ϕ(pi ) = (pi − 1) > 1, i=1 i=1 i=1 da wir bereits p1 = 2, p2 = 3 kennen. Per Definition von ϕ gibt es daher eine natürliche Zahl m > 1, die zu M teilerfremd ist. Nach Satz 2.1.6 besitzt diese einen Primteiler p | m. Nun folgt aus der Teilerfremdheit zu M , dass p ̸= pi für alle bereits bekannten pi , i = 1, . . . , n, ist – ein Widerspruch zur Annahme. 18 Teilbarkeitslehre 2.4 Primzahlsatz und Primzahlen Dieser letzte Abschnitt behandelt eine dem Primzahlsatz ähnliche Abschätzung der Primzahlfunktion π und schließt mit der Betrachtung spezieller Primzahlen. Zur einfachen Charakterisierung von Primzahlen und zur Erstellung von Primzahltafeln dient das sogenannte Sieb des Erathostenes. Dieses beruht auf folgendem √ Lemma 2.4.1. Sei n ∈ N, n > 1. Besitzt n keinen positiven Teiler d ≤ n außer 1, dann ist n prim. Beweis. Sei d ∈ N √ ein Teiler von n. Dann gibt√es ein d′ ∈ N√mit dd′ = n. Dann können ′ nicht beide d, d > n erfüllen, d.h. es gilt d ≤ n oder d′ ≤ n. Nach Voraussetzung ist dann d = 1 oder d′ = 1 und somit d = 1 oder d = n. Damit ist n ∈ P prim. Hieraus resultiert das Korollar 2.4.2. Sei x ∈ R, x ≥ 1. Notiert man alle natürliche Zahlen √ kleiner oder gleich x und streicht alle Vielfachen der natürlichen Zahlen 1 < m ≤ x, so bleiben genau 1 und alle Primzahlen p ≤ x stehen. √ Beweis. Alle stehenbleibenden n außer 1 haben keinen Teiler d ≤ x, also insbe√ Zahlen √ sondere keinen Teiler d ≤ n ≤ x und sind damit prim. Definition 2.4.3. Sei x ∈ R, x ≥ 1. Dann sei die Primzahlfunktion definiert durch π(x) := |{p ∈ P | p ≤ x}|. Mit obigem Korollar und einigem Rechenaufwand folgt die Tabelle, x 101 102 103 104 105 .. . π(x) 4 25 168 1229 9592 .. . x ≈ π(x) 2.5 4.0 6.0 8.1 10.4 .. . 1010 455052512 22.0 wobei das Verhältnis x/π(x) stets ungefähr um den Wert 2.3 wächst. Eine elementare Funktion mit dieser Eigenschaft ist der natürliche Logarithmus ln mit ln(10) ≈ 2.3. Vermutet wurde die Aussage x ∼ ln(x) π(x) (x → ∞) :⇔ lim x→∞ x π(x) ln(x) =1 2.4 Primzahlsatz und Primzahlen 19 von Gauß im Jahre 1792. Mit funktionentheoretischen Mitteln wie der Riemannschen ζ-Funktion ∑ 1 ζ(s) = , s ∈ C mit Re(s) > 1, ns n∈N wurde diese Aussage 1896 von Hadamard und de la Vallée-Poussin bewiesen. Erst 1948 gelang dem Mathematiker Selberg ein Beweis mit elementaren Methoden. Theorem 2.4.4. (Primzahlsatz) Für die Primzahlfunktion π gilt x ∼ ln(x) (x → ∞), π(x) d.h. lim x→∞ x π(x) ln(x) = 1. Beweis. Siehe [4]. Da dieser Beweis den Rahmen der Vorlesung sprengen würde, beweisen wir nur eine Variante der 1850 von Tschebycheff hergeleiteten Ungleichung aus Theorem 2.4.5. Für hinreichend große x ∈ R, x > 1, gilt 0.89 x x < π(x) < 1.11 . ln(x) ln(x) Beweis. Siehe [5]. Wir beweisen nämlich die beiden getrennten Abschätzungen wie folgt für natürliche Zahlen. Zunächst eine Abschätzung nach oben. Satz 2.4.6. Für n ∈ N, n ≥ 2 gilt (2.3) π(n) < 2 n . ln(n) Beweis. Man macht sich leicht mithilfe einer Tabelle wie oben klar, dass die Aussage für alle natürlichen Zahlen n ∈ [2, 200) gilt. Man zeigt nun: Gilt (2.3) für ein n ∈ N, n ≥ 100, so auch für 2n sowie 2n + 1. Dies genügt, denn damit erhält man die Gültigkeit der Abschätzung induktiv für alle natürlichen Zahlen n ≥ 2. Sei also n ≥ 100 mit obiger Ungleichung (2.3) gegeben. Die folgenden Schritte sind motiviert durch die exponierte Ungleichung nπ(n) < e2n . Zunächst betrachtet man 2n 2 = (1 + 1) 2n = ) 2n ( ∑ 2n k=0 wobei per Definition ( 2n n ) = k ( ) 2n > , n 1 · 2 · . . . · 2n (2n)! = n! · n! (1 · 2 · . . . · n)2 20 Teilbarkeitslehre ist. Da im Zähler alle Primzahlen p ≤ 2n auftreten, im Nenner aber keine Primzahlen n < p ≤ 2n auftreten, folgt aus der Tatsache, dass der Binomialkoeffizient eine natürliche Zahl ist, ( ) ∏ 2n p . n p∈P, n<p≤2n Letzteres Produkt hat genau π(2n) − π(n) Faktoren, welche jeweils größer als n sind. Dies impliziert die Abschätzung ( ) ∏ 2n π(2n)−π(n) p≤ n < < 22n n p∈P, n<p≤2n bzw. nach Anwendung des streng monoton steigenden Logarithmus (ln(2) ≈ 0.693) (π(2n) − π(n)) ln(n) < 2n ln(2) ⇒ π(2n) < π(n) + 0.7 2n . ln(n) Beachtet man die Voraussetzung für n ≥ 100, so bleibt π(2n) < 2n 2n 2n ! 2n + 0.7 = 1.7 ≤2 ln(n) ln(n) ln(n) ln(2n) zu verifizieren. Letztere Ungleichung ist jedoch äquivalent zu 1.7 ln(2n) ≤ 2 ln(n) ⇔ ⇔ ⇔ 1.7 ln(2) + 1.7 ln(n) ≤ 2 ln(n) 17 ln(2) ≤ ln(n) 3 n ≥ 217/3 ≈ 50.80, was offensichtlich für obiges n erfüllt ist. Verwendet man die erhaltenen Abschätzungen für 2n, erhält man für n ≥ 100 π(2n + 1) ≤ π(2n) + 1 < 1.7 2n 2n + 1 2n + 1 < 1.725 < 1.725 . ln(n) ln(n) ln(n) Eine letzte Rechnung zeigt π(2n + 1) < 1.725 2n + 1 ! 2n + 1 ≤2 ln(n) ln(2n + 1) ⇔ 2n + 1 ≤ n80/69 , wobei letztere Ungleichung tatsächlich für n ≥ 100 Gültigkeit besitzt. Der Beweis einer unteren Schranke für die Primzahlfunktion basiert auf folgenden Lemmata. 2.4 Primzahlsatz und Primzahlen 21 Lemma 2.4.7. Sei n ∈ N0 , p ∈ P. Sei prp die höchste Potenz, die n! teilt. Dann gilt ] ∞ [ ∑ n rp = pk k=1 mit der Gauß-Klammer [·]. Beweis. Zunächst ist die Summe endlich und damit wohldefiniert, denn für pk > n ist jeder Summand gleich Null. Für n = 0, 1 ist die Aussage klar, d.h. rp = 0. Sei also n > 1 und 1 < m ≤ n mit p | m. Dann gibt es ein α ∈ N mit m = pα bzw. α = m/p ≤ n/p. Ist umgekehrt α ≤ n/p natürlich, so ist m := pα ≤ n durch p teilbar. Die Gesamtanzahl von natürlichen m ≤ n mit p | m ist demnach [n/p] und jede solche Zahl m liefert einen Beitrag von 1 zur genauen p-Potenz, die n! teilt. Der Gesamtbeitrag aller solcher Zahlen zur genauen p-Potenz, die n! teilt, ist also zumindest [n/p]. Unter diesen Zahlen gibt es jedoch [n/p2 ] solche, die durch p2 teilbar sind und den Gesamtbeitrag von mindestens [n/p2 ] zur genauen p-Potenz liefern. Fährt man fort, so folgt die Behauptung. ( ) Lemma 2.4.8. Seien n, k ∈ N0 mit k ≤ n und p ∈ P. Sei psp die höchste Potenz, die nk teilt, dann gilt psp ≤ n. ( ) n! Beweis. Per Definition des Binomialkoeffizienten nk = k!(n−k)! folgt aus Lemma 2.4.7 ] ∑ ] ∑ ] ∑ ] [ ] [ ]) ∞ [ ∞ [ ∞ [ ∞ ([ ∑ n k n−k n k n−k sp = − − = − m − . pm pm pm pm p pm m=1 m=1 m=1 m=1 Wie bereits in obigem Lemma erwähnt, erstreckt sich die Summation maximal bis pm ≤ n, d.h. m ≤ [ln(n)/ ln(p)] =: np . Dabei belegt aber jeder Summand der letzten Summe den Wert 0 oder 1, denn mittels Division mit Rest kleiner pm folgt [ ] [ ] [ ] [ ] n k + (n − k) k n−k = = m + +δ pm pm p pm mit δ ∈ {0, 1}. Folglich ist die Summe abschätzbar durch [ ] np ∑ ln(n) ln(n) sp ≤ 1 = np = ≤ . ln(p) ln(p) m=1 Exponieren ergibt die gewünschte Ungleichung. Diese Hilfssätze ergeben in Analogie zur Verwendung des binomischen Lehrsatzes in Satz 2.4.6 folgenden Satz 2.4.9. Für n ∈ N, n ≥ 260 gilt (2.4) 0.65 n < π(n). ln(n) 22 Teilbarkeitslehre Beweis. Es ist mit Lemma 2.4.8 für n ≥ 2 n ( ) n ∏ ∑ ∑ n n n 2 = (1 + 1) = = psp k k=0 k=0 p∈P, p≤n ≤ n ∑ ∏ n= k=0 p∈P, p≤n n ∑ nπ(n) = (n + 1)nπ(n) ≤ n2+π(n) . k=0 Für n ≥ 260 lässt sich daraus 2 + π(n) ≥ ln(2) n ln(n) ⇒ π(n) ≥ ln(2) n n − 2 > 0.65 ln(n) ln(n) abschätzen. Diese Abschätzung lässt sich noch etwas verbessern, die Konstante ist jedoch durch ln(2) ≈ 0.693 nach oben beschränkt. Durch die verbesserte Wahl in n + 1 ≤ n1+ε mit ε > 0 zeigt sich, dass die Ungleichung (2.4) bereits für n ≥ 110 gilt. Nach dieser asymptotischen Abschätzung der Primzahlfunktion ist wiederum klar, dass es unendlich viele Primzahlen gibt. Über die genaue Verteilung der Primzahlen ist im Allgemeinen wenig bekannt, jedoch lässt ein Blick in eine Primzahltabelle vermuten, dass es unendlich viele Primzahlzwillinge, d.h. Paare (p, p + 2) ∈ P2 zweier aufeinanderfolgender Primzahlen, gibt. Beispielsweise sind (3, 5), (5, 7), (17, 19) oder (299477, 299479) Primzahlzwillinge, aber nicht (2, 3). Mithilfe der Funktionentheorie und sogenannten Dirichletschen L-Reihen lässt sich der folgende Satz der analytischen Zahlentheorie über die Verteilung von Primzahlen zeigen. Satz 2.4.10. (Dirichlet) Seien a, m ∈ N teilerfremd. Dann stellt die arithmetische Progression oder Folge mit an = a + mn für n ∈ N unendliche viele Primzahlen dar. Beweis. Siehe [1]. Eine entsprechende Aussage für quadratische Folgen an = an2 + bn + c, ggT(a, b, c) = 1 ist nicht bekannt. Euler stellte dazu fest, dass an = n2 +n+41 für 0 ≤ n ≤ 39 Primzahlen darstellt, nicht aber für n = 40, denn 402 + 40 + 41 = 40 · (40 + 1) + 41 = 412 ∈ / P. Eine Faktorisierung liefert auch bei manchen höheren polynomialen Folgen ein negatives Ergebnis. Zum Beispiel beschreibt bn = n4 + 4 nur für n = 1 eine Primzahl, ansonsten ist sie zusammengesetzt gemäß n4 + 4 = (n2 )2 + 22 = (n2 + 2)2 − (2n)2 = (n2 + 2 − 2n)(n2 + 2 + 2n) mit 1 < n2 + 2 − 2n = (n − 1)2 + 1 für n > 1. Nichtsdestotrotz lässt sich beweisen, dass eine solche Folge unendlich viele Primteiler hat. 2.4 Primzahlsatz und Primzahlen 23 Satz 2.4.11. Sei h ∈ Z[X] ein Polynom über Z vom Grad deg(h) ≥ 1. Dann existieren unendlich viele Primzahlen p ∈ P mit p | h(np ) für geeignetes np ∈ N. Beweis. Sei m = deg(h) ≥ 1 und h(X) = m ∑ ak X k mit ak ∈ Z, am ̸= 0. k=0 Ist a0 = 0, so gilt p | h(p) für alle p ∈ P. Sei a0 ̸= 0 und angenommen, dass die Aussage des Satzes falsch ist. Seien p1 , . . . , pr die verschiedenen Primteiler der Funktionswerte h(n), n ∈ N. Setze für ein noch zu wählendes B∈N r ∏ B n := 2 pi . i=1 Dann gilt h(a20 n) = m ∑ ak (a20 n)k = a0 · k=0 m ∑ ak a2k−1 nk = a0 · g(n), 0 k=0 wobei letztere Summe der Funktionswert eines Polynoms g ∈ Z[X] ist mit Grad m ≥ 1, da am , a0 ̸= 0. Für B → ∞, d.h. n → ∞, folgt also |g(n)| → ∞. Für hinreichend großes B ∈ N besitzt daher g(n) einen Primteiler p. Dieser erfüllt p | h(a20 n) und aufgrund der Annahme gilt p = pi für ein i ∈ {1, . . . , r}, d.h. p | n per Definition. Wegen g(0) = 1 damit auch p | (g(n) − 1). Im Widerspruch zu p ∤ 1. Abschließend seien noch einige besondere Zahlen und insbesondere spezielle Primzahlen betrachtet. Zunächst die historisch bedingten Zahlen aus Definition 2.4.12. Eine Zahl n ∈ N heißt vollkommen oder perfekt, falls n mit der Summe seiner echten Teiler übereinstimmt, d.h. ∑ n= d. d|n, 0<d<n Mit der Notation aus Beispiel 2.3.5 (a) ist eine natürliche Zahl n genau dann vollkommen wenn σ1 (n) = 2n gilt. Beispiele für die ersten vollkommenen Zahlen sind 6, 28, 496, 8 128 oder 33 550 336. Bereits Euklid hat die Gestalt der ersten vollkommenen Zahlen untersucht, nämlich n = 2t (2t+1 − 1) mit t ∈ N, wobei der zweite Faktor eine Primzahl ist. Definition 2.4.13. Eine Primzahl der Form p = 2ν − 1 mit ν ∈ N heißt Mersennesche Primzahl. Offensichtlich erhält man für ν = 1, 4 oder ν = 6 keine Primzahlen. Genauer zeigt man 24 Teilbarkeitslehre Lemma 2.4.14. Ist p = 2ν − 1 ∈ P für ein ν ∈ N, ν > 1, so ist notwendigerweise ν ∈ P. Beweis. Ist ν > 1 nicht prim, so besitzt ν eine Zerlegung ν = αβ mit α, β ∈ N, α, β > 1. Gemäß der geometrischen Summenformel xβ − 1 = xβ−1 + xβ−2 + · · · + x + 1 x−1 für x ∈ R \ {1} folgt 2ν − 1 = (2α )β − 1 = (2α − 1)(2α(β−1) + · · · + 2α + 1). Wegen α, β > 1 sind beide Faktoren größer als Eins und folglich 2ν − 1 ∈ / P. Beispielsweise sind 3, 7 oder 2521 − 1, 211 213 − 1 und 219 937 − 1 Mersennesche Primzahlen, nicht jedoch 211 − 1 oder 243 − 1. Es ist bis heute unbekannt, ob es unendlich viele solcher Primzahlen gibt und damit auch die Frage nach der Anzahl vollkommener Zahlen, wie folgender Satz zeigt. Satz 2.4.15. Für t ∈ N gelten folgende Aussagen. (i) (Euklid) Zahlen der Form n = 2t (2t+1 − 1) mit p = 2t+1 − 1 ∈ P sind vollkommen. (ii) (Euler) Eine gerade vollkommene Zahl hat notwendigerweise die Gestalt n = 2t (2t+1 − 1) mit p = 2t+1 − 1 ∈ P. Beweis. (i) Seien n, p wie angegeben. Wir zeigen σ1 (n) = 2n, wobei σ1 nach Beispiel 2.3.5 (a) multiplikativ ist. Da p ∈ P ungerade ist, gilt ggT(2t , p) = 1 und somit σ1 (n) = σ1 (2t ) · σ1 (p) = (1 + 2 + · · · + 2t )(1 + p) 2t+1 − 1 = (1 + (2t+1 − 1)) = p2t+1 = 2n 2−1 aufgrund der geometrischen Summenformel. (ii) Sei n = 2t u eine gerade vollkommene Zahl mit t, u ∈ N und u ungerade. Aufgrund der Vollkommenheit ergibt sich wie in (i) 2t+1 u = 2n = σ1 (n) = σ1 (2t u) = σ1 (2t )σ1 (u) = (2t+1 − 1)σ1 (u). Nach Satz 2.1.14 (c) folgt aus (2t+1 , 2t+1 − 1) = 1 die Faktorisierung u = (2t+1 − 1)a mit a ∈ N und folglich σ1 (u) = 2t+1 a. Wegen 2t+1 − 1 > 1 hat u > 1 mindestens die verschiedenen Teiler a und u. Nun ist aber bereits a + u = 2t+1 a = σ1 (u), Das heißt u hat genau die Teiler a und u. Da 1 ebenfalls ein Teiler von u ist, gilt entweder a = 1 oder u = 1. Wie bereits festgestellt, ist u > 1, d.h. a = 1 und u = 2t+1 − 1 ist per Definition prim. 2.4 Primzahlsatz und Primzahlen 25 Da jede Mersennesche Primzahl eine gerade vollkommene Zahl impliziert, ist die Anzahl der geraden vollkommenen Zahlen unklar. Außerdem ist bisher keine ungerade vollkommene Zahl bekannt. Als letzte spezielle Klasse von Primzahlen betrachten wir die nach Fermat benannten Primzahlen, die in der elementaren Geometrie eine wichtige Rolle spielen. Definition 2.4.16. Eine Primzahl der Form p = 2ν + 1 mit ν = 2n für n ∈ N0 heißt Fermatsche Primzahl. Diese Definition basiert auf folgendem Lemma 2.4.17. Die Zahl 2ν + 1 ∈ N ist für ν ∈ N höchstens dann prim, falls ν = 2n mit n ∈ N0 eine reine Zweierpotenz ist. Beweis. Ist ν keine reine Zweierpotenz, so besitzt ν ≥ 3 einen ungeraden Teiler n > 1 mit ν = αn, α ∈ N. Für ungerades n folgt aus der geometrischen Summenformel xn + 1 (−x)n − 1 ∑ (−1)k xk , = = x+1 (−x) − 1 k=0 n−1 für x ∈ R \ {−1}. Aufgrund der Faktorisierung ist 2ν + 1 = (2α )n + 1 = (2α + 1)(2α(n−1) − 2α(n−2) ± · · · − 2α + 1) und mit 1 < 2α + 1 < (2α )n + 1 ist die Zahl 2ν + 1 nicht prim. Bis heute kennt man nur fünf solcher Fermatschen Primzahlen, nämlich für die Zahlen n = 0, . . . , 4, d.h. 3, 5, 17, 257 und 65 537. Es wurde von Euler gezeigt, dass 641 | 232 + 1 gilt, aber aufgrund der schnell wachsenden Potenzen ist es schwer Faktoren zu finden bzw. die Primeigenschaft zu zeigen. Diese Primzahlen tauchen in der Geometrie auf und man kann mit algebraischen Mitteln folgenden Satz zeigen. Satz 2.4.18. (Gauß) Das regelmäßige n-Eck ist genau dann mit Zirkel und Lineal konstruierbar wenn n ≥ 3 von der Form n=2 t r ∏ pi , t, r ∈ N0 , i=1 ist, wobei p1 , . . . , pr verschiedene Fermatsche Primzahlen seien und für r = 0 das leere Produkt per Definition Eins ist. Abschließen wollen wir dieses Kapitel mit einer etwas nutzlosen, aber expliziten Darstellung der Primzahlfunktion π. 26 Teilbarkeitslehre Korollar 2.4.19. Für x ∈ R, x ≥ 3 gilt ] ) ( [ n−1 ( πn ) m ∑ ∏ π(x) = 1 + 1 − lim 1 − sin2 . m→∞ k n∈N, k=2 3≤n≤x Beweis. Sei n ∈ N, 3 ≤ n ≤ x. Ist n ∈ / P, so gibt es einen echten Teiler 2 ≤ k0 ≤ n − 1 von n. Daher ist der Faktor sin(πn/k0 ) = 0, sodass der Grenzwert Eins und der Beitrag zur Summe Null ist. Ist jedoch n ∈ P, so ist keiner der Faktoren des Produkts Null und damit n−1 ( ) ∏ 2 πn 0≤1− < 1. sin k k=2 Der Grenzwert der geometrischen Folge ist daher Null und der Beitrag zur Summe ist 1 wie gefordert. 3 Kongruenzen und Restklassen Zunächst werden einige Grundlagen der Linearen Algebra über Restklassen und Kongruenzen aufgeführt, um im weiteren Verlauf allgemeiner Lösungen von Polynomkongruenzen zu betrachten und die Darstellung natürlicher Zahlen als Summe von ganzzahligen Quadraten zu studieren. 3.1 Einführung Bereits in Satz 2.2.4 wurden die Hauptideale mZ der ganzen Zahlen für m ∈ N untersucht. Hierzu sei Z/mZ der zugehörige Restklassenring (Z modulo mZ), welcher aus allen Restklassen a = a + mZ, a ∈ Z, besteht, wobei zwei Restklassen a, b genau dann übereinstimmen wenn gilt a = b :⇔ a − b ∈ mZ ⇔ m | (a − b). Wie bereits in Linearer Algebra gezeigt wurde, ist Z/mZ ein kommutativer Ring mit Nullelement 0 und Einselement 1 unter der wohldefinierten Addition und Multiplikation gemäß a + b := a + b und a · b := a · b, a, b ∈ Z. In manchen Beweisen ist es sinnvoll den surjektiven Ringhomomorphismus ψ : Z → Z/mZ, a 7→ a mit mZ als Kern der Abbildung einzubeziehen. Definition 3.1.1. Sei m ∈ N, a, b ∈ Z. Man schreibt a ≡ b (mod m) oder a ≡ b (m), falls a = b in Z/mZ gilt. Man sagt a sei kongruent b modulo m. Dies ist genau dann der Fall wenn m | (a − b). Die in Z/mZ geltenden Rechenregeln für Summen und Produkte ergeben entsprechende Rechenregeln für Kongruenzen. Satz 2.2.1 liefert beispielsweise eine Darstellung von Z/mZ, nämlich Z/mZ = {0, 1, . . . , m − 1}. Denn jede ganze Zahl a ∈ Z ist kongruent zu genau einem Rest 0 ≤ r < m. Stimmen zwei Reste r ≡ r′ (m) modulo m überein, so folgt bereits r = r′ , d.h. die Restklassen sind disjunkt und Z/mZ hat genau m Elemente. Diese Eigenschaft motiviert folgende 27 28 Kongruenzen und Restklassen Definition 3.1.2. Sind a1 , . . . , am ∈ Z derart, dass Z/mZ = {a1 , . . . , am }, so nennt man {a1 , . . . , am } ein vollständiges Repräsentantensystem modulo m. Beispiel 3.1.3. Vollständige Repräsentantensysteme modulo m sind {0, 1, . . . , m − 1} oder {1, . . . , m}. Für gerades m ist auch } { 0, ±1, . . . , ± m2 ein vollständiges Repräsentantensystem modulo m. Für ungerade Zahlen m entsprechend { } 0, ±1, . . . , ± m−1 . 2 Definition 3.1.4. Sei R ein kommutativer Ring mit Einselement. Dann heißt R nullteilerfrei, falls für alle a, b ∈ R gilt: a·b=0 ⇒ a=0 oder b = 0. Im Allgemeinen besitzt der Ring Z/mZ Nullteiler wie etwa für m = 10: 2 · 5 = 10 = 0, aber 2, 5 ̸= 0. Es lässt sich jedoch für m ∈ P Folgendes zeigen. Lemma 3.1.5. Sei p ∈ P, dann ist Z/pZ nullteilerfrei. Beweis. Seien a · b = 0 in Z/pZ, dann gilt p | (ab). Da p prim ist, folgt mit Korollar 2.1.9 p | a oder p | b, d.h. a = 0 oder b = 0 in Z/pZ. Satz 3.1.6. Ist p ∈ P, so ist Z/pZ ein Körper. Beweis. Es genügt zu zeigen, dass es für alle a ̸= 0 ein eindeutiges multiplikatives Inverses gibt. Hierfür definiere man die Hilfsfunktion ϕa : Z/pZ → Z/pZ, x 7→ a · x. ϕa ist injektiv, denn gilt ϕa (x) = ϕa (y), so folgt a · x − y = 0. Mit Korollar 2.1.9 ist a = 0 oder x = y. Nach Annahme ist der erste Fall nicht möglich und damit ϕa injektiv. Nach Linearer Algebra ist aufgrund der Endlichkeit von Z/pZ die Abbildung auch surjektiv, d.h. es gibt genau ein x ∈ Z/pZ mit 1 = ϕa (x) = a · x. Nach Theorem 3.1.11 von Euler und Fermat zeigt sich im weiteren Verlauf sogar die explizite Wahl a−1 = ap−2 . Mittels dieser einfachen Resultate lassen sich bereits lineare Kongruenzen betrachten. Satz 3.1.7. Seien m ∈ N und a, c ∈ Z mit d := ggT(a, m). Dann ist die lineare Kongruenz ax ≡ c (mod m) genau dann lösbar wenn d | c gilt. Im letzteren Fall hat die Kongruenz genau d modulo m inkongruente Lösungen m m x0 , x0 + , . . . , x0 + (d − 1) . d d Für teilerfremde Zahlen (a, m) = 1 gibt es folglich stets eine eindeutige Lösung x0 ∈ Z/mZ. 3.1 Einführung 29 Beweis. Sei zunächst die Kongruenz lösbar mit ax0 ≡ c (m). Dann gibt es ein y ∈ Z mit c = ax0 + ym und die Eigenschaften d | a, d | m ergeben d | c nach Lemma 2.1.2. Gelte umgekehrt d | c, dann gibt es nach Korollar 2.2.5 von Bézout ganze Zahlen x, y mit d = ax + my. Daraus folgt c xc (m). c = (ax + my) ≡ a · d d Dann ist offensichtlich x0 := xc ∈ Z eine Lösung der Kongruenz wegen d | c. d Für den Beweis der Lösungsanzahl sei d | c fest. Für zwei Lösungen x, x′ der Kongruenz folgt dann (m) a a ′ c (m) a ′ ′ ax ≡ ax ≡ c (m) ⇔ x≡ x ≡ ⇒ (x − x ) ≡ 0 . d d d d d d ( ) Wegen Korollar 2.1.12 ist ad , md = 1 und Satz 2.1.14 liefert (m) m | (x − x′ ) ⇔ x ≡ x′ . d d Das heißt die Lösungen sind kongruent modulo dem surjektiven Ringhomomorphismus m d ψ : Z/mZ → Z/ md Z, und dementsprechend haben sie unter y 7→ y dasselbe Bild. Der Homomorphiesatz der Linearen Algebra ergibt für den Kern von ψ { m } |Z/mZ| ν = 0, . . . , d − 1 . |Kern(ψ)| = = d sowie Kern(ψ) = ν (mod m) |Z/ md Z| d Damit hat die Kongruenz für eine feste Lösung x0 höchstens die d Lösungen x0 , x0 + m m , . . . , x0 + (d − 1) , d d denn a(x0 + ν md ) ≡ c + ad νm ≡ c (m) für alle ν = 0, . . . , d − 1. Dass diese Lösungen alle modulo m inkongruent sind, zeigt sich aus folgender Rechnung x0 + ν m m ≡ x0 + ν ′ (m) d d ⇔ (ν − ν ′ ) m ≡ 0 (m) d ⇔ ν ≡ ν ′ (d). Hieraus resultiert direkt der Bezug zu der in Beispiel 2.3.3 definierten Eulerschen ϕFunktion. Korollar 3.1.8. Sei (Z/mZ)× die Gruppe der Einheiten in Z/mZ. Dann gilt (Z/mZ)× = {a ∈ Z/mZ | (a, m) = 1} und insbesondere (Z/mZ)× = ϕ(m). 30 Kongruenzen und Restklassen Beweis. Ist a ∈ (Z/mZ)× eine Einheit, dann gibt es ein x ∈ Z/mZ mit ax ≡ 1 (m), d.h. die lineare Kongruenz ist lösbar mit c = 1. Obiger Satz ergibt (a, m) | c, also (a, m) = 1. Gelte umgekehrt (a, m) = 1, so ist nach Satz 3.1.7 die Kongruenz für c = 1 lösbar und damit a eine Einheit in Z/mZ. Mittels Division mit Rest ist jedes a ∈ Z modulo m kongruent zu einem Rest 0 ≤ r < m, d.h. für die Einheiten folgt ∑ (Z/mZ)× = 1 = ϕ(m). 1≤r≤m, (m,r)=1 Definition 3.1.9. Seien a1 , . . . , aϕ(m) ∈ Z derart, dass { } (Z/mZ)× = a1 , . . . , aϕ(m) . Dann heißt {a1 , . . . , aϕ(m) } ein primes oder primitives vollständiges Restsystem modulo m oder kurz primes Restsystem modulo m. Beispiel 3.1.10. (a) Ist p ∈ P, so folgt mit ϕ(p) = p − 1, dass {1, . . . , p − 1} ein primes vollständiges Restsystem modulo p ist. (b) Ist {x1 , . . . , xϕ(m) } ein primes Restsystem modulo m und a ∈ Z mit (a, m) = 1. Dann ist auch {ax1 , . . . , axϕ(m) } ein primes Restsystem modulo m. Denn wegen (xi , m) = 1 = (a, m) ist auch nach Satz 2.1.14 (axi , m) = 1 und damit axi ∈ (Z/mZ)× für i = 1, . . . , ϕ(m). Dieser Satz garantiert ebenso die Injektivität von ϕa : (Z/mZ)× → (Z/mZ)× , x 7→ a · x, da ϕa (x) = ϕa (y) genau dann der Fall ist wenn a(x − y) ≡ 0 (m) gilt. Wegen (a, m) = 1 impliziert Satz 2.1.14 x ≡ y (m). Damit sind alle Elemente axi modulo m inkongruent. Theorem 3.1.11. Für a ∈ Z gelten (i) (Satz von Euler-Fermat) Sei m ∈ N mit (a, m) = 1, dann gilt aϕ(m) ≡ 1 (m). (ii) Sei p ∈ P, p ∤ a, dann gilt für alle ν ∈ N ν−1 (p−1) ap ≡ 1 (mod pν ). (iii) (Kleiner Fermatscher Satz) Ist p ∈ P, so folgt ap ≡ a (p). Beweis. Es genügt (i) zu zeigen, denn mit ϕ(pν ) = pν−1 (p − 1) für ν ∈ N folgt daraus (ii). Ebenso folgert man (iii) für ν = 1 nach einer Multiplikation mit a für p ∤ a. Ist p ein Teiler von a, so gilt offensichtlich ap ≡ 0 ≡ a (p). Für den Beweis von (i) betrachte man erneut die Hilfsfunktion ϕa aus Beispiel 3.1.10 (b). 3.1 Einführung 31 Da (Z/mZ)× endlich ist, folgt aus der Injektivität die Bijektivität der Abbildung und man hat ϕ(m) ϕ(m) ϕ(m) ϕ(m) ∏ ∏ ∏ ∏ ϕ(m) xi ≡ axi (m) ⇔ xi ≡ a xi (m). i=1 i=1 i=1 i=1 Da für ein primes Restsystem {x1 , . . . , xϕ(m) } multiplikative Inverse in Z/mZ für jedes xi existieren, lässt sich sukzessiv mit diesen Inversen multiplizieren und man erhält die Aussage. Aus diesem wichtigen Theorem folgt bereits die Lösbarkeit einer einfachen quadratischen Kongruenz in Z/pZ. Korollar 3.1.12. Sei n ∈ N, n > 1. Dann gelten (i) (Satz von Wilson) n ist prim genau dann wenn (n − 1)! ≡ −1 (n) gilt. (ii) Für ungerades n = p ∈ P ist (( p−1 ) )2 ! ≡ 2 { −1 (p) für 1 (p) für p ≡ 1 (4), p ≡ 3 (4). Insbesondere sind die quadratischen Kongruenzen x2 ≡ −1 (p) im Fall p ≡ 1 (4) lösbar. Beweis. (i) Sei zunächst n = p ∈ P. Betrachtet man das Polynom f (X) := X p−1 − 1 ∈ (Z/pZ)[X] mit dem Grad p − 1, so hat das von Null verschiedene Polynom über dem Körper Z/pZ höchstens p − 1 Nullstellen. Nach Theorem 3.1.11 (ii) folgen bereits die p − 1 modulo p verschiedenen Nullstellen, nämlich gerade die Einheiten in Z/pZ. Daraus resultiert die Linearfaktorzerlegung f (X) = (X − 1) · . . . · (X − p − 1). Vergleicht man den konstanten Term des Polynoms, so folgt −1 = f (0) = p−1 ∏ (−k) = (−1)p−1 (p − 1)! = (p − 1)!, k=1 denn p ist ungerade. Ist umgekehrt n ∈ N, n > 1 mit (n − 1)! ≡ −1 (n) und sei angenommen, n wäre nicht prim. Dann gibt es nach Satz 2.1.6 einen Teiler 1 < t < n von n. Für diesen Teiler folgt dann aber t | (n − 1)! und im Widerspruch zu t > 1. t|n ⇒ t | −1 32 Kongruenzen und Restklassen (ii) Ist p prim und ungerade, so gibt es ein k ∈ N mit p = 2k + 1. Dann ist nach Beispiel 3.1.3 {0, ±, . . . , ±k} ein vollständiges Repräsentantensystem modulo p. Daraus ergibt sich das prime Restsystem {±1, . . . , ±k} modulo p. Ein weiteres primes Restsystem ist nach Beispiel 3.1.10 (a) {1, . . . , p − 1} und es gilt mithilfe von (i) −1 ≡ (p − 1)! ≡ k ∏ j · (−j) ≡ (−1)k (k!)2 (mod p). j=1 Ist p ≡ 1 (4), so ist k = p−1 gerade und es folgt die Behauptung. Für p ≡ 3 (4) folgt 2 ebenfalls mit ungeradem k die Aussage. Damit lässt sich der folgende Spezialfall des Satzes 2.4.10 von Dirichlet ableiten. Korollar 3.1.13. Es gibt unendlich viele Primzahlen p ≡ 1 (4). Beweis. Es genügt für beliebiges n ∈ N zu zeigen, dass es eine Primzahl p ≡ 1 (4) gibt mit p > n. Dazu sei m := (n!)2 + 1 definiert. Wegen n > 1 ist in jedem Fall n! gerade und folglich m > 1 ungerade. Sei p | m der kleinste Primteiler von m. Dann ist auch p ungerade und p > n, da p sonst n! und damit im Widerspruch 1 teilen würde. Damit ist (n!)2 = m − 1 ≡ −1 (p) ⇒ ( ) p−1 p−1 (n!)p−1 = (n!)2 2 ≡ (−1) 2 (p). Nach dem Satz 3.1.11 (ii) ist wegen p ∤ n! 1 ≡ (n!)p−1 ≡ (−1) p−1 2 (p), was nur dann der Fall ist wenn p ≡ 1 (4) ungerade ist. 3.2 Polynomiale Kongruenzen modulo einer Primzahl 33 3.2 Polynomiale Kongruenzen modulo einer Primzahl In dem folgenden Abschnitt sei p stets eine feste Primzahl. Von Interesse sind, wie in Satz 3.1.7 bereits im einfachen Fall untersucht, Aussagen über die Anzahl und eventuell die Gestalt der Lösungen von Polynomkongruenzen modulo p. Dafür betrachtet man Polynome in mehreren Variablen über dem Polynomring Z[X1 , . . . , Xn ] für ein n ∈ N. Sei F (X1 , . . . , Xn ) = r1 ∑ ν1 =0 ··· rn ∑ aν1 ···νn X1ν1 · . . . · Xnνn ∈ Z[X1 , . . . , Xn ] νn =0 ein Polynom mit ganzzahligen Koeffizienten aν1 ···νn ∈ Z für r1 , . . . , rn ∈ N0 . Ist F nicht das Nullpolynom und sei r ∈ N0 die größte Zahl derart, dass es eine Darstellung r = ν1 + · · · + νn gibt mit aν1 ···νn ̸= 0, dann heißt r = deg F der Grad von F . Ist F das Nullpolynom, so setzt man deg F := −∞. Im Reellen oder über Z sind zwei Polynome, deren Funktionswerte auf ganz R bzw. Z übereinstimmen, identisch. Dies gilt in Restklassenringen im Allgemeinen nicht. Beispiel 3.2.1. Das Nullpolynom F (X) = 0 und das von Null verschiedene Polynom G(X) = X p − X ∈ Z[X] haben nach dem kleinen Fermatschen Satz 3.1.11 (iii) dieselben Funktionswerte auf ganz Z/pZ, sind aber nicht identisch. Dieser Umstand motiviert Definition 3.2.2. Seien F, G ∈ Z[X1 , . . . , Xn ]. (i) F und G sind kongruent modulo p (F ≡ G), falls die entsprechenden Koeffizienten der Polynome kongruent modulo p sind. (ii) F und G sind äquivalent modulo p (F ∼ G), falls für alle Tupel (x1 , . . . , xn ) ∈ Zn gilt F (x1 , . . . , xn ) ≡ G(x1 , . . . , xn ) (mod p). Wie Beispiel 3.2.1 zeigt, ist X p − X ∼ 0, aber die beiden Polynome sind nicht kongruent modulo p. Allgemein impliziert daher nur die Kongruenz eine Äquivalenz. Es stellt sich die Frage, ob es wie in obigem Beispiel stets ein äquivalentes Polynom mit geringerem Grad gibt. Definition 3.2.3. Ein Polynom F ∈ Z[X1 , . . . , Xn ] heißt reduziert, falls der Grad von F bezüglich jeder Unbestimmten Xi kleiner als p ist, d.h. ri < p für alle i = 1, . . . , n. Satz 3.2.4. Jedes Polynom F ∈ Z[X1 , . . . , Xn ] ist äquivalent zu einem reduzierten Polynom F ∗ mit deg F ∗ ≤ deg F . Beweis. Nach dem kleinen Fermatschen Satz gilt Xip ∼ Xi für alle i = 1, . . . , n. Da Summen, Vielfache und Produkte von äquivalente Polynomen wiederum äquivalent zueinander sind, lässt sich somit sukzessiv ri∗ < p finden. Damit folgt auch deg F ∗ ≤ deg F . 34 Kongruenzen und Restklassen Satz 3.2.5. Seien F ∼ G ∈ Z[X1 , . . . , Xn ] beide reduziert, dann gilt F ≡ G. Insbesondere ist das zu F äquivalente reduzierte Polynom F ∗ modulo p eindeutig bestimmt. Beweis. Es genügt zu zeigen, dass für reduziertes F ∼ 0 bereits F ≡ 0 gilt. Denn F ∼G⇔F −G∼0 und F ≡ G ⇔ F − G ≡ 0. Dies zeigen wir durch Beweis per Induktion über n. (IA) n = 1. Per Voraussetzung ist deg F < p. Sei F das Polynom, welches durch Reduktion der Koeffizienten von F modulo p entsteht. Dann gilt auch deg F < p. Wegen F ∼ 0 hat das kongruente Polynom F genau p Nullstellen, nämlich für alle x ∈ Z/pZ. Damit hat F mehr Nullstellen als sein Grad und ist damit bereits das Nullpolynom, denn Z/pZ ist ein Körper. Das heißt F ≡ F = 0. (IV) Gelte die Aussage für ein n − 1 ∈ N, n ≥ 2. (IS) n − 1 → n. Wir schreiben F als reduziertes Polynom mit variablen Koeffizienten Ai (X1 , . . . , Xn−1 ) in einer Unbekannten Xn : F (X1 , . . . , Xn ) = p−1 ∑ Ai (X1 , . . . , Xn−1 )Xni . i=0 Wir fixieren das Tupel (c1 , . . . , cn−1 ) ∈ Zn−1 und kürzen ai = Ai (c1 , . . . , cn−1 ) ab, sodass G(Xn ) := F (c1 , . . . , cn−1 , Xn ) = a0 + a1 Xn + · · · + ap−1 Xnp−1 ein reduziertes Polynom mit G ∼ 0 ist. Aufgrund des Induktionsanfangs ist G ≡ 0 und somit ai ≡ 0 (p). Da G für jedes Tupel (c1 , . . . , cn−1 ) ∈ Zn−1 kongruent 0 modulo p ist, gilt für jedes der reduzierten Polynome Ai Ai (X1 , . . . , Xn−1 ) ∼ 0. Gemäß der Induktionsvoraussetzung folgt Ai ≡ 0 und damit F ≡ 0. Ein erstes Ergebnis über die Anzahl von Lösungen von polynomialen Kongruenzen liefert Satz 3.2.6. Sei F ∈ Z[X1 , . . . , Xn ] und deg F < n. Wenn die Kongruenz F (X1 , . . . , Xn ) ≡ 0 (mod p) eine Lösung in (Z/pZ)n besitzt, dann hat die Kongruenz mindestens zwei inkongruente Lösungen in (Z/pZ)n . 3.2 Polynomiale Kongruenzen modulo einer Primzahl 35 Beweis. Ohne Einschränkung sei F nicht konstant, d.h. r := deg F ≥ 1. Angenommen, die Kongruenz habe genau eine Lösung xi ≡ ai (p). Sei H(X1 , . . . , Xn ) := 1 − (F (X1 , . . . , Xn ))p−1 ∈ Z[X1 , . . . , Xn ]. Dann ist deg H = r(p − 1) und mit der Eindeutigkeit der Lösung { 1 (p) falls xi ≡ ai (p), H(x1 , . . . , xn ) ≡ 0 (p) sonst nach Theorem 3.1.11 von Euler und Fermat. Definiere das reduzierte Polynom ∗ H (X1 , . . . , Xn ) = n ∏ ( ) 1 − (Xi − ai )p−1 . i=1 Per Definition und abermals Theorem 3.1.11 ist { 1 (p) falls xi ≡ ai (p), H ∗ (x1 , . . . , xn ) ≡ 0 (p) sonst und daher H ∼ H ∗ . Nach Satz 3.2.5 ist dann H ∗ das zu H äquivalente reduzierte Polynom, welches mit Satz 3.2.4 n(p − 1) = deg H ∗ ≤ deg H = r(p − 1) erfüllt. Dies würde aber n ≤ r implizieren im Widerspruch zur Annahme. Die Existenz einer trivialen Lösung impliziert folglich die Existenz einer weiteren nicht trivialen Lösung. Definition 3.2.7. Seien F ∈ Z[X1 , . . . , Xn ] und r ∈ N. Dann heißt F Form vom Grad r oder homogen vom Grad r, falls alle in F vorkommenden Terme denselben Grad besitzen. Beispielsweise ist F (X1 , . . . , Xn ) = n ∑ i=1 ai Xi2 + n ∑ bij Xi Xj ∈ Z[X1 , . . . , Xn ] i,j=1 eine quadratische Form, d.h. homogen vom Grad r = 2. Korollar 3.2.8. (Satz von Chevalley) Sei F ∈ Z[X1 , . . . , Xn ] eine Form vom Grad 1 ≤ r < n. Dann hat die Kongruenz F (X1 , . . . , Xn ) ≡ 0 (mod p) eine von Null verschiedene, d.h. nicht triviale Lösung. 36 Kongruenzen und Restklassen Beweis. Die Form F vom Grad r ≥ 1 besitzt stets die Nulllösung, welche die Kongruenz löst. Wegen r < n ergibt obiger Satz die Behauptung. Mit ähnlichen Mitteln lässt sich folgender Satz zeigen. Satz 3.2.9. (Warning) Sei F ∈ Z[X1 , . . . , Xn ] vom Grad r < n. Dann ist die Anzahl der Lösungen modulo p der Kongruenz F (X1 , . . . , Xn ) ≡ 0 (mod p) durch p teilbar. Beweis. Ohne Einschränkung sei F nicht konstant, da es sonst entweder keine oder pn Lösungen gäbe. Sei r := deg F ≥ 1 und setze H(X1 , . . . , Xn ) := 1 − (F (X1 , . . . , Xn ))p−1 ∈ Z[X1 , . . . , Xn ]. Dann ist deg H = r(p − 1) und { 1 (p) H(x1 , . . . , xn ) ≡ 0 (p) falls F (x1 , . . . , xn ) ≡ 0 (p), sonst nach Theorem 3.1.11 und der Lösbarkeit. Damit folgt für die Nullstellenmenge N von F , für welche H die charakteristische Funktion darstellt, ∑ ∑ ∑ |N | = H(x) = (1 − (F (x))p−1 ) = pn − (F (x))p−1 . x∈(Z/pZ)n x∈(Z/pZ)n x∈(Z/pZ)n Nun lässt sich F p−1 als Summe von Monomen schreiben gemäß (F (X)) p−1 = r1 ∑ ν1 =0 ··· rn ∑ aν1 ···νn X1ν1 · . . . · Xnνn νn =0 mit gewissen Koeffizienten aν1 ···νn ∈ Z. Mithilfe der Resultate über Primitivwurzeln aus Abschnitt 3.4 zeigt man { ∑ −1 (p) falls (p − 1) | ν, ν x ≡ 0 (p) sonst, x∈(Z/pZ)× denn der erste Fall ist nach Theorem 3.1.11 klar. Nach Satz 3.4.7 gibt es eine Einheit a ∈ (Z/pZ)× , welche ein primes Restsystem erzeugt: (Z/pZ)× = {1, a, . . . , ap−2 }. Eine Kombination mit dem binomischen Lehrsatz unter Berücksichtigung von aν ̸= 1 ergibt dann die obige Kongruenz. Wegen r < n gibt es stets ein Exponent νj mit νj < p − 1, da sonst r(p − 1) ≥ ν1 + · · · + νn ≥ n(p − 1) 3.2 Polynomiale Kongruenzen modulo einer Primzahl 37 folgen würde. Dies und die Summation implizieren im Produkt (F (x))p − 1 stets eine Null modulo p, da die Wahl für jedes Tupel (ν1 , . . . , νn ) möglich ist: r1 rn ∑ ∑ ∑ ∑ |N | ≡ − ··· aν1 ···νn xν11 · . . . · xνnn ≡ 0 (mod p). ν1 =0 νn =0 x1 ∈Z/pZ xn ∈Z/pZ 38 Kongruenzen und Restklassen 3.3 Simultane Kongruenzen Bereits aus Linearer Algebra ist der Chinesische Restsatz bekannt, der an dieser Stelle nochmals formuliert und bewiesen wird. Satz 3.3.1. (Chinesischer Restsatz) Seien m1 , . . . , mr ∈ N paarweise teilerfremd und ∏r a1 , . . . , ar ∈ Z sowie m := i=1 mi . Dann gibt es ein modulo m eindeutig bestimmtes x ∈ Z, welches die folgenden Kongruenzen simultan erfüllt: x ≡ a1 (m1 ), .. . x ≡ ar (mr ). Beweis. Betrachte die Abbildung ϕ : Z/mZ → r ∏ Z/mi Z, x (m) 7→ (x (m1 ), . . . , x (mr )) . i=1 Dann ist ϕ ein wohldefinierter Ringhomomorphismus in den Produktring mit der komponentenweisen Multiplikation und Addition. Für die Injektivität von ϕ genügt es ein x ∈ Kern(ϕ) zu betrachten, d.h. x ≡ 0 (mi ) für i = 1, . . . , r. Aufgrund der paarweisen Teilerfremdheit liefert Satz 2.1.14 sukzessive x ≡ 0 (m). ∏ Da die Mächtigkeit m des Definitionsbereichs mit der des Bildbereichs ri=1 mi übereinstimmt, ist ϕ sogar bijektiv und der Satz ist gezeigt. Obiger Beweis liefert lediglich eine eindeutige Existenzaussage, jedoch kein effektives Verfahren zur Bestimmung der Lösung x modulo m. Deshalb folgender konstruktiver Beweis. Beweis. Für i = 1, . . . , r definiere qi = m/mi . Dann ist ggT(q1 , . . . , qr ) = 1, da m1 , . . . , mr paarweise teilerfremd sind. Nach Lemma 2.2.5 von Bézout gibt es eine Darstellung 1= r ∑ y i qi mit y1 , . . . , yr ∈ Z, i=1 welche mithilfe des Euklidschen Algorithmus bestimmt werden kann. Setzt man nun x = a1 y1 q1 + · · · + ar yr qr , so erfüllt wegen yi qi ≡ 1 (mi ) für i = 1, . . . , r und qj ≡ 0 (mi ) für i ̸= j dieses x alle Kongruenzen modulo mi . Korollar 3.3.2. Seien F∏∈ Z[X1 , . . . , Xn ] und m ∈ N, m > 1 mit der kanonischen Primfaktorzerlegung m = ri=1 pαi i . Dann ist die Kongruenz F (X1 , . . . , Xn ) ≡ 0 (m) 3.3 Simultane Kongruenzen 39 genau dann lösbar wenn für alle i = 1, . . . , r die Kongruenzen F (X1 , . . . , Xn ) ≡ 0 (pαi i ) lösbar sind. Beweis. Offensichtlich gilt mit pαi i | m F (X1 , . . . , Xn ) ≡ 0 (m) (i) ⇒ F (X1 , . . . , Xn ) ≡ 0 (pαi i ) . (i) Seien umgekehrt x1 , . . . , xn die Lösungen der Kongruenzen für jedes i = 1, . . . , r. Dann lässt sich mithilfe des chinesischen Restsatzes jeweils ein modulo m eindeutiges xj bestimmen mit (i) xj ≡ xj (pαi i ) für alle i = 1, . . . , r. Es folgt hieraus (i) αi F (x1 , . . . , xn ) ≡ F (x1 , . . . , x(i) n ) ≡ 0 (pi ) und, da die Primzahlpotenzen paarweise teilerfremd sind, ergibt sich F (x1 , . . . , xn ) ≡ 0 (m). Ein im Allgemeinen sehr schwieriges und tiefliegendes Problem der Zahlentheorie betrifft wie bereits in der Einleitung erwähnt die Lösbarkeit diophantischer Gleichungen F (X1 , . . . , Xn ) = 0 für F ∈ Z[X1 , . . . , Xn ] innerhalb der ganzen Zahlen. Ein Beispiel hierfür liefert der große Fermatsche Satz. Offensichtlich folgt aus der Lösbarkeit der Gleichung in Zn die Lösbarkeit jeder Kongruenz F (X1 , . . . , Xn ) ≡ 0 (m) ∀ m > 1. Im Allgemeinen ist diese notwendige Bedingung jedoch nicht hinreichend für die Existenz einer Lösung der Gleichung. Man kann jedoch folgende Spezialfälle zeigen. Satz 3.3.3. Seien a1 , . . . , an , b ∈ Z. Dann ist a1 X1 + · · · + an Xn = b genau dann in ganzen Zahlen lösbar wenn die entsprechenden Kongruenzen a1 X1 + · · · + an Xn ≡ b (m) lösbar sind. ∀m>1 40 Kongruenzen und Restklassen Beweis. Für den Fall n = 1 vergleiche Satz 3.1.7, jedoch ist dieser durch den folgenden Beweis eingeschlossen. Wir setzen d = ggT(a1 , . . . , an ) und erhalten nach Korollar 2.2.5 Za1 + · · · + Zan = Zd. Das heißt obige Gleichung der linearen Form ist genau dann in Zn lösbar wenn b ∈ Zd ist, also d | b gilt. Da nach obiger Feststellung die Rückrichtung trivial ist, nehmen wir an, es gebe für jedes m ∈ N, m > 1, eine Lösung der Kongruenz: (m) a1 x1 + · · · + an x(m) ≡ b (m) n (m) Damit gibt es für jedes m ein x0 (m) a1 x1 (m) x1 , . . . , x(m) ∈ Z. n mit ∈ Z mit (m) + · · · + an x(m) + mx0 n = b. Folglich ist aber nach dem Lemma von Bézout für jedes m > 1 auch ggT(a1 , . . . , am , m) | b. Gilt d = ggT(a1 , . . . , an ) = 1, so teilt dieser sofort b und die Gleichung der linearen Form hat eine Lösung. Ist d > 1, setzen wir m = d und es folgt mit den Rechenregeln für den ggT ebenfalls d | b. Dagegen viel schwerer zu beweisen ist der folgende Satz 3.3.4. (Hasse-Minkowski) Sei Q ∈ Z[X1 , . . . , Xn ] eine quadratische Form mit Q(X1 , . . . , Xn ) = n ∑ aij Xi Xj . i,j=1 Dann hat die Gleichung Q(X1 , . . . , Xn ) = 0 genau dann eine nicht triviale Lösung wenn alle Kongruenzen Q(X1 , . . . , Xn ) ≡ 0 (m) ∀m>1 nicht trivial lösbar sind. Diese Fälle lassen vermuten, dass für allgemeinere diophantische Gleichungen kaum eine vollständige Lösungstheorie möglich ist. Oftmals lässt sich jedoch eine Lösung modulo einer Primzahlpotenz pα zu einer Lösung modulo pα+1 liften. Diese Idee beschreibt folgender Satz 3.3.5. Sei f ∈ Z[X] ein Polynom mit ganzzahligen Koeffizienten, sei p prim und α ∈ N, α ≥ 2. Sei r ∈ Z eine Lösung von f (X) ≡ 0 (pα−1 ) mit 0 ≤ r < pα−1 . Dann gelten folgende Aussagen: 3.3 Simultane Kongruenzen 41 (i) Ist f ′ (r) ̸≡ 0 (p), dann lässt sich die Lösung r modulo pα−1 eindeutig zu einer Lösung a modulo pα liften, d.h. es gibt genau ein a ∈ N0 mit a < pα sowie a ≡ r (pα−1 ) f (a) ≡ 0 (pα ). und (ii) Ist f ′ (r) ≡ 0 (p), dann gibt es zwei Möglichkeiten: (1) Gilt f (r) ≡ 0 (pα ), so lässt sich die Lösung r auf genau p modulo pα verschiedene Weisen zu einer Lösung modulo pα liften. (2) Gilt f (r) ̸≡ 0 (pα ), so lässt sich die Lösung r nicht liften. Beweis. Sei n = deg f , dann gilt nach dem Satz von Taylor (3.1) f (x + h) = n ∑ f (k) (x) k=0 k! hk für x, h ∈ R. Für Polynome f folgt jedoch für ai ∈ Z, k ∈ N ( n ) ( ) n n k ∑ ∑ ∑ i d i−k i (k) ai k! · xi−k , i · . . . · (i − (k − 1)) · ai x = ai x = f (x) = k k dx i=0 i=k i=k sodass in (3.1) die Koeffizienten für x ∈ Z ebenfalls ganze Zahlen sind. Setzt man x = r und h = qpα−1 für q ∈ Z, so ergibt sich aus der Taylor-Entwicklung (3.1) für α ≥ 2 modulo pα f (r + qpα−1 ) ≡ f (r) + f ′ (r)qpα−1 (mod pα ), denn hk = q k pk(α−1) ≡ 0 (pα ) für k ≥ 2. Nach Voraussetzung findet sich für f (r) ein s ∈ Z mit f (r) = spα−1 . Setzen wir weiter a = x + h als potentielle Lösung modulo pα , hat man f (a) ≡ (s + f ′ (r)q)pα−1 (mod pα ). Jede potentielle Lösung a ∈ Z hat aufgrund der Division mit Rest gemäß Satz 2.2.1 gerade eine Gestalt a = r + qpα−1 und somit ist auch a ≡ r (pα−1 ) eine Lösung modulo pα−1 der Nullstellengleichung von f . Aus obiger Kongruenz ist ersichtlich, dass gilt: f (a) ≡ 0 (mod pα ) ⇔ s + f ′ (r)q ≡ 0 (mod p), wobei letztere Kongruenz im Fall (i) eindeutig im Körper Z/pZ lösbar ist. Reduziert man noch q ∈ Z modulo p, d.h. 0 ≤ q < p, so hat a ∈ N0 die geforderten Eigenschaften und ist eindeutig. Gilt die Voraussetzung von (ii), so erhält man f (a) ≡ f (r) ≡ 0 (mod pα ) ⇔ s≡0 (mod p) und der Fall (2) lässt keine Lösbarkeit zu. Gilt der Fall (1), so ergeben sich die modulo pα inkongruenten Lösungen r, r + pα−1 , . . . , r + (p − 1)pα−1 42 Kongruenzen und Restklassen durch die p modulo p verschiedenen Werte von q. Wählt man wieder a ∈ N0 mit a < pα sind dies alle gelifteten Lösungen mit a ≡ r (pα−1 ) sowie f (a) ≡ 0 (pα ). Als einfache Anwendung dieses Satzes betrachten wir quadratische Kongruenzen. Satz 3.3.6. Sei p ∈ P ungerade und a ∈ Z mit ggT(p, a) = 1. Dann gilt x2 ≡ a (mod pα ) lösbar für alle α∈N ⇔ x2 ≡ a (mod p) lösbar. Beweis. Da die Hinrichtung trivial ist, beweisen wir die Rückrichtung per Induktion über α ∈ N. Der Induktionsanfang ist bereits vorausgesetzt, sodass wir für α ≥ 2 die Lösbarkeit von x2 ≡ a (mod pα−1 ) annehmen. Sei r etwa eine Lösung, dann können wir ohne Einschränkung 0 ≤ r < pα−1 für die Anwendung von Satz 3.3.5 voraussetzen. Dazu ist F (X) = X 2 − a ∈ Z[X] mit f ′ (r) = 2r ̸≡ 0 (p), denn p ∤ a und somit p ∤ r2 , r. Außerdem ist p ungerade. Nach Satz 3.3.5 (i) ergibt sich die Existenz einer Lösung, nämlich genauso viele Lösungen wie es modulo pα−1 bzw. modulo p gibt. Beispiel 3.3.7. Betrachtet man die quadratische Kongruenz im Fall p = 2, d.h. die Lösbarkeit von x2 ≡ a (mod 2α ) für a ∈ Z, α = 1, 2, 3, so folgt hierfür (a) α = 1. Für alle a ∈ Z ist die Kongruenz eindeutig lösbar. (b) α = 2. Da Quadrate in Z/4Z nur die Werte 0, 1 annehmen, ist die Kongruenz genau dann lösbar wenn a ≡ 0, 1 (4) ist. (c) α = 2. Quadrate in Z/8Z nehmen nur die Werte 0, 1 und 4 an. Daher ist die Kongruenz genau dann lösbar wenn a ≡ 0, 1, 4 (8) ist. Die einfachen Beispiele aus 3.3.7 lassen ein ähnliches Resultat wie in Satz 3.3.6 für p = 2 erhoffen, wenn auch nicht für α ≤ 3. Genauer hat man Satz 3.3.8. Sei a ∈ Z ungerade, dann gilt für folgende Kongruenzen: x2 ≡ a (2α ) lösbar für alle α≥3 ⇔ Letzteres ist genau dann der Fall wenn a ≡ 1 (8) ist. x2 ≡ a (8) lösbar 3.3 Simultane Kongruenzen 43 Beweis. Die Hinrichtung ist wieder klar. Für die Rückrichtung lässt sich Satz 3.3.5 (ii) nicht direkt anwenden, da keine explizite Lösung bekannt ist. Per Induktion über α ≥ 3 zeigen wir daher die Aussage. Sei also x2 ≡ a (2α ) für ein α ≥ 3 lösbar für ein r ∈ Z. Für die Lösbarkeit der Kongruenz im Fall α + 1 wählt man den Ansatz q2 ≡ a (mod 2α+1 ) mit q = r + γ2α−1 für ein noch zu bestimmendes γ ∈ Z. Nun ist für α ≥ 3 q 2 = r2 + rγ2α + γ 2 22α−2 ≡ r2 + rγ2α (mod 2α+1 ) und q2 ≡ a ⇔ (mod 2α+1 ) r2 − a + rγ2α ≡ 0 (mod 2α+1 ). Nach Induktionsvoraussetzung ist dies äquivalent zu r2 −a 2α + rγ ≡ 0 (mod 2). Per Voraussetzung ist r2 und damit r ungerade und letztere Kongruenz ist im Körper Z/2Z eindeutig nach γ auflösbar. Dies liefert eine Lösung q der obigen Form. Beispiel 3.3.7 (c) ergibt die vollständige Aussage des Satzes. 44 Kongruenzen und Restklassen 3.4 Primitivwurzeln Zur Lösung von sogenannten Binomialkongruenzen X n ≡ b (mod m) ist man an den Werten der Potenzen an , a ∈ Z, interessiert. Bereits für teilerfremde Zahlen m ∈ N, a ∈ Z wurde in Theorem 3.1.11 gezeigt, dass stets aϕ(m) ≡ 1 (m) gilt. Jedoch zeigt (−1)2 ≡ 1 (m), dass Potenzen bereits für kleinere Exponenten kongruent 1 sind, falls ϕ(m) > 2 ist. Definition 3.4.1. Sei m ∈ N, a ∈ Z mit ggT(a, m) = 1. Dann heißt vm (a) := min{f ∈ N | af ≡ 1 (m)} die Ordnung von a modulo m. Definition 3.4.2. Eine Zahl a ∈ Z heißt Primitivwurzel modulo m für ein m ∈ N mit ggT(a, m) = 1, falls vm (a) = ϕ(m) gilt. Aus der Sicht der Gruppentheorie betrachtet ist vm (a) die Ordnung der Einheit a in der Gruppe (Z/mZ)× . Da diese Gruppe genau ϕ(m) Elemente besitzt, erzeugt eine Primitivwurzel diese Gruppe. Das heißt gibt es eine Primitivwurzel modulo m, so ist (Z/mZ)× zyklisch. Wie sich im weiteren Verlauf zeigen wird, existieren solche Elemente nicht immer. Lemma 3.4.3. Sei m ∈ N, a ∈ Z mit ggT(a, m) = 1. Dann gelten (i) Für k, n ∈ N0 ist ak ≡ an (mod m) ⇔ k ≡ n (mod vm (a)), d.h. insbesondere vm (a) | ϕ(m). (ii) Die Zahlen 1, a, a2 , . . . , avm (a)−1 sind inkongruent modulo m. Beweis. Für den Beweis setze man v := vm (a). (i) Sei ak ≡ an (m) und ohne Einschränkung k ≥ n. Da a eine Einheit ist, ist diese Kongruenz äquivalent zu ak−n ≡ 1 (m). Division mit Rest ergibt k − n = qv + r mit q, r ∈ Z, 0 ≤ r < v. Dann ist mit av ≡ 1 (m) und v minimal auch 1 ≡ ak−n = (av )q ar ≡ ar (m) ⇔ r=0 ⇔ k ≡ n (v). Das Theorem 3.1.11 von Euler-Fermat liefert die Zusatzaussage. 3.4 Primitivwurzeln 45 (ii) Wären zwei Potenzen kongruent, d.h. aµ ≡ aν (m) mit 0 ≤ µ, ν < v, dann folgt a|ν−µ| ≡ 1 (m). Nun ist 0 ≤ |ν − µ| < v und aufgrund der Minimalität ν = µ. Korollar 3.4.4. Sei m ∈ N, a ∈ Z mit ggT(a, m) = 1. Dann ist a eine Primitivwurzel modulo m genau dann wenn {1, a, . . . , aϕ(m)−1 } ein primes vollständiges Restsystem modulo m bildet. Beweis. Die Hinrichtung folgt direkt aus Lemma 3.4.3 (ii) und vm (a) = ϕ(m). Bilden die obigen Zahlen jedoch ein vollständiges primes Restsystem modulo m, so muss jede der ϕ(m) Elemente von (Z/mZ)× enthalten sein, d.h. auch aµ ̸≡ 1 (m) für 1 ≤ µ < ϕ(m) und damit vm (a) = ϕ(m). Offenbar lassen sich prime Restsysteme modulo m auf einfache Weise durch Primitivwurzeln beschreiben. Diese existieren jedoch nicht immer. Satz 3.4.5. Sei a ∈ Z ungerade und α ∈ N, α ≥ 3. Dann gilt α−2 a2 ≡ 1 (mod 2α ), d.h. insbesondere, dass es keine Primitivwurzeln modulo 2α gibt. Beweis. Wir zeigen die Aussage per vollständiger Induktion über α. Für α = 3 sind die ungeraden Zahlen ±1, ±3 in Z/8Z zu quadrieren, welche offensichtlich kongruent 1 sind. Gelte die Aussage für ein α ≥ 3. α−2 Dann gibt es ein t ∈ Z mit a2 = 1 + t2α . Quadrieren liefert daher α−1 a2 = 1 + t2α+1 + t2 22α ≡ 1 + t2 22α (mod 2α+1 ). Wegen 2α ≥ α + 1 ist der Induktionsschritt vollzogen. Mit der Identität ϕ(2α ) = 2α−1 gibt es daher keine Primitivwurzeln modulo 2α . Für ungerade Primzahlen gilt dies glücklicherweise nicht. Um einen Existenzsatz für Primitivwurzeln modulo ungerader Primzahlen zu beweisen, benötigt man folgenden Hilfssatz. Lemma 3.4.6. Sei m ∈ N, a ∈ Z mit ggT(a, m) = 1. Setzt man vm (a) = v, so gilt für k ∈ Z \ {0} v . vm (ak ) = ggT(v, k) Insbesondere ist die Ordnung von a und ak modulo m genau dann gleich wenn k und vm (a) teilerfremd sind. Beweis. Per Definition ist vm (ak ) die kleinste Zahl s ∈ N mit aks ≡ 1 (m). Nach Lemma 3.4.3 (i) ist dies gleichbedeutend zu ks ≡ 0 (v). Wegen (v, k) ∈ N folgt die äquivalente Aussage ( ) v k s ≡ 0 mod (v,k) . (v,k) 46 Kongruenzen und Restklassen k v Nun ist mit den Rechenregeln aus Korollar 2.1.12 ( (v,k) , (v,k) )= 2.1.14 folgt ( ) v vm (ak ) = s ≡ 0 mod (v,k) . (v,k) (v,k) = 1 und gemäß Satz Da s ∈ N minimal ist, ergibt sich die Aussage des Lemmas. Satz 3.4.7. Sei p ∈ P und d ∈ N ein Teiler von ϕ(p) = p − 1. Dann existieren genau ϕ(d) Zahlen a ∈ N mit a ≤ p − 1 und vp (a) = d. Insbesondere gibt es genau ϕ(p − 1) ≥ 1 Primitivwurzeln modulo p. Beweis. Gelte d | (p − 1). Aufgrund der Eindeutigkeit der Ordnung lässt sich {1, . . . , p − 1} = • ∪ B(d) d|(p−1), d>0 schreiben mit B(d) := {s ∈ N | s ≤ p − 1, vp (s) = d}. Es genügt für f (d) := |B(d)| zu zeigen, dass stets f (d) = ϕ(d) gilt. Betrachtet man beide Funktionen genauer, so folgt aufgrund der disjunkten Zerlegung und Korollar 2.3.7 bereits ∑ ∑ f (d) ≥ 0, f (d) = p − 1 = ϕ(d), ϕ(d) ≥ 1. d|(p−1), d>0 d|(p−1), d>0 Wenn wir zeigen können, dass für f (d) ≥ 1 stets f (d) = ϕ(d) folgt, so ergibt die Identität der Summen die zu zeigende Aussage. Sei also f (d) ∈ N. Dann gibt es ein a ∈ N mit Ordnung vp (a) = d. Das heißt a löst die Kongruenz X d − 1 ≡ 0 (mod p). Nach Lemma 3.4.3 (ii) sind alle Lösungen dieser Kongruenz, welche über dem Körper Z/pZ höchstens d Lösungen besitzt, gegeben durch 1, a, . . . , ad−1 . Ist nun s ∈ B(d), so löst diese Zahl obige Kongruenz und ist folglich kongruent zu einer der Potenzen ak , k = 1, . . . , d. Aufgrund von Lemma 3.4.6 ist d = vp (a) = vp (ak ) = vp (s) was per Definition f (d) = |B(d)| = ⇔ ∑ ggT(k, d) = 1, 1 = ϕ(d) 1≤k≤d, ggT(k,d)=1 impliziert. Das Pendant zu Satz 3.4.5 für ungerade Primzahlen ist folgender 3.4 Primitivwurzeln 47 Satz 3.4.8. Sei p ∈ P, p > 2. (i) Es gibt eine Primitivwurzel q modulo p mit q p−1 ̸≡ 1 (p2 ). (ii) Für eine Primitivwurzel q modulo p gilt q ist Primitivwurzel modulo pα ∀α∈N ⇔ q p−1 ̸≡ 1 (mod p2 ). Beweis. Für den Beweis verwenden wir den binomischen Lehrsatz p−1 (p + z) ) p−1 ( ∑ p − 1 k p−1−k = p z . k k=0 (i) Sei w eine Primitivwurzel modulo p nach Satz 3.4.7, d.h. wp−1 ≡ 1 (p). Wendet man Satz 3.3.5 auf die Kongruenz f (X) := X p−1 − 1 ≡ 0 (mod p) an, so folgt f ′ (w) = (p − 1)wp−2 ≡ −w−1 ̸≡ 0 (p) und w lässt sich eindeutig zu einer Einheitswurzel z modulo p2 liften. Dann ist q := p + z ≡ z ≡ w (p) ebenfalls eine Primitivwurzel modulo p. Für dieses q folgt ( ) p − 1 1 z−2 p−1 p−1 0 p−1 q = (p + z) ≡p z + pq ≡ z p−1 + (p2 − p)z p−2 (mod p2 ) 1 ≡ 1 − pz p−2 ̸≡ 1 (mod p2 ), denn gemäß der Liftung ist 1 ≤ z < p2 und z ≡ w ̸≡ 0 (p), sodass auch z p−2 und p teilerfremd sind. (ii) Sei zunächst q eine Primitivwurzel modulo aller Potenzen pα , α ∈ N. Dann gilt dies insbesondere für α = 2. Wegen vp2 (q) = ϕ(p2 ) = p(p−1) > p−1 ist für den kleineren Exponenten q p−1 ̸≡ 1 (mod p2 ). Sei umgekehrt letztere Inkongruenz erfüllt für eine Primitivwurzel q modulo p. Es genügt nach Lemma 3.4.3 mit t := vpα (q) für α ≥ 2 zu zeigen, dass t = ϕ(pα ) gilt. Mit q t ≡ 1 (pα ) folgt ebenso q t ≡ 1 (p) und nach Lemma 3.4.3 (i) ergibt die Primitivwurzel q modulo p sogar t ≡ 0 (vq (p)) mit vq (p) = ϕ(p) = p − 1. Das heißt es gibt ein s ∈ Z mit t = s(p − 1). Andererseits gilt nach diesem Lemma t | ϕ(pα ), d.h. t ist Teiler von pα−1 (p − 1) und s ist ein Teiler von pα−1 , folglich s = pβ für ein 0 ≤ β ≤ α − 1. Angenommen es gelte β ≤ α − 2, so folgte t = pβ (p − 1) | pα−2 (p − 1) = ϕ(pα−1 ) ⇒ α−1 ) q ϕ(p ≡1 (mod pα ). 48 Kongruenzen und Restklassen Dass letztere Kongruenz jedoch nie der Fall ist für α ≥ 2 zeigen wir per Induktion über α: Für α = 2 ist dies gerade die Voraussetzung. Gelte nun α−1 ) q ϕ(p ̸≡ 1 (mod pα ) für ein α ≥ 2. Nach Theorem 3.1.11 lässt sich ein k ∈ Z finden mit q ϕ(p ) = 1 + kpα−1 , wobei p ∤ k nach Induktionsvoraussetzung gilt. Potenzieren liefert mit α ≥ 2 und p > 2 ( ) ( ) ( )p p p 2 2(α−1) ϕ(pα ) ϕ(pα−1 ) α−1 p α−1 q = q = (1 + kp ) ≡ 1 + kp + k p (mod pα+1 ) 1 2 p − 1 ≡ 1 + kpα + k 2 p2α−1 ≡ 1 + kpα (mod pα+1 ). 2 α Da p kein Teiler von k ist, ergibt sich ebenfalls q ϕ(p ) ̸≡ 1 (pα+1 ), was zu zeigen war. α−1 Als Anwendung des letzten Satzes betrachte man die Binomialkongruenz X n ≡ b (mod m) für b ∈ Z und ungerades m ∈ N mit ggT(m, b) = 1. Gemäß Korollar 3.3.2 genügt es die Lösbarkeit der speziellen Binomialkongruenz X n ≡ b (mod pα ) (3.2) für Primteiler p > 2 von m mit entsprechendem α ∈ N der kanonischen Primfaktorzerlegung von m zu betrachten. Da eine Lösung x ∈ Z/pα Z notwendigerweise mit p ∤ b auch p ∤ x erfüllt, lässt sich nach Lemma 3.4.3 für die Einheiten b und x in Z/pα Z folgender wichtiger Lösungsansatz wählen: b ≡ gν (mod pα ) und x ≡ gµ (mod pα ) für eine Primitivwurzel g modulo pα aus obigem Satz. Man erhält als hinreichendes Kriterium Korollar 3.4.9. Seien p ∈ P ungerade und α ∈ N, b ∈ Z mit p ∤ b. Sei g eine Primitivwurzel modulo pα und man schreibe jeweils b ≡ g ν (pα ) sowie x ≡ g µ (pα ). Dann impliziert die Teilbarkeit ggT(n, ϕ(pα )) | ν die Lösbarkeit von (3.2). Beweis. Mit dem Lösungsansatz und Lemma 3.4.3 folgert man sofort xn ≡ b (mod pα ) ⇔ g µn ≡ g ν (mod pα ) ⇔ µn ≡ ν (mod ϕ(pα )). Mittels Satz 3.1.7 folgt nun die im Allgemeinen nicht eindeutige Lösbarkeit der letzteren linearen Kongruenz genau dann wenn ggT(n, ϕ(pα )) | ν gilt. Gilt letzteres Kriterium für alle Faktoren pαi i der kanonischen Primfaktorzerlegung von ∏r m = i=1 pαi i , so ist auch X n ≡ b (mod m) lösbar. Ist m gerade, so lässt sich zumindest mit den Primitivwurzeln 1 modulo 2 oder 3 modulo 4 arbeiten. Gilt jedoch 8 | m, so lässt sich obiger Lösungsansatz nach Satz 3.4.5 nicht wählen. 3.5 Darstellung als Summe von Quadraten 49 3.5 Darstellung als Summe von Quadraten Wie bereits im vorherigen Kapitel untersucht wurde, ist die Kongruenz X 2 ≡ b (mod pα ) für α ∈ N und jedes Quadrat b ∈ (Z/pZ)× lösbar, denn man sieht leicht Satz 3.5.1. Sei p ∈ P, p > 2. Dann werden alle Quadrate in (Z/pZ)× durch die Zahlen {g 2ν | 0 ≤ ν < p−1 } 2 modulo p repräsentiert für eine Primitivwurzel g modulo p. Insbesondere gibt es Quadrate in (Z/pZ)× . p−1 2 Beweis. Mit Lemma 3.4.3 (ii) ist offensichtlich (Z/pZ)× = {g ν | 0 ≤ ν < p − 1}. Beachtet man Theorem 3.1.11 von Euler und Fermat, so folgt die Aussage. Für die Summe zweier Quadrate folgt damit bereits Lemma 3.5.2. Sei p ∈ P. Dann ist die Kongruenz X 2 + Y 2 ≡ −1 (mod p) lösbar. Beweis. Der Fall p = 2 ist trivialerweise durch (1, 0) oder (0, 1) lösbar. Für p > 2 betrachten wir die Kongruenz y 2 ≡ −1 − x2 (mod p) und zählen die Anzahl der modulo p inkongruenten Werte beider Seiten. Wegen Z/pZ = (Z/pZ)× ∪ {0} folgen mit obigem Satz 3.5.1 bereits für y 2 genau modulo p inkongruente Werte. Mit −1 − x2 ≡ −1 − (x′ )2 (mod p) ⇔ x2 ≡ (x′ )2 p−1 2 +1 (mod p) ergibt sich für die rechte Seite dieselbe Anzahl und somit nimmt die rechte Seite mindestens einen Wert eines Quadrats der linken Seite an. Betrachtet man allgemeiner die Darstellbarkeit natürlicher Zahlen n ∈ N als Summe zweier Quadrate n = x2 + y 2 mit x, y ∈ Z, so genügt es die Lösbarkeit für Primzahlen n ∈ P zu prüfen, denn das Produkt von Summen zweier Quadrate ist stets eine Summe zweier Quadrate, denn (a2 + b2 )(c2 + d2 ) = (ac − bd)2 + (ad + bc)2 , wie man sich leicht mithilfe der Multiplikativität des komplexen Betrags klarmacht. 50 Kongruenzen und Restklassen Lemma 3.5.3. Sei p ∈ P und e ∈ N minimal mit e2 > p. Ist z ∈ Z mit z ̸≡ 0 (p), dann gibt es eine Darstellung z ≡ ±xy −1 (p) mit x, y ∈ N, x, y < e und p ∤ x, y. Beweis. Zunächst ist e ≤ p, denn sonst wäre e > p ≥ (e − 1)2 , was e ∈ {1, 2} im Widerspruch impliziert. Wir betrachten Terme der Form v + zw mit v, w ∈ N0 , v, w < e und z ̸≡ 0 (p). Dabei können für festes z ∈ Z nicht alle e2 Ausdrücke paarweise inkongruent modulo p sein, da es nur p inkongruente Werte gibt. Das heißt es gibt Paare (v, w) ̸= (v ′ , w′ ) ∈ N20 mit v, v ′ , w, w′ < e und v + zw ≡ v ′ + zw′ (p) z(w − w′ ) ≡ v ′ − v (p). ⇔ Nun ist 0 ≤ y := |w − w′ |, x := |v − v ′ | < e ≤ p. Wäre y = 0, so folgte x ≡ 0 (p) und mit x < p auch x = 0. Dies ergibt jedoch einen Widerspruch, denn w = w′ und v = v ′ . Damit ist y ̸≡ 0 (p) invertierbar und man erhält die gewünschte Darstellung, denn wäre x = 0, so folgte y = 0 wegen p ∤ z. Satz 3.5.4. Sei p ∈ P. Dann gibt es genau dann Zahlen x, y ∈ Z mit p = x2 + y 2 wenn die Kongruenz Z 2 ≡ −1 (p) lösbar ist. Beweis. Ist p = x2 + y 2 darstellbar, so gilt p ∤ x, denn sonst folgte p | y 2 und somit p | y sowie p2 | p im Widerspruch. Daher ist x ∈ Z/pZ invertierbar und es folgt x2 + y 2 = p ≡ 0 (p) ⇒ −1 ≡ −(x−1 x)2 ≡ (x−1 y)2 (p), sodass die Kongruenz Z 2 ≡ −1 (p) lösbar ist. Ist z 2 ≡ −1 (p), liefert Lemma 3.5.3 eine Darstellung −1 ≡ z 2 ≡ (xy −1 )2 (p) ⇒ x2 + y 2 ≡ 0 (p). Wegen 0 < x, y ≤ e − 1 < p ist 0 < x2 , y 2 ≤ (e − 1)2 < p und folglich p ≤ x2 + y 2 < 2p. Korollar 3.5.5. Sei p ∈ P. Dann lässt sich p genau dann als Summe zweier Quadrate darstellen wenn p ≡ ̸ 3 (4) gilt. Beweis. Offensichtlich lässt sich p = 2 als Summe zweier Quadrate ganzer Zahlen darstellen. Wegen x2 ≡ 0, 1 (4) ist p ≡ 3 (4) nicht darstellbar. Im Fall p ≡ 1 (4) ergibt Korollar 3.1.12 (ii) die Lösbarkeit der Kongruenz Z 2 ≡ −1 (p) und somit die Darstellbarkeit von p nach obigem Satz. Für die Summe dreier Quadrate bewies bereits Gauß die Darstellbarkeit aller natürlicher Zahlen n = 4k m mit 4 ∤ k und m ̸≡ 7 (8). Klar ist dabei, dass Zahlen n ≡ 7 (8) nicht als Summe dreier Quadrate dargestellt werden können, denn x2 ≡ 0, 1, 4 (8). Ein Beweis des Drei-Quadrate-Satzes von Gauß wird an dieser Stelle ausgelassen und stattdessen die Summe vierer Quadrate genauer betrachtet. 3.5 Darstellung als Summe von Quadraten 51 In Analogie zur komplexen Norm | · | erweist sich der Schiefkörper H der Quaternionen mit der entsprechenden multiplikativen Norm als nützlich, da somit das Produkt zweier Summen von vier Quadraten wiederum eine Summe vierer Quadrate ist: (3.3) (a2 + b2 + c2 + d2 )(w2 + x2 + y 2 + z 2 ) = A2 + B 2 + C 2 + D2 mit A = aw − bx − cy − dz, C = ay − bz + cw + dx, B = ax + bw + cz − dy, D = az + by − cx + dw. Satz 3.5.6. Jedes n ∈ N lässt sich als Summe von vier Quadraten darstellen, d.h. n = w2 + x2 + y 2 + z 2 mit w, x, y, z ∈ Z. Beweis. Aufgrund der oben bereits ausgeführten Multiplikativität genügt es den Beweis für n = p ∈ P zu führen, offensichtlich sogar für p > 2. Nach Lemma 3.5.2 gibt es ein m ∈ N mit pm = x2 + y 2 + 12 + 02 , wobei wir ohne Einschränkung gemäß Beispiel 3.1.3 annehmen, dass |x|, |y| ≤ Dies liefert die Abschätzung p−1 2 ist. (p − 1)2 p2 pm = x + y + 1 ≤ 2 +1≤ . 4 2 2 Das bedeutet, für dieses m ≤ chung p 2 2 gibt es ganze Zahlen w, x, y, z ∈ Z als Lösung der Gleipm = w2 + x2 + y 2 + z 2 . Ist m = 1, so ist nichts zu zeigen. Im Fall m > 1 zeigen wir, dass es ein N < m gibt, sodass die Gleichung pN = w2 + x2 + y 2 + z 2 ganzzahlig lösbar ist. Führt man diesen Abstieg induktiv fort, so erhält man nach endlich vielen Schritt N = 1, was den Satz beweist. Sei also 1 < m ≤ p2 mit pm = w2 + x2 + y 2 + z 2 und seien a, b, c, d ∈ Z die betragsmäßig kleinsten Reste modulo m der Zahlen w, x, y, z, d.h. m a ≡ w (m), b ≡ x (m), c ≡ y (m), d ≡ z (m) und |a|, |b|, |c|, |d| ≤ . (3.4) 2 Damit folgt pm = w2 + x2 + y 2 + z 2 ≡ a2 + b2 + c2 + d2 ≡ 0 (m) bzw. a2 + b2 + c2 + d2 = m′ m für ein m′ ∈ N0 . Wäre m′ = 0, so auch w ≡ x ≡ y ≡ z ≡ 0 (m) und die Summe der Quadrate ist durch 52 Kongruenzen und Restklassen m2 teilbar. Aber m2 | pm impliziert m = p im Widerspruch zu 1 < m ≤ p2 . Mit m′ ∈ N ergibt sich pm · mm′ = (w2 + x2 + y 2 + z 2 ) · (a2 + b2 + c2 + d2 ) = A2 + B 2 + C 2 + D2 mit den Bezeichnungen aus (3.3). Bedingung (3.4) liefert A ≡ B ≡ C ≡ D ≡ 0 (m) und daher die Darstellbarkeit ( )2 ( )2 ( )2 ( )2 A B C D ′ pm = + + + . m m m m Bereits klar ist m′ = m−1 (a2 + b2 + c2 + d2 ) ≤ m mit (3.4), d.h. im Fall m′ < m wählen wir N = m′ . Sei nun m′ = m, dann nehmen die Zahlen a, b, c, d ihre betragsmäßig größten Werte an a2 + b2 + c2 + d2 = m2 ⇒ |a| = |b| = |c| = |d| = m 2 und m ist gerade. Wegen (3.4) folgt 4pm = (2w)2 + (2x)2 + (2y)2 + (2z)2 ≡ (2a)2 + (2b)2 + (2c)2 + (2d)2 ≡ 0 (m2 ), sodass schließlich m | 4 gilt und es nur zwei Fälle gibt: Ist m = 4 folgt mit 2w ≡ 2x ≡ 2y ≡ 2z ≡ 0 (m) schließlich ( )2 ( w )2 ( x )2 ( y )2 ( z )2 1 p= + + + pm = 2 2 2 2 2 und p ist als Summe von ganzzahligen Quadraten darstellbar. Ist m = 2, so ergibt sich mit 2p = w2 + x2 + y 2 + z 2 und 2 = 12 + 12 + 02 + 02 analog zu (3.3) 4p = (w − x)2 + (w + x)2 + (y − z)2 + (y + z)2 . Hierbei sind aber a, b, c, d ∈ {±1} und w ≡ x ≡ y ≡ z ≡ 1 (2) alle ungerade. Damit sind die Summe bzw. Differenz zweier solcher Zahlen w ± x und y ± z gerade und es lässt sich p darstellen als Summe vierer ganzzahliger Quadrate, was zu zeigen war. 4 Quadratische Reste Bereits in Abschnitt 3.3 haben wir quadratische Kongruenzen betrachtet. Im Folgenden interessieren uns sogenannte quadratische Reste. 4.1 Das Legendre-Symbol Definition 4.1.1. Sei m ∈ N, a ∈ Z mit ggT(a, m) = 1. Dann heißt a quadratischer Rest modulo m, falls die Kongruenz X2 ≡ a (mod m) lösbar ist. Nach dem chinesischen Restsatz 3.3.1 und den Erkenntnissen aus Abschnitt 3.3 folgt direkt Satz 4.1.2. Sei m ∈ N. Dann ist a ∈ Z mit ggT(a, m) = 1 genau dann quadratischer Rest modulo m wenn a quadratischer Rest modulo aller Primteiler von m ist und im Falle m = 4 zusätzlich a ≡ 1 (4) sowie im Falle 8 | m zusätzlich a ≡ 1 (8) gilt. Beweis. Für m = 1 ist nichts ∏ zu zeigen, für m > 1 betrachte man die kanonische Primfaktorzerlegung von m = ri=1 pαi i und nach Korollar 3.3.2 ist X2 ≡ a (mod m) lösbar ⇔ X2 ≡ a (mod pαi i ) ∀ i = 1, . . . , r lösbar. Für ungerade Primteiler gilt Satz 3.3.6 und für p = 2 liefert Satz 3.3.8 mittels Beispiel 3.3.7 die Behauptung. Aufgrund dieser Aussage genügt es zunächst quadratische Reste modulo einer Primzahl p ∈ P zu betrachten. Um genauere Eigenschaften solcher quadratischer Reste herzuleiten, macht man für ungerade Primzahlen Definition 4.1.3. Sei p ∈ P, p > 2 und a ∈ Z mit ggT(a, p) = 1. Dann heißt { ( ) 1 falls a quadratischer Rest modulo p, a := p −1 sonst das Legendre-Symbol von a modulo p. Für dieses Symbol lässt sich folgender auf Euler zurückgehender Satz beweisen. 53 54 Quadratische Reste Satz 4.1.4. Seien a, b ∈ Z, p ∈ P mit p ∤ a, b. Dann gilt ( ) ( ) (i) a ≡ b (p) impliziert ap = pb . (ii) (Eulersches Kriterium) ( ) p−1 a ≡a 2 p (mod p). (iii) Das Legendre-Symbol ist streng multiplikativ, d.h. ( ) ( ) ( ) ab a b = · . p p p Beweis. Per Definition folgt sofort (i). Ist (ii) gezeigt, folgt mit Satz 2.1.14 (c) die Wohldefiniertheit von ( ) ( )( ) p−1 p−1 p−1 ab b a ≡ (ab) 2 ≡ a 2 b 2 ≡ (mod p). p p p Da die vorkommenden Legendre-Symbole nur Werte ±1 annehmen können und p > 2 gilt, folgt sogar Gleichheit. Daher genügt es, (ii) zu zeigen. Wir zeigen ( ) p−1 a = 1 ⇔ a 2 ≡ 1 (mod p), p denn nach Theorem 3.1.11 von Euler und Fermat gilt ( p−1 ) ( p−1 ) ap−1 − 1 ≡ a 2 − 1 a 2 + 1 ≡ 0 (mod p), p−1 d.h. a 2 ≡ ±1 (p) nimmt nicht mehr Werte an. Sei dazu g eine Primitivwurzel modulo p gemäß Satz 3.4.7 und schreibe a ≡ g ν (p). ⇒: Sei x2 ≡ a (p) lösbar. Wir schreiben x ≡ g µ (p) und erhalten x2 ≡ g 2µ ≡ g ν ≡ a (p) ⇔ 2µ ≡ ν (p − 1) nach Lemma 3.4.3. Da p − 1 gerade ist, ist auch ν gerade und es folgt a p−1 2 ⇐: Ist ν gerade, so folgt ≡ (g ν ) p−1 2 ν ≡ (g p−1 ) 2 ≡ 1 ν a ≡ (g 2 )2 (mod p). (mod p) und die Kongruenz ist lösbar, d.h. a quadratischer Rest modulo p. Angenommen ν wäre ungerade, etwa ν = 2r + 1 mit r ∈ Z, dann folgt gemäß 1≡a p−1 2 ≡ (g 2r+1 ) p−1 2 ≡ (g p−1 )r g p−1 2 ≡g p−1 2 (mod p) ein Widerspruch für die Primitivwurzel g, denn ϕ(p) = p − 1 > p−1 . 2 4.1 Das Legendre-Symbol Ergänzend setzt man 55 ( ) a := 0, p falls p | a. Die Aussagen des Satzes 4.1.4 bleiben auch mit dieser verallgemeinerten Definition gültig, wie man sich leicht überlegt. 56 Quadratische Reste 4.2 Das Jacobi-Symbol Eine direkte Verallgemeinerung quadratischer Reste modulo beliebiger ungerader m ∈ N stellt das im diesem Abschnitt behandelte Symbol dar. Definition 4.2.1. Sei m ∈ N ungerade. Ein Halbsystem modulo m ist eine Menge ganzer Zahlen {b1 , . . . , b m−1 }, sodass 2 { } 0, ±b1 , . . . , ±b m−1 2 ein vollständiges Restsystem modulo m ist. Ist die Anzahl m klar, schreiben wir auch {bµ } für das Halbsystem. Beispielsweise ist die Menge Hm := {1, . . . , m−1 } 2 ein Halbsystem modulo m. Satz 4.2.2. Seien m ∈ N ungerade, a ∈ Z mit ggT(a, m) = 1 und {bµ } ein beliebiges Halbsystem modulo m, dann gibt es eine Permutation π : Hm → Hm mit abµ ≡ bπ(µ) eµ ∀ µ ∈ Hm (mod m) und Einheiten eµ ∈ {±1} = Z× . Beweis. Klar ist aufgrund der Definition des Halbsystems, dass es zu jedem µ ∈ Hm ein Funktionswert π(µ) ∈ Hm gibt mit abµ ≡ bπ(µ) eµ (mod m). Es bleibt zu zeigen, dass π eine Bijektion ist. Aufgrund der Endlichkeit von Hm genügt es die Injektivität von π zu zeigen. Dazu seien π(µ) = π(ν) mit abµ ≡ bπ(µ) eµ (mod m), abν ≡ bπ(ν) eν (mod m). Dann folgt mit eµ , eν ∈ {±1} und ggT(a, m) = 1 abµ eµ ≡ bπ(µ) ≡ bπ(ν) ≡ abν eν (mod m) ⇒ bµ eµ ≡ bν eν (mod m). Dies liefert bµ ≡ bν eν eµ (m), wobei das Produkt der beiden Einheiten ±1 ist. Daher muss bereits µ = ν gelten, da sonst {bµ } kein Halbsystem wäre. Wählt man in obiger Proposition verschiedene Halbsysteme, so hängen die Einheiten eµ in der Regel vom gewählten Halbsystem ab. Zeigen lässt sich jedoch Lemma 4.2.3. Seien m ∈ N ungerade, a ∈ Z mit ggT(a, m) = 1 und {bµ }, {cµ } Halbsysteme modulo m mit abµ ≡ bπ(µ) eµ (mod m) und acµ ≡ cπ(µ) fµ (mod m) ∀ µ ∈ Hm 4.2 Das Jacobi-Symbol 57 und eµ , fµ ∈ {±1}. Dann ist m−1 2 m−1 2 ∏ eµ = µ=1 ∏ fµ , µ=1 d.h. das Produkt aller Einheiten ist unabhängig von der Wahl des Halbsystems. Beweis. Nach Umnummerierung kann man annehmen, dass mit εµ ∈ {0, 1} cµ ≡ (−1)εµ bµ ∀ µ ∈ Hm (mod m) gilt. Damit lässt sich fµ modulo m ablesen aus acµ ≡ abµ (−1)εµ ≡ (−1)εµ bπ(µ) eµ ≡ cπ(µ) (−1)εµ +επ(µ) eµ (mod m). Daher erhält man m−1 2 ∏ m−1 2 fµ = µ=1 ∏ m−1 2 (−1)εµ +επ(µ) eµ = (−1)ε · µ=1 ∏ eµ µ=1 mit geradem m−1 m−1 ε= 2 ∑ επ(µ) + µ=1 2 ∑ m−1 εµ = 2 µ=1 2 ∑ εµ , µ=1 da π eine Permutation ist und demnach die Summen den gleichen Wert annehmen. Daher lässt sich Folgendes wohldefinieren. Definition 4.2.4. Seien m ∈ N ungerade, a ∈ Z mit ggT(a, m) = 1 und {bµ } irgendein Halbsystem modulo m. Dann heißt (a) m m−1 2 := ∏ eµ µ=1 das Jacobi-Symbol von a modulo m. Das dieses Symbol eine Verallgemeinerung des Legendre-Symbols ist, zeigt Satz 4.2.5. Sei m = p ∈ P ungerade, dann stimmt das Jacobi- mit dem LegendreSymbol überein. Beweis. Per Definition ist abµ ≡ bπ(µ) eµ (p), d.h. p−1 p−1 a p−1 2 2 ∏ µ=1 bµ = 2 ∏ p−1 (abµ ) ≡ µ=1 2 ∏ p−1 (bπ(µ) eµ ) ≡ µ=1 2 ∏ µ=1 p−1 bπ(µ) 2 ∏ µ=1 eµ (mod p). 58 Quadratische Reste Wegen ggT(bµ , p) = 1 und der Permutation π folgt durch Kürzen p−1 a p−1 2 ≡ 2 ∏ eµ (mod p), µ=1 sodass das Euler-Kriterium aus Satz 4.1.4 die Kongruenz zum Legendre-Symbol liefert. Wegen p > 2 ergibt sich wiederum Gleichheit. In Analogie zu Satz 4.1.4 hat man Satz 4.2.6. Seien m ∈ N ungerade, a, b ∈ Z mit ggT(a, m) = 1 = ggT(b, m). Dann gilt (a) (b) (i) a ≡ b (m) impliziert m = m . (ii) Das Jacobi-Symbol ist streng multiplikativ, d.h. ( ) ( ) ( ) ab a b = · . m m m Beweis. Per Definition folgt sofort (i). Sei also {bµ } ein beliebiges Halbsystem und gelte für eµ , fµ ∈ {±1} und Permutationen π, π̃ abµ ≡ bπ(µ) eµ (mod m) und bbµ ≡ bπ̃(µ) fµ (mod m) ∀ µ ∈ Hm . Dann ist abbµ ≡ abπ̃(µ) fµ ≡ bπ(π̃(µ)) eπ̃(µ) fµ (m) mit der Permutation π ◦ π̃ und somit ( ab m ) m−1 2 = ∏ µ=1 m−1 2 (eπ̃(µ) fµ ) = ∏ µ=1 (a) (b) · fν = eµ fν = . m m ν=1 µ=1 ν=1 m−1 2 eπ̃(µ) ∏ m−1 2 ∏ m−1 2 ∏ Wie der nachfolgende Satz zeigt, ist eine Eigenschaft wie das Euler-Kriterium für das Jacobi-Symbol im Allgemeinen nicht gültig. Satz 4.2.7. Seien m, n ∈ N ungerade, a ∈ Z mit ggT(a, m) = 1 = ggT(a, n). Dann gilt ( a ) ( a )(a) = . mn m n Beweis. Seien {bµ } bzw. {cν } Halbsysteme modulo m bzw. n. Wir zeigen, dass B = {bµ + ms | µ ∈ Hm , s = 0, . . . , n − 1} und C = {mcν | ν ∈ Hn } ein Halbsystem H = B ∪ C modulo mn bildet: Klar ist, dass |H| = n|Hm | + |Hn | = mn−1 gilt und es genügt zu zeigen, dass alle Zahlen 2 in H paarweise inkongruent modulo mn sind. Hierfür gibt es 3 verschiedene Fälle 4.2 Das Jacobi-Symbol 59 • Für µ, µ̃ ∈ Hm und s, s̃ ∈ {0, . . . , n − 1} gelte bµ + ms ≡ bµ̃ + ms̃ ⇒ (mod mn) bµ ≡ bµ̃ (mod m), was per Definition des Halbsystems µ = µ̃ ergibt. Dies liefert wiederum s ≡ s̃ (n) nach Division mit m und damit s = s̃ wegen |s − s̃| ≤ n − 1. • Für µ ∈ Hm , ν ∈ Hn und s ∈ {0, . . . , n − 1} gelte bµ + ms ≡ mcν ⇒ (mod mn) bµ ≡ 0 (mod m) im Widerspruch zur Definition des Halbsystems. • Für ν, ν̃ ∈ Hn gelte mcν ≡ mcν̃ (mod mn) ⇒ cν ≡ cν̃ (mod n), was per Definition des Halbsystems ν = ν̃ ergibt. Seien nun abµ ≡ bπ(µ) eµ (mod m) und acν ≡ cπ̃(ν) fν (mod n) ∀ µ ∈ Hm , ν ∈ Hn und eµ , fν ∈ {±1}. Somit folgt nach Anwendung der Halbsysteme B, C für ein t ∈ Z a(bµ + ms) = bπ(µ) eµ + tmeµ = (bπ(µ) + m(nr + s̃))eµ ≡ (bπ(µ) + ms̃)eµ a(mcν ) ≡ mcπ̃(ν) fν (mod mn), (mod mn), gemäß einer Division mit Rest s̃ ∈ {0, . . . , n − 1} im ersten Fall. Kombination dieser Einheiten in H bzw. in B und C getrennt ergibt m−1 n n−1 2 2 ( a ) ( a )n ( a ) ( a ) ( a ) ∏ ∏ = eµ fν = = , mn m n m n µ=1 ν=1 da n ungerade ist. 60 Quadratische Reste 4.3 Das Quadratische Reziprozitätsgesetz Eines der wichtigsten Resultate der elementaren Zahlentheorie ist das nachfolgende Quadratische Reziprozitätsgesetz, dessen Anwendungen in Abschnitt 4.5 genauer betrachtet werden. Theorem 4.3.1. Seien a, m ∈ N ungerade mit ggT(a, m) = 1. Dann gilt ( a ) (m) a−1 m−1 (4.1) = (−1) 2 2 . m a Beweis. Man betrachte das spezielle Halbsystem Hm modulo m, d.h. bµ = µ für alle µ ∈ Hm . Wegen aµ ≡ π(µ)eµ (m) gilt eµ = −1 genau dann wenn aµ ≡ −k mit k ∈ Hm , d.h. m eµ = −1 ⇔ ∃y ∈ Z : − < aµ − my < 0. 2 Damit ist (a) = (−1)ν mit ν = |{(x, y) ∈ Z2 | x ∈ Hm , − m2 < ax − my < 0}|, m denn eine ganzzahlige Lösung der Ungleichung ist eindeutig durch x bestimmt, nämlich gilt für zwei Lösungen (x, y), (x, y ′ ) ∈ Z2 − m m m < ax − my < m(y ′ − y) < + ax − my < . 2 2 2 Offensichtlich gilt für solche Lösungen ebenso my > ax > 0 und my < ax + m2 < (a + 1) m2 , d.h. wegen a ungerade ν = |{(x, y) ∈ Hm × Ha | − m2 < ax − my < 0}|. Analog ist (m) a = (−1)ν ′ mit ν ′ = |{(x, y) ∈ Ha × Hm | − a2 < mx − ay < 0}|. Umbenennung der Variablen liefert ν ′ = |{(x, y) ∈ Hm × Ha | 0 < ax − my < a2 }|. Damit ergibt sich zusammengefasst ( a ) (m) = (−1)µ mit µ = ν + ν ′ = |{(x, y) ∈ Hm × Ha | − m2 < ax − my < a2 }|, m a denn ax = my würde mit ggT(a, m) = 1 direkt m | x implizieren im Widerspruch zu x ∈ Hm . Zur Abschätzung der Anzahl der Lösungen behilft man sich einer geometrischen Argumentation. 4.3 Das Quadratische Reziprozitätsgesetz 61 Es ist L = Hm × Ha ⊂ Z2 ein Gitter, welches durch die Eckpunkte (1, 1), (1, a−1 ), ( m−1 , 1) 2 2 m−1 a−1 sowie ( 2 , 2 ) eines Rechtecks bestimmt ist. Hierin betrachten wir die Teilmenge G = {(x, y) ∈ Hm × Ha | − m2 < ax − my < a2 } ⊂ L mit |G| = µ ≤ |L| = m−1 a−1 , 2 2 sodass es genügt zu zeigen, dass |L \ G| gerade ist. Um dies zu zeigen, weisen wir zunächst nach, dass G symmetrisch zum Mittelpunkt (x0 , y0 ) = ( m+1 , a+1 ) des Rechtecks ist, d.h. 4 4 (x, y) ∈ G ⇔ ( m+1 − x, a+1 − y) ∈ G 2 2 gilt. Gelte also (x, y) ∈ G, d.h. mittels der Ungleichung (x, y) ∈ L mit − m 2 < ax − my < a 2 ⇔ ⇔ ⇔ − m2 < − ax + my − m2 < a2 ( ) ( a+1 ) − x − m − y < − m2 < a m+1 2 2 m+1 a+1 ( 2 − x, 2 − y) ∈ G. a 2 a 2 Damit ist ebenso L\G symmetrisch zum Mittelpunkt, d.h. ist ein Punkt (x, y) ∈ L\G ungleich seinem Spiegelpunkt, so gibt es immer ein Paar von Punkten in L\G. Angenommen Punkt und Bildpunkt wären identisch und lägen beide in L \ G, also (x, y) = ( m+1 − x, a+1 − y) ∈ L \ G 2 2 ⇔ (x, y) = (x0 , y0 ) = ( m+1 , a+1 ) ∈ L \ G, 4 4 folgte ein Widerspruch, denn mit a, m ∈ N folgt (x0 , y0 ) ∈ G: − m2 < ax0 − my0 < a 2 mit ax0 − my0 = a 4 − m . 4 Damit ist |L \ G| gerade und folglich ( a ) (m) a−1 m−1 = (−1)|G| = (−1)|L|−|L\G| = (−1)|L| = (−1) 2 2 . m a Ähnlich der Beweisidee folgen direkt einige wichtige ergänzende Sätze. Satz 4.3.2. (1. Ergänzungssatz) Sei m ∈ N ungerade, dann gilt { ( ) m−1 1 falls −1 = (−1) 2 = m −1 falls m ≡ 1 (4), m ≡ 3 (4). Beweis. Wähle das spezielle Halbsystem Hm mit bµ = µ, womit aus a = −1 stets eµ = −1 für alle µ ∈ Hm folgt. Die Permutation ist in diesem Fall die Identität. Somit ist ( ) ∏ m−1 −1 = eµ = (−1) 2 . m µ∈H m 62 Quadratische Reste Dieses Resultat wurde bereits für ungerade Primzahlen teilweise in Korollar 3.1.12 gezeigt, d.h. dass −1 quadratischer Rest modulo p für p ≡ 1 (4) ist. Dass dies für p ≡ 3 (4) nicht der Fall ist, überlegt man sich ebenso leicht ohne Anwendung des ersten Ergänzungssatzes. Beispiel 4.3.3. 5 ist quadratischer Rest modulo p wenn p ≡ 1, 4 (5) gilt, denn nach dem Reziprozitätsgesetz folgt mit 5 ≡ 1 (4) ( ) ( ) {( 1 ) falls p ≡ 1 (5), 5 p = = ( 5−1 ) p 5 falls p ≡ −1 (5). 5 Der erste Fall ist klarerweise 1 und für den zweiten lässt sich eben bewiesener Satz anwenden. Satz 4.3.4. (2. Ergänzungssatz) Für m ∈ N ungerade gilt { ( ) m2 −1 1 2 = (−1) 8 = m −1 falls falls m ≡ 1, 7 (8), m ≡ 3, 5 (8). Beweis. Analog zum vorherigen Beweis verwende man das Halbsystem Hm . Dann ist 2µ ≡ π(µ)eµ (m) für eine Permutation π. Sei zunächst m ≡ 1 (4). Dann gilt { { 1 für µ = 1, . . . , m−1 , 2µ für µ = 1, . . . , m−1 , 4 4 ( ) eµ = mit π(µ) = m−1 −1 sonst 2 µ − 4 − 1 sonst und wegen m+1 2 ungerade folglich ( ) m−1 m+1 m2 −1 m−1 2 4 4 2 = (−1) = (−1) 8 . = (−1) m Ist m ≡ 3 (4), so folgt ähnlich { 1 für µ = 1, . . . , m−3 , 4 eµ = −1 sonst Da der sonstige Fall mit { 2µ ( π(µ) = 2 µ− ) m−3 4 −1 für µ = 1, . . . , m−3 , 4 sonst. m+1 4 ( Zahlen enthält und m−1 ungerade ist, gilt schließlich 2 ) m+1 m+1 m−1 m2 −1 2 4 4 2 = (−1) = (−1) = (−1) 8 . m Korollar 4.3.5. Sei p ∈ P ungerade. Dann ist 2 quadratischer Rest modulo p genau dann wenn p ≡ 1, 7 (8) gilt. Beispiel 4.3.6. 3 ist kein quadratischer Rest modulo 17, denn nach dem Quadratischen Reziprozitätsgesetz ist ( ) ( ) ( ) 3 17 2 = = = −1 17 3 3 mit 17 ≡ 2 (3) und dem 2. Ergänzungssatz 4.3.4. 4.4 Ein zweiter Beweis des Quadratischen Reziprozitätsgesetzes 63 4.4 Ein zweiter Beweis des Quadratischen Reziprozitätsgesetzes Ein alternativer Beweis des Quadratischen Reziprozitätsgesetzes für zwei ungerade Primzahlen verwendet sogenannte Gauß-Summen. Definition 4.4.1. Sei p ∈ P ungerade und n ∈ Z. Dann heißt ∑ ( ν ) 2πiνn G(n, p) := e p p ν (p) Gauß-Summe, wobei sich die Summe über ein vollständiges Repräsentantensystem modulo p erstreckt. Die obige Summe ist dabei wohldefiniert, denn sie hängt gemäß e2πis = 1 für alle s∈Z nicht von der Wahl des Repräsentantensystems ab. Aufgrund der verallgemeinerten Definition des Legendre-Symbols genügt es über ein vollständiges primes Restsystem zu summieren, was wir mit ∑ ( ν ) 2πiνn ∑ ( ν ) 2πiνn G(n, p) = e p = e p p p ∗ ν (p) andeuten wollen, denn ( ) ν p ν (p) = 0 für p | ν. Satz 4.4.2. Sei p ∈ P ungerade und n ∈ Z. Dann gilt (i) G(0, p) = 0 ( ) (ii) G(n, p) = np G(1, p) 2 (iii) G(1, p) = ( −1 p ) p und insbesondere ist n 7→ G(n, p) p-periodisch. Beweis. (i) Es ist ∑ (ν ) G(0, p) = . p ∗ ν (p) Sei g eine Primitivwurzel modulo p, welche somit ( ) kein quadratischer Rest modulo p ist nach dem Eulerschen Kriterium, d.h. gp = −1. Da g eine Einheit in Z/pZ 64 Quadratische Reste ist, durchläuft mit ν auch gν ein vollständiges primes Restsystem modulo p. Nach Satz 4.1.4 ist folglich ∑ ( ν ) ∑ ( gν ) ( g ) ∑ ( ν ) ∑ (ν ) = = =− , p p p p p ∗ ∗ ∗ ∗ ν (p) ν (p) ν (p) ν (p) also G(0, p) = 0. (ii) Wir untersuchen zwei Fälle getrennt. Gelte zunächst p | n. Dann ist ∑ (ν ) ∑ ( ν ) 2πiνn p = G(n, p) = e =0 p p ∗ ∗ ν (p) ν (p) gemäß (i). Gelte nun p ∤ n, dann ist n eine Einheit und es gilt nach Satz 4.1.4 (iii) ( ) ( −1 ) ( −1 ) ( ) n 1 nn n 1= = = . p p p p ( −1 ) ( ) Wie im Beweis von (i) ergibt sich mit np = np ∑ ( n−1 ν ) 2πiνn−1 n ( n−1 ) ∑ ( ν ) 2πiν G(n, p) = e p = e p p p p ν (p)∗ ν (p)∗ ( ) ( −1 ) n n G(1, p) = G(1, p). = p p ( ) Da mit Satz 4.1.4 die Funktion n 7→ np p-periodisch ist, folgt dies auch für G(·, p). (iii) Es ist aufgrund der Multiplikativität des Legendre-Symbols ∑ ( ν ) 2πiν ∑ ( µ ) 2πiµ ∑ G(1, p)2 = e p e p = p p ∗ ∗ ∗ ν (p) µ (p) ν (p) ,µ (p)∗ ( νµ p ) e 2πi(µ+ν) p . Da für festes µ in der Summe p ∤ µ gilt, lässt sich anstatt über ν auch über µν summieren, d.h. ) ∑ ( ν ) ( µ )2 2πiµ(1+ν) 2πi(µ+νµ) νµ2 p G(1, p) = = e p e p p p ν (p)∗ ,µ (p)∗ ν (p)∗ ,µ (p)∗ ∑ ( ν ) ∑ 2πiµ(1+ν) = e p . p ∗ ∗ 2 ∑ ν (p) ( µ (p) 4.4 Ein zweiter Beweis des Quadratischen Reziprozitätsgesetzes 65 Mit der geometrischen Summenformel erhält man leicht { p−1 ∑ 2πiµ(1+ν) ∑ 2πiµ(1+ν) −1 falls 1 + ν ≡ ̸ 0 (p), e p = e p −1= p − 1 falls 1 + ν ≡ 0 (p). µ=0 µ (p)∗ Daher folgt mit (i) ( ) ( ) ∑ ( ν ) ( −1 ) ∑ (ν ) −1 −1 G(1, p) = − + (p − 1) = − +p =p . p p p p p ∗ ∗ 2 ν (p) ν̸≡−1 (p) ν (p) Satz 4.4.3. Seien p, q ∈ P ungerade und verschieden. Dann gilt ( ) p−1 q−1 p q−1 G(1, p) ≡ (−1) 2 2 (mod q). q Beweis. Da q − 1 gerade ist, folgt nach Satz 4.4.2 (iii) (( q−1 G(1, p) = −1 p ) ) q−1 ( ) q−1 2 p−1 q−1 q−1 −1 2 q−1 p = p 2 = (−1) 2 2 p 2 p mit dem 1. Ergänzungssatz 4.3.2. Das Eulersche Kriterium aus Satz 4.1.4 (ii) ergibt dann die Behauptung modulo q. Um für zwei verschiedene Primzahlen p, q hieraus das Quadratische Reziprozitätsgesetz herzuleiten, genügt es ( ) q q−1 G(1, p) ≡ (mod q) p zu zeigen, da q > 2 ist. Hierfür benötigt man die folgende Fourier-Entwicklung für N -periodische Funktionen f : Z → C, f (n + N ) = f (n) ∀n∈Z für eine Periode N ∈ N. Lemma 4.4.4. Sei f : Z → C eine N -periodische Funktion für N ∈ N, dann besitzt f eine diskrete Fourier-Entwicklung f (n) = ∑ ν (N ) als Fourier-Koeffizienten. a(ν)e 2πiνn N mit a(ν) = 2πiµν 1 ∑ f (µ)e− N N µ (N ) 66 Quadratische Reste Beweis. Für n ∈ Z bzw. n = 1, . . . , N genügt es zu zeigen, dass die Summe mit dem Wert f (n) übereinstimmt: ∑ ν (N ) a(ν)e 2πiνn N ∑ ∑ ∑ ∑ 2πiν(n−µ) 2πiµν 2πiνn 1 1 = f (µ)e− N e N = f (µ) e− N N N ν (N ) = 1 N ∑ µ (N ) µ (N ) ν (N ) f (µ)N = f (n), µ≡n (N ) da die Summe über ν nach der geometrischen Summenformel für n − µ ̸≡ 0 (N ) stets den Wert Null annimmt. Wie man leicht erkennt, sind die Fourier-Koeffizienten der p-periodischen Funktion G(·, p) gerade die Legendre-Symbole. Aus dem nächsten Resultat folgt schließlich der Spezialfall des Quadratischen Reziprozitätsgesetzes. Satz 4.4.5. Seien p, q ∈ P ungerade. Dann gilt (i) q−1 G(1, p) ( ) q = p (ii) Ist p ̸= q, so folgt G(1, p) q−1 ( ∑ ν1 ,...,νq (p) ν1 +···+νq ≡q (p) ( ) q ≡ p ν1 · . . . · νq p ) (mod q) Beweis. (i) Da nach Satz 4.4.2 G(·, p) p-periodisch ist, gilt dies ebenso für G(·, p)q und nach obigem Lemma gibt es eine diskrete Fourier-Entwicklung G(n, p)q = ∑ aq (ν)e 2πiνn p ν (p) mit aq (ν) = 2πiµν 1∑ G(µ, p)q e− p . p µ (p) Per Definition der Gauß-Summe und der Multiplikativität des Legendre-Symbols folgt ∑ ( νq ) 2πiνq µ ∑ ( ν ) 2πiν1 µ G(µ, p)q = e p · ... · e p p p νq (p) ν1 (p) ( ) ∑ 2πi(ν1 +···+νq )µ ν1 · . . . · νq p = e , p ν1 ,...,νq (p) 4.4 Ein zweiter Beweis des Quadratischen Reziprozitätsgesetzes 67 sodass sich die Fourier-Koeffizienten zu ( ) q −ν)µ 1 ∑ ν1 · . . . · νq ∑ 2πi(ν1 +···+ν p aq (ν) = e p p ν1 ,...,νq (p) µ (p) ) ( ∑ ν1 · . . . · νq (4.2) = p ν1 ,...,νq (p) ν1 +···+νq ≡ν (p) ergeben, da die Summation über µ nur in den letzteren Fällen ungleich Null ist. Andererseits folgt für ungerades q aus Satz 4.4.2 (ii) (( ) )q ( ) µ µ q G(µ, p) = G(1, p) = G(1, p)q . p p Die Fourier-Koeffizienten lassen sich daher darstellen als ( ) ∑ 2πiνµ µ − p 1 1 aq (ν) = G(1, p)q e = G(1, p)q G(−ν, p) p p p µ (p) per Definition der Gauß-Summe. Mit Satz 4.4.2 gilt daher ( ) ( )( ) 1 −ν ν −1 G(1, p)2 q q−1 aq (ν) = G(1, p) G(1, p) = G(1, p) p p p p p ( ) ν (4.3) = G(1, p)q−1 . p Durch die Setzung von ν = q in den beiden Darstellungen (4.2) und (4.3) von aq (ν) folgt die Behauptung. (ii) Für p ̸= q ist das Legendre-Symbol ungleich Null und es genügt gemäß (i) zu zeigen: ( ) ∑ ν1 · . . . · νq (4.4) ≡ 1 (mod q) p ν1 ,...,νq (p) ν1 +···+νq ≡q (p) Gibt es ein ν ∈ Z mit ν1 ≡ · · · ≡ νq ≡ ν (p), so ergäbe sich qν ≡ q (p), d.h. ν ≡ 1 (p) wegen der Teilerfremdheit von p und q. In diesem Fall ist der Betrag zur Summe 1. Gibt es ein Paar i ̸= j mit νi ̸≡ νj (p), so betrachte man die zyklische Permutation νi 7→ ν⟨i+α0 ⟩ für i = 1, . . . , q, wobei für α ∈ Z mit ⟨α⟩ die eindeutig bestimmte Zahl mit 1 ≤ ⟨α⟩ ≤ q und ⟨α⟩ ≡ α (mod q) 68 Quadratische Reste sei. Aufgrund der Indexpermutation ist ν⟨1+α0 ⟩ + · · · + ν⟨q+α0 ⟩ ≡ ν1 + · · · + νq ≡ q sowie ( ν⟨1+α0 ⟩ · . . . · ν⟨q+α0 ⟩ p ) Genauer hat man für i = 1, . . . , q { i + α0 ⟨i + α0 ⟩ = i + α0 − q ( = ν1 · . . . · νq p (mod p) ) . falls i + α0 ≤ q, sonst. Betrachtet man nun für zwei verschiedene α0 , β0 ∈ {0, . . . , q − 1} die entsprechenden zyklischen Permutationen, so sind diese als Vektor aufgefasst verschieden, denn sei ohne Einschränkung β0 = α0 + γ ≥ α0 , dann gibt es für α0 ein kα ∈ {1, . . . , q} mit kα + α0 = q und man erhält aus ν⟨i+α0 ⟩ ≡ ν⟨i+β0 ⟩ (p) für i = 1, . . . , q ν1+α0 ≡ ν1+α0 +γ .. . νkα −γ+α0 ≡ νkα −γ+α0 +γ νkα −γ+α0 +1 ≡ ν1 .. . νkα +α0 ≡ νγ ν1 ≡ νγ+1 .. . να0 ≡ νγ+α0 , wobei die letzten Zeilen nur für den Fall α0 > 0 hinzukommen. Rekursiv zeigt man hierbei, dass dann alle Einträge νi modulo p übereinstimmen würden, im Widerspruch zur Annahme, es gäbe ein Paar i ̸= j mit νi ̸≡ νj (p) und p ∈ P. Damit gibt sich zu jedem Tupel (ν1 , . . . , νq ), welches nicht nur modulo p gleiche Einträge besitzt, genau q modulo p inkongruente Tupel mit Einträgen ν⟨i+α0 ⟩ für α0 = 0, . . . , q − 1. Für diese Tupel ändert sich der Wert des Legendre-Symbol nicht und die Anzahl solcher Lösungen ist durch q teilbar. Mit dem ersten Fall identischer Einträge zusammen folgt schließlich die Behauptung. Aus diesem Spezialfall für Primzahlen folgt direkt aufgrund der Multiplikativität des Jacobi-Symbols das allgemeine Quadratische Reziprozitätsgesetz. 4.5 Theoretische Anwendungen des Quadratischen Reziprozitätsgesetzes 69 4.5 Theoretische Anwendungen des Quadratischen Reziprozitätsgesetzes Als Anwendungen des in den letzten Abschnitten hergeleiteten Quadratischen Reziprozitätsgesetzes und der Ergänzungssätze betrachten wir nun die Fermatschen Primzahlen sowie sogenannte biquadratische Reste und geben einen kurzen Einblick in die Lösbarkeit kubischer diophantischer Gleichungen. 4.5.1 Fermatsche Primzahlen Gemäß Lemma 2.4.17 ist eine Zahl 2m +1 für m ∈ N höchstens dann prim wenn m = 2s für ein s ∈ N0 eine reine Zweierpotenz ist. Dieses notwendige Kriterium lässt sich spezifizieren zu Satz 4.5.1. Die Zahl 2m + 1, m ≥ 2, ist genau dann prim wenn 32 m−1 ≡ −1 (2m + 1). Beweis. Sei p = 2m + 1 ∈ P. Wegen m ≥ 2 ist m gerade nach Lemma 2.4.17 und man erhält p ≡ 1 (4) sowie p ≡ (−1)m + 1 ≡ 2 (3). Eine Anwendung des Quadratischen Reziprozitätsgesetzes ergibt ( ) ( ) ( ) p−1 2 3 p m−1 −1 = = = ≡ 3 2 = 32 (mod 2m + 1) 3 3 p mit dem Euler-Kriterium. Sei umgekehrt die Kongruenz erfüllt und p ∈ P ein Primteiler von 2m + 1, dann gilt nach dem chinesischen Restsatz 3.3.1 32 m−1 ≡ −1 (mod p) ⇒ m 32 ≡ 1 (mod p), sodass die Ordnung vp (3) ein Teiler von 2m ist, d.h. vp (3) = 2ν . Wäre ν < m, so folgte m−1 durch sukzessives Quadrieren 32 ≡ 1 (p), was 1 ≡ −1 (p) für p > 2 implizieren würde, also ein Widerspruch. Damit folgt nach Lemma 3.4.3 ebenfalls vp (3) = 2m | ϕ(p) = p − 1 und damit p = 1 + k2m mit k ∈ N. Aufgrund der Teilbarkeit ist aber 2m + 1 ≥ p = 1 + k2m und daher k = 1 sowie 2m + 1 prim. 4.5.2 Biquadratische Reste Definition 4.5.2. Sei p ∈ P ungerade, a ∈ Z mit ggT(a, p) = 1. Dann heißt a biquadratischer Rest modulo p, falls die Kongruenz X 4 ≡ a (p) lösbar ist. Die Verbindung zu quadratischen Resten liefert folgender Satz 4.5.3. Seien p ≡ 3 (4), a ∈ Z mit ggT(a, p) = 1. Dann ist a biquadratischer Rest modulo p genau dann wenn a quadratischer Rest modulo p ist. 70 Quadratische Reste Beweis. Ist a biquadratischer Rest modulo p, so ist offensichtlich a auch quadratischer Rest modulo p. Sei umgekehrt x ∈ Z mit x2 ≡ a (p). Wegen p ≡ 3 (4) ist ggT(4, p − 1) = 2 und nach dem Lemma von Bézout gibt es α, β ∈ Z mit 4α + (p − 1)β = 2. Das Theorem von Euler-Fermat liefert daher a ≡ x2 ≡ x4α+(p−1)β ≡ (xα )4 (xβ )p−1 ≡ (xα )4 (mod p) und xα löst die biquadratische Kongruenz. Analog zum Eulerschen Kriterium erhält man das folgende Kriterium für biquadratische Kongruenzen Lemma 4.5.4. Seien p ≡ 1 (4), a ∈ Z mit ggT(a, p) = 1. Dann ist a genau dann p−1 biquadratischer Rest modulo p wenn a 4 ≡ 1 (p). Beweis. Ist x4 ≡ a (p) für ein x ∈ Z, so folgt mit Theorem 3.1.11 a p−1 p−1 4 ≡ xp−1 ≡ 1 (mod p). p−1 Ist umgekehrt a 4 ≡ 1 (p), dann ergibt Quadrieren a 2 ≡ 1 (p) und das EulerKriterium ergibt die Existenz eines z ∈ Z mit z 2 ≡ a (p). Nochmaliges Anwenden des p−1 p−1 Eulerschen Kriteriums auf die Kongruenz 1 ≡ a 4 ≡ z 2 (p) liefert, dass auch z quadratischer Rest modulo p ist, d.h. a ≡ z 2 ≡ (x2 )2 ≡ x4 (p) für ein x ∈ Z. Hieraus ergibt sich der auf Gauß zurückgehende Spezialfall für a = 2. Satz 4.5.5. (Gauß) Sei p ≡ 1 (4). Dann ist 2 genau dann biquadratischer Rest modulo p wenn p die Gestalt p = x2 + 64y 2 mit x, y ∈ N hat. Beweis. Nach Korollar 3.5.5 ist p ≡ 1 (4) als Summe zweier Quadrate darstellbar, d.h. es gibt a, c ∈ N mit p = a2 + c2 , wobei genau eine der Zahlen gerade ist. Sei ohne Einschränkung c = 2b gerade. Aufgrund des obigen Lemmas 4.5.4 genügt es, folgende Äquivalenz zeigen: p−1 2 4 ≡ 1 (p) ⇔ 4|b Um dies zu zeigen, betrachte man die ungerade Zahl a+c und berechne deren LegendreSymbol auf zwei verschiedene Weisen. Zunächst ist offensichtlich p weder Teiler von a noch von c, sodass diese Einheiten modulo p sind. Definiert man j := ca−1 mit dem multiplikativen Inversen von a, folgt aufgrund der Darstellung von p = a2 + c2 direkt c2 ≡ −a2 (p) bzw. j 2 ≡ −1 (p). Einerseits gilt (a + c)2 = p + 2ac ≡ 2ac (p) und p ∤ (a + c), da ggT(p, a) = 1 = ggT(p, c) ist. Mit dem Euler-Kriterium folgt ) ( ) p−1 ( p−1 p−1 a+c (p) ≡ (a + c) 2 ≡ (a + c)2 4 ≡ (2ac) 4 p ( ) p−1 p−1 p−1 p−1 a ≡ (2aja) 4 ≡ (2j) 4 a 2 ≡ (2j) 4 (p). p 4.5 Theoretische Anwendungen des Quadratischen Reziprozitätsgesetzes 71 Wegen p ≡ 1 (4) liefert das Quadratische Reziprozitätsgesetz mit p ≡ c2 (a) und den Rechenregeln für das Jacobi-Symbol ( ) ( ) ( 2) ( ) a p c c 2 = = = = 1. p a a a Daher hat man ( (4.5) a+c p ) ≡ (2j) p−1 4 (p). Andererseits ist 2p gerade mit 2p = (a + c)2 + (a − c)2 , sodass man mit den Rechenregeln für das Jacobi-Symbol ( 2p a+c ) ( = (a − c)2 a+c ) ( = a−c a+c )2 =1 erhält. Eine Kombination mit dem Quadratischen Reziprozitätsgesetz 4.3.1 und dem 2. Ergänzungssatz 4.3.4 ergibt ( a+c p ) ( ) ( )( ) ( )( )2 p 2p p 2 p = = = a+c a+c a+c a+c a+c ( ) 2 (a+c) −1 2 = = (−1) 8 . a+c Um den Ausdruck mit (4.5) vergleichen zu können, rechnet man (a + c)2 − 1 = p + 2ac − 1 = p − 1 + 4ab und folglich mit j 2 ≡ −1 (p) ( (4.6) a+c p ) ≡ (j 2 ) p−1+4ab 8 ≡j p−1 4 j ab (p). Kombiniert man die beiden Kongruenzen (4.5) und (4.6), folgt mit der Einheit j 2 p−1 4 j p−1 4 ≡j p−1 4 j ab (p) ⇔ 2 p−1 4 ≡ j ab (p). Die zu zeigende Aussage ist damit j ab ≡ 1 (p) ⇔ 4 | b. Mit j 2 ≡ −1 (p) ist jedoch vp (j) = 4 und nach Lemma 3.4.3 teilt die Ordnung den Exponent ab, d.h. 4 | ab. Da a ungerade ist, ergibt sich die behauptete Aussage. 72 Quadratische Reste 4.5.3 Kubische Gleichungen Die Lösbarkeitstheorie kubischer diophantischer Gleichungen ist im Allgemeinen sehr schwierig, weshalb in diesem Fall nur Spezialfälle genannt bzw. bewiesen werden. Beispielsweise hat die Gleichung x3 + y 3 = z 3 für x, y, z ∈ Z keine Lösung mit xyz ̸= 0 wie bereits 1770 Euler mithilfe komplexer Zahlen bewies. Satz 4.5.6. Die Gleichung y 2 = x3 + k hat keine Lösung (x, y) ∈ Z2 , falls k ∈ Z von der Gestalt k = (4n − 1)3 − 4m2 ist mit m, n ∈ Z und m durch keine Primzahl p ≡ 3 (4) teilbar ist. Beweis. Angenommen, es gäbe ganze Zahlen x, y mit y 2 = x3 + k und k ≡ −1 (4) von obiger Gestalt. Dann liefert eine Reduktion modulo 4 y 2 ≡ x3 − 1 (mod 4). Gemäß Beispiel 3.3.7 nimmt die linke Seite nur die Werte 0, 1 modulo 4 an. Dagegen ist x3 ≡ 0 (4) für gerade Zahlen und x3 ≡ ±1 (4) für x ≡ ±1 (4). Das heißt ein Vergleich der beiden Seiten liefert notwendigerweise x ≡ 1 (4). Betrachtet man die ursprüngliche Gleichung genauer und setzt a := 4n − 1, erhält man y 2 + 4m2 = x3 + a3 = (x + a)(x2 − ax + a2 ). Wegen x ≡ 1 (4) und a ≡ −1 (4) ist der erste Faktor gerade und der zweite Faktor ungerade mit x2 − ax + a2 ≡ 3 (4) und daher gibt es mindestens einen Primteiler p ≡ 3 (4) dieses Faktors. Offensichtlich gilt y 2 + 4m2 ≡ 0 (p) ⇔ y 2 ≡ −4m2 (p), womit −4m2 quadratischer Rest modulo p ist: ) ( ) ( )2 ( )2 ( ) ( −1 2 m −1 −4m2 1= = = , p p p p p denn 2 und m sind gerade. Dies führt zum Widerspruch mit dem 1. Ergänzungssatz 4.3.2 wegen p ≡ 3 (4). Beispielhaft seien einige Werte von k gegeben: n 0 m 1 k −5 0 0 0 2 4 5 −17 −65 −101 1 1 1 2 23 11 1 1 2 2 4 5 1 2 −37 −73 339 327 2 4 279 2 5 243 Ein tiefliegendes Resultat sei abschließend ohne Beweis gegeben. Satz 4.5.7. Seien a, b ∈ Z mit 4a3 + 27b2 ̸= 0. Dann hat die Gleichung y 2 = x3 + ax + b nur endlich viele Lösungen (x, y) ∈ Z2 . 5 Ganzzahlige binäre quadratische Formen 5.1 Klassen binärer quadratischer Formen Dieser Abschnitt behandelt die Darstellung ganzer Zahlen durch quadratische Formen und beinhaltet eine genauere Betrachtung der darstellenden Formen für festes n ∈ Z sowie eine Beschreibung der verschiedenen Lösungen eines solchen Darstellungsproblems. Für das Studium der quadratischen Formen macht man folgende Definition 5.1.1. Ein reelles Polynom Q(x, y) = ax2 + bxy + cy 2 mit a, b, c ∈ Z heißt ganzzahlige binäre quadratische Form. In Anlehnung an die Gestalt von Skalarprodukten lässt sich eine quadratische Form mittels einer symmetrischen Matrix ( ) a 2b A= b ∈ Q2×2 c 2 darstellen über das Matrix-Vektorprodukt ( ) x . Q(x, y) = x y A y ( ) Man nennt A die zu Q gehörige Matrix oder Darstellungsmatrix von Q. Im Folgenden verwenden wir der Einfachheit halber die nachstehende Notation. Für A ∈ Qm×m , B ∈ Qm×n setzt man A[B] := B T AB ∈ Qn×n . Offensichtlich gilt für C ∈ Qn×o A[B · C] = (A[B]) [C] ∈ Qo×o und die quadratische Form schreibt sich als Anwendung [( )] x Q(x, y) = A . y Außerdem bezeichne SL2 (Z) die Gruppe der ganzzahligen 2×2-Matrizen mit Determinante 1. 73 74 Ganzzahlige binäre quadratische Formen Definition 5.1.2. Zwei ganzzahlige binäre quadratische Formen Q(x, y) = ax2 +bxy +cy 2 und Q′ (x, y) = a′ x2 + b′ xy + c′ y 2 mit Matrizen A bzw. A′ heißen äquivalent (Q ∼ Q′ ), wenn es ein U ∈ SL2 (Z) gibt mit A′ = A[U ]. Seien Q und Q′ wie in der Definition gegeben und ( ) α β U= ∈ SL2 (Z) mit det U = αδ − βγ = 1. γ δ Dann ist [( )] [ ( )] [( )] x x x Q (x, y) = A = (A[U ]) =A U y y y [( )] αx + βy =A = Q(αx + βy, γx + δy), γx + δy ′ ′ d.h. Q′ geht aus Q durch eine lineare Substitution mit einer Matrix U ∈ SL2 (Z) hervor. Genauer liefert ein Koeffizientenvergleich a′ = aα2 + bαγ + cγ 2 = Q(α, γ), b′ = 2aαβ + b(αδ + βγ) + 2cγδ, c′ = aβ 2 + bβδ + cδ 2 = Q(β, δ). Lemma 5.1.3. Die in Definition 5.1.2 definierte Relation ∼ ist eine Äquivalenzrelation. Das heißt die Menge der ganzzahligen binären quadratischen Formen zerfällt in disjunkte Äquivalenzklassen. Beweis. Die Reflexivität ist klar, da die Einheitsmatrix in SL2 (Z) liegt. Die Relation ∼ ist symmetrisch, denn für Q ∼ Q′ gibt es ein U ∈ SL2 (Z) mit A′ = A[U ]. Da U invertierbar ist, folgt A = A′ [U −1 ], d.h. Q′ ∼ Q aufgrund der Gruppeneigenschaft von SL2 (Z). Die Transitivität folgt analog, denn aus A′ = A[U1 ] und A′′ = A′ [U2 ] folgt A′′ = A[U1 U2 ]. Eine interessante Feststellung, die im späteren Verlauf von Relevanz ist, ist folgende Bemerkung. Wird n ∈ Z durch Q ganzzahlig dargestellt, d.h. es gibt x, y ∈ Z mit Q(x, y) = n, so stellt auch jedes Q′ mit Q′ ∼ Q diese Zahl ganzzahlig dar, nämlich gemäß [( )] [ ( )] [( )] x x −1 −1 x n = Q(x, y) = A = (A[U U ]) = A[U ] U y y y [( )] δx − βy = A′ = Q′ (δx − βy, −γx + αy). −γx + αy Äquivalente Formen lassen sich charakterisieren durch die Definition 5.1.4. Sei die ganzzahlige binäre quadratische Form Q wie bisher gegeben mit Q(x, y) = ax2 + bxy + cy 2 . Die ganze Zahl D := b2 − 4ac heißt Diskriminante von Q. 5.1 Klassen binärer quadratischer Formen 75 Lemma 5.1.5. Die Diskriminante ist eine Klasseninvariante, d.h. Q′ ∼ Q impliziert D′ = D. Beweis. Es ist per Definition ( ) b2 D a 2b − = ac − = det b = det A. c 4 4 2 Mit A′ = A[U ] = U T AU folgt aus der Multiplikativität der Determinante und U ∈ SL2 (Z) det A′ = det(U T ) det A det U = det(U )2 det A = det A, d.h. D = −4 det A = −4 det A′ = D′ . Die Umkehrung der Aussage des Lemmas ist im Allgemeinen nicht richtig. Beispiel 5.1.6. Für D = 0 ist Q(x, y) := y 2 ≁ 2y 2 =: Q′ (x, y), denn gäbe es ein U ∈ SL2 (Z) mit A′ = A[U ], so folgte ( ) ( )( )( ) ( 2 ) 0 0 α γ 0 0 α β γ γδ ′ T = A = A[U ] = U AU = = 0 2 β δ 0 1 γ δ γδ δ 2 √ / Z – ein Widerspruch. und somit γ = 0 und δ = ± 2 ∈ Zentrales Resultat dieses Abschnitts ist der folgende Satz zur Charakterisierung der Klassen ganzzahliger binärer quadratischer Formen. Theorem 5.1.7. Die Anzahl der Äquivalenzklassen ganzzahliger binärer quadratischer Formen mit gegebener Diskriminante ist endlich, falls D ̸= 0. Sie ist unendlich, falls D = 0 gilt. In diesem Fall bilden die Formen Qc (x, y) = cy 2 für c ∈ Z ein vollständiges Repräsentantensystem. Beweis. Der Beweis unterteilt sich in die zwei Fälle D ̸= 0 und D = 0. Jeweils zeigt man die Äquivalenz der Formen zu sogenannten reduzierten Formen, deren Anzahl anschließend abgeschätzt wird. D ̸= 0. • Sei D zunächst keine Quadratzahl, d.h. D nicht von der Form u2 mit u ∈ N und wie bisher [( )] x 2 2 Q(x, y) = ax + bxy + cy = A . y Mit D ̸= 0 sind nicht alle Koeffizienten von Q Null und Q stellt ein von Null verschiedene Zahl dar. Sei a′ ∈ Z \ {0} die dem Absolutbetrag nach kleinste solche Zahl. Dann gibt es α, γ ∈ Z mit Q(α, γ) = a′ . 76 Ganzzahlige binäre quadratische Formen Diese Zahl benutzt man zur Transformation von Q. Da α, γ nicht beide Null sind, gilt für d = ggT(α, γ) (α γ ) , = Q(α, γ) = a′ d2 Q d d und damit d = 1 aufgrund der Minimalität von a′ . Wegen d = 1 finden sich ganze Zahlen β, δ ∈ Z mit αβ − γδ = 1, d.h. ( ) α β U= ∈ SL2 (Z). γ δ Transformiert man Q mit diesem U erhält man Q′ mit [( )] [ ( )] x x ′ ′ Q (x, y) = A =A U . y y Der Koeffizient vor x2 berechnet sich gemäß [( )] [ ( )] α 1 ′ = Q(α, γ) = a′ . =A Q (1, 0) = A U γ 0 Die weiteren Einträge von A′ sind noch genauer zu bestimmen. Wir setzen für b′ , c′ ∈ Z ( ′ b′ ) a ′ A = b′ 2′ . c 2 Im Folgenden wird Q′ weiter transformiert, um eine äquivalente reduzierte Form Q̃(x, y) = ãx2 + b̃xy + c̃y 2 mit |b̃| ≤ |ã| ≤ |c̃| zu erhalten. Dies geschieht mit der Parametermatrix ( ) 1 ν V := ∈ SL2 (Z) für ν ∈ Z. 0 1 Die transformierte Form sei mit Q̃ bezeichnet, dann gilt für die zugehörige Matrix à ( ) ) ( ′ b′ +2a′ ν ã 2b̃ a ′ 2 e . =: A = A [V ] = b′ +2a′ ν ′ 2 b̃ a ν + b′ ν + c′ c̃ 2 2 Wegen a′ ̸= 0 lässt sich ν ∈ Z so wählen, dass |b̃| = |b′ + 2a′ ν| ≤ |a′ | = |ã|. Für dieses fest gewählte ν ist c̃ ̸= 0, denn wäre dies nicht der Fall, so folgte mit der Äquivalenz Q ∼ Q̃ D = b̃2 − 4ãc̃ = b̃2 5.1 Klassen binärer quadratischer Formen 77 im Widerspruch zur Annahme D sei kein Quadrat. Aufgrund der Darstellung c̃ = Q̃(1, 0) wird nach obiger Bemerkung c̃ ̸= 0 auch von der äquivalenten Form Q dargestellt. Die Minimalität der anfangs gewählten Zahl |a′ | bzw. |ã| ergibt direkt |ã| ≤ |c̃| wie gewünscht. Wie eben argumentiert, ist in dieser reduzierten Form auch ã ̸= 0, sonst wäre D eine Quadratzahl. Dies ergibt die Abschätzung der Koeffizienten mittels der festen Diskriminante 4|ã||c̃| = |4ãc̃| = |b̃2 − D| ≤ |b̃|2 + |D| ≤ |ã||c̃| + |D|. Das heißt für ã, c̃ ∈ Z mit |D| 3 gibt es nur endlich viele Möglichkeiten. Entsprechend für b̃, da dieser Koeffizient durch |ã| beschränkt ist. Folglich gibt es nur endlich viele solcher reduzierten Formen. 0 < |ã||c̃| ≤ • Ist D = u2 mit u ∈ N, so zeigt man die Äquivalenz von Q zu Q̃(x, y) = ±uxy + c̃y 2 mit 0 ≤ c̃ ≤ u. Hieraus folgt direkt mit c̃ ∈ Z die Endlichkeit der Anzahl der Äquivalenzklassen. (1) Ist a = 0, so gilt b = ±u wegen u2 = D = b2 − 4ac = b2 . Also ist Q(x, y) = ±uxy + cy 2 . (2) Ist a ̸= 0, so gilt mittels quadratischer Ergänzung und D = u2 4aQ(x, y) = (2ax + (b + u)y)(2ax + (b − u)y). Betrachte die rationalen Nullstellen von Q. Setze zum Beispiel − b−u α = 2a γ als vollständig gekürzten Bruch, d.h. ggT(α, γ) = 1. Wegen a ̸= 0 ist dann Q(α, γ) = 0 und es gibt aufgrund der Teilerfremdheit β, δ ∈ Z mit αδ − βγ = 1. Wählt man diese Koeffizienten als Transformationsmatrix ( ) α β U= ∈ SL2 (Z), γ δ so ergibt sich eine transformierte Form Q′ (x, y) = a′ x2 + b′ xy + c′ y 2 mit a′ = Q(α, γ) = 0 und folglich b′2 = D = u2 , d.h. ebenso b′ = ±u. 78 Ganzzahlige binäre quadratische Formen Nun liegen beide Fälle (1) und (2) in derselben Form vor. Eine letzte Transformation mit der Parametermatrix V ergibt [( ) ( )] 1 ν x ′ Q̃ = A = Q′ (x + νy, y) = ±uxy + (c′ ± uν)y 2 . 0 1 y Wegen u = √ D ̸= 0, lässt sich ν ∈ Z so wählen, dass 0 ≤ c̃ = c′ ± uν ≤ u erfüllt ist. D = 0. Zunächst ist jede Form mit D = 0 äquivalent zu einer Form Qc : Wegen D = −4 det A gibt es im Kern der singulären Darstellungsmatrix über Q einen nicht verschwindenden Vektor (α, γ) ∈ Q2 \ {(0, 0)} mit ( ) ( ) α 0 A = . γ 0 Durch Multiplikation mit dem Hauptnenner der beiden Brüche und anschließendes Teilen durch den ggT ergibt sich (α, γ) ∈ Z2 \ {(0, 0)} mit ggT(α, γ) = 1. Dieses Paar ergibt offensichtlich eine Nullstelle von Q, was wir für die Transformation mit ( ) α β U= γ δ benutzen wollen, wobei wiederum β, δ ∈ Z mit αδ − βγ = 1 gewählt wurden. Die transformierte Form Q′ hat den Koeffizienten a′ = Q(α, γ) = 0 und somit gilt 0 = D = b′2 . Dies ergibt Q′ (x, y) = c′ y 2 = Qc′ . Für die Aussage des Theorems genügt es zu zeigen, dass für alle Formen Qc ≁ Qc′ genau für c ̸= c′ ∈ Z gilt: Ist c = c′ so sind die Formen offensichtlich äquivalent. Sei also Qc ∼ Qc′ angenommen. Dann gilt für die Darstellungsmatrizen mit U ∈ SL2 (Z) analog zu Beispiel 5.1.6 ( ) ( ) [( )] ( 2 ) 0 0 0 0 α β cγ cγδ ′ = A = A[U ] = = . 0 c′ 0 c γ δ cγδ cδ 2 (1) Ist c = 0, so auch c′ = 0. (2) Ist c ̸= 0, so folgt γ = 0 und 1 = det U = αδ. Mit α, δ ∈ Z folgt δ = ±1, d.h. c = c′ . Daher gibt es unendlich viele disjunkte Äquivalenzklassen [Qc ], c ∈ Z, ganzzahliger binärer quadratischer Formen mit D = 0. 5.1 Klassen binärer quadratischer Formen 79 Ist D ̸= 0, kann man im Allgemeinen kein Vertretersystem der Formen mit Diskriminante D in einfacher Schreibweise angeben. Jedoch gibt es weitere Invarianten zur Charakterisierung der Klassen, die im Folgenden vorgestellt seien. Lemma 5.1.8. Seien Q(x, y) = ax2 + bxy + cy 2 und Q′ (x, y) = a′ x2 + b′ xy + c′ y 2 zwei ganzzahlige binäre quadratische Formen mit Q ∼ Q′ und D < 0. Dann ist a, a′ ̸= 0 und das Vorzeichen des Koeffizienten von x2 ist eine Klasseninvariante, d.h. sign(a) = sign(a′ ). Ist a > 0, so ist Q positiv definit, d.h. für alle (x, y) ∈ Z2 \ {(0, 0)} gilt Q(x, y) > 0. Ist a < 0, so ist Q negativ definit, d.h. Q(x, y) < 0 für (x, y) ̸= (0, 0). Beweis. Wäre a = 0 oder a′ = 0, so folgte 0 > D = b2 = (b′ )2 ≥ 0 im Widerspruch. Mittels quadratischer Ergänzung erhält man [( ] )2 b D Q(x, y) = a x + y − 2 y 2 . 2a 4a Für D < 0 ist die eckige Klammer Null genau dann wenn x = y = 0 ist. Dies zeigt die Definitheit in Abhängigkeit des Vorzeichens von a. Sei U ∈ SL2 (Z) mit A′ = A[U ] wie bisher bezeichnet. Dann gilt a′ = Q(α, γ), sodass mit der Definitheit der Form Q dieselben Vorzeichen sign(a) = sign(a′ ) folgen, denn wäre α = γ = 0, so wäre det U = 0 im Widerspruch. Man beachte, dass die negativ definiten Formen aus den positiv definiten durch Multiplikation mit dem Faktor −1 hervorgehen. Sie sind jedoch nicht äquivalent aufgrund des Vorzeichens vor x2 . Außerdem muss hierfür die Diskriminante negativ sein. Eine weitere Invariante wird dem sogenannten Inhalt, dem ggT(a, b, c) der Koeffizienten, einer quadratischen Form zugeschrieben. Lemma 5.1.9. Seien Q(x, y) = ax2 + bxy + cy 2 und Q′ (x, y) = a′ x2 + b′ xy + c′ y 2 zwei ganzzahlige binäre quadratische Formen mit Q ∼ Q′ und Q nicht identisch Null. Dann ist Q′ ebenfalls nicht identisch Null. Ist r = ggT(a, b, c) und r′ = ggT(a′ , b′ , c′ ), so gilt r = r′ , d.h. der Inhalt ist eine Klasseninvariante. Beweis. Sei U ∈ SL2 (Z) wie bisher bezeichnet. Mit A′ = A[U ] gilt A = A′ [U −1 ], d.h. A′ ̸= 0. Wie zu Beginn dieses Abschnitts berechnet, gilt a′ = aα2 + bαγ + cγ 2 , b′ = 2aαβ + b(αδ + βγ) + 2cγδ, c′ = aβ 2 + bβδ + cδ 2 . Damit ergibt sich r | a′ , r | b′ , r | c′ und somit r | r′ . Umgekehrt hat U −1 ganzzahlige Einträge und eine analoge Rechnung liefert die Aussage r′ | r. Folglich sind die Formen von identischem Inhalt. 80 Ganzzahlige binäre quadratische Formen Eine Form vom Inhalt r = ggT(a, b, c) und der Diskriminante D ist offensichtlich das rfache einer Form vom Inhalt 1 und der Diskriminante D/r2 . Daher genügt es im Folgenden solche einfache Formen zu betrachten. Definition 5.1.10. Sei Q(x, y) = ax2 + bxy + cy 2 eine ganzzahlige binäre quadratische Form mit Inhalt ggT(a, b, c) = 1. Dann heißt Q primitiv. Definition 5.1.11. Sei D ∈ Z\{0}. Dann definiert man die nach Theorem 5.1.7 endliche Klassenzahl h(D) als • die Anzahl der Äquivalenzklassen primitiver ganzzahliger binärer quadratischer Formen der Diskriminante D, falls D > 0, • die Anzahl der Äquivalenzklassen positiv definiter primitiver ganzzahliger binärer quadratischer Formen der Diskriminante D, falls D < 0. Während Theorem 5.1.7 eine obere Schranke für die Klassenzahl h(D) liefert, gibt nachfolgendes Lemma eine untere Schranke und somit die Existenz mindestens einer Äquivalenzklasse an. Lemma 5.1.12. Sei D ∈ Z \ {0}. Dann gilt h(D) ≥ 1 ⇔ D ≡ 0, 1 (4). Beweis. Wegen D = b2 − 4ac ≡ b2 ≡ 0, 1 (4) ist für h(D) ≥ 1 klar, dass die Diskriminante der Form die obige Eigenschaft haben muss. Ist umgekehrt D ≡ 0 (4), so erfüllt D 2 y 4 die Eigenschaften von Definition 5.1.11 und für D ≡ 1 (4) genügt diesen ( )2 1 D 1−D 2 Q(x, y) := x + y − y 2 = x2 + xy + y . 2 4 4 Q(x, y) := x2 − Einige Klassenzahlen für kleine Werte der Diskriminante lassen sich mithilfe von Theorem 5.1.7 angeben. Die nicht-elementare Zahlentheorie liefert jedoch geschlossene Formeln für h(D) zur einfacheren Berechnung. Für negative Diskriminanten ergibt sich beispielsweise D h(D) −20 −19 −16 −15 −12 −11 −8 −7 3 1 1 2 1 1 1 1 −4 1 und für einige positive Werte von D liefert eine Rechnung D h(D) 1 1 4 1 5 1 8 1 9 2 12 2 13 1 16 2 17 1 20 3 −3 1 5.2 Automorphismen 81 5.2 Automorphismen Man betrachte ganzzahlige Lösungen (x, y) ∈ Z2 der Gleichung Q(x, y) = n für gegebenes n ∈ Z. Im Folgenden setzen wir Q als primitiv voraus, d.h. ggT(a, b, c) = 1. Wie bereits gezeigt wurde, stellen äquivalente Formen dieselben Zahlen dar. Nun interessiert man sich für äquivalente Lösungen. Definition 5.2.1. Sei A die zu Q gehörige symmetrische Matrix und sei U ∈ SL2 (Z). Dann heißt U Automorphismus von Q, falls A = A[U ] gilt. Bemerkung. Die obige Definition ist äquivalent dazu, dass für alle x, y ∈ Z gilt [( )] [( )] [ ( )] x x x Q(x, y) = A = (A[U ]) =A U = Q(αx + βy, γx + δy). y y y Die eine Richtung ist offensichtlich. Ist umgekehrt Q(x, y) = Q(αx + βy, γx + δy) ∀ x, y ∈ Z so folgt mit den Darstellungsmatrizen A und A′ := A[U ] direkt a = Q(1, 0) = Q(α, γ) = a′ , c = Q(0, 1) = Q(β, δ) = c′ , b = Q(1, 1) − a − c = Q(α + β, γ + δ) − a − c = a′ + b′ + c′ − (a + c) = b′ , d.h. A = A[U ]. Beispiel 5.2.2. (i) Sei Q(x, y) = x2 + y 2 mit D = −4. Dann ist ( ) ( ) 1 0 0 −1 ∈ SL2 (Z) und U := A= 0 1 1 0 ein Automorphismus von Q, denn es gilt für alle x, y ∈ Z ( ) ( ) x −y U = und Q(−y, x) = (−y)2 + x2 = x2 + y 2 = Q(x, y). y x (ii) Sei Q(x, y) = x2 − 2y 2 mit D = 8. Dann ist ( ) ( ) 1 0 3 4 A= und U := ∈ SL2 (Z) 0 −2 2 3 ein Automorphismus von Q, denn es gilt für alle x, y ∈ Z Q(3x + 4y, 2x + 3y) = (3x + 4y)2 − 2(2x + 3y)2 = x2 − 2y 2 = Q(x, y). 82 Ganzzahlige binäre quadratische Formen Lemma 5.2.3. Die Menge der Automorphismen von Q bildet mit der gewöhnlichen Matrixmultiplikation eine Untergruppe Aut(Q) von SL2 (Z). Beweis. Mit der Einheitsmatrix ist Aut(Q) ̸= ∅. Für zwei Automorphismen U, V von Q gilt U V −1 ∈ Aut(Q), denn: A[U V −1 ] = (A[U ])[V −1 ] = A[V −1 ] = (A[V ])[V −1 ] = A[V V −1 ] = A. Für eine Lösung von Q(x, y) = n für festes n ∈ Z stellt nach obiger Bemerkung auch ( ′) ( ) x x =U für U ∈ Aut(Q) ′ y y dieses n gemäß Q(x′ , y ′ ) = n dar. Diese Eigenschaft wird nun benutzt, um eine Äquivalenzrelation auf der Lösungsmenge für festes Q und n zu definieren. Definition 5.2.4. Sei Q eine primitive ganzzahlige binäre quadratische Form und n ∈ Z gegeben. Dann definiert ( ) ( ′) ( ′) ( ) x x x x ∼ :⇔ ∃ U ∈ Aut(Q) mit =U y y′ y′ y eine Äquivalenzrelation auf der Menge der ganzzahligen Lösungen von Q(x, y) = n, denn Aut(Q) ist eine Untergruppe. Diese Äquivalenzklassen nutzen wir nun für folgende Definition 5.2.5. Sei Q eine primitive ganzzahlige binäre quadratische Form mit Diskriminante D ̸= 0 und n ∈ Z gegeben. Sei R(n, Q) die Anzahl der unter der Operation von Aut(Q) inäquivalenten Lösungen von Q(x, y) = n. Man nennt R(n, Q) Darstellungszahl von n durch Q. Man definiert die Gesamtdarstellungsanzahl von n durch primitive ganzzahlige binäre quadratische Formen der Diskriminante D als ∑ h(D) RD (n) := R(n, Qi ), i=1 wobei die Summe über ein Vertretersystem {Q1 , . . . , Qh(D) } der Äquivalenzklassen primitiver ganzzahliger binärer quadratischer Formen mit fester Diskriminante D (positiv definit, falls D < 0 < a, negativ definit, falls D, a < 0) läuft. Die Summe RD (n) ist dabei wohldefiniert, denn R(n, Q) = R(n, Q′ ) für Q ∼ Q′ . 5.2 Automorphismen 83 In der Tat, für Q ∼ Q′ existiert ein U ∈ SL2 (Z) mit A′ = A[U ]. Seien nun ( ) ( ′) x x ∼ , y y′ ∃ V ∈ Aut(Q) d.h. Dann erhält man über ( ) ( ) u −1 x ∈ Z2 := U y v und mit ( ′) ( ) x x =V . ′ y y ( ′) ( ′) u −1 x ∈ Z2 := U y′ v′ die Lösungen von Q′ (u, v) = n = Q′ (u′ , v ′ ). Wählt man V ′ := U −1 V U ∈ Aut(Q′ ), denn A′ [V ′ ] = A′ wegen A[V ] = A, A[U ] = A′ , so sind auch diese Lösungen äquivalent unter dem Automorphismus V ′ von Q′ . Die umgekehrte Richtung folgt analog. Im nächsten Abschnitt wird sich zeigen, dass R(n, Q) stets endlich ist. Dies geschieht über eine geschlossene Formel für die Gesamtdarstellungsanzahl RD (n) für gewisse Diskriminanten D ̸= 0. Für R(n, Q) sind bislang im Allgemeinen keine einfachen Formeln bekannt. Für die Betrachtung von RD (n) benötigt man jedoch Informationen über die Struktur der Untergruppe Aut(Q), die in diesem Abschnitt erarbeitet werden. Im Folgenden nehmen wir an, dass D ̸= 0 keine Quadratzahl ist. Denn ist u2 = D ≡ b2 (4), so sind entweder b und u beide ungerade oder beide gerade. Wie im Beweis von Theorem 5.1.7 zerfällt aQ daher in Linearfaktoren über Z gemäß ( )( ) b+u b−u an = aQ(x, y) = ax + y ax + y 2 2 und die Lösung des Problems wird einfach. Theorem 5.2.6. Sei Q(x, y) = ax2 + bxy + cy 2 eine primitive ganzzahlige binäre quadratische Form mit Diskriminante D ̸= 0, kein Quadrat. Dann liefert die Abbildung (5.1) (t, u) 7→ ( t−bu 2 au ) −cu t+bu 2 ∈ Aut(Q) eine Bijektion zwischen der Menge der Lösungen (t, u) ∈ Z2 der Pellschen Gleichung (5.2) t2 − Du2 = 4 und der Automorphismengruppe Aut(Q). Diese Abbildung ist ein Gruppenisomorphismus, wenn die ganzzahligen Lösungen von (5.2) mit ( (t1 , u1 ) ◦ (t2 , u2 ) := t1 t2 + Du1 u2 u1 t2 + u2 t1 , 2 2 ) 84 Ganzzahlige binäre quadratische Formen als Komposition versehen werden. Ist D < 0 , so ist Aut(Q) zyklisch von der Ordnung 6 falls D = −3, ω = 4 falls D = −4, 2 falls D < −4 und damit endlich. Ist D > 0, so besitzt Aut(Q) unendlich viele Elemente und ist isomorph zu Z × Z/2Z. Beweis. Sei zunächst U ∈ Aut(Q) ein Automorphismus von Q mit Darstellungsmatrix A. Die Bezeichnungen seien wie bisher. Dann gilt wegen A[U ] = A (5.3) (5.4) (5.5) a = Q(α, γ) = aα2 + bαγ + cγ 2 , b = 2aαβ + b(αδ + βγ) + 2cγδ, c = Q(β, δ) = aβ 2 + bβδ + cδ 2 . Dann ist mit (5.4) und det U = αδ − βγ = 1 zunächst 2(aαβ + bβγ + cγδ) = b + b(βγ − αδ) = 0, d.h. in Kombination mit (5.3) aβ = α(aαβ + bβγ) + cβγ 2 = α(−cγδ) + cβγ 2 = −cγ(αδ − βγ) = −cγ. Ferner folgt aus (5.5), det U = 1 und aαβ + cγδ = −bβγ c(α − δ) = (aβ 2 + bβδ + cδ 2 )α − cδ = β(aαβ + bαδ + cγδ) + cδ(αδ − βγ − 1) = β(bαδ − bβγ) = bβ. Da D = b2 − 4ac kein Quadrat ist, können wir a, c ̸= 0 folgern. Zur Herleitung der Lösungen der Pellschen Gleichung (5.2) macht man eine Fallunterscheidung. b ̸= 0. Es gilt mit den eben hergeleiteten Gleichungen denn schreibt man u = p q γ β δ−α =− = =: u ∈ Z, a c b mit q ∈ N in gekürzter Form, so folgen γq = ap, βq = −cp und (δ − α)q = bp. Damit teilt q jeden Koeffizienten der primitiven Form Q. Dies bedeutet aber gerade q | ggT(a, b, c) = 1 und somit q = 1. Setzt man zusätzlich t := δ + α ∈ Z, so folgt die gewünschte Gestalt ) ( t−bu −cu 2 . U= au t+bu 2 Wegen det U = 1 folgt, dass (t, u) ∈ Z2 Lösung der Gleichung (5.2) ist: 1 = αδ − βγ = t2 − Du2 t2 − (bu)2 + au · cu = . 4 4 5.2 Automorphismen 85 b = 0. In diesem Fall ist ggT(a, c) = 1 und man zeigt analog zum ersten Fall, dass γ β = − =: u ∈ Z a c gilt. Mit c ̸= 0 folgt aus c(α − δ) = bβ die Identität von α und δ. Man setzt folglich t = 2α und U hat dieselbe Gestalt wie in im obigen Fall. (t, u) ∈ Z2 ist ebenfalls wieder eine Lösung der Pellschen Gleichung. Sei nun (t, u) ∈ Z2 eine Lösung von (5.2). Dann ist ( t−bu 2 U := au ) −cu ∈ SL2 (Q) t+bu 2 wie man bereits oben im Fall b ̸= 0 gezeigt hat. Wegen t2 − b2 u2 ≡ t2 − Du2 ≡ 0 (4) können die zwei Zahlen t + bu und t − bu, die sich um die gerade Zahl 2bu unterscheiden, nicht beide ungerade sein, d.h. U ∈ SL2 (Z). Mit ( AU = at 2 bt−Du 4 bt+Du 4 ct 2 ) rechnet man leicht A[U ] = A nach und erhält U ∈ Aut(Q). Dies zeigt die Wohldefiniertheit und Bijektivität durch Angabe der Umkehrfunktion der Abbildung (5.1). Dass (5.1) ein Gruppenhomomorphismus darstellt, rechnet man leicht nach für zwei Automorphismen U1 , U2 ∈ Aut(Q) ( t1 −bu1 U1 U2 = 2 −cu1 ) ( t2 −bu2 2 −cu2 ) 1 2 au1 t1 +bu au2 t2 +bu 2 2 ) ( 1 t1 t2 + Du1 u2 − b(u1 t2 + u2 t1 ) −2c(u1 t2 + u2 t1 ) = 2a(u1 t2 + u2 t1 ) t1 t2 + Du1 u2 + b(u1 t2 + u2 t1 ) 4 und vergleicht mit der definierten Komposition für zwei Lösungen der Pellschen Gleichung. Ist D < 0, so folgt aus Gleichung (5.2) t2 ≤ t2 − Du2 = 4 sowie |D|u2 ≤ t2 − Du2 = 4, d.h. |t|, |u| ≤ 2. Wegen D ≡ b2 ≡ 0, 1 (4) ist D ≤ −3 und damit sogar |u| ≤ 1. In diesen Fällen lassen sich die möglichen Lösungspaare einfach ablesen: (±2, 0), (1, ±1), (−1, ±1) falls D = −3, (t, u) = (±2, 0), (0, ±1) falls D = −4, (±2, 0) falls D < −4. 86 Ganzzahlige binäre quadratische Formen Hieraus folgen die Ordnungen von Aut(Q) sowie unter Anwendung von (5.1) die Elemente von Aut(Q). Für die Zyklizität der Gruppe Aut(Q) sei U ein solcher Automorphismus mit ( ) ) ( t−bu −cu α β 2 U= = γ δ au t+bu 2 wie im obigen Beweis, d.h. t = δ + α und au = γ, cu = −β. Definiert man für diese Notation √ t+u D ∈ C, ε := 2 √ so folgt mit 2ε′ := t − u D gerade εε′ = 1 und ε, ε′ ∈ C× sind Einheiten von (C, ·). Betrachtet man die Abbildung ϕ : Aut(Q) → C× , U 7→ ε, dann ist diese ein injektiver Gruppenhomomorphismus: Für ε1 , ε2 hat man √ √ √ t1 + u1 D t2 + u2 D (t1 t2 + Du1 u2 ) + (u1 t2 + u2 t1 ) D ε1 ε2 = = 2 2 4 und sieht die Ähnlichkeit zur Definition der Komposition zweier Lösungen (t1 , u1 ) und (t2 , u2 ) von (5.2). √ Ist also ε = 1 zum Beweis der Injektivität, so folgt √ D ∈ R \ Q, denn D ist kein Quadrat. Aus dieser Eigenschaft folgt u = 0, denn 2 − t = u D ∈ R \ Q, aber 2 − t ∈ Z. Da D kein Quadrat ist, gilt weiterhin a, c ̸= 0 und es folgt aus u = 0 auch β = γ = 0. Wegen 1 = det U = αδ und 2=t=δ+α ist U bereits die Einheitsmatrix und ϕ injektiv. Aus linearer Algebra ist bekannt, dass daher das Bild(ϕ) eine Untergruppe von C× ist. Für die entsprechenden Lösungen (t, u) der Pellschen Gleichung erhält man √ √ 1±i 3 −1±i 3 ±1, , falls D = −3, 2 2 ε = ±1, ±i falls D = −4, ±1 falls D < −4 und erkennt, dass dies ω-te Einheitswurzeln sind, d.h. durch εω := e2πi/ω erzeugt werden und jeweils eine zyklische Untergruppe Uω ⊂ C× bilden. Damit ist auch Aut(Q) zyklisch von der Ordnung ω und wird von ϕ−1 (εω ) erzeugt. Ist D > 0 kein Quadrat, d.h. eigentlich D ≥ 5 aufgrund D ≡ b2 ≡ 0, 1 (4), dann liefert ϕ einen Gruppenmonomorphismus nach R× mit ±1 im Bild, denn die leicht erkennbare 5.2 Automorphismen 87 Lösung (t, u) = (±2, 0) existiert weiterhin. Bild(ϕ) ist weiterhin eine Untergruppe von R× . Betrachte die positive Untergruppe E := {ε ∈ Bild(ϕ) | ε > 0} des Bildes. Offensichtlich gilt Bild(ϕ) = {±1} × E. Es gibt nun zwei Fälle. Entweder E = {1} und es gibt nur die einfache Lösung (t, u) = (±2, 0) oder E beinhaltet mehr Elemente. Mithilfe einiger Arbeit und der ζ-Funktion lässt sich durch nicht-elementare Zahlentheorie zeigen, dass stets der zweite Fall eintritt (vergleiche [6]). Sei also ε ∈ E. Angenommen t ≤ 0, dann ist aber ε oder ε−1 = ε′ negativ und nicht in E enthalten (in Abhängigkeit von u) – Widerspruch, da E eine Gruppe ist. Folglich können wir t ∈ N annehmen. Ist ε > 1, so ergibt sich ε > 1 > ε−1 = ε′ , d.h. √ √ t+u D t−u D > ⇔ u > −u ⇔ u ∈ N. 2 2 Damit folgt im Fall ε ∈ E, ε > 1 direkt √ √ 1+ 5 1+ D ≥ > 1, 5, ε≥ 2 2 womit 1 kein Häufungspunkt von E sein kann, denn mit ε−1 erhält man ebenso, dass alle Elemente ε ̸= 1 von 1 einen Mindestabstand haben. Allgemeiner bestimmt diese Abschätzung für jedes Paar von Elementen 1 < ε1 < ε2 ∈ E einen Mindestabstand, denn 1 < ε2 · ε′1 ∈ E ⇒ 1, 5 < ε2 · ε′1 = ε2 ε1 und damit 1, 5ε1 < ε2 , d.h. ε2 − ε1 > 0, 5ε1 > 0, 75. Damit besitzt die Teilmenge F := {ε ∈ E | ε > 1} ein kleinstes Element ε0 > 1, denn F hat keine Häufungspunkte und ist nicht leer. Dieses Element erzeugt aber bereits ganz E, denn sei ε > 1, so erhält man durch Invertieren die Elemente kleiner 1 und es gibt ein n ∈ N mit εn0 ≤ ε < εn+1 0 ⇔ 1≤ ε < ε0 . εn0 Die Minimalität von ε0 impliziert sofort ε = εn0 , da der Quotient andernfalls ein Element von F und kleiner als ε0 wäre. Dies zeigt E = {εn0 | n ∈ Z} und folglich Aut(Q) ≃ {±1} × Z. 88 Ganzzahlige binäre quadratische Formen Beispiel 5.2.7. von (i) Sei Q(x, y) = x2 + xy + y 2 mit D = −3, so wird Aut(Q) erzeugt ( ) 0 −1 U= 1 1 mit der Ordnung 6. (ii) Sei Q(x, y) = x2 + xy − y 2 mit D = 5. Es genügt die Pellsche Gleichung t2 − 5u2 = 4, t, u ∈ N, zu betrachten und man erhält als kleinstes Element ε0 > 1 √ 3+ 5 ε0 = mit Aut(Q) ≃ {±εn0 | n ∈ Z}. 2 5.3 Darstellungsanzahlen 89 5.3 Darstellungsanzahlen In diesem Abschnitt wird für die im vorherigen Abschnitt definierte Gesamtdarstellungsanzahl RD (n) einer Zahl n ∈ Z durch primitive ganzzahlige binäre quadratische Formen gegebener Diskriminante D ̸= 0 eine Formel hergeleitet, sodass sich deren Endlichkeit beweisen lässt. Definition 5.3.1. Eine Zahl D ∈ Z \ {0} heißt quadratfrei, falls |D| = 1 oder |D| = m ∏ pi mit pi ̸= pj prim für alle i ̸= j ∈ {1, . . . , m}. i=1 D heißt Grundzahl oder Fundamentaldiskriminante, falls entweder D ≡ 1 (4) und D quadratfrei oder D ≡ 0 (4), D4 quadratfrei und D4 ≡ 2, 3 (4) ist. Diese Grundzahlen lassen, wie man sich leicht klar macht, eine eindeutige Darstellung jeder Diskriminante D ∈ Z \ {0}, D ≡ 0, 1 (4) zu, nämlich D = D0 f 2 mit f ∈ N und einer Fundamentaldiskriminante D0 . Mit den Grundzahlen lassen sich auch alle reellen Dirichlet-Charaktere, d.h. alle Gruppenhomomorphismen χ : (Z/nZ)× → R× , darstellen – unter Verwendung der folgenden Abbildung. Definition 5.3.2. Sei D eine Grundzahl. Dann definiert χD : N → {0, ±1} eine streng multiplikative Fortsetzung des Legendre-Symbols durch (1) χD (1) = 1, ( ) (2) χD (p) = Dp , falls p > 2 prim ist, und 0 χD (2) = 1 −1 falls D ≡ 0 (4), falls D ≡ 1 (8), falls D ≡ 5 (8), (3) χD ist streng multiplikativ, d.h. χD (ab) = χD (a)χD (b) ∀ a, b ∈ N. Im Folgenden wird sich zeigen, dass RD (n) mit der summatorischen Funktion von χD übereinstimmt. In Analogie zu den Darstellungsanzahlen macht man 90 Ganzzahlige binäre quadratische Formen Definition 5.3.3. Sei R∗ (n, Q) die Anzahl der unter der Operation von Aut(Q) inäquivalenten primitiven Lösungen von Q(x, y) = n für gegebenes Q mit Diskriminante D ̸= 0, n ∈ Z. Eine Lösung heißt dabei primitiv, falls Q(x, y) = n mit ggT(x, y) = 1 gilt. Entsprechend zur Gesamtdarstellungsanzahl sei ∑ h(D) ∗ RD (n) := R∗ (n, Qi ) i=1 als Summe über ein Vertretersystem der Äquivalenzklassen primitiver ganzzahliger binärer quadratischer Formen mit fester Diskriminante D ̸= 0 (positiv definit, falls D < 0 < a, negativ definit, falls D, a < 0). Diese Definition ist wohldefiniert unter der Gruppenoperation von SL2 (Z), denn es gilt ( ) ( ) x x primitiv ⇔ U primitiv ∀ U ∈ SL2 (Z) y y aufgrund der ganzzahligen Einträge von U, U −1 . Der Zusammenhang zu RD (n) zeigt sich dadurch, dass jede Lösung (x, y) ∈ Z2 von Q(x, y) = n ein Vielfaches einer primitiven Lösung (x′ , y ′ ) ∈ Z2 ist mit n = Q(x, y) = (ggT(x, y))2 · Q(x′ , y ′ ). Folglich gilt für n ̸= 0 die Identität RD (n) = ∑ d2 |n ∗ RD (n) d2 . d>0 Der Fall n = 0 soll im Folgenden ausgeschlossen werden, denn es ist R(n, Q) = 1, falls es nur die triviale Lösung x = 0 = y gibt, ansonsten ist die Darstellungszahl unendlich, da für jedes λ ∈ N mit einer nicht trivialen Lösung (x, y) auch λ(x, y) offensichtlich eine nicht triviale Lösung ist. Diese verschiedenen Lösungen sind paarweise inäquivalent bezüglich der Operation von Aut(Q). Des weiteren genügt es positive Zahlen n ∈ N zu betrachten, denn für n ̸= 0 gilt R(n, Q) = R(−n, −Q) und mit einem vollständigen Repräsentantensystem {Q1 , . . . , Qh(D) } zu fester Diskriminante D ̸= 0 ist auch {−Q1 , . . . , −Qh(D) } ein solches, d.h. ∑ h(D) RD (n) = i=1 ∑ h(D) R(n, Qi ) = i=1 ∑ h(D) R(−n, −Qi ) = R(−n, Qi ) = RD (−n). i=1 Der Beweis einer einfachen Formel für RD (n) im Fall, dass D eine Grundzahl und n > 0 ist, macht Gebrauch von gruppentheoretischen Argumenten, deshalb 5.3 Darstellungsanzahlen 91 Definition 5.3.4. Eine Gruppe (G, ∗) operiert von rechts auf einer Menge X, falls es eine Abbildung X × G → X, (x, g) 7→ x ◦ g gibt, wobei mit dem neutralen Element e von G die Verknüpfung ◦ (i) x ◦ e = x ∀ x ∈ X, (ii) (x ◦ g1 ) ◦ g2 = x ◦ (g1 ∗ g2 ) ∀ x ∈ X, g1 , g2 ∈ G erfüllt. Zahlentheoretisch wurden bereits einige Beispiele hierfür verwendet. Beispiel 5.3.5. Sei G = (SL2 (Z), ·). (a) Sei X die Menge der primitiven ganzzahligen binären quadratischen Formen zu fester Diskriminante D ̸= 0 (positiv definit, falls D < 0 < a, negativ definit, falls D, a < 0) mit zugehöriger Darstellungsmatrix A. Dann operiert G auf X vermöge ( ( )) x ′ ′ (Q, U ) 7→ Q ◦ U := Q mit Q (x, y) = Q U y bzw. mittels A über (A, U ) 7→ A ◦ U := A[U ]. Die Wohldefiniertheit der Operation wurde bereits in Abschnitt 5.1 gezeigt. (b) Sei Y = {(x, y) ∈ Z2 | ggT(x, y) = 1}. Dann operiert G auf Y durch ( ) ( ) (( ) ) x x −1 x ∈ Y. ◦ U := U , U 7→ y y y Operiert eine Gruppe G auf einer Menge X, so definiert x∼y :⇔ ∃g ∈ G mit y = x ◦ g eine Äquivalenzrelation auf X. Mit X/G werde die Menge der Äquivalenzklassen bezüglich ∼ bezeichnet. Dann zerfällt X in disjunkte Äquivalenzklassen X= • ∪ xi G mit xi G = {xi ◦ g | g ∈ G}, i∈I wobei die Indexmenge I mit {xi }i∈I = X/G ein Vertretersystem der Äquivalenzklassen durchläuft. Beispiel 5.3.6. Seien die Notationen wie im vorherigen Beispiel 5.3.5. 92 Ganzzahlige binäre quadratische Formen (a) X/G bildet die Menge der Äquivalenzklassen der primitiven ganzzahligen binären quadratischen Formen zu fester Diskriminante D ̸= 0 wie oben definiert. (b) Im Fall von Beispiel 5.3.5 (b) stellt sich heraus, dass jedes primitive Element von Y unter der Operation von G = SL2 (Z) zu (1, 0) äquivalent ist: Für (x, y) ∈ Y gibt es β, δ ∈ Z mit xβ − yδ = 1, d.h. es gibt ( ( ) ( ) ) x β 1 x U= ∈ SL2 (Z) mit U = y δ 0 y und Y /G besteht aus genau der Äquivalenzklasse von (1, 0). Als nächstes benötigt man den Begriff der Isotropie- oder Stabilisatorgruppe: Definition 5.3.7. Sei (G, ∗) eine Gruppe, die von rechts auf einer Menge X operiere und x ∈ X. Dann heißt Gx := {g ∈ G | x ◦ g = x} ⊂ G die Stabilisator(unter)gruppe von x in G. Es ist offensichtlich e ∈ Gx ̸= ∅ und für g1 , g2 ∈ Gx ist x ◦ (g1 g2−1 ) = (x ◦ g1 ) ◦ g2−1 = x ◦ g2−1 = (x ◦ g2 ) ◦ g2−1 = x ◦ (g2 g2−1 ) = x. Damit ist Gx tatsächlich eine Untergruppe von G. Mit dieser Notation lassen sich folgende zahlentheoretische Beispiele anführen: Beispiel 5.3.8. Mit denselben Bezeichnungen wie in den vorherigen Beispielen gilt: (a) Für eine quadratische Form Q ∈ X mit Darstellungsmatrix A bezeichnet GA := GQ = Aut(Q) die Stabilisatoruntergruppe von Q in G = SL2 (Z). (b) Man erhält die Isotropiegruppe {( G(1) = 0 } ) 1 k k ∈ Z ⊂ G, 0 1 denn hierfür muss U −1 (1, 0)T = (1, 0)T gelten mit U ∈ SL2 (Z). Sei also ( ) ( ) α β δ −β −1 U= , dann ist U = . γ δ −γ α Das heißt mit αδ − βγ = 1 ( )( ) ( ) δ −β 1 1 = −γ α 0 0 ⇔ δ = 1, γ = 0, α = 1. 5.3 Darstellungsanzahlen 93 Lemma 5.3.9. Sei G eine Gruppe, die auf den Mengen X und Y von rechts operiere. Sei S ⊂ X × Y eine Teilmenge, die unter der Diagonaloperation invariant bleibt, d.h. (x, y) ◦ g := (x ◦ g, y ◦ g) ∈ S ∀ g ∈ G, (x, y) ∈ S. Definiere für y ∈ Y die Teilmenge Xy := {x ∈ X | (x, y) ∈ S} ⊂ X und für festes x ∈ X die Menge Yx := {y ∈ Y | (x, y) ∈ S} ⊂ Y. Dann gilt (i) Gx operiert auf Yx von rechts gemäß (y, g) 7→ y ◦ g und Gy operiert auf Xy entsprechend durch (x, g) 7→ x ◦ g. (ii) ∑ |S/G| = |Yx /Gx | = x∈X/G ∑ |Xy /Gy |. y∈Y /G Beweis. (i) Sei y ∈ Yx , d.h. (x, y) ∈ S, und g ∈ Gx . Dann ist y ◦ g ∈ Yx oder äquivalent (x, y ◦ g) ∈ S zu zeigen. Nun ist (x, y ◦ g) = (x ◦ (g −1 g), y ◦ g) = ((x ◦ g −1 ) ◦ g, y ◦ g). Wegen g, g −1 ∈ Gx folgt schließlich mit (x, y) ∈ S auch (x, y ◦ g) = (x ◦ g −1 , y) ◦ g = (x, y) ◦ g ∈ S. Das heißt die Operation ist wohldefiniert, denn Gx ⊂ G ist eine Untergruppe und Yx ⊂ X. Analog zeigt man die Wohldefiniertheit der Operation von Gy auf Xy . (ii) Es genügt wiederum die erste Gleichheit zu zeigen. Zunächst ist die Summe wohldefiniert, denn seien x, x′ ∈ X mit x ∼ x′ , so gibt es ein g ∈ G mit x′ = x ◦ g. Dann gilt Gx′ = g −1 Gx g bzw. Gx = gGx′ g −1 und Yx′ = Yx ◦ g. Mit gruppentheoretischen Mitteln kann man zeigen, dass Yx → Yx′ , y 7→ y ◦ g einen Isomorphismus der Quotienten Yx /Gx ≃ Yx′ /Gx′ induziert, d.h. dass die Summen wohldefiniert sind. Wähle ein Vertretersystem {xi }i∈I von X/G und sei (x, y) ∈ S. Wegen X= • ∪ i∈I xi G mit xi G = {xi ◦ g | g ∈ G} 94 Ganzzahlige binäre quadratische Formen gibt es ein i ∈ I und ein g ∈ G mit x ◦ g = xi , d.h. es gibt ein y ′ = y ◦ g ∈ Yxi , denn (xi , y ′ ) = (x, y) ◦ g ∈ S. Nun sind Elemente (xi , y1 ), (xj , y2 ) ∈ S für i ̸= j ∈ I nicht äquivalent unter der Operation von G, da die Zerlegung von X durch G mittels Äquivalenzklassen disjunkt ist. Das heißt zwei unter G äquivalente Elemente (xi , y1 ), (xi , y2 ) erfüllen y1 , y2 ∈ Yxi und es gibt ein g ∈ G mit (xi ◦ g, y1 ◦ g) = (xi , y1 ) ◦ g = (xi , y2 ). Folglich muss g ∈ Gxi ein Stabilisator sein und y1 ∼ y2 unter der Operation von Gxi . Im zahlentheoretischen Kontext lassen sich X, Y, G wie bereits in den vorherigen Beispielen wählen und man setzt für festes n > 0 und D ̸= 0 { ( ( )) } x S := Q, Q(x, y) = n ⊂ X × Y. y Dann ist {( ) x ∈Y YA := YQ = y } Q(x, y) = n und X(x) = {Q ∈ X | Q(x, y) = n} . y Dieser Zusammenhang liefert folgendes Korollar 5.3.10. Mit den eben eingeführten Bezeichnungen gilt nach obigem Lemma |S/G| = ∑ ∑ h(D) |YA /GA | = ∗ R∗ (n, Qi ) = RD (n) i=1 A∈X/G und unter Verwendung der zweiten Identität in Lemma 5.3.9 (ii) ebenso / |S/G| = X(1) G(1) = {b (mod 2n) | b2 ≡ D (4n)} . 0 0 Beweis. Man beachte Beispiel 5.3.6 und 5.3.8 und für die zweite Identität benutze man, dass X(1) die Menge der primitiven ganzzahligen binären quadratischen Formen zu fester 0 Diskriminante D ̸= 0 wie in den Beispielen ist mit Q(1, 0) = n, d.h. D = b2 −4nc ≡ b2 (4n) und b2 − D 2 y . Q(x, y) = nx2 + bxy + 4n 5.3 Darstellungsanzahlen 95 Die Isotropiegruppe G(1) operiert auf dieser Menge nach eben gezeigtem Lemma durch 0 ( ( )) 1 k Q, 7→ Q′ 0 1 Q′ (x, y) = Q(x + ky, y) mit ∀ x, y ∈ Z. Zwei Formen Q und Q′ aus X(1) sind dabei äquivalent, falls es ein k ∈ Z gibt mit 0 Q′ (x, y) = Q(x + ky, y) ( ) b2 − D 2 = nx + (b + 2nk)xy + nk + bk + y2 4n 2 (b + 2nk) − D 2 = nx2 + (b + 2nk)xy + y 4n 2 für alle x, y ∈ Z. Das heißt im Vergleich zu Q wird b nur durch b + 2nk ersetzt und der Koeffizient n vor x2 bleibt erhalten. Dies impliziert die Anzahl der Äquivalenzklassen. Mit dieser Vorarbeit lässt sich nun folgendes Theorem beweisen. Theorem 5.3.11. Sei D ̸= 0 eine Grundzahl, n ∈ Z ̸= 0. Dann gilt (5.6) RD (n) = ∑ χD (d). d|n d>0 Insbesondere folgt hieraus die Endlichkeit von RD (n) sowie R(n, Q). Beweis. Wie bereits vor Definition 5.3.4 gezeigt wurde, gilt RD (−n) = RD (n), sodass im Folgenden n ∈ N angenommen wird. Korollar 5.3.10 liefert ∗ RD (n) = {b (mod 2n) | b2 ≡ D (4n)} . ∗ Nach dem chinesischen Restsatz ist dann RD als Funktion in n multiplikativ, da für (n1 , n2 ) = 1 gilt kgV(2n1 , 2n2 ) = 2n1 n2 . Dies überträgt sich auf RD gemäß RD (n1 n2 ) = ∑ d2 |(n1 n2 ), d>0 ∗ RD ( ) (n n ) ∑ n1 n2 1 2 ∗ = RD α(g), d2 g2 g|(n1 n2 ), g>0 wobei die multiplikative Funktion α : N → {0, 1} durch { 1 falls g ein Quadrat ist, α(g) = 0 sonst 96 Ganzzahlige binäre quadratische Formen definiert ist. Damit erhält man RD (n1 n2 ) = ∑ ( ∗ RD g|(n1 n2 ), g>0 ( ∑ = ∗ RD g1 |n1 ,g1 >0, g2 |n2 ,g2 >0 ∑ = n1 n2 g2 ( ∗ RD g1 |n1 ,g1 >0, g2 |n2 ,g2 >0 ) α(g) n1 n2 g12 g22 n1 g12 ) α(g1 g2 ) ( ) ∗ RD n2 g22 ) α(g1 )α(g2 ) = RD (n1 ) · RD (n2 ). Ebenso ist die rechte Seite von (5.6) als summatorische Funktion der streng multiplikativen Funktion χD multiplikativ. Es genügt also die Gleichung (5.6) für Primzahlpotenzen zu beweisen. Das heißt sei n = pα für p prim, α ∈ N. Für x ∈ Q bezeichne [x] wieder die größte ganze Zahl kleiner oder gleich x. Wegen α RD (p ) = ∑ ( ∗ RD d2 |pα , d>0 pα d2 ) ∑ [α/2] = ∗ RD (pα−2t ) t=0 ∗ betrachte man zunächst RD (pβ ), β ∈ N. p > 2. Mit dem chinesischen Restsatz 3.3.1 folgt ∗ RD (pβ ) = {b (mod 2pβ ) | b2 ≡ D (4pβ )} = {b (mod 2) | b2 ≡ D (4)} · {b (mod pβ ) | b2 ≡ D (pβ )} = {b (mod pβ ) | b2 ≡ D (pβ )} , d.h. mit nachfolgender Argumentation 2 falls p ∤ D 0 falls p ∤ D β ∗ RD (p ) = 1 falls p | D 0 falls p | D und und ( ) D (p) D p = 1, = −1, und β = 1, und β ≥ 2. Denn für p > 2 lässt sich mittels Satz 3.3.5 eindeutig von einer Lösung modulo p von X 2 − D ≡ 0 nach modulo p2 , . . . , pβ liften. Das heißt ist D quadratischer Rest modulo p, so gibt es genau zwei modulo p inkongruente Lösungen ±b wegen p > 2, die direkt zwei Lösungen modulo pβ erzeugen. Ist D kein quadratischer Rest modulo p, so gibt es keine Lösung modulo p und 5.3 Darstellungsanzahlen 97 folglich auch nicht modulo pβ . Im Fall p | D und β = 1 folgt aus X 2 ≡ D (p) die eindeutige Lösung b ≡ 0 (p). Für p | D und β > 1 folgt aus b2 ≡ D (pβ ) auch b2 ≡ D (p2 ), sodass p auch b2 und damit b teilt. Dies führt zum Widerspruch der Definition einer Grundzahl, denn p2 | D mit p > 2. Der Zusammenhang zu RD (pα ) liefert: • Ist D quadratischer Rest modulo p, so folgt ∑ [α/2] α RD (p ) = ∑ [α/2]−1 ∗ RD (pα−2t ) = t=0 ∗ 2 + RD (pα−2[α/2] ) = α + 1. t=0 Andererseits ist ∑ χD (d) = d|pα , α ∑ t χD (p ) = t=0 α ∑ t χD (p) = t=0 α ∑ 1 = α + 1. t=0 d>0 • Ist D kein quadratischer Rest modulo p, so zeigt sich { [α/2]−1 ∑ 1 falls α ≡ 0 (2), ∗ RD (pα ) = 0 + RD (pα−2[α/2] ) = 0 falls α ≡ 1 (2). t=0 Analog ist { 1 χD (d) = (−1)t = 0 t=0 d|pα , ∑ α ∑ falls α ≡ 0 (2), falls α ≡ 1 (2). d>0 • Ist p ein Teiler von D, so gilt α RD (p ) = ∗ RD (pα−2[α/2] ) =1=1+ α ∑ χD (p)t = t=1 ∑ χD (d). d|pα , d>0 p = 2. Es gilt für β ∈ N ∗ (2β ) = {b (mod 2β+1 ) | b2 ≡ D (2β+2 )} RD Ist D ungerade, also D ≡ 1, 5 (8), so liefert Satz 3.3.8, dass im Fall D ≡ 5 (8) die Kongruenz b2 ≡ D (2β+2 ) für β ∈ N nicht lösbar ist. Hierfür erhält man { 1 falls α ≡ 0 (2), RD (2α ) = 0 falls α ≡ 1 (2). 98 Ganzzahlige binäre quadratische Formen Im Fall D ≡ 1 (8) gibt es genau zwei inkongruente Lösungen ±b, sodass sich RD (2α ) = α + 1 ergibt. Ist D ≡ 0 (4), so hat die Kongruenz b2 ≡ D (2β+2 ) nur für β = 1 genau eine Lösung, für β = 2 keine und damit auch für β > 2 keine. Dies stimmt mit den Werten der summatorischen Funktion von χD überein: falls D ≡ 0 (4), α 1 ∑ ∑ t χD (d) = χD (2) = α + 1 falls D ≡ 1 (8), ∑α t t=0 d|2α , falls D ≡ 5 (8). t=0 (−1) d>0 Beispiel 5.3.12. Sei n = p > 2 prim, dann ist RD (p) = ∑ d|p, d>0 ( χD (d) = 1 + D p ) . Das heißt ist D quadratischer Rest modulo p, so ist die Gesamtdarstellungszahl 2, im anderen Fall 1 oder 0 je nachdem, ob p ein Teiler der Grundzahl ist oder nicht. 6 Approximation reeller Zahlen durch rationale Zahlen Aus den Grundvorlesungen ist bereits bekannt, dass zwischen zwei reellen Zahlen stets rationale Zahlen liegen. Dies lässt sich beispielsweise mit dem Archimedischen Prinzip beweisen. In diesem Kapitel wollen wir diese Approximationseigenschaft genauer untersuchen, insbesondere für algebraische Zahlen über Q, um schließlich sogar die Transzendenz der Eulerschen Zahl e zu folgern. 6.1 Der Dirichletsche Approximationssatz Aufgrund der Dichtheit der rationalen Zahlen in R lässt sich jedes θ ∈ R beliebig genau durch Brüche (zum Beispiel durch Dezimalentwicklung) approximieren. Hierbei können jedoch die Nenner der gekürzten approximierenden rationalen Zahlen sehr groß sein. Etwa für θ := π − 3 ≈ 0.141592653 hat man mit der Dezimalbruchentwicklung 1 14 7 141 1415 283 14159 , = , , = , ,... 10 100 50 1000 10000 2000 100000 als approximierende Brüche. Beispielsweise gibt es aber auch Brüche, deren Nenner relativ klein sind und trotzdem als Approximation in Frage kommen: 1 7 2 − θ < − θ < 2 . im Vergleich zu 7 100 50 100 Soll also die rationale Approximation einen kleinen Nenner b ∈ N besitzen, so ergibt sich a ⇔ |bθ − a| < εb. θ − < ε b Satz 6.1.1. (Satz von Dirichlet) Seien θ ∈ R, n ∈ N. Dann gibt es a ∈ Z, b ∈ N mit b ≤ n, ggT(a, b) = 1 und |bθ − a| < 1 . n 99 100 Approximation reeller Zahlen durch rationale Zahlen Beweis. Für x ∈ R schreibt man x = [x] + {x} mit der bekannten Gauß-Klammer [x] ∈ Z und dem Residuum {x} := x − [x] ∈ [0, 1). Insbesondere liegen die n + 1 Zahlen {kθ} für k = 0, . . . , n im Intervall [0, 1). Unterteilt man n−1 ∪ [k k + 1) , [0, 1) = n n k=0 in n gleich große Teilintervalle, so folgt mit dem Dirichletschen Schubfachprinzip, dass es zwei Zahlen {kθ}, {lθ} für 0 ≤ k < l ≤ n gibt, die im selben Teilintervall liegen, d.h. |{kθ} − {lθ}| < 1 . n Per Definition ergibt sich daher (l − k)θ = [lθ] + {lθ} − ([kθ] + {kθ}) = [lθ] − [kθ] + {lθ} − {kθ} und setzt man 0 < B := l − k ≤ n sowie A := [lθ] − k[θ] ∈ Z, so liefert die Ungleichung |Bθ − A| < 1 . n Division mit ggT(A, B) ≥ 1 liefert dann die Aussage. Hieraus erhält man direkt eine einfache Folgerung, nämlich Korollar 6.1.2. Sei θ ∈ R. Dann gibt es a ∈ Z, b ∈ N mit ggT(a, b) = 1 und a 1 θ − < 2 . b b Beweis. Nach obigem Satz gibt es zu jedem n ∈ N ein 1 ≤ b ≤ n mit a 1 1 ≤ 2. θ − < b nb b Man macht sich mit Satz 2.1.14 leicht klar, dass für rationale Zahlen q ∈ Q die vollständig gekürzte Darstellung a mit a ∈ Z, b ∈ N q= b eindeutig ist. Für θ ∈ R definiere man die nach Korollar 6.1.2 nicht leere Menge { } S(θ) := (a, b) ∈ Z × N | ggT(a, b) = 1, θ − ab < b12 und erhält Satz 6.1.3. Für θ ∈ R gelten folgende Aussagen. 6.1 Der Dirichletsche Approximationssatz 101 (i) Ist θ ∈ R \ Q, so besitzt S(θ) unendlich viele Elemente. (ii) Ist S(θ) unendlich, so gibt es für jedes M ∈ N ein Paar (a, b) ∈ S(θ) mit b > M . (iii) Ist θ ∈ Q, so ist |S(θ)| < ∞. Beweis. (i) Sei θ irrational. Angenommen, S(θ) ist endlich, dann existierte a α := min θ − > 0. (a,b)∈S(θ) b Wählt man n ∈ N mit αn > 1, so ergibt Satz 6.1.1 ein Paar (a0 , b0 ) ∈ Z × N mit b0 ≤ n und ggT(a0 , b0 ) = 1, sodass gilt 1 . n Mit derselben Abschätzung wie im Beweis zu Korollar 6.1.2 folgt (a0 , b0 ) ∈ S(θ) sowie mit der Wahl von n a 0 θ − < 1 ≤ 1 < α b0 b0 n n |b0 θ − a0 | < ein Widerspruch zur Wahl von α. (ii) Sei |S(θ)| = ∞ und angenommen, es gäbe ein M ∈ N, sodass für alle (a, b) ∈ S(θ) gilt b ≤ M . Dann gibt es zunächst nur endlich viele Möglichkeiten für die Wahl von b ∈ N. Andererseits ist die Wahl von a ∈ Z durch 1 |a| ≤ |bθ − a| + |bθ| < + b|θ| ≤ 1 + M |θ| < ∞ b eingeschränkt und S(θ) wäre endlich im Widerspruch zur Annahme. (iii) Ist θ rational, so lässt sich θ eindeutig als vollständig gekürzten Bruch θ = ab00 mit ggT(a0 , b0 ) = 1 und b0 ∈ N darstellen. Wäre S(θ) unendlich, so gäbe es nach (ii) ein Paar (a, b) ∈ S(θ) mit b > b0 und folglich a0 a a 1 0 < − = θ − < 2 . b0 b b b Multiplikation mit dem Hauptnenner liefert schließlich den Widerspruch 0 < |a0 b − ab0 | < b0 < 1. b Dieser Satz zeigt mit (i) und (ii), dass θ ∈ R irrational ist genau dann wenn es unendlich viele Approximationen in S(θ) gibt. Hurwitz konnte sogar beweisen, dass es für Elemente von S(θ) eine optimale Schranke 1 1 a θ − < √ 2 b 5b gibt. Den Satz von Dirichlet verallgemeinerte Kronecker wie folgt. 102 Approximation reeller Zahlen durch rationale Zahlen 6.2 Der Kroneckersche Approximationssatz Betrachtet man die Linearform Lθ : Z2 → R mit Lθ (x, y) = θx + y für ein θ ∈ R, so nimmt diese gemäß Satz 6.1.1 Werte beliebig nahe der Null an. Für θ ∈ Q liegt die Null im Bildbereich. Allgemeiner werden wir nun untersuchen, ob die Linearform Werte beliebig nahe vorgegebener reeller Zahlen annimmt. Für θ ∈ Q ist dies offensichtlich nicht der Fall für beliebige reelle Zahlen. Denn für θ = ab lässt sich eine Zahl α ∈ R \ Q höchstens auf ± 1b annähern, denn a k |Lθ (x, y) − α| = x + y − [α] − {α} ≥ min {α} − . k=0,...,b b b Im anderen Fall gilt jedoch ∪ Lemma 6.2.1. Sei θ irrational, dann liegt A := n∈N {{nθ}} dicht in Einheitsintervall [0, 1] ⊂ R, d.h. zu jedem α ∈ [0, 1] und ε > 0 gibt es ein m ∈ N mit |{mθ} − α| < ε. Beweis. Zu θ ∈ R \ Q und 0 < ε < 1 gibt es nach Satz 6.1.1 teilerfremde Zahlen a, b mit |bθ − a| < ε. Die Irrationalität von θ impliziert dabei die Positivität des Betrags. Sei also ohne Einschränkung bθ − a > 0, dann ist 0 < [bθ] − a + {bθ} < ε. Wegen ε < 1 (ε < 1 ist dabei keine Einschränkung, da die Differenz |{mθ} − α| stets kleiner Eins ist.) ist a = [bθ] und {bθ} ∈ (0, ε). Zu letzterer Zahl gibt es folglich ein n ∈ N mit 1 1 ≤ {bθ} < . n+1 n Infolge dessen gilt 0 < {bθ} < 2{bθ} < · · · < n{bθ} < 1 und man hat eine Intervallunterteilung [0, 1] = n−1 ∪ [k{bθ}, (k + 1){bθ}) ∪ [n{bθ}, 1]. k=0 Hierbei haben die ersten n Teilintervalle alle die Breite {bθ} < ε. Für das rechte Intervall folgt aber ebenso 1 n = ≤ {bθ} < ε 1 − n{bθ} ≤ 1 − n+1 n+1 nach der Wahl von n. Nun liegt α ∈ [0, 1] in genau einem dieser Teilintervalle und man kann m = kb ∈ N für das maximale k mit k{bθ} ≤ α wählen. Dieser Hilfssatz impliziert nun direkt den folgenden Spezialfall des Kroneckerschen Theorems. 6.2 Der Kroneckersche Approximationssatz 103 Satz 6.2.2. Seien θ irrational, α ∈ R und ε > 0 gegeben. Dann gibt es (a, b) ∈ Z × N mit |Lθ (b, a) − α| = |(bθ + a) − α| < ε. Beweis. Wegen {α} ∈ [0, 1) lässt sich hierauf Lemma 6.2.1 anwenden und man erhält |mθ − [mθ] − (α − [α])| = |{mθ} − {α}| < ε. Wählt man b = m und a = [α] − [mθ], so folgt die Behauptung. 104 Approximation reeller Zahlen durch rationale Zahlen 6.3 Der Liouvillesche Approximationssatz Um im nächsten Abschnitt die Transzendenz der Eulerschen Zahl herzuleiten, studiert man zunächst algebraische Zahlen. Definition 6.3.1. Sei θ ∈ C. Dann heißt θ algebraische Zahl, falls die Körpererweiterung Q(θ)/Q endlich ist. Andernfalls heißt θ transzendente Zahl. In Algebra zeigt man, dass es für algebraische Zahlen äquivalent zur obigen Definition ein eindeutig bestimmtes, normiertes und irreduzibles Polynom f ∈ Q[X] \ {0} minimalen Grades gibt, das sogenannte Minimalpolynom, mit deg(f ) = [Q(θ) : Q] < ∞ und f (θ) = 0. θ heißt dann auch algebraisch vom Grad deg(f ) ∈ N (über Q). Hierbei ist ein nicht konstantes Polynom f ∈ Q[X] irreduzibel, falls es keine Darstellung der Form f (X) = g(X) · h(X) mit g, h ∈ Q[X], 1 ≤ deg(g), deg(h) < deg(f ) gibt. Andernfalls heißt f reduzibel. √ Beispiel 6.3.2. (a) θ = 2 besitzt das Minimalpolynom f (X) = X 2 − 2 ∈ Q[X], denn f (θ) = 0 und f ist normiert. Angenommen, das Minimalpolynom hätte einen √ kleineren Grad, so müsste 2 ∈ Q folgen – ein Widerspruch. (b) θ = i ist eine algebraische Zahl mit Minimalpolynom g(X) = X 2 + 1 nach analoger Schlussweise wie in (a). √ (c) θ = 3 5 besitzt das Minimalpolynom h(X) = X 3 −5, denn wäre h reduzibel, so müsste das Polynom in einen Linearfaktor und ein Quadrat zerfallen, im Widerspruch zu den Nullstellen θe2πi/3 ∈ / Q von h. In den Vorlesungen zur Algebra wurden Irreduzibilitätskriterien hergeleitet, insbesondere für den Quotientenkörper Q der ganzen Zahlen Z. Der Satz von Gauß liefert dabei, dass jedes irreduzible f ∈ Q[X] \ {0} mit einer Einheit c ∈ Q× = Q \ {0} multipliziert werden kann, um ein in Z[X] irreduzibles Polynom f˜ zu erhalten. Umgekehrt folgt ebenso aus der Irreduzibilität eines normierten Polynoms f in Z[X] die von f im Quotientenkörper Q[X]. Lemma 6.3.3. Sei f ∈ Q[X] irreduzibel vom Grad n ∈ N, n ≥ 2. Dann hat f keine Nullstelle in Q. Beweis. Angenommen es gibt ein r ∈ Q mit f (r) = 0, dann folgt f (X) := n ∑ k=0 ak X = f (X) − f (r) = k n ∑ ak (X k − rk ) = (X − r)g(X) k=1 für ein g ∈ Q[X]. Wegen deg(X − r) = 1 < n und deg(g) = n − 1 < n wäre daher f reduzibel, im Widerspruch zur Annahme. 6.3 Der Liouvillesche Approximationssatz 105 Nachfolgender Satz gibt eine untere Schranke für die Approximation irrationaler Zahlen wie in Beispiel 6.3.2. Satz 6.3.4. (Liouville) Sei θ ∈ R algebraisch über Q vom Grad n ≥ 2. Dann gibt es eine Konstante C = C(θ) > 0, sodass für alle (a, b) ∈ Z × N gilt: a C θ − > n. b b Beweis. Aufgrund der Voraussetzung gibt es ein irreduzibles f ∈ Q[X] mit deg(f ) = n und f (θ) = 0. Nach Lemma 6.3.3 ist für alle Paare (a, b) ∈ Z × N auch f ( ab ) ̸= 0. Multipliziert man mit dem Hauptnenner aller Koeffizienten, so lässt sich ohne Einschränkung f ∈ Z[X] wählen. Nach dem Mittelwertsatz folgt daher f ( ab ) = f ( ab ) − f (θ) = f ′ (ξ)( ab − θ) für eine Zahl ξ zwischen a b und θ. Sei f (X) := n ∑ ak X k mit ak ∈ Z, k=0 so gilt für ein N ∈ Z \ {0} 0 ̸= f ( ab ) = n ∑ k=0 ak ( a )k b = n 1 ∑ N k n−k a a b =: . k bn k=0 bn Kombiniert erhält man 1 a ′ a ≤ |f ( )| = |f (ξ)| θ − . b bn b Im ersten Fall ergibt sich direkt mit b ∈ N a a 1 ⇒ θ − > n . θ − > 1 b b b Im anderen Fall folgt, da ξ zwischen ab und θ liegt, a ⇒ |θ − ξ| ≤ 1. θ − ≤ 1 b Um die Ableitung abschätzen zu können, ist zunächst ξ gleichmäßig beschränkt durch |ξ| ≤ |θ − ξ| + |θ| ≤ |θ| + 1. Daher ist |f ′ (ξ)| ≤ max |f ′ | =: A(θ) < ∞. [0,|θ|+1] Da n ≥ 2 ist, muss A(θ) > 0 gelten und folglich hat man a 1 ≤ A(θ) θ − < (A(θ) + 1) θ − n b b a , b 106 Approximation reeller Zahlen durch rationale Zahlen sodass sich für beide Fälle 1 1 1 a θ − ≥ n min(1, (A(θ) + 1)−1 ) = b b A(θ) + 1 bn ergibt. Aufgrund der Abzählbarkeit der Nullstellen von Polynomen in Q[X] gibt es nur abzählbar viele algebraische Zahlen. Da C bzw. R überabzählbar ist, gibt es folglich überabzählbar viele transzendente Zahlen. Obiger Satz kann dazu benutzt werden, um die Transzendenz gewisser gut approximierbarer irrationaler Zahlen zu zeigen. Definition 6.3.5. Eine Zahl θ ∈ R heißt Liouvillesche Zahl, falls es zu jedem r ∈ N ein Paar (ar , br ) ∈ Z × N mit br > 1 gibt und ar 1 0 < θ − < r . br br Satz 6.3.6. Eine Liouvillesche Zahl θ ∈ R ist transzendent. Beweis. Zunächst ist θ irrational, denn wäre θ ∈ Q, so folgte mit er := ggT(ar , br ) für Ar = ar /er und Br = br /er 1 A 1 a r r θ − = θ − < 1 = ≤ 2 r r Br br br (Br er ) Br für r ≥ 2. Wegen ggT(Ar , Br ) = 1 folgt (Ar , Br ) ∈ S(θ) für jedes r ≥ 2. Da S(θ) nach Satz 6.1.3 endlich ist, gibt es unendlich viele Indizes rk ≥ 2, k ∈ N, mit rk → ∞ für k → ∞ und (Ark , Brk ) = (Ar , Br ) für ein festes r ≥ 2. Daher folgt ein Widerspruch gemäß a A A a r r r r k k = θ − < 1r ≤ 1 → 0 (k → ∞). = θ − 0 < θ − = θ − br Br Brk brk brkk 2rk Mithilfe von Satz 6.3.4 schließt man aus, dass θ algebraisch ist, denn wegen θ ∈ R \ Q genügt es hierfür den Fall n ≥ 2 zum Widerspruch führen: a 1 1 C r θ − < 1 < ⇒ 0 < C < ≤ → 0 (r → ∞). bnr br brr br−n 2r−n r Wie Liouville 1844 zeigte, ist die folgende Liouvillesche Konstante transzendent, da sie Liouvillesch ist. Dies war einer der ersten Beweise der Transzendenz einer reellen Zahl. 6.3 Der Liouvillesche Approximationssatz 107 Beispiel 6.3.7. Seien ∑ 1 θ := 10m! m∈N r! und br := 10 , r ∑ 1 ar := 10 10m! m=1 r! für r ∈ N, dann ist θ transzendent nach obigem Satz. In der Tat, ar , br ∈ N und br > 1 für alle r ∈ N und es gilt ∞ ∑ ∑ 1 ar 1 1 1 10 10 1 1 1 0<θ− = ≤ = (r+1)! < r+1 = r r!−1 ≤ r m! (r+1)! m br 10 10 10 10 9 br br 10 br m=r+1 m∈N 0 nach der geometrischen Summenformel für alle natürlichen r. Mit einigem Aufwand unter Verwendung der expliziten Darstellung des Kettenbruchs der Eulerschen Zahl e lässt sich beweisen, dass e keine Liouvillesche Zahl ist. Daher benötigt man einen gesonderten Beweis für die Transzendenz. 108 Approximation reeller Zahlen durch rationale Zahlen 6.4 Die Transzendenz der Eulerschen Zahl Zunächst zeigt man leicht, dass die Eulersche Zahl ∞ ∑ 1 e := m! m=0 mit 2 < e < 3 irrational ist. Lemma 6.4.1. Die Eulersche Zahl e ist eine irrationale Zahl. Beweis. Angenommen e wäre rational, dann gäbe es p, q ∈ N mit ggT(p, q) = 1 und q > 1. Multipliziert man e mit q!, so folgt q ∞ ∑ ∑ q! q! q!e = + , m! m=q+1 m! m=0 wobei die linke Seite und der erste Term der rechten Seite offensichtlich natürliche Zahlen sind. Für den zweiten Term der rechten Seite gilt aber nach der geometrischen Summenformel ∞ ∞ ∞ ∑ ∑ ∑ q! 1 q! 1 1 0< = ≤ = 1 −1 = , m m! m=1 (q + m)! m=1 3 2 1− 3 m=q+1 denn für alle m ∈ N gilt mit q ≥ 2 m m ∏ (q + m)! ∏ (2 + k) ≥ 3m . (q + k) ≥ = q! k=1 k=1 Damit hat man den Widerspruch im Vergleich beider Seiten von q!e. Bevor wir die von Hermite im Jahre 1873 bewiesene Transzendenz von e zeigen, in Analogie zur Taylor-Entwicklung ein Lemma über Polynome, das wir im Folgenden benötigen. Lemma 6.4.2. Für s ≥ 0 sei das reelle Polynom Φ ∈ R[X] gegeben durch Φ(x) = s ∑ cr x r für x ∈ R. r=0 Definiert man εr (x) := ∞ ∑ k=1 xk r! (r + k)! und und ex s ∑ r=0 (r) für die r-ten Ableitungen Φ s ∑ cr εr (x)xr , r=0 dann gilt Φ(r) (0) = r!cr ψ(x) := |x| und εr (|x|) ≤ e r!cr = s ∑ Φ(r) (x) + ψ(x) r=0 − 1 sowie ψ(0) = 0. 6.4 Die Transzendenz der Eulerschen Zahl 109 Beweis. Zunächst ergibt die Differentiation der Monome für 0 ≤ k ≤ r dk r r! x = r(r − 1) · . . . · (r − k + 1)xr−k = xr−k . k dx (r − k)! Damit folgt zunächst Φ(k) (x) = s ∑ cr r=k r! xr−k (r − k)! und die Summation der Ableitungen liefert dann s ∑ s ∑ s ∑ s r s r ∑ ∑ ∑ ∑ r! r! xm r−k r−k Φ (x) = cr x = x = cr r!cr (r − k)! (r − k)! m! r=0 r=0 m=0 k=0 k=0 r=k k=0 ( ) s ∞ ∑ ∑ xk x = r!cr e − . k! r=0 k=r+1 (k) Mit diesem Hilfssatz beweist man nun per Widerspruch die Transzendenz der Eulerschen Zahl. Satz 6.4.3. Die Eulersche Zahl e ist eine transzendente Zahl. Beweis. Angenommen e wäre algebraisch, dann existiert ein zugehöriges Minimalpolynom f ∈ Q[X] mit n := deg(f ) ≥ 2, da e ∈ R \ Q. Daher gibt es nach Multiplikation mit dem Hauptnenner ein irreduzibles f˜ ∈ Z[X] mit f˜(e) = n ∑ mit a0 ̸= 0. at et = 0 t=0 Wir wählen p ∈ P mit p > max(|a0 |, n) und setzen Φp (x) := n s ∑ xp−1 ∏ (x − k)p =: cr x r (p − 1)! k=1 r=0 mit cr ∈ Q für 0 ≤ r ≤ s = np + p − 1, wobei cr (p − 1)! =: br ∈ Z gilt und nach obigem Lemma sogar für 0 ≤ r < p − 1. 0 = Φ(r) p (0) = cr r! Eine nochmalige Anwendung von Lemma 6.4.2 ergibt ( s ) s n s n ∑ ∑ ∑ ∑ ∑ 0 = f˜(e) r!cr = at et r!cr = at Φ(r) (t) + ψ(t) = S1 + S2 p r=0 mit S1 := t=0 n ∑ t=0 at r=0 s ∑ r=0 Φ(r) p (t) t=0 und r=0 S2 := n ∑ t=0 at ψ(t), 110 Approximation reeller Zahlen durch rationale Zahlen wobei ψ ebenso von p abhängt. Nun zeigt sich, dass S1 ∈ Z \ {0} gilt und S2 gegen Null strebt für große p ∈ P – ein Widerspruch. • Wegen at ∈ Z genügt es die innere Summe zu betrachten. Zunächst ist mit obigen Bemerkungen über die Koeffizienten cr s ∑ Φ(r) p (0) = s ∑ r=0 s ∑ cr r! = r=0 cr r! = r=p−1 s ∑ br r=p−1 r! ∈ Z. (p − 1)! Es lässt sich sogar modulo p reduzieren zu s ∑ (p−1) (0) ≡ ((−1)n n!)p Φ(r) p (0) ≡ bp−1 ≡ Φp (mod p), r=0 denn nach der verallgemeinerten Produktregel gilt Φp(r) (x) 1 = (p − 1)! ∑ r0 ,r1 ,...,rn , r0 +r1 +···+rn =r n dr0 p−1 ∏ drk r! x · (x − k)p . rk r0 !r1 ! · . . . · rn ! dxr0 dx k=1 Für festes 1 ≤ t ≤ n in der Summe von S1 stimmt t mit einem der Werte k im Produkt von Φp überein und man erhält Ψ(x) := Φp (x + t) = n s ∑ xp (x + t)p−1 ∏ (x + t − k)p = g(x) =: dr xr (p − 1)! k=1 (p − 1)! r=0 mit einem Polynom g ∈ Z[X] und Koeffizienten dr ∈ Q. Analog zu obigen Überlegungen ist dr = 0 für 0 ≤ r < p und man erhält mit dr (p − 1)! =: er ∈ Z s ∑ dr r! = r=0 s ∑ dr r! = r=p s ∑ er r=p r! ∈ Z. (p − 1)! Insbesondere ist dieser Ausdruck durch p teilbar. Schließlich ergibt sich s ∑ r=0 Φ(r) p (t) = s ∑ r=0 (r) Ψ (0) = s ∑ dr r! ≡ 0 (mod p), r=0 d.h. S1 ∈ Z mit S1 ≡ a0 ((−1)n n!)p (p). Aufgrund der Wahl der Primzahl p > max(|a0 |, n) und a0 ̸= 0 folgt mit Theorem 3.1.11 von Euler-Fermat S1 ≡ a0 (−1)n n! ̸≡ 0 und daher |S1 | ≥ 1. (mod p) 6.4 Die Transzendenz der Eulerschen Zahl 111 • Andererseits lässt sich mit Lemma 6.4.2 ψ abschätzen in S2 zu |ψ(t)| ≤ s ∑ |cr |εr (t)t ≤ e r t r=0 s ∑ |cr |tr . r=0 (r) Betrachtet man die Ableitungen Φp (0), so ergibt sich für die Funktion n xp−1 ∏ Φ+ (x) := (x + k)p (p − 1)! k=1 (r) (r) gerade |cr r!| = |Φp (0)| ≤ Φ+ (0), d.h. nach Taylor |ψ(t)| ≤ e t s ∑ r=0 |cr |t ≤ e r t s (r) ∑ Φ+ (0) r=0 r! tr = et Φ+ (t). Für festes 0 ≤ t ≤ n wird das Verhalten von |ψ(t)| für p → ∞ von tnp+p−1 nnp+p−1 (nn+1 )p ≤ = (p − 1)! (p − 1)! n(p − 1)! bestimmt. Letzterer Quotient strebt jedoch gegen Null für p → ∞, da die Fakultät stärker steigt als jedes Polynom. Da die Koeffizienten at ∈ Z fest gewählt waren, folgt |S2 | ≤ 21 für hinreichend großes p ∈ P. Mithilfe des nachstehenden sehr aufwendig zu beweisenden Theorems folgt leicht die Transzendenz der Zahl π und weiteren abzählbar vielen transzendenten Zahlen. Theorem 6.4.4. (Hermite-von Lindemann) Sei α ∈ C \ {0} eine algebraische Zahl. Dann ist eα transzendent. Beweis. Siehe [2]. Korollar 6.4.5. Die Kreiszahl π ist transzendent. Beweis. Wäre π algebraisch und betrachtet man das Polynom g(X) = X 2 + 4, so gilt g(2i) = 0 und 2i ist ebenfalls algebraisch. Nach den Vorlesungen der Algebra wäre daher das Produkt 2πi ̸= 0 algebraisch, d.h. nach Theorem 6.4.4 wäre e2πi = 1 transzendent, was offensichtlich ein Widerspruch ist. Literaturverzeichnis [1] H. Hasse: Vorlesungen über Zahlentheorie, Springer: Berlin Göttingen (1964) [2] F. von Lindemann: Über die Zahl π, Mathematische Annalen 20 (1882), pp. 213-225 [3] K. Roos: Vorlesungsmitschrieb von Prof. Dr. W. Kohnen, Heidelberg (2004) [4] A. Selberg: An elementary proof of the prime-number theorem, Annals of Mathematics, Second Series, Vol. 50, No. 2 (1949), pp. 305-313 [5] Commissionaires de l’Académie impériale des Sciences: Œuvres de P. L. Tchebychef, Mathematics, Brown University Library (1907), pp. 51-70 [6] D.B. Zagier: Zetafunktionen und quadratische Körper, Springer: Berlin Heidelberg (1981) 113