Skript Elliptische Kurven II Universität Basel FS 2016 Philipp Habegger 1. Juni 2016 Inhaltsverzeichnis -1. Vorwort 5 I. Algebraische Zahlentheorie 7 0. Übersicht 9 1. Ring der ganzen algebraischen Zahlen 1.1. Zahlkörper . . . . . . . . . . . . . . . . . . . 1.2. Mehr über Körpererweiterungen . . . . . . . 1.3. Einschub über Moduln . . . . . . . . . . . . 1.4. Ring der ganzen Zahlen in einem Zahlkörper 1.5. Diskriminante . . . . . . . . . . . . . . . . . 1.6. Dedekindsche Ringe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 13 14 16 18 21 26 2. Primidealfaktorisierung in ZK 37 2.1. Die Norm eines Ideals . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 2.2. Zerfällung von Primzahlen . . . . . . . . . . . . . . . . . . . . . . . . . . 42 2.3. Kreisteilungskörper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 3. Klassen- und Einheitengruppe 53 3.1. Geometrie der Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 3.2. Einbettung von ZK . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 3.3. Dirichlets Einheitensatz . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 4. Fermats Letzter Satz – ein Spezialfall 67 II. Der Satz von Mordell-Weil 73 5. Höhenfunktionen 5.1. Die Weil Höhe . . . . . . . . . . . . . . . . . . 5.2. Eine Diophantische Anwendung . . . . . . . . 5.3. Die Néron-Tate Höhe . . . . . . . . . . . . . . 5.4. Anwendung auf den Satz von Mordell-Weil . . 5.5. Beweis des schwachen Satzes von Mordell-Weil 77 77 88 90 101 104 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 Inhaltsverzeichnis 6. Epilogue 119 6.1. Die Vermutung von Birch und Swinnerton-Dyer . . . . . . . . . . . . . . 119 4 -1. Vorwort Teil I dieses Skripts entstanden in Vorlesungen, welche ich an der Universität Zürich (HS2010) und der Goethe-Universität Frankfurt am Main (SS2012) gehalten habe. Ich gehe davon aus, dass es noch einige Zeit dauern wird, bis die gröbsten Fehler korrigiert sind. Sie lesen das Skript auf eigene Gefahr! Korrekturvorschläge nehme ich gerne entgegen. Bitte teilen Sie mir solche per Email oder persönlich nach der Vorlesung mit. Folgende zwei Bücher dienten als Grundstruktur für Teil I des Skripts. Sie enthalten bei auch viel weiterführendes Material, unten sind [1] und [2] als Einführungen in das Thema zu verstehen und [3] ist eine Vertiefung. 1. Armin Leutbecher, Zahlentheorie, Springer Verlag 2. Daniel A. Marcus, Number Fields, Universitext, Springer Verlag 3. Jürgen Neukirch, Algebraische Zahlentheorie Springer Verlag Weiterhin hat 4. Enrico Bombier und Walter Gubler, Heights in Diophantine Geometry, Cambridge University Press bei Teil II geholfen. Die Datenbank 5. Database of L-functions, modular forms, and related objects hielf bei der Zusammenstellung einiger Beispiele. 5 Teil I. Algebraische Zahlentheorie 7 0. Übersicht Der Ausgangspunkte der algebraischen Zahlentheorie ist im 19. Jahrhundert. Die vielleicht wichtigste Motivation war es, folgende Behauptung von Fermat zu beweisen, für dessen Beweis ihm bekanntlich das nötige Papier fehlte. Satz (Fermats “letzter Satz”). Sei n ≥ 3 eine ganze Zahl und x, y, z ∈ Z mit xn + y n = z n . Dann gilt xyz = 0. Obwohl er oft mit Fermats Satz bezeichnet wird, wurde dieses Resultat erst 1994 durch Andrew Wiles, mit der Hilfe von Richard Taylor, bewiesen. Der Ansatz von Wiles wird für diese Vorlesung keine Rolle spielen, da die von ihm verwendeten Methoden weit mehr als algebraische Zahlentheorie benötigen. Dennoch kann man mit klassischen Methoden eine schwache Version von Fermats letzten Satz beweisen. Dazu können wir zuerst eine einfache Reduktion durchführen. Seien x, y, z ∈ Z und n ≥ 3 mit xn + y n = z n . Ist p eine Primzahl, die n teilt, so können wir n = pm mit m ∈ N schreiben. Es gilt (xm )p + (y m )p = (z m )p . In anderen Worten erfüllen x0 = xm , y 0 = y m , z 0 = z m die Gleichung x0p + y 0p = z 0p . Natürlich ist xyz = 0 genau dann, wenn x0 y 0 z 0 = 0. Um Fermats letzten Satz zu beweisen genügt es also, denn Fall n = p zu behandeln. Diese Reduktion scheint zwar unspektakulär, führt aber zu einer wesentlichen Vereinfachung des Problems. Nachdem wir genügend Theorie im Laufe des Semesters aufgebaut haben, werden wir folgende schwache Variante von Fermats Satz beweisen können. Satz. Sei p ≥ 3 eine reguläre Primzahl. Falls xp + y p = z p mit x, y, z ∈ Z dann gilt p|xyz. Beachten Sie, dass diese Resultat in zweierlei Hinsicht schwächer als der Satz von Wiles ist. Erstens ist die Schlussfolgerung p|xyz nicht die optimale, nämlich dass mindestens eines der drei Zahlen x, y, z gleich Null ist. Mit grösserem Aufwand ist es übrigens mit klassischen Methoden möglich, p|xyz durch xyz = 0 zu ersetzen. 9 0. Übersicht Zweitens müssen wir uns auf reguläre Primzahlen beschränken. Die Bedeutung des Adjektivs “regulär” wird erst im Laufe des Semester erläutert. Zuerst müssen wir Konzepte wie ganze algebraische Zahlen und Klassengruppen einführen. Die drei kleinsten irregulären Primzahlen sind 37, 59 und 67 und das sind die einzigen unter 100. Man weiss, dass es unendlich viele irreguläre Primzahlen gibt und das sind zunächst schlechte Nachrichten. Heuristische Überlegungen, auf die wir nicht weiter eingehen werden, legen nahe, dass eine Primzahl mit “Wahrscheinlichkeit” e−1/2 = 0.60653 . . . regulär ist. Dennoch ist es bis heute ein offenes Problem zu beweisen, dass es unendlich viele reguläre Primzahlen gibt! Obwohl wir noch einiges an Theorie erarbeiten müssen, bevor wir die schwächere Version von Fermats letzten Satz zeigen können, ist die dem Beweis zugrunde liegene Idee einfach. Wir verdeutlichen diese Idee an einer einfacheren Gleichung. Wir interessieren uns für ganzzahlige Lösungen (x, y) der Gleichung y 2 = x3 + 1. Satz. Die einzige Lösung mit x ungerade ist (−1, 0). (Über Lösungen mit x gerade machen wir hier keine Aussage.) Beweis. Wir schreiben die Gleichung um und faktorisieren y 2 − 1 = x3 also (y − 1)(y + 1) = x3 . Behauptung: Die Zahlen y − 1 und y + 1 sind teilerfremd. Ein gemeinsamer Teiler d ∈ Z von y−1 und y+1 ist auch ein Teiler von (y+1)−(y−1) = 2. Also kommt nur d ∈ {±1, ±2} in Frage. Ist d = ±2, dann ist 2 ein Teiler von x3 und somit auch ein Teiler von x. Dieser Widersprich zur Voraussetzung erledigt die Behauptung. fm Wir schreiben nun y − 1 = ±pe11 · · · penn und y + 1 = ±q1f1 · · · qm mit Primzahlen pi , qi und ei , fi ∈ N. Das Produkt (y − 1)(y + 1) ist eine dritte Potenz und y + 1, y − 1 haben verschiedene Primteiler. Aus der Eindeutigkeit der Primfaktorisierung folgt, dass sowohl die ei wie auch die fi Vielfache von 3 sind. Inbesondere ist y − 1 = ±z 3 und y + 1 = ±w3 mit z, w ∈ Z. Wegen (−1)3 = −1 verschluckt der Kubus ein negatives Vorzeichen. Wir dürfen y − 1 = z 3 und y + 1 = w3 annehmen. Wir nehmen wieder die Differenz und erhalten 2 = (y + 1) − (y − 1) = w3 − z 3 . Dass zwei Kuben sich so nahe sind ist ungewöhnlich. Die Kuben ganzer Zahlen sind . . . − 27, −8, −1, 1, 8, 28, . . . . Differenz 2 tritt nur zwischen 1 und −1 auf. Es folgt also w = 1 und z = −1. 10 Das kann man formal wie folgt beweisen. Aus w3 −z 3 = 2 folgt w > z und (z+1)3 −z 3 ≤ 2. Wir multiplizieren die linke Seite aus, dividieren durch 3 und erhalten z 2 + z − 1/3 ≤ 0. Hieraus folgt z = 0 oder z = −1. Aber w3 = 2 is unlösbar in w ∈ Z. Also muss z = −1 und w = 1 gelten. Es gilt y = 1 + z 3 = 0 und damit x = −1. Das ist also die einzige Lösung (für x ungerade). Der Grund wieso wir uns auf ungerade x einschränken mussten ist das Analogon zu p - xyz in der vereinfachten Version von Fermats Satz. Als nächstes wollen wir die eben beschrieben Method anwenden, um ganzzahlig Lösungen x, y, z von xp + y p = z p zu untersuchen. Wie üblich ist p eine ungerade Primzahl. Unter der Annahme, dass xp + y p = z p und dass xyz 6= 0 wollen wir einen Widerspruch herleiten. Dazu formen wir um z xp = z p − y p = y p (tp − 1) mit t = . y Nun betrachten wir den Ausdruck T p − 1 als Polynom P (T ) ∈ Q[T ]. Dieses Polynom besitzt genau p verschiedene komplexe Nullstellen 1, e 2πi p ,e 4πi p ,...,e 2πi(p−1) p . Wir kürzen ζp = e2πi/p ab. Unser Polynom faktorisiert wie folgt P (T ) = (T − 1)(T − ζp ) · · · (T − ζpp−1 ) und daraus leiten wir xp = (z − y)(z − ζp y) · · · (z − ζpp−1 y) ab. Die oben vorgelegt Strategie suggeriert nun folgendes Vorgehen. (i) Zunächst sollten wir versuchen zu beweisen, dass z − y, z − ζp y, . . . , z − ζpp−1 y paarweise teilerfremd sind. (ii) Danach könnte man hoffe, dass jeder Faktor z − ζpi y (für 0 ≤ i ≤ p − 1) eine p-te Potenz ist. (iii) Schliesslich sind wir versucht, aus (ii) einen Widerspruch herzuleiten. Schon Schritt (i) führt zu einem Problem. Die Ausdrücke z − ζpi y sind für i 6= 0 keine ganze Zahlen und lediglich komplexe Zahlen. Da der Ring der komplexen Zahlen ein Körper ist, ist seine Teilbarkeitstheorie trivial. Wir können uns nicht erhoffen hieraus Information zu gewinnen. Es bietet sich jedoch an, im Ring Z[ζp ] = {a0 + a1 ζp + · · · + ap−1 ζ p−1 ; a0 , . . . , ap−1 ∈ Z} 11 0. Übersicht zu arbeiten. Dieser enthält die relevanten Elemente z − ζ i y und ist dem Ring der ganzen Zahlen “näher” als den komplexen. Um wie in (i) von Teilerfremdheit zu sprechen, setzt voraus, dass man es mit einem faktoriellen Ring zu tun hat. Bekannterweise ist Z faktoriell, aber wie steht es mit Z[ζp ]? Leider gilt folgender Satz, den wir nicht beweisen werden: Satz. Der Ring Z[ζp ] ist faktoriell ⇐⇒ p ≤ 19. Ein faktorieller Ring zu sein, ist also eine zu starke Einschränkung. Wir werden zwar nicht direkt beweisen können, dass Z[ζ23 ] nicht faktoriell ist, aber folgendes Beispiel soll verdeutlichen, dass es sich um ein grundsätzliches Phänomen handelt. √ √ Beispiel 0.1. Man rechnet leicht nach, dass R = Z[ −5] = {a + b −5; a, b ∈ Z} ein Unterring der komplexen Zahlen ist. Dieser Ring ist nicht faktoriell, da die zwei Faktorisierungen √ √ 6 = 2 ∗ 3 = (1 + −5)(1 − −5) √ nicht äquivalent sind. Es lässt sich beweisen, dass 2, 3, 1 ± −5 irreduzible Element von R sind. Weiterhin sind sie paarweise nicht assoziert. Folglich haben wir 6 auf zwei verschiedene Arten faktorisiert. Die Lösung dieses Problems liegt in Dedekinds Idealtheorie. Die Idee ist, kurz gesagt, nicht Elemente zu faktoriseren, sondern Ideale. Das Wort Ideal stammt von der Ansicht, dass Ideale in bestimmten Situationen bessere Faktorisierungseinschaften besitzen als Element eines Rings. Wir werden in den ersten zwei Kapitel beweisen, dass sich in für uns interessante Situationen, Ideale eindeutig als Produkt von Primideal schreiben lassen. Dieser Faktorisierungssatz gilt natürlich nicht in jedem Ring, sondern in einem sogenannten Dedekindschen Ring. Diese Klasse reicht für viele Anwendungen in der Zahlentheorie aus. Der grobe Plan für den ersten Teil dieser Vorlesung sieht wie folgt aus. Kapitel 1. Wir führen Dedekindsche Ringe ein und liefern eine √ wichtige Klasse von Beispielen. Darunter befinden sich die Ringe Z, Z[ζp ] sowie Z[ −5]. Sie verallgemeinert den Ring der ganzen Zahl. Kapitel 2. Hier beweisen wir den Faktorisierungssatz für Ideale in einem Dedekindschen Ring. Kapitel 3. Wir studieren eine wichtige Invariante eines Dedekindschen Rings: die Klassengruppe. Es handelt sich um eine abelsche Gruppe welche “misst”, wie weit ein Dedekindscher Ring davon entfernt ist, faktoriell zu sein. Kapitel 4. Zuletzt werden wir die erarbeitete Theorie verwenden, um eine schwache Version von Fermats letzten Satz zu beweisen. 12 1. Ring der ganzen algebraischen Zahlen Ziel dieses Kapitels ist es, Ringe zu definieren welche in arithmetischen Anwendungen auftreten. Diese sind die sogenannte Dedekindschen Ring. 1.1. Zahlkörper Gegeben seien zwei Körper K und F mit K ⊇ F . Dann nennt man das Paar K/F eine Körpererweiterung und K eine Körpererweiterung von F . Man kann K auf natürliche Art als Vektorraum über F (oder F -Vektorraum) betrachten. Insbesondere besitzt K eine Basis als F -Vektorraum. Wir werden uns hauptsächlich für den Fall interessieren wo dieser Vektorraum endliche Dimension hat. Definition 1.1. Seien K und F Körper mit K ⊇ F . Falls K ein endlich dimensionaler F -Vektorraum ist so nennt man die Erweiterung K/F endlich und setzt [K : F ] = dimF K. Man sagt auch, dass K eine endliche Erweiterung von F ist. Die Dimension [K : F ] heisst Grad der Erweiterung. In der Zahlentheorie speilt der Körper Q der rationalen Zahlen eine besondere Rolle. Deshalb kriegen die endlichen Erweiterungen von Q einen besonderen Namen. Definition 1.2. Eine endliche Erweiterung von Q heisst Zahlkörper. Der Grad eines Zahlkörpers ist [K : Q]. Es folgen ein paar Beispiele. Beispiele 1.3. (i) Natürlich ist Q selbst ein Zahlkörper. √ (ii) Das Polynom X 2 + 1 is irreduzibel in Q[X]. Somit ist K = Q[X]/(P ) = Q( −1) ein Zahlkörper und K/Q hat Grad 2. (iii) Der Körper der reellen Zahlen R ist kein Zahlkörper. Wäre R/Q eine endliche Erweiterung, so wäre R als Menge isomorph zu Qn mit n ∈ N und damit abzählbar unendlich. Dies ist jedoch absurd. Die komplexen Zahlen C bilden auch keinen Zahlkörper. 13 1. Ring der ganzen algebraischen Zahlen (iv) Ein Zahlkörper K heisst quadratisch, falls [K : Q] = 2. Neben Q sind quadratische Zahlkörper die einfachsten Beispiele. Sei m ∈ Z r {0, 1} eine quadratfreie Zahl. D.h. es gibt keine Primzahl p mit p2 |m. Das Polynom P = X 2 − m ∈ Q[X] ist irreduzibel wegen dem Kriterium von Eisenstein. Der Quotient Q[X]/(P ) ist ein Körper K und es gilt √ K = Q( m) √ wobei m gleichbedeutend mit der Restklasse X + (P ) ∈ K ist. Eine Basis von K als Q-Vektorraum ist durch √ (1, m) gegeben. D.h. jedes Element aus x ∈ K lässt sich auf eindeutige Art als Linear√ kombination x = a + mb mit a, b ∈ Q schreiben. √ Wir werden später sehen, dass jede quadratische Erweiterung von Form Q( m) ist. (v) Das Eisenstein Kriterium impliziert ebenfalls, dass X 3 −2 ein irreduzibles Polynom in Q[X] ist. Der Körper Q(21/3 ) ist somit ein Zahlkörper vom Grad 3. Zahlkörper haben Charakteristik 0. Es gibt auch ein natürlich Analogon in Charakteristik p > 0 und diese sind endliche Körpererweiterungen von Fp (X), dem Körper der rationalen Funktionen mit Koeffizienten in Fp = Z/pZ. Solche Körper werden in dieser Vorlesung keine Rolle spielen. 1.2. Mehr über Körpererweiterungen In diesem Abschnitt sind K ⊇ F Körper so, dass K/F eine endliche Körpererweiterung ist. Schon im letzten Abschnitt haben wir gesehen, dass K ein endlich dimensionaler F Vektorraum ist. Jetzt werden wir Konzepte aus der linearen Algebra verwenden um Element von K zu untersuchen. Jedes x ∈ K induziert einen Endomorphismus ϕx von K (als F -Vektorraum) wie folgt: ϕx : K → K ist gegeben durch ϕx (y) = xy für alle y ∈ K. Wir werden später ϕx mit der Hilfe einer F -Basis von K als Matrix ausdrücken. Die folgenden zwei Definition sind natürlich basisunabhängig. Definition 1.4. Die Notation sie wie oben. (i) Die Spur T rK/F (x) von x (bezüglich K/F ) ist die Spur von ϕx betrachtet als Endomorphism des F -Vektorraums K. 14 1.2. Mehr über Körpererweiterungen (ii) Die Norm NK/F (x) von x (bezüglich K/F ) ist die Determinante von ϕx betrachtet als Endomorphism des F -Vektorraums K. Die Notation T rK/F (x) kommt aus dem Englischen oder Französischen (“trace”). Beispiele 1.5. (i) Hier ist F = R und K =√C. Die Erweiterung C/R hat Grad 2. Eine R-Basis von C is gegeben durch (1, −1)√(die Wahl der Wurzel von −1 ist für dieses Beispiel irrelevant). Sei z = x + y −1 mit x, y ∈ R. Dann wird ϕz bezüglich der eben erwähnten Basis durch x −y y x repräsentiert. Demnach ist T rC/R (z) = 2x und NC/R (z) = x2 + y 2 . (ii) Schauen wir uns eine endliche Erweiterung von Q an. √ Das Polynom X 2 − 5 is irreduzibel in Q[X]. Deshalb ist K = Q[X]/P Q[X] √ = Q( 5) eine endliche ErweiQ-Basis von K (wieder terung von Q; der Grad [K : Q] ist 2. Jetzt ist (1, 5) eine √ ist die Wahl der Wurzeln von 5 irrelevant). Sei x = a + 5b. Bezüglich unserer Basis wird ϕx durch a 5b b a repräsentiert. Deshalb gilt T rK/Q (x) = 2a und NK/Q (x) = a2 − 5b2 . Wir werden nun Spur und Norms eines Elements mit Hilfe von Körpereinbettungen beschreiben. Erinnerung. Aus der Algebra kennen wir den folgenden Satz. (i) (Satz des primitiven Elements.) Sei K eine endliche Körpererweiterung von F mit F von Charakteristik 0. Dann existiert ein x ∈ K mit K = F (x). In anderen Worten, es gibt ein irreduzibeles Polynom P ∈ F [X] so, dass K zum Körper F [X]/P F [X] isomorph ist. (ii) Seien F und K wie in (i) und L ein Körper mit L ⊇ K, so dass P in L[X] in Linearfaktoren zerfällt. Sei d = [K : F ]. Es gibt paarweise verschiedene Einbettungen σ1 , . . . , σd : K → L mit σi |F die Identität auf F . Beispiel 1.6. Das Resultat √ (ii) von oben wird durch folgendes Beispiel illustriert. Man nehme F = Q, K = Q( 5) und √ L =√C. Dann ist √ [K : Q]√= 2 und die zwei Einbettungen σ1,2 : K → C sind durch σ1 ( 5) = 5 und σ2 ( 5) = − 5 festgelegt. Die Bedingung im Satz des primitiven Elements, dass F Charakteristik 0 haben soll kann durch eine schwächere ersetzt werden: man muss nur annehmen, dass K/F eine separabele Körpererweiterung ist. Dies gilt zum Beispiel wenn F ein endlicher Körper ist. Nun können wir Spur und Norm mit Hilfe der σi ausdrücken. 15 1. Ring der ganzen algebraischen Zahlen Lemma 1.7. Seien F, K, L, d und σ1 , . . . , σd wie oben in (ii). Für x ∈ K gilt T rK/F (x) = NK/F (x) = d X i=1 d Y σi (x) = −a1 [K : F (x)] [K:F (x)] σi (x) = (−1)[K:F ] am i=1 wobei X m + a1 X m−1 + · · · + am ∈ F [X] das F -Minimalpolynom von x ist. Beweis. Wir werden annehmen, dass F (x) = K gilt. Der allgemeine Fall F (x) ⊆ K wird in einer Übungsaufgabe behandelt. Sei P das F -Minimalpolynom von x mit den Koeffizienten wie in der Behauptung. Wegen unserer Annahmen gilt aber m = d. Die Elements 1, x, x2 , . . . , xd−1 sind F -linear unabhängig. Deshalb ist (1, x, x2 , . . . , xd−1 ) eine F -Basis von K. Bezüglich dieser Basis wird ϕx durch 0 0 · · · 0 −ad 1 0 0 −ad−1 .. .. . . 0 1 . . . . . .. .. .. . . .. 0 0 · · · 1 −a1 repräsentiert. Spur und Determinante dieser Matrix sind −a1 und (−1)d ad . Somit gilt T rK/F (x) = −a1 und NK/F (x) = (−1)d ad und die Hälfte des Lemmas ist bewiesen. Über L faktorisiert P vollständig in Linearfaktoren d P = X + a1 X d−1 d Y + · · · + ad = (X − σi (x)). i=1 Ein Koeffizientenvergleich liefert −a1 = d X d σi (x) und (−1) ad = i=1 d Y σi (x) i=1 und damit ist der Beweis vollständig. Wir werden uns später mit Spur und Norm auf K beschäftigen. Zunächst konzentrieren wir uns aber auf Ringe. 1.3. Einschub über Moduln In diesem Abschnitt machen wir eine kurze Einführung in die Theorie von Moduln. Sei dazu A ein Ring.1 Grob gesagt ist ein A-Modul die Verallgemeinerung eines Vektorraums. Die Definition ist auch ähnlich. 1 Ab jetzt ist ein Ring stets kommutative und besitzt ein Einselement. 16 1.3. Einschub über Moduln Definition 1.8. Sei A ein Ring mit Einselement 1. Ein A-Modul ist eine abelsche Gruppe (M, +, 0) zusammen mit einer Abbildung · : A × M → M , genannt Skalarmultiplikation, für die die folgenden Eigenschaften gelten. (i) Für alle a, b ∈ A und alle m ∈ M gilt (ab)·m = a·(b·m) und (a+b)·m = a·m+b·m. (ii) Für alle a ∈ A und alle m, n ∈ M gilt a · (m + n) = a · m + a · n. (iii) Für alle m ∈ M gilt 1 · m = m. Wir werden · oft weglassen und benutzen nur das Symbol M , um den Modul zu bezeichnen. Beispiele 1.9. (i) Sei G eine beliebige abelsche Gruppe und A = Z. Dann können wir G mit der Struktur eines Z-Moduls wie folgt ausstatten. Sei + die Verknüpfung auf G und 0G das neutrale Element von G. Sei a ∈ Z und g ∈ G. Wir setzen a · g = g + ··· + g | {z } a mal falls a > 0, a · g = − (g + · · · + g) | {z } −a mal falls a < 0, und 0 · g = 0G . Man überprüft leicht, dass G ein Z-Modul ist. In der Tat ist das Datum eines Z-Moduls äquivalent zum Datum einer abelschen Gruppe. (ii) Ist A ein Körper, so ist ein A-Modul ein A-Vektorraum und umgekehrt ist ein A-Vektorraum ein A-Modul. (iii) Sei A ein Ring und I ein Ideal. Dann ist I ein A-Modul, da ai ∈ I für alle a ∈ A und alle i ∈ I. (iv) Sei A ein Ring und I ⊆ A ein Ideal. Wir wissen bereits aus dem letzten Beispiel, dass I ein A-Modul ist. Der Quotient A/I trägt auch die Struktur eines A-Moduls. Die Veknüpfung A × (A/I) → A/I definieren wir wie folgt. Ein typisches Element von A/I ist von der Form m + I für einen Repräsentanten m ∈ A. Sei a ∈ A. Da I ein Ideal ist, gilt ab ∈ I für jedes b ∈ I. Ist also n ∈ A ein neuer Repräsentant von m + I (d.h. n + I = m + I) so gilt m − n ∈ I und damit a(m − n) ∈ I. Es folgt, dass am + I = an + I. Somit ist die Nebenklasse a(m + I) = am + I wohldefinieren. 17 1. Ring der ganzen algebraischen Zahlen Die gesuchte Verknüpfung A × (A/I) → A/I wird durch (1.9) gegeben. Dass alle Eigenschaften eines Moduls erfüllt sind, folgt nach einer kleinen Rechnung. Nur als Beispiel halten wir a(m + I + n + I) = a(m + n) + I für a, m, n ∈ A fest; hieraus folgt (ii) in der Definition des Moduls. Achtung. Die Theorie der Moduln ist einiges komplizierter als die Theorie der Vektorräume. Es gibt zwar den Begriff einer Basis eines Moduls, aber nicht jeder Modul besitzt eine Basis. Wir benötigen nicht viel mehr als den Formalismus von Moduln und gehen nicht tief in die Theorie ein. Ein Untermodul ist die Verallgemeinerung eines Untervektorraums. Definition 1.10. Sei A ein Ring und (M, +, 0) ein A-Modul. Ein Untermodul von M ist eine Untergruppe von (M, +, 0), die abgeschlossen unter der Skalarmultiplikation ist. Der folgende Begriff ist eine wichtige Endlichkeitsaussage für Moduln. Definition 1.11. Sei A ein Ring. Ein A-Modul M heisst endlich erzeugt, falls es m1 , . . . , mn ∈ M gibt, so dass für jedes m ∈ M Elemente r1 , . . . , rn ∈ A existieren, mit m = r1 m1 + · · · + rn mn . In etwas eleganter Notation gilt M = Am1 + · · · + Amn . Obwohl es formal nicht erlaubt ist, werden wir Elemente im Modul oft auch von der rechten Seite mit Elementen aus dem Grundring Skalarmultiplizieren.2 1.4. Ring der ganzen Zahlen in einem Zahlkörper Das Ziel dieses Abschnitts ist es, die “korrekte” Verallgemeinerung ZK der √ ganzen Zahln −1) werden Z in einem Zahlkörper K zu konstruieren. Zum Beispiel im Fall K = Q( √ √ wir√ZK = Z[ −1] erhalten. Etwas erstaunlich ist, dass ZK = Z[( 5 + 1)/2], falls K = Q( 5). Die Konstruktion ist ein ganz allgemeines Konzept aus der kommutativen Algebra. Definition 1.12. Sei K ein Körper und A ein Unterring von K. Dann heisst AK = {x ∈ K : es existieren a1 , . . . , ad ∈ A mit xd + a1 xd−1 + · · · + ad = 0} der ganze Abschluss von A in K. Elemente von AK heissen ganz über A. Diese Definition macht auch Sinn, wenn der Körper K durch einen Ring ersetzt wird. Bemerkungen 1.13. (i) Es ist a priori nicht klar, dass AK ein Unterring von K ist, weil nicht offensichtlich ist, dass AK abgeschlossen ist bzgl. Addition und Multiplikation. Wir werden aber genau dies weiter unten beweisen. 2 Das ist harmlos, da bei uns der Grundring stets kommutativ ist. 18 1.4. Ring der ganzen Zahlen in einem Zahlkörper (ii) Auf jeden Fall gilt A ⊆ AK denn jedes a ∈ A ist Nullstelle von X − a. Bevor wir zu weiteren Eigenschaften von AK kommen, untersuchen wir ein wichtiges Beispiel: A = Z und K = Q. Lemma 1.14. Es gilt ZQ = Z. Beweis. Die Inklusion Z ⊆ ZQ wurde schon erwähnt. Es reicht also zu zeigen, dass x ∈ Z aus x ∈ ZQ folgt. Da x ∈ Q gibt es teilerfremd p, q ∈ Z mit q 6= 0 so, dass x = p/q. Nun ist x auch ganz über Z. Somit existieren a1 , . . . , ad ∈ Z mit xd + a1 xd−1 + · · · + ad = 0. Oder pd + a1 pd−1 q + · · · + ad q d = 0. (1.1) Sei nun l eine Primzahl welche q teilt. Aus (1.1) schliessen wir, dass l auch p teilen muss. Dies widersprich aber der Annahme, dass p und q teilerfremd sind. Somit hat q keine Primteiler. Also q = ±1 und x ∈ Z. Wir zeigen weiter unten, dass AK ein Ring ist. Dafür brauchen wir eine alternative (aber äquivalente) Definition. Lemma 1.15. Sei K ein Körper und A ⊆ K ein Unterring mit x1 , . . . , xn ∈ K. Die folgenden zwei Aussagen sind äquivalent. (i) Wir haben x1 , . . . , xn ∈ AK . (ii) Der Ring A[x1 , . . . , xn ] ist ein endlich erzeugter A-Modul. (Das heisst, es gibt y1 , . . . , ym ∈ A[x1 , . . . , xn ] mit A[x1 , . . . , xn ] = y1 A + · · · + ym A.) Beweis. Wir zeigen zunächst “(i)⇒(ii)” über Induktion auf n. Sei n = 1 und x = x1 . Es existieren a1 , . . . , ad ∈ A mit xd + a1 xd−1 + · · · + ad = 0. Somit haben wir xd ∈ xd−1 A + 0 · · · + A. Induktion auf d0 zeigt nun, dass für d0 ≥ d die Beziehung xd ∈ xd−1 A + · · · + A gilt. Daraus folgt, dass A[x] als A-Modul von xd−1 , . . . , x, 1 erzeugt wird. Sei also n > 1. Aus der Induktionsvoraussetzung folgt A[x1 , . . . , xn−1 ] = y1 A + · · · + ym A für geeignete yi . Deshalb ist A[x1 , . . . , xn ] = y1 A[xn ] + · · · + ym A[xn ]. Aus dem Fall n = 1 folgt, dass A[xn ] ein endlich erzeugter A-Modul ist. Somit ist die Implikation “(i)⇒(ii)” bewiesen. Nun zu “(ii)⇒(i)”. Aus Symmetriegründen reicht es zu zeigen, dass x = x1 ganz über A ist. Sei also A[x1 , . . . , xn ] = y1 A + · · · + ym A. Für jedes 1 ≤ i ≤ m haben wir xyi = m X αij yj j=1 für geeignete αij ∈ A. Die Matrix M = (αij )1≤i,j≤m hat Koeffizienten in A und erfüllt M v = xv mit v = (y1 , . . . , ym )t ∈ K m , wobei t transponieren bedeutet. Es gilt v 6= 0, also ist v ein Eigenvektor von M mit Eigenwert x. Da sich alles im Körper K abspielt, ist x Nullstelle des charakteristischen Polynoms von M . Dieses Polynom ist normiert und seine Koeffizienten sind Produkte und Summen der αij , also wiederum in A. Deshalb ist x ganz über A. 19 1. Ring der ganzen algebraischen Zahlen Bemerkung 1.16. Dieses letzte Lemma gilt auch, falls wir K durch einen beliebigen Ring ersetzen. Der Beweis benötigt jedoch einige Anpassungen, da die entscheidenden Aspekte der linearen Algebra in dieser Allgemeinheit nicht gelten. Die Tatsache, dass AK ein Ring ist folgt nun leicht. Proposition 1.17. Sei K ein Körper und A ein Unterring von K. Dann ist AK ein Unterring von K. Beweis. Wegen 0, 1 ∈ AK reicht zu zeigen, dass mit x, y ∈ AK auch x − y und xy in AK liegen. Aus Lemma 1.15 “(i)⇒(ii)” folgt, dass A[x, y] ein endlich erzeugter A-Modul ist. Es gilt A[x, y] = A[x, y, x − y, xy]. Die Umkehrung “(ii)⇒(i)” zeigt nun, dass x − y und xy beide in AK liegen. Jetzt kommen wir zu einer wichtigen Definition. Definition 1.18. Sei K ein Zahlkörper. Dann heisst ZK der Ring der ganzen algebraischen Zahlen in K. Element von ZK heissen ganze Zahlen von K. Algebraische Zahlentheorie ist zu einem grossen Teil das Studium von Eigenschaften dieser Ringe. Beispiel 1.19. Wir haben schon gesehen, dass ZQ = Z gilt. (Das gleiche Argument zeigt übrigens, dass ZK ∩ Q = Z für jeden Körper K ⊇ Q gilt.) Man erhält also nichts Neues im Falle K = Q, was natürlich zu erwarten war. Auf der anderen Seite gilt ZK ) Z für jeden Zahlkörper K mit K 6= Q. Bemerkung 1.20. Der Ring ZC is auch wohldefiniert. Er heisst Ring der ganzen algebraischen Zahlen, wird jedoch in der Vorlesung keine besondere Rolle spielen. Das nächste Lemma ist oftmals nützlich, um ZK zu bestimmen. Lemma 1.21. Sei K ein Zahlkörper und x ∈ K mit Q-Minimalpolynom P ∈ Q[X]. Dann gilt x ∈ ZK genau dann, wenn P ∈ Z[X]. Beweis. Die Richtung “⇐” folgt aus der Definition. Sei also x ∈ ZK . Es existiert R = X d +a1 X d−1 +· · ·+ad ∈ Z[X] mit R(x) = 0. Somit teilt P das Polynom R im Ring Q[X]. In anderen Worten, es gilt R = P Q mit Q ∈ Q[X]. Da P und Q normiert sind, gibt es positive p, q ∈ Z mit pP, qQ ∈ Z[X] primitiv (d.h. ihre Koeffizienten sind teilerfremd). Das Gauss’sche Lemma impliziert, dass das Produkt (pP )(qQ) = pqR primitiv ist. Das ist aber nur möglich, falls pq = 1 = p = q. Also hat P Koeffizienten in Z. Lemma 1.22. Sei K ein Zahlkörper und x ∈ ZK . Dann sind T rK/Q (x) und NK/Q (x) in Z. Beweis. Wegen Lemma 1.21 liegt das Q-Minimalpolynom X m + a1 X m−1 + · · · + am von x in Z[X]. Spur und Norm von x sind also in Z wegen Lemma 1.7. 20 1.5. Diskriminante Beispiel 1.23. Wir bestimmen nun ZK für die einfachsten nichttrivialen Zahlkörper, die quadratischen Erweiterungen von Q. Sei m ∈ Z r {0, 1} quadratfrei. Insbesondere gilt m 6≡ 0 (mod 4). Aus dem Eisensteinschen Kriterium folgt, dass X 2 − m in Q[X] irreduzibel ist für m 6= −1. Im Fall m = −1 ist √ dieses Polynom natürlich auch irreduzibel. Deshalb ist K = Q[X]/(X 2 − m)Q[X] = Q( m) eine quadratische Erweiterung von Q, d.h. [K : Q] = 2. Aus der Algebra ist bekannt sein, dass jede quadratische Erweiterung von Q von dieser Form ist. √ Wir berechnen ZK . Weil X 2 − m Koeffizienten in Z besitzt und normiert ist, gilt m∈ √ √ ZK . Weil ZK ein Ring ist folgt daraus sofort, √ dass Z[ m] = Z + mZ ⊆ ZK . Jedes Element x ∈ ZK hat die Form a + mb mit a, b ∈ Q. Wir werden nun weitere Bedingungen an a, b finden. Falls b = 0, dann ist x = a ∈ ZK ∩ Q = Z (siehe Bemerkung im Beispiel oben). Nehmen wir von nun an also b 6= 0 an, also x 6∈ Q. Es gilt m = ((x − a)/b)2 und eine kurze Rechnung zeigt, dass P = X 2 − 2aX + (a2 − b2 m) ∈ Q[X] bei x verschwindet. Wegen x 6∈ Q ist P das Q-Minimalpolynom von x. Aus der “⇒” Richtung von Lemma 1.21 wissen wir, dass P ∈ Z[X]. In anderen Worten, a0 = 2a, a2 − b2 m ∈ Z. Somit ist a02 −4b2 m ∈ 4Z und deshalb (2b)2 m ∈ Z. Weil m quadratfrei ist, folgt hieraus b0 = 2b ∈ Z (nutze die Primfaktorisierung in Z). Wir haben also a02 − b02 m ∈ 4Z oder a02 ≡ b02 m (mod 4). Falls a0 ungerade ist, so gilt a02 ≡ 1 (mod 4) und deshalb b02 m ≡ 1 (mod 4). Also muss b0 auch ungerade sein und m ≡ 1 (mod 4). Im Fall m ≡ 2, 3 (mod 4) ist damit zumindest a0 gerade sind, wegen 0 ≡ b02 m (mod 4) folgt dasselbe für b0 . Dann sind a und b in Z und wir folgern √ √ (1.2) ZK = Z + mZ = Z[ m] falls m ≡ 2, 3 (mod 4). Es bleibt den Fall m ≡ 1 (mod 4) zu betrachten (m ≡ 0 (mod 4) ist unmöglich). Hier wissen wir, dass a02 ≡ b02 (mod 4). Also teilt 4 das Produkt (a0 − b0 )(a0 + b0 ). Das ist aber nur möglich, falls a0 − b0 gerade ist. Aber a − b √ = (a0 − b0 )/2 ∈ Z und somit ist √ x = (a0 −b0 )/2+b0 (1+ ist einfach √ m)/2. Wir finden ZK ⊆ Z+(1+ m)/2Z. Andererseits 2 zu zeigen, dass (1+ m)/2 ganz über Z ist mit Q-Minimalpolynom X −X +(1−m)/4 ∈ Z[X]. Zusammenfassend, √ √ 1+ m 1+ m ZK = Z + Z=Z falls m ≡ 1 (mod 4). (1.3) 2 2 Bemerkung 1.24. Ist K ein Zahlkörper, so gibt es im Allgemeinen kein x ∈ ZK mit ZK = Z[x]. 1.5. Diskriminante Die erste Invariante eines Zahlkörpers, die man kennenlernt, ist sein Grad. Die Diskriminante eines Zahlkörpers ist eine Invariante, die sich nicht so einfach definieren lässt. 21 1. Ring der ganzen algebraischen Zahlen Sie ist jedoch aus zweierlei Hinsicht von grundlegender Bedeutung. Erstens ist sie ein wichtiges technisches Hilfsmittel; auf diesen Aspekt werden wir uns im aktuellen Abschnitt konzentrieren. Zweitens verschlüsselt die Diskriminante “fast” alle Information eines Zahlkörpers. Wir werden erst später diese Information extrahieren können. Wir beginnen mit der Definition der Diskriminante eines Tupels. Definition 1.25. Sei F ein Körper und K eine endliche Erweiterung vom Grad d. Die Diskriminante eines Tupels (x1 , . . . , xd ) ∈ K d ist T rK/F (x1 x1 ) · · · T rK/F (x1 xd ) .. .. ∆K/F (x1 , . . . , xd ) = det . . . T rK/F (xd x1 ) · · · T rK/F (xd xd ) Sie ist ein Element von F , da alle Spuren in F liegen. Sie F ein Körper der Charakteristik 0, wir werden den Satz des primitiven Elements anwenden, um die Diskriminante auf alternative Weise zu berechnen. Für die nächsten zwei Lemmas brauchen wir die folgende Notation. Gegeben sei ein Körper F der Charakteristik 0 und eine endliche Erweiterung K vom Grad d. Es existiert ein Körper L, welcher F enthält und d paarweise verschiedene Einbettungen σ1 , . . . , σd : K → L mit σi |F = idF for 1 ≤ i ≤ d. Diese Existenzaussage ist eine Konsequenz vom Satz des primitiven Elements. Lemma 1.26. Sei (x1 , . . . , xd ) ∈ K d . (i) Es gilt σ1 (x1 ) · · · .. ∆K/F (x1 , . . . , xd ) = det . σd (x1 ) · · · (ii) Falls yi = Pd j=1 2 σ1 (xd ) .. . . σd (xd ) (1.4) αij xj mit αij ∈ F , dann gilt ∆K/F (y1 , . . . , yd ) = det(A)2 ∆K/F (x1 , . . . , xd ) wobei α11 · · · .. A= . αd1 · · · α1d .. . αdd die entsprechende Übergangsmatrix ist. Beweis. Um das Lemma zu beweisen definieren wir M als die Matrix auf der rechten Seite von (1.4). Es gilt σ1 (x1 x1 ) + · · · + σd (x1 x1 ) · · · σ1 (x1 xd ) + · · · + σd (x1 xd ) .. .. det M 2 = det M t M = det . . . σ1 (xd x1 ) + · · · + σd (xd x1 ) · · · 22 σ1 (xd xd ) + · · · + σd (xd xd ) 1.5. Diskriminante Diese Determinante ist ∆K/F (x1 , . . . , xd ) wegen Lemma 1.7. Also folgt Teil (i). Teil (ii) folgt aus ∆K/F (y1 , . . . , yd ) = (det M At )2 = det(A)2 ∆K/F (x1 , . . . , xd ); die zweite Gleichheit ist eine Konsequenz von (i). Die Tatsache dass wir eine F -Basis (x1 , . . . , xd ) durch eine beliebe ersetzen können, um die Diskriminante zu berechnen (wenn man die ensprechende Übergangsmatrix kennt), ist entscheidend im nächsten Lemma. Lemma 1.27. Sei (x1 , . . . , xd ) ∈ K d eine F -Basis von K. Dann ist ∆K/F (x1 , . . . , xd ) 6= 0. Beweis. Weil F Charakteristik 0 hat, gibt es x ∈ K mit K = F (x). In anderen Worten, (1, x, . . . , xd−1 ) ist eine F -Basis von K. Wegen Teil (ii) des vorhergehenenden Lemmas genügt es, das aktuelle Lemma für diese Basis zu zeigen; die Übergangsmatrix ist natürlich nicht-singulär. Aus Lemma 1.26(ii) erhalten wir 1 σ1 (x) σ1 (x)2 · · · .. .. ∆K/F (1, x, . . . , xd−1 ) = det ... . . 1 σd (x) σd (x)2 · · · 2 σ1 (x)d−1 .. . . d−1 σd (x) Diese Determinante ist von Vandermondeschen Typ. Es gilt Y (σi (x) − σj (x))2 . ∆K/F (1, x, . . . , xd−1 ) = 1≤i<j≤d Da die σi paarweise verscheiden sind und weil K = F (x) gilt folgern wir, dass σ1 (x), . . . , σd (x) paarweise verschieden sind. Die Diskriminante ist also nicht 0. Ab jetzt ist K ein Zahlkörper und F = Q. Zur Erinnerung, ZK bezeichnet den Ring der ganzen algebraischen Zahlen in K. Wir werden jetzt die Diskriminante benutzen, um erste Einblicke über die Struktur von ZK als Z-Modul zu erhalten. Lemma 1.28. Sei K ein Zahlkörper vom Grad d über Q. Des Weiteren sei (x1 , . . . , xd ) ∈ K d eine Q-Basis von K wobei wir x1 , . . . , xd ∈ ZK annehmen. Dann gilt ∆K/Q (x1 , . . . , xd )ZK ⊆ x1 Z + · · · + xd Z. Beweis. Da (x1 , . . . , xd ) eine Basis von K als Q-Vektorraum ist, können wir jedes x ∈ ZK als Linearkombination x = α1 x1 + · · · + αd xd mit α1 , . . . , αd ∈ Q schreiben. Nun berechnen wir die Spur von xi x für die möglichen i in dem wir ihre Q-Linearität ausnützen T rK/Q (xi x) = α1 T rK/Q (xi x1 ) + · · · + αd T rK/Q (xi xd ). 23 1. Ring der ganzen algebraischen Zahlen Fassen wir alle d Gleichung in eine Matrizengleichung zusammen so erhalten wir T rK/Q (x1 x) T rK/Q (x1 x1 ) · · · T rK/Q (x1 xd ) α1 .. .. .. .. v= = . . . . . T rK/Q (xd x) T rK/Q (xd x1 ) · · · T rK/Q (xd xd ) αd | {z } | {z } M α Aus Lemma 1.22 und xi x ∈ ZK folgern wir v ∈ Zd . Die lineare Algebra impliziert Zd 3 M # v = M # M α = det(M )α. Unsere Definition der Diskriminante ergibt ∆K/Q (x1 , . . . , xd )αi ∈ Z für 1 ≤ i ≤ d und somit ∆K/Q (x1 , . . . , xd )x ∈ x1 Z + · · · + xd Z. Das Lemma folgt, da x ∈ ZK beliebig war. Man beachte, dass das vorhergehende Lemma trivial ist wenn die Diskriminante verschwindet. Um diesen Fall auszuschliessen, brauchen wir Lemma 1.27. Als Konsequenz erhalten wir die folgende Proposition über die Z-Modulstruktur von ZK . Proposition 1.29. Sei K ein Zahlkörper vom Grad d und sei M 6= 0 ein endlich erzeugter Untermodul von K betrachtet als ZK -Modul (als Beispiel ist M = ZK möglich). Dann ist M frei von Rang d als Z-Modul. In anderen Worten: es gibt Z-linear unabhängige x1 , . . . , xd ∈ M so dass sich jedes element von M in der Form α1 x1 + · · · + αd αd mit α1 , . . . , αd ∈ Z eindeutig schreiben lässt. Beweis. Sei (x1 , . . . , xd ) eine beliebige Q-Basis von K. Wir zeigen zuerst, dass wir x1 , . . . , xd ∈ ZK annehmen können. Seien dazu a0 , . . . , ad ∈ Z mit a0 6= 0 und a0 xd1 + · · · + ad = 0. Dann gilt nach Multiplikation mit a0d−1 (a0 x1 )d + a1 (a0 x1 )d−1 + · · · + a0d−1 ad = 0. Also ist a0 x1 Nullstelle eines normierten Polynoms mit ganzzahligen Koeffizienten und somit a0 x1 ∈ ZK . Analog können wir x2 , . . . , xd durch positive, ganzzahlige Vielfache ersetzen, die in ZK liegen. Das neue Tupel bleibt eine Q-Basis von K. Also können wir x1 , . . . , xd ∈ ZK annehmen. Nun sei ∆ = ∆K/Q (x1 , . . . , xd ) ∈ Q. Wegen Lemma 1.27 haben wir ∆ 6= 0. Lemma 1.28 zeigt die zweite Inklusion in x1 Z + · · · + xd Z ⊆ ZK ⊆ xd x1 Z + · · · + Z. ∆ ∆ Die rechte und linke Seiten sind freie Z-Modul vom Rang d, da x1 , . . . , xd linear unabhängig über Q sind, und ZK steckt dazwischen. Der Struktursatz über endlich erzeugte Z-Moduln impliziert nun, dass ZK ein freier, endlich erzeugter Z-Modul von Rang d ist. 24 1.5. Diskriminante Wir haben gezeigt, dass ZK ein freier Z-Modul von Rang d ist. Nun wollen wir dasselbe für M tun. Nach Voraussetzung ist M = y1 ZK + · · · + yn ZK für ein Erzeugersystem y1 , . . . , y n ∈ M . Mit dem gleichen Argument wie oben finden wir ein ganzzahliges a ≥ 1 mit ay1 , . . . , ayn ∈ ZK . Also gilt aM ⊆ ZK . Der Struktursatz über endliche erzeugte Z-Moduln impliziert, dass aM endlich erzeugt und frei von Rang höchstens d ist. Andererseits ist M 6= 0, also exist m ∈ M r {0}. Es gilt mZK ⊆ M , weil M abgeschlossen unter Multiplikation mit Elementen ZK aus. Daraus folgt, dass M frei von Rang d als Z-Modul. Bemerkung 1.30. Diese Proposition gilt sogar in folgender Allgemeinheit. Sei K eine endliche Körpererweiterung von F mit [K : F ] = d und F habe Charakteristik 0. Weiterhin sei A ein Unterring von F , der ein Hauptidealring ist. Dann ist der ganze Abschluss AK von A in K ein Ring; dies folgt aus Proposition 1.17. Für ein endlich erzeugter A-Modul gibt es auch einen Struktursatz Analog zum Fall A = Z; entscheidende ist, dass A ein Hauptidealring ist. Mit dem selben Argument wie oben zeigt man, dass jeder endlich erzeugte AK -Untermodul 0 6= M ⊆ K ein freier A-Modul vom Rang d ist. Das nächste Korollar lässt sich auch in dieser Allgemeinheit formulieren. Korollar 1.31. Sei K ein Zahlkörper. (i) Jedes Ideal I von ZK is endlich erzeugt, d.h. es gibt y1 , . . . , yn mit I = y1 ZK + · · · + yn ZK . In anderen Worten ist ZK ein noetherscher Ring. (ii) Ist I 6= 0 ein Ideal von ZK , dann ist I ein freier Z-Modul von Rang [K : Q]. (iii) Der Quotientenkörper Quot(ZK ) von ZK ist K. Beweis. Sei I ⊆ ZK ein Ideal. Gemäss Proposition 1.29 ist ZK ein freier Z-Modul von Rang [K : Q], also impliziert der Struktursatz über endlich erzeugte Z-Moduln, dass I frei von Rang höchstens [K : Q] ist. Insbesondere ist I endlich erzeugt als Z-Modul. Eine Erzeugendersystem als Z-Modul erzeugt auch I als Ideal. Teil (i) folgt. Um Teil (ii) zu zeigen nimmt man M = I in Proposition 1.29, die Voraussetzung ist erfüllt, da I ein endlich erzeugtes Ideal ist. Schliesslich folgt Teil (iii) aus dem Argument, welches wir am Anfang des Beweises von Proposition 1.29 benutzt haben. Achtung. Sei K ein Zahlkörper und I 6= 0 ein Ideal von ZK . Im Allgemeinen ist I kein freier ZK -Modul. Beispiel 1.32. Wir Überprüfen direkt, dass ZK ein freier Z-Modul von√Rang 2 ist, falls K ein Zahlkörper vom Grad 2 ist. Wir wissen bereits, dass K = Q( m) für ein quadratfreies m ∈ Z r {0, 1}. Weiterhin haben wir in Beispiel 1.23 gesehen, dass √ Z+Z m : falls m ≡ 2, 3 (mod 4), √ ZK = 1+ m Z+Z 2 : falls m ≡ 1 (mod 4). √ √ Im ersten Fall ist (1, m) eine Z-Basis von ZK und im zweiten Fall ist (1, (1 + m)/2) eine Z-Basis. In beiden Fällen sehen wir also direkt, dass ZK ein freier Z-Modul von Rang 2 ist. 25 1. Ring der ganzen algebraischen Zahlen Jetzt können wir die Diskriminante eines Zahlkörpers definieren. Definition 1.33. Sei K ein Zahlkörper vom Grad d. Wegen Korollar 1.31 gibt es x1 , . . . , xd ∈ ZK so, dass (x1 , . . . , xd ) eine Z-Basis von ZK ist. Wir definieren die Diskriminante von K als ∆K = ∆K/Q (x1 , . . . , xd ). Bemerkung 1.34. Die Diskriminante ist unabhängig von der Wahl der Z-Basis (x1 , . . . , xd ): ist (y1 , . . . , yd ) eine weitere Z-Basis, so ist die entsprechende Übergangsmatrix in GLd (Z). Diese muss Determinante ±1 haben. Es folgt nun ∆K/Q (x1 , . . . , xd ) = ∆K/Q (y1 , . . . , yd ) aus Lemma 1.26(ii). Die Definition der Diskriminante und Lemma 1.22 implizieren, dass ∆K ∈ Z für jeden Zahlkörper. Des Weiteren ist ∆K 6= 0 wegen Lemma 1.27. Für kleine Zahlkörper können wir die Diskriminante schon berechnen. Beispiele 1.35. (i) Es gilt ∆Q = 1. √ (ii) Sei K = Q( m) mit m ∈ Z r {0, 1} quadratfrei. Wir haben schon eine Z-Basis von ZK kennengelernt. Mit Hilfe dieser lässt sich 4m : falls m ≡ 2, 3 (mod 4), ∆K = m : falls m ≡ 1 (mod 4) zeigen. Dies ist eine Übungsaufgabe auf Blatt 3. Definition-Lemma 1.36. Sei K ein Zahlkörper und I 6= 0 ein Ideal von ZK . Dann ist ZK /I ein endlicher Ring. Wir definieren die Norm von I als die Kardinalität N (I) = #(ZK /I) < ∞. Wir setzen auch N (0) = 0 für das Nullideal. Beweis. Ist I = 6 0 ein Ideal von ZK , dann haben I und ZK denselben endlichen Rang als Z-Moduln wegen Korollar 1.31. Daher ist ZK /I endlich. 1.6. Dedekindsche Ringe Nachdem wir die Z-Modulstruktur von ZK aufgeklärt haben, untersuchen wir jetzt die Struktur als Ring. Bemerkung 1.37. Ist K ein Zahlkörper √ dann ist im Allgemeinen ZK kein Hauptidealring. Dies haben wir am Fall K = Q( −5) in Beispiel 0.1 gesehen. Das Ziel diese Abschnitts ist es, diesen Defizit wett zumachen. Wir werden uns nicht gar nicht erst darum bemühen, Elemente von ZK in Primfaktoren zu faktoriseren. Die neue Idee wird sein, Ideale von ZK als Produkte von Primideale zu schreiben. Wir beginnen mit einem klassischen Begriff. 26 1.6. Dedekindsche Ringe Definition 1.38. Einen Integritätsbereich R mit Quotientenkörper Quot(R) nennt man ganz abgeschlossen, falls RQuot(R) = R Die nächste Proposition fasst schon bekannte Eigenschaften von ZK mit neuer Information zusammen. Sie ist das Produkt unsere Arbeit bis hierhin. Proposition 1.39. Sei K ein Zahlkörper. Dann ist R = ZK ein Integritätsbereich und es gilt: (D1) R ist noethersch, (D2) R ist ganz abgeschlossen, (D3) jedes Primideal von R ungleich 0 ist ein maximales Ideal. Beweis. Eigenschaft (D1) ist Korollar 1.31(i). Wir zeigen nun (D2). Das eben erwähnte Korollar impliziert auch Quot(ZK ) = K. Also müssen wir (ZK )K = ZK zeigen. Hierbei ist die Inklusion “⊇” klar. Sei also x ∈ (ZK )K . Lemma 1.15 zeigt, dass ZK [x] ein endlich erzeugter ZK -Modul ist. Wegen Proposition 1.29(ii) ist ZK [x] ein endlich erzeugter Z-Modul. Dieser Modul enthält Z[x], welches deshalb selbst ein endliche erzeugter Z-Modul ist. Aus Lemma 1.15 (umgekehrte Richtung) folgt nun, dass x ganz über Z ist. Also x ∈ ZK . Da x beliebig war folgt (ZK )K ⊆ ZK und somit (D2). Um (D3) zu zeigen, sei P 6= 0 ein Primideal von ZK . Aus der Algebra ist bekannt, dass ZK /P ein Integritätsbereich ist. Dieser Ring ist endlich mit Kardinalität N (P ). Die Proposition folgt nun aus folgender Tatsache: jeder endlicher Integritätsbereich R ist ein Körper. Um das zu zeigen, sei x ∈ R r {0}. Dann ist y 7→ xy ein Gruppenhomomorphismus zwischen von additiven Gruppe in sich selbst R → R. Dieser ist injektiv da xy = 0 nur sein kann, falls y = 0. Da R endlich ist muss jede injektive Selbstabbildung R → R auch surjektiv sein. Insbesondere gibt es y ∈ R mit xy = 1. Also ist R ein Körper. Wir werden nur die drei Eigenschaften (D1), (D2) und (D3) von ZK brauchen, um die schon angedeutete Faktorisierungstheorie zu entwickeln. Ring die ihnen genügen tragen einen besonderen Namen. Definition 1.40. Ein Integritätsbereich R der (D1), (D2) und (D3) erfüllt, heisst Dedekindscher Ring. Beispiele 1.41. (i) Der Ring der ganzen Zahlen eines Zahlkörpers ist ein Dedekindscher Ring wegen Proposition 1.39. (ii) Jeder Hauptidealring ist ein Dedekindscher Ring. Dies wird in den Übungen bewiesen. (iii) Der Polynomring K[X, Y ] über einem Körper K mit zwei Unbekannte X und Y ist kein Dedekindscher Ring. Obwohl man beweisen kann, dass (D1) und (D2) erfüllt sind, gibt es Primideale wie XK[X, Y ] die nicht maximal sind: XK[X, Y ] ( (X, Y ). 27 1. Ring der ganzen algebraischen Zahlen (iv) Gemäss unserer Definition ist ein Körper ein Dedekindscher Ring. Einige Authoren schliessen diesen Fall jedoch explizit aus. Definition 1.42. Sei R ein beliebiger Ring (wie immer kommutativ mit 1). Wir definieren die Summe zweier Ideal I, J ⊆ R als I + J = {a + b : a ∈ I und b ∈ J}. Dann ist I + J wieder ein Ideal von R. Wir können auch deren Produkt definieren ( n ) X IJ = ai bi : a1 , . . . , an ∈ I und b1 , . . . , bn ∈ I . i=1 Auch IJ ist ein Ideal von R. Bemerkungen 1.43. (i) Einzeln sind diese zwei Operationen assoziativ und kommutativ. Zusammen erfüllen sie das Distributivitätsgesetzt. (ii) Das Nullideal {0} ist ein neutrales Element bezüglich der Addition und das Einsideal R ist ein neutrales Element bezüglich der Multiplikation. (iii) Im Allgemeinen ist die Menge der Ideale von R zusammen mit eben definierten Addition (oder der Multiplikation) keine Gruppe: das Inverse fehlen. Wir kommen zum Hauptsatz über Dedekindsche Ring. Satz 1.44. Sei R ein Dedekindscher Ring. Jedes Ideal I 6= 0 von R ist ein Produkt von endlich vielen Primideale ungleich dem Nullideal von R. Weiterhin ist diese Faktorisierung bis auf die Reihenfolge eindeutig. In anderen Worten, es existieren paarweise verschieden Primideale P1 , . . . , Pg ungleich 0 und positive ganze Zahlen e1 , . . . , eg mit e I = P1e1 · · · Pg g . Sind Q1 , . . . , Qh paarweise verschieden Primideale und f1 , . . . , fh positive ganze Zahlen mit I = Qf11 · · · Qfhh . Dann ist g = h und nach Permutation der Qi gilt Pi = Qi und ei = fi für 1 ≤ i ≤ g. Wir illustrieren die Aussage des Satzes zuerst an einem Beispiel. Der Beweis folgt später. √ √ Beispiel 1.45. Sei K = Q( −5). Wir wissen aus Abschnitt 1.4, dass ZK = Z[ −5]. Es gilt √ √ 6 = 2 · 3 = (1 + −5)(1 − −5). √ und 2, 3, 1 ± −5 sind irreduzibel aber keine Primelemente, die erste Aussage wird in den Übungen behandelt. Diese Gleichheit gilt auch für die entsprechenden Hauptideale √ √ 6ZK = 2ZK 3ZK = (1 + −5)ZK (1 − −5)ZK . √ Diese Faktorisierung widerspricht unserem Satz nicht, da 2ZK , 3ZK , (1 ± −5)ZK keine Primideale sind. Sie lassen sich weiter faktoriseren: 2ZK = P 2 28 und 3ZK = Q1 Q2 1.6. Dedekindsche Ringe wobei √ P = 2ZK +(1+ −5)ZK , √ Q1 = 3ZK +(1+ −5)ZK und √ Q2 = 3ZK +(1− −5)ZK . Man kann leicht nachrechnen, dass P, Q1 und Q2 Ideale sind und dass die Gleichungen oben gelten. Wir überprüfen exemplarisch, dass P 2 = 2ZK gilt. Wir haben √ √ √ √ P 2 = 4ZK + 2(1 + −5)ZK + (1 + −5)2 ZK = 4ZK + 2(1 + −5)ZK + 2(−2 + −5)ZK √ √ −5), 2(−2 + −5) ∈ 2ZK , finden wir P 2 ⊆ 2ZK . Andererseits gilt 6 = Da 4, 2(1 + √ √ 2(1 + −5) − 2(−2 + −5) ∈ P 2 und damit auch 2 = 6 − 4 ∈ P 2 . Weil P 2 ein Ideal ist, folgt 2ZK ⊆ P 2 , also 2ZK = P 2 . Es lässt sich auch beweisen, dass P, Q1 und Q2 sogar Primideale sind. Sie sind aber keine Hauptideale.3 Es gilt ebenfalls √ √ (1 + −5)ZK = P Q1 und (1 − −5)ZK = P Q2 . Später werden wir Techniken kennenlernen, um Ideale systematisch in Primideale zu faktorisieren. Wir beweisen nun Satz 1.44 mit der Hilfe von zwei Lemmas. Lemma 1.46. Sei R ein Dedekindscher Ring und I ein Ideal von R mit I 6= 0. Dann gibt es g ≥ 0 und Primideale P1 , . . . , Pg ungleich Null, so dass I ⊇ P1 · · · Pg . Beweis. Es ist zu zeigen, dass die Menge der Gegenbeispiele M = {I ein Ideal von R :I 6= 0 und I 6⊇ P1 · · · Pg für alle g ≥ 0 und alle Primideale P1 , . . . , Pg von R ungleich Null}. leer ist. Wir beweisen die Aussage, in dem wir ein I ∈ M wählen und einen Widerspruch herleiten. Wegen (D1) ist R noethersch. Ist I ⊆ I 0 ⊆ I 00 ⊆ · · · mit I, I 0 , I 00 , . . . ∈ M so muss diese Idealfolge irgendwann stabilisieren. Deshalb dürfen wir ohne Beschränkung der Allgemeinheit annehmen, dass I ein maximales Element von M ist. D.h. J ∈ M und J ⊇ I impliziert J = I. Es gilt I 6= R da wir g = 0 in der Definition von M zugelassen haben.4 Das Ideal I kann auch kein Primideal sein, denn sonst wäre es nicht in M. Es gibt also a, b ∈ R r I mit ab ∈ I. Wir setzen A = I + aR und B = I + bR. Das sind Ideale von R und es gilt A ) I und B ) I wegen der Wahl von a und b. Deren Produkt AB = I + abR ist aber genau I. Da I maximal mit der Eigenschaft I ∈ M ist, gilt A 6∈ M. Wegen A 6= 0 ist A kein Gegenbeispiel zur Aussages dieses Lemmas, d.h. A 6∈ M und es gibt Primideale 3 4 Wieso? Das leere Produkt ist per Definition gleich R. 29 1. Ring der ganzen algebraischen Zahlen P1 , . . . , Pg ungleich Null mit A ⊇ P1 · · · Pg . Aus Symmetriegründen gibt es Primideale Q1 , . . . , Qh ungleich Null mit B ⊇ Q1 · · · Qh . Wir nehmen Produkte und folgern wegen Kommutativität I = AB ⊇ P1 · · · Pg Q1 · · · Qh . Also liegt I doch nicht in M, das ist ein Widerspruch. Das zweite Lemma bedarf einer Definition. Definition 1.47. Sei R ein Integritätsbereich mit Quotientenkörper K und P ⊆ R ein Primideal mit P 6= 0. (i) Wir definieren den Untermodul P −1 = {x ∈ K : für alle a ∈ P gilt xa ∈ R} = {x ∈ K : xP ⊆ R} des R-Moduls K. Es gilt P −1 ⊇ R, da P ein Ideal von R ist. (ii) Für ein Ideal I von R definieren das Produkt P −1 I = {x1 a1 + · · · + xr ar : x1 , . . . , xr ∈ P −1 und a1 , . . . , ar ∈ I}. Es ist ebenfalls ein Untermodul des R-Moduls K. In einem Dedekindschen Ring wird P −1 die Rolle eines Inverses von P spielen, wie wir später sehen werden. Achtung. Im Allgemeinen ist P −1 nicht in R enthalten und deshalb kein Ideal von R. Falls jedoch P −1 eine Teilmenge von R ist, so ist es automatisch ein Ideal von R, da es stets ein Untermodul von Quot(R) betrachtet als R-Modul ist. Beispiel 1.48. Im Fall R = Z (ein Dedekindscher Ring) und P = 5Z gilt P −1 = 51 Z ⊆ Q. In diesem Fall ist P −1 ein Inverses von P , da P −1 P = Z. Lemma 1.49. Sei R ein Dedekindscher Ring, P 6= 0 ein Primideal von R, und I ein Ideal von R mit I 6= 0. Dann gilt P −1 I ) I. Beweis. Unter diesen Voraussetzungen gilt P −1 I ⊇ I, da 1 ∈ P −1 . Es reicht zu zeigen, dass Gleichheit nicht gilt. Wir zeigen die Aussage zunächst für I = R. Also müssen wir P −1 ) R beweisen. Weiter unten behandeln wir den allgemeinen Fall. Wir wählen irgendein a ∈ P r {0}. Das Hauptideal aR ist ungleich Null. Wegen Lemma 1.46 gibt es Primideal P1 , . . . , Pg ungleich Null mit P1 · · · Pg ⊆ aR. Wir haben sicher g ≥ 1, da aR ⊆ P ( R. Ohne Einschränkung der Allgemeinheit können wir annehmen, dass g minimal ist mit der Eigenschaft P1 · · · Pg ⊆ aR. Wir zeigen zuerst, dass es ein i ∈ {1, . . . , g} gibt mit Pi ⊆ P . Falls nicht, gibt es für jedes solche i ein ai ∈ Pi r P . Das Produkt a1 · · · ag liegt in P1 · · · Pg ⊆ aR ⊆ P . Weil P ein Primideal ist, liegt ein ai in P . Widerspruch! 30 1.6. Dedekindsche Ringe Nach Permutation der Pi können wir P1 ⊆ P annehmen. Aus (D3) folgt, dass P1 ein maximales Ideal ist. Wegen P 6= R muss P1 = P gelten. Aus der Minimalität von g folgt P2 · · · Pg 6⊆ aR. Wir können also b ∈ P2 · · · Pg wählen mit b 6∈ aR. Das heisst, b/a 6∈ R. Andererseits gilt bP = bP1 wegen P = P1 . Somit bP ⊆ P1 · · · Pg ⊆ aR. Aus der Definition von P −1 folgt b/a ∈ P −1 . Der Quotient b/a liegt also in P −1 r R. Insbesondere ist P −1 ) R, was zu zeigen war. Nun behandeln wir den Fall, wo I 6= 0 ein Ideal von R ist. Wir nehmen P −1 I = I an und werden einen Widerspruch folgern. Wegen (D1) gibt es n ≥ 1 und α1 , . . . , αn ∈ I r {0} mit I = α1 R + · · · + αn R. Sei x ∈ P −1 beliebig. Dann ist αi x ∈ P −1 I = I, also können wir aij ∈ R (1 ≤ i, j ≤ n) finden mit n X αi x = aij αj für 1 ≤ i ≤ n. j=1 Die n×n Matrix A = (aij )i,j hat Koeffizienten in R. Die Gleichung oben und (α1 , . . . , αn ) 6= 0 implizieren, dass x ein Eigenwert von A ist. Somit ist x Nullstelle des charakteristischen Polynoms von A. Dieses Polynom ist normiert und hat Koeffizienten in R. Deshalb ist x ganz über R. Dass heisst, x ∈ RQuot(R) da x ∈ Quot(R). Wegen (D2) gilt RQuot(R) = R und somit ist x ∈ R. Da x ∈ P −1 beliebig war, haben wir P −1 ⊆ R bewiesen. Es gilt ebenfalls P −1 ⊇ R und dies widerspricht dem ersten Teil des Beweises. Bemerkung 1.50. Das letzte Lemma hat eine einleuchtende Konsequenz. Ist P ⊆ R ein Primideal P 6= 0, so folgt P −1 P ) P . Aber aus der Definition von P −1 folgt, dass P −1 P ⊆ R ein Ideal von R ist. Wegen (D3) ist das Primideal P maximal. Somit folgt aus P ( P −1 P ⊆ R die Gleichheit P −1 P = R. Sie verleiht der Notation P −1 Bedeutung und bestätigt wieder, dass das Einsideal R als neutrals Element für die Idealmultiplikation zu verstehen ist. Nun können wir Satz 1.44 beweisen. Beweis von Satz 1.44. Wir beweisen zuerst die Existenz der Primfaktorisierung. Weiter unten zeigen wir die Eindeutigkeit. Ähnlich wie in Lemma 1.46 definieren wir eine Ausnahmemenge M = {I ein Ideal von R :I 6= 0 und I lässt sich nicht als Produkt endlich vieler Primideale ungleich Null schreiben} die, falls sie nicht leer ist, zu einem Widerspruch führt. Nehmen wir also an, dass I ∈ M. Mit einem ähnlichen Argument wie im Beweis von Lemma 1.46, nutzen wir (D1), um I in M maximal bezüglich der Inklusion zu wählen. In anderen Worten, falls J ∈ M mit J ⊇ I, dann gilt J = I. 31 1. Ring der ganzen algebraischen Zahlen Wir haben I 6= R denn das Ideal R ist das leere Produkt. Somit ist I in einem maximalen Ideal P von R enthalten.5 Zur Erinnerung, ein maximales Ideal in einem beliebigen Ring ist ein Primideal. Sicher gilt auch I ( P da andererseits I schon prim wäre und deshalb nicht in M liegen würde. Aus Lemma 1.49 schliessen wir I ( P −1 I. Da I ⊆ P gilt P −1 I ⊆ P −1 P = R. Die letzte Gleichheit haben wir in Bemerkung 1.50 festgestellt. Somit ist P −1 I ein Ideal von R welches I strikt enthält. Weil I maximal mit der Eigenschaft I ∈ M ist, muss P −1 I 6∈ M gelten. Da P −1 I 6= 0 lässt sich P −1 I in Primideal faktorisieren, also P −1 I = P1e1 · · · Pgeg wobei P1 , . . . , Pg Primideale von R ungleich Null sind. Um den Widerspruch zu erlangen müssen wir die Gleichheit oben mit P multiplizieren. Dabei erinnern wir uns, dass P −1 P = P −1 P = R gilt. Nun beweisen wir die Eindeutigkeit der Primidealfaktorisierung. Nehmen wir also an, dass I = P1e1 · · · Pgeg = Qf11 · · · Qfhh mit Pi , Qi , ei , fh wie in der Formulierung des Satzes. Wir werden Eindeutigkeit mittels Induktion auf e1 + · · · + eg ≥ 0 zeigen. Ist der Induktionsparameter Null, oder äquivalent g = 0, so muss I = R sein. Daraus folgt h = 0, da Qf11 · · · Qfhh ⊆ Qi für 1 ≤ i ≤ h. e Sei nun g ≥ 1. Es gilt P1e1 · · · Pg g ⊆ P1 . Da Qf11 · · · Qfhh ⊆ P1 argumentieren wir wie im Beweis von Lemma 1.49, um zu zeigen, dass es ein i ∈ {1, . . . , h} mit Qi ⊆ P1 und fi ≥ 1 geben muss. Da wir die Qi permutieren dürfen, nehmen wir i = 1 an. Wegen (D3) ist Q1 ein maximales Ideal und P1 6= R und somit Q1 = P1 . Wie oben zeigt man, dass P1 P1−1 = R. Multiplizieren wir also P1e1 · · · Pgeg = P1f1 Qf22 . . . Qfhh mit P1−1 so folgt P1e1 −1 · · · Pgeg = P1f1 −1 Qf22 . . . Qfhh . Die Summe (e1 − 1) + e2 + · · · + eg ist nun kleiner wie der Induktionsparameter. Aus Induktion folgt nun die Eindeutigkeit. Motiviert durch diesen Satz führen wir eine Notation ein, um Teilbarkeit von Ideale auszudrücken. Definition 1.51. Sei R ein Dedekindscher Ring und I, J Ideale von R. Wir schreiben I | J falls es ein Ideal I 0 von R gibt mit II 0 = J. Natürlich lässt sich Teilbarkeit von Ideale in einem beliebigen Ring definieren. 5 Dies folgt direkt aus (D1) oder in einem allgemeinen Ring aus dem Zornschen Lemma. 32 1.6. Dedekindsche Ringe Korollar 1.52. Sei R ein Dedekindscher Ring und I, J Ideale von R. Es gilt I|J ⇐⇒ J ⊆ I. Beweis. Die Richtung “=⇒” ist einfach: falls J = II 0 so gilt sicherlich J ⊆ I. Die Umkehrung ist klar, falls J = 0. Ansonsten brauchen wir Satz 1.44. Sei also I = P1e1 · · · Pgeg und J = P1f1 · · · Pgfg mit P1 , . . . , Pg paarweise verschiedene Primideal ungleich Null und ei , fi ≥ 0 (wir erlauben ei = 0 oder fi = 0). Wir zeigen über Induktion auf e1 +· · ·+eg , dass ei ≤ fi gelten muss. Der Fall e1 +· · ·+eg = 0 ist trivial. Nehmen wir also ohne Einschränkung an, dass e1 ≥ 1. Dann ist I ⊆ P1 . Und wieder wie f im Beweis von Lemma 1.49 ist ein Faktor in P1f1 · · · Pg g ⊆ J ⊆ P1 in P1 enthalten. Dies impliziert f1 ≥ 1. Es gilt P1−1 P1 = R, siehe Bemerkung 1.50. Falls wir also P1f1 · · · Pgfg ⊆ P1e1 · · · Pgeg mit P1−1 multiplizieren, folgt P1f1 −1 · · · Pgfg ⊆ P1e1 −1 · · · Pgeg . Induktion impliziert nun ei ≤ fi . Deswegen ist I 0 = P1f1 −e1 · · · Pgfg −eg ein wohldefiniertes Ideal von R. Es gilt II 0 = J, wie gewünscht. Bemerkung 1.53. Elemente aus Qr{0} lassen sich auch in Primfaktoren faktorisiern: e für x ∈ Q r {0} gilt x = ±pe11 · · · pgg mit p1 , . . . , pg ∈ Z Primzahlen und e1 , . . . , eg ∈ Z. Der Punkt ist natürlich, dass wir negative ei zulassen. Man kann sich nun fragen ob es ein Analogon für Ideale gibt. Oder in anderen Worten, was sind die Produkt aus Primideale mit Exponenten die möglicherweise negativ sind? Definition 1.54. Sei R ein Dedekindscher Ring und K = Quot(R). (i) Ein gebrochenes Ideal (von R) ist ein endlich erzeugter R-Untermodul von K ungleich Null. (ii) Die Menge aller gebrochener Ideale von R wird mit J(R) bezeichnet und falls K Zahlkörper ist, so schreiben wir J(K) = J(ZK ). (iii) Jedes x ∈ K × erzeugt ein gebrochenes Ideal xR ∈ J(R). Solche gebrochene Ideale nennt man gebrochene Hauptideale. Die Menge P(R) = {xR : x ∈ K × } ist eine Untergruppe von J(R). Falls K ein Zahlkörper ist, so schreiben wir oft P(K) für P(ZK ). 33 1. Ring der ganzen algebraischen Zahlen (iv) Sind M und N zwei gebrochene Ideale, dann ist ihr Produkt durch M N = {m1 n1 + · · · + mr nr : m1 , . . . , mr ∈ M und n1 , · · · , nr ∈ N } gegeben. Das Produkt M N liegt wieder in J(R). Wir erhalten dadurch eine assoziative und kommutative Verknüpfung J(R) × J(R) → J(R). Bezüglich dieser Verknüpfung ist das gebrochene Ideal R ein Einselement. (iv) Ist M ein gebrochenes Ideal so definieren wir M −1 = {x ∈ K : xM ⊆ R}. Dann ist M −1 wieder ein gebrochenes Ideal. Wir erhalten also eine Selbstabbildung J(R) → J(R) gegeben durch M 7→ M −1 . Jedes Ideal ungleich Null eines Dedekindschen Rings R ist ein gebrochenes Ideal, da Dedekindsche Ringe noethersch sind. Falls P 6= 0 ein Primideal von R ist, so stimmt die Definitionen für P −1 aus (iv) oben mit Definition 1.47(i) überein. Proposition 1.55. Sei R ein Dedekindscher Ring. Dann ist J(R) zusammen mit der Verknüpfung aus (iii) und der Abbildung aus (iv) als Inverseabbildung eine abelsche Gruppe mit Einselement R. Sie wird von den Primidealen ungleich Null aus R frei erzeugt. Beweis. Um die Gruppeneigenschaft zu beweisen, reicht es zu zeigen, dass M M −1 = R gilt für alle M ∈ J(R). Wir machen dies zunächst falls M ein Ideal von R ist. Wegen Satz 1.44 können wir M faktorisieren M = P1 · · · Pg mit Pi 6= 0 Primideale. Es reicht zu zeigen, dass M −1 = P1−1 · · · Pg−1 . Die Definition impliziert die Inklusion “⊇”. Für die andere Richtung sei x ∈ M −1 . Dann ist xM ⊆ R und deshalb xM P1−1 · · · Pg−1 ⊆ P1−1 · · · Pg−1 . Aus Bemerkung 1.50 folgt Pi Pi−1 = R. Daraus folgt M P1−1 · · · Pg−1 = R und deshalb x ∈ P1−1 · · · Pg−1 , wie erwünscht. Ein beliebiges M ∈ J(R) ist ein endlich erzeugter R-Modul. Also existieren y1 , . . . , ym ∈ Quot(R) mit M = y1 R + · · · + ym R. Es gibt a ∈ R r {0} mit ayi ∈ R für alle 1 ≤ i ≤ m und damit aM ⊆ R. Nun ist es einfach zu zeigen, dass (aM )−1 = a−1 M −1 . Da aM ein Ideal von R ist, wissen wir bereits, dass (aM )(aM )−1 = R. Somit folgt M M −1 = R, wie gewünscht. Dass J(R) von Primideale in R ungleich Null erzeugt wird, folgt aus obigem Argument. Dass diese Ideale unabhängig sind folgt aus der Eindeutigkeitsaussage in Satz 1.44. Beispiel 1.56. Die Gruppe J(Q) wird frei von 2Z, 3Z, 5Z, . . . erzeugt. Sie ist zu (Q>0 , ·, 1) isomorph. Bemerkung 1.57. Also ist bereits die Gruppe J(Q) sehr “gross”. Sie hat unendlichen Rang. Die Situation ist vergleichbar mit der Picardgruppe einer elliptischen Kurve E wie wir sie im ersten Semester kennengelernt haben. Ist E über einem algebraisch abgeschlossenem Körper F definiert, so war Div(E) = ⊕P ∈E Z. Der Quotient Pic(E) = Div(E)/div(F (E)× ) lieferte wichtige Informationen über das Gruppengesetz auf E. 34 1.6. Dedekindsche Ringe Die Analogie wie ersichtlich, da wir in Proposition 1.55 festgestellt haben, dass M J(K) = Z 06=P ⊆ZK P ein Primideal für einen Zahlkörper K. Wir werden nun in analoger Weise einen Quotienten dieser freien abelsche Gruppe untersuchen. Definition 1.58. Sei R ein Dedekindscher Ring mit Quotientenkörper K. Der Quotient Cl(R) = J(R)/P(R) nennt man die Klassengruppe von R. Ist I ∈ J(R) so schreiben wir [I] für das Bild von I in Cl(R). Falls K ein Zahlkörper ist, so schreiben wir oft Cl(K) = Cl(ZK ). Die Verknüpfung in der Klassengruppe wir multiplikativ geschrieben und 1 ∈ Cl(R) ist das Einselement. In dieser Notation gilt also [I] = 1 genau dann, wenn I ein gebrochenes Hauptideal ist. Lemma 1.59. Sei R ein Dedekindscher Ring. (i) Jede Klasse in Cl(R) wird durch ein Ideal I ⊆ R mit I 6= 0 repräsentiert (ii) Die Klassengruppe Cl(R) ist genau dann trivial, wenn R ein Hauptidealring ist. Beweis. Teil (i) folgt, da es zu jedem J ∈ J(J) ein a ∈ R r {0} mit aJ ⊆ R gibt, cf. Beweis von Proposition 1.55. Teil (ii) ist eine Konsequenz der Äquivalenz Cl(R) ist trivial ⇐⇒ jedes gebrochene Ideal von R ist ein gebrochenes Hauptideal und weil, wegen (i), dies zur Aussage, dass jedes Ideal von R ein Hauptideal äquivalent ist. √ Beispiel 1.60. Sei K = Q( −5). Wir wissen bereits, dass ZK kein Hauptidealring ist. Deshalb gilt Cl(K) 6= {1}. Wir werden bald sehen, dass Cl(K) zyklisch der Ordnung 2 ist. Die Klassengruppe Cl(K) ist eine subtile Invariante des Zahlkörpers K. Die zwei folgenden Probleme sind schwierig. Satz 1.61 (Baker–Heegner–Stark, eine alte Vermutung von Gauss). Sei m ∈ Z quadrat√ frei mit m < 0 und K = Q( m). Falls Cl(K) trivial ist, oder äquivalent falls ZK ein Hauptidealring ist, so gilt m ∈ {−1, −2, −3, −7, −11, −19, −43, −67, −163}. Für positives m erwartet man das folgende. Vermutung 1.62. Es gibt unendlich viele quadratfreie m ∈ Z mit m > 1, so dass √ Cl(Q( m)) = {1}. 35 1. Ring der ganzen algebraischen Zahlen Da sich die Ideale eines Dedekindschen Rings eindeutig in Primideal faktorisieren lassen, macht es Sinn von teilerfremden Idealen zu sprechen. Definition 1.63. Zwei Ideale I und J eines Dedekindschen Rings R heissen teilerfremd, falls 0 6= P ⊆ R ein Primideal =⇒ P - I oder P - J. Proposition 1.64 (Chinesischer Restsatz). Sei R ein Dedekindscher Ring und I, J ⊆ R Ideale. (i) Die Ideale I und J sind genau dann teilerfremd, wenn I + J = R. (ii) Falls I + J = R, so gilt I ∩ J = IJ. (iii) Falls I + J = R, so ist die durch r + IJ 7→ (r + I, r + J) für r ∈ R definierte Abbildung R/IJ → R/I × R/J wohldefiniert und ein Ringisomorphismus. Beweis. Wir beginnen mit “=⇒” von (i). Sicher ist I + J ein Ideal von R und falls I + J 6= R so gibt es ein maximales Ideal P ⊇ I + J. Also ist P ein Primideal und I ⊆ P sowie J ⊆ P . Aus Korollar 1.52 folgt P | I und P | J, ein Widerspruch. Die Umkehrung “⇐=” von (i) benutzt die einfache Richtung dieses Korollar. Ist P ein Teiler von I und J, so gilt P ⊇ I und P ⊆ J, also P ⊇ I + J. Dies widerspricht I + J = R. Für (ii) stellen wir fest, dass I ∩ J ⊇ IJ aus der Definition des Produkts zweier Ideal folgt und sogar für beliebige Ideal in einen beliebigen Ring gilt. Wir zeigen nun “⊆”. Sei also a ∈ I ∩ J. Dann ist aR ein Ideal von R enthalten in I und J. Wegen Korollar 1.52 gilt I | aR und J | aR. Aus (i) und I + J = R folgt, dass die Primidealteiler von I und J paarweise verschieden sind. Aus Satz 1.44 folgern wir, dass IJ | aR. Die einfache Richtung von Korollar 1.52 impliziert aR ⊆ IJ und daher a ∈ IJ. Somit ist Teil (ii) bewiesen. Nun zu Teil (iii). Wegen I ∩ J ⊇ IJ ist unsere Abbildung, die wir hier mit ϕ bezeichnen, ein wohldefinierter Ringhomomorphismus. Dass diese Abbildung injektiv ist, folgt aus I ∩ J ⊆ IJ. Es reicht also die Surjektivität zu zeigen. Das heisst, für beliebige r1 , r2 ∈ R müssen wir r ∈ R finden, mit ϕ(r + IJ) = (r1 + I, r2 + J). Nach Voraussetzung gibt es a ∈ I und b ∈ J mit a + b = 1. Dann gilt br1 = r1 − ar1 ∈ r1 + I und ar2 = r2 − br2 ∈ r2 + J. Wir wählen r = ar2 + br1 . Somit ist r + I = r1 + I und r + J = r2 + J. Daraus folgt ϕ(r + IJ) = (r1 + I, r2 + J). Bemerkungen 1.65. (i) Falls R = Z impliziert diese Proposition die aus Algebra bekannte Aussage, dass Z/abZ und Z/aZ × Z/bZ isomorph sind für a, b ∈ Z teilerfremd. (ii) Für jeden Ring R kann man unter der Annahme I + J = R zeigen, dass die natürliche Abbildung R/(I ∩ J) → R/I × R/J ein Ringisomorphismus ist. 36 2. Primidealfaktorisierung in ZK 2.1. Die Norm eines Ideals In diesem Kapitel werden wir uns verstärkt den ganzen algebraischen Zahlen eines Zahlkörpers K zuwenden. Für jedes Ideal I ⊆ ZK hatten wir in Definition-Lemma 1.36 die Norm N (I) ∈ {0, 1, 2, . . . } definiert. Mit Hilfe dieser Norm können wir in gewissen Situationen entscheiden, ob ein Ideal ein Primideal ist. Lemma 2.1. Sei K ein Zahlkörper und I ⊆ ZK ein Ideal. (i) Es gilt N (I) ∈ I. Insbesondere enthält ein Ideal von ZK ungleich Null eine positive ganze Zahl. (ii) Falls N (I) eine Primzahl ist, so ist I ein Primideal. Beweis. Für beide Teile können wir ohne Einschränkung I 6= 0 annehmen. Dann ist ZK /I mit der Addition eine endliche abelsche Gruppe der Kardinalität N (I). Für jedes a + I ∈ ZK /I ist also N (I)(a + I) = N (I)a + I = I das neutrale Element in ZK /I. Wir wählen a = 1 und folgern N (I) ∈ I und deshalb Teil (i). Für Teil (ii) reicht es zu zeigen, dass jeder endliche Ring R, dessen Kardinalität eine Primzahl ist, ein Körper ist. Denn dann muss I ein maximales Ideal, also insbesondere ein Primideal, sein. Zum Beweis sei x ∈ R r {0}. Dann definiert y 7→ xy ein Homomorphismus R → R der additiven Gruppe. Das Bild enthält zwei verschiedene Elemente 0 und x. Da #R eine Primzahl ist, muss das Bild, dessen Kardinalität #R teilt, ganz R sein. Insbesondere liegt 1 im Bild. Deshalb gibt es y ∈ R mit xy = 1. Also ist R ein Körper. √ Beispiel 2.2. Sei K√= Q( −5). In Beispiel 1.45 haben wir gesehen, dass 2ZK = P 2 mit P = 2ZK + (1 √ + −5)ZK . Wir wollen nun beweisen, dass √ P ein Primideal ist. Wir wissen ZK = Z + −5Z, cf. (1.2). Also hat 2ZK = 2Z + 2 −5Z Index 4 in ZK , d.h. N (2ZK ) = 4. Da 2ZK ⊆ P definiert a + 2ZK 7→ a + P für a ∈ ZK einen surjektiven Ringhomomorphismus Z/2ZK → ZK /P . Es folgt N (P ) | N (2ZK ). Die Möglichkeiten für N (P ) beschränken sich somit auf {1, 2, 4}. Falls N (P ) = 1, so wäre P = ZK und somit 2ZK = P 2 = ZK . Dies ist unmöglich. Falls N (P ) = 4 so wäre der Ringhomomorphismus oben ein Isomorphismus. Das heisst, P = 2ZK . Dies widerspricht Satz 1.44 und 2ZK = P 2 . Also kann nur N (P ) = 2 sein. Wegen Lemma 2.1(ii) ist P ein Primideal. Ähnlich lässt sich zeigen, dass Q1 , Q2 in der Faktorisierung von 3ZK in Kapitel 1 Primideale sind. 37 2. Primidealfaktorisierung in ZK Achtung. Die Umkehrung von Lemma 2.1(ii) ist falsch. Es gibt Primideale, dessen Norm eine Primpotenz aber keine Primzahl ist. Wie der Name der Normabbildung suggeriert ist diese multiplikativ. Diese keineswegs offensichtliche Aussage werden wir jetzt beweisen. Proposition 2.3. Sei K ein Zahlkörper und I, J ⊆ ZK beliebige Ideale. Dann gilt N (IJ) = N (I)N (J). Beweis. Sicher dürfen wir I 6= 0 und J 6= 0 annehmen. Wir zeigen zuerst den folgenden Spezialfall. Behauptung 1: Sei P ⊆ ZK ein Primideal P 6= 0 und e ∈ Z mit e ≥ 0. Dann gilt N (P e ) = N (P )e . Wir beweisen die Aussage mittels Induktion auf e. Der Fall e = 0 folgt aus N (ZK ) = 1. Wir nehmen also e ≥ 1 an. Der Quotient P e /P e−1 ist ein ZK -Modul und sogar ein (ZK /P )-Modul. Weil P 6= 0 ein Primideal ist, ist wegen (D3) P ein maximales Ideal. Deshalb ist ZK /P ein Körper und P e /P e−1 ein (ZK /P )-Vektorraum. Es gilt P e−1 ) P e wegen Satz 1.44. Wählen wir also a ∈ P e−1 rP e . Dann ist I = aZK +P e ein Ideal von ZK . Wir haben P e ( I ⊆ P e−1 . Wegen Korollar 1.52 gilt also I | P e und P e−1 | I. Aus Satz 1.44 schliessen wir I = P e−1 . Daraus folgt, dass P e−1 /P e von a + P e als (ZK /P )-Vektorraum erzeugt wird. In anderen Worten gilt dimZK /P P e−1 /P e = 1. Die Kardinalität von P e−1 /P e ist also #ZK /P = N (P ). Deshalb und wegen Induktion gilt N (P e ) = #ZK /P e = #P e−1 /P e · #ZK /P e−1 = N (P )N (P )e−1 = N (P )e . Die erste Behauptung ist bewiesen. Behauptung 2:Seien P1 , . . . , Pg paarweise verschiedene Primideale ungleich Null von e ZK und e1 , . . . , eg ∈ Z positiv. Dann gilt N (P1e1 · · · Pg g ) = N (P1 )e1 · · · N (Pg )eg . Wir beweisen die Aussage mittels Induktion auf g. Der Fall g = 0 ist trivial. Sei also e g ≥ 1. Der Chinesischer Restsatz, Proposition 1.64(i), impliziert P1e1 + P2e2 · · · Pg g = ZK . e Nun wenden wir Teil (iii) dieser Proposition 1.64 auf P1e1 und P2e2 · · · Pg g an. Inbesondere e e sind ZK /P1e1 · · · Pg g und ZK /P1e1 × ZK /P2e2 · · · Pg g Isomorph als Ringe. Uns interessiert nur die Kardinalität, also N (P1e1 · · · Pgeg ) = N (P1e1 )N (P2e2 · · · Pgeg ). Aus Induktion und aus Behauptung 1 folgt N (P1e1 · · · Pgeg ) = N (P1e1 )N (P2 )e2 · · · N (Pg )eg = N (P1 )e1 N (P2 )e2 · · · N (Pg )eg . Auch die zweite Behauptung ist nun bewiesen. Die Proposition folgt aus Behauptung 2 und aus Satz 1.44. Nun wird die Theorie auf die diophantische Gleichung y 2 = x3 − 5 angewandt. Wir folgen die Strategie aus Kapitel 0 zur Lösung von y 2 = x3 + 1, mit dem entscheidenden Unterschied, dass wir mit Idealen arbeiten. Das Argument unten ist die Blaupause für das in der Einleitung erwähnte Resultat Richtung Fermats Letztem Satz für reguläre Primzahlen. 38 2.1. Die Norm eines Ideals √ Beispiel 2.4. Unter einer Annahme an die Klassengruppe Cl(Q( −5)) die wir später beweisen werden, zeigen wir, dass es kein (x, y) ∈ Z2 gibt, mit y 2 = x3 − 5. Wir nehmen an, dass es ein solches Paar √ gibt und folgern ein √ Widerspruch. √ Wir arbeiten im Ring ZK mit K = Q( −5). Darin gilt (y + −5)(y − −5) = x3 . Auf der Ebene der Hauptideale erhalten wir √ √ (y + −5)ZK · (y − −5)ZK = x3 ZK . √ √ Behauptung 1: Die Ideale (y + −5)ZK und (y −√ −5)ZK sind teilerfremd. Sei P√⊆ ZK ein Primideal P 6=√0 und P | (y ± −5)ZK . Wegen Korollar 1.52 gilt (y ± −5)ZK ⊆ P und daher 2 −5ZK ⊆ P . Eine weitere Anwendung von Korollar 1.52 zeigt √ √ √ P | 2ZK · −5ZK = (2ZK + (1 + −5)ZK )2 · −5ZK , | {z } Primideal √ dabei erinnern wir uns an die Beispiele 2.2 und 1.45. Weiterhin ist N ( −5ZK ) = 5 √ wegen Aufgabe 2, Serie 4. Also ist −5ZK ein Primideal √ ist wegen Lemma√2.1(ii). Da P ein Primideal ist, gilt entweder P = 2ZK + (1 + −5)ZK oder P = −5ZK . Im ersten Fall haben wir 2ZK = P 2 | x3 also liegt x3 /2 ∈ ZK ∩ Q = Z. Folglich ist x gerade. Wir schliessen y 2 ≡ −5 ≡ 3 mod 8. Man überprüft aber leicht, dass 3 kein Quadrat modulo 8 ist. Dieser Fall ist also unmöglich. Im zweiten Fall gilt P 2 = 5ZK | x3 . Ähnlich wie vorhin sieht man, dass 5 | x in Z. Wegen y 2 − x3 = −5 folgt 5 | y in Z. Deshalb 25 | y 2 − x3 = −5 in Z. Auch das ist unmöglich. Somit ist Behauptung 1 bewiesen. Wegen Satz 1.44 gilt (y + √ −5)ZK = g Y i=1 Piei und h Y √ (y − −5)ZK = Qfi i i=1 mit i Primideale ungleich Null, ei ≥ 1, fi ≥ 1, und {Qi } ∩ {Pi } = ∅. Das Produkt Q Qg Pi , eQ h fi 3 i i=1 Qi = x ZK ist eine dritte Potenz in der freien abelschen Gruppe J(ZK ). i=1 Pi Es folgt, dass 3 | ei und 3 | fi und insbesondere ist √ (y + −5)ZK = I 3 eine dritte Potenz, hier ist I ein Ideal von ZK . Wie weiter? Falls ZK ein Hauptidealring wäre, könnten wir einen Erzeuger von I wählen und hoffen einen Widerspruch abzuleiten. Leider ist ZK kein Hauptidealring. Es gilt [I]3 = [I 3 ] = 1 in der Klassengruppe Cl(K) da I 3 ein Hauptideal ist. Weiter unten werden wir beweisen, dass Cl(K) zyklisch der Ordnung 2 ist. Insbesondere muss auch [I] trivial in Cl(K) sein. Also ist I ein Hauptideal, obwohl ZK kein Hauptidealring ist. 39 2. Primidealfaktorisierung in ZK √ √ √ −5)ZK . Da y + −5 und (a + b −5)3 das gleiche Es gibt also a, b ∈ Z mit √ I = (a + b √ Ideal erzeugen, gilt y + −5 = u(a+b −5)3 mit u ∈ Z× K . Wie in Aufgabe 4, Blatt 1 kann man Z× bestimmen, in diesem Fall gibt es nur die zwei Einheiten ±1. Da (−1)3 = −1 K können wir ohne Einschränkung u = 1 annehmen. Wir haben √ √ y + −5 = a3 − 15ab2 + −5(3a2 b − 5b3 ) und vergleicht man Imaginärteile, so finden wir (3a2 − 5b2 )b = 1. Es muss also b = ±1 und somit 3a2 − 5 = ±1 gelten. Diese Gleichung impliziert a 6∈ Z. Das ist der Widerspruch den wir gesucht haben. Also hat y 2 = x3 − 5 keine Lösung mit x, y ∈ Z. Jetzt müssen wir noch beweisen, dass Cl(K) zyklisch der Ordnung 2 ist. √ Lemma 2.5. Sei K = Q( −5), dann ist Cl(K) ∼ = Z/2Z. Beweis. Wir betrachten ZK als Unterring von C. Jedes Ideal I 6= 0 von ZK ist ein freier Z-Modul von Rang 2 = [K : Q]. Deshalb gibt es Z-unabhängige a1 , a2 ∈ I ⊆ C so, dass I = a1 Z + a2 Z. Wir werden jetzt in drei Schritten die Basis (a1 , a2 ) “reduzieren”. D.h. wir werden sie durch eine neue Basis ersetzen, die günstige Eigenschaften hat. Behauptung 1: Das Ideal I ist eine diskrete Teilmenge von C. Um das zu zeigen, reicht es zu beweisen, dass 0 in I isoliert ist. Falls > 0 mit |a1 α + a2 β| < und α, β ∈ Z dann ist |a1 α + a2 β| < . Aus Lemmas 1.26(i) und 1.27 folgt, dass a1 a2 a1 a2 eine invertierbare Matrix ist. Falls also klein genug ist (in Funktion von a1 , a2 ) so muss |α| < 1 und |β| < 1 gelten. Diskretheit folgt aus α, β ∈ Z. Behauptung 2: Es gibt eine Z-Basis (a1 , a2 ) von I mit |a1 | = inf{|a| : a ∈ I r {0}}. Aus Behauptung 1 folgt, dass das Infimum angenommen wird, i.e. es ist ein Minimum. Wir wählen also a1 ∈ I r {0} mit minimalem Absolutbetrag. Weiterhin existiert eine Z-Basis (a01 , a02 ) von I. Es gibt also α, β ∈ Z mit a1 = a01 α + a02 β. Aus Minimalität von |a1 | folgern wir ggT(α, β) = 1. Es gibt deshalb γ, δ ∈ Z mit αδ − βγ = 1. Dann ist aber (a1 , a01 γ + a02 δ) eine Z-Basis von I da α β γ δ in SL2 (Z) liegt. Behauptung 3: Es gibt eine Z-Basis (a1 , a2 ) von I mit a2 ≥ 1, Re a2 ≤ 1/2, und Im a2 ≥ 0. a1 a1 a1 40 2.1. Die Norm eines Ideals Wir nehmen a1 , a2 wie in Behauptung 2. Aus der Minimalität von |a1 | ergibt sich die erste Ungleichung. Wir werden nun a2 so modifizieren, dass die Basiseigenschaft nicht verloren geht und dass die zweite und dritte Ungleichung gelten. Die Minimalitätseigenschaft von |a1 | bleibt hierdurch erhalten. Zum Beispiel können wir a2 durch a2 + ka1 mit k ∈ Z ersetzen. Für k geeignet gilt die zweite Ungleichung. Falls nötig ersetzen wir a2 durch −a2 um die Dritte zu erzwingen. Eine Basis wie in Behauptung 3 nennt man reduziert. Ist (a1 , a2 ) eine reduzierte Basis von I so setzen wir a2 τ= . a1 2 2 2 Es gilt also √ |τ | ≥ 1, |Re(τ )| ≤ 1/2 und Im(τ ) ≥ 0. Aus |τ | = |Re(τ )| + |Im(τ )| folgt Im(τ ) ≥ 3/2. Lemma 1.26(ii) entnehmen wir ∆K/Q (a1 , a2 ) = N (I)2 ∆K/Q = −20N (I)2 . Hierbei haben wir benutzt, dass die Diskriminante von K gleich −20 ist. Andererseits können wir Lemma 1.26(i) nutzen um ∆K/Q (a1 , a2 ) = det a1 a2 a1 a2 2 = (a1 a2 − a1 a2 )2 = |a1 |4 (τ − τ )2 = −4|a1 |4 Im(τ )2 zu berechnen. Für |a1 |2 ergibt sich also p |a1 |2 ≤ 2 5/3N (I). Nun ist |a1 |2 = a1 a1 = NK/Q (a1 ). Weiterhin gilt a1 ∈ I, also a1 ZK ⊆ I. Aus Korollar 1.52 folgt I | a1 ZK . In anderen Worten, es gibt ein Ideal J ⊆ ZK mit IJ = a1 ZK . NB: in der Klassengruppe Cl(K) gilt [I][J] = [a1 ZK ] = 1. Das heisst, [J] ist das Inverse von [I]. Die Multiplikativität der Norm, siehe Proposition 2.3, und Aufgabe 2, Serie 5 ergeben p N (I)N (J) = N (IJ) = N (a1 ZK ) = |NK/Q (a1 )| = |a1 |2 ≤ 2 5/2N (I). Die Norm N (I) kürzt sich also weg. Wir erhalten p N (J) ≤ 2 5/2 < 3. Es gibt also zwei Möglichkeiten. Die erste Möglichkeit ist N (J) = 1. Dann ist J = ZK und I = a1 ZK . In diesem Fall ist I ein Hauptideal und [I] = 1 in der Klassengruppe. Die Zweite ist N (J) = 2. Aus Lemma 2.1 folgt 2 ∈ J und dass J ein Primideal ist. Also 2ZK ⊆ J und wegen Korollar 1.52 ist J ein Idealteiler von 2ZK . Nun haben wir √ weiter 2 oben schon 2ZK vollständing faktorisiert. Es gilt 2ZK = P mit P = 2ZK +(1+ −5)ZK . Es muss also J = P gelten. Insbesondere ist [I] = [P ]−1 in Cl(K). Fazit: für ein beliebiges Ideal I 6= 0 von ZK gilt [I] = 1 oder [I] = [P ]−1 in der Klassengruppe. Wir wissen aus Lemma 1.59(i), dass solche I die Klassengruppe erzeugen. Somit ist #Cl(K) ≤ 2. Aber #Cl(K) ≥ 2, da wegen Beispiel 0.1 der Ring ZK kein Hauptidealring ist. Das Lemma folgt aus der Tatsache, dass es bis auf Isomorphie nur eine Gruppe der Ordnung 2 gibt. 41 2. Primidealfaktorisierung in ZK Diese Lemma ist ein Prototyp einer allgemeineren Aussage für die Klassengruppe eines Zahlkörpers. Satz. Sei K ein Zahlkörper. Dann ist Cl(K) eine endliche abelsche Gruppe. Insbesondere ist ZK nicht allzuweit davon entfernt, ein Hauptidealring zu sein. Wir werden diesen Satz erst später beweisen. 2.2. Zerfällung von Primzahlen Sei K ein Zahlkörper und I ⊆ ZK ein Ideal I 6= 0. Aus Lemma 2.1(i) und Korollar 1.52 e folgt I | N (I)ZK . Die natürliche Zahl N (I) lässt sich als N (I) = pe11 · · · pgg schreiben mit p1 , . . . , pg ≥ 2 paarweise verscheidene Primzahlen. Jeder Primidealteiler von I ist daher ein Primidealteiler eines pi . Bemerkung 2.6. Kennt man alle Primidealteiler von pZK für alle Primzahlen p ≥ 2, so kennt man alle Ideale von ZK . Diese einfache Bemerkung ist der Leitfaden des aktuellen Abschnitts. Wir führen ein paar neue Begriffe ein. Definition 2.7. Sei K ein Zahlkörper und P ⊆ ZK ein Primideal P 6= 0. Wegen N (P ) ∈ P ist P ∩ Z ein Primideal ungleich Null von Z. Es hat deshalb die Form pZ mit p ≥ 2 eine Primzahl. Diese Primzahl ist eindeutig bestimmt. Aus Satz 1.44 wissen wir, e dass pZK = P1e1 · · · Pg g mit P1 , . . . , Pg paarweise verschieden Primideale und ei ≥ 1. Es gilt P | pZK wegen Korollar 1.52 und daher ist P ∈ {P1 , . . . , Pg }. Sei also P = Pi mit i ∈ {1, . . . , g} (i) Der Exponenten von P in pZK , also ei , heisst Verzweigungsindex von P und wird mit e(P ) bezeichnet. (ii) Weil ZK /P ein endliche Körpererweiterung on Fp ist, gilt N (P ) = pf für ein f ≥ 1. Dieser Exponent f heisst Restklassengrad von P und wird mit f (P ) bezeichnet. e Lemma 2.8. Sei K ein Zahlkörper und p ≥ 2 eine Primzahl. Sei P1e1 · · · Pg g die Primidealfaktorisierung von pZK . Es gilt g X i=1 e(Pi )f (Pi ) = X e(P )f (P ) = [K : Q]. P |pZK Beweis. Die erste Gleichheit ist einfach Notation. Wegen Aufgabe 2 in Serie 5 gilt p[K:Q] = |NK/Q (p)| = N (pZK ). Proposition 2.3 ergibt aber N (pZK ) = N (P1 )e(P1 ) · · · N (Pg )e(Pg ) . Aus der Definition vom Restklassengrad haben wird p[K:Q] = N (P1 )e(P1 ) · · · N (Pg )e(Pg ) = pe(P1 )f (P1 )+···+e(Pg )f (Pg ) und somit auch unser Lemma. 42 2.2. Zerfällung von Primzahlen In einem festen Zahlkörper K werden wir nun für fast alle Primzahlen p die Verzweigungsindizes und Restklassengrade der Primidealteiler von pZK bestimmen. Zuerst brauchen wir eine Bemerkung 2.9. Sei K ein Zahlkörper und α ∈ ZK ein primitives Element der Erweiterung K/Q. Das heisst, K = Q(α). Dann ist der Index [ZK : Z[α]] < ∞. Um das zu sehen bemerken wir, dass die abelsche Gruppe ZK /Z[α] endlich erzeugte ist und nur aus Torsionselemente besteht. Sie ist deshalb endlich. Sei eine Primzahl p fixiert. Im Folgenden wird die Reduktion eines Polynom A ∈ Z[T ] modulo p mit A ∈ Fp [T ] bezeichnet. Satz 2.10. Sei K ein Zahlkörper und α ∈ ZK ein primitives Element der Erweiterung K/Q mit Q-Minimalpolynom A ∈ Q[T ]. Wegen Lemma 1.21 ist A ∈ Z[T ]. Weiterhin sei p ≥ 2 eine Primzahl mit p - [ZK : Z[α]]. e1 eg Wir faktorisieren A = A1 · · · Ag mit e1 ≥ 1, . . . , eg ≥ 1 und A1 , . . . , Ag irreduzible und paarweise teilerfremde Polynome in Fp [T ]. Jedes Ai ist die Reduktionen eines Ai ∈ Z[T ] mit deg Ai = deg Ai . Dann sind Pi = pZK + Ai (α)ZK 1 ≤ i ≤ g paarweise verschieden Primideale ungleich Null von ZK . Desweiteren gilt pZK = P1e1 · · · Pgeg und der Restklassengrad von Pi ist deg Ai = deg Ai . Die Wahl des Lifts von Ai in Z[T ] wie im Satz 2.10 ist irrelevant. Wir bemerken jedoch, dass Ai und jeder Lift wie im Satz den selben Grad haben. Bevor wir Satz 2.10 beweisen, schauen wir uns ein Beispiel an. Wir faktorisieren Ideale pZK falls K ein quadratischer Zahlkörper ist? √ Beispiele 2.11. (i) Beginnen wir √ zuerst mit dem uns bekannten Körper K = Q( −5). Es gilt ZK = Z[α] wobei α = −5. Glücklicherweise haben wir [ZK : Z[α]] = 1, also können wir Satz 2.10 auf jede Primzahl p anwenden. Das Minimalpolynom A ∈ Q[T ] von α ist A = T 2 − 5. Wir brauchen eine Fallunterscheidung. Sei zuerst p = 2, dann gilt 2 A = (T + 1) . Also können wir hier A1 = T + 1 wählen und erhalten √ 2ZK = (2ZK + ( −5 + 1)ZK )2 . 43 2. Primidealfaktorisierung in ZK Damit ist die uns schon lange bekannte Faktorisierung von 2ZK erneut bewiesen. 2 Für p = 5, gilt A = T . Hier ist A1 = T möglich und wir erhalten √ 5ZK = (5ZK + −5ZK )2 . Dies lässt sich natürlich zu √ 5ZK = ( −5ZK )2 vereinfachen. Machen wir noch p = 7. Es gilt 32 ≡ 2 ≡ −5 mod 7. Also faktorisiert A in zwei verschieden Faktoren in F7 [T ]: A = (T − 3) (T + 3) ∈ F7 [T ]. Wir wählen A1 = T − 3 und A2 = T + 3 und erhalten √ √ 7ZK = P1 P2 mit P1 = 7ZK + ( −5 − 3)ZK und P2 = 7ZK + ( −5 + 3)ZK wobei P1 und P2 verschieden Primideale sind. √ (ii) Sei m ∈ Z r {0, 1} quadratfrei und K = Q( m). Wir wissen bereits, dass √ Z[ √ m] : m ≡ 2, 3 mod 4, ZK = Z[ m+1 ] : m ≡ 1 mod 4. 2 √ √ Wir definieren entsprechen α = m oder α = ( m + 1)/2. Der Index [ZK : Z[α]] ist somit 1. Satz 2.10 lässt sich somit auf jede Primzahl anwenden. Das Q-Minimalpolynom A von α ist gegeben durch 2 T −m : m ≡ 2, 3 mod 4, A= 1−m 2 T −T + 4 : m ≡ 1 mod 4. und die Diskriminante ist natürlich 4m : m ≡ 2, 3 mod 4, ∆K = m : m ≡ 1 mod 4. Dann ist ∆K die Diskriminante des Polynoms A. Sei nun p ≥ 2 eine Primzahl. Wir nutzen Satz 2.10 um pZK zu faktorisieren. Dazu müssen wir die Reduktion A ∈ Fp [T ] von A modulo p faktorisieren. Wir behandeln zuerst den Fall p 6= 2. Dabei ist zu beachten, dass ∆K ∈ Fp die Diskriminante von A ist. Das Polynom A ist in Fp [T ] genau dann irreduzibel, wenn es keine Nullstelle in Fp besitzt. Wir erhalten : falls ∆K ∈ F× irreduzibel p kein Quadrat ist, × A A mit A irreduzibel und teilerfremd : falls ∆ ∈ F A= 1 2 1,2 K p ein Quadrat ist, 2 A1 : falls ∆K = 0 in Fp . 44 2.2. Zerfällung von Primzahlen Beachte, dass ∆K = 0 und p | ∆K äquivalent sind. Aus Satz 2.10 folgt : falls ∆K ∈ F× P rimideal p kein Quadrat ist, pZK = P1 P2 mit P1,2 Primideale : falls ∆K ∈ F× p ein Quadrat ist, 2 P mit P ein Primdeal : falls ∆K = 0 in Fp . Der Fall p = 2 muss separat behandelt werden. Man wendet auch Satz 2.10 auf A an. Falls m ≡ 2, 3 mod 4 so findet man schnell, dass A ein Quadrat in F2 [T ] ist. Für m ≡ 1 mod 4 muss man noch unterscheiden ob (1 − m)/4 gerade oder ungerade ist. Im ersten Fall zerfällt A in F2 [T ] und im zweiten Fall ist das Polynom irreduzibel. Man findet : falls m ≡ 5 mod 8, P rimideal P1 P2 mit P1,2 Primideale : falls m ≡ 1 mod 8, 2ZK = 2 P mit P ein Primdeal : falls m ≡ 2, 3 mod 4. Folgende Regelmässigkeit findet man aus obiger Untersuchung für jedes p. Das Ideal pZK ist genau dann quadratfrei, wenn p - ∆K . Das Legendre Symbol ist eine nützlich Notation um Ideal pZK in quadratischen Zahlkörper zu faktorisieren. Definition 2.12. Sei p ≥ 3 eine ungerade Primzahl und n ∈ Z. Unten bezeichnet n die Reduktion von n modulo p. Das Legendre Symbol ist gegeben durch −1 : falls n ∈ F× kein Quadrat ist, n +1 : falls n ∈ F× ein Quadrat ist, = p 0 : falls n = 0 oder äquivalent p | n. Der Beweis von Satz 2.10 geht über drei Lemmas. Wir halten die Notation fest wie in der Formulierung des Satzes. Lemma 2.13. Nach einer Permutation der A1 , . . . , Ag gibt es s ∈ Z mit 1 ≤ s ≤ g, so dass P1 , . . . , Ps Primideale sind mit f (P1 ) = deg A1 , . . . , f (Ps ) = deg As . Für die Übrigen gilt Ps+1 = · · · = Pg = ZK . Beweis. Da Ai ∈ Fp [T ] irreduzibel ist, ist Fi = Fp [T ]/Ai Fp [T ] ein Körper. Aus der Vorlesung Algebra ist bekannt, dass Fi eine endliche Körpererweiterung von Fp mit Grad deg Ai ist. Um das Lemma zu beweisen, reicht es zu zeigen, dass für i ∈ {1, . . . , g} entweder ZK /Pi ∼ = Fi oder Pi = ZK gilt. Im ersten Fall muss dann Pi ein maximales Ideal, also insbesondere ein Primideal sein. Wir haben dann auch N (Pi ) = pdeg Ai ; aus der Definition des Restklassengrads folgt f (Pi ) = deg Ai = deg Ai . 45 2. Primidealfaktorisierung in ZK Wir haben einen Ringhomomorphismus Φ gegeben durch das Kompositum Φ : Z[T ] → Fp [T ] → Fp [T ]/Ai Fp [T ] = Fi . Hierbei werden zuerst die Koeffizienten eines Polynoms in Z[T ] modulo p reduziert. Die zweite Abbildung ist die kanonische. Da beide einzeln surjektiv sind, ist auch Φ surjektiv. Weiterhin bemerkt man, dass Φ(p) = 0 und Φ(Ai ) = 0. Das Ideal Ker(Φ) enthält somit pZ[T ] + Ai Z[T ]. Andererseits findet man schnell, dass sogar Ker(Φ) = pZ[T ] + Ai Z[T ] gilt. Zusammengefasst haben wir gezeigt, dass Φ einen Isomorphismus Z[T ]/(pZ[T ] + Ai Z[T ]) ∼ = Fi (2.1) induziert. Da Fi ein Körper ist, ist pZ[T ] + Ai Z[T ] ein maximales Ideal von Z[T ]. (2.2) Wir wollen schlussendlich Fi mit dem Faktorring ZK /Pi vergleichen. Deshalb führen wir einen weiteren Ringhomomorphismus Ψ ein. Dieser ist das Kompositum Ψ : Z[T ] → ZK → ZK /Pi T 7→ α. Der erste Faktor wertet also ein Polynom in Z[T ] an der Stelle α aus. Der zweite Faktor ist die kanonische Abbildung. Auch Ψ ist surjektive. Dies folgt aber nicht unmittelbar ? und hier brauchen wir die Bedingung p - [ZK : Z[α]]. Surjektivität folgt aus ZK = ? Pi + Z[α]. Wegen Pi ⊇ pZK folgt diese Gleichheit aus ZK = pZK + Z[α]. Sicher gilt die Inklusion “⊇”. Um die andere Inkusion zu zeigen, wählen wir r, s ∈ Z, so dass pr + [ZK : Z[α]]s = 1; dies ist möglich wegen der Bedingung an p. Sei a ∈ ZK beliebig. Dann gilt pra + [ZK : Z[α]]sa = a. Aber pra ∈ pZK und [ZK : Z[α]]sa ∈ Z[α], also a ∈ pZK + Z[α]. Deshalb induziert Ψ einen Isomorphismus Z[T ]/Ker(Ψ) ∼ = ZK /Pi . (2.3) Wie für Φ werden wir nun den Kern von Ψ bestimmen. Sicherlich gilt Φ(Ai ) = 0, da Ai (α) ∈ Pi . Weiterhin haben wir Φ(p) = 0 da auch p ∈ Pi . Somit ist Ker(Ψ) ⊇ pZ[T ] + Ai Z[T ] bewiesen. Wir erinnern uns aber daran, dass die rechte Seite ein maximales Ideal ist, cf. (2.2). Somit gibt es genau zwei Möglichkeiten für Ker(Ψ). Die erste Möglichkeit ist Ker(Ψ) = Z[T ]. Wegen (2.3) ist also ZK /Pi = 0. In anderen Worten Pi = ZK . In diesem Fall ist die Konklusion bewiesen. Die zweite Möglichkeite ist Ker(Ψ) = pZ[T ] + Ai Z[T ]. Aus (2.1) und (2.3) folgern wir daher Fi ∼ = ZK /Pi . Auch in diesem Fall folgt das Lemma. Bemerkung 2.14. Ganz am Ende des Beweises werden wir zeigen, dass s = g. Also gibt es keine “Ausnahme Pi ”. 46 2.2. Zerfällung von Primzahlen Lemma 2.15. Seien i, j ∈ {1, . . . , g} mit i 6= j. Dann gilt Pi + Pj = ZK . Beweis. Da Fp [T ] ein Hauptidealring ist und weil Ai , Aj teilerfremd sind, finden wir B, C ∈ Z[T ] mit Ai B + Aj C = 1 in Fp [T ]. Also gibt es D ∈ Z[T ] mit Ai B + Aj C = 1 + pD. Wir setzen α für T ein und erhalten Ai (α)B(α) + Aj (α)C(α) = 1 + pD(α). Aus der Definition von Pi und Pj erhalten wir p, Ai (α) ∈ Pi und Aj (α) ∈ Pj . Also impliziert obige Gleichung 1 ∈ Pi + Pj . Deshalb ist Pi + Pj = ZK . Dieses Lemma impliziert Pi 6= Pj falls i, j ∈ {1, . . . , s} verschieden sind. e Lemma 2.16. Es gilt pZK | P1e1 · · · Pg g . e1 eg e Beweis. In Fp [T ] gilt A1 · · · Ag = A. Deshalb gibt es D ∈ Z[T ] mit Ae11 · · · Agg = A + pD. Wir setzen α ein, beachten dabei A(α) = 0 und erhalten A1 (α)e1 · · · Ag (α)eg = pD(α). Daraus folgt A1 (α)e1 · · · Ag (α)eg ∈ pZK . (2.4) e Jedes Element aus P1e1 · · · Pg g is eine Summe über Produkte a1 · · · ag mit ai ∈ Piei ⊆ pZK + Ai (α)ei ZK . In dieser Notation ist a1 · · · ag ∈ pZK + A1 (α)e1 · · · Ag (α)eg ZK . Wir erhalten also P1e1 · · · Pgeg ⊆ pZK + A1 (α)e1 · · · Ag (α)eg ZK = pZK wegen (2.4). Das Lemma folgt aus Korollar 1.52. Beweis von Satz 2.10. Aus den drei Lemmas folgt pZK | P1e1 · · · Pgeg = P1e1 · · · Pses . wobei P1 , . . . , Ps paarweise verschiedene Primideale ungleich Null sind mit f (Pi ) = deg Ai und Ps+1 = · · · = Pg = ZK . Es gilt Pi | pZK für jedes i ∈ {1, . . . , g}, da Pi ⊇ pZK . Wegen Satz 1.44 und der Definition von e(Pi ) gilt e(P1 ) pZK = P1 · · · Pse(Ps ) mit 1 ≤ e(Pi ) ≤ ei für i ∈ {1, . . . , s}. Nun nutzen wir Lemma 2.8. Es impliziert die erste Gleichheit in [K : Q] = s X i=1 e(Pi ) f (Pi ) ≤ deg(Ae11 · · · Aess ) ≤ deg(Ae11 · · · Aegg ) = deg A = [K : Q]; | {z } =deg(Ai ) die letzte Gleichheit folgt, da α primitiv ist. Es muss also überall Gleichheit gelten oben. Zunächst folgt s = g, da ei deg Ai > 0 für alle i ∈ {1, . . . , g}. Danach folgt auch ei = e(Pi ) für i ∈ {1, . . . , g}. Im Allgemeinen ist nicht jeder Ring ZK von der Form Z[α]. 47 2. Primidealfaktorisierung in ZK Definition 2.17. Ein Zahlkörper K heisst monogensch, falls α ∈ ZK mit ZK = Z[α] existiert. Monogensche Zahlkörper haben den Vorteil, dass man Satz 2.10 für jede Primzahl anwenden kann. Beispiele 2.18. Wir haben schon einige monogensche Zahlkörper kennen gelernt. √ (i) Für quadratfreies m ∈ Z r {0, 1} ist Q( m) monogensch. (ii) Für quadratfreies m ∈ Zr{0, 1} mit m ≡ 2, 4, 5, 7 mod 9 ist Q(m1/3 ) monogensch. Siehe dazu Aufgabe 4, Blatt 3. (iii) Der Zahlkörper Q(α) von Grad 5 mit α5 − α + 1 = 0 ist monogensch. Dies folgt aus Aufgabe 1, Blatt 4. Achtung. Es gibt ein Zahlkörper welcher nicht monogensch ist. Es existiert sogar einen Zahlkörper K so, dass [ZK : Z[α]] gerade ist für jedes primitive Element α ∈ ZK . Insbesondere lässt sich Satz 2.10 für kein α auf K mit p = 2 anwenden. Definition 2.19. Sei K ein Zahlkörper und p ≥ 2 eine Primzahl. Man sagt, dass p (in K) verzweigt, falls es ein Primideal P von ZK gibt mit P 2 | pZK . Die verzweigten Primzahlen p sind also diejenige für welche pZK nicht quadratfrei ist. Falls K eine Grad 2 Erweiterung von Q ist, so haben wir gesehen, dass die Primteiler der Diskriminante genau die verzweigten Primzahlen sind. Diese Beobachtung lässt sich wie folgt verallgemeinern. Proposition 2.20. Sei K ein Zahlkörper und α ∈ ZK primitiv, also K = Q(α). Sei weiterhin p ≥ 2 eine Primzahl mit p - [ZK : Z[α]]. Dann verzweigt p in K genau dann, wenn p | ∆K . Beweis. Das Q-Minimalpolynom A von α liegt in Z[T ]. Dann d = deg A = [K : Q]. Sei A seine Reduktion modulo p. Also verzweigt p in K Satz 2.10 ⇐⇒ 2 es gibt B ∈ Z[T ] normiert mit deg B ≥ 1 und B | A. Der Zerfällungskörper von A ist ein Zahlkörper L. Wir können annehmen, dass L ⊇ K. Qd Es gilt A = i=1 (T − yi ) mit yi ∈ ZL . Unser α ist unter den yi . Sei P das Primideal von ZL welches p enthält. Für a ∈ ZL schreiben wir a für sein Bild in ZK /P . Nun ist A nicht quadratfrei genau dann, wenn A0 (yi ) = 0 für ein i ∈ {1, . . . , d}. Also verzweigt p in K ⇐⇒ es gibt i ∈ {1, . . . , d} mit A0 (yi ) = 0 ⇐⇒ es gilt d Y A0 (y i) = i=1 ⇐⇒ ∆K 48 (1, α, . . . , αd−1 ) d Y A0 (yi ) = 0 i=1 = 0; 2.3. Kreisteilungskörper die letzte Äquivalenz folgt aus Aufgabe 4, Serie 2. Aber ∆K (1, α, . . . , αd−1 ) = 0 ist äquivalent mit ∆K (1, α, . . . , αd−1 ) ∈ P ∩ Z = pZ, also p | ∆K (1, α, . . . , αd−1 ). Schliesslich gilt ∆K (1, α, . . . , αd−1 ) = [ZK : Z[α]]2 ∆K , siehe Lemma 1.26(ii). Wegen Voraussetzung gilt p - [ZK : Z[α]] und daraus folgt die Proposition. Bemerkung 2.21. Der Beweis der Proposition benutzt die Voraussetzung p - [ZK : Z[α]] zweimal. Dennoch ist sie überflüssig. Das heisst, p verzweigt in K genau dann, wenn p | ∆K . Korollar 2.22. Sei K ein Zahlkörper. Es gibt höchstens endlich viele Primzahlen welche in K verzweigen. Beweis. Dies folgt aus Proposition 2.20, weil [ZK : Z[α]] höchstens endlich viele Primteiler besitzt und wegen ∆K 6= 0, cf. Lemma 1.27. 2.3. Kreisteilungskörper Wir kommen nun zu einer wichtigen Klasse von Zahlkörpern. Erinnerung. Sei p ≥ 2 eine Primzahl und ζ = ζp = e2πi/p ∈ C. Es gilt ζ p = 1. Also ist ζ eine algebraische Zahl und K = Q(ζ) ist ein Zahlkörper. Das normierte Polynom T p − 1 ∈ Z[T ] hat ζ als Nullstelle. Es folgt ζ ∈ ZK und [K : Q] ≤ p. Aber T p − 1 ist nicht das Q-Minimalpolynom von ζ da es nie irreduzibel ist. Es gilt T p − 1 = (T − 1) (T p−1 + T p−2 + · · · + T + 1) . {z } | =Φp Wir haben Φp (ζ) = 0. Behauptung: Das Polynom Φp (T ) ist irreduzibel in Q[T ]. Beweis: Das “verschobene” Polynom Φp (T +1) ist von besonders einfacher Form modulo p. Es gilt (T + 1)p − 1 Tp Φp (T + 1) ≡ ≡ ≡ T p−1 mod p. (T + 1) − 1 T Andererseits ist der konstante Term von Φp (T + 1) gleich Φp (1) = 1| + ·{z · · + 1} = p. p-mal Nach dem Eisensteinschen Kriterium ist Φp (T + 1) irreduzibel. Somit ist auch Φp (T ) irreduzibel. Daher ist [K : Q] = p − 1. Definition 2.23. Sei p ≥ 2 eine Primzahl. Der Zahlkörper K = Q[T ]/(T p−1 + · · · + T + 1)Q[T ] heisst p-ter Kreisteilungskörper. Wir schreiben oft ζ oder ζp für das Bild von T in K. Die Kreisteilungskörper treten im Zusammenhang mit Fermats letzten Satz auf. Sei also K der p-te Kreisteilungskörper. Was können wir über ZK , ∆K , ClK und Z× K sagen? Der Ring der algebraischen Zahlen und die Diskriminante sind zugänglich. Wir werden sie weiter unten bestimmen. Die Einheitengruppe und insbesondere die Klassengruppe sind aber schwierig festzulegen. 49 2. Primidealfaktorisierung in ZK Lemma 2.24. Sei p ≥ 2 eine Primzahl und K = Q(ζ) der p-te Kreisteilungskörper. (i) Es gilt pZK = (λZK )p−1 wobei λ = 1 − ζ. (ii) Die Diskriminante des Tupels (1, ζ, . . . , ζ p−2 ) erfüllt ∆K (1, ζ, . . . , ζ p−2 ) = ±pp−2 . Beweis. Den Beweis von (i) beginnen wir mit der Beobachtung, dass Φp (ζ i ) = 0 für 1 ≤ i ≤ p − 1. Es gilt #{ζ, ζ 2 , . . . , ζ p−1 } = p − 1. Also haben wir alle Nullstellen von Φp gefunden. Es gilt Φp (T ) = (T − ζ) · · · (T − ζ p−1 ) und somit p = Φp (1) = p−1 Y (1 − ζ i ). i=1 Wir zeigen weiter unten, dass (1 − ζ i )/(1 − ζ) ∈ Z× K falls i ∈ {1, . . . , p − 1}. Ist dies einmal bekannt so haben wir p−1 p−1 Y Y 1 − ζi 1 − ζi p (1 − ζ) = (1 − ζ) p= 1−ζ 1−ζ i=1 i=1 | {z } ∈Z× K und daraus folgt (i). Wieso ist (1 − ζ i )/(1 − ζ) eine Einheit? Dass dieses Element überhaupt in ZK liegt folgt aus 1 − ζi = 1 + ζ + · · · + ζ i−1 ∈ ZK . 1−ζ Um dasselbe für das Inverse zu zeigen wählen wir j ∈ Z mit ij ≡ 1 mod p. Es gilt ζ ij = ζ und somit 1 − ζ ij 1−ζ = = 1 + ζ i + ζ 2i + · · · + ζ i(j−1) ∈ ZK . 1 − ζi 1 − ζi Somit ist (1 − ζ i )/(1 − ζ) ∈ Z× K. Nun zu Teil (ii). Aufgabe 4, Serie 2 zeigt ∆K (1, ζ, . . . , ζ p−2 )=± p−1 Y Φ0p (ζ i ). i=1 Wie können wir Φ0p (ζ i ) bestimmen? Wir müssen einfach T p − 1 = (T − 1)Φp (T ) ableiten und geeignet evaluieren. Es gilt pT p−1 = Φp (T ) + (T − 1)Φ0p (T ) und evaluiert bei ζ i erhalten wir pζ i(p−1) = 0 + (ζ i − 1)Φ0p (ζ i ). 50 2.3. Kreisteilungskörper Also Φ0p (ζ i ) = pζ i(p−1) (ζ i − 1)−1 . Wir haben also ∆K (1, ζ, . . . , ζ p−2 ) = ± p−1 Y pζ i(p−1) (ζ i − 1) −1 = ±pp−1 p−1 p−1 Y p Φp (1) ! p−1 Y (ζ i − 1)−1 ζ i(p−1) i=1 i=1 =± p−1 Y i=1 ζ i(p−1) . i=1 Wir wissen bereits, dass Φp (1) = p. Weiterhin ist Also folgt Teil (ii). Qp−1 i=1 ζ i(p−1) = (±Φp (0))p−1 = ±1. Bemerkung 2.25. Seien p und K wie in Lemma 2.24.Falls p ≥ 5 so ist pp−2 nicht quadratfrei. Wir können also nicht den üblich “Trick” anwenden um ZK = Z[ζ] zu folgern. Dass diese Gleichung aber trotzdem gilt zeigt uns folgendes Lemma. Lemma 2.26. Sei p ≥ 2 eine Primzahl und K = Q(ζ) der p-te Kreisteilungskörper. Es gilt ZK = Z[ζ]. Beweis. Wir wissen bereits, dass ±pp−2 = ∆K (1, ζ, . . . , ζ p−2 ) = [ZK : Z[ζ]]2 ∆K , siehe Lemma 1.26(ii). Also ist [ZK : Z[ζ]] ein Teiler von pp−2 . Dies impliziert pp−2 ZK ⊆ Z[ζ]. (2.5) Wir setzen λ = 1 − ζ wie in Lemma 2.24(i). Wir haben pZK = (λZK )p−1 . Da die Norm multiplikativ ist, gilt pp−1 = p[K:Q] = |NK/Q (pZK )| = N (pZK ) = N (λZK )p−1 . Also ist N (λZK ) = p. Lemma 2.1(ii) zeigt, dass λZK ein Primideal ist. Der Quotient ZK /λZK ist also Z/pZ. Daraus folgern wir ZK = Z + λZK also insbesondere ZK = Z[ζ] + λZK . (2.6) Behauptung: Für t ∈ Z mit t ≥ 1 gilt ZK = Z[ζ] + λt ZK . Der Beweis ist Induktion auf t. Den Fall t = 1 haben wir schon erledigt. Gemäss Induktionsvoraussetzung haben wir ZK = Z[ζ] + λt ZK . Wir multiplizieren mit λ und erhalten λZK = λZ[ζ] + λt+1 ZK . Insbesondere also λZK ⊆ Z[ζ] + λt+1 ZK , da λ ∈ Z[ζ]. Wenn wir jetzt (2.6) heranziehen, erhalten wir ZK ⊆ Z[ζ] + λt+1 ZK . Daraus folgt unsere Behauptung. Zurück zum Beweis von Lemma 2.26. Wir nehmen t = (p − 1)(p − 2) und erhalten ZK = Z[ζ] + (λZK )(p−1)(p−2) = Z[ζ] + pp−2 ZK wegen Lemma 2.24(i). Schliesslich impliziert (2.5) die Inklusion ZK ⊆ Z[ζ]. Die Umgekehrte Inklusion gilt trivialerweise also ist das Lemma bewiesen. 51 2. Primidealfaktorisierung in ZK Korollar 2.27. Seine p und K wie in Lemma 2.26. (i) Es gilt ∆K = ±pp−2 . (ii) Falls p ≥ 3 so ist p die einzige Primzahl, welche in K verzweigt. Beweis. Die Diskriminante ∆K ist ∆K/Q (1, ζ, . . . , ζ p−2 ) = ±pp−2 wegen Lemma 2.24. Der zweite Teil folgt direkt aus dem ersten und Satz 2.10. Bemerkung 2.28. In einem Kreisteilungskörper K kann man lZK “explizit” faktorisieren für eine beliebige Primzahl l. 52 3. Klassen- und Einheitengruppe Wir haben schon erlebt, wie die Struktur der Klassengruppe ClK hilfreich sein kann, wenn es darum geht diophantische Gleichungen zu lösen. Sei K ein Zahlkörper. Dann ist x7→xZ × 1 → Z× −→K J(K) → Cl(K) → 0 K → K eine exakte Sequenz. Die beiden Gruppe in der mitte, also K × und J(K), sind “gross”: wir haben z.B. gesehen, dass J(K) frei abelsch von unendlichem Rang ist. Ziel dieses Kapitels ist es, die Struktur von Z× K und Cl(K) aufzuklären. Der erste Meilenstein ist der folgende Satz, wir werden ihn erst weiter unten beweisen. Satz 3.1. Sei K ein Zahlkörper, dann ist die Klassengruppe Cl(K) endlich. Bemerkung 3.2. Um Satz 3.1 zu beweisen, folgen wir dem Beweis dass die Klassengruppe von ZQ(√−5) zu Z/2Z isomorph ist. Konkret werden wir für einen Zahlkörper K eine Konstante CK > 0 mit folgender Eigenschaft finden. Für jedes Ideal I ⊆ ZK ungleich Null gibt es a ∈ I r {0} mit |NK/Q (a)| ≤ CK N (I). In diesem Fall gilt aZK ⊆ I und wie üblich gibt es ein Ideal J ⊆ ZK mit IJ = aZK . Die Norm erfüllt N (I)N (J) ≤ CK N (I), also N (J) ≤ CK . Weiterhin werden wir sehen, dass es nur endlich viele Ideale beschränkter Norm gibt. In der Klassengruppe gilt aber [I][J] = [aZK ] = 1. Und somit gibt es nur endlich viele Möglichkeiten für [I]. Da jedes Element der Klassengruppe von der Form [I] ist, folgt Satz 3.1. 3.1. Geometrie der Zahlen Wir entwickeln die Grundlagen eine auf Minkowski zurückgehende Theorie. Sie ist ein wichtiges Werkzeug in vielen Bereichen der Zahlentheorie. Die allgemeine Frage in “Geometrie der Zahlen” lässt sich wie folgt formulieren. Sei E ⊆ Rd eine Teilmenge. Unter welchen Bedingung an E enthält diese Menge ein Element von Zd r {0}? Ist E zum Beispiel der abgeschlossene euklidische Ball um den Nullpunkt mit Radius ρ, so ist E ∩ (Zd r {0}) nicht leer für ρ genügend gross (z.B. ρ ≥ 1 reicht aus). Insbesondere enthalten solche E einen ganzzahligen Vektor ungleich Null, falls deren Volumen genügend gross ist. Aber eine allgemeine Lebesgue messbare Menge E von beliebig grossem Volumen muss nicht unbedingt ein Element von Zd r {0} enthalten. Die Menge E braucht zusätzliche Eigenschaften. Wir werden diese weiter unten kennen lernen. 53 3. Klassen- und Einheitengruppe Es wird sich als nützlich erweisen nicht nur mit Zd sondern mit allgemeineren Untergruppen von Rd zu arbeiten. Definition 3.3. Ein Gitter ist eine endliche erzeugte Untegruppe von Rd mit Rang d welcher eine R-Basis von Rd enthält. Beispiele 3.4. (i) Das erste Beispiel eines Gitters in Rd ist Zd selbst. (ii) Die Untergruppe √ √ Λ = (1, 2)Z + (1, − 2)Z √ ist ein Gitter in R2 . Die zwei Vektoren (1, ± 2) sind R-linear unabhängig. Es folgt, dass Λ ein freier Z-Modul von Rang 2 ist, und dass Λ eine R-Basis von R2 enthält. (ii) Die Untergruppe √ Λ = (1, 0)Z + ( 2, 0)Z ist kein Gitter in R2 . Obwohl Λ ein freier Z-Untermodul von R2 mit Rang 2 ist, sind je zwei Element aus Λ stets R-linear abhängig. Definition 3.5. Sei Λ ein Gitter in Rd und (v1 , . . . , vd ) eine Z-Basis von Λ. Aus der Definition folgt, dass (v1 , . . . , vd ) eine R-Basis von Rd ist. Der Wert | det[v1 · · · vd ]| ist unabhängig von der Wahl der vi und heisst Determinante von Λ, oder det Λ als Symbol. Die Determinante erfüllt det Λ > 0. Gegeben v1 , . . . , vd wie oben, so nennt man F = {λ1 v1 + · · · + λd vd : λi ∈ [0, 1)} eine Fundamentalmasche von Λ (bezüglich der Basis (v1 , . . . , vd )). Diese hängt von der Basiswahl ab. √ √ Beispiel 3.6. Das Gitter (1, 2)Z+(1, − 2)Z aus dem Beispiel oben hat Determinante √ 2 2. Bemerkungen 3.7. (i) Aus der Tatsache, dass ein Gitter positive Determinante hat folgt, dass es eine diskrete Teilmenge von Rd ist. (ii) Sei µ das Lebesgue Mass auf Rd , Λ ein Gitter von Rd und F eine Fundamentalmasche von Λ (bezüglich einer beliebigen Z-Basis). Dann gilt µ(F ) = det Λ. Wir werden Punkte ungleich Null in E finden welche Element eines Gitter sind. Definition 3.8. Eine Teilmenge E ⊆ Rd heisst symmetrisch, falls −x ∈ E aus x ∈ E folgt. Wie oben wird µ das Lebesgue Mass auf Rd sein. 54 3.1. Geometrie der Zahlen Satz 3.9 (Minkowskis Gitterpunktsatz). Sei Λ ⊆ Rd ein Gitter und E eine symmetrisch, konvexe, Lebesgue messbare Teilmenge des Rd . Falls µ(E) > 2d det Λ dann existiert ein v ∈ E mit v ∈ Λr{0}. Falls wir zusätzlich annehmen, dass E kompakt ist, so reicht die Voraussetzung µ(E) ≥ 2d det Λ. Beweis. Wir zeigen weiter unten, dass es v, v 0 ∈ Λ gibt mit v 6= v 0 und 1 1 0 E+v ∩ E + v 6= ∅. 2 2 (3.1) Daraus folgt die erste Behauptung des Gitterpunktsatzes wie folgt. Wir wählen x, y ∈ E mit x/2 + v = y/2 + v 0 . Es gilt v − v0 = y x 1 1 − = y + (−x). 2 2 2 2 Aus der Symmetrie von E folgt −x ∈ E. Da E konvex ist, enthält sie den Mittelpunkt der Strecke zwischen y und −x. In anderen Worten, y/2 − x/2 ∈ E. Also ist v − v 0 ∈ E. Da v − v 0 ∈ Λ r {0} folgt die erste Behauptung des Lemmas. Nun müssen wir noch (3.1) beweisen. Dazu nehmen wir an, dass die Mengen 12 E +v paarweise disjunkt sind, wenn v die Element von Λ durchläuft. Daraus wird ein Widerspruch folgen. Wir wählen eine Z-Basis von Λ und nennen die sich daraus ergebende Fundamentalmasche F . Die Mengen ( 21 E + v) ∩ F , wobei v das Gitter Λ durchläuft, sind paarweise disjunkt. Aus der σ-Additivität von µ ergibt sich die erste Gleichheit in ! [ 1 X 1 E+v ∩F =µ E + v ∩ F ≤ µ(F ) = det Λ. (3.2) µ 2 2 v∈Λ v∈Λ Für v ∈ Λ gilt (( 21 E + v) ∩ F ) = ( 12 E) ∩ (F − v) + v. Da µ translationsinvariant ist, folgt µ(( 21 E + v) ∩ F ) = µ(( 12 E) ∩ (F − v)). Wir schreiben (3.2) um und erhalten X 1 det Λ ≥ µ E ∩ (F − v) . 2 v∈Λ Da F eine Fundamentalmasche ist, sind die F − v (wobei v das Gitter durchläuft) paarweise verschieden. Wir erhalten ! ! [ [ 1 1 det Λ ≥ µ E ∩ (F − v) = µ E ∩ (F − v) . 2 2 v∈Λ v∈Λ S Aber jedes Element in Rd liegt in F modulo Λ. Daraus folgt v∈Λ (F − v) = Rd . Also det Λ ≥ µ( 21 E) = 2−d µ(E). Diese Ungleichung widerspricht der Voraussetzung an das Mass von E. 55 3. Klassen- und Einheitengruppe Wir müssen noch beweisen, dass µ(E) ≥ 2d det Λ reicht, falls E kompakt ist. In diesem Fall ist µ(E) < ∞ und wir haben auch µ((1 + )E) = (1 + )d µ(E) > 2d det Λ für jedes > 0. Aus dem ersten Teil des Lemmas folgt, dass für jedes ∈ (0, 1] ein v ∈ (1 + )E ∩ (Λ r {0}) gibt. Nun ist E symmetrisch konvex und nicht-leer. Also 0 ∈ E und sogar (1 + )E ⊆ 2E. Aber 2E ist auch kompakt und Λ ist diskret. Deshalb ist (2E) ∩ (Λ r {0}) endlich. Es gibt also eine Folge k ∈ (0, 1] mit k → 0 mit vk = v0 ∈ (1 + k )E ∩ (Λ r {0}), d.h. vk ist unabhängig von k. Da E abgeschlossen ist gilt sogar v0 ∈ E. Also folgt der zweite Teil der Behauptung. Beispiel 3.10. Falls E wie im ersten Teil des Lemmas ist (d.h. nicht unbedingt kompakt), so brauchen wir wirklich strikte Ungleichheit. Sei E = (−1, 1)d . Diese Menge ist konvex, symmetrisch und Lebesgue messbar mit µ(E) = 2d . Aber E ∩ Zd = {0}. 3.2. Einbettung von ZK Wir werden uns mit Gitter in Rd beschäftigen die von einem Zahlkörper K von Grad d stammen. Aus der Algebra ist bekannt, dass es d paarweise verschiedene Einbettungen σ1 , . . . , σ d : K → C gibt. Es ist hilfreich diese wie folgt zu sortieren. Zunächst gibt es r ∈ Z mit 0 ≤ r ≤ d so, dass (nach Umnummerierung der σi ) σi (K) ⊆ R für 1 ≤ i ≤ r und σi (K) 6⊆ R für r + 1 ≤ i ≤ n. Die Einbettungen σ1 , . . . , σr heissen reellen Einbettungen. Ist i > r so nennt man σi eine komplexe Einbettung. In diesem Fall gilt σi 6= σi ; hier ist σ(x) = σ(x) mit die · komplexe Konjugation. Nach einer weiteren Umnummerierung gilt σr+1 = σr+s+1 , σr+2 = σr+s+2 , . . . , σr+s = σr+2s für s = (d − r)/2. Definition 3.11. Das Paar (r, s) welches wir dem Zahlkörper K zugeordnet haben, heisst Signatur von K. √ Beispiele 3.12. (i) Sei m ∈ Z r {0, 1} quadratfrei und K = Q( m). Falls m > 0 so hat K Signatur (2, 0). Falls m < 0 so ist die Signatur (0, 1). (ii) Sei p ≥ 3 eine Primzahl und K der p-te Kreisteilungskörper. Dann hat K keine reelle Einbettungen da der Körper eine p-te Einheitswurzel enthält. Die Signatur von K ist daher (0, (p − 1)/2). 56 3.2. Einbettung von ZK Sei K wieder ein beliebiger Zahlkörper mit Signatur (r, s) und Grad d = r+2s. Weiterhin seien Einbettungen σ1 , . . . , σd wie oben sortiert. Wir definieren eine Q-lineare Abbildung Ψ : K → Rd durch x 7→ (σ1 (x), . . . , σr (x), Re σr+1 (x), Im σr+1 (x), . . . , Re σr+s (x), Im σr+s (x)), hier sind Re und Im Real- beziehungsweise Imaginärteil. Die Abbildung Ψ ist injektiv. √ √ m) wie im Beispiel zuvor. Falls m > 0 so ist Ψ(a+ mb) = Beispiel 3.13. Sei K = Q( p √ √ √ (a + mb, a − mb). Falls m < 0 so ist Ψ(a + mb) = (a, |m|b). Wir werden jetzt u.a. zeigen, dass das Bild von ZK unter Ψ ein Gitter in Rd ist. Lemma 3.14. Wir behalten die Notation von oben bei. (i) Dann ist Ψ(ZK ) ein Gitter in Rd mit Determinante 2−s |∆K |1/2 . (ii) Sei I ⊆ ZK ein Ideal I 6= 0 dann ist auch Ψ(I) ein Gitter und die Determinante ist 2−s |∆K |1/2 N (I). Beweis. Wir fangen mit Teil (i) an. Da Ψ injektiv ist und weil ZK ein freier Z-Modul von Rang d ist, ist Ψ(ZK ) ein freier Z-Modul von Rang d. Wir müssen also nachweisen, dass Ψ(ZK ) eine R-Basis von Rd enthält. Dazu sei (a1 , . . . , ad ) eine Z-Basis von ZK . Es gilt σ1 (aj ) .. . σr (aj ) Re σr+1 (aj ) [Ψ(a1 ) · · · Ψ(ad )] = ∈ MatR (d). Im σr+1 (aj ) .. . Re σr+s (aj ) Im σr+s (aj ) 1≤j≤d Hieraus folgt 1 .. . 1 1 i 1 i .. . 1 i 1 −i 1 −i .. . 1 −i [Ψ(a1 ) . . . Ψ(ad )] = [σi (aj )]1≤i,j≤d 57 3. Klassen- und Einheitengruppe 1 i Die Determinante eines Blocks ist −2i. Die Determinante der Matrix ganz 1 −i links ist ±(2i)s . Die Determinante der Matrix ganz rechts zum Quadrat ist genau ∆K wegen Lemma 1.26(i). Wir erhalten | det[Ψ(a1 ) · · · Ψ(ad )]| = 2−s |∆K |1/2 6= 0. Insbesondere sind Ψ(a1 ), . . . , Ψ(ad ) linear unabhängig über R. Also ist Ψ(ZK ) ein Gitter und ihre Determinante ist durch 2−s |∆K |1/2 gegeben. Daraus folgt Teil (i). Teil (ii) folgt aus dem ersten Teil und #(ZK /I) = N (I). Wir werden nun mit Hilfe des Gitterpunktsatzes von Minkowski ein Element von I mit kleiner Norm bestimmen. Zuerst brauchen wir aber eine Teilmenge E in Rd . Leider ist im allgemeinen der topologisch Abschluss der Menge Ψ({x ∈ K : |NK/Q (x)| ≤ 1}) ⊆ Rd nicht konvex. Wir können aber mit einer ähnlichen Menge arbeiten. Sei dazu λ ≥ 0 ein Parameter. Wir setzen Eλ = {(x1 , . . . , xr , xr+1 , yr+1 , . . . , xr+s , yr+s ) ∈ Rd ; 2 2 |x1 | + · · · + |xr | + 2(x2r+1 + yr+1 )1/2 + · · · + 2(x2r+s + yr+s )1/2 ≤ λ}. | {z } Definiert eine Norm auf Rd . Bezüglich dieser Norm ist also Eλ eine abgeschlossen Kugel um den Nullpunkt mit Radius λ. Bemerkung 3.15. Die Menge Eλ hat folgende Eigenschaften. (i) Sie ist konvex, dies folgt aus der Dreiecksungleichung der Norm. (ii) Sie ist symmetrisch. (iii) Sie ist kompakt, also insbesondere Lebesgue messbar. (iv) Es gilt µ(Eλ ) = λd µ(E1 ). Wir werden (um den Gitterpunktsatz anwendenzukönnen) das Mass von Eλ bestimmen müssen. Die vierte Eigenschaft sagt uns, dass es reicht das Mass von E1 zu kennen. Der Zusammenhang zwischen Eλ und der Normabbildung auf K ist durch folgendes Lemma gegeben. Lemma 3.16. Wir behalten die Notation von oben bei. Sei a ∈ K und λ ≥ 0 mit Ψ(a) ∈ Eλ . Dann gilt d λ . |NK/Q (a)| ≤ d Beweis. Sei Ψ(a) = (x1 , . . . , xr , xr+1 , yr+1 , . . . , xr+s , yr+s ). Lemma 1.7 besagt, dass |NK/Q (a)| = d Y i=1 58 2 2 2 2 ) 2 · · · (x2r+s + yr+s )2 . |σi (a)| = |x1 | · · · |xr |(x2r+1 + yr+1 3.2. Einbettung von ZK Wir können diese Produkt aus d = r +2s Faktoren gegen oben mit Hilfe der Ungleichung zwischen dem arithmetischen und geometrischen Mittel abschätzen. Dazu betrachten wir 2 2 ) 2 als ein Quadrat für 1 ≤ i ≤ s. Wir erhalten (x2r+i + yr+i |NK/Q (a)|1/d ≤ 1 2 2 |x1 | + · · · + |xr | + 2(x2r+1 + yr+1 )1/2 + · · · + 2(x2r+s + yr+s )1/2 . d Wegen Ψ(a) ∈ Eλ ist die rechte Seite höchstens λ/d. Es folgt |NK/Q (a)| ≤ (λ/d)d , wie gewünscht. Folgende Proposition ist der wichtigste Schritt im Beweis von Satz 3.1. Proposition 3.17. Sei K ein Zahlkörper mit Signatur (r, s) und Grad d = r + 2s. Weiterhin sei I ein Ideal von ZK mit I 6= 0. Es gibt a ∈ I r {0} mit |NK/Q (a)| ≤ CK N (I) wobei d! CK = d d s 4 |∆K |1/2 . π Beweis. Weiter unten werden wir µ(E1 ) = 2r π s d! 2 (3.3) zeigen. Zunächst zeigen wir aber wie diese Ungleichung die Proposition impliziert. Wir werden Satz 3.9 auf das Gitter Ψ(I) und der Menge Eλ mit s 1/d 4 N (I)1/d |∆K |1/(2d) λ = d! π anwenden. Wir wissen bereits, dass Eλ konvex, symmetrisch und kompakt ist (und daher auch Lebesgue messbar). Es reicht also nachzuweisen, dass µ(Eλ ) ≥ 2d det Ψ(Λ). Nun gilt λd π s µ(Eλ ) = λd µ(E1 ) = 2r = 2d−s N (I)|∆K |1/2 = 2d det Ψ(I) d! 2 wegen Lemma 3.14(ii). Also gibt es a ∈ I r {0} mit Ψ(a) ∈ Eλ . Wegen Lemma 3.16 und der Definition von CK haben wir |NK/Q (a)| ≤ λd = CK N (I). dd Um die Proposition zu beweisen müssen wir noch (3.3) ziegen. Dazu definieren wir Vr,s (λ) = µ(Eλ ). Beachte, dass Eλ von der Signatur (r, s) abhängt. 59 3. Klassen- und Einheitengruppe Es gilt V0,1 (λ) = πλ2 /4. Weiterhin berechnen wir Z 2 2 1/2 V0,s−1 (1 − 2(x + x ) V0,s (1) = Z 1/2 2(s−1) (1 − 2ρ) 0 Daraus folgt (3.3) falls r = 0. Analog zeigt man Z 1 Ind. Vr−1,s (1 − x)dx = 2 Vr,s (1) = 2 0 1/2 V0,s−1 (1 − 2ρ)ρdρdθ 0 π s−1 2π = (2s − 2)! 2 Z )dxdy = x2 +y 2 ≤1/4 Ind. 2π Z 0 1 π s ρdρ = . (2s)! 2 π s 1 2r−1 (d − 1)! 2 Z 1 (1 − x)d−1 dx = 0 1 r π s 2 . d! 2 Wir kommen nun zum Beweis von Satz 3.1. Sei x ein beliebiges Element der Klassengruppe Cl(K). Wir wissen, dass x−1 von einem Ideal I ⊆ ZK mit I 6= 0 repräsentiert wird. Wegen Proposition 3.17 gibt es a ∈ I r {0} mit |NK/Q (a)| ≤ CK N (I). Also ist das Hauptideal aZK in I enthalten. Wegen Korollar 1.52 gibt es ein Ideal 0 6= J ⊆ ZK mit IJ = aZK . Da die Norm eines Ideals multiplikativ ist gilt N (I)N (J) = N (IJ) = N (aZK ) = |NK/Q (a)| ≤ CK N (I). Also haben wir N (J) ≤ CK . In der Klassengruppe gilt [I][J] = [aZK ] = 1. Also [J] = x. Aber wegen Serie 3 Aufgabe 3(iv) gibt es nur endlich viele Ideale in ZK mit Norm höchstens CK . Es gibt also nur endlich viele Möglichkeiten für J und so für x. Jetzt berechnen wir einige Klassengruppe. Dazu benutzen wir die Notation vom Beweis von Satz 3.1. Beispiele 3.18. (i) Sei K der 5-te Kreisteilungskörper. Wir wissen, d = 4, (r, s) = (0, 2) und ∆K = ±53 und erhalten 4! CK = 4 4 2 4 53/2 < 2. π Sind x und J wie im Beweis von Satz 3.1 (also insbesondere x = [J]) dann gilt N (J) ≤ CK . Also N (J) = 1 und somit J = ZK . Daher ist x das triviale Element und wir folgern Cl(K) = {1}. Folglich ist ZK ein Hauptidealring. (ii) Sei nun K = Q(71/3 ). Aufgabe 5 der Serie 2 impliziert ZK = Z[71/3 ]. Weiterhin haben wir d = 3, (r, s) = (1, 1) und ∆K = −33 · 72 . Wie vorhin können wir daraus CK bestimmen und erhalten CK < 11. 60 3.2. Einbettung von ZK Falls also x und J wie im Beweis von Satz 3.1 sind, so gilt N (J) ≤ 10. Wir bestimmen nun alle Ideale (ungleich Null) in ZK mit Norm höchstens 10. Jedes solche Ideal ist ein Produkt von Primidealfaktoren von 2ZK , 3ZK , 5ZK und 7ZK . Wir wenden Satz 2.10 an um diese Hauptideal zu faktorisieren. Als α nehmen wir 71/3 und A is somit T 3 − 7. Es folgt 2ZK = P2 Q2 , 3ZK = P33 , 5ZK = P5 Q5 , N (P2 ) = 2, N (Q2 ) = 4 N (P3 ) = 3 N (P5 ) = 5, N (Q5 ) = 25 7ZK = (71/3 ZK )3 , N (71/3 ZK ) = 7. da A ≡ (T + 1)(T 2 + T + 1) mod 2, da A ≡ (T − 1)3 mod 3, da A ≡ (T + 2)(T 2 + 3T + 4) mod 5, Folgende Tabelle beschreibt die Ideal von ZK mit Norm höchstens 10. Norm: 1 Ideal: ZK 2 P2 3 P3 4 P22 , Q2 5 P5 6 P2 P 3 7 7 ZK 1/3 P23 , 8 2ZK 9 P32 10 P2 P5 Aber nicht alle repräsentieren paarweise verschieden Elemente der Klassengruppe. Zum Beispiel sind ZK , 71/3 ZK und 2ZK trivial in Cl(K). Wir erhalten zunächst #Cl(K) ≤ 10 werden aber nun weitere Ideale eliminieren. Nun gilt NK/Q (−1 + 71/3 ) = 6 wegen der Normformel in Serie 2, Aufgabe 5(iii). Also hat (−1+71/3 )ZK Norm 6 als Ideal. Es gibt aber nur ein Ideal in ZK der Norm 6. Deshalb ist P2 P3 das Hauptideal (−1 + 71/3 )ZK und wir können es eliminieren. Also #Cl(K) ≤ 9. In der Klassengruppe gilt [P2 ][P3 ] = 1 und [P2 ][Q2 ] = 1. Somit haben wir [Q2 ] = [P3 ] also können wir zum Beispiel P3 eliminieren. Wir sind nun bei #Cl(K) ≤ 8 angekommen. Aber es gibt noch weitere Kollisionen denn [P2 ] = [P3 ]−1 = [P3 ]−1 [3ZK ] = [P3 ]−1 [P33 ] = [P32 ]. Also ist P32 überflüssig und wir haben #Cl(K) ≤ 7. Nun [P23 ] = [P3 ]6 = [3ZK ]2 = 1. Somit können wir P23 eliminieren und erhalten #Cl(K) ≤ 6. Schlussendlich ist [P22 ] = [P3 ]4 = [3ZK ][P3 ] = [P3 ] und P22 muss nicht berücksichtigt werden. Daher #Cl(K) ≤ 5. Behauptung: Das Ideal P3 ist kein Hauptideal. Falls P3 ein Hauptideal wäre, so gäbe es ein Element in ZK der Norm ±N (P3 ) = ±3. Ein solches Element hat die Form a + b71/3 + c(71/3 )2 mit a, b, c ∈ Z und Norm a3 + 7b3 + 72 c3 − 21abc = ±3 wegen Serie 2 Aufgabe 5(iii). Reduziert man diese Gleichheit modulo 7 so erhält man a3 = ±3 mod 7. Dies ist aber unmöglich. Also folgt unsere Behauptung. Wir schliessen, dass Cl(K) nicht trivial ist, also #Cl(K) ≥ 2. Wegen [P3 ]3 = 1 muss [P3 ] Ordnung 3 haben. Deshalb gilt 3|#Cl(K). Da #Cl(K) ≤ 5 gibt es nur die Möglichkeit #Cl(K) = 3. Wir folgern, dass Cl(K) zu Z/3Z isomorph ist und von P3 erzeugt wird. 61 3. Klassen- und Einheitengruppe Die Form der Konstante CK hat auch theoretische Konsequenzen. Korollar 3.19. Sei K ein Zahlkörper mit d = [K : Q]. Es gilt |∆K | ≥ (π/2)2[d/2] wobei [·] die Gaussklammer ist. Beweis. Sei (r, s) die Signatur von K. Sicherlich haben wir s ≤ [d/2]. Wir wenden Proposition 3.17 auf I = ZK an. Es gibt also a ∈ ZK r {0} mit |NK/Q (a)| ≤ CK . Da a 6= 0 ist NK/Q (a) ∈ Z r {0}. Also haben wir die (triviale) untere Schranke s d! 4 1 ≤ |NK/Q (a)| ≤ CK = d |∆K |1/2 . d π Daraus schliessen wir |∆K |1/2 ≥ π [d/2] π [d/2] d d d d π [d/2] · · · d d ··· ≥ 2[d/2] = . 1 d 4 4 2 +1 2 2 |{z} |{z} |{z} | {z } ≥2 ≥1 ≥2 ≥1 Die Diskriminante geht also gegen unendlich im Grad da π > 2. Bemerkung 3.20. Für jeden Zahlkörper K und jede Primzahl p ≥ 2 gilt: p verzweigt in K genau dann, wenn p|∆K . Wir haben dies nur für monogene Körper bewiesen, siehe Satz 2.10. Falls K 6= Q so gilt d ≥ 2 und |∆K | ≥ (π/2)2 > 2 wegen dem Korollar oben. Also verzweigt in jedem Zahlkörper ungleich Q mindestens eine Primzahl. 3.3. Dirichlets Einheitensatz Wir werden mit Geometrie der Zahlen auch die Einheitengruppe Z× K eines Zahlkörpers K untersuchen. Ziel dieses Abschnitts ist es, die Struktur von Z× aufzuklären. K Satz 3.21. Sei K ein Zahlkörper der Signatur (r, s). Dann gibt es eine ganze Zahl w ≥ 1 r+s−1 ∼ mit Z× . Insbesondere ist Z× K = (Z/wZ) × Z K endlich erzeugt. In diesem Abschnitt fixieren wir einen Zahlkörper K und (r, s) wie im Satz. Desweiteren setzen wir d = r + 2s = [K : Q]. Definition 3.22. Seien σ1 , . . . , σr : K → R die reellen Einbettungen von K und σr+1 , . . . , σr+s : K → C komplexe Einbettungen die paarweise nicht komplex konjugiert sind. Wie üblich setzen wir σr+s+i = σr+i für 1 ≤ i ≤ s. Für u ∈ Z× K definieren wir L(u) = (log |σ1 (u)|, . . . , log |σr (u)|, 2 log |σr+1 (u)|, . . . , 2 log |σr+s (u)|). r+s Dies ist ein Gruppenhomomorphismus L : Z× . K → R Das nächste Lemma gibt erste Informationen über L. Lemma 3.23. Wie verwenden dieselbe Notation wie eben. 62 3.3. Dirichlets Einheitensatz (i) Es gilt r+s L(Z× : x1 + · · · + xr+s = 0}. K ) ⊆ {(x1 , . . . , xr+s ) ∈ R (ii) Der Kern Ker(L) ist endlich. (iii) Sei B ∈ R. Im Bild L(Z× K ) gibt es höchstens endliche viele Elemente mit Maximumsnorm höchstens B. Beweis. Sei u ∈ Z× K . Wir wissen, dass NK/Q (u) = ±1, da u eine Einheit ist. Andererseits impliziert Lemma 1.7 1 = |NK/Q (u)| = |σ1 (u)| · · · |σr+2s (u)| = |σ1 (u)| · · · |σr (u)||σr+1 (u)|2 · · · |σr+s (u)|2 . Teil (i) folgt in dem man den Logarithmus nimmt. Falls u in Ker(L) liegt, so gilt |σi (u)| = 1 für 1 ≤Qi ≤ r + s und natürlich auch für r + s + 1 ≤ i ≤ r + 2s = d. Wir betrachten P = di=1 (T − σi (u)) als Polynom in T . Sicherlich gilt P ∈ Q[T ] und sogar P ∈ Z[T ]. Wir schreiben P = T d + a1 T d−1 + · · · + ad mit ai ∈ Z. Es gilt zum Beispiel a1 = −(σ1 (u) + · · · + σd (u)) also |a1 | ≤ d. Ebenso haben wir ad = ±σ1 (u) · · · σd (u) und somit |ad | = 1. Jedes ai ist ein symmetrisches Polynom in σ1 (u), . . . , σd (u). Es ist nun nicht schwierig zu zeigen, dass jedes |ai | nur in Funktion von d beschränkt ist. Also gibt es nur endlich viele Möglichkeiten für die ai . Es gibt auch nur endlich viele P . Aber P (u) = 0 und jedes Polynom hat höchstens endlich viele Nullstellen. Es folgt Teil (ii). Der Teil (iii) ist ganz ähnlich wie (ii). Es reicht zu zeigen, dass die Menge L(Z× K) ∩ {(x1 , . . . , xr+s ) : |xi | ≤ B für 1 ≤ i ≤ r + s} endlich ist. Aber falls L(u) = (x1 , . . . , xr+s ) und |xi | ≤ B dann gilt log |σi (u)| ≤ eB . Die ai aus Teil (ii) haben Absolutbetrag welcher in Funktion von d und B beschränkt ist. Es gibt also wieder nur endliche viele P wie in (ii). Daraus folgt (iii). Wir haben eine kurze exakte Sequenz 1 → Ker(L) → Z× K → L(ZK ) → 0. Als nächstes zeigen wir eine “Hälfte” von Satz 3.21. Lemma 3.24. Die Gruppe Z× K ist endliche erzeugt von Rang höchstens r + s − 1. Beweis. Sei V ⊆ Rr+s der R-Vektorraum, der von L(Z× K ) erzeugt wird. Aus Lemma 3.23(i) folgt m = dim V ≤ r + s − 1. Wir wählen eine Basis (v1 , . . . , vm ) von V mit vi ∈ L(Z× K ) für 1 ≤ i ≤ m. Die Gruppe ) ist frei und hat Rang m. Λ = v1 Z + · · · + vm Z ⊆ L(Z× K Behauptung: Der Index [L(Z× K ) : Λ] ist endlich. (k) (k) × Falls die Faktorgruppe L(ZK )/Λ unendlich wäre, gäbe es eine unendliche Folge (ξ1 , . . . , ξr+s ) ∈ (k) (k) [0, 1)r+s (mit k ≥ 1) paarweise verschiedener Vektoren mit v1 ξ1 +· · ·+vr+s ξr+s ∈ L(Z× K ). × Das sind aber unendlich viele Vektoren in L(ZK ) mit beschränkter Norm. Dies widerspricht (iii) von Lemma 3.23. 63 3. Klassen- und Einheitengruppe × Sei N = [L(Z× K ) : Λ]. Aus Gruppentheorie folgt N L(ZK ) ⊆ Λ. Also L(Z× K) ⊆ 1 Λ. N Da N1 Λ endlich erzeugt von Rang m ist, ist nach dem Struktursatz für endlich erzeugte Z-Moduln L(Z× K ) endlich erzeugt mit Rang höchstens m ≤ r + s − 1. Wir müssen aber nun zeigen, dass der Rang von Z× K mindestens r + s − 1 ist. Die Schwierigkeit dabei ist es, nicht-triviale Einheiten zu konstruieren, falls r + s − 1 ≥ 1. Lemma 3.25. Es gibt eine Konstante C > 0 mit folgender Eigenschaft. Sei k ∈ Z mit 1 ≤ k ≤ r + s. Für jedes a ∈ ZK r {0} gibt es ein b ∈ ZK r {0}, so dass |NK/Q (b)| ≤ C und |σi (b)| < |σi (a)| falls i ∈ {1, . . . , r + s} r {k}. Weiterhin ist die Wahl C = 2s+1 π −s |∆K |1/2 zulässig. Beweis. Sei Ψ : ZK → Rd die Abbildung von Abschnitt 3.2. Also Ψ(a) = (σ1 (a), . . . , σr (a), Re σr+1 (a), Im σr+1 (a), . . . , Re σr+s (a), Im σr+s (a)) ∈ Rd . Wir beweisen das Lemma im Fall k = 1 ≤ r. Dies vereinfach die Notation etwas, der allgemeine Fall folgt durch eine entsprechende Anpassung der Indizes. Sei s 2 |σ1 (a)| 1/2 0 |∆K | >0 C =2 |NK/Q (a)| π Wir wenden Geometrie der Zahlen auf E = {(x1 , . . . , xr , xr+1 , yr+1 , . . . , xr+s , yr+s ) ∈ Rd :|x1 | < C 0 , |xi | < |σi (a)| für 2 ≤ i ≤ r, |x2i + yi2 | < |σi (a)|2 für r ≤ i ≤ s}. an. Es ist eine konvexe und symmetrische Teilmenge von Rd mit Lebesgue Mass µ(E) = 2r π s |NK/Q (a)| 0 C = 2r+s+1 |∆K |1/2 . |σ1 (a)| Lemma 3.14(i) zeigt det Ψ(ZK ) = 2−s |∆K |1/2 . Wir haben also µ(E) = 2d+1 det Ψ(ZK ) > 2d det Ψ(ZK ). Nach Minkowskis Gitterpunktsatz, Satz 3.9, existiert b ∈ ZK r {0} mit Ψ(b) ∈ E. Aus der Definition von E erhalten wir |NK/Q (b)| ≤ C 0 |NK/Q (a)| 2s+1 = s |∆K |1/2 |σ1 (a)| π und |σi (b)| < |σi (a)| für i 6= 1, was zu zeigen war. 64 3.3. Dirichlets Einheitensatz Bis jetzt haben wir noch keine Einheiten gefunden. Das ändert sich im nächsten Lemma. Lemma 3.26. Sei k ∈ Z mit 1 ≤ k ≤ r + s. Es existiert u ∈ Z× K mit L(u) = (x1 , . . . , xr+s ) und xi < 0 für i ∈ {1, . . . , r + s} r {k}. Beweis. Wir wenden Lemma 5.66 auf a1 = 1 an. Es gilt also a2 ∈ ZK r {0} mit |NK/Q (a2 )| ≤ C und |σi (a2 )| < |σi (a1 )| = 1 für i 6= k. Nun wenden wir Lemma 5.66 auf a2 an und erhalten a3 ∈ ZK r {0} mit den gewünschten Eigenschaften. Dieser Schritt wird induktiv wiederholt. Wir erhalten eine Folge {aj : j ≥ 1} ⊆ ZK r{0} mit beschränkter Norm und |σi (ah )| < |σi (aj )| falls h > j und i 6= k. Die Elemente der Idealfolge aj ZK haben durch C beschränkte Norm. Nun gibt es nach Serie 7, Aufgabe 1 nur endlich viele Ideale in ZK mit beschränkter Norm. Also gibt es h > j mit ah ZK = aj ZK . Daraus folgt, dass u = ah /aj ∈ Z× K. Weiterhin haben wir |σi (u)| < 1 für i 6= k. Wir kommen nun zum Beweis von Satz 3.21. Wir wissen bereits von Lemma 3.24, dass × m ∼ × Z× K = (ZK )tors × Z mit m ≤ r + s − 1 und dass (ZK )tors eine endliche Gruppe ist. Jede endliche Untergruppe der multiplikativen Gruppe eines Körpers ist zyklisch. Deshalb ∼ gilt (Z× K )tors = Z/wZ für ein w ∈ N. Es reicht also zu zeigen, dass m ≥ r + s − 1. Dazu wenden wir Lemma 3.26 auf k = 1, . . . , r + s an und erhalten u1 , . . . , ur+s ∈ Z× K mit |σi (uk )| < 1 falls i 6= k. Um m ≥ r + s − 1 zu beweisen, reicht es zu zeigen, dass die Matrix L(u1 ) ∗ <0 .. ... [αij ]1≤i,j≤r+s = = ∈ Matr+s (R) . L(ur+s ) <0 ∗ Rang mindestens r + s − 1 hat. Die Elemente ausserhalb der Diagonale sind negativ. Da die Norm einer Einheit ±1 ist, ist die Summe über eine Zeile gleich Null. Also sind die Elemente auf der Diagonale nicht negativ. Wir zeigen, dass die ersten r + s − 1 Spalten R-linear unabhängig sind. Wir nehmen Pr+s−1 also an, dass j=1 αij λj = 0 für 1 ≤ i ≤ r + s mit (λ1 , . . . , λr+s−1 ) ∈ Rr+s−1 r {0}. Daraus wird sich ein Widerspruch ergeben. Dazu wählen wir k, so dass λk maximalen Absolutbetrag unter den λ1 , . . . , λr+s−1 hat. Nach Normierung gilt ohne Einschränkung der Allgemeinheit λk = 1. Also λj ≤ 1 für alle j ∈ {1, . . . , r + s − 1}. Wir erhalten 0= r+s−1 X j=1 αkj λj = αkk λk + |{z} |{z} ≥0 =1 r+s−1 X αkj λj ≥ |{z} |{z} j=1, j6=k <0 ≤1 r+s−1 X αkj = −αk,r+s j=1 da die Summe über eine Zeile von [αij ] Null ergibt. Aber −αk,r+s > 0 und das ist ein Widerspruch. Korollar 3.27. Die einzigen Zahlkörper mit endlicher Einheitengruppe sind Q und √ Q( m) mit m ∈ Z quadratfrei und m < 0. 65 3. Klassen- und Einheitengruppe Beweis. Sonst ist r + s − 1 ≥ 1. √ Beispiele 3.28. Sei K = Q( m) mit m ∈ Z quadratfrei und m > 0. Satz 3.21 impliziert × ∼ dass Z× K = (Z/wZ) × Z mit w ∈ N. Da K eine reelle Einbettungen hat, muss (ZK )tors = × k {±1} und w = 2 sein. In anderen Worten: es existiert η ∈ K mit ZK = {±η : k ∈ Z}. √ √ √ 2)(1 − 2) = −1. In den Übungen wird (i) Falls m = 2 so√ist 1 + 2 ∈ Z× K da (1 + Z× 2)k : k ∈ Z} bewiesen. K = {±(1 + (ii) Ein Erzeuger η wie oben kann schon für relative kleine m kompliziert sein. Falls √ k K = Q( 67) ist Z× K = {±η : k ∈ Z} mit √ η = 48842 + 5967 67. 66 4. Fermats Letzter Satz – ein Spezialfall Wir werden jetzt eine längere Anwendung der bisherigen Theorie anschauen. Es handelt sich dabei um den ersten Fall von Fermats letztem Satz für “reguläre” Exponenten. Definition 4.1. Eine Primzahl p ≥ 3 heisst regulär, falls p - #Cl(K) für den p-ten Kreisteilungskörper K. Beachte, dass 2 nicht regulär ist obwohl 2 - #Cl(Q) = 1. Beispiele 4.2. (i) Wir wissen, dass #Cl(K) = 1 falls K der 3-te oder 5-te Kreisteilungskörper ist. Also sind 3 und 5 reguläre Primzahlen. (ii) Sei K der 37-te Kreisteilungskörper. Dann gilt Cl(K) ∼ = Z/37Z (wir werden dies nicht beweisen können). Also ist 37 keine reguläre Primzahl. Es ist die kleinste nicht reguläre Primzahl. (iii) Man kann zeigen, dass es unendlich viele Primzahlen gibt die nicht regulär sind. (iv) Es ist ein offenes Problem ob es endlich oder unendlich viele reguläre Primzahlen gibt. Die allgemein akzeptierte Vermutung besagt, dass es unendlich viele gibt. Satz 4.3. Sei p ≥ 3 eine reguläre Primzahl. Falls xp + y p = z p mit x, y, z ∈ Z dann gilt p | xyz. Bemerkung 4.4. Dies ist der sogenannte erste Fall für reguläre Primzahlen. Der zweite Fall besagt, dass falls xp + y p = z p mit x, y, z ∈ Z und p | xyz dann gilt xyz = 0. Der zweite Fall für reguläre Primzahlen ist einiges schwieriger zu beweisen. Wir werden uns nur mit dem ersten Fall beschäftigen. Wir werden im aktuellen Abschnitt die folgende Notation verwenden. Es sei p ≥ 3 eine reguläre Primzahl und K der p-te Kreisteilungskörper. Zur Erinnerung, es gilt K = Q[T ]/ (1 + T + · · · + T p−1 ) Q[T ]. Wir schreiben ζ für das Bild von T in K. Dann {z } | =A gilt ζ p = 1 und K = Q(ζ). Wir haben in Kapitel 2.3 einige Eigenschaften von K kennengelernt und bewiesen. Es gilt [K : Q] = p − 1, ZK = Z[ζ], ∆K = ±pp−2 und K hat Signatur (r, s) = (0, (p − 1)/2). Wir werden nun ein wichtiger Unterkörper von K bestimmen. 67 4. Fermats Letzter Satz – ein Spezialfall Definition 4.5. Betrachte den Ringhomomorphismus Q[T ] −→Q[T ] −→Q[T ]/AQ[T ] = K T 7→ T p−1 7→ T p−1 + AQ[T ]. Das Bild von A ist A(T p−1 ). Da ζ, . . . , ζ p−1 genau die Nullstellen von A sind, ist ζ eine Nullstelle von A(T p−1 ). Wir schliessen, dass A | A(T p−1 ). Also erhalten wir einen Ringhomomorphismus · : K → K. Da K ein Körper ist folgt, dass · injektiv ist. Betrachtet man K als Q-Vektorraum der Dimension p − 1, so stellen wir fest, dass es ein Körperautomorphismus ist. Wir haben ζ = ζ p−1 = ζ −1 . Bemerkung 4.6. Man soll sich · wie komplex konjugieren vorstellen. Sei σ : K → C eine Einbettung. Dann gilt σ(ζ) = e2πik/p für ein k ∈ Z. Wir berechnen σ(ζ) = e−2πik/p = σ(ζ)−1 = σ(ζ). Beachte, dass im ersten Ausdruck · auf C komplex konjugieren ist. Im letzten Ausdruck ist · der Automorphismus von K wie er oben definiert wurde. Das Diagramm K σy · −−−→ K yσ C −−−−−−−→ C. kompl.Konj. kommutiert. k Lemma 4.7. Es gilt (Z× K )tors = {±ζ ; k ∈ Z mit 0 ≤ k ≤ p − 1}. Beweis. Wir wissen, dass G = (Z× K )tors eine zyklische Gruppe ist. Da diese die Unterk gruppe {±ζ ; k ∈ Z mit 0 ≤ k ≤ p − 1} der Ordnung 2p enthält, ist G zu Z/(2pw)Z isomorph mit w ∈ N. Wir müssen w = 1 beweisen. Dazu nehmen wir w > 1 an und folgern einen Widerspruch. Sei l ein Primteiler von w. Es gibt drei Fälle. Fall 1: Es gilt l = 2. √ −1 ∈ Dann haben √ wir 4 | #G. Also enthält G ein Element der Ordnung 4. Das heisst, √ √ √ 2 2 K und so Q( −1) ⊆ K. Es gilt 2 −1 = (1 + −1) , also 2ZK = ((1 + −1)ZK ) . Insbesondere verzweigt 2 in K. Aber Korollar 2.27 besagt, dass p 6= 2 die einzige Primzahl ist, die in K verzweigt. Wir haben den Widerspruch. Fall 2: Es gilt l 6= 2 und l 6= p. Dieser Fall ist ähnlich. Da l | #G gibt es ξ ∈ K mit ξ l = 1 und ξ 6= 1. Wie im Beweis von Lemma 2.24 stellen wir fest, dass (1 − ξ)l−1 = ul für eine Einheit u ∈ Z× K . Auf der Stufe von Hauptideale gilt ((1 − ξ)ZK )l−1 = lZK , also ist l in K verzweigt und dies widerspricht Korollar 2.27, da l 6= p. Fall 3: Es gilt l = p 6= 2. 68 Dieser Fall muss auf andere Art behandelt werden. Wir wissen, dass p2 | #G. Also gibt 2 es ξ ∈ K mit ξ p = 1 aber ξ p 6= 1. Das heisst, ξ hat Ordnung p2 . Man rechnet leicht nach, dass 2 p−1 p(p−1) p T p − 1 = (T − 1)(T + · {z · · + T + 1})(T + T p(p−2) | | {z + · · · + T + 1}) =B=A(T p ) =A 2 gilt. Da ξ p − 1 = 0 und ξ p 6= 1 folgt B(ξ) = A(ξ p ) = 0. Wir wissen, dass A(T + 1) ≡ T p−1 (mod p) gilt. Also haben wir B(T + 1) ≡ A((T + 1)p ) ≡ A(T + 1)p ≡ T (p−1)p (mod p). Weiterhin ist der konstante Term von B(T + 1) gleich B(1) = A(1) = p. Das Eisensteinsche Kriterium impliziert, dass B irreduzibel in Z[T ] ist. Wegen dem Gauss Lemma ist es sogar in Q[T ] irreduzibel. Deshalb gilt [Q(ξ) : Q] = p(p − 1). Aber dieser Grad ist höchstens [K : Q] = p − 1 da K ⊇ Q(ξ). Somit haben wir den Widerspruch gefunden. × r Lemma 4.8. Sei u ∈ Z× K . Es gibt v ∈ ZK und r ∈ Z mit u = ζ v und v = v. Beweis. Sei · der Körperautomorphismus von K, den wir oben definiert haben. Dieser fixiert Q, das heisst es gilt x = x für x ∈ Q. Falls P ∈ Z[T ] das Q-Minimalpolynom von u ist, so gilt 0 = P (u) = P (u). Daher ist P auch das Q-Minimalypolynom von u. Nun ist u ein Einheit, deshalb ist ihre Norm ±1 = ±P (0), siehe Lemma 1.7. Folglich ist die Norm von u auch ±1 und daher muss u eine Einheit sein. Insbesondere ist α = uu−1 ∈ Z× K. −1 Sei σ : K → C eine Einbettung. Dann ist σ(α) = σ(u)σ(u) und so |σ(α)| = 1. (p−1)/2 Sei L : Z× der Gruppenhomomorphismus von Abschnitt 3.3. Dann ist L(α) = K → Z 0. Wir wissen aber, dass der Kern von L eine endliche Gruppe ist wegen Lemma 3.23(ii). × Somit hat α als Element der Gruppe Z× K endliche Ordnung, d.h. α ∈ (ZK )tors . Aus Lemma 4.7 folgt α = ±ζ k für ein k ∈ Z. Wir nehmen zunächst an, dass α = −ζ k gilt. Da ZK = Z[ζ] gibt es b0 , . . . , bp−2 ∈ Z mit u = b0 + b1 ζ + · · · + bp−2 ζ p−2 . Da (1 − ζ i )/(1 − ζ) eine Einheit ist für 0 ≤ i ≤ p − 1 (siehe Beweis von Lemma 2.24(i)) haben wir u − (b0 + · · · + bp−2 ) ≡ b1 (ζ − 1) + · · · + bp−2 (ζ p−2 − 1) ∈ (1 − ζ)ZK . Wir erhalten u ≡ b0 + · · · + bp−2 (mod (1 − ζ)ZK ) und mit einer ähnlichen Rechnung u ≡ b0 + · · · + bp−2 (mod (1 − ζ)ZK ). Somit ist u ≡ u (mod (1 − ζ)ZK ). Die Annahme u = −uζ k impliziert u(1+ζ k ) ≡ 0 (mod (1−ζ)ZK ). Nun ist 1+ζ k eine Einheit für ζ k 6= 1, cf. Übungsblatt 9, Aufgabe 1. aber (1 − ζ)ZK hat Norm p, cf. den Beweis von Lemma 2.26. Somit muss 1 + ζ k = 2 gelten und damit (1 − ζ)ZK das Hauptideal 2uZK = 2ZK . Insbesondere teilt p = N ((1 − ζ)ZK ) die Norm N (2ZK ) = 2p−1 , ein Widerspruch. Wir folgern, dass α = ζ k gilt. Also u = ζ k u. Da p 6= 2 gibt es r ∈ Z mit 2r ≡ k (mod p). Wir definieren v = ζ −r u und berechnen v = ζ r u = ζ r−k u = ζ 2r−k v = v. Natürlich gilt u = ζ r v. Das Lemma folgt, da v eine Einheit ist. 69 4. Fermats Letzter Satz – ein Spezialfall Nun können wir Satz 4.3 beweisen. Wir behalten dabei die Notation p, K, . . . bei. Weiterhin seien x, y, z ∈ Z mit xp + y p = z p . Wir nehmen p - xyz an und werden ein Widerspruch herleiten. Wir werden nun einige Reduktionsschritte durchführen bevor wir zum Hauptargument kommen. (i) Ohne Einschränkung können wir p ≥ 5 annehmen. Denn falls p = 3 findet man a3 ≡ ±1 (mod 9) für jede ganze Zahl a ∈ Z, die nicht durch 3 teilbar ist. Also haben wir x3 + y 3 ≡ 0, ±2 (mod 9). Ein Widerspruch. [Bemerkung: Es gilt 17 + 307 ≡ 317 (mod 49) also können wir Satz 4.3 nicht ohne weiteres mittels “modulo p2 ” beweisen.] (ii) Ohne Einschränkung können wir ggT(x, y, z) = 1 annehmen, da wir x, y, z durch einen gemeinsamen Teiler dividieren dürfen. (iii) Ohne Einschränkung gilt x 6≡ y (mod p). Um das zu sehen, zeigen wir zuerst, dass x ≡ y ≡ −z (mod p) unmöglich ist. Denn sonst würde −2z p ≡ 2(−z)p ≡ 2xp ≡ xp + y p ≡ z p (mod p) und somit p | 3z p gelten. Letztere Aussage ist unmöglich da p - z und p ≥ 5. Also gilt entweder x 6≡ y (mod p) (und somit ist der Reduktionsschritt beweisen) oder y 6≡ −z (mod p). Im zweiten Fall ersetzen wir die ursprüngliche Gleichung durch y p + (−z)p = (−x)p . Es gilt z p = Qp−1 i=0 (x + ζ i y) und entsprechend für Hauptideale haben wir (zZK )p = p−1 Y (x + ζ i y)ZK . {z } | i=0 =Ii Behauptung: Falls i, j ∈ {0, . . . , p − 1} mit i 6= j dann sind die Ideale Ii und Ij teilerfremd. Beweis: Wir nehmen an, dass ein Primideal P 6= 0 von ZK sowohl Ii wie auch Ij teilt. Daraus wird sich ein Widerspruch ergeben. Es gilt also x + ζ i y, x + ζ j y ∈ P und damit (x + ζ i y) − (x + ζ j y) = ζ i (1 − ζ i−j )y ∈ P . Wir haben also P | (1 − ζ i−j )ZK yZK und da P ein Primideal ist, gilt P | (1 − ζ i−j )ZK oder P | yZK . Beachte, dass (1 − ζ i−j )ZK = (1 − ζ)ZK , dies folgt da (1 − ζ i−j )/(1 − ζ) ∈ Z× K (siehe den Beweis Lemma 2.24). Analog können wir y wegkürzen und finden ζ j (x + ζ i y) − ζ i (x + ζ j y) = ζ j (1 − ζ i−j )x ∈ P . Genauso wie vorhin ergibt sich P | (1 − ζ)ZK oder P | xZK . Was passiert falls P - (1 − ζ)ZK ? Dann muss P sowohl xZK wie auch yZK teilen. Die Norm von P ist le mit l ≥ 2 eine Primzahl und e ≥ 1. Es folgt l | x und l | y und somit auch l | z da z p = xp + y p . Dies widerspricht der Annahme, dass x, y, z teilerfremd sind. 70 Also muss P | (1 − ζ)ZK gelten. Aber (1 − ζ)ZK ist ein Primideal mit Norm p.1 Es gilt P = (1 − ζ)ZK und daher x + y ≡ x + ζ i y ≡ 0 (mod P ). Also x + y ∈ P ∩ Z = pZ und somit x + y ≡ 0 (mod p). Wir erhalten z p ≡ xp + y p ≡ (x+y)p ≡ 0 (mod p) und somit ist z durch p teilbar (wir sind im ersten Fall). Das ist ein Widerspruch. Die Behauptung dass I0 , . . . , Ip−1 paarweise teilerfremd sind, ist bewiesen. Nun ist I0 · · · Ip−1 gleich (zZK )p , eine p-te Potenz, also ist jeder Faktor eine p-te Potenz. Also gibt es Ideale J0 , . . . , Jp−1 ⊆ ZK mit Jip = Ii für jedes i ∈ {0, . . . , p − 1}. Jetzt kommt der entscheidende Schritt. Jedes Ii ist ein Hauptideal (x + yζ i )ZK . Deshalb gilt in der Klassengruppe [Ji ]p = [Jip ] = [Ii ] = 1. Also hat [Ji ] als Element von Cl(K) Ordnung 1 oder p. Nun kann die Ordnung nicht p sein, da diese Primzahl die Kardinalität von Cl(K) nicht teilt. Also ist [Ji ] trivial und daher ist Ji ein Hauptideal αi ZK mit αi ∈ ZK für jedes i. Wir werden ab jetzt mit i = 1 weiterarbeiten. Wir schreiben α = α1 . Es gilt αp ZK = (x + ζy)ZK . Leider folgt daraus nicht, dass x + ζy und αp gleich sind. p Aber es gibt auf jeden Fall ein u ∈ Z× K mit x + ζy = uα . × Wegen Lemma 4.8 gibt es v ∈ ZK und r ∈ Z mit u = ζ r v und v = v. Da ZK = Z[ζ] gibt es b0 , . . . , bp−2 mit α = b0 + b1 ζ + · · · + bp−2 ζ p−2 . Modulo pZK gilt αp ≡ bp0 + · · · + bpp−2 (mod pZK ). | {z } =:a Hier ist entscheidend, dass a eine ganze Zahl ist. Wir erhalten x+ζy ≡ ζ r va (mod pZK ) und so ζ −r x + ζ 1−r y ≡ va (mod pZK ). (4.1) Falls wir den Automorphismus · : K → K anwenden erhalten wir r x + ζy ≡ ζ va (mod pZK ); hierzu verwenden wir a ∈ Z, also insbesondere a = a. Zur Erinnerung gilt ζ = ζ −1 und v = v. Also ζ r x + ζ r−1 y ≡ va (mod pZK ). (4.2) Gleichungen (4.1) und (4.2) zusammen ergeben x + ζy − ζ 2r x − ζ 2r−1 y ≡ 0 (mod pZK ). Also folgt 1 x y x y + ζ − ζ 2r − ζ 2r−1 ∈ ZK . p p p p (4.3) Beweis von Lemma 2.26. 71 4. Fermats Letzter Satz – ein Spezialfall Nehmen wir zunächst an, dass 1, ζ, ζ 2r , ζ 2r−1 paarweise verschieden sind. Dann sind diese vier Elemente Teile einer Z-Basis von ZK = Z[ζ]. In diesem Fall impliziert (4.3) dass p | x und p | y. Wie oben folgt p | z, also sind x, y, z nicht teilerfremd. Ein Widerspruch. Aus dem Paragraph oben folgt, dass mindestens zwei unter 1, ζ, ζ 2r , ζ 2r−1 übereinstimmen. Sicherlich gilt ζ 6= 1 und ζ 2r 6= ζ 2r−1 . Aber was passiert falls ζ 2r = 1? Gleichung (4.3) impliziert (ζ − ζ −1 )y/p ∈ ZK . Da ζ 2 6= 1 sind ζ, ζ −1 = ζ p−1 Teile einer Z-Basis von ZK . Es folgt p | y, ein Widerspruch. Die zwei Gleichungen 1 = ζ 2r−1 und ζ = ζ 2r sind äquivalent. Ist einer dieser Gleichungen erfüllt, so sagt uns (4.3), dass (x − y)/p − ζ(x − y)/p ∈ ZK . Wie oben folgt p | x − y oder x ≡ y (mod p). Dies widerspricht Reduktionsschritt (iii). Der letzte Fall ist ζ = ζ 2r−1 . Aus (4.3) erhält man x(1 − ζ 2 )/p ∈ ZK . Wiederum folgt p | x und das ist ein Widerspruch. Dies beendet alle möglichen Fälle. Der Beweis von Satz 4.3 ist vollendet. 72 Teil II. Der Satz von Mordell-Weil 73 Zum Schluss wenden wir uns dem Satz von Mordell-Weil zu. Wir setzen dafür die bis jetzt entwickelten Methoden aus der Theorie der elliptischen Kurven und der algebraischen Zahlentheorie voraus. Satz 4.9 (Mordell-Weil). Sei K ein Zahlkörper und E eine elliptische Kurve, die über K definiert ist. Dann ist E(K) ein endlich erzeugte abelsche Gruppe, d.h. E(K) ∼ = T × Zr für eine ganze Zahl r ≥ 0 und eine endliche Gruppe T . Ein wichtiges Hilfsmittel im Beweis dieses Satzes ist die sogenannte kanonische oder Néron-Tate Höhe auf E(K). Dies ist eine Abbildung E(K) → [0, +∞), welche die “arithmetische Komplexität” von Punkten in E(K) misst. Wir werden sie im Laufe des nächsten Kapitels einführen. 75 5. Höhenfunktionen 5.1. Die Weil Höhe Bevor wir von Höhen auf elliptischen Kurven sprechen, werden wir die sogenannte Weil Höhe auf einem Zahlkörper einführen. Die grundlegende Fragestellung ist die folgende: wie misst man die Komplexität einer rationalen Zahl? Dazu die folgende Aufgabe: man soll die folgende Liste rationaler Zahlen 5/7, 1, 1/2016, 200, 1968/1984, 1.000.000/2.000.000, 1.000.000/2.000.001 in aufsteigender Reihenfolge gemäss eines (sinnvollen) Komplexitätsmasses ordnen. Nun ist a priori nicht klar, wie man Komplexität misst. Eine naheliegendes Mass ist die Anzahl Bits, die ein Computer braucht, um die entsprechende Zahl zu speichern. Diese Überlegung führt zu der folgenden Definition. Definition 5.1. Sei x ∈ Q in gekürzter Form a/b mit a, b ∈ Z teilerfremd und b ≥ 1. Die Weil Höhe oder einfach Höhe von x ist h(x) = log max{|a|, b}. Beispiele 5.2. Es gilt h(5/7) = log 7, h(1) = 0, h(1/2016) = log 2016, h(1968/1984) = log 124 und h(1.000.000/2.000.000) = log 2, h(1.000.000/2.000.001) = log(2.000.001) Bemerkungen 5.3. Bis auf einen multiplikativen Faktor ist h(x) die Anzahl Bits, die es braucht, um die rationale Zahl x zu speichern. In der Literatur wir z.T. auch mit der exponentiellen Höhe eh(x) = max{|a|, b} gearbeitet. Für x, y ∈ Q gelten die folgenden Eigenschaften, die man schnell nachrechnen kann. (i) Es gilt h(x) ≥ 0 und Gleichheit gilt genau dann, wenn x = 0 oder x = ±1. (ii) Für x 6= 0 und k ≥ 0 eine ganze Zahl gilt h(xk ) = kh(x). (iii) Für x 6= 0 gilt h(x−1 ) = h(x). Aus (ii) folgt h(xk ) = |k|h(x). (iv) Es gilt h(xy) ≤ h(x) + h(y). 77 5. Höhenfunktionen (v) Für jede reelle Zahl B ist {x ∈ Q : h(x) ≤ B} eine endliche Menge. Eigenschaften (ii), (iii) und (iv) suggerieren, dass die Höhe kompatibel mit der multiplikativen Gruppe Q× ist. Später werden wir mit Hilfe von h(·) eine Höhe auf einer elliptischen Kurve definieren. Zuerst wollen wir jedoch die Weil Höhe auf Zahlkörper verallgemeinern. Als Motivation dient die folgende Berechnen. Bemerkung 5.4. Sei x = a/b mit a, b ∈ Z teilerfremd und b ≥ 1. Wir nehmen hier x 6= 0 an. Gemäss Definition gilt h(x) = log max{|a|, b} = log (b max{1, |a/b|}) = log (b max{1, |x|}) . e Wir faktorisieren b = pe11 · · · pgg , wobei p1 < p2 < · · · < pg Primzahlen sind und e1 , . . . , eg ∈ N. Für eine Primzahl p sei | · |p der p-adische Absolutbetrag auf Q wie in Abschnitt 3.1, Skript Elliptische Kurven I. Mit dieser Notation gilt |b|p = p−ei = |b/a|p = |x−1 |p < 1 falls p = pi , die zweite Gleichheit folgt, da a und b teilerfremd sind. Weiterhin gilt |b|p = 1, falls p 6∈ {p1 , . . . , pg } und |x−1 |p = |b/a|p = |a|−1 p ≤ 1. Es folgt |x|p = |a/b|p > 1 ⇐⇒ p ∈ {p1 , . . . , pg }. Wir können also b alternativ auch wie folgt ausdrücken Y Y −1 b = |b|−1 max{1, |x|p }, · · · |b| = |x| = p p1 pg p |x|p >1 p dabei laufen beide Produkte über alle Primzahlen. Obwohl es unendlich viele Primzahlen gibt, sind nur endlich viele Faktoren in den Produkten 6= 1. Für die Höhe von x können wir die folgende alternative Formel angeben X h(x) = log max{1, |x|} + log max{1, |x|p } p Diese neue Schreibweise ist der Schlüssel zur Verallgemeinerung auf Q. Dazu müssen wir Absolutbeträge auf Zahlkörper einführen, die die p-adische Absolutbeträge verallgemeinern. Dazu benötigen wir die Primideale. Definition 5.5. Sei K ein Zahlkörper und x ∈ K. 78 5.1. Die Weil Höhe (i) Sei x 6= 0. Für ein Primideal P ⊆ ZK mit P 6= 0 lässt sich das gebrochene Hauptideal xZK als P e I schreiben, wobei P nicht in der Primidealfaktorisierung von I auftaucht und e ∈ Z ist eindeutig durch x und P bestimmt. Wie auf Übungsblatt 4 setzen wir ordP (x) = e. Ist e(P ) der Verzweigungsindex von P und P ∩ Z = pZ mit p ≥ 2 eine Primzahl, so definieren wir |x|P = p−ordP (x)/e(P ) . (5.1) Weiterhin setzen wir |0|P = 0. (ii) Sei σ : K → C ein Ringhomomorphismus. Dann definieren wir |x|σ = |σ(x)|, hierbei ist | · | der Standardabsolutbetrag auf C. Wir definieren M (K) als die Menge {P : 0 6= P ⊆ ZK Primideal} ∪ {σ ein Ringhomomorphismus von K nach C} . {z } | {z } | =M 0 (K) =M ∞ (K) Bemerkungen 5.6. Behalten wir die Notation der Definition bei und ist v entweder ein Primideal ungleich Null von ZK oder ein Ringhomomorphismus K → C, so gelten für x, y ∈ K die folgenden Eigenschaften. (i) Es gilt |x|v ≥ 0 mit Gleichheit genau dann, wenn x = 0. (ii) Es gilt |xy|v = |x|v |y|v . (iii) Es gilt allgemein |x + y|v ≤ |x|v + |y|v und |x + y|v ≤ max{|x|v , |y|v }, falls v ein Primideal ist. Für ein Primideal folgen alle Eigenschaften aus Übungsblatt 4, Aufgabe 3. Für v = σ folgen sie aus den entsprechenden Eigenschaften des Standardabsolutbetrags. Ist v = P ein Primideal ungleich Null, so lässt sich die Division durch e(P ) in (5.1) wie folgt begründen. Für eine Primzahl p ∈ Z ist per Definition e(P1 ) pZK = P1 · · · Pge(Pg ) für Primideale P1 , . . . , Pg ⊆ ZK . Für P = Pi gilt nach (5.1) |p|Pi = p−ordPi (p)/e(Pi ) = p−1 . Also setzt jedes | · |Pi den p-adische Absolutbetrag von Q auf K fort. Für ein Ringhomomorphismus σ : K → C setzt | · |σ den Standardabsolutbetrag von Q auf K fort. Achtung. Zwei zueinander komplex konjugierte Elemente von M ∞ (K) liefern den gleichen Absolutbetrag auf K. In der Literatur werden solche Elemente in M ∞ (K) oft miteinander identifiziert. 79 5. Höhenfunktionen Lemma 5.7. Sei K ein Zahlkörper und x ∈ K × = K r {0}. Es gibt höchstens endlich viele v ∈ M (K) mit |x|v 6= 1. Beweis. Da M ∞ (K) aus [K : Q] Ringhomomorphismen besteht und damit endlich ist, reicht es die Schlussfolgerung für M 0 (K) anstelle von M (K) zu zeigen. Aber in der Primidealfaktorisierung des gebrochenen Ideals xZK tauchen nur endlich viele Primideale auf. Nur diese liefern ein v ∈ M 0 (K) mit |x|v 6= 1. Also folgt unser lemma. Definition 5.8. Sei K ein Zahlkörper und x ∈ K. Wir definieren X X 1 hK (x) = e(P )f (P ) log max{1, |x|P } + log max{1, |x|σ } ≥ 0; [K : Q] ∞ 0 P ∈M (K) σ∈M (K) hierbei ist e(P ) der Verzweigungsindex von P und f (P ) der Restklassengrad von P . Wir schreiben oft d(P ) = e(P )f (P ). Bemerkung 5.9. In der Notation der Definition und für jedes P ∈ M0 (K) sind die Faktoren e(P )f (P ) Normierungskonstanten, deren Bedeutung erst später klar wird. Aus der Wahl der Normierung in Definition 5.5 folgt e(P )f (P ) |x|P = N (P )−ordP (x) , falls x ∈ K × . Beispiele 5.10. (i) Sei d ≥ 1 eine ganze Zahl und x = 21/d . Dann ist x eine Nullstelle des Polynoms X d − 2 (welches nach dem Eisensteinkriterium für p = 2 irreduzibel in Q[X] ist). Insbesondere ist x ganz algebraisch. Sei K ein Zahlkörper, welcher x enthält. Es gibt sogar x ∈ ZK . Wir bestimmen nun |x|v für alle v ∈ M (K). Falls v ∈ M 0 (K), so ist v = P ein Primideal ungleich Null von ZK . Wegen x ∈ ZK ist xZK ein Ideal von ZK und die Exponenten aller Primidealteiler sind nicht negative, d.h. ordP (x) ≥ 0. Es folgt |x|v ≤ 1 und damit log max{1, |x|v } = log 1 = 0. Also liefert v keinen Beitrag zu hK (x). Falls v ∈ M ∞ (K), so ist v = σ : K → C ein Ringhomomorphismus. Wegen σ(x)d = σ(xd ) = σ(2) = 2 gilt |x|σ = |σ(x)| = 21/d . Also log max{1, |x|v } = (log 2)/d. Nun gibt es genau [K : Q] Elemente in M ∞ (K). Nach Definition 5.8 gilt hK (x) = 1 [K : Q] X v∈M ∞ (K) log 2 log 2 = . d d In diesem Beispiel stellen wir fest, dass hK (x) nicht vom Zahlkörper K abhängt. 80 5.1. Die Weil Höhe (ii) Sei x = 1 + 21/4 und K = Q(x). Weil x ein Nullstelle von (X − 1)4 − 2 = X 3 − 4X 3 + 6X 2 − 4X − 1 ist, gilt x ∈ ZK . Wie in (i) stellt man [K : Q] = 4 fest. Um hK (x) zu berechnen, müssen wir wie in (i) also nur σ ∈ M ∞ (K) berücksichtigen. Es gibt genau vier Möglichkeiten für σ und für σ(x) gibt es genau vier Werte in C 1 + 21/4 , 1 + 21/4 i, 1 − 21/4 , 1 − 21/4 i wobei i = e2πi/4 . Wir stellen |1 + 21/4 | > 1, |1 + 21/4 i| = |1 − 21/4 i| > 1, und |1 − 21/4 | < 1 fest. Nach einer kurzen Rechnung finden wir 1 log(1 + 21/4 ) + log |1 + 21/4 i| + log |1 − 21/4 i| 4 1 = log(1 + 21/4 + 22/4 + 23/4 ) 4 1 = − log(21/4 − 1). 4 hK (x) = Wir verfolgen unsere Beobachten in Beispiel 5.10(i) und zeigen nun, dass hK (x) unabhängig von K ist. Genauer, seien K und F Zahlkörper mit x ∈ F und F ⊆ K, so werden wir hK (x) = hF (x) beweisen. Zuerst brauchen wir etwas Vorarbeit. Definition-Lemma 5.11. Seien K und F Zahlkörper mit F ⊆ K. Für ein Ideal I ⊆ ZF definieren wir IZK = {x ∈ K : es gibt n ≥ 0, a1 , . . . , an ∈ I und b1 , . . . , bn ∈ ZK mit x = a1 b1 + · · · + an bn }. Dann ist IZK ein Ideal von ZK . Es ist das kleinste Ideal von ZK , welches I enthält. Beweis. Beide Aussagen folgen direkt aus der Definition. Die eigentliche Schwierigkeit besteht darin, die Norm von I mit der Norm von IZK zu vergleichen. Lemma 5.12. Seien K und F Zahlkörper mit F ⊆ K und I ein Ideal von F . Dann gilt N (IZK ) = N (I)[K:F ] . Beweis. Die Aussage ist klar, falls I = 0, sei also I 6= 0. Wir behandeln zuerst den Fall, wo I = aZF ein Hauptideal ist. Dann ist IZK = aZK . Aus Übungsblatt 5, Aufgabe 2(iii) folgt die zweite und vierte Gleichheit in N (IZK ) = N (aZK ) = |NK/Q (a)| = |NF/Q (a)|[K:F ] = N (aZF )[K:F ] = N (I)[K:F ] , die dritte Gleichheit folgt aus Lemma 1.7. 81 5. Höhenfunktionen Sei nun I 6= 0 ein beliebiges Ideal von ZF . Weil die Klassengruppe von F endliche Ordnung n ≥ 1 besitzt, ist [I]n = [I n ] das neutrale Element in Cl(F ). D.h. I n ist ein Hauptideal von ZF . Für diese Aussage haben wir N (I n ZK ) = N (I n )[F :K] bereits bewiesen. Aber I n ZK = (IZK )n lässt sich leicht überprüfen und aus der Multiplikativität der Norm, cf. Proposition 2.3, folgt N (IZK )n = N (I)n[F :K] . Das Lemma folgt, da wir n im Exponenten kürzen dürfen. Lemma 5.13. Seien K und F Zahlkörper mit F ⊆ K. Für jedes x ∈ F gilt hK (x) = hF (x). Beweis. Für jedes Primideal P 6= 0 von ZF ist P ZK ein Ideal von ZK (jedoch nicht notwendigerweise ein Primideal). Wir faktoriseren es e(P,1) P ZK = P1 e(P,g(P )) · · · Pg(P ) , wobei Pi Primideale von ZK sind. Wir können die Norm von P ZK mit Lemma 5.12 berechnen. Dazu erinnern wir uns an die Definition des Restklassengrads, Definition 2.7, und der Multiplikativität der Norm. Es gilt pf (P )[K:F ] = N (P )[K:F ] = N (P ZK ) = N (P1 )e(P,1) · · · N (Pg(P ) )e(P,g(P )) = pf (P1 )e(P,1)+···+f (Pg(P ) )e(P,g(P )) , wobei p die Primzahl von Z ist, die in P und P liegt. Durch Vergleich der Exponenten erhalten wir f (P )[K : F ] = f (P1 )e(P, 1) + · · · + f (Pg(P ) )e(P, g(P )), (5.2) diese Identität wird später wichtig sein. Um das Lemma zu beweisen, dürfen wir x 6= 0 annehmen. Wir faktorisieren das gebrochene Ideal Y xZF = P ordP (x) P wobei P über alle Primideal ungleich Null von ZF läuft, dabei sind nur endlich viele Exponenten ungleich 0. Aus der Faktorisierung von jedem P in Primideale von ZK folgt ordPi (x) = e(P, i)ordP (x) für alle Primidealteiler Pi von P ZK . Wir können dies wie folgt für die zugehörigen Absolutbeträge ausdrücken e(Pi ) log |x|Pi = e(P, i)e(P ) log |x|P (5.3) wobei die entsprechenden Verzweigungsindizes e(Pi ) und e(P ) auftauchen und wir lediglich Definition (5.5) verwendet haben. 82 5.1. Die Weil Höhe Per Definition von hK (x) gilt X [K : Q]hK (x) = e(P)f (P) log max{1, |x|P } + X log max{1, |σ(x)|} σ∈M ∞ (K) P∈M 0 (K) g(P ) = X X P ∈M 0 (F ) i=1 f (Pi )e(P, i)e(P ) log max{1, |x|P } + X log max{1, |σ(x)|} σ∈M ∞ (K) wobei wir (5.3) nutzten. Die innere Summe über den Index i lässt sich mittels (5.2) vereinfach. Wir erhalten X X [K : Q]hK (x) = [K : F ] e(P )f (P ) log max{1, |x|P } + log max{1, |σ(x)|}. σ∈M ∞ (K) P ∈M 0 (F ) (5.4) Aus der Körpertheorie wissen wir, dass sich jeder Ringhomomorphismus F → C auf genau [K : F ] verschiedene Arten zu einem Ringhomomorphismus K → C fortsetzen lässt. Wegen x ∈ F finden wir X X log max{1, |σ(x)|σ } = [K : F ] log max{1, |σ(x)|}. σ∈M ∞ (K) σ∈M ∞ (K) Ersetzen wir mittels dieser Gleichung die letzte Summe in (5.4) und benutzen wir [K : Q] = [K : F ][F : Q], so finden wir hK (x) = hF (x), was zu zeigen war. Definition 5.14. Für eine algebraische Zahl x definieren wir h(x) = hK (x) für ein Zahlkörper K, welcher x enthält. Wir nennen h(x) die Weil Höhe oder Höhe von x. Bemerkung 5.15. Die zwei Definitionen der Weil Höhe einer rationalen Zahl, Definition 5.1 und 5.14, sind äquivalent. Die Weil Höhe erfüllt ähnliche Eigenschaften wie in Bemerkung 5.3. Die Analoga von (ii) und (iv) folgen sofort aus der Definition. Lemma 5.16. Sei x eine algebraische Zahl. (i) Falls x 6= 0 und falls k ≥ 0 eine ganze Zahl ist, so folgt h(xk ) = kh(x). (ii) Ist y eine weitere algebraische Zahl, so folgt h(xy) ≤ h(x) + h(y). Beweis. Für beide Aussagen benötigen wir die Summezerlegung der Weil Höhe in Definition 5.8. Seien s, t ≥ 0 reelle Zahlen. Teil (i) folgt aus max{1, sk } = max{1, s}k falls s > 0 und Teil (ii) folgt aus max{1, st} ≤ max{1, s} max{1, t}. 83 5. Höhenfunktionen Man kann auch die Weil Höhe einer Summe gegen oben abschätzen. Lemma 5.17. Für algebraische Zahlen x und y gilt h(x + y) ≤ h(x) + h(y) + log 2. Beweis. Sei K = Q(x, y) und v ∈ M (K). Falls v = P ∈ M 0 (K), so gilt |x + y|P ≤ max{|x|P , |y|P } und damit max{1, |x + y|P } ≤ max{1, |x|P } max{1, |y|P }. Falls v = σ ∈ M ∞ (P ) benutzen wir max{1, |x + y|σ } ≤ max{1, |x|σ + |y|σ } ≤ 2 max{1, |x|σ } max{1, |y|σ }. (5.5) Zur Erinnerung gilt #M ∞ (K) = [K : Q]. Für die Weil Höhe erhalten wir [K : Q]h(x + y) = X log max{1, |x + y|P } + X log max{1, |x + y|σ } σ∈M ∞ (K) P ∈M 0 (K) ≤ [K : Q](h(x) + h(y) + log 2), wobei log 2 vom Faktor 2 in (5.5) stammt. Beispiel 5.18. Wir wissen bereits, dass h(0) = h(±1) = 0. Es gibt aber weitere algebraische Zahlen von Höhe Null. Ist ζ eine Einheitswurzel, d.h. ζ n = 1 für eine natürliche Zahl n, so gilt 0 = h(1) = h(ζ n ) = nh(ζ) also h(ζ) = 0. Die Aussage, dass die Weil Höhe Invariant unter Inversenbildung ist, benötigt einen Zwischenschritt. Proposition 5.19 (Produktformel). Sei K ein Zahlkörper und x ∈ K × . Dann gilt Y e(P )f (P ) |x|P Y |x|σ = 1. σ∈M ∞ (K) P ∈M 0 (K) Beweis. Die Norm von x lässt sich mittels Lemma 1.7 mit Hilfe der Ringhomomorphismen K → C bestimmen. Es gilt Y NK/Q (x) = σ(x). σ∈M ∞ (K) Weiterhin gilt N (xZK ) = |NK/Q (x)| wegen Übungsblatt 5, Aufgabe 2(iii), also N (xZK ) = Y σ∈M ∞ (K) 84 |σ(x)| = Y σ∈M ∞ (K) |x|σ . (5.6) 5.1. Die Weil Höhe Nun ist xZK = Q P ∈M 0 (K) P ordP (x) und daher wegen der Multiplikativität der Norm N (xZK ) = Y N (P )ordP (x) . P ∈M 0 (K) Für jedes Primideal P ∈ M 0 (K) gilt wegen der Bemerkung 5.9 die Identität N (P )ordP (x) = Q −e(P )f (P ) −e(P )f (P ) |x|P . Also N (xZK ) = P ∈M 0 (K) |x|P . Das Lemma folgt durch den Vergleich mit (5.6). Die Produktformel ist der Schlüssel zum nächsten Lemma. Lemma 5.20. Sei x 6= 0 eine algebraische Zahl, dann gilt h(x) = h(x−1 ). Weiterhin gilt h(xk ) = |k|h(x) für alle k ∈ Z. Beweis. Die zweite Aussage folgt aus der ersten Aussage zusammen mit Lemma 5.16(i). Sei x wie in der Voraussetzung. Per Definition gilt X X [Q(x) : Q]h(x−1 ) = e(P )f (P ) log max{1, |x|−1 } + max{1, |x|−1 σ } P σ∈M ∞ (K) P ∈M 0 (K) dazu addieren wir 0= X P ∈M 0 (K) X e(P )f (P ) log |x|P + log |x|σ , σ∈M ∞ (K) die Summe verschwindet wegen der Produktformel, Proposition 5.19. Wegen log max{1, t−1 } + log t = log max{1, t} für alle t > 0 erhalten wird h(x−1 ) = h(x), was zu zeigen war. Nun werden wir noch die Analoga von Eigenschaften (i) und (vi) in Bemerkung 5.3 für die Weil Höhe nachweisen. Dazu lohnt es sich ein algebraischer Abschluss Q der rationalen Zahlen zu fixieren. Bemerkung 5.21. Die Endlichkeitsaussage in Bemerkung 5.3 lässt sich nicht direkt auf alle algebraischen Zahlen übersetzen. Die Menge {x ∈ Q : h(x) ≤ 1} (5.7) enthält neben der Null auch alle Einheitswurzeln, cf. Beispiel 5.18. Insbesondere ist (5.7) eine unendliche Menge. Sie enthält wegen Beispiel 5.10(i) auf alle 21/d mit d ≥ 1. In dieser letzten Bemerkung fällt auf, dass sowohl Einheitswurzeln wie auch die Wurzeln 21/d hohen Grad über Q haben. Es gibt einen Ersatz für die Endlichkeitsaussage in Bemerkung 5.3(vi), man muss aber zusätzlich zur Weil Höhe den Grad beschränken. 85 5. Höhenfunktionen Satz 5.22 (Northcott). Seien B und D reelle Zahlen, dann ist x ∈ Q : h(x) ≤ B und [Q(x) : Q] ≤ D eine endliche Menge. Beweis. Sei x ∈ Q mit h(x) ≤ B und [K : Q] ≤ D mit K = Q(x). Zwischenschritt: Es gibt N ∈ N mit N ≤ eDB , so dass N x ∈ ZK . Ohne Einschränkung der Allgemeinheit dürfen wir x 6= 0 annehmen. Wir faktorisieren das gebrochene Ideal xZK = P1−e1 · · · Pg−eg Qf11 · · · Qfl l wobei P1 , . . . , Pg , Q1 , . . . , Ql ⊆ ZK Primideale sind und e1 , . . . , eg , f1 , . . . , fg ≥ 1. Wir e e zeigen, dass N x ∈ ZK für N = N (P1e1 · · · Pg g ). Wegen Lemma 2.1(i) ist N ∈ P1e1 · · · Pg g e und damit N ZK ⊆ P1e1 · · · Pg g . Daher gilt N xZK ⊆ P1e1 · · · Pgeg (xZK ) = Qf11 · · · Qfl l ⊆ ZK und hieraus folgt N x ∈ ZK . Nun müssen wir noch N gegen oben abschätzen. Die Definition der Weil Höhe, zusammen mit Bemerkung 5.9, ergibt X log max{1, N (P )−ordP (x) } + X log max{1, |x|σ } = [K : Q]h(x) ≤ DB. σ∈M ∞ (K) P ∈M 0 (K) (5.8) Die Beiträge von σ ∈ M ∞ (K) sind nicht negativ, wir können sie, da wir nur an einer Ungleichung interessiert sind, also vernachlässigen. Nur die Primideale P1 , . . . , Pg tragen zur Summe über M 0 (K) bei. Wir erhalten log N = log(N (P1 )e1 · · · N (Pg )eg ) ≤ DB, wobei wir die Multiplikativität der Norm verwendet haben. Der Zwischenschritt ist bewiesen. Aus (5.8) folgt |x|σ ≤ eDB für alle σ ∈ M ∞ (K) und somit |z|σ ≤ N eDB ≤ e2DB wobei z = N x. Das Polynom P = Y (X − σ(z)) σ∈M ∞ (K) muss wegen K = Q(x) = Q(z) das Minimalpolynoms über Q von z sein. Also insbesondere P ∈ Q[X]. Wegen Lemma 1.21 und weil z ∈ ZK folgt sogar P ∈ Z[X]. Wir schreiben P = X d − a1 X d−1 + · · · + (−1)d ad mit a1 , . . . , ad ∈ Z und d = [Q(x) : Q] ≤ D. Wie im Beweis von Lemma 3.23 können wir die ai mit Hilfe der Nullstellen gegen 86 5.1. Die Weil Höhe oben abschätzen. Es gilt P = (X − σ1 (z)) · · · (X − σd (z)) mit {σ1 , . . . , σd } = M ∞ (K) und daher |a1 | = |σ1 (z) + · · · + σd (z)| ≤ d max{|σ1 (z)|, . . . , |σd (z)|} ≤ de2DB ≤ De2DB X σi (z)σj (d) ≤ d2 max{|σ1 (z)|, . . . , |σd (z)|}2 ≤ d2 e4DB ≤ D2 e4DB |a2 | = i<j .. . 2 |ad | = |σ1 (z) · · · σd (z)| ≤ e2dDB ≤ e2D B . Wir stellen fest, dass |a1 |, . . . , |ad | rein in Funktion von B und D beschränkt sind. Da es sich um ganze Zahlen handelt, gibt es nur endlich viele Möglichkeiten für a1 , . . . , ad und damit nur endlich viele Möglichkeiten für P . Wegen P (z) = 0 gibt es nur endlich viele Möglichkeiten für z, was zu zeigen war. Der sogenannte Satz von Northcott hat viele Anwendungen in der Zahlentheorie. Wir werden ihn als erstes dazu benutzen, um Bemerkung 5.3(i) auf alle algebraische Zahlen zu verallgemeinern. Wir haben in Beispiel 5.18 gesehen, dass 0 und alle Einheitswurzeln Weil Höhe Null haben. Der Satz von Kronecker ist die Umkehrung. Satz 5.23 (Kronecker). Sei x eine algebraische Zahl mit h(x) = 0. Dann ist x = 0 oder x ist eine Einheitswurzel. Beweis. Aus h(x) = 0 folgt wegen Lemma 5.16(i) ebenfalls h(x) = h(x2 ) = h(x3 ) = · · · = 0. Aber alle Potenzen xk mit k ≥ 0 liegen im Zahlkörper K = Q(x) und insbesondere in {y ∈ Q : h(y) = 0 und [Q(y) : Q] ≤ [Q(x) : Q]}. Diese Menge ist wegen dem Satz von Northcott endlich. Insbesondere existieren Indizes k < l in N mit xk = xl . Falls x 6= 0, so gilt xl−k = 1 und damit ist gezeigt, dass x eine Einheitswurzel ist. Bemerkung 5.24. Wir wissen dass die Weil Höhe nie negativ ist und dass sie genau bei 0 und den Einheitswurzeln verschwindet. Weiterhin kann die Weil Höhe beliebig kleine und positive Werte annehmen, da h(21/d ) = (log 2)/d. In diesem Fall gilt [Q(21/d ) : Q] = d und [Q(21/d ) : Q]h(21/d ) = log 2. Ein berühmtes offenes Problem von Dirk Lehmer aus dem Jahr 1933 fragt, wie klein die Weil Höhe multipliziert mit dem Grad sein kann. Konkret besteht Lehmers Problem darin, zu jedem > 0 die Existenz einer algebraische Zahl x mit 0 < [Q(x) : Q]h(x) < 87 5. Höhenfunktionen zu beweisen. Dieses Problem ist bis heute offen. Der kleinste bekannte positive Wert von [Q(x) : Q]h(x) hat bereits Lehmer entdeckt. Ist x eine Nullstelle von X 10 + X 9 − X 7 − X 6 − X 5 − X 4 − X 3 + X + 1, so gilt [Q(x) : Q] = 10 und 10h(x) = 0.1623576120077381394 . . . . Er hat auch nachgewiesen, dass für algebraische Zahlen vom Grad 10, 12 und 14 kein kleiner Wert auftritt. (Für festen Grad ist diese Frage in endlicher Zeit lösbar.) Mit Computern hat man nachweisen können, dass es kein kleineres Beispiel mit Grad ≤ 44 gibt. Es ist erstaunlich, dass Lehmers Beispiel ohne Hilfe von Computer gefunden wurde. Aufgrund dieser und auch anderer Hinweise glaubt man heute, dass Lehmers Problem nicht lösbar ist. Daher hat man die folgende Vermutung (die oft fälschlicherweise Lehmer zugeschrieben wird). Vermutung. Es existiert c > 0, so dass jede algebraische Zahl x entweder h(x) = 0 oder h(x) ≥ c/[Q(x) : Q] erfüllt. 5.2. Eine Diophantische Anwendung Wir können die Weil Höhe benutzen, um gewisse diophantische Gleichungen zu untersuchen. Definition 5.25. Zwei algebraische Zahlen x, y mit x 6= 0 und y 6= 0 heissen multiplikativ abhängig, falls es (r, s) ∈ Z2 r {0} mit xr y s = 1 gibt. Beispiel 5.26. Wir werden uns für multiplikativ abhängige Lösungen x, y von x + y = 1 interessieren. Das Paar x = 1/2 und y = 1/2 ist multiplikativ abhängig, da xy −1 = 1. Weiterhin sind x = −1 und y = 2 multiplikativ abhängig wegen x2 y 0 = 1. Zusammen mit (2, −1) gibt es also mindestens drei rationale Paare (x, y) mit x, y multiplikativ abhängig und x + y = 1. Lässt man algebraische Zahlen zu, so findet man gar unendlich viele. Ist x 6= 1 eine Einheitswurzel und y = 1 − x, so gilt xr y 0 = 1, wobei r die Ordnung von x ist. Satz 5.27. Seien x 6= 0 und y 6= 0 multiplikativ abhängige algebraische Zahlen mit x + y = 1. Dann gilt h(x) ≤ log 4 und h(y) ≤ log 4. Beweis. Der Beweis beruht auf einer Idee von E. Bombieri. Aus Symmetrie dürfen wir h(x) ≥ h(y) annehmen. Wir müssen also h(x) ≤ log 4 beweisen. Ohne Einschränkung dürfen wir h(x) > 0 annehmen. 88 5.2. Eine Diophantische Anwendung Es gibt (r, s) ∈ Z r {0} mit xr y s = 1, also xr = y −s . Wir wenden die Weil Höhe an, benutzen Lemma 5.20 und erhalten |r|h(x) = |s|h(y). Falls s = 0, so wäre r 6= 0 und damit h(x) = 0, aber diesen Fall haben wir bereits erledigt. Also s 6= 0 und daher ist q = r/s ∈ Q wohldefiniert und erfüllt |q| = h(y) ≤ 1. h(x) Aus Lemma 5.17 folgt h(x) = h(1 − y) ≤ h(1) + h(−y) + log 2 = h(y) + log 2, da h(y) = h(−y) gilt. Aus Symmetriegründen gilt ebenfalls h(y) ≤ h(x) + log 2 und damit |h(x) − h(y)| ≤ log 2. Wir ersetzen h(y) durch |q|h(x) und finden h(x) |1 − |q|| ≤ log 2. Es gibt zwei Fälle. Falls |q| ≤ 1/2, so gilt |1 − |q|| = 1 − |q| ≥ 1/2 und damit h(x) ≤ 2 log 2. Der zweite Fall ist |q| > 1/2. Hier machen wir eine multiplikative Koordinatentransformation, dazu definieren wir x̃ = x−1 und ỹ = x−1 y. Wir wissen, dass h(x̃) = h(x−1 ) = h(x) und daher reicht es zu zeigen, dass h(x̃) ≤ log 4. Mit der Hilfe von xr y s = 1 finden wir, dass x̃ und ỹ auch multiplikativ abhängig sind. Konkret gilt x̃−r−s ỹ s = xr+s (x−1 y)s = xr y s = 1. Wir argumentieren wie oben und finden | − r − s|h(x̃) = |s|h(ỹ) oder |q̃|h(x̃) = h(ỹ) mit q̃ = −r/s − 1 = −q − 1. Wir berechnen x̃ − ỹ = x−1 (1 − y) = 1 und ähnlich wie oben finden wir h(x̃) |1 − |q̃|| = |h(x̃) − h(ỹ)| ≤ log 2. (5.9) Aus |q| ≤ 1 folgt q + 1 ≥ 0, also |q̃| = q + 1 und |1 − |q̃|| = |q|. Aber wir sind im Fall |q| > 1/2 und somit folgt aus (5.9) die gewünschte Schranke h(x̃) ≤ 2 log 2. Korollar 5.28. Seien x = 6 0 und y 6= 0 multiplikativ abhängige rationale Zahlen mit x + y = 1. Dann gilt (x, y) ∈ {(1/2, 1/2), (−1, 2), (2, −1)}. Beweis. Wir schreiben x = a/b mit a, b ∈ Z teilerfremd mit b 6= 0. Aus Satz 5.27 folgt |a| ≤ 4 sowie |b| ≤ 4. Damit kann man alle in Frage kommende x überprüfen. Für jeden Kandidaten überprüft man, ob x und y = 1 − x multiplikativ abhängig sind (dies lässt sich leicht mittels der Primfaktorzerlegung überprüfen). So hat beispielsweise x = 3/4 89 5. Höhenfunktionen Weil Höhe log 4. Also y = 1 − x = 1/4, aber 3/4 und 1/4 sind nicht multiplikativ abhängig, da r s 1 3 = 3r 4−r−s 4 4 nur dann 1 ist, wenn r = s = 0 gilt. Mit diesem Verfahren überprüft man, dass nur die drei angegebenen Punkte auftreten. 5.3. Die Néron-Tate Höhe Unsere nächste Aufgabe ist es, eine Höhe auf einer elliptischen Kurve zu definieren. In diesem Abschnitt bezeichnet Q ein algebraischer Abschluss von Q. Dann ist Q ein algebraischer Abschluss für jeden Körper K ⊆ Q. Definition 5.29. Sei K ⊆ Q ein Zahlkörper und E eine elliptische Kurve, die durch eine kurze Weierstrassgleichung y 2 = x3 + Ax + B mit A, B ∈ K (5.10) definiert ist. Die Weil Höhe von P ∈ E definieren wir als 0 : falls P = 0 = [0 : 1 : 0], h(P ) = h(x0 ) : falls P = (x0 , y0 ) = [x0 : y0 : 1] mit x0 , y0 ∈ Q. Bemerkung 5.30. Diese Definition enthält einige willkürliche Wahlen. Wir hätten z.B. ebenso h(P ) im Fall P 6= 0 als h(y0 ) definieren können, oder auch als h(x0 ) + h(y0 ), um beide Koordinaten zu berücksichtigen. Aber ist die erste Koordinate gegeben, so gibt es aufgrund der Gleichung y02 = x30 +Ax0 +B nur zwei Möglichkeiten für die zweite Koordinate. Also verliert man keine entscheinende Information, wenn man y0 nicht direkt in der Höhe berücksichtigt. Es stellt sich nun die Frage, ob die Weil Höhe auf E ähnliche Eigenschaften erfüllt, wie die Weil Höhe auf den algebraischen Zahlen. Wir beginnen mit den guten Nachrichten. Es gilt das Analogon zum Satz von Northcott. Dazu brauchen wir eine Definition. Definition 5.31. Sei K ⊆ Q ein Zahlkörper und E eine elliptische Kurve, die durch (5.10) präsentiert ist. Für P ∈ E(K) definieren wir K : falls P = 0, K(P ) = K(x0 , y0 ) : falls P = (x0 , y0 ) = [x0 : y0 : 1] mit x0 , y0 ∈ Q. Dann ist K(P ) der kleinste Zahlkörper in Q, welcher K und eine Wahl von projektiven Koordinaten von P enthält. Insbesondere gilt P ∈ E(K(P )). Lemma 5.32. Sei K ⊆ Q ein Zahlkörper und E eine elliptische Kurve, die wie in (5.10) präsentiert ist. 90 5.3. Die Néron-Tate Höhe (i) Die Weil Höhe auf E erfüllt den Satz von Northcott, d.h. für reelle Zahlen B und D ist die Menge {P ∈ E : h(P ) ≤ B und [K(P ) : K] ≤ D endlich. (ii) Für P ∈ E gilt h(P ) = h(−P ). Beweis. Ist P wie in der Menge aus Teil (i), so dürfen wir P = (x0 , y0 ) annehmen. Aus K(x0 ) ⊆ K(P ) und K ⊇ Q folgt [Q(x0 ) : Q] ≤ [K(x0 ) : Q] = [K(x0 ) : K][K : Q] ≤ D[K : Q]. Weiterhin ist h(x0 ) = h(P ) ≤ B. Weil [K : Q] fest ist, impliziert der Satz von Northcott, Satz 5.22, mit D[K : Q] anstelle von D, dass es nur endlich viele Möglichkeiten für x0 gibt. Aber es gilt y 2 = x3 + Ax + B, d.h. für die Wahl der ersten Koordinate gilt es höchstens zwei Möglichkeiten für die zweite Koordinate. Also gibt es nur endlich viele Möglichkeiten für P . Hieraus folgt (i). Um (ii) zu zeigen, dürfen wir wegen −0 = 0 ebenfalls P = (x0 , y0 ) mit x0 , y0 ∈ Q annehmen. Per Definition gilt h(P ) = h(x0 ), aber −P = (x0 , −y0 ) und damit h(P ) = h(−P ), was zu zeigen war. Als nächstes wollen wir untersuchen, ob die Weil Höhe auf einer elliptischen Kurve die × Gruppenstruktur berücksichtigt. Zur Erinnerung, es gilt h(xk ) = |k|h(x) falls x ∈ Q und k ∈ Z. D.h. wir möchten am liebsten h(kP ) in Relation mit h(P ) bringen. Dazu machen wir einige numerische Beispiele, hier beginnen die schlechte Nachrichten. Beispiele 5.33. (i) Seien K und E zunächste wie in Definition 5.10. Wir untersuchen den ersten interessanten Fall k = 2. Dazu müssen wir uns an die Duplikationsformel aus dem letzten Semester erinnern. Für P = 0 ∈ E gilt 2P = 0 und falls P = (x0 , y0 ) ∈ E gilt es zwei Fälle, cf. Lemma Skript Elliptische Kurven I, Lemma 1.100(ii) oder Skript Elliptische Kurven I, (3.7). Falls y0 = 0, so gilt 2P = 0. Sonst gilt y0 6= 0 und 4 x0 − 2Ax20 − 8Bx0 + A2 ,∗ 2P = 4y02 (5.11) Im Spezialfall K = Q und E : y 2 = x3 + 2 betrachten wir P = (−1, 1). Nach definition ist h(P ) = h(−1) = 0. Mit der Duplikationsformel und A = 0, B = 2 bestimmen wir 17 2P = ,∗ . 4 Es gilt somit h(2P ) = h(17/4) = log 17. Als erstes stellen wir fest, dass h(2P ) 6= 2h(P ), natürlich kann es kein Faktor α mit h(2P ) = αh(P ) geben. 91 5. Höhenfunktionen (ii) Kann die Weil Höhe auf E Punkte endlicher Ordnung von Punkt unendlicher Ordnung unterscheiden, wie es die Weil Höhe auf Q wegen dem Satz von Kronecker tut? Wir untersuchen diese Frage an der elliptischen Kurve E : y 2 = x3 + 2 und den Punkt P = (−1, 1) aus (i). Hier Weiterhin impliziert der Satz von Lutz-Nagell, Skript Elliptische Kurven I, Satz 3.20, dass 2P unendliche Ordnung als Punkt von E besitzt. Damit hat auch P unendliche Ordnung. Aber trotzdem gilt h(P ) = 0. Also gibt es Punkt mit Weil Höhe 0 aber unendlicher Ordnung. (iii) Andersherum kann man auch Punkte endlicher Ordnung mit positiver Weil Höhe konstruieren. Sei dazu E die durch y 2 = x3 + x − 10 definierte elliptische Kurve und P = (2, 0). Weil die zweite Koordinate von P verschwindet, gilt 2P = 0. Also hat P endliche Ordnung 2. Aber h(P ) = h(2) = log 2 > 0. Wir halten fest, dass das Zusammenspiel zwischen Weil Höhe und Gruppenstruktur auf × E weniger rund läuft wie in Abschnitt 5.1, wo die zugrundeliegende Gruppe Q mit der Multiplikation war. Beispiel 5.34. Wir setzen Teil (ii) des letzten Beispiels mit der Kurve E : y 2 = x3 + 2 und P = (−1, 1) fort. In der Tabelle unten wird in der zweiten Spalte die Abszisse von kP festgehalten für k ∈ {0, . . . , 10} k 0 1 2 3 4 5 6 7 8 9 10 Abszisse von kP 0 −1 17/4 127/441 66113/80656 108305279/48846121 −174016613231/306196222500 11140700095100159/357683450575441 −535925530724803712767/431791166736106232896 325834850451854833442478847/30317214134131077328593201 −64363752249455070879137307239023/293763056960316465372944069236324 Wie erwartet wachsen Zähler und Nenner von kP stark an. Als nächstes tragen wir in Abbildung 5.1 die Weil Höhe der Abszisse gegen k auf. Die Punkte nähern sich sehr gut einer Parabel an, dies wirkt noch überzeugender, wenn man sich an h(−kP ) = h(kP ) erinnert. Um die Übereinstimmung zu verdeutlichen, wurde rechts der Graph der Parabel y = 0.755k 2 gezeichnet. Dennoch liegen die Punkt (k, h(kP )) nicht genau auf der Parabel, denn Letztere ist nur eine Approximation. Wir machen die Beobachtung im letzten Beispiel etwas präsizer im Fall k = 2. Wir werden beweisen, dass h(2P ) ungefähr 4h(P ) ist. 92 5.3. Die Néron-Tate Höhe Abbildung 5.1.: k vs. Weil Höhe h(kP ) Proposition 5.35. Sei K ⊆ Q ein Zahlkörper und E eine elliptische Kurve über K, die durch y 2 = x3 + Ax + B mit A, B ∈ K präsentiert ist. Es existiert eine Konstante C ≥ 0 die nur von A und B abhängt mit den folgenden Eigenschaften. (i) Für alle P ∈ E gilt h(2P ) ≤ 4h(P ) + C. (ii) Für alle P ∈ E gilt h(2P ) ≥ 4h(P ) − C. Insgesamt gilt also |h(2P ) − 4h(P )| ≤ C für alle P ∈ E. Beweis. Beide Aussagen sind im Fall P = 0 trivial, da h(0) = 0. Gilt 2P = 0 und P 6= 0, so ist die Ungleichung in (i) erfüllt für alle C ≥ 0, da h(P ) ≥ 0 = h(2P ). Um (ii) zu sehen, erinnern wir uns daran, dass P = (x0 , 0), wobei x30 +Ax0 +B = 0. Es gibt also höchstens 3 (und sogar genau 3) Möglichkeiten für x0 . Wir wählen C so gross, dass C ≥ 4h(x0 ) für alle Nullstellen von X 3 + AX + B und dann folgt (ii). Also reicht es (i) und (ii) im Fall P = (x0 , y0 ) mit x0 , y0 ∈ Q und y0 6= 0 zu zeigen. Wir wählen dazu einen Zahlkörper K, der x0 und y0 enthält. Der Punkt 2P ist durch (5.11) gegeben. Da y02 = x30 + Ax0 + B, gilt 4 x0 − 2Ax20 − 8Bx0 + A2 2P = ,∗ . (5.12) 4(x30 + Ax0 + B) Wir beweisen die Teile (i) und (ii) separat und beginnen mit (i). In Definition der Weil Höhe vereinheitlichen wir die Notation bzgl. der Absolutbeträge in M 0 (K) und M ∞ (K). Es gilt 4 x0 − 2Ax20 − 8Bx0 + A2 h(2P ) = h (5.13) 4(x30 + Ax0 + B) 4 2 2 X 1 x − 2Ax0 − 8Bx0 + A d(v) log max 1, 0 = , [K : Q] 4(x30 + Ax0 + B) v v∈M (K) 93 5. Höhenfunktionen hier ist d(v) = d(P ) = e(P )f (P ), falls P ∈ M 0 (K) und d(v) = 1 falls v ∈ M ∞ (K). Da 4(x30 + Ax0 + B) nicht verschwindet, gilt die Produktformel (in logarithmischer Schreibweise) X d(v) log |4(x30 + Ax0 + B)|v = 0 v∈M (K) wegen Proposition 5.19. Wir addieren diese Darstellung der Null zu (5.13) und erhalten h(2P ) = 1 [K : Q] X d(v) log max {|p(x0 )|v , |q(x0 )|v } . (5.14) v∈M (K) wobei p(x) = x4 − 2Ax2 − 8Bx + A2 und q(x) = 4(x3 + Ax + B). Nun werden wir diese Summe summandenweise gegen oben abschätzen. Sei also v ∈ M (K). Falls v = σ : K → C ein Ringhomomorphismus ist, d.h. M ∞ (K), so gilt |q(x0 )|σ ≤ 4(|x0 |3σ + |A|σ |x0 |σ + |B|σ ) ≤ 4(1 + |A|σ + |B|σ ) max{1, |x0 |σ }3 sowie |p(x0 )|σ ≤ |x0 |4σ + 2|A|σ |x0 |2σ + 8|B|σ |x0 |σ + |A|2σ ≤ (1 + 2|A|σ + 8|B|σ + |A|2σ ) max{1, |x0 |σ }4 . Wir können beide Ungleichung in max{|p(x0 )|σ , |q(x0 )|σ } ≤ 12 max{1, |A|σ }2 max{1, |B|σ } max{1, |x0 |σ }4 (5.15) zusammenfassen. Im zweiten Fall ist v = P ein Primideal ungleich Null von ZK . Hier gehen wir ähnlich vor, können aber die stärkere ultrametrische Dreiecksungleichung verwenden. Wegen |2|P ≤ 1 gilt |q(x0 )|P ≤ |4|P max{|x0 |3P , |A|P |x0 |P , |B|P } ≤ max{1, |A|P } max{1, |B|P } max{1, |x0 |P }3 sowie |p(x0 )|P ≤ max{|x0 |4P , |2A|2P |x0 |2P , |8B|P |x0 |P , |A|2P } ≤ max{1, |A|P }2 max{1, |B|P } max{1, |x0 |P }4 . Zusammengefasst gilt max{|p(x0 )|P , |q(x0 )|P } ≤ max{1, |A|P }2 max{1, |B|P } max{1, |x0 |P }4 . 94 (5.16) 5.3. Die Néron-Tate Höhe Um h(2P ) in der Form (5.14) gegen oben abzuschätzen, benötigen wir (5.15) sowie (5.16) und finden 1 X h(2P ) ≤ d(v) log(max{1, |A|v }2 max{1, |B|v } max{1, |x0 |v }4 ) [K : Q] v∈M (K) X + log 12 σ∈M ∞ (K) = 4h(x0 ) + 2h(A) + h(B) + log(12). Teil (i) folgt, da wir C ≥ 2h(A) + h(B) + log(12) annehmen dürfen und da h(x0 ) = h(P ) gilt. In Teil (ii) müssen wir (5.14) gegen unten abschätzen. Dies lässt sich nicht alleine mit der Dreiecksungleichung erreichen, da diese in die für uns ungünstige Richtung geht. Wir brauchen zwei Identitäten, die sich durch direkts Ausrechnen überprüfen lassen: 28 ∆x70 = r(x0 )p(x0 ) + s(x0 )q(x0 ) ∆ = t(x0 )p(x0 ) + u(x0 )q(x0 ) (5.17) (5.18) wobei ∆ = −24 (4A3 + 27B 2 ), r(x) = 212 (−4A3 x3 − 3A4 x + A2 Bx2 − 27B 2 x3 − 3A3 B − 22AB 2 x − 24B 3 ), s(x) = 210 (−5A4 x2 − A2 Bx3 + 3A5 − 26A3 Bx − 32AB 2 x2 + 24A2 B 2 − 192B 3 x), t(x) = −24 (3x2 + 4A), u(x) = 22 (3x2 − 5Ax − 27B). Falls v = σ ∈ M ∞ (K), so liefert die Dreiecksungleichung zusammen mit den Definitionen oben angewendet auf (5.17) und (5.18) 28 |∆|σ |x0 |7σ ≤ 220 max{1, |A|σ }5 max{1, |B|σ }3 max{1, |x0 |σ }3 max{|p(x0 )|σ , |q(x0 )|σ } und |∆|σ ≤ 28 max{1, |A|σ } max{1, |B|σ } max{1, |x0 |σ }2 max{|p(x0 )|σ , |q(x0 )|σ }. Zusammengefasst ergibt sich |∆|σ max{1, |x0 |σ }7 ≤ 212 max{1, |A|σ }5 max{1, |B|σ }3 max{1, |x0 |σ }3 max{|p(x0 )|σ , |q(x0 )|σ }. (5.19) Falls v = P ∈ M 0 (K) so können wir die ultrametrische Dreiecksungleichung anwenden. Der Vorteil ist, dass wir (ähnlich wie im Beweis von Teil (i)) eine saubere Ungleichung |∆|σ max{1, |x0 |σ }7 ≤ max{1, |A|σ }5 max{1, |B|σ }3 max{1, |x0 |σ }3 max{|p(x0 )|σ , |q(x0 )|σ } (5.20) ohne Vorfaktor erhalten. 95 5. Höhenfunktionen Da E eine elliptische Kurve ist, besitzt die durch y 2 = x3 + Ax + B definierte affine Kurve keine Singularität. Wir wissen aus dem Skript Elliptische Kurven I, Beispiel 1.25, dass ∆ = −24 (4A3 + 27B 2 ) 6= 0. Wir dürfen also die Produktformel anwenden. Es folgt Y Y 7d(v) = max{1, |x | } max{1, |x0 |v }7d(v) . |∆|d(v) 0 v v v∈M (K) v∈M (K) Auf der rechten Seite steht e7[K:Q]h(x0 ) . Die Faktoren auf der linken Seite können wir mit der Hilfe von (5.19) und (5.20) wie folgt gegen oben abschätzen X 7[K : Q]h(x0 ) = d(v) log(|∆|v max{1, |x0 |v }7 ) v∈M (K) ≤ X d(v) log(max{1, |A|v }5 max{1, |B|v }3 max{1, |x0 |v }3 max{|p(x0 )|v , |q(x0 )|v }) v∈M (K) + X 12 log 2 v∈M ∞ (K) = [K : Q](5h(A) + 3h(B) + 3h(x0 ) + 12 log 2) + X d(v) log max{|p(x0 )|v , |q(x0 )|v }. v∈M (K) Die Summe auf der rechten Seite ist gleich [K : Q]h(2P ) wegen (5.14). Wir teilen die Gleichung durch [K : Q], benutzen h(x0 ) = h(P ) und finden 7h(P ) ≤ 5h(A) + 3h(B) + 3h(P ) + 10 log 2 + h(2P ). Teil (ii) folgt nachdem wir links und rechts 3h(P ) subtrahieren und weil wir C ≥ 5h(A)+ 3h(B) + 3h(P ) + 10 log 2 annehmen dürfen. Durch Mittelung können wir aus der Weil Höhe eine neue Höhe definieren. Grob gesagt können wir die Weil Höhe um eine beschränkte Funktion stören, um eine Funktion E → R zu erhalten, die kompatibel mit der Gruppenstruktur auf E ist. Satz 5.36. Sei K ⊆ Q ein Zahlkörper und E eine elliptische Kurve über K, die durch y 2 = x3 + Ax + B mit A, B ∈ K präsentiert ist. (i) Für jeden Punkt P ∈ E existiert der Grenzwert h(2n P ) , n→+∞ 4n lim wir bezeichnen ihn mit ĥ(P ). (ii) Es gibt eine konstante C ≥ 0 die nur von A und B abhängt mit |h(P ) − ĥ(P )| ≤ C (iii) Für alle P ∈ E gilt ĥ(2P ) = 4ĥ(P ). 96 für alle P ∈ E. 5.3. Die Néron-Tate Höhe (iv) Es gibt genau eine Funktion E → R, welche die Schlussfolgerung von (ii) und (iii) erfüllt. Definition 5.37. Die in Satz 5.36(i) definierte Funktion ĥ : E → R heisst Néron-Tate Höhe auf E. Beispiel 5.38. (i) Für den Nullpunkt 0 einer elliptischen Kurve gilt h(0) = 0 und damit auch ĥ(0) = 0. (ii) Für jeden Punkt P einer elliptischen Kurve gilt ĥ(P ) = ĥ(−P ), da bereits h(P ) = h(−P ) für die Weil Höhe gilt, vgl. Lemma 5.32(ii). Beweis von Satz 5.36. Für Teil (i) werden wir beweisen, dass es sich bei h(2n P ) 4n n≥1 (5.21) um eine Cauchy Folge handelt. Sei dazu C die Konstante aus Proposition 5.35 und n ≥ m ≥ 0 ganze Zahlen. Ein Teleskopsummen argument ergibt h(2n P ) h(2m P ) 4n − 4m m+1 m h(2n P ) h(2n−1 P ) h(2n−1 P ) h(2n−2 P ) h(2 P ) h(2 P ) − + − + · · · − + = 4n 4n−1 4n−1 4n−2 4m+1 4m h(2n P ) h(2n−1 P ) h(2n−1 P ) h(2n−2 P ) h(2m+1 P ) h(2m P ) + + ··· + ≤ − − 4m+1 − 4m 4n 4n−1 4n−1 4n−2 1 1 1 ≤ n h(2n P ) − 4h(2n−1 P ) + n−1 h(2n−1 P ) − 4h(2n−2 P ) + · · · + m+1 h(2m+1 P ) − 4h(2m P ) . 4 4 4 Die Absolutbeträge auf der letzten Zeile enthalten Terme der Gestalt h(2Q) − 4h(Q) mit Q = 2m+l P für ein l ≥ 0. Aus Proposition 5.35 leiten wir |h(2Q) − 4h(Q)| ≤ C ab, für Q beliebig. Wir erhalten h(2n P ) h(2m P ) 1 1 1 C 1 1 4n − 4m ≤ C 4n + 4n+1 + · · · + 4m+1 = 4m+1 1 + 4 + · · · + 4n−m +∞ C X1 C 4 ≤ m+1 = m+1 . (5.22) l 4 4 4 3 l=0 Da die rechte Seite für n → +∞ gegen Null strebt, ist (5.21) eine Cauchy Folge. Somit ist Teil (i) bewiesen. Teil (ii) folgt aus der Ungleichung (5.22) mit der Wahl m = 0, d.h. es gilt h(2n P ) C ≤ − h(P ) ≤C 4n 3 97 5. Höhenfunktionen für alle P ∈ E. Teil (ii) folgt, in dem wir n gegen Unendlich streben lassen. Teil (iii) ist eine Formalität. Es gilt h(2n+1 P ) h(2n+1 P ) = lim 4 = 4ĥ(P ) n→+∞ n→+∞ 4n 4n+1 ĥ(2P ) = lim für alle P ∈ E. Sei schliesslich h̃ : E → R eine Funktion, welche die Schlussfolgerungen (ii) und (iii) erfüllt. Insbesondere existiert C̃ mit |h(P ) − h̃(P )| ≤ C̃ für alle P ∈ E. Also |ĥ(P ) − h̃(P )| ≤ |ĥ(P ) − h(P )| + |h̃(P ) − h(P )| ≤ C + C̃ für alle P ∈ E. D.h. die Funktion ĥ − h̃ ist auf E beschränkt. Wegen ĥ(2n P ) = 4n ĥ(P ) und h̃(2n P ) = 4n h̃(P ) gilt |ĥ(P ) − h̃(P )| ≤ 4−n (C + C̃) für alle P ∈ E und n ≥ 0. Nehmen wir n → +∞ so folgt ĥ(P ) = h̃(P ) für alle P ∈ E. Damit ist Teil (iv) bewiesen. Beispiel 5.39. Es folgt eine Tabelle mit Werten der Weil Höhe, wobei die elliptische Kurve durch y 2 = x3 + 2 gegeben ist und P = (−1, 1). 2n 1 2 4 8 16 32 64 128 256 512 1024 2048 h(2n P ) 4n 0 0.708303336014054 . . . 0.706121779770151 . . . 0.745789482657755 . . . 0.754528984391964 . . . 0.754528922410346 . . . 0.754527928503109 . . . 0.754530986046368 . . . 0.754567527565468 . . . 0.754576673398363 . . . 0.754576666245150 . . . 0.754576733995140 . . . Mit einem Computer kann man ĥ(P ) beliebig genau annähern, es gilt ĥ(P ) = 0.754576903181227 . . . . Bemerkung 5.40. Ist P ein Punkt auf einer elliptischen Kurve, die über einem Zahlkörper definiert ist, so gilt allgemein ĥ(kP ) = k 2 ĥ(P ) (5.23) für alle k ∈ Z. In Satz 5.36 haben wir nur (den wichtigen) Spezialfall k = 2 bewiesen. Aus diesem folgt durch Iteration ĥ(2n P ) = 4n ĥ(P ) (5.24) für alle n ≥ 0. 98 5.3. Die Néron-Tate Höhe Wir halten einige weitere Eigenschaften der Néron-Tate Höhe fest. Satz 5.41. Sei K ⊆ Q ein Zahlkörper und E eine elliptische Kurve, die mittels (5.10) definiert ist. (i) Die Néron-Tate Höhe erfüllt den Satz von Northcott, d.h. für reelle Zahlen B, D ist {P ∈ E : ĥ(P ) ≤ B und [K(P ) : K] ≤ D} endlich. (ii) Die Néron-Tate Höhe erfüllt den Satz von Kronecker, d.h. für P ∈ E gilt ĥ(P ) = 0 ⇐⇒ P hat endliche Ordnung. Beweis. Ist P ein Punkt auf E mit ĥ(P ) ≤ B, so gilt h(P ) ≤ B + C für die Weil Höhe wegen Satz 5.36(ii). Also können wir die Endlichkeit in (i) aus der Northcotteigenschaft der Weil Höhe auf E, Lemma 5.32(i), schliessen. Nun zeigen wir Teil (ii). Sei dazu P ein Punkt endlicher Ordnung k. Hätten wir (5.23) zur Verfügung, so könnten wir, zusammen mit Beispiel 5.38(i), 0 = ĥ(0) = ĥ(kP ) = k 2 ĥ(P ) und damit ĥ(P ) = 0 folgern. Da wir (5.23) nur für |k| ≤ 2 wissen, müssen wir etwas mehr arbeiten. Wir betrachten die Folge 20 , 21 , 22 , 23 , . . . modulo k. Da es nur endlich viele Äquivalenzklassen modulo k gibt, existieren positive Zahlen n > m ≥ 0 mit 2n ≡ 2m (mod k). Also 2n = 2m + jk für ein j ∈ Z. Hieraus und mit kP = 0 folgt 2n P = 2m P . Für die Néron-Tate Höhe wissen wir (5.24) 4n ĥ(P ) = ĥ(2n P ) = ĥ(2m P ) = 4m ĥ(P ) also (4n − 4m )ĥ(P ) = 0 und damit ĥ(P ) = 0. Die umgekehrte Richtung erfolgt ähnlich wie im Beweis von Satz 5.23. Gilt ĥ(P ) = 0, so haben wir auch 0 = ĥ(P ) = ĥ(2P ) = ĥ(4P ) = ĥ(8P ) = · · · . Aber wegen dem Satz von Northcott, Teil (i) dieses Satzes, ist {P, 2P, 4P, 8P, . . .} endlich. Somit existieren ganze Zahlen n > m ≥ 0 mit 2n P = 2m P , also (2n − 2m )P = 0. Wegen 2n − 2m 6= 0 hat P endliche Ordnung. Korollar 5.42. Sei K ⊆ Q ein Zahlkörper und E eine elliptische Kurve, die mittels (5.10) definiert ist. Die über K definierten Torsionspunkte {P ∈ E(K) : P hat endliche Ordnung} bilden eine endliche Gruppe. Beweis. Jeder Punkt in der besagten Untergruppe hat Néron-Tate Höhe 0. Die Endlichkeit folgt aus dem Satz von Northcott für die Néron-Tate Höhe, Satz 5.41(i). 99 5. Höhenfunktionen Als letztes schätzen wir die Néron-Tate Höhe einer Summe gegen oben. Proposition 5.43. Sei K ⊆ Q ein Zahlkörper und E eine elliptische Kurve, die mittels (5.10) definiert ist. (i) Es gibt eine Konstant C = C(A, B) ≥ 0, so dass die Weil Höhe h(P ⊕ Q) ≤ 2h(P ) + 2h(Q) + C für alle P, Q ∈ E erfüllt. (ii) Für alle P, Q ∈ E erfüllt die Néron-Tate Höhe ĥ(P ⊕ Q) ≤ 2ĥ(P ) + 2ĥ(Q). Beweis. Wir zeigen zuerst, wie Teil (ii) aus Teil (i) folgt. Für P, Q ∈ E impliziert die Schranke in (i) h(2n (P ⊕ Q)) ≤ 2h(2n P ) + 2h(2n Q) für alle ganzen Zahlen n ≥ 0. Nun teilen wir diese Ungleichung durch 4n und nehmen den Grenzwert für n → +∞. Dabei konvergiert die linke Seite gegen ĥ(P ⊕ Q) und die rechte Seite gegen 2ĥ(P ) + 2ĥ(Q). Für den Beweis von Teil (i) dürfen wir P 6= 0, Q 6= 0 und P ⊕ Q 6= 0 annehmen. Also gilt P = (x0 , y0 ) und Q = (x1 , y1 ) mit x0,1 , y0,1 ∈ Q. Weiterhin folgt die Abschätzung in (i) im Fall P = Q aus Proposition 5.35(i). Also dürfen wir P 6= Q und damit wegen P 6= −Q auch x0 6= x1 annehmen. Die Abszisse der Summe P ⊕ Q = (x2 , ∗) lässt sich mit Skript Elliptische Kurven I, Lemma 1.100(i) bestimmen, es gilt 2 (y1 − y0 )2 − (x0 + x1 )(x1 − x0 )2 y1 − y0 . − (x0 + x1 ) = x2 = x1 − x0 (x1 − x0 )2 Wir multiplizieren den Zähler aus, ersetzen yi2 durch x3i + Axi + B und erhalten nach einer kurzen Rechnung x2 = x0 x1 (x0 + x1 ) − 2y0 y1 + A(x0 + x1 ) + 2B . (x1 − x0 )2 (5.25) Sei K ein Zahlkörper, welcher x0 , x1 , x2 , y0 , y1 enthält. Per Definition gilt h(P ⊕ Q) = h(x2 ) und X x0 x1 (x0 + x1 ) − 2y0 y1 + A(x0 + x1 ) + 2B 1 h(x2 ) = d(v) log max 1, [K : Q] (x1 − x0 )2 v v∈M (K) mit d(v) wie in unterhalb von (5.13). Wir wenden die Produktformel, Proposition 5.19, in logarithmischer Form auf (x1 − x0 )2 an, und finden h(x2 ) = X 1 d(v) log max |x1 − x0 |2v , |x0 x1 (x0 + x1 ) − 2y0 y1 + A(x0 + x1 ) + 2B|v [K : Q] v∈M (K) (5.26) Nun schätzen wir jeden Summand gegen oben ab. 100 5.4. Anwendung auf den Satz von Mordell-Weil Sei v ∈ M 0 (P ) ein maximales Ideal. Wegen yi2 = x3i + Axi + B für i = 0, 1 folgt aus der ultrametrischen Dreiecksungleichung |yi |2v ≤ max{1, |A|v , |B|v } max{1, |xi |v }3 und daher |yi |v ≤ max{1, |A|v }1/2 max{1, |B|v }1/2 max{1, |xi |v }3/2 (5.27) |x1 − x0 |2v ≤ max{|x0 |v , |x1 |v }2 ≤ max{1, |x0 |v }2 max{1, |x1 |v }2 (5.28) Weiterhin gilt und |x0 x1 (x0 + x1 ) − 2y0 y1 + A(x0 + x1 ) + 2B|v ist höchstens max{1, |A|v , |B|v } max{|x20 x1 |v , |x0 x21 |v , |y0 y1 |v , |x0 |v , |x1 |v , 1}. (5.29) Mit (5.27) können wir |y0 y1 |v gegen oben abschätzen, also ist (5.29) höchstens max{1, |A|v }2 max{1, |B|v }2 max{1, |x0 |v }2 max{1, |x1 |v }2 . (5.30) Für v ∈ M ∞ (K) gehen wir ähnlich vor, nur dürfen wir hier nur die übliche Dreiecksungleichung anwenden. Es gilt beispielsweise |yi |2v ≤ |xi |3v + |Axi |v + |B|v ≤ 3 max{1, |A|v } max{1, |B|v } max{1, |xi |v }3 . Ähnlich sieht man, dass sämtliche Ungleichungen oben weiter gelten, wenn man die obere Schranke geeignet multipliziert. Genauer gesagt exister eine Konstante c ≥ 1 mit |x1 − x0 |2v ≤ c max{1, |x0 |v }2 max{1, |x1 |v }2 (5.31) |x0 x1 (x0 + x1 ) − 2y0 y1 + A(x0 + x1 ) + 2B|v ≤ max{1, |A|v }2 max{1, |B|v }2 max{1, |x0 |v }2 max{1, |x1 |v }2 . (5.32) und Jetzt setzen wir die oberen Schranken (5.28), (5.30), (5.31) und (5.32) in (5.26) ein und schliessen h(x2 ) ≤ 2h(x0 ) + 2h(x1 ) + 2h(A) + 2h(B) + log c = 2h(P ) + 2h(Q) + C für die Konstante C = 2h(A) + 2h(B) + log c, welche nicht von P und Q abhängt. 5.4. Anwendung auf den Satz von Mordell-Weil Nun haben wir mit der Néron-Tate Höhe ein mächtiges Werkzeug, welches eine zentrale Rolle im Beweis des Satzes von Mordell-Weil ist. Satz (Mordell-Weil). Sei K ein Zahlkörper und E eine elliptische Kurve, die über K definiert ist. Dann ist E(K) eine endlich erzeugte abelsche Gruppe, d.h. E(K) ∼ = T × Zr für eine ganze Zahl r ≥ 0 und eine endliche Gruppe T . 101 5. Höhenfunktionen Die bewiesenen Eigenschaften der Néron-Tate Höhe impliziert bereits einen Teil dieses Satzes. Aus Korollar 5.42 wissen wir, dass es in E(K) höchstens endlich viele Punkte endlicher Ordnung gibt. Davon unberührt bleiben jedoch die “schwierigen” Punkte unendlicher Ordnung. Bemerkung 5.44. Wir beginnen mit einer einfachen Beobachtung über die Gruppe G = Zr . Diese ist zwar unendlich, aber der Quotient G/2G ∼ = (Z/2Z)r wobei 2G = {2g : g ∈ Zr } ist endlich und besitzt 2r Elemente. Eine beliebige endlich erzeugte abelsche Gruppe ist zu G = T × Zr isomorph, wobei T eine endliche Gruppe ist und r ≥ 0. Für Gruppen dieses Typs ist der Quotient G/2G ∼ = (T /2T ) × (Z/2Z)r ebenfalls endlich, da T /2T als Quotient einer endlichen Gruppe endlich ist. Wir halten die folgende Aussage fest: Damit eine abelsche Gruppe G endlich erzeugt ist, muss notwendigerweise G/2G endlich sein. Leider ist die Umkehrung dieser Aussage falsch. Ist z.B. G = Q mit der Addition, so gilt 2G = Q und damit ist G/2G die triviale Gruppe. Aber G ist als Gruppe nicht endlich erzeugt. Um dies zu beweisen, seien q1 , . . . , qn rationale Zahlen. Wir zeigen, dass q1 Z + · · · + qn Z 6= Q und dafür dürfen wir qi 6= 0 für alle i ∈ {1, . . . , n} annehmen. Im Nenner des Produkts q1 · · · qn kommen höchstens endlich viele Primzahlen vor. Also existiert eine Primzahl p, die den Nenner nicht teilt. Damit liegt 1/p nicht in q1 Z + · · · + qn Z, was zu zeigen war. Obwohl die Umkehrung der letzten Bemerkung im Allgemeinen falsch ist, lässt sie sich für elliptische Kurven über Zahlkörper beweisen. Dazu werden wir die Néron-Tate Höhe benötigen. Satz 5.45. Sei K ein Zahlkörper und E eine elliptische Kurve über K, die in kurzer Weierstrassform präsentiert wird. Wir nehmen an, dass E(K)/2E(K) eine endliche Gruppe ist. Dann ist E(K) eine endlich erzeugte Gruppe. Beweis. Wegen unserer Annahme, dass E(K)/2E(K) endlich ist, können wir ein endliches Repräsentatensystems dieser Faktorgruppe wählen. Es gibt daher P1 , . . . , Pn ∈ E(K), so dass es für jeden Punkt P ∈ E(K) ein i mit P − Pi ∈ 2E(K) gibt. Daher gibt es ein Q ∈ E(K) mit P − Pi = 2Q. Wir setzen in die Néron-Tate Höhe ein und erhalten ĥ(P − Pi ) = ĥ(2Q) = 4ĥ(Q), 102 5.4. Anwendung auf den Satz von Mordell-Weil wobei wir Satz 5.36(iii) verwendet haben. Wegen Proposition 5.43(ii) können wir die Néron-Tate Höhe einer Summe abschätzen, es folgt 4ĥ(Q) ≤ 2ĥ(P ) + 2ĥ(−Pi ) = 2ĥ(P ) + 2ĥ(Pi ). Also ĥ(P ) C + wobei C = max{ĥ(P1 ), . . . , ĥ(Pn )}. 2 2 Nun können wir dieses Verfahren an den Punkt Q anwenden. Es existiert j und R ∈ E(K), so dass Q − Pj = 2R ∈ 2E(K). Aus dem gleichen Grund wie oben gilt die Abschätzung ĥ(Q) ĥ(−Pj ) ĥ(Q) C ĥ(R) ≤ + ≤ + . 2 2 2 2 ĥ(Q) ≤ Setzen wir die Schranke für ĥ(Q) ein, so folgt ĥ(R) ≤ ĥ(P ) C C + + 4 2 4 und P = Pi + 2Q = Pi + 2Pj + 4R. Diesen Prozess führen wir an R fort und wählen k und S ∈ E(K) mit R − Pk = 2S, wie vorhin folgt ĥ(S) ≤ ĥ(P ) C C C + + + 8 2 4 8 und P = Pi + 2Q = Pi + 2Pj + 4R = Pi + 2Pj + 4Pk + 8S. Nach dem N -ten Schritt haben einen Punkt P 0 ∈ E(K) mit ĥ(P ) ĥ(P ) ≤ N + C 2 0 1 1 + ··· + N 2 2 ≤ ĥ(P ) +C 2N und P ∈ ZP1 + · · · + ZPn + ZP 0 (5.33) konstruiert. Falls 2N ≥ ĥ(P ), so gilt ĥ(P 0 ) ≤ 1+C. Wegen dem Satz von Northcott, Satz 5.41(i), gibt es nur endliche viele Elemente in E(K), deren Néron-Tate Höhe durch C beschränkt ist. Also gibt es für N genügend gross nur endlich viele Möglichkeiten für P 0 . Wegen (5.33) liegt P , und damit ganz E(K) in der endlich erzeugten Gruppe X ZP1 + · · · + ZPn + ZP 0 , P 0 ∈E(K) ĥ(P 0 )≤C+1 was zu zeigen war. Nun haben wir den Satz von Mordell-Weil auf die folgende Aussage reduziert. Man nennt sie schwachen Satz von Mordell-Weil. 103 5. Höhenfunktionen Satz 5.46 (Schwacher Mordell-Weil Satz). Sei K ein Zahlkörper und E eine elliptische Kurve über K, die in kurzer Weierstrassform präsentiert wird. Dann ist E(K)/2E(K) eine endliche Gruppe. Diese Aussage werden wir nun beweisen. Dazu machen wir eine Beobachtung über Punkte auf E deren Koordinaten im algebraischen Abschluss vom Grundkörper liegen. Lemma 5.47. Sei K ein beliebiger Körper und E eine elliptische Kurve über K, die in kurzer Weierstrassform präsentiert wird. Zu jedem Punkt P ∈ E existiert Q ∈ E mit 2Q = P . D.h. E/2E ist die triviale Gruppe Achtung. Dieses Lemma impliziert den schwachen Satz von Mordell-Weil nicht, da Punkte in E Koordinaten in einem algebraischen Abschluss K von K besitzt. Aber ein Zahlkörper ist nie algebraisch abgeschlossen. Die Schwierigkeit in Satz 5.46 ist zu zeigen, dass man Endlichkeit hat, wenn K ein Zahlkörper ist. Beweis von Lemma 5.47. Ist P = 0, so dürfen wir Q = 0 wählen. Sonst ist P 6= 0 von der Form (x0 , y0 ) mit x0 , y0 im algebraischen Abschluss K von K. Seien wie üblich A, B ∈ K die Koeffizienten in der kurzen Weierstrassgleichung, welche E präsentiert. Wir erinnern uns an die Duplikationsformel (5.12). Das Polynom X 4 − 2AX 2 − 8BX + A2 − 4x0 (X 3 + AX + B) besitzt in K eine Nullstelle x1 . Wir wählen weiterhin y1 ∈ K mit y12 = x31 + Ax1 + B. Dann ist (x1 , y1 ) ∈ E und es gilt 2(x1 , y1 ) = (x0 , ?). Da (x0 , ±y0 ) die einzigen Punkte auf E mit Abzisse x0 sind, muss ? = ±y1 gelten. Insbesondere folgt das Lemma für eine Wahl des Vorzeichens Q = (x1 , ±y1 ). Bemerkung 5.48. Es ist a priori nicht offesichtlich, ob es überhaupt eine elliptische Kurve E und einen Körper K gibt, über dem E definiert ist, so dass E(K)/2E(K) unendlich ist. Wegen Lemma 5.47 ist ein solcher Körper K nicht algebraische abgeschlossen, K kann wegen dem schwachen Satz von Mordell-Weil auch kein Zahlkörper sein. Falls K ein endlicher Körper ist, ist E(K) und daher insbesondere E(K)/2E(K) endlich. Schliesslich werden wir zeigen, dass E(R)/2E(R) endlich ist, falls K = R. 5.5. Beweis des schwachen Satzes von Mordell-Weil Sei E eine elliptische Kurve, die über einem Körper K definiert ist und die in kurzer Weierstrassform y 2 = x3 + Ax + B mit A, B ∈ K präsentiert ist. Wir verlangen zunächst nicht, dass K ein Zahlkörper ist. Bemerkung 5.49. Punkte in E der Ordnung zwei, sind genau die Punkte der Form (x0 , 0) mit x0 3 + Ax0 + B = 0. Dies folgt aus Skript Elliptische Kurven I, DefinitionLemma 1.99. 104 5.5. Beweis des schwachen Satzes von Mordell-Weil Unser Beweis von Satz 5.46 lässt sich in drei Schritte gliederen. Er beruht auf einer Idee von J.W.S. Cassels. Für die ersten zwei Schritte machen wir die folgende Annahme 5.50. Das Polynom X 3 + AX + B = (X − α1 )(X − α2 )(X − α3 ) zerfällt über K in Linearfaktoren, hier α1 , α2 , α3 ∈ K. D.h. E(K) besitzt drei Punkte der Ordnung 2. Auf Übungsblatt 12, Elliptische Kurven I, haben wir die Bezeichnung E[2] = {P ∈ E : 2P = 0} eingeführt. Es ist die Gruppe der Punkte endlicher Ordnung 1 oder 2. Annahme 5.50 ist äquivalent zur Bedingung E[2] ⊆ E(K). Definition 5.51. Für ein Ring R ist R×2 = {x2 : x ∈ R× } die Untergruppe aller Quadrate der Einheitengruppe R× . Ein wichtiger Spezialfall ist der Fall eines Körpers K = R. Dann ist K ×2 die Untergruppe aller Quadrate in K × = K r {0}. Die Beweisstrategie für den schwachen Mordell-Weil Satz besteht aus drei Schritten. (I) Unter der Annahme 5.50 werden wir einen Gruppenhomomorphism ϕ : E(K) → (K × /K ×2 )3 mit Kern 2E(K) konstruieren. Also ist E(K)/2E(K) zu einer Untergruppe von (K × /K ×2 )3 isomorph. (II) Die Faktorgruppe Q× /Q×2 ist unendlich, da die Primzahlen in Z paarweise verschiedene Elemente repräsentieren. Im allgemeinen ist K × /K ×2 für jeden Zahlkörper K unendlich. Aber wir werden im zweiten Schritt under Annahme 5.50 zeigen, dass das Bild von ϕ endlich ist, falls K ein Zahlkörper ist. Aus (I) und (II) folgt, dass E(K)/2E(K) ∼ = Bild(ϕ) eine endliche Gruppe ist, für jeden Zahlkörper K. Dies ist der schwache Satz von Mordell-Weil im Spezialfall wenn X 3 + AX +B über K in Linearfaktoren zerfällt. Der allgemeine Befall bedarf eines zusätzlichen Schritts. (III) Sei K ein Zahlkörper. Wir wählen eine endliche Körpererweiterung F ⊇ K, welcher alle Nullstellen von x3 +Ax+B enthält. Dann ist nach (I) und (II) die Faktorgruppe E(F )/2E(F ) endlich. Nach Satz 5.45 ist E(F ) endlich erzeugt. Aber E(K) ist eine Untergruppe von E(F ) und daher auch endlich erzeugt. Insbesondere stellen wir wie in Bemerkung 5.44 fest, dass E(K)/2E(K) endlich ist. Das Argument in Schritt (III) ist bereits ein vollständiger Beweis. Wir müssen also noch den Gruppenhomomorphism ϕ aus (I) konstruieren und die Eigenschaft in (II) nachweisen. 105 5. Höhenfunktionen Bemerkung 5.52. Seien E eine elliptische Kurve über einem Körper K, die durch eine kurze Weierstrass y 2 = x3 + Ax + B mit Annahme 5.50 präsentiert ist. Ein wichtiger Aspekt in der Untersuchung von E(K)/2E(K) ist die Frage, wann sich ein Punkt Q ∈ E(K) als 2P mit P ∈ E(K) schreiben lässt. In anderen Worten, welche Elemente aus E(K) lassen sich “durch zwei dividieren”? Wir wollen hier diesem Problem nachgehen. Dazu untersuchen wir zuerst eine notwendige Bedigung, dass Q in 2E(K) liegt. Sicher liegt Q = 0 in 2E(K). Sei also nun Q = 2P mit P ∈ E(K) und Q = (x1 , ∗) 6= 0. Also P = (x0 , y0 ) ∈ E(K) mit y0 6= 0 und m = (3x20 + A)/(2y0 ) ∈ K. Dann is m die Steigung der Tangent an E durch P . Setzen wir q = y0 − mx0 ∈ K, so beschreibt y = mx + q die Tangent an E durch P . Der Schnittpunkt dieser Tangent mit E liefert −P . Wir schreiben G = Y 2 − (X 3 + AX + B). Im Beweis von Skript Elliptische Kurven I, Lemma 1.100(ii) haben wir gesehen, dass G(X, mX + q) = −(X − x0 )2 (X − x1 ). Die doppelte Nullstelle ist ein Konsequenz der Tangente. Nun ersetzen wir X durch αi und erhalten −(αi − x0 )2 (αi − x1 ) = G(αi , mαi + q) = (mαi + q)2 − (αi3 + Aαi + B) = (mαi + q)2 {z } | =0 für i ∈ {1, 2, 3}. Aus y0 6= 0 folgt x0 6= αi und eine einfache Umformung ergibt 2 mαi + q x1 − αi = . x0 − α i (5.34) Alle Elemente der rechten Seite liegen in K, insbesondere ist die rechte Seite das Quadrat eines Elements aus K (aber möglicherweise Null). Wir haben die folgende Implikation bewiesen (x1 , ∗) ∈ 2E(K) r {0} =⇒ x1 − αi ist ein Quadrat in K für alle i ∈ {1, 2, 3}. (5.35) Beispiel 5.53. Wir untersuchen die elliptische Kurve E : y 2 = x3 − 25x über Q. Die Punkte der Ordnung 2 sind (±5, 0) und (0, 0). In diesem Beispiel ist α1 = 5, α2 = −5 und α3 = 0. Weiterhin gibt es einen (−4, 6) ∈ E(Q) mit 1681 ,∗ . 2(−4, 6) = 144 In der Notation der Bemerkung ist P = (−4, 6). Die Steigung der Tangente an P ist m = 23/12 und q = 41/3 bestimmt die Verschiebung. Mit x1 = 1681/144 stellen wir 31 2 6 : αi = 5, 49 2 x1 − α i = : αi = −5, 12 41 2 : αi = 0 12 106 5.5. Beweis des schwachen Satzes von Mordell-Weil fest. Wie behauptet ist also x1 − αi stets ein Quadrat ist Q. Anderseits ist −9 : αi = 5, 1 : αi = −5, x0 − αi = −4 − αi = −4 : αi = 0 nicht immer ein rationales Quadrat. Es folgt, dass P = (−4, 6) kein Verdoppelung eines Punktes E(Q) ist. Die Umkehrung von (5.35) stimmt, wie wir im nächsten Lemma sehen werden. Lemma 5.54. Seien E und K wie in Bemerkung 5.52, insbesondere ist Annahme 5.50 erfüllt. Sei Q = (x1 , ∗) ∈ E(K) r {0}, dann gilt Q ∈ 2E(K) r {0} ⇐⇒ x1 − αi ist ein Quadrat in K für alle i ∈ {1, 2, 3}. Beweis. Wegen Bemerkung 5.52 müssen wir nur die Implikation “⇐=” beweisen. Daher existiert für jedes i ∈ {1, 2, 3} ein ui ∈ K mit x1 − αi = u2i . Weiterhin wissen wir, dass Q = 2P für ein P ∈ E wegen Lemma 5.47. Das Problem ist, dass wir nicht sicher sein können, dass P in E(K) liegt. Wegen P 6= 0 können wir P = (x0 , y0 ) mit x0 , y0 ∈ K schreiben. Es gelten die drei Gleichungen (5.34) für i = 1, 2, 3, d.h. 2 mαi + q = x1 − αi = u2i x0 − α i wobei m und q die Tangente an E durch P beschreiben. Nachdem wir nach Bedarf die Vorzeichen der ui angepasst haben, gilt sogar mαi + q = ui x0 − α i Dieses Gleichungssystem lässt sich u1 −α1 u2 −α2 u3 −α3 und mαi + q = ui (x0 − αi ). wie folgt in Matrixform umschreiben α1 u1 −1 x0 −1 m = α2 u2 . α3 u3 −1 q (5.36) (5.37) Wir zeigen später, dass die Determinant D der 3 × 3 Matrix nicht verschwindet. Weil ui , αi ∈ K für alle i folgt hieraus durch Matrixinversion, dass x0 , m, q ∈ K. Aber P liegt auf der Tangente, also −y0 = mx0 + q ∈ K und damit P = (x0 , y0 ) ∈ E(K). Wegen Q = 2P ∈ 2E(K) folgt hieraus das lemma. Mir müssen noch nachweisen, dass D nicht verschwindet. Es gilt D = u1 (α2 − α3 ) + u2 (α3 − α1 ) + u3 (α1 − α2 ) = u1 (u23 − u22 ) + u2 (u21 − u23 ) + u3 (u22 − u21 ) da αi − αj = (x1 − u2i ) − (x1 − u2j ) = u2j − u2i . Man findet D = (u2 − u3 )(u1 − u3 )(u1 − u2 ) und weiter (u2 + u3 )(u1 + u3 )(u1 + u2 )D = (u22 − u23 )(u21 − u23 )(u21 − u22 ) = (α3 − α2 )(α3 − α1 )(α2 − α1 ). 107 5. Höhenfunktionen Aber X 3 +AX +B hat keine mehrfache Nullstelle, da die elliptische Kurve keine Singularitäten besitzt, cf. Skript Elliptische Kurven I, Beispiel 1.25. Damit sind die αi paarweise verschieden und insbesondere D 6= 0. Beispiel 5.55. Ist E wieder durch y 2 = x3 − 25x = (x − 5)(x + 5)x über Q gegeben, dann implizert das letzte Lemma, dass (−4, 6) nicht in E(Q) liegt, da −4 − 5 = −9 kein Quadrat in Q ist. Wir können E auch als elliptische Kurve über R betrachten. Natürlich ist −9 kein Quadrat in R, also ist (−4, 6) kein Element von E(R). Aber √ √ −4 − 5 = −9 = (3 −1)2 , −4 − (−5) = 1 = 12 und − 4 − 0 = −4 = (2 −1)2 √ √ sind Quadrate in Q( −1). Also müsste wegen Lemma 5.54 der Punkt in E(Q( −1)) liegen. In der Tat gilt z.B. √ √ [2] 2 + −1, −1 + 7 −1 = (−4, 6). Nun können wir den in Teil (I) der Beweisstrategie angekündigten Gruppenhomomorphismus E(K) → (K × /K ×2 )3 konstruieren. Einen Punkt (x1 , ∗) möchten wir auf die Restklasse von x1 − αi schicken. Die drei möglichen i liefern drei mögliche Indizes. Dabei müssen im Falle x1 = αi Sorge tragen. Definition-Lemma 5.56. Seien E und Annahme 5.50 erfüllt. Sei Q ∈ E(K) und K ×2 = 1 : ×2 (x1 − αi )K : ϕi (Q) = (αi − αj )(αi − αk )K ×2 : K wie in Bemerkung 5.52, insbesondere ist i ∈ {1, 2, 3}, wir definieren falls Q = 0, falls Q = (x1 , ∗) und x1 6= αi , falls Q = (αi , 0) und {i, j, k} = {1, 2, 3}. Dann ist ϕ = (ϕ1 , ϕ2 , ϕ3 ) : E(K) → ((K × )/K ×2 )3 ein Gruppenhomomorphismus mit Kern 2E(K). Beweis. Für jedes i ∈ {1, 2, 3, } ist die Abbildung ϕi wohldefiniert, da im dritten Fall (αi − αj )(αi − αk ) 6= 0 gilt. Seien Q, Q0 , Q00 ∈ E(K) Punkte mit Q ⊕ Q0 ⊕ Q00 = 0. Wir werden zuerst ϕi (Q)ϕi (Q0 )ϕi (Q00 ) = 1 (5.38) nachweisen. Dazu müssen wir einige Fälle unterscheiden. Seien zunächst zwei unter den Q, Q0 , Q00 gleich, z.B. Q = Q0 . Dann gilt Q00 = −2Q, also ϕi (Q00 ) = 1 wegen (5.35) im Fall Q00 6∈ E[2], dies stimmt auch für Q00 ∈ E[2] r {0} und Q00 = 0. Nun gilt ebenfalls ϕi (Q)ϕi (Q0 ) = ϕi (Q)2 = 1. Hieraus folgt (5.38), falls zwei unter Q, Q0 , Q00 übereinstimmen. 108 5.5. Beweis des schwachen Satzes von Mordell-Weil Ist Q = 0 oder Q0 = 0 oder Q00 = 0, so ist (5.38) auch erfüllt. Seien also alle Q, Q0 , Q00 ungleich Null und paarweise verschieden. Damit ist Q = (x1 , ∗), Q0 = (x01 , ∗), Q00 = (x001 , ∗) und die x1 , x01 , x001 sind paarweise verschieden. Es gibt eine Geradengleichung y = mx + q, die auf genau diesen Punkte von E verschwindet. Da die x1 , x01 , x001 verschieden sind, folgt (mX + q)2 − (X 3 + AX + B) = −(X − x1 )(X − x01 )(X − x001 ) = (x1 − X)(x01 − X)(x001 − X). (5.39) Substituiert man αi für X, findet man, dass (mαi + q)2 = (x1 − αi )(x01 − αi )(x001 − αi ) ein Quadrat in K ist. Ist dieses Quadrat ungleich Null, so folgt ϕi (Q)ϕi (Q0 )ϕi (Q00 ) = 1, was zu zeigen war. Das Quadrat verschindet wenn genau ein Q, Q0 , Q00 von der Form (αi , 0) ∈ E[2] ist. Ohne Einschränkung ist x1 = αi . Durch Ableitung von (5.39) nach X erhält und Auswertung an αi erhält man unter Berücksichtigung von mα1 + q = 0 die zweite Gleichheit in (αi − αj )(αi − αk ) = 3α12 + A = (x01 − αi )(x001 − αi ) mit {i, j, k} = {1, 2, 3}. Per Definition repräsentiert die linke Seite ϕi (Q) und die rechte Seite repräsentiert ϕi (Q0 )ϕi (Q00 ). Es folgt ϕ(Q)ϕi (Q0 )ϕi (Q00 ) = ϕi (Q)2 = 1. Also ist beweisen, dass jedes ϕi ein Gruppenhomomorphismus ist. Ist Q ∈ 2E(K) kein Element von E[2], so ist ϕi (Q) = 1 für alle i wegen Lemma 5.54. Liegt Q ∈ 2E(K) r {0} in E[2] so gilt bspw. Q = (α1 , 0). Für i 6= 1 ist α1 − αi ∈ K ×2 , also ϕ1 (Q) = (α1 − α2 )(α1 − α3 )K ×2 = 1. Folglich ist 2E(K) im Kern von ϕ enthalten. Sei umgekehrt Q ∈ E(K) mit ϕ(Q) = 1, dann ist Q ∈ 2E(K) wegen Lemma 5.54. Es folgt, dass 2E(K) der Kern von ϕ ist. Beispiele 5.57. (i) Wir untersuchen weiter die Kurve E : y 2 = x3 − 25x aus den Beispielen 5.53 und 5.55. Wegen X 3 − 25X = (X − α1 )(X − α2 )(X − α3 ) mit α1 = 5, α2 = −5, α3 = 0 ist E[2] = {0, (5, 0), (−5, 0), (0, 0)}. Ist der Punkt (5, 0) in E(Q) durch 2 teilbar? Sein Bild ist ϕ((5, 0)) = (5−(−5))(5−0), 5−(−5), 5−0 (Q×2 )3 = (50, 10, 5)(Q×2 )3 = (2, 10, 5)(Q×2 )3 . Da weder 2, 10 noch 5 rationale Quadrate sind ist (5, 0) 6∈ 2E(Q). √ √ Im Zahlkörper K = Q( 2, 5) existieren Wurzeln von 2, 10 und 5. Also müsste (5, 0) in 2E(K) liegen. Es gilt bspw. √ √ √ √ √ 2P = (5, 0) mit P = 5 + 5 2, 5(2 + 2) 5 ∈ E(Q( 2, 5)). 109 5. Höhenfunktionen (ii) Wir schauen uns jetzt E : y 2 = x3 − 1596x + 23920 über Q an. Die Punkte der Ordnung 2 sind (26, 0), (20, 0) und (−46, 0). In E(Q) existieren Punkte P = (−24, 220) und Q= 136 1540 , 9 27 . Wir berechnen ϕ(P ) = (−2 · 52 , −22 · 11, 2 · 11)(Q×2 )3 = (−2, −11, 22)(Q×2 )3 und ϕ(Q) = −2 · 72 −22 · 11 2 · 52 · 11 , , 32 32 32 (Q×2 )3 = (−2, −11, 22)(Q×2 )3 . Insbesondere gilt P 6∈ 2E(Q) und Q 6∈ 2E(Q). Weil ϕ ein Gruppenhomomorphismus ist und wegen ϕ(P ) = ϕ(Q), haben wir ϕ(P ⊕ Q) = ϕ(P )ϕ(Q) = ϕ(P )2 = 1. Also müsste P ⊕ Q ∈ 2E(Q) liegen. In der Tat gilt 105 −85 P ⊕Q= , = 2(53, −297). 4 8 (iii) Sei K ein Körper, so dass K × /K ×2 eine endliche Gruppe ist, z.B. K = R. Dann ist E(K)/2E(K) eine endliche Gruppe für jede elliptische Kurve E, die mittels einer kurzen Weierstrassgleichung über K definiert ist und E[2] ⊆ E(K) erfüllt. Um Teil II der Strategie zu bearbeiten müssen wir noch nachweisen, dass ϕ in (K × /K ×2 )3 endliches Bild besitzt, falls K ein Zahlkörper ist. Wir exerzieren dies zuerst an einem expliziten Beispiel. Beispiele 5.58. (i) Sei E die elliptische Kurve y 2 = x3 − 25x über K = Q. Wir wissen, dass E[2] = {0, (5, 0), (−5, 0), (0, 0)} und in Beispiel 5.57(i) haben wir ϕ((5, 0)) = (2, 10, 5)(Q× /Q×2 )3 berechnet. Man findet weiter ϕ((−5, 0)) = (−10, 2, −5)(Q× /Q×2 )3 und ϕ((0, 0)) = (−5, 5, −1)(Q× /Q×2 )3 . Sei nun Q = (x1 , y1 ) ∈ E(Q) r E[2], also x1 ∈ 6 {5, −5, 0}. Wir schreiben x1 − 5 = 2 ±a1 b1 mit a1 ein quadratfreies Produkt aus Primzahlen und b1 ∈ Q× . Weiterhin bezeichnet u1 ∈ {±1} das Vorzeichen. Ähnlich bestimmt man a2,3 ∈ N, b2,3 ∈ Q× , u2,3 ∈ {±1}, so dass x1 + 5 = u2 a2 b22 110 und x1 = u3 a3 b23 . 5.5. Beweis des schwachen Satzes von Mordell-Weil Also wird ϕ(Q) von (u1 a1 , u2 a2 , u3 a3 ) repräsentiert. Da es nur endlich viele Möglichkeiten für (u1 , u2 , u3 ) ∈ {±1}3 gibt, müssen wir zeigen, dass es nur endlich viele Möglichkeiten für (a1 , a2 , a3 ) gibt. Nehmen wir das Produkt, so erhalten wir y12 = (x1 − 5)(x1 + 5)x1 = (u1 u2 u3 )(a1 a2 a3 )(b1 b2 b3 )2 6= 0, es ist ein Quadrat in Q× . Für jede Primzahl p gilt 2ordp (y1 ) = ordp (a1 a2 a3 ) + 2ordp (b1 b2 b3 ), also sind a1 a2 a3 und u1 u2 u3 Quadrate in Z. Insbesondere gilt u1 u2 u3 = 1. D.h. ein Primteiler von einem ai teilt genau eine Zahl unter aj , ak wobei {i, j, k} = {1, 2, 3}. Es gibt also ganze quadratfreie Zahlen c1 , c2 , c3 ≥ 1 mit a1 = c 2 c 3 , a2 = c1 c3 , und a3 = c 1 c 2 . Für ein Primteiler p von c3 gilt p | a1 und p | a2 . Also p | a2 − a1 . Wir wollen ordp (b1 ) ≥ 0 zeigen. Dazu nehmen wir ordp (b1 ) < 0 an. Dann gilt ordp (x1 − 5) = ordp (u1 a1 b21 ) = ordp (a1 ) + 2ordp (b1 ) = 1 + 2ordp (b1 ) ≤ 1 − 2 = −1 und damit ist ordp (x1 ) negativ und ungerade. Wir erhalten, dass ordp (x1 − 5) = ordp (x1 + 5) = ordp (x1 ) < 0 ungerade ist. Aber (5.58) impliziert 2ordp (y1 ) = 3ordp (x1 ). Folglich müsste ordp (x1 ) gerade sein, ein Widerspruch. Also gilt ordp (b1 ) ≥ 0. Analog finden wir ordp (b2 ) ≥ 0. Es gilt − 10 = (x1 − 5) − (x1 + 5) = u1 a1 b21 − u2 a2 b22 (5.40) und ordp (u1 a1 b21 −u2 a2 b22 ) ≥ min{ordp (u1 a1 b21 ), ordp (u2 a2 b22 )} ≥ min{ordp (a1 ), ordp (a2 )} ≥ 1. Also ist p ein Teiler von 10. Wir haben gezeigt, dass c3 nur 2 oder 5 als Primteiler besitzen kann. Weil c3 quadratfrei ist, folgt c3 ∈ {1, 2, 5, 10}. Insbesondere gibt es nur endlich viele Möglichkeiten für c3 . Für c1 und c2 geht man analog vor und findet c1 | 5 sowie c2 | 5. Folglich gibt es nur endlich viele Möglichkeiten für (c1 , c2 , c3 ). Weil c2 c3 , c1 c3 und c1 c2 quadatfrei sind, gibt es nur die folgenden acht Möglichkeiten. (1, 1, 1), (1, 1, 2), (1, 1, 5), (1, 5, 1), (1, 5, 2), (5, 1, 1), (5, 1, 2), (1, 1, 10). Die entsprechenden möglichen sieben Tupeln (a1 , a2 , a3 ) sind (1, 1, 1), (2, 2, 1), (5, 5, 1), (5, 1, 5), (10, 2, 5), (1, 5, 5), (2, 10, 5), (10, 10, 1). Dazu müssen wir die vier Vorzeichen Tripel (u1 , u2 , u3 ) ∈ {±1}3 mit u1 u2 u3 = 1 berücksichtigen. Es gibt also höchstens 4 · 8 = 32 Möglichkeiten für ϕ(Q). Unter diesen befinden sich ϕ(E[2]). 111 5. Höhenfunktionen Aber nicht alle 32 Möglichkeiten tretten in ϕ(E(Q) r E[2]) tatsächlich auf. Für die Wahl (a1 , a2 , a3 ) = (10, 10, 1) und (u1 , u2 , u3 ) = (1, −1, −1) vereinfacht sich (5.40) zu −1 = b21 + b22 . Diese Gleichung ist besitzt jedoch keine Lösung über Q, führt also zu einem Widerspruch. Demnach gilt #E(Q)/2E(Q) = #Bild(ϕ) ≤ 31. In der Faktorgruppe E(Q)/2E(Q) hat jedes Element Ordnung 1 oder 2. Somit muss E(Q)/2E(Q) ∼ = (Z/2Z)s für ein s gelten. Hieraus folgt jetzt #E(Q)/2E(Q) ≤ 16. (5.41) Wegen Satz 5.45 stellen wir fest, dass E(Q) endlich erzeugt ist. Mit dem Satz von Lutz-Nagell, Skript Elliptische Kurven I, Satz 3.20, kann man überprüfen, dass E[2] die einzigen Punkte endlicher Ordnung von E(Q) sind. Also gibt es r ≥ 0 mit E(Q) ∼ = E[2] × Zr . In Beispiel 5.53 haben wir den Punkt (−4, 6) 6∈ E[2] unendlicher Ordnung untersucht. Also haben wir r ≥ 1. Wir finden E(Q)/2E(Q) ∼ = E[2] × (Z/2Z)r . Weil E[2] genau vier Elemente besitzt, können wir aus (5.41) die Schranke r ≤ 2 ableiten. Es gibt also zwei Möglichkeiten r = 1 oder r = 2. Den Fall r = 2 lässt sich nun nicht ohne weiteres ausschliessen. (ii) Nun untersuchen wir mit den selben Ideen die Kurve E : y 2 = x3 − 412 x. Hier sind die Punkte der Ordnung 2 rational, da E[2] = {0, (41, 0), (−41, 0), (0, 0)}. Mit dem Satz von Lutz-Nagell kann man zeigen, dass E[2] die Gruppe der Punkte endlicher Ordnung von E(Q) ist. Wir im ersten Beispiel findet man, dass jedes Element in ϕ(E(Q)) von (u1 a1 , u2 a2 , u3 a3 ) mit (a1 , a2 , a3 ) ∈{(1, 1, 1), (2, 2, 1), (41, 41, 1), (82, 82, 1), (41, 1, 41), (82, 2, 41), (1, 41, 41), (2, 82, 41)} und (u1 , u2 , u3 ) ∈ {±1}3 wobei u1 u2 u3 = 1 repräsentiert wird. Es folgt wieder #ϕ(E(Q)) ≤ 32. Und wieder können wir ein Fall, hier (82, −82, −1), ausschliessen, da b21 + b22 = −1 in Q unlösbar ist. Also #ϕ(E(Q)) ≤ 31 und damit #ϕ(E(Q)) ≤ 16. Es folgt E(Q) ∼ = E[2] × Zr . Wieder gilt Bild(ϕ) ∼ = E(Q)/2E(Q) ∼ = E[2] × (Z/2Z)r . 112 5.5. Beweis des schwachen Satzes von Mordell-Weil Weil das Bild höchstens 16 Elemente enthält, gilt r ≤ 2 und sogar 2r = #Bild(ϕ) . 4 (5.42) Dieses mal haben wir Glück, denn es gibt weitere Punkte P = (−9, 120) und Q = (841, 24360) in E(Q). Sie haben unendliche Ordnung wegen P, Q 6∈ E[2]. Wir erhalten ϕ(P ) = (−2, 2, −1)(Q×2 )3 und ϕ(Q) = (2, 2, 1)(Q×2 )3 . Wir kürzen S = (41, 0) ∈ E[2] und T = (−41, 0) ∈ E[2]. Sei G die von ϕ(S), ϕ(T ), ϕ(P ), ϕ(Q) erzeugte Untergruppe von Bild(ϕ) ⊆ (Q× /Q×2 )3 . Wir wissen, dass #G ≤ 16. Nun werden wir #G = 16 beweisen. Da jedes Element in (Q× /Q×2 )3 durch Quadrierung trivial wird, können wir diese Gruppe und auch G als F2 -Vektorraum betrachten. Es reicht zu zeigen, dass ϕ(S), ϕ(T ), ϕ(P ), ϕ(Q) linear unabhängig als Elemente dieses Vektorraums sind sind. Seien a, b, c, d ∈ Z mit ϕ(S)a ϕ(T )b ϕ(P )c ϕ(Q)d = 1. Wir müssen zeigen, dass a, b, c, d allesamt gerade sind. Dazu berechnen wir ϕ(S) und ϕ(T ) und setzen ein 1 = ϕ(S)a ϕ(T )b ϕ(P )c ϕ(Q)d = ((−1)b+c ·2a+b+c+d ·41b , 2a+b+c+d ·41a , (−1)b+c ·41a+b )(Q×2 )3 . Es folgt b + c ≡ a + b + c + d ≡ b ≡ a ≡ a + b ≡ 0 (mod 2). Hieraus folgt sofort, dass a ≡ b ≡ c ≡ d ≡ 0 (mod 2). Es folgt #G = 16 und wegen G ⊆ Bild(ϕ) auch #Bild(ϕ) = 16. Mit (5.42) finden wir r = 2. Also E(Q) ∼ = E[2] × Z2 . Dieses Argument zeigt sogar, dass P und Q unabhängig sind, d.h. aP + bQ = 0 mit a, b ∈ Z impliziert a = b = 0. Um dieses Argument zu verallgemeinern, müssen wir eine Bedingung an den Körper K stellen. Erinnerung. Elemente r und r0 eines Rings R heissen assoziert, falls es eine eine Einheit u ∈ R× gibt, mit r = ur0 . Dies induziert eine Äquivalenzrelation auf R. Ein Element p eines Rings ist ein Primelement, falls p weder Null noch eine Einheit ist, und falls p | ab mit a, b ∈ R =⇒ p | a oder p | b. In einem faktoriellen Ring besitzt jedes Element ungleich Null eine Primfaktorzerlegung, die bis auf die Reihenfolge und bis auf Assoziation eindeutig ist. 113 5. Höhenfunktionen Definition 5.59. Sei R ein faktorieller Ring und a ∈ R r {0}. Dann existiert u ∈ R× und paarweise nicht assozierte Primelemente p1 , . . . , pg ∈ R sowie ganze Zahlen e e1 , . . . , en ≥ 1 mit a = upe11 · · · pgg . Wir definieren ω(a) = g, die Anzahl nicht assozierter Primteiler von a. Proposition 5.60. Seien E eine elliptische Kurve über einem Körper K die in kurzer Weierstrassform gegeben ist und welche Annahme 5.50 erfüllt. Weiterhin nehmen wir an, dass α1 , α2 , α3 in einem Unterring R ⊆ K enthalten sind, welcher die folgenden Eigenschaften besitzt. (i) Der Quotientenkörper von R ist K. (ii) Der Ring R ist ein faktorieller Ring. (iii) Der Quotient R× /R×2 ist endlich. Dies gilt falls R× endlich erzeugt ist wegen Bemerkung 5.44. Dann ist E(K)/2E(K) endlich und besitzt höchstens # R× /R×2 2 P 2 1≤i<j≤3 ω(αi −αj ) (5.43) Elemente. Bemerkungen 5.61. Bevor wir zum Beweis kommen, sei erwähnt, dass der Ring Z die Eigenschaften (i), (ii) und (iii) erfüllt im Fall K = Q. Für einen beliebigen Zahlkörper K erfüllt R = ZK Eigenschaft (i). Dirichelts Einheitensatz impliziert (iii), aber Eigenschaft (ii) ist in der Regel für ZK nicht erfüllt. Weiterhin kann man nicht erwarten, dass die αi Elemente von ZK sind. Diese zwei Mankos werden wir später beheben müssen. Beweis. Sei S eine Menge von Repräsentanten der Primelemente aus R modulo Assoziae tion. Also ist jedes Element in K × von der Form upe11 · · · pgg mit u ∈ R× , p1 , . . . , pg ∈ S und e1 , . . . , eg ∈ Z r {0}. Hier ist u eindeutig und die pi mit den entsprechenden Exponenten sind bis auf ihre Reihenfolge eindeutig. Wir wählen weiterhin eine endliche Teilmenge U ⊆ R× , dessen Elemente R× /R×2 repräsentieren. Es gilt #U = #(R× /R×2 ). Sei Q = (x1 , y1 ) ∈ E(K) r E[2]. Per Definition wird ϕ(Q) von (x1 − α1 , x1 − α2 , x1 − α3 ) repräsentiert. Für jedes i ∈ {1, 2, 3} exist bi ∈ K mit x1 − αi = b2i ui ai , wobei ai ein Produkt aus paarweisen verschiedenen Elementen aus S ist und ui ∈ U . Da U endlich ist, müssen überprüfen, dass es nur endlich viele Möglichkeiten für das Tripel (a1 , a2 , a3 ) gibt. Es gilt 0 6= y12 = (x1 − α1 )(x1 − α2 )(x1 − α3 ) = (b1 b2 b3 )2 (u1 u2 u3 )(a1 a2 a3 ). (5.44) Wegen αi ∈ R muss ein Primelement im Nenner von x1 mit gerade Multiplizität auftauchen. Die gleiche Potenz dieses Primelements taucht im Nenner von b2i ui ai auf. Es 114 5.5. Beweis des schwachen Satzes von Mordell-Weil folgt, dass der Nenner von bi und ai teilerfremd sind. Wegen der Eindeutigkeit der Primfaktorisierung und wegen (5.44), müssen die Exponenten in der Primfaktorisierung von a1 a2 a3 gerade sein. Also ist a1 a2 a3 ein Quadrat in R. Folglich existieren c1 , c2 , c3 , die jeweils Produkte von verschiedenen Primelemente in S sind, so dass a1 = c2 c3 , a2 = c1 c3 und a3 = c1 c2 . Sei p ∈ S ein Teiler von c3 , also p | a1 und p | a2 . Weil aber a1 teilerfremd zum Nenner b1 ist, teilt p den Nenner von x − α1 . Analog sieht man, dass p ebenfalls den Nenner von x − α2 teilt. Folglich teilt p die Differenz (x − α2 ) − (x − α1 ) = α1 − α2 , also c3 | α1 − α2 . Damit gibt es höchstens ω(α1 − α2 ) mögliche Primteiler in S von c3 . Weil c3 quadratfrei ist, bleiben höchstens 2ω(α1 −α2 ) Möglichkeiten für c3 . Aus Symmetriegründen gibt es für {i, j, k} = {1, 2, 3} höchstens 2ω(αj −αk ) mögliche ci . Für das Tripel (c1 , c2 , c3 ) und somit für (a1 , a2 , a3 ) gibt es nur endlich viele Möglichkeiten, deren Anzahl ist durch P 2 1≤i<j≤3 ω(αi −αj ) (5.45) beschränkt. Aus (5.44) folgt, dass u1 u2 u3 ∈ K ×2 . Wir benutzen erneut die Faktorialität, um zu schliessen, dass u1 u2 u3 ∈ R×2 . Daher wird u3 modulo R×2 von u1 , u2 bestimmt. Folglich gibt es höchstens 2 # R× /R×2 (5.46) Möglichkeiten für (u1 , u2 , u3 ). Also ist das Produkt aus (5.45) und (5.46) eine Schranke für die Anzahl Möglichkeiten modulo (K ×2 )3 von ϕ(Q), falls Q ∈ E(K) r E[2]. Für Q ∈ E[2] kommen höchstens vier Möglichkeiten dazu. Geht man die Definition durch, so stellt man fest, dass diese Bild bereits oben mitgezählt wurden. Ist z.B. Q = (α1 , 0), so haben wird ϕ(Q) von (c2 c3 , c1 c3 , c1 c2 ) mit c1 = 1, c2 = α1 − α3 und c3 = α1 − α2 repräsentiert. Damit haben wir gezeigt, dass #ϕ(E(K)) durch die rechte Seite von (5.43) beschränkt ist. Wegen Definition-Lemma 5.56 gilt #ϕ(E(K)) = #(E(K)/2E(K)) und hieraus folgt die Proposition. Bemerkung 5.62. Wir sind nun sehr nahe daran, den schwachen Satz von MordellWeil für Zahlkörper zu beweisen und damit den eigentlichen Satz von Mordell-Weil zu beweisen. Sei K ein Zahlkörper und E eine elliptische Kurve über K in kurzer Weierstrassform. Ist Cl(K) trivial, dann ist ZK ein Hauptidealring und damit insbesondere ein faktorieller ×2 Ring. Wegen Dirichlets Einheitensatz, Satz 3.21, ist Z× K /ZK endlich. In diesem Fall folgt aus Satz 5.45 und Proposition 5.60, dass E(K) endlich erzeugt ist, falls E[2] ⊆ E(K). Das Endspiel besteht darin, den Fall zu behandeln, wenn Cl(K) nicht trivial ist. Dazu benötigen wir die zusätzliche Freiheit, die uns Proposition 5.60 bietet. Es reicht einen Ring R mit ZK ⊆ R ⊆ K zu finden, der (ii) und (iii) der Proposition erfüllt. Dies werden wir nun tun. Die grundlegende Idee ist es, maximale Ideale von ZK die keine Hauptideale sind zu eliminieren. Dabei wir sich die Einheitengruppe etwas vergrössern. 115 5. Höhenfunktionen Beispiel 5.63. Sei R = Z[1/2] ⊆ Q. Das ist der Ring aller rationaler Zahlen a/2n wobei a ∈ Z und n ≥ 0 eine ganze Zahl ist. Dieser Ring enthält Z, besitzt eine neue Einheiten 2, da 1/2 ∈ R. Man kann sich leicht davon überzeugen, dass er weiterhin ein Hauptidealring und damit faktoriell ist. Aber das maximale Ideal 2Z vergrössert sich zu 2Z[1/2] = Z[1/2]. Wir haben es also beim Übergang von Z nach Z[1/2] eliminiert. Definition-Lemma 5.64. Sei K ein Zahlkörper und S ⊆ M 0 (K) eine endliche Menge maximaler Ideale. Wir definieren ZK,S = {0} ∪ {x ∈ K × : ordP (x) ≥ 0 für alle P 6∈ S}. Dann ist ZK,S ein Unterring von K, der ZK enthält. Inbesondere ist K der Quotientenkörper von ZK,S . Für S = ∅ ist ZK,S = ZK . Die Einheitengruppe ist × Z× K,S = {0} ∪ {x ∈ K : ordP (x) = 0 für alle P 6∈ S}. Beweis. Sicher gilt 0, 1 ∈ ZK,S . Dass ZK,S abgeschlossen unter Addition und Multiplikation ist, folgt aus Eigenschaften der Valuation. Für x, y ∈ ZK,S r {0} gilt ordP (x + y) ≥ min{ordP (x), ordP (y)} ≥ 0 und ordP (xy) = ordP (x) + ordP (y) ≥ 0 für alle P 6∈ S. Also x + y, xy ∈ ZK,S . Für jedes Element x ∈ ZK gilt ordP (x) ≥ 0 für alle P ∈ M 0 (K). Hieraus folgt ZK ⊆ ZK,S . Per Definition gilt ZK = ZK,∅ und die letzte Aussage folgt auch sofort aus der Definition. Beispiel 5.65. Im Fall K = Q und S = {2} erhält man ZQ,S = Z[1/2]. Für S 0 = {2, 5} gilt ZQ,S 0 = Z[1/2, 1/5]. Im letzten Beispiel sind 2 und 5 Einheiten in ZQ,S 0 . Dirichlets Einheitensatz lässt sich auf Z× K,S ausweiten. Lemma 5.66. Sei K und S ⊆ M 0 (K) eine endliche Menge maximaler Ideale. × ×2 (i) Die Einheitengruppe Z× K,S ist endlich erzeugt. Insbesondere ist ZK,S /ZK,S endlich. (ii) Ist J ⊆ ZK,S ein Ideal, dann ist I = J∩ZK ein Ideal von ZK und es gilt IZK,S = J.1 (iii) Für jedes Ideal P ∈ S gilt P ZK,S = ZK,S . Beweis. Wir schreiben S = {P1 , . . . , Pn } und h = #Cl(K). Dann ist Pih ein gebrochenes Hauptideal πi ZK mit pi ∈ K × für alle 1 ≤ i ≤ n. Es gilt ordQ (πi ) = 0, falls Q 6= Pi ein maximales Ideal von ZK ist und ordPi (πi ) = h. Wir zeigen zuerst (i). Sei u ∈ Z× K,S . Wir definieren −ordP1 (u) v = uh π1 1 · · · πn−ordPn (u) ∈ K × . Hier ist IZK,S das von I in ZK,S erzeugte Ideal, vgl Definition-Lemma 5.11. 116 5.5. Beweis des schwachen Satzes von Mordell-Weil Dieses Element erfüllt ordPi (v) = 0 für alle i. Aber u, 1/u ∈ ZK,S , also ordP (u) = 0 für alle P 6∈ S. Da die Valuation der πi bzgl. diesen P auch verschwindet, gilt ordP (v) = 0 für alle P 6∈ S. Somit folgt ordP (v) = 0 für alle P ∈ M 0 (K). × Aus Definition-Lemma 5.64 folgt v ∈ Z× K . Die Gruppe ZK ist endlich erzeugt wegen dem × h Satz von Dirichlet. Das Element u liegt in der von ZK und den πi endlich erzeugten Untergruppe G von K × . Da f : u 7→ uh auf K × endlichen Kern hat, liegt Z× K,S in der −1 endlich erzeugten Gruppe f (G), ist also selber endlich erzeugt. Die letzte Behauptung in (i) folgt aus Bemerkung 5.44. Für (ii) bedarf nur die Aussage IZK,S = J eines Beweises. Wegen I ⊆ J und weil J ein Ideal von ZK,S ist, folgt IZK,S ⊆ J. Um die umgekehrte Inklusion zu zeigen, sei a ∈ J r {0}. Per Definiton gilt ordP (a) ≥ 0 falls P 6∈ S. Das gebrochene Hauptideal aZK ist ein Produkt P1e1 · · · Pnen M mit e1 , . . . , en ∈ Z und M ein Ideal von ZK . Jedes πi besitzt nur Primidealteiler aus S, also πi ∈ Z× K,S . hk+ei k e1 Für k ≥ 0 gross genug ist πi Pi = Pi ein Ideal in ZK , man benötigt nur hk + ei ≥ 0 für alle i. Folglich ist (π1 · · · πn )k a = P1hk+e1 · · · Pnhk+en M ZK ein Ideal in ZK . Inbesondere gilt ab ∈ ZK mit b = (π1 · · · πn )k . Also ab ∈ J ∩ ZK = I. Aber die einzigen Primidealteiler von bZK sind in S, also ordP (b) = 0 für alle P ∈ −1 M 0 (K) r S. Es folgt b ∈ Z× ∈ Ib−1 ⊆ IZK,S , was für (ii) zu K,S und damit a = (ab)b zeigen war. −1 Um (iii) zu beweisen, erinnern wir uns an πi ∈ Pih ⊆ Pi und πi ∈ Z× ∈ K,S . Also 1 = πi πi Pi ZK,S . Folglich ist Pi ZK,S = ZK,S . Schliesslich werden wir noch zeigen, dass ZK,S ein faktorieller Ring ist, falls S geeignet gewählt wurde. Proposition 5.67. Sei K ein Zahlkörper. Es existiert eine endliche Menge maximaler Ideale S0 ⊆ M 0 (K), so dass ZK,S ein Hauptidealring ist für alle endlichen Teilmengen S ⊆ M 0 (K) mit S ⊇ S0 . Beweis. Wegen der Endlichkeit der Klassengruppe existiert Ideale I1 , . . . , In ⊆ ZK ungleich Null mit Cl(K) = {[I1 ], . . . , [In ]}. D.h. zu jedem Ideal I ⊆ ZK mit I 6= 0 existiert ein 1 ≤ i ≤ n und ein α ∈ K × mit I = αIi . e Jedes Ideal Ii lässt sich in Primidealfaktoren zerlegen, also Ii = Pi1ei1 · · · Pigig wobei eij ≥ 0 ganze Zahlen sind. Für S0 nehmen wir alle möglichen Pij , also S0 = {P ∈ M 0 (K) : es gibt i mit P | Ii }. Diese Menge ist endlich. Sei S ⊇ S0 wie in der Voraussetzung und J 6= 0 ein Ideal von ZK,S . Wir müssen zeigen, dass J ein Hauptideal ist. Der Schnitt J ∩ ZK ist ein Ideal I von ZK und IZK,S = J wegen Lemma 5.66(ii). Also I 6= 0 und I = αIi für ein α ∈ K × und ein i ∈ {1, . . . , n}. Wegen Lemma 5.66(iii) ist Pij ZK,S = ZK,S , da Pij ∈ S. Also ist e IZK,S = αIi ZK,S = α(Pi1ei1 · · · Pigig )ZK,S = αZK,S ein Hauptideal. Die Proposition folgt, da J = IZK,S . 117 5. Höhenfunktionen Beweis des Satzes von Mordell-Weil. Sei F ein Zahlkörper und E eine elliptische Kurve, die durch y 2 = x3 + Ax + B mit A, B ∈ F gegeben ist. Wir werden zeigen, dass E(F ) endlich erzeugt ist. Sei K der Zerfällungskörper von X 3 + AX + B über F . Die Nullstellen von X 3 + AX + B bezeichnen wir mit α1 , α2 , α3 ∈ F . Wir betrachten E als elliptische Kurve über dem Zahlkörper K. Dann E(K) enthält alle Punkte der Ordnung 2. Wegen Proposition 5.67 gibt es eine endliche Menge S ⊆ M 0 (K) von maximalen Idealen, so dass ZK,S ein Hauptidealring ist. Insbesondere ist ZK,S faktoriell. Proposition 5.60 müssen wir sicherstellen, dass alle αi in ZK,S liegen. Dafür vergrössern wir S um alle maximalen Idealen P ∈ M 0 (K) mit ordP (α1 ) < 0 oder ordP (α2 ) < 0 oder ordP (α3 ) < 0. Es handelt sich um nur endlich viele Primideale, und αi ∈ ZK,S für alle i. ×2 Lemma 5.66(ii) impliziert, dass Z× K,S /ZK,S eine endliche Gruppe ist. Wegen ZK ⊆ ZK,S ⊆ K ist Bedingung (i) in Proposition 5.60 erfüllt. Folglich ist E(K)/2E(K) endlich und Satz 5.45 impliziert, dass E(K) endlich erzeugt ist. Deshalb muss auch die Untergruppe E(F ) endlich erzeugt sein. 118 6. Epilogue Am Ende dieser Vorlesungsreihe besprechen wir einige offene Probleme und aktuelle Resultate. 6.1. Die Vermutung von Birch und Swinnerton-Dyer Am Anfang dieser Vermutung stehen numerische Berechnung über elliptische Kurven E, welche über Q definiert sind. Die Vermutung von Birch und Swinnerton-Dyer liefert eine Verbindung zwischen der Arithmetik von E(Q) und analytischen Eigenschaften der sogenannten L-Funktion des Paares E, Q. Wir werden nun eine vereinfache Variante dieser L-Funktion einführen. Diese kombiniert Informationen aus der Zeta-Funktionen von allen möglichen Reduktionen von E modulo einer Primzahl. Beispiele 6.1. (i) Wir erinnern uns an die Definition der Zeta-Funktion der projektiven Gerade, Skript Elliptische Kurven I, Beispiel 4.6(i). Über dem endlichen Körper Fp ist sie ZP1 /Fp = exp ∞ X #P1 (Fpn ) n=1 n ! Tn = exp ∞ X 1 + pn n=1 n ! Tn = 1 . (1 − T )(1 − pT ) Dies ist ein Element in QJT K, dem Ring der formalen Potenzreihen in einer Variable T und rationalen Koeffizienten. Substituiert man p−s und s > 1 für T so erhält man ζP1 /Fp (s) = 1 (1 − p−s )(1 − p1−s ) . Diese Ausdruck ist wohldefiniert falls s ∈ R r {0, 1}. Da alle Fp als Reduktionen von Z auftauchen, möchten wir sie alle gleichzeitig betrachten. Nehmen wir formal das Produkt über alle Primzahlen p, so finden wir ! ∞ ! ∞ Y X X Y Y 1 ζP1 /Fp (s) = = p−ms p−m(s−1) −s 1−s (1 − p )(1 − p ) p m=0 m=0 p p in der zweiten Gleichung haben wir zweimal die geometrische Reihe ausgewertet. 119 6. Epilogue Wegen der Eindeutigkeit der Primfaktorzerlegung einer natürlichen Zahl gilt ∞ YX p−ms = p m=0 ∞ X n−s . n=1 Diese Summe konvergiert für s > 1 und beschreibt die Riemannsche Zetafunktion. Es folgt Y ζP1 /Fp (s) = ζ(s)ζ(s − 1) p für alle s > 2. (ii) Sei nun E eine elliptische Kurve, die mittels y 2 + axy + cy = x3 + bx2 + dx + e mit a, b, c, d, e ∈ Q definiert ist. Durch eine geeignete Wahl von u ∈ Q× und der Substitution x 7→ u2 x und y 7→ u3 y können wir annehmen, dass a, b, c, d und e ganze Zahlen sind. Es ist nicht schwer zu überprüfen, dass diese Transformation einen Gruppenisomorphismus auf den rationalen Punkten induziert. Es gibt eine endliche Menge S, so dass für jede Primzahl p 6∈ S die Gleichung y 2 + axy + cy = x3 + bx2 + dx + e eine elliptische Kurve Ep definiert, wobei a, b, c, d, e ∈ Fp die Reduktionen von a, b, c, d, e ∈ Z modulo p bezeichnen. Wir nennen Ep die Reduktion von E modulo p. Diese Reduktion existiert für alle Primzahlen bis auf endlich viele Ausnahmen und ist eine elliptische Kurve über Fp . Die Zeta-Funktion von Ep ist gemäss Skript Elliptische Kurven I, Definition 4.5 ! ∞ X #E(Fpn ) n T . ZEp /Fp = exp n n=1 Die Weil-Vermutungen für Ep , also Skript Elliptische Kurven I, Satz 4.8, implizieren (1 − ω1 T )(1 − ω2 T ) ZEp /Fp = (1 − T )(1 − pT ) mit ap = ω1 + ω2 = p + 1 − #E(Fp ) ∈ Z und ω1 ω2 = p.1 Wir imitieren das Vorgehen in Beispiel (i) und nehmen das Produkt über alle Primzahlen p - ∆ und substituieren T durch p−s . Wir erhalten Y Y Y 1 − ap p−s + p1−2s (1 − p−s )(1 − p1−s ) (1 − ap p−s + p1−2s ). = ζ(s)ζ(1 − s) (1 − p−s )(1 − p1−s ) p-∆ p-∆ p-∆ Das Produkt über alle Primteiler von ∆ kompensiert die fehlenden Faktoren in der Riemannschen Zeta-Funktion. Aber viel wichtiger ist das verbleibende Produkt über 1 − ap p−s + p1−2s . 1 Es gilt sogar ω1 = ω2 und damit |ω1 | = |ω2 | = 120 √ p. Aber dies haben wir damals nicht bewiesen. 6.1. Die Vermutung von Birch und Swinnerton-Dyer Wir defineren. L∗E/Q (s) = Y (1 − ap p−s + p1−2s )−1 . p-∆ Dies ist beinahe die L-Funktion von E. Die L-Funktion von E ist Y LE/Q (s) = L∗E/Q (s) (1 − ap p−s )−1 , p-∆ wobei ap ∈ Z für die (endlich vielen) Primteiler von ∆ definiert werden muss. Diese Definition ist delikat und wir werden sie hier nicht besprechen. Es sei aber erwähnt, dass ap ∈ {0, ±1} für p ∈ S, falls man eine geschickte Koordinatentransformation durchführt. Für s > 0 ist LE/Q (s) genau dann konvergent, wenn L∗E/Q (s) konvergent ist. Die L-Funktion von E/Q verschlüsselt wichtige Informationen über alle möglichen Reduktionen der elliptischen Kurve. Man möchte hoffen, dass sich daraus auch Informationen über E(Q) ableiten lässt. Für welche reellen Zahlen s konvergiert LE/Q (s)? Es gilt ap = p + 1 − #Ep (Fp ) und #Ep (Fp ) ≤ 2p + 1, weil es für jede Wahl einer Abzisse eines Punkts in Ep (Fp ) r {0} höchstens zwei Wahlen für die Ordinate gibt. Daraus folgt | − ap p−s + p1−2s | ≤ |ap |p−s + p1−2s ≤ 2p1−s + p−s + p1−2s ≤ 4p1−s . (6.1) Für p gross genug gilt 4p1−s < 1, falls s > 1. Q Aus der Analysis wissen wir, dass das Produkt p-∆ (1 − ap p−s + p1−2s ) konvergiert, falls es p0 gibt, so dass die Reihe X log(1 − ap p−s + p1−2s ) p≥p0 konvergiert. Wegen log(1 + t) = t + O(t2 ) für t klein genug, folgt die gewünschte Konvergenz aus der Konvergenz der Reihe X −ap p−s + p1−2s . p≥p0 Wegen (6.1) konvergiert diese letzte Reihe, falls 1 − s < −1, also wenn s > 2. √ Wenn wir die Riemannsche Vermutung für Ep /Fp benutzen, also |ω1 | = |ω2 | = p √ so erhalten wir ein besseres Resultat. Es gilt |ap | ≤ |ω1 | + |ω2 | = 2 p. Wir können (6.1) zu | − ap p−s + p1−2s | ≤ |ap |p−s + p1−2s ≤ 2p1/2−s + p1−2s ≤ 3p1/2−s . 121 6. Epilogue verbessern, falls s ≥ 1/2. Also konvergiert X −ap p−s + p1−2s p-∆ falls s > 3/2. Damit konvergiert L∗E/Q (s) für s > 3/2 und somit konvergiert auch LE/Q (s) für s > 3/2. Man überprüft leich, dass LE/Q (s) für alle komplexen Zahlen s mit Re (s) > 3/2 konvergiert. Sei V ⊆ C eine offene Menge. Eine Abbildung f : V → C heisst analytisch, falls es um jeden Punkt z0 ∈ C eine offene Kreisschreibe U ⊆ V und eine Potenzreihe P ∞ n n=0 fn (z − z0 ) gibt, so dass die Potenzreihe für alle Punkte z ∈ U konvergiert und f (z) = ∞ X fn (z − z0 )n n=0 für alle z ∈ U gilt. Zwei analytische Abbildungen f1 , f2 : C → C die auf einem Intervall (a, b) mit a < b übereinstimmen, stimmen auf ganz C überein. Eine analytische Abbildung f : C → C heisst ganz. Satz 6.2 (Wiles, Breuil-Conrad-Diamond-Taylor). Sei E eine elliptische Kurve, die über Q definiert ist, dann besitzt LE/Q (s) eine ganze Fortsetzung auf C. D.h. es gibt eine ganze Funktion C → C die mit LE/Q (s) auf {z ∈ C : Re (s) > 3/2} übereinstimmt. Vermutung 6.3 (Birch + Swinnerton-Dyer (Spezialfall)). Sei E eine elliptische Kurve, die über Q definiert ist mit Torsiongruppe E(Q)tors und E(Q) ∼ = E(Q)tors × Zr . Dann besitzt LE/Q (s) eine Nullstelle der Ordnung r bei s = 1. Um genauer zu sein, gilt r LE/Q (s) = c(s − 1) + ∞ X fn (s − 1)n n=r+1 auf einer offenen Kreisscheibe um 1, wobei R(E/Q)#X(E/Q) c= (#E(Q)tors )2 Q p wp 6= 0. Bemerkung 6.4. Wir erklären einige der Grössen, die in der Konstant c auftreten. (i) Der Faktor R(E/Q) heisst Regulator von E und kommt wie folgt zustande. Die Gruppe E(Q) hat Rang r. Es gibt also P1 , . . . , Pr ∈ E(Q), so dass E(Q) = E(Q)tors + P1 Z + · · · + Pr Z. Die Punkte P1 , . . . , Pr sind unabhängig. D.h. falls a1 , . . . , ar ∈ Z mit a1 P1 + · · · + ar Pr = 0, dann gilt a1 = · · · = ar = 0. Die Restklassen der P1 , . . . , Pr erzeugen die freie abelsche Gruppe E(Q)/E(Q)tors . 122 6.1. Die Vermutung von Birch und Swinnerton-Dyer Wir haben in Abschnitt 5.4 die Néron-Tate Höhe ĥ : E(Q) → R eingeführt. Die Paarung 1 (P, Q) = (ĥ(P ⊕ Q) − ĥ(P ) − ĥ(Q)) 2 definiert eine symmetrische Bilinearform E(Q) × E(Q) → R (dies haben wir nicht bewiesen). Es gilt (P, P ) = 21 (ĥ(2P ) − 2ĥ(P )) = ĥ(P ). Der Regulator ist die Determinante (P , P ) (P , P ) · · · (P , P ) 1 1 1 2 1 r .. .. .. ... R(E/Q) = det . . . . (Pr , P1 ) (Pr , P2 ) · · · (Pr , Pr ) Man kann sich R(E/Q) als Volumen eines Parallelepipeds vorstellen, welches von P1 , . . . , Pr aufgespannt wird. Das Volume wird bzgl. der durch ĥ1/2 induzierten euklidschen Norm bestimmt. (ii) Die Konstanten wp heissen Tawagama Zahlen und beschreiben Volumina für p ∈ {2, 3, 5, . . .} ∪ {∞}. Wir gehen nicht weiter auf diese Grössen ein. (iii) Schliesslich ist X(E/Q) die sogenannte Tate-Shafarevich Gruppe von E/Q. Dies ist die mysteriöseste Komponente in der Formel für c. Sei E durch die kurze Weierstrassgleichung y 2 = (x−α1 )(x−α2 )(x−α3 ) gegeben. Im Beweis der Endlichkeit von E(Q)/2E(Q), genauer in Proposition 5.60, haben wir gezeigt, dass ein Punkt in ϕ(Q) mit Q = (x1 , ∗) ∈ E(Q)rE[2] von (u1 a1 , u2 a2 , u3 a3 ) repräsentiert wird, welches ein Gleichungssystem x1 − α1 = u1 a1 b21 x1 − α2 = u2 a2 b22 x1 − α3 = u3 a3 b23 mit b1 , b2 , b3 ∈ Q löst. Hier sind die ui ∈ {±1} und die ai sind quadratfreie natürliche Zahlen. Durch Elimination von x1 kriegen wir α1 − α2 = u2 a2 b22 − u1 a1 b21 α1 − α3 = u3 a3 b23 − u1 a1 b21 (6.2) Umgekehrt impliziert die Existenz einer Lösung b1 , b2 , b3 ∈ Q, dass (u1 a1 , u2 a2 , u3 a3 ) ein Element in ϕ(E(Q) r E[2]) repräsentiert. Eine notwendige Bedingung für die Existenz einer rationalen Lösung ist die Existenz einer reellen Lösung. Denn existiert keine reelle Lösung b1 , b2 , b3 ∈ R von (6.2) so kann sicher auch keine rationale Lösung existieren. Die Existenz bzw. Nichtexistenz einer reellen Lösung lässt sich leicht mit Methoden der Analysis überprüfen. 123 6. Epilogue Die reellen Zahlen R sind die Vervollständigung von Q bzgl. des Standardabsolutbetrags. Es gibt für jede Primzahl p eine Vervollständigung Qp von Q bzgl. des p-adischen Absolutbetrags. Zu einem gewissen Grad kann man p-adische Analysis betreiben und entscheiden, ob (6.2) eine Lösung b1 , b2 , b3 ∈ Qp besitzt. Kurzum, besitzt (6.2) eine rationale Lösung, so besitzt sich in R sowie in Qp für jede Primzahl p eine Lösung. Leider ist die Umkehrung falsch. Die Tate-Shafarevich Gruppe X(E/Q) misst inwiefern diese Umkehrung versagt. Dies erinnert an die Klassengruppe eines Zahlkörpers, welche misst, ob der Ring der ganzen Zahlen ein Hauptidealring ist oder nicht. Im Gegensatz zur Klassengruppe ist jedoch nicht bekannt, ob X(E/Q) stets eine endliche Gruppe ist. Dies ist in sich eine schwierige und ungelöste Vermutung. Nach Arbeiten von Gross-Zagier, Kolyvagin, Wiles, Breuil-Conrad-Diamond-Taylor weiss man, das Folgende. Besitzt LE/Q (s) bei s = 1 eine Nullstelle der Ordnung m ∈ {0, 1}, so gilt E(Q) ∼ = E(Q)tors × Zm . 124 Index M (K), M 0 (K) und M ∞ (K), 79 Primelement eines Rings, 113 Produkt zweier Ideale, 28 Assozierte Elemente eines Rings, 113 Dedekindscher Ring, 27 Determinante eines Gitters, 54 Diskriminante eines Tupels, 22 Diskriminante eines Zahlkörpers, 26 Endlich erzeugter Modul, 18 Endliche Körpererweiterung, 13 Faktorieller Ring, 113 Fundamentalmasche, 54 Ganz abgeschlossener Integritätsbereich, 27 Ganze Elemente, 18 Ganze Zahlen eines Zahlkörpers, 20 Ganzer Abschluss eines Unterrings, 18 Gebrochenes Hauptideal, 33 Gebrochenes Ideal, 33 Gitter in Rd , 54 Grad einer Körpererweiterung, 13 Klassengruppe, 35 Kreisteilungskörper, 49 Reduktion einer Elliptischen Kurve modulo p, 120 Reguläre Primzahl, 67 Restklassengrad eines Primideals, 42 Ring der ganzen algebraischen Zahlen eines Zahlkörpers, 20 Signatur eines Zahlkörpers, 56 Skalarmultiplikation im Modul, 17 Spur eines Elements, 14 Summe zweier Ideale, 28 Symmetrische Teilmenge von Rd , 54 Teilerfremde Ideale, 36 Untermodul, 18 Verzweigte Primzahl, 48 Verzweigungsindex eines Primideals, 42 Weil Höhe auf elliptischen Kurven, 90 Weil Höhe einer rationalen Zahl, 77 Weil Höhe in einem Zahlkörper, 83 Zahlkörper, 13 Legendre Symbol, 45 Modul über einem Ring, 17 Monogenscher Zahlkörper, 48 Multiplikativ abhängig, 88 Néron-Tate Höhe, 97 Norm eines Elements, 15 Norm eines Ideals, 26 125