ELLIPTISCHE KURVEN mit Anwendungen in der Kryptographie Steffen Reith & Rasa & Jörn Steuding Universität Würzburg, Wintersemester 2009/10 Topologisch ist eine elliptische Kurve eigentlich nichts anderes als ein ’donut’ oder (mathematisch korrekter) ein Torus, was das Titelbild erklärt. In dieser Vorlesung beschäftigen wir uns jedoch mehr mit den arithmetischen und geometrischen Eigenschaften elliptischer Kurven sowie insbesondere deren Anwendungen in der Kryptographie. Für den Zahlentheoretiker sind rationale Punkte auf elliptischen Kurven interessant. Hier gibt es Zusammenhänge mit gewissen diophantischen Gleichungen (z.B. der Fermat-Gleichung) oder etwa dem so genannten Kongruenzzahlproblem: Gegeben eine natürliche Zahl n, entscheide man, ob es ein rechtwinkliges Dreieck mit rationalen Seitenlängen und Flächeninhalt n gibt! Ein Kryptograph hingegen studiert elliptische Kurven stets über endlichen Körpern. In den letzten Jahren wurden eine Vielfalt von Ergebnissen, Algorithmen und Implementationstechniken entwickelt, die dazu führen, dass mittelfristig die Kryptographie mit elliptischen Kurven die klassischen Verfahren in vielen Gebieten ablösen wird, benötigen Kryptosysteme, die auf elliptischen Kurven basieren, doch wesentlich kleinere Schlüssel als die Klassiker. Tatsächlich kommt die Kryptographie mit elliptischen Kurven heute schon in Systemen mit wenigen Ressourcen zum Einsatz (eingebettete Systeme), wie z.B. Steuergeräte im Automobil (bei elektronischen Wegfahrsperren, als Tuning-Schutz oder in der Car-2-Car Kommunikation). Die Theorie der elliptischen Kurven hat sich rasant entwickelt. In dieser Einführung werden wir daher nur die Fundamente der Theorie ergründen. Unsere Hauptinteressen sind dabei Anwendungen elliptischer Kurven auf zahlentheoretische Fragestellungen und Kryptogrphie. Dies erfordert einen Spagat zwischen Tiefe und Breite. Wir werden nicht alle Theoreme in ihrer vollen Allgemeinheit beweisen können. Auch werden wir nicht alle notwendigen Hilfsmittel aus anderen mathematischen Disziplinen herleiten. Die Vorlesung wird von zwei Dozenten gelesen - Steffen Reith (jeweils am Montag von 10 bis 11:30 Uhr im Raum SE 08), der über die kryptographischen Aspekte vorträgt, und - Jörn Steuding (jeweils am Freitag von 10 bis 11:30 Uhr ebenda), der zu den theoretischen Zusammenhängen vorliest. Begleitend gibt es eine Übung (jeweils montags von 17 bis 18:30 Uhr im SE 36). In der Vorlesung wird eine elementare Herangehensweise vorgenommen, d.h. Kenntnisse der algebraischen Geometrie und der Funktionen- oder Zahlentheorie werden nicht benötigt. Alle Algorithmen werden jedoch ohne Voraussetzungen hergeleitet. Dies ist nur ein Vorlesungsskript und enthält womöglich den ein oder anderen (Druck-)Fehler. Vielen Dank an Peter Dinges und Florian Göpfert für Fehlerlesen und Korrekturen einer älteren Version. Weitere Verbesserungsvorschläge und Kommentare sind daher herzlich willkommen. Viel Spaß! Inhaltsverzeichnis 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. Was sind elliptische Kurven? Elliptische Kurven über den reellen und den rationalen Zahlen Die Gruppenstruktur elliptischer Kurven Reduktion modulo p Die Assoziativität des Gruppengesetzes Fermats ’descente infinie’ Der Satz von Mordell Torsion Die Vermutung von Birch & Swinnerton-Dyer Das Kongruenzzahlproblem Literaturverzeichnis 1 13 18 24 31 35 41 48 56 63 71 II 1. Was sind elliptische Kurven? 1 1. Was sind elliptische Kurven? Keine Ellipsen! Letztere lassen sich durch Gleichungen der Form (X/a)2 + (Y /b)2 = 1 mit nichtverschwindenden reellen Zahlen a, b beschreiben. Mit der Parametrisierung x(t) = a cos t, y(t) = b sin t ergibt sich deren Bogenlänge als ein elliptische Integral (zweiter Art): Z π/2 p Z 2π p 2 2 ( dx/ dt) + ( dy/ dt) dt = 4 a2 cos2 t + b2 sin2 t dt. 0 0 Im Allgemeinen lässt sich dieses Integral nicht elementar integrieren (eine Ausnahme ist natürlich der Kreis, wenn also a = b gilt). Mit Hilfe von elliptischen Kurven findet man jedoch für diese elliptischen Integrale eine nicht-elementare Stammfunktion (was ein Thema der Funktionentheorie ist und deshalb in dieser Vorlesung nicht hergeleitet werden wird). Tatsächlich sind elliptische Kurven spezielle algebraische Kurven über einem Körper K. Dabei bedeutet das Attribut ’algebraisch’ im Wesentlichen, dass die Kurve durch eine algebraische Gleichung beschrieben werden kann. Im Falle elliptischer Kurven handelt es sich dabei um glatte kubische Kurven (ein Begriff, den wir weiter unten noch präzisieren werden) und die definierende algebraische Gleichung lässt sich meist in die Form E : Y 2 = X 3 + aX + b bringen, wobei a, b irgendwelche festen Koeffizienten aus dem Körper K sind, von denen wir bis auf weiteres der Einfachheit halber annehmen wollen, dass es ganze Zahlen sind. Wir bezeichnen mit E(K) die Menge der Punkte (x, y) ∈ K2 , die dieser Gleichung genügen, also Koordinaten im Körper K besitzen, sowie einem unendlich fernen Punkt, dessen wahre Relevanz sich allerdings erst später wirklich erschließen wird. Insbesondere die ganzzahligen bzw. die rationalen Punkte auf einer solchen Kurve sind von arithmetischem Interesse. Insofern sind elliptische Kurven Spezialfälle so genannter diophantischer Gleichungen, also algebraische Gleichungen mit rationalen Koeffizienten, die auf Lösbarkeit in ganzen oder rationalen Zahlen untersucht werden. Die Namensgebung ist zu Ehren des griechischen Mathematikers Diophant, der im dritten Jahrhundert n. Chr. in Alexandrien lebte. Über sein Leben ist nur sehr wenig bekannt; seine Werke, insbesondere seine bahnbrechende ’Arithmetica’, waren lange verschollen und wurden erst im 16. Jahrhundert wieder entdeckt. Ein berühmtes diophantisches Problem ist die Fermatsche Vermutung, welche Fermat in sein Exemplar der Diophantschen ’Arithmetica’ notierte: ”Es ist unmöglich, einen Kubus in zwei Kuben zu zerlegen, oder ein Biquadrat in zwei Biquadrate, oder allgemein irgendeine Potenz größer als die zweite in Potenzen gleichen 2 ELLIPTISCHE KURVEN Abbildung 1. Links: Diophants Buch ’Arithmetica’ in einer Ausgabe des 17. Jahrhunderts. Rechts: Pierre de Fermat, ∗ 1607/08 Beaumont-deLomagne – † 1665 Castres; französischer Jurist und Mathematiker, der nicht nur in der Zahlentheorie wichtige Akzente setzte, sondern auch Mitbegründer der analytischen Geometrie und der Differential- und Integralrechnung war. Grades. Ich habe einen wahrhaft wunderbaren Beweis gefunden, aber dieser Rand ist zu schmal, ihn zu fassen.”∗ In moderner mathematischer Sprache bedeutet dies: Die Gleichung Xn + Y n = Zn mit ganzzahligem n≥3 besitzt nur triviale Lösungen in ganzen Zahlen, d.h. also genau solche Lösungen x, y, z ∈ Z, die man sofort sieht: xyz = 0. (Wir notieren Unbekannte üblicherweise mit Großbuchstaben und Lösungen mit den entsprechenden Kleinbuchstaben.) Fermats ’Beweis’ ist jedoch nie aufgetaucht; heute geht man davon aus, dass Fermat keinen stichhaltigen Beweis hatte. Die Fermatsche Vermutung wurde schließlich 1995 von Andrew Wiles gelöst. Sein Beweis basiert auf einer Brücke zwischen elliptischen Kurven und Modulformen (das sind holomorphe Funktionen der oberen Halbebene, die einer Vielzahl von Funktionalgleichungen genügen, gewissermaßen automorph bzgl. der Gruppe SL2 (Z) sind) und ist eine Perle der modernen Mathematik. Tatsächlich handelt es sich aber nur im kubischen Fall bei der Fermat-Gleichung um eine elliptische Kurve im folgenden Sinne: Mit der Transformation U = X/Z, V = Y /Z schreibt sich die Fermat-Gleichung um zu Un + V n = 1 Lateinisch: ”Cubum autem in duos cubos, aut quadratoquadratum in duos quadratoquadratos, et generaliter nullam in infinitum ultra quadratum potestatem in duos eiusdem nominis fas est dividere. Cuius rei demonstrationem mirabilem sane detexi. Hanc marginis exiguitas non caperet.” ∗ 1. Was sind elliptische Kurven? 3 und die Fermatsche Vermutung besteht nun in dem Problem, rationale Lösungen zu finden. Dabei gehen nur triviale ganzzahlige Lösungen verloren. Falls der Exponent n = 3 ist, handelt es sich um eine glatte kubische und damit also elliptische Kurve. Vermöge der Transformation 36 + Y 36 − Y , V = 6X 6X wird die Gleichung der Fermat-Kurve auf so genannte Weierstraß-Normalform gebracht: U= U3 + V 3 = 1 −→ Y 2 = X 3 − 432. (Nachrechnen erlaubt!) Mit der Transformation X= U −V 12 , Y = 36 U +V U +V lässt sich dies auch umkehren, womit also eine birationale Abbildung zwischen diesen beiden Kurven bzw. Gleichungen gegeben ist; hierbei bedeutet birational, dass die Bijektion zwischen den Kurven rationale Punkte auf rationale Punkte abbildet (bis auf endlich viele Ausnahmen). Dabei ist natürlich zu beachten, dass bei Körpern der Charakteristik zwei oder drei hier Probleme auftreten. Zur weiteren Illustration unserer bislang nur provisorischen Definition elliptischer Kurven und der Problematik verschiedener Erscheinungsformen kubischer Kurven untersuchen wir ein der Fermat-Kurve zum Exponenten n = 3 verwandtes Beispiel. Zwischen den beiden ebenen kubischen Kurven U 3 + V 3 = 1729 ←→ Y 2 = X 3 − 1 291 438 512 besteht eine ’birationale Äquivalenz’ vermöge der bijektiven Abbildung U 7→ X := 20 748 , U +V V 7→ Y := 62 244 U −V . U +V Wie man solche birationalen Abbildungen findet, entnimmt man etwa dem Buch [4] von Knapp. Übrigens wusste bereits Ramanujan, dass die Ausgangsgleichung nur zwei Lösungen in ganzen Zahlen besitzt: 1729 = 13 + 123 = 93 + 103 , (was man unschwer mit den Faktorisierungen U 3 +V 3 = (U +V )(U 2 −U V +V 2 ) und 1729 = A · B beweist). Demgegenüber besitzt die transformierte rechte Gleichung nur endlich viele rationale Lösungen (was insbesondere Ramanujan’s Beobachtung über die Endlichkeit der ganzzahligen Lösungen impliziert). Warum solche Kurven für Zahlentheoretiker einerseits und für Kryptographen andererseits so interessant sind, wird sich uns recht bald erschließen. Zunächst wollen wir aber elliptische Kurven im Kontext algebraischer Kurven betrachten (auch wenn dieser algebraisch-geometrische Standpunkt letztlich nicht Gegenstand dieser ’elementaren’ Vorlesung sein wird). 4 ELLIPTISCHE KURVEN Abbildung 2. Links die reelle Kurve X 3 + Y 3 = 1729, rechts die reelle Kurve Y 2 = X 3 − 1 291 438 512 (beide mit den jeweiligen rationalen Punkten aus dem Text). Im Folgenden sei K ein Körper (z.B. der Körper Q der rationalen Zahlen oder der Körper R reellen Zahlen oder die komplexen Zahlen oder aber auch ein endlicher Körper) und K ein algebraischer Abschluß (also der Körper der durch Adjunktion der Wurzeln sämtlicher algebraischen Gleichungen mit Koeffizienten in K entsteht, wie z.B. der Körper der komplexen Zahlen C = R nach dem Fundamentalsatz der Algebra der algebraische Abschluß von R ist). Eine ebene algebraische Kurve C über K ist definiert durch eine Gleichung P (X , Y) = 0, wobei P ∈ K[X , Y] irreduzibel über K ist (sich also nur trivial faktorisieren lässt). Der Grad von C bzw. des Polynoms X P (X , Y) = aij X i Y j i,j ist dann definiert durch deg C = deg P = max{i + j : aij 6= 0}. Ein Punkt (x, y) ∈ K2 mit P (x, y) = 0 heißt ein K-rationaler Punkt von C und die Menge aller solchen Punkte notieren wir mit C(K). Hier ein Beispiel: Die Gleichung X Y 2 − 6X 2 − 11 = 0 definiert eine ebene Kurve über Q vom Grad drei und etwa ( 21 , 5) ∈ C(Q). In diesem Zusammenhang sei ein interessantes Problem erwähnt. Auf dem Internationalen Mathematikerkongress 1900 in Paris stellte Hilbert insgesamt 23 Probleme, welche die Entwicklung der Mathematik im zwanzigsten Jahrhundert wesentlich beeinflußt haben. Das zehnte Hilbertsche Problem lautet: ”Eine diophantische Gleichung mit irgend welchen Unbekannten und mit ganzen rationalen Zahlencoefficienten sei vorgelegt: man soll ein Verfahren angeben, nach welchem sich mittelst einer endlichen Anzahl von Operationen entscheiden läßt, ob die Gleichung in ganzen rationalen Zahlen lösbar ist.” 1. Was sind elliptische Kurven? 5 In moderner Sprache ist also nach einem Algorithmus gefragt, mit dessen Hilfe man in einer endlichen Anzahl von Schritten entscheiden kann, ob ein Polynom in mehreren Veränderlichen und mit ganzzahligen Koeffizienten, eine ganzzahlige Lösung besitzt. Yuri Matjasevich gab 1970 eine negative Antwort auf das zehnte Hilbertsche Problem: Es gibt keinen Algorithmus, der entscheidet ob eine beliebig gegebene diophantische Gleichung in ganzen Zahlen lösbar ist! Erstaunlicherweise ist über den rationalen Zahlen dieselbe Frage noch ungelöst. Hierzu gibt es ein ’Bonmot’ von Henri Darmon: “In other words: a number theorist cannot be replaced by a computer! ” Für eine Teilklasse von diophantischen Gleichungen, wie etwa die Menge der elliptische Kurven definierenden Gleichungen, ist jedoch Matyasevichs Antwort unbrauchbar. Für Teilklassen wie etwa polynomielle Gleichungen in zwei Veränderlichen ist bislang ein Algorithmus nicht ausgeschlossen. Als Nächstes wollen wir den Begriff algebraischer Kurven etwas präzisieren. Gegeben ein Polynom P ∈ K[X , Y] vom Grad deg P = d, definieren wir das zugehörige homogenisierte Polynom vom Grad deg P = d durch P̃ (X, Y, Z) := Z d P (X/Z, Y /Z); hierbei wird also X = X/Z und Y = Y /Z gesetzt und jedes Monom durch Multiplikation von Potenzen von Z auf Gesamtgrad d gebracht. Beispielsweise gilt P (X , Y) = Y 2 − X 3 − X − 7 → P̃ (X, Y, Z) = Y 2 Z − X 3 − XZ 2 − 7Z 3 . Dann erhält man das Ausgangspolynom P vermöge P (X , Y) = P̃ (X , Y, 1). Diese Konstruktion ist interessant mit Blick auf die projektive Ebene P2 (K), welche aus der affinen Ebene K2 durch den Quotienten P2 (K) = (K3 \ {0})/(K \ {0}) mittels der Äquivalenzrelation (a, b, c) ∼ (λa, λb, λc) für λ ∈ K entsteht. Man beachte, dass nebenbei P̃ (λa, λb, λc) = λd P̃ (a, b, c) gilt. Jede Äquivalenzklasse wird mit (a : b : c) notiert und die projektive Ebene P2 (K) kann entsprechend mit den Geraden durch den Ursprung 0 in K3 identifiziert werden. Dabei wird die affine Ebene K2 durch Hinzufügen einiger unendlich ferner Punkte kompaktifiziert und die Einbettung K2 ֒→ P2 (K2 ), (a, b) 7→ (a : b : 1) ist nahezu bijektiv (bis eben auf die unendlich fernen Punkte (a : b : 0), welche die projektive Gerade P1 (K) bilden). Damit beschreibt P̃ (X, Y, Z) = 0 den projektiven Abschluss C˜ in P2 (K) der algebraischen Kurve P (X , Y) = 0 6 ELLIPTISCHE KURVEN Abbildung 3. Zwei Beispiele reeller singulärer kubischer Kurven. Links die Neilsche Parabel Y 2 = X 3 , welche singulär im Ursprung ist, rechts die Kurve Y 2 = X 2 (X + 1) mit einem Dopplepunkt im Ursprung. in der affinen Ebene K2 . Die projektive Kurve C˜ besteht dann aus der affinen Kurve C und einigen unendlich fernen Punkten; im obigen Beispiel: ˜ Q) = C(Q) ∪ {O} C( mit O = (0 : 1 : 0). Dieser unendlich ferne Punkt O wird sich insbesondere bei elliptischen Kurven als äußerst wichtig erweisen. Der Vorteil der projektiven Sichtweise ergibt sich aus dem Satz von Bezout, der besagt, dass zwei projektive Kurven F (X, Y, Z) = 0 und G(X, Y, Z) = 0 vom Grad m bzw. n sich in genau mn Punkten des P2 (K) schneiden, wobei wir Vielfachheiten zählen (wie etwa im Tangentialfall), sofern F und G keinen gemeinsamen nicht-trivialen Faktor haben (klar) und K algebraisch abgeschlossen sei. Jede von diesen Bedingungen ist natürlich und kann nicht ausgelassen werden. Einen Beweis des Satzes von Bezout findet man etwa bei Knapp [4]. Bei elliptischen Kurven können wir also beim Schnitt mit irgendwelchen Geraden stets von drei Schnittpunkten ausgehen! Im Affinen ist diese Aussage hoffnunglos falsch, wie etwa das Beispiel zweier paralleler Geraden lehrt. Aber auch bei anderen algebraischen Kurven ist die projektive Sichtweise von Bedeutung. Eine affine Kurve C : P (X , Y) = 0 heißt nicht-singulär bzw. glatt (im Falle perfekter Körper K), wenn für alle Punkte (x, y) auf C der Gradient in diesem Punkt nicht verschwindet, also nicht alle partiellen Ableitungen gleich Null sind: ∂P ∂P oder 6= 0 ; gradP (x, y) 6= 0 , d.h. ∂x ∂y andernfalls nennen wir (x, y) singulär. Die projektive Kurve C˜ heißt nichtsingulär, wenn alle affinen ’Teile’ nicht-singulären sind, d.h. die Kurven P̃ (X, Y, 1) = 0 bzw. P̃ (X, 1, Z) = 0 bzw. P̃ (1, Y, Z) = 0 1. Was sind elliptische Kurven? 7 Abbildung 4. Links: Claude Gaspar Bachet de Méziriac, ∗ 9. Oktober 1581, – † 26. Februar 1638 in Bourg-en-Bresse; übersetzte u.a. die ’Arithmetica’ des Diophant in das Lateinische, was die Zahlentheorie aus der Vergessenheit des Mittelalters führte. Rechts: Euklid, ∗ 325 v. Chr., – † ca. 265 v. Chr. in Alexandria; bedeutender griechischer Mathematiker, Verfasser der ’Elemente’ und Begründer der Zahlentheorie. nicht-singulär sind; man beachte, dass diese affinen Teile zusammen genommen eine Überdeckung von C˜ liefern. Ist (x, y) nicht-singulär und K = R, so ist C um den Punkt (x, y) lokal eine glatte Kurve; für K = C hingegen sieht C lokal wie die komplexe Ebene C aus und definiert eine kompakte Riemannsche Fläche (auch dies ist ein Thema der Funktionentheorie). Nun wollen wir ebene algebraische Kurven bzgl. ihrer Grade betrachten. • deg P = 1: In diesem Fall ist C eine affine Gerade: aX + bY + c = 0 mit (a, b) 6= (0, 0). Für a, b, c ∈ Q besitzt diese lineare Gleichung bekanntlich (mit Hilfe des euklidischen Algorithmus und ein wenig elementarer Zahlentheorie) unendlich viele rationale Lösungen, d.h. – umformuliert in unsere geometrische Sprache – die Kurve C enthält unendlich viele rationale Punkte (also solche mit rationalen Koordinaten). • deg P = 2: In diesem Fall ist C eine affine Quadrik, ist also nach Hauptachsentransformation von der Gestalt aX 2 + bY 2 + c = 0. Wir betrachten zunächst den Spezialfall des Einheitskreises C : X 2 + Y 2 = 1. Interessant sind auch hier die rationalen Punkte. Wir beschreiben diese mit einer geometrischen Methode nach Bachet. Wir schneiden den Einheitskreis 8 ELLIPTISCHE KURVEN Abbildung 5. Der Einheitskreis geschnitten mit der Sekante durch die Punkte (−1, 0) und ( 35 , − 54 ) (mit Steigung m = − 21 ); dem zweiten Schnittpunkt entspricht das pythagoräische Tripel (3, 4, 5). Man beachte, dass die Zuordnung zwischen rationalen Punkten und pythagoräischen Tripeln nicht bijektiv ist. mit der Geradenschar Lm : Y = m(X + 1) für m ∈ Q. Jede Gerade Lm schneidet den Kreis in dem Punkt (−1, 0) sowie in einem weiteren Schnittpunkt, dessen Koordinaten sich leicht berechnen als 1 − m2 2m (x, y) = , . 1 + m2 1 + m2 Tatsächlich ist also dieser zweite Schnittpunkt genau dann rational, wenn die Steigung m der Geraden Lm rational ist. Auf diese Weise erhalten wir nicht nur viele rationale Punkte auf dem Kreis, sondern sogar sämtliche: Die Sekante durch (−1, 0) und (x, y) ∈ C ∩ Q2 \ {(−1, 0)} besitzt nämlich eine rationale Steigung und mittels m = uv für ganzzahlige u, v ergibt sich so u2 − v 2 2uv (x, y) = , ∈ C. u2 + v 2 u2 + v 2 Den Punkt (−1, 0) erhalten wir vermöge m → ∞ (dem Fall der Tangente an (−1, 0)). Damit ergibt sich der klassische Satz 1 (Euklid). Die ganzzahligen Lösungen x, y, z der Gleichung X2 + Y 2 = Z2 heißen pythagoräische Tripel; derer gibt es unendlich viele und alle ergeben sich durch die Parametrisierung (x, y, z) = (u2 − v 2 , 2uv, u2 + v 2 ) für u, v ∈ Z. 1. Was sind elliptische Kurven? 9 Abbildung 6. Die Ellipse X 2 + 4Y 2 = 4 geschnitten mit der Sekan10 10 12 te durch die Punkte (− 13 , − 12 ) und ( 13 , 13 ); Die Parallele durch (2, 0) 13 289 120 10 10 12 schneidet den Kreis im weiteren Punkt ( 169 , − 169 ) = (− 13 , − 12 )⊕( 13 , 13 ); 13 der Punkt (2, 0) ist das neutrale Element der Gruppe. Z.B.: 32 + 42 = 52 oder aber 52 + 122 = 132 oder auch 3152 + 49 6122 = 49 6132 . Ein pythagoräisches Tripel (x, y, z) heißt primitiv, wenn der größte gemeinsame Teiler von x, y, z gleich Eins ist. Wir sehen sofort, dass es auch unendlich viele primitive pythagoräische Tripel gibt! Euklid gab einen arithmetischen Beweis, der im Wesentlichen auf der Faktorisierung Y 2 = Z 2 − X 2 = (Z − X)(Z + X) unter Berücksichtigung der Parität beruht (siehe etwa [9]). Bachets Methode funktioniert auf allgemeinen Quadriken – vorausgesetzt es gibt mindestens einen rationalen Punkt! Auf diese Bedingung kann natürlich nicht verzichtet werden; die Gleichung X 2 + Y 2 = 3 besitzt keine rationale Lösungen (wie man leicht bei Betrachtung derselben modulo 9 einsieht). Als Nächstes zeigen wir, dass eine Quadrik die Struktur einer abelschen Gruppe besitzt – ein Aspekt, dessen Analogon später von großer Relevanz in der Theorie der elliptischen Kurven sein wird! Hierbei gehen wir davon aus, dass die Quadrik bereits auf folgende Hauptachsenform transformiert ist: d falls d ≡ 1 mod 4, 2 2 (1) C : X − ∆Y = 4 mit ∆ = 4d falls d ≡ 2, 3 mod 4, bei quadratfreiem 1 6= d ∈ Z. Dann wird die Addition zweier Punkte Pj = (xj , yj ) erklärt durch P1 ⊕ P2 = (x1 , y1 ) ⊕ (x2 , y2 ) := 21 (x1 x2 + ∆y1 y2 ), 21 (x1 y2 + x2 y1 ) . Der arithmetische Hintergrund besteht in der Abbildung √ (x, y) 7→ 12 (x + y d). Für den Algebraiker ist diese Abbildung ein Homomorphismus von √ der Gruppe C(Q) in die Einheitengruppe des quadratischen Zahlkörper Q( d) (genauer: dessen Ganzheitsrings). Im Falle −d ∈ N ist C eine Ellipse und nur endlich 10 ELLIPTISCHE KURVEN 15 10 5 -5 5 10 15 20 -5 -10 -15 Abbildung 7. Die Hyperbel X 2 − 2Y 2 = 1; die ganzzahligen Punkte sind fett eingezeichnet, wie etwa (x, y) = (3, 2). viele ganzzahlige Punkte können überhaupt auf dieser ’beschränkten’ Kurve liegen; in diesem Falle korrespondieren √ diese Punkte mit Einheiten in dem imaginär-quadratischen Zahlkörper Q( d). Für d ∈ N ist C eine Hyperbel und die beschreibende diophantische Gleichung ist als Pellsche Gleichung bekannt; in diesem Fall existieren stets unendlich viele ganzzahlige Gitterpunkte auf C, die mit Einheiten in dem reell√ quadratischen Zahlkörper Q( d) korrespondieren. Wir betrachten als Beispiel einer solchen Gleichung: (2) X 2 − 2Y 2 = 1. Eine solche Hyperbel enthält natürlich viele Punkte, aber liegen auch welche mit ganzzahligen Koordinaten auf ihr? Auf Grund der Symmetrie ist mit x, y auch ±x, ±y eine Lösung, wobei jede Kombination von Vorzeichen erlaubt ist, weil die Unbekannten ja nur quadratisch in der Gleichung auftreten und diese Quadrate die Vorzeichen ’nicht sehen’. Geometrisch fragen wir nach ganzzahligen Punkten auf einer Hyperbel. Durch Ausprobieren finden wir die Lösung x = 3 und y = 2 in natürlichen Zahlen und wir erhalten weitere auf folgende erstaunliche Art und Weise: Zunächst quadrieren wir unsere Lösung √ √ √ (x + y 2)2 = (3 + 2 2)2 = 17 + 12 2, dann ist x = 17 und y = 12 eine neue Lösung: 172 − 2 · 122 = 289 − 2 · 144 = 1. 1. Was sind elliptische Kurven? 11 Ferner erhalten wir durch weiteres Potenzieren √ √ (3 + 2 2)3 = 99 + 70 2 und wiederum ist x = 99 und y = 70 eine Lösung. Mittels X 2 − 2Y 2 = 1 ⇐⇒ (2X )2 − 8Y 2 = 4 transformiert sich Gleichung (2) in die Gestalt (1) und es korrespondieren die rationalen Punkte (3, 2) ↔ (6, 2) und (6, 2) ⊕ (6, 2) = (34, 12) ↔ (17, 12) = (3, 2) ⊕ (3, 2). All diese√Lösungen besitzen eine interessante Eigenschaft, sie approximieren nämlich 2 besser und besser: √ 99 3 17 = 1, 5, = 1, 416, = 1, 41428571 . . . , −→ 2 = 1, 41421356 . . . 2 12 70 Übrigens ist das Längenverhältnis bei Din A 4 Länge 29, 7cm 99 = = ; Breite 21cm 70 √ warum diese Approximation an 2 eine so gute Wahl für unser Papierformat ist, erfährt man in [9]. • deg P ≥ 3: Diese Klasse von Kurven umfasst die elliptischen Kurven (für die zusätzlich noch einige Regularitätsbedingungen erfüllt sein müssen). Ist d = deg P der Grad des Polynoms P und r die Anzahl der Doppelpunkte, so heißt g = 12 (d − 1)(d − 2) − r das Geschlecht der Kurve C; diese Größe ist eine nicht-negative ganze Zahl und eine wichtige topologische Invariante der Kurve. Elliptische Kurven sind nicht-singuläre Kurven vom Geschlecht eins, welche mindestens einen rationalen Punkt enthalten. Komplexe elliptische Kurven sind kompakte Riemannsche Flächen vom Geschlecht eins. Topologisch sind diese homöomorph zu einem Torus C/Λ, wobei Λ ein Gitter in der komplexen Zahlenebene C ist. Verschiedene Gitter führen u.U. zu unterschiedlichen elliptischen Kurven mit unterschiedlichen analytischen Eigenschaften, jedoch sind alle solche topologisch identisch: Dem einen ’Loch’ eines Torus entsprechend ist das Geschlecht – also die Anzahl der ’Löcher’ der Riemannschen Fläche – gleich eins. Ein Beispiel einer kubischen Kurve, die keine elliptische Kurve ist, weil sie keinen rationalen Punkt besitzt, ist beschrieben durch die Gleichung U 3 + pV 3 + p2 = 0 mit einer Primzahl p. Gleichungen wie etwa Y 2 = X(X 2 − 1)(X 2 − 2) führen auf so genannte hyperelliptische Kurven. In einem komplexen Modell besitzt diese kompakte Riemannsche Fläche zu dieser Gleichung zwei Löcher, besitzt also Geschlecht zwei. Die Kleinsche Quartik, gegeben durch die Gleichung X 3 Y +Y 3 Z+Z 3 X = 0, ist ein Beispiel einer kompakten Riemannschen Fläche vom Geschlecht drei. 12 ELLIPTISCHE KURVEN Abbildung 8. Zwei Beispiele nicht elliptischer Kurven. Links ein reelles Bild der Kurve Y 2 = X(X 2 −1)(X 2 −2) vom Geschlecht zwei, rechts die Kleinsche Quartik vom Geschlecht drei, wie man an den ’Löchern’ abzählen kann. Mordell vermutete, dass jede über Q definierte Kurve von einem Geschlecht echt größer eins nur höchstens endlich viele rationale Punkte enthalten kann. Dies steht im Gegensatz zu Kurven vom Geschlecht null, also Kegelschnitte wie z.B. ein Kreis, bzw. elliptische Kurven, die allesamt Geschlecht eins haben und u.U. unendlich viele rationale Punkte besitzen. Mordells Vermutung wurde 1983 von Gerd Faltings mit Methoden der algebraischen Geometrie bewiesen, der dafür mit der renommierten Fields-Medaille auf dem Internationalen Kongress für Mathematik 1986 in Berkeley ausgezeichnet wurde: Satz von Faltings. Eine nicht-singuläre Kurve vom Geschlecht g ≥ 2 besitzt höchstens endlich viele rationale Punkte. (Die Aussage gilt sogar für Krationale Punkte, wobei K ein beliebiger Zahlkörper ist.) Rationale Lösungen von Gleichungen in zwei Variablen entsprechen ganzzahligen Lösungen assoziierter Gleichungen in drei Variablen; die glatte FermatKurve U n + V n − 1 = 0, besitzt Geschlecht 12 (n − 1)(n − 2). Für n = 2 ist das Geschlecht also null und es gibt mit den pythagoräischen Tripeln tatsächlich unendlich viele Lösungen. Ist n = 3, so ist das Geschlecht eins und in diesem Fall haben wir es mit einer elliptischen Kurve zu tun (s.o.); hier bewies bereits Euler die nicht-triviale Unlösbarkeit bzw. Gauß (einige Ungenauigkeiten bei Euler ausräumend), womit in der nachfolgenden Tabelle das ’ ?’ durch ’endlich viele triviale Lösungen’ ersetzt werden kann. Für n ≥ 4 ist das Geschlecht größer als zwei und Faltings’ Beweis der Mordell-Vermutung zeigt, dass es also zu jedem festen Exponenten n ebenso nur höchstens endlich viele nicht-triviale Lösungen in ganzen Zahlen 2. Elliptische Kurven über R und Q 13 gibt. n = 2 g = 0 pythagoräische Tripel n=3 g=1 ? n≥4 g≥2 <∞ Im allgemeinen Fall einer elliptischen Kurve hingegen können unendlich viele rationale Punkte existieren, deshalb also das Fragezeichen ’ ?’ in obiger Tabelle, so dass also Geschlecht g = 1 der Grenzfall zwischen der ’einfachen’ Theorie der Kegelschnitte (mit i.A. unendlich vielen rationalen Punkten) und der ’schwierigen’ Theorie höhergeschlechtlicher Kurven mit nur höchstens endlich vielen rationalen Punkten ist. Dies macht elliptische Kurven in arithmetischer Hinsicht so interessant! 2. Elliptische Kurven über den reellen und den rationalen Zahlen Wir starten mit einer klassischen Aufgabe aus Diophants ’Arithmetica’ (Problem 24 in Buch N): Teile eine gegebene Zahl in zwei Zahlen, so dass deren Produkt gleich einem Kubus minus einer Seite ist. In moderner Sprache bedeutet dies, zu einer gegebenen rationalen Zahl a weitere rationale Zahlen x und y zu finden, so dass y(a − y) = x3 − x gilt. Wir skizzieren Diophants Lösung am Beispiel a = 6. Die ’triviale’ Lösung (x, y) = (−1, 0) liegt auf der Geraden X = λY − 1 mit λ=3 und Substitution in der obigen kubischen Gleichung führt auf y(6 − y) = (λy − 1)3 − (λy − 1) = y(27y 2 − 27y + 6) bzw. nach Kürzen des Faktors y und Lösen der resultierenden quadratischen 26 , x = 17 Gleichung auf y = 27 9 . Ausgehend von dem offensichtlichen rationalen Abbildung 9. Diophant konstruiert den nicht-trivialen rationalen Punkt ( 17 , 26 ) durch Schnitt der Tangente X = 3Y − 1 an den trivia9 27 len Punkt (−1, 0) auf der elliptischen Kurve Y (6 − Y ) = X 3 − X. 14 ELLIPTISCHE KURVEN Punkt (−1, 0) haben wir so einen alles andere als offensichtlichen rationalen Punkt gefunden! Bei allgemeinem a kommt man durch entsprechende Variation von λ ganz ähnlich zum Ziel kommen. Vermöge der Transformation X = −X und Y =Y −3 ergibt sich aus Diophants Gleichung Y (6 − Y ) = X 3 − X eine elliptische Kurvengleichung in ’Weierstraßscher Normalform’ (s.u.): Y 2 = X 3 − X + 9. Diophants Aufgabe ist eines der ersten Auftreten elliptischer Kurven in der Geschichte der Mathematik; die spezielle Theorie elliptischer Kurven (bei der insbesondere die Geometrie der zu Grunde liegenden Kurve eine wichtige Rolle spielt) geht nach ersten Anfängen bei Bachet und Fermat im 17. Jahrhundert auf die Arbeiten von Poincaré und Mordell zu Beginn des zwanzigsten Jahrhunderts zurück. Über dem Körper der reellen Zahlen lassen sich elliptische Kurven sehr schön als ebene Kurven in der euklidischen Ebene visualisieren. Dabei treten im Wesentlichen zwei Typen auf. Im Folgenden wollen wir stets davon ausgehen, dass unsere elliptische Kurve in Weierstraßscher Normalform vorliegt, d.h. E : Y 2 = X 3 + aX + b mit a, b ∈ Q, wobei für die Diskriminante ∆ := −(4a3 + 27b2 ) 6= 0 gelte, also das Polynom X 7→ P (X) = X 3 +aX+b drei verschiedene Nullstellen besitze, die elliptische Kurve also glatt sei. Entsprechend besitzt P also eine oder drei reelle Nullstellen und die elliptische Kurve zerfällt über dem Körper R demzufolge in eine bzw. zwei Zusammenhangskomponenten, je nachdem ob die Diskriminante positiv oder negativ ist. Abbildung 10. Daumenkino: Links die elliptische Kurve Y 2 = X(X − 1)(X + 1) mit positiver Diskriminante ∆ = 4, in der Mitte die singuläre kubische Kurve Y 2 = X(X − 21 )2 mit ∆ = 0 und rechts die elliptische Kurve Y 2 = X(X − 1)(X + 1) + 3 mit negativer Diskriminante ∆ = −239. 2. Elliptische Kurven über R und Q 15 Um dies einzusehen, nun ein Exkurs über kubische Gleichungen in einer Veränderlichen. Diese liegen stets in folgender Form vor: X 3 + AX 2 + BX + C = 0 mit A, B, C ∈ R, bzw. gegebenenfalls nach Anwendung einer Tschirnhaus-Transformation X 7→ X = X + A3 in der Gestalt (3) X 3 + aX + b = 0 mit a, b ∈ R[A, B, C]. (Die Beschränkung auf reelle Koeffizienten lässt sich ohne weiteres aufheben, ist aber in unserem Kontext völlig ausreichend.) Wir dürfen also annehmen, dass kein quadratischer Term in der kubischen Gleichung auftritt. Mehr Freiheit ergibt sich zunächst vermöge des Ansatzes X = u + v, womit sich (3) übersetzt in u3 + 3u2 v + 3uv 2 + v 3 + a(u + v) + b = 0 bzw. u3 + v 3 = −b und 3uv = −a (bzw. u3 v 3 = −( a3 )3 ). Wir setzen nun entsprechend U + V = −b und U V = −( a3 )3 und lösen mit Vietas Wurzelsatz (Z − U )(Z − V ) = 0 bzw. Z 2 + bZ − ( a3 )3 = 0 durch z = u3 , v 3 . Damit ergibt sich nun die so genannte Formel von Cardano (auch ’Cardanische Formel’) r q 3 x = u1 + v1 mit u1 , v1 = − 2b ± ( 2b )2 + ( a3 )3 als Lösung von (3). Hierbei ist u1 eine der drei komplexen Wurzeln und v1 ist durch u1 v1 = − a3 festgelegt; weitere Lösungen von (3) ergeben sich durch x = ζu1 + ζ 2 v1 , ζ 2 u1 + ζv1 , wobei ζ = exp( 2πi 3 ) eine primitive dritte Einheitswurzel ist. Der Fall nicht-reeller Lösungen (’casus irreduzibilis’) tritt genau dann auf, wenn ⇐⇒ ∆<0 ( 2b )2 + ( a3 )3 > 0 (da nämlich −22 33 ∆ = ( 2b )2 +( a3 )3 ) und der Fall ∆ = 0 beschreibt die Existenz einer mehrfachen reellen Nullstelle. Wir erinnern, dass die Diskriminante eines Polynoms das Quadrat der Differenzen der Wurzeln des Polynoms ist. Dabei besitzt ein Polynom n-ten Grades nach dem Fundamentalsatz der Algebra genau n Nullstellen in C; die Diskriminante eines über R definierten Polynoms ist dabei (auf Grund der Symmetrien) stets reellwertig! Die spezielle Form elliptischer Kurven ergibt sich nun aus der Lösbarkeit kubischer Gleichungen und der Lage der Lösungen bei stetig variierendem Y in der Weierstraßschen Normalform. Besitzen diese reelle Nullstellen, so treten entweder eine oder drei reelle Nullstellen auf; komplexe Nullstellen treten nur als Paare komplex konjugierter Zahlen auf. 16 ELLIPTISCHE KURVEN Abbildung 11. Der Erste, der kubische Gleichungen zu lösen vermochte, war wohl Scipinio del Ferro anfangs des 16. Jahrhunderts (ohne Bild). Dieser gab auf dem Totenbett sein Wissen an seine Schüler weiter. Der ’Stotterer’ Nicolo Tartaglia, ∗1499 oder 1500 in Brescia, - †1557 in Venedig, trat in öffentlichen Wettstreiten mit seinen Lösungen an. Rechts Girolamo Cardano, ∗1501 in Pavia, - †1576 in Rom, der Tartaglias Formeln ohne dessen Wissen und ohne dessen Namensnennung in seinem Lehrbuch ’Ars magna sive de Regulis Algebraicis’ 1545 veröffentlichte. Jetzt wollen wir elliptische Kurven über Q studieren. Da die rationalen Zahlen eine sehr dünne Teilmenge der reellen Zahlen bilden, ist zunächst nicht klar, wie reichhaltig E(Q) ⊂ E(R) ist. Wir erinnern uns an die Lösung des Problems des Diophant zu Beginn dieses Paragraphen. Diophant konstruierte einen rationalen Punkt auf der elliptischen Kurve durch Schnitt mit einer ’rationalen Geraden’. Diese Tangente an den Punkt (−1, 0) schneidet die kubische Kurve in einem dritten Punkt; man beachte dabei, dass der Berührpunkt (−1, 0) die Vielfachheit zwei besitzt (weil der Berührpunkt der Tangente doppelt zu zählen ist). Ganz ähnlich verfährt Bachet mehr als ein Jahrtausend später im Fall der Kurve E : Y 2 = X 3 + c, wobei c eine fest gewählte rationale Zahl ist. Speziell für c = −2 liefert die implizite Differentiation 2y dy = 3x2 dx dy 3x2 = dx 2y bzw. die Tangentengleichung L : Y = 2y 2 − 3x3 3x2 X+ , 2y 2y also für den Punkt (x, y) = (3, 5) ∈ E(Q) die Geradengleichung L : Y = 27 10 X − 31 10 . 2. Elliptische Kurven über R und Q 17 Durch Schnitt mit der elliptischen Kurve ergibt sich eine kubische Gleichung in X: 3x2 2y 2 − 3x3 2 = X 3 + c; X+ 2y 2y diese besitzt drei Nullstellen, nämlich x mit Vielfachheit zwei und eine einfache dritte Nullstelle ξ, die damit also der Bedingung 3x2 2 = 2x + ξ 2y genügt (vermöge eines Koeffizientenvergleichs bei X 2 ). Im Spezialfall (x, y) = (3, 5) ergibt sich so die kubische Gleichung 2 31 27 X − = X3 − 2 10 10 27 2 und ξ = ( 10 ) −2·3= 129 100 . Ganz allgemein erhalten wir so Satz 2 (Bachet). Mit (x, y) ist auch x4 − 8cx −x6 − 20cx3 + 8c2 , 4y 2 8y 3 ein Punkt auf E : Y 2 = X 3 + c; besitzt (x, y) ∈ E rationale Koordinaten, so auch der durch Schnitt mit der Tangenten an (x, y) konstruierte Punkt. Weil wir ausschließlich rationale Operationen angewandt haben, vererbt sich die Rationalität bei der Bachetschen Tangentenmethode! In unserem Beispiel ergibt sich so sukzessive 129 383 2 340 922 881 113 259 286 337 279 → , , . (x, y) = (3, 5) → 100 1000 76602 76603 Tatsächlich entstehen so für c 6= 1, −432 unendlich viele rationale Punkte! (Der Beweis ist aber nicht ganz einfach, denn a priori ist nicht klar, dass sich irgendwann die so konstruierten Punkte nicht wiederholen.) Diophants Argument bzw. Bachets Methode des Schnittes rationaler Geraden mit algebraischen Kurven führten u.a. zu besagtem geometrischen Beweis des Euklidischen Satzes 1 über die pythaogräischen Tripel. Insbesondere lässt sich diese Idee auf allgemeine elliptische Kurven verallgemeinern; ganz wichtig dabei ist die Existenz eines rationalen Punktes: Ohne einen solchen können gar keine Tangenten oder Sekanten gebildet werden. Deshalb fordern wir also stets E(Q) 6= ∅. Auch versagt Bachets Methode im Falle der Kurve, die durch die Gleichung Y 2 = X 3 + X gegeben ist, wenn wir als Startpunkt (0, 0) wählen. In diesem Fall existiert nämlich kein dritter Schnittpunkt der Tangente mit der elliptischen Kurve im Endlichen, allerdings kann man sich durch Hinzufügen eines unendlich fernen Punktes behelfen. Uns interessiert hier aber der allgemeine Fall. Beispielsweise liegen die Punkte P = (−2, 3) und Q = (2, 5) beide sowohl auf der elliptischen Kurve E : Y 2 = X 3 + 17 18 ELLIPTISCHE KURVEN als auch auf der Geraden L : Y = 12 X + 4; die Gerade L kann also als Sekante durch die Punkte P und Q betrachtet werden. Für den dritten Schnittpunkt (x, y) besteht dann die kubische Gleichung ( 21 X + 4)2 = X 3 + 17 X 3 − 14 X 2 − 4X + 1 = 0; ⇐⇒ natürlich erfüllen auch die x-Koordinaten von P und Q diese Gleichung. Umformen und Berücksichtigung dieser bereits bekannten Lösungen liefert X 3 − 41 X 2 − 4X + 1 = 0 = (X − 2)(X + 2)(X − 41 ), also die x-Koordinate des dritten Schnittpunkts x = 14 . Einsetzen in der Sekantengleichung liefert y = 41 · 12 + 4 = 33 8 . Damit haben wir also den rationalen Punkt (x, y) = ( 14 , 33 8 )∈E∩L gefunden. Durch Spiegeln ergibt sich auf Grund der elliptischen Kurven in Weierstrass-Form inhärenten Symmetrie auch noch der gespiegelte rationale Punkt ( 41 , − 33 8 ) ∈ E ∩ L. Bildet man neue Sekanten, entsteht so u.a. der Punkt 1097 , − ). Wir haben damit eine Konstruktionsmethode vieler rationaler ( 106 9 27 Punkte auf elliptischen Kurven gefunden. Tatsächlich entstehen auf diese Art und Weise sämtliche rationalen Punkte! (Aber auch dieser Beweis ist nicht leicht.) 3. Die Gruppenstruktur elliptischer Kurven Wir gehen wieder von einer elliptischen Kurve in Normalform E : Y 2 = X 3 + aX + b mit a, b ∈ Q aus (insbesondere ist also die Diskriminante ∆ 6= 0 und die Kurve ist glatt). Ferner seien P = (x1 , y1 ) und Q = (x2 , y2 ) Punkte auf E, wobei wir zunächst x1 6= x2 annehmen wollen. Dann ist die Sekante durch P und Q gegeben durch die Gerade y2 − y1 (X − x1 ) + y1 . L : Y = x2 − x1 Man macht sich dann leicht klar, dass die Sekante L neben P und Q einen weiteren Schnittpunkt mit der elliptischen Kurve E hat (dank des Satzes von Bezout: eine elliptische Kurve ist eine kubische Kurve, besitzt also im projektiven Raum drei Schnittpunkte mit jeder Geraden). Mit ein wenig Rechnerei ergibt sich dieser dritter Schnittpunkt als P ∗ Q = (x3 , y3 ) mit (4) 1 2 x3 = ( xy22 −y −x1 ) − x2 − x1 , y3 = y2 −y1 x2 −x1 (x3 − x1 ) + y 1 . Das Bemerkenswerte ist, dass mit den Koordinaten von P und Q auch die Koordinaten des dritten Schnittpunktes P ∗ Q rational sind. Denn durch Anwenden der Grundrechenarten verlässt man nicht die Menge der rationalen 3. Die Gruppenstruktur 19 Zahlen – Q ist ein Körper! Ein ähnliches Phänomen ergibt sich auch im Falle P = Q. In diesem Fall wird die Sekante zur Tangente und es gilt x1 = x2 . Sei zuerst y1 = y2 6= 0, so errechnet sich die Tangente als L : Y = 3x21 + a (X − x1 ) + y1 ; 2y1 (bzw. analytisch vermöge Bilden des Grenzwertes x2 → x1 in (4)). Der Schnittpunkt mit der elliptischen Kurve ist dann x3 = ( 3x21 +a 2 2y1 ) − 2x1 , y3 = 3x21 +a 2y1 (x3 − x1 ) + y 1 (allgemeiner als Bachets Verdopplungsformel aus Satz 2). Im letzten zu diskutierenden Fall ist x1 = x2 und y1 = y2 = 0 und es gibt keinen dritten Schnittpunkt im Endlichen und wir interpretieren deshalb den unendlich fernen Punkt O = (∞, ∞) als dritten Schnittpunkt (bzw. projektiv O = (0 : 1 : 0)). In all diesen Fällen ist mit P, Q ∈ E(Q) auch P ∗Q ∈ E(Q), da offensichtlich die Koordinaten x3 , y3 rationale Funktionen der Koordinaten x1 , y1 von P und x2 , y2 von Q sowie den Koeffizienten von E sind. Ähnlich verhält es sich, wenn wir ein anderes Zahlenuniversum als die rationalen Zahlen zugrunde legen, sofern dieses nur die Struktur eines Körpers besitzt, und die E definierende Gleichung bzw. die Koordinatenformeln für P ∗Q über K sinnvoll bestehen; im Falle endlicher Körper K ist Charakteristik zwei problematisch im Hinblick auf die Verdopplungsformel. Mit Hilfe dieser geometrischen Konstruktion definier- Abbildung 12. Die verschiedenen Konfiguratione von Schnittpunkten einer elliptische Kurve mit Geraden. te Poincaré eine Addition von Punkten auf einer elliptischen Kurve wie folgt: Zu den Punkten P und Q, wie oben, liegt auch der Punkt P ∗ Q = (x3 , y3 ) auf der elliptischen Kurve. Spiegelt man letzteren an der x-Achse, so entsteht ein weiterer Punkt auf der elliptischen Kurve; dieser definiere die Summe der Punkte P und Q, also P ⊕ Q = (x3 , −y3 ). Diese Addition ist vollkommen verschieden von der üblichen Addition rationaler oder reeller Zahlen, jedoch respektiert sie die uns so wichtigen Rechengesetze wie Kommutativität (also P ⊕ Q = Q ⊕ P ), Distributivität und Assoziativität (wenngleich der Nachweis der letzten Eigenschaft nicht ganz so einfach 20 ELLIPTISCHE KURVEN ist, es sei den man argumentiert mit fortgeschrittenen Methoden der Funktionentheorie oder der algebraischen Geometrie). Dabei fungiert der unendlich ferne Punkt O als neutrales Element (analog zur Null bei der herkömmlichen Addition), denn es ist P ⊕ O = P für jeden Punkt P auf E. Auch können wir additiv inverse Elemente erklären: Gilt P ⊕ Q = O, so schreiben wir Q = −P , und man verifiziert leicht, dass −P = (x1 , −y1 ) für P = (x1 , y1 ) gilt; insbesondere besitzt also jeder Punkt ein additiv Inverses. Hier wird die wichtige Rolle des unendlich fernen Punktes O deutlich, spielt er doch die Rolle des neutralen Elementes und ist somit für die Gruppenstruktur der elliptischen Kurve hinzuzufügen. Tatsächlich kann man jedoch einen beliebigen rationalen Punkt der Kurve als neutrales Element zu einem geeignet definierten Gruppengesetz erklären (was sich am besten durch eine projektive Diskussion erklären lässt). Mehr noch: die rationalen Operationen, mit denen sich die Koordinaten des durch die Addition erklärten Punktes berechnen, führen für einen beliebigen Körper nicht aus diesem hinaus. Es gilt also Satz 3 (Poincaré, 1901). Sei K ein beliebiger Körper, dann ist eine über K definierte elliptische Kurve E(K) = {(x, y) ∈ K2 : y 2 = x3 + ax + b} ∪ {O} zusammen mit der Addition ′ ⊕′ eine abelsche Gruppe mit O als neutralem Element. Wir haben den Beweis nahezu vollständig erbracht, lediglich die Assoziativität verbleibt zu zeigen, was wir in §5 ausführen werden. Elliptische Kurven können sehr wenige rationale Punkte besitzen. So liegen auf der Kurve Y 2 = X 3 −X nur die Punkte (0, 0) und (±1, 0) zuzüglich O (wie wir in §6, Satz 7 zeigen werden). Andere Kurven wie etwa Y 2 = X 3 −2 hingegen besitzen unendlich viele rationale Punkte. Insofern können wir es also mit recht unterschiedlichen Gruppen bei elliptischen Kurven zu tun haben. Was lässt sich allgemein über elliptische Kurven über Q sagen? Genauer: Inwieweit besitzen die Gruppen E(Q) eine ähnliche Struktur? Licht ins Dunkle brachte schließlich Louis Mordell. Er bewies eine Vermutung von Poincaré, als er 1922 zeigte, dass es stets endlich viele Punkte gibt, aus denen sich jeder rationale Punkt durch endlich viele Schnitte von Sekanten und Tangenten konstruieren lässt. Etwas mathematischer: Satz 4 (Mordell, 1922). Die Gruppe der rationalen Punkte einer über Q definierten elliptischen Kurve ist endlich erzeugt, d.h. E(Q) ≃ Zr × T, wobei r = rg(E) der Rang von E(Q) und T = Etors (Q) die Torsionsgruppe aller Elemente endlicher Ordnung ist. Eine elliptische Kurve E(Q) ist also eine endlich erzeugte abelsche Gruppe. Die Torsionsgruppe T ist die Menge aller Punkte endlicher Ordnung, also 3. Die Gruppenstruktur 21 Abbildung 13. Links: Henri Poincaré, ∗ 1854 - † 1912. Ein weiterer französischer Mathematiker, der durch seine bahnbrechenden Arbeiten zum Dreikörperproblem berühmt geworden ist. Die Poincarésche Vermutung über die Topologie von dreidimensionalen Flächen ist eines der sieben Millenniumsprobleme und wurde vor wenigen Jahren durch Grigori Perelman bewiesen. Rechts: Louis Mordell, ∗ 1888 - † 1972. Bedeutender amerikanischer Zahlentheoretiker litauischer Abstammung, der u.a. die Lösbarkeit polynomieller Gleichungen in ganzen bzw. rationalen Zahlen studierte. die Menge all der Punkte P , die sich durch fortgesetzte Addition ihrer selbst letztlich zum neutralen Element O addieren lassen. Solche Punkte sind selten, denn die Torsionsgruppe ist stets endlich (was sich sofort aus dem Struktursatz für endlich erzeugte abelsche Gruppen ergibt); allerdings liefert dieses Argument keinerlei Aussage über die Größe von T , noch über die Lage der Torsionspunkte. Ferner kann man von solchen Punkten P nur endlich viele weitere Punkte erreichen. Die Größe einer elliptischen Kurve E wird durch ihren Rang r = rg(E) bestimmt, denn alle Elemente in Zr bis auf das neutrale Element haben unendliche Ordnung, d.h. fortgesetzte Addition ihrer selbst führt niemals auf das neutrale Element. Also besitzt nach Mordell eine elliptische Kurve E(Q) genau dann unendlich viele rationale Punkte, wenn ihr Rang rg(E) positiv ist: ♯E(Q) = ∞ ⇐⇒ r(E) > 0. Der Rang steht für die Anzahl der Punkte, aus denen sich mittels Bachets Sekanten-Tangenten-Methode jeder rationale Punkt in endlich vielen Schnitten erreichen lässt. Beispielsweise gilt für die elliptische Kurve zur Gleichung Y 2 = X3 − 4 E(Q) ≃ Z1 , wobei etwa der Punkt (2, 2) alle rationalen Punkte erzeugt. Die Aussage des Mordellschen Satzes ist falsch für singuläre Kurven wie etwa der singulären Neilschen Parabel Y 2 = X 3 mit einer Spitze in (0, 0). Wie kann man aber im Fall einer elliptischen Kurve entscheiden, ob ihr Rang positiv ist oder nicht? 22 ELLIPTISCHE KURVEN Tatsächlich gibt die Vermutung von Birch & Swinnerton-Dyer hierfür ein Kriterium. (In §9 dazu mehr!) Ein weiteres offenes Problem in diesem Zusammenhang ist die Rang-Vermutung: lim supE rg(E) = ∞. Der aktuelle Weltrekord stammt von Elkies aus dem Jahre 2006; wir sollten nicht darauf verzichten, die definierende Gleichung der Kurve mit ihren etwas länglichen Koeffizienten niederzuschreiben: Y 2 + XY + Y = X3 − X2 −20 067 762 415 575 526 585 033 208 209 338 542 750 930 230 312 178 956 502 X +34 481 611 795 030 556 467 032 985 690 390 720 374 855 944 359 319 180 361 266 008 296 291 939 448 732 243 429. Auf der Internetseite http://web.math.hr/∼duje/tors/z1.html findet man 28 ’unabhängige’ Punkte unendlicher Ordnung, was rg(E) ≥ 28 aufzeigt (tatsächlich besteht sogar die Möglichkeit, dass der Rang dieser Kurve noch größer ist). Hier ist noch ein weiter Weg bis unendlich zu gehen... 4 2 -2 -1 1 2 3 -2 -4 Abbildung 14. Addition (−1, 0) ⊕ (0, 1) = (2, −3) auf der elliptischen Kurve Y 2 = X 3 + 1. Insgesamt existieren sechs rationale Punkte, welche sich alle recht schnell mit der Tangenten-Sekanten-Methode aus obigen drei Punkten ergeben. Wir geben ein paar Beispiele (hier ohne Beweis): (i) E : Y 2 = X 3 + 1; in diesem Fall ist E(Q) = hP = (2, 3)i 3. Die Gruppenstruktur 23 und r = 0 sowie T = E(Q) ≈ Z/6Z. (ii) E : Y 2 = X 3 − X; diese Kurve besitzt über Q die Struktur E(Q) = {O, (0, 0), (−1, 0), (+1, 0)}; hier ist der Rang r = 0 und T = E(Q) ≈ (Z/2Z) × (Z/2Z) (vgl. Satz 7 in §6). (iii) E : Y 2 = X 3 − 4; hier ist E(Q) = hP = (2, 2)i und r = 1 und T = {O}. Der Satz von Mordell besitzt weitreichende Verallgemeinerungen: Andre Weil bewies 1929 ein entsprechendes Analogon für sogenannte ’abelsche Varietäten’: Gegeben ein beliebiger Zahlkörper K (also eine endliche algebraische Erweiterung von Q), so ist die Gruppe der K-rationalen Punkte einer über K definierten abelschen Varietät eine endlich erzeugte abelsche Gruppe — die so genannte Mordell-Weil Gruppe. Die Torsion ist besser verstanden als der Rang. Unabhängig voneinander bewiesen Nagell und Lutz: Satz 5 (Nagell 1935; Lutz 1937). Sei E eine elliptische Kurve mit definierender Gleichung Y 2 = X 3 + aX + b mit ganzzahligen Koeffizienten a und b. Ist dann P = (x, y) ∈ T = Etors (Q) ein Torsionspunkt, so gilt x, y ∈ Z und y 2 | (4a3 + 27b2 ) = −∆ falls y 6= 0. Da also die Diskriminante nur endlich viele Teiler haben kann, folgt also nun noch einmal, dass es nur endlich viele Torsionspunkte geben kann; diesmal jedoch mit einer expliziten Schranke für die ganzzahligen Koordinaten derselben! Insbesondere folgt für die Kardinalität der Torsionsgruppe p ♯T ≤ 2 + 2 |∆|. Ein tiefliegender Satz zeigt jedoch auf, dass erstaunlicherweise nur endlich viele verschiedene Torsionsgruppen auftreten: Satz von Mazur (1975). Für eine elliptische Kurve wie oben existieren nur die folgenden fünfzehn Torsionstypen: Etors (Q) ≃ Z/nZ mit n ≤ 12, n 6= 11, oder Etors (Q) ≃ Z/2Z ⊕ Z/nZ mit n = 2, 4, 6, 8. All diese Typen treten als Torsionsgruppen auf. Der Beweis ist schwierig und wir verweisen auf den Originalartikel.† Wir diskutieren diesen Satz lediglich mit Blick auf unsere obigen Beispiele: In Beispiel i) † B. Mazur, Modular curves and the Eisenstein ideal, IHES Publ. Math. 47 (1977), 33-186. 24 ELLIPTISCHE KURVEN ist die Diskriminante ∆ = −27 und für die y-Koordinate eines Torsionspunktes kommen also nur 0, ±1, ±3 in Frage; die Torsionsgruppe ist hier T = Z/6Z. Übrigens: Punkte mit ganzzahligen Koordinaten sind nicht notwendig Torsionspunkte! Ein Beispiel hierfür liefert die durch Y 2 = X 3 + 17 definierte elliptische Kurve mit dem Punkt P = (−2, 3) unendlicher Ordnung. In diesem Zusammenhang sei ein weiterer tiefliegender Satz erwähnt: Satz von Siegel (1926). Für eine elliptische Kurve wie oben existieren nur endlich viele Punkte mit ganzzahligen Koordinaten. Hier verweisen wir für den Beweis auf [3]. Ein erstes Beispiel für solche Aussagen haben wir bereits in §1 mit der Ramanujanschen Gleichung U 3 +V 3 = 1729 kennen gelernt; der Satz von Siegel ist jedoch weitaus allgemeiner. Die Aussage des Siegelschen Satzes ist übrigens falsch für singuläre kubische Kurven, wie die Neilsche Parabel Y 2 = X3 aufzeigt; hier lassen sich nämlich die Punkte mit ganzzahligen Koordinaten durch (m2 , m3 ) mit m ∈ Z parametrisieren. Ferner zeigt dieses Beispiel, dass auch die Aussage des Mordellschen Satzes falsch für singuläre kubische Kurven ist. 4. Reduktion modulo p Zahlentheoretische Probleme betrachtet man oft am besten mit der modularen Brille: Angenommen, wir fragen uns, welche Zahlen sich als Differenz von zwei Quadratzahlen darstellen lassen, so sind dies u.a. die ungeraden Zahlen, denn es gilt 2m + 1 = (m + 1)2 − m2 ; auch findet man alle Vielfachen von 4 wieder (nämlich durch Multiplikation der letzten Gleichung mit 4 = 22 ), nicht aber die Zahlen, die bei Division durch 4, den Rest 2 lassen. Wie beweist man dies? Eine ganze Zahl ist entweder gerade, d.h. von der Form n = 2k, oder ungerade, d.h. n = 2k +1. Entsprechend lassen die Quadrate n2 = 4k2 bzw. 4k2 + 4k + 1 den Rest 0 oder 1 bei Division durch 4 und deshalb ist die Differenz zweier Quadratzahlen nie eine Zahl, die den Rest 2 bei Division durch 4 lässt. Arithmetische Obstruktionen äußern sich oft bei Blick auf die Primzahlen! In dem obigen Beispiel ist es die Parität, also die Eigenschaft ob eine Zahl gerade oder ungerade ist, welche Darstellungen als Differenz zweier Quadrate erlaubt oder verbietet. Es ist also die Primzahl 2, die wir in diesem Fall zu betrachten hatten (bzw. dessen Quadrat). Primzahlen sind die multiplikativen Bausteine der ganzen Zahlen und jede ganze Zahl lässt sich bekanntlich bis auf das Vorzeichen als im Wesentlichen eindeutiges Produkt von Primzahlpotenzen darstellen. Insofern bestimmen Primzahlen gewisse Teilbarkeitseigenschaften oder auch Darstellbarkeitsphänomene bei ganzen Zahlen! 4. Reduktion modulo p 25 In der arithmetischen Theorie der elliptischen Kurven (aber natürlich auch im Hinblick auf kryptographische Anwendungen) ist insbesondere die Reduktion modulo Primzahlen von Interesse. Hierbei studiert man eine gegebene elliptische Kurve (5) E : Y 2 = X 3 + aX + b mit a, b ∈ Z über endlichen Körpern. Aus der Algebra ist bekannt, dass jeder endliche Körper isomorph zu einer Erweiterung Fq eines primen Restklassenkörpers Fp = Z/pZ ist; hierbei ist p eine Primzahl und bezeichne auch im Folgenden stets eine Primzahl sowie q = pf für eine natürliche Zahl f . Mit Hilfe der natürlichen Einbettung N ֒→ Z/pZ, n 7→ 1| + .{z . . + 1} n−mal erklärt sich der kanonische Homomorphismus Z → Z/pZ, n 7→ n mod p und entsprechend werden wir statt (5) die Kongruenz (6) E : Y 2 ≡ X 3 + aX + b mod p studieren; dabei dürfen wir a, b als Elemente von Z/pZ auffassen. Nun definiert diese Kongruenz eine Gleichung im Körper Z/pZ und insofern beschreibt (6) eine Kurve über dem Restklassenkörper Z/pZ, welche wir mit E(Z/pZ) notieren und die Reduktion modulo p der primär über Z erklärten elliptischen Kurve E nennen. (Tatsächlich untersucht man auch elliptische Kurven über allgemeinen endlichen Körpern Fq , jedoch opfern wir diese Allgemeinheit der Einfachheit.) Nach dem Poincaréschen Satz 3 trägt die Reduktion E(Z/pZ) modulo einer Primzahl p wieder die Struktur einer abelschen Gruppe und die Additionsgesetze erklären sich völlig analog zu denen über Q (s.u.); dabei spielt nach wie vor ein unendlich ferner Punkt O die Rolle des neutralen Elementes bzgl. dieser Addition. Ferner haben wir es bei elliptischen Kurven über endlichen Körpern stets mit endlichen Gruppen zu tun (was sie insbesondere interessant für kryptographische Aspekte macht). Die wichtigsten Fragen mit Blick auf die Arithmetik elliptischer Kurven sind bei dieser Konstruktion: Welche Eigenschaften erbt E(Z/pZ) von E(Q) und welche Rückschlüsse von E(Z/pZ) auf E(Q) lassen sich ziehen? Als ein Beispiel untersuchen wir die elliptische Kurve E : Y 2 = X 3 + X, welche nach §3 über den rationalen Zahlen die Struktur E(Q) = {O, (0, 0)} 26 ELLIPTISCHE KURVEN besitzt. Für die Diskussion der modulo einer Primzahl p reduzierten Kurven haben wir also die Kongruenz Y 2 ≡ X 3 + X mod p zu studieren. Hierbei ist der kleine Satz von Fermat besonders wichtig: Für p ∤ a gilt ap−1 ≡ 1 mod p bzw. ap ≡ a mod p. • p = 2 : Mit dem kleinen Fermat vereinfacht sich die zu untersuchende Kongruenz zu Y ≡ Y 2 ≡ X 3 + X ≡ X + X ≡ 0 mod 2 und es ergibt sich {(0, 0), (1, 0)} als Menge der Punkte die, dieser Kongruenz genügen, wobei wir noch gar nicht den unendlich fernen Punkt berücksichtigt haben. Allerdings ist die Charakteristik des zu Grunde liegenden endlichen Körpers zwei und in diesem Fall haben wir es (s.o.) nicht mit einer kubischen Kurve zu tun; außerdem ergibt sich hier noch die Diskriminante als ∆ = −4 ≡ 0 mod 2, weshalb wir es darüber hinaus auch noch mit einer singulären nichtkubischen Kurve zu tun haben und deshalb also das Gruppengesetz keinen Sinn macht. Wir fahren mit unserer Beispielkurve fort: • p = 3 : In ähnlicher Weise findet man hier mit (0, 0), (2, 1), (2, 2) drei endliche Punkte, jedoch ist hier die Charakteristik des endlichen Körpers drei und also unsere Kurve wiederum keine kubische Kurve. • p = 5 : In diesem Fall handelt es sich um eine nicht-singuläre kubische Kurve und es gilt E(Z/5Z) = {O, (0, 0), (2, 0), (3, 0)}. Wir sagen die elliptische Kurve E : Y 2 = X 3 +aX+b hat gute Reduktion modulo p, falls die Kurve E(Z/pZ) nicht-singulär ist, also ∆ = −(4a3 + 27b2 ) 6≡ 0 mod p gilt; ansonsten sprechen wir von schlechter Reduktion modulo p. Nun hat die Diskriminante ∆ nur endlich viele Primteiler, d.h. für alle bis auf endlich viele Primzahlen ist die Reduktion gut. Und noch ein Beispiel: E : Y 2 = X3 − 2 über Z/5Z. Hier berechnet sich die Diskriminante als ∆ = −22 · 33 . Modulo p = 5 haben wir also gute Reduktion und es zeigt sich E(Z/5Z) = {O, (1, 2), (1, 3), (2, 1), (2, 4), (3, 0)}. Diese elliptische Kurve besteht also aus sechs Punkten. Um mehr Einsicht in die Struktur dieser Gruppe zu erhalten, schauen wir uns an, wie sich Vielfache des Punktes P = (1, 2) verhalten. Mit dem Gruppengesetz aus §3 ergibt sich für die Koordinaten des Punktes 2P = P ⊕ P = (x3 , −y3 ) x3 = (3x21 + a)2 (2y1 )−2 − 2x1 , y3 = (3x21 + a)(2y1 )−1 (x3 − x1 ) + y1 , 4. Reduktion modulo p 27 wobei in unserem Fall a = 0 gilt; dabei haben wir jeweils das multiplikativ Inverse im Körper Z/5Z zu nehmen. Speziell mit x1 = 1, y1 = 2 ergibt sich daraus x3 = (3 · 4−1 )2 − 2 ≡ 2, y3 = 3 · 4−1 (2 − 1) + 2 ≡ 4 ≡ −1 mod 5, also 2P = (2, 1). (Spiegeln an der x-Achse nicht vergessen!) Mit noch ein wenig mehr Rechnerei ergibt sich P = (1, 2) → 2P = (2, 1) → 3P = (3, 0) → → 4P = (2, 4) → 5P = (1, 3) → 6P = O, womit also der Punkt P die Gruppe erzeugt. Im Falle 6P = 3P ⊕ 3P entsteht der unendlich ferne Punkt, denn bei der Addition ist hier das Inverse von 0 mod 5 zu berechnen, was wir ähnlich zum rationalen Fall als ∞ deuten. Abbildung 15. Eine Visualisierung der elliptischen Kurve Y 2 = X 3 − 2 bei Reduktion modulo p = 5. Die Gruppe ist zyklisch von der Ordnung sechs. Von großer Wichtigkeit ist die Größe von elliptischen Kurven über endlichen Körpern. Bezeichnet N (p) := ♯E(Z/pZ) die Gruppenordnung der Reduktion modulo p, so gilt sicherlich 1 ≤ N (p) ≤ 2p + 1, denn stets ist O ∈ E(Z/pZ), was die erste Ungleichung liefert, während die zweite Ungleichung daraus resultiert, dass für jede der p Restklassen x mod p es höchstens zwei y mit y 2 ≡ x3 + ax + b mod p gibt (da Z/pZ ein Körper ist). 28 ELLIPTISCHE KURVEN Tatsächlich gilt jedoch etwas viel Restriktiveres, was wir mit einem heuristischen Argument plausibel machen wollen: Aus der Theorie der quadratischen Reste ist bekannt, dass es genauso viele quadratische Reste wie Nichtreste modulo p gibt, wobei p hier und im Folgenden eine ungerade Primzahl sei. (Wir erinnern: a 6≡ 0 mod p ist ein quadratischer Rest, wenn die Kongruenz X 2 ≡ a mod p lösbar ist; ansonsten heißt a ein Nichtrest. Mehr hierzu findet sich in jedem Zahlentheoriebuch wie etwa [6].) Dies interpretieren wir so, dass zu x ∈ {0, 1, . . . , p − 1} die Wahrscheinlichkeit, dass x3 + ax + b ein Quadrat ist, gleich 21 beträgt. Also ist der Erwartungswert für N (p) gleich 1+2· 1 2 · p = p + 1. Es geht noch etwas genauer: Das Legendre-Symbol beschreibt, ob eine Restklasse ein quadratischer Rest ist oder nicht: +1, wenn a mod p quadratischer Rest, a = 0 , falls p | a, p −1, wenn a mod p quadratischer Nichtrest. Damit schreibt sich 3 X x3 + ax + b X x + ax + b = p+1+ ; N (p) = 1 + 1+ p p x mod p x mod p hier ist jeder Summand entweder gleich zwei oder gleich null, je nachdem, ob (x, y) ∈ E(Z/pZ). Da das Legendre-Symbol ausschließlich die Werte 0, ±1 annimmt, liegt es nahe die Summe rechts als eine stochastische Irrfahrt zu interpretieren (was sie sicherlich nicht ist); mit der Theorie der Irrfahrten √ (bzw. dem Satz von Moivre-Laplace) ist der Wert der Summe als O( p) zu schätzen. Tatsächlich liefert dies die richtige Größenordnung, wie bereits Emil Artin vermutete und Helmut Hasse bewies: Satz 6 (Hasse 1933). Sei p prim und E eine elliptische Kurve über Z/pZ, dann gilt √ |p + 1 − N (p)| < 2 p. Der Satz von Hasse gilt auch für elliptische Kurven über endlichen Körpern Fq , bloß ist hier die Ungleichung des Satzes zu ersetzen durch √ |q + 1 − N (q)| ≤ 2 q. Auch dieses Ergebnis wurde von Weil (1948) auf beliebige nicht-singuläre Kurven verallgemeinert; auf ihn zurückgehende höherdimensionale Vermutungen über die Anzahl von Punkten auf algebraischen Varietäten über endlichen Körpern wurden von Dwork, Grothendieck und Deligne (1974) bewiesen; Pierre Deligne wurde für seine Arbeiten 1978 mit der Fields-Medaille ausgezeichnet. Wir wollen einen Spezialfall des Satzes 6 von Hasse beweisen. Ein Blick in die Liste der ersten Gruppenordnungen der durch die Gleichung Y 2 = X 3 + X 4. Reduktion modulo p 29 Abbildung 16. Helmut Hasse, ∗ 1898 in Kassel, - † in Ahrensburg bei Hamburg; bedeutender Mathematiker, der hauptsächlich zur algebraischen Zahlentheorie arbeitete und das ’Lokal-Global-Prinzip’ für quadratische Formen entdeckte. Rechts: André Weil, ∗ 1906 in Paris, - † 1998 in Princeton; weltreisende Berühmtheit und Bourbaki-Mitglied mit einem bewegten Lebenslauf und sehr tiefliegenden Ergebnissen in algebraischer Geometrie und Zahlentheorie. definierten Kurve bei Reduktion modulo kleiner Primzahlen offenbart eine gewisse Gesetzmäßigkeit: 5 7 11 13 17 19 23 29 p N (p) 4 8 12 20 16 20 24 20 Offensichtlich gilt hier: für jede Primzahl p ≡ 3 mod 4. N (p) = p + 1 Beweis. Mit dem ersten Ergänzungsgesetz (siehe etwa [6]), p−1 −1 = (−1) 2 = −1, p zeigt sich (zusammen mit den Rechenreglen für das Legendre-Symbol) (−x)3 + (−x) −(x3 + x) = p p 3 3 x +x x +x −1 =− . = p p p Also folgt 0 = X 06≡x mod p = 2 X 06≡x mod p (−x)3 + (−x) p 3 x +x , p + x3 + x p 30 ELLIPTISCHE KURVEN denn mit x durchläuft auch −x alle primen Restklassen modulo p. Es folgt also N (p) = p + 1. • In diesem Beweis eines wirklich einfachen Spezialfalles des Satzes von Hasse haben wir eine Symmetrie der elliptischen Kurve E : Y 2 = X 3 −X ausgenutzt, die nicht alle elliptische Kurven teilen. Neben den üblichen Endomorphismen der Multiplikation mit einer ganzen Zahl, E → E, P 7→ n · P = P . . ⊕ P} | ⊕ .{z n−mal für n ∈ Z, besitzt diese spezielle elliptische Kurve den zusätzlichen Endomorphismus √ ψ : E → E, (x, y) 7→ (−x, y −1), √ wobei −1 hier für eine primitive vierte Einheitswurzel steht (also im komplexen Fall gleich der imaginären Einheit ist); eine solche zusätzliche Symmetrie nennt man komplexe Multiplikation, manifestiert sich diese doch stets als ein Element eines Ganzheitsrings eines imaginär-quadratischen Zahlkörpers (siehe [11]). Bei der Kurve gegeben durch die Gleichung Y 2 = X 3 + 17 bei Reduktion modulo Primzahlen p ≡ 2 mod 3 erhält man mit einem ganz ähnlichen Argument ebenfalls N (p) = p + 1. Von besonderem Interesse ist auch die Frage, inwieweit sich lokale Information für globale Fragen nutzbar machen lässt. Hierzu sei zunächst der berühmte Satz von Hasse–Minkowski über nicht-triviale Darstellungen rationaler Zahlen durch über Q definierte quadratische Formen erwähnt, welcher zeigt, dass jene äquivalent zur nicht-trivialen Darstellbarkeit in allen lokalen p-adischen Körpern Qp zuzüglich R ist (siehe [9]). Ein einfaches Beispiel für diese geheimnisvolle Beziehung, globale Information ist: x ist ein rationales Quadrat ←→ lokale Information , x ist ein Quadrat über den reellen Zahlen und modulo allen Primzahlen. Es ist bekannt, dass diese ebenfalls auf Hasse zurückgehende Idee, das so genannte Lokal-Global-Prinzip, also lokale Informationen aus den p-adischen Vervollständigungen des globalen Körpers Q für die Arithmetik von Q zu gewinnen, bereits für kubische Formen i.A. scheitert. Allerdings mag man im Falle elliptischer Kurven hoffen, trotzdem ein Analogon dieser Idee zu finden: Betrachten wir beispielsweise die Kurve zur Gleichung ⇐⇒ E : Y 2 = X3 − 2 von oben, so ist (3, 5) ∈ E(Q) ein rationaler Punkt und bei Reduktion modulo p folgt (3, 5) ∈ E(Z/pZ) für alle Primzahlen p guter Reduktion. (Hier nutzen wir nur aus, dass Kongruenzen gewissermaßen Abschwächungen der Gleichheitsrelation sind!) Wir fragen: Gilt auch die Umkehrung? Genauer: 5. Assoziativität des Gruppengesetzes 31 Gibt es ’relativ viele’ Punkte in ’vielen’ Kurven E(Z/pZ), so sollten sich viele von diesen zu rationalen Punkten auf E(Q) zusammenfügen! Und dies wäre letztlich ein Indiz dafür, dass E(Q) unendlich viele Punkte enthält. Es geht hier also wie beim Satz von Hasse–Minkowski um das Schlagen einer Brücke zwischen lokaler und globaler Information (d.h. Punkte bei Reduktion modulo Primzahlen vs. rationale Punkte). Tatsächlich steht hier im Hintergrund eine der sieben Millennium-Vermutungen, die offene Vermutung von Birch & Swinnerton–Dyer (1963/65). Ist E eine über Z definierte elliptische Kurve, so gilt Y N (p) πE (x) := ∼ CE (log x)rg(E) p p≤x mit einer nur von E abhängigen Konstanten CE 6= 0 bei x → ∞. Dies ist eine schwache Form der Vermutung von Birch & Swinnerton–Dyer; eine stärkere Version wird uns später noch beschäftigen. Ist also die Gruppenordnung N (p) bei Reduktion modulo p für viele Primzahlen signifikant größer als der Erwartungswert, so sollte der Rang der Kurve rg(E) positiv sein. Numerische Daten für viele elliptische Kurven unterstützen diese Vorhersage. 5. Die Assoziativität des Gruppengesetzes Für den vollständigen Beweis des Poincaréschen Satzes 3 fehlt nur noch der Nachweis der Assoziativität bei der Addition von Punkten, also (P ⊕ Q) ⊕ R = P ⊕ (Q ⊕ R) für beliebige endliche Punkte P, Q, R auf einer elliptischen Kurve E(K) mit einem fixierten Körper K. Hierfür gibt es verschiedene Beweise: Ein eleganter Ansatz benutzt Divisoren und den Satz von Riemann-Roch aus der algebraischen Geometrie, die wir hier nicht voraussetzen wollen. Am einfachsten ist vielleicht der komplexe Beweis, welcher allerdings den Makel hat, das Gruppengesetz nur für C und Teilkörper zu liefern. Wir möchten Satz 3 jedoch für beliebige Körper (insbesondere für die in der Kryptographie so wichtigen endlichen Körper) vollständig beweisen.‡ Dazu machen wir einen kurzen Abstecher in die projektive Geometrie (vgl. auch §1). Gegeben ein Körper K, betrachten wir die zugehörige projektive Ebene P2 (K) = (K3 \ {0})/ ∼, wobei die Quotientenstruktur durch die Äquivalenzrelation (x, y, z) ∼ (λx, λy, λz) für λ ∈ K∗ entsteht. Damit werden alle skalaren Vielfachen eines Vektors (x, y, z) miteinander identifiziert und wir notieren die Äquivalenzklassen als (x : y : z). ‡ Prinzipiell könnte man sich auch einen Beweis mittels Computer-Algebra vorstellen... 32 ELLIPTISCHE KURVEN Jede Gerade durch den Ursprung 0 in K3 steht also für einen Punkt in der projektiven Ebene. Aus der affinen Kurve enststeht die zugehörige projektive Kurve durch ’Homogenisierung’ affine elliptische Kurve: Y 2 = X 3 + aX + b −→ projektive elliptische Kurve: Y 2 Z = X 3 + aXZ 2 + bZ 3 . Offensichtlich genügen mit (x, y, z) auch λ(x, y, z) der homogenisierten projektiven Gleichung. Die projektive Kurve enthält den zusätzlichen Punkt (0 : 1 : 0), welchen wir als den unendlich fernen Punkt O auffassen. Die affine Kurve gewinnt man aus der projektiven Kurve einfach durch Projektion Z = 1 zurück. Ferner stellt sich ein affiner Punkt P = (x, y) auf der projektiven Kurve dar als (x : y : 1) = ( xy : 1 : y1 ) und mit y, x → ∞ ergibt sich der unendlich ferne Punkt O. Eine affine Kurve C, gegeben durch eine polynomielle Gleichung P (X, Y ) = 0, heißt bekanntlich irreduzibel, falls das Polynom P irreduzibel ist, sich also nur trivial faktorisieren lässt. Projektive Kurven C1 und C2 besitzen keine gemeinsame Komponente, wenn ihre irreduziblen Komponenten verschieden sind, also kein gemeinsamer polynomieller Faktor (von einem positiven Grad) in beiden definierenden Polynomen aufgeht. Insbesondere ist der Schnitt zweier solcher Kurven notwendig eine endliche Punktmenge und wir definieren für einen Punkt P ∈ C1 ∩ C2 die Schnittmultiplizität als ı(C1 ∩ C2 , P ) = 1, falls C1 und C2 sich transversal in P schneiden, bzw. als ı(C1 ∩ C2 , P ) = m, wenn die Vielfachheit m ist (und natürlich null für P ∈ 6 C1 ∩ C2 ). Damit formuliert sich nun der Satz von Bezout. Für zwei projektive Kurven C1 und C2 ohne gemeinsame Komponenten gilt X ı(C1 ∩ C2 , P ) = deg C1 · deg C2 . P ∈C1 ∩C2 Sind C1 und C2 beide glatt ohne nicht transversale Schnitte, so gilt ♯(C1 ∩ C2 ) = deg C1 · deg C2 . Insbesondere schneiden sich zwei parallele Geraden im Unendlichen (denn Geraden haben Grad deg C = 1; man erinnere sich an die Definition des Grades in §1). Ferner zeigt sich, wie bereits erwähnt, dass eine Gerade eine elliptische Kurve stets in genau drei Punkten schneidet. Für einen Beweis des Bezoutschen Satzes verweisen wir auf [4] bzw. [8]. Neunpunktesatz. Seien C, C1 und C2 drei kubische Kurven und C enthalte acht der neun Schnittpunkte von C1 ∩ C2 , dann liegt auch der neunte Schnittpunkt auf C. 5. Assoziativität des Gruppengesetzes 33 Abbildung 17. Die Assoziativität der Addition von Punkten auf einer elliptischen Kurve; das Bild ist dem schönen Buch [8] entnommen, weshalb hier auch’+’ statt ’⊕’ steht. Der Beweis funktioniert so ähnlich, wie die für folgende Sätze der analytischen Geometrie: Durch zwei verschiedene Punkte im Euklidischen geht genau Gerade; oder höherdimensional: Eine Quadrik in allgemeiner Lage ist durch fünf Punkte eindeutig bestimmt. 34 ELLIPTISCHE KURVEN Beweis. Eine projektive kubische Kurve ist gegeben durch eine kubische Gleichung der Form aX 3 +bX 2 Y +cXY 2 +dY 3 +eX 2 Z +f XZ 2 +gY 2 Z +hY Z 2 +iZ 3 +jXY Z = 0. Jede solche kubische Kurve C ist also durch die zehn Koeffizienten a, b, c, . . . , i, j bestimmt; Multiplikation der Gleichung mit einem von null verschiedenen Skalar verändert nicht die Kurve. Also ist C bis auf ein Vielfaches der Koeffizienten eindeutig bestimmt, definiert also einen eindeutigen Punkt (a : b : c : . . . : i : j) im projektiven Raum P9 (den man analog zum P2 definiert). Darüberhinaus ist die Menge aller kubischen Kurven isomorph zum P9 . Nun fragen wir, wann ein Punkt P = (x : y : z) auf einer kubischen Kurve C liegt. Dies ist genau dann der Fall, wenn die lineare homogene Gleichung ax3 + bx2 y + cxy 2 + dy 3 + ex2 z + f xz 2 + gy 2 z + hyz 2 + iz 3 + jxyz = 0. in den unbekannten Koeffizienten a, b, c, . . . , i, j erfüllt ist. Also ist für einen gegebenen Punkt P die Menge aller Kurven C, die P enthalten, durch eine homogene lineare Gleichung in P9 determiniert. Entsprechend ist die Menge aller Kurven C, welche die n verschiedenen Punkte P1 , . . . , Pn enthalten, eindeutig durch ein System von n homogenen linearen Gleichungen in P9 festgelegt. Haben wir also zwei kubische Kurven C1 , C2 mit mindestens neun gemeinsamen Punkten gegeben, so sei C die Menge aller kubischen Kurven C, welche durch irgendwelche fest gewählten acht der neun Punkte laufen. Diese Menge korrespondiert mit einer Lösung eines Systems von acht homogenen linearen Gleichungen in zehn Unbekannten. Der Lösungsraum besteht nun aus allen Linearkombinationen λ1 v + λ2 w zweier linear unabhängiger Lösungen v, w von Zehntupeln. Da nun sowohl C1 als auch C2 in C enthalten sind, liefern die Koeffizienten ihrer definierenden Gleichungen F1 = 0 bzw. F2 = 0 jeweils ein Zehntupel, welches dieses homogene lineare Gleichungssystem löst und deshalb den gesamten Lösungsraum aufspannen. Ist nun C eine weitere kubische Kurve in C, die also jene ausgezeichneten acht Punkte trifft, so ist die C definierende Gleichung von der Form λ1 F1 (X, Y, Z) + λ2 F2 (X, Y, Z) = 0 für gewisse λ1 , λ2 ∈ K. Damit enthält aber C sicher auch den neunten Punkt (x : y : z) (denn für jenen gilt Fj (x, y, z) = 0). • Damit gelingt nun der Beweis der Assoziativität wie folgt: Gegeben seien P, Q, R ∈ E(K), dann bezeichnen P ∗ Q und Q ∗ R den dritten Schnittpunkt der Sekante durch P und Q bzw. durch Q und R mit der elliptischen Kurve E(K); im Falle P = Q bzw. Q = R handelt es sich dabei um die Tangente. Auf jeden Fall existiert jedoch dieser dritte Schnittpunkt dank des Satzes von Bezout. Können wir (7) (P ⊕ Q) ∗ R = P ∗ (Q ⊕ R) 6. Fermats ’descente infinie’ 35 zeigen, so folgt bereits (P ⊕ Q) ⊕ R = P ⊕ (Q ⊕ R) und damit die Assoziativität des Gruppengesetz. Dabei haben wir gewissermaßen O gekürzt, denn aus der Definition der Addition folgt P ⊕ Q = O ∗ (P ∗ Q). Wir notieren eine Gerade beispielsweise durch die Punkte P und Q nun kurz mit P Q. Wir starten mit den Geraden P (Q ⊕ R) (die durgezogene Linie in Abbildung 17) und (P ⊕ Q)R (gestrichelt in Abbildung 17). Wir haben zu zeigen, dass deren Schnitt auf der elliptischen Kurve liegt. In dem Falle folgt nämlich (7). Hierzu betrachten wir die neun Punkte • • • • O, P, Q, R, P ∗ Q, P ⊕ Q, Q ∗ R, Q ⊕ R, sowie den Schnittpunkt beider Geraden. Nun definieren die drei Geraden RQ sowie P (Q ⊕ R) und (P ⊕ Q)(P ∗ Q) als jeweils lineare Gleichung (die jeweils durchgezogenen Linien) eine kubische Kurve C1 . Analog definieren die drei Geraden P Q sowie R(P ⊕ Q) und (Q ⊕ R)(Q ∗ R) (die jeweils gestrichelten Linien) eine kubische Kurve C2 . Nach Konstruktion liegen die neun Punkte auf beiden kubischen Kurven. Unsere elliptische Kurve E trifft acht dieser Punkte des Schnittes C1 ∩ C2 und nach dem Neunpunktesatz liegt dann auch der neunte Punkt, der Schnittpunkt der Geraden P (Q⊕R) und (P ⊕Q)R, auf der elliptischen Kurve. Dies zeigt (7) und letztlich also die Assoziativität der Punkteaddition auf elliptischen Kurven. • 6. Fermats ’descente infinie’ Pierre de Fermat las Bachets lateinische Übersetzung Diophants ’Arithmetica’ und notierte auf dem sehr schmalen Rand neben Euklids Parametrisierung der pythagoräischen Tripel (Satz 1), dass er für die Unmöglichkeit eines analogen Resultates mit Kuben oder Biquadraten oder gar höheren Potenzen statt der Quadrate einen wunderbaren Beweis besitze (siehe §1). Fermat’s last theorem. [Andrew Wiles, 1995] Die Gleichung Xn + Y n = Zn mit n≥3 besitzt nur triviale Lösungen in ganzen Zahlen, d.h. xyz = 0. Wiles gefeierter Beweis basiert auf der Theorie der Modulformen und elliptischen Kurven. Tatsächlich bewies Wiles einen Spezialfall der so genannten ’Shimura-Taniyama-Vermutung’ (aus dem Jahre 1957), welche eine Brücke zwischen eben diesen Gebieten spannt. Die Idee, auf diese Art und Weise die Fermatsche Vermutung zu beweisen (im Englischsprachigen auch ’Fermats last theorem’ genannt, weil es lange das letzte unbewiesene Resultat aus Fermats Briefen an seine Zeitgenossen war), geht zurück auf Hellegouarch und Frey, 36 ELLIPTISCHE KURVEN Abbildung 18. Oben: Yutaka Taniyama, ∗ 1927 - † 1958 in Tokio (links) und Goro Shimura, ∗ 1930 in Hamamatsu (rechts); unten: Andrew Wiles, ∗ 1953 in Cambridge. Das erste Indiz für die Richtigkeit der bemerkenswerten Shimura-Taniyama-Vermutung aus dem Jahre 1955 war Weils Umkehrsatz von 1967. die beide (unabhängig voneinander) in den siebziger Jahren folgenden Ansatz proklamierten: Angenommen, es gäbe eine nicht-triviale Lösung der FermatGleichung für ein festes n ≥ 3, (8) xn + y n = z n , so betrachte man die elliptische Kurve E : Y 2 = X(X − xn )(X − z n ) mit der nach unserer Annahme nicht verschwindenden Diskriminante ∆ = 16(xyz)2n . Hier ist E zwar noch nicht in Weierstraßscher Normalform gegeben, lässt sich aber leicht in diese transformieren. Bei der Berechnung der Diskriminante legt man am besten die algebraische Definition als Produkt der Quadrate über die Differenzen der Nullstellen zu Grunde und berechnet mit Hilfe von (8) ∆ = 16(xn )2 (z n − xn )2 (z n )2 = 16x2n y 2n z 2n . Die Idee ist nun, zu zeigen, dass diese so definierte elliptische Kurve nicht modular sein kann, also bei Reduktion modulo Primzahlen nicht von so genannten 6. Fermats ’descente infinie’ 37 Modulformen herrührt (was von Ribet um 1990 bewiesen wurde). Tatsächlich besagt die mittlerweile von Wiles et al. komplett bewiesene Shimura-TaniyamaVermutung, dass alle über den rationalen Zahlen definierten elliptischen Kurven von gewissen Modulformen herrühren. Wiles genügte ursprünglich ein Spezialfall dieser Vermutung um Fermats ’letzten Satz’ auf folgendem Umweg zu beweisen: Wenn Fermats letzter Satz falsch ist, so auch die Taniyama-ShimuraVermutung; ist die Taniyama-Shimura-Vermutung hingegen richtig, so muss auch Fermats letzter Satz richtig sein!§ Wir kehren zurück zu Fermat. Sicher ist, dass er einen Beweis für den Exponenten n = 4 hatte und womöglich glaubte Fermat, dass seine Beweismethode – die Methdode des unendlichen Abstiegs (descente infinie) – für beliebige Exponenten n ≥ 3 anwendbar sei. Allerdings bereitet bereits n = 3 Probleme, welche Euler teilweise und schließlich Gauß gänzlich behoben. Es scheint jedoch aussichtslos, den allgemeinen Fall mit elementaren Methoden zu behandeln. Hier geben wir nun Fermats Argument für den Exponenten n = 4 im Gewand elliptischer Kurven: Satz 7. Die elliptische Kurve E : Y 2 = X3 − X besitzt über Q Rang null, enthält also nur ’triviale’ Punkte, d.h. E(Q) = {O, (0, 0), (−1, 0), (1, 0)}. Bevor wir diesen Satz beweisen, zeigen wir, dass hieraus tatsächlich die Gültigkeit der Fermatschen Vermutung für n = 4 folgt: Angenommen, es gibt eine nicht-triviale Lösung, also x4 + y 4 = z 4 mit o.B.d.A. x, y, z ∈ N. Dann folgt äquivalent x4 = z 4 − y 4 bzw. nach Multiplikation mit z 2 y −6 2 2 2 3 z z2 x z = − . y3 y2 y2 Also folgte die Existenz eines rationalen Punktes auf der elliptischen Kurve mit nichtverschwindender y-Koordinate, ein Widerspruch zu Satz 7. Für den elementaren Beweis von Satz 7 bemühen wir Fermats Idee des ’descente infinie’. Ein wichtiges Hilfsmittel ist hierbei eine Größe, die wir später (in §7) auch bei Mordell finden! Gilt α = ab ∈ Q mit gekürzten Zähler und Nenner, so sei die Höhe von α 6= 0 definiert durch H(α) := max{|a|, |b|} und H(0) := H( 10 ) = 1. Die Fermatsche Beweisidee lässt sich nun kurz so formulieren: Erziele einen Widerspruch durch Abstieg von einer ’kleinsten’ Lösung bzgl. der Höhe zu einer noch kleineren! § Einstiegsliteratur bietet der lesenswerte Artikel ’Über die Fermat-Vermutung’, Elem. Math. 50 (1995), 12-25, von J. Kramer, mehr Details bietet [11]; in beiden Quellen finden sich auch Zitate für die Originalarbeiten von Wiles et al. 38 ELLIPTISCHE KURVEN Abbildung 19. Die elliptische Kurve Y 2 = X 3 −X mit ihren drei endlichen rationalen Punkten (0, 0), (±1, 0), welche man sofort aus der Faktorisierung Y 2 = (X − 1)X(X + 1) abliest. Wir starten mit einigen Vorüberlegungen. Ist (0, 0) 6= (x, y) ein Punkt auf E(Q), so auch (− x1 , xy2 ) denn insbesondere ist x 6= 0 und y 2 −1 3 −1 − ⇐⇒ y 2 = −x + x3 . = x2 x x Wir gehen nun von einem Punkt (x1 , y1 ) ∈ E(Q) ungleich den trivialen Punkten (0, 0), (±1, 0) aus. Dann ist (x1 − 1)x1 (x1 + 1) = y12 > 0. Wegen H(x) = H(− x1 ) dürfen wir annehmen, dass x1 > 1. Wir zeigen zuerst: x1 − 1, x1 , x1 + 1 sind allesamt Quadrate rationaler Zahlen. Sei also x1 = m n mit teilerfremden natürlichen Zahlen m, n. Angenommen, m und n sind ungerade, so folgt x1 + 1 (m + n)/2 = , x1 − 1 (m − n)/2 x′1 = wobei jeweils (m ± n)/2 ∈ Z. Nach einer langweiligen Rechnerei, 2 x1 + 1 3 x1 + 1 2y1 = − (x1 − 1)2 x1 − 1 x1 − 1 ⇐⇒ 4y12 folgt damit = (x1 + 1)(x1 − 1){(x1 + 1)2 − (x1 − 1)2 }, x′1 , 2y1 ∈ E(Q). (x1 − 1)2 6. Fermats ’descente infinie’ 39 Nun ist nm + n m − no < max{m, n} = H(x1 ). , 2 2 Setzen wir die natürliche Zahl H(x1 ) als minimal voraus, so ergibt sich ein Widerspruch! Also ist m gerade oder n gerade, aber nicht beide (da diese ja teilerfremd sind). Eine einfache Rechnung zeigt H(x′1 ) ≤ max (m − n)mn(m + n) , n4 ein Quadrat! Nun sind die Zahlen m − n, m, n, m + n paarweise teilerfremd; eigentlich bereitet nur der Fall m + n, m − n etwas Kopfzerbrechen. Wegen y12 = (x1 − 1)x1 (x1 + 1) = 2m = (m + n) + (m − n) und 2n = (m + n) − (m − n) kommen hier als größter gemeinsamer Teiler nur 1 oder 2 in Frage, wobei letzteres aber auf Grund der Teilerfremdheit von m und n unmöglich ist. Mit der eindeutigen Primfaktorzerlegung (in Q) sind also alle Zahlen m − n, m, n, m + n Quadrate rationaler Zahlen. Insbesondere gilt dies für m m+n m−n , x1 = , x1 + 1 = , x1 − 1 = n n n was zu zeigen war. Diese Konstellation von drei Quadraten ist etwas besonderes, wie der folgende wichtige Satz zeigt, der Aufschluss über die Teilbarkeit eines Punktes durch zwei gibt: Satz 8 (’Multiplication by 2’-map). Sei K ein Körper einer Charakteristik 6= 2, 3 und E : Y 2 = (X − α)(X − β)(X − γ) mit paarweise verschiedenen Wurzeln α, β, γ ∈ K eine elliptische Kurve. Dann gibt es zu jedem Punkt (x1 , y1 ) ∈ E(K) genau dann einen Punkt (x0 , y0 ) ∈ E(K) mit 2(x0 , y0 ) = (x1 , y1 ), wenn x1 − α, x1 − β, x1 − γ Quadrate in K sind. Beweis. Wir nehmen an, dass (x1 , y1 ) = 2(x0 , y0 )(:= (x0 , y0 ) ⊕ (x0 , y0 )). Sei Y = mX+b die Tangente an (x0 , y0 ) ∈ E(K), dann genügen die Punkte (x0 , y0 ) und (x1 , −y1 ) (Spiegeln an der x-Achse nicht vergessen!) der Gleichung (X − α)(X − β)(X − γ) = (mX + b)2 bzw. (X − α)(X − β)(X − γ) − (mX + b)2 = (X − x1 )(X − x0 )2 (dabei steht der Exponent zwei rechts beim Linearfaktor X − x0 , weil wir es ja mit der Tangente zu tun haben). Im Folgenden bezeichne ein Quadrat in K (nicht notwendig dasselbe bei jedem Auftreten). Dann ergibt sich speziell für X = α − = (α − x1 ) 6= 0 ⇐⇒ x1 − α = sowie analog x1 − β, x1 − γ = mit paarweise verschiedenen Quadraten. 40 ELLIPTISCHE KURVEN Für die Umkehrung sei nach einer etwaigen Variablentransformation o.B.d.A. x1 = 0, dann gilt y12 = −αβγ = t für ein t ∈ K. Zusammen mit −α = α21 , −β = β12 , −γ = γ12 für gewisse α1 , β1 , γ1 ∈ K (nach Voraussetzung) ergibt sich bei geeigneter Wahl der Vorzeichen y1 = α1 β1 γ1 . Damit bilden wir nun die Tangente Y = mX + y1 an den unbekannten Punkt (x0 , y0 ) durch (0, y1 ) und erhalten durch Einsetzen (X − α)(X − β)(X − γ) − (mX + y1 )2 = X(X − x0 )2 . Setzen wir (X − α)(X − β)(X − γ) = X 3 + rX 2 + sX + t, so gilt r = −α − β − γ, (9) s = αβ + αγ + βγ Zusammen mit y1 = α1 β1 γ1 folgt oben also 3 1 X (X + rX 2 + sX + t − m2 X 2 − 2my1 X − y12 ) = (X − x0 )2 . Ein Koeffizientenvergleich liefert t = y12 und die Diskriminante des quadratischen Polynoms (10) X 2 + (r − m2 )X + s − 2my1 verschwindet also (auf Grund der doppelten Nullstelle x0 ), d.h. (11) (r − m2 )2 = 4(s − 2my1 ). Letzteres ist eine biquadratische Gleichung in m und wir suchen eine Lösung in K, um einen Punkt (x0 , y0 ) mit Koordinaten in K zu finden! Mit Blick auf die Cardanosche Formel spendieren wir eine Unbekannte u und fragen, wann (m2 − r + u)2 = 2um2 − 8y1 m + (u2 − 2ru + 4s) ein Quadrat ist? (Hierbei haben wir gegenüber (11) lediglich Null addiert.) Nun soll das quadratische Polynom in m auf der rechten Seite eine doppelte Nullstelle besitzen, entsprechend setzen wir dessen Diskriminante gleich Null: 0 = 64y12 − 8u(u2 − 2ru + 4s) bzw. mit ein wenig Rechnerei und (9) 0 = u3 − 2ru2 + 4su − 8y12 = (u + 2α)(u + 2β)(u + 2γ). Setzen wir also u = −2α, ergibt sich (m2 − r − 2α)2 = −4αm2 − 8y1 m + (4α2 + 4rα + 4s) und nach Substitution von (9) folgt (m2 − α + β + γ)2 = 4(α1 m − β1 γ1 )2 7. Der Satz von Mordell 41 bzw. m = ±α1 ± (β1 ∓ γ1 ). Damit besitzt (11) wie gewünscht eine Lösung m0 ∈ K und, wie man sofort nachrechnet, ist x0 = 21 (m20 − r) eine doppelte Nullstelle des Polynoms (10) bzw. ebenso von (X − α)(X − β)(X − γ) − (mX + y1 )2 . Es folgt 2(x0 , −m0 x0 − y1 ) = (0, y1 ) und der Satz ist bewiesen. • Nun geben wir den Beweis von Satz 7. Hierzu wenden wir Satz 8 mit α = 1, β = 0 und γ = −1 an. Nach unseren Vorüberlegungen sind die Voraussetzungen von Satz 8 erfüllt und somit existiert zu einem gegebenen Punkt (x1 , y1 ) auf E ein weiterer (x0 , y0 ) mit 2(x0 , y0 ) = (x1 , y1 ). Es genügt nun zu zeigen, dass H(x0 ) < H(x1 ) gilt, denn dann ergibt sich der gewünschte Widerspruch unter Annahme der Minimalität von H(x1 ). Mit der Verdopplungsformel (dem Gruppengesetz bei Tangenten) zeigt sich für x0 = ab mit teilerfremden a, b nach einer kleinen Rechnerei x1 = (a2 + b2 )2 (x20 + 1)2 = . 4ab(a2 − b2 ) 4(x30 − x0 ) Hier ist der größte gemeinsame Teiler von Zähler und Nenner des Bruches rechts ≤ 4 (denn diese sind teilerfremd bis auf eine Zweierpotenz). Also folgt tatsächlich H(x1 ) ≥ 41 (a2 + b2 )2 ≥ 1 4 max{|a|, |b|}4 > max{|a|, |b|} = H(x0 ) und H(x0 ) ≥ 2 (da x0 6= 0, ±1). Damit ist Satz 7 bewiesen. • Man vergleiche diesen Beweis mit Fermats Originalbeweis (siehe [9] bzw. §IV.1 in [4]). Das obige Argument benutzt interessante Konzepte, die eine tragende Rolle in der Theorie elliptischer Kurven spielen: Die Höhe wird sich u.a. im Beweis des Mordellschen Satzes als wichtig erweisen; ebenso die Gruppenstruktur, die sich insbesondere im Satz 8 wiederspiegelt. Diese Ideen lassen sich auf gewisse ähnliche elliptische Kurven Y 2 = X 3 − n2 X ausdehnen, doch dies ist ein Thema, welches wir in §10 besprechen werden. 7. Der Satz von Mordell Nun wollen wir den Mordellschen Satz 4 aus §3 beweisen. Wir erinnern seine Aussage: Die Gruppe der rationalen Punkte einer über Q definierten elliptischen Kurve ist endlich erzeugt, d.h. E(Q) ≃ Zr × T, wobei r = rg(E) der Rang von E(Q) und T = Etors (Q) die Torsionsgruppe aller Elemente endlicher Ordnung ist. Wir beschränken uns aber auf den 42 ELLIPTISCHE KURVEN Spezialfall E : Y 2 = X 3 + aX + b = (X − θ1 )(X − θ2 )(X − θ3 ) mit ganzzahligen Wurzeln θj . Im Beweis werden uns tatsächlich viele alte Ideen wieder begegegnen...¶ Y2 =X3 -62 X 20 P=H-3,9L 9360006 15120493920 P+Q=H , L 1324801 1524845951 10 1074902978 394955797978664 Q=H- , L 2015740609 90500706122273 -5 5 15 10 -10 -20 Abbildung 20. Die elliptische Kurve Y 2 = X 3 − 62 X mit etlichen rationalen Punkten. Seien zunächst zwei Punkte Pj = (xj , yj ) ∈ E(Q) mit x1 6= x2 gegeben. Die Sekante durch P1 und P2 wird dann beschrieben durch y2 − y1 Y = mX + c mit m = , c = y1 − mx1 x2 − x1 und P3 = P1 ∗ P2 sei der dritte Schnittpunkt mit E(Q). Wir führen neue Parameter ein und setzen xj = uj + θ. Die kubische Gleichung (mX + c)2 = X 3 + aX + b wird gelöst von den x-Koordinaten der Punkte (x, y) = (xj , yj ) für j = 1, 2, 3. Setzen wir xj = θj +uj ein, so ergibt sich durch Einsetzen in die Schnittpunktgleichung von Kurve und Gerade (nach ein wenig Rechnerei) u3 + (3θ − m2 )u2 + (3θ 2 + a − 2m2 θ − 2mc)u + |θ 3 + {z aθ + }b −(mθ + c)2 = 0 =0 ¶ Unser Beweis geht auf Andre Weil zurück. In der Darstellung folgen wir dem Buch mit dem irreführenden Namen The Riemann hypothesis and Hilbert’s tenth problem von S. Chowla, Gordon & Breach, 1965; jener schreibt dort übrigens, dieser Beweis wäre ”nothing beyond the capacity or ability of a ten-year old”. 7. Der Satz von Mordell 43 für u = uj . Das Polynom links faktorisiert sich als (u − u1 )(u − u2 )(u − u3 ), so dass ein Koeffizientenvergleich auf u1 u2 u3 = (mθ + c)2 bzw. (12) 1 x3 − θ = (x1 − θ)(x2 − θ) (y2 − y1 )θ + x2 y1 − x1 y2 x2 − x1 führt. Falls P1 = P2 findet man analog 2 2 x1 − a − 2θx1 − 2θ 2 (13) x3 − θ = . 2y1 2 Lemma 1. Zu O = 6 (x, y) ∈ E(Q) gibt es x, y, z ∈ Z mit y x x = 2, y = 3, z z wobei ggT(x, z) = ggT(y, z) = 1. Beweis. Sei x = nℓ , y = m n mit o.B.d.A. ggT(ℓ, m, n) = 1. Dass dies wirklich keine Einschränkung ist, zeigt Einsetzen in die E definierende Gleichung: ℓ3 ℓ m2 = +a +b 2 3 n n n bzw. ℓ3 = n(m2 − aℓn − bn2 ) Sei jetzt d := ggT(ℓ, n), sowie ℓ = dℓ′ und n = dn′ mit also ggT(ℓ′ , n′ ) = 1. Dann folgt d2 ℓ′3 = n′ (m2 − aℓn − bn2 ) und ggT(d, m2 − aℓn − bn2 ) = 1. Somit ist n′ = d2 n′′ für eine ganze Zahl n′′ und obige Gleichung lässt sich umschreiben zu ℓ′3 = n′′ (m2 − aℓn − bn2 ) mit ggT(ℓ′ , n′′ ) = 1. Mit der Teilerfremdheit folgt n′′ = 1 bzw. n′ = d2 und es ergibt sich dℓ′ ℓ′ m = und y = 3, d3 d2 d jeweils in offensichtlich gekürzter Form. Das Lemma ist bewiesen. • x= Sei nun O = 6 P = (x, y) ∈ E(Q) mit eben x = zx2 , y = zy3 . Dann ist y2 x x x 2 y = 6 = − θ1 − θ2 − θ3 , z z2 z2 z2 bzw. y2 = (x − θ1 z2 )(x2 − (θ2 + θ3 )xz2 + θ2 θ3 z4 ). Die Koeffizienten einer algebraischen Gleichung sind elementarsymmetrische Funktionen der Wurzeln der Gleichung. In unserem Fall bedeutet dies θ1 + θ2 + θ3 = 0, θ1 θ2 θ3 = −b und θ2 θ3 = θ12 + a. 44 ELLIPTISCHE KURVEN Unter Berücksichtigung der E definierenden Gleichung ergibt sich daher y2 = (x − θ1 z2 )(x2 + θ1 xz2 + (θ12 + a)z4 ). (14) Lemma 2. Für θ ∈ {θ1 , θ2 , θ3 } seien P = x − θz2 und Q = x2 + θxz2 + (θ 2 + a)z4 (also P Q = y2 nach (14)). Dann gilt ggT(P, Q) | (3θ 2 + a). Man beachte, dass alle θj und damit auch a ganzzahlig sind! Beweis. Zunächst gilt −P (x + 2θz2 ) + Q = −x2 + θxz2 − 2θxz2 + 2θ 2 z4 + x2 + θxz2 + (θ 2 + a)z4 = (3θ 2 + a)z4 bzw. (wiederum nach einiger Rechnerei) P (θ 2 + a)x + (θ 2 + a)θz2 + 2θ 2 Q = (3θ 2 + a)x2 . Mit dem vorangegangenen Lemma folgt ggT(x, z) = 1 und damit die Behauptung des Lemmas. • Nun seien mit M := ggT(P, Q) die Zahlen P ′ , Q′ erklärt durch P = M P ′ und Q = M Q′ mit ggT(P ′ , Q′ ) = 1. Es folgt daher aus (14) y 2 y y2 = P Q = M 2 P ′ Q′ bzw. P ′ Q′ = mit ∈ Z. M M Da P ′ , Q′ teilerfremd sind und ihr Produkt ein Quadrat ist, folgt P ′ = p2 , Q′ = q2 (15) für gewisse p, q ∈ Z (was man mit der Argumentation im Beweis des Fermatschen Satzes 7 in §6 vergleiche.). Lemma 3. Ist O = 6 (x, y) ∈ E(Q), dann gilt x − θ = µα2 für θ = θj , wobei α ∈ Q und µ entstammt einer endlichen Teilmenge ZE ⊂ Z. Beweis. Es gilt x−θ = x x − θz2 P −θ = = 2 =M 2 z z2 z 2 p . z Mit M = µ und pz = α zeigt sich vermöge Lemma 2 nun, dass µ ein Teiler von 3θ 2 + a ist. Da letztere Zahl nur endlich viele Teiler besitzt, entstammt µ also einer endlichen Teilmenge von Z. • Zu jedem (x, y) ∈ E(Q) \ {O} assoziieren wir nun ein Tripel (µ1 , µ2 , µ3 ) gemäß x − θi = µi α2i , so dass ZE ∋ µi | (3θi2 + a), αi ∈ Q. 7. Der Satz von Mordell 45 Dann folgt mittels Gleichung (12) bzw. im Tangentialfall (13) sofort µ1 µ2 µ3 = β 2 für ein β ∈ Q. Ist nun ferner der Punkt P1 assoziiert mit (µ1 , µ2 , µ3 ) und der Punkt P2 assoziiert mit (µ′1 , µ′2 , µ′3 ), so ist P3 = P1 ∗ P2 assoziiert mit (µ1 µ′1 , µ2 µ′2 , µ3 µ′3 ), denn eben mit (12) bzw. (13) gilt x3 − θ j = 1 1 · = µj µ′j · , ·= (x1 − θj )(x2 − θj ) µj µ′j wobei das Quadratsymbol hier für nicht notwendig gleiche rationale Quadrate steht. Im Falle P1 = P2 ist P3 = P1 ∗ P2 assoziiert mit (1, 1, 1). Im Folgenden geben wir nun den Beweis des Mordellschen Satzes (frei von jeglicher Gruppentheorie, allerdings unter der Annahme der Ganzzahligkeit der Wurzeln θi ). Wir zeigen hierzu: Es gibt endlich viele Punkte aus denen sich jeder Punkt P ∈ E(Q) durch endlich viele Anwendungen der SekantenTangenten-Methode konstruieren lässt. Seien A1 , . . . , Aw die endlich vielen Punkte, die mit allen (endlich vielen) möglichen Tripeln (µ1 , µ2 , µ3 ) mit µj | (3θj2 + a) assoziiert sind. Sei P = ( zx2 , zy3 ) 6= O nun irgendein Punkt aus E(Q) \ {O} (hierbei benutzen wir implizit Lemma 1 für die Form der Koordinaten). Dann existiert ein Punkt Av , so dass Av und P mit demselben Tripel assoziiert sind, was wir kurz wie folgt ausdrücken: P ∼ Av . Dann ist nach unseren obigen Überlegungen Q := P ∗Av assoziiert mit (1, 1, 1) und nach Satz 8 (multiplication by 2-map) gibt es x1 y1 P1 = , ∈ E(Q) mit P1 ∗ P1 = Q z21 z31 (denn x − θj = (x − θj ) · = ). Die Tangente an P1 geht also durch Q. Wir führen nun diese Konstruktion fort: xn yn P 7→ P1 7→ P2 7→ . . . 7→ Pn = , , z2n z3n wobei jeweils Pj+1 sich aus Pj durch Tangentenbildung ergibt, wie zuvor P1 aus P0 = P . Als wesentliches Werkzeug betrachten wir dabei nun die Höhe, definiert durch xn H(Pn ) = H 2 := max{|xn |, |z2n |} zn (vgl. §6). Wir wollen zeigen: bzw. p H(P1 ) ≤ c H(P ), p H(Pn ) ≤ c H(Pn−1 ) mit einer Konstanten c, die nur von E und A1 , . . . , Aw abhängt. 46 ELLIPTISCHE KURVEN Hierzu nehmen wir nun an, dass ℓ m P ∼ Av = , und n2 n3 Q = P ∗ Av = ξ η , ζ2 ζ3 . Dann folgt (mit ein wenig Rechnerei) ξ (ℓx + an2 z2 )(ℓz2 + n2 x) + 2bn4 z4 − 2mnyz = ; ζ2 (ℓz2 − n2 x)2 im Gegensatz zu (12) setzt man hier wiederum die elliptische Kurvengleichung mit der Tangentengleichung Y = mX + c gleich, ersetzt aber die unbekannte Steigung m mittels eines Koeffizientenvergleichs. Man findet unschwer (ℓx + an2 z2 )(ℓz2 + n2 x) + 2bn4 z4 − 2mnyz = O(H(P )2 ) mit einer nur von E und den Punkten A1 , . . . , Aw abhängigen impliziten Konstanten. Ferner gilt mit der E definierenden Gleichung y2 = x3 + axz2 + bz4 = O(H(P )3 ) sowie yz = O(H(P )2 ). Insgesamt folgt daher |ξ| ≤ cH(P )2 mit einer absoluten nur von E abhängigen Konstanten c. Eine analoge Abschätzung gilt für den Nenner ζ 2 der x-Koordinate von Q und es folgt daher H(Q) = max{|ξ|, |ζ 2 |} ≤ cH(P )2 . Jetzt betrachten wir P1 ∗ P1 = Q mittels (13) machen wir den Ansatz q für j = 1, 2, 3, (16) ± ξ − θj ζ 2 = e1 + e2 θj + e3 θj2 und erhalten also e1 = ζ(x21 − az41 ) −ζx1 z21 −ζz41 , e2 = , e3 = . 2y1 z1 y1 z1 y1 z1 Wir können (16) als ein lineares Gleichungssystem mit drei Gleichungen in drei Unbekannten e1 , e2 , e3 auffassen, welches mit Hilfe der Cramerschen Regel explizit gelöst werden kann. Bezeichnet nämlich 1 θ1 θ12 ∆ := det 1 θ2 θ22 , 1 θ3 θ32 so gilt sicherlich ∆ 6= 0 (da die θj paarweise verschiede sind). Die Cramersche Regel zeigt p ∆ej ∈ Z und ∆ej = O( H(Q)) = O(H(P )). Ferner folgt ∆(2e1 − ae2 ) = ∆ζ 2 x , y1 z1 1 −∆e3 = ∆ζ 4 z ∈ Z y1 z1 1 7. Der Satz von Mordell 47 und also teilt y1 die Zahl ∆ζ (da y1 und z1 teilerfremd sind nach Lemma 1) und ferner eilt z1 die Größe ∆ζ (da x1 und z1 teilerfremd sind nach Lemma 1). Ausserdem sind y1 und z1 teilerfremd, womit also y∆ζ ganzzahlig ist und 1 z1 p ∆ζ 2 x1 = ∆(2e1 − ae2 ) = O( H(Q)) y1 z1 p 4 2 bzw. p x1 = O( H(Q)) gilt. Mit einem analogen Argument gewinnt man z1 = O( H(Q)). Also folgt p 1 H(P1 ) = max{|x1 |, |z21 |} = O(H(Q) 4 ) = O( H(P )). Per Induktion ergibt sich bzw. q p 1 1 H(P2 ) ≤ c c H(P ) = c1+ 2 H(P ) 4 r q p 1 1 −n H(Pn ) ≤ c c . . . c H(P ) = c1+ 2 + 4 +...H(P )2 ≤ 2c2 1 für alle hinreichend großen n (denn limm→∞ H m = 1 für alle positiven H). Damit sind sowohl xn als auch zn beschränkt durch die Konstante 2c2 ; gleiches gilt für yn , denn auf Grund der E definierenden Gleichung gilt y2n = x3n + axn z3n + bz4n . Dieser Teil des Beweises ist eine natürliche, wenn auch im Detail sehr technische Fortführung der ermatschen Abstiegsmethode! Also gehört Pn zu einer endlichen Menge rationaler Punkte auf E, etwa B1 , . . . , Bk jeweils von der Form s u mit s, t, u ∈ Z, H(Bj ) ≤ 2c2 . Bj = 2 , 3 t t Sei also etwa Pn = Bj , dann ist Qn−1 = Bj ∗ Bj und Pn−1 = Qn−1 ∗ Ai mit Ai ∼ Pn−1 . Nun definieren wir Qn−2 = Pn−1 ∗ Pn−1 sowie Pn−2 = Qn−2 ∗ Ak mit Ak ∼ Pn−2 . Fortführung dieses Arguments liefert mit Sekanten- und Tangentenbildung also einen ’Startpunkt’ P = P0 und der Mordellsche Satz 4 ist bewiesen. • Eine genaue Analyse des Beweises (mit zahlentheoretischen und algebraischen Methoden) liefert eine Schranke für den Rang einer elliptischen Kurve E = E(Q), nämlich rg(E) ≤ n1 + 2n2 − 1, wobei n1 die Anzahl der Primzahlen ist, die genau eine der Zahlen θi − θj mit i 6= j teilen und n2 die Anzahl der Primzahlen, welche alle Zahlen θ1 − θ2 , θ1 − θ3 , θ2 − θ3 teilen. (Einen Beweis findet man etwa in [4].) Diese Abschätzung ist erstaunlich gut; beispielsweise gilt für die elliptische Kurve E : Y 2 = (X − 1)X(X + 1) die Abschätzung rg(E) ≤ 1 + 2 · 0 − 1 = 0, in Übereinstimmung mit Satz 7. 48 ELLIPTISCHE KURVEN 8. Torsion Unser nächstes Ziel ist die Beschreibung der rationalen Punkte endlicher Ordnung einer elliptischen Kurve bzw. – gruppentheoretisch formuliert – der Torsionsuntergruppe T := {P ∈ E(Q) : nP = O für ein n ∈ N}, wobei 0 · P = O sei. Tatsächlich betrachten wir den Fall elliptischer Kurven, die in Weierstraßscher Normalform durch ganzzahlige Koeffizienten gegeben sind und wollen den Satz 5 von Nagell-Lutz aus §3 beweisen: Sei E eine elliptische Kurve mit definierender Gleichung Y 2 = X 3 + aX + b mit ganzzahligen Koeffizienten a und b. Ist dann P = (x, y) ∈ T = Etors (Q) ein Torsionspunkt, so gilt x, y ∈ Z und y | (4a3 + 27b2 ) = −∆ falls y 6= 0. Tatsächlich kann man Satz 5 sogar mit der verschärften Bedingung y 2 | ∆ beweisen, uns genügt hier jedoch diese schwächere Form. Abbildung 21. Links: Trygve Nagell, ∗ 1895 - † 1988; norwegischer Zahlentheoretiker, der sich hauptsächlich im schwedischen Uppsala diophantischen Gleichungen widmete. Rechts: Hypatia aus dem vierten Jahrhundert; die womöglich erste Frau in der Mathematik, welche von fanatischen Christen ermordet wurde. Leider habe ich kein Foto der französischen Mathematikerin Élisabeth Lutz, ∗ 1914 - † 2008, gefunden; sie war eine Schülerin von André Weil und arbeitete zu elliptischen Kurven über p-adischen Körpern. 8. Torsion 49 Dieser Satz erlaubt die effektive Berechnung der Torsionsuntergruppe. Wir starten mit einem Beispiel: E1 : Y 2 = X 3 − X; in diesem Fall ist die Diskriminante ∆ = 4 und als Kandidaten von Torsionspunkten P = (x, y) mit y 6= 0 kommen nur solche in Frage, für die also y ∈ {±1, ±2, ±4} gilt. Damit ist es ein Leichtes, die Torsionsgruppe zu bestimmen: T1 = {O, (0, 0), (−1, 0), (+1, 0)}. Ohne Beweis geben wir für die allgemeinere Kurve En : Y 2 = X 3 − n2 X mit n ∈ N deren Torsionsgruppe durch Tn = {O, (0, 0), (−n, 0), (+n, 0)} an; die Torsionspunkte sind also in diesen Fällen neben dem unendlich fernen Punkt O stets genau die Punkte mit verschwindender y-Koordinate und die Torsionsgruppe ist stets isomorph zur Kleinschen Vierergruppe. (Ein Beweis hierfür findet sich in [4].) Der Beweis des Satzes von Nagell-Lutz benutzt das Konzept der p-adischen Zahlen, welche von Hensel 1893 als Parallelwelt zu den reellen Zahlen eingeführt wurde. Hierzu sei p eine feste Primzahl; auf Grund der eindeutigen Primfaktorzerlegung in Q existieren zu jedem 0 6= α ∈ Q von null verschiedene, teilerfremde ganze Zahlen a, b, so dass a α = · pνp (α) mit ab 6≡ 0 mod p, b wobei νp (α) der Exponent von p in der Primfaktorzerlegung von α ist, den wir im Folgenden die Ordnung von α nennen und mit ord(α) = νp (α) notieren wollen. Tatsächlich definiert −νp (α) p |α|p = 0 falls falls α 6= 0, α = 0. einen nicht-archimedischen Absolutbetrag auf Q und |α|p ist genau dann ’klein’, wenn α durch eine ’große’ Potenz von p teilbar ist. Diese Brücke zwischen Analysis bzw. Topologie einerseits und Zahlentheorie andererseits erlaubt tiefe Einblicke in die Arithmetik, wie wir kurz skizzieren wollen. Der Satz von Ostrowski liefert zunächst eine Charakterisierung aller topologisch inäquivalenter Absolutbeträge auf Q: Jeder nicht-triviale Absolutbetrag auf Q ist äquivalent zu genau einem p-adischen Absolutbetrag | . |p oder aber äquivalent zum Standardabsolutbetrag. Vervollständigt man nun den Körper 50 ELLIPTISCHE KURVEN der rationalen Zahlen der Cantorschen Methode folgend (mit dem Quotienten der konvergenten rationalen Cauchy-Folgen modulo den Nullfolgen), so ergeben sich neben den reellen Zahlen bzgl. der p-adischen Absolutbeträge für jede Primzahl p der so genannte Körper Qp der p-adischen Zahlen. Insgesamt entsteht also folgendes Bild: Q Vervollständigung −→ Q2 , Q3 , Q5 , . . . and R. Hierbei sind die Vervollständigungen paarweise verschiedenen und also jeweils gleichberechtigte Zahlenuniversen (von denen sich jedoch außerhalb der Zahlentheorie der Körper der reellen Zahlen durchgesetzt hat). Das Lokal-Global-Prinzip ist nun die Idee, globale Informationen (das sind solche über den globalen Körper Q) aus lokalen Informationen (der lokalen Körper Qp ) zu gewinnen. Ein einfaches Beispiel, welches sich sofort aus der eindeutigen Primfaktorzerlegung ergibt, ist etwa, dass eine rationale Zahl genau dann ein Quadrat in Q ist, wenn es ein Quadrat in allen Qp und auch (wegen des Vorzeichens) in R ist. Ein tieferliegendes Beispiel ist der berühmte Satz von Hasse-Minkowski, welcher besagt, dass eine quadratische Form q über Q eine rationale Zahl α genau dann darstellt, also q(x) = α für ein x mit insbesondere x 6= 0 für α = 0, wenn q die Zahl α über allen Qp sowie R darstellt. Diese Äquivalenz ist tatsächlich nützlich, da die Darstellbarkeit durch quadratische Formen über den lokalen Körpern i.A. leichter zu entscheiden ist, als über dem globalen Q. Eine weitere Anwendung des Lokal-Global-Prinzips stellt die Vermutung von Birch & Swinnerton–Dyer bereits (die wir in §9 behandeln werden). Mehr zu dem faszinierenden Thema der p-adischen Zahlen findet der geneigte Leser in [9]. Jetzt kehren wir zum Beweis des Satzes 5 von Nagell-Lutz zurück, der einige Ideen p-adischer Zahlen in sich trägt. Zu einem Punkt P = (x, y) ∈ E(Q) \ {O} gibt es nach Lemma 1 aus §7 ganze Zahlen x, y, z mit y x x = 2, y = 3, z z wobei ggT(x, z) = ggT(y, z) = 1. Angenommen, p ist eine Primzahl, welche den Nenner von x oder den Nenner von y teilt, so folgt unmittelbar aus der obigen Darstellung, dass p dann sowohl den Nenner von x als auch den von y teilt sowie 3ord(x) = 2ord(y). Wir definieren nun für ν ∈ N die Menge E(pν ) := {(x, y) ∈ E(Q) \ {O} : ord(x) ≤ −2ν, ord(y) ≤ −3ν} ∪ {O}. Dann gilt offensichtlich . . . ⊂ E(pν+1 ) ⊂ E(pν ) ⊂ . . . ⊂ E(p2 ) ⊂ E(p) ⊂ E(Q); beispielsweise ist hier E(p) die Menge aller rationalen Punkte (x, y) mit mindestens dem Teiler p2 des Nenners von x und mindestens dem Teiler p3 des 8. Torsion 51 Nenners von y sowie dem unendlich fernen Punkt. Unser erstes Ziel ist zu zeigen, dass ein Punkt endlicher Ordnung (also ein Element der Torsionsuntergruppe) in keiner Menge E(p) für beliebige Primzahlen p liegen kann, denn dann sind offensichtlich x und y ganzzahlig. Der p-adische Hintergrund besteht darin, dass mit wachsendem ν die Punkte (x, y) ∈ E(pν ) p-adisch wachsende Koordinaten besitzen und sich also dem unendlich fernen Punkt O annähern. Hierzu vollziehen wir einen Koordinatenwechsel: Vermöge der Substitution t = xy , s = y1 schreibt sich die E definierende kubische Gleichung y 2 = x3 + ax + b um zu s = t3 + ats2 + bs3 ; die Abbildung x = st , y = 1s ist bijektiv für y, s 6= 0 und bildet O auf den Punkt (0, 0) in der (t, s)-Ebene ab. Die Punkte in der (t, s)-Ebene entsprechen also eineindeutig den Punkten in der (x, y)-Ebene ohne O und den Punkten der Ordnung zwei (denn 2P = O ist äquivalent zu y = 0). Der Geraden Abbildung 22. Die Kurve y 2 = x3 +x+2 (links) und s = t3 +ts2 +2s3 nach dem Koordinatenwechsel (rechts). Aus der Achsensymmetrie der elliptischen Kurve in Weierstrass Normalform wird dabei eine Punktsymmetrie bzgl. des Nullpunktes. y = λx + µ in der (x, y)-Ebene entspricht dabei die Gerade λ 1 s=− t+ . µ µ in der (t, s)-Ebene. Wir untersuchen zunächst die Schnittpunkte von solchen Geraden mit E bzgl. E(pν ): 52 ELLIPTISCHE KURVEN Lemma 4. Die Menge Rp := {x ∈ Q : ord(x) ≥ 0} ist ein Ring, wobei ord( . ) die Ordnung bzgl. einer Primzahl p sei. Ferner besitzt Rp eine eindeutige Primzerlegung und die Einheiten sind alle x ∈ Q mit ord(x) = 0. Insbesondere gilt für x ∈ Rp , dass x einen Nenner besitzt, der nicht durch p teilbar ist. Beweis durch Nachrechnen: Mit x, y ∈ Rp sind auch x ± y, x · y ∈ Rp . Die Aussage über die Primzerlegung ist trivial, denn p ist das einzige Primelement. Die Aussage über die Einheiten ist trivial. • Sei nun (x, y) ∈ E(pν ) \ {O}, dann ist (s.o.) m d x = p−2(ν+i) und y = p−3(ν+i) n e für ein i ∈ N0 mit nicht durch p teilbaren ganzen Zahlen d, e, m, n. Also folgt x me ν+i 1 e t= = p und s = = p3(ν+i) , y nd y d d.h. es ist genau dann (t, s) ∈ E(pν ), wenn t ∈ pν Rp und s ∈ p3ν Rp . Lemma 5. Für jedes ν ∈ N ist E(pν ) eine Untergruppe von E(Q) und die Abbildung x ϕ : E(pν )/E(p3ν ) → pν Rp /p3ν Rp , P = (x, y) 7→ t(P ) = t = , O 7→ 0 y ist ein Isomorphismus. Beweis. Seien gegeben zwei verschiedene Punkte Pj = (tj , sj ) ∈ E(pν ). Angenommen t1 = t2 , so folgt über s1 6= s2 und damit y1 = −y2 sofort P1 = −P2 und P1 ⊕ P2 ∈ E(pν ). Der Fall t1 6= t2 ist schwieriger zu behandeln: Sei s = αt + β die Gerade durch die Punkte P1 und P2 , so gilt sj = t3j + atj s2j + bs3j für j = 1, 2 und damit s2 − s1 = t32 − t31 + a (t2 s22 − t1 s21 ) | {z } +b(s32 − s31 ) =(t2 −t1 )s22 +t1 (s22 −s21 ) Wegen t32 − t21 = (t2 − t1 )(t22 + t2 t1 + t21 ) folgt nach einiger Rechnerei für die Steigung der Geraden durch P1 und P2 (17) α= t22 + t1 t2 + t21 + as22 s2 − s1 = t2 − t1 1 − at1 (s2 + s1 ) − b(s22 + s1 s2 + s21 ) Auf Grund der 1 im Nenner dieses Ausdrucks ist α eine Einheit in Rp . Im Falle P1 = P2 entsteht aus (17) durch Grenzübergang t2 → t1 , s2 → s1 die Formel 3t21 + as21 . α= 1 − 2at1 s1 − 3bs21 8. Torsion 53 Sei nun P3 = (t3 , s3 ) der dritte Schnittpunkt der Geraden mit E(Q). Substitutieren wir s = αt + β, so entsteht αt + β = t3 + at(αt + β)2 + b(αt + β)3 bzw. 0 = (1 + aα2 + bα3 )t3 + (2aαβ + 3bα2 β)t2 (18) +(aβ 2 + 3bαβ 2 − α)t + bβ 3 − β = (1 + aα2 + bα3 )(t − t1 )(t − t2 )(t − t3 ) und ein weiterer (und nicht letzter) Koeffizientenvergleich zeigt (19) t1 + t2 + t3 = − 2aαβ + 3bα2 β . 1 + aα2 + bα3 Abbildung 23. Die Addition auf der Kurve s = t3 + ts2 + 2s3 nach dem Koordinatenwechsel. Wir addieren nun P1 ⊕ P2 ähnlich wie in der (x, y)-Ebene, bloß unter Ersetzung des unendlich fernen Punktes O durch den Ursprung (0, 0) (entsprechend unserer Substitution) wie folgt: Bezeichnet P1 ∗ P2 = (t3 , s3 ) den dritten Schnittpunkt der Geraden durch P1 und P2 , so sei P1 ⊕ P2 = (−t3 , −s3 ), also der dritte Schnittpunkt der Geraden durch P1 ∗ P2 und (0, 0). (Dies liefert tatsächlich einen Punkt auf der elliptischen Kurve, denn mit (t, s) ist auch (−t, −s) ein Punkt auf E). Zurück zu α, gegeben durch (17); für t1 , s1 , t2 , s2 ∈ pν Rp ist der Zähler von α ein Element in p2ν Rp und ebenso −at1 (s2 + s1 ) − b(s22 + s2 s1 + s21 ) ∈ p2ν Rp . 54 ELLIPTISCHE KURVEN Insbesondere ist der Nenner von α also eine Einheit in Rp und somit α ∈ p2ν Rp . Mit s1 ∈ p3ν Rp und t1 ∈ p2ν Rp folgt daher β = s1 − αt1 ∈ p3ν Rp , wobei β der konstante Term in der Geradengleichung s = αt+β ist. Mit Formel (18) ergibt sich analog t1 + t2 + t3 ∈ p3ν Rp und ferner mit t1 , t2 ∈ pν Rp folgt −t3 ∈ pν Rp . Liegen also die t-Koordinaten von P1 , P2 in pν Rp , so auch die tKoordinate von P1 ⊕ P2 . Selbiges gilt für P = (t, s) und −P = (−t, −s). Damit ist E(pν ) abgeschlossen bzgl. der Addition und der Bildung des Inversen, also eine Gruppe! Tatsächlich haben wir P1 , P2 ∈ E(pν ) =⇒ t(P1 ) + t(P2 ) − t(P1 ⊕ P2 ) ∈ p3ν Rp bzw. (20) t(P1 ⊕ P2 ) ≡ t(P1 ) + t(P2 ) mod p2 Rp gezeigt (hier ist die Addition links die auf E, während rechts in Rp ⊂ Q addiert wird). Nun ist die Abbildung φ : E(pν ) → Q, P 7→ t(P ) kein Gruppenhomomorphismus (da i.A. die Kongruenz (20) keine Gleichung ist), wohl aber, wenn wir nach dem Kern austeilen: Ker φ = {P ∈ E(pν ) : t(P ) ∈ p3ν Rp }. Damit ist das Lemma bewiesen. • Nun sind wir bereit für den Beweis von Satz 5. Sei m die Ordnung von P 6= O, also m 6= 1, sowie p irgendeine Primzahl. Wir wollen zeigen, dass P 6∈ E(p) gilt. Angenommen, P ∈ E(p). Dann kann P nicht in allen Mengen E(pν ) bei ν ∈ N bestehen (klar), also existiert eine natürliche Zahl ν mit (21) P ∈ E(P ν ) \ E(P ν+1 ). Im Falle p ∤ m folgt aus (20) t(mP ) ≡ mt(P ) mod p3ν Rp bzw., wegen mP = O, 0 = t(O) ≡ mt(P ) mod p3ν Rp . Da aber m nach Voraussetzung invertierbar ist (da teilerfremd mit p), ergibt sich notwendigerweise 0 = t(P ) mod p3ν Rp und damit P ∈ E(p3ν ), der gewünschte Widerspruch zu (21). Falls p | m, wenn also m = pn für ein n ∈ N, so betrachten wir den Punkt ′ P = nP ; dieser besitzt die Ordnung p (klar). Mit der Gruppeneigenschaft ist mit P auch P ′ ein Element von E(p). Nehmen wir nun ferner P ′ ∈ E(P ν ) \ E(P ν+1 ) 8. Torsion 55 für ein ν ∈ N in Analogie zu (21) an, so folgt ähnlich 0 = t(O) = t(pP ′ ) ≡ pt(P ′ ) mod p3ν Rp bzw. (nach Kürzen des Faktors p) t(P ′ ) ≡ 0 mod p3ν−1 Rp und wiederum der gewünschte Widerspruch zu (21). Wir haben bislang also gezeigt, dass P 6∈ E(p) für alle Primzahlen p gilt, wonach E(p) also keine Punkte endlicher Ordnung enthält. Ist also P = (x, y) ein Punkt endlicher Ordnung, so sind die Nenner von x und y durch keine Primzahl teilbar, also ganzzahlig! Es verbleibt zu zeigen, dass im Falle y 6= 0 die Diskriminante ∆ = −(4a3 + 27b2 ) ein Vielfaches von y ist. Die Diskriminante ∆ ist dabei die Diskriminante des kubischen Polynoms f (X) := X 3 + aX + b = (X − α1 )(X − α2 )(X − α3 ) und damit auch ∆ = −(4a3 + 27b2 ) = (α1 − α2 )2 (α1 − α3 )2 (α2 − α3 )2 (das ist aus der Algebra bekannt, kann aber auch durch Nachrechnen sofort verifiziert werden). Ferner ist aus der Algebra bekannt, dass für ein Polynom f ∈ Z[X] mit Leitkoeffizient 1 dessen Diskriminante im von f und dessen Ableitung f ′ erzeugten Ideal im Polynomring Z[X] liegt. In unserem Fall kann man leicht eine entsprechende Linearkombination mit (22) ∆ = −(4a3 + 27b2 ) = (18aX − 27b)f (X) + (−6aX 2 + 9bX − 4a2 )f ′ (X) direkt angeben (wenn es auch mal wieder auf Rechnerei hinausläuft). Nun ist wegen y 6= 0 sicherlich 2P = (x, y) 6= O. Mit P ist auch 2P von endlicher Ordnung, besitzt also nach dem bereits Gezeigten ganzzahlige Koordinaten x, y. Die Verdopplungsformel (Spezialfall des Gruppengesetzes) liefert nun ′ 2 f (x) f ′ (x) 2x + x = mit ∈ Z. 2y 2y Insbesondere ist y ein Teiler von f ′ (x) und nach (22) somit auch von (18aX − 27b)f (x) + (−6aX 2 + 9bX − 4a2 )f ′ (x) = (18aX − 27b)y 2 + (−6aX 2 + 9bX − 4a2 )f ′ (x) = ∆. Damit ist der Satz 5 von Nagell-Lutz bewiesen. • Tatsächlich kann man zeigen, dass die elliptische Kurve E, gegeben durch die Gleichung Y 2 = X 3 + dX mit d ∈ Z von einer Form d 6= m4 k für irgendwelche m, k ∈ Z über Q die Torsionsgruppe isomorph zu • Z/2Z × Z/2Z, falls −d ein Quadrat ist, • Z/4Z, falls d = 4, • Z/2Z, sonst, 56 ELLIPTISCHE KURVEN ist. Der Beweis benutzt etwas tieferliegende Konzepte p-adischer Zahlen (nämlich so genannte ganze p-adische Zahlen) und wir verweisen für den nicht ganz einfachen Beweis auf [4]. 9. Die Vermutung von Birch & Swinnerton-Dyer Wir starten mit einer über Z definierten elliptischen Kurve E in Weierstraß Normalform. Arithmetisch interessant ist u.a. die Größe der Gruppe der rationalen Punkte auf E, z.B. ob der Rang positiv ist und also E(Q) unendlich ist oder aber der Rang gleich null ist und nur endlich viele rationale Punkte existieren. Hierzu mag man die Hoffnung hegen, mit einem Lokal-Global-Prinzip durch Studium der Kurve über lokalen Körpern Z/pZ zu einer Primzahl p, globale Informationen über etwa den Rang von E(Q) zu sammeln. Nach Reduktion modulo einer Primzahl p > 2 (welche die Diskriminante nicht teilt, um eine glatte elliptische Kurve zu haben) sind dabei also die Lösungen der Kongruenz Y 2 ≡ X 3 + aX + b mod p zu untersuchen. Für die Anzahl ♯E mod p dieser Lösungen modulo p wissen wir mit dem Satz 6 von Hasse √ (23) |p + 1 − ♯E mod p| < 2 p. In einem gewissen Sinne ist also p+1 der Erwartungswert für die Gruppenordnung ♯E mod p der reduzierten Kurve. Nun bilden wir (in gewisser Analogie zum Problem der Primzahlverteilung in der Zahlentheorie) das Produkt πE (x) := Y ♯E mod p . p p≤x Hier ist ein Faktor groß, wenn die elliptische Kurve bei Reduktion modulo der entsprechenden Primzahl p viele Punkte enthält, also ♯E mod p größer als der Erwartungswert p + 1 ausfällt. Nun mag man hoffen, dass viele Punkte bei Reduktion modulo vieler Primzahlen sich zu vielen rationalen Punkten zusammenfügen lassen! (Die Umkehrung gilt trivialerweise.) In eben diesem Sinne vermuteten Birch & Swinnerton-Dyerk (auf der Basis von numerischem Material): Vermutung von Birch & Swinnerton–Dyer (1963/65). Ist E eine über Z definierte elliptische Kurve, so gilt Y ♯E mod p ∼ CE (log x)rg(E) πE (x) = p p≤x mit einer nur von E abhängigen Konstanten CE 6= 0 bei x → ∞. k B. Birch, H.P.F. Swinnerton–Dyer, Notes on elliptic curves, I+II, Journal für reine und angewandte Mathematik 212 (1963), 7-25; 218 (1965), 79-108 9. Die Vermutung von Birch & Swinnerton-Dyer 57 Das Symbol ’∼’ bedeutet hierbei, dass der Quotient beider Seiten für gegen unendlich wachsendes x sich immer mehr dem Wert eins annähert, also gewissermaßen beide Ingredienzen von derselben Größenordnung sind. Ist also die Gruppenordnung ♯E mod p bei Reduktion für viele Primzahlen signifikant größer als der Erwartungswert, so sollte πE (x) bei x → ∞ groß ausfallen, was nur der Fall sein kann, wenn der Rang rg(E) der Kurve positiv ist. Dies ist die so genannte schwache Form der Vermutung von Birch & Swinnerton-Dyer; eine stärkere Form dieser Vermutung beinhaltet eine genaue Beschreibung der Konstanten CE , in die weitere Strukturgrößen der elliptischen Kurve E eingehen. Diese Vermutung ist eines der sieben Millenniumsprobleme! Bislang kennt man nur Teillösungen, die allerdings bereits beachtliche Konsequenzen für die Mathematik liefern. Nun wollen wir die Vermutung von Birch & Swinnerton-Dyer in eine analytische Gestalt bringen (wobei rudimentäre Vorkenntnisse in Funktionentheorie und/oder analytischer Zahlentheorie ganz hilfreich sind). Bei der Frage der Verteilung der Primzahlen studiert man die Riemannsche Zetafunktion ζ(s) = ∞ X Y n−s (1 − p−s )−1 = p n=1 als eine Funktion einer komplexen Veränderlichen s = σ + it; die Identität zwischen dem so genannten Euler-Produkt links, das über alle Primzahlen erhoben ist, und der so genannten Dirichlet-Reihe rechts, ist eine analytische Version der eindeutigen Primfaktorzerlegung der ganzen Zahlen (und beweist sich leicht mittels der geometrischen Reihe). Diese Objekte konvergieren in der Halbebene σ > 1 absolut und gleichmäßig auf jeder kompakten Teilmenge. Aus der Existenz der Singularität in s = 1 (wenn die Dirichlet-Reihe zur divergenten harmonischen Reihe wird) folgt bereits die Unendlichkeit der Menge der 58 ELLIPTISCHE KURVEN Primzahlen (ansonsten wäre ja das Produkt für s = 1 konvergent) und mit mehr funktionentheoretischem Werkzeug sogar der Primzahlsatz x ♯{p ≤ x : p prim} ∼ bei x → ∞. log x In diesem Zusammenhang sei mit der Riemannschen Vermutung ein anderes Millennium-Problem erwähnt: Liegen alle nicht-reellen Nullstellen von ζ(s) auf der so genannten kritischen Geraden s = 12 + iR? Ein Nachweis hiervon würde eine erheblich bessere Abschätzung des Fehlerterms im Primzahlsatz liefern. Tatsächlich besteht ein enger Zusammenhang zwischen der Lage der Nullstellen von ζ(s) und der Verteilung der Primzahlen. In Analogie zur Riemannschen Zetafunktion definieren wir – Hasse folgend – die zu einer elliptischen Kurve assoziierte L-Funktion durch Y Y (24) L(s; E) = (1 − ap p−s )−1 (1 − ap p−s + p1−2s )−1 , p∤∆ p|∆ wobei ap := p + 1 − ♯E mod p und ∆ die Diskriminante ist; dabei gibt es natürlich nur endlich viele Primteiler p | ∆. Bekanntlich konvergiert ein Euler-Produkt genau dann absolut und gleichmäßig, Y (1 − ap p−s ) < ∞, p wenn X p log |1 − ap p−s | < ∞ bzw. X p |ap |p−σ < ∞ (hier haben wir im Wesentlichen Beträge gesetzt, den Logarithmus und anschließend die Taylorentwicklung angewandt). Im Falle der L-Funktion einer elliptischen Kurve liefert Hasses Abschätzung (23) daher die Konvergenz für σ > 32 . Vergessen wir zunächst unsere gute Schule (sprich: Vorsicht bei Konvergenz) und nehmen an, das L(s; E)-definierende Produkt sei konvergent für s = 1, dann ließe sich das Produkt aus der Birch & Swinnerton-Dyer-Vermutung aus einem Wert der L-Funktion ablesen: Lassen wir die Teilerbedingung für die Primzahlen außer acht, gilt nämlich Y p ≈ lim πE (x)−1 . L(1; E) ≈ x→∞ ♯E mod p p Unglücklicherweise ist das Euler-Produkt links der absoluten Konvergenzhalbebene nicht konvergent und somit der Wert L(1; E) zunächst ohne weiteren Sinn. Hasse vermutete, dass L(s; E) in die ganze komplexe Ebene analytisch fortsetzbar ist (wenn auch leider nicht durch obiges Produkt) und einer bestimmten Funktionalgleichung genügt (ähnlich der der Zetafunktion; siehe (25) weiter unten). Damit lässt sich nun die Vermutung von Birch & Swinnerton–Dyer auch über die zu einer elliptischen Kurve E assoziierten LFunktion erklären, nämlich: 9. Die Vermutung von Birch & Swinnerton-Dyer 59 Analytische Version der Vermutung von Birch & Swinnerton–Dyer. Ist E eine über Z definierte elliptische Kurve, so gilt rg(E) > 0 ⇐⇒ L(1; E) = 0. Eine genauere Version dieser Vermutung besagt, dass die Ordnung der Nullstelle von L(s; E) in s = 1 (im funktionentheoretischen Sinne) genau mit dem Rang der elliptischen Kurve übereinstimmt – ein interessantes Wechselspiel zwischen Analysis und Arithmetik! Ist die Vermutung von Birch & Swinnerton-Dyer richtig, so liefert sie letztlich einen Algorithmus, der erlaubt sämtliche rationalen Punkte einer elliptischen Kurve zu bestimmen. Jetzt wollen wir die Frage untersuchen, was genau Hasse auf diese Form L(s; E) einer erzeugenden Funktion gebaut aus den lokalen Daten der elliptischen Kurve geführt hat. Gegeben eine Primzahl p erklären wir die lokale Zetafunktion durch ! ∞ X ♯E(Fpn ) n u . Z(u; Ep ) := exp n n=1 Tatsächlich zeigte Hasse über Satz 6 hinaus ♯E(Fpn ) = pn + 1 − (αn + β n ), wobei X 2 − ap X + p = (X − α)(X − β) mit zwei komplexen Wurzeln α, β. Damit determiniert der Fall der Reduktion modulo p (wenn also n = 1) den Rest (d.h. n ≥ 2) und es berechnet sich nun ∞ X 1 (pu)n + un − (αu)n − (βu)n . log Z(u; Ep ) = n n=1 Mit Hilfe der Taylorentwicklung des Logarithmus, − log(1 − z) = folgt daher Z(u; Ep ) = ∞ X zn n=1 n , 1 − ap u + pu2 (1 − αu)(1 − βu) = , (1 − u)(1 − pu) (1 − u)(1 − pu) Die lokale Zetafunktion ist somit eine rationale Funktion. Die Nullstellen des Zählers berechnen sich damit als Paar komplex konjugierter Nullstellen q 1 1 mit |uk |2 = u1 u2 = u1,2 = (ap ± a2p − 4p) 2p p 1 und also |u1 | = |u2 | = p− 2 (innerhalb des Konvergenzbereiches der obigen Reihenentwicklung). Setzen wir nun u = p−s , so liegen die Nullstellen von Z(p−s ; Ep ) auf der kritischen Geraden Re s = 21 und unsere lokale Zetafunktion erfüllt das Analogon der Riemannschen Vermutung für die Riemannsche Zetafunktion. Entsprechend nennt man den Satz von Hasse auch die ’Riemannsche Vermutung für Kurven’ und dies wird oft auch als Indiz für die Richtigkeit 60 ELLIPTISCHE KURVEN der klassischen Riemannschen Vermutung ins Spiel gebracht.∗∗ Der Realteil der kritischen Geraden entspricht dabei genau dem Exponenten in Hasses Relation (23). Es gibt eine weitere Analogie: Für ζ(s) besteht bekanntlich die Funktionalgleichung s π − 2 Γ( 2s )ζ(s) = π − (25) 1−s 2 Γ( 1−s 2 )ζ(1 − s). Ganz ähnlich besitzt auch unsere lokale Zetafunktion eine Funktionalgleichung: Es gilt nämlich Z(p−s ; Ep ) = = 1 − Ap−s + p1−2s (1 − p−s )(1 − p1−s ) p1−2s 1 − Aps−1 + p2s−1 = Z(ps−1 ; Ep ); p1−2s (1 − ps−1 )(1 − ps ) dies ist wie bei der Riemannschen Zetafunktion eine Punktsymmetrie s ↔ 1 − s und die Nullstellen von Z(p−s ; E) liegen also auf der Symmetrieachse dieser Funktionalgleichung. Nun erklären wir die globale Zetafunktion einer elliptischen Kurve E formal durch das Euler-Produkt Y Z(s; E) := Z(p−s ; Ep ), p wobei wir für Primteiler p der Diskriminante Z(p−s ; Ep ) = (1 − p−s )−1 (1 − p1−s )−1 setzen (diese Faktoren enthalten keine Informationen über E, erweisen sich aber weiter unten als recht natürlich). Damit gilt also Y Y (1 − ap p−s + p1−2s ). Z(s; E) = (1 − p−s )−1 (1 − p1−s )−1 p p∤∆ Dieser Ausdruck ist annähernd Y Y Y (1 − ap p−s ) (1 − ap p−s + p1−2s ) ≈ (1 − p−s )−1 (1 − p1−s )−1 p p|∆ p∤∆ = ζ(s)ζ(s − 1)L(s; E)−1 mit der Hasse L-Funktion L(s; E), definiert in (24). Hasse vermutete für L(s; E) • eine analytische Fortsetzung in die ganze komplexe Ebene, • eine Funktionalgleichung (mit einer Symmetrie s ↔ 2 − s): √ !2−s √ !s N N Γ(s)L(s; E) = ω Γ(2 − s)L(2 − s; E) 2π 2π mit einem Vorzeichen ω = ±1 und einer natürlichen Zahl N . ∗∗ Weitreichende Verallgemeinerungen gehen zurück auf Weil und Deligne und ihre Beweise sind keineswegs trivial. Da jedoch ζ(s) eine transzendente Funktion ist, sollte die ursprüngliche Riemannsche Vermutung viel schwieriger zu beweisen sein... 9. Die Vermutung von Birch & Swinnerton-Dyer 61 Ist übrigens das Vorzeichen negativ, so folgt unmittelbar L(1; E) = 0 und unter der weiteren Annahme der analytischen Form der Birch & Swinnerton– Dyer-Vermutung somit ein positiver Rang der elliptischen Kurve E(Q), bzw. die Existenz unendlich vieler rationaler Punkte. Wir blicken nun kurz auf einen Beweis der Funktionalgleichung für die Riemannsche Zetafunktion, und zwar einen der beiden, die Riemann selbst gab: Für σ > 1 findet man durch eine geeignete Substitution im definierenden Integral der Gammafunktion Z ∞ s − 2s −s s π Γ( 2 )n = x 2 −1 exp(−πn2 x) dx 0 und nach Summation über alle natürlichen Zahlen n Z ∞ ∞ ∞ X X s s exp(−πn2 x) dx; x 2 −1 n−s = (26) π − 2 Γ( 2s ) n=1 0 n=1 hier ist die Reihe links die ζ-definierende Dirichlet-Reihe, während rechts die ’halbe’ Thetafunktion ∞ X exp(πin2 τ ) ϑ(τ ) = n=−∞ vermindert um den konstanten Term auftritt. Aus dieser Integraldarstellung gewinnt man nun leicht die analytische Fortsetzung von ζ(s) nach C \ {1} und die Funktionalgleichung (25). Hierzu benutzt man die Modularitätseigenschaft der Thetafunktion, insbesondere die Transformationsformel q ϑ(− τ1 ) = τi ϑ(τ ) für komplexe τ der oberen Halbebene, welches die Invarianz des Integrals in (26) bzgl. der Transformation s 7→ 1 − s impliziert. Es sind nicht viele Methoden zur analytischen Fortsetzung von Dirichlet-Reihen bekannt und tatsächlich kann man auch Beispiele konstruieren, die sich nicht über eine gewisse Barriere hinweg fortsetzen lassen. Für die wichtige Klasse der Dirichlet-Reihen zu Modulformen gelang jedoch Hecke 1936 der Nachweis einer tiefliegenden Korrespondenz: Dirichlet-Reihen mit Funktionalgleichung ⇐⇒ Modulformen der oberen Halbebene Hierbei sind Modulformen definiert als holomorphe Funktionen f der oberen Halbebene H := {τ = x + iy : y > 0}, welche den folgenden Eigenschaften genügen. • Funktionalgleichungen: Für alle τ ∈ H gilt a b aτ + b k = (cτ + d) f (τ ) für alle ∈ SL2 (Z); f cτ + d c d • Regularitätsbedingung: Die Abbildung τ := x + iy 7→ y k |f (τ )|2 ist beschränkt auf H. 62 ELLIPTISCHE KURVEN Hierbei heißt k das Gewicht (und ist zunächst eine gerade natürliche Zahl). Oft ist es auch sinnvoll, Modulformen zu Untergruppen der SL2 (Z) zu definieren, etwa zur Kongruenzuntergruppe a b Γ0 (N ) := ∈ SL2 (Z) : c ≡ 0 mod N c d zur Stufe N . Wegen ( 10 11 ) ∈ Γ0 (N ) besitzen solche Modulformen für τ ∈ H insbesondere eine Fourier-Reihenentwicklung ∞ X c(n) exp(2πinτ ) f (τ ) = n=1 mit gewissen komplexen Koeffizienten c(n). Hecke folgend lässt sich zu einer solchen Modulform f eine L-Funktion vermöge ∞ X c(n) L(s; f ) = ns n=1 assoziieren. Unter gewissen Umständen sind die Fourier-Koeffizienten c(n) multiplikativ, so dass dann die definierende Dirichlet-Reihe in Analogie zu zeta eine Darstellung als Euler-Produkt besitzt: −1 Y c(p) −1 Y c(p) 1 L(s; f ) = 1− s 1 − s + 2s+1−k . p p p p|N p∤N Ferner verifizierten Hecke bzw. Atkin & Lehner das Bestehen einer Funktionalgleichung der Form s N 2 (2π)−s Γ(s)L(s, f ) = ±N k−s 2 (2π)s−k Γ(k − s)L(k − s, f ). In den 1960er Jahren formulierten die japanischen Mathematiker Shimura & Taniyama einen erstaunlichen Zusammenhang zwischen prinzipiell verschiedenen L-Funktionen: Demnach sollte es zu über Q definierten elliptischen Kurve E eine Modulform f vom Gewicht k = 2 zu einer bestimmten Stufe N geben, so dass die assoziierten L-Funktionen übereinstimmen: L(s; E) = L(s; f ); insbesondere stimmen damit auch die Koeffizienten in den Reihenentwicklungen überein (auf Grund des Identitätssatzes für Dirichlet-Reihen), was wichtige arithmetische Informationen über die elliptische Kurve via den analytischen Modulformen liefert. Diese erstaunliche Brücke zwischen elliptischen Kurven einerseits und Modulformen andererseits wurde schließlich durch den Beweis der Shimura-Taniyama-Vermutung von Wiles et al. sicher gestellt (wobei auch sein Beweis der Fermatschen Vermutung abfiel; siehe §6). Kurz: elliptische Kurven sind modular! Insbesondere wurden so die Vermutungen Hasses über die analytische Fortsetzbarkeit und die Funktionalgleichung von LFunktionen zu elliptischen Kurven verifiziert. Speziell für die elliptische Kurve E : Y 2 = X 3 − X ergeben sich so die L-Funktion L(s; E) = (1 + 31−2s )−1 · (1 + 2 · 5−s + 51−2s )−1 · . . . 10. Das Kongruenzzahlproblem 63 und die Modulform f (τ ) = q − 2q 5 − 3q 9 + . . . mit q = exp(2πiτ ), welche Gewicht k = 2 und Stufe N = 32 besitzt. Dieser und weitere Spezialfälle wurden vor Wiles von Eichler, Shimura und Tunnell bewiesen. Eine wichtige ungelöste Frage in diesem Kontext: Falls eine Euler-Produktdarstellung für L(s; E) (bzw. L(s; f )) besteht, gilt dann ein Analogon der Riemannschen Vermutung, wie es für ζ(s) angenommen wird? Was ist bekannt hinsichtlich der Vermutung von Birch & Swinnerton–Dyer? Beispielsweise zeigte Kolyvagin 1989, dass ein Nichtverschwinden von L(s; E) für s = 1 nach sich zieht, dass der Rang der Kurve null ist; ferner zeigte er, dass eine einfache Nullstelle in s = 1 (also L(1; E) = 0 6= L′ (1; E)) den Rang eins impliziert. Für spezielle elliptische Kurven (mit komplexer Multiplikation) sind weitere Ergebnisse bekannt, u.a. von Coates & Wiles sowie Gross & Zagier und einigen weiteren. Eine vollständige Lösung der Vermutung von Birch & Swinnerton-Dyer scheint jedoch noch in weiter Ferne zu liegen. 10. Das Kongruenzzahlproblem Eine natürliche Zahl n heißt Kongruenzzahl, falls es ein rechtwinkliges Dreieck mit rationalen Seitenlängen und Flächeninhalt n gibt, wenn also mit Blick auf den Satz des Pythagoras a, b, c ∈ Q existieren, so dass (27) a2 + b2 = c2 und n = 12 ab. Diese Fragestellung ist ca. eintausend Jahre alt und wurde von arabischen Mathematikern gestellt. Mit Euklids Parametrisierung der pythagoräischen Tripel (Satz 1) findet man bereits unendlich viele Beispiele für Kongruenzzahlen: Z.B. liefert das Tripel 3, 4, 5 ein rechtwinkliges Dreieck mit Flächeninhalt 6 und sogar ganzzahligen Seitenlängen. Ein weiteres Beispiel ist n = 5, wie bereits Fibonacci wusste und wir leicht der Gleichung 2 2 2 20 41 3 + = 2 3 6 entnehmen. Viel schwieriger ist es aber, wenn man für eine gegebene Zahl entscheiden soll, ob diese eine Kongruenzzahl ist oder nicht. Dies ist das so genannte Kongruenzzahlproblem. Alle Kongruenzzahlen ergeben sich letztendlich aus pythagoräischen Tripeln, allerdings liegt eine tückische Schwierigkeit darin, dass nicht nur ganzzahlige sondern allgemeiner rationale Seitenlängen zugelassen sind! Um dieses Problem nicht zu unterschätzen, fragen wir ganz explizit: Ist 1 eine Kongruenzzahl oder aber 157? Das Dreieck in Abbildung 24 verifiziert sofort, dass letztere 157 tatsächlich eine Kongruenzzahl ist. Doch wie findet man ein solches Dreieck? Ein anderes Problem ist es, auszuschließen, dass eine gegebene Zahl n keine Kongruenzzahl ist, es also kein Dreieck mit rationalen 64 ELLIPTISCHE KURVEN 224403517704336969924557513090674863160948472041 8912332268928859588025535178967163570016480830 411340519227716149383203 21666555693714761309610 157 6803298487826435051217540 411340519227716149383203 Abbildung 24. Ein rechtwinkliges Dreieck mit rationalen Seitenlängen und Fläche 157. Dieses Dreieck ist das kleinst mögliche in dem Sinne, dass die Nenner und Zähler der Seitenlängen minimal sind mit dieser Eigenschaft. (Das Beispiel wird Don Zagier zugeschrieben.) Seiten und Fläche n gibt. Die Zahl 1 ist beispielsweise von diesem Typ, wie bereits Fermat mit seinem Verfahren des unendlichen Abstieges beweisen konnte (was wir weiter unten in einer anderen Form reproduzieren wollen). Glücklicherweise für die Mathematik hat er für dieses Mysterium, wie Weil äußerte, genügend Platz gefunden, um es irgendwo am Rande niederzuschreiben. Zunächst gilt es jedoch, das Kongruenzzahlproblem in die Theorie elliptischer Kurven zu übersetzen. Hierzu zeigen wir Lemma 6. Eine natürliche Zahl n ist genau dann eine Kongruenzzahl, wenn es drei Quadrate rationaler Zahlen in arithmetischer Progression und gemeinsamer Differenz n gibt, d.h. es existieren x, y, z ∈ Q mit (28) y2 = x2 − n und z2 = x2 + n. Beweis. Angenommen, (27) gilt, so folgt wegen b = c 2 a 2 n 2 = + 2 2 a 2n a bzw. c 2 n 2 ±n= ; ± 2 2 a damit sind die drei Quadrate in arithmetischer Progression gefunden. Umgekehrt gilt mit (28) a 2n = z2 − x2 + x2 − y2 = z2 − y2 bzw. n = 12 (z − y)(z + y). Damit zeigt sich (z + y)2 + (z − y)2 = 2(z2 + y2 ) = (2x)2 . Also gilt auch die Umkehrung. • 10. Das Kongruenzzahlproblem 65 Der Beweis ist konstruktiv! Beispielsweise übersetzt sich das pythagoräische Tripel 3, 4, 5 in die drei Quadrate 2 2 2 1 5 7 1 25 49 = , = , = 2 4 2 4 2 4 mit gemeinsamer Differenz 6. Projektiv beschreibt (28) den Schnitt zweier Quadriken und definiert damit eine Raumkurve vom Grad vier, was projiziert in die Ebene eine glatte kubische Kurve liefert: Satz 9. Eine natürliche Zahl n ist genau dann eine Kongruenzzahl, wenn die elliptische Kurve En : Y 2 = X 3 − n2 X einen rationalen Punkt (x, y) mit y 6= 0 besitzt bzw. der Rang von En positiv ist. Im Hinblick auf unsere Untersuchungen aus §8 im Umfeld des Satzes 5 von Nagell-Lutz sind die Punkte endlicher Ordnung von En gegeben durch O, (0, 0), (−n, 0) und (n, 0), weshalb sich das Kriterium des Satzes auch durch den Rang von En ausdrücken lässt. Beweis. Angenommen, n ist eine Kongruenzzahl, so liefert das vorangegangene Lemma die Existenz einer arithemtischen Progression rationaler Quadrate mit gemeinsamer Differenz n. Mit der obigen Schreibweise folgt daher durch Multiplikation derselben (xyz)2 = (x2 − n)x2 (x2 + n). Setzen wir nun y = xyz und x = x2 , so folgt y 2 = (x − n)x(x + n) = x3 − n2 x und damit ist ein Punkt (x, y) auf En (Q) gefunden. Aus y = 0 folgt sofort x = 0 oder x = ±n, was xyz = 0 impliziert und kein Dreieck liefert. Definieren umgekehrt die rationalen Zahlen a, b, c ein rechtwinkliges Dreieck mit Fläche n, so seien x= a(a − c) 2 und y= a2 (a − c) . 2 Dann ist y 6= 0 (wegen a 6= c) und durch Nachrechnen verifiziert sich leicht (x, y) ∈ En (Q), was wir dem geneigten Leser überlassen wollen. • Es ist erstaunlich, dass sich das gut eintausend Jahre alte Kongruenzzahlproblem äquivalent in die Sprache der elliptischen Kurven übersetzen lässt. Diese Theorie ermöglicht nun sofort tiefere Einblicke: Zunächst einmal ist die Korrespondenz zwischen rechtwinkligen Dreiecken mit rationalen Seitenlängen 66 ELLIPTISCHE KURVEN a, b, c und Flächeninhalt n und Punkten (x, y) unendlicher Ordnung auf der elliptischen Kurve En (Q) explizit (wenngleich auch nicht eindeutig): a(a − c) a2 (a − c) (a, b, c) 7→ , , 2 2 y 2nx n2 + x2 (x, y) 7→ , , , x y y wobei die Seitenlängen natürlich immer mit einem positiven Vorzeichen auszustatten sind. Beispielsweise korrespondiert so Fibonaccis rechtwinkliges Dreieck zur Kongruenzzahl n = 5 (s.o.) mit dem rationalen Punkt (−4, 6) ∈ E5 . Ferner folgt, dass bereits mit einem einzigen rechtwinkligen Dreieck mit rationalen Seiten und Fläche n automatisch unendlich viele solcher existieren, da ein jedes dieser Art einem rationalen Punkt unendlicher Ordnung entspricht! So liefert eine Punktverdopplung in Fibonaccis Beispiel 1681 62 279 ,− , 2(−4, 6) = 144 728 was auf das rechtwinklige Dreieck mit Seitenlängen Flächeninhalt n = 5 führt. (Bitte Nachrechnen!) 1519 4920 334 4161 492 , 1519 , 747 348 Y2 =X3 -62 X 20 P=H-3,9L 9360006 15120493920 P+Q=H , L 1324801 1524845951 10 1074902978 394955797978664 Q=H- , L 2015740609 90500706122273 -5 5 10 15 -10 -20 Abbildung 25. Die Addition gewisser Punkte auf der elliptischen Kurve Y 2 = X 3 − 62 X; den Punkten P und Q entsprechen die Dreiecke mit Seitenlängen 3, 4, 5 bzw. 8518220204 , 3122541453 , 18428872963986767525 , jeweils 104084715 2129555051 2216541307731009701 mit Flächeninhalt 6. Jeder weitere rote Punkt steht für ein weiteres Vielfaches von (−3, 9) bzw. einem Dreieck mit Fläche 6. und 10. Das Kongruenzzahlproblem 67 Korollar 1 (Fermat). Eine Quadratzahl ist nie eine Kongruenzzahl. Beweis. Auf Grund der Homogenität der Polynome in a, b, c in (27) genügt es die Quadratzahl 1 zu betrachten. Ist nämlich n = m2 eine Kongruenzzahl, so folgte aus (27) a2 + b2 = c2 und 2m2 = ab für gewisse a, b, c ∈ Q. Nach Division durch m2 ergäbe sich dann aber ein a b c rechtwinkliges Dreieck mit Seitenlängen m , m , m und Flächeninhalt 1. Dass n = 1 aber keine Kongruenzzahl sein kann, folgt mit Hilfe von Satz 9 sofort aus Satz 7, da E1 keine rationalen Punkte unendlicher Ordnung enthält. • Die Verbindung zu elliptischen Kurven lässt hoffen, das Kongruenzzahlproblem durch die gut ausgebaute Theorie elliptischer Kurven zu lösen. Und tatsächlich gelang Tunnell∗ ein bemerkenswertes Resultat in dieser Richtung. Mit Hilfe elliptischer Kurven und der Theorie der Modulformen fand er einen einfachen Algorithmus, der in endlicher Zeit entscheidet, ob eine gegebene Zahl eine Kongruenzzahl ist oder nicht. Allerdings basiert dieser Algorithmus auf der Richtigkeit der bislang ungelösten Vermutung von Birch & SwinnertonDyer: Satz von Tunnell. Ist n ∈ N quadratfrei, so gilt Z dx a(N − 2M )2 ∞ √ √ , L(1; En ) = 16 n x3 − x 1 wobei a gleich eins oder zwei ist, je nachdem ob n ungerade oder gerade ist, und N für die Anzahl der ganzzahligen Lösungen der quadratischen Gleichung 2X 2 + Y 2 + 8Z 2 = na sowie M die Anzahl der ganzzahligen Lösungen der quadratischen Gleichung 2X 2 + Y 2 + 32Z 2 = na steht. Wir dürfen annehmen, dass n quadratfrei ist. Der Satz von Tunnell besagt, dass für eine Kongruenzzahl n die Relation N = 2M für die Anzahl der Darstellungen von n durch gewisse quadratische Formen bestehen muss; ansonsten wäre L(1; En ) 6= 0 nach einem oben erwähnten Resultat von Coates & Wiles im Widerspruch zu dem positiven Rang von En (Q) nach Satz 9. Die Richtigkeit der Vermutung von Birch & Swinnerton-Dyer würde auch die Umkehrung dieser Aussage erlauben: Wenn N = 2M gilt, so ist zunächst also L(1; En ) = 0 und damit der Rang von En (Q) positiv und also n eine Kongruenzzahl. Übrigens wäre damit jede Zahl n ≡ 5, 6 oder 7 mod 8 als Kongruenzzahl nachgewiesen. Da die involvierten quadratischen Formen positiv definit sind, und das Kriterium sich auf ganzzahlige Darstellungen bezieht, kommen letztlich nur endlich viele Tripel (x, y, z) überhaupt bei der Darstellbarkeit von n in Frage. Der Tunnellsche Beweis ist leider nicht einfach, weshalb wir auf [6] verweisen. ∗ J. Tunnell, A classical diophantine problem and modular forms of weight 3/2, Inventiones math. 72 (1983), 323-334. 68 ELLIPTISCHE KURVEN Als Nächstes wollen wir Chahal† folgend eine unendliche Familie von Kongruenzzahlen angeben: Satz 10 (Chahal, 2006). Für jedes m ∈ N ist n = m(4m2 + 1) eine Kongruenzzahl. Beweis. Wir starten mit einer (wirklich) alten Identität von Desboves:‡ (Y 2 + 2X Y − X 2 )4 + (2X 3 Y + X 2 Y 2 )(2X + 2Y)4 = (X 4 + Y 4 + 10X 2 Y 2 + 4X Y 3 + 12X 3 Y)2 . Mit der Substitution X = 1 − 2λ, Y = 4λ ergibt sich (1 − 12λ + 4λ2 )4 + 8λ(2λ − 1)2 (2(1 + 2λ))4 = (1 + 40λ − 104λ2 + 160λ3 + 16λ4 )2 und es entsteht ein Punkt P = (x, y) mit den Koordinaten (1 − 12λ + 4λ2 )2 , 4(1 + 2λ)2 (1 − 12λ + 4λ2 )(1 + 40λ − 104λ2 + 160λ3 + 16λ4 ) y = y(λ) = 8(1 + 2λ)3 auf der elliptischen Kurve x = x(λ) = (29) Y 2 = X 3 + dX mit d = d(λ) = 8λ(2λ − 1)2 . Genügt nun n der Gleichung −n2 = 8λ(2λ − 1)2 mit λ = −2m2 , so ist die obige elliptische Kurve vom Typ En und wir haben gemäß Satz 9 nur noch nachzuweisen, dass der rationale Punkt P unendliche Ordnung besitzt. Dies liefert aber sofort der Satz 5 von Nagell-Lutz. • Im Verbleibenden wollen wir das Unmögliche möglich machen und nun doch noch ein rechtwinkliges Dreieck mit Fläche eins konstruieren! Dabei können wir nach obigem Korollar keine rationalen Seitenlängen fordern, wohl aber algebraische. So ist das Dreieck mit den Seitenlängen √36 , √46 , √56 rechtwinklig und besitzt Fläche eins. Allerdings war uns das zu einfach: Wir haben hier die quadratische Homogenität von (27) ausgenutzt. Interessanter ist, ob uns dies auch mit algebraischen Seitenlängen höheren Grades gelingen kann? Dieser Frage sind Girondo et al.§ nachgegangen. Wir beweisen nun (skizzenhaft) den folgenden Satz: Jede natürliche Zahl n ist eine Kongruenzzahl über einem geeigneten reell-kubischen Zahlkörper. Hierbei heißt eine endliche algebraische Erweiterung von Q ein Zahlkörper † J.S. Chahal, Congruent numbers and elliptic curves, American Mathematical Monthly 113 (2006) 308–317. ‡ A. Desboves, Sur l’emploi des identités algébriques dans la résolution, en nombres entiers, des équations d’un degré supérieur au second, Comptes Rendus LXXXVII (1879) 159–161, 321-322. § E. Girondo, G. González-Diez, E. González-Jiménez, R. Steuding, J. Steuding, Right triangles with algebraic sides and elliptic curves over number fields, Math. Slovaca 59 (2009), 299-306. 10. Das Kongruenzzahlproblem 69 und tatsächlich lässt sich vieles aus der Theorie der elliptischen Kurven von Q auf solche Zahlkörper übertragen. Wir nennen dabei eine natürliche Zahl n eine Kongruenzzahl bzgl. eines Zahlkörpers K, wenn es unendlich viele rechtwinkliges Dreiecke mit Fläche n und Seitenlängen in K gibt. Für den Beweis des oben angebeenen Satzes erklären wir zu n ∈ N die Zahl λ = λ(n) als die eindeutige reelle Lösung der kubischen Gleichung (29), also 32λ3 − 32λ2 + 8λ + n2 = 0. Dann gilt λ = λ(n) = wobei κ = κ(n) = q 3 1 1 1 + κ+ , 3 12 3κ p −8 − 27n2 + 3 48n2 + 81n4 ; dabei wählen wir κ als die eindeutige reelle dritte Wurzel, welche für alle n negativ ausfällt. Mit ein wenig Rechnerei finden wir den Punkt P = (x, y) auf der elliptischen Kurve En (Q(λ)), wobei die Koordinaten durch 1 x = {256 + 992n2 + 65n4 + (1024 − 2688n2 − 28n4 )λ 4(n2 − 16)2 +(1024 + 1920n2 + 4n4 )λ2 }, 1 {−16384 + 72704n2 + 80960n4 + 2868n6 − n8 y = 2 32(n − 16)3 +(196608 − 462848n2 − 145152n4 − 1456n6 )λ +(196608 + 421888n2 + 100608n4 + 208n6 )λ2 } gegeben sind. Es verbleibt zu zeigen, dass der Punkt Pλ ∈ En (Q(λ)) unendliche Ordnung besitzt. Tatsächlich ist das Torsionsverhalten über Zahlkörpern diffiziler als über Q, jedoch mag man hier ausnutzen, dass die Abbildung √ (x, y) → (−x, iy) mit i = −1 ein Endomorphismus auf En definiert und also En komplexe Multiplikation bzgl. Z[i] besitzt. Mit Schranken für die Ordnung der Torsionsuntergruppe¶ zeigt sich, dass P wirklich von unendlicher Ordnung auf En (Q(λ)) ist. (Tatsächlich benutzt man hierzu so genannte Divisionspolynome; die Details finden sich in dem entsprechenden Aufsatz von Girondo et al.) Damit besitzt En (Q(λ(n))) positiven Rang und unser Satz folgt aus dem Zahlkörperanalogon von Satz 9. Dank dieser expliziten Konstruktion ist also etwa n = 1 eine Kongruenzzahl bzgl. des Zahlkörpers Q(α), wobei q √ 1 1 3 1 −35 + 3 129 + p . α= + √ 3 3 12 3 −35 + 3 129 Das folgende Dreieck hat Seitenlängen in eben diesem Zahlkörper und besitzt Flächeninhalt eins: ¶ D. Prasad and C.S. Yogananda, Bounding the torsion in CM elliptic curves. C. R. Math. Acad. Sci. Soc. R. Can. 23 (2001), no. 1, 1–5. 70 ELLIPTISCHE KURVEN 15 817 675 6 642 426 138 048 62 195 380 736 Α2 151 008 Α + 1 62 195 62 195 779 890 3776 Α2 1879 Α - + 1335 1335 76 896 448 Α2 5 151 011 Α + 3 321 213 16 606 065 Literaturverzeichnis [1] R. Crandall, C. Pomerance, Prime Numbers: A Computational Perspective, Springer 2005 [2] D. Hankerson, A. Menezes, S. Vanstone, Guide to Elliptic Curve Cryptography, Springer 2004 [3] M. Hindry, J.H. Silverman, Diophantine Geometry: An Introduction, Springer 2000 [4] A.W. Knapp, Elliptic Curves, Princeton University Press 1992 [5] D.E. Knuth, The art of computer programming, vol. 2; Seminumerical Algorithms, Addison-Wesley 1997, 3rd ed. [6] N. Koblitz, A Course in Number Theory and Cryptography, Springer 1987 [7] J.H. Silverman, The Arithmetic of Elliptic Curves, Springer 2009, 2nd edition [8] J.H. Silverman, J. Tate, Rational points on elliptic urves, Springer 1992 [9] J. Steuding, Diophantine Analysis, CRC-Press/Chapman Hall 2005 [10] M. Stoll, Elliptische Kurven I + II, online -Skript erhältlich unter http://www.faculty.iu-bremen.de/stoll/vorlesungen/Elliptische-Kurven-SS2000.pdf [11] L.C. Washington, Elliptic Curves. Number Theory and Cryptography, CRCPress/Chapman Hall, 2nd ed. 2008 71