Julius-Maximilians-Universität Würzburg Fakultät Mathematik/Informatik Bachelorthesis im Studiengang Mathematik Thema: Der Beweis der Waringschen Vermutung nach Hilbert eingereicht von: Leonie Martin eingereicht am: 16. Februar 2015 Betreuer: Herr Prof. Dr. Jörn Steuding Inhaltsverzeichnis 1 Motivation 3 2 Die Hurwitzsche Vermutung und die Identität von Hilbert 2.1 Polynomielle Identitäten und die Hurwitzsche Vermutung . . . 2.2 Hermitesche Polynome und die Identität von Hilbert . . . . . 4 4 6 3 Der Beweis der Waringschen Vermutung nach Hilbert per Induktion 17 4 Formel zur Abschätzung von g(k) 26 5 Alternative Herangehensweise von Hardy und Littlewood 27 Literatur 29 Erklärung 30 2 1 Motivation Die vorliegende Arbeit beschäftigt sich mit der Waringschen Vermutung, einer Fragestellung im Bereich der Zahlentheorie, die viele große Mathematiker beschäftigte. Die Aussage dieser Vermutung lautet: Jede natürliche Zahl n kann als endliche Summe k-ter Potenzen geschrieben werden, also n = xk1 + xk2 + · · · + xkr mit r ∈ N endlich. Anders formuliert besagt dies, dass die Menge der natürlichen Zahlen k-ter Potenz eine Basis endlicher Ordnung für jede natürliche Zahl n ist. Diese allgemeine Aussage werden wir in Kapitel 3 beweisen. Mit g(k) bezeichnet man in der Regel die minimale Anzahl r, sodass jede natürliche Zahl als Summe von genau r k-ten Potenzen geschrieben werden kann. Lagrange zeigte im Jahre 1770 [3], dass jede natürliche Zahl die Summe von höchstens vier Quadraten ist. Dies ist bezüglich der eben eingeführten Notation äquivalent zur Gleichheit g(k) = 4, denn die Zahl 7 benötigt beispielsweise mindestens 4 Summanden, nämlich 7 = 22 + 12 + 12 + 12 . Diesen sogenannten ’Vierquadratesatz’ hatte bereits Fermat ein Jahrhundert zuvor vermutet, jedoch nicht bewiesen. Weitere konkrete Werte von g(k) konnten mit der Zeit gezeigt werden, allerdings lag der Fokus bald vorwiegend auf der Suche nach Formeln für g(k). Johannes Albert Euler fand eine recht einfach zu beweisende untere Abschätzung für g(k). Diese wird in Kapitel 4 vorgestellt. Kapitel 5 widmet sich einer alternativen Herangehensweise an die Waringsche Vermutung, die durch Hardy und Littlewood entwickelt wurde und im Gegensatz zu Hilberts Beweisidee auch auf andere additive Probleme angewandt werden kann. Die folgenden zwei Kapitel basieren zum größten Teil auf [2]. 3 2 2.1 Die Hurwitzsche Vermutung und die Identität von Hilbert Polynomielle Identitäten und die Hurwitzsche Vermutung In diesem Kapitel werden wir zunächst einige polynomielle Identitäten zeigen und die Aussage der Waringschen Vermutung für die Fälle k = 4, k = 6, k = 8 beweisen. Bemerkung 2.1. Wir nutzen im Folgenden die Notation (x1 ± x2 ± · · · ± xn )k := (x1 + ε2 x2 + · · · + εn xn )k . X ε2 ,...,εn =±1 Außerdem bezeichne g(k) die kleinste Zahl r, sodass jede natürliche Zahl als Summe von genau r k-ten Potenzen natürlicher Zahlen dargestellt werden kann. Satz 2.2. (Liouville) x21 + x22 + x23 + x24 2 = 1 X (xi ± xj )4 6 1≤i<j≤4 ist eine polynomielle Identität für alle x1 , x2 , x3 , x4 ∈ Z und jede natürliche Zahl ist die Summe von 53 vierten Potenzen, d.h. g(4) ≤ 53. Beweis. Durch Ausmultiplizieren erhalten wir (x1 ± x2 )4 = (x1 + x2 )4 + (x1 − x2 )4 = 2x41 + 12x21 x22 + 2x42 . Damit folgt X (xi ± xj )4 = 1≤i<j≤4 X (xi + xj )4 + 1≤i<j≤4 X = X (xi − xj )4 1≤i<j≤4 2x4i + 12x2i x2j + 2x4j 1≤i<j≤4 =6 4 X x4i + 12 i=1 X x2i x2j 1≤i<j≤4 = 6 x21 + x22 + x23 + x24 2 . Hiermit ist die obige Gleichung gezeigt. Sei nun a ∈ N. Nach dem Satz von Lagrange ist a die Summe von vier 4 Quadraten, also a = x21 + x22 + x23 + x24 für gewisse xk ∈ Z. Einsetzen in die eben bewiesene Gleichung liefert 6a2 = 6 x21 + x22 + x23 + x24 = (xi + xj )4 + X 1≤i<j≤4 2 X (xi − xj )4 . 1≤i<j≤4 6a2 ist somit die Summe von 12 vierten Potenzen. Jedes n ∈ N kann in der Form n = 6q + r mit q ≥ 0 und 0 ≤ r ≤ 5 geschrieben werden. Wendet man wiederum den Satz von Lagrange an, erhält man q = a21 + a22 + a23 + a24 für gewisse ak ∈ Z und somit folgt, dass 6q = 6a21 +6a22 +6a23 +6a24 die Summe von 48 vierten Potenzen ist. Da r zwischen 0 und 5 liegt, ist r insbesondere Summe von 5 vierten Potenzen, nämlich jeweils 04 oder 14 . Damit folgt insgesamt, dass jedes n ∈ N die Summe von 53 vierten Potenzen ist. Die Beweise der folgenden zwei Sätze verlaufen ähnlich und werden hier deshalb nicht gezeigt. Satz 2.3. (Fleck) (x21 +x22 +x23 +x24 )3 = X 3 X 6 1 1 X (xi ±xj )6 + x (xi ±xj ±xk )6 + 60 1≤i<j<k≤4 30 1≤i<j≤4 5 1≤i≤4 i ist eine polynomielle Identität für alle x1 , x2 , x3 , x4 ∈ Z und jede natürliche Zahl ist die endliche Summe sechster Potenzen. Satz 2.4. (Hurwitz) 1 (x1 ± x2 ± x3 ± x4 )8 840 X 1 + (2xi ± xj ± xk )8 5040 1≤i<j<k≤4 (x21 + x22 + x23 + x24 )4 = + 1 X 1 X (xi ± xj )8 + (2xi )6 84 1≤i<j≤4 840 1≤i≤4 ist eine polynomielle Identität für alle x1 , x2 , x3 , x4 ∈ Z und jede natürliche Zahl ist die endliche Summe achter Potenzen. Im nächsten Kapitel werden wir die Hilbertsche Identität (x21 + · · · + x24 )k = M X ai (bi,1 x21 + bi,2 x22 + bi,3 x23 + bi,4 x24 )2k (2.1) i=1 beweisen, wobei M ∈ N, bi,j ∈ Z und ai ∈ Q+ sind. Hurwitz konnte mithilfe dieser Gleichung außerdem sofort zeigen, dass die Waringsche Vermutung für den Exponenten 2k stimmt, wenn sie denn für k bereits gilt. Den Beweis hierfür werden wir in Satz 2.17 führen. 5 2.2 Hermitesche Polynome und die Identität von Hilbert Definition 2.5. Für n ∈ N0 heißt Hn (x) = −1 2 n ex 2 dn −x2 e dxn das Hermitesche Polynom. Die ersten Hermiteschen Polynome lauten H0 (x) = 1, H1 (x) = x, 1 H2 (x) = x2 − , 2 3 H3 (x) = x3 − x. 2 Allgemein gilt folgende Rekursionsformel 1 Hn+1 (x) = xHn (x) − Hn0 (x), 2 (2.2) denn durch Ableiten erhält man Hn0 n −1 n d 2 d −x2 ex e = 2 dx dxn n −1 n+1 x2 dn+1 −x2 −1 n 2 d −x2 (2x) ex e e e − 2 = 2 dxn 2 dxn+1 = 2xHn (x) − 2Hn+1 (x) ! und Umstellen zeigt sofort (2.2). Induktiv sieht man, dass Hn (x) ein normiertes Polynom n-ten Grades ist, welches aufgrund der Linearkombinationen in der Rekursionsformel ausschließlich rationale Koeffizienten besitzt. Außerdem ist Hn (x) für gerades n ebenfalls gerade und für ungerades n ungerade. Lemma 2.6. Das Hermitesche Polynom Hn (x) besitzt n paarweise verschiedene reelle Nullstellen. Beweis. Wir führen eine Induktion nach n. Die Aussage stimmt offensichtlich für n = 0 und n = 1, denn H0 (x) ≡ 1 und H1 (x) hat eine Nullstelle im Punkt Null. Sei nun n ≥ 1 und wir nehmen an, dass die Aussage für ein Hn gilt. Hn (x) 6 besitzt dann n paarweise verschiedene reelle Nullstellen. Da diese alle einfach sind, bezeichnen wir sie mit βn < βn−1 < · · · < β2 < β1 , wobei Hn (βj ) = 0 und Hn0 (βj ) 6= 0 für alle j = 1, . . . , n gilt. Als normiertes Polynom vom Grad n gilt für Hn (x) lim Hn (x) = ∞ x→∞ und somit Hn0 (β1 ) > 0. Da die n − 1 paarweise verschiedenen reellen Nullstellen von Hn0 (x) die n Nullstellen von Hn (x) trennen, folgt (−1)j+1 Hn0 (βj ) > 0 für j = 1, . . . , n. Die Rekursionsformel (2.2) liefert 1 1 Hn+1 (βj ) = βj Hn (βj ) − Hn0 (βj ) = − Hn0 (βj ) 2 2 und damit insgesamt (−1)j Hn+1 (βj ) = (−1)j+1 0 Hn (βj ) > 0 2 für j = 1, . . . , n. Für j = 2, . . . , n besitzt Hn+1 (x) mit dem Zwischenwertsatz eine Nullstelle βj∗ in jedem offenen Intervall (βj , βj−1 ). Aus limx→∞ Hn+1 (x) = ∞ und Hn+1 (β1 ) < 0 folgt, dass Hn+1 (x) eine Nullstelle β1∗ > β1 hat. Ist n gerade, dann gilt Hn+1 (βn ) > 0. Somit ist n + 1 ungerade und Hn+1 (x) folglich ein Polynom ungeraden Grades. Damit erhalten wir ∗ < βn . limx→−∞ Hn+1 (x) = −∞. Dann hat Hn+1 (x) eine Nullstelle βn+1 Analog kann man aus ungeradem n folgern, dass Hn+1 (βn ) < 0 gilt und ∗ Hn+1 (x) eine Nullstelle βn+1 < βn besitzt. Hn+1 (x) hat somit n + 1 paarweise verschiedene reelle Nullstellen und die Aussage ist bewiesen. Lemma 2.7. Sei n ∈ N und f (x) ein Polynom von einem Grad höchstens n − 1. Dann gilt Z ∞ 2 e−x Hn (x)f (x)dx = 0. −∞ 7 Beweis. Wir führen eine Induktion nach n. Ist n = 1, so lautet das Hermitesche Polynom H1 (x) = x und f (x) ist konstant, also f (x) = a0 für ein a0 ∈ R. Dann folgt durch Einsetzen Z ∞ −∞ −x2 e H1 (x)f (x)dx = a0 Z ∞ 2 e−x xdx = 0, −∞ −x2 da x 7→ e x eine ungerade Funktion ist. Nehmen wir nun an, die Aussage stimmt für ein n ∈ N und f (x) sei ein Polynom von einem Grad höchstens n. Dann ist f 0 (x) ein Polynom von einem Grad höchstens n − 1. Durch partielle Integration erhalten wir dann Z ∞ −∞ −1 n+1 Z ∞ dn+1 −x2 e f (x)dx 2 −∞ dxn+1 −1 n+1 Z ∞ dn −x2 0 e f (x)dx =− 2 −∞ dxn −1 Z ∞ −x2 =− e Hn (x)f 0 (x)dx 2 −∞ 2 e−x Hn+1 (x)f (x)dx = (IV ) = 0. Damit ist die Aussage für alle n ∈ N bewiesen. Lemma 2.8. Für n ∈ N0 gilt n! 1 Z ∞ −x2 n n e x dx = 2 (n/2)! cn = √ π −∞ 0 falls n gerade, falls n ungerade. (2.3) Beweis. Zum Beweis nutzen wir eine Induktion nach n. Für n = 0 erhalten wir Z ∞ √ 2 e−x dx = π, −∞ was dem Gaußschen Fehlerintegral entspricht. Somit folgt c0 = 1 = 0! . 20 (0/2)! 2 Für n = 1 ist die Funktion x 7→ e−x x ungerade und somit ist Z ∞ 2 e−x xdx = 0 −∞ und c1 = 0. Sei nun n ≥ 2 und die Aussage gelte für n−2. Partielle Integration liefert 1 Z ∞ −x2 n √ cn = e x dx π −∞ n − 1 1 Z ∞ −x2 n−2 √ = e x dx 2 π −∞ n−1 = cn−2 . 2 8 Ist n ungerade, dann gilt cn−2 = 0 und somit auch cn = 0. Ist n andererseits gerade, so folgt durch Erweitern mit n im zweiten Schritt n−1 cn = cn−2 2 (n − 2)! n−1 = 2 2n ((n − 2)/2)! n! = n . 2 (n/2)! Dies beweist die Aussage für alle n ∈ N. Lemma 2.9. Seien β1 , . . . , βn paarweise verschiedene reelle Zahlen und c0 , . . . , cn−1 die durch (2.3) definierten Zahlen. Dann hat das lineare Gleichungssystem n X βjk xj = ck für k = 0, 1, . . . , n − 1 (2.4) j=1 eine eindeutige Lösung ρ1 , . . . , ρn . Ist r(x) ein Polynom von einem Grad höchstens n − 1, so gilt außerdem n X 1 Z ∞ −x2 e r(x)dx. r(βj )ρj = √ π −∞ j=1 Beweis. Die Existenz und Eindeutigkeit der Lösung ρ1 , . . . , ρn folgt sofort aus der Tatsache, dass die Determinante des linearen Gleichungssystems +x2 +β2 x2 +β22 x2 x1 β 1 x1 β12 x1 .. . +... +... +... β1n−1 x1 +β2n−1 x2 + . . . +xn +βn xn +βn2 xn = c0 = c1 = c2 +βnn−1 xn = cn−1 der Vandermonde-Determinate 1 β1 β2 1 . .. n−1 β1 1 β2 β22 .. . ... ... ... .. . β2n−1 . . . n−1 βn 1 βn βn2 .. . 9 = Y 1≤i<j≤n (βj − βi ) 6= 0 entspricht. Sei r(x) = Pn−1 k=0 n X ak xk . Dann gilt r(βj )ρj = j=1 n n−1 X X ak βjk ρj j=1 k=0 = n−1 X k=0 = n−1 X ak n X βjk ρj j=1 ak c k . k=0 Einsetzen von ck aus (2.3) liefert Z ∞ X 1 n−1 2 ak e−x xk dx r(βj )ρj = √ π k=0 −∞ j=1 n X X 1 Z ∞ −x2 n−1 =√ e ak xk dx π −∞ k=0 | {z r(x) } 1 Z ∞ −x2 e r(x)dx. =√ π −∞ Damit ist die Aussage gezeigt. Lemma 2.10. Seien β1 , . . . , βn die n paarweise verschiedenen reellen Nullstellen des Hermiteschen Polynoms Hn (x) und ρ1 , . . . , ρn die Lösung des linearen Gleichunssystems (2.4). Sei f (x) ein Polynom von einem Grad höchstens 2n − 1. Dann gilt n X 1 Z ∞ −x2 f (βj )ρj = √ e f (x)dx. π −∞ j=1 Beweis. Durch Polynomdivision erhält man Polynome q(x) und r(x) von einem Grad höchstens n − 1, sodass gilt f (x) = Hn (x)q(x) + r(x). Setzen wir hier βj ein, so erhalten wir wegen Hn (βj ) = 0 für j = 1, . . . , n sodann f (βj ) = Hn (βj )q(βj ) + r(βj ) = r(βj ). 10 Wenden wir anschließend Lemma 2.9 und Lemma 2.7 an, so folgt nach einigen Umformungen die Behauptung n X f (βj )ρj = j=1 n X r(βj )ρj j=1 1 Z ∞ −x2 e r(x)dx =√ π −∞ 1 Z ∞ −x2 1 Z ∞ −x2 =√ e Hn (x)q(x)dx + √ e r(x)dx π −∞ π −∞ 1 Z ∞ −x2 =√ e f (x)dx. π −∞ Lemma 2.11. Seien β1 , . . . , βn die n paarweise verschiedenen reellen Nullstellen des Hermiteschen Polynoms Hn (x) und ρ1 , . . . , ρn die Lösung des linearen Gleichunssystems (2.4). Dann gilt ρi > 0 für i = 1, . . . , n. Beweis. Spalten wir das Hermitesche Polynom in Linearfaktoren auf, so lautet dieses n Hn (x) = Y (x − βj ) j=1 und daraus folgt fi (x) = Hn (x) x − βi !2 = n Y (x − βj )2 für alle i = 1, . . . , n. j=1 j6=i Dies ist ein normiertes Polynom von einem Grad höchstens 2n − 2, wobei fi (x) ≥ 0 für alle x ∈ R gilt. Da f nicht konstant und stetig ist, folgt 1 Z ∞ −x2 √ e {z } fi (x) dx > 0. | {z } π −∞ | >0 ≥0 Wegen fi (βi ) > 0 und fi (βj ) = 0 für j 6= i erhalten wir mit Lemma 2.10 fi (βi )ρi = n X fi (βj )ρj j=1 1 Z ∞ −x2 e fi (x)dx =√ π −∞ > 0. Dies zeigt ρi > 0 für i = 1, . . . , n. 11 Lemma 2.12. Seien c0 , c1 , . . . , cn−1 die rationalen Zahlen, die durch (2.3) definiert wurden. Dann existieren paarweise verschiedene β1∗ , . . . , βn∗ ∈ Q und positive rationale Zahlen ρ∗1 , . . . , ρ∗n , sodass gilt n X (βj∗ )k ρ∗j = ck für k = 0, 1, . . . , n − 1. j=1 Beweis. Lemma 2.9 besagt, dass das lineare Gleichunssystem n X βjk xj = ck für k = 0, 1, . . . , n − 1 j=1 mit n paarweise verschiedenen, reellen β1 , . . . , βn eine eindeutige Lösung (ρ1 , . . . , ρn ) besitzt. Sei R die offene Teilmenge des Rn , die aus allen Vektoren (β1 , . . . , βn ) besteht, so dass βi 6= βj für i 6= j. Außerdem sei Φ : R → Rn diejenige Funktion, die (β1 , . . . , βn ) auf (ρ1 , . . . , ρn ) abbildet. Nach der Cramerschen Regel zum Lösen von linearen Gleichungen können wir jedes ρj als rationale Funktion von β1 , . . . , βn ausdrücken und somit ist die Funktion Φ(β1 , . . . , βn ) = (ρ1 , . . . , ρn ) stetig. Sei Rn+ die offene Teilmenge von Rn , die alle Vektoren (x1 , . . . , xn ) umfasst mit xi > 0 für alle i = 1, . . . , n. Sind die β1 , . . . , βn die n Nullstellen von Hn (x), so wissen wir aus Lemma 2.11 (β1 , . . . , βn ) ∈ R und Φ(β1 , . . . , βn ) = (ρ1 , . . . , ρn ) ∈ Rn+ . Da Rn+ eine offene Teilmenge des Rn ist, folgt, dass Φ−1 (Rn+ ) eine offene Umgebung von (β1 , . . . , βn ) in R ist. Die Vektoren mit rationalen Koordinaten liegen dicht in R, weshalb die Umgebung einen rationalen Punkt (β1∗ , . . . , βn∗ ) besitzen muss. Sei (ρ∗1 , . . . , ρ∗n ) = Φ(β1∗ , . . . , βn∗ ) ∈ Rn+ . Da jedes ρ∗i als rationale Funktion der Zahlen β1∗ , . . . , βn∗ ∈ Q mit rationalen Koeffizienten ausgedrückt werden kann, folgt, dass jede der positiven Zahlen ρ∗i rational ist. Die Aussage ist somit bewiesen. Lemma 2.13. Seien n verschiedene reelle Zahlen β1 , . . . , βn und c0 , c1 , . . . , cn−1 die durch (2.3) definierten Zahlen . Sei außerdem ρ1 , . . . , ρn die Lösung 12 des linearen Gleichungssystem (2.4). Für jede positive ganze Zahl r und für m = 1, 2, . . . , n − 1 gilt die Gleichheit cm x21 + · · · + x2r m/2 = n X j1 =1 ··· n X ρj1 . . . ρjr (βj1 x1 + · · · + βjr xr )m . jr =1 Beweis. Wir wenden im folgenden Beweis den Multinomialsatz an und formen um, sodass sich Folgendes ergibt n X = = m! = m! j1 =1 n X ... ... n X jr =1 n X j1 =1 jr =1 n X n X ρj1 . . . ρjr (βj1 x1 + · · · + βjr xr )m ρj1 . . . ρjr m! (βj1 x1 )µ1 . . . (βjr xr )µr µ ! . . . µ ! r µ1 +···+µr =m 1 X µi ≥0 µ X x1 1 µ1 ... βj1 ρj1 . . . jr =1 µ1 +···+µr =m µ1 ! j1 =1 µi ≥0 r n Y n X X X xµi i µi ··· βji ρji µ1 +···+µr =m j1 =1 jr =1 i=1 µi ! µi ≥0 xµr r µr β ρj µr ! jr r n xµi i X = m! βjµi ρj µi ! jr =1 µ1 +···+µr =m i=1 X r Y µi ≥0 = m! X r Y cµi xµi i µ1 +···+µr =m i=1 µi ≥0 µi ! . Mit Lemma 2.8 folgt cm = 0 für m ungerade. Ist m ungerade und µ1 +· · ·+µr = m, dann muss µi ungerade sein für gewisse i und somit folgt n X j1 =1 ··· n X ρj1 . . . ρjr (βj1 x1 + · · · + βjr xr )m = 0. jr =1 Damit ist das Lemma für ungerade m bewiesen. Nehmen wir nun an, dass m gerade ist. Dann müssen wir nur Aufteilungen von m in gerade Summanden µi = 2νi betrachten. Setzt man außerdem die Definition der cn aus (2.3) ein, so erhält man 13 n X ··· j1 =1 n X ρj1 . . . ρjr (βj1 x1 + · · · + βjr xr )m jr =1 = m! r i Y c2νi x2ν i X = m! 2ν1 +···+2νr =m i=1 νi ≥0 r X Y (2νi )! i (2νi )! x2ν i 22νi νi ! (2νi )! ν1 +···+νr =m/2 i=1 νi ≥0 r X Y m! xi2νi = m 2 ν1 +···+νr =m/2 i=1 νi ! νi ≥0 = r X Y m! (x2i )νi (m/2)! 2m (m/2)! νi ! ν1 +···+νr =m/2 i=1 νi ≥0 = cm (m/2)! 2 ν1 (x1 ) . . . (x2r )νr ν ! . . . ν ! r ν1 +···+νr =m/2 1 X νi ≥0 = cm (x21 + · · · + x2r )m/2 . Damit ist die polynomielle Identität gezeigt. Satz 2.14. (Hilbertsche Identität) Für jedes k ≥ 1 und r ≥ 1 existiert ein M ∈ N und positive ai ∈ Q und bi,j ∈ N für i = 1, . . . , M und j = 1, . . . , r, sodass gilt (x21 + · · · + x2r )k = M X ai (bi,1 x1 + · · · + bi,r xr )2k . (2.5) i=1 Beweis. Wähle n > 2k und seien β1∗ , . . . , βn∗ , ρ∗1 , . . . , ρ∗n die in Lemma 2.12 konstruierten rationalen Zahlen. Dann sind β1∗ , . . . , βn∗ paarweise verschieden und ρ∗1 , . . . , ρ∗n positiv. Wenden wir darauf Lemma 2.13 mit m = 2k an, so erhalten wir c2k (x21 + ··· + x2r )k = n X ··· j1 =1 n X ρ∗j1 . . . ρ∗jr (βj∗1 x1 + · · · + βj∗r xr )2k . jr =1 Sei q der gemeinsame Nenner der n Brüche β1∗ , . . . , βn∗ . Dann ist qβj∗ ∈ N für alle j = 1, . . . , r und es gilt (x21 + ··· + x2r )k ρ∗j1 . . . ρ∗jr = ··· (qβj∗1 x1 + · · · + qβj∗r xr )2k . 2k j1 =1 jr =1 c2k q n X n X Damit ist die Aussage bewiesen. 14 Lemma 2.15. Sei k ≥ 1. Wenn positive rationale Zahlen a1 , . . . , aM existieren, sodass jedes ausreichend große n ∈ N in der Form n= M X ai xki (2.6) i=1 mit x1 , . . . , xM ∈ N0 geschrieben werden kann, dann ist die Waringsche Vermutung für den Exponenten k wahr. Beweis. Wähle n0 so, dass jede natürliche Zahl n ≥ n0 in der Form (2.6) geschrieben werden kann. Sei q der kleinste gemeinsame Nenner der Brüche a1 , . . . , aM . Dann ist qai ∈ Z für i = 1, . . . , M und qn ist die Summe von PM i=1 qai nichtnegativen k-ten Potenzen für jedes n ≥ n0 . Da jede Zahl N ≥ qn0 in der Form N = qn + r mit n ≥ n0 und 0 ≤ r ≤ q − 1 geschrieben P werden kann, kann folglich auch N als Summe von diesmal M i=1 qai + q − 1 nichtnegativen k-ten Potenzen ausgedrückt werden. Offensichtlich kann jedes nichtnegative N ≤ qn0 als endliche Summe von kten Potenzen geschrieben werden und somit gilt die Waringsche Vermutung für k. Damit ist die Aussage bewiesen. Bemerkung 2.16. Die folgende Notation geht auf Stridsberg zurück: Sei PM k k mit positiven rationalen i=1 ai xi eine fixierte Diagonalform vom Grad P Koeffizienten a1 , . . . , aM . Wir schreiben n = (k), wenn nichtnegative ganze Zahlen x1 , . . . , xM existieren, sodass n= M X ai xki (2.7) i=1 gilt. P Wir schreiben von nun an jede natürliche Zahl, die (2.7) erfüllt, als (k). P P P P P Dann folgt (k) + (k) = (k) und (2k) = (k). Lemma 2.15 kann dann wie folgt umformuliert werden: P Ist n = (k) für jede ausreichend große nichtnegative ganze Zahl n erfüllt, dann ist die Waringsche Vermutung wahr für den Exponenten k. Satz 2.17. Gilt die Waringsche Vermutung für k, dann stimmt sie auch für 2k. Beweis. Zunächst wenden wir Hilberts Identität (2.5) für k mit r = 4 an: (x21 + ··· + x24 )k = M X ai (bi,1 x1 + · · · + bi,4 x4 )2k . i=1 15 Sei y ∈ N0 . Nach dem Vierquadratesatz von Lagrange existieren Zahlen x1 , x2 , x3 , x4 ∈ N0 , sodass y = x21 + x22 + x23 + x24 ist, und somit folgt yk = M X ai zi2k (2.8) i=1 mit zi = bi,1 x1 + · · · + bi,4 x4 ∈ N0 . Das bedeutet jedoch yk = X (2k) für jedes y ∈ N0 . Gilt die Waringsche Vermutung für k, dann ist jede nichtnegative ganze Zahl die endliche Summe von k-ten Potenzen und somit ist jede nichtnegative P ganze Zahl die endliche Summe von Zahlen der Form (2k). Nach Lemma 2.15 stimmt die Waringsche Vermutung somit auch für den Exponenten 2k. Damit ist der Beweis vollständig. 16 3 Der Beweis der Waringschen Vermutung nach Hilbert per Induktion Wir werden nun die Hilbertsche Identität nutzen, um die Waringsche Vermutung für alle Exponenten k ≥ 2 zu beweisen. Dazu führen wir eine Induktion nach k durch und zeigen: Ist k ≥ 2 und die Waringsche Vermutung stimmt für alle Exponenten kleiner als k, dann ist sie auch für k richtig. Lemma 3.1. Sei k ≥ 2 und 0 ≤ l ≤ k. Dann existieren natürliche Zahlen B0,l , B1,l , . . . , Bl−1,l , die nur von k und l abhängen, sodass gilt 2l x T k−l + l−1 X Bi,l x2i T k−i = X (2k) i=0 für alle ganzen Zahlen x und T mit x2 ≤ T. Beweis. Wir beginnen mit der Hilbertschen Identität für den Exponenten k + l mit r = 5: x21 + · · · + x25 k+l = Ml X ai (bi,1 x1 + · · · + bi,5 x5 )2k+2l , i=1 wobei die ganzen Zahlen Ml und bi,j und die positiven rationalen Zahlen ai nur von k und l abhängig sind. Sei U ∈ N0 . Nach dem Vierquadratesatz von Lagrange können wir U = x21 + x22 + x23 + x24 mit x1 , x2 , x3 , x4 ∈ N schreiben. Sei x := x5 . Dann erhalten wir die polynomielle Identität x2 + U k+l = Ml X ai (bi x + ci )2k+2l , (3.1) i=1 wobei die Zahlen Ml , ai und bi := bi,5 nur von k und l und die ganzen Zahlen ci := bi,1 x1 + · · · + bi,4 x4 nur von k, l und U abhängen. Da l ≤ k ist, folgt 2l ≤ k + l. Differenziert man das Polynom auf der linken Seite von (3.1) 2l-mal, so erhält man l k+l k−i X d2l 2 2 2i x + U = A x x + U , i,l dx2l i=0 17 wobei die Ai,l ∈ N nur von k und l abhängig sind. Dies kann man per Induktion beweisen, indem man k fest, aber beliebig wählt und die Aussage für alle l < k zeigt. Dabei muss man die Fälle l = 0 und l = 1 einzeln betrachten. Der Induktionsschluss geht dann recht einfach, beinhaltet jedoch viele Umformungen und Indexverschiebungen, weshalb hier darauf verzichtet wird. Differenziert man das Polynom auf der rechten Seite von (3.1) 2l-mal, erhält man Ml d2l X ai (bi x + ci )2k+2l dx2l i=1 = = = Ml X i=1 Ml X i=1 Ml X 2k (2k + 1) (2k + 2) . . . (2k + 2l) b2l i ai (bi x + ci ) a0i (bi x + ci )2k a0i yi2k , i=1 wobei yi := |bi x + ci | eine nichtnegative ganze Zahl ist und a0i := (2k + 1) (2k + 2) . . . (2k + 2l) b2l i ai eine nichtnegative rationale Zahl ist, die nur von k und l abhängig ist. Wenn x und U ganze Zahlen sind und U ≥ 0, dann existieren y1 , . . . , yMl ∈ N mit l X Ai,l x2i x2 + U k−i i=0 = Ml X a0i yi2k . i=1 2 Seien nun x und T ∈ N0 , sodass x ≤ T ist. Da Al,l eine natürliche Zahl ist, folgt x2 ≤ Al,l T und somit ist U = Al,l T − x2 ∈ N0 . Mit dieser Wahl von U folgt l X Ai,l x 2i 2 x +U k−i = l X Ai,l x2i (Al,l T )k−i i=0 i=0 = l X 2i k−i Ai,l Ak−i l,l x T i=0 = Ak−l+1 l,l l X Ai,l Al−i−1 x2i T k−i l,l i=0 = Ak−l+1 l,l l X i=0 18 Bi,l x2i T k−i , wobei Bl,l := 1 und die Bi,l := Ai,l Al−i−1 l,l für i = 0, . . . , l − 1 natürliche Zahlen sind. Mit der Definition a00i := a0i Ak−l+1 l,l gilt dann x2l T k−l + l−1 X Bi,l x2i T k−i = i=0 Ml X a00i yi2k = X (2k) . i=1 Damit ist die Aussage bewiesen. Satz 3.2. (Hilbert-Waring) Die Menge der nichtnegativen k-ten Potenzen ist eine Basis endlicher Ordnung für jedes n ∈ N. Beweis. Wir führen eine Induktion nach k. Der Fall k = 1 ist klar und für k = 2 erhalten wir mit dem Vierquadratesatz von Lagrange die Aussage. Sei nun k ≥ 3 und die Menge l-ter Potenzen ist eine Basis endlicher Ordnung für jedes l < k. Nach Satz 2.17 ist die Menge der (2l)-ten Potenzen eine Basis endlicher Ordnung für l = 1, 2, . . . , k − 1. Deshalb existiert eine ganze Zahl r, sodass für jedes n ∈ N0 und für l = 1, . . . , k − 1 die Gleichung 2l n = x2l 1,l + · · · + xr,l lösbar ist mit gewissen x1,l , . . . , xr,l ∈ N0 . Eine mögliche Lösung wäre beispielsweise r = max{g(2l) : l = 1, 2, . . . , k − 1}. Sei T ≥ 2. Wähle ganze Zahlen C1 , . . . , Ck−1 mit 0 ≤ Cl < T. Dann existieren nichtnegative ganze Zahlen xj,l für j = 1, . . . , r und l = 1, . . . , k − 1, sodass 2l x2l (3.2) 1,l + · · · + xr,l = Ck−l ist und demnach gilt x2j,l ≤ r X x2i j,l ≤ Ck−l < T j=1 für j = 1, . . . , r, l = 1, . . . , k − 1 und i = 1, . . . , l. Nach Lemma 3.1 existieren positive ganze Zahlen Bi,l , die nur von k und l abhängig sind, derart, dass k−l x2l + j,l T l−1 X k−i Bi,l x2i = j,l T i=0 19 X (2k) = X (k) . (3.3) Summiert man (3.3) für j = 1, . . . , r und benutzt (3.2) für den ersten Term, so erhält man Ck−l T k−l + l−1 X Bi,l T k−i i=0 = Ck−l T k−l = Ck−l T k−l r X x2i j,l j=1 +T k−l+1 l−1 X Bi,l T l−1−i i=0 = X + Dk−l+1 T r X x2i j,l j=1 k−l+1 (k) mit Dk−l+1 := l−1 X Bi,l T l−1−i i=0 r X x2i j,l j=1 für l = 1, . . . , k − 1. Die ganze Zahl Dk−l+1 wird ausschließlich durch k, l, T und aufgrund von (3.2) durch Ck−l festgelegt und ist unabhängig von allen Ck−i mit i 6= l. Sei B ∗ := max{Bi,l : l = 1, . . . , k − 1 und i = 0, 1, . . . , l − 1}. Dann gilt 0 ≤ Ck−l T k−l + Dk−l+1 T k−l+1 = Ck−l T k−l + | {z <T k−l+1 } l−1 X Bi,l T k−i (3.4) r X x2i j,l j=1 i=0 | {z } <T <B ∗ T k−l+1 k + rT + = B ∗ rT k + T l−1 X T i=1 ! l−1 X i k−l+1 T i=0 < B∗ ! T k+1 rT k + T −1 ! ≤ (r + 2) B ∗ T k , da T / (T − 1) ≤ 2 für T ≥ 2 ist. Setze Ck := D1 := 0. 20 k−i+1 Dann folgt durch Summation von (3.4) für l = 1, . . . , k − 1 k−1 X Ck−l T k−l + Dk−l+1 T k−l+1 = l=1 k X (Cl + Dl ) T l = X (k) (3.5) l=1 und mit der Abschätzung bei (3.4) erhalten wir 0≤ k X (Cl + Dl ) T l < (k − 1) (r + 2) B ∗ T k = E ∗ T k , l=1 wobei die ganze Zahl E ∗ := (k − 1) (r + 2) B ∗ von k abhängt, jedoch von T unabhängig ist. Wählen wir T ≥ E ∗, so gilt 0≤ k X (Cl + Dl ) T l < E ∗ T k < T k+1 . l=1 Somit können wir k X Pk l=1 (Cl + Dl ) T l bezüglich der Basis T schreiben als (Cl + Dl ) T l = E1 T + · · · + Ek−1 T k−1 + Ek T k , (3.6) l=1 wobei 0 ≤ Ei < T für i = 1, . . . , k − 1 und 0 ≤ Ek < E ∗ gelten. Damit legt jede Wahl eines (k − 1)-Tupels (C1 , . . . , Ck−1 ) von Zahlen aus {0, 1, . . . , T − 1} ein anderes (k − 1)-Tupel (E1 , . . . , Ek−1 ) von Zahlen aus {0, 1, . . . , T −1} fest. Wir wollen nun zeigen, dass diese Abbildung von (k−1)Tupeln bijektiv ist. Es reicht, die Surjektivität zu zeigen, da eine surjektive Abbildung zwischen zwei gleichmächtigen Mengen sofort auch injektiv ist. Sei (E1 , . . . , Ek−1 ) ein (k − 1)-Tupel von Zahlen aus {0, 1, . . . , T − 1}. Dann existiert ein einfacher Algorithmus, der ganze Zahlen C1 , C2 , . . . , Ck−1 ∈ {0, 1, . . . , T − 1} generiert, sodass (3.6) für eine gewisse nichtnegative ganze Zahl Ek < E ∗ erfüllt ist. Sei C1 = E1 und I2 = 0. Da D1 = 0 ist, erhalten wir (C1 + D1 ) T = E1 T + I2 T 2 . 21 Die ganze Zahl C1 legt (nach der Definition der Dk−l+1 ) die ganze Zahl D2 fest. Wähle C2 ∈ {0, 1, . . . , T − 1}, sodass gilt C2 + D2 + I2 ≡ E2 (mod T ). Damit folgt C2 + D2 + I2 = E2 + I3 T für ein gewisses I3 ∈ Z und somit 2 X (Cl + Dl ) T l = C1 T + D1 T + C2 T 2 + D2 T 2 l=1 = E1 T + I2 T 2 +E2 T 2 + I3 T 3 − I2 T 2 | {z } | {z } =0 = 2 X =0 El T l + I3 T 3 . l=1 Das C2 ∈ N legt D3 fest. Wähle C3 ∈ {0, 1, . . . , T − 1}, sodass gilt C3 + D3 + I3 ≡ E3 (mod T ). Dann gilt C3 + D3 + I3 = E3 + I4 T für ein gewisses I4 ∈ Z und somit 3 X (Cl + Dl ) T l = l=1 3 X El T l + I4 T 4 . l=1 Sei 2 ≤ j ≤ k − 1 und es seien Ij und C1 , . . . , Cj−1 ∈ {0, 1, . . . , T − 1} bereits konstruiert, sodass gilt j−1 X (Cl + Dl ) T l = l=1 j−1 X El T l + Ij T j . l=1 Dann existiert eine eindeutige ganze Zahl Cj ∈ {0, 1, . . . , T − 1}, sodass gilt Cj + Dj + Ij ≡ Ej (mod T ). Somit ist Cj + Dj + Ij = Ej + Ij+1 T für ein gewisses Ij+1 ∈ Z und j X l=1 (Cl + Dl ) T l = j X l=1 22 El T l + Ij+1 T j+1 . Per Induktion folgt, dass dieses Vorgehen eine eindeutige Folge von ganzen Zahlen C1 , C2 , . . . , Ck−1 ∈ {0, 1, . . . , T − 1} liefert, sodass gilt k−1 X l (Cl + Dl ) T = l=1 k−1 X El T l + Ik T k . l=1 Da Ck = 0 und Dk durch Ck−1 festgelegt ist, erhalten wir 0≤ k X (Cl + Dl ) T l = l=1 k−1 X El T l + (Dk + Ik ) T k = l=1 k X El T l < E ∗ T k , l=1 wobei wir Ek := Dk + Ik setzen. Aus 0≤ k−1 X El T l < T k l=1 folgt 0 ≤ Ek < E ∗ und k−1 X El T l + E ∗ T k < (1 + E ∗ ) T k ≤ 2E ∗ T k . (3.7) l=1 Somit ist die Surjektivität und insbesondere die Bijektivität bewiesen und wir können die Gleichung (3.5) umschreiben wie folgt k X l El T = k X (Cl + Dl ) T l = X (k) . l=1 l=1 Da E ∗ nur von k und nicht von T abhängig ist, folgt (E ∗ − Ek ) T k = und somit k−1 X X El T l + E ∗ T k = (k) X (k) (3.8) l=1 für jedes (k − 1)-Tupel (E1 , . . . , Ek−1 ) aus Zahlen El ∈ {0, 1, . . . , T − 1}. Wähle die ganze Zahl T0 > 5E ∗ , sodass 4 (T + 1)k ≤ 5T k für alle T ≥ T0 . Wir behaupten nun: Ist T ≥ T0 und (F0 , F1 , . . . , Fk−1 ) ein beliebiges k-Tupel von ganzen Zahlen aus {0, 1, . . . , T − 1}, so folgt F0 + F1 T + · · · + Fk−1 T k−1 + 4E ∗ T k = 23 X (k) . Um dies zu beweisen, nutzen wir folgenden Idee. Sei E00 ∈ {0, 1, . . . , T − 1}. Wendet man (3.7) mit T + 1 statt T an und betrachtet nur den ersten und letzten Summanden, so erhält man E00 (T + 1) + E ∗ (T + 1)k < (T + 1)2 + E ∗ (T + 1)k ≤ (1 + E ∗ ) (T + 1)k ≤ 2E ∗ (T + 1)k . (3.9) Setzt man in (3.8) T + 1 anstelle von T ein, so erhält man wiederum E00 (T + 1) + E ∗ (T + 1)k = X (k) . (3.10) Für jede Wahl von k ganzen Zahlen E00 , E1 , . . . , Ek−1 ∈ {0, 1, . . . , T − 1} erhält man durch Addition von (3.8) und (3.10) F ∗ := E1 T + · · · + Ek−1 T k−1 + E ∗ T k + E00 (T + 1) + E ∗ (T + 1)k = (E00 + E ∗ ) + (E1 + E00 + kE ∗ )T + k−1 X k El + l E ∗ T l + 2E ∗ T k l=2 = X (k). Darüberhinaus folgt aus (3.7) und (3.9) 0 ≤ F ∗ < 4E ∗ (T + 1)k ≤ 5E ∗ T k < T k+1 , da 4 (T + 1)k ≤ 5T k und 5E ∗ < T0 ≤ T gilt. Zu k gegebenen beliebigen ganzen Zahlen F0 , F1 , . . . , Fk−1 ∈ {0, 1, . . . , T − 1} können wir wieder unseren Algorithmus anwenden, um die ganzen Zahlen Fk und E00 , E1 , E2 , . . . , Ek−1 ∈ {0, 1, . . . , T − 1} erhalten, sodass F0 + F1 T + · · · + Fk−1 T k−1 + Fk T k = E1 T + · · · + Ek−1 T k−1 + E ∗ T k + E00 (T + 1) + E ∗ (T + 1)k = X (k) ist, wobei Fk ∈ Z die Gleichung 0 ≤ Fk < 5E ∗ erfüllt. P Nach Addition von (5E ∗ − Fk ) T k = (k) erhalten wir F0 + F1 T + · · · + Fk−1 T k−1 + 5E ∗ T k = X (k) für alle T ≥ T0 und für jede Wahl von F0 , F1 , . . . , Fk−1 ∈ {0, 1, . . . , T − 1}. P Dies beweist n = (k), wenn T ≥ T0 und 5E ∗ T k ≤ n < (5E ∗ + 1) T k 24 gelten. Es existiert eine ganze Zahl T1 ≥ T0 , sodass 5E ∗ (T + 1)k < (5E ∗ + 1) T k Dann ist n = P für alle T ≥ T1 . (k), wenn T ≥ T1 und 5E ∗ T k ≤ n < 5E ∗ (T + 1)k (3.11) erfüllt sind. Da jede ganze Zahl n ≥ 5E ∗ T1k die Ungleichung (3.11) für gewisse T ≥ T1 erfüllt, erhalten wir n= X (k) für alle n ≥ 5E ∗ T1k . Mit Lemma 2.15 folgt, dass die Waringsche Vermutung für den Exponenten k stimmt. Dies vervollständigt den Beweis des Hilbert-Waringschen Satzes. 25 4 Formel zur Abschätzung von g(k) Wie bereits in Kapitel 2 erwähnt, sei g (k) die kleinste Zahl r, sodass wir jede natürliche Zahl als Summe von genau r k-ten Potenzen ganzer Zahlen darstellen können. Johannes Albert Euler [3], der Sohn des berühmten Leonhard Euler, konnte um 1772 zeigen, dass diese Zahl durch einen recht einfachen Term nach unten beschränkt ist. Dies wird im folgenden Satz bewiesen. Satz 4.1. Es gilt k g(k) ≥ 2 + " # k 3 2 − 2, wobei [x] die größte natürliche Zahl n mit n ≤ x ist. Die zugehörige Funktion nennt man auch Gaußklammer. Beweis. Fixiere zunächst ein beliebiges k ∈ N. Setze nun k " # k 3 2 n := 2 − 1 ∈ N. Dann folgt n < 3k . Die Summanden k-ter Potenzen von n sind also 2k (a viele) und 1k (b viele), d.h. n = a2k + b. Daraus folgt n n−b ≤ < a= 2k 2k Aufgrund von a ≤ k 3 2 −1 < k 3 2 " # k 3 2 . erhalten wir die gesuchte Abschätzung g(k) ≥ a + b = a + n − a2k = n − a 2k − 1 k ≥2 k " # k =2 + 3 2 −1− " # k 3 2 − 2. 26 " # k 3 2 ! −1 2k − 1 5 Alternative Herangehensweise von Hardy und Littlewood Der in Kapitel 3 geführte Beweis der Waringschen Vermutung nach Hilbert war zu jener Zeit (1909) bahnbrechend, da die Aussage des Satzes lange nicht bewiesen werden konnte. Jedoch bereits im Jahre 1920 veröffentlichten Hardy und Littlewood [1] eine analytische Methode, die - anders als der Beweis von Hilbert - auch für andere additive Probleme genutzt werden kann. Sie bietet demnach mehr Anwendungsmöglichkeiten und folgt dabei einem Ansatz aus der Funktionentheorie. In diesem Kapitel soll die grobe Idee dieser Methode vorgestellt werden. Wir bezeichnen mit r (N ) die Anzahl der Darstellungen der natürlichen Zahl N in der Form N = xk1 + xk2 + · · · + xks mit xi ≥ 1. (5.1) Ausgangspunkt der Überlegungen ist die asymptotische Formel r (N ) = Ck,s N s/k−1 S (N ) + O N s/k−1−δ mit einer absoluten positiven Konstanten Ck,s und einer positiven, singulären Reihe S (N ) (auf die wir hier nicht weiter eingehen werden). Diese Formel ist für ein hinreichend großes s gültig und von k abhängig. Für hinreichend große N dominiert der Hauptterm und daher gilt insbesondere r(N ) ≥ 1. Die erzeugende Funktion für r (N ) lautet ∞ X N r (N ) z = ∞ X z nk !s . n=0 N =0 Der Konvergenzradius dieser Reihe beträgt gerade 1. Mit der Cauchyschen Integralformel folgt dann, dass die r(N ) den Taylorkoeffizienten der Reihe entsprechen, wenn man über einen Kreis von einem Radius r < 1 integriert. Vinogradov veröffentlichte 1928 einige technische Verbesserungen der HardyLittlewood-Methode und ersetzte die eben erwähnte unendliche Reihe durch endliche Summen wie folgt. Schreibe e(t) = e2πit . Wir definieren T (α) für ein reelles α durch T (α) := P X x=1 27 e(αxk ), wobei P eine positive ganze Zahl ist. Dann gilt (T (α))s = X r0 (m)e(mα). (5.2) m Hierbei bezeichne r0 (m) die Anzahl an Darstellungen von m als m = xk1 + · · · + xks mit 1 ≤ xi ≤ P. Ist P ≥ [N 1/k ], wobei [ · ] wieder die Gaußklammer bezeichne, so ist r0 (N ) die gesamte Anzahl an Darstellungen von N in der Form (5.1). Also gilt r0 (N ) = r(N ). Multiplizieren wir beide Seiten von (5.2) mit e(−N α) und integrieren über das Intervall [0, 1] bzw. jedes beliebige Intervall der Länge 1, so erhalten wir r(N ) = Z 1 (T (α))s e(−N α)dα. 0 Nun zerlegt man das Einheitsintervall in gewisse disjunkte Teilintervalle und schätzt den Integranden jeweilig ab. Die so genannten ’major arcs’ liefern den Hauptterm, während die ’minor arcs’ zum Fehlerterm beitragen. Details zu dieser so genannten Kreismethode bzw. Hardy-Littlewood-Methode finden sich in [1]. 28 Literatur [1] Harold Davenport. Analytic methods for Diophantine equations and Diophantine inequalities. Cambridge University Press, 2005. [2] Melvyn B Nathanson. Additive number theory: The classical bases, volume 164 of. Graduate Texts in Mathematics, 1996. [3] Paulo Ribenboim. The book of prime number records. Springer, 1988. 29 Erklärung Hiermit erkläre ich, dass ich die vorliegende Arbeit selbstständig verfasst und keine anderen als die angegebenen Quellen und Hilfsmittel verwendet und die Arbeit keiner anderen Prüfungsbehörde zur Erlangung eines akademischen Grades vorgelegt habe. Würzburg, den 16. Februar 2015 Martin, Leonie 30