Simon Feiler Die relative Verteilung der Inversen einer natürlichen Zahl zu variablen Moduln Dissertation zur Erlangung des Doktorgrades der Fakultät für Mathematik und Physik der Albert–Ludwigs–Universität Freiburg im Breisgau 31. Mai 2010 Gesetzt vom Autor unter LATEX Dekan: Gutachter: Gutachterin: Datum der Promotion: Prof. Dr. Kay Königsmann Prof. Dr. Dieter Wolke PD Dr. Karin Halupczok 03. August 2010 Danksagung Ich möchte mich bei Herrn Prof. Dr. D. Wolke für die Anregung und Betreuung meiner Dissertation bedanken. Ohne ihn wäre die Erstellung dieser Arbeit nicht möglich gewesen. Ein weiterer Dank geht an meine Zimmergenossen Yvonne Buttkewitz, Mathias Krieger und Karin Halupczok, die sowohl meinen Aufenthalt an der Universität versüßt, als auch einige fachliche Probleme (mitunter auch „triviale“ Dinge) mit mir diskutiert und mir damit bei der Erstellung der Arbeit geholfen haben. Ich danke weiterhin den Organisatoren und Mitgliedern der Kaffeerunde für die Möglichkeit, kurz aus der fachlichen Arbeit auszuspannen und sich mit anderen Themen zu befassen. Danke auch an Frau Monika Gilg für die Unterstützung bei der Organisation meiner Konferenzteilnahme bei „Analytic Number Theory“ in Göttingen, wo ich die in dieser Arbeit verwendeten Methoden der klassischen Zahlentheorie kurz vorstellen durfte. Für die hilfreichen Tipps zu Notationsabschnitt und dem Einstieg in Abschnitt 1 sowie die (nicht ganz so hilfreiche) Diskussion über typographische Details und Eigenheiten danke ich Thomas Klein. In erster Linie geht mein Dank aber an meine Eltern Johanna und Wolfgang, ohne die mein gesamtes Studium nicht möglich gewesen wäre, und an meine Frau Lena, die insbesondere auch die Korrekturlesung durchgeführt hat und (vor allem kurz vor der Fertigstellung der Arbeit) als mein personifiziertes schlechtes Gewissen aufgetreten ist. Alle drei haben mich stets nach Kräften unterstützt und so zur Fertigstellung (nicht nur) dieser Arbeit beigetragen. Danke! Inhaltsverzeichnis I Einleitung II Vorüberlegungen 1 Gleichverteilung . . . . . . . . . . . . . . . . . . 2 Allgemeine Überlegungen . . . . . . . . . . . . . a Rückführung auf ein Restklassenproblem . . . b Intervalle von zu a teilerfremden Zahlen . . . c Intervalle von zu a teilerfremden Primzahlen 5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 11 13 13 16 17 III Verwendung der expliziten Formel 3 Eine „explizite Formel“ . . . . . . . . . . . . . . . . . . . . . . . . . . . . a Herleitung der expliziten Formel . . . . . . . . . . . . . . . . . . . . b Verallgemeinerte Gauss’sche Summen . . . . . . . . . . . . . . . . . 4 Abschätzung der Nullstellensumme . . . . . . . . . . . . . . . . . . . . . a Realteil gleich oder kleiner als 12 . . . . . . . . . . . . . . . . . . . . b Realteil größer als 21 . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 Die Verteilung unter der verallgemeinerten Riemann’schen Vermutung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 23 23 26 29 31 34 46 IV Verwendung von Kloosterman–Summen und der Vaughan–Identität 6 Unvollständige Kloosterman–Summen . . . . . . . . . . . . . . . . . . . . . 7 Die Vaughan–Identität . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . a Abschätzung der beiden mittleren Terme der Vaughan–Identität . . . . . . b Abschätzung des letzten Terms aus der Vaughan–Identität . . . . . . . . . 8 Die Verteilung ohne verallgemeinerte Riemann’sche Vermutung . . . . . . . . . . . . . 57 57 64 66 70 81 . . . . . . . . . . . . . . . . 99 99 110 110 117 119 119 128 132 136 136 142 146 146 148 149 153 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Anhang A Die charakteristische Funktion 1α,β,ε,r . . . . . . . . . . . . B Nullstellen Dirichlet’scher L–Funktionen . . . . . . . . . a Übergang von N0 zu N in der expliziten Formel . . . . b Die vertikale Verteilung der Nullstellen Dirichlet’scher C Summen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . a Kontinuisierung der Nullstellensumme . . . . . . . . . . b Von Primzahlsummen zu von Mangold–Summen . . . c Abschätzungen für endliche Summen . . . . . . . . . . . D zu §7: Die Vaughan–Identität . . . . . . . . . . . . . . . . a Herleitung der Vaughan–Identität . . . . . . . . . . . . b Beweis von Bemerkung 7.7 . . . . . . . . . . . . . . . . E Einfache Ergebnisse . . . . . . . . . . . . . . . . . . . . . . a zu §1: Gleichverteilung . . . . . . . . . . . . . . . . . . . b Gegenseitige Invertierung . . . . . . . . . . . . . . . . . c Fourierreihen . . . . . . . . . . . . . . . . . . . . . . . d Von ψ ( · ; · , · ) zu π ( · ; · , · ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . L–Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Literaturverzeichnis Dissertation von Simon Feiler zum Thema Die relative Verteilung der Inversen einer natürlichen Zahl zu variablen Moduln . . . . . . . . . . . . . . . . 155 Seite 4 Notation Notation Mengen N N P H Menge der positiven ganzen Zahlen (N = N \ {0}) 0 Menge der nicht–negativen ganzen Zahlen (N0 = N ∪ {0}) Menge der Primzahlen Menge der komplexen Zahlen mit einem Realteil, der größer als 1 ist X Menge aller Dirichlet–Charaktere X0 Menge aller Dirichlet–Hauptcharaktere Xq Menge aller Dirichlet–Charaktere modulo q ∈ N Ax Menge aller Elemente der Menge A ⊆ R, die höchstens so groß wie x ∈ (Ausnahme: N0 ) R sind Funktionen Anzahl der Elemente einer höchstens abzählbaren Menge A Größte ganze Zahl, die höchstens so groß wie x ∈ R ist (Gauss–Klammer) Größter gemeinsamer Teiler von a ∈ Z und b ∈ Z \ {πa} Realteil einer komplexen Zahl z ∈ C Imaginärteil einer komplexen Zahl z ∈ C Konjugiert–Komplexes einer komplexen Zahl z ∈ C Dirichlet–Hauptcharakter modulo q ∈ N Dirichlet’sche L–Funktion zum Dirichlet–Charakter χ ∈ X bxc P χ (n) · Λ (n) für ein (χ, x)T ∈ X × R mit x ≥ 1 ψ (x, χ) #A bxc ggT (a, b) Re (z) Im (z) z̄ χ0,q L ( · , χ) n=1 ψ (x; q, `) bxc P n=1 n≡` (mod q) Λ (n) für ein (x, q, `)T ∈ R × N × Z mit x ≥ 1 π (x; q, `) # { p ∈ Px | p ≡ ` (mod q)} für ein (x, q, `)T ∈ R × N × Z mit x ≥ 1 e (α) e2πi·α = exp (2πi · α) = cos (2π · α) + i · sin (2π · α) für ein α ∈ R Landau–Symbolik A → C x 7→ f (x) B → C x 7→ g (x) Für drei Mengen A, B und C, drei Funktionen f : ,g: C → C und h : , sowie eine Menge D ⊆ A ∩ B ∩ C bedeuten x 7→ h (x) f = g + O (h) auf D oder f (x) = g (x) + O (h (x)) für alle x ∈ D, dass es eine Konstante C ∈ R+ ∪ {0} mit |f (x) − g (x)| ≤ C · h (x) für alle x ∈ D gibt (in diesem Fall muss h (x) ∈ R+ ∪ {0} für alle x ∈ D gelten) bzw. N → D f (x) = g (x) + o (h (x)) für x → x0 , dass für alle Folgen y : mit n 7→ yn f (yn ) − g (yn ) lim yn = x0 und h (yn ) 6= 0 für alle n ∈ N gerade lim = 0 ist. n→∞ n→∞ h (yn ) Kapitel I Einleitung Diese Arbeit beschäftigt sich mit der relativen Verteilung von Inversen einer fest vorgegebenen Zahl in verschiedenen endlichen multiplikativen Untergruppen von Z. Dabei bedeutet „relative Verteilung“, dass der Betrag des kleinsten positiven Inversen ins Verhältnis zur Gruppenstärke gesetzt wird. Der Text ist unterteilt in Absätze, in denen Sachverhalte anschaulich erklärt oder verdeutlicht werden, und Teile, in denen mathematisch und formal korrekt gearbeitet wird. Die Veranschaulichungen sind durch einen schwarzen Strich am linken Seitenrand gekennzeichnet. Um den Weg, auf dem die Ergebnisse erzielt werden, nachvollziehen zu können, genügt es völlig, lediglich die Passagen ohne diese Markierung zu studieren. Diese Vorgehensweise wird allerdings nicht empfohlen. An dieser Stelle sollen nun die oben angegebenen „Inversen“ präzise definiert werden. Definition (Multiplikative Inverse in Z) Sei o ( n ) (m, r)T ∈ Z2 r 6= 0 und ggT (m, r) = 1 → N ? : (n, q)T 7→ n?q derart, dass für alle n ∈ Z und alle q ∈ Z \ {0} mit ggT (n, q) = 1 1 ≤ n?q ≤ |q| und n · n?q ≡ 1 (mod |q|) gilt. Die Frage, aus der diese Arbeit entstand, lässt sich folgendermaßen formulieren: Wie ist für eine fest vorgegebene Zahl a ∈ N \ {1} und eine gegebene Menge M ⊆ {om ∈ N \ {1}| ggT (a, m) = 1} die Menge n ? am m ∈ (0; 1) m ∈ M im Einheitsintervall (0; 1) verteilt? Man stellt relativ schnell fest, dass eine Gleichverteilung, wie sie 1916 von H. Weyl im Artikel „Über die Gleichverteilung von Zahlen mod Eins“ (siehe [We]) definiert wird, bei keiner unendlichen Modulmenge auftreten kann. Dieses Ergebnis wird in Satz 1.4 auf Seite 13 formuliert. Der Hauptteil dieser Arbeit widmet sich der Fragestellung auf der nächsten Seite: „Es seien auf der Geraden der reellen Zahlen unendlich viele Punkte α1 , α2 , α3 , · · · markiert; wir rollen die Gerade auf einen Kreis vom Umfange 1 auf und fragen, ob dabei die an den Stellen αn befindlichen Marken schließlich den Umfang des Kreises überall gleich dicht bedecken.“ (H. Weyl in [We]) Seite 6 Einleitung In welchem Verhältnis müssen eine natürliche Zahl a ∈ N \ {1} und eine reelle Zahl x ∈ R mit n x ≥ 2 stehen, damit die Verteio a?p lung der Elemente der Menge ∈ (0; 1) p ∈ P und p ≤ x p im Einheitsintervall einer Gleichverteilung ähnelt? Eine kurze Analyse der Inversenbildung ? sich liefert, dass die Werte von amm Bildlich gesprochen gibt es also ϕ (a) ? „Töpfe“, auf die die Werte von amm N, j ≤ a und verteilt werden können. Damit ergibt sich eine weitere mögliche Fragestellung: N m∈ \{1} j a an den Stellen mit j ∈ ggT (a, j) = 1 „häufen“. m∈M Wie gleichmäßig sind für eine fest vorgegebene Zahl a ∈ N \{1}, gegebene Schranken w ∈ R und x ∈ R mit 1 ≤ w < x sowie eine gegebene Menge Mn ⊆ { m ∈ N\ {1}| ggT (a, m) = 1} dieo Ele? mente der Menge amm ∈ (0; 1) m ∈ M und w < m ≤ x auf die verschiedenen „Töpfe“ verteilt? In dieser Fragestellung ist bereits die Regelmäßigkeit der „Befüllung“ der einzelnen Töpfe enthalten. Die ebenfalls interessante Frage nach der Gesamtverteilung erhält man mit w := 1 im Grenzfall x → ∞. Wählt man für M alle zu a teilerfremden natürlichen Zahlen (außer der 1), so kommt man sehr schnell darauf, dass sich der „Füllstand“ zweier verschiedener Töpfe stets um maximal 1 unterscheidet. Genaueres findet sich in Satz 2.5 auf Seite 16. Im Falle der zu a teilerfremden Primzahlen ist es möglich, den Primzahlsatz in Progressionen heranzuziehen. Ist das Verhältnis von a und x entsprechend dessen Voraussetzungen gegeben, so erhält man eine Aussage, die in ihrer Qualität der Qualität des Primzahlsatzes entspricht. Das ist nicht sehr befriedigend. Um auf die Frage nach einer „Quasi– Gleichverteilung“ zurückzukommen, wird zunächst ein Teilintervall von (0; 1) betrachtet, welches keinen der Töpfe „zerschneidet“ † sprich: „I. M. Vinogradov“ (das heißt, ein Topf gehört entweder ganz oder gar nicht zu diesem Teilintervall). Es werden also α ∈ R+ und β ∈ R+ mit 0 < α < β < 1 gewählt, die außerhalb der Töpfe liegen. Die Betrachtung beschränkt sich dann auf das Intervall (α; β]. Ziel ist es, zu zeigen, dass die Anzahl der Folgenglieder innerhalb dieses Teilintervalls in etwa dem (β − α)–fachen der insgesamt zur Verfügung stehenden Folgenglieder entspricht. Mit Hilfe der Fourier–Entwicklung einer von I. M. Vinogradov† in seinem Buch „The method of trigonometrical sums in the theory of numbers“ (siehe [Vi]) vorgestellten Funktion (siehe Anhang A) wird das Problem auf die Berechnung einer Exponentialsumme mit Summationsindizes aus Z zurückgeführt. Der Summand mit dem Index 0 liefert bereits den erwarteten Hauptterm, so dass die Beiträge der anderen Summanden als Fehlerterm erkannt werden müssen. Einleitung Seite 7 Diese Arbeit nähert sich den anderen Summanden auf zwei verschiedenen Wegen. Auf dem ersten Weg führen die Verwendung der sogenannten „expliziten Formel“ für die Funktion ψ ( · , · ) und eine Abschätzung der dabei entstehenden Summe über die Nullstellen der Dirichlet’schen L–Funktionen zu den Dirichlet–Charakteren modulo a zum Ziel. Nimmt man die verallgemeinerte Riemann’sche Vermutung an, so erhält man hierbei ein Ergebnis, das widerum vergleichbar mit dem Primzahlsatz in Progressionen ist, der durch Verwendung der verallgemeinerten Riemann’schen Vermutung entsteht (siehe Satz 5.7 auf Seite 52). Ohne die Annahme der verallgemeinerten Riemann’schen Vermutung ergibt sich ein we- sentlich schlechteres Ergebnis, das zudem von dem Resultat, das sich auf dem zweiten Weg ergibt, erheblich in den Schatten gestellt wird. Dieser zweite Weg führt über eine Abschätzung von unvollständigen Kloosterman–Summen, die in ähnlicher Art bei C. Hooley („Applications of sieve methods to the theory of numbers“, siehe [Ho]) zu finden ist, und über die Vaughan–Identität (siehe Anhang D). R. C. Vaughan stellt diese nach ihm benannte Methode zum Beispiel in „An elementary method in prime number theory“ (siehe [Va]) vor. Man gelangt nach umfangreichen Abschätzungen zu einem nichtlinearen Ungleichungssystem in mehreren Variablen, dessen Optimierung auf die folgende Aussage führt: Sind a ∈ N \ {1}, α ∈ R+ , β ∈ R+ mit 0 < α < β < 1 und ε ∈ R+ mit ε < min {2α; 2 − 2β; β − α} derart vorgegeben, dass keiner der oben erwähnten „Töpfe“ mit α − 2ε ; α + 2ε oder β − 2ε ; β + 2ε ein gemeinsames Element besitzt, so existiert ein 6 2 δ0 ∈ R+ mit δ0 ≥ 51 , so dass für alle (δ, ς, κ, C, D, x)T ∈ (R+ ) 2 mit δ < δ0 , ς > 6, κ > 8, x ≥ 2 und Cxςδ ≤ a ≤ Dx 3 −κδ a?p # p ∈ P p ≤ x, ggT (a, p) = 1 und ∈ (α; β] p = (β − α) · # { p ∈ P| p ≤ x und ggT (a, p) = 1} q |ln (ln (x))| · ln3 (x) · x1−δ + OC,D,δ,ς,κ ε2 gilt, wobei „OC,D,δ,ς,κ “ bedeuten soll, dass die O–Konstante von δ, ς, κ, C und D abhängen kann. Da # { p ∈ P| p ≤ x und ggT (a, p) = 1} x ist, im Wesentlichen von der Ordnung ln(x) kann der O–Term dieser Aussage durchaus als Fehlerterm erkannt werden. Lediglich die Einschränkung Cxςδ ≤ a verhindert also die Folgerung, dass die betrachtete Menge gleichverteilt im Einheitsintervall ist. Wie oben erwähnt muss allerdings eine Einschränkung dieser Art existieren. Die Aussage, die sich auf dem ersten Weg mit Annahme der verallgemeinerten Riemann’schen ergibt, entspricht der gerahmten Aussage mit der Ausnahme, dass alle δ ∈ R+ , alle C ∈ R+ , alle D ∈ R+ und alle x ∈ R+ mit x ≥ 2 und Cxδ ≤ a ≤ Dx1−2δ zugelassen werden. Hier werden also ς und κ nicht benötigt. Außerdem hängt die O– Konstante in diesem Fall nicht von δ ab. Seite 8 Ist man lediglich an einem Fehlerterm inx teressiert, der o ln(x) ist, so kann man mit der ersten Methode eine entsprechend angepasste Aussage sogar für alle C ∈ R+ , alle D ∈ R+ und alle x ∈ R+ mit x ≥ 2 und C · ln (x) ≤ a ≤ D · ln8x(x) erreichen. Interessant bleiben die Fragen, ob die obe2 ren Grenzen Dx 3 −κδ , Dx1−2δ und D · ln8x(x) noch verbesserbar sind, beziehungsweise ob man auch ohne Verwendung der verallgemeinerten Riemann’schen Vermutung mit a beliebig nah an x herankommen kann. Desweiteren können möglicherweise bessere Resultate erreicht werden, wenn man die Aussage nicht für alle a ∈ N \ {1}, die ein bestimmtes Größenverhältnis zu x einhalten, anstrebt, sondern lediglich an einer „fast alle“–Aussage oder an einer Mittelung über verschiedene a interessiert ist. Zuguterletzt könnte man ein Maß auf [0; 1) einführen, das außerhalb der Töpfe verschwindet und testen, ob die Folge der relativen Inversen bezüglich dieses Maßes gleichverteilt ist. Um diese Aspekte auch noch zu beleuch- 1 Einleitung ten, wäre allerdings vermutlich wesentlich mehr Raum vonnöten, als diese Arbeit bietet. In der Fachliteratur findet sich nur wenig zu dem angegebenen Thema. Meist werden nur Ergebnisse zu verwandten Themen erreicht. So beschäftigen sich zum Beispiel W. Zhang (et. al.)1 oder auch C. I. Cobeli, S. M. Gonek, M. Vâjâitu und A. Zaharescu2 weitgehend mit der Inversenbildung bzw. den Lösungen einer linearen Kongruenz modulo eines festen Moduls, während zum Beispiel W. Duke, J. B. Friedlander und H. Iwaniec3 oder C. Hooley4 sich mit den Lösungen von Kongruenzgleichungen zu höhergradigen Polynomen bei variablem Modul widmen. Diese Einleitung schließt nun mit einem Überblick über die einzelnen Paragraphen der vorliegenden Arbeit. Kapitel II enthält die Schritte, die zur Exponentialsumme führen. In §1 (Gleichverteilung) wird kurz auf die Gleichverteilung im Weyl’schen Sinne eingegangen. „General Kloosterman Sums and the Difference Between an Integer and Its Inverse Modulo Q“, H. Liu und W. Zhang, Acta Mathematica Sinica, English Series 23 (2007), Seiten 77 bis 82 oder „On the Difference between an Integer and Its Inverse Modulo n“, W. Zhang, Journal of Number Theory 52 (1995), Seiten 1 bis 6 oder „A generalization on the difference between an integer and its inverse modulo q (II)“, T. Zhang und W. Zhang, Proceedings of the Japan Academy (Series A) 81 (2005), Seiten 7 bis 11 oder „On the distribution of inverse modulo p (II)“, W. Zhang, Acta Arithmetica 100 (2001), Seiten 189 bis 194 2 „The distribution of patterns of inverses modulo a prime“, C. I. Cobeli, S. M. Gonek und A. Zaharescu, Journal of Number Theory 101 (2003), Seiten 209 bis 222 oder „Distribution of gaps between the inverses mod q“, C. I. Cobeli, M. Vâjâitu und A. Zaharescu, Proceedings of the Edinburgh Mathematical Society 46 (2003), Seiten 185 bis 203 3 „Equidistribution of roots of a quadratic congruence to prime moduli“, W. Duke, J. B. Friedlander und H. Iwaniec, Annals of Mathematics 141 (1995), Seiten 423 bis 441 4 „On the number of divisors of quadratic polynomials“, C. Hooley, Acta Mathematica 110 (1963), Seiten 97 bis 114 oder „On the distribution of the roots of polynomial congruences“, C. Hooley, Mathematika 11 (1964), Seiten 39 bis 49 Einleitung Die oben erwähnten „Töpfe“ werden in §2 (Allgemeine Überlegungen) zunächst definiert. Sie ergeben sich aus der für alle a ∈ N und alle m ∈ N mit ggT (a, m) = 1 gültigen Formel a?m m?a 1 + =1+ . m a am Die? Frage nach der Verteilung der Brüche amm mit m ∈ M auf die einzelnen Töpfe lässt sich damit auf ein Restklassenproblem zurückführen. Besteht M aus den zu a teilerfremden natürlichen Zahlen (ohne die 1) oder den zu a teilerfremden Primzahlen oder jeweils dem Schnitt einer dieser Mengen mit einem Intervall, so lässt sich die Frage direkt, beziehungsweise unter Verwendung des Primzahlsatzes in Progressionen lösen. §2 enthält in Teilabschnitt c außerdem die Hinführung auf die Exponentialsumme mit Hilfe der Vinogradov† ’schen Funktion. In Kapitel III wird diese Exponentialsumme dann mit Hilfe der in §3 (Eine „explizite Formel“) zunächst hergeleiteten expliziten Formel abgeschätzt. In dieser expliziten Formel treten einerseits Summen auf, die als Verallgemeinerung der sogenannten Gauss’schen Summen interpretiert werden können, und andererseits stößt man auf eine Summe über alle Nullstellen von Dirichlet’schen L–Funktionen zu den Dirichlet–Charakteren modulo a. Da die in dieser Arbeit verwendeten Ergebnisse bezüglich der verallgemeinerten Gauss’schen Summen weitgehend bekannt sind, werden diese direkt an die Herleitung der expliziten Formel angeschlossen. Eine ausführliche Herleitung der Ergebnisse findet sich in „Cambridge studies in advanced mathematics 97 — Multiplicative Number Theory I. Classical Theory“ von H. L. Montgomery und R. C. Vaughan (siehe [MV]). §4 (Abschätzung der Nullstellensumme) beschäftigt sich dann mit der Summe über † sprich: „Vinogradov“ Seite 9 die Nullstellen der Dirichlet’schen L– Funktionen. Die Summe wird dabei in zwei Teile aufgespalten. Während der Teil zu den Nullstellen, deren Realteil nicht über 21 hinaus geht, diskret abgeschätzt wird, scheint bei den Nullstellen mit größerem Realteil eine kontinuierliche Abschätzung vonnöten zu sein. Dabei wird die Summe in ein Doppelintegral über Real– und Imaginärteil umgewandelt, dessen Integrand mit Hilfe von Nullstellen–Dichtesätzen zu den Dirichlet’schen L–Funktionen abgeschätzt werden kann. Das resultierende Lemma 4.9 bezieht in seiner Formulierung eine mögliche Verbesserung der Nullstellen– Dichtesätze (zum Beispiel in Richtung der sogenannten Dichte–Hypothese) bereits mit ein. In §5 (Die Verteilung unter der verallgemeinerten Riemann’schen Vermutung) werden die Abschätzungen von Nullstellensumme und Gauss’schen Summen kombiniert und auf die Exponentialsumme angewandt. Im Falle der Gültigkeit der verallgemeinerten Riemann’schen Vermutung kann dabei das Ergebnis zu den Nullstellen mit Realteil größer als 12 ignoriert werden, was zu der oben angegebenen Modifikation der gerahmten Aussage führt. §5 schließt mit einer kurzen Bemerkung über die Möglichkeiten dieser Methode im unbedingten Fall. In Kapitel IV werden Abschätzungen von unvollständigen Kloosterman–Summen und die Vaughan–Identität verwendet, um die Exponentialsumme abzuschätzen. Die Kloosterman–Summen werden in §6 (Unvollständige Kloosterman– Summen) abgeschätzt. Die Ergebnisse können in gewissem Sinne als Verfeinerung der oben angesprochenen Abschätzungen von C. Hooley (siehe [Ho]) verstanden werden. Seite 10 In §7 (Die Vaughan–Identität) werden dann die Terme abgeschätzt, die auftreten, wenn man die Vaughan–Identität auf die Exponentialsumme anwendet. Einer dieser Terme wird trivial abgeschätzt, während in zwei weiteren der Terme direkt unvollständige Kloosterman– Summen auftreten, auf die die Ergebnisse aus §6 anwendbar sind. Der letzte Term hingegen bereitet noch einige Schwierigkeiten. Nach Anwendung der Hölder’schen Ungleichung lässt sich mit einigem Aufwand dann aber auch hier ein hinreichend gutes Ergebnis erzielen. Den Schlusspunkt der Arbeit markiert §8 (Die Verteilung ohne verallgemeinerte Riemann’sche Vermutung). Zunächst wird die Abschätzung der Vaughan–Terme auf die Exponentialsumme übertragen. Bringt man das Resultat mit den Ergebnissen aus §2 zusammen und fordert, dass der Feh- Einleitung lerterm O x1−δ für ein δ ∈ R+ sein soll, so ergibt sich ein Ungleichungssystem mit fünf zu wählenden Parametern und im Wesentlichen vier Ungleichungen. Die optimale Wahl der Parameter hängt dabei auch von dem Verhältnis von a und x ab. Unter Anderem deshalb muss für diese Optimierung noch ein wenig Aufwand betrieben werden. Vor dem Literaturverzeichnis findet sich ein recht umfangreicher Anhang. In diesem sind allerdings lediglich die Beweise einiger leicht einsichtiger Aussagen im Text aufgeführt, deren Einfügung an der entsprechenden Stelle den Lesefluss erheblich behindern würde. Auch findet sich dort die Herleitung von Zusammenhängen, die einem Leser, der sich bereits tiefer mit analytischer Zahlentheorie beschäftigt hat, bereits bekannt oder zumindest unmittelbar einsichtig sein müssten. Kapitel II Vorüberlegungen §1: Gleichverteilung Die erste Frage, die man sich mit Bezug auf die Verteilung einer abzählbaren Menge M ⊆ [0; 1) im Einheitsintervall [0; 1) stellen kann, ist die, ob M im Einheitsintervall gleichverteilt ist. Für „Gleichverteilung“ wird dabei die Definition von H. Weyl verwendet. Definition 1.1 (Gleichverteilung) N → [0; 1) Die Werte einer Folge x : heißen gleichverteilt im Intervall [0; 1), wenn für n 7→ xn alle α ∈ R und alle β ∈ R mit 0 ≤ α < β < 1 gilt: lim n→∞ # { m ∈ N| m ≤ n und xm ∈ [α; β)} = β − α. n Ein wirksames Kriterium zum Testen einer beliebigen abzählbaren Teilmenge des Einheitsinvalls auf Gleichverteilung ist das sogenannte Weyl–Kriterium. Hilfssatz 1.2 (Weyl–Kriterium) Behauptung: Die Werte von x : N → [0; 1) n 7→ xn vall [0; 1), wenn für alle h ∈ Z \ {0} N X sind genau dann gleichverteilt im Inter- e (h · xn ) = o (N ) für N → ∞ n=1 ist. Referenz: Siehe [We, Satz 1 auf Seite 315]5 . X so verstandene n Eine o Gleichverteilung lässt sich für a ∈ N \ {1} selbstverständlich nur auf a?m m ∈ (0; 1) m ∈ M anwenden, wenn M ⊆ { m ∈ N \ {1}| ggT (a, m) = 1} abzählbar unendlich ist (später wird offenbar, dass für m ∈ N und n ∈ N mit ggT (a, m) = 1, ggT (a, n) = 1 ? ? und m 6= n stets amm 6= ann gilt). n ? o Ziel dieses Paragraphen ist es, zu zeigen, dass amm ∈ (0; 1) m ∈ M für ein beliebiges a und abzählbar unendliches M nicht gleichverteilt in [0; 1) ist. ! X a? m Um dieses Ziel zu erreichen, kann man zum Beispiel Re e h· für genügend m m∈Mn große n ∈ N und mindestens ein h ∈ Z \ {0} nach unten abschätzen. 5 „Über die Gleichverteilung von Zahlen mod. Eins“, H. Weyl, Mathematische Annalen 77 (1916), Seiten 313 bis 352, Satz 1 auf Seite 315. Seite 12 Vorüberlegungen Lemma 1.3 (Untere Abschätzung für Re P e ga · a?m m ) Voraussetzungen: Seien a ∈ N \ {1}, M ⊆ { m ∈ N \ {1}| ggT (a, m) = 1} mit #M = ∞ und g ∈ Z \ {0}. Behauptung: Es gibt ein nur von g und M abhängiges n0 (g, M) ∈ N mit n a? #Mn X Re e ga · m ≥ m 4 m=2 m∈M für alle n ∈ N mit n ≥ n0 (g, M). Der unten aufgeführte Beweis führt zur Konstanten 14 . Durch Vergrößerung von n0 (g, M) kann diese Konstante aber beliebig nah an 1 heranrücken. ? g Die Idee des Beweises lässt sich folgendermaßen beschreiben: Wegen e ga · amm = e m für alle g ∈ Z \{0} und alle m ∈ M werden in der Summe die g–ten Einheitswurzeln modulo m addiert. Mit wachsendem m nähern diese sich auf dem Einheitskreis immer mehr der 1, so dass ihr Realteil irgendwann (abhängig von g) größer als 21 werden muss. Wenn die Anzahl der Summanden mit Realteil größer als 12 groß genug ist, ergibt sich die Behauptung. Die benötigte Anzahl der Summanden hängt selbstverständlich von M ab. Beweis: (i) Abschätzung des Realteils der „meisten“ Summanden Für alle m ∈ M gibt es ein hm ∈ Z mit a?m · a = 1 + hm · m. Damit folgt für alle m ∈ M g g a? 1 + hm · m e ga · m = e g · =e + ghm = e . m m m m Sei Mg := 6 · |g|. Dann gilt für alle m ∈ M mit m ≥ Mg π 1 g a?m g Re e ga · = Re e2πi· m = cos 2π · ≥ cos = . m m 3 2 (ii) Definition von n0 (g, M) und Nachweis der Behauptung Seien Mg −1 X a?m Σg,M := e ga · , m m=2 m∈M ∆Mg ∈M ( 1, falls Mg ∈ M, := 0, falls Mg ∈ / M, Rg,M := Re (Σg,M ) + und ∆Mg ∈M #MMg − 2 2 (1.1) §2: Allgemeine Überlegungen Seite 13 n0 (g, M) := min {n ∈ N |n ≥ Mg und #Mn ≥ −4 · Rg,M }. Dann folgt für alle n ∈ N mit n ≥ n0 (g, M) n n ? X am a?m X e ga · Re Re e ga · = Re (Σg,M ) + m m m=2 m∈M (1.1) ≥ Re (Σg,M ) + m=Mg m∈M n X m=Mg m∈M = Re (Σg,M ) + 1 2 1 · #Mn − #MMg + ∆Mg ∈M 2 1 · #Mn + Rg,M 2 1 1 ≥ · #Mn − · #Mn . 2 4 = X 1.3 zeigt in n Lemma o Verbindung mit dem Weyl–Kriterium 1.2 direkt, dass die Menge a?m m ∈ (0; 1) m ∈ M für alle a ∈ N \ {1} und alle M ⊆ { m ∈ N \ {1}| ggT (a, m) = 1} mit #M = ∞ nicht gleichverteilt in [0; 1) ist. Ein ausführlicher Beweis findet sich in Teilabschnitt a von Anhang E ab Seite 146. Satz 1.4 Voraussetzungen: Seien a ∈ N \ {1} und M ⊆ { m ∈ N \ {1}| ggT (a, m) = 1} mit #M = ∞. Behauptung: a?m ∈ (0; 1) m ∈ M ist nicht gleichverteilt im Intervall [0; 1). m §2: Allgemeine Überlegungen a: Rückführung auf ein Restklassenproblem n ? o Nachdem klar ist, dass die Menge amm ∈ (0; 1) m ∈ M für beliebiges a ∈ N \ {1} und M ⊆ { m ∈ N \ {1}| ggT (a, m) = 1} mit #M = ∞ nicht im Weyl’schen Sinne gleichverteilt im Einheitsintervall ist, istndie Frage nach selbstverständlich noch nicht der Verteilung o a?m beanwortet. Das Arbeiten mit m ∈ (0; 1) m ∈ M selbst stellt sich aber auf Grund der fehlenden Kenntnis über die Werte von ? als eher mühsam heraus. Mit Hilfe des folgenden Lemmas kann man diese Mühe umgehen, wenn man nur an der Verteilung der Werte und nicht an jedem einzelnen Wert interessiert ist. Der Beweis des Lemmas besteht im Prinzip aus direktem Nachrechnen und findet sich in Teilabschnitt b von Anhang E ab Seite 148. Dissertation von Simon Feiler zum Thema Die relative Verteilung der Inversen einer natürlichen Zahl zu variablen Moduln Seite 14 Vorüberlegungen Lemma 2.1 (Gegenseitige Invertierung) Voraussetzungen: Seien a ∈ N \ {1} und m ∈ N \ {1} mit ggT (a, m) = 1. Behauptung: Dann gilt a?m a − m?a 1 = + . m a am n ? o Dieses Lemma ermöglicht, amm ∈ (0; 1) m ∈ N \ {1} und ggT (a, m) = 1 mit einer natürlichen Zahl a ∈ N \ {1} auf eine andere Art darzustellen. Der Darstellung a − m?a 1 + ∈ (0; 1) m ∈ M a am lässt sich leichter entnehmen, welche Werte für M ⊆ { m ∈ N \ {1}| ggT (a, m) = 1} in der Menge enthalten sind. i 1 j+1 ; a mit j ∈ Na−1 auf keinen So werden zum Beispiel die Intervalle 0; a1 und aj + 2·a Fall getroffen.Für alle j ∈ Nia−1 mit ggT (j, a) 6= 1 oder M ∩ (−ja? + aZ) = ∅ kann man sogar 1 j+1 das Intervall j−1 ausschließen. a + 2·a ; a Die möglichen Zielintervalle werden in der nächsten Definition festgehalten. Definition 2.2 (Zielintervalle) In dieser Definition seien a ∈ N \ {1} und M ⊆ { m ∈ N \ {1}| ggT (m, a) = 1} beliebig. a) Sei Ja,M := {j ∈ N |j ≤ a, ggT (j, a) = 1 und M ∩ (−ja? + aZ) 6= ∅ }. j j 1 b) Für alle j ∈ Ja,M sei Ij;a,M := ; + . a a a · min {m ∈ M |m?a = a − j } [ c) Sei Wa,M := Ij;a,M . j∈Ja,M Für a ∈ N \ {1} und M ⊆ { m ∈ N \ {1}| ggT (m, a) = 1} sammelt Ja,M diejenigen natürlichen Zahlen, die kleiner als a und Zähler vonn Brüchen mit Nenner o a sind, in deren a?m unmittelbarer Umgebung sich Elemente der Menge m ∈ (0; 1) m ∈ M befinden können. Für jedes j ∈ Ja,M werden dann durch Ij;a,M diese Umgebungen genauer spezifiziert. Der linke Randpunkt wird lediglich aus technischen Gründen zu Ij;a,M hinzugenommen. Korollar 2.3 Voraussetzungen: Seien a ∈ N \ {1} und M ⊆ { m ∈ N \ {1}| ggT (m, a) = 1}. Behauptung: Für alle m ∈ M ist und es ist a?m m a?m ∈ Ia−m?a ;a,M m ∈ (0; 1) m ∈ M ⊆ Wa,M . §2: Allgemeine Überlegungen Seite 15 Beweis: Die Behauptung folgt direkt aus Lemma 2.1 auf der vorherigen Seite und der Definition von Ij;a,M mit j ∈ Ja,M . X lässt sich die Frage nach der Verteilung im Einheitsintervall der Elemente der Menge n Nun o a?m m ∈ (0; 1) m ∈ M für a ∈ N \ {1} und M ⊆ { m ∈ N \ {1}| ggT (m, a) = 1} in einem neuen Sinne formulieren: o n ? Wie viele Elemente der Menge amm ∈ (0; 1) m ∈ M befinden sich in welchem Intervall Ij;a,M mit j ∈ Ja,M ? Wie gleichmäßig findet die „Befüllung“ statt, sprich wie ist die Frage zu beantworten, wenn statt M die Menge der Elemente von M unterhalb einer Schranke betrachtet wird? Diese Frage lässt sich umformulieren und auf ein Restklassenproblem zurückführen. Lemma 2.4 Voraussetzungen: Seien a ∈ N \ {1}, M ⊆ { m ∈ N \ {1}| ggT (m, a) = 1} und j ∈ Ja,M . Behauptung: (i) Für alle m ∈ M ist a?m ∈ Ij;a,M ⇐⇒ m ≡ −ja? (mod a). m ? a (ii) Es ist # m ∈ M m ∈ Ij;a,M = # { m ∈ M| m ≡ −ja? (mod a)}. m Beweis: (i) Behauptung (i) Für alle m ∈ M ist m ≥ 2 und damit folgt für alle k ∈ Ja,M k 1 k 1 k+1 + ≤ + < . ? a a · min { m ∈ M| ma = a − k} a a·2 a Die Intervalle Ik;a,M mit k ∈ Ja,M sind damit disjunkt. Mit Korollar 2.3 auf der vorherigen Seite folgt für alle m ∈ M a?m ∈ Ij;a,M m ⇐⇒ j ≡ a − m?a (mod a) ⇐⇒ (ii) Behauptung (ii) Behauptung (ii) ist eine direkte Konsequenz von Behauptung (i). m ≡ −ja? (mod a). X Seite 16 Vorüberlegungen Damit ist für a ∈ N \ {1} nund M ⊆ {m ∈ N \o{1}| ggT (m, a) = 1} die Frage nach der ? Verteilung der Elemente von amm ∈ (0; 1) m ∈ M auf die Intervalle Ij;a,M mit j ∈ Ja,M auf die Frage nach der Verteilung der Elemente von M auf die zu a teilerfremden Restklassen zurückgeführt. b: Intervalle von zu a teilerfremden Zahlen Für a ∈ N \{1} und eine Menge M aufeinanderfolgender und zu a teilerfremder Zahlen kann mit Teilabschnitt a die Frage nach der Verteilung der „relativen Inversen“ auf die Intervalle Ij;a,M mit j ∈ Ja,M direkt beantwortet werden. n ? o In diesem Fall sind die Elemente von amm ∈ (0; 1) m ∈ M so gleichmäßig wie möglich auf die Intervalle Ij;a,M mit j ∈ Ja,M verteilt. Satz 2.5 Voraussetzungen: Seien a ∈ N \ {1}, w ∈ R mit w ≥ 1, x ∈ R mit x > w und M := {m ∈ N |ggT (a, m) = 1 und w < m ≤ x } . Behauptung: Für alle j ∈ Ja,M ist ? am bxc − bwc bxc − bwc # m ∈ M ∈ Ij;a,M ∈ ; +1 . m a a Ist bxc − bwc ≥ a, so ist Ja,M = { j ∈ N| j ≤ a und ggT (a, j) = 1}. Im Beweis wird M zunächst in reduzierte Restsysteme modulo a zerlegt, die aus aufeinanderfolgenden zu a teilerfremden Zahlen bestehen. Danach wird gezeigt, dass zu jedem der reduzierten Restsysteme genau ein relatives Inverses in je einem der Ij;a,M mit j ∈ Ja,M liegt. In jedem Intervall kommt von dem bei der Unterteilung übrig gebliebenen Reststück maximal ein relatives Inverses hinzu. Beweis: (i) Zerlegung von M Sei j ∈ Ja,M . Nach Lemma 2.4 auf der vorherigen Seite ist j X m∈M a? m ∈I j;a,M m 1= k bxc bxc bxc−bwc a X X X X `=0 m=bwc+`a+1 ggT(a,m)=1 m≡−ja? (mod a) m=bwc+1 ggT(a,m)=1 m≡−ja? (mod a) 1= j k bxc−bwc m=bwc+ ·a+1 a ggT(a,m)=1 m≡−ja? (mod a) 1+ −1 bwc+(`+1)·a 1. Wegen j ∈ Ja,M ist ggT (a, j) = 1. Damit folgt ggT (a, −ja? ) = 1 und für alle m ∈ m ≡ −ja? (mod a) ist deshalb ggT (a, m) = 1. Z mit §2: Allgemeine Überlegungen Seite 17 (ii) Berechnung der Doppelsumme Für alle ` ∈ Z ist bwc+(`+1)·a 1 = # {m ∈ N |bwc + `a < m ≤ bwc + (` + 1) · a und m ≡ −ja? X (mod a) } . m=bwc+`a+1 m≡−ja? (mod a) Für alle ` ∈ Z gibt es in der Menge { m ∈ N| bwc + `a < m ≤ bwc + (` + 1) · a} wegen (bwc + (` + 1) · a) − (bwc + ` · a) = a genau ein Element mj,` , das die Kongruenz mj,` ≡ −ja? (mod a) erfüllt. Es ergibt sich j bxc−bwc a k −1 j bwc+(`+1)·a X X `=0 m=bwc+`·a+1 ggT(a,m)=1 m≡−ja? (mod a) 1= bxc−bwc a X `=0 k −1 bxc − bwc . # {mj,` } = a (iii) Abschätzen der Restsumme Es gilt bxc − bwc bxc − bwc bxc − bwc + · a < bxc − bwc − − 1 · a = a. a a n j k o Deshalb gibt es in der Menge m ∈ N bwc + bxc−bwc · a < m ≤ bxc höchstens ein modulo a X a zu −ja? kongruentes Element. Intervalle N ovon zu a ∈ N \ {1} teilerfremden Zahlen sind die Werte von n Für a?m also so gleichmäßig wie möglich verteilt. Dabei ist die Größe von a m ∈ (0; 1) m ∈ N und ihr Verhältnis zu den Intervallgrenzen min N und max N unerheblich. c: Intervalle von zu a teilerfremden Primzahlen Wesentlich schwieriger gestaltet sich das Problem, wenn man ein Intervall von zu a ∈ N \{1} teilerfremden Primzahlen betrachtet. Der Primzahlsatz in Progressionen liefert nur für Intervalle, deren obere Grenze wesentlich größer als a ist, das gewünschte Ergebnis. Rest dieser Arbeit beschäftigt sich mit der o Lösung der Frage, inwiefern sich die Menge n Der a?p T 2 p ∈ (0; 1) p ∈ P, ggT (a, p) = 1 und w < p ≤ x mit (w, x) ∈ R und 1 ≤ w < x gleichmäßig auf das Einheitsintervall verteilt und wie für eine gleichmäßige Verteilung das Verhältnis von a zu den Intervallgrenzen w und x gewählt werden kann. Zunächst wird mit Hilfe einer auf I. M. Vinogradov† zurückgehenden Methode die a? Berechnung der Anzahl der pp mit p ∈ P und w < p ≤ x, die in einem Teilintervall des Einheitsintervalls liegen, auf die Berechnung einer Exponentialsumme zurückgeführt. Seite 18 Vorüberlegungen In den folgenden Kapiteln wird diese Exponentialsumme zunächst mit Hilfe einer expliziten Formel zur ψ–Funktion und später mit Hilfe der Vaughan–Identität abgeschätzt. Vinogradovs grundlegende Idee ist die Einführung einer Funktion, die auf dem Teilintervall [α; β] den Wert 1 und außerhalb den Wert 0 annimmt. Diese Funktion wird dann geglättet. Die Fourier–Koeffizienten der geglätteten Funktion sollen in geeigneter Weise beschränkt sein (siehe auch Lemma 12 in Chapter I von [Vi]). Da der Existenzbeweis für diese Funktion extrem umfangreich ist, aber keine interessanten Ideen enthält, wurde er in Anhang A ab Seite 99 verlegt. Definition 2.6 (Die Funktion 1α,β,ε,r ) Für alle r ∈ N, alle α ∈ R, alle β ∈ R und alle ε ∈ R+ mit 0 < α < β < 1 und R → R ε ≤ min {2α; 2 − 2β; β − α} sei 1α,β,ε,r : eine stetige Funktion mit x 7→ 1α,β,ε,r (x) (i) 1α,β,ε,r (x + 1) = 1α,β,ε,r (x) für alle x ∈ R, (ii) 1α,β,ε,r (x) = 1 für alle x ∈ R mit α + 2ε ≤ x ≤ β − 2ε , (iii) 1α,β,ε,r (x) = 0 für alle x ∈ R mit 0 ≤ x < α − 2ε oder β + 2ε < x < 1, Z1 (iv) 1α,β,ε,r (t) dt = β − α und 0 1 Z 1 rr (v) 1α,β,ε,r (t) · e (ht) dt ≤ r+1 r · r+1 für alle h ∈ Z \ {0}. π ε |h| 0 Kurz gesagt ist eine 1α,β,ε,r stetige, reellwertige und 1–periodische Funktion auf den reellen ε ε ε ε Zahlen, die auf α + 2 ; β − 2 den Wert 1 annimmt und auf [0; 1)\ α − 2 ; β + 2 verschwindet. Zusätzlich sind die Fourier–Koeffizienten von 1α,β,ε,r in geeigneter Weise beschränkt und die Integration von 1α,β,ε,r über eine Periode liefert den Wert β − α. Wichtig ist die Entwickelbarkeit von 1α,β,ε,r in eine Fourierreihe, deren Wert an jeder Stelle mit dem Wert von 1α,β,ε,r übereinstimmt. Der Beweis des folgenden Korollars findet sich in Teilabschnitt c von Anhang E ab Seite 149. Korollar 2.7 (Fourier–Entwickelbarkeit von 1α,β,ε,r ) Voraussetzungen: Seien r ∈ N, α ∈ R, β ∈ R und ε ∈ R+ mit 0 < α < β < 1 und ε ≤ min {2α, 2 − 2β; β − α}. Behauptung: Für alle x ∈ R ist 1 1α,β,ε,r (x) = XZ h∈ † sprich: „I. M. Vinogradov“ Z0 1α,β,ε,r (t) · e (−ht) dt · e (hx). §2: Allgemeine Überlegungen Seite 19 Damit lässt sich das in der Einleitung beschriebene Problem auf die Abschätzung einer Exponentialsumme zurückführen. Lemma 2.8 (Einführung der Exponentialsumme) Voraussetzungen: Seien a ∈ N \ {1}, P∗ := { p ∈ P| ggT (a, p) = 1}, r ∈ N, α ∈ R, β ∈ R und ε ∈ R+ mit α∈ / Wa,P∗ , β∈ / Wa,P∗ , und 0 < α < β < 1, ε ≤ min {2α; 2 − 2β; β − α} + ε < 2 · min |x − γ| ∈ R |x ∈ Wa,P∗ und γ ∈ {α; β} . Die Funktion 1α,β,ε,r ist in Abbildung 1 auf dem Einheitsintervall schematisch dargestellt. α, β und ε sind so gewählt, dass die Abschnitte, in denen 1α,β,ε,r andere Werte als 0 oder 1 annimmt, außerhalb von Wa,P∗ liegen. 1 6 Ij1 ;a,P∗ Abbildung 1: Ij2 ;a,P∗ α |{z} ε Ij3 ;a,P∗ Ij4 ;a,P∗ Ij5 ;a,P∗ β |{z} Ij ;a,P ∗ 6 ε - 1 1α,β,ε,r und Wa,P∗ mit den Voraussetzungen aus Lemma 2.8 Behauptung: Dann ist für alle x ∈ R und alle w ∈ R mit 1 ≤ w < x a?p ∈ (α; β] # p ∈ P w < p ≤ x, ggT (a, p) = 1 und p = (β − α) · # { p ∈ P| w < p ≤ x und ggT (a, p) = 1} 1 ? bxc X Z X hpa + 1α,β,ε,r (t) · e (ht) dt · e . a Z h∈ \{0} 0 p=bwc+1 p∈ ggT(a,p)=1 P Die Parameter in Lemma 2.8 sind so gewählt, dass 1α,β,ε,r für alle p ∈ P mit ggT (a, p) = 1 genau dann den Wert 1 liefert, wenn a?p p a?p p ∈ [α; β) liegt und genau dann den Wert 0 liefert, wenn ∈ / [α; β) enthalten ist. Die Behauptung folgt dann unmittelbar, wenn man 1α,β,ε,r durch ihre Fourierreihe ersetzt und am Ende ausnutzt, dass reelle Zahlen mit ihrem Konjugiert–Komplexen übereinstimmen. Seite 20 Vorüberlegungen Beweis: ? (i) Bedingung an paa Wegen α ∈ / Wa,P∗ , β ∈ / Wa,P∗ , j ∈ Ja,P∗ ε 2 < |x − α| und (A ∩ Ij;a,P∗ ) ∈ {∅, Ij;a,P∗ } α − 2ε ; α + 2ε ∩ Ij;a,P∗ = ∅ β − 2ε ; β + 2ε ∩ Ij;a,P∗ = ∅. für alle A ∈ ε 2 < |x − β| für alle x ∈ Wa,P∗ sind für alle α + 2ε ; β − 2ε ; 0; α − 2ε ; β + 2ε ; 1 , und Für alle p ∈ P mit ggT (a, p) = 1 folgt mit Lemma 2.1 auf Seite 14 a?p ∈ [α; β) p p?a 1 + ∈ α + 2ε ; β − 2ε a ap p?a 1− ∈ α + 2ε ; β − 2ε a p?a 1α,β,ε,r 1 − =1 a ⇐⇒ 1− ⇐⇒ ⇐⇒ und a?p ∈ / [α; β) p p?a 1 + ∈ [0; 1) \ α − 2ε ; β + 2ε a ap ? p 1 − a ∈ [0; 1) \ α − 2ε ; β + 2ε a p?a 1α,β,ε,r 1 − = 0. a ⇐⇒ 1− ⇐⇒ ⇐⇒ (ii) Beweis der Behauptung Mit Korollar 2.7 auf Seite 18 folgt für alle x ∈ R und alle w ∈ R mit 1 ≤ w < x a?p # p ∈ P w < p ≤ x, ggT (a, p) = 1 und ∈ [α; β) p bxc bxc X X p?a 1= = 1α,β,ε,r 1 − a p=bwc+1 p∈ ∗ p=bwc+1 p∈ ∗ P P a? p ∈[α;β) p = bxc X 1 XZ p=bwc+1 h∈ p∈ ∗ P Z0 p?a 1α,β,ε,r (t) · e (−ht) dt · e h · 1 − a 1 = XZ h∈ Z1 Mit 0 Z0 1α,β,ε,r (t) · e (ht) dt · bxc X p=bwc+1 p∈ ∗ P p?a e h· . a 1α,β,ε,r (t) · e (0 · t) dt = (β − α) folgt die Behauptung. X §2: Allgemeine Überlegungen Will man die letzte Zeile aus der Behauptung von Lemma 2.8 betraglich nach oben abschätzen, so bietet es sich an, zunächst die Dreiecksungleichung auf die äußere Summe anzuwenden. Danach ist es noch nötig, die Fourier–Koeffizienten von 1α,β,ε,r und die verbleibende Exponentialsumme abzuschätzen. Die Abschätzung der Fourier– Koeffizienten ist bereits bekannt. Die nächsten beiden Kapitel widmen sich der Abschätzung der Exponentialsumme. Zunächst werden die Summanden nach den reduzierten Restklassen modulo a sortiert. Damit erhält man eine Restklassensumme über das Produkt eines Exponentialterms mit der Funktion π ( · ; a, · ). Mit Hilfe von partieller Summation wird diese Summe in eine Summe über das Produkt des Exponentialterms mit der Funktion ψ ( · ; a, · ) überführt. Mittels einer expliziten Formel für ψ ( · ; a, · ), die gleichmäßig für alle reduzierten Restklassen gilt, lässt sich die Restklassensumme in eine Ramanujan–Summe Seite 21 verwandeln und so die gesamte Exponentialsumme abschätzen. Nimmt man die verallgemeinerte Riemann’sche Vermutung an, so lässt sich mit dieser Methode ein interessantes Ergebnis formulieren. Ein nur leicht schwächeres Ergebnis erhält man ohne Annahme der verallgemeinerten Riemann’schen Vermutung, wenn man die Exponentialsumme zunächst mit partieller Summation in eine lineare Summe über das Produkt der von–Mangoldt– Funktion mit dem entsprechenden Exponentialterm umwandelt. Die entstandene Summe kann dann mit Hilfe der Vaughan–Identität in geeignetem Maße abgeschätzt werden. Hierbei kommt außerdem eine Abschätzung von unvollständigen Kloosterman–Summen zum Tragen. Im nächsten Kapitel wird der Weg über die explizite Formel gewählt bevor im übernächsten Kapitel mit der Vaughan– Identität gearbeitet wird. Kapitel III Verwendung der expliziten Formel §3: Eine „explizite Formel“ In §3 soll zunächst eine explizite Formel für a X `=1 ggT(a,`)=1 e h`?a a · ψ (x; a, `) mit a ∈ N \ {1}, h ∈ Z, x ∈ R und x ≥ 2 hergeleitet werden. Danach werden bekannte Abschätzungen für die in der expliziten Formel auftretenden verallgemeinerten Gauss’schen Summen angegeben. a: Herleitung der expliziten Formel Als erstes Hilfsmittel werden die Charakterrelationen für Dirichlet–Charaktere benötigt. Bemerkung 3.1 (Charakterrelationen) Für alle q ∈ N, alle n ∈ Z und alle ` ∈ Z ist ( X ϕ (q) , falls n ≡ ` (mod q) und ggT (q, `) = 1 ist; χ̄ (`) χ (n) = 0, falls n 6≡ ` (mod q) oder ggT (q, `) > 1 ist. χ∈X q Für alle q ∈ N, alle χ1 ∈ Xq und alle χ2 ∈ Xq ist q X ( ϕ (q) , falls χ1 = χ2 ist; χ̄1 (`) χ2 (`) = 0, falls χ1 6= χ2 ist. `=1 Referenz: Siehe [Br, Satz 1.5.1 in Verbindung mit (1.56) auf Seite 34 der 1. Auflage]6 . X Mit Hilfe dieser Charakterrelationen lässt sich die erste Formel herleiten, die bei dem Beweis der expliziten Formel verwendet werden wird. Bemerkung 3.2 Für alle x ∈ R+ , alle q ∈ N und alle ` ∈ Z mit ggT (q, `) = 1 ist ψ (x; q, `) = X 1 · χ̄ (`) ψ (x, χ). ϕ (q) χ∈Xq 6 „Einführung in die analytische Zahlentheorie“, J. Brüdern, Springer (Berlin, Heidelberg — 1995), Satz 1.5.1 in Verbindung mit (1.56) auf Seite 34 der 1. Auflage Seite 24 Verwendung der expliziten Formel Beweis: Seien x ∈ R+ , q ∈ N und ` ∈ Z mit ggT (`, q) = 1. Mit den Charakterrelationen 3.1 auf der vorherigen Seite folgt bxc X ψ (x; q, `) = n≡` = Λ (n) = n=1 (mod q) bxc X Λ (n) · n=1 X 1 · χ̄ (`) χ (n) ϕ (q) χ∈Xq bxc X X X 1 1 χ (n) Λ (n) = · χ̄ (`) · · χ̄ (`) ψ (x, χ). ϕ (q) ϕ (q) n=1 χ∈Xq X χ∈Xq Das zweite Hilfsmittel zum Beweis der expliziten Formel ist die aus der Literatur bekannte explizite Formel für ψ ( · , χ) mit χ ∈ X . Um diese einfach wiedergeben zu können, werden nun ein paar Abkürzungen definiert. Definition 3.3 a) Sei X → {0; 1} ( 1, falls χ ∈ X ist ∆: 0 χ 7→ ∆χ := 0, falls χ ∈ / X0 ist die Dirichlet–Hauptcharakter–Indikatorfunktion. X → { D| D ⊆ C} und b) Seien N0 : χ 7→ N0 (χ) := { % ∈ C \ {0}| L (%, χ) = 0 und 0 ≤ Re (%) ≤ 1} N : X → { D| D ⊆ C} χ 7→ N (χ) := { % ∈ C| L (%, χ) = 0 und 0 < Re (%) < 1} Nullstellenmengenfunktionen zu den Dirichlet–Charakteren. c) Für alle q ∈ N, alle h ∈ Z und alle χ ∈ Xq sei τh (χ) := q X χ (`) e `=1 ggT(q,`)=1 h` q die h–te verallgemeinerte Gauss’sche Summe von χ. Die verallgemeinterten Gauss’schen Summen werden für die Formulierung der bekannten expliziten Formel zwar nicht benötigt, treten aber im darauffolgenden Lemma auf. Leider findet sich die bekannte explizite Formel in der Literatur nur in der Version, die Bezug auf N0 nimmt, also in der auch Nullstellen auf der imaginären Achse einbezogen werden. Da Nullstellen auf der Imaginärachse für das Folgende allerdings überaus störend sind, wird in Teilabschnitt a von Anhang B ab Seite 110 bewiesen, dass eine äquivalente explizite Formel gilt, in der nur die Nullstellen in N (χ) mit χ ∈ X betrachtet werden. Dissertation von Simon Feiler zum Thema Die relative Verteilung der Inversen einer natürlichen Zahl zu variablen Moduln §3: Eine „explizite Formel“ Seite 25 Hilfssatz 3.4 (Explizite Formel für ψ ( · , χ)) Voraussetzungen: Seien q ∈ N, χ ∈ Xq , x ∈ R und T ∈ R mit 1 ≤ T ≤ x. Behauptung: Es gibt eine von allen Parametern unabhängige Konstante C ∈ R+ mit X % x − 1 x 2 ψ (x, χ) − ∆χ x − ≤ C · T · ln (qx) . %∈N (χ) % |Im %|≤T Mittels dieser expliziten Formel und Bemerkung 3.2 lässt sich nun relativ schnell die ge ? a X h` wünschte explizite Formel für · ψ (x; a, `) gewinnen. e a `=1 ggT(a,`)=1 Dabei wird verwendet, dass das Konjugiert–Komplexe des Wertes eines Charakters modulo q ∈ N an einer Stelle ` ∈ Z mit ggT (q, `) = 1 gerade dem Wert des Charakters an dem Inversen `?q entspricht und dass die Inversen eines reduzierten Restsystems wieder ein reduziertes Restsystem bilden. Lemma 3.5 (Explizite Formel) Voraussetzungen: n o Seien a ∈ N \ {1} und D := (x, T )T ∈ R2 x ≥ 2 und 1 ≤ T ≤ x . Sei X ×D → C X x% − 1 T (χ, x, T ) → 7 R (x, T ) := ψ (x, χ) − ∆ x + R: χ χ % %∈N (χ) |Im(%)|≤T . Behauptung: Für alle (χ, x, T )T ∈ Xa × D ist Rχ (x, T ) = O x T · ln2 (ax) . Für alle h ∈ Z, alle x ∈ R mit x ≥ 2 und alle T ∈ R mit 1 ≤ T ≤ x ist a X e `=1 ggT(a,`)=1 = h`?a a · ψ (x; a, `) X τh (χ) τh (χ0,a ) ·x− · ϕ (a) ϕ (a) χ∈Xa X %∈N (χ) |Im %|≤T X τh (χ) x% − 1 + · Rχ (x, T ). % ϕ (a) χ∈Xa Beweis: Die erste Behauptung folgt direkt aus Hilfssatz 3.4. Sei h ∈ Z. Für alle ` ∈ Z mit ggT (a, `) = 1 gilt nach Bemerkung 3.2 auf Seite 23 ψ (x; a, `) = X 1 · χ̄ (`) ψ (x, χ). ϕ (a) χ∈Xa Seite 26 Verwendung der expliziten Formel Wegen χ̄ (`) = χ (`?a ) für alle ` ∈ Z mit ggT (a, `) = 1 und alle χ ∈ Xa folgt a X e `=1 ggT(a,`)=1 = h`?a a a X · ψ (x; a, `) e `=1 ggT(a,`)=1 = X 1 · ϕ (a) χ∈Xa h`?a a · X 1 · χ̄ (`) ψ (x, χ) ϕ (a) a X χ∈Xa e `=1 ggT(a,`)=1 h`?a χ (`?a ) · ∆χ x − a χ∈Xa x% − 1 + Rχ (x, T ) %∈N (χ) % |Im %|≤T X 1 · = ∆χ x − ϕ (a) X X a X |Im %|≤T `=1 ggT(a,`)=1 x% − 1 + Rχ (x, T ) · %∈N (χ) % | e {z h` a = τh (χ) da { `?a ∈ Na | ` ∈ Na mit ggT (a, `) = 1} = { ` ∈ Na | ggT (a, `) = 1} ist. χ (`), } X Um die rechte Seite in Lemma 3.5 weiter abschätzen zu können, muss man die verallgemeinerten Gauss’schen Summen und die Nullstellensumme genauer abschätzen. b: Verallgemeinerte Gauss’sche Summen Über die verallgemeinerten Gauss’schen Summen ist alles, was in dieser Arbeit benötigt wird, bereits bekannt. Dieser Teilabschnitt referiert die Ergebnisse und fasst sie in der gewünschten Form zusammen. Die verallgemeinerte Gauss’sche Summe zu einem Hauptcharakter wird auch Ramanujan–Summe genannt. Ihr Wert ist in kompakter Form angebbar. Bemerkung 3.6 (Ramanujan–Summen) Für alle h ∈ Z und alle q ∈ N ist τh (χ0,q ) = µ q ggT (q, |h|) ϕ (q) · ϕ q ggT(q,|h|) Referenz: Siehe [Br, Lemma 1.3.1. auf Seite 20 der 1. Auflage]7 . . X Für Nicht–Hauptcharaktere χ ∈ X hängt der Wert der verallgemeinerten Gauss–Summe stark von dem Charakter ab, von dem χ induziert wird. Es soll kurz darauf eingegangen werden, was das heißt. 7 „Einführung in die analytische Zahlentheorie“, J. Brüdern, Springer (Berlin, Heidelberg — 1995), Lemma 1.3.1. auf Seite 20 der 1. Auflage §3: Eine „explizite Formel“ Seite 27 Definition 3.7 (Führungszahl und primitive Charaktere) a) Für alle q ∈ N und alle χ ∈ Xq heißt min { r ∈ N| χ (`) = χ (` + r) für alle ` ∈ Z mit ggT (`, q) = 1} Führungszahl von χ. b) Für alle q ∈ N heißt ein χ ∈ Xq \ X0 primitiv, falls q die Führungszahl von χ ist. c) Seien Xprimitiv := { χ ∈ X | χ ist primitiv} und für alle q ∈ N Xq,primitiv := Xq ∩ Xprimitiv . Sei X1,primitiv := {χ0,1 } . Ein Charakter wird von einem Charakter induziert, falls der Modul des induzierdenden Charakters höchstens so groß ist, wie der Modul des induzierten Charakters, und wenn beide Charaktere an den Stellen, an denen der induzierte Charakter nicht verschwindet, dieselben Werte annehmen. Jeder nicht–primitive Nicht–Hauptcharakter wird von einem primitiven Charakter induziert. Bemerkung 3.8 Sind q ∈ N, χ ∈ Xq \ X0 und q1 ∈ N die Führungszahl von χ, so wird q von q1 geteilt und es gibt ein eindeutig bestimmtes χ1 ∈ Xq1 ,primitiv mit χ1 (`) = χ (`) für alle ` ∈ Z mit ggT (q, `) = 1. Referenz: Siehe [MV, Theorem 9.2 auf Seite 283]8 . X Für primitive Charaktere χ ∈ Xprimitiv ist der Betrag der Gauss’schen Summe τ1 (χ) gerade die Wurzel des Moduls. Lemma 3.9 (Gauss’sche Summen zu primitiven Charakteren) Voraussetzungen: Seien q ∈ N \ {1} und χ ∈ Xq,primitiv . Behauptung: Dann sind |τ1 (χ)| = q 2 und τh (χ) = χ̄ (h) · τ1 (χ) für alle h ∈ Z. 1 Referenz: Siehe [MV, Theorem 9.7 auf Seite 287]9 . 8 X „Cambridge studies in advanced mathematics 97 — Multiplicative Number Theory I. Classical Theory“, H. L. Montgomery und R. C. Vaughan, Cambridge University Press (New York — 2007), Theorem 9.2 auf Seite 283 9 „Cambridge studies in advanced mathematics 97 — Multiplicative Number Theory I. Classical Theory“, H. L. Montgomery und R. C. Vaughan, Cambridge University Press (New York — 2007), Theorem 9.7 auf Seite 287 Seite 28 Verwendung der expliziten Formel Zuguterletzt lässt sich die verallgemeinerte Gauss’sche Summe zu einem nicht–primitiven Charakter mit Hilfe der Gauss’schen Summe zu dem induzierenden Charakter darstellen. Lemma 3.10 (Verallgemeinerte Gauss’sche Summen zu nicht–primitiven Charakteren) Voraussetzungen: Seien q ∈ N \ {1} und χ ∈ Xq \ X0 . Seien q1 ∈ N die Führungszahl von χ und χ1 ∈ Xq1 ,primitiv mit χ (`) = χ1 (`) für alle ` ∈ N mit ggT (`, q) = 1. Sei h ∈ Z. Behauptung: Wird Wird q nicht von q1 geteilt, so ist τh (χ) = 0. ggT (q, |h|) q von q1 geteilt, so ist ggT (q, |h|) τh (χ) = χ1 q q1 · ggT (q, |h|) h · χ̄1 ggT (q, |h|) ϕ (q) q · τ1 (χ1 ) . · ·µ q q1 · ggT (q, |h|) ϕ ggT(q,|h|) Referenz: Siehe [MV, Theorem 9.12 auf Seite 290]10 . X Zusammengefasst zeigt sich, dass der Betrag einer verallgemeinerten Gauss’schen Summe zu einem Charakter höchstens im Wesentlichen die Wurzel des Charaktermoduls erreicht. Korollar 3.11 (Abschätzung für verallgemeinete Gauss’sche Summen) Voraussetzungen: Seien q ∈ N \ {1} und χ ∈ Xq \ X0 . Seien q1 ∈ N die Führungszahl von χ und h ∈ Z. Behauptung: Wird Wird q nicht von q1 geteilt, so ist τh (χ) = 0. ggT (q, |h|) 1 q ϕ (q) · q12 . von q1 geteilt, so ist |τh (χ)| ≤ q ggT (q, |h|) ϕ ggT(q,|h|) Insbesondere ist stets ϕ (q) |τh (χ)| ≤ ϕ q ggT(q,|h|) 1 · q2. Beweis: Folgt wegen q1 ≤ q (Bemerkung 3.8 auf der vorherigen Seite) direkt aus Lemma 3.10 und Lemma 3.9 auf der vorherigen Seite. X 10 „Cambridge studies in advanced mathematics 97 — Multiplicative Number Theory I. Classical Theory“, H. L. Montgomery und R. C. Vaughan, Cambridge University Press (New York — 2007), Theorem 9.12 auf Seite 290 §4: Abschätzung der Nullstellensumme Seite 29 §4: Abschätzung der Nullstellensumme In §4 wird die Nullstellensumme aus Lemma 3.5 abgeschätzt. Dabei erweisen sich Nullstellen, deren Realteil nahe bei 0 oder bei 1 liegt, als empfindlich störend. Zunächst sollen solche „Ausnahmenullstellen“ quantifiziert und benannt werden. Hilfssatz 4.1 (Lemma von Landau und Page) Behauptung: Es gibt eine von allen Parametern unabhängige Konstante C ∈ R+ , so dass die Menge C % ∈ C × Xq L (%, χ) = 0 und Re (%) ≥ 1 − χ ln (q · (|Im (%)| + 2)) für alle q ∈ N höchstens ein Element besitzt. Gibt es ein q ∈ Re (%) ≥ 1 − N, ein χ ∈ Xq und ein % ∈ C mit L (%, χ) = 0 und C ln(q·(|Im(%)|+2)) , C sowie ln (2q) und % ist eine einfache Nullstelle von L ( · , χ). so gelten, Im (%) = 0, Re (%) ≥ 1 − χ (`) ∈ {−1; 0; 1} für alle ` ∈ Z Referenz: Siehe [Pr, Satz 6.9.a) in Kapitel IV. auf Seite 130 der 1. Auflage]11 . X Definition 4.2 (Ausnahmenullstelle) a) Sei C ∈ R+ derart, dass für alle q ∈ N gilt: C % ≤1 ∈ C × Xq L (%, χ) = 0 und Re (%) ≥ 1 − # χ ln (q · (|Im (%)| + 2)) b) Sei β : c) Sei η : N → R 2, falls L (s, χ) 6= 0 für alle χ ∈ Xq und alle C ist s ∈ C mit Re (s) ≥ 1 − ln(q·(|Im(s)|+2)) q 7→ βq := %, falls es ein χ ∈ Xq und ein % ∈ C mit C L (%, χ) = 0 und Re (%) ≥ 1 − ln(q·(|Im(%)|+2)) . gibt N → {0; 1} ( q 7→ ηq := 0, falls βq = 2 ist . 1, falls βq 6= 2 ist Ist q ∈ N mit ηq = 1, so heißt q Ausnahmemodul, βq heißt Ausnahmenullstelle modulo q und das χ ∈ Xq mit L (βq , χ) = 0 heißt Ausnahme–Dirichlet–Charakter modulo q. 11 „Grundlagen der mathematischen Wissenschaften 91 — Primzahlverteilung“, K. Prachar, Springer (Berlin, Göttingen, Heidelberg — 1957), Satz 6.9.a) in Kapitel IV. auf Seite 130 der 1. Auflage Seite 30 Verwendung der expliziten Formel T durch den größtmöglichen Wert durch den größtmöglichen Wert kontinuierlich in Real– und Imaginärrichtung durch den größtmöglichen Wert durch den größtmöglichen Wert 1 durch den größt- kontinuierlich möglichen Wert in Realrichtung 0 −1 durch den größtmöglichen Wert durch den größtmöglichen Wert kontinuierlich in Real– und Imaginärrichtung durch den größtmöglichen Wert durch den größtmöglichen Wert −T 0 1 1 2 Abbildung 2: Aufteilung der Nullstellen aus Lemma 3.5 Zusätzlich ist die Art der Abschätzung innerhalb der verschiedenen Bereiche angegeben. Dabei spiegelt in der rechten Hälfte der Farbverlauf die Integrationsrichtungen wider. Ab hier wird der kritische Streifen, in dem die Nullstellen aus N (χ) mit χ ∈ X liegen können, aufgeteilt in die linke Hälfte s ∈ C| 0 < Re (s) ≤ 12 und die rechte Hälfte s ∈ C| 21 < Re (s) < 1 . In der linken Hälfte erweist es sich als ausreichend, diese in Streifen der Höhe 1 aufzuteilen und dann die Summanden zu den Nullstellen in einem solchen Streifen durch den maximal möglichen Wert abzuschätzen. Dies wird in Teilabschnitt a geschehen. In der rechten Hälfte dagegen wird die Nullstellensumme in ein Doppelintegral umgewandelt und deshalb also kontinuierlich abgeschätzt. Hier kommen sogenannte Dichtesätze für die Nullstellen zum Einsatz. Diese werden in Teilabschnitt b eingeführt. Abbildung 2 verdeutlicht die Situation. Die linke und die rechte Begrenzung stellen die Bereiche dar, in denen nach dem Lemma von Landau und Page 4.1 höchstens eine Nullstelle auftaucht. Die Erkenntnisse aus Teilabschnitt b liefern für die Ausgangsfragestellung keine befriedigenden Ergebnisse. Aus diesem Grund wird im Anschluss mit der verallgemeinerten Riemann’schen Vermutung weitergearbeitet. Teilabschnitt b wird also für die restliche Betrachtung nicht benötigt. Dennoch ist es interessant, die Situation auch in dem unbedingten Fall ohne Annahme der verallgemeinerten Riemann’schen Vermutung zu kennen. §4: Abschätzung der Nullstellensumme Seite 31 a: Realteil gleich oder kleiner als 1 2 Wie bereits angekündigt, wird in Teilabschnitt a die linke Hälfte des kritischen Streifens in Streifen der Höhe 1 zerschnitten und dann die Summanden der Nullstellensumme durch den größtmöglichen Wert auf dem Streifen abgeschätzt. Im Anschluss ist es natürlich wichtig, zu wissen, wieviele Nullstellen sich in einem solchen Streifen befinden. Das nächste Lemma löst diese Frage. Da sich in der Literatur nur Angaben über primitive Charaktere und χ0,1 finden, wurde der Transfer auf nicht–primitive Charaktere in Teilabschnitt b von Anhang B ab Seite 117 verlegt. Lemma 4.3 (Die vertikale Verteilung der Nullstellen Dirichlet’scher L–Funktionen) Behauptung: Es gibt eine von allen Parametern unabhängige Konstante C ∈ R+ , so dass für alle q ∈ N, alle χ ∈ Xq und alle T ∈ R mit T ≥ 1 gilt # { % ∈ N (χ)| T < |Im (%)| ≤ T + 1} ≤ C · ln (q (T + 4)) und # { % ∈ N (χ)| |Im (%)| ≤ 1} ≤ C · ln (4q) . Damit lässt sich der Beitrag der Nullstellen mit einem Realteil von höchstens stellensumme in Lemma 3.5 auf Seite 25 abschätzen. 1 2 zur Null- Lemma 4.4 (Summe über die Nullstellen mit Realteil gleich oder kleiner als 12 ) Behauptung: Es gibt eine von allen Parametern unabhängige Konstante C ∈ R+ , so dass für alle a ∈ N \ {1}, alle x ∈ R mit x ≥ 2 und alle T ∈ R mit T ≥ 1 gilt: X X χ∈Xa %∈N (χ) |Im(%)|≤T Re(%)≤ 12 1 x1−βa + 1 |x% | + 1 ≤ ηa · + C · ϕ (a) · x 2 · ln2 (aT ) . |%| 1 − βa Im Beweis wird zunächst die Ausnahmenullstelle abgespalten und danach unterschieden zwischen Nullstellen mit Imaginärteil zwischen −1 und 1 und den anderen Nullstellen. Beweis: Seien a ∈ N \ {1}, x ∈ R mit x ≥ 2 und T ∈ R mit T ≥ 1. (i) Abspalten der Ausnahmenullstelle Mit dem Lemma von Landau und Page 4.1 auf Seite 29 und Definition 4.2 folgt X X χ∈Xa %∈N (χ) |Im(%)|≤T Re(%)≤ 21 X |x% | + 1 x1−βa + 1 = ηa · + |%| 1 − βa χ∈Xa X %∈N (χ) |Im(%)|≤T C ≤Re(%)≤ 12 ln(a·(|Im(%)|+2)) xRe(%) + 1 . |%| Seite 32 Verwendung der expliziten Formel (ii) Anteil der Nullstellen mit Imaginärteil zwischen −1 und 1 C Für alle χ ∈ Xa und alle % ∈ N (χ) mit |Im (%)| ≤ 1 und ln(a(|Im(%)|+2)) < Re (%) ≤ Re (%) ≥ C ln (3a) und damit 1 2 ist 1 ln (3a) ≤ . |%| C Nach Lemma 4.3 auf der vorherigen Seite gibt es ein von allen Parametern unabhängiges C ∈ R+ mit X X χ∈Xa %∈N (χ) |Im(%)|≤1 C ≤Re(%)≤ 21 ln(a·(|Im(%)|+2)) xRe(%) + 1 |%| ≤ X X χ∈Xa %∈N (χ) |Im(%)|≤1 C ≤Re(%)≤ 12 ln(a·(|Im(%)|+2)) 1 x 2 + 1 · ln (3a) = C 1 |Im (%)| ≤ 1 und C 1 · # % ∈ N (χ) ln (a · (|Im (%)| + 2)) ≤ Re (%) ≤ 2 χ∈Xa · C 1 2 X # {% ∈ N (χ) ||Im (%)| ≤ 1 } χ∈Xa x + 1 · ln (3a) ≤ C X x 2 + 1 · ln (3a) ≤ 1 x 2 + 1 · ln (3a) · C X C · ln (4a) χ∈Xa 1 C = · ϕ (a) · x 2 + 1 · ln (3a) · ln (4a) . C (iii) Anteil der Nullstellen mit anderem Imaginärteil Nach Lemma 4.3 auf der vorherigen Seite gilt außerdem X X χ∈Xa %∈N (χ) 1<|Im(%)|≤T C ≤Re(%)≤ 21 ln(a·(|Im(%)|+2)) ≤ bT c X X χ∈Xa n=1 ≤ bT c X X χ∈Xa n=1 xRe(%) + 1 |%| 1 X %∈N (χ) n<|Im(%)|≤n+1 C ≤Re(%)≤ 12 ln(a·(|Im(%)|+2)) 1 X %∈N (χ) n<|Im(%)|≤n+1 Re(%)≤ 12 x2 + 1 n x2 + 1 |Im (%)| §4: Abschätzung der Nullstellensumme Seite 33 ) ( bT c n < Im (%) ≤ n + 1 X 1 X · # % ∈ N (χ) = x +1 · 1 und Re (%) ≤ n n=1 χ∈Xa 2 bT c 1 X1 X ≤ x2 + 1 · · # {% ∈ N (χ) |n < Im (%) ≤ n + 1 } n 1 2 n=1 χ∈Xa bT c ≤ X1 X 1 · C · ln (a · (n + 4)) x2 + 1 · n n=1 χ∈Xa bT c X 1 1 ≤ C · x2 + 1 · · ϕ (a) · ln (a · (bT c + 4)) n n=1 1 † ≤ C · x 2 + 1 · ϕ (a) · ln (a · (bT c + 4)) · (1 + ln (bT c)) 1 ≤ C · ϕ (a) · x 2 + 1 · ln (a · (T + 4)) · (ln (T ) + 1) . (iv) Zusammenführung Insgesamt folgt X X χ∈Xa %∈N (χ) |Im(%)|≤T Re(%)≤ 21 X |x% | + 1 x1−βa + 1 ≤ ηa · + |%| 1 − βa + X χ∈Xa %∈N (χ) |Im(%)|≤1 C ≤Re(%)≤ 12 ln(a·(|Im(%)|+2)) X X χ∈Xa %∈N (χ) 1<|Im(%)|≤T C ≤Re(%)≤ 12 ln(a·(|Im(%)|+2)) xRe(%) + 1 |%| xRe(%) + 1 |%| 1 x1−βa + 1 C 2 ≤ ηa · + · ϕ (a) · x + 1 · ln (3a) · ln (4a) 1 − βa C 1 + C · ϕ (a) · x 2 + 1 · ln (a · (T + 4)) · (ln (T ) + 1) 1 x1−βa + 1 = ηa · + O ϕ (a) · x 2 · ln2 (a) + ln (aT ) · ln (T ) . 1 − βa X Unter der Annahme der verallgemeinerten Riemann’schen Vermutung fällt in (i) der Ausnahmenullstellenterm weg und es bleibt lediglich der hintere Term zu betrachten. In diesem spielen die Nullstellen mit Realteil kleiner als 12 eine untergeordnete Rolle, so dass auch bei Verwendung der verallgemeinerten Riemann’schen Vermutung im eben geführten Beweis derselbe O–Term auftauchen würde. † Zu bT c X 1 ≤ ln (bT c) + 1 siehe Bemerkung C.6 auf Seite 132 in Anhang C. n n=1 Seite 34 Verwendung der expliziten Formel b: Realteil größer als 1 2 Schätzt man auch rechts der 12 –Geraden nach dieser Methode ab, so erhält man in jedem Fall einen relativ großen x–Exponenten. Lemma 3.5 soll aber zur Abschätzung der Exponentialsumme aus Lemma 2.8 verwendet werden. Dabei soll die triviale Abschätzung selbstverständlich bestmöglich unterboten werden, was sich in relativ kleinen x–Exponenten bemerkbar macht. Deshalb empfiehlt es sich, für jede Nullstelle den tatsächlichen Exponenten zu verwenden. Dies kann zum Beispiel durch die Verwendung von Dichtesätzen annähernd realisiert werden. Zur Formulierung der Dichtesätze empfiehlt sich die folgende Definition. Definition 4.5 Für diese Definition sei A := 21 ; 1 × (X ∪ N) × (R+ ∪ {0}). Sei A → N0 ) ( σ ≤ Re (%) ≤ 1 , falls r ∈ X σ # % ∈ N (r) N: und |Im (%)| ≤ T r 7→ Nr (σ, T ) := X Nχ (σ, T ), falls r ∈ N T χ∈Xr . Hilfssatz 4.6 (Dichtesatz) Voraussetzungen: 15 Seien u ∈ 21 ; 43 , v ∈ 43 ; 15 19 und w ∈ 19 ; 1 . Seien q ∈ N, T ∈ R mit T ≥ 1 und ϑ ∈ R+ . Behauptung: Es gibt eine von allen Parametern unabhängige Konstante C1 ∈ von ϑ abhängige Konstanten C2,ϑ ∈ R+ und C3,ϑ ∈ R+ mit R+ und nur 3 Nq (u, T ) ≤ C1 · (qT ) 2−u ·(1−u) · ln9 (qT ) , 12 Nq (v, T ) ≤ C2,ϑ · (qT ) 5 ·(1−v)+ϑ und Nq (w, T ) ≤ C3,ϑ · (qT )2·(1−w)+ϑ . Referenz: Siehe [Mo, Theorem 12.1 auf Seite 98]12 , [Hx, Formel (1.1) auf Seite 435]13 und [HB, Theorem 3 auf Seite 223]14 . X 12 „Lecture Notes in Mathematics 227 — Topics in multiplicative number theory“, H. L. Montgomery, Springer (Berlin, Heidelberg, New York — 1971), Theorem 12.1 auf Seite 98 13 „Large values of Dirichlet polynomials, III “, M. N. Huxley, Acta Arithmetica 26 (1975), Seiten 435 bis 444, Formel (1.1) auf Seite 435 14 „Zero density estimates for the Riemann zeta-function and Dirichlet L–functions“, D. R. Heath–Brown, Journal of the London Mathematical Society – Series 2 19 (1979), Seiten 221 bis 232, Theorem 3 auf Seite 223 Dissertation von Simon Feiler zum Thema Die relative Verteilung der Inversen einer natürlichen Zahl zu variablen Moduln §4: Abschätzung der Nullstellensumme Seite 35 Zur mittleren Abschätzung muss noch etwas gesagt werden: Bei Huxley findet sich lediglich eine Abschätzung der Form bQc X 1 · Nχ0,1 (σ, T ) + q0 q≡0 X Nχ (σ, T ) ≤ Cϑ · q=2 χ∈Xq,primitiv (mod q0 ) Dabei sind q0 ∈ N, Q ∈ R+ , T ∈ R mit T ≥ 1, σ ∈ Im erklärenden Text fügt Huxley an: 1 2; 1 Q2 T q0 12 ·(1−σ)+ϑ 5 . und ϑ ∈ R+ beliebig vorgegeben. „Jutila actually treats all characters to a fixed modulus, which is essentially the special case Q = q0 , where q0 is a divisor of the given modulus.“ (M. N. Huxley in [Hx]) Es soll kurz ausgeführt werden, was das heißt. In Anhang B wird gezeigt, dass für einen Charakter χ ∈ X und seinen induzierenden Charakter χ1 ∈ Xprimitiv stets N (χ) = N (χ1 ) und L (1 + it, χ) 6= 0 für alle t ∈ R bzw. t ∈ R \ {0} gilt. Da der Modul eines induzierenden Charakters stets den Modul des induzierten Charakters teilt, folgt mit Huxley’s Formel Nq (σ, T ) = X Nχ (σ, T ) = χ∈Xq ≤ q X d=1 d teilt q X χ∈Xq Cϑ · d2 T d q X Nχ1 (σ, T ) ≤ Nχ0,1 (σ, T ) + d=2 d teilt q 12 ·(1−σ)+ϑ 5 X Nχ (σ, T ) χ∈Xd,primitiv 12 ≤ Cϑ · (qT ) 5 ·(1−σ)+ϑ · τ. (q) . Dabei ist τ. die Funktion, die eine natürliche Zahl auf die Anzahl ihrer Teiler abbildet. Diese ist nach Bemerkung 7.2 durch jede Potenz ihres Argumentes beschränkt, wenn man die Potenz mit einer nur vom Exponenten abhängigen Konstante multipliziert. Damit ergibt sich die Aussage des Dichtesatzes 4.6. Außerdem lässt Formel (2.23) aus [Hx] vermuten, dass in der zweiten Abschätzung von 3 Hilfssatz 4.6 der Faktor 12 5 auch durch 3v−1 ersetzt werden könnte. Die Vermutung entsteht, da in Dichtesätzen der Exponent der „Q2 T –Version“ meist auch in der „qT –Version“ gilt. Leider lässt sich hierfür in der Literatur aber kein exakter Nachweis finden. Die Vorfaktoren von (1 − · ) in den Exponenten des Dichtesatzes 4.6 bilden eine Funktion, deren Graph in Abbildung 3 auf der nächsten Seite gezeigt wird. Es zeigt sich, dass diese Funktion nicht über 12 5 hinaus wächst. Korollar 4.7 Voraussetzung: Sei ϑ ∈ R+ . Behauptung: Es gibt eine nur von ϑ abhängige Konstante Cϑ ∈ alle T ∈ R mit T ≥ 1 und alle u ∈ 21 ; 1 gilt: 12 R+ , so dass für alle q ∈ N, Nq (u, T ) ≤ Cϑ · (qT ) 5 ·(1−u)+ϑ . Seite 36 Verwendung der expliziten Formel 12 5 12 5 3 3u−1 3 2−u 57 26 2 2 u 1 2 3 4 1 15 19 Abbildung 3: Exponenten im Dichtesatz 4.6 Beweis: R \ {2} → R 3 ist monoton steigend auf 2−u monoton fallend auf R \ 13 . Es gilt u 7→ 3 2− 3 4 = 12 12 = , 8−3 5 3 3· 3 4 −1 = R \ {2} und R\ 1 3 v 7→ 12 12 = 9−4 5 und → 2<2+ R 3 ist 3v − 1 2 12 = . 5 5 X Mit dem Dichtesatz 4.6 auf Seite 34 folgt die Behauptung. Um die Nullstellensumme mit der Funktion N in Verbindung zu bringen, bietet sich eine Kontinuisierung der Summe an. In Abbildung 2 auf Seite 30 wurde angedeutet, wie die Kontinuisierungsbereiche aufgeteilt sind. Zur Kontinuisierung werden x Re(%) σ Re(%) Z u ln (x) · x du =x + σ und 1 1 = + |Im (%)| T ZT 1 dt t2 |Im(%)| geschrieben. Danach lassen sich Summe und Integrale vertauschen. Da beide Integralausdrücke in der Nullstellensumme miteinander multipliziert werden, ergibt sich dabei ein Doppelintegral und einige Randterme, namentlich zwei Einzelintegrale und ein integralfreier Term. Als Integranden finden sich die Anzahlen der Nullstellen in von den Integrationsvariablen abhängigen Rechtecken, die letztlich linear aus den Werten von N hervorgehen. §4: Abschätzung der Nullstellensumme Seite 37 Der ausführliche Beweis der folgenden Bemerkung findet sich in Teilabschnitt a von Anhang C ab Seite 119. Die Idee zu dieser Kontinuisierung entstand nach einem Blick in Kapitel 24 von [Da]15 . Bemerkung 4.8 (Kontinuisierung der Nullstellensumme) Für alle q ∈ N, alle τ ∈ R+ , alle T ∈ und alle x ∈ R mit x > 1 sind X χ∈Xq ZT xRe(%) X %∈N (χ) τ <|Im(%)|≤T σ≤Re(%)<S R mit T ≥ τ , alle σ ∈ R, alle S ∈ R mit +1 = |Im (%)| ln (x) · ZS τ ZS + ln (x) · xu t2 1 2 ≤σ<S≤1 · Nq (u, t) du dt σ u x · Nq (u, T ) Nq (u, τ ) − T τ du σ ZT 1 σ S · (x + 1) · N (σ, t) − x + 1 · N (S, t) dt q q t2 τ Nq (S, τ ) Nq (S, T ) − · xS + 1 + τ T Nq (σ, T ) Nq (σ, τ ) + − · (xσ + 1) T τ + und X X χ∈Xq %∈N (χ) |Im(%)|≤T σ≤Re(%)<S x Re(%) ZS = ln (x) · xu · Nq (u, T ) du + xσ · Nq (σ, T ) − xS · Nq (S, T ) . σ Hierauf aufbauend kann der Anteil der Nullstellen mit Realteil größer als 12 zur Nullstellensumme unter Verwendung des Dichtesatzes 4.6 abgeschätzt werden. Verwendet man den Dichtesatz direkt, so ergeben sich allerdings Integranden, deren Stammfunktionen nicht berechenbar sind. Aus diesem Grund wird auf Korollar 4.7 zurückgegriffen. Bei der Formulierung des folgenden Lemmas wurde die Möglichkeit, dass der Dichtesatz 4.6 noch in Richtung der sogenannten Dichtehypothese (die Existenz eines nur von ϑ abhängigen + Cϑ ∈ Cϑ · (qT )2·(1−σ)+ϑ für alle q ∈ N, alle T ∈ R mit T ≥ 1, alle 1 R mit Nq (σ, T ) ≤ σ ∈ 2 ; 1 und alle ϑ ∈ R+ ) verbessert wird, mit berücksichtigt. 1 Diese Berücksichtigung macht sich in Form von zwei Konstanten A ∈ 2; 12 5 und α ∈ 2 ; 1 bemerkbar. Diese Konstanten werden so gewählt, dass auf dem Intervall [α; 1] die Dichtehypothese gilt und auf dem Intervall 12 ; 1 eine Abschätzung in derselben Form möglich ist, bei der die 2 im Exponenten der Dichtehypothese durch A ersetzt wird. Nach dem Dichtesatz 4.6 15 sind nach momentanem Forschungsstand A als 12 5 und α als 19 wählbar. 15 „Multiplicative Number Theory“, H. Davenport, Markham Publishing Company (Chicago — 1967) Seite 38 Verwendung der expliziten Formel Lemma 4.9 Voraussetzungen: + Seien a ∈ N \ {1}, α ∈ 12 ; 1 und A ∈ 2; 12 5 derart, dass es nur von ϑ abhängige C1,ϑ ∈ R und C2,ϑ ∈ R+ mit Na (u, T ) ≤ C1,ϑ · (aT )A·(1−u)+ϑ und Na (v, T ) ≤ C2,ϑ · (aT )2·(1−v)+ϑ für alle ϑ ∈ R+ , alle T ∈ R mit T ≥ 1, alle u ∈ 12 ; 1 und alle v ∈ [α; 1] gibt. Behauptung: Dann gibt es eine nur von ϑ abhängige Konstante Cϑ ∈ R+ , so dass für alle ϑ ∈ R+ \ {2α − 1; 1 − A · (1 − α)}, alle h ∈ Z, alle T ∈ R mit T ≥ 1, mit alle x ∈ R mit x ≥ 2 und x > (aT )A und alle S ∈ [α; 1] \ 1+ϑ 2 Re (%) ≥ S, |Im (%)| ≤ T und # % ∈ C ≤ ηa es gibt ein χ ∈ Xa mit L (%, χ) = 0 X X χ∈Xa %∈N (χ) |Im(%)|≤T 1 ≤Re(%) 2 ≤ xβa + 1 |x% | + 1 − ηa · |%| βa 1 Cϑ · a · x 2 · ln10 (aT ) + Cϑ · ln (x) D (A, α, ϑ) · aA·(1−α)+ϑ · xα · D1 (A, α, ϑ) − 2 x T 1−A·(1−α)−ϑ ln A + Cϑ · A A 1 ln (x) · a 2 +ϑ · x 2 · D3 (A, ϑ) − D4 (A, ϑ) · T 2 −1+ϑ (aT ) ln x (aT )A ln (x) D6 (S, ϑ) 2·(1−S)+ϑ S + Cϑ · ·a · x · D5 (S, ϑ) − 2S−1−ϑ T ln (aTx )2 ln (x) D7 (α, ϑ) 2·(1−α)+ϑ α ·a + Cϑ · ·x · − D8 (α, ϑ) T 2α−1−ϑ ln (aTx )2 gilt. Dabei sind 3 − 2A · (1 − α) − 2ϑ , 1 − A · (1 − α) − ϑ A · (1 − α) + ϑ D2 (A, α, ϑ) = , 1 − A · (1 − α) − ϑ 6 − 2A − 4ϑ D3 (A, ϑ) = , A − 2 + 2ϑ A + 2ϑ D4 (A, ϑ) = und A − 2 + 2ϑ D1 (A, α, ϑ) = 4S − 1 − 2ϑ , 2S − 1 − ϑ 2 · (1 − S) + ϑ D6 (S, ϑ) = , 2S − 1 − ϑ 2 · (1 − α) + ϑ D7 (α, ϑ) = , 2α − 1 − ϑ 4α − 1 − 2ϑ D8 (α, ϑ) = . 2α − 1 − ϑ D5 (S, ϑ) = In Lemma 4.9 ist S gerade so gewählt, dass die einzige Nullstelle % ∈ C der Dirichlet’schen L–Funktion zu einem Dirichlet–Charakter modulo a mit Re (%) ≥ S und −T ≤ Im (%) ≤ T die eventuell vorhandene Ausnahmenullstelle modulo a ist. Die vermeintliche Einschränkung S ≥ α ist eine logische Folge der Tatsache, dass auf [α; 1] die Dichtehypothese vorausgesetzt wird, da für alle σ ∈ [S; 1] Na (σ, T ) ≤ Na (S, T ) ≤ 1 = (aT )0 ≤ (aT )2·(1−σ) §4: Abschätzung der Nullstellensumme Seite 39 gilt. Die Wahl von ϑ wird eingeschränkt, um eine Division durch 0 zu verhindern. Beweis: Seien ϑ ∈ R+ \ {2α − 1; 1 − A · (1 − α)},h ∈ Z, T ∈ R mit T ≥ 1 und x ∈ R mitx ≥ 2 und x > (aT )A . Sei S ∈ [α; 1] \ 1+ϑ 2 Re (%) ≥ S, |Im (%)| ≤ T und es mit # % ∈ C gibt ein χ ∈ Xa mit L (%, χ) = 0 Seien C1,ϑ ∈ R+ und C2,ϑ ∈ R+ mit Na (u, T ) ≤ C1,ϑ · (aT )A·(1−u)+ϑ Na (v, T ) ≤ C2,ϑ · (aT )2·(1−v)+ϑ für alle v ∈ [α; 1]. ≤ ηa . für alle u ∈ 21 ; 1 und Die Summe, die übrigbleibt, wenn man den zur Ausnahmenullstelle gehörenden Summanden abzieht, kann nach Bemerkung 4.8 kontinuisiert werden. Die N –Werte in den Integranden werden danach gemäß der Voraussetzung abgeschätzt. (i) Abspalten der Ausnahmenullstelle Mit dem Lemma von Landau und Page 4.1 auf Seite 29 und Definition 4.2 folgt X X χ∈Xa %∈N (χ) |Im(%)|≤T 1 <Re(%) 2 X xβa + 1 |x% | + 1 − ηa · ≤ |%| βa X χ∈Xa %∈N (χ) |Im(%)|≤T 1 ≤Re(%)<S 2 xRe(%) + 1 . |%| Nach dem Lemma von Landau und Page 4.1 auf Seite 29 ist Na (S, t) = Na (S, 0) für alle t ∈ R mit 0 ≤ t ≤ T . (ii) Anteil der Nullstellen mit Imaginärteil zwischen −1 und 1 Mit Bemerkung 4.8 auf Seite 37 folgt ! X X X X xRe(%) + 1 1 xRe(%) ≤ 1 + 1 |%| 2 2 χ∈Xa χ∈Xa %∈N (χ) |Im(%)|≤1 1 ≤Re(%)<S 2 ≤ 2· X %∈N (χ) |Im(%)|≤1 1 ≤Re(%)<S 2 # { % ∈ N (χ)| |Im (%)| ≤ 1} χ∈Xa ZS + 2 · ln (x) · 1 xu · Na (u, 1) du + 2x 2 · Na 1 2, 1 − 2xS · Na (S, 1) . 1 2 Nach dem Dichtesatz 4.6 auf Seite 34 und Lemma 4.3 auf Seite 31 gibt es ein C ∈ R+ mit 2· X 1 # { % ∈ N (χ)| |Im (%)| ≤ 1} + 2x 2 · Na 1 2, 1 − 2xS · Na (S, 1) χ∈Xa ≤ 2· X 3 1 1 C · ln (4a) + 2x 2 · Ca 2− 2 ·(1− 12 ) · ln9 (a) − 2xS · Na (S, 0) χ∈Xa 1 = 2C · ϕ (a) · ln (4a) + 2Cax 2 · ln9 (a) − 2xS · Na (S, 0) . Seite 40 Verwendung der expliziten Formel ZS Damit bleibt nur noch xu · Na (u, 1) du abzuschätzen. 1 2 Nach Anwendung der Dichtesatz–ähnlichen Voraussetzung können dabei alle nicht von u u abhängigen Faktoren vor das Integral gezogen werden. Dabei bleiben die Integranden axA u und ax2 stehen. Durch Erweitern mit dem Logarithmus der jeweiligen Basis werden diese Terme integrierbar. Außerdem gilt ZS xu · Na (u, 1) du 1 2 Zα ≤ u x · C1,ϑ · a A·(1−u)+ϑ ZS du + xu · C2,ϑ · a2·(1−u)+ϑ du α 1 2 C1,ϑ · aA+ϑ · = ln axA Zα 1 2 ZS x x u C2,ϑ x x u 2+ϑ ·a ln A · A du + · ln 2 · 2 du x a a a a ln a2 α h x u iu=S h x u iu=α C2,ϑ C1,ϑ 2+ϑ A+ϑ + · a · · a · aA a2 u= 12 u=α ln axA ln ax2 A 1 C1,ϑ C2,ϑ A·(1−α)+ϑ α +ϑ 2·(1−S)+ϑ S 2·(1−α)+ϑ α 2 2 = · a · x − a · x + · a · x − a · x . ln axA ln ax2 = Insgesamt ergibt sich X χ∈Xa X %∈N (χ) |Im(%)|≤1 xRe(%) + 1 ≤ |%| 1 2C · ϕ (a) · ln (4a) + 2C · ax 2 · ln9 (a) − 2xS · Na (S, 0) 1 ≤Re(%)<S 2 A 1 ln (x) A·(1−α)+ϑ α +ϑ 2 2 · · x a · x − a ln axA ln (x) 2·(1−S)+ϑ S 2·(1−α)+ϑ α + 2C2,ϑ · · a · x − a · x . ln ax2 + 2C1,ϑ · Der Anteil der Nullstellen mit anderem Imaginärteil wird im Prinzip analog behandelt. Allerdings wird hier in Real– und in Imaginärrichtung kontinuisiert (siehe Bemerkung 4.8). Nach Ausnutzen von Na (S, t) = Na (S, 0) für alle t ∈ R mit 0 ≤ t ≤ T bleiben ein Doppelintegral und zwei einfache Integrale abzuschätzen. Dabei wird dieselbe Technik wie im gerade behandelten Fall angewandt. §4: Abschätzung der Nullstellensumme Seite 41 (iii) Anteil der Nullstellen mit anderem Imaginärteil Mit Na (S, t) = Na (S, 0) für alle t ∈ R mit 0 ≤ t ≤ T und Lemma 4.8 auf Seite 37 folgt X X χ∈Xa %∈N (χ) 1<|Im(%)|≤T 1 ≤Re(%)<S 2 xRe(%) + 1 |%| ZT ln (x) · = + ZS 1 ZT xu · Na (u, t) du dt + ln (x) · 2 t ZS u x · Na (u, T ) Na (u, 1) − T 1 du 1 2 1 2 1 1 2 + 1 · N · x a t2 1 2, t − xS + 1 · Na (S, t) dt 1 ! Na 12 , T Na 12 , 1 1 Na (S, 1) Na (S, T ) S + · x +1 + · x2 + 1 − − 1 T T 1 ZS ZT ZS u Na (u, T ) x u · Na (u, t) du dt + ln (x) · x · − Na (u, 1) du = ln (x) · t2 T 1 1 1 2 1 2 ZT + x2 + 1 · 1 1 · Na t2 + xS + 1 · Na (S, 0) · Na 1 , t dt + 2 ZT 1 2, T − Na T 1 2, 1 −1 1 dt + 1 − . 2 t T 1 Es ist ZT 1 t=T 1 1 1 1 1 −1 + 1 − = − 1 + 1 − = 0. dt + 1 − = 2 t T t t=1 T T T (iv) Abschätzen des einfachen t–Integrals Nach dem Dichtesatz 4.6 auf Seite 34 gilt ZT 1 · Na t2 1 1 2, t ZT dt ≤ 3 ·(1− 12 ) 1 2− 1 2 · C · (at) · ln9 (at) dt t2 1 ZT 9 ≤ Ca · ln (aT ) · 1 dt t 1 = Ca · ln9 (aT ) · [ln (t)]t=T t=1 = Ca · ln9 (aT ) · ln (T ) . Ferner ist 3 Na 1 2, T T − Na C · (aT ) 2− 12 1 2, 1 ≤ ·(1− 12 ) T · ln9 (aT ) − 0 = Ca · ln9 (aT ) . Seite 42 Verwendung der expliziten Formel Damit folgt T Z 1 x +1 · · Na t2 1 2 Na 1 2 , t dt + 1 2, T 1 C · a · x 2 + 1 · ln10 (aT ) 1 ≤ . 2, 1 ln (2) − Na T 1 Dabei wurde der ln (2) im Nenner nur spendiert, um auch den Fall a = 2 mit einschließen zu können. Das einfache u–Integral lässt sich wie im Fall |Im (%)| ≤ 1 behandeln. (v) Abschätzen des einfachen u–Integrals Es gilt ZS ln (x) · u x · Na (u, T ) − Na (u, 1) du T 1 2 Zα ≤ ln (x) · ZS C1,ϑ · (aT )A·(1−u)+ϑ x · du + ln (x) · T u ln (x) (aT )A+ϑ · C1,ϑ · · x T ln (aT )A (aT )2 C1,ϑ · (aT )A+ϑ ln (x) · x T ln (aT )A ln (x) (aT ) · x T ln (aT )2 = C1,ϑ · ln + C2,ϑ · ln ln 1 2 ZS ! x (aT )A !u x · du (aT )A 2 2+ϑ + C2,ϑ · Zα u x x ln · du (aT )2 (aT )2 α " !u #u=α x · (aT )A u= 1 (aT )2+ϑ ln (x) · · + C2,ϑ · x T ln = C2,ϑ · (aT )2·(1−u)+ϑ du T α 1 2 = xu · · x (aT )2 u u=S u=α A 1 ! ln (x) · (aT )A·(1−α)+ϑ · xα (aT ) 2 +ϑ · x 2 − T T ln (x) · (aT )2·(1−S)+ϑ · xS (aT )2·(1−α)+ϑ · xα − T T x (aT )A x (aT )2 ! . Es bleibt das Doppelintegral abzuschätzen. Hier wird zunächst wieder das u–Integral in bekannter Manier behandelt. Danach kann der Integrand des t–Integrals als t–Potenz erkannt werden. Die Voraussetzungen an ϑ garantieren hierbei, dass der Exponent verschieden von −1 ist. §4: Abschätzung der Nullstellensumme Seite 43 (vi) Abschätzen des Doppelintegrals Es ist außerdem ZT ZS u x · Na (u, t) du dt t2 1 1 2 ZT ≤ Zα u ZS u x x · C1,ϑ · (at)A·(1−u)+ϑ du + · C2,ϑ · (at)2·(1−u)+ϑ du dt t2 t2 1 α 1 2 C1,ϑ · aA+ϑ · = ZT 1 tA+ϑ x t2 · ln A Zα · ln x · A (at) 1 2 (at) ! x (at) !u A du dt ZT S u Z 2+ϑ x t x · ln · du dt + C2,ϑ · a2+ϑ · 2 2 x 2 (at) (at) t · ln (at)2 α 1 !u #u=α " T Z C1,ϑ x A+ϑ A−2+ϑ ·a ≤ dt · t · x (at)A ln A u= 1 1 (aT ) + ln C 2,ϑ · a2+ϑ · x (aT )2 2 ZT tϑ · 1 x (at)2 = ln C 1,ϑ · aA·(1−α)+ϑ · xα · x (aT )A ln C 2,ϑ · a2·(1−S)+ϑ · xS · x (aT )2 A 2 t tA·(1−α)+ϑ−1 dt = A · (1 − α) + ϑ − 1 − t 2 −1+ϑ A 2 −1+ϑ #t=T t−2S+ϑ+1 dt = −2S + ϑ + 1 t=T " t A −2+ϑ 2 dt = − 1 ZT −2S+ϑ t ZT 1 1 t−2S+ϑ dt − a2·(1−α)+ϑ · xα · ZT − −2α+ϑ A t=1 t=1 t 1 t−2α+ϑ+1 dt = − −2α + ϑ + 1 A t 2 −2+ϑ dt t−2α+ϑ dt . 1 = t=1 1 1 · 1 − 1−A·(1−α)−ϑ , 1 − A · (1 − α) − ϑ T A 1 − T 2 −1+ϑ = A , 2 −1+ϑ 1 1 = · 1 − 2S−1−ϑ 2S − 1 − ϑ T und ZT 1 #t=T 1 ZT A tA·(1−α)−2+ϑ dt − a 2 +ϑ · x 2 · ZT < 0 < ϑ, ϑ 6= 2S − 1 und ϑ 6= 2α − 1 sind " A·(1−α)−2+ϑ ZT 1 Wegen ϑ 6= 1 − A · (1 − α), 1 − ZT dt u=α 1 + u u=S t=T t=1 1 = · 2α − 1 − ϑ 1 T 2α−1−ϑ −1 . Seite 44 Verwendung der expliziten Formel Insgesamt folgt ZT ln (x) · ZS 1 xu · Na (u, t) du dt t2 1 2 C1,ϑ ln (x) · · x 1 − A · (1 − α) − ϑ ln A ≤ (aT )A·(1−α)+ϑ · xα aA·(1−α)+ϑ · xα − T ! (aT ) + A 2 C1,ϑ ln (x) · · x − 1 + ϑ ln A A a A +ϑ 2 1 (aT ) 2 +ϑ · x 2 ·x − T ! 1 2 (aT ) C2,ϑ ln (x) · + · x 2S − 1 − ϑ ln 2 (aT ) (aT )2·(1−S)+ϑ · xS a2·(1−S)+ϑ · xS − T ! C2,ϑ ln (x) · + · x 2α − 1 − ϑ ln (aT )2 (aT )2·(1−α)+ϑ · xα − a2·(1−α)+ϑ · xα T ! . Nun sind noch die Einzelergebnisse zusammenzusetzen. (vii) Zusammenführung Setzt man die Integralabschätzungen in (iii) ein, so ergibt sich mit (i) und (ii) X X χ∈Xa %∈N (χ) |Im(%)|≤T 1 ≤Re(%) 2 ≤ ≤ x βa + 1 xRe(%) + 1 − ηa · |%| βa X X χ∈Xa %∈N (χ) |Im(%)|≤1 1 ≤Re(%)<S 2 X xRe(%) + 1 + |%| χ∈Xa X %∈N (χ) 1<|Im(%)|≤T 1 ≤Re(%)<S 2 xRe(%) + 1 |%| 1 2C · ϕ (a) · ln (4a) + 2C · ax 2 · ln9 (a) − 2xS · Na (S, 0) A 1 ln (x) A·(1−α)+ϑ α +ϑ 2 2 + 2C1,ϑ · · a · x − a · x ln axA ln (x) 2·(1−S)+ϑ S 2·(1−α)+ϑ α · a · x − a · x + 2C2,ϑ · ln ax2 C1,ϑ ln (x) · + · x 1 − A · (1 − α) − ϑ ln A A·(1−α)+ϑ a (aT )A·(1−α)+ϑ · xα ·x − T α (aT ) + A 2 C1,ϑ ln (x) · · x − 1 + ϑ ln A A a A +ϑ 2 1 (aT ) 2 +ϑ · x 2 ·x − T ! 1 2 (aT ) C2,ϑ ln (x) · + · x 2S − 1 − ϑ ln 2 (aT ) (aT )2·(1−S)+ϑ · xS a2·(1−S)+ϑ · xS − T ! Dissertation von Simon Feiler zum Thema Die relative Verteilung der Inversen einer natürlichen Zahl zu variablen Moduln ! §4: Abschätzung der Nullstellensumme (aT )2·(1−α)+ϑ · xα − a2·(1−α)+ϑ · xα T ! A 1 ln (x) (aT )A·(1−α)+ϑ · xα (aT ) 2 +ϑ · x 2 · + C1,ϑ · − x T T ln (aT )A ! ln (x) (aT )2·(1−S)+ϑ · xS (aT )2·(1−α)+ϑ · xα · + C2,ϑ · − x T T ln C2,ϑ ln (x) · + · x 2α − 1 − ϑ ln (aT )2 Seite 45 ! (aT )2 + ≤ 1 C · a · x 2 + 1 · ln10 (aT ) ln (2) 1 1 C 2C · ϕ (a) · ln (4a) + 2C · ax 2 · ln9 (a) + · a · x 2 + 1 · ln10 (aT ) ln (2) 1 ln (x) A·(1−α)+ϑ α ·a ·x · 2+ + C1,ϑ · x 1 − A · (1 − α) − ϑ ln A (aT ) ln (x) (aT )A·(1−α)+ϑ · xα 1 · − C1,ϑ · · −1 x T 1 − A · (1 − α) − ϑ ln A (aT ) ! 1 A 1 ln (x) +ϑ ·a2 · x 2 · −2 + A + C1,ϑ · x ln 2 −1+ϑ (aT )A ! A 1 ln (x) 1 (aT ) 2 +ϑ · x 2 · − C1,ϑ · · A +1 x T − 1 + ϑ ln 2 (aT )A ln (x) 1 2·(1−S)+ϑ S ·a + C2,ϑ · ·x · 2+ 2S − 1 − ϑ ln (aTx )2 ln (x) 1 (aT )2·(1−S)+ϑ · xS · − C2,ϑ · · −1 T 2S − 1 − ϑ ln (aTx )2 ln (x) 1 2·(1−α)+ϑ α ·a − C2,ϑ · ·x · 2+ 2α − 1 − ϑ ln (aTx )2 ln (x) (aT )2·(1−α)+ϑ · xα 1 · + C2,ϑ · · −1 . T 2α − 1 − ϑ ln (aTx )2 X Seite 46 Verwendung der expliziten Formel §5: Die Verteilung unter der Annahme der Gültigkeit der verallgemeinerten Riemann’schen Vermutung a?p p o In §5 wird die Verteilung von ∈ (0; 1) p ∈ Px und ggT (a, p) = 1 mit a ∈ N \ {1}, x ∈ R und x ≥ 2 unter der Annahme der verallgemeinerten Riemann’schen Vermutung untersucht. Hierfür werden die Ergebnisse aus §3 und aus Teilabschnitt a von §4 verwendet. §4b wird nicht benötigt, da die verallgemeinerte Riemann’sche Vermutung bedingt, dass alle Nullstellen schon in der in Teilabschnitt a betrachteten Summe zum Zuge kommen. Zunächst soll die verallgemeinerte Riemann’sche Vermutung formuliert werden. n Verallgemeinerte Riemann’sche Vermutung 5.1 Behauptung: Für alle χ ∈ X und alle % ∈ N (χ) ist Re (%) = 21 . Aus Lemma 4.4 lässt sich mit den Ergebnissen zu den verallgemeinerten Gauss’schen Sum ? a X h`a men direkt ein Hauptterm mit Restgliedabschätzung für e · ψ (x; a, `) mit a `=1 ggT(a,`)=1 a ∈ N \ {1}, h ∈ Z, x ∈ R und x ≥ 2 herleiten. Lemma 5.2 („Explizite Formel“ und verallgemeinere Riemann’schen Vermutung) Voraussetzung: Es gelte die verallgemeinerte Riemann’sche Vermutung 5.1. Behauptung: Es gibt eine von allen Parametern unabhängige Konstante C ∈ R+ mit a a µ ggT(a,|h|) X h`?a · x e · ψ (x; a, `) − a a `=1 ϕ ggT(a,|h|) ggT(a,`)=1 ϕ (a) ≤C· ϕ a ggT(a,|h|) 1 1 · a 2 · x 2 · ln2 (ax) für alle a ∈ N \ {1}, alle h ∈ Z und alle x ∈ R mit x ≥ 2. Im Beweis wird selbstverständlich zunächst die explizite Formel 3.5 angewandt. Der Hauptterm ergibt sich aus der Ramanujan–Summe 3.6, während sich der Restterm aus der expliziten Formel mit Korollar 3.11 abschätzen lässt. Die Nullstellensumme kann dann mit Lemma 4.4 abgeschätzt werden. Beweis: (i) Anwenden von Lemma n 3.5 o Seien a ∈ N \ {1} und D := (x, T )T ∈ R2 x ≥ 2 und 1 ≤ T ≤ x . Sei X ×D → C X x% − 1 T (χ, x, T ) → 7 R (x, T ) := ψ (x, χ) − ∆ x + R: χ χ % %∈N (χ) |Im(%)|≤T . §5: Die Verteilung unter der verallgemeinerten Riemann’schen Vermutung Seite 47 Nach Hilfssatz 3.4 auf Seite 25 ist für alle (χ, x, T )T ∈ Xa × D x Rχ (x, T ) = O · ln2 (ax) . T Nach Lemma 3.5 auf Seite 25 folgt für alle h ∈ Z und alle (x, T )T ∈ D a X e `=1 ggT(a,`)=1 h`?a a · ψ (x; a, `) = X τh (χ) τh (χ0,a ) ·x− · ϕ (a) ϕ (a) χ∈Xa X %∈N (χ) |Im(%)|≤T X τh (χ) x% − 1 + · Rχ (x, T ). % ϕ (a) χ∈Xa (ii) Abschätzen des Betrags der hinteren Summe aus (i) Nach Anwenden der Dreiecksungleichung und Korollar 3.11 auf Seite 28 folgt für alle h ∈ Z und alle (x, T )T ∈ D X X τh (χ) 1 · Rχ (x, T ) ≤ · |τh (χ)| · |Rχ (x, T )| ϕ (a) χ∈Xa χ∈Xa ϕ (a) x X 1 1 ϕ (a) · a2 · O ≤ · · ln2 (ax) a ϕ (a) T χ∈Xa ϕ ggT(a,|h|) 1 x ϕ (a) · a 2 · · ln2 (ax) . = O a T ϕ ggT(a,|h|) Damit passt die Summe mit dem Restterm R bereits in den angestrebten Fehler, wenn man √ (x, T )T ∈ D mit T ≥ x wählt. In der inneren Summe der Doppelsumme kann wegen der Gültigkeit der verallgemeinerten Riemann’schen Vermutung die Summationsbedingung um „Re (%) ≤ 12 “ erweitert werden, ohne den Wert der Doppelsumme zu ändern. Also kann hierauf direkt Lemma 4.4 angewandt werden. Gemeinsam mit Korollar 3.11 liefert das die gewünschte Abschätzung. (iii) Abschätzen der Nullstellen–Doppelsumme in (i) Wiederum mit der Dreiecksungleichung und Korollar 3.11 auf Seite 28 folgt für alle h ∈ alle (x, T )T ∈ D X % X X |τh (χ)| X |x% − 1| τh (χ) x − 1 · ≤ · % ϕ (a) |%| χ∈Xa ϕ (a) %∈N (χ) %∈N (χ) χ∈Xa |Im(%)|≤T ≤ a X χ∈Xa ϕ 1 2 a ggT(a,|h|) Z und |Im(%)|≤T · X %∈N (χ) |Im(%)|≤T 1 X |x% | + 1 a2 · = a |%| ϕ ggT(a,|h|) χ∈Xa X %∈N (χ) |Im(%)|≤T xRe(%) + 1 . |%| Seite 48 Verwendung der expliziten Formel Nach Lemma 4.4 auf Seite 31 gibt es eine von allen Parametern unabhängige Konstante C ∈ R+ , so dass für alle h ∈ Z und alle x ∈ R mit x ≥ 2 und alle T ∈ R mit T ≥ 1 X X χ∈Xa %∈N (χ) |Im(%)|≤T Re(%)≤ 21 1 xRe(%) + 1 x1−βa + 1 + C · ϕ (a) · x 2 · ln2 (aT ) ≤ ηa · |%| 1 − βa gilt. Wegen der verallgemeinerten Riemann’schen Vermutung 5.1 ist ηa = 0 und Re (%) ≤ 1 2 für alle % ∈ N (χ) und alle χ ∈ Xa . Damit folgt für alle h ∈ Z, alle x ∈ R mit x ≥ 2 und alle T ∈ R mit 1 ≤ T ≤ x 1 X x% − 1 X τh (χ) 1 a2 · C · ϕ (a) · x 2 · ln2 (aT ) . · ≤ a % ϕ χ∈Xa ϕ (a) %∈N (χ) ggT(a,|h|) |Im(%)|≤T Zuguterletzt ergibt sich der Hauptterm aus der Formel für die Ramanujan–Summe 3.6. (iv) Beweis der Behauptung Für alle h ∈ Z und alle x ∈ R mit x ≥ 2 folgt mit Bemerkung 3.6 auf Seite 26 a µ τh (χ0,a ) ggT(a,|h|) ·x ·x= a ϕ (a) ϕ ggT(a,|h|) und wenn in (ii) und (iii) T := x verwendet wird, ergibt sich mit (i) die Behauptung. X Um dieses Ergebnis mit Lemma 2.8 kombinieren zu können, muss der Übergang von ψ ( · ; · , · ) zu π ( · ; · , · ) vollführt werden. Wie dieser zu leisten ist, wird in Teilabschnitt d von Anhang E ab Seite 153 ausgeführt. Bemerkung 5.3 (Übergang von ψ ( · ; · , · ) zu π ( · ; · , · )) Für alle q ∈ N, alle ` ∈ Z und alle x ∈ R mit x ≥ 2 ist ψ (x; q, `) π (x; q, `) = + ln (x) Zx √ ψ (t; q, `) dt + O x . t · ln2 (t) 2 Wie stets bei Formeln, die durch eine Übertragung von ψ ( · ; · , · ) zu π ( · ; · , · ) (oder jeweils verwandten Funktionen) entstehen, lässt sich die Formel für π ( · ; · , · ) am genauesten mit Hilfe des Gauss’schen Integrallogarithmus notieren. §5: Die Verteilung unter der verallgemeinerten Riemann’schen Vermutung Definition 5.4 (Li) R → R Sei Li : x 7→ Li (x) := max Z {2;x} 2 Seite 49 der Gauss’sche Integrallogarithmus. 1 dt ln (t) Lemma 5.5 (Lemma 2.8 unter der verallgemeinerten Riemann’schen Vermutung) Voraussetzungen: Es gelte die verallgemeinerte Riemann’sche Vermutung 5.1. Seien a ∈ N \ {1}, P∗ := { p ∈ P| ggT (a, p) = 1}, r ∈ N, α ∈ R, β ∈ R und ε ∈ R+ mit α∈ / Wa,P∗ , β∈ / Wa,P∗ , 0 < α < β < 1, ε ≤ min {2α; 2 − 2β; β − α} + ε < 2 · min |x − γ| ∈ R |x ∈ Wa,P∗ und γ ∈ {α; β} . und Behauptung: Dann gilt für alle x ∈ R mit x ≥ 2 a?p ∈ (α; β] # p ∈ P p ≤ x, ggT (a, p) = 1 und p = (β − α) · # { p ∈ P| p ≤ x und ggT (a, p) = 1} 1 a µ ggT(a,|h|) X Z · Li (x) + 1α,β,ε,r (t) · e (ht) dt · a ϕ ggT(a,|h|) h∈Z\{0} 0 1 1 1 2 X Z 2 · x 2 · ln (ax) ϕ (a) · a . + 1α,β,ε,r (t) · e (ht) dt · O a ϕ h∈Z\{0} 0 ggT(a,|h|) Im Beweis wird zunächst die Exponentialsumme aus Lemma 2.8 nach Restklassen modulo a sortiert. Auf diese Weise taucht π (x; a, · ) in den Summanden auf. Beim Übergang zu ψ (x; a, · ) entsteht nach Bemerkung 5.3 ein Integral. Die Summe mit ψ (x; a, · ) kann gemäß Lemma 5.2 in Haupt– und Restterm umgeschrieben werden. Das Integral über den Hauptterm liefert Li, während das Integral über den Restterm in geeigneter Weise beschränkt bleibt. Beweis: (i) Umformen der Exponentialsumme aus Lemma 2.8 Für alle h ∈ Z und alle x ∈ R mit x ≥ 2 gilt wegen Bemerkung 5.3 auf der vorherigen Seite bxc X p=1 p∈ ggT(a,p)=1 P e hp?a a = = a X bxc X `=1 ggT(a,`)=1 p=1 p∈ p≡` (mod a) a X `=1 ggT(a,`)=1 e P e h`?a a hp?a a a X = `=1 ggT(a,`)=1 · ψ (x; a, `) + ln (x) Zx 2 e h`?a a · π (x; a, `) √ ψ (t; a, `) dt + O x t · ln2 (t) Seite 50 Verwendung der expliziten Formel 1 · ln (x) = Zx + a X `=1 ggT(a,`)=1 a X e `=1 ggT(a,`)=1 h`?a a a X 1 · t · ln2 (t) · ψ (x; a, `) e `=1 ggT(a,`)=1 2 + e h`?a a h`?a a · ψ (t; a, `) dt √ x . ·O (ii) Abschätzen des dritten Terms in (i) Wegen { `?a ∈ N| ` ∈ Na mit ggT (a, `) = 1} = { ` ∈ Na | ggT (a, `) = 1} und Bemerkung 3.6 auf Seite 26 gilt für alle h ∈ Z a X e `=1 ggT(a,`)=1 h`?a a a X = e `=1 ggT(a,`)=1 h` a = τh (χ0,a ) = µ a ggT (a, |h|) ϕ (a) · ϕ a ggT(a,|h|) . Damit folgt für alle h ∈ Z und alle x ∈ R mit x ≥ 2 a X e h`?a ·O a `=1 ggT(a,`)=1 √ 1 ϕ (a) · x2 . x = O a ϕ ggT(a,|h|) (iii) Anwenden von Lemma 5.2 auf die ersten beiden Terme in (i) Für alle h ∈ Z und alle x ∈ R mit x ≥ 2 sind nach Lemma 5.2 auf Seite 46 1 · ln (x) a X e `=1 ggT(a,`)=1 h`?a a · ψ (x; a, `) a µ 1 1 ggT(a,|h|) 1 ϕ (a) ·x+O · a 2 · x 2 · ln2 (ax) = · a a ln (x) ϕ ggT(a,|h|) ϕ ggT(a,|h|) und Zx 1 · t · ln2 (t) 2 a X e `=1 ggT(a,`)=1 h`?a a · ψ (t; a, `) dt a µ 1 1 ggT(a,|h|) 1 ϕ (a) ·t+O · a 2 · t 2 · ln2 (at) dt = · a a t · ln2 (t) ϕ ggT(a,|h|) ϕ ggT(a,|h|) 2 a Zx Zx 2 µ ggT(a,|h|) 1 1 ϕ (a) ln (at) · · a2 · √ = dt + O dt . 2 2 a a ln (t) t · ln (t) ϕ ϕ Zx ggT(a,|h|) 2 ggT(a,|h|) 2 §5: Die Verteilung unter der verallgemeinerten Riemann’schen Vermutung Seite 51 (iv) Berechnung des ersten und Abschätzung des zweiten Integrals in (iii) Für alle x ∈ R mit x ≥ 2 ergibt sich mit partieller Integration Zx 1 dt = 2 ln (t) 2 Zx 2 =− t=x Zx 1 1 1 dt t· dt = t · − − 1· − ln (t) t=2 ln (t) t · ln2 (t) 2 x 2 + + ln (x) ln (2) Zx x 2 1 dt = − + Li (x) + . ln (t) ln (x) ln (2) 2 Für alle x ∈ R und alle t ∈ R mit x ≥ t ≥ 2 gilt ln2 (at) ln2 (ax) ≤ . ln2 (t) ln2 (2) Damit folgt für alle x ∈ R mit x ≥ 2 Zx 2 · ln2 (ax) ln2 (at) √ · dt ≤ ln2 (2) t · ln2 (t) Zx 1 1 −1 2 · ln2 (ax) 1 2 − 22 · x · t 2 dt = . 2 ln2 (2) 2 2 Setzt man die beiden Erkenntnisse über die Integrale in (iii) ein, so erhält man mit (ii) und (i) aus Lemma 2.8 auf Seite 19 sofort die Behauptung. X Nun fehlt nur noch eine Abschätzung der Euler’schen ϕ–Funktion nach unten, da diese in der eben gewonnenen Formel auch im Nenner auftritt. Bemerkung 5.6 (Abschätzung der Euler’schen ϕ–Funktion) Es gibt eine von n unabhängige Konstante C ∈ R+ mit C· n ≤ ϕ (n) ≤ n − 1 |ln (ln (n))| für alle n ∈ N \ {1} . Referenz: Siehe [Pr, Satz 5.1 in Kapitel I. auf Seite 24 der 1. Auflage]16 . X Der Betrag im Nenner wurde eingeführt, um auch den Fall n = 2 einzuschließen. n ? o a Damit lässt sich nun zeigen, dass die Menge pp ∈ (0; 1) p ∈ P, p ≤ x und ggT (a, p) = 1 für x ∈ R mit x ≥ 2 und nahezu alle a ∈ N \ {1} mit a < x im Einheitsintervall möglichst gleichmäßig verteilt ist. Der folgende Satz wird in zwei Versionen angegeben. Der Hauptterm beträgt jedesmal (β − α) · # { p ∈ P| p ≤ x und ggT (a, p) = 1} und ist damit in der Größenordnung Li (x) angesiedelt. In der ersten angegebenen Version wird ein Fehler in der Größenordnung x1−δ mit δ ∈ R+ x angestrebt, während sich die zweite angegebene Version mit der Größenordnung o ln(x) begnügt. 16 „Grundlagen der mathematischen Wissenschaften 91 — Primzahlverteilung“, K. Prachar, Springer (Berlin, Göttingen, Heidelberg — 1957), Satz 5.1 in Kapitel I. auf Seite 24 der 1. Auflage Seite 52 Verwendung der expliziten Formel Satz 5.7 Voraussetzungen: Es gelte die verallgemeinerte Riemann’sche Vermutung 5.1. Seien a ∈ N \ {1}, P∗ := { p ∈ P| ggT (a, p) = 1}, α ∈ R, β ∈ R und ε ∈ R+ mit α∈ / Wa,P∗ , und β∈ / Wa,P∗ , 0 < α < β < 1, ε ≤ min {2α; 2 − 2β; β − α} + ε < 2 · min |x − γ| ∈ R |x ∈ Wa,P∗ und γ ∈ {α; β} . Behauptung: Dann gilt für alle δ ∈ R, alle C ∈ R+ , alle D ∈ R+ und alle x ∈ R mit x ≥ 2 und Cxδ ≤ a ≤ Dx1−2δ a?p ∈ (α; β] # p ∈ P p ≤ x, ggT (a, p) = 1 und p = (β − α) · # { p ∈ P| p ≤ x und ggT (a, p) = 1} 2 ln (x) · |ln (ln (x))| 1−δ + OC,D ·x . ε2 Für alle C ∈ R+ , alle D ∈ C · ln (x) ≤ a ≤ D · ln8x(x) gilt R+ und alle x ∈ R+ mit x ≥ 2 und a?p # p ∈ P p ≤ x, ggT (a, p) = 1 und ∈ (α; β] p = (β − α) · # { p ∈ P| p ≤ x und ggT (a, p) = 1} |ln (ln (x))| x + OC,D · . ε2 · ln (x) ln (x) Dabei soll „OC,D “ bedeuten, dass die O–Konstante nur von C und D abhängen kann. Der Beweis stützt sich auf Lemma 5.5 und verwendet hier r := 2. Nach der Abschätzung von ϕ können die Summanden der beiden Summen auf Grund der bekannten Abschätzungen für die Fourier–Koeffizienten von 1α,β,ε,2 so abgeschätzt werden, dass die einzelnen Summen konvergieren. Im Grenzwert steht ein ε2 im Nenner. Dabei ergibt sich in der ersten Summe der Term Li (x) · ln (ln (a)) · a−1 und die zweite 1 1 Summe liefert a 2 · x 2 · ln2 (ax) · ln (ln (a)). x Da Li (x) für alle x ∈ R mit x ≥ 2 durch B · ln(x) mit B ∈ R+ beschränkt ist, folgt damit direkt die Behauptung. Beweis: (i) Abschätzung der einzelnen Komponenten der rechten Seite von Lemma 5.5 Für alle h ∈ Z \ {0} gilt nach Definition 2.6 auf Seite 18 1 Z 1α,β,ε,2 (t) · e (ht) dt ≤ 4 · 1 . π 3 ε2 |h|3 0 §5: Die Verteilung unter der verallgemeinerten Riemann’schen Vermutung Seite 53 Nach Bemerkung 5.6 auf Seite 51 gibt es ein C ∈ R+ mit 1 ϕ a ggT(a,|h|) ≤ C · |ln (ln (a))| · ggT (a, |h|) |h| ≤ C · |ln (ln (a))| · a a für alle h ∈ Z \ {0}. Dabei taucht ggT (a, |h|) nicht im Nenner des Argumentes des iterierten Logarithmus auf, da dessen Argument für ein h ∈ Z \ {0} mit ggT (a, |h|) = a sonst 1 würde. Für alle x ∈ R mit x ≥ e gilt x ln(x) Zx 1 dt = ln (t) Li (x) = Z 1 dt + ln (t) x ln(x) 1 ≤ · ln (2) 1 dt ln (t) x ln(x) 2 2 Zx Z 1 dt + ln 2 Zx 1 x ln(x) · 1 dt = x ln(x) −2 ln (2) x ln(x) x x − ln(x) + x ln ln(x) x 1 +1 · . ≤ ln (2) ln (x) + R → R Li und sind auf ihren Definitionsbereichen stetig. x x 7→ ln(x) y Deshalb existieren max (Li (y)) und min ln(y) . y∈[2;e] y∈[2;e] Für alle x ∈ [2; e] gilt Li (x) · min y∈[2;e] y ln (y) ≤ max (Li (y)) · y∈[2;e] x . ln (x) Also gibt es ein B ∈ R mit Li (x) ≤ B · für alle x ∈ R mit x ≥ 2. Es gilt X X 1 1 = 2 · L (2, χ0,1 ) . 2 =2· n2 |h| n∈ N h∈Z\{0} x ln(x) + (ii) Abschätzung des Li–Terms aus Lemma 5.5 Für alle x ∈ R mit x ≥ 2 folgt a Z1 µ ggT(a,|h|) X 1 (t) · e (ht) dt · · Li (x) α,β,ε,2 a h∈Z\{0} ϕ ggT(a,|h|) 0 1 µ a X Z ggT(a,|h|) 1α,β,ε,2 (t) · e (ht) dt · · Li (x) ≤ a ϕ h∈Z\{0} 0 ggT(a,|h|) X 4 1 |h| x · 3 · C · |ln (ln (a))| · ·B· ≤ 3 2 π ε |h| a ln (x) Z h∈ \{0} = 8BC · L (2, χ0,1 ) |ln (ln (a))| x · . · 2 π3 ε · ln (x) a Seite 54 Verwendung der expliziten Formel (iii) Abschätzung des O–Terms aus Lemma 5.5 Außerdem gilt für alle x ∈ R mit x ≥ 2 Z1 X 1 1 ϕ (a) 2 2 2 1 (t) · e (ht) dt · · a · x · ln (ax) α,β,ε,2 a h∈Z\{0} ϕ ggT(a,|h|) 0 1 X Z 1α,β,ε,2 (t) · e (ht) dt · ϕ (a) · a 12 · x 12 · ln2 (ax) ≤ a ϕ ggT(a,|h|) h∈Z\{0} 0 X 1 1 4 |h| 1 ≤ ϕ (a) · a 2 · x 2 · ln2 (ax) · · 3 · C · |ln (ln (a))| · 3 2 π ε |h| a h∈Z\{0} = 1 8C · L (2, χ0,1 ) |ln (ln (a))| · ln2 (ax) ϕ (a) 1 · · · a2 · x2 . 3 2 π ε a (iv) Anwenden von Lemma 5.5 Nach Lemma 5.5 auf Seite 49, (ii) und (iii) ist für alle x ∈ R mit x ≥ 2 a?p # p ∈ P p ≤ x, ggT (a, p) = 1 und ∈ (α; β] p = (β − α) · # { p ∈ P| p ≤ x und ggT (a, p) = 1} 1 a Z µ X ggT(a,|h|) · Li (x) + 1α,β,ε,2 (t) · e (ht) dt · a ϕ h∈Z\{0} 0 ggT(a,|h|) 1 X Z 1 1 ϕ (a) · a 2 · x 2 · ln2 (ax) + 1α,β,ε,2 (t) · e (ht) dt · O a ϕ ggT(a,|h|) h∈Z\{0} 0 = (β − α) · # { p ∈ P| p ≤ x und ggT (a, p) = 1} 8BC · L (2, χ0,1 ) |ln (ln (a))| x +O · 2 · π3 ε · ln (x) a 1 8C · L (2, χ0,1 ) |ln (ln (a))| · ln2 (ax) ϕ (a) 1 2 · x2 +O · · · a . π3 ε2 a Die erste Behauptung folgt mit ϕ (a) ≤ a − 1 wegen den für alle δ ∈ R, alle C1 ∈ R+ , alle D1 ∈ R+ und alle x ∈ R mit x ≥ 2 und C1 · xδ ≤ a ≤ D1 · x1−2δ gültigen Ungleichungen x x 1 ≤ = · x1−δ δ a C1 C1 · x und 1 p 1 1 1 2 a 2 · x 2 ≤ D1 · x1−2δ · x 2 = D1 · x1−δ . Die zweite Behauptung folgt mit ϕ (a) ≤ a − 1 wegen den für alle C2 ∈ R+ , alle D2 ∈ alle x ∈ R+ mit x ≥ 2 und C2 · ln (x) ≤ a ≤ D2 · ln8x(x) gültigen Ungleichungen |ln (ln (a))| x 1 |ln (ln (D2 · x))| x · ≤ · · ln (x) a C2 ln (x) ln (x) und Dissertation von Simon Feiler zum Thema Die relative Verteilung der Inversen einer natürlichen Zahl zu variablen Moduln R+ und §5: Die Verteilung unter der verallgemeinerten Riemann’schen Vermutung 1 2 2 1 2 2 2 |ln (ln (a))| · ln (ax) · a · x ≤ |ln (ln (D2 · x))| · ln D2 · x |ln (ln (x))| x = OD2 , · ln (x) ln (x) x · D2 · 8 ln (x) wobei „OD2 “ bedeuten soll, dass die O–Konstante von D2 abhängen kann. Damit dürfte das mit dieser Methode maximal erreichbare Ergebnis bewiesen sein. An der Beweisführung aus §5 wird auch deutlich, warum ein analoges Ergebnis im unbedingten Fall (also ohne die Annahme der Gültikeit der verallgemeinerten Riemann’schen Vermutung) nur zu einem unbefriedigend schwachem Ergebnis führt. Die Abschätzung der Nullstellensumme wird für a ∈ N \ {1} und h ∈ Z im Prinzip 1 lediglich mit a2 a ϕ ggT(a,|h|) multipliziert und findet sich in dieser Gestalt im Beweis von Satz 5.7 wieder. Beachtet man nicht nur den Beitrag der Nullstellen mit einem Realteil von höchstens 1 2 , sondern des gesamten kritischen Streifen, so ergibt sich aus Lemma 4.9 auf Seite 37 der Term 5 a 2 −2S+ϑ · xS , wobei ϑ ∈ R+ beliebig und S ∈ 21 ; 1 derart gewählt ist, dass höchstens die eventu- Seite 55 1 2 1 · x2 X ell vorhandene Ausnahmenullstelle modulo a in { s ∈ C| Re (s) ≥ S und |Im (s)| ≤ T } mit einem von x abhängigen T ∈ R mit T ≥ 1 liegt. x Damit dieser Term o ln(x) sein kann, muss auf jeden Fall 2−2S a < x 5−4S gelten. Dieser Exponent bewegt sich monoton fallend von 13 nach 0, wenn S von 12 nach 1 wandert. Da für S nach dem momentanen Stand der Forschung eher Werte nahe der 1 anzusetzen sind, gilt eine zu Satz 5.7 analoge Formel im unbedingten Fall also nur für sehr wenige (a, x)T ∈ N × R. Wesentlich mehr (a, x)T ∈ N × R lassen sich im unbedingten Fall mit der in Kapitel IV vorgestellten Methode erreichen. Kapitel IV Verwendung von Kloosterman–Summen und der Vaughan–Identität Die Exponentialsumme in Lemma 2.8 kann auch als unvollständige Kloosterman–Summe angesehen werden. Wie schon gesehen, wird versucht, diese möglichst gut in der Länge abzuschätzen. Leider lassen sich in der Literatur keine wirksamen Abschätzungen für unvollständige Kloosterman–Summen in der Länge finden. Die vorhandenen Abschätzungen verbessern die triviale Abschätzung nur um Potenzen des natürlichen Logarithmus der Länge (siehe zum Beispiel [Ko]17 ). Auch in dieser Arbeit werden bezüglich der Abschätzung von unvollständigen Kloosterman–Summen in der Länge keine besseren Ergebnisse erzielt. Schreibt man die Exponentialsumme hingegen um, so lässt sie sich mit der Vaughan–Identität auf wesentlich kürzere Kloosterman–Summen zurückführen. Diese können dann relativ gut im Modul abgeschätzt werden. Wie in Satz 5.7 wird auch in diesem Kapitel wieder untersucht, welche Bedingungen Modul und Umfang der betrachteten Menge erfüllen müssen, damit die Menge der relativen Inversen so gleichmäßig wie möglich in [0; 1) verteilt liegt. Länge der Exponentialsumme und Modul werden wiederum korrelieren, weshalb eine gute Abschätzung im Modul bei gleichzeitiger Reduzierung der Länge auf dem Weg zu den gewünschten Ergebnissen zum Ziel führt. §6: Unvollständige Kloosterman–Summen Zunächst soll die Abschätzung einer unvollständigen Kloosterman–Summe dargelegt werden. Die vorgestellte Methode zur Abschätzung solcher Summen findet sich in ähnlicher Form in Abschnitt 2.5 von [Ho]18 . Allerdings lässt die hier vorgestellte Version im Gegensatz zur Version bei Hooley alle denkba17 ren Summenlängen zu und geht am Ende auch noch auf den Sonderfall ein, dass einer der beiden Parameter der Kloosterman– Summe verschwindet. Damit klar ist, worüber in §6 gesprochen wird, werden Kloosterman–Summen zunächst definiert. „Incomplete Kloosterman sums and their applications“, M. A. Korolev, Izvestiya: Mathematics 64 (2000), Seiten 1129 bis 1152 Original in „Nepolnye summy Kloostermana i ih priloeni “, M. A. Korolv, Izvesti Rossisko akademii nauk. Seri Matematiqeska 64 (2000), Seiten 41 bis 64 von Teil 6 18 „Applications of sieve methods to the theory of numbers“, C. Hooley, Cambridge University Press (Cambridge — 1976) Seite 58 Verwendung von Kloosterman–Summen und der Vaughan–Identität Definition 6.1 (Kloosterman–Summen und die Teileranzahl–Funktion) a) Sei S: Z2 × (Z \ {0}) → C (u, v, q) T 7→ S (u, v; q) := |q| X n=1 ggT(q,n)=1 ? un + vnq . e |q| S (u, v; q) mit u ∈ Z, v ∈ Z und q ∈ Z \ {0} heißt vollständige Kloosterman–Summe modulo q bezüglich u und v. N → N b) Sei τ. : die Teileranzahl–Funktion. n 7→ τ. (n) := # { d ∈ N| d teilt n} Vollständige Kloosterman–Summen sind seit Mitte des zwanzigsten Jahrhunderts relativ gut im Modul abschätzbar. Hilfssatz 6.2 (Abschätzung von vollständigen Kloosterman–Summen) Behauptung: Für alle u ∈ Z, alle v ∈ Z und alle q ∈ Z \ {0} gilt p |S (u, v; q)| ≤ τ. (|q|) · |q| · ggT (|q| , u, v). Referenz: Siehe [Es, Formel (6) auf Seite 83]19 . X Hat man es dagegen mit unvollständigen Kloosterman–Summen zu tun, so empfiehlt es sich, diese zu „vervollständigen“, um danach eine Abschätzung mit Hilfe von Hilfssatz 6.2 zu erhalten. Für die Vervollständigung wird ein Spezialfall der geometrischen Summe benötigt. Bemerkung 6.3 (Geometrische Summe) Für alle n ∈ Z und alle q ∈ Z ist ( |q| X |q| , falls n ≡ 0 (mod |q|) ist; `n e = q 0, falls n 6≡ 0 (mod |q|) ist. `=1 Beweis: Sei q ∈ Z. Für alle n ∈ Z ist e nq = 1 genau dann, wenn n ≡ 0 (mod |q|) ist. Für alle n ∈ Z mit n ≡ 0 (mod |q|) folgt X |q| |q| ` |q| X X `n n = e = 1 = |q| . e q q `=1 `=1 `=1 Für alle n ∈ Z mit n 6≡ 0 (mod |q|) ergibt sich mit der geometrischen Summenformel n|q| ` 1 − e n q |q|−1 |q| 1 − e X X q q `n n = = 0. e = e = q q 1−e n 1−e n `=1 19 `=0 q X q „On Kloosterman’s Sum“, T. Estermann, Mathematika 8 (1961), Seiten 83 bis 86, Formel (6) auf Seite 83 §6: Unvollständige Kloosterman–Summen Seite 59 Diese Formel ist der Schlüssel zur folgenden Vervollständigung von unvollständigen Kloosterman–Summen. Bemerkung 6.4 (Vervollständigung unvollständiger Kloosterman–Summen) Für alle u ∈ Z, alle v ∈ Z, alle q ∈ Z \ {0} und alle A ⊆ Z mit #A < ∞ ist X e n∈A ggT(q,n)=1 un + vn?q q |q| X `n 1 X q q = . · S |q| · (u − `) , |q| · v; q · e |q| q n∈A `=1 Beweis: Für alle u ∈ Z, alle v ∈ Z, alle q ∈ Z \{0} und alle A ⊆ Z mit #A < ∞ ist wegen Bemerkung 6.3 auf der vorherigen Seite X n∈A ggT(q,n)=1 e un + vn?q q = |q| X e k=1 ggT(q,k)=1 = |q| X e k=1 ggT(q,k)=1 = |q| X uk + vkq? q uk + vkq? q X |q| 1 X ` · (n − k) · · e |q| q X · 1 n∈A n≡k (mod |q|) n∈A `=1 X |q| X (u − `) · k + vkq? 1 `n ·e · e |q| q q n∈A k=1 `=1 ggT(q,k)=1 X |q| 1 X |q| |q| `n = S · · (u − `) , · v; q · e . |q| q q q `=1 X n∈A Man beachte, dass in der inneren Summe auf der rechten Seite keine Größter–gemeinsamer– Teiler–Bedingung mehr zu finden ist. In dieser Arbeit werden Kloosterman–Summen über Intervalle natürlicher Zahlen, die teilerfremd zum Modul der Summe sind, betrachtet. Bei der Vervollständigung ist also nach Bemerkung 6.4 der entsprechende Abschnitt der geometrischen Reihe abzuschätzen. Lemma 6.5 (Zusammenhängende Teilabschnitte der geometrischen Reihe) Behauptung: Für alle ` ∈ Z, alle q ∈ Z \ {0}, die ` nicht teilen, alle x ∈ R und alle y ∈ mit x ≥ byc + 1 ≥ 1 ist X e (byc+1)·` − e (bxc+1)·` bxc q q `n e = . π` q n=byc+1 2 · sin |q| Im Beweis wird lediglich auf die geometrische Summenformel zurückgegriffen. Der Betrag des Nenners lässt sich dann mit der Euler’schen Formel für eiα mit α ∈ vereinfachen. R R Seite 60 Verwendung von Kloosterman–Summen und der Vaughan–Identität Beweis: (i) Geometrische Summenformel Seien ` ∈ Z, q ∈ Z \ {0} kein Teiler von `, x ∈ R und y ∈ R mit x ≥ byc + 1 ≥ 1. Mit der geometrischen Summenformel folgt bxc X n=byc+1 e `n q = bxc n byc n X X ` ` e e − q q n=0 n=0 bxc+1 byc+1 1 − e q` 1 − e q` = − 1 − e q` 1 − e q` (bxc+1)·` e (byc+1)·` − e q q = . 1 − e q` (ii) Berechnung des Betrags des Nenners Wegen |e (α)| = 1, e (α) = cos (2πα) + i · sin (2πα), cos (−α) = cos (α) und sin (−α) = − sin (α) für alle α ∈ R ist 1 − e ` = e − ` · 1 − e ` = e − ` − e ` q 2q q 2q 2q π` π` π` π` = cos − + i · sin − − cos − i · sin q q q q π` sin π` . = −2i · sin = 2 · X q |q| Da der Sinus im Nenner schwer zu handhaben ist, wird er linear abgeschätzt. Der Beweis hierzu ist eine einfache Anwendung des Satzes von Rolle, der besagt, dass zwischen zwei Nullstellen einer stetig differenzierbaren Funktion stets eine Extremstelle liegen muss. Bemerkung 6.6 Es ist sin (πx) ≥ x für alle x ∈ R mit 0 ≤ x ≤ 12 . Beweis: Sei f : R → R . x 7→ f (x) := sin (πx) − x f ist stetig differenzierbar mit f 0 (x) = π · cos (πx) − 1 für alle x ∈ R. f 0 hat also dasselbe Monotonieverhalten wie cos (π·). Insbesondere ist f 0 auf (0; 1) streng monoton fallend und hat dort maximal eine Nullstelle. Mit dem Satz von Rolle folgt, dass f in [0; 1] höchstens zwei Nullstellen haben kann. √ √ Mit f (0) = 0, f 21 = 1− 12 = 21 > 0 und f 34 = √12 − 34 = 8−4 9 < 0 folgt die Behauptung. X §6: Unvollständige Kloosterman–Summen Seite 61 Damit lassen sich nun unvollständige Kloosterman–Summen abschätzen. Lemma 6.7 (Abschätzung von unvollständigen Kloosterman–Summen) Behauptung: Für alle u ∈ Z, alle v ∈ x ≥ byc + 1 ≥ 1 ist Z, alle q ∈ Z \ {0}, alle x ∈ R und alle y ∈ R mit bxc ? X un + vnq e q n=byc+1 ggT(q,n)=1 j k |q| 2 X p bxc − byc 1 ≤ +2· · τ. (|q|) · |q| · ggT (|q| , v). q ` `=1 Im Beweis wird die Kloosterman–Summe zunächst mittels Bemerkung 6.4 vervollständigt und danach die vollständige Kloosterman–Summe nach Hilfssatz 6.2 abgeschätzt. Dabei enteht eine Summe über alle natürlichen Zahlen unterhalb von |q| (einschließlich). Der |q|–te Summand liefert den ersten Term (und damit meist den Hauptbeitrag) in der Klammer der Behauptung. Die restliche Summe über ` ∈ N mit 1 ≤ ` < |q| wird in der Mitte geteilt, so dass auf die innere Summe Lemma 6.5 und Bemerkung 6.6 angewandt werden können. Beweis: (i) Dreiecksungleichung und Lemma 6.2 Seien u ∈ Z, v ∈ Z, q ∈ Z \ {0}, x ∈ R und y ∈ R mit x ≥ byc + 1 ≥ 1. Mit Lemma 6.2 auf Seite 58 und der Dreiecksungleichung folgt wegen Bemerkung 6.4 auf Seite 59 X bxc |q| bxc X un + vn?q 1 X q `n q = · e S |q| · (u − `) , |q| · v; |q| · e q |q| q n=byc+1 `=1 n=byc+1 ggT(q,n)=1 |q| bxc X 1 X q `n q ≤ · e S |q| · (u − `) , |q| · v; |q| · |q| q `=1 n=byc+1 p |q| bxc X X τ. (|q|) · |q| · ggT (|q| , v) `n e . ≤ · |q| q `=1 n=byc+1 (ii) Symmetrie des letzten Betrags bezüglich 2q und Lemma 6.5 Für alle ` ∈ Z gilt bxc X X bxc bxc X `n (q − `) · n `n e − e e = = , q q q n=byc+1 n=byc+1 n=byc+1 da die mittlere Summe das Konjugiert–Komplexe der ersten Summe darstellt. Seite 62 Verwendung von Kloosterman–Summen und der Vaughan–Identität Wendet man dies auf alle ` ∈ N mit j bxc X X `n e = q `=1 n=byc+1 |q|−1 |q|−1 2 |q| 2 k < ` < |q| an, so folgt mit Lemma 6.5 auf Seite 59 bxc X X `n e + q `=1 n=byc+1 bxc X n , falls e 2 + n=byc+1 0, falls j k |q| bxc 2 X X `n ≤ 2· e q `=1 n=byc+1 k |q| (byc+1)·` 2 e X q j = `=1 sin |q|−1 X j k |q| `= 2 +1 q 2 ∈ Z ist q 2 ∈ / Z ist X bxc (q − `) · n e q n=byc+1 − e (bxc+1)·` q . π` |q| (iii) Dreiecksungleichung und Bemerkung 6.6 ` 1 Für alle ` ∈ N mit ` ≤ |q| 2 ist |q| ≤ 2 . Mit der Dreiecksungleichung und Bemerkung 6.6 auf Seite 60 folgt wegen (ii) bxc X |q| bxc |q|−1 X X X X bxc `n `n = e · n + e e |q| q q q `=1 n=byc+1 `=1 n=byc+1 n=byc+1 j k |q| (byc+1)·` (bxc+1)·` 2 + e e X q q ≤ |bxc − byc| + π` sin |q| `=1 j ≤ |bxc − byc| + Mit (i) ist das die Behauptung. |q| 2 k X 2 ` `=1 |q| . X Lemma 6.7 ist im Wesentlichen eine leichte Verallgemeinerung von Lemma 4 in Kapitel 2 aus [Ho]. Es liefert eine Abschätzung für allgemeine unvollständige Kloosterman–Summen. In Lemma 2.8 tritt allerdings eine Kloosterman–Summe auf, bei der der Parameter u verschwindet. In diesem Fall erhält man noch bessere Abschätzungen, wenn man die Summe in Stücke der Länge ϕ (|q|) und ein Reststück aufteilt. Hier können die Stücke der Länge ϕ (|q|) als Ramanujan–Summen zum Modul |q| interpretiert werden. Eine Ramanujan–Summe ist eine verallgemeinerte Gauss’sche Summe, die mit einem Dirichlet–Hauptcharakter gebildet wird. Das Reststück wird dann wie oben gezeigt abgeschätzt. §6: Unvollständige Kloosterman–Summen Seite 63 Lemma 6.8 (Abschätzung von unvollständigen Kloosterman–Summen mit u = 0) Behauptung: Für alle j h ∈ Zk, alle q ∈ Z \ {0}, alle x ∈ R und alle y ∈ R mit x ≥ byc + 1 und · |q| ≥ 0 ist byc + bxc−byc |q| ? bxc X hnq bxc − byc |q| ϕ (|q|) e − ·µ · |q| q |q| ggT (|q| , |h|) ϕ n=byc+1 ggT(|q|,|h|) ggT(q,n)=1 j k |q| 2 X p 1 < 1 + 2 · · τ. (|q|) · |q| · ggT (|q| , |h|). ` `=1 Diese Abschätzung wird dann später zur Abschätzung der sich aus der Vaughan–Identität ergebenden Terme eingesetzt. Man beachte, dass die Abschätzung in der Länge im Wesentlichen ein |q|–tel der trivialen Abschätzung beträgt, während die Abschätzung im Modul quasi direkt von den vollständigen Kloosterman–Summen übernommen wird. Beweis: (i) Aufsplitten der Summe j k Seien h ∈ Z, q ∈ Z \ {0}, x ∈ R und y ∈ R mit x ≥ byc + 1 und byc + bxc−byc · |q| ≥ 0. |q| Dann gilt j bxc X e n=byc+1 ggT(q,n)=1 hn?q q bxc X = e j k bxc−byc n=byc+1+ ·|q| |q| hn?q q + bxc−byc |q| X `=1 k byc+`·|q| X e n=byc+1+(`−1)·|q| ggT(q,n)=1 ggT(q,n)=1 |q| q · hn?q |q| (ii) Berechnen der Doppelsumme mit Bemerkung 3.6 Für alle ` ∈ Z ist nun {n ∈ Z |byc + (` − 1) · |q| < n ≤ byc + ` · |q| und ggT (q, n) = 1 } ein reduziertes Restsystem modulo |q|. Damit ist für alle ` ∈ Z auch ? nq ∈ N |byc + (` − 1) · |q| < n ≤ byc + ` · |q| und ggT (q, n) = 1 ein reduziertes Restsystem modulo |q|. Für alle ` ∈ Z ergibt sich byc+`·|q| X n=byc+1+(`−1)·|q| ggT(q,n)=1 e |q| q · hn?q |q| = |q| X n=1 ggT(|q|,n)=1 e q |q| ·h ·n = τ q ·h χ0,|q| . |q| |q| . Seite 64 Verwendung von Kloosterman–Summen und der Vaughan–Identität Nach Bemerkung 3.6 auf Seite 26 folgt für alle ` ∈ Z |q| byc+`·|q| ? X · hn |q| q q = µ e |q| ggT |q| , n=byc+1+(`−1)·|q| ggT(q,n)=1 q Wegen |q| · h = j bxc−byc |q| |q| |q| q |q| · · h ϕ (|q|) ϕ !. |q| q ggT |q|, |q| ·h · |h| = |h| erhält man also k byc+`·|q| X X `=1 n=byc+1+(`−1)·|q| ggT(q,n)=1 e |q| q · hn?q |q| |q| ϕ (|q|) = bxc − byc · µ . · |q| |q| ggT (|q| , |h|) ϕ ggT(|q|,|h|) (iii) Abschätzen des Betrags der Restsumme Nach Lemma 6.7 auf Seite 61 gilt ? bxc bxc X X hnq 0 · n + hn?q e e q = q j k n=byc+1+j bxc−byc k·|q| bxc−byc n=byc+ |q| ·|q|+1 |q| ggT(q,n)=1 ggT(q,n)=1 j k j k |q| bxc−byc 2 bxc − byc + · |q| X p |q| 1 ≤ +2· · τ. (|q|) · |q| · ggT (|q| , |h|) |q| ` `=1 j |q| k 2 X p 1 < 1 + 2 · · τ. (|q|) · |q| · ggT (|q| , |h|) ` `=1 wegen bxc − byc bxc − byc · |q| > − 1 · |q| = bxc − byc − |q| . |q| |q| X §7: Die Vaughan–Identität 1977 entwickelte R. C. Vaughan in seinem Artikel „Sommes trigonométriques sur les nombres premiers“ 20 eine neue Methode zur Abschätzung von Summen der Form bxc X Λ (n) · f (n), mit x ∈ R, w ∈ R und 0 ≤ bwc ≤ x−1, die später nach ihm „Vaughan– n=bwc+1 Identität“ benannt wurde. Eine gute Bescheibung in englischer Sprache findet sich in „An elementary method in prime number theory“, R. C. Vaughan, Acta Arthmetica 37 (1980), Seiten 111 bis 115 oder in der neueren Fachliteratur. 20 „Sommes trigonométriques sur les nombres premiers“, R. C. Vaughan, Comptes Rendus Hebdomadaires des Séances de l’Académie des Sciences. Séries A et B 285 (1977), Seiten A981 bis A983 §7: Die Vaughan–Identität Seite 65 byc X Die Vaughan–Identität nutzt die einfache Tatsache µ (d) = 0 für alle n ∈ N und alle d=1 d teilt n y ∈ R mit 2 ≤ n ≤ y, um aus der relativ langen Ursprungssumme mehrere kürzere Summen zu erhalten, die einzeln abgeschätzt in der Summe eine bessere Abschätzung ergeben als eine direkte Abschätzung der Ursprungssumme. Ein weiterer entscheidender Vorteil der Vaughan–Identität ist, dass die „nichtlineare“ Sumbx̃c bxc X X f (bn) mit b ∈ N Λ (n) · f (n) zum Teil in „lineare“ Summen der Form me n=bw̃c+1 n=bwc+1 überführt wird. Ist f vollständig multiplikativ oder von Parametern abhängig, in die b ohne großen Verlust „eingearbeitet“ werden kann, so ist die Bezeichnung „lineare Summe“ klar gerechtfertigt. Die Form der Vaughan–Identität, die hier verwendet wird, wird in Anhang D ab Seite 136 entwickelt. Hilfssatz 7.1 (Vaughan–Identität) Voraussetzungen: A → C Seien A ⊆ C mit N ⊆ A und f : m 7→ f (m) Seien y ∈ R mit y ≥ 1 und z ∈ R mit z ≥ 1. . Behauptung: Für alle x ∈ R mit x ≥ yz gilt bxc X bzc X Λ (m) · f (m) = m=1 Λ (m) · f (m) m=1 + byc X bZxb c µ (b) · b=1 1 · s 1 x bX bc byc bzc − XX µ (b) · Λ (c) · x bX bc c b=1 c=1 − f (bn) ds n=bsc+1 f (bcn) n=1 x bX zc byc X n=byc+1 d=1 d teilt n µ (d) · x bX nc Λ (b) · f (bn). b=bzc+1 Die Funktion f wird indieserArbeit die Funktion sein, die eine natürliche, zu a ∈ N \ {1} hn?a teilerfremde Zahl n auf e mit h ∈ Z abbildet und die auf den nicht zu a teilerfremden a natürlichen Zahlen verschwindet. f ist also im hier behandelten Fall von dem Parameter h abhängig. Die erste Summe aus der rechten Seite der Vaughan–Identität kann durch geschickte Wahl von z trivial abgeschätzt werden, ohne das Ergebnis zu stören. Mit Hilfe der in §6 gewonnenen Abschätzungen sollen nun die anderen in der Vaughan– Identität auftretenden Terme abgeschätzt werden. Da der Parameter h in den Ergebnissen von §6 lediglich im größten gemeinsamen Teiler auftritt, kann hier problemlos mit b?a bzw. c?a Dissertation von Simon Feiler zum Thema Die relative Verteilung der Inversen einer natürlichen Zahl zu variablen Moduln Seite 66 Verwendung von Kloosterman–Summen und der Vaughan–Identität multipliziert werden, ohne das Ergebnis zu verändern. Damit ergeben sich tatsächlich „lineare Summen“ in den beiden mittleren Termen der Vaughan–Identität. Der letzte Term bedarf einer besonderen Behandlung. Nach Anwenden der Hölder’schen Ungleichung kann aber auch er so umgewandelt werden, dass in dem entstehenden Term eine lineare Summe auftaucht. Wegen des Auftretens der Teilerfunktion τ. in §6 benötigt man eine Abschätzung derselben für alle drei Terme. Bemerkung 7.2 Für alle ϑ ∈ gilt R+ gibt es eine nur von ϑ abhängige Konstante Cϑ ∈ R+ , so dass für alle n ∈ N τ. (n) = n X 1 ≤ Cϑ · n ϑ . d=1 d teilt n Referenz: Siehe [Hu, Theorem 5.2 in Kapitel 6 auf Seite 111 der englischen Ausgabe]21 . X Außerdem müssen nach dem Anwenden der Ergebnisse aus §6 noch gewisse Restsummen abgeschätzt werden. Der Beweis der folgenden Bemerkung findet sich in Anhang C ab Seite 133. Er beruht weitestgehend auf partieller Summation, sowie dem Satz von Qebyxv† und einer Formel für die Anzahl der quadratfreien Zahlen unterhalb einer reellen Schranke. Bemerkung 7.3 Es gibt von y unabhänige Konstanten Q ∈ R+ und C ∈ R+ , so dass für alle y ∈ R mit y ≥ 1 byc X b=1 Λ (b) ≤ Q · y, byc X Λ (b) b=1 b ≤ Q · (ln (y) + 1) und X byc 2 µ (b) 6 − 2 · ln (y) ≤ C π b=1 b sind. a: Abschätzung der beiden mittleren Terme der Vaughan–Identität In Teilabschnitt a sollen der Integralterm und der „lineare Term“ — sprich der Dreifach– Summen–Term, in dem die innere Summe eine „lineare“ Summe darstellt — aus der Vaughan–Identität abgeschätzt werden. Bei beiden Termen haben die Kloosterman–Summen bereits die Form von Lemma 6.8, so dass dieses Lemma direkt angewandt werden kann. Deshalb ist die Abschätzung für diese beiden Terme relativ leicht zu erhalten. 21 „Introduction to number theory“, Hua L. K., Springer (Berlin, Heidelberg, New York — 1982), Theorem 5.2 in Kapitel 6 auf Seite 111 der englischen Ausgabe † sprich: „Chebyshev“ §7: Die Vaughan–Identität Seite 67 Lemma 7.4 (Integralterm) Voraussetzungen: Seien a ∈ N \ {1}, ϑ ∈ R+ , h ∈ Z und y ∈ R mit y ≥ 1 und x ∈ R mit x ≥ y. Behauptung: Dann gibt es eine Konstante C ∈ R+ und eine nur von ϑ abhängige Konstante Cϑ ∈ R+ mit x x b c X bX Zb bc ? byc h · (bn)a 1 µ (b) · ds · e s a b=1 n=bsc+1 1 ggT(a,b)=1 ggT(a,n)=1 x a ≤ C · µ2 ggT(a,|h|) · |ln (ln (a))| · ln (x) · ln (y) · · ggT (a, |h|) a a bX 2c p 1 1 +ϑ + Cϑ · 1 + 2 · · ln (x) · ya 2 · ggT (a, |h|). ` `=1 Im Beweis wird nach Anwendung der Dreiecksungleichung die Kloosterman–Summe abgeschätzt. Danach wird die untere Grenze fallengelassen und es bleiben lediglich Terme übrig, die mit den beiden dem Teilabschnitt vorgegangenen Bemerkungen abgeschätzt werden können, um die gewünschte Form zu erhalten. Beweis: (i) Abschätzung der Kloosterman–Summe x bZxb c bX byc bc X h · (bn)?a 1 Sei Σx,y (a, h) := µ (b) · · e ds. s a b=1 ggT(a,b)=1 n=bsc+1 ggT(a,n)=1 1 Mit der Dreiecksungleichung und Lemma 6.8 auf Seite 63 folgt |Σx,y (a, h)| byc X ≤ µ2 (b) · b=1 ggT(a,b)=1 byc X ≤ bZxb c 1 µ2 (b) · b=1 ggT(a,b)=1 + byc X b=1 ggT(a,b)=1 1 · s x bX bc e n=bsc+1 ggT(a,n)=1 bZxb c 1 · s $ x b 1 2 bZxb c µ (b) · 1 (b?a h) · n?a ds a % − bsc a ϕ (a) 2 ds ·µ · ? a a ggT (a, |ba h|) ϕ ggT(a,|b ? h|) a a bX 2c p 1 1 · 1 + 2 · · τ. (a) · a · ggT (a, |b?a h|) ds s ` `=1 Seite 68 Verwendung von Kloosterman–Summen und der Vaughan–Identität µ2 ϕ ≤ a ggT(a,|h|) a ggT(a,|h|) · ϕ (a) ·x· a byc X b=1 ggT(a,b)=1 µ2 (b) b a bX 2c p 1 + 1 + 2 · · τ. (a) · a · ggT (a, |h|) · ` `=1 bZxb c · 1 ds s 1 byc X µ2 (b) · b=1 ggT(a,b)=1 bZxb c 1 ds. s 1 (ii) Abschätzung des Integrals, der b–Summen, von ϕ und von τ. Für alle b ∈ N mit b ≤ y ist bZxb c j x k x 1 ds = ln ≤ ln ≤ ln (x) . s b b 1 Nach Bemerkung 5.6 auf Seite 51, Bemerkung 7.3 auf Seite 66 und Bemerkung 7.2 auf Seite 66 gibt es ein C ∈ R+ und ein von ϑ abhängiges Cϑ ∈ R+ mit |Σx,y (a, h)| µ2 ≤ a ggT(a,|h|) ϕ (a) x · |ln (ln (a))| · ln (x) · ln (y) · · · ggT (a, |h|) a a C a bX c 2 p 1 1 +ϑ + Cϑ · 1 + 2 · · ln (x) · ya 2 · ggT (a, |h|). ` X `=1 Im Prinzip völlig analog läuft die Abschätzung des linearen Terms. Lemma 7.5 (Linearer Term) Voraussetzungen: Seien a ∈ N \ {1}, ϑ ∈ R+ , h ∈ Z und (x, y, z)T ∈ R3 mit y ≥ 1, z ≥ 1 und x ≥ yz. Behauptung: Dann gibt es eine Konstante C ∈ R+ und eine nur von ϑ abhängige Konstante Cϑ ∈ R+ mit x byc b c bzc bc ? X X X h · (bcn) a µ (b) · Λ (c) · e a b=1 c=1 n=1 ggT(a,b)=1 ggT(a,c)=1 ggT(a,n)=1 x a ≤ C · µ2 ggT(a,|h|) · |ln (ln (a))| · ln (y) · ln (ez) · · ggT (a, |h|) a a bX 2c p 1 1 +ϑ + Cϑ · 1 + 2 · · yza 2 · ggT (a, |h|). ` `=1 §7: Die Vaughan–Identität Seite 69 Beweis: (i) Abschätzung der Kloosterman–Summe byc X Sei Σx,y,z (a, h) := bzc X µ (b) · Λ (c) · x bX bc c e n=1 ggT(a,n)=1 c=1 b=1 ggT(a,b)=1 ggT(a,c)=1 h · (bcn)?a . a Mit der Dreiecksungleichung und Lemma 6.8 auf Seite 63 folgt |Σx,y,z (a, h)| x b bc c byc bzc ? ? ? X X X (hba ca ) · na ≤ µ2 (b) · Λ (c) · e a n=1 c=1 b=1 ggT(a,n)=1 ggT(a,b)=1 ggT(a,c)=1 $ % 2 a byc bzc x µ ggT(a,|b X X ? c? h|) a a bc · ϕ (a) ≤ µ2 (b) · Λ (c) · · a a ϕ c=1 b=1 ggT(a,|b? c? h|) a a ggT(a,b)=1 ggT(a,c)=1 bzc X byc X + c=1 b=1 ggT(a,b)=1 ggT(a,c)=1 µ2 ϕ ≤ a ggT(a,|h|) a ggT(a,|h|) a bX 2c p 1 2 µ (b) · Λ (c) · 1 + 2 · · τ. (a) · a · ggT (a, |b?a c?a h|) ` `=1 · ϕ (a) ·x· a byc X b=1 ggT(a,b)=1 µ2 (b) · b a bX 2c p 1 + 1 + 2 · · τ. (a) · a · ggT (a, |h|) · ` `=1 bzc X c=1 ggT(a,c)=1 byc X b=1 ggT(a,b)=1 Λ (c) c 2 µ (b) · bzc X Λ (c). c=1 ggT(a,c)=1 (ii) Abschätzung der c–Summen, der b–Summen, von ϕ und von τ. Nach Bemerkung 5.6 auf Seite 51, Bemerkung 7.3 auf Seite 66 und Bemerkung 7.2 auf Seite 66 gibt es ein C ∈ R+ und ein von ϑ abhängiges Cϑ ∈ R+ mit |Σx,y,z (a, h)| a µ2 ggT(a,|h|) ϕ (a) x ≤ · |ln (ln (a))| · ln (y) · ln (ez) · · · ggT (a, |h|) a a C a bX c 2 p 1 1 +ϑ + Cϑ · 1 + 2 · · yza 2 · ggT (a, |h|). ` `=1 X Seite 70 Verwendung von Kloosterman–Summen und der Vaughan–Identität b: Abschätzung des letzten Terms aus der Vaughan–Identität Im letzten Term wird die innere Summe mit Hilfe der Hölder’schen Ungleichung „linearisiert“. Hilfssatz 7.6 (Hölder’sche Ungleichung) Voraussetzungen: Seien A ⊆ Z, B ⊆ C und C ⊆ C mit #A < ∞ und A ⊆ B ∩ C. B → C C → C Seien f : ,g: und p ∈ R mit p > 1. x 7→ f (x) x 7→ g (x) Behauptung: Dann gilt !1 p X |f (n) · g (n)| ≤ n∈A X n∈A |f (n)|p · X |g (n)| p p−1 ! p−1 p . n∈A Referenz: Siehe [He, 59.2 Höldersche Ungleichung auf Seite 347 der 13. Auflage]22 . X Die Summanden der Kloostermann–Summe werden im letzten Vaughan–Term mit einem Λ–Wert multipliziert. Um wieder auf eine lineare Kloosterman–Summe zu kommen, wird auf die äußere Summe zunächst die Hölder’sche Ungleichung mit p := 2 angewandt. Dadurch wird die nicht–lineare Kloosterman–Summe im Betrag quadriert. Eine Veränderung der Summationsreihenfolge führt dann auf lineare Kloosterman–Summen. Da die Abschätzung dieses aus der Hölder’schen Ungleichung entstehenden zweiten Faktors relativ aufwendig ist, wird sie aus dem eigentlichen Beweis ausgelagert. Zunächst wird eine Summenabschätzung benötigt, die heuristisch einleuchtend ist und deshalb in Teilabschnitt b von Anhang C ab Seite 142 bewiesen wird. Bemerkung 7.7 Für alle a ∈ N \ {1}, alle d ∈ N, die a teilen, alle b ∈ Z, alle y ∈ Z und alle z ∈ Z mit z ≤ y ist y − z ϕ d · a d a d y a X − 1 ≤ τ. . d c=z+1 ggT(a,b−c)=d Damit lässt sich der Zweite der Terme abschätzen, die durch Anwendung der Hölder’schen Ungleichung auf den letzten Term der Vaughan–Identität entstehen. 22 „Lehrbuch der Analysis — Teil 1 “, H. Heuser, B.G. Teubner GmbH (Stuttgart, Leipzig, Wiesbaden — 2000 (13. Auflage)), 59.2 Höldersche Ungleichung auf Seite 347 der 13. Auflage §7: Die Vaughan–Identität Seite 71 Lemma 7.8 (Vorbereitung von Lemma 7.10) Voraussetzungen: Seien a ∈ N \ {1}, h ∈ Z und (x, y, z)T ∈ R mit x ≥ 1, y ≥ 1, z ≥ 1 und x ≥ yz. Behauptung: Dann gibt es eine nur von ϑ abhängige Konstante Cϑ ∈ ϑ ∈ 0; 12 gilt R+ , so dass für alle 2 ? ? X hba na Λ (b) · e a n=byc+1 b=bzc+1 ggT(a,n)=1 ggT(a,b)=1 2 x x ex ϑ ≤ Cϑ · |ln (ln (a))| · ln ·a · · x · ggT (a, |h|) + ln y ay y a ! bX 2c 2 a 12 p x 2 x xa + Cϑ · 1 + · a2ϑ · · ggT (a, |h|). + · ln ` y y2 y x bX zc j k x y `=1 Beweis: Zunächst wird das Quadrat ausmultipliziert und die Summationsreihenfolge vertauscht. Man beachte hierzu auch Abbildung 4 auf der nächsten Seite, in der der Bereich dargestellt ist, über den summiert wird. Schneidet man die entstandene Figur mit zur bc–Ebene parallelen Ebenen, so entstehen Quadrate. Dies veranschaulicht das Auftreten des Maximums in der oberen Grenze der letzten Summe des nächsten Beweispunktes. (i) Ausschreiben des Betrags und Vertauschen der Summationsreihenfolge Schreibt man den Betrag mit Hilfe des Konjugiert–Komplexen aus und vertauscht die Summationsreihenfolge, so erhält man bXc x z Σx,y,z (a, h) := bXc x n n=byc+1 b=bzc+1 ggT(a,n)=1 ggT(a,b)=1 = x bX zc 2 ? ? hba na Λ (b) · e a x bX nc x bX nc = x y X X b=bzc+1 ggT(a,b)=1 Λ (b) · c=bzc+1 ggT(a,c)=1 (b?a − c?a ) · hn?a a (b?a − c?a ) · hn?a . a Λ (b) · Λ (c) · e n=byc+1 b=bzc+1 c=bzc+1 ggT(a,n)=1 ggT(a,b)=1 ggT(a,c)=1 j k j k x y Λ (c) · j x max {b,c} k X n=byc+1 ggT(a,n)=1 e Nun taucht also eine lineare Kloosterman–Summe auf, die nach Lemma 6.8 abgeschätzt werden kann. Seite 72 Verwendung von Kloosterman–Summen und der Vaughan–Identität n x z y x y z z c b x y Abbildung 4: Summationsbereich in Beweispunkt (i) von Lemma 7.8 (ii) Abschätzen der n–Summe mit Lemma 6.8 Mit der Dreiecksungleichung und Lemma 6.8 auf Seite 63 folgt Σx,y,z (a, h) j k j k X y X x y ≤ x Λ (b) · b=bzc+1 ggT(a,b)=1 j k c=bzc+1 ggT(a,c)=1 j k x y + X b=bzc+1 ggT(a,b)=1 x y Λ (b) · X c=bzc+1 ggT(a,c)=1 k j µ2 x a − byc ? ? max {b,c} · ggT(a,|(ba −ca )·h|) · ϕ (a) Λ (c) · a ϕ ggT(a,|(ba? −c? )·h|) a a a bX 2c p 2 Λ (c) · 1 + · τ. (a) · a · ggT (a, |(b?a − c?a ) · h|). ` `=1 §7: Die Vaughan–Identität Seite 73 Das zu subtrahierende byc in der großen Gauss–Klammer wird von hier an fallengelassen. Weiterhin stellt man fest, dass der größte gemeinsame Teiler von a und b?a − c?a für alle (b, c)T ∈ Z2 mit ggT (a, bc) = 1 mit dem größten gemeinsamen Teiler von a und b − c übereinstimmt. Aus diesem Grund scheint eine Aufteilung nach den Teilern von a sinnvoll. Der Quotient von µ2 und ϕ entspricht dann dem Quotienten des Betrags einer Ramanujan– Summe und des ϕ–Wertes zum Modul der Summe. (iii) Betrachtung des größten gemeinsamen Teilers Für alle b ∈ Z mit ggT (a, b) = 1 und alle c ∈ Z mit ggT (a, c) = 1 gilt ggT (a, b?a − c?a ) = ggT (a, bc · (b?a − c?a )) = ggT (a, b − c) wegen bc · (b?a − c?a ) = c · bb?a − b · cc?a ≡ − (b − c) (mod a). Damit folgt für alle d ∈ N, die a teilen, alle b ∈ Z mit ggT (a, b) = 1 und alle c ∈ ggT (a, c) = 1 und ggT (a, b − c) = d a a b?a − c?a ? ? ggT (a, |(ba − ca ) · h|) = d · ggT , · |h| = d · ggT , |h| . d d d Z mit Mit Bemerkung 3.6 auf Seite 26 folgt für alle d ∈ N, die a teilen, alle b ∈ Z mit ggT (a, b) = 1 und alle c ∈ Z mit ggT (a, c) = 1 und ggT (a, b − c) = d a 2 d a 2 µ a a µ ggT(a,|(b? −c? )·h|) χ τ h 0, d ggT( d ,|h|) a a = . = a ϕ ad d ϕ ggT(a,|(ba? −c? )·h|) ϕ ggT a ,|h| a a (d ) Mit ga,h : { k ∈ N| k teilt a} → R+ a r bX 2c a 1 d → 7 ga,h (d) := 1 + 2 · ggT , |h| · τ. (a) · ` d `=1 und (ii) folgt also Σx,y,z (a, h) a a τ χ h 0, d ϕ (a) X · x· · a ϕ ad d=1 ≤ d teilt a j k j k X y X x x y Λ (b) · b=bzc+1 ggT(a,b)=1 j k c=bzc+1 ggT(a,c)=1 ggT(a,b−c)=d j k y X y X x + √ a· a X d=1 d teilt a ga,h (d) · √ d· b=bzc+1 ggT(a,b)=1 Λ (c) · x Λ (b) · c=bzc+1 ggT(a,c)=1 ggT(a,b−c)=d Λ (c). 1 max {b, c} Seite 74 Verwendung von Kloosterman–Summen und der Vaughan–Identität Während die innere Summe des zweiten Terms nach einer trivialen Abschätzung von Λ schon für Bemerkung 7.7 bereitet ist, muss aus der inneren Summe des ersten Terms noch das Maximum aufgeschlüsselt werden. Das ist auf Grund der Symmetrie der Doppelsumme in b und c aber problemlos möglich. (iv) Elimination des Maximums im ersten Term Für alle d ∈ N, die a teilen, gilt j k j k X y X x y x Λ (b) · b=bzc+1 ggT(a,b)=1 Λ (c) · c=bzc+1 ggT(a,c)=1 ggT(a,b−c)=d 1 max {b, c} j k x y X = b X Λ (b) · b=bzc+1 ggT(a,b)=1 c=bzc+1 ggT(a,c)=1 ggT(a,b−c)=d 1 Λ (c) · + b j k j k X y X x y x Λ (b) · c=b+1 ggT(a,c)=1 ggT(a,b−c)=d b=bzc+1 ggT(a,b)=1 1 c x X b=bzc+1 ggT(a,b)=1 Λ (b) · b b X y X Λ (c) + c=bzc+1 ggT(a,c)=1 ggT(a,b−c)=d c=bzc+1 ggT(a,c)=1 Λ (c) · c j k c−1 X Λ (b) b=bzc+1 ggT(a,b)=1 ggT(a,b−c)=d j k x y = 2· Λ (c) · j k x y = j k x X b=bzc+1 ggT(a,b)=1 Λ (b) · b b X c=bzc+1 ggT(a,c)=1 ggT(a,b−c)=d d · Λ (c) − a y X b=bzc+1 ggT(a,b)=1 Λ2 (b) . b Dabei muss der „Diagonalterm“ nur für d = a beachtet werden, da auf der Diagonalen b = c in jedem Fall ggT (a, b − c) = ggT (a, 0) = a gilt. Mit diesem Wissen lässt sich der Beitrag des Diagonalterms zur Gesamtsumme direkt angeben. d Für alle d ∈ N \ {a}, die a teilen ist = 0. a Der Beitrag des letzten Terms zur Gesamtsumme liefert also j k j k x x y y X X ϕ (a) τh χ0, aa j a k Λ2 (b) ϕ (a) |τh (χ0,1 )| Λ2 (b) −x · · · · = −x · · · . a a b a ϕ (1) b ϕ aa b=bzc+1 ggT(a,b)=1 Mit ϕ (1) = 1 und τh (χ0,1 ) = 1 X χ0,1 (`) · e `=1 Σx,y,z (a, h) ≤ b=bzc+1 ggT(a,b)=1 ϕ (a) 2x · · a a X d=1 d teilt a h` 1 = 1 folgt τh χ0, ad · ϕ ad j k x y X b=bzc+1 ggT(a,b)=1 Λ (b) · b b X c=bzc+1 ggT(a,c)=1 ggT(a,b−c)=d Λ (c) §7: Die Vaughan–Identität + √ Seite 75 a X a· ga,h (d) · √ j k j k X y X x y d· d=1 d teilt a x Λ (b) · b=bzc+1 ggT(a,b)=1 Λ (c) c=bzc+1 ggT(a,c)=1 ggT(a,b−c)=d j k x −x· ϕ (a) · a y X b=bzc+1 ggT(a,b)=1 Λ2 (b) . b Nun kann also nach der Abschätzung der von–Mangoldt–Funktion durch den natürlichen Logarithmus der oberen Summationsgrenze und Streichen der Teilerfremdheitsbedingung des Summationsindizes zu a die innere Summe gemäß Bemerkung 7.7 behandelt werden. Auch hier werden die Summen nur größer, wenn man alle Gauss–Klammern durch ihr Argument abschätzt und alle Terme, die abgezogen werden, einfach ignoriert. (v) Abschätzung der c–Summen mit Bemerkung 7.7 Mit Bemerkung 7.7 auf Seite 70 folgt nach Abschätzung der inneren von Mangoldt–Funktion und Ignorieren der ersten Teilerfremdheitsbedingung in der Summationsbedingung der inneren Summe Σx,y,z (a, h) ϕ (a) 2x · · a ≤ a X d=1 d teilt a τh χ0, ad · ϕ ad j k + √ a· a X ga,h (d) 1 d=1 d teilt a d− 2 x y · X b=bzc+1 ggT(a,b)=1 j k x y X b=bzc+1 ggT(a,b)=1 Λ (b) · ln (b) · b b − bzc ϕ · d j k x y − bzc ϕ x Λ (b) · ln · · y d a d a d a d a d + τ. + τ. a d x y X b=bzc+1 ggT(a,b)=1 Λ2 (b) . b Lässt man alle negativen Terme weg, so erhält man j k x Σx,y,z (a, h) ≤ 2x ϕ (a) · · a a a X d=1 d teilt a a τ χ h 0, d · y X d teilt a Λ (b) · ln (b) b=bzc+1 ggT(a,b)=1 a a a τ χ X h 0, d ϕ (a) + 2x · · · τ. · a d ϕ ad d=1 j k x y X b=bzc+1 ggT(a,b)=1 d j k ϕ (a) −x· · a a Λ (b) · ln (b) b Dissertation von Simon Feiler zum Thema Die relative Verteilung der Inversen einer natürlichen Zahl zu variablen Moduln ! Seite 76 Verwendung von Kloosterman–Summen und der Vaughan–Identität j k x r a x X a ϕ x · · + ln · ga,h (d) · y y d d=1 d teilt a y X a d a d · Λ (b) b=bzc+1 ggT(a,b)=1 j k x a a X √ √ x · a· ga,h (d) · d · τ. · + ln y d d=1 d teilt a y X Λ (b). b=bzc+1 ggT(a,b)=1 Hierbei sind die b–Summen und die d–Summen jeweils voneinander unabhängig. Schätzt man in den ersten beiden b–Summen den natürlichen Logarithmus durch den natürlichen Logarithmus der oberen Summationsgrenze ab, so lässt sich Bemerkung 7.3 unter Vernachlässigung der Teilerfremdheitsbedingung direkt anwenden. In den ersten drei Termen ist außerdem eine Umkehrung der Reihenfolge in der d–Summation sinnvoll. (vi) Abschätzen der b–Summen Nach Bemerkung 7.3 auf Seite 66 gibt es ein Q ∈ R+ mit 2 a x x ϕ (a) X Σx,y,z (a, h) ≤ 2Q · ln · · · |τh (χ0,d )| y ay a d=1 d teilt a a x ex ϕ (a) X |τh (χ0,d )| + 2Q · ln · ln ·x· · · τ. (d) y y a ϕ (d) d=1 d teilt a 2 a a √ ϕ (d) X x x · d· + Q · ln · 2 · ga,h y y d d d=1 d teilt a a a √ √ x X x + Q · ln · a· · ga,h (d) · d · τ. . y y d d=1 d teilt a Bei der Abschätzung der d–Summen wird zunächst die Ramanujan–Summe so abgeschätzt, dass keine Abhängigkeit von d mehr auftritt. Die übrig bleibenden Summen kann man dann mit der Abschätzung der Teilerfunktion auswerten. (vii) Abschätzen der d–Summen Mit Bemerkung 3.6 auf Seite 26 und Lemma 5.6 auf Seite 51 folgt die Existenz eines C̃ ∈ so dass für alle d ∈ N \ {1}, die a teilen, gilt d ϕ (d) 2 |τh (χ0,d )| = µ · d ggT (d, |h|) ϕ ggT(d,|h|) d ϕ (d) 2 ≤µ · d ggT (d, |h|) ggT(d,|h|) C̃ · |ln(ln(d))| d ggT (d, |h|) · |ln (ln (d))| ϕ (d) 2 =µ · · . ggT (d, |h|) d C̃ Oben wurde bereits τh (χ0,1 ) = 1 gezeigt. R+ , §7: Die Vaughan–Identität Seite 77 Seien Σa := 1 + 2 · a bX 2c 1 `=1 C := C̃ · |ln (ln (2))| . und ` Schätzt man nun das Argument des iteriterten Logarithmus durch a, die Möbius–Funktion durch 1 und die übrigen größten gemeinsamen Teiler durch ggT (a, |h|) ab, so folgt mit Bemer 1 + kung 7.2 auf Seite 66 und ϕ(d) d ≤ 1 für alle d ∈ N, dass für alle ϑ ∈ 0; 2 ein Cϑ ∈ R existiert mit a X |τh (χ0,d )| ≤ d=1 d teilt a a X d=1 d teilt a 1 · ggT (a, |h|) · |ln (ln (a))| C Cϑ · |ln (ln (a))| · aϑ · ggT (a, |h|) , C 1−ϑ a a X X |τh (χ0,d )| 1 Cϑ · τ. (d) ≤ · · ggT (a, |h|) · |ln (ln (a))| ϕ (d) C d d=1 d=1 | {z } ≤ d teilt a d teilt a ≤ 1 a X Cϑ ≤ · |ln (ln (a))| · ggT (a, |h|) · 1 C d=1 d teilt a Cϑ2 · |ln (ln (a))| · aϑ · ggT (a, |h|) , C a a a √ ϕ (d) X X p √ ga,h ggT (d, |h|) · d · d· ≤ Σa · τ. (a) · d d ≤ d=1 d teilt a d=1 d teilt a ≤ Cϑ · Σ a · a 1 +ϑ 2 1 a X p d 2 · ggT (a, |h|) · a d=1 | {z } d teilt a ≤ Cϑ2 · Σa · a 1 +2ϑ 2 ≤ 1 p · ggT (a, |h|) und a X ga,h (d) · √ d · τ. a d=1 d teilt a d ≤ Cϑ · Σa · τ. (a) · a X d=1 d teilt a ≤ Cϑ2 ϑ+ 12 · Σa · a r a √ a ϑ ggT , |h| · d · d d 1 X d 2 −ϑ p · ggT (a, |h|) · a d=1 | {z } d teilt a ≤ 1 p 1 ≤ Cϑ3 · Σa · a 2 +2ϑ · ggT (a, |h|). Insgesamt folgt für alle ϑ ∈ 0; 12 2QCϑ x ϕ (a) x2 Σx,y,z (a, h) ≤ · |ln (ln (a))| · ln · · 1−ϑ · ggT (a, |h|) C y a ya 2 2QCϑ x ex ϕ (a) + · |ln (ln (a))| · ln · ln · · xaϑ · ggT (a, |h|) C y y a Seite 78 Verwendung von Kloosterman–Summen und der Vaughan–Identität a bX 2 1 +2ϑ 2c p x · a2 x 2 2 · + QCϑ · 1 + · ggT (a, |h|) · ln 2 ` y y `=1 a bX 2c xa1+2ϑ p x 2 3 · + QCϑ · 1 + · ggT (a, |h|). · ln ` y y X `=1 Damit ist der eine Term, der sich aus der Hölder’schen Ungleichung ergibt, abgeschätzt. Zur Abschätzung des anderen Terms lässt sich die folgende Bemerkung verwenden. Bemerkung 7.9 (Summen von Potenzen der Teilerfunktion) Für alle ` ∈ N0 gibt es ein C` ∈ R+ , so dass für alle x ∈ R mit x ≥ 2 gilt bxc X ` −1 τ.` (n) ≤ C` · ln2 (x) · x. n=1 Referenz: Siehe [Hu, Theorem 5.3 in Kapitel 6 auf Seite 111 der englischen Ausgabe]23 . X Aus der Hölder’schen Ungleichung und der Abschätzung der beiden sich ergebenden Terme lässt sich eine Abschätzung des letzten Terms aus der Vaughan–Identität ermitteln. Lemma 7.10 (Letzter Term) Voraussetzungen: Seien a ∈ N \ {1}, ϑ ∈ 0; 21 , h ∈ Z und (x, y, z)T ∈ R3 mit y ≥ 1, z ≥ 1 und x ≥ yz. Seien a bX 2c x 1 3 x L (x, y, z) := ln · ln und Σa := 1 + 2 · . y z ` `=1 Behauptung: Dann gibt es eine nur von ϑ abhängige Konstante Cϑ ∈ R+ mit x x bzc bX byc nc ? X X h · (bn)a µ (d) · Λ (b) · e a n=byc+1 d=1 b=bzc+1 d teilt n ggT(a,n)=1 ggT(a,b)=1 3 ϑ p x2 · a 2 p ≤ Cϑ · |ln (ln (a))| · L (x, y, z) · ggT (a, |h|) 1 · (ayz) 2 s ϑ ex xa 2 p + Cϑ · |ln (ln (a))| · L (x, y, z) · ln · 1 · ggT (a, |h|) y z2 ! 3 1 1 +ϑ +ϑ p p x2 · a4 xa 2 + Cϑ · L (x, y, z) · Σa · + · 4 ggT (a, |h|). 1 1 yz 2 (yz) 2 23 „Introduction to number theory“, Hua L. K., Springer (Berlin, Heidelberg, New York — 1982), Theorem 5.3 in Kapitel 6 auf Seite 111 der englischen Ausgabe §7: Die Vaughan–Identität Seite 79 Beweis: (i) Die Hölder’sche Ungleichung Mit der Dreiecksungleichung und der Hölder’schen Ungleichung 7.6 auf Seite 70 folgt x x bX c b c byc z n ? X X h · (bn)a µ (d) · Λ (b) · e a n=byc+1 d=1 b=bzc+1 d teilt n ggT(a,n)=1 ≤ ggT(a,b)=1 bXc x z 2 12 byc X µ (d) d=1 n=byc+1 ggT(a,n)=1 d teilt n · bXc x z bXc x n n=byc+1 b=bzc+1 ggT(a,n)=1 ggT(a,b)=1 2 12 ? ? hba na Λ (b) · e . a (ii) Abschätzen des ersten Terms 2 x byc bX zc x X Ist < 2, so gilt µ (d) = 0 wegen y ≥ 1. z n=byc+1 d=1 ggT(a,n)=1 d teilt n x Ist ≥ 2, so gibt es nach Bemerkung 7.9 auf der vorherigen Seite ein C ∈ R+ mit z 2 2 2 x x x byc bX bX b c byc byc zc zc z X X X X 2 µ (d) ≤ µ (d) ≤ 1 d=1 d=1 n=byc+1 d=1 n=byc+1 n=byc+1 ggT(a,n)=1 d teilt n ggT(a,n)=1 ≤ x bX zc n=1 d teilt n τ.2 (n) ≤ C · jxk z ggT(a,n)=1 2 −1 · ln2 j x k z d teilt n ≤ C · ln3 x x · . z z (iii) Anwenden von Lemma 7.8 Aus Lemma 7.8 auf Seite 71 folgt die Existenz eines nur von ϑ abhängigen Cϑ ∈ R+ mit x b xz c b c byc n ? X X X h · (bn)a µ (d) · Λ (b) · e a n=byc+1 d=1 b=bzc+1 d teilt n ggT(a,n)=1 ggT(a,b)=1 12 2 x ϑ x · Cϑ · |ln (ln (a))| · ln ·a · · ggT (a, |h|) y ay 1 2 x ex ϑ · Cϑ · |ln (ln (a))| · ln · xa · ln · ggT (a, |h|) y y !1 2 1 +2ϑ 2 x1 p x x · a2 2 3 x + C · ln · · Cϑ · Σa · ln · · ggT (a, |h|) z z y y2 12 x1 x xa1+2ϑ p 2 3 x + C · ln · · Cϑ · Σa · ln · · ggT (a, |h|) , z z y y √ √ √ √ √ 4 da α + β + γ + δ ≤ α + β + γ + δ für alle (α, β, γ, δ)T ∈ (R+ ∪ {0}) gilt. x x1 2 ≤ C · ln3 · z z x x1 2 + C · ln3 · z z X Seite 80 Verwendung von Kloosterman–Summen und der Vaughan–Identität Am Ende von §7 soll noch die Abschätzung angegeben werden, die entsteht, wenn man alle Ergebnisse aus §7 kombiniert. Dabei wird in der Anfangssumme aus der Vaughan–Identität nach Anwenden der Dreiecksungleichung der Satz von Qebyxv† angewandt und für die restlichen Terme werden die angegebenen Abschätzungen eingesetzt. Lemma 7.11 wird im weiteren Verlauf für die Abschätzung der Exponentialsumme aus Lemma 2.8 verwendet und tritt somit an die Stelle der expliziten Formel aus Kapitel III. In §8 werden dabei y und z als geeignete Potenzen der Ursprungssummenlänge gewählt. Lemma 7.11 (Zusammenfassung) Voraussetzungen: Seien a ∈ N \ {1}, ϑ ∈ 0; 12 , h ∈ Z und (x, y, z)T ∈ R3 mit y ≥ 1, z ≥ 1 und x ≥ yz. Seien a bX 2c x 1 3 x · ln und Σa := 1 + 2 · . L (x, y, z) := ln y z ` `=1 Behauptung: Dann gibt es eine Konstante C ∈ R+ und eine nur von ϑ abhängige Konstante Cϑ ∈ R+ mit X ? bxc hna Λ (n) · e a n=1 ggT(a,n)=1 ≤ Cz x + C · |ln (ln (a))| · (ln (x) + ln (ez)) · ln (y) · · ggT (a, |h|) p a 1 1 +ϑ +ϑ + Cϑ · Σa · ln (x) · ya 2 + yza 2 · ggT (a, |h|) 3 ϑ p x2 · a 2 p + Cϑ · |ln (ln (a))| · L (x, y, z) · ggT (a, |h|) 1 · (ayz) 2 s ϑ ex xa 2 p + Cϑ · |ln (ln (a))| · L (x, y, z) · ln · 1 · ggT (a, |h|) y z2 ! 3 1 1 p p x 2 · a 4 +ϑ xa 2 +ϑ + Cϑ · L (x, y, z) · Σa · + · 4 ggT (a, |h|). 1 1 yz 2 (yz) 2 Beweis: Die Aussage des Lemmas folgt direkt aus Hilfssatz 7.1 auf Seite 65, der Dreiecksungleichung, Bemerkung 7.3 auf Seite 66, Lemma 7.4 auf Seite 67, Lemma 7.5 auf Seite 68 und Lemma 7.10 auf Seite 78. X † sprich: „Chebyshev“ §8: Die Verteilung ohne verallgemeinerte Riemann’sche Vermutung Seite 81 §8: Die Verteilung ohne Annahme der Gültigkeit der verallgemeinerten Riemann’schen Vermutung In §8 soll ein Ergebnis angegeben werden, das dem von Satz 5.7 ähnelt, jedoch ohne die verallgemeinerte Riemann’sche Vermutung 5.1 auskommt. Um Lemma 2.8 gemeinsam mit Lemma 7.11 anwenden zu können, muss zunächst der Transfer von der Primzahlsumme aus Lemma 2.8 zur mit der von–Mangoldt–Funktion modifizierten Summe aus Lemma 7.11 geleistet werden. Dieser lässt sich mit Hilfe von partieller Summation vollführen. Dargestellt ist er in Teilabschnitt b von Anhang C ab Seite 128.√Auf Kosten einer höheren Konstante C ließe sich als x Fehlerterm im folgenden Lemma auch ln(x) erreichen. Lemma 8.1 (Primzahlsummen über beschränkte Funktionen) Voraussetzungen: Seien x ∈ R mit x ≥ 2, A ⊆ C mit { n ∈ N| n ≤ x} ⊆ A, f : M ∈ R+ ∪ {0} mit |f (t)| ≤ M für alle t ∈ N mit t ≤ x. Sei C := 1 + A → C t 7→ f (t) und 1 . ln (4) 19 Behauptung: Dann gilt 12 7 < C < 11 und x btc X Z bxc bxc X X √ 1 Λ (n) · f (n) dt ≤ CM · x. · f (p) − Λ (n) · f (n) − 2 ln (x) t · ln (t) p=2 n=1 2 n=1 p∈P Jetzt lässt sich mit Lemma 7.11 eine Abschätzung des Restglieds aus Lemma 2.8 angeben. Da die mit der von–Mangoldt–Funktion modifizierte Summe im vorstehenden Lemma einmal in ihrer Gesamtlänge und einmal mit einer Länge, die von der Integrationsvariablen abhängt, vorkommt, ist es nicht möglich, weiter mit den beiden globalen Parametern y und z zu rechnen, da diese für jede dieser Summen individuell gewählt werden müssten. (Man beachte die Voraussetzung „x ≥ yz“ aus Lemma 7.11.) Dieses Problem wird durch die Einführung zweier anderer globaler Parameter λ und ν gelöst. y und z werden dann für jede Summe als die λ–te bzw. ν–te Potenz der Summenlänge gewählt. Im Integral ergeben sich damit — von Logarithmus–Faktoren, die trivial abgeschätzt werden können, abgesehen — Polyome in der Integrationsvariablen. Der Grad der einzelnen Monome ist dabei jeweils um 1 kleiner als der Grad der entsprechenden sich aus der Abschätzung der allein stehenden Summe ergebenden Monome. Durch die Integration sind die Resultate der beiden Abschätzungen also jeweils von der gleichen Ordnung. Die einzige Ausnahme von diesem polynomiellen Charakter bildet der Fall λ = 0, der bedeuten würde, dass man in jeder abzuschätzenden Summe y = 1 wählt und somit im Prinzip auf einen der beiden Parameter in der Vaughan–Identität verzichtet. Diese eigentlich unsinnige Wahl würde die Abschätzung allerdings minimal verbessern, da anstelle von xλ + xλ+ν in einem Term die Größenordnung 1 + |ln (ln (x))| + xν auftreten würde. Der Nutzen ist allerdings gleich null, da im Falle λ = 0 die Wahl ν = 0 (also z = 1) die Verwendung der Vaughan–Identität ad absurdum führen würde und damit der iterierte Logarithmus auf keinen Fall die Größenordnung der Abschätzung bestimmt. Seite 82 Verwendung von Kloosterman–Summen und der Vaughan–Identität Lemma 8.2 (Kombination von Lemma 7.11 und Lemma 8.1) Voraussetzungen: n o Seien α ∈ R, β ∈ R mit 0 < α < β < 1 und ε ∈ R+ mit ε < min 2α; 2 − 2β; β−α . 2 Behauptung: Für alle r ∈ N \ {1}, alle ϑ ∈ 0; 12 , alle λ ∈ [0; 1] und alle ν ∈ [0; 1 − λ] gibt es eine nur von r, ϑ, λ und ν abhängige Konstante Cϑ,λ,ν,r ∈ R+ , so dass für alle a ∈ N \ {1} und alle x ∈ R mit x ≥ 2 1 Z bxc ? X X hpa 1α,β,ε,r (t) · e (ht) dt · e a h∈Z\{0} p=2 0 p∈P ggT(a,p)=1 1 Cϑ,λ,ν,r ν x 2 + |ln (ln (a))| · ln (x) · ≤ · x + x εr a 1 Cϑ,λ,ν,r λ λ+ν · Σ · x + ∆ · |ln (ln (x))| + x · a 2 +ϑ + a λ,0 εr ! λ+ν 3 ν ϑ 1 Cϑ,λ,ν,r p x2− 2 + · |ln (ln (a))| · ln (x) · + ln 2 (x) · x1− 2 · a 2 1 −ϑ εr 2 2 a 3 ν 1 1 Cϑ,λ,ν,r p −λ− 2 +ϑ 1− λ+ν +ϑ 2 4 2 2 + · · a + x · a Σ · ln (x) · x a εr gilt, wobei Σa := 1 + 2 · a bX 2c 1 `=1 ` und ∆λ,0 ( 0, := 1, falls λ 6= 0 ist falls λ = 0 ist sind. Im Beweis wird zunächst Lemma 8.1 auf die innere Summe angewandt. Auf dem Weg zur Abschätzung des dabei entstehenden Integrals ergibt sich eine Abschätzung für den zweiten entstehenden Term. Mit der Dreiecksungleichung und den bekannten Abschätzungen der Fourier–Koeffizienten von 1α,β,ε,r folgt dann die Behauptung. Beweis: (i) Lemma 8.1 Sei a ∈ N \ {1}. Nach Lemma 8.1 auf der vorherigen Seite gilt für alle h ∈ Z und alle x ∈ R mit x ≥ 2 ? ? hna hna ? Zx bxc bxc btc Λ (n) · e Λ (n) · e X X X √ a a hpa e = + dt + O x , a ln (x) t · ln2 (t) p=2 p∈ ggT(a,p)=1 P n=1 ggT(a,n)=1 wobei die O–Konstante höchstens 1 + n=1 2 ggT(a,n)=1 1 ln(4) beträgt. §8: Die Verteilung ohne verallgemeinerte Riemann’sche Vermutung Seite 83 Für alle t ∈ R mit t ≥ 2 wird die Summe im Integranden nach Lemma 7.11 abgeschätzt. Dabei werden die dortigen Parameter y und z als Potenzen von t gewählt. (ii) Abschätzung des Integranden auf der rechten Seite von (i) Seien Σa := 1 + 2 · a bX 2c 1 `=1 ` und L: (R+ ) 3 (t, y, z)T R . t t · ln3 7 → L (t, y, z) := ln y z → Für alle ϑ ∈ 0; 21 gibt es nach Lemma 7.11 auf Seite 80 eine nur von ϑ abhängige Konstante Aϑ ∈ R+ mit ? btc X hna Λ (n) · e a n=1 ggT(a,n)=1 ≤ Aϑ · tν t + Aϑ · |ln (ln (a))| · (ln (t) + ln (etν )) · ln tλ · · ggT (a, |h|) pa 1 1 λ +ϑ λ+ν +ϑ + Aϑ · Σa · ln (t) · t · a 2 + t · ggT (a, |h|) · a2 λ+ν 3 q t2− 2 p λ ν + Aϑ · |ln (ln (a))| · L (t, t , t ) · 1 ϑ · ggT (a, |h|) a2− 2 q p ν ϑ + Aϑ · |ln (ln (a))| · L (t, tλ , tν ) · ln (et1−λ ) · t1− 2 · a 2 · ggT (a, |h|) q 3 p λ+ν 1 1 ν + Aϑ · L (t, tλ , tν ) · Σa · t 2 −λ− 2 · a 4 +ϑ + t1− 2 · a 2 +ϑ · 4 ggT (a, |h|) für alle t ∈ R mit t ≥ 2, alle h ∈ Z, alle λ ∈ [0; 1] und alle ν ∈ [0; 1 − λ]. Die Wahl von y = tλ und z = tν führt dazu, dass L (t,y, z) gerade das Produkt von Logarithmen von t–Potenzen darstellt. Formt man L t, tλ , tν und die anderen auftretenden von t abhängigen Logarithmen gemäß der Logarithmen–Gesetze um und verrechnet die dabei entstehenden Vorfaktoren mit der Konstante Aϑ , so erhält man neue Konstanten, die auch von λ und ν abhängen. Für alle t ∈ R mit t ≥ 2, alle λ ∈ [0; 1] und alle ν ∈ [0; 1 − λ] gilt q q q 3 t t λ ν L (t, t , t ) = ln tλ · ln tν = (1 − λ) · (1 − ν)3 · ln2 (t) , λ · ln2 (t) (ln (t) + ln (etν )) · ln tλ = λ · ln2 (t) + λν · ln2 (t) + λ · ln (t) ≤ λ + λν + ln(2) und q q p ln (et1−λ ) = (1 − λ) · ln (t) + 1 ≤ 1 − λ + 1 ln(2) · p ln (t). Seite 84 Verwendung von Kloosterman–Summen und der Vaughan–Identität Also gibt es für alle ϑ ∈ 0; 12 , alle λ ∈ [0; 1] und alle ν ∈ [0; 1 − λ] eine nur von ϑ, λ und ν abhängige Konstante Aϑ,λ,ν ∈ R+ ∪ {0} mit btc ? X hna Λ (n) · e a n=1 ggT(a,n)=1 ≤ Aϑ · tν t + Aϑ,λ,ν · |ln (ln (a))| · ln2 (t) · · ggT (a, |h|) a p 1 1 + Aϑ · Σa · ln (t) · tλ · a 2 +ϑ + tλ+ν · a 2 +ϑ · ggT (a, |h|) 3 + Aϑ,λ,ν · p + Aϑ,λ,ν · p |ln (ln (a))| · ln2 (t) · t2− a λ+ν 2 1 −ϑ 2 2 ! p ϑ ν + ln (t) · t1− 2 · a 2 · p ggT (a, |h|) 3 p λ+ν ν 1 1 Σa · ln2 (t) · t 2 −λ− 2 · a 4 +ϑ + t1− 2 · a 2 +ϑ · 4 ggT (a, |h|) für alle t ∈ R mit t ≥ 2 und alle h ∈ Z. Setzt man diese Abschätzung in das Integral aus (i) nach Anwendung der Dreiecksungleichung ein, so erhält man nach Ausmultiplizieren der Klammerterme acht Integrale, die abzuschätzen sind. Alle nicht von t abhängigen Faktoren können dabei vor das Integral gezogen werden. Im Folgenden werden die acht dabei entstehenden Integrale abgeschätzt bzw. berechnet. (iii) Abschätzung der sich ergebenden Integrale Für alle ν ∈ [0; 1] und alle x ∈ R mit x ≥ 2 ist Zx Zx tν 1 −1 t=x 1 1 xν ν ν ν dt ≤ x · dt = x · = x · − ≤ . ln (t) t=2 ln (2) ln (x) ln (2) t · ln2 (t) t · ln2 (t) 2 2 Damit ist der erste Term in der ersten Zeile von (ii) genauso verarbeitet wie der zweite Term aus der Klammer in der zweiten Zeile. Beim ersten Term aus der Klammer in der zweiten Zeile von (ii) bleibt ln (t) · tλ stehen. Für alle x ∈ R mit x ≥ 2 ist Zx ln (t) · t0 dt = [ln (ln (t))]t=x t=2 = ln (ln (x)) − ln (ln (2)) ≤ |ln (ln (x))| t · ln2 (t) 2 und für alle λ ∈ (0; 1] gilt λ t=x Zx Zx 1 ln (t) · tλ 1 t 1 λ−1 dt ≤ · t dt = · ≤ · xλ . 2 ln (2) ln (2) λ t=2 λ · ln (2) t · ln (t) 2 2 5 ν Der zweite Term in der Klammer der dritten Zeile von (ii) enthält ln 2 (t) · t1− 2 . Für alle ν ∈ [0; 1] und alle x ∈ R mit x ≥ 2 gilt Zx 2 5 ν 1 ln 2 (t) · t1− 2 dt ≤ ln 2 (x) · 2 t · ln (t) Zx " t 2 − ν2 p dt = ln (x) · ν t1− 2 1 − ν2 #t=x ≤ t=2 p ν 2 · ln (x) · x1− 2 . 2−ν §8: Die Verteilung ohne verallgemeinerte Riemann’sche Vermutung Seite 85 Die restlichen Terme können gleich behandelt werden, da hier lediglich ln2 (t) · tf (λ,ν) mit einem positiven f (λ, ν) stehen bleibt. R2 → R+ Für alle f : , alle λ ∈ R, alle ν ∈ R und alle x ∈ R mit x ≥ 2 ist (λ, ν)T 7→ f (λ, ν) " #t=x Zx 2 Zx f (λ,ν) ln (t) · tf (λ,ν) t 1 dt = tf (λ,ν)−1 dt = ≤ · xf (λ,ν) . 2 f (λ, ν) f (λ, ν) t · ln (t) 2 t=2 2 (iv) Abschätzung der rechten Seite in (i) Nach (ii) und (iii) gibt es für alle ϑ ∈ 0; 21 , alle λ ∈ [0; 1] und alle ν ∈ [0; 1 − λ] eine nur von ϑ, λ und ν abhängige Konstante Bϑ,λ,ν ∈ R+ mit ? x hn Z btc Λ (n) · e a a X dt 2 t · ln (t) n=1 2 ggT(a,n)=1 ≤ Bϑ,λ,ν · xν x · ggT (a, |h|) a p 1 · a 2 +ϑ · ggT (a, |h|) + Bϑ,λ,ν · |ln (ln (a))| · + Bϑ,λ,ν · Σa · xλ+ν 3 + Bϑ,λ,ν p · |ln (ln (a))| · x2− λ+ν 2 1 −ϑ 2 2 ! p ν ϑ + ln (x) · x1− 2 · a 2 · p ggT (a, |h|) a 3 p p λ+ν 1 1 ν + Bϑ,λ,ν · Σa · x 2 −λ− 2 · a 4 +ϑ + x1− 2 · a 2 +ϑ · 4 ggT (a, |h|) ( p 1 Bϑ,λ,ν · Σa · xλ · a 2 +ϑ · ggT (a, |h|), falls λ 6= 0 ist p + 1 +ϑ Bϑ,λ,ν · Σa · |ln (ln (x))| · a 2 · ggT (a, |h|), falls λ = 0 ist für alle x ∈ R mit x ≥ 2 und alle h ∈ Z. Nach (ii) gilt für alle ϑ ∈ 0; 21 , alle λ ∈ [0; 1], alle ν ∈ [0; 1 − λ], alle h ∈ Z und alle x ∈ R mit x≥2 ? X bxc Λ (n) · e hna a ln (x) n=1 ggT(a,n)=1 ≤ Aϑ · xν ln (x) x · ggT (a, |h|) a ! λ+ν · a 12 +ϑ p 1 x xλ · a 2 +ϑ + · ggT (a, |h|) ln (x) + Aϑ,λ,ν · |ln (ln (a))| · ln (x) · + Aϑ · Σ a · 3 + Aϑ,λ,ν + Aϑ,λ,ν p · |ln (ln (a))| · ln (x) · x2− λ+ν 2 1 −ϑ 2 2 ! p ν ϑ + ln (x) · x1− 2 · a 2 · p ggT (a, |h|) a 3 p p λ+ν ν 1 1 · Σa · ln (x) · x 2 −λ− 2 · a 4 +ϑ + x1− 2 · a 2 +ϑ · 4 ggT (a, |h|). Dissertation von Simon Feiler zum Thema Die relative Verteilung der Inversen einer natürlichen Zahl zu variablen Moduln Seite 86 Verwendung von Kloosterman–Summen und der Vaughan–Identität Sei ∆λ,0 ( 0, falls λ 6= 0 ist; := 1, falls λ = 0 ist. Aus (i) und der Dreiecksungleichung ergibt sich für alle ϑ ∈ 0; 21 , alle λ ∈ [0; 1] und alle ν ∈ [0; 1 − λ] die Existenz einer nur von ϑ, λ und ν abhängigen Konstante Cϑ,λ,ν ∈ R+ mit ? bxc X hpa e a p=1 p∈P ggT(a,p)=1 1 1 · x2 ≤ 1+ ln (4) + Cϑ,λ,ν · xν x + Cϑ,λ,ν · |ln (ln (a))| · ln (x) · · ggT (a, |h|) a p 1 1 λ +ϑ λ+ν + Cϑ,λ,ν · Σa · x · a 2 + x · a 2 +ϑ · ggT (a, |h|) 3 + Cϑ,λ,ν p · |ln (ln (a))| · ln (x) · x2− 1 λ+ν 2 ϑ a2− 2 ! p ν ϑ + ln (x) · x1− 2 · a 2 · p ggT (a, |h|) p p λ+ν 3 ν 1 1 Σa · ln (x) · x 2 −λ− 2 · a 4 +ϑ + x1− 2 · a 2 +ϑ · 4 ggT (a, |h|) p 1 + ∆λ,0 · Bϑ,λ,ν · Σa · |ln (ln (x))| · a 2 +ϑ · ggT (a, |h|) + Cϑ,λ,ν · für alle x ∈ R mit x ≥ 2 und alle h ∈ Z. In Lemma 2.8 wird dies für alle h ∈ Z \ {0} noch mit dem h–ten Fourier–Koeffizienten von 1α,β,ε,r multipliziert. Schätzt man daraufhin ggT (a, |h|) durch |h| ab und beachtet die Abschätzungen für die Fourier–Koeffizienten von 1α,β,ε,r , so erhält man eine Abschätzung der Restsumme aus Lemma 2.8. (v) Abschätzen der Restsumme aus Lemma 2.8 Für alle h ∈ Z \ {0} und alle r ∈ N gilt nach Definition 2.6 auf Seite 18 1 Z 1α,β,ε,r (t) · e (ht) dt ≤ Dr,ε |h|r+1 mit Dr,ε := rr π r+1 · εr . 0 Für alle r̃ ∈ R mit r̃ ≥ 2 gilt 0≤ X Z h∈ \{0} 1 r̃ |h| ≤ X 1 1 = 2 · L (2, χ0,1 ) < ∞. 2 =2· n2 |h| n∈N h∈Z\{0} X §8: Die Verteilung ohne verallgemeinerte Riemann’sche Vermutung Seite 87 Für alle r ∈ N \ {1}, alle ϑ ∈ 0; 21 , alle λ ∈ [0; 1], alle ν ∈ [0; 1 − λ] und alle x ∈ R mit x ≥ 2 folgt also 1 bxc ? X Z X hpa 1α,β,ε,r (t) · e (ht) dt · e a h∈Z\{0} p=2 0 p∈P ggT(a,p)=1 X Dr,ε 1 1 ν 1 2 + 2 + C · x · x · x ≤ ϑ,λ,ν ln(4) |h|r+1 h∈Z\{0} X + Z h∈ \{0} + X |h| Dr,ε X Dr,ε Z |h|r+1 X Dr,ε h∈ \{0} |h|r+1 h∈Z\{0} X + Z h∈ \{0} X + Z h∈ \{0} X + Z h∈ \{0} ≤ r+1 |h|r+1 h∈Z\{0} + + Dr,ε Dr,ε r+1 |h| Dr,ε r+1 |h| Dr,ε 1 Dr,ε · x 2 + · Cϑ,λ,ν λ+ν 3 p x2− 2 p |ln (ln (a))| · ln (x) · 1 ϑ · ggT (a, |h|) a2− 2 p p 3 ν ϑ · |ln (ln (a))| · ln 2 (x) · x1− 2 · a 2 · ggT (a, |h|) · Cϑ,λ,ν · · Cϑ,λ,ν · Cϑ,λ,ν · p p 3 ν 1 Σa · ln (x) · x 2 −λ− 2 · a 4 +ϑ · 4 ggT (a, |h|) · Cϑ,λ,ν · p p λ+ν 1 Σa · ln (x) · x1− 2 · a 2 +ϑ · 4 ggT (a, |h|) 1 r+1 |h| x · ggT (a, |h|) a p 1 1 · Σa · xλ · a 2 +ϑ + xλ+ν · a 2 +ϑ · ggT (a, |h|) · Cϑ,λ,ν · |ln (ln (a))| · ln (x) · · ∆λ,0 · Bϑ,λ,ν · Σa · |ln (ln (x))| · a 2 +ϑ · 1 Dr,ε · x 2 + Dr,ε · Cϑ,λ,ν · xν ln (4) + Dr,ε · Cϑ,λ,ν · 1 |h|r+1 h∈Z\{0} X 1 |h|r h∈Z\{0} X 1 1 · Σa · xλ · a 2 +ϑ + xλ+ν · a 2 +ϑ · + Dr,ε · Cϑ,λ,ν · |ln (ln (a))| · ln (x) · x · a X Z h∈ \{0} 3 + Dr,ε · Cϑ,λ,ν p · |ln (ln (a))| · + Dr,ε · Cϑ,λ,ν · ln (x) · p ggT (a, |h|) x2− a λ+ν 2 1 −ϑ 2 2 1 1 |h|r+ 2 ! 3 2 1− ν2 + ln (x) · x ·a ϑ 2 · Z |h|r+ 2 1 X 1 Z |h|r+ 4 h∈ \{0} 1 1 h∈ \{0} 3 p λ+ν ν 1 1 Σa · ln (x) · x 2 −λ− 2 · a 4 +ϑ + x1− 2 · a 2 +ϑ · + ∆λ,0 · Dr,ε · Bϑ,λ,ν · Σa · |ln (ln (x))| · a 2 +ϑ · X X 1 Z |h|r+ 2 h∈ \{0} 3 1 wegen der für alle h ∈ Z \ {0} gültigen Ungleichung ggT (a, |h|) ≤ |h| . X Seite 88 Verwendung von Kloosterman–Summen und der Vaughan–Identität In Kombination mit Lemma 2.8 liefert dieses Ergebnis die folgende Aussage. Satz 8.3 Voraussetzungen: Seien a ∈ N \ {1}, P∗ := { p ∈ P| ggT (a, p) = 1}, α ∈ R, β ∈ R und ε ∈ R+ mit α∈ / Wa,P∗ , und β∈ / Wa,P∗ , 0 < α < β < 1, ε ≤ min {2α; 2 − 2β; β − α} + ε < 2 · min |x − γ| ∈ R |x ∈ Wa,P∗ und γ ∈ {α; β} . 2 Behauptung: Es gibt ein δ0 ∈ R mit δ0 ≥ 51 , so dass für alle (δ, ς, κ, C, D, x)T ∈ R6 mit 2 0 < δ < δ0 , ς > 6, κ > 8, C > 0, D > 0, x ≥ 2 und Cxςδ ≤ a ≤ Dx 3 −κδ a?p # p ∈ P p ≤ x, ggT (a, p) = 1 und ∈ (α; β] p = (β − α) · # { p ∈ P| p ≤ x und ggT (a, p) = 1} q |ln (ln (x))| · ln3 (x) + Oδ,ς,κ,C,D · x1−δ ε2 ist, wobei „Oδ,ς,κ,C,D “ bedeuten soll, dass die O–Konstante nur von δ, ς, κ, C und D abhängen kann. Im Beweis geht es darum, die Parameter aus Lemma 8.2 so zu wählen, dass jeder dort auftretende Term in den gewünschten Fehlerterm passt. 2 Dies gelingt leider nicht global für alle x ∈ R mit x ≥ 2 und Cxςδ ≤ a ≤ Dx 3 −κδ . Deshalb wird dieser Bereich in drei Teilbereiche aufgeteilt. Der erste Teilbereich umfasst 1 2 diejenigen (x, D)T ∈ R2 mit x ≥ 2, D > 0 und x 3 +3δ ≤ a ≤ Dx 3 −κδ , der zweite Teilbereich 9ςδ 3δ widmet sich den (x, C)T ∈ R2 mit x ≥ 2, C > 0 und Cxςδ ≤ a ≤ x 8 − 4 und der dritte 1 Teilbereich besteht aus dem „Mittelteil“, also den x ∈ R mit x ≥ 2 und x7δ ≤ a ≤ x 3 +3δ . Beweis: (i) Definitionen und Abschätzung von Σa Seien a C → C bX 2c ( 1 1, falls λ = 0 ist Σa := 1 + 2 · , ∆ · ,0 : ` λ 7→ ∆λ,0 := 0, falls λ 6= 0 ist `=1 und Σ: R+ → C x 7→ Σ (x) := 1 X Z Z h∈ \{0} 0 1α,β,ε,2 (t) · e (ht) dt · bxc X p=2 p∈ ggT(a,p)=1 P ? hpa e . a §8: Die Verteilung ohne verallgemeinerte Riemann’sche Vermutung Seite 89 Dann gilt für alle ξ ∈ 0; 23 , alle D ∈ R+ und alle x ∈ R mit x ≥ 2 und a ≤ Dxξ 3 2 3 2 3 Σa ≤† 3 + 2 · ln a2 = ln e4 · a2 ≤ ln D 4·e · x2ξ = 2ξ · ln (x) + ln D 4·e 3 + 2 · ln (D) 2 4 3 + 2 · ln (D) − ln (4) · ln (x) = · ln (x) . ≤ + − 3 ln (2) ln (2) 3 Die nächsten Beweispunkte laufen alle nach dem gleichen Schema ab. Für den in der Überschrift gegebenen Bereich wird zunächst ein Intervall angegeben, aus dem das zugehörige ν gewählt werden kann. Abhängig davon wird ein λ definiert. λ und ν bestimmen im Anschluss obere Grenzen für ϑ. Damit die Voraussetzungen (λ, ν, λ + ν)T ∈ [0; 1]3 und ϑ ∈ 0; 21 erfüllt werden können, müssen dabei Forderungen an δ — sowie κ und ς, sofern diese in der Überschrift des Beweispunktes auftreten — gestellt werden. Mit diesen Parametern, die von δ, κ und ς abhängen, wird dann Lemma 8.2 angewandt und am Ende gezeigt, dass die Einschränkungen an λ, ν und ϑ einen Fehlerabschätzungsexponenten von 1 − δ liefern. 1 2 (ii) x 3 +3δ ≤ a ≤ Dx 3 −κδ 1 2 In diesem Beweispunkt seien δ ∈ 0; 12 und κ ∈ 8; 3δ vorausgesetzt. Seien κ 2 ν1 ∈ 2δ; − 2 · δ ‡, λ1 := − ν1 2 3 und 1 (κ − 2) · 3δ 3δ 3ν1 − 6δ (κ − 4) · 3δ − 6ν1 ϑ1 := min ; ; ; ; . 2 4 − 6κδ 1 + 9δ 2 − 3κδ 8 − 12κδ Es ist 1 ≥ 2 3 = 2 3 − ν1 + ν1 = λ1 + ν1 und wegen δ > 0 sind ν1 > 2δ > 0 und 2 2 2 κ 2 2 1 1 − ν1 > − − 2 · δ > − 3δ · δ + 2δ = − + 2δ = + 2δ > 0. 3 3 2 3 2 3 3 3 Die Wahl von ν1 , λ1 und ϑ1 hängt nur von κ und δ ab. Außerdem ist ϑ1 ∈ 0; 12 . Aus Lemma 8.2 auf Seite 82 folgt die Existenz einer nur von κ und δ abhängigen Konstante C1,κ,δ ∈ R+ mit 1 C1,κ,δ ν1 x 2 + |ln (ln (a))| · ln (x) · + x |Σ (x)| ≤ · x ε2 a 1 C1,κ,δ λ1 λ1 +ν1 + · Σ · x + ∆ · |ln (ln (x))| + x · a 2 +ϑ1 a λ ,0 1 ε2 ! λ1 +ν1 3 ν1 ϑ1 1 C1,κ,δ p x2− 2 + ln 2 (x) · x1− 2 · a 2 + · |ln (ln (a))| · ln (x) · ϑ1 1 − ε2 a2 2 3 ν1 λ +ν 1 1 C1,κ,δ p −λ1 − 2 +ϑ1 1− 1 2 1 +ϑ1 2 4 2 + · Σ · ln (x) · x · a + x · a a ε2 λ1 = bT c X 1 ≤ ln (bT c) + 1 siehe Bemerkung C.6 auf Seite 132 in Anhang C. n n=1 ‡ Zum Beispiel ν1 := κδ 4 † Zu Seite 90 Verwendung von Kloosterman–Summen und der Vaughan–Identität κ 1 2 C1,κ,δ x −2)·δ −κδ ( 2 2 3 · x ≤ + x + ln ln Dx · ln (x) · 1 +3δ ε2 x3 1 +ϑ 1 2 2 2 C1,κ,δ 2 + · Σa · x 3 −ν1 + x 3 · Dx 3 −κδ ε2 2 3 2 r ln (x) · x 32 − ϑ1 ν 3 2 2 1− 21 −κδ 2 −κδ 2 3 3 · Dx ln ln Dx · 1 − ϑ1 + ln (x) · x 1 +3δ 2 2 3 x 2 1 +ϑ1 1 +ϑ1 p ν 3 2 2 −( 23 −ν1 )− 21 −κδ 4 1− 32 −κδ 2 2 3 3 · Σa · ln (x) · x · Dx +x · Dx C1,κ,δ + · ε2 C1,κ,δ ε2 2 1 C1,κ,δ ( κ −2)·δ −3δ 2 2 + |ln (ln (Dx))| · ln (x) · x 3 ≤ · x + x ε2 1 1 C1,κ,δ +ϑ1 1−ν1 − κδ +ϑ1 · 2−3κδ +ϑ1 1− κδ +ϑ1 · 2−3κδ 2 2 3 2 2 3 + · x + D · x · Σ · D a ε2 ϑ1 ν 1 C1,κ,δ p +ϑ1 · 1+9δ 1− 21 +ϑ1 · 2−3κδ 1− 3δ 2 6 2 · ln 2 (x) · x 6 · + D x + |ln (ln (Dx))| · ln (x) · ε2 1 ν 1 C1,κ,δ p +ϑ1 +ϑ1 · 2−3κδ +ϑ1 +ϑ1 · 2−3κδ 1+ 21 − κδ 1− κδ 4 4 3 2 2 3 + · Σ · ln (x) · D + D · x · x a ε2 + für alle x ∈ R und alle D ∈ R+ mit x ≥ 2 und 1 2 x 3 +3δ ≤ a ≤ Dx 3 −κδ . Die Behauptung folgt nun für alle x ∈ R und alle D ∈ R+ mit x 3 +3δ ≤ a ≤ Dx 3 −κδ und x ≥ 2 aus Lemma 2.8 auf Seite 19 wegen 1 2 1 2 κ 2 − 2 · δ ≤ 2 · 3δ · δ − 2δ ≤ 1 − δ, 2 ≤ 1 − δ, 3 − 3δ ≤ 1 − δ κδ 2 − 3κδ κδ (κ − 2) · 3δ 2 − 3κδ 1− + ϑ1 · ≤ 1− + · = 1 − δ, 2 3 2 4 − 6κδ 3 κδ 2 − 3κδ κδ 2 − 3κδ 1 − ν1 − + ϑ1 · ≤ 1− + ϑ1 · ≤ 1 − δ, 2 3 2 3 3δ 1 + 9δ 3δ 3δ 1 + 9δ 1− + ϑ1 · ≤ 1− + · = 1 − δ, 2 6 2 1 + 9δ 6 ν1 2 − 3κδ ν1 3ν1 − 6δ 2 − 3κδ 1− + ϑ1 · ≤ 1− + · =1−δ 2 6 2 2 − 3κδ 6 und 2 − 3κδ ν1 κδ (κ − 4) · 3δ − 6ν1 2 − 3κδ ν1 κδ 1+ − + ϑ1 · ≤ 1+ − + · = 1 − δ. 2 4 3 2 4 8 − 12κδ 3 Hier nun ein paar Worte zur Wahl von λ1 , λ + ν + ξ · 12 + ϑ ≤ 1 − δ, ν1 , ϑ1 und den x–Potenzen, die a begrenzen. 3 λ+ν 1 ϑ 2 − 2 − ζ · 2 − 2 ≤ 1 − δ, Geht man von ζ ∈ R und ξ ∈ R mit ζ ≤ ξ 1 − ν2 + ξϑ δ, 2 ≤1− und Cxζ ≤ a ≤ Dxξ aus, so werden also 3 1 ν nach Lemma 8.2 λ ∈ [0; 1], ν ∈ [0; 1 − λ] 2 −λ− 2 +ξ· 4 +ϑ ≤1−δ 1 und ϑ ∈ 0; 2 gesucht, so dass und 1 1 − λ+ν ν ≤ 1 − δ, 2 +ξ· 2 +ϑ ≤1−δ 1 1 − ζ ≤ 1 − δ, λ + ξ · 12 + ϑ ≤ 1 − δ, 2 sind, ξ möglichst groß und ζ möglichst klein gewählt werden kann. §8: Die Verteilung ohne verallgemeinerte Riemann’sche Vermutung Setzt man ζ ≥ δ und 2δ < ν ≤ 1 − δ voraus, so lassen sich die erste, die zweite und die drittletzte Ungleichung in jedem Fall erfüllen (mit der drittletzten Ungleichung ergibt sich dadurch für ϑ eine Abhängigkeit von ν, δ und ξ). Beachtet man noch, dass die dritte Ungleichung wegen ν ≥ 0 in jedem Fall erfüllt wird, wenn die vierte Ungleichung erfüllt ist, so sucht man ζ ∈ R, ξ ∈ R, λ ∈ R, ν ∈ R und ϑ ∈ R mit Seite 91 nen Größen ϑ und δ ab hier weggelassen. Als Ausgleich hierfür werden die entsprechenden Ungleichungen in strikte Ungleichungen verwandelt. Stellt man die erhaltenen Ungleichungen nach ξ und ζ um, so ergibt sich, dass ζ ∈ R, ξ ∈ R, λ ∈ R und ν ∈ R mit 0 < ν < 1, 0 ≤ λ ≤ 1 − ν, 0 < ζ ≤ ξ, 2δ < ν ≤ 1 − δ, ξ < 2 − 2 · (λ + ν) , 0 ≤ λ ≤ 1 − ν, ξ < 4 · (λ + ν) − 2ν − 2, δ ≤ ζ ≤ ξ, n o 0 < ϑ ≤ min 12 ; ν−2δ , ξ ξ < (λ + ν) und λ + ν + 2ξ + ξϑ ≤ 1 − δ, 2λ + ν − 2ξ − 2ξϑ ≥ 1 + 2δ, ζ > 1 − (λ + ν) gesucht werden. Hier wird deutlich, dass die Wahl von ξ und ζ im Wesentlichen von der Summe (λ + ν) abhängt, wobei ν möglichst klein gehalten werden sollte, damit sich in der Mittleren der ξ betreffenden Ungleichungen eine möglichst hohe obere Schranke für ξ ergibt. λ + ν − ξ − 2ξϑ ≥ 2δ und λ + ν + ζ − ζϑ ≥ 1 + 2δ. Um in die Nähe einer Lösung dieses Systems zu kommen, werden die beiden beliebig kleiζ, ξ (λ ν) + (λ + 2· 1− 2− 1 ν) 2 3 0 (λ ν) 4· + (λ +ν )− 2 2 5 (λ + ν) 3 5 2 3 1 Abbildung 5: Die Schranken für ζ und ξ in Abhängigkeit von (λ + ν) Seite 92 Verwendung von Kloosterman–Summen und der Vaughan–Identität Man stellt fest, dass max (min {t; 4t − 2; 2 − 2t}) = t∈[0;1] 2 3 ist. (Siehe auch Abbildung 5 auf der vorherigen Seite — hier stellt die graue Linie die untere Grenze für ζ in Abhängigkeit von (λ + ν) dar, während die durchgezogenen Linien die oberen Schranken für ξ symbolisieren, welche auf der horizontalen Achse wie in der vorstehenden Gleichung sortiert sind.) 2 Deshalb wurden in Beweispunkt (ii) Dx 3 1 quasi als obere Schranke und x 3 quasi als untere Schranke für a gewählt. Die Verfeine2 1 rungen Dx 3 −κδ bzw. x 3 +3δ entstehen, wenn man δ und ϑ wieder in die Ungleichungen einbezieht. In Abbildung 5 auf der vorherigen Seite ist auch zu erkennen, wie es jetzt weitergeht. 1 Für a < x 3 +3δ ist es möglich, eine größere Summe (λ + ν) zu wählen, so dass man irgendwann mit 1 − (λ + ν) bei ςδ landet. Auch diese Schranke für die untere x–Potenz lässt sich motivieren. (iii) Cxςδ ≤ a ≤ x In Abbildung 5 wird deutlich, dass bei hoher Wahl für λ + ν die Ungleichungen λ+ν+ ξ 2 + ξϑ ≤ 1 − δ und λ + ν + ζ − ζϑ ≥ 1 + 2δ die stärksten Einschränkungen an ξ und ζ darstellen. Ignoriert man hier die beliebig klein wählbare Größe ϑ und wandelt dafür die Ungleichungen in strikte Ungleichungen um, so ergeben sich unter Beachtung von ζ ≤ ξ für ζ die beiden Abschätzungen λ+ν+ ζ 2 <1−δ und λ + ν + ζ > 1 + 2δ. Zieht man die erste Ungleichung von der zweiten ab, so erhält man ζ 2 > 3δ bzw. ζ > 6δ. Zunächst wird nun der untere Bereich der x–Potenzen betrachtet. 9ςδ − 3δ 8 4 1 16 66 In diesem Beweispunkt seien δ ∈ 0; und ς ∈ 6; − vorausgesetzt. 15 29δ 29 Seien 17δ 29ςδ † − , ν2 ∈ 2δ; 1 − 8 16 λ2 := 1 − δ 5ςδ − − ν2 4 8 und ϑ2 := min 1 ς − 6 3ς − 18 8ν2 − 16δ 16 − 34δ − 29ςδ − 16ν2 4 − 6δ − 7ςδ ; ; ; ; ; . 2 18ς − 12 8ς 9ςδ − 6δ 36ςδ − 24δ 9ςδ − 6δ Wegen ς > 0 und δ > 0 sind ν2 > 2δ > 0 und δ 5ςδ 17δ 29ςδ δ 5ςδ 15δ 19ςδ 1 − ν2 ≥ λ2 = 1 − ν2 − − ≥1− 1− − − − = + > 0. 4 8 8 16 4 8 8 16 Die Wahl von ν2 , λ2 und ϑ2 hängt nur von ς und δ ab. Außerdem ist ϑ2 ∈ 0; 12 . † Zum Beispiel ν2 := 1 2 − δ 16 − 29ςδ 32 §8: Die Verteilung ohne verallgemeinerte Riemann’sche Vermutung Seite 93 Aus Lemma 8.2 auf Seite 82 folgt die Existenz einer nur von ς und δ abhängigen Konstante C2,ς,δ ∈ R+ mit 1 C2,ς,δ ν2 x 2 + |ln (ln (a))| · ln (x) · |Σ (x)| ≤ · x + x ε2 a 1 C2,ς,δ + 2 · Σa · xλ2 + ∆λ2 ,0 · |ln (ln (x))| + xλ2 +ν2 · a 2 +ϑ2 ε ! λ2 +ν2 3 ν2 ϑ2 1 C2,ς,δ p x2− 2 + 2 · |ln (ln (a))| · ln (x) · + ln 2 (x) · x1− 2 · a 2 ϑ 1 − 22 ε 2 a 3 ν2 λ2 +ν2 1 1 C2,ς,δ p + 2 · Σa · ln (x) · x 2 −λ2 − 2 · a 4 +ϑ2 + x1− 2 · a 2 +ϑ2 ε 9ςδ 3δ 1 C2,ς,δ 1− 17δ − 29ςδ x −4 8 16 + x 2 + ln ln x 8 ≤ · ln (x) · · x ε2 Cxςδ 1 +ϑ 2 δ 5ςδ δ 5ςδ 3δ 9ςδ C2,ς,δ 2 + 2 · Σa · x1− 4 − 8 −ν2 + x1− 4 − 8 · x 8 − 4 ε δ 5ςδ r ln (x) · x 32 − 1− 4 2− 8 C2,ς,δ 9ςδ 3δ − + 2 · ln ln x 8 4 · ϑ 1 − 2 ε (Cxςδ ) 2 2 r 9ςδ 3δ ϑ2 ν 3 C2,ς,δ 9ςδ 2 1− 22 − 3δ 2 8 4 + 2 · ln ln x · x 8 −4 · ln (x) · x ε 9ςδ 3δ 1 +ϑ2 ν2 3 δ 5ςδ C2,ς,δ p 4 + 2 · Σa · ln (x) · x 2 −(1− 4 − 8 −ν2 )− 2 · x 8 − 4 ε δ − 5ςδ 9ςδ 3δ 1 +ϑ2 1− 4 C2,ς,δ p 8 2 2 + 2 · Σa · ln (x) · x1− · x 8 −4 ε 1 29ςδ C2,ς,δ |ln (ln (x))| · ln (x) 1−ςδ 1− 17δ − · x 8 16 + x 2 + ·x ≤ ε2 C 9ςδ−6δ 9ςδ−6δ 5δ ςδ 5δ ςδ C2,ς,δ + 2 · Σa · x1−ν2 − 8 − 16 +ϑ2 · 8 + x1− 8 − 16 +ϑ2 · 8 ε ! δ 3ςδ ςδ ν2 9ςδ−6δ 1 C2,ς,δ p x1+ 8 − 16 +ϑ2 · 2 + 2 · |ln (ln (x))| · ln (x) · + ln 2 (x) · x1− 2 +ϑ2 · 16 ϑ2 1 − ε C2 2 1 ν2 δ 29ςδ 9ςδ−6δ 9ςδ−6δ 1 δ 7ςδ C2,ς,δ p + 2 · Σa · ln (x) · x 2 + 2 + 16 + 32 +ϑ2 · 8 + x 2 − 4 + 8 +ϑ2 · 8 ε für alle x ∈ R und alle C ∈ R+ mit x ≥ 2 und Cxςδ ≤ a ≤ x Die Behauptung folgt nun für alle x ∈ aus Lemma 2.8 auf Seite 19 wegen 9ςδ − 3δ 8 4 . R und alle C ∈ R+ mit Cxςδ ≤ a ≤ x 9ςδ − 3δ 8 4 und x ≥ 2 17δ 29ςδ 1 − ≤ 1 − δ, ≤ 1 − δ, 1 − ςδ ≤ 1 − δ 8 16 2 5δ ςδ 9ςδ − 6δ 5δ ςδ ς −6 9ςδ − 6δ 1− − + ϑ2 · ≤ 1− − + · = 1 − δ, 8 16 8 8 16 18ς − 12 8 5δ ςδ 9ςδ − 6δ 5δ ςδ 9ςδ − 6δ 1 − ν2 − − + ϑ2 · ≤ 1− − + ϑ2 · ≤ 1 − δ, 8 16 8 8 16 8 δ 3ςδ ςδ δ 3ςδ 3ς − 18 ςδ 1+ − + ϑ2 · ≤ 1+ − + · = 1 − δ, 8 16 2 8 16 8ς 2 1− Seite 94 Verwendung von Kloosterman–Summen und der Vaughan–Identität ν2 9ςδ − 6δ ν2 8ν2 − 16δ 9ςδ − 6δ + ϑ2 · ≤ 1− + · = 1 − δ, 2 16 2 9ςδ − 6δ 16 δ 29ςδ 9ςδ − 6δ 1 ν2 δ 29ςδ 1 ν2 + + + + ϑ2 · ≤ + + + 2 2 16 32 8 2 2 16 32 16 − 34δ − 29ςδ − 16ν2 9ςδ − 6δ + · =1−δ 36ςδ − 24δ 8 1− und 9ςδ − 6δ 1 δ 7ςδ 4 − 6δ − 7ςδ 9ςδ − 6δ 1 δ 7ςδ − + + ϑ2 · ≤ − + + · = 1 − δ. 2 4 8 8 2 4 8 9ςδ − 6δ 8 Um die Größe ς im Folgenden nicht mehr mitschleppen zu müssen, soll kurz gezeigt werden, 16 dass die Behauptung schon für alle δ ∈ 0; 269 und alle x ∈ R mit x ≥ 2 und δ δ x7δ− 18 ≤ a ≤ x7δ+ 16 bewiesen ist. (iv) Absolute Werte 16 1 1 16 < 269 < 16 . Für alle δ ∈ 0; 269 Es ist 17 gilt 66 16 66 269 − 66 203 16 − > − = = = 7. 16 29δ 29 29 29 29 29 · 269 16 Für alle δ ∈ 0; 269 darf also in Beweispunkt (iii) zum Beispiel ς := 125 18 < 7 sowie C := 1 gewählt werden und die Behauptung folgt damit für alle x ∈ R mit x ≥ 2 und Cxςδ = x 125δ 18 17δ δ = x6δ+ 18 ≤ a ≤ x7δ+ 16 = x 113δ 16 =x 125δ − 12δ 16 16 =x 9ςδ − 3δ 8 4 . Damit sind die obere und die untere Grenze in der Behauptung abgearbeitet und noch zu zeigen ist die Behauptung für alle δ ∈ (0; δ0 ) mit δ0 ∈ R+ und alle x ∈ R mit x ≥ 2 und 1 x7δ ≤ a ≤ x 3 +3δ . In diesem mittleren Bereich wird in Schritten von je 2δ vorgegangen. Dies ist wenig hilfreich, wenn man eine effektive Angabe der Konstanten wünscht, führt aber zum Ziel. 1 5δ 2 Startet man für ein δ ∈ 0; 33 mit einem beliebigen oberen Exponenten ξ ∈ 7δ; 2 − 4 , so 1 lassen sich ν ∈ (2δ; 1), λ ∈ [0; 1 − ν] und ϑ ∈ 0; 2 angeben, mit denen die oben angegebenen Ungleichungen für ζ := ξ − 2δ erfüllt werden. Diese hängen allerdings von ξ ab, so dass auch die entsprechende O–Konstante von ξ abhängt. Dieser Missstand wird im letzten Beweispunkt noch behoben. δ (v) xξ− 2 ≤ a ≤ xξ In diesem Beweispunkt seien δ ∈ 2 0; 33 und ξ ∈ 1 5δ 7δ; − 2 4 vorausgesetzt. Seien νξ ∈ 2δ; 1 − δ − 2ξ 2 †, λξ := 1 + 3δ 3ξ − − νξ 4 4 und ϑξ := min 1 ξ − 7δ νξ − 2δ 2 − δ − 4ξ − 2νξ 4 − 5δ − 7ξ ; ; ; ; . 2 4ξ ξ 4ξ 8ξ §8: Die Verteilung ohne verallgemeinerte Riemann’sche Vermutung Seite 95 Wegen ξ > δ > 0 gilt νξ > 2δ > 0 und 3 δ 3ξ 3δ 5δ 5ξ 1 − νξ ≥ λξ = 1 − νξ − · (ξ − δ) > 1 − 1 − − 2ξ − + = + > 0. 4 2 4 4 4 4 Die Wahl von λξ , νξ und ϑξ hängt nur von ξ und δ ab. Außerdem ist ϑξ ∈ 0; 21 . Aus Lemma 8.2 auf Seite 82 folgt die Existenz einer nur von ξ und δ abhängigen Konstante Cξ,δ ∈ R+ mit 1 Cξ,δ νξ x 2 + |ln (ln (a))| · ln (x) · |Σ (x)| ≤ · x + x ε2 a 1 Cξ,δ + 2 · Σa · xλξ + ∆λξ ,0 · |ln (ln (x))| + xλξ +νξ · a 2 +ϑξ ε λξ +νξ 3 − ν ϑ p 2 ξ ξ 1 Cξ,δ x2 + 2 · |ln (ln (a))| · ln (x) · + ln 2 (x) · x1− 2 · a 2 ϑξ 1 ε a2− 2 λ +ν ν 3 1 1 Cξ,δ p 1− ξ 2 ξ −λξ − 2ξ +ϑξ +ϑξ 2 4 2 +x ·a ·a + 2 · Σa · ln (x) · x ε 1 Cξ,δ x 1− 2δ −2ξ ξ 2 + ln ln x ≤ · x + x · ln (x) · δ ε2 xξ− 2 1 +ϑξ 3ξ 3ξ 3δ 3δ Cξ,δ 2 + 2 · Σa · x1+ 4 − 4 −νξ + x1+ 4 − 4 · xξ ε 3δ 3ξ 1+ − 3 q ϑξ νξ ln (x) · x 2 − 42 4 3 2 1− ξ + ln 2 (x) · x 2 · xξ |ln (ln (x ))| · ϑξ 1 − δ 2 2 ξ− 2 x 3ξ 1 +ϑξ 1 +ϑξ ν p 1+ 3δ 3 4 − 4 2 −(1+ 3δ − 3ξ −νξ )− 2ξ ξ 4 1− 2 4 4 2 · Σa · ln (x) · x · x · xξ +x Cξ,δ + 2 · ε Cξ,δ ε2 1 Cξ,δ 1− δ −2ξ 1−ξ+ 2δ 2 2 + |ln (ln (x))| · ln (x) · x · x + x ≤ ε2 ξ ξ 3δ 3δ Cξ,δ + 2 · Σa · x1−νξ + 4 − 4 +ϑξ ·ξ + x1+ 4 − 4 +ϑξ ·ξ ε νξ ξ 2ξ−δ ξ δ 1 Cξ,δ p + 2 · |ln (ln (x))| · ln (x) · x1− 8 − 8 +ϑξ · 4 + ln 2 (x) · x1− 2 +ϑξ · 2 ε 1 νξ 3δ 7ξ 1 3δ Cξ,δ p + 2 · Σa · ln (x) · x 2 + 2 − 4 +ξ+ϑξ ·ξ + x 2 − 8 + 8 +ϑξ ·ξ ε für alle x ∈ R mit x ≥ 2 und δ xξ− 2 ≤ a ≤ xξ . + Die Behauptung folgt nun für alle x ∈ Seite 19 wegen R mit x ≥ 2 und xξ− 2 ≤ a ≤ xξ aus Lemma 2.8 auf δ δ − 2ξ ≤ 1 − − 14δ ≤ 1 − δ, 2 2 δ δ 1 − ξ + ≤ 1 − 7δ + ≤ 1 − δ, 2 2 1− † Zum Beispiel νξ := 1 2 + 3δ 4 δ 1 ≤ 1 − δ, 2 −ξ Dissertation von Simon Feiler zum Thema Die relative Verteilung der Inversen einer natürlichen Zahl zu variablen Moduln Seite 96 Verwendung von Kloosterman–Summen und der Vaughan–Identität 3δ ξ − + ϑξ · ξ 4 4 3δ ξ − + ϑξ · ξ 1 − νξ + 4 4 δ ξ 2ξ − δ 1 − − + ϑξ · 8 8 4 νξ ξ 1− + ϑξ · 2 2 3δ 1 νξ + − + ξ + ϑξ · ξ 2 2 4 1+ 3δ ξ ξ − 7δ − + · ξ = 1 − δ, 4 4 4ξ 3δ ξ 1+ − + ϑξ · ξ ≤ 1 − δ, 4 4 δ ξ ξ − 7δ 2ξ 1− − + · = 1 − δ, 8 8 4ξ 4 νξ νξ − 2δ ξ 1− + · = 1 − δ, 2 ξ 2 2 − δ − 4ξ − 2νξ 3δ 1 νξ + − +ξ+ ·ξ =1−δ 2 2 4 4ξ ≤ 1+ ≤ ≤ ≤ ≤ und 1 3δ 7ξ 1 3δ 7ξ 4 − 5δ − 7ξ − + + ϑξ · ξ ≤ − + + · ξ = 1 − δ, 2 8 8 2 8 8 8ξ wobei die in diesem Beweisschritt angegebene O–Konstante noch von ξ abhängt. Selbstverständlich werden für jedes δ ∈ R+ nur endlich viele Schritte der Größe 2δ benötigt, 2 eine nur um den Weg von 7δ nach 13 +3δ zu überbrücken. Daraus entsteht für jedes δ ∈ 0; 51 von δ abhängige Konstante, die gleichmäßig im gesamten „Mittelteil“ gilt. Gemeinsam mit den beiden bereits angegebenen Konstanten für den oberen und den unteren Bereich ist damit die 2 Behauptung für alle C ∈ R+ , alle D ∈ R+ und alle x ∈ R mit x ≥ 2 und Cxςδ ≤ a ≤ Dx 3 −κδ gezeigt. 1 (vi) x7δ ≤ a ≤ x3 +3δ 2 1 Für alle δ ∈ 0; 51 ist 12 − 5δ 4 > 3 + 3δ. 2 vorausgesetzt. Sei In diesem Beweispunkt werde δ ∈ 0; 51 2 Nδ := − 8. 3δ Für alle n ∈ N0 mit n < Nδ seien ξδ,n 1 nδ := + 3δ − 3 2 und ξδ,Nδ ( ξδ,Nδ −1 − 2δ , falls := ξδ,Nδ −1 − 4δ , falls 2 3δ 2 3δ ∈ / N ist; ∈ N ist. Dann ist ξδ,n+1 < ξδ,n für alle n ∈ N0 mit n < Nδ . 2 Außerdem gilt im Falle 3δ ∈ /N 1 + 3δ, 3 2 1 3δ − 8 · δ ξδ,Nδ = + 3δ − 3 2 2 · δ 1 1 1 > + 3δ − 3δ + 4δ = + 7δ − = 7δ 3 2 3 3 2 δ 1 δ 3δ − 8 · δ ξδ,Nδ − = + 3δ − − 2 3 2 2 2 −1 ·δ 1 5δ 1 13δ 1 δ < + − 3δ + 4δ = + − + = 7δ. 3 2 2 3 2 3 2 ξδ,0 = und §8: Die Verteilung ohne verallgemeinerte Riemann’sche Vermutung Im Fall 2 3δ Seite 97 ∈ N folgt genauso 1 + 3δ, 3 2 1 δ 3δ − 9 · δ ξδ,Nδ = + 3δ − − 3 2 4 2 · δ 1 9δ δ 1 1 > + 3δ − 3δ + − = + 7δ − = 7δ 3 2 2 2 3 3 2 1 δ δ δ 3δ − 9 · δ − − ξδ,Nδ − = + 3δ − 2 3 2 4 2 2 · δ 9δ 1 9δ 1 27δ 1 27δ = + − 3δ + = + − = < 7δ. 3 4 2 2 3 4 3 4 ξδ,0 = und Damit folgt für alle n ∈ N0 mit n ≤ Nδ ξδ,Nδ − δ 2 < 7δ < ξδ,Nδ ≤ ξδ,n ≤ ξδ,0 = 1 3 + 3δ < 1 2 − 5δ 4 . Außerdem hängt ξδ,n für alle n ∈ N0 mit n ≤ Nδ nur von δ und n ab. Nach Beweispunkt (v) gibt es also für alle n ∈ N0 mit n ≤ Nδ ein nur von δ und n abhängiges Dn,δ ∈ R+ mit q |Σ (x)| ≤ für alle x ∈ R mit x ≥ 2 und |ln (ln (x))| · ln3 (x) Dn,δ · ε2 · x1−δ δ xξδ,n − 2 ≤ a ≤ xξδ,n . Für alle x ∈ R mit x ≥ 2 und x7δ ≤ a ≤ x 3 +3δ gibt es ein nx ∈ N0 mit 1 nx ≤ Nδ Mit und δ xξδ,nx − 2 ≤ a ≤ xξδ,nx . C3,δ := max Dn,δ ∈ R+ n ∈ N0 und n ≤ Nδ folgt also |Σ (x)| ≤ für alle x ∈ R mit x ≥ 2 und q C3,δ · |ln (ln (x))| · ln3 (x) ε2 · x1−δ 1 x7δ ≤ a ≤ x 3 +3δ . Mit den Beweispunkten (ii), (iii) und (iv) folgt die Behauptung aus Lemma 2.8 auf Seite 19. X Theoretisch entsteht die Voraussetzung ς > 6 nur, wenn man ζ ≤ ξ annimmt. Andererseits lassen sich selbstverständlich auch C ∈ R+ , D ∈ R+ , ζ ∈ R+ , ξ ∈ R+ und x ∈ R mit x ≥ 2, Cxζ ≤ a ≤ Dxξ und ζ > ξ finden. Lässt man diese im Beweis zu, so müsste man mit der angegebenen Beweismethode bis zur Voraussetzung „ς > 2“ kommen. Allerdings sind in dem Beweisschritt dann nicht einmal mehr alle (C, D)T ∈ R mit 0 < C ≤ 1 und D ≥ 1 zugelassen. Dies bildet eine nicht zumutbare Einschränkung. Seite 98 Verwendung von Kloosterman–Summen und der Vaughan–Identität In Satz 5.7 — dem Analogon zum gerade bewiesenen Satz mit Annahme der Verallgemeinerten Riemann’schen Vermutung — wird auch noch eine analoge Formel angegeben, wenn im Fehlerterm nicht eine x– Potenz gewonnen werden soll, sondern wenn der Fehlerterm lediglich von der Größenordx nung o ln(x) für x → ∞ sein soll. Der Vorteil dieses Ziels ist dort, dass man von der recht einschneidenden Bedingung Cxδ ≤ a herunterkommt zu C · ln (x) ≤ a und gleichzeitig die Bedingung a ≤ Dx1−2δ zu a ≤ D· ln8x(x) abschwächen kann. Dadurch sind dort für ein x mehr a wählbar als bei der anderen Fehlerabschätzung. Ein ähnliches Ergebnis scheint mit der in diesem Kapitel vorgestellten Methode nur für derart wenige (x, a)T ∈ R × N erreichbar zu sein, dass sich die Mühe wohl nicht lohnt. In §8 unterscheidet sich die Abschätzung der Summe aus Lemma 2.8 im Prinzip höchstens um einen Logarithmus–Faktor von der Abschätzung aus Lemma 7.11, wobei der größte gemeinsame Teiler verschwindet. Dort sind L (x, y, z) := ln xy ·ln3 xz und bXc 1 a 2 Σa := 1 + 2 · . ` Betrachtet man jetzt eine Funktion f : R+ → R+ mit f (x) = o (1) für x → ∞ und will erreichen, dass jeder Term in der Abschätzung aus Lemma 7.11 von der Gröf (x) x ßenordnung O ε2 · ln(x) ist, so müssen insbesondere p 3 |ln (ln (a))| · L (x, y, z) x 2 1 Cϑ · · 1 · 1 ϑ ln (x) (yz) 2 a 2 − 2 x ≤c· · f (x) ln (x) `=1 und Cϑ · 1 Σa x · yz · a 2 +ϑ ≤ d · · f (x) ln (x) ln (x) sein. Dies liefert Cϑ ! 2 p 1 1−ϑ |ln (ln (a))| · L (x, y, z) x2 · 1 cf (x) (yz) 2 als untere und d f (x) x · · Cϑ Σa yz 2 1+2ϑ als obere Schranke für a. Damit hier a ≥ c̃ · lnA (x) mit einem A ∈ R+ vorausgesetzt werden kann, muss also lnBx(x) = O (yz) sein, da in der unteren Schranke bereits eine x–Potenz +steht, wenn 1−δ yz = O x mit einem δ ∈ R ist. x ˜ yz = d · lnB (x) liefert Cϑ ! 2 p 1−ϑ B |ln (ln (a))| · L (x, y, z) 2 (x) · ln 1 cd˜2 · f (x) als untere und 2 1+2ϑ d · f (x) B · ln (x) Cϑ · d˜ · Σa als obere Schranke für a. Hier sind sowohl die Vorfaktoren der Basis als auch der Exponent in der unteren Schranke größer als in der oberen, so dass für a höchstens ein Spielraum zwischen zwei Logarithmuspotenzen bleibt. Man würde zwar vermutlich mit a bis zu jeder beliebigen Logarithmus–Potenz hochlaufen können, eine x–Potenz jedoch nie erreichen. Aus diesem Grund scheint die Voraussetzung, dass a mindestens die Ordnung einer x–Potenz hat, durchaus sinnvoll. Anhang Anhang A: Die charakteristische Funktion 1α,β,ε,r In Teilabschnitt 2c (Intervalle von zu a teilerfremden Primzahlen) wird zunächst die Funktion 1α,β,ε,r für geeignete α ∈ R, β ∈ R, ε ∈ R+ und r ∈ N definiert. In Anhang A soll die Existenz dieser Funktion bewiesen werden. Dies geschieht im Prinzip durch direkte Angabe. Dabei wird von einer Treppenfunktion ausgegangen, die dann genau r–mal „geglättet“ wird. In jedem Glättungsschritt wird der Funktionswert der neuen Glättung an einer Stelle als Mittelwert der Funktionswerte der vorherigen Glättung innerhalb eines Intervalls um diese Stelle bestimmt. Dies geschieht durch Integralbildung und Division durch die Intervalllänge. Die Methode geht zurück auf eine Idee von I. M. Vinogradov† (siehe [Vi, Lemma 12 in Chapter I]). Um die für 1α,β,ε,r geforderten Integralabschätzungen induktiv beweisen zu können, bietet sich wegen der Mittelwertsbildung die Verwendung des kleinen Satzes von Fubini an. Hilfssatz A.1 (Kleiner Satz von Fubini) Voraussetzungen: Seien p ∈ N, q ∈ N, A ⊆ Rp × Rq offen oder abgeschlossen und f: A → C (x, y)T 7→ f (x, y) stetig auf A, derart, dass ein M ∈ R+ ∪ {0} existiert mit p x2 + y 2 ≤ M |f (x, y)| ≤ M und für alle (x, y)T ∈ A. Rq → { D| D n⊆ Rp } o Seien B : und C := { y ∈ Rq | By 6= ∅}. y 7→ By := x ∈ Rp (x, y)T ∈ A ( p ) R → { D| D n⊆ Rq } o Seien G : und H := { x ∈ Rp | Gx 6= ∅}. x 7→ Gx := y ∈ Rq (x, y)T ∈ A ( ) Z Z f (x, y) dx für alle y ∈ C und Behauptung: Es existieren By Gx Z C → C F : y 7→ F (y) := f (x, y) dx By † sprich: „I. M. Vinogradov“ f (x, y) dy für alle x ∈ H. ist stetig auf C, Seite 100 Anhang Z H → C G: x 7→ G (x) := f (x, y) dy Gx Z ist stetig auf H und es gilt Z f (x, y) d (x, y) = A Z F (y) dy = C G (x) dx. H Referenz: Siehe [Kö, Sätze 7 und 7’ in Kapitel 7 auf den Seiten 249 und 251 und Stetigkeitssatz in Kapitel 8 auf Seite 282 der 5. Auflage]24 . X Der kleine Satz von Fubini sagt also aus, dass es bei der Integration einer beschränkten und stetigen Funktion, die auf einem beschränkten und mehrdimensionalen Gebiet, das offen oder abgeschlossen sein darf, definiert ist, nicht auf die Reihenfolge der Integration ankommt. Außerdem wird festgehalten, dass Funktionen, die durch Integration in einer Richtung entstehen, stetig sind. Um den kleinen Satz von Fubini in jedem Glättungsschritt anwenden zu können, werden im nächsten Lemma Stetigkeit, Beschränktheit und 1–Periodizität der Glättungen bewiesen. Lemma A.2 (Stetigkeit, Beschränktheit und Periodizität der Funktion 1α,β,ε,r ) Voraussetzungen: n o Seien α ∈ R, β ∈ R mit 0 < α < β < 1, δ ∈ R+ mit δ ≤ min α; 1 − β; β−α , 2 f0 : und fk : R → R ( 1, falls es ein h ∈ Z mit α ≤ x − h ≤ β gibt , x 7→ f0 (x) := 0, falls es ein h ∈ Z mit β − 1 < x − h < α gibt R → R 1 · x → 7 fk (x) := 2δ Behauptung: Zδ −δ fk−1 (x + t) dt für alle k ∈ N. R für alle k ∈ N. (ii) Für alle x ∈ R und alle k ∈ N0 gilt (i) Dann ist fk stetig auf ganz 0 ≤ fk (x) ≤ 1. (iii) Für alle x ∈ R und alle k ∈ N0 gilt fk (x + 1) = fk (x) . 24 „Analysis 2 “, K. Königsberger, Springer (Berlin, Heidelberg, New York — 1993), Sätze 7 und 7’ in Kapitel 7 auf den Seiten 249 und 251 und Stetigkeitssatz in Kapitel 8 auf Seite 282 der 5. Auflage A: Die charakteristische Funktion 1α,β,ε,r Seite 101 Der Beweis wird durch Induktion über k geführt. Zunächst wird der Induktionsanfang in einigen Beweisschritten vorbereitet. Der Induktionsanfang selbst beginnt dann in Beweisschritt (vii). Der Induktionsschluss beruft sich in der Stetigkeitsaussage auf den kleinen Satz von Fubini A.1. Die eigentliche Arbeit besteht im Nachrechnen der Stetigkeit von f1 . Beweis: Um sich im Folgenden auf eine (möglichst kleine) offene Umgebung des Intervalls [0; 1] beschränken zu können, wird zunächst die 1–Periodizität von f1 bewiesen. (i) Periodizität von f1 Für alle x ∈ R und alle t ∈ R ist f0 (x + 1 + t) = f0 (x + t). Damit folgt für alle x ∈ R 1 f1 (x + 1) = · 2δ Zδ 1 · f0 (x + 1 + t) dt = 2δ −δ Zδ f0 (x + t) dt = f1 (x) . −δ Da f0 nicht stetig ist, lässt sich der kleine Satz von Fubini nicht auf f0 anwenden. Deshalb werden nun zunächst die Werte von f1 im Intervall [0; 1] berechnet. Das Intervall [0; 1] wird von f1 in fünf Sektoren aufgeteilt. Im ersten und im letzten Sektor verschwindet f1 . Im zweiten Sektor steigt f1 linear vom Wert 0 auf den Wert 1 an, den f1 im dritten Sektor konstant annimmt, bevor die Werte von f1 im vierten Sektor linear wieder auf den Wert 0 abfallen. (ii) Das Verschwinden von f1 in [0; α − δ] und [β + δ; 1] Es ist β + δ ≤ β + 1 − β = 1 und es ist α − δ ≥ α − α = 0. Damit folgt für alle t ∈ (−δ; δ) β − 1 ≤ −δ < x + t < α, für alle x ∈ [0; α − δ] und β < x + t < 1 + δ ≤ 1 + α, für alle x ∈ [β + δ; 1] . Deshalb ist f0 (x + t) = 0 für alle x ∈ [0; α − δ] ∪ [β + δ; 1] und alle t ∈ (−δ, δ). Also ist für alle x ∈ [0; α − δ] ∪ [β + δ; 1] 1 f1 (x) = · 2δ Zδ 1 f0 (x + t) dt = · 2δ −δ Zδ 0 dt = 0. −δ (iii) Die Konstanz von f1 in [α + δ; β − δ] Für alle x ∈ [α + δ; β − δ] und alle t ∈ [−δ, δ] gilt α≤x+t≤β und damit f0 (x + t) = 1. Also ist für alle x ∈ [α + δ, β − δ] 1 · f1 (x) = 2δ Zδ −δ 1 f0 (x + t) dt = · 2δ Zδ 1 dt = −δ 1 δ − (−δ) · [t]t=δ = 1. t=−δ = 2δ 2δ Seite 102 Anhang (iv) Die Linearität von f1 in [α − δ; α + δ] Wegen α ≥ δ, β − 1 ≤ −δ und δ ≤ β−α 2 ist für alle x ∈ [α − δ; α + δ] β − 1 ≤ −δ ≤ α − 2δ ≤ x − δ ≤ α ≤ x + δ ≤ α + 2δ ≤ β. Damit folgt für alle x ∈ [α − δ; α + δ] Zδ 1 f1 (x) = · 2δ 1 · f0 (x + t) dt = 2δ −δ x+δ x+δ Z Z 1 x+δ−α · . f0 (u) du = 1 du = 2δ 2δ α x−δ (v) Die Linearität von f1 in [β − δ; β + δ] Wegen β + δ ≤ 1, δ ≤ α und δ ≤ β−α 2 ist für alle x ∈ [β − δ; β + δ] α ≤ β − 2δ ≤ x − δ ≤ β ≤ x + δ ≤ β + 2δ ≤ 1 + δ ≤ 1 + α. Für alle x ∈ [β − δ; β + δ] folgt 1 f1 (x) = · 2δ Zδ 1 f0 (x + t) dt = · 2δ −δ x+δ Z Zβ 1 β − (x − δ) f0 (u) du = · 1 du = . 2δ 2δ x−δ x−δ (vi) Werte von f1 Für alle x ∈ R ist also 0, x−α+δ , 2δ 1, f1 (x) = −x + β + δ , 2δ 0, f (x − h) , 1 falls 0 ≤ x < α − δ ist; falls α − δ ≤ x < α + δ ist; falls α + δ ≤ x < β − δ ist; falls β − δ ≤ x < β + δ ist; falls β + δ ≤ x < 1 ist; falls es ein h ∈ Z \ {0} mit h ≤ x < h + 1 gibt. Nun ist der Weg für den Induktionsanfang bereitet. Die Periodizität von f0 ist genau wie die Beschränktheit klar. Die Stetigkeit von f1 innerhalb der fünf Sektoren ist ebenfalls klar, weil die konstanten und die linearen Funktionen stetig sind. Zu Überprüfen bleibt die Stetigkeit von f1 in den Randpunkten der Sektoren. (vii) Induktionsanfang — Periodizität und Beschränktheit von f0 Es ist f0 (x + 1) = f0 (x) für alle x ∈ R (ersetze h in der Definition von f0 durch h + 1). Wegen { f0 (x) ∈ R| x ∈ R} = {0; 1} gilt 0 ≤ f0 (x) ≤ 1 für alle x ∈ R. 1α,β,ε,r A: Die charakteristische Funktion Seite 103 (viii) Induktionsanfang — Stetigkeit von f1 f1 ist auf (−1 + β + δ; α − δ) stetig, da f1 dort konstant ist. f1 ist auf (α − δ; α + δ) stetig, da f1 dort affin linear ist. f1 ist auf (α + δ; β − δ) stetig, da f1 dort konstant ist. f1 ist auf (β − δ; β + δ) stetig, da f1 dort affin linear ist. Es sind lim x→(α−δ)+ lim − f1 (x) = f1 (x) = x→(α+δ) · ( x − α + δ) = 0 = 1 2δ · ( x − α + δ) = 1 = lim 1 2δ · (−x + β + δ) = 1 = lim 1 2δ · (−x + β + δ) = 0 = lim − x→(α+δ) lim f1 (x) = lim f1 (x) = x→(β−δ)+ 1 2δ lim x→(α−δ)+ x→(β−δ)+ lim 0= lim 1= lim 1= lim 0= x→(α−δ)− x→(α+δ)+ x→(β−δ)− lim f1 (x), lim f1 (x), lim f1 (x), lim f1 (x). x→(α−δ)− x→(α+δ)+ x→(β−δ)− und x→(β+δ)− x→(β+δ)− x→(β+δ)+ x→(β+δ)+ Außerdem gilt f1 (α − δ) = 0, f1 (α + δ) = 1, f1 (β − δ) = 1 f1 (β + δ) = 0. und Wegen der 1–Periodizität von f1 (siehe (i)) ist f1 also stetig auf ganz R. (ix) Induktionsvoraussetzung Es gibt ein k ∈ N0 , so dass 1. fk+1 auf R stetig ist, 2. fk (x) = fk (x + 1) für alle x ∈ R und 3. 0 ≤ fk (x) ≤ 1 für alle x ∈ R gelten. Periodizität und Beschränktheit von fk+1 ergeben sich direkt aus den entsprechenden Aussagen über fk . (x) Induktionsschluss — Periodizität und Beschränktheit Es gilt fk (x + 1 + t) = fk (x + t) für alle x ∈ R und alle t ∈ R. Damit folgt für alle x ∈ R 1 fk+1 (x + 1) = · 2δ Zδ 1 fk (x + 1 + t) dt = · 2δ −δ Zδ fk (x + t) dt = fk+1 (x) . −δ Es gilt 0 ≤ fk (x + t) ≤ 1 für alle x ∈ R und alle t ∈ R. Also ist für alle x ∈ R 1 0= · 2δ Zδ −δ 1 0 dt ≤ · 2δ Zδ −δ 1 fk (x + t) dt = fk+1 (x) ≤ · 2δ Zδ 1 dt = 1. −δ Seite 104 Anhang Die Stetigkeitsaussage des Induktionsschlusses ergibt sich unter Verwendung der Induktionsvoraussetzung direkt aus dem kleinen Satz von Fubini A.1. (xi) Induktionsschluss — Stetigkeit R2 → R Wegen der Stetigkeit von fk+1 und der Stetigkeit von + : ist die Funk(x, t)T 7→ x + t [y; z] × [−δ; δ] → R tion auf [y; z] × [−δ; δ] stetig für alle y ∈ R und alle z ∈ R (x, t)T 7→ fk+1 (x + t) mit z ≥ y. Nach dem kleinen Satz von Fubini A.1 auf Seite 99 ist fk+2 stetig auf [y; z] für alle y ∈ R und alle z ∈ R mit z ≥ y. X Im Prinzip sind noch die Symmetrie zur α+β 2 –Geraden und die steigenh aller Glättungen i α+β−1 α+β de Monotonie aller Glättungen auf ; 2 beweisbar. (Die fallende Monotonie aller 2 h i α+β+1 Glättungen auf α+β folgt dann automatisch.) 2 ; 2 Diese Eigenschaften von 1α,β,ε,r werden aber in dieser Arbeit nicht benötigt. Um die Integralabschätzungen in den Eigenschaften von 1α,β,ε,r von einem Glättungsschritt auf den nächsten übertragen zu können, ist es hilfreich, neben dem kleinen Satz von Fubini A.1 auch noch den Vorteil zu nutzen, dass bei Integration einer periodischen Funktion über die gesamte Periodenlänge der Startpunkt der Integration irrelevant ist. Dieser Sachverhalt ist im nächsten Lemma festgehalten. Lemma A.3 (Integration periodischer Funktionen über eine Periode) Voraussetzungen: R → R + mit Seien p ∈ R und f : t 7→ f (t) f (t + hp) = f (t) für alle t ∈ R und alle h ∈ Z y+p Z derart, dass f (t) dt für ein y ∈ R existiert. y Behauptung: Dann gilt für alle x ∈ R x+p Z Zp Zp f (t) dt = f (t) dt = f (t + x) dt. x 0 0 Im Beweis wird das vordere Integral an einem Vielfachen von p in zwei Teile aufgespalten. Auf die beiden erhaltenen Integrale werden jeweils Substitutionsregel und Periodizität angewandt, so dass am Schluss beide Teile wieder zusammengesetzt werden können. A: Die charakteristische Funktion 1α,β,ε,r Seite 105 Beweis: (i) Beweis der äußeren Gleichung Wegen der Substitutionsregel ist x+p Z u=t−x f (t) dt = x+p−x Z x x−x Zp f (t + x) dt. f (u + x) du = 0 (ii) Beweis der vorderen Gleichung Wegen der Substitutionsregel und f (t + hp) = f (t) für alle t ∈ R und alle h ∈ Z ist j k x p+p p x+p Z x+p Z Z f (t) dt = x f (t) dt + j k x p f (t) dt x p+p x+p− j k u=t− x p−p p j k x p =j k v=t− x p j k p j k j k x p+p− x p p p p−p Z x f u+ p + p du + p j k p+p− x p−p p j k p x− x p j k p x− x p x p Zp Z f (t) dt + = 0 x f v+ p dv p Z Zp f (t) dt = f (t) dt. X 0 j k x− x p p Damit sind alle Werkzeuge für den Beweis der Existenz von 1α,β,ε,r bereitgelegt. Lemma A.4 (Existenz der Funktion 1α,β,ε,r ) Voraussetzungen: Seien r ∈ N, α ∈ R, β ∈ R und ε ∈ R+ mit 0 < α < β < 1 und ε ≤ min {2α; 2 − 2β; β − α}. Behauptung: Es gibt eine stetige Funktion f : R → R x 7→ f (x) mit (i) f (x + 1) = f (x) für alle x ∈ R, (ii) f (x) = 1 für alle x ∈ R mit α + ε 2 ≤ x ≤ β − 2ε , (iii) f (x) = 0 für alle x ∈ R mit 0 ≤ x < α − ε 2 oder β + ε 2 < x < 1, Z1 f (t) dt = β − α und (iv) 0 1 Z rr 1 (v) f (t) · e (ht) dt ≤ r+1 r · r+1 für alle h ∈ Z \ {0}. π ε |h| 0 Dissertation von Simon Feiler zum Thema Die relative Verteilung der Inversen einer natürlichen Zahl zu variablen Moduln Seite 106 Anhang 1α,β,ε,r ist die r–te Glättung der in Lemma A.2 auf Seite 100 definierten Funktion. ε Als δ wird dabei der Wert 2r gewählt, da (wie bereits im Beweis von Lemma A.2 angedeutet) die Intervalle, auf denen die Glättungen konstant 1 bzw. 0 sind, in jedem Glättungsschritt links und rechts um jeweils δ gekürzt werden. Dieser Sachverhalt wird im Beweis ausführlich dargestellt. Die Abschätzung für die Fourier–Koeffizienten ist quasi trivial. Im Beweis des Lemmas werden die Fourier–Koeffizienten aller fk mit k ∈ N0 exakt berechnet. Beweis: f wird als die r–te Glättung der in Lemma A.2 definiterten Funktion gewählt. Aus Lemma A.2 folgen dann bereits Stetigkeit und 1–Periodizität von f und aller Glättungen auf dem Weg zu f . (i) Definition der Funktion f R → R ( 1, falls es ein h ∈ Z mit α ≤ x − h ≤ β gibt , Seien f0 : x 7→ f0 (x) := 0, falls es ein h ∈ Z mit β − 1 < x − h < α gibt R → R Zδ ε 1 δ := , fk : für alle k ∈ Nr und f := fr . · fk−1 (x + t) dt x 7→ fk (x) := 2r 2δ −δ Nach Lemma A.2 auf Seite 100 ist fk für alle k ∈ Nr stetig auf f0 (x + 1) = f0 (x) und R mit fk (x + 1) = fk (x) für alle x ∈ R. Der Induktionsanfang gründet sich lediglich auf die Definition von f0 . Benötigt werden die Konstanz von f0 auf entsprechenden Intervallen und die exakte Berechnung der Fourier–Koeffizienten von f0 . (ii) Induktionsanfang 1. Die Werte von f0 auf [α + 0 · δ; β − 0 · δ]: Es ist f0 (x) = 1 für alle x ∈ R mit α + 0 · δ ≤ x ≤ β − 0 · δ (setze h = 0). 2. Die Werte von f0 auf [0; α − 0 · δ) ∪ (β + 0 · δ; 1): Es ist f0 (x) = 0 für alle x ∈ R mit 0 ≤ x < α − 0 · δ (setze h = 0). Es ist f0 (x) = 0 für alle x ∈ R mit β + 0 · δ < x < 1 (setze h = 1 und beachte α > 0). 3. Integralwert von f0 über eine Periode: f0 (t) dt = Es ist 0 Zβ Zα Z1 0 dt + 0 Z1 0 dt = β − α. 1 dt + α β A: Die charakteristische Funktion 1α,β,ε,r Seite 107 4. Berechnung der Fourier–Koeffizienten von f0 : Für alle h ∈ Z \ {0} ist Z1 0 Zβ t=β 1 1 2πi·ht = ·e · (e (βh) − e (αh)) f0 (t) · e (ht) dt = e dt = 2πi · h 2πi · h t=α α e (βh) − e (αh) e (δh) − e (−δh) 0 = · . 2πi · h 2πi · 2δh 2πi·ht (iii) Induktionsvoraussetzung Es gibt ein k ∈ Nr mit 1. fk−1 (x) = 1 für alle x ∈ [α + (k − 1) · δ; β − (k − 1) · δ], 2. fk−1 (x) = 0 für alle x ∈ [0; α − (k − 1) · δ) ∪ (β + (k − 1) · δ; 1), Z1 fk−1 (t) dt = β − α und 3. 0 Z1 4. e (βh) − e (αh) · fk−1 (t) · e (ht) dt = 2πi · h e (δh) − e (−δh) 2πi · 2δh k−1 für alle h ∈ Z \ {0}. 0 In jedem Glättungsschritt werden die Bereiche, auf denen fk konstant 0 oder 1 wird, je um 2δ verkleinert. Der Integralwert über eine Periode bleibt bestehen und bei der exakten Berechnung der Fourier–Koeffizienten erhöht sich lediglich der Exponent des zweiten Faktors um 1. (iv) Induktionsschluss 1. Funktionswerte von fk auf [α + kδ; β − kδ]: Sei x1 ∈ [α + kδ; β − kδ]. Für alle t ∈ R mit −δ ≤ t ≤ δ ist α + (k − 1) · δ ≤ x1 + t ≤ β − (k − 1) · δ. Nach (iii) 1. ist also fk−1 (x1 + t) = 1 für alle t ∈ R mit −δ ≤ t ≤ δ. Damit folgt 1 fk (x1 ) = · 2δ Zδ 1 fk−1 (x1 + t) dt = · 2δ −δ Zδ 1 dt = 1 δ − (−δ) · [t]t=δ = 1. t=−δ = 2δ 2δ −δ 2. Funktionswerte von fk auf [0; α − kδ): Sei x2 ∈ [0; α − kδ). Für alle t ∈ R mit 0 ≤ t < δ ist 0 ≤ x2 + t < α − (k − 1) · δ. Seite 108 Wegen δ = Anhang ε 2r , k ≤ r und ε 2 ≤ 1 − β ist β + (k − 1) · δ − 1 = −1 + β − δ + kε 2r ≤ ε 2 − (1 − β) − δ ≤ −δ. Für alle t ∈ R mit −δ < t ≤ 0 ist also β + (k − 1) · δ − 1 < x2 + t < α − (k − 1) · δ. Nach (iii) 2. und (i) ist fk−1 (x2 + t) = 0 für alle t ∈ R mit −δ < t < δ. Damit folgt 1 fk (x2 ) = · 2δ Zδ Zδ 1 · fk−1 (x2 + t) dt = 2δ −δ 0 dt = 0. −δ 3. Funktionswerte von fk auf (β + kδ; 1): Sei x3 ∈ (β + kδ; 1). Für alle t ∈ R mit −δ < t ≤ 0 ist β + (k − 1) · δ < x3 + t < 1. Wegen δ = ε 2r , k ≤ r und ε 2 ≤ α ist 1 + α − (k − 1) · δ = 1 + δ + α − kε 2r ≥1+δ+α− ε 2 ≥ 1 + δ. Für alle t ∈ R mit 0 ≤ t < δ ist also β + (k − 1) · δ < x3 + t < 1 + α − (k − 1) · δ. Nach (iii) 2. und (i) ist fk−1 (x3 + t) = 0 für alle t ∈ R mit −δ < t < δ. Damit folgt 1 · fk (x3 ) = 2δ Zδ 1 · fk−1 (x3 + t) dt = 2δ −δ Zδ 0 dt = 0. −δ Bei der Berechnung der Fourier–Koeffizienten lässt sich die Induktionsvoraussetzung am einfachsten anwenden, wenn vorher die Integrationsreihenfolge vertauscht wird. Dafür müssen zunächst die Voraussetzungen des kleinen Satzes von Fubini verifiziert werden. 4. Anwendbarkeit des kleinen Satzes von Fubini A.1: R → C Wegen der Stetigkeit von fk−1 , der Stetigkeit von und der t 7→ e (ht) R2 → R [0; 1] × [−δ; δ] → R Stetigkeit von + : sind und (t, s)T 7→ t + s (t, s)T 7→ fk−1 (t + s) [0; 1] × [−δ; δ] → C für alle h ∈ Z auf [0; 1] × [−δ; δ] stetig. (t, s)T 7→ fk−1 (t + s) · e (ht) A: Die charakteristische Funktion 1α,β,ε,r Seite 109 5. Integralwert von fk über eine Periode: Nach 4., dem kleinen Satz von Fubini A.1 auf Seite 99, (i), Lemma A.3 auf Seite 104 und (iii) 3. ist Z1 Z1 Zδ Zδ Z1 1 1 fk (t) dt = · fk−1 (t + s) ds dt = · fk−1 (t + s) dt ds 2δ 2δ 0 −δ 0 = Zδ 1 · 2δ −δ −δ 1 Z fk−1 (t) dt ds = 1 · 2δ 0 Zδ (β − α) ds −δ 0 = (β − α) · 1 · 2δ Zδ = β − α. 1 ds −δ 6. Berechnung der Fourier–Koeffizienten von fk : Nach 4., dem kleinen Satz von Fubini A.1 auf Seite 99, (i), der 1–Periodizität von e, Lemma A.3 auf Seite 104 und (iii) 4. ist für alle h ∈ Z \ {0} Z1 fk (t) · e (ht) dt 0 Z1 = 1 · 2δ 1 · 2δ Zδ −δ fk−1 (t + s) ds · e (ht) dt −δ 0 = Zδ Z1 = 1 Z fk−1 (t + s) · e (h · (t + s)) dt · e (−hs) ds 0 1 fk−1 (t) · e (ht) dt · · 2δ Zδ e2πi·(−h)·s ds −δ 0 e (βh) − e (αh) = · 2πi · h e (δh) − e (−δh) 2πi · 2δh k−1 e (βh) − e (αh) · 2πi · h e (δh) − e (−δh) 2πi · 2δh k = s=δ 1 1 2πi·(−hs) · · ·e 2δ 2πi · (−h) s=−δ . (v) Beweis der Behauptungen für f 1. Nach (i) ist f (x + 1) = fr (x + 1) = fr (x) = f (x) für alle x ∈ R. 2. Nach (iv) 1. ist f (x) = fr (x) = 1 für alle x ∈ R mit α + rδ ≤ x ≤ β − rδ. Mit rδ = ε 2 folgt f (x) = 1 für alle x ∈ R mit α + ε 2 ≤ x ≤ β − 2ε . 3. Nach (iv) 2. und (iv) 3. ist f (x) = fr (x) = 0 für alle x ∈ β + rδ < x < 1. Mit rδ = ε 2 folgt f (x) = 0 für alle x ∈ R mit 0 ≤ x < α − ε 2 R mit 0 ≤ x < α − rδ oder oder β + ε 2 < x < 1. Seite 110 Anhang Z1 Z1 fr (t) dt = β − α. f (t) dt = 4. Nach (iv) 5. ist 0 0 5. Für alle h ∈ Z \ {0} ist nach (iv) 6. und wegen δ = ε 2r 1 1 Z Z r e (βh) − e (αh) e (δh) − e (−δh) f (t) · e (ht) dt = fr (t) · e (ht) dt = · 2πi · h 2πi · 2δh 0 0 !r |e (βh) − e (αh)| |e (δh) − e (−δh)| = · 2π · |h| 2π · 2εh 2r r 2 rr 1 2r ≤ = r+1 r · r+1 . X · 2π |h| 2πε |h| π ε |h| Anhang B: Nullstellen Dirichlet’scher L–Funktionen a: Übergang von N0 zu N in der expliziten Formel In der Literatur findet sich die folgende explizite Formel. Hilfssatz B.1 (Explizite Formel für ψ ( · , χ) mit reinimaginären Nullstellen) Voraussetzungen: Seien q ∈ N, χ ∈ Xq , x ∈ R und T ∈ R mit 1 ≤ T ≤ x. Behauptung: Es gibt eine von allen Parametern unabhängige Konstante C ∈ R+ mit X %−1 x ψ (x, χ) − ∆χ x − ≤ C · x · ln2 (qx) . %∈N0 (χ) % T |Im(%)|≤T Referenz: Siehe [IK, Proposition 5.25 auf Seite 120]25 . X Dabei sind allerdings Nullstellen, die auf der imaginären Achse liegen, ebenfalls Teil der Summationsbedingung. In Teilabschnitt a von Anhang B sollen diese Nullstellen aus der Summationsbedingung verschwinden. Nach dem Satz von Hadamard und de la Vallée–Poussin haben L–Funktionen keine Nullstellen auf der Achse mit Realteil 1. 25 „Colloquium Publications Volume 53 — Analytic Number Theory“, H. Iwaniec und E. Kowalski, American Mathematical Society (Providence, Rhode Island — 2004), Proposition 5.25 auf Seite 120 B: Nullstellen Dirichlet’scher L–Funktionen Seite 111 Hilfssatz B.2 (Satz von Hadamard und de la Vallée Poussin) Voraussetzungen: ( R \ {0} , falls χ ∈ X0 ist; Seien χ ∈ X und A := R, falls χ ∈ / X0 ist. Behauptung: Dann ist L (1 + it, χ) 6= 0 für alle t ∈ A. Referenz: Siehe [La, § 115. auf Seite 459 und § 45. auf Seite 166]26 . X Mit dem Satz von Hadamard und de la Vallée Poussin sollen auch Nullstellen auf der imaginären Achse so weit als möglich ausgeschlossen werden. Die Funktionalgleichungen für Dirichlet’sche L–Funktionen führen die Werte einer L–Funktion links der 21 –Geraden auf Werte der L–Funktion rechts der 21 –Geraden zurück und sind deshalb für dieses Vorhaben prädestiniert. Der Nachteil an den Funktionalgleichungen ist allerdings, dass sie nur für L–Funktionen zu primitiven Dirichlet–Charakteren und Dirichlet–Haupcharakteren gelten. Hilfssatz B.3 (Funktionalgleichungen für L–Funktionen) Behauptung: Für alle s ∈ C \ {1} gilt 1−s s π − 2 · Γ 2s · L (s, χ0,1 ) = π − 2 · Γ 1−s 2 · L (1 − s, χ0,1 ) . Für alle q ∈ N, alle χ ∈ Xq,primitiv mit χ (−1) = 1 und alle s ∈ C gilt q s π 1−s · Γ 2s · L (s, χ) = τ1 (χ) · Γ 1−s · L (1 − s, χ̄) . 2 Für alle q ∈ N, alle χ ∈ Xq,primitiv mit χ (−1) = −1 und alle s ∈ C gilt 1 iq s π 2 −s · Γ s+1 · L (s, χ) = τ1 (χ) · Γ 2−s · L (1 − s, χ̄) . 2 2 Referenz: Siehe [Br, Sätze 2.2.1 auf Seite 59, 2.4.1 auf Seite 73 und 2.4.2 auf Seite 74 der 1. Auflage]27 . X Um mit den Funktionalgleichungen auf Nullstellen schließen zu können, muss ausgeschlossen werden, dass Γ eine Nullstelle in dem betrachteten Bereich aufweist. Bemerkung B.4 Es ist Γ (−z) 6= 0 für alle z ∈ C \ N0 . Referenz: Siehe [Br, Satz 2.1.1. auf Seite 53 der 1. Auflage]28 . 26 X „Handbuch der Lehre von der Verteilung der Primzahlen.“, E. Landau, B.G. Teubner GmbH (Leipzig — 1909), § 115. auf Seite 459 und § 45. auf Seite 166 27 „Einführung in die analytische Zahlentheorie“, J. Brüdern, Springer (Berlin, Heidelberg — 1995), Sätze 2.2.1 auf Seite 59, 2.4.1 auf Seite 73 und 2.4.2 auf Seite 74 der 1. Auflage 28 „Einführung in die analytische Zahlentheorie“, J. Brüdern, Springer (Berlin, Heidelberg — 1995), Satz 2.1.1. auf Seite 53 der 1. Auflage Seite 112 Anhang Nun kann für primitive Charaktere und Hauptcharaktere geschlossen werden, dass die zugehörige L–Funktion keine reinimaginären Nullstellen besitzt. Korollar B.5 (Primitive Charaktere haben keine reinimaginären Nullstellen) Behauptung: Für alle χ ∈ Xprimitiv ∪ {χ0,1 } und alle t ∈ R \ {0} ist L (it, χ) 6= 0. Beweis: (i) χ0,1 Annahme: Es gibt ein t0 ∈ R \ {0} mit L (it0 , χ0,1 ) = 0. Nach Hilfssatz B.3 auf der vorherigen Seite gilt 0 = π− it0 2 ·Γ it0 2 · L (it0 , χ0,1 ) = π − 1−it0 2 ·Γ 1−it0 2 · L (1 − it0 , χ0,1 ) . 0 Nach Bemerkung B.4 auf der vorherigen Seite ist Γ 1−it 6= 0. 2 Also ist L (1 − it0 , χ0,1 ) = 0 mit Widerspruch zum Satz von Hadamard und de la Vallée–Poussin B.2 auf der vorherigen Seite. (ii) Primitive Charaktere Annahme: Es gibt ein χ ∈ Xprimititv und ein t ∈ R \ {0} mit L (it, χ) = 0. 1 − χ (−1) Sei κ := . Nach Hilfssatz B.3 auf der vorherigen Seite gilt 2 1 0 = iκ q it π 1+κ −it · Γ it+κ · L (it, χ) = τ1 (χ) · Γ 1−it+κ · L (1 − it, χ̄) . 2 2 Nach Lemma 3.9 auf Seite 27 ist τ1 (χ) 6= 0 und nach Bemerkung B.4 auf der vorherigen 1−it+κ 6= 0. Seite ist Γ 2 Also ist L (1 − it, χ̄) = 0 mit Widerspruch zum Satz von Hadamard und de la Vallée– Poussin B.2 auf der vorherigen Seite. X Damit ist N0 (χ) = N (χ) für alle χ ∈ Xprimitiv gezeigt. Für nicht–primitive Charaktere gilt die Funktionalgleichung nicht. Allerdings stimmt die zu einem Charakter gehörende L–Funktion bis auf ein endliches Produkt mit der L–Funktion des induzierenden primitiven Charakters überein. Lemma B.6 (Quotient zweier verwandter L–Funktionen) Voraussetzungen: Seien q ∈ N, χ ∈ Xq \ X0 , q1 ∈ N die Führungszahl von χ und χ1 ∈ Xq1 mit χ (`) = χ1 (`) für alle ` ∈ Z mit ggT (q, `) = 1. Behauptung: Dann gilt L (s, χ) = L (s, χ1 ) · Y P p∈ p teilt q p teilt q1 nicht χ1 (p) 1− für alle s ∈ C. ps Y 1 Ferner ist L (s, χ0,q ) = L (s, χ0,1 ) · 1 − s für alle s ∈ C \ {1}. p P p∈ p teilt q B: Nullstellen Dirichlet’scher L–Funktionen Seite 113 Referenz: Siehe [Pr, Satz 6.3 in Kapitel IV. auf Seite 127 der 1. Auflage]29 . X Damit lassen sich alle Nullstellen einer L–Funktion zu einem nicht–primitiven Charakter finden, die nicht gleichzeitig Nullstellen zur L–Funktion des induzierenden Charakters sind. Es stellt sich heraus, dass diese reinimaginär sind. Korollar B.7 (Nullstellen von L–Funktionen zu nicht–primitiven Charakteren) Voraussetzungen: Seien q ∈ N, χ ∈ Xq \ X0 , q1 ∈ N die Führungszahl von χ und χ1 ∈ Xq1 ,primitiv mit χ (`) = χ1 (`) für alle ` ∈ Z mit ggT (q, `) = 1. bp P → Nq1 Sei b : derart, dass χ1 (p) = e für alle p ∈ P mit ggT (q1 , p) = 1 gilt. p 7→ bp q1 Behauptung: Für alle % ∈ C mit L (%, χ) = 0 und L (%, χ1 ) 6= 0 gibt es ein p ∈ P mit ggT (q, p) > ggT (q1 , p) = 1 und ein k ∈ Z mit %=i· 2π · (bp + kq1 ) . ln (p) · q1 Für alle % ∈ C \ {1} mit L (%, χ0,q ) = 0 und L (%, χ0,1 ) 6= 0 gibt es ein p ∈ P, das q teilt, und ein k ∈ Z mit %=i· 2πk . ln (p) Insbesondere sind N (χ) = N (χ1 ) und N (χ0,q ) = N (χ0,1 ). Beweis: (i) Nichthauptcharaktere Nach Korollar B.6 auf der vorherigen Seite ist Y χ1 (p) 1 − = 0 . { % ∈ C| L (%, χ) = 0} = { % ∈ C| L (%, χ1 ) = 0} ∪ % ∈ C % p∈P p p teilt q p teilt q nicht 1 Sei nun % ∈ C mit Y P p∈ p teilt q p teilt q1 nicht 29 1− χ1 (p) p% = 0. „Grundlagen der mathematischen Wissenschaften 91 — Primzahlverteilung“, K. Prachar, Springer (Berlin, Göttingen, Heidelberg — 1957) Satz 6.3 in Kapitel IV. auf Seite 127 der 1. Auflage Seite 114 Anhang Sei p ∈ P mit ggT (q, p) > ggT (q1 , p) = 1 und 1− χ1 (p) = 0. p% b 2πi· qp Damit folgt p% = χ1 (p) und wegen p% = eln(p)·% und χ1 (p) = e %=i· 1 gibt es ein k ∈ Z mit 2πbp 2πk +i· . ln (p) · q1 ln (p) (ii) Hauptcharakter Nach Korollar B.6 auf Seite 112 ist { %0 ∈ C \ {1}| L (%0 , χ0,q ) = 0} Y 1 = { %0 ∈ C \ {1}| L (%0 , χ0,1 ) = 0} ∪ %0 ∈ C \ {1} 1 − %0 = 0 . r r∈P r teilt q Sei nun %0 ∈ C \ {1} mit Y 1 1 − %0 = 0. r P r∈ r teilt q Sei r ∈ P ein Teiler von q mit 1− 1 = 0. r %0 Damit folgt r%0 = 1 und wegen r%0 = eln(r)·%0 und 1 = e0 gibt es ein ` ∈ Z mit %0 = i · 2π` . ln (r) X Für einen Charakter χ und seinen induzierenden Charakter χ1 gilt also N (χ) = N (χ1 ) = N0 (χ1 ) . Damit kann eine explizite Formel der Form B.1 mit N statt N0 gewonnen werden, wenn man von ψ ( · , χ) zu ψ ( · , χ1 ) übergeht. Im dabei auftretenden Fehler spielt die Anzahl der Primfaktoren des Moduls von χ eine entscheidende Rolle. Daher soll diese zunächst abgeschätzt werden. Bemerkung B.8 Es ist # { p ∈ P| p teilt n} ≤ Beweis: Sei ω : ln (n) für alle n ∈ N. ln (2) N → N0 n 7→ ω (n) := # { p ∈ P| p teilt n} (i) Induktionsanfang 0 ln (1) Es ist ω (1) = 0 ≤ = . ln (2) ln (2) . B: Nullstellen Dirichlet’scher L–Funktionen Seite 115 (ii) Induktionsvoraussetzung ln (k) Es gibt ein n ∈ N mit ω (k) ≤ für alle k ∈ Nn . ln (2) (iii) Induktionsschluss Gibt es ein j ∈ N und ein p ∈ P mit n + 1 = pj , so ist ω (n + 1) = 1 ≤ ln (n + 1) ln (2) wegen n + 1 ≥ 2. Gibt es ein ` ∈ N \ {1} und ein m ∈ N \ {1} mit n + 1 = ` · m und ggT (`, m) = 1, so folgt ω (n + 1) = ω (` · m) = ω (`) + ω (m) ≤ ln (`) ln (m) ln (` · m) ln (n + 1) + = = . ln (2) ln (2) ln (2) ln (2) X Damit lässt sich jetzt Hilfssatz 3.4 auf Seite 25 beweisen. Korollar B.9 (Explizite Formel für ψ ( · , χ)) Voraussetzungen: Seien q ∈ N, χ ∈ Xq , x ∈ R und T ∈ R mit 1 ≤ T ≤ x. Behauptung: Es gibt eine von allen Parametern unabhängige Konstante C ∈ R+ mit X % x − 1 x ψ (x, χ) − ∆χ x − ≤ C · · ln2 (qx) . %∈N (χ) % T |Im(%)|≤T Beweis: (i) χ ∈ Xprimitiv ∪ {χ0,1 } Ist χ ∈ Xprimitiv ∪ {χ0,1 } so folgt die Behauptung wegen der Nullstellenfreiheit von L ( · , χ) auf { σ + it ∈ C| σ ∈ {0; 1} und t ∈ R \ {iσ}} (siehe Satz von Hadamard und de la Vallée– Poussin B.2 auf Seite 111 und Korollar B.5 auf Seite 112) direkt aus Satz B.1 auf Seite 110. (ii) χ ∈ / Xprimitiv ∪ {χ0,1 } Sei also nun χ ∈ / Xprimitiv ∪ {χ0,1 } vorausgesetzt. Sei q1 ∈ N die Führungszahl von χ, falls χ 6= χ0,q ist, und q1 := 1, falls χ = χ0,1 ist. Sei χ1 ∈ Xq1 ,primitiv mit χ1 (`) = χ (`) für alle ` ∈ Z mit ggT (q, `) = 1. Nach dem Satz von Hadamard und de la Vallée–Poussin B.2, Korollar B.5 und Korollar B.7 auf Seite 113 ist N0 (χ1 ) = N (χ1 ) = N (χ) . Dissertation von Simon Feiler zum Thema Die relative Verteilung der Inversen einer natürlichen Zahl zu variablen Moduln Seite 116 Anhang Wegen Bemerkung B.8 auf Seite 114, ∆χ = ∆χ1 und q1 ≤ q (siehe Bemerkung 3.8 auf Seite 27) folgt aus Satz B.1 auf Seite 110 die Existenz eines von allen Parametern unabhängigen C ∈ R+ mit X % x − 1 ψ (x, χ) − ∆χ x − %∈N (χ) % |Im(%)|≤T X X bxc bxc % X X bxc x − 1 = χ1 (n) Λ (n) − χ1 (n) Λ (n) + χ (n) Λ (n) − ∆χ x − %∈N (χ1 ) % n=1 |Im(%)|≤T n=1 n=1 X x% − 1 ≤ ψ (x, χ1 ) − ∆χ1 x − %∈N0 (χ1 ) % |Im(%)|≤T = χ(n) bxc bxc bxc z }| { X X X + − χ1 (n) Λ (n) + χ (n) Λ (n) − χ1 (n) Λ (n) n=1 n=1 n=1 ggT(q,n)=1 ggT(q,n)=1 ggT(q,n)>1 ≤C· =C· x · ln2 (q1 x) + T bxc X Λ (n) n=1 ggT(q,n)>1 j X x · ln2 (q1 x) + T P p∈ p teilt q ln(x) ln(p) X k ln (p) k=1 X x ln (x) 2 = C · · ln (q1 x) + −1+1 ln (p) · T ln (p) P p∈ p teilt q x · ln2 (qx) + ln (x) · # { p ∈ P| p teilt q} T x ln (q) ≤ C · · ln2 (qx) + ln (x) · . T ln (2) ≤C· X B: Nullstellen Dirichlet’scher L–Funktionen Seite 117 b: Die vertikale Verteilung der Nullstellen Dirichlet’scher L–Funktionen Da in der Literatur die Anzahl der Nullstellen einer L–Funktion in einem Streifen der Höhe 1, die in Lemma 4.3 zu finden ist, im Allgemeinen nicht angegeben wird, sondern lediglich die Anzahl der Nullstellen in einem Rechteck der Höhe 2T mit T ∈ R+ , T0 ∈ R+ und T ≥ T0 auftaucht, soll hier kurz angegeben werden, wie man von dem Rechteck auf den Streifen kommt. Für primitive Charaktere findet man die folgende Aussage. Hilfssatz B.10 (Die vertikale Verteilung bei primitiven Dirichlet–Charakteren) Behauptung: Es gibt eine von allen Parametern unabhängige Konstante C ∈ R+ , so dass für alle q ∈ N, alle χ ∈ Xq,primitiv und alle T ∈ R mit T ≥ 1 gilt: # { % ∈ N0 (χ)| |Im (%)| ≤ T } − T · ln qT ≤ C · ln (q (T + 3)) . π 2πe Referenz: Siehe [IK, Theorem 5.24 auf Seite 120 — nach Theorem 5.8 auf Seite 104 wurde im O–Term der Logarithmus vergessen]30 . X Für χ0,1 kann die Existenz von Ausnahmenullstellen ausgeschlossen werden. Außerdem gilt im Prinzip dieselbe Aussage, wie für primitive Charaktere. Hilfssatz B.11 (Die vertikale Verteilung bei χ0,1 ) Behauptung: Es gibt eine von allen Parametern unabhängige Konstante C ∈ R+ , so dass für alle T ∈ R mit T ≥ 1 gilt: T T # { % ∈ N0 (χ0,1 )| |Im (%)| ≤ T } − · ln ≤ C · ln (T + 1) . π 2πe Für alle x ∈ [0; 1) ist L (x, χ0,1 ) < 0. Referenz: Siehe [Ti, Theorem 9.4 auf Seite 181]31 und [Br, Satz 2.2.1 auf Seite 59 der 1. Auflage]32 . X Damit kann Lemma 4.3 auf Seite 31 bewiesen werden. 30 „Colloquium Publications Volume 53 — Analytic Number Theory“, H. Iwaniec und E. Kowalski, American Mathematical Society (Providence, Rhode Island — 2004), Theorem 5.24 auf Seite 120 31 „The theory of the Riemann zeta–function“, E. C. Titchmarsh, Oxford University Press (London — 1951), Theorem 9.4 auf Seite 181 32 „Einführung in die analytische Zahlentheorie“, J. Brüdern, Springer (Berlin, Heidelberg — 1995), Satz 2.2.1 auf Seite 59 der 1. Auflage Seite 118 Anhang Korollar B.12 (Die vertikale Verteilung der Nullstellen Dirichlet’scher L–Funktionen) Behauptung: Es gibt eine von allen Parametern unabhängige Konstante C ∈ R+ , so dass für alle q ∈ N, alle χ ∈ Xq und alle T ∈ R mit T ≥ 1 gilt # { % ∈ N (χ)| T < |Im (%)| ≤ T + 1} ≤ C · ln (q (T + 4)) und # { % ∈ N (χ)| |Im (%)| ≤ 1} ≤ C · ln (4q) . Zunächst werden mit der Dreiecksungleichung Terme hergestellt, auf die unter Verwendung von N (χ) = N0 (χ1 ) für den χ ∈ X induzierenden Charakter χ1 ∈ X einer der beiden vorangegangenen Hilfssätze angewandt werden kann. Der sich ergebende Restterm kann mit Hilfe des Mittelwertsatzes der Differentialrechnung abgeschätzt werden. Beweis: (i) Anwenden der Dreiecksungleichung Für alle q ∈ N, alle χ ∈ Xq und alle T ∈ R mit T ≥ 1 gilt # { % ∈ N (χ)| T < |Im (%)| ≤ T + 1} T +1 q (T + 1) = # { % ∈ N (χ)| |Im (%)| ≤ T + 1} − · ln π 2πe T qT − # { % ∈ N (χ)| |Im (%)| ≤ T } − · ln π 2πe T +1 q (T + 1) T qT + · ln − · ln π 2πe π 2πe q (T + 1) T +1 ≤ # { % ∈ N (χ)| |Im (%)| ≤ T + 1} − · ln π 2πe qT T + # { % ∈ N (χ)| |Im (%)| ≤ T } − · ln π 2πe T + 1 q (T + 1) T qT + · ln − · ln . π 2πe π 2πe (ii) Umformen des dritten Summanden aus (i) Für alle q ∈ N und alle T ∈ R mit T ≥ 1 gibt es nach dem Mittelwertsatz der Differentialrechnung ein S ∈ R mit T < S < T + 1 und T +1 q (T + 1) T qT · ln − · ln π 2πe π 2πe q T + 1 T T ln (T + 1) − ln (T ) ln (T + 1) = · + + ln · − π (T + 1) − T π 2πe π π T ln (T + 1) 1 q = + + · ln . πS π π 2πe Für alle T ∈ R mit T ≥ 1 und alle S ∈ R mit T < S < T + 1 ist T T < = 1. S T C: Summen Seite 119 (iii) N (χ) = N0 (χ1 ) Seien q ∈ N und χ ∈ Xq . Sei q1 ∈ N die Führungszahl von χ, falls χ 6= χ0,q ist, bzw. q1 := 1, falls χ = χ0,q ist. Sei χ1 ∈ Xq1 ,primitiv mit χ1 (`) = χ (`) für alle ` ∈ Z mit ggT (q, `) = 1. Nach dem Satz von Hadamard und de la Vallée–Poussin B.2 auf Seite 111, Korollar B.5 auf Seite 112 und Korollar B.7 auf Seite 113 gilt dann N0 (χ1 ) = N (χ1 ) = N (χ) . (iv) Anwenden von Hilfssatz B.10 und Hilfssatz B.11 auf die Summanden aus (i) Mit Hilfssatz B.10 und Hilfssatz B.11 auf Seite 117 folgt für alle T ∈ R mit T ≥ 1 wegen q1 ≤ q (siehe Bemerkung 3.8 auf Seite 27) # { % ∈ N (χ)| T < |Im (%)| ≤ T + 1} = # { % ∈ N0 (χ1 )| T < |Im (%)| ≤ T + 1} O (ln (q1 · (T + 4))) + O (ln (q1 · (T + 3))) q 1 1 · 1 + ln + O (ln (T + 1)) + O π 2πe = O (ln (q1 · (T + 4))) = = O (ln (q · (T + 4))) und # { % ∈ N (χ)| |Im (%)| ≤ 1} = # { % ∈ N0 (χ1 )| |Im (%)| ≤ 1} 1 q1 · 1 = · ln + O (ln (q1 · (1 + 3))) π 2πe = O (ln (4q1 )) = O (ln (4q)) . X Anhang C: Summen a: Kontinuisierung der Nullstellensumme In Teilabschnitt a von Anhang C wird gezeigt, wie die Nullstellensumme aus Lemma 3.5 auf Seite 25 über die Nullstellen mit Realteil größer als 21 kontinuisiert werden soll. Aus Abbildung 2 auf Seite 30 ist ersichtlich, dass die Nullstellensumme über Nullstellen mit Imaginärteil zwischen −1 und 1 nur in Realrichtung kontinuisiert wird. Die Restsumme wird in ein Doppel–Integral umgewandelt. Seite 120 Anhang Lemma C.1 Voraussetzungen: Seien χ ∈ X , τ ∈ R+ , T ∈ R mit T ≥ τ , σ ∈ R und S ∈ R mit 1 2 ≤ σ < S ≤ 1. Behauptung: Dann sind für alle x ∈ R mit x > 1 X %∈N (χ) τ <|Im(%)|≤T σ≤Re(%)<S xRe(%) + 1 |Im (%)| ZT ln (x) · = ZS τ ln (x) + · T ZS τ < |Im (%)| ≤ t und xu du dt · # % ∈ N (χ) u ≤ Re (%) < S t2 σ τ < |Im (%)| ≤ T und du x · # % ∈ N (χ) u ≤ Re (%) < S u σ ZT τ < |Im (%)| ≤ t und 1 · # % ∈ N (χ) dt σ ≤ Re (%) < S t2 τ σ τ < |Im (%)| ≤ T und x +1 + · # % ∈ N (χ) σ ≤ Re (%) < S T σ + (x + 1) · und X Re(%) x ZS = ln (x) · %∈N (χ) |Im(%)|≤T σ≤Re(%)<S xu · Nχ (u, T ) du + xσ · Nχ (σ, T ) − xS · Nχ (S, T ) . σ Ferner ist # {% ∈ N (χ) |τ < |Im (%)| ≤ T und σ ≤ Re (%) < S } = Nχ (σ, T ) + Nχ (S, τ ) − Nχ (σ, τ ) − Nχ (S, T ) . Beweis: (i) Aufteilen in vier Summen Sei x ∈ R mit x > 1. Für alle % ∈ N (χ) mit τ < |Im (%)| ≤ T ist ZT 1 1 = + |Im (%)| T 1 dt. t2 |Im(%)| Für alle % ∈ N (χ) mit Re (%) ≥ σ ist x Re(%) σ Re(%) Z ln (x) · xu du. =x + σ C: Summen Seite 121 Damit folgt X %∈N (χ) τ <|Im(%)|≤T σ≤Re(%)<S xRe(%) + 1 |Im (%)| X = %∈N (χ) τ <|Im(%)|≤T σ≤Re(%)<S ZT 1 + T 1 σ dt · x + 1 + t2 σ X = %∈N (χ) τ <|Im(%)|≤T σ≤Re(%)<S + ln (x) · xu du |Im(%)| xσ X %∈N (χ) τ <|Im(%)|≤T σ≤Re(%)<S +1 + T 1 · T Re(%) Z X 1 dt · t2 %∈N (χ) τ <|Im(%)|≤T σ≤Re(%)<S Re(%) Z ZT X ln (x) · x du + ln (x) · xu du σ |Im(%)| u ZT σ (x + 1) · %∈N (χ) τ <|Im(%)|≤T σ≤Re(%)<S σ Re(%) Z 1 dt. t2 |Im(%)| (ii) Vertauschen von Summe und einfachem t–Integral C → C ( 1, falls z ∈ D ist . Für alle D ⊆ C sei 1D : z 7→ 1D (z) := 0, falls z ∈ / D ist Im letzten Term von (i) soll die Summe mit dem Integral vertauscht werden. Dazu wird der ZT 1 konstante Vorfaktor (xσ + 1) vor die Summe gezogen. In der Summe verbleibt dt. t2 |Im(%)| Der Wert dieses Integrals wird nicht verändert, wenn der Integrand mit der Funktion 1[|Im(%)|;T ] multipliziert und das Integral von τ bis T erstreckt wird. Damit folgt X σ ZT (x + 1) · %∈N (χ) τ <|Im(%)|≤T σ≤Re(%)<S 1 dt = (xσ + 1) · t2 |Im(%)| σ X ZT τ ZT τ σ 1[|Im(%)|;T ] (t) t2 %∈N (χ) τ τ <|Im(%)|≤T σ≤Re(%)<S = (x + 1) · = (xσ + 1) · ZT ZT = (x + 1) · τ 1 · t2 X dt 1[|Im(%)|;T ] (t) dt %∈N (χ) τ <|Im(%)|≤T σ≤Re(%)<S X X 1 · %∈N (χ) 1 + %∈N (χ) 0 dt 2 t t<|Im(%)|≤T τ <|Im(%)|≤t σ≤Re(%)<S σ≤Re(%)<S τ < |Im (%)| ≤ t und 1 · # % ∈ N (χ) dt. σ ≤ Re (%) < S t2 Seite 122 Anhang Genauso läuft die Umformung des vorletzten Terms aus (i). (iii) Vertauschen von Summe und einfachem u–Integral Ferner gilt X Re(%) Z 1 · T 1 ln (x) · x du = · T %∈N (χ) τ <|Im(%)|≤T σ≤Re(%)<S σ ZS X u ln (x) · %∈N (χ) τ <|Im(%)|≤T σ≤Re(%)<S ln (x) = · T ZS = ln (x) · T σ ln (x) · = T ZS σ 1[σ;Re(%)] (u) du X xu · %∈N (χ) τ <|Im(%)|≤T σ≤Re(%)<S σ ZS xu · 1[σ;Re(%)] (u) du xu · X X %∈N (χ) 0 τ <|Im(%)|≤T σ≤Re(%)<u + %∈N (χ) 1 du τ <|Im(%)|≤T u≤Re(%)<S τ < |Im (%)| ≤ T und x · # % ∈ N (χ) du. u ≤ Re (%) < S u σ Im zweiten Term von (i) ergibt sich etwas mehr Aufwand, da in beiden Richtungen kontinuisiert wird. (iv) Vertauschen von Summe und Doppel–Integral Zuguterletzt ist X %∈N (χ) τ <|Im(%)|≤T σ≤Re(%)<S ZT 1 dt · t2 X ZT %∈N (χ) τ τ <|Im(%)|≤T σ≤Re(%)<S ZT = ln (x) · τ ln (x) · xu du σ |Im(%)| = ln (x) · Re(%) Z S Z u x · 1[σ;Re(%)] (u) · 1[|Im(%)|;T ] (t) du dt t2 σ X S Z xu dt · 1 (u) · 1 (t) du [σ;Re(%)] [|Im(%)|;T ] %∈N (χ) t2 τ <|Im(%)|≤T σ σ≤Re(%)<S X X T S Z Z u x %∈N (χ) 1[σ;Re(%)] (u) · 1 + %∈N (χ) 1[σ;Re(%)] (u) · 0 du dt = ln (x) · · t2 t<|Im(%)|≤T τ <|Im(%)|≤t τ σ σ≤Re(%)<S σ≤Re(%)<S C: Summen Seite 123 ZT = ln (x) · τ X X ZS u x t2 · %∈N (χ) 0 + %∈N (χ) 1 du dt τ <|Im(%)|≤t τ <|Im(%)|≤t σ σ≤Re(%)<u u≤Re(%)<S ZT ZS u τ < |Im (%)| ≤ t und x du dt. · # % ∈ N (χ) = ln (x) · 2 u ≤ Re (%) < S t τ σ (v) Beweis der zweiten Behauptung Weiterhin gilt Re(%) Z X X σ xRe(%) = ln (x) · xu du x + %∈N (χ) |Im(%)|≤T σ≤Re(%)<S %∈N (χ) |Im(%)|≤T σ≤Re(%)<S σ ZS X σ = x · (Nχ (σ, T ) − Nχ (S, T )) + ln (x) · xu · 1[σ;Re(%)] (u) du %∈N (χ) σ |Im(%)|≤T σ≤Re(%)<S ZS σ = x · (Nχ (σ, T ) − Nχ (S, T )) + ln (x) · = xσ · (Nχ (σ, T ) − Nχ (S, T )) + ln (x) · σ ZS σ = x · (Nχ (σ, T ) − Nχ (S, T )) + ln (x) · 1[σ;Re(%)] (u) du %∈N (χ) |Im(%)|≤T σ≤Re(%)<S σ ZS X xu · X xu · %∈N (χ) 0 |Im(%)|≤T σ≤Re(%)<u X + %∈N (χ) 1 du |Im(%)|≤T u≤Re(%)<S xu · (Nχ (u, T ) − Nχ (S, T )) du. σ Mit ZS σ x · (Nχ (σ, T ) − Nχ (S, T )) − Nχ (S, T ) · ln (x) · xu du σ = x · Nχ (σ, T ) − x · Nχ (S, T ) − Nχ (S, T ) · [xu ]u=S u=σ σ σ = xσ · Nχ (σ, T ) − xS · Nχ (S, T ) folgt die behauptete Gleichung. (vi) Beweis der Zusatzaussage Es ist |Im (%)| ≤ T und τ < |Im (%)| ≤ T und = % ∈ N (χ) % ∈ N (χ) σ ≤ Re (%) < S σ ≤ Re (%) ≤ 1 |Im (%)| ≤ T und |Im (%)| ≤ τ und \ % ∈ N (χ) ∪ % ∈ N (χ) . σ ≤ Re (%) ≤ 1 S ≤ Re (%) ≤ 1 Seite 124 Anhang Wegen τ ≤ T und σ < S ist |Im (%)| ≤ T und |Im (%)| ≤ τ und ∩ % ∈ N (χ) % ∈ N (χ) S ≤ Re (%) ≤ 1 σ ≤ Re (%) ≤ 1 |Im (%)| ≤ τ und = % ∈ N (χ) . S ≤ Re (%) ≤ 1 Für beliebige endliche Mengen A, B und C gilt nun # (A \ (B ∪ C)) = #A − (#B + #C − # (B ∩ C)) = #A + # (B ∩ C) − #B − #C. X Aus diesem Lemma kann ähnlich wie in Beweispunkt (v) auf Bemerkung 4.8 auf Seite 37 geschlossen werden. Genau wie in Beweispunkt (v) entstehen beim Einsetzen der Zusatzaussage in die erste Gleichung von Lemma C.1 Randterme bei den Integralen, die sich am Ende aber weitgehend gegenseitig aufheben. Um die Aussage von Bemerkung 4.8 zu erhalten, muss man in der nun folgenden Behauptung lediglich für ein q ∈ N über alle χ ∈ Xq summieren. Wegen der Linearität des Integrals lassen sich diese (endlichen) Summen dann mit den Integralen vertauschen. Nach Definition ist die Summe der Nχ ( · , · ) über alle χ ∈ Xq gerade Nq ( · , · ). Die zweite Aussage von Bemerkung 4.8 entsteht genauso aus der zweiten Behauptung von Lemma C.1. Korollar C.2 Voraussetzungen: Seien χ ∈ X , τ ∈ R+ , T ∈ R mit T ≥ τ , σ ∈ R und s ∈ R mit 1 2 ≤ σ < S ≤ 1. Behauptung: Dann ist für alle x ∈ R mit x > 1 X %∈N (χ) τ <|Im(%)|≤T σ≤Re(%)<S xRe(%) + 1 |Im (%)| ZT ln (x) · = ZS τ ZS + ln (x) · xu t2 · Nχ (u, t) du dt σ u x · Nχ (u, T ) Nχ (u, τ ) − T τ du σ ZT 1 · (xσ + 1) · Nχ (σ, t) − xS + 1 · Nχ (S, t) dt 2 t τ Nχ (S, τ ) Nχ (S, T ) + − · xS + 1 τ T Nχ (σ, T ) Nχ (σ, τ ) + − · (xσ + 1) . T τ + C: Summen Seite 125 Im Beweis werden zunächst die grundlegenden Integrale berechnet. Danach werden die Terme aus Lemma C.1 Schritt für Schritt durchgegangen und mittels der Zusatzaussage aus Lemma C.1 umgeformt. Zuletzt werden alle Terme wieder zusammengefasst. Beweis: (i) Integrale Sei x ∈ R mit x > 1. Es sind ZT τ t=T 1 1 1 1 dt = − = − t2 t t=τ τ T ZS und S σ ln (x) · xu du = [xu ]u=S u=σ = x − x . σ (ii) Erster Term Mit der Zusatzaussage von Lemma C.1 auf Seite 120 folgt ZT ZS u τ < |Im (%)| ≤ t und x du dt ln (x) · · # % ∈ N (χ) 2 u ≤ Re (%) < S t τ σ ZT ZS u x = ln (x) · · (Nχ (u, t) + Nχ (S, τ ) − Nχ (u, τ ) − Nχ (S, t)) du dt t2 τ σ ZT ZS u x = ln (x) · · Nχ (u, t) du dt t2 τ σ T S Z Z 1 − ln (x) · dt · xu · Nχ (u, τ ) du t2 τ σ S T Z Z 1 · Nχ (S, t) dt · ln (x) · xu du − t2 τ σ S T Z Z 1 + Nχ (S, τ ) · dt · ln (x) · xu du t2 σ τ ZT ZS u x = ln (x) · · Nχ (u, t) du dt t2 τ ln (x) + · T ZS σ ln (x) x · Nχ (u, τ ) du − · τ u σ + xσ · ZT xu · Nχ (u, τ ) du σ 1 · Nχ (S, t) dt − xS · t2 τ + Nχ (S, τ ) · ZS xS τ + Nχ (S, τ ) · ZT τ σ x T 1 · Nχ (S, t) dt t2 − Nχ (S, τ ) · xσ xS − Nχ (S, τ ) · . τ T Dissertation von Simon Feiler zum Thema Die relative Verteilung der Inversen einer natürlichen Zahl zu variablen Moduln Seite 126 Anhang (iii) Zweiter Term Analog folgt ln (x) · T ZS τ < |Im (%)| ≤ T und x · # % ∈ N (χ) du u ≤ Re (%) < S u σ ln (x) = · T ln (x) · = T ZS σ ZS xu · (Nχ (u, T ) + Nχ (S, τ ) − Nχ (u, τ ) − Nχ (S, T )) du Nχ (S, τ ) − Nχ (S, T ) · x · (Nχ (u, T ) − Nχ (u, τ )) du + T u σ =− ln (x) · T ZS ln (x) · xu du σ ZS xu · Nχ (u, τ ) du + ln (x) · T σ ZS xu · Nχ (u, T ) du σ − Nχ (S, T ) · xS T − Nχ (S, τ ) · xσ T + Nχ (S, T ) · xσ xS + Nχ (S, τ ) · . T T (iv) Dritter Term Genauso ergibt sich ZT σ (x + 1) · τ < |Im (%)| ≤ t und 1 dt · # % ∈ N (χ) σ ≤ Re (%) < S t2 τ = (xσ + 1) · ZT 1 · (Nχ (σ, t) + Nχ (S, τ ) − Nχ (σ, τ ) − Nχ (S, t)) dt t2 τ = ZT σ (x + 1) · 1 · (Nχ (σ, t) − Nχ (S, t)) dt t2 τ ZT σ + (x + 1) · (Nχ (S, τ ) − Nχ (σ, τ )) · 1 dt t2 τ σ ZT =−x · 1 · Nχ (S, t) dt + (xσ + 1) · t2 τ + Nχ (S, τ ) · ZT 1 · Nχ (σ, t) dt t2 τ 1 − τ ZT 1 · Nχ (S, t) dt t2 τ xσ + 1 xσ + 1 xσ xσ + 1 − Nχ (S, τ ) · + Nχ (σ, τ ) · + Nχ (S, τ ) · − Nχ (σ, τ ) · . T T τ τ C: Summen Seite 127 (v) Vierter Term Zuguterletzt ist noch τ < |Im (%)| ≤ T und xσ + 1 · # % ∈ N (χ) σ ≤ Re (%) < S T σ x +1 = · (Nχ (σ, T ) + Nχ (S, τ ) − Nχ (σ, τ ) − Nχ (S, T )) T 1 = − Nχ (S, T ) · T xσ + 1 xσ xσ + 1 xσ + 1 − Nχ (σ, τ ) · − Nχ (S, T ) · + Nχ (σ, T ) · . + Nχ (S, τ ) · T T T T In der Zusammenfassung heben sich einige Terme wieder weg, da sie einmal mit positivem und einmal mit negativem Vorzeichen addiert werden. Je zwei gleiche Terme sind in der folgenden Gleichung aus Gründen der Übersichtlichkeit mit derselben römischen Zahl gekennzeichnet. (vi) Zusammenführung Mit Lemma C.1 auf Seite 120 ergibt sich X xRe(%) + 1 |Im (%)| %∈N (χ) τ <|Im(%)|≤T σ≤Re(%)<S ZT ln (x) · = S Z u x · Nχ (u, t) du dt t2 τ σ ZS ZS ln (x) ln (x) u + · x · Nχ (u, τ ) du − · xu · Nχ (u, τ ) du T τ σ σ | {z } I σ ZT +x · τ | ZT 1 1 S · Nχ (S, t) dt − x · · Nχ (S, t) dt 2 t t2 τ {z } II xσ xσ xS xS + Nχ (S, τ ) · − Nχ (S, τ ) · − Nχ (S, τ ) · τ τ} | | {z T} | {z {z T} + Nχ (S, τ ) · III ZS − IV V ZS ln (x) ln (x) · xu · Nχ (u, τ ) du + · xu · Nχ (u, T ) du T T σ σ | {z } − Nχ (S, T ) · I S x xσ xσ xS − Nχ (S, τ ) · + Nχ (S, T ) · + Nχ (S, τ ) · T T} | | {z T} | {z {z T} III − xσ · ZT τ | VI ZT 1 1 · Nχ (S, t) dt + (xσ + 1) · · Nχ (σ, t) dt 2 t t2 τ {z } II V Seite 128 Anhang 1 + Nχ (S, τ ) · − τ ZT 1 · Nχ (S, t) dt t2 τ xσ + 1 xσ + 1 xσ xσ + 1 − Nχ (S, τ ) · + Nχ (σ, τ ) · + Nχ (S, τ ) · − Nχ (σ, τ ) · τ} τ | {z T } | {z T } | {z VII VIII IV 1 − Nχ (S, T ) · T xσ + 1 xσ + 1 xσ xσ + 1 + Nχ (S, τ ) · − Nχ (σ, τ ) · − Nχ (S, T ) · + Nχ (σ, T ) · . T} T {z T } | {z T } | {z | VII VIII xRe(%) ZT VI Das liefert X %∈N (χ) τ <|Im(%)|≤T σ≤Re(%)<S +1 = |Im (%)| ln (x) · ZS τ ZS t2 · Nχ (u, t) du dt σ u ln (x) · x · + xu Nχ (u, T ) Nχ (u, τ ) − T τ du σ ZT 1 σ S · (x + 1) · N (σ, t) − x + 1 · N (S, t) dt χ χ t2 τ Nχ (S, τ ) Nχ (S, T ) + − · xS + 1 τ T Nχ (σ, T ) Nχ (σ, τ ) + − · (xσ + 1) . T τ + X b: Von Primzahlsummen zu von Mangold–Summen Der Übergang von Summen der Form X f (p) zu Summen der Form p∈P X Λ (n) · f (n) n∈A(P) mit P ⊆ P und A (P) ⊆ N wird mit Hilfe von partieller Summation durchgeführt. Lemma C.3 (Partielle Summation) Voraussetzungen: Seien x ∈ R mit x ≥ 1, A ⊆ C mit Nx ⊆ A und f : ε ∈ R+ mit (1 − ε; x + ε) ⊆ B und g : B → C t 7→ g (t) A → C t 7→ f (t) . Seien B ⊆ stetig differenzierbar auf (1 − ε; x + ε). Behauptung: Dann gilt bxc X n=1 f (n) · g (n) = g (x) · C und bxc X n=1 Zx f (n) − 0 g (t) · 1 btc X n=1 f (n) dt. C: Summen Beweis: Sei Ξ : Seite 129 N×R → R ( 1, falls n ≤ t n 7→ Ξn (t) := t 0, falls n > t . Es gilt Zx 0 g (t) · 1 btc X Zx g (t) · f (n) dt = n=1 0 bxc X Zx bxc X f (n) · n=1 X f (n) · Ξn (t) · g 0 (t) dt 1 bxc g 0 (t) dt = X f (n) · (g (x) − g (n)). X n=1 n Wendet man dieses Lemma auf Zx n=1 n=1 1 = f (n) · Ξn (t) dt = bxc X f (p) mit P ⊆ P an, so erhält man die folgende Aussage. p∈P Korollar C.4 (Primzahlsummen) Voraussetzungen: Seien x ∈ R mit x ≥ 2, A ⊆ C mit Nx ⊆ A und f : A → C t 7→ f (t) √ j . Behauptung: Es gilt bxc X p=2 p∈ P bxc f (p) = X 1 1 · · Λ (n) · f (n) − ln (x) ln (x) n=1 + √ Zx X btc 2 Λ (n) · f (n) dt − t · ln2 (t) n=1 ln(x) xc ln(p) bX X k ln (p) · f pk p=2 k=2 p∈ j k P ln(t) tc ln(p) Zx bX X ln (p) · f pk 2 p=2 p∈ P k=2 t · ln2 (t) dt. Beweis: (i) Definition von g R → C Sei g : stetig differenzierbar auf t 7→ g (t) g (t) = R mit 1 ln (t) für alle t ∈ R mit t ≥ 2. g existiert, da das multiplikative Inverse des natürlichen Logarithmus auf { t ∈ R| t > 1} stetig differenzierbar ist. Für alle t ∈ R mit t > 2 ist −1 g 0 (t) = . t · ln2 (t) Seite 130 Anhang (ii) Partielle Summation N → R ( ˜ ln (n) · f (n) , falls n ∈ P Definiert man f : ˜ n 7→ f (n) := 0, falls n ∈ /P Summation C.3 auf Seite 128 bxc X p=2 p∈ P , so folgt mit partieller bxc bxc X ln (p) · f (p) X ˜ f (p) = = f (n) · g (n) ln (p) p=2 p∈ n=1 P = g (x) · bxc X Zx f˜ (n) − n=1 g 0 (t) · btc X f˜ (n) dt. n=1 1 (iii) Beweis der Behauptung Für alle y ∈ R mit y ≥ 1 ist byc X f˜ (n) = n=1 byc X ln (p) · f (p) p=1 p∈ P j ln(y) ln(p) j k ln(y) k byc ln(p) X X X X ln (p) · f pk − ln (p) · f pk = byc p=1 p∈ P j k=2 ln(y) byc byc = p=1 p∈ k P k=1 X Λ (n) · f (n) − p=2 p∈ n=1 Wegen Λ (1) = 0 ist insbesondere ln(p) X X P byc X ln (p) · f pk . k=2 f˜ (n) = 0 für alle y ∈ R mit 1 ≤ y < 2. n=1 Außerdem ist j byc ln(y) ln(p) X X k ln (p) · f pk = 0 √ p=b y c+1 k=2 p∈ P √ für alle y ∈ R mit y ≥ 1, da die innere Summe leer ist p > y ⇐⇒ Wegen x ≥ 2 folgt bxc X f (p) = g (x) · p=2 p∈ bxc X f˜ (n) − n=1 P = g (x) · bxc X n=1 Zx 0 g (t) · Zx 0 g (t) · 2 f˜ (n) dt n=1 1 f˜ (n) − btc X btc X n=1 f˜ (n) dt ln(y) ln(p) <2 . C: Summen Seite 131 1 ln (x) = √ bxc X · Λ (n) · f (n) − n=1 √ btc X Zx Λ (n) · f (n) − P + p=2 p∈ j k P ln(x) k=2 k ln (p) · f pk ln(t) tc ln(p) bX X p=2 p∈ 2 n=1 j xc ln(p) bX X ln (p) · f pk k=2 dt. t · ln (t) X 2 Ist zusätzlich f beschränkt, so lässt sich der Beitrag der Doppelsummen begrenzen. Als Grenze erhält man die Quadratwurzel der oberen Summationsgrenze der Primzahlsumme, 1 multipliziert mit der Schranke von f und dem Faktor 1 + ln(4) , der sich aus den beiden 1 19 12 Doppelsummen–Termen ergibt. Es ist 7 < 1 + ln(4) < 11 . Dieser Fall ist der interessante und häufig benutzte. In dieser Arbeit ist f sogar eine Funktion, die auf den Einheitskreis abbildet und damit durch 1 beschränkt ist. Korollar C.5 (Primzahlsummen über beschränkte Funktionen) Voraussetzungen: A → C und M ∈ Seien x ∈ R mit x ≥ 2, A ⊆ C mit Nx ⊆ A, f : t 7→ f (t) 1 |f (n)| ≤ M für alle n ∈ N mit n ≤ x. Sei C := 1 + . ln (4) Behauptung: Dann gilt 12 7 <C< 19 11 R+ ∪ {0} mit und x btc bxc Z bxc X X Λ (n) · f (n) X √ 1 f (p) − · Λ (n) · f (n) − dt ≤ CM · x. 2 ln (x) t · ln (t) p=2 n=1 2 n=1 p∈P Beweis: (i) Anwenden von Korollar C.4 Nach Korollar C.4 auf Seite 129 ist bxc X p=2 p∈ P √ bxc f (p) = X 1 1 · Λ (n) · f (n) − · ln (x) ln (x) n=1 + Zx X btc 2 Λ (n) · f (n) dt − 2 t · ln (t) n=1 √ j ln(x) xc ln(p) bX X k ln (p) · f pk p=2 k=2 p∈ j k P ln(t) ln(p) tc Zx bX X ln (p) · f pk 2 p=2 p∈ P k=2 t · ln2 (t) dt. Seite 132 Anhang (ii) Abschätzen der Doppelsumme Für alle y ∈ R mit 1 ≤ y ≤ x ist nun j k j k √ j ln(y) k ln(y) ln(y) √ yc b yc ln(p) b √y c b ln(p) ln(p) X X X X X X ln (p) · ln (p) · ln (p) · f pk ≤ M f pk ≤ p=2 k=2 p=2 p=2 k=2 k=2 p∈P p∈P p∈P √ √ =M· yc bX ln (p) · p=2 p∈ P yc bX ln (y) −1 ≤M · ln (y) ln (p) ≤ M · ln (y) · # {p ∈ P |p ≤ √ p=2 p∈ P y}. (iii) Abschätzen der Restterme Damit folgt j k √ ln(x) xc ln(p) bX X 1 √ √ 1 k ln (p) · f p ≤ · M · ln (x) · # p ∈ P p ≤ x ≤ M · x. ln (x) · ln (x) p=2 k=2 p∈P Außerdem ergibt sich x √ j ln(t) k Zx Z b tc ln(p) X X ln (p) · f pk 1 dt ≤ 2 t · ln (t) t · ln2 (t) p=2 k=2 2 2 p∈P √ j ln(t) k b tc ln(p) X X · ln (p) · f pk dt p=2 k=2 p∈P x √ Z M · ln (t) · # p ∈ P p ≤ t dt ≤ t · ln2 (t) 2 Zx ≤M· √ M t dt ≤ · t · ln (t) ln (2) 2 Zx 1 t− 2 dt 2 √ √ M · = x− 2 . 2 · ln (2) X c: Abschätzungen für endliche Summen Im Text tauchen an einigen Stellen Abschätzungen von endlichen Summen auf. Diese sollen hier bewiesen werden. Die Summe über die Reziproken der natürlichen Zahlen aus einem Intervall kann im Prinzip durch die Differenz der Werte des natürlichen Logarithmus an den Intervallgrenzen abgeschätzt werden. Bemerkung C.6 (Die endliche harmonische Reihe) Für alle S ∈ R+ , alle R ∈ R mit R ≥ 1 und alle T ∈ R mit T ≥ max {R; S} gilt ln (bT c + 1) − ln (bSc + 1) ≤ bT c X n=bSc+1 1 n und bT c X n=bRc+1 1 ≤ ln (bT c) − ln (bRc) . n C: Summen Seite 133 Im Beweis wird die Summe als Riemann’sche Ober– bzw. Untersumme des entsprechenden Integrals interpretiert. Beweis: Seien S ∈ R+ , R ∈ R mit R ≥ 1 und T ∈ R mit T ≥ max {R; S}. ( + ) R → R ist streng monoton fallend auf R+ . 1 t 7→ t (i) Untere Abschätzung der Summe bT c X Also ist n=bSc+1 1 eine Riemann’sche Obersumme von n bT Zc+1 1 dt. t bSc+1 Damit folgt bT c X n=bSc+1 1 ≥ n bT Zc+1 1 t=bT c+1 dt = [ln (t)]t=bSc+1 = ln (bT c + 1) − ln (bSc + 1) . t bSc+1 (ii) Obere Abschätzung der Summe bT c X Ebenso ist n=bRc+1 1 eine Riemann’sche Untersumme von n ZbT c 1 dt. t bRc Damit folgt bT c X n=bRc+1 1 ≤ n ZbT c 1 t=bT c dt = [ln (t)]t=bRc = ln (bT c) − ln (bRc) . t X bRc Zum Beweis von Bemerkung 7.3 auf Seite 66 benötigt man unter Anderem den Satz von Qebyxv† . Dieser wird auch beim Beweis von Bemerkung 5.3 auf Seite 48 in Teilabschnitt d von Anhang E eine Rolle spielen. Hilfssatz C.7 (Satz von Qebyxv) Behauptung: (i) Es gibt von x unabhängige Konstanten Q1 ∈ R+ und Q2 ∈ R+ mit Q1 · x ≤ bxc X Λ (n) ≤ Q2 · x n=1 für alle x ∈ R mit x ≥ 2. (ii) Es gibt von x unabhängige Konstanten Q3 ∈ R+ und Q4 ∈ R+ mit Q3 · x x ≤ # { p ∈ P| p ≤ x} ≤ Q4 · ln (x) ln (x) für alle x ∈ R mit x ≥ 2. † sprich: „Chebyshev“ Seite 134 Anhang Referenz: Siehe [La, § 18. auf den Seiten 79 bis 83]33 und [Pr, Satz 3.2 in Kapitel I. auf Seite 19 der 1. Auflage]34 . X Der Satz von Qebyxv gibt also Schranken für die Anzahl der Primzahlen unterhalb einer vorgegebenen Grenze an. Außerdem liefert er Schranken für die damit eng zusammenhängende Summe von Λ–Werten bis zu einer oberen Grenze. Als letzte Zutat für Bemerkung 7.3 wird noch die Anzahl der quadratfreien Zahlen unterhalb einer vorgegebenen Schranke benötigt. Bemerkung C.8 (Quadratfreie Zahlen) Es gibt eine von y unabhängige Konstante C ∈ R+ , so dass für alle y ∈ R mit y ≥ 1 gilt byc X 6 √ 2 µ (b) − 2 · y ≤ C · y. π b=1 Referenz: Siehe [Hu, Theorem 6.2 in Kapitel 6 auf Seite 114 der englischen Ausgabe]35 . Bemerkung C.9 (Bemerkung 7.3) Es gibt von y unabhänige Konstanten Q ∈ gilt byc X R+ und C ∈ R+ , so dass für alle y ∈ R mit y ≥ 1 byc X Λ (b) Λ (b) ≤ Q · y, b=1 X b=1 b ≤ Q · (ln (y) + 1) und byc 2 X µ (b) 6 ≤ C. − · ln (y) π2 b=1 b Q ist die Konstante Q2 aus dem Satz von Qebyxv. Die letzten beiden Behauptungen entstehen durch partielle Summation, während die erste Behauptung ein Teil des Satzes von Qebyxv ist. Beweis: (i) Zu den ersten beiden Abschätzungen Nach dem Satz von Qebyxv C.7 auf der vorherigen Seite gibt es ein Q ∈ R+ mit byc X Λ (b) ≤ Qy b=1 für alle y ∈ R mit y ≥ 1. 33 „Handbuch der Lehre von der Verteilung der Primzahlen.“, E. Landau, B.G. Teubner GmbH (Leipzig — 1909), § 18. auf den Seiten 79 bis 83 34 „Grundlagen der mathematischen Wissenschaften 91 — Primzahlverteilung“, K. Prachar, Springer (Berlin, Göttingen, Heidelberg — 1957), Satz 3.2 in Kapitel I. auf Seite 19 der 1. Auflage 35 „Introduction to number theory“, Hua L. K., Springer (Berlin, Heidelberg, New York — 1982), Theorem 6.2 in Kapitel 6 auf Seite 114 der englischen Ausgabe C: Summen Seite 135 Mit partieller Summation C.3 auf Seite 128 folgt byc X byc X Λ (b) b b=1 = Λ (b) b=1 − y Zy X btc b=1 1 ≤ Qy + y Zy 1 Λ (b) · − 2 dt t Qt dt t2 1 Zy = Q+Q· 1 dt t 1 = Q + Q · ln (y) für alle y ∈ R mit y ≥ 1. (ii) Zur dritten Abschätzung Nach Bemerkung C.8 auf der vorherigen Seite ist für alle y ∈ R mit y ≥ 1 byc X byc 2 X µ (b) b=1 b = µ2 (b) b=1 − y Zy X btc 1 = 6 π2 b=1 1 µ2 (b) · − 2 dt t √ Zy ·y+O y + y √ t 6 π2 ·t+O t2 Zy y Z 3 1 dt + O t− 2 dt t dt 1 6 = 2 +O π 6 +O π2 1 √ y 1 √ y 6 + 2· π 1 = + 1 6 − 12 · ln (y) + O 1 − y . π2 Dissertation von Simon Feiler zum Thema Die relative Verteilung der Inversen einer natürlichen Zahl zu variablen Moduln X Seite 136 Anhang Anhang D: zu §7: Die Vaughan–Identität a: Herleitung der Vaughan–Identität In Teilabschnitt a von Anhang D soll die Vaughan–Identität bewiesen und so verwendet werden, dass das Ergebnis mit Hilfssatz 7.1 übereinstimmt. Um die Vaughan–Identität zu beweisen, wird zunächst die Möbius’sche Umkehrformel benötigt. Hilfssatz D.1 (Möbius’sche Umkehrformel) Voraussetzungen: Seien A ⊆ C, B ⊆ C mit N ⊆ A ∩ B, f : A → C n 7→ f (n) und F : B → C n 7→ F (n) . Behauptung: Es gilt F (n) = n X für alle n ∈ N f (d) d=1 d teilt n genau dann, wenn f (n) = n X µ (d) · F d=1 d teilt n n d für alle n ∈ N gilt. Referenz: Siehe [Br, Satz 1.3.3 auf Seite 19 der 1. Auflage]36 . Angewandt auf F : N → C X n 7→ F (n) := 1 Behauptung (i) der folgenden Bemerkung. liefert die Möbius’sche Umkehrformel D.1 Bemerkung D.2 (Teilersummen über µ und Λ) (i) Für alle n ∈ N gilt n X d=1 d teilt n (ii) Für alle n ∈ N gilt n X ( 1, falls n = 1 ist; µ (d) = 0, falls n 6= 1 ist. Λ (d) = ln (n). d=1 d teilt n 36 „Einführung in die analytische Zahlentheorie“, J. Brüdern, Springer (Berlin, Heidelberg — 1995), Satz 1.3.3 auf Seite 19 der 1. Auflage D: zu §7: Die Vaughan–Identität Seite 137 Beweis: (i) Beweis von Behauptung (i) mit Hilfssatz D.1 N → N0 ( 1, falls d = 1 ist Seien n ∈ N \ {1} und ε : d 7→ ε (d) := 0, falls d = 6 1 ist Dann ist n n n X X X ε (d) = ε (1) + ε (d) = 1 + d=1 d teilt n Ferner ist 1 X d=2 d teilt n . 0 = 1. d=2 d teilt n ε (d) = ε (1) = 1. d=1 d teilt 1 Mit der Möbius’schen Umkehrformel D.1 auf der vorherigen Seite folgt Behauptung (i). (ii) Beweis von Behauptung (ii) Y P × N → N0 pkp,m für alle m ∈ N ist. Sei k : derart, dass m = T (p, m) 7→ kp,m P p∈ Dann gilt für alle m ∈ N m X d=1 d teilt m Λ (d) = p,m X kX P p∈ ln (p) = j=1 X p∈ kp,m ≥1 P X kp,m · ln (p) = p∈ P ln pkp,m = ln Y p∈ P pkp,m . X Damit lässt sich bereits die Vaughan–Identität beweisen. Lemma D.3 (Vaughan–Identität) Voraussetzungen: Seien y ∈ R mit y ≥ 1, z ∈ R mit z ≥ 1 und n ∈ N mit n > z. Behauptung: Dann ist Λ (n) = byc X b=1 b teilt n µ (b) · ln n b − byc X bzc X c=1 b=1 b teilt n c teilt µ (b) Λ (c) + n b n X n c X µ (b) Λ (c). c=bzc+1 b=byc+1 c teilt n b teilt nc Im Beweis wird zunächst die Möbius’sche Umkehrformel auf Bemerkung D.2 (ii) angewandt. Danach wird die entstehende Summe aufgeteilt in die Summanden mit einem Summationsindex von höchstens y und in die Summanden mit höherem Summationsindex. Während die erste Summe unverändert bleibt, wird wiederum Bemerkung D.2 (ii) auf die Summanden der zweiten Summe angewandt. Die innere Summe der entstehenden Doppelsumme wird dann wie oben bei z geteilt. So entstehen drei Summen. Auf die „gemischte“ Doppelsumme mit Summationsindizes größer als y aber höchstens z wird Bemerkung D.2 (i) angewandt, um die Behauptung zu erreichen. Seite 138 Anhang Beweis: (i) Anwenden der Möbius’schen Umkehrformel Mit Satz D.1 auf Seite 136 und Bemerkung D.2 (ii) auf Seite 136 folgt n X Λ (n) = µ (b) · ln b=1 b teilt n byc X = µ (b) · ln b=1 b teilt n byc X = µ (b) · ln b=1 b teilt n byc X = µ (b) · ln b=1 b teilt n n b n b n b n b + n X µ (b) · ln n b b=byc+1 b teilt n + n n X µ (b) · c=1 c teilt b=byc+1 b teilt n + b X n X n b bzc X µ (b) · c=1 c teilt b=byc+1 b teilt n Λ (c) Λ (c) + n n X µ (b) · b=byc+1 b teilt n n b b X Λ (c). c=bzc+1 c teilt nb (ii) Umformung der mittleren Summe n n z Nun ist wegen Bemerkung D.2 (i) auf Seite 136 und ≥ > = 1 für alle c ∈ Nz c z z n X b=byc+1 b teilt n µ (b) · bzc X c=1 c teilt Λ (c) = n X µ (b) · c=1 c teilt b=1 b teilt n n b = bzc X bzc X Λ (c) − n b c X Λ (c) · b=1 b teilt | byc X b=1 b teilt n µ (b) · byc X µ (b) − b=1 b teilt n n c {z bzc X c=1 c teilt b=1 b teilt n n c=1 c teilt n =− byc X µ (b) · Λ (c) n b bzc X c=1 c teilt Λ (c) n b } =0 bzc µ (b) · X c=1 c teilt Λ (c). n b Setzt man die Gleichung aus (ii) in die Gleichung aus (i) ein, erhält man die Behauptung. X P Die Vaughan–Identität soll genutzt werden, um eine Summe der Form Λ · f mit f : N → C in mehrere kürzere Summen aufzusplitten. Dabei wird nach Anwendung der Vaughan–Identität in allen Termen die Summationsreihenfolge vertauscht. Schreibt man den ln im ersten Term als Integralwert und nutzt im letzten Term noch ein weiteres Mal Bemerkung D.2 (i) aus, so erhält man die gewünschte Aussage. D: zu §7: Die Vaughan–Identität Seite 139 P Lemma D.4 ( Λ · f mit der Vaughan–Identität) Voraussetzungen: A → C Seien A ⊆ C mit N ⊆ A und f : . m 7→ f (m) Seien y ∈ R mit y ≥ 1 und z ∈ R mit z ≥ 1. Behauptung: Für alle x ∈ R mit x ≥ yz gilt bxc X bzc X Λ (m) · f (m) = m=1 Λ (m) · f (m) m=1 + byc X bZxb c µ (b) · b=1 − 1 · s 1 byc bzc X X x bX bc µ (b) · Λ (c) · x bX bc c b=1 c=1 − f (bn) ds n=bsc+1 f (bcn) n=1 x bX zc byc X n=byc+1 d=1 d teilt n x bX nc µ (d) · Λ (b) · f (bn). b=bzc+1 Beweis: (i) Abkürzungen für die in der Vaughan–Identität auftretenden Summen Sei x ∈ R mit x ≥ yz. Für alle n ∈ N seien Σ1 (n) := byc X µ (b) · ln b=1 b teilt n n b , byc X Σ2 (n) := bzc X µ (b) · Λ (c) c=1 b=1 b teilt n c teilt n X Σ3 (n) := und n b n c X µ (b) · Λ (c). c=bzc+1 b=byc+1 c teilt n b teilt nc Σ1 (n) und Σ2 (n) stimmen für n ∈ N mit n ≤ z überein. (ii) Auffüllen der zu Σ1 und Σ2 gehörenden Summen Für alle n ∈ N mit n ≤ z ist nach Bemerkung D.2 (ii) auf Seite 136 Σ1 (n) = byc X b=1 b teilt n µ (b) · ln n b = byc X b=1 b teilt n n µ (b) · b X c=1 c teilt Λ (c) = n b byc X b=1 b teilt n µ (b) · bzc X c=1 c teilt Λ (c) = Σ2 (n) . n b Seite 140 Anhang Mit der Vaughan–Identität D.3 auf Seite 137 folgt bxc X Λ (m) · f (m) = m=1 bzc X Λ (m) · f (m) + m=1 bzc X = bxc X Λ (m) · f (m) + m=1 − bxc X (Σ1 (m) − Σ2 (m) + Σ3 (m)) · f (m) m=bzc+1 bxc X Σ1 (m) · f (m) m=1 bxc X Σ2 (m) · f (m) + m=1 Σ3 (m) · f (m). m=bzc+1 Nach Vertauschen der Summationsreihenfolge in den einzelnen Termen und einiger Schönheitskorrekturen ergibt sich bereits die Behauptung. (iii) Umformen des Σ1 –Terms Es ist nun X bxc bxc Σ1 (m) · f (m) = X X µ (b) · ln m=1 m=1 = byc byc X m b b=1 b teilt m µ (b) · b=1 x bX bc Zn f (bn) · n=1 · f (m) 1 ds s 1 x c+1 bX byc b c n−1 XZ X 1 f (bn) · ds. = µ (b) · s b=1 n=1 c=1 c Für alle b ∈ N mit b ≤ y ist o n jxk und c ≤ n − 1 (c, n)T ∈ N2 n ≤ b n jxk j x ko T 2 = (c, n) ∈ N c ≤ − 1 und c + 1 ≤ n ≤ . b b Wegen bsc = c für alle (s, c)T ∈ R × N mit c ≤ s < c + 1 folgt bxc X Σ1 (m) · f (m) = m=1 byc X b=1 = byc X x c+1 −1 b xb c Z bX bc X 1 µ (b) · f (bn) · ds s c=1 µ (b) · = b=1 x bX c−1 Zc+1 bX bc c=1 b=1 byc X n=c+1 c x b bZ c x b µ (b) · 1 1 · s c f (bn) · n=bsc+1 x bX bc n=bsc+1 f (bn) ds. 1 ds s D: zu §7: Die Vaughan–Identität Seite 141 (iv) Umformen des Σ2 –Terms Weiterhin zeigt sich bxc X bxc Σ2 (m) · f (m) = m=1 byc bzc X X X m=1 = µ (b) · Λ (c) · f (m) c=1 b=1 b teilt m c teilt m b byc bzc X X µ (b) · Λ (c) · b=1 c=1 x bX bc c f (bcn). n=1 (v) Umformen des Σ3 –Terms Zuguterletzt gilt noch bxc X Σ3 (m) · f (m) = m=1 bxc m X X m=1 m c X c=bzc+1 b=byc+1 c teilt m b teilt m c x bX bxc n cc X X = µ (b) · Λ (c) · f (m) µ (b) · Λ (c) · f (cn). c=bzc+1 n=1 b=byc+1 b teilt n Für alle n ∈ N mit n ≤ y ist n X µ (b) = 0. b=byc+1 b teilt n > xy . Ferner ist xc < y für alle c ∈ N mit c Nach Bemerkung D.2 (i) auf Seite 136 ist für alle n ∈ N \ {1} n X µ (b) = 0. b=1 b teilt n Damit folgt bxc X m=1 Σ3 (m) · f (m) = x bX cc bxc X n X µ (b) · Λ (c) · f (cn) c=bzc+1 n=byc+1 b=byc+1 b teilt n j k x =− y X x bX cc c=bzc+1 n=byc+1 =− x bX zc x bX nc n=byc+1 c=bzc+1 byc X µ (b) · Λ (c) · f (cn) b=1 b teilt n byc X b=1 b teilt n µ (b) · Λ (c) · f (cn). X Seite 142 Anhang b: Beweis von Bemerkung 7.7 In Bemerkung 7.7 wird die Anzahl der ganzen Zahlen innerhalb eines rellen Intervalles, deren Differenz zu einer festen ganzen Zahl mit einem vorgegebenen Modul einen bestimmten größten gemeinsamen Teiler bildet, möglichst genau angegeben. Der Beweis für diese Angabe wird in diesem Teilabschnitt von Anhang D geführt. Zunächst wird festgestellt, dass die Anzahl der natürlichen Zahlen innerhalb eines Intervalls, die eine bestimmte Kongruenz erfüllen, im Wesentlichen dem Quotienten aus Intervalllänge und Modul entspricht. Bemerkung D.5 (Mächtigkeit des Schnitts eines Intervalls mit einer Restklasse) Für alle y ∈ Z, alle z ∈ Z mit z ≤ y, alle n ∈ N und alle b ∈ N ist y X c≡b 1∈ c=z+1 (mod n) y−z y−z ; +1 . n n Der Beweis verläuft ähnlich wie der Beweis zur Verteilung der Inversen von a ∈ N\ {1} modulo aller zu a teilerfremden Zahlen aus einem Intervall. Er wird per Induktion über y−z n geführt. Beweis: Für alle y ∈ Z, alle z ∈ Z mit z ≤ y und alle n ∈ N y−z sei kn (y, z) := . n (i) Induktionsanfang Für alle y ∈ Z, alle z ∈ Z mit z ≤ y und alle n ∈ N mit kn (y, z) = 0 gilt y − z < n. Für alle y ∈ Z und alle z ∈ Z mit z ≤ y gilt # { c ∈ Z| z < c ≤ y} = y X 1 = y − (z + 1) + 1 = y − z. c=z+1 Für alle y ∈ Z, alle z ∈ Z mit z ≤ y und alle n ∈ N mit kn (y, z) = 0 gibt es also weniger als n ganze Zahlen, die größer als z und höchstens so groß wie y sind. Für alle b ∈ Z kann von diesen höchstens eines kongruent zu b modulo n sein. Für alle y ∈ Z, alle z ∈ Z mit z ≤ y, alle n ∈ N mit kn (y, z) = 0 und alle b ∈ Z ist also y X c≡b 1 ∈ {0; 1} = {kn (y, z) ; kn (y, z) + 1} = c=z+1 (mod n) y−z y−z ; +1 . n n (ii) Induktionsvoraussetzung Es gibt ein ` ∈ N0 , so dass für alle y ∈ Z, alle z ∈ Z mit z ≤ y, alle n ∈ N mit kn (y, z) = ` und alle b ∈ Z gilt: y X c≡b c=z+1 (mod n) 1 ∈ {`; ` + 1} = {kn (y, z) ; kn (y, z) + 1} = y−z y−z ; +1 n n D: zu §7: Die Vaughan–Identität Seite 143 (iii) Induktionsschluss Seien y ∈ Z,z ∈ Z mit z ≤ y, n ∈ N mit kn (y, z) = ` + 1 und b ∈ Z. Wegen y−z = kn (y, z) = ` + 1 und ` ≥ 0 gilt n y − z ≥ kn (y, z) · n ≥ n, weshalb y − n ≥ z ist. y X Wegen # {c ∈ N |y − n < c ≤ y } = 1 = y − (y − n + 1) + 1 = n gibt es genau ein c ∈ Z c=y−n+1 mit y − n < c ≤ y und c ≡j b (modkn). y−z Ferner ist kn (y − n, z) = (y−n)−z = y−z − 1 = kn (y, z) − 1 = `. n n −1 = n Mit der Induktionsvoraussetzung folgt y X c=z+1 c≡b (mod n) y−n X 1= y X 1+ c=z+1 c≡b (mod n) 1 ∈ {` + 1; (` + 1) + 1} c=y−n+1 c≡b (mod n) | {z = 1 = {kn (y, z) ; kn (y, z) + 1} = } y−z y−z ; +1 . n n X Zum Beweis von Bemerkung 7.7 werden noch zwei elementare Ergebnisse benötigt. Bemerkung D.6 (i) Für alle n ∈ N gilt n X k=1 k teilt n µ (k) · n = ϕ (n). k n o (ii) Für alle (n, m)T ∈ Z \ (0, 0)T gilt { k ∈ N| k teilt n und k teilt m} ⊆ { k ∈ N| k teilt ggT (n, m)} . Referenz: Siehe [Hu, Theorem 4.2 in Kapitel 6 auf Seite 109 und Theorem 4.4 (iii) in Kapitel 1 auf Seite 5 der englischen Ausgabe]37 . X Damit sind alle zum Beweis von Bemerkung 7.7 benötigten Hilfsmittel bereitgestellt. In diesem wird der sogenannte Möbius–Trick angewandt, der im Prinzip lediglich aus der Verwendung von Bemerkung D.2 (i) besteht. Beim Möbius–Trick wird dieses Ergebnis verwendet, um die Größter–gemeinsamer–Teiler–Bedingung einer Summe durch eine weitere Summation auszudrücken. Nach Vertauschung der Summationsreihenfolge lässt sich die entstandene Doppelsumme einfacher berechnen. 37 „Introduction to number theory“, Hua L. K., Springer (Berlin, Heidelberg, New York — 1982), Theorem 4.2 in Kapitel 6 auf Seite 109 und Theorem 4.4 (iii) in Kapitel 1 auf Seite 5 der englischen Ausgabe Seite 144 Anhang Lemma D.7 (Bemerkung 7.7) Voraussetzungen: Seien a ∈ N \ {1}, d ∈ N ein Teiler von a, b ∈ Z, y ∈ Z und z ∈ Z mit z ≤ y. Behauptung: Dann ist y − z ϕ d · a d a d y a X − 1 ≤ τ. . d c=z+1 ggT(a,b−c)=d Beweis: (i) Der Möbius–Trick Nach Bemerkung D.2 (i) auf Seite 136 folgt y X y X 1= c=z+1 ggT(a,b−c)=d y X ggT( ad , b−c d ) c=z+1 c≡b (mod d) k=1 k teilt ggT( ad , b−c d ) 1= c=z+1 b−c≡0 (mod d) =1 ggT( ad , b−c d ) X µ (k). Die innere Summe wird nicht verändert, wenn als obere Grenze ad angegeben wird, da die Teilerbedingung weitere Summanden ausschließt. Für alle c ∈ N mit c ≡ b (mod d) teilen alle k ∈ N, die ggT ad , b−c teilen, auch ad und b−c d d . Mit Bemerkung D.6 (ii) auf Seite 143 folgt y X c=z+1 ggT(a,b−c)=d 1= y X a a d X d X µ (k) = c=z+1 k=1 c≡b (mod d) k teilt ad k teilt b−c d k=1 k teilt y X µ (k) · 1. c=z+1 c≡b (mod d) b−c ≡0 (mod k) d a d (ii) Auswertung der beiden Restklassenbedingungen der inneren Summe Für alle c ∈ Z und alle k ∈ N mit c ≡ b (mod d) und b−c d ≡ 0 (mod k) gibt es ein j ∈ ein h ∈ Z mit c = b + jd b−c = hk, d und was zu j = −hk und c = b − h · (dk) führt. Für alle c ∈ Z und alle k ∈ N mit c ≡ b (mod d) und b−c d ≡ 0 (mod k) ist also c ≡ b (mod dk). Andererseits gibt es für alle c ∈ Z und alle k ∈ N mit c ≡ b (mod dk) ein m ∈ Z mit c = b + m · (dk) , was zu c ≡ b (mod d) führt. und b−c ≡0 d (mod k) Z und D: zu §7: Die Vaughan–Identität Seite 145 Für alle c ∈ Z und alle k ∈ N ist damit b−c c ≡ b (mod d) und ≡ 0 (mod k) d c ≡ b (mod dk). äquivalent zu (iii) Anwenden von Bemerkung D.5 o n T 4 (`, n, s, t) ∈ Z n > 0 und s ≤ t → R t−s Sei Ξ : + (`, n, s, t)T 7→ Ξ`,n (s, t) := − n . 1 t X c=s+1 c≡` (mod n) Nach Bemerkung D.5 auf Seite 142 gilt für alle (`, n, s, t)T ∈ Z4 mit n > 0 und s ≤ t Ξ`,n (s, t) ∈ (−1; 1] . Mit (i) und (ii) ergibt sich y X a d X 1= c=z+1 ggT(a,b−c)=d k=1 k teilt a y X µ (k) · 1= c=z+1 c≡b (mod d) (mod k) a d d X k=1 k teilt b−c ≡0 d y X µ (k) · a d c≡b 1 c=z+1 (mod dk) a d X = k=1 k teilt µ (k) · y−z + Ξb,dk (z, y) dk a d a a d X y−z · = d k=1 k teilt d X µ (k) + µ (k) · Ξb,dk (z, y). k k=1 k teilt a d a d (iv) Bemerkung D.6 (i) und Abschätzung der zweiten Summe Die Behauptung folgt nun aus a a d a X µ (k) y−z y−z ϕ = · µ (k) · d = · k a k d d X y−z · d k=1 k teilt k=1 k teilt a d a d a d a d nach Bemerkung D.6 (i) auf Seite 143 und a a a X d d a X X d ≤ µ (k) · Ξ (z, y) |µ (k)| · |Ξ (z, y)| ≤ 1 = τ. . b,dk b,dk d k=1 k=1 k=1 k teilt a k teilt a k teilt a d d d Dissertation von Simon Feiler zum Thema Die relative Verteilung der Inversen einer natürlichen Zahl zu variablen Moduln X Seite 146 Anhang Anhang E: Einfache Ergebnisse a: zu §1: Gleichverteilung n ? o In §1 wurde die Gleichverteilung einer Menge amm ∈ (0; 1) m ∈ M mit a ∈ N \ {1}, M ⊆ { m ∈ N \ {1}| ggT (a, m) = 1} und #M = ∞ im Weyl’schen Sinne untersucht. Voraussetzung E.1 In Teilabschnitt a von Anhang E wird vorausgesetzt, dass a ∈ N \ {1} und M ⊆ { m ∈ N \ {1}| ggT (a, m) = 1} mit #M = ∞ sind. Das Weyl–Kriterium 1.2 auf Seite 11 selbst bezieht sich nur auf Folgen, die auf ganz N definiert sind. ? Will man das Weyl–Kriterium auf die Folge amm anwenden, so bedarf es deshalb m∈M einer Umnummerierung der Folge. In diesem Teilabschnitt von Anhang E soll diese Umnummerierung vorgenommen werden. Außerdem muss geprüft werden, ob eine solche Umnummerierung weitere Konsequenzen für das Weyl–Kriterium hat. Zunächst jedoch werden die Elemente von M aufsteigend „nummeriert“. Definition E.2 N → M derart, dass b (n) = min (M \ { b (j) ∈ M| j ∈ N mit j < n}) für alle Sei b : n 7→ b (n) N → (0; 1) ? a n ∈ N ist. Sei c : . b(n) n 7→ cn := b (n) b ordnet der Zahl n ∈ N gerade das n–te Element von M zu. ? Dementsprechend bildet c ein n ∈ N auf das n–te Folgenglied von amm m∈M ab. Um zwischen beiden Nummerierungen der Elemente von M wechseln zu können, ist es notwendig, die Bijektivität von b einzusehen. Bemerkung E.3 M → N b ist umkehrbar. Es ist : m 7→ b−1 (m) := #Mm n ? o am Es ist { cn ∈ (0; 1)| n ∈ N} = m ∈ (0; 1) m ∈ M . b−1 die Umkehrung von b. Beweis: (i) Nacheinanderausführung von b und b−1 Sei m ∈ M. Dann ist b b−1 (m) = b (#M m ) nach Konstruktion von b gerade das Maximum −1 von Mm . Wegen m ∈ M folgt b b (m) = m. (ii) Nacheinanderausführung von b−1 und b Sei n ∈ N. Dann ist b−1 (b (n)) = #Mb(n) die Anzahl der Elemente von M, die kleiner oder gleich b (n) sind. Nach Konstruktion von b gibt es gerade n solcher Elemente. X E: Einfache Ergebnisse Seite 147 Die Folge (cn )n∈N enthält also dieselben Folgenglieder wie a?m m m∈M in derselben Reihen- folge. ? Die folgende Bemerkung zeigt, dass das Weyl–Kriterium im Prinzip direkt auf amm angewandt werden kann. m∈M Bemerkung E.4 Für alle h ∈ Z \ {0} ist lim N →∞ N X e (hcn ) n=1 N = lim N →∞ N e h· X m=2 m∈M a?m m . #MN Beweis: Sei h ∈ Z \ {0}. Es ist für alle N ∈ N N X n=1 e (hcn ) = N X n=1 e h· a?b(n) b (n) b(N ) ! = X m=2 m∈M a?m e h· . m Mit Bemerkung E.3 auf der vorherigen Seite, dem streng monotonen Wachstum von b und dem sich damit ergebenden streng monotonen Wachstum von b−1 folgt ? b−1 (M ) N M e h · am X X e (hcn ) X m e (hcn ) = lim = lim = 0. X lim M →∞ M →∞ #MM b−1 (M ) N →∞ N m=2 m∈M n=1 n=1 In Lemma 1.3 auf Seite 12 wurde der Realteil der mit ga · a?m m m∈M und g ∈ Z \ {0} gebildeten Exponentialsumme mit genügend vielen Summanden nach unten abgeschätzt. Damit folgt, dass der Realteil dieser Exponentialsumme im gleichen Maße wie die Anzahl ihrer Summanden n ? wächst. o Deshalb ist amm ∈ (0; 1) m ∈ M nicht im Weyl’schen Sinne gleichverteilt in (0; 1). Korollar E.5 (Satz 1.4) Behauptung: a?m ∈ (0; 1) m ∈ M ist nicht gleichverteilt im Intervall (0; 1). m Beweis: (i) Auswerten des Ergebnisses aus Lemma 1.3 mit Bemerkung E.4 Sei g ∈ Z \ {0}. Nach Lemma 1.3 auf Seite 12 gibt es ein C ∈ R+ und ein nur von g und M abhängiges N0 (g, M) ∈ N, so dass für alle N ∈ N mit N ≥ N0 (g, M) a?m N N a? X X e ga · m Re e ga · m ≥ C · #MN und damit Re ≥C m #MN m=2 m∈M gilt. m=2 m∈M Seite 148 Anhang Insbesondere ist lim Re N →∞ e ga · N X m=2 m∈M a?m m #MN ≥ C. Mit Bemerkung E.4 auf der vorherigen Seite folgt lim N →∞ N X e (gacn ) n=1 N N e ga · X = lim N →∞ a?m m #MN m=2 m∈M 6= 0. (ii) Anwenden des Weyl–Kriteriums 1.2 Das Weyl–Kriterium 1.2 auf Seite 11 liefert, dass { cn ∈ (0; 1)| n ∈ N} nicht gleichverteilt im Intervall (0; 1) ist. n ? o Mit { cn ∈ (0; 1)| n ∈ N} = amm ∈ (0; 1) m ∈ M (siehe Bemerkung E.3 auf Seite 146) folgt die Behauptung. X b: Gegenseitige Invertierung Aus §2 ist noch der Beweis zu Lemma 2.1 auf Seite 14 nachzuholen. Lemma E.6 (Lemma 2.1) Voraussetzungen: Seien a ∈ N \ {1} und m ∈ N \ {1} mit ggT (a, m) = 1. Behauptung: Dann gilt a?m a − m?a 1 = + . m a am Beweis: ? a−1 (i) a teilt m?a + amm Es gibt ein g ∈ Z und ein h ∈ Z mit a?m · a = 1 + gm m?a · m = 1 + ha. und Damit folgt a?m · a = (m?a · m − ha) + gm bzw. (a?m + h) · a = (m?a + g) · m. Wegen ggT (a, m) = 1 gibt es also ein ` ∈ Z mit (m?a + g) = `a. Multipliziert man diese Gleichung mit m, so erhält man m?a · m = `am − gm bzw. m?a · m = `am − (a?m · a − 1) , also m?a a? 1 =`− m + . a m ma E: Einfache Ergebnisse Seite 149 (ii) Bestimmung von ` aus 1 ≤ a?m < m und 1 ≤ m?a < a Nach Definition von ? ist 0 < m?a < a und mit (i) folgt 0<`− a?m 1 + < 1. m ma (E.1) Wegen a?m ≥ 1, m ≥ 1 und a > 1 gilt a?m 1 1 ≥ > > 0. m m ma Also ist 0 < a?m 1 a? − < m und mit a?m < m folgt m ma m 0< 1 a?m − < 1. m ma Durch Addition dieser Ungleichung zu Ungleichung (E.1) folgt 0 < ` < 2. Mit ` ∈ Z folgt ` = 1. Mit (i) ergibt sich m?a a? 1 =1− m + a m ma bzw. a?m a − m?a 1 = + . m a am X c: Fourierreihen In Teilabschnitt 2c (Intervalle von zu a teilerfremden Primzahlen) wird die Funktion 1α,β,ε,r in eine Fourierreihe entwickelt. In Teilabschnitt c von Anhang E sollen kurz die hierfür benötigten Eigenschaften von Fourierreihen referiert werden. Da in dieser Arbeit nicht mit der sin–cos–Form, sondern mit der e–Form der Fourierreihen gearbeitet wird, muss zunächst geklärt werden, was „Konvergenz einer Reihe über Z“ bedeuten soll. Definition E.7 Für diese Definition seien c : Z → C h 7→ ch und C ∈ C beliebig. a) ch heißt konvergent gegen C, wenn für alle ϑ ∈ R+ ein n0 (ϑ) ∈ h∈ Z n X ch − C < ϑ für alle n ∈ N0 mit n ≥ n0 (ϑ) ist. b) X X N0 existiert, so dass h=−n Z ch heißt konvergent, wenn es ein D ∈ C gibt, so dass h∈ c) X Z h∈ X h∈ ch heißt absolut konvergent, wenn X h∈ Z Z |ch | konvergent ist. ch konvergent gegen D ist. Seite 150 Anhang Die Konvergenz einer Reihe über Z ist damit im Prinzip auf die Konvergenz einer Reihe über N0 zurückgeführt. Hierzu stelle man sich zu einer gegebenen Folge über Z eine Folge über N0 vor, deren h–tes Folgenglied für h ∈ N gerade der Summe aus dem h–ten und dem (−h)–ten Folgenglied der Ursprungsfolge entspricht. Wie im Reellen folgt auch im Komplexen und damit bei den hier verwendeten Reihen über Z aus der absoluten Konvergenz einer Reihe die Konvergenz der Reihe. Bemerkung E.8 Ist c : Z → C h 7→ ch derart, dass X h∈ Z ch absolut konvergent ist, so ist X h∈ Z ch konvergent. Referenz: Siehe [FB, Satz 2.5 in Kapitel I auf Seite 18 der 3. Auflage]38 in Verbindung mit [He, Satz 31.4 auf Seite 192 der 13. Auflage]39 . X Es gilt sogar noch mehr. Aus der absoluten Konvergenz einer Reihe folgt bereits die absolute Konvergenz der mit ihren Summanden gebildete Fourierreihe auf ganz R. Lemma E.9 Voraussetzung: Sei c : Behauptung: X h∈ Z Z → C derart, dass h 7→ ch X Z ch absolut konvergent ist. h∈ ch · e (hx) ist für alle x ∈ R absolut konvergent. Beweis: Für alle x ∈ R und alle h ∈ Z ist |ch · e (hx)| = |ch | · |e (hx)| = |ch | . | {z } =1 n X Für alle x ∈ R und alle n ∈ N0 gilt also h=−n Damit folgt die absolute Konvergenz von X Z |ch · e (hx)| = n X |ch |. h=−n ch · e (hx) für alle x ∈ R aus der absoluten Kon- h∈ vergenz von X h∈ 38 Z ch . X „Funktionentheorie 1 “, E. Freitag und R. Busam, Springer (Berlin, Heidelberg, New York — 1993), Satz 2.5 in Kapitel I auf Seite 18 der 3. Auflage 39 „Lehrbuch der Analysis — Teil 1 “, H. Heuser, B.G. Teubner GmbH (Stuttgart, Leipzig, Wiesbaden — 2000 (13. Auflage)) E: Einfache Ergebnisse Seite 151 Die entscheidenden Eigenschaften von 1α,β,ε,r , die dazu führen, dass die Umformungen aus Teilabschnitt 2c (Intervalle von zu a teilerfremden Primzahlen) erlaubt sind, sind die Stetigkeit und die Beschränktheit der Fourier–Koeffizienten, da diese die Konvergenz der Fourierreihe bereits bedingen. Die Werte einer Funktion entsprechen den Werten der zugehörigen Fourierreihe, wenn die Funktion stetig ist und die Reihe konvergiert. Hilfssatz E.10 Voraussetzungen: Seien p ∈ R und f : + R → C x 7→ f (x) mit f (x + p) = f (x) für alle x ∈ R derart, dass Zp |f (t)| dt existiert. 0 p Sei x ∈ R derart, dass f in x stetig ist und XZ h∈ Z0 ht hx f (t) · e − dt · e konvergiert. p p p Behauptung: Dann ist f (x) = XZ h∈ Z0 ht hx f (t) · e − dt · e . p p Referenz: Siehe [To, Satz 4. in §4. von Kapitel VI auf Seite 152 der 1. Auflage (Beachte auch §14. von Kapitel I und §15. von Kapitel I)]40 . X Um von der Beschränktheit der Fourier–Koeffizienten von 1α,β,ε,r auf die Konvergenz der Fourierreihe zu schließen, wird noch das sogenannte „Monotoniekriterium“ für die Konvergenz von Reihen benötigt. Bemerkung E.11 (Monotoniekriterium für die Konvergenz von Reihen) Sind c : X Z Z → R+ ∪ {0} h 7→ ch und M ∈ R ∪ {0} mit + n X ch ≤ M für alle n ∈ N0 , so ist h=−n ch konvergent. h∈ Referenz: Siehe [He, 23.1 Monotonieprinzip auf Seite 155 der 13. Auflage]41 . Damit sind sämtliche Vorarbeiten erledigt um die Gleichheit von Fourierreihe einzusehen. 40 X 1α,β,ε,r mit ihrer „Fourierreihen“, G. P. Tolstow, VEB Deutscher Verlag der Wissenschaften (Berlin — 1955), Satz 4. in §4. von Kapitel VI auf Seite 152 der 1. Auflage Original in „Rdy Fur~e“, G. P. Tolstov, Gosudarstvennoe izdatel~stvo fiziko–matematiqesko literatury (Moskva — 1951) 41 „Lehrbuch der Analysis — Teil 1 “, H. Heuser, B.G. Teubner GmbH (Stuttgart, Leipzig, Wiesbaden — 2000 (13. Auflage)), 23.1 Monotonieprinzip auf Seite 155 der 13. Auflage Seite 152 Anhang Korollar E.12 Voraussetzungen: Seien r ∈ N, α ∈ R, β ∈ R und ε ∈ R+ mit 0 < α < β < 1 und ε ≤ min {2α, 2 − 2β; β − α}. Behauptung: Für alle x ∈ R ist 1 XZ 1α,β,ε,r (x) = h∈ Z0 1α,β,ε,r (t) · e (−ht) dt · e (hx). Beweis: X (i) Die Konvergenz von |ch | Z → C Z1 Sei c : h 7→ ch := 1α,β,ε,r (t) · e (−ht) dt . 0 Für alle h ∈ Z \ {0} ist wegen |h| ≥ 1 und r ≥ 1 1 Z 1 1 rr rr · 2. ≤ |ch | = 1α,β,ε,r (t) · e (−ht) dt ≤ r+1 r · r+1 r+1 r π ε |h| π ε |−h| 0 Für alle n ∈ N0 folgt mit c0 = Z1 1α,β,ε,r (t) dt = β − α 0 n X |ch | = |c0 | + h=−n n X |ch | + n X h=1 = β−α+ ≤ β−α+ |c−h | h=1 h=1 ≤ |β − α| + n X n rr π r+1 εr 2rr π r+1 εr · · n X h=1 X rr 1 1 + · 2 2 r+1 r h π ε h h=1 1 h2 2rr · L (2, χ0,1 ) . X Nach Bemerkung E.11 auf der vorherigen Seite ist |ch | konvergent. π r+1 εr h∈ Z (ii) Beweis der Behauptung X Wegen (i), Lemma E.9 auf Seite 150 und Bemerkung E.8 auf Seite 150 ist ch · e (hx) für alle x ∈ R konvergent. Ferner ist Z h∈ 1α,β,ε,r ist für alle x ∈ R in x stetig. Z1 0 |1α,β,ε,r (t)| dt = Z1 1α,β,ε,r (t) dt = β − α. 0 Nach Hilfssatz E.10 auf der vorherigen Seite ist 1α,β,ε,r (x) = X h∈ Z ch · e (hx) für alle x ∈ R. X E: Einfache Ergebnisse Seite 153 d: Von ψ ( · ; · , · ) zu π ( · ; · , · ) Im folgenden Lemma wird mit Hilfe von partieller Summation gezeigt, wie man von den Werten von ψ ( · ; q, `) mit q ∈ Z und ` ∈ Z auf die Werte von π ( · ; q, `) schließen kann. Lemma E.13 (Bemerkung 5.3) Behauptung: Für alle q ∈ N, alle ` ∈ Z und alle x ∈ R mit x ≥ 2 ist ψ (x; q, `) π (x; q, `) = + ln (x) Zx √ ψ (t; q, `) dt + O x . t · ln2 (t) 2 Beweis: (i) Abschätzung der Summanden zu echten Primzahlpotenzen in ψ ( · ; q, `) Seien q ∈ N und ` ∈ Z. Nach dem Satz von Qebyxv C.7 auf Seite 133 gibt es eine Konstante Q ∈ R+ mit √ X T P N ln (p) ≤ j p=2 p∈ P (p,k) ∈ ×( \{1}) pk ≤x, pk ≡` (mod q) ln(x) xc ln(p) bX X √ k ln (p) < xc bX p=2 p∈ P k=2 ln (x) ln (p) · ln (p) √ √ x √ ≤ ln (x) · # p ∈ P| p ≤ x ≤ ln (x) · Q · ln ( x) √ = 2Q · x für alle x ∈ R mit x ≥ 2. Damit folgt für alle x ∈ R mit x ≥ 2 bxc X p=2 p∈ p≡` (mod q) P ln (p) = X T P N (p,k) ∈ × pk ≤x, pk ≡` (mod q) = ψ (x; q, `) + O X ln (p) − T P N ln (p) (p,k) ∈ ×( \{1}) pk ≤x, pk ≡` (mod q) √ x . (ii) Beweis mittels partieller Summation der Behauptung R → R Sei f : stetig differenzierbar mit x 7→ f (x) f (x) = 1 ln (x) für alle x ∈ R mit x ≥ 2. f existiert, weil das multiplikative Inverse des ln auf { x ∈ R| x > 1} stetig differenzierbar ist. Damit kann es insbesondere ab jedem x ∈ R mit x > 1 stetig differenzierbar nach links fortgesetzt werden. Es ist f 0 (x) = − 1 x · ln2 (x) für alle x ∈ R mit x > 2. Seite 154 Anhang Mit partieller Summation C.3 auf Seite 128 folgt für alle x ∈ R mit x ≥ 2 wegen (i) bxc X π (x; q, `) = 1= p=2 p∈ p≡` (mod q) p=2 p∈ p≡` (mod q) P 1 = · ln (x) bxc X P ln (p) ln (p) Zx bxc X ln (p) − p=2 p∈ p≡` (mod q) P 1 btc X f 0 (t) · dt ln (p) p=2 p∈ p≡` (mod q) P | {z } = 0 für 1≤t<2 √ = ψ(t;q,`)+O( t) für t≥2 √ √ Zx ψ (t; q, `) + O t ψ (x; q, `) + O ( x) dt = + ln (x) t · ln2 (t) 2 x √ √ Zx Z ψ (x; q, `) ψ (t; q, `) x t = + dt + O +O dt . ln (x) ln (x) t · ln2 (t) t · ln2 (t) 2 2 Damit folgt die Behauptung aus der für alle x ∈ R mit x ≥ 2 gültigen Ungleichung Zx √ t t · ln2 (t) 2 dt ≤ √ Zx x· 2 √ 1 dt = x · 2 t · ln (t) 1 1 − ln (2) ln (x) . X Literaturverzeichnis [Br] „Einführung in die analytische Zahlentheorie“, J. Brüdern, Springer (Berlin, Heidelberg, New York — 1995) [Da] „Multiplicative Number Theory“, H. Davenport, Markham Publishing Company (Chicago — 1967) [Es] „On Kloosterman’s Sum“, T. Estermann, Mathematika 8 (1961), Seiten 83 bis 86 [FB] „Funktionentheorie 1 “, E. Freitag und R. Busam, Springer (Berlin, Heidelberg, New York — 1993) [HB] „Zero density estimates for the Riemann zeta-function and Dirichlet L–functions“, D. R. Heath–Brown, Journal of the London Mathematical Society – Series 2 19 (1979), Seiten 221 bis 232 [He] „Lehrbuch der Analysis — Teil 1 “, H. Heuser, B.G. Teubner GmbH (Stuttgart, Leipzig, Wiesbaden — 2000 (13. Auflage)) [Ho] „Applications of sieve methods to the theory of numbers“, C. Hooley, Cambridge University Press (Cambridge — 1976) [Hu] „Introduction to number theory“, Hua L. K., Springer (Berlin, Heidelberg, New York — 1982) [Hx] „Large values of Dirichlet polynomials, III “, M. N. Huxley, Acta Arithmetica 26 (1975), Seiten 435 bis 444 [IK] „Colloquium Publications Volume 53 — Analytic Number Theory“, H. Iwaniec und E. Kowalski, American Mathematical Society (Providence, Rhode Island — 2004) [Kö] „Analysis 2 “, K. Königsberger, Springer (Berlin, Heidelberg, New York — 1993) [Ko] „Incomplete Kloosterman sums and their applications“, M. A. Korolev, Izvestiya: Mathematics 64 (2000), Seiten 1129 bis 1152 Original in „Nepolnye summy Kloostermana i ih priloeni “, M. A. Korolv, Izvesti Rossisko akademii nauk. Seri Matematiqeska 64 (2000), Seiten 41 bis 64 von Teil 6 [La] „Handbuch der Lehre von der Verteilung der Primzahlen.“, E. Landau, B.G. Teubner GmbH (Leipzig — 1909) [Mo] „Lecture Notes in Mathematics 227 — Topics in multiplicative number theory“, H. L. Montgomery, Springer (Berlin, Heidelberg, New York — 1971) [MV] „Cambridge studies in advanced mathematics 97 — Multiplicative Number Theory I. Classical Theory“, H. L. Montgomery und R. C. Vaughan, Cambridge University Press (New York — 2007) Dissertation von Simon Feiler zum Thema Die relative Verteilung der Inversen einer natürlichen Zahl zu variablen Moduln Seite 156 Literaturverzeichnis [Pr] „Grundlagen der mathematischen Wissenschaften 91 — K. Prachar, Springer (Berlin, Göttingen, Heidelberg — 1957) Primzahlverteilung“, [Ti] „The theory of the Riemann zeta–function“, E. C. Titchmarsh, Oxford University Press (London — 1951) [To] „Fourierreihen“, G. P. Tolstow, VEB Deutscher Verlag der Wissenschaften (Berlin — 1955) Original in „Rdy Fur~e“, G. P. Tolstov, Gosudarstvennoe izdatel~stvo fiziko– matematiqesko literatury (Moskva — 1951) [Va] „An elementary method in prime number theory“, R. C. Vaughan, Acta Arithmetica 37 (1980), Seiten 111 bis 115 [Vi] „The method of trigonometric sums in the theory of numbers“, I. M. Vinogradov, Interscience Publishers (New York — 1954) Original in „Metod trigonometriqeskih summ v teorii qisel“, I. M. Vinogradov, Trudy Matematiqeskogo instituta AN SSSR 23 (1947), Seiten 1 bis 111 [We] „Über die Gleichverteilung von Zahlen mod. Eins“, H. Weyl, Mathematische Annalen 77 (1916), Seiten 313 bis 352 Literaturverzeichnis Seite 157 [cgz] „The distribution of patterns of inverses modulo a prime“, C. I. Cobeli, S. M. Gonek und A. Zaharescu, Journal of Number Theory 101 (2003), Seiten 209 bis 222 [cvz] „Distribution of gaps between the inverses mod q“, C. I. Cobeli, M. Vâjâitu und A. Zaharescu, Proceedings of the Edinburgh Mathematical Society 46 (2003), Seiten 185 bis 203 [dfi] „Equidistribution of roots of a quadratic congruence to prime moduli“, W. Duke, J. B. Friedlander und H. Iwaniec, Annals of Mathematics 141 (1995), Seiten 423 bis 441 [h1] „On the number of divisors of quadratic polynomials“, C. Hooley, Acta Mathematica 110 (1963), Seiten 97 bis 114 [h2] „On the distribution of the roots of polynomial congruences“, C. Hooley, Mathematika 11 (1964), Seiten 39 bis 49 [lz] „General Kloosterman Sums and the Difference Between an Integer and Its Inverse Modulo Q“, H. Liu und W. Zhang, Acta Mathematica Sinica, English Series 23 (2007), Seiten 77 bis 82 [v] „Sommes trigonométriques sur les nombres premiers“, R. C. Vaughan, Comptes Rendus Hebdomadaires des Séances de l’Académie des Sciences. Séries A et B 285 (1977), Seiten A981 bis A983 [z1] „On the Difference between an Integer and Its Inverse Modulo n“, W. Zhang, Journal of Number Theory 52 (1995), Seiten 1 bis 6 [z2] „On the distribution of inverse modulo p (II)“, W. Zhang, Acta Arithmetica 100 (2001), Seiten 189 bis 194 [zz] „A generalization on the difference between an integer and its inverse modulo q (II)“, T. Zhang und W. Zhang, Proceedings of the Japan Academy (Series A) 81 (2005), Seiten 7 bis 11