Experimente in der Zahlentheorie

Werbung
Staatsexamensarbeit
Experimente in der Zahlentheorie:
Teilbarkeit, Quadratfreiheit und Primzahlverteilung
Frank Jahn
1
Inhaltsverzeichnis
1 Einleitung
1.1 Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2 Danksagung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2 Wahrscheinlichkeiten für Teilerfremdheit und Quadratfreiheit
2.1 Die Riemannsche Zetafunktion . . . . . . . . . . . . . . . . .
2.2 Die Funktionen ϕ(n) und µ(n) . . . . . . . . . . . . . . . . .
2.3 Asymptotische Äquivalenz und mittlere Ordnung . . . . . . .
2.4 Wahrscheinlichkeiten für Teilerfremdheit und Quadratfreiheit
3 Der
3.1
3.2
3.3
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
4
4
5
6
6
10
14
18
Primzahlsatz
22
Die Funktionen Φ(s) und ϑ(x) . . . . . . . . . . . . . . . . . . . . . . . . 22
Das analytische Theorem von Newman . . . . . . . . . . . . . . . . . . . . 29
Der Primzahlsatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
4 Die durchschnittliche Anzahl an Primfaktoren
37
4.1 Die Sätze von Mertens . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
4.2 Die durchschnittliche Anzahl an Primfaktoren . . . . . . . . . . . . . . . . 43
5 Zahlentheoretische Probleme in der Schule
48
5.1 Wahrscheinlichkeiten für Teilerfremdheit und Quadratfreiheit . . . . . . . 48
5.2 Der Primzahlsatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
5.3 Die durchschnittliche Anzahl an Primfaktoren . . . . . . . . . . . . . . . . 68
Symbolverzeichnis
73
Literaturverzeichnis
74
2
Eidesstattliche Erklärung
Ich versichere hiermit, dass ich die Arbeit selbständig angefertigt habe und keine anderen
als die angegebenen Quellen und Hilfsmittel benutzt habe.
3
1 Einleitung
1.1 Einleitung
Die Zahlentheorie gilt als die mathematische Königsdisziplin und bringt oft einfach
verständliche, jedoch schwer zu beweisende Aussagen zum Vorschein. Gerade im schulischen Bereich verzichtet man daher wegen Zeitmangel und fehlenden Leitfäden für die
Unterrichtsgestaltung komplett auf dieses große Feld der Mathematik. In dieser Staatsexamensarbeit werden deshalb interessante und einfach zu formulierende Aussagen aus
der sogenannten elementaren Zahlentheorie“aufgegriffen und aufbereitet. Wir begin”
nen im zweiten Kapitel die beiden Eigenschaften Quadratfreiheit und Teilerfremdheit zu
untersuchen und werden zu einem verblüffenden Ergebnis kommen. Im dritten Kapitel
steht die Primzahlfunktion im Mittelpunkt, die die Mathematiker bis heute beschäftigt,
und im nachfolgenden Kapitel untersuchen wir das Wachstum der Primfaktoren. Im
letzten Teil der Arbeit werden die Themen aus den vorherigen Abschnitten erneut aufgegriffen und in einer für Schüler angemessenen Form präsentiert. Diese Arbeit kann
und soll auch als Anleitung und Anregung für Lehrer verstanden werden, diese Themen
zum Inhalt einer Mathematik AG in der Oberstufe zu machen. Deswegen sind an vielen
Stellen didaktische Hinweise zu finden, wie man den Schülern die nicht immer einfachen
Aussagen trotz fehlendem Vorwissen veranschaulichen kann. Auch leitet diese Arbeit
zum Experimentieren an, denn kaum ein Mathematiker findet Lösungen für Probleme,
ohne verschiedene Methoden und Verfahren auszuprobieren und sie dann so zu wählen,
dass er auf eine möglichst einfache Art und Weise ein Ergebnis erzielt. Gerade in der
heutigen Zeit bietet es sich an, mit Schülern an Computern besondere Eigenschaften
von Funktionen herauszuarbeiten und graphisch darzustellen, um somit Vermutungen
aufzustellen, welche dann bewiesen werden.
Für die ganze Arbeit gelten, wenn nicht anders angegeben, folgende Notationen:
•
•
•
•
•
•
N := {1, 2, 3, . . . }
N0 := {0} ∪ N
P := {n ∈ N|n ist Primzahl}
R+ := {x ∈ R|x > 0}
Sei x ∈ R, dann ist [x] definiert als der ganzzahlige Anteil von x und {x} := x−[x].
Seien m, n ∈ N, dann bedeutet m|n, dass m ein Teiler von n ist.
4
1.2 Danksagung
Ich bedanke mich an erster Stelle bei Herrn Professor Gekeler für das sehr interessante
Thema und die exzellente Betreuung während des ganzen Studiums. Weiterhin bedanke ich mich bei Johannes Lengler für die vielen Ratschläge und Diskussionen, die diese
Arbeit entscheidend geprägt haben. Nicht zuletzt bedanke ich mich bei meiner Freundin
Luisa Kleine, die mit ihrem sprachlichen Talent so manche Formulierung entscheidend
verbessert hat und natürlich bei meinen Eltern, die mich während meines ganzen Studiums stets unterstützt und motiviert haben.
5
2 Wahrscheinlichkeiten für Teilerfremdheit
und Quadratfreiheit
In diesem Kapitel interessieren wir uns vor allem für die Wahrscheinlichkeiten, mit denen zwei zufällig ausgewählte Zahlen teilerfremd sind, bzw. eine zufällig ausgewählte
Zahl quadratfrei ist. Auf den ersten Blick haben die beiden Eigenschaften Teilerfremd”
heit“und Quadratfreiheit“nicht viel gemeinsam, jedoch wird sich im Laufe des Kapitels
”
herausstellen, dass auf der Ebene der Wahrscheinlichkeiten enge Zusammenhänge bestehen. Bevor wir uns jedoch die Probleme genauer betrachten, befassen wir uns mit den Eigenschaften der Riemannschen Zetafunktion, da uns diese im Laufe der Beweisführungen
immer wieder begegnen wird. In vielen Beweisen des Kapitels halten wir uns grob an
die unausgearbeitete Vorgehensweise von [GEKELER] in Kap.7 & 11, falls nicht, wird
darauf hingewiesen.
2.1 Die Riemannsche Zetafunktion
2.1.1 Definition
Die Funktion
ζ(s) =
∞
X
n−s =
n=1
X
n∈
N
n−s
C
heißt Riemannsche Zetafunktion. Sie ist definiert für s ∈ , Re(s) > 1, und die Summe
konvergiert für diese s absolut (Beweis siehe [EDWARDS] Kap. 1.4).
Der folgende Satz über ζ(s) ist von großer Bedeutung für unsere gesuchten Aussagen
und wurde erstmals von Euler im Jahr 1735 gezeigt.
2.1.2 Satz
Es gilt
ζ(2) =
π2
.
6
Um diese Aussage zu beweisen, zeigen wir zunächst das folgende Lemma:
6
2.1.3 Lemma
Sei 4 = {(u, v) ∈ 2 |u, v ≥ 0, u + v ≤ π2 } mit Innerem
I := (0, 1) das Einheitsintervall. Dann
4̊ = {(u, v) ∈ 2 |u, v > 0, u + v < π2 } und sei ˚
ist die Abbildung
sin u sin v
Φ : (u, v) 7→
,
cos v cos u
R
R
eine Bijektion von 4̊ nach ˚
I ×˚
I = (0, 1) × (0, 1).
Beweis.
Der Cosinus ist auf (0, π2 ) streng monoton fallend. Deshalb folgt aus v <
π
cos(v) > cos
− u = sin u,
2
π
2
− u:
sin u
sin v
d.h. cos
v < 1. Analog folgt cos u > 1, da der Sinus in diesem Intervall streng monoton
sin v
sin u
wachsend ist. Wir setzen nun x := cos
v , y := cos u und erhalten:
sin2 u = x2 cos2 v
und
sin2 v = y 2 cos2 u
Da 1 = cos2 v+sin2 v gilt, können wir sin2 v ersetzen und einige Umformungen durchführen:
1 = cos2 v + y 2 cos2 u
⇔ cos2 v = 1 − y 2 cos2 u
⇔ cos2 v = 1 − y 2 (1 − sin2 u)
⇔ cos2 v = 1 − y 2 (1 − x2 cos2 v)
⇔ (1 − x2 y 2 ) cos2 v = 1 − y 2
s
1 − y2
⇔ cos v =
1 − x2 y 2
Schließlich bekommen wir:
s
v = arccos
1 − y2
1 − x2 y 2
!
1 − x2
1 − x2 y 2
!
.
(2.1)
.
(2.2)
Analog erhält man aus 1 = cos2 u + sin2 u:
s
u = arccos
Die Gleichungen (2.1) und (2.2) liefern uns somit das Linksinverse Φ−1 zu Φ.
7
Um zu zeigen, dass Φ−1 auch Rechtsinverse zu Φ ist, rechnen wir nach, dass Φ◦Φ−1 = id
gilt. Wir erhalten also:
s
s
!
!!
2
1
−
x
1 − y2
−1
Φ ◦ Φ (x, y) = Φ arccos
, arccos
1 − x2 y 2
1 − x2 y 2

q

q
1−y 2
1−x2
sin
arccos
sin
arccos
1−x2 y 2
1−x2 y 2


q

=
,
q
2
1−y
1−x2
cos arccos
cos arccos
1−x2 y 2
1−x2 y 2
r

r
q
q

1−y 2
1−x2
2 arccos
2 arccos
1
−
cos
1
−
cos
1−x2 y 2
1−x2 y 2



q
q
=
,


2
1−x2
1−x2 y 2
1−y
1−x2 y 2
q
1−
= q
1−x2
1−x2 y 2
1−y 2
1−x2 y 2
q
1−
, q
1−y 2
1−x2 y 2
1−x2
1−x2 y 2


q
q

1−y 2
1−x2
y 2 1−x
x2 1−x
2 y2
2 y2

= q
, q
2
1−x2
1−x2 y 2
1−y
1−x2 y 2
= (x, y) .
Hierbei können wir auf Betragsstriche verzichten, da x und y stets positiv sind. Also ist
Φ−1 Links- und Rechtsinverses und somit Umkehrabbildung zu Φ.
Nun können wir Satz 2.1.2 beweisen:
2.1.4 Beweis von Satz 2.1.2
Der folgende Beweis stammt von Calabi aus dem Jahr 1985. Er besteht darin, das Doppelintegral über die Funktion 1−x12 y2 auf zwei verschiedene Arten zu berechnen. Hierfür
sei I = [0, 1] und I = [0, 1 − ] mit 1 > > 0.
1. Es gilt:
∞
X
x2 y 2
i
i=0
=
1
, ∀(x, y) ∈ I × I .
1 − x2 y 2
Mit der Summenformel der geometrischen Reihe
∞
X
i=0
qi =
1
mit |q| < 1
1−q
8
folgt dies direkt, wenn wir q = x2 y 2 setzen. Insbesondere ist dann die Voraussetzung an q erfüllt, da x und y in I liegen sollen, und die Summe ist absolut konvergent. Mit Hilfe dieser Umformung und der absoluten Konvergenz (∗) können wir
schreiben:
Z Z
Z Z X
∞
1
dxdy =
1 − x2 y 2
I I
(∗)
=
I I
∞ Z
X
i=0
i=0 I
I
Z
=
x2 y 2
i
dxdy
x2i y 2i dxdy
∞
X
(1 − )2i+1
(2i + 1)2
i=0
Obige Summe ist ebenfalls absolut konvergent (#), da der Zähler betragskleiner
als eins ist und der Nenner quadratisch wächst. Wir erhalten nun das gesuchte
Integral, wenn wir gegen 0 gehen lassen:
Z Z
Z Z
1
1
dxdy = lim
dxdy
2
2
→0
1−x y
1 − x2 y 2
I
I
= lim
I I
∞
X
→0
(#)
=
i=0
∞
X
i=0
(1 − )2i+1
(2i + 1)2
1
(2i + 1)2
Dies ist eine Summe über die quadratischen Kehrwerte aller ungeraden natürlichen
Zahlen. Diese können wir so ausdrücken, dass wir die Summe über alle natürlichen
Zahlen nehmen und davon die die Summe der geraden natürlichen Zahlen wieder
abziehen. Es ergibt sich also:
X
i≥0
X 1
X 1
1
1 X 1
3
=
−
= 1− 2
= ζ(2).
2
2
2
2
(2i + 1)
n
(2n)
2
n
4
N
N
n∈
n∈
n∈
N
2. Nun verwenden wir die Bijektion Φ aus Lemma 2.1.3, um das Integral mit Hilfe einer Koordinatentransformation zu berechnen. Dazu benötigen wir zuerst die
Jacobi-Matrix JΦ (u, v). Hierbei benutzen wir direkt die Notationen wie im Lemma,
sin u
sin v
also x = cos
v und y = cos u . Dann ist
 ∂x
JΦ (u, v) = 
∂u
∂x 
∂v
∂y
∂u
∂y
∂v

=
9
cos u
cos v
sin u sin v
cos2 v
sin v sin u
cos2 u
cos v
cos u


die gesuchte Jacobi-Matrix mit Determinante
det (JΦ (u, v)) =
cos u cos v sin u sin v sin v sin u
sin2 u sin2 v
·
−
·
=
1−
·
= 1−x2 y 2 .
cos v cos u
cos2 v
cos2 u
cos2 v cos2 u
Führen wir nun die Koordinatentransformation Φ aus, so wird I × I nach
4 = {(u, v) ∈ 2 |u, v ≥ 0, u + v ≤ π2 } abgebildet. Also gilt:
R
Z Z
I
1
dxdy =
1 − x2 y 2
Z
det (JΦ (u, v))
dudv =
1 − x2 y 2
4
I
Z
1 π π
π2
dudv = Fläche von 4 = · · =
2 2 2
8
4
3. Vergleichen wir nun die Ergebnisse von 1. und 2., so erhalten wir
3
ζ(2) =
4
Z Z
I
d.h. ζ(2) =
1
π2
dxdy
=
,
1 − x2 y 2
8
I
π2
6 .
2.2 Die Funktionen ϕ(n) und µ(n)
Bevor wir beginnen können, konkrete Überlegungen zu Wahrscheinlichkeiten durchzuführen, betrachten wir zunächst zwei besondere Funktionen. Beide haben Eigenschaften, die von Natur aus interessant sind und uns zusätzlich helfen, in späteren Beweisen
Aussagen umzuformen. Ziel des Abschnitts wird darüber hinaus sein, eine Transformationsformel zu beweisen, welche auf den deutschen Mathematiker August Ferdinand
Möbius zurückgeht.
2.2.1 Definition
Es sei für n ∈ definiert:
N
ϕ(n) := #{d ∈
Die Funktion ϕ :
N|1 ≤ d ≤ n;
ggT (d, n) = 1}.
N → N heißt Eulersche ϕ-Funktion.
Eine interessante und nützliche Eigenschaft der oben definierten Funktion erhalten wir,
wenn wir die Summe der Funktionswerte ϕ(d) aller Teiler einer Zahl n betrachten. Auskunft darüber gibt das folgende Lemma, welches uns in späteren Beweisen noch von
Nutzen sein wird.
10
2.2.2 Lemma (Summe über ϕ(n))
Es gilt für n ∈ :
N
X
ϕ(d) = n.
d|n
Beweis.
Wir definieren für d|n die Menge S(d) := {i ∈ | 1 ≤ i ≤ n; ggT (i, n) = d}. Dann ist
.
S
#S(d) = ϕ nd nach Definition von S(d) und
S(d) = {1, 2, 3, . . . , n}.
N
d|n
Die Disjunktheit (∗) folgt aus folgendem Widerspruch:
Angenommen es existierte ein i ∈ , sodass i ∈ S(d1 ) und i ∈ S(d2 ) mit d1 6= d2 , wobei
d1 und d2 Teiler von n sind. Dann würde gelten:
N
ggT (i, n) = d1 , da i ∈ S(d1 ) und ggT (i, n) = d2 , da i ∈ S(d2 ).
Also folgt d1 = d2 im Widerspruch zur Annahme, da der größte gemeinsame Teiler
eindeutig bestimmt ist.
Nun gilt:
.
[
X n
(∗) X
n=#
S(d) =
#S(d) =
ϕ
.
d
d|n
d|n
d|n
Es ist nun aber egal, ob d alle Teiler von n durchläuft und man ϕ nd betrachtet, oder
ob d0 := nd alle Teiler von n durchläuft und man ϕ(d0 ) betrachtet. Somit ergibt sich:
X n X
X
n=
=
ϕ
ϕ(d0 ) =
ϕ(d).
d
0
d |n
d|n
d|n
Bevor wir uns der zweiten namensgebenden Funktion dieses Abschnitts zuwenden, definieren wir zwei Funktionen, die uns eine einfachere Darstellunge erlauben und auf die
wir insbesondere in Kapitel 4 wieder zurückkommen werden.
2.2.3 Definition
Q ep
Für n =
p , ep ∈
p∈
P
N0 definieren wir die beiden Funktionen
N → N0
ω:
n 7→ #{p ∈
11
P| ep 6= 0}
N → N0
Ω:
n 7→
X
P
ep .
p∈
Also beschreibt ω(n) die Anzahl verschiedener Primfaktoren und Ω(n) die Anzahl der
Primfaktoren unter Berücksichtigung der Vielfachheiten ep .
Nun führen wir die zweite wichtige Funktion ein, die ein essentieller Bestandteil der
Transformationsformel sein wird.
2.2.4 Definition
Für n ∈ sei die Funktion µ :
N
N0 → {±1, 0} definiert als:
(
(−1)ω(n)
n 7→
0
n quadratfrei
sonst.
Die Funktion µ heißt Möbius-Funktion und offensichtlich ist sie schwach multiplikativ,
d.h. für zwei natürliche Zahlen m, n mit ggT (m, n) = 1 gilt:
µ(m · n) = µ(m)µ(n).
Auch hier ist das Betrachten der Summe über die µ(n) analog zu der Summe über die
ϕ(n) in Lemma 2.2.2 interessant und nützlich zugleich.
2.2.5 Lemma (Summe über µ(d))
Für n ∈ gilt:
N
X
d|n
(
1
µ(d) =
0
n=1
n 6= 1.
Beweis.
Wir beweisen die Aussage mit vollständiger Induktion über ω(n).
Induktionsanfang:
Die Aussage
ω(n) = 0 ⇔ n = 1
12
ist richtig, da 1 die einzige Zahl ist, bei der die Vielfachheiten der Primzahlen in der
eindeutigen Produktdarstellung alle Null sind. Also gilt natürlich auch
X
µ(d) = (−1)0 = 1.
d|1
Ebenso gilt
ω(n) = 1 ⇒ n = pep , ep > 0
und damit ist
X
d|n
µ(d) =
X
µ(d) = µ(1)+µ(p)+µ(p2 )+· · ·+µ(pep ) = 1+(−1)+0+· · ·+0 = 0. (IV )
d|pep
Induktionsschritt: n → n + 1, n ≥ 1
N
Für ω(n) > 1, d.h. n = pep · m mit m ∈ \{1} und p 6 | m ergibt sich, da man die Teiler
von n in beliebiger Reihenfolge durchlaufen kann und die Möbius-Funktion schwach
multiplikativ (∗) ist:
X
X X
µ(d0 · d00 )
=
d0 |pep d00 |m
d|n
(∗)
=
X X
µ(d0 )µ(d00 )
d0 |pep d00 |m

=
 
X
µ(d0 ) · 
d0 |pep
= 0·
µ(d00 )
d0 |m

IV

X

X
µ(d00 )
d0 |m
= 0.
Schließlich können wir die Transformationsformel der Möbius-Inversion herleiten, die uns
im nächsten Abschnitt einen Beweis erleichtern wird.
2.2.6 Satz (Möbius-Inversion)
Sind f, F zwei arithmetische Funktionen, also Abbildungen von den natürlichen in die
reellen Zahlen, so sind äquivalent:
13
1. F (n) =
P
f (d) ∀n ∈
d|n
2. f (n) =
P
µ(d)F
d|n
n
d
N,
∀n ∈
N.
Beweis.
Sei 1. erfüllt, dann gilt, da es egal ist, in welcher Reihenfolge man die Teiler von n
durchläuft:
X
d|n
µ(d)F
n
d
=
X
d|n


X
X
X
X
2.2.5
f (k)
µ(d) 
µ(d)f (k) =
f (k) =
µ(d) = f (n).
k| n
d
k,d
kd|n
k|n
d| n
k
Die Umkehrung ergibt sich analog.
2.3 Asymptotische Äquivalenz und mittlere Ordnung
Mit Hilfe der im vorherigen Abschnitt gewonnenen Erkenntnisse können wir jetzt die Begriffe asymptotische Äquivalenz“ und mittlere Ordnung“ einführen. Mit diesen werden
”
”
wir in der Lage sein, eine Art Erwartungswert bzw. erwartetes Verhalten für Funktionen
anzugeben, was uns nicht nur in diesem Kapitel behilflich sein wird.
2.3.1 Definition
Zwei Funktionen f und g auf einer nach oben unbeschränkten Menge D ⊆
asymptotisch äquivalent, falls gilt
R heißen
f (x)
= 1.
x→∞ g(x)
lim
Wir schreiben hierfür f ∼ g. Weiter schreiben wir f = O(g), wenn es ein c ∈
ein x0 ∈ D gibt, sodass für alle x > x0 aus D gilt:
|f (x)| ≤ c|g(x)|.
Das Symbol O(g) heißt Landau-Symbol.
2.3.2 Definition
Seien f, g reelle Funktionen. Dann hat f mittlere Ordnung g, falls gilt:
X
f (n) ∼
n≤x
X
n≤x
14
g(n).
R+ und
Da die mittlere Ordnung ein Konzept aus der Heuristik ist, machen wir folgende Bemerkung.
2.3.3 Bemerkung (Mittlere Ordnung)
Genau genommen gibt es nicht die“ mittlere Ordnung, sondern unter Umständen belie”
big viele. Die Funktion g aus der Definition beschreibt nämlich lediglich den Mittelwert
von f in einer Umgebung von x, welcher nicht zwangsläufig nur durch g gut approximiert
werden kann. Da wir jedoch in unserem Vorgehen stets auf eine bestimmte Ordnung hinaus wollen, sprechen wir trotzdem von der“ mittleren Ordnung einer Funktion.
”
In den nächsten Teilen des Kapitels tauchen nun oft unendliche Produkte auf, wesewegen
wir zur absoluten Konvergenz dieser eine Bemerkung machen.
2.3.4 Bemerkung (Absolute Konvergenz unendlicher Produkte)
∞
Q
(1 + an ) ein unendliches Produkt. Man kann zeigen (siehe [JAENICH] Kap.
Sei P :=
n=1
9), dass das Produkt P genau dann absolut konvergiert, wenn die Reihe
∞
P
an absolut
n=1
konvergiert. Insbesondere dürfen wir bei absoluter Konvergenz von Prdukten ebenso
umordnen, wie wir es von absolut konvergenten Summen gewöhnt sind.
Um nun die mittlere Ordnung von ϕ(n) ausrechnen zu können, brauchen wir noch ein
Lemma:
2.3.5 Lemma
Es gilt:
Y
1 −1
ζ(2) =
1− 2
.
p
P
p∈
Beweis.
Die Aussage ist der Spezialfall s = 2 des später bewiesenen Satzes 3.1.2.
Jetzt können wir die mittlere Ordnung von ϕ(n) berechnen, welche entscheidend für den
nächsten Abschnitt sein wird und uns wieder auf die in Abschnitt 2.1 angesprochene
Zeta-Funktion führt.
15
2.3.6 Satz (Mittlere Ordnung von ϕ(n))
Für die Eulersche ϕ-Funktion gilt:
i) Ihre mittlere Ordnung ist gegeben durch:
g(x) =
6
x.
π2
ii) Genauer gilt sogar die Formel
X
3 2
x + O(x log x).
π2
ϕ(n) =
n≤x
Beweis.
Wir zeigen die Aussagen in 4 Schritten, in denen wir nacheinander die Summe abschätzen.
Hierbei nutzen wir z.T. andere Methoden als in [GEKELER], weil wir auf die Einführung
Dirichlet-Reihen verzichtet haben.
1. Nach Lemma 2.2.2 gilt:
X
ϕ(d) = n.
d|n
Setzen wir f (n) = ϕ(n) und F (n) = n, so erhalten wir mit der Möbius-Inversion
aus Satz 2.2.6 die Aussage
ϕ(n) =
X
µ(d)
X
n
=
µ(d)m.
d
n
(∗)
d= m
d|n
Ausgehend von dieser ist, wenn wir bei (∗∗) die gaußsche Summenformel
n
P
i = n(n+1)
benutzen,
2
i=1
X
n≤x
(∗)
ϕ(n) =
XX
µ(d)m =
n
n≤x d= m
X
µ(d)
=
m
m≤ x
d
d≤x
(∗∗) 1
X
X
µ(d)
hxi hx
+1
i
2
d d
d≤x
x
X
x
≤
µ(d)
+1
+2
d
d
d≤x
=
1X
x2 3 X
x X
µ(d) 2 +
µ(d) +
µ(d)2
2
d
2
d
d≤x
1
= x2
2
d≤x
X µ(d)
d≤x
16
d2
d≤x
3 X µ(d)
+ x
+ O(x).
2
d
d≤x
(#)
2. Um die erste Summe abzuschätzen, benutzen wir:
1 2.3.5 Y
1
=
1− 2 .
ζ(2)
p
p∈
P
P
(
− n12
Sei an :=
0
n∈ ,
sonst.
Dann gilt:
∞
X
X 1
X 1
<
< ∞.
p2
n2
|an | =
n=1
Also ist
p∈
P
n∈
N
∞
P
an absolut konvergent und damit nach Bemerkung 2.3.4 auch das Pro
∞
Q
Q dukt
(1 + an ) =
1 − p12 . Betrachten wir nun das Produkt, so stellen wir
n=1
n=1
p∈
P
fest, dass wegen der eindeutigen Primfaktorzerlegung das Inverse jeder Quadratzahl gebildet wird. Das Vorzeichen hängt von der Anzahl der Faktoren p12 , die zur
Bildung erforderlich waren, ab. Bei gerader Anzahl ist es positiv, sonst negativ.
Durch die absolute Konvergenz des Produktes dürfen wir so umordnen, dass gilt:
Y
p∈
P
1−
1
p2
X
=
n quadratfrei
X
=
n quadratfrei
ω(n) gerade
=
(−1)ω(n)
n2
−
1
n2
−
X
n quadratfrei
ω(n) ungerade
1
n2
X µ(n)
.
n2
n∈
N
Also gilt insgesamt:
X µ(n)
1
=
.
n2
ζ(2)
n∈
N
Damit erhalten wir
X µ(d)
d≤x
d2
=
X µ(d) X µ(d)
−
= ζ(2)−1 + O(x−1 ),
d2
d2
d∈
N
d>x
weil wir den Restterm aufgrund der absoluten Konvergenz der Reihe gegen
abschätzen können.
17
1
x
3. Um die zweite Summe abschätzen zu können, verwenden wir, dass für alle natürlichen
Zahlen d ≥ 1
µ(d)
1
≤
d
d
gilt. Dies liefert uns eine geeignete Abschätzung durch:
X µ(d)
d≤x
d
≤
X1
d≤x
d
Zx
≤1+
1
dy = 1 + log(x) = O(log x).
y
1
4. Setzen wir die beiden Abschätzungen in (#) ein, so erhalten wir:
X
n≤x
1 X µ(d) 1 X µ(d)
ϕ(n) = x2
+ x
+ O(x)
2
d2
2
d
d≤x
d≤x
1
1
1
= ζ(2)−1 x2 + x2 O(x−1 ) + xO(log x) + O(x)
2
2
2
1
−1 2
= ζ(2) x + O(x) + O(x log x) + O(x)
2
6
2.1.2 1
· 2 x2 + O(x log x)
=
2 π
3 2
= 2 x + O(x log x).
π
2.4 Wahrscheinlichkeiten für Teilerfremdheit und
Quadratfreiheit
Nachdem wir nun alle nötigen Vorbereitungen gemacht haben, können wir uns mit den
eigentlichen Fragestellungen des Kapitels beschäftigen. Wir beginnen mit der Wahrscheinlichkeit für Teilerfremdheit.
2.4.1 Korollar (Wahrscheinlichkeiten für Teilerfremdheit)
Es gilt:
N N
#{(m, n) ∈ × | m, n ≤ x mit ggT (m, n) = 1}
6
= 2
x→∞
#{(m, n) ∈ × | m, n ≤ x}
π
P (m, n teilerfremd) := lim
N N
Hierbei können wir P (m, n teilerfremd) als Wahrscheinlichkeit, dass zwei zufällig gewählte
natürliche Zahlen m, n teilerfremd sind interpretieren und erhalten:
P (ggT (m, n) = 1) = ζ(2)−1 =
18
6
≈ 60, 793%.
π2
Beweis.
Wir beweisen die Aussage, in dem wir die relative Häufigkeit aller teilerfremden Zufallspaare natürlicher Zahlen (m, n) innerhalb der Grundgesamtheit aller Zufallspaare und
dies dann durch die mittlere Ordnung der Eulerschen ϕ-Funktion ausdrücken, die wir
kennen. Hierbei wird bei (∗) ausgenutzt, dass die Menge
{m ∈ |x > m > n mit ggT (m, n) = 1} gleichmächtig mit der Menge
{n ∈ |x > n > m mit ggT (m, n) = 1} ist und der Fall m = n mit ggT (m, n) = 1 nur
für m = n = 1 auftritt. Darüber hinaus ist die Mächtigkeit
Pder Menge
{m ∈ |x > m > n mit ggT (m, n) = 1} gegeben durch
ϕ(m), weil die ϕ-Funktion
N
N
N
m≤x
genau die Zahlen n zählt, die zu m teilerfremd sind und somit die Summe der Anzahl
aller zu m teilerfremden Zahlen bis x entspricht. Es gilt also:
N N
#{(m, n) ∈ × | m, n ≤ x mit ggT (m, n) = 1}
x→∞
#{(m, n) ∈ × | m, n ≤ x}
#{(m, n) ∈ × |x > m > n mit ggT (m, n) = 1}
= lim
x→∞
#{(m, n) ∈ × | m, n ≤ x}
#{(m, n) ∈ × |x > n > m mit ggT (m, n) = 1}
+
#{(m, n) ∈ × | m, n ≤ x}
#{(m, n) ∈ × |x > m = n mit ggT (m, n) = 1}
+
#{(m, n) ∈ × | m, n ≤ x}


P
ϕ(m)
1 
(∗)
 m≤x
+ 2
= lim 2 ·
2
x→∞
[x]
[x]
P (m, n teilerfremd) = lim
N N
N N
N N
2.3.6
= lim
x→∞
=
6 2
x
π2
N N
N N
N N
N N
+ O(x log x) + 1
[x]2
6
.
π2
Nachdem wir nun konkret einen Wert für die Wahrscheinlichkeit der Teilerfremdheit
angeben konnten, wollen wir nun ebenso eine Aussage über die Wahrscheinlichkeit der
Quadratfreiheit machen, welche nicht ganz so einfach zu beweisen ist wie das vorherige
Korollar.
2.4.2 Satz (Wahrscheinlichkeit für Quadratfreiheit)
Es gilt:
P (n quadratfrei) := lim
x→∞
#{n ∈
N|n ≤ x mit n quadratfrei} = ζ(2)−1.
#{n ∈ N|n ≤ x}
19
Analog zu Satz 2.4.1 können wir P(n quadratfrei) als Wahrscheinlichkeit auffassen, dass
eine zufällig ausgewählte Zahl n quadratfrei ist.
Beweis.
1. n quadratfrei ⇔ µ(n) = ±1 ⇔ µ(n)2 = 1, also
P
P (n quadratfrei) = lim
#{n ∈
x→∞
µ(n)2
N|n ≤ x mit n quadratfrei} = lim 
n≤x

x→∞
#{n ∈ N|n ≤ x}
[x]
N
2. Für n ∈
existiert genau eine Darstellung n = qm2 , wobei m, q ∈
quadratfrei ist. Hierbei ist q durch die Darstellung
Y
q=
p


.
N und q
P
p∈
ep ungerade
gegeben, da in m2 bereits alle quadratischen Primfaktoren aus n enthalten sind.
Dann ist für dieses n
i)
(
1
µ(n) =
0
2
und für d ∈
m=1
sonst
)
2.2.5
=
X
µ(d),
d|m
N gilt:
ii)
d|m ⇔ d2 |m2 ⇔ d2 |m2 q ⇔ d2 |n.
3. Nun können wir die Summe in 1. umformen. Hierbei nutzen wir bei (∗), dass es
d durch alle Zahlen bis x laufen zu lassen, wenn wir für jedes d den Faktor
genügt,
x
2
heranmultiplizieren,
der angibt, wie viele Zahlen
d2
x die Bedingung d |n in der
ersetzten Summe erfüllt hätten. Bei (∗∗) haben wir d2 durch 1 abgeschätzt, was
P
P
√
uns die Wachstumsabschätzung √ 1 = O( x) liefert. Den Wert für √ µ(d)
d2
d≤ x
d≤ x
kennen wir bereits aus dem Beweis von 2.3.6. Also ergibt sich, wenn wir im Folgenden m(n) statt m schreiben, da m implizit von n abhängt:
X
n≤x
i)
µ(n)2 =
X X
n≤1 d|m(n)
20
µ(d)
ii)
=
XX
µ(d)
n≤x d2 |n
hxi
d2
√
d≤ x
n x o
x
X
=
µ(d) 2 −
d
d2
√
(∗)
X
=
µ(d)
d≤ x
X µ(d)
√
+
O(
x)
d2
√
d≤ x
√
1
2.3.6
= x ζ(2)−1 + O(x− 2 ) + O( x)
√
= xζ(2)−1 + O( x).
(∗∗)
= x
4. Kommen wir nun wieder zurück zur eigentlichen Aussage in 1., so erhalten wir die
gesuchte Wahrscheinlichkeit folgendermaßen:
P
µ(n)2
 n≤x
P (n quadratfrei) = lim 
x→∞
[x]
1.

 3.
 = lim
x→∞
√ xζ(2)−1 + O( x)
= ζ(2)−1 .
[x]
2.4.3 Bemerkung
Wir haben also insgesamt, dass die relativen Häufigkeiten in 2.4.1 und 2.4.2 gegen denselben Wert konvergieren, also die Wahrscheinlichkeit, dass eine zufällige Zahl quadratfrei
ist, ist genauso hoch wie die Wahrscheinlichkeit, dass zwei zufällig gewählte Zahlen zueinander teilerfremd sind. In Kapitel 5 werden wir anschaulich sehen, warum diese beiden
Wahrscheinlichkeiten so eng miteinander verknüpft sind und die Gleichheit durch einen
anderen Beweis heuristischer Art zeigen.
21
3 Der Primzahlsatz
In diesem Kapitel wollen wir eine Abschätzung für die Primzahlfunktion π(x) herleiten,
was ein wichtiges Ergebnis der analytischen Zahlentheorie ist. Der Kern des Beweises
hierfür stammt von D. J. Newman aus dem Jahr 1980, ist also noch relativ neu. Hier
werden wir uns mit der Fassung von D. Zagier befassen (siehe [ZAGIER]), die weitere
Vereinfachungen ausnutzt. Wir werden vor allem sehen, dass wir auf viele Ergebnisse der
komplexen Analysis zurückgreifen müssen, um unser Ziel zu erreichen. Zunächst jedoch
werden wir neben ζ(s) noch zwei weitere Funktionen untersuchen, die uns dabei helfen,
π(x) korrekt abzuschätzen.
3.1 Die Funktionen Φ(s) und ϑ(x)
3.1.1 Definition
Seien s ∈ und x ∈
C
R, so definieren wir:
Φ(s) :=
X log p
X
,
ϑ(x)
:=
log p.
ps
P
p≤x
p∈
P
p∈
Man sieht direkt, dass Φ(s) genauso wie ζ(s) für Re(s) > 1 absolut konvergiert und somit
Φ(s) sowie ζ(s) in diesem Gebiet holomorph sind.
Nun beweisen wir zunächst die allgemeine Version des Lemmas 2.3.5:
3.1.2 Lemma (Produktschreibweise der Zeta-Funktion)
Für Re(s) > 1 gilt:
ζ(s) =
1
.
1 − p1s
p∈P
Y
Beweis.
Aufgrund der eindeutigen Faktorisierung der natürlichen Zahlen (∗) und der absoluten
Konvergenz (∗∗) von ζ(s) in diesem Bereich haben wir:
22

(∗)
ζ(s) =
1
X
(ep )p ≥0
Q
p∈
P
!s =
pep
X

P
(∗∗)
p−ep s  =
Y
P
p∈
p∈
(ep )p ≥0



Y
X

p−ep s 
(ep )p ≥0
Re(s)>1
=
Y
P
p∈
1
.
1 − p−s
Hierbei muss man beachten, dass man über Tupel (ep )p summiert, bei denen fast alle
Einträge 0 sind.
Die nächsten Lemmata benötigen wir, um Aussagen über Eigenschaften der Funktionen
Φ(s) und ϑ(x) zu machen, welche uns später helfen werden, den Primzahlsatz zu zeigen.
3.1.3 Lemma (Holomorphie der Zeta-Funktion für Re(s) > 0)
Die Funktion
C
1
, s∈
s−1
besitzt eine holomorphe Fortsetzung für Re(s) > 0. Diese ist gegeben durch die Funktion
ζ(s) −
n+1
X Z 1
1
−
.
ns xs
n∈
N
n
Beweis.
Im Folgenden nutzen wir die Schreibweise [g(x)]tt12 für g(t1 ) − g(t2 ). Dann haben wir für
Re(s) > 1:
ζ(s) −
X 1
1
1
=
−
s
s−1
n
s−1
n∈N
1 X
(∗) X 1
−s+1
−s+1
=
−
(n
+
1)
−
n
ns 1 − s
n∈N
n∈N
X 1
X 1
−
(n + 1)−s+1 − n−s+1
=
s
n
1−s
n∈N
n∈N
n+1
X 1
X 1
n+1
−s+1
=
[x]
−
x
ns n
1−s
n
n∈N
n∈N
!
n+1
X 1
1
n+1
−s+1
=
[x]
−
x
ns n
1−s
n
n∈
N
n+1
X Z 1
1
=
−
.
ns xs
n∈
N
n
23
Die Summe bei (∗) ist eine Teleskopsumme, d.h. die Glieder heben sich fast alle gegenseitig auf. Übrig bleibt allein (−1)−s+1 = −1.
Die Reihe auf der rechten Seite konvergiert absolut für Re(s) > 0, da
n+1
Z n+1
x Z 1
1
1
s − s dx
− s dx = s
n
x
su n n
n
n+1 x
Z Z
1
du dx
= s
s+1
u
n n
n+1
Z Zx
≤ |s|
n
(∗∗)
1 us+1 du dx
n
n+1
Z Zx
≤ |s|
n
=
1
nRe(s)+1 du dx
n
n+1
Z Zx
|s|
1du dx
nRe(s)+1
n
≤
|s|
nRe(s)+1
n
.
1 offensichtlich für u = n ihr
Bei (∗∗) haben wir ausgenutzt, dass die Funktion us+1
Maximum hat, da dann der Nenner am kleinsten ist. Wegen der so bewiesenen absoluten
1
Konvergenz der Reihe kann die Funktion ζ(s) − s−1
mit dieser Formel holomorph für
alle s mit Re(s) > 0 fortgesetzt werden.
Im nächsten Schritt versuchen wir eine grobe Abschätzung für ϑ(x) zu finden, die wir
im Verlauf dieses Kapitels aber noch verbessern können. Zunächst reicht aber folgendes
Lemma aus:
3.1.4 Lemma (Abschätzung für ϑ(x))
Für x ∈ gilt
R
ϑ(x) = O(x).
Beweis.
Sei n ∈ . Dann ist nach dem binomischen Lehrsatz (siehe [HEUSER] Satz 7.4), angewandt bei (∗),
N
24
2
2n
= (1 + 1)
2n (∗)
=
2n X
2n
i
i=0
da alle Binomialkoeffizienten positiv sind. Aber
2n
(2n)!
≥
=
(n!)2
n
2n
≥
,
n
Y
p
n<p≤2n
p∈
P
2n
n
gilt, weil
eine natürliche Zahl ist und keine Primzahl größer als n in n! enthalten
sein kann. Somit enthält 2n
n mindestens alle Primzahlen p mit n < p ≤ 2n, was die
Ungleichung zeigt. Wir erhalten also die Abschätzung



 
22n ≥
Y
n<p≤2n
p∈
P

 X
  Y 
 = eϑ(2n)−ϑ(n) .
 = exp 

log
p
p
p = exp 
log



 
n<p≤2n
p∈
n<p≤2n
p∈
P
P
Wenden wir nun darauf den Logarithmus an, so haben wir
ϑ(2n) − ϑ(n) ≤ log(22n ) = 2n log 2.
Jetzt können wir für ein beliebiges m ∈
m (∗∗)
ϑ(2 ) =
N schreiben:
m
X
(ϑ(2n ) − ϑ(2n−1 ))
n=1
m
(#) X
≤
2n log 2
n=1
(+)
= (2m+1 − 2) log 2
< 2m+1 log 2.
Hier haben wir bei (#) die eben gezeigt Ungleichung für 2n−1 statt n angewendet, bei
(∗∗) konnten wir den Ausdruck durch eine Teleskopsumme schreiben, weil ϑ(1) = 0
b
P
b −q a
gilt und bei (+) haben wir die geometrische Summenformel
q n = qq−1
für |q| < 1
n=a
ausgenutzt.
Jetzt können wir für beliebiges reelles x ≥ 1 ein m finden, sodass 2m−1 ≤ x < 2m erfüllt
ist. Dies gibt uns
ϑ(x) ≤ ϑ(2m ) < 2m+1 log 2 = (4 log 2)2m−1 ≤ (4 log 2)x,
und wir erhalten ϑ(x) = O(x) wie gewünscht.
Um später das analytische Theorem anwenden zu können, welches unseren Beweis stark
abkürzen wird, müssen wir jetzt folgende Holomorphieeigenschaft zeigen:
25
3.1.5 Lemma/Bemerkung (Holomorphie von Φ(s) −
Für komplexe Zahlen s mit Re(s) ≥ 1 ist die Funktion
1
s−1
für Re(s) ≥ 1)
1
s−1
holomorph. D.h. es existieren auch für alle komplexen Zahlen mit Realteil 1 offene Umgebungen, also insbesondere auch für bestimmte komplexe Zahlen mit Realteil kleiner als
1, für die die Funktion holomorph ist.
Φ(s) −
Beweis.
Für Re(s) > 1 impliziert das konvergente Produkt aus Lemma 3.1.2, dass ζ(s) dort
nullstellenfrei ist. Da wir Ableitungen von Produkten viel schwerer berechnen können
als die von Summen, versuchen wir, durch die nachfolgenden Rechnungen das Produkt
zu eliminieren und somit unsere Problemstellung auf Summen zu beschränken. Leiten
wir die Funktion ζ(s) nun ab und nutzen die Produkdarstellung, so erhalten wir:


−1
Y
d


ζ(s)0 =
1 − e−s log p
ds
p∈P


=
−s
XY

0−s −1  − log p · p

1
−
p
·

 (1 − p−s )2
0
p∈
=
P
X
P
P
p∈
p0 6=p
ζ(s) ·
p∈
= −ζ(s)
− log p
− p−s )
ps (1
X log p
.
ps − 1
P
p∈
Nutzen wir dies, so können wir schreiben:
−
ζ 0 (s) X log p
=
ζ(s)
ps − 1
p∈
P
X ps log p
=
ps (ps − 1)
p∈
P
X ps log p − log p + log p
=
ps (ps − 1)
p∈
P
X (ps − 1) log p X log p
=
+
ps (ps − 1)
ps (ps − 1)
p∈
P
p∈
26
P
=
X log p X log p
+
ps
ps (ps − 1)
p∈
P
= Φ(s) +
P
p∈
log p
.
− 1)
X
p∈
P
ps (ps
Die hintere Summe konvergiert für Re(s) > 12 , da der größte Exponent im Nenner 2s ist.
Aus Lemma 3.1.3 folgt, dass ζ(s) meromorph fortsetzbar auf Re(s) > 0 ist und einen Pol
0 (s)
erster Ordnung bei s = 1 hat. Also hat ζζ(s)
einen Pol erster Ordnung bei s = 1 und bei
allen Nullstellen von ζ(s). Somit kann man Φ(s) meromorph auf Re(s) > 12 fortsetzen.
Sei nun sα := 1 + iα mit α ∈ \{0} und sei µ ∈ die Nullstellenordnung von ζ(s) in
1
sα . Dann folgt aus Lemma 3.1.3, dass µ nicht negativ ist, da sonst ζ(s) − s−1
für sα eine
weitere Polstelle hätte und nicht holomorph wäre.
Setzen wir nun
R
Z
Z(s) := ζ(s) −
1
,
s−1
so ist
Z 0 (s) = ζ 0 (s) +
1
.
(s − 1)2
Insbesondere ist nach Lemma 3.1.3 Z(s) holomorph für Re(s) > 0 und Z(1) = z sowie
Z 0 (1) = z 0 mit endlichen z, z 0 ∈ . Somit erhalten wir
C
ζ 0 (s)
Z 0 (s)
1
=
−
.
1
2
ζ(s)
(s − 1) Z(s) + (s − 1)
Z(s) + s−1
Sei > 0. Es ergibt sich folgender Grenzwert:

i) lim · Φ(1 + ) = lim −
→0
→0
= − lim →0
ζ 0 (1
+ )
−
ζ(1 + )

X
log p
P
p1+ (p1+
p∈
− 1)

ζ 0 (1
X
+ )
log p
− lim 1+
ζ(1 + ) →0
p (p1+ − 1)
p∈P
|
{z
}
=0
Z 0 (1 + )
1
= − lim −
1
2
→0
(1
+
−
1)
Z(1
+
) + (1 + − 1)
Z(1 + ) + 1+−1
!
Z 0 (1 + )
= − lim
− 2
→0 Z(1 + ) + 1
Z(1
+
) + 0 · Z 0 (1)
1
=−
−
Z(1) + ∞ 0 · Z(1) + 1
= −(0 − 1) = 1.
27
!
1
Dies zeigt bereits, dass Φ(s) − s−1
holomorph für s = 1 ist, da Φ(s) dort einen einfachen
Pol hat. Weiter können wir nun in einer Umgebung von 1 + iα ein holomorphes K(s)
finden, sodass
ζ(s) = K(s)(s − (1 + iα))µ
gilt. Insbesondere ist dann K(1 + iα) endlich und verschieden von Null. Somit erhalten
wir als Ableitung
ζ 0 (s) = K 0 (s)(s − (1 + iα))µ + µK(s)(s − (1 + iα))µ−1 .
An der Stelle sα genügt es, eine beliebige Richtungsableitung zu berechnen, weil Φ(s)
meromorph für Re(s) > 21 ist. Außerdem können wir die Berechnung gleichzeitig für
sα und das komplex konjugierte sα durchführen, da aufgrund der rellen Basis und des
komplexen Exponenten ζ(s) = ζ(s) gilt und sich somit auch die Polstellenordnung nicht
ändert. Ist wieder > 0, so erhalten wir analog zu i):
ζ 0 (1 + ± iα)
−0
→0 ζ(1 + ± iα)
0
K (1 + ± iα)(1 + ± iα − (1 ± iα))µ
= − lim →0
K(1 + ± iα)(1 + ± iα − (1 + ±iα))µ
µK(1 + ± iα)(1 + ± iα − (1 ± iα))µ−1
+
K(1 + ± iα)(1 + ± iα − (1 + ±iα))µ
0
K (1 + ± iα) µ
= − lim +
→0
K(1 + ± iα)
0
K (1 ± iα)
=− 0·
+µ
K(1 ± iα)
= −µ.
ii) lim · Φ(1 + ± iα) = − lim →0
Ebenso können wir den Punkt s2α = 1 + 2iα mit Nullstellenordnung ν ≥ 0 betrachten
und erhalten wie in ii):
lim · Φ(1 + ± 2iα) = −ν.
→0
Mit Hilfe der Ungleichung für > 0
2 X
4
Φ(1 + + irα) = Φ(1 + − 2iα) + 4Φ(1 + − iα) + 6Φ(1 + )
2+r
r=−2
+ 4Φ(1 + + iα) + Φ(1 + + 2iα)
X log p
=
(p2iα + 4piα + 6p0 + 4p−iα + p−2iα )
p1+
p∈
P
28
=
X log p α
α
(pi 2 + p−i 2 )4
1+
p
p∈
P
≥ 0,
können wir den Grenzübergang wie in i) , ii) , iii) durchführen und erhalten für
!
2 X
4
Φ(1 + + irα) ≥ 0
lim ·
→0
2+r
r=−2
die Ungleichung
−ν − 4µ + 6 − 4µ − ν = 6 − 8µ − 2ν ≥ 0.
Da µ und ν nach Voraussetzung nicht negativ waren folgt sofort µ = 0. Weil µ aber die
Nullstellenordnung von ζ(1 + iα) war, folgt zusammen mit der Polstelle bei s = 1 , dass
ζ(s) nullstellenfrei für Re(s) = 1 ist.
3.2 Das analytische Theorem von Newman
Um nun in unserem Beweis den entscheidenden Schritt machen zu können, brauchen wir
zunächst einen Satz, der erstmals 1980 von D. J. Newman in [NEWMAN] gezeigt wurde.
3.2.1 Satz (Analytisches Theorem von Newman)
Sei f (t) (t ≥ 0) eine beschränkte und lokal integrierbare Funktion und g(z) =
mit Re(z) > 0 holomorph fortsetzbar auf Re(z) ≥ 0. Dann existiert
R∞
R∞
f (t)e−zt dt
0
f (t)dt.
0
Beweis.
Sei T > 0 und
ZT
gT (z) :=
f (t)e−zt dt.
0
Nach Voraussetzung ist diese Funktion holomorph für alle z. Wir müssen nun zeigen,
dass gilt
lim gT (0) = g(0).
T →∞
Sei R ∈
R+ beliebig groß und sei ∂C der Rand des Gebietes
C := {z ∈ C| |z| ≤ R, Re(z) ≥ −δ}
29
mit δ > 0 abhängig von R klein genug, sodass g(z) auf ganz C holomorph ist. Dieses
δ kann man finden, denn aufgrund der holomorphen Fortsetzbarkeit von g(z) existieren
Umgebungen für Re(s) = 0, | Im(s)| ≤ R auf denen g(z) immer noch holomorph fortsetzbar ist. Man aus den unendlich vielen Umgebungen eine endliche Anzahl auswählen,
die die Menge {s ∈ | Re(s) = 0, | Im(s)| ≤ R} überdecken, weil sie kompakt ist. Habe
die kleinste dieser nun endlich vielen Umgebungen den Radius 2δ. Da der Radius dieser
Umgebungen mindestens 2δ ist, existiert für jeden Punkt eine Umgebung mit mindestens Radius δ, auf der g(z) noch holomorph fortsetzbar ist. Also ist dieser Radius unser
gesuchtes δ.
Dann ist nach dem Cauchyschen Integralsatz (siehe [Freitag] Theorem 3.2):
C
g(z) − gT (z)
dz
z−0
Z
1
g(0) − gT (0) =
2πi
∂C
g(z) − gT (z) zT
e dz
z
∂C
Z
g(z) − gT (z) zT
z2
(∗∗) 1
=
e
1 + 2 dz
2πi
z
R
∂C
Z
z 2 dz
1
zT
(g(z) − gT (z))e
1+ 2
.
=
2πi
R
z
1
=
2πi
(∗)
Z
∂C
Bei (∗) und (∗∗) haben wir holomorphe Funktionen hinzugefügt, die an der Stelle z = 0,
an der die Funktion z1 eine Polstelle hat, den Wert 1 haben. Also ändern sie an unserem
Ergebnis nichts.
Wir betrachten nun nacheinander verschiedene Wege, um ∂C möglichst geschickt zu
umlaufen, sodass wir das Integral ausrechnen können.
1. Auf dem Halbkreis C+ = ∂C ∩ {Re(z) > 0} ist die zu integrierende Funktion
beschränkt durch 2B
mit B = max |f (t)|, da für Re(z) > 0 und |z| = R
R2
t≥0
∞
Z
ZT
−zt
−zt |g(z) − gT (z)| = f (t)e dt − f (t)e dt
0∞
0
Z
−zt = f (t)e dt
T
Z∞
(#)
≤ B
=
|e−zt |dt
T
−
Be Re(z)T
Re
30
,
und
zT
z 2 1 e
= eRe(z)T
1+ 2
R
z
= eRe(z)T
= eRe(z)T
zz + z 2 ·
R2 z z(z + z) · R2 z 2 Re(z) ·
R2 = eRe(z)T ·
2 Re(z)
R2
Rb
Rb
gilt, wobei wir bei (#) die Standardabschätzung für Integrale f (t)dt ≤ |f (t)|dt
a
a
(siehe auch [FREITAG] Bemerkung 1.5) benutzt haben. Also haben wir insgesamt
Z
Z 1
2
zT
dz
1
z
z 2 1 zT
(g(z) − gT (z))e
1+ 2
|(g(z) − gT (z))| · e
dz
1+ 2
≤
2πi
R
z 2π
R
z
C+
C+
!
Z
Be− Re(z)T Re(z)T 2 Re(z)
1
·e
·
dz
=
2π
Re
R2
C+
Z
1 2B
=
· 2
dz
2π R
C+
B
· πR
πR2
B
= .
R
=
2. Sei nun C− = ∂C ∩ {Re(z) < 0}. Hier betrachten wir g(z) und gT (z) einzeln.
C
Da gT (z) ganz ist, also auf ganz holomorph ist, können wir wegen der Transformationsinvarianz (siehe [FREITAG] Satz 1.6) C− ersetzen durch den Halbkreis
0 = {z ∈
C−
| |z| = R, Re(z) < 0}. Dann gilt analog zu 1. für Re(z) < 0
C
T
Z
ZT
Be− Re(z)T
−zt
|gT (z)| = f (t)e dt ≤ B |e−zT |dt =
,
| Re(z)|
0
0
und deshalb
31
Z 1 Z
2
2
zT
z
dz z
1 1
zT
1+ 2
gT (z)e
|gT (z)| e
1+ 2
dz
≤
2πi
R
z 2π
R
z
0
0
C−
C−
Z
1 Be− Re(z)T Re(z)T 2| Re(z)|
=
·
·e
·
dz
2π
| Re(z)|
R2
0
C−
B
· πR
πR2
B
= .
R
=
3. Schließlich betrachten wir den letzten Integrand. Da
z2
1
g(z) · 1 + 2 ·
R
z
unabhängig von T ist, und ezT für Re(z) < 0 für große T gegen 0 konvergiert,
erhalten wir:
1
lim
T →∞ 2πi
Z
g(z)e
zT
z 2 dz
= 0.
1+ 2
R
z
C−
4. Nehmen wir nun 1., 2. und 3. zusammen, so bekommen wir:

Z
2
z
dz
 1
lim sup |g(0) − gT (0)| = lim sup 
(g(z) − gT (z))ezT 1 + 2
2πi
R
z T →∞
T →∞
C+
1 Z
z 2 dz zT
+
gT (z)e
1+ 2
2πi
R
z 0
C−

1 Z
2
z
dz 
g(z)ezT 1 + 2
+

2πi
R
z C−
B B
≤ lim sup
+ +0
R R
T →∞
2B
=
.
R
Da aber R beliebig war und B nach Konstruktion nicht von R abhängt, ergibt sich
32
lim gT (0) = g(0), für R → ∞.
T →∞
3.3 Der Primzahlsatz
Jetzt können wir das analytische Theorem benutzen, um folgende Integralexistenz nachzuweisen, welche uns im nachfolgenden Lemma eine genauere Abschätzung für ϑ(x)
liefern wird.
3.3.1 Lemma (Konvergenz des Integrals
R∞ ϑ(x)−x
1
Das Integral
Z∞
x2
dx)
ϑ(x) − x
dx
x2
1
ist konvergent.
Beweis.
In diesem Beweis kommen nun viele unserer bisherigen Erkenntnisse zusammen. Sei
Re(s) > 1, dann ist, weil ϑ(x) für Werte x zwischen zwei Primzahlen konstant ist,
∞
∞
∞
Z
Z
X log p Z dϑ(x) (∗) ϑ(x) ∞
ϑ(x) (∗∗)
Φ(s) =
+s
=
=
dx = s e−st ϑ(et )dt.
ps
xs
xs 1
xs+1
P
p∈
1
1
0
Bei (∗) haben wir partiell integriert und bei (∗∗) haben wir die Substitution x 7→ et
durchgeführt.
Wir setzen nun
f (t) := ϑ(et )e−t − 1,
Φ(z + 1) 1
− .
g(z) :=
z+1
z
Dann ist, wenn wir bei (+) das oben berechnete Integral benutzen,
33
Z∞
Z∞
f (t)e−zt dt = (ϑ(et )e−t − 1)e−zt dt
0
0
Z∞
= (ϑ(et )e−t(z+1) − e−zt )dt
0
Φ(z + 1)
=
−
z+1
(+)
Z∞
e−zt dt
0
Φ(z + 1) 1
−
z+1
z
= g(z).
=
Das Lemma 3.1.5 liefert, falls wir dort s = z+1 setzen, dass g(z) für Re(z) ≥ 0 holomorph
ist. Außerdem erhalten wir aus Lemma 3.1.4, dass gilt:
ϑ(x) = O(x)
⇔ ϑ(et ) = O(et ).
Also bekommen wir
f (t) = ϑ(et )e−t − 1 = O(et )e−t − 1 = O(1).
Insbesondere ist also f (t) beschränkt.
Somit erfüllen f (t) und g(z) die Voraussetzungen des analytischen Theorems 3.2.1, d.h.
das Integral
Z∞
0
Z∞
Z∞
Z∞
ϑ(et ) − et
ϑ(x) − x
t −t
f (t)dt = (ϑ(e )e − 1)dt =
dt =
dx,
et
x2
0
0
0
wobei wir die Substitution t 7→ log x durchgeführt haben, existiert.
Jetzt sind wir in der Lage, eine noch bessere Abschätzung für ϑ(x) zu beweisen, welche
uns im Anschluss direkt Abschätzungen zum Beweis des Primzahlsatzes liefern wird.
3.3.2 Lemma (ϑ(x) ∼ x)
Es gilt
ϑ(x) ∼ x.
34
Beweis.
Angenommen, dass es für λ > 1 ein genügend großes x gäbe, sodass ϑ(x) ≥ λx. Da ϑ(x)
nicht fallend ist, ergäbe sich dann für diese x:
Zλx
ϑ(t) − t
dt ≥
t2
x
Zλx
λx − t (∗)
dt =
t2
x
λ−t
dt = − log λ + λ − 1 > 0.
t2
1
Bei (∗) haben wir die Substitution t →
wert
Z∞
Zλ
ϑ(t) − t
dt ≥ lim
λ→∞
t2
Zλx
t
x
durchgeführt. Betrachten wir nun den Grenz-
ϑ(t) − t
dt ≥ lim (− log λ + λ − 1) = ∞,
λ→∞
t2
x
1
so erhalten wir einen Widerspruch zur Konvergenz des Integrals
R∞ ϑ(t)−t
1
t2
dt wegen Lemma
3.3.1. Analog kommen wir durch die Annahme, es gäbe ein λ < 1 mit ϑ(x) ≤ λx, zur
Ungleichung:
Zx
ϑ(t) − t
dt ≤
t2
λx
Zx
λx − t
dt =
t2
λx
Z1
λ−t
dt = log λ − λ + 1 < 0.
t2
λ
Multiplizieren wir die Gleichung mit −1 und betrachten erneut den Grenzübergang
λ → ∞, so ergibt sich derselbe Widerspruch wie oben. Also muss λ = 1 gelten, d.h.
ϑ(x) ∼ x.
Es bleibt nun noch übrig, den Primzahlsatz zu beweisen. Er wurde zwar bereits von
Gauß vermutet, konnte jedoch erst 1896 unabhängig von Jacques Salomon Hadamard
und Charles-Jean de La Vallée Poussin bewiesen werden.
3.3.3 Satz (Der Primzahlsatz)
Die Funktion π(x), welche die Anzahl der Primzahlen bis zu einer Schranke x beschreibt,
ist asymptotisch äquivalent zu logx x , d.h.
π(x) ∼
x
.
log x
Beweis.
Wir können schreiben:
ϑ(x) =
X
p≤x
p∈
P
log p ≤
X
p≤x
p∈
P
35
log x = π(x) log x,
da die Summe nur π(x) Summanden hat und diese höchstens so groß wie log x sein
können. Es ergibt sich also:
ϑ(x)
≤ π(x).
log x
(3.1)
Außerdem gilt für alle > 0:
X
ϑ(x) ≥
log p
x1− ≤p≤x
p∈
P
X
≥
log x1−
x1− ≤p≤x
p∈
P
X
=
(1 − ) log x
x1− ≤p≤x
p∈
P
= (1 − ) log x(π(x) − π(x1− )).
Offensichtlich gilt aber auch π(x1− ) ≤ x1− , d.h. es gilt:
ϑ(x) ≥ (1 − ) log x(π(x) − π(x1− )).
Formen wir dies um, erhalten wir:
ϑ(x)
1
·
+ x1− .
1 − log x
Aus den Gleichungen 3.1 und 3.2 ergibt sich nun:
π(x) ≤
ϑ(x)
1
ϑ(x)
≤ π(x) ≤
·
+ x1−
log x
1 − log x
ϑ(x)
log x
1
ϑ(x) log x
⇔
≤ π(x) ·
≤
·
+ .
x
x
1−
x
x
Da für jedes > 0
lim
x→∞
log x
=0
x
gilt und weil nach Lemma 3.3.2
ϑ(x)
=1
x→∞ x
ist, erhalten wir aus obiger Ungleichung
log x
1 ≤ lim π(x) ·
≤ 1.
x→∞
x
lim
Somit folgt π(x) ∼
x
log x .
36
(3.2)
4 Die durchschnittliche Anzahl an
Primfaktoren
In unserem letzten Kapitel haben wir den Primzahlsatz bewiesen, der etwas über die
Dichteverteilung der Primzahlen aussagt. Nun wollen wir uns damit befassen, wie sich
die durchschnittliche Anzahl an Primfaktoren entwickelt. Hierbei unterscheiden wir zwischen der Anzahl an verschiedenen Primfaktoren ω(n) und der Anzahl an Primfaktoren
mit Vielfachheiten Ω(n) einer beliebigen natürlichen Zahl n. Allerdings werden wir sehen, dass auch hier die Ergebnisse eng miteinander zusammenhängen. Bevor wir jedoch
beginnen können, direkt die mittleren Ordnungen zu berechnen, benötigen wir noch
einige Aussagen über Primzahlsummen.
4.1 Die Sätze von Mertens
Zuerst zeigen wir jedoch einen sehr nützlichen Transformationssatz, mit dem wir später
die Sätze von Mertens beweisen können.
4.1.1 Satz (Transformationssatz, Abel-Summation)
Sei (ci )i∈N eine Folge von natürlichen Zahlen mit ci = 0 für i < i0 ∈
C(x) :=
[x]
X
N und sei
ci
i=1
Ist f (x) eine stetig differenzierbare Funktion für x ≥ i0 , dann gilt:
X
Zx
ci f (i) = C(x)f (x) −
i≤x
C(t)f 0 (t)dt.
i0
Beweis.
Wir halten uns in diesem Beweis an die Vorgabe aus [HARDY] Theorem 421. Setze
N := [x], dann erhalten wir durch Konstruktion einer Teleskopsumme und Umordnen:
X
i≤x
ci f (i) =
X
((C(i) − C(i − 1))f (i))
i≤x
37
= C(1)f (1) + (C(2) − C(1)) f (2) + · · · + (C(N ) − C(N − 1)) f (N )
= C(1) (f (1) − f (2)) + · · · + C(N − 1) (f (N − 1) − f (N )) + C(N )f (N )
X
(C(i) (f (i) − f (i + 1))) + C(x)f ([x]),
=
i≤x−1
weil C(N ) = C(x) ist. Ebenso ist C(t) = C(i), falls i ≤ t < i + 1, weil zwischen i und
i + 1 keine weiteren Folgenglieder summiert werden. Deshalb gilt:
Zi
C(i)(f (i) − f (i + 1)) = C(i)
Zi+1
f (t)dt = −
C(t)f 0 (t)dt.
0
i+1
i
Also gilt mit C(t) = 0 für t < i0 :

Zi+1
C(t)f 0 (t)dt + C(x)f ([x])

X
i≤x
ci f (i) = − 
X
i0 ≤i<x−1 i
Z[x]
= C(x)f ([x]) −
C(t)f 0 (t)dt
i0
Zx
= C(x)f (x) −
C(t)f 0 (t)dt.
i0
4.1.2 Lemma (Mertens’ erster Satz)
Es gilt für p ∈ :
P
X log p
p≤x
p
= log x + O(1).
Beweis.
1. Sei f (t) = log t und (ci )i∈N = 1 für alle i, dann ist C(x) =
P
1 = [x]. Ebenso
i≤x
ist f (t) für t > 0 stetig differenzierbar. Wenden wir nun den Transformationssatz
4.1.1 an, so erhalten wir mit n = [x]:
log(n!) =
X
log i
i≤n
38
Zx
= [x] log x −
1
[t] · dt
t
1
= x log x + O(log x) − [t]t=x
t=1
= x log x + O(log x) − [x] + 1
= x log x + O(x).
2. Als nächstes berechnen wir denselben Ausdruck auf eine andere Art. Da die Vielfachheit ep einer Primzahl in der Primfaktorzerlegung von n implizit von n abhängt,
setzen wir für die Dauer des Beweises ep = ep (n), um die Summen besser überschaubar
zu machen.
log(n!) =
X
ep (n!) log p
p≤x
p∈
P
∞ XX
x
=
log p
pm
p≤x m=1
p∈
∞
XX
P
=
p≤x m=1
p∈
∞
XX
P
=
p≤x m=1
p∈
P
∞ XX
x
x
log p −
log p
pm
pm
p≤x m=1
p∈
P
∞
X
X
x
log
p
−
log
p
pm
m=1
p≤x
p∈
P
h
=
X
∞
X
p≤x m=1
p∈
P
−
P
p≤x
p∈
P
≤
X
p≤x m=1
p∈
P
i
m=1
p≤x
p∈
log p
∞
X
log x
log p
x
pm
X
X x x
log p −
log p
pm
pm
h
X
i
log x
+2
log p
X
X
x
−
log p
i pm
p≤x
p∈
h
P
h
x
m= log
+1
log p
log x
log p
∞
X
x
i pm
h
x
m= log
+3
log p
i
∞
X
X
X
X
X log p
x
log
p
−
log
p
−2
log
p
−
x
pm
p2
m=1
p≤x
p∈
P
p≤x
p∈
P
p≤x
p∈
P
m=
|
3.1.4
≤
∞
XX
X
X log p
x
log x
log p −
log p
− O(x) − C1 x
m
p
log p
p2
p≤x m=1
p∈
P
p≤x
p∈
p≤x
p∈
P
|
39
P{z
=C2
}
h
1
p
i m
log x
+1
log p
{z
=C1
}
=
∞
XX
x
log p − π(x) log x − O(x) − C1 C2 x
pm
p≤x m=1
p∈
∞
XX
3.3.3
P
=
p≤x m=1
p∈
∞
XX
P
=
p≤x m=1
p∈
P
x
log p + O
pm
x
log x + O(x)
log x
x
log p + O(x).
pm
Die positive Konstante C1 ≤ 2 ergibt sich aus dem Anwenden der geometrischen
Reihe, da in den Grenzen der Summe stets pxm < 1, gilt und die Existenz von C2
∞
P
log n
folgt aus der bekannten Konvergenz von
.
n2
n=1
3. Nun schätzen wir folgende Differenz ab:
∞
∞
XX
log p X log p X X log p
−
=
pm
p
pm
p≤x m=1
p∈
P
p≤x m=2
p∈
p≤x
p∈
P
P
∞
X
1
log p
pm
X
≤
P
m=2
p∈
(∗∗)
=
X
P
log p ·
p∈
=
X
P
p∈
<
X
N
n∈
1
1−
1
p
1
−1−
p
!
log p
p(p − 1)
log n
n(n − 1)
= K.
Bei (∗∗) verwenden
wir die Summenformel der geometrische Reihe, da für alle
1
p ∈
stets p < 1 gilt. Also können wir die Doppelsumme durch eine Summe
über alle Primzahlen bis zur Schranke x abschätzen und haben dabei nur einen
konstanten Fehlerterm.
P
4. Fassen wir nun unsere Ergebnisse zusammen, so erhalten wir:
1.
2.
x log x + O(x) = log(n!) =
∞
X log p
XX
x
3.
log p + O(x) = x
+ xO(1).
m
p
p
p≤x m=1
40
p≤x
Teilen durch x und Umsortieren liefert
X log p
= log x + O(1),
p
p≤x
was den ersten Satz von Mertens beweist.
Mit Hilfe des ersten Satzes von Mertens können wir nun den zweiten Satz von Mertens
beweisen, welcher uns im nächsten Abschnitt eine Abschätzung für die mittlere Ordnung
von ω(n) und Ω(n) liefern wird.
4.1.3 Lemma (Mertens’ zweiter Satz)
Es gibt eine Konstante C1 ∈ , sodass gilt:
R
X1
p≤x
p
= log log x + C1 + O
1
log x
.
Beweis.
Wir setzen
(
ci :=
log i
i ,
0,
falls i Primzahl,
sonst.
Dann gilt nach dem ersten Satz von Mertens 4.1.2
X
ci =
i≤x
Setzen wir nun f (t) :=
1
log t ,
X log p
= log x + O(1).
p
p≤x
p∈
P
so erhalten wir mit Hilfe des Transformationssatzes 4.1.1:
X1 X
=
ci f (i)
p
p≤x
p∈
P
i≤x
C(x)
+
=
log x
Zx
C(t)
dt
t(log t)2
2
1
=1+
O(1) +
log x
Zx
2
1
dt +
t log t
Zx
2
41
1
O(1)dt
t(log t)2
1
=1+
O(1) + [log log t]t=x
t=2 + O(1)
log x
Zx
1
dt
t(log t)2
2
1
O(1) + [log log t]t=x
=1+
t=2 + O(1)
log x
Z∞
1
dt − O(1)
t(log t)2
Z∞
1
dt
t(log t)2
x
2
= log log x + C1 + E(x),
mit
Z∞
C1 = 1 − log log 2 + O(1)
1
dt
t(log t)2
1
und E(x) =
O(1) − O(1)
log x
x
2
Hierbei ist C1 konstant, da
Z∞
2
Z∞
1
1
1 t=∞
=
dt = −
,
2
t(log t)
log t t=2
log 2
und wird Meissel-Mertens-Konstante genannt. Außerdem gilt:
Z∞
1
dt
t(log t)2
x
!
1
1 t=∞
=O
+O
−
log x
log t t=x
1
=O
.
log x
1
O(1) − O(1)
E(x) =
log x
Insgesamt haben wir nun
X1
p≤x
p
= log log x + C1 + O
und damit Mertens zweiten Satz gezeigt.
4.1.4 Bemerkung (Die Meissel-Mertens-Konstante)
Man kann zeigen, dass
42
1
log x
1
dt.
t(log t)2


X X 1

1
1


+
≈ 0, 261497 . . .
C1 = lim 
− log log x = γ +
log 1 −
n→∞
p
p
p
P
p≤n
p∈
P
p∈
gilt, wobei
γ := lim
n→∞
n
X
1
− log n
k
!
≈ 0, 577215 . . .
k=1
die Euler-Mascheroni-Konstante ist [HAVIL] Kap. 7.2.
4.2 Die durchschnittliche Anzahl an Primfaktoren
Ausgehend von den Sätzen von Mertens können wir nun die mittleren Ordnungen bestimmen. Nach dem Erhalt dieser sind wir in der Lage, für große x mittels Ableitungen die
durchschnittliche Anzahl an Primfaktoren zu bestimmen. Wir beginnen mit der Summe
über die ω(n):
4.2.1 Satz (Summe über die ω(n))
Für x ∈ gilt:
R
X
ω(n) = x log log x + C1 x + O
n≤x
x
log x
.
Beweis.
Es gilt folgende Gleichungungskette:
X
ω(n) =
n≤x
Da wir wissen, dass
und erhalten so:
X
XX
n≤x p|n
p∈
P
n o
x
p
1=
X x
p≤x
p∈
P
X x X x
=
−
.
p
p
p
p≤x
p∈
P
p≤x
p∈
P
< 1 gilt, können wir die zweite Summe mit π(x) abschätzen
ω(n) = x
n≤x
X1
+ O(π(x))
p
p≤x
p∈
P
4.1.3
= x log log x + C1 + O
43
1
log x
+ O(π(x))
1
= x log log x + C1 x + O
log x
x
= x log log x + C1 x + O
log x
3.3.3
+O
x
log x
Nun wenden wir uns der Summe über die Ω(n) zu:
4.2.2 Satz (Summe über die Ω(n))
Für x ∈ gilt:
R
X
Ω(n) = x log log x + C2 x + O
n≤x
x
log x
,
wobei C2 = 1, 03465 . . . eine Konstante ist.
Beweis.
1. In diesem Beweis verwenden wir wieder die Schreibweise ep = ep (n), um eine
bessere Übersicht zu gewährleisten. Wir definieren nun die Funktion
A(x) :=
X
n≤x
(Ω(n) − ω(n)) =
∞ XX
x
(ep (n) − 1) =
,
pk
XX
P k=2
n≤x p|n
p∈
p∈
P
h i
weil pxk die Anzahl der Zahlen n ≤ x angibt, welche k-mal durch p teilbar sind.
Nun setzen wir:
C2 := C1 +
X
p∈
P
1
,
p(p − 1)
was wegen der Konvergenz der Summe konstant ist.
2. Es gilt nun aufgrund der Definition der Gaußklammer:
∞
XX
1
A(x) ≤ x
pk
p∈
=x
P k=2
∞
X 1 X
1
2
p
pk
p∈
44
P
k=0
(∗)
X 1
1
·
2
p 1−
p∈P
X
1
=x
=x
p∈
1
p
P p(p − 1)
= x(C2 − C1 ).
Bei (∗) haben wir die geometrische Summenformel angewendet, da
als 1 ist.
1
p
stets kleiner
3. Wenden wir nun die geometrische Summenformel auf folgenden Ausdruck an, so
ist
n
X
1
=
pk
k=2
!
1
n
X
1 − pn+1
1
1
1
1
1
1
−1− =
−1−
=
− n+1
=
−cp−n
1
n
k
p
p
p(p
−
1)
p
−
p
p(p
−
1)
p
1
−
p
k=0
für ein geeignetes c > 0.
i
h
x
+
1
Nun ist aber mit n := log
log p
−
p−n = p
h
i
log x
+1
log p
=e
−
h
i
log x
+1
log p
log p
≤ e− log x = x−1 .
4. Verkleinern wir nun die Summanden in A(x), so erhalten wir:
log x
+1
log p
A(x) ≥
X x
−
1
pk
X
√
p≤ x
p∈
k=2
P
log x
+1
log p
=
X
√
p≤ x
p∈
P
3.
=x
k=2
X √
p≤ x
p∈
P
≥x
X √
p≤ x
p∈
P
=x
X
√
p≤ x
p∈
P
log x
+1
log p
X x
X
−
k
p
√
X
p≤ x
p∈
P
1
− cp−n
p(p − 1)
1
− cx−1
p(p − 1)
1
+ O(1)
p(p − 1)
1
k=2
+
X
√
p≤ x
p∈
P
−
log x
log p
O(log x)
√
p≤ x
p∈
P
X
√
p≤ x
p∈
45
X
O
P
√
1 + O( x log x)

(∗∗)
= x
X
P
p∈
1
+O
p(p − 1)

√
√
log x 
√
+ O(π( x)) + O( x log x)
x
√
2.
= x(C2 − C1 ) + O( x log x).
1
P
mit C2 = C1 +
P p(p−1)
= 1, 03465 . . . . Hier haben wir bei (∗∗) die Summe
p∈
vergrößert und einen Abschätzungsterm hinzugefügt.
5. Aus 2. und 4. erhalten wir also
√
A(x) = x(C2 − C1 ) + O( x log x).
Die Behauptung ergibt sich aus:
X
Ω(n) =
n≤x
X
ω(n) + A(x)
n≤x
√
x
+ x(C2 − C1 ) + O( x log x)
= x log log x + C1 x + O
log x
x
= x log log x + C2 x + O
,
log x
4.2.1
da
x
log x
>
√
x log x für x ? 5504.
4.2.3 Bemerkung (Die durchschnittliche Anzahl an Primfaktoren)
Für x ∈ , x 1 und n ∈ , n ≈ x kann man die Näherungsausdrücke für die Summen
über ω(n) und Ω(n) als Funktionen in x auffassen, die stetig differenzierbar sind. Die Ableitung entspricht dann der Änderung der Summe, also der Anzahl der Primfaktoren, die
beim nächsten Summanden auftauchen. Also kann man die Ableitung als durchschnittliche Anzahl an Primzahlen auffassen, die pro Summand im Bereich um x auftritt. Wir
erhalten also für die durchschnittliche Anzahl an verschiedenen Primfaktoren:


X
d 
d
1
ω(n) ≈
(x log log x + C1 x) = log log x +
+ C1 .
dx
dx
log x
R
N
n≤x
Für die durchschnittliche Anzahl aller Primfaktoren bekommen wir:
46


d
d X
1
Ω(n) ≈
(x log log x + C2 x) = log log x +
+ C2 .
dx
dx
log x
n≤x
Wir sehen also, dass sich die beiden Durchschnittswerte nur um einen konstanten Summanden unterscheiden, was überraschend ist. Betrachten wir ein paar numerische Beispiele, so stellen wir fest, dass trotz sehr großer Schranke x, die zu erwartende Anzahl
an Primteilern sehr gering bleibt.
Tabelle 4.1: Durchschnittliche Anzahl an Primfaktoren
Obere Schranke
1010
1020
1050
10100
!
P
d
ω(n)
3,3981 4,0913 5,0076 5,7010
dx
n≤x
!
P
d
Ω(n)
4,1713 4,8644 5,7807 6,4739
dx
n≤x
47
5 Zahlentheoretische Probleme in der
Schule
Nachdem wir es in den vorherigen Kapiteln geschafft haben, mit zum Teil schwierigen mathematischen Methoden Aussagen zu erhalten, wollen wir nun versuchen, diese Probleme
auch im schulischen Kontext zu behandeln. Die Zielgruppe für unsere Überlegungen ist
eine Gruppe Oberstufenschüler, die besonders gute Leistungen in Mathematik hervorbringen. Ein Beispiel für eine solche Gruppe wäre eine Mathematik AG in der Oberstufe.
Es ist offensichtlich, dass diese Schüler in der Regel noch nicht das mathematische Vorwissen erworben haben, mit dem sie die Probleme auf oben beschriebenem Weg lösen
oder nachvollziehen können. Dazu ist eine Motivation des Themas sehr wichtig, weil davon maßgeblich der Lernerfolg der Schüler abhängt. Im Folgenden werden wir nun die
Kapitel einzeln motivieren, zeigen, wo sich in den genutzen Beweisen Probleme ergeben
und anschließend andere Möglichkeiten angeben, durch die man äquivalente Aussagen
beweisen kann.
5.1 Wahrscheinlichkeiten für Teilerfremdheit und
Quadratfreiheit
Im ersten Abschnitt befassen wir uns mit den Wahrscheinlichkeiten für Teilerfremdheit
und Quadratfreiheit. Wir beginnen mit einer Motivation.
5.1.1 Motivation
Zunächst müssen wir uns klar machen, was Teilerfremdheit und Quadratfreiheit eigentlich bedeuten. Teilerfremdheit zweier Zahlen bedeutet, dass der größte gemeinsame Teiler
der beiden Zahlen 1 ist, d.h. in den beiden Primfaktorzerlegung sind alle Primzahlen mit
Vielfachheiten größer als 0 paarweise verschieden. Quadratfreiheit hingegen bedeutet,
dass wir für eine natürliche Zahl keine Quadratzahl finden, sodass der Quotient wieder
eine natürliche Zahl ist, d.h. in der Primfaktorzerlegung der natürlichen Zahl dürfen
nur die Vielfachheiten 1 oder 0 vorkommen. Das Besondere an diesen Eigenschaften ist,
dass sie so unterschiedlich aussehen, man jedoch auf den ersten Blick keine Aussagen
über die Wahrscheinlichkeiten machen kann, mit denen zwei natürliche Zahlen bzw. eine
natürliche Zahl diese Eigenschaft besitzen.
Um nun eine erste Vorstellung zu gewinnen, wie die Eigenschaften auftreten, bietet es
48
sich an, die Schüler experimentieren zu lassen. Also weisen wir sie an, je nach Größe
der Gruppe, beliebige Zahlen auf diese Eigenschaften zu testen und dann die relativen Häufigkeiten zu bilden. Mit entsprechender Ausstattung lässt sich das sehr bequem
mit Computern ausführen. Die Programme sind mit entsprechender Software leicht zu
schreiben, sodass man Stichproben in beliebigen Zahlenbereichen durchführen kann. In
der Programmsprache von Matlab könnten die Programme so aussehen:
%W a h r s c h e i n l i c h k e i t f ü r
%Schranken m und n
d i s p ( ’ Schranke f ü r m’ )
m=i n p u t ( ’m= ’)
d i s p ( ’ Schranke f ü r n ’ )
n=i n p u t ( ’ n= ’)
u=0;
f o r i =1:m;
f o r j =1:n ;
e=gcd ( i , j ) ;
i f ( e==1)
u=u+1;
else
end
end
end
R=u / (m∗n )
T e i l e r f r e m d h e i t z w e i e r Zahlen i n n e r h a l b d e r
%E i n l e s e n d e r Schranken f ü r m und n
%L a u f v a r i a b l e d e r a b s o l u t e n H ä u f i g k e i t
%D u r c h l a u f e n a l l e r Zahle nkombi nation en
%Berechnung d e s ggT
%Bei T e i l e r f r e m d h e i t wird u um 1 e r h ö h t
%Berechnung d e r r e l a t i v e n H ä u f i g k e i t
%W a h r s c h e i n l i c h k e i t f ü r Q u a d r a t f r e i h e i t d e r Zahlen 1 b i s k
d i s p ( ’ Obere Schranke ’ )
k=i n p u t ( ’ k = ’)
%Schranke f e s t l e g e n
u=0;
%L a u f v a r i a b l e d e r a b s o l u t e n H ä u f i g k e i t
f o r n=1:k ;
%D u r c h l a u f e n a l l e r Zahlen
p = factor (n ) ;
%F a k t o r i s i e r u n g
n = unique ( p ) ;
%Löschen d o p p e l t e r Elemente
r = l e n g t h ( n)− l e n g t h ( p ) ;
%Pr üfen ob Längen von n
%und p g l e i c h
i f ( r ==0);
%Erhöhung d e r L a u f v a r i a b l e
u =u+ 1 ;
%f a l l s d i e Längen g l e i c h s i n d
else
end ;
end ;
Q=u/k
%Berechnung d e r r e l a t i v e n H ä u f i g k e i t
Immer wenn Computerprogramme eingesetzt werden, muss man auch die Effizienz dieser diskutieren. Die oben angegebenen Programmvorschläge sind sicher nicht optimal,
weil alle Zahlbereiche komplett durchlaufen werden, erfüllen jedoch ihren Zweck. Im
ersten Programm kann man sich beispielsweise überlegen, oder besser noch die Schüler
überlegen lassen, inwiefern man den Zahlbereich geschickter durchlaufen kann, bzw. wel-
49
che Bereiche man überhaupt durchlaufen muss. Denn wenn ggT (27, 4) = 1, dann ist auch
ggT (4, 27) = 1 und man kann sich die Rechnung einmal sparen. Das zweite Programm
könnte man dahingehend verbessern, dass man nur Zahlen untersucht, die modulo 4 nicht
0 sind, was ein Viertel der Zahlen bereits vor der aufwendigen Faktorisierung als nicht
quadratfrei einstuft. Nochmals verbessert wird dies durch eine zusätzliche Abfrage nach
der Klasse modulo 9. Hier kann man ausprobieren, inwiefern solche Abfragen noch Laufzeitverbesserungen bringen. Z.B. kann ein Test modulo 49 bei jeder Zahl möglicherweise
aufwendiger sein, als die damit ausgeschlossenen Zahlen zu durchlaufen.
Lässt man die beiden Programme nun Zahlenbereiche durchlaufen, so erhält man beispielsweise folgende Tabellen:
Tabelle 5.1:
Obere Grenze m
Obere Grenze n
Relative Häufigkeit
Wahrscheinlichkeit für Teilerfremdheit
10
50
100
500
1000
10
10
50
100
500
0,63 0,626 0,6138 0,6088 0,6087
1000
1000
0,6084
Tabelle 5.2: Wahrscheinlichkeit für Quadratfreiheit
Obere Grenze
10
50
100 1000 10000 100000
Relative Häufigkeit 0,7 0,62 0,61 0,608 0,6083 0,6079
Betrachtet man nun die Ergebnisse, so erkennt man, dass beide relativen Häufigkeiten
anscheinend gegen denselben Zahlenwert konvergieren. Es stellt sich automatisch die
Frage danach, wieso das so ist und ob dieser Wert exakt bestimmbar ist. Hier bietet
es sich an, auf die Einführung der mittleren Ordnung und asymptotischen Äquivalenz
zu verzichten und heuristisch an das Problem heranzugehen, da dies für die Schüler
anschaulicher ist. Auch wenden wir die Strategie des Rückwärtsarbeitens an, bei der wir
nicht wie in Kapitel 1 auf das Problem hinarbeiten, sondern ausgehend vom Problem eine
Lösung suchen. Dieses Vorgehen ist für die Schüler zum einen einfacher zu durchschauen,
weil wir nicht gezwungen werden Bezeichnungen einzuführen, deren Sinn den Schülern
erst später voll bewusst wird, zum anderen erkennen wir hier wesentlich besser, warum
der Grenzwert, auf den wir stoßen, derselbe ist.
5.1.2 Heuristische Betrachtung von Teilerfremdheit und Quadratfreiheit
Wir interpretieren wie üblich P (A) als die Wahrscheinlichkeit mit der das Ereignis A
auftritt.
1. Eine beliebige natürliche Zahl m ist durch eine Primzahl p teilbar, falls m ≡ 0
mod p gilt. Dies träfe in p1 der Fälle zu, wenn die Menge der betrachteten Zahlen endlich und ein Vielfaches von p wäre. Da die natürlichen Zahlen aber unbeschränkt sind, können wir dieses Konzept aus der Wahrscheinlichkeitstheorie nicht
anwenden, d.h. unsere Überlegungen sind nicht mathematisch exakt. Dies wird
50
darin deutlich, dass wir eine Gleichverteilung aller natürlichen Zahlen wegen der
Unbeschränktheit nicht realisieren können und somit auf diesem Weg auch keine
Wahrscheinlichkeiten zuordnen können. Heuristisch gesehen ist unsere Aussage,
dass eine zufällige Zahl mit Wahrscheinlichkeit p1 durch p teilbar ist, jedoch gerechtfertigt, da wir hier einfach die Kongruenzklassen modulo p betrachten, welche
wiederum endlich sind. Die Wahrscheinlichkeit, dass m und eine weitere natürliche
Zahl n durch p teilbar sind, ist, da m und n unabhängig voneinander gewählt
werden, p1 · p1 = p12 . Mit Hilfe des Gegenereignisses erhalten wir also:
P (m, n sind nicht beide durch p teilbar) = 1 − P (m, n sind durch p teilbar)
1
= 1 − 2.
p
2. Wir weiten nun unsere Überlegungen auf zwei verschiedene Primzahlen p und q aus.
Hier stoßen wir auf dasselbe Problem wie in 1., da wir keinen mathematisch exakt
definierten Wahrscheinlichkeitsraum zur Verfügung haben und deshalb nicht über
die Unabhängigkeit der Ereignisse sprechen können. Heuristisch gesehen können
wir jedoch, analog zu oben, unsere Betrachtungen auf die Kongruenzklassen modulo p · q beschränken. Weil p und q beide prim sind, liefert uns diese Betrachtung
mit Hilfe des chinesischen Restsatzes, dass wir die Kongruenzen, und damit unsere
Wahrscheinlichkeiten, getrennt betrachten können. Im Falle getrennter Betrachtungen für p und q multiplizieren sich die Wahrscheinlichkeiten aber einfach auf.
Also erhalten wir:
P (m, n sind nicht beide durch p und q teilbar) = P (m, n sind nicht beide durch p teilbar)
· P (m, n sind nicht beide durch q teilbar)
1
1
= 1− 2 · 1− 2 .
p
q
Wir sehen also, dass sich die Wahrscheinlichkeiten für mehrere Primzahlen einfach
aufmultiplizieren.
3. Die Zahlen m und n sind aber teilerfremd, wenn das Ergeignis m und n sind nicht
”
beide durch p teilbar“ für alle Primzahlen p aufritt.
P (m, n teilerfremd) = P (m, n sind für alle Primzahlen p nicht beide durch p teilbar)
Y
1
=
1− 2 .
p
p∈
P
Hier erkennen wir an Hand der Produktdarstellung bereits den Zusammenhang
mit der Riemannschen Zeta-Funktion, welchen wir aber erst später zeigen.
51
Nun betrachten wir die Wahrscheinlichkeit für Quadratfreiheit. Eine natürliche Zahl n
ist genau durch ein Quadrat q teilbar, wenn für alle Primzahlen p mit p2 |q direkt p2 |n
folgt. Soll also n quadratfrei sein, so muss sie frei von Primzahlquadraten sein. Es folgt
wie oben
Y
1
1− 2 ,
P (n ist quadratfrei) =
p
P
p∈
da die Teilbarkeit durch verschiedene Primzahlen unabhängige Ereignisse sind.
Wir sehen also, wie eng der Zusammenhang zwischen den beiden Eigenschaften wirklich
ist, denn die Wahrscheinlichkeiten gehen beide auf denselben Ausdruck zurück. Allerdings sind wir noch nicht in der Lage, dieses Produkt zu berechnen, da wir den Bezug
zur Zeta-Funktion noch nicht kennen. Deswegen werden wir nun analog zu 3.1.2 versuchen, das Produkt umzuformen und danach ζ(2) ausrechnen. Hierbei ist es dem Lehrer
überlassen, ob er die Zeta-Funktion
mathematisch exakt definiert oder das Symbol ζ(2)
P 1
nur als Abkürzung für
verwendet.
2
n
n∈
N
5.1.3 Die Produktdarstellung von ζ(2)
Es gilt:
Y
1
1 − 2 = ζ(2)−1 .
p
P
p∈
Beweis.
Wir verwenden hier einen anderen Beweis als in 3.1.2, weil wir diesmal etwas anschaulicher vorgehen wollen. Zunächst stellen wir fest, dass es genügt
Y
1
= ζ(2)
1
1
−
p∈P
p2
zu zeigen, da wir dieses Produkt problemlos invertieren können. Als nächstes wenden
wir auf die linke Seite die geometrische Summenformel an und erhalten
!
∞
Y
Y X
1
=
p−2k .
1
p∈P 1 − p2
p∈P k=0
Da wir nun ein unendliches Produkt über unendliche Summen haben, beschränken wir
uns zunächst auf folgenden Fall:
Sei Sx := {p ∈ |p ≤ x}. Dann ist Sx ⊂ und endlich. Betrachten wir nun
!
∞
Y X
−2k
Px :=
p
,
P
P
p∈Sx
k=0
52
so erhalten wir beispielsweise für x = 5:
(1 + 2−2 + 2−4 + . . . ) · (1 + 3−2 + 3−4 + . . . ) · (1 + 5−2 + 5−4 + . . . ).
Wir sehen, dass wir durch geschicktes Auswählen von Einträgen in den Klammern,
die miteinander multipliziert werden, das Inverse jeder Quadratzahl bilden können, die
nur die Primfaktoren 2,3 und 5 enthält. Aufgrund der eindeutigen Primfaktorzerlegung
(PFZ) wird jede dieser Quadratzahlen genau einmal durch die Multiplikation gebildet.
Also können wir allgemein
X
1
Px =
n2
N
n∈
n hat PFZ
in Sx
schreiben. Offensichtlich ist Px nicht negativ, monoton und durch
P
n∈
N
1
n2
nach oben
beschränkt. Deswegen existiert der Grenzwert lim Px .
x→∞
Weil für immer größer werdendes x die Menge Sx immer mehr Primfaktoren enthält, werden im Grenzübergang alle natürlichen Zahlen durchlaufen, da alle Primzahlen kleiner
als unendlich sind. D.h. wir haben
lim Px =
x→∞
Andererseits gilt wegen S∞ = {p ∈
lim Px =
x→∞
X 1
.
n2
n∈
N
P|p ≤ ∞} = P die folgende Gleichheit:
Y
∞
X
p∈S∞
k=0
Y
∞
X
P
k=0
!
p−2k
=
p∈
!
p−2k
.
Insgesamt bekommen wir also
Y
∞
X
P
k=0
p∈
!
p−2k
= lim Px =
x→∞
X 1
,
n2
n∈
N
was unsere Aussage beweist.
Nun haben wir unser Problem auf ein anderes zurückgeführt und erhalten:
P (m, n teilerfremd) = P (n ist quadratfrei) = ζ(2)−1 .
Jetzt stellt sich auch für die Schüler ganz automatisch die Frage, wie man ζ(2) am besten berechnen kann. Dies ist wichtig, da sie so selbst den Nutzen sehen, diese Reihe zu
berechnen, was zu Beginn des Abschnitts keineswegs plausibel war. Wir haben allerdings in unserer Zielgruppe nur begrenzte Kenntnisse aus der Analysis, welche wir zu
Problemlösung nutzen können. Im Folgenden werden wir deswegen einen alternativen
Beweis für 2.1.2 angeben, der andere Voraussetzungen an Analysis und den komplexen
Zahlen erfordert. Somit kann hier der Lehrer wählen, was er für geeigneter hält.
53
5.1.4 Der Wert von ζ(2)
Es gilt:
ζ(2) =
π2
.
6
Im folgenden Beweis orientieren wir uns an der Vorlage aus [AIGNER] Kap. 7.
5.1.5 Beweis von 5.1.4
Wir zeigen die Aussage in mehreren Schritten.
1. Zunächst beweisen wir:
π
2π
mπ
2m(2m − 1)
2
2
2
cot
+ cot
+ · · · + cot
=
.
2m + 1
2m + 1
2m + 1
6
Hierfür nutzen wir die elementare Relation
cos(nx) + i sin(nx) = e(inx) = (cos(x) + i sin(x))n .
Betrachten wir hiervon den Imaginärteil so erhalten wir:
Im(cos(nx) + i sin(nx)) = sin(x)
(1)
und
n−1
[X
2 ]
n
k
(−1)
sin2k+1 (x) cosn−2k−1 (x).
Im ((cos(x) + i sin(x)) ) =
2k + 1
n
(2)
k=0
rx
Setzen wir nun n = 2m + 1 und betrachten die m Werte x = 2m+1
mit r =
π
1, 2, . . . , m, dann ist 0 < x < 2 und nx = rπ, also sin(nx) = 0. Weiterhin ist sin(x)
für alle m positiv und die Werte sind paarweise verschieden, da der Sinus in diesem
Bereich monoton ist. Setzen wir nun (1) und (2) gleich so erhalten wir:
n−1
[X
2 ]
n
k
0=
(−1)
sin2k+1 (x) cosn−2k−1 (x).
2k + 1
k=0
Jetzt teilen wir durch sinn (x) und bekommen:
n
n
n−1
0=
cot
(x) −
cotn−3 (x) + . . . .
1
3
54
(∗)
Nun setzen wir unser oben gewähltes n ein:
2m + 1
2m + 1
2m
0=
cot (x) −
cot2(m−1) (x) + . . . .
1
3
Betrachten wir nun das Polynom p(t) vom Grad m mit
2m + 1 m
2m + 1 m−1
m 2m + 1
,
p(t) :=
t −
t
+ · · · + (−1)
2m + 1
1
3
so kennen wir aus (∗) die m verschiedenen Nullstellen ar bereits, denn
2
ar = cot
rπ
2m + 1
mit r = 1, 2, . . . m.
Das Polynom
π
2m + 1
mπ
2
2
l(t) :=
t − cot
· · · · · cot
1
2m + 1
2m + 1
hat aber ebenso Grad m und dieselben Nullstellen wie p(t), d.h. die Polynome
müssen übereinstimmen. Insbesondere stimmen dann ihre Koeffizienten überein.
Vergleichen wir die Koeffizienten von tm−1 , so erhalten wir:
2m + 1
2m + 1
π
mπ
2
2
−
=−
(cot
+ · · · + cot
)
3
1
2m + 1
2m + 1
2m+1
2m(2m − 1)
3
,
d.h. a1 + · · · + ar = 2m+1 =
6
1
was zu zeigen war.
2. Als nächstes benötigen wir noch eine Aussage desselben Typs. Wir zeigen
csc
2
π
2m + 1
wobei csc(x) =
+ csc
1
sin(x)
2
2π
2m + 1
+ · · · + csc
2
mπ
2m + 1
=
2m(2m + 2)
,
6
die Kosekans-Funktion ist. Es gilt nun
csc2 (x) =
1
cos2 (x) + sin2 (x)
=
= cot2 (x) + 1,
sin2 (x)
sin2 (x)
was uns mit Hilfe von 1. direkt das Ergebnis liefert:
55
2π
mπ
π
2
2
+ csc
+ · · · + csc
csc
2m + 1
2m + 1
2m + 1
π
2π
mπ
2
2
2
= cot
+ 1 + cot
+ 1 + · · · + cot
+1
2m + 1
2m + 1
2m + 1
π
2π
mπ
= cot2
+ cot2
+ · · · + cot2
+m
2m + 1
2m + 1
2m + 1
1. 2m(2m − 1)
=
+m
6
4m2 − 2m + 6m
=
6
2
4m + 4m
=
6
2m(2m + 2)
=
.
6
2
3. Sei nun x ∈ (0, π2 ), so gilt offensichtlich:
0 < sin(x) < x < tan(x)
und wir erhalten durch Bilden der reziproken Werte
0 < cot(x) <
1
< csc(x).
x
Quadrieren liefert dann
cot2 (x) <
1
< csc2 (x).
x2
Setzen wir nun für x die m Werte aus 1. ein und addieren die Ergebnisse, so
erhalten wir:
π
mπ
2m + 1 2
2m + 1 2
cot2
+ · · · + cot2
<
+ ··· +
2m + 1
2m + 1
π
mπ
π
mπ
2
2
< csc
+ · · · + csc
.
2m + 1
2m + 1
Nutzen wir nun unsere Ergebnisse aus 1. und 2. so bekommen wir:
2m(2m − 1)
<
6
2m + 1
π
56
2
+ ··· +
2m + 1
mπ
2
<
2m(2m + 2)
6
und somit
d.h.
1
1
2m(2m + 2)
2m(2m − 1)
2m + 1 2
·
+ ··· + 2 <
<
,
2
6
π
1
m
6
6 2m 2m − 1
1
1
6 2m 2m + 2
< 2 + ··· + 2 < 2
.
2
π 2m + 1 2m + 1
1
m
π 2m + 1 2m + 1
Man sieht direkt, dass für m → ∞ die linke und die rechte Seite gegen
gieren, also ebenso der Ausdruck in der Mitte. Es ist also:
ζ(2) =
π2
6
konver-
∞
X
π2
1
=
.
m2
6
m=0
2
Somit erhalten wir, dass
P (n quadratfrei) = P (m, n teilerfremd) =
6
≈ 0, 6079.
π2
5.2 Der Primzahlsatz
Im zweiten Abschnitt des schulischen Teils wollen wir uns mit dem Primzahlsatz beschäftigen.
Wie eben beginnen wir mit einer Motivation.
5.2.1 Motivation
Die Anzahl aller Primzahlen unter einer Schranke war schon immer ein sehr interessantes
Problem. Es war besonders einfach zu formulieren, jedoch war lange Zeit nicht klar, ob
es überhaupt eine elementare Funktion gibt, die die Primzahlfunktion π(x) annähert.
Besonders interessant ist die Funktion, da man ausgehend von ihr Aussagen über die
Primzahlverteilung machen kann, also etwa, ob die Dichte der Primzahlen konstant bleibt
oder sich verändert.
Um den Schülern einen ersten Überblick zu geben, wie π(x) aussieht, hilft es wieder,
sich die Technik zu Nutze zu machen. Da viele Programme bereits Primzahltests implementiert haben, ist es auch für Schüler nicht schwer, die Primzahlfunktion bis zu einer
beliebigen Schranke zu berechnen und ihren Verlauf graphisch darzustellen. In Matlab
könnte dieses Programm so aussehen:
%Die P r i m z a h l f u n k t i o n
d i s p ( ’ o b e r e Schranke ’ )
n=i n p u t ( ’ n= ’)
%E i n l e s e n d e r o b e r e n Schranke
57
k=1;
%H i l f s v a r i a b l e
f o r i =1:n ;
%D u r c h l a u f d e r Zahlen b i s n
l=i s p r i m e ( i ) ;
%Test a u f P r i m a l i t ä t
i f ( l ==1);
%F a l l s l prim , S p e i c h e r u n g von i im k−t e n
u ( k)= i ;
%E i n t r a g d e s V e k t o r s u
k=k+1;
else ;
end ;
end ;
%S t u f e n p l o t d e r P r i m z a h l f u n k t i o n ,
%l e n g t h ( u ) i s t d i e Anzahl an Primzahlen b i s z u r Schranke n
s t a i r s ([1 u n ] , [ 0 1: length (u) length (u ) ] )
Auch hier ist es sinnvoll, die Frage der Effizienz in den Raum zu stellen. Denn je nach
oberer Schranke kann es beispielsweise deutlich schneller gehen, mit dem Sieb des Eratosthenes zu operieren, um eine Primzahlliste zu erstellen. Auch könnte man von vornherein nur die ungeraden Zahlen durchlaufen und als weitere Verbesserung auch nur die,
die zusätzlich nicht durch 3 teilbar sind. Dies würde eine erhebliche Verringerung der
zu durchlaufenden Zahlen bedeuten, jedoch das Programm verlängern. Auch kommt es
auf den verwendeten Primzahltest an, denn dieser benötigt besonders für große Zahlen
sehr viel der verfügbaren Rechenleistung. Hier können Schüler sehr gut ihre Kreativität
in die Unterrichtsgestaltung mit einfließen lassen und miteinander über die optimalen
Abfragen in den Programmen diskutieren.
Setzen wir als obere Schranke n = 1000000, so erhalten wir folgenden Funktionsgraphen:
Es bietet sich nun an, die Schüler raten zu lassen, welche Funktion diesen Graphen
gut annähern könnte. Hierbei kann man über den Graphen der Primzahlfunktion den
58
vorgeschlagenen Funktionsgraphen zeichnen, was mit Computerprogrammen und einem
Beamer sehr gut funktioniert. So sehen die Schüler dann auch direkt, wo ihre vorgeschlagenen Funktionen gute und wo sie schlechte Annäherungen an die Primzahlfunktion sind.
Allerdings sind die Schüler wahrscheinlich nicht in der Lage, auf die Funktion logx x zu
kommen, da sie mit dieser noch nie konfrontiert wurden.
Eine andere Möglichkeit, die Schüler anschaulich auf die Funktion zu bringen, wäre die
x
Berechnung und Tabellierung von π(x)
. Wir erhalten dabei z.B. folgende Tabelle:
Obere Schranke
x
π(x)
101
2,5
102
4
103
5,95
104
8,14
105
10,43
106
12,74
Hier fällt auf, dass die berechneten Werte nahezu linear mit dem Exponenten der oberen
Schranke ansteigen. Da der Logarithmus in der Schule behandelt wird, ist es durchaus
x
zu erwarten, dass die Schüler die Beziehung π(x)
≈ log x aus der Tabelle herauslesen
können. Es ist wie üblich dem Lehrer überlassen, wie viele Hinweise er gibt und welche
Möglichkeiten er abhängig von den Vorkenntnissen der Schüler für geeignet hält.
Leider können wir den Primzahlsatz wie in Kapitel 3 nicht direkt beweisen. Dies setzt zu
viel Vorwissen in funktionentheoretischen Sachverhalten vorraus, die man den Schülern
auch nicht in angemessener Zeit vermitteln kann. Es gibt zwar noch andere Möglichkeiten,
den Primzahlsatz zu zeigen, jedoch sind auch diese Beweise sehr kompliziert und im schulischen Rahmen nicht durchführbar. Deswegen ist es sinnvoll, an dieser Stelle nur eine
Abschätzung nach oben und unten zu beweisen. Dies illustriert anschaulich, dass sich
die Primzahlfunktion innerhalb eines elementar bestimmbaren Bereiches befindet.
Obwohl der Beweis mit schulischer Analysis durchführbar ist, benötigen wir zunächst
einige Hilfssätze, die uns im eigentlichen Beweis nützlich sein werden. An dieser Stelle
muss man den Schülern klar machen, dass diese Hilfssätze zunächst nichts mit dem
eigentlichen Problem zu tun haben und wir sie nur benötigen, weil sie uns später Lücken
im Beweis schließen. Wir orientieren uns in den Beweisen an der Vorgehensweise aus
[SCHULZE-PILLOT] Kap. 10.
5.2.2 Hilfssatz (Ungleichung für Binomialkoeffizienten)
Für n ∈ gilt:
2n
n
4 < (2n + 1)
.
n
N
Beweis.
Zunächst formen wir die rechte Seite ein wenig um:
2n
(2n)!
(2n + 1)!(n + 1)
2n + 1
(2n + 1)
= (2n + 1)
=
= (n + 1)
.
n
(n!)2
n!(n + 1)!
n
Nun beweisen wir die Aussage durch vollständige Induktion.
59
Induktionsanfang:
Für n = 1 gilt:
2
4 < 6 = 3 ∗ 2 = (2 · 1 + 1)
.
1
1
Induktionsschritt: n → n + 1, n > 1
Auf der linken Seite kommt ein Faktor 4 hinzu. Rechts erkennen wir durch
2n + 3
(2n + 3)!
(n + 2)
= (n + 2)
n+1
(n + 1)!(n + 2)!
(2n + 3)!
=
((n + 1)!)2
(2n + 1)!(2n + 2)(2n + 3)
=
(n!)2 (n + 1)2
2n (2n + 2)(2n + 3)
= (2n + 1)
,
n
(n + 1)2
dass ein Faktor
(2n+2)(2n+3)
(n+1)2
hinzukommt. Wegen
(2n + 2)(2n + 2)
(n + 1)(n + 1)
(2n + 2)(2n + 3)
>
=4
=4
(n + 1)2
(n + 1)2
(n + 1)2
und dem Induktionsanfang erhalten wir die gewünschte Ungleichung.
Nun können wir den folgenden Hilfssatz zeigen, der es uns erlaubt, später die obere
Abschätzung für die Primzahlfunktion zu beweisen.
5.2.3 Hilfssatz (Primzahlschranke)
Für n ∈ gilt:
N
Y
p < 4n .
p≤n
p∈
P
Beweis.
Für n = 1, 2 ist die Aussage trivial. Für n ≥ 3 verwenden wir Induktion und unterscheiden dabei, ob n gerade oder ungerade ist.
Induktionsschritt: n − 1 → n, n ≥ 3
60
1. Sei n gerade, dann ist n keine Primzahl und es gilt:
Y
Y
p=
IV
p ≤ 4n−1 < 4n .
p≤n−1
p∈
p≤n
p∈
P
P
2. Sei n ungerade, d.h. n = 2m + 1, so gilt:
2m + 1 5.2.2 m
< 4 .
p m
Y
m+1<p≤2m+1
p∈
P
Also können wir schreiben:

Y
p≤2m+1
p∈
P
 

 Y  

p=
p

·
p≤m+1
p∈
Y
m+1<p≤2m+1
p∈
P
P
 IV m+1 m
p
4 = 42m+1 .
<4
Die Behauptung ergibt sich direkt aus 1. und 2.
Der letzte Hilfssatz, der eine Abschätzung für das kleinste gemeinsame Vielfache (kgV)
liefert, ist notwendig, um die untere Schranke der Primzahlfunktion zu zeigen.
5.2.4 Hilfssatz (Abschätzung des kgV)
Sei dn := kgV (1, 2, . . . , n), n ∈ . Dann ist für n ≥ 7 stets dn > 2n .
N
Beweis. Der Beweis beruht darauf, das Integral
Z1
I(m, n) :=
xm−1 (1 − x)n−m dx
0
zu berechnen, wobei m, n ∈
1. Wegen (1 − x)n−m =
N mit 1 ≤ m ≤ n.
n−m
P
j=0
I(m, n) =
(−1)j xj gilt:
Z1
n−m
X
1
n−m
1
m−1+j
j n−m
∈
,
(−1)
x
dx =
(−1)
m + j dn
j
j
n−m
X
j=0
n−m
j
Z
j
j=0
0
denn dn ist immer Hauptnenner der Summanden.
61
2. Um I(m, n) auf eine zweite Art zu berechnen, berechnen wir das Integral
Z1
(1 − x + xy)n−1 dx
0
mit y ∈ [0, 1) ebenso auf zwei Arten.
a) Für die erste Art nutzen wir die Darstellung durch Binomialkoeffizienten.
Z
1
n−1
(1 − x + xy)
dx =
0
n−1
X
m=0
Z1
n−1
(1 − x)n−m−1 (xy)m dx
m
m→m−1
=
0
n X
n−1
m−1
m=1
=
(1 − x)n−m (xy)m−1 dx
0
n X
m=1
Z1
n − 1 m−1
y
I(m, n).
m−1
b) Für die zweite Art rechnen wir das Integral einfach aus.
Z1
(1 − x + xy)n
dx =
n(y − 1)
n−1
(1 − x + xy)
x=1
0
x=0
yn
1
−
n(y − 1) n(y − 1)
1 yn − 1
=
n y−1
geom. Summe 1
=
(1 + y + y 2 + · · · + y n−1 ).
n
=
Da die Faktoren 1, y, y 2 , . . . linear unabhängig auf [0, 1) sind, können wir Koeffizientenvergleich auf a) und b) anwenden und erhalten
n−1
1
I(m, n) = ,
m−1
n
d.h. es gilt
I(m, n) =
1
n
=
n−1
m−1
1
m
n
m
.
3. Vergleichen wir nun 1. und 2. so bekommen wir, dass es eine ganze Zahl c gibt,
sodass
62
1
m
=
n
m
c
dn
gilt. Formen wir dies um, so erhalten wir:
n
n
dn = cm
, d.h. m
|dn .
m
m
4. Insbesondere gelten dann auch:
•
•
2n
n
|d2n |d2n+1 ,
n
2n
2n + 1 Symm.
2n + 1
(2n + 1)
= (n + 1)
= (n + 1)
|d2n+1 .
n
n
n+1
Also haben wir wegen ggT (n, 2n + 1) = 1
2n
n(2n + 1)
|d2n+1 ,
n
und wegen 5.2.2 gilt
d2n+1 > n4n .
5. Folglich gilt:
• für n ≥ 2: d2n+1 > 2 · 4n = 22n+1 ,
• für n ≥ 4: d2n+2 ≥ d2n+1 ≥ 4n+1 = 22n+2 .
Somit haben wir die Behauptung gezeigt für gerade n ≥ 5 und ungerade n ≥ 10.
Es bleibt der Fall n = 8 übrig, welchen wir schnell nachrechnen:
d8 = 23 · 3 · 5 · 7 = 840 > 256 = 28 .
Damit ist die Behauptung bewiesen.
Jetzt können wir die Abschätzung formulieren, veranschaulichen jedoch vor dem Beweis
die Bedeutung dieser Abschätzung mit Hilfe eines Graphen, in den wir π(x) und die
Abschätzungen eintragen. So können die Schüler sich besser vorstellen, wie genau diese
Abschätzung ist und was diese leisten, bzw. nicht leisten kann. Zunächst geben wir die
Abschätzung an:
63
5.2.5 Abschätzung der Primzahlfuntkion
Für alle n ≥ 4 gelten die Ungleichungen:
n
n
log log n
log 2
≤ π(n) ≤ log 4 + 8
.
log n
log n
log n
Das folgende Bild zeigt, dass die Abschätzung zwar richtig, aber keineswegs sehr gut ist:
5.2.6 Beweis der Abschätzung
Wir zeigen zunächst die erste Ungleichung:
Sei p ein Primteiler von dn und e ∈ so, dass pe |dn und pe+1 6 |dn . Wir schreiben dafür
auch pe ||dn . Dann existiert eine natürliche Zahl m ≤ n mit pe ||m. Deshalb gilt:
Y
Y
pe ≤
n = nπ(n) ,
dn =
N
p≤n
pe ||dn
p∈
P
d.h.
p≤n
p∈
P
log dn ≤ π(n) log n.
Für n ≥ 7 ist dies wegen 5.2.4 äquivalent zu:
π(n) ≥
log(2n )
n
= log 2
.
log n
log n
Die Fälle n = 4, 5, 6 gelten ebenfalls, wie man leicht nachrechnet:
64
n
4
5
6
log 2 logn n
2
2, 15 . . .
2, 32 . . .
π(n)
2
3
3
Also ist die erste Ungleichung bewiesen.
Die zweite Ungleichung ist nicht so leicht zu zeigen. Hierfür gehen wir in mehreren
Schritten vor, die größtenteils einer Funktionsdiskussion in der Oberstufe entsprechen.
1. Sei t ∈ [1, n). Es ist
tπ(n)−π(t) ≤
Y
5.2.3
p ≤ 4n
t<p≤n
p∈
P
(π(n) − π(t)) log t ≤ n log 4
n
n
π(n) ≤ log 4
+ π(t) ≤ log 4
+ t.
log t
log t
2. Wir suchen nun das t, für das die Funktion auf der rechten Seite minimal wird, um
die beste Abschätzung zu erhalten. Da wir dieses aber nicht elementar ausrechnen
können, wählen wir stattdessen t := logn2 n . Einsetzen in 1. liefert dann:
n
n log 4
n
=
π(n) ≤
+
2
log n − 2 log log n log n
log n
log 4
1−
2 log log n
log n
1
+
log n
!
.
Ein Vergleich mit der gesuchten Abschätzung zeigt uns nun, dass es genügt
log 4 + 8
log 4
1
log log n
+
≥
2
log
log
n
log n
log n
1 − log n
(∗)
zu beweisen.
3. Um dies zu zeigen, setzen wir L = L(x) := 2 logloglogx x für x > 1. Es gilt dann:
L(x) > 0 ⇔ log log x > 0 ⇔ log x > 1 ⇔ x > e.
Ab jetzt sei immer x > e. Weiter ist L0 (x) =
d
dx L(x)
log x
und es gilt:
= 2 1−log
x log2 x
L0 (x) = 0 ⇔ log log x = 1 ⇔ x = ee ≈ 15, 15 . . . .
Weiterhin bemerken wir, dass L(x) ab x = ee monoton fallend ist und dass L(ee ) =
2
e < 1 gilt. Dies wird im nächsten Schritt zusammen mit L > 0 bei (∗∗) ausgenutzt.
65
4. Nun beginnen wir die Ungleichung (∗) umzuformen und sie mit L(x) in Verbindung
zu bringen.
log 4
1−
2 log log n
log n
+
1
log log n
≤ log 4 + 8
log n
log n
log 4
1
+
≤ log 4 + 4L
1 − L log n
1
⇔ log 4
− 1 ≤ log 4 + 4L
1−L
L
1
log 4
≤L−
⇔
4
1−L
4 log n
log 4
1−L
(∗∗)
⇔
≤1−L−
4
4L log n
log 2
1
1
⇔ L≤1−
−
+
2
4L log n 4 log n
1
1
log 2
L=L(n)
−
+
⇔
L≤1−
2
8 log log n 4 log n
⇔
(#)
5. Wir fassen nun beide Seiten von (#) als Funktion in x. Die Ableitung der linken
Seite kennen wir, die der rechten Seite ist
d
dx
log 2
1
1
1
1
1−
−
+
=
−
2
8 log log x 4 log x
8x(log x)(log log x)2 4x log2 x
1
1
1
=
−
.
4x log x 2(log log x)2 log x
6. Als nächstes vergleichen wir die Ableitungen der beiden Seiten von (#), um eine
Aussage über das Wachstum der beiden Funktionen machen zu können.
⇔
⇔
⇔
⇔
d
d
log 2
1
1
L(x) ≤
1−
−
+
dx
dx
2
8 log log x 4 log x
1 − log log x
1
1
1
2
≤
−
4x log x 2(log log x)2 log x
x log2 x
8
1
1
(1 − log log x) ≤
−
log x
2(log log x)2 log x
log x
8 − 8 log log x ≤
−1
2(log log x)2
log x
9 ≤ 8 log log x +
2(log log x)2
66
Man sieht, dass die Ungleichung auf jeden Fall für x ≥ ee erfüllt ist, da die rechte
Seite dort monoton steigend ist und log log x ≥ 1 sowie 2(logloglogx x)2 ≥ 2e gelten.
7. Durch 6. erhalten wir, dass, wenn (#) für ein x0 ≥ ee erfüllt ist, die Ungleichung
auch für alle x ≥ x0 erfüllt ist. Setzen wir x0 = 250, so ist L(x0 ) = 0, 618 . . . und
die rechte Seite von (#) hat den Wert 0, 625 . . . für x0 . Also ist die Ungleichung
(#) für x ≥ 250 und damit wegen 4. auch (∗) erfüllt. Für die verbleibenden n ∈
zwischen 4 und 250 rechnet man die Ungleichung direkt nach. Damit ist auch die
zweite Ungleichung bewiesen.
N
Nun ist es sinnvoll, den Schülern noch einen Ausblick zu geben, was in der analytischen
Zahlentheorie möglich ist. Der eigentliche Primzahlsatz aus 3.3.3 kann verbessert werden durch π(x) ≈ logx x + logx2 x . Eine noch bessere Approximation ist jedoch die Funktion
Rx
li(x) = 2 log1 x dx. Diese Approximation ist nicht nur wesentlich besser, sondern lässt
sich darüberhinaus interpretieren. Für große Zahlen hat nämlich die Primzahlfunktion
d
d
ungefähr die Steigung dx
π(x) ≈ dx
li(x) = log1 x . D.h. die Wahrscheinlichkeit für eine
Zahl in einem Bereich um x 0 prim zu sein ist ungefähr log1 x . Unter Annahme der
√
Riemannschen Vermutung kann man sogar den Fehlerterm von li(x) auf O( x log x) bestimmen. Um die Fortschritte in den Abschätzungen zu verdeutlichen, bietet es sich an,
die Schüler mit Hilfe von Programmen Tabellen erstellen zu lassen, welche einen guten
Überblick über die Abschätzungen bietet. Beispielsweise könnte eine Tabelle folgendermaßen aussehen, wobei der Lehrer die Werte der Größenordnungen angibt, in denen die
Programme versagen:
x
10
102
103
104
105
106
107
108
109
1010
1011
1012
1013
1014
1015
π(x)
x
log x
li(x)
4
25
168
1.229
9.592
78.498
664.579
5.761.455
50.847.534
455.052.511
4.118.054.813
37.607.912.018
346.065.536.839
3.204.941.750.802
29.844.570.422.669
4
22
145
1.086
8.686
72.382
620.421
5.428.681
48.254.942
434.294.482
3.948.131.654
36.191.206.825
334.072.678.387
3.102.103.442.166
28.952.965.460.217
6
30
178
1.246
9.630
78.628
664.918
5.762.209
50.849.235
455.055.615
4.118.066.401
37.607.950.281
346.065.645.810
3.204.942.065.692
29.844.571.475.288
67
1016
1017
1018
1019
1020
279.238.341.033.925
2.623.557.157.654.233
24.739.954.287.740.860
234.057.667.276.344.607
2.220.819.602.560.918.840
271.434.051.189.532
2.554.673.422.960.305
24.127.471.216.847.324
228.576.043.106.974.646
2.171.472.409.516.259.138
279.238.344.248.557
2.623.557.165.610.822
24.739.954.309.690.415
234.057.667.376.222.382
2.220.819.602.783.663.484
Man erkennt hier sehr gut, dass der in 3.3.3 bewiesene Primzahlsatz wirklich nur als
asymptotische Aussage anzusehen ist, da er selbst in der Größenordnung 1020 in der
zweiten Stelle schon einen Fehler besitzt. Die li(x)-Funktion hingegen stimmt in den ersten 10 Stellen mit π(x) überein, ist also wesentlich besser, jedoch selbst mit Computern
aufwändiger zu berechnen. Es bleibt allerdings noch die Frage offen, wie man π(1020 )
exakt bestimmt, da bei solch hohen Zahlen der Speicher der Computer nicht ausreichend
für eine komplette Auflistung ist. Man kann mit Hilfe der Möbius-Transformation zeigen
(siehe [BORWEIN]), dass
Z∞
∞
∞
∞
∞
X
X
µ(n) 1 X µ(n) X ρ X µ(n)
dt
µ(n)
π(x) =
li x n −
li x n +
−log
2
2
n
n ρ
n
(t − 1)t log t
n
n=1
n=1
n=1
1
n=1
xn
gilt, wobei die Summe über ρ alle nichttrivialen Nullstellen ρ der Riemannschen Zetafunktion durchläuft. Mit diesem Ausdruck ist es möglich π(x) bis zu einer gewissen, von
der Technik vorgegebenen Schranke exakt zu bestimmen, was wir aber hier nicht weiter
verfolgen werden.
5.3 Die durchschnittliche Anzahl an Primfaktoren
In unserem letzten Abschnitt suchen wir einen anderen Zugang zur Abschätzung der
durchschnittlichen Anzahl an Primfaktoren als in Kapitel 4. Wir könnten zwar dieselbe Vorgehensweise benutzen, da die Beweise unter Anleitung eines Lehrers auch für
Schüler verständlich sind, jedoch kann man hier mit experimentellen Mitteln wesentlich
anschaulicher die Abschätzungen annähern. Zunächst motivieren wir das Thema.
5.3.1 Motivation
Da wir im eben das Verhalten der Primzahlfunktion untersucht haben, wissen wir nun,
dass wir Grenzen angeben können, in denen die Primzahlfunktion verläuft. Die nächste
natürliche Frage, die sich stellt, ist, wie sich die Anzahl an Primfaktoren verhält. Hier
müssen wir jedoch unterscheiden, ob wir die Vielfachheiten berücksichtigen oder nicht.
Auf Anhieb lässt sich nur sagen, dass wir, wenn wir die Vielfachheiten berücksichtigen,
einen höheren durchschnittlichen Wert an Primfaktoren erwarten werden, als ohne Berücksichtigung der Vielfachheiten, was klar ist. Allerdings interessiert uns auch, wie stark sich
die beiden Werte unterscheiden und wie wir das Wachstum abschätzen können.
68
Wie üblich bei zahlentheoretischen Problemen ist es sinnvoll, sich die Verteilungen mit
einem Computer visuell darstellen zu lassen. Wir benutzen im Folgenden die Darstellungen Ω(n) bzw. ω(n) für die durchschnittliche Anzahl an Primfaktoren mit bzw. ohne
Berücksichtigung der Vielfachheiten bis zur Schranke n ∈ . Zur Berechnung von Ω(n)
greifen wir auf das Matlab Programm
N
%Durchschnittliche Anzahl an Primfaktoren mit Vielfachheiten
disp(’Obere Schranke eingeben’) %Schranke festlegen
n=input(’n=’);
u=0;
%Absolute Anzahl an Primfaktoren
for i=1:n;
p=factor(i);
%Faktorisierung
u=u+length(p);
%Erhöhung der Laufvariablen um
%die Anzahl der Primfaktoren von i
end
M=u/n
%Berechnung des Durchschnittswertes
zurück und zur Bestimmung von ω(n) auf das Programm:
%Durchschnittliche Anzahl an Primfaktoren ohne Vielfachheiten
disp(’Obere Schranke eingeben’) %Obere Schranke festlegen
n=input(’n=’);
u=0;
%Laufvariable
for i=1:n;
p=factor(i);
%Faktorisierung
k=unique(p);
%Löschen doppelter Einträge
u=u+length(k);
%Erhöhung der Laufvariablen um
%die Anzahl an verschiedenen Primfaktoren
end
O=u/n
%Berechnung des Durchschnittswertes
Natürlich sollte hier wieder die Effizienz der Programme eine große Rolle spielen, so wäre
es sicher geschickt, beide Programme zu verknüpfen, um nur einmal Faktorisieren zu
müssen. Erneut ist es dem Lehrer überlassen, ob er selbst bessere Programme vorschlägt
oder das Problem als Knobelaufgabe an die Schüler weitergibt.
Nun betrachten wir wie bereits bei den vorherigen Problemstellungen verschiedenen
Zahlbereiche und stellen Ω(n) und ω(n) gegenüber. Es ergibt sich folgende Tabelle:
Tabelle 5.4: Durchschnittliche Anzahl an Primfaktoren bis zur Schranke n
Schranke n 10 100
1000
10000 100000 1000000
Ω(n)
ω(n)
1,6
1,2
2,4
1,72
2,8780
2,1270
3,1986
2,4301
3,4362
2,6640
3,6266
2,8537
In dieser Darstellung erkennen wir an der Tabelle nur, dass die Durchschnittswerte sehr
langsam ansteigen. Nun wird von den Schülern sicher der Vorschlag kommen, sich die
69
beiden Funktionen zeichnen zu lassen. Dies ist eine hervoragende Idee, wie wir gleich
sehen werden. Setzen wir als obere Schranke 10000, so erhalten wir folgende Funktionsgraphen:
Hier erkennen wir und insbesondere die Schüler schon viel eher, wie die beiden Funktionen zusammenhängen, denn die Steigungen scheinen für große Zahlenwerte nahezu
identisch zu sein, was den parallelen Verlauf erklärt. Betrachten wir dazu noch die Differenz Ω(n) − ω(n), so erhalten wir:
Tabelle 5.5: Differenz von Ω(n)und ω(n)
Schranke n
10 100 1000 10000 100000
Ω(n) − ω(n)
0,4
0,7
0,751
0,7685
0,7722
1000000
0,7729
Man sieht hier, dass die Differenz zu konvergieren scheint, was unsere Vermutung der
identischen Steigung bestätigt. Tatsächlich ist der Grenzwert dieser Differenz die Differenz der beiden Konstanten C1 und C2 aus Abschnitt 4.2 für die C2 − C1 ≈ 0, 7731 gilt.
Als Nächstes versuchen wir mehr über die Funktionen herauszufinden. Da wir ein sehr
langsames Wachstum, z.B. ein logarithmisches, vermuten, benutzen wir eine logarithmische Skalierung und erhalten:
70
Offensichtlich reicht die logarithmische Skalierung nicht aus, denn der Graph ist immernoch sichtbar gekrümmt. Deswegen skalieren wir nochmals logarithmisch, um dann
folgenden Graph zu bekommen:
In dieser Skalierung können wir nun einen nahezu linearen Zusammenhang beobachten.
Also können wir nun für große n folgende approximierende Funktionen annehmen:
71
ω(n) ≈ log log(a1 n) + b1 ,
Ω(n) ≈ log log(a2 n) + b2 .
Hierbei sind a1 , a2 , b1 , b2 reelle Konstanten, welche es nun zu bestimmen gilt. Aufgrund
der Linearität bei einer doppelt logarithmischen Skalierung können wir a1 und a2 als
Steigungen der Geraden auffassen. Diese lassen sich mit mit Hilfe eines Steigungsdreiecks approximieren, eine den Schülern gut bekannte Methode. Wir erhalten dann für
hinreichend große Zahlen:
a1 =
ω(100000) − ω(50000)
2, 6640 − 2, 5991
=
≈ 1, 045 ≈ 1,
log log(100000) − log log(50000)
0, 0621
a2 =
Ω(100000) − Ω(50000)
3, 4362 − 3, 3706
=
≈ 1, 056 ≈ 1.
log log(100000) − log log(50000)
0, 0621
Somit bekommen wir relativ gute Abschätzungen für a1 und a2 , welche nah am realen Wert 1 liegen. Es bleibt nun noch übrig die Konstanten b1 und b2 zu bestimmen.
Dies bewerkstelligen wir mit einfachem Einsetzen einer möglichst großen Zahl in unsere
Funktion und Vergleichen mit dem berechneten Wert aus unserem Programm.
b1 = ω(100000) − log log(100000) ≈ 2, 6640 − 2, 4435 ≈ 0, 2205,
b2 = Ω(100000) − log log(100000) ≈ 3, 4362 − 2, 4435 ≈ 0, 9927.
Auch hier erhalten wir im Rahmen unserer Mittel gute Abschätzungen, denn die Fehler
|b1 − C1 | ≈ |0, 2205 − 0, 2615| = 0, 041 und |b2 − C2 | ≈ |0, 9927 − 1, 0347| = 0, 042 sind
klein und können je nach gewünschter Genauigkeit mit erhöhtem Rechenaufwand weiter
reduziert werden. D.h. wir konnten mit einfachen numerischen Methoden die in Kapitel 4
hergeleiteten Ausdrücke annähern, ohne Kenntnisse der höheren Mathematik vorauszusetzen. Dies ist gerade für Schüler interessant, die sich für alternative Problemlösungen
interessieren und eine gute Abwechslung zu den Methoden in 5.1 und 5.2.
72
Symbolverzeichnis
O(g) Landau-Symbol als Abschätzung für das Wachstumsverhalten . . . . . . . . . . . . . . 14.
µ(n)
Möbius-Funktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12.
Ω(n) Anzahl an Primfaktoren unter Berücksichtigung der Vielfachheiten . . . . . . . . . 12.
ω(n)
Anzahl verschiedener Primfaktoren in n . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12.
Φ(s)
Summe über
ϕ(n)
Eulersche ϕ-Funktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.
π(x)
Anzahl an Primzahlen bis zur Schranke x . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22.
ϑ(x)
Summe über log p bis zur Schranke x . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22.
ζ(s)
Riemannsche Zetafunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.
log p
ps
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22.
73
Literaturverzeichnis
[AIGNER] Aigner M. & Ziegler G. 2004, Das Buch der Beweise 2. Auflage, Springer Berlin
[BORWEIN] Borwein J. M., Bradley D. M. & Crandall R. E. 2000, Computational
Strategies for the Riemann Zeta Function, Journal of Computational and Applied
Mathematics Vol. 121 S. 247-296
[EDWARDS] Edwards H. M. 2001, Riemann’s Zeta Function, Dover Pubns - Dover
[FREITAG] Freitag E. & Busam Rolf 2006, Funktionentheorie 1, Springer - Berlin
[GEKELER] Unkorrigierte Vorlesungsmitschrift aus der Vorlesung Elementare
”
Zahlentheorie“aus dem Jahr 2003, gehalten von Prof. Dr. Ernst-Ulrich Gekeler an
der Universität des Saarlandes
[HARDY] Hardy G. H. & Wright E. M. 2008, An Introduction To The Theory Of
Numbers, Oxford University Press - Oxford
[HAVIL] Havil J. 2003, Gamma: Exploring Euler’s Constant, Princeton University
Press - Princeton
[HEUSER] Heuser Harro 2009, Lehrbuch der Analysis Teil 1, 17. Auflage,
Vieweg+Teubner - Wiesbaden
[JAENICH] Jänich, K. 2004, Funktionentheorie 6. Auflage, Springer - Berlin
[NEWMAN] Newman D. J. 1980, Simple Analytic Proof Of The Prime Number
Theorem, The American Mathematical Monthly Vol. 87 No. 7, Mathematical
Association of America - Washington DC
[SCHULZE-PILLOT] Schulze-Pillot R. 2007, Elementare Algebra und Zahlentheorie,
Springer - Berlin
[ZAGIER] Zagier D. 1997, Newman’s Short Proof Of The Prime Number Theorem,
The American Mathematical Monthly Vol. 104 No. 8, Mathematical Association of
America - Washington DC
74
Herunterladen
Explore flashcards