Experimente in der Zahlentheorie

Staatsexamensarbeit
Experimente in der Zahlentheorie:
Teilbarkeit, Quadratfreiheit und Primzahlverteilung
Frank Jahn
1
Inhaltsverzeichnis
1 Einleitung
1.1 Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2 Danksagung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2 Wahrscheinlichkeiten für Teilerfremdheit und Quadratfreiheit
2.1 Die Riemannsche Zetafunktion . . . . . . . . . . . . . . . . .
2.2 Die Funktionen ϕ(n) und µ(n) . . . . . . . . . . . . . . . . .
2.3 Asymptotische Äquivalenz und mittlere Ordnung . . . . . . .
2.4 Wahrscheinlichkeiten für Teilerfremdheit und Quadratfreiheit
3 Der
3.1
3.2
3.3
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
4
4
5
6
6
10
14
18
Primzahlsatz
22
Die Funktionen Φ(s) und ϑ(x) . . . . . . . . . . . . . . . . . . . . . . . . 22
Das analytische Theorem von Newman . . . . . . . . . . . . . . . . . . . . 29
Der Primzahlsatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
4 Die durchschnittliche Anzahl an Primfaktoren
37
4.1 Die Sätze von Mertens . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
4.2 Die durchschnittliche Anzahl an Primfaktoren . . . . . . . . . . . . . . . . 43
5 Zahlentheoretische Probleme in der Schule
48
5.1 Wahrscheinlichkeiten für Teilerfremdheit und Quadratfreiheit . . . . . . . 48
5.2 Der Primzahlsatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
5.3 Die durchschnittliche Anzahl an Primfaktoren . . . . . . . . . . . . . . . . 68
Symbolverzeichnis
73
Literaturverzeichnis
74
2
Eidesstattliche Erklärung
Ich versichere hiermit, dass ich die Arbeit selbständig angefertigt habe und keine anderen
als die angegebenen Quellen und Hilfsmittel benutzt habe.
3
1 Einleitung
1.1 Einleitung
Die Zahlentheorie gilt als die mathematische Königsdisziplin und bringt oft einfach
verständliche, jedoch schwer zu beweisende Aussagen zum Vorschein. Gerade im schulischen Bereich verzichtet man daher wegen Zeitmangel und fehlenden Leitfäden für die
Unterrichtsgestaltung komplett auf dieses große Feld der Mathematik. In dieser Staatsexamensarbeit werden deshalb interessante und einfach zu formulierende Aussagen aus
der sogenannten elementaren Zahlentheorie“aufgegriffen und aufbereitet. Wir begin”
nen im zweiten Kapitel die beiden Eigenschaften Quadratfreiheit und Teilerfremdheit zu
untersuchen und werden zu einem verblüffenden Ergebnis kommen. Im dritten Kapitel
steht die Primzahlfunktion im Mittelpunkt, die die Mathematiker bis heute beschäftigt,
und im nachfolgenden Kapitel untersuchen wir das Wachstum der Primfaktoren. Im
letzten Teil der Arbeit werden die Themen aus den vorherigen Abschnitten erneut aufgegriffen und in einer für Schüler angemessenen Form präsentiert. Diese Arbeit kann
und soll auch als Anleitung und Anregung für Lehrer verstanden werden, diese Themen
zum Inhalt einer Mathematik AG in der Oberstufe zu machen. Deswegen sind an vielen
Stellen didaktische Hinweise zu finden, wie man den Schülern die nicht immer einfachen
Aussagen trotz fehlendem Vorwissen veranschaulichen kann. Auch leitet diese Arbeit
zum Experimentieren an, denn kaum ein Mathematiker findet Lösungen für Probleme,
ohne verschiedene Methoden und Verfahren auszuprobieren und sie dann so zu wählen,
dass er auf eine möglichst einfache Art und Weise ein Ergebnis erzielt. Gerade in der
heutigen Zeit bietet es sich an, mit Schülern an Computern besondere Eigenschaften
von Funktionen herauszuarbeiten und graphisch darzustellen, um somit Vermutungen
aufzustellen, welche dann bewiesen werden.
Für die ganze Arbeit gelten, wenn nicht anders angegeben, folgende Notationen:
•
•
•
•
•
•
N := {1, 2, 3, . . . }
N0 := {0} ∪ N
P := {n ∈ N|n ist Primzahl}
R+ := {x ∈ R|x > 0}
Sei x ∈ R, dann ist [x] definiert als der ganzzahlige Anteil von x und {x} := x−[x].
Seien m, n ∈ N, dann bedeutet m|n, dass m ein Teiler von n ist.
4
1.2 Danksagung
Ich bedanke mich an erster Stelle bei Herrn Professor Gekeler für das sehr interessante
Thema und die exzellente Betreuung während des ganzen Studiums. Weiterhin bedanke ich mich bei Johannes Lengler für die vielen Ratschläge und Diskussionen, die diese
Arbeit entscheidend geprägt haben. Nicht zuletzt bedanke ich mich bei meiner Freundin
Luisa Kleine, die mit ihrem sprachlichen Talent so manche Formulierung entscheidend
verbessert hat und natürlich bei meinen Eltern, die mich während meines ganzen Studiums stets unterstützt und motiviert haben.
5
2 Wahrscheinlichkeiten für Teilerfremdheit
und Quadratfreiheit
In diesem Kapitel interessieren wir uns vor allem für die Wahrscheinlichkeiten, mit denen zwei zufällig ausgewählte Zahlen teilerfremd sind, bzw. eine zufällig ausgewählte
Zahl quadratfrei ist. Auf den ersten Blick haben die beiden Eigenschaften Teilerfremd”
heit“und Quadratfreiheit“nicht viel gemeinsam, jedoch wird sich im Laufe des Kapitels
”
herausstellen, dass auf der Ebene der Wahrscheinlichkeiten enge Zusammenhänge bestehen. Bevor wir uns jedoch die Probleme genauer betrachten, befassen wir uns mit den Eigenschaften der Riemannschen Zetafunktion, da uns diese im Laufe der Beweisführungen
immer wieder begegnen wird. In vielen Beweisen des Kapitels halten wir uns grob an
die unausgearbeitete Vorgehensweise von [GEKELER] in Kap.7 & 11, falls nicht, wird
darauf hingewiesen.
2.1 Die Riemannsche Zetafunktion
2.1.1 Definition
Die Funktion
ζ(s) =
∞
X
n−s =
n=1
X
n∈
N
n−s
C
heißt Riemannsche Zetafunktion. Sie ist definiert für s ∈ , Re(s) > 1, und die Summe
konvergiert für diese s absolut (Beweis siehe [EDWARDS] Kap. 1.4).
Der folgende Satz über ζ(s) ist von großer Bedeutung für unsere gesuchten Aussagen
und wurde erstmals von Euler im Jahr 1735 gezeigt.
2.1.2 Satz
Es gilt
ζ(2) =
π2
.
6
Um diese Aussage zu beweisen, zeigen wir zunächst das folgende Lemma:
6
2.1.3 Lemma
Sei 4 = {(u, v) ∈ 2 |u, v ≥ 0, u + v ≤ π2 } mit Innerem
I := (0, 1) das Einheitsintervall. Dann
4̊ = {(u, v) ∈ 2 |u, v > 0, u + v < π2 } und sei ˚
ist die Abbildung
sin u sin v
Φ : (u, v) 7→
,
cos v cos u
R
R
eine Bijektion von 4̊ nach ˚
I ×˚
I = (0, 1) × (0, 1).
Beweis.
Der Cosinus ist auf (0, π2 ) streng monoton fallend. Deshalb folgt aus v <
π
cos(v) > cos
− u = sin u,
2
π
2
− u:
sin u
sin v
d.h. cos
v < 1. Analog folgt cos u > 1, da der Sinus in diesem Intervall streng monoton
sin v
sin u
wachsend ist. Wir setzen nun x := cos
v , y := cos u und erhalten:
sin2 u = x2 cos2 v
und
sin2 v = y 2 cos2 u
Da 1 = cos2 v+sin2 v gilt, können wir sin2 v ersetzen und einige Umformungen durchführen:
1 = cos2 v + y 2 cos2 u
⇔ cos2 v = 1 − y 2 cos2 u
⇔ cos2 v = 1 − y 2 (1 − sin2 u)
⇔ cos2 v = 1 − y 2 (1 − x2 cos2 v)
⇔ (1 − x2 y 2 ) cos2 v = 1 − y 2
s
1 − y2
⇔ cos v =
1 − x2 y 2
Schließlich bekommen wir:
s
v = arccos
1 − y2
1 − x2 y 2
!
1 − x2
1 − x2 y 2
!
.
(2.1)
.
(2.2)
Analog erhält man aus 1 = cos2 u + sin2 u:
s
u = arccos
Die Gleichungen (2.1) und (2.2) liefern uns somit das Linksinverse Φ−1 zu Φ.
7
Um zu zeigen, dass Φ−1 auch Rechtsinverse zu Φ ist, rechnen wir nach, dass Φ◦Φ−1 = id
gilt. Wir erhalten also:
s
s
!
!!
2
1
−
x
1 − y2
−1
Φ ◦ Φ (x, y) = Φ arccos
, arccos
1 − x2 y 2
1 − x2 y 2

q

q
1−y 2
1−x2
sin
arccos
sin
arccos
1−x2 y 2
1−x2 y 2


q

=
,
q
2
1−y
1−x2
cos arccos
cos arccos
1−x2 y 2
1−x2 y 2
r

r
q
q

1−y 2
1−x2
2 arccos
2 arccos
1
−
cos
1
−
cos
1−x2 y 2
1−x2 y 2



q
q
=
,


2
1−x2
1−x2 y 2
1−y
1−x2 y 2
q
1−
= q
1−x2
1−x2 y 2
1−y 2
1−x2 y 2
q
1−
, q
1−y 2
1−x2 y 2
1−x2
1−x2 y 2


q
q

1−y 2
1−x2
y 2 1−x
x2 1−x
2 y2
2 y2

= q
, q
2
1−x2
1−x2 y 2
1−y
1−x2 y 2
= (x, y) .
Hierbei können wir auf Betragsstriche verzichten, da x und y stets positiv sind. Also ist
Φ−1 Links- und Rechtsinverses und somit Umkehrabbildung zu Φ.
Nun können wir Satz 2.1.2 beweisen:
2.1.4 Beweis von Satz 2.1.2
Der folgende Beweis stammt von Calabi aus dem Jahr 1985. Er besteht darin, das Doppelintegral über die Funktion 1−x12 y2 auf zwei verschiedene Arten zu berechnen. Hierfür
sei I = [0, 1] und I = [0, 1 − ] mit 1 > > 0.
1. Es gilt:
∞
X
x2 y 2
i
i=0
=
1
, ∀(x, y) ∈ I × I .
1 − x2 y 2
Mit der Summenformel der geometrischen Reihe
∞
X
i=0
qi =
1
mit |q| < 1
1−q
8
folgt dies direkt, wenn wir q = x2 y 2 setzen. Insbesondere ist dann die Voraussetzung an q erfüllt, da x und y in I liegen sollen, und die Summe ist absolut konvergent. Mit Hilfe dieser Umformung und der absoluten Konvergenz (∗) können wir
schreiben:
Z Z
Z Z X
∞
1
dxdy =
1 − x2 y 2
I I
(∗)
=
I I
∞ Z
X
i=0
i=0 I
I
Z
=
x2 y 2
i
dxdy
x2i y 2i dxdy
∞
X
(1 − )2i+1
(2i + 1)2
i=0
Obige Summe ist ebenfalls absolut konvergent (#), da der Zähler betragskleiner
als eins ist und der Nenner quadratisch wächst. Wir erhalten nun das gesuchte
Integral, wenn wir gegen 0 gehen lassen:
Z Z
Z Z
1
1
dxdy = lim
dxdy
2
2
→0
1−x y
1 − x2 y 2
I
I
= lim
I I
∞
X
→0
(#)
=
i=0
∞
X
i=0
(1 − )2i+1
(2i + 1)2
1
(2i + 1)2
Dies ist eine Summe über die quadratischen Kehrwerte aller ungeraden natürlichen
Zahlen. Diese können wir so ausdrücken, dass wir die Summe über alle natürlichen
Zahlen nehmen und davon die die Summe der geraden natürlichen Zahlen wieder
abziehen. Es ergibt sich also:
X
i≥0
X 1
X 1
1
1 X 1
3
=
−
= 1− 2
= ζ(2).
2
2
2
2
(2i + 1)
n
(2n)
2
n
4
N
N
n∈
n∈
n∈
N
2. Nun verwenden wir die Bijektion Φ aus Lemma 2.1.3, um das Integral mit Hilfe einer Koordinatentransformation zu berechnen. Dazu benötigen wir zuerst die
Jacobi-Matrix JΦ (u, v). Hierbei benutzen wir direkt die Notationen wie im Lemma,
sin u
sin v
also x = cos
v und y = cos u . Dann ist
 ∂x
JΦ (u, v) = 
∂u
∂x 
∂v
∂y
∂u
∂y
∂v

=
9
cos u
cos v
sin u sin v
cos2 v
sin v sin u
cos2 u
cos v
cos u


die gesuchte Jacobi-Matrix mit Determinante
det (JΦ (u, v)) =
cos u cos v sin u sin v sin v sin u
sin2 u sin2 v
·
−
·
=
1−
·
= 1−x2 y 2 .
cos v cos u
cos2 v
cos2 u
cos2 v cos2 u
Führen wir nun die Koordinatentransformation Φ aus, so wird I × I nach
4 = {(u, v) ∈ 2 |u, v ≥ 0, u + v ≤ π2 } abgebildet. Also gilt:
R
Z Z
I
1
dxdy =
1 − x2 y 2
Z
det (JΦ (u, v))
dudv =
1 − x2 y 2
4
I
Z
1 π π
π2
dudv = Fläche von 4 = · · =
2 2 2
8
4
3. Vergleichen wir nun die Ergebnisse von 1. und 2., so erhalten wir
3
ζ(2) =
4
Z Z
I
d.h. ζ(2) =
1
π2
dxdy
=
,
1 − x2 y 2
8
I
π2
6 .
2.2 Die Funktionen ϕ(n) und µ(n)
Bevor wir beginnen können, konkrete Überlegungen zu Wahrscheinlichkeiten durchzuführen, betrachten wir zunächst zwei besondere Funktionen. Beide haben Eigenschaften, die von Natur aus interessant sind und uns zusätzlich helfen, in späteren Beweisen
Aussagen umzuformen. Ziel des Abschnitts wird darüber hinaus sein, eine Transformationsformel zu beweisen, welche auf den deutschen Mathematiker August Ferdinand
Möbius zurückgeht.
2.2.1 Definition
Es sei für n ∈ definiert:
N
ϕ(n) := #{d ∈
Die Funktion ϕ :
N|1 ≤ d ≤ n;
ggT (d, n) = 1}.
N → N heißt Eulersche ϕ-Funktion.
Eine interessante und nützliche Eigenschaft der oben definierten Funktion erhalten wir,
wenn wir die Summe der Funktionswerte ϕ(d) aller Teiler einer Zahl n betrachten. Auskunft darüber gibt das folgende Lemma, welches uns in späteren Beweisen noch von
Nutzen sein wird.
10
2.2.2 Lemma (Summe über ϕ(n))
Es gilt für n ∈ :
N
X
ϕ(d) = n.
d|n
Beweis.
Wir definieren für d|n die Menge S(d) := {i ∈ | 1 ≤ i ≤ n; ggT (i, n) = d}. Dann ist
.
S
#S(d) = ϕ nd nach Definition von S(d) und
S(d) = {1, 2, 3, . . . , n}.
N
d|n
Die Disjunktheit (∗) folgt aus folgendem Widerspruch:
Angenommen es existierte ein i ∈ , sodass i ∈ S(d1 ) und i ∈ S(d2 ) mit d1 6= d2 , wobei
d1 und d2 Teiler von n sind. Dann würde gelten:
N
ggT (i, n) = d1 , da i ∈ S(d1 ) und ggT (i, n) = d2 , da i ∈ S(d2 ).
Also folgt d1 = d2 im Widerspruch zur Annahme, da der größte gemeinsame Teiler
eindeutig bestimmt ist.
Nun gilt:
.
[
X n
(∗) X
n=#
S(d) =
#S(d) =
ϕ
.
d
d|n
d|n
d|n
Es ist nun aber egal, ob d alle Teiler von n durchläuft und man ϕ nd betrachtet, oder
ob d0 := nd alle Teiler von n durchläuft und man ϕ(d0 ) betrachtet. Somit ergibt sich:
X n X
X
n=
=
ϕ
ϕ(d0 ) =
ϕ(d).
d
0
d |n
d|n
d|n
Bevor wir uns der zweiten namensgebenden Funktion dieses Abschnitts zuwenden, definieren wir zwei Funktionen, die uns eine einfachere Darstellunge erlauben und auf die
wir insbesondere in Kapitel 4 wieder zurückkommen werden.
2.2.3 Definition
Q ep
Für n =
p , ep ∈
p∈
P
N0 definieren wir die beiden Funktionen
N → N0
ω:
n 7→ #{p ∈
11
P| ep 6= 0}
N → N0
Ω:
n 7→
X
P
ep .
p∈
Also beschreibt ω(n) die Anzahl verschiedener Primfaktoren und Ω(n) die Anzahl der
Primfaktoren unter Berücksichtigung der Vielfachheiten ep .
Nun führen wir die zweite wichtige Funktion ein, die ein essentieller Bestandteil der
Transformationsformel sein wird.
2.2.4 Definition
Für n ∈ sei die Funktion µ :
N
N0 → {±1, 0} definiert als:
(
(−1)ω(n)
n 7→
0
n quadratfrei
sonst.
Die Funktion µ heißt Möbius-Funktion und offensichtlich ist sie schwach multiplikativ,
d.h. für zwei natürliche Zahlen m, n mit ggT (m, n) = 1 gilt:
µ(m · n) = µ(m)µ(n).
Auch hier ist das Betrachten der Summe über die µ(n) analog zu der Summe über die
ϕ(n) in Lemma 2.2.2 interessant und nützlich zugleich.
2.2.5 Lemma (Summe über µ(d))
Für n ∈ gilt:
N
X
d|n
(
1
µ(d) =
0
n=1
n 6= 1.
Beweis.
Wir beweisen die Aussage mit vollständiger Induktion über ω(n).
Induktionsanfang:
Die Aussage
ω(n) = 0 ⇔ n = 1
12
ist richtig, da 1 die einzige Zahl ist, bei der die Vielfachheiten der Primzahlen in der
eindeutigen Produktdarstellung alle Null sind. Also gilt natürlich auch
X
µ(d) = (−1)0 = 1.
d|1
Ebenso gilt
ω(n) = 1 ⇒ n = pep , ep > 0
und damit ist
X
d|n
µ(d) =
X
µ(d) = µ(1)+µ(p)+µ(p2 )+· · ·+µ(pep ) = 1+(−1)+0+· · ·+0 = 0. (IV )
d|pep
Induktionsschritt: n → n + 1, n ≥ 1
N
Für ω(n) > 1, d.h. n = pep · m mit m ∈ \{1} und p 6 | m ergibt sich, da man die Teiler
von n in beliebiger Reihenfolge durchlaufen kann und die Möbius-Funktion schwach
multiplikativ (∗) ist:
X
X X
µ(d0 · d00 )
=
d0 |pep d00 |m
d|n
(∗)
=
X X
µ(d0 )µ(d00 )
d0 |pep d00 |m

=
 
X
µ(d0 ) · 
d0 |pep
= 0·
µ(d00 )
d0 |m

IV

X

X
µ(d00 )
d0 |m
= 0.
Schließlich können wir die Transformationsformel der Möbius-Inversion herleiten, die uns
im nächsten Abschnitt einen Beweis erleichtern wird.
2.2.6 Satz (Möbius-Inversion)
Sind f, F zwei arithmetische Funktionen, also Abbildungen von den natürlichen in die
reellen Zahlen, so sind äquivalent:
13
1. F (n) =
P
f (d) ∀n ∈
d|n
2. f (n) =
P
µ(d)F
d|n
n
d
N,
∀n ∈
N.
Beweis.
Sei 1. erfüllt, dann gilt, da es egal ist, in welcher Reihenfolge man die Teiler von n
durchläuft:
X
d|n
µ(d)F
n
d
=
X
d|n


X
X
X
X
2.2.5
f (k)
µ(d) 
µ(d)f (k) =
f (k) =
µ(d) = f (n).
k| n
d
k,d
kd|n
k|n
d| n
k
Die Umkehrung ergibt sich analog.
2.3 Asymptotische Äquivalenz und mittlere Ordnung
Mit Hilfe der im vorherigen Abschnitt gewonnenen Erkenntnisse können wir jetzt die Begriffe asymptotische Äquivalenz“ und mittlere Ordnung“ einführen. Mit diesen werden
”
”
wir in der Lage sein, eine Art Erwartungswert bzw. erwartetes Verhalten für Funktionen
anzugeben, was uns nicht nur in diesem Kapitel behilflich sein wird.
2.3.1 Definition
Zwei Funktionen f und g auf einer nach oben unbeschränkten Menge D ⊆
asymptotisch äquivalent, falls gilt
R heißen
f (x)
= 1.
x→∞ g(x)
lim
Wir schreiben hierfür f ∼ g. Weiter schreiben wir f = O(g), wenn es ein c ∈
ein x0 ∈ D gibt, sodass für alle x > x0 aus D gilt:
|f (x)| ≤ c|g(x)|.
Das Symbol O(g) heißt Landau-Symbol.
2.3.2 Definition
Seien f, g reelle Funktionen. Dann hat f mittlere Ordnung g, falls gilt:
X
f (n) ∼
n≤x
X
n≤x
14
g(n).
R+ und
Da die mittlere Ordnung ein Konzept aus der Heuristik ist, machen wir folgende Bemerkung.
2.3.3 Bemerkung (Mittlere Ordnung)
Genau genommen gibt es nicht die“ mittlere Ordnung, sondern unter Umständen belie”
big viele. Die Funktion g aus der Definition beschreibt nämlich lediglich den Mittelwert
von f in einer Umgebung von x, welcher nicht zwangsläufig nur durch g gut approximiert
werden kann. Da wir jedoch in unserem Vorgehen stets auf eine bestimmte Ordnung hinaus wollen, sprechen wir trotzdem von der“ mittleren Ordnung einer Funktion.
”
In den nächsten Teilen des Kapitels tauchen nun oft unendliche Produkte auf, wesewegen
wir zur absoluten Konvergenz dieser eine Bemerkung machen.
2.3.4 Bemerkung (Absolute Konvergenz unendlicher Produkte)
∞
Q
(1 + an ) ein unendliches Produkt. Man kann zeigen (siehe [JAENICH] Kap.
Sei P :=
n=1
9), dass das Produkt P genau dann absolut konvergiert, wenn die Reihe
∞
P
an absolut
n=1
konvergiert. Insbesondere dürfen wir bei absoluter Konvergenz von Prdukten ebenso
umordnen, wie wir es von absolut konvergenten Summen gewöhnt sind.
Um nun die mittlere Ordnung von ϕ(n) ausrechnen zu können, brauchen wir noch ein
Lemma:
2.3.5 Lemma
Es gilt:
Y
1 −1
ζ(2) =
1− 2
.
p
P
p∈
Beweis.
Die Aussage ist der Spezialfall s = 2 des später bewiesenen Satzes 3.1.2.
Jetzt können wir die mittlere Ordnung von ϕ(n) berechnen, welche entscheidend für den
nächsten Abschnitt sein wird und uns wieder auf die in Abschnitt 2.1 angesprochene
Zeta-Funktion führt.
15
2.3.6 Satz (Mittlere Ordnung von ϕ(n))
Für die Eulersche ϕ-Funktion gilt:
i) Ihre mittlere Ordnung ist gegeben durch:
g(x) =
6
x.
π2
ii) Genauer gilt sogar die Formel
X
3 2
x + O(x log x).
π2
ϕ(n) =
n≤x
Beweis.
Wir zeigen die Aussagen in 4 Schritten, in denen wir nacheinander die Summe abschätzen.
Hierbei nutzen wir z.T. andere Methoden als in [GEKELER], weil wir auf die Einführung
Dirichlet-Reihen verzichtet haben.
1. Nach Lemma 2.2.2 gilt:
X
ϕ(d) = n.
d|n
Setzen wir f (n) = ϕ(n) und F (n) = n, so erhalten wir mit der Möbius-Inversion
aus Satz 2.2.6 die Aussage
ϕ(n) =
X
µ(d)
X
n
=
µ(d)m.
d
n
(∗)
d= m
d|n
Ausgehend von dieser ist, wenn wir bei (∗∗) die gaußsche Summenformel
n
P
i = n(n+1)
benutzen,
2
i=1
X
n≤x
(∗)
ϕ(n) =
XX
µ(d)m =
n
n≤x d= m
X
µ(d)
=
m
m≤ x
d
d≤x
(∗∗) 1
X
X
µ(d)
hxi hx
+1
i
2
d d
d≤x
x
X
x
≤
µ(d)
+1
+2
d
d
d≤x
=
1X
x2 3 X
x X
µ(d) 2 +
µ(d) +
µ(d)2
2
d
2
d
d≤x
1
= x2
2
d≤x
X µ(d)
d≤x
16
d2
d≤x
3 X µ(d)
+ x
+ O(x).
2
d
d≤x
(#)
2. Um die erste Summe abzuschätzen, benutzen wir:
1 2.3.5 Y
1
=
1− 2 .
ζ(2)
p
p∈
P
P
(
− n12
Sei an :=
0
n∈ ,
sonst.
Dann gilt:
∞
X
X 1
X 1
<
< ∞.
p2
n2
|an | =
n=1
Also ist
p∈
P
n∈
N
∞
P
an absolut konvergent und damit nach Bemerkung 2.3.4 auch das Pro
∞
Q
Q dukt
(1 + an ) =
1 − p12 . Betrachten wir nun das Produkt, so stellen wir
n=1
n=1
p∈
P
fest, dass wegen der eindeutigen Primfaktorzerlegung das Inverse jeder Quadratzahl gebildet wird. Das Vorzeichen hängt von der Anzahl der Faktoren p12 , die zur
Bildung erforderlich waren, ab. Bei gerader Anzahl ist es positiv, sonst negativ.
Durch die absolute Konvergenz des Produktes dürfen wir so umordnen, dass gilt:
Y
p∈
P
1−
1
p2
X
=
n quadratfrei
X
=
n quadratfrei
ω(n) gerade
=
(−1)ω(n)
n2
−
1
n2
−
X
n quadratfrei
ω(n) ungerade
1
n2
X µ(n)
.
n2
n∈
N
Also gilt insgesamt:
X µ(n)
1
=
.
n2
ζ(2)
n∈
N
Damit erhalten wir
X µ(d)
d≤x
d2
=
X µ(d) X µ(d)
−
= ζ(2)−1 + O(x−1 ),
d2
d2
d∈
N
d>x
weil wir den Restterm aufgrund der absoluten Konvergenz der Reihe gegen
abschätzen können.
17
1
x
3. Um die zweite Summe abschätzen zu können, verwenden wir, dass für alle natürlichen
Zahlen d ≥ 1
µ(d)
1
≤
d
d
gilt. Dies liefert uns eine geeignete Abschätzung durch:
X µ(d)
d≤x
d
≤
X1
d≤x
d
Zx
≤1+
1
dy = 1 + log(x) = O(log x).
y
1
4. Setzen wir die beiden Abschätzungen in (#) ein, so erhalten wir:
X
n≤x
1 X µ(d) 1 X µ(d)
ϕ(n) = x2
+ x
+ O(x)
2
d2
2
d
d≤x
d≤x
1
1
1
= ζ(2)−1 x2 + x2 O(x−1 ) + xO(log x) + O(x)
2
2
2
1
−1 2
= ζ(2) x + O(x) + O(x log x) + O(x)
2
6
2.1.2 1
· 2 x2 + O(x log x)
=
2 π
3 2
= 2 x + O(x log x).
π
2.4 Wahrscheinlichkeiten für Teilerfremdheit und
Quadratfreiheit
Nachdem wir nun alle nötigen Vorbereitungen gemacht haben, können wir uns mit den
eigentlichen Fragestellungen des Kapitels beschäftigen. Wir beginnen mit der Wahrscheinlichkeit für Teilerfremdheit.
2.4.1 Korollar (Wahrscheinlichkeiten für Teilerfremdheit)
Es gilt:
N N
#{(m, n) ∈ × | m, n ≤ x mit ggT (m, n) = 1}
6
= 2
x→∞
#{(m, n) ∈ × | m, n ≤ x}
π
P (m, n teilerfremd) := lim
N N
Hierbei können wir P (m, n teilerfremd) als Wahrscheinlichkeit, dass zwei zufällig gewählte
natürliche Zahlen m, n teilerfremd sind interpretieren und erhalten:
P (ggT (m, n) = 1) = ζ(2)−1 =
18
6
≈ 60, 793%.
π2
Beweis.
Wir beweisen die Aussage, in dem wir die relative Häufigkeit aller teilerfremden Zufallspaare natürlicher Zahlen (m, n) innerhalb der Grundgesamtheit aller Zufallspaare und
dies dann durch die mittlere Ordnung der Eulerschen ϕ-Funktion ausdrücken, die wir
kennen. Hierbei wird bei (∗) ausgenutzt, dass die Menge
{m ∈ |x > m > n mit ggT (m, n) = 1} gleichmächtig mit der Menge
{n ∈ |x > n > m mit ggT (m, n) = 1} ist und der Fall m = n mit ggT (m, n) = 1 nur
für m = n = 1 auftritt. Darüber hinaus ist die Mächtigkeit
Pder Menge
{m ∈ |x > m > n mit ggT (m, n) = 1} gegeben durch
ϕ(m), weil die ϕ-Funktion
N
N
N
m≤x
genau die Zahlen n zählt, die zu m teilerfremd sind und somit die Summe der Anzahl
aller zu m teilerfremden Zahlen bis x entspricht. Es gilt also:
N N
#{(m, n) ∈ × | m, n ≤ x mit ggT (m, n) = 1}
x→∞
#{(m, n) ∈ × | m, n ≤ x}
#{(m, n) ∈ × |x > m > n mit ggT (m, n) = 1}
= lim
x→∞
#{(m, n) ∈ × | m, n ≤ x}
#{(m, n) ∈ × |x > n > m mit ggT (m, n) = 1}
+
#{(m, n) ∈ × | m, n ≤ x}
#{(m, n) ∈ × |x > m = n mit ggT (m, n) = 1}
+
#{(m, n) ∈ × | m, n ≤ x}


P
ϕ(m)
1 
(∗)
 m≤x
+ 2
= lim 2 ·
2
x→∞
[x]
[x]
P (m, n teilerfremd) = lim
N N
N N
N N
2.3.6
= lim
x→∞
=
6 2
x
π2
N N
N N
N N
N N
+ O(x log x) + 1
[x]2
6
.
π2
Nachdem wir nun konkret einen Wert für die Wahrscheinlichkeit der Teilerfremdheit
angeben konnten, wollen wir nun ebenso eine Aussage über die Wahrscheinlichkeit der
Quadratfreiheit machen, welche nicht ganz so einfach zu beweisen ist wie das vorherige
Korollar.
2.4.2 Satz (Wahrscheinlichkeit für Quadratfreiheit)
Es gilt:
P (n quadratfrei) := lim
x→∞
#{n ∈
N|n ≤ x mit n quadratfrei} = ζ(2)−1.
#{n ∈ N|n ≤ x}
19
Analog zu Satz 2.4.1 können wir P(n quadratfrei) als Wahrscheinlichkeit auffassen, dass
eine zufällig ausgewählte Zahl n quadratfrei ist.
Beweis.
1. n quadratfrei ⇔ µ(n) = ±1 ⇔ µ(n)2 = 1, also
P
P (n quadratfrei) = lim
#{n ∈
x→∞
µ(n)2
N|n ≤ x mit n quadratfrei} = lim 
n≤x

x→∞
#{n ∈ N|n ≤ x}
[x]
N
2. Für n ∈
existiert genau eine Darstellung n = qm2 , wobei m, q ∈
quadratfrei ist. Hierbei ist q durch die Darstellung
Y
q=
p


.
N und q
P
p∈
ep ungerade
gegeben, da in m2 bereits alle quadratischen Primfaktoren aus n enthalten sind.
Dann ist für dieses n
i)
(
1
µ(n) =
0
2
und für d ∈
m=1
sonst
)
2.2.5
=
X
µ(d),
d|m
N gilt:
ii)
d|m ⇔ d2 |m2 ⇔ d2 |m2 q ⇔ d2 |n.
3. Nun können wir die Summe in 1. umformen. Hierbei nutzen wir bei (∗), dass es
d durch alle Zahlen bis x laufen zu lassen, wenn wir für jedes d den Faktor
genügt,
x
2
heranmultiplizieren,
der angibt, wie viele Zahlen
d2
x die Bedingung d |n in der
ersetzten Summe erfüllt hätten. Bei (∗∗) haben wir d2 durch 1 abgeschätzt, was
P
P
√
uns die Wachstumsabschätzung √ 1 = O( x) liefert. Den Wert für √ µ(d)
d2
d≤ x
d≤ x
kennen wir bereits aus dem Beweis von 2.3.6. Also ergibt sich, wenn wir im Folgenden m(n) statt m schreiben, da m implizit von n abhängt:
X
n≤x
i)
µ(n)2 =
X X
n≤1 d|m(n)
20
µ(d)
ii)
=
XX
µ(d)
n≤x d2 |n
hxi
d2
√
d≤ x
n x o
x
X
=
µ(d) 2 −
d
d2
√
(∗)
X
=
µ(d)
d≤ x
X µ(d)
√
+
O(
x)
d2
√
d≤ x
√
1
2.3.6
= x ζ(2)−1 + O(x− 2 ) + O( x)
√
= xζ(2)−1 + O( x).
(∗∗)
= x
4. Kommen wir nun wieder zurück zur eigentlichen Aussage in 1., so erhalten wir die
gesuchte Wahrscheinlichkeit folgendermaßen:
P
µ(n)2
 n≤x
P (n quadratfrei) = lim 
x→∞
[x]
1.

 3.
 = lim
x→∞
√ xζ(2)−1 + O( x)
= ζ(2)−1 .
[x]
2.4.3 Bemerkung
Wir haben also insgesamt, dass die relativen Häufigkeiten in 2.4.1 und 2.4.2 gegen denselben Wert konvergieren, also die Wahrscheinlichkeit, dass eine zufällige Zahl quadratfrei
ist, ist genauso hoch wie die Wahrscheinlichkeit, dass zwei zufällig gewählte Zahlen zueinander teilerfremd sind. In Kapitel 5 werden wir anschaulich sehen, warum diese beiden
Wahrscheinlichkeiten so eng miteinander verknüpft sind und die Gleichheit durch einen
anderen Beweis heuristischer Art zeigen.
21
3 Der Primzahlsatz
In diesem Kapitel wollen wir eine Abschätzung für die Primzahlfunktion π(x) herleiten,
was ein wichtiges Ergebnis der analytischen Zahlentheorie ist. Der Kern des Beweises
hierfür stammt von D. J. Newman aus dem Jahr 1980, ist also noch relativ neu. Hier
werden wir uns mit der Fassung von D. Zagier befassen (siehe [ZAGIER]), die weitere
Vereinfachungen ausnutzt. Wir werden vor allem sehen, dass wir auf viele Ergebnisse der
komplexen Analysis zurückgreifen müssen, um unser Ziel zu erreichen. Zunächst jedoch
werden wir neben ζ(s) noch zwei weitere Funktionen untersuchen, die uns dabei helfen,
π(x) korrekt abzuschätzen.
3.1 Die Funktionen Φ(s) und ϑ(x)
3.1.1 Definition
Seien s ∈ und x ∈
C
R, so definieren wir:
Φ(s) :=
X log p
X
,
ϑ(x)
:=
log p.
ps
P
p≤x
p∈
P
p∈
Man sieht direkt, dass Φ(s) genauso wie ζ(s) für Re(s) > 1 absolut konvergiert und somit
Φ(s) sowie ζ(s) in diesem Gebiet holomorph sind.
Nun beweisen wir zunächst die allgemeine Version des Lemmas 2.3.5:
3.1.2 Lemma (Produktschreibweise der Zeta-Funktion)
Für Re(s) > 1 gilt:
ζ(s) =
1
.
1 − p1s
p∈P
Y
Beweis.
Aufgrund der eindeutigen Faktorisierung der natürlichen Zahlen (∗) und der absoluten
Konvergenz (∗∗) von ζ(s) in diesem Bereich haben wir:
22

(∗)
ζ(s) =
1
X
(ep )p ≥0
Q
p∈
P
!s =
pep
X

P
(∗∗)
p−ep s  =
Y
P
p∈
p∈
(ep )p ≥0



Y
X

p−ep s 
(ep )p ≥0
Re(s)>1
=
Y
P
p∈
1
.
1 − p−s
Hierbei muss man beachten, dass man über Tupel (ep )p summiert, bei denen fast alle
Einträge 0 sind.
Die nächsten Lemmata benötigen wir, um Aussagen über Eigenschaften der Funktionen
Φ(s) und ϑ(x) zu machen, welche uns später helfen werden, den Primzahlsatz zu zeigen.
3.1.3 Lemma (Holomorphie der Zeta-Funktion für Re(s) > 0)
Die Funktion
C
1
, s∈
s−1
besitzt eine holomorphe Fortsetzung für Re(s) > 0. Diese ist gegeben durch die Funktion
ζ(s) −
n+1
X Z 1
1
−
.
ns xs
n∈
N
n
Beweis.
Im Folgenden nutzen wir die Schreibweise [g(x)]tt12 für g(t1 ) − g(t2 ). Dann haben wir für
Re(s) > 1:
ζ(s) −
X 1
1
1
=
−
s
s−1
n
s−1
n∈N
1 X
(∗) X 1
−s+1
−s+1
=
−
(n
+
1)
−
n
ns 1 − s
n∈N
n∈N
X 1
X 1
−
(n + 1)−s+1 − n−s+1
=
s
n
1−s
n∈N
n∈N
n+1
X 1
X 1
n+1
−s+1
=
[x]
−
x
ns n
1−s
n
n∈N
n∈N
!
n+1
X 1
1
n+1
−s+1
=
[x]
−
x
ns n
1−s
n
n∈
N
n+1
X Z 1
1
=
−
.
ns xs
n∈
N
n
23
Die Summe bei (∗) ist eine Teleskopsumme, d.h. die Glieder heben sich fast alle gegenseitig auf. Übrig bleibt allein (−1)−s+1 = −1.
Die Reihe auf der rechten Seite konvergiert absolut für Re(s) > 0, da
n+1
Z n+1
x Z 1
1
1
s − s dx
− s dx = s
n
x
su n n
n
n+1 x
Z Z
1
du dx
= s
s+1
u
n n
n+1
Z Zx
≤ |s|
n
(∗∗)
1 us+1 du dx
n
n+1
Z Zx
≤ |s|
n
=
1
nRe(s)+1 du dx
n
n+1
Z Zx
|s|
1du dx
nRe(s)+1
n
≤
|s|
nRe(s)+1
n
.
1 offensichtlich für u = n ihr
Bei (∗∗) haben wir ausgenutzt, dass die Funktion us+1
Maximum hat, da dann der Nenner am kleinsten ist. Wegen der so bewiesenen absoluten
1
Konvergenz der Reihe kann die Funktion ζ(s) − s−1
mit dieser Formel holomorph für
alle s mit Re(s) > 0 fortgesetzt werden.
Im nächsten Schritt versuchen wir eine grobe Abschätzung für ϑ(x) zu finden, die wir
im Verlauf dieses Kapitels aber noch verbessern können. Zunächst reicht aber folgendes
Lemma aus:
3.1.4 Lemma (Abschätzung für ϑ(x))
Für x ∈ gilt
R
ϑ(x) = O(x).
Beweis.
Sei n ∈ . Dann ist nach dem binomischen Lehrsatz (siehe [HEUSER] Satz 7.4), angewandt bei (∗),
N
24
2
2n
= (1 + 1)
2n (∗)
=
2n X
2n
i
i=0
da alle Binomialkoeffizienten positiv sind. Aber
2n
(2n)!
≥
=
(n!)2
n
2n
≥
,
n
Y
p
n<p≤2n
p∈
P
2n
n
gilt, weil
eine natürliche Zahl ist und keine Primzahl größer als n in n! enthalten
sein kann. Somit enthält 2n
n mindestens alle Primzahlen p mit n < p ≤ 2n, was die
Ungleichung zeigt. Wir erhalten also die Abschätzung



 
22n ≥
Y
n<p≤2n
p∈
P

 X
  Y 
 = eϑ(2n)−ϑ(n) .
 = exp 

log
p
p
p = exp 
log



 
n<p≤2n
p∈
n<p≤2n
p∈
P
P
Wenden wir nun darauf den Logarithmus an, so haben wir
ϑ(2n) − ϑ(n) ≤ log(22n ) = 2n log 2.
Jetzt können wir für ein beliebiges m ∈
m (∗∗)
ϑ(2 ) =
N schreiben:
m
X
(ϑ(2n ) − ϑ(2n−1 ))
n=1
m
(#) X
≤
2n log 2
n=1
(+)
= (2m+1 − 2) log 2
< 2m+1 log 2.
Hier haben wir bei (#) die eben gezeigt Ungleichung für 2n−1 statt n angewendet, bei
(∗∗) konnten wir den Ausdruck durch eine Teleskopsumme schreiben, weil ϑ(1) = 0
b
P
b −q a
gilt und bei (+) haben wir die geometrische Summenformel
q n = qq−1
für |q| < 1
n=a
ausgenutzt.
Jetzt können wir für beliebiges reelles x ≥ 1 ein m finden, sodass 2m−1 ≤ x < 2m erfüllt
ist. Dies gibt uns
ϑ(x) ≤ ϑ(2m ) < 2m+1 log 2 = (4 log 2)2m−1 ≤ (4 log 2)x,
und wir erhalten ϑ(x) = O(x) wie gewünscht.
Um später das analytische Theorem anwenden zu können, welches unseren Beweis stark
abkürzen wird, müssen wir jetzt folgende Holomorphieeigenschaft zeigen:
25
3.1.5 Lemma/Bemerkung (Holomorphie von Φ(s) −
Für komplexe Zahlen s mit Re(s) ≥ 1 ist die Funktion
1
s−1
für Re(s) ≥ 1)
1
s−1
holomorph. D.h. es existieren auch für alle komplexen Zahlen mit Realteil 1 offene Umgebungen, also insbesondere auch für bestimmte komplexe Zahlen mit Realteil kleiner als
1, für die die Funktion holomorph ist.
Φ(s) −
Beweis.
Für Re(s) > 1 impliziert das konvergente Produkt aus Lemma 3.1.2, dass ζ(s) dort
nullstellenfrei ist. Da wir Ableitungen von Produkten viel schwerer berechnen können
als die von Summen, versuchen wir, durch die nachfolgenden Rechnungen das Produkt
zu eliminieren und somit unsere Problemstellung auf Summen zu beschränken. Leiten
wir die Funktion ζ(s) nun ab und nutzen die Produkdarstellung, so erhalten wir:


−1
Y
d


ζ(s)0 =
1 − e−s log p
ds
p∈P


=
−s
XY

0−s −1  − log p · p

1
−
p
·

 (1 − p−s )2
0
p∈
=
P
X
P
P
p∈
p0 6=p
ζ(s) ·
p∈
= −ζ(s)
− log p
− p−s )
ps (1
X log p
.
ps − 1
P
p∈
Nutzen wir dies, so können wir schreiben:
−
ζ 0 (s) X log p
=
ζ(s)
ps − 1
p∈
P
X ps log p
=
ps (ps − 1)
p∈
P
X ps log p − log p + log p
=
ps (ps − 1)
p∈
P
X (ps − 1) log p X log p
=
+
ps (ps − 1)
ps (ps − 1)
p∈
P
p∈
26
P
=
X log p X log p
+
ps
ps (ps − 1)
p∈
P
= Φ(s) +
P
p∈
log p
.
− 1)
X
p∈
P
ps (ps
Die hintere Summe konvergiert für Re(s) > 12 , da der größte Exponent im Nenner 2s ist.
Aus Lemma 3.1.3 folgt, dass ζ(s) meromorph fortsetzbar auf Re(s) > 0 ist und einen Pol
0 (s)
erster Ordnung bei s = 1 hat. Also hat ζζ(s)
einen Pol erster Ordnung bei s = 1 und bei
allen Nullstellen von ζ(s). Somit kann man Φ(s) meromorph auf Re(s) > 12 fortsetzen.
Sei nun sα := 1 + iα mit α ∈ \{0} und sei µ ∈ die Nullstellenordnung von ζ(s) in
1
sα . Dann folgt aus Lemma 3.1.3, dass µ nicht negativ ist, da sonst ζ(s) − s−1
für sα eine
weitere Polstelle hätte und nicht holomorph wäre.
Setzen wir nun
R
Z
Z(s) := ζ(s) −
1
,
s−1
so ist
Z 0 (s) = ζ 0 (s) +
1
.
(s − 1)2
Insbesondere ist nach Lemma 3.1.3 Z(s) holomorph für Re(s) > 0 und Z(1) = z sowie
Z 0 (1) = z 0 mit endlichen z, z 0 ∈ . Somit erhalten wir
C
ζ 0 (s)
Z 0 (s)
1
=
−
.
1
2
ζ(s)
(s − 1) Z(s) + (s − 1)
Z(s) + s−1
Sei > 0. Es ergibt sich folgender Grenzwert:

i) lim · Φ(1 + ) = lim −
→0
→0
= − lim →0
ζ 0 (1
+ )
−
ζ(1 + )

X
log p
P
p1+ (p1+
p∈
− 1)

ζ 0 (1
X
+ )
log p
− lim 1+
ζ(1 + ) →0
p (p1+ − 1)
p∈P
|
{z
}
=0
Z 0 (1 + )
1
= − lim −
1
2
→0
(1
+
−
1)
Z(1
+
) + (1 + − 1)
Z(1 + ) + 1+−1
!
Z 0 (1 + )
= − lim
− 2
→0 Z(1 + ) + 1
Z(1
+
) + 0 · Z 0 (1)
1
=−
−
Z(1) + ∞ 0 · Z(1) + 1
= −(0 − 1) = 1.
27
!
1
Dies zeigt bereits, dass Φ(s) − s−1
holomorph für s = 1 ist, da Φ(s) dort einen einfachen
Pol hat. Weiter können wir nun in einer Umgebung von 1 + iα ein holomorphes K(s)
finden, sodass
ζ(s) = K(s)(s − (1 + iα))µ
gilt. Insbesondere ist dann K(1 + iα) endlich und verschieden von Null. Somit erhalten
wir als Ableitung
ζ 0 (s) = K 0 (s)(s − (1 + iα))µ + µK(s)(s − (1 + iα))µ−1 .
An der Stelle sα genügt es, eine beliebige Richtungsableitung zu berechnen, weil Φ(s)
meromorph für Re(s) > 21 ist. Außerdem können wir die Berechnung gleichzeitig für
sα und das komplex konjugierte sα durchführen, da aufgrund der rellen Basis und des
komplexen Exponenten ζ(s) = ζ(s) gilt und sich somit auch die Polstellenordnung nicht
ändert. Ist wieder > 0, so erhalten wir analog zu i):
ζ 0 (1 + ± iα)
−0
→0 ζ(1 + ± iα)
0
K (1 + ± iα)(1 + ± iα − (1 ± iα))µ
= − lim →0
K(1 + ± iα)(1 + ± iα − (1 + ±iα))µ
µK(1 + ± iα)(1 + ± iα − (1 ± iα))µ−1
+
K(1 + ± iα)(1 + ± iα − (1 + ±iα))µ
0
K (1 + ± iα) µ
= − lim +
→0
K(1 + ± iα)
0
K (1 ± iα)
=− 0·
+µ
K(1 ± iα)
= −µ.
ii) lim · Φ(1 + ± iα) = − lim →0
Ebenso können wir den Punkt s2α = 1 + 2iα mit Nullstellenordnung ν ≥ 0 betrachten
und erhalten wie in ii):
lim · Φ(1 + ± 2iα) = −ν.
→0
Mit Hilfe der Ungleichung für > 0
2 X
4
Φ(1 + + irα) = Φ(1 + − 2iα) + 4Φ(1 + − iα) + 6Φ(1 + )
2+r
r=−2
+ 4Φ(1 + + iα) + Φ(1 + + 2iα)
X log p
=
(p2iα + 4piα + 6p0 + 4p−iα + p−2iα )
p1+
p∈
P
28
=
X log p α
α
(pi 2 + p−i 2 )4
1+
p
p∈
P
≥ 0,
können wir den Grenzübergang wie in i) , ii) , iii) durchführen und erhalten für
!
2 X
4
Φ(1 + + irα) ≥ 0
lim ·
→0
2+r
r=−2
die Ungleichung
−ν − 4µ + 6 − 4µ − ν = 6 − 8µ − 2ν ≥ 0.
Da µ und ν nach Voraussetzung nicht negativ waren folgt sofort µ = 0. Weil µ aber die
Nullstellenordnung von ζ(1 + iα) war, folgt zusammen mit der Polstelle bei s = 1 , dass
ζ(s) nullstellenfrei für Re(s) = 1 ist.
3.2 Das analytische Theorem von Newman
Um nun in unserem Beweis den entscheidenden Schritt machen zu können, brauchen wir
zunächst einen Satz, der erstmals 1980 von D. J. Newman in [NEWMAN] gezeigt wurde.
3.2.1 Satz (Analytisches Theorem von Newman)
Sei f (t) (t ≥ 0) eine beschränkte und lokal integrierbare Funktion und g(z) =
mit Re(z) > 0 holomorph fortsetzbar auf Re(z) ≥ 0. Dann existiert
R∞
R∞
f (t)e−zt dt
0
f (t)dt.
0
Beweis.
Sei T > 0 und
ZT
gT (z) :=
f (t)e−zt dt.
0
Nach Voraussetzung ist diese Funktion holomorph für alle z. Wir müssen nun zeigen,
dass gilt
lim gT (0) = g(0).
T →∞
Sei R ∈
R+ beliebig groß und sei ∂C der Rand des Gebietes
C := {z ∈ C| |z| ≤ R, Re(z) ≥ −δ}
29
mit δ > 0 abhängig von R klein genug, sodass g(z) auf ganz C holomorph ist. Dieses
δ kann man finden, denn aufgrund der holomorphen Fortsetzbarkeit von g(z) existieren
Umgebungen für Re(s) = 0, | Im(s)| ≤ R auf denen g(z) immer noch holomorph fortsetzbar ist. Man aus den unendlich vielen Umgebungen eine endliche Anzahl auswählen,
die die Menge {s ∈ | Re(s) = 0, | Im(s)| ≤ R} überdecken, weil sie kompakt ist. Habe
die kleinste dieser nun endlich vielen Umgebungen den Radius 2δ. Da der Radius dieser
Umgebungen mindestens 2δ ist, existiert für jeden Punkt eine Umgebung mit mindestens Radius δ, auf der g(z) noch holomorph fortsetzbar ist. Also ist dieser Radius unser
gesuchtes δ.
Dann ist nach dem Cauchyschen Integralsatz (siehe [Freitag] Theorem 3.2):
C
g(z) − gT (z)
dz
z−0
Z
1
g(0) − gT (0) =
2πi
∂C
g(z) − gT (z) zT
e dz
z
∂C
Z
g(z) − gT (z) zT
z2
(∗∗) 1
=
e
1 + 2 dz
2πi
z
R
∂C
Z
z 2 dz
1
zT
(g(z) − gT (z))e
1+ 2
.
=
2πi
R
z
1
=
2πi
(∗)
Z
∂C
Bei (∗) und (∗∗) haben wir holomorphe Funktionen hinzugefügt, die an der Stelle z = 0,
an der die Funktion z1 eine Polstelle hat, den Wert 1 haben. Also ändern sie an unserem
Ergebnis nichts.
Wir betrachten nun nacheinander verschiedene Wege, um ∂C möglichst geschickt zu
umlaufen, sodass wir das Integral ausrechnen können.
1. Auf dem Halbkreis C+ = ∂C ∩ {Re(z) > 0} ist die zu integrierende Funktion
beschränkt durch 2B
mit B = max |f (t)|, da für Re(z) > 0 und |z| = R
R2
t≥0
∞
Z
ZT
−zt
−zt |g(z) − gT (z)| = f (t)e dt − f (t)e dt
0∞
0
Z
−zt = f (t)e dt
T
Z∞
(#)
≤ B
=
|e−zt |dt
T
−
Be Re(z)T
Re
30
,
und
zT
z 2 1 e
= eRe(z)T
1+ 2
R
z
= eRe(z)T
= eRe(z)T
zz + z 2 ·
R2 z z(z + z) · R2 z 2 Re(z) ·
R2 = eRe(z)T ·
2 Re(z)
R2
Rb
Rb
gilt, wobei wir bei (#) die Standardabschätzung für Integrale f (t)dt ≤ |f (t)|dt
a
a
(siehe auch [FREITAG] Bemerkung 1.5) benutzt haben. Also haben wir insgesamt
Z
Z 1
2
zT
dz
1
z
z 2 1 zT
(g(z) − gT (z))e
1+ 2
|(g(z) − gT (z))| · e
dz
1+ 2
≤
2πi
R
z 2π
R
z
C+
C+
!
Z
Be− Re(z)T Re(z)T 2 Re(z)
1
·e
·
dz
=
2π
Re
R2
C+
Z
1 2B
=
· 2
dz
2π R
C+
B
· πR
πR2
B
= .
R
=
2. Sei nun C− = ∂C ∩ {Re(z) < 0}. Hier betrachten wir g(z) und gT (z) einzeln.
C
Da gT (z) ganz ist, also auf ganz holomorph ist, können wir wegen der Transformationsinvarianz (siehe [FREITAG] Satz 1.6) C− ersetzen durch den Halbkreis
0 = {z ∈
C−
| |z| = R, Re(z) < 0}. Dann gilt analog zu 1. für Re(z) < 0
C
T
Z
ZT
Be− Re(z)T
−zt
|gT (z)| = f (t)e dt ≤ B |e−zT |dt =
,
| Re(z)|
0
0
und deshalb
31
Z 1 Z
2
2
zT
z
dz z
1 1
zT
1+ 2
gT (z)e
|gT (z)| e
1+ 2
dz
≤
2πi
R
z 2π
R
z
0
0
C−
C−
Z
1 Be− Re(z)T Re(z)T 2| Re(z)|
=
·
·e
·
dz
2π
| Re(z)|
R2
0
C−
B
· πR
πR2
B
= .
R
=
3. Schließlich betrachten wir den letzten Integrand. Da
z2
1
g(z) · 1 + 2 ·
R
z
unabhängig von T ist, und ezT für Re(z) < 0 für große T gegen 0 konvergiert,
erhalten wir:
1
lim
T →∞ 2πi
Z
g(z)e
zT
z 2 dz
= 0.
1+ 2
R
z
C−
4. Nehmen wir nun 1., 2. und 3. zusammen, so bekommen wir:

Z
2
z
dz
 1
lim sup |g(0) − gT (0)| = lim sup 
(g(z) − gT (z))ezT 1 + 2
2πi
R
z T →∞
T →∞
C+
1 Z
z 2 dz zT
+
gT (z)e
1+ 2
2πi
R
z 0
C−

1 Z
2
z
dz 
g(z)ezT 1 + 2
+

2πi
R
z C−
B B
≤ lim sup
+ +0
R R
T →∞
2B
=
.
R
Da aber R beliebig war und B nach Konstruktion nicht von R abhängt, ergibt sich
32
lim gT (0) = g(0), für R → ∞.
T →∞
3.3 Der Primzahlsatz
Jetzt können wir das analytische Theorem benutzen, um folgende Integralexistenz nachzuweisen, welche uns im nachfolgenden Lemma eine genauere Abschätzung für ϑ(x)
liefern wird.
3.3.1 Lemma (Konvergenz des Integrals
R∞ ϑ(x)−x
1
Das Integral
Z∞
x2
dx)
ϑ(x) − x
dx
x2
1
ist konvergent.
Beweis.
In diesem Beweis kommen nun viele unserer bisherigen Erkenntnisse zusammen. Sei
Re(s) > 1, dann ist, weil ϑ(x) für Werte x zwischen zwei Primzahlen konstant ist,
∞
∞
∞
Z
Z
X log p Z dϑ(x) (∗) ϑ(x) ∞
ϑ(x) (∗∗)
Φ(s) =
+s
=
=
dx = s e−st ϑ(et )dt.
ps
xs
xs 1
xs+1
P
p∈
1
1
0
Bei (∗) haben wir partiell integriert und bei (∗∗) haben wir die Substitution x 7→ et
durchgeführt.
Wir setzen nun
f (t) := ϑ(et )e−t − 1,
Φ(z + 1) 1
− .
g(z) :=
z+1
z
Dann ist, wenn wir bei (+) das oben berechnete Integral benutzen,
33
Z∞
Z∞
f (t)e−zt dt = (ϑ(et )e−t − 1)e−zt dt
0
0
Z∞
= (ϑ(et )e−t(z+1) − e−zt )dt
0
Φ(z + 1)
=
−
z+1
(+)
Z∞
e−zt dt
0
Φ(z + 1) 1
−
z+1
z
= g(z).
=
Das Lemma 3.1.5 liefert, falls wir dort s = z+1 setzen, dass g(z) für Re(z) ≥ 0 holomorph
ist. Außerdem erhalten wir aus Lemma 3.1.4, dass gilt:
ϑ(x) = O(x)
⇔ ϑ(et ) = O(et ).
Also bekommen wir
f (t) = ϑ(et )e−t − 1 = O(et )e−t − 1 = O(1).
Insbesondere ist also f (t) beschränkt.
Somit erfüllen f (t) und g(z) die Voraussetzungen des analytischen Theorems 3.2.1, d.h.
das Integral
Z∞
0
Z∞
Z∞
Z∞
ϑ(et ) − et
ϑ(x) − x
t −t
f (t)dt = (ϑ(e )e − 1)dt =
dt =
dx,
et
x2
0
0
0
wobei wir die Substitution t 7→ log x durchgeführt haben, existiert.
Jetzt sind wir in der Lage, eine noch bessere Abschätzung für ϑ(x) zu beweisen, welche
uns im Anschluss direkt Abschätzungen zum Beweis des Primzahlsatzes liefern wird.
3.3.2 Lemma (ϑ(x) ∼ x)
Es gilt
ϑ(x) ∼ x.
34
Beweis.
Angenommen, dass es für λ > 1 ein genügend großes x gäbe, sodass ϑ(x) ≥ λx. Da ϑ(x)
nicht fallend ist, ergäbe sich dann für diese x:
Zλx
ϑ(t) − t
dt ≥
t2
x
Zλx
λx − t (∗)
dt =
t2
x
λ−t
dt = − log λ + λ − 1 > 0.
t2
1
Bei (∗) haben wir die Substitution t →
wert
Z∞
Zλ
ϑ(t) − t
dt ≥ lim
λ→∞
t2
Zλx
t
x
durchgeführt. Betrachten wir nun den Grenz-
ϑ(t) − t
dt ≥ lim (− log λ + λ − 1) = ∞,
λ→∞
t2
x
1
so erhalten wir einen Widerspruch zur Konvergenz des Integrals
R∞ ϑ(t)−t
1
t2
dt wegen Lemma
3.3.1. Analog kommen wir durch die Annahme, es gäbe ein λ < 1 mit ϑ(x) ≤ λx, zur
Ungleichung:
Zx
ϑ(t) − t
dt ≤
t2
λx
Zx
λx − t
dt =
t2
λx
Z1
λ−t
dt = log λ − λ + 1 < 0.
t2
λ
Multiplizieren wir die Gleichung mit −1 und betrachten erneut den Grenzübergang
λ → ∞, so ergibt sich derselbe Widerspruch wie oben. Also muss λ = 1 gelten, d.h.
ϑ(x) ∼ x.
Es bleibt nun noch übrig, den Primzahlsatz zu beweisen. Er wurde zwar bereits von
Gauß vermutet, konnte jedoch erst 1896 unabhängig von Jacques Salomon Hadamard
und Charles-Jean de La Vallée Poussin bewiesen werden.
3.3.3 Satz (Der Primzahlsatz)
Die Funktion π(x), welche die Anzahl der Primzahlen bis zu einer Schranke x beschreibt,
ist asymptotisch äquivalent zu logx x , d.h.
π(x) ∼
x
.
log x
Beweis.
Wir können schreiben:
ϑ(x) =
X
p≤x
p∈
P
log p ≤
X
p≤x
p∈
P
35
log x = π(x) log x,
da die Summe nur π(x) Summanden hat und diese höchstens so groß wie log x sein
können. Es ergibt sich also:
ϑ(x)
≤ π(x).
log x
(3.1)
Außerdem gilt für alle > 0:
X
ϑ(x) ≥
log p
x1− ≤p≤x
p∈
P
X
≥
log x1−
x1− ≤p≤x
p∈
P
X
=
(1 − ) log x
x1− ≤p≤x
p∈
P
= (1 − ) log x(π(x) − π(x1− )).
Offensichtlich gilt aber auch π(x1− ) ≤ x1− , d.h. es gilt:
ϑ(x) ≥ (1 − ) log x(π(x) − π(x1− )).
Formen wir dies um, erhalten wir:
ϑ(x)
1
·
+ x1− .
1 − log x
Aus den Gleichungen 3.1 und 3.2 ergibt sich nun:
π(x) ≤
ϑ(x)
1
ϑ(x)
≤ π(x) ≤
·
+ x1−
log x
1 − log x
ϑ(x)
log x
1
ϑ(x) log x
⇔
≤ π(x) ·
≤
·
+ .
x
x
1−
x
x
Da für jedes > 0
lim
x→∞
log x
=0
x
gilt und weil nach Lemma 3.3.2
ϑ(x)
=1
x→∞ x
ist, erhalten wir aus obiger Ungleichung
log x
1 ≤ lim π(x) ·
≤ 1.
x→∞
x
lim
Somit folgt π(x) ∼
x
log x .
36
(3.2)
4 Die durchschnittliche Anzahl an
Primfaktoren
In unserem letzten Kapitel haben wir den Primzahlsatz bewiesen, der etwas über die
Dichteverteilung der Primzahlen aussagt. Nun wollen wir uns damit befassen, wie sich
die durchschnittliche Anzahl an Primfaktoren entwickelt. Hierbei unterscheiden wir zwischen der Anzahl an verschiedenen Primfaktoren ω(n) und der Anzahl an Primfaktoren
mit Vielfachheiten Ω(n) einer beliebigen natürlichen Zahl n. Allerdings werden wir sehen, dass auch hier die Ergebnisse eng miteinander zusammenhängen. Bevor wir jedoch
beginnen können, direkt die mittleren Ordnungen zu berechnen, benötigen wir noch
einige Aussagen über Primzahlsummen.
4.1 Die Sätze von Mertens
Zuerst zeigen wir jedoch einen sehr nützlichen Transformationssatz, mit dem wir später
die Sätze von Mertens beweisen können.
4.1.1 Satz (Transformationssatz, Abel-Summation)
Sei (ci )i∈N eine Folge von natürlichen Zahlen mit ci = 0 für i < i0 ∈
C(x) :=
[x]
X
N und sei
ci
i=1
Ist f (x) eine stetig differenzierbare Funktion für x ≥ i0 , dann gilt:
X
Zx
ci f (i) = C(x)f (x) −
i≤x
C(t)f 0 (t)dt.
i0
Beweis.
Wir halten uns in diesem Beweis an die Vorgabe aus [HARDY] Theorem 421. Setze
N := [x], dann erhalten wir durch Konstruktion einer Teleskopsumme und Umordnen:
X
i≤x
ci f (i) =
X
((C(i) − C(i − 1))f (i))
i≤x
37
= C(1)f (1) + (C(2) − C(1)) f (2) + · · · + (C(N ) − C(N − 1)) f (N )
= C(1) (f (1) − f (2)) + · · · + C(N − 1) (f (N − 1) − f (N )) + C(N )f (N )
X
(C(i) (f (i) − f (i + 1))) + C(x)f ([x]),
=
i≤x−1
weil C(N ) = C(x) ist. Ebenso ist C(t) = C(i), falls i ≤ t < i + 1, weil zwischen i und
i + 1 keine weiteren Folgenglieder summiert werden. Deshalb gilt:
Zi
C(i)(f (i) − f (i + 1)) = C(i)
Zi+1
f (t)dt = −
C(t)f 0 (t)dt.
0
i+1
i
Also gilt mit C(t) = 0 für t < i0 :

Zi+1
C(t)f 0 (t)dt + C(x)f ([x])

X
i≤x
ci f (i) = − 
X
i0 ≤i<x−1 i
Z[x]
= C(x)f ([x]) −
C(t)f 0 (t)dt
i0
Zx
= C(x)f (x) −
C(t)f 0 (t)dt.
i0
4.1.2 Lemma (Mertens’ erster Satz)
Es gilt für p ∈ :
P
X log p
p≤x
p
= log x + O(1).
Beweis.
1. Sei f (t) = log t und (ci )i∈N = 1 für alle i, dann ist C(x) =
P
1 = [x]. Ebenso
i≤x
ist f (t) für t > 0 stetig differenzierbar. Wenden wir nun den Transformationssatz
4.1.1 an, so erhalten wir mit n = [x]:
log(n!) =
X
log i
i≤n
38
Zx
= [x] log x −
1
[t] · dt
t
1
= x log x + O(log x) − [t]t=x
t=1
= x log x + O(log x) − [x] + 1
= x log x + O(x).
2. Als nächstes berechnen wir denselben Ausdruck auf eine andere Art. Da die Vielfachheit ep einer Primzahl in der Primfaktorzerlegung von n implizit von n abhängt,
setzen wir für die Dauer des Beweises ep = ep (n), um die Summen besser überschaubar
zu machen.
log(n!) =
X
ep (n!) log p
p≤x
p∈
P
∞ XX
x
=
log p
pm
p≤x m=1
p∈
∞
XX
P
=
p≤x m=1
p∈
∞
XX
P
=
p≤x m=1
p∈
P
∞ XX
x
x
log p −
log p
pm
pm
p≤x m=1
p∈
P
∞
X
X
x
log
p
−
log
p
pm
m=1
p≤x
p∈
P
h
=
X
∞
X
p≤x m=1
p∈
P
−
P
p≤x
p∈
P
≤
X
p≤x m=1
p∈
P
i
m=1
p≤x
p∈
log p
∞
X
log x
log p
x
pm
X
X x x
log p −
log p
pm
pm
h
X
i
log x
+2
log p
X
X
x
−
log p
i pm
p≤x
p∈
h
P
h
x
m= log
+1
log p
log x
log p
∞
X
x
i pm
h
x
m= log
+3
log p
i
∞
X
X
X
X
X log p
x
log
p
−
log
p
−2
log
p
−
x
pm
p2
m=1
p≤x
p∈
P
p≤x
p∈
P
p≤x
p∈
P
m=
|
3.1.4
≤
∞
XX
X
X log p
x
log x
log p −
log p
− O(x) − C1 x
m
p
log p
p2
p≤x m=1
p∈
P
p≤x
p∈
p≤x
p∈
P
|
39
P{z
=C2
}
h
1
p
i m
log x
+1
log p
{z
=C1
}
=
∞
XX
x
log p − π(x) log x − O(x) − C1 C2 x
pm
p≤x m=1
p∈
∞
XX
3.3.3
P
=
p≤x m=1
p∈
∞
XX
P
=
p≤x m=1
p∈
P
x
log p + O
pm
x
log x + O(x)
log x
x
log p + O(x).
pm
Die positive Konstante C1 ≤ 2 ergibt sich aus dem Anwenden der geometrischen
Reihe, da in den Grenzen der Summe stets pxm < 1, gilt und die Existenz von C2
∞
P
log n
folgt aus der bekannten Konvergenz von
.
n2
n=1
3. Nun schätzen wir folgende Differenz ab:
∞
∞
XX
log p X log p X X log p
−
=
pm
p
pm
p≤x m=1
p∈
P
p≤x m=2
p∈
p≤x
p∈
P
P
∞
X
1
log p
pm
X
≤
P
m=2
p∈
(∗∗)
=
X
P
log p ·
p∈
=
X
P
p∈
<
X
N
n∈
1
1−
1
p
1
−1−
p
!
log p
p(p − 1)
log n
n(n − 1)
= K.
Bei (∗∗) verwenden
wir die Summenformel der geometrische Reihe, da für alle
1
p ∈
stets p < 1 gilt. Also können wir die Doppelsumme durch eine Summe
über alle Primzahlen bis zur Schranke x abschätzen und haben dabei nur einen
konstanten Fehlerterm.
P
4. Fassen wir nun unsere Ergebnisse zusammen, so erhalten wir:
1.
2.
x log x + O(x) = log(n!) =
∞
X log p
XX
x
3.
log p + O(x) = x
+ xO(1).
m
p
p
p≤x m=1
40
p≤x
Teilen durch x und Umsortieren liefert
X log p
= log x + O(1),
p
p≤x
was den ersten Satz von Mertens beweist.
Mit Hilfe des ersten Satzes von Mertens können wir nun den zweiten Satz von Mertens
beweisen, welcher uns im nächsten Abschnitt eine Abschätzung für die mittlere Ordnung
von ω(n) und Ω(n) liefern wird.
4.1.3 Lemma (Mertens’ zweiter Satz)
Es gibt eine Konstante C1 ∈ , sodass gilt:
R
X1
p≤x
p
= log log x + C1 + O
1
log x
.
Beweis.
Wir setzen
(
ci :=
log i
i ,
0,
falls i Primzahl,
sonst.
Dann gilt nach dem ersten Satz von Mertens 4.1.2
X
ci =
i≤x
Setzen wir nun f (t) :=
1
log t ,
X log p
= log x + O(1).
p
p≤x
p∈
P
so erhalten wir mit Hilfe des Transformationssatzes 4.1.1:
X1 X
=
ci f (i)
p
p≤x
p∈
P
i≤x
C(x)
+
=
log x
Zx
C(t)
dt
t(log t)2
2
1
=1+
O(1) +
log x
Zx
2
1
dt +
t log t
Zx
2
41
1
O(1)dt
t(log t)2
1
=1+
O(1) + [log log t]t=x
t=2 + O(1)
log x
Zx
1
dt
t(log t)2
2
1
O(1) + [log log t]t=x
=1+
t=2 + O(1)
log x
Z∞
1
dt − O(1)
t(log t)2
Z∞
1
dt
t(log t)2
x
2
= log log x + C1 + E(x),
mit
Z∞
C1 = 1 − log log 2 + O(1)
1
dt
t(log t)2
1
und E(x) =
O(1) − O(1)
log x
x
2
Hierbei ist C1 konstant, da
Z∞
2
Z∞
1
1
1 t=∞
=
dt = −
,
2
t(log t)
log t t=2
log 2
und wird Meissel-Mertens-Konstante genannt. Außerdem gilt:
Z∞
1
dt
t(log t)2
x
!
1
1 t=∞
=O
+O
−
log x
log t t=x
1
=O
.
log x
1
O(1) − O(1)
E(x) =
log x
Insgesamt haben wir nun
X1
p≤x
p
= log log x + C1 + O
und damit Mertens zweiten Satz gezeigt.
4.1.4 Bemerkung (Die Meissel-Mertens-Konstante)
Man kann zeigen, dass
42
1
log x
1
dt.
t(log t)2


X X 1

1
1


+
≈ 0, 261497 . . .
C1 = lim 
− log log x = γ +
log 1 −
n→∞
p
p
p
P
p≤n
p∈
P
p∈
gilt, wobei
γ := lim
n→∞
n
X
1
− log n
k
!
≈ 0, 577215 . . .
k=1
die Euler-Mascheroni-Konstante ist [HAVIL] Kap. 7.2.
4.2 Die durchschnittliche Anzahl an Primfaktoren
Ausgehend von den Sätzen von Mertens können wir nun die mittleren Ordnungen bestimmen. Nach dem Erhalt dieser sind wir in der Lage, für große x mittels Ableitungen die
durchschnittliche Anzahl an Primfaktoren zu bestimmen. Wir beginnen mit der Summe
über die ω(n):
4.2.1 Satz (Summe über die ω(n))
Für x ∈ gilt:
R
X
ω(n) = x log log x + C1 x + O
n≤x
x
log x
.
Beweis.
Es gilt folgende Gleichungungskette:
X
ω(n) =
n≤x
Da wir wissen, dass
und erhalten so:
X
XX
n≤x p|n
p∈
P
n o
x
p
1=
X x
p≤x
p∈
P
X x X x
=
−
.
p
p
p
p≤x
p∈
P
p≤x
p∈
P
< 1 gilt, können wir die zweite Summe mit π(x) abschätzen
ω(n) = x
n≤x
X1
+ O(π(x))
p
p≤x
p∈
P
4.1.3
= x log log x + C1 + O
43
1
log x
+ O(π(x))
1
= x log log x + C1 x + O
log x
x
= x log log x + C1 x + O
log x
3.3.3
+O
x
log x
Nun wenden wir uns der Summe über die Ω(n) zu:
4.2.2 Satz (Summe über die Ω(n))
Für x ∈ gilt:
R
X
Ω(n) = x log log x + C2 x + O
n≤x
x
log x
,
wobei C2 = 1, 03465 . . . eine Konstante ist.
Beweis.
1. In diesem Beweis verwenden wir wieder die Schreibweise ep = ep (n), um eine
bessere Übersicht zu gewährleisten. Wir definieren nun die Funktion
A(x) :=
X
n≤x
(Ω(n) − ω(n)) =
∞ XX
x
(ep (n) − 1) =
,
pk
XX
P k=2
n≤x p|n
p∈
p∈
P
h i
weil pxk die Anzahl der Zahlen n ≤ x angibt, welche k-mal durch p teilbar sind.
Nun setzen wir:
C2 := C1 +
X
p∈
P
1
,
p(p − 1)
was wegen der Konvergenz der Summe konstant ist.
2. Es gilt nun aufgrund der Definition der Gaußklammer:
∞
XX
1
A(x) ≤ x
pk
p∈
=x
P k=2
∞
X 1 X
1
2
p
pk
p∈
44
P
k=0
(∗)
X 1
1
·
2
p 1−
p∈P
X
1
=x
=x
p∈
1
p
P p(p − 1)
= x(C2 − C1 ).
Bei (∗) haben wir die geometrische Summenformel angewendet, da
als 1 ist.
1
p
stets kleiner
3. Wenden wir nun die geometrische Summenformel auf folgenden Ausdruck an, so
ist
n
X
1
=
pk
k=2
!
1
n
X
1 − pn+1
1
1
1
1
1
1
−1− =
−1−
=
− n+1
=
−cp−n
1
n
k
p
p
p(p
−
1)
p
−
p
p(p
−
1)
p
1
−
p
k=0
für ein geeignetes c > 0.
i
h
x
+
1
Nun ist aber mit n := log
log p
−
p−n = p
h
i
log x
+1
log p
=e
−
h
i
log x
+1
log p
log p
≤ e− log x = x−1 .
4. Verkleinern wir nun die Summanden in A(x), so erhalten wir:
log x
+1
log p
A(x) ≥
X x
−
1
pk
X
√
p≤ x
p∈
k=2
P
log x
+1
log p
=
X
√
p≤ x
p∈
P
3.
=x
k=2
X √
p≤ x
p∈
P
≥x
X √
p≤ x
p∈
P
=x
X
√
p≤ x
p∈
P
log x
+1
log p
X x
X
−
k
p
√
X
p≤ x
p∈
P
1
− cp−n
p(p − 1)
1
− cx−1
p(p − 1)
1
+ O(1)
p(p − 1)
1
k=2
+
X
√
p≤ x
p∈
P
−
log x
log p
O(log x)
√
p≤ x
p∈
P
X
√
p≤ x
p∈
45
X
O
P
√
1 + O( x log x)

(∗∗)
= x
X
P
p∈
1
+O
p(p − 1)

√
√
log x 
√
+ O(π( x)) + O( x log x)
x
√
2.
= x(C2 − C1 ) + O( x log x).
1
P
mit C2 = C1 +
P p(p−1)
= 1, 03465 . . . . Hier haben wir bei (∗∗) die Summe
p∈
vergrößert und einen Abschätzungsterm hinzugefügt.
5. Aus 2. und 4. erhalten wir also
√
A(x) = x(C2 − C1 ) + O( x log x).
Die Behauptung ergibt sich aus:
X
Ω(n) =
n≤x
X
ω(n) + A(x)
n≤x
√
x
+ x(C2 − C1 ) + O( x log x)
= x log log x + C1 x + O
log x
x
= x log log x + C2 x + O
,
log x
4.2.1
da
x
log x
>
√
x log x für x ? 5504.
4.2.3 Bemerkung (Die durchschnittliche Anzahl an Primfaktoren)
Für x ∈ , x 1 und n ∈ , n ≈ x kann man die Näherungsausdrücke für die Summen
über ω(n) und Ω(n) als Funktionen in x auffassen, die stetig differenzierbar sind. Die Ableitung entspricht dann der Änderung der Summe, also der Anzahl der Primfaktoren, die
beim nächsten Summanden auftauchen. Also kann man die Ableitung als durchschnittliche Anzahl an Primzahlen auffassen, die pro Summand im Bereich um x auftritt. Wir
erhalten also für die durchschnittliche Anzahl an verschiedenen Primfaktoren:


X
d 
d
1
ω(n) ≈
(x log log x + C1 x) = log log x +
+ C1 .
dx
dx
log x
R
N
n≤x
Für die durchschnittliche Anzahl aller Primfaktoren bekommen wir:
46


d
d X
1
Ω(n) ≈
(x log log x + C2 x) = log log x +
+ C2 .
dx
dx
log x
n≤x
Wir sehen also, dass sich die beiden Durchschnittswerte nur um einen konstanten Summanden unterscheiden, was überraschend ist. Betrachten wir ein paar numerische Beispiele, so stellen wir fest, dass trotz sehr großer Schranke x, die zu erwartende Anzahl
an Primteilern sehr gering bleibt.
Tabelle 4.1: Durchschnittliche Anzahl an Primfaktoren
Obere Schranke
1010
1020
1050
10100
!
P
d
ω(n)
3,3981 4,0913 5,0076 5,7010
dx
n≤x
!
P
d
Ω(n)
4,1713 4,8644 5,7807 6,4739
dx
n≤x
47
5 Zahlentheoretische Probleme in der
Schule
Nachdem wir es in den vorherigen Kapiteln geschafft haben, mit zum Teil schwierigen mathematischen Methoden Aussagen zu erhalten, wollen wir nun versuchen, diese Probleme
auch im schulischen Kontext zu behandeln. Die Zielgruppe für unsere Überlegungen ist
eine Gruppe Oberstufenschüler, die besonders gute Leistungen in Mathematik hervorbringen. Ein Beispiel für eine solche Gruppe wäre eine Mathematik AG in der Oberstufe.
Es ist offensichtlich, dass diese Schüler in der Regel noch nicht das mathematische Vorwissen erworben haben, mit dem sie die Probleme auf oben beschriebenem Weg lösen
oder nachvollziehen können. Dazu ist eine Motivation des Themas sehr wichtig, weil davon maßgeblich der Lernerfolg der Schüler abhängt. Im Folgenden werden wir nun die
Kapitel einzeln motivieren, zeigen, wo sich in den genutzen Beweisen Probleme ergeben
und anschließend andere Möglichkeiten angeben, durch die man äquivalente Aussagen
beweisen kann.
5.1 Wahrscheinlichkeiten für Teilerfremdheit und
Quadratfreiheit
Im ersten Abschnitt befassen wir uns mit den Wahrscheinlichkeiten für Teilerfremdheit
und Quadratfreiheit. Wir beginnen mit einer Motivation.
5.1.1 Motivation
Zunächst müssen wir uns klar machen, was Teilerfremdheit und Quadratfreiheit eigentlich bedeuten. Teilerfremdheit zweier Zahlen bedeutet, dass der größte gemeinsame Teiler
der beiden Zahlen 1 ist, d.h. in den beiden Primfaktorzerlegung sind alle Primzahlen mit
Vielfachheiten größer als 0 paarweise verschieden. Quadratfreiheit hingegen bedeutet,
dass wir für eine natürliche Zahl keine Quadratzahl finden, sodass der Quotient wieder
eine natürliche Zahl ist, d.h. in der Primfaktorzerlegung der natürlichen Zahl dürfen
nur die Vielfachheiten 1 oder 0 vorkommen. Das Besondere an diesen Eigenschaften ist,
dass sie so unterschiedlich aussehen, man jedoch auf den ersten Blick keine Aussagen
über die Wahrscheinlichkeiten machen kann, mit denen zwei natürliche Zahlen bzw. eine
natürliche Zahl diese Eigenschaft besitzen.
Um nun eine erste Vorstellung zu gewinnen, wie die Eigenschaften auftreten, bietet es
48
sich an, die Schüler experimentieren zu lassen. Also weisen wir sie an, je nach Größe
der Gruppe, beliebige Zahlen auf diese Eigenschaften zu testen und dann die relativen Häufigkeiten zu bilden. Mit entsprechender Ausstattung lässt sich das sehr bequem
mit Computern ausführen. Die Programme sind mit entsprechender Software leicht zu
schreiben, sodass man Stichproben in beliebigen Zahlenbereichen durchführen kann. In
der Programmsprache von Matlab könnten die Programme so aussehen:
%W a h r s c h e i n l i c h k e i t f ü r
%Schranken m und n
d i s p ( ’ Schranke f ü r m’ )
m=i n p u t ( ’m= ’)
d i s p ( ’ Schranke f ü r n ’ )
n=i n p u t ( ’ n= ’)
u=0;
f o r i =1:m;
f o r j =1:n ;
e=gcd ( i , j ) ;
i f ( e==1)
u=u+1;
else
end
end
end
R=u / (m∗n )
T e i l e r f r e m d h e i t z w e i e r Zahlen i n n e r h a l b d e r
%E i n l e s e n d e r Schranken f ü r m und n
%L a u f v a r i a b l e d e r a b s o l u t e n H ä u f i g k e i t
%D u r c h l a u f e n a l l e r Zahle nkombi nation en
%Berechnung d e s ggT
%Bei T e i l e r f r e m d h e i t wird u um 1 e r h ö h t
%Berechnung d e r r e l a t i v e n H ä u f i g k e i t
%W a h r s c h e i n l i c h k e i t f ü r Q u a d r a t f r e i h e i t d e r Zahlen 1 b i s k
d i s p ( ’ Obere Schranke ’ )
k=i n p u t ( ’ k = ’)
%Schranke f e s t l e g e n
u=0;
%L a u f v a r i a b l e d e r a b s o l u t e n H ä u f i g k e i t
f o r n=1:k ;
%D u r c h l a u f e n a l l e r Zahlen
p = factor (n ) ;
%F a k t o r i s i e r u n g
n = unique ( p ) ;
%Löschen d o p p e l t e r Elemente
r = l e n g t h ( n)− l e n g t h ( p ) ;
%Pr üfen ob Längen von n
%und p g l e i c h
i f ( r ==0);
%Erhöhung d e r L a u f v a r i a b l e
u =u+ 1 ;
%f a l l s d i e Längen g l e i c h s i n d
else
end ;
end ;
Q=u/k
%Berechnung d e r r e l a t i v e n H ä u f i g k e i t
Immer wenn Computerprogramme eingesetzt werden, muss man auch die Effizienz dieser diskutieren. Die oben angegebenen Programmvorschläge sind sicher nicht optimal,
weil alle Zahlbereiche komplett durchlaufen werden, erfüllen jedoch ihren Zweck. Im
ersten Programm kann man sich beispielsweise überlegen, oder besser noch die Schüler
überlegen lassen, inwiefern man den Zahlbereich geschickter durchlaufen kann, bzw. wel-
49
che Bereiche man überhaupt durchlaufen muss. Denn wenn ggT (27, 4) = 1, dann ist auch
ggT (4, 27) = 1 und man kann sich die Rechnung einmal sparen. Das zweite Programm
könnte man dahingehend verbessern, dass man nur Zahlen untersucht, die modulo 4 nicht
0 sind, was ein Viertel der Zahlen bereits vor der aufwendigen Faktorisierung als nicht
quadratfrei einstuft. Nochmals verbessert wird dies durch eine zusätzliche Abfrage nach
der Klasse modulo 9. Hier kann man ausprobieren, inwiefern solche Abfragen noch Laufzeitverbesserungen bringen. Z.B. kann ein Test modulo 49 bei jeder Zahl möglicherweise
aufwendiger sein, als die damit ausgeschlossenen Zahlen zu durchlaufen.
Lässt man die beiden Programme nun Zahlenbereiche durchlaufen, so erhält man beispielsweise folgende Tabellen:
Tabelle 5.1:
Obere Grenze m
Obere Grenze n
Relative Häufigkeit
Wahrscheinlichkeit für Teilerfremdheit
10
50
100
500
1000
10
10
50
100
500
0,63 0,626 0,6138 0,6088 0,6087
1000
1000
0,6084
Tabelle 5.2: Wahrscheinlichkeit für Quadratfreiheit
Obere Grenze
10
50
100 1000 10000 100000
Relative Häufigkeit 0,7 0,62 0,61 0,608 0,6083 0,6079
Betrachtet man nun die Ergebnisse, so erkennt man, dass beide relativen Häufigkeiten
anscheinend gegen denselben Zahlenwert konvergieren. Es stellt sich automatisch die
Frage danach, wieso das so ist und ob dieser Wert exakt bestimmbar ist. Hier bietet
es sich an, auf die Einführung der mittleren Ordnung und asymptotischen Äquivalenz
zu verzichten und heuristisch an das Problem heranzugehen, da dies für die Schüler
anschaulicher ist. Auch wenden wir die Strategie des Rückwärtsarbeitens an, bei der wir
nicht wie in Kapitel 1 auf das Problem hinarbeiten, sondern ausgehend vom Problem eine
Lösung suchen. Dieses Vorgehen ist für die Schüler zum einen einfacher zu durchschauen,
weil wir nicht gezwungen werden Bezeichnungen einzuführen, deren Sinn den Schülern
erst später voll bewusst wird, zum anderen erkennen wir hier wesentlich besser, warum
der Grenzwert, auf den wir stoßen, derselbe ist.
5.1.2 Heuristische Betrachtung von Teilerfremdheit und Quadratfreiheit
Wir interpretieren wie üblich P (A) als die Wahrscheinlichkeit mit der das Ereignis A
auftritt.
1. Eine beliebige natürliche Zahl m ist durch eine Primzahl p teilbar, falls m ≡ 0
mod p gilt. Dies träfe in p1 der Fälle zu, wenn die Menge der betrachteten Zahlen endlich und ein Vielfaches von p wäre. Da die natürlichen Zahlen aber unbeschränkt sind, können wir dieses Konzept aus der Wahrscheinlichkeitstheorie nicht
anwenden, d.h. unsere Überlegungen sind nicht mathematisch exakt. Dies wird
50
darin deutlich, dass wir eine Gleichverteilung aller natürlichen Zahlen wegen der
Unbeschränktheit nicht realisieren können und somit auf diesem Weg auch keine
Wahrscheinlichkeiten zuordnen können. Heuristisch gesehen ist unsere Aussage,
dass eine zufällige Zahl mit Wahrscheinlichkeit p1 durch p teilbar ist, jedoch gerechtfertigt, da wir hier einfach die Kongruenzklassen modulo p betrachten, welche
wiederum endlich sind. Die Wahrscheinlichkeit, dass m und eine weitere natürliche
Zahl n durch p teilbar sind, ist, da m und n unabhängig voneinander gewählt
werden, p1 · p1 = p12 . Mit Hilfe des Gegenereignisses erhalten wir also:
P (m, n sind nicht beide durch p teilbar) = 1 − P (m, n sind durch p teilbar)
1
= 1 − 2.
p
2. Wir weiten nun unsere Überlegungen auf zwei verschiedene Primzahlen p und q aus.
Hier stoßen wir auf dasselbe Problem wie in 1., da wir keinen mathematisch exakt
definierten Wahrscheinlichkeitsraum zur Verfügung haben und deshalb nicht über
die Unabhängigkeit der Ereignisse sprechen können. Heuristisch gesehen können
wir jedoch, analog zu oben, unsere Betrachtungen auf die Kongruenzklassen modulo p · q beschränken. Weil p und q beide prim sind, liefert uns diese Betrachtung
mit Hilfe des chinesischen Restsatzes, dass wir die Kongruenzen, und damit unsere
Wahrscheinlichkeiten, getrennt betrachten können. Im Falle getrennter Betrachtungen für p und q multiplizieren sich die Wahrscheinlichkeiten aber einfach auf.
Also erhalten wir:
P (m, n sind nicht beide durch p und q teilbar) = P (m, n sind nicht beide durch p teilbar)
· P (m, n sind nicht beide durch q teilbar)
1
1
= 1− 2 · 1− 2 .
p
q
Wir sehen also, dass sich die Wahrscheinlichkeiten für mehrere Primzahlen einfach
aufmultiplizieren.
3. Die Zahlen m und n sind aber teilerfremd, wenn das Ergeignis m und n sind nicht
”
beide durch p teilbar“ für alle Primzahlen p aufritt.
P (m, n teilerfremd) = P (m, n sind für alle Primzahlen p nicht beide durch p teilbar)
Y
1
=
1− 2 .
p
p∈
P
Hier erkennen wir an Hand der Produktdarstellung bereits den Zusammenhang
mit der Riemannschen Zeta-Funktion, welchen wir aber erst später zeigen.
51
Nun betrachten wir die Wahrscheinlichkeit für Quadratfreiheit. Eine natürliche Zahl n
ist genau durch ein Quadrat q teilbar, wenn für alle Primzahlen p mit p2 |q direkt p2 |n
folgt. Soll also n quadratfrei sein, so muss sie frei von Primzahlquadraten sein. Es folgt
wie oben
Y
1
1− 2 ,
P (n ist quadratfrei) =
p
P
p∈
da die Teilbarkeit durch verschiedene Primzahlen unabhängige Ereignisse sind.
Wir sehen also, wie eng der Zusammenhang zwischen den beiden Eigenschaften wirklich
ist, denn die Wahrscheinlichkeiten gehen beide auf denselben Ausdruck zurück. Allerdings sind wir noch nicht in der Lage, dieses Produkt zu berechnen, da wir den Bezug
zur Zeta-Funktion noch nicht kennen. Deswegen werden wir nun analog zu 3.1.2 versuchen, das Produkt umzuformen und danach ζ(2) ausrechnen. Hierbei ist es dem Lehrer
überlassen, ob er die Zeta-Funktion
mathematisch exakt definiert oder das Symbol ζ(2)
P 1
nur als Abkürzung für
verwendet.
2
n
n∈
N
5.1.3 Die Produktdarstellung von ζ(2)
Es gilt:
Y
1
1 − 2 = ζ(2)−1 .
p
P
p∈
Beweis.
Wir verwenden hier einen anderen Beweis als in 3.1.2, weil wir diesmal etwas anschaulicher vorgehen wollen. Zunächst stellen wir fest, dass es genügt
Y
1
= ζ(2)
1
1
−
p∈P
p2
zu zeigen, da wir dieses Produkt problemlos invertieren können. Als nächstes wenden
wir auf die linke Seite die geometrische Summenformel an und erhalten
!
∞
Y
Y X
1
=
p−2k .
1
p∈P 1 − p2
p∈P k=0
Da wir nun ein unendliches Produkt über unendliche Summen haben, beschränken wir
uns zunächst auf folgenden Fall:
Sei Sx := {p ∈ |p ≤ x}. Dann ist Sx ⊂ und endlich. Betrachten wir nun
!
∞
Y X
−2k
Px :=
p
,
P
P
p∈Sx
k=0
52
so erhalten wir beispielsweise für x = 5:
(1 + 2−2 + 2−4 + . . . ) · (1 + 3−2 + 3−4 + . . . ) · (1 + 5−2 + 5−4 + . . . ).
Wir sehen, dass wir durch geschicktes Auswählen von Einträgen in den Klammern,
die miteinander multipliziert werden, das Inverse jeder Quadratzahl bilden können, die
nur die Primfaktoren 2,3 und 5 enthält. Aufgrund der eindeutigen Primfaktorzerlegung
(PFZ) wird jede dieser Quadratzahlen genau einmal durch die Multiplikation gebildet.
Also können wir allgemein
X
1
Px =
n2
N
n∈
n hat PFZ
in Sx
schreiben. Offensichtlich ist Px nicht negativ, monoton und durch
P
n∈
N
1
n2
nach oben
beschränkt. Deswegen existiert der Grenzwert lim Px .
x→∞
Weil für immer größer werdendes x die Menge Sx immer mehr Primfaktoren enthält, werden im Grenzübergang alle natürlichen Zahlen durchlaufen, da alle Primzahlen kleiner
als unendlich sind. D.h. wir haben
lim Px =
x→∞
Andererseits gilt wegen S∞ = {p ∈
lim Px =
x→∞
X 1
.
n2
n∈
N
P|p ≤ ∞} = P die folgende Gleichheit:
Y
∞
X
p∈S∞
k=0
Y
∞
X
P
k=0
!
p−2k
=
p∈
!
p−2k
.
Insgesamt bekommen wir also
Y
∞
X
P
k=0
p∈
!
p−2k
= lim Px =
x→∞
X 1
,
n2
n∈
N
was unsere Aussage beweist.
Nun haben wir unser Problem auf ein anderes zurückgeführt und erhalten:
P (m, n teilerfremd) = P (n ist quadratfrei) = ζ(2)−1 .
Jetzt stellt sich auch für die Schüler ganz automatisch die Frage, wie man ζ(2) am besten berechnen kann. Dies ist wichtig, da sie so selbst den Nutzen sehen, diese Reihe zu
berechnen, was zu Beginn des Abschnitts keineswegs plausibel war. Wir haben allerdings in unserer Zielgruppe nur begrenzte Kenntnisse aus der Analysis, welche wir zu
Problemlösung nutzen können. Im Folgenden werden wir deswegen einen alternativen
Beweis für 2.1.2 angeben, der andere Voraussetzungen an Analysis und den komplexen
Zahlen erfordert. Somit kann hier der Lehrer wählen, was er für geeigneter hält.
53
5.1.4 Der Wert von ζ(2)
Es gilt:
ζ(2) =
π2
.
6
Im folgenden Beweis orientieren wir uns an der Vorlage aus [AIGNER] Kap. 7.
5.1.5 Beweis von 5.1.4
Wir zeigen die Aussage in mehreren Schritten.
1. Zunächst beweisen wir:
π
2π
mπ
2m(2m − 1)
2
2
2
cot
+ cot
+ · · · + cot
=
.
2m + 1
2m + 1
2m + 1
6
Hierfür nutzen wir die elementare Relation
cos(nx) + i sin(nx) = e(inx) = (cos(x) + i sin(x))n .
Betrachten wir hiervon den Imaginärteil so erhalten wir:
Im(cos(nx) + i sin(nx)) = sin(x)
(1)
und
n−1
[X
2 ]
n
k
(−1)
sin2k+1 (x) cosn−2k−1 (x).
Im ((cos(x) + i sin(x)) ) =
2k + 1
n
(2)
k=0
rx
Setzen wir nun n = 2m + 1 und betrachten die m Werte x = 2m+1
mit r =
π
1, 2, . . . , m, dann ist 0 < x < 2 und nx = rπ, also sin(nx) = 0. Weiterhin ist sin(x)
für alle m positiv und die Werte sind paarweise verschieden, da der Sinus in diesem
Bereich monoton ist. Setzen wir nun (1) und (2) gleich so erhalten wir:
n−1
[X
2 ]
n
k
0=
(−1)
sin2k+1 (x) cosn−2k−1 (x).
2k + 1
k=0
Jetzt teilen wir durch sinn (x) und bekommen:
n
n
n−1
0=
cot
(x) −
cotn−3 (x) + . . . .
1
3
54
(∗)
Nun setzen wir unser oben gewähltes n ein:
2m + 1
2m + 1
2m
0=
cot (x) −
cot2(m−1) (x) + . . . .
1
3
Betrachten wir nun das Polynom p(t) vom Grad m mit
2m + 1 m
2m + 1 m−1
m 2m + 1
,
p(t) :=
t −
t
+ · · · + (−1)
2m + 1
1
3
so kennen wir aus (∗) die m verschiedenen Nullstellen ar bereits, denn
2
ar = cot
rπ
2m + 1
mit r = 1, 2, . . . m.
Das Polynom
π
2m + 1
mπ
2
2
l(t) :=
t − cot
· · · · · cot
1
2m + 1
2m + 1
hat aber ebenso Grad m und dieselben Nullstellen wie p(t), d.h. die Polynome
müssen übereinstimmen. Insbesondere stimmen dann ihre Koeffizienten überein.
Vergleichen wir die Koeffizienten von tm−1 , so erhalten wir:
2m + 1
2m + 1
π
mπ
2
2
−
=−
(cot
+ · · · + cot
)
3
1
2m + 1
2m + 1
2m+1
2m(2m − 1)
3
,
d.h. a1 + · · · + ar = 2m+1 =
6
1
was zu zeigen war.
2. Als nächstes benötigen wir noch eine Aussage desselben Typs. Wir zeigen
csc
2
π
2m + 1
wobei csc(x) =
+ csc
1
sin(x)
2
2π
2m + 1
+ · · · + csc
2
mπ
2m + 1
=
2m(2m + 2)
,
6
die Kosekans-Funktion ist. Es gilt nun
csc2 (x) =
1
cos2 (x) + sin2 (x)
=
= cot2 (x) + 1,
sin2 (x)
sin2 (x)
was uns mit Hilfe von 1. direkt das Ergebnis liefert:
55
2π
mπ
π
2
2
+ csc
+ · · · + csc
csc
2m + 1
2m + 1
2m + 1
π
2π
mπ
2
2
2
= cot
+ 1 + cot
+ 1 + · · · + cot
+1
2m + 1
2m + 1
2m + 1
π
2π
mπ
= cot2
+ cot2
+ · · · + cot2
+m
2m + 1
2m + 1
2m + 1
1. 2m(2m − 1)
=
+m
6
4m2 − 2m + 6m
=
6
2
4m + 4m
=
6
2m(2m + 2)
=
.
6
2
3. Sei nun x ∈ (0, π2 ), so gilt offensichtlich:
0 < sin(x) < x < tan(x)
und wir erhalten durch Bilden der reziproken Werte
0 < cot(x) <
1
< csc(x).
x
Quadrieren liefert dann
cot2 (x) <
1
< csc2 (x).
x2
Setzen wir nun für x die m Werte aus 1. ein und addieren die Ergebnisse, so
erhalten wir:
π
mπ
2m + 1 2
2m + 1 2
cot2
+ · · · + cot2
<
+ ··· +
2m + 1
2m + 1
π
mπ
π
mπ
2
2
< csc
+ · · · + csc
.
2m + 1
2m + 1
Nutzen wir nun unsere Ergebnisse aus 1. und 2. so bekommen wir:
2m(2m − 1)
<
6
2m + 1
π
56
2
+ ··· +
2m + 1
mπ
2
<
2m(2m + 2)
6
und somit
d.h.
1
1
2m(2m + 2)
2m(2m − 1)
2m + 1 2
·
+ ··· + 2 <
<
,
2
6
π
1
m
6
6 2m 2m − 1
1
1
6 2m 2m + 2
< 2 + ··· + 2 < 2
.
2
π 2m + 1 2m + 1
1
m
π 2m + 1 2m + 1
Man sieht direkt, dass für m → ∞ die linke und die rechte Seite gegen
gieren, also ebenso der Ausdruck in der Mitte. Es ist also:
ζ(2) =
π2
6
konver-
∞
X
π2
1
=
.
m2
6
m=0
2
Somit erhalten wir, dass
P (n quadratfrei) = P (m, n teilerfremd) =
6
≈ 0, 6079.
π2
5.2 Der Primzahlsatz
Im zweiten Abschnitt des schulischen Teils wollen wir uns mit dem Primzahlsatz beschäftigen.
Wie eben beginnen wir mit einer Motivation.
5.2.1 Motivation
Die Anzahl aller Primzahlen unter einer Schranke war schon immer ein sehr interessantes
Problem. Es war besonders einfach zu formulieren, jedoch war lange Zeit nicht klar, ob
es überhaupt eine elementare Funktion gibt, die die Primzahlfunktion π(x) annähert.
Besonders interessant ist die Funktion, da man ausgehend von ihr Aussagen über die
Primzahlverteilung machen kann, also etwa, ob die Dichte der Primzahlen konstant bleibt
oder sich verändert.
Um den Schülern einen ersten Überblick zu geben, wie π(x) aussieht, hilft es wieder,
sich die Technik zu Nutze zu machen. Da viele Programme bereits Primzahltests implementiert haben, ist es auch für Schüler nicht schwer, die Primzahlfunktion bis zu einer
beliebigen Schranke zu berechnen und ihren Verlauf graphisch darzustellen. In Matlab
könnte dieses Programm so aussehen:
%Die P r i m z a h l f u n k t i o n
d i s p ( ’ o b e r e Schranke ’ )
n=i n p u t ( ’ n= ’)
%E i n l e s e n d e r o b e r e n Schranke
57
k=1;
%H i l f s v a r i a b l e
f o r i =1:n ;
%D u r c h l a u f d e r Zahlen b i s n
l=i s p r i m e ( i ) ;
%Test a u f P r i m a l i t ä t
i f ( l ==1);
%F a l l s l prim , S p e i c h e r u n g von i im k−t e n
u ( k)= i ;
%E i n t r a g d e s V e k t o r s u
k=k+1;
else ;
end ;
end ;
%S t u f e n p l o t d e r P r i m z a h l f u n k t i o n ,
%l e n g t h ( u ) i s t d i e Anzahl an Primzahlen b i s z u r Schranke n
s t a i r s ([1 u n ] , [ 0 1: length (u) length (u ) ] )
Auch hier ist es sinnvoll, die Frage der Effizienz in den Raum zu stellen. Denn je nach
oberer Schranke kann es beispielsweise deutlich schneller gehen, mit dem Sieb des Eratosthenes zu operieren, um eine Primzahlliste zu erstellen. Auch könnte man von vornherein nur die ungeraden Zahlen durchlaufen und als weitere Verbesserung auch nur die,
die zusätzlich nicht durch 3 teilbar sind. Dies würde eine erhebliche Verringerung der
zu durchlaufenden Zahlen bedeuten, jedoch das Programm verlängern. Auch kommt es
auf den verwendeten Primzahltest an, denn dieser benötigt besonders für große Zahlen
sehr viel der verfügbaren Rechenleistung. Hier können Schüler sehr gut ihre Kreativität
in die Unterrichtsgestaltung mit einfließen lassen und miteinander über die optimalen
Abfragen in den Programmen diskutieren.
Setzen wir als obere Schranke n = 1000000, so erhalten wir folgenden Funktionsgraphen:
Es bietet sich nun an, die Schüler raten zu lassen, welche Funktion diesen Graphen
gut annähern könnte. Hierbei kann man über den Graphen der Primzahlfunktion den
58
vorgeschlagenen Funktionsgraphen zeichnen, was mit Computerprogrammen und einem
Beamer sehr gut funktioniert. So sehen die Schüler dann auch direkt, wo ihre vorgeschlagenen Funktionen gute und wo sie schlechte Annäherungen an die Primzahlfunktion sind.
Allerdings sind die Schüler wahrscheinlich nicht in der Lage, auf die Funktion logx x zu
kommen, da sie mit dieser noch nie konfrontiert wurden.
Eine andere Möglichkeit, die Schüler anschaulich auf die Funktion zu bringen, wäre die
x
Berechnung und Tabellierung von π(x)
. Wir erhalten dabei z.B. folgende Tabelle:
Obere Schranke
x
π(x)
101
2,5
102
4
103
5,95
104
8,14
105
10,43
106
12,74
Hier fällt auf, dass die berechneten Werte nahezu linear mit dem Exponenten der oberen
Schranke ansteigen. Da der Logarithmus in der Schule behandelt wird, ist es durchaus
x
zu erwarten, dass die Schüler die Beziehung π(x)
≈ log x aus der Tabelle herauslesen
können. Es ist wie üblich dem Lehrer überlassen, wie viele Hinweise er gibt und welche
Möglichkeiten er abhängig von den Vorkenntnissen der Schüler für geeignet hält.
Leider können wir den Primzahlsatz wie in Kapitel 3 nicht direkt beweisen. Dies setzt zu
viel Vorwissen in funktionentheoretischen Sachverhalten vorraus, die man den Schülern
auch nicht in angemessener Zeit vermitteln kann. Es gibt zwar noch andere Möglichkeiten,
den Primzahlsatz zu zeigen, jedoch sind auch diese Beweise sehr kompliziert und im schulischen Rahmen nicht durchführbar. Deswegen ist es sinnvoll, an dieser Stelle nur eine
Abschätzung nach oben und unten zu beweisen. Dies illustriert anschaulich, dass sich
die Primzahlfunktion innerhalb eines elementar bestimmbaren Bereiches befindet.
Obwohl der Beweis mit schulischer Analysis durchführbar ist, benötigen wir zunächst
einige Hilfssätze, die uns im eigentlichen Beweis nützlich sein werden. An dieser Stelle
muss man den Schülern klar machen, dass diese Hilfssätze zunächst nichts mit dem
eigentlichen Problem zu tun haben und wir sie nur benötigen, weil sie uns später Lücken
im Beweis schließen. Wir orientieren uns in den Beweisen an der Vorgehensweise aus
[SCHULZE-PILLOT] Kap. 10.
5.2.2 Hilfssatz (Ungleichung für Binomialkoeffizienten)
Für n ∈ gilt:
2n
n
4 < (2n + 1)
.
n
N
Beweis.
Zunächst formen wir die rechte Seite ein wenig um:
2n
(2n)!
(2n + 1)!(n + 1)
2n + 1
(2n + 1)
= (2n + 1)
=
= (n + 1)
.
n
(n!)2
n!(n + 1)!
n
Nun beweisen wir die Aussage durch vollständige Induktion.
59
Induktionsanfang:
Für n = 1 gilt:
2
4 < 6 = 3 ∗ 2 = (2 · 1 + 1)
.
1
1
Induktionsschritt: n → n + 1, n > 1
Auf der linken Seite kommt ein Faktor 4 hinzu. Rechts erkennen wir durch
2n + 3
(2n + 3)!
(n + 2)
= (n + 2)
n+1
(n + 1)!(n + 2)!
(2n + 3)!
=
((n + 1)!)2
(2n + 1)!(2n + 2)(2n + 3)
=
(n!)2 (n + 1)2
2n (2n + 2)(2n + 3)
= (2n + 1)
,
n
(n + 1)2
dass ein Faktor
(2n+2)(2n+3)
(n+1)2
hinzukommt. Wegen
(2n + 2)(2n + 2)
(n + 1)(n + 1)
(2n + 2)(2n + 3)
>
=4
=4
(n + 1)2
(n + 1)2
(n + 1)2
und dem Induktionsanfang erhalten wir die gewünschte Ungleichung.
Nun können wir den folgenden Hilfssatz zeigen, der es uns erlaubt, später die obere
Abschätzung für die Primzahlfunktion zu beweisen.
5.2.3 Hilfssatz (Primzahlschranke)
Für n ∈ gilt:
N
Y
p < 4n .
p≤n
p∈
P
Beweis.
Für n = 1, 2 ist die Aussage trivial. Für n ≥ 3 verwenden wir Induktion und unterscheiden dabei, ob n gerade oder ungerade ist.
Induktionsschritt: n − 1 → n, n ≥ 3
60
1. Sei n gerade, dann ist n keine Primzahl und es gilt:
Y
Y
p=
IV
p ≤ 4n−1 < 4n .
p≤n−1
p∈
p≤n
p∈
P
P
2. Sei n ungerade, d.h. n = 2m + 1, so gilt:
2m + 1 5.2.2 m
< 4 .
p m
Y
m+1<p≤2m+1
p∈
P
Also können wir schreiben:

Y
p≤2m+1
p∈
P
 

 Y  

p=
p

·
p≤m+1
p∈
Y
m+1<p≤2m+1
p∈
P
P
 IV m+1 m
p
4 = 42m+1 .
<4
Die Behauptung ergibt sich direkt aus 1. und 2.
Der letzte Hilfssatz, der eine Abschätzung für das kleinste gemeinsame Vielfache (kgV)
liefert, ist notwendig, um die untere Schranke der Primzahlfunktion zu zeigen.
5.2.4 Hilfssatz (Abschätzung des kgV)
Sei dn := kgV (1, 2, . . . , n), n ∈ . Dann ist für n ≥ 7 stets dn > 2n .
N
Beweis. Der Beweis beruht darauf, das Integral
Z1
I(m, n) :=
xm−1 (1 − x)n−m dx
0
zu berechnen, wobei m, n ∈
1. Wegen (1 − x)n−m =
N mit 1 ≤ m ≤ n.
n−m
P
j=0
I(m, n) =
(−1)j xj gilt:
Z1
n−m
X
1
n−m
1
m−1+j
j n−m
∈
,
(−1)
x
dx =
(−1)
m + j dn
j
j
n−m
X
j=0
n−m
j
Z
j
j=0
0
denn dn ist immer Hauptnenner der Summanden.
61
2. Um I(m, n) auf eine zweite Art zu berechnen, berechnen wir das Integral
Z1
(1 − x + xy)n−1 dx
0
mit y ∈ [0, 1) ebenso auf zwei Arten.
a) Für die erste Art nutzen wir die Darstellung durch Binomialkoeffizienten.
Z
1
n−1
(1 − x + xy)
dx =
0
n−1
X
m=0
Z1
n−1
(1 − x)n−m−1 (xy)m dx
m
m→m−1
=
0
n X
n−1
m−1
m=1
=
(1 − x)n−m (xy)m−1 dx
0
n X
m=1
Z1
n − 1 m−1
y
I(m, n).
m−1
b) Für die zweite Art rechnen wir das Integral einfach aus.
Z1
(1 − x + xy)n
dx =
n(y − 1)
n−1
(1 − x + xy)
x=1
0
x=0
yn
1
−
n(y − 1) n(y − 1)
1 yn − 1
=
n y−1
geom. Summe 1
=
(1 + y + y 2 + · · · + y n−1 ).
n
=
Da die Faktoren 1, y, y 2 , . . . linear unabhängig auf [0, 1) sind, können wir Koeffizientenvergleich auf a) und b) anwenden und erhalten
n−1
1
I(m, n) = ,
m−1
n
d.h. es gilt
I(m, n) =
1
n
=
n−1
m−1
1
m
n
m
.
3. Vergleichen wir nun 1. und 2. so bekommen wir, dass es eine ganze Zahl c gibt,
sodass
62
1
m
=
n
m
c
dn
gilt. Formen wir dies um, so erhalten wir:
n
n
dn = cm
, d.h. m
|dn .
m
m
4. Insbesondere gelten dann auch:
•
•
2n
n
|d2n |d2n+1 ,
n
2n
2n + 1 Symm.
2n + 1
(2n + 1)
= (n + 1)
= (n + 1)
|d2n+1 .
n
n
n+1
Also haben wir wegen ggT (n, 2n + 1) = 1
2n
n(2n + 1)
|d2n+1 ,
n
und wegen 5.2.2 gilt
d2n+1 > n4n .
5. Folglich gilt:
• für n ≥ 2: d2n+1 > 2 · 4n = 22n+1 ,
• für n ≥ 4: d2n+2 ≥ d2n+1 ≥ 4n+1 = 22n+2 .
Somit haben wir die Behauptung gezeigt für gerade n ≥ 5 und ungerade n ≥ 10.
Es bleibt der Fall n = 8 übrig, welchen wir schnell nachrechnen:
d8 = 23 · 3 · 5 · 7 = 840 > 256 = 28 .
Damit ist die Behauptung bewiesen.
Jetzt können wir die Abschätzung formulieren, veranschaulichen jedoch vor dem Beweis
die Bedeutung dieser Abschätzung mit Hilfe eines Graphen, in den wir π(x) und die
Abschätzungen eintragen. So können die Schüler sich besser vorstellen, wie genau diese
Abschätzung ist und was diese leisten, bzw. nicht leisten kann. Zunächst geben wir die
Abschätzung an:
63
5.2.5 Abschätzung der Primzahlfuntkion
Für alle n ≥ 4 gelten die Ungleichungen:
n
n
log log n
log 2
≤ π(n) ≤ log 4 + 8
.
log n
log n
log n
Das folgende Bild zeigt, dass die Abschätzung zwar richtig, aber keineswegs sehr gut ist:
5.2.6 Beweis der Abschätzung
Wir zeigen zunächst die erste Ungleichung:
Sei p ein Primteiler von dn und e ∈ so, dass pe |dn und pe+1 6 |dn . Wir schreiben dafür
auch pe ||dn . Dann existiert eine natürliche Zahl m ≤ n mit pe ||m. Deshalb gilt:
Y
Y
pe ≤
n = nπ(n) ,
dn =
N
p≤n
pe ||dn
p∈
P
d.h.
p≤n
p∈
P
log dn ≤ π(n) log n.
Für n ≥ 7 ist dies wegen 5.2.4 äquivalent zu:
π(n) ≥
log(2n )
n
= log 2
.
log n
log n
Die Fälle n = 4, 5, 6 gelten ebenfalls, wie man leicht nachrechnet:
64
n
4
5
6
log 2 logn n
2
2, 15 . . .
2, 32 . . .
π(n)
2
3
3
Also ist die erste Ungleichung bewiesen.
Die zweite Ungleichung ist nicht so leicht zu zeigen. Hierfür gehen wir in mehreren
Schritten vor, die größtenteils einer Funktionsdiskussion in der Oberstufe entsprechen.
1. Sei t ∈ [1, n). Es ist
tπ(n)−π(t) ≤
Y
5.2.3
p ≤ 4n
t<p≤n
p∈
P
(π(n) − π(t)) log t ≤ n log 4
n
n
π(n) ≤ log 4
+ π(t) ≤ log 4
+ t.
log t
log t
2. Wir suchen nun das t, für das die Funktion auf der rechten Seite minimal wird, um
die beste Abschätzung zu erhalten. Da wir dieses aber nicht elementar ausrechnen
können, wählen wir stattdessen t := logn2 n . Einsetzen in 1. liefert dann:
n
n log 4
n
=
π(n) ≤
+
2
log n − 2 log log n log n
log n
log 4
1−
2 log log n
log n
1
+
log n
!
.
Ein Vergleich mit der gesuchten Abschätzung zeigt uns nun, dass es genügt
log 4 + 8
log 4
1
log log n
+
≥
2
log
log
n
log n
log n
1 − log n
(∗)
zu beweisen.
3. Um dies zu zeigen, setzen wir L = L(x) := 2 logloglogx x für x > 1. Es gilt dann:
L(x) > 0 ⇔ log log x > 0 ⇔ log x > 1 ⇔ x > e.
Ab jetzt sei immer x > e. Weiter ist L0 (x) =
d
dx L(x)
log x
und es gilt:
= 2 1−log
x log2 x
L0 (x) = 0 ⇔ log log x = 1 ⇔ x = ee ≈ 15, 15 . . . .
Weiterhin bemerken wir, dass L(x) ab x = ee monoton fallend ist und dass L(ee ) =
2
e < 1 gilt. Dies wird im nächsten Schritt zusammen mit L > 0 bei (∗∗) ausgenutzt.
65
4. Nun beginnen wir die Ungleichung (∗) umzuformen und sie mit L(x) in Verbindung
zu bringen.
log 4
1−
2 log log n
log n
+
1
log log n
≤ log 4 + 8
log n
log n
log 4
1
+
≤ log 4 + 4L
1 − L log n
1
⇔ log 4
− 1 ≤ log 4 + 4L
1−L
L
1
log 4
≤L−
⇔
4
1−L
4 log n
log 4
1−L
(∗∗)
⇔
≤1−L−
4
4L log n
log 2
1
1
⇔ L≤1−
−
+
2
4L log n 4 log n
1
1
log 2
L=L(n)
−
+
⇔
L≤1−
2
8 log log n 4 log n
⇔
(#)
5. Wir fassen nun beide Seiten von (#) als Funktion in x. Die Ableitung der linken
Seite kennen wir, die der rechten Seite ist
d
dx
log 2
1
1
1
1
1−
−
+
=
−
2
8 log log x 4 log x
8x(log x)(log log x)2 4x log2 x
1
1
1
=
−
.
4x log x 2(log log x)2 log x
6. Als nächstes vergleichen wir die Ableitungen der beiden Seiten von (#), um eine
Aussage über das Wachstum der beiden Funktionen machen zu können.
⇔
⇔
⇔
⇔
d
d
log 2
1
1
L(x) ≤
1−
−
+
dx
dx
2
8 log log x 4 log x
1 − log log x
1
1
1
2
≤
−
4x log x 2(log log x)2 log x
x log2 x
8
1
1
(1 − log log x) ≤
−
log x
2(log log x)2 log x
log x
8 − 8 log log x ≤
−1
2(log log x)2
log x
9 ≤ 8 log log x +
2(log log x)2
66
Man sieht, dass die Ungleichung auf jeden Fall für x ≥ ee erfüllt ist, da die rechte
Seite dort monoton steigend ist und log log x ≥ 1 sowie 2(logloglogx x)2 ≥ 2e gelten.
7. Durch 6. erhalten wir, dass, wenn (#) für ein x0 ≥ ee erfüllt ist, die Ungleichung
auch für alle x ≥ x0 erfüllt ist. Setzen wir x0 = 250, so ist L(x0 ) = 0, 618 . . . und
die rechte Seite von (#) hat den Wert 0, 625 . . . für x0 . Also ist die Ungleichung
(#) für x ≥ 250 und damit wegen 4. auch (∗) erfüllt. Für die verbleibenden n ∈
zwischen 4 und 250 rechnet man die Ungleichung direkt nach. Damit ist auch die
zweite Ungleichung bewiesen.
N
Nun ist es sinnvoll, den Schülern noch einen Ausblick zu geben, was in der analytischen
Zahlentheorie möglich ist. Der eigentliche Primzahlsatz aus 3.3.3 kann verbessert werden durch π(x) ≈ logx x + logx2 x . Eine noch bessere Approximation ist jedoch die Funktion
Rx
li(x) = 2 log1 x dx. Diese Approximation ist nicht nur wesentlich besser, sondern lässt
sich darüberhinaus interpretieren. Für große Zahlen hat nämlich die Primzahlfunktion
d
d
ungefähr die Steigung dx
π(x) ≈ dx
li(x) = log1 x . D.h. die Wahrscheinlichkeit für eine
Zahl in einem Bereich um x 0 prim zu sein ist ungefähr log1 x . Unter Annahme der
√
Riemannschen Vermutung kann man sogar den Fehlerterm von li(x) auf O( x log x) bestimmen. Um die Fortschritte in den Abschätzungen zu verdeutlichen, bietet es sich an,
die Schüler mit Hilfe von Programmen Tabellen erstellen zu lassen, welche einen guten
Überblick über die Abschätzungen bietet. Beispielsweise könnte eine Tabelle folgendermaßen aussehen, wobei der Lehrer die Werte der Größenordnungen angibt, in denen die
Programme versagen:
x
10
102
103
104
105
106
107
108
109
1010
1011
1012
1013
1014
1015
π(x)
x
log x
li(x)
4
25
168
1.229
9.592
78.498
664.579
5.761.455
50.847.534
455.052.511
4.118.054.813
37.607.912.018
346.065.536.839
3.204.941.750.802
29.844.570.422.669
4
22
145
1.086
8.686
72.382
620.421
5.428.681
48.254.942
434.294.482
3.948.131.654
36.191.206.825
334.072.678.387
3.102.103.442.166
28.952.965.460.217
6
30
178
1.246
9.630
78.628
664.918
5.762.209
50.849.235
455.055.615
4.118.066.401
37.607.950.281
346.065.645.810
3.204.942.065.692
29.844.571.475.288
67
1016
1017
1018
1019
1020
279.238.341.033.925
2.623.557.157.654.233
24.739.954.287.740.860
234.057.667.276.344.607
2.220.819.602.560.918.840
271.434.051.189.532
2.554.673.422.960.305
24.127.471.216.847.324
228.576.043.106.974.646
2.171.472.409.516.259.138
279.238.344.248.557
2.623.557.165.610.822
24.739.954.309.690.415
234.057.667.376.222.382
2.220.819.602.783.663.484
Man erkennt hier sehr gut, dass der in 3.3.3 bewiesene Primzahlsatz wirklich nur als
asymptotische Aussage anzusehen ist, da er selbst in der Größenordnung 1020 in der
zweiten Stelle schon einen Fehler besitzt. Die li(x)-Funktion hingegen stimmt in den ersten 10 Stellen mit π(x) überein, ist also wesentlich besser, jedoch selbst mit Computern
aufwändiger zu berechnen. Es bleibt allerdings noch die Frage offen, wie man π(1020 )
exakt bestimmt, da bei solch hohen Zahlen der Speicher der Computer nicht ausreichend
für eine komplette Auflistung ist. Man kann mit Hilfe der Möbius-Transformation zeigen
(siehe [BORWEIN]), dass
Z∞
∞
∞
∞
∞
X
X
µ(n) 1 X µ(n) X ρ X µ(n)
dt
µ(n)
π(x) =
li x n −
li x n +
−log
2
2
n
n ρ
n
(t − 1)t log t
n
n=1
n=1
n=1
1
n=1
xn
gilt, wobei die Summe über ρ alle nichttrivialen Nullstellen ρ der Riemannschen Zetafunktion durchläuft. Mit diesem Ausdruck ist es möglich π(x) bis zu einer gewissen, von
der Technik vorgegebenen Schranke exakt zu bestimmen, was wir aber hier nicht weiter
verfolgen werden.
5.3 Die durchschnittliche Anzahl an Primfaktoren
In unserem letzten Abschnitt suchen wir einen anderen Zugang zur Abschätzung der
durchschnittlichen Anzahl an Primfaktoren als in Kapitel 4. Wir könnten zwar dieselbe Vorgehensweise benutzen, da die Beweise unter Anleitung eines Lehrers auch für
Schüler verständlich sind, jedoch kann man hier mit experimentellen Mitteln wesentlich
anschaulicher die Abschätzungen annähern. Zunächst motivieren wir das Thema.
5.3.1 Motivation
Da wir im eben das Verhalten der Primzahlfunktion untersucht haben, wissen wir nun,
dass wir Grenzen angeben können, in denen die Primzahlfunktion verläuft. Die nächste
natürliche Frage, die sich stellt, ist, wie sich die Anzahl an Primfaktoren verhält. Hier
müssen wir jedoch unterscheiden, ob wir die Vielfachheiten berücksichtigen oder nicht.
Auf Anhieb lässt sich nur sagen, dass wir, wenn wir die Vielfachheiten berücksichtigen,
einen höheren durchschnittlichen Wert an Primfaktoren erwarten werden, als ohne Berücksichtigung der Vielfachheiten, was klar ist. Allerdings interessiert uns auch, wie stark sich
die beiden Werte unterscheiden und wie wir das Wachstum abschätzen können.
68
Wie üblich bei zahlentheoretischen Problemen ist es sinnvoll, sich die Verteilungen mit
einem Computer visuell darstellen zu lassen. Wir benutzen im Folgenden die Darstellungen Ω(n) bzw. ω(n) für die durchschnittliche Anzahl an Primfaktoren mit bzw. ohne
Berücksichtigung der Vielfachheiten bis zur Schranke n ∈ . Zur Berechnung von Ω(n)
greifen wir auf das Matlab Programm
N
%Durchschnittliche Anzahl an Primfaktoren mit Vielfachheiten
disp(’Obere Schranke eingeben’) %Schranke festlegen
n=input(’n=’);
u=0;
%Absolute Anzahl an Primfaktoren
for i=1:n;
p=factor(i);
%Faktorisierung
u=u+length(p);
%Erhöhung der Laufvariablen um
%die Anzahl der Primfaktoren von i
end
M=u/n
%Berechnung des Durchschnittswertes
zurück und zur Bestimmung von ω(n) auf das Programm:
%Durchschnittliche Anzahl an Primfaktoren ohne Vielfachheiten
disp(’Obere Schranke eingeben’) %Obere Schranke festlegen
n=input(’n=’);
u=0;
%Laufvariable
for i=1:n;
p=factor(i);
%Faktorisierung
k=unique(p);
%Löschen doppelter Einträge
u=u+length(k);
%Erhöhung der Laufvariablen um
%die Anzahl an verschiedenen Primfaktoren
end
O=u/n
%Berechnung des Durchschnittswertes
Natürlich sollte hier wieder die Effizienz der Programme eine große Rolle spielen, so wäre
es sicher geschickt, beide Programme zu verknüpfen, um nur einmal Faktorisieren zu
müssen. Erneut ist es dem Lehrer überlassen, ob er selbst bessere Programme vorschlägt
oder das Problem als Knobelaufgabe an die Schüler weitergibt.
Nun betrachten wir wie bereits bei den vorherigen Problemstellungen verschiedenen
Zahlbereiche und stellen Ω(n) und ω(n) gegenüber. Es ergibt sich folgende Tabelle:
Tabelle 5.4: Durchschnittliche Anzahl an Primfaktoren bis zur Schranke n
Schranke n 10 100
1000
10000 100000 1000000
Ω(n)
ω(n)
1,6
1,2
2,4
1,72
2,8780
2,1270
3,1986
2,4301
3,4362
2,6640
3,6266
2,8537
In dieser Darstellung erkennen wir an der Tabelle nur, dass die Durchschnittswerte sehr
langsam ansteigen. Nun wird von den Schülern sicher der Vorschlag kommen, sich die
69
beiden Funktionen zeichnen zu lassen. Dies ist eine hervoragende Idee, wie wir gleich
sehen werden. Setzen wir als obere Schranke 10000, so erhalten wir folgende Funktionsgraphen:
Hier erkennen wir und insbesondere die Schüler schon viel eher, wie die beiden Funktionen zusammenhängen, denn die Steigungen scheinen für große Zahlenwerte nahezu
identisch zu sein, was den parallelen Verlauf erklärt. Betrachten wir dazu noch die Differenz Ω(n) − ω(n), so erhalten wir:
Tabelle 5.5: Differenz von Ω(n)und ω(n)
Schranke n
10 100 1000 10000 100000
Ω(n) − ω(n)
0,4
0,7
0,751
0,7685
0,7722
1000000
0,7729
Man sieht hier, dass die Differenz zu konvergieren scheint, was unsere Vermutung der
identischen Steigung bestätigt. Tatsächlich ist der Grenzwert dieser Differenz die Differenz der beiden Konstanten C1 und C2 aus Abschnitt 4.2 für die C2 − C1 ≈ 0, 7731 gilt.
Als Nächstes versuchen wir mehr über die Funktionen herauszufinden. Da wir ein sehr
langsames Wachstum, z.B. ein logarithmisches, vermuten, benutzen wir eine logarithmische Skalierung und erhalten:
70
Offensichtlich reicht die logarithmische Skalierung nicht aus, denn der Graph ist immernoch sichtbar gekrümmt. Deswegen skalieren wir nochmals logarithmisch, um dann
folgenden Graph zu bekommen:
In dieser Skalierung können wir nun einen nahezu linearen Zusammenhang beobachten.
Also können wir nun für große n folgende approximierende Funktionen annehmen:
71
ω(n) ≈ log log(a1 n) + b1 ,
Ω(n) ≈ log log(a2 n) + b2 .
Hierbei sind a1 , a2 , b1 , b2 reelle Konstanten, welche es nun zu bestimmen gilt. Aufgrund
der Linearität bei einer doppelt logarithmischen Skalierung können wir a1 und a2 als
Steigungen der Geraden auffassen. Diese lassen sich mit mit Hilfe eines Steigungsdreiecks approximieren, eine den Schülern gut bekannte Methode. Wir erhalten dann für
hinreichend große Zahlen:
a1 =
ω(100000) − ω(50000)
2, 6640 − 2, 5991
=
≈ 1, 045 ≈ 1,
log log(100000) − log log(50000)
0, 0621
a2 =
Ω(100000) − Ω(50000)
3, 4362 − 3, 3706
=
≈ 1, 056 ≈ 1.
log log(100000) − log log(50000)
0, 0621
Somit bekommen wir relativ gute Abschätzungen für a1 und a2 , welche nah am realen Wert 1 liegen. Es bleibt nun noch übrig die Konstanten b1 und b2 zu bestimmen.
Dies bewerkstelligen wir mit einfachem Einsetzen einer möglichst großen Zahl in unsere
Funktion und Vergleichen mit dem berechneten Wert aus unserem Programm.
b1 = ω(100000) − log log(100000) ≈ 2, 6640 − 2, 4435 ≈ 0, 2205,
b2 = Ω(100000) − log log(100000) ≈ 3, 4362 − 2, 4435 ≈ 0, 9927.
Auch hier erhalten wir im Rahmen unserer Mittel gute Abschätzungen, denn die Fehler
|b1 − C1 | ≈ |0, 2205 − 0, 2615| = 0, 041 und |b2 − C2 | ≈ |0, 9927 − 1, 0347| = 0, 042 sind
klein und können je nach gewünschter Genauigkeit mit erhöhtem Rechenaufwand weiter
reduziert werden. D.h. wir konnten mit einfachen numerischen Methoden die in Kapitel 4
hergeleiteten Ausdrücke annähern, ohne Kenntnisse der höheren Mathematik vorauszusetzen. Dies ist gerade für Schüler interessant, die sich für alternative Problemlösungen
interessieren und eine gute Abwechslung zu den Methoden in 5.1 und 5.2.
72
Symbolverzeichnis
O(g) Landau-Symbol als Abschätzung für das Wachstumsverhalten . . . . . . . . . . . . . . 14.
µ(n)
Möbius-Funktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12.
Ω(n) Anzahl an Primfaktoren unter Berücksichtigung der Vielfachheiten . . . . . . . . . 12.
ω(n)
Anzahl verschiedener Primfaktoren in n . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12.
Φ(s)
Summe über
ϕ(n)
Eulersche ϕ-Funktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.
π(x)
Anzahl an Primzahlen bis zur Schranke x . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22.
ϑ(x)
Summe über log p bis zur Schranke x . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22.
ζ(s)
Riemannsche Zetafunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.
log p
ps
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22.
73
Literaturverzeichnis
[AIGNER] Aigner M. & Ziegler G. 2004, Das Buch der Beweise 2. Auflage, Springer Berlin
[BORWEIN] Borwein J. M., Bradley D. M. & Crandall R. E. 2000, Computational
Strategies for the Riemann Zeta Function, Journal of Computational and Applied
Mathematics Vol. 121 S. 247-296
[EDWARDS] Edwards H. M. 2001, Riemann’s Zeta Function, Dover Pubns - Dover
[FREITAG] Freitag E. & Busam Rolf 2006, Funktionentheorie 1, Springer - Berlin
[GEKELER] Unkorrigierte Vorlesungsmitschrift aus der Vorlesung Elementare
”
Zahlentheorie“aus dem Jahr 2003, gehalten von Prof. Dr. Ernst-Ulrich Gekeler an
der Universität des Saarlandes
[HARDY] Hardy G. H. & Wright E. M. 2008, An Introduction To The Theory Of
Numbers, Oxford University Press - Oxford
[HAVIL] Havil J. 2003, Gamma: Exploring Euler’s Constant, Princeton University
Press - Princeton
[HEUSER] Heuser Harro 2009, Lehrbuch der Analysis Teil 1, 17. Auflage,
Vieweg+Teubner - Wiesbaden
[JAENICH] Jänich, K. 2004, Funktionentheorie 6. Auflage, Springer - Berlin
[NEWMAN] Newman D. J. 1980, Simple Analytic Proof Of The Prime Number
Theorem, The American Mathematical Monthly Vol. 87 No. 7, Mathematical
Association of America - Washington DC
[SCHULZE-PILLOT] Schulze-Pillot R. 2007, Elementare Algebra und Zahlentheorie,
Springer - Berlin
[ZAGIER] Zagier D. 1997, Newman’s Short Proof Of The Prime Number Theorem,
The American Mathematical Monthly Vol. 104 No. 8, Mathematical Association of
America - Washington DC
74

Zugehörige Unterlagen

Analysis II für Studierende der Ingenieurwissenschaften

Experimente in der Zahlentheorie

Zugehörige Unterlagen

Dieses Dokument Sammlung (en)

Dieses Dokument gespeichert

Schlagen Sie uns vor, wie wir StudyLib verbessern können