Die Quadratur des Kreises - Humboldt

Werbung
Die Quadratur des Kreises
Teilnehmer:
Nils Bohlmann
Demna Grüning
Rainer Lang
Matthias Paulsen
Oliver Schaff
Karl Schrader
Vanessa Weigelt
Philip Wellnitz
Andreas-Oberschule, Berlin
Andreas-Oberschule, Berlin
Heinrich-Hertz-Oberschule, Berlin
Gymnasium Miesbach
Andreas-Oberschule, Berlin
Heinrich-Hertz-Oberschule, Berlin
Heinrich-Hertz-Oberschule, Berlin
Heinrich-Hertz-Oberschule, Berlin
Gruppenleiter:
Barbara Jung
Jürg Kramer
Humboldt-Universität zu Berlin
Humboldt-Universität zu Berlin
Mitglied im Forschungszentrum Matheon
Die Quadratur des Kreises ist ein klassisches Problem der Geometrie. Man versteht darunter die Aufgabe, allein mit Hilfe von Zirkel und Lineal aus einem
vorgegebenen Kreis ein Quadrat mit demselben Flächeninhalt zu konstruieren.
Wir haben im Zuge unserer Untersuchungen erkannt, dass die Konstruierbarkeit
(ebener) geometrischer Objekte mit Zirkel und Lineal mit feineren Eigenschaften
der reellen Zahlen zusammenhängt. Deshalb haben bei unserer Arbeit neben geometrischen Aspekten vor allem interessante algebraische bzw. zahlentheoretische
Fragestellungen eine prominente Rolle gespielt.
33
1
1.1
Mathematische Grundlagen
Beweis des Fundamentalsatzes der Algebra
Satz 1.1. Jedes Polynom der Form f (x) = an xn + an−1 xn−1 + ... + a1 x + a0 mit
n > 0, a0 , ..., an ∈ C; an , a0 6= 0 besitzt mindestens eine Nullstelle ζ in C.
Beweis. Es gilt, dass eine reelle, stetige Funktion einer oder mehrerer Variablen
auf einer abgeschlossenen, beschränkten Menge ein Minimum annimmt.
Abbildung 1: Die beiden Bereiche 1 und 2
Wir betrachten die Kreisscheibe, im Folgenden Bereich 2, mit einem Radius r :=
1 + |an−1 | + ... + |a1 | + |a0 | ∈ R um den Koordinatenursprung. Der Rest der
Zahlenebene sei mit Bereich 1 bezeichnet.
Da Bereich 2 abgeschlossen ist und die Funktion |f | dort stetig ist, besitzt |f | auf
Bereich 2 ein Minimum ζ0 .
Abschätzungen liefern im Bereich 1 die Ungleichungen |f (ζ)| > r ≥ |f (ζ0 )|.
Daraus folgt: |f (ζ0 )| ≤ |f (ζ)| für alle ζ ∈ C.
Angenommen, f (ζ0 ) 6= 0. Über Abschätzungen und Umformungen kann nun eine
Zahl α konstruiert werden, bei der |f (ζ0 )| > |f (α)| gilt. Das ist offensichtlich ein
Widerspruch, somit muss eine Nullstelle bei ζ0 sein.
1.2
Existenz transzendenter Zahlen
Definition 1.2. Eine komplexe Zahl γ heißt algebraisch von Grad n, genau dann,
wenn sie Nullstelle eines Polynoms f (x) = an xn + an−1 xn−1 + ... + a1 x + a0 mit
ganzzahligen Koeffizienten a0 , ..., an , an 6= 0, n > 0, ist.
34
Wir schreiben im Folgenden für die Menge aller algebraischen Zahlen Q.
Definition 1.3. Eine komplexe Zahl γ heißt transzendent, genau dann, wenn
sie nicht algebraisch ist.
Wir schreiben im Folgenden für die Menge aller transzendenten Zahlen T = C\Q.
Definition 1.4. Eine Menge M ist abzählbar, genau dann, wenn es eine surjektive Abbildung N≥ 1 → M gibt.
Surjektiv heißt, dass jedes Element in M getroffen wird.
Definition 1.5. Eine Menge M ist überabzählbar, genau dann, wenn sie nicht
abzählbar ist.
Die Existenz transzendenter Zahlen und somit die Sinnhaftigkeit der Definition
1.3 wird nun über die Mächtigkeiten der Mengen Q und C gezeigt. Speziell wird
gezeigt, dass Q abzählbar unendlich viele Elemente, C jedoch überabzählbar unendlich viele Elemente enthält, somit also auch T überabzählbar unendlich viele
Elemente enthält.
Satz 1.6. Die Menge Q ist abzählbar.
Beweis. Um Q als abzählbar nachzuweisen, genügt es die Menge MP der Polynome mit ganzzahligen Koeffizienten als abzählbar zu erweisen. Wir betrachten
also ein Polynom der Form f (x) = an xn + an−1 xn−1 + ... + a1 x + a0 . Das Polynom
ist durch folgende Eigenschaften eindeutig bestimmt:
1. Den Grad n ∈ N des Polynoms und
2. die ganzzahligen Koeffizienten a0 , ..., an ∈ Z, an 6= 0.
Für jedes n ∈ N ist N × Zn abzählbar, somit ist auch
[
MP ⊂
(N × Zn )
n∈N
abzählbar.
Satz 1.7. Die Menge C ist überabzählbar.
Beweis. Angenommen, es existiert eine Nummerierung (zn ) aller reellen Zahlen
im Intervall (0, 1).
Wir betrachten die Dezimaldarstellung der zn :
z1
z2
z3
z4
= 0, a11 a12 a13 ...
= 0, a21 a22 a23 ...
= 0, a31 a32 a33 ...
= ...
35
Aus den hervorgehobenen diagonalen Ziffern konstruieren wir eine neue Zahl
x = 0, x1 x2 x3 ... mit
4, falls aii = 5
xi =
.
5, falls aii 6= 5
Da sich diese Zahl offenbar von jedem Folgenglied zi an der i-ten Nachkommastelle
unterscheidet, ist sie offenbar keines der zi , was einen Widerspruch darstellt.
Da das betrachtete Intervall (0, 1) eine Teilmenge der Menge R aller reellen Zahlen
ist, ist R erst recht überabzählbar. Daraus folgt, dass C ebenfalls überabzählbar
ist.
1.3
Erzeugung von Zahlen mittels Konstruktion
Wir stellen uns die Frage, welche Zahlen sich mit Zirkel und Lineal konstruieren
lassen. Dazu schauen wir uns zuerst an, welche Rechenoperationen sich ausführen
lassen, wenn wir die Strecken a und b bereits aus der gegebenen Einheitsstrecke
konstruiert haben.
Addition und Subtraktion: Auf einer Gerade
werden Kreise abgetragen und so die Längen a+b
und a − b konstruiert.
Multiplikation: a,b und das Einheitsmaß werden eingezeichnet und so die Länge x = a · b
konstruiert.
Division: a,b und das Einheitsmaß werden eingezeichnet und so die Länge x = ab konstruiert.
36
Wurzelziehen: a und das Einheitsmaß werden
eingezeichnet, ein Halbkreis
gezogen und ein Lot
√
gefällt. Dann gilt x = a.
Korollar 1.8. In einem x, y-Koordinatensystem mit Einheitsstrecke können nach
Vorhergehendem alle Punkte mit rationalen Koordinaten konstruiert werden.
√
Korollar 1.9. Dies bedeutet nun, dass die Zahl π genau dann konstruierbar
ist, wenn π konstruierbar ist.
1.3.1
Schnittpunkte von Geraden oder Kreisen
Durch das Gleichsetzen der Gleichungen für Geraden und Kreise lassen sich die
Koordinaten der Schnittpunkte bestimmen. Es stellt sich heraus, dass deren Koordinaten nur durch die Grundrechenarten und Wurzelziehen aus bereits konstruierten Zahlen hervorgehen. Somit handelt es sich bei den Zahlen, die durch
Kombination der vorherigen Verfahren konstruiert werden können, um alle mit
Zirkel und Lineal konstruierbaren Zahlen.
2
2.1
Beweis der Algebraizität konstruierbarer Zahlen
Definition konstruierbarer Zahlen
√
Wir definieren den Körper K1,k := {a + b k|a, b ∈ Q} für ein festes k ∈ Q.
Die Koordinaten unserer bisher konstruierbaren Zahlen lassen sich in einen solchen Körper einordnen. Wir können nun mehr als nur Zahlen aus K1,k konstruieren. Mithilfe dieser Zahlen können wir neue Geraden- und Kreisgleichungen
erschaffen und anschließend wieder neue Koordinaten.
p
Wir erzeugen so neue Körper Kn,kn = {an−1 + bn−1 kn−1 |an−1 , bn−1 ∈ Kn−1,kn−1 }
Da durch das erneute Wurzelziehen nach jedem neuen Körper neue irrationale
Zahlen hinzukommen, ergibt sich die Beziehung:
Q = K0,k0 ⊂ K1,k1 ⊂ K2,k2 ⊂ . . . ⊂ Kn,kn ⊂ . . . .
Intuitiv lassen sich nun die konstruierbaren Zahlen definieren:
Definition 2.1. Eine Zahl α heißt konstruierbar genau dann, wenn gilt:
∃n ∈ N, ∃q ∈ Q : α ∈ Kn,q .
37
2.1.1
Algebraizität konstruierbarer Zahlen
Zunächst beweisen wir folgenden Hilfssatz:
Lemma 2.2. Sei xk ∈ Kk eine konstruierbare Zahl. Dann genügt xk einer Gleichung vom Grad 2l mit Koeffizienten aus Kk−l , wobei 0 < l ≤ k ist.
Beweis. Mithilfe vollständiger Induktion über l ∈ N.
√
Induktionsanfang (l = 1): Sei xk = ak−1 +bk−1 mk−1 ∈ Kk mit ak−1 , bk−1 , mk−1 ∈
Kk−1 gegeben. Wegen
√
xk = ak−1 + bk−1 mk−1 ⇔ (xk − ak−1 )2 = b2k−1 mk−1
ist ersichtlich, dass xk Nullstelle eines Polynoms 21 -ten Grades ist mit Koeffizienten aus Kk−1
Induktionsschritt:
xk sei Nullstelle des Polynoms f (x) = aL xL + aL−1 xL−1 + ... + a1 x + a0 vom Grad
L := 2l mit aj ∈ Kk−l für alle j = 0, 1, ..., L.
Wir schreiben für ein festes w ∈ Kk−l−1 :
√
aj := bj + cj w mit bj , cj ∈ Kk−l−1
So gilt:
√
f (x) = (bL xL + bL−1 xL−1 + ... + b1 x + b0 ) + w · (cL xL + cL−1 xL−1 + ... + c1 x + c0 )
Wenn wir xk einsetzen (f (xk ) = 0) und die entstehende Gleichung quadrieren,
erhalten wir:
(bL xLk + bL−1 xL−1
+ ... + b1 x1k + b0 )2 = w · (cL xLk + cL−1 xL−1
+ ... + c1 x1k + c0 )2
k
k
Wie schon im Induktionsanfang ist hier ersichtlich, dass xk Nullstelle eines Polynoms vom Grad 2 · L = 2l+1 mit Koeffizienten aus Kk−l−1 = Kk−(l+1) . Damit ist
der Induktionsschritt bewiesen.
Da der Hilfssatz nun für alle l, 0 < l ≤ k, und somit auch für l = k gilt, genügt
jede konstruierbare Zahl xk einem Polynom mit rationalen Koeffizienten, wodurch
folgende Schlussfolgerung gilt:
Korollar 2.3. Jede konstruierbare Zahl ist algebraisch.
Weiterhin gilt nun auch:
Korollar 2.4. Dies bedeutet nun, dass die Zahl π höchstens dann konstruierbar
ist, wenn sie algebraisch ist.
38
Beweis der Transzendenz von e
3
Satz 3.1. Die Zahl e ist transzendent.
3.1
Beweisstrategie
Wir treffen die indirekte Annahme, dass e algebraisch vom Grad m ist.
Somit gilt:
∃a0 , ..., am ∈ Z, a0 6= 0, am 6= 0 : am em + am−1 em−1 + ... + a1 e + a0 = 0.
Um dies zu einem Widerspruch zu führen, konstruieren wir ein Hilfspolynom
H ∈ Q[x] mit folgenden Eigenschaften:
(i) H(0) 6= 0,
(ii) H(j) ∈ Z (j = 0, ..., m),
(iii)
m
P
aj H(j) 6= 0,
j=0
P
m
(iv) aj (H(0)ej − H(j)) < 1.
j=1
Zur Konstruktion des Widerspruches definieren wir nun folgende Größen:
c :=
m
X
aj H(j) ∈ Z \ {0} ⇒ |c| ≥ 1,
(1)
j=0
εj := H(0)ej − H(j) (j = 0, ..., m),
m
X
σ :=
aj ε j .
(2)
(3)
j=1
Aus Eigenschaft (ii) folgern wir, dass c ∈ Z und aus (iii), dass c 6= 0 gilt.
Mit (i) lässt sich (2) nach ej umstellen, sodass gilt:
ej =
H(j)
εj
+
.
H(0) H(0)
Dies lässt sich als Approximation von ej (j = 0, ..., m) durch die Werte des
εj
H(j)
Polynoms H(0)
interpretieren, da wir zeigen werden, dass H(0)
sehr klein wird.
Außerdem bemerken wir, dass nach Eigenschaft (iv) die Ungleichung |σ| < 1
besteht.
39
Mit e als Nullstelle des Polynoms muss gelten:
0=
m
X
aj e j
j=0
=
m
X
j=0
aj
H(j)
εj
+
H(0) H(0)
m
m
=
1 X
1 X
aj H(j) +
aj ε j
H(0) j=0
H(0) j=0
=
σ
c
+
.
H(0) H(0)
Mit H(0) 6= 0 erhält man:
|c| = |σ|.
Da |c| > 1 und |σ| < 1, kann diese Gleichung nicht gelten. Somit wird der
Annahme der Algebraizität von e widersprochen, weshalb e transzendent ist.
3.2
Definition des Hilfspolynoms H
Wir wählen eine Primzahl p ∈ P beliebig. Nun definieren wir einige Hilfspolynome:
f (x) := xp−1 (x − 1)p (x − 2)p · ... · (x − m)p
mit Grad N = p − 1 + m · p. Basierend darauf definieren wir
F (x) := f (x) + f 0 (x) + ... + f (N ) (x).
Betrachten wir die Ableitung
F 0 (x) := f 0 (x) + f 000 (x) + ... + f (N ) (x) = F (x) − f (x),
so erkennen wir, dass das Polynom mit seiner Ableitung auf [0, m] fast übereinstimmen würde, falls f ausreichend klein wäre.
Dies wollen wir nun durch eine Abschätzung überprüfen. Dazu stellen wir fest:
x ∈ [0, m] =⇒ |x(x − 1) · ... · (x − m)| ≤ mm+1 .
Mit M := mm+1 ergibt sich:
max |f (x)| ≤ M p .
0≤x≤m
40
Man erkennt, dass f auf [0, m] nicht klein ist. Somit müssen wir ein neues Polynom
definieren:
F (x)
H(x) :=
.
(p − 1)!
Aus den für F nachgewiesenen Eigenschaften können wir für H ableiten:
H 0 (x) = H(x) −
und auch
p
f (x) ≤ M .
max 0≤x≤m (p − 1)! (p − 1)!
Wählen wir p hinreichend groß, wird
H(x)
H(0)
f (x)
,
(p − 1)!
f (x)
(p−1)!
beliebig klein. Somit approximiert
nach Gleichung (2) die Exponentialfunktion für große p gut.
Es kann weiterhin einfach gezeigt werden, dass H die geforderten Eigenschaften
(i)–(iv) erfüllt.
Beispiel 3.2. Mit
Man erhält:
H(x)
H(0)
als Approximation erhalten wir e, wenn wir x := 1 setzen.
H(1)
F (1)
(p − 1)!
F (1)
=
·
=
.
H(0)
(p − 1)!
F (0)
F (0)
Für das Beispiel wählen wir nun m = 2 und p = 5.
f (x) = x4 (x − 1)5 (x − 2)5 ,
F (x) = x14 − x13 + 84x12 + 654x11 + ... + 29 141 344 128,
F (0) = 29 141 344 128, F (1) = 79 214 386 200,
F (1)
= 2, 718281828458561...
F (0)
Diese Näherung ist bereits auf zehn Nachkommastellen korrekt. Es zeigt sich, dass
das beschriebene Verfahren sinnvoll ist, um eine Näherung für e zu erhalten.
4
Beweis der Transzendenz von π
Satz 4.1. Die Zahl π ist transzendent.
Beweis. Sei N die Menge der positiven ganzen Zahlen.
Angenommen, π wäre algebraisch. Dann wäre auch iπ algebraisch, d. h. es gibt
ein Polynom Q mit ganzzahligen Koeffizienten und einer Nullstelle bei iπ. Seien
41
α1 , . . . , αn ∈ C alle Nullstellen dieses Polynoms. Bekanntlich gilt 1 + eiπ = 0 und
somit
1 + e α1
⇐⇒
(1 + eα1 ) (1 + eα2 ) · · · (1 + eαn ) = 0
+ · · · + eαn + eα1 +α2 + · · · + eα1 +···+αn = 0 .
Die in den Exponenten auftretenden Summen, die nicht 0 sind, werden mit
β1 , . . . , βN bezeichnet. Damit ist
a0 + eβ1 + · · · + eβN = 0 mit a0 ∈ N, βk ∈ C \ {0} für 1 ≤ k ≤ N .
(4)
Man kann zeigen, dass β1 , . . . , βN die Nullstellen eines Polynoms
P (z) = b0 + b1 z + · · · + bN z N = 0 mit b0 , bN 6= 0, bk ∈ Z für 1 ≤ k ≤ N
sind, weil selbiges mit dem Polynom Q für α1 , . . . , αn gilt.
Wir wollen nun eβ1 , . . . , eβN approximieren durch
eβk =
Mk + εk
M
mit M ∈ Z, Mk , εk ∈ C für 1 ≤ k ≤ N .
(5)
Dann ist nach (4)
(a0 M + M1 + · · · + MN ) + (ε1 + · · · + εN ) = 0 .
(6)
Gelingt es, M sowie die Mk und εk derart zu wählen, dass der linke Summand
von (6) eine ganze Zahl 6= 0 ist und der Betrag des rechten Summanden < 1 ist,
erhalten wir offenbar den erwünschten Widerspruch.
Wir setzen nun für eine Primzahl p
Z∞
M :=
e−z z p−1
(N −1)p−1
· P (z)p · bN
dz .
(p − 1)!
0
Schreibt man den Integranden als
e−z z p−1
· (c0 + c1 z + · · · + cm z m )
(p − 1)!
mit ck ∈ Z, m ∈ N ,
so erhalten wir gemäß der Γ-Funktion
M = c0 + c1 p + · · · + cm
(N −1)p−1
(p − 1 + m)!
∈Z.
(p − 1)!
(7)
Es ist c0 = bp0 bN
. Wählen wir also p > |b0 | und p > |bN |, ist c0 nicht durch p
teilbar. Deshalb ist nach (7) insgesamt M nicht durch p teilbar. Zusätzlich können
wir p > |a0 | einrichten, damit p auch a0 M nicht teilt.
42
Wir setzen ferner für 1 ≤ k ≤ N
εk := eβk
Zβk
e−z z p−1
(N −1)p−1
· P (z)p · bN
dz
(p − 1)!
0
und Mk := eβk
Z∞
e−z z p−1
(N −1)p−1
· P (z)p · bN
dz ,
(p − 1)!
βk
wodurch (5) erfüllt ist.
Bezeichnet G das Maximum des Ausdrucks
zP (z)bN −1 ,
N
wobei z auf der Strecke zwischen 0 und einem beliebigen βk liegt, dann gilt
|εk | ≤ C ·
Gp−1
(p − 1)!
mit einer von p unabhängigen Konstanten C. Folglich ist
lim |εk | = 0 .
p→∞
Insbesondere kann p so groß gewählt werden, dass |ε1 + · · · + εN | < 1 erfüllt ist.
Schließlich betrachten wir die Summe der Mk , von der wir zeigen wollen, dass sie
eine durch p teilbare ganze Zahl ist:


Z∞ −z p−1
N
N
X
X
e z
(N −1)p−1
eβk
Mk =
· P (z)p · bN
dz  .
(p
−
1)!
k=1
k=1
βk
Wir substituieren z − βk durch ζ:
=
N
X

Z∞

k=1
Z∞
=
0
−ζ

p−1
e (ζ + βk )
(p − 1)!
(N −1)p−1
· P (ζ + βk )p · bN
dζ 
0
N
e−ζ X (N −1)p−1
(ζ + βk )p−1 · P (ζ + βk )p · bN
dζ.
(p − 1)! k=1
43
Mit P (z) = bN (z − β1 ) · · · (z − βN ) ergibt sich weiter
Z∞
=
0
Z∞
=
0
N
e−ζ X p−1
dζ
(ζ + βk )p−1 (ζ + βk − β1 )p · · · ζ p · · · (ζ + βk − βN )bN
N
(p − 1)! k=1
N
e−ζ ζ p X (bN ζ + bN βk )p−1 (bN ζ + bN βk − bN β1 )p · . . .
(p − 1)! k=1
. . . · (bN ζ + bN βk − bN βk−1 )p (bN ζ + bN βk − bN βk+1 )p · . . .
. . . · (bN ζ + bN βk − bN βN )p dζ
Z∞
=
e−ζ ζ p
t0 + t1 ζ + · · · + tN p−1 ζ N p−1 dζ.
(p − 1)!
0
Dabei sind die Koeffizienten tk symmetrische Polynome in bN β1 bis bN βN . Weil
diese die Lösungen der Gleichung
z
+ · · · + bN
b0 + b1
bN
z
bN
N
−1
= 0 ⇐⇒ b0 bN
+ · · · + zN = 0
N
sind, d. h. die Nullstellen eines normierten Polynoms mit ganzen Koeffizienten
sind, handelt es sich bei den elementarsymmetrischen Polynomen in bN β1 bis
bN βN und somit auch bei den tk um ganze Zahlen. Folglich ist
N
X
Mk = t0 p + t1 p(p + 1) + · · · + tN p−1
k=1
(N p − 1)!
(p − 1)!
eine durch p teilbare ganze Zahl. Deshalb ist a0 M + M1 + · · · + MN nicht durch
p teilbar und daher betragsmäßig mindestens 1, was im Widerspruch zur Gleichung (6) steht. Die Annahme, π wäre algebraisch, ist deswegen falsch.
Korollar 4.2. Die Quadratur des Kreises allein mit Zirkel und Lineal ist unmöglich.
44
Herunterladen