Die Transzendenz von π

Werbung
Die Transzendenz von π
Norbert Engbers
22.08.2004
Einleitung
Als Ferdinand Lindemann 1882 die Transzendenz von π bewies, hatte er ein
zwei Jahrtausende altes Problem erledigt: Die Quadratur des Kreises, oder in
heutiger Sprache die Konstruktion zweier Strecken mit dem Längenverhältnis π
nur mit Zirkel und Lineal.
Man kann nämlich Strecken mit Längenverhältnis z nur konstruieren, wenn z
Element eines algebraischen Zahlkörpers K ist, der über eine Kette
K = K1 ⊃ K2 ⊃ . . . ⊃ K n = Q
quadratischer Körpererweiterungen, also so, dass
∀i [Ki : Ki+1 ] = 2,
zu Q absteigt. Insbesondere muss z dafür Nullstelle eines Polynoms
2., 4., 8., . . . , 2n−1 . Grades aus Z[X] sein.
Obgleich also seit 120 Jahren feststeht, dass π dieses Kriterium nicht erfüllt,
beschäftigen sich nach wie vor viele Hobbymathematiker mit der Aufgabe, mit
den genannten Hilfsmitteln einen Kreis in ein flächengleiches Quadrat zu überführen.
Vielleicht hilft dieser Artikel ja dagegen.
1
Zentrales Ergebnis
Satz 1: π ist transzendent.
Ich erwähne zunächst einen Satz, aus dem die Transzendenz von e und π quasi
sofort folgt:
Beweisidee 1: Satz von LINDEMANN-WEIERSTRASS:
Für alle paarweise verschiedenen α1 , . . . , αn ∈ Q̄
und für alle β1 , . . . , βn ∈ Q̄ gilt:
n
X
βi · eαi 6= 0,
i=0
oder kurz gefasst: Alle eαi mit paarweise verschiedenen algebraischen Exponenten sind linear unabhängig über dem Körper der algebraischen Zahlen.
Sehr leicht kann man nun die Transzendenz von e und π zeigen:
Korollar 1: e ist transzendent.
Beweis: Annahme: e ∈ Q̄.
Setze α1 = 0, α2 = 1, β1 = e, β2 = −1,
βi = 0 für alle anderen i.
Dann ist e ·e0 − 1 · e1 = e − e = 0,
im Widerspruch zum Satz von Lindemann-Weierstraß.
Korollar 2: π ist transzendent.
Beweis: Annahme: π ∈ Q̄.
Wegen i2 = −1 und der Tatsache, dass die algebraischen
Zahlen einen Körper bilden, sind auch i · π und 2 · i · π aus Q̄.
Setze dann α1 = 1, α2 = 1, β1 = i · π, β2 = 2 · i · π, βi = 0 für alle anderen i.
Dann ist 1 · ei·π + 1 · e2·i·π = −1 + 1 = 0,
im Widerspruch zum Satz von Lindemann-Weierstraß.
2
Doch statt den Satz von Lindemann-Weierstraß zu beweisen, werden
wir in etwa wieder so vorgehen wie im Transzendenzbeweis für die
Zahl e.
Als wichtige Voraussetzungen brauchen wir eine Aussage über
ganz-algebraische Zahlen sowie den Hauptsatz über
elementarsymmetrische Funktionen.
Lemma 1:
Sei ξ eine algebraische Zahl über Q mit dem Minimalpolynom
f ∈ Z[X],
f=
r
X
ak · X k .
k=0
Dann ist ar · ξ eine ganz-algebraische Zahl, also Nullstelle eines normierten Polynoms mit ganzzahligen Koeffizienten (was beileibe keine Selbstverständlichkeit
ist).
Beweis von Lemma 1:
Es ist
r
X
0=
aj · ξ j .
j=0
:
Wir multiplizieren die Gleichung mit ar−1
r
0
=
ar−1
r
·
r
X
aj · ξ j
j=0
=
arr
r
·ξ +
r−1
X
ar−1
· aj · ξ j
r
j=0
=
2
r
(ar · ξ) +
r−1
X
j=0
3
arr−1−j · aj · (ar · ξ)j .
Den elementarsymmetrischen Funktionen begegnet man, wenn man Produkte
von Linearfaktoren ausmultipliziert und mit Polynomen vergleicht.
Permutationen der Nullstellen ui haben selbstverständlich keinen Einfluss auf
das Ergebnis, wenn man die Koeffizienten als Polynome in den Nullstellen auffasst:
(x − u1 ) · (x − u2 ) · . . . · (x − un )
= xn − s1 · xn−1 + s2 · xn−2 − + . . . + (−1)n · sn ,
wobei die sn die folgenden Ausdrücke in den ui sind:
s1
=
n
X
ui ,
i=1
s2
=
X
ui · uj ,
1≤i,j≤n
s3
=
ui · uj · uk ,
1≤i,j,k≤n
...
sn
X
=
n
Y
ui .
i=1
Lemma 2: Hauptsatz über elementarsymmetrische Funktionen
Jedes in den Ausdrücken u1 , . . . , un symmetrische, also unter Permutationen
der Indices 1, . . . , n unveränderliche Polynom
f (u1 , . . . , un ) ∈ Z[u1 , . . . , un ]
ist als Polynom p(s1 , . . . , sn ) mit ganzzahligen Koeffizienten in den elementarsymmetrischen Funktionen
s1 (ξ1 , . . . , ξr ),
s2 (ξ1 , . . . , ξr ),
...,
sr (ξ1 , . . . , ξr )
eindeutig darstellbar.
4
Beweis von Lemma 2:
Wenn man die Monome eines symmetrischen Polynoms nach dem Totalgrad
ordnet, erhält man eine Summe homogener Polynome. Permutationen der Variablen u1 , . . . , un ändern den Totalgrad nicht, also reicht es, den Satz für homogene symmetrische Polynome k. Grades zu zeigen.
Diese bleiben homogen und symmetrisch, wenn man sie untereinander addiert,
subtrahiert oder mit ganzen Zahlen multipliziert. Es existiert mit dem Nullpolynom 0, dem der Grad k zugewiesen wird, ein neutrales Element und zu jedem
Element ein Inverses, nämlich das mit anderen Vorzeichen vor den Koeffizienten.
Daher sagt man, die symmetrischen homogenen Polynome k-ten Grades bilden
mit der 0 einen Modul M über Z.
Wir überlegen nun, welchen Rang dieser Modul über Z hat, d.h. wieviele Elemente man mindestens braucht, um den ganzen Modul durch Addieren und
Multiplizieren dieser Elemente, Erzeuger genannt, mit ganzen Zahlen zu erhalten.
Sei w ein Erzeuger von M. Wegen der Symmetrie ist mit dem Monom
ut11 · . . . · utnn
auch der ganze Orbit
1
n
{utσ(1)
· . . . · utσ(n)
|σ ∈ Sn }
elementweise als Summanden in w.
M hat also den Rang m über Z, wobei m die Anzahl der verschiedenen Orbits
von Monomen
ut11 · . . . · utnn
unter Sn ist, für die t1 + . . . + tn = k gilt.
Also wählt man für jeden Orbit das Monom als Repräsentanten, in dem ti ≤ ti+1
für alle 1 ≤ i < n gilt.
5
Solch einem Monom kann folgendes Diagramm mit k Punkten eindeutig zugeordnet werden:
u1
u2
u3
u
u
u
u
u
u
u
e
u
e
u4
un−2
un−1
u
u
e
u
e
un
e
Abb.1:Zum Beweis des Hauptsatzes über elementarsymmetrische Funktionen
Das Diagramm ist durch die Randpunkte (offen) eindeutig bestimmt. Das Setzen von bν Randpunkten bei uν zwingt uns, links davon alles aufzufüllen, also
ν · bν Punkte zu setzen. Die Anzahl der Möglichkeiten, k Punkte in so einem
Diagramm anzubringen, ist also gleich der Anzahl der Möglichkeiten, die Zahl
k als Summe
b1 + 2 · b 2 + 3 · b 3 + . . . + n · b n = k
mit natürlichen Zahlen b1 , . . . , bn darzustellen, wobei hier auch 0 erlaubt ist
(falls bei uν kein Randpunkt eingetragen ist).
Die Monome sb11 · . . . · sbnn von gleichem Totalgrad k = b1 + 2 · b2 + . . . + n · bn
in den elementarsymmetrischen Funktionen erzeugen den Untermodul S ⊆ M;
dessen Rang ist also gleichfalls die Anzahl der Möglichkeiten,
b1 + 2 · b2 + . . . + n · bn = k
mit natürlichen bν zu erreichen.
Wegen
S ⊆ M und rang S = rang M
sind die Moduln identisch. Daraus folgt auch sofort: Die Darstellung in s1 , . . . , sn
ist eindeutig.
2
6
Nun widmen wir uns gewappnet der Hauptaufgabe dieses Artikels, dem
Beweis von Satz 1:
Angenommen, π sei algebraisch über Q. Weil auch i algebraisch über Q ist und
die Menge der algebraischen Zahlen über Q, Q̄ ⊂ C, einen Körper bildet
(siehe den Artikel ”Das Minimalpolynom algebraischer Zahlen”),
ist auch i · π algebraisch mit dem Minimalpolynom
g ∈ Z[X], g(x) =
r
X
bk · xk .
k=0
Der Leitkoeffizient von g ist br . Nach Lemma 1 ist damit br · i · π eine ganzalgebraische Zahl. Nach dem Fundamentalsatz der Algebra zerfällt g über Q̄ in
r verschiedene Linearfaktoren:
g(z) = br · (z − ξ1 ) · (z − ξ2 ) · . . . · (z − ξr ).
Dabei sind ξ1 , . . . , ξr die Konjugierten von i · π, also alle Nullstellen des Minimalpolynoms von (i) · π. Genau wie br · i · π sind alle br · ξj ganz-algebraisch,
also Nullstellen eines normierten Polynoms aus Z[X].
Wir bilden nun den Ausdruck
(1 + eξ1 ) · (1 + eξ2 ) · . . . · (1 + eξr ).
Da i · π unter den Konjugierten ist und ei·π = −1, ist dieses Produkt gleich Null.
Wir multiplizieren das Produkt aus und erhalten:
1+
r
X
j=1
eξj +
X
eξj +ξk + . . . + eξ1 +...+ξr .
1<=j<k<=r
Sei εk = (ε1k , . . . , εrk ) ∈ {0, 1}r , k ein Index, der die 2r Elemente von {0, 1}r
durchläuft, dann ist das Produkt
(1 + eξ1 ) · (1 + eξ2 ) · . . . · (1 + eξr )
r
X
=
eε1k ·ξ1 +...+εrk ·ξr
k=1
eine Summe aus 2r Exponentialtermen, in deren Exponenten alle Summen aus
den ξj stehen, die möglich sind, wenn jedes ξj entweder hineingenommen werden
kann oder nicht.
7
Diese 2r Summen werden zur Vereinfachung nun φk geschrieben:
φk =
r
X
1 ≤ k ≤ 2r .
εjk · ξj ,
j=1
Wichtige Konsequenz: Permutiert man die Indices der ξj irgendwie, so steht das
Ergebnis dieser Operation wieder unter den Summanden. Zu jedem
φk = ε1k · ξ1 + . . . + εrk · ξr
ist also auch der ganze Orbit bzgl. der symmetrischen Gruppe Sn unter den 2r
Faktoren, also existiert zu jedem σ ∈ Sn ein l ∈ 1, . . . , 2r mit
φl = ε1k · ξσ(1) + . . . + εrk · ξσ(r) .
Mindestens eine von diesen Summen ist Null. Sei q die Anzahl derer, die Null
ergeben; diese tragen zum Produkt
(1 + eξ1 ) · (1 + eξ2 ) · . . . · (1 + eξn )
jeweils 1 bei. Dieses Produkt kann dann als Summe folgendermaßen geschrieben
werden:
q+
n
X
eφk mit n = 2r − q.
k=1
Ein entscheidender Trick bei der algebraischen Abschätzung wird sein, die Summe über 1, . . . , n mit −q identifizieren zu können, um daraus eine Teilbarkeitsaussage zu gewinnen.
Wir wählen eine Primzahl p, groß genug, denn über deren Größe wird später
der Widerspruch geführt, und definieren das Polynom f vom Grad n · p + p − 1,
p−1
f (x) = bn·p
·
r ·x
n
Y
(x − φk )p .
k=1
Das Polynom f ist in den Ausdrücken φk symmetrisch, d.h. gegenüber jeder
Permutation der k invariant. Der Hauptsatz über elementarsymmetrische
Funktionen garantiert nun, dass das ausmultiplizierte Polynom eine polynomiale Darstellung in
s1 (ξ1 , . . . , ξr ),
s2 (ξ1 , . . . , ξr ),
...,
sr (ξ1 , . . . , ξr )
besitzt, die wieder ganzzahlige Koeffizienten hat. Außerdem gilt, dass die beiden
Produkte
r
2
Y
(x − φk ) = x2
r
k=1
−n
·
n
Y
k=1
8
(x − φk )
in den Konjugierten ξ1 , . . . , ξr von i · π wieder symmetrisch sind. Letzteres ist
darin begründet, dass zu jedem σ ∈ Sr ein l ∈ {1, . . . , 2r } existiert mit
φl = ε1k · ξσ(1) + . . . + εrk · ξσ(r) ,
also die Produkte auch dessen Linearfaktor enthalten.
Also läßt sich - wiederum nach dem Satz über elementarsymmetrische Funktionen - dieses Produkt als Polynom mit ganzzahligen Koeffizienten in den elementarsymmetrischen Funktionen
s1 (ξ1 , . . . , ξr ),
s2 (ξ1 , . . . , ξr ),
...,
sr (ξ1 , . . . , ξr )
schreiben. Die elementarsymmetrischen Funktionen in ξ1 , . . . , ξr sind aber gerade die rationalen Koeffizienten
b0
br−1
, ...,
br
br
des normierten Minimalpolynoms! Das ergibt sich aus der Identität
1,
r
X
bk
k=0
br
· xk = (x − ξ1 ) · (x − ξ2 ) · . . . · (x − ξr )
nach Ausmultiplizieren der rechten Seite.
Es gibt also ein Polynom F ∈ Z [X, Xr−1 , . . . , X0 ], so dass
2r −q
x
·
n
Y
(x − φk ) = F
k=1
br−1
b0
x,
,...,
br
br
.
Q2r −q
Die Koeffizienten von k=1 (x − φk ) sind also rationale Zahlen. Der Vorfaktor
br steht in f (x) n · p-mal vor der p-ten Potenz dieses Produkts und macht also
die Koeffizienten von f alle zu ganzen Zahlen.
Zwei konträre Abschätzungen
Nun bedienen wir uns wieder des bereits aus ”Selbstverständliches über e und
Pi, Teil 1” bekannten Funktionals
Z t
If (t) =
et−u · f (u)du ,
0
das wegen der Holomorphie des Integranden für alle komplexen t eindeutig bestimmt ist. Also gilt die Standardabschätzung für Integrale, ”Betrag eines Integrals ist kleiner oder gleich der Länge des Integrationsweges mal Maximum
des
9
Betrages auf diesem Weg”, insbesondere mit dem kürzestmöglichen Weg in C,
¯
dem geradlinigen 0t.
Algebraische Abschätzung eines Funktionals
Von If leiten wir
Jf = If (φ1 ) + . . . + If (φn )
ab, das - wie im Beweis der Transzendenz von e - mittels partieller Integration
ausgewertet wird zu
Jf =
∞
X
eφk ·
j=0
=
r
2X
−q
φk
e
·
∞
X
f (j) (0) −
j=0
n·p+p−1
X
f
f (j) (φk )
k=1 j=0
(j)
(0) −
j=0
k=1
n X
∞
X
n n·p+p−1
X
X
k=1
f (j) (φk ).
j=0
Höhere als n · p + p − 1-te Ableitungen sind allesamt 0, können also ignoriert
werden. Wir setzen
m = n · p + p − 1.
Damit ist
Jf =
r
2X
−q
φk
e
m
X
·
Wegen q +
k=0
(0) −
m
n X
X
f (j) (φk ).
k=0 j=0
j=0
k=0
P2r −q
f
(j)
eφk = 0 ist die erste Summe −q:
Jf = −q ·
j=0
X
f (j) (0) −
m
m X
n
X
f (j) (φk ).
j=0 k=1
Aufgrund der ganzzahligen Koeffizienten von f (und der seiner ersten
n · p + p − 1 Ableitungen!) und dem hohen Exponenten für br ergibt sich, dass
die Summen
n
X
f (j) (φk )
k=1
symmetrische Polynome in den n ganz-algebraischen Zahlen br ·φ1 , . . . , br ·φn mit
ganzzahligen Koeffizienten sind und also auch Jf ein symmetrisches Polynom
ist mit ganzzahligen Koeffizienten in den 2r Ausdrücken
br ·
j=1
X
εjk · ξj .
r
10
Also lässt sich Jf als ganzzahliges Polynom in den elementarsymmetrischen
Funktionen
s1 (ξ1 , . . . , ξr ),
s2 (ξ1 , . . . , ξr ),
...,
sr (ξ1 , . . . , ξr )
schreiben. Diese sind gleich den Koeffizienten im Minimalpolynom g von i · π,
also ganzzahlig, so dass wir folgern können:
Jf ist eine ganze Zahl.
Ist der Ableitungsgrad j echt kleiner als p, so ist f (j) (φk ) = 0 für alle k ∈
{1, . . . , n}, da die φk als p-fache Nullstellen konstruiert sind. Zu der Doppelsumme tragen also nur die p-te und höhere Ableitungen bei, deshalb ist die
Doppelsumme ein Vielfaches von p!.
Ist j < p − 1, so ist auch f (j) (0) = 0. Ferner ist auch f (j) (0) ein Vielfaches von
p!, falls j ≥ p.
Die interessanteste Ableitung ist also f (p−1) (0):
n·p
f (p−1) (0) = bn·p
· (p − 1)! · (φ1 · . . . · φn )p
r · (−1)
φ1 · . . . · φn ist symmetrisch in den Konjugierten ξj von i · π: zu jedem Faktor
φk = ε1k · ξ1 + . . . + εrk · ξr ist auch der ganze Orbit bzgl. der symmetrischen
Gruppe Sr unter den 2r − p Faktoren, also existiert zu jedem σ ∈ Sr ein l ∈
{1, . . . , 2r − p} mit
φl = ε1k · ξσ(1) + . . . + ε1k · ξσ(r) .
Also ist - wieder nach dem Hauptsatz über elementarsymmetrische
Funktionen φ1 · . . . · φn
ein ganzzahliges Polynom in den elementarsymmetrischen Funktionen der ξj .
Diese sind als die Koeffizienten des Minimalpolynoms ganzzahlig, also ist φ1 ·
. . . · φn ganzzahlig. f (p−1) (0) ist also ein Vielfaches von (p − 1)!.
Die Primfaktoren in br und φ1 · . . . · φn sind unabhängig von p. p kann also so
groß gewählt werden, dass es weder in br noch in φ1 · . . . · φn vorkommt. So ist
gewährleistet, dass f (p−1) (0) nicht Vielfaches von p! ist.
11
Wir gewinnen die Darstellung
Jf = −q · a · (p − 1)! − b · p! mit a, b ∈ Z,
p kein Teiler von a
Jf = |q · a + b · p|
⇔
(p − 1)! Ist zudem noch p teilerfremd zu q, so teilt p weder q noch a, und der Betrag ist
eine natürliche Zahl > 0. Damit folgt
|Jf | ≥ (p − 1)!.
Soweit die algebraische Abschätzung des Funktionals.
Die analytische Abschätzung
Die analytische Abschätzung gewinnt man nun durch die Standardabschätzung.
Dabei ist wieder fˆ dasjenige Polynom vom Grad m = n · p + p − 1, dessen
Koeffizienten betragsmäßig gleich denen
von f , jedoch alle positiv sind. So ist
gewährleistet, dass das Maximum von fˆ(u) auf der Kreisscheibe K um 0 mit
dem Radius |φk | bei |φk | angenommen wird.
n Z
X φk
φk −u
|Jf | = e
· f (u)du k=1 0
Z
n
X φk
≤
eφk −u · f (u)du
0
k=1
n Z φk
X
φ −u
e k · f (u) du
≤
≤
≤
≤
k=1 0
n Z φk
X
k=1
n
X
k=1
n
X
φ −u e k · |f (u)| du
0
|φk | · e|φk | · max |f (u)|
u∈K
|φk | · e|φk | · fˆ(|φk |).
k=1
Mit Φ := max1≤k≤n |φk | gilt
|Jf | ≤ n · Φ · eΦ · fˆ(Φ).
12
Setzt man nun
M :=
bnr
· max|x|≤Φ
n
Y
(x − φk )
x ·
k=1
und
c1 := n · eΦ ,
so gilt, da fˆ(x) 0 als Nullstelle, also kein Absolutglied besitzt,
Mp
φk −x ˆ · f (x) ≤ eΦ ·
e
Φ
für |x| ≤ Φ.
Mit der Standardabschätzung erhalten wir für |Jf |:
|Jf |
≤ n · Φ · eΦ ·
Mp
Φ
= c1 · Mp .
Somit kann |Jf | nicht stärker als exponentiell mit der Größe von p zunehmen.
Dies steht im Widerspruch zu |Jf | ≥ (p − 1)!, denn (p − 1)! nimmt stärker als
exponentiell mit der Größe von p zu.
Hiermit erhalten wir schließlich den Widerspruch, der den Beweis vollendet.
2
Abb.2: Carl Louis Ferdinand LINDEMANN
13
Quellen:
Peter Bundschuh, Einführung in die Zahlentheorie, Springer Verlag 1996
Michael Artin, Algebra; Birkhäuser Verlag 1998
http://www.math.sc.edu/ filaseta/gradcourses/Math785/Math785Notes6.pdf
(Transzendenz von Pi)
http://kr.cs.ait.ac.th/ radok/math/mat5/algebra32.htm
(Modul-Idee zum Beweis des Hauptsatzes über elementarsymmetrische Funktionen)
14
Herunterladen