Die Transzendenz von π

Die Transzendenz von π
Norbert Engbers
22.08.2004
Einleitung
Als Ferdinand Lindemann 1882 die Transzendenz von π bewies, hatte er ein
zwei Jahrtausende altes Problem erledigt: Die Quadratur des Kreises, oder in
heutiger Sprache die Konstruktion zweier Strecken mit dem Längenverhältnis π
nur mit Zirkel und Lineal.
Man kann nämlich Strecken mit Längenverhältnis z nur konstruieren, wenn z
Element eines algebraischen Zahlkörpers K ist, der über eine Kette
K = K1 ⊃ K2 ⊃ . . . ⊃ K n = Q
quadratischer Körpererweiterungen, also so, dass
∀i [Ki : Ki+1 ] = 2,
zu Q absteigt. Insbesondere muss z dafür Nullstelle eines Polynoms
2., 4., 8., . . . , 2n−1 . Grades aus Z[X] sein.
Obgleich also seit 120 Jahren feststeht, dass π dieses Kriterium nicht erfüllt,
beschäftigen sich nach wie vor viele Hobbymathematiker mit der Aufgabe, mit
den genannten Hilfsmitteln einen Kreis in ein flächengleiches Quadrat zu überführen.
Vielleicht hilft dieser Artikel ja dagegen.
1
Zentrales Ergebnis
Satz 1: π ist transzendent.
Ich erwähne zunächst einen Satz, aus dem die Transzendenz von e und π quasi
sofort folgt:
Beweisidee 1: Satz von LINDEMANN-WEIERSTRASS:
Für alle paarweise verschiedenen α1 , . . . , αn ∈ Q̄
und für alle β1 , . . . , βn ∈ Q̄ gilt:
n
X
βi · eαi 6= 0,
i=0
oder kurz gefasst: Alle eαi mit paarweise verschiedenen algebraischen Exponenten sind linear unabhängig über dem Körper der algebraischen Zahlen.
Sehr leicht kann man nun die Transzendenz von e und π zeigen:
Korollar 1: e ist transzendent.
Beweis: Annahme: e ∈ Q̄.
Setze α1 = 0, α2 = 1, β1 = e, β2 = −1,
βi = 0 für alle anderen i.
Dann ist e ·e0 − 1 · e1 = e − e = 0,
im Widerspruch zum Satz von Lindemann-Weierstraß.
Korollar 2: π ist transzendent.
Beweis: Annahme: π ∈ Q̄.
Wegen i2 = −1 und der Tatsache, dass die algebraischen
Zahlen einen Körper bilden, sind auch i · π und 2 · i · π aus Q̄.
Setze dann α1 = 1, α2 = 1, β1 = i · π, β2 = 2 · i · π, βi = 0 für alle anderen i.
Dann ist 1 · ei·π + 1 · e2·i·π = −1 + 1 = 0,
im Widerspruch zum Satz von Lindemann-Weierstraß.
2
Doch statt den Satz von Lindemann-Weierstraß zu beweisen, werden
wir in etwa wieder so vorgehen wie im Transzendenzbeweis für die
Zahl e.
Als wichtige Voraussetzungen brauchen wir eine Aussage über
ganz-algebraische Zahlen sowie den Hauptsatz über
elementarsymmetrische Funktionen.
Lemma 1:
Sei ξ eine algebraische Zahl über Q mit dem Minimalpolynom
f ∈ Z[X],
f=
r
X
ak · X k .
k=0
Dann ist ar · ξ eine ganz-algebraische Zahl, also Nullstelle eines normierten Polynoms mit ganzzahligen Koeffizienten (was beileibe keine Selbstverständlichkeit
ist).
Beweis von Lemma 1:
Es ist
r
X
0=
aj · ξ j .
j=0
:
Wir multiplizieren die Gleichung mit ar−1
r
0
=
ar−1
r
·
r
X
aj · ξ j
j=0
=
arr
r
·ξ +
r−1
X
ar−1
· aj · ξ j
r
j=0
=
2
r
(ar · ξ) +
r−1
X
j=0
3
arr−1−j · aj · (ar · ξ)j .
Den elementarsymmetrischen Funktionen begegnet man, wenn man Produkte
von Linearfaktoren ausmultipliziert und mit Polynomen vergleicht.
Permutationen der Nullstellen ui haben selbstverständlich keinen Einfluss auf
das Ergebnis, wenn man die Koeffizienten als Polynome in den Nullstellen auffasst:
(x − u1 ) · (x − u2 ) · . . . · (x − un )
= xn − s1 · xn−1 + s2 · xn−2 − + . . . + (−1)n · sn ,
wobei die sn die folgenden Ausdrücke in den ui sind:
s1
=
n
X
ui ,
i=1
s2
=
X
ui · uj ,
1≤i,j≤n
s3
=
ui · uj · uk ,
1≤i,j,k≤n
...
sn
X
=
n
Y
ui .
i=1
Lemma 2: Hauptsatz über elementarsymmetrische Funktionen
Jedes in den Ausdrücken u1 , . . . , un symmetrische, also unter Permutationen
der Indices 1, . . . , n unveränderliche Polynom
f (u1 , . . . , un ) ∈ Z[u1 , . . . , un ]
ist als Polynom p(s1 , . . . , sn ) mit ganzzahligen Koeffizienten in den elementarsymmetrischen Funktionen
s1 (ξ1 , . . . , ξr ),
s2 (ξ1 , . . . , ξr ),
...,
sr (ξ1 , . . . , ξr )
eindeutig darstellbar.
4
Beweis von Lemma 2:
Wenn man die Monome eines symmetrischen Polynoms nach dem Totalgrad
ordnet, erhält man eine Summe homogener Polynome. Permutationen der Variablen u1 , . . . , un ändern den Totalgrad nicht, also reicht es, den Satz für homogene symmetrische Polynome k. Grades zu zeigen.
Diese bleiben homogen und symmetrisch, wenn man sie untereinander addiert,
subtrahiert oder mit ganzen Zahlen multipliziert. Es existiert mit dem Nullpolynom 0, dem der Grad k zugewiesen wird, ein neutrales Element und zu jedem
Element ein Inverses, nämlich das mit anderen Vorzeichen vor den Koeffizienten.
Daher sagt man, die symmetrischen homogenen Polynome k-ten Grades bilden
mit der 0 einen Modul M über Z.
Wir überlegen nun, welchen Rang dieser Modul über Z hat, d.h. wieviele Elemente man mindestens braucht, um den ganzen Modul durch Addieren und
Multiplizieren dieser Elemente, Erzeuger genannt, mit ganzen Zahlen zu erhalten.
Sei w ein Erzeuger von M. Wegen der Symmetrie ist mit dem Monom
ut11 · . . . · utnn
auch der ganze Orbit
1
n
{utσ(1)
· . . . · utσ(n)
|σ ∈ Sn }
elementweise als Summanden in w.
M hat also den Rang m über Z, wobei m die Anzahl der verschiedenen Orbits
von Monomen
ut11 · . . . · utnn
unter Sn ist, für die t1 + . . . + tn = k gilt.
Also wählt man für jeden Orbit das Monom als Repräsentanten, in dem ti ≤ ti+1
für alle 1 ≤ i < n gilt.
5
Solch einem Monom kann folgendes Diagramm mit k Punkten eindeutig zugeordnet werden:
u1
u2
u3
u
u
u
u
u
u
u
e
u
e
u4
un−2
un−1
u
u
e
u
e
un
e
Abb.1:Zum Beweis des Hauptsatzes über elementarsymmetrische Funktionen
Das Diagramm ist durch die Randpunkte (offen) eindeutig bestimmt. Das Setzen von bν Randpunkten bei uν zwingt uns, links davon alles aufzufüllen, also
ν · bν Punkte zu setzen. Die Anzahl der Möglichkeiten, k Punkte in so einem
Diagramm anzubringen, ist also gleich der Anzahl der Möglichkeiten, die Zahl
k als Summe
b1 + 2 · b 2 + 3 · b 3 + . . . + n · b n = k
mit natürlichen Zahlen b1 , . . . , bn darzustellen, wobei hier auch 0 erlaubt ist
(falls bei uν kein Randpunkt eingetragen ist).
Die Monome sb11 · . . . · sbnn von gleichem Totalgrad k = b1 + 2 · b2 + . . . + n · bn
in den elementarsymmetrischen Funktionen erzeugen den Untermodul S ⊆ M;
dessen Rang ist also gleichfalls die Anzahl der Möglichkeiten,
b1 + 2 · b2 + . . . + n · bn = k
mit natürlichen bν zu erreichen.
Wegen
S ⊆ M und rang S = rang M
sind die Moduln identisch. Daraus folgt auch sofort: Die Darstellung in s1 , . . . , sn
ist eindeutig.
2
6
Nun widmen wir uns gewappnet der Hauptaufgabe dieses Artikels, dem
Beweis von Satz 1:
Angenommen, π sei algebraisch über Q. Weil auch i algebraisch über Q ist und
die Menge der algebraischen Zahlen über Q, Q̄ ⊂ C, einen Körper bildet
(siehe den Artikel ”Das Minimalpolynom algebraischer Zahlen”),
ist auch i · π algebraisch mit dem Minimalpolynom
g ∈ Z[X], g(x) =
r
X
bk · xk .
k=0
Der Leitkoeffizient von g ist br . Nach Lemma 1 ist damit br · i · π eine ganzalgebraische Zahl. Nach dem Fundamentalsatz der Algebra zerfällt g über Q̄ in
r verschiedene Linearfaktoren:
g(z) = br · (z − ξ1 ) · (z − ξ2 ) · . . . · (z − ξr ).
Dabei sind ξ1 , . . . , ξr die Konjugierten von i · π, also alle Nullstellen des Minimalpolynoms von (i) · π. Genau wie br · i · π sind alle br · ξj ganz-algebraisch,
also Nullstellen eines normierten Polynoms aus Z[X].
Wir bilden nun den Ausdruck
(1 + eξ1 ) · (1 + eξ2 ) · . . . · (1 + eξr ).
Da i · π unter den Konjugierten ist und ei·π = −1, ist dieses Produkt gleich Null.
Wir multiplizieren das Produkt aus und erhalten:
1+
r
X
j=1
eξj +
X
eξj +ξk + . . . + eξ1 +...+ξr .
1<=j<k<=r
Sei εk = (ε1k , . . . , εrk ) ∈ {0, 1}r , k ein Index, der die 2r Elemente von {0, 1}r
durchläuft, dann ist das Produkt
(1 + eξ1 ) · (1 + eξ2 ) · . . . · (1 + eξr )
r
X
=
eε1k ·ξ1 +...+εrk ·ξr
k=1
eine Summe aus 2r Exponentialtermen, in deren Exponenten alle Summen aus
den ξj stehen, die möglich sind, wenn jedes ξj entweder hineingenommen werden
kann oder nicht.
7
Diese 2r Summen werden zur Vereinfachung nun φk geschrieben:
φk =
r
X
1 ≤ k ≤ 2r .
εjk · ξj ,
j=1
Wichtige Konsequenz: Permutiert man die Indices der ξj irgendwie, so steht das
Ergebnis dieser Operation wieder unter den Summanden. Zu jedem
φk = ε1k · ξ1 + . . . + εrk · ξr
ist also auch der ganze Orbit bzgl. der symmetrischen Gruppe Sn unter den 2r
Faktoren, also existiert zu jedem σ ∈ Sn ein l ∈ 1, . . . , 2r mit
φl = ε1k · ξσ(1) + . . . + εrk · ξσ(r) .
Mindestens eine von diesen Summen ist Null. Sei q die Anzahl derer, die Null
ergeben; diese tragen zum Produkt
(1 + eξ1 ) · (1 + eξ2 ) · . . . · (1 + eξn )
jeweils 1 bei. Dieses Produkt kann dann als Summe folgendermaßen geschrieben
werden:
q+
n
X
eφk mit n = 2r − q.
k=1
Ein entscheidender Trick bei der algebraischen Abschätzung wird sein, die Summe über 1, . . . , n mit −q identifizieren zu können, um daraus eine Teilbarkeitsaussage zu gewinnen.
Wir wählen eine Primzahl p, groß genug, denn über deren Größe wird später
der Widerspruch geführt, und definieren das Polynom f vom Grad n · p + p − 1,
p−1
f (x) = bn·p
·
r ·x
n
Y
(x − φk )p .
k=1
Das Polynom f ist in den Ausdrücken φk symmetrisch, d.h. gegenüber jeder
Permutation der k invariant. Der Hauptsatz über elementarsymmetrische
Funktionen garantiert nun, dass das ausmultiplizierte Polynom eine polynomiale Darstellung in
s1 (ξ1 , . . . , ξr ),
s2 (ξ1 , . . . , ξr ),
...,
sr (ξ1 , . . . , ξr )
besitzt, die wieder ganzzahlige Koeffizienten hat. Außerdem gilt, dass die beiden
Produkte
r
2
Y
(x − φk ) = x2
r
k=1
−n
·
n
Y
k=1
8
(x − φk )
in den Konjugierten ξ1 , . . . , ξr von i · π wieder symmetrisch sind. Letzteres ist
darin begründet, dass zu jedem σ ∈ Sr ein l ∈ {1, . . . , 2r } existiert mit
φl = ε1k · ξσ(1) + . . . + εrk · ξσ(r) ,
also die Produkte auch dessen Linearfaktor enthalten.
Also läßt sich - wiederum nach dem Satz über elementarsymmetrische Funktionen - dieses Produkt als Polynom mit ganzzahligen Koeffizienten in den elementarsymmetrischen Funktionen
s1 (ξ1 , . . . , ξr ),
s2 (ξ1 , . . . , ξr ),
...,
sr (ξ1 , . . . , ξr )
schreiben. Die elementarsymmetrischen Funktionen in ξ1 , . . . , ξr sind aber gerade die rationalen Koeffizienten
b0
br−1
, ...,
br
br
des normierten Minimalpolynoms! Das ergibt sich aus der Identität
1,
r
X
bk
k=0
br
· xk = (x − ξ1 ) · (x − ξ2 ) · . . . · (x − ξr )
nach Ausmultiplizieren der rechten Seite.
Es gibt also ein Polynom F ∈ Z [X, Xr−1 , . . . , X0 ], so dass
2r −q
x
·
n
Y
(x − φk ) = F
k=1
br−1
b0
x,
,...,
br
br
.
Q2r −q
Die Koeffizienten von k=1 (x − φk ) sind also rationale Zahlen. Der Vorfaktor
br steht in f (x) n · p-mal vor der p-ten Potenz dieses Produkts und macht also
die Koeffizienten von f alle zu ganzen Zahlen.
Zwei konträre Abschätzungen
Nun bedienen wir uns wieder des bereits aus ”Selbstverständliches über e und
Pi, Teil 1” bekannten Funktionals
Z t
If (t) =
et−u · f (u)du ,
0
das wegen der Holomorphie des Integranden für alle komplexen t eindeutig bestimmt ist. Also gilt die Standardabschätzung für Integrale, ”Betrag eines Integrals ist kleiner oder gleich der Länge des Integrationsweges mal Maximum
des
9
Betrages auf diesem Weg”, insbesondere mit dem kürzestmöglichen Weg in C,
¯
dem geradlinigen 0t.
Algebraische Abschätzung eines Funktionals
Von If leiten wir
Jf = If (φ1 ) + . . . + If (φn )
ab, das - wie im Beweis der Transzendenz von e - mittels partieller Integration
ausgewertet wird zu
Jf =
∞
X
eφk ·
j=0
=
r
2X
−q
φk
e
·
∞
X
f (j) (0) −
j=0
n·p+p−1
X
f
f (j) (φk )
k=1 j=0
(j)
(0) −
j=0
k=1
n X
∞
X
n n·p+p−1
X
X
k=1
f (j) (φk ).
j=0
Höhere als n · p + p − 1-te Ableitungen sind allesamt 0, können also ignoriert
werden. Wir setzen
m = n · p + p − 1.
Damit ist
Jf =
r
2X
−q
φk
e
m
X
·
Wegen q +
k=0
(0) −
m
n X
X
f (j) (φk ).
k=0 j=0
j=0
k=0
P2r −q
f
(j)
eφk = 0 ist die erste Summe −q:
Jf = −q ·
j=0
X
f (j) (0) −
m
m X
n
X
f (j) (φk ).
j=0 k=1
Aufgrund der ganzzahligen Koeffizienten von f (und der seiner ersten
n · p + p − 1 Ableitungen!) und dem hohen Exponenten für br ergibt sich, dass
die Summen
n
X
f (j) (φk )
k=1
symmetrische Polynome in den n ganz-algebraischen Zahlen br ·φ1 , . . . , br ·φn mit
ganzzahligen Koeffizienten sind und also auch Jf ein symmetrisches Polynom
ist mit ganzzahligen Koeffizienten in den 2r Ausdrücken
br ·
j=1
X
εjk · ξj .
r
10
Also lässt sich Jf als ganzzahliges Polynom in den elementarsymmetrischen
Funktionen
s1 (ξ1 , . . . , ξr ),
s2 (ξ1 , . . . , ξr ),
...,
sr (ξ1 , . . . , ξr )
schreiben. Diese sind gleich den Koeffizienten im Minimalpolynom g von i · π,
also ganzzahlig, so dass wir folgern können:
Jf ist eine ganze Zahl.
Ist der Ableitungsgrad j echt kleiner als p, so ist f (j) (φk ) = 0 für alle k ∈
{1, . . . , n}, da die φk als p-fache Nullstellen konstruiert sind. Zu der Doppelsumme tragen also nur die p-te und höhere Ableitungen bei, deshalb ist die
Doppelsumme ein Vielfaches von p!.
Ist j < p − 1, so ist auch f (j) (0) = 0. Ferner ist auch f (j) (0) ein Vielfaches von
p!, falls j ≥ p.
Die interessanteste Ableitung ist also f (p−1) (0):
n·p
f (p−1) (0) = bn·p
· (p − 1)! · (φ1 · . . . · φn )p
r · (−1)
φ1 · . . . · φn ist symmetrisch in den Konjugierten ξj von i · π: zu jedem Faktor
φk = ε1k · ξ1 + . . . + εrk · ξr ist auch der ganze Orbit bzgl. der symmetrischen
Gruppe Sr unter den 2r − p Faktoren, also existiert zu jedem σ ∈ Sr ein l ∈
{1, . . . , 2r − p} mit
φl = ε1k · ξσ(1) + . . . + ε1k · ξσ(r) .
Also ist - wieder nach dem Hauptsatz über elementarsymmetrische
Funktionen φ1 · . . . · φn
ein ganzzahliges Polynom in den elementarsymmetrischen Funktionen der ξj .
Diese sind als die Koeffizienten des Minimalpolynoms ganzzahlig, also ist φ1 ·
. . . · φn ganzzahlig. f (p−1) (0) ist also ein Vielfaches von (p − 1)!.
Die Primfaktoren in br und φ1 · . . . · φn sind unabhängig von p. p kann also so
groß gewählt werden, dass es weder in br noch in φ1 · . . . · φn vorkommt. So ist
gewährleistet, dass f (p−1) (0) nicht Vielfaches von p! ist.
11
Wir gewinnen die Darstellung
Jf = −q · a · (p − 1)! − b · p! mit a, b ∈ Z,
p kein Teiler von a
Jf = |q · a + b · p|
⇔
(p − 1)! Ist zudem noch p teilerfremd zu q, so teilt p weder q noch a, und der Betrag ist
eine natürliche Zahl > 0. Damit folgt
|Jf | ≥ (p − 1)!.
Soweit die algebraische Abschätzung des Funktionals.
Die analytische Abschätzung
Die analytische Abschätzung gewinnt man nun durch die Standardabschätzung.
Dabei ist wieder fˆ dasjenige Polynom vom Grad m = n · p + p − 1, dessen
Koeffizienten betragsmäßig gleich denen
von f , jedoch alle positiv sind. So ist
gewährleistet, dass das Maximum von fˆ(u) auf der Kreisscheibe K um 0 mit
dem Radius |φk | bei |φk | angenommen wird.
n Z
X φk
φk −u
|Jf | = e
· f (u)du k=1 0
Z
n
X φk
≤
eφk −u · f (u)du
0
k=1
n Z φk
X
φ −u
e k · f (u) du
≤
≤
≤
≤
k=1 0
n Z φk
X
k=1
n
X
k=1
n
X
φ −u e k · |f (u)| du
0
|φk | · e|φk | · max |f (u)|
u∈K
|φk | · e|φk | · fˆ(|φk |).
k=1
Mit Φ := max1≤k≤n |φk | gilt
|Jf | ≤ n · Φ · eΦ · fˆ(Φ).
12
Setzt man nun
M :=
bnr
· max|x|≤Φ
n
Y
(x − φk )
x ·
k=1
und
c1 := n · eΦ ,
so gilt, da fˆ(x) 0 als Nullstelle, also kein Absolutglied besitzt,
Mp
φk −x ˆ · f (x) ≤ eΦ ·
e
Φ
für |x| ≤ Φ.
Mit der Standardabschätzung erhalten wir für |Jf |:
|Jf |
≤ n · Φ · eΦ ·
Mp
Φ
= c1 · Mp .
Somit kann |Jf | nicht stärker als exponentiell mit der Größe von p zunehmen.
Dies steht im Widerspruch zu |Jf | ≥ (p − 1)!, denn (p − 1)! nimmt stärker als
exponentiell mit der Größe von p zu.
Hiermit erhalten wir schließlich den Widerspruch, der den Beweis vollendet.
2
Abb.2: Carl Louis Ferdinand LINDEMANN
13
Quellen:
Peter Bundschuh, Einführung in die Zahlentheorie, Springer Verlag 1996
Michael Artin, Algebra; Birkhäuser Verlag 1998
http://www.math.sc.edu/ filaseta/gradcourses/Math785/Math785Notes6.pdf
(Transzendenz von Pi)
http://kr.cs.ait.ac.th/ radok/math/mat5/algebra32.htm
(Modul-Idee zum Beweis des Hauptsatzes über elementarsymmetrische Funktionen)
14

Die Transzendenz von π

Dieses Dokument Sammlung (en)

Dieses Dokument gespeichert

Schlagen Sie uns vor, wie wir StudyLib verbessern können