Die Transzendenz von π Norbert Engbers 22.08.2004 Einleitung Als Ferdinand Lindemann 1882 die Transzendenz von π bewies, hatte er ein zwei Jahrtausende altes Problem erledigt: Die Quadratur des Kreises, oder in heutiger Sprache die Konstruktion zweier Strecken mit dem Längenverhältnis π nur mit Zirkel und Lineal. Man kann nämlich Strecken mit Längenverhältnis z nur konstruieren, wenn z Element eines algebraischen Zahlkörpers K ist, der über eine Kette K = K1 ⊃ K2 ⊃ . . . ⊃ K n = Q quadratischer Körpererweiterungen, also so, dass ∀i [Ki : Ki+1 ] = 2, zu Q absteigt. Insbesondere muss z dafür Nullstelle eines Polynoms 2., 4., 8., . . . , 2n−1 . Grades aus Z[X] sein. Obgleich also seit 120 Jahren feststeht, dass π dieses Kriterium nicht erfüllt, beschäftigen sich nach wie vor viele Hobbymathematiker mit der Aufgabe, mit den genannten Hilfsmitteln einen Kreis in ein flächengleiches Quadrat zu überführen. Vielleicht hilft dieser Artikel ja dagegen. 1 Zentrales Ergebnis Satz 1: π ist transzendent. Ich erwähne zunächst einen Satz, aus dem die Transzendenz von e und π quasi sofort folgt: Beweisidee 1: Satz von LINDEMANN-WEIERSTRASS: Für alle paarweise verschiedenen α1 , . . . , αn ∈ Q̄ und für alle β1 , . . . , βn ∈ Q̄ gilt: n X βi · eαi 6= 0, i=0 oder kurz gefasst: Alle eαi mit paarweise verschiedenen algebraischen Exponenten sind linear unabhängig über dem Körper der algebraischen Zahlen. Sehr leicht kann man nun die Transzendenz von e und π zeigen: Korollar 1: e ist transzendent. Beweis: Annahme: e ∈ Q̄. Setze α1 = 0, α2 = 1, β1 = e, β2 = −1, βi = 0 für alle anderen i. Dann ist e ·e0 − 1 · e1 = e − e = 0, im Widerspruch zum Satz von Lindemann-Weierstraß. Korollar 2: π ist transzendent. Beweis: Annahme: π ∈ Q̄. Wegen i2 = −1 und der Tatsache, dass die algebraischen Zahlen einen Körper bilden, sind auch i · π und 2 · i · π aus Q̄. Setze dann α1 = 1, α2 = 1, β1 = i · π, β2 = 2 · i · π, βi = 0 für alle anderen i. Dann ist 1 · ei·π + 1 · e2·i·π = −1 + 1 = 0, im Widerspruch zum Satz von Lindemann-Weierstraß. 2 Doch statt den Satz von Lindemann-Weierstraß zu beweisen, werden wir in etwa wieder so vorgehen wie im Transzendenzbeweis für die Zahl e. Als wichtige Voraussetzungen brauchen wir eine Aussage über ganz-algebraische Zahlen sowie den Hauptsatz über elementarsymmetrische Funktionen. Lemma 1: Sei ξ eine algebraische Zahl über Q mit dem Minimalpolynom f ∈ Z[X], f= r X ak · X k . k=0 Dann ist ar · ξ eine ganz-algebraische Zahl, also Nullstelle eines normierten Polynoms mit ganzzahligen Koeffizienten (was beileibe keine Selbstverständlichkeit ist). Beweis von Lemma 1: Es ist r X 0= aj · ξ j . j=0 : Wir multiplizieren die Gleichung mit ar−1 r 0 = ar−1 r · r X aj · ξ j j=0 = arr r ·ξ + r−1 X ar−1 · aj · ξ j r j=0 = 2 r (ar · ξ) + r−1 X j=0 3 arr−1−j · aj · (ar · ξ)j . Den elementarsymmetrischen Funktionen begegnet man, wenn man Produkte von Linearfaktoren ausmultipliziert und mit Polynomen vergleicht. Permutationen der Nullstellen ui haben selbstverständlich keinen Einfluss auf das Ergebnis, wenn man die Koeffizienten als Polynome in den Nullstellen auffasst: (x − u1 ) · (x − u2 ) · . . . · (x − un ) = xn − s1 · xn−1 + s2 · xn−2 − + . . . + (−1)n · sn , wobei die sn die folgenden Ausdrücke in den ui sind: s1 = n X ui , i=1 s2 = X ui · uj , 1≤i,j≤n s3 = ui · uj · uk , 1≤i,j,k≤n ... sn X = n Y ui . i=1 Lemma 2: Hauptsatz über elementarsymmetrische Funktionen Jedes in den Ausdrücken u1 , . . . , un symmetrische, also unter Permutationen der Indices 1, . . . , n unveränderliche Polynom f (u1 , . . . , un ) ∈ Z[u1 , . . . , un ] ist als Polynom p(s1 , . . . , sn ) mit ganzzahligen Koeffizienten in den elementarsymmetrischen Funktionen s1 (ξ1 , . . . , ξr ), s2 (ξ1 , . . . , ξr ), ..., sr (ξ1 , . . . , ξr ) eindeutig darstellbar. 4 Beweis von Lemma 2: Wenn man die Monome eines symmetrischen Polynoms nach dem Totalgrad ordnet, erhält man eine Summe homogener Polynome. Permutationen der Variablen u1 , . . . , un ändern den Totalgrad nicht, also reicht es, den Satz für homogene symmetrische Polynome k. Grades zu zeigen. Diese bleiben homogen und symmetrisch, wenn man sie untereinander addiert, subtrahiert oder mit ganzen Zahlen multipliziert. Es existiert mit dem Nullpolynom 0, dem der Grad k zugewiesen wird, ein neutrales Element und zu jedem Element ein Inverses, nämlich das mit anderen Vorzeichen vor den Koeffizienten. Daher sagt man, die symmetrischen homogenen Polynome k-ten Grades bilden mit der 0 einen Modul M über Z. Wir überlegen nun, welchen Rang dieser Modul über Z hat, d.h. wieviele Elemente man mindestens braucht, um den ganzen Modul durch Addieren und Multiplizieren dieser Elemente, Erzeuger genannt, mit ganzen Zahlen zu erhalten. Sei w ein Erzeuger von M. Wegen der Symmetrie ist mit dem Monom ut11 · . . . · utnn auch der ganze Orbit 1 n {utσ(1) · . . . · utσ(n) |σ ∈ Sn } elementweise als Summanden in w. M hat also den Rang m über Z, wobei m die Anzahl der verschiedenen Orbits von Monomen ut11 · . . . · utnn unter Sn ist, für die t1 + . . . + tn = k gilt. Also wählt man für jeden Orbit das Monom als Repräsentanten, in dem ti ≤ ti+1 für alle 1 ≤ i < n gilt. 5 Solch einem Monom kann folgendes Diagramm mit k Punkten eindeutig zugeordnet werden: u1 u2 u3 u u u u u u u e u e u4 un−2 un−1 u u e u e un e Abb.1:Zum Beweis des Hauptsatzes über elementarsymmetrische Funktionen Das Diagramm ist durch die Randpunkte (offen) eindeutig bestimmt. Das Setzen von bν Randpunkten bei uν zwingt uns, links davon alles aufzufüllen, also ν · bν Punkte zu setzen. Die Anzahl der Möglichkeiten, k Punkte in so einem Diagramm anzubringen, ist also gleich der Anzahl der Möglichkeiten, die Zahl k als Summe b1 + 2 · b 2 + 3 · b 3 + . . . + n · b n = k mit natürlichen Zahlen b1 , . . . , bn darzustellen, wobei hier auch 0 erlaubt ist (falls bei uν kein Randpunkt eingetragen ist). Die Monome sb11 · . . . · sbnn von gleichem Totalgrad k = b1 + 2 · b2 + . . . + n · bn in den elementarsymmetrischen Funktionen erzeugen den Untermodul S ⊆ M; dessen Rang ist also gleichfalls die Anzahl der Möglichkeiten, b1 + 2 · b2 + . . . + n · bn = k mit natürlichen bν zu erreichen. Wegen S ⊆ M und rang S = rang M sind die Moduln identisch. Daraus folgt auch sofort: Die Darstellung in s1 , . . . , sn ist eindeutig. 2 6 Nun widmen wir uns gewappnet der Hauptaufgabe dieses Artikels, dem Beweis von Satz 1: Angenommen, π sei algebraisch über Q. Weil auch i algebraisch über Q ist und die Menge der algebraischen Zahlen über Q, Q̄ ⊂ C, einen Körper bildet (siehe den Artikel ”Das Minimalpolynom algebraischer Zahlen”), ist auch i · π algebraisch mit dem Minimalpolynom g ∈ Z[X], g(x) = r X bk · xk . k=0 Der Leitkoeffizient von g ist br . Nach Lemma 1 ist damit br · i · π eine ganzalgebraische Zahl. Nach dem Fundamentalsatz der Algebra zerfällt g über Q̄ in r verschiedene Linearfaktoren: g(z) = br · (z − ξ1 ) · (z − ξ2 ) · . . . · (z − ξr ). Dabei sind ξ1 , . . . , ξr die Konjugierten von i · π, also alle Nullstellen des Minimalpolynoms von (i) · π. Genau wie br · i · π sind alle br · ξj ganz-algebraisch, also Nullstellen eines normierten Polynoms aus Z[X]. Wir bilden nun den Ausdruck (1 + eξ1 ) · (1 + eξ2 ) · . . . · (1 + eξr ). Da i · π unter den Konjugierten ist und ei·π = −1, ist dieses Produkt gleich Null. Wir multiplizieren das Produkt aus und erhalten: 1+ r X j=1 eξj + X eξj +ξk + . . . + eξ1 +...+ξr . 1<=j<k<=r Sei εk = (ε1k , . . . , εrk ) ∈ {0, 1}r , k ein Index, der die 2r Elemente von {0, 1}r durchläuft, dann ist das Produkt (1 + eξ1 ) · (1 + eξ2 ) · . . . · (1 + eξr ) r X = eε1k ·ξ1 +...+εrk ·ξr k=1 eine Summe aus 2r Exponentialtermen, in deren Exponenten alle Summen aus den ξj stehen, die möglich sind, wenn jedes ξj entweder hineingenommen werden kann oder nicht. 7 Diese 2r Summen werden zur Vereinfachung nun φk geschrieben: φk = r X 1 ≤ k ≤ 2r . εjk · ξj , j=1 Wichtige Konsequenz: Permutiert man die Indices der ξj irgendwie, so steht das Ergebnis dieser Operation wieder unter den Summanden. Zu jedem φk = ε1k · ξ1 + . . . + εrk · ξr ist also auch der ganze Orbit bzgl. der symmetrischen Gruppe Sn unter den 2r Faktoren, also existiert zu jedem σ ∈ Sn ein l ∈ 1, . . . , 2r mit φl = ε1k · ξσ(1) + . . . + εrk · ξσ(r) . Mindestens eine von diesen Summen ist Null. Sei q die Anzahl derer, die Null ergeben; diese tragen zum Produkt (1 + eξ1 ) · (1 + eξ2 ) · . . . · (1 + eξn ) jeweils 1 bei. Dieses Produkt kann dann als Summe folgendermaßen geschrieben werden: q+ n X eφk mit n = 2r − q. k=1 Ein entscheidender Trick bei der algebraischen Abschätzung wird sein, die Summe über 1, . . . , n mit −q identifizieren zu können, um daraus eine Teilbarkeitsaussage zu gewinnen. Wir wählen eine Primzahl p, groß genug, denn über deren Größe wird später der Widerspruch geführt, und definieren das Polynom f vom Grad n · p + p − 1, p−1 f (x) = bn·p · r ·x n Y (x − φk )p . k=1 Das Polynom f ist in den Ausdrücken φk symmetrisch, d.h. gegenüber jeder Permutation der k invariant. Der Hauptsatz über elementarsymmetrische Funktionen garantiert nun, dass das ausmultiplizierte Polynom eine polynomiale Darstellung in s1 (ξ1 , . . . , ξr ), s2 (ξ1 , . . . , ξr ), ..., sr (ξ1 , . . . , ξr ) besitzt, die wieder ganzzahlige Koeffizienten hat. Außerdem gilt, dass die beiden Produkte r 2 Y (x − φk ) = x2 r k=1 −n · n Y k=1 8 (x − φk ) in den Konjugierten ξ1 , . . . , ξr von i · π wieder symmetrisch sind. Letzteres ist darin begründet, dass zu jedem σ ∈ Sr ein l ∈ {1, . . . , 2r } existiert mit φl = ε1k · ξσ(1) + . . . + εrk · ξσ(r) , also die Produkte auch dessen Linearfaktor enthalten. Also läßt sich - wiederum nach dem Satz über elementarsymmetrische Funktionen - dieses Produkt als Polynom mit ganzzahligen Koeffizienten in den elementarsymmetrischen Funktionen s1 (ξ1 , . . . , ξr ), s2 (ξ1 , . . . , ξr ), ..., sr (ξ1 , . . . , ξr ) schreiben. Die elementarsymmetrischen Funktionen in ξ1 , . . . , ξr sind aber gerade die rationalen Koeffizienten b0 br−1 , ..., br br des normierten Minimalpolynoms! Das ergibt sich aus der Identität 1, r X bk k=0 br · xk = (x − ξ1 ) · (x − ξ2 ) · . . . · (x − ξr ) nach Ausmultiplizieren der rechten Seite. Es gibt also ein Polynom F ∈ Z [X, Xr−1 , . . . , X0 ], so dass 2r −q x · n Y (x − φk ) = F k=1 br−1 b0 x, ,..., br br . Q2r −q Die Koeffizienten von k=1 (x − φk ) sind also rationale Zahlen. Der Vorfaktor br steht in f (x) n · p-mal vor der p-ten Potenz dieses Produkts und macht also die Koeffizienten von f alle zu ganzen Zahlen. Zwei konträre Abschätzungen Nun bedienen wir uns wieder des bereits aus ”Selbstverständliches über e und Pi, Teil 1” bekannten Funktionals Z t If (t) = et−u · f (u)du , 0 das wegen der Holomorphie des Integranden für alle komplexen t eindeutig bestimmt ist. Also gilt die Standardabschätzung für Integrale, ”Betrag eines Integrals ist kleiner oder gleich der Länge des Integrationsweges mal Maximum des 9 Betrages auf diesem Weg”, insbesondere mit dem kürzestmöglichen Weg in C, ¯ dem geradlinigen 0t. Algebraische Abschätzung eines Funktionals Von If leiten wir Jf = If (φ1 ) + . . . + If (φn ) ab, das - wie im Beweis der Transzendenz von e - mittels partieller Integration ausgewertet wird zu Jf = ∞ X eφk · j=0 = r 2X −q φk e · ∞ X f (j) (0) − j=0 n·p+p−1 X f f (j) (φk ) k=1 j=0 (j) (0) − j=0 k=1 n X ∞ X n n·p+p−1 X X k=1 f (j) (φk ). j=0 Höhere als n · p + p − 1-te Ableitungen sind allesamt 0, können also ignoriert werden. Wir setzen m = n · p + p − 1. Damit ist Jf = r 2X −q φk e m X · Wegen q + k=0 (0) − m n X X f (j) (φk ). k=0 j=0 j=0 k=0 P2r −q f (j) eφk = 0 ist die erste Summe −q: Jf = −q · j=0 X f (j) (0) − m m X n X f (j) (φk ). j=0 k=1 Aufgrund der ganzzahligen Koeffizienten von f (und der seiner ersten n · p + p − 1 Ableitungen!) und dem hohen Exponenten für br ergibt sich, dass die Summen n X f (j) (φk ) k=1 symmetrische Polynome in den n ganz-algebraischen Zahlen br ·φ1 , . . . , br ·φn mit ganzzahligen Koeffizienten sind und also auch Jf ein symmetrisches Polynom ist mit ganzzahligen Koeffizienten in den 2r Ausdrücken br · j=1 X εjk · ξj . r 10 Also lässt sich Jf als ganzzahliges Polynom in den elementarsymmetrischen Funktionen s1 (ξ1 , . . . , ξr ), s2 (ξ1 , . . . , ξr ), ..., sr (ξ1 , . . . , ξr ) schreiben. Diese sind gleich den Koeffizienten im Minimalpolynom g von i · π, also ganzzahlig, so dass wir folgern können: Jf ist eine ganze Zahl. Ist der Ableitungsgrad j echt kleiner als p, so ist f (j) (φk ) = 0 für alle k ∈ {1, . . . , n}, da die φk als p-fache Nullstellen konstruiert sind. Zu der Doppelsumme tragen also nur die p-te und höhere Ableitungen bei, deshalb ist die Doppelsumme ein Vielfaches von p!. Ist j < p − 1, so ist auch f (j) (0) = 0. Ferner ist auch f (j) (0) ein Vielfaches von p!, falls j ≥ p. Die interessanteste Ableitung ist also f (p−1) (0): n·p f (p−1) (0) = bn·p · (p − 1)! · (φ1 · . . . · φn )p r · (−1) φ1 · . . . · φn ist symmetrisch in den Konjugierten ξj von i · π: zu jedem Faktor φk = ε1k · ξ1 + . . . + εrk · ξr ist auch der ganze Orbit bzgl. der symmetrischen Gruppe Sr unter den 2r − p Faktoren, also existiert zu jedem σ ∈ Sr ein l ∈ {1, . . . , 2r − p} mit φl = ε1k · ξσ(1) + . . . + ε1k · ξσ(r) . Also ist - wieder nach dem Hauptsatz über elementarsymmetrische Funktionen φ1 · . . . · φn ein ganzzahliges Polynom in den elementarsymmetrischen Funktionen der ξj . Diese sind als die Koeffizienten des Minimalpolynoms ganzzahlig, also ist φ1 · . . . · φn ganzzahlig. f (p−1) (0) ist also ein Vielfaches von (p − 1)!. Die Primfaktoren in br und φ1 · . . . · φn sind unabhängig von p. p kann also so groß gewählt werden, dass es weder in br noch in φ1 · . . . · φn vorkommt. So ist gewährleistet, dass f (p−1) (0) nicht Vielfaches von p! ist. 11 Wir gewinnen die Darstellung Jf = −q · a · (p − 1)! − b · p! mit a, b ∈ Z, p kein Teiler von a Jf = |q · a + b · p| ⇔ (p − 1)! Ist zudem noch p teilerfremd zu q, so teilt p weder q noch a, und der Betrag ist eine natürliche Zahl > 0. Damit folgt |Jf | ≥ (p − 1)!. Soweit die algebraische Abschätzung des Funktionals. Die analytische Abschätzung Die analytische Abschätzung gewinnt man nun durch die Standardabschätzung. Dabei ist wieder fˆ dasjenige Polynom vom Grad m = n · p + p − 1, dessen Koeffizienten betragsmäßig gleich denen von f , jedoch alle positiv sind. So ist gewährleistet, dass das Maximum von fˆ(u) auf der Kreisscheibe K um 0 mit dem Radius |φk | bei |φk | angenommen wird. n Z X φk φk −u |Jf | = e · f (u)du k=1 0 Z n X φk ≤ eφk −u · f (u)du 0 k=1 n Z φk X φ −u e k · f (u) du ≤ ≤ ≤ ≤ k=1 0 n Z φk X k=1 n X k=1 n X φ −u e k · |f (u)| du 0 |φk | · e|φk | · max |f (u)| u∈K |φk | · e|φk | · fˆ(|φk |). k=1 Mit Φ := max1≤k≤n |φk | gilt |Jf | ≤ n · Φ · eΦ · fˆ(Φ). 12 Setzt man nun M := bnr · max|x|≤Φ n Y (x − φk ) x · k=1 und c1 := n · eΦ , so gilt, da fˆ(x) 0 als Nullstelle, also kein Absolutglied besitzt, Mp φk −x ˆ · f (x) ≤ eΦ · e Φ für |x| ≤ Φ. Mit der Standardabschätzung erhalten wir für |Jf |: |Jf | ≤ n · Φ · eΦ · Mp Φ = c1 · Mp . Somit kann |Jf | nicht stärker als exponentiell mit der Größe von p zunehmen. Dies steht im Widerspruch zu |Jf | ≥ (p − 1)!, denn (p − 1)! nimmt stärker als exponentiell mit der Größe von p zu. Hiermit erhalten wir schließlich den Widerspruch, der den Beweis vollendet. 2 Abb.2: Carl Louis Ferdinand LINDEMANN 13 Quellen: Peter Bundschuh, Einführung in die Zahlentheorie, Springer Verlag 1996 Michael Artin, Algebra; Birkhäuser Verlag 1998 http://www.math.sc.edu/ filaseta/gradcourses/Math785/Math785Notes6.pdf (Transzendenz von Pi) http://kr.cs.ait.ac.th/ radok/math/mat5/algebra32.htm (Modul-Idee zum Beweis des Hauptsatzes über elementarsymmetrische Funktionen) 14