Der Hauptsatz der Algebra in effektiver Gestalt: ein reell-algebraischer Beweis mittels sturmscher Ketten Michael Eisermann Institut Fourier, Université Grenoble I www-fourier.ujf-grenoble.fr/˜eiserm 15. Januar 2009 Carl Friedrich Gauß (1777–1855) Augustin Louis Cauchy (1789–1857) Charles-François Sturm (1803–1855) Mathematisches Kolloquium, Johannes-Gutenberg-Universität Mainz 1/30 Vorwort Der Hauptsatz der Algebra ist ein klassisches Ergebnis der Mathematik des 19. Jahrhunderts. Er wird oft benutzt, zitiert, gelehrt, . . . und verdient daher eine angemessene Aufmerksamkeit. Er ist auch heute noch aktuell, zum Beispiel im Hinblick auf seine algorithmischen und numerischen Aspekte. Die Aussage des Satzes kann heutzutage kaum überraschen, ein schöner Beweis hingegen schon. Ich möchte hier einen reell-algebraischen Beweis vorstellen, der bemerkenswerte Vorzüge aufweist: er ist elegant, elementar, und effektiv. Das Ziel meines Vortrags ist seine Popularisierung. Der reell-algebraische Beweis geht zurück auf Ideen von Gauß (1799), Cauchy (1831/37), und vor allem Sturm (1836), scheint aber heute völlig unbekannt. Ich hatte das Glück, ihn bei der Ausarbeitung eines Computer-Algebra-Kurses zu entdecken, und war anschließend sehr erstaunt, ihn nicht in der modernen Literatur zu finden. Mein Beitrag besteht darin, diesen wunderschönen Beweis wieder an das Licht der (mathematischen) Öffentlichkeit zu bringen, und Sturms Skizze in moderner Strenge auszuführen. 2/30 Überblick 1 Der Hauptsatz der Algebra Der Satz und seine Geschichte Reelle Nullstellen reeller Polynome Komplexe Nullstellen komplexer Polynome 2 Sturm 1829/1835: reelle Nullstellen reeller Polynome Cauchy-Index für reelle Polynome Cauchys Inversionsformel Sturmsche Ketten 3 Sturm 1836: komplexe Nullstellen komplexer Polynome Cauchy-Index für komplexe Polynome Die Produktformel Homotopie-Invarianz 4 Zusammenfassung und Ausblick Bibliographie: The Fundamental Theorem of Algebra made effective: an elementary real-algebraic proof via Sturm chains. www-fourier.ujf-grenoble.fr/˜eiserm/publications.html#roots 3/30 Der Hauptsatz der Algebra §1.1 Satz (Kurzfassung) Jedes komplexe Polynom vom Grad n hat genau n komplexe Nullstellen. Satz (Langfassung) Sei R der Körper der reellen Zahlen und sei C = R[i] mit i2 = −1. Dann gilt: Für jedes Polynom F = Z n + c1 Z n−1 + · · · + cn−1 Z + cn mit c1 , . . . , cn−1 , cn ∈ C existieren z1 , z2 , . . . , zn ∈ C so dass F = (Z − z1 )(Z − z2 ) · · · (Z − zn ). Nahe liegende Fragen: Gibt es einen elementaren, geometrisch ansprechenden Beweis? Kann man die Voraussetzung abschwächen? Welche geordneten Körper? Kann man die Schlussfolgerung verstärken? Zu einer effektiven Version? 4/30 Einige Daten zum Hauptsatz der Algebra Scipione del Ferro (1456-1526) Niccolò Fontana Tartaglia (1500-1557) Gerolamo Cardano (1501-1576) Lodovico Ferrari (1522-1565) ... Niels Henrik Abel (1802-1829) Évariste Galois (1811-1832) Mathematischer Tourismus Albert Girard (1595-1632) René Descartes (1596-1650) Gottfried Leibniz (1646-1716) ... Leonhard Euler (1707-1783) Jean le Rond d’Alembert (1717-1783) Joseph-Louis Lagrange (1736-1813) Pierre-Simon Laplace (1749-1827) ... Carl Friedrich Gauß (1777-1855) Augustin Louis Cauchy (1789–1857) Charles-François Sturm (1803–1855) §1.1 5/30 Beweisstrategien Drei Beweisstrategien zum Hauptsatz der Algebra: 1 Analysis, mittels Kompaktheit, Integration, Stokes, . . . (d’Alembert 1746, Argand 1814, Cauchy 1820); 2 Algebra, mittels symmetrischer Funktionen oder Galois-Theorie (Euler 1749, Lagrange 1772, Laplace 1795, Gauß 1816); 3 Algebraische Topologie, mittels einer Form der Umlaufzahl (Gauß 1799/1816, Cauchy 1831, Sturm–Liouville 1836) Der hier vorgestellte Beweis ist reell-algebraisch, zwischen 2 und 3. Was ist an diesem reell-algebraischen Beweis interessant? 4 Er ist elementar: Arithmetik und Zwischenwertsatz reeller Polynome. 4 Alle Argumente gelten über jedem reell abgeschlossenem Körper. 4 Der Beweis ist konstruktiv und erlaubt das Auffinden der Nullstellen. 4 Der Algorithmus ist einfach zu implementieren und ausreichend effizient. 4 Formaler, computer-verifizierbarer Beweis: Hauptsatz + Algorithmus. Kurzum: minimale Voraussetzungen, maximale Information. §1.1 6/30 Von den reellen Zahlen zu reell abgeschlossenen Körpern Satz (Charakterisierung der reellen Zahlen) Für jeden geordneten Körper (R, +, ·, ≤) sind äquivalent: 1 (R, ≤) erfüllt die Supremums-Bedingung. 2 Jedes Intervall [a, b] ⊂ R ist kompakt. 3 Jedes Intervall [a, b] ⊂ R ist zusammenhängend. 4 Jede stetige Funktion f : R → R erfüllt den Zwischenwertsatz: f (a)f (b) < 0 =⇒ ∃x ∈ R : (x − a)(x − b) < 0 ∧ f (x) = 0. Zwischen je zwei solchen Körper besteht genau ein Isomorphismus. Ein solcher Körper existiert: wir nennen ihn den Körper der reellen Zahlen. Dies benötigt die Logik zweiter Stufe. Es reicht aber viel weniger: Definition (reell abgeschlossener Körper) Ein geordneter Körper (R, +, ·, ≤) heißt reell abgeschlossen wenn jedes Polynom P ∈ R[X] den Zwischenwertsatz über R erfüllt. Beispiele: die reellen Zahlen R, die reell-algebraischen Zahlen Qc ⊂ R, . . . Jeder geordnete Körper erlaubt einen reellen Abschluss. Beispiel: R(X)c . §1.2 7/30 Ergänzung: reell abgeschlossene Körper §1.2 Proposition Es sei (R, +, ·, ≤) ein reell abgeschlossener Körper. Die Anordnung ist eindeutig bestimmt durch a ≥ 0 ⇔ ∃r ∈ R : r2 = a. Beweis. Für jedes a ∈ R≥0 hat X 2 − a eine Nullstelle in [0, 1 + a]. Somit hat jedes a ∈ R≥0 eine Quadratwurzel r ∈ R≥0 , r2 = a. Satz (reeller Abschluss) Jeder angeordnete Körper (K, +, ·, ≤) erlaubt einen reellen Abschluss, d.h. eine algebraische Erweiterung R ⊃ K die reell abgeschlossen ist. Zwischen zwei reellen Abschlüssen existiert genau ein Isomorphismus. Dies steht im Gegensatz zum algebraischen Abschluss! Satz (Artin–Schreier 1927) Sei R ein Körper und sei C ⊃ R ein algebraisch abgeschlossener Körper. Wenn 1 < dimR (C) < ∞, dann ist R reell abgeschlossen und C = R[i]. Für uns bilden reell abgeschlossene Körper die minimale Voraussetzung. Satz (Tarski 1951, Seidenberg 1954) Je zwei reell abgeschlossene Körper haben dieselbe elementare Theorie. 8/30 Reelle Nullstellen reeller Polynome Wie bestimmt man die Anzahl der Nullstellen von P ∈ R[X] in [a, b]? a b a b Teilantworten von Descartes (1596-1650), Fourier (1768-1830), . . . Sturmscher Satz (1829/35) Wenn R reell abgeschlossen ist, dann gilt ˛ ˘ ¯ # x ∈ [a, b] ˛ P (x) = 0 = ` ´ Vab S0 , S1 , . . . , Sn . Hierbei ist Vab die Differenz der Vorzeichenwechsel in a und in b. Die Kette S0 , S1 , . . . , Sn entsteht aus S0 = P und S1 = P 0 durch iterierte euklidische Division: Sk−1 = Qk Sk − Sk+1 bis schließlich Sn+1 = 0. Sturms Satz erlaubt das Zählen und Auffinden aller reellen Nullstellen: 5 §1.2 3 2 1 2 1 1 1 2 1 1 1 11 1 1 9/30 Umlaufzahl: geometrische Motivation Sei F ∈ C[Z] ein Polynom und sei Γ ⊂ C ein Rechteck. Beispiel: F = Z 5 − 5Z 4 − 2Z 3 − 2Z 2 − 3Z − 12 und Γ = [−1, 1]2 . Im d Im F(b) c F(a) Re Re F(d) a b F(c) Geometrische Beweisidee (Gauß 1799): Wir definieren ind∂Γ (F ) als die Umlaufzahl von F |∂Γ um 0. Wenn Γ groß ist, dann gilt ind∂Γ (F ) = ind∂Γ (Z n ) = n. Wenn Γ klein ist, dann gilt ind∂Γ (F ) = ind∂Γ (const) = 0. Die Umlaufzahl ändert sich nur, wenn 0 durchlaufen wird. Für Grad n ≥ 1 muss also F eine Nullstelle haben. Problem: Wie kann man die Umlaufzahl streng definieren? §1.3 10/30 Umlaufzahl: algebraische Eigenschaften Sei R ein reell abgeschlossener Körper und sei C = R[i], i2 = −1. Sei Ω die Menge stückw. polynomialer Schleifen γ : [0, 1] → C∗ , γ(0) = γ(1). Satz Es gibt eine Abbildung ind : Ω → Z mit folgenden Eigenschaften: 0 Berechnung: ind(γ) berechnet sich mittels Sturms Algorithmus über R. 1 Normalisierung: Für jedes Rechteck Γ ⊂ C gilt ( 1 falls 0 ∈ Int Γ, ind(∂Γ) = 0 falls 0 ∈ C r Γ. 2 Multiplikativität: ind(γ1 · γ2 ) = ind(γ1 ) + ind(γ2 ). 3 Homotopie-Invarianz: ind(γ0 ) = ind(γ1 ) falls γ0 ∼ γ1 in C∗ . Die Schwierigkeit liegt in der Konstruktion einer solchen Abbildung! Überlagerungstheorie, angewendet auf exp : C → → C∗ mit Gruppe Z. ∼ ∗ Fundamentalgruppe, ind : π1 (C , 1) − → Z via Seifert–van Kampen. ∼ Homologietheorie, ind : H1 (C∗ ) − → Z via Eilenberg–Steenrod. Differentialtopologie, Satz von Sard und Abbildungsgrad. R dz 1 Komplexe Analysis, analytischer Index ind(γ) = 2iπ . γ z Reelle Algebra, algebraischer Index ind : Ω → Z via sturmsche Ketten. §1.3 11/30 Ergänzung: Homotopie-Beweis des Hauptsatzes der Algebra Hat man einen Index im obigen Sinne konstruiert, dann folgt daraus der klassische Homotopie-Beweis des Hauptsatzes der Algebra: Wir wählen Γ = [−1, +1] × [−1, +1] ⊂ C. Zu jedem Polynom F = Z n + cn−1 Z n−1 + · · · + c1 Z + c0 konstruieren wir eine Homotopie H : [0, 1] × ∂Γ → C wie folgt. Für t > 0 setzen wir Ht (z) = tn F (z(1 − t)/t). Dies setzt sich stetig nach t = 0 fort: Ht (z) = (1 − t)n z n + cn−1 (1 − t)n−1 tz n−1 + · · · + c1 (1 − t)tn−1 z + c0 tn . Wir erhalten so eine Homotopie zwischen H0 (z) = z n und H1 (z) = c0 in C. Wenn F keine Nullstellen in C hat, dann ist H eine Homotopie in C∗ . Der Index ergibt dann n = ind∂Γ (H0 ) = ind∂Γ (H1 ) = 0. Umgekehrt, für n ≥ 1 muss F mindestens eine Nullstelle z1 ∈ C haben. Wir faktorisieren F = (Z − z1 )F1 und schließen per Induktion über n. §1.3 12/30 Komplexe Nullstellen komplexer Polynome §1.3 Sei R ein reell abgeschlossener Körper und sei C = R[i], i2 = −1. Wir können einen Index mit den nötigen Eigenschaften konstruieren: ff stückweise polynomiale →Z ind : Schleifen γ : [0, 1] → C∗ Dieser liefert einen effektiven Beweis des Hauptsatzes der Algebra: ind∂Γ (F ) zählt die Nullstellen von F in Γ. (Sturmscher Satz / C) ind∂Γ (F ) = deg(F ) für Γ ausreichend groß. (Cauchy-Schranke) Das Zählen erlaubt auch das Auffinden aller komplexen Nullstellen: 1 0 1 0 0 1 2 0 1 1 0 2 0 0 8 4 3 (Nach ausreichender Näherung geht man zum Newton-Verfahren über.) 13/30 Einige Daten zu konstruktiven und algorithmischen Aspekten §1.3 Reell-algebraischer Index Sturm 1829/35: Mémoire sur la résolution des équations numériques Cauchy 1831/37: Calcul des résidus et calcul des indices Sturm–Liouville 1836: Démonstration d’un théorème de M. Cauchy Rezeption in Lehrbüchern Serret 1877: Cours d’algèbre supérieure (Sturm reell und komplex) Weber 1898: Lehrbuch der Algebra (Sturm reell, kaum komplex) Runge 1898: Encyklopädie (Sturm reell und komplex) Index und Abbildungsgrad Kronecker 1869: Systeme von Functionen mehrer Variabeln Brouwer 1912: Abbildungen von Mannigfaltigkeiten Weyl 1924: Fundamentalsatz der Algebra Algorithmen und Implementationen Lehmer 1969: Search procedures for polynomial equation solving Wilf 1978: Bisection algorithm for computing zeros of polynomials Schönhage 1982: The fundamental theorem of algebra in terms of computational complexity 14/30 Vorzeichenwechsel §2.0 Im Folgenden sei (R, +, ·, ≤) ein geordneter Körper. Wir zählen Vorzeichenwechsel V (s0 , s1 ) zwischen s0 , s1 ∈ R: V (+, −) = V (−, +) = 1, V (+, +) = V (−, −) = V (0, 0) = 0, V (+, 0) = V (0, +) = V (−, 0) = V (0, −) = 12 . Definition Die Anzahl der Vorzeichenwechsel einer Folge (s0 , . . . , sn ) in R ist V (s0 , . . . , sn ) := n X k=1 V (sk−1 , sk ) = n X ˛ ˛ 1˛ sign(sk−1 ) − sign(sk )˛. 2 k=1 Für eine Folge von Polynomen (S0 , . . . , Sn ) in R[X] setzen wir ` ´ ` ´ Va S0 , . . . , Sn := V S0 (a), . . . , Sn (a) . Für die Differenz in a, b ∈ R schreiben wir Vab := Va − Vb . ! Vgl. traditionelle Definition (Descartes, Fourier): man bildet die reduzierte Folge ŝ aus s durch Weglassen aller Nullen und definiert V̂ (s) := V (ŝ). 15/30 Die Regeln von Descartes und Fourier §2.0 Wie bestimmt man die Anzahl der Nullstellen von P ∈ R[X] in [a, b]? Viele Mathematiker haben diese Frage untersucht. Zwei berühmte Beispiele: Ê Die Regel von Descartes beschränkt die Anzahl der positiven Nullstellen: Satz (Regel von Descartes) Für jedes Polynom P = c0 + c1 X + · · · + cn X n in R[X] gilt ˛ ˘ ¯ # x ∈ R>0 ˛ P (x) = 0 ≤ V̂ (c0 , c1 , . . . , cn ). mult Ë Fourier hat diese Abschätzung auf beliebige Intervalle verallgemeinert: Satz (Regel von Fourier) Für jedes Polynom P = c0 + c1 X + · · · + cn X n in R[X] gilt ˛ ˘ ¯ ≤ V̂ab (P, P 0 , . . . , P (n) ). # x ∈ ]a, b] ˛ P (x) = 0 mult Wenn P genau n Nullstellen in R hat, dann gilt Gleichheit für alle ]a, b] ⊂ R. Vorteil: Die Abschätzung ist leicht zu berechnen. Nachteil: Die so erhaltenen Schranken sind oft ungenau. Dies war der Kenntnisstand vor Sturms bahnbrechender Arbeit 1829. 16/30 Cauchy-Index: Zählen reeller Polstellen §2.1 Es erweist sich als vorteilhaft, rationale Funktionen f ∈ R(X)∗ zu betrachten. +1 +1 a +1 a −1 +1 a a −1 Ind=+1 −1 Ind=−1 Ind=0 −1 Ind=0 Definition (Cauchy-Index) Wir definieren den Cauchy-Index von f ∈ R(X)∗ in a ∈ R durch 8 ε > <+1 falls lima f = +∞, ˆ ˜ + − ε 1 ε Inda (f ) := 2 Inda (f )−Inda (f ) wobei Inda (f ) := −1 falls lima f = −∞, > : 0 sonst. Auf einem Intervall [a, b] ⊂ R setzen wir X Indba (f ) := 21 Ind+ Indx (f ) − a (f ) + 1 2 Ind− b (f ). x∈]a,b[ Eigenschaften: Indba (f ) + Indcb (f ) = Indca (f ) und Indba (f ◦ τ ) = Indττ (b) (a) (f ). 17/30 Cauchy-Index: Zählen reeller Nullstellen §2.1 Proposition (logarithmische Ableitung) Für f ∈ R(X)∗ 8 > <+1 falls a eine Nullstelle von f ist, gilt Inda (f 0 /f ) = −1 falls a eine Polstelle von f ist, > : 0 sonst. Beweis. Wir faktorisieren f = (X − a)m g so dass g(a) ∈ R∗ . ` 0´ 0 0 m + gg . Also Inda ff = sign(m). Die Leibniz-Regel ergibt ff = X−a Korollar (reelle Nullstellen reeller Polynome) Der Index Indba (P 0 /P ) zählt die Nullstellen von P ∈ R[X]∗ in [a, b]: “P0 ” ˛ ˘ ¯ # x ∈ [a, b] ˛ P (x) = 0 = Indba . P Nullstellen auf dem Rand {a, b} zählen nur zur Hälfte. Problem: Kann man den Index berechnen ohne die Polstellen zu kennen? Beispiel: Der Zwischenwertsatz lautet nun Indba ( P1 ) = Vab (1, P ). Dies verlagert die Zählung vom Intervall [a, b] auf den Rand {a, b}. Allgemeine Lösung: Sturmsche Kette zur Berechnung von Indba ( Q ). P 18/30 Cauchys Inversionsformel über einem reell abgeschlossenen Körper Inversionsformel (Cauchy 1837) Wenn P, Q ∈ R[X] keine gemeinsame Nullstelle in a oder b haben, dann “Q” “P ” ` ´ Indba + Indba = Vab P, Q . P Q Beweis. Wir können P 6= 0 und Q 6= 0 und ggT(P, Q) = 1 annehmen. Ê Betrachten wir ein Intervall [a, b] das keine Wurzeln von P und Q enthält: ` ´ `P ´ Ohne Pole verschwinden die Indices Indba Q und Indba Q . P Gemäß ZWS behalten P und Q ihr Vorzeichen also Vab (P, Q) = 0. Ë Die Formel ist additiv bezüglich Unterteilung des Intervalls [a, b]. Es reicht daher, einen einzigen Pol zu betrachten: P (a) = 0 und Q(a) 6= 0. a b Indba `Q´ Indba `Q´ P P = − 21 ⇒ Va (P, Q) = 12 , Vb (P, Q) = 1 = + 21 ⇒ Va (P, Q) = 12 , Vb (P, Q) = 0 a b ! Die Indexzählung Ë gilt lokal um jeden Pol, auf [a, a + δ] und [a − δ, a] mit δ > 0. Hierzu reicht die Stetigkeit der Polynome; dies gilt über jedem angeordneten Körper. Das globale Argument Ê auf ganz [a, b] hingegen benötigt den Zwischenwertsatz! §2.2 19/30 Sturmsche Ketten §2.3 Definition (sturmsche Kette) Eine Folge (S0 , . . . , Sn ) in R[X] heißt sturmsche Kette auf [a, b] ⊂ R falls gilt: Wenn Sk (x) = 0 für 0 < k < n und x ∈ [a, b], dann Sk−1 (x)Sk+1 (x) < 0. Korollar (der Inversionsformel) Für sturmsche Ketten gilt Indba ` S1 ´ `S ´ ` ´ + Indba Sn−1 =Vab S0 , S1 , . . . , Sn−1 , Sn . S0 n Beweis. Die Inversionsformel bildet eine Teleskopsumme! Für n = 2: “S ” “S ” “S ” “S ” ` ´ 1 0 2 1 Indba + Indba + Indba + Indba = Vab S0 , S1 , S2 . S0 S1 S1 S2 Proposition (euklidische Kettenbruchentwicklung) Zu R mit ggT(R, S) = 1 liefert der euklidische Algorithmus eine sturmsche S Kette S0 = S, S1 = R, . . . , Sn = 1, Sn+1 = 0 mit Sk−1 = Qk Sk − Sk+1 . Folgerung: der sturmsche Satz Für jedes Polynom P ∈ R[X] über einem reell abgeschlossenen Körper gilt “P0 ” ˛ ˘ ¯ ` ´ # x ∈ [a, b] ˛ P (x) = 0 = Indba = Vab S0 , S1 , . . . , Sn . P 20/30 Umlaufzahl: algebraische Eigenschaften §3.1 Sei R ein reell abgeschlossener Körper und sei C = R[i], i2 = −1. Wir wollen die algebraische Umlaufzahl konstruieren: ff stückweise polynomiale →Z ind : ∗ Schleifen γ : [0, 1] → C Diese soll folgende Eigenschaften haben: 1 Normalisierung: Für jedes Rechteck Γ ⊂ C gilt ( 1 falls 0 ∈ Int Γ, ind(∂Γ) = 0 falls 0 ∈ C r Γ. 2 Multiplikativität: ind(γ1 · γ2 ) = ind(γ1 ) + ind(γ2 ). 3 Homotopie-Invarianz: ind(γ0 ) = ind(γ1 ) falls γ0 ∼ γ1 in C∗ . Algorithmischer Bonus: Berechnung mittels sturmscher Ketten. Computer-Algebra statt Numerik: Alle Rechnungen sind exakt. 21/30 Umlaufzahl: geometrische Motivation und algebraische Definition Für F ∈ C[X] beschreibt γ : [0, 1] → C mit γ(x) = F (x) einen Pfad in C: Im −1 +1 +1 −1 Re x=1 x=0 Beobachtung Der Index ind10 (F ) := 1 2 Ind10 ` re F im F ) zählt die Umläufe um 0. ` ´ Allgemeiner: für a, b ∈ C betrachte den Pfad γ(x) = F a + (b − a)x . Definition ` ´ Für F ∈ C[Z] und a, b ∈ C setzen wir indba (F ) = ind10 F a + (b − a)X . §3.1 22/30 Umlaufzahl bezüglich eines Rechtecks Beispiel: F = Z 5 − 5Z 4 − 2Z 3 − 2Z 2 − 3Z − 12 und Γ = [−1, +1] × [−1, +1]. Im d Im F(b) c F(a) Re Re F(d) a b F(c) Definition Für jedes Polynom F ∈ C[Z] und jedes Rechteck Γ ⊂ C setzen wir ind∂Γ (F ) := indba (F ) + indcb (F ) + inddc (F ) + indad (F ). Proposition (Normalisierung) Es gilt ind∂Γ (Z − z0 ) = §3.1 8 1 > > > <1 2 1 > > > :4 0 falls z0 falls z0 falls z0 falls z0 im Inneren von Γ liegt, auf dem Rand von Γ liegt, auf einer Ecke von Γ liegt, im Äußeren von Γ liegt. 23/30 Die Produktformel §3.2 Für F = P + iQ und G = R + iS gilt F G = (P R − QS) + i(P S + QR). Lemma (Produktformel) P R Für je zwei rationale Funktionen Q , S ∈ R(X)∗ gilt “ P R − QS ” “P ” “R” “ P R” Indba = Indba + Indba − Vab 1, + . P S + QR Q S Q S Spezialfall: Für P = S und Q = R ist dies Cauchys Inversionsformel. Den allgemeinen Fall beweist man genauso wie den Spezialfall. Satz (Multiplikativität) Wenn F, G ∈ C[Z] keine Nullstellen in den Ecken von Γ ⊂ R2 haben, dann ind∂Γ (F · G) = ind∂Γ (F ) + ind∂Γ (G). Korollar (Zählen komplexer Nullstellen zerfallender Polynome) Angenommen F ∈ C[Z] zerfällt über C gemäß F = c(Z − z1 ) · · · (Z − zn ), ohne Wurzeln auf den Ecken von Γ. Dann zählt ind∂Γ (F ) die Wurzeln in Γ. ! Wir müssen noch zeigen, dass über C jedes Polynom zerfällt. 24/30 Zählen komplexer Nullstellen §3.3 Wir wollen zeigen: Wenn ind∂Γ (F ) > 0, dann F (z) = 0 für ein z ∈ Γ. Äquivalent hierzu: Wenn F (z) 6= 0 für alle z ∈ Γ, dann ind∂Γ (F ) = 0. Wir betrachten die Einbettung C[Z] ⊂ C[X, Y ] gemäß Z = X + iY . Lemma (lokale Version) Wenn F ∈ C[X, Y ] in (x, y) ∈ R2 nicht verschwindet, dann gibt es δ > 0 so dass ind∂Γ (F ) = 0 für alle Γ ⊂ [x − δ, x + δ] × [y − δ, y + δ]. Beweis. Stetigkeit (explizites δ, über beliebigem angeordneten Körper). Satz (globale Version) Wenn F ∈ C[X, Y ] auf Γ ⊂ R2 nicht verschwindet, dann gilt ind∂Γ (F ) = 0. Beweis. Speziell über den reellen Zahlen R: Kompaktheits-Argument. Allgemein über reell abgeschlossenen Körpern: sturmscher Satz. Korollar (Zählen komplexer Nullstellen beliebiger Polynome) Für jedes F ∈ C[Z] zählt der Index ind∂Γ (F ) die Wurzeln von F in Γ. Beweis. Sei F = (Z − z1 ) · · · (Z − zm )G so dass G keine Nullstellen in C hat. Wir benutzen die Multiplikativität des Index, und obigen Satz für G. 25/30 Ergänzung: Beweis mittels sturmscher Ketten Sei F ∈ C[X, Y ] ohne Nullstellen auf Γ = [x0 , x1 ] × [y0 , y1 ]. Wir betrachten S0 = im F und S1 = re F in C[X, Y ] = C[Y ][X]. Wir konstruieren S2 , . . . , Sn ∈ C[Y ][X] durch (pseudo-)euklidische Division: c2k Sk−1 = Qk Sk − Sk+1 , degX Sk+1 < degX Sk , Qk ∈ C[Y ][X], ck ∈ C[Y ], degX Sn = 0, Sn ∈ C[Y ]. Ê Wenn Sn auf [y0 , y1 ] keine Nullstellen hat, dann gilt Sturm: wenn Sk (x, y) = 0 in (x, y) ∈ Γ, dann Sk−1 (x, y)Sk+1 (x, y) < 0. ˛ ´ ` re F ˛ ´ ` x1 re F ˛ ˛ X = x1 Y = y0 + Indyy10 im 2 indC ∂Γ (F ) = + Indx0 im F F ˛ ` re F ˛ ´ ` ´ ˛ Y = y1 + Indyy0 re F ˛ X = x0 + Indxx01 im 1 im F F ˛ ˛ ´ ` ´ ` = + Vxx01 S0 , . . . , Sn ˛ Y = y0 + Vyy01 S0 , . . . , Sn ˛ X = x1 ˛ ˛ ´ ` ´ ` + Vxx10 S0 , . . . , Sn ˛ Y = y1 + Vyy10 S0 , . . . , Sn ˛ X = x0 = 0. Ë Schlimmstenfalls endliche Menge kritischer Werten y ∈ [y0 , y1 ]. Analoges Argument in C[X][Y ]: endliche Menge kritischer Werte x ∈ [x0 , x1 ]. Um einen kritischen Punkt (x, y) wenden wir das Lemma (lokale Version) an. Außerhalb kritischer Punkte wenden wir das globale Ergebnis Ê an. §3.3 26/30 Grobe Lokalisierung der Nullstellen §3.3 Definition (Cauchy-Schranke) Sei F = Z n + cn−1 Z n−1 + · · · + c1 Z + c0 in C[Z]. Wir setzen M := max{|c0 |, . . . , |cn−1 |} und ρF := 1 + M . Satz (grobe Lokalisierung der Nullstellen) Für jedes z ∈ C mit |z| ≥ ρF gilt |F (z)| ≥ 1. Also liegen alle komplexen Nullstellen von F in B(ρF ) = {z ∈ C | |z| < ρF }. Beweis. Der Satz gilt für F = Z n : hier ist M = 0 und ρF = 1. Im Weiteren können wir also M > 0 und ρF > 1 annehmen. Sei z ∈ C so dass |z| ≥ ρF , also |z| − 1 ≥ M . Hier finden wir |F (z) − z n | = |c0 + c1 z + · · · + cn−1 z n−1 | ≤ |c0 | + |c1 ||z| + · · · + |cn−1 ||z n−1 | n −1 ≤ M + M |z| + · · · + M |z|n−1 = M |z| ≤ |z|n − 1. |z|−1 Schließlich erhalten wir |z n | = |z n − F (z) + F (z)| ≤ |z n − F (z)| + |F (z)|, und daraus |F (z)| ≥ |z n | − |F (z) − z n | ≥ |z|n − (|z|n − 1) = 1. 27/30 Homotopie-Invarianz §3.3 Satz (Homotopie-Invarianz) Sei F ∈ C[T, Z]. Angenommen für jedes t ∈ [0, 1] hat das Polynom Ft ∈ C[Z] keine Nullstellen auf ∂Γ. Dann gilt ind∂Γ (F0 ) = ind∂Γ (F1 ). Beweis. Die Abwesenheit von Nullstellen auf [0, 1] × [a, b] impliziert indba (F | T = 0) − indba (F | T = 1) = ind10 (F | Z = a) − ind10 (F | Z = b). Die Summe über alle vier Kanten von Γ ergibt ind∂Γ (F0 ) − ind∂Γ (F1 ) = 0. Korollar Für F ∈ C[Z]∗ und Γ ⊃ B(ρF ) gilt ind∂Γ (F ) = deg F . Beweis. Sei F = Z n + cn−1 Z n−1 + · · · + c0 ein Polynom vom Grad n. Ft = Z n + t(cn−1 Z n−1 + · · · + c0 ) deformiert F1 = F zu F0 = Z n . Die Cauchy-Schranke ρt = 1 + tM schrumpft von ρ1 = ρF zu ρ0 = 1. Somit hat Ft keine Nullstelle auf ∂Γ, und ind∂Γ (F1 ) = ind∂Γ (F0 ) = n. Dies beweist den Hauptsatz: das Rechteck Γ enthält n Nullstellen von F . 28/30 Zusammenfassung und Ausblick Über reell abgeschlossenen Körpern können wir einen Index konstruieren: ff stückweise polynomiale → Z. ind : Schleifen γ : [0, 1] → C∗ Dieser erlaubt einen elementaren und effektiven Beweis des Hauptsatzes. Algebraische Grad-Schranken Gilt R reell n-abgeschlossen ⇐⇒ R[i] algebraisch n-abgeschlossen? Die Implikation “⇒” gilt in kleinen Graden. Die Umkehrung “⇐” ist klar. Algorithmische Optimierung: asymptotische Komplexität Auffinden der Nullstellen eines Polynoms vom Grad n: algebraisch: Õ(n4 ); numerisch: Õ(n3 ), Schönhage 1982. Wie kann der algebraische Kalkül noch effizienter gemacht werden? Algebraischer Abbildungsgrad in höheren Dimensionen Brouwerscher Fixpunktsatz über reell abgeschlossenen Körpern. Algebraische Grad-Schranken? §4.0 29/30 Vielen Dank für Ihre Aufmerksamkeit! [email protected] www-fourier.ujf-grenoble.fr/˜eiserm The Fundamental Theorem of Algebra made effective: an elementary real-algebraic proof via Sturm chains §4.0 Für Kommentare und Anregungen bin ich dankbar! 30/30