Vorwort Der Hauptsatz der Algebra in effektiver Gestalt: ein reell-algebraischer Beweis mittels sturmscher Ketten Der Hauptsatz der Algebra ist ein klassisches Ergebnis der Mathematik des 19. Jahrhunderts. Er wird oft benutzt, zitiert, gelehrt, . . . und verdient daher eine angemessene Aufmerksamkeit. Er ist auch heute noch aktuell, zum Beispiel im Hinblick auf seine algorithmischen und numerischen Aspekte. Michael Eisermann Institut Fourier, Université Grenoble I www-fourier.ujf-grenoble.fr/˜eiserm Die Aussage des Satzes kann heutzutage kaum überraschen, ein schöner Beweis hingegen schon. Ich möchte hier einen reell-algebraischen Beweis vorstellen, der bemerkenswerte Vorzüge aufweist: er ist elegant, elementar, und effektiv. Das Ziel meines Vortrags ist seine Popularisierung. 15. Januar 2009 Der reell-algebraische Beweis geht zurück auf Ideen von Gauß (1799), Cauchy (1831/37), und vor allem Sturm (1836), scheint aber heute völlig unbekannt. Ich hatte das Glück, ihn bei der Ausarbeitung eines Computer-Algebra-Kurses zu entdecken, und war anschließend sehr erstaunt, ihn nicht in der modernen Literatur zu finden. Mein Beitrag besteht darin, diesen wunderschönen Beweis wieder an das Licht der (mathematischen) Öffentlichkeit zu bringen, und Sturms Skizze in moderner Strenge auszuführen. Carl Friedrich Gauß (1777–1855) Augustin Louis Cauchy (1789–1857) Charles-François Sturm (1803–1855) Mathematisches Kolloquium, Johannes-Gutenberg-Universität Mainz Überblick 1 2 3 4 2/30 1/30 Der Hauptsatz der Algebra Der Hauptsatz der Algebra Der Satz und seine Geschichte Reelle Nullstellen reeller Polynome Komplexe Nullstellen komplexer Polynome Satz (Kurzfassung) Jedes komplexe Polynom vom Grad n hat genau n komplexe Nullstellen. Sturm 1829/1835: reelle Nullstellen reeller Polynome Cauchy-Index für reelle Polynome Cauchys Inversionsformel Sturmsche Ketten Satz (Langfassung) Sei R der Körper der reellen Zahlen und sei C = R[i] mit i2 = −1. Dann gilt: Für jedes Polynom Sturm 1836: komplexe Nullstellen komplexer Polynome Cauchy-Index für komplexe Polynome Die Produktformel Homotopie-Invarianz F = Z n + c1 Z n−1 + · · · + cn−1 Z + cn mit c1 , . . . , cn−1 , cn ∈ C existieren z1 , z2 , . . . , zn ∈ C so dass F = (Z − z1 )(Z − z2 ) · · · (Z − zn ). Zusammenfassung und Ausblick Nahe liegende Fragen: Gibt es einen elementaren, geometrisch ansprechenden Beweis? Bibliographie: The Fundamental Theorem of Algebra made effective: an elementary real-algebraic proof via Sturm chains. Kann man die Voraussetzung abschwächen? Welche geordneten Körper? Kann man die Schlussfolgerung verstärken? Zu einer effektiven Version? www-fourier.ujf-grenoble.fr/˜eiserm/publications.html#roots 3/30 §1.1 4/30 Einige Daten zum Hauptsatz der Algebra Scipione del Ferro (1456-1526) Niccolò Fontana Tartaglia (1500-1557) Gerolamo Cardano (1501-1576) Lodovico Ferrari (1522-1565) ... Niels Henrik Abel (1802-1829) Évariste Galois (1811-1832) Beweisstrategien Drei Beweisstrategien zum Hauptsatz der Algebra: Mathematischer Tourismus 1 Albert Girard (1595-1632) René Descartes (1596-1650) Gottfried Leibniz (1646-1716) ... Leonhard Euler (1707-1783) Jean le Rond d’Alembert (1717-1783) Joseph-Louis Lagrange (1736-1813) Pierre-Simon Laplace (1749-1827) ... Carl Friedrich Gauß (1777-1855) Algebraische Topologie, mittels einer Form der Umlaufzahl (Gauß 1799/1816, Cauchy 1831, Sturm–Liouville 1836) Was ist an diesem reell-algebraischen Beweis interessant? 4 Er ist elementar: Arithmetik und Zwischenwertsatz reeller Polynome. 4 Alle Argumente gelten über jedem reell abgeschlossenem Körper. 4 Der Beweis ist konstruktiv und erlaubt das Auffinden der Nullstellen. 4 Der Algorithmus ist einfach zu implementieren und ausreichend effizient. 4 Formaler, computer-verifizierbarer Beweis: Hauptsatz + Algorithmus. Kurzum: minimale Voraussetzungen, maximale Information. 5/30 §1.1 Von den reellen Zahlen zu reell abgeschlossenen Körpern Proposition Es sei (R, +, ·, ≤) ein reell abgeschlossener Körper. Die Anordnung ist eindeutig bestimmt durch a ≥ 0 ⇔ ∃r ∈ R : r2 = a. Für jeden geordneten Körper (R, +, ·, ≤) sind äquivalent: 1 (R, ≤) erfüllt die Supremums-Bedingung. 2 Jedes Intervall [a, b] ⊂ R ist kompakt. 3 Jedes Intervall [a, b] ⊂ R ist zusammenhängend. 4 Jede stetige Funktion f : R → R erfüllt den Zwischenwertsatz: f (a)f (b) < 0 =⇒ ∃x ∈ R : (x − a)(x − b) < 0 ∧ f (x) = 0. 6/30 Ergänzung: reell abgeschlossene Körper Satz (Charakterisierung der reellen Zahlen) Beweis. Für jedes a ∈ R≥0 hat X 2 − a eine Nullstelle in [0, 1 + a]. Somit hat jedes a ∈ R≥0 eine Quadratwurzel r ∈ R≥0 , r2 = a. Satz (reeller Abschluss) Jeder angeordnete Körper (K, +, ·, ≤) erlaubt einen reellen Abschluss, d.h. eine algebraische Erweiterung R ⊃ K die reell abgeschlossen ist. Zwischen zwei reellen Abschlüssen existiert genau ein Isomorphismus. Zwischen je zwei solchen Körper besteht genau ein Isomorphismus. Ein solcher Körper existiert: wir nennen ihn den Körper der reellen Zahlen. Dies steht im Gegensatz zum algebraischen Abschluss! Dies benötigt die Logik zweiter Stufe. Es reicht aber viel weniger: Satz (Artin–Schreier 1927) Definition (reell abgeschlossener Körper) Sei R ein Körper und sei C ⊃ R ein algebraisch abgeschlossener Körper. Wenn 1 < dimR (C) < ∞, dann ist R reell abgeschlossen und C = R[i]. Ein geordneter Körper (R, +, ·, ≤) heißt reell abgeschlossen wenn jedes Polynom P ∈ R[X] den Zwischenwertsatz über R erfüllt. Für uns bilden reell abgeschlossene Körper die minimale Voraussetzung. Beispiele: die reellen Zahlen R, die reell-algebraischen Zahlen Qc ⊂ R, . . . Satz (Tarski 1951, Seidenberg 1954) Jeder geordnete Körper erlaubt einen reellen Abschluss. Beispiel: R(X)c . §1.2 Algebra, mittels symmetrischer Funktionen oder Galois-Theorie (Euler 1749, Lagrange 1772, Laplace 1795, Gauß 1816); 3 Der hier vorgestellte Beweis ist reell-algebraisch, zwischen 2 und 3. Augustin Louis Cauchy (1789–1857) Charles-François Sturm (1803–1855) §1.1 Analysis, mittels Kompaktheit, Integration, Stokes, . . . (d’Alembert 1746, Argand 1814, Cauchy 1820); 2 7/30 §1.2 Je zwei reell abgeschlossene Körper haben dieselbe elementare Theorie. 8/30 Reelle Nullstellen reeller Polynome Umlaufzahl: geometrische Motivation Wie bestimmt man die Anzahl der Nullstellen von P ∈ R[X] in [a, b]? Sei F ∈ C[Z] ein Polynom und sei Γ ⊂ C ein Rechteck. Beispiel: F = Z 5 − 5Z 4 − 2Z 3 − 2Z 2 − 3Z − 12 und Γ = [−1, 1]2 . Im Im d a b a F(b) c F(a) b Re Re F(d) Teilantworten von Descartes (1596-1650), Fourier (1768-1830), . . . a Sturmscher Satz (1829/35) Wenn R reell abgeschlossen ist, dann gilt ˛ ˘ ¯ # x ∈ [a, b] ˛ P (x) = 0 = ` ´ Vab S0 , S1 , . . . , Sn . Wenn Γ groß ist, dann gilt ind∂Γ (F ) = ind∂Γ (Z n ) = n. Wenn Γ klein ist, dann gilt ind∂Γ (F ) = ind∂Γ (const) = 0. Die Umlaufzahl ändert sich nur, wenn 0 durchlaufen wird. Für Grad n ≥ 1 muss also F eine Nullstelle haben. Sturms Satz erlaubt das Zählen und Auffinden aller reellen Nullstellen: 3 2 1 2 1 1 1 2 1 1 1 11 1 Problem: Wie kann man die Umlaufzahl streng definieren? 1 §1.2 9/30 §1.3 Umlaufzahl: algebraische Eigenschaften 2 Sei R ein reell abgeschlossener Körper und sei C = R[i], i = −1. Sei Ω die Menge stückw. polynomialer Schleifen γ : [0, 1] → C∗ , γ(0) = γ(1). Hat man einen Index im obigen Sinne konstruiert, dann folgt daraus der klassische Homotopie-Beweis des Hauptsatzes der Algebra: Wir wählen Γ = [−1, +1] × [−1, +1] ⊂ C. Zu jedem Polynom F = Z n + cn−1 Z n−1 + · · · + c1 Z + c0 Es gibt eine Abbildung ind : Ω → Z mit folgenden Eigenschaften: 0 Berechnung: ind(γ) berechnet sich mittels Sturms Algorithmus über R. 1 Normalisierung: Für jedes Rechteck Γ ⊂ C gilt ( 1 falls 0 ∈ Int Γ, ind(∂Γ) = 0 falls 0 ∈ C r Γ. 2 Multiplikativität: ind(γ1 · γ2 ) = ind(γ1 ) + ind(γ2 ). 3 Homotopie-Invarianz: ind(γ0 ) = ind(γ1 ) falls γ0 ∼ γ1 in C∗ . 10/30 Ergänzung: Homotopie-Beweis des Hauptsatzes der Algebra Satz konstruieren wir eine Homotopie H : [0, 1] × ∂Γ → C wie folgt. Für t > 0 setzen wir Ht (z) = tn F (z(1 − t)/t). Dies setzt sich stetig nach t = 0 fort: Ht (z) = (1 − t)n z n + cn−1 (1 − t)n−1 tz n−1 + · · · + c1 (1 − t)tn−1 z + c0 tn . Wir erhalten so eine Homotopie zwischen H0 (z) = z n und H1 (z) = c0 in C. Die Schwierigkeit liegt in der Konstruktion einer solchen Abbildung! Überlagerungstheorie, angewendet auf exp : C → → C∗ mit Gruppe Z. ∼ Fundamentalgruppe, ind : π1 (C∗ , 1) − → Z via Seifert–van Kampen. ∼ Homologietheorie, ind : H1 (C∗ ) − → Z via Eilenberg–Steenrod. Differentialtopologie, Satz von Sard und Abbildungsgrad. R dz 1 Komplexe Analysis, analytischer Index ind(γ) = 2iπ . γ z Reelle Algebra, algebraischer Index ind : Ω → Z via sturmsche Ketten. §1.3 F(c) Wir definieren ind∂Γ (F ) als die Umlaufzahl von F |∂Γ um 0. Hierbei ist Vab die Differenz der Vorzeichenwechsel in a und in b. Die Kette S0 , S1 , . . . , Sn entsteht aus S0 = P und S1 = P 0 durch iterierte euklidische Division: Sk−1 = Qk Sk − Sk+1 bis schließlich Sn+1 = 0. 5 b Geometrische Beweisidee (Gauß 1799): Wenn F keine Nullstellen in C hat, dann ist H eine Homotopie in C∗ . Der Index ergibt dann n = ind∂Γ (H0 ) = ind∂Γ (H1 ) = 0. Umgekehrt, für n ≥ 1 muss F mindestens eine Nullstelle z1 ∈ C haben. Wir faktorisieren F = (Z − z1 )F1 und schließen per Induktion über n. 11/30 §1.3 12/30 Komplexe Nullstellen komplexer Polynome Einige Daten zu konstruktiven und algorithmischen Aspekten Reell-algebraischer Index Sei R ein reell abgeschlossener Körper und sei C = R[i], i2 = −1. Sturm 1829/35: Mémoire sur la résolution des équations numériques Wir können einen Index mit den nötigen Eigenschaften konstruieren: ff stückweise polynomiale →Z ind : Schleifen γ : [0, 1] → C∗ Cauchy 1831/37: Calcul des résidus et calcul des indices Sturm–Liouville 1836: Démonstration d’un théorème de M. Cauchy Rezeption in Lehrbüchern Serret 1877: Cours d’algèbre supérieure (Sturm reell und komplex) Dieser liefert einen effektiven Beweis des Hauptsatzes der Algebra: Weber 1898: Lehrbuch der Algebra (Sturm reell, kaum komplex) ind∂Γ (F ) zählt die Nullstellen von F in Γ. (Sturmscher Satz / C) Runge 1898: Encyklopädie (Sturm reell und komplex) ind∂Γ (F ) = deg(F ) für Γ ausreichend groß. (Cauchy-Schranke) Index und Abbildungsgrad Kronecker 1869: Systeme von Functionen mehrer Variabeln Das Zählen erlaubt auch das Auffinden aller komplexen Nullstellen: 1 Brouwer 1912: Abbildungen von Mannigfaltigkeiten Weyl 1924: Fundamentalsatz der Algebra 0 1 0 0 1 2 0 1 1 0 2 0 0 Algorithmen und Implementationen 8 4 Lehmer 1969: Search procedures for polynomial equation solving 3 Wilf 1978: Bisection algorithm for computing zeros of polynomials Schönhage 1982: The fundamental theorem of algebra in terms of computational complexity (Nach ausreichender Näherung geht man zum Newton-Verfahren über.) §1.3 13/30 §1.3 Vorzeichenwechsel Wie bestimmt man die Anzahl der Nullstellen von P ∈ R[X] in [a, b]? Viele Mathematiker haben diese Frage untersucht. Zwei berühmte Beispiele: Im Folgenden sei (R, +, ·, ≤) ein geordneter Körper. Wir zählen Vorzeichenwechsel V (s0 , s1 ) zwischen s0 , s1 ∈ R: V (+, −) = V (−, +) = 1, Ê Die Regel von Descartes beschränkt die Anzahl der positiven Nullstellen: V (+, +) = V (−, −) = V (0, 0) = 0, Satz (Regel von Descartes) V (+, 0) = V (0, +) = V (−, 0) = V (0, −) = 12 . Für jedes Polynom P = c0 + c1 X + · · · + cn X n in R[X] gilt ˛ ˘ ¯ # x ∈ R>0 ˛ P (x) = 0 ≤ V̂ (c0 , c1 , . . . , cn ). Definition mult Die Anzahl der Vorzeichenwechsel einer Folge (s0 , . . . , sn ) in R ist V (s0 , . . . , sn ) := n X k=1 Ë Fourier hat diese Abschätzung auf beliebige Intervalle verallgemeinert: n X ˛ ˛ 1˛ V (sk−1 , sk ) = sign(sk−1 ) − sign(sk )˛. 2 Satz (Regel von Fourier) k=1 Für jedes Polynom P = c0 + c1 X + · · · + cn X n in R[X] gilt ˛ ˘ ¯ # x ∈ ]a, b] ˛ P (x) = 0 ≤ V̂ab (P, P 0 , . . . , P (n) ). Für eine Folge von Polynomen (S0 , . . . , Sn ) in R[X] setzen wir ` ´ ` ´ Va S0 , . . . , Sn := V S0 (a), . . . , Sn (a) . mult Wenn P genau n Nullstellen in R hat, dann gilt Gleichheit für alle ]a, b] ⊂ R. Für die Differenz in a, b ∈ R schreiben wir Vab := Va − Vb . Vorteil: Die Abschätzung ist leicht zu berechnen. Nachteil: Die so erhaltenen Schranken sind oft ungenau. ! Vgl. traditionelle Definition (Descartes, Fourier): man bildet die reduzierte Folge ŝ aus s durch Weglassen aller Nullen und definiert V̂ (s) := V (ŝ). §2.0 14/30 Die Regeln von Descartes und Fourier 15/30 §2.0 Dies war der Kenntnisstand vor Sturms bahnbrechender Arbeit 1829. 16/30 Cauchy-Index: Zählen reeller Polstellen Cauchy-Index: Zählen reeller Nullstellen Es erweist sich als vorteilhaft, rationale Funktionen f ∈ R(X)∗ zu betrachten. +1 +1 +1 a a −1 Für f ∈ R(X)∗ gilt Inda (f 0 /f ) = a a −1 Ind=+1 Proposition (logarithmische Ableitung) +1 −1 Ind=−1 −1 Ind=0 Beweis. Wir faktorisieren f = (X − a)m g so dass g(a) ∈ R∗ . ` 0´ 0 0 m + gg . Also Inda ff = sign(m). Die Leibniz-Regel ergibt ff = X−a Ind=0 Definition (Cauchy-Index) Korollar (reelle Nullstellen reeller Polynome) Wir definieren den Cauchy-Index von f ∈ R(X)∗ in a ∈ R durch 8 ε > <+1 falls lima f = +∞, ˆ ˜ − ε Inda (f ) := 21 Ind+ −1 falls limεa f = −∞, a (f )−Inda (f ) wobei Inda (f ) := > : 0 sonst. Der Index Indba (P 0 /P ) zählt die Nullstellen von P ∈ R[X]∗ in [a, b]: “P0 ” ˛ ˘ ¯ # x ∈ [a, b] ˛ P (x) = 0 = Indba . P Nullstellen auf dem Rand {a, b} zählen nur zur Hälfte. Auf einem Intervall [a, b] ⊂ R setzen wir X Indab (f ) := 12 Inda+ (f ) + Indx (f ) − Problem: Kann man den Index berechnen ohne die Polstellen zu kennen? 1 2 Ind− b (f ). Beispiel: Der Zwischenwertsatz lautet nun Indba ( P1 ) = Vab (1, P ). x∈]a,b[ Dies verlagert die Zählung vom Intervall [a, b] auf den Rand {a, b}. Eigenschaften: Indba (f ) + Indcb (f ) = Indca (f ) und Indba (f ◦ τ ) = Indττ (b) (a) (f ). §2.1 17/30 §2.1 Cauchys Inversionsformel über einem reell abgeschlossenen Körper Allgemeine Lösung: Sturmsche Kette zur Berechnung von Indba ( Q ). P Inversionsformel (Cauchy 1837) Definition (sturmsche Kette) Wenn P, Q ∈ R[X] keine gemeinsame Nullstelle in a oder b haben, dann “Q” “P ” ` ´ Indba + Indba = Vab P, Q . P Q Eine Folge (S0 , . . . , Sn ) in R[X] heißt sturmsche Kette auf [a, b] ⊂ R falls gilt: Wenn Sk (x) = 0 für 0 < k < n und x ∈ [a, b], dann Sk−1 (x)Sk+1 (x) < 0. Beweis. Wir können P 6= 0 und Q 6= 0 und ggT(P, Q) = 1 annehmen. Für sturmsche Ketten gilt Indba Korollar (der Inversionsformel) Gemäß ZWS behalten P und Q ihr Vorzeichen also Vab (P, Q) = 0. b ` ´ Indba Q P = − 21 ⇒ Va (P, Q) = 1 , 2 Proposition (euklidische Kettenbruchentwicklung) Zu R mit ggT(R, S) = 1 liefert der euklidische Algorithmus eine sturmsche S Kette S0 = S, S1 = R, . . . , Sn = 1, Sn+1 = 0 mit Sk−1 = Qk Sk − Sk+1 . Vb (P, Q) = 1 ` ´ Indba Q = + 21 ⇒ Va (P, Q) = 12 , Vb (P, Q) = 0 P a ` S1 ´ `S ´ ` ´ + Indba Sn−1 =Vab S0 , S1 , . . . , Sn−1 , Sn . S0 n Beweis. Die Inversionsformel bildet eine Teleskopsumme! Für n = 2: “S ” “S ” “S ” “S ” ` ´ 1 0 2 1 Indba + Indba + Indba + Indba = Vab S0 , S1 , S2 . S0 S1 S1 S2 Ë Die Formel ist additiv bezüglich Unterteilung des Intervalls [a, b]. Es reicht daher, einen einzigen Pol zu betrachten: P (a) = 0 und Q(a) 6= 0. a 18/30 Sturmsche Ketten Ê Betrachten wir ein Intervall [a, b] das keine Wurzeln von P und Q enthält: ` ´ `P ´ Ohne Pole verschwinden die Indices Indba Q und Indba Q . P Folgerung: der sturmsche Satz b Für jedes Polynom P ∈ R[X] über einem reell abgeschlossenen Körper gilt “P0 ” ˛ ˘ ¯ ` ´ # x ∈ [a, b] ˛ P (x) = 0 = Indba = Vab S0 , S1 , . . . , Sn . P ! Die Indexzählung Ë gilt lokal um jeden Pol, auf [a, a + δ] und [a − δ, a] mit δ > 0. Hierzu reicht die Stetigkeit der Polynome; dies gilt über jedem angeordneten Körper. Das globale Argument Ê auf ganz [a, b] hingegen benötigt den Zwischenwertsatz! §2.2 8 > <+1 falls a eine Nullstelle von f ist, −1 falls a eine Polstelle von f ist, > : 0 sonst. 19/30 §2.3 20/30 Umlaufzahl: algebraische Eigenschaften Umlaufzahl: geometrische Motivation und algebraische Definition Für F ∈ C[X] beschreibt γ : [0, 1] → C mit γ(x) = F (x) einen Pfad in C: Sei R ein reell abgeschlossener Körper und sei C = R[i], i2 = −1. Im Wir wollen die algebraische Umlaufzahl konstruieren: ff stückweise polynomiale →Z ind : Schleifen γ : [0, 1] → C∗ −1 +1 +1 −1 1 x=0 Normalisierung: Für jedes Rechteck Γ ⊂ C gilt ( 1 falls 0 ∈ Int Γ, ind(∂Γ) = 0 falls 0 ∈ C r Γ. Beobachtung Der Index ind10 (F ) := 2 Multiplikativität: ind(γ1 · γ2 ) = ind(γ1 ) + ind(γ2 ). 3 Homotopie-Invarianz: ind(γ0 ) = ind(γ1 ) falls γ0 ∼ γ1 in C∗ . 1 2 Ind10 ` re F im F ) zählt die Umläufe um 0. ` ´ Allgemeiner: für a, b ∈ C betrachte den Pfad γ(x) = F a + (b − a)x . Algorithmischer Bonus: Berechnung mittels sturmscher Ketten. Definition Computer-Algebra statt Numerik: Alle Rechnungen sind exakt. ` ´ Für F ∈ C[Z] und a, b ∈ C setzen wir indba (F ) = ind10 F a + (b − a)X . 21/30 §3.1 §3.1 Umlaufzahl bezüglich eines Rechtecks 5 4 3 2 Beispiel: F = Z − 5Z − 2Z − 2Z − 3Z − 12 und Γ = [−1, +1] × [−1, +1]. Im d Für F = P + iQ und G = R + iS gilt F G = (P R − QS) + i(P S + QR). Lemma (Produktformel) F(b) P R Für je zwei rationale Funktionen Q , S ∈ R(X)∗ gilt “ P R − QS ” “P ” “R” “ P R” Indba = Indba + Indba − Vab 1, + . P S + QR Q S Q S F(a) Re F(d) a b F(c) Spezialfall: Für P = S und Q = R ist dies Cauchys Inversionsformel. Den allgemeinen Fall beweist man genauso wie den Spezialfall. Definition Satz (Multiplikativität) Für jedes Polynom F ∈ C[Z] und jedes Rechteck Γ ⊂ C setzen wir Wenn F, G ∈ C[Z] keine Nullstellen in den Ecken von Γ ⊂ R2 haben, dann ind∂Γ (F ) := indba (F ) + indcb (F ) + inddc (F ) + indad (F ). ind∂Γ (F · G) = ind∂Γ (F ) + ind∂Γ (G). Proposition (Normalisierung) Es gilt ind∂Γ (Z − z0 ) = 22/30 Die Produktformel Im c Re §3.1 Re x=1 Diese soll folgende Eigenschaften haben: 8 1 > > > <1 2 1 > > > :4 0 falls z0 falls z0 falls z0 falls z0 Korollar (Zählen komplexer Nullstellen zerfallender Polynome) im Inneren von Γ liegt, auf dem Rand von Γ liegt, auf einer Ecke von Γ liegt, im Äußeren von Γ liegt. Angenommen F ∈ C[Z] zerfällt über C gemäß F = c(Z − z1 ) · · · (Z − zn ), ohne Wurzeln auf den Ecken von Γ. Dann zählt ind∂Γ (F ) die Wurzeln in Γ. ! Wir müssen noch zeigen, dass über C jedes Polynom zerfällt. 23/30 §3.2 24/30 Zählen komplexer Nullstellen Ergänzung: Beweis mittels sturmscher Ketten Wir wollen zeigen: Wenn ind∂Γ (F ) > 0, dann F (z) = 0 für ein z ∈ Γ. Sei F ∈ C[X, Y ] ohne Nullstellen auf Γ = [x0 , x1 ] × [y0 , y1 ]. Äquivalent hierzu: Wenn F (z) 6= 0 für alle z ∈ Γ, dann ind∂Γ (F ) = 0. Wir betrachten S0 = im F und S1 = re F in C[X, Y ] = C[Y ][X]. Wir betrachten die Einbettung C[Z] ⊂ C[X, Y ] gemäß Z = X + iY . Wir konstruieren S2 , . . . , Sn ∈ C[Y ][X] durch (pseudo-)euklidische Division: Lemma (lokale Version) c2k Sk−1 = Qk Sk − Sk+1 , Wenn F ∈ C[X, Y ] in (x, y) ∈ R2 nicht verschwindet, dann gibt es δ > 0 so dass ind∂Γ (F ) = 0 für alle Γ ⊂ [x − δ, x + δ] × [y − δ, y + δ]. degX Sk+1 < degX Sk , ck ∈ C[Y ], degX Sn = 0, Sn ∈ C[Y ]. Ê Wenn Sn auf [y0 , y1 ] keine Nullstellen hat, dann gilt Sturm: Beweis. Stetigkeit (explizites δ, über beliebigem angeordneten Körper). Beweis. Speziell über den reellen Zahlen R: Kompaktheits-Argument. Allgemein über reell abgeschlossenen Körpern: sturmscher Satz. wenn Sk (x, y) = 0 in (x, y) ∈ Γ, dann Sk−1 (x, y)Sk+1 (x, y) < 0. ˛ ` ´ ` re F ˛ ´ x1 re F ˛ ˛ X = x1 Y = y0 + Indyy10 im 2 indC ∂Γ (F ) = + Indx0 im F F ˛ ` re F ˛ ` ´ ´ ˛ Y = y1 + Indyy0 re F ˛ X = x0 + Indxx01 im 1 im F F ˛ ˛ ´ ` ` ´ = + Vxx01 S0 , . . . , Sn ˛ Y = y0 + Vyy01 S0 , . . . , Sn ˛ X = x1 ˛ ˛ ´ ´ x0 ` y0 ` ˛ ˛ + Vx1 S0 , . . . , Sn Y = y1 + Vy1 S0 , . . . , Sn X = x0 = 0. Korollar (Zählen komplexer Nullstellen beliebiger Polynome) Ë Schlimmstenfalls endliche Menge kritischer Werten y ∈ [y0 , y1 ]. Satz (globale Version) Wenn F ∈ C[X, Y ] auf Γ ⊂ R2 nicht verschwindet, dann gilt ind∂Γ (F ) = 0. Analoges Argument in C[X][Y ]: endliche Menge kritischer Werte x ∈ [x0 , x1 ]. Für jedes F ∈ C[Z] zählt der Index ind∂Γ (F ) die Wurzeln von F in Γ. Um einen kritischen Punkt (x, y) wenden wir das Lemma (lokale Version) an. Beweis. Sei F = (Z − z1 ) · · · (Z − zm )G so dass G keine Nullstellen in C hat. Wir benutzen die Multiplikativität des Index, und obigen Satz für G. §3.3 Außerhalb kritischer Punkte wenden wir das globale Ergebnis Ê an. 25/30 §3.3 Grobe Lokalisierung der Nullstellen 26/30 Homotopie-Invarianz Definition (Cauchy-Schranke) Satz (Homotopie-Invarianz) Sei F = Z n + cn−1 Z n−1 + · · · + c1 Z + c0 in C[Z]. Wir setzen M := max{|c0 |, . . . , |cn−1 |} und ρF := 1 + M . Sei F ∈ C[T, Z]. Angenommen für jedes t ∈ [0, 1] hat das Polynom Ft ∈ C[Z] keine Nullstellen auf ∂Γ. Dann gilt ind∂Γ (F0 ) = ind∂Γ (F1 ). Satz (grobe Lokalisierung der Nullstellen) Beweis. Die Abwesenheit von Nullstellen auf [0, 1] × [a, b] impliziert Für jedes z ∈ C mit |z| ≥ ρF gilt |F (z)| ≥ 1. indba (F | T = 0) − indba (F | T = 1) = ind10 (F | Z = a) − ind10 (F | Z = b). Also liegen alle komplexen Nullstellen von F in B(ρF ) = {z ∈ C | |z| < ρF }. Die Summe über alle vier Kanten von Γ ergibt ind∂Γ (F0 ) − ind∂Γ (F1 ) = 0. Beweis. Der Satz gilt für F = Z n : hier ist M = 0 und ρF = 1. Im Weiteren können wir also M > 0 und ρF > 1 annehmen. Korollar Sei z ∈ C so dass |z| ≥ ρF , also |z| − 1 ≥ M . Hier finden wir Für F ∈ C[Z]∗ und Γ ⊃ B(ρF ) gilt ind∂Γ (F ) = deg F . |F (z) − z n | = |c0 + c1 z + · · · + cn−1 z n−1 | ≤ |c0 | + |c1 ||z| + · · · + |cn−1 ||z n−1 | Beweis. Sei F = Z n + cn−1 Z n−1 + · · · + c0 ein Polynom vom Grad n. Ft = Z n + t(cn−1 Z n−1 + · · · + c0 ) deformiert F1 = F zu F0 = Z n . Die Cauchy-Schranke ρt = 1 + tM schrumpft von ρ1 = ρF zu ρ0 = 1. Somit hat Ft keine Nullstelle auf ∂Γ, und ind∂Γ (F1 ) = ind∂Γ (F0 ) = n. n −1 ≤ M + M |z| + · · · + M |z|n−1 = M |z| ≤ |z|n − 1. |z|−1 Schließlich erhalten wir |z n | = |z n − F (z) + F (z)| ≤ |z n − F (z)| + |F (z)|, und daraus |F (z)| ≥ |z n | − |F (z) − z n | ≥ |z|n − (|z|n − 1) = 1. §3.3 Qk ∈ C[Y ][X], Dies beweist den Hauptsatz: das Rechteck Γ enthält n Nullstellen von F . 27/30 §3.3 28/30 Zusammenfassung und Ausblick Über reell abgeschlossenen Körpern können wir einen Index konstruieren: ff stückweise polynomiale → Z. ind : Schleifen γ : [0, 1] → C∗ Dieser erlaubt einen elementaren und effektiven Beweis des Hauptsatzes. Algebraische Grad-Schranken Gilt R reell n-abgeschlossen ⇐⇒ R[i] algebraisch n-abgeschlossen? Die Implikation “⇒” gilt in kleinen Graden. Die Umkehrung “⇐” ist klar. Algorithmische Optimierung: asymptotische Komplexität Auffinden der Nullstellen eines Polynoms vom Grad n: algebraisch: Õ(n4 ); numerisch: Õ(n3 ), Schönhage 1982. Vielen Dank für Ihre Aufmerksamkeit! Wie kann der algebraische Kalkül noch effizienter gemacht werden? [email protected] www-fourier.ujf-grenoble.fr/˜eiserm Algebraischer Abbildungsgrad in höheren Dimensionen Brouwerscher Fixpunktsatz über reell abgeschlossenen Körpern. The Fundamental Theorem of Algebra made effective: an elementary real-algebraic proof via Sturm chains Algebraische Grad-Schranken? §4.0 29/30 §4.0 Für Kommentare und Anregungen bin ich dankbar! 30/30