Der Hauptsatz der Algebra in effektiver Gestalt: ein reell

Der Hauptsatz der Algebra in effektiver Gestalt:
ein reell-algebraischer Beweis mittels sturmscher Ketten
Michael Eisermann
Institut Fourier, Université Grenoble I
www-fourier.ujf-grenoble.fr/˜eiserm
15. Januar 2009
Carl Friedrich Gauß (1777–1855)
Augustin Louis Cauchy (1789–1857)
Charles-François Sturm (1803–1855)
Mathematisches Kolloquium, Johannes-Gutenberg-Universität Mainz
1/30
Vorwort
Der Hauptsatz der Algebra ist ein klassisches Ergebnis der Mathematik des
19. Jahrhunderts. Er wird oft benutzt, zitiert, gelehrt, . . . und verdient daher
eine angemessene Aufmerksamkeit. Er ist auch heute noch aktuell, zum
Beispiel im Hinblick auf seine algorithmischen und numerischen Aspekte.
Die Aussage des Satzes kann heutzutage kaum überraschen, ein schöner
Beweis hingegen schon. Ich möchte hier einen reell-algebraischen Beweis
vorstellen, der bemerkenswerte Vorzüge aufweist: er ist elegant, elementar,
und effektiv. Das Ziel meines Vortrags ist seine Popularisierung.
Der reell-algebraische Beweis geht zurück auf Ideen von Gauß (1799),
Cauchy (1831/37), und vor allem Sturm (1836), scheint aber heute völlig
unbekannt. Ich hatte das Glück, ihn bei der Ausarbeitung eines
Computer-Algebra-Kurses zu entdecken, und war anschließend sehr
erstaunt, ihn nicht in der modernen Literatur zu finden.
Mein Beitrag besteht darin, diesen wunderschönen Beweis wieder an das
Licht der (mathematischen) Öffentlichkeit zu bringen, und Sturms Skizze in
moderner Strenge auszuführen.
2/30
Überblick
1
Der Hauptsatz der Algebra
Der Satz und seine Geschichte
Reelle Nullstellen reeller Polynome
Komplexe Nullstellen komplexer Polynome
2
Sturm 1829/1835: reelle Nullstellen reeller Polynome
Cauchy-Index für reelle Polynome
Cauchys Inversionsformel
Sturmsche Ketten
3
Sturm 1836: komplexe Nullstellen komplexer Polynome
Cauchy-Index für komplexe Polynome
Die Produktformel
Homotopie-Invarianz
4
Zusammenfassung und Ausblick
Bibliographie:
The Fundamental Theorem of Algebra made effective:
an elementary real-algebraic proof via Sturm chains.
www-fourier.ujf-grenoble.fr/˜eiserm/publications.html#roots
3/30
Der Hauptsatz der Algebra
§1.1
Satz (Kurzfassung)
Jedes komplexe Polynom vom Grad n hat genau n komplexe Nullstellen.
Satz (Langfassung)
Sei R der Körper der reellen Zahlen und sei C = R[i] mit i2 = −1.
Dann gilt: Für jedes Polynom
F = Z n + c1 Z n−1 + · · · + cn−1 Z + cn
mit c1 , . . . , cn−1 , cn ∈ C existieren z1 , z2 , . . . , zn ∈ C so dass
F = (Z − z1 )(Z − z2 ) · · · (Z − zn ).
Nahe liegende Fragen:
Gibt es einen elementaren, geometrisch ansprechenden Beweis?
Kann man die Voraussetzung abschwächen? Welche geordneten Körper?
Kann man die Schlussfolgerung verstärken? Zu einer effektiven Version?
4/30
Einige Daten zum Hauptsatz der Algebra
Scipione del Ferro (1456-1526)
Niccolò Fontana Tartaglia (1500-1557)
Gerolamo Cardano (1501-1576)
Lodovico Ferrari (1522-1565)
...
Niels Henrik Abel (1802-1829)
Évariste Galois (1811-1832)
Mathematischer Tourismus
Albert Girard (1595-1632)
René Descartes (1596-1650)
Gottfried Leibniz (1646-1716)
...
Leonhard Euler (1707-1783)
Jean le Rond d’Alembert (1717-1783)
Joseph-Louis Lagrange (1736-1813)
Pierre-Simon Laplace (1749-1827)
...
Carl Friedrich Gauß (1777-1855)
Augustin Louis Cauchy (1789–1857)
Charles-François Sturm (1803–1855)
§1.1
5/30
Beweisstrategien
Drei Beweisstrategien zum Hauptsatz der Algebra:
1
Analysis, mittels Kompaktheit, Integration, Stokes, . . .
(d’Alembert 1746, Argand 1814, Cauchy 1820);
2
Algebra, mittels symmetrischer Funktionen oder Galois-Theorie
(Euler 1749, Lagrange 1772, Laplace 1795, Gauß 1816);
3
Algebraische Topologie, mittels einer Form der Umlaufzahl
(Gauß 1799/1816, Cauchy 1831, Sturm–Liouville 1836)
Der hier vorgestellte Beweis ist reell-algebraisch, zwischen 2 und 3.
Was ist an diesem reell-algebraischen Beweis interessant?
4 Er ist elementar: Arithmetik und Zwischenwertsatz reeller Polynome.
4 Alle Argumente gelten über jedem reell abgeschlossenem Körper.
4 Der Beweis ist konstruktiv und erlaubt das Auffinden der Nullstellen.
4 Der Algorithmus ist einfach zu implementieren und ausreichend effizient.
4 Formaler, computer-verifizierbarer Beweis: Hauptsatz + Algorithmus.
Kurzum: minimale Voraussetzungen, maximale Information.
§1.1
6/30
Von den reellen Zahlen zu reell abgeschlossenen Körpern
Satz (Charakterisierung der reellen Zahlen)
Für jeden geordneten Körper (R, +, ·, ≤) sind äquivalent:
1
(R, ≤) erfüllt die Supremums-Bedingung.
2
Jedes Intervall [a, b] ⊂ R ist kompakt.
3
Jedes Intervall [a, b] ⊂ R ist zusammenhängend.
4
Jede stetige Funktion f : R → R erfüllt den Zwischenwertsatz:
f (a)f (b) < 0 =⇒ ∃x ∈ R : (x − a)(x − b) < 0 ∧ f (x) = 0.
Zwischen je zwei solchen Körper besteht genau ein Isomorphismus.
Ein solcher Körper existiert: wir nennen ihn den Körper der reellen Zahlen.
Dies benötigt die Logik zweiter Stufe. Es reicht aber viel weniger:
Definition (reell abgeschlossener Körper)
Ein geordneter Körper (R, +, ·, ≤) heißt reell abgeschlossen
wenn jedes Polynom P ∈ R[X] den Zwischenwertsatz über R erfüllt.
Beispiele: die reellen Zahlen R, die reell-algebraischen Zahlen Qc ⊂ R, . . .
Jeder geordnete Körper erlaubt einen reellen Abschluss. Beispiel: R(X)c .
§1.2
7/30
Ergänzung: reell abgeschlossene Körper
§1.2
Proposition
Es sei (R, +, ·, ≤) ein reell abgeschlossener Körper.
Die Anordnung ist eindeutig bestimmt durch a ≥ 0 ⇔ ∃r ∈ R : r2 = a.
Beweis. Für jedes a ∈ R≥0 hat X 2 − a eine Nullstelle in [0, 1 + a].
Somit hat jedes a ∈ R≥0 eine Quadratwurzel r ∈ R≥0 , r2 = a.
Satz (reeller Abschluss)
Jeder angeordnete Körper (K, +, ·, ≤) erlaubt einen reellen Abschluss,
d.h. eine algebraische Erweiterung R ⊃ K die reell abgeschlossen ist.
Zwischen zwei reellen Abschlüssen existiert genau ein Isomorphismus.
Dies steht im Gegensatz zum algebraischen Abschluss!
Satz (Artin–Schreier 1927)
Sei R ein Körper und sei C ⊃ R ein algebraisch abgeschlossener Körper.
Wenn 1 < dimR (C) < ∞, dann ist R reell abgeschlossen und C = R[i].
Für uns bilden reell abgeschlossene Körper die minimale Voraussetzung.
Satz (Tarski 1951, Seidenberg 1954)
Je zwei reell abgeschlossene Körper haben dieselbe elementare Theorie.
8/30
Reelle Nullstellen reeller Polynome
Wie bestimmt man die Anzahl der Nullstellen von P ∈ R[X] in [a, b]?
a
b
a
b
Teilantworten von Descartes (1596-1650), Fourier (1768-1830), . . .
Sturmscher Satz (1829/35)
Wenn R reell abgeschlossen ist, dann gilt
˛
˘
¯
# x ∈ [a, b] ˛ P (x) = 0
=
`
´
Vab S0 , S1 , . . . , Sn .
Hierbei ist Vab die Differenz der Vorzeichenwechsel in a und in b.
Die Kette S0 , S1 , . . . , Sn entsteht aus S0 = P und S1 = P 0 durch iterierte
euklidische Division: Sk−1 = Qk Sk − Sk+1 bis schließlich Sn+1 = 0.
Sturms Satz erlaubt das Zählen und Auffinden aller reellen Nullstellen:
5
§1.2
3
2
1
2
1
1
1
2
1
1
1
11
1
1
9/30
Umlaufzahl: geometrische Motivation
Sei F ∈ C[Z] ein Polynom und sei Γ ⊂ C ein Rechteck.
Beispiel: F = Z 5 − 5Z 4 − 2Z 3 − 2Z 2 − 3Z − 12 und Γ = [−1, 1]2 .
Im
d
Im
F(b)
c
F(a)
Re
Re
F(d)
a
b
F(c)
Geometrische Beweisidee (Gauß 1799):
Wir definieren ind∂Γ (F ) als die Umlaufzahl von F |∂Γ um 0.
Wenn Γ groß ist, dann gilt ind∂Γ (F ) = ind∂Γ (Z n ) = n.
Wenn Γ klein ist, dann gilt ind∂Γ (F ) = ind∂Γ (const) = 0.
Die Umlaufzahl ändert sich nur, wenn 0 durchlaufen wird.
Für Grad n ≥ 1 muss also F eine Nullstelle haben.
Problem: Wie kann man die Umlaufzahl streng definieren?
§1.3
10/30
Umlaufzahl: algebraische Eigenschaften
Sei R ein reell abgeschlossener Körper und sei C = R[i], i2 = −1.
Sei Ω die Menge stückw. polynomialer Schleifen γ : [0, 1] → C∗ , γ(0) = γ(1).
Satz
Es gibt eine Abbildung ind : Ω → Z mit folgenden Eigenschaften:
0
Berechnung: ind(γ) berechnet sich mittels Sturms Algorithmus über R.
1
Normalisierung: Für jedes Rechteck Γ ⊂ C gilt
(
1 falls 0 ∈ Int Γ,
ind(∂Γ) =
0 falls 0 ∈ C r Γ.
2
Multiplikativität: ind(γ1 · γ2 ) = ind(γ1 ) + ind(γ2 ).
3
Homotopie-Invarianz: ind(γ0 ) = ind(γ1 ) falls γ0 ∼ γ1 in C∗ .
Die Schwierigkeit liegt in der Konstruktion einer solchen Abbildung!
Überlagerungstheorie, angewendet auf exp : C →
→ C∗ mit Gruppe Z.
∼
∗
Fundamentalgruppe, ind : π1 (C , 1) −
→ Z via Seifert–van Kampen.
∼
Homologietheorie, ind : H1 (C∗ ) −
→ Z via Eilenberg–Steenrod.
Differentialtopologie, Satz von Sard und Abbildungsgrad.
R dz
1
Komplexe Analysis, analytischer Index ind(γ) = 2iπ
.
γ z
Reelle Algebra, algebraischer Index ind : Ω → Z via sturmsche Ketten.
§1.3
11/30
Ergänzung: Homotopie-Beweis des Hauptsatzes der Algebra
Hat man einen Index im obigen Sinne konstruiert, dann folgt daraus
der klassische Homotopie-Beweis des Hauptsatzes der Algebra:
Wir wählen Γ = [−1, +1] × [−1, +1] ⊂ C. Zu jedem Polynom
F = Z n + cn−1 Z n−1 + · · · + c1 Z + c0
konstruieren wir eine Homotopie H : [0, 1] × ∂Γ → C wie folgt.
Für t > 0 setzen wir
Ht (z) = tn F (z(1 − t)/t).
Dies setzt sich stetig nach t = 0 fort:
Ht (z) = (1 − t)n z n + cn−1 (1 − t)n−1 tz n−1 + · · · + c1 (1 − t)tn−1 z + c0 tn .
Wir erhalten so eine Homotopie zwischen H0 (z) = z n und H1 (z) = c0 in C.
Wenn F keine Nullstellen in C hat, dann ist H eine Homotopie in C∗ .
Der Index ergibt dann n = ind∂Γ (H0 ) = ind∂Γ (H1 ) = 0.
Umgekehrt, für n ≥ 1 muss F mindestens eine Nullstelle z1 ∈ C haben.
Wir faktorisieren F = (Z − z1 )F1 und schließen per Induktion über n.
§1.3
12/30
Komplexe Nullstellen komplexer Polynome
§1.3
Sei R ein reell abgeschlossener Körper und sei C = R[i], i2 = −1.
Wir können einen Index mit den nötigen Eigenschaften konstruieren:
ff

stückweise polynomiale
→Z
ind :
Schleifen γ : [0, 1] → C∗
Dieser liefert einen effektiven Beweis des Hauptsatzes der Algebra:
ind∂Γ (F ) zählt die Nullstellen von F in Γ. (Sturmscher Satz / C)
ind∂Γ (F ) = deg(F ) für Γ ausreichend groß. (Cauchy-Schranke)
Das Zählen erlaubt auch das Auffinden aller komplexen Nullstellen:
1
0
1
0
0
1
2
0
1
1
0
2
0
0
8
4
3
(Nach ausreichender Näherung geht man zum Newton-Verfahren über.)
13/30
Einige Daten zu konstruktiven und algorithmischen Aspekten
§1.3
Reell-algebraischer Index
Sturm 1829/35: Mémoire sur la résolution des équations numériques
Cauchy 1831/37: Calcul des résidus et calcul des indices
Sturm–Liouville 1836: Démonstration d’un théorème de M. Cauchy
Rezeption in Lehrbüchern
Serret 1877: Cours d’algèbre supérieure (Sturm reell und komplex)
Weber 1898: Lehrbuch der Algebra (Sturm reell, kaum komplex)
Runge 1898: Encyklopädie (Sturm reell und komplex)
Index und Abbildungsgrad
Kronecker 1869: Systeme von Functionen mehrer Variabeln
Brouwer 1912: Abbildungen von Mannigfaltigkeiten
Weyl 1924: Fundamentalsatz der Algebra
Algorithmen und Implementationen
Lehmer 1969: Search procedures for polynomial equation solving
Wilf 1978: Bisection algorithm for computing zeros of polynomials
Schönhage 1982: The fundamental theorem of algebra in terms of
computational complexity
14/30
Vorzeichenwechsel
§2.0
Im Folgenden sei (R, +, ·, ≤) ein geordneter Körper.
Wir zählen Vorzeichenwechsel V (s0 , s1 ) zwischen s0 , s1 ∈ R:
V (+, −) = V (−, +) = 1,
V (+, +) = V (−, −) = V (0, 0) = 0,
V (+, 0) = V (0, +) = V (−, 0) = V (0, −) = 12 .
Definition
Die Anzahl der Vorzeichenwechsel einer Folge (s0 , . . . , sn ) in R ist
V (s0 , . . . , sn ) :=
n
X
k=1
V (sk−1 , sk ) =
n
X
˛
˛
1˛
sign(sk−1 ) − sign(sk )˛.
2
k=1
Für eine Folge von Polynomen (S0 , . . . , Sn ) in R[X] setzen wir
`
´
`
´
Va S0 , . . . , Sn := V S0 (a), . . . , Sn (a) .
Für die Differenz in a, b ∈ R schreiben wir Vab := Va − Vb .
! Vgl. traditionelle Definition (Descartes, Fourier): man bildet die reduzierte
Folge ŝ aus s durch Weglassen aller Nullen und definiert V̂ (s) := V (ŝ).
15/30
Die Regeln von Descartes und Fourier
§2.0
Wie bestimmt man die Anzahl der Nullstellen von P ∈ R[X] in [a, b]?
Viele Mathematiker haben diese Frage untersucht. Zwei berühmte Beispiele:
Ê Die Regel von Descartes beschränkt die Anzahl der positiven Nullstellen:
Satz (Regel von Descartes)
Für jedes Polynom P = c0 + c1 X + · · · + cn X n in R[X] gilt
˛
˘
¯
# x ∈ R>0 ˛ P (x) = 0
≤ V̂ (c0 , c1 , . . . , cn ).
mult
Ë Fourier hat diese Abschätzung auf beliebige Intervalle verallgemeinert:
Satz (Regel von Fourier)
Für jedes Polynom P = c0 + c1 X + · · · + cn X n in R[X] gilt
˛
˘
¯
≤ V̂ab (P, P 0 , . . . , P (n) ).
# x ∈ ]a, b] ˛ P (x) = 0
mult
Wenn P genau n Nullstellen in R hat, dann gilt Gleichheit für alle ]a, b] ⊂ R.
Vorteil: Die Abschätzung ist leicht zu berechnen.
Nachteil: Die so erhaltenen Schranken sind oft ungenau.
Dies war der Kenntnisstand vor Sturms bahnbrechender Arbeit 1829.
16/30
Cauchy-Index: Zählen reeller Polstellen
§2.1
Es erweist sich als vorteilhaft, rationale Funktionen f ∈ R(X)∗ zu betrachten.
+1
+1
a
+1
a
−1
+1
a
a
−1
Ind=+1
−1
Ind=−1
Ind=0
−1
Ind=0
Definition (Cauchy-Index)
Wir definieren den Cauchy-Index von f ∈ R(X)∗ in a ∈ R durch
8
ε
>
<+1 falls lima f = +∞,
ˆ
˜
+
−
ε
1
ε
Inda (f ) := 2 Inda (f )−Inda (f ) wobei Inda (f ) := −1 falls lima f = −∞,
>
:
0
sonst.
Auf einem Intervall [a, b] ⊂ R setzen wir
X
Indba (f ) := 21 Ind+
Indx (f ) −
a (f ) +
1
2
Ind−
b (f ).
x∈]a,b[
Eigenschaften: Indba (f ) + Indcb (f ) = Indca (f ) und Indba (f ◦ τ ) = Indττ (b)
(a) (f ).
17/30
Cauchy-Index: Zählen reeller Nullstellen
§2.1
Proposition (logarithmische Ableitung)
Für f ∈ R(X)∗
8
>
<+1 falls a eine Nullstelle von f ist,
gilt Inda (f 0 /f ) = −1 falls a eine Polstelle von f ist,
>
:
0
sonst.
Beweis. Wir faktorisieren f = (X − a)m g so dass g(a) ∈ R∗ .
` 0´
0
0
m
+ gg . Also Inda ff = sign(m).
Die Leibniz-Regel ergibt ff = X−a
Korollar (reelle Nullstellen reeller Polynome)
Der Index Indba (P 0 /P ) zählt die Nullstellen von P ∈ R[X]∗ in [a, b]:
“P0 ”
˛
˘
¯
# x ∈ [a, b] ˛ P (x) = 0
= Indba
.
P
Nullstellen auf dem Rand {a, b} zählen nur zur Hälfte.
Problem: Kann man den Index berechnen ohne die Polstellen zu kennen?
Beispiel: Der Zwischenwertsatz lautet nun Indba ( P1 ) = Vab (1, P ).
Dies verlagert die Zählung vom Intervall [a, b] auf den Rand {a, b}.
Allgemeine Lösung: Sturmsche Kette zur Berechnung von Indba ( Q
).
P
18/30
Cauchys Inversionsformel über einem reell abgeschlossenen Körper
Inversionsformel (Cauchy 1837)
Wenn P, Q ∈ R[X] keine gemeinsame Nullstelle in a oder b haben, dann
“Q”
“P ”
`
´
Indba
+ Indba
= Vab P, Q .
P
Q
Beweis. Wir können P 6= 0 und Q 6= 0 und ggT(P, Q) = 1 annehmen.
Ê Betrachten wir ein Intervall [a, b] das keine Wurzeln von P und Q enthält:
` ´
`P ´
Ohne Pole verschwinden die Indices Indba Q
und Indba Q
.
P
Gemäß ZWS behalten P und Q ihr Vorzeichen also Vab (P, Q) = 0.
Ë Die Formel ist additiv bezüglich Unterteilung des Intervalls [a, b].
Es reicht daher, einen einzigen Pol zu betrachten: P (a) = 0 und Q(a) 6= 0.
a
b
Indba
`Q´
Indba
`Q´
P
P
= − 21 ⇒ Va (P, Q) = 12 , Vb (P, Q) = 1
= + 21 ⇒ Va (P, Q) = 12 , Vb (P, Q) = 0
a
b
! Die Indexzählung Ë gilt lokal um jeden Pol, auf [a, a + δ] und [a − δ, a] mit δ > 0.
Hierzu reicht die Stetigkeit der Polynome; dies gilt über jedem angeordneten Körper.
Das globale Argument Ê auf ganz [a, b] hingegen benötigt den Zwischenwertsatz!
§2.2
19/30
Sturmsche Ketten
§2.3
Definition (sturmsche Kette)
Eine Folge (S0 , . . . , Sn ) in R[X] heißt sturmsche Kette auf [a, b] ⊂ R falls gilt:
Wenn Sk (x) = 0 für 0 < k < n und x ∈ [a, b], dann Sk−1 (x)Sk+1 (x) < 0.
Korollar (der Inversionsformel)
Für sturmsche Ketten gilt Indba
` S1 ´
`S
´
`
´
+ Indba Sn−1
=Vab S0 , S1 , . . . , Sn−1 , Sn .
S0
n
Beweis. Die Inversionsformel bildet eine Teleskopsumme! Für n = 2:
“S ”
“S ”
“S ”
“S ”
`
´
1
0
2
1
Indba
+ Indba
+ Indba
+ Indba
= Vab S0 , S1 , S2 .
S0
S1
S1
S2
Proposition (euklidische Kettenbruchentwicklung)
Zu R
mit ggT(R, S) = 1 liefert der euklidische Algorithmus eine sturmsche
S
Kette S0 = S, S1 = R, . . . , Sn = 1, Sn+1 = 0 mit Sk−1 = Qk Sk − Sk+1 .
Folgerung: der sturmsche Satz
Für jedes Polynom P ∈ R[X] über einem reell abgeschlossenen Körper gilt
“P0 ”
˛
˘
¯
`
´
# x ∈ [a, b] ˛ P (x) = 0
= Indba
= Vab S0 , S1 , . . . , Sn .
P
20/30
Umlaufzahl: algebraische Eigenschaften
§3.1
Sei R ein reell abgeschlossener Körper und sei C = R[i], i2 = −1.
Wir wollen die algebraische Umlaufzahl konstruieren:
ff

stückweise polynomiale
→Z
ind :
∗
Schleifen γ : [0, 1] → C
Diese soll folgende Eigenschaften haben:
1
Normalisierung: Für jedes Rechteck Γ ⊂ C gilt
(
1 falls 0 ∈ Int Γ,
ind(∂Γ) =
0 falls 0 ∈ C r Γ.
2
Multiplikativität: ind(γ1 · γ2 ) = ind(γ1 ) + ind(γ2 ).
3
Homotopie-Invarianz: ind(γ0 ) = ind(γ1 ) falls γ0 ∼ γ1 in C∗ .
Algorithmischer Bonus: Berechnung mittels sturmscher Ketten.
Computer-Algebra statt Numerik: Alle Rechnungen sind exakt.
21/30
Umlaufzahl: geometrische Motivation und algebraische Definition
Für F ∈ C[X] beschreibt γ : [0, 1] → C mit γ(x) = F (x) einen Pfad in C:
Im
−1
+1
+1
−1
Re
x=1
x=0
Beobachtung
Der Index ind10 (F ) :=
1
2
Ind10
` re F
im F
) zählt die Umläufe um 0.
`
´
Allgemeiner: für a, b ∈ C betrachte den Pfad γ(x) = F a + (b − a)x .
Definition
`
´
Für F ∈ C[Z] und a, b ∈ C setzen wir indba (F ) = ind10 F a + (b − a)X .
§3.1
22/30
Umlaufzahl bezüglich eines Rechtecks
Beispiel: F = Z 5 − 5Z 4 − 2Z 3 − 2Z 2 − 3Z − 12 und Γ = [−1, +1] × [−1, +1].
Im
d
Im
F(b)
c
F(a)
Re
Re
F(d)
a
b
F(c)
Definition
Für jedes Polynom F ∈ C[Z] und jedes Rechteck Γ ⊂ C setzen wir
ind∂Γ (F ) := indba (F ) + indcb (F ) + inddc (F ) + indad (F ).
Proposition (Normalisierung)
Es gilt ind∂Γ (Z − z0 ) =
§3.1
8
1
>
>
>
<1
2
1
>
>
>
:4
0
falls z0
falls z0
falls z0
falls z0
im Inneren von Γ liegt,
auf dem Rand von Γ liegt,
auf einer Ecke von Γ liegt,
im Äußeren von Γ liegt.
23/30
Die Produktformel
§3.2
Für F = P + iQ und G = R + iS gilt F G = (P R − QS) + i(P S + QR).
Lemma (Produktformel)
P R
Für je zwei rationale Funktionen Q
, S ∈ R(X)∗ gilt
“ P R − QS ”
“P ”
“R”
“ P
R”
Indba
= Indba
+ Indba
− Vab 1, +
.
P S + QR
Q
S
Q
S
Spezialfall: Für P = S und Q = R ist dies Cauchys Inversionsformel.
Den allgemeinen Fall beweist man genauso wie den Spezialfall.
Satz (Multiplikativität)
Wenn F, G ∈ C[Z] keine Nullstellen in den Ecken von Γ ⊂ R2 haben, dann
ind∂Γ (F · G) = ind∂Γ (F ) + ind∂Γ (G).
Korollar (Zählen komplexer Nullstellen zerfallender Polynome)
Angenommen F ∈ C[Z] zerfällt über C gemäß F = c(Z − z1 ) · · · (Z − zn ),
ohne Wurzeln auf den Ecken von Γ. Dann zählt ind∂Γ (F ) die Wurzeln in Γ.
! Wir müssen noch zeigen, dass über C jedes Polynom zerfällt.
24/30
Zählen komplexer Nullstellen
§3.3
Wir wollen zeigen: Wenn ind∂Γ (F ) > 0, dann F (z) = 0 für ein z ∈ Γ.
Äquivalent hierzu: Wenn F (z) 6= 0 für alle z ∈ Γ, dann ind∂Γ (F ) = 0.
Wir betrachten die Einbettung C[Z] ⊂ C[X, Y ] gemäß Z = X + iY .
Lemma (lokale Version)
Wenn F ∈ C[X, Y ] in (x, y) ∈ R2 nicht verschwindet, dann gibt es δ > 0
so dass ind∂Γ (F ) = 0 für alle Γ ⊂ [x − δ, x + δ] × [y − δ, y + δ].
Beweis. Stetigkeit (explizites δ, über beliebigem angeordneten Körper).
Satz (globale Version)
Wenn F ∈ C[X, Y ] auf Γ ⊂ R2 nicht verschwindet, dann gilt ind∂Γ (F ) = 0.
Beweis. Speziell über den reellen Zahlen R: Kompaktheits-Argument.
Allgemein über reell abgeschlossenen Körpern: sturmscher Satz.
Korollar (Zählen komplexer Nullstellen beliebiger Polynome)
Für jedes F ∈ C[Z] zählt der Index ind∂Γ (F ) die Wurzeln von F in Γ.
Beweis. Sei F = (Z − z1 ) · · · (Z − zm )G so dass G keine Nullstellen in C hat.
Wir benutzen die Multiplikativität des Index, und obigen Satz für G.
25/30
Ergänzung: Beweis mittels sturmscher Ketten
Sei F ∈ C[X, Y ] ohne Nullstellen auf Γ = [x0 , x1 ] × [y0 , y1 ].
Wir betrachten S0 = im F und S1 = re F in C[X, Y ] = C[Y ][X].
Wir konstruieren S2 , . . . , Sn ∈ C[Y ][X] durch (pseudo-)euklidische Division:
c2k Sk−1 = Qk Sk − Sk+1 ,
degX Sk+1 < degX Sk ,
Qk ∈ C[Y ][X],
ck ∈ C[Y ],
degX Sn = 0,
Sn ∈ C[Y ].
Ê Wenn Sn auf [y0 , y1 ] keine Nullstellen hat, dann gilt Sturm:
wenn Sk (x, y) = 0 in (x, y) ∈ Γ, dann Sk−1 (x, y)Sk+1 (x, y) < 0.
˛
´
` re F ˛
´
`
x1 re F ˛
˛ X = x1
Y = y0 + Indyy10 im
2 indC
∂Γ (F ) = + Indx0 im F
F
˛
` re F ˛
´
`
´
˛ Y = y1 + Indyy0 re F ˛ X = x0
+ Indxx01 im
1 im F
F
˛
˛
´
`
´
`
= + Vxx01 S0 , . . . , Sn ˛ Y = y0 + Vyy01 S0 , . . . , Sn ˛ X = x1
˛
˛
´
`
´
`
+ Vxx10 S0 , . . . , Sn ˛ Y = y1 + Vyy10 S0 , . . . , Sn ˛ X = x0 = 0.
Ë Schlimmstenfalls endliche Menge kritischer Werten y ∈ [y0 , y1 ].
Analoges Argument in C[X][Y ]: endliche Menge kritischer Werte x ∈ [x0 , x1 ].
Um einen kritischen Punkt (x, y) wenden wir das Lemma (lokale Version) an.
Außerhalb kritischer Punkte wenden wir das globale Ergebnis Ê an.
§3.3
26/30
Grobe Lokalisierung der Nullstellen
§3.3
Definition (Cauchy-Schranke)
Sei F = Z n + cn−1 Z n−1 + · · · + c1 Z + c0 in C[Z].
Wir setzen M := max{|c0 |, . . . , |cn−1 |} und ρF := 1 + M .
Satz (grobe Lokalisierung der Nullstellen)
Für jedes z ∈ C mit |z| ≥ ρF gilt |F (z)| ≥ 1.
Also liegen alle komplexen Nullstellen von F in B(ρF ) = {z ∈ C | |z| < ρF }.
Beweis. Der Satz gilt für F = Z n : hier ist M = 0 und ρF = 1.
Im Weiteren können wir also M > 0 und ρF > 1 annehmen.
Sei z ∈ C so dass |z| ≥ ρF , also |z| − 1 ≥ M . Hier finden wir
|F (z) − z n | = |c0 + c1 z + · · · + cn−1 z n−1 | ≤ |c0 | + |c1 ||z| + · · · + |cn−1 ||z n−1 |
n
−1
≤ M + M |z| + · · · + M |z|n−1 = M |z|
≤ |z|n − 1.
|z|−1
Schließlich erhalten wir
|z n | = |z n − F (z) + F (z)| ≤ |z n − F (z)| + |F (z)|,
und daraus
|F (z)| ≥ |z n | − |F (z) − z n | ≥ |z|n − (|z|n − 1) = 1.
27/30
Homotopie-Invarianz
§3.3
Satz (Homotopie-Invarianz)
Sei F ∈ C[T, Z]. Angenommen für jedes t ∈ [0, 1] hat das Polynom
Ft ∈ C[Z] keine Nullstellen auf ∂Γ. Dann gilt ind∂Γ (F0 ) = ind∂Γ (F1 ).
Beweis. Die Abwesenheit von Nullstellen auf [0, 1] × [a, b] impliziert
indba (F | T = 0) − indba (F | T = 1) = ind10 (F | Z = a) − ind10 (F | Z = b).
Die Summe über alle vier Kanten von Γ ergibt ind∂Γ (F0 ) − ind∂Γ (F1 ) = 0.
Korollar
Für F ∈ C[Z]∗ und Γ ⊃ B(ρF ) gilt ind∂Γ (F ) = deg F .
Beweis. Sei F = Z n + cn−1 Z n−1 + · · · + c0 ein Polynom vom Grad n.
Ft = Z n + t(cn−1 Z n−1 + · · · + c0 ) deformiert F1 = F zu F0 = Z n .
Die Cauchy-Schranke ρt = 1 + tM schrumpft von ρ1 = ρF zu ρ0 = 1.
Somit hat Ft keine Nullstelle auf ∂Γ, und ind∂Γ (F1 ) = ind∂Γ (F0 ) = n.
Dies beweist den Hauptsatz: das Rechteck Γ enthält n Nullstellen von F .
28/30
Zusammenfassung und Ausblick
Über reell abgeschlossenen Körpern können wir einen Index konstruieren:
ff

stückweise polynomiale
→ Z.
ind :
Schleifen γ : [0, 1] → C∗
Dieser erlaubt einen elementaren und effektiven Beweis des Hauptsatzes.
Algebraische Grad-Schranken
Gilt R reell n-abgeschlossen ⇐⇒ R[i] algebraisch n-abgeschlossen?
Die Implikation “⇒” gilt in kleinen Graden. Die Umkehrung “⇐” ist klar.
Algorithmische Optimierung: asymptotische Komplexität
Auffinden der Nullstellen eines Polynoms vom Grad n:
algebraisch: Õ(n4 ); numerisch: Õ(n3 ), Schönhage 1982.
Wie kann der algebraische Kalkül noch effizienter gemacht werden?
Algebraischer Abbildungsgrad in höheren Dimensionen
Brouwerscher Fixpunktsatz über reell abgeschlossenen Körpern.
Algebraische Grad-Schranken?
§4.0
29/30
Vielen Dank für Ihre Aufmerksamkeit!
[email protected]
www-fourier.ujf-grenoble.fr/˜eiserm
The Fundamental Theorem of Algebra made effective:
an elementary real-algebraic proof via Sturm chains
§4.0
Für Kommentare und Anregungen bin ich dankbar!
30/30

Zugehörige Unterlagen

1. Welche der folgenden Polynome sind separabel? D f(x) = x 3 − x2

Der Hauptsatz der Algebra in effektiver Gestalt: ein reell

Zugehörige Unterlagen

Produkte

Unterstützung

Der Hauptsatz der Algebra in effektiver Gestalt: ein reell

Zugehörige Unterlagen

Dieses Dokument Sammlung (en)

Dieses Dokument gespeichert

Schlagen Sie uns vor, wie wir StudyLib verbessern können