Der Hauptsatz der Algebra in effektiver Gestalt: ein reell

Vorwort
Der Hauptsatz der Algebra in effektiver Gestalt:
ein reell-algebraischer Beweis mittels sturmscher Ketten
Der Hauptsatz der Algebra ist ein klassisches Ergebnis der Mathematik des
19. Jahrhunderts. Er wird oft benutzt, zitiert, gelehrt, . . . und verdient daher
eine angemessene Aufmerksamkeit. Er ist auch heute noch aktuell, zum
Beispiel im Hinblick auf seine algorithmischen und numerischen Aspekte.
Michael Eisermann
Institut Fourier, Université Grenoble I
www-fourier.ujf-grenoble.fr/˜eiserm
Die Aussage des Satzes kann heutzutage kaum überraschen, ein schöner
Beweis hingegen schon. Ich möchte hier einen reell-algebraischen Beweis
vorstellen, der bemerkenswerte Vorzüge aufweist: er ist elegant, elementar,
und effektiv. Das Ziel meines Vortrags ist seine Popularisierung.
15. Januar 2009
Der reell-algebraische Beweis geht zurück auf Ideen von Gauß (1799),
Cauchy (1831/37), und vor allem Sturm (1836), scheint aber heute völlig
unbekannt. Ich hatte das Glück, ihn bei der Ausarbeitung eines
Computer-Algebra-Kurses zu entdecken, und war anschließend sehr
erstaunt, ihn nicht in der modernen Literatur zu finden.
Mein Beitrag besteht darin, diesen wunderschönen Beweis wieder an das
Licht der (mathematischen) Öffentlichkeit zu bringen, und Sturms Skizze in
moderner Strenge auszuführen.
Carl Friedrich Gauß (1777–1855)
Augustin Louis Cauchy (1789–1857)
Charles-François Sturm (1803–1855)
Mathematisches Kolloquium, Johannes-Gutenberg-Universität Mainz
Überblick
1
2
3
4
2/30
1/30
Der Hauptsatz der Algebra
Der Hauptsatz der Algebra
Der Satz und seine Geschichte
Reelle Nullstellen reeller Polynome
Komplexe Nullstellen komplexer Polynome
Satz (Kurzfassung)
Jedes komplexe Polynom vom Grad n hat genau n komplexe Nullstellen.
Sturm 1829/1835: reelle Nullstellen reeller Polynome
Cauchy-Index für reelle Polynome
Cauchys Inversionsformel
Sturmsche Ketten
Satz (Langfassung)
Sei R der Körper der reellen Zahlen und sei C = R[i] mit i2 = −1.
Dann gilt: Für jedes Polynom
Sturm 1836: komplexe Nullstellen komplexer Polynome
Cauchy-Index für komplexe Polynome
Die Produktformel
Homotopie-Invarianz
F = Z n + c1 Z n−1 + · · · + cn−1 Z + cn
mit c1 , . . . , cn−1 , cn ∈ C existieren z1 , z2 , . . . , zn ∈ C so dass
F = (Z − z1 )(Z − z2 ) · · · (Z − zn ).
Zusammenfassung und Ausblick
Nahe liegende Fragen:
Gibt es einen elementaren, geometrisch ansprechenden Beweis?
Bibliographie:
The Fundamental Theorem of Algebra made effective:
an elementary real-algebraic proof via Sturm chains.
Kann man die Voraussetzung abschwächen? Welche geordneten Körper?
Kann man die Schlussfolgerung verstärken? Zu einer effektiven Version?
www-fourier.ujf-grenoble.fr/˜eiserm/publications.html#roots
3/30 §1.1
4/30
Einige Daten zum Hauptsatz der Algebra
Scipione del Ferro (1456-1526)
Niccolò Fontana Tartaglia (1500-1557)
Gerolamo Cardano (1501-1576)
Lodovico Ferrari (1522-1565)
...
Niels Henrik Abel (1802-1829)
Évariste Galois (1811-1832)
Beweisstrategien
Drei Beweisstrategien zum Hauptsatz der Algebra:
Mathematischer Tourismus
1
Albert Girard (1595-1632)
René Descartes (1596-1650)
Gottfried Leibniz (1646-1716)
...
Leonhard Euler (1707-1783)
Jean le Rond d’Alembert (1717-1783)
Joseph-Louis Lagrange (1736-1813)
Pierre-Simon Laplace (1749-1827)
...
Carl Friedrich Gauß (1777-1855)
Algebraische Topologie, mittels einer Form der Umlaufzahl
(Gauß 1799/1816, Cauchy 1831, Sturm–Liouville 1836)
Was ist an diesem reell-algebraischen Beweis interessant?
4 Er ist elementar: Arithmetik und Zwischenwertsatz reeller Polynome.
4 Alle Argumente gelten über jedem reell abgeschlossenem Körper.
4 Der Beweis ist konstruktiv und erlaubt das Auffinden der Nullstellen.
4 Der Algorithmus ist einfach zu implementieren und ausreichend effizient.
4 Formaler, computer-verifizierbarer Beweis: Hauptsatz + Algorithmus.
Kurzum: minimale Voraussetzungen, maximale Information.
5/30 §1.1
Von den reellen Zahlen zu reell abgeschlossenen Körpern
Proposition
Es sei (R, +, ·, ≤) ein reell abgeschlossener Körper.
Die Anordnung ist eindeutig bestimmt durch a ≥ 0 ⇔ ∃r ∈ R : r2 = a.
Für jeden geordneten Körper (R, +, ·, ≤) sind äquivalent:
1
(R, ≤) erfüllt die Supremums-Bedingung.
2
Jedes Intervall [a, b] ⊂ R ist kompakt.
3
Jedes Intervall [a, b] ⊂ R ist zusammenhängend.
4
Jede stetige Funktion f : R → R erfüllt den Zwischenwertsatz:
f (a)f (b) < 0 =⇒ ∃x ∈ R : (x − a)(x − b) < 0 ∧ f (x) = 0.
6/30
Ergänzung: reell abgeschlossene Körper
Satz (Charakterisierung der reellen Zahlen)
Beweis. Für jedes a ∈ R≥0 hat X 2 − a eine Nullstelle in [0, 1 + a].
Somit hat jedes a ∈ R≥0 eine Quadratwurzel r ∈ R≥0 , r2 = a.
Satz (reeller Abschluss)
Jeder angeordnete Körper (K, +, ·, ≤) erlaubt einen reellen Abschluss,
d.h. eine algebraische Erweiterung R ⊃ K die reell abgeschlossen ist.
Zwischen zwei reellen Abschlüssen existiert genau ein Isomorphismus.
Zwischen je zwei solchen Körper besteht genau ein Isomorphismus.
Ein solcher Körper existiert: wir nennen ihn den Körper der reellen Zahlen.
Dies steht im Gegensatz zum algebraischen Abschluss!
Dies benötigt die Logik zweiter Stufe. Es reicht aber viel weniger:
Satz (Artin–Schreier 1927)
Definition (reell abgeschlossener Körper)
Sei R ein Körper und sei C ⊃ R ein algebraisch abgeschlossener Körper.
Wenn 1 < dimR (C) < ∞, dann ist R reell abgeschlossen und C = R[i].
Ein geordneter Körper (R, +, ·, ≤) heißt reell abgeschlossen
wenn jedes Polynom P ∈ R[X] den Zwischenwertsatz über R erfüllt.
Für uns bilden reell abgeschlossene Körper die minimale Voraussetzung.
Beispiele: die reellen Zahlen R, die reell-algebraischen Zahlen Qc ⊂ R, . . .
Satz (Tarski 1951, Seidenberg 1954)
Jeder geordnete Körper erlaubt einen reellen Abschluss. Beispiel: R(X)c .
§1.2
Algebra, mittels symmetrischer Funktionen oder Galois-Theorie
(Euler 1749, Lagrange 1772, Laplace 1795, Gauß 1816);
3
Der hier vorgestellte Beweis ist reell-algebraisch, zwischen 2 und 3.
Augustin Louis Cauchy (1789–1857)
Charles-François Sturm (1803–1855)
§1.1
Analysis, mittels Kompaktheit, Integration, Stokes, . . .
(d’Alembert 1746, Argand 1814, Cauchy 1820);
2
7/30 §1.2
Je zwei reell abgeschlossene Körper haben dieselbe elementare Theorie.
8/30
Reelle Nullstellen reeller Polynome
Umlaufzahl: geometrische Motivation
Wie bestimmt man die Anzahl der Nullstellen von P ∈ R[X] in [a, b]?
Sei F ∈ C[Z] ein Polynom und sei Γ ⊂ C ein Rechteck.
Beispiel: F = Z 5 − 5Z 4 − 2Z 3 − 2Z 2 − 3Z − 12 und Γ = [−1, 1]2 .
Im
Im
d
a
b
a
F(b)
c
F(a)
b
Re
Re
F(d)
Teilantworten von Descartes (1596-1650), Fourier (1768-1830), . . .
a
Sturmscher Satz (1829/35)
Wenn R reell abgeschlossen ist, dann gilt
˛
˘
¯
# x ∈ [a, b] ˛ P (x) = 0
=
`
´
Vab S0 , S1 , . . . , Sn .
Wenn Γ groß ist, dann gilt ind∂Γ (F ) = ind∂Γ (Z n ) = n.
Wenn Γ klein ist, dann gilt ind∂Γ (F ) = ind∂Γ (const) = 0.
Die Umlaufzahl ändert sich nur, wenn 0 durchlaufen wird.
Für Grad n ≥ 1 muss also F eine Nullstelle haben.
Sturms Satz erlaubt das Zählen und Auffinden aller reellen Nullstellen:
3
2
1
2
1
1
1
2
1
1
1
11
1
Problem: Wie kann man die Umlaufzahl streng definieren?
1
§1.2
9/30 §1.3
Umlaufzahl: algebraische Eigenschaften
2
Sei R ein reell abgeschlossener Körper und sei C = R[i], i = −1.
Sei Ω die Menge stückw. polynomialer Schleifen γ : [0, 1] → C∗ , γ(0) = γ(1).
Hat man einen Index im obigen Sinne konstruiert, dann folgt daraus
der klassische Homotopie-Beweis des Hauptsatzes der Algebra:
Wir wählen Γ = [−1, +1] × [−1, +1] ⊂ C. Zu jedem Polynom
F = Z n + cn−1 Z n−1 + · · · + c1 Z + c0
Es gibt eine Abbildung ind : Ω → Z mit folgenden Eigenschaften:
0
Berechnung: ind(γ) berechnet sich mittels Sturms Algorithmus über R.
1
Normalisierung: Für jedes Rechteck Γ ⊂ C gilt
(
1 falls 0 ∈ Int Γ,
ind(∂Γ) =
0 falls 0 ∈ C r Γ.
2
Multiplikativität: ind(γ1 · γ2 ) = ind(γ1 ) + ind(γ2 ).
3
Homotopie-Invarianz: ind(γ0 ) = ind(γ1 ) falls γ0 ∼ γ1 in C∗ .
10/30
Ergänzung: Homotopie-Beweis des Hauptsatzes der Algebra
Satz
konstruieren wir eine Homotopie H : [0, 1] × ∂Γ → C wie folgt.
Für t > 0 setzen wir
Ht (z) = tn F (z(1 − t)/t).
Dies setzt sich stetig nach t = 0 fort:
Ht (z) = (1 − t)n z n + cn−1 (1 − t)n−1 tz n−1 + · · · + c1 (1 − t)tn−1 z + c0 tn .
Wir erhalten so eine Homotopie zwischen H0 (z) = z n und H1 (z) = c0 in C.
Die Schwierigkeit liegt in der Konstruktion einer solchen Abbildung!
Überlagerungstheorie, angewendet auf exp : C →
→ C∗ mit Gruppe Z.
∼
Fundamentalgruppe, ind : π1 (C∗ , 1) −
→ Z via Seifert–van Kampen.
∼
Homologietheorie, ind : H1 (C∗ ) −
→ Z via Eilenberg–Steenrod.
Differentialtopologie, Satz von Sard und Abbildungsgrad.
R dz
1
Komplexe Analysis, analytischer Index ind(γ) = 2iπ
.
γ z
Reelle Algebra, algebraischer Index ind : Ω → Z via sturmsche Ketten.
§1.3
F(c)
Wir definieren ind∂Γ (F ) als die Umlaufzahl von F |∂Γ um 0.
Hierbei ist Vab die Differenz der Vorzeichenwechsel in a und in b.
Die Kette S0 , S1 , . . . , Sn entsteht aus S0 = P und S1 = P 0 durch iterierte
euklidische Division: Sk−1 = Qk Sk − Sk+1 bis schließlich Sn+1 = 0.
5
b
Geometrische Beweisidee (Gauß 1799):
Wenn F keine Nullstellen in C hat, dann ist H eine Homotopie in C∗ .
Der Index ergibt dann n = ind∂Γ (H0 ) = ind∂Γ (H1 ) = 0.
Umgekehrt, für n ≥ 1 muss F mindestens eine Nullstelle z1 ∈ C haben.
Wir faktorisieren F = (Z − z1 )F1 und schließen per Induktion über n.
11/30 §1.3
12/30
Komplexe Nullstellen komplexer Polynome
Einige Daten zu konstruktiven und algorithmischen Aspekten
Reell-algebraischer Index
Sei R ein reell abgeschlossener Körper und sei C = R[i], i2 = −1.
Sturm 1829/35: Mémoire sur la résolution des équations numériques
Wir können einen Index mit den nötigen Eigenschaften konstruieren:
ff

stückweise polynomiale
→Z
ind :
Schleifen γ : [0, 1] → C∗
Cauchy 1831/37: Calcul des résidus et calcul des indices
Sturm–Liouville 1836: Démonstration d’un théorème de M. Cauchy
Rezeption in Lehrbüchern
Serret 1877: Cours d’algèbre supérieure (Sturm reell und komplex)
Dieser liefert einen effektiven Beweis des Hauptsatzes der Algebra:
Weber 1898: Lehrbuch der Algebra (Sturm reell, kaum komplex)
ind∂Γ (F ) zählt die Nullstellen von F in Γ. (Sturmscher Satz / C)
Runge 1898: Encyklopädie (Sturm reell und komplex)
ind∂Γ (F ) = deg(F ) für Γ ausreichend groß. (Cauchy-Schranke)
Index und Abbildungsgrad
Kronecker 1869: Systeme von Functionen mehrer Variabeln
Das Zählen erlaubt auch das Auffinden aller komplexen Nullstellen:
1
Brouwer 1912: Abbildungen von Mannigfaltigkeiten
Weyl 1924: Fundamentalsatz der Algebra
0
1
0
0
1
2
0
1
1
0
2
0
0
Algorithmen und Implementationen
8
4
Lehmer 1969: Search procedures for polynomial equation solving
3
Wilf 1978: Bisection algorithm for computing zeros of polynomials
Schönhage 1982: The fundamental theorem of algebra in terms of
computational complexity
(Nach ausreichender Näherung geht man zum Newton-Verfahren über.)
§1.3
13/30 §1.3
Vorzeichenwechsel
Wie bestimmt man die Anzahl der Nullstellen von P ∈ R[X] in [a, b]?
Viele Mathematiker haben diese Frage untersucht. Zwei berühmte Beispiele:
Im Folgenden sei (R, +, ·, ≤) ein geordneter Körper.
Wir zählen Vorzeichenwechsel V (s0 , s1 ) zwischen s0 , s1 ∈ R:
V (+, −) = V (−, +) = 1,
Ê Die Regel von Descartes beschränkt die Anzahl der positiven Nullstellen:
V (+, +) = V (−, −) = V (0, 0) = 0,
Satz (Regel von Descartes)
V (+, 0) = V (0, +) = V (−, 0) = V (0, −) = 12 .
Für jedes Polynom P = c0 + c1 X + · · · + cn X n in R[X] gilt
˛
˘
¯
# x ∈ R>0 ˛ P (x) = 0
≤ V̂ (c0 , c1 , . . . , cn ).
Definition
mult
Die Anzahl der Vorzeichenwechsel einer Folge (s0 , . . . , sn ) in R ist
V (s0 , . . . , sn ) :=
n
X
k=1
Ë Fourier hat diese Abschätzung auf beliebige Intervalle verallgemeinert:
n
X
˛
˛
1˛
V (sk−1 , sk ) =
sign(sk−1 ) − sign(sk )˛.
2
Satz (Regel von Fourier)
k=1
Für jedes Polynom P = c0 + c1 X + · · · + cn X n in R[X] gilt
˛
˘
¯
# x ∈ ]a, b] ˛ P (x) = 0
≤ V̂ab (P, P 0 , . . . , P (n) ).
Für eine Folge von Polynomen (S0 , . . . , Sn ) in R[X] setzen wir
`
´
`
´
Va S0 , . . . , Sn := V S0 (a), . . . , Sn (a) .
mult
Wenn P genau n Nullstellen in R hat, dann gilt Gleichheit für alle ]a, b] ⊂ R.
Für die Differenz in a, b ∈ R schreiben wir Vab := Va − Vb .
Vorteil: Die Abschätzung ist leicht zu berechnen.
Nachteil: Die so erhaltenen Schranken sind oft ungenau.
! Vgl. traditionelle Definition (Descartes, Fourier): man bildet die reduzierte
Folge ŝ aus s durch Weglassen aller Nullen und definiert V̂ (s) := V (ŝ).
§2.0
14/30
Die Regeln von Descartes und Fourier
15/30 §2.0
Dies war der Kenntnisstand vor Sturms bahnbrechender Arbeit 1829.
16/30
Cauchy-Index: Zählen reeller Polstellen
Cauchy-Index: Zählen reeller Nullstellen
Es erweist sich als vorteilhaft, rationale Funktionen f ∈ R(X)∗ zu betrachten.
+1
+1
+1
a
a
−1
Für f ∈ R(X)∗ gilt Inda (f 0 /f ) =
a
a
−1
Ind=+1
Proposition (logarithmische Ableitung)
+1
−1
Ind=−1
−1
Ind=0
Beweis. Wir faktorisieren f = (X − a)m g so dass g(a) ∈ R∗ .
` 0´
0
0
m
+ gg . Also Inda ff = sign(m).
Die Leibniz-Regel ergibt ff = X−a
Ind=0
Definition (Cauchy-Index)
Korollar (reelle Nullstellen reeller Polynome)
Wir definieren den Cauchy-Index von f ∈ R(X)∗ in a ∈ R durch
8
ε
>
<+1 falls lima f = +∞,
ˆ
˜
−
ε
Inda (f ) := 21 Ind+
−1 falls limεa f = −∞,
a (f )−Inda (f ) wobei Inda (f ) :=
>
:
0
sonst.
Der Index Indba (P 0 /P ) zählt die Nullstellen von P ∈ R[X]∗ in [a, b]:
“P0 ”
˛
˘
¯
# x ∈ [a, b] ˛ P (x) = 0
= Indba
.
P
Nullstellen auf dem Rand {a, b} zählen nur zur Hälfte.
Auf einem Intervall [a, b] ⊂ R setzen wir
X
Indab (f ) := 12 Inda+ (f ) +
Indx (f ) −
Problem: Kann man den Index berechnen ohne die Polstellen zu kennen?
1
2
Ind−
b (f ).
Beispiel: Der Zwischenwertsatz lautet nun Indba ( P1 ) = Vab (1, P ).
x∈]a,b[
Dies verlagert die Zählung vom Intervall [a, b] auf den Rand {a, b}.
Eigenschaften: Indba (f ) + Indcb (f ) = Indca (f ) und Indba (f ◦ τ ) = Indττ (b)
(a) (f ).
§2.1
17/30 §2.1
Cauchys Inversionsformel über einem reell abgeschlossenen Körper
Allgemeine Lösung: Sturmsche Kette zur Berechnung von Indba ( Q
).
P
Inversionsformel (Cauchy 1837)
Definition (sturmsche Kette)
Wenn P, Q ∈ R[X] keine gemeinsame Nullstelle in a oder b haben, dann
“Q”
“P ”
`
´
Indba
+ Indba
= Vab P, Q .
P
Q
Eine Folge (S0 , . . . , Sn ) in R[X] heißt sturmsche Kette auf [a, b] ⊂ R falls gilt:
Wenn Sk (x) = 0 für 0 < k < n und x ∈ [a, b], dann Sk−1 (x)Sk+1 (x) < 0.
Beweis. Wir können P 6= 0 und Q 6= 0 und ggT(P, Q) = 1 annehmen.
Für sturmsche Ketten gilt Indba
Korollar (der Inversionsformel)
Gemäß ZWS behalten P und Q ihr Vorzeichen also Vab (P, Q) = 0.
b
` ´
Indba Q
P
=
− 21
⇒ Va (P, Q) =
1
,
2
Proposition (euklidische Kettenbruchentwicklung)
Zu R
mit ggT(R, S) = 1 liefert der euklidische Algorithmus eine sturmsche
S
Kette S0 = S, S1 = R, . . . , Sn = 1, Sn+1 = 0 mit Sk−1 = Qk Sk − Sk+1 .
Vb (P, Q) = 1
` ´
Indba Q
= + 21 ⇒ Va (P, Q) = 12 , Vb (P, Q) = 0
P
a
` S1 ´
`S
´
`
´
+ Indba Sn−1
=Vab S0 , S1 , . . . , Sn−1 , Sn .
S0
n
Beweis. Die Inversionsformel bildet eine Teleskopsumme! Für n = 2:
“S ”
“S ”
“S ”
“S ”
`
´
1
0
2
1
Indba
+ Indba
+ Indba
+ Indba
= Vab S0 , S1 , S2 .
S0
S1
S1
S2
Ë Die Formel ist additiv bezüglich Unterteilung des Intervalls [a, b].
Es reicht daher, einen einzigen Pol zu betrachten: P (a) = 0 und Q(a) 6= 0.
a
18/30
Sturmsche Ketten
Ê Betrachten wir ein Intervall [a, b] das keine Wurzeln von P und Q enthält:
` ´
`P ´
Ohne Pole verschwinden die Indices Indba Q
und Indba Q
.
P
Folgerung: der sturmsche Satz
b
Für jedes Polynom P ∈ R[X] über einem reell abgeschlossenen Körper gilt
“P0 ”
˛
˘
¯
`
´
# x ∈ [a, b] ˛ P (x) = 0
= Indba
= Vab S0 , S1 , . . . , Sn .
P
! Die Indexzählung Ë gilt lokal um jeden Pol, auf [a, a + δ] und [a − δ, a] mit δ > 0.
Hierzu reicht die Stetigkeit der Polynome; dies gilt über jedem angeordneten Körper.
Das globale Argument Ê auf ganz [a, b] hingegen benötigt den Zwischenwertsatz!
§2.2
8
>
<+1 falls a eine Nullstelle von f ist,
−1 falls a eine Polstelle von f ist,
>
:
0
sonst.
19/30 §2.3
20/30
Umlaufzahl: algebraische Eigenschaften
Umlaufzahl: geometrische Motivation und algebraische Definition
Für F ∈ C[X] beschreibt γ : [0, 1] → C mit γ(x) = F (x) einen Pfad in C:
Sei R ein reell abgeschlossener Körper und sei C = R[i], i2 = −1.
Im
Wir wollen die algebraische Umlaufzahl konstruieren:
ff

stückweise polynomiale
→Z
ind :
Schleifen γ : [0, 1] → C∗
−1
+1
+1
−1
1
x=0
Normalisierung: Für jedes Rechteck Γ ⊂ C gilt
(
1 falls 0 ∈ Int Γ,
ind(∂Γ) =
0 falls 0 ∈ C r Γ.
Beobachtung
Der Index ind10 (F ) :=
2
Multiplikativität: ind(γ1 · γ2 ) = ind(γ1 ) + ind(γ2 ).
3
Homotopie-Invarianz: ind(γ0 ) = ind(γ1 ) falls γ0 ∼ γ1 in C∗ .
1
2
Ind10
` re F
im F
) zählt die Umläufe um 0.
`
´
Allgemeiner: für a, b ∈ C betrachte den Pfad γ(x) = F a + (b − a)x .
Algorithmischer Bonus: Berechnung mittels sturmscher Ketten.
Definition
Computer-Algebra statt Numerik: Alle Rechnungen sind exakt.
`
´
Für F ∈ C[Z] und a, b ∈ C setzen wir indba (F ) = ind10 F a + (b − a)X .
21/30 §3.1
§3.1
Umlaufzahl bezüglich eines Rechtecks
5
4
3
2
Beispiel: F = Z − 5Z − 2Z − 2Z − 3Z − 12 und Γ = [−1, +1] × [−1, +1].
Im
d
Für F = P + iQ und G = R + iS gilt F G = (P R − QS) + i(P S + QR).
Lemma (Produktformel)
F(b)
P R
Für je zwei rationale Funktionen Q
, S ∈ R(X)∗ gilt
“ P R − QS ”
“P ”
“R”
“ P
R”
Indba
= Indba
+ Indba
− Vab 1, +
.
P S + QR
Q
S
Q
S
F(a)
Re
F(d)
a
b
F(c)
Spezialfall: Für P = S und Q = R ist dies Cauchys Inversionsformel.
Den allgemeinen Fall beweist man genauso wie den Spezialfall.
Definition
Satz (Multiplikativität)
Für jedes Polynom F ∈ C[Z] und jedes Rechteck Γ ⊂ C setzen wir
Wenn F, G ∈ C[Z] keine Nullstellen in den Ecken von Γ ⊂ R2 haben, dann
ind∂Γ (F ) := indba (F ) + indcb (F ) + inddc (F ) + indad (F ).
ind∂Γ (F · G) = ind∂Γ (F ) + ind∂Γ (G).
Proposition (Normalisierung)
Es gilt ind∂Γ (Z − z0 ) =
22/30
Die Produktformel
Im
c
Re
§3.1
Re
x=1
Diese soll folgende Eigenschaften haben:
8
1
>
>
>
<1
2
1
>
>
>
:4
0
falls z0
falls z0
falls z0
falls z0
Korollar (Zählen komplexer Nullstellen zerfallender Polynome)
im Inneren von Γ liegt,
auf dem Rand von Γ liegt,
auf einer Ecke von Γ liegt,
im Äußeren von Γ liegt.
Angenommen F ∈ C[Z] zerfällt über C gemäß F = c(Z − z1 ) · · · (Z − zn ),
ohne Wurzeln auf den Ecken von Γ. Dann zählt ind∂Γ (F ) die Wurzeln in Γ.
! Wir müssen noch zeigen, dass über C jedes Polynom zerfällt.
23/30 §3.2
24/30
Zählen komplexer Nullstellen
Ergänzung: Beweis mittels sturmscher Ketten
Wir wollen zeigen: Wenn ind∂Γ (F ) > 0, dann F (z) = 0 für ein z ∈ Γ.
Sei F ∈ C[X, Y ] ohne Nullstellen auf Γ = [x0 , x1 ] × [y0 , y1 ].
Äquivalent hierzu: Wenn F (z) 6= 0 für alle z ∈ Γ, dann ind∂Γ (F ) = 0.
Wir betrachten S0 = im F und S1 = re F in C[X, Y ] = C[Y ][X].
Wir betrachten die Einbettung C[Z] ⊂ C[X, Y ] gemäß Z = X + iY .
Wir konstruieren S2 , . . . , Sn ∈ C[Y ][X] durch (pseudo-)euklidische Division:
Lemma (lokale Version)
c2k Sk−1 = Qk Sk − Sk+1 ,
Wenn F ∈ C[X, Y ] in (x, y) ∈ R2 nicht verschwindet, dann gibt es δ > 0
so dass ind∂Γ (F ) = 0 für alle Γ ⊂ [x − δ, x + δ] × [y − δ, y + δ].
degX Sk+1 < degX Sk ,
ck ∈ C[Y ],
degX Sn = 0,
Sn ∈ C[Y ].
Ê Wenn Sn auf [y0 , y1 ] keine Nullstellen hat, dann gilt Sturm:
Beweis. Stetigkeit (explizites δ, über beliebigem angeordneten Körper).
Beweis. Speziell über den reellen Zahlen R: Kompaktheits-Argument.
Allgemein über reell abgeschlossenen Körpern: sturmscher Satz.
wenn Sk (x, y) = 0 in (x, y) ∈ Γ, dann Sk−1 (x, y)Sk+1 (x, y) < 0.
˛
`
´
` re F ˛
´
x1 re F ˛
˛ X = x1
Y = y0 + Indyy10 im
2 indC
∂Γ (F ) = + Indx0 im F
F
˛
` re F ˛
`
´
´
˛ Y = y1 + Indyy0 re F ˛ X = x0
+ Indxx01 im
1 im F
F
˛
˛
´
`
`
´
= + Vxx01 S0 , . . . , Sn ˛ Y = y0 + Vyy01 S0 , . . . , Sn ˛ X = x1
˛
˛
´
´
x0 `
y0 `
˛
˛
+ Vx1 S0 , . . . , Sn Y = y1 + Vy1 S0 , . . . , Sn X = x0 = 0.
Korollar (Zählen komplexer Nullstellen beliebiger Polynome)
Ë Schlimmstenfalls endliche Menge kritischer Werten y ∈ [y0 , y1 ].
Satz (globale Version)
Wenn F ∈ C[X, Y ] auf Γ ⊂ R2 nicht verschwindet, dann gilt ind∂Γ (F ) = 0.
Analoges Argument in C[X][Y ]: endliche Menge kritischer Werte x ∈ [x0 , x1 ].
Für jedes F ∈ C[Z] zählt der Index ind∂Γ (F ) die Wurzeln von F in Γ.
Um einen kritischen Punkt (x, y) wenden wir das Lemma (lokale Version) an.
Beweis. Sei F = (Z − z1 ) · · · (Z − zm )G so dass G keine Nullstellen in C hat.
Wir benutzen die Multiplikativität des Index, und obigen Satz für G.
§3.3
Außerhalb kritischer Punkte wenden wir das globale Ergebnis Ê an.
25/30 §3.3
Grobe Lokalisierung der Nullstellen
26/30
Homotopie-Invarianz
Definition (Cauchy-Schranke)
Satz (Homotopie-Invarianz)
Sei F = Z n + cn−1 Z n−1 + · · · + c1 Z + c0 in C[Z].
Wir setzen M := max{|c0 |, . . . , |cn−1 |} und ρF := 1 + M .
Sei F ∈ C[T, Z]. Angenommen für jedes t ∈ [0, 1] hat das Polynom
Ft ∈ C[Z] keine Nullstellen auf ∂Γ. Dann gilt ind∂Γ (F0 ) = ind∂Γ (F1 ).
Satz (grobe Lokalisierung der Nullstellen)
Beweis. Die Abwesenheit von Nullstellen auf [0, 1] × [a, b] impliziert
Für jedes z ∈ C mit |z| ≥ ρF gilt |F (z)| ≥ 1.
indba (F | T = 0) − indba (F | T = 1) = ind10 (F | Z = a) − ind10 (F | Z = b).
Also liegen alle komplexen Nullstellen von F in B(ρF ) = {z ∈ C | |z| < ρF }.
Die Summe über alle vier Kanten von Γ ergibt ind∂Γ (F0 ) − ind∂Γ (F1 ) = 0.
Beweis. Der Satz gilt für F = Z n : hier ist M = 0 und ρF = 1.
Im Weiteren können wir also M > 0 und ρF > 1 annehmen.
Korollar
Sei z ∈ C so dass |z| ≥ ρF , also |z| − 1 ≥ M . Hier finden wir
Für F ∈ C[Z]∗ und Γ ⊃ B(ρF ) gilt ind∂Γ (F ) = deg F .
|F (z) − z n | = |c0 + c1 z + · · · + cn−1 z n−1 | ≤ |c0 | + |c1 ||z| + · · · + |cn−1 ||z n−1 |
Beweis. Sei F = Z n + cn−1 Z n−1 + · · · + c0 ein Polynom vom Grad n.
Ft = Z n + t(cn−1 Z n−1 + · · · + c0 ) deformiert F1 = F zu F0 = Z n .
Die Cauchy-Schranke ρt = 1 + tM schrumpft von ρ1 = ρF zu ρ0 = 1.
Somit hat Ft keine Nullstelle auf ∂Γ, und ind∂Γ (F1 ) = ind∂Γ (F0 ) = n.
n
−1
≤ M + M |z| + · · · + M |z|n−1 = M |z|
≤ |z|n − 1.
|z|−1
Schließlich erhalten wir
|z n | = |z n − F (z) + F (z)| ≤ |z n − F (z)| + |F (z)|,
und daraus
|F (z)| ≥ |z n | − |F (z) − z n | ≥ |z|n − (|z|n − 1) = 1.
§3.3
Qk ∈ C[Y ][X],
Dies beweist den Hauptsatz: das Rechteck Γ enthält n Nullstellen von F .
27/30 §3.3
28/30
Zusammenfassung und Ausblick
Über reell abgeschlossenen Körpern können wir einen Index konstruieren:
ff

stückweise polynomiale
→ Z.
ind :
Schleifen γ : [0, 1] → C∗
Dieser erlaubt einen elementaren und effektiven Beweis des Hauptsatzes.
Algebraische Grad-Schranken
Gilt R reell n-abgeschlossen ⇐⇒ R[i] algebraisch n-abgeschlossen?
Die Implikation “⇒” gilt in kleinen Graden. Die Umkehrung “⇐” ist klar.
Algorithmische Optimierung: asymptotische Komplexität
Auffinden der Nullstellen eines Polynoms vom Grad n:
algebraisch: Õ(n4 ); numerisch: Õ(n3 ), Schönhage 1982.
Vielen Dank für Ihre Aufmerksamkeit!
Wie kann der algebraische Kalkül noch effizienter gemacht werden?
[email protected]
www-fourier.ujf-grenoble.fr/˜eiserm
Algebraischer Abbildungsgrad in höheren Dimensionen
Brouwerscher Fixpunktsatz über reell abgeschlossenen Körpern.
The Fundamental Theorem of Algebra made effective:
an elementary real-algebraic proof via Sturm chains
Algebraische Grad-Schranken?
§4.0
29/30 §4.0
Für Kommentare und Anregungen bin ich dankbar!
30/30