Technische Universität Dresden Fachrichtung Mathematik Institut für Analysis Der Satz von Tarski-Seidenberg und seine Anwendung in der Theorie der partiellen Differentialgleichungen Diplomarbeit zur Erlangung des ersten akademischen Grades Diplommathematiker vorgelegt von Name: Zanger geboren am: 27.04.1980 Vorname: Florian in: Pforzheim Tag der Einreichung: 21.09.2009 Betreuer: Prof. Dr. rer. nat. Rainer Picard 1 2 Inhaltsverzeichnis 0 Einleitung 1 Grundlagen 1.1 Polynome . . . . . . . . . . . . . . 1.2 Semialgebraische Mengen . . . . . . 1.3 Wohlfundierte Induktion . . . . . . 1.4 Integritätsringe und Satz von Gauß 2 Der 2.1 2.2 2.3 2.4 5 . . . . . . . . . . . . Satz von Tarski-Seidenberg Polynomdivision über Ringen . . . . . . Das Reduktionslemma . . . . . . . . . . Häufigkeiten . . . . . . . . . . . . . . . . Beweis des Satzes von Tarski-Seidenberg . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 Anwendung in der Theorie der partiellen Differentialgleichungen 3.1 Resultante und Diskriminante . . . . . . . . . . . . . . . . . . 3.2 Koeffizientenabhängigkeit der Nullstellen komplexer Polynome 3.3 Untere Abschätzung positiver Polynome . . . . . . . . . . . . 3.4 Stetige Inversion linearer partieller Differentialoperatoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 9 13 18 20 . . . . 25 25 33 52 56 . . . . 67 67 75 97 109 4 Quantorenelimination mit dem Satz von Tarski-Seidenberg 117 Symbolverzeichnis 122 Index 126 Literaturverzeichnis 129 3 Inhaltsverzeichnis 4 0 Einleitung Im Jahr 1951 veröffentlichte Alfred Tarski einen Artikel mit dem Titel “A decision method for elementary algebra and geometry” [Tar]. Die darin bewiesene Aussage ist heute unter dem Namen Satz von Tarski-Seidenberg bekannt. Den Beweis hatte Tarski bereits 1930 gefunden (siehe [Tar, S. 301]1 ). Drei Jahre später, im Jahr 1954, veröffentlichte Abraham Seidenberg unter dem Titel “A new decision method for elementary algebra” [Sei] einen anderen Beweis des selben Satzes. Beide Beweise geben – die Titel der beiden Veröffentlichungen weisen darauf hin – Verfahren an, mit denen entschieden werden kann, ob gewisse Aussagen, die Tarski ,sentences of elementary algebra’ (siehe [Tar, S. 306]) nennt, wahr sind. Unter ,sentences of elementary algebra’ werden dabei diejenigen Aussagen verstanden, die in sinnvoller Weise aus Konstanten- und Variablensymbolen für reelle Zahlen, den Symbolen für die Operationen Addition, Multiplikation und Negation, den Symbolen für die Relationen <, > und =, den Symbolen für die Junktoren „und“, „oder“ und „nicht“ und den Symbolen für den All- und Existenzquantor zusammengesetzt sind und deren sämtliche Variablen quantifiziert sind. Tarski erwähnt in der Einleitung des oben erwähnten Artikels [Tar, S. 306], dass aus Kurt Gödels fundamentalen Ergebnissen aus dem Jahr 1930 [Göd] folgt, dass für eine sehr ähnliche Klasse von Aussagen – nämlich diejenige, die man erhält, wenn man in obiger Definition des Begriffs ,sentence of elementary algebra’ anstelle der Konstanten- und Variablensymbole für reelle Zahlen solche für natürliche Zahlen verwendet – kein solches Verfahren existiert. Dies sei jedoch nur der Unvollständigkeit2 halber erwähnt. 1 Diese und folgende Seitenangaben beziehen sich auf Tarski, Alfred: A decision method for elementary algebra and geometry. In: Givant, Steven; McKenzie, Ralph (Hrsg.): Alfred Tarski: Collected Papers Volume 3, Basel 1986, Birkhäuser Verlag, S. 299-367. Der Artikel erschien erstmals in: Tarski, Alfred: A decision method for elementary algebra and geometry, Berkley/Los Angeles 1951, University of California Press, 63 pp. 2 Zugegebenermaßen geht dieser Witz auf [Bül, S. 294] zurück. 5 0 Einleitung In der vorliegenden Arbeit wird der Satz von Tarski-Seidenberg nicht in der soeben beschriebenen ursprünglichen Form, sondern in der Form, in der er im Gebiet der reellen algebraischen Geometrie (wie zum Beispiel bei [Boc0, S. 23], [Boc1, S. 26] oder [Pre, S. 33]) eine Rolle spielt, auftauchen: Die Projektion einer jeden semialgebraischen Menge ist semialgebraisch. Unter semialgebraischen Mengen werden dabei diejenigen Teilmengen des Rn verstanden, die durch quantoren- und negationsfreie ,sentences of elementary algebra’ unter Verzicht auf die Forderung der Quantifiziertheit sämtlicher Variablen beschrieben werden (eine strengere Definition des Begriffs der semialgebraischen Menge steht auf Seite 14). Die Brücke zwischen dieser Formulierung und der ursprünglichen Form des Satzes von Tarski-Seidenberg wird in Kapitel 4 geschlagen. In Kapitel 2 wird der Satz von Tarski-Seidenberg bewiesen. Der dort geführte Beweis ist der, den man in Kurzform im Anhang von [Hör, S. 364-367] und bei [Boc0, S. 15-24] oder dessen englischer Übersetzung [Boc1, S. 17-27] finden kann. Er geht Lars Hörmander zufolge (siehe [Hör, S. 371]) auf Paul Cohen zurück, der diesen abgesehen vom schwer zugänglichen3 mimeographierten Manuskript [Coh] nie veröffentlicht haben soll und besteht wie die beiden bereits erwähnten Beweise in der Angabe eines Verfahrens – diesmal zur Bestimmung der semialgebraischen Beschreibung der Projektion einer durch deren Beschreibung gegebenen semialgebraischen Menge. Tarski thematisiert in seiner Arbeit [Tar, S. 308] die Möglichkeit der Konstruktion einer Maschine, die das von ihm angegebene Verfahren beherrscht und damit prinzipiell in der Lage wäre, jegliche in Form einer ,sentence of elementary algebra’ gestellte Frage zu beantworten. Ebenso ist es möglich, eine Maschine zu konstruieren, d. h. ein Programm zu schreiben, das bei gegebener semialgebraischer Beschreibung einer Menge eine semialgebraische Beschreibung ihrer Projektion berechnet. Das Interesse einer solchen Implementierung könnte jedoch nicht von praktischer Natur sein, da ein solches Programm, wie man beim Lesen des Beweises feststellt, die Projektion selbst relativ einfach beschriebener Mengen nicht in überschaubarer Zeit zu berechnen im Stande wäre. Dieser Umstand kann nicht als Schwäche von Cohens Beweis ausgelegt werden, da Fischer und Rabin gezeigt haben (der Beweis ist bei [Koz, S. 146-150] zu finden), dass das durch den Satz von Tarski-Seidenberg gelöste Entscheidungsproblem schwer für die Komplexitätsklasse NEXPTIME der nichtdeterministisch in Exponentialzeit entscheidbaren Sprachen ist. In der vorliegenden Arbeit wird der Beweis des 3 6 Laut Aussage der Sächsischen Landes- und Universitätsbibliothek ist dieses Manuskript nur direkt in der Stanford University einsehbar. Satzes von Tarski-Seidenberg sehr viel ausführlicher geführt als in den oben angegebenen Büchern, wo er nur vier bis fünf Seiten einnimmt. Ein weiterer Unterschied zu den erwähnten Veröffentlichungen besteht in der Verwendung einer abgewandelten Form der Polynomdivision (siehe Abschnitt 2.1), die die Induktion in Abschnitt 2.4 vereinfacht. Kapitel 3 beschäftigt sich dann mit der Anwendung des Satzes von Tarski-Seidenberg in der Theorie der partiellen Differentialgleichungen. Sehr wahrscheinlich ist Hörmander der Erste, der ihn dort benutzt hat (siehe [Hör, S. 371]). Mit dem Satz von Tarski-Seidenberg kann unter zusätzlicher Verwendung von Aussagen über die Koeffizientenabhängigkeit der Nullstellen komplexer Polynome folgende Behauptung, die auf den ersten Blick trivial erscheint, weil sie es für den Fall n = 1 auch tatsächlich ist, gezeigt werden: Jede auf Rn positive Polynomfunktion kann von unten durch eine Funktion −N Rn 3 x 7→ C 1 + |x|2 mit C > 0 und N ∈ N abgeschätzt werden. Der Beweis dieser Aussage in der vorliegenden Arbeit ist ein anderer als der bei [Hör, S. 368] und [Pic] geführte. Er kommt ohne die Zerlegung des Definitionsbereichs semialgebraischer Funktionen in Teilintervalle aus. In Anschluss daran wird kurz skizziert, wie die untere Abschätzung positiver Polynome bei [Pic] zur stetigen Inversion linearer partieller Differentialoperatoren angewendet wird. Nachdem damit das Ziel der Arbeit erreicht ist, gibt Kapitel 4 einen kurzen Einblick in die Rolle des Satzes von Tarski-Seidenberg bei der Quantorenelimination. Danksagung. Ich danke meinen Eltern für ihr Vertrauen und die bedingungslose Unterstützung, mit der sie mein Studium und diese Arbeit ermöglicht haben. 7 0 Einleitung 8 1 Grundlagen 1.1 Polynome Bemerkung 1.1.1. Da es zur Bezeichnung der Menge der nichtnegativen ganzen Zahlen verschiedene Konventionen gibt, trägt es zur Vermeidung von Missverständnissen bei, wenn hier erwähnt wird, dass in dieser Arbeit das Symbol N für diese Menge verwendet und ihre Elemente als natürliche Zahlen bezeichnet werden. Insbesondere sind also hier die Aussagen 0 ∈ N und „0 ist eine natürliche Zahl“ wahr. In erster Linie zur Vereinfachung der Notation betrachten wir die natürlichen Zahlen als auf die von John von Neumann1 vorgeschlagene Weise konstruiert. Das heißt, die Zahl 0 und die leere Menge ∅ sind ein und dasselbe Objekt und der Nachfolger n + 1 einer jeden natürlichen Zahl n ist die Menge n ∪ {n}. Daraus ergibt sich, dass für jede natürliche Zahl n ∈ N die Identität n = {k ∈ N; k < n} gilt. Definition 1.1.2. Sei R ein kommutativer Ring mit Eins2 und n ∈ N. Dann nennen n wir eine Funktion p ∈ R(N ) Polynom in n Variablen über R, wenn der Träger von p, d. h. die Menge3 spt (p) := [R\ {0}] p endlich ist. 1 Siehe [Mes, S. 274]. Unter einem kommutativen Ring mit Eins wird in dieser Arbeit ein mindestens zweielementiger kommutativer Ring mit Eins verstanden oder anders gesagt, es soll 1 6= 0 gelten oder noch anders gesagt, der Ring soll vom Ring {0} verschieden sein. 3 Ist r eine Relation, so verstehen wir unter dem Nachbereich von r die Menge R (r) := {y; ∃a : (a, y) ∈ r} und unter dem Vorbereich von r die Menge D (r) := {x; ∃a : (x, a) ∈ r}. Ist M eine Menge, so verwenden wir die Schreibweisen r [M ] := {y; ∃m ∈ M : (m, y) ∈ r} für den Nachbereich von M unter r und [M ] r := {x; ∃m ∈ M : (x, m) ∈ r} für den Vorbereich von M unter r. Eine Relation r heißt rechtseindeutig, wenn sie die Aussage ∀x, a, b : ((x, a) ∈ r ∧ (x, b) ∈ r ⇒ a = b) erfüllt. Eine rechtseindeutige Relation ist also nichts anderes als eine Funktion. Ist r rechtseindeutig, so ergibt sich, dass r [M ] = {r (m) ; m ∈ M ∩ D (r)} das Bild von M unter r und [M ] r = {x ∈ D (r) ; r (x) ∈ M } das Urbild von M unter r ist. In Definition 1.1.2 ist demzufolge [R\ {0}] p eine kurze Schreibweise für {α ∈ Nn ; pα 6= 0}. Der Träger eines Polynoms ist also die Menge der Indizes seiner nichtverschwindenden Koeffizienten. 2 9 1 Grundlagen Für die Menge der Polynome in n Variablen über R schreiben wir4 Rhni := {p; p Polynom in n Variablen über R} . Die Summe und das Produkt zweier Polynome p und q in n Variablen über R sind definiert als die Polynome p + q := (pα + qα )α∈Nn und p q := X . pα qβ α+β=γ γ∈Nn Weil mit diesen beiden Operationen die Menge der Polynome in n Variablen über R ein kommutativer Ring mit Eins ist, nennt man Rhni einen Polynomring. Bemerkung 1.1.3. Ist R ein kommutativer Ring mit Eins und S ein Oberring von R, so ist jedes Polynom über R ein Polynom über S. Definition 1.1.4. Jedem Polynom p in n Variablen über einem kommutativen Ring R mit Eins entspricht eine Funktion von Rn nach R, die wir mit p̂R bezeichnen, durch p̂R := Rn 3 x 7→ X p α xα α∈spt(p) definieren und die dem Polynom p zugeordnete Polynomfunktion auf Rn nennen. Ist S ein echter Oberring von R, so sind die Polynomfunktionen p̂R und p̂S voneinander verschieden. Wir werden im Folgenden jedoch trotzdem meist auf die Präzisierung des Ringes verzichten und statt p̂R kurz p̂ schreiben, wenn aus dem Zusammenhang klar ist, welcher Ring gemeint ist. Eine Funktion f ∈ R(R gibt, sodass f = p̂. n) wird Polynomfunktion auf Rn genannt, wenn es p ∈ Rhni Die Menge5 \ := {p̂; p ∈ Rhni} [Rhni] ist die Menge aller Polynomfunktionen auf Rn . 4 5 Eine sehr gängige Bezeichnung für die Menge Rhni lautet R [X0 , . . . , Xn−1 ]. \ gerade das Bild der Fasst man das Symbol b als die Funktion Rhni 3 p 7→ p̂ auf, so ist [Rhni] Menge Rhni unter dieser Funktion. Die Schreibweise entspricht also der in Fußnote 3 auf der vorherigen Seite gemachten Definition des Nachbereichs einer Menge unter einer Relation. 10 1.1 Polynome Lemma 1.1.5. Seien p, q ∈ Rhni. Dann gelten die Gleichungen p[ + q = p̂ + q̂ und pcq = p̂ q̂. Beweis. Für alle x ∈ Rn gilt p[ + q (x) = (p + q)α xα = X α∈spt(p+q) p α xα + X α∈spt(p) X qα xα = (p̂ + q̂) (x) α∈spt(q) und X pcq (x) = (p q)γ xγ = X X α∈spt(p) p α p β xγ = γ∈spt(p q) α+β=γ γ∈spt(p q) X p α xα X qβ xβ = (p̂ q̂) (x) . β∈spt(q) Definition 1.1.6. Für6 k ∈ n sei der Grad eines Polynoms p ∈ Rhni bezüglich seiner k-ten Variablen durch degk p := sup {αk ; α ∈ spt (p)} definiert. Er beträgt −∞, wenn die Menge, über die das Supremum gebildet wird, leer ist. Dies ist genau dann der Fall, wenn p das Nullpolynom ist. Für den Fall n = 1, d. h. für den Fall, dass p ein Polynom in nur einer Variablen ist, schreiben wir auch deg anstelle von deg0 . Ebenfalls im Fall n = 1 definieren wir die Koeffizientenzahl (englisch: number of coefficients) von p als noc p := min {r ∈ N; spt (p) ⊆ r} . Damit gilt für alle p ∈ Rh1i \ {0} die Gleichung noc p = deg p + 1. Die Koeffizientenzahl eines Polynoms p ∈ Rh1i mit spt (p) ∈ N ist gleich der Anzahl seiner nichtverschwindenden Koeffizienten.7 6 Aufgrund von Bemerkung 1.1.1 auf Seite 9 ist k ∈ n eine kurze Schreibweise für k ∈ N, 0 ≤ k < n. Wir werden noch oft Gebrauch von ihr machen. 7 Die Definitionen 1.1.2 und 1.1.4 sind auch im Fall n = 0 sinnvoll. Dann gilt N0 = N∅ = 0 {α ⊆ ∅ × N; α rechtseindeutig} = {∅} = 1 und daher R(N ) = R1 . Weiter ergibt sich Rh0i = R1 . Für n = 0 ist nicht nur die Addition, sondern auch die Multiplikation in Rh0i punktweise. Für alle p ∈ Rh0i ist p̂ ∈ R1 und, wenn man für x ∈ R0 = {0} und α ∈ N0 = {0} die Potenz xα = 00 11 1 Grundlagen Jedes Polynom über R in n + 1 Variablen kann auch als Polynom in nur einer Variablen mit Koeffizienten aus Rhni aufgefasst werden. Folgende Definition ermöglicht diese Umdeutung: Definition 1.1.7. Seien n ∈ N, R ein kommutativer Ring mit Eins und p ∈ Rhn + 1i. Dann sei h1i p := p(α,β) ∈ (Rhni)h1i n α∈N β∈N das „als Polynom in einer Variablen mit Koeffizienten in Rhni aufgefasste Polynom p“. Ist p ∈ (Rhni)h1i ein Polynom in einer Variablen über dem Polynomring Rhni und x ∈ Rn , so entsteht aus p durch Einsetzen der Werte von x in die Koeffizientenpolynome von p ein Polynom in einer Variablen über R. Folgende Definition liefert dazu eine Notation: Definition 1.1.8. Seien n ∈ N, R ein kommutativer Ring mit Eins, p ∈ (Rhni)h1i und x ∈ Rn . Dann sei px̂ := (pcβ (x))β∈N ∈ Rh1i das Polynom, das aus p durch Einsetzen der Werte von x in die Koeffizientenpolynome von p hervorgeht. Mit Definition 1.1.4 auf Seite 10 erhält man dafür die explizitere Darstellung px̂ = (pcβ (x))β∈N = X α∈spt(pβ ) (pβ )α xα . β∈N Lemma 1.1.9. Seien n ∈ N, R ein kommutativer Ring mit Eins, p, q ∈ (Rhni)h1i und x ∈ Rn . Dann gilt px̂ + qx̂ = (p + q)x̂ und px̂ qx̂ = (p q)x̂ . Beweis. Für alle β ∈ N gilt (px̂ + qx̂ )β = pcβ (x) + qcβ (x) = mit 1.1.5 \ p\ β + qβ (x) = (p + q)β (x) = (p + q)x̂ \ = R1 . Definition als 1 erkennt, sogar p̂ = p. Als Menge der Polynomfunktionen ergibt sich [Rh0i] 1.1.6 macht für n = 0 keine Aussage, da es kein k ∈ 0 gibt. Dass es vorteilhaft ist, auch Polynome in null Variablen zu betrachten, zeigt sich spätestens bei der Definition der semialgebraischen Mengen auf Seite 14. 12 1.2 Semialgebraische Mengen und (px̂ qx̂ )β = pcβ (x) qcβ (x) = mit 1.1.5 \ p[ β qβ (x) = (p q)β (x) = (p q)x̂ . Lemma 1.1.10. Seien n ∈ N, R ein kommutativer Ring mit Eins, p ∈ Rhn + 1i, x ∈ Rn und y ∈ R. Dann gilt \ h1i ) (y) . p̂ (x, y) = (p x̂ Beweis. X pb (x, y) = α β p(α,β) x y = α∈Nn ,β∈N X X β∈N α∈Nn p h1i β α X p h1i α∈Nn ,β∈N β xα y β = α x α yβ = X \ h1i ) (x) y β = (p β β∈N X ph1i β∈N x̂ β \ h1i ) (y) . y β = (p x̂ 1.2 Semialgebraische Mengen In diesem Abschnitt wird der für den Satz von Tarski-Seidenberg zentrale Begriff der semialgebraischen Menge definiert. Definition 1.2.1. Unter dem Signum sgn (x) einer reellen Zahl x ∈ R wird die Zahl sgn (x) := x , wenn x 6= 0 0 , wenn x = 0 |x| verstanden. Es gilt sgn (x) ∈ {−1, 0, 1}. Definition 1.2.2. Zur Vereinfachung führen wir die Abkürzung8 Λ := {[ε] sgn; ε ⊆ {−1, 0, 1}} ein. Eine Menge λ ⊆ R nennen wir Achsenabschnitt, wenn λ ∈ Λ. 8 Wegen Fußnote 3 auf Seite 9 ist [ε] sgn = {x ∈ R; sgn (x) ∈ ε}. Also hat Λ genau acht Elemente, die Achsenabschnitte ∅, R>0 , {0}, R≥0 , R<0 , R6=0 , R≤0 und R. 13 1 Grundlagen Definition 1.2.3. Sei n ∈ N. Dann sei9 U (Rn ) := {[λ] p̂; p ∈ Rhni , λ ∈ Λ} die Menge der Urbilder von Achsenabschnitten unter Polynomfunktionen auf Rn . Eine Menge U ⊆ Rn nennen wir Polynom-Urbild, wenn U ∈ U (Rn ). Definition 1.2.4. Sei n ∈ N. Dann sei S (Rn ) := {∩E; E ⊆ U (Rn ) endlich} die Menge der endlichen Schnitte von Polynom-Urbildern. In diesem Zusammenhang interpretieren wir für E = ∅ den im Allgemeinen nicht definierten Schnitt ∩E = ∩∅ als ∩E = ∩∅ := Rn . Eine Menge S ⊆ Rn nennen wir Urbildschnitt, wenn S ∈ S (Rn ). Definition 1.2.5. Sei10 n ∈ N. Dann sei V (Rn ) := {∪E; E ⊆ S (Rn ) endlich} die Menge der endlichen Vereinigungen von Urbildschnitten. Eine Menge V ⊆ Rn heißt semialgebraisch, wenn V ∈ V (Rn ). Lemma 1.2.6. Die Vereinigung zweier semialgebraischer Mengen ist semialgebraisch. Beweis. Sei n ∈ N und seien V, W ∈ V (Rn ). Dann gibt es zwei endliche Mengen E, F ⊆ S (Rn ) von Urbildschnitten mit V = ∪E und W = ∪F. Da E ∪ F ⊆ S (Rn ) endlich, ist die Vereinigung V ∪ W = (∪E) ∪ (∪F) = ∪ (E ∪ F) ∈ V (Rn ) semialgebraisch. 9 Die Bezeichnung Rhni für die Menge der Polynome in n Variablen über R wird in Definition 1.1.2 auf Seite 9 und die Notation p̂ für die einem Polynom p zugeordnete Polynomfunktion in Definition 1.1.4 auf Seite 10 eingeführt. 10 Man beachte, dass der Fall n = 0 in den Definitionen der Polynom-Urbilder, Urbildschnitte und semialgebraischen Mengen nicht ausgeschlossen wird. Dies setzt voraus, dass auch Polynome in null Variablen definiert wurden (vgl. Fußnote 7 auf Seite 11). Semialgebraische Mengen in R0 = {∅} gibt es genau zwei: {∅} und ∅. Diese beiden spielen bei der Anwendung des Satzes von Tarski-Seidenberg zur Existenzquantorenelimination die Rolle von wahr und falsch (siehe Kapitel 4). 14 1.2 Semialgebraische Mengen Das folgende Lemma macht die zum gerade bewiesenen Lemma duale Aussage für Urbildschnitte. Sein Beweis unterscheidet sich nur geringfügig vom gerade geführten. Lemma 1.2.7. Der Schnitt zweier Urbildschnitte ist ein Urbildschnitt. Beweis. Sei n ∈ N und seien S, T ∈ S (Rn ). Dann gibt es zwei endliche Mengen E, F ⊆ U (Rn ) von Polynom-Urbildern mit S = ∩E und T = ∩F. Da E ∪F ⊆ U (Rn ) endlich, ist der Schnitt S ∩T = (∩E)∩(∩F) = ∩ (E ∪ F) ∈ S (Rn ) ein Urbildschnitt. Lemma 1.2.8. Der Schnitt zweier semialgebraischer Mengen ist semialgebraisch. Beweis. Sei n ∈ N und seien V, W ∈ V (Rn ). Dann gibt es zwei endliche Mengen E, F ⊆ S (Rn ) von Urbildschnitten mit V = ∪E und W = ∪F. Per Induktion über die Anzahl der Elemente von E sieht man, dass der Schnitt V ∩W semialgebraisch ist: Induktionsanfang: Für E = ∅ ist V ∩ W = (∪∅) ∩ W = ∅ ∩ W = ∅ = ∪∅ ∈ V (Rn ) semialgebraisch. Induktionsschritt: Für E 6= ∅ gibt es einen Urbildschnitt S ∈ E. Mit D := E\ {S} schreiben wir V ∩ W = (∪E) ∩ W = (S ∪ (∪D)) ∩ W = (S ∩ W ) ∪ ((∪D) ∩ W ) als Vereinigung zweier Mengen. Wenn wir zeigen, dass diese semialgebraisch sind, folgt mit Lemma 1.2.6 die Behauptung. n Die erste Menge S ∩ W ist gleich S ∩ (∪F) = ∪ S {z F} ; F ∈ F | ∩ o und damit ∈S(Rn ) nach Lemma 1.2.7 als endliche Vereinigung von Urbildschnitten semialgebraisch. Die zweite Menge (∪D) ∩ W ist nach Induktionsvoraussetzung (denn D hat ein Element weniger als E) semialgebraisch. Lemma 1.2.9. Seien n ∈ N, U ∈ U (Rn ) ein Polynom-Urbild und σ : n → n bijektiv. Dann gilt 1. [U ] ∈ U (Rn ), d. h. der Austausch kartesischer Faktoren Rn 3 x 7→ xσ(i) i∈n liefert ein Polynom-Urbild. 2. U × R ∈ U (Rn+1 ). 3. Rn \U ∈ U (Rn ), d. h. das Komplement ist ein Polynom-Urbild. 15 1 Grundlagen Beweis. Weil U ∈ U (Rn ), gibt es ein Polynom p ∈ Rhni und ein Polynom-Urbild λ ∈ Λ mit U = [λ] p̂. 1. Die Funktion q := (Nn 3 α 7→ pα◦σ−1 ) ist ein Polynom. Für alle x ∈ Rn gilt X q̂ (x) = α∈Nn X pα◦σ−1 α∈Nn (xi )αi = Y qα xσ−1 (i) α σ −1 (i) Y X pβ β∈Nn xσ−1 (i) i∈n xσ−1 (i) α σ −1 (i) = i∈n = i∈n p̂ qα α∈Nn i∈n Y X Y xσ−1 (i) βi = i∈n = p̂ x ◦ σ −1 und deshalb n o [λ] q̂ = {y; y ∈ Rn , q̂ (y) ∈ λ} = y; y ∈ Rn , p̂ y ◦ σ −1 ∈ λ = {x ◦ σ; x ∈ Rn , p̂ (x) ∈ λ} = (Rn 3 x 7→ x ◦ σ) [[λ] p̂] = Rn 3 x 7→ xσ(i) n was beweist, dass R 3 x 7→ xσ(i) i∈n i∈n [U ] Polynom-Urbild ist. pα 2. Die Funktion r := Nn × N 3 (α, β) 7→ 0 , wenn β = 0 sonst ist ein Polynom. Für alle x ∈ Rn und alle y ∈ R gilt r̂ (x, y) = X r(α,β) xα y β = (α,β)∈Nn ×N X pα xα = p̂ (x) α∈Nn und deshalb [λ] r̂ = {(x, y) ∈ Rn × R; r̂ (x, y) ∈ λ} = {(x, y) ∈ Rn × R; p̂ (x) ∈ λ} = {x ∈ Rn ; p̂ (x) ∈ λ} × R = [λ] p̂ × R = U × R, was beweist, dass U × R ∈ U (Rn+1 ). 3. Das Komplement R\λ ist ein Achsenabschnitt. Deshalb gilt Rn \U = Rn \ [λ] p̂ = [R\λ] p̂ ∈ U (Rn ) . 16 [U ] , 1.2 Semialgebraische Mengen Lemma 1.2.10. Seien n ∈ N, S ∈ S (Rn ) ein Urbildschnitt und σ : n → n bijektiv. Dann gilt 1. [S] ∈ S (Rn ), d. h. der Austausch kartesischer Faktoren Rn 3 x 7→ xσ(i) i∈n liefert einen Urbildschnitt. 2. S × R ∈ S (Rn+1 ). 3. Rn \S ∈ V (Rn ), d. h. das Komplement ist semialgebraisch. Beweis. Da S ∈ S (Rn ), gibt es eine endliche Menge E ⊆ U (Rn ) von PolynomUrbildern mit S = ∩E. 1. Die Menge Rn 3 x 7→ xσ(i) i∈n [S] = (Rn 3 x 7→ x ◦ σ) [∩E] = ∩ {(Rn 3 x 7→ x ◦ σ) [U ] ; U ∈ E} ist als Schnitt endlich vieler Mengen, die nach Lemma 1.2.9 Polynom-Urbilder und damit insbesondere Urbildschnitte sind, nach Lemma 1.2.7 ein Urbildschnitt. 2. Das kartesische Produkt S × R = (∩E) × R = ∩ {U × R; U ∈ E} ist aus dem selben Grund ein Urbildschnitt. 3. Das Komplement Rn \S = Rn \ (∩E) = ∪ {Rn \U ; U ∈ E} ist als Vereinigung endlich vieler Mengen, die nach Lemma 1.2.9 Polynom-Urbilder und damit insbesondere semialgebraisch sind, nach Lemma 1.2.6 semialgebraisch. Lemma 1.2.11. Seien n ∈ N, V ∈ V (Rn ) eine semialgebraische Menge und σ : n → n bijektiv. Dann gilt 1. [V ] ∈ V (Rn ), d. h. der Austausch kartesischer Faktoren Rn 3 x 7→ xσ(i) i∈n liefert eine semialgebraische Menge. 2. V × R ∈ V (Rn+1 ). 3. Rn \V ∈ V (Rn ), d. h. das Komplement ist semialgebraisch. 17 1 Grundlagen Beweis. Da V ∈ V (Rn ), gibt es eine endliche Menge E ⊆ S (Rn ) von Urbildschnitten mit V = ∪E. 1. Die Menge n R 3 x 7→ xσ(i) i∈n [V ] = (Rn 3 x 7→ x ◦ σ) [∪E] = ∪ {(Rn 3 x 7→ x ◦ σ) [S] ; S ∈ E} ist als Vereinigung endlich vieler Mengen, die nach Lemma 1.2.10 Urbildschnitte und damit insbesondere semialgebraisch sind, nach Lemma 1.2.6 semialgebraisch. 2. Das kartesische Produkt V × R = (∪E) × R = ∪ {S × R; S ∈ E} ist aus dem selben Grund semialgebraisch. 3. Das Komplement Rn \V = Rn \ (∪E) = ∩ {Rn \S; S ∈ E} ist als Schnitt endlich vieler Mengen, die nach Lemma 1.2.10 semialgebraisch sind, nach Lemma 1.2.8 semialgebraisch. 1.3 Wohlfundierte Induktion Definition 1.3.1. Sei < eine Relation, K eine Menge und µ ∈ K. Dann sagt man µ ist vorgängerlos bezüglich < in K, wenn @κ ∈ K : κ < µ. Definition 1.3.2. Eine Relation < heißt wohlfundierte Relation11 , wenn jede nichtleere Menge K ein bezüglich < in K vorgängerloses Element besitzt. Lemma 1.3.3. Sei < eine Relation und Φ eine Menge12 , sodass <⊆ Φ × Φ. Dann ist < genau dann eine wohlfundierte Relation, wenn jede nichtleere Menge K ⊆ Φ ein bezüglich < in K vorgängerloses Element besitzt. 11 Im Unterschied zu einer Wohlordnung muss eine wohlfundierte Relation nicht unbedingt eine Ordnungsrelation sein. 12 Eine solche Menge gibt es immer – die kleinste solche ist D (<) ∪ R (<). Die Definitionen der Begriffe Nachbereich R (<) und Vorbereich D (<) finden sich in Fußnote 3 auf Seite 9. 18 1.3 Wohlfundierte Induktion Beweis. Wir zeigen jede Implikation einzeln. Notwendigkeit: Wenn jede nichtleere Menge K ein bezüglich < in K vorgängerloses Element besitzt, dann tut dies auch jede nichtleere Menge K ⊆ Φ. Hinlänglichkeit: Sei K 6= ∅ eine nichtleere Menge. Es ist zu zeigen, dass K ein vorgängerloses Element besitzt. Falls K ⊆ Φ, besitzt K nach Voraussetzung ein bezüglich < in K vorgängerloses Element. Andernfalls, d. h. falls K * Φ, gibt es ε ∈ K\Φ und weil <⊆ Φ × Φ, ist ε vorgängerlos. Lemma 1.3.4 (Wohlfundierte Induktion). Sei < eine wohlfundierte Relation und Φ eine Menge. Hat eine Menge F ⊆ Φ die Eigenschaft ∀ϕ ∈ Φ : ({σ ∈ Φ; σ < ϕ} ⊆ F ⇒ ϕ ∈ F), so ist F = Φ. Beweis. Wäre F 6= Φ, so wäre K := Φ\F 6= ∅ und besäße daher, weil < eine wohlfundierte Relation ist, ein minimales Element µ. Damit wäre {σ ∈ Φ; σ < µ} ∩ K = ∅ und daher {σ ∈ Φ; σ < µ} ⊆ Φ\K = F . Aufgrund der vorausgesetzten Eigenschaft der Menge F wäre damit µ ∈ F im Widerspruch zu µ ∈ K = Φ\F . Bemerkung 1.3.5. Ersetzt man in Lemma 1.3.4 jedes Vorkommen von Φ durch N, so erhält man das bekannte Induktionsprinzip für natürliche Zahlen. Das Lemma kann also als Verallgemeinerung dieses Induktionsprinzips auf andere Mengen als N aufgefasst werden. Es wird zum Beweis von Lemma 2.4.2 auf Seite 57 verwendet werden und dieses wiederum zum Beweis des Satzes von Tarski-Seidenberg (Satz 2.4.5 auf Seite 64). Wer sich nur für den Beweis des Satzes von Tarski-Seidenberg interessiert, nicht aber für seine Anwendung in der Theorie der partiellen Differentialgleichungen, kann die kommenden Seiten überspringen und direkt zu Kapitel 2 auf Seite 25 übergehen. 19 1 Grundlagen 1.4 Integritätsringe und Satz von Gauß Definition 1.4.1. Ist R ein kommutativer Ring und sind a, x ∈ R, so nennt man x einen Teiler von a, wenn es y ∈ R gibt, sodass a = x y. Man schreibt dafür auch kurz x|a (gelesen x teilt a). Ist x kein Teiler von a, so schreibt man dafür kurz x - a. Diese Definition hat zur Konsequenz, dass jedes Element eines kommutativen Rings Teiler der Null ist. Zu jedem x ∈ R gibt es nämlich ein Element y ∈ R (und zwar y = 0), sodass 0 = x y. Definition 1.4.2. Ist R ein kommutativer Ring, so nennt man n ∈ R einen Nullteiler, wenn es b ∈ R\ {0} gibt, sodass n b = 0. Die Forderung b 6= 0 in der Definition des Begriffs Nullteiler ist wichtig, denn ohne sie wären die Begriffe Nullteiler und Teiler der Null gleichbedeutend. In jedem kommutativen Ring R 6= {0} ist die Null ein Nullteiler. Lemma 1.4.3 (Kürzungsregel). Seien R ein kommutativer Ring, a, b, x ∈ R und x kein Nullteiler in R. Dann gilt die Implikation xa = xb ⇒ a = b. Beweis. Das Produkt x (a − b) = x a − x b = 0 verschwindet. Wäre a − b 6= 0, so wäre x ein Nullteiler. Also gilt a = b. Definition 1.4.4. Ein kommutativer Ring heißt nullteilerfrei, wenn jeder seiner Nullteiler gleich null ist, oder anders gesagt13 , wenn für alle Ringelemente a, b mit a b = 0 gilt, dass 0 ∈ {a, b}. Definition 1.4.5. Ein kommutativer Ring mit Eins heißt Integritätsring, wenn er nullteilerfrei ist. Definition 1.4.6. Sei R ein Integritätsring. Dann heißt a ∈ R eine Einheit, wenn a die Eins teilt, d. h., wenn es b ∈ R gibt, sodass a b = 1. 13 Die Äquivalenz sieht man wie folgt: Gilt a b = 0 und jeder Nullteiler ist null, so würde aus 0 ∈ / {a, b} folgen, dass a und b von Null verschiedene Nullteiler wären. Gilt umgekehrt für a b = 0 stets 0 ∈ {a, b} und ist n ein Nullteiler, so gibt es b ∈ R\ {0} mit n b = 0, woraus n = 0 folgt. 20 1.4 Integritätsringe und Satz von Gauß Definition 1.4.7. Sei R ein Integritätsring. Dann heißt u ∈ R irreduzibel, wenn p von Null verschieden ist, keine Einheit ist und wenn für alle a, b ∈ R mit p = a b ein Element von {a, b} eine Einheit ist. Definition 1.4.8. Sei R ein Integritätsring. Dann heißt p ∈ R ein Primelement, wenn p von Null verschieden ist, keine Einheit ist und wenn es für alle a, b ∈ R mit p| (a b) ein Element x ∈ {a, b} mit p|x gibt. Definition 1.4.9. Ein Integritätsring heißt faktorieller Ring, wenn jedes von Null verschiedene Ringelement, das keine Einheit ist, als Produkt von Primelementen geschrieben werden kann, genauer gesagt, wenn ^ _ a ∈ R\ {0} n∈N a keine Einheit f ∈ {p ∈ R; p Primelement}n+1 a= Y fi . i∈n+1 Lemma 1.4.10. Sei R ein Integritätsring. Dann ist jedes Primelement aus R irreduzibel. Beweis. Sei p ∈ R ein Primelement und seien a, b ∈ R mit p = a b. Dann teilt p das Produkt a b. Also gibt es x ∈ {a, b} mit p|x. Es gibt also s ∈ R mit p s = x. Es gibt y ∈ {a, b} mit {x, y} = {a, b}. Damit gilt x 1 = x = p s = a b s = x y s und mit der Kürzungsregel 1.4.3 folgt 1 = y s, d. h. das Element y der Menge {a, b} = {x, y} ist eine Einheit. Bemerkung 1.4.11. Nicht jedes irreduzible Element eines Integritätsrings ist zwangsläufig ein Primelement14 . In einem Hauptidealring15 jedoch schon16 und sogar17 in einem faktoriellen Ring18 . Diese Aussagen werden in der vorliegenden Arbeit jedoch keine Verwendung finden und werden nur der Vollständigkeit halber erwähnt. √ Bei [Rei, S. 136-138] oder [Hor, S. 140] wird begründet, warum a + bi 5; a, b ∈ Z ⊆ C ein √ √ Integritätsring ist, dessen irreduzibles Element 2 das Produkt 1 + i 5 1 − i 5 teilt, ohne einen der Faktoren zu teilen. 15 Zur Definition siehe [Rei, S. 114], [Oel, S. 109] oder [Hor, S. 132]. 16 Zum Beweis siehe [Rei, S. 139]. 17 Jeder Hauptidealring ist ein faktorielle Ring (siehe [Rei, S. 142] oder [Hor, S. 141]). 18 Zum Beweis siehe [Rei, S. 162]. 14 21 1 Grundlagen Satz 1.4.12 (Satz von Gauß). Ist R ein faktorieller Ring, so ist es auch19 Rh1i. Beweis. Ein Beweis dieses Satzes kann bei [Rei, S. 163], [Hor, S. 155] oder bei [Voi, S. 12-15] gefunden werden. Lemma 1.4.13. Seien R ein faktorieller Ring, x, y, w ∈ Rh1i Polynome, x| (y w), deg x > 0, w 6= 0 und deg x > deg w. Dann gibt es ein Polynom t ∈ Rh1i mit deg t > 0, t|x und t|y. Beweis. Dem Beweis liegt die Idee zugrunde, dass die Primfaktoren von x nicht alle in w aufgehen können und deshalb mindestens einer dieser Faktoren y teilen muss. Für den Fall y = 0 beweist man den Satz durch Setzen von t := x. Sei also y 6= 0. Es gibt f ∈ Rh1i mit x f = y w. Es gilt f 6= 0, weil y w 6= 0. Nach Satz von Gauß (Satz 1.4.12) ist Rh1i ein faktorieller Ring. Das Polynom x lässt sich als Produkt von Primelementen in Rh1i schreiben, weil x wegen deg x 6= −∞ von Null verschieden und wegen deg x > 0 keine Einheit in Rh1i ist20 . Es gibt also n ∈ N und Q p ∈ {q ∈ Rh1i ; q Primelement}n+1 , sodass x = i∈n+1 pi . Wir zeigen jetzt indirekt, dass es i ∈ n + 1 gibt, sodass deg pi > 0 und pi |y: Angenommen, für alle i ∈ n + 1 wäre deg pi = 0 oder pi - y. Dann wäre es möglich, per Induktion zu beweisen, dass es für alle k ∈ n + 2 ein Polynom βk ∈ Rh1i vom Grad deg βk = deg y gäbe, das Teiler von y und Teiler von Q ( i∈k pi ) f wäre: Induktionsanfang: Für k = n + 1 könnte man βk := y setzen. Wegen ( Q x f = y w = βk w wäre βk ein Teiler von ( i∈k pi ) f . Q i∈n+1 pi ) f = Induktionsschritt: Sei k ∈ n + 1 und βk+1 ∈ Rh1i ein Polynom vom Grad deg βk+1 = Q deg y, das Teiler von y und Teiler von ( i∈k+1 pi ) f ist. Es gäbe also ϕ ∈ Rh1i mit Y pi f = βk+1 ϕ. (1.1) i∈k+1 Man könnte dann folgende zwei Fälle unterscheiden: 19 20 Die Notation Rhni für Polynomringe wurde in Definition 1.1.2 auf Seite 9 eingeführt. Ein Polynom x ∈ Rh1i mit deg x > 0 ist aus folgendem Grund nie eine Einheit: Welches Polynom aus Rh1i auch immer mit x multipliziert wird, das Produkt ist entweder null oder vom Grad größer 0, also in jedem Fall von der Eins verschieden. 22 1.4 Integritätsringe und Satz von Gauß 1. Fall pk |βk+1 : Dann gäbe es βk ∈ Rh1i mit βk+1 = pk βk . Aus pk |βk+1 und βk+1 |y folgte dann pk |y und aus der Widerspruchsannahme, dass deg pk = 0. Also wäre deg βk = deg βk+1 − deg pk = deg βk+1 = deg y. Das Polynom βk Q wäre wegen βk |βk+1 und βk+1 |y Teiler von y. Die Gleichung pk ( i∈k pi ) f = Q ( i∈k+1 pi ) f = βk+1 ϕ = pk βk ϕ ließe sich beidseitig mit pk kürzen (siehe 1.1 Q Lemma 1.4.3) und man sähe, dass βk auch ein Teiler von ( i∈k pi ) f wäre. 2. Fall pk - βk+1 : Weil pk wegen 1.1 das Produkt βk+1 ϕ, nicht aber den Faktor βk+1 teilen würde, würde pk als Primelement ϕ teilen, d. h. es gäbe ψ ∈ Rh1i mit ϕ = pk ψ. Durch Setzen von βk := βk+1 erhielte man die Gleichung Q Q pk ( i∈k pi ) f = ( i∈k+1 pi ) f = βk+1 ϕ = βk ϕ = βk pk ψ, die sich beidseitig 1.1 mit pk kürzen ließe (siehe Lemma 1.4.3). So sähe man, dass βk Teiler von Q ( i∈k pi ) f wäre. Aus der per Induktion bewiesenen Behauptung würde insbesondere die Existenz eines Polynoms β0 ∈ Rh1i vom Grad deg β0 = deg y folgen, das Teiler von f wäre. Weil f 6= 0, wäre damit deg y ≤ deg f und folglich deg x = deg y + deg w − deg f ≤ x f =y w deg w, im Widerspruch zur Voraussetzung deg x > deg w. Es gibt also i ∈ n + 1, sodass deg pi > 0 und pi |y. Das Setzen von t := pi beendet den Beweis. 23 1 Grundlagen 24 2 Der Satz von Tarski-Seidenberg 2.1 Polynomdivision über Ringen Die Polynomdivision ist ein Verfahren, bei dem üblicherweise vorausgesetzt wird, dass die Polynomkoeffizienten aus einem Körper stammen, weil sie die Eigenschaft von Null verschiedener Körperelemente, ein Inverses bezüglich der Multiplikation zu besitzen, ausnutzt1 . Zu je zwei Polynomen a ∈ Kh1i und b ∈ Kh1i \ {0} über einem Körper K gibt es stets zwei eindeutig bestimmte Polynome m, q ∈ Kh1i mit a = m + b q, sodass der Grad des Divisionsrests m echt kleiner ist als der des Divisors b. Für den Beweis des Satzes von Tarski-Seidenberg wird es von Nutzen sein, eine Entsprechung zu diesem Verfahren für den Fall nichtnotwendigerweise invertierbarer Koeffizienten zu finden. Ein möglicher Weg wäre, auszunutzen, dass wir die Division nur für den Fall von Koeffizienten aus einem Integritätsring benötigen. Wir könnten die Division dann mit Koeffizienten aus dessen Quotientenkörper durchführen und anschließend die Nenner wegmultiplizieren. Diesen Weg werden wir aber aus folgendem Grund nicht direkt einschlagen: Wir werden es mit Polynomen zu tun haben, deren Koeffizienten Polynome über R sind und es wird Situationen geben, in denen aus diesen durch Einsetzen von Werten in die Koeffizientenpolynome Polynome über R entstehen. Unangenehm ist, dass sich dabei, wenn der höchste Koeffizient eine Nullstelle hat, der Grad verringern kann und dies bei Verwendung normaler Polynomdivision dazu führt, dass von Division gefolg1 Betrachtet man beispielsweise den Polynomring Zh1i und seine a := 1{0} und ( Elemente ! 1 für α = 0 b := 2 · 1{0} (mit 1{0} ist hier die Indikatorfunktion N 3 α 7→ ∈ ZN gemeint, 0 sonst die aufgrund der Endlichkeit ihres Trägers ein Polynom ist, dessen zugehörige Polynomfunktion gleich Z 3 z 7→ 1 ist), so gibt es keine zwei Polynome m, q ∈ Zh1i mit deg m < deg b = 0 und a = m + b q. Ansonsten müsste wegen deg m = −∞ nämlich m = 0 gelten und daher 1 = a0 = b0 q0 = 2 q0 . Es gibt aber keine ganze Zahl, die mit 2 multipliziert 1 ergibt. 25 2 Der Satz von Tarski-Seidenberg tes Einsetzen und von Einsetzen gefolgte Division nicht dasselbe sind. Erschwerend kommt hinzu, dass auch der Fall eintreten kann, in dem der Divisor durch Einsetzen null wird. Der hier eingeschlagene Weg ermöglicht es, eine Division durchzuführen und dabei gegebenenfalls so zu tun, als wären die beteiligten Polynome von höherem Grad als sie es eigentlich sind. Dabei hängt dann das Ergebnis einer Division nicht nur von Dividend und Divisor ab, sondern auch vom Grad, der den beiden Polynomen jeweils unterstellt wird. Definition 2.1.1. Eine Funktion v heißt Vektor2 , wenn ihr Definitionsbereich3 D (v) eine natürliche Zahl ist. Für die Anzahl der Komponenten eines Vektors verwenden wir die Schreibweise v := D (v). Definition 2.1.2. Eine Funktion A heißt Matrix, wenn es z ∈ N und s ∈ N gibt, sodass4 D (A) = z × s. Im Fall A 6= ∅ wird die Anzahl der Zeilen von A als A := z und die Anzahl der Spalten von A als |A| := s definiert. Im Fall A = ∅ setzen wir5 A := |A| := 0. Definition 2.1.3. In dieser Definition wird eine Notation festgelegt, die es erlaubt, Komponenten aus einem Vektor zu streichen. Sei v ein Vektor und sei Z ⊆ N. Dann wird durch v|Z der Vektor bezeichnet, der aus v hervorgeht, wenn von seinen Komponenten nur diejenigen mit Indizes in Z beibehalten werden. Genauer gesagt erhalten wir v|Z auf folgende Weise: Wir setzen6 z := # (v ∩ Z). Dann gibt es genau eine monotone Bijektion ζ von z nach v ∩ Z. Damit sei v|Z := (vζi )i∈z . 2 Funktionen, deren Definitionsbereich eine natürliche Zahl ist, werden in dieser Arbeit häufig vorkommen. In einem Text, in dem allgemeine Vektorräume eine Rolle spielen, wäre es hinderlich, für diese Funktionen den Namen Vektor zu verwenden und es müsste ein anderer Name gefunden werden, etwa der Name Tupel oder der Name endliche Folge. Dies ist in der vorliegenden Arbeit jedoch nicht der Fall. 3 Die Notation D (r) für Relationen r wird in Fußnote 3 auf Seite 9 eingeführt. Die Forderung D (v) ∈ N ist aufgrund von Bemerkung 1.1.1 auf Seite 9 eine kurze Schreibweise für ∀n ∈ N : (n + 1 ∈ D (v) ⇒ n ∈ D (v)). 4 Nach Bemerkung 1.1.1 auf Seite 9 ist die Menge z × s gleich {(i, j) ; 0 ≤ i < z, 0 ≤ j < s}. 5 Für den Fall A 6= ∅ folgt aus D (A) = z × s = z̃ × s̃, dass z = z̃ und s = s̃. Für den Fall A = ∅ gilt für alle z, s ∈ N jedoch D (A) = 0 × s = z × 0. Dies macht die Fallunterscheidung in der Definition von A und |A| nötig. 6 Ist E eine endliche Menge, so bezeichnen wir mit #E die Zahl der Elemente von E. 26 2.1 Polynomdivision über Ringen Definition 2.1.4. Wie eben für Vektoren geschehen, führen wir jetzt eine Notation ein, die es erlaubt, Zeilen und Spalten aus einer Matrix zu streichen. Sei A eine Matrix und seien Z, S ⊆ N. Dann wird durch A|Z,S die Matrix bezeichnet, die aus A hervorgeht, wenn von ihren Zeilen nur diejenigen mit Indizes in Z und von ihren Spalten nur diejenigen mit Indizes in S beibehalten werden. Genauer gesagt erhalten wir A|Z,S auf folgende Weise: Wir setzen z := # A ∩ Z und s := # (|A| ∩ S). Dann gibt es genau eine monotone Bijektion ζ von z nach A ∩ Z und genau eine monotone Bijektion σ von s nach |A| ∩ S. Damit sei A|Z,S := Aζi ,σj (i,j)∈z×s . Definition 2.1.5. Sei R ein kommutativer Ring mit Eins und A eine quadratische Matrix über R (d. h. A Matrix,7 A [N2 ] ⊆ R und A = |A|). Dann ist die AdjunktenMatrix von A definiert als Adj (A) := (−1)j+i det A|N\{j},N\{i} i∈A,j∈|A| . Bemerkung 2.1.6. Die Fälle |A| ∈ {0, 1} sind in der soeben getroffenen Definition nicht ausgeschlossen. Im Fall |A| = 0 ergibt sich Adj (A) = ∅ aus der Definitionsgleichung und im Fall |A| = 1 tritt die Frage nach der Determinante der Matrix ∅ auf, d. h. die Frage nach der Determinante der 0 × 0-Matrix. Wir definieren8 det ∅ := 1 nicht nur, weil dadurch der folgende Satz auch für den Fall |A| = 1 gilt, sondern auch, weil sich diese Definition in allen später auftretenden Zusammenhängen als diejenige herausstellen wird, mit der sich Ergebnisse auf den Fall der 0 × 0-Matrix verallgemeinern lassen. Die Notation A N2 wird in Fußnote 3 auf Seite 9 eingeführt. 8 Man kann sich auch auf den Standpunkt stellen, dass es sich hierbei nicht um eine Definition handelt, sondern um die konsequente Auslegung Q der Definition: Die Determinante einer quadratischen Matrix A ist die Summe der Produkte i∈|A| ai,σ(i) für alle Permutationen σ : |A| → |A|. Im Fall |A| = Q 0 gibt es genau eine Permutation σ : |A| → |A|, nämlich die leere Funktion σ = ∅. Das Produkt i∈|A| ai,σ(i) ist für |A| = 0 das leere Produkt, also gleich eins. Demzufolge gilt det ∅ = 1. 7 27 2 Der Satz von Tarski-Seidenberg Satz 2.1.7. Sei R ein kommutativer Ring mit Eins, A eine quadratische Matrix über R und E die A × |A|-Einheitsmatrix über R. Dann gilt Adj (A) A = A Adj (A) = det (A) E. Beweis. Den Beweis dieses Satzes findet man beispielsweise bei [Oel, S. 220] oder bei [Atk, S. 103]. Definition 2.1.8. Ist R ein kommutativer Ring mit Eins und K ∈ N, so bezeichnen wir mit9 RK h1i := {p ∈ Rh1i ; deg p < K} die Menge der Polynome in einer Variablen über R mit Grad kleiner als K. Alternativ könnte RK h1i mit der selben Wirkung auch als die Menge10 {p ∈ Rh1i ; noc p ≤ K} der Polynome in einer Variablen über R mit Koeffizientenzahl kleiner gleich K definiert werden. Bemerkung 2.1.9. Die Menge von Polynomen RK h1i und die Menge von Vektoren RK stehen über RK h1i 3 p 7→ (pi )i∈K ∈ RK K und R 3 x 7→ xα 0 ∈ RK h1i für α ∈ K für α ∈ /K α∈N in Bijektion. 9 Die Bezeichnung Rhni wird in Definition 1.1.2 auf Seite 9 und die Bezeichnung deg p in Definition 1.1.6 auf Seite 11 eingeführt. 10 Die Bezeichnung noc p wird in Definition 1.1.6 auf Seite 11 eingeführt. 28 2.1 Polynomdivision über Ringen Definition 2.1.10. Seien R ein kommutativer Ring mit Eins, M, Q ∈ N und M b ∈ RM +1 h1i. Dann sei b ∈ R(M +Q)×(M +Q) die Matrix Q M b := Q 1 b M +i−j 0 , wenn (j ∈ M ) ∧ (i = j) , wenn (j ∈ / M ) ∧ (M + i − j ∈ M , sonst + 1) . (i,j)∈(M +Q)2 M b soll die Form der Matrix nachahmen. Im Q Fall M = 3 und Q = 2 sieht man zum Beispiel Bemerkung 2.1.11. Das Symbol 1 3 b = 2 b0 1 b1 b0 . 1 b2 b1 b3 b2 b3 Der Buchstabe b steht im Symbol dort, wo die Koeffizienten von b in der Matrix stehen und die Zahlen M und Q beschriften im Symbol die Abstände des Kreuzungspunktes vom oberen und unteren Matrixrand. Satz 2.1.12. Seien R ein kommutativer Ring mit Eins, M, Q ∈ N und b ∈ RM +1 h1i. Dann gilt M det b = bM Q . Q Beweis. Wir zeigen zunächst, dass M b eine obere Dreiecksmatrix ist: Q Für alle i, j ∈ (M + Q) tritt, wenn i > j, weder der Fall (j ∈ M ) ∧ (i = j), noch der Fall (j ∈ / M )∧(M + i − j ∈ M + 1) ein – letzterer nicht, weil dann M +i−j ≥ M +1. Daher stehen unterhalb der Diagonalen nur Nullen. Auf der Diagonalen steht an den M Positionen (j, j), wobei j ∈ M , jeweils eine Eins und an den Q Positionen (M + q, M + q), wobei q ∈ Q, jeweils bM . Da die Determinante einer Dreiecksmatrix gleich dem Produkt ihrer Diagonalelemente ist, folgt die behauptete Gleichung. Dass diese für den Fall von Matrizen über 29 2 Der Satz von Tarski-Seidenberg Körpern allgemein bekannte Schlussfolgerung auch für Matrizen über kommutativen Ringen mit Eins gilt, wird bei [Oel, S. 215] bewiesen. Satz 2.1.13. Seien R ein kommutativer Ring mit Eins, M, Q ∈ N, b ∈ RM +1 h1i, m ∈ RM h1i und q ∈ RQ h1i. Dann gilt m + b q ∈ RM +Q h1i und M m = m + b q, b q Q (mi )i∈M m wobei mit der Vektor gemeint ist und mit der rechten Seite der (qi )i∈Q q Gleichung der Vektor ((m + b q)i )i∈(M +Q) , eine Schreibweise, die durch Bemerkung 2.1.9 gerechtfertigt ist. Beweis. Es gilt m+b q ∈ RM +Q h1i, weil für alle α ∈ N mit α ≥ M +Q der Koeffizient X bβ qγ β+γ=α |{z} |{z} (m + b q)α = mα + |{z} =0 (=0 für β>M ) (=0 für γ≥Q) {z | } =0 verschwindet. mk + X M m = Für alle i ∈ M + Q gilt b q Q i M b Q X k∈M 1M (i) mi + X k∈Q i,k M b Q qk = i,(M +k) 1M +1 (M + i − (M + k)) bM +i−(M +k) qk = k∈Q mi + X 1M +1 (i − k) bi−k qk = k∈Q mi + X bi−k qk = mi + k∈Q i−k∈M +1 was die behauptete Gleichung zeigt. 30 X α+β=i bα qβ = (m + b q)i , 2.1 Polynomdivision über Ringen Definition 2.1.14. Seien R ein kommutativer Ring mit Eins, M, Q ∈ N, a ∈ RM +Q h1i und b ∈ RM +1 h1i. Dann seien die beiden Polynome modM,Q (a, b) ∈ RM h1i und quoM,Q (a, b) ∈ RQ h1i durch das Matrix-Vektor-Produkt M modM,Q (a, b) := Adj b a quoM,Q (a, b) Q definiert, wobei in der Gleichung, wie in Satz 2.1.13 unter Berufung auf 2.1.9, das Polynom a als Vektor aus RM +Q , das Polynom modM,Q (a, b) als Vektor aus RM und das Polynom quoM,Q (a, b) als Vektor aus RQ aufgefasst werden. Satz 2.1.15. Seien R ein kommutativer Ring mit Eins, M, Q ∈ N, a ∈ RM +Q h1i und b ∈ RM +1 h1i. Dann gilt bM Q a = modM,Q (a, b) + b quoM,Q (a, b) , d. h. das Q-mal mit dem höchsten11 Koeffizienten von b multiplizierte Polynom a ist wie bei der Polynomdivision in Polynomringen über Körpern zerlegbar. Beweis. modM,Q (a, b) + b quoM,Q (a, b) = Satz 2.1.13 M modM,Q (a, b) = b Definition 2.1.14 quoM,Q (a, b) Q M M M = bM Q a. b Adj b a = det b a Satz 2.1.7 Satz 2.1.12 Q Q Q Lemma 2.1.16. Seien n ∈ N, R ein kommutativer Ring mit Eins, M, Q ∈ N, a ∈ (Rhni)M +Q h1i, b ∈ (Rhni)M +1 h1i und x ∈ Rn . Dann gilt12 modM,Q (ax̂ , bx̂ ) = (modM,Q (a, b))x̂ , d. h. von Division gefolgtes Einsetzen und von Einsetzen gefolgte Division liefern das selbe Ergebnis, was, wie auf Seite 25 erwähnt, bei gewöhnlicher Polynomdivision nicht der Fall ist. 11 Oder besser gesagt: mit dem M -ten Koeffizienten von b multiplizierte Polynom (denn b muss nicht Höchstgrad haben). 12 Die Schreibweise px̂ für Polynome p ∈ (Rhni)h1i und Vektoren x ∈ Rn wird in Definition 1.1.8 auf Seite 12 eingeführt. 31 2 Der Satz von Tarski-Seidenberg Beweis. Aus Lemma 1.1.9 auf Seite 12 ist bekannt, dass die Operationen Addition und Multiplikation mit dem Einsetzen vertauschen. Die Koeffizienten des Polynoms modM,Q (ax̂ , bx̂ ) bzw. modM,Q (a, b) gehen zum einen aus den Koeffizienten des Polynoms bx̂ bzw. b durch von den Werten dieser KoefM M fizienten unabhängige Anordnung in der Matrix bx̂ bzw. b und UnterQ Q determinantenbildung bei Bildung der Adjunktenmatrix und zum anderen aus den Koeffizienten des Polynoms ax̂ bzw. a durch von den Werten dieser Koeffizienten unabhängige Anordnung in einem Vektor und anschließende Multiplikation desselben mit der Matrix hervor. In der Bildungsvorschrift tauchen also ausschließlich Additionen und Multiplikationen auf, woraus mit Lemma 1.1.9 die behauptete Gleichung folgt. Kriterium 2.1.17. Seien R ein kommutativer Ring mit Eins, a ∈ Rh1i und z ∈ R. Dann ist das Polynom13 1{1} − z1{0} genau dann ein Teiler von a, wenn â (z) = 0. Beweis. Für Polynome über Körpern beweist man dieses Kriterium mit Polynomdivision. Mit Satz 2.1.15 führt die selbe Beweisidee auch hier zum Ziel: Sei 1{1} − z1{0} ein Teiler von a. Dann gibt es q ∈ Rh1i mit a = 1{1} − z1{0} q. d Damit gilt â (z) = 1d {1} (z) − z 1{0} (z) q̂ (z) = z − z = 0. Die Notwendigkeit ist damit gezeigt. Sei nun umgekehrt â (z) = 0. Mit M := 1 gilt b := 1{1} − z1{0} ∈ RM +1 h1i. Es gibt Q ∈ N, sodass a ∈ RM +Q h1i. Nach Definition 2.1.14 gilt dann modM,Q (a, b) ∈ RM h1i = R1 h1i. Deshalb gilt \ (modM,Q (a, b))0 = mod\ M,Q (a, b) (z) + b̂ (z)quoM,Q (a, b) | {z } = Satz 2.1.15 bM Q â (z) = 0. =0 Also gilt modM,Q (a, b) = 0 und erneut mit Satz 2.1.15 gilt bM Q a = | {z } =1 modM,Q (a, b) + b quoM,Q (a, b), d. h. b = 1{1} − z1{0} teilt a wie behauptet. | 13 {z =0 } Mit 1{0} und 1{1} sind hier wie in Fußnote 1 auf Seite 25 die entsprechenden Indikatorfunktionen von N nach R gemeint. Diese sind wegen ihres endlichen Trägers Polynome. Die dem Polynom 1{1} −z1{0} zugeordnete Polynomfunktion ist gleich R 3 r 7→ r1 −zr0 , d. h. gleich R 3 r 7→ r −z. 32 2.2 Das Reduktionslemma 2.2 Das Reduktionslemma Weil wir zum Beweis des Satzes von Tarski-Seidenberg Zusammenfassungen mehrerer Polynome zu einem Objekt verwenden, wird in der folgenden Definition festgelegt, was wir unter einem Vektor von Polynomen verstehen. Definition 2.2.1. Sei R ein kommutativer Ring mit Eins. Ein Vektor14 v heißt Polynomvektor über R, wenn seine Komponenten Polynome über R in einer Variablen sind, d. h. wenn15 v [N] ⊆ Rh1i. Für die Menge der Polynomvektoren über R gilt16 {v; v Polynomvektor über R} = ∪ Rh1i[N] . Polynomvektoren über R nennen wir reelle Polynomvektoren. Wir werden jetzt Funktionen redkµ mit gewissen Parametern µ und k erklären, die gewissen Polynomvektoren über einem Ring R wieder Polynomvektoren zuordnen. Der letztendliche Nutzen dieser Funktionen besteht grob gesprochen darin, dass man die Häufigkeit von Polynomvektoren (die Häufigkeit eines Polynomvektors ist eine Größe, die in Abschnitt 2.3 in Definition 2.3.2 auf Seite 52 definiert werden wird; sie ist ein Maß für den Grad seiner Polynome) beliebig vermindern kann, wenn man die Funktionen redkµ nur oft und geschickt genug auf sie anwendet. Man nimmt dabei in Kauf, dass jede Anwendung mit einer Verdoppelung der Anzahl der Polynomvektorkomponenten einhergeht. Da der Schlüssel zur Gradverminderung die Differentiation sein wird, definieren wir zuerst die Differentiation von Polynomen. Definition 2.2.2. Sei R ein kommutativer Ring mit Eins. Dann sei [N, R] ∈ RN die rekursiv durch [N, R] (0) := 0 ∈ R und [N, R] (n + 1) := [N, R] (n) + 1 ∈ R definierte Folge. Das Ringelement [N, R] (n) erhält man also grob gesagt dadurch, dass man die 14 Der Begriff Vektor wird in Definition 2.1.1 auf Seite 26 eingeführt. Die Bezeichnung Rhni wird in Definition 1.1.2 auf Seite 9 definiert, die Bezeichnung r [M ] für den Nachbereich einer Menge M unter einer Relationen r in Fußnote 3 auf Seite 9. 16 Es ist üblich, die Menge der auf einer Menge d definierten Funktionen mit Werten in einer Menge r durch rd zu bezeichnen. Sind D und r Mengen, so sei r[D] := rd ; d ∈ D . Diese Schreibweise lehnt sich an die in Fußnote 3 auf Seite 9 eingeführte Bezeichnung für den Nachbereich von Mengen unter Relationen an. Fasst man nämlich r als die Funktion D 3 d 7→ rd auf, so erklärt sich die gerade eingeführte Schreibweise r[D] von selbst. Im Fall D = N ist damit zum Beispiel ∪ r[N] = ∪ {rz ; z ∈ N}die Menge der Vektoren mit Komponenten aus r. Die auf dieser Seite 15 auftauchende Menge ∪ Rh1i [N] z ist also gleich ∪ {Rh1i ; z ∈ N}. 33 2 Der Satz von Tarski-Seidenberg Eins des Rings n-mal gemäß 1| + .{z . . + 1} addiert. Wenn aus dem Zusammenhang klar n-mal ist, was gemeint ist, werden wir anstelle von [N, R] (n) auch oft n schreiben. Definition 2.2.3. Sei R ein kommutativer Ring mit Eins und p ∈ Rh1i. Dann sei die Ableitung ∂p von p definiert als das Polynom ∂p := ((α + 1) pα+1 )α∈N . Mit den Faktoren (α + 1) sind dabei die soeben definierten Ringelemente [N, R] (α + 1) gemeint. Satz 2.2.4. Für p ∈ Rh1i gilt17 c = ∂ p̂, ∂p das heißt im Falle reeller Koeffizienten ist die der Ableitung eines Polynoms p zugeordnete Polynomfunktion gleich der Ableitung der diesem Polynom zugeordneten Polynomfunktion. Beweis. Es gilt ∂ p̂ = Definition 1.1.4 auf Seite 10 R 3 x 7→ ∂ R 3 x 7→ α∈spt(p) αpα xα−1 = R 3 x 7→ X X (α + 1) pα+1 xα = α+1∈spt(p) α∈spt(p) R p α xα = X 3 x 7→ X c (∂p)α xα = ∂p. α∈spt(∂p) Lemma 2.2.5. Seien n ∈ N, R ein kommutativer Ring mit Eins, p ∈ (Rhni)h1i und x ∈ Rn . Dann gilt18 ∂ (px̂ ) = (∂p)x̂ , d. h. von Differentiation gefolgtes Einsetzen und von Einsetzen gefolgte Differentiation liefern das selbe Ergebnis. 17 Die Schreibweise p̂ für die einem Polynom p zugeordnete Polynomfunktion wird in Definition 1.1.4 auf Seite 10 eingeführt. 18 Die Schreibweise px̂ für Polynome p ∈ (Rhni)h1i und Vektoren x ∈ Rn wird in Definition 1.1.8 auf Seite 12 eingeführt. 34 2.2 Das Reduktionslemma Beweis. Für alle α ∈ N gilt (∂ (px̂ ))α = (α + 1) (px̂ )α+1 = (α + 1) pd α+1 (x) = d (x) = ((∂p) ) . \ (α + 1) pα+1 (x) = ∂p α x̂ α Definition 2.2.6. Ein Vektor µ heißt Multiindex, wenn seine Komponenten natürliche Zahlen sind, d. h. wenn µ [N] ⊆ N. Definition 2.2.7. Sei R ein kommutativer Ring mit Eins und µ ein Multiindex. Dann sei19 n o Rµ h1i := v ∈ (Rh1i)µ ; ∀i ∈ µ : vi ∈ Rµi h1i die Menge aller µ-komponentigen Polynomvektoren v über R, sodass für alle Indizes i ∈ v der Grad des Polynoms vi kleiner als µi ist20 . Für k ∈ µ sei ek := 1 0 , wenn i = k , wenn i 6= k und daher µ + 1 + ek = i∈µ µi µi + 2 , wenn i = k + 1 , wenn i 6= k . i∈µ Definition 2.2.8. Für einen kommutativen Ring R mit Eins, einen Multiindex µ und k ∈ µ derart, dass (µ + 1 + ek )k = max (µ + 1 + ek ) sei zunächst diff kµ := Rµ+1+ek h1i 3 v 7→ ∂vk vi , wenn i = k , wenn i 6= k ! ∈ Rµ+1 h1i i∈µ die Funktion, die die k-te Komponente eines Polynomvektors aus Rµ+1+ek h1i differenziert und die anderen Komponenten unverändert lässt. Zudem sei21 restkµ := Rµ+1+ek h1i 3 v 7→ modµi ,µk −µi +2 vk , diff kµ (v)i i∈µ ∈ Rµ h1i die Funktion, die die i-te Komponente eines Polynomvektors v aus Rµ+1+ek h1i durch den Rest bei Division der k-ten Komponente durch diff kµ (v)i ersetzt. 19 Die Definition von RK h1i steht unter 2.1.8 auf Seite 28. Oder anders gesagt: die Koeffizientenzahl des Polynoms vi kleiner gleich µi ist (siehe Definition 1.1.6 auf Seite 11). 21 Die Definition von modM,Q (a, b) findet sich unter 2.1.14 auf Seite 31. 20 35 2 Der Satz von Tarski-Seidenberg Im Anschluss an diese Definition folgt der Beweis, dass restkµ richtig definiert wurde, d. h. dass für alle auftretenden µ, k, v und i der Ausdruck modµi ,µk −µi +2 vk , diff kµ (v)i erstens Sinn macht und zweitens Element von Rµi h1i ist. Schließlich sei redkµ := Rµ+1+ek h1i diff kµ (v) 3 v 7→ ∈ R k restµ (v) µ+1 h1i µ die Funktion, deren Definition auf Seite 33 angekündigt wurde. Beweis. Wir überzeugen uns jetzt wie angekündigt davon, dass die Funktion restkµ richtig definiert wurde. Seien dazu µ ein Multiindex, k ∈ µ mit (µ + 1 + ek )k = max (µ + 1 + ek ), v ∈ Rµ+1+ek h1i und i ∈ µ. Nach Definition 2.1.14 auf Seite 31 ist modM,Q (a, b) für M, Q ∈ N, a ∈ RM +Q [1] und b ∈ RM +1 [1] definiert. In unserem Fall, nämlich dem Fall modµi ,µk −µi +2 vk , diff kµ (v)i , gilt M = µi ∈ N, Q = µk − µi + 2 ≥ 1, a = vk ∈ Rµk +2 h1i = RM +Q h1i und (µ+1+ek )k =max(µ+1+ek ) diff kµ (v)i ∈ Rµi +1 h1i = RM +1 h1i. Die Wahl der Parameter und Argumente für b= modM,Q (a, b) ist also gültig. Es bleibt zu zeigen, dass k modµi ,µk −µi +2 vk , diff µ (v)i ∈ Rµi h1i. Dies sieht man schnell, da M = µi und wir aus Definition 2.1.14 auf Seite 31 wissen, dass modM,Q (a, b) ∈ RM h1i. Die Namen der soeben definierten Funktionen sollen daran erinnern, dass diff kµ etwas mit Differentiation, restkµ etwas mit dem Rest bei Division und redkµ etwas mit der Verminderung des Grads (Reduktion) zu tun hat. Jetzt erklären wir eine in Abschnitt 1.1 für Polynome definierte Schreibweise auch für Polynomvektoren. Definition 2.2.9. Seien n ∈ N, R ein kommutativer Ring mit Eins, v ∈ ∪ (Rhni)h1i[N] und x ∈ Rn . Dann sei22 vx̂ := ((vi )x̂ )i∈v ∈ Rh1iv 22 Die Schreibweise px̂ für Polynome p ∈ (Rhni)h1i und Vektoren x ∈ Rn wird in Definition 1.1.8 auf Seite 12 eingeführt. 36 2.2 Das Reduktionslemma der aus dem Polynomvektor v durch komponentenweises Einsetzen von x in die Koeffizientenpolynome der Komponentenpolynome hervorgehende Polynomvektor. Lemma 2.2.10. Seien n ∈ N, R ein kommutativer Ring mit Eins, µ ein Multiindex, k ∈ µ derart, dass (µ + 1 + ek )k = max (µ + 1 + ek ), v ∈ (Rhni)µ+1+ek h1i und x ∈ Rn . Dann gilt redkµ (vx̂ ) = redkµ (v) , x̂ d. h. von Reduktion gefolgtes Einsetzen und von Einsetzen gefolgte Reduktion liefern das selbe Ergebnis. Beweis. Da diff kµ (vx̂ ) = mit Lemma 2.2.5 auf Seite 34 diff kµ (v) x̂ und damit auch restkµ (vx̂ ) = modµi ,µk −µi +2 (vx̂ )k , diff kµ (vx̂ )i modµi ,µk −µi +2 (vk )x̂ , modµi ,µk −µi +2 vk , diff kµ (v)i diff kµ x̂ i∈µ (v) = x̂i = = i∈µ Lemma 2.1.16 auf Seite 31 i∈µ modµi ,µk −µi +2 vk , diff kµ (v)i restkµ (v) x̂ i∈µ = x̂ , gilt k diff kµ (vx̂ ) diff µ (v) x̂ k k (v) redµ (vx̂ ) = = = red . µ x̂ restkµ (vx̂ ) restkµ (v) x̂ Wir wenden uns jetzt dem Spezialfall reeller Polynomvektoren zu. Definition 2.2.11. Sei v ein reeller Polynomvektor. Die Menge der isolierten Nullstellen aller seinen Polynomen zugeordneten Polynomfunktionen bezeichnen wir mit IN (v) := ∪ {x ∈ R; vi 6= 0, v̂i (x) = 0} . i∈v Die Menge IN (v) ist endlich. Wir wollen diese Nullstellen durchnummerieren. Es gibt genau eine monotone Bi- 37 2 Der Satz von Tarski-Seidenberg jektion von23 #IN (v) + 2 nach {−∞} ∪ IN (v) ∪ {∞}. Dieser geben wir den Namen in (v). Damit gilt in (v)0 = −∞, IN (v) = {in (v)n ; 1 ≤ n ≤ #IN (v)} und in (v)#IN(p)+1 = ∞. Die isolierten Nullstellen von v zerschneiden die reelle Achse in #IN (v)+1 Intervalle. Diese seien für n ∈ #IN (v) + 1 durch i I (v)n := in (v)n , in (v)n+1 h bezeichnet. In der folgenden Definition wird festgelegt, auf welche Weise man einem reellen Polynomvektor eine sein Vorzeichenverhalten beschreibende Matrix24 zuordnet. Definition 2.2.12. Es sei25 [N] SGN := ∪ Rh1i ! 3 v 7→ SGN (v) , wobei ! SGN (v) := SGN (v)i,j ∈ {−1, 0, 1} , (i,j)∈v×(2 #IN(v)+1) wobei wiederum26 j+1 (v) sgn v̂ in i 2 , wenn j ungerade SGN (v)i,j := sgn v̂i in (v) j − , wenn j gerade. +1 2 Für Matrizen A führen wir jetzt zusätzlich zu den Schreibweisen A und |A| für Zeilenund Spaltenzahl von A die Bezeichnung kAk ein. Definition 2.2.13. Ist A eine Matrix, so sei kAk := |A| − 1 . 2 23 Für eine endliche Menge E steht #E für die Zahl ihrer Elemente. Aufgrund von Bemerkung 1.1.1 ist #IN (v) + 2 die Menge der natürlichen Zahlen kleiner als #IN (v) + 2. 24 Der Begriff Matrix und die Notationen für die Zeilen- und Spaltenzahl einer Matrix werden in Definition 2.1.2 auf Seite 26 festgelegt. 25 [N] n Der in Fußnote 16 auf Seite 33 getroffenen Festlegung zufolge ist ∪ Rh1i = ∪ {Rh1i ; n ∈ N} die Menge der reellen Polynomvektoren. 26 Die Schreibweise sgn (x) für reelle Zahlen x ∈ R wird in Definition 1.2.1 auf Seite 13 eingeführt. 38 2.2 Das Reduktionslemma Warum wir kAk die Anzahl der Nullstellen von A nennen, leuchtet mit folgender Bemerkung ein. Bemerkung 2.2.14. Für alle reellen Polynomvektoren v 6= ∅ gilt per Definition kSGN (v)k = #IN (v). Bemerkung 2.2.15. Ist v ein reeller Polynomvektor, so gilt für alle i ∈ v und alle n ∈ #IN (v) + 1 die Gleichung27 SGN (v)i,2n =∈ (sgn [v̂i [I (v)n ]]) , weil v̂i sein Vorzeichen in I (v)n nicht wechselt. Über die Einträge der Matrix SGN (v) kann man also sagen, dass die Einträge SGN (v)i,2n−1 für i ∈ v und 1 ≤ n ≤ #IN (v) das Vorzeichen von v̂i an Punkten der reellen Achse und die Einträge SGN (v)i,2n für i ∈ v und n ∈ #IN (v) + 1 das Vorzeichen von v̂i auf Intervallen der reellen Achse angeben. Definition 2.2.16. Eine Matrix A nennen wir Vorzeichenmatrix, wenn es einen reellen Polynomvektor v mit A = SGN (v) gibt. Definition 2.2.17. Für einen Multiindex µ und k ∈ µ derart, dass (µ + 1 + ek )k = max (µ + 1 + ek ), sei Pkµ die Menge der reellen Polynomvektoren aus Rµ+1+ek h1i, deren Komponenten Höchstgrad haben, d. h. Pkµ := Rµ+1+ek h1i \Rµ+ek h1i . Überraschenderweise ist die Bestimmung des Vorzeichenverhaltens eines Polynomvektors aus Pkµ bereits bei alleiniger Kenntnis des Vorzeichenverhaltens des ihm durch redkµ zugeordneten Polynomvektors möglich. Diese Tatsache ist Inhalt des nächsten Satzes. 27 Ist E eine einelementige Menge, so wird mit ∈ (E) ihr Element bezeichnet. 39 2 Der Satz von Tarski-Seidenberg Lemma 2.2.18 (Reduktionslemma). Für alle Multiindizes µ und alle k ∈ µ derart, dass (µ + 1 + ek )k = max (µ + 1 + ek ), ist die Relation REDkµ := n linkseindeutig28 , d. h. REDkµ SGN (v) , SGN redkµ (v) −1 ; v ∈ Pkµ o ist eine Funktion. Beweis. Sei µ ein Multiindex und k ∈ µ derart, dass (µ + 1 + ek )k = max (µ + 1 + ek ). Wir geben jetzt ein Verfahren an, das jeder Vorzeichenmatrix29 R ∈ R REDkµ , d. h. jeder Vorzeichenmatrix, die durch Anwendung von redkµ und anschließender Anwendung von SGN aus einem Element von Pkµ hervorgehen kann, eine Vorzeichenmatrix V zuordnet. Zugleich beweisen wir, dass für jede vorgegebene Vorzeichenmatrix R ∈ R REDkµ die aus ihr auf die noch anzugebende Weise konstruierte Vorzeichenmatrix V folgende Eigenschaft besitzt: Für alle v ∈ Pkµ mit SGN redkµ (v) = R gilt SGN (v) = V . (2.1) Gelingt uns dies, ist Lemma 2.2.18 bewiesen und für jede Vorzeichenmatrix R ∈ R REDkµ und die aus ihr bestimmte Vorzeichenmatrix V gilt REDkµ −1 (R) = V . Sei also R ∈ R REDkµ und (zum Zwecke des Nachweises von 2.1) v ∈ Pkµ , sodass SGN redkµ (v) = R. Erster Teil des Beweises: Vereinfachende Festlegungen Die Zeilenzahlen von R und v stehen bereits fest: Weil v ∈ Pkµ , gilt v = µ und damit R = SGN redkµ (v) = redkµ (v) =2 · v = 2 · µ. Zur Vereinfachung der Bezeichnungen im Laufe des Beweises treffen wir folgende Festlegungen: Sei N := kRk die Anzahl der Nullstellen von R. 28 Aufgrund von Fußnote 3 auf Seite 9 kann man schon erahnen, was der Begriff linkseindeutig bedeutet: Eine Relation r heißt linkseindeutig, wenn sie die Aussage ∀a, b, y : ((a, y) ∈ r ∧ (b, y) ∈ r ⇒ a = b) erfüllt. 29 Die Schreibweise R (r) für den Nachbereich einer Relation r wird in Fußnote 3 auf Seite 9 definiert. 40 2.2 Das Reduktionslemma Seien D und M die beiden Vorzeichenmatrizen, die der oberen und unteren Hälfte D von R entsprechen, d. h. es gelte R = mit D = M = µ. M Sei r := redkµ (v) und x := in (r) die Nummerierung der isolierten Nullstellen von r. Seien d und m die beiden Polynomvektoren, die der oberen und unteren Hälfte von d r entsprechen, d. h. es gelte r = mit d = m = µ. m Bemerkung. Von den gerade getroffenen Festlegungen sind N , D und M diejenigen, die Teil des Verfahrens zur Bestimmung von V sind. Sie lassen sich allein aus der Vorzeichenmatrix R bestimmen. Zweiter Teil des Beweises: Die Nummerierung ν Da SGN (r) = R, gelten für alle i ∈ µ und alle 1 ≤ n ≤ N die Gleichungen sgn d̂i (xn ) = Di,2n−1 und (2.2) sgn (m̂i (xn )) = Mi,2n−1 . (2.3) Weil v ∈ Pkµ , ist das Polynom vk vom Grad µk +1 und sind für i ∈ µ\ {k} die anderen Polynome vi vom Grad µi . Also ist das Polynom ∂vk = diff kµ (v)k = dk vom Grad µk und sind für i ∈ µ\ {k} die anderen Polynome vi = diff kµ (v)i = di vom Grad µi . Zusammenfassend ist für sämtliche Indizes i ∈ µ das Polynom di vom Grad µi . Für jeden Index i ∈ µ können wir das Vorzeichen des höchsten Koeffizienten (di )µi 6= 0 von di aus der Vorzeichenmatrix D wie folgt bestimmen: Im Intervall I (r)N = ]xN , xN +1 [ = ]xN , ∞[ hat d̂i das Vorzeichen Di,2N . Zur späteren Verwendung halten wir fest, dass daher ∀i ∈ µ : sgn (di )µi = Di,2N . (2.4) Das Vorzeichen des höchsten Koeffizienten (vk )µk +1 des Polynoms vk ist gleich dem Vorzeichen des höchsten Koeffizienten (∂vk )µk = (dk )µk seiner Ableitung ∂vk . Ebenfalls zur späteren Verwendung halten wir fest, dass damit sgn (vk )µk +1 = Dk,2N . (2.5) 41 2 Der Satz von Tarski-Seidenberg Als Nächstes werden wir das Vorzeichen von vˆk an den durch die Menge Γ := ∪ {n ∈ N; 1 ≤ n ≤ N ∧ Di,2n−1 = 0} i∈µ gegebenen Stellen {xn ; n ∈ Γ} bestimmen. Sei G := #Γ. Dann gibt es genau eine monotone Bijektion ν von G + 2 nach {0} ∪ Γ ∪ {N + 1}. Das Hinzufügen von 0 und N + 1 zum Wertebereich hat zur Folge, dass xν0 = −∞ und xνG+1 = ∞. Bemerkung. Von den im zweiten Teil des Beweises eingeführten Objekten sind Γ, G und ν diejenigen, die Teil des Verfahrens zur Bestimmung der Vorzeichenmatrix V sind. Es ist wichtig zu bemerken, dass auch für ihre Definition nur die Vorzeichenmatrix R (wenn auch nicht direkt) verwendet wurde. Zur Verwendung innerhalb des Beweises führen wir Abkürzungen für die G + 1 Intervalle ein, in die die reelle Achse von den Punkten {xn ; n ∈ Γ} zerschnitten wird: i h Für g ∈ G + 1 sei Ig := xνg , xνg+1 . Für alle i ∈ µ und alle g ∈ G + 1 wechselt d̂i im Intervall Ig das Vorzeichen nicht, (2.6) weil aufgrund von 2.2 und der Definition von Γ sämtliche Nullstellen von d̂i Elemente von {xn ; n ∈ Γ} sind. Sei 1 ≤ g ≤ G. Dann gibt es einen Zeilenindex i ∈ µ mit Di,2νg −1 = 0. Wegen 2.2 gilt für diesen Zeilenindex auch d̂i xνg = 0. Aus Satz 2.1.15 auf Seite 31 ergibt sich zuerst die Gleichung (di )µi µk −µi +2 vk = modµi ,µk −µi +2 (vk , di ) + di quoµk ,µk −µi +2 (vk , di ) , die sich wegen Definition 2.2.8 auf Seite 35 zu (di )µi µk −µi +2 vk = mi + di quoµk ,µk −µi +2 (vk , di ) umformen lässt. Wegen Satz 1.1.5 auf Seite 11 gilt die Gleichung auch für die zugeordneten Polynomfunktionen. Nach Einsetzen von xνg ergibt sich (di )µi µk −µi +2 vˆk xνg = m̂i xνg + d̂i xνg quoµk ,µk\ −µi +2 (vk , di ) xνg = m̂i xνg . | 42 {z =0 } 2.2 Das Reduktionslemma Durch beidseitige Anwendung von sgn erhält man sgn (di )µi µk −µi sgn vˆk xνg = sgn m̂i xνg und mit 2.4 und 2.3 folgert man sgn vˆk xνg = sgn (di )µi µk −µi sgn m̂i xνg = (Di,2N )µk −µi Mi,2νg −1 . (2.7) Wir interessieren uns auch für das Vorzeichen von vˆk für sehr kleine und sehr große Argumente. Zur Abkürzung innerhalb des Beweises sei sgn (vˆk (−∞)) := lim sgn (vˆk (ξ)) und sgn (vˆk (∞)) := lim sgn (vˆk (ξ)) . ξ→−∞ ξ→∞ Der Zugewinn durch diese Abkürzungen erscheint auf den ersten Blick sehr klein – man beachte jedoch, dass ihre Einführung dazu führt, dass der Ausdruck sgn (vˆk (xn )) auch für n ∈ {0, N } Sinn ergibt. Da das Vorzeichen von Polynomen für sehr kleine und sehr große Argumente allein durch ihren Grad und das Vorzeichen des höchsten Koeffizienten bestimmt sind, ergibt sich mit 2.5, dass sgn (vˆk (−∞)) = (vk )µk +1 (−1)µk +1 = (−1)µk +1 Dk,2N und sgn (vˆk (∞)) = (vk )µk +1 = Dk,2N . Dritter Teil des Beweises: Die Nummerierung γ Jetzt haben wir alles beisammen, um den nächsten Schritt im Verfahren zur Bestimmung von V nachvollziehbar zu machen: Wir definieren K ∈ {−1, 0, 1}G+2 durch K := µ +1 (−1) k Dk,2N = sgn (vˆk (−∞)) µ −µ (Di,2N ) k i Mi,2νg −1 = sgn vˆk xνg mit 2.7 Dk,2N = sgn (vˆk (∞)) für g = 0 für 1 ≤ g ≤ G für g = G + 1 , (2.8) g∈G+2 43 2 Der Satz von Tarski-Seidenberg wobei im Fall 1 ≤ g ≤ G der Zeilenindex i ∈ µ ein beliebiger Zeilenindex mit Di,2νg −1 = 0 sei. Die zur Definition herangezogene rechte Seite der Gleichung 2.7 hängt dann, da sie gleich der linken Seite der Gleichung 2.7 ist, nicht von der Wahl des Zeilenindex i ∈ µ mit Di,2νg −1 = 0 ab. Mit den bisherigen Überlegungen können wir einige der Nullstellen von vˆk aus den Kg auf folgende Weise ablesen: Gilt Kg = 0, so ist xνg eine Nullstelle von vˆk . Die zusätzliche Bestimmung der verbleibenden Nullstellen von vˆk ist Inhalt dieses Teils des Beweises. Für alle g ∈ G + 1 überlegt man sich Folgendes: Weil ∂vk = dk und weil dˆk wegen 2.6 im Intervall Ig das Vorzeichen nicht wechselt, ist vˆk monoton in Ig . Weil dˆk wegen30 deg dk = µk ∈ N nicht das Nullpolynom ist, ist vˆk sogar streng monoton in Ig . Wir schlussfolgern, dass vˆk im Intervall Ig 1. für den Fall Kg · Kg+1 = −1 genau eine Nullstelle, die wir mit zg bezeichnen, und 2. für den Fall Kg · Kg+1 6= −1 keine Nullstelle besitzt. Auf die Lage der Zwischen-Nullstelle zg bezüglich etwaiger xn ∈ Ig können wir nicht schließen (zg < xn , zg = xn oder zg > xn sind möglich31 ), dies stellt jedoch kein Problem dar. In der Absicht, sämtliche isolierte Nullstellen des Polynomvektors v zu indizieren, gehen wir zunächst folgendermaßen vor: 30 Die Bezeichnung deg p für den Grad eines Polynoms p in einer Variablen wird in Definition 1.1.6 auf Seite 11 eingeführt. 31 Folgendes Beispiel zeigt die drei Möglichkeiten: Sei µ := (2)i∈1 , k := 0, α ∈ ]−2, 2[ und v := 1{3} − 3 · 1{1} + α1{0} i∈1 ∈ Pkµ . Durch Rechnung ergibt sich r = redkµ (v) = 3 · 1{2} − 3 · 1{0} . Die Nullstellen von rb0 lauten −1 und 1 und die Nullstelle von rb1 −18 · 1{1} + 9α1{0} α ist α2 ∈ ]−1, 1[. Also gilt IN (r) = −1, α2, 1 , N = 3 und x = in (r) = −∞, −1, 2 , 1, ∞ . 1 0 −1 −1 −1 0 1 Unabhängig von α gilt R = SGN (r) = . Es ergibt sich 1 1 1 0 −1 −1 −1 Γ = {1, 3}, G = 2 und ν = (0, 1, 3, 4). Im nächsten Schritt gilt K = (−1, 1, −1, 1). Wegen K1 · K2 = −1 besitzt vbk im Intervall I1 = ]xν1 , xν2 [ = ]x1 , x3 [ = ]−1, 1[ genau eine Nullstelle 3 z1 . Auch x2 liegt in I1 . Weil vbk (x1 ) > 0, vbk (x3 ) < 0 und vbk (x2 ) = vbk α2 = α8 − 3 α2 + α = > 0 für α < 0 α 2 8 α − 4 = 0 für α = 0 , liegt x2 für α < 0 rechts von z1 , für α = 0 bei z1 und für α > 0 < 0 für α > 0 links von z1 . 44 2.2 Das Reduktionslemma Sei n o Σ := 1 ≤ g ≤ G; Kg = 0 oder ∃i ∈ µ\ {k} : Di,2νg −1 = 0 ∪ {g + 12 ; g ∈ G + 1, Kg · Kg+1 = −1} . Mit S := #Σ gibt es genau eine monotone Bijektion γ von S + 2 nach {0} ∪ Σ ∪ {G + 1}. Zur Verbesserung der Lesbarkeit bei dreifacher Indizierung schreiben wir für s ∈ Σ∩N anstelle von νγs im Rest des Beweises32 ν · γs . Das Hinzufügen von {0} und {G + 1} zum Wertebereich hat zur Folge, dass xν·γ0 = −∞ und xν·γS+1 = ∞. Bemerkung. Zu den im Verfahren zur Bestimmung von V verwendeten Größen sind im dritten Teil des Beweises die Größen K, Σ, S und γ hinzugekommen. Auch zu ihrer Definition wurden ausschließlich Größen verwendet, die aus der Vorzeichenmatrix R abgeleitet sind. Vierter Teil des Beweises: Die Nummerierung y Für s ∈ S + 2 setzen wir xν·γ ys := , wenn γs ∈ N s zγs − 1 2 . , wenn γs ∈ /N Diese Definition ist korrekt, weil für γs ∈ / N die Zwischen-Nullstelle zγs − 1 von vˆk we2 gen Kγs − 1 · Kγs + 1 = −1 existiert. Die auf diese Weise erhaltene Funktion 2 2 y ∈ ({−∞} ∪ R ∪ {∞})S+2 ist injektiv. Wir behaupten jetzt, damit bereits die isolierten Nullstellen von v indiziert zu haben: Behauptung: 32 {ys ; 1 ≤ s ≤ S} = IN (v) (2.9) Wenn dabei · als die Verkettung ◦ von Funktionen aufgefasst wird, erklärt sich die Notation ν · γs = (ν · γ)s von selbst. Allerdings ist dabei zu beachten, dass R (γ) wegen womöglicher nichtnatürlicher Elemente von Σ nicht zwangsläufig Teilmenge von D (ν) ist, was Zweifel daran wecken könnte, ob die Verkettung ν ◦ γ überhaupt definiert sei. Betrachtet man aber die Verkettung beliebiger Relationen a und b als durch b ◦ a := {(x, z) ; ∃y : ((x, y) ∈ a ∧ (y, z) ∈ b)} definiert, so hat man kein Problem. 45 2 Der Satz von Tarski-Seidenberg Wir beweisen jede Inklusion einzeln: 1. Die Richtung „⊆“: Sei 1 ≤ s ≤ S. Dann unterscheiden wir drei Fälle. a) Fall γs ∈ N und Kγs 6= 0: Aufgrund der Definition von Σ gibt es i ∈ µ\ {k} mit Di,2(ν·γs )−1 = 0. Damit gilt sgn (v̂i (ys )) = sgn d̂i (ys ) = sgn d̂i (xν·γs ) i6=k = Di,2(ν·γs )−1 = 0 mit 2.2 und weil vi 6= 0, gilt damit ys ∈ IN (v). b) Fall γs ∈ N und Kγs = 0: Weil sgn (vˆk (ys )) = sgn (vˆk (xν·γs )) ys ∈ IN (v). = mit 2.8 Kγs = 0 und vk 6= 0, gilt c) Fall γs ∈ / N: Dann ist ys = zγs − 1 eine Nullstelle von vˆk . Wegen vk 6= 0 gilt ys ∈ IN (v). 2 2. Die Richtung „⊇“: Sei ξ ∈ IN (v). Dann gibt es i ∈ µ, sodass33 vi 6= 0 und v̂i (ξ) = 0. Wieder unterscheiden wir drei Fälle: a) Fall i 6= k: Wegen vi = di gilt dann d̂i (ξ) = 0 und daher ξ ∈ IN (r). Also gibt es 1 ≤ n ≤ N mit xn = ξ. Wegen 2.2 gilt Di,2n−1 = sgn d̂i (xn ) = 0 und daher n ∈ Γ. Das bedeutet, es gibt 1 ≤ g ≤ G mit νg = n. Da Di,2νg −1 = 0 und i ∈ µ\ {k}, gilt g ∈ Σ ∩ N. Also gibt es 1 ≤ s ≤ S mit γs = g. Damit gilt ys = xν·γs = xνg = xn = ξ. γs ∈N b) Fall i = k und ∃1 ≤ g ≤ G : xνg = ξ : Dann gilt Kg = sgn vˆk xνg = sgn (vˆk (ξ)) = 0 und daher g ∈ Σ ∩ N. mit 2.8 Wie in Fall 2a gibt es damit 1 ≤ s ≤ S mit γs = g und es gilt ys = γs ∈N xν·γs = xνg = ξ. 33 vi 6= 0 gilt sowieso für alle i ∈ µ. 46 2.2 Das Reduktionslemma c) Fall i = k und ∀1 ≤ g ≤ G : xνg 6= ξ : Dann gibt es g ∈ G + 1 mit ξ ∈ Ig . Da vˆk im Intervall Ig höchstens eine Nullstelle besitzt und ξ eine solche ist, gilt Kg · Kg+1 = −1 und zg = ξ. Aus der Definition von Σ ergibt sich, dass g + 12 ∈ Σ. Da es folglich 1 ≤ s ≤ S mit γs = g + 1 2 gibt, gilt ys = zγs − 1 = zg = ξ. γs ∈N / 2 Behauptung 2.9 ist bewiesen. Weil zudem y0 = γ0 =0∈N xν·γ0 = −∞ und yS+1 = γS+1 =G+1∈N xν·γS+1 = ∞, folgt, dass y die Nummerierung der isolierten Nullstellen von v ist: in (v) = y (2.10) Wir sind jetzt an der Stelle angekommen, an der wir die Matrix V konkret konstruieren können. Da wir wollen, dass V gleich SGN (v) ist (d. h., dass V die gewünschte Eigenschaft 2.1 erfüllt), setzen wir die Zeilenzahl von V gleich µ und die Anzahl der Nullstellen von V aufgrund von eben Bewiesenem gleich S (d. h. die Zahl der Spalten von V gleich 2S + 1). Bis zum Ende des Beweises ist jetzt noch Folgendes zu tun: Die Einträge der Vorzeichenmatrix V müssen (unter alleiniger Verwendung von aus der Vorzeichenmatrix R abgeleiteten Größen) mit Werten aus {−1, 0, 1} belegt werden und zugleich muss bewiesen werden, dass diese Einträge gleich den Einträgen aus SGN (v) sind. Wenn wir uns im fünften Teil des Beweises denjenigen Einträgen von V zuwenden, die Punkten auf der reellen Achse entsprechen (d. h. Vi,2s−1 für i ∈ µ und 1 ≤ s ≤ S) und dann im sechsten Teil des Beweises denjenigen, die Intervallen entsprechen (d. h. Vi,2s für i ∈ µ und s ∈ S + 1), erreichen wir sämtliche Einträge von V . Fünfter Teil des Beweises: Einträge von V , die Punkten auf der reellen Achse entsprechen Sei i ∈ µ und 1 ≤ s ≤ S. Dann gilt SGN (v)i,2s−1 = Def. 2.2.12 auf Seite 38 sgn (v̂i (in (v)s )) = mit 2.10 sgn (v̂i (ys )) . (2.11) 47 2 Der Satz von Tarski-Seidenberg Wir unterscheiden vier Fälle: 1. Fall i 6= k und γs ∈ N. Dann gilt SGN (v)i,2s−1 sgn (v̂i (ys )) = sgn d̂i (ys ) = mit 2.11 sgn d̂i (xν·γs ) = γs ∈N i6=k = Di,2(ν·γs )−1 . mit 2.2 Also erreichen wir durch Setzen von Vi,2s−1 Vi,2s−1 = SGN (v)i,2s−1 . := Di,2(ν·γs )−1 , dass 2. Fall i 6= k und γs ∈ / N. Weil i ∈ µ\ {k}, gilt vi = ri = di . Sei zur Abkürzung g := γs − 12 . Im Intervall i h I (r)νg = xνg , xνg +1 wechselt rˆi = d̂i sein Vorzeichen nicht. i h Nach 2.6 wechselt d̂i auch im Intervall Ig = xνg , xνg+1 sein Vorzeichen nicht. Weil die beiden Intervalle nichtleeren Schnitt haben, gilt daher h ∈ sgn d̂i [Ig ] i h h =∈ sgn rˆi I (r)νg ii . (2.12) Damit berechnen wir SGN (v)i,2s−1 sgn d̂i zγs − 1 h h sgn (v̂i (ys )) = sgn d̂i (ys ) i6=k = sgn d̂i (zg ) ii = Setzen h = ∈ sgn d̂i [Ig ] zg ∈Ig Bem. 2.2.15 auf Seite 39 Also erreichen wir durch Vi,2s−1 = SGN (v)i,2s−1 . mit 2.11 2 ∈ sgn rˆi I (r)νg = = γs ∈N / i = mit 2.12 SGN (r)i,2νg = Ri,2νg = Ri,2νγ 1 s− 2 von Vi,2s−1 := Ri,2νγ 1 s− 2 , . dass 3. Fall i = k und γs ∈ N. Dann gilt SGN (v)k,2s−1 = mit 2.11 sgn (vˆk (ys )) = sgn (vˆk (xν·γs )) = Kγs und wir erreichen durch Vk,2s−1 = SGN (v)k,2s−1 . 48 γs ∈N Setzen mit 2.8 von Vk,2s−1 := Kγs , (2.13) dass 2.2 Das Reduktionslemma 4. Fall i = k und γs ∈ / N. Dann gilt SGN (v)k,2s−1 = mit 2.11 sgn (vˆk (ys )) = sgn vˆk zγs − 1 γs ∈N / 2 =0 und wir erreichen durch Setzen von Vk,2s−1 := 0, dass Vk,2s−1 = SGN (v)k,2s−1 . Für die Einträge der Vorzeichenmatrix V , denen in diesem Teil des Beweises ein Wert zugewiesen wurde, gilt zusammenfassend: ∀i ∈ µ ∀1 ≤ s ≤ S : Vi,2s−1 = SGN (v)i,2s−1 (2.14) Sechster Teil des Beweises: Einträge von V , die Intervallen entsprechen Sei i ∈ µ und s ∈ S + 1. Dann gilt i I (v)s = in (v)s , in (v)s+1 h = mit 2.10 ]ys , ys+1 [ . (2.15) Wir unterscheiden fünf Fälle: 1. Fall i 6= k und γs ∈ N. Weil i ∈ µ\ {k}, gilt vi = ri . Im Intervall I (v)s = mit 2.15 ]ys , ys+1 [ = ]xν·γs , ys+1 [ wechselt v̂i = rˆi sein Vorzeiγs ∈N chen nicht. Auch im Intervall I (r)ν·γs = ]xν·γs , xν·γs +1 [ wechselt rˆi sein Vorzeichen nicht. Weil die beiden Intervalle nichtleeren Schnitt haben gilt daher h h ∈ (sgn [v̂i [I (v)s ]]) =∈ sgn rˆi I (r)ν·γs ii . (2.16) Damit berechnen wir SGN (v)i,2s h h ∈ (sgn [v̂i [I (v)s ]]) = Bem. 2.2.15 auf Seite 39 ∈ sgn rˆi I (r)ν·γs ii = Bem. 2.2.15 auf Seite 39 = mit 2.16 SGN (r)i,2(ν·γs ) = Ri,2(ν·γs ) . Also erreichen wir durch Setzen von Vi,2s := Ri,2(ν·γs ) , dass Vi,2s = SGN (v)i,2s . 49 2 Der Satz von Tarski-Seidenberg 2. Fall i 6= k und γs ∈ / N. Sei zur Abkürzung g := γs − 21 . Weil i ∈ µ\ {k}, gilt vi = di . Im Intervall I (v)s = mit 2.15 ]ys , ys+1 [ = ]zg , ys+1 [ wechselt v̂i sein Vorzeichen γs ∈N / nicht. Nach 2.6 wechselt v̂i = d̂i auch im Intervall Ig sein Vorzeichen nicht. Weil zg ∈ Ig haben die beiden Intervalle nichtleeren Schnitt und es gilt ∈ (sgn [v̂i [I (v)s ]]) =∈ (sgn [v̂i [Ig ]]) . (2.17) Damit berechnen wir SGN (v)i,2s ∈ (sgn [v̂i [I (v)s ]]) = = ∈ (sgn [v̂i [Ig ]]) = sgn (v̂i (zg )) = sgn v̂i zγs − 1 2 zg ∈Ig mit 2.17 Bem. 2.2.15 auf Seite 39 = sgn (v̂i (ys )) = 2.11 anwendbar, weil 1≤s≤S (wäre s=0, so wäre γs =0∈N) SGN (v)i,2s−1 = mit 2.14 Vi,2s−1 . Durch Setzen von Vi,2s := Vi,2s−1 (dem auf der rechten Seite der Definitionsgleichung stehenden Eintrag von V wurde bereits in Fall 2 des fünften Teils des Beweises auf Seite 48 der Wert Ri,2νγ − 1 zugewiesen) erreichen wir, dass s 2 Vi,2s = SGN (v)i,2s . 3. Fall i = k, γs ∈ N und Kγs 6= 0. Dann gilt 0 6= Kγs = mit 2.13 sgn (vˆk (ys )) ∈ (sgn [vˆk [I (v)s ]]) h h = ∈ sgn vˆk ]ys , ys+1 [ ii weil 6=0 = Bem. 2.2.15 auf Seite 39 = mit 2.15 SGN (v)i,2s . Also erreichen wir durch Setzen von Vi,2s := Kγs , dass Vi,2s = SGN (v)i,2s . 4. Fall i = k, γs ∈ N und Kγs = 0. Dann gilt Dk,2(ν·γs ) = Rk,2(ν·γs ) = SGN (r)k,2(ν·γs ) 50 = Bem. 2.2.15 auf Seite 39 2.2 Das Reduktionslemma h h ∈ sgn rˆk I (r)ν·γs ii h h =∈ sgn dˆk I (r)ν·γs ii . (2.18) Weil deg dk = µk ∈ N, gilt dk 6= 0 und die Polynomfunktion dˆk kann auf dem Intervall I (r)ν·γs nicht verschwinden. Mit 2.18 folgt Dk,2(ν·γs ) ∈ {−1, 1}. Im Intervall I (v)s = mit 2.15 ]ys , ys+1 [ wechselt vˆk sein Vorzeichen nicht. Im Intervall I (r)ν·γs = ]xν·γs , xν·γs +1 [ = ]ys , xν·γs +1 [ wechselt rˆk = dˆk sein γs ∈N k∈µ Vorzeichen nicht. Weil die beiden Intervalle nichtleeren Schnitt haben, gibt es ξ ∈ I (v)s ∩I (r)ν·γs . Für alle t ∈ ]ys , ξ[ gilt sgn dˆk (t) = t∈I(r)ν·γs h h ∈ sgn dˆk I (r)ν·γs ii = mit 2.18 Dk,2(ν·γs ) ∈ {−1, 1} . (2.19) ! Weil s 6= 0 andernfalls wäre Kγs = Kγ0 = K0 = sgn (vˆk (−∞)) 6= 0 und mit 2.8 vk 6=0 damit 1 ≤ s ≤ S, gilt ys ∈ R. Weil sgn (vˆk (ys )) = mit 2.13 Kγs = 0, gilt vˆk (ys ) = 0. Es ergibt sich ˆξ | {z } =0 dˆk (t) dt ∂ vˆk (t) dt = vˆk (ξ) = vˆk (ys ) + ys ∈R ˆξ ys ys und aus ys < ξ und 2.19 schließt man sgn (vˆk (ξ)) = Dk,2(ν·γs ) . Damit erhält man SGN (v)k,2s = ∈ (sgn [vˆk [I (v)s ]]) Bem. 2.2.15 auf Seite 39 = ξ∈I(v)s sgn (vˆk (ξ)) = Dk,2(ν·γs ) und durch Setzen von Vk,2s := Dk,2(ν·γs ) erreichen wir, dass Vk,2s = SGN (v)k,2s . 5. Fall i = k und γs ∈ / N. Sei zur Abkürzung g := γs − 21 . Wir zeigen zuerst, dass xνg+1 ∈ ]ys , ys+1 ] . i (2.20) h Weil Ig = xνg , xνg+1 , gilt ys = zg < xνg+1 , was die Einhaltung der linken γs ∈N / zg ∈Ig Intervallgrenze zeigt. 51 2 Der Satz von Tarski-Seidenberg Falls γs+1 ∈ N, gilt ys+1 = xν·γs+1 ≥ γs+1 −γs ≥ 12 xνγ 1 s+ 2 = xνg+1 . i Falls γs+1 ∈ / N, gibt es h ∈ N, sodass ys+1 = zg+1+h ∈ Ig+1+h = xνg+1+h , xνg+2+h und damit gilt ys+1 > xνg+1+h ≥ xνg+1 ≥ xνg +1 . h νg+1 −νg ≥1 In beiden Fällen wird also auch die rechte Intervallgrenze eingehalten. Damit ist 2.20 gezeigt. Im Intervall I (v)s = mit 2.15 ]ys , ys+1 [ wechselt vˆk sein Vorzeichen nicht. Weil Kg · Kg+1 = −1, gilt Kg+1 6= 0. Wir berechnen 0 6= Kg+1 = sgn vˆk xνg+1 mit 2.8 = h h ∈ sgn vˆk ]ys , ys+1 [ ii = mit 2.20 weil 6=0 ∈ (sgn [vˆk [I (v)s ]]) = Bem. 2.2.15 auf Seite 39 Also erreichen wir durch Setzen von Vk,2s Vk,2s = SGN (v)k,2s . SGN (v)k,2s . := Kg+1 = Kγs + 1 , dass 2 Damit ist Lemma 2.2.18 bewiesen. 2.3 Häufigkeiten In Abschnitt 2.2 wurde auf Seite 33 angekündigt, dass wir die Häufigkeit eines Polynomvektors beliebig vermindern können, wenn wir die Funktionen redkµ nur oft und geschickt genug auf ihn anwenden. Dabei ist bis jetzt weder klar, was dabei mit Häufigkeit gemeint ist, noch, unter welchen Bedingungen man von einer Verminderung derselben spricht. In diesem Abschnitt werden diese Fragen beantwortet und das nötige Werkzeug bereitgestellt, um die Funktionen redkµ dann in Abschnitt 2.4 „oft und geschickt genug“ auf Polynomvektoren anwenden zu können. n o Definition 2.3.1. Sei34 Φ := ϕ ∈ NN ; spt ϕ endlich . Die Elemente von Φ nennen wir Häufigkeiten. 34 Für ϕ ∈ NN sei spt ϕ := [N\ {0}] ϕ der Träger von ϕ. Aus Fußnote 3 auf Seite 9 ergibt sich [N\ {0}] ϕ = {n ∈ N; ϕn 6= 0}. 52 2.3 Häufigkeiten Definition 2.3.2. Sei R ein kommutativer Ring mit Eins und v ein Polynomvektor über R. Dann sei die Häufigkeit (englisch: frequency) von v durch35 frq v := (# {i ∈ v; noc vi = n})n∈N ∈ Φ definiert. Für alle n ∈ N ist also (frq v)n die Anzahl der Komponenten von v, deren Koeffizientenzahl gleich n ist. Die soeben definierte Häufigkeit eines Polynomvektors ist die Größe, die wir durch Anwendung der Funktionen redkµ vermindern wollen. Was dabei Verminderung bedeutet, legt die folgende Definition fest: Definition 2.3.3. Sind σ, ϕ ∈ Φ Häufigkeiten, dann sagt man σ ist kleiner als ϕ und schreibt dafür σ < ϕ, wenn ∃k ∈ N : (σk < ϕk ∧ ∀n > k : σn = ϕn ) . Jetzt kann bewiesen werden, dass die Funktionen redkµ tatsächlich die Häufigkeit von Polynomvektoren vermindern: Lemma 2.3.4. Seien R ein kommutativer Ring mit Eins, µ ein Multiindex, k ∈ µ derart, dass m := (µ + 1 + ek )k = max (µ + 1 + ek ) und v ∈ Rµ+1+ek h1i.36 Gilt außerdem (vk )m−1 6= 0, so gilt frq redkµ (v) < frq v. Beweis. Aus der Definition der Funktionen redkµ (Definition 2.2.8 auf Seite 35) folgt, h1i. dass redkµ (v) ∈ R µ+1 µ 35 Der Begriff der Koeffizientenzahl noc p eines Polynoms p wird in Definition 1.1.6 auf Seite 11 eingeführt. Ist E eine endliche Menge, so bezeichnen wir mit #E die Zahl der Elemente von E. 36 Dies sind genau die in der Definition der Funktionen redkµ (Definition 2.2.8 auf Seite 35) getroffenen Voraussetzungen. In Definition 2.2.6 auf Seite 35 wird der Begriff Multiindex und in der darauffolgenden Definition 2.2.7 auf Seite 35 die Notation RK h1i eingeführt. ( ! 1 , wenn i = k Mit ek ist hier wie auf Seite 35 der Multiindex ek := gemeint. 0 , wenn i 6= k i∈µ 53 2 Der Satz von Tarski-Seidenberg Daraus ergibt sich für alle Indizes i ∈ redkµ (v)\v die Ungleichung noc redkµ (v)i ≤ µi < max (µ + 1 + ek ) = m (2.21) und für i = k die Ungleichung noc redkµ (v)k ≤ µk + 1 < max (µ + 1 + ek ) = m. (2.22) Die Voraussetzung (vk )m−1 6= 0 bewirkt, dass die Koeffizientenzahl noc vk nicht nur, wie aus v ∈ Rµ+1+ek h1i folgt, kleiner gleich, sondern sogar gleich m ist. Damit gilt die Ungleichung # i ∈ v\ {k} ; noc n frq redkµ (v) m o = # i ∈ redkµ (v); noc redkµ (v)i = m redkµ (v)i | {z = mit 2.21 und 2.22 = m = # {i ∈ v\ {k} ; noc vi = m} } < noc vk =m =vi , weil i∈v\{k} # {i ∈ v; noc vi = m} = (frq v)m und für alle n > m, weil die Koeffizientenzahlen aller Komponentenpolynome von sowohl v als auch redkµ (v) höchstens m = max (µ + 1 + ek ) betragen, die Gleichung frq redkµ (v) n n 0 = # {i ∈ v; noc vi = n} = (frq v)n . n>m Es gilt also wie behauptet frq redkµ (v) < frq v. 54 o = # i ∈ redkµ (v); noc redkµ (v)i = n = n>m 2.3 Häufigkeiten Lemma 2.3.5. Die in Definition 2.3.3 auf Seite 53 definierte Relation < ist eine wohlfundierte Relation37 . Beweis. Nach Lemma 1.3.3 auf Seite 18 reicht es, zu zeigen, dass jede nichtleere Menge K ⊆ Φ ein bezüglich < in K vorgängerloses Element besitzt. Sei also K ⊆ Φ und K 6= ∅. Weil K 6= ∅, gibt es ε ∈ K. Sei m := min {n ∈ N; spt ε ⊆ n}. Wir definieren rekursiv eine Funktion M ∈ ℘ (K)m+1 durch M := {ϕ {ϕ ∈ K; spt ϕ ⊆ m} , wenn n = m ∈ Mn+1 ; ϕn = min {σn ; σ ∈ Mn+1 }} , wenn n ∈ m . n∈m+1 Per Induktion sieht man, dass für alle n ∈ m + 1 die Menge Mn nicht leer ist: Wegen ε ∈ Mm gilt Mm 6= ∅ und für alle n ∈ m folgt aus Mn+1 6= ∅, dass Mn 6= ∅. Also gibt es µ ∈ M0 . Wir zeigen, dass µ vorgängerlos in K ist: Gäbe es κ ∈ K mit κ < µ, so gäbe es k ∈ N mit κk < µk und ∀n > k : κn = µn . Wir führen jetzt sowohl den Fall k ≥ m als auch den Fall k < m zum Widerspruch: 1. Fall k ≥ m. Wegen µ ∈ Mm wäre dann k ∈ / spt µ und damit µk = 0 im Widerspruch zu κk < µk . 2. Fall k < m. Wir zeigen per Induktion, dass dann ∀k < n ≤ m : κ ∈ Mn wäre: Induktionsanfang: Sei r ≥ m. Weil µ ∈ Mm , gilt dann µr = 0 und es wäre κr = µr = 0. Da dies für alle r ≥ m so wäre, wäre κ ∈ Mm . r>k Induktionsschritt: Sei k < n < m und κ ∈ Mn+1 . Dann wäre κn = µn n>k = µ∈Mn min {σn ; σ ∈ Mn+1 } und demzufolge κ ∈ Mn . Insbesondere wäre also κ ∈ Mk+1 und daher κk ≥ min {σk ; σ ∈ Mk+1 }. Weil aber µ ∈ Mk und daher µk = min {σk ; σ ∈ Mk+1 }, wäre κk ≥ µk im Widerspruch zu κk < µk . 37 Der Begriff wohlfundierte Relation wird in Definition 1.3.2 auf Seite 18 eingeführt. 55 2 Der Satz von Tarski-Seidenberg 2.4 Beweis des Satzes von Tarski-Seidenberg In diesem Abschnitt wird der Satz von Tarski-Seidenberg bewiesen. Lemma 2.4.1. Sei38 v ∈ ∪ Rh1i[N] ein reeller Polynomvektor,39 k ∈ [{0}] v und V eine Vorzeichenmatrix40 . Dann gilt41 V = SGN (v) ⇔ V [{k} × N] = {0} und V |N\{k},N = SGN v|N\{k} . Beweis. Weil k ∈ [{0}] v, gilt k ∈ v. Weil vk = 0, folgt aus der Definition der Menge der isolierten Nullstellen eines Polynomvektors (Definition 2.2.11 auf Seite 37), dass IN (v) = IN v|N\{k} . Wir beweisen jede Implikation einzeln. 1. Die Richtung „⇒“: Sei V = SGN (v). Aus k ∈ v, vk = 0 und aus der Definition von SGN (Definition 2.2.12 auf Seite 38) folgt V [{k} × N] = {0}. Die Gleichung V |N\{k},N = SGN v|N\{k} gilt, weil wegen IN (v) = IN v|N\{k} für alle i ∈ v die i-te Zeile von SGN (v) nur von der i-ten Komponente von v abhängt. 2. Die Richtung „⇐“: Sei V [{k} × N] = {0} und V |N\{k},N = SGN v|N\{k} . Dann folgt aus V [{k} × N] 6= ∅, dass k ∈ V und damit V = V |N\{k},N + 1 = SGN v|N\{k} + 1 = v|N\{k} + 1 = v = SGN (v). k∈V k∈v Wir zeigen jetzt, dass auch |V | = |SGN (v)| und dass die Einträge der Matrizen übereinstimmen: 38 Die beiden Begriffe Polynomvektor und reeller Polynomvektor werden in Definition 2.2.1 auf Seite 33 eingeführt. [N] z Nach Fußnote 16 auf Seite 33 ist ∪ Rh1i = ∪ {Rh1i ; z ∈ N} die Menge der reellen Polynomvektoren. 39 Aufgrund von Fußnote 3 auf Seite 9 bedeutet hier k ∈ [{0}] v, dass k ∈ v und vk = 0. 40 In Definition 2.2.16 auf Seite 39 wird der Begriff Vorzeichenmatrix definiert. 41 Die Funktion SGN wird in Definition 2.2.12 auf Seite 38 definiert. Mit Fußnote 3 auf Seite 9 ergibt sich, dass V [{k} × N] = {0} eine kurze Schreibweise für k ∈ V ∧ ∀j ∈ |V | : Vk,j = 0 ist. Die Notationen zum Streichen von Komponenten aus Vektoren und von Zeilen und Spalten aus Matrizen werden in den Definitionen 2.1.3 und 2.1.4 auf Seite 27 festgelegt. 56 2.4 Beweis des Satzes von Tarski-Seidenberg a) Fall V ≤ 1. Weil k ∈ V gilt dann V = 1 und k = 0. Weil V Vorzeichenmatrix, gibt es einen reellen Polynomvektor w mit V = SGN (w). Mit V [{0} × N] = {0} folgt w = (0)i∈1 . Wegen v = V = 1 und v0 = vk = 0 gilt auch v = (0)i∈1 . Also gilt V = SGN (w) = SGN (v). b) Fall V > 1. In diesem Fall gilt V |N\{k},N 6= ∅ und damit auch v|N\{k} 6= ∅ und deshalb |V | = V |N\{k},N = SGN v|N\{k} 2 · #IN v|N\{k} + 1 = 2 · #IN (v) + 1 = Def. 2.2.12 auf Seite 38 = Def. 2.2.12 auf Seite 38 |SGN (v)| . Die Einträge stimmen auch überein, weil die k-ten Zeilen aufgrund der Rechnung V |{k},N = (0)(i,j)∈1×|V | = (0)(i,j)∈1×|SGN(v)| = SGN (v) |{k},N vk =0 gleich sind und für alle i ∈ V \ {k} = SGN (v)\ {k} die i-te Zeile von SGN (v) wegen IN (v) = IN v|N\{k} nur von der entsprechenden Kompo nente von v|N\{k} abhängt und demzufolge wegen V |N\{k},N = SGN v|N\{k} gleich der entsprechenden Zeile von V |N\{k},N , d. h. gleich der i-ten Zeile von V ist. Lemma 2.4.2. Sei n ∈ N. Dann hat die Menge42 F := ϕ ∈ Φ; ^ ^ [N] v∈∪((Rhni)h1i frq v=ϕ ) {x ∈ Rn ; SGN (vx̂ ) ∈ M } ∈ V (Rn ) M Menge von Vorzeichenmatrizen die Eigenschaft ∀ϕ ∈ Φ : 42 ({σ ∈ Φ; σ < ϕ} ⊆ F ⇒ ϕ ∈ F). In Definition 1.2.5 auf Seite 14 wird die Menge V (Rn ) der semialgebraischen Teilmengen von Rn definiert. Die Schreibweise px̂ für Polynome p ∈ (Rhni)h1i und Vektoren x ∈ Rn wird in Definition 1.1.8 auf Seite 12 eingeführt. 57 2 Der Satz von Tarski-Seidenberg Korollar 2.4.3. Weil < nach Lemma 2.3.5 auf Seite 55 eine wohlfundierte Relation ist, sagt Lemma 2.4.2 wegen Lemma 1.3.4 auf Seite 19 aus, dass ^ ^ ^ n∈N v∈∪((Rhni)h1i[N] ) M Menge von {x ∈ Rn ; SGN (vx̂ ) ∈ M } ∈ V (Rn ) . Vorzeichenmatrizen Beweis. Wir beweisen jetzt Lemma 2.4.2. Sei ϕ ∈ Φ und {σ ∈ Φ; σ < ϕ} ⊆ F . (2.23) Sei v ∈ ∪ (Rhni)h1i[N] mit frq v = ϕ und M eine Menge von Vorzeichenmatrizen. Zu zeigen ist, dass die Menge S := {x ∈ Rn ; SGN (vx̂ ) ∈ M } semialgebraisch ist. Wir unterscheiden 4 Fälle: 1. Fall v = ∅. Für alle x ∈ Rn gilt dann vx̂ = ∅ und daher SGN (vx̂ ) = ∅. Je nachdem, ob ∅ ∈ M oder ∅ ∈ / M , gilt damit S = Rn oder S = ∅; in beiden Fällen ist S semialgebraisch. 2. Fall ∃k ∈ v : vk = 0. In diesem Fall können wir durch Streichen der Nullzeile die Häufigkeit des Polynomvektors verkleinern. Seien dazu u := v|N\{k} und n o L := V |N\{k},N ; V ∈ M, V [{k} × N] = {0} . Weil die Ungleichung (frq u)0 = # {i ∈ u; noc ui = 0} = # ([{0}] u) < # ([{0}] v) = # {i ∈ v; noc vi = 0} = (frq v)0 und für alle m > 0 die Gleichungen (frq u)m = # {i ∈ u; noc ui = m} = # {i ∈ v; noc vi = m} = (frq v)m 58 2.4 Beweis des Satzes von Tarski-Seidenberg gelten, gilt frq u < frq v = ϕ. Weil mit 2.23 deshalb frq u ∈ F , folgt aus der Umformung S = {x ∈ Rn ; SGN (vx̂ ) ∈ M } = {x ∈ Rn ; ∃V ∈ M : V = SGN (vx̂ )} = Lemma 2.4.1 n x ∈ Rn ; ∃V ∈ M : V [{k} × N] = {0} , V |N\{k},N = SGN vx̂ |N\{k} n o = o x ∈ Rn ; ∃V ∈ M : V [{k} × N] = {0} , V |N\{k},N = SGN (ux̂ ) = {x ∈ Rn ; SGN (ux̂ ) ∈ L} und der Definition von F , dass S semialgebraisch. 3. Fall v 6= ∅ und ∀i ∈ v : noc vi = 1. Für alle x ∈ Rn und alle i ∈ v ist dann die Polynomfunktion ((vx̂ )i )β y β X (vd x̂ )i = R 3 y 7→ β∈spt((vx̂ )i ) = spt(vi )={0} R 3 y 7→ ((vi )x̂ )0 = R 3 y 7→ (vd i )0 (x) konstant. Für alle x ∈ Rn ist deshalb die Menge IN (vx̂ ) der isolierten Nullstellen von vx̂ leer. Mit der Definition von SGN (Definition 2.2.12 auf Seite 38) folgt, dass die das Vorzeichenverhalten von vx̂ beschreibende Vorzeichenmatrix SGN (vx̂ ) einspaltig ist und sich als SGN (vx̂ ) = sgn (vd i )0 (x) (i,j)∈v×1 schreiben lässt. Damit ist43 S = {x ∈ Rn ; SGN (vx̂ ) ∈ M } = n n x ∈ R ; ∃V ∈ M : V = sgn (vd) i 0 (x) (i,j)∈v×1 = o x ∈ Rn ; ∃V ∈ M ∩ {−1, 0, 1}v×1 : ∀i ∈ v : Vi,0 = sgn (vd i )0 (x) 43 = Die Menge Λ der Achsenabschnitte, die Menge U (Rn ) der Polynom-Urbilder und die Menge S (Rn ) der Urbildschnitte werden auf Seite 13 definiert. 59 2 Der Satz von Tarski-Seidenberg ( ( ) ∪ ∩ [ Vi,0 · R>0 | {z i 0 {z ; i ∈ v ; V ∈ M ∩ {−1, 0, 1} ∈ V (Rn ) } ∈U (Rn ) {z | ) v×1 } ∈Λ | ](vd) } ∈S(Rn ) als endliche Vereinigung von endlichen Schnitten von Urbildern von Achsenabschnitten unter Polynomfunktionen auf Rn semialgebraisch. 4. Fall ∃i ∈ v : noc vi > 1 und ∀i ∈ v : vi 6= 0. Die Menge S kann dann wie folgt als Vereinigung von v + 1 Mengen dargestellt werden: S = S ∩ Rn = S∩ ∪ z∈v z∈v S ∩ [{0}] (v\ z )deg vz | {z ∩ [R\ {0}] (v\ z )deg vz = z∈v ∪ S } =: Tz ∪ ∪ [{0}] (v\ z )deg vz ∩ ∩ [R\ {0}] (v\ i )deg vi = i∈v {z | } =: Tv ∪ {Tz ; z ∈ v + 1} Weil aufgrund von Lemma 1.2.6 auf Seite 14 die Vereinigung endlich vieler semialgebraischer Mengen semialgebraisch ist, bleibt nur noch zu zeigen, dass für alle z ∈ v + 1 die Menge Tz semialgebraisch ist. a) Fall z ∈ v. In diesem Fall können wir die Häufigkeit des Polynomvektors durch Weglassen des höchsten Koeffizienten seines z-ten Komponentenpolynoms vermindern. Sei dazu u := 0 (vi ) α , wenn i = z und α = deg vz , sonst α∈N ∈ (Rhni)h1iv . i∈v Die Häufigkeit von u ist kleiner als die Häufigkeit von v, weil die Ungleichung (frq u)noc vz = #{i ∈ u; noc ui = noc vz } < | {z z∈ / } #{i ∈ v; noc vi = noc vz } = (frq v)noc vz | 60 {z z∈ } 2.4 Beweis des Satzes von Tarski-Seidenberg und für alle m > noc vz die Gleichungen (frq u)m = #{i ∈ u; noc ui = m} = #{i ∈ v; noc vi = m} = (frq v)m | {z | } z∈ / {z } z∈ / gelten. Mit 2.23 folgt daraus frq u ∈ F . Für alle x ∈ [{0}] (v\ z )deg vz gilt ux̂ = vx̂ , (2.24) weil für i = z und α = deg vz sowohl der Koeffizient ((ux̂ )z )deg vz = ((uz )x̂ )deg vz = (u\ z )deg vz (x) = Def. von u 0 als auch der Koeffizient ((vx̂ )z )deg vz = ((vz )x̂ )deg vz = (v\ z )deg vz (x) = 0 x∈[{0}](vz\ )deg vz verschwindet und andernfalls, d. h. für i 6= z oder α 6= deg vz , die Gleichung [ ((ux̂ )i )α = ((ui )x̂ )α = (u i )α (x) = Def. von u [ (v i )α (x) = ((vi )x̂ )α = ((vx̂ )i )α gilt. Damit ist Tz = S ∩ [{0}] (v\ z )deg vz = x ∈ Rn ; SGN (vx̂ ) ∈ M und (v\ z )deg vz (x) = 0 n x ∈ R ; SGN (ux̂ ) ∈ M und (v\ z )deg vz (x) = 0 = {x ∈ Rn ; SGN (ux̂ ) ∈ M } | = mit 2.24 {z ∈V(Rn ) weil frq u∈F und ∩ n [ {0} ](v\ z )deg vz ∈ V (R ) } |{z} ∈Λ | {z } ∈U (Rn )⊆S(Rn )⊆V(Rn ) wegen der Definition von F als Schnitt zweier semialgebraischer Mengen nach Lemma 1.2.8 auf Seite 15 semialgebraisch. 61 2 Der Satz von Tarski-Seidenberg b) Fall z = v. In diesem Fall können wir durch Anwendung einer der Funktionen44 redkµ die Häufigkeit des Polynomvektors verkleinern: Es gibt einen Index k ∈ v, sodass ∀i ∈ v : noc vk ≥ noc vi . Für diesen gilt noc vk > 1. Sei damit45 µ := (noc vi )i∈v − 1 − ek ∈ Nv derjenige Multiindex µ, für den gilt, dass die Komponenten von µ + 1 + ek die Koeffizientenzahlen der Komponentenpolynome von v sind. Weil damit (µ + 1 + ek )k = max (µ + 1 + ek ), liegt v im Definitionsbereich von redkµ und wir können u := redkµ (v) setzen. Weil der Koeffizient (vk )(µ+1+ek ) k −1 = (vk )noc vk −1 = (vk )deg vk 6= 0 nicht verschwindet, folgt mit Lemma 2.3.4 auf Seite 53, dass frq u < frq v. Mit 2.23 folgt daraus frq u ∈ F . ist der reelle Polynomvektor vx̂ Element Für alle x ∈ ∩ [R\ {0}] (v\ i) der Menge 46 i∈v Pkµ , deg vi weil für alle solche x und alle i ∈ vx̂ aus der Rechnung ((vx̂ )i )(µ+1+ek ) −1 = ((vx̂ )i )noc vi −1 = ((vx̂ )i )deg vi = i ((vi )x̂ )deg vi = (v\ i )deg vi (x) 6= 0 folgt, dass die Koeffizientenzahl noc (vx̂ )i nicht nur, wie aus v ∈ Rµ+1+ek h1i folgt, kleiner gleich, sondern sogar gleich (µ + 1 + ek )i ist. Damit ist Tv = S ∩ ∩ [R\ {0}] (v\ i )deg vi = i∈v In Definition 2.2.8 auf Seite 35 werden die Funktionen ( redkµ definiert. ! 1 , wenn i = k 45 Mit ek ist hier wie auf Seite 35 der Multiindex ek := 0 , wenn i 6= k 44 i∈v 46 In Definition 2.2.17 auf Seite 39 werden die Mengen Pkµ definiert. 62 gemeint. 2.4 Beweis des Satzes von Tarski-Seidenberg n und SGN (vx̂ ) ∈ M x ∈ R ; x ∈ ∩ [R\ {0}] (v\ i )deg vi i∈v | {z −1 =(REDkµ ) = } (SGN(redkµ (vx̂ ))) nach Lemma 2.2.18 auf Seite 40 (anwendbar weil vx̂ ∈Pkµ ) ! k x ∈ R ; x ∈ ∩ [R\ {0}] (v\ i )deg vi und SGN redµ (vx̂ ) n i∈v | {z ∈ REDkµ [M ] = } =(redkµ (v)) nach x̂ Lemma 2.2.10 auf Seite 37 k x ∈ R ; x ∈ ∩ [R\ {0}] (v\ i )deg vi und SGN (ux̂ ) ∈ REDµ [M ] = n i∈v ∩ ∩ [ R\ {0} ](v\ i )deg vi i∈v | {z } x ∈ Rn ; SGN (ux̂ ) ∈ REDkµ [M ] o {z } | ∈Λ | n {z ∈V(Rn ) weil frq u∈F und } ∈U (Rn )⊆S(Rn )⊆V(Rn ) wegen der Definition von F als Schnitt endlich vieler semialgebraischer Mengen nach Lemma 1.2.8 auf Seite 15 semialgebraisch. Lemma 2.4.4. Für n ∈ N und S ∈ S (Rn+1 ) gilt47 Rn+1 3 x 7→ (xk )k∈n [S] ∈ V (Rn ) , d. h. die Projektion von Urbildschnitten ist semialgebraisch. Beweis. Es gibt, weil S ∈ S (Rn+1 ), eine endliche Menge E ⊆ U (Rn ) von PolynomUrbildern, sodass S = ∩E. Sei48 z := #E. Dann gibt es eine Bijektion U : z → E. Für alle i ∈ z gibt es, weil Ui ∈ U (Rn ), ein Polynom pi ∈ Rhn + 1i und einen Achsenabschnitt λi ∈ Λ, sodass Ui = [λi ] pbi . Durch Auffassen dieser Polynome als Polynome in nur einer Variablen mit Koeffizienten aus Rhni erhalten wir den Polynomvektor49 v := pi h1i i∈z ∈ (Rhni)h1iz . Nach Fußnote 3 auf Seite 9 bezeichnet der Ausdruck Rn+1 3 x 7→ (xk )k∈n [S] das Bild der Menge S unter der Funktion Rn+1 3 x 7→ (xk )k∈n , d. h. er ist gleich {x ∈ Rn ; ∃y ∈ R : (x, y) ∈ S}. 48 Ist E eine endliche Menge, so wird mit #E die Zahl ihrer Elemente bezeichnet. 49 Zur Notation ph1i für Polynome p ∈ Rhn + 1i siehe Definition 1.1.7 auf Seite 12. 47 63 2 Der Satz von Tarski-Seidenberg Damit gilt n S = ∩E = ∩ {Ui ; i ∈ z} = ∩ {[λi ] pbi ; i ∈ z} = x ∈ Rn+1 ; ∀i ∈ z : pbi (x) ∈ λi o und mit der für alle x ∈ Rn und alle y ∈ R gültigen Rechnung pbi (x, y) = mit Lemma 1.1.10 auf Seite 13 \ d (pi )h1i (y) = (vd i )x̂ (y) = (vx̂ )i (y) x̂ erhält man Rn+1 3 x 7→ (xk )k∈n [S] = {x ∈ Rn ; ∃y ∈ R : (x, y) ∈ S} = n x ∈ R ; ∃y ∈ R ∀i ∈z : n pbi (x, y) | {z } d =(v x̂ )i (y) o x ∈ Rn ; ∃y ∈ R ∀i ∈ z : sgn (vd x̂ )i (y) ∈ λi ∈ λi = = Definition 2.2.12 auf Seite 38 n o x ∈ Rn ; ∃j ∈ 2 #IN (vx̂ ) + 1 ∀i ∈ z : SGN (vx̂ )i,j ∈ λi = n n x ∈ R ; SGN (vx̂ ) ∈ A; A Vorzeichenmatrix, A = z, ∃j ∈ |A| ∀i ∈ z : Ai,j ∈ λi | {z o . } Menge von Vorzeichenmatrizen Aus Korollar 2.4.3 auf Seite 58 ergibt sich, dass Rn+1 3 x 7→ (xk )k∈n [S] semialgebraisch ist. Satz 2.4.5 (Satz von Tarski-Seidenberg). Für n ∈ N und V ∈ V (Rn+1 ) gilt Rn+1 3 x 7→ (xk )k∈n [V ] ∈ V (Rn ) , d. h. die Projektion semialgebraischer Mengen ist semialgebraisch. Beweis. Es gibt, weil V ∈ V (Rn+1 ), eine endliche Menge E ⊆ S (Rn ) von Urbildschnitten, sodass V = ∪E. Damit ist Rn+1 3 x 7→ (xk )k∈n [V ] = Rn+1 3 x 7→ (xk )k∈n [∪E] = {x ∈ Rn ; ∃y ∈ R ∃S ∈ E : (x, y) ∈ S} = ∪ S∈E | Rn+1 3 x 7→ (xk )k∈n [S] ∈ V (Rn ) {z } semialgebraisch nach Lemma 2.4.4 auf der vorherigen Seite 64 2.4 Beweis des Satzes von Tarski-Seidenberg als Vereinigung endlich vieler semialgebraischer Mengen nach Lemma 1.2.6 auf Seite 14 semialgebraisch. 65 2 Der Satz von Tarski-Seidenberg 66 3 Anwendung des Satzes von Tarski-Seidenberg in der Theorie der partiellen Differentialgleichungen 3.1 Resultante und Diskriminante Definition 3.1.1. Seien R ein kommutativer Ring,1 A, B ∈ N, a ∈ RA+1 h1i und B b ∈ RB+1 h1i. Dann sei die Matrix a b ∈ R(A+B)×(A+B) durch A B a b := A ai−j b B+i−j 0 , wenn (j ∈ B) ∧ (i − j ∈ A + 1) , wenn (j ∈ / B) ∧ (B + i − j ∈ B , sonst + 1) (i,j)∈(A+B)2 definiert. B a b soll die Form der Matrix nachahmen. Im Fall A A = 2 und B = 3 gilt beispielsweise Bemerkung 3.1.2. Das Symbol 3 a b = 2 1 a0 a1 a0 a2 a1 a0 a2 a1 a2 b0 b1 b0 . b2 b1 b3 b2 b3 Die Mengen RK h1i werden in Definition 2.1.8 auf Seite 28 definiert. 67 3 Anwendung in der Theorie der partiellen Differentialgleichungen Die Buchstaben a und b stehen im Symbol ungefähr dort, wo die Koeffizienten von a und b in der Matrix stehen und die Zahlen A und B beschriften im Symbol die Abstände des Kreuzungspunktes vom unteren und oberen Matrixrand. Bemerkung 3.1.3. Die in Definition 2.1.10 auf Seite 29 für M , Q ∈ N, einen kommuM tativen Ring mit Eins R und b ∈ RM +1 h1i definierte Matrix b lässt sich mit Q M der soeben definierten Matrix als 1 b schreiben; dabei steht 1 für die Eins im Q Polynomring2 Rh1i, d. h. für das Polynom N 3 α 7→ 1{0} (α) ∈ R . Lemma 3.1.4. Seien R ein kommutativer Ring, A, B ∈ N, a ∈ RA+1 h1i, b ∈ RB+1 h1i, u ∈ RB h1i und v ∈ RA h1i. Dann gilt a u + b v ∈ RA+B h1i und B u a b = a u + b v, v A (ui )i∈B u wobei mit der Vektor gemeint ist und mit der rechten Seite der (vi )i∈A v Gleichung der Vektor ((a u + b v)i )i∈(A+B) , eine durch Bemerkung 2.1.9 auf Seite 28 gerechtfertigte Schreibweise. Beweis. Es gilt a u+b v ∈ RA+B h1i, weil für alle α ∈ N mit α ≥ A+B der Koeffizient X aβ uγ β+γ=α |{z} |{z} (a u + b v)α = (=0 für β>A) (=0 für γ≥B) {z | X bβ vγ β+γ=α |{z} |{z} + } =0 | (=0 für β>B) (=0 für γ≥A) {z } =0 verschwindet. Für alle i ∈ A + B gilt3 B X B u a b = a b v A A k∈B i 2 3 uk + i,k X k∈A B a b A vk = i,(B+k) Die Notation Rhni für Polynomringe wird in Definition 1.1.2 auf Seite 9 eingeführt. Die Verwendung der charakteristischen Funktionen 1A+1 und 1B+1 im Beweis könnte in Frage gestellt werden, da der Ring R nicht notwendigerweise über(eine Eins verfügt. In diesem Fall ai−k für i − k ∈ A + 1 fasse man zum Beispiel 1A+1 (i − k) ai−k als Abkürzung für auf. 0 sonst 68 3.1 Resultante und Diskriminante X 1A+1 (i − k) ai−k uk + X 1B+1 (B + i − (B + k)) bB+i−(B+k) vk = k∈A k∈B X 1A+1 (i − k) ai−k uk + k∈B X ai−k uk + X 1B+1 (i − k) bi−k vk = k∈A X k∈B k∈A i−k∈A+1 i−k∈B+1 bi−k vk = X aα uβ + α+β=i X bα vβ = (a u + b v)i , α+β=i was die behauptete Gleichung zeigt. Bemerkung 3.1.5. Satz 2.1.13 auf Seite 30 lässt sich wegen Bemerkung 3.1.3 als Sonderfall des soeben bewiesenen Lemmas auffassen. Definition 3.1.6. Seien R ein kommutativer Ring, A, B ∈ N, a ∈ RA+1 h1i und b ∈ RB+1 h1i. Dann nennen wir B ResA,B (a, b) := det a b ∈ R A die Resultante der Polynome a und b mit unterstellten Graden A und B. Lemma 3.1.7. Seien R ein kommutativer Ring, A, B ∈ N, a ∈ (Rh1i)A+1 h1i, b ∈ (Rh1i)B+1 h1i und r ∈ R. Dann gilt4 ResA,B (ar̂ , br̂ ) = Res\ A,B (a, b) (r) , d. h. es ist egal, ob man zuerst das Ringelement r in die Koeffizienten der Polynome a und b einsetzt und anschließend deren Resultante berechnet oder ob man zuerst die Resultante der Polynome a und b berechnet und anschließend in das dadurch erhaltene Polynom das Ringelement r einsetzt – man erhält das selbe Ergebnis. Beweis. Das Ringelement ResA,B (ar̂ , br̂ ) bzw. das Polynom ResA,B (a, b) geht aus den Koeffizienten (abi (r))i∈A und bbi (r) der Polynome ar̂ und br̂ bzw. den Koi∈B effizienten (ai )i∈A und (bi )i∈B der Polynome a und b durch von den Werten dieser B B Koeffizienten unabhängige Anordnung in der Matrix ar̂ br̂ bzw. a b und A A anschließender Determinantenbildung hervor. 4 Die Schreibweise pr̂ für Polynome p ∈ (Rh1i)h1i und r ∈ R wird in Definition 1.1.8 auf Seite 12 eingeführt. 69 3 Anwendung in der Theorie der partiellen Differentialgleichungen In der Bildungsvorschrift tauchen also ausschließlich Additionen und Multiplikationen auf, woraus mit Lemma 1.1.5 auf Seite 11 die behauptete Gleichung folgt. Satz 3.1.8. Seien R ein kommutativer Ring mit Eins, n ∈ N und A ∈ Rn×n . Dann sind die beiden folgenden Aussagen äquivalent: 1. Es gibt einen Vektor µ ∈ Rn \ {0}, sodass Aµ = 0. 2. Die Determinante det A ist ein Nullteiler5 in R. Beweis. Den Beweis dieses Satzes findet man bei [Oel, S. 233]. Dass er auch für n = 0 gilt, sieht man wie folgt: Für n = 0 gibt es nur eine Matrix A ∈ Rn×n = {∅} und für diese gilt det A = 1 (siehe Bemerkung 2.1.6 auf Seite 27). Die Eins ist nie Nullteiler, es reicht also zu zeigen, dass es keinen Vektor µ ∈ Rn \ {0} gibt. Dies folgt daraus, dass die Menge R0 = {∅} einelementig ist und der Vektor 0 in R0 gerade gleich ∅ ist. Da in einem Integritätsring6 die Null der einzige Nullteiler ist, erhalten wir: Korollar 3.1.9. Seien R ein Integritätsring, n ∈ N und A ∈ Rn×n . Dann sind die beiden folgenden Aussagen äquivalent: 1. Es gibt einen Vektor µ ∈ Rn \ {0}, sodass Aµ = 0. 2. Es gilt det A = 0. Kriterium 3.1.10. Seien R ein faktorieller Ring7 , A, B ∈ N mit8 A + B > 0, a ∈ RA+1 h1i und b ∈ RB+1 h1i. Dann sind die beiden folgenden Aussagen äquivalent: 1. Es gilt aA = bB = 0 oder es gibt t ∈ Rh1i mit deg t > 0, sodass9 t|a und t|b. 2. Es gilt ResA,B (a, b) = 0. 5 Zum Begriff Nullteiler siehe Definition 1.4.2 auf Seite 20. Der Begriff Integritätsring wird in Definition 1.4.5 auf Seite 20 definiert. 7 Der Begriff faktorieller Ring wird in Definition 1.4.9 auf Seite 21 definiert. 8 Ohne die Voraussetzung A + B > 0 gilt der Satz leider nicht, denn für A = B = 0 ist ResA,B (a, b) unabhängig vom Wert der Polynome a und b als Determinante der 0 × 0-Matrix immer gleich eins und kann daher nichts über die Existenz eines gemeinsamen nichtkonstanten Teilers der Polynome a und b aussagen. Ein solcher existiert im Fall A = B = 0 genau dann, wenn a = b = 0. 9 Die Schreibweise t|a bedeutet t teilt a, siehe dazu Definition 1.4.1 auf Seite 20. 6 70 3.1 Resultante und Diskriminante Beweis. Wir beweisen jede Richtung einzeln: 1⇒2: Wir unterscheiden zwei Fälle: B a b nicht die leere A Matrix, sie besitzt also eine unterste Zeile; ihr Zeilenindex ist i = A + B − 1. Mit Blick auf Definition 3.1.1 auf Seite 67 sieht man folgendermaßen, dass für B alle j ∈ A + B der Eintrag a b verschwindet: A A+B−1,j Für j ∈ B gilt, wenn der Eintrag nicht null ist, i − j = A + B − 1 − j ∈ A + 1, daher A + B − 1 − j < A + 1, d. h. j > B − 2, damit j = B − 1 und folglich i − j = A und der Eintrag ist gleich aA = 0. 1. Fall aA = bB = 0: Weil A + B > 0, ist die Matrix Für j ∈ / B sieht man ganz ähnlich, dass wenn der Eintrag nicht null ist, B + i − j = A + 2 B − 1 − j ∈ B + 1, daher A + 2 B − 1 − j < B + 1, d. h. j > A + B − 2, damit j = A + B − 1 und folglich B + i − j = B gilt und der Eintrag gleich bB = 0 ist. Die Matrix hat also eine Nullzeile, was zur Folge hat, dass ihre Determinante, d. h. ResA,B (a, b), verschwindet. 2. Fall aA 6= 0 oder bB 6= 0: Dann existiert ein Polynom t ∈ Rh1i vom Grad deg t > 0, das a und b teilt. Es gibt also Polynome u, v ∈ Rh1i mit a = t v und b = t u. Weil a ∈ RA+1 h1i und b ∈ RB+1 h1i folgt aus diesen Gleichungen (auch falls a = 0 oder RA h1i. Damit erhält man den b =0), dass u ∈ RB h1i und v ∈ u u ähnlich wie in Lemma 3.1.4 Vektor µ := ∈ RA+B , wobei mit −v −v (ui )i∈B auf Seite 68 der Vektor gemeint ist. Nach eben diesem Lemma (−vi )i∈A B u = a u − b v = t v u − t u v = 0. Weil µ 6= 0 (andernfalls gilt a b −v A wäre u = v = 0 und folglich a = b = 0, im Widerspruch zu aA 6= 0 oder bB 6= 0), B folgt aus Korollar 3.1.9, dass ResA,B (a, b) = det a b = 0. A B 2⇒1: Sei ResA,B (a, b) = 0. Per Definition gilt ResA,B (a, b) = det a b . WeA A+B gen Korollar 3.1.9 gibt es dann µ ∈ R \ {0}, sodass das Matrix-Vektor B u Produkt a b µ verschwindet. Durch Aufspaltung gemäß := µ lassen v A 71 3 Anwendung in der Theorie der partiellen Differentialgleichungen sich aus dem µ zwei Polynome u ∈ RB h1i und v ∈ RA h1i Vektor gewinnen, (u ) u i i∈B wobei mit wie in Lemma 3.1.4 auf Seite 68 der Vektor (vi )i∈A v B u gemeint ist. Mit eben diesem Lemma folgert man a b = a u + b v v A und daraus wiederum a u + b v = 0. Im Fall aA = bB = 0 ist die Richtung 2⇒1 gezeigt. Nehmen wir also an, dass mindestens einer der Fälle aA 6= 0 oder bB 6= 0 zutrifft: 1. Fall aA 6= 0: Wir wollen jetzt Lemma 1.4.13 auf Seite 22 auf die Polynome a, b, v ∈ Rh1i anwenden. Die erste Voraussetzung zu dessen Anwendung, nämlich a| (b v), ist aufgrund der Gleichung a u + b v = 0 erfüllt. Es gilt A 6= 0, weil andernfalls B ResA,B (a, b) = det a b 0 = det 1{i} (j) a0 (i,j)∈B×B = Def. auch im 3.1.1 Fall B=0 a0 B 6= 0 wäre. Also gilt deg a = A > 0, weshalb die zweite Voraussetzung zur Anwendung von Lemma 1.4.13 erfüllt ist. Die dritte Voraussetzung v 6= 0 ist auch erfüllt, weil andernfalls aus a u + b v = 0 und a 6= 0 folgen würde, dass u auch u = 0, d. h. µ = = 0, im Widerspruch zu µ ∈ RA+B \ {0}. Weil v v ∈ RA h1i, ist auch die letzte Voraussetzung deg a = A > deg v erfüllt und es gibt ein Polynom t ∈ Rh1i vom Grad deg t > 0, das a und b teilt. 2. Fall bB 6= 0: Wir wollen auch in diesem Fall Lemma 1.4.13 anwenden – diesmal aber auf die Polynome b, a, u ∈ Rh1i. Die erste Voraussetzung zu dessen Anwendung, nämlich b| (a u), ist aufgrund der Gleichung a u + b v = 0 erfüllt. Es gilt B 6= 0, da andernfalls 0 ResA,B (a, b) = det a b A = det 1{i} (j) b0 (i,j)∈A×A = Def. auch im 3.1.1 Fall A=0 b0 A 6= 0 wäre. Also gilt deg b = B > 0, weshalb die zweite Voraussetzung zur Anwendung von Lemma 1.4.13 erfüllt ist. Die dritte Voraussetzung u 6= 0 ist auch erfüllt, weil andernfalls aus a u + b v = 0 und b 6= 0 folgen würde, dass auch 72 3.1 Resultante und Diskriminante v = 0, was aus dem selben Grund wie im ersten Fall nicht möglich ist. Weil u ∈ RB h1i, ist auch die letzte Voraussetzung deg b = B > deg u erfüllt und es gibt ein Polynom t ∈ Rh1i vom Grad deg t > 0, das a und b teilt. Die Resultante findet bei folgender Definition Anwendung: Definition 3.1.11. Seien R ein kommutativer Ring mit Eins, F ∈ N und f ∈ RF +2 h1i. Dann gilt10 ∂f ∈ RF +1 h1i und wir nennen DisF (f ) := ResF +1,F (f, ∂f ) ∈ R die Diskriminante des Polynoms f mit unterstelltem Grad F . Lemma 3.1.12. Seien R ein kommutativer Ring mit Eins, F ∈ N, f ∈ (Rh1i)F +2 h1i und r ∈ R. Dann gilt \ DisF (fr̂ ) = Dis F (f ) (r) , d. h. es ist egal, ob man zuerst das Ringelement r in die Koeffizienten des Polynoms f einsetzt und anschließend dessen Diskriminante berechnet oder ob man zuerst die Diskriminante des Polynoms f berechnet und anschließend in das dadurch erhaltene Polynom das Ringelement r einsetzt – man erhält das selbe Ergebnis. Beweis. Das Lemma ist eine direkte Folgerung von Lemma 3.1.7. Für die auf Seite 34 definierte Ableitung von Polynomen gilt die Produktregel: Lemma 3.1.13. Seien R ein kommutativer Ring mit Eins und f , g ∈ Rh1i. Dann gilt ∂ (f g) = (∂f ) g + f (∂g) . Beweis. Den Beweis dafür, dass die Produktregel in dieser Allgemeinheit gilt, findet man beispielsweise bei [Rei, S. 177] oder bei [Hor, S. 102]. Definition 3.1.14. Sei R ein Integritätsring. Dann sagt man, R habe die Charakteristik Null, wenn für die in Definition 2.2.2 auf Seite 33 eingeführte Folge [N, R] gilt, dass n = 0 die einzige natürliche Zahl mit [N, R] (n) = 0 ist. 10 Die Schreibweise ∂f für die Ableitung eines Polynoms wird in Definition 2.2.3 auf Seite 34 eingeführt. 73 3 Anwendung in der Theorie der partiellen Differentialgleichungen Lemma 3.1.15. Sei R ein Integritätsring der Charakteristik Null und t ∈ Rh1i mit deg t > 0. Dann gilt deg (∂t) = (deg t) − 1. Beweis. Aus der Definition der Ableitung von Polynomen auf Seite 34 folgt deg (∂t) < deg t. Es bleibt also zu zeigen, dass (∂t)(deg t)−1 6= 0. Dies folgt aus der Rechnung (∂t)(deg t)−1 = [N, R] (deg t) · tdeg t , dem Umstand, dass R Charakteristik Null hat und dem Umstand, dass R nullteilerfrei ist. Lemma 3.1.16. Sei R ein faktorieller Ring der Charakteristik Null und f ∈ Rh1i. Dann sind folgende zwei Aussagen äquivalent: 1. Es gibt t ∈ Rh1i mit deg t > 0, t|f und t|∂f . 2. Es gibt k ∈ Rh1i mit deg k > 0 und k 2 |f . Beweis. Wir zeigen jede Richtung einzeln: 1⇒2: Es gibt g, h ∈ Rh1i mit f = g t und ∂f = h t. Nach Lemma 3.1.13 (Produktregel) gilt ∂f = (∂g) t + g (∂t), woraus (h − ∂g) t = g ∂t folgt, d. h. t| (g ∂t). Damit ist bereits die erste Voraussetzung zur Anwendung von Lemma 1.4.13 auf Seite 22 auf die Polynome t, g, ∂t ∈ Rh1i erfüllt. Die zweite Voraussetzung deg t > 0 ist auch erfüllt. Aus Lemma 3.1.15 folgt sowohl deg (∂t) ≥ 0 und damit ∂t 6= 0, d. h. die dritte Voraussetzung, als auch deg t > deg (∂t), d. h. die letzte Voraussetzung. Es gibt also ein Polynom k ∈ Rh1i mit deg k > 0, k|t und k|g. Daher gibt es Polynome a, b ∈ Rh1i, sodass t = a k und g = b k. Damit gilt f = g t = b a k 2 , d. h. k 2 |f . 2⇒1: Es gibt g ∈ Rh1i mit f = g k 2 . Damit gilt nach Lemma 3.1.13 (Produktregel) ∂f = (∂g) k 2 + g 2 (∂k) k = ((∂g) k + g 2 ∂k) k. Also erfüllt t := k die Behauptung. Kriterium 3.1.17. Seien R ein faktorieller Ring der Charakteristik Null, F ∈ N und f ∈ RF +2 h1i. Dann sind die beiden folgenden Aussagen äquivalent: 1. Es gilt fF +1 = 0 oder es gibt t ∈ Rh1i mit deg t > 0, sodass t2 |f . 2. Es gilt DisF (f ) = 0. 74 3.2 Koeffizientenabhängigkeit der Nullstellen komplexer Polynome Beweis. Die erste Aussage ist nach Lemma 3.1.16 äquivalent zu folgender Aussage: Es gilt fF +1 = 0 oder es gibt t ∈ Rh1i mit deg t > 0, t|f und t|∂f . Diese ist wegen Kriterium 3.1.10 auf Seite 70, der Definition der Diskriminante und wegen (∂f )F = (F + 1) fF +1 äquivalent zur zweiten Aussage. 3.2 Koeffizientenabhängigkeit der Nullstellen komplexer Polynome Es ist bekannt, dass eine Polynomfunktion in einer Variablen11 t über C vom Grad12 n ∈ N genau n mit Vielfachheit gezählte Nullstellen in C besitzt (Fundamentalsatz der Algebra). Wenn man die Koeffizienten eines solchen Polynoms variiert, ist zu erwarten, dass sich die Nullstellen auch bewegen. Unter Variation könnte man hierbei den allgemeinen Fall verstehen, in dem sich der Koeffizientenvektor des Polynoms frei in Cn+1 bewegt. Wir betrachten aber lediglich den Spezialfall, in dem die Koeffizienten selbst Polynomfunktionen in einer Variablen11 z über C sind und deren Argument z sich frei in C bewegt. Man kann auch den allgemeineren Fall betrachten, in dem die Koeffizienten holomorphe Funktionen in einer Variablen sind (siehe [Voi]) – für unsere Zwecke ist die Behandlung des polynomialen Falls aber ausreichend. In der Umgebung der meisten Stellen z ∈ C ist die Abhängigkeit der Nullstellen vom Argument z der Koeffizientenpolynomfunktionen nicht nur stetig, sondern sogar holomorph; an andernen Stellen – nämlich dort, wo es zu mehrfachen Nullstellen kommt, erhält man erst nach einem Vorgang, den man mit den Worten „Auffalten der mehrblättrigen Riemannschen Fläche“ umschreiben könnte13 einen holomorphen funktionalen Zusammenhang. 11 Dass hier die Namen der Variablen t und z genannt werden, soll es erleichtern, den Text in Zusammenhang mit den Sätzen und Beweisen dieses Abschnitts zu bringen. 12 In Definition 1.1.6 auf Seite 11 wird der Begriff Grad für Polynome, nicht jedoch für Polynomfunktionen definiert. Wenn der Ring R jedoch so beschaffen ist, dass die Funktion Rh1i 3 p 7→ p̂ (Die Notation Rh1i für die Menge der Polynome in einer Variablen über R wird in Definition 1.1.2 auf Seite 9 eingeführt und die Notation p̂ für die einem Polynom zugeordnete Polynomfunktion p̂ : R → R in Definition 1.1.4 auf Seite 10) injektiv ist – und dies ist hier (R = C) der Fall - macht es Sinn, vom Grad einer Polynomfunktion zu sprechen – gemeint ist damit dann der Grad des einzigen Polynoms, dem unter der Funktion Rh1i 3 p 7→ p̂ diese Polynomfunktion zugeordnet wird. 13 Hier ist die Sprache von Satz 3.2.11 auf Seite 84. Siehe zum Begriff Riemannsche Fläche z.B. [Rüh, S. 79]. 75 3 Anwendung in der Theorie der partiellen Differentialgleichungen Lemma 3.2.1. Seien p ∈ (Ch1i)h1i, z ∈ C, t ∈ C, ε > 0, sodass die Polynomfunktion14 pcẑ keine Nullstellen auf {τ ∈ C; |τ − t| = ε} besitzt und M ∈ N, sodass M + 1 die Zahl der mit Vielfachheit gezählten Nullstellen von pcẑ auf15 B (t, ε) ist. Dann gibt es δ > 0, sodass für alle ζ ∈ B (z, δ) die Funktion pcζ̂ keine Nullstellen auf {τ ∈ C; |τ − t| = ε} und M + 1 mit Vielfachheit gezählte Nullstellen auf B (t, ε) besitzt. n o Beweis. Die Menge (ζ, τ ) ∈ C × C; pcζ̂ (τ ) = 0 ist als Urbild der abgeschlossenen Menge {0} ⊆ C unter der stetigen Funktion C×C 3 (ζ, τ ) 7→ pcζ̂ (τ ) ∈ C abgeschlossen. Die Menge {z}×{τ ∈ C; |τ − t| = ε} ist kompakt. Da die beiden zudem disjunkt sind, haben sie positiven Abstand voneinander und es gibt δ > 0, sodass C × C 3 (ζ, τ ) 7→ pcζ̂ (τ ) keine Nullstellen auf B (z, δ) × {τ ∈ C; |τ − t| = ε} besitzt. Sei 1 N := B (z, δ) 3 ζ → 7 2πi ˆ |ρ−t|=ε ∂ pcζ̂ (ρ) pcζ̂ (ρ) dρ . Für alle ζ ∈ B (z, δ) ist dann nach dem Satz von der Null- und Polstellenzählung (siehe z.B. [Fre, S. 170]) N (ζ) ∈ N gleich der Zahl der mit Vielfachheit gezählten Nullstellen von pcζ̂ auf B (t, ε). Als stetige Funktion mit Werten in N ist N konstant. Weil pcẑ nach Voraussetzung M mit Vielfachheit gezählte Nullstellen auf B (t, ε) besitzt, gilt N (z) = M und aufgrund der Konstantheit N = (B (z, δ) 3 ζ 7→ M ). Der folgende Satz taucht in ähnlicher Form auch bei [Hör, S. 362] auf und kann als Satz über implizite Funktionen für komplexe Polynome aufgefasst werden: Satz 3.2.2. Seien p ∈ (Ch1i)h1i, z, t ∈ C, sodass pcẑ (t) = 0 und (∂ pcẑ ) (t) 6= 0. Dann gibt es ε > 0, δ > 0 und eine holomorphe Funktion θ : B (z, δ) → B (t, ε), sodass ^ pcζ̂ (τ ) = 0 ⇔ θ (ζ) = τ . (ζ, τ ) ∈ B (z, δ) × B (t, ε) Beweis. Wegen pcẑ (t) = 0 und (∂ pcẑ ) (t) 6= 0 gibt es ε > 0, sodass pcẑ keine Nullstellen auf16 B [t, ε] \ {t} besitzt. 14 Die Schreibweise px̂ für Polynome p ∈ (Rh1i)h1i und x ∈ R wird in Definition 1.1.8 auf Seite 12 eingeführt. 15 Für m ∈ C und r > 0 ist mit B (m, r) die offene Kreisscheibe {ζ ∈ C; |ζ − m| < r} gemeint. 16 Für z ∈ C und ε > 0 ist mit B [z, ε] die abgeschlossene Kreisscheibe {ζ ∈ C; |ζ − z| ≤ ε} gemeint. 76 3.2 Koeffizientenabhängigkeit der Nullstellen komplexer Polynome Weil t daher die einzige Nullstelle von pcẑ auf B (t, ε) ist und t wegen der Voraussetzung (∂ pcẑ ) (t) 6= 0 eine einfache Nullstelle ist, ist die Zahl der mit Vielfachheit gezählten Nullstellen von pcẑ auf B (t, ε) gleich eins. Aus Lemma 3.2.1 folgt damit, dass es δ > 0 gibt, sodass für alle ζ ∈ B (z, δ) die Funktion pcζ̂ keine Nullstellen auf {τ ∈ C; |τ − t| = ε} besitzt, genau eine Nullstelle auf B (t, ε) besitzt und diese Nullstelle einfach ist. Die Funktion 1 θ := B (z, δ) 3 ζ → 7 2πi ˆ ρ |ρ−t|=ε ∂ pcζ̂ (ρ) pcζ̂ (ρ) dρ ist holomorph. Wenn wir zeigen, dass für alle ζ ∈ B (z, δ) die Zahl θ (ζ) die Nullstelle von pcζ̂ auf B (t, ε) ist, ist der Satz bewiesen. Sei also ζ ∈ B (z, δ). Dann besitzt pcζ̂ genau eine Nullstelle ν ∈ B (t, ε). Also gibt es nach Lemma 2.1.17 auf Seite 32 eine Polynomfunktion f : C → C, sodass pcζ̂ = f · (τ 7→ (τ − ν)). Für die Ableitung von pcζ̂ ergibt sich ∂ pcζ̂ = (∂f ) · (τ 7→ (τ − ν)) + f und damit 1 θ (ζ) = 2πi 1 2πi ˆ ˆ |ρ−t|=ε | ρ |ρ−t|=ε (∂f ) (ρ) (ρ − ν) + f (ρ) dρ = f (ρ) (ρ − ν) ρ (∂f ) (ρ) 1 dρ + f (ρ) 2πi {z =:A } | ˆ |ρ−t|=ε {z =:B ρ dρ. ρ−ν } Unter Verwendung des Cauchyschen Integralsatzes (siehe z.B. [Fre, Seite 77]) wollen wir zeigen, dass A = 0. Zuerst stellen wir dazu fest, dass die Funktion f auf B (t, ε) keine Nullstellen haben kann, da wegen pcζ̂ = f · (τ 7→ (τ − ν)) andernfalls die mit Vielfachheit gezählte Zahl der Nullstellen von pcζ̂ auf B (t, ε) größer als eins wäre. Damit folgern wir, dass die im Integranden von A auftauchende Funktion (τ 7→fτ )·∂f aufgrund der Nullstellenlosigkeit ihres Nenners holomorph auf B (t, ε) ist. Der Cauchysche Integralsatz ist also anwendbar und A = 0. Mit der Cauchyschen Integralformel [Fre, S. 87] ergibt sich B = ν. Es folgt also θ (ζ) = ν, d. h. θ (ζ) ist die Nullstelle von pcζ̂ auf B (t, ε). Das folgende Lemma gibt unter anderem eine hinreichende Bedingung für die Anwendbarkeit des soeben bewiesenen Satzes an: 77 3 Anwendung in der Theorie der partiellen Differentialgleichungen Lemma 3.2.3. Seien P ∈ N,17 p ∈ (Ch1i)P +2 h1i und18 d := DisP (p) ∈ Ch1i. Für alle z ∈ C mit dˆ(z) 6= 0 besitzt dann pcẑ genau P + 1 voneinander verschiedene einfache Nullstellen. \ ˆ Dis Beweis. Wegen DisP (pẑ ) = P (p) (z) = d (z) 6= 0 ist der Koeffizient Lemma 3.1.12 (pẑ )P +1 von Null verschieden, andernfalls wäre nämlich wegen Kriterium 3.1.17 auf Seite 74 (anwendbar, da C faktorieller Ring19 der Charakteristik Null20 ) DisP (pẑ ) = 0. Also ist pẑ vom Grad P +1, weshalb pcẑ nach dem Fundamentalsatz der Algebra P +1 mit Vielfachheit gezählte Nullstellen besitzt. Es handelt sich dabei um einfache Nullstellen, denn wäre µ ∈ C eine mehrfache Nullstelle von pcẑ , so wäre das Polynom, dessen Polynomfunktion τ 7→ (τ − µ) lautet, vom Grad größer null, sein Quadrat wäre ein Teiler von pẑ und ebenfalls nach Kriterium 3.1.17 wäre DisP (pẑ ) = 0. Das folgende Lemma erlaubt es, unter gewissen Voraussetzungen den Weg einer Nullstelle eines Polynoms zu verfolgen, der durch den Weg, den das Argument seiner Koeffizientenpolynome durchläuft, vorgegeben ist: Lemma 3.2.4. Seien P ∈ N, p ∈ (Ch1i)P +2 h1i, d := DisP (p) ∈ Ch1i,21 ˆ a, b ∈ R mit a ≤ b, ζ : [a, b] → R stetig und t ∈ C Nullstelle R := [C\ {0}] d, von pd . ζd (a) Dann gibt es genau eine stetige Funktion τ : [a, b] → C, sodass die Anfangsbedingung τ (a) = t erfüllt ist und für alle α ∈ [a, b] die Zahl τ (α) Nullstelle von pd [ ist. ζ(α) Beweis. Zur Abkürzung innerhalb des Beweises führen wir folgende Sprechweise ein: Für β ∈ [a, b] heiße eine Funktion τ : [a, β] → C Nullstellenverfolgung bis β, wenn τ stetig, τ (a) = t und wenn für alle α ∈ [a, β] die Zahl τ (α) Nullstelle von pd [ ist. ζ(α) Wir beweisen zuerst die Existenz: Sei G := {β ∈ [a, b] ; Es gibt eine Nullstellenverfolgung bis β} . 17 Die Mengen RK h1i werden in Definition 2.1.8 auf Seite 28 definiert. Die Diskriminante DisF (f ) eines Polynoms f mit unterstelltem Grad F wird in Definition 3.1.11 auf Seite 73 definiert. 19 Jeder Körper ist ein faktorieller Ring (der Begriff faktorieller Ring wird in Definition 1.4.9 auf Seite 21 definiert), weil jedes seiner von Null verschiedenen Elemente eine Einheit ist. 20 In Definition 3.1.14 auf Seite 73 steht, was Charakteristik Null bedeutet. 21 ˆ ˆ Nach Fußnote n 3 auf Seite 9 isto[C\ {0}] d der Vorbereich der Menge C\ {0} unter der Funktion d, d. h. gleich z ∈ C; dˆ(z) 6= 0 . 18 78 3.2 Koeffizientenabhängigkeit der Nullstellen komplexer Polynome Es gilt a ∈ G, da die Funktion [a, a] 3 α 7→ t Nullstellenverfolgung bis a ist. Die Menge G ist ein Intervall: Aus a ≤ α ≤ β und β ∈ G folgt α ∈ G, weil die Einschränkung der Nullstellenverfolgung bis β auf das Intervall [a, α] Nullstellenverfolgung bis α ist. Sei r die rechte Intervallgrenze von G. Wir zeigen jetzt indirekt, dass G = [a, r]. Nehmen wir also an, es sei G = [a, r[. Der Punkt ζ (r) liegt in R, d. h. es gilt dˆ(ζ (r)) 6= 0. Nach Lemma 3.2.3 besitzt pd genau ζd (r) P + 1 voneinander verschiedene einfache Nullstellen. Sei T die Menge dieser Nullstellen. Für alle σ ∈ T kann man folgende Überlegung anstellen: Weil ζ (r) ∈ R, folgt aus Lemma 3.2.3, dass Satz 3.2.2 anwendbar ist, d. h. es gibt, weil σ Nullstelle von pd ist, εσ > 0, δσ > 0 und eine holomorphe Funktion θσ : B (ζ (r) , δσ ) → B (σ, εσ ), ζd (r) sodass ^ (pcû (v) = 0 ⇔ θσ (u) = v) . (3.1) (u, v) ∈ B (ζ (r) , δσ ) × B (σ, εσ ) Es gibt nun γ ∈ [a, r[, sodass das Wegstück22 ζ [[γ, r]] Teilmenge einer jeden der endlich vielen Kreisscheiben B (ζ (r) , δσ ) mit σ ∈ T ist (dies aufgrund der Stetigkeit von ζ) und sodass die Menge {θσ (ζ (γ)) ; σ ∈ T } nicht weniger als P + 1 Elemente hat (dies aufgrund der Stetigkeit der P + 1 Funktionen θσ mit σ ∈ T ). Es gibt, weil γ ∈ G, eine Nullstellenverfolgung τ : [a, γ] → C bis γ. Da τ (γ) Nullstelle von pd ist, da pd wegen Lemma 3.2.3 höchstens P + 1 Nullstellen besitzt und da die [ [ ζ(γ) ζ(γ) Elemente der P + 1-elementigen Menge {θσ (ζ (γ)) ; σ ∈ T } wegen der Äquivalenz 3.1 Nullstellen von pd sind, ist τ (γ) ein Element dieser Menge, d. h. es gibt σ ∈ T mit [ ζ(γ) τ (γ) = θσ (ζ (γ)). Damit definieren wir eine Fortsetzung ρ von τ : ρ := [a, r] 3 α 7→ τ (α) θσ (ζ (α)) für α ∈ [a, γ] für α ∈ ]γ, r] Diese Fortsetzung von τ hat folgende Eigenschaften: 1. Sie ist stetig, weil τ (γ) = θσ (ζ (γ)). 22 An dieser Stelle führt die in Fußnote 3 auf Seite 9 definierte Schreibweise für das Bild einer Menge unter einer Funktion zur Schachtelung zweier eckiger Klammernpaare. Der Ausdruck ζ [[γ, r]] bezeichnet nichts anderes als das Bild des Intervalls [γ, r] unter der Funktion ζ, d. h. die Menge {ζ (α) ; α ∈ [γ, r]}. 79 3 Anwendung in der Theorie der partiellen Differentialgleichungen 2. Es gilt ρ (a) = t weil ρ (a) = τ (a). 3. Für alle α ∈ [a, r] ist die Zahl ρ (α) Nullstelle von pd [ . Dies sieht man folgenζ(α) dermaßen: Für α ∈ [a, γ] gilt ρ (α) = τ (α), weshalb ρ (α) Nullstelle von pd [ ζ(α) ist. Für α ∈ ]γ, r] verwenden wir die Äquivalenz 3.1: Es gilt (ζ (α) , θσ (ζ (α))) ∈ B (ζ (r) , δσ )×B (σ, εσ ) und damit pd [ (θσ (ζ (α))) = 0. Also ist ρ (α) = θσ (ζ (α)) ζ(α) Nullstelle von pd [. ζ(α) Demzufolge ist ρ Nullstellenverfolgung bis r und damit r ∈ G, im Widerspruch zu G = [a, r[. Wir haben indirekt gezeigt, dass G = [a, r]. Wir zeigen jetzt ebenfalls indirekt, dass r = b. Nehmen wir also an, es gelte r < b. Dann könnte man wie folgt zeigen, dass das Intervall G rechtsoffen wäre: Sei β ∈ G. Dann gibt es eine Nullstellenverfolgung τ : [a, β] → C bis β. Da der Punkt ζ (β) in R liegt, folgt aus Lemma 3.2.3, dass Satz 3.2.2 anwendbar ist, d. h. es gibt, weil τ (β) Nullstelle von pd [ ist, ε > 0, δ > 0 und eine holomorphe Funktion ζ(β) θ : B (ζ (β) , δ) → B (τ (β) , ε), sodass ^ (pcû (v) = 0 ⇔ θ (u) = v) . (3.2) (u, v) ∈ B (ζ (β) , δ) × B (τ (β) , ε) Weil ζ stetig und β ≤ r < b ist, gibt es γ ∈ ]β, b], sodass ζ [[β, γ]] ⊆ B (ζ (β) , δ). Damit definieren wir eine Fortsetzung ρ von τ : τ (α) für α ∈ [a, β] ρ := [a, γ] 3 α 7→ θ (ζ (α)) für α ∈ ]β, γ] Diese Fortsetzung von τ hat folgende Eigenschaften: 1. Sie ist stetig, weil τ (β) = θ (ζ (β)). Dies sieht man mit der Äquivalenz 3.2 wie folgt: Weil (ζ (β) , τ (β)) ∈ B (ζ (β) , δ) × B (τ (β) , ε) und τ (β) Nullstelle von pd [ ist, gilt θ (ζ (β)) = τ (β). ζ(β) 2. Es gilt ρ (a) = t, weil ρ (a) = τ (a). 3. Für alle α ∈ [a, γ] ist die Zahl ρ (α) Nullstelle von pd [ . Dies sieht man wie folgt: ζ(α) Für α ∈ [a, β] ist ρ (α) gleich τ (α) und damit Nullstelle von pd [ . Ansonsten, ζ(α) d. h. für α ∈ ]β, γ], kommt wieder Äquivalenz 3.2 zur Anwendung: Es gilt (ζ (α) , θ (ζ (α))) ∈ B (ζ (β) , δ) × B (τ (β) , ε) und damit pd [ (θ (ζ (α))) = 0. ζ(α) Wegen ρ (α) = θ (ζ (α)) ist also auch in diesem Fall ρ (α) Nullstelle von pd [. ζ(α) 80 3.2 Koeffizientenabhängigkeit der Nullstellen komplexer Polynome Also ist ρ Nullstellenverfolgung bis γ und damit γ ∈ G. Wir haben unter der Annahme, die rechte Intervallgrenze r des Intervalls G sei kleiner als b, gezeigt, dass das Intervall G rechtsoffen und damit G = [a, r[ wäre, im Widerspruch zur bereits bewiesenen Gleichung G = [a, r]. Folglich gilt r = b, d. h. G = [a, b]. Es existiert eine Nullstellenverfolgung bis b. Es folgt der Beweis der Eindeutigkeit: Seien τ : [a, b] → C und σ : [a, b] → C Nullstellenverfolgungen bis b. Sei G := {α ∈ [a, b] ; τ (α) = σ (α)} . Dann ist G nicht leer, weil τ (a) = t = σ (a). Außerdem ist G als Urbild der abgeschlossenen Menge {0} ⊆ C unter der stetigen Funktion τ − σ abgeschlossen in [a, b]. Wir zeigen jetzt, dass G auch offen in [a, b] ist. Sei dazu α ∈ G. Weil ζ (α) ∈ R, folgt aus Lemma 3.2.3, dass Satz 3.2.2 anwendbar ist, d. h. es gibt, weil τ (α) = σ (α) Nullstelle von pd > 0, δ > 0 und eine holomorphe Funktion [ ist, ε ζ(α) θ : B (ζ (α) , δ) → B (τ (α) , ε), sodass ^ (pcû (v) = 0 ⇔ θ (u) = v) . (3.3) (u, v) ∈ B (ζ (α) , δ) × B (τ (α) , ε) h i Es gibt dann γ > 0, sodass23 ζ B[a,b] (α, γ) ⊆ B (ζ (α) , δ) (dies, da ζ stetig) und h i h i sodass τ B[a,b] (α, γ) ⊆ B (τ (α) , ε) und σ B[a,b] (α, γ) ⊆ B (τ (α) , ε) (dies, da τ und σ stetig). Für alle β ∈ B[a,b] (α, γ) sind daher τ (β) und σ (β) in B (τ (α) , ε) liegende Nullstellen von pd [ . Mit der Äquivalenz 3.3 folgt, dass dann sowohl τ (β) = θ (ζ (β)) ζ(α) als auch σ (β) = θ (ζ (β)), also τ (β) = σ (β), d. h. β ∈ G gilt. Wir haben gezeigt, dass G offen in [a, b] ist. Weil das Intervall [a, b] zusammenhängend ist, folgt, dass die in [a, b] offene, abgeschlossene und nichtleere Teilmenge G gleich [a, b] ist und die Eindeutigkeit ist gezeigt. Das folgende Lemma ist eine Verallgemeinerung des soeben bewiesenen Lemmas, bei dem die rechte Intervallgrenze weder offen noch endlich sein muss: 23 Mit B[a,b] (α, γ) ist hier die γ-Kugel um α im Raum [a, b] gemeint, d. h. die Menge {β ∈ [a, b] ; |β − α| < γ}. 81 3 Anwendung in der Theorie der partiellen Differentialgleichungen Lemma 3.2.5. Seien P ∈ N, p ∈ (Ch1i)P +2 h1i, d := DisP (p) ∈ Ch1i, ˆ a ∈ R, I ⊆ [a, ∞[ ein Intervall24 mit a ∈ I, ζ : I → R stetig R := [C\ {0}] d, und t ∈ C Nullstelle von pd . ζd (a) Dann gibt es genau eine stetige Funktion τ : I → C, sodass die Anfangsbedingung τ (a) = t erfüllt ist und für alle α ∈ I die Zahl τ (α) Nullstelle von pd [ ist. ζ(α) Beweis. Wir beweisen zuerst die Existenz: Wegen Lemma 3.2.4 gibt es für alle α ∈ I genau eine stetige Funktion ρα : [a, α] → C, sodass ρα (a) = t und sodass für alle β ∈ [a, α] die Zahl ρα (β) Nullstelle von pd [ ist. ζ(β) Sei damit τ := (I 3 α 7→ ρα (α)). Für alle α, β ∈ I mit a ≤ α ≤ β gilt aufgrund der Eindeutigkeit in Lemma 3.2.4 ρα = ρβ |[a,α] . (3.4) Wir zeigen jetzt, dass τ die behaupteten Eigenschaften erfüllt. Wir weisen Stetigkeit in jedem Punkt nach. Sei dazu α ∈ I. Dann gibt es folgende Fälle: 1. Fall α < sup I: Dann gibt es µ ∈ I mit α < µ und die Einschränkung τ |[a,µ] = ρµ 3.4 ist stetig und daher τ stetig an der Stelle α. 2. Fall α = sup I: Dann ist τ = ρα stetig und daher τ stetig an der Stelle α. 3.4 Weil τ (a) = ρa (a) und ρa die Anfangsbedingung erfüllt, gilt τ (a) = t. Für alle α ∈ I ist τ (α) = ρα (α) Nullstelle von pd [. ζ(α) Also ist die Existenz gezeigt. Es folgt der Beweis der Eindeutigkeit: Seien τ : I → C und σ : I → C, sodass τ (a) = σ (a) = t und sodass für alle α ∈ I die Zahlen τ (α) und σ (α) Nullstellen von pd [ sind. Für alle α ∈ I sind dann die ζ(α) Einschränkungen τ |[a,α] und σ|[a,α] aufgrund der Eindeutigkeit in Lemma 3.2.4 gleich. Also gilt τ = σ. Das folgende Lemma ist eine Abwandlung des gerade bewiesenen Lemmas, das sich von diesem einzig dadurch unterscheidet, dass die Nullstelle im gegenläufigen Sinn verfolgt wird. 24 Unter einem Intervall verstehen wir eine zusammenhängende Teilmenge von R. 82 3.2 Koeffizientenabhängigkeit der Nullstellen komplexer Polynome Lemma 3.2.6. Seien P ∈ N, p ∈ (Ch1i)P +2 h1i, d := DisP (p) ∈ Ch1i, ˆ a ∈ R, I ⊆ ]−∞, a] ein Intervall mit a ∈ I, ζ : I → R stetig R := [C\ {0}] d, und t ∈ C Nullstelle von pd . ζd (b) Dann gibt es genau eine stetige Funktion τ : I → C, sodass die Anfangsbedingung τ (a) = t erfüllt ist und für alle α ∈ I die Zahl τ (α) Nullstelle von pd [ ist. ζ(α) Beweis. Die Behauptung ergibt sich durch Anwendung von Lemma 3.2.6 auf ã := −a,25 I˜ := − [I] und ζ̃ := I˜ 3 α 7→ ζ (−α) . Das folgende Lemma ist eine weitere Verallgemeinerung der letzten Lemmata auf den Fall eines beliebigen Intervalls: Lemma 3.2.7. Seien P ∈ N, p ∈ (Ch1i)P +2 h1i, d := DisP (p) ∈ Ch1i, ˆ I ⊆ R ein Intervall, a ∈ I, ζ : I → R stetig und t ∈ C Nullstelle R := [C\ {0}] d, von pd . ζd (a) Dann gibt es genau eine stetige Funktion τ : I → C, sodass die Anfangsbedingung τ (a) = t erfüllt ist und für alle α ∈ I die Zahl τ (α) Nullstelle von pd [ ist. ζ(α) Beweis. Lemma 3.2.6 liefert eine stetige Funktion λ : ]−∞, a] ∩ I → C, sodass λ (a) = t und sodass für alle α ∈ ]−∞, a] ∩ I die Zahl λ (α) Nullstelle von pd [ ist. ζ(α) Lemma 3.2.5 liefert eine stetige Funktion ρ : [a, ∞[ ∩ I → C, sodass ρ (a) = t und sodass für alle α ∈ [a, ∞[ ∩ I die Zahl ρ (α) Nullstelle von pd [ ist. ζ(α) Die Definition λ (α) τ := I 3 α 7→ ρ (α) für α ≤ a für α ≥ a ist eindeutig, weil λ (a) = t = ρ (a). Die Funktion τ ist stetig, weil λ und ρ stetig sind und der Anschluss bei a auch stetig ist. Die Anfangsbedingung τ (a) = t ist wegen τ (a) = λ (a) erfüllt. Für alle α ∈ I ist τ (α) Nullstelle von pd [ , weil für α ≤ a die Zahl τ (α) = λ (α) und für α > a die ζ(α) Zahl τ (α) = ρ (α) Nullstelle von pd [ ist. ζ(α) Die Existenz ist gezeigt, es folgt die Eindeutigkeit: 25 Mit − [I] ist hier die Menge {−α; α ∈ I} gemeint. Fasst man dabei die Negation − als die Funktion (R 3 α 7→ −α) auf, erklärt sich die Schreibweise von selbst aus Fußnote 3 auf Seite 9. 83 3 Anwendung in der Theorie der partiellen Differentialgleichungen Seien τ : I → C und σ : I → C, sodass τ (a) = σ (a) = t und sodass für alle α ∈ I die Zahlen τ (α) und σ (α) Nullstellen von pd [ sind. Aus der Eindeutigkeit in Lemma ζ(α) 3.2.6 folgt, dass die beiden Einschränkungen τ |]−∞,a]∩I und σ|]−∞,a]∩I gleich sind und aus der Eindeutigkeit in Lemma 3.2.5, dass die beiden Einschränkungen τ |[a,∞[∩I und σ|[a,∞[∩I gleich sind. Also gilt τ = σ und die Eindeutigkeit ist gezeigt. Zur Erleichterung der Formulierung des nächsten Satzes führen wir zunächst einige Bezeichnungen ein. Definition 3.2.8. Sei k ∈ N und 0 < δ 6= 1. Eine Funktion θ heißt (k + 1)-fache 1 δ-Auffaltung, falls26 D (θ) = B 0, δ k+1 , R (θ) ⊆ C und falls θ holomorph ist. Definition 3.2.9. Sei 0 < δ 6= 1. Eine Funktion θ heißt δ-Auffaltung, falls es k ∈ N gibt, sodass θ eine (k + 1)-fache δ-Auffaltung ist. Definition 3.2.10. Sei 0 < δ 6= 1 und θ eine δ-Auffaltung. Da es dann genau ein k ∈ N gibt, sodass θ eine (k + 1)-fache δ-Auffaltung ist27 , nennen wir k + 1 die δ-Windungszahl von θ und schreiben dafür wdgδ (θ) := k + 1. An den Stellen z ∈ C, an denen die Diskriminante verschwindet, ist Satz 3.2.2 nicht anwendbar. Der folgende Satz aber schon: Satz 3.2.11. Seien P ∈ N, p ∈ (Ch1i)P +2 h1i, d := DisP (p) ∈ Ch1i \ {0}, z ∈ C mit pẑ 6= 0 und t ∈ C Nullstelle von pcẑ . Dann gibt es ε > 0, 0 < δ 6= 1 und eine endliche, nichtleere Menge Θ von δ-Auffaltungen mit folgenden Eigenschaften: 1. Die Summe P θ∈Θ wdgδ (θ) ist die Vielfachheit der Nullstelle t von pcẑ . 2. Für alle ζ ∈ B (z, δ) und alle Nullstellen τ ∈ B (t, ε) von pcζ̂ gibt es eine (und falls ζ 6= z nur eine) δ-Auffaltung θ ∈ Θ und ein (und falls ζ 6= z nur ein) ξ ∈ D (θ), sodass ζ = z + ξ wdgδ (θ) und θ (ξ) = τ . 3. Für alle θ ∈ Θ und alle ξ ∈ D (θ) gilt ζ := z + ξ wdgδ (θ) ∈ B (z, δ) und τ := θ (ξ) ∈ B (t, ε) und τ ist eine Nullstelle von pcζ̂ . 26 Die Schreibweisen D (θ) und R (θ) für den Vor- und Nachbereich von Funktionen werden in Fußnote 3 auf Seite 9 eingeführt. 27 Dies liegt daran, dass die Funktion R 3 r 7→ δ r wegen 0 < δ 6= 1 streng monoton ist. Die Forderung δ 6= 1 benötigen wir an keiner anderen als an dieser Stelle. Es wäre möglich, auf die Forderung δ 6= 1 zu verzichten, wenn man die Information über die Windungszahl auf andere Weise mit θ verknüpfte – etwa durch die Definition von Auffaltungen als Paare aus holomorpher Funktion und Windungszahl. 84 3.2 Koeffizientenabhängigkeit der Nullstellen komplexer Polynome Beweis. Es gibt M ∈ N, sodass M + 1 die Vielfachheit der Nullstelle t von pcẑ ist. Weil pcẑ 6= 0, gibt es ε > 0, sodass pcẑ keine Nullstellen auf B [t, ε] \ {t} besitzt. Dann gibt es δ > 0, sodass für alle ζ ∈ B (z, δ) die Funktion pcζ̂ keine Nullstellen auf {τ ∈ C; |τ − t| = ε} besitzt (3.5) und M + 1 die Zahl der mit Vielfachheit gezählten Nullstellen von pcζ̂ auf B (t, ε) (3.6) ist (dies nach Lemma 3.2.1), sodass dˆ keine Nullstellen auf B (z, δ) \ {z} besitzt (dies, weil d ∈ Ch1i \ {0} und daher dˆ nur endlich viele Nullstellen besitzt) und sodass δ 6= 1. Insbesondere ist damit B (z, δ) \ {z} Teilmenge der Menge R := [C\ {0}] dˆ und wir können die beiden Lemmata 3.2.2 und 3.2.3 auf in B (z, δ) \ {z} liegende Punkte und Lemma 3.2.7 auf in B (z, δ) \ {z} verlaufende Wege anwenden. Sei T := ϕ ∈ B (t, ε)]−∞,ln(δ)[ stetig; ^ ϕ (x) Nullstelle von p[ [x . z+e x∈]−∞,ln(δ)[ Es folgt eine Überlegung, derzufolge T mindestens M + 1 Elemente hat: Der Weg ]−∞, ln (δ)[ 3 x 7→ z + ex verläuft in B (z, δ) \ {z}. Es gibt y ∈ ]−∞, ln (δ)[. Wegen 3.6 hat p[ [y genau M + 1 z+e Nullstellen auf B (t, ε). Nach Lemma 3.2.7 gibt es zu jeder dieser Nullstellen τ genau eine stetige Funktion ϕ : ]−∞, ln (δ)[ → C mit ϕ (y) = τ und sodass für alle x ∈ ]−∞, ln (δ)[ die Zahl ϕ (x) Nullstelle von p[ / T , so gäbe es a ∈ [x ist. Wäre ϕ ∈ z+e ]−∞, ln (δ)[ mit ϕ (a) ∈ / B (t, ε) und aufgrund der Stetigkeit von ]−∞, ln (δ)[ 3 x 7→ |ϕ (x) − t| ∈ R und wegen des Zwischenwertsatzes c ∈ ]−∞, ln (δ)[ mit ϕ (c) ∈ {τ ∈ C; |τ − t| = ε}. Dann wäre ϕ (c) eine Nullstelle von p[ [c z+e c auf {τ ∈ C; |τ − t| = ε}, was wegen z + e ∈ B (z, δ) ein Widerspruch zu 3.5 wäre. Also hat T mindestens M + 1 Elemente. 85 3 Anwendung in der Theorie der partiellen Differentialgleichungen Stimmen zwei Funktionen aus T an einer Stelle aus ]−∞, ln (δ)[ überein, so sind sie wegen der Eindeutigkeit aus Lemma 3.2.7 gleich. (3.7) Daher kann T nicht mehr als M + 1 Elemente haben (sonst besäße nämlich zu jedem x ∈ ]−∞, ln (δ)[ die Polynomfunktion p[ [x mehr als M + 1 Nullstellen auf B (t, ε), z+e im Widerspruch zu 3.6). Die Zahl der Elemente von T beträgt demzufolge M + 1. Die durch die M + 1 Elemente von T parametrisierten Nullstellen verfolgen wir jetzt entlang konzentrischer Kreise um z: Für alle ϕ ∈ T gibt es genau eine Fortsetzung Φϕ : {w ∈ C; Re (w) < ln (δ)} → B (t, ε) von ϕ, sodass für alle x ∈ ]−∞, ln (δ)[ die Funktion R 3 α 7→ Φϕ (x + iα) ∈ C stetig (3.8) und für alle w ∈ D (Φϕ ) die Zahl Φϕ (w) Nullstelle von p[ z\ +ew ist, (3.9) was man wie folgt sieht: Für alle x ∈ ]−∞, ln (δ)[ verläuft λx := R 3 α 7→ z + ex+iα in B (z, δ) \ {z} und ist ϕ (x) Nullstelle von p[ . Wieder nach Lemma 3.2.7 gibt \ λ x (0) es dann genau eine stetige Funktion ρx : R → C mit ρx (0) = ϕ (x), sodass für alle α ∈ R die Zahl ρx (α) Nullstelle von p\ ist. Wenn also eine Fortsetzung Φϕ von ϕ \ λ x (α) auf {w ∈ C; Re (w) < ln (δ)} mit den Eigenschaften 3.8 und 3.9 existiert, so muss sie gleich {w ∈ C; Re (w) < ln (δ)} 3 w 7→ ρRe(w) (Im (w)) sein. Für den Nachweis der Existenz bleibt nur noch zu zeigen, dass für alle x ∈ ]−∞, ln (δ)[ die Funktion ρx nach B (t, ε) abbildet. Gäbe es β ∈ R mit ρx (β) ∈ / B (t, ε) so gäbe es aufgrund der Stetigkeit von R 3 α 7→ |ρx (α) − t| ∈ R und wegen des Zwischenwertsatzes α ∈ R mit ρx (α) ∈ {τ ∈ C; |τ − t| = ε}. Das heißt, ρx (α) wäre eine Nullstelle von p\ auf {τ ∈ C; |τ − t| = ε}, was wegen \ λ x (α) λx (α) ∈ B (z, δ) ein Widerspruch zu 3.5 wäre. Es ist gezeigt, dass es genau eine Fortsetzung Φϕ : {w ∈ C; Re (w) < ln (δ)} → B (t, ε) von ϕ mit 3.8 und 3.9 gibt. Für alle w ∈ C mit Re (w) < ln (δ) und alle Nullstellen τ von p[ z\ +ew gibt es genau eine Funktion ϕ ∈ T mit Φϕ (w) = τ , 86 (3.10) 3.2 Koeffizientenabhängigkeit der Nullstellen komplexer Polynome was man wie folgt sieht: Sei y := Re (w) und β := Im (w). Wir betrachten den Weg λ := R 3 α 7→ z + ey+iα . Weil λ (β) = z + ew , ist τ Nullstelle von pd [ und es gibt nach Lemma 3.2.7 genau λ(β) eine stetige Funktion ρ : R → C mit ρ (β) = τ , sodass für alle α ∈ R die Zahl ρ (α) x Nullstelle von pd [ ist. Betrachtet man den Weg ]−∞, ln (δ)[ 3 x 7→ z + e , so gibt λ(α) es, weil wegen z + ey = λ (0) die Zahl ρ (0) Nullstelle von p[ [y ist, ebenfalls nach z+e Lemma 3.2.7 genau eine Funktion ϕ ∈ T mit ϕ (y) = ρ (0). Die Eindeutigkeit bei 3.10 sieht man jetzt wie folgt: Sei ψ ∈ T mit Φψ (w) = τ . Die beiden Funktionen ρ und ν := (R 3 α 7→ Φψ (y + iα) ∈ C) sind stetig (letztere wegen 3.8). Für alle α ∈ R ist ihr Wert an der Stelle α eine Nullstelle von pd [ (dies gilt λ(α) für ν wegen 3.9). Ihr Wert stimmt an der Stelle β überein (ρ (β) = τ = Φψ (w) = Φψ (y + iβ) = ν (β)). Wieder nach Lemma 3.2.7 sind die beiden daher gleich und es gilt ϕ (y) = ρ (0) = ν (0) = Φψ (y) = ψ (y). Wegen 3.7 gilt damit ϕ = ψ, was die Eindeutigkeit zeigt. Wie folgt überzeugt man sich davon, dass Φϕ (w) = τ : Die beiden Funktionen ρ und κ := (R 3 α 7→ Φϕ (y + iα) ∈ C) sind stetig (letztere wegen 3.8). Für alle α ∈ R ist ihr Wert an der Stelle α eine Nullstelle von pd [ (dies gilt für κ wegen 3.9). Ihr Wert stimmt an der Stelle 0 λ(α) überein (ρ (0) = ϕ (y) = Φϕ (y) = κ (0)). Wieder nach Lemma 3.2.7 sind die beiden daher gleich und es gilt Φϕ (w) = Φϕ (y + iβ) = κ (β) = ρ (β) = τ . Damit ist auch die Existenz bei 3.10 gezeigt. Von folgender Tatsache wird in diesem Beweis mehrfach Gebrauch gemacht werden: 28 Für alle v ∈ C mit Re (v) < ln (δ) und jede Nullstelle τ von p[ [v gibt es eine z+e holomorphe Funktion f mit v ∈ D (f ) ⊆ {w ∈ C; Re (w) < ln (δ)} und f (v) = τ und eine Zahl κ > 0, sodass für alle u ∈ D (f ) die Zahl f (u) die einzige Nullstelle von p[ [u auf B (τ, κ) ist. z+e (3.11) Dies sieht man wie folgt: Nach Lemma 3.2.2 gibt es, weil τ Nullstelle von p[ [v ist, z+e κ > 0 und eine holomorphe Funktion θ mit z + ev ∈ D (θ) ⊆ B (z, δ) \ {z}, sodass für alle ζ ∈ D (θ) der Funktionswert θ (ζ) die einzige Nullstelle von pcζ̂ auf B (τ, κ) 28 Die Sprechweise „f ist eine holomorphe Funktion“ soll bedeuten, dass f Funktion, D (f ) ⊆ C offen, R (f ) ⊆ C und f holomorph ist. 87 3 Anwendung in der Theorie der partiellen Differentialgleichungen ist. Die Menge V := {u ∈ C; z + eu ∈ D (θ)} ist als Urbild der offenen Menge D (θ) unter der stetigen Funktion C 3 u 7→ z + eu ∈ C offen und eine Teilmenge von {w ∈ C; Re (w) < ln (δ)}, die v enthält. Damit ist f := (V 3 u 7→ θ (z + eu )) eine Funktion mit den geforderten Eigenschaften.29 Wir zeigen jetzt, dass für alle ϕ ∈ T die Funktion Φϕ holomorph ist, (3.12) indem wir jede Gerade {x + iα; α ∈ R} für x ∈ ]−∞, ln (δ)[ einzeln betrachten. Sei also x ∈ ]−∞, ln (δ)[. Sei G := {α ∈ R; Φϕ ist holomorph an der Stelle x + iα}. Wie folgt sieht man, dass dann G offen in R ist: Sei α ∈ G. Weil Φϕ (x + iα) nach 3.9 Nullstelle von p\ \ x+iα ist, gibt es nach 3.11 eine Zahl κ > 0 und eine holomorphe z+e Funktion f mit x + iα ∈ D (f ) ⊆ {w ∈ C; Re (w) < ln (δ)} und f (x + iα) = Φϕ (x + iα) , sodass für alle u ∈ D (f ) der Funktionswert f (u) die einzige Nullstelle von p[ [u auf z+e B (Φϕ (x + iα) , κ) ist. Es gibt r > 0, sodass B (x + iα, r) ⊆ D (f ) (dies, weil D (f ) offen) und sodass f [B (x + iα, r)] ⊆ B (Φϕ (x + iα) , κ) (dies, weil α ∈ G und daher Φϕ insbesondere stetig an der Stelle x + iα ist). Da für alle u ∈ B (x + iα, r) die Zahl Φϕ (u) nach 3.9 Nullstelle von p[ [u und aufgrund der Wahl von r Element z+e von B (Φϕ (x + iα) , κ) ist, muss Φϕ (u) gleich der einzigen Nullstelle f (u) von p[ [u z+e auf B (Φϕ (x + iα) , κ) sein. Damit stimmt Φϕ auf B (x + iα, r) mit der holomorphen Funktion f überein, es gilt30 BR (α, r) ⊆ G. Wir haben gezeigt, dass G offen in R ist. Die Abgeschlossenheit von G zeigen wir mit dem Folgenkriterium. Seien dazu g ∈ GN n→∞ und α ∈ R mit gn −→ α. Weil Φϕ (x + iα) nach 3.9 Nullstelle von p\ \ x+iα ist, gibt z+e es nach 3.11 eine Zahl κ > 0 und eine holomorphe Funktion f mit x + iα ∈ D (f ) ⊆ {w ∈ C; Re (w) < ln (δ)} und f (x + iα) = Φϕ (x + iα) , sodass für alle u ∈ D (f ) der Funktionswert f (u) die einzige Nullstelle von p[ [u auf z+e B (Φϕ (x + iα) , κ) ist. Weil D (f ) offen, gibt es r > 0, sodass B (x + iα, r) ⊆ D (f ). 29 Dass D (f ) aus abzählbar vielen um Vielfache von 2πi gegeneinander verschobenen Zusammenhangskomponenten besteht, stört nicht. 30 Mit BR (α, r) ist die Menge {β ∈ R; |β − α| < r}, nicht die Menge B (α, r) = {w ∈ C; |w − α| < r} gemeint. 88 3.2 Koeffizientenabhängigkeit der Nullstellen komplexer Polynome Es gibt einen Folgenindex n ∈ N, sodass x + ign ∈ B (x + iα, r). Sei Ω := |gn − α|. Es gibt Λ > 0, sodass die Strecke S := {w ∈ C; |Re (w) − x| < Λ, Im (w) = gn } in der Kreisscheibe B (x + iα, r) liegt und sodass f [S] ⊆ B (Φϕ (x + iα) , κ) (dies, weil x + ign ∈ B (x + iα, r) und weil Φϕ wegen gn ∈ G stetig an der Stelle x + ign ist). Da für alle u ∈ S die Zahl Φϕ (u) nach 3.9 Nullstelle von p[ [u und aufgrund z+e der Wahl von Λ Element von B (Φϕ (x + iα) , κ) ist, muss Φϕ (u) gleich der einzigen Nullstelle f (u) von p[ [u auf B (Φϕ (x + iα) , κ) sein. Es gilt also Φϕ |S = f |S . Dass z+e diese beiden Funktionen sogar auf dem Rechteck H := {w ∈ C; |Re (w) − x| < Λ, |Im (w) − α| ≤ Ω} ⊆ B (x + iα, r) übereinstimmen, sieht man mit der Eindeutigkeit aus Lemma 3.2.7 folgendermaßen: Sei y ∈ ]x − Λ, x + Λ[. Dann ist der Weg ζ := [α − Ω, α + Ω] 3 β 7→ z + ey+iβ stetig, sind für alle β ∈ [α − Ω, α + Ω] die beiden Zahlen Φϕ (y + iβ) (diese nach 3.9) und f (y + iβ) (diese nach Wahl von f ) Nullstellen von pd [ und stimmen die beiden ζ(β) stetigen Funktionen [α − Ω, α + Ω] 3 β 7→ Φϕ (y + iβ) und [α − Ω, α + Ω] 3 β 7→ f (y + iβ) (die erste ist stetig wegen 3.8, die zweite weil f holomorph ist) an der Stelle gn wegen y + ign ∈ S überein. Mit Lemma 3.2.7 folgt die Gleichheit von Φϕ und f auf der Strecke {w ∈ C; Re (w) = y, |Im (w) − α| ≤ Ω}. Da dies für alle y ∈ ]x − Λ, x + Λ[ gilt, ist die Behauptung Φϕ |H = f |H gezeigt. Für Ω = 0 gilt α = gn ∈ G und für Ω > 0 stimmt Φϕ in einer offenen Umgebung von x + iα mit der holomorphen Funktion f überein, ist also holomorph bei x + iα, weshalb auch in diesem Fall α ∈ G gilt. Wir haben gezeigt, dass der Grenzwert einer jeden in R konvergenten Folge mit Gliedern aus G in G liegt, also ist G abgeschlossen wie behauptet. Die dritte Eigenschaft von G, die hier gezeigt wird, ist, dass G nicht leer ist: Weil Φϕ (x) nach 3.9 Nullstelle von p[ [x ist, gibt es nach 3.11 eine holomorphe Funktion z+e f mit x ∈ D (f ) ⊆ {w ∈ C; Re (w) < ln (δ)} und f (x) = Φϕ (x) , sodass für alle u ∈ D (f ) die Zahl f (u) Nullstelle von p[ [u ist. Weil D (f ) offen z+e ist, gibt es r > 0, sodass das Quadrat H := {w ∈ C; |Re (w) − x| < r, |Im (w) < r|} 89 3 Anwendung in der Theorie der partiellen Differentialgleichungen Teilmenge von D (f ) ist. Da Φϕ Fortsetzung der wegen ϕ ∈ T stetigen Funktion ϕ ist (Φϕ |]−∞,ln(δ)[ = ϕ), ist die Funktion ]x − r, x + r[ 3 y 7→ Φϕ (y) stetig. Die Funktion ]x − r, x + r[ 3 y 7→ f (y) ist ebenfalls stetig. Mit der Absicht, Lemma 3.2.7 anzuwenden, stellen wir fest, dass der Weg ζ := (]x − r, x + r[ 3 y 7→ z + ey ) stetig ist. Weil ϕ ∈ T und wegen der Definition von T ist für alle y ∈ ]x − r, x + r[ der Funktionswert Φϕ (y) Nullstelle der Polynomfunktion pd . Für alle y ∈ ]x − r, x + r[ ζd (y) ist der Funktionswert f (y) ebenfalls Nullstelle der Polynomfunktion pd . Da zuζd (y) dem Φϕ und f aufgrund der Wahl von f an der Stelle x übereinstimmen, folgt aus der Eindeutigkeit aus Lemma 3.2.7, dass Φϕ |]x−r,x+r[ = f |]x−r,x+r[ . Wir zeigen jetzt, dass sogar Φϕ |H = f |H gilt. Sei y ∈ ]x − r, x + r[. Dann ist die Funktion ψ := ]−r, r[ 3 β 7→ z + ey+iβ stetig, für alle β ∈ ]−r, r[ sowohl die Zahl Φϕ (y + iβ) Nullstelle von p[ [ [ (dies nach 3.9) als auch die Zahl f (y + iβ) Nullstelle von p [ ψ(β) ψ(β) (dies nach Wahl von f ) und es stimmen die beiden stetigen Funktionen ]−r, r[ 3 β 7→ Φϕ (y + iβ) und ]−r, r[ 3 β 7→ f (y + iβ) (die erste ist stetig wegen 3.8, die zweite weil f holomorph ist) an der Stelle 0 wegen Φϕ |]x−r,x+r[ = f |]x−r,x+r[ überein. Wieder mit Lemma 3.2.7 folgt die Gleichheit von Φϕ und f auf der Strecke {w ∈ C; Re (w) = y, |Im (w)| < r}. Da dies für alle y ∈ ]x − r, x + r[ gilt, ist die Behauptung Φϕ |H = f |H gezeigt. Also ist Φϕ an der Stelle x holomorph und damit 0 ∈ G. Deshalb ist G nicht leer. Als offene, abgeschlossene und nichtleere Teilmenge der zusammenhängenden Menge R ist G gleich R. Wir haben gezeigt, dass für alle ϕ ∈ T und für alle x ∈ ]−∞, ln (δ)[ die Menge {α ∈ R; Φϕ ist holomorph an der Stelle x + iα} gleich R ist. Das heißt, Behauptung 3.12 ist gezeigt. Für alle s ∈ Z sei ηs := (C 3 w 7→ w + 2πis). Aus folgendem Grund ist31 für alle ϕ ∈ T und alle s ∈ Z die Funktion Φϕ ηs |R ein Element von T , 31 (3.13) Zu dem Ergebnis, dass die Funktion Φϕ ηs |R gleich ]−∞, ln (δ)[ 3 x 7→ Φϕ (x + 2πis) ist, kommt man sowohl wenn man sie als Verkettung mit einer Einschränkung Φϕ (ηs |R ) betrachtet (bei dieser Verkettung gilt R (ηs |R ) * D (Φϕ ), siehe dazu Fußnote 32 auf Seite 45) als auch wenn man sie als eingeschränkte Verkettung (Φϕ ηs ) |R betrachtet (bei dieser Einschränkung gilt R * D (Φϕ ηs ), was aber auch nicht tragisch ist, wenn man die Einschränkung r|M einer Relation r auf eine Menge M , die nicht notwendigerweise M ⊆ D (r) erfüllt, als die Relation {(a, b) ; (a, b) ∈ r, a ∈ M } auffasst). Es wäre auch möglich, einfach Φϕ ηs |]−∞,ln(δ)[ anstelle von Φϕ ηs |R zu schreiben, der Ausdruck taucht aber im Folgenden häufig auf, weshalb die kürzere Schreibweise bevorzugt wird. 90 3.2 Koeffizientenabhängigkeit der Nullstellen komplexer Polynome das heißt, die Umrundungen führen nicht aus T heraus: Nach Wahl von Φϕ gilt R (Φϕ ) ⊆ B (t, ε) und daher auch R (Φϕ ηs |R ) ⊆ B (t, ε). Weil für alle x ∈ ]−∞, ln (δ)[ und damit wegen eηs (x) = ex die Zahl Φϕ ηs (x) wegen 3.9 Nullstelle von p\ \ ηs (x) z+e Nullstelle von p[ [x ist und außerdem Φϕ ηs |R nach 3.12 stetig ist, gilt wie behauptet z+e Φϕ ηs |R ∈ T . Damit wird das Aufstellen folgender Behauptung möglich: Für alle ϕ ∈ T und alle s ∈ Z gilt32 ΦΦϕ ηs |R = Φϕ ηs . (3.14) Diese Behauptung ist wahr, weil Φϕ ηs eine Fortsetzung von Φϕ ηs |R ist, die die vertikale Stetigkeitsforderung 3.8 erfüllt und weil für alle w ∈ D (Φϕ ηs ) die Zahl Φϕ ηs (w) wegen 3.9 Nullstelle von pz+e \ , damit wegen eηs (w) = ew Nullstelle von p[ \ ηs (w) z\ +ew ist, folglich Φϕ ηs zudem die Forderung 3.9 erfüllt und damit Φϕ ηs gleich der einzigen Funktion ΦΦσ ηs |R mit diesen Eigenschaften ist. Wir zeigen jetzt, dass die durch ∼:= {(ϕ, ψ) ∈ T × T ; ∃s ∈ Z : ψ = Φϕ ηs |R } definierte Relation eine Äquivalenzrelation auf T ist: Sie ist reflexiv auf T , weil für alle ϕ ∈ T eine Zahl s ∈ Z existiert (nämlich s = 0), sodass ϕ = Φϕ ηs |R , was zeigt, dass ϕ ∼ ϕ. Dass sie symmetrisch ist, sieht man wie folgt: Seien ϕ, ψ ∈ T mit ϕ ∼ ψ. Dann gibt es s ∈ Z, sodass ψ = Φϕ ηs |R . Damit gilt ϕ = Φϕ η0 |R = Φϕ ηs η−s |R = ΦΦϕ ηs |R η−s |R = 3.14 Φψ η−s |R und folglich ψ ∼ ϕ. Zum Nachweis der Transitivität seien ϕ, ψ und σ ∈ T mit ϕ ∼ ψ und ψ ∼ σ. Dann gibt es r, s ∈ Z, sodass ψ = Φϕ ηr |R und σ = Φψ ηs |R . Damit gilt σ = Φψ ηs |R = ΦΦϕ ηr |R ηs |R = Φϕ ηr ηs |R = Φϕ ηr+s |R , woraus ϕ ∼ σ folgt. 3.14 Also ist ∼ eine Äquivalenzrelation auf der M + 1-elementigen Menge T . Sei K := T/∼ die Menge der Äquivalenzklassen bezüglich ∼. Es gibt eine Menge S ⊆ T , die genau einen Repräsentanten pro Äquivalenzklasse enthält. Zu jedem Repräsentanten ϕ ∈ S konstruieren wir jetzt eine δ-Auffaltung: 32 Auch der Ausdruck Φϕ ηs auf der rechten gen Fußnote 32 auf Seite 45 trotz R (ηs ) {w ∈ C; Re (w) < ln (δ)} 3 w 7→ Φσ (w + 2πis). Seite von Gleichung 3.14 ist we* D (Φϕ ) definiert; er ist gleich 91 3 Anwendung in der Theorie der partiellen Differentialgleichungen Sei ϕ ∈ S. Dann gibt es genau eine Äquivalenzklasse K ∈ K mit ϕ ∈ K. Es gibt k ∈ N, sodass k + 1 die Zahl der Elemente von K ist. Wir zeigen jetzt, dass Φϕ eine 2πi (k + 1) -periodische Funktion ist und dass alle g ∈ Z mit ϕ = Φϕ ηg |R ganzzahlige Vielfache von k + 1 sind: (3.15) Die Funktion Z 3 a 7→ Φϕ ηa |R nimmt wegen 3.13 und aufgrund der Definition von ∼ nur Werte in der Äquivalenzklasse K an und ist wegen deren Endlichkeit nicht injektiv. Es gibt also zwei Zahlen r, s ∈ Z mit r < s und Φϕ ηr |R = Φϕ ηs |R , sodass es keine zwei Zahlen r̃, s̃ ∈ Z mit r̃ < s̃, Φϕ ηr̃ |R = Φϕ ηs̃ |R und s̃ − r̃ < s − r gibt (d. h. r und s sind mit minimalem Abstand wählbar). Weil Φϕ = Φϕ ηr η−r = ΦΦϕ ηr |R η−r = ΦΦϕ ηs |R η−r = Φϕ ηs η−r = Φϕ ηs−r , 3.14 3.14 ist Φϕ eine 2πi (s − r)-periodische Funktion. Da alle Elemente von K als Werte der mit eben Bewiesenem (s − r)-periodischen Funktion Z 3 a 7→ Φϕ ηa |R auftauchen, kann s − r nicht kleiner sein als die Zahl dieser Elemente, d. h. es gilt s − r ≥ k + 1. Da die Elemente von K die einzigen sind, die als Werte der Funktion {n ∈ N; n < s − r} 3 a 7→ Φϕ ηa |R auftauchen, könnte diese, weil ihr Definitionsbereich (s − r)-elementig ist, im Fall s − r > k + 1 nicht injektiv sein und es gäbe zwei Zahlen r̃, s̃ ∈ {n ∈ N; n < s − r} mit r̃ < s̃ und Φϕ ηr̃ |R = Φϕ ηs̃ |R . Weil dann s̃ − r̃ < s − r wäre, ist dies nicht möglich und es gilt s − r ≤ k + 1. Es folgt also s − r = k + 1. Der erste Teil von Behauptung 3.15 ist gezeigt. Sei nun g ∈ Z mit ϕ = Φϕ ηg |R . Es gibt genau eine ganze Zahl m ∈ Z mit g ∈ ]m, m + 1]. Mit r̃ := (k + 1) m und s̃ := g gilt r̃ < s̃. Aufgrund der bereits k+1 gezeigten 2πi (k + 1)-Periodizität von Φϕ gilt Φϕ = Φϕ η(k+1)m . Es folgt Φϕ ηr̃ = Φϕ η(k+1)m = Φϕ = ΦΦϕ ηg |R = Φϕ ηg = Φϕ ηs̃ . 3.14 Da damit der Fall s̃ − r̃ < s − r ausgeschlossen ist, gilt g = s̃ ≥ s − r + r̃ = k + 1 + (k + 1) m = (k + 1) (m + 1). Weil aufgrund der Wahl von m außerdem g ≤ (k + 1) (m + 1) gilt, ist g = (k + 1) (m + 1) ganzzahliges Vielfaches von k + 1 und auch der zweite Teil von Behauptung 3.15 gezeigt. 1 Sei V := B 0, δ k+1 \ {0}. Für alle ξ ∈ V ist die Menge33 (k + 1) [[{ξ}] exp] unendlich 33 Ähnlich wie bei der Definition der Schreibweise − [I] in Fußnote 25 auf Seite 83 verstehen wir für 92 3.2 Koeffizientenabhängigkeit der Nullstellen komplexer Polynome und Teilmenge von {w ∈ C; Re (w) < ln (δ)} (letzteres, weil für w ∈ (k + 1) [[{ξ}] exp] aus der Annahme Re (w) ≥ ln (δ) folgen würde, dass |ξ| = exp alle 1 w w 1 ln (δ) = δ k+1 ≥ exp = exp Re k+1 k+1 k+1 v w und damit ξ ∈ / V ). Für je zwei v, w ∈ (k + 1) [[{ξ}] exp] gilt e k+1 = e k+1 und ist ein ganzzahliges Vielfaches von 2πi, d. h. w − v ein ganzdeshalb die Differenz w−v k+1 zahliges Vielfaches von 2πi (k + 1). Daraus folgt, weil Φϕ nach 3.15 eine 2πi (k + 1)periodische Funktion ist, dass das Bild Φϕ [(k + 1) [[{ξ}] exp]] ⊆ C einelementig ist. Mit diesem Wissen definieren wir die Funktion34 θ := V ∪ {0} 3 ξ 7→ ∈ (Φϕ [(k + 1) [[{ξ}] exp]]) , wenn ξ ∈ V , wenn ξ = 0 t . (3.16) Für alle ξ ∈ D (θ) gilt ζ := z + ξ k+1 ∈ B (z, δ) und τ := θ (ξ) ∈ B (t, ε) und τ ist Nullstelle von pcζ̂ , (3.17) letzteres, weil für ξ = 0 die Zahl θ (0) = t Nullstelle von pcẑ ist und es für ξ ∈ V eine Zahl w ∈ (k + 1) [[{ξ}] exp] gibt, womit wegen 3.9 die Zahl Φϕ (w) Nullstelle von p[ z\ +ew w ist und dies wegen Φϕ (w) = θ (ξ) = τ und wegen z+ew = z+ e k+1 bedeutet, dass τ Nullstelle von pcζ̂ ist. k+1 = z+ξ k+1 = ζ Es folgt eine Überlegung, derzufolge θ eine (k + 1)-fache δ-Auffaltung ist: Aufgrund 1 der Wahl von δ gilt 0 < δ 6= 1. Aufgrund der Definition von V gilt D (θ) = B 0, δ k+1 und aufgrund der Definition von θ gilt R (θ) ⊆ C. Wie folgt überzeugt man sich davon, dass θ holomorph auf V ist: Sei ξ ∈ V . Dann gibt es w ∈ (k + 1) [[{ξ}] exp]. Die auf der offenen Kreisscheibe S := B (w, π) definierte Funktion w E := S 3 w 7→ e k+1 I ⊆ C und c ∈ C unter c [I] die Menge {cj; j ∈ I}. Auch hier ergibt sich die Schreibweise aus der Definition des Nachbereichs in Fußnote 3 auf Seite 9, wenn man c als die Funktion C 3 j 7→ cj auffasst. u n Hier gilt also (k o + 1) [[{ξ}] exp] = {(k + 1) u; u ∈ [{ξ}] exp} = {(k + 1) u; u ∈ C, e = ξ} = w w ∈ C; e k+1 = ξ . 34 Nach Fußnote 27 auf Seite 39 ist ∈ (Φϕ [(k + 1) [[{ξ}] exp]]) das Element der einelementigen Menge Φϕ [(k + 1) [[{ξ}] exp]]. 93 3 Anwendung in der Theorie der partiellen Differentialgleichungen ist injektiv (weil der Radius von S klein genug gewählt ist) und von nichtverschwindender Ableitung. Ihre Inverse L := E −1 ist deshalb holomorph. Die Menge D (L) = R (E) ist, weil E (w) = ξ, eine offene Umgebung von ξ. Für alle ψ ∈ D (L) gilt ψ = E (L (ψ)), deshalb L (ψ) ∈ (k + 1) [[{ψ}] exp] und deshalb Φϕ (L (ψ)) =∈ (Φϕ [(k + 1) [[{ξ}] exp]]) . Es ist also θ|D(L) = Φϕ L als Verkettung zweier holomorpher Funktionen holomorph. Weil dies für alle ξ ∈ V gilt, ist θ holomorph auf V . Die Stelle 0 ∈ D (θ) ist der einzige Punkt, an dem die Holomorphie von θ noch nicht gezeigt wurde. Da Φϕ und damit auch θ beschränkt ist, gibt es nach dem Riemannschen Hebbarkeitssatz (siehe z.B. [Fre, S. 130]) eine holomorphe Funktion h : D (θ) → C, sodass h|V = θ|V . Dass h (0) = t (d. h., dass mit t der richtige Funktionswert für θ (0) gewählt wurde), sieht man folgendermaßen: Wäre h (0) 6= t, so wäre |h (0) − t| > 0 und es gäbe, weil h 1 stetig bei 0 ist, eine Zahl ρ > 0 mit ρ ≤ δ k+1 , sodass für alle ξ ∈ B (0, ρ) \ {0} die Ungleichung 1 |θ (ξ) − t| = |h (ξ) − t| > |h (0) − t| =: γ 2 gelten würde. Wegen γ ≤ ε besäße pcẑ keine Nullstellen auf B [t, γ] \ {t}. Nach Lemma 3.2.1 gäbe es dann β > 0, sodass für alle ζ ∈ B (z, β) die mit Vielfachheit gezählte Zahl der Nullstellen von pcζ̂ auf B (t, γ) gleich M + 1 wäre. Es gäbe ξ ∈ B (0, ρ) \ {0} mit ζ := z + ξ k+1 ∈ B (z, β). Die Polynomfunktion pcζ̂ besäße genau M + 1 mit Vielfachheit gezählte Nullstellen auf B (t, ε). Nach 3.17 wäre θ (ξ) eine Nullstelle von pcζ̂ , die wegen |θ (ξ) − t| > γ in B (t, ε) \B (t, γ) läge. Nach 3.6 kann pcζ̂ aber nicht mehr als M + 1 mit Vielfachheit gezählte Nullstellen auf B (t, ε) haben. Deshalb gilt h (0) = t. Wir haben gezeigt, dass θ holomorph ist. Damit ist θ eine (k + 1)-fache δ-Auffaltung. Zu jedem Repräsentanten ϕ ∈ S haben wir eine δ-Auffaltung konstruiert. Sei Θ die Menge dieser δ-Auffaltungen. Dass keinen zwei voneinander verschiedenen Repräsentanten ϕ und ψ aus S bei dieser Konstruktion die selbe δ-Auffaltung θ zugeordnet wird, hat folgenden Grund: Die Äquivalenzklassen, zu denen ϕ und ψ gehören, würden in der Zahl ihrer Elemente übereinstimmen – diese wäre gleich wdgδ (θ). Es gibt w ∈ C mit Re (w) < ln (δ), 1 w womit ξ := e wdgδ (θ) wegen |ξ| = exp Re wdgw (θ) < δ wdgδ (θ) Element von D (θ) und δ 94 3.2 Koeffizientenabhängigkeit der Nullstellen komplexer Polynome w ∈ wdgδ (θ) [[{ξ}] exp] wäre. Damit wäre Φϕ (w) =∈ (Φϕ [wdgδ (θ) [[{ξ}] exp]]) = θ (ξ) = 3.16 3.16 ∈ (Φψ [wdgδ (θ) [[{ξ}] exp]]) = Φψ (w) . Mit 3.10 würde folgen, dass ϕ = ψ. Verschiedenen Repräsentanten aus S werden also verschiedene δ-Auffaltungen zugeordnet. Damit kann Punkt 1 aus Satz 3.2.11 bewiesen werden: Die Vielfachheit der Nullstelle P P t von pcẑ ist gleich35 M + 1 = #T = K∈K #K = θ∈Θ wdgδ (θ). Punkt 3 aus Satz 3.2.11 ist mit dem Wissen, dass jede Funktion θ ∈ Θ eine δ-Auffaltung ist, eine direkte Folgerung aus 3.17. Es fehlt also nur noch der Beweis von Punkt 2 aus Satz 3.2.11. Sei dazu ζ ∈ B (z, δ) und τ ∈ B (t, ε) Nullstelle von pcζ̂ . Im Fall ζ = z folgt die Behauptung aus dem Umstand, dass t die einzige Nullstelle von pcẑ auf B (t, ε) ist und alle δ-Auffaltungen aus Θ die Zahl 0 auf t abbilden. Sei also ζ ∈ B (z, δ) \ {z}. Dann gibt es w ∈ C mit Re (w) < ln (δ) und ζ = z +ew . Nach 3.10 gibt es dann genau eine Funktion ϕ ∈ T mit Φϕ (w) = τ . Es gibt genau einen Repräsentanten ψ ∈ S mit ϕ ∼ ψ. Es gibt daher s ∈ Z, sodass ψ = Φϕ ηs |R . Sei θ die zum Repräsentanten ψ konstruierte δ-Auffaltung aus Θ. Sei u := w − 2πis. Dann gilt Φψ (u) = ΦΦϕ ηs |R (u) = Φϕ ηs (u) = Φϕ (u + 2πis) = Φϕ (w) = τ . 3.14 u Sei ξ := e wdgδ (θ) . Dann gilt ξ ∈ D (θ), weil Re (u) |ξ| = exp wdgδ (θ) ! Re (w) = exp wdgδ (θ) ! ! 1 1 < exp ln (δ) = δ wdgδ (θ) . wdgδ (θ) Außerdem gilt z + ξ wdgδ (θ) = z + eu = z + ew = ζ und weil u wegen der Wahl von ξ ein Element von wdgδ (θ) [[{ξ}] exp] ist, θ (ξ) = ∈ (Φψ [wdgδ (θ) [[{ξ}] exp]]) = Φψ (u) = τ . 3.16 Die in Punkt 3 von Satz 3.2.11 behauptete Existenz ist damit gezeigt. Es folgt der Beweis der Eindeutigkeit: Seien θ ∈ Θ2 und ξ ∈ D (θ0 ) × D (θ1 ), sodass 35 Für eine endliche Menge T bezeichne #T die Zahl der Elemente von T . 95 3 Anwendung in der Theorie der partiellen Differentialgleichungen für beide36 j ∈ 2 die Gleichungen ζ = z + ξj wdgδ (θj ) und θj (ξj ) = τ gelten. Für beide j ∈ 2 ist dann folgende Überlegung möglich: Es gibt wj ∈ C, sodass wj ξj = e ( ) . Es gilt Re (w ) < ln (δ), weil andernfalls |ξ | = exp j j wdgδ θj 1 1 Re (wj ) wdgδ (θj ) ≥ δ wdgδ (θj ) und damit ξj ∈ / D (θj ) wäre. Es gibt einen Repräsentanten ϕj ∈ S, sodass θj die zu ϕj konstruierte δ-Auffaltung ist. Weil wj ein Element von wdgδ (θj ) [[{ξj }] exp] ist, gilt damit τ = θj (ξj ) = ∈ Φϕj [wdgδ (θj ) [[{ξj }] exp]] = Φϕj (wj ) . 3.16 Wegen ew0 = ξ0 wdgδ (θ0 ) = ζ − z = ξ1 wdgδ (θ1 ) = ew1 ist w0 − w1 ein ganzzahliges Vielfaches von 2πi. Es gibt also s ∈ Z, sodass w1 = w0 + 2πis. Der Wert der beiden Funktionen Φϕ0 und ΦΦϕ1 ηs |R stimmt an der Stelle w0 wegen Φϕ0 (w0 ) = τ = Φϕ1 (w1 ) = Φϕ1 ηs (w0 ) = ΦΦϕ1 ηs |R (w1 ) 3.14 überein. Nach 3.10 gilt damit ϕ0 = Φϕ1 ηs |R . Das wiederum bedeutet, dass ϕ0 ∼ ϕ1 . Da ϕ0 und ϕ1 Repräsentanten aus S sind, folgt daraus ϕ0 = ϕ1 . Damit gilt auch θ0 = θ1 und wdgδ (θ0 ) = wdgδ (θ1 ). Aus ϕ0 = Φϕ0 ηs |R folgt mit 3.15, dass s ein ganzzahliges Vielfaches von wdgδ (θ0 ) ist. Es gibt also m ∈ Z mit s = m wdgδ (θ0 ). Damit gilt w1 w0 +2πis ξ1 = e wdgδ (θ1 ) = e wdgδ (θ1 ) = e w0 +2πim wdgδ (θ0 ) wdgδ (θ1 ) w0 = e wdgδ (θ1 ) +2πim w0 = e wdgδ (θ0 ) = ξ0 . Mit der Feststellung, dass die in Punkt 2 behauptete Eindeutigkeit gezeigt ist, endet der Beweis von Satz 3.2.11. Bemerkung 3.2.12 (Puiseux-Reihen). Die Elemente der unter den Voraussetzungen von Satz 3.2.11 existierenden Menge Θ sind auf Kreisscheiben mit Mittelpunkt 0 ∈ C definierte holomorphe Funktionen und deshalb in Potenzreihen um 0 ∈ C entwickelbar. Für alle θ ∈ Θ gibt es also eine Koeffizientenfolge c (θ) ∈ CN , sodass für alle P ξ ∈ D (θ) die Gleichung θ (ξ) = n∈N c (θ)n ξ n gilt. Punkt 2 von Satz 3.2.11 lässt sich damit wie folgt interpretieren: Für alle ζ ∈ B (z, δ) 36 Nach Bemerkung 1.1.1 auf Seite 9 gilt 2 = {0, 1}. 96 3.3 Untere Abschätzung positiver Polynome und alle Nullstellen τ ∈ B (t, ε) von pcζ̂ gibt es eine (und falls ζ 6= z nur eine) δ-Auffaltung θ ∈ Θ und eine (und falls ζ 6= z nur eine) wdgδ (θ)-te Wurzel ξ ∈ D (θ) von ζ − z, sodass X n τ= c (θ)n (ζ − z) wdgδ (θ) , n∈N wobei die Potenz (ζ − z) n wdgδ (θ) als ξ n zu lesen ist. Punkt 3 von Satz 3.2.11 lässt sich ebenfalls auf diese Weise interpretieren: Für alle θ ∈ Θ, alle ζ ∈ B (z, δ) und alle wdgδ (θ)-ten Wurzeln ξ ∈ D (θ) von ζ − z ist n X c (θ)n (ζ − z) wdgδ (θ) ∈ B (t, ε) n∈N n eine Nullstelle von pcζ̂ , wobei die Potenz (ζ − z) wdgδ (θ) als ξ n zu lesen ist. Eine Potenzreihe mit gebrochenem Exponenten wie sie hier auftaucht wird PuiseuxReihe genannt (siehe [Hör, S. 364] oder [Voi]). 3.3 Untere Abschätzung positiver Polynome Ziel dieses Abschnitts ist es, zu beweisen, dass jede auf Rn positive Polynomfunktion von unten durch eine Funktion Rn 3 x 7→ C 1 + |x|2 −N mit C > 0 und N ∈ N abgeschätzt werden kann. Für n = 1 ist diese Aussage offensichtlich, da dann jede positive Polynomfunktion sogar durch eine positive Konstante von unten abgeschätzt werden kann. Dass diese Eigenschaft in höheren Dimensionen verloren geht, zeigt folgendes aus [Hör, S. 369] entnommene Beispiel: Die Polynomfunktion R2 3 x 7→ (x0 x1 − 1)2 + x20 ist positiv, weil die Quadrate (x0 x1 − 1)2 und x20 nicht zugleich null werden können. Sie nimmt jede positive Zahl als Funktionswert an, weil sie für alle ε > 0 das Paar ε1/2 , ε−1/2 auf ε abbildet. Also kann sie nicht durch eine positive Konstante von unten abgeschätzt werden. 97 3 Anwendung in der Theorie der partiellen Differentialgleichungen Lemma 3.3.1. Sei37 p ∈ (Ch1i)h1i irreduzibel38 mit deg p > 0 und z ∈ C. Dann gilt39 pẑ ∈ Ch1i \ {0}. Beweis. Nur innerhalb dieses Beweises treffen wir folgende Konvention: Für M ⊆ N endlich sei mit 1M die Indikatorfunktion, die von N nach C abbildet und damit Element von Ch1i ist, gemeint, und mit 1M die Indikatorfunktion, die von N nach Ch1i abbildet und damit Element von (Ch1i)h1i ist. Diese Unterscheidung ist zur Vermeidung von Zweideutigkeiten notwendig. Auch nur innerhalb dieses Beweises definieren wir: Für a ∈ (Ch1i)h1i sei tr (a) das Polynom tr (a) := (aα )β α∈N β∈N ∈ (Ch1i)h1i. Es ist das durch Vertauschen (Transponieren) der Indizes, d. h. durch Vertauschen der Variablen aus dem Polynom a hervorgehende Polynom40 . Für alle a ∈ (Ch1i)h1i gilt tr (tr (a)) = a, weil für alle α, β ∈ N die Gleichung (tr (tr (a))α )β = tr (a)β = (aα )β gilt. α Für alle a, b ∈ (Ch1i)h1i gilt tr (a b) = tr (a) tr (b), weil für alle α, β ∈ N die Gleichung tr (a b)β X γ+δ=α α = ((a b)α )β = tr (a)β X γ+δ=α γ tr (b)β δ = tr (a)β tr (b)β (aγ )β (bδ )β = γ+δ=α β X aγ bδ = α = (tr (a) tr (b))β α gilt. Die Eins im Polynomring (Ch1i)h1i ist das Polynom 1{0} . Es gilt tr 1{0} = 1{0} , was man durch Anwendung der Kürzungsregel (Lemma 1.4.3 auf Seite 20) auf die Gleichung tr 1{0} ·1{0} = tr 1{0} · 1{0} = tr 1{0} tr 1{0} sieht (anwendbar, weil aus tr 1{0} = 0 folgen würde, dass 1{0} = tr tr 1{0} kein Nullteiler ist). 37 = tr (0) = 0, weshalb 1{0} Die Notation Rh1i für die Menge der Polynome in einer Variablen über einem Ring R wird in Definition 1.1.2 auf Seite 9 eingeführt. 38 In Definition 1.4.7 auf Seite 21 wird der Begriff der Irreduzibilität definiert. 39 Die Schreibweise px̂ für Polynome p ∈ (Rh1i)h1i und x ∈ R wird in Definition 1.1.8 auf Seite 12 eingeführt. 40 Anschaulich passiert Folgendes: Würde man a ein Polynom in der Variablen t mit Koeffizienten, die komplexe Polynome in der Variablen z sind, nennen, so würde man tr (a) das Polynom nennen, dass aus p durch Umordnung der Terme hervorgeht und ein Polynom in der Variablen z mit Koeffizienten, die komplexe Polynome in der Variablen t sind, nennen. 98 3.3 Untere Abschätzung positiver Polynome Ist a ∈ (Ch1i)h1i eine Einheit, so gibt es b ∈ (Ch1i)h1i mit a b = 1{0} . Damit gilt 1{0} = tr 1{0} = tr (a b) = tr (a) tr (b), weshalb tr (a) ebenfalls eine Einheit ist. Ist umgekehrt a ∈ (Ch1i)h1i ein Polynom, sodass tr (a) eine Einheit ist, so ist a = tr (tr (a)) eine Einheit. Ein Polynom a ∈ (Ch1i)h1i ist also genau dann eine Einheit, wenn tr (a) eine Einheit ist. Nach diesen Vorbereitungen kommen wir jetzt zum Beweis. Wäre pẑ = 0, so wäre [ (p) (z) = tr X tr (p)β z β = β∈N X (pα )β β∈N α∈N zβ = X (pα )β z β β∈N = (pcα (z))α∈N = pẑ = 0. α∈N Nach Kriterium 2.1.17 auf Seite 32 wäre b := 1{1} − z1{0} ein Teiler von tr (p), d. h. es gäbe q ∈ (Ch1i)h1i mit tr (p) = b q. Dann wäre tr (b) tr (q) = tr (b q) = tr (tr (p)) = p. (3.18) Man sähe dann wie folgt, dass weder tr (b) noch tr (q) Einheiten wären und deshalb p im Widerspruch zur Voraussetzung nicht irreduzibel wäre: Weil deg b = 1, ist b keine Einheit41 und damit auch tr (b) keine Einheit. Weil für alle α, β ∈ N die Geichung (bβ )α = −z1{0} 1 {0} 0 1{1} 0 1{1} − z1{0} β = α −z für β = 0 = für β = 1 1 für α = β = 0 sonst sonst − z1{0} α 0 für α = 0, β = 1 = α für α = 0 sonst = 1{1} − z1{0} 1{0} β α β gilt, gilt tr (b) = 1{1} − z1{0} 1{0} und damit deg (tr (b)) = 0. Aus Gleichung 3.18 ergäbe sich damit deg (tr (q)) = deg p > 0, weshalb auch tr (b) keine Einheit wäre41 . 41 Siehe Fußnote 20 auf Seite 22. 99 3 Anwendung in der Theorie der partiellen Differentialgleichungen Lemma 3.3.2. Sei f : R → R semialgebraisch42 . Dann gibt es eine endliche Menge Q ⊆ (Ch1i)h1i, sodass ∀q ∈ Q : q irreduzibel und deg q > 0 und ∀z ∈ R∃q ∈ Q : qẑ 6= 0 und f (z) ist Nullstelle von qcẑ . Beweis. Nach Definition 1.2.5 auf Seite 14 gibt es eine endliche Menge E ⊆ S (R2 ) von Urbildschnitten, sodass f = ∪E. Für alle S ∈ E gibt es nach Definition 1.2.4 auf Seite 14 eine endliche Menge FS ⊆ U (R2 ) von Polynom-Urbildern, sodass S = ∩FS . Für alle der endlich vielen U ∈ G := ∪ {FS ; S ∈ E} gibt es nach Definition 1.2.3 auf Seite 14 ein Polynom pU ∈ Rh2i und einen Achsenabschnitt43 µU ∈ Λ, sodass U = [µU ] pcU . Für alle U ∈ G ist das Polynom44 pU h1i ∈ (Rh1i)h1i auch ein Element von (Ch1i)h1i. n o Die Menge K := pU h1i ; U ∈ G, pU h1i 6= 0 und pU h1i keine Einheit in (Ch1i)h1i ist endlich. Nach Satz von Gauß (Satz 1.4.12 auf Seite 22) ist (Ch1i)h1i ein faktorieller Ring, weil C ein solcher ist45 . Für alle k ∈ K gibt es also nach Definition 1.4.9 auf Seite 21 eine Zahl nk ∈ N und eine Funktion fk ∈ {q ∈ (Ch1i)h1i ; q Primelement}nk +1 , Q sodass46 k = i∈nk (fk )i . Sei damit P := {(fk )i ; k ∈ K, i ∈ nk + 1}. Durch Weglassen aller Polynome vom Grad kleiner eins erhält man die endliche Menge Q := {q ∈ P ; deg q > 0}, von der jetzt gezeigt wird, dass sie die behaupteten Eigenschaften erfüllt. Da nach Lemma 1.4.10 auf Seite 21 Primelemente irreduzibel sind, ist Q wie behauptet eine Menge irreduzibler Polynome vom Grad größer null und die erste Eigenschaft ist gezeigt. 42 2 Die Funktion f : R → R ist Teilmenge von R und heißt deshalb 2semialgebraisch, wenn 2 2 f ∈ V R . Zur Menge V R der semialgebraischen Teilmengen von R siehe Definition 1.2.5 auf Seite 14. Auf diese Weise wird der Begriff der semialgebraischen Funktion auch bei [Boc0, S. 25], [Boc1, S. 28] und [Pre, S. 94] definiert, nicht jedoch bei [Hör, S. 367], wo auch +∞ und −∞ als Funktionswerte erlaubt sind und der Subgraph anstelle des Graphen herangezogen wird. 43 In Definition 1.2.2 auf Seite 13 wird die Menge Λ der Achsenabschnitte definiert. 44 Zur Schreibweise ph1i siehe Definition 1.1.7 auf Seite 12. 45 Wie bereits in Fußnote 19 auf Seite 78 festgestellt, ist jeder Körper ein faktorieller Ring. 46 Aus Bemerkung 1.1.1 auf Seite 9 folgt, dass i ∈ nk eine kurze Schreibweise für i ∈ N, i < nk ist. 100 3.3 Untere Abschätzung positiver Polynome Die zweite Eigenschaft zeigen wir indirekt durch die Annahme, es gäbe z ∈ R, sodass für alle q ∈ Q die Zahl f (z) keine Nullstelle von qcẑ wäre oder qẑ das Nullpolynom wäre. Dann gäbe es aufgrund der Stetigkeit der endlich vielen Polynome aus Q eine Zahl ε > 0, sodass für alle q ∈ Q das Polynom qcẑ keine Nullstelle auf dem Intervall47 BR (f (z) , ε) hätte oder qẑ = 0 wäre. Für alle q ∈ Q wäre also, weil qcẑ sein Vorzeichen auf BR (f (z) , ε) nicht wechseln könnte, das Bild48 sgn [qcẑ [BR (f (z) , ε)]] einelementig. Für alle q ∈ P \Q gilt deg q < 1, damit auch deg c qẑ < 1, weshalb qcẑ konstant und damit sgn [qcẑ [BR (f (z) , ε)]] ebenfalls einelementig ist. h i Also wäre für alle k ∈ K das Bild sgn kcẑ [BR (f (z) , ε)] einelementig, weil alle FakQ toren des Produkts k = i∈nk (fk )i Elemente von P sind. Für alle U ∈ G könnte man sich wie folgt von der Einelementigkeit des Bildes h1i ) [B (f (z) , ε)] sgn (p\ überzeugen: Falls deg pU h1i < 1, gilt auch U R ẑ h1i ) konstant und deshalb das Bild einelementig ist. deg pU h1i < 1, weshalb (p\ U ẑ ẑ h1i Andernfalls gilt pU 6= 0 und pU h1i ist keine Einheit in (Ch1i)h1i (eine solche wäre vom Grad null), d. h. es gilt pU h1i ∈ K. Für Polynome aus K ist die Einelementigkeit schon gezeigt. Weil (z, f (z)) ∈ f , gibt es einen Urbildschnitt S ∈ E mit (z, f (z)) ∈ S. Für alle Polynom-Urbilder U ∈ FS ⊆ G könnte man sich folgendes überlegen: Wegen S = ∩FS ⊆ U gilt (z, f (z)) ∈ U = [µU ] pcU , d. h. es gilt pcU (z, f (z)) ∈ µU . Nach Lemma 1.1.10 auf Seite 13 gilt h1i ) (f (z)) = p c (p\ U U (z, f (z)) ∈ µU . ẑ Aufgrund der bewiesenen Einelementigkeit wäre sogar h1i ) [B (f (z) , ε)] ⊆ µ (p\ U R U ẑ und wieder mit Lemma 1.1.10 auf Seite 13 wäre pcU [{z} × BR (f (z) , ε)] ⊆ µU , was äquivalent zu {z} × BR (f (z) , ε) ⊆ [µU ] pcU = U ist. Folglich wäre {z} × BR (f (z) , ε) ⊆ ∩FS = S ⊆ f und f wäre keine Funktion. 47 48 Mit BR (t, ε) ist für t ∈ R und ε > 0 die Menge {τ ∈ R; |τ − t| < ε} = ]t − ε, t + ε[ gemeint. Die Funktion sgn wird in Definition 1.2.1 auf Seite 13 definiert. 101 3 Anwendung in der Theorie der partiellen Differentialgleichungen Lemma 3.3.3. Sei f : R → R semialgebraisch mit der Eigenschaft ∀µ > 0∃κ > 0∀z ∈ R\BR (0, µ) : f (z) > κ. Dann gibt es c > 0 und N ∈ N, sodass ∀z ∈ R\ {0} : f (z) > c 1 + z −2 −N . Beweis. Für alle z ∈ R\ {0} gilt wegen z ∈ R\BR (0, |z|) nach Voraussetzung f (z) > 0. (3.19) Nach Lemma 3.3.2 gibt es eine endliche Menge Q ⊆ (Ch1i)h1i irreduzibler Polynome vom Grad größer null, sodass es für alle z ∈ R ein Polynom q ∈ Q gibt, sodass f (z) Nullstelle von qcẑ und qẑ 6= 0 ist. Sei T := {q ∈ Q; 0 ist Nullstelle von pc0̂ }. Weil für jedes Polynom q ∈ Q\T die Funktion R2 3 (z, t) 7→ qcẑ (t) ∈ R stetig und ihr Wert an der Stelle (0, 0) von Null verschieden ist, gibt es σq > 0, sodass für alle z ∈ B (0, σq ) die Polynomfunktion c qẑ nullstellenlos auf B (0, σq ) ist. (3.20) Es gibt ν > 0, sodass für alle q ∈ Q\T die Ungleichung49 ν ≤ σq (3.21) gilt. Auf alle q ∈ T ist Satz 3.2.11 auf Seite 84 anwendbar: Sei q ∈ T . Dann gibt es, weil deg q > 0, eine Zahl Q ∈ N, sodass deg q = Q+1. Damit gilt50 q ∈ (Ch1i)Q+2 h1i. Wegen deg q = Q + 1 gilt qQ+1 6= 0. Weil q irreduzibel, gibt es kein t ∈ (Ch1i)h1i mit deg t > 0, sodass t2 |q. Aufgrund von Kriterium 3.1.17 auf Seite 74 gilt damit DisQ (q) ∈ Ch1i \ {0}. Die Zahl 0 ist Nullstelle von qb0̂ . Mit Lemma 3.3.1 sieht man, dass51 q0̂ 6= 0. Also ist Satz 3.2.11 auf Seite 84 anwendbar und es 49 Die Schreibweise ν := min {σq ; q ∈ Q\T } wird hier vermieden, weil der Fall Q\T = ∅ nicht ausgeschlossen ist. 50 In Definition 2.1.8 auf Seite 28 werden die Mengen RK h1i definiert. 51 Aus Lemma 3.3.2 allein lässt sich dies nicht folgern, auch wenn es auf den ersten Blick so aussieht. 102 3.3 Untere Abschätzung positiver Polynome gibt εq > 0, 0 < δq 6= 1 und eine endliche, nichtleere Menge Θq von δq -Auffaltungen52 mit folgender Eigenschaft: Für alle z ∈ B (0, δq ) und alle Nullstellen t ∈ B (0, εq ) von qcẑ gibt es eine δq -Auffaltung θ ∈ Θq und ξ ∈ D (θ) , sodass z = ξ wdgδq (θ) und θ (ξ) = t. (3.22) Sei H := {θ; q ∈ T, θ ∈ Θq , θ 6= 0}. Für alle θ ∈ H gibt es wegen θ 6= 0 eine holomorphe Funktion hθ : D (θ) → C mit hθ (0) 6= 0 und eine Zahl53 vθ ∈ N, sodass für alle ξ ∈ D (θ) die Gleichung (3.23) ξ vθ hθ (ξ) = θ (ξ) gilt. Weil hθ (0) 6= 0 und hθ stetig, gibt es ρθ > 0 mit B (0, ρθ ) ⊆ D (θ), sodass für alle ξ ∈ B (0, ρθ ) die Ungleichung |hθ (ξ)| > 1 |hθ (0)| 2 (3.24) gilt. Es gibt eine Zahl N ∈ N, sodass für alle θ ∈ H die Ungleichung vθ ≤ 2N (3.25) gilt. Es gibt µ > 0 mit54 µ ≤ 1 und µ ≤ ν, sodass für alle q ∈ T die Ungleichung µ ≤ δq und für alle θ ∈ Θq ∩ H die Ungleichung µ ≤ ρθ wdgδq (θ) gilt. (3.26) Nach Voraussetzung gibt es dann κ > 0, sodass für alle z ∈ R\BR (0, µ) die Ungleichung f (z) > κ (3.27) gilt. Es gibt c > 0 mit c ≤ κ und c < ν, sodass für alle q ∈ T die Ungleichung c < εq und für alle θ ∈ H die Ungleichung c ≤ 21 |hθ (0)| gilt. (3.28) 52 Der Begriff δ-Auffaltung wird in Definition 3.2.8 auf Seite 84 definiert. Die Zahl vθ ist die Vielfachheit der Nullstelle bei Null. 54 Hinweis: Es kann vorkommen, dass eine Funktion θ ∈ H für zwei Polynome q, r ∈ T mit Radien δq 6= δr zugleich δq -Auffaltung und δr -Auffaltung ist. Ein Beispiel dafür lautet D (θ) = B (0, 2), δq = 2, wdgδq (θ) = 1, δr = 4, wdgδr (θ) = 2. 53 103 3 Anwendung in der Theorie der partiellen Differentialgleichungen Es folgt der Beweis der Ungleichung. Sei z ∈ R\ {0}. Es gibt drei Fälle: 1. Fall |z| ≥ µ: Dann gilt f (z) > κ ≥ c ≥ c (1 + z −2 ) 3.27 −N . 3.28 2. Fall |z| < µ und f (z) > c: Dann gilt f (z) > c ≥ c (1 + z −2 ) −N . 3. Fall |z| < µ und f (z) ≤ c: Dann gibt es q ∈ Q, sodass f (z) Nullstelle von qcẑ ist. Wäre q ∈ Q\T , so wäre |z| < µ ≤ ν ≤ σq , 3.26 3.21 d. h. z ∈ B (0, σq ) und |f (z)| = f (z) ≤ c < ν ≤ σq , 3.19 3.28 3.21 d. h. f (z) ∈ B (0, σq ) im Widerspruch zu 3.20. Also gilt q ∈ T . Damit gilt |z| < µ ≤ δq , 3.26 d. h. z ∈ B (0, δq ) und |f (z)| = f (z) ≤ c < εq , 3.19 3.28 d. h. f (z) ∈ B (0, εq ). Wegen 3.22 gibt es also θ ∈ Θq und ξ ∈ D (θ), sodass z = ξ wdgδq (θ) und θ (ξ) = f (z). Weil θ (ξ) = f (z) > 0, gilt θ 6= 0 und damit θ ∈ H. 3.19 1/wdg Es gilt |ξ| = |z| δq (θ) < µ /wdgδq (θ) ≤ ρθ und damit ξ ∈ B (0, ρθ ). 1 3.26 Es gilt |z| < µ ≤ 1 und deshalb |ξ| = |z| /wdgδq (θ) ≥ |z|. 1 3.26 |z|<1 Damit gilt f (z) = |f (z)| = |θ (ξ)| = |ξ|vθ |hθ (ξ)| > 3.19 c |ξ|vθ ≥ c |z|vθ 3.23 ≥ |z|<1 und 3.25 104 3.24 c |z|2N = c z −2 −N 1 |hθ (0)| |ξ|vθ ≥ 2 3.28 ≥ c 1 + z −2 −N . 3.3 Untere Abschätzung positiver Polynome Lemma 3.3.4. Sei g : R → R semialgebraisch mit der Eigenschaft ∀Ω > 0∃κ > 0∀r ∈ BR (0, Ω) : g (r) > κ. Dann gibt es C > 0 und N ∈ N, sodass ∀r ∈ R : g (r) > C 1 + r2 −N . Beweis. Wir beabsichtigen, Lemma 3.3.3 auf die Funktion f := R 3 z 7→ g 1 z 0 für z 6= 0 für z = 0 anzuwenden. Die Menge V0 := {(k, y, r) ∈ R3 ; kr − 1 = 0} ist ein Polynom-Urbild und damit semialgebraisch. Die Menge V1 := g × R ⊆ R3 ist nach Lemma 1.2.11 auf Seite 17 semialgebraisch. Die Menge V2 := {(k, y, r) ∈ R3 ; (r, y) ∈ g} = (R3 3 ξ 7→ (ξ2 , ξ1 , ξ0 )) [V1 ] ist nach dem selben Lemma semialgebraisch. Die Menge V3 := {(k, y, r) ∈ R3 ; kr = 1, y = g (r)} = V0 ∩ V3 ist als Schnitt zweier semialgebraischer Mengen nach Lemma 1.2.8 auf Seite 15 semialgebraisch. Die Menge V4 := n n 1 ,g r o (r) ; r ∈ R\ {0} = {(k, g (r)) ; r ∈ R\ {0} , k ∈ R, kr = 1} = o (k, y) ∈ R2 ; r ∈ R, kr = 1, y = g (r) = R3 3 ξ 7→ (ξi )i∈2 [V3 ] ist als Projektion einer semialgebraischen Menge nach Satz von Tarski-Seidenberg (Satz 2.4.5 auf Seite 64) semialgebraisch. Die Menge V5 := {(0, 0)} = {(k, y) ∈ R2 ; k 2 + y 2 = 0} ist ein Polynom-Urbild und damit semialgebraisch. Damit ist f = {(z, f (z)) ; z ∈ R} = V5 ∪ V4 als Vereinigung zweier semialgebraischer Mengen nach Lemma 1.2.6 auf Seite 14 semialgebraisch. Um Lemma 3.3.3 anwenden zu können, fehlt noch der Nachweis, dass ∀µ > 0∃κ > 0∀z ∈ R\BR (0, µ) : f (z) > κ. 105 3 Anwendung in der Theorie der partiellen Differentialgleichungen Sei also µ > 0. Mit Ω := µ1 gibt es nach Voraussetzung κ > 0, sodass für alle r ∈ BR (0, Ω) die Ungleichung g (r) > κ gilt. Für alle z ∈ R\BR (0, µ) gilt dann 1 z > µ1 = Ω, d. h. z1 ∈ BR (0, Ω) und damit f (z) = g z1 > κ. Lemma 3.3.3 ist also anwendbar und es gibt c > 0 und N ∈ N, sodass ∀z ∈ R\ {0} : f (z) > c 1 + z −2 −N n . o Nach Voraussetzung gilt g (0) > 0. Sei damit C := min c, g(0) . 2 −N Für r = 0 gilt also g (r) = g (0) > C = C (1 + r2 ) −2 !−N 1 1 >c 1+ g (r) = f r r und für r 6= 0 gilt ≥ C 1 + r2 −N wie behauptet. Lemma 3.3.5. Seien n ∈ N, A ∈ V (Rn ) semialgebraisch und abgeschlossen und p ∈ Rhni mit p̂ [A] ⊆ R>0 . Dann gibt es C > 0 und N ∈ N, sodass für alle x ∈ A die Ungleichung −N p̂ (x) > C 1 + |x|2 gilt. Beweis. Die Definition g := (R 3 r 7→ min ({p̂ (x) ; x ∈ A, |x| = |r|} ∪ {1})) ist korrekt, weil für alle r ∈ R die Menge {x ∈ A; |x| = |r|} kompakt ist und deshalb die stetige Funktion p̂, wenn die Menge nicht leer ist, auf ihr das Minimum annimmt. Das Ziel ist die Anwendung von Lemma 3.3.4 auf die Funktion g. Dass g die Eigenschaft ∀Ω > 0∃κ > 0∀r ∈ BR (0, Ω) : g (r) > κ besitzt, sieht man wie folgt: Sei Ω > 0. Dann ist B [0, Ω] ∩ A beschränkt und abgeschlossen und folglich kompakt. Da zudem p̂ [A] ⊆ R>0 , gibt es κ > 0 mit κ < 1, sodass für alle x ∈ B [0, Ω] ∩ A die Ungleichung p̂ (x) > κ gilt. Für alle r ∈ BR (0, Ω) gilt damit g (r) > κ. Um Lemma 3.3.4 anwenden zu können, muss also nur noch gezeigt werden, dass g semialgebraisch ist. 106 3.3 Untere Abschätzung positiver Polynome Die Menge V0 := {(x, y, v) ∈ R × R × Rn ; p̂ (v) = y} = {(x, y, v) ∈ R × R × Rn ; p̂ (v) − y = 0} ist semialgebraisch, weil sie ein Polynom-Urbild ist. Die Menge n o n o V1 := (x, y, v) ∈ R × R × Rn ; r2 = v 2 = (x, y, v) ∈ R × R × Rn ; r2 − v 2 = 0 ist aus dem selben Grund semialgebraisch. Die Menge V2 := A × R2 ⊆ Rn+2 ist nach Lemma 1.2.11 auf Seite 17 semialgebraisch. Die Menge V3 := R2 × A = (Rn × R2 3 (v, ξ) 7→ (ξ, v)) [V2 ] ist nach dem selben Lemma semialgebraisch. Die Menge V4 := {(r, y, v) ∈ R × R × Rn ; v ∈ A, r2 = v 2 , p̂ (v) = y} = V3 ∩ V1 ∩ V0 ist als Schnitt dreier semialgebraischer Mengen nach Lemma 1.2.8 auf Seite 15 semialgebraisch. Für alle i ∈ n + 1 sei Fi := (v, x) ∈ A, (r, y, v) ∈ R × R × Ri ; _ x∈Rn−i r 2 = v 2 + x2 . p̂ (v, x) = y Per Induktion sieht man, dass für alle i ∈ n + 1 die Menge Fi semialgebraisch ist: Induktionsanfang: Fn ist semialgebraisch, weil Fn = V4 . Induktionsschritt: Sei i ∈ n und Fi+1 semialgebraisch. Dann ist Fi = (v, w, x) ∈ A (r, y, v) ∈ R × R × Ri ; R3+i 3 ξ 7→ (ξj )j∈2+i (r, y, v, w) _ _ w∈R x∈Rn−i−1 r 2 = v 2 + w 2 + x2 = p̂ (v, w, x) = y 2 2 2 2 r = v + w + x p̂ (v, w, x) = y (v, w, x) ∈ A ∈ R×R×Ri ×R; _ x∈Rn−i−1 = R3+i 3 ξ 7→ (ξj )j∈2+i [Fi+1 ] 107 3 Anwendung in der Theorie der partiellen Differentialgleichungen als Projektion einer semialgebraischen Menge nach Satz von Tarski-Seidenberg (Satz 2.4.5 auf Seite 64) semialgebraisch. Die Menge V5 := {(r, y) ∈ R2 ; ∃x ∈ A : r2 = x2 , p̂ (x) = y} ist semialgebraisch, weil sie gleich F0 ist. Die Menge V6 := {(r, y) ∈ R2 ; y = 1} = {(r, y) ∈ R2 ; y − 1 = 0} ist ein PolynomUrbild und deshalb semialgebraisch. Die Menge V7 := {(r, y) ∈ R2 ; y = 1 oder ∃x ∈ A : r2 = x2 , p̂ (x) = y} = V6 ∪ V5 ist als Vereinigung zweier semialgebraischer Mengen nach Lemma 1.2.6 auf Seite 14 semialgebraisch. Die Menge V8 := {(r, k, y) ∈ R3 ; (r, k) ∈ V7 } = V7 × R ist nach Lemma 1.2.11 auf Seite 17 semialgebraisch. Die Menge V9 := {(r, y, k) ∈ R3 ; (r, k) ∈ V7 } = (R3 3 ξ 7→ (ξ0 , ξ2 , ξ1 )) [V8 ] ist nach dem selben Lemma semialgebraisch. Die Menge V10 := {(r, y, k) ∈ R3 ; k < y} = {(r, y, k) ∈ R3 ; k − y < 0} ist ein PolynomUrbild und deshalb semialgebraisch. Die Menge V11 := {(r, y, k) ∈ R3 ; k < y, (r, k) ∈ V7 } = V10 ∩ V9 ist als Schnitt zweier semialgebraischer Mengen semialgebraisch. Die Menge V12 := {(r, y) ∈ R2 ; ∃k ∈ R : k < y, (r, k) ∈ V7 } = R3 3 ξ 7→ (ξi )i∈2 [V11 ] ist als Projektion einer semialgebraischen Menge nach Satz von Tarski-Seidenberg semialgebraisch. Die Menge V13 := {(r, y) ∈ R2 ; @k ∈ R : k < y, (r, k) ∈ V7 } = R2 \V12 ist als Komplement einer semialgebraischen Menge nach Lemma 1.2.11 auf Seite 17 semialgebraisch. Die Menge V14 := {(r, y) ∈ V7 ; @k ∈ R : k < y, (r, k) ∈ V7 } = V7 ∩ V13 ist als Schnitt zweier semialgebraischer Mengen semialgebraisch. Wir zeigen jetzt, dass g = V14 : Die Inklusion g ⊆ V14 : Sei (r, y) ∈ g. Dann gilt y = g (r). Aufgrund der Definitionen von g und V7 gilt (r, y) ∈ V7 . Weil g (r) das Minimum der Menge {p̂ (x) ; x ∈ A, |x| = |r|} ∪ {1} ist, gibt es kein k < g (r) mit (r, k) ∈ V7 . Also gilt (r, y) ∈ V14 . Die Inklusion V14 ⊆ g: Sei (r, y) ∈ V14 . Dann gilt (r, y) ∈ V7 und es gibt kein k < y mit (r, k) ∈ V7 . Also ist y das Minimum der Menge {p̂ (x) ; x ∈ A, |x| = |r|} ∪ {1} und damit gleich g (r). Es gilt (r, y) = (r, g (r)) ∈ g. 108 3.4 Stetige Inversion linearer partieller Differentialoperatoren Folglich ist g semialgebraisch und Lemma 3.3.4 anwendbar. Es gibt C > 0 und N ∈ N, sodass −N . ∀r ∈ R : g (r) > C 1 + r2 Mit der Feststellung, dass damit für alle x ∈ A die Ungleichung p̂ (x) ≥ min ({p̂ (ξ) ; ξ ∈ A, |ξ| = |x|} ∪ {1}) = g (|x|) > C 1 + |x|2 −N gilt, endet der Beweis. Vom soeben bewiesenen Lemma wird im folgenden Abschnitt Gebrauch gemacht. 3.4 Stetige Inversion linearer partieller Differentialoperatoren In diesem Abschnitt wird kurz umrissen, welche Verwendung die im letzten Abschnitt bewiesene untere Abschätzung positiver Polynome in der Theorie der partiellen Differentialgleichungen findet. Der Abschnitt gibt nur einen groben Überblick – wer an den Details interessiert ist, sei auf [Pic] verwiesen, wo das hier Skizzierte in voller Ausführlichkeit behandelt wird. Gegeben seien n ∈ N, l ∈ N und ein Polynom55 a ∈ folgenden Differentialoperator darstellt: P ∂0 , ∂˜ := X C(l+1)×(l+1) h1 + ni, das aα ∂ α . α∈N1+n Dabei bezeichnet ∂0 die Ableitung in Richtung der nullten Variablen (Zeitableitung) und ∂˜ den Vektor der Ableitungen in Richtung der anderen Variablen (Raumablei tung) und es gilt ∂ = ∂0 , ∂˜ . Das Polynom a sei so beschaffen, dass es eine Zahl κ>0 55 Die Bezeichnung Rhni für die Menge der Polynome in n Variablen über einem Ring R wird in Definition 1.1.2 auf Seite 9 eingeführt. 109 3 Anwendung in der Theorie der partiellen Differentialgleichungen gibt, sodass die Funktion56 R × Rn × R 3 (τ, ξ, ν) 7→ det (â (iτ + ν, iξ)) ∈ C im Halbraum R × Rn × R≥κ keine Nullstelle besitzt. (3.29) Die hier geforderten Voraussetzungen gelten für den Rest des Abschnitts. Ziel ist es, die stetige Invertierbarkeit des Differentialoperators P ∂0 , ∂˜ in einem noch zu präzisierenden Sinne zu zeigen. Die Räume, die dabei eine Rolle spielen, werden jetzt eingeführt: Definition 3.4.1. Für alle ν ≥ κ und jeden Multiindex γ ∈ Z1+n sei mγν := R1+n 3 (τ, ξ) 7→ (iτ + ν)γ0 (ẽ + iξ)γ̃ , wobei57 ẽ := (1)k∈n und γ̃ derjenige Multiindex aus Z1+n sei, für den γ = (γ0 , γ̃) gilt. Die Funktionenmenge ˆ := ϕ ∈ L2,loc R1+n ; mγ ϕ ∈ L2 R1+n Hν,γ ν n o wird mit dem Skalarprodukt ˆ × H ˆ 3 (ϕ, ψ) 7→ hmγ ϕ|mγ ψi Hν,γ ν,γ ν ν L2 (R1+n ) zu einem Hilbertraum (siehe [Pic]). Mit F ist im Folgenden die stetige Fortsetzung F : L2 R1+n → L2 R1+n der auf L1 (R1+n ) ∩ L2 (R1+n ) eingeschränkten Fourier-Transformation F : L1 (R1+n ) → C (R1+n ) f 7→ 56 1+n R 3 (τ, ξ) 7→ 1 (2π) 1+n 2 ´ ! f (t, x) e −i(tτ +hx|ξi) dt dx R1+n Die Notation p̂ für die einem Polynom p zugeordnete Polynomfunktion wird in Definition 1.1.4 auf Seite 10 eingeführt. 57 Nach Bemerkung 1.1.1 auf Seite 9 ist k ∈ n eine kurze Schreibweise für k ∈ N, 0 ≤ k < n. 110 3.4 Stetige Inversion linearer partieller Differentialoperatoren zu einem unitären Operator gemeint. Definition 3.4.2. Für ν ≥ κ sei Hν,0 := L2 R1+n , exp (−2νt) dt dx . ˆ = L2 (R1+n )) Den durch (nach Definition ist Hν,0 ˆ Lν : Hν,0 → Hν,0 f 7→ F (R1+n 3 (t, x) 7→ e−νt f (t, x)) definierten Operator nennen wir die Fourier-Laplace-Transformation. Der Operator Lν ist unitär. Er lässt sich derart erweitern, dass für alle γ ∈ Z1+n durch Setzen von58 ˆ L Hν,γ := Hν,γ ν ˆ unitär wird (siehe dazu [Pic]). der Operator Lν : Hν,γ → Hν,γ Definition 3.4.3. Für ν > κ sei Hˆ ν,−∞ n o ˆ ; γ ∈ Z1+n := ∪ Hν,γ und Hν,−∞ := ∪ Hν,γ ; γ ∈ Z1+n . Dabei ist der Raum Hν,−∞ genau der erweiterte Definitionsbereich von Lν und Lν ˆ : ist in folgendem Sinne stetig von Hν,−∞ nach Hν,−∞ ^ _ ˆ . Lν stetig von Hν,α nach Hν,β α∈Z1+n β∈Z1+n Um dies zu sehen, reicht es β := α zu setzen. ˆ ˆ Ein linearer Operator L : Hν,−∞ → Hν,−∞ heißt stetig, wenn ^ _ ˆ nach H ˆ L stetig von Hν,α ν,β α∈Z1+n β∈Z1+n 58 Die Notation [M ] f für das Urbild einer Menge M unter einer Funktion f wird in Fußnote 3 auf Seite 9 eingeführt. 111 3 Anwendung in der Theorie der partiellen Differentialgleichungen und ein linearer Operator L : Hν,−∞ → Hν,−∞ heißt stetig, wenn ^ _ L stetig von Hν,α nach Hν,β . α∈Z1+n β∈Z1+n Beispiel 3.4.4. Ist f eine Polynomfunktion von R1+n nach C (d. h. es gibt p ∈ Ch1 + ni mit p̂|R1+n = f ), so bildet der von dieser Polynomfunktion erzeugte Multiplikationsoperator ˆ 3 ϕ 7→ f ϕ Hν,−∞ ˆ stetig nach Hν,−∞ ab. Beweis. Es reicht, die Aussage für ein Monom mit Koeffizient 1, d.h. für den Fall f = (R1+n 3 (τ, ξ) 7→ τ γ0 ξ γ̃ ) mit γ ∈ N1+n zu zeigen59 . Sei α ∈ Z1+n . Wir setzen β := α − γ. ˆ , alle τ ∈ R und alle ξ ∈ Rn gilt dann die Abschätzung Für alle ϕ ∈ Hν,α 2 mβν f ϕ (τ, ξ) = (iτ 2 τ +ν 2 β0 β0 + ν) (ẽ + iξ) f Y 1+ β̃ Y 2γ̃ ξ k |ϕ (τ, ξ)|2 k k∈n τ 2 + ν2 β0 +γ0 ≤ ν≥0,γ∈N1+n = β̃k ξk2 τ 2γ0 k∈n 2 (τ, ξ) ϕ (τ, ξ) Y 1 + ξk2 β̃k +γ̃k |ϕ (τ, ξ)|2 = k∈n (iτ 2 + ν)α0 (ẽ + iξ)α̃ ϕ (τ, ξ) = |(mαν ϕ) (τ, ξ)|2 . ˆ nach H ˆ . Damit ist der Multiplikationsoperator stetig von Hν,α ν,β Da die Fourier-Laplace-Transformation Differentiation in Multiplikation verwandelt, gilt Lν L−1 ν . .. ˜ . P ∂0 , ∂ = . . 59 Lν L−1 ν Dieses Argument macht davon Gebrauch, dass Linearkombinationen stetiger Operatoren stetig sind, was wir für den hier verwendeten Stetigkeitsbegriff nicht nachgewiesen haben. Die ausführlichen Beweise sind bei [Pic] zu finden. 112 3.4 Stetige Inversion linearer partieller Differentialoperatoren Hˆ ν,−∞ l+1 3 ϕ 7→ R 1+n ˆ 3 (τ, ξ) 7→ â (iτ + ν, iξ) ϕ (τ, ξ) ∈ Hν,−∞ l+1 ! =: (Ms,z )s,z∈l+1 . Die Frage nach der stetigen Invertierbarkeit von P ∂0 , ∂˜ ist daher äquivalent zur Frage nach der stetigen Invertierbarkeit der Matrix M . Nach Satz 2.1.7 auf Seite 27 lässt sich die Inverse von M als M −1 = (det M )−1 Adj (M ) schreiben, weil die Einträge der Matrix M miteinander kommutierende Multiplikationsoperatoren sind. Die Einträge der Matrix M sind Elemente des Rings der von Polynomfunktionen von R1+n nach C erzeugten Multiplikationsoperatoren. Die Einträge der AdjunktenMatrix Adj (M ) stammen daher nach Definition der Adjunkten-Matrix (Definition 2.1.5 auf Seite 27) aus dem selben Ring, sind also nach Beispiel 3.4.4 stetig. Wenn wir jetzt noch zeigen, dass (det M )−1 stetig ist, sind wir am Ziel60 . Dies ist die Stelle, an der der Satz von Tarski-Seidenberg in Form der unteren Abschätzung positiver Polynome ins Spiel kommt. Die Funktion R × Rn × R 3 (τ, ξ, ν) 7→ |det (â (iτ + ν, iξ))|2 ist eine Polynomfunktion von R1+n+1 nach R, es gibt also Q ∈ Rh1 + n + 1i, sodass für alle τ ∈ R, ξ ∈ Rn und ν ∈ R die Gleichung Q̂ (τ, ξ, ν) = |det (â (iτ + ν, iξ))|2 gilt. Auf der semialgebraischen und abgeschlossenen Menge R × Rn × R≥κ ist Q̂ nach Voraussetzung 3.29 positiv. Nach Lemma 3.3.5 auf Seite 106 gibt es also C > 0 und N ∈ N, sodass für alle τ ∈ R, ξ ∈ Rn und ν ∈ R≥κ die Abschätzung Q̂ (τ, ξ, ν) > C 1 + τ 2 + |ξ|2 + ν 2 −N gilt. 60 Wir machen hier davon Gebrauch, dass die Komposition stetiger Funktionen stetig ist, was wir für den hier verwendeten Stetigkeitsbegriff nicht nachgewiesen haben. Die vollständigen Beweise finden sich wie gesagt bei [Pic]. 113 3 Anwendung in der Theorie der partiellen Differentialgleichungen Für alle solche τ , ξ und ν gilt damit Q̂ (τ, ξ, ν) > C |{z} 1 +τ 2 + 2 2 ≤ τ κ+ν 2 C X r∈n ξr2 + ν2 −N ≥ |{z} ≤ τ 2 +ν 2 κ2 Q k∈n (1 + ξk2 ) ! −N Y 1 n 2 2 2 2 2 1 + ξk ≥ +1 τ +ν + 2 τ +ν κ2 κ k∈n {z | } ≤ (τ 2 + ν 2 ) Q k∈n (1 + ξk2 ) Y 1 n −N 2 2 −N 2 −N + 1 + τ + ν 1 + ξ . k κ2 {z κ2 k∈n | } =: c2 mit c > 0 (3.30) C Wir zeigen jetzt, dass der Multiplikationsoperator −1 (det M ) ˆ = Hν,−∞ 3 ϕ 7→ R1+n 3 (τ, ξ) 7→ det (â (iτ + ν, iξ))−1 ϕ (τ, ξ) ˆ stetig nach Hν,−∞ abbildet. Sei also α ∈ Z1+n . Wir setzen β := α − (N )k∈1+n . ˆ gilt dann Für alle ϕ ∈ Hν,α 2 −1 (det M ) (ϕ) 2 −1 β ˆ = mγ (det M ) (ϕ)L2 (R1+n ) = Hν,β (τ, ξ) 7→ mαν (τ, ξ) (iτ + ν)−N |·| = (τ 2 + ν 2 ) |·| < 1 c q {z L2 (R1+n ) } |·| = −N 2 | 2 (1 + iξk )−N (det M )−1 (ϕ) (τ, ξ) } k∈n | {z | Y {z (1 + ξk2 ) −N 2 } Q̂ (τ, ξ, ν) nach 3.30 q 2 1 −1 α (τ, (â (iτ (τ, (τ, (τ, Q̂ ξ, ν)det + ν, iξ)) ϕ ξ) 2 1+n = ξ) → 7 m ξ) ν 2 L (R ) | {z } c q |·| = Q̂ (τ, ξ, ν) 1 1 α 2 |m ϕ| |ϕ|2 ˆ , 2 (R1+n ) = ν L 2 2 Hν,α c c 114 ≤ 3.4 Stetige Inversion linearer partieller Differentialoperatoren ˆ nach H ˆ abbildet61 . was zeigt, dass (det M )−1 stetig von Hν,α ν,β l+1 ˆ ˆ Also ist der Multiplikationsoperator M : Hν,−∞ → Hν,−∞ bar, woraus wie angekündigt folgt, dass der Differentialoperator L−1 ν ... P ∂0 , ∂˜ = L−1 ν l+1 M stetig invertier- Lν ... Lν als Operator von (Hν,−∞ )l+1 nach (Hν,−∞ )l+1 ebenfalls stetig invertierbar ist. Für seine Inverse erhalten wir die Darstellung −1 P ∂0 , ∂˜ = L−1 ν .. . L−1 ν −1 (det M ) Adj (M ) Lν .. . Lν . Nachdem damit das wesentliche Ziel der vorliegenden Arbeit erreicht ist, gibt das folgende Kapitel einen kurzen Einblick in die Bedeutung des Satzes von TarskiSeidenberg für die Quantorenelimination. 61 Bei der weiteren Verwendung dieses Resultats bei [Pic] spielt es eine Rolle, dass die Konstante c in der Abschätzung unabhängig von ν gewählt werden kann. 115 3 Anwendung in der Theorie der partiellen Differentialgleichungen 116 4 Quantorenelimination mit dem Satz von Tarski-Seidenberg Dieses Kapitel umschreibt kurz, wie der Satz von Tarski-Seidenberg in der Form, in der er in dieser Arbeit bewiesen wurde, zur Quantorenelimination verwendet werden kann. Da dieses Kapitel nicht den Anspruch erhebt, korrekte Beweise zu liefern und sein Zweck darin besteht, die Idee aufzuzeigen, wird hier mit nachlässig definierten Begriffen und mit Beispielen gearbeitet. Definition. Mit dem Begriff allgemeiner Ausdruck ist im Folgenden ein in sinnvoller Weise aus Konstanten- und Variablensymbolen für reelle Zahlen, den Symbolen für die Operationen Addition, Multiplikation und Negation, den Symbolen für die Relationen <, > und =, den Symbolen für die Junktoren „und“, „oder“ und „nicht“ und den Symbolen für den All- und Existenzquantor zusammengesetzter Ausdruck gemeint. Definition. Unter einem semialgebraischen Ausdruck wird im Folgenden ein quantorenfreier allgemeiner Ausdruck verstanden. Definition. Unter einer ,sentence of elementary algebra’ wird ein allgemeiner Ausdruck verstanden, dessen sämtliche Variablen quantifiziert sind. In dieser Bedeutung hat Tarski (siehe Einleitung, Seite 5) den Begriff verwendet. Problem. Gegeben sei ein semialgebraischer Ausdruck und ein Variablensymbol x. Man betrachtet nun den allgemeinen Ausdruck ∃x : P und möchte einen semialgebraischen Ausdruck Q finden, in dem das Variablensymbol x nicht vorkommt, in dem keine nicht in P vorkommenden Variablensymbole auftauchen und der äquivalent zum Ausdruck ∃x : P ist. Da der gesuchte Ausdruck insbesondere quantorenfrei sein muss, spricht man von Quantorenelimination. Beispiel. Der Ausdruck P = nicht x2 − y + 3 > 5 und z = π 117 4 Quantorenelimination mit dem Satz von Tarski-Seidenberg ist ein semialgebraischer Ausdruck. Bei Betrachtung des allgemeinen Ausdrucks ∃x : P = ∃x : nicht x2 − y + 3 > 5 und z = π stellt man durch die Umformung ∃x : nicht x2 − y + 3 > 5 und z = π ∃x : nicht x2 > 2 + y nicht∀x : x2 > 2 + y ⇔ oder z 6= π ⇔ oder z 6= π ⇔ (nicht (2 + y < 0) oder z 6= π) ⇔ (y ≥ −2 oder z 6= π) fest, dass Q := (y ≥ −2 oder z 6= π) ein semialgebraischer Ausdruck mit den gewünschten Eigenschaften ist. Die Frage lautet nun, ob es immer einen solchen Ausdruck gibt und, wenn ja, ob es ein Verfahren gibt, mit dem man ihn konstruieren kann. Man kann eine Analogie zwischen semialgebraischen Ausdrücken und semialgebraischen Mengen herstellen, was am Beispiel deutlich wird: Der semialgebraische Ausdruck P beschreibt die Menge n (x, y, z) ∈ R3 ; nicht x2 − y + 3 > 5 und z = π R3 \ n o o n = (x, y, z) ∈ R3 ; x2 − y − 2 > 0 ∩ (x, y, z) ∈ R3 ; z = π o , die aus folgendem Grund semialgebraisch ist: Die Mengen 3 2 3 {(x, y, z) ∈ R ; x − y − 2 > 0} und {(x, y, z) ∈ R ; z = π} sind Polynom-Urbilder1 und deshalb semialgebraisch. Nach Lemma 1.2.8 auf Seite 15 ist der Schnitt zweier semialgebraischer Mengen semialgebraisch und nach Lemma 1.2.11 auf Seite 17 das Komplement einer semialgebraischen Menge semialgebraisch. Man kann sich überlegen, dass die durch semialgebraische Ausdrücke auf diese Weise beschreibbaren Mengen genau die semialgebraischen Mengen sind2 . 1 2 Der Begriff Polynom-Urbild wird in Definition 1.2.3 auf Seite 14 definiert. Wie angekündigt, wird in diesem Kapitel auf Beweise verzichtet. 118 Wie bereits in der Einleitung erwähnt, kann aus dem Beweis des Satzes von TarskiSeidenberg ein Verfahren abgeleitet werden, mit dem bei gegebener semialgebraischer Beschreibung einer Menge eine semialgebraische Beschreibung ihrer Projektion bestimmt werden kann. Damit lässt sich folgendes Verfahren zur Quantorenelimination angeben: Algorithmus. Gegeben seien ein semialgebraischer Ausdruck P und ein Variablensymbol x. Zuerst bestimmt man die Zahl n ∈ N der Variablensymbole, die in P vorkommen und von x verschieden sind. Die Namen dieser Variablen seien y0 , y1 , ..., yn−1 . Die durch den semialgebraischen Ausdruck P beschriebene Menge V := {(y, x) ∈ Rn × R; Die Variablenbelegung (y, x) erfüllt P } ist semialgebraisch. Es lässt sich eine semialgebraische Beschreibung3 dieser Menge finden. Diese kann, falls der Junktor „nicht“ in P vorkommt, komplizierter als P sein4 . Die Projektion Rn+1 3 ξ 7→ (ξi )i∈n [V ] = {y ∈ Rn ; ∃x ∈ R : (y, x) ∈ V } = {y ∈ Rn ; Die Variablenbelegung y erfüllt ∃x : P } =: W ist nach Satz von Tarski-Seidenberg (Satz 2.4.5 auf Seite 64) semialgebraisch. Das aus dem Beweis des Satzes ableitbare Verfahren lässt sich zur Bestimmung einer semialgebraischen Beschreibung der Menge W verwenden. Das Problem ist nur, dass die Bestimmung dieser Beschreibung sehr viel Zeit und dass die Beschreibung selbst sehr viel Speicherplatz in Anspruch nehmen kann – selbst wenn die semialgebraische Beschreibung der zu projizierenden Menge V überschaubar ist. 3 Damit ist eine Datenstruktur gemeint, die eine endliche Menge von Achsenabschnitten und Polynomen zu Polynom-Urbildern zusammenfasst, diese zu Urbildschnitten gruppiert und diese wiederum zu einer semialgebraischen Menge zusammenfasst. 4 Da Komplemente in der in dieser Arbeit gewählten Definition der semialgebraischen Mengen nicht auftauchen, stehen diese zur Übersetzung des Junktors „nicht“ nicht zur Verfügung. Die Vorkommen dieses Junktors müssen zuerst mit Lemma 1.2.11 auf Seite 17 eliminiert werden. 119 4 Quantorenelimination mit dem Satz von Tarski-Seidenberg Aus der semialgebraischen Beschreibung der Projektion W lässt sich direkt5 ein semialgebraischer Ausdruck Q ableiten, in dem außer y0 , y1 , ..., yn−1 keine Variablensymbole vorkommen und der die Projektion W beschreibt, d. h. für den W = {y ∈ Rn ; Die Variablenbelegung y erfüllt Q} gilt. Weil damit {y ∈ Rn ; Die Variablenbelegung y erfüllt ∃x : P } = {y ∈ Rn ; Die Variablenbelegung y erfüllt Q} gilt, ist Q zum Ausdruck ∃x : P äquivalent, also ein Ausdruck wie gesucht. Das soeben beschriebene Verfahren zur Existenzquantorenelemination kann auch zur Elimination von Allquantoren verwendet werden, da jeder Ausdruck ∀x : P äquivalent zum Ausdruck nicht (∃x : nicht (P )) ist. Wie in der Einleitung angekündigt, wird jetzt der Zusammenhang zwischen dem Satz von Tarski-Seidenberg in der Form, in der er in der vorliegenden Arbeit vorkommt, und dem von Tarski angegebenen Entscheidungsverfahren für ,sentences of elementary algebra’ hergestellt (siehe Einleitung, Seite 6). Das soeben beschriebene Verfahren zur Quantorenelimination, das wesentlich vom Satz von Tarski-Seidenberg in der Form, in der er in der vorliegenden Arbeit vorkommt, Gebrauch macht, kann auf folgende Weise zur Entscheidung über die Wahrheit einer ,sentence of elementary algebra’ verwendet werden: 5 Wegen des Junktors „nicht“ ist der Übergang von einem semialgebraischen Ausdruck zur semialgebraischen Beschreibung der durch ihn beschriebenen Menge nicht direkt (siehe Fußnote 4 auf der vorherigen Seite). Der Übergang von der semialgebraischen Beschreibung einer Menge zu einem semialgebraischen Ausdruck, der diese Menge beschreibt, bereitet dahingegen keine Schwierigkeiten, da in der semialgebraischen Beschreibung keine Komplemente vorkommen und solche, selbst wenn sie vorkämen, aufgrund der Verfügbarkeit des Junktors „nicht“ kein Hindernis wären. 120 Algorithmus. Es handelt sich um ein rekursives Verfahren, mit dem zu jedem allgemeinen Ausdruck P ein zu diesem äquivalenter semialgebraischer Ausdruck gefunden werden kann, der außer den in P unquantifizierten Variablensymbolen keine Variablensymbole enthält: 1. Ist ein allgemeiner Ausdruck von der Form nicht P , so bestimmt man einen zu P äquivalenten semialgebraischen Ausdruck und negiert diesen. 2. Ist ein allgemeiner Ausdruck von einer der beiden Formen P und Q, P oder Q, so bestimmt man zu P und Q äquivalente semialgebraische Ausdrücke und verknüpft diese. 3. Ist ein allgemeiner Ausdruck von einer der beiden Formen ∀x : P , ∃x : P , so bestimmt man zuerst einen zu P äquivalenten semialgebraischen Ausdruck und konstruiert anschließend mit dem oben angegebenen Verfahren zur Quantorenelimination einen zu ∀x : P bzw. ∃x : P äquivalenten semialgebraischen Ausdruck. 4. Ist ein allgemeiner Ausdruck von keiner der aufgezählten Formen, so ist er quantorenfrei und damit bereits ein semialgebraischer Ausdruck. Wendet man dieses rekursive Verfahren auf eine ,sentence of elementary algebra’ P an, so erhält man einen zu ihr äquivalenten semialgebraischen Ausdruck Q, der außer den in P unquantifizierten Variablensymbolen keine Variablensymbole enthält. Da aber P als ,sentence of elementary algebra’ keine unquantifizierten Variablensymbole enthält, ist Q variablenfrei und die Bestimmung des Wahrheitswerts von P durch einfaches Auswerten von Q möglich. So kann also für jede ,sentence of elementary algebra’ entschieden werden, ob sie wahr oder falsch ist. 121 Symbolverzeichnis 122 Symbolverzeichnis N Menge der nichtnegativen ganzen Zahlen R (r) Nachbereich der Relation r D (r) Vorbereich der Relation r r [M ] Nachbereich der Menge M unter der Relation r [M ] r Vorbereich der Menge M unter der Relation r Rhni Menge der Polynome in n Variablen über dem Ring R spt (p) Träger des Polynoms p, d.h. Menge der Indizes seiner nichtverschwindenden Koeffizienten ph1i Als Polynom in einer Variablen aufgefasstes Polynom p, siehe Definition 1.1.7 auf Seite 12 degk p Grad des Polynoms p bezüglich seiner k-ten Variablen deg p Grad des einvariabligen Polynoms p noc p Koeffizientenzahl des einvariabligen Polynoms p ∂p Ableitung des einvariabligen Polynoms p p̂R oder p̂ Dem Polynom p über dem Ring R zugeordnete Polynomfunktion \ [Rhni] Menge der Polynomfunktionen auf Rn px̂ Polynom, das aus dem Polynom p durch Einsetzen von x in dessen Koeffizientenpolynome entsteht, siehe Definition 1.1.8 auf Seite 12 123 Symbolverzeichnis vx̂ Polynomvektor, der aus dem Polynomvektor p durch komponentenweises Einsetzen von x in die Koeffizientenpolynome entsteht, siehe Definition 2.2.9 auf Seite 36 v Komponentenzahl des Vektors v A Zeilenzahl der Matrix A |A| Spaltenzahl der Matrix A v|Z Vektor, der aus dem Vektor v hervorgeht, wenn von seinen Komponenten nur diejenigen mit Indizes in Z beibehalten werden, siehe Definition 2.1.3 auf Seite 26 A|Z,S Matrix, die aus der Matrix A hervorgeht, wenn von ihren Zeilen nur diejenigen mit Indizes in Z und von ihren Spalten nur diejenigen mit Indizes in S beibehalten werden, siehe Definition 2.1.4 auf Seite 27 Adj (A) Adjunkten-Matrix der Matrix A RK h1i Menge der Polynome in einer Variablen über dem Ring R mit Grad kleiner als K, siehe Definition 2.1.8 auf Seite 28 Rµ h1i Menge der Polynomvektoren über dem Ring R, deren Grad durch den Multiindex µ beschränkt ist, siehe Definition 2.2.7 auf Seite 35 M b Q In Definition 2.1.10 auf Seite 29 definierte Matrix modM,Q (a, b) In Definition 2.1.14 auf Seite 31 definierter Divisionsrest quoM,Q (a, b) In Definition 2.1.14 auf Seite 31 definierter Quotient a|b a ist ein Teiler von b a-b a ist kein Teiler von b diff kµ In Definition 2.2.8 auf Seite 35 definierte Funktion restkµ In Definition 2.2.8 auf Seite 35 definierte Funktion redkµ In Definition 2.2.8 auf Seite 35 definierte Funktion frq v Häufigkeit des Polynomvektors v 124 Symbolverzeichnis IN (v) Menge der isolierten Nullstellen des reellen Polynomvektors v in (v) Nullstellennummerierung des reellen Polynomvektors v I (v) Intervallnummerierung des reellen Polynomvektors v sgn (x) Signum der Zahl x SGN (v) Vorzeichenmatrix des reellen Polynomvektors v kAk Anzahl der Nullstellen der Matrix A Pµk In Definition 2.2.17 auf Seite 39 definierte Menge reeller Polynomvektoren B a b A Resultantenmatrix der Polynome a und b mit unterstellten Graden A und B ResA,B (a, b) Resultante der Polynome a und b mit unterstellten Graden A und B DisF (f ) Diskriminante des Polynoms f mit unterstelltem Grad F B (z, ε) Offene Kreisscheibe um z ∈ C mit Radius ε > 0 B [z, ε] Abgeschlossene Kreisscheibe um z ∈ C mit Radius ε > 0 1M Indikatorfunktion der Menge M #E Zahl der Elemente der endlichen Menge E ∈ (E) Element der einelementigen Menge E [N, R] In Definition 2.2.2 auf Seite 33 definierte Folge tr (a) In Abschnitt 3.3 auf Seite 98 definiertes Polynom ek Einheitsvektor wdgδ (θ) δ-Windungszahl der δ-Auffaltung θ Λ Menge der Achsenabschnitte U (Rn ) Menge der Polynomurbilder S (Rn ) Menge der Urbildschnitte V (Rn ) Menge der semialgebraischen Mengen 125 Symbolverzeichnis 126 Index 0 × 0-Matrix, 27 Hilbertraum, 110 Ableitung eines Polynoms, 34 Indikatorfunktion, 25, 32, 98 Achsenabschnitt, 13 Integritätsring, 20 Adjunkten-Matrix, 27 Intervallnummerierung, 38 allgemeiner Ausdruck, 117 irreduzibel, 21 Anzahl der Nullstellen einer Matrix, 38 John von Neumann, 9 beschränkter Grad, 28, 35 Bild, 9 Kürzungsregel, 20 Koeffizientenzahl, 11 Charakteristik Null, 73 δ-Auffaltung, 84, 103 δ-Windungszahl, 84 Differentialoperator, 109 Diskriminante, 73 kommutativer Ring mit Eins, 9 Komponenten streichen, 26 Komponentenzahl eines Vektors, 26 Komposition, 45, 90 linkseindeutig, 40 Divisionsrest, 31 Matrix, 26 Einheit, 20 Menge der isolierten Nullstellen, 37 Einheitsvektor, 35 Menge der natürlichen Zahlen, 9 Einsetzen, 12, 37 Menge der Polynome, 10 faktorieller Ring, 21 Fourier-Laplace-Transformation, 111 Menge der Polynomfunktionen, 10 Multiindex, 35 Fourier-Transformation, 110 Nachbereich, 9 Funktion, 9 Nullstellennummerierung, 38 Grad, 11 Häufigkeit, 33, 52, 53 Nullstellenverfolgung, 78 Nullteiler, 20, 70 nullteilerfrei, 20 127 Index Polynom, 9 Polynom-Urbild, 14 Polynomdivision, 25, 29, 31 Polynomfunktion, 10 Polynomring, 10 Polynomvektor, 33 Polynomvektor, reeller, 33 Primelement, 21 Produktregel, 73 Projektion, 64 Puiseux-Reihe, 96 quadratische Matrix, 27 Quantorenelimination, 117 Quotient, 31 Quotientenkörper, 25 rechtseindeutig, 9 Reduktion, 36, 53 Reduktionslemma, 40 Resultante, 69 Resultantenmatrix, 67 Satz von Gauß, 22 Satz von Tarski-Seidenberg, 5, 64, 105, 108, 113, 119 semialgebraische Beschreibung, 119 semialgebraische Funktion, 100 semialgebraische Menge, 14 semialgebraischer Ausdruck, 117 sentences of elementary algebra, 5, 117 Signum, 13 Spaltenzahl einer Matrix, 26 Teiler, 20 Träger, 9 Urbild, 9 128 Urbildschnitt, 14 Vektor, 26 Verkettung, 45, 90 Vorbereich, 9 vorgängerlos, 18 Vorzeichenmatrix, 38, 39 Vorzeichenverhalten, 38 wohlfundierte Induktion, 19, 55, 58 wohlfundierte Relation, 18, 55, 58 Zeilen und Spalten streichen, 27 Zeilenzahl einer Matrix, 26 zugeordnete Polynomfunktion, 10 Zwischen-Nullstelle, 44 Literaturverzeichnis [Atk] Atkinson, F.: Multiparameter Eigenvalue Problems Volume I, New York/London 1972, Academic Press. [Boc0] Bochnak, Jacek; Coste, Michel; Roy, Marie-Françoise: Géométrie algébrique réelle, Berlin/Heidelberg 1987, Springer-Verlag. [Boc1] Bochnak, Jacek; Coste, Michel; Roy, Marie-Françoise: Real Algebraic Geometry, Berlin/Heidelberg 1998, Springer-Verlag. [Bül] Von Bülow, Christopher: Beweisbarkeitslogik, Berlin 2006, Logos Verlag. [Coh] Cohen, Paul: A simple proof of Tarski’s theorem on elementary algebra, Mimeographed manuscript, Stanford University 1967, 6 pp. [Fre] Freitag, Eberhard; Busam, Rolf: Funktionentheorie, Berlin/Heidelberg 1993, Springer-Verlag. [Göd] Gödel, Kurt: Über formal unentscheidbare Sätze der Principia Mathematica und verwandter Systeme I. Monatshefte für Mathematik, Volume 38, Number 1, Wien 1931, Springer-Verlag, S. 173-198. [Hör] Hörmander, Lars: The Analysis of Linear Partial Differential Operators II, Berlin/Heidelberg 1983, Springer-Verlag. [Hor] Hornfeck, Bernhard: Algebra, Berlin/New York 1976, De Gruyter Lehrbuch. [Koz] Kozen, Dexter: Theory of computation, 2006, Springer-Verlag. [Mes] Meschkowski, Herbert: Problemgeschichte der Mathematik III, Zürich 1986, B.I.-Wissenschaftsverlag. [Oel] Oeljeklaus, Eberhard; Remmert, Reinhold: Berlin/Heidelberg 1974, Springer-Verlag. Lineare Algebra I, [Pic] Picard, Rainer; McGhee, Des: Partial Differential Equations: A unified Hilbert Space Approach, Manuskript, Dresden 2009. http://www.math.tu-dresden.de/~picard/picard/lectures/PDE_I_2009 129 Literaturverzeichnis [Pre] Prestel, Alexander; Delzell, Charles: Positive Polynomials, Berlin/Heidelberg 2001, Springer-Verlag. [Rüh] Rühs, F.: Funktionentheorie, Berlin 1971, Deutscher Verlag der Wissenschaften. [Rei] Reiffen, Hans-Jörg; Scheja, Günter; Vetter, Udo: Algebra, Mannheim 1984, B.I.Wissenschaftsverlag. [Sei] Seidenberg, Abraham: A new decision method for elementary algebra. Annals of Mathematics, Vol. 60, 1954, S. 365-374. [Tar] Tarski, Alfred: A decision method for elementary algebra and geometry. In: Givant, Steven; McKenzie, Ralph (Hrsg.): Alfred Tarski: Collected Papers Volume 3, Basel 1986, Birkhäuser Verlag, S. 299-367. Ersterscheinung: Tarski, Alfred: A decision method for elementary algebra and geometry, Berkeley/Los Angeles 1951, University of California Press, 63 pp. [Voi] Voigt, Jürgen: Perturbation Theory of Eigenvalues, Manuskript, Dresden 2009. http://www.math.tu-dresden.de/~voigt/lehre/vorlesungen/opth 130 Erklärung Hiermit erkläre ich, dass ich die am heutigen Tag eingereichte Diplomarbeit zum Thema „Der Satz von Tarski-Seidenberg und seine Anwendung in der Theorie der partiellen Differentialgleichungen“ unter Betreuung von Prof. Dr. rer. nat. Rainer Picard selbstständig erarbeitet, verfasst und Zitate kenntlich gemacht habe. Andere als die angegebenen Hilfsmittel wurden von mir nicht benutzt. Datum Unterschrift 131