4 Quantorenelimination mit dem Satz von Tarski

Werbung
Technische Universität Dresden
Fachrichtung Mathematik
Institut für Analysis
Der Satz von Tarski-Seidenberg und
seine Anwendung in der Theorie der
partiellen Differentialgleichungen
Diplomarbeit
zur Erlangung des ersten akademischen Grades
Diplommathematiker
vorgelegt von
Name:
Zanger
geboren am:
27.04.1980
Vorname: Florian
in: Pforzheim
Tag der Einreichung: 21.09.2009
Betreuer: Prof. Dr. rer. nat. Rainer Picard
1
2
Inhaltsverzeichnis
0 Einleitung
1 Grundlagen
1.1 Polynome . . . . . . . . . . . . . .
1.2 Semialgebraische Mengen . . . . . .
1.3 Wohlfundierte Induktion . . . . . .
1.4 Integritätsringe und Satz von Gauß
2 Der
2.1
2.2
2.3
2.4
5
.
.
.
.
.
.
.
.
.
.
.
.
Satz von Tarski-Seidenberg
Polynomdivision über Ringen . . . . . .
Das Reduktionslemma . . . . . . . . . .
Häufigkeiten . . . . . . . . . . . . . . . .
Beweis des Satzes von Tarski-Seidenberg
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
3 Anwendung in der Theorie der partiellen Differentialgleichungen
3.1 Resultante und Diskriminante . . . . . . . . . . . . . . . . . .
3.2 Koeffizientenabhängigkeit der Nullstellen komplexer Polynome
3.3 Untere Abschätzung positiver Polynome . . . . . . . . . . . .
3.4 Stetige Inversion linearer partieller Differentialoperatoren . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
9
9
13
18
20
.
.
.
.
25
25
33
52
56
.
.
.
.
67
67
75
97
109
4 Quantorenelimination mit dem Satz von Tarski-Seidenberg
117
Symbolverzeichnis
122
Index
126
Literaturverzeichnis
129
3
Inhaltsverzeichnis
4
0 Einleitung
Im Jahr 1951 veröffentlichte Alfred Tarski einen Artikel mit dem Titel “A decision
method for elementary algebra and geometry” [Tar]. Die darin bewiesene Aussage
ist heute unter dem Namen Satz von Tarski-Seidenberg bekannt. Den Beweis hatte
Tarski bereits 1930 gefunden (siehe [Tar, S. 301]1 ). Drei Jahre später, im Jahr 1954,
veröffentlichte Abraham Seidenberg unter dem Titel “A new decision method for
elementary algebra” [Sei] einen anderen Beweis des selben Satzes.
Beide Beweise geben – die Titel der beiden Veröffentlichungen weisen darauf hin –
Verfahren an, mit denen entschieden werden kann, ob gewisse Aussagen, die Tarski ,sentences of elementary algebra’ (siehe [Tar, S. 306]) nennt, wahr sind. Unter
,sentences of elementary algebra’ werden dabei diejenigen Aussagen verstanden, die
in sinnvoller Weise aus Konstanten- und Variablensymbolen für reelle Zahlen, den
Symbolen für die Operationen Addition, Multiplikation und Negation, den Symbolen für die Relationen <, > und =, den Symbolen für die Junktoren „und“, „oder“
und „nicht“ und den Symbolen für den All- und Existenzquantor zusammengesetzt
sind und deren sämtliche Variablen quantifiziert sind.
Tarski erwähnt in der Einleitung des oben erwähnten Artikels [Tar, S. 306], dass aus
Kurt Gödels fundamentalen Ergebnissen aus dem Jahr 1930 [Göd] folgt, dass für
eine sehr ähnliche Klasse von Aussagen – nämlich diejenige, die man erhält, wenn
man in obiger Definition des Begriffs ,sentence of elementary algebra’ anstelle der
Konstanten- und Variablensymbole für reelle Zahlen solche für natürliche Zahlen verwendet – kein solches Verfahren existiert. Dies sei jedoch nur der Unvollständigkeit2
halber erwähnt.
1
Diese und folgende Seitenangaben beziehen sich auf Tarski, Alfred: A decision method for elementary algebra and geometry. In: Givant, Steven; McKenzie, Ralph (Hrsg.): Alfred Tarski:
Collected Papers Volume 3, Basel 1986, Birkhäuser Verlag, S. 299-367. Der Artikel erschien erstmals in: Tarski, Alfred: A decision method for elementary algebra and geometry, Berkley/Los
Angeles 1951, University of California Press, 63 pp.
2
Zugegebenermaßen geht dieser Witz auf [Bül, S. 294] zurück.
5
0 Einleitung
In der vorliegenden Arbeit wird der Satz von Tarski-Seidenberg nicht in der soeben
beschriebenen ursprünglichen Form, sondern in der Form, in der er im Gebiet der
reellen algebraischen Geometrie (wie zum Beispiel bei [Boc0, S. 23], [Boc1, S. 26]
oder [Pre, S. 33]) eine Rolle spielt, auftauchen: Die Projektion einer jeden semialgebraischen Menge ist semialgebraisch. Unter semialgebraischen Mengen werden
dabei diejenigen Teilmengen des Rn verstanden, die durch quantoren- und negationsfreie ,sentences of elementary algebra’ unter Verzicht auf die Forderung der Quantifiziertheit sämtlicher Variablen beschrieben werden (eine strengere Definition des
Begriffs der semialgebraischen Menge steht auf Seite 14). Die Brücke zwischen dieser
Formulierung und der ursprünglichen Form des Satzes von Tarski-Seidenberg wird in
Kapitel 4 geschlagen.
In Kapitel 2 wird der Satz von Tarski-Seidenberg bewiesen. Der dort geführte Beweis
ist der, den man in Kurzform im Anhang von [Hör, S. 364-367] und bei [Boc0, S. 15-24]
oder dessen englischer Übersetzung [Boc1, S. 17-27] finden kann. Er geht Lars Hörmander zufolge (siehe [Hör, S. 371]) auf Paul Cohen zurück, der diesen abgesehen vom schwer zugänglichen3 mimeographierten Manuskript [Coh] nie veröffentlicht
haben soll und besteht wie die beiden bereits erwähnten Beweise in der Angabe eines
Verfahrens – diesmal zur Bestimmung der semialgebraischen Beschreibung der Projektion einer durch deren Beschreibung gegebenen semialgebraischen Menge. Tarski
thematisiert in seiner Arbeit [Tar, S. 308] die Möglichkeit der Konstruktion einer
Maschine, die das von ihm angegebene Verfahren beherrscht und damit prinzipiell
in der Lage wäre, jegliche in Form einer ,sentence of elementary algebra’ gestellte
Frage zu beantworten. Ebenso ist es möglich, eine Maschine zu konstruieren, d. h.
ein Programm zu schreiben, das bei gegebener semialgebraischer Beschreibung einer
Menge eine semialgebraische Beschreibung ihrer Projektion berechnet. Das Interesse
einer solchen Implementierung könnte jedoch nicht von praktischer Natur sein, da ein
solches Programm, wie man beim Lesen des Beweises feststellt, die Projektion selbst
relativ einfach beschriebener Mengen nicht in überschaubarer Zeit zu berechnen im
Stande wäre. Dieser Umstand kann nicht als Schwäche von Cohens Beweis ausgelegt
werden, da Fischer und Rabin gezeigt haben (der Beweis ist bei [Koz, S. 146-150] zu
finden), dass das durch den Satz von Tarski-Seidenberg gelöste Entscheidungsproblem
schwer für die Komplexitätsklasse NEXPTIME der nichtdeterministisch in Exponentialzeit entscheidbaren Sprachen ist. In der vorliegenden Arbeit wird der Beweis des
3
6
Laut Aussage der Sächsischen Landes- und Universitätsbibliothek ist dieses Manuskript nur direkt
in der Stanford University einsehbar.
Satzes von Tarski-Seidenberg sehr viel ausführlicher geführt als in den oben angegebenen Büchern, wo er nur vier bis fünf Seiten einnimmt. Ein weiterer Unterschied zu
den erwähnten Veröffentlichungen besteht in der Verwendung einer abgewandelten
Form der Polynomdivision (siehe Abschnitt 2.1), die die Induktion in Abschnitt 2.4
vereinfacht.
Kapitel 3 beschäftigt sich dann mit der Anwendung des Satzes von Tarski-Seidenberg
in der Theorie der partiellen Differentialgleichungen. Sehr wahrscheinlich ist Hörmander der Erste, der ihn dort benutzt hat (siehe [Hör, S. 371]). Mit dem Satz von
Tarski-Seidenberg kann unter zusätzlicher Verwendung von Aussagen über die Koeffizientenabhängigkeit der Nullstellen komplexer Polynome folgende Behauptung, die
auf den ersten Blick trivial erscheint, weil sie es für den Fall n = 1 auch tatsächlich
ist, gezeigt werden: Jede auf Rn positive Polynomfunktion kann von unten durch eine
Funktion
−N
Rn 3 x 7→ C 1 + |x|2
mit C > 0 und N ∈ N abgeschätzt werden. Der Beweis dieser Aussage in der vorliegenden Arbeit ist ein anderer als der bei [Hör, S. 368] und [Pic] geführte. Er kommt
ohne die Zerlegung des Definitionsbereichs semialgebraischer Funktionen in Teilintervalle aus. In Anschluss daran wird kurz skizziert, wie die untere Abschätzung
positiver Polynome bei [Pic] zur stetigen Inversion linearer partieller Differentialoperatoren angewendet wird.
Nachdem damit das Ziel der Arbeit erreicht ist, gibt Kapitel 4 einen kurzen Einblick
in die Rolle des Satzes von Tarski-Seidenberg bei der Quantorenelimination.
Danksagung. Ich danke meinen Eltern für ihr Vertrauen und die bedingungslose Unterstützung, mit der sie mein Studium und diese Arbeit ermöglicht haben.
7
0 Einleitung
8
1 Grundlagen
1.1 Polynome
Bemerkung 1.1.1. Da es zur Bezeichnung der Menge der nichtnegativen ganzen Zahlen
verschiedene Konventionen gibt, trägt es zur Vermeidung von Missverständnissen bei,
wenn hier erwähnt wird, dass in dieser Arbeit das Symbol N für diese Menge verwendet und ihre Elemente als natürliche Zahlen bezeichnet werden. Insbesondere sind
also hier die Aussagen 0 ∈ N und „0 ist eine natürliche Zahl“ wahr.
In erster Linie zur Vereinfachung der Notation betrachten wir die natürlichen Zahlen
als auf die von John von Neumann1 vorgeschlagene Weise konstruiert. Das heißt, die
Zahl 0 und die leere Menge ∅ sind ein und dasselbe Objekt und der Nachfolger n + 1
einer jeden natürlichen Zahl n ist die Menge n ∪ {n}. Daraus ergibt sich, dass für
jede natürliche Zahl n ∈ N die Identität n = {k ∈ N; k < n} gilt.
Definition 1.1.2. Sei R ein kommutativer Ring mit Eins2 und n ∈ N. Dann nennen
n
wir eine Funktion p ∈ R(N ) Polynom in n Variablen über R, wenn der Träger von p,
d. h. die Menge3 spt (p) := [R\ {0}] p endlich ist.
1
Siehe [Mes, S. 274].
Unter einem kommutativen Ring mit Eins wird in dieser Arbeit ein mindestens zweielementiger
kommutativer Ring mit Eins verstanden oder anders gesagt, es soll 1 6= 0 gelten oder noch
anders gesagt, der Ring soll vom Ring {0} verschieden sein.
3
Ist r eine Relation, so verstehen wir unter dem Nachbereich von r die
Menge R (r) := {y; ∃a : (a, y) ∈ r} und unter dem Vorbereich von r die Menge
D (r) := {x; ∃a : (x, a) ∈ r}.
Ist M eine Menge, so verwenden wir die Schreibweisen r [M ] := {y; ∃m ∈ M : (m, y) ∈ r} für
den Nachbereich von M unter r und [M ] r := {x; ∃m ∈ M : (x, m) ∈ r} für den Vorbereich von
M unter r.
Eine
Relation
r
heißt
rechtseindeutig,
wenn
sie
die
Aussage
∀x, a, b : ((x, a) ∈ r ∧ (x, b) ∈ r ⇒ a = b) erfüllt. Eine rechtseindeutige Relation ist also
nichts anderes als eine Funktion.
Ist r rechtseindeutig, so ergibt sich, dass r [M ] = {r (m) ; m ∈ M ∩ D (r)} das Bild von M
unter r und [M ] r = {x ∈ D (r) ; r (x) ∈ M } das Urbild von M unter r ist. In Definition 1.1.2 ist
demzufolge [R\ {0}] p eine kurze Schreibweise für {α ∈ Nn ; pα 6= 0}. Der Träger eines Polynoms
ist also die Menge der Indizes seiner nichtverschwindenden Koeffizienten.
2
9
1 Grundlagen
Für die Menge der Polynome in n Variablen über R schreiben wir4
Rhni := {p; p Polynom in n Variablen über R} .
Die Summe und das Produkt zweier Polynome p und q in n Variablen über R sind
definiert als die Polynome


p + q := (pα + qα )α∈Nn und p q := 
X
.
pα qβ 
α+β=γ
γ∈Nn
Weil mit diesen beiden Operationen die Menge der Polynome in n Variablen über R
ein kommutativer Ring mit Eins ist, nennt man Rhni einen Polynomring.
Bemerkung 1.1.3. Ist R ein kommutativer Ring mit Eins und S ein Oberring von R,
so ist jedes Polynom über R ein Polynom über S.
Definition 1.1.4. Jedem Polynom p in n Variablen über einem kommutativen Ring
R mit Eins entspricht eine Funktion von Rn nach R, die wir mit p̂R bezeichnen, durch

p̂R := Rn 3 x 7→

X
p α xα 
α∈spt(p)
definieren und die dem Polynom p zugeordnete Polynomfunktion auf Rn nennen.
Ist S ein echter Oberring von R, so sind die Polynomfunktionen p̂R und p̂S voneinander verschieden. Wir werden im Folgenden jedoch trotzdem meist auf die Präzisierung
des Ringes verzichten und statt p̂R kurz p̂ schreiben, wenn aus dem Zusammenhang
klar ist, welcher Ring gemeint ist.
Eine Funktion f ∈ R(R
gibt, sodass f = p̂.
n)
wird Polynomfunktion auf Rn genannt, wenn es p ∈ Rhni
Die Menge5
\ := {p̂; p ∈ Rhni}
[Rhni]
ist die Menge aller Polynomfunktionen auf Rn .
4
5
Eine sehr gängige Bezeichnung für die Menge Rhni lautet R [X0 , . . . , Xn−1 ].
\ gerade das Bild der
Fasst man das Symbol b als die Funktion Rhni 3 p 7→ p̂ auf, so ist [Rhni]
Menge Rhni unter dieser Funktion. Die Schreibweise entspricht also der in Fußnote 3 auf der
vorherigen Seite gemachten Definition des Nachbereichs einer Menge unter einer Relation.
10
1.1 Polynome
Lemma 1.1.5. Seien p, q ∈ Rhni. Dann gelten die Gleichungen
p[
+ q = p̂ + q̂ und pcq = p̂ q̂.
Beweis. Für alle x ∈ Rn gilt
p[
+ q (x) =
(p + q)α xα =
X
α∈spt(p+q)
p α xα +
X
α∈spt(p)
X
qα xα = (p̂ + q̂) (x)
α∈spt(q)
und
X
pcq (x) =
(p q)γ xγ =
X


X

α∈spt(p)
p α p β xγ =
γ∈spt(p q) α+β=γ
γ∈spt(p q)

X
p α xα  
X
qβ xβ  = (p̂ q̂) (x) .
β∈spt(q)
Definition 1.1.6. Für6 k ∈ n sei der Grad eines Polynoms p ∈ Rhni bezüglich seiner
k-ten Variablen durch
degk p := sup {αk ; α ∈ spt (p)}
definiert. Er beträgt −∞, wenn die Menge, über die das Supremum gebildet wird,
leer ist. Dies ist genau dann der Fall, wenn p das Nullpolynom ist.
Für den Fall n = 1, d. h. für den Fall, dass p ein Polynom in nur einer Variablen ist,
schreiben wir auch deg anstelle von deg0 .
Ebenfalls im Fall n = 1 definieren wir die Koeffizientenzahl (englisch: number of
coefficients) von p als
noc p := min {r ∈ N; spt (p) ⊆ r} .
Damit gilt für alle p ∈ Rh1i \ {0} die Gleichung noc p = deg p + 1. Die Koeffizientenzahl eines Polynoms p ∈ Rh1i mit spt (p) ∈ N ist gleich der Anzahl seiner nichtverschwindenden Koeffizienten.7
6
Aufgrund von Bemerkung 1.1.1 auf Seite 9 ist k ∈ n eine kurze Schreibweise für k ∈ N, 0 ≤ k < n.
Wir werden noch oft Gebrauch von ihr machen.
7
Die Definitionen 1.1.2 und 1.1.4 sind auch im Fall n = 0 sinnvoll. Dann gilt N0 = N∅ =
0
{α ⊆ ∅ × N; α rechtseindeutig} = {∅} = 1 und daher R(N ) = R1 . Weiter ergibt sich Rh0i = R1 .
Für n = 0 ist nicht nur die Addition, sondern auch die Multiplikation in Rh0i punktweise. Für
alle p ∈ Rh0i ist p̂ ∈ R1 und, wenn man für x ∈ R0 = {0} und α ∈ N0 = {0} die Potenz xα = 00
11
1 Grundlagen
Jedes Polynom über R in n + 1 Variablen kann auch als Polynom in nur einer Variablen mit Koeffizienten aus Rhni aufgefasst werden. Folgende Definition ermöglicht
diese Umdeutung:
Definition 1.1.7. Seien n ∈ N, R ein kommutativer Ring mit Eins und p ∈ Rhn + 1i.
Dann sei
h1i
p := p(α,β)
∈ (Rhni)h1i
n
α∈N
β∈N
das „als Polynom in einer Variablen mit Koeffizienten in Rhni aufgefasste Polynom p“.
Ist p ∈ (Rhni)h1i ein Polynom in einer Variablen über dem Polynomring Rhni und
x ∈ Rn , so entsteht aus p durch Einsetzen der Werte von x in die Koeffizientenpolynome von p ein Polynom in einer Variablen über R. Folgende Definition liefert dazu
eine Notation:
Definition 1.1.8. Seien n ∈ N, R ein kommutativer Ring mit Eins, p ∈ (Rhni)h1i
und x ∈ Rn . Dann sei
px̂ := (pcβ (x))β∈N ∈ Rh1i
das Polynom, das aus p durch Einsetzen der Werte von x in die Koeffizientenpolynome
von p hervorgeht.
Mit Definition 1.1.4 auf Seite 10 erhält man dafür die explizitere Darstellung

px̂ = (pcβ (x))β∈N = 


X
α∈spt(pβ )
(pβ )α xα 

.
β∈N
Lemma 1.1.9. Seien n ∈ N, R ein kommutativer Ring mit Eins, p, q ∈ (Rhni)h1i
und x ∈ Rn . Dann gilt
px̂ + qx̂ = (p + q)x̂ und px̂ qx̂ = (p q)x̂ .
Beweis. Für alle β ∈ N gilt
(px̂ + qx̂ )β = pcβ (x) + qcβ (x)
=
mit 1.1.5
\
p\
β + qβ (x) = (p + q)β (x) = (p + q)x̂
\ = R1 . Definition
als 1 erkennt, sogar p̂ = p. Als Menge der Polynomfunktionen ergibt sich [Rh0i]
1.1.6 macht für n = 0 keine Aussage, da es kein k ∈ 0 gibt. Dass es vorteilhaft ist, auch Polynome
in null Variablen zu betrachten, zeigt sich spätestens bei der Definition der semialgebraischen
Mengen auf Seite 14.
12
1.2 Semialgebraische Mengen
und
(px̂ qx̂ )β = pcβ (x) qcβ (x)
=
mit 1.1.5
\
p[
β qβ (x) = (p q)β (x) = (p q)x̂ .
Lemma 1.1.10. Seien n ∈ N, R ein kommutativer Ring mit Eins, p ∈ Rhn + 1i,
x ∈ Rn und y ∈ R. Dann gilt
\
h1i ) (y) .
p̂ (x, y) = (p
x̂
Beweis.
X
pb (x, y) =
α β
p(α,β) x y =
α∈Nn ,β∈N

X
X 
β∈N
α∈Nn
p
h1i
β
α
X
p
h1i
α∈Nn ,β∈N
β
xα y β =
α

x
α
yβ =
X
\
h1i ) (x) y β =
(p
β
β∈N
X ph1i
β∈N
x̂ β
\
h1i ) (y) .
y β = (p
x̂
1.2 Semialgebraische Mengen
In diesem Abschnitt wird der für den Satz von Tarski-Seidenberg zentrale Begriff der
semialgebraischen Menge definiert.
Definition 1.2.1. Unter dem Signum sgn (x) einer reellen Zahl x ∈ R wird die Zahl
sgn (x) :=


x
, wenn x 6= 0

0
, wenn x = 0
|x|
verstanden. Es gilt sgn (x) ∈ {−1, 0, 1}.
Definition 1.2.2. Zur Vereinfachung führen wir die Abkürzung8
Λ := {[ε] sgn; ε ⊆ {−1, 0, 1}}
ein.
Eine Menge λ ⊆ R nennen wir Achsenabschnitt, wenn λ ∈ Λ.
8
Wegen Fußnote 3 auf Seite 9 ist [ε] sgn = {x ∈ R; sgn (x) ∈ ε}. Also hat Λ genau acht Elemente,
die Achsenabschnitte ∅, R>0 , {0}, R≥0 , R<0 , R6=0 , R≤0 und R.
13
1 Grundlagen
Definition 1.2.3. Sei n ∈ N. Dann sei9
U (Rn ) := {[λ] p̂; p ∈ Rhni , λ ∈ Λ}
die Menge der Urbilder von Achsenabschnitten unter Polynomfunktionen auf Rn .
Eine Menge U ⊆ Rn nennen wir Polynom-Urbild, wenn U ∈ U (Rn ).
Definition 1.2.4. Sei n ∈ N. Dann sei
S (Rn ) := {∩E; E ⊆ U (Rn ) endlich}
die Menge der endlichen Schnitte von Polynom-Urbildern. In diesem Zusammenhang
interpretieren wir für E = ∅ den im Allgemeinen nicht definierten Schnitt ∩E = ∩∅
als ∩E = ∩∅ := Rn .
Eine Menge S ⊆ Rn nennen wir Urbildschnitt, wenn S ∈ S (Rn ).
Definition 1.2.5. Sei10 n ∈ N. Dann sei
V (Rn ) := {∪E; E ⊆ S (Rn ) endlich}
die Menge der endlichen Vereinigungen von Urbildschnitten.
Eine Menge V ⊆ Rn heißt semialgebraisch, wenn V ∈ V (Rn ).
Lemma 1.2.6. Die Vereinigung zweier semialgebraischer Mengen ist semialgebraisch.
Beweis. Sei n ∈ N und seien V, W ∈ V (Rn ). Dann gibt es zwei endliche Mengen
E, F ⊆ S (Rn ) von Urbildschnitten mit V = ∪E und W = ∪F.
Da E ∪ F ⊆ S (Rn ) endlich, ist die Vereinigung
V ∪ W = (∪E) ∪ (∪F) = ∪ (E ∪ F) ∈ V (Rn )
semialgebraisch.
9
Die Bezeichnung Rhni für die Menge der Polynome in n Variablen über R wird in Definition 1.1.2
auf Seite 9 und die Notation p̂ für die einem Polynom p zugeordnete Polynomfunktion in Definition 1.1.4 auf Seite 10 eingeführt.
10
Man beachte, dass der Fall n = 0 in den Definitionen der Polynom-Urbilder, Urbildschnitte und
semialgebraischen Mengen nicht ausgeschlossen wird. Dies setzt voraus, dass auch Polynome
in null Variablen definiert wurden (vgl. Fußnote 7 auf Seite 11). Semialgebraische Mengen in
R0 = {∅} gibt es genau zwei: {∅} und ∅. Diese beiden spielen bei der Anwendung des Satzes
von Tarski-Seidenberg zur Existenzquantorenelimination die Rolle von wahr und falsch (siehe
Kapitel 4).
14
1.2 Semialgebraische Mengen
Das folgende Lemma macht die zum gerade bewiesenen Lemma duale Aussage für
Urbildschnitte. Sein Beweis unterscheidet sich nur geringfügig vom gerade geführten.
Lemma 1.2.7. Der Schnitt zweier Urbildschnitte ist ein Urbildschnitt.
Beweis. Sei n ∈ N und seien S, T ∈ S (Rn ). Dann gibt es zwei endliche Mengen
E, F ⊆ U (Rn ) von Polynom-Urbildern mit S = ∩E und T = ∩F.
Da E ∪F ⊆ U (Rn ) endlich, ist der Schnitt S ∩T = (∩E)∩(∩F) = ∩ (E ∪ F) ∈ S (Rn )
ein Urbildschnitt.
Lemma 1.2.8. Der Schnitt zweier semialgebraischer Mengen ist semialgebraisch.
Beweis. Sei n ∈ N und seien V, W ∈ V (Rn ). Dann gibt es zwei endliche Mengen
E, F ⊆ S (Rn ) von Urbildschnitten mit V = ∪E und W = ∪F.
Per Induktion über die Anzahl der Elemente von E sieht man, dass der Schnitt V ∩W
semialgebraisch ist:
Induktionsanfang: Für E = ∅ ist V ∩ W = (∪∅) ∩ W = ∅ ∩ W = ∅ = ∪∅ ∈ V (Rn )
semialgebraisch.
Induktionsschritt: Für E 6= ∅ gibt es einen Urbildschnitt S ∈ E. Mit D := E\ {S}
schreiben wir V ∩ W = (∪E) ∩ W = (S ∪ (∪D)) ∩ W = (S ∩ W ) ∪ ((∪D) ∩ W )
als Vereinigung zweier Mengen. Wenn wir zeigen, dass diese semialgebraisch sind,
folgt mit Lemma 1.2.6 die Behauptung.
n
Die erste Menge S ∩ W ist gleich S ∩ (∪F) = ∪ S
{z F} ; F ∈ F
| ∩
o
und damit
∈S(Rn ) nach Lemma 1.2.7
als endliche Vereinigung von Urbildschnitten semialgebraisch.
Die zweite Menge (∪D) ∩ W ist nach Induktionsvoraussetzung (denn D hat ein
Element weniger als E) semialgebraisch.
Lemma 1.2.9. Seien n ∈ N, U ∈ U (Rn ) ein Polynom-Urbild und σ : n → n bijektiv.
Dann gilt
1.
[U ] ∈ U (Rn ), d. h. der Austausch kartesischer Faktoren
Rn 3 x 7→ xσ(i)
i∈n
liefert ein Polynom-Urbild.
2. U × R ∈ U (Rn+1 ).
3. Rn \U ∈ U (Rn ), d. h. das Komplement ist ein Polynom-Urbild.
15
1 Grundlagen
Beweis. Weil U ∈ U (Rn ), gibt es ein Polynom p ∈ Rhni und ein Polynom-Urbild
λ ∈ Λ mit U = [λ] p̂.
1. Die Funktion q := (Nn 3 α 7→ pα◦σ−1 ) ist ein Polynom. Für alle x ∈ Rn gilt
X
q̂ (x) =
α∈Nn
X
pα◦σ−1
α∈Nn
(xi )αi =
Y
qα
xσ−1 (i)
α
σ −1 (i)
Y
X
pβ
β∈Nn
xσ−1 (i)
i∈n
xσ−1 (i)
α
σ −1 (i)
=
i∈n
=
i∈n
p̂
qα
α∈Nn
i∈n
Y
X
Y
xσ−1 (i)
βi
=
i∈n
= p̂ x ◦ σ −1
und deshalb
n
o
[λ] q̂ = {y; y ∈ Rn , q̂ (y) ∈ λ} = y; y ∈ Rn , p̂ y ◦ σ −1 ∈ λ =
{x ◦ σ; x ∈ Rn , p̂ (x) ∈ λ} = (Rn 3 x 7→ x ◦ σ) [[λ] p̂] = Rn 3 x 7→ xσ(i)
n
was beweist, dass R 3 x 7→ xσ(i)
i∈n
i∈n
[U ] Polynom-Urbild ist.


pα

2. Die Funktion r := Nn × N 3 (α, β) 7→ 

0

, wenn β = 0 

sonst
ist ein Polynom.
Für alle x ∈ Rn und alle y ∈ R gilt
r̂ (x, y) =
X
r(α,β) xα y β =
(α,β)∈Nn ×N
X
pα xα = p̂ (x)
α∈Nn
und deshalb
[λ] r̂ = {(x, y) ∈ Rn × R; r̂ (x, y) ∈ λ} = {(x, y) ∈ Rn × R; p̂ (x) ∈ λ} =
{x ∈ Rn ; p̂ (x) ∈ λ} × R = [λ] p̂ × R = U × R,
was beweist, dass U × R ∈ U (Rn+1 ).
3. Das Komplement R\λ ist ein Achsenabschnitt. Deshalb gilt
Rn \U = Rn \ [λ] p̂ = [R\λ] p̂ ∈ U (Rn ) .
16
[U ] ,
1.2 Semialgebraische Mengen
Lemma 1.2.10. Seien n ∈ N, S ∈ S (Rn ) ein Urbildschnitt und σ : n → n bijektiv.
Dann gilt
1.
[S] ∈ S (Rn ), d. h. der Austausch kartesischer Faktoren
Rn 3 x 7→ xσ(i)
i∈n
liefert einen Urbildschnitt.
2. S × R ∈ S (Rn+1 ).
3. Rn \S ∈ V (Rn ), d. h. das Komplement ist semialgebraisch.
Beweis. Da S ∈ S (Rn ), gibt es eine endliche Menge E ⊆ U (Rn ) von PolynomUrbildern mit S = ∩E.
1. Die Menge
Rn 3 x 7→ xσ(i)
i∈n
[S] = (Rn 3 x 7→ x ◦ σ) [∩E] =
∩ {(Rn 3 x 7→ x ◦ σ) [U ] ; U ∈ E}
ist als Schnitt endlich vieler Mengen, die nach Lemma 1.2.9 Polynom-Urbilder
und damit insbesondere Urbildschnitte sind, nach Lemma 1.2.7 ein Urbildschnitt.
2. Das kartesische Produkt S × R = (∩E) × R = ∩ {U × R; U ∈ E} ist aus dem
selben Grund ein Urbildschnitt.
3. Das Komplement Rn \S = Rn \ (∩E) = ∪ {Rn \U ; U ∈ E} ist als Vereinigung
endlich vieler Mengen, die nach Lemma 1.2.9 Polynom-Urbilder und damit
insbesondere semialgebraisch sind, nach Lemma 1.2.6 semialgebraisch.
Lemma 1.2.11. Seien n ∈ N, V ∈ V (Rn ) eine semialgebraische Menge und σ : n → n
bijektiv. Dann gilt
1.
[V ] ∈ V (Rn ), d. h. der Austausch kartesischer Faktoren
Rn 3 x 7→ xσ(i)
i∈n
liefert eine semialgebraische Menge.
2. V × R ∈ V (Rn+1 ).
3. Rn \V ∈ V (Rn ), d. h. das Komplement ist semialgebraisch.
17
1 Grundlagen
Beweis. Da V ∈ V (Rn ), gibt es eine endliche Menge E ⊆ S (Rn ) von Urbildschnitten
mit V = ∪E.
1. Die Menge
n
R 3 x 7→ xσ(i)
i∈n
[V ] = (Rn 3 x 7→ x ◦ σ) [∪E] =
∪ {(Rn 3 x 7→ x ◦ σ) [S] ; S ∈ E}
ist als Vereinigung endlich vieler Mengen, die nach Lemma 1.2.10 Urbildschnitte
und damit insbesondere semialgebraisch sind, nach Lemma 1.2.6 semialgebraisch.
2. Das kartesische Produkt V × R = (∪E) × R = ∪ {S × R; S ∈ E} ist aus dem
selben Grund semialgebraisch.
3. Das Komplement Rn \V = Rn \ (∪E) = ∩ {Rn \S; S ∈ E} ist als Schnitt endlich
vieler Mengen, die nach Lemma 1.2.10 semialgebraisch sind, nach Lemma 1.2.8
semialgebraisch.
1.3 Wohlfundierte Induktion
Definition 1.3.1. Sei < eine Relation, K eine Menge und µ ∈ K. Dann sagt man
µ ist vorgängerlos bezüglich < in K, wenn
@κ ∈ K : κ < µ.
Definition 1.3.2. Eine Relation < heißt wohlfundierte Relation11 , wenn jede nichtleere
Menge K ein bezüglich < in K vorgängerloses Element besitzt.
Lemma 1.3.3. Sei < eine Relation und Φ eine Menge12 , sodass <⊆ Φ × Φ. Dann
ist < genau dann eine wohlfundierte Relation, wenn jede nichtleere Menge K ⊆ Φ
ein bezüglich < in K vorgängerloses Element besitzt.
11
Im Unterschied zu einer Wohlordnung muss eine wohlfundierte Relation nicht unbedingt eine
Ordnungsrelation sein.
12
Eine solche Menge gibt es immer – die kleinste solche ist D (<) ∪ R (<). Die Definitionen der
Begriffe Nachbereich R (<) und Vorbereich D (<) finden sich in Fußnote 3 auf Seite 9.
18
1.3 Wohlfundierte Induktion
Beweis. Wir zeigen jede Implikation einzeln.
Notwendigkeit: Wenn jede nichtleere Menge K ein bezüglich < in K vorgängerloses
Element besitzt, dann tut dies auch jede nichtleere Menge K ⊆ Φ.
Hinlänglichkeit: Sei K 6= ∅ eine nichtleere Menge. Es ist zu zeigen, dass K ein
vorgängerloses Element besitzt. Falls K ⊆ Φ, besitzt K nach Voraussetzung ein
bezüglich < in K vorgängerloses Element. Andernfalls, d. h. falls K * Φ, gibt es
ε ∈ K\Φ und weil <⊆ Φ × Φ, ist ε vorgängerlos.
Lemma 1.3.4 (Wohlfundierte Induktion). Sei < eine wohlfundierte Relation und Φ
eine Menge. Hat eine Menge F ⊆ Φ die Eigenschaft
∀ϕ ∈ Φ :
({σ ∈ Φ; σ < ϕ} ⊆ F
⇒
ϕ ∈ F),
so ist F = Φ.
Beweis. Wäre F 6= Φ, so wäre K := Φ\F 6= ∅ und besäße daher, weil < eine
wohlfundierte Relation ist, ein minimales Element µ. Damit wäre
{σ ∈ Φ; σ < µ} ∩ K = ∅ und daher {σ ∈ Φ; σ < µ} ⊆ Φ\K = F . Aufgrund der
vorausgesetzten Eigenschaft der Menge F wäre damit µ ∈ F im Widerspruch zu
µ ∈ K = Φ\F .
Bemerkung 1.3.5. Ersetzt man in Lemma 1.3.4 jedes Vorkommen von Φ durch N,
so erhält man das bekannte Induktionsprinzip für natürliche Zahlen. Das Lemma
kann also als Verallgemeinerung dieses Induktionsprinzips auf andere Mengen als
N aufgefasst werden. Es wird zum Beweis von Lemma 2.4.2 auf Seite 57 verwendet
werden und dieses wiederum zum Beweis des Satzes von Tarski-Seidenberg (Satz 2.4.5
auf Seite 64).
Wer sich nur für den Beweis des Satzes von Tarski-Seidenberg interessiert, nicht aber
für seine Anwendung in der Theorie der partiellen Differentialgleichungen, kann die
kommenden Seiten überspringen und direkt zu Kapitel 2 auf Seite 25 übergehen.
19
1 Grundlagen
1.4 Integritätsringe und Satz von Gauß
Definition 1.4.1. Ist R ein kommutativer Ring und sind a, x ∈ R, so nennt man
x einen Teiler von a, wenn es y ∈ R gibt, sodass a = x y. Man schreibt dafür auch
kurz x|a (gelesen x teilt a).
Ist x kein Teiler von a, so schreibt man dafür kurz x - a.
Diese Definition hat zur Konsequenz, dass jedes Element eines kommutativen Rings
Teiler der Null ist. Zu jedem x ∈ R gibt es nämlich ein Element y ∈ R (und zwar
y = 0), sodass 0 = x y.
Definition 1.4.2. Ist R ein kommutativer Ring, so nennt man n ∈ R einen Nullteiler,
wenn es b ∈ R\ {0} gibt, sodass n b = 0.
Die Forderung b 6= 0 in der Definition des Begriffs Nullteiler ist wichtig, denn ohne
sie wären die Begriffe Nullteiler und Teiler der Null gleichbedeutend.
In jedem kommutativen Ring R 6= {0} ist die Null ein Nullteiler.
Lemma 1.4.3 (Kürzungsregel). Seien R ein kommutativer Ring, a, b, x ∈ R und x
kein Nullteiler in R. Dann gilt die Implikation
xa = xb
⇒
a = b.
Beweis. Das Produkt x (a − b) = x a − x b = 0 verschwindet. Wäre a − b 6= 0, so wäre
x ein Nullteiler. Also gilt a = b.
Definition 1.4.4. Ein kommutativer Ring heißt nullteilerfrei, wenn jeder seiner Nullteiler gleich null ist, oder anders gesagt13 , wenn für alle Ringelemente a, b mit a b = 0
gilt, dass 0 ∈ {a, b}.
Definition 1.4.5. Ein kommutativer Ring mit Eins heißt Integritätsring, wenn er
nullteilerfrei ist.
Definition 1.4.6. Sei R ein Integritätsring. Dann heißt a ∈ R eine Einheit, wenn a
die Eins teilt, d. h., wenn es b ∈ R gibt, sodass a b = 1.
13
Die Äquivalenz sieht man wie folgt: Gilt a b = 0 und jeder Nullteiler ist null, so würde aus
0 ∈
/ {a, b} folgen, dass a und b von Null verschiedene Nullteiler wären. Gilt umgekehrt für
a b = 0 stets 0 ∈ {a, b} und ist n ein Nullteiler, so gibt es b ∈ R\ {0} mit n b = 0, woraus n = 0
folgt.
20
1.4 Integritätsringe und Satz von Gauß
Definition 1.4.7. Sei R ein Integritätsring. Dann heißt u ∈ R irreduzibel, wenn p
von Null verschieden ist, keine Einheit ist und wenn für alle a, b ∈ R mit p = a b ein
Element von {a, b} eine Einheit ist.
Definition 1.4.8. Sei R ein Integritätsring. Dann heißt p ∈ R ein Primelement,
wenn p von Null verschieden ist, keine Einheit ist und wenn es für alle a, b ∈ R mit
p| (a b) ein Element x ∈ {a, b} mit p|x gibt.
Definition 1.4.9. Ein Integritätsring heißt faktorieller Ring, wenn jedes von Null
verschiedene Ringelement, das keine Einheit ist, als Produkt von Primelementen
geschrieben werden kann, genauer gesagt, wenn
^
_
a ∈ R\ {0}
n∈N
a keine Einheit f ∈ {p ∈ R; p Primelement}n+1
a=
Y
fi .
i∈n+1
Lemma 1.4.10. Sei R ein Integritätsring. Dann ist jedes Primelement aus R irreduzibel.
Beweis. Sei p ∈ R ein Primelement und seien a, b ∈ R mit p = a b. Dann teilt p das
Produkt a b. Also gibt es x ∈ {a, b} mit p|x. Es gibt also s ∈ R mit p s = x. Es gibt
y ∈ {a, b} mit {x, y} = {a, b}. Damit gilt x 1 = x = p s = a b s = x y s und mit der
Kürzungsregel 1.4.3 folgt 1 = y s, d. h. das Element y der Menge {a, b} = {x, y} ist
eine Einheit.
Bemerkung 1.4.11. Nicht jedes irreduzible Element eines Integritätsrings ist zwangsläufig ein Primelement14 . In einem Hauptidealring15 jedoch schon16 und sogar17 in einem
faktoriellen Ring18 . Diese Aussagen werden in der vorliegenden Arbeit jedoch keine
Verwendung finden und werden nur der Vollständigkeit halber erwähnt.
√
Bei [Rei, S. 136-138] oder [Hor, S. 140] wird begründet, warum a + bi 5; a, b ∈ Z ⊆ C ein
√ √ Integritätsring ist, dessen irreduzibles Element 2 das Produkt 1 + i 5 1 − i 5 teilt, ohne
einen der Faktoren zu teilen.
15
Zur Definition siehe [Rei, S. 114], [Oel, S. 109] oder [Hor, S. 132].
16
Zum Beweis siehe [Rei, S. 139].
17
Jeder Hauptidealring ist ein faktorielle Ring (siehe [Rei, S. 142] oder [Hor, S. 141]).
18
Zum Beweis siehe [Rei, S. 162].
14
21
1 Grundlagen
Satz 1.4.12 (Satz von Gauß). Ist R ein faktorieller Ring, so ist es auch19 Rh1i.
Beweis. Ein Beweis dieses Satzes kann bei [Rei, S. 163], [Hor, S. 155] oder bei
[Voi, S. 12-15] gefunden werden.
Lemma 1.4.13. Seien R ein faktorieller Ring, x, y, w ∈ Rh1i Polynome, x| (y w),
deg x > 0, w 6= 0 und deg x > deg w. Dann gibt es ein Polynom t ∈ Rh1i mit
deg t > 0, t|x und t|y.
Beweis. Dem Beweis liegt die Idee zugrunde, dass die Primfaktoren von x nicht alle
in w aufgehen können und deshalb mindestens einer dieser Faktoren y teilen muss.
Für den Fall y = 0 beweist man den Satz durch Setzen von t := x. Sei also y 6= 0.
Es gibt f ∈ Rh1i mit x f = y w. Es gilt f 6= 0, weil y w 6= 0. Nach Satz von Gauß
(Satz 1.4.12) ist Rh1i ein faktorieller Ring. Das Polynom x lässt sich als Produkt
von Primelementen in Rh1i schreiben, weil x wegen deg x 6= −∞ von Null verschieden und wegen deg x > 0 keine Einheit in Rh1i ist20 . Es gibt also n ∈ N und
Q
p ∈ {q ∈ Rh1i ; q Primelement}n+1 , sodass x = i∈n+1 pi .
Wir zeigen jetzt indirekt, dass es i ∈ n + 1 gibt, sodass deg pi > 0 und pi |y:
Angenommen, für alle i ∈ n + 1 wäre deg pi = 0 oder pi - y.
Dann wäre es möglich, per Induktion zu beweisen, dass es für alle k ∈ n + 2 ein
Polynom βk ∈ Rh1i vom Grad deg βk = deg y gäbe, das Teiler von y und Teiler von
Q
( i∈k pi ) f wäre:
Induktionsanfang: Für k = n + 1 könnte man βk := y setzen. Wegen (
Q
x f = y w = βk w wäre βk ein Teiler von ( i∈k pi ) f .
Q
i∈n+1
pi ) f =
Induktionsschritt: Sei k ∈ n + 1 und βk+1 ∈ Rh1i ein Polynom vom Grad deg βk+1 =
Q
deg y, das Teiler von y und Teiler von ( i∈k+1 pi ) f ist. Es gäbe also ϕ ∈ Rh1i
mit


Y

pi  f = βk+1 ϕ.
(1.1)
i∈k+1
Man könnte dann folgende zwei Fälle unterscheiden:
19
20
Die Notation Rhni für Polynomringe wurde in Definition 1.1.2 auf Seite 9 eingeführt.
Ein Polynom x ∈ Rh1i mit deg x > 0 ist aus folgendem Grund nie eine Einheit: Welches Polynom
aus Rh1i auch immer mit x multipliziert wird, das Produkt ist entweder null oder vom Grad
größer 0, also in jedem Fall von der Eins verschieden.
22
1.4 Integritätsringe und Satz von Gauß
1. Fall pk |βk+1 : Dann gäbe es βk ∈ Rh1i mit βk+1 = pk βk . Aus pk |βk+1 und
βk+1 |y folgte dann pk |y und aus der Widerspruchsannahme, dass deg pk = 0.
Also wäre deg βk = deg βk+1 − deg pk = deg βk+1 = deg y. Das Polynom βk
Q
wäre wegen βk |βk+1 und βk+1 |y Teiler von y. Die Gleichung pk ( i∈k pi ) f =
Q
( i∈k+1 pi ) f = βk+1 ϕ = pk βk ϕ ließe sich beidseitig mit pk kürzen (siehe
1.1
Q
Lemma 1.4.3) und man sähe, dass βk auch ein Teiler von ( i∈k pi ) f wäre.
2. Fall pk - βk+1 : Weil pk wegen 1.1 das Produkt βk+1 ϕ, nicht aber den Faktor
βk+1 teilen würde, würde pk als Primelement ϕ teilen, d. h. es gäbe ψ ∈ Rh1i
mit ϕ = pk ψ. Durch Setzen von βk := βk+1 erhielte man die Gleichung
Q
Q
pk ( i∈k pi ) f = ( i∈k+1 pi ) f = βk+1 ϕ = βk ϕ = βk pk ψ, die sich beidseitig
1.1
mit pk kürzen ließe (siehe Lemma 1.4.3). So sähe man, dass βk Teiler von
Q
( i∈k pi ) f wäre.
Aus der per Induktion bewiesenen Behauptung würde insbesondere die Existenz eines
Polynoms β0 ∈ Rh1i vom Grad deg β0 = deg y folgen, das Teiler von f wäre. Weil
f 6= 0, wäre damit deg y ≤ deg f und folglich deg x = deg y + deg w − deg f ≤
x f =y w
deg w, im Widerspruch zur Voraussetzung deg x > deg w.
Es gibt also i ∈ n + 1, sodass deg pi > 0 und pi |y. Das Setzen von t := pi beendet
den Beweis.
23
1 Grundlagen
24
2 Der Satz von Tarski-Seidenberg
2.1 Polynomdivision über Ringen
Die Polynomdivision ist ein Verfahren, bei dem üblicherweise vorausgesetzt wird,
dass die Polynomkoeffizienten aus einem Körper stammen, weil sie die Eigenschaft
von Null verschiedener Körperelemente, ein Inverses bezüglich der Multiplikation
zu besitzen, ausnutzt1 . Zu je zwei Polynomen a ∈ Kh1i und b ∈ Kh1i \ {0} über
einem Körper K gibt es stets zwei eindeutig bestimmte Polynome m, q ∈ Kh1i mit
a = m + b q, sodass der Grad des Divisionsrests m echt kleiner ist als der des Divisors
b. Für den Beweis des Satzes von Tarski-Seidenberg wird es von Nutzen sein, eine
Entsprechung zu diesem Verfahren für den Fall nichtnotwendigerweise invertierbarer
Koeffizienten zu finden.
Ein möglicher Weg wäre, auszunutzen, dass wir die Division nur für den Fall von
Koeffizienten aus einem Integritätsring benötigen. Wir könnten die Division dann
mit Koeffizienten aus dessen Quotientenkörper durchführen und anschließend die
Nenner wegmultiplizieren.
Diesen Weg werden wir aber aus folgendem Grund nicht direkt einschlagen: Wir
werden es mit Polynomen zu tun haben, deren Koeffizienten Polynome über R sind
und es wird Situationen geben, in denen aus diesen durch Einsetzen von Werten in
die Koeffizientenpolynome Polynome über R entstehen. Unangenehm ist, dass sich
dabei, wenn der höchste Koeffizient eine Nullstelle hat, der Grad verringern kann und
dies bei Verwendung normaler Polynomdivision dazu führt, dass von Division gefolg1
Betrachtet man beispielsweise den Polynomring Zh1i und seine
a := 1{0} und
( Elemente !
1 für α = 0
b := 2 · 1{0} (mit 1{0} ist hier die Indikatorfunktion N 3 α 7→
∈ ZN gemeint,
0 sonst
die aufgrund der Endlichkeit ihres Trägers ein Polynom ist, dessen zugehörige Polynomfunktion gleich Z 3 z 7→ 1 ist), so gibt es keine zwei Polynome m, q ∈ Zh1i mit deg m < deg b = 0
und a = m + b q. Ansonsten müsste wegen deg m = −∞ nämlich m = 0 gelten und daher
1 = a0 = b0 q0 = 2 q0 . Es gibt aber keine ganze Zahl, die mit 2 multipliziert 1 ergibt.
25
2 Der Satz von Tarski-Seidenberg
tes Einsetzen und von Einsetzen gefolgte Division nicht dasselbe sind. Erschwerend
kommt hinzu, dass auch der Fall eintreten kann, in dem der Divisor durch Einsetzen
null wird.
Der hier eingeschlagene Weg ermöglicht es, eine Division durchzuführen und dabei
gegebenenfalls so zu tun, als wären die beteiligten Polynome von höherem Grad als
sie es eigentlich sind. Dabei hängt dann das Ergebnis einer Division nicht nur von
Dividend und Divisor ab, sondern auch vom Grad, der den beiden Polynomen jeweils
unterstellt wird.
Definition 2.1.1. Eine Funktion v heißt Vektor2 , wenn ihr Definitionsbereich3 D (v)
eine natürliche Zahl ist.
Für die Anzahl der Komponenten eines Vektors verwenden wir die Schreibweise
v := D (v).
Definition 2.1.2. Eine Funktion A heißt Matrix, wenn es z ∈ N und s ∈ N gibt,
sodass4 D (A) = z × s.
Im Fall A 6= ∅ wird die Anzahl der Zeilen von A als A := z und die Anzahl der
Spalten von A als |A| := s definiert. Im Fall A = ∅ setzen wir5 A := |A| := 0.
Definition 2.1.3. In dieser Definition wird eine Notation festgelegt, die es erlaubt,
Komponenten aus einem Vektor zu streichen.
Sei v ein Vektor und sei Z ⊆ N. Dann wird durch v|Z der Vektor bezeichnet, der
aus v hervorgeht, wenn von seinen Komponenten nur diejenigen mit Indizes in Z
beibehalten werden. Genauer gesagt erhalten wir v|Z auf folgende Weise:
Wir setzen6 z := # (v ∩ Z). Dann gibt es genau eine monotone Bijektion ζ von z
nach v ∩ Z. Damit sei
v|Z := (vζi )i∈z .
2
Funktionen, deren Definitionsbereich eine natürliche Zahl ist, werden in dieser Arbeit häufig
vorkommen. In einem Text, in dem allgemeine Vektorräume eine Rolle spielen, wäre es hinderlich,
für diese Funktionen den Namen Vektor zu verwenden und es müsste ein anderer Name gefunden
werden, etwa der Name Tupel oder der Name endliche Folge. Dies ist in der vorliegenden Arbeit
jedoch nicht der Fall.
3
Die Notation D (r) für Relationen r wird in Fußnote 3 auf Seite 9 eingeführt. Die Forderung
D (v) ∈ N ist aufgrund von Bemerkung 1.1.1 auf Seite 9 eine kurze Schreibweise für
∀n ∈ N : (n + 1 ∈ D (v) ⇒ n ∈ D (v)).
4
Nach Bemerkung 1.1.1 auf Seite 9 ist die Menge z × s gleich {(i, j) ; 0 ≤ i < z, 0 ≤ j < s}.
5
Für den Fall A 6= ∅ folgt aus D (A) = z × s = z̃ × s̃, dass z = z̃ und s = s̃. Für den Fall A = ∅
gilt für alle z, s ∈ N jedoch D (A) = 0 × s = z × 0. Dies macht die Fallunterscheidung in der
Definition von A und |A| nötig.
6
Ist E eine endliche Menge, so bezeichnen wir mit #E die Zahl der Elemente von E.
26
2.1 Polynomdivision über Ringen
Definition 2.1.4. Wie eben für Vektoren geschehen, führen wir jetzt eine Notation
ein, die es erlaubt, Zeilen und Spalten aus einer Matrix zu streichen.
Sei A eine Matrix und seien Z, S ⊆ N. Dann wird durch A|Z,S die Matrix bezeichnet,
die aus A hervorgeht, wenn von ihren Zeilen nur diejenigen mit Indizes in Z und von
ihren Spalten nur diejenigen mit Indizes in S beibehalten werden. Genauer gesagt
erhalten wir A|Z,S auf folgende Weise:
Wir setzen z := # A ∩ Z und s := # (|A| ∩ S).
Dann gibt es genau eine monotone Bijektion ζ von z nach A ∩ Z und genau eine
monotone Bijektion σ von s nach |A| ∩ S.
Damit sei
A|Z,S := Aζi ,σj
(i,j)∈z×s
.
Definition 2.1.5. Sei R ein kommutativer Ring mit Eins und A eine quadratische
Matrix über R (d. h. A Matrix,7 A [N2 ] ⊆ R und A = |A|). Dann ist die AdjunktenMatrix von A definiert als
Adj (A) := (−1)j+i det A|N\{j},N\{i}
i∈A,j∈|A|
.
Bemerkung 2.1.6. Die Fälle |A| ∈ {0, 1} sind in der soeben getroffenen Definition
nicht ausgeschlossen. Im Fall |A| = 0 ergibt sich Adj (A) = ∅ aus der Definitionsgleichung und im Fall |A| = 1 tritt die Frage nach der Determinante der Matrix ∅ auf,
d. h. die Frage nach der Determinante der 0 × 0-Matrix. Wir definieren8
det ∅ := 1
nicht nur, weil dadurch der folgende Satz auch für den Fall |A| = 1 gilt, sondern
auch, weil sich diese Definition in allen später auftretenden Zusammenhängen als
diejenige herausstellen wird, mit der sich Ergebnisse auf den Fall der 0 × 0-Matrix
verallgemeinern lassen.
Die Notation A N2 wird in Fußnote 3 auf Seite 9 eingeführt.
8
Man kann sich auch auf den Standpunkt stellen, dass es sich hierbei nicht um eine Definition
handelt, sondern um die konsequente Auslegung
Q der Definition: Die Determinante einer quadratischen Matrix A ist die Summe der Produkte i∈|A| ai,σ(i) für alle Permutationen σ : |A| → |A|.
Im Fall |A| = Q
0 gibt es genau eine Permutation σ : |A| → |A|, nämlich die leere Funktion σ = ∅.
Das Produkt i∈|A| ai,σ(i) ist für |A| = 0 das leere Produkt, also gleich eins. Demzufolge gilt
det ∅ = 1.
7
27
2 Der Satz von Tarski-Seidenberg
Satz 2.1.7. Sei R ein kommutativer Ring mit Eins, A eine quadratische Matrix über
R und E die A × |A|-Einheitsmatrix über R. Dann gilt
Adj (A) A = A Adj (A) = det (A) E.
Beweis. Den Beweis dieses Satzes findet man beispielsweise bei [Oel, S. 220] oder bei
[Atk, S. 103].
Definition 2.1.8. Ist R ein kommutativer Ring mit Eins und K ∈ N, so bezeichnen
wir mit9
RK h1i := {p ∈ Rh1i ; deg p < K}
die Menge der Polynome in einer Variablen über R mit Grad kleiner als K.
Alternativ könnte RK h1i mit der selben Wirkung auch als die Menge10
{p ∈ Rh1i ; noc p ≤ K}
der Polynome in einer Variablen über R mit Koeffizientenzahl kleiner gleich K
definiert werden.
Bemerkung 2.1.9. Die Menge von Polynomen RK h1i und die Menge von Vektoren RK
stehen über

RK h1i 3 p 7→ (pi )i∈K ∈ RK
K
und 
R 3 x 7→



 xα


0



∈ RK h1i

für α ∈ K 
für α ∈
/K
α∈N
in Bijektion.
9
Die Bezeichnung Rhni wird in Definition 1.1.2 auf Seite 9 und die Bezeichnung deg p in Definition 1.1.6 auf Seite 11 eingeführt.
10
Die Bezeichnung noc p wird in Definition 1.1.6 auf Seite 11 eingeführt.
28
2.1 Polynomdivision über Ringen
Definition 2.1.10. Seien R ein kommutativer Ring mit Eins, M, Q ∈ N und
M
b ∈ RM +1 h1i. Dann sei
b ∈ R(M +Q)×(M +Q) die Matrix
Q
M
b :=
Q



1


 b
 M +i−j




0

, wenn (j ∈ M ) ∧ (i = j)
, wenn (j ∈
/ M ) ∧ (M + i − j ∈ M
, sonst


+ 1) 


.
(i,j)∈(M +Q)2
M
b soll die Form der Matrix nachahmen. Im
Q
Fall M = 3 und Q = 2 sieht man zum Beispiel
Bemerkung 2.1.11. Das Symbol

1

3
b =
2










b0


1
b1 b0 


.
1 b2 b1 


b3 b2 

b3
Der Buchstabe b steht im Symbol dort, wo die Koeffizienten von b in der Matrix stehen
und die Zahlen M und Q beschriften im Symbol die Abstände des Kreuzungspunktes
vom oberen und unteren Matrixrand.
Satz 2.1.12. Seien R ein kommutativer Ring mit Eins, M, Q ∈ N und b ∈ RM +1 h1i.
Dann gilt


M
det  b  = bM Q .
Q
Beweis. Wir zeigen zunächst, dass
M
b eine obere Dreiecksmatrix ist:
Q
Für alle i, j ∈ (M + Q) tritt, wenn i > j, weder der Fall (j ∈ M ) ∧ (i = j), noch der
Fall (j ∈
/ M )∧(M + i − j ∈ M + 1) ein – letzterer nicht, weil dann M +i−j ≥ M +1.
Daher stehen unterhalb der Diagonalen nur Nullen.
Auf der Diagonalen steht an den M Positionen (j, j), wobei j ∈ M , jeweils eine Eins
und an den Q Positionen (M + q, M + q), wobei q ∈ Q, jeweils bM .
Da die Determinante einer Dreiecksmatrix gleich dem Produkt ihrer Diagonalelemente ist, folgt die behauptete Gleichung. Dass diese für den Fall von Matrizen über
29
2 Der Satz von Tarski-Seidenberg
Körpern allgemein bekannte Schlussfolgerung auch für Matrizen über kommutativen
Ringen mit Eins gilt, wird bei [Oel, S. 215] bewiesen.
Satz 2.1.13. Seien R ein kommutativer Ring mit Eins, M, Q ∈ N, b ∈ RM +1 h1i,
m ∈ RM h1i und q ∈ RQ h1i. Dann gilt m + b q ∈ RM +Q h1i und


M
m 
= m + b q,
b 
q
Q




(mi )i∈M 
m 
wobei mit 
der Vektor 
gemeint ist und mit der rechten Seite der
(qi )i∈Q
q
Gleichung der Vektor ((m + b q)i )i∈(M +Q) , eine Schreibweise, die durch Bemerkung
2.1.9 gerechtfertigt ist.
Beweis. Es gilt m+b q ∈ RM +Q h1i, weil für alle α ∈ N mit α ≥ M +Q der Koeffizient
X
bβ
qγ
β+γ=α
|{z}
|{z}
(m + b q)α = mα +
|{z}
=0
(=0 für β>M ) (=0 für γ≥Q)
{z
|
}
=0
verschwindet.



mk +
X
M
m 
=
Für alle i ∈ M + Q gilt  b 
q
Q
i
M
b
Q
X
k∈M
1M (i) mi +
X
k∈Q
i,k
M
b
Q
qk =
i,(M +k)
1M +1 (M + i − (M + k)) bM +i−(M +k) qk =
k∈Q
mi +
X
1M +1 (i − k) bi−k qk =
k∈Q
mi +
X
bi−k qk = mi +
k∈Q
i−k∈M +1
was die behauptete Gleichung zeigt.
30
X
α+β=i
bα qβ = (m + b q)i ,
2.1 Polynomdivision über Ringen
Definition 2.1.14. Seien R ein kommutativer Ring mit Eins, M, Q ∈ N,
a ∈ RM +Q h1i und b
∈
RM +1 h1i. Dann seien die beiden Polynome
modM,Q (a, b) ∈ RM h1i und quoM,Q (a, b) ∈ RQ h1i durch das Matrix-Vektor-Produkt




M
modM,Q (a, b) 

:= Adj  b  a
quoM,Q (a, b)
Q
definiert, wobei in der Gleichung, wie in Satz 2.1.13 unter Berufung auf 2.1.9, das
Polynom a als Vektor aus RM +Q , das Polynom modM,Q (a, b) als Vektor aus RM und
das Polynom quoM,Q (a, b) als Vektor aus RQ aufgefasst werden.
Satz 2.1.15. Seien R ein kommutativer Ring mit Eins, M, Q ∈ N, a ∈ RM +Q h1i
und b ∈ RM +1 h1i. Dann gilt
bM Q a = modM,Q (a, b) + b quoM,Q (a, b) ,
d. h. das Q-mal mit dem höchsten11 Koeffizienten von b multiplizierte Polynom a ist
wie bei der Polynomdivision in Polynomringen über Körpern zerlegbar.
Beweis.


modM,Q (a, b) + b quoM,Q (a, b)


=
Satz 2.1.13
M
modM,Q (a, b) 
=
b 
Definition 2.1.14
quoM,Q (a, b)
Q


M
M
M
=
bM Q a.
b Adj  b  a = det  b  a
Satz 2.1.7
Satz 2.1.12
Q
Q
Q
Lemma 2.1.16. Seien n ∈ N, R ein kommutativer Ring mit Eins, M, Q ∈ N,
a ∈ (Rhni)M +Q h1i, b ∈ (Rhni)M +1 h1i und x ∈ Rn . Dann gilt12
modM,Q (ax̂ , bx̂ ) = (modM,Q (a, b))x̂ ,
d. h. von Division gefolgtes Einsetzen und von Einsetzen gefolgte Division liefern das
selbe Ergebnis, was, wie auf Seite 25 erwähnt, bei gewöhnlicher Polynomdivision nicht
der Fall ist.
11
Oder besser gesagt: mit dem M -ten Koeffizienten von b multiplizierte Polynom (denn b muss
nicht Höchstgrad haben).
12
Die Schreibweise px̂ für Polynome p ∈ (Rhni)h1i und Vektoren x ∈ Rn wird in Definition 1.1.8
auf Seite 12 eingeführt.
31
2 Der Satz von Tarski-Seidenberg
Beweis. Aus Lemma 1.1.9 auf Seite 12 ist bekannt, dass die Operationen Addition
und Multiplikation mit dem Einsetzen vertauschen.
Die Koeffizienten des Polynoms modM,Q (ax̂ , bx̂ ) bzw. modM,Q (a, b) gehen zum einen
aus den Koeffizienten des Polynoms bx̂ bzw. b durch von den Werten dieser KoefM
M
fizienten unabhängige Anordnung in der Matrix
bx̂ bzw.
b und UnterQ
Q
determinantenbildung bei Bildung der Adjunktenmatrix und zum anderen aus den
Koeffizienten des Polynoms ax̂ bzw. a durch von den Werten dieser Koeffizienten unabhängige Anordnung in einem Vektor und anschließende Multiplikation desselben
mit der Matrix hervor.
In der Bildungsvorschrift tauchen also ausschließlich Additionen und Multiplikationen auf, woraus mit Lemma 1.1.9 die behauptete Gleichung folgt.
Kriterium 2.1.17. Seien R ein kommutativer Ring mit Eins, a ∈ Rh1i und z ∈ R.
Dann ist das Polynom13 1{1} − z1{0} genau dann ein Teiler von a, wenn â (z) = 0.
Beweis. Für Polynome über Körpern beweist man dieses Kriterium mit Polynomdivision. Mit Satz 2.1.15 führt die selbe Beweisidee auch hier zum Ziel:
Sei 1{1} − z1{0} ein Teiler von a. Dann gibt es q ∈ Rh1i mit a = 1{1} − z1{0} q.
d
Damit gilt â (z) = 1d
{1} (z) − z 1{0} (z) q̂ (z) = z − z = 0. Die Notwendigkeit ist
damit gezeigt.
Sei nun umgekehrt â (z) = 0. Mit M := 1 gilt b := 1{1} − z1{0} ∈ RM +1 h1i. Es gibt
Q ∈ N, sodass a
∈
RM +Q h1i. Nach Definition 2.1.14 gilt dann
modM,Q (a, b) ∈ RM h1i = R1 h1i. Deshalb gilt
\
(modM,Q (a, b))0 = mod\
M,Q (a, b) (z) + b̂ (z)quoM,Q (a, b)
| {z }
=
Satz 2.1.15
bM Q â (z) = 0.
=0
Also gilt modM,Q (a, b)
=
0 und erneut mit Satz 2.1.15 gilt bM Q a
=
| {z }
=1
modM,Q (a, b) + b quoM,Q (a, b), d. h. b = 1{1} − z1{0} teilt a wie behauptet.
|
13
{z
=0
}
Mit 1{0} und 1{1} sind hier wie in Fußnote 1 auf Seite 25 die entsprechenden Indikatorfunktionen
von N nach R gemeint. Diese sind wegen ihres endlichen Trägers Polynome. Die dem Polynom
1{1} −z1{0} zugeordnete Polynomfunktion ist gleich R 3 r 7→ r1 −zr0 , d. h. gleich R 3 r 7→ r −z.
32
2.2 Das Reduktionslemma
2.2 Das Reduktionslemma
Weil wir zum Beweis des Satzes von Tarski-Seidenberg Zusammenfassungen mehrerer
Polynome zu einem Objekt verwenden, wird in der folgenden Definition festgelegt,
was wir unter einem Vektor von Polynomen verstehen.
Definition 2.2.1. Sei R ein kommutativer Ring mit Eins. Ein Vektor14 v heißt
Polynomvektor über R, wenn seine Komponenten Polynome über R in einer Variablen
sind, d. h. wenn15 v [N] ⊆ Rh1i. Für die Menge der Polynomvektoren über R gilt16
{v; v Polynomvektor über R} = ∪ Rh1i[N] .
Polynomvektoren über R nennen wir reelle Polynomvektoren.
Wir werden jetzt Funktionen redkµ mit gewissen Parametern µ und k erklären, die
gewissen Polynomvektoren über einem Ring R wieder Polynomvektoren zuordnen.
Der letztendliche Nutzen dieser Funktionen besteht grob gesprochen darin, dass man
die Häufigkeit von Polynomvektoren (die Häufigkeit eines Polynomvektors ist eine
Größe, die in Abschnitt 2.3 in Definition 2.3.2 auf Seite 52 definiert werden wird; sie
ist ein Maß für den Grad seiner Polynome) beliebig vermindern kann, wenn man die
Funktionen redkµ nur oft und geschickt genug auf sie anwendet. Man nimmt dabei
in Kauf, dass jede Anwendung mit einer Verdoppelung der Anzahl der Polynomvektorkomponenten einhergeht. Da der Schlüssel zur Gradverminderung die Differentiation sein wird, definieren wir zuerst die Differentiation von Polynomen.
Definition 2.2.2. Sei R ein kommutativer Ring mit Eins. Dann sei [N, R] ∈ RN die
rekursiv durch [N, R] (0) := 0 ∈ R und [N, R] (n + 1) := [N, R] (n) + 1 ∈ R definierte
Folge. Das Ringelement [N, R] (n) erhält man also grob gesagt dadurch, dass man die
14
Der Begriff Vektor wird in Definition 2.1.1 auf Seite 26 eingeführt.
Die Bezeichnung Rhni wird in Definition 1.1.2 auf Seite 9 definiert, die Bezeichnung r [M ] für den
Nachbereich einer Menge M unter einer Relationen r in Fußnote 3 auf Seite 9.
16
Es ist üblich, die Menge der auf einer Menge d definierten Funktionen
mit Werten
in einer Menge
r durch rd zu bezeichnen. Sind D und r Mengen, so sei r[D] := rd ; d ∈ D . Diese Schreibweise
lehnt sich an die in Fußnote 3 auf Seite 9 eingeführte Bezeichnung für den Nachbereich
von
Mengen unter Relationen an. Fasst man nämlich r als die Funktion D 3 d 7→ rd auf, so erklärt
sich die gerade eingeführte Schreibweise r[D] von selbst. Im Fall D = N ist damit zum Beispiel
∪ r[N] = ∪ {rz ; z ∈ N}die Menge
der Vektoren mit Komponenten aus r. Die auf dieser Seite
15
auftauchende Menge ∪ Rh1i
[N]
z
ist also gleich ∪ {Rh1i ; z ∈ N}.
33
2 Der Satz von Tarski-Seidenberg
Eins des Rings n-mal gemäß 1| + .{z
. . + 1} addiert. Wenn aus dem Zusammenhang klar
n-mal
ist, was gemeint ist, werden wir anstelle von [N, R] (n) auch oft n schreiben.
Definition 2.2.3. Sei R ein kommutativer Ring mit Eins und p ∈ Rh1i. Dann sei
die Ableitung ∂p von p definiert als das Polynom
∂p := ((α + 1) pα+1 )α∈N .
Mit den Faktoren (α + 1) sind dabei die soeben definierten Ringelemente [N, R] (α + 1)
gemeint.
Satz 2.2.4. Für p ∈ Rh1i gilt17
c = ∂ p̂,
∂p
das heißt im Falle reeller Koeffizienten ist die der Ableitung eines Polynoms p zugeordnete Polynomfunktion gleich der Ableitung der diesem Polynom zugeordneten
Polynomfunktion.
Beweis. Es gilt

∂ p̂
=
Definition 1.1.4 auf Seite 10


R
3 x 7→

∂ R 3 x 7→
α∈spt(p)


αpα xα−1  = R 3 x 7→
X
X
(α + 1) pα+1 xα  =
α+1∈spt(p)
α∈spt(p)


R
p α xα  =
X
3 x 7→
X
c
(∂p)α xα  = ∂p.
α∈spt(∂p)
Lemma 2.2.5. Seien n ∈ N, R ein kommutativer Ring mit Eins, p ∈ (Rhni)h1i und
x ∈ Rn . Dann gilt18
∂ (px̂ ) = (∂p)x̂ ,
d. h. von Differentiation gefolgtes Einsetzen und von Einsetzen gefolgte Differentiation liefern das selbe Ergebnis.
17
Die Schreibweise p̂ für die einem Polynom p zugeordnete Polynomfunktion wird in Definition 1.1.4
auf Seite 10 eingeführt.
18
Die Schreibweise px̂ für Polynome p ∈ (Rhni)h1i und Vektoren x ∈ Rn wird in Definition 1.1.8
auf Seite 12 eingeführt.
34
2.2 Das Reduktionslemma
Beweis. Für alle α ∈ N gilt
(∂ (px̂ ))α = (α + 1) (px̂ )α+1 = (α + 1) pd
α+1 (x) =
d (x) = ((∂p) ) .
\
(α +
1) pα+1 (x) = ∂p
α
x̂ α
Definition 2.2.6. Ein Vektor µ heißt Multiindex, wenn seine Komponenten natürliche Zahlen sind, d. h. wenn µ [N] ⊆ N.
Definition 2.2.7. Sei R ein kommutativer Ring mit Eins und µ ein Multiindex.
Dann sei19
n
o
Rµ h1i := v ∈ (Rh1i)µ ; ∀i ∈ µ : vi ∈ Rµi h1i
die Menge aller µ-komponentigen Polynomvektoren v über R, sodass für alle Indizes
i ∈ v der Grad des Polynoms vi kleiner als µi ist20 .
Für k ∈ µ sei
ek :=



 1


0

, wenn i = k 
, wenn i 6= k

und daher µ + 1 + ek =
i∈µ



 µi


µi

+ 2 , wenn i = k 
+ 1 , wenn i 6= k
.

i∈µ
Definition 2.2.8. Für einen kommutativen Ring R mit Eins, einen Multiindex µ
und k ∈ µ derart, dass (µ + 1 + ek )k = max (µ + 1 + ek ) sei zunächst
diff kµ
:= Rµ+1+ek h1i 3 v 7→


∂vk


vi
, wenn i = k
, wenn i 6= k

!
∈ Rµ+1 h1i

i∈µ
die Funktion, die die k-te Komponente eines Polynomvektors aus Rµ+1+ek h1i differenziert und die anderen Komponenten unverändert lässt.
Zudem sei21
restkµ := Rµ+1+ek h1i 3 v 7→ modµi ,µk −µi +2 vk , diff kµ (v)i
i∈µ
∈ Rµ h1i
die Funktion, die die i-te Komponente eines Polynomvektors v aus Rµ+1+ek h1i durch
den Rest bei Division der k-ten Komponente durch diff kµ (v)i ersetzt.
19
Die Definition von RK h1i steht unter 2.1.8 auf Seite 28.
Oder anders gesagt: die Koeffizientenzahl des Polynoms vi kleiner gleich µi ist (siehe Definition 1.1.6 auf Seite 11).
21
Die Definition von modM,Q (a, b) findet sich unter 2.1.14 auf Seite 31.
20
35
2 Der Satz von Tarski-Seidenberg
Im Anschluss an diese Definition folgt der Beweis, dass restkµ richtig definiert wurde,
d. h. dass für alle auftretenden µ, k, v und i der Ausdruck modµi ,µk −µi +2 vk , diff kµ (v)i
erstens Sinn macht und zweitens Element von Rµi h1i ist.
Schließlich sei


redkµ
:=



Rµ+1+ek h1i




diff kµ (v) 
3 v 7→ 
∈ R
k
restµ (v)

µ+1


 h1i




µ
die Funktion, deren Definition auf Seite 33 angekündigt wurde.
Beweis. Wir überzeugen uns jetzt wie angekündigt davon, dass die Funktion restkµ
richtig definiert wurde. Seien dazu µ ein Multiindex, k ∈ µ mit (µ + 1 + ek )k =
max (µ + 1 + ek ), v ∈ Rµ+1+ek h1i und i ∈ µ. Nach Definition 2.1.14 auf Seite 31
ist modM,Q (a, b) für M, Q ∈ N, a ∈ RM +Q [1] und b ∈ RM +1 [1] definiert. In
unserem Fall, nämlich dem Fall modµi ,µk −µi +2 vk , diff kµ (v)i , gilt M = µi ∈ N,
Q = µk − µi + 2
≥
1, a = vk ∈ Rµk +2 h1i = RM +Q h1i und
(µ+1+ek )k =max(µ+1+ek )
diff kµ
(v)i ∈ Rµi +1 h1i = RM +1 h1i. Die Wahl der Parameter und Argumente für
b=
modM,Q (a, b)
ist
also
gültig.
Es
bleibt
zu
zeigen,
dass
k
modµi ,µk −µi +2 vk , diff µ (v)i ∈ Rµi h1i. Dies sieht man schnell, da M = µi und wir
aus Definition 2.1.14 auf Seite 31 wissen, dass modM,Q (a, b) ∈ RM h1i.
Die Namen der soeben definierten Funktionen sollen daran erinnern, dass diff kµ etwas
mit Differentiation, restkµ etwas mit dem Rest bei Division und redkµ etwas mit der
Verminderung des Grads (Reduktion) zu tun hat.
Jetzt erklären wir eine in Abschnitt 1.1 für Polynome definierte Schreibweise auch
für Polynomvektoren.
Definition 2.2.9. Seien n ∈ N, R ein kommutativer Ring mit Eins,
v ∈ ∪ (Rhni)h1i[N] und x ∈ Rn . Dann sei22
vx̂ := ((vi )x̂ )i∈v ∈ Rh1iv
22
Die Schreibweise px̂ für Polynome p ∈ (Rhni)h1i und Vektoren x ∈ Rn wird in Definition 1.1.8
auf Seite 12 eingeführt.
36
2.2 Das Reduktionslemma
der aus dem Polynomvektor v durch komponentenweises Einsetzen von x in die Koeffizientenpolynome der Komponentenpolynome hervorgehende Polynomvektor.
Lemma 2.2.10. Seien n ∈ N, R ein kommutativer Ring mit Eins, µ ein Multiindex, k ∈ µ derart, dass (µ + 1 + ek )k = max (µ + 1 + ek ), v ∈ (Rhni)µ+1+ek h1i und
x ∈ Rn . Dann gilt
redkµ (vx̂ ) = redkµ (v) ,
x̂
d. h. von Reduktion gefolgtes Einsetzen und von Einsetzen gefolgte Reduktion liefern
das selbe Ergebnis.
Beweis. Da
diff kµ (vx̂ )
=
mit Lemma 2.2.5 auf Seite 34
diff kµ (v)
x̂
und damit auch
restkµ (vx̂ ) = modµi ,µk −µi +2 (vx̂ )k , diff kµ (vx̂ )i
modµi ,µk −µi +2 (vk )x̂ ,
modµi ,µk −µi +2 vk , diff kµ (v)i
diff kµ
x̂ i∈µ
(v)
=
x̂i
=
=
i∈µ Lemma 2.1.16 auf Seite 31
i∈µ
modµi ,µk −µi +2 vk , diff kµ (v)i
restkµ (v)
x̂
i∈µ
=
x̂
,
gilt


 
k
diff kµ (vx̂ )   diff µ (v) x̂  k
k

(v)
redµ (vx̂ ) =
=
=
red
.
µ
x̂
restkµ (vx̂ )
restkµ (v)
x̂
Wir wenden uns jetzt dem Spezialfall reeller Polynomvektoren zu.
Definition 2.2.11. Sei v ein reeller Polynomvektor. Die Menge der isolierten Nullstellen aller seinen Polynomen zugeordneten Polynomfunktionen bezeichnen wir mit
IN (v) := ∪ {x ∈ R; vi 6= 0, v̂i (x) = 0} .
i∈v
Die Menge IN (v) ist endlich.
Wir wollen diese Nullstellen durchnummerieren. Es gibt genau eine monotone Bi-
37
2 Der Satz von Tarski-Seidenberg
jektion von23 #IN (v) + 2 nach {−∞} ∪ IN (v) ∪ {∞}. Dieser geben wir den Namen in (v). Damit gilt in (v)0 = −∞, IN (v) = {in (v)n ; 1 ≤ n ≤ #IN (v)} und
in (v)#IN(p)+1 = ∞.
Die isolierten Nullstellen von v zerschneiden die reelle Achse in #IN (v)+1 Intervalle.
Diese seien für n ∈ #IN (v) + 1 durch
i
I (v)n := in (v)n , in (v)n+1
h
bezeichnet.
In der folgenden Definition wird festgelegt, auf welche Weise man einem reellen Polynomvektor eine sein Vorzeichenverhalten beschreibende Matrix24 zuordnet.
Definition 2.2.12. Es sei25
[N]
SGN := ∪ Rh1i
!
3 v 7→ SGN (v) ,
wobei
!
SGN (v) := SGN (v)i,j ∈ {−1, 0, 1}
,
(i,j)∈v×(2 #IN(v)+1)
wobei wiederum26




j+1
(v)
sgn
v̂
in
i


2

, wenn j ungerade
SGN (v)i,j := 




sgn v̂i in (v) j
−
, wenn j gerade.
+1
2
Für Matrizen A führen wir jetzt zusätzlich zu den Schreibweisen A und |A| für Zeilenund Spaltenzahl von A die Bezeichnung kAk ein.
Definition 2.2.13. Ist A eine Matrix, so sei
kAk :=
|A| − 1
.
2
23
Für eine endliche Menge E steht #E für die Zahl ihrer Elemente. Aufgrund von Bemerkung 1.1.1
ist #IN (v) + 2 die Menge der natürlichen Zahlen kleiner als #IN (v) + 2.
24
Der Begriff Matrix und die Notationen für die Zeilen- und Spaltenzahl einer Matrix werden in
Definition 2.1.2 auf Seite 26 festgelegt.
25
[N]
n
Der in Fußnote 16 auf Seite 33 getroffenen Festlegung zufolge ist ∪ Rh1i
= ∪ {Rh1i ; n ∈ N}
die Menge der reellen Polynomvektoren.
26
Die Schreibweise sgn (x) für reelle Zahlen x ∈ R wird in Definition 1.2.1 auf Seite 13 eingeführt.
38
2.2 Das Reduktionslemma
Warum wir kAk die Anzahl der Nullstellen von A nennen, leuchtet mit folgender
Bemerkung ein.
Bemerkung 2.2.14. Für alle reellen Polynomvektoren v 6= ∅ gilt per Definition
kSGN (v)k = #IN (v).
Bemerkung 2.2.15. Ist v ein reeller Polynomvektor, so gilt für alle i ∈ v und alle
n ∈ #IN (v) + 1 die Gleichung27
SGN (v)i,2n =∈ (sgn [v̂i [I (v)n ]]) ,
weil v̂i sein Vorzeichen in I (v)n nicht wechselt.
Über die Einträge der Matrix SGN (v) kann man also sagen, dass die Einträge
SGN (v)i,2n−1 für i ∈ v und 1 ≤ n ≤ #IN (v)
das Vorzeichen von v̂i an Punkten der reellen Achse und die Einträge
SGN (v)i,2n für i ∈ v und n ∈ #IN (v) + 1
das Vorzeichen von v̂i auf Intervallen der reellen Achse angeben.
Definition 2.2.16. Eine Matrix A nennen wir Vorzeichenmatrix, wenn es einen
reellen Polynomvektor v mit A = SGN (v) gibt.
Definition 2.2.17. Für einen Multiindex µ und k ∈ µ derart, dass (µ + 1 + ek )k =
max (µ + 1 + ek ), sei Pkµ die Menge der reellen Polynomvektoren aus Rµ+1+ek h1i,
deren Komponenten Höchstgrad haben, d. h.
Pkµ := Rµ+1+ek h1i \Rµ+ek h1i .
Überraschenderweise ist die Bestimmung des Vorzeichenverhaltens eines Polynomvektors aus Pkµ bereits bei alleiniger Kenntnis des Vorzeichenverhaltens des ihm durch
redkµ zugeordneten Polynomvektors möglich. Diese Tatsache ist Inhalt des nächsten
Satzes.
27
Ist E eine einelementige Menge, so wird mit ∈ (E) ihr Element bezeichnet.
39
2 Der Satz von Tarski-Seidenberg
Lemma 2.2.18 (Reduktionslemma). Für alle Multiindizes µ und alle k ∈ µ derart,
dass (µ + 1 + ek )k = max (µ + 1 + ek ), ist die Relation
REDkµ :=
n
linkseindeutig28 , d. h. REDkµ
SGN (v) , SGN redkµ (v)
−1
; v ∈ Pkµ
o
ist eine Funktion.
Beweis. Sei µ ein Multiindex und k ∈ µ derart, dass (µ + 1 + ek )k = max (µ + 1 + ek ).
Wir geben jetzt ein Verfahren an, das jeder Vorzeichenmatrix29 R ∈ R REDkµ , d. h.
jeder Vorzeichenmatrix, die durch Anwendung von redkµ und anschließender Anwendung von SGN aus einem Element von Pkµ hervorgehen kann, eine Vorzeichenmatrix V zuordnet. Zugleich beweisen wir, dass für jede vorgegebene Vorzeichenmatrix
R ∈ R REDkµ die aus ihr auf die noch anzugebende Weise konstruierte Vorzeichenmatrix V folgende Eigenschaft besitzt:
Für alle v ∈ Pkµ mit SGN redkµ (v) = R gilt SGN (v) = V .
(2.1)
Gelingt uns dies, ist Lemma 2.2.18 bewiesen und für jede Vorzeichenmatrix
R ∈ R REDkµ
und die aus ihr bestimmte Vorzeichenmatrix V gilt
REDkµ
−1
(R) = V .
Sei also R ∈ R REDkµ und (zum Zwecke des Nachweises von 2.1) v ∈ Pkµ , sodass
SGN redkµ (v) = R.
Erster Teil des Beweises: Vereinfachende Festlegungen
Die Zeilenzahlen von R und v stehen bereits fest: Weil v ∈ Pkµ , gilt v = µ und damit
R = SGN redkµ (v) = redkµ (v) =2 · v = 2 · µ.
Zur Vereinfachung der Bezeichnungen im Laufe des Beweises treffen wir folgende
Festlegungen:
Sei N := kRk die Anzahl der Nullstellen von R.
28
Aufgrund von Fußnote 3 auf Seite 9 kann man schon erahnen, was der Begriff
linkseindeutig bedeutet: Eine Relation r heißt linkseindeutig, wenn sie die Aussage
∀a, b, y : ((a, y) ∈ r ∧ (b, y) ∈ r ⇒ a = b) erfüllt.
29
Die Schreibweise R (r) für den Nachbereich einer Relation r wird in Fußnote 3 auf Seite 9 definiert.
40
2.2 Das Reduktionslemma
Seien D und M die beiden Vorzeichenmatrizen,
die der oberen und unteren Hälfte


D 
von R entsprechen, d. h. es gelte R = 
mit D = M = µ.
M
Sei r := redkµ (v) und x := in (r) die Nummerierung der isolierten Nullstellen von r.
Seien d und m die beiden Polynomvektoren,
die der oberen und unteren Hälfte von


d 
r entsprechen, d. h. es gelte r = 
mit d = m = µ.
m
Bemerkung. Von den gerade getroffenen Festlegungen sind N , D und M diejenigen,
die Teil des Verfahrens zur Bestimmung von V sind. Sie lassen sich allein aus der
Vorzeichenmatrix R bestimmen.
Zweiter Teil des Beweises: Die Nummerierung ν
Da SGN (r) = R, gelten für alle i ∈ µ und alle 1 ≤ n ≤ N die Gleichungen
sgn d̂i (xn ) = Di,2n−1 und
(2.2)
sgn (m̂i (xn )) = Mi,2n−1 .
(2.3)
Weil v ∈ Pkµ , ist das Polynom vk vom Grad µk +1 und sind für i ∈ µ\ {k} die anderen
Polynome vi vom Grad µi . Also ist das Polynom ∂vk = diff kµ (v)k = dk vom Grad
µk und sind für i ∈ µ\ {k} die anderen Polynome vi = diff kµ (v)i = di vom Grad µi .
Zusammenfassend ist für sämtliche Indizes i ∈ µ das Polynom di vom Grad µi . Für
jeden Index i ∈ µ können wir das Vorzeichen des höchsten Koeffizienten (di )µi 6= 0
von di aus der Vorzeichenmatrix D wie folgt bestimmen:
Im Intervall I (r)N = ]xN , xN +1 [ = ]xN , ∞[ hat d̂i das Vorzeichen Di,2N . Zur späteren
Verwendung halten wir fest, dass daher
∀i ∈ µ :
sgn (di )µi = Di,2N .
(2.4)
Das Vorzeichen des höchsten Koeffizienten (vk )µk +1 des Polynoms vk ist gleich dem
Vorzeichen des höchsten Koeffizienten (∂vk )µk = (dk )µk seiner Ableitung ∂vk . Ebenfalls zur späteren Verwendung halten wir fest, dass damit
sgn (vk )µk +1 = Dk,2N .
(2.5)
41
2 Der Satz von Tarski-Seidenberg
Als Nächstes werden wir das Vorzeichen von vˆk an den durch die Menge
Γ := ∪ {n ∈ N; 1 ≤ n ≤ N ∧ Di,2n−1 = 0}
i∈µ
gegebenen Stellen {xn ; n ∈ Γ} bestimmen. Sei G := #Γ. Dann gibt es genau eine
monotone Bijektion ν von G + 2 nach {0} ∪ Γ ∪ {N + 1}. Das Hinzufügen von 0 und
N + 1 zum Wertebereich hat zur Folge, dass xν0 = −∞ und xνG+1 = ∞.
Bemerkung. Von den im zweiten Teil des Beweises eingeführten Objekten sind Γ, G
und ν diejenigen, die Teil des Verfahrens zur Bestimmung der Vorzeichenmatrix V
sind. Es ist wichtig zu bemerken, dass auch für ihre Definition nur die Vorzeichenmatrix R (wenn auch nicht direkt) verwendet wurde.
Zur Verwendung innerhalb des Beweises führen wir Abkürzungen für die G + 1 Intervalle ein, in die die reelle Achse von den Punkten {xn ; n ∈ Γ} zerschnitten wird:
i
h
Für g ∈ G + 1 sei Ig := xνg , xνg+1 .
Für alle i ∈ µ und alle g ∈ G + 1
wechselt d̂i im Intervall Ig das Vorzeichen nicht,
(2.6)
weil aufgrund von 2.2 und der Definition von Γ sämtliche Nullstellen von d̂i Elemente
von {xn ; n ∈ Γ} sind.
Sei 1 ≤ g ≤ G. Dann gibt es einen Zeilenindex i ∈ µ mit Di,2νg −1 = 0. Wegen 2.2 gilt
für diesen Zeilenindex auch d̂i xνg = 0.
Aus Satz 2.1.15 auf Seite 31 ergibt sich zuerst die Gleichung
(di )µi µk −µi +2 vk = modµi ,µk −µi +2 (vk , di ) + di quoµk ,µk −µi +2 (vk , di ) ,
die sich wegen Definition 2.2.8 auf Seite 35 zu
(di )µi µk −µi +2 vk = mi + di quoµk ,µk −µi +2 (vk , di )
umformen lässt. Wegen Satz 1.1.5 auf Seite 11 gilt die Gleichung auch für die zugeordneten Polynomfunktionen. Nach Einsetzen von xνg ergibt sich
(di )µi µk −µi +2 vˆk xνg = m̂i xνg + d̂i xνg quoµk ,µk\
−µi +2 (vk , di ) xνg = m̂i xνg .
|
42
{z
=0
}
2.2 Das Reduktionslemma
Durch beidseitige Anwendung von sgn erhält man
sgn (di )µi
µk −µi
sgn vˆk xνg
= sgn m̂i xνg
und mit 2.4 und 2.3 folgert man
sgn vˆk xνg
= sgn (di )µi
µk −µi
sgn m̂i xνg
= (Di,2N )µk −µi Mi,2νg −1 .
(2.7)
Wir interessieren uns auch für das Vorzeichen von vˆk für sehr kleine und sehr große
Argumente. Zur Abkürzung innerhalb des Beweises sei
sgn (vˆk (−∞)) := lim sgn (vˆk (ξ)) und sgn (vˆk (∞)) := lim sgn (vˆk (ξ)) .
ξ→−∞
ξ→∞
Der Zugewinn durch diese Abkürzungen erscheint auf den ersten Blick sehr klein –
man beachte jedoch, dass ihre Einführung dazu führt, dass der Ausdruck sgn (vˆk (xn ))
auch für n ∈ {0, N } Sinn ergibt.
Da das Vorzeichen von Polynomen für sehr kleine und sehr große Argumente allein
durch ihren Grad und das Vorzeichen des höchsten Koeffizienten bestimmt sind,
ergibt sich mit 2.5, dass
sgn (vˆk (−∞)) = (vk )µk +1 (−1)µk +1 = (−1)µk +1 Dk,2N und
sgn (vˆk (∞)) = (vk )µk +1 = Dk,2N .
Dritter Teil des Beweises: Die Nummerierung γ
Jetzt haben wir alles beisammen, um den nächsten Schritt im Verfahren zur Bestimmung von V nachvollziehbar zu machen:
Wir definieren K ∈ {−1, 0, 1}G+2 durch
K :=


µ +1

(−1) k Dk,2N = sgn (vˆk (−∞))




µ −µ
 (Di,2N ) k i Mi,2νg −1 = sgn vˆk xνg

mit 2.7




Dk,2N = sgn (vˆk (∞))

für g = 0
für 1 ≤ g ≤



G


für g = G + 1
, (2.8)
g∈G+2
43
2 Der Satz von Tarski-Seidenberg
wobei im Fall 1 ≤ g ≤ G der Zeilenindex i ∈ µ ein beliebiger Zeilenindex mit
Di,2νg −1 = 0 sei. Die zur Definition herangezogene rechte Seite der Gleichung 2.7
hängt dann, da sie gleich der linken Seite der Gleichung 2.7 ist, nicht von der Wahl
des Zeilenindex i ∈ µ mit Di,2νg −1 = 0 ab.
Mit den bisherigen Überlegungen können wir einige der Nullstellen von vˆk aus den
Kg auf folgende Weise ablesen: Gilt Kg = 0, so ist xνg eine Nullstelle von vˆk . Die
zusätzliche Bestimmung der verbleibenden Nullstellen von vˆk ist Inhalt dieses Teils
des Beweises.
Für alle g ∈ G + 1 überlegt man sich Folgendes: Weil ∂vk = dk und weil dˆk wegen 2.6
im Intervall Ig das Vorzeichen nicht wechselt, ist vˆk monoton in Ig . Weil dˆk wegen30
deg dk = µk ∈ N nicht das Nullpolynom ist, ist vˆk sogar streng monoton in Ig . Wir
schlussfolgern, dass vˆk im Intervall Ig
1. für den Fall Kg · Kg+1 = −1 genau eine Nullstelle, die wir mit zg bezeichnen,
und
2. für den Fall Kg · Kg+1 6= −1 keine Nullstelle besitzt.
Auf die Lage der Zwischen-Nullstelle zg bezüglich etwaiger xn ∈ Ig können wir nicht
schließen (zg < xn , zg = xn oder zg > xn sind möglich31 ), dies stellt jedoch kein
Problem dar.
In der Absicht, sämtliche isolierte Nullstellen des Polynomvektors v zu indizieren,
gehen wir zunächst folgendermaßen vor:
30
Die Bezeichnung deg p für den Grad eines Polynoms p in einer Variablen wird in Definition 1.1.6
auf Seite 11 eingeführt.
31
Folgendes Beispiel zeigt die drei Möglichkeiten: Sei µ := (2)i∈1 , k := 0, α ∈ ]−2, 2[
und v := 1{3} − 3 · 1{1} + α1{0} i∈1 ∈ Pkµ . Durch Rechnung ergibt sich r = redkµ (v) =
3 · 1{2} − 3 · 1{0}
. Die Nullstellen von rb0 lauten −1 und 1 und die Nullstelle von rb1
−18 · 1{1} + 9α1{0}
α
ist α2 ∈ ]−1, 1[. Also gilt IN (r) = −1, α2, 1 , N = 3 und x = in (r) = −∞,
−1, 2 , 1, ∞ .
1 0 −1 −1 −1 0
1
Unabhängig von α gilt R = SGN (r) =
. Es ergibt sich
1 1 1
0 −1 −1 −1
Γ = {1, 3}, G = 2 und ν = (0, 1, 3, 4). Im nächsten Schritt gilt K = (−1, 1, −1, 1). Wegen
K1 · K2 = −1 besitzt vbk im Intervall I1 = ]xν1 , xν2 [ = ]x1 , x3 [ = ]−1, 1[ genau eine Nullstelle
3
z1 . Auch x2 liegt in I1 . Weil vbk (x1 ) > 0, vbk (x3 ) < 0 und vbk (x2 ) = vbk α2 = α8 − 3 α2 + α =

> 0 für α < 0

α
2
8 α − 4 = 0 für α = 0 , liegt x2 für α < 0 rechts von z1 , für α = 0 bei z1 und für α > 0

< 0 für α > 0
links von z1 .
44
2.2 Das Reduktionslemma
Sei
n
o
Σ := 1 ≤ g ≤ G; Kg = 0 oder ∃i ∈ µ\ {k} : Di,2νg −1 = 0 ∪
{g + 12 ; g ∈ G + 1, Kg · Kg+1 = −1} .
Mit S := #Σ gibt es genau eine monotone Bijektion γ von S + 2 nach
{0} ∪ Σ ∪ {G + 1}.
Zur Verbesserung der Lesbarkeit bei dreifacher Indizierung schreiben wir für s ∈ Σ∩N
anstelle von νγs im Rest des Beweises32 ν · γs .
Das Hinzufügen von {0} und {G + 1} zum Wertebereich hat zur Folge, dass
xν·γ0 = −∞ und xν·γS+1 = ∞.
Bemerkung. Zu den im Verfahren zur Bestimmung von V verwendeten Größen sind
im dritten Teil des Beweises die Größen K, Σ, S und γ hinzugekommen. Auch zu ihrer
Definition wurden ausschließlich Größen verwendet, die aus der Vorzeichenmatrix R
abgeleitet sind.
Vierter Teil des Beweises: Die Nummerierung y
Für s ∈ S + 2 setzen wir


xν·γ
ys := 

, wenn γs ∈ N
s
zγs − 1
2
.
, wenn γs ∈
/N
Diese Definition ist korrekt, weil für γs ∈
/ N die Zwischen-Nullstelle zγs − 1 von vˆk we2
gen Kγs − 1 · Kγs + 1 = −1 existiert. Die auf diese Weise erhaltene Funktion
2
2
y ∈ ({−∞} ∪ R ∪ {∞})S+2 ist injektiv.
Wir behaupten jetzt, damit bereits die isolierten Nullstellen von v indiziert zu haben:
Behauptung:
32
{ys ; 1 ≤ s ≤ S} = IN (v)
(2.9)
Wenn dabei · als die Verkettung ◦ von Funktionen aufgefasst wird, erklärt sich die Notation
ν · γs = (ν · γ)s von selbst. Allerdings ist dabei zu beachten, dass R (γ) wegen womöglicher
nichtnatürlicher Elemente von Σ nicht zwangsläufig Teilmenge von D (ν) ist, was Zweifel daran
wecken könnte, ob die Verkettung ν ◦ γ überhaupt definiert sei. Betrachtet man aber die Verkettung beliebiger Relationen a und b als durch b ◦ a := {(x, z) ; ∃y : ((x, y) ∈ a ∧ (y, z) ∈ b)}
definiert, so hat man kein Problem.
45
2 Der Satz von Tarski-Seidenberg
Wir beweisen jede Inklusion einzeln:
1. Die Richtung „⊆“:
Sei 1 ≤ s ≤ S. Dann unterscheiden wir drei Fälle.
a) Fall γs ∈ N und Kγs 6= 0:
Aufgrund der Definition von Σ gibt es i ∈ µ\ {k} mit Di,2(ν·γs )−1 = 0.
Damit gilt
sgn (v̂i (ys )) = sgn d̂i (ys ) = sgn d̂i (xν·γs )
i6=k
= Di,2(ν·γs )−1 = 0
mit 2.2
und weil vi 6= 0, gilt damit ys ∈ IN (v).
b) Fall γs ∈ N und Kγs = 0:
Weil sgn (vˆk (ys )) = sgn (vˆk (xν·γs ))
ys ∈ IN (v).
=
mit 2.8
Kγs = 0 und vk 6= 0, gilt
c) Fall γs ∈
/ N:
Dann ist ys = zγs − 1 eine Nullstelle von vˆk . Wegen vk 6= 0 gilt ys ∈ IN (v).
2
2. Die Richtung „⊇“:
Sei ξ ∈ IN (v). Dann gibt es i ∈ µ, sodass33 vi 6= 0 und v̂i (ξ) = 0. Wieder
unterscheiden wir drei Fälle:
a) Fall i 6= k:
Wegen vi = di gilt dann d̂i (ξ) = 0 und daher ξ ∈ IN (r). Also gibt es
1 ≤ n ≤ N mit xn = ξ. Wegen 2.2 gilt Di,2n−1 = sgn d̂i (xn ) = 0 und
daher n ∈ Γ. Das bedeutet, es gibt 1 ≤ g ≤ G mit νg = n.
Da Di,2νg −1 = 0 und i ∈ µ\ {k}, gilt g ∈ Σ ∩ N. Also gibt es 1 ≤ s ≤ S
mit γs = g.
Damit gilt ys = xν·γs = xνg = xn = ξ.
γs ∈N
b) Fall i = k und ∃1 ≤ g ≤ G : xνg = ξ :
Dann gilt Kg = sgn vˆk xνg = sgn (vˆk (ξ)) = 0 und daher g ∈ Σ ∩ N.
mit 2.8
Wie in Fall 2a gibt es damit 1 ≤ s ≤ S mit γs = g und es gilt ys =
γs ∈N
xν·γs = xνg = ξ.
33
vi 6= 0 gilt sowieso für alle i ∈ µ.
46
2.2 Das Reduktionslemma
c) Fall i = k und ∀1 ≤ g ≤ G : xνg 6= ξ :
Dann gibt es g ∈ G + 1 mit ξ ∈ Ig . Da vˆk im Intervall Ig höchstens eine
Nullstelle besitzt und ξ eine solche ist, gilt Kg · Kg+1 = −1 und zg = ξ.
Aus der Definition von Σ ergibt sich, dass g + 12 ∈ Σ.
Da es folglich 1 ≤ s ≤ S mit γs = g +
1
2
gibt, gilt ys = zγs − 1 = zg = ξ.
γs ∈N
/
2
Behauptung 2.9 ist bewiesen.
Weil zudem y0
=
γ0 =0∈N
xν·γ0 = −∞ und yS+1
=
γS+1 =G+1∈N
xν·γS+1 = ∞, folgt, dass y die
Nummerierung der isolierten Nullstellen von v ist:
in (v) = y
(2.10)
Wir sind jetzt an der Stelle angekommen, an der wir die Matrix V konkret konstruieren können.
Da wir wollen, dass V gleich SGN (v) ist (d. h., dass V die gewünschte Eigenschaft
2.1 erfüllt), setzen wir die Zeilenzahl von V gleich µ und die Anzahl der Nullstellen
von V aufgrund von eben Bewiesenem gleich S (d. h. die Zahl der Spalten von V
gleich 2S + 1).
Bis zum Ende des Beweises ist jetzt noch Folgendes zu tun: Die Einträge der Vorzeichenmatrix V müssen (unter alleiniger Verwendung von aus der Vorzeichenmatrix
R abgeleiteten Größen) mit Werten aus {−1, 0, 1} belegt werden und zugleich muss
bewiesen werden, dass diese Einträge gleich den Einträgen aus SGN (v) sind.
Wenn wir uns im fünften Teil des Beweises denjenigen Einträgen von V zuwenden,
die Punkten auf der reellen Achse entsprechen (d. h. Vi,2s−1 für i ∈ µ und 1 ≤ s ≤ S)
und dann im sechsten Teil des Beweises denjenigen, die Intervallen entsprechen (d. h.
Vi,2s für i ∈ µ und s ∈ S + 1), erreichen wir sämtliche Einträge von V .
Fünfter Teil des Beweises: Einträge von V , die Punkten auf der reellen Achse
entsprechen
Sei i ∈ µ und 1 ≤ s ≤ S.
Dann gilt
SGN (v)i,2s−1
=
Def. 2.2.12 auf Seite 38
sgn (v̂i (in (v)s ))
=
mit 2.10
sgn (v̂i (ys )) .
(2.11)
47
2 Der Satz von Tarski-Seidenberg
Wir unterscheiden vier Fälle:
1. Fall i 6= k und γs ∈ N.
Dann gilt
SGN (v)i,2s−1
sgn (v̂i (ys )) = sgn d̂i (ys )
=
mit 2.11
sgn d̂i (xν·γs )
=
γs ∈N
i6=k
= Di,2(ν·γs )−1 .
mit 2.2
Also erreichen wir durch Setzen von Vi,2s−1
Vi,2s−1 = SGN (v)i,2s−1 .
:=
Di,2(ν·γs )−1 , dass
2. Fall i 6= k und γs ∈
/ N.
Weil i ∈ µ\ {k}, gilt vi = ri = di . Sei zur Abkürzung g := γs − 12 . Im Intervall
i
h
I (r)νg = xνg , xνg +1 wechselt rˆi = d̂i sein Vorzeichen nicht.
i
h
Nach 2.6 wechselt d̂i auch im Intervall Ig = xνg , xνg+1 sein Vorzeichen nicht.
Weil die beiden Intervalle nichtleeren Schnitt haben, gilt daher
h
∈ sgn d̂i [Ig ]
i
h
h
=∈ sgn rˆi I (r)νg
ii
.
(2.12)
Damit berechnen wir
SGN (v)i,2s−1
sgn d̂i zγs − 1
h
h
sgn (v̂i (ys )) = sgn d̂i (ys )
i6=k
= sgn d̂i (zg )
ii
=
Setzen
h
= ∈ sgn d̂i [Ig ]
zg ∈Ig
Bem. 2.2.15 auf Seite 39
Also erreichen wir durch
Vi,2s−1 = SGN (v)i,2s−1 .
mit 2.11
2
∈ sgn rˆi I (r)νg
=
=
γs ∈N
/
i
=
mit 2.12
SGN (r)i,2νg = Ri,2νg = Ri,2νγ
1
s− 2
von
Vi,2s−1
:=
Ri,2νγ
1
s− 2
,
.
dass
3. Fall i = k und γs ∈ N.
Dann gilt
SGN (v)k,2s−1
=
mit 2.11
sgn (vˆk (ys )) = sgn (vˆk (xν·γs )) = Kγs
und wir erreichen durch
Vk,2s−1 = SGN (v)k,2s−1 .
48
γs ∈N
Setzen
mit 2.8
von
Vk,2s−1
:=
Kγs ,
(2.13)
dass
2.2 Das Reduktionslemma
4. Fall i = k und γs ∈
/ N.
Dann gilt
SGN (v)k,2s−1
=
mit 2.11
sgn (vˆk (ys )) = sgn vˆk zγs − 1
γs ∈N
/
2
=0
und wir erreichen durch Setzen von Vk,2s−1 := 0, dass Vk,2s−1 = SGN (v)k,2s−1 .
Für die Einträge der Vorzeichenmatrix V , denen in diesem Teil des Beweises ein Wert
zugewiesen wurde, gilt zusammenfassend:
∀i ∈ µ ∀1 ≤ s ≤ S :
Vi,2s−1 = SGN (v)i,2s−1
(2.14)
Sechster Teil des Beweises: Einträge von V , die Intervallen entsprechen
Sei i ∈ µ und s ∈ S + 1.
Dann gilt
i
I (v)s = in (v)s , in (v)s+1
h
=
mit 2.10
]ys , ys+1 [ .
(2.15)
Wir unterscheiden fünf Fälle:
1. Fall i 6= k und γs ∈ N.
Weil i ∈ µ\ {k}, gilt vi = ri .
Im Intervall I (v)s
=
mit 2.15
]ys , ys+1 [ = ]xν·γs , ys+1 [ wechselt v̂i = rˆi sein Vorzeiγs ∈N
chen nicht.
Auch im Intervall I (r)ν·γs = ]xν·γs , xν·γs +1 [ wechselt rˆi sein Vorzeichen nicht.
Weil die beiden Intervalle nichtleeren Schnitt haben gilt daher
h
h
∈ (sgn [v̂i [I (v)s ]]) =∈ sgn rˆi I (r)ν·γs
ii
.
(2.16)
Damit berechnen wir
SGN (v)i,2s
h
h
∈ (sgn [v̂i [I (v)s ]])
=
Bem. 2.2.15 auf Seite 39
∈ sgn rˆi I (r)ν·γs
ii
=
Bem. 2.2.15 auf Seite 39
=
mit 2.16
SGN (r)i,2(ν·γs ) = Ri,2(ν·γs ) .
Also erreichen wir durch Setzen von Vi,2s := Ri,2(ν·γs ) , dass Vi,2s = SGN (v)i,2s .
49
2 Der Satz von Tarski-Seidenberg
2. Fall i 6= k und γs ∈
/ N.
Sei zur Abkürzung g := γs − 21 . Weil i ∈ µ\ {k}, gilt vi = di .
Im Intervall I (v)s
=
mit 2.15
]ys , ys+1 [ = ]zg , ys+1 [ wechselt v̂i sein Vorzeichen
γs ∈N
/
nicht.
Nach 2.6 wechselt v̂i = d̂i auch im Intervall Ig sein Vorzeichen nicht.
Weil zg ∈ Ig haben die beiden Intervalle nichtleeren Schnitt und es gilt
∈ (sgn [v̂i [I (v)s ]]) =∈ (sgn [v̂i [Ig ]]) .
(2.17)
Damit berechnen wir
SGN (v)i,2s
∈ (sgn [v̂i [I (v)s ]])
=
= ∈ (sgn [v̂i [Ig ]]) =
sgn (v̂i (zg )) = sgn v̂i zγs − 1
2
zg ∈Ig
mit 2.17
Bem. 2.2.15 auf Seite 39
= sgn (v̂i (ys ))
=
2.11 anwendbar, weil 1≤s≤S
(wäre s=0, so wäre γs =0∈N)
SGN (v)i,2s−1
=
mit 2.14
Vi,2s−1 .
Durch Setzen von Vi,2s := Vi,2s−1 (dem auf der rechten Seite der Definitionsgleichung stehenden Eintrag von V wurde bereits in Fall 2 des fünften Teils
des Beweises auf Seite 48 der Wert Ri,2νγ − 1 zugewiesen) erreichen wir, dass
s 2
Vi,2s = SGN (v)i,2s .
3. Fall i = k, γs ∈ N und Kγs 6= 0.
Dann gilt
0 6= Kγs
=
mit 2.13
sgn (vˆk (ys ))
∈ (sgn [vˆk [I (v)s ]])
h
h
= ∈ sgn vˆk ]ys , ys+1 [
ii
weil 6=0
=
Bem. 2.2.15 auf Seite 39
=
mit 2.15
SGN (v)i,2s .
Also erreichen wir durch Setzen von Vi,2s := Kγs , dass Vi,2s = SGN (v)i,2s .
4. Fall i = k, γs ∈ N und Kγs = 0.
Dann gilt
Dk,2(ν·γs ) = Rk,2(ν·γs ) = SGN (r)k,2(ν·γs )
50
=
Bem. 2.2.15 auf Seite 39
2.2 Das Reduktionslemma
h
h
∈ sgn rˆk I (r)ν·γs
ii
h
h
=∈ sgn dˆk I (r)ν·γs
ii
.
(2.18)
Weil deg dk = µk ∈ N, gilt dk 6= 0 und die Polynomfunktion dˆk kann auf dem
Intervall I (r)ν·γs nicht verschwinden. Mit 2.18 folgt Dk,2(ν·γs ) ∈ {−1, 1}.
Im Intervall I (v)s
=
mit 2.15
]ys , ys+1 [ wechselt vˆk sein Vorzeichen nicht.
Im Intervall I (r)ν·γs = ]xν·γs , xν·γs +1 [ = ]ys , xν·γs +1 [ wechselt rˆk = dˆk sein
γs ∈N
k∈µ
Vorzeichen nicht.
Weil die beiden Intervalle nichtleeren Schnitt haben, gibt es ξ ∈ I (v)s ∩I (r)ν·γs .
Für alle t ∈ ]ys , ξ[ gilt
sgn dˆk (t)
=
t∈I(r)ν·γs
h
h
∈ sgn dˆk I (r)ν·γs
ii
=
mit 2.18
Dk,2(ν·γs ) ∈ {−1, 1} . (2.19)
!
Weil s 6= 0 andernfalls wäre Kγs = Kγ0 = K0
= sgn (vˆk (−∞)) 6= 0 und
mit 2.8
vk 6=0
damit 1 ≤ s ≤ S, gilt ys ∈ R.
Weil sgn (vˆk (ys ))
=
mit 2.13
Kγs = 0, gilt vˆk (ys ) = 0.
Es ergibt sich
ˆξ
| {z }
=0
dˆk (t) dt
∂ vˆk (t) dt =
vˆk (ξ) = vˆk (ys ) +
ys ∈R
ˆξ
ys
ys
und aus ys < ξ und 2.19 schließt man sgn (vˆk (ξ)) = Dk,2(ν·γs ) .
Damit erhält man
SGN (v)k,2s
=
∈ (sgn [vˆk [I (v)s ]])
Bem. 2.2.15 auf Seite 39
=
ξ∈I(v)s
sgn (vˆk (ξ)) = Dk,2(ν·γs )
und durch Setzen von Vk,2s := Dk,2(ν·γs ) erreichen wir, dass Vk,2s = SGN (v)k,2s .
5. Fall i = k und γs ∈
/ N.
Sei zur Abkürzung g := γs − 21 .
Wir zeigen zuerst, dass
xνg+1 ∈ ]ys , ys+1 ] .
i
(2.20)
h
Weil Ig = xνg , xνg+1 , gilt ys = zg < xνg+1 , was die Einhaltung der linken
γs ∈N
/
zg ∈Ig
Intervallgrenze zeigt.
51
2 Der Satz von Tarski-Seidenberg
Falls γs+1 ∈ N, gilt ys+1 = xν·γs+1
≥
γs+1 −γs ≥ 12
xνγ
1
s+ 2
= xνg+1 .
i
Falls γs+1 ∈
/ N, gibt es h ∈ N, sodass ys+1 = zg+1+h ∈ Ig+1+h = xνg+1+h , xνg+2+h
und damit gilt ys+1 > xνg+1+h ≥ xνg+1
≥
xνg +1 .
h
νg+1 −νg ≥1
In beiden Fällen wird also auch die rechte Intervallgrenze eingehalten.
Damit ist 2.20 gezeigt.
Im Intervall I (v)s
=
mit 2.15
]ys , ys+1 [ wechselt vˆk sein Vorzeichen nicht.
Weil Kg · Kg+1 = −1, gilt Kg+1 6= 0. Wir berechnen
0 6= Kg+1
= sgn vˆk xνg+1
mit 2.8
=
h
h
∈ sgn vˆk ]ys , ys+1 [
ii
=
mit 2.20
weil 6=0
∈ (sgn [vˆk [I (v)s ]])
=
Bem. 2.2.15 auf Seite 39
Also erreichen wir durch Setzen von Vk,2s
Vk,2s = SGN (v)k,2s .
SGN (v)k,2s .
:= Kg+1
= Kγs + 1 , dass
2
Damit ist Lemma 2.2.18 bewiesen.
2.3 Häufigkeiten
In Abschnitt 2.2 wurde auf Seite 33 angekündigt, dass wir die Häufigkeit eines Polynomvektors beliebig vermindern können, wenn wir die Funktionen redkµ nur oft und
geschickt genug auf ihn anwenden. Dabei ist bis jetzt weder klar, was dabei mit Häufigkeit gemeint ist, noch, unter welchen Bedingungen man von einer Verminderung
derselben spricht. In diesem Abschnitt werden diese Fragen beantwortet und das
nötige Werkzeug bereitgestellt, um die Funktionen redkµ dann in Abschnitt 2.4 „oft
und geschickt genug“ auf Polynomvektoren anwenden zu können.
n
o
Definition 2.3.1. Sei34 Φ := ϕ ∈ NN ; spt ϕ endlich . Die Elemente von Φ nennen
wir Häufigkeiten.
34
Für ϕ ∈ NN sei spt ϕ := [N\ {0}] ϕ der Träger von ϕ. Aus Fußnote 3 auf Seite 9 ergibt sich
[N\ {0}] ϕ = {n ∈ N; ϕn 6= 0}.
52
2.3 Häufigkeiten
Definition 2.3.2. Sei R ein kommutativer Ring mit Eins und v ein Polynomvektor
über R. Dann sei die Häufigkeit (englisch: frequency) von v durch35
frq v := (# {i ∈ v; noc vi = n})n∈N ∈ Φ
definiert.
Für alle n ∈ N ist also (frq v)n die Anzahl der Komponenten von v, deren Koeffizientenzahl gleich n ist.
Die soeben definierte Häufigkeit eines Polynomvektors ist die Größe, die wir durch
Anwendung der Funktionen redkµ vermindern wollen. Was dabei Verminderung bedeutet, legt die folgende Definition fest:
Definition 2.3.3. Sind σ, ϕ ∈ Φ Häufigkeiten, dann sagt man σ ist kleiner als ϕ und
schreibt dafür σ < ϕ, wenn
∃k ∈ N :
(σk < ϕk
∧
∀n > k : σn = ϕn ) .
Jetzt kann bewiesen werden, dass die Funktionen redkµ tatsächlich die Häufigkeit von
Polynomvektoren vermindern:
Lemma 2.3.4. Seien R ein kommutativer Ring mit Eins, µ ein Multiindex, k ∈ µ
derart, dass m := (µ + 1 + ek )k = max (µ + 1 + ek ) und v ∈ Rµ+1+ek h1i.36 Gilt
außerdem (vk )m−1 6= 0, so gilt
frq redkµ (v) < frq v.
Beweis. Aus der Definition der Funktionen redkµ (Definition 2.2.8 auf Seite 35) folgt,
 h1i.
dass redkµ (v) ∈ R
µ+1


µ
35
Der Begriff der Koeffizientenzahl noc p eines Polynoms p wird in Definition 1.1.6 auf Seite 11
eingeführt.
Ist E eine endliche Menge, so bezeichnen wir mit #E die Zahl der Elemente von E.
36
Dies sind genau die in der Definition der Funktionen redkµ (Definition 2.2.8 auf Seite 35) getroffenen
Voraussetzungen.
In Definition 2.2.6 auf Seite 35 wird der Begriff Multiindex und in der darauffolgenden Definition 2.2.7 auf Seite 35 die Notation RK h1i eingeführt. (
!
1 , wenn i = k
Mit ek ist hier wie auf Seite 35 der Multiindex ek :=
gemeint.
0 , wenn i 6= k
i∈µ
53
2 Der Satz von Tarski-Seidenberg
Daraus ergibt sich für alle Indizes i ∈ redkµ (v)\v die Ungleichung
noc redkµ (v)i ≤ µi < max (µ + 1 + ek ) = m
(2.21)
und für i = k die Ungleichung
noc redkµ (v)k ≤ µk + 1 < max (µ + 1 + ek ) = m.
(2.22)
Die Voraussetzung (vk )m−1 6= 0 bewirkt, dass die Koeffizientenzahl noc vk nicht nur,
wie aus v ∈ Rµ+1+ek h1i folgt, kleiner gleich, sondern sogar gleich m ist.
Damit gilt die Ungleichung
# i ∈ v\ {k} ; noc
n
frq redkµ (v)
m
o
= # i ∈ redkµ (v); noc redkµ (v)i = m
redkµ (v)i
|
{z
=
mit 2.21 und 2.22
= m = # {i ∈ v\ {k} ; noc vi = m}
}
<
noc vk =m
=vi , weil i∈v\{k}
# {i ∈ v; noc vi = m} = (frq v)m
und für alle n > m, weil die Koeffizientenzahlen aller Komponentenpolynome von
sowohl v als auch redkµ (v) höchstens m = max (µ + 1 + ek ) betragen, die Gleichung
frq redkµ (v)
n
n
0 = # {i ∈ v; noc vi = n} = (frq v)n .
n>m
Es gilt also wie behauptet frq redkµ (v) < frq v.
54
o
= # i ∈ redkµ (v); noc redkµ (v)i = n
=
n>m
2.3 Häufigkeiten
Lemma 2.3.5. Die in Definition 2.3.3 auf Seite 53 definierte Relation < ist eine
wohlfundierte Relation37 .
Beweis. Nach Lemma 1.3.3 auf Seite 18 reicht es, zu zeigen, dass jede nichtleere
Menge K ⊆ Φ ein bezüglich < in K vorgängerloses Element besitzt. Sei also K ⊆ Φ
und K 6= ∅.
Weil K 6= ∅, gibt es ε ∈ K.
Sei m := min {n ∈ N; spt ε ⊆ n}.
Wir definieren rekursiv eine Funktion M ∈ ℘ (K)m+1 durch
M :=



 {ϕ


{ϕ
∈ K; spt ϕ ⊆ m}

, wenn n = m 
∈ Mn+1 ; ϕn = min {σn ; σ ∈ Mn+1 }} , wenn n ∈ m
.

n∈m+1
Per Induktion sieht man, dass für alle n ∈ m + 1 die Menge Mn nicht leer ist:
Wegen ε ∈ Mm gilt Mm 6= ∅ und für alle n ∈ m folgt aus Mn+1 6= ∅, dass Mn 6= ∅.
Also gibt es µ ∈ M0 . Wir zeigen, dass µ vorgängerlos in K ist:
Gäbe es κ ∈ K mit κ < µ, so gäbe es k ∈ N mit κk < µk und ∀n > k : κn = µn .
Wir führen jetzt sowohl den Fall k ≥ m als auch den Fall k < m zum Widerspruch:
1. Fall k ≥ m.
Wegen µ ∈ Mm wäre dann k ∈
/ spt µ und damit µk = 0 im Widerspruch zu
κk < µk .
2. Fall k < m.
Wir zeigen per Induktion, dass dann ∀k < n ≤ m : κ ∈ Mn wäre:
Induktionsanfang: Sei r ≥ m. Weil µ ∈ Mm , gilt dann µr = 0 und es wäre
κr = µr = 0. Da dies für alle r ≥ m so wäre, wäre κ ∈ Mm .
r>k
Induktionsschritt: Sei k < n < m und κ ∈ Mn+1 . Dann wäre κn = µn
n>k
=
µ∈Mn
min {σn ; σ ∈ Mn+1 } und demzufolge κ ∈ Mn .
Insbesondere wäre also κ ∈ Mk+1 und daher κk ≥ min {σk ; σ ∈ Mk+1 }. Weil
aber µ ∈ Mk und daher µk = min {σk ; σ ∈ Mk+1 }, wäre κk ≥ µk im Widerspruch zu κk < µk .
37
Der Begriff wohlfundierte Relation wird in Definition 1.3.2 auf Seite 18 eingeführt.
55
2 Der Satz von Tarski-Seidenberg
2.4 Beweis des Satzes von Tarski-Seidenberg
In diesem Abschnitt wird der Satz von Tarski-Seidenberg bewiesen.
Lemma 2.4.1. Sei38 v ∈ ∪ Rh1i[N] ein reeller Polynomvektor,39 k ∈ [{0}] v und V
eine Vorzeichenmatrix40 . Dann gilt41
V = SGN (v) ⇔ V [{k} × N] = {0} und V |N\{k},N = SGN v|N\{k}
.
Beweis. Weil k ∈ [{0}] v, gilt k ∈ v. Weil vk = 0, folgt aus der Definition der Menge
der isolierten Nullstellen eines Polynomvektors (Definition 2.2.11 auf Seite 37), dass
IN (v) = IN v|N\{k} .
Wir beweisen jede Implikation einzeln.
1. Die Richtung „⇒“:
Sei V = SGN (v).
Aus k ∈ v, vk = 0 und aus der Definition von SGN (Definition 2.2.12 auf
Seite 38) folgt V [{k} × N] = {0}. Die Gleichung V |N\{k},N = SGN v|N\{k}
gilt, weil wegen IN (v) = IN v|N\{k} für alle i ∈ v die i-te Zeile von SGN (v)
nur von der i-ten Komponente von v abhängt.
2. Die Richtung „⇐“:
Sei V [{k} × N] = {0} und V |N\{k},N = SGN v|N\{k} .
Dann folgt aus V [{k} × N] 6= ∅, dass k ∈ V und damit
V = V |N\{k},N + 1 = SGN v|N\{k} + 1 = v|N\{k} + 1 = v = SGN (v).
k∈V
k∈v
Wir zeigen jetzt, dass auch |V | = |SGN (v)| und dass die Einträge der Matrizen
übereinstimmen:
38
Die beiden Begriffe Polynomvektor und reeller Polynomvektor werden in Definition 2.2.1 auf
Seite 33 eingeführt.
[N]
z
Nach Fußnote 16 auf Seite 33 ist ∪ Rh1i
= ∪ {Rh1i ; z ∈ N} die Menge der reellen Polynomvektoren.
39
Aufgrund von Fußnote 3 auf Seite 9 bedeutet hier k ∈ [{0}] v, dass k ∈ v und vk = 0.
40
In Definition 2.2.16 auf Seite 39 wird der Begriff Vorzeichenmatrix definiert.
41
Die Funktion SGN wird in Definition 2.2.12 auf Seite 38 definiert.
Mit Fußnote 3 auf Seite 9 ergibt sich, dass V [{k} × N] = {0} eine kurze Schreibweise für
k ∈ V ∧ ∀j ∈ |V | : Vk,j = 0 ist.
Die Notationen zum Streichen von Komponenten aus Vektoren und von Zeilen und Spalten
aus Matrizen werden in den Definitionen 2.1.3 und 2.1.4 auf Seite 27 festgelegt.
56
2.4 Beweis des Satzes von Tarski-Seidenberg
a) Fall V ≤ 1.
Weil k ∈ V gilt dann V = 1 und k = 0. Weil V Vorzeichenmatrix, gibt es
einen reellen Polynomvektor w mit V = SGN (w). Mit V [{0} × N] = {0}
folgt w = (0)i∈1 . Wegen v = V = 1 und v0 = vk = 0 gilt auch v = (0)i∈1 .
Also gilt V = SGN (w) = SGN (v).
b) Fall V > 1.
In diesem Fall gilt V |N\{k},N 6= ∅ und damit auch v|N\{k} 6= ∅ und deshalb
|V | = V |N\{k},N = SGN v|N\{k} 2 · #IN v|N\{k} + 1 = 2 · #IN (v) + 1
=
Def. 2.2.12 auf Seite 38
=
Def. 2.2.12 auf Seite 38
|SGN (v)| .
Die Einträge stimmen auch überein, weil die k-ten Zeilen aufgrund der
Rechnung
V |{k},N = (0)(i,j)∈1×|V | = (0)(i,j)∈1×|SGN(v)| = SGN (v) |{k},N
vk =0
gleich sind und für alle i ∈ V \ {k} = SGN (v)\ {k} die i-te Zeile von
SGN (v) wegen IN (v) = IN v|N\{k} nur von der entsprechenden Kompo
nente von v|N\{k} abhängt und demzufolge wegen V |N\{k},N = SGN v|N\{k}
gleich der entsprechenden Zeile von V |N\{k},N , d. h. gleich der i-ten Zeile
von V ist.
Lemma 2.4.2. Sei n ∈ N. Dann hat die Menge42
F :=











ϕ ∈ Φ;










^
^
[N]
v∈∪((Rhni)h1i
frq v=ϕ
)











{x ∈ Rn ; SGN (vx̂ ) ∈ M } ∈ V (Rn )










M Menge von
Vorzeichenmatrizen
die Eigenschaft
∀ϕ ∈ Φ :
42
({σ ∈ Φ; σ < ϕ} ⊆ F
⇒
ϕ ∈ F).
In Definition 1.2.5 auf Seite 14 wird die Menge V (Rn ) der semialgebraischen Teilmengen von Rn
definiert.
Die Schreibweise px̂ für Polynome p ∈ (Rhni)h1i und Vektoren x ∈ Rn wird in Definition 1.1.8
auf Seite 12 eingeführt.
57
2 Der Satz von Tarski-Seidenberg
Korollar 2.4.3. Weil < nach Lemma 2.3.5 auf Seite 55 eine wohlfundierte Relation
ist, sagt Lemma 2.4.2 wegen Lemma 1.3.4 auf Seite 19 aus, dass
^
^
^
n∈N
v∈∪((Rhni)h1i[N] )
M Menge von
{x ∈ Rn ; SGN (vx̂ ) ∈ M } ∈ V (Rn ) .
Vorzeichenmatrizen
Beweis. Wir beweisen jetzt Lemma 2.4.2.
Sei ϕ ∈ Φ und
{σ ∈ Φ; σ < ϕ} ⊆ F .
(2.23)
Sei v ∈ ∪ (Rhni)h1i[N] mit frq v = ϕ und M eine Menge von Vorzeichenmatrizen.
Zu zeigen ist, dass die Menge S := {x ∈ Rn ; SGN (vx̂ ) ∈ M } semialgebraisch ist.
Wir unterscheiden 4 Fälle:
1. Fall v = ∅.
Für alle x ∈ Rn gilt dann vx̂ = ∅ und daher SGN (vx̂ ) = ∅. Je nachdem, ob
∅ ∈ M oder ∅ ∈
/ M , gilt damit S = Rn oder S = ∅; in beiden Fällen ist S
semialgebraisch.
2. Fall ∃k ∈ v : vk = 0.
In diesem Fall können wir durch Streichen der Nullzeile die Häufigkeit des
Polynomvektors verkleinern. Seien dazu
u := v|N\{k}
und
n
o
L := V |N\{k},N ; V ∈ M, V [{k} × N] = {0} .
Weil die Ungleichung
(frq u)0 = # {i ∈ u; noc ui = 0} = # ([{0}] u) <
# ([{0}] v) = # {i ∈ v; noc vi = 0} = (frq v)0
und für alle m > 0 die Gleichungen
(frq u)m = # {i ∈ u; noc ui = m} = # {i ∈ v; noc vi = m} = (frq v)m
58
2.4 Beweis des Satzes von Tarski-Seidenberg
gelten, gilt frq u < frq v = ϕ. Weil mit 2.23 deshalb frq u ∈ F , folgt aus der
Umformung
S = {x ∈ Rn ; SGN (vx̂ ) ∈ M } =
{x ∈ Rn ; ∃V ∈ M : V = SGN (vx̂ )}
=
Lemma 2.4.1
n
x ∈ Rn ; ∃V ∈ M : V [{k} × N] = {0} , V |N\{k},N = SGN vx̂ |N\{k}
n
o
=
o
x ∈ Rn ; ∃V ∈ M : V [{k} × N] = {0} , V |N\{k},N = SGN (ux̂ ) =
{x ∈ Rn ; SGN (ux̂ ) ∈ L}
und der Definition von F , dass S semialgebraisch.
3. Fall v 6= ∅ und ∀i ∈ v : noc vi = 1.
Für alle x ∈ Rn und alle i ∈ v ist dann die Polynomfunktion


((vx̂ )i )β y β 

X

(vd
x̂ )i = R 3 y 7→
β∈spt((vx̂ )i )
=
spt(vi )={0}
R 3 y 7→ ((vi )x̂ )0 = R 3 y 7→ (vd
i )0 (x)
konstant.
Für alle x ∈ Rn ist deshalb die Menge IN (vx̂ ) der isolierten Nullstellen von
vx̂ leer. Mit der Definition von SGN (Definition 2.2.12 auf Seite 38) folgt, dass
die das Vorzeichenverhalten von vx̂ beschreibende Vorzeichenmatrix SGN (vx̂ )
einspaltig ist und sich als
SGN (vx̂ ) = sgn (vd
i )0 (x)
(i,j)∈v×1
schreiben lässt.
Damit ist43
S = {x ∈ Rn ; SGN (vx̂ ) ∈ M } =
n
n
x ∈ R ; ∃V ∈ M : V = sgn
(vd)
i 0
(x)
(i,j)∈v×1
=
o
x ∈ Rn ; ∃V ∈ M ∩ {−1, 0, 1}v×1 : ∀i ∈ v : Vi,0 = sgn (vd
i )0 (x)
43
=
Die Menge Λ der Achsenabschnitte, die Menge U (Rn ) der Polynom-Urbilder und die Menge
S (Rn ) der Urbildschnitte werden auf Seite 13 definiert.
59
2 Der Satz von Tarski-Seidenberg
(
(
)
∪ ∩ [ Vi,0 · R>0
|
{z
i 0
{z
; i ∈ v ; V ∈ M ∩ {−1, 0, 1}
∈ V (Rn )
}
∈U (Rn )
{z
|
)
v×1
}
∈Λ
|
](vd)
}
∈S(Rn )
als endliche Vereinigung von endlichen Schnitten von Urbildern von Achsenabschnitten unter Polynomfunktionen auf Rn semialgebraisch.
4. Fall ∃i ∈ v : noc vi > 1 und ∀i ∈ v : vi 6= 0.
Die Menge S kann dann wie folgt als Vereinigung von v + 1 Mengen dargestellt
werden:
S = S ∩ Rn =
S∩
∪
z∈v
z∈v
S ∩ [{0}] (v\
z )deg vz
|
{z
∩ [R\ {0}] (v\
z )deg vz =
z∈v
∪
S
}
=: Tz
∪
∪ [{0}] (v\
z )deg vz
∩
∩ [R\ {0}] (v\
i )deg vi =
i∈v
{z
|
}
=: Tv
∪ {Tz ; z ∈ v + 1}
Weil aufgrund von Lemma 1.2.6 auf Seite 14 die Vereinigung endlich vieler
semialgebraischer Mengen semialgebraisch ist, bleibt nur noch zu zeigen, dass
für alle z ∈ v + 1 die Menge Tz semialgebraisch ist.
a) Fall z ∈ v.
In diesem Fall können wir die Häufigkeit des Polynomvektors durch Weglassen des höchsten Koeffizienten seines z-ten Komponentenpolynoms vermindern.
Sei dazu
u :=



 0


(vi )
α





, wenn i = z und α = deg vz 
, sonst
α∈N
∈ (Rhni)h1iv .
i∈v
Die Häufigkeit von u ist kleiner als die Häufigkeit von v, weil die Ungleichung
(frq u)noc vz = #{i ∈ u; noc ui = noc vz } <
|
{z
z∈
/
}
#{i ∈ v; noc vi = noc vz } = (frq v)noc vz
|
60
{z
z∈
}
2.4 Beweis des Satzes von Tarski-Seidenberg
und für alle m > noc vz die Gleichungen
(frq u)m = #{i ∈ u; noc ui = m} = #{i ∈ v; noc vi = m} = (frq v)m
|
{z
|
}
z∈
/
{z
}
z∈
/
gelten. Mit 2.23 folgt daraus frq u ∈ F .
Für alle x ∈ [{0}] (v\
z )deg vz gilt
ux̂ = vx̂ ,
(2.24)
weil für i = z und α = deg vz sowohl der Koeffizient
((ux̂ )z )deg vz = ((uz )x̂ )deg vz = (u\
z )deg vz (x)
=
Def. von u
0
als auch der Koeffizient
((vx̂ )z )deg vz = ((vz )x̂ )deg vz = (v\
z )deg vz (x)
=
0
x∈[{0}](vz\
)deg vz
verschwindet und andernfalls, d. h. für i 6= z oder α 6= deg vz , die Gleichung
[
((ux̂ )i )α = ((ui )x̂ )α = (u
i )α (x)
=
Def. von u
[
(v
i )α (x) = ((vi )x̂ )α = ((vx̂ )i )α
gilt.
Damit ist
Tz = S ∩ [{0}] (v\
z )deg vz =
x ∈ Rn ; SGN (vx̂ ) ∈ M und (v\
z )deg vz (x) = 0
n
x ∈ R ; SGN (ux̂ ) ∈ M und (v\
z )deg vz (x) = 0 =
{x ∈ Rn ; SGN (ux̂ ) ∈ M }
|
=
mit 2.24
{z
∈V(Rn ) weil frq u∈F und
∩
n
[ {0} ](v\
z )deg vz ∈ V (R )
}
|{z}
∈Λ
|
{z
}
∈U (Rn )⊆S(Rn )⊆V(Rn )
wegen der Definition von F
als Schnitt zweier semialgebraischer Mengen nach Lemma 1.2.8 auf Seite 15
semialgebraisch.
61
2 Der Satz von Tarski-Seidenberg
b) Fall z = v.
In diesem Fall können wir durch Anwendung einer der Funktionen44 redkµ
die Häufigkeit des Polynomvektors verkleinern:
Es gibt einen Index k ∈ v, sodass ∀i ∈ v : noc vk ≥ noc vi . Für diesen gilt
noc vk > 1. Sei damit45
µ := (noc vi )i∈v − 1 − ek ∈ Nv
derjenige Multiindex µ, für den gilt, dass die Komponenten von µ + 1 + ek
die Koeffizientenzahlen der Komponentenpolynome von v sind.
Weil damit (µ + 1 + ek )k = max (µ + 1 + ek ), liegt v im Definitionsbereich
von redkµ und wir können
u := redkµ (v)
setzen.
Weil der Koeffizient
(vk )(µ+1+ek )
k −1
= (vk )noc vk −1 = (vk )deg vk 6= 0
nicht verschwindet, folgt mit Lemma 2.3.4 auf Seite 53, dass frq u < frq v.
Mit 2.23 folgt daraus frq u ∈ F .
ist der reelle Polynomvektor vx̂ Element
Für alle x ∈ ∩ [R\ {0}] (v\
i)
der Menge
46
i∈v
Pkµ ,
deg vi
weil für alle solche x und alle i ∈ vx̂ aus der Rechnung
((vx̂ )i )(µ+1+ek ) −1 = ((vx̂ )i )noc vi −1 = ((vx̂ )i )deg vi =
i
((vi )x̂ )deg vi = (v\
i )deg vi (x) 6= 0
folgt, dass die Koeffizientenzahl noc (vx̂ )i nicht nur, wie aus v ∈ Rµ+1+ek h1i
folgt, kleiner gleich, sondern sogar gleich (µ + 1 + ek )i ist.
Damit ist
Tv = S
∩
∩ [R\ {0}] (v\
i )deg vi =
i∈v
In Definition 2.2.8 auf Seite 35 werden die Funktionen (
redkµ definiert.
!
1
,
wenn
i
=
k
45
Mit ek ist hier wie auf Seite 35 der Multiindex ek :=
0 , wenn i 6= k
44
i∈v
46
In Definition 2.2.17 auf Seite 39 werden die Mengen Pkµ definiert.
62
gemeint.
2.4 Beweis des Satzes von Tarski-Seidenberg
n
und SGN (vx̂ ) ∈ M
x ∈ R ; x ∈ ∩ [R\ {0}] (v\
i )deg vi
i∈v
|
{z
−1
=(REDkµ )
=
}
(SGN(redkµ (vx̂ )))
nach Lemma 2.2.18 auf Seite 40
(anwendbar weil vx̂ ∈Pkµ )
!
k
x ∈ R ; x ∈ ∩ [R\ {0}] (v\
i )deg vi und SGN redµ (vx̂ )
n
i∈v
|
{z
∈ REDkµ [M ] =
}
=(redkµ (v)) nach
x̂
Lemma 2.2.10 auf Seite 37
k
x ∈ R ; x ∈ ∩ [R\ {0}] (v\
i )deg vi und SGN (ux̂ ) ∈ REDµ [M ] =
n
i∈v
∩
∩ [ R\ {0} ](v\
i )deg vi
i∈v
| {z }
x ∈ Rn ; SGN (ux̂ ) ∈ REDkµ [M ]
o
{z
}
|
∈Λ
|
n
{z
∈V(Rn ) weil frq u∈F und
}
∈U (Rn )⊆S(Rn )⊆V(Rn )
wegen der Definition von F
als Schnitt endlich vieler semialgebraischer Mengen nach Lemma 1.2.8 auf
Seite 15 semialgebraisch.
Lemma 2.4.4. Für n ∈ N und S ∈ S (Rn+1 ) gilt47
Rn+1 3 x 7→ (xk )k∈n [S] ∈ V (Rn ) ,
d. h. die Projektion von Urbildschnitten ist semialgebraisch.
Beweis. Es gibt, weil S ∈ S (Rn+1 ), eine endliche Menge E ⊆ U (Rn ) von PolynomUrbildern, sodass S = ∩E. Sei48 z := #E. Dann gibt es eine Bijektion U : z → E.
Für alle i ∈ z gibt es, weil Ui ∈ U (Rn ), ein Polynom pi ∈ Rhn + 1i und einen
Achsenabschnitt λi ∈ Λ, sodass Ui = [λi ] pbi .
Durch Auffassen dieser Polynome als Polynome in nur einer Variablen mit Koeffizienten aus Rhni erhalten wir den Polynomvektor49
v := pi h1i
i∈z
∈ (Rhni)h1iz .
Nach Fußnote 3 auf Seite 9 bezeichnet der Ausdruck
Rn+1 3 x 7→ (xk )k∈n [S] das Bild der Menge
S unter der Funktion Rn+1 3 x 7→ (xk )k∈n , d. h. er ist gleich {x ∈ Rn ; ∃y ∈ R : (x, y) ∈ S}.
48
Ist E eine endliche Menge, so wird mit #E die Zahl ihrer Elemente bezeichnet.
49
Zur Notation ph1i für Polynome p ∈ Rhn + 1i siehe Definition 1.1.7 auf Seite 12.
47
63
2 Der Satz von Tarski-Seidenberg
Damit gilt
n
S = ∩E = ∩ {Ui ; i ∈ z} = ∩ {[λi ] pbi ; i ∈ z} = x ∈ Rn+1 ; ∀i ∈ z : pbi (x) ∈ λi
o
und mit der für alle x ∈ Rn und alle y ∈ R gültigen Rechnung
pbi (x, y)
=
mit Lemma 1.1.10 auf Seite 13
\
d
(pi )h1i (y) = (vd
i )x̂ (y) = (vx̂ )i (y)
x̂
erhält man
Rn+1 3 x 7→ (xk )k∈n [S] = {x ∈ Rn ; ∃y ∈ R : (x, y) ∈ S} =
n
x ∈ R ; ∃y ∈ R ∀i ∈z :
n
pbi (x, y)
| {z }
d
=(v
x̂ )i (y)
o
x ∈ Rn ; ∃y ∈ R ∀i ∈ z : sgn (vd
x̂ )i (y) ∈ λi
∈ λi =
=
Definition 2.2.12 auf Seite 38
n
o
x ∈ Rn ; ∃j ∈ 2 #IN (vx̂ ) + 1 ∀i ∈ z : SGN (vx̂ )i,j ∈ λi =
n
n
x ∈ R ; SGN (vx̂ ) ∈ A; A Vorzeichenmatrix, A = z, ∃j ∈ |A| ∀i ∈ z : Ai,j ∈ λi
|
{z
o
.
}
Menge von Vorzeichenmatrizen
Aus Korollar 2.4.3 auf Seite 58 ergibt sich, dass Rn+1 3 x 7→ (xk )k∈n [S] semialgebraisch ist.
Satz 2.4.5 (Satz von Tarski-Seidenberg). Für n ∈ N und V ∈ V (Rn+1 ) gilt
Rn+1 3 x 7→ (xk )k∈n [V ] ∈ V (Rn ) ,
d. h. die Projektion semialgebraischer Mengen ist semialgebraisch.
Beweis. Es gibt, weil V ∈ V (Rn+1 ), eine endliche Menge E ⊆ S (Rn ) von Urbildschnitten, sodass V = ∪E. Damit ist
Rn+1 3 x 7→ (xk )k∈n [V ] = Rn+1 3 x 7→ (xk )k∈n [∪E] =
{x ∈ Rn ; ∃y ∈ R ∃S ∈ E : (x, y) ∈ S} = ∪
S∈E
|
Rn+1 3 x 7→ (xk )k∈n [S] ∈ V (Rn )
{z
}
semialgebraisch nach
Lemma 2.4.4 auf der vorherigen Seite
64
2.4 Beweis des Satzes von Tarski-Seidenberg
als Vereinigung endlich vieler semialgebraischer Mengen nach Lemma 1.2.6 auf Seite 14
semialgebraisch.
65
2 Der Satz von Tarski-Seidenberg
66
3 Anwendung des Satzes von
Tarski-Seidenberg in der Theorie
der partiellen
Differentialgleichungen
3.1 Resultante und Diskriminante
Definition 3.1.1. Seien R ein kommutativer Ring,1 A, B ∈ N, a ∈ RA+1 h1i und
B
b ∈ RB+1 h1i. Dann sei die Matrix a b ∈ R(A+B)×(A+B) durch
A
B
a b :=
A



ai−j


 b
 B+i−j




0
, wenn (j ∈ B) ∧ (i − j ∈ A + 1)
, wenn (j ∈
/ B) ∧ (B + i − j ∈ B
, sonst



+ 1) 


(i,j)∈(A+B)2
definiert.
B
a b soll die Form der Matrix nachahmen. Im Fall
A
A = 2 und B = 3 gilt beispielsweise
Bemerkung 3.1.2. Das Symbol

3
a b =
2
1










a0
a1 a0
a2 a1 a0
a2 a1
a2

b0


b1 b0 


.
b2 b1 


b3 b2 

b3
Die Mengen RK h1i werden in Definition 2.1.8 auf Seite 28 definiert.
67
3 Anwendung in der Theorie der partiellen Differentialgleichungen
Die Buchstaben a und b stehen im Symbol ungefähr dort, wo die Koeffizienten von
a und b in der Matrix stehen und die Zahlen A und B beschriften im Symbol die
Abstände des Kreuzungspunktes vom unteren und oberen Matrixrand.
Bemerkung 3.1.3. Die in Definition 2.1.10 auf Seite 29 für M , Q ∈ N, einen kommuM
tativen Ring mit Eins R und b ∈ RM +1 h1i definierte Matrix
b lässt sich mit
Q
M
der soeben definierten Matrix als 1 b schreiben; dabei steht 1 für die Eins im
Q
Polynomring2 Rh1i, d. h. für das Polynom N 3 α 7→ 1{0} (α) ∈ R .
Lemma 3.1.4. Seien R ein kommutativer Ring, A, B ∈ N, a ∈ RA+1 h1i, b ∈ RB+1 h1i,
u ∈ RB h1i und v ∈ RA h1i. Dann gilt a u + b v ∈ RA+B h1i und


B
u
a b   = a u + b v,
v
A




(ui )i∈B 
u
wobei mit   der Vektor 
gemeint ist und mit der rechten Seite der
(vi )i∈A
v
Gleichung der Vektor ((a u + b v)i )i∈(A+B) , eine durch Bemerkung 2.1.9 auf Seite 28
gerechtfertigte Schreibweise.
Beweis. Es gilt a u+b v ∈ RA+B h1i, weil für alle α ∈ N mit α ≥ A+B der Koeffizient
X
aβ
uγ
β+γ=α
|{z}
|{z}
(a u + b v)α =
(=0 für β>A) (=0 für γ≥B)
{z
|
X
bβ
vγ
β+γ=α
|{z}
|{z}
+
}
=0
|
(=0 für β>B) (=0 für γ≥A)
{z
}
=0
verschwindet.
Für alle i ∈ A + B gilt3



B
X B
u 
 a b 
=
a b
v
A
A
k∈B
i
2
3
uk +
i,k
X
k∈A
B
a b
A
vk =
i,(B+k)
Die Notation Rhni für Polynomringe wird in Definition 1.1.2 auf Seite 9 eingeführt.
Die Verwendung der charakteristischen Funktionen 1A+1 und 1B+1 im Beweis könnte in Frage
gestellt werden, da der Ring R nicht notwendigerweise über(eine Eins verfügt. In diesem Fall
ai−k für i − k ∈ A + 1
fasse man zum Beispiel 1A+1 (i − k) ai−k als Abkürzung für
auf.
0
sonst
68
3.1 Resultante und Diskriminante
X
1A+1 (i − k) ai−k uk +
X
1B+1 (B + i − (B + k)) bB+i−(B+k) vk =
k∈A
k∈B
X
1A+1 (i − k) ai−k uk +
k∈B
X
ai−k uk +
X
1B+1 (i − k) bi−k vk =
k∈A
X
k∈B
k∈A
i−k∈A+1
i−k∈B+1
bi−k vk =
X
aα uβ +
α+β=i
X
bα vβ = (a u + b v)i ,
α+β=i
was die behauptete Gleichung zeigt.
Bemerkung 3.1.5. Satz 2.1.13 auf Seite 30 lässt sich wegen Bemerkung 3.1.3 als Sonderfall des soeben bewiesenen Lemmas auffassen.
Definition 3.1.6. Seien R ein kommutativer Ring, A, B ∈ N, a ∈ RA+1 h1i und
b ∈ RB+1 h1i. Dann nennen wir


B
ResA,B (a, b) := det  a b  ∈ R
A
die Resultante der Polynome a und b mit unterstellten Graden A und B.
Lemma 3.1.7. Seien R ein kommutativer Ring, A, B ∈ N, a ∈ (Rh1i)A+1 h1i,
b ∈ (Rh1i)B+1 h1i und r ∈ R. Dann gilt4
ResA,B (ar̂ , br̂ ) = Res\
A,B (a, b) (r) ,
d. h. es ist egal, ob man zuerst das Ringelement r in die Koeffizienten der Polynome
a und b einsetzt und anschließend deren Resultante berechnet oder ob man zuerst
die Resultante der Polynome a und b berechnet und anschließend in das dadurch
erhaltene Polynom das Ringelement r einsetzt – man erhält das selbe Ergebnis.
Beweis. Das Ringelement ResA,B (ar̂ , br̂ ) bzw. das Polynom ResA,B (a, b) geht aus
den Koeffizienten (abi (r))i∈A und bbi (r)
der Polynome ar̂ und br̂ bzw. den Koi∈B
effizienten (ai )i∈A und (bi )i∈B der Polynome a und b durch von den Werten dieser
B
B
Koeffizienten unabhängige Anordnung in der Matrix ar̂ br̂ bzw. a b und
A
A
anschließender Determinantenbildung hervor.
4
Die Schreibweise pr̂ für Polynome p ∈ (Rh1i)h1i und r ∈ R wird in Definition 1.1.8 auf Seite 12
eingeführt.
69
3 Anwendung in der Theorie der partiellen Differentialgleichungen
In der Bildungsvorschrift tauchen also ausschließlich Additionen und Multiplikationen auf, woraus mit Lemma 1.1.5 auf Seite 11 die behauptete Gleichung folgt.
Satz 3.1.8. Seien R ein kommutativer Ring mit Eins, n ∈ N und A ∈ Rn×n . Dann
sind die beiden folgenden Aussagen äquivalent:
1. Es gibt einen Vektor µ ∈ Rn \ {0}, sodass Aµ = 0.
2. Die Determinante det A ist ein Nullteiler5 in R.
Beweis. Den Beweis dieses Satzes findet man bei [Oel, S. 233]. Dass er auch für n = 0
gilt, sieht man wie folgt: Für n = 0 gibt es nur eine Matrix A ∈ Rn×n = {∅} und für
diese gilt det A = 1 (siehe Bemerkung 2.1.6 auf Seite 27). Die Eins ist nie Nullteiler,
es reicht also zu zeigen, dass es keinen Vektor µ ∈ Rn \ {0} gibt. Dies folgt daraus,
dass die Menge R0 = {∅} einelementig ist und der Vektor 0 in R0 gerade gleich ∅
ist.
Da in einem Integritätsring6 die Null der einzige Nullteiler ist, erhalten wir:
Korollar 3.1.9. Seien R ein Integritätsring, n ∈ N und A ∈ Rn×n . Dann sind die
beiden folgenden Aussagen äquivalent:
1. Es gibt einen Vektor µ ∈ Rn \ {0}, sodass Aµ = 0.
2. Es gilt det A = 0.
Kriterium 3.1.10. Seien R ein faktorieller Ring7 , A, B ∈ N mit8 A + B > 0,
a ∈ RA+1 h1i und b ∈ RB+1 h1i. Dann sind die beiden folgenden Aussagen äquivalent:
1. Es gilt aA = bB = 0 oder es gibt t ∈ Rh1i mit deg t > 0, sodass9 t|a und t|b.
2. Es gilt ResA,B (a, b) = 0.
5
Zum Begriff Nullteiler siehe Definition 1.4.2 auf Seite 20.
Der Begriff Integritätsring wird in Definition 1.4.5 auf Seite 20 definiert.
7
Der Begriff faktorieller Ring wird in Definition 1.4.9 auf Seite 21 definiert.
8
Ohne die Voraussetzung A + B > 0 gilt der Satz leider nicht, denn für A = B = 0 ist ResA,B (a, b)
unabhängig vom Wert der Polynome a und b als Determinante der 0 × 0-Matrix immer gleich
eins und kann daher nichts über die Existenz eines gemeinsamen nichtkonstanten Teilers der
Polynome a und b aussagen. Ein solcher existiert im Fall A = B = 0 genau dann, wenn a = b = 0.
9
Die Schreibweise t|a bedeutet t teilt a, siehe dazu Definition 1.4.1 auf Seite 20.
6
70
3.1 Resultante und Diskriminante
Beweis. Wir beweisen jede Richtung einzeln:
1⇒2: Wir unterscheiden zwei Fälle:
B
a b nicht die leere
A
Matrix, sie besitzt also eine unterste Zeile; ihr Zeilenindex ist i = A + B − 1.
Mit Blick auf Definition 3.1.1 auf Seite 67 sieht man folgendermaßen, dass für
B
alle j ∈ A + B der Eintrag a b
verschwindet:
A A+B−1,j
Für j ∈ B gilt, wenn der Eintrag nicht null ist, i − j = A + B − 1 − j ∈ A + 1,
daher A + B − 1 − j < A + 1, d. h. j > B − 2, damit j = B − 1 und folglich
i − j = A und der Eintrag ist gleich aA = 0.
1. Fall aA = bB = 0: Weil A + B > 0, ist die Matrix
Für j ∈
/ B sieht man ganz ähnlich, dass wenn der Eintrag nicht null ist,
B + i − j = A + 2 B − 1 − j ∈ B + 1, daher A + 2 B − 1 − j < B + 1, d. h.
j > A + B − 2, damit j = A + B − 1 und folglich B + i − j = B gilt und der
Eintrag gleich bB = 0 ist.
Die Matrix hat also eine Nullzeile, was zur Folge hat, dass ihre Determinante,
d. h. ResA,B (a, b), verschwindet.
2. Fall aA 6= 0 oder bB 6= 0: Dann existiert ein Polynom t ∈ Rh1i vom Grad
deg t > 0, das a und b teilt. Es gibt also Polynome u, v ∈ Rh1i mit a = t v und
b = t u. Weil a ∈ RA+1 h1i und b ∈ RB+1 h1i folgt aus diesen Gleichungen (auch
falls a = 0 oder
RA h1i. Damit erhält man den
 b =0), dass u ∈ RB h1i und
 v ∈
u 
u 
ähnlich wie in Lemma 3.1.4
Vektor µ := 
∈ RA+B , wobei mit 
−v
−v


(ui )i∈B 
auf Seite 68 der Vektor 
gemeint ist. Nach eben diesem Lemma
(−vi )i∈A


B
u
 = a u − b v = t v u − t u v = 0. Weil µ 6= 0 (andernfalls
gilt a b 
−v
A
wäre u = v = 0 und folglich a = b = 0, im Widerspruch
zu aA 6= 0 oder bB 6= 0),

B
folgt aus Korollar 3.1.9, dass ResA,B (a, b) = det  a b  = 0.
A


B
2⇒1: Sei ResA,B (a, b) = 0. Per Definition gilt ResA,B (a, b) = det  a b . WeA
A+B
gen Korollar 3.1.9 gibt es dann µ ∈ R
\ {0}, sodass das
 Matrix-Vektor
B
u
Produkt a b µ verschwindet. Durch Aufspaltung gemäß   := µ lassen
v
A
71
3 Anwendung in der Theorie der partiellen Differentialgleichungen
sich aus dem
µ zwei Polynome u ∈ RB h1i und v ∈ RA h1i
 Vektor

 gewinnen,

(u
)
u
i i∈B 
wobei mit   wie in Lemma 3.1.4 auf Seite 68 der Vektor 
(vi )i∈A
v


B
u
gemeint ist. Mit eben diesem Lemma folgert man a b   = a u + b v
v
A
und daraus wiederum a u + b v = 0.
Im Fall aA = bB = 0 ist die Richtung 2⇒1 gezeigt. Nehmen wir also an, dass
mindestens einer der Fälle aA 6= 0 oder bB 6= 0 zutrifft:
1. Fall aA 6= 0: Wir wollen jetzt Lemma 1.4.13 auf Seite 22 auf die Polynome a, b,
v ∈ Rh1i anwenden. Die erste Voraussetzung zu dessen Anwendung, nämlich
a| (b v), ist aufgrund der Gleichung a u + b v = 0 erfüllt. Es gilt A 6= 0, weil
andernfalls


B
ResA,B (a, b) = det  a b 
0
=
det 1{i} (j) a0
(i,j)∈B×B
=
Def.
auch im
3.1.1
Fall B=0
a0 B 6= 0
wäre. Also gilt deg a = A > 0, weshalb die zweite Voraussetzung zur Anwendung von Lemma 1.4.13 erfüllt ist. Die dritte Voraussetzung v 6= 0 ist
auch erfüllt, weil andernfalls

aus a u + b v = 0 und a 6= 0 folgen würde, dass
u
auch u = 0, d. h. µ =   = 0, im Widerspruch zu µ ∈ RA+B \ {0}. Weil
v
v ∈ RA h1i, ist auch die letzte Voraussetzung deg a = A > deg v erfüllt und es
gibt ein Polynom t ∈ Rh1i vom Grad deg t > 0, das a und b teilt.
2. Fall bB 6= 0: Wir wollen auch in diesem Fall Lemma 1.4.13 anwenden – diesmal
aber auf die Polynome b, a, u ∈ Rh1i. Die erste Voraussetzung zu dessen
Anwendung, nämlich b| (a u), ist aufgrund der Gleichung a u + b v = 0 erfüllt.
Es gilt B 6= 0, da andernfalls


0
ResA,B (a, b) = det  a b 
A
=
det 1{i} (j) b0
(i,j)∈A×A
=
Def.
auch im
3.1.1
Fall A=0
b0 A 6= 0
wäre. Also gilt deg b = B > 0, weshalb die zweite Voraussetzung zur Anwendung von Lemma 1.4.13 erfüllt ist. Die dritte Voraussetzung u 6= 0 ist auch
erfüllt, weil andernfalls aus a u + b v = 0 und b 6= 0 folgen würde, dass auch
72
3.1 Resultante und Diskriminante
v = 0, was aus dem selben Grund wie im ersten Fall nicht möglich ist. Weil
u ∈ RB h1i, ist auch die letzte Voraussetzung deg b = B > deg u erfüllt und es
gibt ein Polynom t ∈ Rh1i vom Grad deg t > 0, das a und b teilt.
Die Resultante findet bei folgender Definition Anwendung:
Definition 3.1.11. Seien R ein kommutativer Ring mit Eins, F ∈ N und f ∈ RF +2 h1i.
Dann gilt10 ∂f ∈ RF +1 h1i und wir nennen
DisF (f ) := ResF +1,F (f, ∂f ) ∈ R
die Diskriminante des Polynoms f mit unterstelltem Grad F .
Lemma 3.1.12. Seien R ein kommutativer Ring mit Eins, F ∈ N, f ∈ (Rh1i)F +2 h1i
und r ∈ R. Dann gilt
\
DisF (fr̂ ) = Dis
F (f ) (r) ,
d. h. es ist egal, ob man zuerst das Ringelement r in die Koeffizienten des Polynoms
f einsetzt und anschließend dessen Diskriminante berechnet oder ob man zuerst die
Diskriminante des Polynoms f berechnet und anschließend in das dadurch erhaltene
Polynom das Ringelement r einsetzt – man erhält das selbe Ergebnis.
Beweis. Das Lemma ist eine direkte Folgerung von Lemma 3.1.7.
Für die auf Seite 34 definierte Ableitung von Polynomen gilt die Produktregel:
Lemma 3.1.13. Seien R ein kommutativer Ring mit Eins und f , g ∈ Rh1i. Dann
gilt
∂ (f g) = (∂f ) g + f (∂g) .
Beweis. Den Beweis dafür, dass die Produktregel in dieser Allgemeinheit gilt, findet
man beispielsweise bei [Rei, S. 177] oder bei [Hor, S. 102].
Definition 3.1.14. Sei R ein Integritätsring. Dann sagt man, R habe die Charakteristik Null, wenn für die in Definition 2.2.2 auf Seite 33 eingeführte Folge [N, R]
gilt, dass n = 0 die einzige natürliche Zahl mit [N, R] (n) = 0 ist.
10
Die Schreibweise ∂f für die Ableitung eines Polynoms wird in Definition 2.2.3 auf Seite 34 eingeführt.
73
3 Anwendung in der Theorie der partiellen Differentialgleichungen
Lemma 3.1.15. Sei R ein Integritätsring der Charakteristik Null und t ∈ Rh1i mit
deg t > 0. Dann gilt
deg (∂t) = (deg t) − 1.
Beweis. Aus der Definition der Ableitung von Polynomen auf Seite 34 folgt
deg (∂t) < deg t. Es bleibt also zu zeigen, dass (∂t)(deg t)−1 6= 0. Dies folgt aus der
Rechnung (∂t)(deg t)−1 = [N, R] (deg t) · tdeg t , dem Umstand, dass R Charakteristik
Null hat und dem Umstand, dass R nullteilerfrei ist.
Lemma 3.1.16. Sei R ein faktorieller Ring der Charakteristik Null und f ∈ Rh1i.
Dann sind folgende zwei Aussagen äquivalent:
1. Es gibt t ∈ Rh1i mit deg t > 0, t|f und t|∂f .
2. Es gibt k ∈ Rh1i mit deg k > 0 und k 2 |f .
Beweis. Wir zeigen jede Richtung einzeln:
1⇒2: Es gibt g, h ∈ Rh1i mit f = g t und ∂f = h t. Nach Lemma 3.1.13 (Produktregel) gilt ∂f = (∂g) t + g (∂t), woraus (h − ∂g) t = g ∂t folgt, d. h. t| (g ∂t).
Damit ist bereits die erste Voraussetzung zur Anwendung von Lemma 1.4.13
auf Seite 22 auf die Polynome t, g, ∂t ∈ Rh1i erfüllt. Die zweite Voraussetzung
deg t > 0 ist auch erfüllt. Aus Lemma 3.1.15 folgt sowohl deg (∂t) ≥ 0 und
damit ∂t 6= 0, d. h. die dritte Voraussetzung, als auch deg t > deg (∂t), d. h.
die letzte Voraussetzung. Es gibt also ein Polynom k ∈ Rh1i mit deg k > 0,
k|t und k|g. Daher gibt es Polynome a, b ∈ Rh1i, sodass t = a k und g = b k.
Damit gilt f = g t = b a k 2 , d. h. k 2 |f .
2⇒1: Es gibt g ∈ Rh1i mit f = g k 2 . Damit gilt nach Lemma 3.1.13 (Produktregel)
∂f = (∂g) k 2 + g 2 (∂k) k = ((∂g) k + g 2 ∂k) k. Also erfüllt t := k die Behauptung.
Kriterium 3.1.17. Seien R ein faktorieller Ring der Charakteristik Null, F ∈ N
und f ∈ RF +2 h1i. Dann sind die beiden folgenden Aussagen äquivalent:
1. Es gilt fF +1 = 0 oder es gibt t ∈ Rh1i mit deg t > 0, sodass t2 |f .
2. Es gilt DisF (f ) = 0.
74
3.2 Koeffizientenabhängigkeit der Nullstellen komplexer Polynome
Beweis. Die erste Aussage ist nach Lemma 3.1.16 äquivalent zu folgender Aussage:
Es gilt fF +1 = 0 oder es gibt t ∈ Rh1i mit deg t > 0, t|f und t|∂f .
Diese ist wegen Kriterium 3.1.10 auf Seite 70, der Definition der Diskriminante und
wegen (∂f )F = (F + 1) fF +1 äquivalent zur zweiten Aussage.
3.2 Koeffizientenabhängigkeit der Nullstellen
komplexer Polynome
Es ist bekannt, dass eine Polynomfunktion in einer Variablen11 t über C vom Grad12
n ∈ N genau n mit Vielfachheit gezählte Nullstellen in C besitzt (Fundamentalsatz
der Algebra). Wenn man die Koeffizienten eines solchen Polynoms variiert, ist zu erwarten, dass sich die Nullstellen auch bewegen. Unter Variation könnte man hierbei
den allgemeinen Fall verstehen, in dem sich der Koeffizientenvektor des Polynoms frei
in Cn+1 bewegt. Wir betrachten aber lediglich den Spezialfall, in dem die Koeffizienten selbst Polynomfunktionen in einer Variablen11 z über C sind und deren Argument
z sich frei in C bewegt. Man kann auch den allgemeineren Fall betrachten, in dem die
Koeffizienten holomorphe Funktionen in einer Variablen sind (siehe [Voi]) – für unsere
Zwecke ist die Behandlung des polynomialen Falls aber ausreichend. In der Umgebung der meisten Stellen z ∈ C ist die Abhängigkeit der Nullstellen vom Argument
z der Koeffizientenpolynomfunktionen nicht nur stetig, sondern sogar holomorph; an
andernen Stellen – nämlich dort, wo es zu mehrfachen Nullstellen kommt, erhält
man erst nach einem Vorgang, den man mit den Worten „Auffalten der mehrblättrigen Riemannschen Fläche“ umschreiben könnte13 einen holomorphen funktionalen
Zusammenhang.
11
Dass hier die Namen der Variablen t und z genannt werden, soll es erleichtern, den Text in
Zusammenhang mit den Sätzen und Beweisen dieses Abschnitts zu bringen.
12
In Definition 1.1.6 auf Seite 11 wird der Begriff Grad für Polynome, nicht jedoch für Polynomfunktionen definiert. Wenn der Ring R jedoch so beschaffen ist, dass die Funktion Rh1i 3 p 7→ p̂ (Die
Notation Rh1i für die Menge der Polynome in einer Variablen über R wird in Definition 1.1.2
auf Seite 9 eingeführt und die Notation p̂ für die einem Polynom zugeordnete Polynomfunktion
p̂ : R → R in Definition 1.1.4 auf Seite 10) injektiv ist – und dies ist hier (R = C) der Fall
- macht es Sinn, vom Grad einer Polynomfunktion zu sprechen – gemeint ist damit dann der
Grad des einzigen Polynoms, dem unter der Funktion Rh1i 3 p 7→ p̂ diese Polynomfunktion
zugeordnet wird.
13
Hier ist die Sprache von Satz 3.2.11 auf Seite 84. Siehe zum Begriff Riemannsche Fläche z.B.
[Rüh, S. 79].
75
3 Anwendung in der Theorie der partiellen Differentialgleichungen
Lemma 3.2.1. Seien p ∈ (Ch1i)h1i, z ∈ C, t ∈ C, ε > 0, sodass die Polynomfunktion14 pcẑ keine Nullstellen auf {τ ∈ C; |τ − t| = ε} besitzt und M ∈ N, sodass M + 1
die Zahl der mit Vielfachheit gezählten Nullstellen von pcẑ auf15 B (t, ε) ist.
Dann gibt es δ > 0, sodass für alle ζ ∈ B (z, δ) die Funktion pcζ̂ keine Nullstellen
auf {τ ∈ C; |τ − t| = ε} und M + 1 mit Vielfachheit gezählte Nullstellen auf B (t, ε)
besitzt.
n
o
Beweis. Die Menge (ζ, τ ) ∈ C × C; pcζ̂ (τ ) = 0 ist als Urbild der abgeschlossenen
Menge {0} ⊆ C unter der stetigen Funktion C×C 3 (ζ, τ ) 7→ pcζ̂ (τ ) ∈ C abgeschlossen.
Die Menge {z}×{τ ∈ C; |τ − t| = ε} ist kompakt. Da die beiden zudem disjunkt sind,
haben sie positiven Abstand voneinander und es gibt δ > 0, sodass
C × C 3 (ζ, τ ) 7→ pcζ̂ (τ ) keine Nullstellen auf B (z, δ) × {τ ∈ C; |τ − t| = ε} besitzt.
Sei

1
N := B (z, δ) 3 ζ →
7
2πi
ˆ
|ρ−t|=ε
∂ pcζ̂ (ρ)
pcζ̂ (ρ)

dρ .
Für alle ζ ∈ B (z, δ) ist dann nach dem Satz von der Null- und Polstellenzählung
(siehe z.B. [Fre, S. 170]) N (ζ) ∈ N gleich der Zahl der mit Vielfachheit gezählten
Nullstellen von pcζ̂ auf B (t, ε). Als stetige Funktion mit Werten in N ist N konstant.
Weil pcẑ nach Voraussetzung M mit Vielfachheit gezählte Nullstellen auf B (t, ε) besitzt, gilt N (z) = M und aufgrund der Konstantheit N = (B (z, δ) 3 ζ 7→ M ).
Der folgende Satz taucht in ähnlicher Form auch bei [Hör, S. 362] auf und kann als
Satz über implizite Funktionen für komplexe Polynome aufgefasst werden:
Satz 3.2.2. Seien p ∈ (Ch1i)h1i, z, t ∈ C, sodass pcẑ (t) = 0 und (∂ pcẑ ) (t) 6= 0. Dann
gibt es ε > 0, δ > 0 und eine holomorphe Funktion θ : B (z, δ) → B (t, ε), sodass
^
pcζ̂ (τ ) = 0
⇔
θ (ζ) = τ .
(ζ, τ ) ∈ B (z, δ) × B (t, ε)
Beweis. Wegen pcẑ (t) = 0 und (∂ pcẑ ) (t) 6= 0 gibt es ε > 0, sodass pcẑ keine Nullstellen
auf16 B [t, ε] \ {t} besitzt.
14
Die Schreibweise px̂ für Polynome p ∈ (Rh1i)h1i und x ∈ R wird in Definition 1.1.8 auf Seite 12
eingeführt.
15
Für m ∈ C und r > 0 ist mit B (m, r) die offene Kreisscheibe {ζ ∈ C; |ζ − m| < r} gemeint.
16
Für z ∈ C und ε > 0 ist mit B [z, ε] die abgeschlossene Kreisscheibe {ζ ∈ C; |ζ − z| ≤ ε} gemeint.
76
3.2 Koeffizientenabhängigkeit der Nullstellen komplexer Polynome
Weil t daher die einzige Nullstelle von pcẑ auf B (t, ε) ist und t wegen der Voraussetzung (∂ pcẑ ) (t) 6= 0 eine einfache Nullstelle ist, ist die Zahl der mit Vielfachheit
gezählten Nullstellen von pcẑ auf B (t, ε) gleich eins. Aus Lemma 3.2.1 folgt damit,
dass es δ > 0 gibt, sodass für alle ζ ∈ B (z, δ) die Funktion pcζ̂ keine Nullstellen
auf {τ ∈ C; |τ − t| = ε} besitzt, genau eine Nullstelle auf B (t, ε) besitzt und diese
Nullstelle einfach ist.
Die Funktion

1
θ := B (z, δ) 3 ζ →
7
2πi
ˆ
ρ
|ρ−t|=ε
∂ pcζ̂ (ρ)
pcζ̂ (ρ)

dρ
ist holomorph. Wenn wir zeigen, dass für alle ζ ∈ B (z, δ) die Zahl θ (ζ) die Nullstelle
von pcζ̂ auf B (t, ε) ist, ist der Satz bewiesen. Sei also ζ ∈ B (z, δ). Dann besitzt pcζ̂
genau eine Nullstelle ν ∈ B (t, ε). Also gibt es nach Lemma 2.1.17 auf Seite 32 eine
Polynomfunktion f : C → C, sodass pcζ̂ = f · (τ 7→ (τ − ν)). Für die Ableitung von
pcζ̂ ergibt sich ∂ pcζ̂ = (∂f ) · (τ 7→ (τ − ν)) + f und damit
1
θ (ζ) =
2πi
1
2πi
ˆ
ˆ
|ρ−t|=ε
|
ρ
|ρ−t|=ε
(∂f ) (ρ) (ρ − ν) + f (ρ)
dρ =
f (ρ) (ρ − ν)
ρ (∂f ) (ρ)
1
dρ +
f (ρ)
2πi
{z
=:A
}
|
ˆ
|ρ−t|=ε
{z
=:B
ρ
dρ.
ρ−ν
}
Unter Verwendung des Cauchyschen Integralsatzes (siehe z.B. [Fre, Seite 77]) wollen
wir zeigen, dass A = 0. Zuerst stellen wir dazu fest, dass die Funktion f auf B (t, ε)
keine Nullstellen haben kann, da wegen pcζ̂ = f · (τ 7→ (τ − ν)) andernfalls die mit
Vielfachheit gezählte Zahl der Nullstellen von pcζ̂ auf B (t, ε) größer als eins wäre.
Damit folgern wir, dass die im Integranden von A auftauchende Funktion (τ 7→fτ )·∂f aufgrund der Nullstellenlosigkeit ihres Nenners holomorph auf B (t, ε) ist. Der Cauchysche
Integralsatz ist also anwendbar und A = 0.
Mit der Cauchyschen Integralformel [Fre, S. 87] ergibt sich B = ν.
Es folgt also θ (ζ) = ν, d. h. θ (ζ) ist die Nullstelle von pcζ̂ auf B (t, ε).
Das folgende Lemma gibt unter anderem eine hinreichende Bedingung für die Anwendbarkeit des soeben bewiesenen Satzes an:
77
3 Anwendung in der Theorie der partiellen Differentialgleichungen
Lemma 3.2.3. Seien P ∈ N,17 p ∈ (Ch1i)P +2 h1i und18 d := DisP (p) ∈ Ch1i.
Für alle z ∈ C mit dˆ(z) 6= 0 besitzt dann pcẑ genau P + 1 voneinander verschiedene
einfache Nullstellen.
\
ˆ
Dis
Beweis. Wegen DisP (pẑ )
=
P (p) (z) = d (z) 6= 0 ist der Koeffizient
Lemma 3.1.12
(pẑ )P +1 von Null verschieden, andernfalls wäre nämlich wegen Kriterium 3.1.17 auf
Seite 74 (anwendbar, da C faktorieller Ring19 der Charakteristik Null20 ) DisP (pẑ ) = 0.
Also ist pẑ vom Grad P +1, weshalb pcẑ nach dem Fundamentalsatz der Algebra P +1
mit Vielfachheit gezählte Nullstellen besitzt. Es handelt sich dabei um einfache Nullstellen, denn wäre µ ∈ C eine mehrfache Nullstelle von pcẑ , so wäre das Polynom,
dessen Polynomfunktion τ 7→ (τ − µ) lautet, vom Grad größer null, sein Quadrat
wäre ein Teiler von pẑ und ebenfalls nach Kriterium 3.1.17 wäre DisP (pẑ ) = 0.
Das folgende Lemma erlaubt es, unter gewissen Voraussetzungen den Weg einer Nullstelle eines Polynoms zu verfolgen, der durch den Weg, den das Argument seiner
Koeffizientenpolynome durchläuft, vorgegeben ist:
Lemma 3.2.4. Seien P ∈ N, p ∈ (Ch1i)P +2 h1i, d := DisP (p) ∈ Ch1i,21
ˆ a, b ∈ R mit a ≤ b, ζ : [a, b] → R stetig und t ∈ C Nullstelle
R := [C\ {0}] d,
von pd
.
ζd
(a)
Dann gibt es genau eine stetige Funktion τ : [a, b] → C, sodass die Anfangsbedingung
τ (a) = t erfüllt ist und für alle α ∈ [a, b] die Zahl τ (α) Nullstelle von pd
[ ist.
ζ(α)
Beweis. Zur Abkürzung innerhalb des Beweises führen wir folgende Sprechweise ein:
Für β ∈ [a, b] heiße eine Funktion τ : [a, β] → C Nullstellenverfolgung bis β, wenn τ
stetig, τ (a) = t und wenn für alle α ∈ [a, β] die Zahl τ (α) Nullstelle von pd
[ ist.
ζ(α)
Wir beweisen zuerst die Existenz:
Sei
G := {β ∈ [a, b] ; Es gibt eine Nullstellenverfolgung bis β} .
17
Die Mengen RK h1i werden in Definition 2.1.8 auf Seite 28 definiert.
Die Diskriminante DisF (f ) eines Polynoms f mit unterstelltem Grad F wird in Definition 3.1.11
auf Seite 73 definiert.
19
Jeder Körper ist ein faktorieller Ring (der Begriff faktorieller Ring wird in Definition 1.4.9 auf
Seite 21 definiert), weil jedes seiner von Null verschiedenen Elemente eine Einheit ist.
20
In Definition 3.1.14 auf Seite 73 steht, was Charakteristik Null bedeutet.
21
ˆ
ˆ
Nach Fußnote
n 3 auf Seite 9 isto[C\ {0}] d der Vorbereich der Menge C\ {0} unter der Funktion d,
d. h. gleich z ∈ C; dˆ(z) 6= 0 .
18
78
3.2 Koeffizientenabhängigkeit der Nullstellen komplexer Polynome
Es gilt a ∈ G, da die Funktion [a, a] 3 α 7→ t Nullstellenverfolgung bis a ist.
Die Menge G ist ein Intervall: Aus a ≤ α ≤ β und β ∈ G folgt α ∈ G, weil die
Einschränkung der Nullstellenverfolgung bis β auf das Intervall [a, α] Nullstellenverfolgung bis α ist.
Sei r die rechte Intervallgrenze von G.
Wir zeigen jetzt indirekt, dass G = [a, r]. Nehmen wir also an, es sei G = [a, r[. Der
Punkt ζ (r) liegt in R, d. h. es gilt dˆ(ζ (r)) 6= 0. Nach Lemma 3.2.3 besitzt pd
genau
ζd
(r)
P + 1 voneinander verschiedene einfache Nullstellen. Sei T die Menge dieser Nullstellen. Für alle σ ∈ T kann man folgende Überlegung anstellen: Weil ζ (r) ∈ R, folgt
aus Lemma 3.2.3, dass Satz 3.2.2 anwendbar ist, d. h. es gibt, weil σ Nullstelle von
pd
ist, εσ > 0, δσ > 0 und eine holomorphe Funktion θσ : B (ζ (r) , δσ ) → B (σ, εσ ),
ζd
(r)
sodass
^
(pcû (v) = 0
⇔
θσ (u) = v) .
(3.1)
(u, v) ∈ B (ζ (r) , δσ ) × B (σ, εσ )
Es gibt nun γ ∈ [a, r[, sodass das Wegstück22 ζ [[γ, r]] Teilmenge einer jeden der
endlich vielen Kreisscheiben B (ζ (r) , δσ ) mit σ ∈ T ist (dies aufgrund der Stetigkeit
von ζ) und sodass die Menge {θσ (ζ (γ)) ; σ ∈ T } nicht weniger als P + 1 Elemente
hat (dies aufgrund der Stetigkeit der P + 1 Funktionen θσ mit σ ∈ T ). Es gibt,
weil γ ∈ G, eine Nullstellenverfolgung τ : [a, γ] → C bis γ. Da τ (γ) Nullstelle von
pd
ist, da pd
wegen Lemma 3.2.3 höchstens P + 1 Nullstellen besitzt und da die
[
[
ζ(γ)
ζ(γ)
Elemente der P + 1-elementigen Menge {θσ (ζ (γ)) ; σ ∈ T } wegen der Äquivalenz 3.1
Nullstellen von pd
sind, ist τ (γ) ein Element dieser Menge, d. h. es gibt σ ∈ T mit
[
ζ(γ)
τ (γ) = θσ (ζ (γ)).
Damit definieren wir eine Fortsetzung ρ von τ :

ρ := 
[a, r] 3 α 7→


τ
(α)

θσ (ζ (α))

für α ∈ [a, γ] 
für α ∈ ]γ, r]

Diese Fortsetzung von τ hat folgende Eigenschaften:
1. Sie ist stetig, weil τ (γ) = θσ (ζ (γ)).
22
An dieser Stelle führt die in Fußnote 3 auf Seite 9 definierte Schreibweise für das Bild einer Menge
unter einer Funktion zur Schachtelung zweier eckiger Klammernpaare. Der Ausdruck ζ [[γ, r]]
bezeichnet nichts anderes als das Bild des Intervalls [γ, r] unter der Funktion ζ, d. h. die Menge
{ζ (α) ; α ∈ [γ, r]}.
79
3 Anwendung in der Theorie der partiellen Differentialgleichungen
2. Es gilt ρ (a) = t weil ρ (a) = τ (a).
3. Für alle α ∈ [a, r] ist die Zahl ρ (α) Nullstelle von pd
[ . Dies sieht man folgenζ(α)
dermaßen: Für α ∈ [a, γ] gilt ρ (α) = τ (α), weshalb ρ (α) Nullstelle von pd
[
ζ(α)
ist. Für α ∈ ]γ, r] verwenden wir die Äquivalenz 3.1: Es gilt (ζ (α) , θσ (ζ (α))) ∈
B (ζ (r) , δσ )×B (σ, εσ ) und damit pd
[ (θσ (ζ (α))) = 0. Also ist ρ (α) = θσ (ζ (α))
ζ(α)
Nullstelle von pd
[.
ζ(α)
Demzufolge ist ρ Nullstellenverfolgung bis r und damit r ∈ G, im Widerspruch zu
G = [a, r[. Wir haben indirekt gezeigt, dass G = [a, r].
Wir zeigen jetzt ebenfalls indirekt, dass r = b. Nehmen wir also an, es gelte r < b.
Dann könnte man wie folgt zeigen, dass das Intervall G rechtsoffen wäre:
Sei β ∈ G. Dann gibt es eine Nullstellenverfolgung τ : [a, β] → C bis β. Da der
Punkt ζ (β) in R liegt, folgt aus Lemma 3.2.3, dass Satz 3.2.2 anwendbar ist, d. h. es
gibt, weil τ (β) Nullstelle von pd
[ ist, ε > 0, δ > 0 und eine holomorphe Funktion
ζ(β)
θ : B (ζ (β) , δ) → B (τ (β) , ε), sodass
^
(pcû (v) = 0
⇔
θ (u) = v) .
(3.2)
(u, v) ∈ B (ζ (β) , δ) × B (τ (β) , ε)
Weil ζ stetig und β ≤ r < b ist, gibt es γ ∈ ]β, b], sodass ζ [[β, γ]] ⊆ B (ζ (β) , δ).
Damit definieren wir eine Fortsetzung ρ von τ :



τ
(α)

für α ∈ [a, β] 
ρ := [a, γ] 3 α 7→ 

θ (ζ (α)) für α ∈ ]β, γ]

Diese Fortsetzung von τ hat folgende Eigenschaften:
1. Sie ist stetig, weil τ (β) = θ (ζ (β)). Dies sieht man mit der Äquivalenz 3.2 wie
folgt: Weil (ζ (β) , τ (β)) ∈ B (ζ (β) , δ) × B (τ (β) , ε) und τ (β) Nullstelle von
pd
[ ist, gilt θ (ζ (β)) = τ (β).
ζ(β)
2. Es gilt ρ (a) = t, weil ρ (a) = τ (a).
3. Für alle α ∈ [a, γ] ist die Zahl ρ (α) Nullstelle von pd
[ . Dies sieht man wie folgt:
ζ(α)
Für α ∈ [a, β] ist ρ (α) gleich τ (α) und damit Nullstelle von pd
[ . Ansonsten,
ζ(α)
d. h. für α ∈ ]β, γ], kommt wieder Äquivalenz 3.2 zur Anwendung: Es gilt
(ζ (α) , θ (ζ (α))) ∈ B (ζ (β) , δ) × B (τ (β) , ε) und damit pd
[ (θ (ζ (α))) = 0.
ζ(α)
Wegen ρ (α) = θ (ζ (α)) ist also auch in diesem Fall ρ (α) Nullstelle von pd
[.
ζ(α)
80
3.2 Koeffizientenabhängigkeit der Nullstellen komplexer Polynome
Also ist ρ Nullstellenverfolgung bis γ und damit γ ∈ G. Wir haben unter der Annahme, die rechte Intervallgrenze r des Intervalls G sei kleiner als b, gezeigt, dass
das Intervall G rechtsoffen und damit G = [a, r[ wäre, im Widerspruch zur bereits
bewiesenen Gleichung G = [a, r].
Folglich gilt r = b, d. h. G = [a, b]. Es existiert eine Nullstellenverfolgung bis b.
Es folgt der Beweis der Eindeutigkeit:
Seien τ : [a, b] → C und σ : [a, b] → C Nullstellenverfolgungen bis b. Sei
G := {α ∈ [a, b] ; τ (α) = σ (α)} .
Dann ist G nicht leer, weil τ (a) = t = σ (a).
Außerdem ist G als Urbild der abgeschlossenen Menge {0} ⊆ C unter der stetigen
Funktion τ − σ abgeschlossen in [a, b].
Wir zeigen jetzt, dass G auch offen in [a, b] ist. Sei dazu α ∈ G. Weil ζ (α) ∈ R, folgt
aus Lemma 3.2.3, dass Satz 3.2.2 anwendbar ist, d. h. es gibt, weil τ (α) = σ (α) Nullstelle von pd
> 0, δ > 0 und eine holomorphe Funktion
[ ist, ε
ζ(α)
θ : B (ζ (α) , δ) → B (τ (α) , ε), sodass
^
(pcû (v) = 0
⇔
θ (u) = v) .
(3.3)
(u, v) ∈ B (ζ (α) , δ) × B (τ (α) , ε)
h
i
Es gibt dann γ > 0, sodass23 ζ B[a,b] (α, γ) ⊆ B (ζ (α) , δ) (dies, da ζ stetig) und
h
i
h
i
sodass τ B[a,b] (α, γ) ⊆ B (τ (α) , ε) und σ B[a,b] (α, γ) ⊆ B (τ (α) , ε) (dies, da τ und
σ stetig). Für alle β ∈ B[a,b] (α, γ) sind daher τ (β) und σ (β) in B (τ (α) , ε) liegende
Nullstellen von pd
[ . Mit der Äquivalenz 3.3 folgt, dass dann sowohl τ (β) = θ (ζ (β))
ζ(α)
als auch σ (β) = θ (ζ (β)), also τ (β) = σ (β), d. h. β ∈ G gilt. Wir haben gezeigt,
dass G offen in [a, b] ist.
Weil das Intervall [a, b] zusammenhängend ist, folgt, dass die in [a, b] offene, abgeschlossene und nichtleere Teilmenge G gleich [a, b] ist und die Eindeutigkeit ist
gezeigt.
Das folgende Lemma ist eine Verallgemeinerung des soeben bewiesenen Lemmas, bei
dem die rechte Intervallgrenze weder offen noch endlich sein muss:
23
Mit B[a,b] (α, γ) ist hier die γ-Kugel um α im Raum [a, b] gemeint, d. h. die Menge
{β ∈ [a, b] ; |β − α| < γ}.
81
3 Anwendung in der Theorie der partiellen Differentialgleichungen
Lemma 3.2.5. Seien P ∈ N, p ∈ (Ch1i)P +2 h1i, d := DisP (p) ∈ Ch1i,
ˆ a ∈ R, I ⊆ [a, ∞[ ein Intervall24 mit a ∈ I, ζ : I → R stetig
R := [C\ {0}] d,
und t ∈ C Nullstelle von pd
.
ζd
(a)
Dann gibt es genau eine stetige Funktion τ : I → C, sodass die Anfangsbedingung
τ (a) = t erfüllt ist und für alle α ∈ I die Zahl τ (α) Nullstelle von pd
[ ist.
ζ(α)
Beweis. Wir beweisen zuerst die Existenz:
Wegen Lemma 3.2.4 gibt es für alle α ∈ I genau eine stetige Funktion ρα : [a, α] → C,
sodass ρα (a) = t und sodass für alle β ∈ [a, α] die Zahl ρα (β) Nullstelle von pd
[ ist.
ζ(β)
Sei damit τ := (I 3 α 7→ ρα (α)).
Für alle α, β ∈ I mit a ≤ α ≤ β gilt aufgrund der Eindeutigkeit in Lemma 3.2.4
ρα = ρβ |[a,α] .
(3.4)
Wir zeigen jetzt, dass τ die behaupteten Eigenschaften erfüllt.
Wir weisen Stetigkeit in jedem Punkt nach. Sei dazu α ∈ I. Dann gibt es folgende
Fälle:
1. Fall α < sup I: Dann gibt es µ ∈ I mit α < µ und die Einschränkung τ |[a,µ] = ρµ
3.4
ist stetig und daher τ stetig an der Stelle α.
2. Fall α = sup I: Dann ist τ = ρα stetig und daher τ stetig an der Stelle α.
3.4
Weil τ (a) = ρa (a) und ρa die Anfangsbedingung erfüllt, gilt τ (a) = t.
Für alle α ∈ I ist τ (α) = ρα (α) Nullstelle von pd
[.
ζ(α)
Also ist die Existenz gezeigt. Es folgt der Beweis der Eindeutigkeit:
Seien τ : I → C und σ : I → C, sodass τ (a) = σ (a) = t und sodass für alle α ∈ I
die Zahlen τ (α) und σ (α) Nullstellen von pd
[ sind. Für alle α ∈ I sind dann die
ζ(α)
Einschränkungen τ |[a,α] und σ|[a,α] aufgrund der Eindeutigkeit in Lemma 3.2.4 gleich.
Also gilt τ = σ.
Das folgende Lemma ist eine Abwandlung des gerade bewiesenen Lemmas, das sich
von diesem einzig dadurch unterscheidet, dass die Nullstelle im gegenläufigen Sinn
verfolgt wird.
24
Unter einem Intervall verstehen wir eine zusammenhängende Teilmenge von R.
82
3.2 Koeffizientenabhängigkeit der Nullstellen komplexer Polynome
Lemma 3.2.6. Seien P ∈ N, p ∈ (Ch1i)P +2 h1i, d := DisP (p) ∈ Ch1i,
ˆ a ∈ R, I ⊆ ]−∞, a] ein Intervall mit a ∈ I, ζ : I → R stetig
R := [C\ {0}] d,
und t ∈ C Nullstelle von pd
.
ζd
(b)
Dann gibt es genau eine stetige Funktion τ : I → C, sodass die Anfangsbedingung
τ (a) = t erfüllt ist und für alle α ∈ I die Zahl τ (α) Nullstelle von pd
[ ist.
ζ(α)
Beweis. Die Behauptung ergibt sich durch Anwendung von Lemma 3.2.6 auf
ã := −a,25 I˜ := − [I] und ζ̃ := I˜ 3 α 7→ ζ (−α) .
Das folgende Lemma ist eine weitere Verallgemeinerung der letzten Lemmata auf den
Fall eines beliebigen Intervalls:
Lemma 3.2.7. Seien P ∈ N, p ∈ (Ch1i)P +2 h1i, d := DisP (p) ∈ Ch1i,
ˆ I ⊆ R ein Intervall, a ∈ I, ζ : I → R stetig und t ∈ C Nullstelle
R := [C\ {0}] d,
von pd
.
ζd
(a)
Dann gibt es genau eine stetige Funktion τ : I → C, sodass die Anfangsbedingung
τ (a) = t erfüllt ist und für alle α ∈ I die Zahl τ (α) Nullstelle von pd
[ ist.
ζ(α)
Beweis. Lemma 3.2.6 liefert eine stetige Funktion λ : ]−∞, a] ∩ I → C, sodass
λ (a) = t und sodass für alle α ∈ ]−∞, a] ∩ I die Zahl λ (α) Nullstelle von pd
[ ist.
ζ(α)
Lemma 3.2.5 liefert eine stetige Funktion ρ : [a, ∞[ ∩ I → C, sodass ρ (a) = t und
sodass für alle α ∈ [a, ∞[ ∩ I die Zahl ρ (α) Nullstelle von pd
[ ist.
ζ(α)
Die Definition



λ (α)
τ := I 3 α 7→ 
ρ (α)


für α ≤ a 
für α ≥ a

ist eindeutig, weil λ (a) = t = ρ (a).
Die Funktion τ ist stetig, weil λ und ρ stetig sind und der Anschluss bei a auch stetig
ist. Die Anfangsbedingung τ (a) = t ist wegen τ (a) = λ (a) erfüllt. Für alle α ∈ I
ist τ (α) Nullstelle von pd
[ , weil für α ≤ a die Zahl τ (α) = λ (α) und für α > a die
ζ(α)
Zahl τ (α) = ρ (α) Nullstelle von pd
[ ist.
ζ(α)
Die Existenz ist gezeigt, es folgt die Eindeutigkeit:
25
Mit − [I] ist hier die Menge {−α; α ∈ I} gemeint. Fasst man dabei die Negation − als die Funktion
(R 3 α 7→ −α) auf, erklärt sich die Schreibweise von selbst aus Fußnote 3 auf Seite 9.
83
3 Anwendung in der Theorie der partiellen Differentialgleichungen
Seien τ : I → C und σ : I → C, sodass τ (a) = σ (a) = t und sodass für alle α ∈ I die
Zahlen τ (α) und σ (α) Nullstellen von pd
[ sind. Aus der Eindeutigkeit in Lemma
ζ(α)
3.2.6 folgt, dass die beiden Einschränkungen τ |]−∞,a]∩I und σ|]−∞,a]∩I gleich sind und
aus der Eindeutigkeit in Lemma 3.2.5, dass die beiden Einschränkungen τ |[a,∞[∩I und
σ|[a,∞[∩I gleich sind. Also gilt τ = σ und die Eindeutigkeit ist gezeigt.
Zur Erleichterung der Formulierung des nächsten Satzes führen wir zunächst einige
Bezeichnungen ein.
Definition 3.2.8. Sei k ∈ N und 0 < δ 6= 1. Eine Funktion θ heißt (k + 1)-fache
1
δ-Auffaltung, falls26 D (θ) = B 0, δ k+1 , R (θ) ⊆ C und falls θ holomorph ist.
Definition 3.2.9. Sei 0 < δ 6= 1. Eine Funktion θ heißt δ-Auffaltung, falls es k ∈ N
gibt, sodass θ eine (k + 1)-fache δ-Auffaltung ist.
Definition 3.2.10. Sei 0 < δ 6= 1 und θ eine δ-Auffaltung. Da es dann genau ein
k ∈ N gibt, sodass θ eine (k + 1)-fache δ-Auffaltung ist27 , nennen wir k + 1 die
δ-Windungszahl von θ und schreiben dafür wdgδ (θ) := k + 1.
An den Stellen z ∈ C, an denen die Diskriminante verschwindet, ist Satz 3.2.2 nicht
anwendbar. Der folgende Satz aber schon:
Satz 3.2.11. Seien P ∈ N, p ∈ (Ch1i)P +2 h1i, d := DisP (p) ∈ Ch1i \ {0}, z ∈ C mit
pẑ 6= 0 und t ∈ C Nullstelle von pcẑ .
Dann gibt es ε > 0, 0 < δ 6= 1 und eine endliche, nichtleere Menge Θ von δ-Auffaltungen mit folgenden Eigenschaften:
1. Die Summe
P
θ∈Θ
wdgδ (θ) ist die Vielfachheit der Nullstelle t von pcẑ .
2. Für alle ζ ∈ B (z, δ) und alle Nullstellen τ ∈ B (t, ε) von pcζ̂ gibt es eine (und
falls ζ 6= z nur eine) δ-Auffaltung θ ∈ Θ und ein (und falls ζ 6= z nur ein)
ξ ∈ D (θ), sodass ζ = z + ξ wdgδ (θ) und θ (ξ) = τ .
3. Für alle θ ∈ Θ und alle ξ ∈ D (θ) gilt ζ := z + ξ wdgδ (θ) ∈ B (z, δ) und
τ := θ (ξ) ∈ B (t, ε) und τ ist eine Nullstelle von pcζ̂ .
26
Die Schreibweisen D (θ) und R (θ) für den Vor- und Nachbereich von Funktionen werden in
Fußnote 3 auf Seite 9 eingeführt.
27
Dies liegt daran, dass die Funktion R 3 r 7→ δ r wegen 0 < δ 6= 1 streng monoton ist. Die
Forderung δ 6= 1 benötigen wir an keiner anderen als an dieser Stelle. Es wäre möglich, auf die
Forderung δ 6= 1 zu verzichten, wenn man die Information über die Windungszahl auf andere
Weise mit θ verknüpfte – etwa durch die Definition von Auffaltungen als Paare aus holomorpher
Funktion und Windungszahl.
84
3.2 Koeffizientenabhängigkeit der Nullstellen komplexer Polynome
Beweis. Es gibt M ∈ N, sodass M + 1 die Vielfachheit der Nullstelle t von pcẑ ist.
Weil pcẑ 6= 0, gibt es ε > 0, sodass pcẑ keine Nullstellen auf B [t, ε] \ {t} besitzt. Dann
gibt es δ > 0, sodass für alle ζ ∈ B (z, δ)
die Funktion pcζ̂ keine Nullstellen auf {τ ∈ C; |τ − t| = ε} besitzt
(3.5)
und
M + 1 die Zahl der mit Vielfachheit gezählten Nullstellen von pcζ̂ auf B (t, ε) (3.6)
ist (dies nach Lemma 3.2.1), sodass dˆ keine Nullstellen auf B (z, δ) \ {z} besitzt (dies,
weil d ∈ Ch1i \ {0} und daher dˆ nur endlich viele Nullstellen besitzt) und sodass
δ 6= 1.
Insbesondere ist damit B (z, δ) \ {z} Teilmenge der Menge R := [C\ {0}] dˆ und wir
können die beiden Lemmata 3.2.2 und 3.2.3 auf in B (z, δ) \ {z} liegende Punkte und
Lemma 3.2.7 auf in B (z, δ) \ {z} verlaufende Wege anwenden.
Sei
T :=



ϕ ∈ B (t, ε)]−∞,ln(δ)[ stetig;
^


ϕ (x) Nullstelle von p[
[x .
z+e
x∈]−∞,ln(δ)[

Es folgt eine Überlegung, derzufolge T mindestens M + 1 Elemente hat: Der Weg
]−∞, ln (δ)[ 3 x 7→ z + ex
verläuft in B (z, δ) \ {z}. Es gibt y ∈ ]−∞, ln (δ)[. Wegen 3.6 hat p[
[y genau M + 1
z+e
Nullstellen auf B (t, ε). Nach Lemma 3.2.7 gibt es zu jeder dieser Nullstellen τ genau
eine stetige Funktion ϕ : ]−∞, ln (δ)[ → C mit ϕ (y) = τ und sodass für alle
x ∈ ]−∞, ln (δ)[ die Zahl ϕ (x) Nullstelle von p[
/ T , so gäbe es a ∈
[x ist. Wäre ϕ ∈
z+e
]−∞, ln (δ)[ mit ϕ (a)
∈
/
B (t, ε) und aufgrund der Stetigkeit von
]−∞, ln (δ)[ 3 x 7→ |ϕ (x) − t| ∈ R und wegen des Zwischenwertsatzes c ∈ ]−∞, ln (δ)[
mit ϕ (c) ∈ {τ ∈ C; |τ − t| = ε}. Dann wäre ϕ (c) eine Nullstelle von p[
[c
z+e
c
auf {τ ∈ C; |τ − t| = ε}, was wegen z + e ∈ B (z, δ) ein Widerspruch zu 3.5 wäre.
Also hat T mindestens M + 1 Elemente.
85
3 Anwendung in der Theorie der partiellen Differentialgleichungen
Stimmen zwei Funktionen aus T an einer Stelle aus ]−∞, ln (δ)[ überein,
so sind sie wegen der Eindeutigkeit aus Lemma 3.2.7 gleich.
(3.7)
Daher kann T nicht mehr als M + 1 Elemente haben (sonst besäße nämlich zu jedem
x ∈ ]−∞, ln (δ)[ die Polynomfunktion p[
[x mehr als M + 1 Nullstellen auf B (t, ε),
z+e
im Widerspruch zu 3.6). Die Zahl der Elemente von T beträgt demzufolge M + 1.
Die durch die M + 1 Elemente von T parametrisierten Nullstellen verfolgen wir jetzt
entlang konzentrischer Kreise um z: Für alle ϕ ∈ T gibt es genau eine Fortsetzung
Φϕ : {w ∈ C; Re (w) < ln (δ)} → B (t, ε) von ϕ, sodass
für alle x ∈ ]−∞, ln (δ)[ die Funktion R 3 α 7→ Φϕ (x + iα) ∈ C stetig
(3.8)
und für alle w ∈ D (Φϕ ) die Zahl Φϕ (w) Nullstelle von p[
z\
+ew ist,
(3.9)
was man wie folgt sieht: Für alle x ∈ ]−∞, ln (δ)[ verläuft
λx := R 3 α 7→ z + ex+iα
in B (z, δ) \ {z} und ist ϕ (x) Nullstelle von p[
. Wieder nach Lemma 3.2.7 gibt
\
λ
x (0)
es dann genau eine stetige Funktion ρx : R → C mit ρx (0) = ϕ (x), sodass für alle
α ∈ R die Zahl ρx (α) Nullstelle von p\
ist. Wenn also eine Fortsetzung Φϕ von ϕ
\
λ
x (α)
auf {w ∈ C; Re (w) < ln (δ)} mit den Eigenschaften 3.8 und 3.9 existiert, so muss sie
gleich
{w ∈ C; Re (w) < ln (δ)} 3 w 7→ ρRe(w) (Im (w))
sein. Für den Nachweis der Existenz bleibt nur noch zu zeigen, dass für alle
x ∈ ]−∞, ln (δ)[ die Funktion ρx nach B (t, ε) abbildet. Gäbe es β ∈ R mit
ρx (β) ∈
/ B (t, ε) so gäbe es aufgrund der Stetigkeit von R 3 α 7→ |ρx (α) − t| ∈ R und
wegen des Zwischenwertsatzes α ∈ R mit ρx (α) ∈ {τ ∈ C; |τ − t| = ε}. Das heißt,
ρx (α) wäre eine Nullstelle von p\
auf {τ ∈ C; |τ − t| = ε}, was wegen
\
λ
x (α)
λx (α) ∈ B (z, δ) ein Widerspruch zu 3.5 wäre. Es ist gezeigt, dass es genau eine
Fortsetzung Φϕ : {w ∈ C; Re (w) < ln (δ)} → B (t, ε) von ϕ mit 3.8 und 3.9 gibt.
Für alle w ∈ C mit Re (w) < ln (δ) und alle Nullstellen τ von p[
z\
+ew
gibt es genau eine Funktion ϕ ∈ T mit Φϕ (w) = τ ,
86
(3.10)
3.2 Koeffizientenabhängigkeit der Nullstellen komplexer Polynome
was man wie folgt sieht:
Sei y := Re (w) und β := Im (w). Wir betrachten den Weg λ := R 3 α 7→ z + ey+iα .
Weil λ (β) = z + ew , ist τ Nullstelle von pd
[ und es gibt nach Lemma 3.2.7 genau
λ(β)
eine stetige Funktion ρ : R → C mit ρ (β) = τ , sodass für alle α ∈ R die Zahl ρ (α)
x
Nullstelle von pd
[ ist. Betrachtet man den Weg ]−∞, ln (δ)[ 3 x 7→ z + e , so gibt
λ(α)
es, weil wegen z + ey = λ (0) die Zahl ρ (0) Nullstelle von p[
[y ist, ebenfalls nach
z+e
Lemma 3.2.7 genau eine Funktion ϕ ∈ T mit ϕ (y) = ρ (0).
Die Eindeutigkeit bei 3.10 sieht man jetzt wie folgt: Sei ψ ∈ T mit Φψ (w) = τ . Die
beiden Funktionen ρ und ν := (R 3 α 7→ Φψ (y + iα) ∈ C) sind stetig (letztere wegen
3.8). Für alle α ∈ R ist ihr Wert an der Stelle α eine Nullstelle von pd
[ (dies gilt
λ(α)
für ν wegen 3.9). Ihr Wert stimmt an der Stelle β überein (ρ (β) = τ = Φψ (w) =
Φψ (y + iβ) = ν (β)). Wieder nach Lemma 3.2.7 sind die beiden daher gleich und es
gilt ϕ (y) = ρ (0) = ν (0) = Φψ (y) = ψ (y). Wegen 3.7 gilt damit ϕ = ψ, was die
Eindeutigkeit zeigt.
Wie folgt überzeugt man sich davon, dass Φϕ (w) = τ : Die beiden Funktionen
ρ und κ := (R 3 α 7→ Φϕ (y + iα) ∈ C)
sind stetig (letztere wegen 3.8). Für alle α ∈ R ist ihr Wert an der Stelle α eine
Nullstelle von pd
[ (dies gilt für κ wegen 3.9). Ihr Wert stimmt an der Stelle 0
λ(α)
überein (ρ (0) = ϕ (y) = Φϕ (y) = κ (0)). Wieder nach Lemma 3.2.7 sind die beiden
daher gleich und es gilt Φϕ (w) = Φϕ (y + iβ) = κ (β) = ρ (β) = τ . Damit ist auch
die Existenz bei 3.10 gezeigt.
Von folgender Tatsache wird in diesem Beweis mehrfach Gebrauch gemacht werden:
28
Für alle v ∈ C mit Re (v) < ln (δ) und jede Nullstelle τ von p[
[v gibt es eine
z+e
holomorphe Funktion f mit v ∈ D (f ) ⊆ {w ∈ C; Re (w) < ln (δ)}
und f (v) = τ und eine Zahl κ > 0, sodass für alle u ∈ D (f )
die Zahl f (u) die einzige Nullstelle von p[
[u auf B (τ, κ) ist.
z+e
(3.11)
Dies sieht man wie folgt: Nach Lemma 3.2.2 gibt es, weil τ Nullstelle von p[
[v ist,
z+e
κ > 0 und eine holomorphe Funktion θ mit z + ev ∈ D (θ) ⊆ B (z, δ) \ {z}, sodass
für alle ζ ∈ D (θ) der Funktionswert θ (ζ) die einzige Nullstelle von pcζ̂ auf B (τ, κ)
28
Die Sprechweise „f ist eine holomorphe Funktion“ soll bedeuten, dass f Funktion, D (f ) ⊆ C
offen, R (f ) ⊆ C und f holomorph ist.
87
3 Anwendung in der Theorie der partiellen Differentialgleichungen
ist. Die Menge V := {u ∈ C; z + eu ∈ D (θ)} ist als Urbild der offenen Menge D (θ)
unter der stetigen Funktion C 3 u 7→ z + eu ∈ C offen und eine Teilmenge von
{w ∈ C; Re (w) < ln (δ)}, die v enthält. Damit ist f := (V 3 u 7→ θ (z + eu )) eine
Funktion mit den geforderten Eigenschaften.29
Wir zeigen jetzt, dass
für alle ϕ ∈ T die Funktion Φϕ holomorph ist,
(3.12)
indem wir jede Gerade {x + iα; α ∈ R} für x ∈ ]−∞, ln (δ)[ einzeln betrachten. Sei
also x ∈ ]−∞, ln (δ)[. Sei G := {α ∈ R; Φϕ ist holomorph an der Stelle x + iα}.
Wie folgt sieht man, dass dann G offen in R ist: Sei α ∈ G. Weil Φϕ (x + iα) nach
3.9 Nullstelle von p\
\
x+iα ist, gibt es nach 3.11 eine Zahl κ > 0 und eine holomorphe
z+e
Funktion f mit
x + iα ∈ D (f ) ⊆ {w ∈ C; Re (w) < ln (δ)} und f (x + iα) = Φϕ (x + iα) ,
sodass für alle u ∈ D (f ) der Funktionswert f (u) die einzige Nullstelle von p[
[u auf
z+e
B (Φϕ (x + iα) , κ) ist. Es gibt r > 0, sodass B (x + iα, r) ⊆ D (f ) (dies, weil D (f )
offen) und sodass f [B (x + iα, r)] ⊆ B (Φϕ (x + iα) , κ) (dies, weil α ∈ G und daher
Φϕ insbesondere stetig an der Stelle x + iα ist). Da für alle u ∈ B (x + iα, r) die
Zahl Φϕ (u) nach 3.9 Nullstelle von p[
[u und aufgrund der Wahl von r Element
z+e
von B (Φϕ (x + iα) , κ) ist, muss Φϕ (u) gleich der einzigen Nullstelle f (u) von p[
[u
z+e
auf B (Φϕ (x + iα) , κ) sein. Damit stimmt Φϕ auf B (x + iα, r) mit der holomorphen
Funktion f überein, es gilt30 BR (α, r) ⊆ G. Wir haben gezeigt, dass G offen in R ist.
Die Abgeschlossenheit von G zeigen wir mit dem Folgenkriterium. Seien dazu g ∈ GN
n→∞
und α ∈ R mit gn −→ α. Weil Φϕ (x + iα) nach 3.9 Nullstelle von p\
\
x+iα ist, gibt
z+e
es nach 3.11 eine Zahl κ > 0 und eine holomorphe Funktion f mit
x + iα ∈ D (f ) ⊆ {w ∈ C; Re (w) < ln (δ)} und f (x + iα) = Φϕ (x + iα) ,
sodass für alle u ∈ D (f ) der Funktionswert f (u) die einzige Nullstelle von p[
[u auf
z+e
B (Φϕ (x + iα) , κ) ist. Weil D (f ) offen, gibt es r > 0, sodass B (x + iα, r) ⊆ D (f ).
29
Dass D (f ) aus abzählbar vielen um Vielfache von 2πi gegeneinander verschobenen Zusammenhangskomponenten besteht, stört nicht.
30
Mit BR (α, r) ist die Menge {β ∈ R; |β − α| < r}, nicht die Menge B (α, r) = {w ∈ C; |w − α| < r}
gemeint.
88
3.2 Koeffizientenabhängigkeit der Nullstellen komplexer Polynome
Es gibt einen Folgenindex n ∈ N, sodass x + ign ∈ B (x + iα, r). Sei Ω := |gn − α|.
Es gibt Λ > 0, sodass die Strecke
S := {w ∈ C; |Re (w) − x| < Λ, Im (w) = gn }
in der Kreisscheibe B (x + iα, r) liegt und sodass f [S] ⊆ B (Φϕ (x + iα) , κ) (dies,
weil x + ign ∈ B (x + iα, r) und weil Φϕ wegen gn ∈ G stetig an der Stelle x + ign
ist). Da für alle u ∈ S die Zahl Φϕ (u) nach 3.9 Nullstelle von p[
[u und aufgrund
z+e
der Wahl von Λ Element von B (Φϕ (x + iα) , κ) ist, muss Φϕ (u) gleich der einzigen
Nullstelle f (u) von p[
[u auf B (Φϕ (x + iα) , κ) sein. Es gilt also Φϕ |S = f |S . Dass
z+e
diese beiden Funktionen sogar auf dem Rechteck
H := {w ∈ C; |Re (w) − x| < Λ, |Im (w) − α| ≤ Ω} ⊆ B (x + iα, r)
übereinstimmen, sieht man mit der Eindeutigkeit aus Lemma 3.2.7 folgendermaßen:
Sei y ∈ ]x − Λ, x + Λ[. Dann ist der Weg ζ := [α − Ω, α + Ω] 3 β 7→ z + ey+iβ
stetig, sind für alle β ∈ [α − Ω, α + Ω] die beiden Zahlen Φϕ (y + iβ) (diese nach 3.9)
und f (y + iβ) (diese nach Wahl von f ) Nullstellen von pd
[ und stimmen die beiden
ζ(β)
stetigen Funktionen
[α − Ω, α + Ω] 3 β 7→ Φϕ (y + iβ) und [α − Ω, α + Ω] 3 β 7→ f (y + iβ)
(die erste ist stetig wegen 3.8, die zweite weil f holomorph ist) an der Stelle gn wegen
y + ign ∈ S überein. Mit Lemma 3.2.7 folgt die Gleichheit von Φϕ und f auf der
Strecke {w ∈ C; Re (w) = y, |Im (w) − α| ≤ Ω}. Da dies für alle y ∈ ]x − Λ, x + Λ[
gilt, ist die Behauptung Φϕ |H = f |H gezeigt. Für Ω = 0 gilt α = gn ∈ G und
für Ω > 0 stimmt Φϕ in einer offenen Umgebung von x + iα mit der holomorphen
Funktion f überein, ist also holomorph bei x + iα, weshalb auch in diesem Fall α ∈ G
gilt. Wir haben gezeigt, dass der Grenzwert einer jeden in R konvergenten Folge mit
Gliedern aus G in G liegt, also ist G abgeschlossen wie behauptet.
Die dritte Eigenschaft von G, die hier gezeigt wird, ist, dass G nicht leer ist: Weil
Φϕ (x) nach 3.9 Nullstelle von p[
[x ist, gibt es nach 3.11 eine holomorphe Funktion
z+e
f mit
x ∈ D (f ) ⊆ {w ∈ C; Re (w) < ln (δ)} und f (x) = Φϕ (x) ,
sodass für alle u ∈ D (f ) die Zahl f (u) Nullstelle von p[
[u ist. Weil D (f ) offen
z+e
ist, gibt es r > 0, sodass das Quadrat H := {w ∈ C; |Re (w) − x| < r, |Im (w) < r|}
89
3 Anwendung in der Theorie der partiellen Differentialgleichungen
Teilmenge von D (f ) ist. Da Φϕ Fortsetzung der wegen ϕ ∈ T stetigen Funktion
ϕ ist (Φϕ |]−∞,ln(δ)[ = ϕ), ist die Funktion ]x − r, x + r[ 3 y 7→ Φϕ (y) stetig. Die
Funktion ]x − r, x + r[ 3 y 7→ f (y) ist ebenfalls stetig. Mit der Absicht, Lemma 3.2.7
anzuwenden, stellen wir fest, dass der Weg ζ := (]x − r, x + r[ 3 y 7→ z + ey ) stetig
ist. Weil ϕ ∈ T und wegen der Definition von T ist für alle y ∈ ]x − r, x + r[ der
Funktionswert Φϕ (y) Nullstelle der Polynomfunktion pd
. Für alle y ∈ ]x − r, x + r[
ζd
(y)
ist der Funktionswert f (y) ebenfalls Nullstelle der Polynomfunktion pd
. Da zuζd
(y)
dem Φϕ und f aufgrund der Wahl von f an der Stelle x übereinstimmen, folgt
aus der Eindeutigkeit aus Lemma 3.2.7, dass Φϕ |]x−r,x+r[ = f |]x−r,x+r[ . Wir zeigen
jetzt, dass sogar Φϕ |H = f |H gilt. Sei y ∈ ]x − r, x + r[. Dann ist die Funktion
ψ := ]−r, r[ 3 β 7→ z + ey+iβ stetig, für alle β ∈ ]−r, r[ sowohl die Zahl Φϕ (y + iβ)
Nullstelle von p[
[
[ (dies nach 3.9) als auch die Zahl f (y + iβ) Nullstelle von p
[
ψ(β)
ψ(β)
(dies nach Wahl von f ) und es stimmen die beiden stetigen Funktionen
]−r, r[ 3 β 7→ Φϕ (y + iβ) und ]−r, r[ 3 β 7→ f (y + iβ)
(die erste ist stetig wegen 3.8, die zweite weil f holomorph ist) an der Stelle 0 wegen Φϕ |]x−r,x+r[ = f |]x−r,x+r[ überein. Wieder mit Lemma 3.2.7 folgt die Gleichheit
von Φϕ und f auf der Strecke {w ∈ C; Re (w) = y, |Im (w)| < r}. Da dies für alle
y ∈ ]x − r, x + r[ gilt, ist die Behauptung Φϕ |H = f |H gezeigt. Also ist Φϕ an der
Stelle x holomorph und damit 0 ∈ G. Deshalb ist G nicht leer.
Als offene, abgeschlossene und nichtleere Teilmenge der zusammenhängenden Menge
R ist G gleich R. Wir haben gezeigt, dass für alle ϕ ∈ T und für alle x ∈ ]−∞, ln (δ)[
die Menge {α ∈ R; Φϕ ist holomorph an der Stelle x + iα} gleich R ist. Das heißt,
Behauptung 3.12 ist gezeigt.
Für alle s ∈ Z sei ηs := (C 3 w 7→ w + 2πis). Aus folgendem Grund ist31
für alle ϕ ∈ T und alle s ∈ Z die Funktion Φϕ ηs |R ein Element von T ,
31
(3.13)
Zu dem Ergebnis, dass die Funktion Φϕ ηs |R gleich ]−∞, ln (δ)[ 3 x 7→ Φϕ (x + 2πis) ist, kommt
man sowohl wenn man sie als Verkettung mit einer Einschränkung Φϕ (ηs |R ) betrachtet (bei
dieser Verkettung gilt R (ηs |R ) * D (Φϕ ), siehe dazu Fußnote 32 auf Seite 45) als auch wenn
man sie als eingeschränkte Verkettung (Φϕ ηs ) |R betrachtet (bei dieser Einschränkung gilt
R * D (Φϕ ηs ), was aber auch nicht tragisch ist, wenn man die Einschränkung r|M einer Relation r auf eine Menge M , die nicht notwendigerweise M ⊆ D (r) erfüllt, als die Relation
{(a, b) ; (a, b) ∈ r, a ∈ M } auffasst).
Es wäre auch möglich, einfach Φϕ ηs |]−∞,ln(δ)[ anstelle von Φϕ ηs |R zu schreiben, der Ausdruck
taucht aber im Folgenden häufig auf, weshalb die kürzere Schreibweise bevorzugt wird.
90
3.2 Koeffizientenabhängigkeit der Nullstellen komplexer Polynome
das heißt, die Umrundungen führen nicht aus T heraus: Nach Wahl von Φϕ gilt
R (Φϕ ) ⊆ B (t, ε) und daher auch R (Φϕ ηs |R ) ⊆ B (t, ε). Weil für alle x ∈ ]−∞, ln (δ)[
und damit wegen eηs (x) = ex
die Zahl Φϕ ηs (x) wegen 3.9 Nullstelle von p\
\
ηs (x)
z+e
Nullstelle von p[
[x ist und außerdem Φϕ ηs |R nach 3.12 stetig ist, gilt wie behauptet
z+e
Φϕ ηs |R ∈ T .
Damit wird das Aufstellen folgender Behauptung möglich: Für alle ϕ ∈ T und alle
s ∈ Z gilt32
ΦΦϕ ηs |R = Φϕ ηs .
(3.14)
Diese Behauptung ist wahr, weil Φϕ ηs eine Fortsetzung von Φϕ ηs |R ist, die die vertikale Stetigkeitsforderung 3.8 erfüllt und weil für alle w ∈ D (Φϕ ηs ) die Zahl Φϕ ηs (w)
wegen 3.9 Nullstelle von pz+e
\
, damit wegen eηs (w) = ew Nullstelle von p[
\
ηs (w)
z\
+ew ist,
folglich Φϕ ηs zudem die Forderung 3.9 erfüllt und damit Φϕ ηs gleich der einzigen
Funktion ΦΦσ ηs |R mit diesen Eigenschaften ist.
Wir zeigen jetzt, dass die durch
∼:= {(ϕ, ψ) ∈ T × T ; ∃s ∈ Z : ψ = Φϕ ηs |R }
definierte Relation eine Äquivalenzrelation auf T ist:
Sie ist reflexiv auf T , weil für alle ϕ ∈ T eine Zahl s ∈ Z existiert (nämlich s = 0),
sodass ϕ = Φϕ ηs |R , was zeigt, dass ϕ ∼ ϕ.
Dass sie symmetrisch ist, sieht man wie folgt: Seien ϕ, ψ ∈ T mit ϕ ∼ ψ. Dann gibt
es s ∈ Z, sodass ψ = Φϕ ηs |R . Damit gilt ϕ = Φϕ η0 |R = Φϕ ηs η−s |R = ΦΦϕ ηs |R η−s |R =
3.14
Φψ η−s |R und folglich ψ ∼ ϕ.
Zum Nachweis der Transitivität seien ϕ, ψ und σ ∈ T mit ϕ ∼ ψ und ψ ∼ σ. Dann
gibt es r, s ∈ Z, sodass ψ = Φϕ ηr |R und σ = Φψ ηs |R . Damit gilt σ = Φψ ηs |R =
ΦΦϕ ηr |R ηs |R = Φϕ ηr ηs |R = Φϕ ηr+s |R , woraus ϕ ∼ σ folgt.
3.14
Also ist ∼ eine Äquivalenzrelation auf der M + 1-elementigen Menge T . Sei K := T/∼
die Menge der Äquivalenzklassen bezüglich ∼.
Es gibt eine Menge S ⊆ T , die genau einen Repräsentanten pro Äquivalenzklasse
enthält. Zu jedem Repräsentanten ϕ ∈ S konstruieren wir jetzt eine δ-Auffaltung:
32
Auch der Ausdruck Φϕ ηs auf der rechten
gen Fußnote 32 auf Seite 45 trotz R (ηs )
{w ∈ C; Re (w) < ln (δ)} 3 w 7→ Φσ (w + 2πis).
Seite von Gleichung 3.14 ist we* D (Φϕ ) definiert; er ist gleich
91
3 Anwendung in der Theorie der partiellen Differentialgleichungen
Sei ϕ ∈ S. Dann gibt es genau eine Äquivalenzklasse K ∈ K mit ϕ ∈ K. Es gibt
k ∈ N, sodass k + 1 die Zahl der Elemente von K ist.
Wir zeigen jetzt, dass
Φϕ eine 2πi (k + 1) -periodische Funktion ist und dass alle
g ∈ Z mit ϕ = Φϕ ηg |R ganzzahlige Vielfache von k + 1 sind:
(3.15)
Die Funktion Z 3 a 7→ Φϕ ηa |R nimmt wegen 3.13 und aufgrund der Definition von ∼
nur Werte in der Äquivalenzklasse K an und ist wegen deren Endlichkeit nicht injektiv. Es gibt also zwei Zahlen r, s ∈ Z mit r < s und Φϕ ηr |R = Φϕ ηs |R , sodass es
keine zwei Zahlen r̃, s̃ ∈ Z mit r̃ < s̃, Φϕ ηr̃ |R = Φϕ ηs̃ |R und s̃ − r̃ < s − r gibt (d. h.
r und s sind mit minimalem Abstand wählbar). Weil
Φϕ = Φϕ ηr η−r = ΦΦϕ ηr |R η−r = ΦΦϕ ηs |R η−r = Φϕ ηs η−r = Φϕ ηs−r ,
3.14
3.14
ist Φϕ eine 2πi (s − r)-periodische Funktion. Da alle Elemente von K als Werte
der mit eben Bewiesenem (s − r)-periodischen Funktion Z 3 a 7→ Φϕ ηa |R auftauchen, kann s − r nicht kleiner sein als die Zahl dieser Elemente, d. h. es gilt
s − r ≥ k + 1. Da die Elemente von K die einzigen sind, die als Werte der Funktion
{n ∈ N; n < s − r} 3 a 7→ Φϕ ηa |R auftauchen, könnte diese, weil ihr Definitionsbereich (s − r)-elementig ist, im Fall s − r > k + 1 nicht injektiv sein und es gäbe
zwei Zahlen r̃, s̃ ∈ {n ∈ N; n < s − r} mit r̃ < s̃ und Φϕ ηr̃ |R = Φϕ ηs̃ |R . Weil dann
s̃ − r̃ < s − r wäre, ist dies nicht möglich und es gilt s − r ≤ k + 1. Es folgt also
s − r = k + 1. Der erste Teil von Behauptung 3.15 ist gezeigt.
Sei nun g ∈ Z mit ϕ = Φϕ ηg |R . Es gibt genau eine ganze Zahl m ∈ Z mit
g
∈ ]m, m + 1]. Mit r̃ := (k + 1) m und s̃ := g gilt r̃ < s̃. Aufgrund der bereits
k+1
gezeigten 2πi (k + 1)-Periodizität von Φϕ gilt Φϕ = Φϕ η(k+1)m . Es folgt
Φϕ ηr̃ = Φϕ η(k+1)m = Φϕ = ΦΦϕ ηg |R = Φϕ ηg = Φϕ ηs̃ .
3.14
Da damit der Fall s̃ − r̃ < s − r ausgeschlossen ist, gilt g = s̃ ≥ s − r + r̃ =
k + 1 + (k + 1) m = (k + 1) (m + 1). Weil aufgrund der Wahl von m außerdem g ≤
(k + 1) (m + 1) gilt, ist g = (k + 1) (m + 1) ganzzahliges Vielfaches von k + 1 und
auch der zweite Teil von Behauptung 3.15 gezeigt.
1
Sei V := B 0, δ k+1 \ {0}. Für alle ξ ∈ V ist die Menge33 (k + 1) [[{ξ}] exp] unendlich
33
Ähnlich wie bei der Definition der Schreibweise − [I] in Fußnote 25 auf Seite 83 verstehen wir für
92
3.2 Koeffizientenabhängigkeit der Nullstellen komplexer Polynome
und Teilmenge von {w ∈ C; Re (w) < ln (δ)} (letzteres, weil für
w ∈ (k + 1) [[{ξ}] exp] aus der Annahme Re (w) ≥ ln (δ) folgen würde, dass
|ξ| =
exp
alle
1
w
w 1
ln (δ) = δ k+1
≥ exp
= exp Re
k+1
k+1
k+1
v
w
und damit ξ ∈
/ V ). Für je zwei v, w ∈ (k + 1) [[{ξ}] exp] gilt e k+1 = e k+1 und ist
ein ganzzahliges Vielfaches von 2πi, d. h. w − v ein ganzdeshalb die Differenz w−v
k+1
zahliges Vielfaches von 2πi (k + 1). Daraus folgt, weil Φϕ nach 3.15 eine 2πi (k + 1)periodische Funktion ist, dass das Bild Φϕ [(k + 1) [[{ξ}] exp]] ⊆ C einelementig ist.
Mit diesem Wissen definieren wir die Funktion34

θ := V ∪ {0} 3 ξ 7→



∈

(Φϕ [(k + 1) [[{ξ}] exp]]) , wenn ξ ∈ V 
, wenn ξ = 0

t
.
(3.16)
Für alle ξ ∈ D (θ) gilt
ζ := z + ξ k+1 ∈ B (z, δ) und τ := θ (ξ) ∈ B (t, ε) und τ ist Nullstelle von pcζ̂ , (3.17)
letzteres, weil für ξ = 0 die Zahl θ (0) = t Nullstelle von pcẑ ist und es für ξ ∈ V eine
Zahl w ∈ (k + 1) [[{ξ}] exp] gibt, womit wegen 3.9 die Zahl Φϕ (w) Nullstelle von p[
z\
+ew
w
ist und dies wegen Φϕ (w) = θ (ξ) = τ und wegen z+ew = z+ e k+1
bedeutet, dass τ Nullstelle von pcζ̂ ist.
k+1
= z+ξ k+1 = ζ
Es folgt eine Überlegung, derzufolge θ eine (k + 1)-fache δ-Auffaltung ist: Aufgrund
1
der Wahl von δ gilt 0 < δ 6= 1. Aufgrund der Definition von V gilt D (θ) = B 0, δ k+1
und aufgrund der Definition von θ gilt R (θ) ⊆ C. Wie folgt überzeugt man sich davon,
dass θ holomorph auf V ist: Sei ξ ∈ V . Dann gibt es w ∈ (k + 1) [[{ξ}] exp]. Die auf
der offenen Kreisscheibe S := B (w, π) definierte Funktion
w
E := S 3 w 7→ e k+1
I ⊆ C und c ∈ C unter c [I] die Menge {cj; j ∈ I}. Auch hier ergibt sich die Schreibweise aus der
Definition des Nachbereichs in Fußnote 3 auf Seite 9, wenn man c als die Funktion C 3 j 7→ cj
auffasst.
u
n Hier gilt also (k
o + 1) [[{ξ}] exp] = {(k + 1) u; u ∈ [{ξ}] exp} = {(k + 1) u; u ∈ C, e = ξ} =
w
w ∈ C; e k+1 = ξ .
34
Nach Fußnote 27 auf Seite 39 ist ∈ (Φϕ [(k + 1) [[{ξ}] exp]]) das Element der einelementigen Menge
Φϕ [(k + 1) [[{ξ}] exp]].
93
3 Anwendung in der Theorie der partiellen Differentialgleichungen
ist injektiv (weil der Radius von S klein genug gewählt ist) und von nichtverschwindender Ableitung. Ihre Inverse L := E −1 ist deshalb holomorph. Die Menge
D (L) = R (E) ist, weil E (w) = ξ, eine offene Umgebung von ξ. Für alle ψ ∈ D (L)
gilt ψ = E (L (ψ)), deshalb L (ψ) ∈ (k + 1) [[{ψ}] exp] und deshalb
Φϕ (L (ψ)) =∈ (Φϕ [(k + 1) [[{ξ}] exp]]) .
Es ist also θ|D(L) = Φϕ L als Verkettung zweier holomorpher Funktionen holomorph.
Weil dies für alle ξ ∈ V gilt, ist θ holomorph auf V . Die Stelle 0 ∈ D (θ) ist der
einzige Punkt, an dem die Holomorphie von θ noch nicht gezeigt wurde. Da Φϕ und
damit auch θ beschränkt ist, gibt es nach dem Riemannschen Hebbarkeitssatz (siehe
z.B. [Fre, S. 130]) eine holomorphe Funktion h : D (θ) → C, sodass h|V = θ|V . Dass
h (0) = t (d. h., dass mit t der richtige Funktionswert für θ (0) gewählt wurde), sieht
man folgendermaßen: Wäre h (0) 6= t, so wäre |h (0) − t| > 0 und es gäbe, weil h
1
stetig bei 0 ist, eine Zahl ρ > 0 mit ρ ≤ δ k+1 , sodass für alle ξ ∈ B (0, ρ) \ {0} die
Ungleichung
1
|θ (ξ) − t| = |h (ξ) − t| > |h (0) − t| =: γ
2
gelten würde. Wegen γ ≤ ε besäße pcẑ keine Nullstellen auf B [t, γ] \ {t}. Nach Lemma
3.2.1 gäbe es dann β > 0, sodass für alle ζ ∈ B (z, β) die mit Vielfachheit gezählte
Zahl der Nullstellen von pcζ̂ auf B (t, γ) gleich M + 1 wäre. Es gäbe ξ ∈ B (0, ρ) \ {0}
mit ζ := z + ξ k+1 ∈ B (z, β). Die Polynomfunktion pcζ̂ besäße genau M + 1 mit
Vielfachheit gezählte Nullstellen auf B (t, ε). Nach 3.17 wäre θ (ξ) eine Nullstelle von
pcζ̂ , die wegen |θ (ξ) − t| > γ in B (t, ε) \B (t, γ) läge. Nach 3.6 kann pcζ̂ aber nicht
mehr als M + 1 mit Vielfachheit gezählte Nullstellen auf B (t, ε) haben. Deshalb gilt
h (0) = t. Wir haben gezeigt, dass θ holomorph ist. Damit ist θ eine (k + 1)-fache
δ-Auffaltung.
Zu jedem Repräsentanten ϕ ∈ S haben wir eine δ-Auffaltung konstruiert. Sei Θ die
Menge dieser δ-Auffaltungen.
Dass keinen zwei voneinander verschiedenen Repräsentanten ϕ und ψ aus S bei dieser
Konstruktion die selbe δ-Auffaltung θ zugeordnet wird, hat folgenden Grund: Die
Äquivalenzklassen, zu denen ϕ und ψ gehören, würden in der Zahl ihrer Elemente
übereinstimmen – diese wäre gleich wdgδ (θ). Es gibt w ∈ C mit Re (w) < ln (δ),
1
w
womit ξ := e wdgδ (θ) wegen |ξ| = exp Re wdgw (θ) < δ wdgδ (θ) Element von D (θ) und
δ
94
3.2 Koeffizientenabhängigkeit der Nullstellen komplexer Polynome
w ∈ wdgδ (θ) [[{ξ}] exp] wäre. Damit wäre
Φϕ (w) =∈ (Φϕ [wdgδ (θ) [[{ξ}] exp]]) = θ (ξ) =
3.16
3.16
∈ (Φψ [wdgδ (θ) [[{ξ}] exp]]) = Φψ (w) .
Mit 3.10 würde folgen, dass ϕ = ψ. Verschiedenen Repräsentanten aus S werden also
verschiedene δ-Auffaltungen zugeordnet.
Damit kann Punkt 1 aus Satz 3.2.11 bewiesen werden: Die Vielfachheit der Nullstelle
P
P
t von pcẑ ist gleich35 M + 1 = #T = K∈K #K = θ∈Θ wdgδ (θ).
Punkt 3 aus Satz 3.2.11 ist mit dem Wissen, dass jede Funktion θ ∈ Θ eine δ-Auffaltung ist, eine direkte Folgerung aus 3.17.
Es fehlt also nur noch der Beweis von Punkt 2 aus Satz 3.2.11.
Sei dazu ζ ∈ B (z, δ) und τ ∈ B (t, ε) Nullstelle von pcζ̂ . Im Fall ζ = z folgt die
Behauptung aus dem Umstand, dass t die einzige Nullstelle von pcẑ auf B (t, ε) ist
und alle δ-Auffaltungen aus Θ die Zahl 0 auf t abbilden. Sei also ζ ∈ B (z, δ) \ {z}.
Dann gibt es w ∈ C mit Re (w) < ln (δ) und ζ = z +ew . Nach 3.10 gibt es dann genau
eine Funktion ϕ ∈ T mit Φϕ (w) = τ . Es gibt genau einen Repräsentanten ψ ∈ S
mit ϕ ∼ ψ. Es gibt daher s ∈ Z, sodass ψ = Φϕ ηs |R . Sei θ die zum Repräsentanten
ψ konstruierte δ-Auffaltung aus Θ. Sei u := w − 2πis. Dann gilt
Φψ (u) = ΦΦϕ ηs |R (u) = Φϕ ηs (u) = Φϕ (u + 2πis) = Φϕ (w) = τ .
3.14
u
Sei ξ := e wdgδ (θ) . Dann gilt ξ ∈ D (θ), weil
Re (u)
|ξ| = exp
wdgδ (θ)
!
Re (w)
= exp
wdgδ (θ)
!
!
1
1
< exp
ln (δ) = δ wdgδ (θ) .
wdgδ (θ)
Außerdem gilt z + ξ wdgδ (θ) = z + eu = z + ew = ζ und weil u wegen der Wahl von ξ
ein Element von wdgδ (θ) [[{ξ}] exp] ist,
θ (ξ) = ∈ (Φψ [wdgδ (θ) [[{ξ}] exp]]) = Φψ (u) = τ .
3.16
Die in Punkt 3 von Satz 3.2.11 behauptete Existenz ist damit gezeigt.
Es folgt der Beweis der Eindeutigkeit: Seien θ ∈ Θ2 und ξ ∈ D (θ0 ) × D (θ1 ), sodass
35
Für eine endliche Menge T bezeichne #T die Zahl der Elemente von T .
95
3 Anwendung in der Theorie der partiellen Differentialgleichungen
für beide36 j ∈ 2 die Gleichungen
ζ = z + ξj wdgδ (θj ) und θj (ξj ) = τ
gelten. Für beide j ∈ 2 ist dann folgende Überlegung möglich: Es gibt wj ∈ C, sodass
wj
ξj = e
( ) . Es gilt Re (w ) < ln (δ), weil andernfalls |ξ | = exp
j
j
wdgδ θj
1
1
Re (wj )
wdgδ (θj )
≥
δ wdgδ (θj ) und damit ξj ∈
/ D (θj ) wäre. Es gibt einen Repräsentanten ϕj ∈ S, sodass θj
die zu ϕj konstruierte δ-Auffaltung ist. Weil wj ein Element von wdgδ (θj ) [[{ξj }] exp]
ist, gilt damit
τ = θj (ξj ) = ∈ Φϕj [wdgδ (θj ) [[{ξj }] exp]] = Φϕj (wj ) .
3.16
Wegen ew0 = ξ0 wdgδ (θ0 ) = ζ − z = ξ1 wdgδ (θ1 ) = ew1 ist w0 − w1 ein ganzzahliges
Vielfaches von 2πi. Es gibt also s ∈ Z, sodass w1 = w0 + 2πis. Der Wert der beiden
Funktionen Φϕ0 und ΦΦϕ1 ηs |R stimmt an der Stelle w0 wegen
Φϕ0 (w0 ) = τ = Φϕ1 (w1 ) = Φϕ1 ηs (w0 ) = ΦΦϕ1 ηs |R (w1 )
3.14
überein. Nach 3.10 gilt damit ϕ0 = Φϕ1 ηs |R . Das wiederum bedeutet, dass ϕ0 ∼ ϕ1 .
Da ϕ0 und ϕ1 Repräsentanten aus S sind, folgt daraus ϕ0 = ϕ1 . Damit gilt auch
θ0 = θ1 und wdgδ (θ0 ) = wdgδ (θ1 ). Aus ϕ0 = Φϕ0 ηs |R folgt mit 3.15, dass s ein
ganzzahliges Vielfaches von wdgδ (θ0 ) ist. Es gibt also m ∈ Z mit s = m wdgδ (θ0 ).
Damit gilt
w1
w0 +2πis
ξ1 = e wdgδ (θ1 ) = e wdgδ (θ1 ) = e
w0 +2πim wdgδ (θ0 )
wdgδ (θ1 )
w0
= e wdgδ (θ1 )
+2πim
w0
= e wdgδ (θ0 ) = ξ0 .
Mit der Feststellung, dass die in Punkt 2 behauptete Eindeutigkeit gezeigt ist, endet
der Beweis von Satz 3.2.11.
Bemerkung 3.2.12 (Puiseux-Reihen). Die Elemente der unter den Voraussetzungen
von Satz 3.2.11 existierenden Menge Θ sind auf Kreisscheiben mit Mittelpunkt 0 ∈ C
definierte holomorphe Funktionen und deshalb in Potenzreihen um 0 ∈ C entwickelbar. Für alle θ ∈ Θ gibt es also eine Koeffizientenfolge c (θ) ∈ CN , sodass für alle
P
ξ ∈ D (θ) die Gleichung θ (ξ) = n∈N c (θ)n ξ n gilt.
Punkt 2 von Satz 3.2.11 lässt sich damit wie folgt interpretieren: Für alle ζ ∈ B (z, δ)
36
Nach Bemerkung 1.1.1 auf Seite 9 gilt 2 = {0, 1}.
96
3.3 Untere Abschätzung positiver Polynome
und alle Nullstellen τ ∈ B (t, ε) von pcζ̂ gibt es eine (und falls ζ 6= z nur eine) δ-Auffaltung θ ∈ Θ und eine (und falls ζ 6= z nur eine) wdgδ (θ)-te Wurzel ξ ∈ D (θ) von
ζ − z, sodass
X
n
τ=
c (θ)n (ζ − z) wdgδ (θ) ,
n∈N
wobei die Potenz (ζ − z)
n
wdgδ (θ)
als ξ n zu lesen ist.
Punkt 3 von Satz 3.2.11 lässt sich ebenfalls auf diese Weise interpretieren: Für alle
θ ∈ Θ, alle ζ ∈ B (z, δ) und alle wdgδ (θ)-ten Wurzeln ξ ∈ D (θ) von ζ − z ist
n
X
c (θ)n (ζ − z) wdgδ (θ) ∈ B (t, ε)
n∈N
n
eine Nullstelle von pcζ̂ , wobei die Potenz (ζ − z) wdgδ (θ) als ξ n zu lesen ist.
Eine Potenzreihe mit gebrochenem Exponenten wie sie hier auftaucht wird PuiseuxReihe genannt (siehe [Hör, S. 364] oder [Voi]).
3.3 Untere Abschätzung positiver Polynome
Ziel dieses Abschnitts ist es, zu beweisen, dass jede auf Rn positive Polynomfunktion
von unten durch eine Funktion
Rn 3 x 7→ C 1 + |x|2
−N
mit C > 0 und N ∈ N abgeschätzt werden kann. Für n = 1 ist diese Aussage offensichtlich, da dann jede positive Polynomfunktion sogar durch eine positive Konstante
von unten abgeschätzt werden kann. Dass diese Eigenschaft in höheren Dimensionen
verloren geht, zeigt folgendes aus [Hör, S. 369] entnommene Beispiel: Die Polynomfunktion
R2 3 x 7→ (x0 x1 − 1)2 + x20
ist positiv, weil die Quadrate (x0 x1 − 1)2 und x20 nicht zugleich null werden können.
Sie nimmt jede positive Zahl als Funktionswert an, weil sie für alle ε > 0 das Paar
ε1/2 , ε−1/2 auf ε abbildet. Also kann sie nicht durch eine positive Konstante von
unten abgeschätzt werden.
97
3 Anwendung in der Theorie der partiellen Differentialgleichungen
Lemma 3.3.1. Sei37 p ∈ (Ch1i)h1i irreduzibel38 mit deg p > 0 und z ∈ C. Dann
gilt39 pẑ ∈ Ch1i \ {0}.
Beweis. Nur innerhalb dieses Beweises treffen wir folgende Konvention: Für M ⊆ N
endlich sei mit 1M die Indikatorfunktion, die von N nach C abbildet und damit
Element von Ch1i ist, gemeint, und mit 1M die Indikatorfunktion, die von N nach
Ch1i abbildet und damit Element von (Ch1i)h1i ist. Diese Unterscheidung ist zur
Vermeidung von Zweideutigkeiten notwendig.
Auch nur innerhalb dieses
Beweises
definieren wir: Für a ∈ (Ch1i)h1i sei tr (a)
das Polynom tr (a) :=
(aα )β
α∈N β∈N
∈ (Ch1i)h1i. Es ist das durch Vertauschen
(Transponieren) der Indizes, d. h. durch Vertauschen der Variablen aus dem Polynom
a hervorgehende Polynom40 .
Für alle a ∈ (Ch1i)h1i gilt tr (tr (a)) = a, weil für alle α, β ∈ N die Gleichung
(tr (tr (a))α )β = tr (a)β = (aα )β gilt.
α
Für alle a, b ∈ (Ch1i)h1i gilt tr (a b) = tr (a) tr (b), weil für alle α, β ∈ N die Gleichung

tr (a b)β
X γ+δ=α
α
= ((a b)α )β = 
tr (a)β

X
γ+δ=α
γ
tr (b)β
δ
= tr (a)β tr (b)β
(aγ )β (bδ )β =
γ+δ=α
β
X
aγ bδ  =
α
= (tr (a) tr (b))β
α
gilt.
Die Eins im Polynomring (Ch1i)h1i ist das Polynom 1{0} . Es gilt tr 1{0} = 1{0} ,
was man durch Anwendung der Kürzungsregel (Lemma 1.4.3 auf Seite 20) auf die
Gleichung tr 1{0} ·1{0} = tr 1{0} · 1{0} = tr 1{0} tr 1{0} sieht (anwendbar, weil
aus tr 1{0} = 0 folgen würde, dass 1{0} = tr tr 1{0}
kein Nullteiler ist).
37
= tr (0) = 0, weshalb 1{0}
Die Notation Rh1i für die Menge der Polynome in einer Variablen über einem Ring R wird in
Definition 1.1.2 auf Seite 9 eingeführt.
38
In Definition 1.4.7 auf Seite 21 wird der Begriff der Irreduzibilität definiert.
39
Die Schreibweise px̂ für Polynome p ∈ (Rh1i)h1i und x ∈ R wird in Definition 1.1.8 auf Seite 12
eingeführt.
40
Anschaulich passiert Folgendes: Würde man a ein Polynom in der Variablen t mit Koeffizienten,
die komplexe Polynome in der Variablen z sind, nennen, so würde man tr (a) das Polynom
nennen, dass aus p durch Umordnung der Terme hervorgeht und ein Polynom in der Variablen
z mit Koeffizienten, die komplexe Polynome in der Variablen t sind, nennen.
98
3.3 Untere Abschätzung positiver Polynome
Ist a ∈ (Ch1i)h1i eine Einheit, so gibt es b ∈ (Ch1i)h1i mit a b = 1{0} . Damit
gilt 1{0} = tr 1{0} = tr (a b) = tr (a) tr (b), weshalb tr (a) ebenfalls eine Einheit
ist. Ist umgekehrt a ∈ (Ch1i)h1i ein Polynom, sodass tr (a) eine Einheit ist, so ist
a = tr (tr (a)) eine Einheit. Ein Polynom a ∈ (Ch1i)h1i ist also genau dann eine
Einheit, wenn tr (a) eine Einheit ist.
Nach diesen Vorbereitungen kommen wir jetzt zum Beweis. Wäre pẑ = 0, so wäre
[
(p) (z) =
tr
X
tr (p)β z β =
β∈N
X
(pα )β
β∈N
α∈N
zβ =


X

(pα )β z β 
β∈N
= (pcα (z))α∈N = pẑ = 0.
α∈N
Nach Kriterium 2.1.17 auf Seite 32 wäre b := 1{1} − z1{0} ein Teiler von tr (p), d. h.
es gäbe q ∈ (Ch1i)h1i mit tr (p) = b q. Dann wäre
tr (b) tr (q) = tr (b q) = tr (tr (p)) = p.
(3.18)
Man sähe dann wie folgt, dass weder tr (b) noch tr (q) Einheiten wären und deshalb
p im Widerspruch zur Voraussetzung nicht irreduzibel wäre:
Weil deg b = 1, ist b keine Einheit41 und damit auch tr (b) keine Einheit.
Weil für alle α, β ∈ N die Geichung (bβ )α =


−z1{0}



 1
 {0}




0



 1{1}


0

1{1} − z1{0}

β
=
α

−z
für β = 0 






=
für β = 1 
1
für α = β = 0
sonst
sonst
− z1{0}

α



0
für α = 0, β =



1


=
α

für α = 0 
sonst
=

1{1} − z1{0} 1{0}
β
α
β
gilt, gilt tr (b) = 1{1} − z1{0} 1{0} und damit deg (tr (b)) = 0. Aus Gleichung 3.18
ergäbe sich damit deg (tr (q)) = deg p > 0, weshalb auch tr (b) keine Einheit wäre41 .
41
Siehe Fußnote 20 auf Seite 22.
99
3 Anwendung in der Theorie der partiellen Differentialgleichungen
Lemma 3.3.2. Sei f : R → R semialgebraisch42 . Dann gibt es eine endliche Menge
Q ⊆ (Ch1i)h1i, sodass
∀q ∈ Q :
q irreduzibel und deg q > 0
und
∀z ∈ R∃q ∈ Q :
qẑ 6= 0 und f (z) ist Nullstelle von qcẑ .
Beweis. Nach Definition 1.2.5 auf Seite 14 gibt es eine endliche Menge E ⊆ S (R2 )
von Urbildschnitten, sodass f = ∪E.
Für alle S ∈ E gibt es nach Definition 1.2.4 auf Seite 14 eine endliche Menge
FS ⊆ U (R2 ) von Polynom-Urbildern, sodass S = ∩FS .
Für alle der endlich vielen U ∈ G := ∪ {FS ; S ∈ E} gibt es nach Definition 1.2.3
auf Seite 14 ein Polynom pU ∈ Rh2i und einen Achsenabschnitt43 µU ∈ Λ, sodass
U = [µU ] pcU .
Für alle U ∈ G ist das Polynom44 pU h1i ∈ (Rh1i)h1i auch ein Element von (Ch1i)h1i.
n
o
Die Menge K := pU h1i ; U ∈ G, pU h1i 6= 0 und pU h1i keine Einheit in (Ch1i)h1i ist
endlich. Nach Satz von Gauß (Satz 1.4.12 auf Seite 22) ist (Ch1i)h1i ein faktorieller
Ring, weil C ein solcher ist45 . Für alle k ∈ K gibt es also nach Definition 1.4.9 auf
Seite 21 eine Zahl nk ∈ N und eine Funktion fk ∈ {q ∈ (Ch1i)h1i ; q Primelement}nk +1 ,
Q
sodass46 k = i∈nk (fk )i . Sei damit P := {(fk )i ; k ∈ K, i ∈ nk + 1}.
Durch Weglassen aller Polynome vom Grad kleiner eins erhält man die endliche
Menge Q := {q ∈ P ; deg q > 0}, von der jetzt gezeigt wird, dass sie die behaupteten
Eigenschaften erfüllt.
Da nach Lemma 1.4.10 auf Seite 21 Primelemente irreduzibel sind, ist Q wie behauptet eine Menge irreduzibler Polynome vom Grad größer null und die erste Eigenschaft ist gezeigt.
42
2
Die Funktion
f : R → R ist
Teilmenge von R und heißt deshalb 2semialgebraisch, wenn
2
2
f ∈ V R . Zur Menge V R der semialgebraischen Teilmengen von R siehe Definition 1.2.5
auf Seite 14. Auf diese Weise wird der Begriff der semialgebraischen Funktion auch bei
[Boc0, S. 25], [Boc1, S. 28] und [Pre, S. 94] definiert, nicht jedoch bei [Hör, S. 367], wo auch +∞
und −∞ als Funktionswerte erlaubt sind und der Subgraph anstelle des Graphen herangezogen
wird.
43
In Definition 1.2.2 auf Seite 13 wird die Menge Λ der Achsenabschnitte definiert.
44
Zur Schreibweise ph1i siehe Definition 1.1.7 auf Seite 12.
45
Wie bereits in Fußnote 19 auf Seite 78 festgestellt, ist jeder Körper ein faktorieller Ring.
46
Aus Bemerkung 1.1.1 auf Seite 9 folgt, dass i ∈ nk eine kurze Schreibweise für i ∈ N, i < nk ist.
100
3.3 Untere Abschätzung positiver Polynome
Die zweite Eigenschaft zeigen wir indirekt durch die Annahme, es gäbe z ∈ R, sodass
für alle q ∈ Q die Zahl f (z) keine Nullstelle von qcẑ wäre oder qẑ das Nullpolynom
wäre. Dann gäbe es aufgrund der Stetigkeit der endlich vielen Polynome aus Q eine
Zahl ε > 0, sodass für alle q ∈ Q das Polynom qcẑ keine Nullstelle auf dem Intervall47
BR (f (z) , ε) hätte oder qẑ = 0 wäre.
Für alle q ∈ Q wäre also, weil qcẑ sein Vorzeichen auf BR (f (z) , ε) nicht wechseln
könnte, das Bild48 sgn [qcẑ [BR (f (z) , ε)]] einelementig.
Für alle q ∈ P \Q gilt deg q < 1, damit auch deg c
qẑ < 1, weshalb qcẑ konstant und
damit sgn [qcẑ [BR (f (z) , ε)]] ebenfalls einelementig ist.
h
i
Also wäre für alle k ∈ K das Bild sgn kcẑ [BR (f (z) , ε)] einelementig, weil alle FakQ
toren des Produkts k = i∈nk (fk )i Elemente von P sind.
Für alle U ∈ G könnte man
sich wie folgt von der Einelementigkeit des Bildes
h1i ) [B (f (z) , ε)]
sgn (p\
überzeugen: Falls deg pU h1i
<
1, gilt auch
U
R
ẑ
h1i ) konstant und deshalb das Bild einelementig ist.
deg pU h1i < 1, weshalb (p\
U
ẑ
ẑ
h1i
Andernfalls gilt pU 6= 0 und pU h1i ist keine Einheit in (Ch1i)h1i (eine solche wäre
vom Grad null), d. h. es gilt pU h1i ∈ K. Für Polynome aus K ist die Einelementigkeit
schon gezeigt.
Weil (z, f (z)) ∈ f , gibt es einen Urbildschnitt S ∈ E mit (z, f (z)) ∈ S.
Für alle Polynom-Urbilder U ∈ FS ⊆ G könnte man sich folgendes überlegen: Wegen
S = ∩FS ⊆ U gilt (z, f (z)) ∈ U = [µU ] pcU , d. h. es gilt pcU (z, f (z)) ∈ µU . Nach
Lemma 1.1.10 auf Seite 13 gilt
h1i ) (f (z)) = p
c
(p\
U
U (z, f (z)) ∈ µU .
ẑ
Aufgrund der bewiesenen Einelementigkeit wäre sogar
h1i ) [B (f (z) , ε)] ⊆ µ
(p\
U
R
U
ẑ
und wieder mit Lemma 1.1.10 auf Seite 13 wäre pcU [{z} × BR (f (z) , ε)] ⊆ µU , was
äquivalent zu {z} × BR (f (z) , ε) ⊆ [µU ] pcU = U ist.
Folglich wäre {z} × BR (f (z) , ε) ⊆ ∩FS = S ⊆ f und f wäre keine Funktion.
47
48
Mit BR (t, ε) ist für t ∈ R und ε > 0 die Menge {τ ∈ R; |τ − t| < ε} = ]t − ε, t + ε[ gemeint.
Die Funktion sgn wird in Definition 1.2.1 auf Seite 13 definiert.
101
3 Anwendung in der Theorie der partiellen Differentialgleichungen
Lemma 3.3.3. Sei f : R → R semialgebraisch mit der Eigenschaft
∀µ > 0∃κ > 0∀z ∈ R\BR (0, µ) :
f (z) > κ.
Dann gibt es c > 0 und N ∈ N, sodass
∀z ∈ R\ {0} :
f (z) > c 1 + z −2
−N
.
Beweis. Für alle z ∈ R\ {0} gilt wegen z ∈ R\BR (0, |z|) nach Voraussetzung
f (z) > 0.
(3.19)
Nach Lemma 3.3.2 gibt es eine endliche Menge Q ⊆ (Ch1i)h1i irreduzibler Polynome
vom Grad größer null, sodass es für alle z ∈ R ein Polynom q ∈ Q gibt, sodass f (z)
Nullstelle von qcẑ und qẑ 6= 0 ist.
Sei T := {q ∈ Q; 0 ist Nullstelle von pc0̂ }.
Weil für jedes Polynom q ∈ Q\T die Funktion R2 3 (z, t) 7→ qcẑ (t) ∈ R stetig und ihr
Wert an der Stelle (0, 0) von Null verschieden ist, gibt es σq > 0, sodass
für alle z ∈ B (0, σq ) die Polynomfunktion c
qẑ nullstellenlos auf B (0, σq ) ist. (3.20)
Es gibt ν > 0, sodass für alle q ∈ Q\T die Ungleichung49
ν ≤ σq
(3.21)
gilt.
Auf alle q ∈ T ist Satz 3.2.11 auf Seite 84 anwendbar:
Sei q ∈ T . Dann gibt es, weil deg q > 0, eine Zahl Q ∈ N, sodass deg q = Q+1. Damit
gilt50 q ∈ (Ch1i)Q+2 h1i. Wegen deg q = Q + 1 gilt qQ+1 6= 0. Weil q irreduzibel, gibt
es kein t ∈ (Ch1i)h1i mit deg t > 0, sodass t2 |q. Aufgrund von Kriterium 3.1.17 auf
Seite 74 gilt damit DisQ (q) ∈ Ch1i \ {0}. Die Zahl 0 ist Nullstelle von qb0̂ . Mit Lemma
3.3.1 sieht man, dass51 q0̂ 6= 0. Also ist Satz 3.2.11 auf Seite 84 anwendbar und es
49
Die Schreibweise ν := min {σq ; q ∈ Q\T } wird hier vermieden, weil der Fall Q\T = ∅ nicht
ausgeschlossen ist.
50
In Definition 2.1.8 auf Seite 28 werden die Mengen RK h1i definiert.
51
Aus Lemma 3.3.2 allein lässt sich dies nicht folgern, auch wenn es auf den ersten Blick so aussieht.
102
3.3 Untere Abschätzung positiver Polynome
gibt εq > 0, 0 < δq 6= 1 und eine endliche, nichtleere Menge Θq von δq -Auffaltungen52
mit folgender Eigenschaft: Für alle z ∈ B (0, δq ) und alle Nullstellen t ∈ B (0, εq ) von
qcẑ gibt es
eine δq -Auffaltung θ ∈ Θq und ξ ∈ D (θ) , sodass z = ξ wdgδq (θ) und θ (ξ) = t. (3.22)
Sei H := {θ; q ∈ T, θ ∈ Θq , θ 6= 0}. Für alle θ ∈ H gibt es wegen θ 6= 0 eine holomorphe Funktion hθ : D (θ) → C mit hθ (0) 6= 0 und eine Zahl53 vθ ∈ N, sodass für alle
ξ ∈ D (θ) die Gleichung
(3.23)
ξ vθ hθ (ξ) = θ (ξ)
gilt. Weil hθ (0) 6= 0 und hθ stetig, gibt es ρθ > 0 mit B (0, ρθ ) ⊆ D (θ), sodass für
alle ξ ∈ B (0, ρθ ) die Ungleichung
|hθ (ξ)| >
1
|hθ (0)|
2
(3.24)
gilt. Es gibt eine Zahl N ∈ N, sodass für alle θ ∈ H die Ungleichung
vθ ≤ 2N
(3.25)
gilt.
Es gibt µ > 0 mit54
µ ≤ 1 und µ ≤ ν, sodass für alle q ∈ T die Ungleichung µ ≤ δq
und für alle θ ∈ Θq ∩ H die Ungleichung µ ≤ ρθ wdgδq (θ) gilt.
(3.26)
Nach Voraussetzung gibt es dann κ > 0, sodass für alle z ∈ R\BR (0, µ) die Ungleichung
f (z) > κ
(3.27)
gilt. Es gibt c > 0 mit
c ≤ κ und c < ν, sodass für alle q ∈ T die Ungleichung c < εq
und für alle θ ∈ H die Ungleichung c ≤ 21 |hθ (0)| gilt.
(3.28)
52
Der Begriff δ-Auffaltung wird in Definition 3.2.8 auf Seite 84 definiert.
Die Zahl vθ ist die Vielfachheit der Nullstelle bei Null.
54
Hinweis: Es kann vorkommen, dass eine Funktion θ ∈ H für zwei Polynome q, r ∈ T mit Radien
δq 6= δr zugleich δq -Auffaltung und δr -Auffaltung ist. Ein Beispiel dafür lautet D (θ) = B (0, 2),
δq = 2, wdgδq (θ) = 1, δr = 4, wdgδr (θ) = 2.
53
103
3 Anwendung in der Theorie der partiellen Differentialgleichungen
Es folgt der Beweis der Ungleichung. Sei z ∈ R\ {0}. Es gibt drei Fälle:
1. Fall |z| ≥ µ:
Dann gilt f (z) > κ ≥ c ≥ c (1 + z −2 )
3.27
−N
.
3.28
2. Fall |z| < µ und f (z) > c:
Dann gilt f (z) > c ≥ c (1 + z −2 )
−N
.
3. Fall |z| < µ und f (z) ≤ c:
Dann gibt es q ∈ Q, sodass f (z) Nullstelle von qcẑ ist. Wäre q ∈ Q\T , so wäre
|z| < µ ≤ ν ≤ σq ,
3.26
3.21
d. h. z ∈ B (0, σq ) und
|f (z)| = f (z) ≤ c < ν ≤ σq ,
3.19
3.28
3.21
d. h. f (z) ∈ B (0, σq ) im Widerspruch zu 3.20. Also gilt q ∈ T .
Damit gilt
|z| < µ ≤ δq ,
3.26
d. h. z ∈ B (0, δq ) und
|f (z)| = f (z) ≤ c < εq ,
3.19
3.28
d. h. f (z) ∈ B (0, εq ).
Wegen 3.22 gibt es also θ ∈ Θq und ξ ∈ D (θ), sodass z = ξ wdgδq (θ) und
θ (ξ) = f (z).
Weil θ (ξ) = f (z) > 0, gilt θ 6= 0 und damit θ ∈ H.
3.19
1/wdg
Es gilt |ξ| = |z|
δq (θ)
< µ /wdgδq (θ) ≤ ρθ und damit ξ ∈ B (0, ρθ ).
1
3.26
Es gilt |z| < µ ≤ 1 und deshalb |ξ| = |z| /wdgδq (θ) ≥ |z|.
1
3.26
|z|<1
Damit gilt
f (z) = |f (z)| = |θ (ξ)| = |ξ|vθ |hθ (ξ)| >
3.19
c |ξ|vθ ≥ c |z|vθ
3.23
≥
|z|<1 und 3.25
104
3.24
c |z|2N = c z −2
−N
1
|hθ (0)| |ξ|vθ ≥
2
3.28
≥ c 1 + z −2
−N
.
3.3 Untere Abschätzung positiver Polynome
Lemma 3.3.4. Sei g : R → R semialgebraisch mit der Eigenschaft
∀Ω > 0∃κ > 0∀r ∈ BR (0, Ω) :
g (r) > κ.
Dann gibt es C > 0 und N ∈ N, sodass
∀r ∈ R :
g (r) > C 1 + r2
−N
.
Beweis. Wir beabsichtigen, Lemma 3.3.3 auf die Funktion

f := R 3 z 7→

 
g 1
z

0

für z 6= 0 
für z = 0

anzuwenden.
Die Menge V0 := {(k, y, r) ∈ R3 ; kr − 1 = 0} ist ein Polynom-Urbild und damit semialgebraisch.
Die Menge V1 := g × R ⊆ R3 ist nach Lemma 1.2.11 auf Seite 17 semialgebraisch.
Die Menge V2 := {(k, y, r) ∈ R3 ; (r, y) ∈ g} = (R3 3 ξ 7→ (ξ2 , ξ1 , ξ0 )) [V1 ] ist nach dem
selben Lemma semialgebraisch.
Die Menge V3 := {(k, y, r) ∈ R3 ; kr = 1, y = g (r)} = V0 ∩ V3 ist als Schnitt zweier
semialgebraischer Mengen nach Lemma 1.2.8 auf Seite 15 semialgebraisch.
Die Menge V4 :=
n
n
1
,g
r
o
(r) ; r ∈ R\ {0} = {(k, g (r)) ; r ∈ R\ {0} , k ∈ R, kr = 1} =
o
(k, y) ∈ R2 ; r ∈ R, kr = 1, y = g (r) = R3 3 ξ 7→ (ξi )i∈2 [V3 ]
ist als Projektion einer semialgebraischen Menge nach Satz von Tarski-Seidenberg
(Satz 2.4.5 auf Seite 64) semialgebraisch.
Die Menge V5 := {(0, 0)} = {(k, y) ∈ R2 ; k 2 + y 2 = 0} ist ein Polynom-Urbild und
damit semialgebraisch.
Damit ist f = {(z, f (z)) ; z ∈ R} = V5 ∪ V4 als Vereinigung zweier semialgebraischer
Mengen nach Lemma 1.2.6 auf Seite 14 semialgebraisch.
Um Lemma 3.3.3 anwenden zu können, fehlt noch der Nachweis, dass
∀µ > 0∃κ > 0∀z ∈ R\BR (0, µ) :
f (z) > κ.
105
3 Anwendung in der Theorie der partiellen Differentialgleichungen
Sei also µ > 0. Mit Ω := µ1 gibt es nach Voraussetzung κ > 0, sodass für alle
r ∈ BR (0, Ω) die Ungleichung g (r) > κ gilt. Für alle z ∈ R\BR (0, µ) gilt dann
1
z > µ1 = Ω, d. h. z1 ∈ BR (0, Ω) und damit f (z) = g z1 > κ.
Lemma 3.3.3 ist also anwendbar und es gibt c > 0 und N ∈ N, sodass
∀z ∈ R\ {0} :
f (z) > c 1 + z −2
−N
n
.
o
Nach Voraussetzung gilt g (0) > 0. Sei damit C := min c, g(0)
.
2
−N
Für r = 0 gilt also g (r) = g (0) > C = C (1 + r2 )
−2 !−N
1
1
>c 1+
g (r) = f
r
r
und für r 6= 0 gilt
≥ C 1 + r2
−N
wie behauptet.
Lemma 3.3.5. Seien n ∈ N, A ∈ V (Rn ) semialgebraisch und abgeschlossen und
p ∈ Rhni mit p̂ [A] ⊆ R>0 . Dann gibt es C > 0 und N ∈ N, sodass für alle x ∈ A die
Ungleichung
−N
p̂ (x) > C 1 + |x|2
gilt.
Beweis. Die Definition
g := (R 3 r 7→ min ({p̂ (x) ; x ∈ A, |x| = |r|} ∪ {1}))
ist korrekt, weil für alle r ∈ R die Menge {x ∈ A; |x| = |r|} kompakt ist und deshalb
die stetige Funktion p̂, wenn die Menge nicht leer ist, auf ihr das Minimum annimmt.
Das Ziel ist die Anwendung von Lemma 3.3.4 auf die Funktion g.
Dass g die Eigenschaft
∀Ω > 0∃κ > 0∀r ∈ BR (0, Ω) :
g (r) > κ
besitzt, sieht man wie folgt:
Sei Ω > 0. Dann ist B [0, Ω] ∩ A beschränkt und abgeschlossen und folglich kompakt.
Da zudem p̂ [A] ⊆ R>0 , gibt es κ > 0 mit κ < 1, sodass für alle x ∈ B [0, Ω] ∩ A die
Ungleichung p̂ (x) > κ gilt. Für alle r ∈ BR (0, Ω) gilt damit g (r) > κ.
Um Lemma 3.3.4 anwenden zu können, muss also nur noch gezeigt werden, dass g
semialgebraisch ist.
106
3.3 Untere Abschätzung positiver Polynome
Die Menge
V0 := {(x, y, v) ∈ R × R × Rn ; p̂ (v) = y} = {(x, y, v) ∈ R × R × Rn ; p̂ (v) − y = 0}
ist semialgebraisch, weil sie ein Polynom-Urbild ist.
Die Menge
n
o
n
o
V1 := (x, y, v) ∈ R × R × Rn ; r2 = v 2 = (x, y, v) ∈ R × R × Rn ; r2 − v 2 = 0
ist aus dem selben Grund semialgebraisch.
Die Menge V2 := A × R2 ⊆ Rn+2 ist nach Lemma 1.2.11 auf Seite 17 semialgebraisch.
Die Menge V3 := R2 × A = (Rn × R2 3 (v, ξ) 7→ (ξ, v)) [V2 ] ist nach dem selben
Lemma semialgebraisch.
Die Menge V4 := {(r, y, v) ∈ R × R × Rn ; v ∈ A, r2 = v 2 , p̂ (v) = y} = V3 ∩ V1 ∩ V0 ist
als Schnitt dreier semialgebraischer Mengen nach Lemma 1.2.8 auf Seite 15 semialgebraisch.
Für alle i ∈ n + 1 sei
Fi :=





(v, x) ∈ A,
(r, y, v) ∈ R × R × Ri ;




_
x∈Rn−i





r 2 = v 2 + x2  .


p̂ (v, x) = y 
Per Induktion sieht man, dass für alle i ∈ n + 1 die Menge Fi semialgebraisch ist:
Induktionsanfang: Fn ist semialgebraisch, weil Fn = V4 .
Induktionsschritt: Sei i ∈ n und Fi+1 semialgebraisch. Dann ist
Fi =





(v, w, x) ∈ A
(r, y, v) ∈ R × R × Ri ;




R3+i 3 ξ 7→






(ξj )j∈2+i  (r, y, v, w)




_
_
w∈R
x∈Rn−i−1





r 2 = v 2 + w 2 + x2  =


p̂ (v, w, x) = y 






2
2
2
2
r = v + w + x 



p̂ (v, w, x) = y 
(v, w, x) ∈ A
∈ R×R×Ri ×R;
_
x∈Rn−i−1
=
R3+i 3 ξ 7→ (ξj )j∈2+i [Fi+1 ]
107
3 Anwendung in der Theorie der partiellen Differentialgleichungen
als Projektion einer semialgebraischen Menge nach Satz von Tarski-Seidenberg
(Satz 2.4.5 auf Seite 64) semialgebraisch.
Die Menge V5 := {(r, y) ∈ R2 ; ∃x ∈ A : r2 = x2 , p̂ (x) = y} ist semialgebraisch, weil
sie gleich F0 ist.
Die Menge V6 := {(r, y) ∈ R2 ; y = 1} = {(r, y) ∈ R2 ; y − 1 = 0} ist ein PolynomUrbild und deshalb semialgebraisch.
Die Menge V7 := {(r, y) ∈ R2 ; y = 1 oder ∃x ∈ A : r2 = x2 , p̂ (x) = y} = V6 ∪ V5 ist
als Vereinigung zweier semialgebraischer Mengen nach Lemma 1.2.6 auf Seite 14
semialgebraisch.
Die Menge V8 := {(r, k, y) ∈ R3 ; (r, k) ∈ V7 } = V7 × R ist nach Lemma 1.2.11 auf
Seite 17 semialgebraisch.
Die Menge V9 := {(r, y, k) ∈ R3 ; (r, k) ∈ V7 } = (R3 3 ξ 7→ (ξ0 , ξ2 , ξ1 )) [V8 ] ist nach
dem selben Lemma semialgebraisch.
Die Menge V10 := {(r, y, k) ∈ R3 ; k < y} = {(r, y, k) ∈ R3 ; k − y < 0} ist ein PolynomUrbild und deshalb semialgebraisch.
Die Menge V11 := {(r, y, k) ∈ R3 ; k < y, (r, k) ∈ V7 } = V10 ∩ V9 ist als Schnitt zweier
semialgebraischer Mengen semialgebraisch.
Die Menge V12 := {(r, y) ∈ R2 ; ∃k ∈ R : k < y, (r, k) ∈ V7 } = R3 3 ξ 7→ (ξi )i∈2 [V11 ]
ist als Projektion einer semialgebraischen Menge nach Satz von Tarski-Seidenberg
semialgebraisch.
Die Menge V13 := {(r, y) ∈ R2 ; @k ∈ R : k < y, (r, k) ∈ V7 } = R2 \V12 ist als Komplement einer semialgebraischen Menge nach Lemma 1.2.11 auf Seite 17 semialgebraisch.
Die Menge V14 := {(r, y) ∈ V7 ; @k ∈ R : k < y, (r, k) ∈ V7 } = V7 ∩ V13 ist als Schnitt
zweier semialgebraischer Mengen semialgebraisch.
Wir zeigen jetzt, dass g = V14 :
Die Inklusion g ⊆ V14 : Sei (r, y) ∈ g. Dann gilt y = g (r). Aufgrund der Definitionen
von g und V7 gilt (r, y) ∈ V7 . Weil g (r) das Minimum der Menge
{p̂ (x) ; x ∈ A, |x| = |r|} ∪ {1} ist, gibt es kein k < g (r) mit (r, k) ∈ V7 . Also gilt
(r, y) ∈ V14 .
Die Inklusion V14 ⊆ g: Sei (r, y) ∈ V14 . Dann gilt (r, y) ∈ V7 und es gibt kein k < y
mit (r, k) ∈ V7 . Also ist y das Minimum der Menge {p̂ (x) ; x ∈ A, |x| = |r|} ∪ {1}
und damit gleich g (r). Es gilt (r, y) = (r, g (r)) ∈ g.
108
3.4 Stetige Inversion linearer partieller Differentialoperatoren
Folglich ist g semialgebraisch und Lemma 3.3.4 anwendbar. Es gibt C > 0 und
N ∈ N, sodass
−N
.
∀r ∈ R : g (r) > C 1 + r2
Mit der Feststellung, dass damit für alle x ∈ A die Ungleichung
p̂ (x) ≥ min ({p̂ (ξ) ; ξ ∈ A, |ξ| = |x|} ∪ {1}) = g (|x|) > C 1 + |x|2
−N
gilt, endet der Beweis.
Vom soeben bewiesenen Lemma wird im folgenden Abschnitt Gebrauch gemacht.
3.4 Stetige Inversion linearer partieller
Differentialoperatoren
In diesem Abschnitt wird kurz umrissen, welche Verwendung die im letzten Abschnitt
bewiesene untere Abschätzung positiver Polynome in der Theorie der partiellen Differentialgleichungen findet. Der Abschnitt gibt nur einen groben Überblick – wer an
den Details interessiert ist, sei auf [Pic] verwiesen, wo das hier Skizzierte in voller
Ausführlichkeit behandelt wird.
Gegeben seien n ∈ N, l ∈ N und ein Polynom55 a ∈
folgenden Differentialoperator darstellt:
P ∂0 , ∂˜ :=
X
C(l+1)×(l+1) h1 + ni, das
aα ∂ α .
α∈N1+n
Dabei bezeichnet ∂0 die Ableitung in Richtung der nullten Variablen (Zeitableitung)
und ∂˜ den Vektor der Ableitungen in Richtung der anderen Variablen (Raumablei
tung) und es gilt ∂ = ∂0 , ∂˜ .
Das Polynom a sei so beschaffen, dass es eine Zahl
κ>0
55
Die Bezeichnung Rhni für die Menge der Polynome in n Variablen über einem Ring R wird in
Definition 1.1.2 auf Seite 9 eingeführt.
109
3 Anwendung in der Theorie der partiellen Differentialgleichungen
gibt, sodass die Funktion56
R × Rn × R 3 (τ, ξ, ν) 7→ det (â (iτ + ν, iξ)) ∈ C
im Halbraum R × Rn × R≥κ keine Nullstelle besitzt.
(3.29)
Die hier geforderten Voraussetzungen gelten für den Rest des Abschnitts.
Ziel ist es, die stetige Invertierbarkeit des Differentialoperators P ∂0 , ∂˜ in einem
noch zu präzisierenden Sinne zu zeigen. Die Räume, die dabei eine Rolle spielen,
werden jetzt eingeführt:
Definition 3.4.1. Für alle ν ≥ κ und jeden Multiindex γ ∈ Z1+n sei
mγν := R1+n 3 (τ, ξ) 7→ (iτ + ν)γ0 (ẽ + iξ)γ̃ ,
wobei57 ẽ := (1)k∈n und γ̃ derjenige Multiindex aus Z1+n sei, für den γ = (γ0 , γ̃) gilt.
Die Funktionenmenge
ˆ := ϕ ∈ L2,loc R1+n ; mγ ϕ ∈ L2 R1+n
Hν,γ
ν
n
o
wird mit dem Skalarprodukt
ˆ × H ˆ 3 (ϕ, ψ) 7→ hmγ ϕ|mγ ψi
Hν,γ
ν,γ
ν
ν
L2 (R1+n )
zu einem Hilbertraum (siehe [Pic]).
Mit F ist im Folgenden die stetige Fortsetzung
F : L2 R1+n → L2 R1+n
der auf L1 (R1+n ) ∩ L2 (R1+n ) eingeschränkten Fourier-Transformation
F : L1 (R1+n ) → C (R1+n )
f 7→
56
1+n
R
3 (τ, ξ) 7→
1
(2π)
1+n
2
´
!
f (t, x) e
−i(tτ +hx|ξi)
dt dx
R1+n
Die Notation p̂ für die einem Polynom p zugeordnete Polynomfunktion wird in Definition 1.1.4
auf Seite 10 eingeführt.
57
Nach Bemerkung 1.1.1 auf Seite 9 ist k ∈ n eine kurze Schreibweise für k ∈ N, 0 ≤ k < n.
110
3.4 Stetige Inversion linearer partieller Differentialoperatoren
zu einem unitären Operator gemeint.
Definition 3.4.2. Für ν ≥ κ sei
Hν,0 := L2 R1+n , exp (−2νt) dt dx .
ˆ = L2 (R1+n ))
Den durch (nach Definition ist Hν,0
ˆ
Lν : Hν,0 → Hν,0
f 7→ F (R1+n 3 (t, x) 7→ e−νt f (t, x))
definierten Operator nennen wir die Fourier-Laplace-Transformation. Der Operator
Lν ist unitär. Er lässt sich derart erweitern, dass für alle γ ∈ Z1+n durch Setzen von58
ˆ L
Hν,γ := Hν,γ
ν
ˆ unitär wird (siehe dazu [Pic]).
der Operator Lν : Hν,γ → Hν,γ
Definition 3.4.3. Für ν > κ sei
Hˆ
ν,−∞
n
o
ˆ ; γ ∈ Z1+n
:= ∪ Hν,γ
und
Hν,−∞ := ∪ Hν,γ ; γ ∈ Z1+n .
Dabei ist der Raum Hν,−∞ genau der erweiterte Definitionsbereich von Lν und Lν
ˆ :
ist in folgendem Sinne stetig von Hν,−∞ nach Hν,−∞
^
_
ˆ .
Lν stetig von Hν,α nach Hν,β
α∈Z1+n β∈Z1+n
Um dies zu sehen, reicht es β := α zu setzen.
ˆ
ˆ
Ein linearer Operator L : Hν,−∞
→ Hν,−∞
heißt stetig, wenn
^
_
ˆ nach H ˆ
L stetig von Hν,α
ν,β
α∈Z1+n β∈Z1+n
58
Die Notation [M ] f für das Urbild einer Menge M unter einer Funktion f wird in Fußnote 3 auf
Seite 9 eingeführt.
111
3 Anwendung in der Theorie der partiellen Differentialgleichungen
und ein linearer Operator L : Hν,−∞ → Hν,−∞ heißt stetig, wenn
^
_
L stetig von Hν,α nach Hν,β .
α∈Z1+n β∈Z1+n
Beispiel 3.4.4. Ist f eine Polynomfunktion von R1+n nach C (d. h. es gibt
p ∈ Ch1 + ni mit p̂|R1+n = f ), so bildet der von dieser Polynomfunktion erzeugte
Multiplikationsoperator
ˆ
3 ϕ 7→ f ϕ
Hν,−∞
ˆ
stetig nach Hν,−∞
ab.
Beweis. Es reicht, die Aussage für ein Monom mit Koeffizient 1, d.h. für den Fall
f = (R1+n 3 (τ, ξ) 7→ τ γ0 ξ γ̃ ) mit γ ∈ N1+n zu zeigen59 .
Sei α ∈ Z1+n . Wir setzen β := α − γ.
ˆ , alle τ ∈ R und alle ξ ∈ Rn gilt dann die Abschätzung
Für alle ϕ ∈ Hν,α
2
mβν f ϕ (τ, ξ)
=
(iτ

2
τ +ν
2 β0
β0
+ ν) (ẽ + iξ) f

Y

1+
β̃

Y 2γ̃

ξ k  |ϕ (τ, ξ)|2
k
k∈n
τ 2 + ν2
β0 +γ0
≤
ν≥0,γ∈N1+n


=

β̃k
ξk2  τ 2γ0
k∈n
2
(τ, ξ) ϕ (τ, ξ)
Y

1 + ξk2
β̃k +γ̃k
 |ϕ (τ, ξ)|2
=
k∈n
(iτ
2
+ ν)α0 (ẽ + iξ)α̃ ϕ (τ, ξ) = |(mαν ϕ) (τ, ξ)|2 .
ˆ nach H ˆ .
Damit ist der Multiplikationsoperator stetig von Hν,α
ν,β
Da die Fourier-Laplace-Transformation Differentiation in Multiplikation verwandelt,
gilt




Lν
L−1

 
 ν




.
..
˜
.

 P ∂0 , ∂ 
=
.
.

59
Lν


L−1
ν

Dieses Argument macht davon Gebrauch, dass Linearkombinationen stetiger Operatoren stetig
sind, was wir für den hier verwendeten Stetigkeitsbegriff nicht nachgewiesen haben. Die ausführlichen Beweise sind bei [Pic] zu finden.
112
3.4 Stetige Inversion linearer partieller Differentialoperatoren
Hˆ
ν,−∞
l+1
3 ϕ 7→ R
1+n
ˆ
3 (τ, ξ) 7→ â (iτ + ν, iξ) ϕ (τ, ξ) ∈ Hν,−∞
l+1 !
=: (Ms,z )s,z∈l+1 .
Die Frage nach der stetigen Invertierbarkeit von P ∂0 , ∂˜ ist daher äquivalent zur
Frage nach der stetigen Invertierbarkeit der Matrix M . Nach Satz 2.1.7 auf Seite 27
lässt sich die Inverse von M als
M −1 = (det M )−1 Adj (M )
schreiben, weil die Einträge der Matrix M miteinander kommutierende Multiplikationsoperatoren sind.
Die Einträge der Matrix M sind Elemente des Rings der von Polynomfunktionen
von R1+n nach C erzeugten Multiplikationsoperatoren. Die Einträge der AdjunktenMatrix Adj (M ) stammen daher nach Definition der Adjunkten-Matrix (Definition
2.1.5 auf Seite 27) aus dem selben Ring, sind also nach Beispiel 3.4.4 stetig.
Wenn wir jetzt noch zeigen, dass (det M )−1 stetig ist, sind wir am Ziel60 .
Dies ist die Stelle, an der der Satz von Tarski-Seidenberg in Form der unteren Abschätzung positiver Polynome ins Spiel kommt.
Die Funktion
R × Rn × R 3 (τ, ξ, ν) 7→ |det (â (iτ + ν, iξ))|2
ist eine Polynomfunktion von R1+n+1 nach R, es gibt also Q ∈ Rh1 + n + 1i, sodass
für alle τ ∈ R, ξ ∈ Rn und ν ∈ R die Gleichung Q̂ (τ, ξ, ν) = |det (â (iτ + ν, iξ))|2
gilt.
Auf der semialgebraischen und abgeschlossenen Menge R × Rn × R≥κ ist Q̂ nach
Voraussetzung 3.29 positiv. Nach Lemma 3.3.5 auf Seite 106 gibt es also C > 0 und
N ∈ N, sodass für alle τ ∈ R, ξ ∈ Rn und ν ∈ R≥κ die Abschätzung
Q̂ (τ, ξ, ν) > C 1 + τ 2 + |ξ|2 + ν 2
−N
gilt.
60
Wir machen hier davon Gebrauch, dass die Komposition stetiger Funktionen stetig ist, was wir
für den hier verwendeten Stetigkeitsbegriff nicht nachgewiesen haben. Die vollständigen Beweise
finden sich wie gesagt bei [Pic].
113
3 Anwendung in der Theorie der partiellen Differentialgleichungen
Für alle solche τ , ξ und ν gilt damit
Q̂ (τ, ξ, ν) > C |{z}
1 +τ 2 +
2
2
≤ τ κ+ν
2
C
X
r∈n
ξr2
+ ν2
−N
≥
|{z}
≤
τ 2 +ν 2
κ2
Q
k∈n
(1 + ξk2 )
!
−N
Y
1
n 2
2
2
2
2
1 + ξk
≥
+1 τ +ν + 2 τ +ν
κ2
κ
k∈n
{z
|
}
≤ (τ 2 + ν 2 )
Q
k∈n
(1 + ξk2 )
Y
1
n −N 2
2 −N
2 −N
+
1
+
τ
+
ν
1
+
ξ
.
k
κ2 {z κ2
k∈n
|
}
=: c2 mit c > 0
(3.30)
C
Wir zeigen jetzt, dass der Multiplikationsoperator
−1
(det M )
ˆ
= Hν,−∞
3 ϕ 7→ R1+n 3 (τ, ξ) 7→ det (â (iτ + ν, iξ))−1 ϕ (τ, ξ)
ˆ
stetig nach Hν,−∞
abbildet.
Sei also α ∈ Z1+n . Wir setzen β := α − (N )k∈1+n .
ˆ gilt dann
Für alle ϕ ∈ Hν,α
2
−1
(det M ) (ϕ)
2
−1
β
ˆ = mγ (det M ) (ϕ)L2 (R1+n ) =
Hν,β
(τ, ξ)
7→ mαν (τ, ξ) (iτ + ν)−N
|·| =
(τ 2 + ν 2 )
|·| <
1
c
q
{z
L2 (R1+n )
}
|·| =
−N
2
|
2
(1 + iξk )−N (det M )−1 (ϕ) (τ, ξ)
} k∈n |
{z
|
Y
{z
(1 + ξk2 )
−N
2
}
Q̂ (τ, ξ, ν) nach 3.30
q
2
1 −1
α
(τ,
(â
(iτ
(τ,
(τ,
(τ,
Q̂
ξ,
ν)det
+
ν,
iξ))
ϕ
ξ)
2 1+n =
ξ)
→
7
m
ξ)
ν
2
L (R
)
|
{z
}
c
q
|·| = Q̂ (τ, ξ, ν)
1
1
α 2
|m
ϕ|
|ϕ|2 ˆ ,
2 (R1+n ) =
ν
L
2
2
Hν,α
c
c
114
≤
3.4 Stetige Inversion linearer partieller Differentialoperatoren
ˆ nach H ˆ abbildet61 .
was zeigt, dass (det M )−1 stetig von Hν,α
ν,β
l+1
ˆ
ˆ
Also ist der Multiplikationsoperator M : Hν,−∞
→ Hν,−∞
bar, woraus wie angekündigt folgt, dass der Differentialoperator

L−1
ν
...


P ∂0 , ∂˜ = 

L−1
ν
l+1




M





stetig invertier-

Lν
...
Lν




als Operator von (Hν,−∞ )l+1 nach (Hν,−∞ )l+1 ebenfalls stetig invertierbar ist. Für
seine Inverse erhalten wir die Darstellung

−1
P ∂0 , ∂˜



=

L−1
ν
..
.
L−1
ν





−1
 (det M ) Adj (M ) 



Lν
..
.
Lν


.

Nachdem damit das wesentliche Ziel der vorliegenden Arbeit erreicht ist, gibt das
folgende Kapitel einen kurzen Einblick in die Bedeutung des Satzes von TarskiSeidenberg für die Quantorenelimination.
61
Bei der weiteren Verwendung dieses Resultats bei [Pic] spielt es eine Rolle, dass die Konstante c
in der Abschätzung unabhängig von ν gewählt werden kann.
115
3 Anwendung in der Theorie der partiellen Differentialgleichungen
116
4 Quantorenelimination mit dem
Satz von Tarski-Seidenberg
Dieses Kapitel umschreibt kurz, wie der Satz von Tarski-Seidenberg in der Form, in
der er in dieser Arbeit bewiesen wurde, zur Quantorenelimination verwendet werden
kann. Da dieses Kapitel nicht den Anspruch erhebt, korrekte Beweise zu liefern und
sein Zweck darin besteht, die Idee aufzuzeigen, wird hier mit nachlässig definierten
Begriffen und mit Beispielen gearbeitet.
Definition. Mit dem Begriff allgemeiner Ausdruck ist im Folgenden ein in sinnvoller
Weise aus Konstanten- und Variablensymbolen für reelle Zahlen, den Symbolen für
die Operationen Addition, Multiplikation und Negation, den Symbolen für die Relationen <, > und =, den Symbolen für die Junktoren „und“, „oder“ und „nicht“
und den Symbolen für den All- und Existenzquantor zusammengesetzter Ausdruck
gemeint.
Definition. Unter einem semialgebraischen Ausdruck wird im Folgenden ein quantorenfreier allgemeiner Ausdruck verstanden.
Definition. Unter einer ,sentence of elementary algebra’ wird ein allgemeiner Ausdruck verstanden, dessen sämtliche Variablen quantifiziert sind. In dieser Bedeutung
hat Tarski (siehe Einleitung, Seite 5) den Begriff verwendet.
Problem. Gegeben sei ein semialgebraischer Ausdruck und ein Variablensymbol x.
Man betrachtet nun den allgemeinen Ausdruck ∃x : P und möchte einen semialgebraischen Ausdruck Q finden, in dem das Variablensymbol x nicht vorkommt, in
dem keine nicht in P vorkommenden Variablensymbole auftauchen und der äquivalent zum Ausdruck ∃x : P ist. Da der gesuchte Ausdruck insbesondere quantorenfrei
sein muss, spricht man von Quantorenelimination.
Beispiel. Der Ausdruck
P = nicht x2 − y + 3 > 5 und z = π
117
4 Quantorenelimination mit dem Satz von Tarski-Seidenberg
ist ein semialgebraischer Ausdruck. Bei Betrachtung des allgemeinen Ausdrucks
∃x : P = ∃x : nicht x2 − y + 3 > 5 und z = π
stellt man durch die Umformung
∃x : nicht x2 − y + 3 > 5 und z = π
∃x : nicht x2 > 2 + y
nicht∀x : x2 > 2 + y
⇔
oder z 6= π ⇔
oder z 6= π ⇔ (nicht (2 + y < 0) oder z 6= π) ⇔
(y ≥ −2 oder z 6= π)
fest, dass
Q := (y ≥ −2 oder z 6= π)
ein semialgebraischer Ausdruck mit den gewünschten Eigenschaften ist.
Die Frage lautet nun, ob es immer einen solchen Ausdruck gibt und, wenn ja, ob es
ein Verfahren gibt, mit dem man ihn konstruieren kann.
Man kann eine Analogie zwischen semialgebraischen Ausdrücken und semialgebraischen Mengen herstellen, was am Beispiel deutlich wird:
Der semialgebraische Ausdruck P beschreibt die Menge
n
(x, y, z) ∈ R3 ; nicht x2 − y + 3 > 5 und z = π
R3 \
n
o
o
n
=
(x, y, z) ∈ R3 ; x2 − y − 2 > 0 ∩ (x, y, z) ∈ R3 ; z = π
o
,
die
aus
folgendem
Grund
semialgebraisch
ist:
Die
Mengen
3
2
3
{(x, y, z) ∈ R ; x − y − 2 > 0} und {(x, y, z) ∈ R ; z = π} sind Polynom-Urbilder1
und deshalb semialgebraisch. Nach Lemma 1.2.8 auf Seite 15 ist der Schnitt zweier
semialgebraischer Mengen semialgebraisch und nach Lemma 1.2.11 auf Seite 17 das
Komplement einer semialgebraischen Menge semialgebraisch. Man kann sich überlegen, dass die durch semialgebraische Ausdrücke auf diese Weise beschreibbaren
Mengen genau die semialgebraischen Mengen sind2 .
1
2
Der Begriff Polynom-Urbild wird in Definition 1.2.3 auf Seite 14 definiert.
Wie angekündigt, wird in diesem Kapitel auf Beweise verzichtet.
118
Wie bereits in der Einleitung erwähnt, kann aus dem Beweis des Satzes von TarskiSeidenberg ein Verfahren abgeleitet werden, mit dem bei gegebener semialgebraischer
Beschreibung einer Menge eine semialgebraische Beschreibung ihrer Projektion bestimmt werden kann. Damit lässt sich folgendes Verfahren zur Quantorenelimination
angeben:
Algorithmus. Gegeben seien ein semialgebraischer Ausdruck P und ein Variablensymbol x.
Zuerst bestimmt man die Zahl n ∈ N der Variablensymbole, die in P vorkommen und
von x verschieden sind. Die Namen dieser Variablen seien y0 , y1 , ..., yn−1 .
Die durch den semialgebraischen Ausdruck P beschriebene Menge
V := {(y, x) ∈ Rn × R; Die Variablenbelegung (y, x) erfüllt P }
ist semialgebraisch. Es lässt sich eine semialgebraische Beschreibung3 dieser Menge
finden. Diese kann, falls der Junktor „nicht“ in P vorkommt, komplizierter als P
sein4 .
Die Projektion
Rn+1 3 ξ 7→ (ξi )i∈n [V ] = {y ∈ Rn ; ∃x ∈ R : (y, x) ∈ V } =
{y ∈ Rn ; Die Variablenbelegung y erfüllt ∃x : P } =: W
ist nach Satz von Tarski-Seidenberg (Satz 2.4.5 auf Seite 64) semialgebraisch. Das
aus dem Beweis des Satzes ableitbare Verfahren lässt sich zur Bestimmung einer
semialgebraischen Beschreibung der Menge W verwenden. Das Problem ist nur, dass
die Bestimmung dieser Beschreibung sehr viel Zeit und dass die Beschreibung selbst
sehr viel Speicherplatz in Anspruch nehmen kann – selbst wenn die semialgebraische
Beschreibung der zu projizierenden Menge V überschaubar ist.
3
Damit ist eine Datenstruktur gemeint, die eine endliche Menge von Achsenabschnitten und Polynomen zu Polynom-Urbildern zusammenfasst, diese zu Urbildschnitten gruppiert und diese
wiederum zu einer semialgebraischen Menge zusammenfasst.
4
Da Komplemente in der in dieser Arbeit gewählten Definition der semialgebraischen Mengen
nicht auftauchen, stehen diese zur Übersetzung des Junktors „nicht“ nicht zur Verfügung. Die
Vorkommen dieses Junktors müssen zuerst mit Lemma 1.2.11 auf Seite 17 eliminiert werden.
119
4 Quantorenelimination mit dem Satz von Tarski-Seidenberg
Aus der semialgebraischen Beschreibung der Projektion W lässt sich direkt5 ein semialgebraischer Ausdruck Q ableiten, in dem außer y0 , y1 , ..., yn−1 keine Variablensymbole vorkommen und der die Projektion W beschreibt, d. h. für den
W = {y ∈ Rn ; Die Variablenbelegung y erfüllt Q}
gilt. Weil damit
{y ∈ Rn ; Die Variablenbelegung y erfüllt ∃x : P } =
{y ∈ Rn ; Die Variablenbelegung y erfüllt Q}
gilt, ist Q zum Ausdruck ∃x : P äquivalent, also ein Ausdruck wie gesucht.
Das soeben beschriebene Verfahren zur Existenzquantorenelemination kann auch zur
Elimination von Allquantoren verwendet werden, da jeder Ausdruck ∀x : P äquivalent zum Ausdruck
nicht (∃x : nicht (P ))
ist.
Wie in der Einleitung angekündigt, wird jetzt der Zusammenhang zwischen dem Satz
von Tarski-Seidenberg in der Form, in der er in der vorliegenden Arbeit vorkommt,
und dem von Tarski angegebenen Entscheidungsverfahren für ,sentences of elementary algebra’ hergestellt (siehe Einleitung, Seite 6). Das soeben beschriebene Verfahren zur Quantorenelimination, das wesentlich vom Satz von Tarski-Seidenberg in
der Form, in der er in der vorliegenden Arbeit vorkommt, Gebrauch macht, kann
auf folgende Weise zur Entscheidung über die Wahrheit einer ,sentence of elementary
algebra’ verwendet werden:
5
Wegen des Junktors „nicht“ ist der Übergang von einem semialgebraischen Ausdruck zur semialgebraischen Beschreibung der durch ihn beschriebenen Menge nicht direkt (siehe Fußnote 4
auf der vorherigen Seite). Der Übergang von der semialgebraischen Beschreibung einer Menge
zu einem semialgebraischen Ausdruck, der diese Menge beschreibt, bereitet dahingegen keine
Schwierigkeiten, da in der semialgebraischen Beschreibung keine Komplemente vorkommen und
solche, selbst wenn sie vorkämen, aufgrund der Verfügbarkeit des Junktors „nicht“ kein Hindernis
wären.
120
Algorithmus. Es handelt sich um ein rekursives Verfahren, mit dem zu jedem allgemeinen Ausdruck P ein zu diesem äquivalenter semialgebraischer Ausdruck gefunden
werden kann, der außer den in P unquantifizierten Variablensymbolen keine Variablensymbole enthält:
1. Ist ein allgemeiner Ausdruck von der Form
nicht P ,
so bestimmt man einen zu P äquivalenten semialgebraischen Ausdruck und
negiert diesen.
2. Ist ein allgemeiner Ausdruck von einer der beiden Formen
P und Q,
P oder Q,
so bestimmt man zu P und Q äquivalente semialgebraische Ausdrücke und
verknüpft diese.
3. Ist ein allgemeiner Ausdruck von einer der beiden Formen
∀x : P ,
∃x : P ,
so bestimmt man zuerst einen zu P äquivalenten semialgebraischen Ausdruck
und konstruiert anschließend mit dem oben angegebenen Verfahren zur Quantorenelimination einen zu ∀x : P bzw. ∃x : P äquivalenten semialgebraischen
Ausdruck.
4. Ist ein allgemeiner Ausdruck von keiner der aufgezählten Formen, so ist er
quantorenfrei und damit bereits ein semialgebraischer Ausdruck.
Wendet man dieses rekursive Verfahren auf eine ,sentence of elementary algebra’ P
an, so erhält man einen zu ihr äquivalenten semialgebraischen Ausdruck Q, der außer
den in P unquantifizierten Variablensymbolen keine Variablensymbole enthält. Da
aber P als ,sentence of elementary algebra’ keine unquantifizierten Variablensymbole
enthält, ist Q variablenfrei und die Bestimmung des Wahrheitswerts von P durch
einfaches Auswerten von Q möglich.
So kann also für jede ,sentence of elementary algebra’ entschieden werden, ob sie
wahr oder falsch ist.
121
Symbolverzeichnis
122
Symbolverzeichnis
N
Menge der nichtnegativen ganzen Zahlen
R (r)
Nachbereich der Relation r
D (r)
Vorbereich der Relation r
r [M ]
Nachbereich der Menge M unter der Relation r
[M ] r
Vorbereich der Menge M unter der Relation r
Rhni
Menge der Polynome in n Variablen über dem Ring R
spt (p)
Träger des Polynoms p, d.h. Menge der Indizes seiner nichtverschwindenden Koeffizienten
ph1i
Als Polynom in einer Variablen aufgefasstes Polynom p, siehe Definition 1.1.7 auf Seite 12
degk p
Grad des Polynoms p bezüglich seiner k-ten Variablen
deg p
Grad des einvariabligen Polynoms p
noc p
Koeffizientenzahl des einvariabligen Polynoms p
∂p
Ableitung des einvariabligen Polynoms p
p̂R oder p̂
Dem Polynom p über dem Ring R zugeordnete Polynomfunktion
\
[Rhni]
Menge der Polynomfunktionen auf Rn
px̂
Polynom, das aus dem Polynom p durch Einsetzen von x in dessen
Koeffizientenpolynome entsteht, siehe Definition 1.1.8 auf Seite 12
123
Symbolverzeichnis
vx̂
Polynomvektor, der aus dem Polynomvektor p durch komponentenweises Einsetzen von x in die Koeffizientenpolynome entsteht, siehe
Definition 2.2.9 auf Seite 36
v
Komponentenzahl des Vektors v
A
Zeilenzahl der Matrix A
|A|
Spaltenzahl der Matrix A
v|Z
Vektor, der aus dem Vektor v hervorgeht, wenn von seinen Komponenten nur diejenigen mit Indizes in Z beibehalten werden, siehe Definition 2.1.3 auf Seite 26
A|Z,S
Matrix, die aus der Matrix A hervorgeht, wenn von ihren Zeilen nur
diejenigen mit Indizes in Z und von ihren Spalten nur diejenigen mit
Indizes in S beibehalten werden, siehe Definition 2.1.4 auf Seite 27
Adj (A)
Adjunkten-Matrix der Matrix A
RK h1i
Menge der Polynome in einer Variablen über dem Ring R mit Grad
kleiner als K, siehe Definition 2.1.8 auf Seite 28
Rµ h1i
Menge der Polynomvektoren über dem Ring R, deren Grad durch den
Multiindex µ beschränkt ist, siehe Definition 2.2.7 auf Seite 35
M
b
Q
In Definition 2.1.10 auf Seite 29 definierte Matrix
modM,Q (a, b) In Definition 2.1.14 auf Seite 31 definierter Divisionsrest
quoM,Q (a, b) In Definition 2.1.14 auf Seite 31 definierter Quotient
a|b
a ist ein Teiler von b
a-b
a ist kein Teiler von b
diff kµ
In Definition 2.2.8 auf Seite 35 definierte Funktion
restkµ
In Definition 2.2.8 auf Seite 35 definierte Funktion
redkµ
In Definition 2.2.8 auf Seite 35 definierte Funktion
frq v
Häufigkeit des Polynomvektors v
124
Symbolverzeichnis
IN (v)
Menge der isolierten Nullstellen des reellen Polynomvektors v
in (v)
Nullstellennummerierung des reellen Polynomvektors v
I (v)
Intervallnummerierung des reellen Polynomvektors v
sgn (x)
Signum der Zahl x
SGN (v)
Vorzeichenmatrix des reellen Polynomvektors v
kAk
Anzahl der Nullstellen der Matrix A
Pµk
In Definition 2.2.17 auf Seite 39 definierte Menge reeller Polynomvektoren
B
a b
A
Resultantenmatrix der Polynome a und b mit unterstellten Graden A
und B
ResA,B (a, b)
Resultante der Polynome a und b mit unterstellten Graden A und B
DisF (f )
Diskriminante des Polynoms f mit unterstelltem Grad F
B (z, ε)
Offene Kreisscheibe um z ∈ C mit Radius ε > 0
B [z, ε]
Abgeschlossene Kreisscheibe um z ∈ C mit Radius ε > 0
1M
Indikatorfunktion der Menge M
#E
Zahl der Elemente der endlichen Menge E
∈ (E)
Element der einelementigen Menge E
[N, R]
In Definition 2.2.2 auf Seite 33 definierte Folge
tr (a)
In Abschnitt 3.3 auf Seite 98 definiertes Polynom
ek
Einheitsvektor
wdgδ (θ)
δ-Windungszahl der δ-Auffaltung θ
Λ
Menge der Achsenabschnitte
U (Rn )
Menge der Polynomurbilder
S (Rn )
Menge der Urbildschnitte
V (Rn )
Menge der semialgebraischen Mengen
125
Symbolverzeichnis
126
Index
0 × 0-Matrix, 27
Hilbertraum, 110
Ableitung eines Polynoms, 34
Indikatorfunktion, 25, 32, 98
Achsenabschnitt, 13
Integritätsring, 20
Adjunkten-Matrix, 27
Intervallnummerierung, 38
allgemeiner Ausdruck, 117
irreduzibel, 21
Anzahl der Nullstellen einer Matrix, 38
John von Neumann, 9
beschränkter Grad, 28, 35
Bild, 9
Kürzungsregel, 20
Koeffizientenzahl, 11
Charakteristik Null, 73
δ-Auffaltung, 84, 103
δ-Windungszahl, 84
Differentialoperator, 109
Diskriminante, 73
kommutativer Ring mit Eins, 9
Komponenten streichen, 26
Komponentenzahl eines Vektors, 26
Komposition, 45, 90
linkseindeutig, 40
Divisionsrest, 31
Matrix, 26
Einheit, 20
Menge der isolierten Nullstellen, 37
Einheitsvektor, 35
Menge der natürlichen Zahlen, 9
Einsetzen, 12, 37
Menge der Polynome, 10
faktorieller Ring, 21
Fourier-Laplace-Transformation, 111
Menge der Polynomfunktionen, 10
Multiindex, 35
Fourier-Transformation, 110
Nachbereich, 9
Funktion, 9
Nullstellennummerierung, 38
Grad, 11
Häufigkeit, 33, 52, 53
Nullstellenverfolgung, 78
Nullteiler, 20, 70
nullteilerfrei, 20
127
Index
Polynom, 9
Polynom-Urbild, 14
Polynomdivision, 25, 29, 31
Polynomfunktion, 10
Polynomring, 10
Polynomvektor, 33
Polynomvektor, reeller, 33
Primelement, 21
Produktregel, 73
Projektion, 64
Puiseux-Reihe, 96
quadratische Matrix, 27
Quantorenelimination, 117
Quotient, 31
Quotientenkörper, 25
rechtseindeutig, 9
Reduktion, 36, 53
Reduktionslemma, 40
Resultante, 69
Resultantenmatrix, 67
Satz von Gauß, 22
Satz von Tarski-Seidenberg, 5, 64, 105,
108, 113, 119
semialgebraische Beschreibung, 119
semialgebraische Funktion, 100
semialgebraische Menge, 14
semialgebraischer Ausdruck, 117
sentences of elementary algebra, 5, 117
Signum, 13
Spaltenzahl einer Matrix, 26
Teiler, 20
Träger, 9
Urbild, 9
128
Urbildschnitt, 14
Vektor, 26
Verkettung, 45, 90
Vorbereich, 9
vorgängerlos, 18
Vorzeichenmatrix, 38, 39
Vorzeichenverhalten, 38
wohlfundierte Induktion, 19, 55, 58
wohlfundierte Relation, 18, 55, 58
Zeilen und Spalten streichen, 27
Zeilenzahl einer Matrix, 26
zugeordnete Polynomfunktion, 10
Zwischen-Nullstelle, 44
Literaturverzeichnis
[Atk] Atkinson, F.: Multiparameter Eigenvalue Problems Volume I, New
York/London 1972, Academic Press.
[Boc0] Bochnak, Jacek; Coste, Michel; Roy, Marie-Françoise: Géométrie algébrique
réelle, Berlin/Heidelberg 1987, Springer-Verlag.
[Boc1] Bochnak, Jacek; Coste, Michel; Roy, Marie-Françoise: Real Algebraic Geometry, Berlin/Heidelberg 1998, Springer-Verlag.
[Bül] Von Bülow, Christopher: Beweisbarkeitslogik, Berlin 2006, Logos Verlag.
[Coh] Cohen, Paul: A simple proof of Tarski’s theorem on elementary algebra,
Mimeographed manuscript, Stanford University 1967, 6 pp.
[Fre] Freitag, Eberhard; Busam, Rolf: Funktionentheorie, Berlin/Heidelberg 1993,
Springer-Verlag.
[Göd] Gödel, Kurt: Über formal unentscheidbare Sätze der Principia Mathematica
und verwandter Systeme I. Monatshefte für Mathematik, Volume 38, Number
1, Wien 1931, Springer-Verlag, S. 173-198.
[Hör] Hörmander, Lars: The Analysis of Linear Partial Differential Operators II,
Berlin/Heidelberg 1983, Springer-Verlag.
[Hor] Hornfeck, Bernhard: Algebra, Berlin/New York 1976, De Gruyter Lehrbuch.
[Koz] Kozen, Dexter: Theory of computation, 2006, Springer-Verlag.
[Mes] Meschkowski, Herbert: Problemgeschichte der Mathematik III, Zürich 1986,
B.I.-Wissenschaftsverlag.
[Oel] Oeljeklaus, Eberhard; Remmert, Reinhold:
Berlin/Heidelberg 1974, Springer-Verlag.
Lineare
Algebra
I,
[Pic] Picard, Rainer; McGhee, Des: Partial Differential Equations: A unified Hilbert
Space Approach, Manuskript, Dresden 2009.
http://www.math.tu-dresden.de/~picard/picard/lectures/PDE_I_2009
129
Literaturverzeichnis
[Pre] Prestel, Alexander; Delzell, Charles: Positive Polynomials, Berlin/Heidelberg
2001, Springer-Verlag.
[Rüh] Rühs, F.: Funktionentheorie, Berlin 1971, Deutscher Verlag der Wissenschaften.
[Rei] Reiffen, Hans-Jörg; Scheja, Günter; Vetter, Udo: Algebra, Mannheim 1984, B.I.Wissenschaftsverlag.
[Sei] Seidenberg, Abraham: A new decision method for elementary algebra. Annals
of Mathematics, Vol. 60, 1954, S. 365-374.
[Tar] Tarski, Alfred: A decision method for elementary algebra and geometry. In:
Givant, Steven; McKenzie, Ralph (Hrsg.): Alfred Tarski: Collected Papers Volume 3, Basel 1986, Birkhäuser Verlag, S. 299-367.
Ersterscheinung:
Tarski, Alfred: A decision method for elementary algebra and geometry, Berkeley/Los Angeles 1951, University of California Press, 63 pp.
[Voi] Voigt, Jürgen: Perturbation Theory of Eigenvalues, Manuskript, Dresden 2009.
http://www.math.tu-dresden.de/~voigt/lehre/vorlesungen/opth
130
Erklärung
Hiermit erkläre ich, dass ich die am heutigen Tag eingereichte Diplomarbeit zum
Thema „Der Satz von Tarski-Seidenberg und seine Anwendung in der Theorie der
partiellen Differentialgleichungen“ unter Betreuung von Prof. Dr. rer. nat. Rainer
Picard selbstständig erarbeitet, verfasst und Zitate kenntlich gemacht habe. Andere
als die angegebenen Hilfsmittel wurden von mir nicht benutzt.
Datum
Unterschrift
131
Herunterladen