Entscheidungsprobleme in der Gruppentheorie

Werbung
Entscheidungsprobleme in der Gruppentheorie
Dr. C. Reinfeldt
24. Februar 2014
Inhaltsverzeichnis
1 Grundlagen der Berechenbarkeitstheorie
1.1 Notationen . . . . . . . . . . . . . . . . . .
1.2 Primitiv rekursive Funktionen . . . . . . . .
1.3 Rekursive Funktionen . . . . . . . . . . . .
1.4 Rekursiv aufzählbare und rekursive Mengen
1.5 Diophantische Mengen und Funktionen . . .
1.6 Rekursivität auf N∗ . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
3
4
4
8
10
11
19
2 Gruppen und Gruppenpräsentierungen
2.1 Freie Gruppen . . . . . . . . . . . . . . . . . . . . . .
2.2 Gruppenpräsentierungen . . . . . . . . . . . . . . . . .
2.3 Freie Produkte . . . . . . . . . . . . . . . . . . . . . .
2.4 HNN-Erweiterungen . . . . . . . . . . . . . . . . . . .
2.5 Eigenschaften von Gruppen und Nielsen-Reduziertheit
2.6 Markov-Eigenschaften . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
23
23
26
28
29
32
35
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
3 Entscheidungsprobleme
36
3.1 Wortproblem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
4 Einbettungssätze
37
4.1 Der Higmansche Einbettungssatz . . . . . . . . . . . . . . . . . . 38
Stichwortverzeichnis
45
Literaturverzeichnis
47
Einleitung
In dieser Vorlesung beschäftigen wir uns mit Fragen der algorithmischen Berechenbarkeit verschiedener Eigenschaften von Gruppen. Eine solche Frage könnte
zum Beispiel so lauten:
1
“Gegeben sei eine Gruppe G. Gibt es einen Algorithmus, der entscheidet,
ob die Gruppe G eine bestimmte Eigenschaft hat (z.B., ob G trivial ist, ob G
hyperbolisch ist, . . . )?”
Etwas technischer formuliert, suchen wir also nach einem Algorithmus, der
folgendes leistet: Bekommt er als Input eine Gruppe G, so berechnet er als Output einen Wahrheitswert (true/false), der angibt, ob die Gruppe die gewünschte
Eigenschaft hat.
Um dieser Problemstellung einen vernünftigen Sinn zu verleihen, müssen
wir zwei Dinge klären. Einerseits brauchen wir einen formalen Rahmen für den
Begriff Algorithmus. Ein Algorithmus ist, anschaulich gesprochen, exakt das,
was man sich unter einem Computerprogramm vorstellt, das in einer gängigen
Programmiersprache (C, C++, Java, . . . ) geschrieben ist. Um sich davon zu
überzeugen, dass eine gewisse Aufgabenstellung algorithmisch gelöst werden
kann, reicht diese Anschauung oft schon aus: Man schreibt einfach ein entsprechendes Programm, das die Lösung liefert. Um allerdings zu beweisen, dass
es einen solchen Algorithmus nicht geben kann, brauchen wir einigen Formalismus, um die algorithmisch berechenbaren Funktionen klassifizieren zu können.
Diesen Formalismus werden wir in Kapitel 1 erarbeiten.
Andererseits brauchen wir eine Möglichkeit, eine Gruppe so zu beschreiben,
dass wir sie als Input an einen Algorithmus übergeben können. Um eine Gruppe vollständig zu beschreiben, muss festgelegt werden, welche, bzw. wie viele,
Elemente sie hat, und wie die Verknüpfung in der Gruppe definiert ist.
Eine Möglichkeit, dies für eine endliche Gruppe zu beschreiben, wäre etwa eine Gruppentafel. Eine andere, und für uns interessantere Möglichkeit, ist
die der Gruppenpräsentierung: Eine Gruppe wird durch eine Menge von Erzeugenden und eine Menge von Relationen beschrieben; letztere kann man sich
als Rechenregeln vorstellen, die die Verknüpfung der Gruppe definieren. Wir
werden Gruppenpräsentierungen in Kapitel 2 formalisieren.
....
2
1
Grundlagen der Berechenbarkeitstheorie
In diesem Abschnitt wollen wir gewisse Grundlagen der Berechenbarkeitstheorie
diskutieren und uns einen Überblick verschaffen, unter welchen Voraussetzungen
eine gegebene Funktion berechenbar ist. Berechnenbar soll hierbei, informell,
bedeuten, dass es einen Algorithmus gibt, der für ein gegebenes n aus dem
Definitionsbereich von f das Bild f (n) berechnen kann. Dabei geben wir dem
Computer, der den Algorithmus ausführen soll, grundsätzlich beliebig viel Zeit
und Speicher; wir wollen also nur diskutieren, ob ein Algorithmus existiert, ohne
die Effizienz zu untersuchen.
Um zu argumentieren, dass eine gegebene mathematische Funktion berechenbar ist, genügt es oft, ein Stück Code1 zu liefern, das den Algorithmus
beschreibt, der die Funktion berechnet. So beschreibt z.B. der Code
function binom(n,k) {
if
n < k: return 0;
else if k = 0: return 1;
else:
return
binom(n-1,k)
+ binom(n-1,k-1);
}
eine Funktion, die bei Eingabe
zweier nicht-negativer ganzer Zahlen n und k
den Binomialkoffizienten nk berechnet und zurückgibt.
Nun wird dieses Stück Code jeden, der schon einmal Erfahrungen mit Programmierung gemacht hat, davon überzeugen, dass ein Binomialkoeffizient tatsächlich von einem Computer berechnet werden kann, denn alle Anweisungen,
die in dem Code benutzt werden, stehen in jeder gängigen Programmiersprache
(wie etwa C, C++ und Java) zur Verfügung und können damit in ein Computerprogramm eingebaut werden.
Die Frage, die sich nun aufdrängt, ist folgende: Können eigentlich alle Funktionen, die man im mathematischen Sinne definieren kann, auch durch einen
Algorithmus, d.h. von einem Computer berechnet werden? Um auf diese Frage
eine Antwort geben zu können, braucht es etwas mehr Formalismus: Was ist
eigentlich ein Computer? Oder, genauer gefragt: Was kann ein Computer?
Um dies zu beantworten, gibt es mehrere, äquivalente Ansätze: In der theoretischen Informatik gibt es formale Modelle von Computern, wie etwa die TuringMaschine und die Registermaschine, deren Funktionsumfang man genau beschreiben kann. Es ist ein grundlegendes Resultat der theoretischen Informatik,
dass die von einer Turing-Maschine oder –äquivalent dazu– einer Registermaschine berechenbaren Funktionen gerade die µ-rekursiven Funktionen, oder kurz
rekursiven Funktionen (vgl. Definition 1.10), sind; diesen Begriff werden wir uns
in den folgenden Abschnitten erarbeiten.
1 Dieser wird meist als Pseudo-Code bezeichnet, sofern er heuristisch und ohne klar definierte Syntaxregeln (z.B. in einer konkreten Programmiersprache) gegeben ist.
3
1.1
Notationen
Zunächst fixieren wir einige Definitionen. Wir definieren die Menge der natürlichen Zahlen als
N := {0, 1, 2, 3, . . .},
d.h. einschließlich der Zahl 0. Die positiven natürlich Zahlen bezeichnen wir bei
Bedarf mit N+ := N \ {0}.
Der Begriff Funktion wird im folgenden stets eine Abbildung von Nk nach Nl
bezeichnen, wobei k, l ∈ N+ . Wir benutzen dabei die üblichen Verknüpfungen:
Definition 1.1. Wir definieren folgende Verknüpfungen für Funktionen:
1. Sind g1 , . . . , gm : Nk → Nl Funktionen, dann ist (g1 , . . . , gm ) definiert
durch
(g1 , . . . , gm ) : Nk → Nm·l , x̄ 7→ (g1 (x̄), . . . , gm (x̄))
(x̄ ∈ Nk ).
2. Ist f : Nk → Nl und g : Nl → Nq , so ist g ◦ f gegeben durch
g ◦ f : Nk → Nq , (x1 , . . . , xk ) 7→ g(f (x1 , . . . , xk )).
1.2
Primitiv rekursive Funktionen
Definition 1.2. Die folgenden Funktionen heißen primitive Funktionen:
1. Die konstante Funktion c0 : N → N, n 7→ 0,
2. die Nachfolgerfunktion2 s : N → N, n 7→ n + 1,
3. die Projektion auf die i-te Koordinate,
πik : Nk → N, (x1 , . . . , xk ) 7→ xi
für 1 ≤ i ≤ k. Für πik schreiben wir üblicherweise kurz πi , wenn das k aus
dem Kontext heraus eindeutig ist.
Mithilfe der primitiven Funktionen definieren wir nun iterativ die primitiv
rekursiven Funktionen. Eine Funktion ist primitv rekursiv, falls sie aus den primitiven Funktionen durch (wiederholte) Komposition und primitive Rekursion
konstruierbar ist:
Definition 1.3. Die Klasse der primitiv rekursiven Funktionen ist die kleinste
Klasse von Funktionen, für die gilt
1. Jede primitive Funktion ist primitiv rekursiv.
2. (Komposition:) Sind g1 , . . . , gm : Nk → N und f : Nm → N primitiv
rekursiv, dann ist
f ◦ (g1 , . . . , gm )
primitiv rekursiv.
2s
steht für “successor”, engl. Nachfolger
4
3. (Primitive Rekursion:) Sind g : Nk → N und h : Nk+2 → N primitiv
rekursiv, so ist f : Nk+1 → N mit
f (x1 , . . . , xk , 0)
=
g(x1 , . . . , xk ) und
f (x1 , . . . , xk , t + 1)
=
h(t, f (x1 , . . . , xk , t), x1 , . . . , xk ) ∀t ∈ N
primitiv rekursiv.
Beispiel 1.4. Wir werden im folgenden für eine ganze Reihe von Funktionen
zeigen, dass sie primitiv rekursiv sind. Einerseits soll dies einen Eindruck davon
vermitteln, wie mächtig die Klasse der primitiv rekursiven Funktionen ist, andererseits wird sie uns als Repertoire von primitiv rekursiven Funktionen dienen,
auf das wir später öfters zurückgreifen werden.
1. Für jedes k ∈ N ist die konstante Funktion ck : N → N, n 7→ k, primitiv
rekursiv, denn
ck = s| ◦ .{z
. . ◦ s} ◦c0
k-mal
(wobei s die Nachfolgerfunktion ist, vgl. Definition 1.2 (2)).
2. Die Identität auf N ist primitiv rekursiv, denn idN = π11 .
3. Die Addition + : N2 → N, (x, y) 7→ x+y ist primitiv rekursiv, da sie durch
primitive Rekursion aus der Nachfolgerfunktion hervorgeht: x + 0 = x =
idN (x) und
x + (t + 1) = s(x + t) = s ◦ π2 (t, x + t, x)
für alle t ∈ N.
4. Die Vorgängerfunktion3
(
pred : N → N,
0
t+1
7→ 0
7→ t
∀t ∈ N
ist primitiv rekursiv, denn pred(0) = 0 und pred(t+1) = t = π1 (t, pred(t))
für alle t ∈ N.
5. Die beschränkte Subtraktion
(
x−y
· N2 → N, (x, y) 7→ x −
· y :=
−:
0
für x ≥ y
für x < y
ist primitiv rekursiv, da sie durch primitive Rekursion aus der Vorgänger· 0 = x und
funktion hervorgeht: x −
· t, x)
· (t + 1) = pred(x −
· t) = pred ◦ π2 (t, x −
x−
für alle t ∈ N.
(Achtung: Die klassische Subtraktion ist kein Kandidat für eine primitiv
rekursive Funktion, weil sie, auf N2 definiert, den Bildbereich Z hat.)
3 pred
steht für “predecessor”, engl. Vorgänger
5
6. Die Maximums- und Minimumsfunktion max, min : N2 → N sind primitiv
rekursiv, denn
· x) und min(x, y) = x −
· (x −
· y)
max(x, y) = x + (y −
für alle x, y ∈ N.
7. Die (euklidische) Abstandsfunktion auf N, gegeben durch
d : N2 → N, (x, y) 7→ d(x, y) = |y − x|
ist primitiv rekursiv, denn
· y, y −
· x)
|y − x| = max(x −
für alle x, y ∈ N.
8. Sind f, g : Nn → N primitiv rekursiv, so ist
f + g : Nn → N, (x1 , . . . , xn ) 7→ f (x1 , . . . , xn ) + g(x1 , . . . , xn )
primitiv rekursiv, denn f + g = + ◦ (f, g).
9. Die Mulitiplikation · : N2 → N, (x, y) 7→ x · y ist primitiv rekursiv, denn
x · 0 = 0 und
x · (t + 1) = x · t + x = π2 + π3 (t, x · t, x).
10. Die Indikatorfunktion4 der Relation ≤ auf N2 :
(
1
2
1≤ : N → N, (x, y) 7→ 1x≤y :=
0
falls x ≤ y
falls x > y
ist primitiv rekursiv, denn
· x)
1x≤y = min(1, (y + 1) −
für alle x, y ∈ N. Analog kann man einsehen, dass die Indikatorfunktionen
der Relationen <, ≥ und > sowie = und 6= primitiv rekursiv sind.
11. Der Modulo-Operator mod : N2 → N, gegeben durch
(a, b) 7→ (a mod b) := min{k ∈ N | b teilt a − k}
ist primitiv rekursiv, denn (0 mod b) = 0 und
(t + 1 mod b) = ((t mod b) + 1) · 1(t mod b)+16=b .
4 Für eine beliebige Relation R ⊂ Nk ist die Indikatorfunktion definiert als 1
k
R : N →
{0, 1} ⊂ N, x̄ 7→ 1x̄∈R mit 1x̄∈R = 1 ⇔ x̄ ∈ R.
6
12. Für jedes Polynom P ∈ Z[t1 , . . . , tk ] ist die (unsignierte) polynomiale Abbildung
Nk → N, (x1 , . . . , xk ) 7→ |P (x1 , . . . , xk )|
primitiv rekursiv. Dies folgt aus iterativer Anwendung von (8) und (9)
sowie (7).
Wir konstruieren im folgenden eine weitere, für den Rest des Kapitels wesentliche Funktion, nämlich die Cantorsche Paarfunktion. Dies ist eine primitiv
rekursive Bijektion CP : N2 → N, von der wir oft Gebrauch machen werden.
Konstruktion 1.5 (Cantorsche Paarfunktion). Definiere zunächst die Dreiecksfunktion T durch
n · (n + 1)
.
2
Dann existieren für jedes z ∈ N eindeutige Zahlen n, y ∈ N mit
T : N → N, n 7→ 1 + 2 + . . . + n =
z = T (n) + y und y ≤ n.
Setzen wir x := n − y, so gilt x ≥ 0, und es folgt: Für jedes z ∈ N existiert ein
eindeutiges Paar (x, y) ∈ N2 , so dass
z = T (x + y) + y.
Definiere die Funktion
CP : N2 → N, (x, y) 7→ T (x + y) + y.
CP ist also eine Bijektion, und offensichtlich sind T und somit auch CP primitiv
rekursiv.
Weiter definieren wir L, R : N → N implizit durch
z = CP (L(z), R(z)) für alle z ∈ N.
L(z) und R(z) sind also die linke und die rechte Koordinate des eindeutigen
Paares (x, y), das durch CP auf z abgebildet wird. (Explizit könnte man also
die Funktionen durch L := π1 ◦ CP −1 und R := π2 ◦ CP −1 definieren, vgl.
Definition 1.2 (3)).
Abschließend zeigen wir, dass L und R primitiv rekursiv sind. Betrachte die
Hilfsfunktion
h : N → N, n 7→ max{k ∈ N | T (k) ≤ n}.
Dann ist h primitiv rekursiv, denn h(0) = 0 und
h(t + 1) = h(t) + 1T (h(t)+1)≤t+1
für alle t ∈ N. Nun folgt
R(n)
· T (h(n))
= n−
L(n)
· R(n)
= h(n) −
und
· sind primitiv rekursiv (vgl. 1.4 (5)), also auch L und
für alle n ∈ N. T und −
R.
7
Die Cantorsche Paarfunktion CP liefert uns, iterativ angewandt, primitiv
rekursive Bijektionen von Nk nach N für beliebiges k:
Definition 1.6. Sei k ∈ N. Definiere die Funktion CPk : Nk → N durch CP1 =
idN , CP2 := CP und
CPk+1 : Nk+1 → N, (x1 , . . . , xk+1 ) 7→ CPk (CP (x1 , x2 ), x3 , . . . , xk+1 )
für k ≥ 2. CPk ist offenbar primitiv rekursiv und bijektiv.
1.3
Rekursive Funktionen
Betrachten wir die Funktion f , die eine gegebene natürliche Zahl auf die Position
des ersten Vorkommens ihrer Ziffernfolge in der Dezimaldarstellung der Zahl π
abbildet. So wäre etwa f (415) = 3, denn π = 3, 1415926 . . ., also findet sich
die Ziffernfolge “415” erstmals an Position 3 beginnend. Diese Funktion mag,
verglichen mit den Funktionen aus Beispiel 1.4, ein wenig skurril erscheinen, weil
sie nicht einfach auf arithmetischen Berechnungen natürlicher Zahlen beruht, die
man in einer handlichen Formel zusammenfassen kann.
Dennoch ist f eine wohldefinierte Funktion, die natürliche Zahlen auf natürliche Zahlen abbildet, und die Intuition sagt uns, dass f sicherlich von einem
Computer berechnet werden kann: Es gibt zahlreiche Verfahren, die Zahl π
auf beliebig viele Nachkommastellen genau zu berechnen; ein Algorithmus, der
f (n) berechnen soll, könnte also zukzessive immer mehr Nachkommastellen von
π berechnen und jeweils testen, ob die zuletzt berechneten Ziffern gerade mit
denen von n übereinstimmen.
Ein Computer kann die Funktion f also deshalb berechnen, weil er neben
Arithmetik noch etwas kann: Suchen. Diese Fähigkeit erlaubt es ihm, Funktionen zu berechnen, die nicht primitiv rekursiv sind. Wir müssen also die Klasse
der primitiv rekursiven Funktionen, erweitern, um alle berechenbaren Funktionen zu verstehen.
Allerdings stellt sich hier noch ein weiteres Problem: Es ist keineswegs klar,
ob die Funktion f überhaupt auf ganz N definiert ist, d.h. ob jede endliche
Ziffernfolge in der Dezimaldarstellung von π auftaucht (Es wird gemeinhin angenommen, dass π normal ist, was dieses implizieren würde, ist aber bisher
unbewiesen). D.h. wir können f zwar wie oben definieren, ohne aber zu wissen,
was der Definitionsbereich von f ist.
Falls wir also den oben skizzierten Algorithmus mit einer Eingabe n ins Rennen schicken, deren Dezimaldarstellung nicht in π vorkommt, so würde dieser
offenbar unendlich lange laufen, ohne die Zahl je zu finden und ohne je zu der
Erkenntnis zu gelangen, dass er sie nicht finden wird.
Bei der Klassifikation von berechenbaren Funktionen haben wir es also tatsächlich mit partiellen Funktionen zu tun, die i.a. gar nicht auf ganz Nk definiert
sind:
Definition 1.7. Eine partielle Funktion (von Nk nach Nl ) ist eine Funktion
f : S → Nl für eine Teilmenge S ⊂ Nk . Wir schreiben kurz
f : Nk
8
Nl .
S heißt der Definitionsbereich von f , geschrieben S = Def(f ). Ist Def(f ) = Nk ,
so nennen wir f totale Funktion.
Wir können partielle Funktionen wie gewohnt verknüpfen, müssen dann aber
auf den Definitionsbereich aufpassen:
Definition 1.8. Wir definieren folgende Verknüpfungen für partielle Funktionen:
1. Sind g1 , . . . , gm : Nk
mit
Nl partielle Funktionen, dann ist ḡ := (g1 , . . . , gm )
Def(ḡ) =
m
\
Def(gi )
i=1
gegeben durch
ḡ : Nk
2. Ist f : Nk
Nm·l , x̄ 7→ (g1 (x̄), . . . , gm (x̄))
Nl und g : Nl
(x̄ ∈ Def(ḡ)).
Nq , so ist g ◦ f mit
Def(g ◦ f ) = Def(f ) ∩ f −1 (Def(g))
gegeben durch
g ◦ f : Nk
Nq , (x1 , . . . , xk ) 7→ g(f (x1 , . . . , xk )).
(Man beachte, dass Definition 1.8 im Falle von totalen Funktionen mit Definition 1.1 übereinstimmt, so dass hier keine Mehrdeutigkeiten entstehen.) Insbesondere ist mit diesen Verknüpfungen auch die Komposition von partiellen
Funktionen gemäß Definition 1.3 (2) definiert.
Definition 1.9 (µ-Operator). Sei f : Nk+1
x̄ := (x1 , . . . , xk ) ∈ Nk setze
N eine partielle Funktion. Für
M (x̄) := {n ∈ N | (x̄, l) ∈ Def(f ) ∀ l ≤ n und f (x̄, n) = 0}.
Dann ist µf : Nk
N mit Def(µf ) = {x̄ ∈ Nk | M (x̄) 6= ∅} gegeben durch
µf (x̄) = min(M (x̄))
∀x̄ ∈ Def(µf ).
Definition 1.10. Die Klasse der rekursiven Funktionen ist die kleinste Klasse
N (für beliebiges k ∈ N+ ), die die primitiv
von partiellen Funktionen f : Nk
rekursiven Funktionen enthält und abgeschlossen unter Komposition, primitiver
Rekursion und dem µ-Operator ist.
Beispiel 1.11.
1. Jede Funktion f : Nk
N mit einelementigem Definitionsbereich ist rekursiv: Sei m̄ := (m1 , . . . , mk ) ∈ Nk und f : {m̄} →
N, m̄ 7→ l. Setze
hm̄,l : Nk+1 → N, n̄ 7→ |n̄ − (m1 , . . . , mk , l)|.
Dann ist hm̄,l primitiv rekursiv (dies folgt leicht mithilfe von 1.4 (7)) und
f = µhm̄,l .
9
2. Jede Funktion mit endlichem Definitionsbereich ist rekursiv: Sei
S := {m̄1 , . . . , m̄j } ⊂ Nk
und f : S → N, m̄i 7→ li . Setze
h : Nk+1 → N, n̄ 7→
j
Y
hm̄i ,li (n̄).
i=1
Dann ist h primitiv rekursiv und f = µh.
Wir beenden diesen Abschnitt mit einem klassischen Resultat der theoretischen Informatik, dem Normalformsatz von Kleene (in einer abgeschwächten
Version). Die Definition einer rekursiven Funktion erlaubt es uns, den µ-Operator in beliebiger Verschachtelung zu verwenden, um rekursive Funktionen zu
konstruieren. Der Normalformsatz sagt aber, dass dies gar nicht nötig ist: Jede
rekursive Funktion kann aus primitiv rekursiven Funktionen mit einer einzigen
Anwendung des µ-Operators konstruiert werden. Wir verzichten an dieser Stelle
auf einen Beweis.
Satz 1.12 (Normalformsatz von Kleene). Sei f : Nk
N eine rekursive Funktion. Dann existieren primitiv rekursive Funktionen h : Nk+1 → N und u : N → N,
so dass gilt
f = u ◦ µh.
1.4
Rekursiv aufzählbare und rekursive Mengen
Zwei für die weiteren Kapitel zentrale Begriffe, den uns die Theorie der rekursiven Funktionen liefert, sind die Begriffe der rekursiven bzw. rekursiv aufzählbaren
Mengen. Wir wollen zunächst diese Begriffe definieren:
Definition 1.13. Eine Menge S ⊂ Nk heißt rekursiv, wenn ihre Indikatorfunktion 1S rekursiv ist.
Eine Menge S ist also rekursiv, wenn es einen Algorithmus gibt, der bei
Eingabe von x̄ ∈ Nk entscheidet, ob x̄ ∈ S. Eine Menge ist rekursiv aufzählbar,
wenn es einen Algorithmus gibt, der eine Liste aller Elemente in S generiert. Es
folgt leicht aus den Definitionen (und ist auch gut anschaulich nachzuvollziehen),
dass jede rekursive Menge rekursiv aufzählbar ist. Es ist aber weit weniger klar,
ob jede rekursiv aufzählbare Menge auch rekursiv ist. Die Antwort hierauf lautet
Nein.
Wir werden in diesem Abschnitt sehen, dass die Menge S genau dann rekursiv ist, wenn S und N \ S rekursiv aufzählbar ist. Dies zeigt noch nicht, dass
rekursiv aufzählbare Mengen i.a. nicht rekursiv sind, denn die Existenz einer
reskursiv aufzählbaren Menge S, für die N \ S nicht rekursiv aufzählbar ist,
ist keineswegs trivial. Eine solche Menge werden wir in Abschnitt 1.5 explizit
konstruieren.
10
Definition 1.14. Eine Menge S ⊂ Nk heißt rekursiv aufzählbar, wenn eine
partiell rekursive Funktion f : Nk
N mit Def(f ) = S existiert.
Lemma 1.15. Eine Funktion f : Nk
N ist genau dann rekursiv, wenn ihr
Graph
Γf := {(x̄, f (x̄)) | x̄ ∈ Def(f )} ⊂ Nk+1
rekursiv aufzählbar ist.
Beweis. Sei zunächst f : Nk
h : Nk+2
N rekursiv. Setze
N, (x1 , . . . , xk+2 ) 7→ |f (x1 , . . . , xk ) − xk+1 |.
Dann ist Def(µh) = Γf .
Sei andersherum Γf rekursiv aufzählbar, d.h. es existiert eine rekursive Funktion g : Nk+1
N mit Def(g) = Γf . Seien (gemäß Satz 1.12) u : N → N und
h : Nk+2 → N primitiv rekursiv mit g = u ◦ µh. Setze die Funktion
q : Nk+1
N, (x1 , . . . , xk , n) 7→ h(x1 , . . . , xk , L(n), R(n)).
Dann ist q rekursiv und f = L ◦ µq.
Satz 1.16. Eine Menge S ⊂ Nk ist genau dann rekursiv, wenn S und Nk \ S
rekursiv aufzählbar sind.
Beweis. Seien zunächst S und S̄ := Nk \S rekursiv aufzählbar. Es existieren also
rekursive Funktionen f, f¯ : Nk → N mit Bild(f ) = S und Bild(f¯) = S̄. Setze
f 0 := c1 ◦ f , f¯0 := c0 ◦ f¯. Dann sind f 0 , f¯0 rekursiv (vgl. Beispiel 1.4 (1)), also
sind nach Lemma 1.15 die Graphen Γf 0 und Γf¯0 rekursiv aufzählbar. Dann ist
auch Γ := Γf 0 ∪ Γf¯0 rekursiv aufzählbar (vgl. Übungsblatt1, Aufgabe 2.2). Nun
ist Γ gerade der Graph der Indikatorfunktion 1S . Wiederum nach Aufgabe 2.4
ist also 1S und somit S rekursiv.
Sei nun andersherum 1S rekursiv. Dann ist für S̄ = Nk \ S auch 1S̄ rekursiv,
k
· 1
denn 1x̄∈S = 1 −
x̄∈S̄ für alle x̄ ∈ N . Setze
h : Nk+1 → N, (x̄, n) 7→ 1S̄ (x̄).
Dann ist h rekursiv und Def(µh) = S. Dies zeigt, dass S rekursiv aufzählbar
ist. Das gleiche Argument, angewandt auf S̄, zeigt, dass S̄ rekursiv aufzählbar
ist.
1.5
Diophantische Mengen und Funktionen
Für alle weiteren Betrachtungen bzgl. Berechenbarkeit in dieser Vorlesung spielen diophantische Mengen und Funktionen eine zentrale Rolle. Eine diophantische Menge ist eine Teilmenge von Nk , die auf bestimmte Weise durch ein ganzzahliges Polynom vollständig charakterisiert wird. Eine Funktion heißt dann diophantisch, wenn ihr Graph eine diophantische Menge ist. Ein wesentliches –aber
11
keineswegs triviales– Resultat ist, dass eine Funktion genau dann diophantisch
ist, wenn sie rekursiv ist. Das Konzept der diophantischen Funktionen liefert
also eine alternative Klassifikation der rekursiven Funktionen; diese Erkenntnis
wird uns ein sehr hilfreiches und mächtiges Werkzeug in die Hand geben, um
Berechenbarkeitsprobleme in Gruppen in Angriff zu nehmen.
Den Beweis dieser Äquivalenz erbrachte zunächst Yuri Matyasevich 1970 im
Zuge seines Beweises der Unentscheidbarkeit von Hilberts zehntem Problem 5 .
Ziel dieses Abschnittes ist es, den Beweis dieser Äquivalenz zu skizzieren; wir
folgen dabei der Arbeit von Martin Davis ([D]), die einen gegenüber Matyasevich
leicht abgewandelten Beweis liefert.
Wir beginnen mit einer Definition. Eine Menge S ⊂ Nk ist diophantisch,
wenn sie genau aus allen Präfizes aller Nullstellen eines ganzzahligen Polynoms
besteht:
Definition 1.17. Eine Menge S ⊂ Nk heißt diophantisch, wenn ein Polynom
PS ∈ Z[t1 , . . . , tn ] (mit n ≥ k) existiert, so dass gilt: (x1 , . . . , xk ) ∈ S genau
dann, wenn y1 , . . . , yn−k ∈ N existieren, so dass
PS (x1 , . . . , xk , y1 , . . . , yn−k ) = 0.
Wir sagen in diesem Fall, dass das Polynom PS die Menge S charakterisiert.
Man beachte aber, dass PS natürlich keineswegs eindeutig bestimmt ist.
Bemerkung 1.18. Dass das charakterisierende Polynom aus dem Polynomring
über Z stammt, also negative Koeffizienten haben kann, ist hier wesentlich;
ein charakterisierendes Polynom mit ausschließlich positiven Koeffizienten zu
wählen ist im allgemeinen nicht möglich. Alternativ kann man aber eine diophantische Menge mit zwei Polynomen mit positiven Koeffizienten charakterisieren: Stellen wir PS dar als
PS = P+ − P − ,
wobei P+ die Summe aller Monome aus PS mit positiven Koeffizienten und
−P− die Summe aller Monome mit negativen Koeffizienten ist, so können wir
S beschreiben als
S = {x̄ ∈ Nk | ∃ȳ ∈ Nn−k : P+ (x̄, ȳ) = P− (x̄, ȳ)}.
(1.1)
Diese Charakterisierung wird ebenfalls nützlich sein.
Eine diophantische Menge S ∈ Nk ist also sehr leicht zu beschreiben, weil sie
durch ein charakterisierendes Polynom vollständig definiert ist. Die erste Frage,
die nun auftaucht, ist, welche Mengen diophantisch sind. Wir fangen mit einigen
Beispielen diophantischer Mengen an:
Beispiel 1.19.
1. Nk ist diophantisch; wähle etwa PNk = 0.
5 Hilberts zehntes Problem lautet: “Gibt es einen Algorithmus, der entscheidet, ob ein
gegebenes ganzzahliges Polynom P in n Variablen eine Nullstelle in Zn hat?”
12
2. Die leere Menge ist diophantisch; wähle etwa P∅ = 1.
3. S := {(x, y) ∈ N2 | x < y} ist diophantisch, denn
x < y ⇔ ∃z ∈ N : x − y + z + 1 = 0
für alle x, y ∈ N. (Wähle also PS = t1 − t2 + t3 + 1.)
4. S := {(x, y) ∈ N2 | x ≤ y} ist diophantisch, denn
x ≤ y ⇔ ∃z ∈ N : x − y + z = 0.
Wir zeigen nun einige Eigenschaften diophantischer Mengen, von denen wir
danach häufig und implizit Gebrauch machen werden.
Lemma 1.20. Seien S, T ⊂ Nk diophantisch. Dann gilt
1. S ∩ T ist diophantisch.
2. S ∪ T ist diophantisch.
3. Ist π = (π1k , . . . , πlk ) die Projektion auf die ersten l Koordinaten, so ist
π(S) ⊂ Nl diophantisch.
Beweis. Wir zeigen zunächst (1):
Ist etwa PS ∈ Z[t1 , . . . , tm ] und PT ∈ Z[t1 , . . . , tn ], dann setze l = m + n − k
und wähle PS∩T ∈ Z[t1 , . . . , tl ],
(x1 , . . . , xl ) 7→ PS (x1 , . . . , xm )2 + PT (x1 , . . . , xk , xm+1 , . . . , xl )2 .
PS∩T charakterieisert offenbar S ∩ T .
Sind nun PS , PT und l wie oben, dann ist PS∪T ∈ Z[t1 , . . . , tl ],
(x1 , . . . , xl ) 7→ PS (x1 , . . . , xm ) · PT (x1 , . . . , xk , xm+1 , . . . , xl ),
ein charakerisierendes Polynom für S ∪ T . Dies zeigt (2).
Aussage (3) ist trivial; jedes Polynom, das S charakterisiert, charakterisiert
auch π(S).
Wir behandeln im folgenden ein weiteres Lemma, das es uns erlauben wird,
bei der Charakterisierung diophantischer Mengen mit beschränkten Quantoren
(∃y)≤x und (∀y)≤x zu arbeiten. Ist A(x) ein beliebiges Prädikat (also ein Ausdruck, der für x entweder wahr oder falsch ist), dann bedeutet (∃y)≤x : A(y)
gerade
∃y ∈ N : y ≤ x ∧ A(y).
Analog ist (∀y)≤x : A(y) gerade gleichbedeutend mit
∀y ∈ N : y > x ∨ A(y).
Der Beweis von Teil 2 des nachfolgenden Lemmas ist recht technisch (und deutlich schwerer als der Beweis von Teil 1). Wir werden im Kontext dieses Skriptes
auf den Beweis verzichten und verweisen hierfür auf [D].
13
Lemma 1.21. Sei P ∈ Z[t1 , . . . , tn ] und k < n sowie l := n − k. Dann gilt
1. R := {(x1 , . . . , xk ) | (∃y1 )≤x1 ∃y2 , . . . , yl : P (x1 , . . . , xk , y1 , . . . , yl ) = 0} ist
diophantisch.
2. S := {(x1 , . . . , xk ) | (∀y1 )≤x1 ∃y2 , . . . , yl : P (x1 , . . . , xk , y1 , . . . , yl ) = 0} ist
diophantisch.
Beweis. Der Beweis von (1) ist leicht; es gilt
R = {(x1 , . . . , xk ) | ∃y1 , y2 , . . . , yl : y1 ≤ x1 ∧ P (x1 , . . . , xk , y1 , . . . , yl ) = 0}.
Die Aussage folgt also aus Beispiel 1.19 (4) und Lemma 1.20 (1). Für den Beweis
von (2) siehe [D], Theorem 5.1.
Definition 1.22. Eine partielle Funktion f : Nk
ihr Graph
N heißt diophantisch, wenn
Γf := {(x1 , . . . , xk , f (x1 , . . . , xk )) | (x1 , . . . , xk ) ∈ Def(f )} ⊂ Nk+1
diophantisch ist. Wir sagen kurz, dass ein Polynom P die Funktion f charakterisiert, wenn P den Graphen Γf charakterisiert.
Beispiel 1.23.
tisch, denn
1. Die konstante Funktion c0 : Nk → N, x̄ 7→ 0 ist diophany = c0 (x̄) ⇔ y = 0
∀x̄ ∈ Nk , y ∈ N.
2. Die Nachfolgerfunktion s : N → N, x 7→ x + 1 ist diophantisch, denn
y = s(x) ⇔ y − x − 1 = 0
∀x, y ∈ N.
3. Die Projektion πik ist diophantisch, denn
y = πik (x1 , . . . , xk ) ⇔ y − xi = 0
∀x1 , . . . , xk , y ∈ N.
Weitere, wichtige Beispiele für diophantische Funktionen liefert das folgende
Lemma.
Lemma 1.24. Die Funktionen CP , L und R aus Konstruktion 1.5 sind diophantisch.
Beweis. Seien x, y ∈ N. Setzen wir n := x + y, so folgt unter Berücksichtigung,
dass 2T (n) = n · (n + 1), für alle z ∈ N
z = CP (x, y) ⇔ (x + y)(x + y + 1) + 2y − 2z = 0.
Dies zeigt, dass CP diophantisch ist. Dass L und R diophantisch sind, folgt
daraus, dass
x = L(n) ⇔
∃y ∈ N : CP (x, y) = n
x = R(n) ⇔
∃y ∈ N : CP (y, x) = n
14
bzw.
Nun kommen wir zu einer universellen Konstruktion, die eine sehr zentrale
Rolle spielen wird. Wir konstruieren eine diophantische (und rekursive) Funktion
S : N2 → N, für die gilt: Für jede endliche Sequenz von Zahlen a1 , . . . , an ∈ N
existiert ein u ∈ N, so dass S(i, u) = ai für i = 1, . . . , n. Stellt man sich die
Funktion also als eine unendliche Wertetabelle vor, in der in der i-ten Zeile und
u-ten Spalte die Zahl S(i, u) eingetragen ist, so findet man für jede beliebige
(und beliebig lange) endliche Sequenz von Zahlen a1 , . . . , an ∈ N eine Spalte
in der Tabelle, deren erste n Einträge gerade die Zahlen a1 , . . . , an sind (sofern
man die 0-te Zeile ignoriert; S(0, u) wird immer 0 sein). Dies wird es uns später
erlauben, eine beliebige endliche Sequenz mit einer einzigen Zahl zu kodieren.
Konstruktion 1.25 (Sequenzfunktion S). Die Definition von S ist einfach;
etwas Arbeit macht es aber, die gewünschten Eigenschaften von S zu verifizieren.
Seien u, i ∈ N. Die Division mit Rest der Zahl L(u) durch die Zahl 1 + iR(u)
liefert eindeutige Zahlen k, r ∈ N mit 0 ≤ r < 1 + iR(u) und
L(u) = k · (1 + iR(u)) + r.
Setze
S(i, u) := r.
S ist also gerade (L(u) mod 1 + iR(u)) (vgl. Beispiel 1.4 (11)), und damit insbesondere rekursiv.
Zunächst zeigen wir, dass S diophantisch ist: Es gilt, dass r = S(i, u) genau
dann, wenn das folgende Gleichungssystem mit den Variablen x, y, z, v
(x + y)(x + y + 1) + 2y − 2u =
0
(1.2)
r + z · (1 + iy) − x =
0
(1.3)
0
(1.4)
r + v + 1 − (1 + iy)
=
eine Lösung hat: Aus (1.2) folgt, dass x = L(u) und y = R(u). Aus (1.3)
folgt dann, dass L(u) ≡ r mod 1 + iy, und aus (1.4) folgt schließlich, dass
r < 1 + iR(u).
Bezeichnen wir die drei obigen Polynome mit
P1 , P2 , P3 ∈ Z[u, i, r, x, y, z, v],
so ist P12 + P22 + P32 ein charakterisierendes Polynom für den Graphen
{(i, u, S(i, u))|i, u ∈ N}
und somit für S. Also ist S diophantisch.
Seien nun a1 , . . . , an ∈ N beliebig. Wir zeigen, dass ein u ∈ N existiert, so
dass S(i, u) = ai für i = 1, . . . , Q
n. Wähle y ∈ N, so dass gilt ai < y und i | y für
i = 1, . . . , n (also z.B. y := n! · (ai + 1i=0 )).
Dann sind die Zahlen 1+y, 1+2y, . . . , 1+ny paarweise teilerfremd: Ist d ∈ N,
d > 1, mit d | 1 + iy, d | 1 + jy, i < j, so folgt
d | (j · (1 + iy) − i · (1 + jy)), also d | j − i.
15
Somit folgt d ≤ n, also d | y und somit d | iy, es folgt d - iy + 1, im Widerspruch
zur Annahme.
Nach dem aus der Algebra bekannten Chinesischen Restsatz existiert nun
ein x ∈ N, so dass gilt
x ≡ ai
mod 1 + iy
für i = 1, . . . , n.
Wähle u := CP (x, y). Dann gilt also L(u) = x, R(u) = y und somit
ai ≡ L(u)
mod 1 + iR(u)
und ai < R(u) < 1 + iR(u). Also folgt ai = S(i, u).
Nun haben wir alle nötigen Hilfsmittel erarbeitet, um den Hauptsatz dieses
Abschnitts zu beweisen:
Satz 1.26. Eine partielle Funktion f : Nk
wenn sie rekursiv ist.
N ist genau dann diophantisch,
Beweis. Sei zunächst f diophantisch. Dann existiert nach Definition ein Polynom P ∈ Z[t1 , . . . , tn ] (n > k), so dass
y = f (x1 , . . . , xk ) ⇔ ∃ȳ = (y1 , . . . , yl ) : P (x1 , . . . , xk , y, ȳ) = 0
(mit l := n − k − 1).
Betrachte die Funktion
h : Nk+1
−1
N, (x̄, n) 7→ P (x̄, CPl+1
(n))
−1
(vgl. Definition 1.6). Dann ist h rekursiv und f = π1 ◦ CPl+1
◦ µh. Somit ist f
rekursiv.
Es bleibt zu zeigen, dass jede rekursive Funktion diophantisch ist. Nach Beispiel 1.23 sind alle primitiven Funktionen diophantisch. Es genügt also zu zeigen,
dass die Klasse der diophantischen Funktionen abgeschlossen unter Komposition, primitiver Rekursion und dem µ-Operator ist. Dies zeigen wir im einzelnen,
unter regem Gebrauch der Lemmata 1.20 und 1.21:
• Komposition: Seien g1 , . . . , gm : Nk
und f = h ◦ (g1 , . . . , gm ). Dann gilt
y = f (x1 , . . . , xk ) ⇔
N und h : Nm
N diophantisch
∃t1 , . . . , tm :
t1 = g1 (x1 , . . . , xk )
..
.
∧ tm = gm (x1 , . . . , xk )
∧ y = h(t1 , . . . , tm ).
16
• Primitive Rekursion: Seien f, g und h wie in Definition 1.3 (3) und g
und h diophantisch. Wir nutzen wieder Konstruktion 1.25: Für x̄ ∈ Nk
und z ∈ N existiert ein u ∈ N mit
S(i, u) = f (x̄, i − 1) für 1 ≤ i ≤ z.
Also gilt:
y = f (x̄, z) ⇔
∃u ∈ N :
S(1, u) = g(x̄)
∧ (∀t)≤z : (t = 0) ∨ S(t + 1, u) = h(t − 1, S(t, u), x̄)
∧ y = S(z + 1, u).
• µ-Operator: Sei f : Nk+1
N diophantisch. Dann gilt
y = µf (x̄) ⇔ f (x̄, y) = 0
∧ (∀t)≤y (t = y ∨ f (x̄, t) > 0).
Im letzten Teil dieses Kapitels konstruieren wir eine Teilmenge V ⊂ N, für
die gilt, dass V diophantisch, aber N \ V nicht diophantisch ist. Die Existenz
einer solchen Menge ist zentral für die Konstruktion von Gruppen mit unentscheidbaren Eigenschaften, wie wir sie im folgenden Kapitel machen wollen.
Konstruktion 1.27. Wir fixieren die Menge von Variablen
X := {t0 , t1 , t2 , t3 , . . .}
und konstruieren zunächst eine explizite Aufzählung aller Polynome mit Variablen aus X und nicht-negativen Koeffizienten: Setze dazu P0 := 0, P1 := 1 und
für alle i ∈ N+
P3i−1 := ti−1 ,
P3i
:= PL(i) + PR(i) ,
P3i+1 := PL(i) · PR(i) .
Die Folge (Pn )n∈N enthält alle Polynome in Variablen aus X, wie man leicht
(etwa per Induktion über den Grad) einsehen kann (die Pi sind natürlich nicht
paarweise verschieden; dies spielt aber weiter keine Rolle). Weiter ist jedes Pn
ein Polynom in (höchstens) den Variablen t0 , . . . , tn , wie man induktiv einsieht.
Für n ∈ N sei nun
Dn := {x ∈ N | ∃x1 , . . . , xn ∈ N : PL(n) − PR(n) (x, x1 , . . . , xn ) = 0}.
Dann ist jedes Dn diophantisch (vgl. (1.1)), und somit ist (Dn )n∈N eine Liste
aller diophantischen Mengen.
Die folgenden beiden Theoreme beweisen die Existenz der oben angesprochenen Menge V ⊂ N und beschließen dieses Kapitel.
17
Satz 1.28. Die Menge
V := {n ∈ N | n ∈ Dn }
ist diophantisch.
Beweis. Sei n ∈ N. Ist n ∈ Dn , dann existiert x̄ := (x1 , . . . , xn ) ∈ Nn , so dass
PL(n) (n, x̄) = PR(n) (n, x̄). Weiter existiert nach Konstruktion 1.25 ein u ∈ N, so
dass S(i, u) = Pi (n, x̄) für i = 1, . . . , 3n + 1. Daraus ergibt sich
n ∈ Dn
⇔
∃u ∈ N :
S(1, u) = 1 ∧ S(2, u) = n
∧ ∀i≤n S(3i, u) = S(L(i), u) + S(R(i), u)
∧ ∀i≤n S(3i + 1, u) = S(L(i), u) · S(R(i), u)
∧ S(L(n), u) = S(R(n), u).
Dies zeigt die Behauptung.
Satz 1.29. Die Menge
V̄ := {n ∈ N | n ∈
/ Dn }
ist nicht diophantisch.
Beweis. Es gilt nach Definition für alle n ∈ N
n ∈ V̄ ⇔ n ∈
/ Dn ,
also V̄ 6= Dn . Da die Folge (Dn )n∈N alle diophantischen Teilmengen von N
enthält, folgt die Behauptung.
Wir beschließen diesen Abschnitt mit der Schlussfolgerung, dass Hilberts
Zehntes Problem keine Lösung besitzt. Dieses zehnte auf der Liste der 23 von
David Hilbert 1900 vorgestellten Probleme lautet: “Man gebe ein Verfahren an,
das für ein beliebiges ganzzahliges Polynom entscheidet, ob es eine ganzzahlige
Nullstelle besitzt.”
Wie wir sehen werden, ist es eine Konsequenz der Ergebnisse dieses Abschnittes, dass es keinen Algorithmus gibt, der für ein beliebiges Polynom P ∈
Z[t1 , . . . , tk ] entscheidet, ob P eine Nullstelle mit nicht-negativen Koeffizienten,
d.h. in Nk , besitzt. Man kann wie folgt einsehen, dass dies die Unentscheidbarkeit für beliebige Nullstellen (nach denen Hilbert fragt) impliziert: Nach einem
bekannten Resultat von Lagrange ist jede nicht-negative ganze Zahl als Summe
von 4 Quadraten darstellbar. Betrachten wir das Polynom P 0 , das wir erhalten,
wenn wir in P jedes Vorkommen von ti durch das Polynom t2i,1 + t2i,2 + t2i,3 + t2i,4
ersetzen, so gilt: P 0 hat eine Nullstelle in Z4k genau dann, wenn P eine Nullstelle
in Nk besitzt.
Somit folgt aus den Ergebnissen dieses Abschnittes unmittelbar:
Korollar 1.30. Hilberts Zehntes Problem ist unlösbar.
18
Beweis. Für n ∈ N sei Qn := PL(n) − PR(n) (n) ∈ Z[t1 , . . . , tn ]. Qn ist also
dasjenige Polynom, das man durch Einsetzen von n für t0 im Polynom PL(n) −
PR(n) erhält. Dann gilt offenbar
Qn hat eine Nullstelle in Nn ⇔ n ∈ V.
Ein Algorithmus gemäß Hilberts Zehntem Problem, der für ein gegebenes
Polynom entscheidet, ob es eine Nullstelle besitzt, wäre also hinreichend, um
die Indikatorfunktion 1V zu berechnen. Es folgt aber aus den Sätzen 1.28, 1.29
und 1.26, dass V , und somit 1V , nicht rekursiv ist. Ein Widerspruch.
1.6
Rekursivität auf N∗
Unter einer rekursiven Funktion haben wir in diesem Kapitel bislang stets eine
Funktion von Nk nach N (für festes k) verstanden. Vor dem Hintergrund, dass
rekursive Funktionen gerade die von einem Computer berechenbaren Funktionen
sind, bedeutet dies, dass jeder Algorithmus eine feste Anzahl (k) von natürlichen
Zahlen als Input und eine einzige natürliche Zahl als Ouput hat. Natürlich
sind wir es von einem Computer gewöhnt, dass er viel mehr kann als nur mit
natürlichen Zahlen zu rechnen; dennoch ist diese Charakterisierung rekursiver
Funktionen als Funktionen natürlicher Zahlen durchaus legitim: Die Daten, die
ein Computer speichern und verarbeiten kann, sind immer Binärdaten, die sich
als natürliche Zahlen interpretieren lassen.
Wenn ein Computer mit anderen Typen von Daten umgeht (Fließkommazahlen, Texte, Fotos, . . . ), so steckt nichts anderes dahinter als eine andere Interpretation der Binärzahlen, die vom Computer verarbeitet werden. Anders ausgedrückt, findet hier also eine Identifikation bestimmter Daten mit natürlichen
Zahlen statt, die es dem Computer ermöglicht, Berechnungen auf jenen Daten
durchzuführen. Somit sollte die Theorie, die wir bisher erarbeitet haben, ausreichen, um rekursive Funktionen für beliebige Datenmengen zu formalisieren;
alles, was wir tun müssen, ist, die Daten auf geeignete Weise mit natürlichen
Zahlen zu identifizieren.
In diesem Abschnitt wollen wir zwar noch nicht die natürlichen Zahlen verlassen, aber wir wollen den Begriff der rekursiven Funktionen dahingehend verallgemeinern, dass die Funktionen eine variable Anzahl von Zahlen als Input
erlaubt (genauer: ein Element aus Nk für beliebiges k) und ggf. auch nicht nur
eine Zahl, sondern ein Tupel von Zahlen ausgibt. Wir betrachten also Funktionen, deren Definitionsbereich
[
N∗ :=
Nk
k∈N+
ist (oder eine Teilmenge von N∗ im Falle partieller Funktionen). Dies tun wir, indem wir eine Bijektion zwischen N∗ und N festlegen, die jedes Tupel (n1 , . . . , nk )
eindeutig mit einer natürlichen Zahl identifiziert:
Definition & Lemma 1.31. Die Abbildung CP∗ : N∗ → N wird definiert durch
(n1 , . . . , nk ) 7→ CP (k, CPk (n1 , . . . , nk )).
19
CP∗ ist eine Bijektion, die Umkehrfunktion ist gegeben durch
−1
CP∗−1 (n) = CPL(n)
(R(n)).
Die Idee ist nun klar: Wollen wir eine (partielle) Funktion f : N∗
N
algorithmisch berechnen, so übergeben wir statt des Inputvektors(n1 , . . . , nk )
das Bild n = CP∗ (n1 , . . . , nk ). Auf formaler Ebene haben wir es nun mit einer
Funktion von N nach N zu tun, und der Input n enthält alle Informationen,
um daraus (n1 , . . . , nk ) = CP∗−1 (n) zu extrahieren und dann f (n1 , . . . , nk ) zu
berechnen. Insbesondere können wir aus n die Länge k =: l(n) des kodierten
Vektors (n1 , . . . , nk ) sowie den Datenteil d(n) := CPk (n1 , . . . , nk ) extrahieren.
Auf formaler Ebene sind hier l und d gerade Funktionen, die wir bereits kennen:
Da n = CP (l(n), d(n)) ist, gilt gerade l(n) = L(n) und d(n) = R(n). Die
Bezeichnunen l und d dienen aber im folgenden erheblich der Übersichtlichkeit.
Die obige Überlegung motiviert folgende Definition:
Definition 1.32. Eine Funktion f : N∗
N heißt rekursiv, falls die Funktion
f ◦ CP∗−1 : N
N
rekursiv ist.
Beispiel 1.33. Wir wollen im folgenden beispielhatft zeigen, dass die Summenfunktion
k
X
Σ : N∗ → N, (n1 , . . . , nk ) 7→
ni
i=1
rekursiv ist. Nach Definition 1.32 ist also zu zeigen, dass die Funktion Σ∗ :=
Σ ◦ CP∗−1 , gegeben durch
Σ∗ : N → N, n 7→
k
X
ni ,
i=1
rekursiv ist, wobei (n1 , . . . , nk ) = CP∗−1 (n). Dafür betrachten wir die Frage,
wie ein Algorithmus aussehen könnte, der bei Eingabe n = CP∗ (n1 , . . . , nk )
nun Σ∗ (n) berechnet. Zunächst mal kann der Algorithmus k = l(n) und d :=
d(n) = CPk (n1 , . . . , nk ) extrahieren. Nach Beispiel 1.4 (3) ist die Addition auf
N2 (primitiv) rekursiv. Somit können wir nun zunächst eine Summe s = 0
festsetzen und nun iterativ die einzelnen ni extrahieren und jeweils s durch s+ni
ersetzen. Dies tun wir k mal, und geben am Ende das Ergebnis aus. Dabei sind
uns wiederum die Funktionen L und R behilflich: Wenden wir die Funktionen
auf d = CPk (n1 , . . . , nk ) an, so erhalten wir L(d) = CPk−1 (n1 , . . . , nk−1 ) und
R(d) = nk .
In der Sprache der rekursiven Funktionen konstruieren wir uns nun eine
Iteratorfunktion, die diese Idee des Algorithmus realisiert: Wir setzen
(
s
falls i = 0
3
itrΣ : N → N, (d, s, i) 7→
itrΣ (L(d), s + R(d), i − 1) sonst .
20
Dabei ist die Eingabe d also der (kodierte) Inputvektor, über den summiert
wird, s die (Zwischen-)Summe, die sukzessive errechnet wird und i ein Zähler,
der angibt, wie viele Iterationsschritte (noch) zu tun sind, bevor s ausgegeben
werden kann. Die Funktion itrΣ ist offensichtlich rekursiv, wie aus der obigen,
rekursiven Funktionsdefinition sofort hervorgeht, und es gilt
Σ∗ (n) = itrΣ (d(n), 0, l(n)).
Dies beweist, dass Σ∗ (und somit Σ) rekursiv ist.
In Analogie zum obigen Beispiel zeigen wir nun für einige weitere Funktionen,
dass die rekursiv sind:
Beispiel 1.34. Die folgenden Funktionen sind rekursiv.
1. max : N∗ → N, (n1 , . . . , nk ) 7→ max{n1 , . . . , nk }, denn die Iteratorfunktion
(
m
i=0
itrmax : N3 → N, (d, m, i) 7→
itrmax (L(d), max(m, R(d)), i − 1) sonst
ist offenbar rekursiv (wobei max(m, R(d)) hier das Maximum gemäß Beispiel 1.4 (6) ist) und max ◦CP∗−1 (n) = itrmax (d(n), 0, l(n)).
2. min : N∗ → N, (n1 , . . . , nk ) 7→ min{n1 , . . . , nk }. Hier muss nur beachtet
werden, dass wir anders als bei max nicht mit 0 als Vergleichswert anfangen
dürfen, sondern bereits mit einem Eintrag des Vektors starten müssen. Wir
setzen
(
m
i=0
3
itrmin : N → N, (d, m, i) 7→
itrmin (L(d), min(m, R(d)), i − 1) sonst.
Dann ist min ◦CP∗−1 (n) = itrmax (d(n), R(d(n)), l(n)).
3. Die Projektion π : N2
N, (n, i) 7→ ni für n = CP∗ (n1 , . . . , nk ), die
(n, i) auf die i-te Koordinate des von n kodierten Vektors abbildet (mit
Def(π) = {(n, i) ∈ N2 | 1 ≤ i ≤ l(n)}): Setze
(
R(d)
i=0
itrπ : N2
N, (d, i) 7→
itrπ (L(d), i) sonst.
Dann ist π(n, i) = itrπ (d(n), l(n) − i) für (n, i) ∈ Def(π). (Da Def(π) auch
rekursiv aufzählbar ist, kann man leicht folgern, dass π rekursiv ist. Dies
ist dem Leser überlassen.)
4. Die Konkatenation con : N2
N, (n, m) 7→ CP∗ (n1 , . . . , nk , m1 , . . . , ml )
für n = CP∗ (n1 , . . . , nk ) und m = CP∗ (m1 , . . . , ml ): Setze
(
CP (l, n)
i=0
4
itrcon : N
N, (l, n, m, i) 7→
,
itrcon (l + 1, CP (n, mi0 ), m, i − 1) sonst
21
wobei, wie oben, m = CP∗ (m1 , . . . , ml ), und i0 := l(m) − i + 1. (Um
einzusehen, dass itrcon rekursiv ist, nutzen wir, dass nach (3) mi = π(m, i)
rekursiv berechenbar ist.)
Dann ist con(n, m) = itrcon (l(n), d(n), m, l(m)).
5. Sei ϕ : N
N∗ gegeben und CP∗ ◦ ϕ rekursiv. Dann ist die Abbildung
f : N∗
N, (n1 , . . . , nk ) 7→ CP∗ (ϕ(n1 ), . . . , ϕ(nk )).
rekursiv: Setze
(
itrf : N
4
N, (k, n, m, i) 7→
CP (k, n)
itrf (k + l(mi0 )), con(n, mi0 ), m, i − 1)
i=0
sonst
mit i0 := l(m) − i + 1. Dann ist
f ◦ CP∗−1 (n) = itrcon (l(ϕ(n1 ), ϕ(n1 ), d(n), l(n) − 1).
Ebenso wie den Begriff der rekursiven Funktionen können wir den Begriff
der rekursiven Mengen auf Teilmengen S ⊂ N∗ verallgemeinern, indem wir sie
mit Mengen natürlicher Zahlen identifizieren.
Definition 1.35. Eine Menge S ⊂ N∗ heißt
• rekursiv, falls CP∗ (S) ⊂ N rekursiv ist,
• rekursiv aufzählbar, falls CP∗ (S) ⊂ N rekursiv aufzählbar ist.
Bemerkung 1.36. An dieser Stelle sei bemerkt, dass wir im Falle einer Teilmenge
S ⊂ Nk ⊂ N∗ zwei scheinbar konkurrierende Definitionen der Eigenschaft rekursiv bzw. rekursiv aufzählbar (1.13 bzw. 1.14 und 1.35) haben. Es ist aber leicht
einzusehen, dass die Definitionen äquivalent sind, weil die Funktion CP∗ |Nk rekursiv ist.
22
2
Gruppen und Gruppenpräsentierungen
Wir wissen aus dem Grundstudium, was eine Gruppe ist. Die zentrale Frage,
die uns zunächst beschäftigt, ist, wie wir nun eine Gruppe einem Diskussionspartner, bzw. einem Computer, beschreiben können. Welche Informationen sind
also nötig, um eine Gruppe zu verstehen?
Ist die Gruppe G endlich, so ist es nicht allzu schwer, sie zu beschreiben:
Man liefert eine Liste aller Elemente von G und beschreibt, etwa durch eine
Gruppentafel, was das Produkt zweier beliebiger Gruppenelemente ergibt. Ist
die Gruppe unendlich –und das ist für uns der interessantere Fall–, ist die Lage
schon schwieriger.
Der Ansatz, den wir verfolgen, ist, dem Zuhörer zunächst ein Erzeugendensystem zu liefern. Ähnlich einem Erzeugendensystem eines Vektorraumes, aus
dem alle Vektoren als Linearkombinationen dargestellt werden können, ist ein
Erzeugendensystem einer Gruppe ein Tupel S von Gruppenelementen, für die
gilt, dass jedes Element aus G Produkt von Elementen aus S und deren Inversen
ist. Jedes Element g ∈ G kann also als Produkt
±1
g = s±1
1 · . . . · sn
mit si ∈ S dargestellt werden.
Allerdings sind im allgemeinen diese Produkte nicht alle verschieden. Ist
etwa G eine abelsche Gruppe und (a, b) ein Erzeugendensystem, so gilt a · b =
b · a, was in beliebigen Gruppen natürlich i.a. falsch ist. Wir müssen also die
Multiplikation der Gruppe noch explizit beschreiben. Wie wir das tun, werden
wir in den nächsten beiden Abschnitten erarbeiten.
2.1
Freie Gruppen
Definition 2.1. Sei F eine Gruppe und X ⊂ F eine Teilmenge. Dann heißt F
frei über X, falls F folgende universelle Eigenschaft besitzt: Für jede Gruppe
G und jede Abbildung f : F → G existiert ein eindeutiger Homomorphismus
ϕ : F → G mit ϕ|X = f .
Ist, wie oben, ϕ ein Homomorphismus und f die Einschränkung von ϕ auf
eine Teilmenge des Definitionsbereiches, so nennen wir andersherum ϕ eine Fortsetzung von f . F ist also frei über X, wenn sich jede Abbildung von X in eine
Gruppe H eindeutig (zu einem Homomoprhismus) auf F (X) fortsetzen lässt.
Wir nennen eine Gruppe F kurz frei, wenn sie frei über einer Teilmenge X ist.
X heißt dann Basis von F .
Die Idee ist nun folgende: Sei G eine Gruppe und X ein Erzeugendensystem
von G. Vorbehaltlich der Tatsache, dass wir freie Gruppen leicht konstruieren
bzw. verstehen können, können wir nun G wie in Definition 2.1 dadurch beschreiben, dass wir den eindeutigen (surjektiven) Homomorphismus ϕ von einer
über X freien Gruppe F nach G beschreiben, der X auf X abbildet.
Man beachte aber, dass Definition 2.1 nicht konstruktiv ist; es ist also bisher
nicht klar, ob bzw. für welche X überhaupt freie Gruppen über X existieren. Um
23
diese Frage zu beantworten, werden wir im folgenden für eine gegebene Menge X
eine über X freie Gruppe konstruieren. Zunächst können wir aber unmittelbar
aus Definition 2.1 folgern, dass es für jede Menge X bis auf Isomorphie nur eine
freie Gruppe über X geben kann:
Lemma 2.2. Seien G, G0 Gruppen, G frei über X, G0 frei über X 0 und f :
X → X 0 eine Bijektion. Dann sind G und G0 isomorph.
Beweis. Nach Definition existieren eindeutige Homomorphismen ϕ : G → G0
und ϕ0 : G0 → G, so dass ϕ|X = f und ϕ0 |X 0 = f −1 . Es folgt ϕ0 ◦ ϕ = idG ,
denn idG ist der nach Definition 2.1 eindeutige Homomorphismus von G nach
G mit idG |X = idX . Ebenso folgt ϕ ◦ ϕ0 = idG0 . Somit ist ϕ0 = ϕ−1 und ϕ ein
Isomorphismus.
Nun konstruieren wir eine freie Gruppe:
Sei X eine Menge. Ein Wort in X ist ein Tupel (x1 , . . . , xk ) ∈ X k , für
beliebigs k ∈ N+ . Wir schreiben ein Wort w im Kontext dieser Vorlesung als
Produkt
w = x1 · · · xk .
Dann ist X ∗ := {x1 · · · xr | r ∈ N, xi ∈ X} die Menge aller Wörter über X.
Das leere Wort (r = 0) bezeichnen wir mit 1. Auf der Menge X ∗ definieren wir
die Verknüpfung · durch Konkatenation wie folgt:
· : X ∗ × X ∗ → X ∗ , (x1 · · · xr ) · (y1 · · · ys ) = x1 · · · xr y1 · · · ys
(2.1)
Definition 2.3. Sei X eine Menge. Dann ist (X ∗ , ·) mit der in (2.1) definierten
Multiplikation ein Monoid. Wir nennen (X ∗ , ·) den freien Monoid über X.
Bemerkung 2.4. Der Begriff frei in Definition 2.3 ist genauso motiviert wie bei
der freien Gruppe: Ein Monoid ist genau dann frei (d.h. isomorph zum oben
konstruierten freien Monoid, für geeignetes X), wenn er die zu Definition 2.1
analoge universelle Eigenschaft für Monoide besitzt. Wir ersparen uns aber, dies
als Definition zu verwenden, weil wir davon (explizit) keinen weiteren Gebrauch
machen werden.
Sei im folgenden X eine Menge. Wir definieren X −1 als eine von X disjunkte
Menge formaler Inverser, X −1 := {x−1 | x ∈ X}. Nun setzen wir X̃ := X ∪X −1 .
−1
Weiter setzen wir x−1
:= x. Somit wird −1 zu einer fixpunktfreien Involution
auf X̃.
Auf der Menge X̃ ∗ definieren wir nun die freie Äquivalenz wie folgt: Zwei
Wörter w und w0 heißen zunächst elementar äquivalent, falls u, v ∈ X̃ ∗ und
x ∈ X̃ existieren, so dass w = uv und w0 = uxx−1 v. Die freie Äquivalenz
ist nun die von der elementaren Äquivalenz erzeugte Äquivalenzrelation, wir
bezeichnen sie mit ∼ und die Äquivalenzklasse von w ∈ X̃ ∗ mit [w] (später
werden wir die eckigen Klammern oft einfach weglassen, sofern der Kontext es
erlaubt).
24
Definition & Lemma 2.5. Sei X eine Menge. Setze
F (X) := X̃ ∗ / ∼,
wobei ∼ die freie Äquivalenz bezeichnet. Dann ist F (X) zusammen mit der
Verknüpfung · : F (X) × F (X) → F (X), gegeben durch [w] · [w0 ] := [ww0 ] eine
Gruppe.
Der Beweis ist dem Leser überlassen. Insbesondere verifiziere man, dass [1]
das neutrale Element in F (X) und somit
[x]−1 = [x−1 ] für alle x ∈ X
(2.2)
ist.
Satz 2.6. Die Gruppe F (X) ist frei über [X] := {[x] | x ∈ X}.
Beweis. Sei G eine beliebige Gruppe und f : [X] → G eine Abbildung. Zu zeigen
ist, dass ein eindeutiger Homomorphismus ϕ : F (X) → G existiert mit ϕ|[X] =
f . Sei g = [x11 · · · xnn ] mit xi ∈ X und i ∈ {1, −1}. Ist ϕ ein Homomorphismus
mit obiger Eigenschaft, folgt aus der Homomorphieeigenschaft sofort
ϕ(g) = f ([x1 ])1 · · · f ([xn ])n ,
somit ist ϕ eindeutig bestimmt. Andersherum ist leicht zu prüfen, dass die so
definierte Abbildung wohldefiniert ist, was die Existenz von ϕ impliziert. Die
Behauptung folgt.
Möchte man nun ein Element [w] ∈ F (X) explizit angeben, so bietet es sich
an, den Repräsentanten w möglichst kurz zu wählen. Das implziert insbesondere,
dass der Repräsentant w kein Teilwort der Form xx−1 enthalten sollte (mit x ∈
X̃), da man dieses Teilwort sonst streichen und einen kürzeren Repräsentanten
erhält. Enthält w kein solches Teilwort, so stellt sich heraus, dass w bereits ein
kürzester Repräsentant von [w] ist, und mit dieser Eigenschaft bereits eindeutig
ist. Dies beweisen wir im folgenden:
Definition 2.7. Sei X eine Menge. Ein Wort w = x1 · · · xn in X̃ ∗ heißt reduziert, falls xi 6= x−1
i+1 für alle i ∈ {1, . . . , n − 1}.
Lemma 2.8. Für jedes Wort w ∈ X̃ ∗ existiert ein eindeutig bestimmtes reduziertes Wort w0 ∈ X̃ ∗ , so dass w ∼ w0 .
Beweis. Wir folgen einer Beweisidee von van der Waerden: Sei W die Menge aller reduzierten Wörter in X̃ ∗ . Wir definieren einen Homomorphismus ϕ :
F (X) → S(W ), wobei S(W ) die Permutationgruppe von W bezeichnet (d.h. ϕ
ist gerade eine Operation von F (X) auf W ), der folgende Eigenschaften hat:
1. [ϕ(g)(w)] = g[w] für alle g ∈ F (X) und w ∈ W .
2. ϕ([w])(1) = w für alle w ∈ W .
25
Die Existenz (und Wohldefiniertheit) von ϕ zeigt offenbar die Behauptung, denn
für zwei reduzierte Formen w, w0 ∈ W mit [w] = [w0 ] folgt
w = ϕ([w])(1) = ϕ([w0 ])(1) = w0 .
Sei nun w = x0 · . . . · xn ∈ W ein reduziertes Wort. Wir definieren ϕ durch
(
x · x0 · . . . · xn falls x 6= x−1
0
ϕ([x])(w) =
x1 · . . . · xn
sonst
für x ∈ X̃. Man rechnet leicht nach, dass
ϕ([x])(ϕ([x−1 ])(w)) = ϕ([x−1 ])(ϕ([x])(w)) = w.
Somit folgt ϕ([w]) ∈ S(W ) (d.h. ϕ([w]) ist bijektiv auf W ) und ϕ([x])−1 =
ϕ([x−1 ]).
Wegen der universellen Eigenschaft von F (X) lässt sich ϕ nun eindeutig
auf F (X) fortsetzen. Die gewünschten Eigenschaften folgen sofort aus der Konstruktion, die Behauptung folgt.
In den folgenden Abschnitten wollen wir für ein Element [w] ∈ F (X) kurz
w schreiben. Insbesondere wird für x ∈ X damit das Element [x] ∈ F (X)
kurz mit x bezeichnet. Dies ist grundsätzlich unproblematisch; man beachte
insbesondere, dass es wegen (2.2) keine Notationskonflikte mit der Bezeichnung
x−1 gibt. Zudem hat es zwei große Vorteile: Einerseits erspart es uns eine Menge
Klammern, andererseits erlaubt es uns, die Menge X als Teilmenge von F (X)
zu betrachten. Insbesondere ist X somit eine Basis von F (X). Somit folgt, aus
Lemma 2.2 und Satz 2.6,
Korollar 2.9. Sei G eine Gruppe und X ⊂ G eine Teilmenge. G ist genau
dann frei über X, wenn G isomorph zu F (X) ist.
Wir können also im Falle einer über X freien Gruppe G stets davon ausgehen,
dass G = F (X) ist, und nennen F (X) kurz die freie Gruppe über X.
2.2
Gruppenpräsentierungen
Sei G eine Gruppe und X ⊂ G eine Teilmenge. Dann bezeichnet
hXi := {x11 · · · xnn | n ∈ N, xi ∈ X, i = ±1}
die von X erzeugte Untergruppe. X ist also genau dann ein Erzeugensystem von
G, wenn hXi = G gilt. Weiter bezeichnet
hhXii := {g1 x11 g1−1 · · · gn xnn gn−1 | n ∈ N, gi ∈ G, xi ∈ X, i = ±1}
die von X normal erzeugte Untergruppe. hhXii ist also der kleinste Normalteiler
von G, der X enthält.
26
Sei nun G eine Gruppe und X ein Erzeugendensystem von G. Nach Satz 2.6
existiert ein eindeutiger Homomorphismus π : F (X) → G mit π|X = idX . Da X
als Erzeugendensystem von G im Bild von π liegt, ist π surjektiv, und es folgt
aus dem Homomorphiesatz, dass
G∼
= F (X)/ker(π).
Somit ist G also bis auf Isomorphie eindeutig durch X und ker(π) ≤ F (X)
bestimmt. Da ker(π) ein Normalteiler von F (X) ist, genügt zur eindeutigen Bestimmung von ker(π) die Angabe einer Teilmenge R, die ker(π) normal erzeugt.
Dies motiviert folgende Definition:
Definition 2.10. Sei X eine Menge und R ⊂ F (X). Dann heißt hX|Ri eine
Präsentierung der Gruppe G, falls
G∼
= F (X)/hhRii.
Wir schreiben kurz G = hX|Ri.
Es folgt also sofort aus dem Homomorphiesatz, dass jede Gruppe G eine
Präsentierung besitzt: Wählt man ein beliebiges Erzeugendensystem X von G
(z.B. X := G) und ein beliebiges normales Erzeugendensystem R des Kernes des
eindeutigen Epimorphismus π : F (X) → G mit π|X = idX (z.B. R := ker(π)),
so ist hX|Ri eine Präsentierung von G. Im allgemeinen lassen sich X und R
allerdings wesentlich schlanker wählen.
Beispiel 2.11. Wir beginnen mit einigen Beispielen von Gruppenpräsentierungen.
1. F (X) = hX|∅i (X eine beliebige Menge), denn
F (X) ∼
= F (X)/{1} = F (X)/hh∅ii.
Wir schreiben für hX|∅i auch hX|−i.
2. Z2 = ha, b|[a, b]i, wobei [a, b] := aba−1 b−1 der Kommutator von a und b
ist: Ist
(
a 7→ (1, 0)
2
ϕ : F (a, b) → Z ,
,
b 7→ (0, 1)
so ist kerϕ = hh[a, b]ii.
3. Zn = ha|an i für alle n ∈ N+ , denn der Homomorphismus
ϕ : F (a) → Zn , ak 7→ k̄
hat offenbar ker(ϕ) = {akn | k ∈ Z} = {(an )k | k ∈ Z} = hhan ii.
27
Sei nun G = hX|Ri, H eine Gruppe und f : X → H eine Abbildung. Ist
G nicht frei, so stellt sich die Frage, unter welchen Voraussetzungen sich die
Abbildung f zu einem Homomorphismus fortsetzen lässt.
Nach Satz 2.6 gibt es einen eindeutig bestimmten Homomorphismus ϕ :
F (X) → H mit ϕ|X = f . Falls ein Homomorphismus ψ : G → H mit ψ|X = f
existiert, so gilt offenbar ψ ◦ π|X = f |X , und somit ψ ◦ π = ϕ wegen der
Eindeutigkeit von ϕ mit dieser Eigenschaft. Somit folgt unmittelbar aus dem
Homomorphiesatz, dass ψ genau dann existiert, wenn ϕ durch π faktorisiert,
d.h. wenn ker(π) ⊂ kerϕ = hhRii. Es folgt
Korollar 2.12. Sei G = hX|Ri, H eine Gruppe und f : X → H. Weiter sei
ϕ : F (X) → H die eindeutige Fortsetzung von f auf F (X). Dann existiert eine
Fortsetzung von f auf G genau dann, wenn ϕ(r) = 1 für alle r ∈ R.
2.3
Freie Produkte
Wir definieren im folgenden den Begriff des freien Produktes zweier Gruppen.
Das Adjektiv frei deutet hier wieder an, dass es sich um ein Produkt von Gruppen mit einer universellen Eigenschaft handelt. Dem ist auch so:
Definition 2.13. Seien G1 und G2 Gruppen. Eine Gruppe H heißt freies
Produkt von G1 und G2 (geschrieben H = G1 ∗ G2 ), falls Monomorphismen
τi : Gi → H (i = 1, 2) existieren, so dass folgendes gilt: Für jede Gruppe K und
Homomorphismen ϕi : Gi → K existiert ein eindeutig bestimmter Homomorphismus ψ : H → K, so dass ϕi = ψ ◦ τi für i = 1, 2.
Ähnlich der freien Gruppe im vorherigen Abschnitt zeigen wir zunächst,
dass das freie Produkt von gegebenen Gruppen bis auf Isomorphie eindeutig
bestimmt ist.
Lemma 2.14. Seien G1 und G2 Gruppen und H und K freie Produkte von G1
und G2 . Dann gilt H ∼
= K.
Beweis. Seien τi : Gi → H und ηi : Gi → K (i = 1, 2) Monomorphismen mit der
Eigenschaft wie in Definition 2.13. Dann existieren eindeutige Homomorphismen
ϕ : H → K und ψ : K → H mit τi = ψ ◦ ηi und ηi = ϕ ◦ τi für i = 1, 2. Es folgt
ψ ◦ ϕ ◦ τi = ψ ◦ ηi = τi .
Somit ist ψ ◦ ϕ = idH , denn idH ist der nach Definition 2.13 eindeutige
Homomorphismus von H nach H mit idH ◦ τi = τi . Ebenso folgt ϕ ◦ ψ = idK .
Also gilt ϕ = ψ −1 , somit ist ϕ ein Isomorphismus.
Wir wollen im folgenden das (bis auf Isomorphie eindeutige) freie Produkt
von G und H konstruieren.
Konstruktion 2.15. Seien G und H Gruppen. Sei F die Menge aller Tupel
(g1 , h1 , g2 , h2 , . . . , gn , hn ), wobei n ∈ N beliebig und gi ∈ G, hi ∈ H für i =
1, . . . , n. Auf F definieren wir die Verknüpfung · : F × F → F durch
(g1 , h1 , . . . , gk ) · (g10 , h01 , . . . , gl0 ) = (g1 , h1 , . . . , hk−1 , gk g10 , h01 , . . . , gl0 ).
28
Weiter definieren wir eine freie Äquivalenz auf F wie folgt: Sind u, v ∈ F
beliebig und g, g 0 ∈ G, h, h0 ∈ H, so setzen wir
u · (g, 1, g 0 ) · v
0
u · (1, h, 1, h , 1) · v
∼
u · (gg 0 ) · v,
∼
u · (1, hh0 , 1) · v.
Die freie Äquivalenz ist dann die von ∼ erzeugte Äquivalenzrelation (die wir
abermals mit ∼ bezeichnen).
Lemma 2.16. Seien G und H Gruppen und F wie oben. Dann ist die Gruppe
G ∗ H := F/ ∼ mit der Verknüpfung
· : G ∗ H × G ∗ H → G ∗ H, [w]∼ · [w0 ]∼ := [ww0 ]∼
ein freies Produkt von G und H.
Beweis. Zunächst überzeuge man sich, dass · wohldefiniert und G ∗ H eine
Gruppe ist. Nun betrachte die Einbettungen τG : G ,→ G ∗ H, g 7→ [g]∼
und τH : H ,→ G ∗ H, h 7→ [1, h, 1]∼ . Sei nun K eine beliebige Gruppe und
ϕG : G → K, ϕH : H → K Homomorphismen. Dann ist die Abbildung
ψ : G ∗ H → K, [g1 , h1 , . . . , hk−1 , gk ] 7→ ϕG (g1 ) · ϕH (h1 ) · · · ϕH (hk−1 ) · ϕG (gk )
wohldefiniert und genügt den Eigenschaften aus Definition 2.13. Die Eindeutigkeit von ψ folgt, da ϕG (G) ∪ ϕH (H) ein Erzeugendensystem von G ∗ H ist.
Lemma 2.17. Seien G = hX | Ri, H = hY | Si und X, Y disjunkt. Dann gilt:
1. Für jedes g ∈ G ∗ H existiert ein eindeutiges Tupel
(g1 , h1 , g2 , h2 , . . . , hn−1 , gn ),
so dass gi ∈ G, hi ∈ H sowie gi 6= 1 für i = 2, . . . , n − 1 und hi 6= 1 für
i = 1, . . . , n − 1 und
g = [g1 , h1 , g2 , h2 , . . . , gn , hn ]∼ .
(2.3)
2. G ∗ H = hX, Y |R, Si
Beweis. Übungsaufgabe, Blatt 5
2.4
HNN-Erweiterungen
Die HNN-Erweiterung ist eine Konstruktion, die für eine Gruppe G eine größere
Gruppe G∗ liefert, die G als Untergruppe enthält. Sie wird uns im Verlaufe dieser
Vorlesung als wichtiges Hilfsmittel dienen, um Gruppen mit bestimmten, jeweils
gewünschten Eigenschaften zu konstruieren.
29
HNN-Erweiterungen haben einen geometrischen Hintergrund: Zusammen
mit dem analogen Konzept der amalgamierten Produkte bilden sie die einfachsten und wichtigsten Beispiele für Fundamentalgruppen von Graphen von Gruppen in der Bass-Serre-Theorie, die sich mit der Klassifikation von Gruppenoperationen auf simplizialen Bäumen beschäftigt. Diesen geometrischen Hintergrund
werden wir im Kontext dieser Vorlesung aber nicht weiter beleuchten, sondern
HNN-Erweiterungen rein kombinatorisch diskutieren. Wir beginnen mit einer
Definition:
Definition 2.18. Seien G = hX|Ri und C Gruppen und α, ω : C ,→ G zwei
Monomorphismen. Dann ist die HNN-Erweiterung von G entlang C (bzgl. α
und ω), geschrieben G∗C , definiert als
G∗C := hX, t | R, {α(c) = tω(c)t−1 | c ∈ C}i.
Bemerkung 2.19. Man beachte, dass die Gruppe G∗C von den Monomorphismen
α, ω abhängt, die Schreibweise “G∗C ” aber nicht. Insofern ist diese Schreibweise
potentiell missverständlich; sie ist aber dennoch üblich, und es werden auch im
folgenden keine Mehrdeutigkeiten auftreten.
Es ist zunächst keineswegs klar, dass G eine Untergruppe von G∗C ist (d.h.,
dass die von X erzeugte Untergruppe in G∗C isomorph zu G ist), denn das
Hinzufügen von Relationen kann i.a. die Gruppe kaputtmachen. Unser erstes
Ziel wird es sein, dies zu beweisen. Zunächst entwickeln wir, analog zu dem Fall
des freien Produktes, eine Normalform, in der wir Elemente aus G∗C darstellen
können. Jedes Element aus g ∈ G∗C kann offenbar als Produkt der Form
g = g0 · t±1 · g1 · t±1 · . . . · t±1 · gn
(2.4)
dargestellt werden, wobei gi ∈ G. Allerdings ist diese Darstellung diesmal keineswegs eindeutig: Ist etwa c ∈ C und s = α(c), s0 = ω(c), so gilt nach Konstruktion, dass
s · t · 1 = 1 · t · s0 .
Die Produkte s · t · 1 und 1 · t · s0 , beide in der Form wie in (2.4), sind also
zwei verschiedene Darstellungen desselben Elementes. Damit die Darstellung
eindeutig wird, brauchen wir zusätzliche Forderungen an die gi .
Wähle ein Repräsentantensystem Rα der Menge {α(C)g | g ∈ G} der Rechtsnebenklassen der Untergruppe α(C) in G, und ebenso ein Repräsentantensystem
Rω der Rechtsnebenklassen von ω(C) in G. Wir treffen die Wahl so, dass 1 ∈ Rα
und 1 ∈ Rω , d.h. für die Untergruppen α(C) bzw. ω(C) wählen wir jeweils den
trivialen Repräsentanten. Nun definieren wir eine Normalform wir folgt:
Definition 2.20. Eine Normalform (bzgl. Rα , Rω ) in G∗C ist ein Tupel
(g0 , t1 , g1 , t2 , . . . , tn , gn )
mit gi ∈ G, i ∈ {−1, 1} und folgenden Eigenschaften:
1. Ist i = −1, so ist gi ∈ Rα .
30
2. Ist i = +1, so ist gi ∈ Rω .
3. Ist i 6= i+1 , so ist gi 6= 1.
Es ist leicht zu sehen, dass jedes Element g ∈ G∗C als Normalform darstellbar
ist. Etwas weniger offensichtlich ist, dass diese Normalform stets eindeutig ist.
Dies zeigen wir im folgenden Satz.
Satz 2.21. Für jedes Element g ∈ G∗C existiert eine eindeutige Normalform
w = (g0 , t1 , g1 , t2 , . . . , tn , gn ), so dass
g = [w] := g0 · t1 · g1 · t2 · . . . · tn · gn
Beweis. Wir folgen wieder der Beweisidee von van der Waerden: Sei W die
Menge aller Normalformen in G∗C . Wir definieren einen Homomorphismus ϕ :
G → S(W ) von G in die Permutationgruppe S(W ) von W (d.h. eine Operation
von G auf W ), der folgende Eigenschaften hat:
1. [ϕ(g)(w)] = g[w] für alle g ∈ G∗C und w ∈ W .
2. ϕ([w])(1) = w für alle w ∈ W .
Die Existenz (und Wohldefiniertheit) von ϕ zeigt offenbar den Satz, denn für
zwei Normalformen w, w0 ∈ W mit [w] = [w0 ] folgt
w = ϕ([w])(1) = ϕ([w0 ])(1) = w0 .
Sei nun w = (g0 , t1 , g1 , t2 , . . . , tn , gn ) eine Normalform. Wir definieren
zunächst
ϕ(g)w := (gg0 , t1 , g1 , t2 , . . . , tn , gn )
für g ∈ G. Man rechnet leicht nach, dass ϕ(g)(ϕ(g −1 )(w)) = ϕ(g −1 )(ϕ(g)(w)) =
w. Somit folgt ϕ(g) ∈ S(W ) (d.h. ϕ(g) ist bijektiv auf W ) und ϕ(g)−1 = ϕ(g −1 ).
Weiter setzen wir
(
(α ◦ ω −1 (g0 )g1 , t2 , . . . , tn , gn )
falls 1 = −1 und g0 ∈ ω(C)
ϕ(t)(w) :=
−1 0
1
(α ◦ ω (g0 ), t, gω , t , g1 , . . . , gn ) sonst,
wobei gω der Repräsentant von g0 in Rω ist und g00 ∈ ω(C) gerade so gewählt
ist, dass g0 = g00 gω , und analog
(
(ω ◦ α−1 (g0 )g1 , t2 , . . . , tn , gn )
falls 1 = 1 und g0 ∈ α(C)
−1
ϕ(t )(w) :=
−1 0
−1
1
(ω ◦ α (g0 ), t , gα , t , g1 , . . . , gn ) sonst
mit gα ∈ Rα , g00 ∈ α(C) und g0 = g00 gω .
Wir zeigen nun, dass ϕ(t−1 ) = ϕ(t)−1 . Sei w wie oben. Wir unterscheiden
zwei Fälle: Sei zunächst 1 = −1 und g0 ∈ ω(C). Es ist also
ϕ(t)(w) = α ◦ ω −1 (g0 )g1 · t2 · . . . · tn · gn .
31
Nun ist es nicht möglich, dass 2 = 1 und g1 ∈ α(C), da w eine Normalform ist.
Da g1 ∈ Rα und α ◦ ω −1 (g0 ) ∈ α(C), ist der Repräsentant von α ◦ ω −1 (g0 )g1 in
Rα gerade g1 . Es folgt Also ist
ϕ(t−1 )(ϕ(t)(w))
= ϕ(t−1 )(α ◦ ω −1 (g0 )g1 , t2 , . . . , tn , gn )
(2.5)
= g0 , t1 , g1 , t2 , . . . , tn , gn
(2.6)
= w
(2.7)
Im zweiten Fall, dass 1 = 1 oder g0 ∈
/ ω(C), folgt sofort, dass ebenfalls
ϕ(t−1 )(ϕ(t)(w)) = w. Somit ist ϕ(t−1 )ϕ(t) = idW , und eine analoge Betrachtung zeigt ϕ(t)ϕ(t−1 ) = idW . Es folgt ϕ(t) ∈ S(W ) und ϕ(t−1 ) = ϕ(t)−1 .
Nun rechnet man leicht nach, dass ϕ(t) · ϕ(ω(c)) · ϕ(t−1 ) · ϕ(α(c)−1 )) = 1.
Somit lässt sich ϕ nach Korollar 2.12 eindeutig zu einem Homomorphismus auf
die Gruppe G∗C fortsetzen. Dieser Homomorphismus hat nach Kosntruktion die
gewünschten Eigenschaften. Die Behauptung folgt.
Eine unmittelbare Folgerung aus Satz 2.21 ist das folgende Korollar, das
aussagt, dass wir G als Untergruppe von G∗C auffassen können.
Korollar 2.22. Die Abbildung G → G∗C , g 7→ g ist injektiv.
Beweis. Es genügt zu beobachten, dass (g) eine Normalform in G∗C ist (für
g ∈ G). Ist g 6= 1, so ist also (g) die nach Satz 2.21 eindeutige Normalform in
G∗C , somit ist das repräsentierte Element nicht-trivial.
2.5
Eigenschaften von Gruppen und Nielsen-Reduziertheit
Das freie Produkt und die HNN-Erweiterung sind wertvolle Hilfsmittel, um einige –teils etwas überraschende– Eigenschaften von Gruppen und ihren Untergruppen einzusehen. Wir beginnen zunächst mit einigen Eigenschaften freier
Gruppen.
Lemma 2.23. Sei G eine Gruppe, X ⊂ G eine Teilmenge und X ∩ X −1 = ∅.
Die von X erzeugte Untergruppe hXi ist genau dann frei über X, wenn für alle
Produkte
g = x1 · · · xn ∈ G
mit n > 0, xi ∈ X ∪ X −1 und xi 6= x−1
i+1 gilt, dass g 6= 1.
Beweis. Seien zunächst x1 , . . . , xn ∈ X ∪ X −1 , xi 6= x−1
i+1 und x1 · · · xn = 1.
Dann ist idX nicht zu einem Homomorphismus ϕ : hXi → F (X) fortsetzbar,
denn es müsste gelten
ϕ(x1 · · · xn ) = ϕ(x1 ) · · · ϕ(xn ) 6= 1.
Es folgt sofort, dass hXi nicht frei über X ist.
Sei nun andersherum x1 · · · xn 6= 1 für alle n > 0 und xi ∈ X ∪ X −1 mit
xi 6= x−1
i+1 . Wegen der universellen Eigenschaft von F (X) ist idX eindeutig
32
zu einem Homomorphismus ϕ : F (X) → hXi fortsetzbar. Es folgt aus der
Voraussetzung, dass ϕ(w) 6= 1 für alle w 6= 1, somit ist ϕ injektiv. Da X ein
Erzeugendensystem von hXi ist, ist ϕ surjektiv, also ein Isomorphismus. Daraus
folgt die Behauptung.
Definition 2.24. Sei X eine Menge und F = F (X) die freie Gruppe über X.
Für g ∈ F bezeichne |g| die Länge (d.h. Anzahl der Buchstaben) des eindeutigen
reduzierten Wortes in X̃ ∗ , das g repräsentiert.
Eine (endliche oder unendliche) Teilmenge U ⊂ F heißt Nielsen-reduziert,
falls für beliebige Elemente v1 , v2 , v3 ∈ U ∪ U −1 gilt
1. v1 6= 1,
2. v1 v2 6= 1 ⇒ |v1 v2 | ≥ max(|v1 |, |v2 |),
3. v1 v2 6= 1 und v2 v3 6= 1 ⇒ |v1 v2 v3 | > |v1 | − |v2 | + |v3 |.
Proposition 2.25. Sei X eine Menge und U ⊂ F (X) Nielsen-reduziert. Dann
existieren für jedes u ∈ U ∪ U −1 Wörter α(u), m(u), ω(u) ∈ X̃ ∗ mit m(u) 6= 1
und ω(u) = α(u−1 )−1 , so dass folgendes gilt:
1. α(u) · m(u) · ω(u) ist reduziert und α(u) · m(u) · ω(u) =F u.
−1
2. Sind v1 , . . . , vn ∈ U ∪U −1 , so dass vi 6= vi+1
, und bezeichnet ω(vi )α(vi+1 ) ∈
∗
X̃ das reduzierte Wort, das äquivalent zu ω(vi ) · α(vi+1 ) ist, so ist das
Wort
α(v1 ) · m(v1 ) · ω(v1 )α(v2 ) · m(v2 ) · · · ω(vn−1 )α(vn ) · m(vn ) · ω(vn ) (2.8)
reduziert.
Beweis. Für u ∈ U ∪U −1 bezeichne ũ den eindeutigen reduzierten Repräsentanten
von u in X̃ ∗ . Wähle dann α(u) als das längste Präfix von ũ, das ebenfalls Präfix
eines weiteren ṽ für v ∈ U ∪ U −1 , v 6= u, ist, und ω(u) := α(u−1 )−1 . Aus Eigenschaft 2.24 (2) folgt, dass |α(u)| + |ω(u)| = 2|α(u)| < |u|. Setze m(u) als das
eindeutige nicht-leere Wort, für das gilt, dass α(u) · m(u) · ω(u) = ũ.
−1
Seien nun v1 , . . . , vn ∈ U ∪ U −1 mit vi 6= vi+1
. Dann gilt offenbar (2.8),
denn anderenfalls würde für ein i ∈ 1, . . . , n − 1 gelten, dass ω(vi )α(vi+1 ) = 1
und m(vi )m(vi+1 ) nicht reduziert ist. Dann wäre aber α(vi+1 ) nicht maximal
gewählt. Ein Widerspruch.
Aus Proposition 2.25 und Lemma 2.23 folgt sofort
Korollar 2.26. Ist U ⊂ F (X) Nielsen-reduziert und U ∩ U −1 = ∅, so ist hU i
frei über U .
Eine zentrale Frage, die man über eine gegebene Gruppe G stellen kann, ist
die, wie “groß” die Gruppe G ist:
33
Definition 2.27. Der Rang einer Gruppe G, rank(G) ∈ N∪{∞}, ist die Anzahl
der Elemente eines kleinsten Erzeugendensystemes von G. Wir nennen G endlich
erzeugt, falls rank(G) ∈ N.
Es wird sich herausstellen, dass es schwierig ist, den Rang einer Gruppe zu
bestimmen. Zunächst können wir aber folgendes einsehen:
Proposition 2.28. Sei X eine endliche Menge. Dann ist rank(F (X)) = |X|.
Beweis. Sei X = {x1 , . . . , xn }. Da X ein Erzeugendensystem von F (X) ist, gilt
offenbar rank(F (X)) ≤ n. Zu zeigen ist, dass kein Erzeugendensystem X 0 von
F (X) existiert mit |X 0 | < n. Wir tun dies, indem wir die Aussage auf eine
Gruppe zurückführen, deren Rang wir bestimmen können: Die Gruppe Zn2 hat
offenbar Rang n; denn einerseits ist E := (e1 , . . . , en ) ein Erzeugendensystem
(wobei ei das i-te Einheitstupel in Zn2 bezeichnet), andererseits ist Zn2 als Z2 Vektorraum der Dimension n mindestens von Rang n.
Die Abbildung f : X → E, xi 7→ ei setzt sich nach der universellen Eigenschaft von F (X) zu einem eindeutigen Homomorphismus ϕ : F (X) → Zn2
fort. Da E = f (X) ein Erzeugendensystem ist, ist ϕ surjektiv. Ist nun X 0 ein
beliebiges Erzeugendensystem von F (X), so ist ϕ(X 0 ) ein Erzeugendensystem
von Zn2 . Es folgt |X 0 | ≥ n.
Etwas unintuitiv ist dagegen das Verhalten von Untergruppen im Hinblick
auf ihren Rang. Während man von endlich-dimensionalen Vektorräumen gewöhnt ist, dass ein strikter Teilraum stets eine kleinere Dimension hat, können
Untergruppen einer endlich erzeugten Gruppe G durchaus einen höheren Rang
als G besitzen. Als Beispiel betrachte man die freie Gruppe F = F ({a, b}), und
für n ∈ N die Teilmenge
Mn := h{b, aba−1 , a2 ba−2 , . . . , an ba−n }i.
Man sieht leicht ein, dass Mn Nielsen-reduziert ist. Somit gilt nach Korollar 2.26,
dass Un := hMn i frei über Mn ist; es folgt aus 2.28, dass rank(Un ) = n + 1.
Diese Beobachtung können wir benutzen, um ein viel allgemeineres Resultat zu
beweisen:
Wir beschließen dieses Kapitel mit dem Begriff der Tietze-Äquivalenz.
Definition 2.29 (Tietze-Äquivalenz). Zwei Gruppenpräsentierungen hX|Ri
und hX 0 |R0 i heißen elementar Tietze-äquivalent, falls
1. X 0 = X und R0 = R ∪ {r} für ein r ∈ hhRii oder
2. X 0 = X ∪ {x} für ein x ∈
/ X und R0 = R ∪ {x±1 w} für ein w ∈ F (X).
Die Tietze-Äquivalenz ist die von der elementaren Tietze-Äquivalenz erzeugte
Äquivalenzrelation.
34
2.6
Markov-Eigenschaften
Eines der Ziele dieser Vorlesung ist es, mithilfe des Higmannschen Einbettungssatzes die Existenz endlich präsentierter Gruppen mit unentscheidbarem
Wortproblem zu beweisen. Das bedeutet, dass eine endlich präsentierte Gruppe H = hX|Ri existiert, für die kein Algorithmus existiert, der für ein gegebenes Element w ∈ X̃ ∗ entscheidet, ob w das triviale Element in H repräsentiert. Wir werden in diesem Abschnitt die Existenz einer solchen Gruppe
H annehmen und mit ihrer Hilfe beweisen, dass viele weitere Eigenschaften von
(endlich-präsentierten) Gruppen im allgemeinen unentscheidbar sind; nämlich
alle Markov-Eigenschaften:
Definition 2.30. Eine Eigenschaft P von Gruppen heißt Markov-Eigenschaft,
falls gilt:
1. Es existiert eine endlich präsentierte Gruppe G1 mit der Eigenschaft P .
2. Es existiert eine endlich präsentierte Gruppe G2 , die in keine Gruppe mit
der Eigenschaft P einbettbar ist.
Ein einfaches Beispiel eine Markov-Eigenschaft ist Kommutatvität: Es existieren endlich präsentierte abelsche Gruppen, und eine nicht-abelsche Gruppe ist
in keine abelsche Gruppe einbettbar. Ebenso sind endlich, trivial, torsionsfrei,
frei und nilpotent Markov-Eigenschaften.
Satz 2.31. Sei P eine Markov-Eigenschaft. Dann gibt es keinen Algorithmus,
der für eine beliebige endlich präsentierte Gruppe G entscheidet, ob G die Eigenschaft P hat.
Beweis. Sei H eine Gruppe mit unentscheidbarem Wortproblem und w ∈ H.
Weiter sei G2 wie in Definition 2.30 eine Gruppe, die in keine Gruppe mit der
Eigenschaft P einbettbar ist. Wir beginnen die Konstruktion mit der Gruppe
G ∗ H ∗ hxi. Nach Satz 4.1 existiert eine Gruppe U , die von zwei Elementen
u1 , u2 von unendlicher Ordnung erzeugt wird, in die G ∗ H ∗ hxi einbettbar ist.
Setze nun
J := hU, y1 , y2 | y1 u1 y1−1 = u21 , y2 u2 y2−1 = u22 i.
J geht aus U durch zweifache HNN-Erweiterung hervor, insbesondere ist U also
eine Untergruppe von J. Setze nun
K := hJ, z | zy1 z −1 = y12 , zy2 z −1 = y22 i.
K ist eine HNN-Erweiterung von K entlang der Untergruppe F2 ∼
= hy1 , y2 i ∼
=
2 2
hy1 , y2 i, also ist U eine Untergruppe von K.
[noch nicht fertig...]
35
3
Entscheidungsprobleme
Im folgenden wollen wir die erarbeiteten Hilfsmittel aus den ersten beiden Kapiteln nutzen, um einige algorithmische Probleme in der Gruppentheorie zu
formalisieren und ihre algorithmische Lösbarkeit zu diskutieren. Zunächst stellt
sich die Frage, wie wir die Theorie der rekursiven Funktionen aus Kapitel 1 auf
Gruppen anwenden können.
Wie in Abschnitt 1.6 beschrieben, ist alles, was wir brauchen, eine Identifikation von Gruppenelementen mit Tupeln natürlicher Zahlen. Dann können wir
Berechnungen in Gruppen auf Berechnungen in N∗ zurückführen.
Wir fixieren eine (endliche oder abzählbar unendliche) Menge
X = {x1 , x2 , x3 , . . .}.
Ein Element g der Gruppe F (X) repräsentieren wir üblicherweise durch das
eindeutige reduzierte Wort aus X̃ ∗ , das g repräsentiert. Ein solches Wort
w = xi11 · · · xikk ∈ X̃ ∗ ,
wobei xij ∈ X und j ∈ {±1}, lässt sich zunächst in naheliegender Weise als
Tupel von ganzen Zahlen (1 · i1 , . . . , k · ik ) ∈ Zk parametrisieren. Zum Beispiel
würde das Wort
−1 −1
x21 x2 x−2
3 = x1 x1 x2 x3 x3
durch das Tupel (1, 1, 2, −3, −3) parametrisiert. Das leere Wort 1 ∈ X̃ ∗ wird
durch (0) repräsentiert.
Diese Parametrisierung (1 · i1 , . . . , k · ik ) ∈ Zk lässt sich nun vermöge der
Bijektion
(
2z
falls z gerade,
p : Z → N, z 7→
|2z| − 1 sonst
eindeutig auf das Tupel
enc(w) = (p(1 · i1 ), . . . , p(k · ik )) ∈ Nk
abbilden. Wir nennen enc(w) die Kodierung 6 von w. Wie oben erwähnt, erlaubt
dies in naheligender Weise eine Kodierung eines Elementes g der freien Gruppe,
indem wir g durch seinen reduzierten Repräsentanten w darstellen:
Definition 3.1. Sei g ∈ F (X). Dann ist enc(g) := enc(w) für das eindeutig
bestimmte reduzierte Wort w ∈ X̃ ∗ , das g repräsentiert.
Indem wir Elemente von F (X) nun vermöge der Injektion enc : F (X) →
N∗ mit Tupeln natürlicher Zahlen identifizieren, lässt sich die gesamte Theorie
aus Abschnitt 1.6 auf freie Gruppen übertragen. Dies tun wir im folgenden
Abschnitt.
6 enc
steht für Encoding.
36
3.1
Wortproblem
Das wohl fundamentalste dieser algorithmischen Probleme in der Gruppentheorie ist das Wortproblem: Ist eine Gruppe G durch eine Präsentierung G = hX|Ri
und ein Element g ∈ G als Produkt von Erzeugern (und Inversen),
g = x1 · · · xm
mit xi ∈ X ∪ X −1 , gegeben, kann man entscheiden, ob g = 1 in G gilt?
Die eigentliche Frage, die hier zu entscheiden ist, ist also offenbar, ob in der
freien Gruppe F (X) gilt, dass x1 · · · xm ∈ hhRii. Im Kontext von Teilmengen von
N∗ wissen wir inzwischen, dass diejenigen Teilmengen, für die die Zugehörigkeit
algorithmisch entscheidbar ist, gerade die rekursiven Mengen sind. Durch die
oben konstruierte Kodierung von Elementen aus F (X) in N∗ können wir diesen Begriff nun auf natürliche Weise auf Teilmengen von F (X) erweitern. Wir
identifizieren S ⊂ F (X) mit enc(S) ⊂ N∗ und nennen S rekursiv, falls enc(S)
rekursiv ist.
Definition 3.2. Sei G eine Gruppe mit rekursiver Präsentierung hX|Ri. Wir
sagen, dass G lösbares Wortproblem hat, falls hhRii ⊂ F (X) rekursiv ist.
Zunächst ist hier zu klären, dass die Eigenschaft des lösbaren Wortproblemes G nicht von der gewählten Präsentierung hX|Ri abhängt. Sei also hX 0 |R0 i
eine weitere rekursive Präsentierung von G. Es existiert also ein Isomorphismus
ϕ : F (X)/hhRii → F (X 0 )/hhR0 ii. Für jedes x ∈ X wähle einen Repräsentanten
wx ∈ F (X 0 ) von ϕ(x). Nach der universellen Eigenschaft lässt sich die Abbildung
x 7→ wx eindeutig zu einem Homomorphismus ϕ∗ : F (X) → F (X 0 ) fortsetzen,
und es folgt w ∈ hhRii ⇔ ϕ∗ (w) ∈ hhR0 ii, d.h. 1hhRii = 1hhR0 ii ◦ ϕ∗ . Nun ist
ein Homomorphismus freier Gruppen (auf dem Niveau von N∗ betrachtet) gerade Beispiel 1.34 (5) (genauer: eine Einschränkung davon auf einen geeigneten
Definitionsbereich).
Somit gilt
1hhR0 ii = 1hhRii ◦ ϕ∗ ,
Ist nun 1hhRii rekursiv, so nach Satz ?? auch 1hhR0 ii .
4
Einbettungssätze
In diesem Abschnitt werden wir einige Eigenschaften von Untergruppen von
Gruppen zeigen. Das Ziel wird es sein, den Higmanschen Einbettungssatz zu
beweisen. Wir folgen weitgehend [LS].
Satz 4.1. Jede abzählbare Gruppe C lässt sich in eine Gruppe G von Rang 2
mit folgenden Eigenschaften einbetten:
1. G hat Rang zwei und ein Erzeugendensystem aus zwei Elementen von
unendlicher Ordnung.
37
2. G hat ein Element endlicher Ordnung genau dann, wenn C ein Element
endlicher Ordnung besitzt.
3. Ist C endlich präsentiert, so auch G.
Beweis. Wähle eine abzählbare Präsentierung C = hx1 , x2 , . . . | r1 , r2 , . . .i. Setze
H := C ∗ F (a, b). Die Menge {a−k bak | k ∈ N} ⊂ F (a, b) ist Nielsen-reduziert
und somit eine Basis einer freien Untergruppe von F (a, b).
Ebenso ist
M := {b, x1 a−1 ba, x2 a−2 ba2 , . . .}
Basis einer freien Untergruppe von H. Somit ist die Gruppe
G := hH, t | t−1 at = b, t−1 b−i abi t = ci a−i bai , i ≥ 1i
eine HNN-Erweiterung von H. Somit ist H, und damit auch C, in G einbettbar. Weiter ist leicht einzusehen, dass G Rang (höchstens) 2 hat: Offenbar ist
(a, b, t, x1 , x2 , . . .) ein Erzeugendensystem von G. Es folgt aber sofort aus den
Relationen von G, dass b, x1 , x2 , . . . ∈ ha, ti.
Eigenschaft (2) folgt aus Übungsaufgabe 3 von Blatt 6. Ist C = hx1 , . . . , xn |
r1 , . . . , rm i endlich präsentiert, so liefert die analoge Konstruktion einer HN N Erweiterung entlang einer freien Gruppe von Rang n + 1 eine endliche Präsentierung für G.
4.1
Der Higmansche Einbettungssatz
Satz 4.2. Sei G eine endlich erzeugte Gruppe. G ist genau dann in eine endlich
präsentierte Gruppe eingebettet werden, wenn G rekursiv präsentiert ist.
Eine der beiden Implikation des Higmanschen Einbettungssatzes ist schnell
bewiesen: Sei H durch eine endliche Präsentierung H = hY |Si gegeben und
G = hX|Ri sowie eine Einbettung ϕ̃ : F (X) → F (Y ) ein Lift der Einbettung
ϕ : G ,→ H. Dann ist offenbar ϕ(g) ∈ hhSii genau dann, wenn g ∈ hhRii: Die
eine Implikation (“⇐”) folgt, weil ϕ̃ durch G faktorisiert, die andere aus der
Injektivität von ϕ.
Da S endlich ist, ist hhSii rekursiv aufzählbar, d.h. es existiert eine rekursive
Funktion fS mit Def(f ) = hhSii. Somit ist fS ◦ ϕ̃ eine rekursive Funktion und
Def(fS ◦ ϕ̃) = hhRii. Also ist G rekursiv präsentiert.
Zu zeigen bleibt, dass jede rekursiv präsentierte Gruppe in eine endlich
präsntierte Gruppe einbettbar ist. Diese Richtung ist erheblich schwieriger zu
beweisen. Wir beginnen mit einer Definition einer Eigenschaft von Untergruppen, die eine zentrale Rolle im Verlauf des Beweises einnehmen wird.
Definition 4.3. Sei G eine endlich erzeugte Gruppe. Eine Untergruppe H ≤ G
heißt zahm in G, falls die Gruppe
GH := hG, t | {tht−1 = h | h ∈ H}i
in eine endlich präsentierte Gruppe einbettbar ist.
38
(4.1)
Eine Eigenschaft von zahmen Untergruppen, die wir vielfach benutzen werden, können wir unmittelbar beobachten:
Proposition 4.4. Seien K ≤ H ≤ G Gruppen und K zahm in G. Dann ist K
zahm in H.
Der Beweis ist offensichtlich, da die Gruppe HK (vgl. (4.1)) auf kanonische
Weise in GK eingebettet ist.
Wir werden uns im folgenden für zahme Untergruppen freier Gruppen interessieren. Der Zusammenhang zum Higmanschen Einbettungssatz ist keineswegs
offensichtlich und liegt in folgender Beobachtung: Ist F eine endlich erzeugte
freie Gruppe und R eine normale Untergruppe von F , dann ist die Zahmheit von
R in F eine hinreichende Bedingung dafür, dass F/R in eine endlich präsentierte
Gruppe einbettbar ist, wie das folgende Lemma zeigt. Somit wird die Zahmheit
zu einem wesentlichen Kriterium für das, was wir mit dem Higmanschen Einbettungssatz zeigen wollen.
Lemma 4.5. Sei F eine endliche erzeugte freie Gruppe und R ≤ F normal und
zahm. Dann ist F/R in eine endlich präsentierte Gruppe einbettbar.
Beweis. Sei X eine (endliche) Basis von F , d.h. F = F (X). Da R zahm ist,
existiert eine endlich präsentierte Gruppe H und ein Monomorphismus
ι : FR := hF, t | {trt−1 = r | r ∈ R}i ,→ H.
(4.2)
Ist g ∈ FR , so bezeichnen wir das Bild ι(g) ∈ H kurz mit ġ. Wir bezeichnen mit
H × F das direkte Produkt von H und F und definieren
K := hH × F, s | {s(f˙, 1)s−1 = (f˙, f ),
s(ṫf˙ṫ−1 , 1)s−1 = (ṫf˙ṫ−1 , 1) | f ∈ X}i
(4.3)
(4.4)
K ist offenbar endlich präsentiert, da H endlich präsentiert und X endlich ist.
Weiter zeigen wir, dass die Untergruppe h{(1, f ) | f ∈ X}i ≤ K isomorph zu
F/R ist. Somit ist F/R in K einbettbar, was die Behauptung impliziert.
Sei zunächst w ∈ R. Dann gilt in K aufgrund der gegebenen Relationen
(4.3)
einerseits s(ẇ, 1)s−1 = (ẇ, w) und andererseits
(4.2)
(4.4)
(4.2)
s(ẇ, 1)s−1 = s(ṫẇṫ−1 , 1)s−1 = (ṫẇṫ−1 , 1) = (ẇ, 1),
es folgt (ẇ, w) = (ẇ, 1) in K, und somit durch Multiplikation mit (ẇ−1 , 1) auch
(1, w) = (1, 1).
Es folgt also, dass wir (durch Tietze-Transformationen) alle Relationen der
Form (1, r) mit r ∈ R einführen können. Somit gilt
K = hH × F/R, s | {s(f˙, 1)s−1 = (f˙, f¯), s(ṫf˙ṫ−1 , 1)s−1 = (ṫf˙ṫ−1 , 1) | f ∈ X}i,
wobei f¯ das kanonische Bild von f ∈ F in F/R bezeichnet.
39
Wir zeigen nun, dass K eine HNN-Erweiterung von H × F/R ist. Dies impliziert nach Korollar 2.22, dass H × F/R und somit insbesondere F/R in K
einbettbar sind.
Betrachte die Gruppe C = hF, F 0 | {r = r0 | r ∈ R}i, wobei F 0 eine isomorphe Kopie von F bezeichnet (und g 0 ∈ F 0 das Bild von g ∈ F ). Dann
ist C ∼
= F ∗R F . Mithilfe von Satz 2.21 lässt sich leicht nachrechnen, dass die
Untergruppe
hF, tF t−1 i ≤ FR
isomorph zu C ist. Damit erhalten wir zwei Einbettungen
(
f 7→ (f˙, 1),
α : C ,→ H × F/R,
f 0 7→ (ṫf˙ṫ−1 , 1)
und
(
ω : C ,→ H × F/R,
f →
7 (f˙, f¯),
0
f →
7 (ṫf˙ṫ−1 , 1).
(Von der Wohldefiniertheit der Einbettungen möge man sich überzeugen.)
Somit gilt offenbar K ∼
= (H × F/R)∗C mit den obigen Monomorphismen α und
ω. Daraus folgt die Behauptung.
Lemma 4.6. Sei G eine endlich erzeugte Gruppe, die in eine endlich präsentierte
Gruppe eingebettet werden kann. Dann gilt:
1. Jede endlich erzeugte Untergruppe von G ist zahm in G.
2. Sind H1 , H2 ≤ G zahm, so auch H1 ∩ H2 und hH1 , H2 i.
Beweis. Aussage (1) folgt fast unmittelbar aus der Definition. Wir zeigen im
folgenden 2. Nach Voraussetzung existiert für i = 1, 2 eine endlich präsentierte
Gruppe Mi und ein Monomorphismus
τi : GHi := hG, ti | {ti ht−1
= h | h ∈ Hi }i ,→ Mi .
i
Betrachte die Gruppe
P := hM1 ∗ M2 | {τ1 (g) = τ2 (g) | g ∈ G}i ∼
= M1 ∗G M2 .
P ist endlich präsentiert, weil M1 und M2 endlich präsentiert und G endlich
erzeugt ist (denn wir brauchen die Relationen τ1 (g) = τ2 (g) nur für Erzeuger
von G).
Betrachte den Homomorphismus
(
g 7→ τ1 (g) für g ∈ G
−1
ϕ : hG, u | {uhu = h | h ∈ H1 ∩ H2 }i → P,
u 7→ t1 t2
Es folgt leicht mithilfe von Korollar 2.12, dass ϕ ein wohldefinierter Homomorphismus ist, und man kann leicht aus Satz 2.21 folgern, dass ϕ injektiv ist. Dies
zeigt, dass H1 ∩ H2 zahm ist.
40
Bleibt zu zeigen, dass hH1 , H2 i zahm ist. Beachte, dass in GHi gilt, dass
Hi = ti Hi t−1
i ∩ G.
Es folgt, abermals mithilfe von Satz 2.21, dass in P
−1
τ1 (hH1 , H2 i) = hτ1 (H1 ), τ2 (H2 )i = ht1 G1 t−1
1 , t2 G2 t2 i ∩ G.
Somit ist τ1 (hH1 , H2 i) der Schnitt zweier endlich erzeugter Untergruppen in P ,
und damit zahm in P . Es folgt, dass τ1 (hH1 , H2 i) zahm in τ1 (G) ist, und somit
hH1 , H2 i zahm in G.
Satz 4.7. Sei S ⊂ N rekursiv aufzählbar. Dann ist die Gruppe haz bcz | z ∈ Si
zahm in F (a, b, c).
Beweis. Da S rekursiv aufzählbar ist, ist S diophantisch. Sei PS ∈ Z[t0 , . . . , tk ]
ein charakterisierendes Polynom von S. Nach Übungsaufgabe 3.1 existiert m ≥ k
und Polynome P1 , . . . , Pl ∈ Z[t0 , . . . , tm ] existieren, so dass jedes Pl von einer
der folgenden Formen
Pic
=
Pi,j
:= ti − c
(c ∈ N)
(4.5)
:= ti − tj
(4.6)
+
Pi,j,k
:= ti + tj − tk
(4.7)
·
Pi,j,k
:= ti · tj − tk ,
(4.8)
wobei i, j, k ∈ {1, . . . , m} paarweise verschieden sind und c ∈ N.
und PS äquivalent zum Gleichungssystem (P1 , . . . , Pl ) ist im folgenden Sinne:
Für x̄ ∈ Nk gilt P (x̄) = 0 genau dann, wenn ȳ ∈ Nn−k existiert, so dass
·
Pi (x̄, ȳ) = 0 für i = 1, . . . , l. Wir nehmen zusätzlich im Falle von Pi,j,k
o.B.d.A.
an, dass k < i < j. Dies ist eine Technikalie, die wir später ausnutzen werden.
Betrachte die freie Gruppe
F := F (a0 , b0 , c0 , . . . , am , bm , cm ).
Jedes Tupel z̄ = (z0 , . . . , zm ) ∈ Nm+1 assoziieren wir im folgenden mit dem
Element
wz̄ := (azmm bm czmm )−1 · · · (az11 b1 cz11 )−1 (az00 b0 cz00 )(az11 b1 cz11 ) · · · (azmm bm czmm ).
Für ein Polynom Q ∈ Z[t0 , . . . , tm ] sei nun
AQ := hwz̄ | z̄ ∈ Nm+1 , Q(z̄) = 0i ≤ F
die Untergruppe von F , die von allen zu Lösungen von Q assoziierten Elementen
erzeugt wird. Wir beobachten zunächst, dass
APS =
l
\
i=1
41
APi
(4.9)
gilt: Die Inklusion ⊂“ ist offensichtlich; und ⊃“ folgt, weil die Menge {wz̄ |
”
”
z̄ ∈ Nm+1 } Nielsen-reduziert ist.
Wit werden im folgenden zeigen, dass alle Gruppen APi zahm in F sind.
Dies impliziert nach (4.9) und Lemma 4.6 (2), dass APS zahm ist. Da ebenfalls
gilt, dass
haz00 b0 cz00 | z0 ∈ Si = hAPS , a1 , b1 , c1 , . . . , am , bm , cm i ∩ ha0 , b0 , c0 i,
folgt abermals mit Lemma 4.6, dass haz00 b0 cz00 | z0 ∈ Si zahm in F ist, und somit
nach Proposition 4.4 in F (a0 , b0 , c0 ), was zu zeigen ist.
Um zu zeigen, dass jedes APi zahm in F ist, konstruieren wir eine endlich
erzeugte Gruppe M , die F enthält, so dass für jedes Pi eine endlich erzeugte
Untergruppe Li ≤ M existiert mithilfe
Li ∩ F = APi .
Zusammen mit Lemma 4.6 impliziert dies die Behauptung.
Wir konstruieren M in zwei Schritten. Sei B := {a0 , b0 , c0 , . . . , am , bm , cm }
die gegebene Basis von F . Wir setzen zunächst
M 0 := hF, {ti | i = 0, . . . , m} | {t−1
i bi ti = ai bi ci ,
t−1
i gti = g | i = 0, . . . , m, g ∈ B \ {bi }}i.
In M 0 kommutiert also jedes ti mit allen Erzeugern aus B außer bi . Man kann
leicht nachvollziehen, dass M 0 aus F durch sukzessive HNN-Erweiterungen entlang F hervorgeht; insbesondere gilt also F ≤ M 0 .
Nun setzen wir
M := hM 0 , {pj,l | 0 ≤ l < j < m} | {p−1
j,l cj pj,l = tl cj ,
p−1
j,l tl pj,l = tl ,
p−1
j,l gpj,l = g | i = 0, . . . , m, g ∈ B \ {cj }}i.
Wir sehen im folgenden ein, dass M aus M 0 ebenfalls durch sukzessive HNNErweiterungen mit stabilen Buchstaben pj,l entlang Cl := hF, tl i hervorgeht. Es
gilt in M 0 , dass
−1
Cl = hF, tl | t−1
l bl tl = al bl cl , {tl gtl = g | g ∈ B \ {bl }}i,
und man rechnet leicht nach, dass die Abbildung


cj 7→ tl cj
αl : Cl → Cl , g 7→ g
für g ∈ B \ cj


tl 7→ tl
ein wohldefinierter Automorphismus von Cl ist, und wir erhalten eine HNNErweiterung entlang Cl bezüglich der kanonischen und der mit αl verknüpften
Einbettung von Cl in M 0 .
42
Wir zeigen nun, dass für jedes Pi eine endlich erzeugte Untergruppe Li ≤ M
existiert mithilfe
Li ∩ F = APi .
Für ein Polynom PS definieren wir die folgende Untergruppe von M , abhängig
von der Gestalt von Ps (gemäß (4.5) bis (4.8)):
Lci
L=
i,j
+
Li,j,k
L·i,j,k
:= hw(0,...,c,0,...,0) , {ts | s 6= i}i,
:= hw(0,...,0) , ti tj , {ts | s ∈
/ {i, j}}i,
:= hw(0,...,0) , ti tk , tj tk , {ts | s ∈
/ {i, j, k}}i,
:= hw(0,...,0) , ti pj,k , tj pi,k , {ts | s ∈
/ {i, j, k}}i.
Man rechnet nach, dass
t−1
i w(z0 ,...,zm ) ti
=
w(z0 ,...,zi−1 ,zi +1,zi+1 ,...,zm )
(4.10)
p−1
j,l w(z0 ,...,zm ) pj,l
=
w(z0 ,...,zl−1 ,zl +zj ,zl+1 ,...,zm ) .
(4.11)
·
). Aus (4.10)
(wobei an dieser Stelle benutzt wird, dass k < i < j, falls Ps = Pi,j,k
und (??) folgt sofort, dass
APs ≤ F ∩ LPs .
Sei andersherum w ein Wort in den oben angegebenen Erzeugern von LPs (und
Inversen), und wir nehmen an, dass w ∈ F . Enthält w keine t±1
und p±1
i
j,k , so
±1
±1
gilt offenbar w ∈ APs . Enthält w aber ti und pj,k , so ist w nicht in Normalform bzgl. der korrespondierenden HNN-Erweiterung und kann daher reduziert
werden. Eine Reduktion erhält aber die Eigenschaft von
Mittels Satz 4.7 können wir nun den Higmanschen Einbettungssatz beweisen:
Beweis. Sei also G rekursiv präsentierbar. Nach Satz 4.1 ist G in eine Gruppe
von Rang 2 einbettbar, und die im Beweis von Satz 4.1 konstruierte Präsentierung
dieser Gruppe ist ebenfalls rekursiv, sofern die Konstruktion mit einer rekursiven Präsentierung begonnen wird. Daher genügt es, zu zeigen, dass jede rekursiv
präsentierbare Gruppe von Rang 2 in eine endlich präsentierbare Gruppe eingebettet werden kann. Sei also X := {a, b} und R ≤ F (X) rekursiv aufzählbar.
Wir zeigen im folgenden, dass R zahm in F (X) ist. Dies impliziert nach Lemma 4.5 die Behauptung.
Wir definieren die Funktion γ durch


a
7→ 1





7→ 2
b
γ : X̃ ∗ → N, a−1
7→ 3


−1

b
7→ 4



w · · · w 7→ P γ(w ) · 10k−i
1
k
i
(für wi ∈ X̃). Für ein Wort w ist γ(w) also gerade die Zahl, die man erhält,
indem man das Wort als Zahl im Zahlensystem mit Basis 10 betrachtet, wobei
a, b, a−1 und b−1 die Ziffern 1, 2, 3 und 4 repräsentieren.
43
Es ist leicht zu zeigen, dass γ rekursiv ist. Da R rekursiv aufzählbar und
γ rekursiv ist, folgt, dass γ(R) rekursiv aufzählbar ist. Nun setzen wir F :=
F (a, b, c, d, e, h), und für ein Wort w ∈ X̃ ∗ sei
gw := whcγ (w)deγ (w) ∈ F.
Nun definieren wir GF := hgw | w ∈ X̃ ∗ i. Nun mag die Idee des Beweises bereits
deutlich werden: Der Term γ(w)deγ (w) am Ende von gw hat die Funktion einer
Art Prüfsumme, die in G hinter einem Wort w mitgeführt wird (der Zweck
des Erzeugers h wird später deutlich werden). Im Hinblick auf die Untergruppe
R ≤ F (a, b) betrachten wir nun die Untergruppe
Y := ha, b, h, ci dei | i ∈ γ(R)i.
(4.12)
R = hG ∩ Y, h, c, d, ei ∩ F (a, b)
(4.13)
Wir zeigen, dass in F
gilt: Sei zunächst w ein frei reduzierter Repräsentant eines Elementes von R.
Dann ist gw = whcγ (w)deγ (w) ∈ G∩Y , somit folgt die Inklusion ⊂“ von (4.13)
”
unmittelbar. Die Inklusion ⊃“ folgt, weil das in 4.12 angegebene Erzeugenden”
system von Y Nielsen-reduziert ist.
Nach Satz 4.7 und Lemma 4.6 ist Y zahm in F . Es bleibt zu zeigen, dass
G zahm in F ist. Dann folgt abermals aus Lemma 4.6, dass hG ∩ Y, h, c, d, ei
zahm in F ist. Da auch F (a, b) zahm in F ist, ist dann R zahm in F und nach
Proposition 4.4 auch zahm in F (a, b).
Um zu zeigen, dass G zahm in F ist, konstruieren wir eine Gruppe F ∗ aus
F als sukzessive HNN-Erweiterung mit den stabilen Buchstaben ta , tb , ta−1 und
tb−1 :
F ∗ := hF, ta , tb , ta−1 , tb−1 | {t−1
x htx = xh
−1
t−1
x atx = a, tx btx = b
10 −1
10
t−1
x ctx = c , tx etx = e
γ(x) γ(x)
t−1
de
| x ∈ X̃}i
x dtx = c
Man rechnet leicht nach, dass für ein Element w = x1 , . . . , xn ∈ X̃ ∗ gilt
−1
γ(w) γ(w)
t−1
de
= gw .
xn · · · tx1 hdtx1 · · · txn = whc
(4.14)
Wir zeigen im folgenden, dass in F ∗
G = hhd, ta , tb , ta−1 , tb−1 i ∩ F.
(4.15)
Daraus folgt, wiederum nach Lemma 4.6, das G zahm in F ist, was zu zeigen
ist. Die Inklusion ⊂“ von (4.15) folgt sofort aus (4.14). Wir zeigen mithilfe von
”
Satz 2.21 die Inklusion ⊃“: Sei w ein frei reduziertes Produkt in den Erzeugern
”
44
{hd, ta , tb , ta−1 , tb−1 }, also
w = (hd)k1 t1 · · · tl−1 (hd)kl
mit ti ∈ {ta , tb , ta−1 , tb−1 } und ki ∈ Z. Ist l = 1, also w = (hd)k1 , so ist w ∈ G
und es ist nichts zu zeigen. Sei also l > 1, d.h. w enthält mindestens ein tλ mit
λ ∈ {a, b, a−1 , b−1 }.
Da aber nach Voraussetzung w ∈ F gilt, folgt, dass w –bzgl. der Struktur als
HNN-Erweiterung mit stabilem Buchstaben tλ – nicht reduziert ist. Wir können
also einen Reduktionsschritt machen und erhalten eine kürzere Darstellung w1
desselben Elements w. Diesen Prozess können wir solange fortsetzen, wie wi
nicht reduziert bzgl. allen tλ ist. Zu zeigen ist nun folgendes: Enthält ein wi ein
Teilwort der Form
0
t−1
λ w tλ
tλ w0 t−1
λ
mit
mit
w0 ∈ hh, a, b, c, d, ei oder
0
10
10
γ(λ)
w ∈ hh, a, b, c , e , c
(4.16)
γ(λ)
de
i,
(4.17)
0
0 −1
und w0 ∈ G, so ist t−1
λ w tλ bzw. tλ w tλ ebenfalls in G. Im Fall (4.16) folgt dies
sofort aus (4.14). Wir betrachten also (4.17): Da w0 , gilt
w0 = gw11 · · · gwnn
(4.18)
für geeignete wi ∈ X̃ ∗ . Andererseits ist w0 gemäß (4.17) darstellbar als Produkt
w0 = y1 cn1 y2 · yk cnk yk+1
(4.19)
wobei die yi Produkte von h, a, b und d sind, und yi 6= 1 für 1 < i ≤ k. Es
folgt sofort aus den Erzeugern in (4.17), dass ni ≡ 0 oder ni ≡ ±γ(λ) (mod 10).
Man überzeugt sich leicht, dass bei Kürzungen des Produktes aus (4.18) alle
Vorkommen von (cγ(wi ) d)i nicht gekürzt werden. Somit sind die Exponenten
γ(wi ) von c nur solche, die auch in dem Produkt (4.19) auftreten können. Es
folgt, dass γ(wi ) ≡ 0 oder γ(wi ) ≡ ±γ(λ). γ(wi ) ≡ 0 ist auszuschließen, denn
dies gilt nur für wi = 1; jedoch ist hd = g1 nicht in G enthalten.
Somit ist γ(wi ) ≡ ±γ(λ) für i = 1, . . . , n. Dies impliziert, dass wi mit λ
endet. Ist also wi = wi0 λ, so folgt analog zu (4.14), dass
−1
0
0
tλ gwi t−1
λ = tλ g(wi λ) tλ = gwi ∈ G,
und somit tλ w0 t−1
λ ∈ G, was zu zeigen war.
45
Index
µ-Operator, 9
beschränkte Subtraktion, 5
Cantorsche Paarfunktion, 7
charakerisierendes Polynom, 12
diophantische Menge, 12
freie Gruppe, 23
freier Monoid, 24
freies Produkt, 28
Funktion, 4
diophantische . . . , 14
partielle . . . , 8
primitiv rekursive . . . , 4
primitive . . . , 4
rekursive . . . , 9
totale . . . , 9
HNN-Erweiterung, 29
Indikatorfunktion, 6
Markov-Eigenschaft, 35
Menge
rekursiv aufzählbare . . . , 11
rekursive . . . , 10
Modulo-Operator, 6
Nielsen-reduziert, 33
Normalformsatz von Kleene, 10
Präsentierung, 27
Rang, 34
Tietze-Äquivalenz, 34
Wortproblem, 37
46
Literatur
[D]
M. Davis, Hilbert’s Tenth Problem is unsolvable. Amer. Math. Monthly 80,
233-269 (1973).
[LS] Roger Lyndon, Paul Schupp, Combinatorial Group Theory, Springer.
47
Herunterladen