Entscheidungsprobleme in der Gruppentheorie

Werbung
Entscheidungsprobleme in der Gruppentheorie
Dr. C. Reinfeldt
24. Januar 2014
Inhaltsverzeichnis
1 Grundlagen der Berechenbarkeitstheorie
1.1 Notationen . . . . . . . . . . . . . . . . . .
1.2 Primitiv rekursive Funktionen . . . . . . . .
1.3 Rekursive Funktionen . . . . . . . . . . . .
1.4 Rekursiv aufzählbare und rekursive Mengen
1.5 Diophantische Mengen und Funktionen . . .
1.6 Rekursivität auf N∗ . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
3
4
4
8
10
11
19
2 Gruppen und Gruppenpräsentierungen
2.1 Freie Gruppen . . . . . . . . . . . . . . . . . . . . . .
2.2 Gruppenpräsentierungen . . . . . . . . . . . . . . . . .
2.3 Freie Produkte . . . . . . . . . . . . . . . . . . . . . .
2.4 HNN-Erweiterungen . . . . . . . . . . . . . . . . . . .
2.5 Eigenschaften von Gruppen und Nielsen-Reduziertheit
2.6 Markov-Eigenschaften . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
21
21
24
26
27
30
32
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
3 Entscheidungsprobleme
33
3.1 Wortproblem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
4 Einbettungssätze
35
4.1 Der Higmansche Einbettungssatz . . . . . . . . . . . . . . . . . . 35
Stichwortverzeichnis
37
Literaturverzeichnis
39
Einleitung
In dieser Vorlesung beschäftigen wir uns mit Fragen der algorithmischen Berechenbarkeit verschiedener Eigenschaften von Gruppen. Eine solche Frage könnte
zum Beispiel so lauten:
1
“Gegeben sei eine Gruppe G. Gibt es einen Algorithmus, der entscheidet,
ob die Gruppe G eine bestimmte Eigenschaft hat (z.B., ob G trivial ist, ob G
hyperbolisch ist, . . . )?”
Etwas technischer formuliert, suchen wir also nach einem Algorithmus, der
folgendes leistet: Bekommt er als Input eine Gruppe G, so berechnet er als Output einen Wahrheitswert (true/false), der angibt, ob die Gruppe die gewünschte
Eigenschaft hat.
Um dieser Problemstellung einen vernünftigen Sinn zu verleihen, müssen
wir zwei Dinge klären. Einerseits brauchen wir einen formalen Rahmen für den
Begriff Algorithmus. Ein Algorithmus ist, anschaulich gesprochen, exakt das,
was man sich unter einem Computerprogramm vorstellt, das in einer gängigen
Programmiersprache (C, C++, Java, . . . ) geschrieben ist. Um sich davon zu
überzeugen, dass eine gewisse Aufgabenstellung algorithmisch gelöst werden
kann, reicht diese Anschauung oft schon aus: Man schreibt einfach ein entsprechendes Programm, das die Lösung liefert. Um allerdings zu beweisen, dass
es einen solchen Algorithmus nicht geben kann, brauchen wir einigen Formalismus, um die algorithmisch berechenbaren Funktionen klassifizieren zu können.
Diesen Formalismus werden wir in Kapitel 1 erarbeiten.
Andererseits brauchen wir eine Möglichkeit, eine Gruppe so zu beschreiben,
dass wir sie als Input an einen Algorithmus übergeben können. Um eine Gruppe vollständig zu beschreiben, muss festgelegt werden, welche, bzw. wie viele,
Elemente sie hat, und wie die Verknüpfung in der Gruppe definiert ist.
Eine Möglichkeit, dies für eine endliche Gruppe zu beschreiben, wäre etwa eine Gruppentafel. Eine andere, und für uns interessantere Möglichkeit, ist
die der Gruppenpräsentierung: Eine Gruppe wird durch eine Menge von Erzeugenden und eine Menge von Relationen beschrieben; letztere kann man sich
als Rechenregeln vorstellen, die die Verknüpfung der Gruppe definieren. Wir
werden Gruppenpräsentierungen in Kapitel 2 formalisieren.
....
2
1
Grundlagen der Berechenbarkeitstheorie
In diesem Abschnitt wollen wir gewisse Grundlagen der Berechenbarkeitstheorie
diskutieren und uns einen Überblick verschaffen, unter welchen Voraussetzungen
eine gegebene Funktion berechenbar ist. Berechnenbar soll hierbei, informell,
bedeuten, dass es einen Algorithmus gibt, der für ein gegebenes n aus dem
Definitionsbereich von f das Bild f (n) berechnen kann. Dabei geben wir dem
Computer, der den Algorithmus ausführen soll, grundsätzlich beliebig viel Zeit
und Speicher; wir wollen also nur diskutieren, ob ein Algorithmus existiert, ohne
die Effizienz zu untersuchen.
Um zu argumentieren, dass eine gegebene mathematische Funktion berechenbar ist, genügt es oft, ein Stück Code1 zu liefern, das den Algorithmus
beschreibt, der die Funktion berechnet. So beschreibt z.B. der Code
function binom(n,k) {
if
n < k: return 0;
else if k = 0: return 1;
else:
return
binom(n-1,k)
+ binom(n-1,k-1);
}
eine Funktion, die bei Eingabe
zweier nicht-negativer ganzer Zahlen n und k
den Binomialkoffizienten nk berechnet und zurückgibt.
Nun wird dieses Stück Code jeden, der schon einmal Erfahrungen mit Programmierung gemacht hat, davon überzeugen, dass ein Binomialkoeffizient tatsächlich von einem Computer berechnet werden kann, denn alle Anweisungen,
die in dem Code benutzt werden, stehen in jeder gängigen Programmiersprache
(wie etwa C, C++ und Java) zur Verfügung und können damit in ein Computerprogramm eingebaut werden.
Die Frage, die sich nun aufdrängt, ist folgende: Können eigentlich alle Funktionen, die man im mathematischen Sinne definieren kann, auch durch einen
Algorithmus, d.h. von einem Computer berechnet werden? Um auf diese Frage
eine Antwort geben zu können, braucht es etwas mehr Formalismus: Was ist
eigentlich ein Computer? Oder, genauer gefragt: Was kann ein Computer?
Um dies zu beantworten, gibt es mehrere, äquivalente Ansätze: In der theoretischen Informatik gibt es formale Modelle von Computern, wie etwa die TuringMaschine und die Registermaschine, deren Funktionsumfang man genau beschreiben kann. Es ist ein grundlegendes Resultat der theoretischen Informatik,
dass die von einer Turing-Maschine oder –äquivalent dazu– einer Registermaschine berechenbaren Funktionen gerade die µ-rekursiven Funktionen, oder kurz
rekursiven Funktionen (vgl. Definition 1.10), sind; diesen Begriff werden wir uns
in den folgenden Abschnitten erarbeiten.
1 Dieser wird meist als Pseudo-Code bezeichnet, sofern er heuristisch und ohne klar definierte Syntaxregeln (z.B. in einer konkreten Programmiersprache) gegeben ist.
3
1.1
Notationen
Zunächst fixieren wir einige Definitionen. Wir definieren die Menge der natürlichen Zahlen als
N := {0, 1, 2, 3, . . .},
d.h. einschließlich der Zahl 0. Die positiven natürlich Zahlen bezeichnen wir bei
Bedarf mit N+ := N \ {0}.
Der Begriff Funktion wird im folgenden stets eine Abbildung von Nk nach Nl
bezeichnen, wobei k, l ∈ N+ . Wir benutzen dabei die üblichen Verknüpfungen:
Definition 1.1. Wir definieren folgende Verknüpfungen für Funktionen:
1. Sind g1 , . . . , gm : Nk → Nl Funktionen, dann ist (g1 , . . . , gm ) definiert
durch
(g1 , . . . , gm ) : Nk → Nm·l , x̄ 7→ (g1 (x̄), . . . , gm (x̄))
(x̄ ∈ Nk ).
2. Ist f : Nk → Nl und g : Nl → Nq , so ist g ◦ f gegeben durch
g ◦ f : Nk → Nq , (x1 , . . . , xk ) 7→ g(f (x1 , . . . , xk )).
1.2
Primitiv rekursive Funktionen
Definition 1.2. Die folgenden Funktionen heißen primitive Funktionen:
1. Die konstante Funktion c0 : N → N, n 7→ 0,
2. die Nachfolgerfunktion2 s : N → N, n 7→ n + 1,
3. die Projektion auf die i-te Koordinate,
πik : Nk → N, (x1 , . . . , xk ) 7→ xi
für 1 ≤ i ≤ k. Für πik schreiben wir üblicherweise kurz πi , wenn das k aus
dem Kontext heraus eindeutig ist.
Mithilfe der primitiven Funktionen definieren wir nun iterativ die primitiv
rekursiven Funktionen. Eine Funktion ist primitv rekursiv, falls sie aus den primitiven Funktionen durch (wiederholte) Komposition und primitive Rekursion
konstruierbar ist:
Definition 1.3. Die Klasse der primitiv rekursiven Funktionen ist die kleinste
Klasse von Funktionen, für die gilt
1. Jede primitive Funktion ist primitiv rekursiv.
2. (Komposition:) Sind g1 , . . . , gm : Nk → N und f : Nm → N primitiv
rekursiv, dann ist
f ◦ (g1 , . . . , gm )
primitiv rekursiv.
2s
steht für “successor”, engl. Nachfolger
4
3. (Primitive Rekursion:) Sind g : Nk → N und h : Nk+2 → N primitiv
rekursiv, so ist f : Nk+1 → N mit
f (x1 , . . . , xk , 0)
=
g(x1 , . . . , xk ) und
f (x1 , . . . , xk , t + 1)
=
h(t, f (x1 , . . . , xk , t), x1 , . . . , xk ) ∀t ∈ N
primitiv rekursiv.
Beispiel 1.4. Wir werden im folgenden für eine ganze Reihe von Funktionen
zeigen, dass sie primitiv rekursiv sind. Einerseits soll dies einen Eindruck davon
vermitteln, wie mächtig die Klasse der primitiv rekursiven Funktionen ist, andererseits wird sie uns als Repertoire von primitiv rekursiven Funktionen dienen,
auf das wir später öfters zurückgreifen werden.
1. Für jedes k ∈ N ist die konstante Funktion ck : N → N, n 7→ k, primitiv
rekursiv, denn
ck = s| ◦ .{z
. . ◦ s} ◦c0
k-mal
(wobei s die Nachfolgerfunktion ist, vgl. Definition 1.2 (2)).
2. Die Identität auf N ist primitiv rekursiv, denn idN = π11 .
3. Die Addition + : N2 → N, (x, y) 7→ x+y ist primitiv rekursiv, da sie durch
primitive Rekursion aus der Nachfolgerfunktion hervorgeht: x + 0 = x =
idN (x) und
x + (t + 1) = s(x + t) = s ◦ π2 (t, x + t, x)
für alle t ∈ N.
4. Die Vorgängerfunktion3
(
pred : N → N,
0
t+1
7→ 0
7→ t
∀t ∈ N
ist primitiv rekursiv, denn pred(0) = 0 und pred(t+1) = t = π1 (t, pred(t))
für alle t ∈ N.
5. Die beschränkte Subtraktion
(
x−y
· N2 → N, (x, y) 7→ x −
· y :=
−:
0
für x ≥ y
für x < y
ist primitiv rekursiv, da sie durch primitive Rekursion aus der Vorgänger· 0 = x und
funktion hervorgeht: x −
· t, x)
· (t + 1) = pred(x −
· t) = pred ◦ π2 (t, x −
x−
für alle t ∈ N.
(Achtung: Die klassische Subtraktion ist kein Kandidat für eine primitiv
rekursive Funktion, weil sie, auf N2 definiert, den Bildbereich Z hat.)
3 pred
steht für “predecessor”, engl. Vorgänger
5
6. Die Maximums- und Minimumsfunktion max, min : N2 → N sind primitiv
rekursiv, denn
· x) und min(x, y) = x −
· (x −
· y)
max(x, y) = x + (y −
für alle x, y ∈ N.
7. Die (euklidische) Abstandsfunktion auf N, gegeben durch
d : N2 → N, (x, y) 7→ d(x, y) = |y − x|
ist primitiv rekursiv, denn
· y, y −
· x)
|y − x| = max(x −
für alle x, y ∈ N.
8. Sind f, g : Nn → N primitiv rekursiv, so ist
f + g : Nn → N, (x1 , . . . , xn ) 7→ f (x1 , . . . , xn ) + g(x1 , . . . , xn )
primitiv rekursiv, denn f + g = + ◦ (f, g).
9. Die Mulitiplikation · : N2 → N, (x, y) 7→ x · y ist primitiv rekursiv, denn
x · 0 = 0 und
x · (t + 1) = x · t + x = π2 + π3 (t, x · t, x).
10. Die Indikatorfunktion4 der Relation ≤ auf N2 :
(
1
2
1≤ : N → N, (x, y) 7→ 1x≤y :=
0
falls x ≤ y
falls x > y
ist primitiv rekursiv, denn
· x)
1x≤y = min(1, (y + 1) −
für alle x, y ∈ N. Analog kann man einsehen, dass die Indikatorfunktionen
der Relationen <, ≥ und > sowie = und 6= primitiv rekursiv sind.
11. Der Modulo-Operator mod : N2 → N, gegeben durch
(a, b) 7→ (a mod b) := min{k ∈ N | b teilt a − k}
ist primitiv rekursiv, denn (0 mod b) = 0 und
(t + 1 mod b) = ((t mod b) + 1) · 1(t mod b)+16=b .
4 Für eine beliebige Relation R ⊂ Nk ist die Indikatorfunktion definiert als 1
k
R : N →
{0, 1} ⊂ N, x̄ 7→ 1x̄∈R mit 1x̄∈R = 1 ⇔ x̄ ∈ R.
6
12. Für jedes Polynom P ∈ Z[t1 , . . . , tk ] ist die (unsignierte) polynomiale Abbildung
Nk → N, (x1 , . . . , xk ) 7→ |P (x1 , . . . , xk )|
primitiv rekursiv. Dies folgt aus iterativer Anwendung von (8) und (9)
sowie (7).
Wir konstruieren im folgenden eine weitere, für den Rest des Kapitels wesentliche Funktion, nämlich die Cantorsche Paarfunktion. Dies ist eine primitiv
rekursive Bijektion CP : N2 → N, von der wir oft Gebrauch machen werden.
Konstruktion 1.5 (Cantorsche Paarfunktion). Definiere zunächst die Dreiecksfunktion T durch
n · (n + 1)
.
2
Dann existieren für jedes z ∈ N eindeutige Zahlen n, y ∈ N mit
T : N → N, n 7→ 1 + 2 + . . . + n =
z = T (n) + y und y ≤ n.
Setzen wir x := n − y, so gilt x ≥ 0, und es folgt: Für jedes z ∈ N existiert ein
eindeutiges Paar (x, y) ∈ N2 , so dass
z = T (x + y) + y.
Definiere die Funktion
CP : N2 → N, (x, y) 7→ T (x + y) + y.
CP ist also eine Bijektion, und offensichtlich sind T und somit auch CP primitiv
rekursiv.
Weiter definieren wir L, R : N → N implizit durch
z = CP (L(z), R(z)) für alle z ∈ N.
L(z) und R(z) sind also die linke und die rechte Koordinate des eindeutigen
Paares (x, y), das durch CP auf z abgebildet wird. (Explizit könnte man also
die Funktionen durch L := π1 ◦ CP −1 und R := π2 ◦ CP −1 definieren, vgl.
Definition 1.2 (3)).
Abschließend zeigen wir, dass L und R primitiv rekursiv sind. Betrachte die
Hilfsfunktion
h : N → N, n 7→ max{k ∈ N | T (k) ≤ n}.
Dann ist h primitiv rekursiv, denn h(0) = 0 und
h(t + 1) = h(t) + 1T (h(t)+1)≤t+1
für alle t ∈ N. Nun folgt
R(n)
· T (h(n))
= n−
L(n)
· R(n)
= h(n) −
und
· sind primitiv rekursiv (vgl. 1.4 (5)), also auch L und
für alle n ∈ N. T und −
R.
7
Die Cantorsche Paarfunktion CP liefert uns, iterativ angewandt, primitiv
rekursive Bijektionen von Nk nach N für beliebiges k:
Definition 1.6. Sei k ∈ N, k ≥ 2. Definiere die Funktion CPk : Nk → N durch
CP2 := CP und
CPk+1 : Nk+1 → N, (x1 , . . . , xk+1 ) 7→ CPk (x1 , . . . , xk−1 , CP (xk , xk+1 )).
CPk ist offenbar primitiv rekursiv und bijektiv.
1.3
Rekursive Funktionen
Betrachten wir die Funktion f , die eine gegebene natürliche Zahl auf die Position
des ersten Vorkommens ihrer Ziffernfolge in der Dezimaldarstellung der Zahl π
abbildet. So wäre etwa f (415) = 3, denn π = 3, 1415926 . . ., also findet sich
die Ziffernfolge “415” erstmals an Position 3 beginnend. Diese Funktion mag,
verglichen mit den Funktionen aus Beispiel 1.4, ein wenig skurril erscheinen, weil
sie nicht einfach auf arithmetischen Berechnungen natürlicher Zahlen beruht, die
man in einer handlichen Formel zusammenfassen kann.
Dennoch ist f eine wohldefinierte Funktion, die natürliche Zahlen auf natürliche Zahlen abbildet, und die Intuition sagt uns, dass f sicherlich von einem
Computer berechnet werden kann: Es gibt zahlreiche Verfahren, die Zahl π
auf beliebig viele Nachkommastellen genau zu berechnen; ein Algorithmus, der
f (n) berechnen soll, könnte also zukzessive immer mehr Nachkommastellen von
π berechnen und jeweils testen, ob die zuletzt berechneten Ziffern gerade mit
denen von n übereinstimmen.
Ein Computer kann die Funktion f also deshalb berechnen, weil er neben
Arithmetik noch etwas kann: Suchen. Diese Fähigkeit erlaubt es ihm, Funktionen zu berechnen, die nicht primitiv rekursiv sind. Wir müssen also die Klasse
der primitiv rekursiven Funktionen, erweitern, um alle berechenbaren Funktionen zu verstehen.
Allerdings stellt sich hier noch ein weiteres Problem: Es ist keineswegs klar,
ob die Funktion f überhaupt auf ganz N definiert ist, d.h. ob jede endliche
Ziffernfolge in der Dezimaldarstellung von π auftaucht (Es wird gemeinhin angenommen, dass π normal ist, was dieses implizieren würde, ist aber bisher
unbewiesen). D.h. wir können f zwar wie oben definieren, ohne aber zu wissen,
was der Definitionsbereich von f ist.
Falls wir also den oben skizzierten Algorithmus mit einer Eingabe n ins Rennen schicken, deren Dezimaldarstellung nicht in π vorkommt, so würde dieser
offenbar unendlich lange laufen, ohne die Zahl je zu finden und ohne je zu der
Erkenntnis zu gelangen, dass er sie nicht finden wird.
Bei der Klassifikation von berechenbaren Funktionen haben wir es also tatsächlich mit partiellen Funktionen zu tun, die i.a. gar nicht auf ganz Nk definiert
sind:
Definition 1.7. Eine partielle Funktion (von Nk nach Nl ) ist eine Funktion
f : S → Nl für eine Teilmenge S ⊂ Nk . Wir schreiben kurz
f : Nk
8
Nl .
S heißt der Definitionsbereich von f , geschrieben S = Def(f ). Ist Def(f ) = Nk ,
so nennen wir f totale Funktion.
Wir können partielle Funktionen wie gewohnt verknüpfen, müssen dann aber
auf den Definitionsbereich aufpassen:
Definition 1.8. Wir definieren folgende Verknüpfungen für partielle Funktionen:
1. Sind g1 , . . . , gm : Nk
mit
Nl partielle Funktionen, dann ist ḡ := (g1 , . . . , gm )
Def(ḡ) =
m
\
Def(gi )
i=1
gegeben durch
ḡ : Nk
2. Ist f : Nk
Nm·l , x̄ 7→ (g1 (x̄), . . . , gm (x̄))
Nl und g : Nl
(x̄ ∈ Def(ḡ)).
Nq , so ist g ◦ f mit
Def(g ◦ f ) = Def(f ) ∩ f −1 (Def(g))
gegeben durch
g ◦ f : Nk
Nq , (x1 , . . . , xk ) 7→ g(f (x1 , . . . , xk )).
(Man beachte, dass Definition 1.8 im Falle von totalen Funktionen mit Definition 1.1 übereinstimmt, so dass hier keine Mehrdeutigkeiten entstehen.) Insbesondere ist mit diesen Verknüpfungen auch die Komposition von partiellen
Funktionen gemäß Definition 1.3 (2) definiert.
Definition 1.9 (µ-Operator). Sei f : Nk+1
x̄ := (x1 , . . . , xk ) ∈ Nk setze
N eine partielle Funktion. Für
M (x̄) := {n ∈ N | (x̄, l) ∈ Def(f ) ∀ l ≤ n und f (x̄, n) = 0}.
Dann ist µf : Nk
N mit Def(µf ) = {x̄ ∈ Nk | M (x̄) 6= ∅} gegeben durch
µf (x̄) = min(M (x̄))
∀x̄ ∈ Def(µf ).
Definition 1.10. Die Klasse der rekursiven Funktionen ist die kleinste Klasse
N (für beliebiges k ∈ N+ ), die die primitiv
von partiellen Funktionen f : Nk
rekursiven Funktionen enthält und abgeschlossen unter Komposition, primitiver
Rekursion und dem µ-Operator ist.
Beispiel 1.11.
1. Jede Funktion f : Nk
N mit einelementigem Definitionsbereich ist rekursiv: Sei m̄ := (m1 , . . . , mk ) ∈ Nk und f : {m̄} →
N, m̄ 7→ l. Setze
hm̄,l : Nk+1 → N, n̄ 7→ |n̄ − (m1 , . . . , mk , l)|.
Dann ist hm̄,l primitiv rekursiv (dies folgt leicht mithilfe von 1.4 (7)) und
f = µhm̄,l .
9
2. Jede Funktion mit endlichem Definitionsbereich ist rekursiv: Sei
S := {m̄1 , . . . , m̄j } ⊂ Nk
und f : S → N, m̄i 7→ li . Setze
h : Nk+1 → N, n̄ 7→
j
Y
hm̄i ,li (n̄).
i=1
Dann ist h primitiv rekursiv und f = µh.
Wir beenden diesen Abschnitt mit einem klassischen Resultat der theoretischen Informatik, dem Normalformsatz von Kleene (in einer abgeschwächten
Version). Die Definition einer rekursiven Funktion erlaubt es uns, den µ-Operator in beliebiger Verschachtelung zu verwenden, um rekursive Funktionen zu
konstruieren. Der Normalformsatz sagt aber, dass dies gar nicht nötig ist: Jede
rekursive Funktion kann aus primitiv rekursiven Funktionen mit einer einzigen
Anwendung des µ-Operators konstruiert werden. Wir verzichten an dieser Stelle
auf einen Beweis.
Satz 1.12 (Normalformsatz von Kleene). Sei f : Nk
N eine rekursive Funktion. Dann existieren primitiv rekursive Funktionen h : Nk+1 → N und u : N → N,
so dass gilt
f = u ◦ µh.
1.4
Rekursiv aufzählbare und rekursive Mengen
Zwei für die weiteren Kapitel zentrale Begriffe, den uns die Theorie der rekursiven Funktionen liefert, sind die Begriffe der rekursiven bzw. rekursiv aufzählbaren
Mengen. Wir wollen zunächst diese Begriffe definieren:
Definition 1.13. Eine Menge S ⊂ Nk heißt rekursiv, wenn ihre Indikatorfunktion 1S rekursiv ist.
Eine Menge S ist also rekursiv, wenn es einen Algorithmus gibt, der bei
Eingabe von x̄ ∈ Nk entscheidet, ob x̄ ∈ S. Eine Menge ist rekursiv aufzählbar,
wenn es einen Algorithmus gibt, der eine Liste aller Elemente in S generiert. Es
folgt leicht aus den Definitionen (und ist auch gut anschaulich nachzuvollziehen),
dass jede rekursive Menge rekursiv aufzählbar ist. Es ist aber weit weniger klar,
ob jede rekursiv aufzählbare Menge auch rekursiv ist. Die Antwort hierauf lautet
Nein.
Wir werden in diesem Abschnitt sehen, dass die Menge S genau dann rekursiv ist, wenn S und N \ S rekursiv aufzählbar ist. Dies zeigt noch nicht, dass
rekursiv aufzählbare Mengen i.a. nicht rekursiv sind, denn die Existenz einer
reskursiv aufzählbaren Menge S, für die N \ S nicht rekursiv aufzählbar ist,
ist keineswegs trivial. Eine solche Menge werden wir in Abschnitt 1.5 explizit
konstruieren.
10
Definition 1.14. Eine Menge S ⊂ Nk heißt rekursiv aufzählbar, wenn eine
partiell rekursive Funktion f : Nk
N mit Def(f ) = S existiert.
Lemma 1.15. Eine Funktion f : Nk
N ist genau dann rekursiv, wenn ihr
Graph
Γf := {(x̄, f (x̄)) | x̄ ∈ Def(f )} ⊂ Nk+1
rekursiv aufzählbar ist.
Beweis. Sei zunächst f : Nk
h : Nk+2
N rekursiv. Setze
N, (x1 , . . . , xk+2 ) 7→ |f (x1 , . . . , xk ) − xk+1 |.
Dann ist Def(µh) = Γf .
Sei andersherum Γf rekursiv aufzählbar, d.h. es existiert eine rekursive Funktion g : Nk+1
N mit Def(g) = Γf . Seien (gemäß Satz 1.12) u : N → N und
h : Nk+2 → N primitiv rekursiv mit g = u ◦ µh. Setze die Funktion
q : Nk+1
N, (x1 , . . . , xk , n) 7→ h(x1 , . . . , xk , L(n), R(n)).
Dann ist q rekursiv und f = u ◦ L ◦ µq.
Satz 1.16. Eine Menge S ⊂ Nk ist genau dann rekursiv, wenn S und Nk \ S
rekursiv aufzählbar sind.
Beweis. Seien zunächst S und S̄ := Nk \S rekursiv aufzählbar. Es existieren also
rekursive Funktionen f, f¯ : Nk → N mit Bild(f ) = S und Bild(f¯) = S̄. Setze
f 0 := c1 ◦ f , f¯0 := c0 ◦ f¯. Dann sind f 0 , f¯0 rekursiv (vgl. Beispiel 1.4 (1)), also
sind nach Lemma 1.15 die Graphen Γf 0 und Γf¯0 rekursiv aufzählbar. Dann ist
auch Γ := Γf 0 ∪ Γf¯0 rekursiv aufzählbar (vgl. Übungsblatt1, Aufgabe 2.2). Nun
ist Γ gerade der Graph der Indikatorfunktion 1S . Wiederum nach Aufgabe 2.4
ist also 1S und somit S rekursiv.
Sei nun andersherum 1S rekursiv. Dann ist für S̄ = Nk \ S auch 1S̄ rekursiv,
k
· 1
denn 1x̄∈S = 1 −
x̄∈S̄ für alle x̄ ∈ N . Setze
h : Nk+1 → N, (x̄, n) 7→ 1S̄ (x̄).
Dann ist h rekursiv und Def(µh) = S. Dies zeigt, dass S rekursiv aufzählbar
ist. Das gleiche Argument, angewandt auf S̄, zeigt, dass S̄ rekursiv aufzählbar
ist.
1.5
Diophantische Mengen und Funktionen
Für alle weiteren Betrachtungen bzgl. Berechenbarkeit in dieser Vorlesung spielen diophantische Mengen und Funktionen eine zentrale Rolle. Eine diophantische Menge ist eine Teilmenge von Nk , die auf bestimmte Weise durch ein ganzzahliges Polynom vollständig charakterisiert wird. Eine Funktion heißt dann diophantisch, wenn ihr Graph eine diophantische Menge ist. Ein wesentliches –aber
11
keineswegs triviales– Resultat ist, dass eine Funktion genau dann diophantisch
ist, wenn sie rekursiv ist. Das Konzept der diophantischen Funktionen liefert
also eine alternative Klassifikation der rekursiven Funktionen; diese Erkenntnis
wird uns ein sehr hilfreiches und mächtiges Werkzeug in die Hand geben, um
Berechenbarkeitsprobleme in Gruppen in Angriff zu nehmen.
Den Beweis dieser Äquivalenz erbrachte zunächst Yuri Matyasevich 1970 im
Zuge seines Beweises der Unentscheidbarkeit von Hilberts zehntem Problem 5 .
Ziel dieses Abschnittes ist es, den Beweis dieser Äquivalenz zu skizzieren; wir
folgen dabei der Arbeit von Martin Davis ([D]), die einen gegenüber Matyasevich
leicht abgewandelten Beweis liefert.
Wir beginnen mit einer Definition. Eine Menge S ⊂ Nk ist diophantisch,
wenn sie genau aus allen Präfizes aller Nullstellen eines ganzzahligen Polynoms
besteht:
Definition 1.17. Eine Menge S ⊂ Nk heißt diophantisch, wenn ein Polynom
PS ∈ Z[t1 , . . . , tn ] (mit n ≥ k) existiert, so dass gilt: (x1 , . . . , xk ) ∈ S genau
dann, wenn y1 , . . . , yn−k ∈ N existieren, so dass
PS (x1 , . . . , xk , y1 , . . . , yn−k ) = 0.
Wir sagen in diesem Fall, dass das Polynom PS die Menge S charakterisiert.
Man beachte aber, dass PS natürlich keineswegs eindeutig bestimmt ist.
Bemerkung 1.18. Dass das charakterisierende Polynom aus dem Polynomring
über Z stammt, also negative Koeffizienten haben kann, ist hier wesentlich;
ein charakterisierendes Polynom mit ausschließlich positiven Koeffizienten zu
wählen ist im allgemeinen nicht möglich. Alternativ kann man aber eine diophantische Menge mit zwei Polynomen mit positiven Koeffizienten charakterisieren: Stellen wir PS dar als
PS = P+ − P − ,
wobei P+ die Summe aller Monome aus PS mit positiven Koeffizienten und
−P− die Summe aller Monome mit negativen Koeffizienten ist, so können wir
S beschreiben als
S = {x̄ ∈ Nk | ∃ȳ ∈ Nn−k : P+ (x̄, ȳ) = P− (x̄, ȳ)}.
(1.1)
Diese Charakterisierung wird ebenfalls nützlich sein.
Eine diophantische Menge S ∈ Nk ist also sehr leicht zu beschreiben, weil sie
durch ein charakterisierendes Polynom vollständig definiert ist. Die erste Frage,
die nun auftaucht, ist, welche Mengen diophantisch sind. Wir fangen mit einigen
Beispielen diophantischer Mengen an:
Beispiel 1.19.
1. Nk ist diophantisch; wähle etwa PNk = 0.
5 Hilberts zehntes Problem lautet: “Gibt es einen Algorithmus, der entscheidet, ob ein
gegebenes ganzzahliges Polynom P in n Variablen eine Nullstelle in Zn hat?”
12
2. Die leere Menge ist diophantisch; wähle etwa P∅ = 1.
3. S := {(x, y) ∈ N2 | x < y} ist diophantisch, denn
x < y ⇔ ∃z ∈ N : x − y + z + 1 = 0
für alle x, y ∈ N. (Wähle also PS = t1 − t2 + t3 + 1.)
4. S := {(x, y) ∈ N2 | x ≤ y} ist diophantisch, denn
x ≤ y ⇔ ∃z ∈ N : x − y + z = 0.
Wir zeigen nun einige Eigenschaften diophantischer Mengen, von denen wir
danach häufig und implizit Gebrauch machen werden.
Lemma 1.20. Seien S, T ⊂ Nk diophantisch. Dann gilt
1. S ∩ T ist diophantisch.
2. S ∪ T ist diophantisch.
3. Ist π = (π1k , . . . , πlk ) die Projektion auf die ersten l Koordinaten, so ist
π(S) ⊂ Nl diophantisch.
Beweis. Wir zeigen zunächst (1):
Ist etwa PS ∈ Z[t1 , . . . , tm ] und PT ∈ Z[t1 , . . . , tn ], dann setze l = m + n − k
und wähle PS∩T ∈ Z[t1 , . . . , tl ],
(x1 , . . . , xl ) 7→ PS (x1 , . . . , xm )2 + PT (x1 , . . . , xk , xm+1 , . . . , xl )2 .
PS∩T charakterieisert offenbar S ∩ T .
Sind nun PS , PT und l wie oben, dann ist PS∪T ∈ Z[t1 , . . . , tl ],
(x1 , . . . , xl ) 7→ PS (x1 , . . . , xm ) · PT (x1 , . . . , xk , xm+1 , . . . , xl ),
ein charakerisierendes Polynom für S ∪ T . Dies zeigt (2).
Aussage (3) ist trivial; jedes Polynom, das S charakterisiert, charakterisiert
auch π(S).
Wir behandeln im folgenden ein weiteres Lemma, das es uns erlauben wird,
bei der Charakterisierung diophantischer Mengen mit beschränkten Quantoren
(∃y)≤x und (∀y)≤x zu arbeiten. Ist A(x) ein beliebiges Prädikat (also ein Ausdruck, der für x entweder wahr oder falsch ist), dann bedeutet (∃y)≤x : A(y)
gerade
∃y ∈ N : y ≤ x ∧ A(y).
Analog ist (∀y)≤x : A(y) gerade gleichbedeutend mit
∀y ∈ N : y > x ∨ A(y).
Der Beweis von Teil 2 des nachfolgenden Lemmas ist recht technisch (und deutlich schwerer als der Beweis von Teil 1). Wir werden im Kontext dieses Skriptes
auf den Beweis verzichten und verweisen hierfür auf [D].
13
Lemma 1.21. Sei P ∈ Z[t1 , . . . , tn ] und k < n sowie l := n − k. Dann gilt
1. R := {(x1 , . . . , xk ) | (∃y1 )≤x1 ∃y2 , . . . , yl : P (x1 , . . . , xk , y1 , . . . , yl ) = 0} ist
diophantisch.
2. S := {(x1 , . . . , xk ) | (∀y1 )≤x1 ∃y2 , . . . , yl : P (x1 , . . . , xk , y1 , . . . , yl ) = 0} ist
diophantisch.
Beweis. Der Beweis von (1) ist leicht; es gilt
R = {(x1 , . . . , xk ) | (∃y1 , y2 , . . . , yl : y1 ≤ x1 ∧ P (x1 , . . . , xk , y1 , . . . , yl ) = 0}.
Die Aussage folgt also aus Beispiel 1.19 (4) und Lemma 1.20 (1). Für den Beweis
von (2) siehe [D], Theorem 5.1.
Definition 1.22. Eine partielle Funktion f : Nk
ihr Graph
N heißt diophantisch, wenn
Γf := {(x1 , . . . , xk , f (x1 , . . . , xk )) | (x1 , . . . , xk ) ∈ Def(f )} ⊂ Nk+1
diophantisch ist. Wir sagen kurz, dass ein Polynom P die Funktion f charakterisiert, wenn P den Graphen Γf charakterisiert.
Beispiel 1.23.
tisch, denn
1. Die konstante Funktion c0 : Nk → N, x̄ 7→ 0 ist diophany = c0 (x̄) ⇔ y = 0
∀x̄ ∈ Nk , y ∈ N.
2. Die Nachfolgerfunktion s : N → N, x 7→ x + 1 ist diophantisch, denn
y = s(x) ⇔ y − x − 1 = 0
∀x, y ∈ N.
3. Die Projektion πik ist diophantisch, denn
y = πik (x1 , . . . , xk ) ⇔ y − xi = 0
∀x1 , . . . , xk , y ∈ N.
Weitere, wichtige Beispiele für diophantische Funktionen liefert das folgende
Lemma.
Lemma 1.24. Die Funktionen CP , L und R aus Konstruktion 1.5 sind diophantisch.
Beweis. Seien x, y ∈ N. Setzen wir n := x + y, so folgt unter Berücksichtigung,
dass 2T (n) = n · (n + 1), für alle z ∈ N
z = CP (x, y) ⇔ (x + y)(x + y + 1) + 2y − 2z = 0.
Dies zeigt, dass CP diophantisch ist. Dass L und R diophantisch sind, folgt
daraus, dass
x = L(n) ⇔
∃y ∈ N : CP (x, y) = n
x = R(n) ⇔
∃y ∈ N : CP (y, x) = n
14
bzw.
Nun kommen wir zu einer universellen Konstruktion, die eine sehr zentrale
Rolle spielen wird. Wir konstruieren eine diophantische (und rekursive) Funktion
S : N2 → N, für die gilt: Für jede endliche Sequenz von Zahlen a1 , . . . , an ∈ N
existiert ein u ∈ N, so dass S(i, u) = ai für i = 1, . . . , n. Stellt man sich die
Funktion also als eine unendliche Wertetabelle vor, in der in der i-ten Zeile und
u-ten Spalte die Zahl S(i, u) eingetragen ist, so findet man für jede beliebige
(und beliebig lange) endliche Sequenz von Zahlen a1 , . . . , an ∈ N eine Spalte
in der Tabelle, deren erste n Einträge gerade die Zahlen a1 , . . . , an sind (sofern
man die 0-te Zeile ignoriert; S(0, u) wird immer 0 sein). Dies wird es uns später
erlauben, eine beliebige endliche Sequenz mit einer einzigen Zahl zu kodieren.
Konstruktion 1.25 (Sequenzfunktion S). Die Definition von S ist einfach;
etwas Arbeit macht es aber, die gewünschten Eigenschaften von S zu verifizieren.
Seien u, i ∈ N. Die Division mit Rest der Zahl L(u) durch die Zahl 1 + iR(u)
liefert eindeutige Zahlen k, r ∈ N mit 0 ≤ r < 1 + iR(u) und
L(u) = k · (1 + iR(u)) + r.
Setze
S(i, u) := r.
S ist also gerade (L(u) mod 1 + iR(u)) (vgl. Beispiel 1.4 (11)), und damit insbesondere rekursiv.
Zunächst zeigen wir, dass S diophantisch ist: Es gilt, dass r = S(i, u) genau
dann, wenn das folgende Gleichungssystem mit den Variablen x, y, z, v
(x + y)(x + y + 1) + 2y − 2u =
0
(1.2)
r + z · (1 + iy) − x =
0
(1.3)
0
(1.4)
r + v + 1 − (1 + iy)
=
eine Lösung hat: Aus (1.2) folgt, dass x = L(u) und y = R(u). Aus (1.3)
folgt dann, dass L(u) ≡ r mod 1 + iy, und aus (1.4) folgt schließlich, dass
r < 1 + iR(u).
Bezeichnen wir die drei obigen Polynome mit
P1 , P2 , P3 ∈ Z[u, i, r, x, y, z, v],
so ist P12 + P22 + P32 ein charakterisierendes Polynom für den Graphen
{(i, u, S(i, u))|i, u ∈ N}
und somit für S. Also ist S diophantisch.
Seien nun a1 , . . . , an ∈ N beliebig. Wir zeigen, dass ein u ∈ N existiert, so
dass S(i, u) = ai für i = 1, . . . , Q
n. Wähle y ∈ N, so dass gilt ai < y und i | y für
i = 1, . . . , n (also z.B. y := n! · ai ).
Dann sind die Zahlen 1+y, 1+2y, . . . , 1+ny paarweise teilerfremd: Ist d ∈ N
mit d | 1 + iy, d | 1 + jy, i < j, so folgt
d | (j · (1 + iy) − i · (1 + jy)), also d | j − i.
15
Somit folgt d ≤ n, also d | y und somit d | iy, es folgt d - iy + 1, im Widerspruch
zur Annahme.
Nach dem aus der Algebra bekannten Chinesischen Restsatz existiert nun
ein x ∈ N, so dass gilt
x ≡ ai
mod 1 + iy
für i = 1, . . . , n.
Wähle u := CP −1 (x, y). Dann gilt also L(u) = x, R(u) = y und somit
ai ≡ L(u)
mod 1 + iR(u)
und ai < R(u) < 1 + iR(u). Also folgt ai = S(i, u).
Nun haben wir alle nötigen Hilfsmittel erarbeitet, um den Hauptsatz dieses
Abschnitts beweisen:
Satz 1.26. Eine partielle Funktion f : Nk
wenn sie rekursiv ist.
N ist genau dann diophantisch,
Beweis. Sei zunächst f diophantisch. Dann existiert nach Definition ein Polynom P ∈ Z[t1 , . . . , tn ] (n > k), so dass
y = f (x1 , . . . , xk ) ⇔ ∃ȳ = (y1 , . . . , yl ) : P (x1 , . . . , xk , y, ȳ) = 0
(mit l := n − k − 1).
Betrachte die Funktion
h : Nk+1
−1
N, (x̄, n) 7→ P (x̄, CPl+1
(n))
(vgl. Definition 1.6). Dann ist h rekursiv und f = π1 ◦ µh. Somit ist f rekursiv.
Es bleibt zu zeigen, dass jede rekursive Funktion diophantisch ist. Nach Beispiel 1.23 sind alle primitiven Funktionen diophantisch. Es genügt also zu zeigen,
dass die Klasse der diophantischen Funktionen abgeschlossen unter Komposition, primitiver Rekursion und dem µ-Operator ist. Dies zeigen wir im einzelnen,
unter regem Gebrauch der Lemmata 1.20 und 1.21:
• Komposition: Seien g1 , . . . , gm : Nk
und f = h ◦ (g1 , . . . , gm ). Dann gilt
y = f (x1 , . . . , xk ) ⇔
N und h : Nm
N diophantisch
∃t1 , . . . , tm :
t1 = g1 (x1 , . . . , xk )
..
.
∧ tm = gm (x1 , . . . , xk )
∧ y = h(t1 , . . . , tm ).
16
• Primitive Rekursion: Seien f, g und h wie in Definition 1.3 (3) und g
und h diophantisch. Wir nutzen wieder Konstruktion 1.25: Für x̄ ∈ Nk
und z ∈ N existiert ein u ∈ N mit
S(i, u) = f (x̄, i − 1) für 1 ≤ i ≤ z.
Also gilt:
y = f (x̄, z) ⇔
∃u ∈ N :
S(1, u) = g(x̄)
∧ (∀t)≤z : S(t + 1, u) = h(t, S(t, u), x̄)
∧ y = S(z + 1, u).
• µ-Operator: Sei f : Nk+1
y = µf (x̄) ⇔
N diophantisch. Dann gilt
f (x̄, y) = 0
∧ (∀t)≤y (t = y ∨ f (x̄, t) > 0).
Im letzten Teil dieses Kapitels konstruieren wir eine Teilmenge V ⊂ N, für
die gilt, dass V diophantisch, aber N \ V nicht diophantisch ist. Die Existenz
einer solchen Menge ist zentral für die Konstruktion von Gruppen mit unentscheidbaren Eigenschaften, wie wir sie im folgenden Kapitel machen wollen.
Konstruktion 1.27. Wir fixieren die Menge von Variablen
X := {t0 , t1 , t2 , t3 , . . .}
und konstruieren zunächst eine explizite Aufzählung aller Polynome mit Variablen aus X und nicht-negativen Koeffizienten: Setze dazu P0 := 0, P1 := 1 und
für alle i ∈ N+
P3i−1 := ti−1 ,
P3i
:= PL(i) + PR(i) ,
P3i+1 := PL(i) · PR(i) .
Die Folge (Pn )n∈N enthält alle Polynome in Variablen aus X, wie man leicht
(etwa per Induktion über den Grad) einsehen kann (die Pi sind natürlich nicht
paarweise verschieden; dies spielt aber weiter keine Rolle). Weiter ist jedes Pn
ein Polynom in (höchstens) den Variablen t0 , . . . , tn , wie man induktiv einsieht.
Für n ∈ N sei nun
Dn := {x ∈ N | ∃x1 , . . . , xn ∈ N : PL(n) − PR(n) (x, x1 , . . . , xn ) = 0}.
Dann ist jedes Dn diophantisch (vgl. (1.1)), und somit ist (Dn )n∈N eine Liste
aller diophantischen Mengen.
Die folgenden beiden Theoreme beweisen die Existenz der oben angesprochenen Menge V ⊂ N und beschließen dieses Kapitel.
17
Satz 1.28. Die Menge
V := {n ∈ N | n ∈ Dn }
ist diophantisch.
Beweis. Sei n ∈ N. Ist n ∈ Dn , dann existiert x̄ := (x1 , . . . , xn ) ∈ Nn , so dass
PL(n) (n, x̄)) = PR(n) (n, x̄)). Weiter existiert nach Kontruktion 1.25 ein u ∈ N,
so dass S(i, u) = Pi (n, x̄) für i = 1, . . . , 3n + 1. Daraus ergibt sich
n ∈ Dn
⇔
∃u ∈ N :
S(1, u) = 1 ∧ S(2, u) = n
∧ ∀i≤n S(3i, u) = S(L(i), u) + S(R(i), u)
∧ ∀i≤n S(3i + 1, u) = S(L(i), u) · S(R(i), u)
∧ S(L(n), u) = S(R(n), u).
Dies zeigt die Behauptung.
Satz 1.29. Die Menge
V̄ := {n ∈ N | n ∈
/ Dn }
ist nicht diophantisch.
Beweis. Es gilt nach Definition für alle n ∈ N
n ∈ V̄ ⇔ n ∈
/ Dn ,
also V̄ 6= Dn . Da die Folge (Dn )n∈N alle diophantischen Teilmengen von N
enthält, folgt die Behauptung.
Wir beschließen diesen Abschnitt mit der Schlussfolgerung, dass Hilberts
Zehntes Problem keine Lösung besitzt. Dieses zehnte auf der Liste der 23 von
David Hilbert 1900 vorgestellten Probleme lautet: “Man gebe ein Verfahren an,
das für ein beliebiges ganzzahliges Polynom entscheidet, ob es eine ganzzahlige
Nullstelle besitzt.”
Wie wir sehen werden, ist es eine Konsequenz der Ergebnisse dieses Abschnittes, dass es keinen Algorithmus gibt, der für ein beliebiges Polynom P ∈
Z[t1 , . . . , tk ] entscheidet, ob P eine Nullstelle mit nicht-negativen Koeffizienten,
d.h. in Nk , besitzt. Man kann wie folgt einsehen, dass dies die Unentscheidbarkeit für beliebige Nullstellen (nach denen Hilbert fragt) impliziert: Nach einem
bekannten Resultat von Lagrange ist jede nicht-negative ganze Zahl als Summe
von 4 Quadraten darstellbar. Betrachten wir das Polynom P 0 , das wir erhalten,
wenn wir in P jedes Vorkommen von ti durch das Polynom t2i,1 + t2i,2 + t2i,3 + t2i,4
ersetzen, so gilt: P 0 hat eine Nullstelle in Z4k genau dann, wenn P eine Nullstelle
in Nk besitzt.
Somit folgt aus den Ergebnissen dieses Abschnittes unmittelbar:
Korollar 1.30. Hilberts Zehntes Problem ist unlösbar.
18
Beweis. Für n ∈ N sei Qn := PL(n) − PR(n) (n) ∈ Z[t1 , . . . , tn ]. Qn ist also
dasjenige Polynom, das man durch Einsetzen von n für t0 im Polynom PL(n) −
PR(n) erhält. Dann gilt offenbar
Qn hat eine Nullstelle in Nn ⇔ n ∈ V.
Ein Algorithmus gemäß Hilberts Zehntem Problem, der für ein gegebenes
Polynom entscheidet, ob es eine Nullstelle besitzt, wäre also hinreichend, um
die Indikatorfunktion 1V zu berechnen. Es folgt aber aus den Sätzen 1.28, 1.29
und 1.26, dass V , und somit 1V , nicht rekursiv ist. Ein Widerspruch.
1.6
Rekursivität auf N∗
Unter einer rekursiven Funktion haben wir in diesem Kapitel bislang stets eine
Funktion von Nk nach N (für festes k) verstanden. Vor dem Hintergrund, dass
rekursive Funktionen gerade die von einem Computer berechenbaren Funktionen
sind, bedeutet dies, dass jeder Algorithmus eine feste Anzahl (k) von natürlichen
Zahlen als Input und eine einzige natürliche Zahl als Ouput hat. Natürlich
sind wir es von einem Computer gewöhnt, dass er viel mehr kann als nur mit
natürlichen Zahlen zu rechnen; dennoch ist diese Charakterisierung rekursiver
Funktionen als Funktionen natürlicher Zahlen durchaus legitim: Die Daten, die
ein Computer speichern und verarbeiten kann, sind immer Binärdaten, die sich
als natürliche Zahlen interpretieren lassen.
Wenn ein Computer mit anderen Typen von Daten umgeht (Fließkommazahlen, Texte, Fotos, . . . ), so steckt nichts anderes dahinter als eine andere Interpretation der Binärzahlen, die vom Computer verarbeitet werden. Anders ausgedrückt, findet hier also eine Identifikation bestimmter Daten mit natürlichen
Zahlen statt, die es dem Computer ermöglicht, Berechnungen auf jenen Daten
durchzuführen. Somit sollte die Theorie, die wir bisher erarbeitet haben, ausreichen, um rekursive Funktionen für beliebige Datenmengen zu formalisieren;
alles, was wir tun müssen, ist, die Daten auf geeignete Weise mit natürlichen
Zahlen zu identifizieren.
In diesem Abschnitt wollen wir zwar noch nicht die natürlichen Zahlen verlassen, aber wir wollen den Begriff der rekursiven Funktionen dahingehend verallgemeinern, dass die Funktionen eine variable Anzahl von Zahlen als Input
erlaubt (genauer: ein Element aus Nk für beliebiges k) und ggf. auch nicht nur
eine Zahl, sondern ein Tupel von Zahlen ausgibt. Wir betrachten also Funktionen, deren Definitionsbereich
[
N∗ :=
Nk
k∈N+
ist (oder eine Teilmenge von N∗ im Falle partieller Funktionen). Dies tun wir, indem wir eine Bijektion zwischen N∗ und N festlegen, die jedes Tupel (n1 , . . . , nk )
eindeutig mit einer natürlichen Zahl identifiziert:
Definition & Lemma 1.31. Die Abbildung CP∗ : N∗ → N wird definiert durch
(n1 , . . . , nk ) 7→ CP (k, CPk (n1 , . . . , nk )).
19
CP∗ ist eine Bijektion, die Umkehrfunktion ist gegeben durch
−1
CP∗−1 (n) = CPL(n)
(R(n)).
Die Idee ist nun klar: Wollen wir eine (partielle) Funktion f : N∗
N algorithmisch berechnen, so übergeben wir statt dem Inputvektor (n1 , . . . , nk )
das Bild n = CP∗ (n1 , . . . , nk ). Dies enthält alle Informationen, um daraus
(n1 , . . . , nk ) = CP∗−1 (n) zu extrahieren und dann f (n1 , . . . , nk ) zu berechnen;
auf formaler Ebene haben wir es nun aber mit einer Funktion von N nach N zu
tun. Dies motiviert die folgenden Definitionen.
Definition 1.32. Eine Funktion f : N∗
N heißt rekursiv, falls die Funktion
f ◦ CP∗−1 : N
N
rekursiv ist.
Wir werden nun einige Beispiele für rekursive Funktionen geben:
Beispiel 1.33. Die folgenden Funktionen sind rekursiv. Der Beweis ist Übungsaufgabe 8.1.
1. Die Längenfunktion l : N∗ → N, (n1 , . . . , nk ) 7→ k ist rekursiv, denn
l ◦ CP∗−1 (n) = L(n)
für alle n ∈ N.
P
Pk
2.
: N∗ → N, (n1 , . . . , nk ) 7→ i=1 ni .
3. max : N∗ → N, (n1 , . . . , nk ) 7→ max{n1 , . . . , nk }.
4. πj∗ : N∗
N, (n1 , . . . , nk ) 7→ nj mit Def(πj∗ ) = {n̄ ∈ N∗ | l(n̄) ≥ j}.
Ebenso wie den Begriff der rekursiven Funktionen können wir den Begriff
der rekursiven Mengen auf Teilmengen S ⊂ N∗ verallgemeinern, indem wir sie
mit Mengen natürlicher Zahlen identifizieren.
Definition 1.34. Eine Menge S ⊂ N∗ heißt
• rekursiv, falls CP∗ (S) ⊂ N rekursiv ist,
• rekursiv aufzählbar, falls CP∗ (S) ⊂ N rekursiv aufzählbar ist.
Bemerkung 1.35. An dieser Stelle sei bemerkt, dass wir im Falle einer Teilmenge S ⊂ Nk ⊂ N∗ zwei scheinbar konkurrierende Definitionen der Eigenschaft
rekursiv bzw. rekursiv aufzählbar (1.13 bzw. 1.14 und 1.34). Es ist aber leicht
einzusehen, dass die Definitionen äquivalent sind, weil die Funktion CP∗ |Nk offenbar rekursiv ist.
20
2
Gruppen und Gruppenpräsentierungen
Wir wissen aus dem Grundstudium, was eine Gruppe ist. Die zentrale Frage,
die uns zunächst beschäftigt, ist, wie wir nun eine Gruppe einem Diskussionspartner, bzw. einem Computer, beschreiben können. Welche Informationen sind
also nötig, um eine Gruppe zu verstehen?
Ist die Gruppe G endlich, so ist es nicht allzu schwer, sie zu beschreiben:
Man liefert eine Liste aller Elemente von G und beschreibt, etwa durch eine
Gruppentafel, was das Produkt zweier beliebiger Gruppenelemente ergibt. Ist
die Gruppe unendlich –und das ist für uns der interessantere Fall–, ist die Lage
schon schwieriger.
Der Ansatz, den wir verfolgen, ist, dem Zuhörer zunächst ein Erzeugendensystem zu liefern. Ähnlich einem Erzeugendensystem eines Vektorraumes, aus
dem alle Vektoren als Linearkombinationen dargestellt werden können, ist ein
Erzeugendensystem einer Gruppe ein Tupel S von Gruppenelementen, für die
gilt, dass jedes Element aus G Produkt von Elementen aus S und deren Inversen
ist. Jedes Element g ∈ G kann also als Produkt
±1
g = s±1
1 · . . . · sn
mit si ∈ S dargestellt werden.
Allerdings sind im allgemeinen diese Produkte nicht alle verschieden. Ist
etwa G eine abelsche Gruppe und (a, b) ein Erzeugendensystem, so gilt a · b =
b · a, was in beliebigen Gruppen natürlich i.a. falsch ist. Wir müssen also die
Multiplikation der Gruppe noch explizit beschreiben. Wie wir das tun, werden
wir in den nächsten beiden Abschnitten erarbeiten.
2.1
Freie Gruppen
Definition 2.1. Sei F eine Gruppe und X ⊂ F eine Teilmenge. Dann heißt F
frei über X, falls F folgende universelle Eigenschaft besitzt: Für jede Gruppe
G und jede Abbildung f : F → G existiert ein eindeutiger Homomorphismus
ϕ : F → G mit ϕ|X = f .
Ist, wie oben, ϕ ein Homomorphismus und f die Einschränkung von ϕ auf
eine Teilmenge des Definitionsbereiches, so nennen wir andersherum ϕ eine Fortsetzung von f . F ist also frei über X, wenn sich jede Abbildung von X in eine
Gruppe H eindeutig (zu einem Homomoprhismus) auf F (X) fortsetzen lässt.
Wir nennen eine Gruppe F kurz frei, wenn sie frei über einer Teilmenge X ist.
X heißt dann Basis von F .
Die Idee ist nun folgende: Sei G eine Gruppe und X ein Erzeugendensystem
von G. Vorbehaltlich der Tatsache, dass wir freie Gruppen leicht konstruieren
bzw. verstehen können, können wir nun G wie in Definition 2.1 dadurch beschreiben, dass wir den eindeutigen (surjektiven) Homomorphismus ϕ von einer
über X freien Gruppe F nach G beschreiben, der X auf X abbildet.
Man beachte aber, dass Definition 2.1 nicht konstruktiv ist; es ist also bisher
nicht klar, ob bzw. für welche X überhaupt freie Gruppen über X existieren. Um
21
diese Frage zu beantworten, werden wir im folgenden für eine gegebene Menge X
eine über X freie Gruppe konstruieren. Zunächst können wir aber unmittelbar
aus Definition 2.1 folgern, dass es für jede Menge X bis auf Isomorphie nur eine
freie Gruppe über X geben kann:
Lemma 2.2. Seien G, G0 Gruppen, G frei über X, G0 frei über X 0 und f :
X → X 0 eine Bijektion. Dann sind G und G0 isomorph.
Beweis. Nach Definition existieren eindeutige Homomorphismen ϕ : G → G0
und ϕ0 : G0 → G, so dass ϕ|X = f und ϕ0 |X 0 = f −1 . Es folgt ϕ0 ◦ ϕ = idG ,
denn idG ist der nach Definition 2.1 eindeutige Homomorphismus von G nach
G mit idG |X = idX . Ebenso folgt ϕ ◦ ϕ0 = idG0 . Somit ist ϕ0 = ϕ−1 und ϕ ein
Isomorphismus.
Nun konstruieren wir eine freie Gruppe:
Sei X eine Menge. Ein Wort in X ist ein Tupel (x1 , . . . , xk ) ∈ X k , für
beliebigs k ∈ N+ . Wir schreiben ein Wort w im Kontext dieser Vorlesung als
Produkt
w = x1 · · · xk .
Dann ist X ∗ := {x1 · · · xr | r ∈ N, xi ∈ X} die Menge aller Wörter über X.
Das leere Wort (r = 0) bezeichnen wir mit 1. Auf der Menge X ∗ definieren wir
die Verknüpfung · durch Konkatenation wie folgt:
· : X ∗ × X ∗ → X ∗ , (x1 · · · xr ) · (y1 · · · ys ) = x1 · · · xr y1 · · · ys
(2.1)
Definition 2.3. Sei X eine Menge. Dann ist (X ∗ , ·) mit der in (2.1) definierten
Multiplikation ein Monoid. Wir nennen (X ∗ , ·) den freien Monoid über X.
Bemerkung 2.4. Der Begriff frei in Definition 2.3 ist genauso motiviert wie bei
der freien Gruppe: Ein Monoid ist genau dann frei (d.h. isomorph zum oben
konstruierten freien Monoid, für geeignetes X), wenn er die zu Definition 2.1
analoge universelle Eigenschaft für Monoide besitzt. Wir ersparen uns aber, dies
als Definition zu verwenden, weil wir davon (explizit) keinen weiteren Gebrauch
machen werden.
Sei im folgenden X eine Menge. Wir definieren X −1 als eine von X disjunkte
Menge formaler Inverser, X −1 := {x−1 | x ∈ X}. Nun setzen wir X̃ := X ∪X −1 .
−1
Weiter setzen wir x−1
:= x. Somit wird −1 zu einer fixpunktfreien Involution
auf X̃.
Auf der Menge X̃ ∗ definieren wir nun die freie Äquivalenz wie folgt: Zwei
Wörter w und w0 heißen zunächst elementar äquivalent, falls u, v ∈ X̃ ∗ und
x ∈ X̃ existieren, so dass w = uv und w0 = uxx−1 v. Die freie Äquivalenz
ist nun die von der elementaren Äquivalenz erzeugte Äquivalenzrelation, wir
bezeichnen sie mit ∼ und die Äquivalenzklasse von w ∈ X̃ ∗ mit [w] (später
werden wir die eckigen Klammern oft einfach weglassen, sofern der Kontext es
erlaubt).
22
Definition & Lemma 2.5. Sei X eine Menge. Setze
F (X) := X̃ ∗ / ∼,
wobei ∼ die freie Äquivalenz bezeichnet. Dann ist F (X) zusammen mit der
Verknüpfung · : F (X) × F (X) → F (X), gegeben durch [w] · [w0 ] := [ww0 ] eine
Gruppe.
Der Beweis ist dem Leser überlassen. Insbesondere verifiziere man, dass [1]
das neutrale Element in F (X) und somit
[x]−1 = [x−1 ] für alle x ∈ X
(2.2)
ist.
Satz 2.6. Die Gruppe F (X) ist frei über [X] := {[x] | x ∈ X}.
Beweis. Sei G eine beliebige Gruppe und f : [X] → G eine Abbildung. Zu zeigen
ist, dass ein eindeutiger Homomorphismus ϕ : F (X) → G existiert mit ϕ|[X] =
f . Sei g = [x11 · · · xnn ] mit xi ∈ X und i ∈ {1, −1}. Ist ϕ ein Homomorphismus
mit obiger Eigenschaft, folgt aus der Homomorphieeigenschaft sofort
ϕ(g) = f ([x1 ])1 · · · f ([xn ])n ,
somit ist ϕ eindeutig bestimmt. Andersherum ist leicht zu prüfen, dass die so
definierte Abbildung wohldefiniert ist, was die Existenz von ϕ impliziert. Die
Behauptung folgt.
Möchte man nun ein Element [w] ∈ F (X) explizit angeben, so bietet es sich
an, den Repräsentanten w möglichst kurz zu wählen. Das implziert insbesondere,
dass der Repräsentant w kein Teilwort der Form xx−1 enthalten sollte (mit x ∈
X̃), da man dieses Teilwort sonst streichen und einen kürzeren Repräsentanten
erhält. Enthält w kein solches Teilwort, so stellt sich heraus, dass w bereits ein
kürzester Repräsentant von [w] ist, und mit dieser Eigenschaft bereits eindeutig
ist. Dies beweisen wir im folgenden:
Definition 2.7. Sei X eine Menge. Ein Wort w = x1 · · · xn in X̃ ∗ heißt reduziert, falls xi 6= x−1
i+1 für alle i ∈ {1, . . . , n − 1}.
Lemma 2.8. Für jedes Wort w ∈ X̃ ∗ existiert ein eindeutig bestimmtes reduziertes Wort w0 ∈ X̃ ∗ , so dass w ∼ w0 .
Beweis. Wir folgen einer Beweisidee von van der Waerden: Sei W die Menge aller reduzierten Wörter in X̃ ∗ . Wir definieren einen Homomorphismus ϕ :
F (X) → S(W ), wobei S(W ) die Permutationgruppe von W bezeichnet (d.h. ϕ
ist gerade eine Operation von F (X) auf W ), der folgende Eigenschaften hat:
1. [ϕ(g)(w)] = g[w] für alle g ∈ F (X) und w ∈ W .
2. ϕ([w])(1) = w für alle w ∈ W .
23
Die Existenz (und Wohldefiniertheit) von ϕ zeigt offenbar die Behauptung, denn
für zwei reduzierte Formen w, w0 ∈ W mit [w] = [w0 ] folgt
w = ϕ([w])(1) = ϕ([w0 ])(1) = w0 .
Sei nun w = x0 · . . . · xn ∈ W ein reduziertes Wort. Wir definieren ϕ durch
(
x · x0 · . . . · xn falls x 6= x−1
0
ϕ([x])(w) =
x1 · . . . · xn
sonst
für x ∈ X̃. Man rechnet leicht nach, dass
ϕ([x])(ϕ([x−1 ])(w)) = ϕ([x−1 ])(ϕ([x])(w)) = w.
Somit folgt ϕ([w]) ∈ S(W ) (d.h. ϕ([w]) ist bijektiv auf W ) und ϕ([x])−1 =
ϕ([x−1 ]).
Wegen der universellen Eigenschaft von F (X) lässt sich ϕ nun eindeutig
auf F (X) fortsetzen. Die gewünschten Eigenschaften folgen sofort aus der Konstruktion, die Behauptung folgt.
In den folgenden Abschnitten wollen wir für ein Element [w] ∈ F (X) kurz
w schreiben. Insbesondere wird für x ∈ X damit das Element [x] ∈ F (X)
kurz mit x bezeichnet. Dies ist grundsätzlich unproblematisch; man beachte
insbesondere, dass es wegen (2.2) keine Notationskonflikte mit der Bezeichnung
x−1 gibt. Zudem hat es zwei große Vorteile: Einerseits erspart es uns eine Menge
Klammern, andererseits erlaubt es uns, die Menge X als Teilmenge von F (X)
zu betrachten. Insbesondere ist X somit eine Basis von F (X). Somit folgt, aus
Lemma 2.2 und Satz 2.6,
Korollar 2.9. Sei G eine Gruppe und X ⊂ G eine Teilmenge. G ist genau
dann frei über X, wenn G isomorph zu F (X) ist.
Wir können also im Falle einer über X freien Gruppe G stets davon ausgehen,
dass G = F (X) ist, und nennen F (X) kurz die freie Gruppe über X.
2.2
Gruppenpräsentierungen
Sei G eine Gruppe und X ⊂ G eine Teilmenge. Dann bezeichnet
hXi := {x11 · · · xnn | n ∈ N, xi ∈ X, i = ±1}
die von X erzeugte Untergruppe. X ist also genau dann ein Erzeugensystem von
G, wenn hXi = G gilt. Weiter bezeichnet
hhXii := {g1 x11 g1−1 · · · gn xnn gn−1 | n ∈ N, gi ∈ G, xi ∈ X, i = ±1}
die von X normal erzeugte Untergruppe. hhXii ist also der kleinste Normalteiler
von G, der X enthält.
24
Sei nun G eine Gruppe und X ein Erzeugendensystem von G. Nach Satz 2.6
existiert ein eindeutiger Homomorphismus π : F (X) → G mit π|X = idX . Da X
als Erzeugendensystem von G im Bild von π liegt, ist π surjektiv, und es folgt
aus dem Homomorphiesatz, dass
G∼
= F (X)/ker(π).
Somit ist G also bis auf Isomorphie eindeutig durch X und ker(π) ≤ F (X)
bestimmt. Da ker(π) ein Normalteiler von F (X) ist, genügt zur eindeutigen Bestimmung von ker(π) die Angabe einer Teilmenge R, die ker(π) normal erzeugt.
Dies motiviert folgende Definition:
Definition 2.10. Sei X eine Menge und R ⊂ F (X). Dann heißt hX|Ri eine
Präsentierung der Gruppe G, falls
G∼
= F (X)/hhRii.
Wir schreiben kurz G = hX|Ri.
Es folgt also sofort aus dem Homomorphiesatz, dass jede Gruppe G eine
Präsentierung besitzt: Wählt man ein beliebiges Erzeugendensystem X von G
(z.B. X := G) und ein beliebiges normales Erzeugendensystem R des Kernes des
eindeutigen Epimorphismus π : F (X) → G mit π|X = idX (z.B. R := ker(π)),
so ist hX|Ri eine Präsentierung von G. Im allgemeinen lassen sich X und R
allerdings wesentlich schlanker wählen.
Beispiel 2.11. Wir beginnen mit einigen Beispielen von Gruppenpräsentierungen.
1. F (X) = hX|∅i (X eine beliebige Menge), denn
F (X) ∼
= F (X)/{1} = F (X)/hh∅ii.
Wir schreiben für hX|∅i auch hX|−i.
2. Z2 = ha, b|[a, b]i, wobei [a, b] := aba−1 b−1 der Kommutator von a und b
ist: Ist
(
a 7→ (1, 0)
2
ϕ : F (a, b) → Z ,
,
b 7→ (0, 1)
so ist kerϕ = hh[a, b]ii.
3. Zn = ha|an i für alle n ∈ N+ , denn der Homomorphismus
ϕ : F (a) → Zn , ak 7→ k̄
hat offenbar ker(ϕ) = {akn | k ∈ Z} = {(an )k | k ∈ Z} = hhan ii.
25
Sei nun G = hX|Ri, H eine Gruppe und f : X → H eine Abbildung. Ist
G nicht frei, so stellt sich die Frage, unter welchen Voraussetzungen sich die
Abbildung f zu einem Homomorphismus fortsetzen lässt.
Nach Satz 2.6 gibt es einen eindeutig bestimmten Homomorphismus ϕ :
F (X) → H mit ϕ|X = f . Falls ein Homomorphismus ψ : G → H mit ψ|X = f
existiert, so gilt offenbar ψ ◦ π|X = f |X , und somit ψ ◦ π = ϕ wegen der
Eindeutigkeit von ϕ mit dieser Eigenschaft. Somit folgt unmittelbar aus dem
Homomorphiesatz, dass ψ genau dann existiert, wenn ϕ durch π faktorisiert,
d.h. wenn ker(π) ⊂ kerϕ = hhRii. Es folgt
Korollar 2.12. Sei G = hX|Ri, H eine Gruppe und f : X → H. Weiter sei
ϕ : F (X) → H die eindeutige Fortsetzung von f auf F (X). Dann existiert eine
Fortsetzung von f auf G genau dann, wenn ϕ(r) = 1 für alle r ∈ R.
2.3
Freie Produkte
Wir definieren im folgenden den Begriff des freien Produktes zweier Gruppen.
Das Adjektiv frei deutet hier wieder an, dass es sich um ein Produkt von Gruppen mit einer universellen Eigenschaft handelt. Dem ist auch so:
Definition 2.13. Seien G1 und G2 Gruppen. Eine Gruppe H heißt freies
Produkt von G1 und G2 (geschrieben H = G1 ∗ G2 ), falls Monomorphismen
τi : Gi → H (i = 1, 2) existieren, so dass folgendes gilt: Für jede Gruppe K und
Homomorphismen ϕi : Gi → K existiert ein eindeutig bestimmter Homomorphismus ψ : H → K, so dass ϕi = ψ ◦ τi für i = 1, 2.
Ähnlich der freien Gruppe im vorherigen Abschnitt zeigen wir zunächst,
dass das freie Produkt von gegebenen Gruppen bis auf Isomorphie eindeutig
bestimmt ist.
Lemma 2.14. Seien G1 und G2 Gruppen und H und K freie Produkte von G1
und G2 . Dann gilt H ∼
= K.
Beweis. Seien τi : Gi → H und ηi : Gi → K (i = 1, 2) Monomorphismen mit der
Eigenschaft wie in Definition 2.13. Dann existieren eindeutige Homomorphismen
ϕ : H → K und ψ : K → H mit τi = ψ ◦ ηi und ηi = ϕ ◦ τi für i = 1, 2. Es folgt
ψ ◦ ϕ ◦ τi = ψ ◦ ηi = τi .
Somit ist ψ ◦ ϕ = idH , denn idH ist der nach Definition 2.13 eindeutige
Homomorphismus von H nach H mit idH ◦ τi = τi . Ebenso folgt ϕ ◦ ψ = idK .
Also gilt ϕ = ψ −1 , somit ist ϕ ein Isomorphismus.
Wir wollen im folgenden das (bis auf Isomorphie eindeutige) freie Produkt
von G und H konstruieren.
Konstruktion 2.15. Seien G und H Gruppen. Sei F die Menge aller Tupel
(g1 , h1 , g2 , h2 , . . . , gn , hn ), wobei n ∈ N beliebig und gi ∈ G, hi ∈ H für i =
1, . . . , n. Auf F definieren wir die Verknüpfung · : F × F → F durch
(g1 , h1 , . . . , gk ) · (g10 , h01 , . . . , gl0 ) = (g1 , h1 , . . . , hk−1 , gk g10 , h01 , . . . , gl0 ).
26
Weiter definieren wir eine freie Äquivalenz auf F wie folgt: Sind u, v ∈ F
beliebig und g, g 0 ∈ G, h, h0 ∈ H, so setzen wir
u · (g, 1, g 0 ) · v
0
u · (1, h, 1, h , 1) · v
∼
u · (gg 0 ) · v,
∼
u · (1, hh0 , 1) · v.
Die freie Äquivalenz ist dann die von ∼ erzeugte Äquivalenzrelation (die wir
abermals mit ∼ bezeichnen).
Lemma 2.16. Seien G und H Gruppen und F wie oben. Dann ist die Gruppe
G ∗ H := F/ ∼ mit der Verknüpfung
· : G ∗ H × G ∗ H → G ∗ H, [w]∼ · [w0 ]∼ := [ww0 ]∼
ein freies Produkt von G und H.
Beweis. Zunächst überzeuge man sich, dass · wohldefiniert und G ∗ H eine
Gruppe ist. Nun betrachte die Einbettungen τG : G ,→ G ∗ H, g 7→ [g]∼
und τH : H ,→ G ∗ H, h 7→ [1, h, 1]∼ . Sei nun K eine beliebige Gruppe und
ϕG : G → K, ϕH : H → K Homomorphismen. Dann ist die Abbildung
ψ : G ∗ H → K, [g1 , h1 , . . . , hk−1 , gk ] 7→ ϕG (g1 ) · ϕH (h1 ) · · · ϕH (hk−1 ) · ϕG (gk )
wohldefiniert und genügt den Eigenschaften aus Definition 2.13. Die Eindeutigkeit von ψ folgt, da ϕG (G) ∪ ϕH (H) ein Erzeugendensystem von G ∗ H ist.
Lemma 2.17. Seien G = hX | Ri, H = hY | Si und X, Y disjunkt. Dann gilt:
1. Für jedes g ∈ G ∗ H existiert ein eindeutiges Tupel
(g1 , h1 , g2 , h2 , . . . , hn−1 , gn ),
so dass gi ∈ G, hi ∈ H sowie gi 6= 1 für i = 2, . . . , n − 1 und hi 6= 1 für
i = 1, . . . , n − 1 und
g = [g1 , h1 , g2 , h2 , . . . , gn , hn ]∼ .
(2.3)
2. G ∗ H = hX, Y |R, Si
Beweis. Übungsaufgabe, Blatt 5
2.4
HNN-Erweiterungen
Die HNN-Erweiterung ist eine Konstruktion, die für eine Gruppe G eine größere
Gruppe G∗ liefert, die G als Untergruppe enthält. Sie wird uns im Verlaufe dieser
Vorlesung als wichtiges Hilfsmittel dienen, um Gruppen mit bestimmten, jeweils
gewünschten Eigenschaften zu konstruieren.
27
HNN-Erweiterungen haben einen geometrischen Hintergrund: Zusammen
mit dem analogen Konzept der amalgamierten Produkte bilden sie die einfachsten und wichtigsten Beispiele für Fundamentalgruppen von Graphen von Gruppen in der Bass-Serre-Theorie, die sich mit der Klassifikation von Gruppenoperationen auf simplizialen Bäumen beschäftigt. Diesen geometrischen Hintergrund
werden wir im Kontext dieser Vorlesung aber nicht weiter beleuchten, sondern
HNN-Erweiterungen rein kombinatorisch diskutieren. Wir beginnen mit einer
Definition:
Definition 2.18. Seien G = hX|Ri und C Gruppen und α, ω : C ,→ G zwei
Monomorphismen. Dann ist die HNN-Erweiterung von G entlang C (bzgl. α
und ω), geschrieben G∗C , definiert als
G∗C := hX, t | R, {α(c) = tω(c)t−1 | c ∈ C}i.
Bemerkung 2.19. Man beachte, dass die Gruppe G∗C von den Monomorphismen
α, ω abhängt, die Schreibweise “G∗C ” aber nicht. Insofern ist diese Schreibweise
potentiell missverständlich; sie ist aber dennoch üblich, und es werden auch im
folgenden keine Mehrdeutigkeiten auftreten.
Es ist zunächst keineswegs klar, dass G eine Untergruppe von G∗C ist (d.h.,
dass die von X erzeugte Untergruppe in G∗C isomorph zu G ist), denn das
Hinzufügen von Relationen kann i.a. die Gruppe kaputtmachen. Unser erstes
Ziel wird es sein, dies zu beweisen. Zunächst entwickeln wir, analog zu dem Fall
des freien Produktes, eine Normalform, in der wir Elemente aus G∗C darstellen
können. Jedes Element aus g ∈ G∗C kann offenbar als Produkt der Form
g = g0 · t±1 · g1 · t±1 · . . . · t±1 · gn
(2.4)
dargestellt werden, wobei gi ∈ G. Allerdings ist diese Darstellung diesmal keineswegs eindeutig: Ist etwa c ∈ C und s = α(c), s0 = ω(c), so gilt nach Konstruktion, dass
s · t · 1 = 1 · t · s0 .
Die Produkte s · t · 1 und 1 · t · s0 , beide in der Form wie in (2.4), sind also
zwei verschiedene Darstellungen desselben Elementes. Damit die Darstellung
eindeutig wird, brauchen wir zusätzliche Forderungen an die gi .
Wähle ein Repräsentantensystem Rα der Menge {α(C)g | g ∈ G} der Rechtsnebenklassen der Untergruppe α(C) in G, und ebenso ein Repräsentantensystem
Rω der Rechtsnebenklassen von ω(C) in G. Wir treffen die Wahl so, dass 1 ∈ Rα
und 1 ∈ Rω , d.h. für die Untergruppen α(C) bzw. ω(C) wählen wir jeweils den
trivialen Repräsentanten. Nun definieren wir eine Normalform wir folgt:
Definition 2.20. Eine Normalform (bzgl. Rα , Rω ) in G∗C ist ein Tupel
(g0 , t1 , g1 , t2 , . . . , tn , gn )
mit gi ∈ G, i ∈ {−1, 1} und folgenden Eigenschaften:
1. Ist i = −1, so ist gi ∈ Rα .
28
2. Ist i = +1, so ist gi ∈ Rω .
3. Ist i 6= i+1 , so ist gi 6= 1.
Es ist leicht zu sehen, dass jedes Element g ∈ G∗C als Normalform darstellbar
ist. Etwas weniger offensichtlich ist, dass diese Normalform stets eindeutig ist.
Dies zeigen wir im folgenden Satz.
Satz 2.21. Für jedes Element g ∈ G∗C existiert eine eindeutige Normalform
w = (g0 , t1 , g1 , t2 , . . . , tn , gn ), so dass
g = [w] := g0 · t1 · g1 · t2 · . . . · tn · gn
Beweis. Wir folgen wieder der Beweisidee von van der Waerden: Sei W die
Menge aller Normalformen in G∗C . Wir definieren einen Homomorphismus ϕ :
G → S(W ) von G in die Permutationgruppe S(W ) von W (d.h. eine Operation
von G auf W ), der folgende Eigenschaften hat:
1. [ϕ(g)(w)] = g[w] für alle g ∈ G∗C und w ∈ W .
2. ϕ([w])(1) = w für alle w ∈ W .
Die Existenz (und Wohldefiniertheit) von ϕ zeigt offenbar den Satz, denn für
zwei Normalformen w, w0 ∈ W mit [w] = [w0 ] folgt
w = ϕ([w])(1) = ϕ([w0 ])(1) = w0 .
Sei nun w = (g0 , t1 , g1 , t2 , . . . , tn , gn ) eine Normalform. Wir definieren
zunächst
ϕ(g)w := (gg0 , t1 , g1 , t2 , . . . , tn , gn )
für g ∈ G. Man rechnet leicht nach, dass ϕ(g)(ϕ(g −1 )(w)) = ϕ(g −1 )(ϕ(g)(w)) =
w. Somit folgt ϕ(g) ∈ S(W ) (d.h. ϕ(g) ist bijektiv auf W ) und ϕ(g)−1 = ϕ(g −1 ).
Weiter setzen wir
(
(α ◦ ω −1 (g0 )g1 , t2 , . . . , tn , gn )
falls 1 = −1 und g0 ∈ ω(C)
ϕ(t)(w) :=
−1 0
1
(α ◦ ω (g0 ), t, gω , t , g1 , . . . , gn ) sonst,
wobei gω der Repräsentant von g0 in Rω ist und g00 ∈ ω(C) gerade so gewählt
ist, dass g0 = g00 gω , und analog
(
(ω ◦ α−1 (g0 )g1 , t2 , . . . , tn , gn )
falls 1 = 1 und g0 ∈ α(C)
−1
ϕ(t )(w) :=
−1 0
−1
1
(ω ◦ α (g0 ), t , gα , t , g1 , . . . , gn ) sonst
mit gα ∈ Rα , g00 ∈ α(C) und g0 = g00 gω .
Wir zeigen nun, dass ϕ(t−1 ) = ϕ(t)−1 . Sei w wie oben. Wir unterscheiden
zwei Fälle: Sei zunächst 1 = −1 und g0 ∈ ω(C). Es ist also
ϕ(t)(w) = α ◦ ω −1 (g0 )g1 · t2 · . . . · tn · gn .
29
Nun ist es nicht möglich, dass 2 = 1 und g1 ∈ α(C), da w eine Normalform ist.
Da g1 ∈ Rα und α ◦ ω −1 (g0 ) ∈ α(C), ist der Repräsentant von α ◦ ω −1 (g0 )g1 in
Rα gerade g1 . Es folgt Also ist
ϕ(t−1 )(ϕ(t)(w))
= ϕ(t−1 )(α ◦ ω −1 (g0 )g1 , t2 , . . . , tn , gn )
(2.5)
= g0 , t1 , g1 , t2 , . . . , tn , gn
(2.6)
= w
(2.7)
Im zweiten Fall, dass 1 = 1 oder g0 ∈
/ ω(C), folgt sofort, dass ebenfalls
ϕ(t−1 )(ϕ(t)(w)) = w. Somit ist ϕ(t−1 )ϕ(t) = idW , und eine analoge Betrachtung zeigt ϕ(t)ϕ(t−1 ) = idW . Es folgt ϕ(t) ∈ S(W ) und ϕ(t−1 ) = ϕ(t)−1 .
Nun rechnet man leicht nach, dass ϕ(t) · ϕ(ω(c)) · ϕ(t−1 ) · ϕ(α(c)−1 )) = 1.
Somit lässt sich ϕ nach Korollar 2.12 eindeutig zu einem Homomorphismus auf
die Gruppe G∗C fortsetzen. Dieser Homomorphismus hat nach Kosntruktion die
gewünschten Eigenschaften. Die Behauptung folgt.
Eine unmittelbare Folgerung aus Satz 2.21 ist das folgende Korollar, das
aussagt, dass wir G als Untergruppe von G∗C auffassen können.
Korollar 2.22. Die Abbildung G → G∗C , g 7→ g ist injektiv.
Beweis. Es genügt zu beobachten, dass (g) eine Normalform in G∗C ist (für
g ∈ G). Ist g 6= 1, so ist also (g) die nach Satz 2.21 eindeutige Normalform in
G∗C , somit ist das repräsentierte Element nicht-trivial.
2.5
Eigenschaften von Gruppen und Nielsen-Reduziertheit
Das freie Produkt und die HNN-Erweiterung sind wertvolle Hilfsmittel, um einige –teils etwas überraschende– Eigenschaften von Gruppen und ihren Untergruppen einzusehen. Wir beginnen zunächst mit einigen Eigenschaften freier
Gruppen.
Lemma 2.23. Sei G eine Gruppe, X ⊂ G eine Teilmenge und X ∩ X −1 = ∅.
Die von X erzeugte Untergruppe hXi ist genau dann frei über X, wenn für alle
Produkte
g = x1 · · · xn ∈ G
mit n > 0, xi ∈ X ∪ X −1 und xi 6= x−1
i+1 gilt, dass g 6= 1.
Beweis. Seien zunächst x1 , . . . , xn ∈ X ∪ X −1 , xi 6= x−1
i+1 und x1 · · · xn = 1.
Dann ist idX nicht zu einem Homomorphismus ϕ : hXi → F (X) fortsetzbar,
denn es müsste gelten
ϕ(x1 · · · xn ) = ϕ(x1 ) · · · ϕ(xn ) 6= 1.
Es folgt sofort, dass hXi nicht frei über X ist.
Sei nun andersherum x1 · · · xn 6= 1 für alle n > 0 und xi ∈ X ∪ X −1 mit
xi 6= x−1
i+1 . Wegen der universellen Eigenschaft von F (X) ist idX eindeutig
30
zu einem Homomorphismus ϕ : F (X) → hXi fortsetzbar. Es folgt aus der
Voraussetzung, dass ϕ(w) 6= 1 für alle w 6= 1, somit ist ϕ injektiv. Da X ein
Erzeugendensystem von hXi ist, ist ϕ surjektiv, also ein Isomorphismus. Daraus
folgt die Behauptung.
Definition 2.24. Sei X eine Menge und F = F (X) die freie Gruppe über X.
Für g ∈ F bezeichne |g| die Länge (d.h. Anzahl der Buchstaben) des eindeutigen
reduzierten Wortes in X̃ ∗ , das g repräsentiert.
Eine (endliche oder unendliche) Teilmenge U ⊂ F heißt Nielsen-reduziert,
falls für beliebige Elemente v1 , v2 , v3 ∈ U ∪ U −1 gilt
1. v1 6= 1,
2. v1 v2 6= 1 ⇒ |v1 v2 | ≥ max(|v1 |, |v2 |),
3. v1 v2 6= 1 und v2 v3 6= 1 ⇒ |v1 v2 v3 | > |v1 | − |v2 | + |v3 |.
Proposition 2.25. Sei X eine Menge und U ⊂ F (X) Nielsen-reduziert. Dann
existieren für jedes u ∈ U ∪ U −1 Wörter α(u), m(u), ω(u) ∈ X̃ ∗ mit m(u) 6= 1
und ω(u) = α(u−1 )−1 , so dass folgendes gilt:
1. α(u) · m(u) · ω(u) ist reduziert und α(u) · m(u) · ω(u) =F u.
−1
2. Sind v1 , . . . , vn ∈ U ∪U −1 , so dass vi 6= vi+1
, und bezeichnet ω(vi )α(vi+1 ) ∈
∗
X̃ das reduzierte Wort, das äquivalent zu ω(vi ) · α(vi+1 ) ist, so ist das
Wort
α(v1 ) · m(v1 ) · ω(v1 )α(v2 ) · m(v2 ) · · · ω(vn−1 )α(vn ) · m(vn ) · ω(vn ) (2.8)
reduziert.
Beweis. Für u ∈ U ∪U −1 bezeichne ũ den eindeutigen reduzierten Repräsentanten
von u in X̃ ∗ . Wähle dann α(u) als das längste Präfix von ũ, das ebenfalls Präfix
eines weiteren ṽ für v ∈ U ∪ U −1 , v 6= u, ist, und ω(u) := α(u−1 )−1 . Aus Eigenschaft 2.24 (2) folgt, dass |α(u)| + |ω(u)| = 2|α(u)| < |u|. Setze m(u) als das
eindeutige nicht-leere Wort, für das gilt, dass α(u) · m(u) · ω(u) = ũ.
−1
Seien nun v1 , . . . , vn ∈ U ∪ U −1 mit vi 6= vi+1
. Dann gilt offenbar (2.8),
denn anderenfalls würde für ein i ∈ 1, . . . , n − 1 gelten, dass ω(vi )α(vi+1 ) = 1
und m(vi )m(vi+1 ) nicht reduziert ist. Dann wäre aber α(vi+1 ) nicht maximal
gewählt. Ein Widerspruch.
Aus Proposition 2.25 und Lemma 2.23 folgt sofort
Korollar 2.26. Ist U ⊂ F (X) Nielsen-reduziert und U ∩ U −1 = ∅, so ist hU i
frei über U .
Eine zentrale Frage, die man über eine gegebene Gruppe G stellen kann, ist
die, wie “groß” die Gruppe G ist:
31
Definition 2.27. Der Rang einer Gruppe G, rank(G) ∈ N∪{∞}, ist die Anzahl
der Elemente eines kleinsten Erzeugendensystemes von G. Wir nennen G endlich
erzeugt, falls rank(G) ∈ N.
Es wird sich herausstellen, dass es schwierig ist, den Rang einer Gruppe zu
bestimmen. Zunächst können wir aber folgendes einsehen:
Proposition 2.28. Sei X eine endliche Menge. Dann ist rank(F (X)) = |X|.
Beweis. Sei X = {x1 , . . . , xn }. Da X ein Erzeugendensystem von F (X) ist, gilt
offenbar rank(F (X)) ≤ n. Zu zeigen ist, dass kein Erzeugendensystem X 0 von
F (X) existiert mit |X 0 | < n. Wir tun dies, indem wir die Aussage auf eine
Gruppe zurückführen, deren Rang wir bestimmen können: Die Gruppe Zn2 hat
offenbar Rang n; denn einerseits ist E := (e1 , . . . , en ) ein Erzeugendensystem
(wobei ei das i-te Einheitstupel in Zn2 bezeichnet), andererseits ist Zn2 als Z2 Vektorraum der Dimension n mindestens von Rang n.
Die Abbildung f : X → E, xi 7→ ei setzt sich nach der universellen Eigenschaft von F (X) zu einem eindeutigen Homomorphismus ϕ : F (X) → Zn2
fort. Da E = f (X) ein Erzeugendensystem ist, ist ϕ surjektiv. Ist nun X 0 ein
beliebiges Erzeugendensystem von F (X), so ist ϕ(X 0 ) ein Erzeugendensystem
von Zn2 . Es folgt |X 0 | ≥ n.
Etwas unintuitiv ist dagegen das Verhalten von Untergruppen im Hinblick
auf ihren Rang. Während man von endlich-dimensionalen Vektorräumen gewöhnt ist, dass ein strikter Teilraum stets eine kleinere Dimension hat, können
Untergruppen einer endlich erzeugten Gruppe G durchaus einen höheren Rang
als G besitzen. Als Beispiel betrachte man die freie Gruppe F = F ({a, b}), und
für n ∈ N die Teilmenge
Mn := h{b, aba−1 , a2 ba−2 , . . . , an ba−n }i.
Man sieht leicht ein, dass Mn Nielsen-reduziert ist. Somit gilt nach Korollar 2.26,
dass Un := hMn i frei über Mn ist; es folgt aus 2.28, dass rank(Un ) = n + 1.
Diese Beobachtung können wir benutzen, um ein viel allgemeineres Resultat zu
beweisen:
2.6
Markov-Eigenschaften
Eines der Ziele dieser Vorlesung ist es, mithilfe des Higmannschen Einbettungssatzes die Existenz endlich präsentierter Gruppen mit unentscheidbarem
Wortproblem zu beweisen. Das bedeutet, dass eine endlich präsentierte Gruppe H = hX|Ri existiert, für die kein Algorithmus existiert, der für ein gegebenes Element w ∈ X̃ ∗ entscheidet, ob w das triviale Element in H repräsentiert. Wir werden in diesem Abschnitt die Existenz einer solchen Gruppe
H annehmen und mit ihrer Hilfe beweisen, dass viele weitere Eigenschaften von
(endlich-präsentierten) Gruppen im allgemeinen unentscheidbar sind; nämlich
alle Markov-Eigenschaften:
32
Definition 2.29. Eine Eigenschaft P von Gruppen heißt Markov-Eigenschaft,
falls gilt:
1. Es existiert eine endlich präsentierte Gruppe G1 mit der Eigenschaft P .
2. Es existiert eine endlich präsentierte Gruppe G2 , die in keine Gruppe mit
der Eigenschaft P einbettbar ist.
Ein einfaches Beispiel eine Markov-Eigenschaft ist Kommutatvität: Es existieren endlich präsentierte abelsche Gruppen, und eine nicht-abelsche Gruppe ist
in keine abelsche Gruppe einbettbar. Ebenso sind endlich, trivial, torsionsfrei,
frei und nilpotent Markov-Eigenschaften.
Satz 2.30. Sei P eine Markov-Eigenschaft. Dann gibt es keinen Algorithmus,
der für eine beliebige endlich präsentierte Gruppe G entscheidet, ob G die Eigenschaft P hat.
Beweis. Sei H eine Gruppe mit unentscheidbarem Wortproblem und w ∈ H.
Weiter sei G2 wie in Definition 2.29 eine Gruppe, die in keine Gruppe mit der
Eigenschaft P einbettbar ist. Wir beginnen die Konstruktion mit der Gruppe
G ∗ H ∗ hxi. Nach Satz 4.1 existiert eine Gruppe U , die von zwei Elementen
u1 , u2 von unendlicher Ordnung erzeugt wird, in die G ∗ H ∗ hxi einbettbar ist.
Setze nun
J := hU, y1 , y2 | y1 u1 y1−1 = u21 , y2 u2 y2−1 = u22 i.
J geht aus U durch zweifache HNN-Erweiterung hervor, insbesondere ist U also
eine Untergruppe von J. Setze nun
K := hJ, z | zy1 z −1 = y12 , zy2 z −1 = y22 i.
K ist eine HNN-Erweiterung von K entlang der Untergruppe F2 ∼
= hy1 , y2 i ∼
=
hy12 , y22 i, also ist U eine Untergruppe von K.
[noch nicht fertig...]
3
Entscheidungsprobleme
Im folgenden wollen wir die erarbeiteten Hilfsmittel aus den ersten beiden Kapiteln nutzen, um einige algorithmische Probleme in der Gruppentheorie zu
formalisieren und ihre algorithmische Lösbarkeit zu diskutieren. Zunächst stellt
sich die Frage, wie wir die Theorie der rekursiven Funktionen aus Kapitel 1 auf
Gruppen anwenden können.
Wie in Abschnitt 1.6 beschrieben, ist alles, was wir brauchen, eine Identifikation von Gruppenelementen mit Tupeln natürlicher Zahlen. Dann können wir
Berechnungen in Gruppen auf Berechnungen in N∗ zurückführen.
Wir fixieren eine (endliche oder abzählbar unendliche) Menge
X = {x1 , x2 , x3 , . . .}.
33
Ein Element g der Gruppe F (X) repräsentieren wir üblicherweise durch das
eindeutige reduzierte Wort aus X̃ ∗ , das g repräsentiert. Ein solches Wort
w = xi11 · · · xikk ∈ X̃ ∗ ,
wobei xij ∈ X und j ∈ {±1}, lässt sich zunächst in naheliegender Weise als
Tupel von ganzen Zahlen (1 · i1 , . . . , k · ik ) ∈ Zk parametrisieren. Zum Beispiel
würde das Wort
−1 −1
x21 x2 x−2
3 = x1 x1 x2 x3 x3
durch das Tupel (1, 1, 2, −3, −3) parametrisiert. Das Element 1 ∈ F (X) wird
durch (0) repräsentiert.
Diese Parametrisierung (1 · i1 , . . . , k · ik ) ∈ Zk lässt sich nun vermöge der
Bijektion
(
2z
falls z gerade,
p : Z → N, z 7→
|2z| − 1 sonst
eindeutig auf das Tupel
enc(w) = (p(1 · i1 ), . . . , p(k · ik )) ∈ Nk
abbilden. Wir nennen enc(w) die Kodierung 6 von w. Wie oben erwähnt, erlaubt
dies in naheligender Weise eine Kodierung eines Elementes g der freien Gruppe,
indem wir g durch seinen reduzierten Repräsentanten w darstellen:
Definition 3.1. Sei g ∈ F (X). Dann ist enc(g) := enc(w) für das eindeutig
bestimmte reduzierte Wort w ∈ X̃ ∗ , das g repräsentiert.
3.1
Wortproblem
Das wohl fundamentalste dieser algorithmischen Probleme in der Gruppentheorie ist das Wortproblem: Ist eine Gruppe G durch eine Präsentierung G = hX|Ri
und ein Element g ∈ G als Produkt von Erzeugern (und Inversen),
g = x1 · · · xm
mit xi ∈ X ∪ X −1 , gegeben, kann man entscheiden, ob g = 1 in G gilt?
Die eigentliche Frage, die hier zu entscheiden ist, ist also offenbar, ob in der
freien Gruppe F (X) gilt, dass x1 · · · xm ∈ hhRii. Im Kontext von Teilmengen von
N∗ wissen wir inzwischen, dass diejenigen Teilmengen, für die die Zugehörigkeit
algorithmisch entscheidbar ist, gerade die rekursiven Mengen sind. Durch die
oben konstruierte Kodierung von Elementen aus F (X) in N∗ können wir diesen Begriff nun auf natürliche Weise auf Teilmengen von F (X) erweitern. Wir
identifizieren S ⊂ F (X) mit enc(S) ⊂ N∗ und nennen S rekursiv, falls enc(S)
rekursiv ist.
Definition 3.2. Sei G eine Gruppe mit rekursiver Präsentierung hX|Ri. Wir
sagen, dass G lösbares Wortproblem hat, falls hhRii rekursiv ist.
[Fortsetzung folgt...]
6 enc
steht für Encoding.
34
4
Einbettungssätze
In diesem Abschnitt werden wir einige Eigenschaften von Untergruppen von
Gruppen zeigen. Das Ziel wird es sein, den Higmannschen Einbettungssatz zu
beweisen. Wir folgen weitgehend [LS].
Satz 4.1. Jede abzählbare Gruppe C lässt sich in eine Gruppe G von Rang 2
mit folgenden Eigenschaften einbetten:
1. G hat Rang zwei und ein Erzeugendensystem aus zwei Elementen von
unendlicher Ordnung.
2. G hat ein Element endlicher Ordnung genau dann, wenn C ein Element
endlicher Ordnung besitzt.
3. Ist C endlich präsentiert, so auch G.
Beweis. Wähle eine abzählbare Präsentierung C = hx1 , x2 , . . . | r1 , r2 , . . .i. Setze
H := C ∗ F (a, b). Die Menge {a−k bak | k ∈ N} ⊂ F (a, b) ist Nielsen-reduziert
und somit eine Basis einer freien Untergruppe von F (a, b).
Ebenso ist
M := {b, x1 a−1 ba, x2 a−2 ba2 , . . .}
Basis einer freien Untergruppe von H. Somit ist die Gruppe
G := hH, t | t−1 at = b, t−1 b−i abi t = ci a−i bai , i ≥ 1i
eine HNN-Erweiterung von H. Somit ist H, und damit auch C, in G einbettbar. Weiter ist leicht einzusehen, dass G Rang (höchstens) 2 hat: Offenbar ist
(a, b, t, x1 , x2 , . . .) ein Erzeugendensystem von G. Es folgt aber sofort aus den
Relationen von G, dass b, x1 , x2 , . . . ∈ ha, ti.
Eigenschaft (2) folgt aus Übungsaufgabe 3 von Blatt 6. Ist C = hx1 , . . . , xn |
r1 , . . . , rm i endlich präsentiert, so liefert die analoge Konstruktion einer HN N Erweiterung entlang einer freien Gruppe von Rang n + 1 eine endliche Präsentierung für G.
4.1
Der Higmansche Einbettungssatz
Satz 4.2. Sei G eine endlich erzeugte Gruppe. G ist genau dann in eine endlich
präsentierte Gruppe eingebettet werden, wenn G rekursiv präsentiert ist.
Eine der beiden Implikation des Higmannschen Einbettungssatzes ist schnell
bewiesen: Sei H durch eine endliche Präsentierung H = hY |Si gegeben und
G = hX|Ri sowie eine Einbettung ϕ̃ : F (X) → F (Y ) ein Lift der Einbettung
ϕ : G ,→ H. Dann ist offenbar ϕ(g) ∈ hhSii genau dann, wenn g ∈ hhRii: Die
eine Implikation (“⇐”) folgt, weil ϕ̃ durch G faktorisiert, die andere aus der
Injektivität von ϕ.
Da S endlich ist, ist hhSii rekursiv aufzählbar, d.h. es existiert eine rekursive
Funktion fS mit Def(f ) = hhSii. Somit ist fS ◦ ϕ̃ eine rekursive Funktion und
Def(fS ◦ ϕ̃) = hhRii. Also ist G rekursiv präsentiert.
35
Zu zeigen bleibt, dass jede rekursiv präsentierte Gruppe in eine endlich
präsntierte Gruppe einbettbar ist. Diese Richtung ist erheblich schwieriger zu
beweisen. Wir beginnen mit einer Definition einer Eigenschaft von Untergruppen, die eine zentrale Rolle im Verlauf des Beweises einnehmen wird.
Definition 4.3. Sei G eine endlich erzeugte Gruppe. Eine Untergruppe H ≤ G
heißt zahm in G, falls die Gruppe
GH := hG, t | {tht−1 = h | h ∈ H}i
in eine endlich präsentierte Gruppe einbettbar ist.
Wir werden uns im folgenden für zahme Untergruppen freier Gruppen interessieren. Der Zusammenhang zum Higmannschen Einbettungssatz ist keineswegs offensichtlich und liegt in folgender Beobachtung: Ist F eine endlich
erzeugte freie Gruppe und R eine normale Untergruppe von F , dann ist die
Zahmheit von R in F eine hinreichende Bedingung dafür, dass F/R in eine endlich präsentierte Gruppe einbettbar ist, wie das folgende Lemma zeigt. Somit
wird die Zahmheit zu einem wesentlichen Kriterium für das, was wir mit dem
Higmannschen Einbettungssatz zeigen wollen.
Lemma 4.4. Sei F eine endliche erzeugte freie Gruppe und R ≤ F normal und
zahm. Dann ist F/R in eine endlich präsentierte Gruppe einbettbar.
Beweis. Sei X eine (endliche) Basis von F , d.h. F = F (X). Da R zahm ist,
existiert eine endlich präsentierte Gruppe H und ein Monomorphismus
ι : FR := hF, t | {trt−1 = r | r ∈ R}i ,→ H.
(4.1)
Ist g ∈ FR , so bezeichnen wir das Bild ι(g) ∈ H kurz mit ġ. Wir bezeichnen mit
H × F das direkte Produkt von H und F und definieren
K := hH × F, s | {s(f˙, 1)s−1 = (f˙, f ),
s(ṫf˙ṫ−1 , 1)s−1 = (ṫf˙ṫ−1 , 1) | f ∈ X}i
(4.2)
(4.3)
K ist offenbar endlich präsentiert, da H endlich präsentiert und X endlich ist.
Weiter zeigen wir, dass die Untergruppe h{(1, f ) | f ∈ X}i ≤ K isomorph zu
F/R ist. Somit ist F/R in K einbettbar, was die Behauptung impliziert.
Sei zunächst w ∈ R. Dann gilt in K aufgrund der gegebenen Relationen
(4.2)
einerseits s(ẇ, 1)s−1 = (ẇ, w) und andererseits
(4.1)
(4.3)
(4.1)
s(ẇ, 1)s−1 = s(ṫẇṫ−1 , 1)s−1 = (ṫẇṫ−1 , 1) = (ẇ, 1),
es folgt (ẇ, w) = (ẇ, 1) in K, und somit durch Multiplikation mit (ẇ−1 , 1) auch
(1, w) = (1, 1).
Es folgt also, dass wir (durch Tietze-Transformationen) alle Relationen der
Form (1, r) mit r ∈ R einführen können. Somit gilt
K = hH × F/R, s | {s(f˙, 1)s−1 = (f˙, f¯), s(ṫf˙ṫ−1 , 1)s−1 = (ṫf˙ṫ−1 , 1) | f ∈ X}i,
36
wobei f¯ das kanonische Bild von f ∈ F in F/R bezeichnet.
Wir zeigen nun, dass K eine HNN-Erweiterung von H × F/R ist. Dies impliziert nach Korollar 2.22, dass H × F/R und somit insbesondere F/R in K
einbettbar sind.
Betrachte die Gruppe C = hF, F 0 | {r = r0 | r ∈ R}i, wobei F 0 eine isomorphe Kopie von F bezeichnet (und g 0 ∈ F 0 das Bild von g ∈ F ). Dann
ist C ∼
= F ∗R F . Mithilfe von Satz 2.21 lässt sich leicht nachrechnen, dass die
Untergruppe
hF, tF t−1 i ≤ FR
isomorph zu C ist. Damit erhalten wir zwei Einbettungen
(
f 7→ (f˙, 1),
α : C ,→ H × F/R,
f 0 7→ (ṫf˙ṫ−1 , 1)
und
(
ω : C ,→ H × F/R,
f →
7 (f˙, f¯),
0
f →
7 (ṫf˙ṫ−1 , 1).
(Von der Wohldefiniertheit der Einbettungen möge man sich überzeugen.)
Somit gilt offenbar K ∼
= (H × F/R)∗C mit den obigen Monomorphismen α und
ω. Daraus folgt die Behauptung.
37
Index
µ-Operator, 9
beschränkte Subtraktion, 5
Cantorsche Paarfunktion, 7
charakerisierendes Polynom, 12
diophantische Menge, 12
freie Gruppe, 20
freier Monoid, 21
freies Produkt, 25
Funktion, 4
diophantische . . . , 14
partielle . . . , 8
primitiv rekursive . . . , 4
primitive . . . , 4
rekursive . . . , 9
totale . . . , 9
HNN-Erweiterung, 26
Indikatorfunktion, 6
Markov-Eigenschaft, 31
Menge
rekursiv aufzählbare . . . , 10
rekursive . . . , 10
Modulo-Operator, 6
Normalformsatz von Kleene, 10
Präsentierung, 24
Rang, 30
Wortproblem, 34
38
Literatur
[D]
M. Davis, Hilbert’s Tenth Problem is unsolvable. Amer. Math. Monthly 80,
233-269 (1973).
[LS] Roger Lyndon, Paul Schupp, Combinatorial Group Theory, Springer.
39
Herunterladen