Entscheidungsprobleme in der Gruppentheorie Dr. C. Reinfeldt 24. Januar 2014 Inhaltsverzeichnis 1 Grundlagen der Berechenbarkeitstheorie 1.1 Notationen . . . . . . . . . . . . . . . . . . 1.2 Primitiv rekursive Funktionen . . . . . . . . 1.3 Rekursive Funktionen . . . . . . . . . . . . 1.4 Rekursiv aufzählbare und rekursive Mengen 1.5 Diophantische Mengen und Funktionen . . . 1.6 Rekursivität auf N∗ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 4 4 8 10 11 19 2 Gruppen und Gruppenpräsentierungen 2.1 Freie Gruppen . . . . . . . . . . . . . . . . . . . . . . 2.2 Gruppenpräsentierungen . . . . . . . . . . . . . . . . . 2.3 Freie Produkte . . . . . . . . . . . . . . . . . . . . . . 2.4 HNN-Erweiterungen . . . . . . . . . . . . . . . . . . . 2.5 Eigenschaften von Gruppen und Nielsen-Reduziertheit 2.6 Markov-Eigenschaften . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 21 24 26 27 30 32 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 Entscheidungsprobleme 33 3.1 Wortproblem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 4 Einbettungssätze 35 4.1 Der Higmansche Einbettungssatz . . . . . . . . . . . . . . . . . . 35 Stichwortverzeichnis 37 Literaturverzeichnis 39 Einleitung In dieser Vorlesung beschäftigen wir uns mit Fragen der algorithmischen Berechenbarkeit verschiedener Eigenschaften von Gruppen. Eine solche Frage könnte zum Beispiel so lauten: 1 “Gegeben sei eine Gruppe G. Gibt es einen Algorithmus, der entscheidet, ob die Gruppe G eine bestimmte Eigenschaft hat (z.B., ob G trivial ist, ob G hyperbolisch ist, . . . )?” Etwas technischer formuliert, suchen wir also nach einem Algorithmus, der folgendes leistet: Bekommt er als Input eine Gruppe G, so berechnet er als Output einen Wahrheitswert (true/false), der angibt, ob die Gruppe die gewünschte Eigenschaft hat. Um dieser Problemstellung einen vernünftigen Sinn zu verleihen, müssen wir zwei Dinge klären. Einerseits brauchen wir einen formalen Rahmen für den Begriff Algorithmus. Ein Algorithmus ist, anschaulich gesprochen, exakt das, was man sich unter einem Computerprogramm vorstellt, das in einer gängigen Programmiersprache (C, C++, Java, . . . ) geschrieben ist. Um sich davon zu überzeugen, dass eine gewisse Aufgabenstellung algorithmisch gelöst werden kann, reicht diese Anschauung oft schon aus: Man schreibt einfach ein entsprechendes Programm, das die Lösung liefert. Um allerdings zu beweisen, dass es einen solchen Algorithmus nicht geben kann, brauchen wir einigen Formalismus, um die algorithmisch berechenbaren Funktionen klassifizieren zu können. Diesen Formalismus werden wir in Kapitel 1 erarbeiten. Andererseits brauchen wir eine Möglichkeit, eine Gruppe so zu beschreiben, dass wir sie als Input an einen Algorithmus übergeben können. Um eine Gruppe vollständig zu beschreiben, muss festgelegt werden, welche, bzw. wie viele, Elemente sie hat, und wie die Verknüpfung in der Gruppe definiert ist. Eine Möglichkeit, dies für eine endliche Gruppe zu beschreiben, wäre etwa eine Gruppentafel. Eine andere, und für uns interessantere Möglichkeit, ist die der Gruppenpräsentierung: Eine Gruppe wird durch eine Menge von Erzeugenden und eine Menge von Relationen beschrieben; letztere kann man sich als Rechenregeln vorstellen, die die Verknüpfung der Gruppe definieren. Wir werden Gruppenpräsentierungen in Kapitel 2 formalisieren. .... 2 1 Grundlagen der Berechenbarkeitstheorie In diesem Abschnitt wollen wir gewisse Grundlagen der Berechenbarkeitstheorie diskutieren und uns einen Überblick verschaffen, unter welchen Voraussetzungen eine gegebene Funktion berechenbar ist. Berechnenbar soll hierbei, informell, bedeuten, dass es einen Algorithmus gibt, der für ein gegebenes n aus dem Definitionsbereich von f das Bild f (n) berechnen kann. Dabei geben wir dem Computer, der den Algorithmus ausführen soll, grundsätzlich beliebig viel Zeit und Speicher; wir wollen also nur diskutieren, ob ein Algorithmus existiert, ohne die Effizienz zu untersuchen. Um zu argumentieren, dass eine gegebene mathematische Funktion berechenbar ist, genügt es oft, ein Stück Code1 zu liefern, das den Algorithmus beschreibt, der die Funktion berechnet. So beschreibt z.B. der Code function binom(n,k) { if n < k: return 0; else if k = 0: return 1; else: return binom(n-1,k) + binom(n-1,k-1); } eine Funktion, die bei Eingabe zweier nicht-negativer ganzer Zahlen n und k den Binomialkoffizienten nk berechnet und zurückgibt. Nun wird dieses Stück Code jeden, der schon einmal Erfahrungen mit Programmierung gemacht hat, davon überzeugen, dass ein Binomialkoeffizient tatsächlich von einem Computer berechnet werden kann, denn alle Anweisungen, die in dem Code benutzt werden, stehen in jeder gängigen Programmiersprache (wie etwa C, C++ und Java) zur Verfügung und können damit in ein Computerprogramm eingebaut werden. Die Frage, die sich nun aufdrängt, ist folgende: Können eigentlich alle Funktionen, die man im mathematischen Sinne definieren kann, auch durch einen Algorithmus, d.h. von einem Computer berechnet werden? Um auf diese Frage eine Antwort geben zu können, braucht es etwas mehr Formalismus: Was ist eigentlich ein Computer? Oder, genauer gefragt: Was kann ein Computer? Um dies zu beantworten, gibt es mehrere, äquivalente Ansätze: In der theoretischen Informatik gibt es formale Modelle von Computern, wie etwa die TuringMaschine und die Registermaschine, deren Funktionsumfang man genau beschreiben kann. Es ist ein grundlegendes Resultat der theoretischen Informatik, dass die von einer Turing-Maschine oder –äquivalent dazu– einer Registermaschine berechenbaren Funktionen gerade die µ-rekursiven Funktionen, oder kurz rekursiven Funktionen (vgl. Definition 1.10), sind; diesen Begriff werden wir uns in den folgenden Abschnitten erarbeiten. 1 Dieser wird meist als Pseudo-Code bezeichnet, sofern er heuristisch und ohne klar definierte Syntaxregeln (z.B. in einer konkreten Programmiersprache) gegeben ist. 3 1.1 Notationen Zunächst fixieren wir einige Definitionen. Wir definieren die Menge der natürlichen Zahlen als N := {0, 1, 2, 3, . . .}, d.h. einschließlich der Zahl 0. Die positiven natürlich Zahlen bezeichnen wir bei Bedarf mit N+ := N \ {0}. Der Begriff Funktion wird im folgenden stets eine Abbildung von Nk nach Nl bezeichnen, wobei k, l ∈ N+ . Wir benutzen dabei die üblichen Verknüpfungen: Definition 1.1. Wir definieren folgende Verknüpfungen für Funktionen: 1. Sind g1 , . . . , gm : Nk → Nl Funktionen, dann ist (g1 , . . . , gm ) definiert durch (g1 , . . . , gm ) : Nk → Nm·l , x̄ 7→ (g1 (x̄), . . . , gm (x̄)) (x̄ ∈ Nk ). 2. Ist f : Nk → Nl und g : Nl → Nq , so ist g ◦ f gegeben durch g ◦ f : Nk → Nq , (x1 , . . . , xk ) 7→ g(f (x1 , . . . , xk )). 1.2 Primitiv rekursive Funktionen Definition 1.2. Die folgenden Funktionen heißen primitive Funktionen: 1. Die konstante Funktion c0 : N → N, n 7→ 0, 2. die Nachfolgerfunktion2 s : N → N, n 7→ n + 1, 3. die Projektion auf die i-te Koordinate, πik : Nk → N, (x1 , . . . , xk ) 7→ xi für 1 ≤ i ≤ k. Für πik schreiben wir üblicherweise kurz πi , wenn das k aus dem Kontext heraus eindeutig ist. Mithilfe der primitiven Funktionen definieren wir nun iterativ die primitiv rekursiven Funktionen. Eine Funktion ist primitv rekursiv, falls sie aus den primitiven Funktionen durch (wiederholte) Komposition und primitive Rekursion konstruierbar ist: Definition 1.3. Die Klasse der primitiv rekursiven Funktionen ist die kleinste Klasse von Funktionen, für die gilt 1. Jede primitive Funktion ist primitiv rekursiv. 2. (Komposition:) Sind g1 , . . . , gm : Nk → N und f : Nm → N primitiv rekursiv, dann ist f ◦ (g1 , . . . , gm ) primitiv rekursiv. 2s steht für “successor”, engl. Nachfolger 4 3. (Primitive Rekursion:) Sind g : Nk → N und h : Nk+2 → N primitiv rekursiv, so ist f : Nk+1 → N mit f (x1 , . . . , xk , 0) = g(x1 , . . . , xk ) und f (x1 , . . . , xk , t + 1) = h(t, f (x1 , . . . , xk , t), x1 , . . . , xk ) ∀t ∈ N primitiv rekursiv. Beispiel 1.4. Wir werden im folgenden für eine ganze Reihe von Funktionen zeigen, dass sie primitiv rekursiv sind. Einerseits soll dies einen Eindruck davon vermitteln, wie mächtig die Klasse der primitiv rekursiven Funktionen ist, andererseits wird sie uns als Repertoire von primitiv rekursiven Funktionen dienen, auf das wir später öfters zurückgreifen werden. 1. Für jedes k ∈ N ist die konstante Funktion ck : N → N, n 7→ k, primitiv rekursiv, denn ck = s| ◦ .{z . . ◦ s} ◦c0 k-mal (wobei s die Nachfolgerfunktion ist, vgl. Definition 1.2 (2)). 2. Die Identität auf N ist primitiv rekursiv, denn idN = π11 . 3. Die Addition + : N2 → N, (x, y) 7→ x+y ist primitiv rekursiv, da sie durch primitive Rekursion aus der Nachfolgerfunktion hervorgeht: x + 0 = x = idN (x) und x + (t + 1) = s(x + t) = s ◦ π2 (t, x + t, x) für alle t ∈ N. 4. Die Vorgängerfunktion3 ( pred : N → N, 0 t+1 7→ 0 7→ t ∀t ∈ N ist primitiv rekursiv, denn pred(0) = 0 und pred(t+1) = t = π1 (t, pred(t)) für alle t ∈ N. 5. Die beschränkte Subtraktion ( x−y · N2 → N, (x, y) 7→ x − · y := −: 0 für x ≥ y für x < y ist primitiv rekursiv, da sie durch primitive Rekursion aus der Vorgänger· 0 = x und funktion hervorgeht: x − · t, x) · (t + 1) = pred(x − · t) = pred ◦ π2 (t, x − x− für alle t ∈ N. (Achtung: Die klassische Subtraktion ist kein Kandidat für eine primitiv rekursive Funktion, weil sie, auf N2 definiert, den Bildbereich Z hat.) 3 pred steht für “predecessor”, engl. Vorgänger 5 6. Die Maximums- und Minimumsfunktion max, min : N2 → N sind primitiv rekursiv, denn · x) und min(x, y) = x − · (x − · y) max(x, y) = x + (y − für alle x, y ∈ N. 7. Die (euklidische) Abstandsfunktion auf N, gegeben durch d : N2 → N, (x, y) 7→ d(x, y) = |y − x| ist primitiv rekursiv, denn · y, y − · x) |y − x| = max(x − für alle x, y ∈ N. 8. Sind f, g : Nn → N primitiv rekursiv, so ist f + g : Nn → N, (x1 , . . . , xn ) 7→ f (x1 , . . . , xn ) + g(x1 , . . . , xn ) primitiv rekursiv, denn f + g = + ◦ (f, g). 9. Die Mulitiplikation · : N2 → N, (x, y) 7→ x · y ist primitiv rekursiv, denn x · 0 = 0 und x · (t + 1) = x · t + x = π2 + π3 (t, x · t, x). 10. Die Indikatorfunktion4 der Relation ≤ auf N2 : ( 1 2 1≤ : N → N, (x, y) 7→ 1x≤y := 0 falls x ≤ y falls x > y ist primitiv rekursiv, denn · x) 1x≤y = min(1, (y + 1) − für alle x, y ∈ N. Analog kann man einsehen, dass die Indikatorfunktionen der Relationen <, ≥ und > sowie = und 6= primitiv rekursiv sind. 11. Der Modulo-Operator mod : N2 → N, gegeben durch (a, b) 7→ (a mod b) := min{k ∈ N | b teilt a − k} ist primitiv rekursiv, denn (0 mod b) = 0 und (t + 1 mod b) = ((t mod b) + 1) · 1(t mod b)+16=b . 4 Für eine beliebige Relation R ⊂ Nk ist die Indikatorfunktion definiert als 1 k R : N → {0, 1} ⊂ N, x̄ 7→ 1x̄∈R mit 1x̄∈R = 1 ⇔ x̄ ∈ R. 6 12. Für jedes Polynom P ∈ Z[t1 , . . . , tk ] ist die (unsignierte) polynomiale Abbildung Nk → N, (x1 , . . . , xk ) 7→ |P (x1 , . . . , xk )| primitiv rekursiv. Dies folgt aus iterativer Anwendung von (8) und (9) sowie (7). Wir konstruieren im folgenden eine weitere, für den Rest des Kapitels wesentliche Funktion, nämlich die Cantorsche Paarfunktion. Dies ist eine primitiv rekursive Bijektion CP : N2 → N, von der wir oft Gebrauch machen werden. Konstruktion 1.5 (Cantorsche Paarfunktion). Definiere zunächst die Dreiecksfunktion T durch n · (n + 1) . 2 Dann existieren für jedes z ∈ N eindeutige Zahlen n, y ∈ N mit T : N → N, n 7→ 1 + 2 + . . . + n = z = T (n) + y und y ≤ n. Setzen wir x := n − y, so gilt x ≥ 0, und es folgt: Für jedes z ∈ N existiert ein eindeutiges Paar (x, y) ∈ N2 , so dass z = T (x + y) + y. Definiere die Funktion CP : N2 → N, (x, y) 7→ T (x + y) + y. CP ist also eine Bijektion, und offensichtlich sind T und somit auch CP primitiv rekursiv. Weiter definieren wir L, R : N → N implizit durch z = CP (L(z), R(z)) für alle z ∈ N. L(z) und R(z) sind also die linke und die rechte Koordinate des eindeutigen Paares (x, y), das durch CP auf z abgebildet wird. (Explizit könnte man also die Funktionen durch L := π1 ◦ CP −1 und R := π2 ◦ CP −1 definieren, vgl. Definition 1.2 (3)). Abschließend zeigen wir, dass L und R primitiv rekursiv sind. Betrachte die Hilfsfunktion h : N → N, n 7→ max{k ∈ N | T (k) ≤ n}. Dann ist h primitiv rekursiv, denn h(0) = 0 und h(t + 1) = h(t) + 1T (h(t)+1)≤t+1 für alle t ∈ N. Nun folgt R(n) · T (h(n)) = n− L(n) · R(n) = h(n) − und · sind primitiv rekursiv (vgl. 1.4 (5)), also auch L und für alle n ∈ N. T und − R. 7 Die Cantorsche Paarfunktion CP liefert uns, iterativ angewandt, primitiv rekursive Bijektionen von Nk nach N für beliebiges k: Definition 1.6. Sei k ∈ N, k ≥ 2. Definiere die Funktion CPk : Nk → N durch CP2 := CP und CPk+1 : Nk+1 → N, (x1 , . . . , xk+1 ) 7→ CPk (x1 , . . . , xk−1 , CP (xk , xk+1 )). CPk ist offenbar primitiv rekursiv und bijektiv. 1.3 Rekursive Funktionen Betrachten wir die Funktion f , die eine gegebene natürliche Zahl auf die Position des ersten Vorkommens ihrer Ziffernfolge in der Dezimaldarstellung der Zahl π abbildet. So wäre etwa f (415) = 3, denn π = 3, 1415926 . . ., also findet sich die Ziffernfolge “415” erstmals an Position 3 beginnend. Diese Funktion mag, verglichen mit den Funktionen aus Beispiel 1.4, ein wenig skurril erscheinen, weil sie nicht einfach auf arithmetischen Berechnungen natürlicher Zahlen beruht, die man in einer handlichen Formel zusammenfassen kann. Dennoch ist f eine wohldefinierte Funktion, die natürliche Zahlen auf natürliche Zahlen abbildet, und die Intuition sagt uns, dass f sicherlich von einem Computer berechnet werden kann: Es gibt zahlreiche Verfahren, die Zahl π auf beliebig viele Nachkommastellen genau zu berechnen; ein Algorithmus, der f (n) berechnen soll, könnte also zukzessive immer mehr Nachkommastellen von π berechnen und jeweils testen, ob die zuletzt berechneten Ziffern gerade mit denen von n übereinstimmen. Ein Computer kann die Funktion f also deshalb berechnen, weil er neben Arithmetik noch etwas kann: Suchen. Diese Fähigkeit erlaubt es ihm, Funktionen zu berechnen, die nicht primitiv rekursiv sind. Wir müssen also die Klasse der primitiv rekursiven Funktionen, erweitern, um alle berechenbaren Funktionen zu verstehen. Allerdings stellt sich hier noch ein weiteres Problem: Es ist keineswegs klar, ob die Funktion f überhaupt auf ganz N definiert ist, d.h. ob jede endliche Ziffernfolge in der Dezimaldarstellung von π auftaucht (Es wird gemeinhin angenommen, dass π normal ist, was dieses implizieren würde, ist aber bisher unbewiesen). D.h. wir können f zwar wie oben definieren, ohne aber zu wissen, was der Definitionsbereich von f ist. Falls wir also den oben skizzierten Algorithmus mit einer Eingabe n ins Rennen schicken, deren Dezimaldarstellung nicht in π vorkommt, so würde dieser offenbar unendlich lange laufen, ohne die Zahl je zu finden und ohne je zu der Erkenntnis zu gelangen, dass er sie nicht finden wird. Bei der Klassifikation von berechenbaren Funktionen haben wir es also tatsächlich mit partiellen Funktionen zu tun, die i.a. gar nicht auf ganz Nk definiert sind: Definition 1.7. Eine partielle Funktion (von Nk nach Nl ) ist eine Funktion f : S → Nl für eine Teilmenge S ⊂ Nk . Wir schreiben kurz f : Nk 8 Nl . S heißt der Definitionsbereich von f , geschrieben S = Def(f ). Ist Def(f ) = Nk , so nennen wir f totale Funktion. Wir können partielle Funktionen wie gewohnt verknüpfen, müssen dann aber auf den Definitionsbereich aufpassen: Definition 1.8. Wir definieren folgende Verknüpfungen für partielle Funktionen: 1. Sind g1 , . . . , gm : Nk mit Nl partielle Funktionen, dann ist ḡ := (g1 , . . . , gm ) Def(ḡ) = m \ Def(gi ) i=1 gegeben durch ḡ : Nk 2. Ist f : Nk Nm·l , x̄ 7→ (g1 (x̄), . . . , gm (x̄)) Nl und g : Nl (x̄ ∈ Def(ḡ)). Nq , so ist g ◦ f mit Def(g ◦ f ) = Def(f ) ∩ f −1 (Def(g)) gegeben durch g ◦ f : Nk Nq , (x1 , . . . , xk ) 7→ g(f (x1 , . . . , xk )). (Man beachte, dass Definition 1.8 im Falle von totalen Funktionen mit Definition 1.1 übereinstimmt, so dass hier keine Mehrdeutigkeiten entstehen.) Insbesondere ist mit diesen Verknüpfungen auch die Komposition von partiellen Funktionen gemäß Definition 1.3 (2) definiert. Definition 1.9 (µ-Operator). Sei f : Nk+1 x̄ := (x1 , . . . , xk ) ∈ Nk setze N eine partielle Funktion. Für M (x̄) := {n ∈ N | (x̄, l) ∈ Def(f ) ∀ l ≤ n und f (x̄, n) = 0}. Dann ist µf : Nk N mit Def(µf ) = {x̄ ∈ Nk | M (x̄) 6= ∅} gegeben durch µf (x̄) = min(M (x̄)) ∀x̄ ∈ Def(µf ). Definition 1.10. Die Klasse der rekursiven Funktionen ist die kleinste Klasse N (für beliebiges k ∈ N+ ), die die primitiv von partiellen Funktionen f : Nk rekursiven Funktionen enthält und abgeschlossen unter Komposition, primitiver Rekursion und dem µ-Operator ist. Beispiel 1.11. 1. Jede Funktion f : Nk N mit einelementigem Definitionsbereich ist rekursiv: Sei m̄ := (m1 , . . . , mk ) ∈ Nk und f : {m̄} → N, m̄ 7→ l. Setze hm̄,l : Nk+1 → N, n̄ 7→ |n̄ − (m1 , . . . , mk , l)|. Dann ist hm̄,l primitiv rekursiv (dies folgt leicht mithilfe von 1.4 (7)) und f = µhm̄,l . 9 2. Jede Funktion mit endlichem Definitionsbereich ist rekursiv: Sei S := {m̄1 , . . . , m̄j } ⊂ Nk und f : S → N, m̄i 7→ li . Setze h : Nk+1 → N, n̄ 7→ j Y hm̄i ,li (n̄). i=1 Dann ist h primitiv rekursiv und f = µh. Wir beenden diesen Abschnitt mit einem klassischen Resultat der theoretischen Informatik, dem Normalformsatz von Kleene (in einer abgeschwächten Version). Die Definition einer rekursiven Funktion erlaubt es uns, den µ-Operator in beliebiger Verschachtelung zu verwenden, um rekursive Funktionen zu konstruieren. Der Normalformsatz sagt aber, dass dies gar nicht nötig ist: Jede rekursive Funktion kann aus primitiv rekursiven Funktionen mit einer einzigen Anwendung des µ-Operators konstruiert werden. Wir verzichten an dieser Stelle auf einen Beweis. Satz 1.12 (Normalformsatz von Kleene). Sei f : Nk N eine rekursive Funktion. Dann existieren primitiv rekursive Funktionen h : Nk+1 → N und u : N → N, so dass gilt f = u ◦ µh. 1.4 Rekursiv aufzählbare und rekursive Mengen Zwei für die weiteren Kapitel zentrale Begriffe, den uns die Theorie der rekursiven Funktionen liefert, sind die Begriffe der rekursiven bzw. rekursiv aufzählbaren Mengen. Wir wollen zunächst diese Begriffe definieren: Definition 1.13. Eine Menge S ⊂ Nk heißt rekursiv, wenn ihre Indikatorfunktion 1S rekursiv ist. Eine Menge S ist also rekursiv, wenn es einen Algorithmus gibt, der bei Eingabe von x̄ ∈ Nk entscheidet, ob x̄ ∈ S. Eine Menge ist rekursiv aufzählbar, wenn es einen Algorithmus gibt, der eine Liste aller Elemente in S generiert. Es folgt leicht aus den Definitionen (und ist auch gut anschaulich nachzuvollziehen), dass jede rekursive Menge rekursiv aufzählbar ist. Es ist aber weit weniger klar, ob jede rekursiv aufzählbare Menge auch rekursiv ist. Die Antwort hierauf lautet Nein. Wir werden in diesem Abschnitt sehen, dass die Menge S genau dann rekursiv ist, wenn S und N \ S rekursiv aufzählbar ist. Dies zeigt noch nicht, dass rekursiv aufzählbare Mengen i.a. nicht rekursiv sind, denn die Existenz einer reskursiv aufzählbaren Menge S, für die N \ S nicht rekursiv aufzählbar ist, ist keineswegs trivial. Eine solche Menge werden wir in Abschnitt 1.5 explizit konstruieren. 10 Definition 1.14. Eine Menge S ⊂ Nk heißt rekursiv aufzählbar, wenn eine partiell rekursive Funktion f : Nk N mit Def(f ) = S existiert. Lemma 1.15. Eine Funktion f : Nk N ist genau dann rekursiv, wenn ihr Graph Γf := {(x̄, f (x̄)) | x̄ ∈ Def(f )} ⊂ Nk+1 rekursiv aufzählbar ist. Beweis. Sei zunächst f : Nk h : Nk+2 N rekursiv. Setze N, (x1 , . . . , xk+2 ) 7→ |f (x1 , . . . , xk ) − xk+1 |. Dann ist Def(µh) = Γf . Sei andersherum Γf rekursiv aufzählbar, d.h. es existiert eine rekursive Funktion g : Nk+1 N mit Def(g) = Γf . Seien (gemäß Satz 1.12) u : N → N und h : Nk+2 → N primitiv rekursiv mit g = u ◦ µh. Setze die Funktion q : Nk+1 N, (x1 , . . . , xk , n) 7→ h(x1 , . . . , xk , L(n), R(n)). Dann ist q rekursiv und f = u ◦ L ◦ µq. Satz 1.16. Eine Menge S ⊂ Nk ist genau dann rekursiv, wenn S und Nk \ S rekursiv aufzählbar sind. Beweis. Seien zunächst S und S̄ := Nk \S rekursiv aufzählbar. Es existieren also rekursive Funktionen f, f¯ : Nk → N mit Bild(f ) = S und Bild(f¯) = S̄. Setze f 0 := c1 ◦ f , f¯0 := c0 ◦ f¯. Dann sind f 0 , f¯0 rekursiv (vgl. Beispiel 1.4 (1)), also sind nach Lemma 1.15 die Graphen Γf 0 und Γf¯0 rekursiv aufzählbar. Dann ist auch Γ := Γf 0 ∪ Γf¯0 rekursiv aufzählbar (vgl. Übungsblatt1, Aufgabe 2.2). Nun ist Γ gerade der Graph der Indikatorfunktion 1S . Wiederum nach Aufgabe 2.4 ist also 1S und somit S rekursiv. Sei nun andersherum 1S rekursiv. Dann ist für S̄ = Nk \ S auch 1S̄ rekursiv, k · 1 denn 1x̄∈S = 1 − x̄∈S̄ für alle x̄ ∈ N . Setze h : Nk+1 → N, (x̄, n) 7→ 1S̄ (x̄). Dann ist h rekursiv und Def(µh) = S. Dies zeigt, dass S rekursiv aufzählbar ist. Das gleiche Argument, angewandt auf S̄, zeigt, dass S̄ rekursiv aufzählbar ist. 1.5 Diophantische Mengen und Funktionen Für alle weiteren Betrachtungen bzgl. Berechenbarkeit in dieser Vorlesung spielen diophantische Mengen und Funktionen eine zentrale Rolle. Eine diophantische Menge ist eine Teilmenge von Nk , die auf bestimmte Weise durch ein ganzzahliges Polynom vollständig charakterisiert wird. Eine Funktion heißt dann diophantisch, wenn ihr Graph eine diophantische Menge ist. Ein wesentliches –aber 11 keineswegs triviales– Resultat ist, dass eine Funktion genau dann diophantisch ist, wenn sie rekursiv ist. Das Konzept der diophantischen Funktionen liefert also eine alternative Klassifikation der rekursiven Funktionen; diese Erkenntnis wird uns ein sehr hilfreiches und mächtiges Werkzeug in die Hand geben, um Berechenbarkeitsprobleme in Gruppen in Angriff zu nehmen. Den Beweis dieser Äquivalenz erbrachte zunächst Yuri Matyasevich 1970 im Zuge seines Beweises der Unentscheidbarkeit von Hilberts zehntem Problem 5 . Ziel dieses Abschnittes ist es, den Beweis dieser Äquivalenz zu skizzieren; wir folgen dabei der Arbeit von Martin Davis ([D]), die einen gegenüber Matyasevich leicht abgewandelten Beweis liefert. Wir beginnen mit einer Definition. Eine Menge S ⊂ Nk ist diophantisch, wenn sie genau aus allen Präfizes aller Nullstellen eines ganzzahligen Polynoms besteht: Definition 1.17. Eine Menge S ⊂ Nk heißt diophantisch, wenn ein Polynom PS ∈ Z[t1 , . . . , tn ] (mit n ≥ k) existiert, so dass gilt: (x1 , . . . , xk ) ∈ S genau dann, wenn y1 , . . . , yn−k ∈ N existieren, so dass PS (x1 , . . . , xk , y1 , . . . , yn−k ) = 0. Wir sagen in diesem Fall, dass das Polynom PS die Menge S charakterisiert. Man beachte aber, dass PS natürlich keineswegs eindeutig bestimmt ist. Bemerkung 1.18. Dass das charakterisierende Polynom aus dem Polynomring über Z stammt, also negative Koeffizienten haben kann, ist hier wesentlich; ein charakterisierendes Polynom mit ausschließlich positiven Koeffizienten zu wählen ist im allgemeinen nicht möglich. Alternativ kann man aber eine diophantische Menge mit zwei Polynomen mit positiven Koeffizienten charakterisieren: Stellen wir PS dar als PS = P+ − P − , wobei P+ die Summe aller Monome aus PS mit positiven Koeffizienten und −P− die Summe aller Monome mit negativen Koeffizienten ist, so können wir S beschreiben als S = {x̄ ∈ Nk | ∃ȳ ∈ Nn−k : P+ (x̄, ȳ) = P− (x̄, ȳ)}. (1.1) Diese Charakterisierung wird ebenfalls nützlich sein. Eine diophantische Menge S ∈ Nk ist also sehr leicht zu beschreiben, weil sie durch ein charakterisierendes Polynom vollständig definiert ist. Die erste Frage, die nun auftaucht, ist, welche Mengen diophantisch sind. Wir fangen mit einigen Beispielen diophantischer Mengen an: Beispiel 1.19. 1. Nk ist diophantisch; wähle etwa PNk = 0. 5 Hilberts zehntes Problem lautet: “Gibt es einen Algorithmus, der entscheidet, ob ein gegebenes ganzzahliges Polynom P in n Variablen eine Nullstelle in Zn hat?” 12 2. Die leere Menge ist diophantisch; wähle etwa P∅ = 1. 3. S := {(x, y) ∈ N2 | x < y} ist diophantisch, denn x < y ⇔ ∃z ∈ N : x − y + z + 1 = 0 für alle x, y ∈ N. (Wähle also PS = t1 − t2 + t3 + 1.) 4. S := {(x, y) ∈ N2 | x ≤ y} ist diophantisch, denn x ≤ y ⇔ ∃z ∈ N : x − y + z = 0. Wir zeigen nun einige Eigenschaften diophantischer Mengen, von denen wir danach häufig und implizit Gebrauch machen werden. Lemma 1.20. Seien S, T ⊂ Nk diophantisch. Dann gilt 1. S ∩ T ist diophantisch. 2. S ∪ T ist diophantisch. 3. Ist π = (π1k , . . . , πlk ) die Projektion auf die ersten l Koordinaten, so ist π(S) ⊂ Nl diophantisch. Beweis. Wir zeigen zunächst (1): Ist etwa PS ∈ Z[t1 , . . . , tm ] und PT ∈ Z[t1 , . . . , tn ], dann setze l = m + n − k und wähle PS∩T ∈ Z[t1 , . . . , tl ], (x1 , . . . , xl ) 7→ PS (x1 , . . . , xm )2 + PT (x1 , . . . , xk , xm+1 , . . . , xl )2 . PS∩T charakterieisert offenbar S ∩ T . Sind nun PS , PT und l wie oben, dann ist PS∪T ∈ Z[t1 , . . . , tl ], (x1 , . . . , xl ) 7→ PS (x1 , . . . , xm ) · PT (x1 , . . . , xk , xm+1 , . . . , xl ), ein charakerisierendes Polynom für S ∪ T . Dies zeigt (2). Aussage (3) ist trivial; jedes Polynom, das S charakterisiert, charakterisiert auch π(S). Wir behandeln im folgenden ein weiteres Lemma, das es uns erlauben wird, bei der Charakterisierung diophantischer Mengen mit beschränkten Quantoren (∃y)≤x und (∀y)≤x zu arbeiten. Ist A(x) ein beliebiges Prädikat (also ein Ausdruck, der für x entweder wahr oder falsch ist), dann bedeutet (∃y)≤x : A(y) gerade ∃y ∈ N : y ≤ x ∧ A(y). Analog ist (∀y)≤x : A(y) gerade gleichbedeutend mit ∀y ∈ N : y > x ∨ A(y). Der Beweis von Teil 2 des nachfolgenden Lemmas ist recht technisch (und deutlich schwerer als der Beweis von Teil 1). Wir werden im Kontext dieses Skriptes auf den Beweis verzichten und verweisen hierfür auf [D]. 13 Lemma 1.21. Sei P ∈ Z[t1 , . . . , tn ] und k < n sowie l := n − k. Dann gilt 1. R := {(x1 , . . . , xk ) | (∃y1 )≤x1 ∃y2 , . . . , yl : P (x1 , . . . , xk , y1 , . . . , yl ) = 0} ist diophantisch. 2. S := {(x1 , . . . , xk ) | (∀y1 )≤x1 ∃y2 , . . . , yl : P (x1 , . . . , xk , y1 , . . . , yl ) = 0} ist diophantisch. Beweis. Der Beweis von (1) ist leicht; es gilt R = {(x1 , . . . , xk ) | (∃y1 , y2 , . . . , yl : y1 ≤ x1 ∧ P (x1 , . . . , xk , y1 , . . . , yl ) = 0}. Die Aussage folgt also aus Beispiel 1.19 (4) und Lemma 1.20 (1). Für den Beweis von (2) siehe [D], Theorem 5.1. Definition 1.22. Eine partielle Funktion f : Nk ihr Graph N heißt diophantisch, wenn Γf := {(x1 , . . . , xk , f (x1 , . . . , xk )) | (x1 , . . . , xk ) ∈ Def(f )} ⊂ Nk+1 diophantisch ist. Wir sagen kurz, dass ein Polynom P die Funktion f charakterisiert, wenn P den Graphen Γf charakterisiert. Beispiel 1.23. tisch, denn 1. Die konstante Funktion c0 : Nk → N, x̄ 7→ 0 ist diophany = c0 (x̄) ⇔ y = 0 ∀x̄ ∈ Nk , y ∈ N. 2. Die Nachfolgerfunktion s : N → N, x 7→ x + 1 ist diophantisch, denn y = s(x) ⇔ y − x − 1 = 0 ∀x, y ∈ N. 3. Die Projektion πik ist diophantisch, denn y = πik (x1 , . . . , xk ) ⇔ y − xi = 0 ∀x1 , . . . , xk , y ∈ N. Weitere, wichtige Beispiele für diophantische Funktionen liefert das folgende Lemma. Lemma 1.24. Die Funktionen CP , L und R aus Konstruktion 1.5 sind diophantisch. Beweis. Seien x, y ∈ N. Setzen wir n := x + y, so folgt unter Berücksichtigung, dass 2T (n) = n · (n + 1), für alle z ∈ N z = CP (x, y) ⇔ (x + y)(x + y + 1) + 2y − 2z = 0. Dies zeigt, dass CP diophantisch ist. Dass L und R diophantisch sind, folgt daraus, dass x = L(n) ⇔ ∃y ∈ N : CP (x, y) = n x = R(n) ⇔ ∃y ∈ N : CP (y, x) = n 14 bzw. Nun kommen wir zu einer universellen Konstruktion, die eine sehr zentrale Rolle spielen wird. Wir konstruieren eine diophantische (und rekursive) Funktion S : N2 → N, für die gilt: Für jede endliche Sequenz von Zahlen a1 , . . . , an ∈ N existiert ein u ∈ N, so dass S(i, u) = ai für i = 1, . . . , n. Stellt man sich die Funktion also als eine unendliche Wertetabelle vor, in der in der i-ten Zeile und u-ten Spalte die Zahl S(i, u) eingetragen ist, so findet man für jede beliebige (und beliebig lange) endliche Sequenz von Zahlen a1 , . . . , an ∈ N eine Spalte in der Tabelle, deren erste n Einträge gerade die Zahlen a1 , . . . , an sind (sofern man die 0-te Zeile ignoriert; S(0, u) wird immer 0 sein). Dies wird es uns später erlauben, eine beliebige endliche Sequenz mit einer einzigen Zahl zu kodieren. Konstruktion 1.25 (Sequenzfunktion S). Die Definition von S ist einfach; etwas Arbeit macht es aber, die gewünschten Eigenschaften von S zu verifizieren. Seien u, i ∈ N. Die Division mit Rest der Zahl L(u) durch die Zahl 1 + iR(u) liefert eindeutige Zahlen k, r ∈ N mit 0 ≤ r < 1 + iR(u) und L(u) = k · (1 + iR(u)) + r. Setze S(i, u) := r. S ist also gerade (L(u) mod 1 + iR(u)) (vgl. Beispiel 1.4 (11)), und damit insbesondere rekursiv. Zunächst zeigen wir, dass S diophantisch ist: Es gilt, dass r = S(i, u) genau dann, wenn das folgende Gleichungssystem mit den Variablen x, y, z, v (x + y)(x + y + 1) + 2y − 2u = 0 (1.2) r + z · (1 + iy) − x = 0 (1.3) 0 (1.4) r + v + 1 − (1 + iy) = eine Lösung hat: Aus (1.2) folgt, dass x = L(u) und y = R(u). Aus (1.3) folgt dann, dass L(u) ≡ r mod 1 + iy, und aus (1.4) folgt schließlich, dass r < 1 + iR(u). Bezeichnen wir die drei obigen Polynome mit P1 , P2 , P3 ∈ Z[u, i, r, x, y, z, v], so ist P12 + P22 + P32 ein charakterisierendes Polynom für den Graphen {(i, u, S(i, u))|i, u ∈ N} und somit für S. Also ist S diophantisch. Seien nun a1 , . . . , an ∈ N beliebig. Wir zeigen, dass ein u ∈ N existiert, so dass S(i, u) = ai für i = 1, . . . , Q n. Wähle y ∈ N, so dass gilt ai < y und i | y für i = 1, . . . , n (also z.B. y := n! · ai ). Dann sind die Zahlen 1+y, 1+2y, . . . , 1+ny paarweise teilerfremd: Ist d ∈ N mit d | 1 + iy, d | 1 + jy, i < j, so folgt d | (j · (1 + iy) − i · (1 + jy)), also d | j − i. 15 Somit folgt d ≤ n, also d | y und somit d | iy, es folgt d - iy + 1, im Widerspruch zur Annahme. Nach dem aus der Algebra bekannten Chinesischen Restsatz existiert nun ein x ∈ N, so dass gilt x ≡ ai mod 1 + iy für i = 1, . . . , n. Wähle u := CP −1 (x, y). Dann gilt also L(u) = x, R(u) = y und somit ai ≡ L(u) mod 1 + iR(u) und ai < R(u) < 1 + iR(u). Also folgt ai = S(i, u). Nun haben wir alle nötigen Hilfsmittel erarbeitet, um den Hauptsatz dieses Abschnitts beweisen: Satz 1.26. Eine partielle Funktion f : Nk wenn sie rekursiv ist. N ist genau dann diophantisch, Beweis. Sei zunächst f diophantisch. Dann existiert nach Definition ein Polynom P ∈ Z[t1 , . . . , tn ] (n > k), so dass y = f (x1 , . . . , xk ) ⇔ ∃ȳ = (y1 , . . . , yl ) : P (x1 , . . . , xk , y, ȳ) = 0 (mit l := n − k − 1). Betrachte die Funktion h : Nk+1 −1 N, (x̄, n) 7→ P (x̄, CPl+1 (n)) (vgl. Definition 1.6). Dann ist h rekursiv und f = π1 ◦ µh. Somit ist f rekursiv. Es bleibt zu zeigen, dass jede rekursive Funktion diophantisch ist. Nach Beispiel 1.23 sind alle primitiven Funktionen diophantisch. Es genügt also zu zeigen, dass die Klasse der diophantischen Funktionen abgeschlossen unter Komposition, primitiver Rekursion und dem µ-Operator ist. Dies zeigen wir im einzelnen, unter regem Gebrauch der Lemmata 1.20 und 1.21: • Komposition: Seien g1 , . . . , gm : Nk und f = h ◦ (g1 , . . . , gm ). Dann gilt y = f (x1 , . . . , xk ) ⇔ N und h : Nm N diophantisch ∃t1 , . . . , tm : t1 = g1 (x1 , . . . , xk ) .. . ∧ tm = gm (x1 , . . . , xk ) ∧ y = h(t1 , . . . , tm ). 16 • Primitive Rekursion: Seien f, g und h wie in Definition 1.3 (3) und g und h diophantisch. Wir nutzen wieder Konstruktion 1.25: Für x̄ ∈ Nk und z ∈ N existiert ein u ∈ N mit S(i, u) = f (x̄, i − 1) für 1 ≤ i ≤ z. Also gilt: y = f (x̄, z) ⇔ ∃u ∈ N : S(1, u) = g(x̄) ∧ (∀t)≤z : S(t + 1, u) = h(t, S(t, u), x̄) ∧ y = S(z + 1, u). • µ-Operator: Sei f : Nk+1 y = µf (x̄) ⇔ N diophantisch. Dann gilt f (x̄, y) = 0 ∧ (∀t)≤y (t = y ∨ f (x̄, t) > 0). Im letzten Teil dieses Kapitels konstruieren wir eine Teilmenge V ⊂ N, für die gilt, dass V diophantisch, aber N \ V nicht diophantisch ist. Die Existenz einer solchen Menge ist zentral für die Konstruktion von Gruppen mit unentscheidbaren Eigenschaften, wie wir sie im folgenden Kapitel machen wollen. Konstruktion 1.27. Wir fixieren die Menge von Variablen X := {t0 , t1 , t2 , t3 , . . .} und konstruieren zunächst eine explizite Aufzählung aller Polynome mit Variablen aus X und nicht-negativen Koeffizienten: Setze dazu P0 := 0, P1 := 1 und für alle i ∈ N+ P3i−1 := ti−1 , P3i := PL(i) + PR(i) , P3i+1 := PL(i) · PR(i) . Die Folge (Pn )n∈N enthält alle Polynome in Variablen aus X, wie man leicht (etwa per Induktion über den Grad) einsehen kann (die Pi sind natürlich nicht paarweise verschieden; dies spielt aber weiter keine Rolle). Weiter ist jedes Pn ein Polynom in (höchstens) den Variablen t0 , . . . , tn , wie man induktiv einsieht. Für n ∈ N sei nun Dn := {x ∈ N | ∃x1 , . . . , xn ∈ N : PL(n) − PR(n) (x, x1 , . . . , xn ) = 0}. Dann ist jedes Dn diophantisch (vgl. (1.1)), und somit ist (Dn )n∈N eine Liste aller diophantischen Mengen. Die folgenden beiden Theoreme beweisen die Existenz der oben angesprochenen Menge V ⊂ N und beschließen dieses Kapitel. 17 Satz 1.28. Die Menge V := {n ∈ N | n ∈ Dn } ist diophantisch. Beweis. Sei n ∈ N. Ist n ∈ Dn , dann existiert x̄ := (x1 , . . . , xn ) ∈ Nn , so dass PL(n) (n, x̄)) = PR(n) (n, x̄)). Weiter existiert nach Kontruktion 1.25 ein u ∈ N, so dass S(i, u) = Pi (n, x̄) für i = 1, . . . , 3n + 1. Daraus ergibt sich n ∈ Dn ⇔ ∃u ∈ N : S(1, u) = 1 ∧ S(2, u) = n ∧ ∀i≤n S(3i, u) = S(L(i), u) + S(R(i), u) ∧ ∀i≤n S(3i + 1, u) = S(L(i), u) · S(R(i), u) ∧ S(L(n), u) = S(R(n), u). Dies zeigt die Behauptung. Satz 1.29. Die Menge V̄ := {n ∈ N | n ∈ / Dn } ist nicht diophantisch. Beweis. Es gilt nach Definition für alle n ∈ N n ∈ V̄ ⇔ n ∈ / Dn , also V̄ 6= Dn . Da die Folge (Dn )n∈N alle diophantischen Teilmengen von N enthält, folgt die Behauptung. Wir beschließen diesen Abschnitt mit der Schlussfolgerung, dass Hilberts Zehntes Problem keine Lösung besitzt. Dieses zehnte auf der Liste der 23 von David Hilbert 1900 vorgestellten Probleme lautet: “Man gebe ein Verfahren an, das für ein beliebiges ganzzahliges Polynom entscheidet, ob es eine ganzzahlige Nullstelle besitzt.” Wie wir sehen werden, ist es eine Konsequenz der Ergebnisse dieses Abschnittes, dass es keinen Algorithmus gibt, der für ein beliebiges Polynom P ∈ Z[t1 , . . . , tk ] entscheidet, ob P eine Nullstelle mit nicht-negativen Koeffizienten, d.h. in Nk , besitzt. Man kann wie folgt einsehen, dass dies die Unentscheidbarkeit für beliebige Nullstellen (nach denen Hilbert fragt) impliziert: Nach einem bekannten Resultat von Lagrange ist jede nicht-negative ganze Zahl als Summe von 4 Quadraten darstellbar. Betrachten wir das Polynom P 0 , das wir erhalten, wenn wir in P jedes Vorkommen von ti durch das Polynom t2i,1 + t2i,2 + t2i,3 + t2i,4 ersetzen, so gilt: P 0 hat eine Nullstelle in Z4k genau dann, wenn P eine Nullstelle in Nk besitzt. Somit folgt aus den Ergebnissen dieses Abschnittes unmittelbar: Korollar 1.30. Hilberts Zehntes Problem ist unlösbar. 18 Beweis. Für n ∈ N sei Qn := PL(n) − PR(n) (n) ∈ Z[t1 , . . . , tn ]. Qn ist also dasjenige Polynom, das man durch Einsetzen von n für t0 im Polynom PL(n) − PR(n) erhält. Dann gilt offenbar Qn hat eine Nullstelle in Nn ⇔ n ∈ V. Ein Algorithmus gemäß Hilberts Zehntem Problem, der für ein gegebenes Polynom entscheidet, ob es eine Nullstelle besitzt, wäre also hinreichend, um die Indikatorfunktion 1V zu berechnen. Es folgt aber aus den Sätzen 1.28, 1.29 und 1.26, dass V , und somit 1V , nicht rekursiv ist. Ein Widerspruch. 1.6 Rekursivität auf N∗ Unter einer rekursiven Funktion haben wir in diesem Kapitel bislang stets eine Funktion von Nk nach N (für festes k) verstanden. Vor dem Hintergrund, dass rekursive Funktionen gerade die von einem Computer berechenbaren Funktionen sind, bedeutet dies, dass jeder Algorithmus eine feste Anzahl (k) von natürlichen Zahlen als Input und eine einzige natürliche Zahl als Ouput hat. Natürlich sind wir es von einem Computer gewöhnt, dass er viel mehr kann als nur mit natürlichen Zahlen zu rechnen; dennoch ist diese Charakterisierung rekursiver Funktionen als Funktionen natürlicher Zahlen durchaus legitim: Die Daten, die ein Computer speichern und verarbeiten kann, sind immer Binärdaten, die sich als natürliche Zahlen interpretieren lassen. Wenn ein Computer mit anderen Typen von Daten umgeht (Fließkommazahlen, Texte, Fotos, . . . ), so steckt nichts anderes dahinter als eine andere Interpretation der Binärzahlen, die vom Computer verarbeitet werden. Anders ausgedrückt, findet hier also eine Identifikation bestimmter Daten mit natürlichen Zahlen statt, die es dem Computer ermöglicht, Berechnungen auf jenen Daten durchzuführen. Somit sollte die Theorie, die wir bisher erarbeitet haben, ausreichen, um rekursive Funktionen für beliebige Datenmengen zu formalisieren; alles, was wir tun müssen, ist, die Daten auf geeignete Weise mit natürlichen Zahlen zu identifizieren. In diesem Abschnitt wollen wir zwar noch nicht die natürlichen Zahlen verlassen, aber wir wollen den Begriff der rekursiven Funktionen dahingehend verallgemeinern, dass die Funktionen eine variable Anzahl von Zahlen als Input erlaubt (genauer: ein Element aus Nk für beliebiges k) und ggf. auch nicht nur eine Zahl, sondern ein Tupel von Zahlen ausgibt. Wir betrachten also Funktionen, deren Definitionsbereich [ N∗ := Nk k∈N+ ist (oder eine Teilmenge von N∗ im Falle partieller Funktionen). Dies tun wir, indem wir eine Bijektion zwischen N∗ und N festlegen, die jedes Tupel (n1 , . . . , nk ) eindeutig mit einer natürlichen Zahl identifiziert: Definition & Lemma 1.31. Die Abbildung CP∗ : N∗ → N wird definiert durch (n1 , . . . , nk ) 7→ CP (k, CPk (n1 , . . . , nk )). 19 CP∗ ist eine Bijektion, die Umkehrfunktion ist gegeben durch −1 CP∗−1 (n) = CPL(n) (R(n)). Die Idee ist nun klar: Wollen wir eine (partielle) Funktion f : N∗ N algorithmisch berechnen, so übergeben wir statt dem Inputvektor (n1 , . . . , nk ) das Bild n = CP∗ (n1 , . . . , nk ). Dies enthält alle Informationen, um daraus (n1 , . . . , nk ) = CP∗−1 (n) zu extrahieren und dann f (n1 , . . . , nk ) zu berechnen; auf formaler Ebene haben wir es nun aber mit einer Funktion von N nach N zu tun. Dies motiviert die folgenden Definitionen. Definition 1.32. Eine Funktion f : N∗ N heißt rekursiv, falls die Funktion f ◦ CP∗−1 : N N rekursiv ist. Wir werden nun einige Beispiele für rekursive Funktionen geben: Beispiel 1.33. Die folgenden Funktionen sind rekursiv. Der Beweis ist Übungsaufgabe 8.1. 1. Die Längenfunktion l : N∗ → N, (n1 , . . . , nk ) 7→ k ist rekursiv, denn l ◦ CP∗−1 (n) = L(n) für alle n ∈ N. P Pk 2. : N∗ → N, (n1 , . . . , nk ) 7→ i=1 ni . 3. max : N∗ → N, (n1 , . . . , nk ) 7→ max{n1 , . . . , nk }. 4. πj∗ : N∗ N, (n1 , . . . , nk ) 7→ nj mit Def(πj∗ ) = {n̄ ∈ N∗ | l(n̄) ≥ j}. Ebenso wie den Begriff der rekursiven Funktionen können wir den Begriff der rekursiven Mengen auf Teilmengen S ⊂ N∗ verallgemeinern, indem wir sie mit Mengen natürlicher Zahlen identifizieren. Definition 1.34. Eine Menge S ⊂ N∗ heißt • rekursiv, falls CP∗ (S) ⊂ N rekursiv ist, • rekursiv aufzählbar, falls CP∗ (S) ⊂ N rekursiv aufzählbar ist. Bemerkung 1.35. An dieser Stelle sei bemerkt, dass wir im Falle einer Teilmenge S ⊂ Nk ⊂ N∗ zwei scheinbar konkurrierende Definitionen der Eigenschaft rekursiv bzw. rekursiv aufzählbar (1.13 bzw. 1.14 und 1.34). Es ist aber leicht einzusehen, dass die Definitionen äquivalent sind, weil die Funktion CP∗ |Nk offenbar rekursiv ist. 20 2 Gruppen und Gruppenpräsentierungen Wir wissen aus dem Grundstudium, was eine Gruppe ist. Die zentrale Frage, die uns zunächst beschäftigt, ist, wie wir nun eine Gruppe einem Diskussionspartner, bzw. einem Computer, beschreiben können. Welche Informationen sind also nötig, um eine Gruppe zu verstehen? Ist die Gruppe G endlich, so ist es nicht allzu schwer, sie zu beschreiben: Man liefert eine Liste aller Elemente von G und beschreibt, etwa durch eine Gruppentafel, was das Produkt zweier beliebiger Gruppenelemente ergibt. Ist die Gruppe unendlich –und das ist für uns der interessantere Fall–, ist die Lage schon schwieriger. Der Ansatz, den wir verfolgen, ist, dem Zuhörer zunächst ein Erzeugendensystem zu liefern. Ähnlich einem Erzeugendensystem eines Vektorraumes, aus dem alle Vektoren als Linearkombinationen dargestellt werden können, ist ein Erzeugendensystem einer Gruppe ein Tupel S von Gruppenelementen, für die gilt, dass jedes Element aus G Produkt von Elementen aus S und deren Inversen ist. Jedes Element g ∈ G kann also als Produkt ±1 g = s±1 1 · . . . · sn mit si ∈ S dargestellt werden. Allerdings sind im allgemeinen diese Produkte nicht alle verschieden. Ist etwa G eine abelsche Gruppe und (a, b) ein Erzeugendensystem, so gilt a · b = b · a, was in beliebigen Gruppen natürlich i.a. falsch ist. Wir müssen also die Multiplikation der Gruppe noch explizit beschreiben. Wie wir das tun, werden wir in den nächsten beiden Abschnitten erarbeiten. 2.1 Freie Gruppen Definition 2.1. Sei F eine Gruppe und X ⊂ F eine Teilmenge. Dann heißt F frei über X, falls F folgende universelle Eigenschaft besitzt: Für jede Gruppe G und jede Abbildung f : F → G existiert ein eindeutiger Homomorphismus ϕ : F → G mit ϕ|X = f . Ist, wie oben, ϕ ein Homomorphismus und f die Einschränkung von ϕ auf eine Teilmenge des Definitionsbereiches, so nennen wir andersherum ϕ eine Fortsetzung von f . F ist also frei über X, wenn sich jede Abbildung von X in eine Gruppe H eindeutig (zu einem Homomoprhismus) auf F (X) fortsetzen lässt. Wir nennen eine Gruppe F kurz frei, wenn sie frei über einer Teilmenge X ist. X heißt dann Basis von F . Die Idee ist nun folgende: Sei G eine Gruppe und X ein Erzeugendensystem von G. Vorbehaltlich der Tatsache, dass wir freie Gruppen leicht konstruieren bzw. verstehen können, können wir nun G wie in Definition 2.1 dadurch beschreiben, dass wir den eindeutigen (surjektiven) Homomorphismus ϕ von einer über X freien Gruppe F nach G beschreiben, der X auf X abbildet. Man beachte aber, dass Definition 2.1 nicht konstruktiv ist; es ist also bisher nicht klar, ob bzw. für welche X überhaupt freie Gruppen über X existieren. Um 21 diese Frage zu beantworten, werden wir im folgenden für eine gegebene Menge X eine über X freie Gruppe konstruieren. Zunächst können wir aber unmittelbar aus Definition 2.1 folgern, dass es für jede Menge X bis auf Isomorphie nur eine freie Gruppe über X geben kann: Lemma 2.2. Seien G, G0 Gruppen, G frei über X, G0 frei über X 0 und f : X → X 0 eine Bijektion. Dann sind G und G0 isomorph. Beweis. Nach Definition existieren eindeutige Homomorphismen ϕ : G → G0 und ϕ0 : G0 → G, so dass ϕ|X = f und ϕ0 |X 0 = f −1 . Es folgt ϕ0 ◦ ϕ = idG , denn idG ist der nach Definition 2.1 eindeutige Homomorphismus von G nach G mit idG |X = idX . Ebenso folgt ϕ ◦ ϕ0 = idG0 . Somit ist ϕ0 = ϕ−1 und ϕ ein Isomorphismus. Nun konstruieren wir eine freie Gruppe: Sei X eine Menge. Ein Wort in X ist ein Tupel (x1 , . . . , xk ) ∈ X k , für beliebigs k ∈ N+ . Wir schreiben ein Wort w im Kontext dieser Vorlesung als Produkt w = x1 · · · xk . Dann ist X ∗ := {x1 · · · xr | r ∈ N, xi ∈ X} die Menge aller Wörter über X. Das leere Wort (r = 0) bezeichnen wir mit 1. Auf der Menge X ∗ definieren wir die Verknüpfung · durch Konkatenation wie folgt: · : X ∗ × X ∗ → X ∗ , (x1 · · · xr ) · (y1 · · · ys ) = x1 · · · xr y1 · · · ys (2.1) Definition 2.3. Sei X eine Menge. Dann ist (X ∗ , ·) mit der in (2.1) definierten Multiplikation ein Monoid. Wir nennen (X ∗ , ·) den freien Monoid über X. Bemerkung 2.4. Der Begriff frei in Definition 2.3 ist genauso motiviert wie bei der freien Gruppe: Ein Monoid ist genau dann frei (d.h. isomorph zum oben konstruierten freien Monoid, für geeignetes X), wenn er die zu Definition 2.1 analoge universelle Eigenschaft für Monoide besitzt. Wir ersparen uns aber, dies als Definition zu verwenden, weil wir davon (explizit) keinen weiteren Gebrauch machen werden. Sei im folgenden X eine Menge. Wir definieren X −1 als eine von X disjunkte Menge formaler Inverser, X −1 := {x−1 | x ∈ X}. Nun setzen wir X̃ := X ∪X −1 . −1 Weiter setzen wir x−1 := x. Somit wird −1 zu einer fixpunktfreien Involution auf X̃. Auf der Menge X̃ ∗ definieren wir nun die freie Äquivalenz wie folgt: Zwei Wörter w und w0 heißen zunächst elementar äquivalent, falls u, v ∈ X̃ ∗ und x ∈ X̃ existieren, so dass w = uv und w0 = uxx−1 v. Die freie Äquivalenz ist nun die von der elementaren Äquivalenz erzeugte Äquivalenzrelation, wir bezeichnen sie mit ∼ und die Äquivalenzklasse von w ∈ X̃ ∗ mit [w] (später werden wir die eckigen Klammern oft einfach weglassen, sofern der Kontext es erlaubt). 22 Definition & Lemma 2.5. Sei X eine Menge. Setze F (X) := X̃ ∗ / ∼, wobei ∼ die freie Äquivalenz bezeichnet. Dann ist F (X) zusammen mit der Verknüpfung · : F (X) × F (X) → F (X), gegeben durch [w] · [w0 ] := [ww0 ] eine Gruppe. Der Beweis ist dem Leser überlassen. Insbesondere verifiziere man, dass [1] das neutrale Element in F (X) und somit [x]−1 = [x−1 ] für alle x ∈ X (2.2) ist. Satz 2.6. Die Gruppe F (X) ist frei über [X] := {[x] | x ∈ X}. Beweis. Sei G eine beliebige Gruppe und f : [X] → G eine Abbildung. Zu zeigen ist, dass ein eindeutiger Homomorphismus ϕ : F (X) → G existiert mit ϕ|[X] = f . Sei g = [x11 · · · xnn ] mit xi ∈ X und i ∈ {1, −1}. Ist ϕ ein Homomorphismus mit obiger Eigenschaft, folgt aus der Homomorphieeigenschaft sofort ϕ(g) = f ([x1 ])1 · · · f ([xn ])n , somit ist ϕ eindeutig bestimmt. Andersherum ist leicht zu prüfen, dass die so definierte Abbildung wohldefiniert ist, was die Existenz von ϕ impliziert. Die Behauptung folgt. Möchte man nun ein Element [w] ∈ F (X) explizit angeben, so bietet es sich an, den Repräsentanten w möglichst kurz zu wählen. Das implziert insbesondere, dass der Repräsentant w kein Teilwort der Form xx−1 enthalten sollte (mit x ∈ X̃), da man dieses Teilwort sonst streichen und einen kürzeren Repräsentanten erhält. Enthält w kein solches Teilwort, so stellt sich heraus, dass w bereits ein kürzester Repräsentant von [w] ist, und mit dieser Eigenschaft bereits eindeutig ist. Dies beweisen wir im folgenden: Definition 2.7. Sei X eine Menge. Ein Wort w = x1 · · · xn in X̃ ∗ heißt reduziert, falls xi 6= x−1 i+1 für alle i ∈ {1, . . . , n − 1}. Lemma 2.8. Für jedes Wort w ∈ X̃ ∗ existiert ein eindeutig bestimmtes reduziertes Wort w0 ∈ X̃ ∗ , so dass w ∼ w0 . Beweis. Wir folgen einer Beweisidee von van der Waerden: Sei W die Menge aller reduzierten Wörter in X̃ ∗ . Wir definieren einen Homomorphismus ϕ : F (X) → S(W ), wobei S(W ) die Permutationgruppe von W bezeichnet (d.h. ϕ ist gerade eine Operation von F (X) auf W ), der folgende Eigenschaften hat: 1. [ϕ(g)(w)] = g[w] für alle g ∈ F (X) und w ∈ W . 2. ϕ([w])(1) = w für alle w ∈ W . 23 Die Existenz (und Wohldefiniertheit) von ϕ zeigt offenbar die Behauptung, denn für zwei reduzierte Formen w, w0 ∈ W mit [w] = [w0 ] folgt w = ϕ([w])(1) = ϕ([w0 ])(1) = w0 . Sei nun w = x0 · . . . · xn ∈ W ein reduziertes Wort. Wir definieren ϕ durch ( x · x0 · . . . · xn falls x 6= x−1 0 ϕ([x])(w) = x1 · . . . · xn sonst für x ∈ X̃. Man rechnet leicht nach, dass ϕ([x])(ϕ([x−1 ])(w)) = ϕ([x−1 ])(ϕ([x])(w)) = w. Somit folgt ϕ([w]) ∈ S(W ) (d.h. ϕ([w]) ist bijektiv auf W ) und ϕ([x])−1 = ϕ([x−1 ]). Wegen der universellen Eigenschaft von F (X) lässt sich ϕ nun eindeutig auf F (X) fortsetzen. Die gewünschten Eigenschaften folgen sofort aus der Konstruktion, die Behauptung folgt. In den folgenden Abschnitten wollen wir für ein Element [w] ∈ F (X) kurz w schreiben. Insbesondere wird für x ∈ X damit das Element [x] ∈ F (X) kurz mit x bezeichnet. Dies ist grundsätzlich unproblematisch; man beachte insbesondere, dass es wegen (2.2) keine Notationskonflikte mit der Bezeichnung x−1 gibt. Zudem hat es zwei große Vorteile: Einerseits erspart es uns eine Menge Klammern, andererseits erlaubt es uns, die Menge X als Teilmenge von F (X) zu betrachten. Insbesondere ist X somit eine Basis von F (X). Somit folgt, aus Lemma 2.2 und Satz 2.6, Korollar 2.9. Sei G eine Gruppe und X ⊂ G eine Teilmenge. G ist genau dann frei über X, wenn G isomorph zu F (X) ist. Wir können also im Falle einer über X freien Gruppe G stets davon ausgehen, dass G = F (X) ist, und nennen F (X) kurz die freie Gruppe über X. 2.2 Gruppenpräsentierungen Sei G eine Gruppe und X ⊂ G eine Teilmenge. Dann bezeichnet hXi := {x11 · · · xnn | n ∈ N, xi ∈ X, i = ±1} die von X erzeugte Untergruppe. X ist also genau dann ein Erzeugensystem von G, wenn hXi = G gilt. Weiter bezeichnet hhXii := {g1 x11 g1−1 · · · gn xnn gn−1 | n ∈ N, gi ∈ G, xi ∈ X, i = ±1} die von X normal erzeugte Untergruppe. hhXii ist also der kleinste Normalteiler von G, der X enthält. 24 Sei nun G eine Gruppe und X ein Erzeugendensystem von G. Nach Satz 2.6 existiert ein eindeutiger Homomorphismus π : F (X) → G mit π|X = idX . Da X als Erzeugendensystem von G im Bild von π liegt, ist π surjektiv, und es folgt aus dem Homomorphiesatz, dass G∼ = F (X)/ker(π). Somit ist G also bis auf Isomorphie eindeutig durch X und ker(π) ≤ F (X) bestimmt. Da ker(π) ein Normalteiler von F (X) ist, genügt zur eindeutigen Bestimmung von ker(π) die Angabe einer Teilmenge R, die ker(π) normal erzeugt. Dies motiviert folgende Definition: Definition 2.10. Sei X eine Menge und R ⊂ F (X). Dann heißt hX|Ri eine Präsentierung der Gruppe G, falls G∼ = F (X)/hhRii. Wir schreiben kurz G = hX|Ri. Es folgt also sofort aus dem Homomorphiesatz, dass jede Gruppe G eine Präsentierung besitzt: Wählt man ein beliebiges Erzeugendensystem X von G (z.B. X := G) und ein beliebiges normales Erzeugendensystem R des Kernes des eindeutigen Epimorphismus π : F (X) → G mit π|X = idX (z.B. R := ker(π)), so ist hX|Ri eine Präsentierung von G. Im allgemeinen lassen sich X und R allerdings wesentlich schlanker wählen. Beispiel 2.11. Wir beginnen mit einigen Beispielen von Gruppenpräsentierungen. 1. F (X) = hX|∅i (X eine beliebige Menge), denn F (X) ∼ = F (X)/{1} = F (X)/hh∅ii. Wir schreiben für hX|∅i auch hX|−i. 2. Z2 = ha, b|[a, b]i, wobei [a, b] := aba−1 b−1 der Kommutator von a und b ist: Ist ( a 7→ (1, 0) 2 ϕ : F (a, b) → Z , , b 7→ (0, 1) so ist kerϕ = hh[a, b]ii. 3. Zn = ha|an i für alle n ∈ N+ , denn der Homomorphismus ϕ : F (a) → Zn , ak 7→ k̄ hat offenbar ker(ϕ) = {akn | k ∈ Z} = {(an )k | k ∈ Z} = hhan ii. 25 Sei nun G = hX|Ri, H eine Gruppe und f : X → H eine Abbildung. Ist G nicht frei, so stellt sich die Frage, unter welchen Voraussetzungen sich die Abbildung f zu einem Homomorphismus fortsetzen lässt. Nach Satz 2.6 gibt es einen eindeutig bestimmten Homomorphismus ϕ : F (X) → H mit ϕ|X = f . Falls ein Homomorphismus ψ : G → H mit ψ|X = f existiert, so gilt offenbar ψ ◦ π|X = f |X , und somit ψ ◦ π = ϕ wegen der Eindeutigkeit von ϕ mit dieser Eigenschaft. Somit folgt unmittelbar aus dem Homomorphiesatz, dass ψ genau dann existiert, wenn ϕ durch π faktorisiert, d.h. wenn ker(π) ⊂ kerϕ = hhRii. Es folgt Korollar 2.12. Sei G = hX|Ri, H eine Gruppe und f : X → H. Weiter sei ϕ : F (X) → H die eindeutige Fortsetzung von f auf F (X). Dann existiert eine Fortsetzung von f auf G genau dann, wenn ϕ(r) = 1 für alle r ∈ R. 2.3 Freie Produkte Wir definieren im folgenden den Begriff des freien Produktes zweier Gruppen. Das Adjektiv frei deutet hier wieder an, dass es sich um ein Produkt von Gruppen mit einer universellen Eigenschaft handelt. Dem ist auch so: Definition 2.13. Seien G1 und G2 Gruppen. Eine Gruppe H heißt freies Produkt von G1 und G2 (geschrieben H = G1 ∗ G2 ), falls Monomorphismen τi : Gi → H (i = 1, 2) existieren, so dass folgendes gilt: Für jede Gruppe K und Homomorphismen ϕi : Gi → K existiert ein eindeutig bestimmter Homomorphismus ψ : H → K, so dass ϕi = ψ ◦ τi für i = 1, 2. Ähnlich der freien Gruppe im vorherigen Abschnitt zeigen wir zunächst, dass das freie Produkt von gegebenen Gruppen bis auf Isomorphie eindeutig bestimmt ist. Lemma 2.14. Seien G1 und G2 Gruppen und H und K freie Produkte von G1 und G2 . Dann gilt H ∼ = K. Beweis. Seien τi : Gi → H und ηi : Gi → K (i = 1, 2) Monomorphismen mit der Eigenschaft wie in Definition 2.13. Dann existieren eindeutige Homomorphismen ϕ : H → K und ψ : K → H mit τi = ψ ◦ ηi und ηi = ϕ ◦ τi für i = 1, 2. Es folgt ψ ◦ ϕ ◦ τi = ψ ◦ ηi = τi . Somit ist ψ ◦ ϕ = idH , denn idH ist der nach Definition 2.13 eindeutige Homomorphismus von H nach H mit idH ◦ τi = τi . Ebenso folgt ϕ ◦ ψ = idK . Also gilt ϕ = ψ −1 , somit ist ϕ ein Isomorphismus. Wir wollen im folgenden das (bis auf Isomorphie eindeutige) freie Produkt von G und H konstruieren. Konstruktion 2.15. Seien G und H Gruppen. Sei F die Menge aller Tupel (g1 , h1 , g2 , h2 , . . . , gn , hn ), wobei n ∈ N beliebig und gi ∈ G, hi ∈ H für i = 1, . . . , n. Auf F definieren wir die Verknüpfung · : F × F → F durch (g1 , h1 , . . . , gk ) · (g10 , h01 , . . . , gl0 ) = (g1 , h1 , . . . , hk−1 , gk g10 , h01 , . . . , gl0 ). 26 Weiter definieren wir eine freie Äquivalenz auf F wie folgt: Sind u, v ∈ F beliebig und g, g 0 ∈ G, h, h0 ∈ H, so setzen wir u · (g, 1, g 0 ) · v 0 u · (1, h, 1, h , 1) · v ∼ u · (gg 0 ) · v, ∼ u · (1, hh0 , 1) · v. Die freie Äquivalenz ist dann die von ∼ erzeugte Äquivalenzrelation (die wir abermals mit ∼ bezeichnen). Lemma 2.16. Seien G und H Gruppen und F wie oben. Dann ist die Gruppe G ∗ H := F/ ∼ mit der Verknüpfung · : G ∗ H × G ∗ H → G ∗ H, [w]∼ · [w0 ]∼ := [ww0 ]∼ ein freies Produkt von G und H. Beweis. Zunächst überzeuge man sich, dass · wohldefiniert und G ∗ H eine Gruppe ist. Nun betrachte die Einbettungen τG : G ,→ G ∗ H, g 7→ [g]∼ und τH : H ,→ G ∗ H, h 7→ [1, h, 1]∼ . Sei nun K eine beliebige Gruppe und ϕG : G → K, ϕH : H → K Homomorphismen. Dann ist die Abbildung ψ : G ∗ H → K, [g1 , h1 , . . . , hk−1 , gk ] 7→ ϕG (g1 ) · ϕH (h1 ) · · · ϕH (hk−1 ) · ϕG (gk ) wohldefiniert und genügt den Eigenschaften aus Definition 2.13. Die Eindeutigkeit von ψ folgt, da ϕG (G) ∪ ϕH (H) ein Erzeugendensystem von G ∗ H ist. Lemma 2.17. Seien G = hX | Ri, H = hY | Si und X, Y disjunkt. Dann gilt: 1. Für jedes g ∈ G ∗ H existiert ein eindeutiges Tupel (g1 , h1 , g2 , h2 , . . . , hn−1 , gn ), so dass gi ∈ G, hi ∈ H sowie gi 6= 1 für i = 2, . . . , n − 1 und hi 6= 1 für i = 1, . . . , n − 1 und g = [g1 , h1 , g2 , h2 , . . . , gn , hn ]∼ . (2.3) 2. G ∗ H = hX, Y |R, Si Beweis. Übungsaufgabe, Blatt 5 2.4 HNN-Erweiterungen Die HNN-Erweiterung ist eine Konstruktion, die für eine Gruppe G eine größere Gruppe G∗ liefert, die G als Untergruppe enthält. Sie wird uns im Verlaufe dieser Vorlesung als wichtiges Hilfsmittel dienen, um Gruppen mit bestimmten, jeweils gewünschten Eigenschaften zu konstruieren. 27 HNN-Erweiterungen haben einen geometrischen Hintergrund: Zusammen mit dem analogen Konzept der amalgamierten Produkte bilden sie die einfachsten und wichtigsten Beispiele für Fundamentalgruppen von Graphen von Gruppen in der Bass-Serre-Theorie, die sich mit der Klassifikation von Gruppenoperationen auf simplizialen Bäumen beschäftigt. Diesen geometrischen Hintergrund werden wir im Kontext dieser Vorlesung aber nicht weiter beleuchten, sondern HNN-Erweiterungen rein kombinatorisch diskutieren. Wir beginnen mit einer Definition: Definition 2.18. Seien G = hX|Ri und C Gruppen und α, ω : C ,→ G zwei Monomorphismen. Dann ist die HNN-Erweiterung von G entlang C (bzgl. α und ω), geschrieben G∗C , definiert als G∗C := hX, t | R, {α(c) = tω(c)t−1 | c ∈ C}i. Bemerkung 2.19. Man beachte, dass die Gruppe G∗C von den Monomorphismen α, ω abhängt, die Schreibweise “G∗C ” aber nicht. Insofern ist diese Schreibweise potentiell missverständlich; sie ist aber dennoch üblich, und es werden auch im folgenden keine Mehrdeutigkeiten auftreten. Es ist zunächst keineswegs klar, dass G eine Untergruppe von G∗C ist (d.h., dass die von X erzeugte Untergruppe in G∗C isomorph zu G ist), denn das Hinzufügen von Relationen kann i.a. die Gruppe kaputtmachen. Unser erstes Ziel wird es sein, dies zu beweisen. Zunächst entwickeln wir, analog zu dem Fall des freien Produktes, eine Normalform, in der wir Elemente aus G∗C darstellen können. Jedes Element aus g ∈ G∗C kann offenbar als Produkt der Form g = g0 · t±1 · g1 · t±1 · . . . · t±1 · gn (2.4) dargestellt werden, wobei gi ∈ G. Allerdings ist diese Darstellung diesmal keineswegs eindeutig: Ist etwa c ∈ C und s = α(c), s0 = ω(c), so gilt nach Konstruktion, dass s · t · 1 = 1 · t · s0 . Die Produkte s · t · 1 und 1 · t · s0 , beide in der Form wie in (2.4), sind also zwei verschiedene Darstellungen desselben Elementes. Damit die Darstellung eindeutig wird, brauchen wir zusätzliche Forderungen an die gi . Wähle ein Repräsentantensystem Rα der Menge {α(C)g | g ∈ G} der Rechtsnebenklassen der Untergruppe α(C) in G, und ebenso ein Repräsentantensystem Rω der Rechtsnebenklassen von ω(C) in G. Wir treffen die Wahl so, dass 1 ∈ Rα und 1 ∈ Rω , d.h. für die Untergruppen α(C) bzw. ω(C) wählen wir jeweils den trivialen Repräsentanten. Nun definieren wir eine Normalform wir folgt: Definition 2.20. Eine Normalform (bzgl. Rα , Rω ) in G∗C ist ein Tupel (g0 , t1 , g1 , t2 , . . . , tn , gn ) mit gi ∈ G, i ∈ {−1, 1} und folgenden Eigenschaften: 1. Ist i = −1, so ist gi ∈ Rα . 28 2. Ist i = +1, so ist gi ∈ Rω . 3. Ist i 6= i+1 , so ist gi 6= 1. Es ist leicht zu sehen, dass jedes Element g ∈ G∗C als Normalform darstellbar ist. Etwas weniger offensichtlich ist, dass diese Normalform stets eindeutig ist. Dies zeigen wir im folgenden Satz. Satz 2.21. Für jedes Element g ∈ G∗C existiert eine eindeutige Normalform w = (g0 , t1 , g1 , t2 , . . . , tn , gn ), so dass g = [w] := g0 · t1 · g1 · t2 · . . . · tn · gn Beweis. Wir folgen wieder der Beweisidee von van der Waerden: Sei W die Menge aller Normalformen in G∗C . Wir definieren einen Homomorphismus ϕ : G → S(W ) von G in die Permutationgruppe S(W ) von W (d.h. eine Operation von G auf W ), der folgende Eigenschaften hat: 1. [ϕ(g)(w)] = g[w] für alle g ∈ G∗C und w ∈ W . 2. ϕ([w])(1) = w für alle w ∈ W . Die Existenz (und Wohldefiniertheit) von ϕ zeigt offenbar den Satz, denn für zwei Normalformen w, w0 ∈ W mit [w] = [w0 ] folgt w = ϕ([w])(1) = ϕ([w0 ])(1) = w0 . Sei nun w = (g0 , t1 , g1 , t2 , . . . , tn , gn ) eine Normalform. Wir definieren zunächst ϕ(g)w := (gg0 , t1 , g1 , t2 , . . . , tn , gn ) für g ∈ G. Man rechnet leicht nach, dass ϕ(g)(ϕ(g −1 )(w)) = ϕ(g −1 )(ϕ(g)(w)) = w. Somit folgt ϕ(g) ∈ S(W ) (d.h. ϕ(g) ist bijektiv auf W ) und ϕ(g)−1 = ϕ(g −1 ). Weiter setzen wir ( (α ◦ ω −1 (g0 )g1 , t2 , . . . , tn , gn ) falls 1 = −1 und g0 ∈ ω(C) ϕ(t)(w) := −1 0 1 (α ◦ ω (g0 ), t, gω , t , g1 , . . . , gn ) sonst, wobei gω der Repräsentant von g0 in Rω ist und g00 ∈ ω(C) gerade so gewählt ist, dass g0 = g00 gω , und analog ( (ω ◦ α−1 (g0 )g1 , t2 , . . . , tn , gn ) falls 1 = 1 und g0 ∈ α(C) −1 ϕ(t )(w) := −1 0 −1 1 (ω ◦ α (g0 ), t , gα , t , g1 , . . . , gn ) sonst mit gα ∈ Rα , g00 ∈ α(C) und g0 = g00 gω . Wir zeigen nun, dass ϕ(t−1 ) = ϕ(t)−1 . Sei w wie oben. Wir unterscheiden zwei Fälle: Sei zunächst 1 = −1 und g0 ∈ ω(C). Es ist also ϕ(t)(w) = α ◦ ω −1 (g0 )g1 · t2 · . . . · tn · gn . 29 Nun ist es nicht möglich, dass 2 = 1 und g1 ∈ α(C), da w eine Normalform ist. Da g1 ∈ Rα und α ◦ ω −1 (g0 ) ∈ α(C), ist der Repräsentant von α ◦ ω −1 (g0 )g1 in Rα gerade g1 . Es folgt Also ist ϕ(t−1 )(ϕ(t)(w)) = ϕ(t−1 )(α ◦ ω −1 (g0 )g1 , t2 , . . . , tn , gn ) (2.5) = g0 , t1 , g1 , t2 , . . . , tn , gn (2.6) = w (2.7) Im zweiten Fall, dass 1 = 1 oder g0 ∈ / ω(C), folgt sofort, dass ebenfalls ϕ(t−1 )(ϕ(t)(w)) = w. Somit ist ϕ(t−1 )ϕ(t) = idW , und eine analoge Betrachtung zeigt ϕ(t)ϕ(t−1 ) = idW . Es folgt ϕ(t) ∈ S(W ) und ϕ(t−1 ) = ϕ(t)−1 . Nun rechnet man leicht nach, dass ϕ(t) · ϕ(ω(c)) · ϕ(t−1 ) · ϕ(α(c)−1 )) = 1. Somit lässt sich ϕ nach Korollar 2.12 eindeutig zu einem Homomorphismus auf die Gruppe G∗C fortsetzen. Dieser Homomorphismus hat nach Kosntruktion die gewünschten Eigenschaften. Die Behauptung folgt. Eine unmittelbare Folgerung aus Satz 2.21 ist das folgende Korollar, das aussagt, dass wir G als Untergruppe von G∗C auffassen können. Korollar 2.22. Die Abbildung G → G∗C , g 7→ g ist injektiv. Beweis. Es genügt zu beobachten, dass (g) eine Normalform in G∗C ist (für g ∈ G). Ist g 6= 1, so ist also (g) die nach Satz 2.21 eindeutige Normalform in G∗C , somit ist das repräsentierte Element nicht-trivial. 2.5 Eigenschaften von Gruppen und Nielsen-Reduziertheit Das freie Produkt und die HNN-Erweiterung sind wertvolle Hilfsmittel, um einige –teils etwas überraschende– Eigenschaften von Gruppen und ihren Untergruppen einzusehen. Wir beginnen zunächst mit einigen Eigenschaften freier Gruppen. Lemma 2.23. Sei G eine Gruppe, X ⊂ G eine Teilmenge und X ∩ X −1 = ∅. Die von X erzeugte Untergruppe hXi ist genau dann frei über X, wenn für alle Produkte g = x1 · · · xn ∈ G mit n > 0, xi ∈ X ∪ X −1 und xi 6= x−1 i+1 gilt, dass g 6= 1. Beweis. Seien zunächst x1 , . . . , xn ∈ X ∪ X −1 , xi 6= x−1 i+1 und x1 · · · xn = 1. Dann ist idX nicht zu einem Homomorphismus ϕ : hXi → F (X) fortsetzbar, denn es müsste gelten ϕ(x1 · · · xn ) = ϕ(x1 ) · · · ϕ(xn ) 6= 1. Es folgt sofort, dass hXi nicht frei über X ist. Sei nun andersherum x1 · · · xn 6= 1 für alle n > 0 und xi ∈ X ∪ X −1 mit xi 6= x−1 i+1 . Wegen der universellen Eigenschaft von F (X) ist idX eindeutig 30 zu einem Homomorphismus ϕ : F (X) → hXi fortsetzbar. Es folgt aus der Voraussetzung, dass ϕ(w) 6= 1 für alle w 6= 1, somit ist ϕ injektiv. Da X ein Erzeugendensystem von hXi ist, ist ϕ surjektiv, also ein Isomorphismus. Daraus folgt die Behauptung. Definition 2.24. Sei X eine Menge und F = F (X) die freie Gruppe über X. Für g ∈ F bezeichne |g| die Länge (d.h. Anzahl der Buchstaben) des eindeutigen reduzierten Wortes in X̃ ∗ , das g repräsentiert. Eine (endliche oder unendliche) Teilmenge U ⊂ F heißt Nielsen-reduziert, falls für beliebige Elemente v1 , v2 , v3 ∈ U ∪ U −1 gilt 1. v1 6= 1, 2. v1 v2 6= 1 ⇒ |v1 v2 | ≥ max(|v1 |, |v2 |), 3. v1 v2 6= 1 und v2 v3 6= 1 ⇒ |v1 v2 v3 | > |v1 | − |v2 | + |v3 |. Proposition 2.25. Sei X eine Menge und U ⊂ F (X) Nielsen-reduziert. Dann existieren für jedes u ∈ U ∪ U −1 Wörter α(u), m(u), ω(u) ∈ X̃ ∗ mit m(u) 6= 1 und ω(u) = α(u−1 )−1 , so dass folgendes gilt: 1. α(u) · m(u) · ω(u) ist reduziert und α(u) · m(u) · ω(u) =F u. −1 2. Sind v1 , . . . , vn ∈ U ∪U −1 , so dass vi 6= vi+1 , und bezeichnet ω(vi )α(vi+1 ) ∈ ∗ X̃ das reduzierte Wort, das äquivalent zu ω(vi ) · α(vi+1 ) ist, so ist das Wort α(v1 ) · m(v1 ) · ω(v1 )α(v2 ) · m(v2 ) · · · ω(vn−1 )α(vn ) · m(vn ) · ω(vn ) (2.8) reduziert. Beweis. Für u ∈ U ∪U −1 bezeichne ũ den eindeutigen reduzierten Repräsentanten von u in X̃ ∗ . Wähle dann α(u) als das längste Präfix von ũ, das ebenfalls Präfix eines weiteren ṽ für v ∈ U ∪ U −1 , v 6= u, ist, und ω(u) := α(u−1 )−1 . Aus Eigenschaft 2.24 (2) folgt, dass |α(u)| + |ω(u)| = 2|α(u)| < |u|. Setze m(u) als das eindeutige nicht-leere Wort, für das gilt, dass α(u) · m(u) · ω(u) = ũ. −1 Seien nun v1 , . . . , vn ∈ U ∪ U −1 mit vi 6= vi+1 . Dann gilt offenbar (2.8), denn anderenfalls würde für ein i ∈ 1, . . . , n − 1 gelten, dass ω(vi )α(vi+1 ) = 1 und m(vi )m(vi+1 ) nicht reduziert ist. Dann wäre aber α(vi+1 ) nicht maximal gewählt. Ein Widerspruch. Aus Proposition 2.25 und Lemma 2.23 folgt sofort Korollar 2.26. Ist U ⊂ F (X) Nielsen-reduziert und U ∩ U −1 = ∅, so ist hU i frei über U . Eine zentrale Frage, die man über eine gegebene Gruppe G stellen kann, ist die, wie “groß” die Gruppe G ist: 31 Definition 2.27. Der Rang einer Gruppe G, rank(G) ∈ N∪{∞}, ist die Anzahl der Elemente eines kleinsten Erzeugendensystemes von G. Wir nennen G endlich erzeugt, falls rank(G) ∈ N. Es wird sich herausstellen, dass es schwierig ist, den Rang einer Gruppe zu bestimmen. Zunächst können wir aber folgendes einsehen: Proposition 2.28. Sei X eine endliche Menge. Dann ist rank(F (X)) = |X|. Beweis. Sei X = {x1 , . . . , xn }. Da X ein Erzeugendensystem von F (X) ist, gilt offenbar rank(F (X)) ≤ n. Zu zeigen ist, dass kein Erzeugendensystem X 0 von F (X) existiert mit |X 0 | < n. Wir tun dies, indem wir die Aussage auf eine Gruppe zurückführen, deren Rang wir bestimmen können: Die Gruppe Zn2 hat offenbar Rang n; denn einerseits ist E := (e1 , . . . , en ) ein Erzeugendensystem (wobei ei das i-te Einheitstupel in Zn2 bezeichnet), andererseits ist Zn2 als Z2 Vektorraum der Dimension n mindestens von Rang n. Die Abbildung f : X → E, xi 7→ ei setzt sich nach der universellen Eigenschaft von F (X) zu einem eindeutigen Homomorphismus ϕ : F (X) → Zn2 fort. Da E = f (X) ein Erzeugendensystem ist, ist ϕ surjektiv. Ist nun X 0 ein beliebiges Erzeugendensystem von F (X), so ist ϕ(X 0 ) ein Erzeugendensystem von Zn2 . Es folgt |X 0 | ≥ n. Etwas unintuitiv ist dagegen das Verhalten von Untergruppen im Hinblick auf ihren Rang. Während man von endlich-dimensionalen Vektorräumen gewöhnt ist, dass ein strikter Teilraum stets eine kleinere Dimension hat, können Untergruppen einer endlich erzeugten Gruppe G durchaus einen höheren Rang als G besitzen. Als Beispiel betrachte man die freie Gruppe F = F ({a, b}), und für n ∈ N die Teilmenge Mn := h{b, aba−1 , a2 ba−2 , . . . , an ba−n }i. Man sieht leicht ein, dass Mn Nielsen-reduziert ist. Somit gilt nach Korollar 2.26, dass Un := hMn i frei über Mn ist; es folgt aus 2.28, dass rank(Un ) = n + 1. Diese Beobachtung können wir benutzen, um ein viel allgemeineres Resultat zu beweisen: 2.6 Markov-Eigenschaften Eines der Ziele dieser Vorlesung ist es, mithilfe des Higmannschen Einbettungssatzes die Existenz endlich präsentierter Gruppen mit unentscheidbarem Wortproblem zu beweisen. Das bedeutet, dass eine endlich präsentierte Gruppe H = hX|Ri existiert, für die kein Algorithmus existiert, der für ein gegebenes Element w ∈ X̃ ∗ entscheidet, ob w das triviale Element in H repräsentiert. Wir werden in diesem Abschnitt die Existenz einer solchen Gruppe H annehmen und mit ihrer Hilfe beweisen, dass viele weitere Eigenschaften von (endlich-präsentierten) Gruppen im allgemeinen unentscheidbar sind; nämlich alle Markov-Eigenschaften: 32 Definition 2.29. Eine Eigenschaft P von Gruppen heißt Markov-Eigenschaft, falls gilt: 1. Es existiert eine endlich präsentierte Gruppe G1 mit der Eigenschaft P . 2. Es existiert eine endlich präsentierte Gruppe G2 , die in keine Gruppe mit der Eigenschaft P einbettbar ist. Ein einfaches Beispiel eine Markov-Eigenschaft ist Kommutatvität: Es existieren endlich präsentierte abelsche Gruppen, und eine nicht-abelsche Gruppe ist in keine abelsche Gruppe einbettbar. Ebenso sind endlich, trivial, torsionsfrei, frei und nilpotent Markov-Eigenschaften. Satz 2.30. Sei P eine Markov-Eigenschaft. Dann gibt es keinen Algorithmus, der für eine beliebige endlich präsentierte Gruppe G entscheidet, ob G die Eigenschaft P hat. Beweis. Sei H eine Gruppe mit unentscheidbarem Wortproblem und w ∈ H. Weiter sei G2 wie in Definition 2.29 eine Gruppe, die in keine Gruppe mit der Eigenschaft P einbettbar ist. Wir beginnen die Konstruktion mit der Gruppe G ∗ H ∗ hxi. Nach Satz 4.1 existiert eine Gruppe U , die von zwei Elementen u1 , u2 von unendlicher Ordnung erzeugt wird, in die G ∗ H ∗ hxi einbettbar ist. Setze nun J := hU, y1 , y2 | y1 u1 y1−1 = u21 , y2 u2 y2−1 = u22 i. J geht aus U durch zweifache HNN-Erweiterung hervor, insbesondere ist U also eine Untergruppe von J. Setze nun K := hJ, z | zy1 z −1 = y12 , zy2 z −1 = y22 i. K ist eine HNN-Erweiterung von K entlang der Untergruppe F2 ∼ = hy1 , y2 i ∼ = hy12 , y22 i, also ist U eine Untergruppe von K. [noch nicht fertig...] 3 Entscheidungsprobleme Im folgenden wollen wir die erarbeiteten Hilfsmittel aus den ersten beiden Kapiteln nutzen, um einige algorithmische Probleme in der Gruppentheorie zu formalisieren und ihre algorithmische Lösbarkeit zu diskutieren. Zunächst stellt sich die Frage, wie wir die Theorie der rekursiven Funktionen aus Kapitel 1 auf Gruppen anwenden können. Wie in Abschnitt 1.6 beschrieben, ist alles, was wir brauchen, eine Identifikation von Gruppenelementen mit Tupeln natürlicher Zahlen. Dann können wir Berechnungen in Gruppen auf Berechnungen in N∗ zurückführen. Wir fixieren eine (endliche oder abzählbar unendliche) Menge X = {x1 , x2 , x3 , . . .}. 33 Ein Element g der Gruppe F (X) repräsentieren wir üblicherweise durch das eindeutige reduzierte Wort aus X̃ ∗ , das g repräsentiert. Ein solches Wort w = xi11 · · · xikk ∈ X̃ ∗ , wobei xij ∈ X und j ∈ {±1}, lässt sich zunächst in naheliegender Weise als Tupel von ganzen Zahlen (1 · i1 , . . . , k · ik ) ∈ Zk parametrisieren. Zum Beispiel würde das Wort −1 −1 x21 x2 x−2 3 = x1 x1 x2 x3 x3 durch das Tupel (1, 1, 2, −3, −3) parametrisiert. Das Element 1 ∈ F (X) wird durch (0) repräsentiert. Diese Parametrisierung (1 · i1 , . . . , k · ik ) ∈ Zk lässt sich nun vermöge der Bijektion ( 2z falls z gerade, p : Z → N, z 7→ |2z| − 1 sonst eindeutig auf das Tupel enc(w) = (p(1 · i1 ), . . . , p(k · ik )) ∈ Nk abbilden. Wir nennen enc(w) die Kodierung 6 von w. Wie oben erwähnt, erlaubt dies in naheligender Weise eine Kodierung eines Elementes g der freien Gruppe, indem wir g durch seinen reduzierten Repräsentanten w darstellen: Definition 3.1. Sei g ∈ F (X). Dann ist enc(g) := enc(w) für das eindeutig bestimmte reduzierte Wort w ∈ X̃ ∗ , das g repräsentiert. 3.1 Wortproblem Das wohl fundamentalste dieser algorithmischen Probleme in der Gruppentheorie ist das Wortproblem: Ist eine Gruppe G durch eine Präsentierung G = hX|Ri und ein Element g ∈ G als Produkt von Erzeugern (und Inversen), g = x1 · · · xm mit xi ∈ X ∪ X −1 , gegeben, kann man entscheiden, ob g = 1 in G gilt? Die eigentliche Frage, die hier zu entscheiden ist, ist also offenbar, ob in der freien Gruppe F (X) gilt, dass x1 · · · xm ∈ hhRii. Im Kontext von Teilmengen von N∗ wissen wir inzwischen, dass diejenigen Teilmengen, für die die Zugehörigkeit algorithmisch entscheidbar ist, gerade die rekursiven Mengen sind. Durch die oben konstruierte Kodierung von Elementen aus F (X) in N∗ können wir diesen Begriff nun auf natürliche Weise auf Teilmengen von F (X) erweitern. Wir identifizieren S ⊂ F (X) mit enc(S) ⊂ N∗ und nennen S rekursiv, falls enc(S) rekursiv ist. Definition 3.2. Sei G eine Gruppe mit rekursiver Präsentierung hX|Ri. Wir sagen, dass G lösbares Wortproblem hat, falls hhRii rekursiv ist. [Fortsetzung folgt...] 6 enc steht für Encoding. 34 4 Einbettungssätze In diesem Abschnitt werden wir einige Eigenschaften von Untergruppen von Gruppen zeigen. Das Ziel wird es sein, den Higmannschen Einbettungssatz zu beweisen. Wir folgen weitgehend [LS]. Satz 4.1. Jede abzählbare Gruppe C lässt sich in eine Gruppe G von Rang 2 mit folgenden Eigenschaften einbetten: 1. G hat Rang zwei und ein Erzeugendensystem aus zwei Elementen von unendlicher Ordnung. 2. G hat ein Element endlicher Ordnung genau dann, wenn C ein Element endlicher Ordnung besitzt. 3. Ist C endlich präsentiert, so auch G. Beweis. Wähle eine abzählbare Präsentierung C = hx1 , x2 , . . . | r1 , r2 , . . .i. Setze H := C ∗ F (a, b). Die Menge {a−k bak | k ∈ N} ⊂ F (a, b) ist Nielsen-reduziert und somit eine Basis einer freien Untergruppe von F (a, b). Ebenso ist M := {b, x1 a−1 ba, x2 a−2 ba2 , . . .} Basis einer freien Untergruppe von H. Somit ist die Gruppe G := hH, t | t−1 at = b, t−1 b−i abi t = ci a−i bai , i ≥ 1i eine HNN-Erweiterung von H. Somit ist H, und damit auch C, in G einbettbar. Weiter ist leicht einzusehen, dass G Rang (höchstens) 2 hat: Offenbar ist (a, b, t, x1 , x2 , . . .) ein Erzeugendensystem von G. Es folgt aber sofort aus den Relationen von G, dass b, x1 , x2 , . . . ∈ ha, ti. Eigenschaft (2) folgt aus Übungsaufgabe 3 von Blatt 6. Ist C = hx1 , . . . , xn | r1 , . . . , rm i endlich präsentiert, so liefert die analoge Konstruktion einer HN N Erweiterung entlang einer freien Gruppe von Rang n + 1 eine endliche Präsentierung für G. 4.1 Der Higmansche Einbettungssatz Satz 4.2. Sei G eine endlich erzeugte Gruppe. G ist genau dann in eine endlich präsentierte Gruppe eingebettet werden, wenn G rekursiv präsentiert ist. Eine der beiden Implikation des Higmannschen Einbettungssatzes ist schnell bewiesen: Sei H durch eine endliche Präsentierung H = hY |Si gegeben und G = hX|Ri sowie eine Einbettung ϕ̃ : F (X) → F (Y ) ein Lift der Einbettung ϕ : G ,→ H. Dann ist offenbar ϕ(g) ∈ hhSii genau dann, wenn g ∈ hhRii: Die eine Implikation (“⇐”) folgt, weil ϕ̃ durch G faktorisiert, die andere aus der Injektivität von ϕ. Da S endlich ist, ist hhSii rekursiv aufzählbar, d.h. es existiert eine rekursive Funktion fS mit Def(f ) = hhSii. Somit ist fS ◦ ϕ̃ eine rekursive Funktion und Def(fS ◦ ϕ̃) = hhRii. Also ist G rekursiv präsentiert. 35 Zu zeigen bleibt, dass jede rekursiv präsentierte Gruppe in eine endlich präsntierte Gruppe einbettbar ist. Diese Richtung ist erheblich schwieriger zu beweisen. Wir beginnen mit einer Definition einer Eigenschaft von Untergruppen, die eine zentrale Rolle im Verlauf des Beweises einnehmen wird. Definition 4.3. Sei G eine endlich erzeugte Gruppe. Eine Untergruppe H ≤ G heißt zahm in G, falls die Gruppe GH := hG, t | {tht−1 = h | h ∈ H}i in eine endlich präsentierte Gruppe einbettbar ist. Wir werden uns im folgenden für zahme Untergruppen freier Gruppen interessieren. Der Zusammenhang zum Higmannschen Einbettungssatz ist keineswegs offensichtlich und liegt in folgender Beobachtung: Ist F eine endlich erzeugte freie Gruppe und R eine normale Untergruppe von F , dann ist die Zahmheit von R in F eine hinreichende Bedingung dafür, dass F/R in eine endlich präsentierte Gruppe einbettbar ist, wie das folgende Lemma zeigt. Somit wird die Zahmheit zu einem wesentlichen Kriterium für das, was wir mit dem Higmannschen Einbettungssatz zeigen wollen. Lemma 4.4. Sei F eine endliche erzeugte freie Gruppe und R ≤ F normal und zahm. Dann ist F/R in eine endlich präsentierte Gruppe einbettbar. Beweis. Sei X eine (endliche) Basis von F , d.h. F = F (X). Da R zahm ist, existiert eine endlich präsentierte Gruppe H und ein Monomorphismus ι : FR := hF, t | {trt−1 = r | r ∈ R}i ,→ H. (4.1) Ist g ∈ FR , so bezeichnen wir das Bild ι(g) ∈ H kurz mit ġ. Wir bezeichnen mit H × F das direkte Produkt von H und F und definieren K := hH × F, s | {s(f˙, 1)s−1 = (f˙, f ), s(ṫf˙ṫ−1 , 1)s−1 = (ṫf˙ṫ−1 , 1) | f ∈ X}i (4.2) (4.3) K ist offenbar endlich präsentiert, da H endlich präsentiert und X endlich ist. Weiter zeigen wir, dass die Untergruppe h{(1, f ) | f ∈ X}i ≤ K isomorph zu F/R ist. Somit ist F/R in K einbettbar, was die Behauptung impliziert. Sei zunächst w ∈ R. Dann gilt in K aufgrund der gegebenen Relationen (4.2) einerseits s(ẇ, 1)s−1 = (ẇ, w) und andererseits (4.1) (4.3) (4.1) s(ẇ, 1)s−1 = s(ṫẇṫ−1 , 1)s−1 = (ṫẇṫ−1 , 1) = (ẇ, 1), es folgt (ẇ, w) = (ẇ, 1) in K, und somit durch Multiplikation mit (ẇ−1 , 1) auch (1, w) = (1, 1). Es folgt also, dass wir (durch Tietze-Transformationen) alle Relationen der Form (1, r) mit r ∈ R einführen können. Somit gilt K = hH × F/R, s | {s(f˙, 1)s−1 = (f˙, f¯), s(ṫf˙ṫ−1 , 1)s−1 = (ṫf˙ṫ−1 , 1) | f ∈ X}i, 36 wobei f¯ das kanonische Bild von f ∈ F in F/R bezeichnet. Wir zeigen nun, dass K eine HNN-Erweiterung von H × F/R ist. Dies impliziert nach Korollar 2.22, dass H × F/R und somit insbesondere F/R in K einbettbar sind. Betrachte die Gruppe C = hF, F 0 | {r = r0 | r ∈ R}i, wobei F 0 eine isomorphe Kopie von F bezeichnet (und g 0 ∈ F 0 das Bild von g ∈ F ). Dann ist C ∼ = F ∗R F . Mithilfe von Satz 2.21 lässt sich leicht nachrechnen, dass die Untergruppe hF, tF t−1 i ≤ FR isomorph zu C ist. Damit erhalten wir zwei Einbettungen ( f 7→ (f˙, 1), α : C ,→ H × F/R, f 0 7→ (ṫf˙ṫ−1 , 1) und ( ω : C ,→ H × F/R, f → 7 (f˙, f¯), 0 f → 7 (ṫf˙ṫ−1 , 1). (Von der Wohldefiniertheit der Einbettungen möge man sich überzeugen.) Somit gilt offenbar K ∼ = (H × F/R)∗C mit den obigen Monomorphismen α und ω. Daraus folgt die Behauptung. 37 Index µ-Operator, 9 beschränkte Subtraktion, 5 Cantorsche Paarfunktion, 7 charakerisierendes Polynom, 12 diophantische Menge, 12 freie Gruppe, 20 freier Monoid, 21 freies Produkt, 25 Funktion, 4 diophantische . . . , 14 partielle . . . , 8 primitiv rekursive . . . , 4 primitive . . . , 4 rekursive . . . , 9 totale . . . , 9 HNN-Erweiterung, 26 Indikatorfunktion, 6 Markov-Eigenschaft, 31 Menge rekursiv aufzählbare . . . , 10 rekursive . . . , 10 Modulo-Operator, 6 Normalformsatz von Kleene, 10 Präsentierung, 24 Rang, 30 Wortproblem, 34 38 Literatur [D] M. Davis, Hilbert’s Tenth Problem is unsolvable. Amer. Math. Monthly 80, 233-269 (1973). [LS] Roger Lyndon, Paul Schupp, Combinatorial Group Theory, Springer. 39