Algebra I 3 c Rudolf Scharlau, 2002 – 2010 119 Kommutative Ringe In diesem Kapitel stellen wir die grundlegende Theorie der kommutativen Ringe dar, wobei das Ziel letztlich ein tieferes Verständnis der Polynomringe einer Unbestimmtem über Körpern und die daraus resultierende Kontruktion von Erweiterungen, insbesondere Körpererweiterungen ist. Vorausgesetzt werden die in Kapitel 1.5 zusammengestellten Begriffe und Beispiele, die oft bereits aus der Linearen Algebra bekannt sind. In Abschnitt 3.1 werden Ideale in Ringen eingeführt. Sie entsprechen den normalen Untergruppen in Gruppen: man kann mit ihrer Hilfe eine Faktorstruktur“, ” hier den Faktorring definieren, der Homomorphiesatz klärt dann den Zusammenhang zwischen Idealen und Homomorphismen. Ideale mit speziellen Eigenschaften sind Primideale und maximale Ideale; ihre Faktorringe sind nullteilerfrei bzw. Körper. Der Abschnitt schließt mit einer zahlentheoretischen Anwendung: unter Benutzung des Homomorphiesatzes wird der sogenannte Chinesische Restsatz bewiesen, eine Folgerung hiervon ist die Multiplikativität” der Euler’schen Phi” Funktion, die die Einheiten im Ring Z/mZ zählt. In Abschnitt 3.2 werden die Grundkonzepte zu Polynomen geklärt: es wird der Polynomring einer Veränderlichen über einem kommutativen Ring mit Eins eingeführt, dann besprechen wir den Einsetzungs-Homomorphismus, die Division mit Rest, die formale Ableitung und die Vielfachheit von Nullstellen. Schließlich wird die allgemeine Ringtheorie um den Begriff des euklidischen Rings bereichert und gezeigt, dass jeder solche ein Hauptidealring ist. In Abschnitt 3.3 wird die aus den Abschnitten 1.1 und 2.1 für den Ring Z bereits bekannte eindeutige Primfaktorzerlegung, aufbauend auf dem richtigen” ” Konzept des größten gemeinsamen Teilers, auf beliebige Hauptidealringe verallgemeinert. Dadurch werden insbesondere der Polynomring einer Veränderlichen über einem Körper und einige der später zu behandelnden quadratischen Zahlringe abgedeckt. In dem methodisch sehr wichtigen Abschnitt 3.4 werden in allgemeiner Form Erweiterungen von kommutativen Ringen eingeführt. Aufbauend auf der Theorie der Polynomringe wird dann der besonders wichtige Fall der von einem Element erzeugten Erweiterungen eines Körpers im Detail behandelt. Dieses bildet die wesentliche technische Grundlage für die Theorie der algebraischen Körpererweiterungen, hat aber auch andere Anwendungen, z.B. in der algebraischen Zahlentheorie oder der Codierungstheorie. Um die Anwendbarkeit Theorie aus Abschnitt 3.4 in wichtigen speziellen Situationen sicherzustellen, wird in Abschnitt 3.5 zunächst der (vielleicht schon bekannte) Quotientenkörper eines nullteilerfreien Ringes eingeführt, dann werden Polynome über dem Quotientenkörper eines Hauptidealringes genauer untersucht (Irreduzibilitätskriterien von Gauß und Eisenstein). Der nächste Abschnitt 3.6 enthält den ersten längeren zahlentheoretischen Exkurs dieser Vorlesung (Version 2010): es handelt sich um quadratische Reste”, ” Algebra I c Rudolf Scharlau, 2002 – 2010 120 das sind die Quadrate im Ring Z/mZ bzw. seiner Einheitengruppe, und das diesbezügliche Quadratische Reziprozitätsgesetz. Dieses ist ein gängiges Thema der sogenannten Elementaren Zahlentheorie”, das im Prinzip völlig elementar ” behandelt werden kann, aber von algebraischen Methoden profitiert. Der letzte Abschnitt 3.7 enthält einen weiteren zahlentheoretischen Exkurs. Die dort behandelten Quadratischen Zahlringe” sind das Analogon des√Ringes ” Z, wenn man den Körper Q durch einen quadratischen Zahlkörper Q[ d] ersetzt. Die behandelten Ergebnisse zur Struktur dieser Ringe können als eine erste Einführung in das Gebiet der Algebraischen Zahlentheorie” angesehen werden, ” in der analoge Ringe ganzer” algebraischer Zahlen in allgemeineren Körpern ” betrachtet werden. Algebra I 3.1 c Rudolf Scharlau, 2002 – 2010 121 Homomorphismen, Ideale und Faktorringe Aus dem Einleitungskapitel 1.5 sind uns folgende Begriffe bereits bekannt: Ring, kommutativer Ring mit Eins, Teilring (Unterrring), Einheiten eines Ringes, Einheitengruppe, Nullteiler, Integritätsbereich (nullteilerfreier Ring), der Restklassenring Z/mZ. Beim weiteren Aufbau der Ringtheorie läuft vieles analog zum Fall der Gruppen oder Vektorräume; die grundlegenden Begriffe und Konstruktionen sind die gleichen oder ähnlich. So werden Homomorphismen eingeführt als strukturerhaltende Abbildungen. Jeder Homomorphsimus besitzt einen Kern, der ein Unter” objekt” des Definitionsbereiches ist. Die Kerne von Ringhomomorphismen heißen Ideale. Das sind genau diejenigen Unterobjekte von Ringen, nach denen eine Faktorstuktur (Quotientenstruktur) gebildet werden kann. Sie entsprechen also den Normalteilern in Gruppen. Als Konsequenz dieses Sachverhaltes ergibt sich wie bei den Gruppen der Homomorphiesatz. Bei der Entwicklung dieser Grundlagen fassen wir uns generell etwas kürzer als früher bei den Gruppen. Im zweiten Teil dieses Unterkapitels folgen weitere Begriffe, die (größtenteils) spezifisch für Ringe sind: Hauptideale, Schnitte und Summen von Idealen sowie die Begriffe Primideal und maximales Ideal; diese Ideale kann man an ihren Faktorringen erkennen. Wir beschließen diesen Abschnitt mit einer ausführlichen Diskussion des Chinesischen Restsatzes: für die Restklassenringe Z/mZ setzt das nicht nur den Abschnitt 1.5 fort, sondern hat auch Beziehungen zu Kapitel 2.1 (Zyklische Gruppen) sowie 2.6 (Semidirekte Produkte, Automorphismen zyklischer Gruppen). Wir tragen an dieser Stelle auch die Behandlung der Eulerschen Phi-Funktion nach, deren Multiplikativität” aus dem Chinesischen ” Restsatz folgt. Die im folgenden betrachteten Ringe haben in aller Regel ein Einselement; wir wollen das aber nicht ausdrücklich voraussetzen. Letzlich haben wir kommutative Ringe im Auge, werden aber den nicht-kommutativen Fall mit behandeln, solange es keinen zusätzlichen Aufwand macht. Definition 3.1.1 (Homomorphismus, Isomorphismus) a) Es seien R und S zwei Ringe. Eine Abbildung ϕ : R → S heißt Ringhomomorphismus, falls für alle x, y ∈ R gilt ϕ(x + y) = ϕ(x) + ϕ(y) und ϕ(x · y) = ϕ(x) · ϕ(y) . b) Ein Isomorphismus eines Ringes R auf einen Ring S ist ein bijektiver Homomorphismus ϕ : R → S. Falls R = S ist, spricht man von einem Automorphismus dieses Ringes. c) Zwei Ringe R und S heißen isomorph, falls ein Isomorphismus von R auf S existiert. Algebra I c Rudolf Scharlau, 2002 – 2010 122 Beispiele 3.1.2 (Ringhomomorphismen) (1) Wir betrachten den Funktionenring F (M, R), für eine beliebige Menge M, die als Definitionsbereich dient. Für festes a ∈ M ist die Abbildung ϕa : F (M, R) → R, f 7→ f (a) ein Ringhomomorphismus, der sogenannte Auswertungs-Homomorphismus, kurz die Auswertung, an der Stelle a ∈ M. (2) Die Abbildung Z → Z/mZ, x 7→ [x]m := x + mZ ist ein surjektiver Ringhomomorphismus, der sogenannte kanonische Homomorphismus. (3) Die Abbildung C → C, x + iy = z 7→ z := x − iy (x, y ∈ R), also die komplexe Konjugation, ist ein Automorphismus von C. (4) Für jeden (nicht-kommutativen) Ring R und jede Einheit u ∈ R∗ ist die Abbildung iu : R → R, x 7→ uxu−1 ein Automorphismus von R, ein sogenannter innerer Automorphismus. (Man denke insbesondere an R = End(V ) bzw. R = Mn (K) für einen Körper K und einen K-Vektorraum V .) (5) Wenn B eine feste Basis des endlich-dimensionalen K-Vektorraumes V ist, so ist die Abbildung End(V ) → Mn (K), f 7→ MBB (f ) (Matrix von f bezüglich B) ein Ringisomorphismus. Diese Aussage fasst einige Sätze der Linearen Algebra über den Zusammenhang zwischen Linearen Abbildungen und Matrizen zusammen (für den Fall der Endomorphismen). Der folgende Satz ist inzwischen reine Routine. Alles verläuft völlig analog zu den linearen Abbildungen zwischen Vektorräumen oder den Gruppenhomomorphismen sowie dem Isomorphiebegriff für Vektorräume bzw. Gruppen. Satz 3.1.3 a) Es seien ϕ : R → S und ψ : S → K Ringhomomorphismen. Dann ist auch ψ ◦ ϕ : R → K ein Homomorphismus. b) Es sei ϕ : R → S ein Ringisomorphismus. Dann ist auch ϕ−1 : S → R ein Homomorphismus und damit ein Isomorphismus. c) Isomorphie R ∼ = S von Ringen ist eine Äquivalenzrelation. Als nächstes widmen wir uns denjenigen Unterstrukturen eines Ringes, die als Kerne von Ringhomomorphismen auftauchen. Im Falle der Gruppen wären dieses die normalen Untergruppen oder Normalteiler, aber keine beliebigen Untergruppen. Hier ist es ähnlich, wie wir gleich sehen werden. Ein Homomorphismus zwischen zwei Ringen ist insbesondere ein Homomorphismus der unterliegenden abelschen Gruppen, der Kern also insbesondere eine Untergruppe. (Normalität spielt keine Rolle, da es sich um kommutativen Gruppen handelt.) Klar ist auch, dass ein Kern abgeschlossen ist unter der Multiplikation. Bezüglich der Multiplikation gilt sogar noch mehr, und das ist Gegenstand der nächsten Definition. c Rudolf Scharlau, 2002 – 2010 Algebra I 123 Definition 3.1.4 Eine Teilmenge I eines Ringes R heißt ein Ideal, falls folgendes gilt: (I 1) I ist eine Untergruppe von (R, +). (I 2) r ∈ R, a ∈ I =⇒ r · a ∈ I, a · r ∈ I. Man spricht von einem Linksideal, falls statt (I 2) lediglich die folgende Bedingung erfüllt ist: (I 2’) r ∈ R, a ∈ I =⇒ r · a ∈ I. Hier nun der Satz, der diese Definition motiviert: Satz 3.1.5 Der Kern Ker ϕ = {x ∈ R | ϕ(x) = 0} ⊆ R eines Ringhomomorphismus ϕ : R → S ist ein Ideal. Beweis: Da ein Ringhomomorphismus insbesondere ein Homomorphismus der unterliegenden additiven Gruppen ist, ist der Kern nach Satz 1.4.4 eine Untergruppe von (R, +), d.h. die erste Idealeigenschaft (I 1) gilt. Wenn r ∈ R, a ∈ Ker ϕ ist, so ist ϕ(r · a) = ϕ(r) · ϕ(a) = ϕ(r) · 0 = 0, also r · a ∈ Ker ϕ, wie für (I 2) gewünscht. Das gleiche gilt für a · r. Beispiele 3.1.6 (Ideale) (1) Für jeden kommutativen Ring R und jedes a ∈ R ist Ra = {ra | r ∈ R} ein Ideal in R, ein sogenanntes Hauptideal mit Erzeuger a. Es ist auch die Bezeichnung Ra =: (a) üblich. (2) Im Ring Z sind die Ideale genau die Vielfachenmengen Zm = {zm | z ∈ Z}, also sämtlich Hauptideale. Jedes Ideal ist nämlich eine Untergruppe, und jede Untergruppe von Z ist nach 2.1.5 von dieser Bauart, nämlich zyklisch. Es ist übrigens auch unabhängig von dieser expliziten Beschreibung klar, dass in Z jede Untergruppe sogar ein Ideal ist. Denn die Idealeigenschaft (I 2) folgt aus den Untergruppeneigenschaften, weil die Multiplikation in Z auf die fortgesetzte Addition und Bildung von Negativen (additiven Inversen) zurückgeführt werden kann. (3) Im Funktionenring F (M, R) ist für jede Teilmenge N ⊆ M des Definitionsbereichs die Menge {f ∈ F (M, R) | f|N = 0} der auf N verschwindenden Funktionen ein Ideal. Für einelementiges N = {a} ist das der Kern des Auswertungs-Homomorphismus ϕa aus Beispiel 3.1.2 (1). c Rudolf Scharlau, 2002 – 2010 Algebra I 124 (4) Im (nicht-kommutativen) Endomorphismenring End(V ) eines Vektorraums der Dimension ≥ 2 ist für jeden Unterraum U ⊆ V die Teilmenge {f ∈ End(V ) | f|U = 0} der auf U verschwindenden Endomorphismen ein Linksideal, aber für {0} = 6 U 6= V kein zweiseitiges Ideal. Die folgende Definition ist nach den Beipielen (1) und (2) naheliegend: Definition 3.1.7 Ein Hauptidealring ist ein Integritätsbereich R, in dem jedes Ideal I ein Hauptideal ist, d.h. es existiert ein a ∈ R mit I = Ra. Man beachte, dass ein Hauptidealring nach Definition (zusätzlich) nullteilerfrei ist. Wie wir in Beispiel 3.1.6 (2) gesehen haben, ist der Ring Z der ganzen Zahlen ein Hauptidealring. Das gleiche gilt (mit einem analogen Grund, nämlich der Division mit Rest) für den Polynomring über einem Körper. Wir werden Hauptidealringe in Abschnitt 3.3 weiter studieren. Wir machen noch ein paar Bemerkungen über den Zusammenhang zwischen den Begriffen Ideal” und Teilring”. Bei den von uns gewählten Definitionen ist jedes Ideal ” ” ein Teilring (siehe Definition 1.5.4), denn die Eigenschaft (I 2) ist eine Verschärfung von (TR 2). Wenn wir allerdings, und dafür gibt es gute Gründe, von einem Teilring von R verlangen, dass er das Einselement 1R enthält, so bleibt für ein Ideal I, das auch Teilring sein soll, nur noch die Möglichkeit I = R übrig. Denn es ist nach (I 2) r = r1R ∈ I für jedes r ∈ R. Es macht übrigens Sinn, von einem Ideal I ausdrücklich zu verlangen, dass I 6= R ist. Denn für I = R besteht der Faktorring R/I nur aus der Null, und das sollte eigentlich innerhalb der von uns betrachteten Klasse der Ringe mit Einselement ausgeschlossen sein. Zumindest in einem Körper gilt jedenfalls 1 6= 0. Trotzdem bleiben wir dabei, auch ganz R als Ideal anzusehen, weil das letztlich für viele Formulierungen etwas bequemer ist. Nun kommen wir zu den Faktorringen. Diese entstehen durch Äquivalenzklassenbildung nach einem Ideal. Da jedes Ideal I in einem Ring R insbesondere eine Untergruppe von (R, +) ist, ist die Menge R/I der Nebenklassen a+I, a ∈ R, durch 2.2.1 bereits definiert. Da (R, +) eine abelsche Gruppe ist, trägt R/I nach Satz 2.2.12 sogar die Struktur einer Gruppe. In einer abelschen Gruppe ist nämlich jede Untergruppe ein Normalteiler. (Erinnerung: in Wirklichkeit kannten wir die Gruppe R/I schon vor der allgemeinen Behandlung in 2.2.12, nämlich aus der Konstruktion von Z/mZ sowie ggf. von Quotientenvektorräumen.) Es muss jetzt also noch die Multiplikation von Nebenklassen definiert werden, was völlig analog zur Addition, und völlig analog zum Fall von Z/mZ (siehe 1.2.11) geschieht. Die Nebenklassen werden in Ringen oft auch als Restklassen bezeichnet, in Verallgemeinerung der Restklassen ganzer Zahlen (also der Elemente von Z/mZ). Satz 3.1.8 (Faktorring) a) Es sei I ein Ideal im Ring R. Dann wird auf R/I durch (a + I) · (b + I) := a · b + I eine Verknüpfung sinnvoll definiert. (a, b ∈ R) Algebra I c Rudolf Scharlau, 2002 – 2010 125 b) R/I zusammen mit der Restklassen-Addition und der unter a) definierten Restklassen-Multiplikation ist ein Ring, der sogenannte Faktorring von R nach I. c) Die Abbildung πI : R → R/I, x 7→ x + I ist ein Ringhomomorphismus, der sogenannte kanonische Homomorphismus. Sein Kern ist gleich I. Beweis: Zum Beweis von a) muss man bekanntlich folgendes zeigen: Wenn a′ , b′ zwei weitere Ringelemente sind mit a − a′ ∈ I, b − b′ ∈ I, so ist auch ab − a′ b′ ∈ I. Dieses rechnet man unmittelbar nach. Nachdem nun die Multiplikation auf R/I wohldefiniert ist, rechnet man sofort nach, dass sich das Assoziativgesetz hierfür sowie die beiden Distributivgesetze unmittelbar von R auf R/I übertragen. Somit ist b) gezeigt. Teil c) schließlich gilt nach Definition und wird lediglich zur Abrundung aufgeführt. Man sieht hier, dass jedes Ideal als Kern eines Homomorphismus auftaucht. Wir kommen nun zu einem der grundlegenden Sätze der allgemeinen Ringtheorie, dem Homomorphiesatz. Er ist völlig analog zum entsprechenden Satz für Gruppen und kann in der Tat als eine Ergänzung oder Weiterführung des Homomorphiesatzes für Gruppen in der speziellen Situation der Ringe, Ringhomomorphismen und Ideale angesehen werden. Satz 3.1.9 (Homomorphiesatz für Ringe) a) Es sei ϕ : R → S ein Ringhomomorphismus. Weiter sei I ⊆ R ein Ideal mit I ⊆ Ker ϕ. Mit πI bezeichnen wir weiterhin die kanonische Projektion R → R/I. Dann gibt es einen eindeutig bestimmten Ringhomomorphismus ϕ′ : R/I → S mit ϕ = ϕ′ ◦ πI , d.h. das Diagramm πI ϕ - - R S ϕ′ ? R/I ist kommutativ. b) Unter den Voraussetzungen von a) ist Bild ϕ = Bild ϕ′ . Insbesondere ist ϕ′ surjektiv genau dann, wenn ϕ surjektiv ist. c) Unter den Voraussetzungen von a) ist Ker ϕ′ = (Ker ϕ)/N. Insbesondere ist ϕ′ injektiv genau dann, wenn N = Ker ϕ ist. Algebra I c Rudolf Scharlau, 2002 – 2010 126 Beweis: zu a): Aus dem Homomorphiesatz für Gruppen 2.2.13 folgt die Existenz eines eindeutigen Gruppenhomomorphismus ϕ : R → S mit ϕ = ϕ′ ◦ πI . Aus der Definition der Multiplikation auf R/I folgt unmittelbar, das ϕ′ sogar ein Ringhomomorphismus ist. Die Aussagen b) und c) stehen bereits in 2.2.13. Genau wie bei Gruppen ist der Homomorphiesatz ein Standard-Werkzeug, um Isomorphismen zu konstruieren. Hierfür wird der folgende Spezialfall des Satzes benutzt: Korollar 3.1.10 (Isomorphiesatz für Ringe) Jeder surjektive Ringhomomorphismus ϕ : R → S induziert einen Isomorphismus R/ Ker ϕ ∼ = S. Der Homomorphiesatz und seine Folgerung, der Isomorphiesatz, werden uns mit weiterem Aufbau der Ringtheorie immer wieder begegnen, und wir werden nach und nach eine Fülle unterschiedlicher Anwendungen sehen. Hier ist eine erste Anwendung. Wir erinnern an folgende Bezeichnung: Für a ∈ Z und m ∈ N ist [a]m := a + mZ ∈ Z/mZ . die Restklasse (Kongruenzklasse) modulo m der Zahl a. Beispiel 3.1.11 Für m, n ∈ N mit m|n ist die Abbildung Z/nZ → Z/mZ, [x]n 7→ [x]m wohldefiniert und ein surjektiver (Ring-)Homomorphismus. Beweis: Es sei ϕ : Z → Z/mZ die Abbildung x 7→ [x]m , also die kanonische Projektion, und I = nZ. Dann sind alle Voraussetzungen des Homomorphiesatzes erfüllt, und er liefert die gewünschte Aussage. Wenn ein Ideal I in einem Ring R das Einselement 1R enthält, so ist offensichtlich I = R, wie sofort aus Axiom (I 2) folgt. Allgemeiner gilt dieses, sobald I eine Einheit a enthält. Denn dann gilt wieder nach (I 2) auch 1R = a−1 · a ∈ I. Insbesondere sind in einem Körper K die einzigen Ideale {0} und K selbst. Dieses wiederum hat folgende Konsequenz: Satz 3.1.12 Jeder Ringhomomorphismus ϕ : K → R, wobei K ein Körper ist, ist injektiv oder identisch Null. Als nächstes halten wir einige einfache Konstruktionsprinzipien für Ideale fest, die völlig analog dem Fall der Teilräume von Vektorräumen sind. Das folgende überträgt sich übrigens sofort auf Untergruppen von additiv geschriebenen abelschen Gruppen, allgemeiner auf Moduln über Ringen”, wie sie im zweiten Teil ” der Vorlesung betrachtet werden. c Rudolf Scharlau, 2002 – 2010 Algebra I 127 Bemerkung und Definition 3.1.13 Es sei R ein Ring, I und J Ideale in R. a) I ∩ J ist ein Ideal in R. Allgemeiner ist der Durchschnitt einer beliebigen Menge von Idealen wieder ein Ideal. b) I + J ist ein Ideal in R. c) Sei R kommutativ, und seien a1 , . . . , ak ∈ R. Dann ist ( k ) X Ra1 + Ra2 + . . . + Rak = ri ai | r1 , . . . rk ∈ R i=1 ein Ideal in R, das von a1 , . . . , ak erzeugte Ideal. Die unter c) betrachtete Menge ist offenbar ein Analogon des Spanns (der linearen Hülle) endlicher vieler Elemente eines Vektorraums. Der Begriff erzeugt” wird ” unter c) im üblichen Sinn benutzt: es handelt sich um das kleinste Ideal, das die Menge {a1 , . . . , ak } enthält. Dass ein solches existiert, kann man auch an Teil a) sehen: im Prinzip kann man den Schnitt aller Ideale betrachten, die die gegebene Menge enthalten; allerdings liefert das keine konstruktive Beschreibung. Das Summenideal unter b) ist das kleinste Ideal, das I und J enthält; es kann also als das Erzeugnis von I ∪ J aufgefasst werden. Die Hauptideale sind genau die von einem Element erzeugten Ideale; sie entsprechen also den zyklischen Untergruppen. Die in c) betrachteten Ideale heißen endlich erzeugt. Später, wenn wir mehr Beispiele von Ringen genauer kennen, werden wir Ideale sehen, die als Erzeugnis von zwei Elementen gegeben sind, aber nicht von einem Element erzeugt werden können, d.h. keine Hauptideale sind. (Man kann den Polynomring Z[X] nehmen.) Beispiele 3.1.14 (Schnitt und Summe von Idealen) (1) Der Durchschnitt Za ∩ Zb zweier Hauptideale in Z besteht aus den Zahlen, die sowohl Vielfache von a als auch von b sind, d.h. den gemeinsamen Vielfachen von a und b. Dass diese Menge wieder ein Hauptideal ist bedeutet, dass es einen sinnvollen Begriff des kleinsten” gemeinsamen Vielfachen ” gibt, und zwar in allen Hauptidealringen. Für Z hatten wir dieses bereits oben im Kontext zyklischer Gruppen als Hilfssatz 2.1.14 festgehalten. (2) Wir wissen aus Satz 2.1.11, dass von zwei Elementen a und b erzeugte Ideale (=Untergruppen) in Z zur Definition des größten gemeinsamen Teilers benutzt werden können: Za + Zb = Zg, wobei g = ggT(a, b). (Erinnerung: Dieses folgt leicht aus den Lemma von Bezout.) c Rudolf Scharlau, 2002 – 2010 Algebra I 128 Als nächstes betrachten wir Ideale mit zusätzlichen Eigenschaften. Definition 3.1.15 Es sei R ein kommutativer Ring und I ein Ideal in R. a) I heißt Primideal, falls gilt: a, b ∈ R, a · b ∈ I =⇒ a ∈ I oder b ∈ I . b) I heißt maximal, falls I 6= R ist und gilt: J Ideal in R, J ⊇ I =⇒ J = I oder J = R . Der Begriff der Maximalität unter b) ist der übliche, auch in anderen Zusammenhängen nützliche: ein Ideal ist maximal, wenn es als Teilmenge von R maximal bezüglich der Inklusions-Relation ist unter allen echten Teilmengen von R, die Ideale sind. D.h. jede echte Obermenge gehört nicht mehr zu der betrachteten Klasse von Mengen. Die Primideale bzw. maximalen Ideale kann man an ihren Faktorringen erkennen, wie der folgende Satz zeigt. Satz 3.1.16 Es sei I ein Ideal in einem kommutativen Ring R. a) I ist Primideal ⇐⇒ R/I ist nullteilerfrei. b) I ist maximal ⇐⇒ R/I ist ein Körper. Beweis: siehe Vorlesung. Da jeder Körper nullteilerfrei ist, haben die beiden Äquivalenzen des Satzes die folgende Konsequenz: Korollar 3.1.17 Jedes maximale Ideal ist ein Primideal. Im Ring Z sind von {0} verschiedene Primideale und maximale Ideale das gleiche; es sind die Hauptideale Zp, wobei p eine Primzahl ist. Das folgt aus Satz 1.5.14 zusammen mit Satz 3.1.16. Wir notieren noch eine letzte algebraische Standardkonstruktion auch für Ringe; sie baut, wenn man so will, auf 1.3.13 für Gruppen auf. Definition und Bemerkung 3.1.18 (Direktes Produkt von Ringen) a) Wenn R und S zwei Ringe sind, dann ist R ×S mit komponentenweiser Addition und Multiplikation ebenfalls ein Ring, das sogenannte direkte Produkt von R und S. b) R × S ist kommutativ genau dann, wenn R und S es sind. c) Wenn R und S beide ein Einselement besitzen, dann gilt dieses auch für R × S. In diesem Fall gilt für die Einheitengruppen (R × S)∗ = R∗ × S ∗ . Algebra I c Rudolf Scharlau, 2002 – 2010 129 d) Die Faktoren R × {0} und {0} × S sind Ideale in R × S. e) Die beiden Projektionen prR : R × S → R, (x, y) 7→ x, prS : R × S → S, (x, y) 7→ y sind Ringhomomorphismen mit Kern {0} × S bzw. R × {0}. Wir wollen R×{0} und {0}×S nicht ausdrücklich als Teilringe auffassen, denn sie besitzen (ggf. ) ein anderes Einselement als R×S, und die Inklusionen {0}×S ֒→ R × S und R × {0} ֒→ R × S sind keine Ringhomomorphismen, die Eins auf Eins abbilden. Nachdem die allgemeine Theorie nun ein Stück weit entwickelt ist, kehren wir zum Ring der ganzen Zahlen und seinen Restklassen zurück. Der folgende Satz, der sogenannte Chinesische Restsatz, ist einer der Eckpfeiler der Elementaren Zahlentheorie. Satz 3.1.19 (Chinesischer Restsatz für Z) Es seien m1 , m2 , . . . , mr paarweise teilerfremde natürliche Zahlen, d.h. ggT(mi , mj ) = 1 für i 6= j, und m := m1 m2 . . . mr . Dann ist die Abbildung Z/mZ → Z/m1 Z × Z/m2 Z × . . . × Z/mr Z [x]m 7→ ([x]m1 , [x]m2 , . . . , [x]mr ) ein Isomorphismus von Ringen. Als Satz über zyklische Gruppen ist uns dieser Satz aus 2.2.16 bereits bekannt; wir müssen nur bemerken, dass der dort konstruierte Isomorphismus wegen 3.1.9 sogar ein Ringisomorphismus ist. Außerdem haben wir bei dieser Gelegenheit die Verallgemeinerung auf mehr als zwei Faktoren notiert, die man leicht durch Induktion über r beweist. Siehe auch den unten folgenden Zusatz 3.1.21. Wenn man vom Chinesischen Restsatz alle algebraische Terminologie abstreift, handelt er davon, dass mehrere gleichzeitig betrachtete Kongruenzen für teilerfremde Moduln” immer eine gemeinsame Lösung x haben. In der älteren Litera” tur wird er deshalb auch als Hauptsatz über simultane Kongruenzen bezeichnet. Der Satz sieht dann wie folgt aus: Satz 3.1.20 (Hauptsatz über simultane Kongruenzen) Es seien m1 , m2 , . . . , mr paarweise teilerfremde natürliche Zahlen und m ihr Produkt. Dann existiert zu je r vorgegebenen ganzen Zahlen x1 , . . . , xr eine ganze Zahl x mit x ≡ xi (mod mi ) für alle i = 1, . . . , r . Wenn x′ eine weitere solche Zahl ist, dann gilt x′ ≡ x (mod m). Als algorithmische Aufgabe stellt sich nun die Frage, wie man zu gegebenem xi i = 1, . . . , r ein x ∈ Z mit x ≡ xi (mod mi ) für i = 1, . . . , r explizit berechnet. Mit anderen Worten, man möchte einen Algorithmus für die Umkehrabbildung der Abbildung aus dem Beweis des chinesichen Restsatzes angeben. Dieses geht wie folgt: c Rudolf Scharlau, 2002 – 2010 Algebra I Zusatz 3.1.21 In der Situation von 3.1.19 setze man Mi = Q 130 mj und bestimme j6=i für i = 1, . . . , r jeweils ai mit ai Mi ≡ 1 (mod mi ). Dann ist das gesuchte x bei gegebenen xi gleich r X x= ai Mi xi . i=1 Man beachte, dass mi und Mi jeweils teilerfremd sind; deswegen existiert das gewünschte ai (man erinnere sich an 1.5.8). Der Rest des Beweises ergibt sich nunmehr durch direkte Überprüfung der gewünschten Kongruenzen. Vom algorithmischen Standpunkt aus reduziert sich der Chinesische Restsatz somit auf die Inversenberechnung in Ringen Z/mZ, also auf das Lemma von Bezout, und damit letztlich auf den erweiterten euklidischen Algorithmus. Wir wollen nun den Chinesischen Restsatz auf die Bestimmung der Ordnung der Gruppe (Z/mZ)∗ anwenden. Die entsprechende Zählfunktion ist eine bekannte zahlentheoretische Funktion und hat einen eigenen Namen. Definition 3.1.22 Die Eulersche ϕ-Funktion ϕ : N → N ist definiert durch ϕ(n) = |(Z/nZ)∗ | = {k ∈ N | 0 < k < n, ggT(k, n) = 1}. Mit anderen Worten, ϕ(n) ist die Ordnung der primen Restklassengruppe modulo n. Satz 3.1.23 a) Die Eulersche ϕ-Funktion ist multiplikativ , d.h. es gilt ϕ(mn) = ϕ(m)ϕ(n) für alle m, n ∈ N mit ggT(m, n) = 1. b) Für eine Primzahlpotenz pl gilt ϕ(pl ) = pl − pl−1 = pl−1 (p − 1). Beweis: zu a): Der Isomorphismus Z/mnZ ∼ = Z/mZ × Z/nZ induziert wie jeder Ringisomorphismus offenbar einen Isomorphismus der Einheitengruppen: (Z/mnZ)∗ ∼ = (Z/mZ × Z/nZ)∗ . Nach Bemerkung 3.1.18 c) ist die zweite Gruppe isomorph zu (Z/mZ)∗ × (Z/nZ)∗ . Betrachtung der Mächtigkeiten liefert unmittelbar die Behauptung. zu b): dieses ist elementar: die zu pl teilerfremden Zahlen zwischen 0 und pl sind genau die nicht durch p teilbaren unter diesen Zahlen. Nun ist aber genau jede p-te Zahl, also 0, p, 2p, . . . durch p teilbar, von den pl Zahlen von 0 bis pl − 1 sind also genau pl−1 durch p teilbar. Man beachte, dass sich aus a) und b) eine explizite Formel für ϕ(n) ergibt (allerdings nur, wenn man die Primfaktorzerlegung kennt, diese Einschränkung ist für das RSA-Verfahren der Public-Key-Kryptographie von großer Bedeutung). Für jede multiplikative Funktion f : N → C gilt offenbar f (n) = r Y i=1 f (pki i ), wobei n = r Y i=1 pki i mit verschiedenen Primzahlen pi . c Rudolf Scharlau, 2002 – 2010 Algebra I 3.2 131 Polynomringe Generalvoraussetzung: In diesem Abschnitt besitzen alle vorkommenden Ringe R ein Einselement 1R . Ferner sind alle Ringe kommutativ, es sei denn, etwas anderes ist ausdrücklich zugelassen. Von einem Ringhomomorphismus R → S wird verlangt, dass er 1R auf 1S abbildet. Wir wollen jetzt Polynomringe definieren und dadurch den aus der Analysis und Linearen Algebra bekannten Begriff des Polynoms auf eine feste Grundlage stellen sowie etwas verallgemeinern. Man weiß, dass Polynome algebraische Terme mit ” einer Unbestimmten sind“, und man weiß auch, dass jedes Polynom eine Funktion definiert. Die formale Definition eines Polynoms ist abstrakter, aber auch einfacher als solche Erklärungen: Ein Polynom wird definiert als die Folge seiner Koeffizienten. Satz und Definition 3.2.1 (Polynomring) Für einen Ring R setze R(N0 ) = {(ak )k∈N0 | ak ∈ R, ak = 0 für fast alle k} . Definiere auf R(N0 ) die übliche Addition (ak ) + (bk ) := (ak + bk ) (1) sowie eine Multiplikation durch (ak ) · (bk ) = (ck ), wobei ck = k X ai bk−i . (2) i=0 Mit diesen Verknüpfungen ist R(N0 ) ein kommutativer Ring mit Einselement, der sogenannte Polynomring über R. Der Beweis kann durch einfaches Nachrechnen aller Ringaxiome geführt werden, wobei die entsprechenden Axiome für R selbst natürlich ständig benutzt werden. Zumindest ein Teil dieser Verifikationen ist auch schon bekannt: Die Addition ist die übliche Addition auf der Menge RN0 = Abb(N0 , R) aller Folgen in R (eine Folge in R ist bekanntlich nichts anderes als eine Abbildung N0 → R). Wenn R ein Körper ist, erhält man so ein bekanntes Beispiel für einen R-Vektorraum. Seine Gruppenstruktur benutzt nur die Gruppe (R, +); diese liegt genauso schon für einen Ring R vor. Die hier betrachtete Teilmenge R(N0 ) ⊆ RN0 ist offensichtlich eine Untergruppe. Die komplizierter aussehende Multiplikation werden wir gleich noch erklären. In der Definition 3.2.1 sieht man noch keine richtigen“ Polynome wie 2X 3 + ” 5X 2 −3X −1. Den Anschluss an diese übliche Notation erreichen wir mit folgender Konstruktion. c Rudolf Scharlau, 2002 – 2010 Algebra I 132 Zusatz 3.2.2 (Die Unbestimmte) Setze X := (0, 1, 0, 0, . . .) ∈ R(N0 ) , und für r ∈ R und (ak ) ∈ R(N0 ) setze r(ak ) = (rak ) ∈ R(N0 ) . Dann gilt (ak )k∈N0 = n X ak X k k=0 für alle Polynome (ak ), wobei n so gewählt ist, dass ak = 0 für k > n. Dieses X heißt Unbestimmte über R. Nun wollen wir zu der üblichen Bezeichnung R[X] für den Polynomring kommen. Wir führen die Notation R[· · · ] gleich allgemeiner ein, unabhängig von Polynomen: Bemerkung 3.2.3 Es sei S ⊇ R ein Oberring und β ∈ S. Dann ist ( m ) X R[β] := ak β k | m ∈ N, a0 , . . . , am ∈ R k=0 (lies: R adjungiert β“) ein Teilring von S, und zwar der kleinste Teilring von S, ” der R und β enthält. Beweis: Als erstes stellen wir fest, dass 0 und 1 in der angegebenen Menge liegen, wie es für einen Teilring gefordert wird. Ein Teilring von S, der R und β enthält, muss auch β · β = β 2 und weiter dann alle Potenzen β k enthalten, also auch alle Summen der angegebenen Form. Es bleibt zu zeigen, dass die angegebene Menge selbst bereits ein Teilring ist, also abgeschlossen unter Addition und Multiplikation. Für zwei gegebene Elemente k X j=0 j aj β ∈ R[β], m X j=0 bj β j ∈ R[β] sei o.B.d.A. k = m (sonst mit Nullen auffüllen). Offensichtlich ist m X aj β j + j=0 m X bj β j = j=0 m X (aj + bj )β j (3) j=0 wieder von dieser Form. Für das Produkt muss man die Summen ausmultiplizieren und dann nach Potenzen von β sortieren, etwa (a0 + a1 β + a2 β 2 + . . . ) · (b0 + b1 β + b2 β 2 + . . . ) = a0 b0 + (a0 b1 + a1 b0 )β + (a0 b2 + a1 b1 + a2 b0 )β 2 + . . . , allgemein m X j=0 j aj β · m X j=0 j bj β = 2m X k=0 k ck β , wobei ck = k X i=0 ai bk−i . (4) Algebra I c Rudolf Scharlau, 2002 – 2010 Also liegt auch das Produkt in R[β]. 133 Wir wenden uns nun wieder dem Polynomring zu. Wir identifizieren ab jetzt mit Hilfe der Abbildung iR : r 7→ (r, 0, 0, . . .) den Ring R mit einem Teilring von R(N0 ) ; die Elemente der Form (r, 0, 0, . . .) sind die konstanten Polynome“. Diese ” Abbildung nennen wir auch die kanonische Einbettung“ von R in R(N0 ) . Somit ” können wir die vorige Definition auf S = R(N0 ) und β = X anwenden. Gemäß der Formel aus dem Zusatz 3.2.2 erhalten wir für R[β] = R[X] bereits ganz R(N0 ) . Die Schreibweise R[X] := R(N0 ) für den Polynomring ist also gerechtfertigt und nunmehr ein Spezialfall der Definition 3.2.3. Gelegentlich heisst der Polynomring auch R[x], R[T ], R[t], je nachdem, wie die Unbestimmte (0, 1, 0, . . . ) genannt wird. Wir gehen schließlich noch auf die offensichtliche Parallelität zwischen den Formeln (1) und (3) sowie (2) und (4) ein: in der Situation von 3.2.3 hat man eine in naheliegender Weise definierte Abbildung R[X] → R[β], (aj ) = m X j=0 j aj X 7−→ m X aj β j . (5) j=0 Der Vergleich der genannten Formeln besagt genau, dass diese Abbildung verknüpfungstreu für + und · ist, also ein Ringhomomorphismus ist. Diese Tatsache ist der Grund, warum die Definition der Multiplikation in der Definition 3.2.1 offenbar vernüftig ist, und sie stärkt das Vertrauen, dass man sich die Verifikation der Ringaxiome für den Polynomring eigentlich ersparen kann. (Einen schlüssigen Beweis etwa des Assoziativgesetzes ohne Rechnung ergibt dieses Argument allerdings nicht.) Der genannte Homomorphismus ist eindeutig dadurch bestimmt, dass er auf R die Identität (genauer: die Inklusion von R in S) ist und X auf β abbildet. Mit anderen Worten: in dem Polynom, hingeschrieben mit Koeffizienten in R und X-Potenzen wird überall X durch β ersetzt. Man spricht deshalb auch vom Einsetzungs-Homomorphismus. Wir fassen die Diskussion in einem Satz zusammen, der noch eine kleine Verallgemeinerung entält (R braucht kein Teilring von S zu sein). Satz und Definition 3.2.4 (Der Einsetzungs-Homomorphismus) Es sei ϕ : R → S ein Ringhomomorphismus und β ∈ S. Dann gibt es einen eindeutig bestimmten Ringhomomorphismus ϕβ : R[X] → S mit ϕβ ◦ iR = ϕ und ϕβ (X) = β, d.h. das Diagramm iR ϕ ϕβ ? R[X] - - R S c Rudolf Scharlau, 2002 – 2010 Algebra I 134 ist kommutativ. Hier bezeichnet iR : r 7→ (r, 0, 0, . . .) die kanonische Einbettung. Der Homomorphismus ϕβ heißt auch Einsetzungs-Homomorphismus zu β. Für gegebenes f ∈ R[X] wird das Bild ϕβ (f ) auch als f (β) bezeichnet. Falls f (β) = 0 ist (also f im Kern von ϕβ liegt), nennt man β auch eine Nullstelle (in S) von f. Den Einsetzungs-Homomorphismus und die Notation f (β) kann man natürlich auch für S = R[X], β = X anwenden; dann ergibt sich f = f (X). D.h. man kann ein Polynom f auch als f (X) schreiben, wenn dieses im Kontext sinnvoll erscheint. (Bekanntlich hat man bei Funktionen zwischen der Funktion f und ihrem Funktionswert f (x) zu unterscheiden, und genau so bekannt ist, dass diese Unterscheidung in der Analysis nicht immer leicht durchzuhalten ist, man denke etwa an die Funktion” cos(x2 ). Polynome über R sind keine Funktionen auf R, ” ein eventuelles analoges Bezeichungsproblem ist bei Polynomen jedenfalls gelöst.) Ebenso ist es sowohl formal korrekt als auch direkt verständlich, für ein Polynom f auch vom Polynom f (X 2 ), allgemeiner vom Polynom f (g) zu sprechen, wobei g im letzteren Fall irgend ein weiteres Polynom (im gleichen Polynomring) ist. Bemerkung 3.2.5 In 3.2.4 muss S nicht notwendig kommutativ sein, z.B. könnte S ein Ring von Matrizen oder Endomorphismen sein. Dann setzen wir voraus, dass ϕ(x) · y = y · ϕ(x) für alle x ∈ R, y ∈ S gilt. Mit anderen Worten, das Bild ϕ(R) soll im Zentrum von S enthalten sein. Dieses ist analog zum Zentrum einer Gruppe definiert (siehe 2.3.12.e)) und ist ein Unterring von S. Definition und Satz 3.2.6 (Grad von Polynomen, Gradformel) P a) Für ein Polynom f = (ak ) = ak X k ∈ R[X] definiere den Grad von f als grad f := max{k | ak 6= 0} mit der Konvention grad 0 = −∞. Der Koeffizient an , wobei n = grad f heißt auch Leitkoeffizient von f . Ein Polynom heißt normiert, wenn sein Leitkoeffizient 1 ist. b) Es gilt grad(f · g) = grad f + grad g für alle f, g ∈ R[X] derart, dass der Leitkoeffizient von g kein Nullteiler ist. Insbesondere ist R[X] nullteilerfrei, wenn R es ist. c) Für alle f, g ∈ R[X] gilt grad(f + g) ≤ max{grad f, grad g}. Der Beweis ist klar. Algebra I c Rudolf Scharlau, 2002 – 2010 135 Korollar 3.2.7 Es sei R nullteilerfrei. Dann sind die Einheiten von R[X] genau die Einheiten von R. Beweis: Aus einer Gleichung f · g = 1 mit f, g ∈ R[X] folgt mit der Gradformel, dass f und g den Grad null haben, also in R liegen. Die Behauptung ergibt sich dann unmittelbar. Für Ringe mit Nullteilern ist die Aussage von Korollar 3.2.7 im Allgemeinen falsch: es können auch Polynome höheren Grades in R[X] invertierbar sein. Z.B. gilt für f = 1 + 2̄X n ∈ (Z/4Z)[X], dass f 2 = 1 ist, und zwar für jedes n. Bekanntlich kann man Polynome mit Rest“ dividieren, ähnlich wie ganze Zahlen. ” Die genaue Formulierung des Sachverhaltes ist wie folgt: Satz 3.2.8 Es sei R ein beliebiger Ring, f, g ∈ R[X] zwei Polynome über R, der Leitkoeffizient von g sei eine Einheit in R. Dann gibt es eindeutige Polynome q ∈ R[X] und r ∈ R[X], den Quotienten und den Rest, so dass f = qg + r und grad r < grad g. Beweis: Es sei n := grad f und m := grad g; wir können annehmen, dass g normiert ist. Wir führen nun für gegebenes festes g eine Induktion über n durch. Wir können m ≤ n annehmen (sonst sei q = 0 und r = f ). Es sei f = aX n + an−1 X n−1 +· · ·+a0 , g = X m +· · ·+b0 . Wir bilden nun das Polynom aX n−m g, das den gleichen Grad und Leitkoeffizienten wie f hat. Betrachte dann die Differenz f¯ := f −aX n−m g; es gilt grad f¯ < n. Falls sogar grad f¯ < m ist, sind wir fertig, mit q = aX n−m und r = f¯. Anderenfalls gibt es nach Induktionsannahme Polynome q̄, r mit f¯ = q̄g + r und grad r < grad g. Für das Polynom q := aX n−m + q̄ gilt dann f = aX n−m g + f¯ = aX n−m g + q̄g + r = qg + r, wie gewünscht. Zum Beweis der Eindeutigkeit betrachten wir eine weitere Darstellung f = qeg+e r mit den entsprechenden Eigenschaften. Dann ist (q−e q )g = re−r. Wenn q = qe ist, dann ist auch r = re, wir haben also die gleiche Darstellung. Anderenfalls ist nach 3.2.6 b) grad(q − qe)g ≥ grad g, andererseits nach 3.2.6 c) und Voraussetzung grad(e r − r) < grad g, ein Widerspruch. Man mache sich an Hand eines Zahlenbeispiels klar, dass in diesem Beweis bei mehrfacher Anwendung des Induktionssschrittes (solange, bis grad f¯ < m ist) genau das passiert, was man beim üblichen schriftlichen Dividieren von Polynomen tut. In beliebigen (kommutativen) Ringen, insbesondere in Polynomringen, hat man einen offensichtlichen Begriff der Teilbarkeit (siehe auch die folgende Definition 3.3.1): g teilt f , äquivalent: f ist ein Vielfaches von g bedeutet, dass ein q im Ring existiert mit f = qg. Diese allgemeine Definition ist mit dem Sprachgebrauch des Teilens mit Rest” kompatibel: in der Situation von 3.2.8 ist g ein Teiler von f ” c Rudolf Scharlau, 2002 – 2010 Algebra I 136 genau dann, wenn f von g ohne Rest” geteilt wird, genauer, wenn der Rest r ” der Division von f durch g null ist. Die Teilerrelation von Polynomen ist unter anderem im Zusammenhang mit Nullstellen von Interesse: Wenn f ein Vielfaches von g ist, dann ist wegen des Einsetzhomomorphismus jede Nullstelle von g auch eine Nullstelle von f . Insbesondere: wenn f ein Vielfaches von X − a ist, dann ist f (a) = 0. Von dieser offensichtlichen Tatsache gilt auch die (zunächst nicht offensichtliche) Umkehrung: sei f ∈ R[X], grad f ≥ 1 und a ∈ K. Division von f durch g = X − a liefert eine Darstellung f (X) = q(X)(X − a) + r, wobei grad r < 1 ist, also r ∈ R ein konstantes Polynom. Einsetzen von a liefert f (a) = r. Also ist tatsächlich a Nullstelle von f genau dann, wenn r = 0 ist, d.h. wenn X − a ein Teiler von f ist. Dieses beweist den ersten Teil des folgenden Satzes: Satz und Definition 3.2.9 Es sei R ein Ring und f ∈ R[X] ein Polynom über R. Ein Element a ∈ R ist genau dann eine Nullstelle von f , wenn das Polynom X − a ein Teiler von f ist. In diesem Fall gibt es eine eindeutige Darstellung f = (X − a)m h, wobei h ∈ R[X] ein Polynom mit h(a) 6= 0 ist. Die Zahl m =: m(a, f ) heißt auch die Vielfachheit der Nullstelle a von f . ee Die Eindeutigkeit ergibt sich wie folgt: sei f = (X −a)m h eine weitere Darstellung m und o.B.d.A. m ≤ m. e Da (X − a) nach 3.2.6 b) kein Nullteiler in R[X] ist, folgt e e durch Gleichsetzen und Kürzen, dass (X − a)m−m h = h ist. Unter der Annahme m<m e liefert Einsetzen von a, dass h(a) = 0 ist, also einen Widerspruch. Die Vielfachheit m(a, f ) einer Nullstelle a von f ist also die größte Zahl m derart, dass (X − a)m ein Teiler von f ist. Diese Bedingung macht für jedes a ∈ R Sinn. Mit diesem Verständnis ist m(a, f ) immer definiert, und ist ungleich Null genau dann, wenn a eine Nullstelle von f ist. Aus der Analysis weiß man, dass man die Vielfachheit einer Nullstelle auch über die Ableitung beschreiben kann. Die Differentiation von Polynomen kann über beliebigen Körpern, sogar Ringen als rein algebraische Operation wie folgt definiert werden: Bemerkung und Definition 3.2.10 (Derivation) Die Derivation oder formale Ableitung auf dem Polynomring R[X] wird definiert als Abbildung D : R[X] −→ R[X] m−1 m P P . (k + 1)ak+1 X k ak X k 7−→ k=0 k=0 Dann gelten die üblichen Rechenregeln, d.h. für alle f, g ∈ K[X] und alle a, b ∈ R ist D(af + bg) = aD(f ) + bD(g) Linearität D(f · g) = D(f ) · g + f · D(g) Produktregel . Man schreibt auch kurz D(f ) =: f ′ . Algebra I c Rudolf Scharlau, 2002 – 2010 137 Nun können wir ein Kriterium für mehrfache Nullstellen formulieren, das über jedem Ring gilt: Lemma 3.2.11 Es sei f ∈ R[X] ein Polynom über einem Ring R. Ein Element a ∈ R ist mehrfache Nullstelle von f , d.h. m(a, f ) ≥ 2 genau dann, wenn a gemeinsame Nullstelle von f und seiner Ableitung f ′ ist. Beweis: Sei f (a) = 0 vorausgesetzt. Dann ist f (X) = (X − a)g(X) mit einem Polynom g ∈ R[X], also nach der Produktregel f ′ (X) = g(X) + (X − a)g ′(X). Einsetzen von a in diese Polynomgleichung liefert f ′ (a) = g(a). Nach Satz 3.2.9 ist m(a, f ) > 1 äquivalent zu g(a) = 0. Das liefert die Behauptung. Nachdem wir früher für den Ring Z und jetzt für Polynomringe einiges über die Bedeutung der Division mit Rest erfahren haben, wollen wir die Situation in der folgenden Definition axiomatisieren und verallgemeinern: Definition 3.2.12 Ein euklidischer Ring ist ein Integritätsbereich R, für den es eine Funktion γ : R r {0} → N0 gibt, genannt Gradfunktion, so dass gilt: (Division mit Rest) Zu a, b ∈ R, b 6= 0 gibt es q, r ∈ R mit a = qb + r und γ(r) < γ(b) oder r = 0. Wie bei Polynomen setzt man γ(0) = −∞, was einige Ausnahmen in den Formulierungen vermeidet. Der Satz 3.2.8 führt nach dieser Definition auf den folgenden Satz: Satz 3.2.13 Wenn K ein Körper ist, so wird der Polynomring K[X] durch die Gradfunktion zu einem euklidischen Ring. Die Division mit Rest hat für den Polynomring über einem Körper die gleichen Konsequenzen wie für den Ring Z: Existenz des größten gemeinsamen Teilers mit entsprechenden Eigenschaften, Lemma von Bézout, eindeutige Primfaktorzerlegung; dabei entsprechen den Primzahlen die irreduziblen Polynome, die sich nicht als Produkt von Polynomen kleineren Grades schreiben lassen. Wichtig für diesen Themenkreis ist insbesondere der folgende Satz: Satz 3.2.14 Jeder euklidische Ring ist ein Hauptidealring. Dieser Satz verallgemeinert die bekannte Tatsache, dass jede Untergruppe von Z zyklisch ist. Denn in Z sind Ideale nichts anderes als Untergruppen, und Hauptideale sind dasselbe wie zyklische Untergruppen. Auch der Beweis wird völlig analog geführt: Ein b von minimalem Grad in einem Ideal I erzeugt dieses Ideal. c Rudolf Scharlau, 2002 – 2010 Algebra I 3.3 138 Primfaktorzerlegung in Hauptidealringen Inhalt dieses Abschnitts ist die Verallgemeinerung der Teilbarkeitslehre vom Ring Z auf beliebige Hauptidealringe. Hierzu gehört die Behandlung des Größten gemeinsamen Teilers und des Kleinsten gemeinsamen Vielfachen sowie die Formulierung und der (gegenüber dem Fall Z etwas kompliziertere) Beweis des Hauptsat” zes” über die eindeutige Primfaktorzerlegung. Die Verallgemeinerung auf Hauptidealringe schließt insbesondere den wichtigen Fall des Polynomrings über einem beliebigen Körper ein. Wir benutzen die Grundbegriffe der allgemeinen Ringtheorie aus den Abschnitten 1.5 und 3.1; insbesondere der Begriff des Ideals ist im folgenden grundlegend. Für den Aufbau dieser Theorie ist die Unterscheidung zwischen Primelementen (das sind diejenigen, die ein Primideal erzeugen) und irreduziblen Elementen wichtig. Allerdings stellen sich im Fall der Hauptidealringe die beiden Begriffe als äquivalent heraus, und dieses geht wesentlich in den Beweis des Hauptsatzes ein. Auf die in der Literatur übliche Verallgemeinerung auf sogenannten faktori” elle Ringe” verzichten wir. Der ganze Abschnitt ist aber so geschrieben, dass man nicht viel Neues lernen muss, wenn man die (zahlreiche) Literatur hierzu einmal nacharbeiten möchte. Die folgende Theorie gilt für kommutative Ringe R mit Einselement 1R ; wir wiederholen diese Generalvoraussetzung nicht ständig. Bemerkung und Definition 3.3.1 (Teilbarkeit und Assoziiertheit) Seien a, b ∈ R, dabei R ein kommutativer Ring. a) a | b : ⇐⇒ b ∈ Ra a teilt b“ ” b) a | b ⇐⇒ Ra ⊇ Rb c) a ∼ b : ⇐⇒ a | b | a a assoziiert zu b“ ” d) a ∼ b ⇐⇒ Ra = Rb e) Assoziiertheit ist eine Äquivalenzrelation. f) Sei R nullteilerfrei. Dann gilt: a ∼ b ⇐⇒ ∃ u ∈ R∗ : ua = b . Beispiele 3.3.2 (1) In Z sind zwei Elemente a und b genau dann assoziiert, wenn a = ±b ist. (2) Zwei Polynome f und g über einem Körper K sind zueinander assoziiert genau dann, wenn g = cf für eine Konstante c ∈ K ∗ . Jede Äquivalenzklasse assoziierter Polynome enthält genau ein normiertes Polynom X n + an−1 X n−1 + . . .. Algebra I c Rudolf Scharlau, 2002 – 2010 139 Wir wollen nun –wie angekündigt– den Begriff des größten gemeinsamen Teilers auf Hauptidealringe verallgemeinern. Wir wissen aus Satz 2.1.11, siehe auch Beispiel 3.1.14, dass in Ring Z der ggT von a und b durch eine Idealgleichung Za + Zb = Zg gekenzeichnet werden kann. Wir überlegen uns nun, dass eine entsprechende Äquivalenz über einem beliebigen Hauptidealring gilt. Lemma 3.3.3 Es sei R ein Hauptidealring und a, b ∈ R. Für ein Element g ∈ R sind die beiden folgenden Eigenschaften äquivalent: (i) (1) g | a, g | b (2) c ∈ R, c | a und c | b =⇒ c | g (ii) Ra + Rb = Rg. Unter (i) steht die Bedingung, die über Z zur Definition eines ggT benutzt wurde: g ist gemeinsamer Teiler von a und b, und jeder weitere gemeinsame Teiler c ist Teiler von g. Für allgemeine Ringe entscheiden wir uns für Bedingung (ii) als Definition des ggT: Definition 3.3.4 Es sei R ein Integritätsbereich, und a, b ∈ R. Ein Element g ∈ R heißt größter gemeinsamer Teiler von a und b, falls Ra + Rb = Rg ist. Für den Ring Z stimmt nach Satz 2.1.11 der eben definierte Begriff des ggT mit dem schon eingeführten überein. Ein ggT zweier Elemente muss nicht immer existieren; vielmehr existiert er definitionsgemäß genau dann, wenn das von den beiden Elementen erzeugte Ideal ein Hauptideal ist. Insbesondere existiert in einem Hauptidealring für zwei beliebige Elemente ein ggT. Wenn ein ggT existiert, so ist er in aller Regel nicht eindeutig. Deswegen sollte man auch nicht ohne weiteres von dem ggT sprechen. Die Frage, in wie weit ein ggT bestimmt ist, und was die verbleibende Mehrdeutigkeit ist, ist allerdings schnell geklärt. Bemerkung 3.3.5 Es seien a, b ∈ R und g ein ggT von a und b. (a) Wenn g ′ ein weiterer ggT von a und b ist, so ist g ′ assoziiert zu g. (b) Wenn umgekehrt h ein beliebiges zu g assoziiertes Element von R ist, so ist auch h ein ggT von a und b. Der Beweis dieses Lemmas ist klar: ob ein Element g ein ggT von zwei gegebenen Elemente ist oder nicht, hängt nur von dem von g erzeugten Ideal ab, und die Gleichheit von zwei Hauptidealen ist nach Definition (mehr oder weniger, siehe die einfache Bemerkung 3.3.1 oben) äquivalent zur Assoziiertheit ihrer Erzeuger. Wir werden oft ein beliebiges Element, das die Bedingungen für den ggT von a und b erfüllt, mit ggT(a, b) bezeichnen. Das ist zweckmäßig, auch wenn dann das Symbol ggT nicht mehr der Name einer eindeutig definierten Funktion auf R × R ist. Über die praktische Berechnung des ggT kann man allgemein nichts sagen; c Rudolf Scharlau, 2002 – 2010 Algebra I 140 diese ist so gut oder so schlecht möglich, wie man für zwei gegebene Elemente a, b einen Erzeuger des Ideals Ra + Rb explizit bestimmen kann. Ein kanonisches Rechenverfahren gibt es jedoch in euklidischen Ringen: der euklidische Algorithmus funktioniert genauso wie in Z. Satz 3.3.6 (Euklidischer Algorithmus) Es sei R ein euklidischer Ring mit Gradfunktion γ und a, b ∈ R, a 6= 0 6= b. a) Definiere eine endliche Folge a0 , a1 , . . . , am von Elementen in R durch a0 = a, a1 = b ai−1 = qi ai + ai+1 , γ(ai+1 ) < γ(ai ), solange ai 6= 0 . Es ist also ai+1 der Rest von ai−1 bei Division durch ai und m := max{i | ai 6= 0}. Dann ist am ein ggT von a und b. b) Mit der Erweiterung des euklidischen Alogorithmus gemäß 1.1.6 erhält man eine explizite Darstellung des ggTs in der Form xa + yb, x, y ∈ R. Beweis: Völlig der gleiche Beweis wie zu Satz 1.1.3 für den Ring Z zeigt, dass das berechnete Element die Bedingung (i) aus Lemma 3.3.3 erfüllt und die in b) beschriebene Darstellung hat. Die Äquivalenz aus 3.3.3 wird für den Beweis von a) übrigens nicht wirklich gebraucht. Noch schneller kommt man zum Ziel, wenn man direkt die (neue) Definition des ggT über Bedingung (ii) benutzt. Dann kann man nämlich das folgende Lemma anwenden, dessen Beweis praktisch trivial ist: Lemma 3.3.7 Es sei R ein Hauptidealring und a, b, q, r Elemente aus R mit a = qb + r. Dann gilt ggT(a, b) = ggT(b, r) . Beweis: Nach Definition des ggT reicht es, die Gleichheit von Idealen Ra+ Rb = Rb + Rr zu zeigen. Die Inklusion ⊆ folgt aus a = qb + r, also a ∈ Rb + Rr, die Inlusion ⊇ entsprechend aus r = a − qb ∈ Ra + Rb. Wie über Z macht es überhaupt keine Probleme, die Idee des kleinsten gemeinsamen Vielfachen idealtheoretisch zu formulieren; vergleiche 2.1.14. Die Existenz ist in Hauptidealringen definitionsgemäß gesichert. Bemerkung und Definition 3.3.8 Es sei R ein Hauptidealring. Für gegebene Elemente a, b ∈ R sei k ∈ R ein Erzeugendes des Ideals Ra ∩ Rb. Dann gilt: (1) a | k und b | k, (2) l ∈ R, a | l und b | l =⇒ k | l. Umgekehrt ist jedes Element mit diesen Eigenschaften ein Erzeuger von Ra ∩ Rb. Ein solches Element heißt kleinstes gemeinsames Vielfaches von a und b. Algebra I c Rudolf Scharlau, 2002 – 2010 141 Nun steuern wir die eindeutige Primfaktorzerlegung an, die (bei geeigneter Formulierung) in beliebigen Hauptidealringen gilt. Wir müssen zunächst das Analogon einer Primzahl in einem beliebigen (Hauptideal-)Ring definieren. Hierfür gibt es zwei Möglichkeiten. Definition 3.3.9 Es sei R ein Integritätsbereich, R∗ seine Einheitengruppe. a) Ein Element a ∈ R r {0} heißt irreduzibel, falls gilt a = xy, x, y ∈ R =⇒ x ∈ R∗ oder y ∈ R∗ . b) Ein Element p ∈ R r {0} heißt Primelement, falls gilt p | ab, a, b ∈ R =⇒ p | a oder p | b . Die unter a) beschriebene Eigenschaft entspricht der üblichen Definition einer Primzahl: eine Primzahl ist eine (natürliche) Zahl, die außer 1 und sich selbst keine (positiven) Teiler besitzt. D.h. aus p = xy, x, y ∈ Z folgt x = ±1, y = ±p oder umgekehrt. Für allgemeine Ringe muss man statt ±1 beliebige Einheiten zulassen. Die unter b) genannte Bedingung ist eine Eigenschaft, die Primzahlen bekanntlich (siehe 1.1.8) haben, die aber eines Beweises bedarf: wenn eine Primzahl ein Produkt ganzer Zahlen teilt, so teilt sie bereits einen der Faktoren. Diese Eigenschaft ist der Schlüssel zur Eindeutigkeit der Primfaktorzerlegung natürlicher Zahlen (siehe den Beweis zu Satz 1.1.9). Es hat sich eingebürgert, und wird auch durch die folgende Bemerkung 3.3.10 gerechtfertigt, in allgemeinen Ringen diese Eigenschaft zur Definition einer gewissen Klasse von Elementen, eben der Primelemente, heranzuziehen. Bemerkung 3.3.10 Es sei R ein Integritätsbereich. a) Ein Element ist Primelement genau dann, wenn das von ihm erzeugte Hauptideal ein Primideal ist. b) Jedes Primelement ist irreduzibel. Nun verallgemeinern wir den bereits kommentierten Hilfssatz, dass die gewöhnlichen Primzahlen die Primelement-Eigenschaft aus 3.3.9 b) besitzen, auf beliebige Hauptidealringe. Lemma 3.3.11 Es sei R ein Hauptidealring. Dann ist jedes irreduzible Element ein Primelement, und das davon erzeugte Hauptideal ist maximal. Beweis: Es sei u ∈ R ein irreduzibles Element. Es reicht, die zweite Behauptung zu zeigen, denn wenn das Hauptideal Ru maximal ist, dann ist es nach Korollar c Rudolf Scharlau, 2002 – 2010 Algebra I 142 3.1.17 erst recht ein Primideal, nach der obigen Bemerkung 3.3.10, Teil a) ist also u ein Primelement. Sei also I ein Ideal mit Ru ⊆ I ( R. Zu zeigen ist nun Ru = I. Nach Voraussetzung ist I ein Hauptideal, also I = Rb für ein b ∈ R. Wegen Ru ⊆ I existiert ein a ∈ R mit u = ab. Wegen I 6= R ist b keine Einheit. Da u irreduzibel ist, folgt, dass a eine Einheit ist. Also ist Ru = Rb = I (vergleiche 3.3.1), wie gewünscht. Der folgende Satz über die eindeutige Primfaktorzerlegung ist das Hauptergebnis des zweiten Teils dieses Abschnitts. Satz 3.3.12 (Eindeutige Primfaktorzerlegung in Hauptidealringen) Es sei R ein Hauptidealring. Jedes Element a ∈ R läßt sich als ein Produkt von Primelementen schreiben: a = p1 · p2 · . . . · pr wobei p1 , p2 , . . . , pr Primelemente sind. Diese Zerlegung ist eindeutig bis auf Assoziiertheit und die Reihenfolge der Faktoren. D.h., wenn auch a = q1 · q2 · . . . · qs ist mit qj prim für j = 1, . . . , s, so ist r = s, und bei geeigneter Numerierung der qi ist pi ∼ qi für i = 1, . . . , r. Zum Nachweis der Existenz einer solchen Zerlegung benötigen wir das folgende Lemma. Lemma 3.3.13 In einem Hauptidealring R hat jede echt aufsteigende Kette von Idealen endliche Länge. Ist also I1 ⊆ I2 ⊆ . . . ⊆ Ik ⊆ Ik+1 ⊂ . . . eine solche Kette, so existiert ein N ∈ N mit IN = Im für alle m ≥ N. S Beweis: Wir definieren die Menge I := Ik . Diese Menge enthält sicherlich k∈N das Nullelement. Auch die weiteren Idealeigenschaften rechnen wir schnell nach: (I1) x, y ∈ I ⇒ ∃ k, l ∈ N : x ∈ Ik und y ∈ Il ⇒ x, y ∈ Im , m := max{k, l} ⇒ x+y ∈I (I2) r ∈ R, x ∈ I ⇒ ∃ k ∈ N : x ∈ Ik ⇒ rx ∈ Ik ⊆ I. Nach Voraussetzung ist R ein Hauptidealring und somit existiert ein a ∈ I mit I = Ra. Es exisitiert ein N ∈ N mit a ∈ IN . Aus Ik ⊆ Ik+1 folgt direkt a ∈ Ik für alle k ≥ N. Nach Definition gilt nun aR ⊆ Ik ⊆ I = aR für alle k ≥ N und somit die gefordete Gleichheit Ik = I für alle k ≥ N. Bemerkung. Dieses Lemma (mit nahezu gleichem Beweis) gilt in allen Ringen, in denen jedes Ideal endlich erzeugt ist. Solche Ringe hießen noethersche Ringe. Beispiele für noethersche Ringe sind die Polynomringe Z[X] und K[X1 , . . . , Xn ] in mehreren Unbestimmten über einem Körper. c Rudolf Scharlau, 2002 – 2010 Algebra I 143 3.3.14 Beweis von Satz 3.3.12 Wir zeigen zuerst, dass jedes Element in R als Produkt von irreduziblen Elementen geschreiben werden kann. Dieses geschieht durch einen Widerspruchsbeweis, wobei der Widerspruch mit Lemma 3.3.13 erzielt wird. Es sei a ∈ R r R∗ ein Element, das nicht Produkt von irreduziblen Elementen ist. Dann ist insbesondere a selbst reduzibel, d.h. a = a1 = a2 b2 mit a2 , b2 ∈ R r R∗ . Nach Wahl von a ist mindestens eines dieser beiden Elemente a2 , b2 wiederum nicht in ein Produkt von irreduziblen Elementen zerlegbar. O.b.d.A. sei dies das Element a2 . Durch Iterieren dieser Überlegungen erhalten wir eine Folge von Elementen a1 = a2 b2 a2 = a3 b3 .. . ak−1 = ak bk .. . wobei die Folge der zugehörigen Ideale I1 := a1 R, . . . , Ik−1 := ak−1 R, . . . die Eigenschaft Ik−1 ( Ik für alle k hat. Dieses ist ein Widerspruch zu Lemma 3.3.13. Da irreduzible Elemente auch Primelemente sind, ist der erste Teil des Satzes gezeigt. Den zweiten Teil, also die Eindeutigkeit der Primfaktorzerlegung bis auf Multiplikation mit Einheiten, zeigt man ganz analog zum klassischen Fall R = Z. Hier geht entscheidend ein, dass wir eine Zerlegung in Primelemente (nicht bloß irreduzible Elemente) betrachten. In der Situation von 3.3.12 ist es oft sinnvoll, die nur bis auf Einheiten eindeutige Darstellung zu normieren und bei dieser Gelegenheit zueinander assoziierte Primelemente zu einer Potenz zusammenzufassen. Hierzu wählt man ein Vertretersystem PR (für die Relation der Assoziiertheit) aller Primelemente in R (vergleiche 3.3.2). Dann läßt sich jedes a ∈ R eindeutig als Y pνp mit u ∈ R∗ sowie νp =: νp (a) ∈ N0 , νp = 0 für fast alle p, a=u p∈PR schreiben. Das in der Regel formal unendliche Produkt ist sinnvoll, da es nur endlich viele von 1 verschiedene Faktoren hat; es erspart einem die künstliche Nummerierung der in einem bestimmten a auftretenden Primfaktoren. Die Funktion νp : R → N0 ist eindeutig definiert und hängt nicht von der Auswahl des Vertreters p, sondern nur vom Primideal Rp ab. Es handelt sich um die sogenannte p-adische Bewertung auf R. c Rudolf Scharlau, 2002 – 2010 Algebra I 144 Es ist klar, dass man mit den Exponenten νp (x) direkt die Teilbarkeit zweier Elemente kontrollieren kann und darüber auch ggT und kgV beschreiben kann. Das entsprechende Ergebnis wollen wir der Vollständigkeit halber noch als Korollar festhalten. Korollar 3.3.15 Es sei R ein Hauptidealring und die νp , p ∈ PR wie eben definiert. a) Für a, b ∈ R gilt a | b genau dann, wenn νp (a) ≤ νp (b) für alle p ∈ PR . b) Der größte gemeinsame Teiler und das kleinste gemeinsame Vielfache von a, b ∈ R sind durch Y Y pmax{νp (a),νp (b)} pmin{νp (a),νp (b)} , kgV(a, b) = ggT(a, b) = p∈PR p∈PR gegeben. Beweis: Teil a) ergibt sich sofort aus der offensichtlichen Formel νp (xy) = νp (x) + νp (y) für alle p ∈ PR , x, y ∈ R. Teil b) folgt unmittelbar aus Teil a): Es ist klar, dass das dort definierte Element die Bedingung (i) aus Lemma 3.3.3, bzw. die entsprechende Bedingung aus Satz 3.3.8 erfüllt.