Algorithmische Mathematik 1 Ein Skriptum zur Vorlesung im WS 2004/05 Franz Pauer 4.Auflage c 2005 F RANZ PAUER I NNSBRUCK , Ö STERREICH Vorwort Das vorliegende Skriptum soll den Hörerinnen und Hörern der Vorlesung Algorithmische Mathematik 1“ im Wintersemester 2004/05 das Mit” schreiben und Mitdenken in der Vorlesung erleichtern. Das Skriptum enthält alle Algorithmen, Definitionen und Sätze der Vorlesung, aber fast keine Beispiele dazu. In der Vorlesung werden die Algorithmen, Definitionen und Sätze motiviert, der Zusammenhang mit früheren Ergebnissen erläutert und Beispiele dazu besprochen. Die Hauptziele dieser Vorlesung sind: • Zahlenbereiche, in denen exakt (also ohne zu runden) gerechnet werden kann, aufzubauen (Kapitel 1 und 5). Dazu werden Möglichkeiten zur Darstellung von ganzen, rationalen und algebraischen Zahlen sowie Verfahren zum Rechnen mit diesen Zahlen vorgestellt. Grundlegend dafür sind die Division mit Rest, der Euklidische Algorithmus und der erweiterte Euklidische Algorithmus. • Systeme linearer Gleichungen zu lösen (Kapitel 2). Die Fragen, wann es eine Lösung gibt, ob sie eindeutig ist und wie Lösungen berechnet werden können, werden vollständig beantwortet. Weiters wird gezeigt, wie die Menge aller Lösungen durch endlich viele Daten beschrieben werden kann. Dazu muss die Matrizenrechnung eingeführt und auf die Theorie der Vektorräume eingegangen werden. Das zentrale Rechenverfahren zur Lösung von Systemen linearer Gleichungen ist der Gauss-Algorithmus. • Eigenwertprobleme zu lösen(Kapitel 6). Dazu benötigte Hilfsmittel sind Determinanten und polynomiale Abbildungen. Für diese drei Themen ist das Rechnen mit Abbildungen (Kapitel 3) und mit Polynomen (Kapitel 4) von großer Bedeutung. Im Kapitel 0 werden einige Grundbegriffe der Mathematik eingeführt. Dieses Skriptum hat viel mit den Skripten Lineare Algebra (Dür, A. und Pauer, F., Institut für Mathematik, Universität Innsbruck, 2004, 4. Auflage) und Algebra (Pauer, F., Institut für Mathematik, Universität Innsbruck, 2000, 2. Auflage) gemeinsam. Von den ersten drei Auflagen (September 2001, 2002 und 2003) unterscheidet sich diese vierte Auflage nur durch einige Korrekturen und kleinere Veränderungen. ii iii Franz Pauer VORWORT Innsbruck, September 2004 Inhaltsverzeichnis Vorwort ii Kapitel 0. Mengen und Abbildungen 1. Mengen 2. Durchschnitt, Vereinigung und Komplement 3. Abbildungen 4. Familien, Tupel, Folgen und kartesisches Produkt 5. Zusammengesetzte Aussagen 6. Der Induktionsbeweis 1 1 2 3 5 8 8 Kapitel 1. Rechnen mit ganzen und rationalen Zahlen 1. Rechenregeln für ganze Zahlen 2. Division mit Rest 3. Zifferndarstellung von Zahlen 4. Rationale Zahlen 5. Zifferndarstellung von rationalen Zahlen 6. Der Euklidische Algorithmus 7. Primzahlen 8. Gruppen 9. Ringe und Körper 10. Restklassen 10 10 11 12 15 18 19 22 24 27 30 Kapitel 2. Systeme linearer Gleichungen 1. Matrizen 2. Elementare Umformungen 3. Systeme linearer Gleichungen 4. Vektorräume 5. Erzeugendensysteme, lineare Unabhängigkeit und Basen 6. Der Gauss-Algorithmus 34 34 39 41 43 45 49 Kapitel 3. Rechnen mit Abbildungen 1. Permutationen 2. Polynomiale Abbildungen 3. Lineare Abbildungen 4. Die Matrix einer linearen Abbildung 5. Basiswechsel 56 56 60 63 65 69 Kapitel 4. Polynome 1. Der Polynomring 73 73 iv v INHALTSVERZEICHNIS 2. 3. 4. 5. 6. 7. Nullstellen von Polynomen Interpolation Der Euklidische Algorithmus für Polynome Irreduzible Polynome Die Anzahl der Nullstellen eines Polynoms Polynome in mehreren Variablen 75 77 78 80 82 84 Kapitel 5. Erweiterungen des Zahlenbereichs 1. Algebraische Elemente und Minimalpolynome 2. Existenz von Nullstellen 3. Endliche Körper 87 87 89 92 Kapitel 6. Eigenwertprobleme 1. Eigenwerte und Eigenvektoren 2. Determinanten 3. Berechnung von Eigenwerten 93 93 94 99 KAPITEL 0 Mengen und Abbildungen 1. Mengen Definitionen setzen Vorwissen voraus. Zum Beispiel setzt die Definition Ein Quadrat ist ein gleichseitiges Rechteck“ ” voraus, dass bekannt ist, was gleichseitig“ und Rechteck“ bedeuten. Die ” ” Definition Eine gerade Zahl ist eine ganze Zahl, die von 2 geteilt wird“ ” setzt voraus, dass bekannt ist, was ganze Zahl“ und teilen“ bedeuten. Für ” ” Definitionen wird häufig die folgende Kurzschreibweise verwendet: zu definierender Begriff := definierende (schon bekannte) Begriffe . Zum Beispiel: Quadrat := gleichseitiges Rechteck (in Worten: ein Quadrat ist ein gleichseitiges Rechteck) und gerade Zahl := ganze Zahl, die von 2 geteilt wird (in Worten: eine gerade Zahl ist eine ganze Zahl, die von 2 geteilt wird). Der Begriff Menge“ ist jedoch ein Grundbaustein der Mathematik, der ” nicht definiert, sondern nur umschrieben wird: Eine Menge ist eine Zusammenfassung unterscheidbarer Objekte. Diese heißen Elemente der Menge. Eine Menge kann auf zwei Arten angegeben werden: (1) durch Anschreiben der Elemente zwischen geschweiften Klammern, zum Beispiel {7, 3, 5, 8, 1} , {Meier, Müller} ; oder (2) durch ihre Eigenschaften, zum Beispiel {n | n ganze Zahl, n ist größer als 0 und kleiner als 7} (Sprechweise: die Menge aller n, für die gilt: n ist eine ganze Zahl, ” die größer als 0 und kleiner als 7 ist“ oder die Menge aller ganzen ” Zahlen, die größer als 0 und kleiner als 7 sind“). Bezeichnungen: 0/ := {} leere Menge (Menge ohne Elemente) N := {0, 1, 2, 3, . . .} Menge der natürlichen Zahlen Z := {0, 1, −1, 2, −2, . . .} Menge der ganzen Zahlen Ist M eine Menge, so wird 1 2 0. MENGEN UND ABBILDUNGEN e∈M für e ist ein Element von M“ geschrieben, und analog ” e∈ /M für e ist kein Element von M“. ” Auf logische Probleme, die bei der Einführung des Begriffes Menge“ ” auftreten, gehen wir hier nicht ein. Das Russell’sche Paradoxon“ zeigt, ” dass man nicht zu sorglos sein darf: Gilt für M := {A | A Menge, A ∈ / A} die Beziehung M ∈ M ? Beispiel 1 : 1 ∈ N , −1 6∈ N , 1 6∈ 0. / Definition 1 : M und N seien Mengen. M heißt Teilmenge von N, in Zeichen M ⊂ N oder M ⊆ N , wenn jedes Element von M auch Element von N ist. M 6⊂ N bedeutet, dass M nicht Teilmenge von N ist. Die Mengen M und N sind gleich, in Zeichen M=N, wenn M ⊂ N und N ⊂ M ist. Falls M und N nicht gleich sind, schreibt man M 6= N . Schließlich bedeutet M$N, dass M ⊂ N und M 6= N ist, und man nennt M eine echte Teilmenge von N. Beispiel 2 : Für alle Mengen N ist N ⊆ N und 0/ ⊆ N. Es ist {a, b, c} = {b, a, c} = {c, a, b}, beim Anschreiben der Elemente einer Menge kann die Reihenfolge also beliebig gewählt werden. 2. Durchschnitt, Vereinigung und Komplement Definition 2 : M und N seien Mengen. Der Durchschnitt von M und N ist die Menge M ∩ N := {a | a ∈ M und a ∈ N} . Die Mengen M und N sind disjunkt, wenn ihr Durchschnitt leer ist. Die Vereinigung von M und N ist die Menge M ∪ N := {a | a ∈ M oder a ∈ N} , 3 0. MENGEN UND ABBILDUNGEN wobei mit oder“ das einschließende Oder ( und-oder“) und nicht das aus” ” schließende Oder ( entweder-oder“) gemeint ist. Das Komplement von N in ” M bzw. die Mengendifferenz von M und N ist M \ N := {a | a ∈ M und a 6∈ N} . Beispiel 3 : {1, 2, 3} ∩ {4, 3, 5} = {3} , {1, 2, 3} ∪ {4, 3, 5} = {1, 2, 3, 4, 5} , {1, 2, 3} \ {4, 3, 5} = {1, 2} . Definition 3 : Sind M, N und P Mengen, so bedeutet M ∩ (N ∪ P) , dass zuerst die Vereinigung von N und P gebildet wird und danach der Durchschnitt von M mit N ∪ P. Analog wird für andere Verknüpfungen die Reihenfolge durch Klammerung festgelegt. 3. Abbildungen M und N seien Mengen. Eine Abbildung oder Funktion von M nach N ist eine Vorschrift, die jedem Element von M genau ein Element von N zuordnet. M heißt dann der Definitionsbereich der Abbildung, N der Bildbereich. Die Schreibweisen f : M → N , m 7→ f (m) , oder f : M −→ N m 7→ f (m) bedeuten, dass f eine Abbildung von M nach N ist, die dem Element m ∈ M das Element f (m) ∈ N zuordnet. Das Element f (m) heißt Bild von m (bezüglich f ). Ein Element m ∈ M mit f (m) = n ∈ N heißt ein Urbild von n (bezüglich f ). Beispiel 4 : Die Abbildung f : N → Z , z 7→ 2z − 3 , ordnet jeder natürlichen Zahl z die ganze Zahl 2z − 3 zu. Das Bild von 0 bzw. 1 bzw. 2 bezüglich f ist −3 bzw. −1 bzw. 1. Definition 4 : Seien f : M → N und g : P → Q Abbildungen. Dann sind f und g gleich, in Zeichen f = g, wenn gilt: M = P, N = Q und für alle m ∈ M ist f (m) = g(m). 4 0. MENGEN UND ABBILDUNGEN Definition 5 : Sei M eine beliebige Menge. Dann heißt die Abbildung IdM : M → M , m 7→ m , die identische Abbildung oder Identität auf M. Definition 6 : Seien f : M → N eine Abbildung, A ⊂ M und B ⊂ N. Dann heißt f (A) := { f (a) | a ∈ A} ⊂ N das Bild von A (bezüglich f ), Bild( f ) := f (M) heißt das Bild von f , und f −1 (B) := {m ∈ M | f (m) ∈ B} heißt das Urbild von B (bezüglich f ). Die Abbildung f |A : A → N, a 7→ f (a), heißt die Einschränkung von f auf A. Man sagt f bildet A auf B ab“, wenn ” f (A) = B ist. Definition 7 : Seien f : M → N und g : P → Q Abbildungen mit Dann heißt die Abbildung Bild( f ) ⊂ P . g ◦ f : M → Q, m 7→ g( f (m)), die Hintereinanderausführung oder Zusammensetzung von f und g (sprich g nach f“). Oft wird statt g ◦ f nur g f geschrieben. ” Beispiel 5 : Die Hintereinanderausführung von und ist f : N → Z , z 7→ 2z + 1 , g : Z → Z , z 7→ 3z − 7 , g f : N → Z , z 7→ 6z − 4 . Satz 1 : Seien f : M → N, g : P → Q und h : R → S Abbildungen mit Bild( f ) ⊂ P und Bild(g) ⊂ R. Dann gilt h ◦ (g ◦ f ) = (h ◦ g) ◦ f =: h ◦ g ◦ f , d.h. bei mehrfacher Hintereinanderausführung von Abbildungen kommt es nicht auf die Reihenfolge an (die Hintereinanderausführung von Abbildungen ist assoziativ, auf das Setzen von Klammern kann verzichtet werden). 5 0. MENGEN UND ABBILDUNGEN Beweis: Sowohl h ◦ (g ◦ f ) als auch (h ◦ g) ◦ f sind Abbildungen von M nach S. Für jedes m ∈ M ist (h ◦ (g ◦ f ))(m) = h((g ◦ f )(m)) = h(g( f (m))) = (h ◦ g)( f (m)) = ((h ◦ g) ◦ f )(m). Definition 8 : Eine Abbildung f : M → N heißt injektiv bzw. surjektiv, wenn jedes Element von N höchstens bzw. mindestens ein Urbild hat. Eine Abbildung f : M → N heißt bijektiv, wenn jedes Element von N genau ein Urbild hat. Wenn f : M → N bijektiv ist, dann heißt die (ebenfalls bijektive) Abbildung f −1 : N → M, n 7→ Urbild von n bezüglich f , die zu f inverse Abbildung oder die Umkehrabbildung von f . Eine Abbildung ist also genau dann bijektiv, wenn sie sowohl injektiv als auch surjektiv ist. Eine Abbildung ist genau dann surjektiv, wenn ihr Bild und ihr Bildbereich gleich sind. Eine Abbildung ist genau dann injektiv, wenn die Bilder von je zwei verschiedenen Elementen wieder verschieden sind. Definition 9 : Eine Menge M heißt endlich, wenn sie leer ist oder es ein n ∈ N und eine bijektive Abbildung f : {1, . . ., n} → M gibt. Man nennt dann #(M) := n die Anzahl der Elemente von M. Die leere Menge hat 0 Elemente. M heißt unendlich, wenn M nicht endlich ist. 4. Familien, Tupel, Folgen und kartesisches Produkt Eine Abbildung f : I → M wird manchmal in der Form ( f (i))i∈I oder ( fi )i∈I geschrieben und als Familie von Elementen in M, indiziert durch I, bezeichnet. I heißt dann die Indexmenge der Familie ( f i )i∈I . Die Familie ( fi )i∈I heißt endlich, wenn I endlich ist. Wichtige Spezialfälle sind: (1) Eine Abbildung x : {1, 2, . . ., n} → M , i 7→ x(i) , wird in der Form (x1 , . . ., xn ) = (xi )1≤i≤n = (xi )i∈{1,...,n} geschrieben und heißt ein n-Tupel von Elementen in M. Das Element xi heißt dann i-te Komponente von (x1 , . . . , xn ). In den Spezialfällen 6 0. MENGEN UND ABBILDUNGEN n = 2, 3 nennt man (x1 , . . ., xn ) ein Paar bzw. Tripel. Die Menge aller n-Tupel von Elementen in M wird mit Mn bezeichnet (sprich M hoch n“). Für x, y ∈ M n gilt ” x=y genau dann, wenn xi = yi für i = 1, . . ., n ist. Ein Paar (a, b) enthält mehr Information“ als die Menge ” {a, b}. Es ist {a, b} = {b, a}, aber (a, b) = (b, a) nur dann, wenn a = b ist. (2) Seien m ∈ N und I := {i ∈ N | i ≥ m}. Eine Abbildung x : I → M , i 7→ x(i) , wird in der Form (xi )i≥m geschrieben und heißt eine Folge in M. Man beachte, dass (xi )i≥m 6= {xi | i ≥ m} ist. Definition 10 : M und N seien Mengen. Dann heißt M × N := {(x, y) | x ∈ M und y ∈ N} ⊆ (M ∪ N)2 das kartesische Produkt von M und N. Die Abbildungen pr1 : M × N → M , (x, y) 7→ x , und pr2 : M × N → N , (x, y) 7→ y , heißen Projektionen auf den ersten bzw. zweiten Faktor. Definition 11 : Sei f : M → N eine Abbildung. Dann heißt die Menge Graph( f ) := {(m, f (m)) | m ∈ M} ⊆ M × N der Graph von f . Satz 2 : Zwei Abbildungen von M nach N sind genau dann gleich, wenn ihre Graphen gleich sind. Beweis: Es ist zu zeigen: 1. Wenn zwei Abbildungen von M nach N gleich sind, dann sind auch ihre Graphen gleich. 2. Wenn die Graphen zweier Abbildungen von M nach N gleich sind, dann sind diese zwei Abbildungen gleich. Seien f und g Abbildungen von M nach N. Zu 1): Wenn f = g ist, dann ist f (m) = g(m) für alle m ∈ M. Daher ist Graph( f ) = {(m, f (m)) | m ∈ M} = = {(m, g(m)) | m ∈ M} = Graph(g) . 7 0. MENGEN UND ABBILDUNGEN Zu 2): Wenn Graph( f ) = Graph(g) ist, dann ist für alle m ∈ M das Paar (m, f (m)) ein Element von Graph(g). In Graph(g) gibt es genau ein Element, dessen erste Komponente m ist, nämlich (m, g(m)). Also ist f (m) = g(m) für alle m ∈ M, somit ist f = g. Definition 12 : Sei (Mi )i∈I eine Familie von Mengen. Dann heißt ∏ Mi := {(xi)i∈I | für alle i ∈ I ist xi ∈ Mi} i∈I das kartesische Produkt der Mengen Mi , i ∈ I. Für j ∈ I heißt pr j : ∏ Mi → M j , (xi )i∈I 7→ x j , i∈I die Projektion auf den j-ten Faktor. Im Spezialfall I = {1, . . . , n} wird für ∏i∈I Mi auch n ∏ Mi i=1 geschrieben. oder M1 × . . . × Mn 8 0. MENGEN UND ABBILDUNGEN 5. Zusammengesetzte Aussagen Wir betrachten Aussagen A, B,C, . . . , die nach Vereinbarung entweder wahr oder falsch sind. Mit Hilfe der Worte und“ (Zeichen: ∧) , ” oder“ (Zeichen: ∨) , ” nicht“ (Zeichen: ¬) , ” wenn, dann“ (Zeichen: ⇒) , ” genau dann, wenn“ (Zeichen: ⇔) ” bilden wir zusammengesetzte Aussagen, deren Wahrheitswert“ wir durch ” die folgende Tabelle definieren. Dabei steht w für wahr“ und ” f für falsch“. ” A B A ∧ B A ∨ B ¬A A ⇒ B A ⇔ B w w w w f w w w f f w f f f f w f w w w f f f f f w w w Für A ⇒ B verwendet man statt wenn A, dann B“ auch die Sprechwei” sen aus A folgt B“ oder A impliziert B“. ” ” Man beachte: A ist genau dann wahr, wenn ¬A falsch ist. Das wird für indirekte Beweise verwendet: anstatt zu zeigen, dass eine Aussage A wahr ist, wird gezeigt, dass ihr Gegenteil“ ¬A falsch ist. ” In der Mathematik bedeutet das Wort oder“ immer das nicht ausschließen” de und-oder“ und nicht das ausschließende entweder-oder“. ” ” Ist A falsch, dann ist die Aussage A ⇒ B immer wahr ( ex falso quodlibet“). ” 6. Der Induktionsbeweis Sei m eine natürliche Zahl (meistens 0 oder 1) und sei (Am , Am+1 , Am+2 , . . .) eine Folge von Aussagen. Satz 3 : Wenn (1) Am wahr ist und (2) für alle n > m aus An−1 auch An folgt, dann sind alle Aussagen An , n ≥ m , wahr. Damit erhält man eine Methode, die Gültigkeit der Aussagen An , n ≥ m, zu zeigen ( Beweis durch vollständige Induktion“): Es genügt zu zeigen, ” dass (1) ( Induktionsanfang“) und (2) ( Induktionsschluss“) richtig sind. ” ” Um zu zeigen, dass (2) richtig ist, nimmt man an, dass An−1 wahr ist ( In” duktionsannahme“) und versucht damit zu zeigen, dass auch A n wahr ist. Man könnte im Satz die Annahme (2) auch durch (2’) für alle n > m aus Am , Am+1 , . . . , An−1 auch An folgt, 9 0. MENGEN UND ABBILDUNGEN ersetzen. Beweis: Wir benutzen die folgende Eigenschaft der natürlichen Zahlen: jede Teilmenge von N hat ein kleinstes Element. Wir führen den Beweis indirekt und nehmen an, dass nicht alle Aussagen An , n ≥ m , wahr sind. Dann ist die Menge M := {n ∈ N | n ≥ m und An ist falsch} nicht leer. Daher gibt es eine kleinste Zahl k so, dass k ≥ m und Ak falsch ist. Wegen (1) gilt k ≥ m + 1 , also k − 1 ≥ m. Weiters muss Ak−1 wahr sein, weil k die kleinste Zahl in M ist. Aus (2) folgt nun, dass auch Ak wahr ist, was einen Widerspruch bedeutet. Somit muss unsere Annahme am Anfang des Beweises falsch sein, d.h. alle Aussagen An , n ≥ m , sind wahr. Satz 4 : Sei n eine natürliche Zahl. Die Summe der Quadrate aller natürlichen Zahlen von 1 bis n ist S(n) := 61 (2n3 + 3n2 + n). Beweis: Induktionsanfang: S(1) = 61 (2 + 3 + 1) = 1 = 12 , also ist die Aussage für n = 1 wahr. Induktionsschluss: Wir nehmen an, dass die Summe der Quadrate aller natürlichen Zahlen von 1 bis n − 1 gleich S(n − 1) ist. Die Summe der Quadrate aller natürlichen Zahlen von 1 bis n ist dann Wegen S(n − 1) + n2 . 1 S(n − 1) + n2 = (2(n − 1)3 + 3(n − 1)2 + n − 1) + n2 = S(n) 6 ist die Behauptung richtig. KAPITEL 1 Rechnen mit ganzen und rationalen Zahlen 1. Rechenregeln für ganze Zahlen Wir setzen die Menge Z := {. . ., −2, −1, 0, 1, 2, . . .} der ganzen Zahlen mit der Addition Z × Z −→ Z , (a, b) 7−→ a + b, und der Multiplikation Z × Z −→ Z , (a, b) 7−→ a · b, als bekannt voraus. Dabei gelten die folgenden Rechenregeln: Sind a, b, c ganze Zahlen, dann ist • (a + b) + c = a + (b + c) =: a + b + c ( Die Addition von ganzen Zah” len ist assoziativ“, das heißt: auf Klammern kann verzichtet werden). • 0+a = a+0 = a • a + (−a) = (−a) + a = 0 (dabei ist −a := (−1) · a) • a + b = b + a ( Die Addition ist kommutativ“). ” • (a · b) · c = a · (b · c) =: a · b · c ( Die Multiplikation ist assoziativ“). ” • 1·a = a·1 = a • a · b = b · a ( Die Multiplikation ist kommutativ“). ” • (a + b) · c = (a · c) + (b · c) =: a · c + b · c ( Distributivgesetz“) ” Sind m, n ∈ Z , m ≤ n und am , am+1 , . . . , an ∈ Z , dann schreiben wir n ∑ ai i=m für am + am+1 + . . . + an und n ∏ ai i=m für am · am+1 · . . . · an . (Sprechweise: Die Summe bzw. das Produkt aller ai ” mit i von m bis n“). Man prüft leicht nach: Seien p, q ∈ Z , p ≤ q und b p , . . . , bq ∈ Z . Dann gilt ! ! ! ! n ∑ ai · i=m q ∑ bj j=p n = ∑ i=m q ∑ ai b j j=p = q n j=p i=m ∑ ∑ ai b j . Für a, b, c ∈ Z mit c 6= 0 folgt aus a · c = b · c, dass a = b ist. ( In Z kann ” gekürzt werden“). Insbesondere folgt aus a · b = 0, dass a = 0 oder b = 0 ist. Die Subtraktion ist durch Z × Z −→ Z , (a, b) 7−→ a − b := a + (−b), gegeben. Es sei ≤ die durch a ≤ b :⇔ b − a ∈ N 10 11 1. RECHNEN MIT GANZEN UND RATIONALEN ZAHLEN definierte natürliche Ordnung der ganzen Zahlen, wir schreiben a < b für: a ≤ b und a 6= b. Für a, b, c ∈ Z gilt: a≤a , aus a ≤ b und b ≤ a folgt a = b , aus a ≤ b und b ≤ c folgt a ≤ c , a ≤ b oder b ≤ a , a ≤ b genau dann, wenn a + c ≤ b + c ist und wenn c > 0 ist, dann ist a ≤ b genau dann, wenn a · c ≤ b · c ist. Die ersten vier Eigenschaften bedeuten, dass ≤ eine totale Ordnung auf Z ist, die letzten zwei, dass diese mit Addition und Multiplikation vertr äglich ist. Das Vorzeichen vz(a) einer ganzen Zahl a ist 1, wenn a ∈ N , und −1, wenn a 6∈ N . Der Betrag |a| einer ganzen Zahl a ist vz(a) · a. Für Zahlen a, b ∈ Z ist |a · b| = |a| · |b| und |a + b| ≤ |a| + |b|. Eine ganze Zahl ist positiv bzw. negativ, wenn sie größer bzw. kleiner als 0 ist. 2. Division mit Rest Wenn Sie einen Sack mit a Euromünzen haben, die Sie an b Personen verteilen sollen (jede soll gleich viel bekommen), dann werden Sie wahrscheinlich zuerst jeder Person einen Euro geben und diesen Vorgang solange wiederholen, bis im Sack weniger als b Euromünzen sind. Sie haben dann a mit Rest durch b dividiert. Der folgende Satz ist grundlegend für alle Rechenverfahren für ganze Zahlen. Seine Bedeutung liegt darin, dass die drei Strukturen“ +, · und ≤ ” zueinander in Beziehung gesetzt werden. Satz 5 : (Division mit Rest von ganzen Zahlen) Zu je zwei ganzen Zahlen a und b mit b 6= 0 gibt es eindeutig bestimmte ganze Zahlen m und r mit den Eigenschaften a = m·b+r und 0 ≤ r < |b| . Die Zahlen m bzw. r heißen ganzzahliger Quotient von a und b bzw. Rest von a nach Division durch b. Die Zahlen m und r können mit dem folgenden Verfahren (Divisionsalgorithmus) berechnet werden: • Falls a und b natürliche Zahlen sind: Setze m := 0 und r := a. Solange r ≥ b ist, ersetze r durch r − b und m durch m + 1. • Falls a < 0 oder b < 0 ist: Berechne wie oben n und s so, dass |a| = n · |b| + s und 0 ≤ s < |b| ist. Wenn a ≥ 0 ist, dann setze m := −n und r := s. 12 1. RECHNEN MIT GANZEN UND RATIONALEN ZAHLEN Wenn a < 0 und s > 0 ist, dann setze m := −vz(b) · (n + 1) und r := |b| − s. Wenn a < 0 und s = 0 ist, dann setze m := −vz(b) · n und r := 0. Beweis: Wenn a und b natürliche Zahlen sind, dann erhalten wir bei jedem Ersetzen von r durch r − b eine um mindestens 1 kleinere Zahl. Also tritt nach höchstens a Schritten der Fall r < b ein. Somit liefert das obige Verfahren nach endlich vielen Schritten ein Ergebnis m, r. Mit Induktion über |a| ist leicht nachzuprüfen, dass diese Zahlen die angegebenen Bedingungen erfüllen. Es seien m1 , m2 , r1 , r2 ganze Zahlen mit a = m1 · b + r1 = m2 · b + r2 , 0 ≤ r1 , r2 < |b| und o.E.d.A. ( ohne Einschränkung der Allgemeinheit“) r1 ≤ r2 . ” Dann ist |b| > r2 − r1 = |m1 − m2 | · |b| . Daraus folgt m1 = m2 und r1 = r2 , also sind der ganzzahlige Quotient von a und b und der Rest von a nach Division durch b eindeutig bestimmt. 3. Zifferndarstellung von Zahlen Nehmen wir an, Sie kommen mit einem Sack voller Euromünzen in eine Bank und wollen dieses Geld auf ihr Sparbuch einzahlen. Die Anzahl der Euromünzen im Sack ist eine eindeutig bestimmte natürliche Zahl a. Bevor diese Zahl in Ihr Sparbuch eingetragen werden kann, muss der Bankbeamte ihre Zifferndarstellung (zur Basis 10) berechnen. Eine Zahl ist also nicht immer schon in Zifferndarstellung gegeben, sondern diese ist eine Zusatz” information“ über die Zahl. Wie wird die Zifferndarstellung zur Basis 10 von a ermittelt? Man bildet aus den Euromünzen solange Zehnerstapel“, ” bis nur noch weniger als zehn Münzen übrigbleiben, das heißt: a wird mit Rest durch 10 dividiert. Die Anzahl der übriggebliebenen Euromünzen ist dann die Einerziffer“ von a. Macht man dasselbe nun mit den Zehner” stapeln statt mit den Münzen, dann erhält man die Zehnerziffer“ von a, ” usw. Satz 6 : (Darstellung von Zahlen durch Ziffern) Es seien a und b natürliche Zahlen mit a 6= 0 und b ≥ 2. Dann gibt es eindeutig bestimmte natürliche Zahlen n, z0 , z1 , . . ., zn so, dass zn 6= 0, 0 ≤ z0 , z1 , . . ., zn < b und a = zn bn + zn−1 bn−1 + . . . + z1 b1 + z0 = n ∑ zi b i i=0 ist. Wenn b fest gewählt ist, dann ist a durch die Zahlen n, z0 , z1 , . . . , zn eindeutig 13 1. RECHNEN MIT GANZEN UND RATIONALEN ZAHLEN bestimmt. Man wählt Zeichen für die Zahlen von 0 bis b − 1 und schreibt dann n zn zn−1 . . . z0 statt ∑ zi b i . i=0 Die Zahlen z0 , z1 , . . ., zn heißen Ziffern von a zur Basis b (für b=2 bzw. 10: Binärziffern“ bzw. Dezimalziffern“). ” ” Die Ziffern zi von a 6= 0 zur Basis b können mit dem folgenden Verfahren berechnet werden: • Setze i := 0. • Solange a nicht 0 ist: Die i-te Ziffer zi ist der Rest von a nach Division durch b. Ersetze a durch den ganzzahligen Quotienten von a und b. Ersetze i durch i + 1. Beweis: Induktion über a: Wenn a = 1 ist, ist n = 0 und z0 = 1. Für a > 1 seien m bzw. r der ganzzahlige Quotient von a und b bzw. der Rest von a nach Division durch b. Wegen b > 1 ist m < a, also gibt es nach Induktionsannahme eindeutig bestimmte Zahlen k, y0 , y1 , . . ., yk so, dass yk 6= 0, 0 ≤ y0 , y1 , . . ., yk < b und m = yk bk + yk−1 bk−1 + . . . + y1 b1 + y0 ist. Dann ist a = m · b + r = yk bk+1 + yk−1 bk + . . . + y1 b2 + y0 b + r , und yk , . . ., y0 , r sind die Ziffern von a. Aus der Eindeutigkeit von m und r folgt aus der Induktionsannahme die Eindeutigkeit der Ziffern von a zur Basis b. Wird für die Zifferndarstellung einer Zahl die Basis b gewählt, dann können alle Zahlen durch Aneinanderreihen von b verschiedenen Symbolen angeschrieben werden. Eine kleine Basis (zum Beispiel 2) hat den Vorteil, dass man nur wenige Symbole braucht und dass das kleine Einmaleins“ ” sehr einfach ist. Allerdings braucht man dann für größere Zahlen sehr viele Ziffern. Definition 13 : Es seien v = (v1 , . . ., vn ) und w = (w1 , . . . , wn ) zwei verschiedene n-Tupel von ganzen Zahlen und j die kleinste Zahl in {1, . . ., n} mit der Eigenschaft, dass v j 6= w j ist. Dann ist v lexikographisch kleiner als w (Schreibweise: v <lex w), wenn v j < w j ist. 14 1. RECHNEN MIT GANZEN UND RATIONALEN ZAHLEN Beispiel 6 : (1, 2, 3, 4) <lex (1, 2, 4, 3) <lex (2, −7, −3, −5) Satz 7 : (Vergleich von zwei Zahlen, die durch Ziffern dargestellt sind) Es seien b, x, y positive natürliche Zahlen, b ≥ 2 und xk , xk−1 , . . ., x0 y` , y`−1 , . . ., y0 bzw. die Ziffern von x bzw. y bezüglich b. Dann ist x genau dann kleiner als y, wenn k < ` oder (k = ` und (xk , xk−1 , . . . , x0 ) <lex (y` , y`−1 , . . . , y0 )) ist. Beweis: Wenn k < ` ist, dann ist k x = ∑ xi b ≤ i i=0 k ∑ (b − 1)b i k+1 = i=0 k ∑ b − ∑ bi = bk+1 − 1 < bk+1 ≤ y . i i=1 i=0 Es seien k = ` und j die größte Zahl mit der Eigenschaft, dass x j 6= y j ist. Wenn x j < y j ist, dann ist j ∑ xi b j i i=0 ≤ x j b + (b − 1) < (x j + 1)b ≤ y j b ≤ ∑ yi bi j j j i=0 und k x= j ∑ i= j+1 j xi b i + ∑ xi b i < i=0 k ∑ i= j+1 j xi b i + ∑ yi b i = y . i=0 Satz 8 : (Addition von zwei Zahlen, die durch Ziffern dargestellt sind) Es seien b, x, y, k, ` natürliche Zahlen, b ≥ 2 und xk , xk−1 , . . ., x0 bzw. y` , y`−1 , . . ., y0 die Ziffern von x bzw. y bezüglich b. Für je zwei Zahlen in {0, . . ., b − 1} sei die Zifferndarstellung ihrer Summe bekannt. (Wenn diese Summe gr ößer als b − 1 ist, dann hat sie zwei Ziffern, die erste ist 1 und die zweite ist kleiner als b − 1 ). O.E.d.A. sei ` ≤ k. Dann können die Ziffern von x + y mit dem folgenden Verfahren berechnet werden: • Ermittle die Ziffern (x0 + y0 )1 und (x0 + y0 )0 von x0 + y0 . Setze (x + y)0 := (x0 + y0 )0 , u0 := (x0 + y0 )1 und i := 0. • Solange i < ` ist, setze i := i + 1 und ermittle die Ziffern (xi + yi + ui−1 )1 und (xi + yi + ui−1 )0 von xi + yi + ui−1 . Setze (x + y)i := (xi + yi + ui−1 )0 und ui := (xi + yi + ui−1 )1 ( i-ter ” Übertrag“). • Solange i < k ist, setze i := i + 1 und ermittle die Ziffern (xi + ui−1 )1 und (xi + ui−1 )0 von xi + ui−1 . Setze (x + y)i := (xi + ui−1 )0 und ui := (xi + ui−1 )1 . • Wenn u` 6= 0 ist, setze (x + y)`+1 := u` . 15 1. RECHNEN MIT GANZEN UND RATIONALEN ZAHLEN Beweis: Übung. Verfahren für die Subtraktion und Multiplikation können in ähnlicher Weise angegeben werden. Hier wird nur noch das Verfahren für die Division mit Rest in einem Satz formuliert. In Satz 5 wurde bereits ein Divisionsalgorithmus angegeben. Wenn eine Zifferndarstellung der gegebenen Zahlen bekannt ist, kann dieses Verfahren mit Hilfe dieser zusätzlichen Information verbessert werden. Satz 9 : (Division mit Rest von Zahlen, die durch Ziffern dargestellt sind) Es seien b, x, y, k, ` natürliche Zahlen, b ≥ 2, y > 0 und xk , xk−1 , . . ., x0 bzw. y` , y`−1 , . . ., y0 die Ziffern von x bzw. y bezüglich b. O.E.d.A. sei x ≥ y. Die Ziffern des ganzzahligen Quotienten m von x und y können mit dem folgenden Verfahren berechnet werden: • Setze j := k − `, wenn ∑`i=0 xi+k−` bi ≥ y ist, und j := k − ` − 1, sonst. • Solange j ≥ 0 ist, berechne (wie in Satz 5) den ganzzahligen Quotienten m j von ∑i≥0 xi+ j bi und y. Dieser ist die j-te Ziffer von m. Ersetze x durch x − m j · y · b j und j durch j − 1. Beweis: Übung. Wenn zur Darstellung einer Zahl am Computer 32 bits (also 32 Binärziffern) zur Verfügung stehen, dann können in der Zweierkomplementdarstellung die Zahlen in {−231 = −2147483648, . . ., −1, 0, 1, . . ., 231 − 1 = 2147483647} (also insgesamt 232 Zahlen) dargestellt werden. Ist a eine natürliche Zahl in diesem Zahlenbereich, dann wird a durch 0 a30 a29 . . . a1 a0 dargestellt, wobei a30 a29 . . . a1 a0 die Ziffern von a zur Basis 2 sind. Ist a eine negative Zahl in diesem Zahlenbereich, dann wird a durch 1 a30 a29 . . . a1 a0 dargestellt, wobei a30 a29 . . . a1 a0 die Ziffern von a + 231 zur Basis 2 sind. 4. Rationale Zahlen Es seien a und b ganze Zahlen, wobei b 6= 0 ist. Die Aufgabe Finde ” eine Zahl z so, dass b · z = a ist“ bezeichnen wir als Gleichung“ b · x = a. ” Eine Zahl z mit b · z = a heißt Lösung von b · x = a. Wenn |b| 6= 1 ist, dann 16 1. RECHNEN MIT GANZEN UND RATIONALEN ZAHLEN hat die Aufgabe b · x = 1 in Z keine Lösung. Um Lösungen zu erhalten, müssen wir den Zahlenbereich erweitern“. ” Die Aufgabe b · x = a wird durch das Paar (a, b) ∈ Z 2 eindeutig beschrieben, also liegt es nahe, die neuen Zahlen“ durch Paare von ganzen ” Zahlen zu beschreiben. Allerdings sollten für t ∈ Z , t 6= 0, die Gleichungen b · x = a und t · b · x = t · a dieselbe Lösung haben, daher sollen die Zahlenpaare (a, b) und (t · a,t · b) dieselbe neue Zahl“ beschreiben. ” Definition 14 : Es seien a und b ganze Zahlen, wobei b 6= 0. Dann ist die Menge a := {(c, d) | c, d ∈ Z , ad = bc, d 6= 0} b die durch den Zähler“ a und den Nenner“ b gegebene rationale Zahl oder ” ” Bruchzahl. (Beachte: Eine Bruchzahl ist durch Vorgabe von Zähler und Nenner eindeutig bestimmt, aber umgekehrt sind Zähler und Nenner durch die Bruchzahl nicht eindeutig bestimmt). Wir schreiben Q für die Menge der rationalen Zahlen. Für die Bruchzahl a1 schreiben wir oft nur a und fassen so Z als Teilmenge von Q auf. ( Jede ganze Zahl ist eine rationale Zahl“). ” Satz 10 : Es seien a0 , b0 ganze Zahlen und b0 6= 0. Dann sind die Bruchzah0 len ba und ab0 genau dann gleich, wenn a · b0 = a0 · b ist. 0 Beweis: Wenn ab = ba0 ist, dann ist insbesondere (a0 , b0 ) ∈ ab , also a · b0 = a0 · b. Sei umgekehrt a · b0 = a0 · b und (c, d) ∈ ab , also b · c = a · d. Dann ist zu 0 zeigen, dass (c, d) ∈ ba0 , also b0 · c = a0 · d ist. Es ist a · (b0 · c) = (a · b0) · c = (a0 · b) · c = a0 · (b · c) = a0 · (a · d) = a · (a0 · d) , also auch b0 · c = a0 · d. Satz 11 : Für den Nenner einer Bruchzahl kann immer eine positive Zahl gewählt werden. Dann wird die totale Ordnung ≤ auf Z durch a c ≤ :⇔ a · d ≤ b · c b d zu einer totalen Ordnung auf Q erweitert. Beweis: Zuerst ist zu zeigen, dass die Definition von ≤ nicht von der Wahl von Zähler und positivem Nenner abhängt. Seien a, a0 , c, c0 ∈ Z und b, b0 , d, d 0 positive ganze Zahlen so, dass a · b0 = a0 · b, c · d 0 = c0 · d und a · d ≤ b · c ist. 17 1. RECHNEN MIT GANZEN UND RATIONALEN ZAHLEN Dann ist a0 · d 0 · b · d = a · d 0 · b 0 · d ≤ b · d 0 · b 0 · c = b 0 · c0 · b · d und a0 · d 0 ≤ b0 · c0 . Seien a, c, e ∈ Z , b, d, f positive ganze Zahlen so, dass ba ≤ dc und dc ≤ ef ist. Es ist noch zu zeigen, dass dann auch ab ≤ ef ist. Aus a·d · f ≤ b·c· f ≤ b·d ·e folgt a · f ≤ b · e und daher die Behauptung. Wir werden nun die Rechenoperationen von Z auf Q fortsetzen. Satz 12 : Die Abbildungen + : Q × Q −→ Q , a c ad + bc a c , ( , ) 7−→ + := b d b d bd und a c a c ac ( , ) 7−→ · := , b d b d bd sind wohldefiniert. Diese Rechenoperationen in Q erfüllen die gleichen Rechenregeln wie Addition und Multiplikation in Z . Darüberhinaus hat jedes Element ba ∈ Q \ {0} ein inverses Element ( ba )−1 mit der Eigenschaft · : Q × Q −→ Q , a a ( )−1 · = 1 , b b und zwar ist a b ( )−1 = . b a Die Einschränkungen von + und · auf Z × Z stimmen mit der Addition und der Multiplikation auf Z überein. Beweis: Wir müssen zuerst zeigen, dass die Abbildungen + und · wohlde0 0 finiert sind, das heißt: wenn ba = ba0 und dc = dc 0 ist, dann muss auch ad + bc a0 d 0 + b0 c0 = bd b0 d 0 und a 0 c0 ac = 0 0 bd b d sein. Aus a0 b = ab0 und c0 d = cd 0 folgt (ad + bc)b0 d 0 = a0 bdd 0 + bb0 c0 d = bd(a0 d 0 + b0 c0 ) und (ac)b0 d 0 = bd(a0 c0 ) . Die Rechenregeln können leicht nachgeprüft werden. 18 1. RECHNEN MIT GANZEN UND RATIONALEN ZAHLEN 5. Zifferndarstellung von rationalen Zahlen Satz 13 : (Zifferndarstellung von rationalen Zahlen) Es seien b, c, d, p positive ganze Zahlen mit b ≥ 2. Dann gibt es eindeutig bestimmte natürliche Zahlen n, zn , . . . , z0 , z−1 , . . ., z−p so, dass und zn 6= 0 oder n = 0, 0 ≤ zn , . . . , z0 , z−1 , . . . , z−p < b c − (zn bn + zn−1 bn−1 + . . . + z1 b1 + z0 + z−1 b−1 + . . . + z−p b−p ) < b−p d ist. Ist b fest gewählt, schreibt man 0≤ n zn zn−1 . . . z0 .z−1 z−2 . . . z−p statt ∑ zi b i . i=−p Die Zahlen zn , . . . , z0 , z−1 , . . ., z−p heißen Ziffern von a zur Basis b. Die Ziffern zi von dc zur Basis b können wie folgt berechnet werden: • Berechne (mit Satz 6) die Ziffern y0 , . . . , yk zur Basis b des ganzzahligen Quotienten m von c · b p und d . • Setze zi := yi+p , −p ≤ i ≤ k − p =: n . Beweis: Sei r der Rest von c · b p nach Division durch d. Wegen c · b p = m · d + r ist dann c · bp m·d r = + , d · bp d · bp d · bp also c m r r = p + .b−p und <1. d b d d Rationale Zahlen können also beliebig genau“ durch Zahlen der Form ” zn zn−1 . . . z0 .z−1 z−2 . . .z−p angenähert werden, aber es gibt rationale Zahlen, die für alle p von zn zn−1 . . . z0 .z−1 z−2 . . . z−p verschieden sind. Eine rationale Zahl z0 .z−1 z−2 . . . z−p Ee := z0 .z−1 z−2 . . . z−p · be mit b ≥ 2 und z0 6= 0 ist in Exponentialform zur Basis b dargestellt. Die Zahlen e und z0 .z−1 z−2 . . . z−p heißen Exponent und Mantisse. Am Computer kann eine Zahl dann durch die Ziffern des Exponenten und der Mantisse zur Basis 2 dargestellt werden. Die Anzahl dieser Ziffern ist durch eine vorgegebene Zahl beschränkt. Die so am Computer verfügbaren Zahlen heißen Maschinenzahlen. Es gibt nur endlich viele Maschinenzahlen, alle Maschinenzahlen sind rationale Zahlen. Beim Rechnen mit so dargestellten Zahlen gibt es im allgemeinen keine exakten Ergebnisse, sondern Rundungsfehler. Bei Rechenverfahren muss daher darauf geachtet werden, dass sich die Fehler nicht akkumulieren. Fehlerabschätzungen sind erforderlich. 19 1. RECHNEN MIT GANZEN UND RATIONALEN ZAHLEN Beispiel 7 : Die Zahl 0.1 (Dezimaldarstellung) auf der Tastatur wird vom Computer in Binärdarstellung 0.0001100110011001100 . . . umgewandelt und zum Beispiel als 1.100110011001100110011001100110011001100 E − 4 gespeichert. Also ergibt schon die Eingabe von 0.1 einen Rundungsfehler! Will man mit rationalen Zahlen am Computer exakt rechnen, kann man ab als Zahlenpaar (a, b) eingeben. Dann müssen für Zahlenpaare die Rechenoperationen (a, b) + (c, d) := (ad + bc, bd) und definiert werden. (a, b) · (c, d) := (ac, bd) 6. Der Euklidische Algorithmus Es seien a, b, c ganze Zahlen und b 6= 0, c 6= 0. Dann ist a a·c = ∈Q. b b·c Der Übergang von der Darstellung dieser rationalen Zahl durch das Zahlenpaar (a · c, b · c) zu der durch (a, b) heißt durch c kürzen. Rechnet man mit rationalen Zahlen, dann ist es sehr empfehlenswert, alle auftretenden Brüche sofort durch möglichst große Zahlen zu kürzen. Dadurch werden die weiteren Rechnungen oft wesentlich vereinfacht. In diesem Abschnitt wird ein Verfahren zum optimalen Kürzen“ angegeben. Darüberhinaus ” lernen wir ein Verfahren zur Berechnung einer Lösung einer ganzzahligen ” linearen Gleichung“ kennen. Definition 15 : Es seien a,b ganze Zahlen mit b 6= 0. Dann ist a Teiler von b (oder: a teilt b), wenn es eine Zahl c ∈ Z gibt mit b = ac. Die Zahl b heißt Vielfaches von a, wenn a ein Teiler von b ist. Definition 16 : Der größte gemeinsame Teiler von zwei von Null verschiedenen ganzen Zahlen ist die größte ganze Zahl, die beide teilt. Das kleinste gemeinsame Vielfache von zwei von Null verschiedenen ganzen Zahlen ist die kleinste positive ganze Zahl, die Vielfaches von beiden ist. Wir schreiben ggT (a, b) bzw. kgV (a, b) für den größten gemeinsamen Teiler bzw. das kleinste gemeinsame Vielfache zweier Zahlen a und b. Hilfssatz 1 : Es seien a, b, c ∈ Z , a 6= 0, b 6= 0 und a 6= c · b. Dann ist und ggT (a, b) = ggT (|a|, |b|) ggT (a, b) = ggT (a − c · b, b) . 20 1. RECHNEN MIT GANZEN UND RATIONALEN ZAHLEN Beweis: Übung. Satz 14 : (Euklidischer Algorithmus für ganze Zahlen) Es seien a, b ∈ Z , a 6= 0 und b 6= 0. Mit dem folgenden Verfahren kann der größte gemeinsame Teiler von a und b berechnet werden: • Ersetze a und b durch |a| und |b|. • Solange die zwei Zahlen verschieden sind, ersetze die größere durch die Differenz der größeren und der kleineren. • Wenn die zwei Zahlen gleich sind, dann ist ggT (a, b) gleich dieser Zahl. Ersetzt man mehrfaches Abziehen derselben Zahl durch eine Division mit Rest, dann hat dieses Verfahren die folgende Form: • Ersetze a und b durch |a| und |b|. • Solange keine der zwei Zahlen ein Teiler der anderen ist, ersetze die größere der zwei Zahlen durch ihren Rest nach Division durch die kleinere. • Wenn eine der zwei Zahlen ein Teiler der anderen ist, dann ist sie der ggT (a, b). Beweis: Es ist ggT (a, b) = ggT (|a|, |b|). Also können wir annehmen, dass a und b positive ganze Zahlen sind. Wenn sie verschieden sind, wird die größere der zwei Zahlen (wir bezeichnen sie mit max(a, b)) im nächsten Schritt durch eine kleinere positive ganze Zahl ersetzt. Also sind die zwei Zahlen nach höchstens max(a, b) − 1 Schritten gleich. In jedem Schritt wird ein Zahlenpaar durch ein anderes ersetzt, nach Lemma 1 aber so, dass die größten gemeinsamen Teiler der zwei Zahlenpaare gleich sind. Sobald man den größten gemeinsamen Teiler eines Zahlenpaares kennt (das ist spätestens dann der Fall, wenn die zwei Zahlen gleich sind), hat man ggT (a, b) ermittelt. Im Euklidischen Algorithmus wird die folgende Strategie zur Lösung von Problemen verwendet: Wenn man eine Aufgabe nicht sofort lösen kann, ersetzt man diese Aufgabe durch eine einfachere, die aber dieselbe Lösungsmenge hat. Das wiederholt man solange, bis man bei einer Aufgabe landet, deren Lösungen man kennt. Diese Lösungen sind dann auch die Lösungen der ursprünglichen Aufgabe. Satz 15 : (Erweiterter Euklidischer Algorithmus) Es seien a, b ∈ Z , a 6= 0 und b 6= 0. Es gibt ganze Zahlen u, v so, dass u · a + v · b = ggT (a, b) ist. Diese können mit dem folgenden Verfahren berechnet werden: 21 1. RECHNEN MIT GANZEN UND RATIONALEN ZAHLEN • Setze A := (A1 , A2 , A3 ) := (|a|, 1, 0) ∈ Z 3 und B := (B1 , B2 , B3 ) := (|b|, 0, 1) ∈ Z 3 . • Solange B1 die Zahl A1 nicht teilt, berechne den ganzzahligen Quotienten m von A1 und B1 und setze C := B, B := A − m ·C := (A1 − m ·C1 , A2 − m ·C2 , A3 − m ·C3 ) und A := C. • Wenn B1 die Zahl A1 teilt, dann ist u := vz(a) · B2 und v := vz(b) · B3 . Beweis: Wenn zwei Zahlentripel S und T die Eigenschaft S1 = |a| · S2 + |b| · S3 bzw. T1 = |a| · T2 + |b| · T3 haben, dann auch alle Tripel S − m · T mit m ∈ Z . Die ersten zwei Tripel im Algorithmus haben diese Eigenschaft, daher auch alle anderen auftretenden Tripel. Für die ersten Komponenten der Tripel wird der euklidische Algorithmus durchgeführt, für das letzte Tripel B gilt daher ggT (a, b) = |a| · B2 + |b| · B3 = vz(a) · a · B2 + b · vz(b) · B3 . Satz 16 : (Berechnung von kgV (a, b)) Es seien a, b ∈ Z , a 6= 0 und b 6= 0. Dann ist kgV (a, b) = |b| |a| · |b| = · |a| . ggT (a, b) ggT (a, b) |a| |b| Beweis: Es ist klar, dass ggT (a,b) · |b| = ggT (a,b) · |a| ein Vielfaches von a und von b ist. Sei z eine positive ganze Zahl, die Vielfaches von a und von b ist. Dann gibt es ganze Zahlen c, d mit z = c · a und z = d · b. Nach Satz 15 gibt es Zahlen u, v so, dass u · a + v · b = ggT (a, b) ist. Dann ist z= = u·a+v·b u·a v·b ·z = ·z+ ·z = ggT (a, b) ggT (a, b) ggT (a, b) u·a·d·b v·b·c·a a·b + = · (u · d + v · c) = ggT (a, b) ggT (a, b) ggT (a, b) = ein Vielfaches von |a| · |b| · vz(a · b) · (u · d + v · c) ggT (a, b) |a| ggT (a,b) · |b|. Satz 17 : ( Lösen einer ganzzahligen linearen Gleichung“). Es seien a1 , . . . , an ∈ ” Z \ {0} und b ∈ Z . Die größte ganze Zahl, die a1 , . . ., an teilt, heißt größter gemeinsamer Teiler von a1 , . . . , an und wird mit ggT (a1 , . . . , an ) bezeichnet. Es ist ggT (a1 , . . . , an ) = ggT (a1 , ggT (a2 , ggT (a3 , ggT (. . . , an ) . . .)) , 22 1. RECHNEN MIT GANZEN UND RATIONALEN ZAHLEN also kann der größte gemeinsame Teiler von mehreren Zahlen durch sukzessives Berechnen des größten gemeinsamen Teilers von je zwei Zahlen berechnet werden. Es gibt genau dann ein n-Tupel (x1 , . . . , xn ) ∈ Z n mit a1 · x1 + . . . + a n · xn = b , wenn b ein Vielfaches von g := ggT (a1 , . . ., an ) ist. In diesem Fall kann ein solches n-Tupel wie folgt berechnet werden: • Berechne mit Satz 15 Zahlen u1 , . . . , un so, dass a1 · u1 + . . . + an · un = g ist. • Setze xi := ui · bg , 1 ≤ i ≤ n. Beweis: Für jedes n-Tupel (x1 , . . ., xn ) ∈ Z n wird a1 · x1 + . . . + an · xn von g geteilt. Also ist die Bedingung, dass b ein Vielfaches von g ist, notwendig für die Existenz einer Lösung. Wenn diese Bedingung erfüllt ist, ist leicht nachzuprüfen, dass (u1 · bg , . . . , un · bg ) eine Lösung ist. 7. Primzahlen Definition 17 : Eine ganze Zahl p ∈ Z heißt Primzahl, wenn p 6= 0, p 6= 1, p 6= −1 und {1, −1, p, −p} die Menge der Teiler von p ist. Hilfssatz 2 : Es seien p eine Primzahl und a, b ∈ Z . Wenn p die Zahl a · b teilt, dann teilt p auch a oder b. Beweis: Sei c eine ganze Zahl so, dass c · p = a · b ist. Wenn p die Zahl a nicht teilt, dann ist ggT (a, p) = 1. Daher gibt es ganze Zahlen u und v so, dass 1 = u · a + v · p ist. Dann ist b = b · u · a + b · v · p = u · c · p + b · v · p = (u · c + b · v) · p , somit ist p ein Teiler von b. Satz 18 : (Zerlegung in Primfaktoren) Jede ganze Zahl, die größer als 1 ist, kann als Produkt von positiven Primzahlen geschrieben werden. Diese Primzahlen heißen Primfaktoren der Zahl und sind bis auf die Reihenfolge eindeutig bestimmt. Beweis: Es sei a eine ganze Zahl, die größer als 1 ist. Wir beweisen die erste Aussage durch Induktion über a. Wenn a = 2 ist, dann ist a eine Primzahl. Wenn a > 2 ist, dann ist a entweder eine Primzahl oder es gibt ganze Zahlen 23 1. RECHNEN MIT GANZEN UND RATIONALEN ZAHLEN b, c mit 1 < b, c < a so, dass a = b · c ist. Nach Induktionsannahme sind b und c Produkte von positiven Primzahlen, also auch a. Wir beweisen noch die Eindeutigkeit der Primfaktorzerlegung. Es seien a = p1 · p2 · . . . · pk und a = q1 · q2 · . . . · q` zwei Zerlegungen von a in Primfaktoren. Wir beweisen durch Induktion über die größere der zwei Zahlen k, `, dass die Primfaktoren der zwei Zerlegungen bis auf die Reihenfolge gleich sind. Weil p1 das Produkt q1 · q2 · . . . · q` teilt, gibt es nach Lemma 2 eine Zahl j ∈ {1, . . ., `} so, dass p1 = q j ist. Daher ist p2 · . . . · pk = ∏ qi , 1≤i≤`,i6= j und die Behauptung folgt aus der Induktionsannahme. Die Berechnung der Primfaktoren einer Zahl ist sehr aufwendig. Rechenverfahren, in denen Zahlen in Primfaktoren zerlegt werden müssen, sollten nach Möglichkeit vermieden werden. Satz 19 : Es gibt unendlich viele positive Primzahlen. Beweis: Wenn es nur endlich viele positive Primzahlen gäbe, dann wäre ihr Produkt q eine ganze Zahl und q + 1 wäre größer als jede Primzahl. Insbesondere wäre q + 1 keine Primzahl. Nach Satz 18 gibt es eine Primzahl p, die q+1 teilt. Da p auch q teilt, würde p dann auch 1 teilen, Widerspruch. Satz 20 : (Berechnung von ggT und kgV zweier Zahlen, deren Primfaktoren bekannt sind). Es seien p1 , . . . , pn paarweise verschiedene positive Primzahlen und e1 , . . . , en , f1 , . . ., fn natürliche Zahlen. Mit min(ei , fi ) bzw. max(ei , fi ) bezeichnen wir die kleinere bzw. größere der zwei Zahlen ei und fi . Dann ist n n i=1 i=1 n n i=1 i=1 n ggT (∏ pei i , ∏ pi i ) = ∏ pi und f min(ei , fi ) i=1 n kgV (∏ pei i , ∏ pi i ) = ∏ pi min(e , f ) f max(ei , fi ) . i=1 i i . Es ist klar, dass g die Zahlen a := Beweis: Es sei g := ∏ni=1 pi fi ei n n ∏i=1 pi und b := ∏i=1 pi teilt. Da nach Satz 18 die Zerlegung dieser zwei Zahlen in Primfaktoren eindeutig ist, kann ihr größter gemeinsamer Teiler keine anderen Primfaktoren als p1 , . . ., pn enthalten. Aus demselben Grund darf pi in ggT (a, b) nur min(ei , fi )-mal auftreten. Daher ist g = ggT (a, b). Die Behauptung für kgV (a, b) folgt nun aus Satz 16. 24 1. RECHNEN MIT GANZEN UND RATIONALEN ZAHLEN 8. Gruppen Definition 18 : Seien G eine Menge und ∗ : G×G → G eine Abbildung. Für Elemente a, b ∈ G schreiben wir statt ∗(a, b) kurz a∗b. Das Paar (G, ∗) heißt eine Gruppe, wenn die folgenden drei Bedingungen ( Gruppen-Axiome“) ” erfüllt sind: (1) Für alle Elemente a, b, c ∈ G ist a ∗ (b ∗ c) = (a ∗ b) ∗ c =: a ∗ b ∗ c (Assoziativgesetz). (2) Es gibt ein Element e ∈ G so, dass für alle a ∈ G gilt : a ∗ e = e ∗ a = a (e heißt dann neutrales Element in G). (3) Für alle Elemente a ∈ G gibt es ein b ∈ G so, dass a ∗ b = b ∗ a = e ist (b heißt dann zu a inverses Element und wird mit a−1 bezeichnet). Eine Gruppe (G, ∗) heißt kommutativ oder abelsch, wenn zusätzlich gilt: (4) Für alle a, b ∈ G ist a ∗ b = b ∗ a (Kommutativgesetz). Ist (G, ∗) eine Gruppe, dann wird die Abbildung ∗ als Gruppenverkn üpfung, Multiplikation oder, wenn (G, ∗) abelsch ist, als Addition bezeichnet. Wenn aus dem Zusammenhang ersichtlich ist, welche Verknüpfung auf G betrachtet wird, schreibt man statt (G, ∗) kürzer G. Beispiel 8 : ( Z , +), ({1, −1}, ·), ( Q , +) und ( Q \ {0}, ·) sind kommutative Gruppen. Satz 21 : Seien (G, ∗) eine Gruppe und a, b, c ∈ G. Dann gilt: (1) (2) (3) (4) Es gibt genau ein neutrales Element in G. Zu jedem Element in G gibt es genau ein inverses Element in G. Es ist (a ∗ b)−1 = b−1 ∗ a−1 . Aus a ∗ b = a ∗ c oder b ∗ a = c ∗ a folgt b = c ( In einer Gruppe ” kann gekürzt werden“). Beweis: (1) Seien e und e0 neutrale Elemente in G. Dann ist e0 = e ∗ e0 und e = e ∗ e0 , also e = e0 . (2) Seien b und b0 zu a inverse Elemente. Dann ist b = e ∗ b = (b0 ∗ a) ∗ b = b0 ∗ (a ∗ b) = b0 ∗ e = b0 . (3) Es ist (a ∗ b) ∗ (b−1 ∗ a−1 ) = a ∗ (b ∗ (b−1 ∗ a−1 )) = = a ∗ ((b ∗ b−1 ) ∗ a−1 ) = a ∗ (e ∗ a−1 ) = a ∗ a−1 = e und (b−1 ∗ a−1 ) ∗ (a ∗ b) = b−1 ∗ (a−1 ∗ (a ∗ b)) = b−1 ∗ ((a−1 ∗ a) ∗ b) = b−1 ∗ (e ∗ b) = b−1 ∗ b = e. (4) Aus a ∗ b = a ∗ c folgt b = a−1 ∗ a ∗ b = a−1 ∗ a ∗ c = c. 25 1. RECHNEN MIT GANZEN UND RATIONALEN ZAHLEN Definition 19 : Seien (G, ∗) eine Gruppe, m, n ∈ Z und am , am+1 , . . ., an ∈ G. Dann ist für n > m n ∏ ai := am ∗ am+1 ∗ . . . ∗ an := (. . . ((am ∗ am+1) ∗ am+2) ∗ . . . ∗ an−1 ) ∗ an . i=m Sprechweise: Das Produkt aller ai mit i von m bis n. Die Elemente am , am+1 , . . . , an heißen Faktoren von ∏ni=m ai . Für n = m setzt man m ∏ ai := am , i=m und für n < m vereinbart man n ∏ ai := e i=m ( leeres Produkt“), wobei e das neutrale Element von G ist. ” Wenn (G, ∗) kommutativ ist, wird oft + statt ∗, −a statt a−1 und n n ∑ ai i=m statt ∏ ai i=m geschrieben. Sprechweise: Die Summe aller ai mit i von m bis n. Die Elemente am , am+1 , . . . , an heißen dann Summanden von ∑ni=m ai . Hilfssatz 3 : Seien (G, ∗) eine Gruppe, m, k, n ∈ Z , m < k < n und a m , am+1 , . . ., an ∈ G. Dann gilt (am ∗ . . . ∗ ak ) ∗ (ak+1 ∗ . . . ∗ an ) = am ∗ am+1 ∗ . . . ∗ an . Beweis: Wir beweisen die Behauptung durch Induktion nach n − k, der Anzahl der Faktoren von ak+1 ∗ . . . ∗ an . Für n − k = 1 ist sich die Behauptung (am ∗ . . . ∗ an−1 ) ∗ an = am ∗ . . . ∗ an , was nach Definition des Produktes am ∗ . . . ∗ an−1 ∗ an richtig ist. Sei nun n − k > 1. Aus dem Assoziativgesetz und der Induktionsannahme (am ∗ . . . ∗ ak ) ∗ (ak+1 ∗ . . . ∗ an−1 ) = am ∗ am+1 ∗ . . . ∗ an−1 folgt (am ∗ . . . ∗ ak ) ∗ (ak+1 ∗ . . . ∗ an ) = (am ∗ . . . ∗ ak ) ∗ ([ak+1 ∗ . . . ∗ an−1 ] ∗ an ) = ([am ∗ . . . ∗ ak ] ∗ [ak+1 ∗ . . . ∗ an−1 ]) ∗ an = (am ∗ am+1 ∗ . . . ∗ an−1 ) ∗ an = am ∗ am+1 ∗ . . . ∗ an . Satz 22 : (Allgemeines Assoziativgesetz) Seien (G, ∗) eine Gruppe, s eine positive ganze Zahl, m, k1 , . . . , ks , n ganze 26 1. RECHNEN MIT GANZEN UND RATIONALEN ZAHLEN Zahlen mit m < k1 < k2 < . . . ks < n und am , am+1 , . . . , an ∈ G. Dann gilt (am ∗ . . . ∗ ak1 ) ∗ (ak1 +1 ∗ . . . ∗ ak2 ) ∗ . . . ∗ (aks +1 ∗ . . . ∗ an ) = = am ∗ . . . ∗ a n , d.h. auf die Reihenfolge des Ausführens der Gruppenverknüpfung bei der Berechnung von ∏ni=m ai kommt es nicht an, die Klammern können also weggelassen werden. Beweis: Wir beweisen die Behauptung durch Induktion nach s. Für s = 1 folgt die Behauptung aus Lemma 3. Sei s > 1. Nach Induktionsannahme und Lemma 3 ist dann (am ∗ . . . ∗ ak1 ) ∗ (ak1 +1 ∗ . . . ∗ ak2 ) ∗ . . . ∗ (aks +1 ∗ . . . ∗ an ) = [(am ∗. . .∗ak1 )∗(ak1 +1 ∗. . .∗ak2 )∗. . .∗(aks−1 +1 ∗. . .∗aks )]∗(aks +1 ∗. . .∗an ) = = (am ∗ . . . ∗ aks ) ∗ (aks+1 ∗ . . . ∗ an ) = am ∗ . . . ∗ an . Satz 23 : (Allgemeines Kommutativgesetz) Seien (G, +) eine kommutative Gruppe, m, n ∈ Z mit n > m, am , am+1 , . . ., an ∈ G und f eine bijektive Abbildung von {m, m + 1, . . ., n} nach {m, m + 1, . . ., n}. Dann gilt n ∑ ai = i=m n ∑ a f (i) , i=m d.h. auf die Reihenfolge der Summanden kommt es bei der Berechnung von ∑ni=m ai nicht an, sie können beliebig umgeordnet werden. Beweis: Wir beweisen die Behauptung durch Induktion nach n − m. Für n − m = 1 ist die Behauptung richtig, weil die Gruppe kommutativ ist. Sei nun n − m > 0. Wenn f (n) = n ist, dann folgt n n−1 i=m i=m ∑ a f (i) = ( ∑ a f (i)) + an und nach Induktionsannahme die Behauptung, weil die Einschränkung von f auf {m, m + 1, . . ., n − 1} eine bijektive Abbildung nach {m, m + 1, . . ., n − 1} ergibt. Im anderen Fall ist f (n) < n. Sei k ∈ {m, m + 1, . . ., n} so, dass f (k) = n ist. Weil G kommutativ ist, ist n k−1 n i=m i=m i=k+1 ∑ a f (i) = ∑ a f (i) + an + ∑ a f (i) = 27 1. RECHNEN MIT GANZEN UND RATIONALEN ZAHLEN k−1 = ∑ a f (i) + i=m n−1 n ∑ a f (i) + an = ∑ ag(i) + an , i=m i=k+1 wobei g die durch g(i) := f (i), falls m ≤ i < k, und g(i) := f (i + 1), falls k ≤ i < n, definierte bijektive Abbildung von {m, m + 1, . . ., n − 1} nach {m, m + 1, . . ., n − 1} ist. Nach Induktionsannahme ist n−1 n−1 i=m i=m ∑ ag(i) = ∑ ai , also ist n n−1 i=m i=m ∑ a f (i) = ∑ ag(i) + an = n ∑ ai . i=m Definition 20 : Seien I eine endliche Menge, (G, +) eine kommutative Gruppe und (ai )i∈I eine Familie von Elementen in G. Dann ist n ∑ ai := ∑ a f (i) ∈ G , i∈I i=1 wobei f eine bijektive Abbildung von {1, 2, . . ., n := #(I)} nach I ist. Nach Satz 23 hängt ∑i∈I ai nicht von der Wahl der bijektiven Abbildung f ab. Beispiel 9 : Sei I := {(0, 2), (1, 1), (2, 0)}, (G, +) := ( Z , +) und a(0,2) := 3, a(1,1) := 4, a(2,0) := 1. Sei f die bijektive Abbildung von {1, 2, 3} nach I mit f (1) = (1, 1), f (2) = (0, 2), f (3) = (2, 0). Dann ist ∑ ai = a(1,1) + a(0,2) + a(2,0) = 4 + 3 + 1 = 8 . i∈I 9. Ringe und Körper Definition 21 : Seien R eine Menge und + : R × R → R sowie · : R × R → R Abbildungen. Wir schreiben statt +(a, b) kurz a + b“ und ” statt ·(a, b) kurz a · b“ oder ab“. Das Tripel (R, +, ·) heißt ein Ring, wenn ” ” die folgenden Bedingungen ( Ring-Axiome“) erfüllt sind: ” (1) (R, +) ist eine abelsche Gruppe. (2) Für alle a, b, c ∈ R ist (ab)c = a(bc) (Assoziativgesetz). (3) Es gibt ein Element e ∈ R so, dass für alle a ∈ R gilt : ea = ae = a (e heißt dann Einselement und wird mit 1R bezeichnet). (4) Für alle a, b, c ∈ R ist a(b + c) = (ab) + (ac) und (a + b)c = (ac) + (bc) (Distributivgesetz). Ein Ring (R, +, ·) heißt kommutativ, wenn zusätzlich gilt: 28 1. RECHNEN MIT GANZEN UND RATIONALEN ZAHLEN (5) für alle a, b ∈ R ist ab = ba (Kommutativgesetz). Ist (R, +, ·) ein Ring, dann heißt + die Addition und · die Multiplikation des Ringes. Das neutrale Element von (R, +) heißt Nullelement und wird 0R geschrieben. Das zu a ∈ R bezüglich + inverse Element wird mit −a bezeichnet. Die Subtraktion ist dann definiert durch a − b := a + (−b). Um Klammern einzusparen, wird verabredet, dass die Multiplikation immer vor der Addition ausgeführt wird, ausgenommen bei gegenteiliger Klammerung. Zum Beispiel wird (ab) + c abgekürzt als ab + c. Wenn aus dem Zusammenhang ersichtlich ist, welche Addition und Multiplikation auf der Menge R betrachtet werden, so schreibt man statt (R, +, ·) kurz R. Beispiel 10 : ( Z , +, ·) und ( Q , +, ·) sind kommutative Ringe. Definition 22 : Ein Element a eines Ringes R mit Einselement 1R ist invertierbar, wenn es ein Element b ∈ R mit ab = 1R = ba gibt. Das Element b heißt dann zu a (bezüglich ·) inverses Element und wird mit a−1 bezeichnet. Satz 24 : Die Menge aller invertierbaren Elemente eines Ringes R ist mit der Multiplikation von R eine Gruppe. Das Einselement von R ist das neutrale Element dieser Gruppe. Für invertierbare Elemente a, b ∈ R ist (ab)−1 = b−1 a−1 und (a−1 )−1 = a . Beweis: Es ist (ab)(b−1 a−1 ) = a(bb−1 )a−1 = 1 = b−1 (a−1 a)b = (b−1 a−1 )(ab) . Definition 23 : Sei (R, +, ·) ein kommutativer Ring mit mindestens zwei Elementen. R heißt ein Körper, wenn jedes Element von R \ {0} invertierbar ist. Die Division in R ist dann durch a/b := ab−1 definiert. Beispiel 11 : ( Q , +, ·) ist ein Körper. Der Ring ( Z , +, ·) der ganzen Zahlen ist kein Körper. 29 1. RECHNEN MIT GANZEN UND RATIONALEN ZAHLEN Als Merkregel für diese Definitionen gilt: In einem Ring kann addiert, subtrahiert und multipliziert werden. In einem Körper kann zusätzlich noch durch Elemente ungleich null dividiert werden. Die Ring-Axiome sind den Rechenregeln für ganze Zahlen nachgebildet. Satz 25 : Seien (R, +, ·) ein Ring und a, b, c ∈ R. Dann gilt: (1) (2) (3) (4) Aus a + b = a + c folgt b = c. 0R · a = a · 0 R = 0R (−a) · b = a · (−b) = −(a · b) (−a) · (−b) = a · b. Wenn R ein Körper und a 6= 0 ist, dann gilt: (5) Aus a · b = a · c folgt b = c. Beweis: (1) folgt nach Satz 21 durch Kürzen in der Gruppe (R, +). (2) Aus 0R + 0R · a = 0R · a = (0R + 0R ) · a = 0R · a + 0R · a folgt nach (1), dass 0R = 0R · a ist. Analog beweist man die zweite Behauptung. (3) Aus (−a) · b + a · b = (−a + a) · b = 0R · b = 0R folgt (−a) · b = −(a · b). Analog beweist man die zweite Behauptung. (4) Nach (3) ist (−a) · (−b) = −(a · (−b)) = −(−(a · b)) = a · b . (5) Aus a · b = a · c erhält man durch Multiplikation mit a−1 auf beiden Seiten a−1 · a · b = a−1 · a · c und schließlich b = c. Hilfssatz 4 : Seien R ein Ring, k eine positive ganze Zahl und c, d1 , . . . , dk ∈ R. Dann gilt ! ! k k c· ∑ di = ∑ c · di und i=1 i=1 k k i=1 i=1 ∑ di · c = ∑ di · c . Beweis: Wir zeigen die erste Behauptung durch Induktion nach k. Für k = 1 ist nichts zu zeigen. Sei nun k > 1 und die Behauptung gelte für k − 1. Dann folgt mit Hilfe des Distributivgesetzes ! ! ! ∑ di i=1 k−1 k−1 k c· = c· ∑ di + d k i=1 k−1 = ! ∑ c · di + c · d k = i=1 ∑ di = c· i=1 k ∑ c · di . i=1 Die zweite Behauptung wird analog bewiesen. + c · dk = 30 1. RECHNEN MIT GANZEN UND RATIONALEN ZAHLEN Satz 26 : (Allgemeines Distributivgesetz) Seien R ein Ring, m, n ∈ N und a1 , . . ., am , b1 , . . . , bn ∈ R. Dann gilt ! ! ! ! i=1 · n m n m ∑ ai ∑ ai · b j =∑ ∑ bj j=1 i=1 j=1 = n m j=1 i=1 ∑ ∑ ai · b j Beweis: Sei a := ∑m i=1 ai ∈ R. Nach Hilfssatz 4 ist ! ! n a· ∑ bj = j=1 n n m j=1 j=1 i=1 ∑ a · b j = ∑ ∑ ai ·bj = n m j=1 i=1 . ∑ ∑ ai · b j ! . Seien I und J endliche Mengen, R ein Ring und (ai )i∈I , (b j ) j∈J Familien in R. Mit der Schreibweise von Definition 20 erhält man aus Satz 26: ! ! ! ! ∑ ai i∈I · ∑ bj =∑ j∈J = i∈I ∑ (i, j)∈I×J ∑ ai · b j = j∈J ai · b j =: ∑ i∈I, j∈J ∑ ∑ ai · b j j∈J = i∈I ai · b j . 10. Restklassen Sei n eine positive ganze Zahl. Definition 24 : Für a ∈ Z heißt die Menge ā := {a + z · n | z ∈ Z } Restklasse von a modulo n. Die Menge ¯ 1, ¯ . . . , n − 1} { ā | a ∈ Z } = {0, wird mit Zn (Sprechweise: Z modulo n) bezeichnet. Zwei ganze Zahlen a und b sind zueinander kongruent modulo n (Schreibweise: a ≡ b mod (n) ), wenn sie in derselben Restklasse modulo n liegen. Satz 27 : Für ā,b¯∈ Z n ist ā =b¯ oder ā ∩b¯= 0/ . Beweis: Sei ā ∩b¯6= 0. / Dann gibt es Zahlen x, y ∈ Z so, dass a + xn = b + yn ist. Dann ist für alle z ∈ Z ¯ a + zn = b + (y − x + z)n ∈ b¯ (also ā ⊆b) 31 1. RECHNEN MIT GANZEN UND RATIONALEN ZAHLEN und b + zn = a + (x − y + z)n ∈ ā (alsob¯⊆ ā). Satz 28 : Seien a, b ganze Zahlen und ā,b¯die Restklassen von a, b modulo n. Dann ist ā =b¯genau dann, wenn die Reste von a und b nach Division durch n gleich sind. Beweis: Sei r bzw. s der Rest von a bzw. b nach Division durch n. Es ist ¯ r ∈ ā und s ∈b. Wenn r = s ist, folgt aus Satz 27, dass ā =b¯ist. Wenn ā =b¯ist, gibt es eine ganze Zahl z mit b = a + zn. Also ist r = s. 32 1. RECHNEN MIT GANZEN UND RATIONALEN ZAHLEN Satz 29 : Die Abbildungen und + : Z n × Z n −→ Z n , ¯ 7−→ ā +b¯:= a + b ( ā,b) ¯ 7−→ ā ·b¯:= ab · : Z n × Z n −→ Z n , ( ā,b) sind wohldefiniert. Mit diesen Rechenoperationen ist Z n ein kommutativer Ring. Das Nullelement bzw. Einselement von Z n ist 0¯= {z · n | z ∈ Z } bzw. 1¯= {1 + z · n | z ∈ Z }. Beweis: Wir zeigen zuerst, dass + und · wohldefiniert sind. Es seien a, c, b, d ∈ Z so, dass ā = c̄ und̄ b = d.¯Dann sind a − c und b − d Vielfache von n. Wegen (a + b) − (c + d) = (a − c) + (b − d) ist auch (a + b) − (c + d) ein Vielfaches von n, also a + b = c + d. Wegen ab − cd = a(b − d) + (a − c)d ist ab = cd. Nun kann leicht nachgeprüft werden, dass + und · die Rechenregeln eines kommutativen Ringes erfüllen. Beispiel 12 : Am Computer können die Elemente von Z n durch die Zahlen 0, 1, . . ., n − 1 dargestellt werden. Dann wird für 0 ≤ a, b < n die Summe ā +b¯bzw. das Produkt ā ·b¯ durch den Rest von a + b bzw. a · b nach Division durch n dargestellt. Eine andere Möglichkeit zur Darstellung der Restklassen modulo n ist die durch die Zahlen n n−1 n ], −[ ], −[ ] + 1, . . ., [ 2 2 2 wobei [ 2n ] die größte ganze Zahl bezeichnet, die kleiner oder gleich n2 ist. In der Programmiersprache C bedeutet das Rechnen im Datentyp unsigned int das Rechnen im Restklassenring Z n mit n = 232 . Als Summe von 232 − 1 und 1 wird daher 0 ausgegeben. Satz 30 : Es seien a 6= 0 und n ≥ 2 ganze Zahlen. (1) Die Restklasse ā ∈ Zn ist genau dann invertierbar, wenn ggT (a, n) = 1 ist. In diesem Fall wird ā−1 wie folgt berechnet: – Berechne mit dem erweiterten Euklidischen Algorithmus Zahlen u, v ∈ Z so, dass u · a + v · n = 1 ist. – Dann ist ā−1 = ū. (2) Z n ist genau dann ein Körper, wenn n eine Primzahl ist. Beweis: 33 1. RECHNEN MIT GANZEN UND RATIONALEN ZAHLEN (1) Wenn ggT (a, n) = 1 und u · a + v · n = 1 ist, dann ist 1¯= ū · ā + v̄ · n̄ = ū · ā . Wenn ā invertierbar ist, dann gibt es eine ganze Zahl b so, dass ā ·b¯= 1¯ ist. Nach Satz 28 ist daher der Rest von ab nach Division durch n gleich 1, insbesondere ist n ein Teiler von ab − 1. Daher teilt ggT (a, n) sowohl a als auch 1 − a · b, also muss ggT (a, n) gleich 1 sein. (2) Seien n eine Primzahl und a ∈ Z . Dann ist a entweder ein Vielfaches von n oder ggT (a, n) = 1. Daher folgt die Behauptung aus (1). Beispiel 13 : Der Ring Z 2 ist ein Körper mit zwei Elementen. KAPITEL 2 Systeme linearer Gleichungen In diesem Kapitel werden mit m, n, p, q immer positive ganze Zahlen, mit K ein Körper (z.B. Q oder Z p , p prim) und mit R ein kommutativer Ring (z.B. Z , Q oder Z n ) bezeichnet. 1. Matrizen Definition 25 : Eine m × n-Matrix mit Koeffizienten in R (oder eine m × nMatrix über R) ist eine Abbildung A : {1, 2, . . ., m} × {1, 2, . . ., n} → R , (i, j) 7→ A(i, j) . Eine Matrix wird üblicherweise als Familie A11 A12 . . . A1n A21 A22 . . . A2n A = (Ai j )1≤i≤m = .. .. ... . . 1≤ j≤n Am1 Am2 . . . Amn geschrieben, wobei Ai j eine Abkürzung für A(i, j) ist und der i j-te Koeffizient von A (oder Koeffizient in der i-ten Zeile und j-ten Spalte von A) genannt wird. Als Kurzschreibweise wird A = (Ai j )i, j verwendet. Anstelle von Matrix-Koeffizienten“ spricht man auch von Matrix” ” Einträgen“. Eine m × 1-Matrix heißt eine m-Spalte, eine 1 × n-Matrix eine n-Zeile. Die n-Zeile Ai− := (Ai1 , Ai2 , . . . , Ain ) heißt i-te Zeile von A, die m-Spalte A1 j A2 j A− j := ... Am j j-te Spalte von A. Die Menge aller m × n-Matrizen mit Koeffizienten in R wird mit Rm×n bezeichnet. Matrizen mit Koeffizienten in Z oder Q werden kurz ganzzahlige oder rationale Matrizen genannt. 1 × 1-Matrizen mit Koeffizienten in 34 35 2. SYSTEME LINEARER GLEICHUNGEN R werden üblicherweise mit den entsprechenden Elementen von R identifiziert, d.h. R1×1 = R , (Ai j ) 1≤i≤1 = A11 . 1≤ j≤1 Definition 26 : Seien A, B ∈ Rm×n und r ∈ R. Dann heißt A11 + B11 . . . A1n + B1n .. .. ∈ Rm×n A + B := (Ai j + Bi j )1≤i≤m = . . 1≤ j≤n Am1 + Bm1 . . . Amn + Bmn die Summe von A und B, und rA11 . . . r · A := (rAi j )1≤i≤m = ... 1≤ j≤n rA1n .. ∈ Rm×n . rAm1 . . . rAmn heißt das r-fache skalare Vielfache von A. Wir schreiben im Folgenden statt r · A“ kurz rA“. Weiters vereinbaren wir, dass skalare Vielfache vor der ” ” Summe berechnet werden, zum Beispiel ist rA + B zu lesen als (r · A) + B. Satz 31 : (1) (Rm×n , +) ist eine kommutative Gruppe, wobei das neutrale Element die m × n-Nullmatrix 0R . . . 0R .. ∈ Rm×n 0 = ... . 0R . . . 0R und das zu A ∈ Rm×n inverse Element −A = (−Ai j )1≤i≤m ∈ Rm×n 1≤ j≤n ist. (2) Für r, s ∈ R und A, B ∈ Rm×n ist (r + s)A = rA + sA und (3) Für r, s ∈ R und r(A + B) = rA + rB. ist ARm×n (rs)A = r(sA) und 1R A = A . Beweis: (1) Wir zeigen nur die Assoziativität, die anderen Eigenschaften einer Gruppe werden analog bewiesen. Für A, B,C ∈ Rm×n ist (A + B) +C = (Ai j + Bi j )i, j + (Ci, j )i, j = ((Ai j + Bi j ) +Ci j )i, j = = (Ai j + (Bi j +Ci j ))i, j = (Ai j )i, j + (Bi j +Ci j )i, j = A + (B +C) 36 2. SYSTEME LINEARER GLEICHUNGEN aufgrund des Assoziativgesetzes für die Addition in R. (2), (3) Übung. Definition 27 : Für A ∈ Rm×n und B ∈ Rn×p heißt n A · B := ( ∑ Aik Bk j )1≤i≤m ∈ Rm×p 1≤ j≤p k=1 das Produkt von A und B (sprich A mal B“). Oft wird statt A · B nur AB ” geschrieben. Zur Berechnung des Koeffizienten n (AB)i j = ∑ Aik Bk j k=1 werden die Koeffizienten in der i-ten Zeile von A der Reihe nach mit den entsprechenden Koeffizienten in der j-ten Spalte von B multipliziert und anschließend alle diese Produkte addiert. Im Spezialfall m = 1 und p = 1, d.h. A ist eine n-Zeile und B eine nSpalte, ergibt sich B1 n AB = (A1 , . . . , An ) ... = A1 B1 + · · · + An Bn = ∑ Ai Bi . i=1 Bn Beispiel 14 : Ein Korb voller Waren werde durch die Zeile S := (S1 , . . . , Sn ) ∈ Q 1×n beschrieben, wobei Si die Stückzahl der Ware i im Korb angibt. Sei P1 P := ... ∈ Q n×1 , Pn wobei Pi den Preis der Ware i in Euro angibt. Dann ist n SP = ∑ Si Pi ∈ Q i=1 der Wert des ganzen Korbs. 37 2. SYSTEME LINEARER GLEICHUNGEN Beispiel 15 : Die Waren 1, . . . , m werden aus Rohstoffen 1, . . ., n hergestellt, die von Lieferanten 1, . . ., p bezogen werden. Für die Erzeugung der Ware i werden Qi j Einheiten des Rohstoffes j benötigt. Der Preis des Rohstoffes j beim Lieferanten k beträgt Pjk . Setzt man Q := (Qi j )i, j ∈ Q m×n und P := (Pjk ) j,k ∈ Q n×p , dann ist n (QP)ik = ∑ Qi j Pjk j=1 der Gesamtpreis der Rohstoffe für Ware i beim Lieferanten k. Sollen jeweils Si Stück der Ware i produziert werden und setzt man S = (S1 , . . . , Sm ) ∈ Q 1×n , dann ist (SQ)1 j die Anzahl der insgesamt benötigten Einheiten von Rohstoff j und ((SQ)P)1k ist der Preis bei Lieferant k für alle benötigten Rohstoffe. Satz 32 : Die Matrizenmultiplikation ist assoziativ, d.h. für Matrizen A ∈ Rm×n , B ∈ Rn×p und C ∈ R p×q gilt (AB)C = A(BC). Beweis: Da AB eine m × p-Matrix und BC eine n × q-Matrix ist, sind sowohl (AB)C als auch A(BC) m × q-Matrizen. Für 1 ≤ i ≤ m und 1 ≤ j ≤ q ist ! p ((AB)C)i j = ∑ (AB)ikCk j = k=1 p n = p n k=1 `=1 n p ∑ ∑ Ai`B`k ∑ ∑ Ai`B`kCk j = ∑ ∑ Ai`B`kCk j k=1 `=1 n = Ck j ∑ Ai` `=1 `=1 k=1 p ∑ B`kCk j k=1 ! n = ∑ Ai`(BC)` j `=1 = (A(BC))i j . Definition 28 : Für Elemente i, j einer beliebigen Indexmenge ist das KroneckerDelta in R ( 1R falls i = j, δi j := 0R falls i 6= j. 38 2. SYSTEME LINEARER GLEICHUNGEN Die Matrix 1 0 In := (δi j ) 1≤i≤n = ... 1≤ j≤n 0 0 1 .. . 0 heißt n × n-Einheitsmatrix. ... 0 . . . 0 ∈ Rn×n . . .. . . ... 1 Satz 33 : Für eine beliebige Matrix A ∈ Rm×n ist Im A = A und AIn = A . Beweis: Für 1 ≤ i ≤ m und 1 ≤ j ≤ n ist (Im A)i j = ∑m k=1 δik Ak j = Ai j , also Im A = A. Analog beweist man AIn = A. Satz 34 : Für A, B ∈ Rm×n und C ∈ Rn×p gilt (A + B)C = AC + BC. Für A ∈ Rm×n und B,C ∈ Rn×p gilt A(B +C) = AB + AC. Für A ∈ Rm×n , B ∈ Rn×p und r ∈ R gilt r(AB) = (rA)B = A(rB). Für A ∈ Rm×n und r, s ∈ R gilt (rs)A = r(sA). Beweis: Übung. Satz 35 : (Rn×n , +, ·) ist ein Ring mit Einselement In . Wegen 1 0 0 1 0 1 = 0 0 0 0 0 0 aber 0 1 0 0 1 0 0 0 = 0 0 0 0 ist Rn×n im Allgemeinen nicht kommutativ. Beweis: Die Behauptung folgt aus Satz 32, Satz 33 und Satz 34. 39 2. SYSTEME LINEARER GLEICHUNGEN Definition 29 : Eine Matrix A ∈ Rn×n heißt invertierbar, wenn es eine Matrix B ∈ Rn×n gibt mit AB = In und BA = In . In diesem Fall nennt man B die zu A inverse Matrix und schreibt B = A−1 . Sei GLn (R) := {A ∈ Rn×n | A invertierbar}. Nach Satz 24 ist (GLn (R), ·) eine Gruppe, sie heißt allgemeine lineare Gruppe (auf Englisch general linear group“). ” Definition 30 : Sei A = (Ai j )1≤i≤m ∈ Rm×n . Dann heißt 1≤ j≤n AT := (A ji )1≤i≤m ∈ Rn×m 1≤ j≤n die transponierte Matrix von A. Satz 36 : Für r ∈ R, A, B ∈ Rm×n und C ∈ GLn (R) gilt: (1) (AT )T = A (2) (A + B)T = AT + BT (3) (rA)T = rAT (4) (AB)T = BT AT (die Reihenfolge kehrt sich um !) (5) (C −1 )T = (C T )−1 . Beweis: Übung. 2. Elementare Umformungen Definition 31 : Seien 1 ≤ k ≤ m und 1 ≤ ` ≤ n. Dann heißt die Matrix Ek` ∈ Rm×n mit Koeffizienten ( 1R falls i = k und j = `, (Ek` )i j := δik δ j` = 0R falls i 6= k oder j 6= `, eine Standard-Matrix von Rm×n . Zum Beispiel sind die Standard-Matrizen von Q 2×2 1 0 0 1 0 0 0 0 E11 = , E12 = , E21 = und E22 = . 0 0 0 0 1 0 0 1 Im Spezialfall m = 1 (oder n = 1) schreibt man statt E1` (bzw. Ek1 ) kurz e` (bzw. ek ). Zum Beispiel sind die Standard-Zeilen von Q 1×3 e1 = (1, 0, 0) , e2 = (0, 1, 0) und e3 = (0, 0, 1) 40 2. SYSTEME LINEARER GLEICHUNGEN und die Standard-Spalten von Q 2×1 sind 1 0 e1 = und e2 = . 0 1 Definition 32 : Die folgenden Matrizen heißen Elementarmatrizen in Rn×n : Typ 1: In + rEk` , wobei r ∈ R und k 6= ` ist, Typ 2: In − Ekk − E`` + Ek` + E`k , wobei k 6= ` ist, Typ 3: In + (t − 1)Ekk , wobei t ∈ R invertierbar ist. Zum Beispiel sind 0 1 1 0 1 2 ∈ Q n×n , , 1 0 0 3 0 1 Elementarmatrizen vom Typ 1, Typ 2 bzw. Typ 3. Hilfssatz 5 : Für Ek` ∈ Rm×m , A ∈ Rm×n und 1 ≤ i ≤ m ist ( A`− falls i = k, (Ek` A)i− = 0 falls i 6= k. Beweis: Sei 1 ≤ j ≤ n. Wenn i 6= k ist, dann ist (Ek` A)i j = 0, weil außerhalb der k-ten Zeile von Ek` nur Nullen stehen. Wenn i = k ist, dann ist (Ek` A)i j = A` j , weil bei der Produktbildung die 1 in Ek` auf A` j trifft. Satz 37 : Sei A ∈ Rm×n und seien P ∈ Rm×m sowie Q ∈ Rn×n Elementarmatrizen. Dann erhält man PA aus A, indem man Typ 1: zur k-ten Zeile von A das r-fache der `-ten Zeile addiert, Typ 2: die k-te und `-te Zeile von A vertauscht, Typ 3: die k-te Zeile von A mit t multipliziert. Diese Umformungen der Matrix A heißen elementare Zeilenumformungen. Analog erhält man AQ aus A, indem man Typ 1: zur `-ten Spalte von A das r-fache der k-ten Spalte addiert, Typ 2: die k-te und `-te Spalte von A vertauscht, Typ 3: die k-te Spalte von A mit t multipliziert. Diese Umformungen der Matrix A heißen elementare Spaltenumformungen. Beweis: Für P = In + rEk` , wobei r ∈ R und k 6= `, ist PA = (In + rEk` )A = A + rEk` A. Nach Hilfssatz 5 ist ( rA`− falls i = k, (rEk` A)i− = 0 falls i 6= k. 41 2. SYSTEME LINEARER GLEICHUNGEN Die anderen Fälle beweist man analog. Satz 38 : Elementarmatrizen sind invertierbar, genauer gilt: Typ 1: (In + rEk` )−1 = In − rEk` Typ 2: (In − Ekk − E`` + Ek` + E`k )−1 = In − Ekk − E`` + Ek` + E`k Typ 3: (In + (t − 1)Ekk )−1 = In + (t −1 − 1)Ekk . Somit können alle elementaren Zeilen- oder Spaltenumformungen einer beliebigen Matrix durch elementare Zeilen- oder Spaltenumformungen wieder rückgängig gemacht werden. Beweis: Die Matrix (In − rEk` )(In + rEk` ) = (In − rEk` )[(In + rEk` )In ] erhält man aus Im , indem man zuerst zur k-ten Zeile das r-fache der `-ten Zeile addiert und anschließend das r-fache der `-ten Zeile subtrahiert. Daher ist (In − rEk` )(In + rEk` ) = In . Die anderen Fälle beweist man analog. Ist P eine Elementarmatrix, so bekommt man A aus B := PA wieder zurück, indem man B von links mit P −1 multipliziert. 3. Systeme linearer Gleichungen Definition 33 : Ein System linearer Gleichungen mit Koeffizienten in K (oder ein lineares Gleichungssystem über K) ist durch eine Matrix A ∈ K m×n und eine Spalte b ∈ K m×1 gegeben. Die Lösungsmenge dieses Systems ist L(A, b) := {x | x ∈ K n×1 mit Ax = b}. Das System lösen heißt, die Menge L(A, b) zu berechnen. Das System heißt homogen, wenn b die Nullspalte ist, ansonsten inhomogen. Ohne Matrizen kann man das so formulieren: Gegeben sind Elemente Ai j ∈ K und bi ∈ K für 1 ≤ i ≤ m und 1 ≤ j ≤ n. Gesucht sind alle n-Tupel (x1 , . . . , xn ) mit Komponenten in K, sodass A11 x1 + A12 x2 + · · · + A1n xn = b1 A21 x1 + A22 x2 + · · · + A2n xn = b2 .. .. .. . . . Am1 x1 + Am2 x2 + · · · + Amn xn = bm ist. Das durch A ∈ K m×n und b ∈ K m×1 gegebene System linearer Gleichungen wird kurz mit (A, b)“ oder Ax = b“ bezeichnet. Die Zahl m heißt die ” ” Anzahl der Gleichungen, die Zahl n die Anzahl der Unbekannten. 42 2. SYSTEME LINEARER GLEICHUNGEN Aus der Definition sieht man, dass ein homogenes System linearer Gleichungen immer eine Lösung hat, und zwar die Nullspalte. Hingegen gibt es inhomogene Systeme ohne Lösung, zum Beispiel das System x1 + x 2 = 0 . 2x1 + 2x2 = 1 Beispiel 16 : Es soll eine Legierung aus bi Gramm der Metalle Mi , 1 ≤ i ≤ m, hergestellt werden. Zur Verfügung stehen beliebige Mengen von Legierungen L1 , . . . , Ln der Metalle M1 , . . . , Mm , wobei 1 Gramm der Legierung L j jeweils Ai j Gramm des Metalls Mi enthält. Wieviele Gramm von L1 , . . . , Ln müssen für die gewünschte Legierung verschmolzen werden ? Das Zusammenschmelzen von x1 , . . ., xn Gramm der Legierungen L1 , . . ., Ln gibt eine Legierung mit jeweils n ∑ Ai j x j j=1 Gramm des Metalls Mi . Gesucht ist somit L(A, b). Satz 39 : Seien (A, b) ein System linearer Gleichungen über K und z ∈ L(A, b). Dann ist L(A, b) = {z + v | v ∈ L(A, 0)}. Beweis: Sei v ∈ L(A, 0). Dann ist A(z + v) = Az + Av = b + 0 = b, also z + v ∈ L(A, b). Sei x ∈ L(A, b). Dann ist A(x − z) = Ax − Az = b − b = 0, also x − z ∈ L(A, 0) und x = z + (x − z) ∈ {z + v | v ∈ L(A, 0)}. Um die Lösungsmenge eines inhomogenen linearen Gleichungssystems (A, b) zu bestimmen, genügt es somit, nur eine Lösung zu finden und die Lösungsmenge des homogenen linearen Gleichungssystems (A, 0) zu bestimmen. Satz 40 : Seien A ∈ K m×n , r, s ∈ K und v, w ∈ L(A, 0). Dann ist auch rv + sw ∈ L(A, 0) . Beweis: A(rv + sw) = r(Av) + s(Aw) = 0 + 0 = 0. Für die Lösungsmenge L eines Systems linearer Gleichungen gilt genau eine der folgenden drei Aussagen: (1) L ist leer ( es gibt keine Lösung“). ” 43 2. SYSTEME LINEARER GLEICHUNGEN (2) L enthält genau ein Element ( eine Lösung existiert und ist eindeutig ” bestimmt“). (3) L enthält mindestens zwei Elemente. Wenn K unendlich ist (z.B. K = Q ), dann enthält L im Fall (3) nach Satz 39 und Satz 40 unendlich viele Elemente. Wie können wir L dann durch endlich viele Daten beschreiben? Um diese Frage zu beantworten, führen wir im nächsten Abschnitt die Begriffe Vektorraum“ und Basis“ ” ” ein. 4. Vektorräume Beim Rechnen mit m × n-Matrizen mit Koeffizienten in einem Körper K haben wir zwei Rechenoperationen kennengelernt: (1) Die Addition von zwei m × n-Matrizen, (2) Die Multiplikation eines Elementes von K (eines Skalars“) mit einer ” m × n-Matrix. Im Satz 31 wurden die dafür geltenden Rechenregeln angegeben. Definition 34 : Sei V eine Menge und seien + : V × V → V sowie · : K × V → V Abbildungen. Wir schreiben statt +(v, w)“ kurz v + w“ und statt ” ” ·(r, v)“ kurz r · v oder nur rv“. Das Tripel (V, +, ·) ist ein Vektorraum über ” ” ” K, wenn die folgenden drei Bedingungen erfüllt sind: (1) (V, +) ist eine abelsche Gruppe. (2) Für alle r, s ∈ K und für alle v, w ∈ V ist r(v + w) = (rv) + (rw) und (r + s)v = (rv) + (sv) . (3) Für alle r, s ∈ K und für alle v ∈ V ist (rs)v = r(sv) und 1K v = v . Ist (V, +, ·) ein Vektorraum, dann heißen die Elemente von V Vektoren“, ” + Addition“ und · Skalarmultiplikation“. Statt (V, +, ·) wird oft nur V ” ” geschrieben. Das neutrale Element von (V, +) wird mit 0V bezeichnet und heißt der Nullvektor. Man beachte, dass der Begriff Vektor“ erst nach dem Begriff Vektor” ” raum“ eingeführt werden kann, so wie der Begriff Tiroler“ erst nach dem ” Begriff Tirol“ eingeführt werden kann. ” Die Eigenschaften von Vektoren können kurz so beschrieben werden: Vektoren können miteinander addiert und mit Skalaren multipliziert werden. Dabei gelten die üblichen“ Rechenregeln. ” Ein Beispiel aus der Physik: alle Kräfte, die in einem vorgegebenen Punkt angreifen, bilden einen Vektorraum, weil sie addiert und mit Zahlen multipiziert werden können und dabei obige Rechenregeln gelten. Daher sind solche Kräfte Vektoren. Die Addition und die Skalarmultiplikation von m × n-Matrizen mit Koeffizienten in einem Körper erfüllen die Rechenregeln eines Vektorraums. Daher: Matrizen sind Vektoren“. ” 44 2. SYSTEME LINEARER GLEICHUNGEN Satz 41 : K n = {(a1 , . . . , an ) | a1 , . . ., an ∈ K} mit der komponentenweisen Addition (a1 , . . ., an ) + (b1 , . . . , bn ) := (a1 + b1 , . . . , an + bn ) und der komponentenweisen Skalarmultiplikation r(a1 , . . . , an ) := (ra1 , . . ., ran ) ist ein Vektorraum über K und heißt Standard-Vektorraum über K der Dimension n. In diesem Vektorraum ist 0V = (0, . . ., 0) und −(a1 , . . . , an ) = (−a1 , . . ., −an ). Beweis: Übung. Beispiel 17 : Ein Kaufhaus bietet n Waren an. Sei Ui j die Anzahl der am Tag i verkauften Einheiten der Ware j. Dann gibt Ui− = (Ui1 , . . . ,Uin ) den Umsatz am Tag i an, U1− + · · · +Uk− = k k i=1 i=1 ∑ Ui1, . . ., ∑ Uin ! ist der Umsatz vom ersten bis zum k-ten Tag, und 1 (U1− + · · · +Uk− ) ∈ K n k ist der durchschnittliche Tagesumsatz. Satz 42 : Seien V ein Vektorraum über K, r ∈ K und v ∈ V . Dann gilt: (1) Es ist rv = 0 genau dann, wenn r = 0 oder v = 0 ist. (2) (−r)v = r(−v) = −(rv) . Beweis: (1) Aus 0V + 0K v = 0K v = (0K + 0K )v = 0K v + 0K v folgt durch Kürzen 0K v = 0V . Ebenso folgt aus 0V + r0V = r0V = r(0V + 0V ) = r0V + r0V durch Kürzen r0V = 0V . Wenn umgekehrt rv = 0 aber r 6= 0 ist, dann ist r invertierbar, weil K ein Körper ist, und v = 1K v = (r−1 r)v = r−1 (rv) = r−1 0V = 0V . (2) Wegen (rv)+(−r)v = [r +(−r)]v = 0K v = 0V ist −(rv) = (−r)v. Wegen (rv) + (r(−v)) = r[v + (−v)] = r0V = 0V ist −(rv) = r(−v). 45 2. SYSTEME LINEARER GLEICHUNGEN Definition 35 : Sei V ein Vektorraum über K. Eine Teilmenge U von V heißt Untervektorraum oder linearer Unterraum von V , wenn die folgenden drei Bedingungen erfüllt sind: (1) 0V ∈ U (2) Sind zwei Vektoren u, v Elemente von U , dann auch ihre Summe u + v. (3) Ist ein Vektor v Element von U , dann auch alle skalaren Vielfachen rv, r ∈ K. Man schreibt dann U ≤K V oder U ≤ V. Hilfssatz 6 : Seien (V, +, ·) ein Vektorraum über K und W ein Untervektorraum von V . Dann ist (W, +|W ×W , ·|K×W ) selbst ein Vektorraum über K. Beweis: Übung. Satz 43 : Die Lösungsmenge eines homogenen Systems linearer Gleichungen mit der komponentenweisen Addition und Skalarmultiplikation ist ein Vektorraum. Beweis: Folgt aus Satz 40 und Hilfssatz 6. 5. Erzeugendensysteme, lineare Unabhängigkeit und Basen Definition 36 : Seien V ein Vektorraum über K und (vi )i∈I eine Familie von Vektoren in V , wobei I eine beliebige Indexmenge (oft {1, 2, . . ., n}) ist. Eine Familie (ci )i∈I von Elementen in K heißt Koeffizientenfamilie, wenn ci 6= 0 für nur endlich viele i ∈ I ist. Ein Vektor w ∈ V heißt eine Linearkombination von (vi )i∈I , wenn es eine Koeffizientenfamilie (ci )i∈I gibt, sodass w = ∑ ci vi i∈I ist. Dabei ist im Fall einer unendlichen Indexmenge I obige Summe als die endliche Summe über alle Indizes i ∈ I mit ci 6= 0 zu verstehen. Die Menge aller Linearkombinationen von (vi )i∈I ist der kleinste Untervektorraum von V , der alle Vektoren vi , i ∈ I, enthält. Er heißt der von vi , i ∈ I, erzeugte Untervektorraum von V und wird mit K hvi | i ∈ Ii oder ∑ Kvi i∈I 46 2. SYSTEME LINEARER GLEICHUNGEN bezeichnet. Wenn I = {1, . . ., n} ist, dann ist n K hvi | i ∈ Ii = { ∑ ci vi | c1 , . . ., cn ∈ K} . i=1 Definition 37 : Sei V ein Vektorraum über K. Eine Familie (vi )i∈I von Vektoren in V heißt ein Erzeugendensystem von V , wenn K hvi | i ∈ Ii = V ist. Definition 38 : Seien V ein Vektorraum über K und (vi )i∈I eine Familie von Vektoren in V . Dann heißt (vi )i∈I linear unabhängig, wenn für jede Koeffizientenfamilie (ci )i∈I aus ∑ ci vi = 0 i∈I auch ci = 0 für alle i ∈ I folgt. Andernfalls heißt (vi )i∈I linear abhängig. Beispiel 18 : Sei V ein Vektorraum über K. Ein einzelner Vektor v ∈ V ist linear unabhängig genau dann, wenn v 6= 0 ist, weil aus rv = 0 nach Satz 42 r = 0 oder v = 0 folgt. Satz 44 : Sei A ∈ K m×n . (1) L(A, 0) ist genau dann der Nullraum, wenn die Spalten (A−1 , . . ., A−n ) linear unabhängig sind. (2) Für b ∈ K m×1 ist das lineare Gleichungssystem Ax = b genau dann lösbar, wenn b eine Linearkombination der Spalten von A ist. Beweis: Für y ∈ K n×1 ist Ay = y1 A−1 + . . . yn A−n . Definition 39 : Sei V ein Vektorraum über K. Eine Basis von V ist ein linear unabhängiges Erzeugendensystem von V . Satz 45 : Die Familie (Ek` )1≤k≤m 1≤`≤n 47 2. SYSTEME LINEARER GLEICHUNGEN der Standard-Matrizen (siehe Definition 31) ist eine Basis von K m×n und heißt die Standardbasis von K m×n . Insbesondere ist die Familie (ei )1≤i≤n der Standard-Zeilen (siehe Definition 31) eine Basis von K n und heißt die Standardbasis von K n . Beweis: Da für eine beliebige Matrix A ∈ K m×n A= ∑ Ak` Ek` 1≤k≤m 1≤`≤n ist, ist die Familie (Ek` )1≤k≤m ein Erzeugendensystem von K m×n . Um die 1≤`≤n lineare Unabhängigkeit dieser Familie zu zeigen, nehmen wir an, dass für gewisse ck` ∈ K ∑ ck` Ek` = 0 1≤k≤m 1≤`≤n ist. Dann folgt für alle 1 ≤ i ≤ m und 1 ≤ j ≤ n 0= ∑ ck` (Ek` )i j = ci j , 1≤k≤m 1≤`≤n was zu zeigen war. Satz 46 : Sei V ein Vektorraum über K. Eine Familie (vi )i∈I von Vektoren in V ist genau dann eine Basis von V , wenn sich jeder Vektor in V in eindeutiger Weise als Linearkombination von (vi )i∈I schreiben lässt, d.h. für alle w ∈ V gibt es genau eine Koeffizientenfamilie (ci )i∈I , sodass w = ∑ ci vi i∈I ist. Diese Familie (ci )i∈I heißt dann die Koordinatenfamilie des Vektors w bezüglich der Basis (vi )i∈I , und ci ∈ K heißt die Koordinate von w beim Basisvektor vi . Beweis: Wenn sich jeder Vektor aus V in eindeutiger Weise als Linearkombination von (vi )i∈I schreiben lässt, dann ist (vi )i∈I einerseits ein Erzeugendensystem von V und andererseits linear unabhängig, weil aus ∑ civi = 0V = ∑ 0K vi i∈I i∈I 48 2. SYSTEME LINEARER GLEICHUNGEN auf Grund der Eindeutigkeit ci = 0K für alle i ∈ I folgt. Seien umgekehrt (vi )i∈I eine Basis von V und w ∈ V . Da (vi )i∈I ein Erzeugendensystem von V ist, gibt es eine Koeffizientenfamilie (ci )i∈I mit w = ∑ ci vi . i∈I Falls (di )i∈I eine weitere Koeffizientenfamilie in K mit w = ∑ d i vi i∈I ist, erhält man durch Subtrahieren 0V = ∑(ci − di )vi . i∈I Da (vi )i∈I linear unabhängig ist, folgt ci − di = 0K für alle i ∈ I, also ci = di für alle i ∈ I. Beispiel 19 : Für A ∈ K m×n ist ∑ A= Ak` Ek` , 1≤k≤m 1≤`≤n also ist A die Koordinatenfamilie von A bezüglich der Standardbasis (E k` )1≤k≤m 1≤`≤n (und Ak` die Koordinate von A bei Ek` ). Beispiel 20 : Seien V ein Vektorraum über K, (v1 , . . ., vn ) ∈ V n eine Basis von V , w1 , . . . , w` ∈ V und u = ∑ni=1 ci vi ∈ V eine Linearkombination von (v1 , . . . , vn ). Die Aufgabe Überprüfe, ob u eine Linearkombination von (w1 , . . . , w` ) ist und ” - wenn ja - berechne ein `-Tupel (d1 , . . ., d` ) mit u = ∑`j=1 d j w j .“ kann als System linearer Gleichungen formuliert werden: Sei T die n × `-Matrix mit n w j := ∑ Ti j vi , 1 ≤ j ≤ ` . i=1 Gesucht ist eine `-Spalte d ∈ K `×1 so, dass n ∑ ci vi = u = i=1 ` n ` ∑ d j w j = ∑ ( ∑ Ti j d j )vi j=1 i=1 j=1 ist. Daher ist eine solche Spalte d eine Lösung des Systems linearer Gleichungen T x = c, wobei c die n-Spalte mit Einträgen c1 , . . ., cn ist. Satz 47 : Jeder Vektorraum V über K besitzt eine Basis. Wenn V eine endliche Basis hat, dann enthalten je zwei Basen von V gleich viele Vektoren. 49 2. SYSTEME LINEARER GLEICHUNGEN Beweis: wird weggelassen. Definition 40 : Die Zahl dimK (V ) := Anzahl der Elemente einer Basis von V heißt die Dimension von V . Wenn dimK (V ) = n ist, dann nennt man V ndimensional. (Jeder Vektor in V kann durch n Zahlen eindeutig beschrieben werden). Ein Vektorraum V heißt endlich-dimensional, wenn er eine endliche Basis hat, sonst heißt er unendlich-dimensional. Beispiel 21 : Nach Satz 45 ist dimK (K m×n ) = m · n und dimK (K n ) = n . Nach Einführung des Begriffs Basis“ kann die Aufgabenstellung Be” ” rechne die Lösungsmenge des linearen Gleichungssystems (A, b)“ präzisiert werden: Berechne irgendeine Lösung von (A, b) und eine Basis des Lösungsraums ” von (A, 0)“. Man beachte, dass damit nur endlich viele Daten zu berechnen sind, diese bestimmen aber vollständig die (möglicherweise unendliche) Lösungsmenge L(A, b). 6. Der Gauss-Algorithmus Wir werden nun eine Methode zum Lösen eines linearen Gleichungssystems (A, b) kennenlernen. Zunächst betrachten wir einen Spezialfall, in dem die Matrix A eine besonders einfache Gestalt hat. In diesem Fall können wir die Lösungsmenge direkt anschreiben (Satz 48). Danach werden wir den allgemeinen Fall auf den einfachen Fall zurückführen, indem wir die Daten (A, b) schrittweise so verändern, dass die geänderten Daten (A 0 , b0 ) schließlich die einfache Gestalt haben und L(A, b) = L(A0 , b0 ) ist (Satz 50 und Satz 52). Den Übergang von den Daten (A, b) zu (A0 , b0 ) nennt man die Gleichungen umformen“. Gilt dabei ” L(A, b) = L(A0 , b0 ), dann sind die Umformungen zulässig“. ” Definition 41 : Eine Matrix A ∈ K m×n hat Stufenform, wenn die folgenden vier Bedingungen erfüllt sind: (1) Ist Ai− = 0, dann sind auch A(i+1)− = · · · = Am− = 0. (2) Der (von links gelesen) erste Koeffizient 6= 0 in jeder Zeile heißt Pivot und ist 1. 50 2. SYSTEME LINEARER GLEICHUNGEN (3) Der Pivot von Zeile i + 1 steht rechts vom Pivot von Zeile i. (4) Der Pivot jeder Zeile ist der einzige Koeffizient 6= 0 in seiner Spalte. Dann hat A die Gestalt 0 ... 0 1 ∗ ... ∗ 0 ∗ ... ∗ 0 ∗ ... 0 . . . . . . . . . . . . . . . . 0 1 ∗ . . . ∗ 0 ∗ . . . 0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 0 1 ∗ . . . , .. . wobei die Sterne für beliebige Elemente von K stehen. Satz 48 : Sei (A, b) ein System linearer Gleichungen über K mit A ∈ K m×n in Stufenform. Seien r die Anzahl der Pivots, d1 < d2 < · · · < dr die Spaltenindizes der Pivots und 0 1 ... 0 e1 = ... , . . . , en = 0 0 1 die Standardspalten von K n×1 . Dann gilt: (1) L(A, b) ist genau dann nicht leer, wenn für alle i > r gilt: bi = 0. In diesem Fall ist 0 ... 0 b 1 0 r z := ∑ bi edi = ... ∈ L(A, b), i=1 0 br 0 . .. 0 wobei b1 , . . ., br in den Zeilen d1 , . . . , dr stehen. 51 2. SYSTEME LINEARER GLEICHUNGEN (2) Sei J := {1, . . ., n} \ {d1 , . . ., dr } und, für alle j ∈ J, 0 .. . 0 −A1 j 0 . .. r 0 , w j := e j − ∑ Ai j edi = 1 i=1 0 .. . −Ar j 0 . .. 0 wobei −A1 j , . . . , −Ar j in den Zeilen d1 , . . ., dr sowie 1 in der Zeile j stehen. Dann ist (w j ) j∈J eine K-Basis von L(A, 0). Beweis: (1) Wenn L(A, b) nicht leer ist, dann gibt es ein x mit Ax = b, und es folgt bi = Ai− x = 0 für i > r. Sei umgekehrt bi = 0 für i > r. Dann ist r r i=1 i=1 Az = A( ∑ bi edi ) = ∑ bi Aedi = r r i=1 i=1 ∑ biA−di = ∑ biei = b, also z ∈ L(A, b). (2) Für alle j ∈ J ist r r r i=1 i=1 i=1 Aw j = A(e j − ∑ Ai j edi ) = Ae j − ∑ Ai j Aedi = A− j − ∑ Ai j ei = 0, also w j ∈ L(A, 0). Sei (t j ) j∈J eine Familie in K. Dann ist ∑ t jw j = j∈J r ∑ t j e j − ∑ ( ∑ t j Ai j )edi , i=1 j∈J j∈J daher ist t j die Koordinate von ∑ j∈J t j w j beim Standardbasisvektor e j , für alle j ∈ J. Aus ∑ j∈J t j w j = 0 folgt somit t j = 0, j ∈ J. Daher ist (w j ) j∈J linear unabhängig. Es bleibt noch zu zeigen, dass jedes v ∈ L(A, 0) eine Darstellung v= ∑ s jw j j∈J 52 2. SYSTEME LINEARER GLEICHUNGEN mit gewissen s j ∈ K besitzt. Aus Av = 0 folgt für alle i ≤ r: n 0 = Ai− v = ∑ A i j v j = v di + ∑ A i j v j . j∈J j=1 Somit gilt für 1 ≤ i ≤ r v di = − ∑ A i j v j j∈J und wir erhalten r v= r ∑ v j e j + ∑ v di e di = ∑ v j e j − ∑ ∑ A i j v j j∈J j∈J i=1 r = ∑ v j e j − ∑ v j ∑ A i j e di j∈J = j∈J i=1 i=1 ! = ∑ vj j∈J j∈J ! r e di e j − ∑ A i j e di i=1 ! ∑ v jw j , j∈J was zu zeigen war. Unser nächstes Ziel ist es, beliebige lineare Gleichungssysteme zu lösen. Ein erster Schritt dazu ist der folgende Satz. Satz 49 : Sei (A, b) ein lineares Gleichungssystem mit A ∈ K m×n . Dann gilt für beliebiges P ∈ GLm (K) L(PA, Pb) = L(A, b). Beweis: Ist y ∈ L(A, b), dann ist Ay = b, also auch PAy = Pb und y ∈ L(PA, Pb). Daher ist L(A, b) eine Teilmenge von L(PA, Pb). Ist y ∈ L(PA, Pb), dann ist PAy = Pb, also auch Ay = P−1 PAy = P−1 Pb = b und y ∈ L(A, b). Daher ist L(PA, Pb) eine Teilmenge von L(A, b). Satz 49 legt nahe, zu einem gegebenen linearen Gleichungssystem (A, b) eine invertierbare Matrix P zu suchen, sodass das Gleichungssystem (PA, Pb) Stufenform hat. Dann kann die Lösungsmenge mit Satz 48 bestimmt werden. Satz 50 : Jede Matrix A ∈ K m×n kann durch elementare Zeilenumformungen auf Stufenform gebracht werden, genauer gesagt gibt es ein P ∈ GL m (K), das Produkt von höchstens mn Elementarmatrizen ist, sodass PA Stufenform hat. Diese Matrix PA kann mit dem folgenden Algorithmus berechnet werden (Gauss-Elimination): (1) Setze C := A, i := 1 und j := 1. 53 2. SYSTEME LINEARER GLEICHUNGEN (2) Falls Ci j 6= 0 ist, gehe zu Schritt 4. Ansonsten suche ein k ∈ {i + 1, . . ., m} mit Ck j 6= 0. (3) Falls es kein k ∈ {i + 1, . . . , m} mit Ck j 6= 0 gibt, erhöhe j um 1 und wiederhole Schritt 2. Ansonsten vertausche die i-te und k-te Zeile von C und nenne die neue Matrix wieder C. (Dann ist Ci j 6= 0). (4) Multipliziere die i-te Zeile von C mit Ci−1 j und nenne die neue Matrix wieder C. (Dann ist Ci j = 1). (5) Für ` ∈ {1, . . ., m} \ {i} mit C` j 6= 0 subtrahiere das C` j -fache der i-ten Zeile von der `-ten Zeile und nenne die neue Matrix wieder C. (Dann ist C− j = ei ). (6) Erhöhe i und j um 1 und gehe zu Schritt 2. Der Algorithmus wird abgebrochen, sobald i > m oder j > n ist. Dann hat die Matrix C Stufenform. Beweis: Der Algorithmus bricht nach höchstens n Durchläufen ab, weil in jedem Durchlauf j um 1 erhöht wird. Seien P1 , . . ., Ps die Elementarmatrizen zu den im Algorithmus der Reihe nach durchgeführten elementaren Zeilenumformungen. Da pro Durchlauf höchstens m elementare Zeilenumformungen durchgeführt werden, ist s ≤ nm. Nach Satz 37 erhält man am Ende des Algorithmus die Matrix (Ps . . . (P2 (P1 A)) . . .) = (Ps . . . P2 P1 )A, und nach Satz 38 ist P := Ps . . . P2 P1 ∈ GLm (K). Schließlich hat die Matrix PA Stufenform, weil in jedem Durchlauf die ersten j − 1 Spalten nicht mehr verändert werden und in der j-ten Spalte entsprechend umgeformt wird. Der Beweis zeigt, dass man die Transformationsmatrix P erhält, indem man die elementaren Zeilenumformungen nicht nur auf A, sondern auch auf die Einheitsmatrix Im anwendet: (A|Im ) → (P1 A|P1 Im ) → · · · → (Ps . . . P1 A|Ps . . . P1 Im ) = (PA|P). Satz 51 : Sei A ∈ K m×m . Auf die folgende Weise kann überprüft werden, ob A invertierbar ist und, wenn ja, die zu A inverse Matrix A−1 berechnet werden: Bringe A durch Gauss-Elimination auf Stufenform, wobei die elementaren Zeilenoperationen auch auf die Einheitsmatrix angewendet werden: (A|Im ) → (PA|P). 54 2. SYSTEME LINEARER GLEICHUNGEN Dann ist A invertierbar genau dann, wenn PA = Im gilt. In diesem Fall ist A−1 = P . Beweis: Wenn A invertierbar ist, dann sind A, P ∈ GLm (K) und somit auch B := PA ∈ GLm (K). Da B Stufenform hat, ist B = Im oder Bm− = 0. Aus Bm− = 0 würde aber 0 = Bm− (B−1 )−m = (BB−1 )mm = 1, folgen, also muss B = Im sein. Umgekehrt folgt aus PA = Im auch AP = P−1 (PA)P = Im und somit P = A−1 . Satz 52 : Ein lineares Gleichungssystem Ax = b über dem Körper K kann gelöst werden, indem man die Matrix A durch Gauss-Elimination auf Stufenform bringt und b mittransformiert. Praktisch führt man die elementaren Zeilenumformungen auf der erweiterten Matrix“ (A|b) aus und erhält ” (PA|Pb). Dann ist L(A, b) = L(PA, Pb), und L(A, b) kann nach Satz 48 berechnet werden. Insbesondere gibt es genau dann genau eine Lösung, wenn In c und Pb = PA = 0 0 mit c ∈ K n×1 ist. Die eindeutige Lösung ist dann c1 ... . cn Wenn A sogar invertierbar ist, dann hat (A, b) die eindeutige Lösung A−1 b. Beweis: Die Behauptung folgt aus Satz 49 und Satz 48. Satz 53 : Ein homogenes lineares Gleichungssystem Ax = 0 über dem Körper K hat immer die triviale Lösung 0. Wenn A ∈ K m×n mit m < n ist, d.h. es sind weniger Gleichungen als Unbekannte vorhanden, dann gibt es auch eine Lösung, die nicht trivial ist. Beweis: Wenn m < n ist, dann kann PA ∈ K m×n nicht die Form In 0 haben, und nach Satz 52 gibt es mehr als eine Lösung. 55 2. SYSTEME LINEARER GLEICHUNGEN Definition 42 : Sei A ∈ K m×n . Der von den Spalten von A erzeugte Untervektorraum von K m×1 heißt der Spaltenraum von A. Der Rang von A ist die Dimension des Spaltenraums von A. Schreibweise: rg(A). Satz 54 : Seien A ∈ K m×n und P ∈ GLm (K) so, dass PA Stufenform hat. Sei r die Anzahl der Pivots in PA. Dann ist r = rg(A) und die Dimension von L(A, 0) ist n − rg(A). Beweis: Nach Satz 48 ist n − r die Dimension von L(PA, 0). Da PA Stufenform hat, ist leicht nachzuprüfen, dass rg(PA) = r ist. Wenn die Spalten S1 , . . . , Sr eine Basis des Spaltenraums von PA bilden, dann ist (P−1 S1 , . . . , P−1 Sr ) eine Basis des Spaltenraums von P−1 PA = A. Also ist rg(A) = rg(PA) und wegen L(PA, 0) = L(A, 0) ist n − rg(A) die Dimension von L(A, 0). KAPITEL 3 Rechnen mit Abbildungen 1. Permutationen Satz 55 : Sei f : M → N eine Abbildung. (1) Ist f bijektiv, dann gilt f ◦ f −1 = IdN und f −1 ◦ f = IdM . (2) Ist g : N → M eine Abbildung mit f ◦ g = IdN und g ◦ f = IdM , dann ist f bijektiv und g = f −1 . Beweis: Übung. Satz 56 : Seien f : M → N und g : N → P bijektive Abbildungen. Dann ist auch g ◦ f bijektiv und es gilt (g ◦ f )−1 = f −1 ◦ g−1 . Beweis: Wegen (g ◦ f ) ◦ ( f −1 ◦ g−1 ) = g ◦ ( f ◦ f −1 ) ◦ g−1 = g ◦ IdN ◦g−1 = IdP und ( f −1 ◦ g−1 ) ◦ (g ◦ f ) = f −1 ◦ (g−1 ◦ g) ◦ f = f −1 ◦ IdN ◦ f = IdM folgt die Behauptung aus Satz 55, (2). Satz 57 : Sei M eine Menge. Dann ist S(M) := {s | s : M → M bijektiv} mit der Hintereinanderausführung von Abbildungen eine Gruppe mit neutralem Element IdM und heißt die symmetrische Gruppe von M. Beweis: Folgt aus Satz 1 und Satz 56. Definition 43 : Sei n ∈ N und [n] := {1, 2, . . ., n}. Dann nennt man bijektive Abbildungen von [n] nach [n] auch Permutationen der Zahlen 1, 2, . . ., n, und Sn := S([n]) 56 57 3. RECHNEN MIT ABBILDUNGEN heißt die Permutationsgruppe vom Grad n. Eine Permutation σ : {1, 2, . . ., n} → {1, 2, . . ., n} schreibt man oft in der Tabellenform 1 2 ... n . σ (1) σ (2) . . . σ (n) Sn hat genau n! = n(n − 1) · · ·2 · 1 Elemente. Graphisch kann man eine Permutation darstellen, indem man die Zahlen 1, 2, . . ., n anschreibt und für 1 ≤ i ≤ n einen Pfeil von i nach σ (i) zeichnet. Zum Beispiel hat 1 2 3 4 5 6 7 σ= 5 4 6 7 3 1 2 die folgende Darstellung: 6 3 6 ? 1 - 5 7 K A A A A A - 4 2 Da σ : {1, 2, . . ., n} → {1, 2, . . ., n} bijektiv ist, ist jede Zahl Anfangs- und Endpunkt von genau einem Pfeil. Definition 44 : Sei ` ∈ N , ` ≥ 2, und seien j1 , . . ., j` paarweise verschiedene Elemente von {1, . . . , n}. Dann heißt die Abbildung falls i 6∈ { j1 , . . . , j` }, i τ : {1, 2, . . ., n} → {1, 2, . . ., n} , i 7→ jk+1 falls i = jk mit k < `, j falls i = j` , 1 ein Zykel der Länge ` und wird mit ( j 1 , j2 , . . . , j ` ) bezeichnet. Ein Zykel der Länge 2 heißt eine Transposition oder Vertauschung von j1 und j2 . Zwei Zykel (i1 , . . ., ik ) und ( j1 , . . . , j` ) heißen disjunkt, wenn {i1 , . . . , ik } ∩ { j1 , . . . , j` } = 0/ ist. Satz 58 : Es seien (i1 , . . ., ik ) und ( j1 , . . . , j` ) zwei disjunkte Zykel. Es gilt: (i1 , . . ., ik )( j1 , . . ., j` ) = ( j1 , . . . , j` )(i1 , . . ., ik ) 58 3. RECHNEN MIT ABBILDUNGEN und ( j1 , j2 , . . . , j` )−1 = ( j` , j`−1 , . . ., j1 ) , insbesondere ist ( j1 , j2 )−1 = ( j2 , j1 ) = ( j1 , j2 ) . Beweis: Der Zykel (i1 , . . . , ik ) vertauscht nur Elemente in {i1 , . . . , ik }, der Zykel ( j1 , . . . , j` ) nur Elemente in { j1 , . . . , j` }. Daher spielt die Reihenfolge keine Rolle. Man prüft leicht nach, dass ( j` , j`−1 , . . ., j1 ) die Umkehrabbildung von ( j1 , j2 , . . . , j` ) ist. Definition 45 : Seien M eine Menge und f : M −→ M eine Abbildung. Ein Element x ∈ M heißt ein Fixpunkt von f , wenn f (x) = x ist. Satz 59 : Jede Permutation σ ∈ Sn ist Produkt paarweise disjunkter Zyklen ρ1 , . . . , ρm , die eindeutig bis auf die Reihenfolge sind. Die Darstellung σ = ρ 1 . . . ρm heißt die Zyklenzerlegung von σ . Jene Elemente i ∈ {1, 2, . . ., n}, die nicht in den Zyklen vorkommen, sind die Fixpunkte von σ . Beweis: Man startet mit J := {1, . . ., n} und wiederholt die folgende Prozedur, bis J leer ist: Wähle ein j ∈ J und berechne j, σ ( j), σ 2 ( j), σ 3 ( j), . . . solange, bis wieder j kommt. Dann ist entweder j ein Fixpunkt oder ( j, σ ( j), . . .) ein Zykel von σ . Streiche diese Elemente aus der Menge J. Definition 46 : Sei σ ∈ Sn eine Permutation mit p Fixpunkten und m Zyklen. Dann heißt die Zahl sign(σ ) := (−1)n−p−m das Vorzeichen oder Signum von σ . Da Idn keine Zyklen und n Fixpunkte hat, ist sign(Idn ) = 1 . Satz 60 : Jede Permutation σ ∈ Sn ist Produkt von Transpositionen τ1 , . . ., τr ∈ Sn , die im Allgemeinen nicht eindeutig bestimmt sind. Es gilt aber ( 1 falls r gerade ist, sign(σ ) = (−1)r = −1 falls r ungerade ist. 59 3. RECHNEN MIT ABBILDUNGEN Eine Permutation σ heißt gerade bzw. ungerade, wenn sign(σ ) = 1 bzw. −1 ist. Zum Beispiel ist die Identität gerade und jede Transposition ungerade. Beweis: Sei σ = ρ1 . . . ρm die Zyklenzerlegung von σ . Wegen (i1 , . . . , ik ) = (i1 , i2 )(i2 , i3 ) . . . (ik−1 , ik ) kann man jeden Zykel ρi als Produkt von Transpositionen schreiben und daher auch σ . Das Beispiel 1 2 3 = (12)(23) = (13)(12) 2 3 1 zeigt, dass diese Darstellung im Allgemeinen nicht eindeutig ist. Die Aussage sign(σ ) = (−1)r beweisen wir durch Induktion nach r. Für r = 0 ist σ die Identität und sign(σ ) = 1. Für r = 1 ist σ eine Transposition, hat also nur einen Zykel und n − 2 Fixpunkte, also ist sign(σ ) = (−1)n−(n−2)−1 = −1 . Sei nun r ≥ 2, τ1 = (i, j) und ρ := τ2 . . . τr . Dann ist zu zeigen, dass sign((i, j)ρ ) = − sign(ρ ) ist. Dazu untersuchen wir, wie sich die Transposition (i, j) auf die Zyklenzerlegung von ρ auswirkt, und unterscheiden 2 Fälle: (1) Die Elemente i und j liegen im gleichen Zykel ( j1 , . . . , j` ) von ρ , wobei wir dann j1 = i und jk = j mit 2 ≤ k ≤ ` annehmen können, d.h. ( j1 , . . . , j` ) = (i = j1 , . . . , jk−1 , j = jk , . . ., j` ) . Für k = 2 ist dann i ein Fixpunkt von (i, j)ρ , und für k ≥ 3 ist (i, j2 , . . ., jk−1 ) ein Zykel von (i, j)ρ . Für k < ` ist ( j, jk+1 , . . . , j` ) ein Zykel von (i, j)ρ , und für k = ` ist j ein Fixpunkt von (i, j)ρ . Ansonsten bleibt bei der Zyklenzerlegung von ρ alles gleich, sodass die Summe aus der Zahl der Fixpunkte und der Zahl der Zykel insgesamt um 1 steigt und sich damit das Vorzeichen ändert. (2) Im anderen Fall ist i oder j Fixpunkt von ρ oder i, j liegen in verschiedenen Zyklen (i1 , i2 , . . ., ik ) bzw. ( j1 , j2 , . . ., j` ) von ρ , wobei wir i1 = i bzw. j1 = j annehmen können. Dann ist (i = i1 , . . . , ik , j = j1 , . . ., j` ) ein Zykel von (i, j)ρ , sodass insgesamt die Summe aus der Zahl der Fixpunkte und der Zahl der Zykel um 1 fällt und wiederum sich das Vorzeichen ändert. Satz 61 : Für Permutationen σ , τ ∈ Sn gilt sign(σ τ ) = sign(σ ) · sign(τ ) . 60 3. RECHNEN MIT ABBILDUNGEN Beweis: Nach Satz 60 gibt es Transpositionen σ1 , . . . , σr und τ1 , . . . , τs mit σ = σ1 . . . σr bzw. τ = τ1 . . . τs . Dann ist σ τ = σ1 . . . σr τ1 . . . τs , also sign(σ τ ) = (−1)r+s = (−1)r (−1)s = sign(σ ) sign(τ ). 2. Polynomiale Abbildungen In diesem Abschnitt sei K ein Körper. Definition 47 : Seien n ∈ N und a0 , a1 , . . . , an ∈ K. Dann heißt die Abbildung n f : K → K , z 7→ a0 + a1 z + a2 z + · · · + an z = ∑ ai zi , 2 n i=0 eine polynomiale Abbildung von K nach K. Die Elemente a0 , . . ., an heißen Koeffizienten von f . Mit polynomialen Abbildungen sind mehrere grundlegende Aufgaben verbunden: • Auswerten einer polynomialen Abbildung f mit Koeffizienten a 0 , . . ., an in einem Element c von K: Berechne das Bild n f (c) = ∑ a i ci i=0 von c unter der polynomialen Abbildung f . Es ist klar, dass dieses Element von K immer durch Ausführen von Additionen und Multiplikationen in K berechnet werden kann. Darin liegt die rechneri” sche Bedeutung“ der polynomialen Abbildungen. • Interpolation durch eine polynomiale Abbildung: Gegeben sind eine endliche Teilmenge E von K und eine Abbildung g : E −→ K. Gesucht ist eine polynomiale Abbildung von K nach K, deren Einschränkung auf E gleich g ist. • Überprüfe die Gleichheit von zwei polynomialen Abbildungen: Zwei polynomiale Abbildungen seien durch ihre Koeffizienten gegeben. Wie kann man feststellen, ob diese zwei Abbildungen gleich sind? Die Antwort ist nicht so leicht: zum Beispiel sind die polynomialen Abbildungen f : Z 2 −→ Z 2 , z 7−→ z , und g : Z 2 −→ Z 2 , z 7−→ z2 , gleich. • Berechnen der Nullstellen einer polynomialen Abbildung f : Finde alle Elemente c ∈ K mit der Eigenschaft, dass f (c) = 0 ist. Einfacher zu beantwortende Fragen sind: Gibt es solche Elemente? Wenn ja, wieviele? 61 3. RECHNEN MIT ABBILDUNGEN Satz 62 : Es seien c ∈ K und f eine polynomiale Abbildung mit Koeffizienten a0 , . . ., an ∈ K. Mit dem folgenden Verfahren kann f (c) mit höchstens n Additionen und höchstens n Multiplikationen in K berechnet werden: • Setze i := n und w := an . • Solange i 6= 0 ist, ersetze i durch i − 1 und dann w durch w · c + a i . • Wenn i = 0 ist, dann ist f (c) = w. Beweis: n ∑ aici = (. . . ((anc + an−1 )c + an−2 )c + . . . + a1 )c + a0 . i=0 Definition 48 : Es sei A ein Ring und ein K-Vektorraum. Dann ist A eine K-Algebra, wenn für alle t ∈ K und alle a, b ∈ A t · (ab) = a(t · b) = (t · a)b ist. Eine Algebra ist kommutativ, wenn sie als Ring kommutativ ist. Beispiel 22 : Die Menge K n×n aller n × n-Matrizen mit Koeffizienten in K ist mit Addition, Skalarmultiplikation und Multiplikation von Matrizen eine K-Algebra. Sie ist nur dann kommutativ, wenn n = 1 ist. Satz 63 : Es seien M eine Menge und A := Abb(M, K) die Menge aller Abbildungen von M in den Körper K. Für f , g ∈ A und c ∈ K und x ∈ M sei ( f g)(x) := f (x)g(x) , ( f + g)(x) := f (x) + g(x) und (c · f )(x) := c( f (x)) . Mit den Rechenoperationen A × A −→ A , ( f , g) 7−→ f + g , A × A −→ A , ( f , g) 7−→ f g , K × A −→ A , (c, g) 7−→ c · g , (punktweise Addition, Multiplikation, Skalarmultiplikation) ist A eine kommutative K-Algebra. Beweis: Übung. Definition 49 : Es sei R ein Ring und S eine nichtleere Teilmenge von R. Dann ist S eine Unterring von R, wenn 1 ∈ S und für alle a, b ∈ S auch die Elemente a + b , −a und ab 62 3. RECHNEN MIT ABBILDUNGEN in S enthalten sind. Es sei A eine K-Algebra und B eine nichtleere Teilmenge von A. Dann ist B eine Unteralgebra von A, wenn B ein Unterring und ein Untervektorraum von A ist. Ein Unterring bzw. eine Unteralgebra ist mit den auf diese Teilmenge eingeschränkten Rechenoperationen selbst ein Ring bzw. eine Algebra. Satz 64 : Die Menge der polynomialen Abbildungen von K nach K ist eine K-Unteralgebra der Algebra Abb(K, K) aller Abbildungen von K nach K. Beweis: Seien f und g polynomiale Abbildungen und a0 , . . ., an bzw. b0 , . . . , bm ihre Koeffizienten. Für alle z ∈ K ist dann f (z) = ∑ni=0 ai zi und g(z) = ∑mj=1 b j z j . Daher ist für alle z ∈ K ! ! n ( f · g)(z) = f (z)g(z) = n =∑ m ∑ ai z i i=0 m ∑ b jz j j=0 n+m k k=0 i=0 ∑ aib j zi+ j = ∑ ∑ aibk−i i=0 j=0 ! zk , also f · g eine polynomiale Abbildung. Die anderen Eigenschaften einer Unteralgebra sind leicht nachzuprüfen. 63 3. RECHNEN MIT ABBILDUNGEN 3. Lineare Abbildungen In diesem Abschnitt seien V und W Vektorräume über einem Körper K. Definition 50 : Eine Abbildung f : V → W heißt K-linear, wenn die folgenden zwei Bedingungen erfüllt sind: (1) Für alle v, w ∈ V ist f (v + w) = f (v) + f (w) . (2) Für alle c ∈ K und für alle v ∈ V ist f (cv) = c f (v) . Beispiel 23 : Die Nullabbildung 0 : V → W , v 7→ 0W , und die Identität sind K-linear. IdV : V → V , v 7→ v , Beispiel 24 : Für jede Matrix A ∈ K m×n ist die Abbildung K n×1 → K m×1 , x 7→ Ax , K-linear. Später werden wir sehen, dass jede lineare Abbildung vom Vektorraum aller m-Spalten in den Vektorraum aller n-Spalten durch Multiplikation mit einer Matrix gegeben ist. Satz 65 : Seien f : V → W eine lineare Abbildung, (vi )i∈I eine Familie von Vektoren in V und (ci )i∈I eine Koeffizientenfamilie. Dann gilt f (∑ ci vi ) = ∑ ci f (vi ) , i∈I i∈I d.h. man kann eine lineare Abbildung durch die Linearkombination durch” ziehen“. Speziell ist f (0V ) = 0W und, für alle v ∈ V , f (−v) = − f (v) . Beweis: Sei J := {i ∈ I | ci 6= 0}. Dann kann die Behauptung umgeschrieben werden in f ( ∑ c j v j ) = ∑ c j f (v j ) , j∈J j∈J wobei jetzt alle Summen endlich sind. Wir beweisen diese Aussage durch Induktion nach ` := #(J) . 64 3. RECHNEN MIT ABBILDUNGEN Für ` = 1 ist f (c1 v1 ) = c1 f (v1 ) nach Definition. Sei nun ` > 1. Wir wählen ein Element k ∈ J und erhalten auf Grund der Linearität und der Induktionsannahme f ( ∑ c j v j ) = f (ck vk + ∑ c j v j ) = f (ck vk ) + f ( ∑ c j v j ) j∈J j6=k = ck f (vk ) + ∑ c j f (v j ) = j6=k j6=k ∑ c j f (v j ) , j∈J was den Induktionsbeweis beendet. Schließlich ist f (−v) = f ((−1K )v) = (−1K ) f (v) = − f (v) . Satz 66 : Seien U ein Vektorraum über K und f : U → V sowie g : V → W lineare Abbildungen. Dann gilt: (1) Die Zusammensetzung g ◦ f : U → W , u 7→ g( f (u)) , ist K-linear. (2) Wenn f bijektiv ist, dann ist die Umkehrabbildung f −1 : V → U auch K-linear. ( Die Zusammensetzung von linearen Abbildungen ist linear. Die Umkehr” abbildung einer bijektiven linearen Abbildung ist linear.“) Beweis: Für v, w ∈ U und c ∈ K ist (1) (g ◦ f )(v + w) = g( f (v + w)) = g( f (v) + f (w)) = g( f (v)) + g( f (w)) = (g ◦ f )(v) + (g ◦ f )(w), (g ◦ f )(cv) = g( f (cv)) = g(c f (v)) = cg( f (v)) = c(g ◦ f )(v), (2) f ( f −1 (v) + f −1 (w)) = ( f ◦ f −1 )(v) + ( f ◦ f −1 )(w) = v + w, also f −1 (v + w) = f −1 (v) + f −1 (w), und f (c f −1 (v)) = c( f ◦ f −1 )(v) = cv, also f −1 (cv) = c f −1 (v). Definition 51 : Eine lineare und bijektive Abbildung von V nach W heißt Isomorphismus von Vektorräumen. V und W heißen isomorph, wenn es einen Isomorphismus von V nach W (oder von W nach V ) gibt. Schreibweise: V ∼ = W. Satz 67 : (1) Jeder Vektorraum V über K der Dimension n ist zum Standard-Vektorraum K n isomorph. Nach Wahl einer Basis v := (v1 , . . ., vn ) erhält man einen Isomorphismus durch die Koordinaten-Abbildung V −→ K n , x 7→ Koordinatentupel von x bezüglich v . (2) Zwei endlich-dimensionale Vektorräume über K sind genau dann isomorph, wenn ihre Dimensionen gleich sind. 65 3. RECHNEN MIT ABBILDUNGEN Beweis: (1) Nach Satz 46 ist die Abbildung n K n → V , (c1 , . . . , cn ) 7→ ∑ ci vi , i=1 bijektiv. Man prüft leicht nach, dass sie auch linear ist. Nach Satz 66 ist dann die Koordinaten-Abbildung als Umkehrabbildung linear und bijektiv, also ein Isomorphismus. (2) Seien V , W endlich-dimensionale Vektorräume über K. Wenn V und W isomorph sind, dann gibt es eine bijektive lineare Abbildung f : V → W . Sei (v1 , . . . , vn ) eine Basis von V . Man prüft leicht nach, dass dann ( f (v1 ), . . ., f (vn )) eine Basis von W ist, also ist dimK (V ) = n = dimK (W ). Sei umgekehrt dimK (V ) = dimK (W ) =: n. Dann gibt es nach (1) Isomorphismen f : V → K n und g : W → K n . Nach Satz 66 ist dann auch g−1 ◦ f : V → W ein Isomorphismus. 4. Die Matrix einer linearen Abbildung In diesem Abschnitt seien V ein Vektorraum über K mit Dimension n ∈ N , v := (v1 , . . ., vn ) eine Basis von V , W ein Vektorraum über K mit Dimension m ∈ N und w := (w1 , . . . , wm ) eine Basis von W . Satz 68 : Seien u1 , . . . , un ∈ W . Dann gibt es genau eine lineare Abbildung f : V → W mit f (vi ) = ui , 1 ≤ i ≤ n . Somit kann eine lineare Abbildung zwischen Vektorräumen durch (beliebige) Vorgabe der Bilder einer Basis eindeutig definiert werden. Beweis: Wenn eine derartige Abbildung f existiert, dann ist für einen Vektor x = ∑ni=1 ci vi ∈ V n f (x) = f ( ∑ ci vi ) = i=1 n n i=1 i=1 ∑ ci f (vi) = ∑ ciui , was die Eindeutigkeit der Abbildung beweist. Um die Existenz einer solchen Abbildung zu zeigen, definieren wir eine Abbildung f : V → W durch n f (x) := ∑ ci u i , i=1 wobei c1 , . . ., cn ∈ K die Koordinaten von x ∈ V bezüglich der Basis v sind. Dann ist f K-linear, weil für x = ∑ni=1 ci vi , y = ∑ni=1 di vi und t ∈ K wegen x + y = ∑ni=1 (ci + di )vi und tx = ∑ni=1 (tci )vi n f (x + y) = ∑ (ci + di )ui = i=1 n n i=1 i=1 ∑ ciui + ∑ diui = f (x) + f (y) 66 3. RECHNEN MIT ABBILDUNGEN sowie f (tx) = n n i=1 i=1 ∑ tciui = t ∑ ciui ! = t f (x) ist. Schließlich gilt wegen v j = ∑ni=1 δi j vi für alle 1 ≤ j ≤ n: n f (v j ) = ∑ δi j ui = u j . i=1 Definition 52 : Seien y ∈ V und c1 , . . . , cn ∈ K die Koordinaten von y bei v1 , . . ., vn , also n y = ∑ ci vi . i=1 Dann heißt die Spalte c1 c := ... ∈ K n×1 cn die Koordinatenspalte von y bezüglich v. Definition 53 : Seien f : V → W eine K-lineare Abbildung und A1 j , . . . , Am j die Koordinaten von f (v j ) bezüglich w , d.h. m f (v j ) = ∑ Ai j wi , 1 ≤ j ≤ n . i=1 Dann heißt M( f , v, w) := (Ai j )1≤i≤m ∈ K m×n 1≤ j≤n die Matrix von f bezüglich der Basen v und w. Die j-te Spalte von M( f , v, w) ist also die Koordinatenspalte von f (v j ) bezüglich w. Im Spezialfall V = W und v = w schreibt man statt M( f , v, v) kurz M( f , v). Beispiel 25 : Für 1 ≤ j ≤ n ist IdV (v j ) = v j = n ∑ δi j vi i=1 und somit M(IdV , v) = In . Beispiel 26 : Sei A ∈ K m×n . Dann ist die Matrix der linearen Abbildung K n×1 → K m×1 , x 7→ Ax , 67 3. RECHNEN MIT ABBILDUNGEN bezüglich der Standardbasen e = (e1 , . . ., en ) von K n×1 und e0 = (e01 , . . . , e0m ) von K m×1 gleich A, weil für 1 ≤ j ≤ n m Ae j = A− j = ∑ Ai j e0i i=1 ist. Daher ist jede lineare Abbildung von K n×1 nach K m×1 durch Multiplikation mit einer eindeutig bestimmten Matrix A ∈ K m×n gegeben. Oft identifiziert man eine m × n-Matrix mit dieser linearen Abbildung. Satz 69 : Seien U ein Vektorraum über K der Dimensionen ` mit Basis u und f : V → W sowie g : W → U K-lineare Abbildungen. Dann ist M(g ◦ f , v, u) = M(g, w, u) · M( f , v, w) , d.h. der Zusammensetzung von linearen Abbildungen entspricht die Multiplikation der zugehörigen Matrizen. Beweis: Seien A := M( f , v, w) ∈ K m×n und B := M(g, w, u) ∈ K `×m . Dann ist für 1 ≤ j ≤ n m m (g ◦ f )(v j ) = g( f (v j )) = g( ∑ Ai j wi ) = ∑ Ai j g(wi ) i=1 i=1 m = ` ` m k=1 i=1 ∑ Ai j ∑ Bkiuk = ∑ ∑ BkiAi j i=1 k=1 ! uk ` = ∑ (BA)k j uk , k=1 also BA = M(g ◦ f , v, u). Satz 70 : Die lineare Abbildung f : V → W ist genau dann ein Isomorphismus, wenn die Matrix M( f , v, w) invertierbar ist. In diesem Fall ist M( f −1 , w, v) = M( f , v, w)−1 . Beweis: Wenn f ein Isomorphismus ist, dann ist nach Satz 66 die Umkehrabbildung f −1 linear und nach Satz 67 ist n = m. Aus f −1 ◦ f = IdV und f ◦ f −1 = IdW folgt nach Satz 69 und M( f −1 , w, v) · M( f , v, w) = M( f −1 ◦ f , v, v) = M(IdV , v, v) = In M( f , v, w) · M( f −1 , w, v) = M( f ◦ f −1 , w, w) = M(IdW , w, w) = Im . Wenn umgekehrt A := M( f , v, w) ∈ K m×n invertierbar ist, dann ist m = n und es existiert B := A−1 ∈ K n×n . Definiert man nach Satz 68 eine lineare 68 3. RECHNEN MIT ABBILDUNGEN Abbildung g : W → V durch n g(w j ) := ∑ Bi j vi i=1 für 1 ≤ j ≤ n, so folgt nach Satz 69 und M(g ◦ f , v, v) = M(g, w, v) · M( f , v, w) = BA = In = M(IdV , v, v) M( f ◦ g, w, w) = M( f , v, w) · M(g, w, v) = AB = In = M(IdW , w, w) . Daher ist g ◦ f = IdV und f ◦ g = IdW nach Satz 68, also f ein Isomorphismus und g = f −1 . Nach Wahl von Basen im Definitionsbereich und im Bildbereich einer linearen Abbildung ist diese eindeutig durch ihre Matrix bestimmt. Anstatt mit linearen Abbildungen kann mit den entsprechenden Matrizen gerechnet werden. Der Zusammensetzung von linearen Abbildungen entspricht die Matrizenmultiplikation, dem Berechnen der Umkehrabbildung entspricht das Invertieren von Matrizen. 69 3. RECHNEN MIT ABBILDUNGEN 5. Basiswechsel In diesem Abschnitt seien V ein Vektorraum über K mit Dimension n ∈ N , v := (v1 , . . ., vn ) eine Basis von V , W ein Vektorraum über K mit Dimension m ∈ N und w := (w1 , . . . , wm ) eine Basis von W . Definition 54 : Seien p und q positive ganze Zahlen und u := (u1 , . . . , u p ) ∈ V p ein p-Tupel von Vektoren in V . Für T ∈ K p×q sei p uT := (uT )1 , . . . , (uT )q := p ∑ Ti1ui, . . . , ∑ Tipui i=1 i=1 ! ∈ V q. Die Bezeichnung uT ist eine Merkhilfe, weil man analog zur Matrizenrechnung über K den Vektor (uT ) j nach der Regel Zeile u mal Spalte T− j“ ” berechnet. Beispiel 27 : Sei c ∈ K n×1 . Dann ist vc ∈ V und c ist die Koordinatenspalte von vc bezüglich v. Satz 71 : Seien p, q, r positive ganze Zahlen und u := (u1 , . . . , u p ) ∈ V p . Dann gilt: (1) uI p = u (2) Für T ∈ K p×q und U ∈ K q×r ist u(TU ) = (uT )U . (3) Für T ∈ GL p (K) und u0 := uT gilt u = u0 T −1 . Beweis: (1) gilt nach Definition, (2) rechnet man nach und (3) folgt aus u = uIm = u(T T −1 ) = (uT )T −1 = u0 T −1 . Satz 72 : Sei u := (u1 , . . . , uq ) ∈ V q . Dann gilt: (1) Es gibt genau eine Matrix T ∈ K n×q mit u = vT . Diese Matrix T heißt die Transformationsmatrix von v zu u, und die Spalten von T sind die Koordinatenspalten von u1 , . . . , uq bezüglich v. (2) Die Familie u ist genau dann eine Basis von V , wenn T invertierbar ist. Beweis: Übung. 70 3. RECHNEN MIT ABBILDUNGEN Beispiel 28 : Seien f : V → W eine K-lineare Abbildung und A := M( f , v, w) ∈ K m×n die Matrix von f bezüglich v und w. Dann ist A die Transformationsmatrix von w zu f (v) := ( f (v1 ), . . ., f (vn )), also f (v) = wA . Satz 73 : Seien u eine Basis von V und T ∈ GLn (K) die Transformationsmatrix von v zu u. Ist c die Koordinatenspalte von y ∈ V bezüglich v, dann ist T −1 c die Koordinatenspalte von y bezüglich w , d.h. bei Basiswechsel mit der Matrix T transformieren sich die Koordinaten“ mit der Matrix T −1 . ” Beweis: Es ist y = vc = (uT −1 )c = u(T −1 c). Satz 74 : Seien f : V → W eine K-lineare Abbildung, A := M( f , v, w) ∈ K m×n die Matrix von f bezüglich v und w und c ∈ K n×1 die Koordinatenspalte des Vektors y ∈ V bezüglich der Basis v , d.h. y = vc . Dann ist Ac ∈ K m×1 die Koordinatenspalte von f (u) bezüglich der Basis w, d.h. f (y) = w(Ac) . Beweis: Es ist n f (y) = f ( ∑ c j v j ) = j=1 m = ∑ i=1 n n ∑ c j f (v j ) = j=1 ! ∑ Ai j c j w i = j=1 n m j=1 i=1 ∑ c j ∑ Ai j w i m ∑ (Ac)iwi = w(Ac) . i=1 Satz 75 : Sei f : V → W eine K-lineare Abbildung mit Matrix A := M( f , v, w) ∈ K m×n . Seien v0 eine weitere Basis von V , w0 eine weitere Basis von W , T ∈ GLn (K) die Transformationsmatrix von v zu v0 und S ∈ GLm (K) die Transformationsmatrix von w zu w0 . Dann ist M( f , v0 , w0 ) = S−1 AT . 71 3. RECHNEN MIT ABBILDUNGEN Im Spezialfall V = W , v = w und v0 = w0 ist S = T und M( f , v0 ) = T −1 AT . Beweis: Nach Satz 74 ist für 1 ≤ j ≤ n f (v0j ) = f (vT− j ) = wAT− j = (wS)(S−1 AT− j ) = w0 (S−1 AT )− j . Definition 55 : Zwei Matrizen A, B ∈ K n×n heißen ähnlich, wenn es eine Matrix T ∈ GLn (K) gibt mit B = T −1 AT . Zum Beispiel sind nach Satz 75 die Matrizen M( f , v) und M( f , v0 ) einer linearen Abbildung f : V → V ähnlich. Satz 76 : Sei f : V → V eine K-lineare Abbildung mit Matrix A := M( f , v) ∈ K n×n . Wenn B ähnlich zu A ist, dann gibt es eine Basis v0 von V mit M( f , v0 ) = B . Beweis: Sei T ∈ GLn (K) so, dass B = T −1 AT ist. Setze v0 := vT . Nach Satz 75 ist dann M( f , v0 ) = T −1 AT = B. Ähnliche Matrizen beschreiben (bezüglich verschiedener Basen) dieselbe lineare Abbildung. Wird ein physikalisches Phänomen durch eine Abbildung von einem endlichdimensionalen Vektorraum V nach V beschrieben und diese (nach Wahl einer Basis von V ) durch eine Matrix, dann haben nur jene Eigenschaften dieser Matrix physikalische Bedeutung“, die sich ” beim Übergang zu einer ähnlichen Matrix nicht ändern. Ein Beispiel für eine solche Eigenschaft von Matrizen ist die Spur“. ” Definition 56 : Sei A ∈ K n×n . Dann heißt n spur(A) := ∑ Aii i=1 die Spur von A. Satz 77 : (1) Die Abbildung spur : K n×n −→ K ist linear. (2) Für A, B ∈ K n×n gilt: spur(AB) = spur(BA) . 72 3. RECHNEN MIT ABBILDUNGEN (3) Für A ∈ K n×n und T ∈ GLn (K) gilt: spur(T −1 AT ) = spur(A). (4) Seien V ein endlich-dimensionaler Vektorraum über K mit Basis v und f : V → V eine lineare Abbildung mit Matrix A bezüglich v. Dann ist spur( f ) := spur(A) unabhängig von der Wahl der Basis v und heißt Spur von f . Beweis: (1) und (2) nachrechnen, (3) folgt aus (2), (4) aus (3). KAPITEL 4 Polynome In diesem Kapitel wird mit K immer ein Körper bezeichnet. 1. Der Polynomring Definition 57 : Eine Folge (ci )i∈ N in K ist eine endliche Folge, wenn es nur endlich viele Indizes i mit ci 6= 0 gibt. Durch jede endliche Folge wird eine polynomiale Abbildung definiert. Im Computer wird man daher diese Abbildungen durch endliche Folgen darstellen. Allerdings können verschiedene endliche Folgen dieselbe polynomiale Abbildung definieren. Um den daraus entstehenden Problemen zu entgehen, betrachten wir zunächst statt der Abbildungen die endlichen Folgen. Wir definieren für sie Rechenoperationen, die den punktweisen Rechenoperationen für polynomiale Abbildungen entsprechen. Satz 78 : Die Menge P aller endlichen Folgen in K mit den Abbildungen + : P × P −→ P , · : P × P −→ P , ((ci )i∈ N , (di )i∈ N ) 7−→ (ci )i∈ N + (di )i∈ N := (ci + di )i∈ N , i ((ci )i∈ N , (di )i∈ N ) 7−→ (ci )i∈ N · (di )i∈ N := ( ∑ c j di− j )i∈ N , j=0 und · : K × P −→ P , (c, (di )i∈ N ) 7−→ c · (di )i∈ N := (cdi )i∈ N , ist eine kommutative K-Algebra. Sie heißt Polynomring über K oder Algebra der Polynome mit Koeffizienten in K. Ihre Elemente heißen Polynome mit Koeffizienten in K. Das Nullelement des Polynomringes ist die Folge 0 := (0, 0, 0, . . .), das Einselement ist die Folge 1 := (1, 0, 0, . . .). Beweis: Übung. Definition 58 : Es sei f = (c0 , c1 , c2 , . . .) 6= 0 ein Polynom mit Koeffizienten in K. Der Grad von f ist der größte Index i mit ci 6= 0 und wird mit 73 74 4. POLYNOME gr( f ) bezeichnet. Das Element ci heißt i-ter Koeffizient von f . Der Koeffizient cgr( f ) heißt Leitkoeffizient von f und wird mit lk( f ) bezeichnet. Das Polynom f heißt normiert, wenn lk( f ) = 1. Die folgende Schreibweise ist zweckmäßig: Wir wählen irgendein Symbol, zum Beispiel x, und schreiben gr( f ) c0 + c1 x + c2 x2 + . . . + cgr( f ) xgr( f ) = ∑ ci xi statt (c0 , c1 , c2 , . . .) . i=0 Wir sprechen dann von einem Polynom in der Variablen x mit Koeffizienten in K. Für den Polynomring über K schreiben wir dann K[x]. Wir identifizieren Polynome vom Grad 0 mit ihrem nullten Koeffizienten und fassen K so als Teilmenge von K[x] auf. Statt Polynom mit Koeffizienten in K“ schreiben wir im weiteren nur Po” ” lynom“. Satz 79 : Es seien f 6= 0, g 6= 0 Polynome. (1) (2) (3) (4) f g 6= 0 gr( f g) = gr( f ) + gr(g) und lk( f g) = lk( f ) · lk(g) Wenn f + g 6= 0, dann ist gr( f + g) ≤ max(gr( f ), gr(g)) . Das Polynom f ist genau dann invertierbar, wenn gr( f ) = 0 ist. Beweis: Übung . Satz 80 : (Division mit Rest von Polynomen) Es seien f und g Polynome und g 6= 0. Dann gibt es eindeutig bestimmte Polynome m und r mit den Eigenschaften f = m·g+r und (r = 0 oder gr(r) < gr(g)) . Die Polynome m bzw. r heißen polynomialer Quotient von f und g bzw. Rest von f nach Division durch g. Die Polynome m und r können mit dem folgenden Verfahren (Divisionsalgorithmus) berechnet werden: • Setze m := 0 und r := f . • Solange gr(r) ≥ gr(g) ist, ersetze m durch m + lk(r) · lk(g)−1xgr(r)−gr(g) und r durch r − lk(r) · lk(g)−1xgr(r)−gr(g) g . Beweis: Übung (analog dem Beweis des Satzes über die Division mit Rest von ganzen Zahlen). 75 4. POLYNOME Aus diesem Satz folgt, dass Polynomringe über Körpern und der Ring der ganzen Zahlen algebraisch betrachtet“ einander sehr ähnlich sind. ” Satz 81 : Es seien ( fi )i∈ N eine Familie von Polynomen so, dass für alle i∈ N gr( fi ) = i ist. Dann ist ( fi )i∈ N eine K-Basis des Polynomrings über K. Beweis: Sei (ci )i∈ N 6= 0 eine Koeffizientenfamilie in K. Sei k die größte Zahl so, dass ck 6= 0 ist. Wegen gr( fk ) = k ist ck · lk( fk ) = lk( ∑ ci fi ) 6= 0 , i∈ N also auch ∑i∈ N ci fi 6= 0. Daher ist ( fi )i∈ N linear unabhängig. Es sei h 6= 0 ein Polynom. Wir zeigen durch Induktion über gr(h), dass h eine K-Linearkombination von ( f i )i∈ N ist. Wenn gr(h) = 0 ist, dann ist h = lk(h) · lk( f 0)−1 · f0 . Sei j := gr(h) > 0. Division mit Rest von h durch f j ergibt h = m · f j + r mit r = 0 oder gr(r) < gr(h). Dann ist j = gr(h) = gr(m · f j ) = gr(m) + j , also gr(m) = 0 und m ∈ K. Nach Induktionsannahme ist r eine K-Linearkombination von ( fi )i∈ N , daher auch h. Beispiel 29 : Die Familie (xi )i∈ N ist eine K-Basis von K[x] . Für jedes Element a ∈ K ist ((x − a)i )i∈ N eine K-Basis von K[x] . Daher gibt es für jedes Polynom h ∈ K[x] mit n := gr(h) eindeutig bestimmte Elemente c0 , . . ., cn ∈ K so, dass n h= ∑ ci(x − a)i i=0 ist. 2. Nullstellen von Polynomen Definition 59 : Seien f = ∑ni=0 ci xi ∈ K[x] , A eine K-Algebra und a ∈ A. Dann ist n f (a) := ∑ ci a i ∈ A . i=0 Sprechweise: f (a) ∈ A erhält man durch Einsetzen von a in f . Das Element a ist genau dann eine Nullstelle von f in A, wenn f (a) = 0 ist. Die 76 4. POLYNOME polynomiale Abbildung n K −→ K , a 7−→ f (a) = ∑ ci ai , i=0 heißt die durch f definierte (polynomiale) Abbildung und wird oft wieder mit f bezeichnet. Definition 60 : Es seien f,g Polynome mit g 6= 0. Dann ist f Teiler von g (oder: f teilt g), wenn es ein Polynom h ∈ K[x] gibt mit g = f h. Das Polynom g heißt Vielfaches von f , wenn f ein Teiler von g ist. Satz 82 : (1) Ein Element a ∈ K ist genau dann Nullstelle eine Polynoms f ∈ K[x] , wenn das Polynom x − a ein Teiler von f ist. (2) Jedes von Null verschiedene Polynom f ∈ K[x] hat in K höchstens gr( f ) Nullstellen. (3) Es seien f und g Polynome mit f 6= g. Dann haben die Graphen (in K × K) der durch f und g definierten polynomialen Abbildungen höchstens max(gr( f ), gr(g)) gemeinsame Elemente. (4) Wenn K unendlich viele Elemente enthält, dann sind die Koeffizienten einer polynomialen Abbildung von K nach K eindeutig bestimmt. Insbesondere müssen in diesem Fall Polynome und polynomiale Abbildungen nicht unterschieden werden. Beweis: (1) Division mit Rest von f durch x − a ergibt f = m · (x − a) + r, wobei r = 0 oder gr(r) = 0, also r ∈ K ist. Daher ist f (a) = m(a) · 0 + r = r , somit ist f (a) = 0 genau dann, wenn r = 0 ist. (2) Wir beweisen die Aussage durch Induktion über n := gr( f ). Wenn n = 0 ist, dann hat f wegen f 6= 0 keine Nullstellen. Sei n > 0 und sei a ∈ K eine Nullstelle von f . Nach (1) gibt es ein Polynom h ∈ K[x] mit f = (x − a) · h. Dann ist gr(h) = n − 1, nach Induktionsvoraussetzung hat h daher höchstens n − 1 Nullstellen. Jede Nullstelle von (x − a) · h ist eine Nullstelle von h oder gleich a. Daraus folgt die Behauptung. (3) Die Menge der gemeinsamen Elemente der Graphen der durch f und g definierten Abbildungen ist {(a, f (a))| f (a) = g(a)} , ihre Anzahl ist daher die Anzahl der Nullstellen von f − g. Nach (2) ist diese höchstens max(gr( f ), gr(g)). 77 4. POLYNOME (4) Es seien f , g zwei Polynome so, dass für alle a ∈ K gilt: f (a) = g(a). Da K unendlich ist, hat dann f − g beliebig viele Nullstellen. Nach (2) ist daher f = g. 3. Interpolation In diesem Abschnitt seien t0 , . . . ,tn paarweise verschiedene Elemente von K und y0 , . . . , yn Elemente von K. Wir suchen ein Polynom f ∈ K[x] mit der Eigenschaft f (ti ) = yi , 0 ≤ i ≤ n . Ein solches Polynom heißt interpolierendes Polynom. Die Elemente t 0 , . . . ,tn heißen Stützstellen und y0 , . . . , yn Werte der Interpolationsaufgabe. Satz 83 : (Lagrange-Interpolation) Es gibt genau ein interpolierendes Polynom vom Grad ≤ n und zwar n ∑ yi · f i , i=0 wobei 1 · (x − t j ) ∈ K[x] j6=i ti − t j fi := ∏ ist, 0 ≤ i ≤ n . Beweis: Für 0 ≤ i, k ≤ n ist fi (tk ) = δik . Daher ist für 0 ≤ k ≤ n n n i=0 i=0 ( ∑ yi · fi )(tk ) = ∑ yi δik = yk . Der Grad von fi ist n, also ist der Grad von ∑ni=0 yi · fi kleiner oder gleich n. Wenn f und g interpolierende Polynome vom Grad ≤ n sind, dann sind die Elemente t0 , . . . ,tn Nullstellen von f − g. Aus Satz 82 folgt daher f = g. 78 4. POLYNOME Satz 84 : (Newton-Interpolation) Das interpolierende Polynom kann wie folgt berechnet werden: • Setze k := 0 und h0 := y0 . • Solange k < n ist, ersetze k durch k + 1, und setze yk − hk−1 (tk ) ck := k−1 ∏i=0 (tk − ti ) und k−1 hk := hk−1 + ck ∏ (x − ti ) . i=0 • Das interpolierende Polynom ist dann hn . Beweis: Übung. 4. Der Euklidische Algorithmus für Polynome Definition 61 : Es seien f1 , . . . , fn von Null verschiedene Polynome. Das normierte Polynom größten Grades, das f 1 , . . . , fn teilt, heißt größter gemeinsamer Teiler von f 1 , . . . , fn und wird mit ggT ( f1 , . . . , fn ) bezeichnet. Das normierte Polynom kleinsten Grades, das von f1 , . . . , fn geteilt wird, heißt kleinstes gemeinsames Vielfaches von f 1 , . . ., fn und wird mit kgV ( f1 , . . . , fn ) bezeichnet. Hilfssatz 7 : Es seien f , g, h Polynome, f 6= 0, g 6= 0 und f 6= h · g. Dann ist ggT ( f , g) = ggT ( f − h · g, g) . Beweis: Wenn t ein Teiler von f und g ist, dann gibt es Polynome u, v so, dass f = t · u und g = t · v ist. Daher ist f − h · g = t · u − h ·t · v = t · (u − h · v), also t auch ein Teiler von f − h · g. Satz 85 : (Euklidischer Algorithmus für Polynome) Es seien f , g Polynome, f 6= 0 und g 6= 0. Mit dem folgenden Verfahren kann der größte gemeinsame Teiler von f und g berechnet werden: • Solange keines der zwei Polynome ein Teiler der anderen ist, ersetze das Polynom größeren (oder gleichen) Grades durch seinen Rest nach Division durch das andere. • Wenn h, eines der zwei Polynome, ein Teiler des anderen ist, dann ist ggT ( f , g) = lk(h)−1 h. Beweis: Es seien a und b die Grade von f und g. Sei a ≥ b. Wenn f und g verschieden sind, wird f im nächsten Schritt durch ein Polynom kleineren 79 4. POLYNOME Grades ersetzt. Also liefert das Verfahren nach höchstens max(a, b) Schritten ein Ergebnis. In jedem Schritt wird ein Paar von Polynomen durch ein anderes ersetzt, nach Hilfssatz 7 aber so, dass die größten gemeinsamen Teiler der zwei Polynompaare gleich sind. Sobald eines der zwei Polynome das andere teilt, ist dieses c · ggT ( f , g), für ein 0 6= c ∈ K. Satz 86 : (Erweiterter Euklidischer Algorithmus) Es seien f , g Polynome, f 6= 0 und g 6= 0. Es gibt Polynome u, v so, dass u f + vg = ggT ( f , g) ist. Diese können mit dem folgenden Verfahren berechnet werden: • Setze A := (A1 , A2 , A3 ) := ( f , 1, 0) ∈ K[x] 3 und B := (B1 , B2 , B3 ) := (g, 0, 1) ∈ K[x] 3 . • Solange B1 das Polynom A1 nicht teilt, berechne den polynomialen Quotienten m von A1 und B1 und setze C := B, B := A − mC := (A1 − mC1 , A2 − mC2 , A3 − mC3 ) und A := C. • Wenn B1 das Polynom A1 teilt, dann ist u := lk(B1 )−1 · B2 und v := lk(B1 )−1 · B3 . Beweis: Wenn zwei Tripel von Polynomen S und T die Eigenschaft S1 = f · S 2 + g · S 3 bzw. T1 = f · T2 + g · T3 haben, dann auch alle Tripel S − hT mit h ∈ K[x] . Die ersten zwei Tripel im Algorithmus haben diese Eigenschaft, daher auch alle anderen auftretenden Tripel. Für die ersten Komponenten der Tripel wird der euklidische Algorithmus durchgeführt, für das letzte Tripel B gilt daher lk(B1 ) · ggT ( f , g) = f · B2 + g · B 3 . Satz 87 : (Berechnung von kgV ( f , g)) Es seien f , g Polynome, f 6= 0 und g 6= 0. Sei z := lk( f )−1 lk(g)−1 ∈ K. Dann ist z· f z·g kgV ( f , g) = ·g = ·f . ggT ( f , g) ggT ( f , g) Beweis: Es ist klar, dass ggTz·(ff ,g) · g = ggTz·g ( f ,g) · f ein Vielfaches von f und von g ist. Sei h ein Polynom, das Vielfaches von f und von g ist. Dann gibt es Polynome c, d mit h = c · f und h = d · g. Nach Satz 86 gibt es Polynome u, v so, dass u · f + v · g = ggT ( f , g) ist. Dann ist h= = u· f v·g u· f +v·g ·h = ·h+ ·h = ggT ( f , g) ggT ( f , g) ggT ( f , g) f ·g u· f ·d·g v·g·c· f + = · (u · d + v · c) = ggT ( f , g) ggT ( f , g) ggT ( f , g) 80 4. POLYNOME = ein Vielfaches von z· f ·g · z−1 · (u · d + v · c) ggT ( f , g) z· f ·g . ggT ( f , g) Satz 88 : ( Lösen einer linearen Gleichung, deren Koeffizienten Polynome ” sind“) Es seien f1 , . . . , fn von Null verschiedene Polynome, g := ggT ( f 1 , . . . , fn ) und h ein Polynom. Es ist ggT ( f1 , . . ., fn ) = ggT ( f1 , ggT ( f2 , ggT ( f3 , ggT (. . ., fn ) . . .)) , also kann der größte gemeinsame Teiler mehrerer Polynome durch sukzessives Berechnen des größten gemeinsamen Teilers von je zwei Polynomen berechnet werden. Es gibt genau dann ein n-Tupel (x1 , . . . , xn ) von Polynomen mit f 1 · x1 + . . . + f n · xn = h , wenn h ein Vielfaches von g ist. In diesem Fall kann ein solches n-Tupel wie folgt berechnet werden: • Berechne mit Satz 86 Polynome u1 , . . . , un so, dass f1 · u1 + . . . + fn · un = g ist. • Setze xi := ui · hg , 1 ≤ i ≤ n. Beweis: Für jedes n-Tupel (x1 , . . . , xn ) von Polynomen wird f 1 · x1 + . . . + fn · xn von g geteilt. Also ist die Bedingung, dass h ein Vielfaches von g ist, notwendig für die Existenz einer Lösung. Wenn diese Bedingung erfüllt ist, ist leicht nachzuprüfen, dass (u1 · gh , . . . , un · hg ) eine Lösung ist. 5. Irreduzible Polynome Definition 62 : Ein Polynom f ∈ K[x] ist genau dann irreduzibel, wenn f 6∈ K ist und wenn f in K[x] keine Teiler hat, deren Grad größer als 0 und kleiner als gr( f ) ist. Beispiel 30 : Alle Polynome mit Grad 1 sind irreduzibel. Hilfssatz 8 : Es sei f ∈ K[x] ein irreduzibles Polynom mit Koeffizienten in einem Körper K. Wenn f das Produkt zweier Polynome teilt, dann auch eines dieser zwei Polynome. Beweis: Es seien g, h ∈ K[x] so, dass f das Polynom gh teilt. Wir nehmen an, dass f das Polynom g nicht teilt. Weil f irreduzibel ist, ist dann 81 4. POLYNOME ggT ( f , g) = 1. Nach Satz 86 gibt es Polynome u, v mit u f + vg = 1. Weil f ein Teiler von u f h und vgh ist, teilt es auch h = 1 · h = u f h + vgh. Satz 89 : Zu jedem Polynom f ∈ K[x] mit positivem Grad gibt es bis auf die Reihenfolge eindeutig bestimmte normierte irreduzible Polynome f 1 , . . ., fn so, dass n f = lk( f ) ∏ fi i=1 ist. Beweis: Es sei 0 6= f ∈ K[x] ein Polynom mit positivem Grad. Wir zeigen die Existenz einer Zerlegung in irreduzible Faktoren durch Induktion über gr( f ). Wenn gr( f ) = 1 ist, dann ist f irreduzibel. Wenn gr( f ) > 1 ist, dann ist f entweder irreduzibel oder es gibt Polynome g, h mit positivem Grad so, dass f = gh ist. Dann sind die Grade von g und h aber kleiner als der von f . Nach Induktionsannahme sind g und h Produkte von irreduziblen Elementen, also auch f . Wenn f = p1 p2 . . . pn und f = q1 q2 . . . qm zwei Zerlegungen von f in irreduzible Elemente sind, dann gibt es nach Hilfssatz 8 einen Index j so, dass q j das irreduzible Polynom pn teilt. Es gibt also ein invertierbares Element u in K[x] so, dass pn = uq j ist. Daher ist g := up1 p2 . . . pn−1 = ∏ qi . 1≤i≤m, i6= j Der Grad von g ist kleiner als der von f , daher folgt aus der Induktionsannahme die Eindeutigkeit der irreduziblen Faktoren von g bis auf die Reihenfolge und Assoziiertheit. Wegen pn = uq j folgt daraus die Behauptung. Satz 90 : In jedem Polynomring über einem Körper gibt es unendlich viele normierte irreduzible Polynome. Wenn K ein Körper mit endlich vielen Elementen ist, gibt es zu jeder natürlichen Zahl n unendlich viele normierte irreduzible Polynome in K[x] , deren Grad größer als n ist. Beweis: Wenn es nur endlich viele normierte irreduzible Polynome gäbe, dann wäre ihr Produkt q ein Polynom und der Grad von q + 1 wäre größer (oder gleich, wenn es nur ein normiertes irreduzibles Polynom gibt) als der jedes irreduziblen Polynoms. Insbesondere wäre q + 1 kein normiertes irreduzibles Polynom. Nach Satz 89 gibt es ein normiertes irreduzibles Polynom p, das q + 1 teilt. Da p auch q teilt, würde p dann auch 1 teilen, 82 4. POLYNOME Widerspruch. Wenn K ein endlicher Körper und n eine natürliche Zahl ist, gibt es nur endlich viele Polynome, deren Grad kleiner oder gleich n ist. Daraus folgt die zweite Behauptung. 6. Die Anzahl der Nullstellen eines Polynoms Im Satz 82 wurde eine obere Schranke für die Anzahl der Nullstellen eines Polynoms angegeben, diese kann aber viel zu groß sein. Zum Beispiel hat das Polynom xn für jedes n ∈ N in K nur eine Nullstelle. Definition 63 : Es seien f 6= 0 ein Polynom mit Koeffizienten in K und a eine Nullstelle von f in K. Die Vielfachheit der Nullstelle a von f ist die größte ganze Zahl n mit der Eigenschaft, dass (x − a)n ein Teiler von f ist. Eine Nullstelle ist einfach, wenn ihre Vielfachheit 1 ist, und mehrfach, wenn ihre Vielfachheit größer als 1 ist. Satz 91 : Die Abbildung D : K[x] −→ K[x] , n n i=0 i=1 ∑ cixi 7−→ ∑ icixi−1 heißt Differentiation oder Ableitung. Sie ist K-linear und erfüllt die Produktregel für alle Polynome f , g ist D( f · g) = f · D(g) + D( f ) · g . Insbesondere ist für alle positiven ganzen Zahlen k und alle Polynome f ∈ K[x] D( f k ) = k · f k−1 · D( f ) . Beweis: Übung. Definition 64 : Für c ∈ K und a ∈ Z sei a · c := vz(a)c + . . . + vz(a)c . | {z } |a| Summanden Wenn für alle positiven ganzen Zahlen n gilt: n · 1 6= 0, dann ist K ein Körper der Charakteristik 0. Schreibweise: char(K) = 0. Wenn es eine positive ganze Zahl n mit n · 1 = 0 gibt und p die kleinste positive ganze Zahl mit dieser Eigenschaft ist, dann ist K ein Körper der Charakteristik p. Schreibweise: char(K) = p. Es ist leicht zu sehen, dass p in diesem Fall eine Primzahl sein muss. 83 4. POLYNOME Beispiel 31 : Q hat Charakteristik 0, Z p hat Charakteristik p. Satz 92 : Es sei f 6= 0 ein Polynom. (1) Ein Element a ∈ K ist genau dann eine mehrfache Nullstelle von f , wenn f (a) = 0 und D( f )(a) = 0 ist. (2) Wenn char(K) = 0 ist, dann hat das Polynom f ggT ( f , D( f )) nur einfache Nullstellen und zwar genau die Nullstellen von f . (3) Wenn char(K) = 0 ist, dann hat das Polynom f höchstens gr( f ) − gr(ggT ( f , D( f ))) Nullstellen in K. Beweis: (1) Wenn a eine mehrfache Nullstelle von f ist, dann gibt es ein Polynom h ∈ K[x] so, dass f = (x − a)2 · h. Dann ist D( f ) = 2(x − a) · h + (x − a)2 · D(h) = = (x − a) · (2h + (x − a) · D(h)) , also a eine Nullstelle von D( f ). Sei nun umgekehrt a eine Nullstelle von f und von D( f ). Wir dividieren f mit Rest durch (x − a)2 : f = m · (x − a)2 + r , gr(r) < 2 . Dann ist D( f ) = D(m) · (x − a)2 + 2m · (x − a) + D(r) . Aus f (a) = 0 folgt 0 = r(a), also ist r = 0 oder r = lk(r) · (x − a). Aus D( f )(a) = 0 folgt D(r) = 0. Daher ist r = 0 und (x − a)2 ein Teiler von f . (2) Sei a eine Nullstelle von f und n ihre Vielfachheit. Dann gibt es ein Polynom h mit f = (x − a)n · h und h(a) 6= 0. Wegen D( f ) = n · (x − a)n−1 · h + (x − a)n · D(h) = = (x − a)n−1 · (n · h + (x − a) · D(h)) wird ggT ( f , D( f )) von (x − a)n−1 geteilt. Wegen h(a) 6= 0 und weil char(K) = 0 ist, wird n · h + (x − a) · D(h) nicht von (x − a) geteilt. Somit werden D( f ) und ggT ( f , D( f )) nicht von (x − a)n geteilt. Daher ist a eine einfache Nullstelle von ggT ( f f,D( f )) . (3) folgt aus (2). 84 4. POLYNOME 7. Polynome in mehreren Variablen Es sei n eine positive ganze Zahl. Zur Erinnerung: Eine Familie (ci )i∈ N n in K ist eine Koeffizienten-Familie mit Indexmenge N n , wenn es nur endlich viele Indizes i ∈ N n mit ci 6= 0 gibt. Auf N n betrachten wir die komponentenweise Addition: für i, j ∈ N n ist i + j := (i1 , . . ., in ) + ( j1 , . . ., jn ) := (i1 + j1 , . . . , in + jn ) . Für jedes k ∈ N n gibt es nur endliche viele Paare (i, j) ∈ N n × N n mit der Eigenschaft i + j = k. Satz 93 : Die Menge Pn aller Koeffizienten-Familien in K mit Indexmenge N n zusammen mit den Abbildungen + : Pn × Pn −→ Pn , ((ci )i∈ N n , (di )i∈ N n ) 7−→ (ci )i∈ N n + (di )i∈ N n := (ci + di )i∈ N n , · : Pn × Pn −→ Pn , ((ci )i∈ N n , (di )i∈ N n ) 7−→ (ci )i∈ N n · (di )i∈ N n := ( ∑ i, j∈ N n ,i+ j=k ci d j )k∈ N , und · : K × Pn −→ Pn , (c, (di )i∈ N n ) 7−→ c · (di)i∈ N n := (cdi )i∈ N n , ist eine kommutative K-Algebra. Sie heißt Polynomring (in n Variablen) über K oder Algebra der Polynome (in n Variablen) mit Koeffizienten in K. Ihre Elemente heißen Polynome in n Variablen mit Koeffizienten in K. Das Nullelement des Polynomringes in n Variablen ist die Familie 0 := (0)i∈ N n , das Einselement ist die Familie 1 := (δi0 )i∈ N n . Beweis: Übung. Definition 65 : Der Betrag eines Elementes i ∈ N n ist die Zahl |i| := |(i1 , . . . , in )| := i1 + i2 + . . . + in . Es sei f = (ci )i∈ N n 6= 0 ein Polynom mit Koeffizienten in K. Der Grad von f oder Totalgrad von f ist die größte Zahl in { |i| | i ∈ N n , ci 6= 0} und wird mit gr( f ) bezeichnet. Das Polynom f heißt homogen vom Grad d ∈ N , wenn für alle i ∈ N n mit ci 6= 0 gilt: |i| = d. 85 4. POLYNOME Die folgende Schreibweise ist zweckmäßig: Wir wählen n Symbole, zum Beispiel x1 , . . . , xn , und schreiben ∑ n ci xi ∑ oder i1 ,...,in i∈ N ci1 ...in xi11 xi22 . . . xinn statt (ci )i∈ N n . Wir sprechen dann von einem Polynom in den Variablen x1 , . . . , xn mit Koeffizienten in K. Für den Polynomring über K schreiben wir dann K[x 1 , . . . , xn ] oder, wenn n fest gewählt ist, K[x]. Wir identifizieren Polynome vom Grad 0 mit ihren nullten Koeffizienten und fassen K so als Teilmenge von K[x 1 , . . . , xn ] auf. Die Polynome x j := (δi j )i∈ N n , heißen Potenzprodukte in n Variablen. j ∈ Nn , Satz 94 : Die Familie der Potenzprodukte (xi )i∈ N n ist eine K-Basis von K[x1 , . . . , xn ]. Beweis: Übung. Definition 66 : Es seien f := ∑ i1 ,...,in ci1 ...in xi11 xi22 . . . xinn ∈ K[x1 , x2 , . . . , xn ] ein Polynom und a := (a1 , . . . , an ) ein n-Tupel von Elementen einer KAlgebra A. Dann ist f (a) := ∑ i1 ,...,in ci1 ...in ai11 ai22 . . . ainn ein Element von A. Das n-Tupel a ist eine Nullstelle von f in An , wenn f (a) = 0 ist. Die Abbildung K n −→ K , z 7−→ f (z) , heißt die durch f definierte polynomiale Abbildung und wird meistens wieder mit f bezeichnet. Definition 67 : Ein System von polynomialen Gleichungen über K ist gegeben durch eine Teilmenge M ⊆ K[x1 , x2 , . . ., xn ]. Gesucht ist die Menge NK n (M) := {z ∈ K n | für alle f ∈ M ist f (z) = 0} aller gemeinsamen Nullstellen der Polynome in M. Diese heißt Nullstellenmenge von M. Eine Teilmenge N von K n ist eine algebraische Menge, wenn sie die Nullstellenmenge einer Teilmenge von K[x1 , x2 , . . . , xn ] ist. 86 4. POLYNOME Satz 95 : Beliebige Durchschnitte und endliche Vereinigungen von algebraischen Mengen sind wieder algebraisch. Genauer formuliert: Wenn N1 , N2 , . . . ⊆ K n die Nullstellenmengen von M1 , M2 , . . . ⊆ K[x1 , . . . , xn ] sind, dann ist \ i∈ N und k [ i=1 Ni = N K n ( [ Mi ) i∈ N Ni = NK n ({ f1 · f2 · . . . · fk | fi ∈ Mi , 1 ≤ i ≤ k}) . Beweis: Übung. Beispiel 32 : Die Nullstellenmenge von x21 − x22 in K 2 ist die Vereinigung der zwei Geraden NK 2 (x1 + x2 ) und NK 2 (x1 − x2 ). Die Nullstellenmenge von {x1 + x2 , x1 − x2 } ist der Punkt {(0, 0)}, der Durchschnitt dieser zwei Geraden. KAPITEL 5 Erweiterungen des Zahlenbereichs In diesem Kapitel wird mit K immer ein Körper bezeichnet. 1. Algebraische Elemente und Minimalpolynome In diesem Abschnitt sei A eine K-Algebra. Definition 68 : Ein Element a ∈ A ist algebraisch über K, wenn es Nullstelle eines Polynoms f 6= 0 in K[x] ist. Beispiel 33 : Die Matrix 0 −1 ∈ Q 2×2 1 0 ist eine Nullstelle des Polynoms x2 + 1 ∈ Q [x], also algebraisch über Q . Definition 69 : Es seien a ein über K algebraisches Element von A. Das normierte Polynom kleinsten Grades in K[x], das a als Nullstelle hat, heißt Minimalpolynom von a über K. Satz 96 : Es seien a ein über K algebraisches Element in A, dessen Minimalpolynom f ∈ K[x] irreduzibel ist. (1) Wenn g ∈ K[x] ein irreduzibles normiertes Polynom mit g(a) = 0 ist, dann ist f = g. (2) Es sei n der Grad von f . Dann ist (1, a, a2 , . . . , an−1 ) eine K-Basis von K[a] := {h(a) | h ∈ K[x] }. i Wenn r = ∑n−1 i=0 ci x der Rest von h ∈ K[x] nach Division durch f ist, dann ist (c0 , . . . , cn−1 ) das n-Tupel der Koordinaten von h(a) bezüglich der Basis (1, a, a2 , . . . , an−1 ). (3) Die kommutative Unteralgebra K[a] von A ist ein Körper. Es seien h ∈ K[x] und h(a) 6= 0. Die Koordinaten von h(a)−1 ∈ K[a] bezüglich der Basis (1, a, . . ., an−1 ) können wie folgt berechnet werden: 87 88 5. ERWEITERUNGEN DES ZAHLENBEREICHS – Berechne mit dem erweiterten Euklidischen Algorithmus Polynome u, v ∈ K[x] so, dass u f + vh = 1 ist. i – Berechne den Rest ∑n−1 i=0 di x von v nach Division durch f . – Dann ist (d0 , . . . , dn−1 ) das gesuchte n-Tupel der Koordinaten von h(a)−1 . Beweis: (1) Es sei r der Rest von g nach Division durch f . Dann ist a auch eine Nullstelle von r. Wegen r = 0 oder gr(r) < gr( f ) folgt aus der Definition des Minimalpolynoms, dass r = 0 ist. Also wird das irreduzible Polynom g von f geteilt, aus lk(g) = 1 = lk( f ) folgt daher f = g. (2) Es seien h ∈ K[x] und m bzw. r der polynomiale Quotient bzw. Rest von h nach Division durch f . Dann ist h(a) = m(a) · f (a) + r(a) = r(a) , also ist h(a) eine K-Linearkombination von (1, a, . . ., an−1 ). Wäre (1, a, . . ., an−1 ) nicht linear unabhängig, dann gäbe es ein n-Tupel i 0 6= (d0 , . . ., dn−1 ) in K n mit ∑n−1 i=0 di a = 0. Dann wäre aber a die i Nullstelle des Polynoms 0 6= ∑n−1 i=0 di x , dessen Grad kleiner als der von f ist. Widerspruch. (3) Es seien h ∈ K[x] und h(a) 6= 0. Nach (2) können wir annehmen, dass der Grad von h kleiner als n ist (falls nicht, ersetzen wir h durch seinen Rest nach Division durch f ). Dann wird h nicht von f geteilt. Weil f irreduzibel ist, ist daher ggT ( f , h) = 1. Mit dem erweiterten Euklidischen Algorithmus können daher Polynome u, v ∈ K[x] so berechnet werden, dass u f + vh = 1 ist. Dann ist v(a) ∈ K[a] und 1 = u(a) · f (a) + v(a) · h(a) = 0 + v(a) · h(a) , also h(a) invertierbar und h(a)−1 = v(a). Wenn das Minimalpolynom eines algebraischen Elementes a bekannt ist, dann kann am Computer in K[a] exakt gerechnet werden (wobei vorausgesetzt werden muss, dass man in K exakt rechnen kann). Die Elemente von K[a] werden durch n-Tupel in K n dargestellt, und die Rechenoperationen werden mit Hilfe der Aussagen (2) und (3) von Satz 96 ausgeführt. Die erste Aussage von Satz 96 kann verwendet werden, um das Minimalpolynom zu finden: es muss zunächst irgendein normiertes Polynom f , dessen Nullstelle a ist, gegeben sein. Dann wird überprüft, ob f irreduzibel ist. Wenn es irreduzibel ist, dann ist f das Minimalpolynom von a . Wenn nicht, müssen wir einen Faktor g kleineren Grades mit g(a) = 0 finden und mit diesem von Neuem beginnen. Es gibt Verfahren zur effizienten Faktorisierung von Polynomen, diese übersteigen aber den Rahmen dieser Vorlesung. 89 5. ERWEITERUNGEN DES ZAHLENBEREICHS √ Beispiel 34 : Es sei 3 2 die positive reelle Zahl, die Nullstelle von x3 − 2 ist. Wenn das Polynom x3 − 2 nicht irreduzibel über Q wäre, dann hätte es einen Faktor vom Grad 1. Dieses Polynom hat aber keine Nullstelle in Q (Übung), also auch keinen Faktor vom Grad 1. Daher ist x3 − 2 das Mini√ √ √ √ 3 3 3 3 (1, 2, 4) ist eine Q -Basis von Q [ 2]. malpolynom von 2 über Q und √ √ 3 3 −1 Um die Koordinaten von (1 + 2 2 + 3 4) bezüglich dieser Basis zu berechnen, verwenden wir Satz 96. Es ist (−3x − 50)(x3 − 2) + (x2 + 16x − 11)(3x2 + 2x + 1) = 89 , also √ √ −11 16 √ 1√ 3 3 3 3 + (1 + 2 2 + 3 4)−1 = 2+ 4. 89 89 89 Schreibt man dieses Ergebnis in der Form √ √ 1 −11 + 16 3 2 + 3 4 √ √ = 89 (1 + 2 3 2 + 3 3 4) an, so wird diese Berechnung oft als Rationalmachen des Nenners“ be” zeichnet. 2. Existenz von Nullstellen In diesem Abschnitt sei f ∈ K[x] ein irreduzibles normiertes Polynom. Definition 70 : Eine Körper L, der K als Unterring enthält, heißt Körpererweiterung von K. Eine Körpererweiterung K ⊆ L ist endlich, wenn L als K-Vektorraum endlichdimensional ist. Die Dimension dieses Vektorraums heißt Grad der Körpererweiterung. Ein irreduzibles Polynom f ∈ K[x] hat in K keine Nullstellen, daher sucht man eine endliche Körpererweiterung K ⊆ L von möglichst kleinem Grad, sodass das Polynom in L eine Nullstelle hat. Dazu gibt es zwei Möglichkeiten: (1) Man sucht in einer bereits bekannten K-Algebra A nach einer Nullstelle a von f . Wenn man sie findet, dann ist K ⊆ K[a] die gesuchte Körpererweiterung. (2) Man konstruiert eine endliche Körpererweiterung, in der f eine Nullstelle haben muss. Beispiel 35 : Wenn K = Q und f = x2 + 1 ist, dann hat f in der Q -Algebra Q 2×2 die Nullstelle 0 −1 i := . 1 0 90 5. ERWEITERUNGEN DES ZAHLENBEREICHS a −b Also ist Q ⊆ Q [i] := {aI2 + bi = | a, b ∈ Q } eine Körpererweib a terung vom Grad 2. Eine allgemeine Methode zur Konstruktion einer endlichen Körpererweiterung von kleinstmöglichem Grad, in der f eine Nullstelle hat, liefert der folgende Satz 97 : Es seien f ∈ K[x] irreduzibel, n := gr( f ) und V der von 1, x, x2 , . . . , xn−1 erzeugte Untervektorraum von K[x]. Mit der Multiplikation · : V ×V −→ V , (g, h) 7−→ Rest von gh nach Division durch f , wird V zu einer K-Algebra, die sogar eine Körpererweiterung von K (vom Grad n) ist. Das Element x ∈ V ist eine Nullstelle von f in V . Das zu h ∈ V inverse Element kann wie folgt berechnet werden: • Berechne mit dem erweiterten Euklidischen Algorithmus Polynome u, v ∈ K[x] so, dass u f + vh = 1 ist. • Der Rest von v nach Division durch f ist das zu h inverse Element. Beweis: Übung. Beispiel 36 : Seien K = Q , f = x2 + 1 und V := Q h1, xi. Wir betrachten V wie in Satz 97 als zweidimensionale Körpererweiterung von Q . Dann hat f in V die Nullstelle i := x. Definition 71 : Ein Körper K ist algebraisch abgeschlossen, wenn jedes Polynom in K[x] mit positivem Grad eine Nullstelle in K hat. Eine Körpererweiterung K ⊆ L von K heißt algebraischer Abschluss von K, wenn L algebraisch abgeschlossen ist und jedes Element von L algebraisch über K ist. 91 5. ERWEITERUNGEN DES ZAHLENBEREICHS Satz 98 : Jeder Körper hat einen algebraischen Abschluss. Ein algebraischer Abschluss von Q heißt Körper der algebraischen Zahlen. Beweis: wird weggelassen. Manche Eigenschaften von Polynomen sind besonders einfach zu beschreiben, wenn der Koeffizientenkörper algebraisch abgeschlossen ist: Satz 99 : Ein Polynom mit Koeffizienten in einem algebraisch abgeschlossenen Körper K ist genau dann in K[x] irreduzibel, wenn sein Grad 1 ist. Insbesondere gilt: Wenn f ∈ K[x] positiven Grad hat und z1 , . . . , zn die Nullstellen von f in K sind, dann gibt es eindeutig bestimmte positive ganze Zahlen e1 , . . . , en so, dass n f = lk( f ) ∏(x − zi )ei i=1 ist. Beweis: Wenn K algebraisch abgeschlossen ist, hat jedes Polynom in K[x] mit positivem Grad in K eine Nullstelle. Wenn z eine Nullstelle eines irreduziblen Polynoms f ist, dann wird f von x − z geteilt. Daher muss f = lk( f )(x − z) sein. Die zweite Aussage folgt nun aus Satz 89. Satz 100 : Es sei K ein algebraisch abgeschlossener Körper der Charakteristik 0. Dann hat ein Polynom 0 6= f ∈ K[x] genau gr( f ) − gr(ggT ( f , D( f )) (paarweise verschiedene) Nullstellen. Beweis: Folgt aus Satz 92 und Satz 99. 92 5. ERWEITERUNGEN DES ZAHLENBEREICHS 3. Endliche Körper In diesem Abschnitt seien p eine positive Primzahl und L ein endlicher Körper der Charakteristik p. Wir identifizieren n̄ ∈ Zp und n · 1L ∈ L und fassen Z p so als Unterkörper von L auf. Wir bezeichnen mit m die Dimension von L als Vektorraum über Z p . Dann kann jedes Element von L eindeutig durch ein m-Tupel von Elementen in Z p dargestellt werden. Insbesondere ist pm die Anzahl der Elemente von L. Beispiel 37 : Das Polynom x2 +x+1 ist über Z 2 irreduzibel, also ist Z 2 h1, xi mit der in Satz 97 definierten Multiplikation ein Körper der Charakteristik 2 mit 4 Elementen. Seine Elemente sind 0, 1, x und x + 1. Es ist x · (1 + x) = 1, x2 = x + 1 und (x + 1)2 = x. Satz 101 : (1) Für alle positiven ganzen Zahlen m gibt es einen Körper L mit q := pm Elementen. Er wird häufig als Galoiskörper GF(q) bezeichnet. (2) Jedes Element von L ist Nullstelle von xq − x. m (3) Das Polynom x p − x hat irreduzible Faktoren vom Grad m. m (4) Sei f ein irreduzibler Faktor vom Grad m von x p − x. Dann kann GF(q) wie in Satz 97 als Körpererweiterung von Z p , die eine Nullstelle von f enthält, konstruiert werden. Beweis: wird weggelassen. Beispiel 38 : Ein linearer (n,k)-Code ist ein k-dimensionaler Untervektorraum eines n-dimensionalen Vektorraums über einem endlichen Körper L. Seine Elemente heißen Worte des Codes. Wenn q = pm die Anzahl der Elemente von L ist, dann enthält ein linearer (n, k) − Code über L genau qk = pm·k Worte. KAPITEL 6 Eigenwertprobleme In diesem Kapitel sei K ein Körper. 1. Eigenwerte und Eigenvektoren Beispiel 39 : Zwei Gewichte mit Masse m hängen hintereinander an zwei Federn mit Federkonstante k. H H H H H H X X X X X X @ @ @ @ @ @ x1 ? x2 H H H H H H ? Nach den Gesetzen der Mechanik gilt für die Auslenkungen aus der Ruhelage x1 bzw. x2 des ersten bzw. zweiten Gewichts mx001 + kx1 − k(x2 − x1 ) = 0 mx002 + k(x2 − x1 ) = 0 , wobei 00 die zweite Ableitung nach der Zeit bezeichnet. In Matrizenform umgeschrieben erhält man 00 2k −k x1 x1 = 0. m 00 + −k k x2 x2 Wir untersuchen nun die Frage, ob es eine Schwingung der Form x1 (t) = a1 sin(ω t) x2 (t) = a2 sin(ω t) 93 94 6. EIGENWERTPROBLEME gibt, wobei a1 , a2 die Amplituden sind und ω die Frequenz ist. In diesem Fall wäre a1 2k −k a1 2 −mω sin(ω t) + sin(ω t) =0 a2 a2 −k k für alle reellen Zahlen t, also 2k −k a1 2 a1 . = mω −k k a2 a2 Daher suchen wir Spalten, die durch Multiplikation mit einer vorgegebenen Matrix in ein skalares Vielfaches übergehen (Fortsetzung in Beispiel 43). Definition 72 : Seien V ein Vektorraum über K und f : V → V eine lineare Abbildung. (1) Ein Vektor u ∈ V heißt Eigenvektor von f , wenn u 6= 0 ist und eine Zahl λ ∈ K existiert mit f (u) = λ u . Dann heißt λ der Eigenwert von f zum Eigenvektor u. (2) Für einen Eigenwert λ von f ist E( f , λ ) := {x ∈ V | f (x) = λ x} ein Untervektorraum von V , heißt der Eigenraum von f zum Eigenwert λ , und besteht aus dem Nullvektor sowie allen Eigenvektoren von f zum Eigenwert λ . Definition 73 : Sei A ∈ K n×n . Dann heißt u ∈ K n×1 Eigenvektor der Matrix A und λ ∈ K Eigenwert von A, wenn u Eigenvektor bzw. λ Eigenwert der Abbildung K n×1 → K n×1 , x 7→ Ax , ist. 2. Determinanten Definition 74 : Für A ∈ K n×n heißt det(A) := ∑ σ ∈Sn sign(σ )Aσ (1)1 Aσ (2)2 . . . Aσ (n)n die Determinante von A. Beispiel 40 : Im Fall n = 1 ist Sn = {Id1 } und det(A) = A11 . Im Fall n = 2 ist Sn = {Id2 , (1, 2)} und A11 A12 det = A11 A22 − A12 A21 . A21 A22 95 6. EIGENWERTPROBLEME Im Fall n = 3 ist Sn = {Id3 , (1, 2, 3), (1, 3, 2), (1, 3), (2, 3), (1, 2)} und A11 A12 A13 det A21 A22 A23 = A11 A22 A33 + A21 A32 A13 + A31 A12 A23 A31 A32 A33 − A31 A22 A13 − A11 A32 A23 − A21 A12 A33 . Für n ≥ 4 hat Sn mindestens 4! = 24 Elemente und die Definition der Determinante ist für das praktische Rechnen nicht mehr geeignet. Satz 102 : Für A ∈ K n×n ist det(AT ) = det(A) , d.h. Transponieren ändert die Determinante nicht. Beweis: Nach Definition ist det(AT ) = sign(σ ) ∏ (AT )σ ( j) j = ∑ sign(σ ) ∏ Aσ −1 (i)i , σ ∈Sn = n ∑ σ ∈Sn j=1 n ∑ σ ∈Sn n sign(σ ) ∏ A jσ ( j) j=1 i=1 wobei im Produkt i := σ ( j) gesetzt und umgeordnet wurde. Da die Abbildung Sn → Sn , σ 7→ σ −1 , bijektiv ist, kann man τ := σ −1 setzen und erhält durch Umordnen der Summe det(AT ) = ∑ τ ∈Sn n sign(τ ) ∏ Aτ (i)i = det(A) . i=1 Definition 75 : Sei A ∈ K n×n . (1) A hat obere Dreiecksform, wenn Ai j = 0 für alle Indizes i, j mit i > j ist. Dann hat A unterhalb der Hauptdiagonalen {(1, 1), (2, 2), . . ., (n, n)} nur Nulleinträge, d.h. A hat die Gestalt ∗ ∗ ... ∗ 0 ∗ ∗ . . .. . . . . . ... , 0 ... 0 ∗ wobei ∗ für beliebige Körperelemente steht. (2) A hat untere Dreiecksform, wenn Ai j = 0 für alle Indizes i, j mit i < j ist. Dann hat A oberhalb der Hauptdiagonalen nur Nulleinträge, d.h. 96 6. EIGENWERTPROBLEME A hat die Gestalt ∗ 0 ... 0 . . ∗ ∗ . . .. . . .. .. . 0 ∗ ∗ ... ∗ (3) A ist eine Dreiecksmatrix, wenn A obere oder untere Dreiecksform hat. (4) A hat Diagonalform, wenn Ai j = 0 für alle Indizes i, j mit i 6= j ist. Dann hat A ausserhalb der Hauptdiagonalen nur Nulleinträge, d.h. A hat die Gestalt ∗ 0 ... 0 . . .. . . 0 ∗ . . . .. . . . . . 0 0 ... 0 ∗ Beispiel 41 : Jede quadratische Matrix in Stufenform hat obere Dreiecksform. Daher kann jede quadratische Matrix durch elementare Umformungen in obere Dreiecksform übergeführt werden. Satz 103 : Die Determinante einer Dreiecksmatrix A ∈ K n×n ist das Produkt ihrer Diagonalelemente, also det(A) = A11 A22 . . . Ann . Insbesondere ist det(In ) = 1 . Beweis: Übung. Da man Determinanten von Dreiecksmatrizen leicht ausrechnen kann, liegt die Frage nahe, wie sich die Determinante bei elementaren Zeilenumformungen der Matrix ändert. Satz 104 : Sei A ∈ K n×n . (1) Sei B die Matrix, die man erhält, indem man eine Zeile von A mit einem Element c ∈ K multipliziert. Dann ist det(B) = c · det(A). (2) Sei B die Matrix, die man erhält, indem man zwei Zeilen von A vertauscht. Dann ist det(B) = − det(A). 97 6. EIGENWERTPROBLEME (3) Sei B die Matrix, die man erhält, indem man ein skalares Vielfaches einer Zeile von A zu einer anderen Zeile von A addiert. Dann ist det(B) = det(A). (4) Die Aussagen (1) - (3) gelten analog für Spalten statt Zeilen. (5) Die Determinante von A kann wie folgt berechnet werden: Forme A durch elementare Zeilenumformungen (oder Spaltenumformungen) vom Typ 1 (Addition eines Vielfachen einer Zeile zu einer anderen) und vom Typ 2 (Vertauschung zweier Zeilen) in eine Matrix B in Dreiecksform um. Sei k die Zahl der ausgeführten Zeilenvertauschungen. Dann ist det(A) = (−1)k B11 B22 . . . Bnn . Beweis: (1) - (3) nachprüfen, (4) folgt aus Satz 102 und (5) folgt aus (1) - (3). Satz 105 : Seien A, B ∈ K n×n und c ∈ K. (1) (2) (3) (4) (5) det(A · B) = det(A) · det(B) = det(B · A) . Für alle T ∈ GLn (K) ist det(T −1 · A · T ) = det(A) . A ist genau dann invertierbar, wenn det(A) 6= 0 ist. 1 . Wenn A invertierbar ist, dann ist det(A−1 ) = det(A) n det(cA) = c det(A) . Beweis: (1) wird weggelassen. (2) det(T −1 · A · T ) = det(T · (T −1 · A)) = det(A) . (3) und (4) folgen aus (1). (5) folgt aus Satz 104 . Satz 106 : Seien V ein endlich-dimensionaler Vektorraum über K mit Basis v und f : V → V eine lineare Abbildung mit Matrix A bezüglich v . Dann ist det( f ) := det(A) unabhängig von der Wahl der Basis v und heißt die Determinante von f . Es ist f genau dann bijektiv, wenn det( f ) 6= 0 ist. Beweis: Folgt aus Aussagen (2) und (3) in Satz 105 . Definition 76 : Sei A ∈ K n×n . Für 1 ≤ i, j ≤ n heißt die Matrix A(i, j) ∈ K (n−1)×(n−1) , 98 6. EIGENWERTPROBLEME die man aus A durch Weglassen der i-ten Zeile und j-ten Spalte erhält, die i- j-te Streichungsmatrix. Satz 107 : Sei A ∈ K n×n . Dann gilt: (1) Für 1 ≤ j ≤ n ist n det(A) = ∑ (−1)i+ j Ai j det(A(i, j) ) i=1 (Entwicklung der Determinante nach der j-ten Spalte). (2) Für 1 ≤ i ≤ n ist n det(A) = ∑ (−1)i+ j Ai j det(A(i, j)) j=1 (Entwicklung der Determinante nach der i-ten Zeile). Beweis: wird weggelassen. Wenn eine Matrix eine Spalte oder Zeile mit vielen Nullen besitzt, dann ist zur Berechnung der Determinante die Entwicklung nach dieser Spalte oder Zeile zu empfehlen. Satz 108 : Sei A ∈ K n×n . Dann heißt die Matrix Ad(A) ∈ K n×n , definiert durch Ad(A)i j := (−1)i+ j det(A( j,i) ) für 1 ≤ i, j ≤ n, die zu A adjungierte Matrix, und es gilt A · Ad(A) = Ad(A) · A = det(A) · In . Wenn A invertierbar ist, dann ist A−1 = det(A)−1 Ad(A) . Beweis: wird weggelassen. Beispiel 42 : Sei a b A= ∈ K 2×2 . c d Dann ist det(A) = ad − bc und, falls det(A) 6= 0 ist, d −b −1 −1 . A = det(A) −c a 99 6. EIGENWERTPROBLEME 3. Berechnung von Eigenwerten Satz 109 : Seien V ein endlich-dimensionaler Vektorraum über K und f : V → V eine lineare Abbildung. Dann ist λ ∈ K genau dann Eigenwert von f , wenn det(λ IdV − f ) = 0 ist. Die Abbildung χ f : K → K , z 7→ det(z IdV − f ) , ist eine polynomiale Abbildung und heißt das charakteristische Polynom von f . ( Die Eigenwerte von f sind die Nullstellen des charakteristischen ” Polynoms.“) Insbesondere: Die Abbildung f hat höchstens dimK (V ) Eigenwerte. Wenn K algebraisch abgeschlossen und V 6= {0} ist, hat f mindestens einen Eigenvektor. Beweis: Es ist λ genau dann ein Eigenwert von f , wenn ein Vektor u ∈ V mit u 6= 0 existiert, sodass f (u) = λ u ist. Dies ist äquivalent dazu, dass die lineare Abbildung λ IdV − f : V → V , v 7→ λ v − f (v) , nicht injektiv ist. Da die Abbildung IdV − f linear ist und die Dimensionen ihres Definitions- und Bildbereiches übereinstimmen, ist die Abbildung λ IdV − f genau dann injektiv, wenn sie bijektiv ist (Übung). Nach Satz 106 ist λ IdV − f genau dann nicht bijektiv, wenn det(λ IdV − f ) = 0 ist. Satz 109 legt folgendes Verfahren nahe, die Eigenwerte und Eigenvektoren einer linearen Abbildung f : V → V zu berechnen, falls V endlichdimensional ist: (1) Wähle eine Basis v = (v1 , . . . , vn ) von V und bestimme die Matrix A von f bezüglich v . Die Matrix von λ IdV − f bezüglich v ist dann λ In − A . (2) Finde alle λ ∈ K mit det(λ In − A) = 0, das heißt: berechne alle Nullstellen des charakteristischen Polynoms von f . (3) Bestimme für jeden Eigenwert λ den Eigenraum E( f , λ ) durch Lösen des homogenen Systems linearer Gleichungen (λ In − A)x = 0. Beispiel 43 : Wir lösen nun das Eigenwertproblem aus Beispiel 39. Hier ist 2k −k A= . −k k 100 6. EIGENWERTPROBLEME Wegen λ − 2k k det(λ I2 − A) = det = λ 2 − 3kλ + k2 k λ −k sind die Eigenwerte von A √ 3+ 5 λ1 = k und 2 Die zugehörigen Eigenräume sind 1√ bzw. E(A, λ1 ) = R 1− 5 √ 3− 5 λ2 = k. 2 E(A, λ2 ) = R 2 wobei R der Körper der reellen Zahlen ist. 1√ 1+ 5 2 , Beispiel 44 : Sei A ∈ K n×n eine Dreiecksmatrix. Dann ist auch die Matrix λ In − A eine Dreiecksmatrix, und nach Satz 103 ist χA (z) = (z − A11 ) . . . (z − Ann ) . Daher sind die Diagonalelemente einer Matrix in Dreiecksform ihre Eigenwerte. Zum Beispiel ist 1 der einzige Eigenwert der Einheitsmatrix In .