Rudolf Fritsch Wintersemester 2001/02 Lineare Algebra I für Informatiker 15. Oktober 2002 In der Vorlesung Lineare Algebra“, die Sie am Anfang Ihres Informatikstudiums hören, werden ” Sie mathematische Techniken kennenlernen, die grundlegend für die eigentliche Informatik sind und dort immer wieder benötigt werden. Aber ich kann Ihnen nicht alles einschlägige Material vortragen. Um den Stoff voll und unter verschiedenen Gesichtspunkten zu erfassen, ist die Hinzuziehung von Literatur notwendig. Zu dem Thema der Vorlesung gibt es sehr viele Lehrbücher. Einige wenige habe ich im Kommentierten Vorlesungsverzeichnis angegeben, das Sie im Internet finden. Sie stehen im Lesesaal unserer Institutsbibliothek. Ich empfehle Ihnen, sich zu Beginn noch nicht ein solches Buch zu kaufen, sondern zunächst einmal im Lesesaal mit verschiedenen Werken zu arbeiten und sich dann das anzuschaffen, mit dem Sie persönlich am besten zurecht kommen; das kann individuell sehr verschieden sein. Für den Anfang besonders empfehlen möchte ich die im Internet genannten Bücher: • Gerd Fischer: Lineare Algebra - Eine Einführung für Studienanfänger Braunschweig / Wiesbaden: 13 2002. X, 384 Seiten, Vieweg Verlag, ISBN: 3-528-97217-3 Ladenpreis: EUR 19,90 • Klaus Jänich: Lineare Algebra Berlin / Heidelberg / New York / London / Paris / Tokio / Hongkong / Barcelona / Budapest: 9 2003. XII, 271 Seiten, Springer Verlag, ISBN: 3-540-43587-5 Ladenpreis: EUR 19,95 • Herbert Möller: Algorithmische Lineare Algebra Braunschweig / Wiesbaden: 1997. X, 389 Seiten, Vieweg Verlag, ISBN: 3-528-05528-6 Ladenpreis: EUR 29,90 • Bodo Pareigis: Lineare Algebra für Informatiker Berlin / Heidelberg / New York / Barcelona / Hongkong / London / Mailand / Paris / Singapur / Tokio: 2000. VI, 274 Seiten, Springer, ISBN 3-540-67533-7 Ladenpreis: EUR 24,95 sowie • Albrecht Beutelspacher: Lineare Algebra – Eine Einführung in die Wissenschaft der Vektoren, Abbildungen und Matrizen Braunschweig / Wiesbaden: 5 2001. XII, 289 Seiten, Vieweg Verlag, ISBN: 3-528-46508-5 Ladenpreis: EUR 19,90 1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN 2 Die genannten Lehrbücher stammen alle von deutschen Autoren und verwenden die deutsche Sprache. Solche gibt es eigentlich nur noch für wirkliche Anfängertexte. Fortgeschrittene Lehrbücher werden heute überall auf der Welt in Englisch verfasst, wie vor 200 Jahren in Latein. Aus diesem Grund empfehle ich Ihnen auch ein Buch zu unserem Stoff in englischer Sprache, aus der Feder des 1916 in Ungarn geborenen, früherem Präsidenten der American Mathematical Society, • Paul R. Halmos: Finite-Dimensional Vector Spaces, erstmals 1942 in den Vereingten Staaten von Amerika erschienen, neueste Ausgabe New York / Heidelberg / Berlin: 1993. VIII, 200 Seiten, Springer-Verlag, ISBN: 3-540-90093-4 Ladenpreis: EUR 44,95 1 Grundlegendes über Lineare Gleichungssysteme und Matrizen Die Linearen Gleichungssysteme durchziehen wie ein roter Faden die ganze Lineare Algebra, zunächst als Objekte eigenständiger Untersuchungen, dann in Anwendungen. Wir wollen ganz elementar beginnen. Eine lineare Gleichung einfachsten Typs ist ein Ausdruck der Form a · x = c. Dabei sind sogenannten Konstanten (Formvariablen) a und c Elemente eines Zahlbereichs, der Einfachheit halber nehmen wir zunächst den Bereich R der reellen Zahlen: a, c ∈ R . Es ist häufig hilfreich, sich die reellen Zahlen geometrisch als Punkte auf der Zahlengeraden vorzustellen. Der Buchstabe x symbolisiert eine Unbestimmte, Unbekannte oder Variable (Lösungsvariable). Eine Zahl b ∈ R ist eine Lösung der Gleichung, wenn die Ersetzung der Unbestimmten durch diese Zahl zu einer wahren Aussage führt, das heißt, wenn sie Gleichung erfüllt: a · b = c. Im ursprünglichen Sinn beschreibt die Gleichung eine Aufgabe: Man bestimme die Lösungsmenge, das heißt, die Menge der Lösungen: L = {b ∈ R|a · b = c} . Wir wollen diese Aufgabe allgemein lösen. Für spezielle Werte von a und c haben Sie das in der Schule gelernt, im 6., spätestens im 7. Schuljahr. Die allgemeine Lösung aufzuschreiben, das ist gar nicht so einfach, wie Sie zunächst denken mögen. Wir benötigen Fallunterscheidungen. 1. Fall: Ist a 6= 0, so ist eine Äquivalenzumformung der Gleichung möglich, man multipliziert beide Seiten der Gleichung mit 1/a und erhält die äquivalente Gleichung x= c . a 1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN 3 Die Lösungsmenge besteht aus genau einem Element, der Zahl x = c/a: nco a 6= 0 ⇒ L = . a (allgemeiner Fall ) 2. Fall: Ist a = 0, so ist eine weitere Fallunterscheidung notwendig. 1. Unterfall: Ist c 6= 0, die Gleichung also von der Form 0 · x = c (6= 0) , so erfüllt keine reelle Zahl die Gleichung: a = 0 ∧ c 6= 0 ⇒ L = ∅ . 2. Unterfall: Ist auch c = 0, die Gleichung also von der Form 0 · x = 0, so erfüllt jede reelle Zahl die Gleichung: a = c = 0 ⇒ L = R. (Sonderfall ) Sie werden sich und mich vielleicht fragen, warum dieses akribische Vorgehen nötig ist. Man sieht doch in jedem Fall sofort, was los ist. Gerade für Informatiker ist aber diese Auffassung falsch. Wenn man einen Computer programmiert, so sieht dieser von selbst gar nichts. Ein Programm benötigt genau diese Schritte. Die angegebene Lösung der gegebenen linearen Gleichung ist auch noch abhängig von dem gegebenen Zahlbereich, beziehungsweise möglicherweise verschiedenen Zahlbereichen für die Konstanten und Lösungen. Nehmen wir etwa als Zahlbereich für beides die Menge der natürlichen Zahlen N = {1, 2, 3, . . .} , so sieht die allgemeine Lösung ganz anders aus; es sind allerdings wieder zwei Fälle zu unterscheiden: 1. Fall: Ist c ein Vielfaches von a, also c = a·b mit b ∈ N, so ist diese Zahl b die einzige Lösung: c = a · b mit b ∈ N ⇒ L = {b} . 2. Fall: Ist c kein Vielfaches von a, also c 6= a · b für alle b ∈ N, so ist die Lösungsmenge leer: c 6= a · b für alle b ∈ N ⇒ L = ∅ . 1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN 4 Noch ein anderes Ergebnis erhalten wir, wenn wir die Konstanten den natürlichen Zahlen entnehmen, als Lösungen aber auch Bruchzahlen nz (mit z, n ∈ N) zulassen. Dann hat die betrachtete Gleichung immer genau eine Lösung: nco L= . a Die Menge der Bruchzahlen wird durch B bezeichnet: z B = { |z, n ∈ N} . n Bis auf weiteres setze ich bei den folgenden Verallgemeinerungen wegen der geometrischen Anschaulichkeit voraus, dass wir über dem Bereich R der reellen Zahlen arbeiten, das heißt, die betrachteten Konstanten stehen für reelle Zahlen, die Lösungen, die gleich keine Zahlen mehr sein werden, werden aus reellen Zahlen aufgebaut. Was wir bis jetzt behandelt haben, das ist der einfachste Fall einer linearen Gleichung, eine lineare Gleichung in e i n e r Unbekannten. Als nächstes betrachten wir lineare Gleichungen in z w e i Unbekannten. Wir schreiben sie in einer der folgenden Formen a·x+c·y =e oder a1 · x 1 + a2 · x 2 = c . Die erste Form dürfte ihnen von der Schule her vertraut sein, sie vermittelt auch besser die geometrische Anschauung; die zweite benutzt sogenannte untere Indizes, hier 1, 2, und bringt den mathematischen Hintergrund besser zum Ausdruck. Die Lösungen einer solchen Gleichung sind nun nicht mehr Zahlen, sondern geordnete Paare von Zahlen, sie bestehen also immer aus zwei Zahlen, von denen die eine die erste Komponente, und die andere die zweite Komponente ist. Dabei dürfen die beide Komponenten durchaus einander gleich sein. Ist die Gleichung in der zweiten Form angegeben, so bietet es sich an, eine Lösung allgemein als Paar (b1 , b2 ) zu schreiben. Ein solches Zahlenpaar ist genau dann eine Lösung, wenn gilt: a1 · b 1 + a2 · b 2 = c . Für die erste Form könnte man die Lösungen als Paare (b, d) angegeben, für die gilt: a · b + c · d = e. Sind die Komponenten eines solchen Paare Zahlen in Dezimalbruchdarstellung, so verwendet man zur Trennung der Komponenten einen Strichpunkt ;“ oder einen vertikalen Strich |“; ” ” andernfalls könnten Missverständnisse auftreten: (3; 4, 5) = (3|4, 5) oder (3, 4, 5) = (3, 4; 5) = (3, 4|5) . Geometrisch kann man die Lösungen als Punkte in der Anschauungsebene deuten. Die Komponenten heißen dann auch Koordinaten. Die Gesamtheit dieser Paare, geometrisch aller Punkte der Ebene, wird durch R × R oder R2 bezeichnet: R × R = R2 = {(b, d)|b ∈ R ∧ d ∈ R} . 1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN 5 Intermezzo: Die Menge R × R aller Paare reeller Zahlen heißt cartesisches Produkt von R mit sich selbst. Die Benutzung des Wortes Produkt“ wird dabei aus folgender Überlegung ” abgeleitet. Sind A und B zwei endliche Mengen und so ist die Anzahl aller geordneten Paare, deren erste Komponente ein Element von A und deren zweite Komponente ein Element von B ist, gerade das Produkt der Anzahlen der Elemente von A beziehungsweise B: #A × B = #A × #B . (Ist A eine endliche Menge, so bezeichnet #A oder |A| die Anzahl der Elemente von A.) Zurück zur Diskussion einer Gleichung mit zwei Unbekannten. Wieder geht es um die Bestimmung der Lösungsmenge einer solchen Gleichung. Wir gehen dabei von der ersten Form aus und haben wieder Fälle zu unterscheiden. 1. Ist c 6= 0, so erhält man durch eine Äquivalenzumformung die Gleichung a e y =− ·x+ . c c Daraus erhält man als Lösungsmenge e − a · b L= b, b ∈ R ,. c Geometrisch ist die Lösungsmenge eine Gerade mit der Steigung −a/c und e/c als Achsenabschnitt auf der y-Achse. Sie lässt sich auch interpretieren als der Graph der linearen Funktion e−a·x . x 7→ c 2. Ist c = 0, so sieht die Gleichung aus wie eine lineare Gleichung in einer Unbekannten. Aber die möglichen Lösungsmengen sind von ganz anderer Art. Es sind wieder Fälle zu unterscheiden. 2.1. Ist a 6= 0, so erhält man durch ein Äquivalenzumformung die Gleichung x= e . a Daraus erhält man als Lösungsmenge n e o L= ,d | d ∈ R ,. a Geometrisch ist die Lösungsmenge eine zur y-Achse parallele Gerade. 2.2. Ist auch a = 0, ist eine weitere Fallunterscheidung nötig. 2.2.1. Ist e 6= 0, so gibt es keine Lösungen: L = ∅. 1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN 6 2.2.2. Ist schließlich noch e = 0, so sind alle Zahlenpaare Lösungen: L = R2 . Geometrisch ist das die ganze Ebene. Überall in der Natur, insbesondere in der Physik und in der Statistik treten nicht nur lineare Gleichungen mit einer oder zwei Unbekannten auf. Die Zahl der Unbekannten kann sehr viel größer sein. Mein Ururgroßonkel Josef Loschmidt berechnete die Zahl der Moleküle pro Mol, etwa 6 mal 1023 , das ist die nach ihm benannte Loschmidtsche Zahl. Die Physiker beschreiben jedes Molekül mit drei Ortskoordinaten und drei Geschwindigkeitskoordinaten und kommen damit zu Gleichungen in 36 mal 1023 Unbekannten! Wir setzen nun solche Gleichungen allgemein an, eine Gleichung mit n Unbekannten (n ∈ N) schreiben wir in der Form a1 · x 1 + a2 · x 2 + . . . + an · x n = c . Man schreibt eine solche Gleichung auch in der Form: n X aj · x j = c , j=1 oder etwas kürzer, wenn klar ist, welcher Index läuft: n X aj · x j = c . 1 In einer Gleichung dieser Form ist es üblich, die Konstanten a1 , a2 , . . . , an besonders zu benennen, sie stehen bei den Unbestimmten und heißen deshalb Beiwerte oder Koeffizienten, englisch: coefficients. Eine Lösung der Gleichung ist eine Folge reeller Zahlen der Länge n, geschrieben (b1 , b2 , . . . , bn ) . Statt von Folgen spricht man in diesem Zusammenhang allerdings von n-Tupeln (reeller Zahlen). Die Gesamtheit dieser n-Tupel heißt n-dimensionaler Raum (über R) – Bezeichnung: Rn – auch wenn dieser Raum für n > 3 nur sehr schlecht zu veranschaulichen ist. Trotzdem verwendet man auch in diesem Zusmmenhang geometrische Sprechweisen, bezeichnet ein n-Tupel als Punkt und gewisse Teilmengen als Geraden oder Ebenen; das ist anschaulich und suggestiv. Ein n-Tupel (b1 , b2 , . . . , bn ) ist genau dann eine Lösung, wenn gilt: a1 · b 1 + a2 · b 2 + . . . + an · b n = c . Bei der Bestimmung der allgemeinen Lösung dieser Gleichung wird nun der Unterschied zwischen mathematischem und informatischem Vorgehen deutlich. Wir beginnen mit der mathematischen Sichtweise. Sie führt auf die folgende Fallunterscheidung: 1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN 7 1. Nicht alle Koeffizienten a1 , a2 , . . . , an sind gleich Null, das heißt, es gibt ein aj0 6= 0. O.w.E. (= Ohne wesentliche Einchränkung, oder O.B.d.A. = Ohne Beschränkung der Allgemeinheit) können wir j0 = n, also an 6= 0 annehmen. Dann führt eine Äquivalenzumformung auf die Form n−1 c 1 X xn = − · aj x j . an an j=1 Daraus ergibt sich die Lösungsmenge ( ! ) n−1 X 1 L= b1 , b2 , . . . , bn−1 , (c − aj bj ) b1 , b2 , . . . , bn−1 ∈ R . an j=1 Wie im Fall n = 2 lässt sich die Lösungsmenge als Graph der Funktion n−1 c 1 X − · aj x j (x1 , x2 , . . . , xn−1 ) 7→ an an j=1 deuten. Das ist im Moment vielleicht nicht sehr hilfreich. Sie wissen von der Schule, dass die Lösungsmenge im Fall n = 3 eine Ebene ist, man wählt im dreidimensionalen Raum zwei freie Variable, hat ein – wie man sagt – zweidimensionales Gebilde, eine Dimension niedriger als der ganze Raum. Im allgemeinen ist das Gebilde in einem zunächst n-dimensionalen Raum anschaulich von der Dimension n − 1, eins weniger als die volle Dimension. Dafür hat man im linearen Fall den Begriff Hyperebene geprägt, im nichtlinearen Fall spricht man von Hyperflächen. Es sei noch gezeigt, was passiert, wenn man auf die Einschränkung j0 = n verzichtet. Dann löst man die Ausgangsgleichung nach xj0 statt nach xn auf: j0 −1 n X c 1 X 1 − · aj x j − · aj xj xj0 = aj0 aj0 j=1 aj0 j=j +1 0 und die explizite Angabe der Lösungsmenge erfordert wesentlich mehr Schreibarbeit, aber keine wirklich neuen Ideen. 2. Alle Koeffizienten verschwinden, das heißt, sind gleich Null: a1 = a2 = . . . = an = 0 . Dann ist wie in den früheren Überlegungen eine weitere Fallunterscheidung notwendig. 2.1. Ist c 6= 0, so ist L = ∅. 2.2. Ist c = 0, so ist L = Rn . 18. Oktober 2002 Wie behandelt nun ein Informatiker dieser Aufgabe? 1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN 8 1. Es sei a1 6= 0. Äquivalenzumformungen ergeben a2 an c x1 + x2 + . . . + xn = , a1 a1 a1 n c 1 X x1 = − · aj x j , a1 a1 j=2 und daraus erhält man die Lösungsmenge ( ! ) n X 1 (c − aj bj , b2 , b3 , . . . , bn b2 , b3 , . . . , bn ∈ R L= a1 j=2 wie in der mathematischen Sichtweise; der Austausch von n und 1 ist dabei wirklich unwesentlich. Dann geht es aber anders weiter. 2. Es sei a1 = 0. Dann kommt die Fallunterscheidung: 2.1. Es sei a2 6= 0. Nun ergibt eine Äquivalenzumformung: n c 1 X x2 = − · aj x j , a2 a2 j=3 und daraus erhält man die Lösungsmenge ( ! ) n X 1 L= b1 , (c − aj bj , b3 , b4 , . . . , bn ) b1 , b3 , . . . , bn−1 ∈ R . a2 j=3 2.2. Es sei a2 = 0. Dann kommt die Fallunterscheidung: 2.2.1. Es sei a3 6= 0. Nun ergibt eine Äquivalenzumformung: n c 1 X x3 = − · aj x j , a3 a3 j=4 und daraus erhält man die Lösungsmenge ( ! ) n X 1 aj bj , b4 , b5 , . . . , bn ) b1 , b2 , b4 . . . , bn−1 ∈ R . L= b1 , b2 , (c − a3 j=4 2.2.2. Es sei a3 = 0. .. . 2.2.2.. . . .1. Es sei an 6= 0. Nun ergibt eine Äquivalenzumformung: c xn = , an und daraus erhält man die Lösungsmenge c b1 , b2 , . . . , bn−1 , b1 , b2 , . . . , bn−1 ∈ R . L= an 1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN 9 2.2.2.. . . .2. Es sei an = 0. Dann kommt schließlich noch die Fallunterscheidung: 2.2.2.. . . .2.1. Ist c 6= 0, so ist L = ∅. 2.2.2.. . . .2.2. Ist c = 0, so ist L = Rn . Im Fall n = 3 lassen sich die erhaltenen nichttrivialen Lösungsmengen geometrisch veranschaulichen, wozu im dreidimensionalen Raum das folgende rechtwinklige Koordinatensystem einführen. 6 * x1 x 3 x2 - Die Diskussion folgt der Beschreibung der Lösungsmengen in der Informatik. 1. a1 6= 0: Die Lösungsmenge lässt sich als Graph der in der (x2 , x3 )-Ebene definierten Funktion 1 (x2 , x3 ) 7→ (c − a2 · x2 − a3 · x3 ) a1 deuten und ist eine Ebene in allgemeiner Lage“, die die x1 -Achse im Punkt (c/a1 , 0, 0) ” schneidet. 2.1. a1 = 0 6= a2 : Die Lösungsmenge ist eine zur x1 -Achse parallele, also zur (x2 , x3 )-Ebene senkrechte Ebene, die die (x2 , x3 )-Ebene in der durch die Gleichung a2 · x2 + a3 · x3 = c beschriebenen Geraden schneidet. 2.2.1. a1 = a2 = 0 = 6 a3 : Die Lösungsmengeist eine zur (x1 , x2 )-Ebene parallele Ebene, die die x3 -Achse im Punkt (0, 0, c/a3 ) schneidet. Im Verlauf dieser Überlegungen haben mehrfach Äquivalenzumformungen eine wichtige Rolle gespielt. Sie sollten diesen Begriff aus Ihrer Schulzeit kennen. Eine Äquivalenzumformungen beschreibt bekanntlich den Übergang von einer Gleichung zu einer anderen, ohne dass sich die Lösungsmenge ändert. Dabei ist ein Typ von Äquivalenzumformungen besonders wichtig. Satz. Die Lösungsmenge einer linearen Gleichung ändert sich nicht, wenn man sie mit einer festen, von Null verschiedenen Zahl multipliziert. Erklärung und Beweis. Eine lineare Gleichung mit einer Zahl multiplizieren bedeutet, alle Konstanten mit dieser Zahl zu multiplizieren, also den Übergang von der Gleichung (∗) a1 · x 1 + a2 · x 2 + . . . + an · x n = c zu der Gleichung (∗∗) (d · a1 ) · x1 + (d · a2 ) · x2 + . . . + (d · an ) · xn = d · c . 1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN 10 Es ist zu zeigen, dass für d 6= 0 Lösungsmengen L∗ und L∗∗ beider Gleichungen übereinstimmen, das heisst, dass jede Lösung von (∗) auch Lösung von (∗∗) ist und umgekehrt. Wir schreiben dies formal auf: (b1 , b2 , . . . , bn ) ∈ L∗ ⇔ n X aj · b j = c ⇔ j=1 ⇔ d· n X aj · b j = d · c ⇔ j=1 ⇔ n X (d · aj ) · bj = d · c ⇔ (b1 , b2 , . . . , bn ) ∈ L∗∗ . j=1 Der Übergang von der ersten zur zweiten Zeile funktioniert für jede Zahl d, die Rückrichtung, das sogenannte Kürzen durch d, ist aber nur für d 6= 0 möglich. Die bisherige Diskussion zeigt, dass die nichtleeren Lösungsmengen einer linearen Gleichungen in mehr als einer Unbekannten immer viele, über dem Zahlbereich R unendlich viele Elemente enthalten. Aber sie sind trotzdem nicht ganz beliebig, sie haben spezielle Eigenschaften, die sich geometrisch etwa in den Aussagen die Lösungsmenge ist eine Gerade“, die Lösungsmen” ” ge ist eine Ebene“ widerspiegeln. Für die Darstellung solcher Eigenschaften ist die folgende Begriffsbildung hilfreich. Eine lineare Gleichung a1 · x 1 + a2 · x 2 + . . . + an · x n = c heißt homogen, wenn c = 0 gilt, sonst inhomogen. Satz. Für eine homogene lineare Gleichung gilt: 1. Die Lösungsmenge ist nicht leer. 2. Ein Vielfaches einer Lösung ist wieder eine Lösung. 3. Die Summe zweier Lösungen ist auch eine Lösung. 4. Jede Linearkombination von Lösungen ist eine Lösung. Beweis. Wir betrachten die homogene lineare Gleichung n X aj · x j = 0 j=1 in n Unbekannten. 1. Das n-Tupel 0=(0,0,. . . ,0) mit allen Komponenten gleich Null ist Lösung. 2. Ein Vielfaches eines n-Tupels (b1 , b2 , . . . , bn ) erhält man, in dem man alle Komponenten mit derselben Zahl d multipliziert, es hat also die Form: d · (b1 , b2 , . . . , bn ) = (d · b1 , d · b2 , . . . , d · bn ) ; 1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN 11 speziell spricht man vom d-fachen des ursprünglichen n-Tupels. Für jede Lösung (b1 , b2 , . . . , bn ) unserer Gleichung und jede Zahl d berechnen wir: n X aj · (d · bj ) = n X d · aj · b j = d · j=1 j=1 n X aj · b j = d · 0 = 0 ; j=1 also ist auch (d · b1 , d · b2 , . . . , d · bn ) eine Lösung unserer Gleichung. 3. Unter der Summe der n-Tupel (b11 , b21 , . . . , bn1 ) und (b12 , b22 , . . . , bn2 ) versteht man das n-Tupel, das man durch komponentenweise Addition erhält: (b11 , b21 , . . . , bn1 ) + (b12 , b22 , . . . , bn2 ) = (b11 + b12 , b12 + b22 , . . . , bn1 + bn2 ) . Sind die n-Tupel (b11 , b21 , . . . , bn1 ) und (b12 , b22 , . . . , bn2 ) Lösungen unser Gleichung, so berechnen wir n X aj · (bj1 + bj2 ) = j=1 n X aj · bj1 + aj · bj2 = j=1 n X aj · bj1 + j=1 n X aj · bj2 = 0 + 0 = 0 ; j=1 also ist auch (b11 + b12 , b12 + b22 , . . . , bn1 + bn2 ) eine Lösung unserer Gleichung. 4. Es seien n-Tupel (b11 , b21 , . . . , bn1 ), (b12 , b22 , . . . , bn2 ), . . . , (b1p , b2p , . . . , bnp ) gegeben (p ∈ N). Eine Linearkombination aus diesen n-Tupeln ist ein n-Tupel der Form: p p p X X X ( dk · b1k , dk · b2k , . . . , dk · b1k ) = k=1 k=1 k=1 = d1 · (b11 , b21 , . . . , bn1 ) + d2 · (b12 , b22 , . . . , bn2 ) + . . . + dp · (b1p , b2p , . . . , bnp ) mit beliebigen Zahlen d1 , d2 , . . . , dp . Sind die gegebenen n-Tupel Lösungen unserer Gleichung, so berechnen wir für eine Linearkombination n X j=1 aj · p X k=1 dk ·bjk = p n X X j=1 k=1 aj ·dk ·bjk = p n X X aj ·dk ·bjk = k=1 j=1 p X k=1 also ist auch die Linearkombination eine Lösung. dk · n X j=1 aj ·bjk = p X dk ·0 = 0 ; k=1 Dieser Sachverhalt erlaubt es, die allgemeine Lösung einer homogenen Gleichung, deren Koeffizienten nicht alle verschwinden, als Linearkombination gewisser Basislösungen darzustellen. Wir betrachten wieder die homogene lineare Gleichung a1 · x 1 + a2 · x 2 + . . . + an · x n = 0 in n Unbekannten und nehmen dabei wieder an 6= 0 an. Da dann die Multiplikation der Gleichung mit 1/an – wie eben bewiesen – die Lösungsmenge nicht ändert, können wir sogar an = 1, also a1 · x1 + a2 · x2 + . . . + xn = 0 , 1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN 12 annehmen. Die vorhin entwickelten allgemeine Lösung hat die Form (b1 , b2 , . . . , bn−1 , − n−1 X aj b j ) . j=1 Wir haben die folgenden speziellen Lösungen (1, 0, 0, . . . , 0, −a1 ), (0, 1, 0, . . . , 0, −a2 ), (0, 0, 1, . . . , 0, −a3 ), .. . (0, 0, 0, . . . , 1, −an−1 ). 22. Oktober 2002 Die allgemeine Lösung ist dann in eindeutiger Weise als Linearkombination dieser Basislösungen darstellbar: (b1 , b2 , . . . , bn−1 , − n−1 X aj bj ) = b1 · (1, 0, 0, . . . , 0, −a1 ) + . . . + bn−1 · (0, 0, 0, . . . , 1, −an−1 ) . j=1 Zum Nachweis der Eindeutigkeit betrachten wir eine beliebige Linearkombination der Basislösungen: d1 · (1, 0, 0, . . . , 0, −a1 ) + . . . + dn−1 · (0, 0, 0, . . . , 1, −an−1 ) = (d1 , d2 , . . . , dn−1 , − n−1 X aj dj ) . j=1 Diese stimmt aber eben nur dann mit der betrachteten Lösung überein, wenn gilt: d1 = b1 , d2 = b2 , . . . , dn−1 = bn−1 . Nun wenden wir uns dem inhomogenen Fall zu. Ist eine inhomogene Gleichung a1 · x1 + a2 · x2 + . . . + an · xn = c(6= 0) gegeben, so heißt die Gleichung a1 · x 1 + a2 · x 2 + . . . + an · x n = 0 zugehörige homogene Gleichung. Die wesentlichen Aussage über die Lösungsmengen inhomogener Gleichungen enthält der folgende Satz. Für eine inhomogene lineare Gleichung gilt: 1. Die Lösungsmenge ist genau dann nicht leer, wenn nicht alle Koeffizienten verschwinden. 2. Die Differenz zweier Lösungen ist eine Lösung der zugehörigen homogenen Gleichung. 1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN 13 3. Ist die Lösungsmenge nicht leer, so erhält man alle Lösungen, indem man zu einer speziellen Lösung der inhomogenen Gleichung alle Lösungen der zugehörigen homogenen Gleichung addiert. Beweis. Wir betrachten die Gleichung a1 · x1 + a2 · x2 + . . . + an · xn = c(6= 0) . Es sei L ihre Lösungsmenge und Lh die Lösungsmenge der zugehörigen homogenen Gleichung. 1. L = 6 ∅ ⇔ nicht alle aj = 0 ergibt sich aus den vorherigen Überlegungen. 2. Für die Differenz (b11 , b21 , . . . , bn1 ) − (b12 , b22 , . . . , bn2 ) = (b11 − b12 , b12 − b22 , . . . , bn1 − bn2 ) von (b11 , b21 , . . . , bn1 ) ∈ L und (b12 , b22 , . . . , bn2 ) ∈ L berechnen wir: n X aj · (bj1 − bj2 ) = j=1 n X aj · bj1 − j=1 n X aj · bj2 = c − c = 0 ; j=1 also gehört die Differenz zu Lh . 3. Es sei (b10 , b20 , . . . , bn0 ) ∈ L fest gegeben. Mit (b10 , b20 , . . . , bn0 ) + Lh bezeichnen wir die Menge aller n-Tupel, die sich als Summe aus (b10 , b20 , . . . , bn0 ) und einem n-Tupel in Lh darstellen lassen. Es ist L = (b10 , b20 , . . . , bn0 ) + Lh zu zeigen. Wir müssen dazu nachweisen, dass jedes Element der Menge auf der linken Seite auch zu der Menge auf der rechten Seite des Gleichheitszeichens gehört und umgekehrt. ⊂“: Sei (b11 , b21 , . . . , bn1 ) ∈ L gegeben. Nach 2. ist die Differenz ” (b12 , b22 , . . . , bn2 ) = (b11 , b21 , . . . , bn1 ) − (b10 , b20 , . . . , bn0 ) ∈ Lh und damit ist (b11 , b21 , . . . , bn1 ) = (b10 , b20 , . . . , bn0 ) + (b12 , b22 , . . . , bn2 ) ∈ (b10 , b20 , . . . , bn0 ) + Lh . ⊃“: Für ” (b10 , b20 , . . . , bn0 ) + (b12 , b22 , . . . , bn2 ) = (b10 + b12 , b20 + b22 , . . . , bn0 + bn2 ) mit (b12 , b22 , . . . , bn2 ) ∈ Lh berechnen wir: n X j=1 aj · (bj0 + bj2 ) = n X j=1 aj · bj0 + aj · bj2 = n X j=1 aj · bj0 + n X j=1 aj · bj2 = c + 0 = c ; 1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN 14 also gilt: (b10 , b20 , . . . , bn0 ) + (b12 , b22 , . . . , bn2 ) ∈ L . Zur Auswahl einer festen Lösung nehmen wir o.B.d.A. wieder an = 1 an. Dann ist (0, 0, . . . , 0, c) ∈ L. Bei Beschreibung von Phänomene des Alltags kommt man häufig nicht mit einer Gleichung aus. Zum Beispiel wird eine Gerade im dreidimensionalen Raum als Schnitt zweier Ebenen durch zwei lineare Gleichung in drei Unbekannten beschreiben. Das führt allgemein zu dem Begriff des linearen Gleichungssystems (aus m Gleichungen in n Unbekannten: a11 · x1 + a12 · x2 + . . . + a1n · xn = c1 , a21 · x1 + a22 · x2 + . . . + a2n · xn = c2 , .. . am1 · x1 + am2 · x2 + . . . + amn · xn = cm . Unter der Lösungsmenge eines linearen Gleichungssystems versteht man den Durchschnitt der Lösungsmengen der einzelnen Gleichungen: L = L1 ∩ L2 ∩ . . . ∩ Lm = m \ Li . i=1 In Analogie zu unserer Diskussion einer Gleichung heißt ein solches Gleichungssystem homogen, falls c1 = c2 = . . . = cm = 0 ist, sonst inhomogen. Das zugehörige homogene System zu einem inhomogenen Gleichungssystem erhält man, in dem man die rechten Seiten aller Gleichungen Null setzt. Für die Lösungsmengen von linearen Gleichungssystem gelten die gleichen Sätze wie für die Lösungsmengen einer linearen Gleichungen. Satz. Für ein homogenes Gleichungssystem gilt: 1. Die Lösungsmenge ist nicht leer. 2. Ein Vielfaches einer Lösung ist wieder eine Lösung. 3. Die Summe zweier Lösungen ist auch eine Lösung. 4. Jede Linearkombination von Lösungen ist eine Lösung. Auf einen expliziten Beweis dieses Satzes verzichten wir im Moment, er fällt uns bei späteren Strukturüberlegungen einfach in den Schoß. Satz. Für ein inhomogenes lineares Gleichungssystem gilt: 1. Die Differenz zweier Lösungen ist eine Lösung des zugehörigen homogenen Systems. 2. Ist die Lösungsmenge nicht leer, so erhält man alle Lösungen, indem man zu einer speziellen Lösung des inhomogenen Systems alle Lösungen des zugehörigen homogenen Systems addiert. 1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN 15 Diesen Satz beweist man für Systeme genau so wie für einzelne Gleichungen. Allerdings enthält er keine Aussage darüber, wann die Lösungsmenge eines inhomogenen Gleichungssystems nicht leer ist. Eine solche ist für Gleichungssysteme wesentlich schwieriger als für eine einzelne Gleichung und wird erst später entwickelt. Auch die Auffindung von Basislösungen für ein homogenes Gleichungssystem gestaltet sich schwieriger als bei einer einzelnen Gleichung. Diesem Problem werden wir uns als nächstes widmen. Für Gleichungssystem gibt es noch eine wichtige Äquivalenzumformung: Satz. Die Lösungsmenge eines linearen Gleichungssystems ändert sich nicht, wenn man eine Gleichung durch die Summe aus dieser und einer anderen Gleichung ersetzt. Beweis. Da bei dieser Umformung nur zwei Gleichung des Systems involviert sind, genügt es o.B.d.A. ein System aus zwei Gleichungen zu betrachten. Wir zeigen: Die Lösungsmenge L∗ des Systems a11 · x1 + a12 · x2 + . . . + a1n · xn = c1 , a21 · x1 + a22 · x2 + . . . + a2n · xn = c2 stimmt mit der Lösungsmenge L∗∗ des Systems (a11 + a21 ) · x1 + (a12 + a22 ) · x2 + . . . + (a1n + a2n ) · xn = c1 + c2 , a21 · x1 + a22 · x2 + . . . + a2n · xn = c2 überein: L∗ = L∗∗ . Sei zunächst (b1 , b2 , . . . , bn ) ∈ L∗ gegeben. Dann gilt: n X a1j · bj = c1 , j=1 n X a2j · bj = c2 , j=1 und damit auch n X (a1j + a2j ) · bj = j=1 = n X j=1 n X a1j · bj + a2j · bj = a1j · bj + j=1 n X a2j · bj = j=1 = c1 + c2 , n X a2j · bj = c2 . j=1 also (b1 , b2 , . . . , bn ) ∈ L∗∗ . Ist umgekehrt (b1 , b2 , . . . , bn ) ∈ L∗∗ gegeben, so gilt n X j=1 (a1j + a2j ) · bj = c1 + c2 , n X j=1 a2j · bj = c2 , 1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN 16 und damit auch n X a1j · bj = j=1 = = n X j=1 n X j=1 n X (a1j + a2j − a2j ) · bj = (a1j + aj2 ) · bj − a2j · bj = (a1j + a2j ) · bj − j=1 n X a2j · bj = (c1 + c2 ) − c2 = j=1 = c1 , n X a2j · bj = c2 . j=1 Des weiteren führen wir noch eine bequeme Schreibweise ein. Definition. Es sei ein lineares Gleichungssystem a11 · x1 + a12 · x2 + . . . + a1n · xn = c1 , a21 · x1 + a22 · x2 + . . . + a2n · xn = c2 , .. . am1 · x1 + am2 · x2 + . . . + amn · xn = cm gegeben. Das rechteckige Schema A= a11 a21 .. . a12 a22 .. . . . . a1n . . . a2n .. . am1 am2 . . . amn aus m Zeilen und n Spalten heißt Koeffizientenmatrix des a11 a12 . . . a1n a21 a22 . . . a2n A = .. .. .. . . . am1 am2 . . . amn Gleichungssystems, das Schema c1 c2 cn aus m Zeilen und n + 1 Spalten heißt erweiterte Matrix des Gleichungssystems. Allgemein bezeichnet man ein rechteckiges Schema a11 a12 . . . a1n a21 a22 . . . a2n A = .. .. .. . . . am1 am2 . . . amn 1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN 17 aus m Zeilen und n Spalten als eine m × n–Matrix, gesprochen: m kreuz m – Matrix, Plural: Matrizen (früher Matrices oder laut Duden Matrizes, aber Singular nicht Matrize. Die mathematische Begriffsbildung geht zurück auf Arthur Cayley, * Richmond 16. August 1821, + Cambridge 26. Januar 1895, 1844 - 1863 als gut verdienenender Rechtsanwalt tätig, 1863 auf den neueingerichteten Sadlerian Lehrstuhl für Mathematik in Cambridge berufen, Schöpfer der Matrizenrechnung. Wesentliche Ergebnisse der algebraischen Geometrie tragen seinen Namen. Er formulierte 1854 erstmals die abstrakte Definition einer Gruppe. Homepage: www-groups.dcs.st-and.ac.uk/history/Mathematicians/Cayley.html 25. Oktober 2002 Der große Brockhaus von 1979: Matrix [lat. >Stammutter<] 1) Anatomie: a) Mutterboden, z.B. Haar-M. in der Haarzwiebel, in der das Haar wächst; b) Eiweißhülle der Chromosomen. 2) Geowissenschaften: Grundmasse in Ergußgesteinen und das Bindemittel in Sedimentgesteinen. 3) Mathematik: rechteckige Anordnung von m · n Elementen einer Menge (meist eines Ringes) . . . Matrize [lat.-fr.] 1) 2) im Druckwesen. 3) die Negativform bei der Herstellung von Schallplatten. 4) Folien aus Wachspapier, Metall, Kunststoff u. a. zur Herstellung von Vervielfältigungen. Bezeichnungen und Schreibweisen. Der Menge aller m × n–Matrizen wird durch Rm,n oder M (m × n; R) bezeichnet. Man nennt m die Zeilenzahl, n die Spaltenzahl der Matrix A. Ein spezielles Element aij heißt Komponente von A; dabei ist i der Zeilenindex und j der Spaltenindex. Das n-Tupel ai = (ai1 , ai2 , . . . , ain ) heißt i–te Zeile oder i–ter Zeilenvektor von A (i = 1, . . . , m), das m-Tupel a1j a2j aj = .. . amj j–te Spalte oder j–ter Spaltenvektor von A (j = 1, . . . , n); die Zeilen und Spalten einer Matrix lassen sich als Teilmatrizen der gesamten Matrix auffassen; es handelt sich um n-Tupel beziehungsweise m-Tupel, die in besonderer Weise aufgeschrieben werden. Wenn es der Klarheit dient, schreibt man auch a1 a2 A = .. = (a1 , a2 , . . . , an ) . . am Kurzschreibweise für ein lineares Gleichungssystem: Ax = c ; 1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN 18 dabei bezeichnet A die Koeffizientenmatrix, x den Spaltenvektor x1 x2 x = .. . xn aufgefasst als Matrix mit n Zeilen und einer Spalte, sowie c den Spaltenvektor c1 c2 c = .. . . cm Die erweiterte Matrix hat dann die Form (a1 , a2 , . . . , an , c). Man könnte das Gleichungssystem dann auch in der Form aufschreiben: x 1 · a1 + x 2 · a2 + . . . + x n · an = c ; woraus sich unmittelbar der folgende theoretische Satz ergibt: Satz. Die Lösungsmenge des lineares Gleichungssystem: Ax = c ist genau dann nicht leer, wenn sich der Spaltenvektor c als Linearkombination der Spalten der Matrix A darstellen lässt. Den Äquivalenzumformungen eines linearen Gleichungssystems entsprechen die sogenannten elementaren Zeilenumformungen einer Matrix, der erweiterten Matrix des Gleichungssystems: Dabei handelt es sich zunächst um die beiden folgenden Typen von Umformungen einer Matrix A mit den Zeilenvektoren ai , i = 1, . . . , m: 1. Multiplikation einer Zeile mit einem Skalar a1 a2 . . . A= 7→ ai . .. am mit d 6= 0und a1 a2 .. . dai .. . am 1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN 19 2. Addition einer Zeile zu einer anderen A= a1 a2 .. . ai .. . aj .. . am a1 a2 .. . a +a 7→ i . j .. a j .. . am mit i 6= j. Durch Iteration erhält man zwei weitere Typen von Zeilenumformungen, die auch noch zu den elementaren gerechnet werden: 3. Die Addition eines Vielfachen einer Zeile zu einer anderen: a1 a1 a2 a2 .. .. . . ai ai + daj A = .. 7→ .. . . a aj j . . .. .. am am mit i 6= j, und 4. die Vertauschung von zwei Zeilen: A= a1 a2 .. . ai .. . aj .. . am 7→ a1 a2 .. . aj .. . ai .. . am 1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN 20 Beweis von 4. a1 a2 .. . ai .. . aj .. . am a1 a2 .. . 2. ai + aj 7→ .. . a j . .. am a1 a2 .. . 1. ai + aj 7→ .. . −a j . .. am a1 a2 .. . 2. ai + aj 7→ .. . a i . .. am 3. 7→ a1 a2 .. . aj .. . ai .. . am Damit können wir die früher bewiesenen Sätze folgendermaßen umformulieren und zusammenfassen. Satz. Bei elementaren Zeilenumformungen der erweiterten Matrix eines linearen Gleichungssystem ändert sich die Lösungsmenge nicht. Die Lösungsmenge eines linearen Gleichungssystems lässt sich einfach bestimmen, wenn die Koeffizientenmatrix in Zeilenstufenform gegeben ist. Definition. Eine m × n-Matrix A = (aij ) ist von Zeilenstufenform, wenn es (Spalten–)Indizes j1 , j2 , . . . jp mit 1 ≤ p ≤ m und 1 ≤ j1 < j2 < . . . < jp ≤ n gibt derart, daß gilt: aiji = 1 aij = 0 für 1 ≤ i ≤ p für j < ji oder i > p . Bei einem Gleichungssystem aus m Gleichungen mit n Unbekannten handelt es sich um eine m × n-Matrix und es gilt, wenn die Stufenindizes durch j1 , . . . , jp bezeichnet werden: Satz. 1. Ist cj 6= 0 für ein j > p, so ist die Lösungsmenge leer. 2. Ist jp ≤ n, so kann man für die n − p Unbekannten xj mit j 6= ji für i = 1, . . . , p beliebige Werte bj wählen und erhält dann der Reihe nach bjp = cp − apn bn − . . . − apjp +1 bjp +1 = cp − n X apj bj , j=jp +1 bjp−1 = cp−1 − ap−1n bn − . . . − ap−1jp−1 +1 bjp−1 +1 = n X = cp−1 − ap−1j bj , j=jp−1 +1 .. . baj1 = c1 − a1 nban − . . . − a1j1 +1 bj1 +1 = c1 − n X a1j bj . j=j1 +1 Satz. Jede von der Nullmatrix verschiedene Matrix kann durch elementare Zeilenumformungen in eine Matrix von Zeilenstufenform übergeführt werden. – Gaußsches Eliminationsverfahren, auch: Ausräumen einer Matrix – 1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN 21 Beispiel: 0 0 0 2 −1 0 1 −2 1 0 ; A= 0 −1 2 1 −1 0 0 0 1 2 Zeilenvertauschungen führen auf: 0 1 −2 1 0 0 −1 2 1 −1 ; 0 0 0 1 2 0 0 0 2 −1 nun wird die erste Zeile zur zweiten addiert: 0 1 −2 0 0 0 0 0 0 0 0 0 1 0 2 −1 ; 1 2 2 −1 zur Vermeidung von Brüchen empfiehlt es sich nun die zweite und die dritte Zeile zu vertauschen: 0 1 −2 1 0 0 0 0 1 2 ; 0 0 0 2 −1 0 0 0 2 −1 jetzt ziehen wir die dritte Zeile von der vierten ab: 0 1 −2 1 0 0 0 0 1 2 0 0 0 2 −1 0 0 0 0 0 ; zur gewünschten Zeilenstufenform kommen wir dann, in dem wir noch das doppelte der zweiten Zeile von der dritten abziehen: 0 1 −2 1 0 0 0 0 1 2 ; 0 0 0 0 −5 0 0 0 0 0 und die vierte Zeile durch -5 dividieren: 0 1 −2 1 0 0 0 0 1 2 0 0 0 0 1 0 0 0 0 0 . Dies Ergebnis lässt sich nun noch für lineare Gleichungssysteme interpretieren. 1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN 22 1. Ist A die Koeffizientenmatrix eines homogenen Gleichungssystems, so ergibt sich die Lösungsmenge L = {(b1 , 2b3 , b3 , 0, 0)|b1 , b3 , b5 ∈ R} . 2. Ist A die erweiterte Matrix eines inhomogenen Gleichungssystems, so ist die Lösungsmenge leer. Das Ausräumen einer Matrix A 6= 0,, das heißt, einer Matrix, deren Komponenten nicht alle verschwinden, geschieht mit dem Gaußschen Eliminationsverfahren systematisch in folgender Weise. 1. Man sucht die Spalte mit dem niedrigsten Index j1 , in der nicht verschwindende Komponenten stehen: j1 = min{j|j ∈ {1, 2, . . . , n}, aij 6= 0 für ein i ∈ {1, 2, . . . , m}} . 2. Durch eine Zeilenvertauschung erreicht man a1j1 6= 0. 3. Multiplikation der ersten Zeile mit 1/a1j1 führt zu einer Matrix mit a1j1 = 1. 4. Jetzt zieht man für i ∈ {2, 3, . . . , m} das aij1 -fache der ersten Zeile von der i-ten Zeile ab; die Spalte mit dem Index j1 hat nun 1 in der ersten Komponente und 0 sonst. Die erste Zeile und die Spalten mit den Indizes kleiner-gleich j1 bleiben im folgenden unverändert. 5. Wir betrachten die Matrix, die wir durch Streichen der ersten Zeile und der Spalten mit den Indizes kleiner-gleich j1 erhalten und wenden die Schritte 1. bis 4. darauf an. Damit finden wir den gesuchten Spaltenindex j2 und die Spalte mit diesem Index hat die gewünschte Form. 6. Das Verfahren wird fortgesetzt und endet entweder mit einer m-ten Zeile (0,0,. . . ,0,1) oder damit, dass die nach dem Streichen erhaltene Matrix die 0-Matrix ist. 29. Oktober 2002 Fundamentallösungen eines homogenen linearen Gleichungssystems Ax = 0, dessen Koeffizientenmtrix A in Zeilenstufenform gegeben ist. Es seien j1 , j2 , . . . , jp die Stufenindizes. Für jedes j ∈ {1, 2, . . . , n}\{j1 , j2 , . . . , jp } haben wir eine Fundamentallösung v1j v2j j v = .. . . vnj Wir setzen die freien Variablen 1, i = j . vij = 0, i ∈ {1, 2, . . . , n}\{j1 , j2 , . . . , jp , j} 1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN 23 und erhalten für die Komponenten mit den Spaltenindizes 0, P jk > j , vjk j = p − l=k+1 akjl vjl j − akj , jk < j . Jede weitere Lösung ist eindeutig als Linearkombination dieser Fundamentallösungen darstellbar. Beispiel. 0 1 −2 1 0 0 1 2 . A= 0 0 0 0 0 0 1 Die allgemeine Lösung von Ax = 0 hat die Form (b1 , 2b3 , b3 , 0, 0). Wir haben die Fundamentallösungen 1 0 0 2 , v3 = 1 . 0 v1 = 0 0 0 0 Für die allgemeine Lösung gilt dann: b1 2b3 b3 0 0 = b1 · v 1 + b3 · v 3 . Eine spezielle Lösung im inhomogenen Fall erhält man, in dem man alle freien Variablen gleich Null setzt. Matrizenoperationen. Matrizen mit gleicher Zeilen- und Spaltenzahl können addiert werden: A = (aij ) , B = (bij ) ∈ Rm,n , : A + B = (aij + bij ) ∈ Rm,n . Für diese Summenbildung gilt: (A + B) + C = A + (B + C) Assoziativgesetz A + B = B + A Kommutativgesetz Die Matrix 0=(0), deren sämtliche Komponenten gleich Null sind, ist ein neutrales Element bezüglich dieser Addition: A + 0 = A = 0 + A. Zu jeder Matrix A gibt es eine bezüglich der Addition inverse Matrix B, das heißt, eine Matrix B, für die gilt: A + B = 0 = B + A, 1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN 24 Hat A die Komponenten aij , so hat B die Komponenten −aij . Eine weitere Matrizenoperation ist die Multiplikation einer Matrix mit einem Skalar : A = (aij ) , d ∈ R : dA = d · A = (d · aij . Hierfür gelten die folgenden Regeln: d(eA) (d + e)A d(A + B) 0·A d·0 1·A = = = = = = (de)A dA + eA Punkt vor Strich“ ” dA + dB Punkt vor Strich“ ” 0 0 A Die komponentenweise Multiplikation zweier Matrizen gleichen Typs ergibt keine wichtige Operation. Unter der Matrizenmultiplikation“ versteht man deshalb eine ganz andere Operation, ” zu der die folgenden Überlegungen führen. Wir interpretieren die Zeilen einer (m × n)-Matrix A = (aij ) als lineare Funktionen in n Variablen: Für i ∈ {1, 2, . . . , m} setzen wir fi : (x1 , x2 , . . . , xn ) 7→ ai1 x1 + ai2 x2 + . . . + ain xn . Für jedes n-Tupel (b1 , b2 , . . . , bn ) haben wir dann m Funktionswerte c1 = f1 (b1 , b2 , . . . , bn ), c2 = f2 (b1 , b2 , . . . , bn ), . . . , cm = fm (b1 , b2 , . . . , bn ): ci = n X aij bj . j=1 Diese fassen wir zu einem m-Tupel (c1 , c2 , . . . , cm ) zusammen. Damit ordnen wir jedem Element von Rn ein Element von Rm zu, wir haben eine Abbildung Rn → Rm , (b1 , b2 , . . . , bn ) 7→ (c1 , c2 , . . . , cm ) , die wir wegen ihrer Herkunft von der Matrix A ebenfalls mit A bezeichnen: A Rn → R m . Diese Abbildungen haben zunächst die folgenden Eigenschaften: • die Abbildung A ist additiv,, das heißt mit Summen verträglich: A(b1 + b2 ) = A(b1 ) + A(b2 ) ; • die Abbildung A ist homogen,, das heißt mit der Multiplikation mit Skalaren verträglich: A(d · b) = d · A(b) ; 1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN 25 • die Abbildung A ist linear,, das heißt mit Linearkombinationen verträglich: p p X X k A( dk · b ) = dk · A(bk ) ; k=1 k=1 • Linearkombinationen von Matrizen liefern die entsprechenden Linearkombinationen der Werte: p p X X k ( dk · A )(b) = dk · Ak (b) . k=1 k=1 Interpretiert man ein Matrix als Abbildung, so haben wir die Spalten der Matrix eine besondere Bedeutung. Um diese zu erkennen benötigen wir die sogenannten Einheitsvektoren im Rn . Zur Beschreibung benutzen wir das Kroneckersymbol : 1, i = j , j δij = δi = 0, i 6= j . Der j-te Einheitsvektor in Rn ist das n-Tupel ej = (δij ) mit 1 als j-ter Komponente und 0 sonst. Damit berechnen wir für die durch die Matrix A bestimmte Abbildung: A(ej ) = aj , das heißt, in den Spalten der Matrix stehen die Bilder der Einheitsvektoren! Wenn man es in der Mathematik mit Abbildungen ähnlichen Typs zu tun hat, stellt sich immer die Frage nach der Verkettung, das heißt, der Hintereinanderausführung solcher Abbildungen. Betrachten wir dazu A Rm ← Rm mit A = (aij ) und setzen wir eine Abbildung B Rn ← R p davor, die von einer (p × m)-Matrix B = (bjk ) induziert ist. A B Rm ← Rm ← R p . Behauptung: Auch die Verkettung A◦B ist von einer Matrix, einer (p×m)-Matrix, induziert. Beweis. Wir rechnen das Bild eines p-Tupels d = (d1 , d2 , . . . , dp ) unter der Verkettung aus: Pp b d 1k k k=1 Pp p X k=1 b2k dk = A ◦ B(d) = A(B(d)) = A( bjk dk ) = A Pp . . . k=1 k=1 bnk dk 1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN 26 =( n X j=1 aij · p X k=1 p p n X n X X X bjk dk ) = ( aij bjk dk ) = ( ( aij bjk )dk ) . j=1 k=1 k=1 j=1 Bilden wir nun die Matrix C = (cik ) mit den Komponenten cik = n X aij bjk , j=1 so erkennen wir, dass für die zugehörigen Abbildungen gilt A◦B =C. Die Matrix C wird als Produkt der Matrizen A und B, symbolisch: C = A·B = AB, bezeichnet, weil ihre Bildung viele Eigenschaften eines Produktes aufweist. 5. November 2002 Eigenschaften des Matrizenproduktes. • Das Produkt der Matrizen A und B ist nur definiert, wenn die Spaltenzahl von A gleich der Zeilenzahl von B ist. In der Abbildungssprache bedeutet das: das Matrizenprodukt ist eine Abbildung Rm,n × Rn,p −→ Rm,p . • Die Komponente cik ergibt sich, indem man die n Komponenten der i-ten Zeile der Matrix A gliedweise mit den n Komponenten der k-ten Spalte der Matrix B multipliziert und die erhaltenen Produkte addiert. • Beispiel. 4 2 8 8 2 18 3 0 · 1 2 0 3 = 3 6 0 9 2 0 1 3 0 2 4 0 2 6 • Im Fall m = n = p sind zwar sowohl AB als auch BA definiert, aber im allgemeinen gilt AB 6= BA. Beispiel: 0 1 1 0 0 −1 · = −1 0 0 −1 −1 0 1 0 0 1 0 1 · = . 0 −1 −1 0 1 0 Damit ist das Matrizenprodukt nicht kommutativ. • Das Matrizenprodukt ist assoziativ. Beweis. Da in den Spalten der Matrix die Bilder der Einheitsvektoren unter der zugehörigen Abbildung stehen, ist eine Matrix durch die zugehörige Abbildung eindeutig 1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN 27 bestimmt. Zum Nachweis der Assoziativität des Matrizenproduktes genügt es deshalb die Assoziativität der Verkettung von Abbildungen nachzuweisen: (A ◦ B) ◦ C = A ◦ (B ◦ C) . Diese gilt aber ganz allgemein: (A ◦ B) ◦ C(d) = A ◦ B(C(d)) = A(B(C(d))) = A(B ◦ C)(d)) = A ◦ (B ◦ C)(d) für alle d aus dem Definitionsbereich der Abbildung C. Der rechnerische Nachweis der Assoziativität braucht einen großen Schreibaufwand und kann durch die eben geführte Argumentation vermieden werden. • Das Matrizenprodukt verhält sich distributiv: (A + B)C = AC + BC , A(B + C) = AB + AC . • Das Matrizenprodukt ist mit der Multiplikation mit Skalaren verträglich: (dA)B = d(AB) = A(dB) . • Im Fall p = 1 lässt sich die Matrix B als Spaltenvektor b ∈ Rn auffassen, und das Ergebnis als Spaltenvektor c ∈ Rm . In diesem Sinn ist der Wert der Abbildung A an der Stelle b nichts anderes als das Matrizenprodukt Ab: A(b) = c = Ab . Konvention: In Zukunft schreiben wir Ab statt A(b), falls keine Verwechslungen möglich sind. • Das Produkt Zeile mal Spalte ist nur definiert, falls beide die gleiche Länge haben; das Produkt Spalte mal Zeile kann man jedoch immer bilden. Definition und Bezeichnung. Die zu einer m × n-Matrix A = (aij ) transponierte Matrix At = (atij ) ist eine n × m-Matrix und entsteht aus A durch Vertauschen der Zeilen und Spalten: atij = aji . Das Transponieren ist mit der Matrizenaddition und der Multiplikation mit Skalaren verträglich: (A + B)t = At + B t , (dA)t = d(At ) Bezüglich der Matrizenmultiplikation gilt: (AB)t = B t · At Zum Abschluss dieses Kapitels soll noch einige spezielle Matrizentypen vorgestellt werden. Definitionen. 1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN 28 1. Eine Matrix heißt quadratisch, wenn die Zeilenzahl gleich der Spaltenzahl ist. Ist diese Anzahl n, so hat man eine quadratische Matrix der Dimension n. 2. Die quadratische Matrix E = En = (δij ) (der Dimension n) heißt (n-dimensionale) Einheitsmatrix. Die Einheitsmatrix ist ein neutrales Element bezüglich der Matrizenmultiplikation (soweit definiert): A ∈ Rm,n =⇒ Em · A = A = A · En . 3. Eine quadratische Matrix A = (aij ) heißt stochastisch, wenn alle Komponenten nicht negativ sind und die Summe der Komponenten einer Zeile für jede Zeile gleich 1 ist: X aij = 1 für alle i . j Die stochastischen Matrizen dienen zur Beschreibung der sogenannten homogenen Markovketten, benannt nach Andrej Andrejevič Markov, ∗ 14. 6. 1856 im Gouvernement Rjasan, † 20. 7. 1922 St. Petersburg, ab 1893 Professor an der Universität in St. Petersburg. Dabei geht es um eine Folge von Versuchen, wobei in jedem Versuch nur eins von k unvereinbaren Ereignissen A1 , A2 , . . . , Ak eintreten kann und die Wahrscheinlichkeit für das Eintreten des Ereignisses Aj bei einem Versuch nur davon abhängt, welches Ereignis Ai im vorigen Versuch eingetreten ist. Bezeichnet pij diese Wahrscheinlichkeit, so ist die sogenannte Übergangsmatrix (oder der Übergangskern) (pij ) eine stochastische Matrix. Beispiel. Ein Teilchen bewege sich auf der Zahlengeraden durch zufällige Stöße zwischen 1 und n, wobei es immer nur bei einer natürlichen Zahl zum Stillliegen kommt. Dabei gelte folgendes: • Befindet sich das Teilchen vor dem Stoß an der Stelle 1, so wird es auf die Stelle 2 gestoßen. • Befindet sich das Teilchen vor dem Stoß an der Stelle n, so wird es auf die Stelle n − 1 gestoßen. • Befindet sich das Teilchen vor dem Stoß an einer Stelle i mit 1 < i < n, so wird es mit der Wahrscheinlichkeit p auf die Stelle i − 1 und mit der Wahrscheinlichkeit 1 − p auf die Stelle gestoßen. Hier hat die Übergangsmatrix 0 p 0 .. . 0 0 die folgende Form: 1 0 0 0 1−p 0 p 0 1−p .. .. .. . . . 0 0 0 0 0 0 ... 0 0 ... 0 0 ... 0 0 .. .. . . 0 0 0 .. . ... p 0 1 − p ... 0 1 0 Satz. Das Produkt von zwei stochastischen Matrizen gleicher Dimension ist wieder eine stochastische Matrix. 1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN 29 Beweis. Es seien A = (aij ) und B = (bjk ) stochastische Matrizen der Dimension n. Aus aij ≥ 0 Pn für alle i, j und bjk ≥ 0 für alle j, k folgt j=1 aij bjk ≥ 0 für alle i, k. Ferner gilt: n X n X k=1 j=1 aij bjk = n X n X j=1 k=1 aij bjk = n X j=1 aij n X k=1 bjk = n X j=1 aij · 1 = n X aij = 1 . j=1 Unsere Beispielmatrix mit sich selbst multipliziert ergibt: p 0 1−p 0 ... 0 0 0 2 0 2p − p2 0 (1 − p) . . . 0 0 0 2 p2 0 2p − 1p p 0 ... 0 0 0 2 2 0 p 0 2p − 1p p . . . 0 0 0 .. .. .. .. .. .. .. . . . . . . . 0 0 0 0 . . . 0 (1 − p)2 0 0 0 0 ... p 0 1−p . Sie beschreibt, mit welcher Wahrscheinlichkeit sich ein Teilchen von der Stelle i nach zwei Stößen an der Stelle j befindet.