Lineare Algebra I für Informatiker

Rudolf Fritsch
Wintersemester 2001/02
Lineare Algebra I für Informatiker
15. Oktober 2002
In der Vorlesung Lineare Algebra“, die Sie am Anfang Ihres Informatikstudiums hören, werden
”
Sie mathematische Techniken kennenlernen, die grundlegend für die eigentliche Informatik sind
und dort immer wieder benötigt werden. Aber ich kann Ihnen nicht alles einschlägige Material
vortragen. Um den Stoff voll und unter verschiedenen Gesichtspunkten zu erfassen, ist die
Hinzuziehung von Literatur notwendig.
Zu dem Thema der Vorlesung gibt es sehr viele Lehrbücher. Einige wenige habe ich im Kommentierten Vorlesungsverzeichnis angegeben, das Sie im Internet finden. Sie stehen im Lesesaal
unserer Institutsbibliothek. Ich empfehle Ihnen, sich zu Beginn noch nicht ein solches Buch zu
kaufen, sondern zunächst einmal im Lesesaal mit verschiedenen Werken zu arbeiten und sich
dann das anzuschaffen, mit dem Sie persönlich am besten zurecht kommen; das kann individuell sehr verschieden sein. Für den Anfang besonders empfehlen möchte ich die im Internet
genannten Bücher:
• Gerd Fischer:
Lineare Algebra - Eine Einführung für Studienanfänger
Braunschweig / Wiesbaden: 13 2002. X, 384 Seiten, Vieweg Verlag, ISBN: 3-528-97217-3
Ladenpreis: EUR 19,90
• Klaus Jänich:
Lineare Algebra
Berlin / Heidelberg / New York / London / Paris / Tokio / Hongkong / Barcelona /
Budapest: 9 2003. XII, 271 Seiten, Springer Verlag, ISBN: 3-540-43587-5
Ladenpreis: EUR 19,95
• Herbert Möller:
Algorithmische Lineare Algebra
Braunschweig / Wiesbaden: 1997. X, 389 Seiten, Vieweg Verlag, ISBN: 3-528-05528-6
Ladenpreis: EUR 29,90
• Bodo Pareigis:
Lineare Algebra für Informatiker
Berlin / Heidelberg / New York / Barcelona / Hongkong / London / Mailand / Paris /
Singapur / Tokio: 2000. VI, 274 Seiten, Springer, ISBN 3-540-67533-7
Ladenpreis: EUR 24,95
sowie
• Albrecht Beutelspacher:
Lineare Algebra – Eine Einführung in die Wissenschaft der Vektoren, Abbildungen und
Matrizen
Braunschweig / Wiesbaden: 5 2001. XII, 289 Seiten, Vieweg Verlag, ISBN: 3-528-46508-5
Ladenpreis: EUR 19,90
1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN
2
Die genannten Lehrbücher stammen alle von deutschen Autoren und verwenden die deutsche Sprache. Solche gibt es eigentlich nur noch für wirkliche Anfängertexte. Fortgeschrittene Lehrbücher werden heute überall auf der Welt in Englisch verfasst, wie vor 200 Jahren in
Latein. Aus diesem Grund empfehle ich Ihnen auch ein Buch zu unserem Stoff in englischer
Sprache, aus der Feder des 1916 in Ungarn geborenen, früherem Präsidenten der American
Mathematical Society,
• Paul R. Halmos: Finite-Dimensional Vector Spaces, erstmals 1942 in den Vereingten
Staaten von Amerika erschienen, neueste Ausgabe New York / Heidelberg / Berlin: 1993.
VIII, 200 Seiten, Springer-Verlag, ISBN: 3-540-90093-4
Ladenpreis: EUR 44,95
1
Grundlegendes über Lineare Gleichungssysteme und
Matrizen
Die Linearen Gleichungssysteme durchziehen wie ein roter Faden die ganze Lineare Algebra,
zunächst als Objekte eigenständiger Untersuchungen, dann in Anwendungen. Wir wollen ganz
elementar beginnen. Eine lineare Gleichung einfachsten Typs ist ein Ausdruck der Form
a · x = c.
Dabei sind sogenannten Konstanten (Formvariablen) a und c Elemente eines Zahlbereichs, der
Einfachheit halber nehmen wir zunächst den Bereich R der reellen Zahlen:
a, c ∈ R .
Es ist häufig hilfreich, sich die reellen Zahlen geometrisch als Punkte auf der Zahlengeraden vorzustellen. Der Buchstabe x symbolisiert eine Unbestimmte, Unbekannte oder Variable (Lösungsvariable). Eine Zahl b ∈ R ist eine Lösung der Gleichung, wenn die Ersetzung der Unbestimmten
durch diese Zahl zu einer wahren Aussage führt, das heißt, wenn sie Gleichung erfüllt:
a · b = c.
Im ursprünglichen Sinn beschreibt die Gleichung eine Aufgabe:
Man bestimme die Lösungsmenge, das heißt, die Menge der Lösungen:
L = {b ∈ R|a · b = c} .
Wir wollen diese Aufgabe allgemein lösen. Für spezielle Werte von a und c haben Sie das in der
Schule gelernt, im 6., spätestens im 7. Schuljahr. Die allgemeine Lösung aufzuschreiben, das ist
gar nicht so einfach, wie Sie zunächst denken mögen. Wir benötigen Fallunterscheidungen.
1. Fall: Ist a 6= 0, so ist eine Äquivalenzumformung der Gleichung möglich, man multipliziert
beide Seiten der Gleichung mit 1/a und erhält die äquivalente Gleichung
x=
c
.
a
1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN
3
Die Lösungsmenge besteht aus genau einem Element, der Zahl x = c/a:
nco
a 6= 0 ⇒ L =
.
a
(allgemeiner Fall )
2. Fall: Ist a = 0, so ist eine weitere Fallunterscheidung notwendig.
1. Unterfall: Ist c 6= 0, die Gleichung also von der Form
0 · x = c (6= 0) ,
so erfüllt keine reelle Zahl die Gleichung:
a = 0 ∧ c 6= 0 ⇒ L = ∅ .
2. Unterfall: Ist auch c = 0, die Gleichung also von der Form
0 · x = 0,
so erfüllt jede reelle Zahl die Gleichung:
a = c = 0 ⇒ L = R.
(Sonderfall )
Sie werden sich und mich vielleicht fragen, warum dieses akribische Vorgehen nötig ist. Man
sieht doch in jedem Fall sofort, was los ist. Gerade für Informatiker ist aber diese Auffassung
falsch. Wenn man einen Computer programmiert, so sieht dieser von selbst gar nichts. Ein
Programm benötigt genau diese Schritte.
Die angegebene Lösung der gegebenen linearen Gleichung ist auch noch abhängig von dem gegebenen Zahlbereich, beziehungsweise möglicherweise verschiedenen Zahlbereichen für die Konstanten und Lösungen. Nehmen wir etwa als Zahlbereich für beides die Menge der natürlichen
Zahlen
N = {1, 2, 3, . . .} ,
so sieht die allgemeine Lösung ganz anders aus; es sind allerdings wieder zwei Fälle zu unterscheiden:
1. Fall: Ist c ein Vielfaches von a, also c = a·b mit b ∈ N, so ist diese Zahl b die einzige Lösung:
c = a · b mit b ∈ N ⇒ L = {b} .
2. Fall: Ist c kein Vielfaches von a, also c 6= a · b für alle b ∈ N, so ist die Lösungsmenge leer:
c 6= a · b für alle b ∈ N ⇒ L = ∅ .
1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN
4
Noch ein anderes Ergebnis erhalten wir, wenn wir die Konstanten den natürlichen Zahlen
entnehmen, als Lösungen aber auch Bruchzahlen nz (mit z, n ∈ N) zulassen. Dann hat die
betrachtete Gleichung immer genau eine Lösung:
nco
L=
.
a
Die Menge der Bruchzahlen wird durch B bezeichnet:
z
B = { |z, n ∈ N} .
n
Bis auf weiteres setze ich bei den folgenden Verallgemeinerungen wegen der geometrischen
Anschaulichkeit voraus, dass wir über dem Bereich R der reellen Zahlen arbeiten, das heißt, die
betrachteten Konstanten stehen für reelle Zahlen, die Lösungen, die gleich keine Zahlen mehr
sein werden, werden aus reellen Zahlen aufgebaut.
Was wir bis jetzt behandelt haben, das ist der einfachste Fall einer linearen Gleichung, eine
lineare Gleichung in e i n e r Unbekannten. Als nächstes betrachten wir lineare Gleichungen in
z w e i Unbekannten. Wir schreiben sie in einer der folgenden Formen
a·x+c·y =e
oder
a1 · x 1 + a2 · x 2 = c .
Die erste Form dürfte ihnen von der Schule her vertraut sein, sie vermittelt auch besser die
geometrische Anschauung; die zweite benutzt sogenannte untere Indizes, hier 1, 2, und bringt
den mathematischen Hintergrund besser zum Ausdruck. Die Lösungen einer solchen Gleichung
sind nun nicht mehr Zahlen, sondern geordnete Paare von Zahlen, sie bestehen also immer aus
zwei Zahlen, von denen die eine die erste Komponente, und die andere die zweite Komponente
ist. Dabei dürfen die beide Komponenten durchaus einander gleich sein. Ist die Gleichung in
der zweiten Form angegeben, so bietet es sich an, eine Lösung allgemein als Paar (b1 , b2 ) zu
schreiben. Ein solches Zahlenpaar ist genau dann eine Lösung, wenn gilt:
a1 · b 1 + a2 · b 2 = c .
Für die erste Form könnte man die Lösungen als Paare (b, d) angegeben, für die gilt:
a · b + c · d = e.
Sind die Komponenten eines solchen Paare Zahlen in Dezimalbruchdarstellung, so verwendet
man zur Trennung der Komponenten einen Strichpunkt ;“ oder einen vertikalen Strich |“;
”
”
andernfalls könnten Missverständnisse auftreten:
(3; 4, 5) = (3|4, 5) oder
(3, 4, 5) =
(3, 4; 5) = (3, 4|5) .
Geometrisch kann man die Lösungen als Punkte in der Anschauungsebene deuten. Die Komponenten heißen dann auch Koordinaten. Die Gesamtheit dieser Paare, geometrisch aller Punkte
der Ebene, wird durch R × R oder R2 bezeichnet:
R × R = R2 = {(b, d)|b ∈ R ∧ d ∈ R} .
1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN
5
Intermezzo: Die Menge R × R aller Paare reeller Zahlen heißt cartesisches Produkt von R
mit sich selbst. Die Benutzung des Wortes Produkt“ wird dabei aus folgender Überlegung
”
abgeleitet. Sind A und B zwei endliche Mengen und so ist die Anzahl aller geordneten Paare,
deren erste Komponente ein Element von A und deren zweite Komponente ein Element von B
ist, gerade das Produkt der Anzahlen der Elemente von A beziehungsweise B:
#A × B = #A × #B .
(Ist A eine endliche Menge, so bezeichnet #A oder |A| die Anzahl der Elemente von A.)
Zurück zur Diskussion einer Gleichung mit zwei Unbekannten. Wieder geht es um die Bestimmung der Lösungsmenge einer solchen Gleichung. Wir gehen dabei von der ersten Form aus
und haben wieder Fälle zu unterscheiden.
1. Ist c 6= 0, so erhält man durch eine Äquivalenzumformung die Gleichung
a
e
y =− ·x+ .
c
c
Daraus erhält man als Lösungsmenge
e − a · b L=
b,
b ∈ R ,.
c
Geometrisch ist die Lösungsmenge eine Gerade mit der Steigung −a/c und e/c als Achsenabschnitt auf der y-Achse. Sie lässt sich auch interpretieren als der Graph der linearen
Funktion
e−a·x
.
x 7→
c
2. Ist c = 0, so sieht die Gleichung aus wie eine lineare Gleichung in einer Unbekannten.
Aber die möglichen Lösungsmengen sind von ganz anderer Art. Es sind wieder Fälle zu
unterscheiden.
2.1. Ist a 6= 0, so erhält man durch ein Äquivalenzumformung die Gleichung
x=
e
.
a
Daraus erhält man als Lösungsmenge
n e o
L=
,d | d ∈ R ,.
a
Geometrisch ist die Lösungsmenge eine zur y-Achse parallele Gerade.
2.2. Ist auch a = 0, ist eine weitere Fallunterscheidung nötig.
2.2.1. Ist e 6= 0, so gibt es keine Lösungen:
L = ∅.
1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN
6
2.2.2. Ist schließlich noch e = 0, so sind alle Zahlenpaare Lösungen:
L = R2 .
Geometrisch ist das die ganze Ebene.
Überall in der Natur, insbesondere in der Physik und in der Statistik treten nicht nur lineare
Gleichungen mit einer oder zwei Unbekannten auf. Die Zahl der Unbekannten kann sehr viel
größer sein. Mein Ururgroßonkel Josef Loschmidt berechnete die Zahl der Moleküle pro Mol,
etwa 6 mal 1023 , das ist die nach ihm benannte Loschmidtsche Zahl. Die Physiker beschreiben
jedes Molekül mit drei Ortskoordinaten und drei Geschwindigkeitskoordinaten und kommen
damit zu Gleichungen in 36 mal 1023 Unbekannten!
Wir setzen nun solche Gleichungen allgemein an, eine Gleichung mit n Unbekannten (n ∈ N)
schreiben wir in der Form
a1 · x 1 + a2 · x 2 + . . . + an · x n = c .
Man schreibt eine solche Gleichung auch in der Form:
n
X
aj · x j = c ,
j=1
oder etwas kürzer, wenn klar ist, welcher Index läuft:
n
X
aj · x j = c .
1
In einer Gleichung dieser Form ist es üblich, die Konstanten a1 , a2 , . . . , an besonders zu benennen, sie stehen bei den Unbestimmten und heißen deshalb Beiwerte oder Koeffizienten, englisch:
coefficients. Eine Lösung der Gleichung ist eine Folge reeller Zahlen der Länge n, geschrieben
(b1 , b2 , . . . , bn ) .
Statt von Folgen spricht man in diesem Zusammenhang allerdings von n-Tupeln (reeller Zahlen).
Die Gesamtheit dieser n-Tupel heißt n-dimensionaler Raum (über R) – Bezeichnung: Rn – auch
wenn dieser Raum für n > 3 nur sehr schlecht zu veranschaulichen ist. Trotzdem verwendet man
auch in diesem Zusmmenhang geometrische Sprechweisen, bezeichnet ein n-Tupel als Punkt und
gewisse Teilmengen als Geraden oder Ebenen; das ist anschaulich und suggestiv. Ein n-Tupel
(b1 , b2 , . . . , bn ) ist genau dann eine Lösung, wenn gilt:
a1 · b 1 + a2 · b 2 + . . . + an · b n = c .
Bei der Bestimmung der allgemeinen Lösung dieser Gleichung wird nun der Unterschied zwischen mathematischem und informatischem Vorgehen deutlich.
Wir beginnen mit der mathematischen Sichtweise. Sie führt auf die folgende Fallunterscheidung:
1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN
7
1. Nicht alle Koeffizienten a1 , a2 , . . . , an sind gleich Null, das heißt, es gibt ein aj0 6= 0.
O.w.E. (= Ohne wesentliche Einchränkung, oder O.B.d.A. = Ohne Beschränkung der
Allgemeinheit) können wir j0 = n, also an 6= 0 annehmen. Dann führt eine Äquivalenzumformung auf die Form
n−1
c
1 X
xn =
−
·
aj x j .
an an j=1
Daraus ergibt sich die Lösungsmenge
(
!
)
n−1
X
1
L=
b1 , b2 , . . . , bn−1 , (c −
aj bj ) b1 , b2 , . . . , bn−1 ∈ R .
an
j=1
Wie im Fall n = 2 lässt sich die Lösungsmenge als Graph der Funktion
n−1
c
1 X
−
·
aj x j
(x1 , x2 , . . . , xn−1 ) 7→
an an j=1
deuten. Das ist im Moment vielleicht nicht sehr hilfreich. Sie wissen von der Schule, dass
die Lösungsmenge im Fall n = 3 eine Ebene ist, man wählt im dreidimensionalen Raum
zwei freie Variable, hat ein – wie man sagt – zweidimensionales Gebilde, eine Dimension niedriger als der ganze Raum. Im allgemeinen ist das Gebilde in einem zunächst
n-dimensionalen Raum anschaulich von der Dimension n − 1, eins weniger als die volle
Dimension. Dafür hat man im linearen Fall den Begriff Hyperebene geprägt, im nichtlinearen Fall spricht man von Hyperflächen.
Es sei noch gezeigt, was passiert, wenn man auf die Einschränkung j0 = n verzichtet.
Dann löst man die Ausgangsgleichung nach xj0 statt nach xn auf:
j0 −1
n
X
c
1 X
1
−
·
aj x j −
·
aj xj
xj0 =
aj0
aj0 j=1
aj0 j=j +1
0
und die explizite Angabe der Lösungsmenge erfordert wesentlich mehr Schreibarbeit, aber
keine wirklich neuen Ideen.
2. Alle Koeffizienten verschwinden, das heißt, sind gleich Null:
a1 = a2 = . . . = an = 0 .
Dann ist wie in den früheren Überlegungen eine weitere Fallunterscheidung notwendig.
2.1. Ist c 6= 0, so ist L = ∅.
2.2. Ist c = 0, so ist L = Rn .
18. Oktober 2002
Wie behandelt nun ein Informatiker dieser Aufgabe?
1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN
8
1. Es sei a1 6= 0. Äquivalenzumformungen ergeben
a2
an
c
x1 + x2 + . . . + xn =
,
a1
a1
a1
n
c
1 X
x1 =
−
·
aj x j ,
a1 a1 j=2
und daraus erhält man die Lösungsmenge
(
!
)
n
X
1
(c −
aj bj , b2 , b3 , . . . , bn b2 , b3 , . . . , bn ∈ R
L=
a1
j=2
wie in der mathematischen Sichtweise; der Austausch von n und 1 ist dabei wirklich
unwesentlich. Dann geht es aber anders weiter.
2. Es sei a1 = 0. Dann kommt die Fallunterscheidung:
2.1. Es sei a2 6= 0. Nun ergibt eine Äquivalenzumformung:
n
c
1 X
x2 =
−
·
aj x j ,
a2 a2 j=3
und daraus erhält man die Lösungsmenge
(
!
)
n
X
1
L=
b1 , (c −
aj bj , b3 , b4 , . . . , bn ) b1 , b3 , . . . , bn−1 ∈ R .
a2
j=3
2.2. Es sei a2 = 0. Dann kommt die Fallunterscheidung:
2.2.1. Es sei a3 6= 0. Nun ergibt eine Äquivalenzumformung:
n
c
1 X
x3 =
−
·
aj x j ,
a3 a3 j=4
und daraus erhält man die Lösungsmenge
(
!
)
n
X
1
aj bj , b4 , b5 , . . . , bn ) b1 , b2 , b4 . . . , bn−1 ∈ R .
L=
b1 , b2 , (c −
a3
j=4
2.2.2. Es sei a3 = 0.
..
.
2.2.2.. . . .1. Es sei an 6= 0. Nun ergibt eine Äquivalenzumformung:
c
xn =
,
an
und daraus erhält man die Lösungsmenge
c b1 , b2 , . . . , bn−1 ,
b1 , b2 , . . . , bn−1 ∈ R .
L=
an 1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN
9
2.2.2.. . . .2. Es sei an = 0. Dann kommt schließlich noch die Fallunterscheidung:
2.2.2.. . . .2.1. Ist c 6= 0, so ist L = ∅.
2.2.2.. . . .2.2. Ist c = 0, so ist L = Rn .
Im Fall n = 3 lassen sich die erhaltenen nichttrivialen Lösungsmengen geometrisch veranschaulichen, wozu im dreidimensionalen Raum das folgende rechtwinklige Koordinatensystem
einführen.
6
*
x1
x
3 x2
-
Die Diskussion folgt der Beschreibung der Lösungsmengen in der Informatik.
1. a1 6= 0: Die Lösungsmenge lässt sich als Graph der in der (x2 , x3 )-Ebene definierten
Funktion
1
(x2 , x3 ) 7→ (c − a2 · x2 − a3 · x3 )
a1
deuten und ist eine Ebene in allgemeiner Lage“, die die x1 -Achse im Punkt (c/a1 , 0, 0)
”
schneidet.
2.1. a1 = 0 6= a2 : Die Lösungsmenge ist eine zur x1 -Achse parallele, also zur (x2 , x3 )-Ebene
senkrechte Ebene, die die (x2 , x3 )-Ebene in der durch die Gleichung a2 · x2 + a3 · x3 = c
beschriebenen Geraden schneidet.
2.2.1. a1 = a2 = 0 =
6 a3 : Die Lösungsmengeist eine zur (x1 , x2 )-Ebene parallele Ebene, die die
x3 -Achse im Punkt (0, 0, c/a3 ) schneidet.
Im Verlauf dieser Überlegungen haben mehrfach Äquivalenzumformungen eine wichtige Rolle
gespielt. Sie sollten diesen Begriff aus Ihrer Schulzeit kennen. Eine Äquivalenzumformungen
beschreibt bekanntlich den Übergang von einer Gleichung zu einer anderen, ohne dass sich die
Lösungsmenge ändert. Dabei ist ein Typ von Äquivalenzumformungen besonders wichtig.
Satz. Die Lösungsmenge einer linearen Gleichung ändert sich nicht, wenn man sie mit einer
festen, von Null verschiedenen Zahl multipliziert.
Erklärung und Beweis. Eine lineare Gleichung mit einer Zahl multiplizieren bedeutet, alle Konstanten mit dieser Zahl zu multiplizieren, also den Übergang von der Gleichung
(∗)
a1 · x 1 + a2 · x 2 + . . . + an · x n = c
zu der Gleichung
(∗∗)
(d · a1 ) · x1 + (d · a2 ) · x2 + . . . + (d · an ) · xn = d · c .
1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN 10
Es ist zu zeigen, dass für d 6= 0 Lösungsmengen L∗ und L∗∗ beider Gleichungen übereinstimmen,
das heisst, dass jede Lösung von (∗) auch Lösung von (∗∗) ist und umgekehrt. Wir schreiben
dies formal auf:
(b1 , b2 , . . . , bn ) ∈ L∗ ⇔
n
X
aj · b j = c ⇔
j=1
⇔ d·
n
X
aj · b j = d · c ⇔
j=1
⇔
n
X
(d · aj ) · bj = d · c ⇔ (b1 , b2 , . . . , bn ) ∈ L∗∗ .
j=1
Der Übergang von der ersten zur zweiten Zeile funktioniert für jede Zahl d, die Rückrichtung,
das sogenannte Kürzen durch d, ist aber nur für d 6= 0 möglich.
Die bisherige Diskussion zeigt, dass die nichtleeren Lösungsmengen einer linearen Gleichungen
in mehr als einer Unbekannten immer viele, über dem Zahlbereich R unendlich viele Elemente
enthalten. Aber sie sind trotzdem nicht ganz beliebig, sie haben spezielle Eigenschaften, die
sich geometrisch etwa in den Aussagen die Lösungsmenge ist eine Gerade“, die Lösungsmen”
”
ge ist eine Ebene“ widerspiegeln. Für die Darstellung solcher Eigenschaften ist die folgende
Begriffsbildung hilfreich. Eine lineare Gleichung
a1 · x 1 + a2 · x 2 + . . . + an · x n = c
heißt homogen, wenn c = 0 gilt, sonst inhomogen.
Satz. Für eine homogene lineare Gleichung gilt:
1. Die Lösungsmenge ist nicht leer.
2. Ein Vielfaches einer Lösung ist wieder eine Lösung.
3. Die Summe zweier Lösungen ist auch eine Lösung.
4. Jede Linearkombination von Lösungen ist eine Lösung.
Beweis. Wir betrachten die homogene lineare Gleichung
n
X
aj · x j = 0
j=1
in n Unbekannten.
1. Das n-Tupel 0=(0,0,. . . ,0) mit allen Komponenten gleich Null ist Lösung.
2. Ein Vielfaches eines n-Tupels (b1 , b2 , . . . , bn ) erhält man, in dem man alle Komponenten
mit derselben Zahl d multipliziert, es hat also die Form:
d · (b1 , b2 , . . . , bn ) = (d · b1 , d · b2 , . . . , d · bn ) ;
1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN 11
speziell spricht man vom d-fachen des ursprünglichen n-Tupels.
Für jede Lösung (b1 , b2 , . . . , bn ) unserer Gleichung und jede Zahl d berechnen wir:
n
X
aj · (d · bj ) =
n
X
d · aj · b j = d ·
j=1
j=1
n
X
aj · b j = d · 0 = 0 ;
j=1
also ist auch (d · b1 , d · b2 , . . . , d · bn ) eine Lösung unserer Gleichung.
3. Unter der Summe der n-Tupel (b11 , b21 , . . . , bn1 ) und (b12 , b22 , . . . , bn2 ) versteht man das
n-Tupel, das man durch komponentenweise Addition erhält:
(b11 , b21 , . . . , bn1 ) + (b12 , b22 , . . . , bn2 ) = (b11 + b12 , b12 + b22 , . . . , bn1 + bn2 ) .
Sind die n-Tupel (b11 , b21 , . . . , bn1 ) und (b12 , b22 , . . . , bn2 ) Lösungen unser Gleichung, so
berechnen wir
n
X
aj · (bj1 + bj2 ) =
j=1
n
X
aj · bj1 + aj · bj2 =
j=1
n
X
aj · bj1 +
j=1
n
X
aj · bj2 = 0 + 0 = 0 ;
j=1
also ist auch (b11 + b12 , b12 + b22 , . . . , bn1 + bn2 ) eine Lösung unserer Gleichung.
4. Es seien n-Tupel (b11 , b21 , . . . , bn1 ), (b12 , b22 , . . . , bn2 ), . . . , (b1p , b2p , . . . , bnp ) gegeben (p ∈
N). Eine Linearkombination aus diesen n-Tupeln ist ein n-Tupel der Form:
p
p
p
X
X
X
(
dk · b1k ,
dk · b2k , . . . ,
dk · b1k ) =
k=1
k=1
k=1
= d1 · (b11 , b21 , . . . , bn1 ) + d2 · (b12 , b22 , . . . , bn2 ) + . . . + dp · (b1p , b2p , . . . , bnp )
mit beliebigen Zahlen d1 , d2 , . . . , dp . Sind die gegebenen n-Tupel Lösungen unserer Gleichung, so berechnen wir für eine Linearkombination
n
X
j=1
aj ·
p
X
k=1
dk ·bjk =
p
n X
X
j=1 k=1
aj ·dk ·bjk =
p
n
X
X
aj ·dk ·bjk =
k=1 j=1
p
X
k=1
also ist auch die Linearkombination eine Lösung.
dk ·
n
X
j=1
aj ·bjk =
p
X
dk ·0 = 0 ;
k=1
Dieser Sachverhalt erlaubt es, die allgemeine Lösung einer homogenen Gleichung, deren Koeffizienten nicht alle verschwinden, als Linearkombination gewisser Basislösungen darzustellen.
Wir betrachten wieder die homogene lineare Gleichung
a1 · x 1 + a2 · x 2 + . . . + an · x n = 0
in n Unbekannten und nehmen dabei wieder an 6= 0 an. Da dann die Multiplikation der Gleichung mit 1/an – wie eben bewiesen – die Lösungsmenge nicht ändert, können wir sogar an = 1,
also
a1 · x1 + a2 · x2 + . . . + xn = 0 ,
1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN 12
annehmen. Die vorhin entwickelten allgemeine Lösung hat die Form
(b1 , b2 , . . . , bn−1 , −
n−1
X
aj b j ) .
j=1
Wir haben die folgenden speziellen Lösungen
(1, 0, 0, . . . , 0, −a1 ),
(0, 1, 0, . . . , 0, −a2 ),
(0, 0, 1, . . . , 0, −a3 ),
..
.
(0, 0, 0, . . . , 1, −an−1 ).
22. Oktober 2002
Die allgemeine Lösung ist dann in eindeutiger Weise als Linearkombination dieser Basislösungen
darstellbar:
(b1 , b2 , . . . , bn−1 , −
n−1
X
aj bj ) = b1 · (1, 0, 0, . . . , 0, −a1 ) + . . . + bn−1 · (0, 0, 0, . . . , 1, −an−1 ) .
j=1
Zum Nachweis der Eindeutigkeit betrachten wir eine beliebige Linearkombination der Basislösungen:
d1 · (1, 0, 0, . . . , 0, −a1 ) + . . . + dn−1 · (0, 0, 0, . . . , 1, −an−1 ) = (d1 , d2 , . . . , dn−1 , −
n−1
X
aj dj ) .
j=1
Diese stimmt aber eben nur dann mit der betrachteten Lösung überein, wenn gilt:
d1 = b1 , d2 = b2 , . . . , dn−1 = bn−1 .
Nun wenden wir uns dem inhomogenen Fall zu. Ist eine inhomogene Gleichung
a1 · x1 + a2 · x2 + . . . + an · xn = c(6= 0)
gegeben, so heißt die Gleichung
a1 · x 1 + a2 · x 2 + . . . + an · x n = 0
zugehörige homogene Gleichung.
Die wesentlichen Aussage über die Lösungsmengen inhomogener Gleichungen enthält der folgende
Satz. Für eine inhomogene lineare Gleichung gilt:
1. Die Lösungsmenge ist genau dann nicht leer, wenn nicht alle Koeffizienten verschwinden.
2. Die Differenz zweier Lösungen ist eine Lösung der zugehörigen homogenen Gleichung.
1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN 13
3. Ist die Lösungsmenge nicht leer, so erhält man alle Lösungen, indem man zu einer speziellen Lösung der inhomogenen Gleichung alle Lösungen der zugehörigen homogenen
Gleichung addiert.
Beweis. Wir betrachten die Gleichung
a1 · x1 + a2 · x2 + . . . + an · xn = c(6= 0) .
Es sei L ihre Lösungsmenge und Lh die Lösungsmenge der zugehörigen homogenen Gleichung.
1. L =
6 ∅ ⇔ nicht alle aj = 0
ergibt sich aus den vorherigen Überlegungen.
2. Für die Differenz
(b11 , b21 , . . . , bn1 ) − (b12 , b22 , . . . , bn2 ) = (b11 − b12 , b12 − b22 , . . . , bn1 − bn2 )
von (b11 , b21 , . . . , bn1 ) ∈ L und (b12 , b22 , . . . , bn2 ) ∈ L berechnen wir:
n
X
aj · (bj1 − bj2 ) =
j=1
n
X
aj · bj1 −
j=1
n
X
aj · bj2 = c − c = 0 ;
j=1
also gehört die Differenz zu Lh .
3. Es sei (b10 , b20 , . . . , bn0 ) ∈ L fest gegeben. Mit (b10 , b20 , . . . , bn0 ) + Lh bezeichnen wir die
Menge aller n-Tupel, die sich als Summe aus (b10 , b20 , . . . , bn0 ) und einem n-Tupel in Lh
darstellen lassen. Es ist
L = (b10 , b20 , . . . , bn0 ) + Lh
zu zeigen. Wir müssen dazu nachweisen, dass jedes Element der Menge auf der linken Seite
auch zu der Menge auf der rechten Seite des Gleichheitszeichens gehört und umgekehrt.
⊂“: Sei (b11 , b21 , . . . , bn1 ) ∈ L gegeben. Nach 2. ist die Differenz
”
(b12 , b22 , . . . , bn2 ) = (b11 , b21 , . . . , bn1 ) − (b10 , b20 , . . . , bn0 ) ∈ Lh
und damit ist
(b11 , b21 , . . . , bn1 ) = (b10 , b20 , . . . , bn0 ) + (b12 , b22 , . . . , bn2 ) ∈ (b10 , b20 , . . . , bn0 ) + Lh .
⊃“: Für
”
(b10 , b20 , . . . , bn0 ) + (b12 , b22 , . . . , bn2 ) = (b10 + b12 , b20 + b22 , . . . , bn0 + bn2 )
mit
(b12 , b22 , . . . , bn2 ) ∈ Lh
berechnen wir:
n
X
j=1
aj · (bj0 + bj2 ) =
n
X
j=1
aj · bj0 + aj · bj2 =
n
X
j=1
aj · bj0 +
n
X
j=1
aj · bj2 = c + 0 = c ;
1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN 14
also gilt:
(b10 , b20 , . . . , bn0 ) + (b12 , b22 , . . . , bn2 ) ∈ L .
Zur Auswahl einer festen Lösung nehmen wir o.B.d.A. wieder an = 1 an. Dann ist
(0, 0, . . . , 0, c) ∈ L.
Bei Beschreibung von Phänomene des Alltags kommt man häufig nicht mit einer Gleichung aus.
Zum Beispiel wird eine Gerade im dreidimensionalen Raum als Schnitt zweier Ebenen durch
zwei lineare Gleichung in drei Unbekannten beschreiben. Das führt allgemein zu dem Begriff
des linearen Gleichungssystems (aus m Gleichungen in n Unbekannten:
a11 · x1 + a12 · x2 + . . . + a1n · xn = c1 ,
a21 · x1 + a22 · x2 + . . . + a2n · xn = c2 ,
..
.
am1 · x1 + am2 · x2 + . . . + amn · xn = cm .
Unter der Lösungsmenge eines linearen Gleichungssystems versteht man den Durchschnitt der
Lösungsmengen der einzelnen Gleichungen:
L = L1 ∩ L2 ∩ . . . ∩ Lm =
m
\
Li .
i=1
In Analogie zu unserer Diskussion einer Gleichung heißt ein solches Gleichungssystem homogen,
falls c1 = c2 = . . . = cm = 0 ist, sonst inhomogen. Das zugehörige homogene System zu einem
inhomogenen Gleichungssystem erhält man, in dem man die rechten Seiten aller Gleichungen
Null setzt.
Für die Lösungsmengen von linearen Gleichungssystem gelten die gleichen Sätze wie für die
Lösungsmengen einer linearen Gleichungen.
Satz. Für ein homogenes Gleichungssystem gilt:
1. Die Lösungsmenge ist nicht leer.
2. Ein Vielfaches einer Lösung ist wieder eine Lösung.
3. Die Summe zweier Lösungen ist auch eine Lösung.
4. Jede Linearkombination von Lösungen ist eine Lösung.
Auf einen expliziten Beweis dieses Satzes verzichten wir im Moment, er fällt uns bei späteren
Strukturüberlegungen einfach in den Schoß.
Satz. Für ein inhomogenes lineares Gleichungssystem gilt:
1. Die Differenz zweier Lösungen ist eine Lösung des zugehörigen homogenen Systems.
2. Ist die Lösungsmenge nicht leer, so erhält man alle Lösungen, indem man zu einer speziellen Lösung des inhomogenen Systems alle Lösungen des zugehörigen homogenen Systems
addiert.
1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN 15
Diesen Satz beweist man für Systeme genau so wie für einzelne Gleichungen. Allerdings enthält
er keine Aussage darüber, wann die Lösungsmenge eines inhomogenen Gleichungssystems nicht
leer ist. Eine solche ist für Gleichungssysteme wesentlich schwieriger als für eine einzelne Gleichung und wird erst später entwickelt.
Auch die Auffindung von Basislösungen für ein homogenes Gleichungssystem gestaltet sich
schwieriger als bei einer einzelnen Gleichung. Diesem Problem werden wir uns als nächstes
widmen. Für Gleichungssystem gibt es noch eine wichtige Äquivalenzumformung:
Satz. Die Lösungsmenge eines linearen Gleichungssystems ändert sich nicht, wenn man eine
Gleichung durch die Summe aus dieser und einer anderen Gleichung ersetzt.
Beweis. Da bei dieser Umformung nur zwei Gleichung des Systems involviert sind, genügt es
o.B.d.A. ein System aus zwei Gleichungen zu betrachten. Wir zeigen: Die Lösungsmenge L∗ des
Systems
a11 · x1 + a12 · x2 + . . . + a1n · xn = c1 ,
a21 · x1 + a22 · x2 + . . . + a2n · xn = c2
stimmt mit der Lösungsmenge L∗∗ des Systems
(a11 + a21 ) · x1 + (a12 + a22 ) · x2 + . . . + (a1n + a2n ) · xn = c1 + c2 ,
a21 · x1 + a22 · x2 + . . . + a2n · xn = c2
überein: L∗ = L∗∗ .
Sei zunächst (b1 , b2 , . . . , bn ) ∈ L∗ gegeben. Dann gilt:
n
X
a1j · bj = c1 ,
j=1
n
X
a2j · bj = c2 ,
j=1
und damit auch
n
X
(a1j + a2j ) · bj =
j=1
=
n
X
j=1
n
X
a1j · bj + a2j · bj =
a1j · bj +
j=1
n
X
a2j · bj =
j=1
= c1 + c2 ,
n
X
a2j · bj = c2 .
j=1
also (b1 , b2 , . . . , bn ) ∈ L∗∗ .
Ist umgekehrt (b1 , b2 , . . . , bn ) ∈ L∗∗ gegeben, so gilt
n
X
j=1
(a1j + a2j ) · bj = c1 + c2 ,
n
X
j=1
a2j · bj = c2 ,
1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN 16
und damit auch
n
X
a1j · bj =
j=1
=
=
n
X
j=1
n
X
j=1
n
X
(a1j + a2j − a2j ) · bj =
(a1j + aj2 ) · bj − a2j · bj =
(a1j + a2j ) · bj −
j=1
n
X
a2j · bj = (c1 + c2 ) − c2 =
j=1
= c1 ,
n
X
a2j · bj = c2 .
j=1
Des weiteren führen wir noch eine bequeme Schreibweise ein.
Definition. Es sei ein lineares Gleichungssystem
a11 · x1 + a12 · x2 + . . . + a1n · xn = c1 ,
a21 · x1 + a22 · x2 + . . . + a2n · xn = c2 ,
..
.
am1 · x1 + am2 · x2 + . . . + amn · xn = cm
gegeben. Das rechteckige Schema



A=

a11
a21
..
.
a12
a22
..
.

. . . a1n
. . . a2n
..
.
am1 am2 . . . amn
aus m Zeilen und n Spalten heißt Koeffizientenmatrix des

a11 a12 . . . a1n
 a21 a22 . . . a2n

A =  ..
..
..
 .
.
.
am1 am2 . . . amn




Gleichungssystems, das Schema

c1
c2 



cn
aus m Zeilen und n + 1 Spalten heißt erweiterte Matrix des Gleichungssystems.
Allgemein bezeichnet man ein rechteckiges Schema


a11 a12 . . . a1n
 a21 a22 . . . a2n 


A =  ..
..
.. 
 .
.
. 
am1 am2 . . . amn
1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN 17
aus m Zeilen und n Spalten als eine m × n–Matrix, gesprochen: m kreuz m – Matrix, Plural:
Matrizen (früher Matrices oder laut Duden Matrizes, aber Singular nicht Matrize. Die mathematische Begriffsbildung geht zurück auf
Arthur Cayley, * Richmond 16. August 1821, + Cambridge 26. Januar 1895, 1844 - 1863
als gut verdienenender Rechtsanwalt tätig, 1863 auf den neueingerichteten Sadlerian Lehrstuhl
für Mathematik in Cambridge berufen, Schöpfer der Matrizenrechnung. Wesentliche Ergebnisse
der algebraischen Geometrie tragen seinen Namen. Er formulierte 1854 erstmals die abstrakte
Definition einer Gruppe.
Homepage: www-groups.dcs.st-and.ac.uk/history/Mathematicians/Cayley.html
25. Oktober 2002
Der große Brockhaus von 1979:
Matrix [lat. >Stammutter<] 1) Anatomie: a) Mutterboden, z.B. Haar-M. in der Haarzwiebel, in der das Haar wächst; b) Eiweißhülle der Chromosomen. 2) Geowissenschaften:
Grundmasse in Ergußgesteinen und das Bindemittel in Sedimentgesteinen. 3) Mathematik: rechteckige Anordnung von m · n Elementen einer Menge (meist eines Ringes) . . .
Matrize [lat.-fr.] 1) 2) im Druckwesen. 3) die Negativform bei der Herstellung von Schallplatten. 4) Folien aus Wachspapier, Metall, Kunststoff u. a. zur Herstellung von Vervielfältigungen.
Bezeichnungen und Schreibweisen. Der Menge aller m × n–Matrizen wird durch Rm,n
oder M (m × n; R) bezeichnet. Man nennt m die Zeilenzahl, n die Spaltenzahl der Matrix A.
Ein spezielles Element aij heißt Komponente von A; dabei ist i der Zeilenindex und j der
Spaltenindex. Das n-Tupel ai = (ai1 , ai2 , . . . , ain ) heißt i–te Zeile oder i–ter Zeilenvektor von A
(i = 1, . . . , m), das m-Tupel


a1j
 a2j 


aj =  .. 
 . 
amj
j–te Spalte oder j–ter Spaltenvektor von A (j = 1, . . . , n); die Zeilen und Spalten einer Matrix
lassen sich als Teilmatrizen der gesamten Matrix auffassen; es handelt sich um n-Tupel beziehungsweise m-Tupel, die in besonderer Weise aufgeschrieben werden. Wenn es der Klarheit
dient, schreibt man auch


a1
 a2 


A =  ..  = (a1 , a2 , . . . , an ) .
 . 
am
Kurzschreibweise für ein lineares Gleichungssystem:
Ax = c ;
1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN 18
dabei bezeichnet A die Koeffizientenmatrix, x den Spaltenvektor


x1
 x2 


x =  .. 
 . 
xn
aufgefasst als Matrix mit n Zeilen und einer Spalte, sowie c den Spaltenvektor


c1
 c2 


c =  ..  .
 . 
cm
Die erweiterte Matrix hat dann die Form (a1 , a2 , . . . , an , c). Man könnte das Gleichungssystem
dann auch in der Form aufschreiben:
x 1 · a1 + x 2 · a2 + . . . + x n · an = c ;
woraus sich unmittelbar der folgende theoretische Satz ergibt:
Satz. Die Lösungsmenge des lineares Gleichungssystem:
Ax = c
ist genau dann nicht leer, wenn sich der Spaltenvektor c als Linearkombination der Spalten der
Matrix A darstellen lässt.
Den Äquivalenzumformungen eines linearen Gleichungssystems entsprechen die sogenannten
elementaren Zeilenumformungen einer Matrix, der erweiterten Matrix des Gleichungssystems:
Dabei handelt es sich zunächst um die beiden folgenden Typen von Umformungen einer Matrix
A mit den Zeilenvektoren ai , i = 1, . . . , m:
1. Multiplikation einer Zeile mit einem Skalar



a1
 a2 

 . 

 . 

 . 

A=
 7→ 
 ai 

 . 

 .. 

am
mit d 6= 0und
a1
a2
..
.
dai
..
.
am









1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN 19
2. Addition einer Zeile zu einer anderen







A=







a1
a2
..
.
ai
..
.
aj
..
.
am

a1
a2
..
.











 a +a
 7→  i . j


..



 a


j


..


.
am














mit i 6= j.
Durch Iteration erhält man zwei weitere Typen von Zeilenumformungen, die auch noch zu den
elementaren gerechnet werden:
3. Die Addition eines Vielfachen einer Zeile zu einer anderen:




a1
a1
 a2 


a2




..
 .. 


 . 


.




 ai 
 ai + daj 




A =  ..  7→ 
..

.
.




 a 


aj
 j 




 . 
.
..
 .. 


am
am
mit i 6= j, und
4. die Vertauschung von zwei Zeilen:







A=






a1
a2
..
.
ai
..
.
aj
..
.
am














 7→ 












a1
a2
..
.
aj
..
.
ai
..
.
am














1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN 20
Beweis von 4.














a1
a2
..
.
ai
..
.
aj
..
.
am


a1
a2
..
.










 2.  ai + aj
 7→ 
..


.



 a


j


.
..


am


a1
a2
..
.










 1.  ai + aj
 7→ 
..


.


 −a



j


.
..


am


a1
a2
..
.










 2.  ai + aj
 7→ 
..


.



 a


i


.
..


am












 3. 
 7→ 












a1
a2
..
.
aj
..
.
ai
..
.
am














Damit können wir die früher bewiesenen Sätze folgendermaßen umformulieren und zusammenfassen.
Satz. Bei elementaren Zeilenumformungen der erweiterten Matrix eines linearen Gleichungssystem ändert sich die Lösungsmenge nicht.
Die Lösungsmenge eines linearen Gleichungssystems lässt sich einfach bestimmen, wenn die
Koeffizientenmatrix in Zeilenstufenform gegeben ist.
Definition. Eine m × n-Matrix A = (aij ) ist von Zeilenstufenform, wenn es (Spalten–)Indizes
j1 , j2 , . . . jp mit 1 ≤ p ≤ m und 1 ≤ j1 < j2 < . . . < jp ≤ n gibt derart, daß gilt:
aiji = 1
aij = 0
für 1 ≤ i ≤ p
für j < ji oder i > p .
Bei einem Gleichungssystem aus m Gleichungen mit n Unbekannten handelt es sich um eine
m × n-Matrix und es gilt, wenn die Stufenindizes durch j1 , . . . , jp bezeichnet werden:
Satz. 1. Ist cj 6= 0 für ein j > p, so ist die Lösungsmenge leer.
2. Ist jp ≤ n, so kann man für die n − p Unbekannten xj mit j 6= ji für i = 1, . . . , p
beliebige Werte bj wählen und erhält dann der Reihe nach
bjp = cp − apn bn − . . . − apjp +1 bjp +1 = cp −
n
X
apj bj ,
j=jp +1
bjp−1 = cp−1 − ap−1n bn − . . . − ap−1jp−1 +1 bjp−1 +1 =
n
X
= cp−1 −
ap−1j bj ,
j=jp−1 +1
..
.
baj1 = c1 − a1 nban − . . . − a1j1 +1 bj1 +1 = c1 −
n
X
a1j bj .
j=j1 +1
Satz. Jede von der Nullmatrix verschiedene Matrix kann durch elementare Zeilenumformungen
in eine Matrix von Zeilenstufenform übergeführt werden. – Gaußsches Eliminationsverfahren, auch: Ausräumen einer Matrix –
1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN 21
Beispiel:

0
0
0 2 −1
 0
1 −2 1
0 
;
A=
 0 −1
2 1 −1 
0
0
0 1
2

Zeilenvertauschungen führen auf:


0
1 −2 1
0
 0 −1
2 1 −1 
;

 0
0
0 1
2 
0
0
0 2 −1
nun wird die erste Zeile zur zweiten addiert:

0 1 −2
 0 0
0

 0 0
0
0 0
0

1
0
2 −1 
;
1
2 
2 −1
zur Vermeidung von Brüchen empfiehlt es sich nun die zweite und die dritte Zeile zu
vertauschen:


0 1 −2 1
0
 0 0
0 1
2 

;
 0 0
0 2 −1 
0 0
0 2 −1
jetzt ziehen wir die dritte Zeile von der vierten ab:

0 1 −2 1
0
 0 0
0
1
2

 0 0
0 2 −1
0 0
0 0
0


;

zur gewünschten Zeilenstufenform kommen wir dann, in dem wir noch das doppelte der
zweiten Zeile von der dritten abziehen:


0 1 −2 1
0
 0 0
0 1
2 

;
 0 0
0 0 −5 
0 0
0 0
0
und die vierte Zeile durch -5 dividieren:

0 1 −2 1 0
 0 0
0 1 2

 0 0
0 0 1
0 0
0 0 0


.

Dies Ergebnis lässt sich nun noch für lineare Gleichungssysteme interpretieren.
1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN 22
1. Ist A die Koeffizientenmatrix eines homogenen Gleichungssystems, so ergibt sich die Lösungsmenge
L = {(b1 , 2b3 , b3 , 0, 0)|b1 , b3 , b5 ∈ R} .
2. Ist A die erweiterte Matrix eines inhomogenen Gleichungssystems, so ist die Lösungsmenge
leer.
Das Ausräumen einer Matrix A 6= 0,, das heißt, einer Matrix, deren Komponenten nicht alle
verschwinden, geschieht mit dem Gaußschen Eliminationsverfahren systematisch in folgender
Weise.
1. Man sucht die Spalte mit dem niedrigsten Index j1 , in der nicht verschwindende Komponenten stehen:
j1 = min{j|j ∈ {1, 2, . . . , n}, aij 6= 0 für ein i ∈ {1, 2, . . . , m}} .
2. Durch eine Zeilenvertauschung erreicht man a1j1 6= 0.
3. Multiplikation der ersten Zeile mit 1/a1j1 führt zu einer Matrix mit a1j1 = 1.
4. Jetzt zieht man für i ∈ {2, 3, . . . , m} das aij1 -fache der ersten Zeile von der i-ten Zeile ab;
die Spalte mit dem Index j1 hat nun 1 in der ersten Komponente und 0 sonst. Die erste
Zeile und die Spalten mit den Indizes kleiner-gleich j1 bleiben im folgenden unverändert.
5. Wir betrachten die Matrix, die wir durch Streichen der ersten Zeile und der Spalten
mit den Indizes kleiner-gleich j1 erhalten und wenden die Schritte 1. bis 4. darauf an.
Damit finden wir den gesuchten Spaltenindex j2 und die Spalte mit diesem Index hat die
gewünschte Form.
6. Das Verfahren wird fortgesetzt und endet entweder mit einer m-ten Zeile (0,0,. . . ,0,1)
oder damit, dass die nach dem Streichen erhaltene Matrix die 0-Matrix ist.
29. Oktober 2002
Fundamentallösungen eines homogenen linearen Gleichungssystems Ax = 0, dessen
Koeffizientenmtrix A in Zeilenstufenform gegeben ist.
Es seien j1 , j2 , . . . , jp die Stufenindizes. Für jedes j ∈ {1, 2, . . . , n}\{j1 , j2 , . . . , jp } haben wir
eine Fundamentallösung


v1j
 v2j 


j
v =  ..  .
 . 
vnj
Wir setzen die freien Variablen
1, i = j .
vij =
0, i ∈ {1, 2, . . . , n}\{j1 , j2 , . . . , jp , j}
1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN 23
und erhalten für die Komponenten mit den Spaltenindizes
0, P
jk > j ,
vjk j =
p
− l=k+1 akjl vjl j − akj , jk < j .
Jede weitere Lösung ist eindeutig als Linearkombination dieser Fundamentallösungen darstellbar.
Beispiel.


0 1 −2 1 0
0 1 2 .
A= 0 0
0 0
0 0 1
Die allgemeine Lösung von Ax = 0 hat die Form (b1 , 2b3 , b3 , 0, 0). Wir haben die Fundamentallösungen
 
 
1
0
 0 
 2 
 
 
 , v3 =  1  .
0
v1 = 
 
 
 0 
 0 
0
0
Für die allgemeine Lösung gilt dann:






b1
2b3
b3
0
0



 = b1 · v 1 + b3 · v 3 .


Eine spezielle Lösung im inhomogenen Fall erhält man, in dem man alle freien Variablen gleich
Null setzt.
Matrizenoperationen.
Matrizen mit gleicher Zeilen- und Spaltenzahl können addiert werden:
A = (aij ) , B = (bij ) ∈ Rm,n , : A + B = (aij + bij ) ∈ Rm,n .
Für diese Summenbildung gilt:
(A + B) + C = A + (B + C) Assoziativgesetz
A + B = B + A Kommutativgesetz
Die Matrix 0=(0), deren sämtliche Komponenten gleich Null sind, ist ein neutrales Element
bezüglich dieser Addition:
A + 0 = A = 0 + A.
Zu jeder Matrix A gibt es eine bezüglich der Addition inverse Matrix B, das heißt, eine Matrix
B, für die gilt:
A + B = 0 = B + A,
1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN 24
Hat A die Komponenten aij , so hat B die Komponenten −aij .
Eine weitere Matrizenoperation ist die Multiplikation einer Matrix mit einem Skalar :
A = (aij ) , d ∈ R : dA = d · A = (d · aij .
Hierfür gelten die folgenden Regeln:
d(eA)
(d + e)A
d(A + B)
0·A
d·0
1·A
=
=
=
=
=
=
(de)A
dA + eA Punkt vor Strich“
”
dA + dB Punkt vor Strich“
”
0
0
A
Die komponentenweise Multiplikation zweier Matrizen gleichen Typs ergibt keine wichtige Operation. Unter der Matrizenmultiplikation“ versteht man deshalb eine ganz andere Operation,
”
zu der die folgenden Überlegungen führen.
Wir interpretieren die Zeilen einer (m × n)-Matrix A = (aij ) als lineare Funktionen in n
Variablen: Für i ∈ {1, 2, . . . , m} setzen wir
fi : (x1 , x2 , . . . , xn ) 7→ ai1 x1 + ai2 x2 + . . . + ain xn .
Für jedes n-Tupel (b1 , b2 , . . . , bn ) haben wir dann m Funktionswerte c1 = f1 (b1 , b2 , . . . , bn ),
c2 = f2 (b1 , b2 , . . . , bn ), . . . , cm = fm (b1 , b2 , . . . , bn ):
ci =
n
X
aij bj .
j=1
Diese fassen wir zu einem m-Tupel (c1 , c2 , . . . , cm ) zusammen. Damit ordnen wir jedem Element
von Rn ein Element von Rm zu, wir haben eine Abbildung
Rn → Rm , (b1 , b2 , . . . , bn ) 7→ (c1 , c2 , . . . , cm ) ,
die wir wegen ihrer Herkunft von der Matrix A ebenfalls mit A bezeichnen:
A
Rn → R m .
Diese Abbildungen haben zunächst die folgenden Eigenschaften:
• die Abbildung A ist additiv,, das heißt mit Summen verträglich:
A(b1 + b2 ) = A(b1 ) + A(b2 ) ;
• die Abbildung A ist homogen,, das heißt mit der Multiplikation mit Skalaren verträglich:
A(d · b) = d · A(b) ;
1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN 25
• die Abbildung A ist linear,, das heißt mit Linearkombinationen verträglich:
p
p
X
X
k
A(
dk · b ) =
dk · A(bk ) ;
k=1
k=1
• Linearkombinationen von Matrizen liefern die entsprechenden Linearkombinationen der
Werte:
p
p
X
X
k
(
dk · A )(b) =
dk · Ak (b) .
k=1
k=1
Interpretiert man ein Matrix als Abbildung, so haben wir die Spalten der Matrix eine besondere
Bedeutung. Um diese zu erkennen benötigen wir die sogenannten Einheitsvektoren im Rn . Zur
Beschreibung benutzen wir das Kroneckersymbol :
1, i = j ,
j
δij = δi =
0, i 6= j .
Der j-te Einheitsvektor in Rn ist das n-Tupel
ej = (δij )
mit 1 als j-ter Komponente und 0 sonst.
Damit berechnen wir für die durch die Matrix A bestimmte Abbildung:
A(ej ) = aj ,
das heißt, in den Spalten der Matrix stehen die Bilder der Einheitsvektoren!
Wenn man es in der Mathematik mit Abbildungen ähnlichen Typs zu tun hat, stellt sich immer
die Frage nach der Verkettung, das heißt, der Hintereinanderausführung solcher Abbildungen.
Betrachten wir dazu
A
Rm ← Rm
mit A = (aij ) und setzen wir eine Abbildung
B
Rn ← R p
davor, die von einer (p × m)-Matrix B = (bjk ) induziert ist.
A
B
Rm ← Rm ← R p .
Behauptung: Auch die Verkettung A◦B ist von einer Matrix, einer (p×m)-Matrix, induziert.
Beweis. Wir rechnen das Bild eines p-Tupels d = (d1 , d2 , . . . , dp ) unter der Verkettung aus:
 Pp

b
d
1k
k
k=1
Pp
p
X


k=1 b2k dk  =

A ◦ B(d) = A(B(d)) = A(
bjk dk ) = A 

Pp . . .
k=1
k=1 bnk dk
1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN 26
=(
n
X
j=1
aij ·
p
X
k=1
p
p
n X
n
X
X
X
bjk dk ) = (
aij bjk dk ) = ( (
aij bjk )dk ) .
j=1 k=1
k=1 j=1
Bilden wir nun die Matrix C = (cik ) mit den Komponenten
cik =
n
X
aij bjk ,
j=1
so erkennen wir, dass für die zugehörigen Abbildungen gilt
A◦B =C.
Die Matrix C wird als Produkt der Matrizen A und B, symbolisch: C = A·B = AB, bezeichnet,
weil ihre Bildung viele Eigenschaften eines Produktes aufweist.
5. November 2002
Eigenschaften des Matrizenproduktes.
• Das Produkt der Matrizen A und B ist nur definiert, wenn die Spaltenzahl von A gleich
der Zeilenzahl von B ist. In der Abbildungssprache bedeutet das: das Matrizenprodukt
ist eine Abbildung
Rm,n × Rn,p −→ Rm,p .
• Die Komponente cik ergibt sich, indem man die n Komponenten der i-ten Zeile der Matrix
A gliedweise mit den n Komponenten der k-ten Spalte der Matrix B multipliziert und
die erhaltenen Produkte addiert.
• Beispiel.




4 2
8 8 2 18
 3 0 · 1 2 0 3 = 3 6 0 9 
2 0 1 3
0 2
4 0 2 6
• Im Fall m = n = p sind zwar sowohl AB als auch BA definiert, aber im allgemeinen gilt
AB 6= BA. Beispiel:
0 1
1 0
0 −1
·
=
−1 0
0 −1
−1 0
1 0
0 1
0 1
·
=
.
0 −1
−1 0
1 0
Damit ist das Matrizenprodukt nicht kommutativ.
• Das Matrizenprodukt ist assoziativ.
Beweis. Da in den Spalten der Matrix die Bilder der Einheitsvektoren unter der zugehörigen Abbildung stehen, ist eine Matrix durch die zugehörige Abbildung eindeutig
1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN 27
bestimmt. Zum Nachweis der Assoziativität des Matrizenproduktes genügt es deshalb die
Assoziativität der Verkettung von Abbildungen nachzuweisen:
(A ◦ B) ◦ C = A ◦ (B ◦ C) .
Diese gilt aber ganz allgemein:
(A ◦ B) ◦ C(d) = A ◦ B(C(d)) = A(B(C(d))) = A(B ◦ C)(d)) = A ◦ (B ◦ C)(d)
für alle d aus dem Definitionsbereich der Abbildung C.
Der rechnerische Nachweis der Assoziativität braucht einen großen Schreibaufwand und
kann durch die eben geführte Argumentation vermieden werden.
• Das Matrizenprodukt verhält sich distributiv:
(A + B)C = AC + BC , A(B + C) = AB + AC .
• Das Matrizenprodukt ist mit der Multiplikation mit Skalaren verträglich:
(dA)B = d(AB) = A(dB) .
• Im Fall p = 1 lässt sich die Matrix B als Spaltenvektor b ∈ Rn auffassen, und das Ergebnis
als Spaltenvektor c ∈ Rm . In diesem Sinn ist der Wert der Abbildung A an der Stelle b
nichts anderes als das Matrizenprodukt Ab:
A(b) = c = Ab .
Konvention: In Zukunft schreiben wir Ab statt A(b), falls keine Verwechslungen möglich
sind.
• Das Produkt Zeile mal Spalte ist nur definiert, falls beide die gleiche Länge haben; das
Produkt Spalte mal Zeile kann man jedoch immer bilden.
Definition und Bezeichnung. Die zu einer m × n-Matrix A = (aij ) transponierte Matrix
At = (atij ) ist eine n × m-Matrix und entsteht aus A durch Vertauschen der Zeilen und Spalten:
atij = aji .
Das Transponieren ist mit der Matrizenaddition und der Multiplikation mit Skalaren verträglich:
(A + B)t = At + B t ,
(dA)t = d(At )
Bezüglich der Matrizenmultiplikation gilt:
(AB)t = B t · At
Zum Abschluss dieses Kapitels soll noch einige spezielle Matrizentypen vorgestellt werden.
Definitionen.
1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN 28
1. Eine Matrix heißt quadratisch, wenn die Zeilenzahl gleich der Spaltenzahl ist. Ist diese
Anzahl n, so hat man eine quadratische Matrix der Dimension n.
2. Die quadratische Matrix E = En = (δij ) (der Dimension n) heißt (n-dimensionale) Einheitsmatrix.
Die Einheitsmatrix ist ein neutrales Element bezüglich der Matrizenmultiplikation (soweit definiert):
A ∈ Rm,n =⇒ Em · A = A = A · En .
3. Eine quadratische Matrix A = (aij ) heißt stochastisch, wenn alle Komponenten nicht
negativ sind und die Summe der Komponenten einer Zeile für jede Zeile gleich 1 ist:
X
aij = 1
für alle i .
j
Die stochastischen Matrizen dienen zur Beschreibung der sogenannten homogenen Markovketten, benannt nach Andrej Andrejevič Markov, ∗ 14. 6. 1856 im Gouvernement Rjasan,
† 20. 7. 1922 St. Petersburg, ab 1893 Professor an der Universität in St. Petersburg. Dabei
geht es um eine Folge von Versuchen, wobei in jedem Versuch nur eins von k unvereinbaren
Ereignissen A1 , A2 , . . . , Ak eintreten kann und die Wahrscheinlichkeit für das Eintreten des
Ereignisses Aj bei einem Versuch nur davon abhängt, welches Ereignis Ai im vorigen Versuch
eingetreten ist. Bezeichnet pij diese Wahrscheinlichkeit, so ist die sogenannte Übergangsmatrix
(oder der Übergangskern) (pij ) eine stochastische Matrix.
Beispiel. Ein Teilchen bewege sich auf der Zahlengeraden durch zufällige Stöße zwischen 1 und
n, wobei es immer nur bei einer natürlichen Zahl zum Stillliegen kommt. Dabei gelte folgendes:
• Befindet sich das Teilchen vor dem Stoß an der Stelle 1, so wird es auf die Stelle 2 gestoßen.
• Befindet sich das Teilchen vor dem Stoß an der Stelle n, so wird es auf die Stelle n − 1
gestoßen.
• Befindet sich das Teilchen vor dem Stoß an einer Stelle i mit 1 < i < n, so wird es mit
der Wahrscheinlichkeit p auf die Stelle i − 1 und mit der Wahrscheinlichkeit 1 − p auf die
Stelle gestoßen.
Hier hat die Übergangsmatrix

0
 p

 0

 ..
 .

 0
0
die folgende Form:
1
0
0
0 1−p
0
p
0
1−p
..
..
..
.
.
.
0
0
0
0
0
0
... 0 0
... 0 0
... 0 0
.. ..
. .
0
0
0
..
.








... p 0 1 − p 
... 0 1
0
Satz. Das Produkt von zwei stochastischen Matrizen gleicher Dimension ist wieder eine stochastische Matrix.
1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN 29
Beweis. Es seien A = (aij ) und B = (bjk ) stochastische
Matrizen der Dimension n. Aus aij ≥ 0
Pn
für alle i, j und bjk ≥ 0 für alle j, k folgt j=1 aij bjk ≥ 0 für alle i, k.
Ferner gilt:
n X
n
X
k=1 j=1
aij bjk =
n X
n
X
j=1 k=1
aij bjk =
n
X
j=1
aij
n
X
k=1
bjk =
n
X
j=1
aij · 1 =
n
X
aij = 1 .
j=1
Unsere Beispielmatrix mit sich selbst multipliziert ergibt:

p
0
1−p
0
... 0
0
0
2
 0 2p − p2
0
(1
−
p)
.
.
.
0
0
0

2
 p2
0
2p − 1p p
0
... 0
0
0

2
2
 0
p
0
2p − 1p p . . . 0
0
0

 ..
..
..
..
..
..
..
 .
.
.
.
.
.
.

 0
0
0
0
. . . 0 (1 − p)2
0
0
0
0
... p
0
1−p






.




Sie beschreibt, mit welcher Wahrscheinlichkeit sich ein Teilchen von der Stelle i nach zwei
Stößen an der Stelle j befindet.