Lineare Algebra I für Informatiker

Werbung
Rudolf Fritsch
Wintersemester 2001/02
Lineare Algebra I für Informatiker
15. Oktober 2002
In der Vorlesung Lineare Algebra“, die Sie am Anfang Ihres Informatikstudiums hören, werden
”
Sie mathematische Techniken kennenlernen, die grundlegend für die eigentliche Informatik sind
und dort immer wieder benötigt werden. Aber ich kann Ihnen nicht alles einschlägige Material
vortragen. Um den Stoff voll und unter verschiedenen Gesichtspunkten zu erfassen, ist die
Hinzuziehung von Literatur notwendig.
Zu dem Thema der Vorlesung gibt es sehr viele Lehrbücher. Einige wenige habe ich im Kommentierten Vorlesungsverzeichnis angegeben, das Sie im Internet finden. Sie stehen im Lesesaal
unserer Institutsbibliothek. Ich empfehle Ihnen, sich zu Beginn noch nicht ein solches Buch zu
kaufen, sondern zunächst einmal im Lesesaal mit verschiedenen Werken zu arbeiten und sich
dann das anzuschaffen, mit dem Sie persönlich am besten zurecht kommen; das kann individuell sehr verschieden sein. Für den Anfang besonders empfehlen möchte ich die im Internet
genannten Bücher:
• Gerd Fischer:
Lineare Algebra - Eine Einführung für Studienanfänger
Braunschweig / Wiesbaden: 13 2002. X, 384 Seiten, Vieweg Verlag, ISBN: 3-528-97217-3
Ladenpreis: EUR 19,90
• Klaus Jänich:
Lineare Algebra
Berlin / Heidelberg / New York / London / Paris / Tokio / Hongkong / Barcelona /
Budapest: 9 2003. XII, 271 Seiten, Springer Verlag, ISBN: 3-540-43587-5
Ladenpreis: EUR 19,95
• Herbert Möller:
Algorithmische Lineare Algebra
Braunschweig / Wiesbaden: 1997. X, 389 Seiten, Vieweg Verlag, ISBN: 3-528-05528-6
Ladenpreis: EUR 29,90
• Bodo Pareigis:
Lineare Algebra für Informatiker
Berlin / Heidelberg / New York / Barcelona / Hongkong / London / Mailand / Paris /
Singapur / Tokio: 2000. VI, 274 Seiten, Springer, ISBN 3-540-67533-7
Ladenpreis: EUR 24,95
sowie
• Albrecht Beutelspacher:
Lineare Algebra – Eine Einführung in die Wissenschaft der Vektoren, Abbildungen und
Matrizen
Braunschweig / Wiesbaden: 5 2001. XII, 289 Seiten, Vieweg Verlag, ISBN: 3-528-46508-5
Ladenpreis: EUR 19,90
1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN
2
Die genannten Lehrbücher stammen alle von deutschen Autoren und verwenden die deutsche Sprache. Solche gibt es eigentlich nur noch für wirkliche Anfängertexte. Fortgeschrittene Lehrbücher werden heute überall auf der Welt in Englisch verfasst, wie vor 200 Jahren in
Latein. Aus diesem Grund empfehle ich Ihnen auch ein Buch zu unserem Stoff in englischer
Sprache, aus der Feder des 1916 in Ungarn geborenen, früherem Präsidenten der American
Mathematical Society,
• Paul R. Halmos: Finite-Dimensional Vector Spaces, erstmals 1942 in den Vereingten
Staaten von Amerika erschienen, neueste Ausgabe New York / Heidelberg / Berlin: 1993.
VIII, 200 Seiten, Springer-Verlag, ISBN: 3-540-90093-4
Ladenpreis: EUR 44,95
1
Grundlegendes über Lineare Gleichungssysteme und
Matrizen
Die Linearen Gleichungssysteme durchziehen wie ein roter Faden die ganze Lineare Algebra,
zunächst als Objekte eigenständiger Untersuchungen, dann in Anwendungen. Wir wollen ganz
elementar beginnen. Eine lineare Gleichung einfachsten Typs ist ein Ausdruck der Form
a · x = c.
Dabei sind sogenannten Konstanten (Formvariablen) a und c Elemente eines Zahlbereichs, der
Einfachheit halber nehmen wir zunächst den Bereich R der reellen Zahlen:
a, c ∈ R .
Es ist häufig hilfreich, sich die reellen Zahlen geometrisch als Punkte auf der Zahlengeraden vorzustellen. Der Buchstabe x symbolisiert eine Unbestimmte, Unbekannte oder Variable (Lösungsvariable). Eine Zahl b ∈ R ist eine Lösung der Gleichung, wenn die Ersetzung der Unbestimmten
durch diese Zahl zu einer wahren Aussage führt, das heißt, wenn sie Gleichung erfüllt:
a · b = c.
Im ursprünglichen Sinn beschreibt die Gleichung eine Aufgabe:
Man bestimme die Lösungsmenge, das heißt, die Menge der Lösungen:
L = {b ∈ R|a · b = c} .
Wir wollen diese Aufgabe allgemein lösen. Für spezielle Werte von a und c haben Sie das in der
Schule gelernt, im 6., spätestens im 7. Schuljahr. Die allgemeine Lösung aufzuschreiben, das ist
gar nicht so einfach, wie Sie zunächst denken mögen. Wir benötigen Fallunterscheidungen.
1. Fall: Ist a 6= 0, so ist eine Äquivalenzumformung der Gleichung möglich, man multipliziert
beide Seiten der Gleichung mit 1/a und erhält die äquivalente Gleichung
x=
c
.
a
1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN
3
Die Lösungsmenge besteht aus genau einem Element, der Zahl x = c/a:
nco
a 6= 0 ⇒ L =
.
a
(allgemeiner Fall )
2. Fall: Ist a = 0, so ist eine weitere Fallunterscheidung notwendig.
1. Unterfall: Ist c 6= 0, die Gleichung also von der Form
0 · x = c (6= 0) ,
so erfüllt keine reelle Zahl die Gleichung:
a = 0 ∧ c 6= 0 ⇒ L = ∅ .
2. Unterfall: Ist auch c = 0, die Gleichung also von der Form
0 · x = 0,
so erfüllt jede reelle Zahl die Gleichung:
a = c = 0 ⇒ L = R.
(Sonderfall )
Sie werden sich und mich vielleicht fragen, warum dieses akribische Vorgehen nötig ist. Man
sieht doch in jedem Fall sofort, was los ist. Gerade für Informatiker ist aber diese Auffassung
falsch. Wenn man einen Computer programmiert, so sieht dieser von selbst gar nichts. Ein
Programm benötigt genau diese Schritte.
Die angegebene Lösung der gegebenen linearen Gleichung ist auch noch abhängig von dem gegebenen Zahlbereich, beziehungsweise möglicherweise verschiedenen Zahlbereichen für die Konstanten und Lösungen. Nehmen wir etwa als Zahlbereich für beides die Menge der natürlichen
Zahlen
N = {1, 2, 3, . . .} ,
so sieht die allgemeine Lösung ganz anders aus; es sind allerdings wieder zwei Fälle zu unterscheiden:
1. Fall: Ist c ein Vielfaches von a, also c = a·b mit b ∈ N, so ist diese Zahl b die einzige Lösung:
c = a · b mit b ∈ N ⇒ L = {b} .
2. Fall: Ist c kein Vielfaches von a, also c 6= a · b für alle b ∈ N, so ist die Lösungsmenge leer:
c 6= a · b für alle b ∈ N ⇒ L = ∅ .
1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN
4
Noch ein anderes Ergebnis erhalten wir, wenn wir die Konstanten den natürlichen Zahlen
entnehmen, als Lösungen aber auch Bruchzahlen nz (mit z, n ∈ N) zulassen. Dann hat die
betrachtete Gleichung immer genau eine Lösung:
nco
L=
.
a
Die Menge der Bruchzahlen wird durch B bezeichnet:
z
B = { |z, n ∈ N} .
n
Bis auf weiteres setze ich bei den folgenden Verallgemeinerungen wegen der geometrischen
Anschaulichkeit voraus, dass wir über dem Bereich R der reellen Zahlen arbeiten, das heißt, die
betrachteten Konstanten stehen für reelle Zahlen, die Lösungen, die gleich keine Zahlen mehr
sein werden, werden aus reellen Zahlen aufgebaut.
Was wir bis jetzt behandelt haben, das ist der einfachste Fall einer linearen Gleichung, eine
lineare Gleichung in e i n e r Unbekannten. Als nächstes betrachten wir lineare Gleichungen in
z w e i Unbekannten. Wir schreiben sie in einer der folgenden Formen
a·x+c·y =e
oder
a1 · x 1 + a2 · x 2 = c .
Die erste Form dürfte ihnen von der Schule her vertraut sein, sie vermittelt auch besser die
geometrische Anschauung; die zweite benutzt sogenannte untere Indizes, hier 1, 2, und bringt
den mathematischen Hintergrund besser zum Ausdruck. Die Lösungen einer solchen Gleichung
sind nun nicht mehr Zahlen, sondern geordnete Paare von Zahlen, sie bestehen also immer aus
zwei Zahlen, von denen die eine die erste Komponente, und die andere die zweite Komponente
ist. Dabei dürfen die beide Komponenten durchaus einander gleich sein. Ist die Gleichung in
der zweiten Form angegeben, so bietet es sich an, eine Lösung allgemein als Paar (b1 , b2 ) zu
schreiben. Ein solches Zahlenpaar ist genau dann eine Lösung, wenn gilt:
a1 · b 1 + a2 · b 2 = c .
Für die erste Form könnte man die Lösungen als Paare (b, d) angegeben, für die gilt:
a · b + c · d = e.
Sind die Komponenten eines solchen Paare Zahlen in Dezimalbruchdarstellung, so verwendet
man zur Trennung der Komponenten einen Strichpunkt ;“ oder einen vertikalen Strich |“;
”
”
andernfalls könnten Missverständnisse auftreten:
(3; 4, 5) = (3|4, 5) oder
(3, 4, 5) =
(3, 4; 5) = (3, 4|5) .
Geometrisch kann man die Lösungen als Punkte in der Anschauungsebene deuten. Die Komponenten heißen dann auch Koordinaten. Die Gesamtheit dieser Paare, geometrisch aller Punkte
der Ebene, wird durch R × R oder R2 bezeichnet:
R × R = R2 = {(b, d)|b ∈ R ∧ d ∈ R} .
1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN
5
Intermezzo: Die Menge R × R aller Paare reeller Zahlen heißt cartesisches Produkt von R
mit sich selbst. Die Benutzung des Wortes Produkt“ wird dabei aus folgender Überlegung
”
abgeleitet. Sind A und B zwei endliche Mengen und so ist die Anzahl aller geordneten Paare,
deren erste Komponente ein Element von A und deren zweite Komponente ein Element von B
ist, gerade das Produkt der Anzahlen der Elemente von A beziehungsweise B:
#A × B = #A × #B .
(Ist A eine endliche Menge, so bezeichnet #A oder |A| die Anzahl der Elemente von A.)
Zurück zur Diskussion einer Gleichung mit zwei Unbekannten. Wieder geht es um die Bestimmung der Lösungsmenge einer solchen Gleichung. Wir gehen dabei von der ersten Form aus
und haben wieder Fälle zu unterscheiden.
1. Ist c 6= 0, so erhält man durch eine Äquivalenzumformung die Gleichung
a
e
y =− ·x+ .
c
c
Daraus erhält man als Lösungsmenge
e − a · b L=
b,
b ∈ R ,.
c
Geometrisch ist die Lösungsmenge eine Gerade mit der Steigung −a/c und e/c als Achsenabschnitt auf der y-Achse. Sie lässt sich auch interpretieren als der Graph der linearen
Funktion
e−a·x
.
x 7→
c
2. Ist c = 0, so sieht die Gleichung aus wie eine lineare Gleichung in einer Unbekannten.
Aber die möglichen Lösungsmengen sind von ganz anderer Art. Es sind wieder Fälle zu
unterscheiden.
2.1. Ist a 6= 0, so erhält man durch ein Äquivalenzumformung die Gleichung
x=
e
.
a
Daraus erhält man als Lösungsmenge
n e o
L=
,d | d ∈ R ,.
a
Geometrisch ist die Lösungsmenge eine zur y-Achse parallele Gerade.
2.2. Ist auch a = 0, ist eine weitere Fallunterscheidung nötig.
2.2.1. Ist e 6= 0, so gibt es keine Lösungen:
L = ∅.
1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN
6
2.2.2. Ist schließlich noch e = 0, so sind alle Zahlenpaare Lösungen:
L = R2 .
Geometrisch ist das die ganze Ebene.
Überall in der Natur, insbesondere in der Physik und in der Statistik treten nicht nur lineare
Gleichungen mit einer oder zwei Unbekannten auf. Die Zahl der Unbekannten kann sehr viel
größer sein. Mein Ururgroßonkel Josef Loschmidt berechnete die Zahl der Moleküle pro Mol,
etwa 6 mal 1023 , das ist die nach ihm benannte Loschmidtsche Zahl. Die Physiker beschreiben
jedes Molekül mit drei Ortskoordinaten und drei Geschwindigkeitskoordinaten und kommen
damit zu Gleichungen in 36 mal 1023 Unbekannten!
Wir setzen nun solche Gleichungen allgemein an, eine Gleichung mit n Unbekannten (n ∈ N)
schreiben wir in der Form
a1 · x 1 + a2 · x 2 + . . . + an · x n = c .
Man schreibt eine solche Gleichung auch in der Form:
n
X
aj · x j = c ,
j=1
oder etwas kürzer, wenn klar ist, welcher Index läuft:
n
X
aj · x j = c .
1
In einer Gleichung dieser Form ist es üblich, die Konstanten a1 , a2 , . . . , an besonders zu benennen, sie stehen bei den Unbestimmten und heißen deshalb Beiwerte oder Koeffizienten, englisch:
coefficients. Eine Lösung der Gleichung ist eine Folge reeller Zahlen der Länge n, geschrieben
(b1 , b2 , . . . , bn ) .
Statt von Folgen spricht man in diesem Zusammenhang allerdings von n-Tupeln (reeller Zahlen).
Die Gesamtheit dieser n-Tupel heißt n-dimensionaler Raum (über R) – Bezeichnung: Rn – auch
wenn dieser Raum für n > 3 nur sehr schlecht zu veranschaulichen ist. Trotzdem verwendet man
auch in diesem Zusmmenhang geometrische Sprechweisen, bezeichnet ein n-Tupel als Punkt und
gewisse Teilmengen als Geraden oder Ebenen; das ist anschaulich und suggestiv. Ein n-Tupel
(b1 , b2 , . . . , bn ) ist genau dann eine Lösung, wenn gilt:
a1 · b 1 + a2 · b 2 + . . . + an · b n = c .
Bei der Bestimmung der allgemeinen Lösung dieser Gleichung wird nun der Unterschied zwischen mathematischem und informatischem Vorgehen deutlich.
Wir beginnen mit der mathematischen Sichtweise. Sie führt auf die folgende Fallunterscheidung:
1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN
7
1. Nicht alle Koeffizienten a1 , a2 , . . . , an sind gleich Null, das heißt, es gibt ein aj0 6= 0.
O.w.E. (= Ohne wesentliche Einchränkung, oder O.B.d.A. = Ohne Beschränkung der
Allgemeinheit) können wir j0 = n, also an 6= 0 annehmen. Dann führt eine Äquivalenzumformung auf die Form
n−1
c
1 X
xn =
−
·
aj x j .
an an j=1
Daraus ergibt sich die Lösungsmenge
(
!
)
n−1
X
1
L=
b1 , b2 , . . . , bn−1 , (c −
aj bj ) b1 , b2 , . . . , bn−1 ∈ R .
an
j=1
Wie im Fall n = 2 lässt sich die Lösungsmenge als Graph der Funktion
n−1
c
1 X
−
·
aj x j
(x1 , x2 , . . . , xn−1 ) 7→
an an j=1
deuten. Das ist im Moment vielleicht nicht sehr hilfreich. Sie wissen von der Schule, dass
die Lösungsmenge im Fall n = 3 eine Ebene ist, man wählt im dreidimensionalen Raum
zwei freie Variable, hat ein – wie man sagt – zweidimensionales Gebilde, eine Dimension niedriger als der ganze Raum. Im allgemeinen ist das Gebilde in einem zunächst
n-dimensionalen Raum anschaulich von der Dimension n − 1, eins weniger als die volle
Dimension. Dafür hat man im linearen Fall den Begriff Hyperebene geprägt, im nichtlinearen Fall spricht man von Hyperflächen.
Es sei noch gezeigt, was passiert, wenn man auf die Einschränkung j0 = n verzichtet.
Dann löst man die Ausgangsgleichung nach xj0 statt nach xn auf:
j0 −1
n
X
c
1 X
1
−
·
aj x j −
·
aj xj
xj0 =
aj0
aj0 j=1
aj0 j=j +1
0
und die explizite Angabe der Lösungsmenge erfordert wesentlich mehr Schreibarbeit, aber
keine wirklich neuen Ideen.
2. Alle Koeffizienten verschwinden, das heißt, sind gleich Null:
a1 = a2 = . . . = an = 0 .
Dann ist wie in den früheren Überlegungen eine weitere Fallunterscheidung notwendig.
2.1. Ist c 6= 0, so ist L = ∅.
2.2. Ist c = 0, so ist L = Rn .
18. Oktober 2002
Wie behandelt nun ein Informatiker dieser Aufgabe?
1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN
8
1. Es sei a1 6= 0. Äquivalenzumformungen ergeben
a2
an
c
x1 + x2 + . . . + xn =
,
a1
a1
a1
n
c
1 X
x1 =
−
·
aj x j ,
a1 a1 j=2
und daraus erhält man die Lösungsmenge
(
!
)
n
X
1
(c −
aj bj , b2 , b3 , . . . , bn b2 , b3 , . . . , bn ∈ R
L=
a1
j=2
wie in der mathematischen Sichtweise; der Austausch von n und 1 ist dabei wirklich
unwesentlich. Dann geht es aber anders weiter.
2. Es sei a1 = 0. Dann kommt die Fallunterscheidung:
2.1. Es sei a2 6= 0. Nun ergibt eine Äquivalenzumformung:
n
c
1 X
x2 =
−
·
aj x j ,
a2 a2 j=3
und daraus erhält man die Lösungsmenge
(
!
)
n
X
1
L=
b1 , (c −
aj bj , b3 , b4 , . . . , bn ) b1 , b3 , . . . , bn−1 ∈ R .
a2
j=3
2.2. Es sei a2 = 0. Dann kommt die Fallunterscheidung:
2.2.1. Es sei a3 6= 0. Nun ergibt eine Äquivalenzumformung:
n
c
1 X
x3 =
−
·
aj x j ,
a3 a3 j=4
und daraus erhält man die Lösungsmenge
(
!
)
n
X
1
aj bj , b4 , b5 , . . . , bn ) b1 , b2 , b4 . . . , bn−1 ∈ R .
L=
b1 , b2 , (c −
a3
j=4
2.2.2. Es sei a3 = 0.
..
.
2.2.2.. . . .1. Es sei an 6= 0. Nun ergibt eine Äquivalenzumformung:
c
xn =
,
an
und daraus erhält man die Lösungsmenge
c b1 , b2 , . . . , bn−1 ,
b1 , b2 , . . . , bn−1 ∈ R .
L=
an 1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN
9
2.2.2.. . . .2. Es sei an = 0. Dann kommt schließlich noch die Fallunterscheidung:
2.2.2.. . . .2.1. Ist c 6= 0, so ist L = ∅.
2.2.2.. . . .2.2. Ist c = 0, so ist L = Rn .
Im Fall n = 3 lassen sich die erhaltenen nichttrivialen Lösungsmengen geometrisch veranschaulichen, wozu im dreidimensionalen Raum das folgende rechtwinklige Koordinatensystem
einführen.
6
*
x1
x
3 x2
-
Die Diskussion folgt der Beschreibung der Lösungsmengen in der Informatik.
1. a1 6= 0: Die Lösungsmenge lässt sich als Graph der in der (x2 , x3 )-Ebene definierten
Funktion
1
(x2 , x3 ) 7→ (c − a2 · x2 − a3 · x3 )
a1
deuten und ist eine Ebene in allgemeiner Lage“, die die x1 -Achse im Punkt (c/a1 , 0, 0)
”
schneidet.
2.1. a1 = 0 6= a2 : Die Lösungsmenge ist eine zur x1 -Achse parallele, also zur (x2 , x3 )-Ebene
senkrechte Ebene, die die (x2 , x3 )-Ebene in der durch die Gleichung a2 · x2 + a3 · x3 = c
beschriebenen Geraden schneidet.
2.2.1. a1 = a2 = 0 =
6 a3 : Die Lösungsmengeist eine zur (x1 , x2 )-Ebene parallele Ebene, die die
x3 -Achse im Punkt (0, 0, c/a3 ) schneidet.
Im Verlauf dieser Überlegungen haben mehrfach Äquivalenzumformungen eine wichtige Rolle
gespielt. Sie sollten diesen Begriff aus Ihrer Schulzeit kennen. Eine Äquivalenzumformungen
beschreibt bekanntlich den Übergang von einer Gleichung zu einer anderen, ohne dass sich die
Lösungsmenge ändert. Dabei ist ein Typ von Äquivalenzumformungen besonders wichtig.
Satz. Die Lösungsmenge einer linearen Gleichung ändert sich nicht, wenn man sie mit einer
festen, von Null verschiedenen Zahl multipliziert.
Erklärung und Beweis. Eine lineare Gleichung mit einer Zahl multiplizieren bedeutet, alle Konstanten mit dieser Zahl zu multiplizieren, also den Übergang von der Gleichung
(∗)
a1 · x 1 + a2 · x 2 + . . . + an · x n = c
zu der Gleichung
(∗∗)
(d · a1 ) · x1 + (d · a2 ) · x2 + . . . + (d · an ) · xn = d · c .
1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN 10
Es ist zu zeigen, dass für d 6= 0 Lösungsmengen L∗ und L∗∗ beider Gleichungen übereinstimmen,
das heisst, dass jede Lösung von (∗) auch Lösung von (∗∗) ist und umgekehrt. Wir schreiben
dies formal auf:
(b1 , b2 , . . . , bn ) ∈ L∗ ⇔
n
X
aj · b j = c ⇔
j=1
⇔ d·
n
X
aj · b j = d · c ⇔
j=1
⇔
n
X
(d · aj ) · bj = d · c ⇔ (b1 , b2 , . . . , bn ) ∈ L∗∗ .
j=1
Der Übergang von der ersten zur zweiten Zeile funktioniert für jede Zahl d, die Rückrichtung,
das sogenannte Kürzen durch d, ist aber nur für d 6= 0 möglich.
Die bisherige Diskussion zeigt, dass die nichtleeren Lösungsmengen einer linearen Gleichungen
in mehr als einer Unbekannten immer viele, über dem Zahlbereich R unendlich viele Elemente
enthalten. Aber sie sind trotzdem nicht ganz beliebig, sie haben spezielle Eigenschaften, die
sich geometrisch etwa in den Aussagen die Lösungsmenge ist eine Gerade“, die Lösungsmen”
”
ge ist eine Ebene“ widerspiegeln. Für die Darstellung solcher Eigenschaften ist die folgende
Begriffsbildung hilfreich. Eine lineare Gleichung
a1 · x 1 + a2 · x 2 + . . . + an · x n = c
heißt homogen, wenn c = 0 gilt, sonst inhomogen.
Satz. Für eine homogene lineare Gleichung gilt:
1. Die Lösungsmenge ist nicht leer.
2. Ein Vielfaches einer Lösung ist wieder eine Lösung.
3. Die Summe zweier Lösungen ist auch eine Lösung.
4. Jede Linearkombination von Lösungen ist eine Lösung.
Beweis. Wir betrachten die homogene lineare Gleichung
n
X
aj · x j = 0
j=1
in n Unbekannten.
1. Das n-Tupel 0=(0,0,. . . ,0) mit allen Komponenten gleich Null ist Lösung.
2. Ein Vielfaches eines n-Tupels (b1 , b2 , . . . , bn ) erhält man, in dem man alle Komponenten
mit derselben Zahl d multipliziert, es hat also die Form:
d · (b1 , b2 , . . . , bn ) = (d · b1 , d · b2 , . . . , d · bn ) ;
1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN 11
speziell spricht man vom d-fachen des ursprünglichen n-Tupels.
Für jede Lösung (b1 , b2 , . . . , bn ) unserer Gleichung und jede Zahl d berechnen wir:
n
X
aj · (d · bj ) =
n
X
d · aj · b j = d ·
j=1
j=1
n
X
aj · b j = d · 0 = 0 ;
j=1
also ist auch (d · b1 , d · b2 , . . . , d · bn ) eine Lösung unserer Gleichung.
3. Unter der Summe der n-Tupel (b11 , b21 , . . . , bn1 ) und (b12 , b22 , . . . , bn2 ) versteht man das
n-Tupel, das man durch komponentenweise Addition erhält:
(b11 , b21 , . . . , bn1 ) + (b12 , b22 , . . . , bn2 ) = (b11 + b12 , b12 + b22 , . . . , bn1 + bn2 ) .
Sind die n-Tupel (b11 , b21 , . . . , bn1 ) und (b12 , b22 , . . . , bn2 ) Lösungen unser Gleichung, so
berechnen wir
n
X
aj · (bj1 + bj2 ) =
j=1
n
X
aj · bj1 + aj · bj2 =
j=1
n
X
aj · bj1 +
j=1
n
X
aj · bj2 = 0 + 0 = 0 ;
j=1
also ist auch (b11 + b12 , b12 + b22 , . . . , bn1 + bn2 ) eine Lösung unserer Gleichung.
4. Es seien n-Tupel (b11 , b21 , . . . , bn1 ), (b12 , b22 , . . . , bn2 ), . . . , (b1p , b2p , . . . , bnp ) gegeben (p ∈
N). Eine Linearkombination aus diesen n-Tupeln ist ein n-Tupel der Form:
p
p
p
X
X
X
(
dk · b1k ,
dk · b2k , . . . ,
dk · b1k ) =
k=1
k=1
k=1
= d1 · (b11 , b21 , . . . , bn1 ) + d2 · (b12 , b22 , . . . , bn2 ) + . . . + dp · (b1p , b2p , . . . , bnp )
mit beliebigen Zahlen d1 , d2 , . . . , dp . Sind die gegebenen n-Tupel Lösungen unserer Gleichung, so berechnen wir für eine Linearkombination
n
X
j=1
aj ·
p
X
k=1
dk ·bjk =
p
n X
X
j=1 k=1
aj ·dk ·bjk =
p
n
X
X
aj ·dk ·bjk =
k=1 j=1
p
X
k=1
also ist auch die Linearkombination eine Lösung.
dk ·
n
X
j=1
aj ·bjk =
p
X
dk ·0 = 0 ;
k=1
Dieser Sachverhalt erlaubt es, die allgemeine Lösung einer homogenen Gleichung, deren Koeffizienten nicht alle verschwinden, als Linearkombination gewisser Basislösungen darzustellen.
Wir betrachten wieder die homogene lineare Gleichung
a1 · x 1 + a2 · x 2 + . . . + an · x n = 0
in n Unbekannten und nehmen dabei wieder an 6= 0 an. Da dann die Multiplikation der Gleichung mit 1/an – wie eben bewiesen – die Lösungsmenge nicht ändert, können wir sogar an = 1,
also
a1 · x1 + a2 · x2 + . . . + xn = 0 ,
1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN 12
annehmen. Die vorhin entwickelten allgemeine Lösung hat die Form
(b1 , b2 , . . . , bn−1 , −
n−1
X
aj b j ) .
j=1
Wir haben die folgenden speziellen Lösungen
(1, 0, 0, . . . , 0, −a1 ),
(0, 1, 0, . . . , 0, −a2 ),
(0, 0, 1, . . . , 0, −a3 ),
..
.
(0, 0, 0, . . . , 1, −an−1 ).
22. Oktober 2002
Die allgemeine Lösung ist dann in eindeutiger Weise als Linearkombination dieser Basislösungen
darstellbar:
(b1 , b2 , . . . , bn−1 , −
n−1
X
aj bj ) = b1 · (1, 0, 0, . . . , 0, −a1 ) + . . . + bn−1 · (0, 0, 0, . . . , 1, −an−1 ) .
j=1
Zum Nachweis der Eindeutigkeit betrachten wir eine beliebige Linearkombination der Basislösungen:
d1 · (1, 0, 0, . . . , 0, −a1 ) + . . . + dn−1 · (0, 0, 0, . . . , 1, −an−1 ) = (d1 , d2 , . . . , dn−1 , −
n−1
X
aj dj ) .
j=1
Diese stimmt aber eben nur dann mit der betrachteten Lösung überein, wenn gilt:
d1 = b1 , d2 = b2 , . . . , dn−1 = bn−1 .
Nun wenden wir uns dem inhomogenen Fall zu. Ist eine inhomogene Gleichung
a1 · x1 + a2 · x2 + . . . + an · xn = c(6= 0)
gegeben, so heißt die Gleichung
a1 · x 1 + a2 · x 2 + . . . + an · x n = 0
zugehörige homogene Gleichung.
Die wesentlichen Aussage über die Lösungsmengen inhomogener Gleichungen enthält der folgende
Satz. Für eine inhomogene lineare Gleichung gilt:
1. Die Lösungsmenge ist genau dann nicht leer, wenn nicht alle Koeffizienten verschwinden.
2. Die Differenz zweier Lösungen ist eine Lösung der zugehörigen homogenen Gleichung.
1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN 13
3. Ist die Lösungsmenge nicht leer, so erhält man alle Lösungen, indem man zu einer speziellen Lösung der inhomogenen Gleichung alle Lösungen der zugehörigen homogenen
Gleichung addiert.
Beweis. Wir betrachten die Gleichung
a1 · x1 + a2 · x2 + . . . + an · xn = c(6= 0) .
Es sei L ihre Lösungsmenge und Lh die Lösungsmenge der zugehörigen homogenen Gleichung.
1. L =
6 ∅ ⇔ nicht alle aj = 0
ergibt sich aus den vorherigen Überlegungen.
2. Für die Differenz
(b11 , b21 , . . . , bn1 ) − (b12 , b22 , . . . , bn2 ) = (b11 − b12 , b12 − b22 , . . . , bn1 − bn2 )
von (b11 , b21 , . . . , bn1 ) ∈ L und (b12 , b22 , . . . , bn2 ) ∈ L berechnen wir:
n
X
aj · (bj1 − bj2 ) =
j=1
n
X
aj · bj1 −
j=1
n
X
aj · bj2 = c − c = 0 ;
j=1
also gehört die Differenz zu Lh .
3. Es sei (b10 , b20 , . . . , bn0 ) ∈ L fest gegeben. Mit (b10 , b20 , . . . , bn0 ) + Lh bezeichnen wir die
Menge aller n-Tupel, die sich als Summe aus (b10 , b20 , . . . , bn0 ) und einem n-Tupel in Lh
darstellen lassen. Es ist
L = (b10 , b20 , . . . , bn0 ) + Lh
zu zeigen. Wir müssen dazu nachweisen, dass jedes Element der Menge auf der linken Seite
auch zu der Menge auf der rechten Seite des Gleichheitszeichens gehört und umgekehrt.
⊂“: Sei (b11 , b21 , . . . , bn1 ) ∈ L gegeben. Nach 2. ist die Differenz
”
(b12 , b22 , . . . , bn2 ) = (b11 , b21 , . . . , bn1 ) − (b10 , b20 , . . . , bn0 ) ∈ Lh
und damit ist
(b11 , b21 , . . . , bn1 ) = (b10 , b20 , . . . , bn0 ) + (b12 , b22 , . . . , bn2 ) ∈ (b10 , b20 , . . . , bn0 ) + Lh .
⊃“: Für
”
(b10 , b20 , . . . , bn0 ) + (b12 , b22 , . . . , bn2 ) = (b10 + b12 , b20 + b22 , . . . , bn0 + bn2 )
mit
(b12 , b22 , . . . , bn2 ) ∈ Lh
berechnen wir:
n
X
j=1
aj · (bj0 + bj2 ) =
n
X
j=1
aj · bj0 + aj · bj2 =
n
X
j=1
aj · bj0 +
n
X
j=1
aj · bj2 = c + 0 = c ;
1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN 14
also gilt:
(b10 , b20 , . . . , bn0 ) + (b12 , b22 , . . . , bn2 ) ∈ L .
Zur Auswahl einer festen Lösung nehmen wir o.B.d.A. wieder an = 1 an. Dann ist
(0, 0, . . . , 0, c) ∈ L.
Bei Beschreibung von Phänomene des Alltags kommt man häufig nicht mit einer Gleichung aus.
Zum Beispiel wird eine Gerade im dreidimensionalen Raum als Schnitt zweier Ebenen durch
zwei lineare Gleichung in drei Unbekannten beschreiben. Das führt allgemein zu dem Begriff
des linearen Gleichungssystems (aus m Gleichungen in n Unbekannten:
a11 · x1 + a12 · x2 + . . . + a1n · xn = c1 ,
a21 · x1 + a22 · x2 + . . . + a2n · xn = c2 ,
..
.
am1 · x1 + am2 · x2 + . . . + amn · xn = cm .
Unter der Lösungsmenge eines linearen Gleichungssystems versteht man den Durchschnitt der
Lösungsmengen der einzelnen Gleichungen:
L = L1 ∩ L2 ∩ . . . ∩ Lm =
m
\
Li .
i=1
In Analogie zu unserer Diskussion einer Gleichung heißt ein solches Gleichungssystem homogen,
falls c1 = c2 = . . . = cm = 0 ist, sonst inhomogen. Das zugehörige homogene System zu einem
inhomogenen Gleichungssystem erhält man, in dem man die rechten Seiten aller Gleichungen
Null setzt.
Für die Lösungsmengen von linearen Gleichungssystem gelten die gleichen Sätze wie für die
Lösungsmengen einer linearen Gleichungen.
Satz. Für ein homogenes Gleichungssystem gilt:
1. Die Lösungsmenge ist nicht leer.
2. Ein Vielfaches einer Lösung ist wieder eine Lösung.
3. Die Summe zweier Lösungen ist auch eine Lösung.
4. Jede Linearkombination von Lösungen ist eine Lösung.
Auf einen expliziten Beweis dieses Satzes verzichten wir im Moment, er fällt uns bei späteren
Strukturüberlegungen einfach in den Schoß.
Satz. Für ein inhomogenes lineares Gleichungssystem gilt:
1. Die Differenz zweier Lösungen ist eine Lösung des zugehörigen homogenen Systems.
2. Ist die Lösungsmenge nicht leer, so erhält man alle Lösungen, indem man zu einer speziellen Lösung des inhomogenen Systems alle Lösungen des zugehörigen homogenen Systems
addiert.
1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN 15
Diesen Satz beweist man für Systeme genau so wie für einzelne Gleichungen. Allerdings enthält
er keine Aussage darüber, wann die Lösungsmenge eines inhomogenen Gleichungssystems nicht
leer ist. Eine solche ist für Gleichungssysteme wesentlich schwieriger als für eine einzelne Gleichung und wird erst später entwickelt.
Auch die Auffindung von Basislösungen für ein homogenes Gleichungssystem gestaltet sich
schwieriger als bei einer einzelnen Gleichung. Diesem Problem werden wir uns als nächstes
widmen. Für Gleichungssystem gibt es noch eine wichtige Äquivalenzumformung:
Satz. Die Lösungsmenge eines linearen Gleichungssystems ändert sich nicht, wenn man eine
Gleichung durch die Summe aus dieser und einer anderen Gleichung ersetzt.
Beweis. Da bei dieser Umformung nur zwei Gleichung des Systems involviert sind, genügt es
o.B.d.A. ein System aus zwei Gleichungen zu betrachten. Wir zeigen: Die Lösungsmenge L∗ des
Systems
a11 · x1 + a12 · x2 + . . . + a1n · xn = c1 ,
a21 · x1 + a22 · x2 + . . . + a2n · xn = c2
stimmt mit der Lösungsmenge L∗∗ des Systems
(a11 + a21 ) · x1 + (a12 + a22 ) · x2 + . . . + (a1n + a2n ) · xn = c1 + c2 ,
a21 · x1 + a22 · x2 + . . . + a2n · xn = c2
überein: L∗ = L∗∗ .
Sei zunächst (b1 , b2 , . . . , bn ) ∈ L∗ gegeben. Dann gilt:
n
X
a1j · bj = c1 ,
j=1
n
X
a2j · bj = c2 ,
j=1
und damit auch
n
X
(a1j + a2j ) · bj =
j=1
=
n
X
j=1
n
X
a1j · bj + a2j · bj =
a1j · bj +
j=1
n
X
a2j · bj =
j=1
= c1 + c2 ,
n
X
a2j · bj = c2 .
j=1
also (b1 , b2 , . . . , bn ) ∈ L∗∗ .
Ist umgekehrt (b1 , b2 , . . . , bn ) ∈ L∗∗ gegeben, so gilt
n
X
j=1
(a1j + a2j ) · bj = c1 + c2 ,
n
X
j=1
a2j · bj = c2 ,
1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN 16
und damit auch
n
X
a1j · bj =
j=1
=
=
n
X
j=1
n
X
j=1
n
X
(a1j + a2j − a2j ) · bj =
(a1j + aj2 ) · bj − a2j · bj =
(a1j + a2j ) · bj −
j=1
n
X
a2j · bj = (c1 + c2 ) − c2 =
j=1
= c1 ,
n
X
a2j · bj = c2 .
j=1
Des weiteren führen wir noch eine bequeme Schreibweise ein.
Definition. Es sei ein lineares Gleichungssystem
a11 · x1 + a12 · x2 + . . . + a1n · xn = c1 ,
a21 · x1 + a22 · x2 + . . . + a2n · xn = c2 ,
..
.
am1 · x1 + am2 · x2 + . . . + amn · xn = cm
gegeben. Das rechteckige Schema



A=

a11
a21
..
.
a12
a22
..
.

. . . a1n
. . . a2n
..
.
am1 am2 . . . amn
aus m Zeilen und n Spalten heißt Koeffizientenmatrix des

a11 a12 . . . a1n
 a21 a22 . . . a2n

A =  ..
..
..
 .
.
.
am1 am2 . . . amn




Gleichungssystems, das Schema

c1
c2 



cn
aus m Zeilen und n + 1 Spalten heißt erweiterte Matrix des Gleichungssystems.
Allgemein bezeichnet man ein rechteckiges Schema


a11 a12 . . . a1n
 a21 a22 . . . a2n 


A =  ..
..
.. 
 .
.
. 
am1 am2 . . . amn
1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN 17
aus m Zeilen und n Spalten als eine m × n–Matrix, gesprochen: m kreuz m – Matrix, Plural:
Matrizen (früher Matrices oder laut Duden Matrizes, aber Singular nicht Matrize. Die mathematische Begriffsbildung geht zurück auf
Arthur Cayley, * Richmond 16. August 1821, + Cambridge 26. Januar 1895, 1844 - 1863
als gut verdienenender Rechtsanwalt tätig, 1863 auf den neueingerichteten Sadlerian Lehrstuhl
für Mathematik in Cambridge berufen, Schöpfer der Matrizenrechnung. Wesentliche Ergebnisse
der algebraischen Geometrie tragen seinen Namen. Er formulierte 1854 erstmals die abstrakte
Definition einer Gruppe.
Homepage: www-groups.dcs.st-and.ac.uk/history/Mathematicians/Cayley.html
25. Oktober 2002
Der große Brockhaus von 1979:
Matrix [lat. >Stammutter<] 1) Anatomie: a) Mutterboden, z.B. Haar-M. in der Haarzwiebel, in der das Haar wächst; b) Eiweißhülle der Chromosomen. 2) Geowissenschaften:
Grundmasse in Ergußgesteinen und das Bindemittel in Sedimentgesteinen. 3) Mathematik: rechteckige Anordnung von m · n Elementen einer Menge (meist eines Ringes) . . .
Matrize [lat.-fr.] 1) 2) im Druckwesen. 3) die Negativform bei der Herstellung von Schallplatten. 4) Folien aus Wachspapier, Metall, Kunststoff u. a. zur Herstellung von Vervielfältigungen.
Bezeichnungen und Schreibweisen. Der Menge aller m × n–Matrizen wird durch Rm,n
oder M (m × n; R) bezeichnet. Man nennt m die Zeilenzahl, n die Spaltenzahl der Matrix A.
Ein spezielles Element aij heißt Komponente von A; dabei ist i der Zeilenindex und j der
Spaltenindex. Das n-Tupel ai = (ai1 , ai2 , . . . , ain ) heißt i–te Zeile oder i–ter Zeilenvektor von A
(i = 1, . . . , m), das m-Tupel


a1j
 a2j 


aj =  .. 
 . 
amj
j–te Spalte oder j–ter Spaltenvektor von A (j = 1, . . . , n); die Zeilen und Spalten einer Matrix
lassen sich als Teilmatrizen der gesamten Matrix auffassen; es handelt sich um n-Tupel beziehungsweise m-Tupel, die in besonderer Weise aufgeschrieben werden. Wenn es der Klarheit
dient, schreibt man auch


a1
 a2 


A =  ..  = (a1 , a2 , . . . , an ) .
 . 
am
Kurzschreibweise für ein lineares Gleichungssystem:
Ax = c ;
1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN 18
dabei bezeichnet A die Koeffizientenmatrix, x den Spaltenvektor


x1
 x2 


x =  .. 
 . 
xn
aufgefasst als Matrix mit n Zeilen und einer Spalte, sowie c den Spaltenvektor


c1
 c2 


c =  ..  .
 . 
cm
Die erweiterte Matrix hat dann die Form (a1 , a2 , . . . , an , c). Man könnte das Gleichungssystem
dann auch in der Form aufschreiben:
x 1 · a1 + x 2 · a2 + . . . + x n · an = c ;
woraus sich unmittelbar der folgende theoretische Satz ergibt:
Satz. Die Lösungsmenge des lineares Gleichungssystem:
Ax = c
ist genau dann nicht leer, wenn sich der Spaltenvektor c als Linearkombination der Spalten der
Matrix A darstellen lässt.
Den Äquivalenzumformungen eines linearen Gleichungssystems entsprechen die sogenannten
elementaren Zeilenumformungen einer Matrix, der erweiterten Matrix des Gleichungssystems:
Dabei handelt es sich zunächst um die beiden folgenden Typen von Umformungen einer Matrix
A mit den Zeilenvektoren ai , i = 1, . . . , m:
1. Multiplikation einer Zeile mit einem Skalar



a1
 a2 

 . 

 . 

 . 

A=
 7→ 
 ai 

 . 

 .. 

am
mit d 6= 0und
a1
a2
..
.
dai
..
.
am









1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN 19
2. Addition einer Zeile zu einer anderen







A=







a1
a2
..
.
ai
..
.
aj
..
.
am

a1
a2
..
.











 a +a
 7→  i . j


..



 a


j


..


.
am














mit i 6= j.
Durch Iteration erhält man zwei weitere Typen von Zeilenumformungen, die auch noch zu den
elementaren gerechnet werden:
3. Die Addition eines Vielfachen einer Zeile zu einer anderen:




a1
a1
 a2 


a2




..
 .. 


 . 


.




 ai 
 ai + daj 




A =  ..  7→ 
..

.
.




 a 


aj
 j 




 . 
.
..
 .. 


am
am
mit i 6= j, und
4. die Vertauschung von zwei Zeilen:







A=






a1
a2
..
.
ai
..
.
aj
..
.
am














 7→ 












a1
a2
..
.
aj
..
.
ai
..
.
am














1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN 20
Beweis von 4.














a1
a2
..
.
ai
..
.
aj
..
.
am


a1
a2
..
.










 2.  ai + aj
 7→ 
..


.



 a


j


.
..


am


a1
a2
..
.










 1.  ai + aj
 7→ 
..


.


 −a



j


.
..


am


a1
a2
..
.










 2.  ai + aj
 7→ 
..


.



 a


i


.
..


am












 3. 
 7→ 












a1
a2
..
.
aj
..
.
ai
..
.
am














Damit können wir die früher bewiesenen Sätze folgendermaßen umformulieren und zusammenfassen.
Satz. Bei elementaren Zeilenumformungen der erweiterten Matrix eines linearen Gleichungssystem ändert sich die Lösungsmenge nicht.
Die Lösungsmenge eines linearen Gleichungssystems lässt sich einfach bestimmen, wenn die
Koeffizientenmatrix in Zeilenstufenform gegeben ist.
Definition. Eine m × n-Matrix A = (aij ) ist von Zeilenstufenform, wenn es (Spalten–)Indizes
j1 , j2 , . . . jp mit 1 ≤ p ≤ m und 1 ≤ j1 < j2 < . . . < jp ≤ n gibt derart, daß gilt:
aiji = 1
aij = 0
für 1 ≤ i ≤ p
für j < ji oder i > p .
Bei einem Gleichungssystem aus m Gleichungen mit n Unbekannten handelt es sich um eine
m × n-Matrix und es gilt, wenn die Stufenindizes durch j1 , . . . , jp bezeichnet werden:
Satz. 1. Ist cj 6= 0 für ein j > p, so ist die Lösungsmenge leer.
2. Ist jp ≤ n, so kann man für die n − p Unbekannten xj mit j 6= ji für i = 1, . . . , p
beliebige Werte bj wählen und erhält dann der Reihe nach
bjp = cp − apn bn − . . . − apjp +1 bjp +1 = cp −
n
X
apj bj ,
j=jp +1
bjp−1 = cp−1 − ap−1n bn − . . . − ap−1jp−1 +1 bjp−1 +1 =
n
X
= cp−1 −
ap−1j bj ,
j=jp−1 +1
..
.
baj1 = c1 − a1 nban − . . . − a1j1 +1 bj1 +1 = c1 −
n
X
a1j bj .
j=j1 +1
Satz. Jede von der Nullmatrix verschiedene Matrix kann durch elementare Zeilenumformungen
in eine Matrix von Zeilenstufenform übergeführt werden. – Gaußsches Eliminationsverfahren, auch: Ausräumen einer Matrix –
1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN 21
Beispiel:

0
0
0 2 −1
 0
1 −2 1
0 
;
A=
 0 −1
2 1 −1 
0
0
0 1
2

Zeilenvertauschungen führen auf:


0
1 −2 1
0
 0 −1
2 1 −1 
;

 0
0
0 1
2 
0
0
0 2 −1
nun wird die erste Zeile zur zweiten addiert:

0 1 −2
 0 0
0

 0 0
0
0 0
0

1
0
2 −1 
;
1
2 
2 −1
zur Vermeidung von Brüchen empfiehlt es sich nun die zweite und die dritte Zeile zu
vertauschen:


0 1 −2 1
0
 0 0
0 1
2 

;
 0 0
0 2 −1 
0 0
0 2 −1
jetzt ziehen wir die dritte Zeile von der vierten ab:

0 1 −2 1
0
 0 0
0
1
2

 0 0
0 2 −1
0 0
0 0
0


;

zur gewünschten Zeilenstufenform kommen wir dann, in dem wir noch das doppelte der
zweiten Zeile von der dritten abziehen:


0 1 −2 1
0
 0 0
0 1
2 

;
 0 0
0 0 −5 
0 0
0 0
0
und die vierte Zeile durch -5 dividieren:

0 1 −2 1 0
 0 0
0 1 2

 0 0
0 0 1
0 0
0 0 0


.

Dies Ergebnis lässt sich nun noch für lineare Gleichungssysteme interpretieren.
1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN 22
1. Ist A die Koeffizientenmatrix eines homogenen Gleichungssystems, so ergibt sich die Lösungsmenge
L = {(b1 , 2b3 , b3 , 0, 0)|b1 , b3 , b5 ∈ R} .
2. Ist A die erweiterte Matrix eines inhomogenen Gleichungssystems, so ist die Lösungsmenge
leer.
Das Ausräumen einer Matrix A 6= 0,, das heißt, einer Matrix, deren Komponenten nicht alle
verschwinden, geschieht mit dem Gaußschen Eliminationsverfahren systematisch in folgender
Weise.
1. Man sucht die Spalte mit dem niedrigsten Index j1 , in der nicht verschwindende Komponenten stehen:
j1 = min{j|j ∈ {1, 2, . . . , n}, aij 6= 0 für ein i ∈ {1, 2, . . . , m}} .
2. Durch eine Zeilenvertauschung erreicht man a1j1 6= 0.
3. Multiplikation der ersten Zeile mit 1/a1j1 führt zu einer Matrix mit a1j1 = 1.
4. Jetzt zieht man für i ∈ {2, 3, . . . , m} das aij1 -fache der ersten Zeile von der i-ten Zeile ab;
die Spalte mit dem Index j1 hat nun 1 in der ersten Komponente und 0 sonst. Die erste
Zeile und die Spalten mit den Indizes kleiner-gleich j1 bleiben im folgenden unverändert.
5. Wir betrachten die Matrix, die wir durch Streichen der ersten Zeile und der Spalten
mit den Indizes kleiner-gleich j1 erhalten und wenden die Schritte 1. bis 4. darauf an.
Damit finden wir den gesuchten Spaltenindex j2 und die Spalte mit diesem Index hat die
gewünschte Form.
6. Das Verfahren wird fortgesetzt und endet entweder mit einer m-ten Zeile (0,0,. . . ,0,1)
oder damit, dass die nach dem Streichen erhaltene Matrix die 0-Matrix ist.
29. Oktober 2002
Fundamentallösungen eines homogenen linearen Gleichungssystems Ax = 0, dessen
Koeffizientenmtrix A in Zeilenstufenform gegeben ist.
Es seien j1 , j2 , . . . , jp die Stufenindizes. Für jedes j ∈ {1, 2, . . . , n}\{j1 , j2 , . . . , jp } haben wir
eine Fundamentallösung


v1j
 v2j 


j
v =  ..  .
 . 
vnj
Wir setzen die freien Variablen
1, i = j .
vij =
0, i ∈ {1, 2, . . . , n}\{j1 , j2 , . . . , jp , j}
1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN 23
und erhalten für die Komponenten mit den Spaltenindizes
0, P
jk > j ,
vjk j =
p
− l=k+1 akjl vjl j − akj , jk < j .
Jede weitere Lösung ist eindeutig als Linearkombination dieser Fundamentallösungen darstellbar.
Beispiel.


0 1 −2 1 0
0 1 2 .
A= 0 0
0 0
0 0 1
Die allgemeine Lösung von Ax = 0 hat die Form (b1 , 2b3 , b3 , 0, 0). Wir haben die Fundamentallösungen
 
 
1
0
 0 
 2 
 
 
 , v3 =  1  .
0
v1 = 
 
 
 0 
 0 
0
0
Für die allgemeine Lösung gilt dann:






b1
2b3
b3
0
0



 = b1 · v 1 + b3 · v 3 .


Eine spezielle Lösung im inhomogenen Fall erhält man, in dem man alle freien Variablen gleich
Null setzt.
Matrizenoperationen.
Matrizen mit gleicher Zeilen- und Spaltenzahl können addiert werden:
A = (aij ) , B = (bij ) ∈ Rm,n , : A + B = (aij + bij ) ∈ Rm,n .
Für diese Summenbildung gilt:
(A + B) + C = A + (B + C) Assoziativgesetz
A + B = B + A Kommutativgesetz
Die Matrix 0=(0), deren sämtliche Komponenten gleich Null sind, ist ein neutrales Element
bezüglich dieser Addition:
A + 0 = A = 0 + A.
Zu jeder Matrix A gibt es eine bezüglich der Addition inverse Matrix B, das heißt, eine Matrix
B, für die gilt:
A + B = 0 = B + A,
1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN 24
Hat A die Komponenten aij , so hat B die Komponenten −aij .
Eine weitere Matrizenoperation ist die Multiplikation einer Matrix mit einem Skalar :
A = (aij ) , d ∈ R : dA = d · A = (d · aij .
Hierfür gelten die folgenden Regeln:
d(eA)
(d + e)A
d(A + B)
0·A
d·0
1·A
=
=
=
=
=
=
(de)A
dA + eA Punkt vor Strich“
”
dA + dB Punkt vor Strich“
”
0
0
A
Die komponentenweise Multiplikation zweier Matrizen gleichen Typs ergibt keine wichtige Operation. Unter der Matrizenmultiplikation“ versteht man deshalb eine ganz andere Operation,
”
zu der die folgenden Überlegungen führen.
Wir interpretieren die Zeilen einer (m × n)-Matrix A = (aij ) als lineare Funktionen in n
Variablen: Für i ∈ {1, 2, . . . , m} setzen wir
fi : (x1 , x2 , . . . , xn ) 7→ ai1 x1 + ai2 x2 + . . . + ain xn .
Für jedes n-Tupel (b1 , b2 , . . . , bn ) haben wir dann m Funktionswerte c1 = f1 (b1 , b2 , . . . , bn ),
c2 = f2 (b1 , b2 , . . . , bn ), . . . , cm = fm (b1 , b2 , . . . , bn ):
ci =
n
X
aij bj .
j=1
Diese fassen wir zu einem m-Tupel (c1 , c2 , . . . , cm ) zusammen. Damit ordnen wir jedem Element
von Rn ein Element von Rm zu, wir haben eine Abbildung
Rn → Rm , (b1 , b2 , . . . , bn ) 7→ (c1 , c2 , . . . , cm ) ,
die wir wegen ihrer Herkunft von der Matrix A ebenfalls mit A bezeichnen:
A
Rn → R m .
Diese Abbildungen haben zunächst die folgenden Eigenschaften:
• die Abbildung A ist additiv,, das heißt mit Summen verträglich:
A(b1 + b2 ) = A(b1 ) + A(b2 ) ;
• die Abbildung A ist homogen,, das heißt mit der Multiplikation mit Skalaren verträglich:
A(d · b) = d · A(b) ;
1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN 25
• die Abbildung A ist linear,, das heißt mit Linearkombinationen verträglich:
p
p
X
X
k
A(
dk · b ) =
dk · A(bk ) ;
k=1
k=1
• Linearkombinationen von Matrizen liefern die entsprechenden Linearkombinationen der
Werte:
p
p
X
X
k
(
dk · A )(b) =
dk · Ak (b) .
k=1
k=1
Interpretiert man ein Matrix als Abbildung, so haben wir die Spalten der Matrix eine besondere
Bedeutung. Um diese zu erkennen benötigen wir die sogenannten Einheitsvektoren im Rn . Zur
Beschreibung benutzen wir das Kroneckersymbol :
1, i = j ,
j
δij = δi =
0, i 6= j .
Der j-te Einheitsvektor in Rn ist das n-Tupel
ej = (δij )
mit 1 als j-ter Komponente und 0 sonst.
Damit berechnen wir für die durch die Matrix A bestimmte Abbildung:
A(ej ) = aj ,
das heißt, in den Spalten der Matrix stehen die Bilder der Einheitsvektoren!
Wenn man es in der Mathematik mit Abbildungen ähnlichen Typs zu tun hat, stellt sich immer
die Frage nach der Verkettung, das heißt, der Hintereinanderausführung solcher Abbildungen.
Betrachten wir dazu
A
Rm ← Rm
mit A = (aij ) und setzen wir eine Abbildung
B
Rn ← R p
davor, die von einer (p × m)-Matrix B = (bjk ) induziert ist.
A
B
Rm ← Rm ← R p .
Behauptung: Auch die Verkettung A◦B ist von einer Matrix, einer (p×m)-Matrix, induziert.
Beweis. Wir rechnen das Bild eines p-Tupels d = (d1 , d2 , . . . , dp ) unter der Verkettung aus:
 Pp

b
d
1k
k
k=1
Pp
p
X


k=1 b2k dk  =

A ◦ B(d) = A(B(d)) = A(
bjk dk ) = A 

Pp . . .
k=1
k=1 bnk dk
1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN 26
=(
n
X
j=1
aij ·
p
X
k=1
p
p
n X
n
X
X
X
bjk dk ) = (
aij bjk dk ) = ( (
aij bjk )dk ) .
j=1 k=1
k=1 j=1
Bilden wir nun die Matrix C = (cik ) mit den Komponenten
cik =
n
X
aij bjk ,
j=1
so erkennen wir, dass für die zugehörigen Abbildungen gilt
A◦B =C.
Die Matrix C wird als Produkt der Matrizen A und B, symbolisch: C = A·B = AB, bezeichnet,
weil ihre Bildung viele Eigenschaften eines Produktes aufweist.
5. November 2002
Eigenschaften des Matrizenproduktes.
• Das Produkt der Matrizen A und B ist nur definiert, wenn die Spaltenzahl von A gleich
der Zeilenzahl von B ist. In der Abbildungssprache bedeutet das: das Matrizenprodukt
ist eine Abbildung
Rm,n × Rn,p −→ Rm,p .
• Die Komponente cik ergibt sich, indem man die n Komponenten der i-ten Zeile der Matrix
A gliedweise mit den n Komponenten der k-ten Spalte der Matrix B multipliziert und
die erhaltenen Produkte addiert.
• Beispiel.




4 2
8 8 2 18
 3 0 · 1 2 0 3 = 3 6 0 9 
2 0 1 3
0 2
4 0 2 6
• Im Fall m = n = p sind zwar sowohl AB als auch BA definiert, aber im allgemeinen gilt
AB 6= BA. Beispiel:
0 1
1 0
0 −1
·
=
−1 0
0 −1
−1 0
1 0
0 1
0 1
·
=
.
0 −1
−1 0
1 0
Damit ist das Matrizenprodukt nicht kommutativ.
• Das Matrizenprodukt ist assoziativ.
Beweis. Da in den Spalten der Matrix die Bilder der Einheitsvektoren unter der zugehörigen Abbildung stehen, ist eine Matrix durch die zugehörige Abbildung eindeutig
1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN 27
bestimmt. Zum Nachweis der Assoziativität des Matrizenproduktes genügt es deshalb die
Assoziativität der Verkettung von Abbildungen nachzuweisen:
(A ◦ B) ◦ C = A ◦ (B ◦ C) .
Diese gilt aber ganz allgemein:
(A ◦ B) ◦ C(d) = A ◦ B(C(d)) = A(B(C(d))) = A(B ◦ C)(d)) = A ◦ (B ◦ C)(d)
für alle d aus dem Definitionsbereich der Abbildung C.
Der rechnerische Nachweis der Assoziativität braucht einen großen Schreibaufwand und
kann durch die eben geführte Argumentation vermieden werden.
• Das Matrizenprodukt verhält sich distributiv:
(A + B)C = AC + BC , A(B + C) = AB + AC .
• Das Matrizenprodukt ist mit der Multiplikation mit Skalaren verträglich:
(dA)B = d(AB) = A(dB) .
• Im Fall p = 1 lässt sich die Matrix B als Spaltenvektor b ∈ Rn auffassen, und das Ergebnis
als Spaltenvektor c ∈ Rm . In diesem Sinn ist der Wert der Abbildung A an der Stelle b
nichts anderes als das Matrizenprodukt Ab:
A(b) = c = Ab .
Konvention: In Zukunft schreiben wir Ab statt A(b), falls keine Verwechslungen möglich
sind.
• Das Produkt Zeile mal Spalte ist nur definiert, falls beide die gleiche Länge haben; das
Produkt Spalte mal Zeile kann man jedoch immer bilden.
Definition und Bezeichnung. Die zu einer m × n-Matrix A = (aij ) transponierte Matrix
At = (atij ) ist eine n × m-Matrix und entsteht aus A durch Vertauschen der Zeilen und Spalten:
atij = aji .
Das Transponieren ist mit der Matrizenaddition und der Multiplikation mit Skalaren verträglich:
(A + B)t = At + B t ,
(dA)t = d(At )
Bezüglich der Matrizenmultiplikation gilt:
(AB)t = B t · At
Zum Abschluss dieses Kapitels soll noch einige spezielle Matrizentypen vorgestellt werden.
Definitionen.
1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN 28
1. Eine Matrix heißt quadratisch, wenn die Zeilenzahl gleich der Spaltenzahl ist. Ist diese
Anzahl n, so hat man eine quadratische Matrix der Dimension n.
2. Die quadratische Matrix E = En = (δij ) (der Dimension n) heißt (n-dimensionale) Einheitsmatrix.
Die Einheitsmatrix ist ein neutrales Element bezüglich der Matrizenmultiplikation (soweit definiert):
A ∈ Rm,n =⇒ Em · A = A = A · En .
3. Eine quadratische Matrix A = (aij ) heißt stochastisch, wenn alle Komponenten nicht
negativ sind und die Summe der Komponenten einer Zeile für jede Zeile gleich 1 ist:
X
aij = 1
für alle i .
j
Die stochastischen Matrizen dienen zur Beschreibung der sogenannten homogenen Markovketten, benannt nach Andrej Andrejevič Markov, ∗ 14. 6. 1856 im Gouvernement Rjasan,
† 20. 7. 1922 St. Petersburg, ab 1893 Professor an der Universität in St. Petersburg. Dabei
geht es um eine Folge von Versuchen, wobei in jedem Versuch nur eins von k unvereinbaren
Ereignissen A1 , A2 , . . . , Ak eintreten kann und die Wahrscheinlichkeit für das Eintreten des
Ereignisses Aj bei einem Versuch nur davon abhängt, welches Ereignis Ai im vorigen Versuch
eingetreten ist. Bezeichnet pij diese Wahrscheinlichkeit, so ist die sogenannte Übergangsmatrix
(oder der Übergangskern) (pij ) eine stochastische Matrix.
Beispiel. Ein Teilchen bewege sich auf der Zahlengeraden durch zufällige Stöße zwischen 1 und
n, wobei es immer nur bei einer natürlichen Zahl zum Stillliegen kommt. Dabei gelte folgendes:
• Befindet sich das Teilchen vor dem Stoß an der Stelle 1, so wird es auf die Stelle 2 gestoßen.
• Befindet sich das Teilchen vor dem Stoß an der Stelle n, so wird es auf die Stelle n − 1
gestoßen.
• Befindet sich das Teilchen vor dem Stoß an einer Stelle i mit 1 < i < n, so wird es mit
der Wahrscheinlichkeit p auf die Stelle i − 1 und mit der Wahrscheinlichkeit 1 − p auf die
Stelle gestoßen.
Hier hat die Übergangsmatrix

0
 p

 0

 ..
 .

 0
0
die folgende Form:
1
0
0
0 1−p
0
p
0
1−p
..
..
..
.
.
.
0
0
0
0
0
0
... 0 0
... 0 0
... 0 0
.. ..
. .
0
0
0
..
.








... p 0 1 − p 
... 0 1
0
Satz. Das Produkt von zwei stochastischen Matrizen gleicher Dimension ist wieder eine stochastische Matrix.
1 GRUNDLEGENDES ÜBER LINEARE GLEICHUNGSSYSTEME UND MATRIZEN 29
Beweis. Es seien A = (aij ) und B = (bjk ) stochastische
Matrizen der Dimension n. Aus aij ≥ 0
Pn
für alle i, j und bjk ≥ 0 für alle j, k folgt j=1 aij bjk ≥ 0 für alle i, k.
Ferner gilt:
n X
n
X
k=1 j=1
aij bjk =
n X
n
X
j=1 k=1
aij bjk =
n
X
j=1
aij
n
X
k=1
bjk =
n
X
j=1
aij · 1 =
n
X
aij = 1 .
j=1
Unsere Beispielmatrix mit sich selbst multipliziert ergibt:

p
0
1−p
0
... 0
0
0
2
 0 2p − p2
0
(1
−
p)
.
.
.
0
0
0

2
 p2
0
2p − 1p p
0
... 0
0
0

2
2
 0
p
0
2p − 1p p . . . 0
0
0

 ..
..
..
..
..
..
..
 .
.
.
.
.
.
.

 0
0
0
0
. . . 0 (1 − p)2
0
0
0
0
... p
0
1−p






.




Sie beschreibt, mit welcher Wahrscheinlichkeit sich ein Teilchen von der Stelle i nach zwei
Stößen an der Stelle j befindet.
Herunterladen