§7 Matrizen über R und C

Mathematik für Physiker I, WS 2013/2014
Montag 13.1
$Id: matrix.tex,v 1.16 2014/01/13 12:04:56 hk Exp $
$Id: det.tex,v 1.13 2014/01/10 16:51:54 hk Exp hk $
§7
Matrizen über R und C
7.5
Das Gaußsche Eliminationsverfahren in Matrixform
Am Ende der letzten Sitzung hatten wir begonnen die sogenannte LR-Zerlegung einer
Matrix A zu untersuchen, dies war eine Zerlegung A = LR in eine untere Dreiecksmatrix L und eine obere Dreiecksmatrix R. Wir hatten bereits gesehen das die Berechnung
dieser Zerlegung mittels des Gaußschen Eliminationsverfahren möglich ist, zumindest
solange bei diesem keine Zeilenvertauschungen erforderlich sind. Wir wollen uns jetzt
auch noch ein Beispiel hierzu anschauen bei dem auch lange Stufen im Eliminationsverfahren vorkommen, wir betrachten die 4 × 4-Matrix


1 1
3 5
 1 1
0 4 

A=
 3 3 −1 7  .
2 2
0 1
In der ersten Spalte haben wir
1
1
3
2
1
3 5
1 1
3 5
1
0 4
0 0 −3 −1
−→
3 −1 7
0 0 −10 −8
2
0 1
0 0 −6 −9
l12 = 1
l13 = 3
l14 = 2
und damit liegt in der ersten Zeile eine lange Stufe vor. Trotzdem können wir normal
weiter vorfahren, nur das die Werte l23 , l24 diesmal durch die dritte Spalte festgelegt
werden, also
1
0
0
0
1
3 5
1 1
3 5
0 −3 −1
0 0 −3 −1
−→
0 −10 −8
0 0
0 − 14
3
0 0
0 −7
0 −6 −9
l23 =
l24 =
10
3
l34 =
3
2
2
und schließlich wird im letzten Schritt
1
0
0
0
1
3 5
1 1
3 5
0 −3 −1
0 0 −3 −1
−→
0
0 − 14
0 0
0 − 14
3
3
0
0 −7
0 0
0 0
17-1
Mathematik für Physiker I, WS 2013/2014
Damit haben wir in diesem

1
 1
L=
 3
2
Montag 13.1
Beispiel die LR-Zerlegung A = LR mit



1 1 3
5
0 0 0


1 0 0 
 , R =  0 0 −3 −1

14
10
 0 0 0 − .

1
0
3
3
2 32 1
0 0 0
0
Bisher haben wir nur den Fall behandelt, dass das Gaußsche Eliminationsverfahren
ohne Zeilenvertauschungen auskommt, im allgemeinen Fall muss es keine LR-Zerlegung
von A geben, man kann aber durch eine geeignete Permutation der Zeilen von A eine
Matrix A0 bilden die ihrerseits eine LR-Zerlegung zuläßt. Wir können auch sagen wie
wir die Zeilen von A umordnen müssen, die gesuchte Umordnung führt einfach alle
während der Elimination benötigten Zeilenvertauschungen gleich von vornherein aus.
Wenn wir dies formal hinschreiben wollen, ist eine kleine Rechnung hilfreich. Seien
n ∈ N mit n ≥ 1 und K ∈ {R, C} sowie 1 ≤ k, l ≤ n und eine Permutation π ∈ Sn
gegeben. Dann ist Tπ ekl die n × n-Matrix in deren i-ter Zeile für 1 ≤ i ≤ n gerade
die π(i)-te Zeile von ekl steht, d.h. diese ist genau dann von Null verschieden wenn
π(i) = k, also i = π −1 (k), ist und dann steht in der l-ten Spalte eine Eins und alle
anderen Einträge sind Null, also
Tπ ekl = eπ−1 (k),l .
Weiter ist ekl Tπ die n × n-Matrix deren k-te Zeile die l-te Zeile von Tπ ist und alle
anderen Zeilen sind Null. Nun steht in der l-ten Zeile von Tπ genau ein von Null
verschiedener Eintrag und zwar eine Eins in der π(l)-ten Spalte, also
ekl Tπ = ek,π(l) .
Insbesondere haben wir mit diesen beiden Formeln auch
Tπ ekl = eπ−1 (k),l = eπ−1 (k),π(π−1 (l)) = eπ−1 (k),π−1 (l) Tπ ,
und im Fall k 6= l folgt weiter für jedes λ ∈ K
Tπ Ekl (λ) = Tπ (1 + λekl ) = Tπ + λTπ ekl = Tπ + λeπ−1 (k),π−1 (l) Tπ
= (1 + λeπ−1 (k),π−1 (l) )Tπ = Eπ−1 (k),π−1 (l) (λ)Tπ .
Kommen wir nun zum allgemeinen Gaußschen Eliminationsverfahren, also mit eventuell auftretenden Zeilenvertauschungen. Wir übernehmen die obigen Bezeichnungen.
Bei Bearbeitung der i-ten Zeile ist es für 1 ≤ i < m dann als erster Schritt eventuell
nötig diese mit einer weiter unten stehenden Zeile zu vertauschen, sagen wir mit der
ji -ten Zeile wobei i < ji ≤ m ist. Dann bezeichne πi ∈ Sn die Transposition die i
und ji vertauscht. Andernfalls, also wenn keine Vertauschung erforderlich ist, sei πi die
identische Permutation. In beiden Fällen ist dann πi−1 = πi . Die Produktdarstellung
der Stufenform R ist dann
R = Lm−1 Tπm−1 Lm−2 Tπm−2 · · · L2 Tπ2 L1 Tπ1 A.
17-2
Mathematik für Physiker I, WS 2013/2014
Montag 13.1
Sei 1 < i < m. Wir wollen dann die im i-ten Schritt auftauchende Permutationsmatrix
nach vorne durchtauschen. Die weiter rechts stehenden Matrizen Lj haben Indizes
1 ≤ j < i, sei also ein solches 1 ≤ j < i gegeben. Ist πi dann die Identität, so ist
Tπi = 1 und wir haben Tπi Lj = Lj = Lj Tπi . Andernfalls ist πi die i und ji vertauschende
Transposition. Für jedes j < k ≤ m haben wir nun wegen πi−1 = πi und πi (j) = j
Tπi Ekj (−ljk ) = Eπi (k),j (−ljk )Tπi ,
also wird
Tπi Lj = Tπi Emj (−ljm ) · · · Ej+1,j (−lj,j+1 ) = Eπi (m),j (−ljm ) · · · Eπi (j+1),j (−lj,j+1 )Tπi
= Emj (−lj,πi (m) ) · · · Ej+1,j (−lj,πi (j+1) )Tπi ,
und das links stehende Produkt hat dieselbe Form wie Lj nur das jetzt die Einträge
lj,m , . . . , lj,j+1 gemäß πi permutiert wurden. Ziehen wir auf diese Weise alle Permutationsmatrizen nach rechts, so wird
R = L0m−1 · · · L01 Tπm−1 · · · Tπ1 A = L0m−1 · · · L01 Tπ1 ···πm−1 A,
wobei die Matrizen L01 , . . . , L0m−1 die umsortierten Varianten von L1 , . . . , Lm−1 sind. Beachte das dabei auch mehrere aufeinanderfolgende Umsortierungen auftreten können,
für 1 ≤ j < m−1 müssen bis zu m−1−j Permutationsmatrizen an Lj vorbei und dann
ist L0j das Ergebnis dieser bis zu m − 1 − j vielen Umsortierungsschritte. Fassen wir
π = π1 · · · πm−1 ∈ Sn zusammen, so haben wir schließlich eine LR-Zerlegung Tπ A = LR
−1
mit L = L01−1 · · · L0m−1
.
Wir wollen uns auch hierfür ein Beispiel anschauen und eine LR-Zerlegung der
Matrix


3 −1 3 1
 3 −1 3 2 

A=
 2
0 1 1 
−2
0 2 3
herstellen. Im ersten Schritt ist keine Zeilenvertauschung erforderlich und wir rechnen
wie im vorigen Beispiel
3 −1
3
3 −1 3 1
0
0
0
3 −1 3 2
−→ 0
2
−1
2
0 1 1
3
2
−2
0 2 3
0 −3
4
1
1
1
3
11
3
l12 =
1
2
l13 =
3
l14 = − 23
An dieser Stelle ist nun eine Zeilenvertauschung erforderlich, wir vertauschen die zweite
mit der dritten Zeile. Um bei diesen Vertauschungen die Übersicht zu behalten, schreiben wir die permutierten lij neu hin, sofern sie sich ändern, und führen für diese keine
neuen Bezeichungen ein. Außerdem schreiben wir auch die verwendete Permutation π
17-3
Mathematik für Physiker I, WS 2013/2014
Montag 13.1
in der Form [π(1), π(2), . . .] hin, also
3 −1 3
0
0 0
2
−1
0
3
2
0 −3 4
1
1
1
3
11
3
3 −1
3
2
0
−1
3
−→
0
0
0
2
0 −3
4
1
π = [1, 3, 2, 4]
2
l12 =
3
l13 =
1
1
3
1
11
3
Nun können wir die zweite Zeile bearbeiten
3 −1 3
2
0
−1
3
0
0 0
0 − 32 4
3 −1
3 1
2
1
0
−1
3
3
−→
1
0
0
0 1
11
0
0
3 4
3
1
1
3
l23 =
0
l24 = −1
und erneut wird eine Zeilenvertauschung erforderlich, wir müssen die dritte und die
vierte Zeile miteinander vertauschen. In der Notation gehen wir wie oben vor nur
das wir für π gleich das Produkt der beiden bisherigen Permutationen hinschreiben,
wobei wir darauf achten müssen die neue Permutation von rechts an die bisherige
heranzumultiplizieren, also [1, 3, 2, 4] ◦ [1, 2, 4, 3] = [1, 3, 4, 2] und somit
3 −1 3 1
3 −1
3 1
2
1
2
0
−1 3
0
−1 13
3
3
−→
0
0 0 1
0
0
3 4
0
0 3 4
0
0
0 1
π
= [1, 3, 4, 2]
l23 =
l24 =
−1,
0,
l13 = − 23
l14 =
1
Ein weiterer Schritt ist nicht mehr notwendig, also wird schließlich l34 = 0. Insgesamt
haben wir damit die LR-Zerlegung ATπ = LR mit

1
0
 23
1
L=
 − 2 −1
3
1
0
0
0
1
0


0

0 
,R = 

0 
1


1
3 −1
3 1
2
1 

0
−1 3 
0
3
,T = 
0
0
3 4  π  0
0
0
0 1
0
0
0
0
1
0
1
0
0

0
0 
.
1 
0
Dies ist zwar eigentlich eine LR-Zerlegung der Matrix Tπ A man spricht aber trotzdem etwas ungenau davon die LR-Zerlegung von A durchzuführen. Wir fassen unsere
Überlegungen zur LR-Zerlegung jetzt noch in einem Satz zusammen.
Satz 7.9 (Existenz der LR-Zerlegung)
Seien n, m ∈ N mit n, m ≥ 1, K ∈ {R, C} und A ∈ K m×n eine m × n-Matrix über
K. Dann existieren eine Permutation π ∈ Sm , eine untere Dreiecksmatrix L ∈ K m×m
mit Einsen auf der Hauptdiagonalen und eine obere Dreiecksmatrix R ∈ K m×n mit
Tπ A = LR.
Beweis: Dies haben wir bereits oben gezeigt.
17-4
Mathematik für Physiker I, WS 2013/2014
Montag 13.1
Die LR-Zerlegung kann dann auch direkt zur Lösung linearer Gleichungssysteme Ax =
b mit Koeffizientenmatrix A verwendet werden, und zwar hauptsächlich wenn dies ein
reguläres lineares Gleichungssystem ist, wenn also n = m gilt und A invertierbar ist.
Da die Matrizen Tπ und L beide invertierbar ist, ist A nach Lemma 4.(f) genau dann
invertierbar wenn LR = Tπ A dies ist und dies ist weiter genau dann der Fall wenn R
invertierbar ist. Letzteres bedeutet dabei das alle Einträge der Hauptdiagonalen von
R von Null verschieden sind. Nehme an das diese Situation vorliegt und wir Ax = b
lösen wollen. Zunächst ist dies gleichwertig zu
LRx = Tπ Ax = Tπ b,
bilden wir also den Spaltenvektor


bπ(1)


b0 := Tπ b =  ...  ,
bπ(n)
so müssen wir LRx = b0 lösen. Dies ist aber leicht möglich, zuerst löse Ly = b0 durch
sukzessive Berechnung von y1 , . . . , yn , also wie bei den linearen Gleichungssystemen in
Stufenform nur von oben nach unten, und dann löse Rx = y als System in Stufenform. Diese Methode ist hauptsächlich für die numerische Lösung regulärer linearer
Gleichungssysteme von Interesse, wobei dabei eine für numerische Zwecke verfeinerte
Version der LR-Zerlegung benutzt wird, die wir hier nicht mehr besprechen wollen.
Wir wollen hier nur noch ein Beispiel der eben besprochenen Lösungsmethode
vorführen und betrachten das lineare Gleichungssystem




3 −1 3 1
2
 3 −1 3 2 


 und b =  −3  .
Ax = b mit A = 
 2
 5 
0 1 1 
−2
0 2 3
1
Die LR-Zerlegung Tπ A = LR haben wir bereits oben berechnet. Wegen π = [1, 3, 4, 2]
wird


2
 5 

b0 = 
 1 .
−3
Die Lösung von Ly = b0 erfolgt durch
2
11
2
y1 = 2, y2 = 5 − y1 = , y3 = 1 + y1 + y2 = 6, y4 = −3 − y1 = −5
3
3
3
und schließlich lösen wir Rx = y durch
1
26
3 11
1
x4 = −5, x3 = (6 − 4x4 ) = , x2 =
+ x3 − x4 = 21,
3
3
2 3
3
1
2
x1 = (2 + x2 − 3x3 − x4 ) = .
3
3
17-5
Mathematik für Physiker I, WS 2013/2014
§8
Montag 13.1
Determinanten
Wir kommen jetzt zum Begriff der Determinante. Determinanten sind merkwürdigerweise über hundert Jahre älter als Matrizen, und sie wurden auch ursprünglich nicht
im Zusammenhang mit linearen Gleichungssystemen eingeführt, sondern bei der Behandlung von Polynomgleichungen n-ten Grades. Der Name Determinante“ kommt
”
dagegen aus ihrer Verwendung im Zusammenhang mit linearen Gleichungssystemen,
und wir wollen erst einmal erwähnen was hier eigentlich determiniert“ wird. Ange”
nommen wir haben eine quadratische Matrix A über den reellen oder den komplexen
Zahlen. Wie wir noch sehen werden können dann zwei verschiedene Fälle auftreten,
entweder ist das lineare Gleichungssystem Ax = b für jede rechte Seite b eindeutig
lösbar oder es ist niemals eindeutig lösbar und es gibt sowohl rechte Seiten b für die
Ax = b nicht lösbar ist als auch rechte Seiten b für die Ax = b mehrere verschiedene
Lösungen hat, man nennt dieses Verhalten linearer Gleichungssysteme manchmal auch
die Fredholm-Alternative“. Ersteres tritt genau dann auf wenn die Determinante von
”
A von Null verschieden ist und letzteres genau dann wenn sie gleich Null ist. In diesem
Sinne bestimmt, also determiniert, die Determinante von A also das Lösbarkeitsverhalten linearer Gleichungssysteme mit der Koeffizientenmatrix A.
Die Determinante einer n × n Matrix A über K = R oder K = C ist eine Zahl
det A ∈ K. Alternativ wird oft auch |A| anstelle von det A geschrieben. Wird dabei A
direkt in Matrixform (...) hingeschrieben, so läßt man die Klammern um die Matrix in
der Schreibweise |A| üblicherweise fort, schreibt also etwa
1 2 1 3 für die Determinante det A der Matrix
A=
1 2
1 3
.
Beachte das die Determinante nur für quadratische Matrizen definiert wird. Bevor
wir zur Definition der allgemeinen Determinante kommen, wollen wir sie zunächst in
den drei kleinen Fällen n = 1, 2, 3 explizit hinschreiben. Für 1 × 1 Matrizen ist die
Determinante einfach der eine Eintrag der Matrix, also det(a) = a für a ∈ K. Die
Determinante einer 2 × 2 Matrix wird durch die Formel
a b c d := ad − bc
definiert. Beachte das uns der Ausdruck ad − bc bereits in §7 in der Formel
a b
c d
−1
1
=
ad − bc
17-6
d −b
−c
a
Mathematik für Physiker I, WS 2013/2014
Montag 13.1
für die Inverse eine 2 × 2 Matrix begegnet ist. Dies ist kein Zufall, wie wir sehen werden
gibt es auch für n × n Matrizen eine direkte Formel für die Einträge der inversen
Matrix A−1 in Termen gewisser Determinanten. Für n > 3 ist diese Formel allerdings
für praktische Zwecke nur selten hilfreich. Wir kommen nun zur Determinante einer
3 × 3 Matrix, und diese Formel ist bereits merklich komplizierter.
a11 a12 a13 a21 a22 a23 := a11 a22 a33 + a12 a23 a31 + a13 a21 a32 − a13 a22 a31 − a11 a23 a32 − a12 a21 a33 .
a31 a32 a33 Es ist populär sich diese Formel mit Hilfe der sogenannten Regel von Sarrus zu merken.
Hierzu schreibt man sich die ersten beiden Spalten der 3 × 3 Matrix noch einmal rechts
neben die Matrix. Dann bildet man die drei Dreierprodukte entlang der drei Diagonalen
von links nach rechts und addiert diese. Anschließend bildet man die Dreierprodukte
auf den drei Gegendiagonalen von rechts nach links und zieht diese von der zuvor
gebildeten Summe ab. Die so erhaltene Zahl ist die Determinante der Matrix.
−
a11
a12
a13
a11
a12
a21
a22
a23
a21
a22
a31
a32
a33
a31
a32
−
−
+
+
+
Natürlich sind Sie nicht verpflichtet die Regel von Sarrus zu verwenden, mit etwas
Konzentration und ein wenig Übung ist es leicht sich die beiden verdoppelten Spalten
im Kopf zu denken, ohne sie extra hinzuschreiben. Allerdings ist es am besten die Regel
von Sarrus gleich wieder zu vergessen, sie stellt sich als die mit Abstand umständlichste
Methode zur Berechnung der Determinante einer 3 × 3 Matrix heraus.
Für n = 2 und n = 3 hat die Determinante auch eine direkte geometrische Bedeutung. Die Determinante einer 2 × 2 Matrix, beziehungsweise genauer ihr Betrag,
ist die Fläche des von den beiden Spalten, oder Zeilen, aufgespannten Parallelograms.
Entsprechend ist der Betrag der Determinante für n = 3 gleich dem Volumen des
von den drei Spalten aufgespannten Parallelepipeds, dies ist das dreidimensionale Analogon zum Parallelogram und wird oft auch als ein Spat“ bezeichnet. Wir werden
”
diese geometrischen Interpretationen aber erst etwas später in diesem Semester begründen. Entsprechend kann dann auch die Determinante in höheren Dimensionen als
ein n-dimensionales Volumen aufgefasst werden. Bevor wir die exakte Definition dieser
höherdimensionalen Determinanten behandeln, wollen wir hier nur erwähnen das die
Sarrus-Regel sich nicht auf die Determinante von quadratischen Matrizen mit n ≥ 4
Zeilen und Spalten fortsetzt, beispielsweise ist die Determinante einer 4 × 4 Matrix eine
Summe aus 24 Summanden und nicht nur von 8 wie es die Sarrus Regel erwarten ließe.
8.1
Die symmetrische Gruppe
Um die Determinante für größere Matrizen zu definieren, benötigen wir erneut den
Permutationsbegriff aus §7.5. Dort hatten wir die Menge Sn aller Permutationen der
17-7
Mathematik für Physiker I, WS 2013/2014
Montag 13.1
ersten n Zahlen, also aller bijektiven Abbildungen der Menge {1, . . . , n} auf sich selbst,
betrachtet und mit der Hintereinanderausführung als Multiplikation versehen. Diese
Multiplikation erfüllt dann einige Rechenregeln:
(G1) Das Assoziativgesetz π · (η · τ ) = (π · η) · τ für alle π, η, τ ∈ Sn . Dies ist nur ein
Spezialfall des allgemeinen Assoziativgesetzes der Hintereinanderausführung aus
§2.Lemma 1.
(G2) Es gibt ein neutrales Element der Multiplikation, nämlich die identische Abbildung 1 := idM . Diese erfüllt 1 · π = π · 1 = π für alle π ∈ Sn .
(G3) Jedes π ∈ Sn hat ein multiplikatives Inverses π −1 ∈ Sn mit π −1 · π = π · π −1 = 1.
Nach §2.Lemma 2 ist π −1 nämlich gerade die Umkehrabbildung zu π.
Man bezeichnet diese drei Eigenschaften als die Gruppenaxiome und nennt Sn eine
Gruppe. Wir sind hier nicht abstrakt an den Gruppenaxiomen interessiert, aber drei
Folgerungen aus diesen werden für uns sehr wichtig sein.
1. Ist η ∈ Sn und durchläuft π die Elemente von Sn , so durchläuft das Produkt η · π
ebenfalls genau alle Elemente von Sn . Etwas formaler gesagt, ist die Abbildung
f : Sn → Sn ; π 7→ η · π
bijektiv. In der Tat, um einzusehen das f bijektiv ist, ist einzusehen das es für
jedes τ ∈ Sn genau ein π ∈ Sn mit τ = η · π gibt, und die Gruppenaxiome sagen
uns das π = η −1 · τ dieses eindeutige Element von Sn ist.
2. Analog ist für jedes η ∈ Sn auch die Abbildung
g : Sn → Sn ; π 7→ π · η
bijektiv.
3. Auch die Abbildung
h : Sn → Sn ; π 7→ π −1
ist bijektiv und wegen (π −1 )−1 = π für alle π ∈ Sn gleich ihrer eigenen Umkehrabbildung.
Man kann sich die symmetrische Gruppe Sn alternativ auch als die Menge aller möglichen Anordnungen der Zahlen 1, . . . , n vorstellen. Ist nämlich π ∈ Sn eine Permutation,
so kommt in der Liste
π(1), π(2), . . . , π(n)
jede Zahl zwischen 1 und n genau einmal vor, die Liste ist also eine Anordnung der
Zahlen 1, . . . , n. Haben wir umgekehrt eine solche Liste k1 , . . . , kn in der jede Zahl
zwischen 1 und n genau einmal vorkommt, so können wir durch π(i) := ki für i =
17-8
Mathematik für Physiker I, WS 2013/2014
Montag 13.1
1, . . . , n eine zugehörige Permutation definieren. Schauen wir uns dies einmal an einem
Beispiel mit n = 4 an. Die Anordnung
π:
4, 3, 2, 1
entspricht der durch π(1) = 4, π(2) = 3, π(3) = 2 und π(4) = 1 gegebenen Permutation,
denn 4 ist das erste Element in unserer Aufzählung, 3 ist das zweite Element in der
Aufzählung, und so weiter. Ebenso entspricht
η:
3, 1, 4, 2
der Permutation η(1) = 3, η(2) = 1, η(3) = 4 und η(4) = 2. Für das Produkt τ :=
π · η = π ◦ η ist also
τ (1)
τ (2)
τ (3)
τ (4)
=
=
=
=
π(η(1)) = π(3) = 2,
π(η(2)) = π(1) = 4,
π(η(3)) = π(4) = 1,
π(η(4)) = π(2) = 3,
und als Aufzählung geschrieben ist damit
τ =π·η :
2, 4, 1, 3.
Mit der Interpretation von Permutationen als Auflistungen der Zahlen von 1 bist n ist
es auch leicht die Elemente der symmetrischen Gruppe zu zählen.
Lemma 8.1 (Elementeanzahl der Sn )
Für jedes n ∈ N mit n ≥ 1 hat die symmetrische Gruppe Sn genau n! viele Elemente.
Beweis: Für das erste Element der Aufzählung haben wir n Möglichkeiten, für das
zweite dann nur noch n − 1 Möglichkeiten, für das dritte n − 2 Möglichkeiten, und so
weiter, bis für das letzte Element nur noch eine Möglichkeit verbleibt. Als Anzahl aller
möglichen Permutationen ergibt sich damit
n · (n − 1) · (n − 2) · . . . 1 = 1 · 2 · . . . · n = n!.
Schreiben wir |M | für die Anzahl aller Elemente einer endlichen Menge M , so sind
also
|S1 | = 1, |S2 | = 2, |S3 | = 6, |S4 | = 24, |S5 | = 120, . . .
Die Elemente der symmetrischen Gruppe Sn können in zwei verschiedene Sorten eingeteilt werden, die geraden und die ungeraden Permutationen. Nehmen wir einmal an
wir haben eine Permutation π ∈ Sn gegeben. Dann sind π(1), π(2), . . . , π(n) genau die
17-9
Mathematik für Physiker I, WS 2013/2014
Montag 13.1
Zahlen zwischen 1 und n nur in einer anderen Reihenfolge. Dies übeträgt sich dann
auch auf Paare von verschiedenen Zahlen zwischen 1 und n, d.h.
(π(1), π(2)), . . . , (π(1), π(n)), (π(2), π(1)), (π(2), π(3)), . . . , (π(2), π(n)),
. . . , (π(n − 1), π(1)), . . . , (π(n − 1), π(n))
sind wieder genau diese Paare, nur erneut in einer anderen Reihenfolge. Dies modifizieren wir noch etwas und betrachten nur noch die nach Größe geordneten Paare (i, j)
mit 1 ≤ i < j ≤ n, bei denen der zweite Eintrag also größer als der erste Eintrag ist.
Wenden wir unsere Permutation auf diese korrekt geordneten Paare an, so erhalten wir
(π(1), π(2)), . . . , (π(1), π(n)), (π(2), π(3)), . . . , (π(2), π(n)), . . . , (π(n − 1), π(n))
nur noch die Hälfte aller möglichen Paare. Diese umgeordneten Paare müssen aber
nicht mehr nach Größe geordnet sein, die Permutation kann ja auch richtig geordnete
Paare auf falsch geordnete Paare abbilden. Jedes Paar bei dem dies vorkommt nennen
wir einen Fehlstand von π, d.h.
(i, j) mit 1 ≤ i < j ≤ n ist Fehlstand von π :⇐⇒ π(i) > π(j).
Bilden wir nun das Produkt der Differenzen aller unserer obigen Paare, so erhalten wir
fast genau das Produkt aller Differenzen nach Größe geordneter Paare, es kommt nur
für jeden Fehlstand ein Minus Zeichen hinzu. Schreiben wir also F (π) für die Menge
aller Fehlstände von π, so ist
Y
Y
Y
(π(j) − π(i)) = (−1)|F (π)|
(j − i) = ±
(j − i).
1≤i<j≤n
1≤i<j≤n
1≤i<j≤n
Tritt in der obigen Formel das Pluszeichen auf, ist also |F (π)| gerade, so nennen wir
π eine gerade Permutation, und andernfalls heißt π eine ungerade Permutation. Zur
Verwendung in Rechnungen führen wir noch ein Symbol für das auftretende Vorzeichen
ein.
Definition 8.1 (Vorzeichen einer Permutation)
Seien n ∈ N mit n ≥ 1 und π ∈ Sn . Dann heißt
(−1)π := (−1)|F (π)| =
π(j) − π(i)
j−i
1≤i<j≤n
Y
das Vorzeichen von π.
Wir wollen drei Beispiele behandeln.
1. Wir fangen mit dem konkreten Beispiel n = 4 und der durch 3, 4, 1, 2 gegebenen
Permutation π an. Listen wir die nach Größe geordneten Paare und ihre Bilder
17-10
Mathematik für Physiker I, WS 2013/2014
Montag 13.1
unter π auf, so ergibt sich
(i, j)
1, 2
1, 3
1, 4
2, 3
2, 4
3, 4
(π(i), π(j))
3, 4
3, 1 F
3, 2 F
4, 1 F
4, 2 F
1, 2,
wobei die Fehlstände mit dem Symbol F“ markiert sind. Wir haben in diesem
”
Beispiel also |F (π)| = 4 Fehlstände und somit (−1)π = 1, d.h. π ist eine gerade
Permutation.
2. Sei n ∈ N mit n ≥ 2 und bezeichne τ ∈ Sn die Transposition die zwei verschiedene Zahlen 1 ≤ i < j ≤ n miteinander vertauscht. Fehlstände von τ müssen i
oder j involvieren. Gehen wir die Möglichkeiten durch, so ergeben sich genau die
folgenden Fehlstände von τ
F (τ ) = {(i, k)|i < k ≤ j} ∪ {(k, j)|i < k < j}
also |F (τ )| = (j − i) + (j − i − 1) = 2(j − i) − 1 und insbesondere (−1)τ = −1,
d.h. Transpositionen sind immer ungerade.
3. Nun sei π eine Permutation die r ≥ 2 aufeinanderfolgende Ziffern zyklisch nach
rechts schiebt, beispielsweise die Ziffern von i bis i + r − 1 mit 1 ≤ i ≤ n − r + 1.
Es soll also π(k) = k für 1 ≤ k < i und für i + r ≤ k ≤ n, π(k) = k + 1 für
i ≤ k < i + r − 1 und π(i + r − 1) = i sein. Fehlstände von π müssen offenbar zwei
Ziffern zwischen i und i + r − 1 involvieren und i + r − 1 als rechte Komponente
haben, also
F (π) = {(k, i + r − 1)|i ≤ k < i + r − 1}, und somit |F (π)| = r − 1,
und folglich ist auch (−1)π = (−1)r−1 , ist also r gerade so ist π ungerade und ist
r ungerade so ist π gerade.
Lemma 8.2 (Rechenregeln für das Vorzeichen einer Permutation)
Sei n ∈ N mit n ≥ 1. Dann gelten:
(a) Ist id ∈ Sn die identische Permutation, so ist (−1)id = 1.
(b) Für alle π, η ∈ Sn ist (−1)πη = (−1)π (−1)η .
(c) Für jedes π ∈ Sn ist (−1)π
−1
= (−1)π .
17-11
Mathematik für Physiker I, WS 2013/2014
Montag 13.1
Beweis: (a) Klar da die Identität keine Fehlstände hat.
(b) Es gilt
Y
Y
(π(η(j)) − π(η(i))) = (−1)|F (η)|
1≤i<j≤n
(π(j) − π(i))
1≤i<j≤n
= (−1)π (−1)η
Y
(j − i)
1≤i<j≤n
und somit ist
(−1)πη =
π(η(j)) − π(η(i))
= (−1)π (−1)η .
j
−
i
1≤i<j≤n
Y
(c) Nach (a) und (b) gilt
1 = (−1)ππ
8.2
−1
= (−1)π (−1)π
−1
=⇒ (−)π
−1
=
1
= (−1)π .
(−1)π
Definition und Grundeigenschaften der Determinante
Wir definieren die allgemeine Determinante durch die sogenannte Leipnitz-Formel.
Definition 8.2 (Definition der Determinante)
Sei n ∈ N mit n ≥ 1 und sei K ∈ {R, C}. Die Determinante einer n × n Matrix über
K wird durch die Formel
a11 · · · a1n .. . .
.. := X (−1)π a
.
. . 1π(1) · . . . · anπ(n)
π∈Sn
an1 · · · ann definiert.
Die Determinante einer n×n Matrix ist also eine Summe mit |Sn | = n! vielen Summanden und jeder Summand ist ein Produkt aus n Matrixeinträgen und einem Vorzeichen.
Für n = 1, 2, 3 stimmt dies mit der schon eingeführten Determinante überein. Schon
für n = 4 ist die Definition aber nicht direkt zum Berechnen der Determinante geeignet, man hat |S4 | = 24 viele Summanden in der Summe. Es gibt im wesentlichen
zwei Methoden Determinanten zu berechnen, zum einen über die sogenannte LaplaceEntwicklung, die wir im nächsten Abschnitt behandeln, und zum anderen über die
Umformung einer Determinante mittels elementarer Zeilen- und Spaltenoperationen.
Um den letzteren Weg zu begründen, müssen wir uns überlegen wie sich die Determinante bei Anwendung von Zeilenoperationen verhält, und hierfür wollen wir das
folgende Lemma formulieren und beweisen.
17-12
Mathematik für Physiker I, WS 2013/2014
Montag 13.1
Lemma 8.3 (Grundeigenschaften der Determinante)
Seien n ∈ N mit n ≥ 1, K ∈ {R, C} und


a11 · · · a1n


A =  ... . . . ...  ∈ K n×n
an1 · · · ann
eine n × n Matrix über K. Dann gelten:
(a) Es ist det At = det A.
(b) Geht A0 aus A durch Multiplikation einer Zeile oder einer Spalte mit einer Konstanten c ∈ K hervor, so ist det A0 = c · det A.
(c) Sei α ∈ Sn eine Permutation und bezeichne A0 die Matrix, die aus A durch Permutation der Zeilen gemäß α hervorgeht, d.h. für 1 ≤ k ≤ n ist die k-te Zeile von
A0 gleich der α(k)-ten Zeile von A. Dann ist det A0 = (−1)α det A. Die analoge
Aussage gilt für Permutationen der Spalten von A.
(d) Geht A0 aus A durch Vertauschen zweier Zeilen oder Spalten hervor, so ist det A0 =
− det A.
(e) Geht A0 aus A durch Addition eines Vielfachen einer Zeile zu einer anderen Zeile
hervor, so ist det A0 = det A. Die analoge Aussage gilt auch für Spalten statt
Zeilen.
(f ) Besteht eine Zeile oder eine Spalte von A nur aus Nullen, so ist det A = 0.
(g) Ist eine Zeile von A ein Vielfaches einer anderen Zeile von A, oder eine Spalte
von A ein Vielfaches einer anderen Spalte von A, so ist det A = 0.
Beweis: (a) Es gilt nach Lemma 2.(c)
det At =
X
(−1)π aπ(1)1 · . . . · aπ(n)n =
π∈Sn
=
X
X
(−1)π aπ(1),π−1 (π(1)) · . . . · aπ(n),π−1 (π(n))
π∈Sn
π −1
(−1)
a1,π−1 (1) · . . . · an,π−1 (n) =
π∈Sn
X
(−1)π a1π(1) · . . . · anπ(n) = det A.
π∈Sn
(b) Sei 1 ≤ i ≤ n und die i-te Zeile von A0 sei das c-fache der i-ten Zeile von A. Dann
ist
X
det A0 =
(−1)π a1π(1) · . . . · (caiπ(i) ) · . . . · anπ(n)
π∈Sn
X
=c
π∈Sn
17-13
(−1)π a1π(1) · . . . · anπ(n) = c · det A.
Mathematik für Physiker I, WS 2013/2014
Montag 13.1
Mit (a) folgt hieraus auch die Aussage über Spalten.
(c) Es gilt nach Lemma 2.(b)
det A0 =
X
(−1)π aα(1),π(1) · . . . · aα(n),π(n)
π∈Sn
= (−1)α
X
−1
(−1)πα a1,π(α−1 (1)) · . . . · an,π(α−1 (n)) = (−1)α det A.
π∈Sn
Mit (a) folgt hieraus auch die Aussage über Spaltenpermutationen.
(d) Da Transpositionen ungerade Permutationen sind ist dies ein Spezialfall von (c).
(f ) Ist 1 ≤ i ≤ n und besteht die i-te Zeile von A nur aus Nullen, so ist für jedes
π ∈ Sn stets aiπ(i) = 0, also auch a1π(1) · . . . · anπ(n) = 0. Damit ist det A = 0. Mit (a)
folgt auch die Aussage über Spalten.
(g) Nach (a) reicht es die Aussage für Zeilen einzusehen, und nach (b) können wir
annehmen, dass A sogar zwei identische Zeilen hat. Dann ändert sich die Matrix bei
Vertauschen dieser beiden Zeilen nicht, und (d) ergibt det A = − det A, also det A = 0.
(e) Seien c ∈ K, 1 ≤ i, j ≤ n mit i 6= j und A0 gehe aus A durch Addition des c-fachen
der j-ten Zeile zur i-ten Zeile hervor. Dann ist
det A0 =
X
(−1)π a1π(1) · . . . · (aiπ(i) + cajπ(i) ) · . . . · anπ(n)
π∈Sn
X
= det A + c
(−1)π a1π(1) · . . . · ajπ(i) · . . . · anπ(n) .
π∈Sn
Die hintere Summe ist gerade die Determinante der Matrix A00 , die aus A durch Ersetzen
der i-ten Zeile durch die j-te Zeile entsteht. Da A00 zwei identische Zeilen hat, ist nach
(g) aber det A00 = 0, und dies zeigt det A0 = det A.
Wie schon bemerkt soll uns das Lemma eine Methode zur Berechnung von Determinanten liefern. Wir wissen das wir jede Matrix durch Anwendung der drei elementaren
Zeilenumformungen auf Stufenform bringen können, und das Lemma sagt uns wie sich
die Determinante bei Anwendung dieser Zeilenumformungen verhält. Damit kann die
Berechnung einer allgemeinen Determinante auf die Berechung der Determinante einer
Matrix in Stufenform zurückgeführt werden. Etwas allgemeiner behandeln wir gleich
Determinanten von Dreiecksmatrizen.
Lemma 8.4 (Determinante von Dreiecksmatrizen)
Seien n ∈ N mit n ≥ 1, K ∈ {R, C} und


A=
∗
a11
...




 oder A = 
ann
17-14

a11
...
∗


ann
Mathematik für Physiker I, WS 2013/2014
Montag 13.1
eine obere oder eine untere Dreiecksmatrix. Dann ist
det A = a11 · . . . · ann .
Beweis: Schreibe wieder


a11 · · · a1n


A =  ... . . . ...  .
an1 · · · ann
Zunächst sei A eine obere Dreiecksmatrix, also aij = 0 für 1 ≤ j < i ≤ n. Sei π ∈
Sn . Gibt es dann ein 1 ≤ i ≤ n mit π(i) < i, so ist ai,π(i) = 0 und somit auch
a1,π(1) · . . . · an,π(n) = 0. Ist dagegen π(i) ≥ i für jedes 1 ≤ i ≤ n, so ist π(n) ≥ n, also
π(n) = n, und weiter π(n − 1) ≥ n − 1 also π(n − 1) = n − 1 oder π(n − 1) = n,
und wegen π(n − 1) 6= π(n) = n sogar π(n − 1) = n − 1. So fortfahrend folgt dann
π(i) = i für alle 1 ≤ i ≤ n. Es gibt in det A also höchstens einen von Null verschiedenen
Summanden, nämlich derjenige zur identischen Permutation und da diese Permutation
gerade ist, folgt
det A = a11 · . . . · ann .
Ist A eine untere Dreiecksmatrix, so ist At eine obere Dreiecksmatrix und mit Lemma
3.(a) folgt die Behauptung auch in diesem Fall.
Wir rechnen ein Beispiel.
1 2 −1
1
1
1
2
−1
1
2 −1
1 2
0
0
1
−1
0
2
−2
4
2
=
= −
−1 2
3 −1 0
4
2
0 0
2
0
3 0 −1
0
0 −6
2 −3
0 −6
2
1 2 −1
1 1
0 4
0
2
0 = − =
−
0
2 −2 0 0
0 0
0
5 −3
1
0
−2
−3
2 −1
1 4
2
0 = −16.
0
2 −2 0
0
2 Man ist allerdings nicht gezwungen so stur den Gaußschen Algorithmus abzuarbeiten,
oft kann man sich die Arbeit durch Mischen von Zeilen- und Spaltenoperationen erleichtern. Dies geschieht etwa im folgenden Beispiel wo wir zuerst Vielfache der ersten
Zeile von der dritten und vierten Zeile abziehen und anschließend die zweite und dritte
Spalte von der ersten Spalte subtrahieren
1 0 1 −1
1 0
0 0
3
1
−1
3
1
−1
3
4 1 3
7 −5 4 1
3
7 −5 0 1
3
7 −5 2 2 0
1
0 = 0 2 −2
3 −6 = 0 2 −2
3 −6 = 0
4 0 4 −3
6 0 0
0
1 −6 0 0
0
1 −6 1 1 0
8
1
1 1
0
8
1
0 1
0
8
1 17-15
Mathematik für Physiker I, WS 2013/2014
Montag 13.1
nach Lemma 3.(f). Dies ist schon eine durchaus effektive Methode zur Berechnung von
Determinanten. Bevor wir fortfahren wollen wir noch ein oft nützliches Korollar aus
unserem Lemma über Dreiecksmatrizen festhalten.
Korollar 8.5 (Determinanten von Blockdreiecksmatrizen)
Seien n ∈ N mit n ≥ 1, K ∈ {R, C} und A eine n × n-Matrix über K der Form




D1
∗
D1








D2
D2




A=
...
...

 oder A = 




∗
Dr
Dr
mit quadratischen Untermatrizen D1 , . . . , Dr . Dann gilt
det A = det(D1 ) · . . . · det(Dr ).
Beweis: Zunächst sei A eine obere Blockdiagonalmatrix habe also die links stehende
Form. Für jedes 1 ≤ i ≤ r überführe Di durch Vertauschen von Zeilen und Addition
von Vielfachen einer Zeile zu einer anderen Zeile in eine obere Dreiecksmatrix Di0 und
bezeichne si die Anzahl der dabei verwendeten Zeilenvertauschungen. Lassen wir die
dabei verwendeten elementaren Zeilenumformungen dann auch auf ganz A wirken, so
wird A in eine Matrix A0 der Form


D10
∗


0


D


2
A0 = 

...




Dr0
P
überführt, und s := ri=1 si ist die Anzahl der dabei verwendeten Zeilenvertauschungen. Mit Lemma 3.(d,e) folgen
det A = (−1)s det A0 und det Di = (−1)si det Di0
für alle 1 ≤ i ≤ r. Die Matrix A0 ist eine obere Dreiecksmatrix, und damit gilt nach
Lemma 4
r
Y
0
det A =
det Di0 .
i=1
Insgesamt haben wir damit
det A = (−1)s det A0 =
r
r
Y
Y
(−1)si det Di0 =
det Di ,
i=1
17-16
i=1
Mathematik für Physiker I, WS 2013/2014
Montag 13.1
und die Aussage ist für obere Blockdreiecksmatrizen bewiesen. Mit Lemma 3.(a) folgt
dann auch die Aussage über untere Blockdreiecksmatrizen.
Beispielsweise ist damit
1 −1 0
3
7 0
−5
3 2
−9
4 9
0
0
1
3
1 −1 2 1 ·
=
3
9 3 = 10 · (−3) = −30,
7
da es sich hier um eine untere Blockdreiecksmatrix mit den beiden 2 × 2-Kästchen
1 −1
2 1
D1 =
und D2 =
3
7
9 3
handelt. Nachdem die zuletzt bewiesenen Aussagen über Determinanten hauptsächlich
rechnerische Aspekte behandelt haben, wollen wir nun zu einem wichtigen und eher
theoretischen Satz kommen der den Zusammenhang von Determinanten und der Matrixmultiplikation herstellt.
Satz 8.6 (Multiplikationssatz für Determinanten)
Sind n ∈ N mit n ≥ 1 und A, B zwei n × n Matrizen über K ∈ {R, C} so gilt
det(A · B) = det(A) · det(B).
Beweis: Wir schreiben



a11 · · · a1n



A =  ... . . . ...  , B = 
an1 · · · ann



b11 · · · b1n
c11 · · · c1n
 .
.. . .
. 
. 
. ..  und AB =  .. . . . ..  .
.
bn1 · · · bnn
cn1 · · · cnn
P
Nach Definition der Matrizenmultiplikation gilt dann cij = nk=1 aik bkj für alle 1 ≤
i, j ≤ n. Hiermit rechnen wir nun
X
(−1)π c1,π(1) · . . . · cn,π(n)
det(AB) =
π∈Sn
=
X
(−1)π
X
!
a1,j1 bj1 ,π(1)
(−1)π
n
X
· ... ·
j1 =1
π∈Sn
=
n
X
!
an,jn bjn ,π(n)
jn =1
X
a1,j1 · . . . · an,jn · bj1 ,π(1) · . . . · bjn ,π(n)
1≤j1 ,...,jn ≤n
π∈Sn
"
=
X
a1,j1 · . . . · an,jn ·
1≤j1 ,...,jn ≤n
#
X
π∈Sn
17-17
(−1)π bj1 ,π(1) · . . . bjn ,π(n) .
Mathematik für Physiker I, WS 2013/2014
Montag 13.1
Nun kümmern wir uns um den Faktor in den eckigen Klammern. Die dort stehende
Summe sieht fast wie eine Determinante aus, nur das dort überall ji statt i steht. Dies
ist aber kein echtes Problem, schreiben wir B(j1 , . . . , jn ) für die n × n Matrix, deren
i-te Zeile gerade die ji -te Zeile von B ist, so ist der Ausdruck in eckigen Klammern
gerade die Determinante von B(j1 , . . . , jn ), also ist
X
det(AB) =
a1,j1 · . . . · an,jn · det B(j1 , . . . , jn ).
1≤j1 ,...,jn ≤n
Wir betrachten nun einen einzelnen Summanden in dieser Summe, seien also 1 ≤
j1 , . . . , jn ≤ n gegeben. Gibt es dann zwei Indizes 1 ≤ i, i0 ≤ n mit i 6= i0 und
ji = ji0 , so hat die Matrix B(j1 , . . . , jn ) zwei identische Zeilen, und somit ist dann
det B(j1 , . . . , jn ) = 0 nach Lemma 3.(g). Also müssen wir in der obigen Summe nur
die Summanden (j1 , . . . , jn ) betrachten in denen j1 , . . . , jn paarweise verschieden sind.
Aber Tupel aus n verschiedenen Zahlen aus {1, . . . , n} sind ja gerade die Ordnungen
von {1, . . . , n}, also folgt mit Lemma 3.(c)
det(AB) =
X
a1,π(1) · . . . · an,π(n) · det B(π(1), . . . , π(n))
π∈Sn
!
=
X
(−1)π a1,π(1) · . . . · an,π(n)
π∈Sn
17-18
· det(B) = det(A) · det(B).

Zugehörige Unterlagen

4 Sei die Abbildung 1) Bestimmen Sie, bei welchen Punkten lokal

Lineare Algebra für Informatiker, SS12

§7 Matrizen über R und C

Zugehörige Unterlagen

Produkte

Unterstützung

§7 Matrizen über R und C

Zugehörige Unterlagen

Dieses Dokument Sammlung (en)

Dieses Dokument gespeichert

Schlagen Sie uns vor, wie wir StudyLib verbessern können