§7 Matrizen über R und C

Werbung
Mathematik für Physiker I, WS 2013/2014
Montag 13.1
$Id: matrix.tex,v 1.16 2014/01/13 12:04:56 hk Exp $
$Id: det.tex,v 1.13 2014/01/10 16:51:54 hk Exp hk $
§7
Matrizen über R und C
7.5
Das Gaußsche Eliminationsverfahren in Matrixform
Am Ende der letzten Sitzung hatten wir begonnen die sogenannte LR-Zerlegung einer
Matrix A zu untersuchen, dies war eine Zerlegung A = LR in eine untere Dreiecksmatrix L und eine obere Dreiecksmatrix R. Wir hatten bereits gesehen das die Berechnung
dieser Zerlegung mittels des Gaußschen Eliminationsverfahren möglich ist, zumindest
solange bei diesem keine Zeilenvertauschungen erforderlich sind. Wir wollen uns jetzt
auch noch ein Beispiel hierzu anschauen bei dem auch lange Stufen im Eliminationsverfahren vorkommen, wir betrachten die 4 × 4-Matrix


1 1
3 5
 1 1
0 4 

A=
 3 3 −1 7  .
2 2
0 1
In der ersten Spalte haben wir
1
1
3
2
1
3 5
1 1
3 5
1
0 4
0 0 −3 −1
−→
3 −1 7
0 0 −10 −8
2
0 1
0 0 −6 −9
l12 = 1
l13 = 3
l14 = 2
und damit liegt in der ersten Zeile eine lange Stufe vor. Trotzdem können wir normal
weiter vorfahren, nur das die Werte l23 , l24 diesmal durch die dritte Spalte festgelegt
werden, also
1
0
0
0
1
3 5
1 1
3 5
0 −3 −1
0 0 −3 −1
−→
0 −10 −8
0 0
0 − 14
3
0 0
0 −7
0 −6 −9
l23 =
l24 =
10
3
l34 =
3
2
2
und schließlich wird im letzten Schritt
1
0
0
0
1
3 5
1 1
3 5
0 −3 −1
0 0 −3 −1
−→
0
0 − 14
0 0
0 − 14
3
3
0
0 −7
0 0
0 0
17-1
Mathematik für Physiker I, WS 2013/2014
Damit haben wir in diesem

1
 1
L=
 3
2
Montag 13.1
Beispiel die LR-Zerlegung A = LR mit



1 1 3
5
0 0 0


1 0 0 
 , R =  0 0 −3 −1

14
10
 0 0 0 − .

1
0
3
3
2 32 1
0 0 0
0
Bisher haben wir nur den Fall behandelt, dass das Gaußsche Eliminationsverfahren
ohne Zeilenvertauschungen auskommt, im allgemeinen Fall muss es keine LR-Zerlegung
von A geben, man kann aber durch eine geeignete Permutation der Zeilen von A eine
Matrix A0 bilden die ihrerseits eine LR-Zerlegung zuläßt. Wir können auch sagen wie
wir die Zeilen von A umordnen müssen, die gesuchte Umordnung führt einfach alle
während der Elimination benötigten Zeilenvertauschungen gleich von vornherein aus.
Wenn wir dies formal hinschreiben wollen, ist eine kleine Rechnung hilfreich. Seien
n ∈ N mit n ≥ 1 und K ∈ {R, C} sowie 1 ≤ k, l ≤ n und eine Permutation π ∈ Sn
gegeben. Dann ist Tπ ekl die n × n-Matrix in deren i-ter Zeile für 1 ≤ i ≤ n gerade
die π(i)-te Zeile von ekl steht, d.h. diese ist genau dann von Null verschieden wenn
π(i) = k, also i = π −1 (k), ist und dann steht in der l-ten Spalte eine Eins und alle
anderen Einträge sind Null, also
Tπ ekl = eπ−1 (k),l .
Weiter ist ekl Tπ die n × n-Matrix deren k-te Zeile die l-te Zeile von Tπ ist und alle
anderen Zeilen sind Null. Nun steht in der l-ten Zeile von Tπ genau ein von Null
verschiedener Eintrag und zwar eine Eins in der π(l)-ten Spalte, also
ekl Tπ = ek,π(l) .
Insbesondere haben wir mit diesen beiden Formeln auch
Tπ ekl = eπ−1 (k),l = eπ−1 (k),π(π−1 (l)) = eπ−1 (k),π−1 (l) Tπ ,
und im Fall k 6= l folgt weiter für jedes λ ∈ K
Tπ Ekl (λ) = Tπ (1 + λekl ) = Tπ + λTπ ekl = Tπ + λeπ−1 (k),π−1 (l) Tπ
= (1 + λeπ−1 (k),π−1 (l) )Tπ = Eπ−1 (k),π−1 (l) (λ)Tπ .
Kommen wir nun zum allgemeinen Gaußschen Eliminationsverfahren, also mit eventuell auftretenden Zeilenvertauschungen. Wir übernehmen die obigen Bezeichnungen.
Bei Bearbeitung der i-ten Zeile ist es für 1 ≤ i < m dann als erster Schritt eventuell
nötig diese mit einer weiter unten stehenden Zeile zu vertauschen, sagen wir mit der
ji -ten Zeile wobei i < ji ≤ m ist. Dann bezeichne πi ∈ Sn die Transposition die i
und ji vertauscht. Andernfalls, also wenn keine Vertauschung erforderlich ist, sei πi die
identische Permutation. In beiden Fällen ist dann πi−1 = πi . Die Produktdarstellung
der Stufenform R ist dann
R = Lm−1 Tπm−1 Lm−2 Tπm−2 · · · L2 Tπ2 L1 Tπ1 A.
17-2
Mathematik für Physiker I, WS 2013/2014
Montag 13.1
Sei 1 < i < m. Wir wollen dann die im i-ten Schritt auftauchende Permutationsmatrix
nach vorne durchtauschen. Die weiter rechts stehenden Matrizen Lj haben Indizes
1 ≤ j < i, sei also ein solches 1 ≤ j < i gegeben. Ist πi dann die Identität, so ist
Tπi = 1 und wir haben Tπi Lj = Lj = Lj Tπi . Andernfalls ist πi die i und ji vertauschende
Transposition. Für jedes j < k ≤ m haben wir nun wegen πi−1 = πi und πi (j) = j
Tπi Ekj (−ljk ) = Eπi (k),j (−ljk )Tπi ,
also wird
Tπi Lj = Tπi Emj (−ljm ) · · · Ej+1,j (−lj,j+1 ) = Eπi (m),j (−ljm ) · · · Eπi (j+1),j (−lj,j+1 )Tπi
= Emj (−lj,πi (m) ) · · · Ej+1,j (−lj,πi (j+1) )Tπi ,
und das links stehende Produkt hat dieselbe Form wie Lj nur das jetzt die Einträge
lj,m , . . . , lj,j+1 gemäß πi permutiert wurden. Ziehen wir auf diese Weise alle Permutationsmatrizen nach rechts, so wird
R = L0m−1 · · · L01 Tπm−1 · · · Tπ1 A = L0m−1 · · · L01 Tπ1 ···πm−1 A,
wobei die Matrizen L01 , . . . , L0m−1 die umsortierten Varianten von L1 , . . . , Lm−1 sind. Beachte das dabei auch mehrere aufeinanderfolgende Umsortierungen auftreten können,
für 1 ≤ j < m−1 müssen bis zu m−1−j Permutationsmatrizen an Lj vorbei und dann
ist L0j das Ergebnis dieser bis zu m − 1 − j vielen Umsortierungsschritte. Fassen wir
π = π1 · · · πm−1 ∈ Sn zusammen, so haben wir schließlich eine LR-Zerlegung Tπ A = LR
−1
mit L = L01−1 · · · L0m−1
.
Wir wollen uns auch hierfür ein Beispiel anschauen und eine LR-Zerlegung der
Matrix


3 −1 3 1
 3 −1 3 2 

A=
 2
0 1 1 
−2
0 2 3
herstellen. Im ersten Schritt ist keine Zeilenvertauschung erforderlich und wir rechnen
wie im vorigen Beispiel
3 −1
3
3 −1 3 1
0
0
0
3 −1 3 2
−→ 0
2
−1
2
0 1 1
3
2
−2
0 2 3
0 −3
4
1
1
1
3
11
3
l12 =
1
2
l13 =
3
l14 = − 23
An dieser Stelle ist nun eine Zeilenvertauschung erforderlich, wir vertauschen die zweite
mit der dritten Zeile. Um bei diesen Vertauschungen die Übersicht zu behalten, schreiben wir die permutierten lij neu hin, sofern sie sich ändern, und führen für diese keine
neuen Bezeichungen ein. Außerdem schreiben wir auch die verwendete Permutation π
17-3
Mathematik für Physiker I, WS 2013/2014
Montag 13.1
in der Form [π(1), π(2), . . .] hin, also
3 −1 3
0
0 0
2
−1
0
3
2
0 −3 4
1
1
1
3
11
3
3 −1
3
2
0
−1
3
−→
0
0
0
2
0 −3
4
1
π = [1, 3, 2, 4]
2
l12 =
3
l13 =
1
1
3
1
11
3
Nun können wir die zweite Zeile bearbeiten
3 −1 3
2
0
−1
3
0
0 0
0 − 32 4
3 −1
3 1
2
1
0
−1
3
3
−→
1
0
0
0 1
11
0
0
3 4
3
1
1
3
l23 =
0
l24 = −1
und erneut wird eine Zeilenvertauschung erforderlich, wir müssen die dritte und die
vierte Zeile miteinander vertauschen. In der Notation gehen wir wie oben vor nur
das wir für π gleich das Produkt der beiden bisherigen Permutationen hinschreiben,
wobei wir darauf achten müssen die neue Permutation von rechts an die bisherige
heranzumultiplizieren, also [1, 3, 2, 4] ◦ [1, 2, 4, 3] = [1, 3, 4, 2] und somit
3 −1 3 1
3 −1
3 1
2
1
2
0
−1 3
0
−1 13
3
3
−→
0
0 0 1
0
0
3 4
0
0 3 4
0
0
0 1
π
= [1, 3, 4, 2]
l23 =
l24 =
−1,
0,
l13 = − 23
l14 =
1
Ein weiterer Schritt ist nicht mehr notwendig, also wird schließlich l34 = 0. Insgesamt
haben wir damit die LR-Zerlegung ATπ = LR mit

1
0
 23
1
L=
 − 2 −1
3
1
0
0
0
1
0


0

0 
,R = 

0 
1


1
3 −1
3 1
2
1 

0
−1 3 
0
3
,T = 
0
0
3 4  π  0
0
0
0 1
0
0
0
0
1
0
1
0
0

0
0 
.
1 
0
Dies ist zwar eigentlich eine LR-Zerlegung der Matrix Tπ A man spricht aber trotzdem etwas ungenau davon die LR-Zerlegung von A durchzuführen. Wir fassen unsere
Überlegungen zur LR-Zerlegung jetzt noch in einem Satz zusammen.
Satz 7.9 (Existenz der LR-Zerlegung)
Seien n, m ∈ N mit n, m ≥ 1, K ∈ {R, C} und A ∈ K m×n eine m × n-Matrix über
K. Dann existieren eine Permutation π ∈ Sm , eine untere Dreiecksmatrix L ∈ K m×m
mit Einsen auf der Hauptdiagonalen und eine obere Dreiecksmatrix R ∈ K m×n mit
Tπ A = LR.
Beweis: Dies haben wir bereits oben gezeigt.
17-4
Mathematik für Physiker I, WS 2013/2014
Montag 13.1
Die LR-Zerlegung kann dann auch direkt zur Lösung linearer Gleichungssysteme Ax =
b mit Koeffizientenmatrix A verwendet werden, und zwar hauptsächlich wenn dies ein
reguläres lineares Gleichungssystem ist, wenn also n = m gilt und A invertierbar ist.
Da die Matrizen Tπ und L beide invertierbar ist, ist A nach Lemma 4.(f) genau dann
invertierbar wenn LR = Tπ A dies ist und dies ist weiter genau dann der Fall wenn R
invertierbar ist. Letzteres bedeutet dabei das alle Einträge der Hauptdiagonalen von
R von Null verschieden sind. Nehme an das diese Situation vorliegt und wir Ax = b
lösen wollen. Zunächst ist dies gleichwertig zu
LRx = Tπ Ax = Tπ b,
bilden wir also den Spaltenvektor


bπ(1)


b0 := Tπ b =  ...  ,
bπ(n)
so müssen wir LRx = b0 lösen. Dies ist aber leicht möglich, zuerst löse Ly = b0 durch
sukzessive Berechnung von y1 , . . . , yn , also wie bei den linearen Gleichungssystemen in
Stufenform nur von oben nach unten, und dann löse Rx = y als System in Stufenform. Diese Methode ist hauptsächlich für die numerische Lösung regulärer linearer
Gleichungssysteme von Interesse, wobei dabei eine für numerische Zwecke verfeinerte
Version der LR-Zerlegung benutzt wird, die wir hier nicht mehr besprechen wollen.
Wir wollen hier nur noch ein Beispiel der eben besprochenen Lösungsmethode
vorführen und betrachten das lineare Gleichungssystem




3 −1 3 1
2
 3 −1 3 2 


 und b =  −3  .
Ax = b mit A = 
 2
 5 
0 1 1 
−2
0 2 3
1
Die LR-Zerlegung Tπ A = LR haben wir bereits oben berechnet. Wegen π = [1, 3, 4, 2]
wird


2
 5 

b0 = 
 1 .
−3
Die Lösung von Ly = b0 erfolgt durch
2
11
2
y1 = 2, y2 = 5 − y1 = , y3 = 1 + y1 + y2 = 6, y4 = −3 − y1 = −5
3
3
3
und schließlich lösen wir Rx = y durch
1
26
3 11
1
x4 = −5, x3 = (6 − 4x4 ) = , x2 =
+ x3 − x4 = 21,
3
3
2 3
3
1
2
x1 = (2 + x2 − 3x3 − x4 ) = .
3
3
17-5
Mathematik für Physiker I, WS 2013/2014
§8
Montag 13.1
Determinanten
Wir kommen jetzt zum Begriff der Determinante. Determinanten sind merkwürdigerweise über hundert Jahre älter als Matrizen, und sie wurden auch ursprünglich nicht
im Zusammenhang mit linearen Gleichungssystemen eingeführt, sondern bei der Behandlung von Polynomgleichungen n-ten Grades. Der Name Determinante“ kommt
”
dagegen aus ihrer Verwendung im Zusammenhang mit linearen Gleichungssystemen,
und wir wollen erst einmal erwähnen was hier eigentlich determiniert“ wird. Ange”
nommen wir haben eine quadratische Matrix A über den reellen oder den komplexen
Zahlen. Wie wir noch sehen werden können dann zwei verschiedene Fälle auftreten,
entweder ist das lineare Gleichungssystem Ax = b für jede rechte Seite b eindeutig
lösbar oder es ist niemals eindeutig lösbar und es gibt sowohl rechte Seiten b für die
Ax = b nicht lösbar ist als auch rechte Seiten b für die Ax = b mehrere verschiedene
Lösungen hat, man nennt dieses Verhalten linearer Gleichungssysteme manchmal auch
die Fredholm-Alternative“. Ersteres tritt genau dann auf wenn die Determinante von
”
A von Null verschieden ist und letzteres genau dann wenn sie gleich Null ist. In diesem
Sinne bestimmt, also determiniert, die Determinante von A also das Lösbarkeitsverhalten linearer Gleichungssysteme mit der Koeffizientenmatrix A.
Die Determinante einer n × n Matrix A über K = R oder K = C ist eine Zahl
det A ∈ K. Alternativ wird oft auch |A| anstelle von det A geschrieben. Wird dabei A
direkt in Matrixform (...) hingeschrieben, so läßt man die Klammern um die Matrix in
der Schreibweise |A| üblicherweise fort, schreibt also etwa
1 2 1 3 für die Determinante det A der Matrix
A=
1 2
1 3
.
Beachte das die Determinante nur für quadratische Matrizen definiert wird. Bevor
wir zur Definition der allgemeinen Determinante kommen, wollen wir sie zunächst in
den drei kleinen Fällen n = 1, 2, 3 explizit hinschreiben. Für 1 × 1 Matrizen ist die
Determinante einfach der eine Eintrag der Matrix, also det(a) = a für a ∈ K. Die
Determinante einer 2 × 2 Matrix wird durch die Formel
a b c d := ad − bc
definiert. Beachte das uns der Ausdruck ad − bc bereits in §7 in der Formel
a b
c d
−1
1
=
ad − bc
17-6
d −b
−c
a
Mathematik für Physiker I, WS 2013/2014
Montag 13.1
für die Inverse eine 2 × 2 Matrix begegnet ist. Dies ist kein Zufall, wie wir sehen werden
gibt es auch für n × n Matrizen eine direkte Formel für die Einträge der inversen
Matrix A−1 in Termen gewisser Determinanten. Für n > 3 ist diese Formel allerdings
für praktische Zwecke nur selten hilfreich. Wir kommen nun zur Determinante einer
3 × 3 Matrix, und diese Formel ist bereits merklich komplizierter.
a11 a12 a13 a21 a22 a23 := a11 a22 a33 + a12 a23 a31 + a13 a21 a32 − a13 a22 a31 − a11 a23 a32 − a12 a21 a33 .
a31 a32 a33 Es ist populär sich diese Formel mit Hilfe der sogenannten Regel von Sarrus zu merken.
Hierzu schreibt man sich die ersten beiden Spalten der 3 × 3 Matrix noch einmal rechts
neben die Matrix. Dann bildet man die drei Dreierprodukte entlang der drei Diagonalen
von links nach rechts und addiert diese. Anschließend bildet man die Dreierprodukte
auf den drei Gegendiagonalen von rechts nach links und zieht diese von der zuvor
gebildeten Summe ab. Die so erhaltene Zahl ist die Determinante der Matrix.
−
a11
a12
a13
a11
a12
a21
a22
a23
a21
a22
a31
a32
a33
a31
a32
−
−
+
+
+
Natürlich sind Sie nicht verpflichtet die Regel von Sarrus zu verwenden, mit etwas
Konzentration und ein wenig Übung ist es leicht sich die beiden verdoppelten Spalten
im Kopf zu denken, ohne sie extra hinzuschreiben. Allerdings ist es am besten die Regel
von Sarrus gleich wieder zu vergessen, sie stellt sich als die mit Abstand umständlichste
Methode zur Berechnung der Determinante einer 3 × 3 Matrix heraus.
Für n = 2 und n = 3 hat die Determinante auch eine direkte geometrische Bedeutung. Die Determinante einer 2 × 2 Matrix, beziehungsweise genauer ihr Betrag,
ist die Fläche des von den beiden Spalten, oder Zeilen, aufgespannten Parallelograms.
Entsprechend ist der Betrag der Determinante für n = 3 gleich dem Volumen des
von den drei Spalten aufgespannten Parallelepipeds, dies ist das dreidimensionale Analogon zum Parallelogram und wird oft auch als ein Spat“ bezeichnet. Wir werden
”
diese geometrischen Interpretationen aber erst etwas später in diesem Semester begründen. Entsprechend kann dann auch die Determinante in höheren Dimensionen als
ein n-dimensionales Volumen aufgefasst werden. Bevor wir die exakte Definition dieser
höherdimensionalen Determinanten behandeln, wollen wir hier nur erwähnen das die
Sarrus-Regel sich nicht auf die Determinante von quadratischen Matrizen mit n ≥ 4
Zeilen und Spalten fortsetzt, beispielsweise ist die Determinante einer 4 × 4 Matrix eine
Summe aus 24 Summanden und nicht nur von 8 wie es die Sarrus Regel erwarten ließe.
8.1
Die symmetrische Gruppe
Um die Determinante für größere Matrizen zu definieren, benötigen wir erneut den
Permutationsbegriff aus §7.5. Dort hatten wir die Menge Sn aller Permutationen der
17-7
Mathematik für Physiker I, WS 2013/2014
Montag 13.1
ersten n Zahlen, also aller bijektiven Abbildungen der Menge {1, . . . , n} auf sich selbst,
betrachtet und mit der Hintereinanderausführung als Multiplikation versehen. Diese
Multiplikation erfüllt dann einige Rechenregeln:
(G1) Das Assoziativgesetz π · (η · τ ) = (π · η) · τ für alle π, η, τ ∈ Sn . Dies ist nur ein
Spezialfall des allgemeinen Assoziativgesetzes der Hintereinanderausführung aus
§2.Lemma 1.
(G2) Es gibt ein neutrales Element der Multiplikation, nämlich die identische Abbildung 1 := idM . Diese erfüllt 1 · π = π · 1 = π für alle π ∈ Sn .
(G3) Jedes π ∈ Sn hat ein multiplikatives Inverses π −1 ∈ Sn mit π −1 · π = π · π −1 = 1.
Nach §2.Lemma 2 ist π −1 nämlich gerade die Umkehrabbildung zu π.
Man bezeichnet diese drei Eigenschaften als die Gruppenaxiome und nennt Sn eine
Gruppe. Wir sind hier nicht abstrakt an den Gruppenaxiomen interessiert, aber drei
Folgerungen aus diesen werden für uns sehr wichtig sein.
1. Ist η ∈ Sn und durchläuft π die Elemente von Sn , so durchläuft das Produkt η · π
ebenfalls genau alle Elemente von Sn . Etwas formaler gesagt, ist die Abbildung
f : Sn → Sn ; π 7→ η · π
bijektiv. In der Tat, um einzusehen das f bijektiv ist, ist einzusehen das es für
jedes τ ∈ Sn genau ein π ∈ Sn mit τ = η · π gibt, und die Gruppenaxiome sagen
uns das π = η −1 · τ dieses eindeutige Element von Sn ist.
2. Analog ist für jedes η ∈ Sn auch die Abbildung
g : Sn → Sn ; π 7→ π · η
bijektiv.
3. Auch die Abbildung
h : Sn → Sn ; π 7→ π −1
ist bijektiv und wegen (π −1 )−1 = π für alle π ∈ Sn gleich ihrer eigenen Umkehrabbildung.
Man kann sich die symmetrische Gruppe Sn alternativ auch als die Menge aller möglichen Anordnungen der Zahlen 1, . . . , n vorstellen. Ist nämlich π ∈ Sn eine Permutation,
so kommt in der Liste
π(1), π(2), . . . , π(n)
jede Zahl zwischen 1 und n genau einmal vor, die Liste ist also eine Anordnung der
Zahlen 1, . . . , n. Haben wir umgekehrt eine solche Liste k1 , . . . , kn in der jede Zahl
zwischen 1 und n genau einmal vorkommt, so können wir durch π(i) := ki für i =
17-8
Mathematik für Physiker I, WS 2013/2014
Montag 13.1
1, . . . , n eine zugehörige Permutation definieren. Schauen wir uns dies einmal an einem
Beispiel mit n = 4 an. Die Anordnung
π:
4, 3, 2, 1
entspricht der durch π(1) = 4, π(2) = 3, π(3) = 2 und π(4) = 1 gegebenen Permutation,
denn 4 ist das erste Element in unserer Aufzählung, 3 ist das zweite Element in der
Aufzählung, und so weiter. Ebenso entspricht
η:
3, 1, 4, 2
der Permutation η(1) = 3, η(2) = 1, η(3) = 4 und η(4) = 2. Für das Produkt τ :=
π · η = π ◦ η ist also
τ (1)
τ (2)
τ (3)
τ (4)
=
=
=
=
π(η(1)) = π(3) = 2,
π(η(2)) = π(1) = 4,
π(η(3)) = π(4) = 1,
π(η(4)) = π(2) = 3,
und als Aufzählung geschrieben ist damit
τ =π·η :
2, 4, 1, 3.
Mit der Interpretation von Permutationen als Auflistungen der Zahlen von 1 bist n ist
es auch leicht die Elemente der symmetrischen Gruppe zu zählen.
Lemma 8.1 (Elementeanzahl der Sn )
Für jedes n ∈ N mit n ≥ 1 hat die symmetrische Gruppe Sn genau n! viele Elemente.
Beweis: Für das erste Element der Aufzählung haben wir n Möglichkeiten, für das
zweite dann nur noch n − 1 Möglichkeiten, für das dritte n − 2 Möglichkeiten, und so
weiter, bis für das letzte Element nur noch eine Möglichkeit verbleibt. Als Anzahl aller
möglichen Permutationen ergibt sich damit
n · (n − 1) · (n − 2) · . . . 1 = 1 · 2 · . . . · n = n!.
Schreiben wir |M | für die Anzahl aller Elemente einer endlichen Menge M , so sind
also
|S1 | = 1, |S2 | = 2, |S3 | = 6, |S4 | = 24, |S5 | = 120, . . .
Die Elemente der symmetrischen Gruppe Sn können in zwei verschiedene Sorten eingeteilt werden, die geraden und die ungeraden Permutationen. Nehmen wir einmal an
wir haben eine Permutation π ∈ Sn gegeben. Dann sind π(1), π(2), . . . , π(n) genau die
17-9
Mathematik für Physiker I, WS 2013/2014
Montag 13.1
Zahlen zwischen 1 und n nur in einer anderen Reihenfolge. Dies übeträgt sich dann
auch auf Paare von verschiedenen Zahlen zwischen 1 und n, d.h.
(π(1), π(2)), . . . , (π(1), π(n)), (π(2), π(1)), (π(2), π(3)), . . . , (π(2), π(n)),
. . . , (π(n − 1), π(1)), . . . , (π(n − 1), π(n))
sind wieder genau diese Paare, nur erneut in einer anderen Reihenfolge. Dies modifizieren wir noch etwas und betrachten nur noch die nach Größe geordneten Paare (i, j)
mit 1 ≤ i < j ≤ n, bei denen der zweite Eintrag also größer als der erste Eintrag ist.
Wenden wir unsere Permutation auf diese korrekt geordneten Paare an, so erhalten wir
(π(1), π(2)), . . . , (π(1), π(n)), (π(2), π(3)), . . . , (π(2), π(n)), . . . , (π(n − 1), π(n))
nur noch die Hälfte aller möglichen Paare. Diese umgeordneten Paare müssen aber
nicht mehr nach Größe geordnet sein, die Permutation kann ja auch richtig geordnete
Paare auf falsch geordnete Paare abbilden. Jedes Paar bei dem dies vorkommt nennen
wir einen Fehlstand von π, d.h.
(i, j) mit 1 ≤ i < j ≤ n ist Fehlstand von π :⇐⇒ π(i) > π(j).
Bilden wir nun das Produkt der Differenzen aller unserer obigen Paare, so erhalten wir
fast genau das Produkt aller Differenzen nach Größe geordneter Paare, es kommt nur
für jeden Fehlstand ein Minus Zeichen hinzu. Schreiben wir also F (π) für die Menge
aller Fehlstände von π, so ist
Y
Y
Y
(π(j) − π(i)) = (−1)|F (π)|
(j − i) = ±
(j − i).
1≤i<j≤n
1≤i<j≤n
1≤i<j≤n
Tritt in der obigen Formel das Pluszeichen auf, ist also |F (π)| gerade, so nennen wir
π eine gerade Permutation, und andernfalls heißt π eine ungerade Permutation. Zur
Verwendung in Rechnungen führen wir noch ein Symbol für das auftretende Vorzeichen
ein.
Definition 8.1 (Vorzeichen einer Permutation)
Seien n ∈ N mit n ≥ 1 und π ∈ Sn . Dann heißt
(−1)π := (−1)|F (π)| =
π(j) − π(i)
j−i
1≤i<j≤n
Y
das Vorzeichen von π.
Wir wollen drei Beispiele behandeln.
1. Wir fangen mit dem konkreten Beispiel n = 4 und der durch 3, 4, 1, 2 gegebenen
Permutation π an. Listen wir die nach Größe geordneten Paare und ihre Bilder
17-10
Mathematik für Physiker I, WS 2013/2014
Montag 13.1
unter π auf, so ergibt sich
(i, j)
1, 2
1, 3
1, 4
2, 3
2, 4
3, 4
(π(i), π(j))
3, 4
3, 1 F
3, 2 F
4, 1 F
4, 2 F
1, 2,
wobei die Fehlstände mit dem Symbol F“ markiert sind. Wir haben in diesem
”
Beispiel also |F (π)| = 4 Fehlstände und somit (−1)π = 1, d.h. π ist eine gerade
Permutation.
2. Sei n ∈ N mit n ≥ 2 und bezeichne τ ∈ Sn die Transposition die zwei verschiedene Zahlen 1 ≤ i < j ≤ n miteinander vertauscht. Fehlstände von τ müssen i
oder j involvieren. Gehen wir die Möglichkeiten durch, so ergeben sich genau die
folgenden Fehlstände von τ
F (τ ) = {(i, k)|i < k ≤ j} ∪ {(k, j)|i < k < j}
also |F (τ )| = (j − i) + (j − i − 1) = 2(j − i) − 1 und insbesondere (−1)τ = −1,
d.h. Transpositionen sind immer ungerade.
3. Nun sei π eine Permutation die r ≥ 2 aufeinanderfolgende Ziffern zyklisch nach
rechts schiebt, beispielsweise die Ziffern von i bis i + r − 1 mit 1 ≤ i ≤ n − r + 1.
Es soll also π(k) = k für 1 ≤ k < i und für i + r ≤ k ≤ n, π(k) = k + 1 für
i ≤ k < i + r − 1 und π(i + r − 1) = i sein. Fehlstände von π müssen offenbar zwei
Ziffern zwischen i und i + r − 1 involvieren und i + r − 1 als rechte Komponente
haben, also
F (π) = {(k, i + r − 1)|i ≤ k < i + r − 1}, und somit |F (π)| = r − 1,
und folglich ist auch (−1)π = (−1)r−1 , ist also r gerade so ist π ungerade und ist
r ungerade so ist π gerade.
Lemma 8.2 (Rechenregeln für das Vorzeichen einer Permutation)
Sei n ∈ N mit n ≥ 1. Dann gelten:
(a) Ist id ∈ Sn die identische Permutation, so ist (−1)id = 1.
(b) Für alle π, η ∈ Sn ist (−1)πη = (−1)π (−1)η .
(c) Für jedes π ∈ Sn ist (−1)π
−1
= (−1)π .
17-11
Mathematik für Physiker I, WS 2013/2014
Montag 13.1
Beweis: (a) Klar da die Identität keine Fehlstände hat.
(b) Es gilt
Y
Y
(π(η(j)) − π(η(i))) = (−1)|F (η)|
1≤i<j≤n
(π(j) − π(i))
1≤i<j≤n
= (−1)π (−1)η
Y
(j − i)
1≤i<j≤n
und somit ist
(−1)πη =
π(η(j)) − π(η(i))
= (−1)π (−1)η .
j
−
i
1≤i<j≤n
Y
(c) Nach (a) und (b) gilt
1 = (−1)ππ
8.2
−1
= (−1)π (−1)π
−1
=⇒ (−)π
−1
=
1
= (−1)π .
(−1)π
Definition und Grundeigenschaften der Determinante
Wir definieren die allgemeine Determinante durch die sogenannte Leipnitz-Formel.
Definition 8.2 (Definition der Determinante)
Sei n ∈ N mit n ≥ 1 und sei K ∈ {R, C}. Die Determinante einer n × n Matrix über
K wird durch die Formel
a11 · · · a1n .. . .
.. := X (−1)π a
.
. . 1π(1) · . . . · anπ(n)
π∈Sn
an1 · · · ann definiert.
Die Determinante einer n×n Matrix ist also eine Summe mit |Sn | = n! vielen Summanden und jeder Summand ist ein Produkt aus n Matrixeinträgen und einem Vorzeichen.
Für n = 1, 2, 3 stimmt dies mit der schon eingeführten Determinante überein. Schon
für n = 4 ist die Definition aber nicht direkt zum Berechnen der Determinante geeignet, man hat |S4 | = 24 viele Summanden in der Summe. Es gibt im wesentlichen
zwei Methoden Determinanten zu berechnen, zum einen über die sogenannte LaplaceEntwicklung, die wir im nächsten Abschnitt behandeln, und zum anderen über die
Umformung einer Determinante mittels elementarer Zeilen- und Spaltenoperationen.
Um den letzteren Weg zu begründen, müssen wir uns überlegen wie sich die Determinante bei Anwendung von Zeilenoperationen verhält, und hierfür wollen wir das
folgende Lemma formulieren und beweisen.
17-12
Mathematik für Physiker I, WS 2013/2014
Montag 13.1
Lemma 8.3 (Grundeigenschaften der Determinante)
Seien n ∈ N mit n ≥ 1, K ∈ {R, C} und


a11 · · · a1n


A =  ... . . . ...  ∈ K n×n
an1 · · · ann
eine n × n Matrix über K. Dann gelten:
(a) Es ist det At = det A.
(b) Geht A0 aus A durch Multiplikation einer Zeile oder einer Spalte mit einer Konstanten c ∈ K hervor, so ist det A0 = c · det A.
(c) Sei α ∈ Sn eine Permutation und bezeichne A0 die Matrix, die aus A durch Permutation der Zeilen gemäß α hervorgeht, d.h. für 1 ≤ k ≤ n ist die k-te Zeile von
A0 gleich der α(k)-ten Zeile von A. Dann ist det A0 = (−1)α det A. Die analoge
Aussage gilt für Permutationen der Spalten von A.
(d) Geht A0 aus A durch Vertauschen zweier Zeilen oder Spalten hervor, so ist det A0 =
− det A.
(e) Geht A0 aus A durch Addition eines Vielfachen einer Zeile zu einer anderen Zeile
hervor, so ist det A0 = det A. Die analoge Aussage gilt auch für Spalten statt
Zeilen.
(f ) Besteht eine Zeile oder eine Spalte von A nur aus Nullen, so ist det A = 0.
(g) Ist eine Zeile von A ein Vielfaches einer anderen Zeile von A, oder eine Spalte
von A ein Vielfaches einer anderen Spalte von A, so ist det A = 0.
Beweis: (a) Es gilt nach Lemma 2.(c)
det At =
X
(−1)π aπ(1)1 · . . . · aπ(n)n =
π∈Sn
=
X
X
(−1)π aπ(1),π−1 (π(1)) · . . . · aπ(n),π−1 (π(n))
π∈Sn
π −1
(−1)
a1,π−1 (1) · . . . · an,π−1 (n) =
π∈Sn
X
(−1)π a1π(1) · . . . · anπ(n) = det A.
π∈Sn
(b) Sei 1 ≤ i ≤ n und die i-te Zeile von A0 sei das c-fache der i-ten Zeile von A. Dann
ist
X
det A0 =
(−1)π a1π(1) · . . . · (caiπ(i) ) · . . . · anπ(n)
π∈Sn
X
=c
π∈Sn
17-13
(−1)π a1π(1) · . . . · anπ(n) = c · det A.
Mathematik für Physiker I, WS 2013/2014
Montag 13.1
Mit (a) folgt hieraus auch die Aussage über Spalten.
(c) Es gilt nach Lemma 2.(b)
det A0 =
X
(−1)π aα(1),π(1) · . . . · aα(n),π(n)
π∈Sn
= (−1)α
X
−1
(−1)πα a1,π(α−1 (1)) · . . . · an,π(α−1 (n)) = (−1)α det A.
π∈Sn
Mit (a) folgt hieraus auch die Aussage über Spaltenpermutationen.
(d) Da Transpositionen ungerade Permutationen sind ist dies ein Spezialfall von (c).
(f ) Ist 1 ≤ i ≤ n und besteht die i-te Zeile von A nur aus Nullen, so ist für jedes
π ∈ Sn stets aiπ(i) = 0, also auch a1π(1) · . . . · anπ(n) = 0. Damit ist det A = 0. Mit (a)
folgt auch die Aussage über Spalten.
(g) Nach (a) reicht es die Aussage für Zeilen einzusehen, und nach (b) können wir
annehmen, dass A sogar zwei identische Zeilen hat. Dann ändert sich die Matrix bei
Vertauschen dieser beiden Zeilen nicht, und (d) ergibt det A = − det A, also det A = 0.
(e) Seien c ∈ K, 1 ≤ i, j ≤ n mit i 6= j und A0 gehe aus A durch Addition des c-fachen
der j-ten Zeile zur i-ten Zeile hervor. Dann ist
det A0 =
X
(−1)π a1π(1) · . . . · (aiπ(i) + cajπ(i) ) · . . . · anπ(n)
π∈Sn
X
= det A + c
(−1)π a1π(1) · . . . · ajπ(i) · . . . · anπ(n) .
π∈Sn
Die hintere Summe ist gerade die Determinante der Matrix A00 , die aus A durch Ersetzen
der i-ten Zeile durch die j-te Zeile entsteht. Da A00 zwei identische Zeilen hat, ist nach
(g) aber det A00 = 0, und dies zeigt det A0 = det A.
Wie schon bemerkt soll uns das Lemma eine Methode zur Berechnung von Determinanten liefern. Wir wissen das wir jede Matrix durch Anwendung der drei elementaren
Zeilenumformungen auf Stufenform bringen können, und das Lemma sagt uns wie sich
die Determinante bei Anwendung dieser Zeilenumformungen verhält. Damit kann die
Berechnung einer allgemeinen Determinante auf die Berechung der Determinante einer
Matrix in Stufenform zurückgeführt werden. Etwas allgemeiner behandeln wir gleich
Determinanten von Dreiecksmatrizen.
Lemma 8.4 (Determinante von Dreiecksmatrizen)
Seien n ∈ N mit n ≥ 1, K ∈ {R, C} und


A=
∗
a11
...




 oder A = 
ann
17-14

a11
...
∗


ann
Mathematik für Physiker I, WS 2013/2014
Montag 13.1
eine obere oder eine untere Dreiecksmatrix. Dann ist
det A = a11 · . . . · ann .
Beweis: Schreibe wieder


a11 · · · a1n


A =  ... . . . ...  .
an1 · · · ann
Zunächst sei A eine obere Dreiecksmatrix, also aij = 0 für 1 ≤ j < i ≤ n. Sei π ∈
Sn . Gibt es dann ein 1 ≤ i ≤ n mit π(i) < i, so ist ai,π(i) = 0 und somit auch
a1,π(1) · . . . · an,π(n) = 0. Ist dagegen π(i) ≥ i für jedes 1 ≤ i ≤ n, so ist π(n) ≥ n, also
π(n) = n, und weiter π(n − 1) ≥ n − 1 also π(n − 1) = n − 1 oder π(n − 1) = n,
und wegen π(n − 1) 6= π(n) = n sogar π(n − 1) = n − 1. So fortfahrend folgt dann
π(i) = i für alle 1 ≤ i ≤ n. Es gibt in det A also höchstens einen von Null verschiedenen
Summanden, nämlich derjenige zur identischen Permutation und da diese Permutation
gerade ist, folgt
det A = a11 · . . . · ann .
Ist A eine untere Dreiecksmatrix, so ist At eine obere Dreiecksmatrix und mit Lemma
3.(a) folgt die Behauptung auch in diesem Fall.
Wir rechnen ein Beispiel.
1 2 −1
1
1
1
2
−1
1
2 −1
1 2
0
0
1
−1
0
2
−2
4
2
=
= −
−1 2
3 −1 0
4
2
0 0
2
0
3 0 −1
0
0 −6
2 −3
0 −6
2
1 2 −1
1 1
0 4
0
2
0 = − =
−
0
2 −2 0 0
0 0
0
5 −3
1
0
−2
−3
2 −1
1 4
2
0 = −16.
0
2 −2 0
0
2 Man ist allerdings nicht gezwungen so stur den Gaußschen Algorithmus abzuarbeiten,
oft kann man sich die Arbeit durch Mischen von Zeilen- und Spaltenoperationen erleichtern. Dies geschieht etwa im folgenden Beispiel wo wir zuerst Vielfache der ersten
Zeile von der dritten und vierten Zeile abziehen und anschließend die zweite und dritte
Spalte von der ersten Spalte subtrahieren
1 0 1 −1
1 0
0 0
3
1
−1
3
1
−1
3
4 1 3
7 −5 4 1
3
7 −5 0 1
3
7 −5 2 2 0
1
0 = 0 2 −2
3 −6 = 0 2 −2
3 −6 = 0
4 0 4 −3
6 0 0
0
1 −6 0 0
0
1 −6 1 1 0
8
1
1 1
0
8
1
0 1
0
8
1 17-15
Mathematik für Physiker I, WS 2013/2014
Montag 13.1
nach Lemma 3.(f). Dies ist schon eine durchaus effektive Methode zur Berechnung von
Determinanten. Bevor wir fortfahren wollen wir noch ein oft nützliches Korollar aus
unserem Lemma über Dreiecksmatrizen festhalten.
Korollar 8.5 (Determinanten von Blockdreiecksmatrizen)
Seien n ∈ N mit n ≥ 1, K ∈ {R, C} und A eine n × n-Matrix über K der Form




D1
∗
D1








D2
D2




A=
...
...

 oder A = 




∗
Dr
Dr
mit quadratischen Untermatrizen D1 , . . . , Dr . Dann gilt
det A = det(D1 ) · . . . · det(Dr ).
Beweis: Zunächst sei A eine obere Blockdiagonalmatrix habe also die links stehende
Form. Für jedes 1 ≤ i ≤ r überführe Di durch Vertauschen von Zeilen und Addition
von Vielfachen einer Zeile zu einer anderen Zeile in eine obere Dreiecksmatrix Di0 und
bezeichne si die Anzahl der dabei verwendeten Zeilenvertauschungen. Lassen wir die
dabei verwendeten elementaren Zeilenumformungen dann auch auf ganz A wirken, so
wird A in eine Matrix A0 der Form


D10
∗


0


D


2
A0 = 

...




Dr0
P
überführt, und s := ri=1 si ist die Anzahl der dabei verwendeten Zeilenvertauschungen. Mit Lemma 3.(d,e) folgen
det A = (−1)s det A0 und det Di = (−1)si det Di0
für alle 1 ≤ i ≤ r. Die Matrix A0 ist eine obere Dreiecksmatrix, und damit gilt nach
Lemma 4
r
Y
0
det A =
det Di0 .
i=1
Insgesamt haben wir damit
det A = (−1)s det A0 =
r
r
Y
Y
(−1)si det Di0 =
det Di ,
i=1
17-16
i=1
Mathematik für Physiker I, WS 2013/2014
Montag 13.1
und die Aussage ist für obere Blockdreiecksmatrizen bewiesen. Mit Lemma 3.(a) folgt
dann auch die Aussage über untere Blockdreiecksmatrizen.
Beispielsweise ist damit
1 −1 0
3
7 0
−5
3 2
−9
4 9
0
0
1
3
1 −1 2 1 ·
=
3
9 3 = 10 · (−3) = −30,
7
da es sich hier um eine untere Blockdreiecksmatrix mit den beiden 2 × 2-Kästchen
1 −1
2 1
D1 =
und D2 =
3
7
9 3
handelt. Nachdem die zuletzt bewiesenen Aussagen über Determinanten hauptsächlich
rechnerische Aspekte behandelt haben, wollen wir nun zu einem wichtigen und eher
theoretischen Satz kommen der den Zusammenhang von Determinanten und der Matrixmultiplikation herstellt.
Satz 8.6 (Multiplikationssatz für Determinanten)
Sind n ∈ N mit n ≥ 1 und A, B zwei n × n Matrizen über K ∈ {R, C} so gilt
det(A · B) = det(A) · det(B).
Beweis: Wir schreiben



a11 · · · a1n



A =  ... . . . ...  , B = 
an1 · · · ann



b11 · · · b1n
c11 · · · c1n
 .
.. . .
. 
. 
. ..  und AB =  .. . . . ..  .
.
bn1 · · · bnn
cn1 · · · cnn
P
Nach Definition der Matrizenmultiplikation gilt dann cij = nk=1 aik bkj für alle 1 ≤
i, j ≤ n. Hiermit rechnen wir nun
X
(−1)π c1,π(1) · . . . · cn,π(n)
det(AB) =
π∈Sn
=
X
(−1)π
X
!
a1,j1 bj1 ,π(1)
(−1)π
n
X
· ... ·
j1 =1
π∈Sn
=
n
X
!
an,jn bjn ,π(n)
jn =1
X
a1,j1 · . . . · an,jn · bj1 ,π(1) · . . . · bjn ,π(n)
1≤j1 ,...,jn ≤n
π∈Sn
"
=
X
a1,j1 · . . . · an,jn ·
1≤j1 ,...,jn ≤n
#
X
π∈Sn
17-17
(−1)π bj1 ,π(1) · . . . bjn ,π(n) .
Mathematik für Physiker I, WS 2013/2014
Montag 13.1
Nun kümmern wir uns um den Faktor in den eckigen Klammern. Die dort stehende
Summe sieht fast wie eine Determinante aus, nur das dort überall ji statt i steht. Dies
ist aber kein echtes Problem, schreiben wir B(j1 , . . . , jn ) für die n × n Matrix, deren
i-te Zeile gerade die ji -te Zeile von B ist, so ist der Ausdruck in eckigen Klammern
gerade die Determinante von B(j1 , . . . , jn ), also ist
X
det(AB) =
a1,j1 · . . . · an,jn · det B(j1 , . . . , jn ).
1≤j1 ,...,jn ≤n
Wir betrachten nun einen einzelnen Summanden in dieser Summe, seien also 1 ≤
j1 , . . . , jn ≤ n gegeben. Gibt es dann zwei Indizes 1 ≤ i, i0 ≤ n mit i 6= i0 und
ji = ji0 , so hat die Matrix B(j1 , . . . , jn ) zwei identische Zeilen, und somit ist dann
det B(j1 , . . . , jn ) = 0 nach Lemma 3.(g). Also müssen wir in der obigen Summe nur
die Summanden (j1 , . . . , jn ) betrachten in denen j1 , . . . , jn paarweise verschieden sind.
Aber Tupel aus n verschiedenen Zahlen aus {1, . . . , n} sind ja gerade die Ordnungen
von {1, . . . , n}, also folgt mit Lemma 3.(c)
det(AB) =
X
a1,π(1) · . . . · an,π(n) · det B(π(1), . . . , π(n))
π∈Sn
!
=
X
(−1)π a1,π(1) · . . . · an,π(n)
π∈Sn
17-18
· det(B) = det(A) · det(B).
Herunterladen