Mathematik für Physiker I, WS 2013/2014 Montag 13.1 $Id: matrix.tex,v 1.16 2014/01/13 12:04:56 hk Exp $ $Id: det.tex,v 1.13 2014/01/10 16:51:54 hk Exp hk $ §7 Matrizen über R und C 7.5 Das Gaußsche Eliminationsverfahren in Matrixform Am Ende der letzten Sitzung hatten wir begonnen die sogenannte LR-Zerlegung einer Matrix A zu untersuchen, dies war eine Zerlegung A = LR in eine untere Dreiecksmatrix L und eine obere Dreiecksmatrix R. Wir hatten bereits gesehen das die Berechnung dieser Zerlegung mittels des Gaußschen Eliminationsverfahren möglich ist, zumindest solange bei diesem keine Zeilenvertauschungen erforderlich sind. Wir wollen uns jetzt auch noch ein Beispiel hierzu anschauen bei dem auch lange Stufen im Eliminationsverfahren vorkommen, wir betrachten die 4 × 4-Matrix 1 1 3 5 1 1 0 4 A= 3 3 −1 7 . 2 2 0 1 In der ersten Spalte haben wir 1 1 3 2 1 3 5 1 1 3 5 1 0 4 0 0 −3 −1 −→ 3 −1 7 0 0 −10 −8 2 0 1 0 0 −6 −9 l12 = 1 l13 = 3 l14 = 2 und damit liegt in der ersten Zeile eine lange Stufe vor. Trotzdem können wir normal weiter vorfahren, nur das die Werte l23 , l24 diesmal durch die dritte Spalte festgelegt werden, also 1 0 0 0 1 3 5 1 1 3 5 0 −3 −1 0 0 −3 −1 −→ 0 −10 −8 0 0 0 − 14 3 0 0 0 −7 0 −6 −9 l23 = l24 = 10 3 l34 = 3 2 2 und schließlich wird im letzten Schritt 1 0 0 0 1 3 5 1 1 3 5 0 −3 −1 0 0 −3 −1 −→ 0 0 − 14 0 0 0 − 14 3 3 0 0 −7 0 0 0 0 17-1 Mathematik für Physiker I, WS 2013/2014 Damit haben wir in diesem 1 1 L= 3 2 Montag 13.1 Beispiel die LR-Zerlegung A = LR mit 1 1 3 5 0 0 0 1 0 0 , R = 0 0 −3 −1 14 10 0 0 0 − . 1 0 3 3 2 32 1 0 0 0 0 Bisher haben wir nur den Fall behandelt, dass das Gaußsche Eliminationsverfahren ohne Zeilenvertauschungen auskommt, im allgemeinen Fall muss es keine LR-Zerlegung von A geben, man kann aber durch eine geeignete Permutation der Zeilen von A eine Matrix A0 bilden die ihrerseits eine LR-Zerlegung zuläßt. Wir können auch sagen wie wir die Zeilen von A umordnen müssen, die gesuchte Umordnung führt einfach alle während der Elimination benötigten Zeilenvertauschungen gleich von vornherein aus. Wenn wir dies formal hinschreiben wollen, ist eine kleine Rechnung hilfreich. Seien n ∈ N mit n ≥ 1 und K ∈ {R, C} sowie 1 ≤ k, l ≤ n und eine Permutation π ∈ Sn gegeben. Dann ist Tπ ekl die n × n-Matrix in deren i-ter Zeile für 1 ≤ i ≤ n gerade die π(i)-te Zeile von ekl steht, d.h. diese ist genau dann von Null verschieden wenn π(i) = k, also i = π −1 (k), ist und dann steht in der l-ten Spalte eine Eins und alle anderen Einträge sind Null, also Tπ ekl = eπ−1 (k),l . Weiter ist ekl Tπ die n × n-Matrix deren k-te Zeile die l-te Zeile von Tπ ist und alle anderen Zeilen sind Null. Nun steht in der l-ten Zeile von Tπ genau ein von Null verschiedener Eintrag und zwar eine Eins in der π(l)-ten Spalte, also ekl Tπ = ek,π(l) . Insbesondere haben wir mit diesen beiden Formeln auch Tπ ekl = eπ−1 (k),l = eπ−1 (k),π(π−1 (l)) = eπ−1 (k),π−1 (l) Tπ , und im Fall k 6= l folgt weiter für jedes λ ∈ K Tπ Ekl (λ) = Tπ (1 + λekl ) = Tπ + λTπ ekl = Tπ + λeπ−1 (k),π−1 (l) Tπ = (1 + λeπ−1 (k),π−1 (l) )Tπ = Eπ−1 (k),π−1 (l) (λ)Tπ . Kommen wir nun zum allgemeinen Gaußschen Eliminationsverfahren, also mit eventuell auftretenden Zeilenvertauschungen. Wir übernehmen die obigen Bezeichnungen. Bei Bearbeitung der i-ten Zeile ist es für 1 ≤ i < m dann als erster Schritt eventuell nötig diese mit einer weiter unten stehenden Zeile zu vertauschen, sagen wir mit der ji -ten Zeile wobei i < ji ≤ m ist. Dann bezeichne πi ∈ Sn die Transposition die i und ji vertauscht. Andernfalls, also wenn keine Vertauschung erforderlich ist, sei πi die identische Permutation. In beiden Fällen ist dann πi−1 = πi . Die Produktdarstellung der Stufenform R ist dann R = Lm−1 Tπm−1 Lm−2 Tπm−2 · · · L2 Tπ2 L1 Tπ1 A. 17-2 Mathematik für Physiker I, WS 2013/2014 Montag 13.1 Sei 1 < i < m. Wir wollen dann die im i-ten Schritt auftauchende Permutationsmatrix nach vorne durchtauschen. Die weiter rechts stehenden Matrizen Lj haben Indizes 1 ≤ j < i, sei also ein solches 1 ≤ j < i gegeben. Ist πi dann die Identität, so ist Tπi = 1 und wir haben Tπi Lj = Lj = Lj Tπi . Andernfalls ist πi die i und ji vertauschende Transposition. Für jedes j < k ≤ m haben wir nun wegen πi−1 = πi und πi (j) = j Tπi Ekj (−ljk ) = Eπi (k),j (−ljk )Tπi , also wird Tπi Lj = Tπi Emj (−ljm ) · · · Ej+1,j (−lj,j+1 ) = Eπi (m),j (−ljm ) · · · Eπi (j+1),j (−lj,j+1 )Tπi = Emj (−lj,πi (m) ) · · · Ej+1,j (−lj,πi (j+1) )Tπi , und das links stehende Produkt hat dieselbe Form wie Lj nur das jetzt die Einträge lj,m , . . . , lj,j+1 gemäß πi permutiert wurden. Ziehen wir auf diese Weise alle Permutationsmatrizen nach rechts, so wird R = L0m−1 · · · L01 Tπm−1 · · · Tπ1 A = L0m−1 · · · L01 Tπ1 ···πm−1 A, wobei die Matrizen L01 , . . . , L0m−1 die umsortierten Varianten von L1 , . . . , Lm−1 sind. Beachte das dabei auch mehrere aufeinanderfolgende Umsortierungen auftreten können, für 1 ≤ j < m−1 müssen bis zu m−1−j Permutationsmatrizen an Lj vorbei und dann ist L0j das Ergebnis dieser bis zu m − 1 − j vielen Umsortierungsschritte. Fassen wir π = π1 · · · πm−1 ∈ Sn zusammen, so haben wir schließlich eine LR-Zerlegung Tπ A = LR −1 mit L = L01−1 · · · L0m−1 . Wir wollen uns auch hierfür ein Beispiel anschauen und eine LR-Zerlegung der Matrix 3 −1 3 1 3 −1 3 2 A= 2 0 1 1 −2 0 2 3 herstellen. Im ersten Schritt ist keine Zeilenvertauschung erforderlich und wir rechnen wie im vorigen Beispiel 3 −1 3 3 −1 3 1 0 0 0 3 −1 3 2 −→ 0 2 −1 2 0 1 1 3 2 −2 0 2 3 0 −3 4 1 1 1 3 11 3 l12 = 1 2 l13 = 3 l14 = − 23 An dieser Stelle ist nun eine Zeilenvertauschung erforderlich, wir vertauschen die zweite mit der dritten Zeile. Um bei diesen Vertauschungen die Übersicht zu behalten, schreiben wir die permutierten lij neu hin, sofern sie sich ändern, und führen für diese keine neuen Bezeichungen ein. Außerdem schreiben wir auch die verwendete Permutation π 17-3 Mathematik für Physiker I, WS 2013/2014 Montag 13.1 in der Form [π(1), π(2), . . .] hin, also 3 −1 3 0 0 0 2 −1 0 3 2 0 −3 4 1 1 1 3 11 3 3 −1 3 2 0 −1 3 −→ 0 0 0 2 0 −3 4 1 π = [1, 3, 2, 4] 2 l12 = 3 l13 = 1 1 3 1 11 3 Nun können wir die zweite Zeile bearbeiten 3 −1 3 2 0 −1 3 0 0 0 0 − 32 4 3 −1 3 1 2 1 0 −1 3 3 −→ 1 0 0 0 1 11 0 0 3 4 3 1 1 3 l23 = 0 l24 = −1 und erneut wird eine Zeilenvertauschung erforderlich, wir müssen die dritte und die vierte Zeile miteinander vertauschen. In der Notation gehen wir wie oben vor nur das wir für π gleich das Produkt der beiden bisherigen Permutationen hinschreiben, wobei wir darauf achten müssen die neue Permutation von rechts an die bisherige heranzumultiplizieren, also [1, 3, 2, 4] ◦ [1, 2, 4, 3] = [1, 3, 4, 2] und somit 3 −1 3 1 3 −1 3 1 2 1 2 0 −1 3 0 −1 13 3 3 −→ 0 0 0 1 0 0 3 4 0 0 3 4 0 0 0 1 π = [1, 3, 4, 2] l23 = l24 = −1, 0, l13 = − 23 l14 = 1 Ein weiterer Schritt ist nicht mehr notwendig, also wird schließlich l34 = 0. Insgesamt haben wir damit die LR-Zerlegung ATπ = LR mit 1 0 23 1 L= − 2 −1 3 1 0 0 0 1 0 0 0 ,R = 0 1 1 3 −1 3 1 2 1 0 −1 3 0 3 ,T = 0 0 3 4 π 0 0 0 0 1 0 0 0 0 1 0 1 0 0 0 0 . 1 0 Dies ist zwar eigentlich eine LR-Zerlegung der Matrix Tπ A man spricht aber trotzdem etwas ungenau davon die LR-Zerlegung von A durchzuführen. Wir fassen unsere Überlegungen zur LR-Zerlegung jetzt noch in einem Satz zusammen. Satz 7.9 (Existenz der LR-Zerlegung) Seien n, m ∈ N mit n, m ≥ 1, K ∈ {R, C} und A ∈ K m×n eine m × n-Matrix über K. Dann existieren eine Permutation π ∈ Sm , eine untere Dreiecksmatrix L ∈ K m×m mit Einsen auf der Hauptdiagonalen und eine obere Dreiecksmatrix R ∈ K m×n mit Tπ A = LR. Beweis: Dies haben wir bereits oben gezeigt. 17-4 Mathematik für Physiker I, WS 2013/2014 Montag 13.1 Die LR-Zerlegung kann dann auch direkt zur Lösung linearer Gleichungssysteme Ax = b mit Koeffizientenmatrix A verwendet werden, und zwar hauptsächlich wenn dies ein reguläres lineares Gleichungssystem ist, wenn also n = m gilt und A invertierbar ist. Da die Matrizen Tπ und L beide invertierbar ist, ist A nach Lemma 4.(f) genau dann invertierbar wenn LR = Tπ A dies ist und dies ist weiter genau dann der Fall wenn R invertierbar ist. Letzteres bedeutet dabei das alle Einträge der Hauptdiagonalen von R von Null verschieden sind. Nehme an das diese Situation vorliegt und wir Ax = b lösen wollen. Zunächst ist dies gleichwertig zu LRx = Tπ Ax = Tπ b, bilden wir also den Spaltenvektor bπ(1) b0 := Tπ b = ... , bπ(n) so müssen wir LRx = b0 lösen. Dies ist aber leicht möglich, zuerst löse Ly = b0 durch sukzessive Berechnung von y1 , . . . , yn , also wie bei den linearen Gleichungssystemen in Stufenform nur von oben nach unten, und dann löse Rx = y als System in Stufenform. Diese Methode ist hauptsächlich für die numerische Lösung regulärer linearer Gleichungssysteme von Interesse, wobei dabei eine für numerische Zwecke verfeinerte Version der LR-Zerlegung benutzt wird, die wir hier nicht mehr besprechen wollen. Wir wollen hier nur noch ein Beispiel der eben besprochenen Lösungsmethode vorführen und betrachten das lineare Gleichungssystem 3 −1 3 1 2 3 −1 3 2 und b = −3 . Ax = b mit A = 2 5 0 1 1 −2 0 2 3 1 Die LR-Zerlegung Tπ A = LR haben wir bereits oben berechnet. Wegen π = [1, 3, 4, 2] wird 2 5 b0 = 1 . −3 Die Lösung von Ly = b0 erfolgt durch 2 11 2 y1 = 2, y2 = 5 − y1 = , y3 = 1 + y1 + y2 = 6, y4 = −3 − y1 = −5 3 3 3 und schließlich lösen wir Rx = y durch 1 26 3 11 1 x4 = −5, x3 = (6 − 4x4 ) = , x2 = + x3 − x4 = 21, 3 3 2 3 3 1 2 x1 = (2 + x2 − 3x3 − x4 ) = . 3 3 17-5 Mathematik für Physiker I, WS 2013/2014 §8 Montag 13.1 Determinanten Wir kommen jetzt zum Begriff der Determinante. Determinanten sind merkwürdigerweise über hundert Jahre älter als Matrizen, und sie wurden auch ursprünglich nicht im Zusammenhang mit linearen Gleichungssystemen eingeführt, sondern bei der Behandlung von Polynomgleichungen n-ten Grades. Der Name Determinante“ kommt ” dagegen aus ihrer Verwendung im Zusammenhang mit linearen Gleichungssystemen, und wir wollen erst einmal erwähnen was hier eigentlich determiniert“ wird. Ange” nommen wir haben eine quadratische Matrix A über den reellen oder den komplexen Zahlen. Wie wir noch sehen werden können dann zwei verschiedene Fälle auftreten, entweder ist das lineare Gleichungssystem Ax = b für jede rechte Seite b eindeutig lösbar oder es ist niemals eindeutig lösbar und es gibt sowohl rechte Seiten b für die Ax = b nicht lösbar ist als auch rechte Seiten b für die Ax = b mehrere verschiedene Lösungen hat, man nennt dieses Verhalten linearer Gleichungssysteme manchmal auch die Fredholm-Alternative“. Ersteres tritt genau dann auf wenn die Determinante von ” A von Null verschieden ist und letzteres genau dann wenn sie gleich Null ist. In diesem Sinne bestimmt, also determiniert, die Determinante von A also das Lösbarkeitsverhalten linearer Gleichungssysteme mit der Koeffizientenmatrix A. Die Determinante einer n × n Matrix A über K = R oder K = C ist eine Zahl det A ∈ K. Alternativ wird oft auch |A| anstelle von det A geschrieben. Wird dabei A direkt in Matrixform (...) hingeschrieben, so läßt man die Klammern um die Matrix in der Schreibweise |A| üblicherweise fort, schreibt also etwa 1 2 1 3 für die Determinante det A der Matrix A= 1 2 1 3 . Beachte das die Determinante nur für quadratische Matrizen definiert wird. Bevor wir zur Definition der allgemeinen Determinante kommen, wollen wir sie zunächst in den drei kleinen Fällen n = 1, 2, 3 explizit hinschreiben. Für 1 × 1 Matrizen ist die Determinante einfach der eine Eintrag der Matrix, also det(a) = a für a ∈ K. Die Determinante einer 2 × 2 Matrix wird durch die Formel a b c d := ad − bc definiert. Beachte das uns der Ausdruck ad − bc bereits in §7 in der Formel a b c d −1 1 = ad − bc 17-6 d −b −c a Mathematik für Physiker I, WS 2013/2014 Montag 13.1 für die Inverse eine 2 × 2 Matrix begegnet ist. Dies ist kein Zufall, wie wir sehen werden gibt es auch für n × n Matrizen eine direkte Formel für die Einträge der inversen Matrix A−1 in Termen gewisser Determinanten. Für n > 3 ist diese Formel allerdings für praktische Zwecke nur selten hilfreich. Wir kommen nun zur Determinante einer 3 × 3 Matrix, und diese Formel ist bereits merklich komplizierter. a11 a12 a13 a21 a22 a23 := a11 a22 a33 + a12 a23 a31 + a13 a21 a32 − a13 a22 a31 − a11 a23 a32 − a12 a21 a33 . a31 a32 a33 Es ist populär sich diese Formel mit Hilfe der sogenannten Regel von Sarrus zu merken. Hierzu schreibt man sich die ersten beiden Spalten der 3 × 3 Matrix noch einmal rechts neben die Matrix. Dann bildet man die drei Dreierprodukte entlang der drei Diagonalen von links nach rechts und addiert diese. Anschließend bildet man die Dreierprodukte auf den drei Gegendiagonalen von rechts nach links und zieht diese von der zuvor gebildeten Summe ab. Die so erhaltene Zahl ist die Determinante der Matrix. − a11 a12 a13 a11 a12 a21 a22 a23 a21 a22 a31 a32 a33 a31 a32 − − + + + Natürlich sind Sie nicht verpflichtet die Regel von Sarrus zu verwenden, mit etwas Konzentration und ein wenig Übung ist es leicht sich die beiden verdoppelten Spalten im Kopf zu denken, ohne sie extra hinzuschreiben. Allerdings ist es am besten die Regel von Sarrus gleich wieder zu vergessen, sie stellt sich als die mit Abstand umständlichste Methode zur Berechnung der Determinante einer 3 × 3 Matrix heraus. Für n = 2 und n = 3 hat die Determinante auch eine direkte geometrische Bedeutung. Die Determinante einer 2 × 2 Matrix, beziehungsweise genauer ihr Betrag, ist die Fläche des von den beiden Spalten, oder Zeilen, aufgespannten Parallelograms. Entsprechend ist der Betrag der Determinante für n = 3 gleich dem Volumen des von den drei Spalten aufgespannten Parallelepipeds, dies ist das dreidimensionale Analogon zum Parallelogram und wird oft auch als ein Spat“ bezeichnet. Wir werden ” diese geometrischen Interpretationen aber erst etwas später in diesem Semester begründen. Entsprechend kann dann auch die Determinante in höheren Dimensionen als ein n-dimensionales Volumen aufgefasst werden. Bevor wir die exakte Definition dieser höherdimensionalen Determinanten behandeln, wollen wir hier nur erwähnen das die Sarrus-Regel sich nicht auf die Determinante von quadratischen Matrizen mit n ≥ 4 Zeilen und Spalten fortsetzt, beispielsweise ist die Determinante einer 4 × 4 Matrix eine Summe aus 24 Summanden und nicht nur von 8 wie es die Sarrus Regel erwarten ließe. 8.1 Die symmetrische Gruppe Um die Determinante für größere Matrizen zu definieren, benötigen wir erneut den Permutationsbegriff aus §7.5. Dort hatten wir die Menge Sn aller Permutationen der 17-7 Mathematik für Physiker I, WS 2013/2014 Montag 13.1 ersten n Zahlen, also aller bijektiven Abbildungen der Menge {1, . . . , n} auf sich selbst, betrachtet und mit der Hintereinanderausführung als Multiplikation versehen. Diese Multiplikation erfüllt dann einige Rechenregeln: (G1) Das Assoziativgesetz π · (η · τ ) = (π · η) · τ für alle π, η, τ ∈ Sn . Dies ist nur ein Spezialfall des allgemeinen Assoziativgesetzes der Hintereinanderausführung aus §2.Lemma 1. (G2) Es gibt ein neutrales Element der Multiplikation, nämlich die identische Abbildung 1 := idM . Diese erfüllt 1 · π = π · 1 = π für alle π ∈ Sn . (G3) Jedes π ∈ Sn hat ein multiplikatives Inverses π −1 ∈ Sn mit π −1 · π = π · π −1 = 1. Nach §2.Lemma 2 ist π −1 nämlich gerade die Umkehrabbildung zu π. Man bezeichnet diese drei Eigenschaften als die Gruppenaxiome und nennt Sn eine Gruppe. Wir sind hier nicht abstrakt an den Gruppenaxiomen interessiert, aber drei Folgerungen aus diesen werden für uns sehr wichtig sein. 1. Ist η ∈ Sn und durchläuft π die Elemente von Sn , so durchläuft das Produkt η · π ebenfalls genau alle Elemente von Sn . Etwas formaler gesagt, ist die Abbildung f : Sn → Sn ; π 7→ η · π bijektiv. In der Tat, um einzusehen das f bijektiv ist, ist einzusehen das es für jedes τ ∈ Sn genau ein π ∈ Sn mit τ = η · π gibt, und die Gruppenaxiome sagen uns das π = η −1 · τ dieses eindeutige Element von Sn ist. 2. Analog ist für jedes η ∈ Sn auch die Abbildung g : Sn → Sn ; π 7→ π · η bijektiv. 3. Auch die Abbildung h : Sn → Sn ; π 7→ π −1 ist bijektiv und wegen (π −1 )−1 = π für alle π ∈ Sn gleich ihrer eigenen Umkehrabbildung. Man kann sich die symmetrische Gruppe Sn alternativ auch als die Menge aller möglichen Anordnungen der Zahlen 1, . . . , n vorstellen. Ist nämlich π ∈ Sn eine Permutation, so kommt in der Liste π(1), π(2), . . . , π(n) jede Zahl zwischen 1 und n genau einmal vor, die Liste ist also eine Anordnung der Zahlen 1, . . . , n. Haben wir umgekehrt eine solche Liste k1 , . . . , kn in der jede Zahl zwischen 1 und n genau einmal vorkommt, so können wir durch π(i) := ki für i = 17-8 Mathematik für Physiker I, WS 2013/2014 Montag 13.1 1, . . . , n eine zugehörige Permutation definieren. Schauen wir uns dies einmal an einem Beispiel mit n = 4 an. Die Anordnung π: 4, 3, 2, 1 entspricht der durch π(1) = 4, π(2) = 3, π(3) = 2 und π(4) = 1 gegebenen Permutation, denn 4 ist das erste Element in unserer Aufzählung, 3 ist das zweite Element in der Aufzählung, und so weiter. Ebenso entspricht η: 3, 1, 4, 2 der Permutation η(1) = 3, η(2) = 1, η(3) = 4 und η(4) = 2. Für das Produkt τ := π · η = π ◦ η ist also τ (1) τ (2) τ (3) τ (4) = = = = π(η(1)) = π(3) = 2, π(η(2)) = π(1) = 4, π(η(3)) = π(4) = 1, π(η(4)) = π(2) = 3, und als Aufzählung geschrieben ist damit τ =π·η : 2, 4, 1, 3. Mit der Interpretation von Permutationen als Auflistungen der Zahlen von 1 bist n ist es auch leicht die Elemente der symmetrischen Gruppe zu zählen. Lemma 8.1 (Elementeanzahl der Sn ) Für jedes n ∈ N mit n ≥ 1 hat die symmetrische Gruppe Sn genau n! viele Elemente. Beweis: Für das erste Element der Aufzählung haben wir n Möglichkeiten, für das zweite dann nur noch n − 1 Möglichkeiten, für das dritte n − 2 Möglichkeiten, und so weiter, bis für das letzte Element nur noch eine Möglichkeit verbleibt. Als Anzahl aller möglichen Permutationen ergibt sich damit n · (n − 1) · (n − 2) · . . . 1 = 1 · 2 · . . . · n = n!. Schreiben wir |M | für die Anzahl aller Elemente einer endlichen Menge M , so sind also |S1 | = 1, |S2 | = 2, |S3 | = 6, |S4 | = 24, |S5 | = 120, . . . Die Elemente der symmetrischen Gruppe Sn können in zwei verschiedene Sorten eingeteilt werden, die geraden und die ungeraden Permutationen. Nehmen wir einmal an wir haben eine Permutation π ∈ Sn gegeben. Dann sind π(1), π(2), . . . , π(n) genau die 17-9 Mathematik für Physiker I, WS 2013/2014 Montag 13.1 Zahlen zwischen 1 und n nur in einer anderen Reihenfolge. Dies übeträgt sich dann auch auf Paare von verschiedenen Zahlen zwischen 1 und n, d.h. (π(1), π(2)), . . . , (π(1), π(n)), (π(2), π(1)), (π(2), π(3)), . . . , (π(2), π(n)), . . . , (π(n − 1), π(1)), . . . , (π(n − 1), π(n)) sind wieder genau diese Paare, nur erneut in einer anderen Reihenfolge. Dies modifizieren wir noch etwas und betrachten nur noch die nach Größe geordneten Paare (i, j) mit 1 ≤ i < j ≤ n, bei denen der zweite Eintrag also größer als der erste Eintrag ist. Wenden wir unsere Permutation auf diese korrekt geordneten Paare an, so erhalten wir (π(1), π(2)), . . . , (π(1), π(n)), (π(2), π(3)), . . . , (π(2), π(n)), . . . , (π(n − 1), π(n)) nur noch die Hälfte aller möglichen Paare. Diese umgeordneten Paare müssen aber nicht mehr nach Größe geordnet sein, die Permutation kann ja auch richtig geordnete Paare auf falsch geordnete Paare abbilden. Jedes Paar bei dem dies vorkommt nennen wir einen Fehlstand von π, d.h. (i, j) mit 1 ≤ i < j ≤ n ist Fehlstand von π :⇐⇒ π(i) > π(j). Bilden wir nun das Produkt der Differenzen aller unserer obigen Paare, so erhalten wir fast genau das Produkt aller Differenzen nach Größe geordneter Paare, es kommt nur für jeden Fehlstand ein Minus Zeichen hinzu. Schreiben wir also F (π) für die Menge aller Fehlstände von π, so ist Y Y Y (π(j) − π(i)) = (−1)|F (π)| (j − i) = ± (j − i). 1≤i<j≤n 1≤i<j≤n 1≤i<j≤n Tritt in der obigen Formel das Pluszeichen auf, ist also |F (π)| gerade, so nennen wir π eine gerade Permutation, und andernfalls heißt π eine ungerade Permutation. Zur Verwendung in Rechnungen führen wir noch ein Symbol für das auftretende Vorzeichen ein. Definition 8.1 (Vorzeichen einer Permutation) Seien n ∈ N mit n ≥ 1 und π ∈ Sn . Dann heißt (−1)π := (−1)|F (π)| = π(j) − π(i) j−i 1≤i<j≤n Y das Vorzeichen von π. Wir wollen drei Beispiele behandeln. 1. Wir fangen mit dem konkreten Beispiel n = 4 und der durch 3, 4, 1, 2 gegebenen Permutation π an. Listen wir die nach Größe geordneten Paare und ihre Bilder 17-10 Mathematik für Physiker I, WS 2013/2014 Montag 13.1 unter π auf, so ergibt sich (i, j) 1, 2 1, 3 1, 4 2, 3 2, 4 3, 4 (π(i), π(j)) 3, 4 3, 1 F 3, 2 F 4, 1 F 4, 2 F 1, 2, wobei die Fehlstände mit dem Symbol F“ markiert sind. Wir haben in diesem ” Beispiel also |F (π)| = 4 Fehlstände und somit (−1)π = 1, d.h. π ist eine gerade Permutation. 2. Sei n ∈ N mit n ≥ 2 und bezeichne τ ∈ Sn die Transposition die zwei verschiedene Zahlen 1 ≤ i < j ≤ n miteinander vertauscht. Fehlstände von τ müssen i oder j involvieren. Gehen wir die Möglichkeiten durch, so ergeben sich genau die folgenden Fehlstände von τ F (τ ) = {(i, k)|i < k ≤ j} ∪ {(k, j)|i < k < j} also |F (τ )| = (j − i) + (j − i − 1) = 2(j − i) − 1 und insbesondere (−1)τ = −1, d.h. Transpositionen sind immer ungerade. 3. Nun sei π eine Permutation die r ≥ 2 aufeinanderfolgende Ziffern zyklisch nach rechts schiebt, beispielsweise die Ziffern von i bis i + r − 1 mit 1 ≤ i ≤ n − r + 1. Es soll also π(k) = k für 1 ≤ k < i und für i + r ≤ k ≤ n, π(k) = k + 1 für i ≤ k < i + r − 1 und π(i + r − 1) = i sein. Fehlstände von π müssen offenbar zwei Ziffern zwischen i und i + r − 1 involvieren und i + r − 1 als rechte Komponente haben, also F (π) = {(k, i + r − 1)|i ≤ k < i + r − 1}, und somit |F (π)| = r − 1, und folglich ist auch (−1)π = (−1)r−1 , ist also r gerade so ist π ungerade und ist r ungerade so ist π gerade. Lemma 8.2 (Rechenregeln für das Vorzeichen einer Permutation) Sei n ∈ N mit n ≥ 1. Dann gelten: (a) Ist id ∈ Sn die identische Permutation, so ist (−1)id = 1. (b) Für alle π, η ∈ Sn ist (−1)πη = (−1)π (−1)η . (c) Für jedes π ∈ Sn ist (−1)π −1 = (−1)π . 17-11 Mathematik für Physiker I, WS 2013/2014 Montag 13.1 Beweis: (a) Klar da die Identität keine Fehlstände hat. (b) Es gilt Y Y (π(η(j)) − π(η(i))) = (−1)|F (η)| 1≤i<j≤n (π(j) − π(i)) 1≤i<j≤n = (−1)π (−1)η Y (j − i) 1≤i<j≤n und somit ist (−1)πη = π(η(j)) − π(η(i)) = (−1)π (−1)η . j − i 1≤i<j≤n Y (c) Nach (a) und (b) gilt 1 = (−1)ππ 8.2 −1 = (−1)π (−1)π −1 =⇒ (−)π −1 = 1 = (−1)π . (−1)π Definition und Grundeigenschaften der Determinante Wir definieren die allgemeine Determinante durch die sogenannte Leipnitz-Formel. Definition 8.2 (Definition der Determinante) Sei n ∈ N mit n ≥ 1 und sei K ∈ {R, C}. Die Determinante einer n × n Matrix über K wird durch die Formel a11 · · · a1n .. . . .. := X (−1)π a . . . 1π(1) · . . . · anπ(n) π∈Sn an1 · · · ann definiert. Die Determinante einer n×n Matrix ist also eine Summe mit |Sn | = n! vielen Summanden und jeder Summand ist ein Produkt aus n Matrixeinträgen und einem Vorzeichen. Für n = 1, 2, 3 stimmt dies mit der schon eingeführten Determinante überein. Schon für n = 4 ist die Definition aber nicht direkt zum Berechnen der Determinante geeignet, man hat |S4 | = 24 viele Summanden in der Summe. Es gibt im wesentlichen zwei Methoden Determinanten zu berechnen, zum einen über die sogenannte LaplaceEntwicklung, die wir im nächsten Abschnitt behandeln, und zum anderen über die Umformung einer Determinante mittels elementarer Zeilen- und Spaltenoperationen. Um den letzteren Weg zu begründen, müssen wir uns überlegen wie sich die Determinante bei Anwendung von Zeilenoperationen verhält, und hierfür wollen wir das folgende Lemma formulieren und beweisen. 17-12 Mathematik für Physiker I, WS 2013/2014 Montag 13.1 Lemma 8.3 (Grundeigenschaften der Determinante) Seien n ∈ N mit n ≥ 1, K ∈ {R, C} und a11 · · · a1n A = ... . . . ... ∈ K n×n an1 · · · ann eine n × n Matrix über K. Dann gelten: (a) Es ist det At = det A. (b) Geht A0 aus A durch Multiplikation einer Zeile oder einer Spalte mit einer Konstanten c ∈ K hervor, so ist det A0 = c · det A. (c) Sei α ∈ Sn eine Permutation und bezeichne A0 die Matrix, die aus A durch Permutation der Zeilen gemäß α hervorgeht, d.h. für 1 ≤ k ≤ n ist die k-te Zeile von A0 gleich der α(k)-ten Zeile von A. Dann ist det A0 = (−1)α det A. Die analoge Aussage gilt für Permutationen der Spalten von A. (d) Geht A0 aus A durch Vertauschen zweier Zeilen oder Spalten hervor, so ist det A0 = − det A. (e) Geht A0 aus A durch Addition eines Vielfachen einer Zeile zu einer anderen Zeile hervor, so ist det A0 = det A. Die analoge Aussage gilt auch für Spalten statt Zeilen. (f ) Besteht eine Zeile oder eine Spalte von A nur aus Nullen, so ist det A = 0. (g) Ist eine Zeile von A ein Vielfaches einer anderen Zeile von A, oder eine Spalte von A ein Vielfaches einer anderen Spalte von A, so ist det A = 0. Beweis: (a) Es gilt nach Lemma 2.(c) det At = X (−1)π aπ(1)1 · . . . · aπ(n)n = π∈Sn = X X (−1)π aπ(1),π−1 (π(1)) · . . . · aπ(n),π−1 (π(n)) π∈Sn π −1 (−1) a1,π−1 (1) · . . . · an,π−1 (n) = π∈Sn X (−1)π a1π(1) · . . . · anπ(n) = det A. π∈Sn (b) Sei 1 ≤ i ≤ n und die i-te Zeile von A0 sei das c-fache der i-ten Zeile von A. Dann ist X det A0 = (−1)π a1π(1) · . . . · (caiπ(i) ) · . . . · anπ(n) π∈Sn X =c π∈Sn 17-13 (−1)π a1π(1) · . . . · anπ(n) = c · det A. Mathematik für Physiker I, WS 2013/2014 Montag 13.1 Mit (a) folgt hieraus auch die Aussage über Spalten. (c) Es gilt nach Lemma 2.(b) det A0 = X (−1)π aα(1),π(1) · . . . · aα(n),π(n) π∈Sn = (−1)α X −1 (−1)πα a1,π(α−1 (1)) · . . . · an,π(α−1 (n)) = (−1)α det A. π∈Sn Mit (a) folgt hieraus auch die Aussage über Spaltenpermutationen. (d) Da Transpositionen ungerade Permutationen sind ist dies ein Spezialfall von (c). (f ) Ist 1 ≤ i ≤ n und besteht die i-te Zeile von A nur aus Nullen, so ist für jedes π ∈ Sn stets aiπ(i) = 0, also auch a1π(1) · . . . · anπ(n) = 0. Damit ist det A = 0. Mit (a) folgt auch die Aussage über Spalten. (g) Nach (a) reicht es die Aussage für Zeilen einzusehen, und nach (b) können wir annehmen, dass A sogar zwei identische Zeilen hat. Dann ändert sich die Matrix bei Vertauschen dieser beiden Zeilen nicht, und (d) ergibt det A = − det A, also det A = 0. (e) Seien c ∈ K, 1 ≤ i, j ≤ n mit i 6= j und A0 gehe aus A durch Addition des c-fachen der j-ten Zeile zur i-ten Zeile hervor. Dann ist det A0 = X (−1)π a1π(1) · . . . · (aiπ(i) + cajπ(i) ) · . . . · anπ(n) π∈Sn X = det A + c (−1)π a1π(1) · . . . · ajπ(i) · . . . · anπ(n) . π∈Sn Die hintere Summe ist gerade die Determinante der Matrix A00 , die aus A durch Ersetzen der i-ten Zeile durch die j-te Zeile entsteht. Da A00 zwei identische Zeilen hat, ist nach (g) aber det A00 = 0, und dies zeigt det A0 = det A. Wie schon bemerkt soll uns das Lemma eine Methode zur Berechnung von Determinanten liefern. Wir wissen das wir jede Matrix durch Anwendung der drei elementaren Zeilenumformungen auf Stufenform bringen können, und das Lemma sagt uns wie sich die Determinante bei Anwendung dieser Zeilenumformungen verhält. Damit kann die Berechnung einer allgemeinen Determinante auf die Berechung der Determinante einer Matrix in Stufenform zurückgeführt werden. Etwas allgemeiner behandeln wir gleich Determinanten von Dreiecksmatrizen. Lemma 8.4 (Determinante von Dreiecksmatrizen) Seien n ∈ N mit n ≥ 1, K ∈ {R, C} und A= ∗ a11 ... oder A = ann 17-14 a11 ... ∗ ann Mathematik für Physiker I, WS 2013/2014 Montag 13.1 eine obere oder eine untere Dreiecksmatrix. Dann ist det A = a11 · . . . · ann . Beweis: Schreibe wieder a11 · · · a1n A = ... . . . ... . an1 · · · ann Zunächst sei A eine obere Dreiecksmatrix, also aij = 0 für 1 ≤ j < i ≤ n. Sei π ∈ Sn . Gibt es dann ein 1 ≤ i ≤ n mit π(i) < i, so ist ai,π(i) = 0 und somit auch a1,π(1) · . . . · an,π(n) = 0. Ist dagegen π(i) ≥ i für jedes 1 ≤ i ≤ n, so ist π(n) ≥ n, also π(n) = n, und weiter π(n − 1) ≥ n − 1 also π(n − 1) = n − 1 oder π(n − 1) = n, und wegen π(n − 1) 6= π(n) = n sogar π(n − 1) = n − 1. So fortfahrend folgt dann π(i) = i für alle 1 ≤ i ≤ n. Es gibt in det A also höchstens einen von Null verschiedenen Summanden, nämlich derjenige zur identischen Permutation und da diese Permutation gerade ist, folgt det A = a11 · . . . · ann . Ist A eine untere Dreiecksmatrix, so ist At eine obere Dreiecksmatrix und mit Lemma 3.(a) folgt die Behauptung auch in diesem Fall. Wir rechnen ein Beispiel. 1 2 −1 1 1 1 2 −1 1 2 −1 1 2 0 0 1 −1 0 2 −2 4 2 = = − −1 2 3 −1 0 4 2 0 0 2 0 3 0 −1 0 0 −6 2 −3 0 −6 2 1 2 −1 1 1 0 4 0 2 0 = − = − 0 2 −2 0 0 0 0 0 5 −3 1 0 −2 −3 2 −1 1 4 2 0 = −16. 0 2 −2 0 0 2 Man ist allerdings nicht gezwungen so stur den Gaußschen Algorithmus abzuarbeiten, oft kann man sich die Arbeit durch Mischen von Zeilen- und Spaltenoperationen erleichtern. Dies geschieht etwa im folgenden Beispiel wo wir zuerst Vielfache der ersten Zeile von der dritten und vierten Zeile abziehen und anschließend die zweite und dritte Spalte von der ersten Spalte subtrahieren 1 0 1 −1 1 0 0 0 3 1 −1 3 1 −1 3 4 1 3 7 −5 4 1 3 7 −5 0 1 3 7 −5 2 2 0 1 0 = 0 2 −2 3 −6 = 0 2 −2 3 −6 = 0 4 0 4 −3 6 0 0 0 1 −6 0 0 0 1 −6 1 1 0 8 1 1 1 0 8 1 0 1 0 8 1 17-15 Mathematik für Physiker I, WS 2013/2014 Montag 13.1 nach Lemma 3.(f). Dies ist schon eine durchaus effektive Methode zur Berechnung von Determinanten. Bevor wir fortfahren wollen wir noch ein oft nützliches Korollar aus unserem Lemma über Dreiecksmatrizen festhalten. Korollar 8.5 (Determinanten von Blockdreiecksmatrizen) Seien n ∈ N mit n ≥ 1, K ∈ {R, C} und A eine n × n-Matrix über K der Form D1 ∗ D1 D2 D2 A= ... ... oder A = ∗ Dr Dr mit quadratischen Untermatrizen D1 , . . . , Dr . Dann gilt det A = det(D1 ) · . . . · det(Dr ). Beweis: Zunächst sei A eine obere Blockdiagonalmatrix habe also die links stehende Form. Für jedes 1 ≤ i ≤ r überführe Di durch Vertauschen von Zeilen und Addition von Vielfachen einer Zeile zu einer anderen Zeile in eine obere Dreiecksmatrix Di0 und bezeichne si die Anzahl der dabei verwendeten Zeilenvertauschungen. Lassen wir die dabei verwendeten elementaren Zeilenumformungen dann auch auf ganz A wirken, so wird A in eine Matrix A0 der Form D10 ∗ 0 D 2 A0 = ... Dr0 P überführt, und s := ri=1 si ist die Anzahl der dabei verwendeten Zeilenvertauschungen. Mit Lemma 3.(d,e) folgen det A = (−1)s det A0 und det Di = (−1)si det Di0 für alle 1 ≤ i ≤ r. Die Matrix A0 ist eine obere Dreiecksmatrix, und damit gilt nach Lemma 4 r Y 0 det A = det Di0 . i=1 Insgesamt haben wir damit det A = (−1)s det A0 = r r Y Y (−1)si det Di0 = det Di , i=1 17-16 i=1 Mathematik für Physiker I, WS 2013/2014 Montag 13.1 und die Aussage ist für obere Blockdreiecksmatrizen bewiesen. Mit Lemma 3.(a) folgt dann auch die Aussage über untere Blockdreiecksmatrizen. Beispielsweise ist damit 1 −1 0 3 7 0 −5 3 2 −9 4 9 0 0 1 3 1 −1 2 1 · = 3 9 3 = 10 · (−3) = −30, 7 da es sich hier um eine untere Blockdreiecksmatrix mit den beiden 2 × 2-Kästchen 1 −1 2 1 D1 = und D2 = 3 7 9 3 handelt. Nachdem die zuletzt bewiesenen Aussagen über Determinanten hauptsächlich rechnerische Aspekte behandelt haben, wollen wir nun zu einem wichtigen und eher theoretischen Satz kommen der den Zusammenhang von Determinanten und der Matrixmultiplikation herstellt. Satz 8.6 (Multiplikationssatz für Determinanten) Sind n ∈ N mit n ≥ 1 und A, B zwei n × n Matrizen über K ∈ {R, C} so gilt det(A · B) = det(A) · det(B). Beweis: Wir schreiben a11 · · · a1n A = ... . . . ... , B = an1 · · · ann b11 · · · b1n c11 · · · c1n . .. . . . . . .. und AB = .. . . . .. . . bn1 · · · bnn cn1 · · · cnn P Nach Definition der Matrizenmultiplikation gilt dann cij = nk=1 aik bkj für alle 1 ≤ i, j ≤ n. Hiermit rechnen wir nun X (−1)π c1,π(1) · . . . · cn,π(n) det(AB) = π∈Sn = X (−1)π X ! a1,j1 bj1 ,π(1) (−1)π n X · ... · j1 =1 π∈Sn = n X ! an,jn bjn ,π(n) jn =1 X a1,j1 · . . . · an,jn · bj1 ,π(1) · . . . · bjn ,π(n) 1≤j1 ,...,jn ≤n π∈Sn " = X a1,j1 · . . . · an,jn · 1≤j1 ,...,jn ≤n # X π∈Sn 17-17 (−1)π bj1 ,π(1) · . . . bjn ,π(n) . Mathematik für Physiker I, WS 2013/2014 Montag 13.1 Nun kümmern wir uns um den Faktor in den eckigen Klammern. Die dort stehende Summe sieht fast wie eine Determinante aus, nur das dort überall ji statt i steht. Dies ist aber kein echtes Problem, schreiben wir B(j1 , . . . , jn ) für die n × n Matrix, deren i-te Zeile gerade die ji -te Zeile von B ist, so ist der Ausdruck in eckigen Klammern gerade die Determinante von B(j1 , . . . , jn ), also ist X det(AB) = a1,j1 · . . . · an,jn · det B(j1 , . . . , jn ). 1≤j1 ,...,jn ≤n Wir betrachten nun einen einzelnen Summanden in dieser Summe, seien also 1 ≤ j1 , . . . , jn ≤ n gegeben. Gibt es dann zwei Indizes 1 ≤ i, i0 ≤ n mit i 6= i0 und ji = ji0 , so hat die Matrix B(j1 , . . . , jn ) zwei identische Zeilen, und somit ist dann det B(j1 , . . . , jn ) = 0 nach Lemma 3.(g). Also müssen wir in der obigen Summe nur die Summanden (j1 , . . . , jn ) betrachten in denen j1 , . . . , jn paarweise verschieden sind. Aber Tupel aus n verschiedenen Zahlen aus {1, . . . , n} sind ja gerade die Ordnungen von {1, . . . , n}, also folgt mit Lemma 3.(c) det(AB) = X a1,π(1) · . . . · an,π(n) · det B(π(1), . . . , π(n)) π∈Sn ! = X (−1)π a1,π(1) · . . . · an,π(n) π∈Sn 17-18 · det(B) = det(A) · det(B).