Skript zu der Vorlesung Lineare Algebra 2 Prof. Dr. Mark Groves SS2017 13. Mai 2017 Inhaltsverzeichnis 1 Bilinear-, Sesquilinear- und quadratische Formen 1.1 Bilinear- und Sesquilinearformen . . . . . . . . 1.2 Quadratische Formen . . . . . . . . . . . . . . . 1.3 Quadriken . . . . . . . . . . . . . . . . . . . . . 1.4 Bilinearformen und der Dualraum . . . . . . . . . . . 3 3 9 20 38 2 Polynome von linearen Abbildungen 2.1 Einführung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2 Annulierende Polynome . . . . . . . . . . . . . . . . . . . . . . . . . 2.3 Primärzerlegung und die Jordansche Normalform . . . . . . . . . . 44 44 47 53 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 Bilinear-, Sesquilinear- und quadratische Formen 1 Bilinear-, Sesquilinear- und quadratische Formen 1.1 Bilinear- und Sesquilinearformen Definition Es sei V ein Vektorraum über einen Körper K. Eine Bilinearform auf V ist eine Abbildung b : V × V → K, die in beiden Argumenten linear ist, d.h. b(α1 x1 + α2 x2 , y) = α1 ( x1 ,y) + α2 ( x2 ,y) für alle Vektoren x1 , x2 , y und Skalare α1 , α2 sowie b( x,α1 y1 + α2 y2 ) = α1 ( x,y1 ) + α2 ( x,y2 ) für alle Vektoren x, y1 , y2 und Skalare α1 , α2 . Sie ist symmetrisch, falls b( x,y) = b(y,x ) für alle Vektoren x,y. Beispiele 1. Es sei V ein euklidischer Raum. Das Skalarprodukt definiert eine symmetrische Bilinearform b( x,y) = h x, yi auf V. 2. Es sei V ein endlichdimensionaler Vektorraum über einem Körper K. Die Formel b( A,B) = Spur AB definiert eine symmetrische Bilinearform auf Hom (V,V ). 3. Die Formel b(x,y) = det(x|y) definiert eine schiefsymmerische Bilinearform auf R2 , d.h. sie hat die Eigenschaft b(y,x) = −b(x,y) für alle x, y ∈ R2 . 3 1.1 Bilinear- und Sesquilinearformen Definition Es seien V ein endlichdimensionaler Vektorraum über einem Körper K, b eine Bilinearform auf V und B = {e1 , . . . ,en } eine Basis für V. Die Matrix MB (b) = (b(ei ,e j ))i,j=1,...,n ∈ K n×n heißt die Gram-Matrix von b bezüglich B . Beispiel Die Gram-Matrix des kanonischen Skalarprodukts auf R n bezüglich der üblichen Basis ist In , denn ei .e j = δij . Proposition Es seien V ein endlichdimensionaler Vektorraum über einem Körper K und B = {e1 , . . . ,en } eine Basis für V. n (i) Es sei b eine Bilinearform auf V mit Gram-Matrix MB (b) = (mij )i,j =1 . Dann gilt y1 b( x,y) = ( x1 , . . . ,xn ) m11 m12 · · · m1n m21 m22 · · · m2n y2 (1 ) .. .. .. .. . . . . mn1 mn2 · · · mnn yn n = ∑ mij xi y j i,j=1 für alle Vektoren x = x1 e1 + . . . + x n e n , y = y1 e1 + . . . + y n e n in V. n n × n . Dann definiert die Formel (1) eine Bilinearform (ii) Es sei M = (mij )i,j =1 ∈ K b auf V. Ferner ist MB (b) = M. 4 1.1 Bilinear- und Sesquilinearformen Bemerkung Mit x1 x = ... , xn lässt sich (1) als y1 y = ... yn b( x,y) = x T MB (b)y schreiben. Korollar Es seien V ein endlichdimensionaler Vektorraum über einem Körper K und B = {e1 , . . . ,en } eine Basis für V. Dann ist die Abbildung b 7→ MB (b) eine Bijektion von der Menge der Bilinearformen auf V nach der Menge K n×n . Ferner ist b genau dann symmetrisch, wenn MB (b) eine symmetrische Matrix ist. Beweis Die Injektivität und Surjektivität der Abbildung b 7→ MB (b) folgen aus Teil (i) bzw. Teil (ii) der letzten Proposition. Ferner gilt b( x,y) = b(y,x ) für alle x,y ∈ V genau dann, wenn x T M B ( b ) y = yT M B ( b ) x = ( yT M B ( b ) x )T = xT MB ( b ) T y für alle x, y ∈ K n . Dies gilt aber genau dann, wenn MB (b) = MB (b)T . (Die Gleichung xT Ay = xT By gilt für alle x, y ∈ K n genau dann, wenn A = B ist.) Bemerkung Die n2 Zahlen b(ei ,e j ), i,j = 1, . . . , n bestimmen b eindeutig: Mit diesem Wissen können wir b durch (1) rekonstruieren. 5 1.1 Bilinear- und Sesquilinearformen Proposition Es seien V ein endlichdimensionaler Vektorraum über einem Körper K, b eine Blinearform auf V und B , B ′ zwei Basen für V. Dann gilt T M B ′ ( b ) = BB , B ′ M B ( b ) BB , B ′ . Beweis Zu jedem Vektor x ∈ V schreiben wir x = x1 e1 + · · · + x n e n , und x1 x = ... , xn so dass Aus folgt x = x1′ e1′ + · · · + xn′ e′ x1′ x′ = ... , xn′ x = BB , B ′ x ′ . b( x,y) = xT MB (b)y, b( x,y) = x′T MB ′ (b)y′ T ′ ′T ′ x ′ T BB , B ′ M B ( b ) BB , B ′ y = x M B ′ ( b ) y . Da diese Gleichung für alle x′ , y′ ∈ K n gilt, ist T M B ′ ( b ) = BB , B ′ M B ( b ) BB , B ′ . Korollar Es sei V ein n-dimensionaler Vektorraum über einem Körper K. Dann definieren M1 , M2 ∈ K n×n dieselbe Bilinearform auf V genau dann, wenn es eine invertierbare Matrix B mit M1 = BT M2 B (⋆) gibt. Ferner definiert die Formel M1 ∼ M2 ⇔ (⋆) gilt für irgendeine B ∈ GL(K,n) eine Äquivalenzrelation auf K n×n . 6 1.1 Bilinear- und Sesquilinearformen Definition Es sei V ein komplexer Vektorraum. Eine Sesquilinearform auf V ist eine Abbildung b : V × V → C, die im ersten Argument linear und im zweiten Argument antilinear ist, d.h. s(α1 x1 + α2 x2 , y) = α1 ( x1 ,y) + α2 ( x2 ,y) für alle x1 , x2 , y ∈ V und α1 , α2 ∈ C sowie s( x,α1 y1 + α2 y2 ) = ᾱ1 ( x,y1 ) + ᾱ2 ( x,y2 ) für alle Vektoren x, y1 , y2 ∈ V und Skalare α1 , α2 ∈ C. Sie heißt hermitesche Form, falls s( x,y) = s(y,x ) für alle x,y ∈ V. Bemerkung Eine hermitesche Form hat die Eigenschaft s( x,x ) ∈ R für alle x ∈ V. Beispiel Es sei V ein unitärer Raum. Das Skalarprodukt definiert eine hermitesche Form b( x,y) = h x, yi auf V. Definition Es seien V ein endlichdimensionaler komplexer Vektorraum, s eine Sesquilinearform auf V und B = {e1 , . . . ,en } eine Basis für V. Die Matrix MB (s) = (s(ei ,e j ))i,j=1,...,n ∈ C n×n heißt die Gram-Matrix von s bezüglich B . 7 1.1 Bilinear- und Sesquilinearformen Proposition Es seien V ein endlichdimensionaler komplexer Vektorraum und B = {e1 , . . . ,en } eine Basis für V. n (i) Es sei s eine Sesquilinearform auf V mit Gram-Matrix MB (s) = (mij )i,j =1 . Dann gilt s( x,y) = x T MB (s)y = n ∑ i,j=1 mij xi y j , (2 ) wobei x = x1 e1 + . . . + x n e n , und x1 x = ... , xn y = y1 e1 + . . . + y n e n y1 y = ... . yn n n × n . Dann definiert die Formel (2) eine Sesquilinear(ii) Es sei M = (mij )i,j =1 ∈ C form s auf V. Ferner ist MB (s) = M. Korollar Es seien V ein endlichdimensionaler komplexer Vektorraum und B = {e1 , . . . ,en } eine Basis für V. Dann ist die Abbildung s 7→ MB (s) eine Bijektion von der Menge der Sesquilinearformen auf V nach der Menge C n×n . Ferner ist s genau dann hermitesch, wenn MB (s) eine hermitisiche Matrix ist. Proposition Es seien V ein endlichdimensionaler unitärer Raum, s eine Sesquilinearform auf V und B , B ′ zwei Basen für V. Dann gilt T M B ′ ( s ) = BB , B ′ MB ( s ) B B , B ′ . Korollar Es sei V ein n-dimensionaler komplexer Vektorraum. Dann definieren M1 , M2 ∈ C n×n dieselbe Bilinearform auf V genau dann, wenn es eine invertierbare Matrix 8 1.2 Quadratische Formen B mit M1 = BT M2 B (⋆) gibt. Ferner definiert die Formel M1 ∼ M2 ⇔ (⋆) gilt für irgendeine B ∈ GL(C,n) eine Äquivalenzrelation auf C n×n . 1.2 Quadratische Formen Definition Es seien V ein Vektorraum über einem Körper K und b eine symmetrische Bilinearform auf K. Dann heißt die Abbildung q : V → K mit q( x ) = b( x,x ) die zu b gehörige quadratische Form. Proposition Es seien V ein Vektorraum über einem Körper K mit Charakteristik 6= 2. Eine Funktion q : V → K ist genau dann eine quadratische Form, wenn (i) q(λx ) = λ2 q( x ) für alle x ∈ V und λ ∈ K, (ii) die Formel 1 (q( x + y) − q( x ) − q(y)) 2 eine (notwendigerweise symmetrische) Bilinearform b⋆ : V × V → K definiert. b⋆ ( x,y) = In diesem Fall ist q die zu b⋆ gehörige quadratische Form. Beweis Es sei q eine zu einer symmetrischen Bilinearform b : V × V → K gehörige quadratische Form. Aus q( x ) = b( x,x ) 9 1.2 Quadratische Formen folgt (i) und 1 q( x + y) − q( x ) − q(y) 2 1 = b( x + y,x + y) − b( x,x ) − b(y,y) 2 1 = b( x,x ) + b( x,y) + b(y,x ) + b(y,y) − b( x,x ) − b(y,y) 2 = b( x,y), d.h. b⋆ = b. Nun habe q : V → K die Eigenschaften (i), (ii), Dan gilt 1 1 b⋆ ( x,x ) = (q(2x ) − 2q( x )) = (4q( x ) − 2q( x )) = q( x ), 2 2 sodass q die zu b⋆ gehörige quadratische Form ist. Bemerkung Die Identität 1 (q( x + y) − q( x ) − q(y)) 2 heißt Polarisierungsidentität. Sie definiert eine Bijektion von der Menge der symmetrischen Bilinearformen auf V nach der Menge der Funktionen q : V → K mit den Eigenschaften (i), (ii). b( x,y) = Definition Es sei K ein Körper. Ein homogenes quadratisches Polynom auf K n ist ein Ausdruck der Form xT Mx, wobei M eine symmetrische Matrix in K n×n ist. Bemerkungen 1. In der üblichen Notation ist xT Mx = n ∑ mii xi2 + ∑ i =1 2mij xi x j . 1≤ i < j ≤ n 10 1.2 Quadratische Formen Das reelle homogene quadratische Polynom 3x12 + 3x33 + 4x1 x2 + 8x1 x3 + 4x2 x3 lässt sich bspw. als x1 ,x2 ,x3 schreiben. 3 2 4 x1 2 0 2 x2 4 2 3 x3 2. Die Abbildung M 7→ xT Mx ist eine Bijektion von der Menge der symmetrischen Matrizen in K n×n nach der Menge der homogenen quadratischen Polynomen auf K n . Das nächste Ergebnis beschreibt die Beziehnug zwischen quadratischen Formen auf endlichdimensionalen Vektorräumen und homogenen quadratischen Polynomen. Proposition Nun seien V ein endlichdimensionaler Vektorraum über einem Körper K, B = {e1 , . . . ,en } eine Basis für V und b eine Bilinearform auf V. Dann ist die zu b gehörige quadratische Form durch die Formel q ( x ) = xT MB ( b ) x mit x = x1 e1 + · · · + x n e n , gegeben. x1 x = ... xn Nun spezialisieren wir uns auf reelle Vektorräume. Definition Es sei V ein reeller Vektorraum. Eine quadratische Form q auf V heißt (i) positiv definit, falls q(v) > 0 für jedes v ∈ V \ {0}, (ii) positiv semidefinit, falls q(v) ≥ 0 für jedes v ∈ V \ {0}, 11 1.2 Quadratische Formen (iii) negativ definit, falls q(v) < 0 für jedes v ∈ V \ {0}, (iv) negativ semidefinit, falls q(v) ≤ 0 für jedes v ∈ V \ {0}. Bemerkungen 1. Oft sagt man, dass die zugehörige Bilinearform b zu q positiv (negativ) (semi-)definit ist. 2. Ein Skalarprodukt für einen reellen Vektorraum V ist eine positiv definite Bilinearform auf V. Definition Eine symmetrische Matrix M ∈ R n×n heißt (i) positiv definit, falls xT Mx > 0 für jedes x ∈ R n \ {0}, (ii) positiv semidefinit, falls xT Mx ≥ 0 für jedes x ∈ R n \ {0}, (i) positiv definit, falls xT Mx < 0 für jedes x ∈ R n \ {0}, (ii) positiv semidefinit, falls xT Mx ≤ 0 für jedes x ∈ R n \ {0}. Bemerkungen Oft sagt man, dass das homogene quadratische Polynom xT Mx positiv (negativ) (semi-)definit ist. Proposition Eine symmetrische Matrix M ∈ R n×n ist genau dann positiv (negativ) (semi-) definit, wenn sie die Gram-Matrix einer positiv (negativ) (semi-)definiten quadratische Form auf einem n-dimensionalen reellen Vektorraum ist. 12 1.2 Quadratische Formen Korollar Es seien M1 , M2 symmetrische Matrizen in M ∈ R n×n mit M1 = BT M2 B für irgendeine Matrix B ∈ GL(R,n). Dann ist M1 genau dann positiv (negativ) (semi-)definit, wenn M2 positiv (negativ) (semi-)definit ist. Bemerkung Das letzte Korollar gilt insbesondere, wenn M1 , M2 kongruent sind (d.h. die Matrix B ist orthogonal). Bemerkung (‘Hauptachsentransformation’) Es sei M eine symmetrische Matrix in R n×n . Es gibt eine Orthonormalbasis {v1 , . . . ,vn } für R n aus Eigenvektoren von M, und die Basiswechselmatrix P von der üblichen Basis für R n zu {v1 , . . . ,vn } ist orthogonal. Folglich gilt D := PT MP = diag (λ1 , . . . ,λn ), wobei λ j der Eigenwert zum Eigenvektor v j ist. Mit der Substitution x = Px′ können wir das homogene quadratische Polynom xT Mx in das einfachere homogene quadratische Polynom x′T Dx′ = λ1 | x1′ |2 + · · · + λn | xn′ |2 transformieren. Beispiel Betrachte das reelle homogene quadratische Polynom p(x) = x1 ,x2 ,x3 3 2 4 x1 2 0 2 x2 . x3 4 2 3 13 1.2 Quadratische Formen Die Matrix 3 2 4 M = 2 0 2 4 2 3 hat die Eigenwerte −1 (geometrisch doppelt) und 8, und −1 −4 2 1 1 1 B ′ : = √ 2 , √ −2 , 1 5 3 3 5 0 5 2 ist eine Basis für R3 aus Eigenvektoren von M. Die Baselwechselmatrix −1 4 2 √ − √ 5 3 5 3 2 1 P = √25 − 3√ 5 3 2 5 √ 0 3 3 5 hat folglich die Eigenschaft PT MP = diag (−1, − 1,8). Somit ist p′ (x′ ) := p( Px′ ) = − x1′2 − x2′2 + 8x3′2 . Proposition Eine symmetrische Matrix M ∈ R n×n ist (i) genau dann positiv (semi-)definit, wenn ihre Eigenwerte alle positiv (nichtnegativ) sind, (ii) genau dann negativ (semi-)definit, wenn ihre Eigenwerte alle negativ (nichtpositiv) sind. Bemerkung (Diagonalisierung einer quadratischen Form) Wir können die Aussage der letzten Proposition verallgemeinern. Dabei bleiben wir in der Notation der Bemerkung über die Hauptachsentransformation. Ferner seien die Eigenwerte von M so nummeriert, dass λ1 , . . . , λk > 0, λk+1 , . . . , λk+ℓ < 0 und λk+ℓ+1 , . . . , λn = 0. Es sei q eine quadratische Form auf einem endlichdimensionalen reellen Vektorraum V. Ist M die Gram-Matrix von q bezüglich einer Basis B , so gilt q( x ) = xT Mx 14 1.2 Quadratische Formen bezüglich dieser Basis. Verwenden wir P als Basiswechselmatrix, so gilt q( x ) = x′T Dx′ = λ1 ( x1′ )2 + · · · + λk ( xk′ )2 + λk+1 ( xk′ +1 )2 + · · · + λk+ℓ ( xk′ +ℓ )2 | {z } | {z } λ1 , . . . ,λk > 0 λk+1 , . . . ,λk+ℓ < 0 + λk+ℓ+1 ( xk′ +ℓ+1 )2 + · · · + λn ( xn′ )2 {z } | λk+ℓ+1 , . . . ,λn = 0 bezüglich der neuen Basis B ′ . (Ersetzen wir P durch diag(|λ1 |−1/2 , . . . ,|λk+ℓ |−1/2 ,1, . . . ,1) P, so können wir sogar q( x ) = ( x1′ )2 + · · · + ( xk′ )2 − ( xk′ +1 )2 − · · · − ( xk′ +ℓ )2 erreichen.) Es gilt also V = V + ⊕ V − ⊕ V 0, wobei V + = hv1 , . . . ,vk i, V − = hvk+1 , . . . ,vk+ℓ i, V 0 = hvk+ℓ+1 , . . . ,vn i. Ferner ist q|V + ist positiv definit, q|V − ist negativ definit und q|V 0 = 0. Lemma (Sylvesterscher Trägheitssatz) Es sei q eine quadratische Form auf einem endlichdimensionalen reellen Vektorraum V. Ferner seien V = V1+ ⊕ V1− ⊕ V10 , V = V2+ ⊕ V2− ⊕ V20 zwei Zerlegungen von V mit der Eigenschaft, dass q|V + , q|V + positiv definit, q|V − , 1 2 1 q|V − negativ definit und q|V 0 , q|V 0 trivial ist. 2 1 2 Dann ist dim V1+ = dim V2+ , dim V1− = dim V2− und dim V10 = dim V20 . Beweis Wir nehmen an, dass dim V2+ > dim V1+ = dim V − dim(V1− ⊕ V10 ) 15 1.2 Quadratische Formen ist. Dann ist dim(V2+ ∩ (V1− ⊕ V10 )) = dim V2+ + dim(V1− ⊕ V10 ) − dim(V2+ + (V1− ⊕ V10 )) ≥ dim V2+ + dim(V1− ⊕ V10 ) − dim V > 0, sodass es einen nichttrivialen Vektor w ∈ V2+ ∩ (V1− ⊕ V10 ) gibt. Dann ist aber q(w) > 0 und q(w) ≤ 0, ein Widerspruch. Folglich ist dim V2+ ≤ dim V1+ . Vertauschen wir die Indizes, so erhalten wir ebenfalls dim V1+ ≤ dim V2+ . Ein analoges Argument liefert dim V1− = dim V2− . Korollar Es seien M1 , M2 symmetrische Matrizen in M ∈ R n×n mit M1 = BT M2 B für irgendeine Matrix B ∈ GL(R,n). Dann haben M1 und M2 (nach geometrischer Vielfachheit gezählt) die gleiche Anzahl positiver und negativer Eigenwerte. Definition Es seien q ein quadratische Form auf einem endlichdimensionalen reellen Vektorraum V und V = V + ⊕ V − ⊕ V 0 eine Zerlegung von V mit der Eigenschaft, dass q|V + positiv definit, q|V − negativ definit und q|V 0 = 0 ist. Es sei r = dim V + und s = dim V − . Man nennt r + s den Rang und r − s die Signatur der quadratischen Form q. Definition Es sei M eine symmetrische Matrix in Mn×n . Die Matrix Ir 0 0 0 − Is 0 , 0 0 0n − s −r wobei r + s und r − s den Rang bzw. die Signatur einer quadratischen Form mit Gram-Matrix M sind, heißt die Sylvestersche Normalform von M. 16 1.2 Quadratische Formen Bemerkung (Berechnung der Sylvesterschen Normalform) Es gibt zwei Methoden, die Sylvestersche Normalform einer symmetrischen Matrix in R n×n zu berechnen: 1. Man berechnet die Eigenwerte von M. Die Eigenwerte der Matrix 3 2 4 2 0 2 4 2 3 sind −1, −1 und 8, sodass ihre Sylvestersche Normalform diag (1, − 1, − 1) ist. 2. Da eine elementare Matrix invertierbar ist, eine elementare Spaltenumformung einer Rechtsmultiplikation mit einer elementaren Matrix E und die korrespondierende elementare Zeilenumformung einer Linksmultiplikation mit ET entspricht, reicht es, M durch elementare symmetrische Umformungen in Diagonalgestalt zu bringen. Die Rechnung 3 2 4 3 2 0 2 −→ 2 4 2 3 0 3 −→ 2 0 3 −→ 0 0 3 −→ 0 0 3 −→ 0 0 3 −→ 0 0 2 4 0 2 2 −1 2 0 0 2 2 −5 2 0 − 43 2 2 −5 0 0 − 43 2 2 −5 0 0 − 43 0 0 −2 0 0 − 43 0 0 −2 (Z3 → Z3 − 2Z2 ) (S3 → S3 − 2S2 ) (Z2 → Z2 − 23 Z1 ) (S2 → S2 − 32 S1 ) (Z3 → Z3 + 32 Z2 ) (S3 → S3 + 23 S2 ) 17 1.2 Quadratische Formen zeigt, dass die Sylvestersche Normalform der Matrix 3 2 4 2 0 2 4 2 3 diag (1, − 1, − 1) ist. Wir schließen diesen Abschnitt mit einem weiteren Kriterium für die Positivdefinitheit einer quadratischen Form ab. Lemma (Hurwitz-Kriterium) Eine symmetrische Matrix M ∈ R n×n ist genau dann positiv definit, wenn jede Haupt-Unterdeterminante von M positiv ist, d.h. det Mk = 0, k = ,1, . . . ,n mit Mk = (mij )i,j=1,...,k : Mk m11 .. . mk1 M = mk+1,1 . .. mn1 ··· m1k .. . m1,k+1 .. . · · · mkk mk,k+1 · · · mk+1,k mk+1,k+1 .. .. . . · · · mnk mn,k+1 m1n .. . · · · mkn · · · mk+1,n .. . · · · mnn ··· Beweis Zunächst bemerken wir, dass Mk für jedes k = 1, . . . ,n symmetrisch ist. Ferner ist M genau dann positiv definit, wenn Mk für jedes k = 1, . . . ,n positiv definit ist, x : denn xT Mk x = XT MX, wobei X = 0 18 1.2 Quadratische Formen x1 xT Mk x = ( x1 , . . . ,xk ) m11 · · · m1k .. .. .. . . . mk1 · · · mkk xn = ( x1 , . . . ,xk ,0, . . . ,0) m11 · · · m1k .. .. . . mk1 · · · mkk ⋆ ⋆ ⋆ = XT MX. x1 .. . xk 0 . .. 0 Es sei Mk positiv definit für jedes k = 1, . . . ,n. Dann ist Mk kongruent zu einer Diagonalmatrix Dk = diag (d11 , . . . ,dkk ) mit positiven Einträgen. Somit ist k det Mk = det Dk = ∏ dii > 0. i =1 Nun sei det Mk > 0 für jedes k = 1, . . . ,n. Wir zeigen durch vollständige Induktion, dass Mk positiv definit für k = 1, . . . ,n ist. Offensichtlich impliziert det M1 > 0, dass M1 positiv definit ist. Es sei also Mk positiv definit für irgendein k. Dann ist Mk kongruent zu einer Diagonalmatrix Dk = diag (d11 , . . . ,dkk ) mit positiven Einträgen. Es sei Pk eine othogonale Matrix mit PkT Dk P = Dk . Definiere die (orthogonale) Matrix Pk+1 durch 0 .. Pk . Pk+1 = . 0 0 ··· 0 1 Dann gilt PkT+1 Mk+1 Pk+1 = α1 α1 .. . Dk αk · · · α k α k+1 für irgendwelche reellen Zahlen α1 , . . . , αk+1 . 19 1.3 Quadriken Nun verwenden wir die symmetrischen elementaren Umformungen Zk+1 → Zk+1 − αj d jj , Sk + 1 → Sk + 1 − αj d jj , j = 1, . . . ,k, die die Matrix PkT+1 Mk+1 Pk+1 in diag (d11 , . . . ,dkk ,d) für irgendeine reelle Zahl d unformen. Es ist also QTk+1 PkT+1 Mk+1 Pk+1 Qk+1 = diag (d11 , . . . ,dkk ,d) mit β1 .. Ik . Q k+1 = , βk 0 ··· 0 1 α βj = − d j , jj j = 1, . . . ,k, und aus dieser Gleichung folgt k so dass d > 0 ist. det (QTk+1 PkT+1 Mk+1 Pk+1 Qk+1 ) = d ∏ dii , | {z } 1 } |i ={z = det Mk+1 > 0 >0 Folglich ist QTk+1 PkT+1 Mk+1 Pk+1 Qk+1 und somit auch Mk+1 positiv definit. 1.3 Quadriken Definition Es seien A eine symmetrische Matrix in R n×n \ {0}, b ∈ R n und c ∈ R. Die Teilmenge {x ∈ R n : xT Ax + bT x + c = 0} von R n , d.h. die Nullstellenmenge des quadratischen Polynoms xT Ax + bT x + c heißt (n-dimensionale) Quadrik. Im Falle n = 2 heißen Quadriken auch Kegelschnitte. Wir können die geometrische Form einer Quadrik durch Verwendung von Bewegungen, d.h. Translationen und orthogonalen linearen Abbilungen feststellen. 20 1.3 Quadriken Satz Es seien A, . . . , F reelle Zahlen, wobei A, B, C nicht alle verschwinden. Die Gleichung Ax2 + 2Bxy + Cy2 + Dx + Ey + F = 0 beschreibt eine Ellipse, einen Kreis, einen Punkt oder die leere Menge, falls AC − B2 > 0 ist, eine Parabel, zwei Parallele, eine Gerade oder die leere Menge, falls AC − B2 = 0 ist, eine Hypberbel oder zwei sich schneidende Gerade, falls AC − B2 < 0 ist. Beweis Wir schreiben die definierende Gleichung als ( x,y) A B x + ( D, E) x + F = 0. B C y y (1 ) Nun verwenden wir die Hauptachsentransformation: Es gibt eine orthogonale Matrix P derart, dass ′ A 0 PT A B P , = 0 C′ B C wobei A′ , C′ die Eigenwerte der Matrix A B B C sind. Beachte, dass nicht beide gleich Null sind. Wählen wir P mit det P = 1, so ist P eine Rotationsmatrix cos θ − sin θ Rθ = sin θ cos θ für irgendeinen Winkel θ ∈ [0,2π ). Es gilt AC − B = A′ C′ , denn die Determinanten zweier kongruenter Matrizen gleich sind. Setzen wir ′ x x = Rθ ′ y y 21 1.3 Quadriken in (1) ein, so erhalten wir die Gleichung A′ ( x ′ )2 + C′ (y′ )2 + D ′ x ′ + E′ y′ + F = 0, (2 ) wobei ( D ′ , E′ ) = Rθ ( D,E) ist. Nun sei AC − B2 6= 0, so dass A′ C′ 6= 0 ist. Mit x ′′ = x ′ + D′ , 2A′ y′′ = y′ + E′ 2C′ wird (2) durch quadratische Ergänzung zu A′ ( x ′′ )2 + C′ (y′′ )2 + F′ = 0, wobei F′ = F − (3 ) ( D ′ )2 ( E ′ )2 − . 4A′ 4C′ Es sei AC − B2 > 0, so dass ohne Beschränkung der Allgemeinheit A′ , C′ > 0. Dann beschreibt (3) – den Kreis y a a −a x −a ( x ′′ )2 + (y′′ )2 = a2 mit a = √ − F′ /A′ , falls F′ < 0 und A′ = C′ , 22 1.3 Quadriken – die Ellipse y b a −a x −b ( x ′′ )2 (y′′ )2 + 2 =1 a2 b mit a = √ − F′ /A′ , b = √ − F′ /C′ , falls F′ < 0 und A′ 6= C′ , – den Punkt y x ( x ′′ , y′′ ) = (0,0), falls F′ = 0, – die leere Menge, falls F′ > 0. Es sei AC − B2 < 0, so dass A′ , C′ verschiedene Vorzeichen haben. Dann beschreibt (3) 23 1.3 Quadriken – die Hyperbel y x a −a (die Asymptoten sind b y′′ = ± x ′′ ) a ( x ′′ )2 (y′′ )2 − 2 =1 a2 b √ √ mit a = − F′ /A′ , b = F′ /C′ , falls A′ , F′ verschiedene Vorzeichen haben, – die Hyperbel y a x (die Asymptoten sind a y′′ = ± x ′′ ) b −a (y′′ )2 ( x ′′ )2 − 2 =1 a2 b √ √ mit a = − F′ /C′ , b = F′ /A′ , falls A′ , F′ das gleiche Vorzeichen haben, 24 1.3 Quadriken – die zwei Geraden y x y′′ = ± r − A′ ′′ x , C′ die sich im Nullpunkt schneiden, falls F′ = 0. Nun sei AC − B2 = 0, so dass A′ oder C′ verschwindet. Es sei A′ 6= 0, C′ = 0 (der andere Fall wird analog behandelt). Mit x ′′ = x ′ + D′ 2A′ wird (2) durch quadratische Ergänzung zu A′ ( x ′′ )2 + E′ y′ + F′ = 0, (4 ) wobei ( D ′ )2 . 4A′ Falls E′ = 0 ist, beschreibt die reduzierte Gleichung F′ = F − A′ ( x ′′ )2 + F′ = 0 25 1.3 Quadriken – die Gerade y x x ′′ = 0, falls F′ = 0, – die Parallelen y x ′′ x =± r − F′ , A′ falls A′ , F′ verschiedene Vorzeichen haben, – die leere Menge, falls A′ , F′ das gleiche Vorzeichen haben. Falls E′ 6= 0, wird Gleichung (4) mit y′′ = y′ + F′ E′ 26 1.3 zu Quadriken A′ ( x ′′ )2 + E′ y′′ = 0, und diese Gleichung beschreibt eine Parabel: y y x A′ E′ < 0 x A′ E′ > 0 Bemerkung Eine explizite Rechnung zeigt, dass der Rotationswinkel θ im letzten Beweis durch die Formel 2B 1 arctan , A 6= C, 2 A−C θ= π, A=C 4 gegeben ist. Beispiel Beschreiben Sie den durch die Formel 31x2 − 24xy + 21y2 + 4x + 6y = 25 gegebenen Kegelschnitt. Lösung Wir schreiben die Gleichung als ( x,y) 31 −12 x + (4, 6) x − 25 = 0. y −12 21 y 27 1.3 Quadriken Die Eigenwerte der symmetrischen Matrix 31 −12 M= −12 21 sind 39 und 13, und es gilt 1 3 , E39 = √ − 2 13 E13 = Folglich ist 1 2 √ . − 3 13 1 3 2 P= √ 13 −2 3 eine orthogonale Matrix derart, dass PT MP = diag (39,13). Es ist det P = 1, so dass P eine Rotationsmatrix Rθ ist, und aus 3 cos θ = √ , 13 folgt θ = − arctan 32 . Schreiben wir so ist d.h. 2 sin θ = − √ 13 ′ x x =P ′ , y y ( x ′ ,y′ ) PT 31 −12 P x ′ + (4, 6) P x ′ − 25 = 0, y′ y′ −12 21 denn 26 39( x ′ )2 + 13(y′ )2 + √ y′ − 25 = 0, 13 1 (4,6) P = √ (0, 26). 13 Duch quadratische Ergänzung erreichen wir nun 2 1 ′ 2 ′ − 26 = 0, 39( x ) + 13 y + √ 13 und mit 1 y′′ = y′ + √ 13 x ′′ = x, ergibt sich schließlich ( x ′′) 2 2 3 + (y′′ )2 = 1. 2 Es handelt sich also um eine Ellipse. 28 1.3 Quadriken y y y √ 2 x arctan 23 √ 1/ 13 x − 2/3 2/3 x √ − 2 Satz Es seien A eine symmetrische Matrix in R n×n \ {0}, b ∈ R n und c ∈ R. Die Quadrik {x ∈ R n : xT Ax + bT x + c = 0} lässt sich nach einem durch eine Bewegung bestimmten Koordinatenwechsel durch eine der Gleichungen r (i) ∑ j =1 (ii) r ∑ j =1 r (iii) ∑ j =1 yj ρj !2 yj ρj !2 yj ρj r+s − ∑ j =r +1 r+s − !2 ∑ j =r +1 r+s − ∑ j =r +1 yj ρj !2 = 0 mit 0 < r, 0 ≤ s ≤ r, yj ρj !2 − 1 = 0 mit 0 ≤ r, 0 ≤ s, 0 < r + s, yj ρj !2 − yr+s+1 = 0 mit 0 < r, 0 ≤ s ≤ r, wobei ρ1 , . . . , ρr+s positive Zahlen sind, beschrieben. 29 1.3 Quadriken Beweis Es sei P eine orthorgonale Matrix mit der Eigenschaft, dass P T AP = D := diag (λ1 , . . . , λn ), wobei die Eigenwerte λ1 , . . . , λn von A so nummiert werden, dass λ1 , . . . , λr > 0, λr+1 , . . . λr+s < 0 und λr+s+1 , . . . , λn = 0. Nach der Hauptachsentransformation x = Px′ wird die Quadrik durch die Gleichung r+s n j =1 j =1 ∑ λ j (x′j )2 + ∑ b′j x′j + c = 0 beschrieben. Nach der Translation x ′′ = x ′j + bj , 2λ j x ′′ = x ′j , j = 1, . . . ,r + s, j = r + s + 1, . . . ,n, wird die Quadrik durch die Gleichung r+s ∑ j =1 λ j ( x ′′j )2 n + ∑ j =r + s+1 b′j x ′′j + c′ = 0 beschrieben. Ist b′j = 0 für j = r + s + 1, . . . , n und c′ = 0, so ist die Gleichung in der Form (i). (Ohne Beschränkung der Allgemeinheit können wir s ≤ r annhemen, denn ansonsten multiplizieren wir mit −1 und nummerieren die Variablen um.) Ist b′j = 0 für j = r + s + 1, . . . , n und c′ 6= 0, so können wir annnehmen, dass c′ < 0 ist (ansonsten multiplizieren wir mit −1 und nummerieren die Variablen um). Dividieren wir durch |c|, so haben wir die Form (ii) erreicht. Schließlich sei b0′ := (br′ +s+1 , . . . ,bn′ )T 6= 0. Ohne Beschränkung der Allgemeinheit können wir |b0′ | = 1 annehmen (ansonsten dividieren wir die Gleichung durch |b0′ |). Ebenfalls können wir s ≤ r annhemen, denn ansonsten multiplizieren wir mit −1 und nummerieren die Variablen um. Es sei Q0 eine orthogonale Matrix in R (n−r−s)×(n−r−s), deren erste Spalte −b0′ ist, sodass (b0′ )T Q0 = −e1 . Definiere Ir+s 0 0 ′ . Q := , b = 0 Q0 b0′ 30 1.3 Quadriken Dann ist Q eine orthogonale Matrix in R n×n mit (b′ )T Q = −er+s+1 und QT DQ = D. Der Koordinatenwechsel x′′ = Qx′′′ transformiert die Gleichung (x′′ )T Dx′′ + (b′ )T x′′ + c′ = 0 in (x′′′ )T Dx′′′ + (b′ )T Qx′′′ + c = 0, d.h. r+s ∑ λ j (x′′′j )2 − xr′′′+s+1 + c′ = 0 j =1 Wir erreichen die Form (iii) mit der Translation ′′′ ′ xr′′′′ + s +1 = xr + s +1 + c , ′′′ x ′′′′ j = xj , j 6= r + s + 1. Bemerkung Die Normalformen für dreimensionale Quadriken sind: der Nullpunkt z y x x 2 y 2 z2 + 2 + 2 = 0, a2 b c 31 1.3 Quadriken der elliptische Kegel z y x x 2 y2 z2 + = , a2 b2 c2 die Gerade z y x x 2 y2 + 2 =0 a2 b (die z-Achse), die zwei sich schneidenden Ebenen y x z y2 x2 = 2 a2 b ({y = ba x } und {y = − ba x }), 32 1.3 Quadriken die Ebene x y z x2 =0 a2 ({ x = 0}), das Ellipsoid z y x x 2 y 2 z2 + 2 + 2 = 1, a2 b c das einschalige Hyperboloid z y x x 2 y 2 z2 + 2 − 2 = 1, a2 b c 33 1.3 Quadriken der elliptische Zylinder z y x x 2 y2 + 2 = 1, a2 b das zweischalige Hyperboloid z y x x 2 y 2 z2 − 2 − 2 = 1, a2 b c der hyperbolische Zylinder z y x x 2 y2 − 2 = 1, a2 b 34 1.3 Quadriken die zwei parellelen Ebenen x z y x2 =1 a2 ({ x = a} und { x = − a}), die leere Menge − x 2 y 2 z2 − 2 − 2 = 1, a2 b c die leere Menge − x 2 y2 − 2 = 1, a2 b die leere Menge − x2 = 1, a2 das elliptische Paraboloid z y x x 2 y2 + 2 = z, a2 b 35 1.3 Quadriken das hyperbolische Paraboloid z y x x 2 y2 − 2 = z, a2 b der parabolische Zylinder z y x x2 = y. a2 Beispiel Beschreiben Sie den durch die Formel 4x2 + 9y2 + 5z2 − 4xy + 8yz + 12xz + 9z = 3 gegebenen Kegelschnitt. Lösung Wir schreiben die Gleichung als ( x,y,z) 4 −2 −2 9 6 4 6 x + (0,0,9) x − 3 = 0. y 4 y 5 z z 36 1.3 Die Eigenwerte der symmetrischen Matrix 4 −2 M = −2 9 6 4 sind 9, 12 und −3, und es gilt * + * + 2 1 1 1 −2 2 E9 = , E12 = , 3 3 1 2 Folglich ist Quadriken 6 4 5 * + −2 1 −1 E− 3 = , 3 2 2 1 −2 1 P = −2 2 −1 3 1 2 2 eine orthogonale Matrix derart, dass PT MP = diag (9,12, − 3). Es ist det P = 1, so dass P ∈ SO (3,R ). Schreiben wir so ist d.h. ′ x x y = P y′ , z′ z (1 ) ( x ′ ,y′ , z′ ) PT 4 −2 6 P x ′ + (0,0,9) P x ′ − 3 = 0, −2 9 4 y ′ y′ z′ z 6 4 5 3( x ′ )2 + 4(y′ )2 − (z′ )2 + x ′ + 2y′ + 2z′ − 1 = 0 (nach Teilen durch 3). Duch quadratische Ergänzung erreichen wir nun 1 3 x + 6 ′ 2 1 +4 y + 4 und mit 1 x ′′ = x + , 6 ergibt sich schließlich 2 ( x ′′) 1 9 ′ 2 − z′ − 1 1 y′′ = y′ + , 4 + (y′′ )2 1 12 − (z′′ )2 1 3 2 − 1 = 0, 3 z′′ = z′ − 1 (2 ) = 1. Es handelt sich also um einschaliges Hyperboloid. 37 1.4 Bilinearformen und der Dualraum Die Transformation (1) ist eine Drehung. Da der Eigenraum von P zum Eigenwert 1 das Erzeugnis von −1 1 e1 = √ 1 3 1 ist, ist die Drehachse in Richtung e1 . Die Matrixdarstellung von P bezüglich der Orthonormalbasis {e1 , e2 , e3 } für R3 mit −1 1 1 1 e2 = √ 1 1 , e3 = √ 6 −2 2 0 ist 1 0 √0 3 0 21√ 2 , 0 − 23 12 so dass der Drehwinkel θ = − π4 ist. e1 θ e3 e2 Die Transformation (2) ist eine Translation. 1.4 Bilinearformen und der Dualraum Es seien V ein Vektorraum über einem Körper K und b eine Bilinear form auf V. Für jedes feste v ∈ V ist b(v,·) eine lineare Abbildung V → K, d.h. Element im Dualraum V ′ . 38 1.4 Bilinearformen und der Dualraum Folglich definiert die Formel v 7→ b(v,·) eine Abbildung Lb : V → V ′ (so dass b(v,w) = Lb (v)(w) für alle v, w ∈ V) und sie ist linear, denn Lb (α1 v1 + α2 v2 ) = b(α1 v1 + α2 v2 ,·) = α1 b(v1 ,·) + α2 b(v2 ,·) = α 1 L b ( v 1 ) + α 2 L b ( v 2 ). Ist T dagegen eine lineare Abbildung V → V ′ , so definiert die Formel b(v,w) = T (v)(w) eine Bilinearform auf V mit der Eigenschaft, dass Lb = T. Somit ist b 7→ Lb eine Bijektion von der Menge der Bilinearformen auf V nach der Menge der Abbildungen V → V ′ . Für jedes feste w ∈ V ist b(·,w) eine lineare Abbildung V → K, d.h. Element im Dualraum V ′ . Folglich definiert die Formel w 7→ b(·,w) eine lineare Abbildung Rb : V → V ′ (so dass b(v,w) = Rb (w)(v) für alle v, w ∈ V). Ist T dagegen eine lineare Abbildung V → V ′ , so definiert die Formel b(v,w) = T (w)(v) eine Bilinearform auf V mit der Eigenschaft, dass Rb = T. Somit ist b 7→ Rb eine Bijektion von der Menge der Bilinearformen auf V nach der Menge der Abbildungen V → V ′ . Proposition Es seien V ein Vektorraum über einem Körper K und b eine Bilinearform auf V. 1. b ist genau dann nicht ausgeartet, falls Lb : V → V ′ injektiv ist. 2. b ist genau dann nicht ausgeartet, falls Rb : V → V ′ injektiv ist. 39 1.4 Bilinearformen und der Dualraum Beweis 1. Beachte, dass b(v,w) = 0 für alle w ∈ V | {z } Lb (v)(w) ⇒ v=0 (‘b ist nicht ausgeartet’) dieselbe Aussage wie Lb (v ) = 0 ist. ⇒ v=0 (‘Lb ist injektiv’) 2. Diese Aussage wird in ähnlicher Weise bewiesen. Bemerkung Ist V endlichdimensional, so sind Lb und Rb genau dann injektiv, wenn sie bijektiv sind. Somit gilt V ′ = {b(·,w) : w ∈ V } = {b(v,·) : v ∈ V } für einen endlichdimensionalen Vektorraum V mit einer nicht ausgearteten Bilinearform b. Ist b symmetrisch und positiv definit (sodass b ein Skalarprodukt für V ist), heißt dieses Ergebnis der Rieszsche Darstellungssatz. Nun seien V ein endlichdimensionaler Vektorraum über einem Körper K, b eine nicht ausgeartete Bilinearform auf V und T : V → V eine lineare Abbildung. Somit definiert die Formel B(v,w) = b(Tv,w) eine weitere Bilinearform auf V. Das nächste Lemma besagt, dass alle Bilinearformen auf V so erzeugt werden können. Lemma Es seien V ein endlichdimensionaler Vektorraum über einem Körper K und b eine nicht ausgeartete Bilinearform auf V. Nun sei B eine weitere Bilinearform auf V. Dann gibt es eine lineare Abbildung T : V → V derart, dass B(v,w) = b(Tv,w). Ferner ist B genau dann nicht ausgeartet, wenn T bijektiv ist. 40 1.4 Bilinearformen und der Dualraum Beweis 1 Setze T = L− b L B . Dann ist 1 b(Tv,w) = Lb (Tv)(w) = Lb L− b L B (v)(w) = L B (v)(w) = B(v,w). Nun ist T : V → V genau dann bijektiv, wenn LB bijektiv ist, also wenn B nicht ausgeartet ist. Bemerkung Ebenfalls können wir zeigen, dass alle Bilinearformen auf V die Gestalt B(v,w) = b(v,Tw) 1 haben. (Es gilt T = R− b R B .) Lemma Es seien V ein endlichdimensionaler Vektorraum über einem Körper K und b eine Bilinearform auf V. Ferner sei B = {e1 , . . . ,en } eine Basis für V mit Dualbasis B ′ = { f 1 , . . . , f n } für V ′ (sodass f i (e j ) = δij ist). Dann ist M B ( b ) = M B , B ′ ( R b ). Beweis Es sei MB,B ′ ( Rb ) = (mij )i,j=1,...,n , so dass Rb (e j ) = m1j f 1 + m2j f 2 + · · · + mnj f n , j = ,1, . . . , n. Folglich ist mij = Rb (e j )(ei ), i,j = 1, . . . ,n. Auf der anderen Seite ist Rb (e j ) = b(·,e j ), 41 1.4 Bilinearformen und der Dualraum sodass Rb (e j )(ei ) = b(ei ,e j ). Somit ist mij = b(ei ,e j ), i,j = 1, . . . ,n. Korollar Es seien V ein endlichdimensionaler Vektorraum über einem Körper K und b eine Bilinearform auf V. Dann ist b genau dann nicht ausgeartet, wenn sie eine invertierbare Gram-Matrix hat. Bemerkung Dass die Formel und nicht MB ( b ) = MB , B ′ ( R b ) MB ( b ) = MB , B ′ ( L b ) lautet, liegt daran, dass wir die Definition b(v,w) = vT MB (b)w und nicht verwenden. b(v,w) = ( MB (b)v)T w Beispiel Es seien V ein endlichdimensionaler Vektorraum über einem Körper K, b eine nichtdegenerierte Bilinearform auf V und B eine weitere Bilinearform auf V. Ferner sei B eine Basis für V. Dann gilt B(v,w) = b(v,Tw), wobei ist. MB , B ( T ) = MB ( b ) − 1 MB ( B ) 42 1.4 Bilinearformen und der Dualraum Bemerkung Es seien X und Y Vektorräume über einem Körper K. Wir erinnern uns an die folgenden Definitionen. Die duale Abbildung T ′ : Y ′ → X ′ zu einer linearen Abbildung T : X → Y ist durch die Formel T′( f ) = f ◦ T definiert. Die kanonische Einbettung i X : X → X ′′ ist durch die Formel i X (v)( f ) = f (v) definierte lineare Abbildung. Sie ist ein Isomorphismus, falls X endlichdimensional ist. Lemma Es seien V ein endlichdimensionaler Vektorraum über einem Körper K und b eine Bilinearform auf V. Dann ist L′b = Rb ◦ i −1 , R′b = Lb ◦ i −1 . Beweis Die duale Abbildung L′b : V ′′ → V ′ zu Lb : V → V ′ ist durch die Formel L′b (i (v)) = i (v) ◦ Lb definiert. Für alle v, w ∈ V gilt also L′b (i (v))(w) = i (v) Lb w = i (v)b(w,·) = b(w,v) = Rb (v)(w), d.h. für alle v ∈ V, d.h. L′b (i (v)) = Rb (v) L′b ◦ i = Rb . Die andere Gleichung wird in ähnlicher Weise bewiesen. 43 2 Polynome von linearen Abbildungen 2 Polynome von linearen Abbildungen 2.1 Einführung Zunächst fassen wir einige Ergebnisse über Polynome zusammen, die in weiterführenden Vorlesungen über Algebra bewiesen werden. Lemma (Divisionslemma) Es seien f , g Polynome mit Koeffizienten aus einem Körper K und g 6= 0. Dann gibt es eindeutig bestimmte Polynome q, r mit Koeffizienten aus K so, dass f = qg + r, wobei entweder r = 0 oder deg r < deg g ist. Definition Ein nichtkonstantes Polynom p mit Koeffizienten aus einem Körper K heißt irreduzibel, falls es nur durch sich selbst und die konstanten Polynome teilbar ist. Beispiel Das Polynom x2 + 1 ist irreduzibel über R aber nicht über C, denn x2 + 1 = ( x + i)( x − i). Satz Es sei f ein monisches Polynom (d.h. ein Polynom mit Leitkoeffizient 1) mit Koeffizienten aus einem Körper K. Dann gibt es eine eindeutige Zerlegung f = p1e1 · · · pemm von f in ein Produkt von Potenzen verschiedener irreduzibler monischer Polynome. 44 2.1 Einführung Beispiel Die Zerlegungen des Polynoms x4 − x2 − 2 ind ( x2 − 2)( x2 + 1) in Q, √ √ ( x − 2)( x + 2)( x2 + 1) in R, √ √ ( x + 2)( x − 2)( x + i)( x − i) in C. Lemma Es seien m ≥ 2 und p1 , . . . , pm nichttriviale Polynome mit Koeffizienten aus einem Körper K, die keine gemeinsamen Faktoren außer Konstanten haben. Dann gibt es Polynome a1 , . . . , am derart, dass a1 p1 + · · · + am pm = 1. Beweis Es sei S= ( m ∑ fi pi : f1 , . . . , f m sind Polynome i =1 ) . Diese Menge ist nichtleer, denn p1 , . . . , pm ∈ S. Wenden wir das Wohnordnungsaxiom der natürlichen Zahlen auf die Menge {deg s : s ∈ S \ {0}} an, so finden wir ein nichttriviales Polynom m p= ∑ gi p i ∈ S i =1 mit der Eigenschaft deg p ≤ deg s für alle s ∈ S. Nun zeigen wir, dass p| pi für i = 1, . . . , m. Eine Anwendung des Divisionslemmas ergibt Polynome qi , ri mit pi = pqi + ri und ri = 0 oder deg ri < deg p. Im zweiten Fall ist aber ri = pi − sqi ∈ S, 45 2.1 Einführung denn S ist abgeschlossen bezüglich Addition sowie bezüglich Multiplikation mit einem beliebegen Polynom, und dies widerspricht der Definition von p. Folglich ist ri = 0. Da p1 , . . . , pm keine gemeinsamen Faktoren außer Konstanten haben, ist p ein konstantes Polynom. Somit gilt a1 p 1 + · · · + a m p m = 1 mit ai = gi /p. Nun seien V ein Vektorraum über einem Körper K und T : V → V eine lineare Abbildung. Definition Es sei p( x ) = a0 + a1 x + a2 x2 + · · · + an x n ein Polynom mit Koeffizienten in K. Dann bezeichnet p(T ) die lineare Abbildung a0 I + a1 T + a2 T 2 · · · + an T n : V → V, wobei T n = |T ◦ ·{z · · ◦ T} . n mal Bemerkungen 1. Für je zwei Polynome p1 , p2 mit Koeffizienten in K gilt ( p1 + p2 )(T ) = p1 (T ) + p2 (T ), ( p1 p2 )(T ) = p1 (T ) p2 (T ) und folglich p 1 ( T ) + p 2 ( T ) = p 2 ( T ) + p 1 ( T ), p 1 ( T ) p 2 ( T ) = p 2 ( T ) p 1 ( T ). 2. Dieselben Definitionen gelten für Matrizen. 3. Ist V endlichdimensional und A eine Darstellungsmatrix von T bezüglich einer Basis B für V, so ist p( A) die Darstellungsmatrix für p(T ) bezüglich B. 46 2.2 Annulierende Polynome 2.2 Annulierende Polynome In diesem Abschnitt seien V ein endlichdimensionaler Vektorraum über einem Körper K und T : V → V eine lieare Abbildung. Definition Ein annulierendes Polynom von T ist ein nichtriviales Polynom f derart, dass f (T ) = 0 ist, d.h. f (T )v = 0 für alle v ∈ V. Proposition Es existiert ein annulierendes Polynom von T. Beweis Es sei n = dim V. Da dim Hom(V,V ) = n2 ist, sind I, T, T 2 , . . . , T n 2 linear abhängig. Es existieren also Skalare α0 , . . . , αn2 , die nicht alle verschwinden, mit der Eigenschaft 2 Foglich ist α0 I + α1 T + α2 T 2 + · · · + αn2 T n = 0. f ( x ) = α0 + α1 x + · · · + α n2 x n 2 ein annulierendes Polynom von T. Definition Ein annulierendes monisches Polynom kleinsten Grades von T heißt Minimalpolynom von T. Proposition Es seien m ein Minimalpolynom und p ein annulierendes Polynom von T. Dann gilt m| p. Insbesondere ist m eindeutig. 47 2.2 Annulierende Polynome Beweis Es gibt Polynome q und r derart, dass p( x ) = q( x )m ( x ) + r ( x ) und r = 0 or deg r < deg m. Im zweiten Fall ist aber r (T ) = p(T ) − m(T )q(T ) = 0, sodass r ein annulierendes Polynom von T ist. Dies ist aber ein Widerspruch. Beispiel Es sei A= a11 a12 a21 a22 Eine explizite Rechnung zeigt, dass ∈ K 2× 2 . A2 − (a11 + a22 ) A + (a11 a22 − a12 a21 ) I2 = 0. Somit ist p( x ) = x2 − (a11 + a22 ) x + a11 a22 − a12 a21 ein annulierendes Polynom von A. Da das Minimalpolynom von A ein Faktor von p ist, ist deg m gleich 1 oder 2. deg m = 1 genau dann, wenn m( x ) = x − c für irgendein c ∈ K, also genau dann wenn A − cI2 = 0, d.h. A ist ein Vielfaches der Identitätsmatrix. In allen anderen Fällen ist m = p. Die Minimalpolynome der Matrizen 3 0 3 0 , , 0 −3 0 3 1 2 −1 3 sind folglich x − 3, x2 − 9 und x2 − 4x + 5. 48 2.2 Annulierende Polynome Lemma Es sei T diagonalisierbar, so dass V= m M i =1 ker(T − λi I ), wobei λ1 , . . . , λm die verschiedenen Eigenwerte von T sind. Dann ist m m ( x ) = ∏ ( x − λi ) i =1 das Minimalpolynom von T. Beweis Es sei {v1 , . . . ,vn } eine Basis für V aus Eigenvektoren von T. Es sei λi j der Eigenwert zum Eigenvektor v j . Dann gilt m(T )v j = ∏ (T − λi )(T − λi j I )v j = 0, j = 1, . . . ,n. i 6 =i j Folgich ist m(T ) = 0, sodass das Minimalpolynom von T ein Faktor von m ist. Auf der anderen Seite ist jedes Polynom m j ( T ) = ∏ ( x − λ j ), i 6= j das aus m durch Streichen eines linearen Faktors entsteht, kein annulierendes Polynom. Es sei nämlich w j ein Eigenvektor zum Eigenwert λ j . Dann ist m j (T )w j = ∏(T − λi I )w j = ∏(λ j − λi )w j 6= 0. i 6= j i 6= j Somit ist m das Minimalpolynom von T. Beispiel Die reelle Matrix 3 2 4 M = 2 0 2 4 2 3 hat Eigenwerte −1 und 8 und ist diagonalisierbar. Folglich ist ihr Minimalpolynom ( x + 1)( x − 8). 49 2.2 Annulierende Polynome Nun besprechen wir die Beziehung zwischen dem Minimalpolynom und dem charakteristischen Polynom von T. Bemerkung Das charakteristische Polynom c von T ist laut seiner Definition als c( x ) = det( A − xIn ), wobei A eine Darstellungsmatrix für T und n = dim V ist, nicht zwangsläufig monisch (seine Leitkoeffizient ist (−1)n . Ändern wir die Definition in c( x ) = det( xIn − A), so bleiben alle Eigenschaften von c erhalten, es ist aber nun monisch. Insbesondere gibt es eine eindeutige Zerlegung c = p1e1 · · · pemm von c in ein Produkt von Potenzen verschiedener irreduzibler monischer Polynome. Definition Ein Körper K heißt Zerfallungskörper für ein nichtkonstantes Polynom p mit Koeffizienten in K, falls p in (nicht notwendigerweise verschiedene) einfache Faktoren zerfällt. Beispiele 1. Dem Fundamentalsatz der Algebra zufolge ist C ein Zerfallungskörper für alle nichtkonstanten Polynome. 2. Die letzte Aussage gilt nicht für R, denn R ist kein Zerfallungskörper für x2 + 1. 3. R ist ein Zerfallungskörper für ( x2 − 2)2 , denn √ √ ( x 2 − 2 )2 = ( x − 2 )2 ( x + 2 )2 . Q ist jedoch kein Zerfallungskörper für dieses Polynom. 50 2.2 Annulierende Polynome Lemma Es sei K ein Zerfallungskörper für das charakteristische Polynome c von T. Dann ist c ist ein annulierendes Polynom von T, d.h. c(T ) = 0. Beweis Siehe Aufgabe 2, Übungsblatt 4. Bemerkung Das letzte Lemma ist äquivalent zur Aussage m|c, wobei m und c das Minimalpolynom bzw. das charakteristische Polynom von T ist. Korollar Es sei m das Minimalpolynom von T. Dann gilt deg m ≤ dim V. Beweis Aus m|c folgt deg m ≤ deg c = dim V. Lemma Es seien m und c das Minimalpolynom bzw. das charakteristische Polynom von T. Dann ist ( x − λ) genau dann Faktor von m , wenn ( x − λ) Faktor von c ist. Beweis Es sei ( x − λ)|c( x ). Dann ist λ ein Eigenwert von T. Es sei w ein entsprechender Eigenvektor, so dass der Unterraum W = hwi von V invariant unter T ist (es gilt T [W ] = W). 51 2.2 Annulierende Polynome Das Minimalpolynom von T |W ist offensichtlich ( x − λ). Auf der anderen Seite ist m ein annulierendes Polynom für T |W . Somit gilt ( x − λ)|m( x ). Nun sei ( x − λ)|m( x ). Dann existiert ein Polynom q mit deg q < deg m derart, dass m( x ) = ( x − λ)q( x ). Beachte, dass q(T ) kein annulierendes Polynom ist. Somit gibt es v ∈ V mit q(T )v 6= 0. Es ist aber 0 = m(T )v = (T − λI )q(T )v, so dass q(T ) ein Eigenvektor von T mit Eigenwert λ ist. Folglich gilt ( x − λ)|c( x ). Satz (Satz von Cayley und Hamilton) Es seien m und c das Minimalpolynom bzw. das charakteristische Polynom von T. Ferner sei K ein Zerfallungskörper für m und c. Dann gibt es eindeutige Skalare λ1 , . . . , λm und natürliche Zahlen e1 , f 1 , . . . em , f m derart, dass m m ( x ) = ∏ ( x − λi ) e i , i =1 m c ( x ) = ∏ ( x − λi ) f i , i =1 wobei f i ≥ ei , i = 1, . . . , m. Beispiel Finden Sie das Minimalpolynom und das charakteristische Polynom der komplexen Matrix 5 3 1 A = −1 1 −1 . 2 6 6 Lösung Da charakteristische Polynom von A ist x − 5 −3 −1 det( xI3 − A) = det 1 x − 1 1 = ( x − 4)3 . −2 −6 x − 6 52 2.3 Primärzerlegung und die Jordansche Normalform Folglich ist das Minimalpolynom von A das annulierendes Polynom von A kleinsten Grades aus der Liste (i) ( x − 4), (ii) ( x − 4)2 , (iii) ( x − 4)3 . Es ist nun 1 3 1 0 0 0 ( A − 4I ) = −1 −3 −1 6= 0 0 0 , 2 6 2 0 0 0 so dass ( x − 4) kein annulierendes Polynom ist, aber 1 3 1 1 3 1 0 0 0 ( A − 4I )2 = −1 −3 −1 −1 −3 −1 = 0 0 0 . 2 6 2 2 6 2 0 0 0 Folglich ist ( x − 4)2 das Minimalpolynom von A. 2.3 Primärzerlegung und die Jordansche Normalform Um das Hauptergebnis dieses Abschnitts zu formulieren, brauchen wir nun zwei Hilfsergebnisse. Proposition Es sei V ein Vektorraum über einem Körper K und E1 , . . . , Em : V → V nichttriviale lineare Abbildungen mit den Eigenschaften (i) E1 + · · · + Em = I, (ii) Ei E j = E j Ei = 0 für i 6= j. Dann gilt Ei2 = Ei , so dass Ei eine Projektion ist, und ferner ist V = Im E1 ⊕ · · · ⊕ Im Em . Gilt dagegen die Zerlegung V = V1 ⊕ · · · ⊕ Vm , 53 2.3 Primärzerlegung und die Jordansche Normalform so definiert Ei v = vi , i = 1, . . . ,m, fúr v = v1 + · · · + v m , vi ∈ Vi , Projektionen mit den Eigenschaften (i), (ii). Proposition Es seien V ein Vektorraum über einem Körper K, T : V → V eine lineare Abbildung und f ein Polynom mit Koeffizienten aus K. Dann ist der Unterraum ker f (T ) von V invariant unter T. Nun seien V wieder ein endlichdimensionaler Vektorraum über einem Körper K und T : V → V eine lieare Abbildung. Satz (Primärzerlegungssatz) Es seien m das Minimalpolynom von T und e m = p11 · · · pemm seine Zerlegung in ein Produkt von Potenzen verschiedener irreduzibler monischer Polynome. Dann ist V= m M ker pi (T )ei i =1 e und das Minimalpolynom mi von Ti := T |ker pi (T )ei ist pi i . Beweis Für m = 1 ist V offensichtlich gleich ker p1 (T )e1 . Es sei also m ≥ 2. Definiere qi ( x ) = ∏ p j ( x ) e j , i = 1, . . . ,m. j 6 =i Dann sind q1 , . . . , qm Polynome mit keinem gemeinsamen Faktor. Es gibt also Polynome a1 , . . . , am derart, dass q1 ( x )a1 ( x ) + · · · + qm ( x )am ( x ) = 1. Setze Ei = qi (T )ai (T ). 54 2.3 Primärzerlegung und die Jordansche Normalform Es gilt E1 + · · · + Em = I. Für i 6= j gilt Ei E j = qi (T )ai (T )q j (T )a j (T ) = ai (T )a j (T )qi (T )q j (T ) = 0, denn m|qi q j , so dass qi q j ein annulierendes Polynom von T ist. Nun sei Ei = 0 für irgendein i. Dann gilt ∑ Ej = I, j 6 =i sodass V = ∑ E j [V ], j 6 =i und qi (T )[V ] = ∑ qi (T )E j [V ] = ∑ a j (T )qi (T )q j (T )[V ] = 0. j 6 =i j 6 =i Somit ist qi ein annulierendes Polynom von T. Dies ist aber ein Widerspruch, denn deg qi < deg m. Folglich ist Ei eine Projektion und V= m M Im Ei . i =1 Wir bemerken, dass Im Ei invariant unter T ist, denn Im Ei = ker( I − Ei ) = ker( I − qi (T )ai (T )). Nun zeigen wir, dass Im Ei = ker pi (T )ei ist. Es gilt pi (T )ei Ei v = pi (T )ei qi (T )ai (T )v = mi (T )ai (T )v = 0 für alle v ∈ V, so dass Im Vi ⊆ ker pi (T )ei . Nun sei v ∈ ker pi (T )ei . Es seien v1 , . . . , vm ∈ V so, dass v = E1 v1 + · · · + Em vm und 0 = pi (T )ei v = pi (T )ei E1 v1 + · · · + pi (T )ei Em vm | | {z } {z } ∈ Im E1 ∈ Im Em 55 2.3 Primärzerlegung und die Jordansche Normalform (Im E1 , . . . , Im Em sind invariant unter T und somit auch unter pi (T )ei ). Folglich ist pi (T )ei E1 v1 = 0, . . . pi (T )ei Em vm = 0. Für j 6= i gilt also pi (T )ei E j v j = 0, e p j (T )e j E j v j = 0. ej Da pi i , p j Polynome mit keinem gemeinsamen Faktor sind, gibt es Polynome bi , b j derart, dass bi ( x ) pi ( x )ei + b j ( x ) p j ( x )e j = 1 und daher bi (T ) pi (T )ei + b j (T ) p j (T )e j = I. Insbesondere ist E j v j = bi (T ) pi (T )ei E j v j + b j (T ) p j (T )e j E j v j = 0, sodass v = Ei vi ∈ Im Ei . e e Schließlich ist pi i offensichtlich ein annulierendes Polynom von Ti , sodass mi | pi i . Auf der anderen Seite ist mi qi ein annulierendes Polynom für T, so dass m|mi qi . Da ej e m = p11 . . . pemm , qi = ∏ p j , e impliziert dies aber pi i |mi . j 6 =i 56