Kapitel 8 Polynome und Eigenwerte 8.1 Die Polynomalgebra Wir bereits erklärt, was Polynome sind, nämlich Ausdrücke der Form Pn haben i a x , wobei die ai Elemente aus P einem Körper sind (siehe Beispiel 3.1.2 i=0 i (3.)). Manchmal schreiben wir auch i ai xi , wobei das stets bedeuten soll, dass nur für endlich viele i gilt ai 6= 0. Die Menge der Polynome X ai xi : ai ∈ K} K[x] := { i ist ein (unendlichdimensionaler) Vektorraum. Wir haben in 3.1.2 bereits erklärt, was der Grad eines Polynoms f ist (das maximale i so, dass ai 6= 0 gilt, sofern f 6= 0). Der Grad Polynoms wird deg f bezeichnet. Wir P eines i nennen ein Polynom f = i ai x vom Grad n monisch, wenn an = 1. Das Nullpolynom bezeichnen wir mit 0. Die Polynome xn heißen Monome. Wir definieren auf K[x] jetzt eine Multiplikation wie folgt: ( X i i ai x ) · ( X i i XX bi x ) = ( aj bi−j )xi . i i j=0 Insbesondere gilt xn · xm = xn+m . Satz 8.1.1 (K[x], +, ·, 0, x0 ) ist ein kommutativer Ring mit multiplikativ neutralem Element x0 . 100 (8.1) Beweis Wir wissen bereits, dass K[x] ein Vektorraum ist. Die Addition, die wir hier benutzen, ist dieselbe Addition wie im Vektorraum, also ist (K[x], +) sicherlich eine abelsche Gruppe. Wir müssen noch zeigen: • Multiplikation ist kommutativ. • Assoziativgesetz. • Distributivgesetz. • Neutrales Element x0 . Beginnen wir mit der Kommutativität: P P P P P P ( i ai xi )( i bi xi ) = i ( ij=0 aj bi−j )xi = i ( ij=0 ai−j bj )xi = P P P P = i ( ij=0 bj ai−j )xi = ( i bi xi )( i ai xi ). Es genügt jetzt also, nur ein Distributivgesetz zu zeigen, also z.B. (f + g)h = f h + gh: ( X i ai xi + X i bi xi ) · X i ci xi = X i (ai + bi )xi · X ci xi i i XX = ( ((aj + bj )ci−j )xi i j=0 i i XX X = ( aj ci−j + bj ci−j )xi i = ( X i j=0 ai xi · X i j=0 ci xi ) + ( X i bi xi · X ci xi ) i Wegen der Gültigkeit des Distributivgesetzes für alle Polynome ai xi genügt es nun, die Assoziativität und das multiplikativ neutrale Element x0 nur für diese Polynome nachzuweisen (wegen des Distributivgesetzes kann das sofort auf beliebige Polynome, die ja Summen der ai xi sind, ausgeweitet werden). Wir erhalten (an xn · bm xm ) · cp xp = (an bm xn+m ) · cp xp = (an bm )cp x(n+m)+p = = an (bm cp )xn+(m+p) = an xn · (bm xm · cp xp ) 101 sowie an xn · x0 = an xn+0 = an xn . Wir wollen einige Eigenschaften von Polynomen zusammenfassen, die sicherlich nicht sehr überraschend sind: Lemma 8.1.2 Seien f, g ∈ K[x]. Dann gilt: (a) f, g 6= 0 ⇒ f · g 6= 0. (b) deg(f · g) = deg f + deg g. (c) f, g monisch (d) deg(f · g) = 1 (e) f + g 6= 0 ⇒ ⇔ f · g monisch. deg f = 1 und deg g = 1. ⇒ P deg(f + g) ≤ max(deg f, deg g). P Beweis Sei f = i ai xi vom Grad m und g = i bi xi vom Grad n. Dann ist der Koeffizient von xm+n+k in f g mit k > 0 sicherlich 0 nach Definition der Multiplikation, und der Koeffizient von xn+m ist am bn . Das zeigt (a), (b), (c) und (d). Aussage (e) ist offensichtlich (beim Addieren kann der Grad nicht größer werden). Als Korollar von Teil (a) dieses Lemmas halten wir explizit fest: Korollar 8.1.3 Gilt f g = f h in K[x] und f 6= 0, so muss g = h gelten. Beweis 0 = f (g − h) und f 6= 0 impliziert (Lemma 8.1.2 (a)) g − h = 0, also g = h. Definition 8.1.4 Sei V ein K-Vektorraum. Die Vektoraddition sei mit “+” bezeichnet. Ferner gebe es auf V eine Multiplikation “·” so, dass (V, +, ·) ein Ring ist. Wenn zusätzlich für alle v1 , v2 ∈ V und alle λ ∈ K gilt v1 · (v2 λ) = (v1 λ) · v2 = (v1 · v2 )λ so nennt man V eine K-Algebra A. Wir nennen die Algebra kommutativ, wenn die Ringmultiplikation kommutativ ist. Wenn es in dem Ring V ein multiplikativ neutrales Element gibt, sagen wir, A ist eine Algebra mit 1. 102 Beispiel 8.1.5 (1.) Jeder Körper ist ein Vektorraum über sich selber. Wenn man die Multiplikation in dem Körper als die Ringmultiplikation “·” in Definition 8.1.4 wählt, so wird K zu einer kommutativen K-Algebra mit 1. (2.) Die Menge {x + 0 i : x ∈ R} ⊆ C ist der Körper der reellen Zahlen, eingebettet in C. Nun ist C ein zweidimensionaler R-Vektorraum. Mit der Multiplikation in C als Ringmultiplikation wird C zu einer kommutativen R-Algebra mit 1. (3.) Der Endomorphismenring End(V ) sowie der Matrizenring K(n,n) sind nicht kommutative K-Algebren mit neutralem Element. (4.) K[x] ist eine kommutative K-Algebra mit 1. Definition 8.1.6 Seien V und V ′ zwei K-Vektorräume, auf denen auch jeweils eine Multiplikation · (auf V ) und ·′ (auf V ′ ) definiert sind. Wir nehmen an, dass V und V ′ dadurch zu Algebren A und A′ werden. Diese beiden Algebren heißen isomorph, wenn es eine bijektive lineare Abbildung Ψ : V → V ′ gibt mit Ψ(v1 · v2 ) = Ψ(v1 ) ·′ Ψ(v2 ) für alle v1 , v2 ∈ V . Notation: A ∼ = A′ . Satz 8.1.7 Sei V ein n-dimensionaler K-Vektorraum. Als K-Algebren sind End(V ) und K(n,n) isomorph. Beweis Wähle eine Basis B von V . Die Abbildung Ψ : End(V ) → K(n,n) T 7→ [T]BB ist der gewünschte Isomorphismus. Wir definieren nun, was es bedeutet, in ein Polynom für x etwas einzusetzen. Wir wollen uns aber nicht darauf beschränken, Elemente aus K einzusetzen, sondern beliebige Elemente einer K-Algebra. Das bedeutet z.B., dass wir auch Matrizen oder Endomorphismen einsetzen dürfen! 103 Definition 8.1.8 Sei A eine K-Algebra mit neutralem Element 1 (Achtung: 1 ist i.a. nicht das multiplikativ neutrale Element von K. Beispielsweise ist das multiplikativ neutrale Element der Matrixalgebra die EinheitsPn 0 i matrix!). Ist v ∈ A, so setzen wir v := 1. Ist f = i=0 ai x , so definieren wir n X f (v) := ai v i . i=0 Ist A der Körper K (interpretiert als K-Algebra), so ist dies das gewöhnliche Einsetzen in ein Polynom. Satz 8.1.9 Sei K ein Körper und A eine K-Algebra mit neutralem Element. Dann gilt für alle f, g ∈ K[x], alle λ ∈ K und alle v ∈ A: (a) (f λ + g)(v) = f (v)λ + g(v). (b) (f g)(v) = f (v)g(v). Beweis Siehe Vorlesung. 8.2 Zerlegung von Polynomen, Euklidischer Algorithmus Definition 8.2.1 Seien f, g ∈ K[x]. Wir sagen f teilt g wenn es ein p ∈ K[x] gibt mit f · p = g. Notation: f |g. Ein Polynom f heißt reduzibel, wenn es sich als Produkt zweier Polynome vom Grad ≥ 1 schreiben lässt. Andernfalls heißt es irreduzibel. Ein Element λ ∈ K heißt Nullstelle von f , wenn f (λ) = 0 gilt. Unser erstes Ziel in diesem Abschnitt wird sein, die Anzahl Nullstellen eines Polynoms abzuschätzen. Wir beginnen mit einem einfachen Lemma: 104 P P i Lemma 8.2.2 Seien f = ni=0 ai xi und g = m i=0 bi x Polynome in K[x], an , bm 6= 0 und m ≤ n. Dann ist g ein Teiler von f , oder es gibt ein Polynom d mit deg(f − dg) < n. Beweis Setze d = bamn xn−m . Dann ist der Koeffizient von xn in f − dg gerade 0, also deg(f − dg) < n oder f − dg = 0. Satz 8.2.3 Seien f, g ∈ K[x]. Dann gibt es eindeutig bestimmte Polynome q und r so, dass gilt: 1. f = gq + r und 2. r = 0 oder gr(r) < gr(g) Beweis Zunächst zur Eindeutigkeit: Angenommen, f = q1 g + r1 = q2 g + r2 , also g(q1 − q2 ) = r2 − r1 . Wenn q1 − q2 6= 0, so ist der Grad von g(q1 − q2 ) mindestens deg(g), Widerspruch, weil r2 − r1 = 0 oder deg(r2 − r1 ) < deg(g). Also muss q1 = q2 sein, woraus sofort r1 = r2 folgt. Kommen wir nun zur Existenz. Gilt f = 0 oder deg(f ) < deg(g), so setzen wir q = 0. Andernfalls wählen wir ein Polynom d1 so, dass f − d1 g = 0 oder deg(f − d1 g) < deg(f ). Wenn f − d1 g = 0 oder deg(f − d1 g) < deg(g), so sind wir fertig (f = d1 g + (f − d1 g)). Andernfalls wählen wir d2 so, dass f − d1 g − d2 g = 0 oder deg(f − d1 g − d2 g) < deg(f − d1 ). Fahre so fort, bis das Verfahren abbricht, weil f − (d1 + d2 + . . . + ds )g = 0 oder deg(f − (d1 + d2 + . . . + ds )g < deg(g). Das Verfahren bricht ab, weil in jedem Schritt gilt deg(f − (d1 + . . . + di+1 )g) < deg(f − (d1 + . . . + di )g). Korollar 8.2.4 Sei γ ∈ K. Das Polynom x − γ ∈ K[x] teilt f genau dann wenn f (γ) = 0. Beweis Wir schreiben f = (x − γ)q + r, wobei r = 0 oder r ein Polynom vom Grad 0 ist, also ein Skalar. Wir erhalten f (γ) = (γ − γ)q(γ) + r, also ist f (γ) = 0 genau dann wenn r = 0 ist, wenn also x − γ ein Teiler von f ist. Dieser Beweis kann leicht in einen Algorithmus umgesetzt werden, um f und g zu finden. Das ist die (aus der Schule?) bekannte Polynomdivision. Korollar 8.2.5 Ein Polynom vom Grad n hat höchstens n Nullstellen. 105 Beweis (Induktion nach n) Die Fälle n = 0 und n = 1 sind klar. Der Induktionsschritt ist Korollar 8.2.4. Definition 8.2.6 Sei (R, +, ·) ein Ring. Ein Ideal I in R ist ein Teilring von R, für den zusätzlich gilt: Ist f ∈ I und g ∈ R, so ist auch f g ein Element von I. Es gilt folgender bemerkenswerte Satz: Satz 8.2.7 Ist I ein Ideal in K[x], so gibt es ein eindeutig bestimmtes monisches Polynom f derart, dass I = {f · g : g ∈ K[x]}. (Man nennt dieses Ideal das von f erzeugte Hauptideal, Bezeichnung I = hf i). Beweis In der Vorlesung wird der leichte Nachweis erbracht, dass {f · g : g ∈ K[x]} ein Ideal ist. Wir müssen uns noch überlegen, dass jedes Ideal so dargestellt werden kann. Im Fall I = {0} ist nichts zu zeigen, wir können daher I 6= {0} annehmen. Wähle unter allen monischen Polynomen in I eines aus, das möglichst kleinen Grad hat. Wir wollen zeigen, dass dann alle Polynome in I Vielfache von f sind. Angenommen, es gibt ein g ∈ I so, dass f kein Teiler von g ist, Dann gilt g = f q + r mit gr(r) < gr(f ). Dann gilt aber r ∈ I, weil I ein Ideal ist, Widerspruch (beachte: f q ∈ I weil I ein Ideal ist). Zur Eindeutigkeit: Gäbe es noch ein anderes f ′ , so gäbe es p, p′ ∈ K[x] mit f ′ = f p und f = f ′ p′ , also f ′ = f ′ pp′ . Das zeigt pp′ = 1, und deshalb müssen p und p′ Skalare sein (Grad 0). Weil f und f ′ monisch sind geht das nur für p = p′ = 1, also f = f ′ . Lemma 8.2.8 Sei p1 , . . . , pn ∈ K[x]. Dann ist hp1 , . . . , pn i := { ein Ideal in K[x]. n X i=1 pi gi : gi ∈ K[x]} 106 Beweis Nachrechnen! Korollar 8.2.9 Der eindeutig bestimmte monische Erzeuger d von hp1 , . . . , pn i teilt alle Polynome pi . Umgekehrt muss jedes Polynom, das alle pi teilt, auch ein Teiler von d sein. (Deshalb nennt man d auch den größten gemeinsamen Teiler der pi .) Ist d′ ein monisches Polynom in hp1 , . . . , pn i, das alle pi teilt, so gilt d = d′ . Beweis Weil jedes Element in I ein Vielfaches von d ist, muss d alle pi teilen. Es gibt q1 , . . . qn so, dass n X d= pi qi (8.2) i=1 ist. Sei nun d′ ein Polynom, dass alle pi teilt. Dann muss d′ wegen (8.2) auch ein Teiler von d sein. Wenn zusätzlich d′ ∈ hp1 , . . . , pn i gilt, so ist d ein Teiler von d′ , also d = d′ , sofern d′ monisch. Den größten gemeinsamen Teiler zweier Polynome p1 und p2 kann man genauso wie den ggT von zwei Zahlen mithilfe des Euklidischen Algorithmus bestimmen. Der Euklidische Algrorithmus bestimmt gerade ein Polynom d, das sich in der Form p1 q1 + p2 q2 schreiben lässt, und das sowohl p1 als auch p2 teilt. Nach Korollar 8.2.9 muss dieses Polynom der ggT von p1 und p2 sein. Man erhält so, wie im Fall ganzer Zahlen, eine Vielfachsummendarstellung des ggT (siehe Beispiel in der Vorlesung). Wir wollen uns jetzt abschließend noch überlegen, dass wir jedes Polynom eindeutig als Produkt irreduzibler Polynome schreiben können. Dazu zeigen wir zunächst: Lemma 8.2.10 Ist p ∈ K[x] irreduzibel und gilt p|f g für f, g ∈ K[x], so muss p ein Teiler von f oder g sein. Beweis Wir können ohne Einschränkung der Allgemeinheit annehmen, dass alle hier auftretenden Polynome monisch sind. Sei d der ggT von f und p. Weil p irreduzibel ist, muss d = 1 oder d = p gelten. Ist d = p, so ist p ein Teiler von f und wir sind fertig. Andernfalls finden wir Polynome f0 und p0 so, dass 1 = f f0 + pp0 gilt. Das liefert g = gf f0 + gpp0 . Nun teilt p beide Summanden auf der rechten Seite, also auch g auf der linken Seite dieser Gleichung. 107 Man kann dieses Lemma mit Induktion leicht auf das Produkt mehrerer Polynome erweitern: Korollar 8.2.11 Ist p ein irreduzibles Polynom in K[x] und teilt p das Produkt f1 · fn , fi ∈ K[x], so teilt p mindestens einen der Faktoren fi . Satz 8.2.12 Jedes Polynom f 6= 0 in K[x] kann als Produkt eines Skalars γ und irreduzibler monischer Polynome pi vom Grad ≥ 1 geschrieben werden, also in der Form f = γ · p1 · · · pn . Wenn f = µ · q1 · · · qm eine andere solche Zerlegung ist, so gilt γ = µ, m = n und es gibt eine Permutation σ ∈ Sn mit pσ(i) = qi . Beweis Wir schreiben f = γf ′ , wobei f ′ monisch ist. Diese Darstellung ist eindeutig, und deshalb dürfen wir ab jetzt annehmen, dass f monisch ist. Zunächst zur Existenz der Zerlegung: Ist f irreduzibel, so sind wir fertig, andernfalls gilt f = f1 f2 für zwei Polynome von kleinerem Grad. Mit Induktion erhalten wir eine Zerlegung in irreduzible Elemente. Zur Eindeutigkeit: Wenn es zwei solcher Zerlegungen p1 · · · pn = q1 · · · qm gibt, so ist q1 ein Teiler von p1 · · · pn . Weil q1 irreduzibel ist, muss q1 eines der pi teilen, Weil aber auch die pi irreduzibel sind, muss q1 gleich einem der pi sein. Dieses sei pσ(1) . Es gilt also Y i∈{1,...,n},i6=σ(i) pi = q2 · · · qm Fahre so fort! Korollar 8.2.13 Sei f ∈ K[x] ein monisches Polynom, f = p1n1 · · · psns , wobei die pi irreduzibel sind und paarweise teilerfremd. (Man nennt ni die Vielfachheit von pi in f .) Dann ist der ggT der Polynome fi := p fni , i = i 1, . . . , s, gerade 1. Beweis Angenommen, p ist ein irreduzibles Polynom vom Grad ≥ 1, das alle fi teilt. Dann muss p 6= pi für i = 1, . . . s sein, denn pi ist kein Teiler von fi . Andererseits muss p aber eines der pi sein, Widerspruch, also gibt es keinen irreduziblen Teiler, dessen Grad ≥ 1 ist, und somit sind die fi teilerfremd. 108 In R[x] kann man jedes Polynom als Produkt von Linearfaktoren (das sind Polynome vom Grad 1) und Polynomen vom Grad 2 schreiben. Das folgt u.a. aus dem Hauptsatz der Algebra, der besagt: Satz 8.2.14 (Hauptsatz der Algebra) Jedes Polynom in C[x] kann als Produkt von Linearfaktoren geschrieben werden. Der Beweis wird üblicherweise mit analytischen Methoden in einer fortgeschrittenen Analysisvorlesung geführt. Der Satz impliziert für reelle Polynome folgendes: Ist f ∈ R[x], so kann f über C vollständig in Linearfaktoren zerlegt werden. Wie sieht aber eine Zerlegung über R aus? Lemma 8.2.15 Ist f ∈ R[x] und ist γ = a + b i ∈ C eine Nullstelle von f , so ist auch a − b i eine Nullstelle von f (wobei hier a, b ∈ R). P konjugieren”, d.h. Beweis Sei f = ni=0 ai xi , ai ∈ R. Wir wenden Pn “komplex i die Abbildung a + b i 7→ a − b i, auf f (γ) = i=0 ai γ an (und benutzen, dass komplexe Konjugation ein Körperautomorphismus ist). Um zu zeigen, dass die irreduziblen Teiler eines reellen Polynoms höchstens den Grad 2 haben, fassen wir nun (x − γ) und (x − γ) zusammen und stellen fest, dass (x − (a + b i))(x − ((a − b i)) = x2 − 2a + (a2 + b2 ) ein reelles Polynom ist. Die Nullstellen von f kommen also immer in Paaren zweier komplex-konjugierter Nullstellen, die dann zu reellen Polynomen vom Grad 2 zusammengefasst werden können. 8.3 Eigenwerte In diesem Abschnitt sei V stets ein n-dimensionaler Vektorraum, und sei T ∈ End(V ). Solche linearen Abbildungen werden auch lineare Operatoren genannt. 109 Definition 8.3.1 Ein Element γ ∈ K heißt Eigenwert von T, wenn es ein v ∈ V , v 6= 0 gibt mit T(v) = vγ. Ist γ ein Eigenwert, so heißt ein Vektor v mit T(v) = vγ ein Eigenvektor. Die Menge Eig(T, γ) := {v ∈ V : T(v) = vγ} heißt der zu γ gehörende Eigenraum. Ist γ ein Eigenwert mit zugehörigem Eigenwert γ, so ist Eig(T, γ) der Kern der linearen Abbildung T − γidV . Weil γ ein Eigenwert ist, besteht der Kern nicht nur aus 0. Ist umgekehrt γ ∈ K derart, dass T − γ · idV nichtsingulär ist, so gilt Kern(T − γ · idV ) 6= {0}, und somit ist γ ein Eigenwert, weil es dann im Kern Vektoren v 6= 0 gibt mit T(v) = vγ. In Matrizenform: Ist B eine Basis von V , so gilt γ ist Eigenwert von T ⇔ [T]BB − γI ist nicht invertierbar. Häufig spricht man auch von Eigenwerten und Eigenvektoren von Matrizen T ∈ K(n,n) . Sie müssen dann T als lineare Abbildungen Kn → Kn interpretieren. Lemma 8.3.2 Eig(T, γ) ist ein Unterraum von V . (Seine Dimension wird geometrische Vielfachheit genannt.) Beispiel 8.3.3 Sei 5 −6 −6 2 T = −1 4 3 −6 −4 eine reelle Matrix, die wir mit der zugehörigen linearen Abbildung R3 → R3 identifizieren. Die reellen Zahlen 1 und 2 sind Eigenwerte, denn 3 3 T · −1 = −1 · 1 3 3 und 3 Eig(T, 1) = h−1i. 3 110 Der Eigenraum wird berechnet als Kern 4 T − I = −1 3 definierten linearen Abbildung. der durch −6 −6 3 2 −6 −5 Die Zahl 2 ist ein Eigenwert, denn 2 2 T · 1 = 1 · 2. 0 0 Hier ist der Eigenraum zweidimensional: 2 2 Eig(T, 2) = h 1 , 0i. 0 1 Definition 8.3.4 Sei T ein Endomorphismus auf V . Dann definieren wir die Matrix xI − TBB ∈ K[x](n,n) . Die Determinante dieser Matrix heißt das charakteristische Polynom von T. Notation: χT . Eigentlich hängt das charakteristische Polynom noch von der Auswahl der Basis B ab. Das folgende Lemma zeigt, dass dies nicht der Fall ist: Lemma 8.3.5 det(xI − [T]BB ) = det(xI − [T]CC ) Beweis Sei P ∈ GL(n, K) die Matrix mit P−1 TBB P = TCC . Dann gilt det(xI − [T]BB ) = det(P−1 (xI − [T]BB )P) = det(xI − P−1 ([T]BB )P) = det(xI − [T]CC ). 111 Mit anderen Worten: Das charakteristische Polynom ist unabhängig von der konkreten Auswahl der Basis, bzgl. der T dargestellt wird, und wir können deshalb in der Tat von dem charakteristischen Polynom von T sprechen. Das gilt aber nur, wenn wir den Urbild- und den Bildbereich bzgl. derselben Basis darstellen. Beispiel 8.3.6 (a.) Das charakteristische Polynom der Nullabbildung auf einem n-dimensionalen Vektorraum V ist xn , das charakteristische Polynom von idV ist (x − 1)n . (b.) Das charakteristische Polynom von T aus Beispiel 8.3.3 ist x−5 6 6 x − 4 −2 = (x − 2)2 (x − 1). det 1 −3 6 x+4 (c.) Dieses Beispiel zeigt, dass charakteristische Polynome nicht notwendigerweise in Linearfaktoren zerfallen: Das charakteristische Polynom von 0 1 ∈ R(2,2) ist x2 + 1. (Wenn wir die Abbildung als Abbildung auf C2 −1 0 auffassen, zerfällt das Polynom in (x + i)(x − i).) Die Bedeutung des charakteristischen Polynoms zeigt der folgende Satz: Satz 8.3.7 Sei T ein linearer Operator auf V . Dann ist γ ∈ K genau dann ein Eigenwert von T wenn χT (γ) = 0 gilt. Beweis Das Element γ ist genau dann ein Eigenwert, wenn T−γidV singulär ist. Das heißt aber, die Determinante einer Darstellungsmatrix von T − γidV ist 0, also ist (x − γ) ein Teiler des charakteristischen Polynoms. Schauen wir uns noch einmal das Beispiel 8.3.6 (c.) an. Diese Matrix beschreibt im “Anschauungsraum” R2 eine Drehung um 90 Grad nach rechts. Es ist klar, dass eine solche Drehung keinen Eigenwert hat, weil keine Richtung festgehalten wird. Deshalb kann das charakteristische Polynom keine Nullstelle haben! Lemma 8.3.8 Sei V ein n-dimensionaler Vektrorraum, und sei T ein linearer Operator auf V . Dann gilt: 112 (a.) deg(χT ) = n. (b.) T hat höchstens n verschiedene Eigenwerte. Weil jede Matrix eine spezielle lineare Abbildung ist, können wir auch von Eigenvektoren und Eigenwerten von Matrizen sprechen. Wir wollen die entsprechenden Begriffe für Matrizen noch einmal zusammenstellen: Definition 8.3.9 Sei T ∈ K(n,n) . Ein γ ∈ K heißt Eigenwert, wenn es ein v ∈ Kn , v 6= 0 gibt mit Tv = vγ.Das Polynom det(xI − T) heißt das charakteristische Polynom von T, Bezeichnung χT . Ein v mit Tv = vγ heißt Eigenvektor. Das Lemma 8.3.5 besagt für Matrizen gerade folgendes: Lemma 8.3.10 Ähnliche Matrizen haben dieselben charakteristischen Polynome. Bemerkung 8.3.11 Die Umkehrung dieses Lemmas gilt nicht: Die beiden 1 0 Matrizen I2 und über R haben beide das charakteristische Polynom 1 1 (x − 1)2 , sind aber nicht ähnlich, weil die Matrix I2 nur zu sich selbst ähnlich ist. Allgemein gilt, dass die Eigenräume, die zu Eigenwerten ähnlicher Matrizen gehören, gleiche Dimension haben müssen. Diese Dimensionen sind aber nicht durch das charakteristische Polynom bestimmt! Wir haben bislang nur über die Ähnlichkeit von Matrizen gesprochen. Wenn eine lineare Abbildung bzgl. zweier verschiedener Basen dargestellt wird, so sind die beiden Darstellungsmatrizen ähnlich. Nun kann es aber auch passieren, dass zwei verschiedene lineare Abbildungen bzgl. verschiedener Basen identische Darstellungsmatrizen haben. In dem Fall nennen wir die beiden linearen Abbildungen ähnlich. Wenn zwei lineare Abbildungen ähnlich sind, so sind zwei Darstellungsmatrizen ebenfalls ähnlich, unabhängig von der Auswahl der Basen. 113 Charakteristische Polynome ähnlicher linearer Abbildungen sind gleich, deshalb sind die Eigenwerte und die Dimensionen der Eigenräume gleich. Die Eigenräume ähnlicher Matrizen sind aber nicht gleich! Definition 8.3.12 Ist γ ein Eigenwert von T, und tritt x − γ mit Vielfachheit di im charakteristischen Polynom von T auf, so nennt man di die algebraische Vielfachheit des Eigenwerts. Die Dimension dim Eig(T, γ) heißt die geometrische Vielfachheit. Eigenräume sind invariante Unterräume: Definition 8.3.13 Ein Unterraum U ≤ V heißt T-invariant für einen linearen Operator T auf V falls das Bild von U unter T in U liegt, wenn also für alle v ∈ U gilt: T(v) ∈ U. Lemma 8.3.14 Sei U ein T-invarianter Unterraum von V , dim V = n, dim U = s. Ferner sei B = (b1 , . . . bn ) eine Basis von V so, dass (b1 , . . . , bs ) eine Basis von U ist. Dann hat die Darstellungsmatrix von T bzgl. B die Gestalt S M 0 N Die Matrix S ∈ K(s,s) ist eine Darstellungsmatrix von T|U . Lemma 8.3.15 Ist γ ein Eigenwert von T, so ist Eig(T, γ) ein T-invarianter Unterraum. Beweis Übungsaufgabe. Für spätere Verwendung notieren wir noch: Lemma 8.3.16 Ist T ein linearer Operator auf V , und ist v ein Eigenvektor zum Eigenwert γ, so gilt f (T)v = f (γ)v für alle f ∈ K[x]. Beweis Übungsaufgabe. 114 Satz 8.3.17 Sei d die algebraische Vielfachheit des Eigenwertes γ von T. Dann gilt dim Eig(T, γ) ≤ d. Beweis Sei s die geometrische Vielfachheit des Eigenwertes γ. Wir stellen T bzgl. einer Basis dar, in der die ersten s Vektoren gerade Eigenvektoren zum γ sind. Dann hat T, dargestellt bzgl. dieser Basis, die Gestalt Eigenwert S M , wobei S eine Diagonalmatrix ist, deren sämtliche Diagonaleinträge 0 N γ sind. Das charakteristische Polynom von T hat dann aber einen Faktor (x − γ)s , also s ≤ d. Definition 8.3.18 Ein linearer Operator heißt diagonalisierbar wenn es eine Basis von V gibt, die nur aus Eigenvektoren besteht. Wenn ein Operator diagonalisierbar ist, so hat er bzgl. der Basis, die aus Eigenvektoren besteht, Diagonalgestalt, d.h. alle Einträge außerhalb der Hauptdiagonale sind 0, und auf der Hauptdiagonalen stehen die Eigenwerte. Beispiel 8.3.19 Der Operator aus Beispiel 8.3.3 ist diagonalisierbar. Bezüglich der Basis 3 2 2 B = ( −1 , 1 , 0) 3 0 1 ist die Darstellungsmatrix 1 0 0 D := [T]BB = 0 2 0 0 0 2 Wenn B′ die kanonische Basis bezeichnet, so ist 3 2 P := [id]BB′ = −1 −1 3 0 115 die Transformationsmatrix 2 0 1 und P−1 Es gilt D = P−1 TP. −1 2 2 2 . = −1 3 3 −6 −5 Der folgende Satz gibt ein sehr schönes Kriterium für die Diagonalisierbarkeit linearer Operatoren an: Satz 8.3.20 Sei T ein linearer Operator auf dem n-dimensionalen Vektorraum V . Dann sind die folgenden drei Bedingungen äquivalent: (i) T ist diagonalisierbar. (ii) χT = (x − γ1 )d1 · . . . · (x − γs )ds , wobei die γi paarweise verschieden sind, und dim Eig(T, γi ) = d1 (iii) dim Eig(T, γ1) + . . . + dim Eig(T, γs ) = n. Wir beweisen zunächst ein Lemma: Lemma 8.3.21 Sei T ein linearer Operator auf V , und W1 , . . . , Wk seien k verschiedene Eigenräume zu den verschiedenen Eigenwerten γ1 , . . . , γk . Dann gilt dim(W1 + . . . + Wk ) = dim W1 + . . . + dim Wk . Mit anderen Worten: Sind die Bi Basen von Wi , so ist B = (B1 , . . . + Bk ) eine Basis von W := W1 + . . . Wk (der Unterraum hW1 ∪ . . . ∪ Wk i). Beweis Klar ist dim(W1 + . . . + Wk ) ≤ dim W1 + . . . dim Wk . Um Gleichheit zu zeigen müssen wir zeigen, dass die Basen der Wi zusammen eine Basis von W bilden. Wir zeigen: Sind vi ∈ Wi Vektoren mit v1 + . . . + vk = 0, so gilt v1 = . . . = vk = 0. Das zeigt, dass B eine Basis von W ist. Wenn v1 + . . . + vk = 0 gilt, so gilt auch f (T)v1 + . . . f (T)vk = f (T)0 = 0 für jedes Polynom f ∈ K[x]. Wir wählen nun ein fi so, dass fi (γi ) = 1 und fi (γj ) = 0 für i 6= j. Ein solches fi ist beispielsweise (x − γ1 ) · · · (x − γi−1 )(x − γi+1 ) · · · (x − γk ) . (γi − γ1 ) · · · (γi − γi−1 )(γi − γi+1 ) · · · (γi − γk ) Dann ist fi (T)(vi ) = fi (λi )(vi ) = vi wegen Lemma 8.3.16. 116 Beweis (Beweis von Satz 8.3.20) Zur Implikation (i) ⇒ (ii): Wir wissen, dass die Summe der algebraischen Vielfachheiten genau n ist, wenn das Polynom in Linearfaktoren zerfällt. Wenn der Operator diagonalisierbar ist, muss die Summe der Dimensionen der Eigenräume auch n sein. Die Aussage folgt dann aus Satz 8.3.17. P Die Implikation (ii) ⇒ (iii) folgt aus i di = n. Schließlich ist (iii) ⇒ (i) eine Konsequenz von Lemma 8.3.21. Korollar 8.3.22 Ein linearer Operator ist genau dann diagonalisierbar, wenn sein charakteristisches Polynom in Linearfaktoren zerfällt und für alle Eigenwerte die algebraische gleich der geometrischen Vielfachheit ist. Ein großer Teil der Vorlesung Lineare Algebra II befasst sich mit Verallgemeinerungen von Satz 8.3.20: • Was geschieht, wenn das charakteristische Polynom nicht in Linearfaktoren zerfällt? • Was geschieht, wenn das charakteristische Polynom zwar in Linearfaktoren zerfällt, die geometrischen aber nicht gleich den algebraischen Vielfachheien sind? Wir beschließen diesen Abschnitt mit folgendem interessanten Satz: Satz 8.3.23 Jedes monische Polynom vom Grad n in K[x] ist charakteristisches Polynom einer geeigneten Matrix (einer geeigneten linearen Abbildung). Pn−1 Beweis Sei f = xn + i=0 ai xi ∈ K[x]. Dieses Polynom ist das charakteristische Polynom von 0 0 0 · · · −a0 1 0 0 · · · −a1 0 1 0 · · · −a 2 .. .. . . 0 · · · · · · · · · −an−2 0 0 · · · 1 −an−1 . 117 8.4 Zusammenfassung • Sie haben gelernt, was eine Algebra ist. • In K[x] kann man, ähnlich wie im Ring der ganzen Zahlen, Polynome in irreduzible Polynome zerlegen. • Diese Zerlegung ist im wesentlichen eindeutig. • Sie wissen, was Diagonalisierbarkeit bedeutet. • Sie kennen die Definition von Eigenwerten und Eigenvektoren. • Wir haben ein wichtiges Diagonalisierbarkeitskriterium angegeben. • Das charakteristische Polynom ist das entscheidende Hilfsmittel, um Eigenwerte auszurechnen. • Es gibt Matrizen, die nicht diagonalisiert werden können. Sie sollten solche Matrizen angeben können. • Ähnliche Matrizen haben gleiche charakteristische Polynome. • Es gibt Matrizen, die nicht ähnlich sind, aber gleiche charakteristische Polynome haben. • Wir haben erklärt, was invariante Unterräume sind. 118