Polynome und Eigenwerte

Werbung
Kapitel 6
Polynome und Eigenwerte
6.1
Die Polynomalgebra
Wir haben bereits erklärt, was Polynome sind, nämlich Ausdrücke der Form
P
n
i
i=0 ai x , wobei die ai Elemente aus
P einem Körper sind (siehe Beispiel 3.1.1
(3.)). Manchmal schreiben wir auch i ai xi , wobei das stets bedeuten soll, dass
nur für endlich viele i gilt ai 6= 0. Die Menge der Polynome
X
ai xi : ai ∈ K}
K[x] := {
i
ist ein (unendlichdimensionaler) Vektorraum. Wir haben in 3.1.1 bereits erklärt,
was der Grad eines Polynoms f ist (das maximale i so, dass ai 6= 0 gilt, sofern
f 6= 0). Der Grad
P eines Polynoms wird mit deg f bezeichnet. Wir nennen ein
Polynom f = i ai xi vom Grad n monisch, wenn an = 1. Das Nullpolynom
bezeichnen wir mit 0. Die Polynome xn heißen Monome.
Wir definieren auf K[x] jetzt eine Multiplikation wie folgt:
i
XX
X
X
aj bi−j )xi .
(
bi xi ) =
ai xi ) · (
(
i
i
i
(6.1)
j=0
Insbesondere gilt xn · xm = xn+m .
Satz 6.1.1
(K[x], +, ·, 0, x0 )
ist ein kommutativer Ring mit multiplikativ neutralem Element x0 .
Beweis Wir wissen bereits, dass K[x] ein Vektorraum ist. Die Addition, die
wir hier benutzen, ist dieselbe Addition wie im Vektorraum, also ist (K[x], +)
sicherlich eine abelsche Gruppe. Wir müssen noch zeigen:
85
• Multiplikation ist kommutativ.
• Assoziativgesetz.
• Distributivgesetze.
• Neutrales Element x0 .
Beginnen wir mit der Kommutativität:
P
P
P Pi
P Pi
( i ai xi )( i bi xi ) = i ( j=0 aj bi−j )xi = i ( j=0 ai−j bj )xi =
P
P
P Pi
= i ( j=0 bj ai−j )xi = ( i bi xi )( i ai xi ).
Es genügt jetzt also, nur ein Distributivgesetz zu zeigen, also z.B. (f + g)h =
f h + gh, das zweite f (g + h) = f g + f h folgt aus der Kommutativität f (g + h) =
(g + h)f .
X
X
X
ci xi
bi xi ) ·
ai xi +
(
i
i
=
X
(ai + bi )xi ·
=
X
((aj + bj )ci−j )xi
j=0
i
i
X
XX
bj ci−j )xi
aj ci−j +
(
j=0
j=0
i
=
i
X
(
i
=
ci xi
i
i
i
X
X
X
X
X
ci xi )
bi xi ·
ci xi ) + (
ai xi ·
(
i
i
i
i
Wegen der Gültigkeit der Distributivgesetze für alle Polynome ai xi genügt es
nun, die Assoziativität und das multiplikativ neutrale Element x0 nur für diese Polynome nachzuweisen (wegen der Distributivgesetze kann das sofort auf
beliebige Polynome, die ja Summen der ai xi sind, ausgeweitet werden).
Wir erhalten
(an xn · bm xm ) · cp xp = (an bm xn+m ) · cp xp = (an bm )cp x(n+m)+p =
= an (bm cp )xn+(m+p) = an xn · (bm xm · cp xp )
sowie
an xn · x0 = an xn+0 = an xn .
Wir wollen einige Eigenschaften von Polynomen zusammenfassen, die sicherlich
nicht sehr überraschend sind:
Lemma 6.1.2 Seien f, g ∈ K[x]. Dann gilt:
86
(a.) f, g 6= 0
⇒
f · g 6= 0.
(b.) deg(f · g) = deg f + deg g.
(c.) f, g monisch
(d.) deg(f · g) = 1
(e) f + g 6= 0
⇒
⇔
f · g monisch.
deg f = 1 und deg g = 1.
⇒
P
deg(f + g) ≤ max(deg f, deg g).
P
Beweis Sei f = i ai xi vom Grad m und g = i bi xi vom Grad n. Dann ist
der Koeffizient von xm+n+k in f g mit k > 0 sicherlich 0 nach Definition der
Multiplikation, und der Koeffizient von xn+m ist am bn . Das zeigt (a.), (b.), (c.)
und (d.). Aussage (e.) ist offensichtlich (beim Addieren kann der Grad nicht
größer werden).
Als Korollar von Teil (a.) dieses Lemmas halten wir explizit fest:
Korollar 6.1.3 Gilt f g = f h in K[x] und f 6= 0, so muss g = h gelten.
Beweis 0 = f (g − h) und f 6= 0 impliziert (Lemma 6.1.2 (a.)) g − h = 0, also
g = h.
Definition 6.1.4 Sei V ein K-Vektorraum. Die Vektoraddition sei mit “+”
bezeichnet. Ferner gebe es auf V eine Multiplikation “·” so, dass (V, +, ·) ein
Ring ist. Wenn zusätzlich für alle v1 , v2 ∈ V und alle λ ∈ K gilt
v1 · (v2 λ) = (v1 λ) · v2 = (v1 · v2 )λ,
so nennt man V eine K-Algebra A. Wir nennen die Algebra kommutativ,
wenn die Ringmultiplikation kommutativ ist. Wenn es in dem Ring V ein
multiplikativ neutrales Element gibt, sagen wir, A ist eine Algebra mit 1.
Beispiel 6.1.5 (1.) Jeder Körper ist ein Vektorraum über sich selber. Wenn
man die Multiplikation in dem Körper als die Ringmultiplikation “·” in
Definition 6.1.4 wählt, so wird K zu einer kommutativen K-Algebra mit
1.
(2.) Die Menge {x + 0 i : x ∈ R} ⊆ C ist der Körper der reellen Zahlen, eingebettet in C. Nun ist C ein zweidimensionaler R-Vektorraum. Mit der
Multiplikation in C als Ringmultiplikation wird C sogar zu einer kommutativen R-Algebra mit 1.
(3.) Der Endomorphismenring End(V ) sowie der Matrizenring K(n,n) sind nicht
kommutative K-Algebren mit neutralem Element.
(4.) K[x] ist eine kommutative K-Algebra mit 1.
87
Definition 6.1.6 Seien V und V ′ zwei K-Vektorräume, auf denen auch jeweils eine Multiplikation · (auf V ) und ·′ (auf V ′ ) definiert sind. Wir nehmen
an, dass V und V ′ dadurch zu Algebren A und A′ werden. Diese beiden Algebren heißen isomorph, wenn es eine bijektive lineare Abbildung Ψ : V → V ′
gibt mit
Ψ(v1 · v2 ) = Ψ(v1 ) ·′ Ψ(v2 )
für alle v1 , v2 ∈ V . Notation: A ∼
= A′ .
Satz 6.1.7 Sei V ein n-dimensionaler K-Vektorraum. Als K-Algebren sind End(V )
und K(n,n) isomorph.
Beweis Wähle eine Basis B von V . Die Abbildung
Ψ : End(V ) → K(n,n)
T
7→ [T]B
B
ist der gewünschte Isomorphismus.
Wir definieren nun, was es bedeutet, in ein Polynom für x etwas einzusetzen.
Wir wollen uns aber nicht darauf beschränken, Elemente aus K einzusetzen,
sondern beliebige Elemente einer K-Algebra. Das bedeutet z.B., dass wir auch
Matrizen oder Endomorphismen einsetzen dürfen!
Definition 6.1.8 Sei A eine K-Algebra mit neutralem Element 1 (Achtung:
1 ist i.a. nicht das multiplikativ neutrale Element von K. Beispielsweise ist
das multiplikativ neutrale Element der P
Matrixalgebra die Einheitsmatrix!).
Ist v ∈ A, so setzen wir v 0 := 1. Ist f = ni=0 ai xi , so definieren wir
f (v) :=
n
X
ai v i .
i=0
Ist A der Körper K (interpretiert als K-Algebra), so ist dies das gewöhnliche
Einsetzen in ein Polynom.
Satz 6.1.9 Sei K ein Körper und A eine K-Algebra mit neutralem Element.
Dann gilt für alle f, g ∈ K[x], alle λ ∈ K und alle v ∈ A:
(a.) (f λ + g)(v) = f (v)λ + g(v).
(b.) (f g)(v) = f (v)g(v).
Beweis Siehe Vorlesung.
88
6.2
Zerlegung von Polynomen, Euklidischer Algorithmus
Definition 6.2.1 Seien f, g ∈ K[x]. Wir sagen f teilt g, wenn es ein p ∈ K[x]
gibt mit f ·p = g. Notation: f |g. Ein Polynom f heißt reduzibel, wenn es sich
als Produkt zweier Polynome vom Grad ≥ 1 schreiben lässt. Andernfalls heißt
es irreduzibel. Ein Element λ ∈ K heißt Nullstelle von f , wenn f (λ) = 0
gilt.
Unser erstes Ziel in diesem Abschnitt wird sein, die Anzahl Nullstellen eines
Polynoms abzuschätzen.
Wir beginnen mit einem einfachen Lemma:
Pn
Pm
i
i
Lemma 6.2.2 Seien f =
i=0 ai x und g =
i=0 bi x Polynome in K[x],
an , bm 6= 0 und m ≤ n. Dann ist g ein Teiler von f , oder es gibt ein Polynom
d mit deg(f − dg) < n.
Beweis Setze d = bamn xn−m . Dann ist der Koeffizient von xn in f − dg gerade
0, also deg(f − dg) < n oder f − dg = 0.
Satz 6.2.3 Seien f, g ∈ K[x]. Dann gibt es eindeutig bestimmte Polynome q
und r so, dass gilt:
1. f = gq + r
und
2. r = 0 oder deg r < deg g
Beweis Zunächst zur Eindeutigkeit: Angenommen, f = q1 g + r1 = q2 g + r2 ,
also g(q1 − q2 ) = r2 − r1 . Wenn q1 − q2 6= 0, so ist der Grad von g(q1 − q2 )
mindestens deg g, Widerspruch, weil r2 − r1 = 0 oder deg(r2 − r1 ) < deg g. Also
muss q1 = q2 sein, woraus sofort r1 = r2 folgt.
Kommen wir nun zur Existenz. Gilt f = 0 oder deg f < deg g, so setzen wir
q = 0. Andernfalls wählen wir ein Polynom d1 so, dass f − d1 g = 0 oder
deg(f − d1 g) < deg f . Wenn f − d1 g = 0 oder deg(f − d1 g) < deg g, so sind wir
fertig (f = d1 g + (f − d1 g)). Andernfalls wählen wir d2 so, dass f − d1 g − d2 g = 0
oder deg(f − d1 g − d2 g) < deg(f − d1 ). Fahre so fort, bis das Verfahren abbricht,
weil f − (d1 + d2 + . . . + ds )g = 0 oder deg(f − (d1 + d2 + . . . + ds )g < gr(g)
gilt. Das Verfahren bricht ab, weil in jedem Schritt deg(f − (d1 + . . . + di+1 )g) <
deg(f − (d1 + . . . + di )g) gilt.
Korollar 6.2.4 Sei γ ∈ K. Das Polynom x − γ ∈ K[x] teilt f genau dann wenn
f (γ) = 0.
89
Beweis Wir schreiben f = (x − γ)q + r, wobei r = 0 oder r ein Polynom vom
Grad 0 ist, also ein Skalar. Wir erhalten f (γ) = (γ − γ)q(γ)+ r, also ist f (γ) = 0
genau dann wenn r = 0 ist, wenn also x − γ ein Teiler von f ist.
Dieser Beweis kann leicht in einen Algorithmus umgesetzt werden, um f und g
zu finden. Das ist die (aus der Schule?) bekannte Polynomdivision.
Korollar 6.2.5 Ein Polynom vom Grad n hat höchstens n Nullstellen.
Beweis (Induktion nach n) Die Fälle n = 0 und n = 1 sind klar. Der Induktionsschritt ist Korollar 6.2.4.
Definition 6.2.6 Sei A eine Algebra, die auf einem Vektorraum V definiert
ist. Ein Ideal I in A ist ein Unterraum von V , für den gilt:
Ist f ∈ I und g ∈ V , so ist auch f g ein Element von I.
Im allgemeinen werden Ideale für beliebige Ringe definiert. Man verlangt dann
nicht, dass I ein Unterraum ist, sondern I muss nur eine Untergruppe der additiven Gruppe des Rings sein.
Es gilt folgender bemerkenswerte Satz:
Satz 6.2.7 Ist I ein Ideal in K[x], so gibt es ein eindeutig bestimmtes monisches
Polynom f derart, dass
I = {f · g : g ∈ K[x]}.
(Man nennt dieses Ideal das von f erzeugte Hauptideal).
Beweis In der Vorlesung wird der leichte Nachweis erbracht, dass {f · g :
g ∈ K[x]} ein Ideal ist. Wir müssen uns noch überlegen, dass jedes Ideal so
dargestellt werden kann. Im Fall I = {0} ist nichts zu zeigen, wir können daher
I 6= {0} annehmen. Wähle unter allen monischen Polynomen in I eines aus, das
möglichst kleinen Grad hat. Wir wollen zeigen, dass dann alle Polynome in I
Vielfache von f sind. Angenommen, es gibt ein g ∈ I so, dass f kein Teiler von
g ist, Dann gilt g = f q + r mit deg r < deg f . Dann gilt aber r ∈ I, weil I ein
Ideal ist, Widerspruch (beachte: f q ∈ I weil I ein Ideal ist).
Zur Eindeutigkeit: Gäbe es noch ein anderes f ′ , so gäbe es p, p′ ∈ K[x] mit
f ′ = f p und f = f ′ p′ , also f ′ = f ′ pp′ . Das zeigt pp′ = 1, und deshalb müssen
p und p′ Skalare sein (Grad 0). Weil f und f ′ monisch sind, geht das nur für
p = p′ = 1, also f = f ′ .
Lemma 6.2.8 Sei p1 , . . . , pn ∈ K[x]. Dann ist
I(p1 , . . . , pn ) := {
n
X
i=1
ein Ideal in K[x].
90
pi gi : gi ∈ K[x]}
Beweis Nachrechnen!
Korollar 6.2.9 Der eindeutig bestimmte monische Erzeuger d von I(p1 , . . . , pn )
teilt alle Polynome pi . Umgekehrt muss jedes Polynom, das alle pi teilt, auch
ein Teiler von d sein. (Deshalb nennt man d auch den größten gemeinsamen
Teiler der pi .) Ist d′ ein monisches Polynom in I(p1 , . . . , pn ), das alle pi teilt,
so gilt d = d′ .
Beweis Weil jedes Element in I ein Vielfaches von d ist, muss d alle pi teilen.
Es gibt q1 , . . . qn so, dass
n
X
pi qi
(6.2)
d=
i=1
ist. Sei nun d′ ein Polynom, dass alle pi teilt. Dann muss d′ wegen (6.2) auch
ein Teiler von d sein. Wenn zusätzlich d′ ∈ I(p1 , . . . , pn ) gilt, so ist d ein Teiler
von d′ , also d = d′ , sofern d′ monisch.
Den größten gemeinsamen Teiler zweier Polynome p1 und p2 kann man genauso
wie den ggT von zwei Zahlen mit Hilfe des Euklidischen Algorithmus bestimmen.
Der Euklidische Algorithmus bestimmt ein Polynom d, das sich in der Form
p1 q1 + p2 q2 schreiben lässt, und das sowohl p1 als auch p2 teilt. Nach Korollar
6.2.9 muss dieses Polynom der ggT von p1 und p2 sein.
Man erhält so, wie im Fall ganzer Zahlen, eine Vielfachsummendarstellung
des ggT (siehe Beispiel in der Vorlesung).
Wir wollen uns jetzt abschliessend noch überlegen, dass wir jedes Polynom eindeutig als Produkt irreduzibler Polynome schreiben können.
Dazu zeigen wir zunächst:
Lemma 6.2.10 Ist p ∈ K[x] irreduzibel und gilt p|f g für f, g ∈ K[x], so muss
p ein Teiler von f oder g sein.
Beweis Wir können ohne Einschränkung der Allgemeinheit annehmen, dass
alle hier auftretenden Polynome monisch sind. Sei d der ggT von f und p. Weil
p irreduzibel ist, muss d = 1 oder d = p gelten. Ist d = p, so ist p ein Teiler
von f und wir sind fertig. Andernfalls finden wir Polynome f0 und p0 so, dass
1 = f f0 + pp0 gilt. Das liefert g = gf f0 + gpp0 . Nun teilt p beide Summanden
auf der rechten Seite, also auch g auf der linken Seite dieser Gleichung.
Man kann dieses Lemma mit Induktion leicht auf das Produkt mehrerer Polynome erweitern:
Korollar 6.2.11 Ist p ein irreduzibles Polynom in K[x] und teilt p das Produkt
f1 · · · fn , fi ∈ K[x], so teilt p mindestens einen der Faktoren fi .
Satz 6.2.12 Jedes Polynom f 6= 0 in K[x] kann als Produkt eines Skalars γ und
irreduzibler monischer Polynome pi vom Grad ≥ 1 geschrieben werden, also in
der Form f = γ · p1 · · · pn . Wenn f = µ · q1 · · · qm eine andere solche Zerlegung
ist, so gilt γ = µ, m = n und es gibt eine Permutation σ ∈ Sn mit pσ(i) = qi .
91
Beweis Wir schreiben f = γf ′ , wobei f ′ monisch ist. Diese Darstellung ist
eindeutig, und deshalb dürfen wir ab jetzt annehmen, dass f monisch ist.
Zunächst zur Existenz der Zerlegung: Ist f irreduzibel, so sind wir fertig, andernfalls gilt f = f1 f2 für zwei Polynome von kleinerem Grad. Mit Induktion
erhalten wir eine Zerlegung in irreduzible Elemente.
Zur Eindeutigkeit: Wenn es zwei solcher Zerlegungen p1 · · · pn = q1 · · · qm gibt,
so ist q1 ein Teiler von p1 · · · pn . Weil q1 irreduzibel ist, muss q1 eines der pi
teilen, Weil aber auch die pi irreduzibel sind, muss q1 gleich einem der pi sein.
Dieses sei pσ(1) . Es gilt also
Y
pi = q2 · · · qm
i∈{1,...,n},i6=σ(i)
Fahre so fort!
Korollar 6.2.13 Sei f ∈ K[x] ein monisches Polynom, f = p1n1 · · · psns , wobei
die pi irreduzibel sind und paarweise teilerfremd. (Man nennt ni die Vielfachheit von pi in f .) Dann ist der ggT der Polynome fi := p fni , i = 1, . . . , s, das
i
Polynom x0 (= 1).
Beweis Angenommen, p ist ein irreduzibles Polynom vom Grad ≥ 1, das alle
fi teilt. Dann muss p 6= pi für i = 1, . . . s sein, denn pi ist kein Teiler von fi .
Andererseits muss p aber eines der pi sein, Widerspruch, also gibt es keinen
irreduziblen Teiler, dessen Grad ≥ 1 ist, und somit sind die fi teilerfremd. In R[x] kann man jedes Polynom als Produkt von Linearfaktoren (das sind
Polynome vom Grad 1) und Polynomen vom Grad 2 schreiben. Das folgt u.a.
aus dem Hauptsatz der Algebra, der besagt:
Satz 6.2.14 (Hauptsatz der Algebra) Jedes Polynom in C[x] kann als Produkt von Linearfaktoren geschrieben werden.
Der Beweis wird üblicherweise mit analytischen Methoden in einer fortgeschrittenen Analysisvorlesung geführt.
Der Satz impliziert für reelle Polynome folgendes: Ist f ∈ R[x], so kann f über
C vollständig in Linearfaktoren zerlegt werden. Wie sieht aber eine Zerlegung
über R aus?
Lemma 6.2.15 Ist f ∈ R[x] und ist γ = a + b i ∈ C eine Nullstelle von f , so
ist auch a − b i eine Nullstelle von f (wobei hier a, b ∈ R).
P
Beweis Sei f = ni=0 ai xi , ai ∈ R. Wir wenden
“komplex konjugieren”, d.h.
Pn
die Abbildung a + b i 7→ a − b i, auf f (γ) = i=0 ai γ i an.
Um zu zeigen, dass die irreduziblen Teiler eines reellen Polynoms höchstens den
Grad 2 haben, fassen wir nun (x − γ) und (x − γ) zusammen und stellen fest,
dass
(x − (a + b i))(x − ((a − b i)) = x2 − 2a + (a2 + b2 )
92
ein reelles Polynom ist. Die Nullstellen von f kommen also immer in Paaren
zweier komplex-konjugierter Nullstellen vor, die dann zu reellen Polynomen vom
Grad 2 zusammengefasst werden können.
6.3
Eigenwerte
In diesem Abschnitt sei V stets ein n-dimensionaler Vektorraum, und sei T ∈
End(V ). Solche linearen Abbildungen werden wir auch lineare Operatoren nennen.
Definition 6.3.1 Ein Element γ ∈ K heißt Eigenwert von T, wenn es ein
v ∈ V , v 6= 0 gibt mit T(v) = vγ. Ist γ ein Eigenwert, so heißt ein Vektor v mit
T(v) = vγ ein Eigenvektor. Die Menge Eig(T, γ) := {v ∈ V : T(v) = vγ}
heißt der zu γ gehörende Eigenraum.
Ist γ ein Eigenwert mit zugehörigem Eigenwert γ, so ist Eig(T, γ) der Kern der
linearen Abbildung T − γidV . Weil γ ein Eigenwert ist, besteht der Kern nicht
nur aus 0. Ist umgekehrt γ ∈ K derart, dass T − γidV nichtsingulär ist, so gilt
Kern(T − γ · idV ) 6= {0}, und somit ist γ ein Eigenwert, weil es dann im Kern
Vektoren v 6= 0 gibt mit T(v) = vγ.
In Matrizenform: Ist B eine Basis von V , so gilt
γ ist Eigenwert von T
⇔
[T]B
B − γI ist nicht invertierbar.
Häufig spricht man auch von Eigenwerten und Eigenvektoren von Matrizen T ∈
K(n,n) . Sie müssen dann T als lineare Abbildungen Kn → Kn interpretieren.
Lemma 6.3.2 Eig(T, γ) ist ein Unterraum von V .
Beispiel 6.3.3 Sei


5 −6 −6
2
T = −1 4
3 −6 −4
eine reelle Matrix, die wir mit der zugehörigen linearen Abbildung R3 → R3
identifizieren. Die reellen Zahlen 1 und 2 sind Eigenwerte, denn
   
3
3
T · −1 = −1 · 1
3
3
und


3
Eig(T, 1) = h−1i.
3
93
Der Eigenraum wird berechnet als Kern der durch


4 −6 −6
T − I = −1 3
2
3 −6 −5
definierten linearen Abbildung.
Die Zahl 2 ist ein Eigenwert, denn
   
2
2
T · 1 = 1 · 2.
0
0
Hier ist der Eigenraum zweidimensional:
   
2
2
Eig(T, 2) = h1 , 0i.
0
1
Definition 6.3.4 Sei T ein Endomorphismus auf V . Dann definieren wir die
Matrix
(n,n)
xI − [T]B
.
B ∈ K[x]
Die Determinante dieser Matrix heißt das charakteristische Polynom von
T. Notation: χT .
“Eigentlich” hängt das charakteristische Polynom noch von der Auswahl der
Basis B ab. Das folgende Lemma zeigt aber, dass dies nicht der Fall ist:
C
Lemma 6.3.5 det(xI − [T]B
B ) = det(xI − [T]C )
C
Beweis Sei P ∈ GL(n, K) die Matrix mit P−1 [T]B
B P = [T]C . Dann gilt
det(xI − [T]B
B) =
det(P−1 (xI − [T]B
B )P)
=
=
det(xI − P−1 ([T]B
B )P)
C
det(xI − [T]C ).
Mit anderen Worten: Das charakteristische Polynom ist unabhängig von der
konkreten Auswahl der Basis, bzgl. der T dargestellt wird, und wir können
deshalb in der Tat von dem charakteristischen Polynom von T sprechen. Das
gilt aber nur, wenn wir den Urbild- und den Bildbereich bzgl. derselben Basis
B darstellen.
Beispiel 6.3.6 (1.) Das charakteristische Polynom der Nullabbildung auf einem n-dimensionalen Vektorraum V ist xn , das charakteristische Polynom von
idV ist (x − 1)n .
94
(2.) Das charakteristische Polynom von T aus Beispiel 6.3.3 ist


x−5
6
6
x − 4 −2  = (x − 2)2 (x − 1).
det  1
−3
6
x+4
(3.) Dieses Beispiel zeigt, dass ein charakteristisches Polynom nicht notwendigerweise
in Linearfaktoren zerfallen muss: Das charakteristische Polynom von
0 1
∈ R(2,2) ist x2 + 1. (Wenn wir die Abbildung als Abbildung auf C2
−1 0
auffassen, zerfällt das Polynom in (x + i)(x − i).)
Die Bedeutung des charakteristischen Polynoms zeigt der folgende Satz:
Satz 6.3.7 Sei T ein linearer Operator auf V . Dann ist γ ∈ K genau dann ein
Eigenwert von T wenn χT (γ) = 0 gilt.
Beweis Das Element γ ist genau dann ein Eigenwert, wenn T − γidV singulär
ist. Das heißt aber, die Determinante einer Darstellungsmatrix von T − γidV ist
0, also ist (x − γ) ein Teiler des charakteristischen Polynoms.
Schauen wir uns noch einmal das Beispiel 6.3.6 (3.) an. Diese Matrix beschreibt
im “Anschauungsraum” R2 eine Drehung um 90 Grad nach rechts. Es ist klar,
dass eine solche Drehung keinen Eigenwert hat, weil keine Richtung festgehalten
wird. Deshalb kann das charakteristische Polynom keine Nullstelle haben!
Lemma 6.3.8 Sei V ein n-dimensionaler Vektrorraum, und sei T ein linearer
Operator auf V . Dann gilt:
(a.) deg χT = n.
(b.) T hat höchstens n verschiedene Eigenwerte.
Weil jede Matrix eine spezielle lineare Abbildung ist, können wir auch von Eigenvektoren und Eigenwerten von Matrizen sprechen.
Wir wollen die entsprechenden Begriffe für Matrizen noch einmal zusammenstellen:
Definition 6.3.9 Sei T ∈ K(n,n) . Ein γ ∈ K heißt Eigenwert, wenn es ein
v ∈ Kn , v 6= 0 gibt mit Tv = vγ.Das Polynom det(xI − T) heißt das charakteristische Polynom von T, Bezeichnung χT . Ein v mit Tv = vγ heißt
Eigenvektor. Die Menge der v ∈ Kn mit Tv = γv heißt der Eigenraum von γ
Das Lemma 6.3.5 besagt für Matrizen gerade folgendes:
95
Lemma 6.3.10 Ähnliche Matrizen haben dieselben charakteristischen Polynome.
Bemerkung 6.3.11Die Umkehrung dieses Lemmas gilt nicht: Die beiden Ma1 0
trizen I2 und
über R haben beide das charakteristische Polynom (x −
1 1
1)2 , sind aber nicht ähnlich, weil die Matrix I2 nur zu sich selbst ähnlich ist.
Allgemein gilt, dass die Eigenräume, die zu Eigenwerten ähnlicher Matrizen
gehören, gleiche Dimension haben müssen. Diese Dimensionen (geometrische
Vielfachheiten) sind aber nicht durch das charakteristische Polynom bestimmt!
Wir haben bislang nur über die Ähnlichkeit von Matrizen gesprochen. Wenn
eine lineare Abbildung bzgl. zweier verschiedener Basen dargestellt wird, so
sind die beiden Darstellungsmatrizen ähnlich. Nun kann es aber auch passieren,
dass zwei verschiedene lineare Abbildungen bzgl. verschiedener Basen identische
Darstellungsmatrizen haben. In dem Fall nennen wir die beiden linearen Abbildungen ähnlich. Wenn zwei lineare Abbildungen T1 und T2 ähnlich sind, so
sind zwei Darstellungsmatrizen von T1 und T2 ebenfalls ähnlich, unabhängig
von der Auswahl der Basen.
Charakteristische Polynome ähnlicher linearer Abbildungen sind gleich, deshalb
sind die Eigenwerte gleich. Die Eigenräume ähnlicher Matrizen sind aber nicht
gleich, wohl aber deren Dimensionen:
Lemma 1 Sei T ∈ K(n,n) , und sei γ ein Eigenwert von T. Ist P−1 TP = T′ ,
so ist γ auch ein Eigenwert von T′ und dim Eig(T, γ) = dim Eig(T′ , γ).
2
Beweis
dim Eig(T, γ) = n−Rang(T−γI) = n−Rang(P−1 (T−γI)P) = n−Rang(T′ −γI) = dim Eig(T′ , γ),
weil die Multiplikation mit P−1 von links die Hintereinanderausführung elementarer Zeilenumformungen ist, und die Multiplikation von rechts mit P ist die
Hintereinanderausführung elementarer Spaltenumformungen. Beides ändert den
Rang einer Matrix nicht!
Definition 6.3.12 Ist γ ein Eigenwert von T, und tritt x−γ mit Vielfachheit
di im charakteristischen Polynom von T auf, so nennt man di die algebraische Vielfachheit des Eigenwerts. Die Dimension dim Eig(T, γ) heißt die
geometrische Vielfachheit.
Eigenräume sind invariante Unterräume:
96
Definition 6.3.13 Ein Unterraum U ≤ V heißt T-invariant für einen linearen Operator T auf V falls das Bild von U unter T in U liegt, wenn also für
alle v ∈ U gilt: T(v) ∈ U .
Lemma 6.3.14 Sei U ein T-invarianter Unterraum von V , dim V = n, dim U =
s. Ferner sei B = (b1 , . . . bn ) eine Basis von V so, dass (b1 , . . . , bs ) eine Basis
von U ist. Dann hat die Darstellungsmatrix von T bzgl. B die Gestalt
S M
0 N
Die Matrix S ∈ K(s,s) ist eine Darstellungsmatrix von T|U .
Lemma 6.3.15 Ist γ ein Eigenwert von T, so ist Eig(T, γ) ein T-invarianter
Unterraum.
Beweis Übungsaufgabe.
Für spätere Verwendung notieren wir noch:
Lemma 6.3.16 Ist T ein linearer Operator auf V , und ist v ein Eigenvektor
zum Eigenwert γ, so gilt f (T)v = f (γ)v für alle f ∈ K[x].
Beweis Übungsaufgabe.
Satz 6.3.17 Sei d die algebraische Vielfachheit des Eigenwertes γ von T. Dann
gilt
dim Eig(T, γ) ≤ d.
Beweis Sei s die geometrische Vielfachheit des Eigenwertes γ. Wir stellen T
bzgl. einer Basis dar, in der die ersten s Vektoren gerade Eigenvektoren
zum Ei
S M
genwert γ sind. Dann hat T, dargestellt bzgl. dieser Basis, die Gestalt
,
0 N
wobei S eine Diagonalmatrix ist, deren sämtliche Diagonaleinträge γ sind. Das
charakteristische Polynom von T hat dann aber einen Faktor (x − γ)s , also
s ≤ d.
Definition 6.3.18 Ein linearer Operator heißt diagonalisierbar wenn es
eine Basis von V gibt, die nur aus Eigenvektoren besteht.
Wenn ein Operator diagonalisierbar ist, so hat er bzgl. der Basis, die aus Eigenvektoren besteht, Diagonalgestalt, d.h. alle Einträge außerhalb der Hauptdiagonale sind 0, und auf der Hauptdiagonalen stehen die Eigenwerte.
97
Beispiel 6.3.19 Der Operator aus Beispiel 6.3.3 ist diagonalisierbar. Bezüglich
der Basis
     
3
2
2
B = (−1 , 1 , 0)
3
0
1
ist die Darstellungsmatrix

1

0
D := [T]B
=
B
0
Wenn B ′ die kanonische Basis bezeichnet, so

3

P := [id]B
=
−1
′
B
3
und
P−1

0 0
2 0
0 2
ist die Transformationsmatrix

2 2
−1 0
0 1


−1 2
2
2 .
= −1 3
3 −6 −5
Es gilt D = P−1 TP.
Der folgende Satz gibt ein sehr schönes Kriterium für die Diagonalisierbarkeit
linearer Operatoren an:
Satz 6.3.20 Sei T ein linearer Operator auf dem n-dimensionalen Vektorraum
V . Dann sind die folgenden drei Bedingungen äquivalent:
(i) T ist diagonalisierbar.
(ii) χT = (x − γ1 )d1 · . . . · (x − γs )ds , wobei die γi paarweise verschieden sind,
und dim Eig(T, γi ) = di .
(iii) dim Eig(T, γ1 ) + . . . + dim Eig(T, γs ) = n.
Wir beweisen zunächst ein Lemma:
Lemma 6.3.21 Sei T ein linearer Operator auf V , und W1 , . . . , Wk seien k
verschiedene Eigenräume zu den verschiedenen Eigenwerten γ1 , . . . , γk . Dann
gilt
dim(W1 + . . . + Wk ) = dim W1 + . . . + dim Wk .
Mit anderen Worten: Sind die Bi Basen von Wi , so ist B = (B1 , . . . Bk ) eine
Basis von W := W1 + . . . Wk .
98
Beweis Klar ist dim(W1 + . . . + Wk ) ≤ dim W1 + . . . dim Wk . Um Gleichheit
zu zeigen müssen wir zeigen, dass die Vereinigung der Basen der Wi eine Basis
von W bilden. Wir zeigen dazu: Sind vi ∈ Wi Vektoren mit v1 + . . . + vk = 0,
so gilt v1 = . . . = vk = 0. Das zeigt dann, dass B eine Basis von W ist.
Wenn v1 + . . . + vk = 0 gilt, so gilt auch f (T)v1 + . . . f (T)vk = f (T)0 = 0
für jedes Polynom f ∈ K[x]. Wir wählen nun ein fi so, dass fi (γi ) = 1 und
fi (γj ) = 0 für i 6= j. Ein solches fi ist beispielsweise
(x − γ1 ) · · · (x − γi−1 )(x − γi+1 ) · · · (x − γk )
.
(γi − γ1 ) · · · (γi − γi−1 )(γi − γi+1 ) · · · (γi − γk )
Dann ist fi (T) = vi wegen Lemma 6.3.16.
Beweis (Beweis von Satz 6.3.20) Zur Implikation (i) ⇒ (ii): Wir wissen,
dass die Summe der algebraischen Vielfachheiten genau n ist, wenn das Polynom
in Linearfaktoren zerfällt (sonst gilt das nicht!). Wenn der Operator diagonalisierbar ist, muss die Summe der Dimensionen der Eigenräume auch n sein. Die
Aussage folgt dann aus Satz 6.3.17.
P
Die Implikation (ii) ⇒ (iii) folgt aus i di = n.
Schließlich ist (iii) ⇒ (i) eine Konsequenz von Lemma 6.3.21.
Korollar 6.3.22 Ein linearer Operator ist genau dann diagonalisierbar, wenn
sein charakteristisches Polynom in Linearfaktoren zerfällt und für alle Eigenwerte die algebraische gleich der geometrischen Vielfachheit ist.
Ein großer Teil der Vorlesung Lineare Algebra II befasst sich mit Verallgemeinerungen von Satz 6.3.20:
• Was geschieht, wenn das charakteristische Polynom nicht in Linearfaktoren zerfällt?
• Was geschieht, wenn das charakteristische Polynom zwar in Linearfaktoren
zerfällt, die geometrischen aber nicht gleich den algebraischen Vielfachheiten sind?
Wir beschließen diesen Abschnitt mit folgendem interessanten Satz:
Satz 6.3.23 Jedes monische Polynom vom Grad n in K[x] ist charakteristisches
Polynom einer geeigneten Matrix.
Pn−1
Beweis Sei f = xn + i=0 ai xi ∈ K[x]. Dieses Polynom ist das charakteristische Polynom von


0 0
0 ···
−a0
1 0
0 ···
−a1 


0 1
0 ···
−a2 


 ..
..  .
.

.


0 · · · · · · · · · −an−2 
0 0 · · · 1 −an−1
99
6.4
Zusammenfassung
• Sie haben gelernt, was eine Algebra ist.
• In K[x] kann man, ähnlich wie im Ring der ganzen Zahlen, Polynome in
irreduzible Polynome zerlegen.
• Diese Zerlegung ist im wesentlichen eindeutig.
• Matrizen und lineare Abbildungen können eventuell diagonalisiert werden.
• Sie kennen die Definition von Eigenwerten und Eigenvektoren.
• Wir haben ein wichtiges Diagonalisierbarkeitskriterium angegeben.
• Das charakteristische Polynom ist das entscheidende Hilfsmittel, um Eigenwerte auszurechnen.
• Es gibt Matrizen, die nicht diagonalisiert werden können. Sie sollten solche
Matrizen angeben können.
• Ähnliche Matrizen haben gleiche charakteristische Polynome.
• Es gibt Matrizen, die nicht ähnlich sind, aber gleiche charakteristische
Polynome haben.
• Wir haben erklärt, was invariante Unterräume sind.
100
Herunterladen