L ÖSUNGSVORSCHLÄGE ZUM 7. Ü BUNGSBLATT IN L INEARER A LGEBRA II Prof. Werner Bley, Franz Gmeineder December 9, 2011 Aufgabe 1 (a) Obwohl das Resultat dieser Aufgabe nicht sehr tiefliegend ist, hat es doch eine ganz wichtige Bedeutung: In einem unitären (und daher selbstverständlich auch euklidischen) Vektorraum kann das Skalarprodukt aus der Norm rekonstruiert werden. Doch nun zum eigentlichen Beweis. Wir müssen zeigen, dass gilt ||x + y||2 − ||x − y||2 + i||x + iy||2 − i||x − iy||2 = 4hx, yi Hierzu berechnen wir die einzelnen Summanden der linken Seite: ||x + y||2 = hx, xi + 2<hx, yi + hy, yi (1) ||x − y||2 = hx, xi − 2<hx, yi + hy, yi (2) Das ergibt schon mal ||x + y||2 − ||x − y||2 = 4<hx, yi. Weiters haben wir ||x + iy||2 = hx, xi + ihy, xi − ihx, yi + hy, yi (3) ||x − iy||2 = hx, xi − ihy, xi + ihx, yi + hy, yi (4) Ziehen wir Gleichung (4) von Gleichung (3) ab, so erhalten wir ||x + iy||2 − ||x − iy||2 = 2i (hy, xi − hx, yi) = 2i · (−2i=hx, yi) = 4=hx, yi Insgesamt folgt somit ||x + y||2 − ||x − y||2 + i||x + iy||2 − i||x − iy||2 = 4 (<hx, yi + i=hx, yi) = 4hx, yi und das war zu zeigen. (b) Wir zeigen i) ⇒ ii) ⇒ iii) ⇒ i) i) ⇒ ii) Beachte, dass die zu f adjungierte Abbildung f ∗ definiert ist via hf (x) , yi = hx, f ∗ (y)i ∀x, y ∈ V Nun ist nur noch zu beachten, dass für einen normalen Endomorphismus f ◦ f ∗ = f ∗ ◦ f gilt - dann folgt nämlich hf ∗ (x) , f ∗ (y)i = hx, f ∗ ◦ f (y)i |{z} = hx, f ◦ f ∗ (y)i |{z} = hf (x) , f (y)i ] ]] ∗ Dabei haben wir bei ] benutzt, dass f normal ist und bei ]], dass (f ∗ ) = f gilt. Da die Gleichung für alle x, y ∈ V gilt, haben wir die erste Implikation bewiesen. ii) ⇒ iii) Wir setzen einfach in ii) x = y und erhalten ||f ∗ (x) ||2 = hf ∗ (x) , f ∗ (x)i = hf (x) , f (x) = ||f (x) ||2 . Wurzelziehen auf beiden Seiten liefert die Behauptung, da Normen stets nichtnegativ sind. 1 2 iii) ⇒ i) Ein Skalarprodukt ist stets nicht-ausgeartet. Das heißt, (∀y ∈ V : hy, xi = 0) ⇒ x = 0 Sei nun x ∈ V beliebig. Dann folgern wir hx, f ◦ f ∗ (x)i = hf ∗ (x) , f ∗ (x)i = ||f ∗ (x) ||2 = = ||f (x) ||2 = hf (x) , f (x)i = hx, f ∗ ◦ f (x)i |{z} [ wobei wir bei [ die Voraussetzung iii) verwendet haben. Damit folgt ∀x ∈ V : hx, f ◦ f ∗ (x) − f ∗ ◦ f (x)i = 0 was ∀x ∈ V : f ◦ f ∗ (x) = f ∗ ◦ f (x) impliziert. Aufgabe 2 (a) Wir müssen zeigen, dass die angegebene Formel eine positiv definite hermitesche Form auf C [x] definiert. Wir zeigen also zunächst, dass Rh·, ·i eine R R Sesquilinearform ist. Die Additivität in beiden Argumenten vererbt sich wegen f + g = f + g auch auf unser Skalarprodukt. Andererseits ist für beliebige p, q ∈ Vn und λ ∈ C: Z bZ d Z bZ d p (z) q (z)dxdy = λhp, qi hλp, qi = λp (z) q (z)dxdy = λ a a c c Andererseits gilt: b Z d Z hp, λqi = p (z) λq (z)dxdy = a b Z c d Z b Z Z d p (z) λ · q (z)dxdy = λ a p (z) q (z)dxdy) = λhp, qi a c c Damit haben wir die Sesquilinearität gezeigt. Nun zur Hermitezität von h·, ·i. Hier bedienen wir uns der Erläuterung auf dem Übungsblatt. Seien p, q ∈ Vn . Dann gilt: b Z d Z hq, pi = Z b d Z q (z) p (z)dxdy = a a c b Z Z c q (z)p (z)dxdy |{z} = ? d q (z)p (z) dxdy = hp, qi a c Allerdings müssen wir noch begründen, warum die Umformung ? gerechtfertigt ist. Hierzu schreiben wir f (z) = f1 (z) + i · f2 (z). Dann gilt f (z) = f1 (z) − if2 (z). Hiermit folgern wir, dass Z b Z d Z b Z f (z)dxdy = a Z b Z c a d Z b c Z f1 (z) dxdy − i a c d f1 (z) + if2 (z)dxdy |{z} = Def d Z b Z f2 (z) dxdy = a d f (z) dxdy c a c gilt. Somit haben wir ? begründet und haben die Hermitezität gezeigt. Nun zur positiven Definitheit. Sei p ∈ Vn . Dann folgt Z b d Z hp, pi = Z b Z p (z) p (z)dxdy = a c a d |p (z) |2 dxdy c 2 Nun beachte, dass |p (z) | ≥ 0 ist für alle z ∈ C. Das heißt insbesondere, dass |p (z) | reell und nichtnegativ ist. Für z = x + iy schreiben wir kürzer z = (x, y). Wir zeigen nun: hp, pi = 0 ⇒ p (z) = 0 ∀z 3 hp, pi ≥ 0 Für alle y ist die Funktion d Z |p (x, y) |2 dx q (y) = c nichtnegativ und stetig. Ersteres folgt daraus, dass wir eine nichtnegative (!) Funktion über ein Intervall [c, d] mit c < d integrieren. Die zweite Aussage sieht man, indem man sich klar macht, dass eine Stammfunktion von |p (x, y) |2 bezüglich x wieder ein Polynom in y ist - und Polynome sind stetig. Wir erhalten Z Z Z b d b |p (x, y) |2 dxdy = Da a < b ist nach Voraussetzung und q nichtnegativ, folgt Z Z bZ d |p (x, y) |2 dxdy = a q (y) dy a c a b q (y) dy ≥ 0 a c Andererseits wissen wir aus der Analysis 1, dass für eine nichtnegative, stetige Funktion q auf einem Intervall [a, b] gilt: Z b q (y) dy = 0 ⇔ ∀y ∈ [a, b] : q (y) = 0 a Es folgt: Z b Z 0= a d |p (x, y) |2 dxdy = c Z b q (y) dy ⇒ (∀y ∈ [a, b] : q (y) = 0) ⇒ a ∀ (x, y) ∈ [a, b] × [c, d] : |p (x, y) |2 = 0 Also gilt auch hp, pi = 0 ⇒ ∀z: p (z) = 0. Damit haben wir gezeigt, dass durch die angegebene Struktur ein Skalarprodukt auf Vn definiert wird. (b) Nach Definition ist V1 der Vektorraum (!) der Polynome ersten Grades über C, d.h. seine Elemente haben die Form p (z) = a0 + a1 z Dabei seien sowohl die Konstanten a0 , a1 als auch die Variable z komplexe Zahlen. Wir wenden das Gram-Schmidtsche-Orthonormalisierungsverfahren an. Daher beginnen wir mit dem konstanten Polynom p1 (z) = 1 Im ersten Schritt müssen wir p1 lediglich normieren. Allerdings ist das hinfällig, denn s Z 1Z 1 p p hp1 , p1 i = 1 dxdy = (1 − 0) (1 − 0) = 1 0 0 Im zweiten Schritt wählen wir P2 (z) = z Nach Gram-Schmidt erhalten wir via z − h1, zi eine Polynomfunktion, die zu P1 orthogonal ist. Hierzu müssen wir h1, zi berechnen: 1 Z 1Z 1 Z 1 2 Z 1 x 1 (x − iy) dxdy = − iyx dy = − iy dy = 2 2 0 0 0 0 0 1 y y2 1 1 −i = −i 2 2 0 2 2 Wir erhalten als orthogonale Polynomfunktion demnach z 7→ z − q längere Rechnung ergibt ihre Norm 76 . Damit ist r 6 1 1 p2 (z) = z− +i 7 2 2 1 2 + i 21 . Wir normieren sie noch; eine 4 unsere gesuchte orthonormale Polynomfunktion. Die Polynomfunktionen p1 , p2 liefern unsere Orthonormalbasis von V1 . Aufgabe 3 Es reicht aus, die Aussage für zwei solche normalen Endomorphismen zu zeigen; der Rest folgt induktiv. Wir notieren mit E (fi , λ) den Eigenraum von fi zum Eigenwert λ. Da fi für alle i ∈ N normal ist, ist fi nach Vorlesung orthogonal diagonalisierbar. Das heißt insbesondere, dass wir V durch die orthogonale Summe der Eigenräume zerlegen können: V = E (fi , λ1 ) ⊥ · · · ⊥ E (fi , λk ) Analog können wir dasselbe für fj durchführen: V = E (fj , µ1 ) ⊥ · · · ⊥ E (fj , µl ) Hierbei seien λ1 , · · · , λk die verschiedenen Eigenwerte von fi und µ1 , · · · , µl diejenigen von fj . Nun kommt der C LOU: Für λ ∈ {λ1 , · · · , λk } ist der Eigenraum E (fi , λ) fj -invariant. Das heißt: fj (E (fi , λ)) ⊂ E (fi , λ) Hierzu sei x ∈ E (fi , λ). Dann gilt: fi (fj (x)) = fj (fi (x) = fj (λx) = λfj (x) Also ist fj (x) selbst Eigenvektor von fi zum Eigenwert λ, liegt demnach wieder in E (fi , λ). Wir zerlegen nun einen beliebigen Eigenraum E (fi , λq ), q = 1, · · · , k, indem wir H (q, r) = E (fi , λq ) ∩ E (fj , µr ) , r = 1, · · · , l setzen und E (fi , λq ) = H (q, 1) ⊥ · · · ⊥ H (q, l) zeigen. Zunächst ist E (fi , λq ) = l M H (q, r) r=1 Da aber Eigenvektoren zu verschiedenen Eigenwerten automatisch linear unabhängig sind, reduziert sich dies zu E (fi , λq ) = H (q, 1) + · · · + H (q, r) Sei nun x ∈ H (q, r). Dann gibt es für r = 1, · · · , l Vektoren xr ∈ E (fj , µr ) so dass x= l X xr r=1 und die x1 , · · · , xr orthogonal sind (schließlich gilt ja V = E (fj , µ1 ) ⊥ · · · ⊥ E (fj , µl )). Dann folgt aber fi (x) = l X fi (xr ) = λq x = r=1 l X λ q xr r=1 Mit der Eindeutigkeit der orthogonalen Summe schließen wir: fi (xr ) = λq xr für r = 1, · · · , l Damit folgt xr ∈ E (fi , λq ) und schließlich xr ∈ H (q, r) nach Konstruktion von H (q, r). Die Orthogonalität der Räume H (q, r) vererbt sich von der Orthogonalität der Eigenräume E (fj , µ1 ) , · · · , E (fj , µl ).1 Somit erhalten wir eine Orthonormalbasis von E (fi , λq ) aus gemeinsamen Eigenvektoren von fi und fj . Dies führen wir nun für jeden Eigenraum E (fi , λ1 ) , · · · , E (fi , λk ) durch. Da diese Räume orthogonal sind, führt die Vereinigung all dieser Basen zum Ziel. Nun überlegen wir uns noch, wie das Verfahren verallgemeinert werden kann. Hierzu überlegt man sich lediglich , dass unter den gegebenen Voraussetzungen für normale, vertauschende 1 Das kann man leicht anhand der Definition sehen. 5 Endomorphismen fi , fk folgendes gilt: fi fk ist wieder normal und vertauscht mit jedem anderen fl . Alles in allem sind wir an dieser Stelle fertig. A NMERKUNG DES L ÖSUNGSSKIZZENKOMPONISTEN : Die Existenz einer gemeinsamen Orthonormalbasis ist eine Grundsäule der Quantenmechanik. In ihr betrachtet man beobachtbare Größen (Observablen) als selbstadjungierte Operatoren. Diese sind automatisch normal; vertauschen sie zusätzlich, dann ist man in der Lage, bestimmte Eigenschaften der Observablen gleichzeitig, also simultan zu messen! Aufgabe 4 √ √ Wir zeigen, dass Z −2 = a + b −2: a, b ∈ Z ein euklidischer Ring ist. Hierzu machen wir uns zunächst √ klar, dass Z −2 überhaupt ein Integritätsring ist. √ Man überlegt sich leicht, dass Z −2 ⊂ C gilt. Somit vererben sich für + und · alle Rechengesetze von √ √ C auf Z −2 (d.h. Kommutativität, Assoziativität, Distributivität). Das Element 1 = 1 + 0 −2 ist das √ √ Einselement und 0 = 0 + 0 −2 das Nullelement. Wir zeigen nun, dass Z −2 unter den Operationen + und · abgeschlossen ist. Seien hierzu a, b, c, d ∈ Z. Dann folgt mit der Assoziavität und Kommutativität von C √ √ √ a + b −2 + c + d −2 = (a + b) + (c + d) −2 √ √ √ a + b −2 + c + d −2 = (ac − 2bd) + (bc + da) −2 Es sind √ a + b, c + d, ac − 2bd, bc + da ∈ Z und wir erhalten die Abgeschlossenheit. Mit diesen Überlegungen ist Z −2 tatsächlich ein Teilring von C mit derselben 0 und 1 - und daher ein Integritätsring. Es bleibt zu √ zeigen, dass Z −2 ein euklidischer Ring, und hierfür müssen wir einen euklidischen Betrag φ angeben. Zur Wiederholung: Wir nennen einen Integritätsring R euklidisch, wenn es eine Abbildung φ: R \ {0} → N0 mit der folgenden Eigenschaft gibt: Zu beliebigen a, b ∈ R und b 6= 0 existieren q, r ∈ R mit a = qb + r und r = 0 oder φ (r) < φ (b) Eine solche Abbildung φ heißt dann euklidischer Betrag. In unserem Beispiel geschieht das durch die Wahl √ φ a + b −2 = a2 + 2b2 √ √ √ oder, wenn wir die komplexe Schreibweise bevorzugen, durch |a + b 2i|2 = a + b −2 a − b −2 . Dies √ nennen wir die Norm von a + b −2. √ N UN ETWAS T HEORIE : Mit der komplexen Schreibweise sehen wir leicht, dass φ: Z −2 → N0 abbildet und multiplikativ ist: φ √ √ √ √ √ √ a + b −2 c + d −2 = a + b −2 a + b −2 c + d −2 c + d −2 = √ √ = φ a + b −2 φ c + d −2 Wir zeigen nun einen kleinen Hilfssatz, der sich später als nützlich erweist: u∈Z √ × −2 ⇔ φ (u) = 1 √ × √ √ × Dabei sind Z −2 die invertierbaren Elemente von Z −2 . Dies folgt so: Sei u ∈ Z −2 . Dann gibt es √ × ein u0 ∈ Z −2 mit uu0 = 1. das wiederum ergibt: 1 = φ (1) = φ (uu0 ) = φ (u) φ (u0 ) √ Es folgt φ (u) = 1, da φ: Z −2 → N0 abbildet. Andererseits ist φ (u) = uu = 1, und das impliziert u ∈ √ × √ × √ Z −2 . Was ist jedoch Z −2 ? Nach dem vorherigen Hilfssatz schließen wir mit u = a + b −2 u∈Z √ −2 × ⇔ φ (u) = 1 ⇔ a2 + 2b2 = 1 ⇔ a ∈ {−1, 1} ⇔ u ∈ {−1, 1} 6 √ × da a, b ∈ Z sind. Also gilt Z −2 = {−1, 1}. Z URÜCK ZUM EIGENTLICHEN B EWEIS : Wir wollen nun√ klären, warum die Norm einen Euklidischen Betrag liefert. Hierzu überlegen wir uns, dass die Punkte aus Z −2 ein Gitter in C bilden. Hierdurch entstehen √ √ Rechtecke der Höhe 2 und der Breite 1. Die√ Diagonale eines √ solchen Rechtecks hat die Länge 3. Wir nehmen uns nun, analog zur Definition, a ∈ Z −2 und b ∈ Z −2 \ {0}. Aufgefasst als Elemente in C können wir das Produkt ab−1 bilden. In einem Kreis K1 ab−1 = z ∈ C: |z − ab−1 | < 1 √ liegt immer ein Element von Z −2 . Das folgt daraus, dass ein Punkt auf/innerhalb des Rechtecks von dem nächsten Gitterpunkt maximal den Abstand √ 3 1 Diagonalenlänge = <1 2 2 hat. Dieses Element wollen wir q taufen. Setzen wir weiters r = a − qb, so erhalten wir: φ (r) = φ (a − qb) = (a − qb) (a − qb) = ab−1 − q b(ab−1 − q) b = = ab−1 − q (ab−1 − q)bb = |ab−1 − q|2 φ (b) |{z} < φ (b) ] −1 2 wobei wir bei ] ausgenutzt haben, dass eben |ab − q| <√1 nach Konstruktion gilt. Damit sind wird fertig. B EMERKUNG : Man mache sich klar, dass der Beweis für Z −3 nicht funktioniert.