Die Quantentheorie eines Teilchens (Dated: 6. Dezember 2012) Das vorliegende Skript präsentiert einen recht modernen Zugang zu den Konzepten, die die Quantenmechanik heute so präzie und umfassend wie möglich definieren, tragen und ausmachen, und der Phänomenologie, die sich zum einen aus diesen Konzepten ergibt und zum anderen in der Natur beobachtbar realisert ist. Bei aller Sorgfalt und Mühe vermag dieses Skript keinesfalls den bekannten Kanon von Lehrbüchern zu diesem Thema zu ersetzen. Ein hinreichend tiefes Verständnis dieser fundamentalsten Naturbschreibung ist nur möglich, wenn der gesamte Kanon genutzt wird, und nicht nur eines seiner Werke. PACS numbers: I. EINE INFORMELLE EINLADUNG Statt den hoffnungslosen Versuch zu unternehmen, bereits an dieser Stelle—ohne weitere begriffliche geschweige denn konzeptioneller Vorbereitung und Vorbildung— den Anwendungsbereich der Quantenmechanik konstruktiv zu definieren oder zumindestens zu charakterisieren, beginnen wir statt dessen mit einer Einladung. Ein wenig Ideengeschichte vorweg: O. Stern hat sich den weiter unten grob beschriebenen Versuchsaufbau 1921 ausgedacht und zusammen mit W. Gerlach 1922 in Frankfurt durchgeführt. Das sogenannte Stern– Gerlach–Experiment (SGE) illustriert eindrucksvoll den radikalen Bruch mit den Konzepten der klassischen Mechanik und dem klasischen Naturverständnis überhaupt. Das betrachtete System kann als das am wenigsten klassische und als das quantenmechanische System schlechthin betrachtet werden. Das SGE kann daher mit Fug und Recht als paradigmatisches Experiment bezeichnet werden. Das Studienobjekt, hier Silberatome und eine gewisse Eigenschaft, die diese tragen, sowie eine Messmethode basierend auf einer sogenannten Stern–Gerlach– Apparatur (SGA), darf Ihnen vollkommen unbekannt sein. Unser Ziel ist im Moment nicht ein präzises Verständnis des SGE mit all seinen relevanten und auch interessanten Komponenten. Vielmehr konzentrieren wir uns auf nicht–klassische Eigenschaften dieses Systems, die weniger mit dem hier betrachteten speziellen Versuchsaufbau zusammenhängen, als vielmehr von quantenmechanischen Eigentümlickeiten herühren, die wir extrahieren möchten. In einem Ofen werden Silberatome erhitzt, die durch eine kleine Öffnung im Ofen diesen verlassen können, und dann auf einen Spalt treffen, der die Silberatome passiv fokusiert. Diesen Teil des Versuchaufbaus bezeichnen wir mit Q. Hinter Q befinde sich ein inhomogenes Magnefeld, das von einem speziell geformten Magneten erzeugt wird. Schliesslich wird ein weiterer Spalt in den Strahlgang gebracht, wiederum zur passiven Fokussierung. Diesen zweiten Teil des Aufbaus bezeichnen wir mit M. Der dritte und letzte Teil dieses ersten Aufbaus bildet ein Detektor D, also eine Anordnung, die das Aufprallen von Silberatomen auf eine Oberfläche nachhaltig anzeigt. Die Prozessführung sieht also schematisch folgenderma- ßen aus: SGE≡ Q −→ M −→ D. Ein Silberatom stellen wir uns ganz primitiv als eine Ansammlung von 47 Elektronen und einem Kern vor. Dabei sind die Elektronen derart angeordnet, daß 46 von ihnen eine kugelsymmetrische Elektronenwolke um den Kern bilden, die keinen Gesamtdrehimpuls trägt. Der Kern spielt in unseren Betrachtungen keine Rolle, da das Experiment nur auf die Elektronenhülle, genauer auf das äusserste Elektron (in der 5s–Schale) sensitiv ist. Dieses trägt eine Eigenschaft (Observable), die wir Spin nennen, oder auch intrinsischen Drehimpuls, um sie vom Bahndrehimpuls (extrinsischer Drehimpuls) deutlich zu unterscheiden. Auch der Kern trägt diese Eigenschaft, allerdings ist er ∼ 105 mal schwerer als die Elektronenhülle und trägt daher nicht wesentlich zum magnetischen Moment µ des Silberatoms bei. Dieses ist praktisch alleine durch den Spin S des 5s–Elektrons gegeben: µ ≈ (e/me ) S , (1) wobei e < 0 und die Lichtgeschwindigkeit c = 1 gesetzt wurde. Das magnetische Moment koppelt an das inhomogene Magnetfeld B und die Wechselwirkungsenergie (potentielle Energie) dieser Konfiguration ist V = −hµ, Bi. Mit anderen Worten, das inhomogene Magnetfeld übt eine Kraft auf das Silberatom aus: F = −∇V = ∇ (hµ, Bi). Ohne Beschränkung der Allgemeinheit nehmen wir an, daß B = Bz ez , schliesslich können wir unser Koordinatensystem immer so ausrichten. Bei geeigneter Magnetfeldkonfiguration und Orientierung haben wir dann folgende Situation: Atome mit µz > 0 erfahren eine nach unten gerichtete Kraft, während Atome mit µz < 0 eine Beschleunigung noch oben erfahren1 . SGE erlaubt somit, µz ∝ Sz zu messen. Da die Ausrichtung des inhomogenen Magnetfeldes wichtig ist, notieren wir die Vorzugsrichtung immer mit, also SGEz . Die nahe liegende Frage ist, welche Verteilung von Silberatomen auf D wir erwarten? Zunächst die klassische 1 Auch wenn wir es hier mit Atomen zu tun haben, gilt diese klassische Betrachtungsweise. Der Spin ist hier die relevante nicht– klassische Eigenschaft, während das Atom aufgrund seiner grossen Masse einer klassischen Trajektorie folgt, wie wir später sehen werden. 2 Erwartung: Die Silberatome sind im Ofen beliebig ausgerichtet (es gibt ja keine Vorzugsrichtung) und jeder mögliche Wert µz ∈ I ≡ [−|µ|, |µ|] sollte demokratisch angenommen werden. Wir erwarten eine ensprechende Verteilung von Detektorregistrierungen über I, also etwa eine gleiche Anzahl von Treffern für jedes µz ∈ I nach hinreichend langer Experimentierdauer. Die klassische Erwartung hält der Konfrontation mit dem Experiment nicht stand: Tatsächlich spaltet sich der Strahl von Silberatomen in nur zwei disjunkte Strahlen auf, die nur zwei möglichen Werten Sz ∈ {Sz (+), Sz (−)} entsprechen. Natürlich kommt der z–Richtung dabei keine Sonderrolle zu. Damit sind wir noch lange nicht am Ende. Wir betrachten als nächstes Ketten von Stern–Gerlach Experimenten. Mit obigen Erläuterungen definieren wir: Def. I.1 Eine Stern–Gerlach Apparatur SGa (α) , (a ∈ {x, y, z} , α ∈ {±, +, −}) besteht aus einem inhomogenen Magnetfeld in a–Richtung, und einer nachgeschalteten Selektionsvorrichtung, die ausschliesslich die Spinkomponente(n) Sa (α) passieren lässt. Def. I.2 Eine Kette von Stern–Gerlach Experimenten K ({SGa (α)}) besteht aus einer Quelle Q, einer Sequenz von Stern–Gerlach Apparaturen SGa (α) , (a ∈ {x, y, z} , α ∈ {±, +, −}) und einem Detektor D. Wir betrachten zunächst einmal die folgende Kette: K(SGz (±), SGz (+)), also eine Komposition von zwei SGz –Apparaturen, wobei die erste Sz (−) aussortiert2 . Daher erwarten wir ausschliesslich Sz (+) auf D. Als nächstes betrachten wir die SGE– Kette K(SGx (±), SGz (+)). Im Detektor werden Sx ±– Anteile gleich häufig ausfallen. Bedeutet dies, daß 50 Prozent der Atome im Sz (+)–Strahl als Sx (+)– Komponente vorliegen? Im dritten Anlauf betrachten wir K(SGz (±), SGx (+), SGz (+)). Der Detektor registriert beide Spinkomponenten Sz (+) und Sz (−). Aber wie kann dies sein, SGz (+) hat doch als erstes Glied in der Sequenz alle Atome mit Sz (−) aussortiert? Es scheint, als ob das Glied SGx (+) die Wirkung von SGz (+) aufhebt bezüglich der auf D beobachteten Verteilung. Unsere zwar durch gesunden Menschenverstand aber dennoch offenbar falsche Intuition versagt bei der Interpretation von K(SGx (±), SGz (+)). Es ist klug, nun nach guten Analogien in anderen Bereichen der Physik zu suchen. Wir werden fündig in der elementaren Wellenoptik: Wir betrachten eine monochromatische Welle mit Wellenzahlvektor k = kez . Dabei kann es sich um x–polarisiertes Licht E = E(ωt − kz)ex handeln, oder auch um y–polarisiertes E = E(ωt−kz)ey , wobei in beiden Fällen E(ωt−kz) = E0 cos (ωt − kz) gilt, 2 Die Reihenfolge ist relativ zu einem von rechts einfallenden Strahl gewählt. und ω die Kreisfrequenz (∝ Energie) des elektrischen Feldes bezeichne. Nun brauchen wir eine schöne Analogie zu den SGa (α). Hier kommt sie: Def. I.3 Ein variabler Filter F ist eine Abbildung F : R3 × R3 −→ R3 , (A, B) −→ FA (B) ≡ hA, BiA . Hierbei heisst A die Polarisationsrichtung und die lineare Abbildung lin. FA : R3 −→ R3 , B −→ FA (B) heisst A–Filter. Sei nun E eine monochromatische Welle, die sich in z– Richtung ausbreitet. Nun nehmen wir einen ex –Filter zu Hand und gucken durch: Fex (E) = hex , Eiex . Natürlich ist Fex ◦Fex = Fex . Setzen wir nun stattdessen einen ey – Filter auf den ex –Filter, bilden wir also die Komposition Fey ◦ Fex , so wird es dunkel hinter dieser Filterkomposition: Fey (Fex (E)) = 0. Damit handelt es sich bei den Filtern Fex , Fey um Projektoren in der Ebene senkrecht zu k ∝ ez . Aber auch schon elementare Wellenoptik hat mehr zu bieten: Def. I.4 Unter einer Filtersequenz {FA }A∈M ⊂R3 verstehen wir die Komposition von A–Filtern, wobei A über die geordnete Menge M läuft. Hier kommt es offenbar auf die Reihenfolge an. Betrachten wir einmal die Filtersequenz Fex ◦ Fee ◦ Fey , wobei e e ⊥ k and e e 6= ex,y . Nun sind wir geschult in elementarer Wellenoptik, trotzdem ist es gut sich über folgendes zu wundern: Obwohl der erste Filter in obiger Sequenz alle x–polarisierten Anteile aus einer monochromatischen Welle filtert, besitzt die Welle nach dem Einsatz des e e– Filters wieder x–polarisierte Anteile. Offenbar hebt die Polariation mittels des e e–Filters die Wirkung des ey – Filters auf. Damit haben wir eine sehr passende Analogie zu den oben diskutierten SGE–Ketten. Nur hier kennen wir die mathematische Beschreibung: Zunächst einmal rotieren wir das Koordinatensystem, so daß k q ez . Nun, Fey (E) = Ey ey , und Fee (Fey (E)) = Ey Fee (ey ) = Ey hey , e eie e. Per Konstruktion ist heb , e ei 6= 0 , b ∈ {x, y}. Somit gilt: Fex (Fee (Fey (E))) = Ey hey , e ei Fex (e e) = Ey hey , e eihe e, ex i ex . (2) Unser mathematisches Modell liefert hier in der Tat das gewünschte Resultat, nämlich, daß die Wirkung des ey – Filters (partiell) aufgehoben wird durch den anschliessenden Einschub des e e–Filters. Wir erhalten nachweisbar wieder x–polarisierte Komponenten. Der Grund hierfür ist folgender: Die Wahl der z–Achse verlegt alle Polarisationseffekte in die Ebene, die k als Normale hat. Der erste 3 Polarisationsfilter führt in dieser Ebene eine Basis ein, die den Teilraum beschreibt, der durch den Polarisationsvektor gegeben ist, und auch den Teilraum senkrecht hierzu. Der Filter liefert also eine Basis. Bezüglich dieser Basis hat die Polarisationsrichtung des zweiten Filters ausschliesslich nicht–verschwindende Projektionen. Der dritte Filter konstituiert nun wieder die ursprüngliche Basis. Wir betrachten ein konkretes Beispiel: ^(ex , e e) = √ π/4, also he e, ex i = hey , e ei = 1/ 2. Nun spannt ja der zweite Polarisationsfilter auch eine Basis auf, die wir jetzt mit {e e≡e e1 , e e2 } bezeichnen. Wir haben dann Fee1 (E) = hE, e e1 ie e√ e1 i(he e1 , ex iex + he e1 , ey iey ) = 1 = hE, e e hE, e e√ (E) = hE, e1 i(−ex + 1 i(ex + ey )/ 2, und Fe e2 ey )/ 2. Wir fassen unsere elementaren Rechnungen zusammen: √ Fee1 (E) = hE, e e1 ie e1 = hE, e e1 i(ey + ex )/ 2 , √ Fee2 (E) = hE, e e2 ie e2 = hE, e e1 i(ey − ex )/ 2 . (3) Es ist an der Zeit, die Analogie dingfest zu machen: wir übertragen unsere Erkenntnisse aus der Wellenoptik auf das SGE. Dazu brauchen wir lediglich folgende Ersetzung zu machen: Sz (±)–Atome ←→ x, y–polarisiertes Licht, und Sx (±)–Atome ←→ 1, 2– polarisiertes Licht. Das entspricht natürlich noch keiner lexikografischen Ersetzung in der mathematischen Beschreibung. Das kommt jetzt: Gegeben sei die SGE–Kette K(SGz (±), SGx (+), SGz (+)). Wie modellieren wir diese und welche mathematischen Objekte brauchen wir dazu? Die Lichtwelle wurde durch einen Vektor beschrieben, bezüglich der Polarisationen hatten wir es mit einem zwei–dimensionalen Vektorraum zu tun (senkrecht zur Ausbreitungsrichtung der Welle). Dieser Polarisationsvektor beschrieb den Zustand des E–Feldes hinsichtlich der Frage, die uns interessierte. Der zwei–dimensionale Vektorraum ist also ein Zustandsraum und die Vektoren darin nennen wir Zustandsvektor. Wir bezeichnen den Vektor, der den Spinzustand eines Silberatoms (genauer seines 5s–Elektrons) bezogen auf ein inhomogenen Magnetfeldes in z–Richtung angibt mit |Sz ±i ∈ H, wobei wir den zwei–dimensionalen Zustandsraum H genannt haben. Kennen wir den Spinzustand a priori nicht, so schreiben wir kurz |ini ∈ H. Als nächstes benötigen wir eine operationelle Vorschrift, die ein SGE mit inhomogenen Magnetfeld in z– Richtung (äquivalent K(SGz (±))) erklärt. In der Wellenoptik war für die analoge Fragestellung eine mathematische Struktur wesentlich, nämlich ein Skalarprodukt, h◦|◦i, wobei ◦ ein Platzhalter ist. Dieses induziert eine geometrische Struktur auf H und erlaubt uns |ini = hSz − |ini|Sz −i + hSz + |ini|Sz +i , zunächst mit einer SGz (+)–Apparatur auf den einlaufenden Spinzustand |ini operieren wollen. Schematisch notiert soll gelten: SGz (+)|ini = hSz + |ini|Sz +i. Die SGz (+)–Apparatur können wir also folgendermaßen modellieren: Ihre Wirkung ist die einer Projektion auf |Sz +i entlang desselben Basiselementes. Formal3 können wir die Wirkung der SGz (+)–Apparatur so beschreiben: lin. Pz (a) ≡ |Sz aihSz a| : H −→ H , a ∈ {±} , df Pz (a) (|V i) = hSz a|V i|Sz ai . Offenbar handelt es sich bei den Pz (a) um Projektoren, wie Sie leicht überprüfen können. Kommen wir zur betrachteten SGE–Kette zurück, deren interessanter Bestandteil nun folgendermaßen angegeben werden kann: (Pz (−) ◦ Px (+) ◦ Pz (+))(|ini). Es ist einmal ganz ausführlich: Pz (+) (|ini) = = Pz (+) (hSz + |ini |Sz +i + hSz − |ini |Sz −i) = = hSz + |iniPz (+) (|Sz +i) + hSz − |iniPz (+) (|Sz −i) = = hSz + |ini |Sz +i . Und genauso weiter: Px (+) (Pz (+) (|ini)) = = hSz + |ini Px (+) (|Sz +i) = = hSz + |iniPx (+) (hSx + |Sz +i |Sx +i) = = hSz + |inihSx + |Sz +i |Sx +i . Endlich, Pz (−) Px (+) Pz (+) (|ini) = = hSz + |inihSx + |Sz +i Pz (−) (|Sx +i) = = hSz + |inihSx + |Sz +i Pz (−) (hSz − |Sx +i|Sz −i) = = hSz + |inihSx + |Sz +ihSz − |Sx +i|Sz −i . (6) Diese Rechnung verlief tatsächlich vollkommen analog zu (2). Unser mathematisches Modell kann den beobachteten Sachverhalt erfassen und der Wissenstransfer aus der elementaren Wellenoptik hat sich gelohnt. Für das Resultat (6) war ebenfalls wichtig, daß der einlaufende Zustand nicht mit einem Koordinatensystem ausgestattet war, dieses wird vielmehr durch die erste SG–Apparatur bereit gestellt und in dessen Basis entwickeln wir den einlaufenden Zustand, und so weiter. Analog zu (3) haben wir |Sx +i = hSz − |Sx +i|Sz −i + hSz + |Sx +i|Sz +i , |Sx −i = hSz − |Sx −i|Sz −i + hSz + |Sx −i|Sz +i . (7) (4) wie üblich zu interpretieren: die Zahlen (den Körper lassen wir noch unspezifiziert) hSz ± |ini interpretieren wir als Projektionen des unbekannten Spinzustandes |ini auf das betreffende Basiselement von H. daß wir diese Basis gewählt haben liegt einzig und alleine daran, daß wir (5) 3 Keine Sorge, die benötigten mathematischen Objekte werden alsbald eingeführt. Hier begnügen wir uns lediglich darauf zu zeigen, warum diese Objekte in der Naturbeschreibung auftauchen, und unterdrücken die Lust auf mehr Formalität noch. 4 Wenn wir fordern, daß hSx ± |Sx ±i = 1 gilt (Normierungsbedingung), so dürfen wir es wagen (in Anlehnung an das optische √ Analogon), folgendes anzunehmen: hS√ z ± |Sx +i = 1/ 2, und hSz − |Sx −i = −hSz + |Sx −i = 1/ 2. Die nächste Frage, die sich uns stellt und die wir ja verschoben hatten, ist die Frage nach einem geeigneten Körper K, über dem H liegt. Wir beginnen mit einer banalen Beobachtung in Anlehnung an (7): |Sy +i = hSz − |Sy +i|Sz −i + hSz + |Sy +i|Sz +i , |Sy −i = hSz − |Sy −i|Sz −i + hSz + |Sy −i|Sz +i . (8) Nun besitzt eine SGz –Apparatur eine Vorzugsrichtung, die durch das inhomogene Magnetfeld in ez –Richtung gegeben ist. Um diese Richtung besitzt das Experiment eine Rotationssymmetrie. Daher √ liegt es nahe, folgendes anzunehmen: hSz ±√|Sy +i = 1/ 2, und hSz − |Sy −i = −hSz + |Sx −i = 1/ 2. Diese Werte sind allerdings schon vergeben, siehe (7). Damit stellt sich die Frage, wie |Sy ±i dargestellt werden kann. Eine rasche Feststellung ist, daß K 6= R. Wieder hilft eine Analogie aus der elementaren Wellenoptik, wenn auch eine gewagterer— es steht ja aber auch einiges auf dem Spiel. Dieses Mal interessieren wir uns für zirkular polarisiertes Licht, das sich wieder in ez –Richtung ausbreiten soll. Ohne Beschränkung der Allgemeinheit betrachten wir folgende√zirkular polarisierte Lichtwelle: E = E(ωt − kz)ex / 2 + E(ωt − √ kz − π/2)ey / 2. In komplexer Schreibweise: E = √ exp (ωt − kz)(ex + iey )/ 2, wobei Re(E) = E/E0 . Klarerweise ist zirkular polarisiertes Licht leicht zu unterscheiden von linear polarisiertem Licht. In unsere Übersetzungsliste nehmen wir folgendes auf: (Sy +)–Atome ←→ rechts zirkular polarisiertes Licht, und (Sy −)–Atome ←→ links zirkular polarisiertes Licht. Dann bereiten die Zustände |Sy ±i überhaupt keine Probleme: √ √ |Sy ±i = |Sz +i/ 2 ± i|Sz −i/ 2 . (9) Wir sehen also, daß K = C unser Problem löst. Damit wird H also ein Vektorraum über dem komplexen Zahlenkörper. Nun ist es wichtig daran zu erinnern, daß die komplexe Schreibweise in der Elektrodynamik nur rechentechnisch von Bedeutung ist, die Zustände der Elektrodynamik aber immer reelle Vektorfelder sind. Tatsächlich können wir die zur zirkularen Polarisation notwendige Phasenverschiebung komplett reell erfassen, es ist halt nur bequemer mit komplexen Grössen zu rechnen. Dies ist im Falle der Spinzustände offenbar nicht der Fall: hier ist der komplexe Zahlenkörper essentiell, und kein Luxus. Wir benötigen für die betrachteten Projektionen einfach einen grösseren Wertevorrat, als der reelle Zahlenkörper zu bieten hat. Damit stossen wir aber auf komplexe Zustandsvektoren. Mit anderen Worten: die hier betrachteten Spinzustände sind komplexe Linearkombinationen. Folglich können die zur Beschreibung von SGE notwendigen Zustände keine Beobachtungsgrössen sein. Somit wird die zu studierende Theorie essentiell nicht–observabel zu formulieren sein. Eine grasse Abkehr von der klassischen Naturbeschreibung. II. PRÄLIMINARIEN (FUNDAMENTE) In diesem Kapitel wird eine hoffentlich angemessene Würdigung der mathematischen Konzepte dargelegt, wie sie zur Formulierung von physikalischen Sachverhalten in der Quantenmechanik zum Einsatz kommen. Allerdings liegt hier die Betonung auf den mathematischen Strukturen, weniger auf den praktischen Einsatz derselben. Auch nicht auf der durch Erfahrung gschulten Verwässerung dieser Konzepte, die eine bequeme Intuition ermöglichen. Die passiert in Kapitel III. Für das erste durchdenkende Lesen kann das vorliegende Kapitel bis zu den Weihnachtsferien aufgehoben werden, sollte dann aber in der einen oder anderen ruhigen Stunde tiefsinnig durchdacht werden. Wir brauchen also einen komplexen Vektorraum, der als Zustandsraum fungiert, und ein Skalarprodukt, das die relevante geometrische Struktur induziert. Diesen Luxus haben wir in der Quantenmechanik immer. Unsere Notation folgt P.A.M. Dirac, da diese viele Einsichten erleichtert (und sich gut memorieren lässt), und ungemein praktisch fürs bequeme Rechnen (allerdings auch etwas holprig bei formalen Manipulationen) ist. A. Die Geometrie von Hilbert–Räumen Def. II.1 Ein komplexer Vektorraum V heisst ein Prä–Hilbert–Raum, wenn es eine komplexwertige Funktion h◦|◦i : V × V −→ C gibt, die für alle |xi , |yi , |zi ∈ V und α ∈ C folgende Bedingungen erfüllt: (1) hx|xi ≥ 0 und hx|xi = 0 genau dann, wenn |xi = 0 (2) hx|y + zi = hx|yi + hx|zi (3) hx|αyi = αhx|yi (4) hx|yi = hy|xi∗ Die Funktion h◦|◦i heisst Skalarprodukt. Wir bringen zwei Beipiele: Bsp. II.1 Sei Cn , n ∈ N die Menge aller n–Tupels von komplexen Zahlen. Für x = (x1 , . . . , xn ) und y = (y1 , . . . , yn ) in Cn definiere wir df hx|yi = n X x∗j yj . (10) j=1 Bsp. II.2 Sei C[a, b] die Menge (wir brauchen es nicht genauer) der stetigen komplexwertigen Funktionen auf 5 dem abgeschlossenen Intervall [a, b] ⊂ R. Für f, g ∈ C[a, b] definieren wir df Z hf |gi = b dx f ∗ (x) g(x) . (11) a Wir kommen nun zu den nützlichen geometrischen Aspekten, die ein Prä–Hilbert–Raum ganz allgemein zu bieten hat. Def. II.2 Sei V ein Prä–Hilbert–Raum. Zwei Vektoren |xi , |yi ∈ V heißen orthogonal (zueinander), wenn hx|yi = 0. Sei I ⊂ N eine Indexmenge. Eine Menge {|xj i}j∈I von Vektoren in V heißt eine orthonormal Menge, wenn hxj |xj i = 1 ∀j ∈ I, und hxi |xj i = 0 , ∀i, j ∈ I , i 6= j gilt. df p Wir schreiben kurzerhand k|xik = hx|xi. Weiter unten zeigen wir, daß k ◦ k tatsächlich eine Norm ist. Satz II.1 (Satz von Pythagoras) Sei {|xa i}a∈I , I ⊂ N eine orthonormale Menge in einem Prä–Hilbert–Raum V. Dann gilt für alle |xi ∈ V k|xik 2 = X a∈I 2 X |hx|xa i| + |xi − |xa ihxa |xi (12) Lemma II.2 (Schwarzsche Ungleichung) Sei V ein Prä–Hilbert–Raum und |xi, |yi ∈ V. Dann gilt: khx|yik ≤ k|xik k|yik . (14) Beweis II.3 Der Fall |yi = |0i ist trivial. Sei also |yi = 6 |0i. Der Vektor |yi/k|yik bildet selbst eine orthonormale Menge. Mit Hilfe der Besselschen Ungleichung (II.1) folgt daher für jedes |xi ∈ V: 2 k|xik2 ≥ |hx|y/k|yiki| 2 y k|xik2 k|yik2 ≥ |hx|yi| , woraus sich unmittelbar die Behauptung ergibt. ∗–< [{; 0) Aus der Linearen Algebra ist bekannt, daß jeder normierte Vektorraum ein metrischer Raum ist. Der folgende Satz besagt nun, daß jeder Prä–Hilbert–Raum ein normierter Vektorraum ist. Satz II.2 Jeder Prä–Hilbert–Raum V ist ein normierter Vektorraum bezüglich der Norm df kxk = p hx|xi , ∀x ∈ V . (15) Beweis II.4 Als Übung. 2 a∈I Beweis II.1 Wir stellen |xi folgendermaßen dar: ! X X |xi = |xa ihxa |xi + |xi − |xa ihxa |xi . a∈I a∈I Eine kurze Rechnung zeigt, daß X X |xa ihxa |xi ⊥ |xi − |xa ihxa |xi . a∈I a∈I Folglich gilt k|xik2 = 2 2 X X |xa ihxa |xi = = |xa ihxa |xi + |xi − a∈I a∈I 2 X X 2 = |hxa |xi| + |xi − |xa ihxa |xi . a∈I a∈I Eine unmittelbare Einsicht, die sich aus Satz II.2 ergibt ist, daß wir auf V eine natürliche Metrik d haben: Für |xi , |yi ∈ V definieren wir df d(|xi, |yi) = p hx − y|x − yi . (16) Damit stehen uns Konzepte wie Konvergenz, Vollständigkeit und Dichte zu Verfügung. Insbesondere können wir V immer vervollständigen zu einem normierten Raum V 0 , in dem V isometrisch als dichte Untermenge eingebettet ist. Tatsächlich ist V 0 selbst ein Prä– Hilbert–Raum, da das Skalarprodukt von V auf V 0 wegen Stetigkeit erweitert werden kann. Def. II.3 Ein vollständiger Prä–Hilbert–Raum heisst Hilbert–Raum. Def. II.4 Zwei Hilbert–Räume H1 und H2 heißen isomorph (zueinander), wenn es eine lineare Abbildung U : H1 −→ H2 gibt, sodaß hU (x)|U (y)iH2 = hx|yiH1 , ∀|xi, |yi ∈ H1 (17) Damit ist der Satz bewiesen. ∗–< [{; 0) gilt. Eine solche Abbildung heisst unitärer Operator. Lemma II.1 (Besselsche Ungleichung) Sei {|xa i}a∈I , I ⊂ N eine orthonormale Menge in einem Prä–Hilbert–Raum V. Dann gilt für alle |xi ∈ V: X 2 k|xik2 ≥ |hx|xa i| . (13) Wir vertiefen diese Konzepte anhand einiger wichtige Beispiele, die Sie mit Hilverträumen vertraut machen, die für die Quantenmechanik relevant sind. a∈I Beweis II.2 Als Übung. ∗–< [{; 0) Bsp. II.3 Sei L2 ([a, b]) die Menge von komplexwertigen Funktionen auf I ≡ [a, b] ⊂ R, für die gilt: Z 2 (18) dx |f (x)| < ∞ . I 6 Wir definieren ein Skalarprodukt durch: Für alle f, g ∈ L2 (I) Z hf |gi = dx f ∗ (x)g(x) . (19) I Dies ist sinnvoll, da 2 |f ∗ (x)g(x)| ≤ |f (x)|2 +|g(x)|2 , also f ∗ (x)g(x) ∈ L1 (I). In Ihrer einführenden Vorlesung zur Funktionalanalysis beweisen Sie, daß L2 (I) vollständig und daher ein Hilbert–Raum ist. Ausserdem lässt sich zeigen, daß bezüglich der Norm sZ df 2 dx |f (x)| , kf k = (20) I L2 (I) gerade die Vervollständigung von C(I) ist. Bsp. II.4 Sei `2 die Menge der komplexen Zahlenfolgen {zn }n∈N , für die gilt: ∞ X 2 |zn | < ∞ . (21) n=0 h{yn }n∈N |{zn }n∈N i = ∞ X (yn )∗ zn . (22) n=0 Bei `2 handelt es sich um einen archetypischen Hilbertraum in folgendem Sinn: Jeder nicht endlich– dimensionale Hilbert–Raum mit einer abzählbar dichten Untermenge ist isomorph zu `2 . Damit ist `2 ein kanonisches Beispiel für einen Hilbert–Raum. Bsp. II.5 Sei µ ein Borel–Maß auf Rn . Dann bezeichne L2 (Rn , dµ) die Menge aller komplexwertigen Funktionen auf Rn , für die gilt: Z 2 dµ |f (x)| < ∞ . (23) Rn Bezüglich des Skalarproduktes Z df hf |gi = dµ f ∗ (x)g(x) (24) Rn wird L2 (Rn , dµ) zu einem Hilbert–Raum. B. df M⊥ = {|yi ∈ H | hy|xi = 0 , ∀|xi ∈ M} . Der Satz von Riesz Eine für uns wichtige Methode zur Konstruktion von neuen Hilbert–Räumen aus alten besteht darin, einen abgeschlossenen Unterraum M eines gegebenen Hilbert– Raumes H zu betrachten. Dabei erbt M das auf H erklärte Skalarprodukt und wird so selbst zu einem Hilbertraum. Dies erlaubt vertiefende geometrische Einsichten, die uns dann auch mit einer geometrischen Vorstellung von dualen Zuständen ausstattet. (25) Aus der Linearität des Skalarprodukts folgt, daß M⊥ ein linearer Unterraum von H. Ausserdem ist M⊥ abgeschlossen. Also ist auch M⊥ ein Hilbert–Raum. Die Hilbert–Räume M und M⊥ haben lediglich den Nullvektor gemein. Zentral wird folgende Aussage sein: Zu jedem abgeschlossenen Unterraum gibt es senkrechte Vektoren, und zwar ausreichend viele, so daß H = M + M⊥ = |xi + |yi | |xi ∈ M , |yi ∈ M⊥ . (26) Lemma II.3 Sei H ein Hilbert–Raum, M ⊂ H ein abgeschlossener Unterraum, und |xi ∈ H. Dann gibt es einen eindeutig bestimmten Vektor |zi ∈ M, der zu |xi den kürzesten Abstand hat. Beweis II.5 Sei d := inf |yi∈M k|xi − |yik. Wir wählen eine Folge {|yn i} , |yn i ∈ M mit k|xi − |yn ik −→ d. Dann gilt k|yn i − |ym ik2 Wir definieren ein Skalarprodukt durch: df Wir definieren das orthogonale Komplement M⊥ von M: k|yn i − |xi − (|ym i − |xi) k2 2k|yn i − |xik2 + 2k|ym i − |xik2 + −k − 2|xi + |yn i + |yn ik2 = 2k|yn i − |xik2 + 2k|ym i − |xik2 + −4k|xi − (|yn i + |yn i) /2k2 ≤ 2k|yn i − |xik2 + 2k|ym i − |xik2 − 4d2 −→ 2d2 + 2d2 − 4d2 = 0 . = = Die zweite Gleichung folgt aus der Parallelogramm– Identität, die Ungleichung resultiert aus (|yn i + |yn i) /2 ∈ M. Also ist {|yn i} eine Cauchy– Folge. Da M abgeschlossen ist, konvergiert {|yn i} gegen ein |zi ∈ M. Es folgt, daß k|xi − |zik = d. Die Eindeutigkeit überlassen wir einer Übung. ∗–< [{; 0) Nun kommt die zentrale geometrische Aussage, das Projektionstheorem: Satz II.3 Sei H ein Hilbert–Raum und M ⊂ H ein abeschlossener Unterraum. Dann kann jeder Vektor |xi ∈ H folgendermaßen eindeutig dargestellt werden: |xi = |zi + |wi , |zi ∈ M , |wi ∈ M⊥ . Beweis II.6 Sei |xi ∈ H. Nach dem Lemma II.3 gibt es ein eindeutig bestimmtes Element |zi ∈ M, daß |xi am nahesten ist. Wir setzen |wi = |xi − |zi. Klarerweise ist dann |xi = |wi + |zi. Sei |yi ∈ M und t ∈ R. Für d = k|xi − |zik gilt: d2 ≤ k|xi − (|zi + t|yi) k2 = k|wi − t|yik2 = d2 − 2t Re (hw|yi) + t2 k|yik2 . Folglich ist für alle t ∈ R: −2t Re (hw|yi) + t2 k|yik2 ≥ 0. Daher muß Re (hw|yi) = 0. Benutzen wir it statt t, so liefert ein ähnliches Argument, daß auch Im (hw|yi) = 0 gilt. Als Resultat haben wir somit: |wi ∈ M⊥ . Eindeutigkeit bleibt einer Übung vorbehalten. ∗–< [{; 0) 7 Das Projektionstheorem liefert einen natürlichen Isomorphismus zwischen H und M ⊕ M⊥ . Für uns ist es vollkommen in Ordnung, den Isomorphismus zu unterdrücken und einfach H = M ⊕ M⊥ zu notieren. Wir wenden uns nun beschränkten linearen Abbildungen von einem Hilbert–Raum H in einen anderen H0 zu. Sei B (H, H0 ) die Menge der beschränkten linearen Abbildungen von H nach H0 . Offenbar ist B (H, H0 ) ein Vektorraum. Wir definieren auf B (H, H0 ) die folgende Norm: Für T ∈ B (H, H0 ) setzen wir df kT k = sup kT (|xi) kH0 . (27) k|xikH =1 Für Interessierte: Bezüglich dieser Norm wird B (H, H0 ) ein Banach–Raum. Uns interessiert insbesondere der Fall H0 = C: Def. II.5 Der Vektorraum B (H, C) heißt der zu H duale Raum und wird mit H∗ bezeichnet. Die Elemente von H∗ heissen stetige lineare Funktionale. Eine anschauliche Charakterisierung von H∗ verdanken wir F. Riesz und M. Fréchet. Diese macht natürlich von der geometrischen Struktur auf H guten Gebrauch. Satz II.4 Zu jedem T ∈ H∗ existiert genau ein |yT i ∈ H mit T (|xi) = hyT |xi , ∀|xi ∈ H. Weiterhin gilt: k|yT ikH = kT kH∗ . Beweis II.7 Sei N := {|xi ∈ H | T (|xi) = 0}. Wegen der Stetigkeit von T folgt, daß N ⊂ H ein abgeschlossener Unterraum ist. Falls N = H, dann ist T (|xi) = 0 = h0|xi , ∀|xi ∈ H und wir sind fertig. Wir nehmen im weiteren an, daß N 6= H. Der Projektionssatz II.3 garantiert dann, daß es einen vom Nullvektor verschiedenen Vektor |x0 i ∈ N ⊥ gibt. Wir setzen |yT i := (T (|x0 i))∗ k|x0 ik−2 |x0 i. Es bleibt zu zeigen, daß |yT i die richtigen Eigenschaften hat. Falls |xi ∈ N , dann gilt T (|xi) = 0 = hyT |xi (da |yT i ∝ |x0 i ∈ N ⊥ ). Weiterhin, für |xi = α|x0 i , α ∈ C, haben wir T (|xi) = T (α|x0 i) = αT (|x0 i) = ∗ = h(T (|x0 i)) k|x0 ik−2 x0 |αx0 i = hyT |αx0 i . Da die Funktionen T (◦) und hyT |◦i linear sind und auf N und |x0 i übereinstimmen, stimmen sie auch überein auf dem Raum, der von N und |x0 i aufgespannt wird. Dieser Raum ist aber gerade H, denn jedes Element |yi ∈ H kann folgendermassen dargestellt werden: T (|yi) T (|yi) |yi = |yi − |x0 i + |x0 i . (28) T (|x0 i) T (|x0 i) Offenbar ist |yi − T (|yi) |x0 i/T (|x0 i) ∈ N und der letzte Term ist ∝ |x0 i. Also ist T (|xi) = hyT |xi , ∀|xi ∈ H. Nun zur Eindeutigkeit: Sei |y 0 i ∈ H und außerdem T (x) = hy 0 |xi. Insbesondere gilt dann einerseits T (|y 0 i − |yT i) = hy 0 |y 0 i − hy 0 |yT i, und andererseits T (|y 0 i − |yT i) = hyT |y 0 i − hyT |yT i. Daraus folgt nun, k|y 0 ik2 + k|yT ik2 − hy 0 |yT i − hyT |y 0 i = 0, also k|y 0 i − |yT ik2 = 0 y |y 0 i = |yT i, womit Eindeutigkeit gezeigt ist. Es bleibt zu zeigen, daß k|yT ikH = kT kH∗ . Wir bemerken (C als normierter Raum (C, | ◦ |)): kT kH∗ = |T (x)| = sup k|xikH =1 ≤ sup |hyT |xi| Schwarz = k|xikH =1 k|yT ikH k|xikH sup k|xikH =1 kT kH∗ = |T (x)| ≥ |T (|yT i/k|yT ikH )| sup k|xikH =1 = hyT ||yT i/k|yT ikH = k|yT ikH . Damit ist auch die letzte Behauptung des Satzes bewiesen. ∗–< [{; 0) Die Umkehrung von Satz II.4 gilt auch: jedes |yi ∈ H definiert ein stetiges lineares Funktional Ty ∈ H∗ durch Ty (|xi) = hy|xi , ∀|xi ∈ H. Daher schreiben wir in der Physik statt Ty in der Regel hy|. C. Othonormale Basen In diesem Abschnitt übertragen wir das Konzept der Basis von endlich–dimensionalen Vektorräumen auf vollständige Vektorräume, die mit einem Skalarprodukt versehen sind, also auf Hilbert–Räume. Sei S ⊂ H eine Menge orthonormaler Vektoren im Hilbert–Raum H, die in keiner anderen Menge orthonormaler Vektoren in H enthalten ist. Dann heißt S eine vollständige orthonormale Basis von H, kurz vONB(H), oder einfach vONB. Satz II.5 Jeder Hilbertraum H hat eine vONB. Beweis II.8 Bezeichne F ⊂ H die Familie von orthonormalen Mengen in H. Wir versehen diese Familie mit einer partiellen Ordnung: S1 ≺ S2 wenn S1 ⊂ S2 für beliebige S1,2 ∈ F. Die Familie F ist nicht–leer, denn mit |vi ∈ H ist |vi/k|vik eine orthonormale Menge. Seien nun {Sa }a∈A eine linear geordnete Untermenge von F. Dann ist die Vereinigung aller Sa , a ∈ A eine orthonormale Menge, die jedes Sa enthält und daher eine obere Schranke für {Sa }a∈A darstellt. Da jede linear geordnete Untermenge von F eine obere Schranke hat, können wir das Lemma von Zorn anwenden. Aus diesem folgt, daß F ein maximales Element besitzt. Also ein orthonormales System, das in keinem anderen orthonormalen System echt enthalten ist. ∗–< [{; 0) Der folgende Satz zeigt, daß, wie schon im endlich– dimensionalen Fall, jeder Vektor in einem Hilbert–Raum als Linearkombination von Basisvektoren dargestellt werden kann. 8 Satz II.6 Sei H ein Hilbert–Raum und S = {|ea i}a∈A eine ONB. Dann gilt für jedes |yi ∈ H: X |yi = |ea ihea |yi , (29) a∈A sX k|yik = 2 |hea |yi| . (30) a∈A Die Gleichung (29) ist folgendermaßen gemeint: Die Summe auf der rhs(29) konvergiert gegen |yi ∈ H von der Reihenfolge). Umgekehrt, ist P (unabhängig 2 < ∞ , ca ∈ C, so konvergiert die Lineara∈A |ca | P kombination a∈A ca |ea i gegen ein Element aus H. Beweis II.9 Aus der Besselschen Ungleichung (Lemma II.1) folgt, daß für jede endliche Untermenge A0 ⊂ A gilt: X 2 |hea |yi| ≤ k|yik2 . (31) a∈A0 Somit ist hea |yi 6= 0 für höchstens eine abzählbare Anzahl von a’s in A, die wir nach Belieben anordnen: 2 PN a1 , a2 , a3 , . . . , aN . Da die Summe j=1 heaj |yi monoton anwächst und gleichzeitig beschränkt Pnist, konvergiert sie im Limes N −→ ∞. Sei |yn i := j=1 |eaj iheaj |yi. Dann gilt für n > m, 2 X n k|yn i − |ym ik2 = |e ihe |yi aj aj j=m+1 n X heaj |yi2 . = j=m+1 Also ist {|yn i} eine Cauchy–Folge. Sei |zi ∈ H der Grenzwert dieser Cauchy–Folge. Wir notieren: hy − z|eak i = * = lim hy|eak i − n→∞ n X j=1 eaj heaj |yieak = |yi = lim n→∞ |eaj iheaj |yi . (33) j=1 Also gilt (29). Weiterhin folgt 2 n X 0 = lim |yi − |eaj iheaj |yi = n→∞ j=1 n X heaj |yi2 = = lim k|yik2 − n→∞ = k|yik2 − a∈A |v1 i = |w1 i/k|w1 ik |v2 i = |w2 i/k|w2 ik .. . |vn i = |wn i/k|wn ik .. . Die Menge {|vj i} ist eine orthonormale Menge und hat folgende nützliche Eigenschaft: Sei Im := {1, . . . , m} , m ∈ N. Für jedes m ∈ N spannen die Vektoren {|uj i}Im und {|vj i}Im den gleichen Vektorraum auf. Def. II.6 A metrischer Raum M heißt separabel, wenn es eine abzählbare Untermenge U gibt, die dicht in M liegt. Viele für die Praxis relevante Hilbert–Räume sind separabel. Diese können bis auf einen Isomorphismus wie folgt charakterisiert werden (ohne Beweis): D. (34) Beschränkte Operatoren 1. Adjungierte Es bezeichne L(X , Y) den Banach–Raum von Operatolin. ren O : X −→ Y, wobei X , Y selbst Banach–Räume seien. Uns interessiert am meisten der Fall L(H, H) ≡ L(H), mit H ein separabler Hilbert–Raum. Wir können hier nicht auf topologische Untersuchungen eingehen, allerdings sei erwähnt, daß L(X , Y) mit der Norm kT k = j=1 X hea |yi2 , j |w1 i = |u1 i |w2 i = |u2 i − |v1 ihv1 |u1 i .. . Pn−1 |wn i = |un i − j=1 |vj ihvj |un i .. . (32) Und für a 6= ak , k ∈ {1, 2, . . . , N } folgt hy − z|ea i = 0. Somit ist |y − zi orthogonal zu allen |ea i ∈ S , a ∈ A. Da nach Voraussetzung S eine vONB ist, muß |yi = |zi gelten. Damit ist n X Die Gleichung (30) heißt Parzevalsche Gleichung. Die Koeffizienten hea |yi werden oft Fourier–Koeffizienten von |yi bezüglich der Basis {|ea i}a∈A genannt. Der Grund für diese Namensgebung wird erst weiter unten klar. Dies ist eine gute Stelle, um an das Gram–Schmidt– Verfahren zur Konstruktion einer orthonormalen Menge zu erinnern. Gegeben seien linear unabhängige Vektoren |u1 i, |u2 i, . . . . Wir definieren Satz II.7 Ein Hilbert–Raum H ist genau dann separabel, wenn er eine abzählbare ONB S besitzt. Sind N < ∞ Vektoren in S, dann ist H isomorph zu CN . Gibt es abzählbar viele Elemente in S, so ist H isomorph zu `2 . + = hy|eak i − hy|eak i = 0 . woraus sich (30) ergibt. Die umgekehrte Schlussrichtung überlassen wir einer Übung. ∗–< [{; 0) kT |xikY , T ∈ L(X , Y) , |xi ∈ X (, 35) |xi6=|0i kxikX sup ausgestattet ist, die auf L(X , Y) eine Topologie induziert, die sogenannte Norm–Topologie. In dieser Norm ist die Komposition L(X , Y) × L(Y, Z) −→ L(X , Z) , (A, B) −→ A ◦ B stückweise stetig. 9 Sei T ∈ L(X , Y). Die Menge von Vektoren |xi ∈ X mit der Eigenschaft T |xi = |0i ∈ Y heißt der Kern von T und wird folgendermaßen notiert: Kern(T ). Die Menge der Vektoren |yi ∈ Y mit |yi = T |xi , |xi ∈ X heißt das Bild von T und wird mit Bild(T ) notiert. Offenbar ist Kern(T ) ⊂ X und Bild(T ) ⊂ Y. Der Kern(T ) ist ein abgeschlossener Unterraum, während das Bild(T ) nicht abgeschlossen zu sein braucht. Im Folgenden führen wir den zu einem beschränkten Operator adjungierten Operator ein. Mit obigen Bezeichnungen wird dabei zunächst (ein wenig spitzfindig) unterschieden zwischen Operatoren aus L(X , Y) und L(H). Wie weiter oben schon bemerkt, interessieren wir uns hauptsächlich für beschränkte lineare Transformationen O ∈ L(H) von Hilbert–Räumen H. Der Banch– adjungierte Operator zum beschränkten Operator T ∈ L(H, H) ist dann eine lineare Abbildung von H∗ nach H∗ . Sei C : H −→ H∗ , |yi −→ C(|yi)◦ := hy|◦i. Wir definieren eine lineare Abbildung T † : H −→ H als folgende Komposition Def. II.7 Seien X , Y Banach–Räume und T ∈ L(X , Y) beschränkt. Der beschränkte Operator T 0 ∈ L(Y ∗ , X ∗ ) (wobei X ∗ , Y ∗ die zu X , Y dualen Räume bezeichnen) sei folgendermaßen definiert: hx|T yi = (C|xi) (T |yi) = = (T 0 C|xi) (|yi) = hC −1 T 0 Cx|yi = = hT † x|yi . df (T 0 hy|) (|xi) = hy|T xi , ∀hy| ∈ Y ∗ , |xi ∈ X . (36) Der so definierte Operator T 0 heißt Banach–adjungiert zu T . Die Konstruktion ist sehr natürlich, bitte machen Sie sich das klar. Bemerken Sie folgende Schreibweise: |T xi ≡ T |xi ∈ Y. Ein bisschen klarer hätte man die Definition so notieren können: Sei Y 3 |zi := T |xi. Dann soll gelten: (T 0 hy|) (|xi) := hy|zi. In der Physik sind wir oft intuitiver was die Schreibweise betrifft: hyT 0 |xi := hy|T xi, wobei der duale Vektor (stetiges lineares Funktional) hyT 0 | := T 0 hy|. In der Physik wird formal nicht unterschieden zwischen der Operation von Elementen des dualen Vektorraumes und dem Skalarprodukt als lineare Abbildung, weil wir immer Hilbert–Räume zu Verfügung haben und uns daher zweckmäßig der Charakterisiung von Fréchet und Riesz bedienen. Satz II.8 Seien X , Y Banach–Räume. Die Abbildung L(X , Y) −→ L(Y ∗ , X ∗ ) , T −→ T 0 ist ein isometrischer Isomorphismus. Beweis II.10 Die Abbildung L(X , Y) 3 T −→ T 0 ∈ L(Y ∗ , X ∗ ) ist linear. Die Aussagen, daß T 0 beschränkt und obige Abbildung eine Isometrie ist folgen aus der Rechnung: kT kL(X ,Y) = sup k|xikX =1 kT |xikY = df T † = C −1 T 0 C . Dann gilt für alle |xi, |yi ∈ H: T † heißt der Hilbert–adjungierte Operator zu T ∈ L(H, H). Es hat sich eingebürgert, einfach vom adjungierten Operator zu sprechen. Wir listen einige Eigenschaften der Abbildung T −→ T † . Satz II.9 Es gilt mit offensichtlichen Notationen: (1) T → T † ist ein linearer isometrischer isomorphismus von L(H) auf L(H). † (2) (T S) = S † T † . (3) T † † = T. (4) Hat T ein beschränktes Inverses, T −1 , so hat auch −1 T † ein beschränktes Inverses, und es gilt T † = −1 † T . 2 (5) T † T = kT k . Beweis II.11 Als Übung. ∗–< [{; 0) Die folgende Definition ist zentral für die Quantenmechanik, insbesondere für die funktionalanalytische Charakterisierung von Observablen. Def. II.8 Ein beschränkter Operator T ∈ L(H) auf einem Hilbert–Raum H heißt selbstadjungiert, wenn T = T † gilt. ! = sup sup k|xikX =1 khy||Y ∗ =1 |hy|T xi| = ! = = |(T hy|) (|xi)| sup sup khy|kY ∗ =1 k|xikX =1 sup kT 0 hy|kX ∗ = khy|kY ∗ =1 0 = = kT 0 |kL(Y ∗ ,X ∗ ) . Die zweite Gleichung benutzt ein Korrolar des Hahn– Banach Theorems.∗–< [{; 0) Wir erinnern daran, daß auf Cn , n ∈ N, eine lineare Transformation genau dann selbstadjungiert ist, wenn in einer orthonormalen Basis die zugeordnete Matrix invariant ist unter der Komposition von Spiegelung an der Diagonalen und komplexer Konjugation. Eine wichtige Klasse von Operatoren auf einem Hilbert–Raum bilden die sogenannten Projektoren. Def. II.9 Sei P ∈ L(H). Gilt P 2 := P ◦ P = P , so heißt P eine Projektion. Gilt zusätzlich P = P † , so heißt P eine orthogonale Projektion. 10 Bild(P ) ist ein abgeschlossener Unterraum, auf dem P wie die Identität operiert. Ist P sogar orthogonal, dann ⊥ gilt:P (Bild(P )) = 0. Sei H 3 |xi = |yi + |zi , |yi ∈ ⊥ Bild(P ) , |zi ∈ (Bild(P )) , die vom Projektionssatz II.3 garantierte Zerlegung, dann gilt P |xi = |yi. P heißt die orthogonale Projektion auf Bild(P). Mit anderen Worten: der Projektionssatz II.3 konstituiert eine bijektive Korrespondenz zwischen orthogonalen Projektionen und abgeschlossenen Unterräumen. Wir sind ausschließlich an orthogonalen Projektionen interessiert und unterdrücken daher die Qualifikation orthogonal im weiteren. 2. Das Spektrum Sei nun T ∈ L(Cn , Cn ) , n ∈ N. Die Eigenwerte von T sind dann die λ ∈ C mit T − λI = 0. Die Menge dieser λ heißt das Spektrum von T . Das Spektrum von T kann höchstens aus n Punkten bestehen, da det(T − λI) ein Polynom vom Grade n ist. Ist λ kein Eigenwert von T , so kann T − λI invertiert werden, da dann det(T − λI) 6= 0. Die Spektraltheorie von Operatoren auf unendlich– dimensionalen Vektorräumen ist wesentlich interessanter und extrem relevant für die Charakterisierung der Operatoren selbst (und damit der Observablen, wie wir sehen werden). Wir werden präziser: Beweis II.12 Wir beginnen mit dem Beweis von (2). Zunächst eine kurze Rechnung: Seien λ ∈ C , |xi ∈ H. Dann ist 2 k[T − (Re(λ) + i Im(λ))] |xik = 2 2 2 = k[T − Re(λ)] |xik + (Im(λ)) k|xik . 2 2 2 Also, k[T − (Re(λ) + i Im(λ))] |xik ≥ (Im(λ)) k|xik . Für Im(λ) 6= 0 ist daher die Abbildung T − (Re(λ) + i Im(λ)) injektiv und hat ein beschränktes Inverses auf ihrem Wertebereich, der abgeschlossen ist. Ist nun Bild(T − (Re(λ) + i Im(λ))) 6= H, so wäre (Re(λ) + i Im(λ)) ∈ σ(T ), im Widerspruch zu obiger Ungleichung. Also ist (Re(λ) + i Im(λ)) ∈ ρ(T ) für Im(λ) 6= 0. Damit ist (2) gezeigt. Sei nun Im(λ) = 0 und λ ∈ ρ(T ). Dann wäre λ∗ = λ ∈ σ(T † ) = σ(T ), im Widerspruch zur Definition von Punkt– und Residualspektrum, die ja disjunkt sind. Damit ist (1) gezeigt. (3) überlassen wir einer Übung. ∗–< [{; 0) Wir charakterisieren nun einige Klassen von relevanten beschränkten Operatoren. 3. Positive Operatoren Def. II.10 Sei T ∈ L(X ). Die Resolventenmenge ρ(T ) von T ist die Menge aller λ ∈ C, für die T − λI bijektiv ist und ein beschränktes Inverses besitzt. Rλ (T ) = (T − λI)−1 heißt die Resolvente von T bei λ. Das Spektrum σ(T ) von T besteht aus allen C 3 λ 3 ρ(T ). Wir wollen im Folgenden zeigen, daß eine spezielle Darstellung von Operatoren auf Hilbert–Räumen existiert, die ähnlich der Polardarstellung von komplexen Zahlen C 3 z = |z| exp (i arg(z)) ist. Dazu benötigen wir ein Analogon zu den positiven reellen Zahlen. Wir merken noch an, daß T − λI automatisch ein beschränktes Inverses besitzt, wenn es bijektiv ist. Wir unterscheiden zwei Teilmengen des Spektrums: Def. II.12 Sei H ein Hilbert–Raum. Ein Operator B ∈ L(H) heißt positiv, wenn hBx|xi ≥ 0 , ∀|xi ∈ H. Wir schreiben B ≥ 0, wenn B positiv ist und B ≤ A (A ∈ H) wenn A − B ≥ 0. Def. II.11 Sei T ∈ L(X ). (1) Ein Vektor |xi 6= 0 mit T |xi = λ|xi , λ ∈ C heißt Eigenvektor von T , und λ heißt der zugehörige Eigenwert. Ist λ ein Eigenwert, dann ist T − λI nicht injektiv, also ist λ ∈ σ(T ). Die Menge aller Eigenwerte heißt das Punktspektrum von T . (2) Ist λ kein Eigenwert und ist Bild(T − λI) nirgends dicht in X , so gehört λ zum Residualspektrum. Der Grund warum hier diese Unterscheidung eingeführt wird ist, daß selbstadjungierte Operatoren kein Residualspektrum besitzen. Satz II.10 Sei T ∈ L(H) ein selbstadjungierter Operator auf einem Hilbert–Raum H. Dann gilt: (1) T besitzt kein Residualspektrum. (2) σ(T ) ⊂ R. (3) Eigenvektoren zu unterschiedlichen Eigenwerten von T sind orthogonal zueinander. Jeder beschränkte positive Operator auf einem komplexen Hilbert–Raum ist selbstadjungiert. Das sehen wir folgendermaßen ein: Ist A ein positiver Operator, so ist hAz|zi = hAz|zi∗ = hz|Azi , ∀|zi ∈ H, d.h. hz|Azi ∈ R. Wir betrachten den Fall |zi = |xi + |yi , |xi, |yi ∈ H. Da A positiv ist, folgt aus obiger Gleichung Im (hAx|yi) = Im (hx|Ayi) , ∀|xi, |yi ∈ H. Das kann nur der Fall sein, wenn Im (hAx|yi) = 0, also hAx|yi = hx|Ayi , ∀|xi, |yi ∈ H. Dies bedeutet aber gerade, daß A selbstadjungiert ist. Beachten Sie, daß es essentiell war, einen Hilbert–Raum über dem komplexen Zahlenkörper zu betrachten. Für jeden Operator A ∈ L(H) gilt: A† A ≥ 0, denn hA† Ax|xi = kA|xik2 ≥ 0 , ∀|xi ∈ H. In Anlehnung an √ √ ∗ † |z| = z z , ∀z ∈ C läge es nun nahe |A| := A A zu definieren. Dafür müssen wir uns aber versichern, daß wir Wurzeln aus positiven Operatoren ziehen können. Wir beginnen mit einem Lemma: √ Lemma II.4 Die Taylor–Reihenentwicklung von 1 − z an der Stelle z = 0 konvergiert absolut für z ∈ C mit |z| ≤ 1. 11 √ 2 Beweis II.13 Sei 1 − z = c√ 0 + c1 z + c2 z + . . . die Taylor–Reihenentwicklung von 1 − z am Ursprung. Da √ 1 − z analytisch ist für |z| < 1, konvergiert die Reihe √ für |z| < 1 absolut. Die Ableitungen von 1 − z am Ursprung sind alle negativ, also cj < 0 , N 3 j ≥ 1. Somit gilt für ein beliebiges N ∈ N N X |cj | = 2 − j=0 n X cj = j=0 = 2 − lim− x→1 ≤ 2 − lim x→1− y ∞ X n X cj x j = 1−x= = 2y |cj | ≤ 2 . j=0 Daraus folgt unmittelbar, daß die Reihenentwicklung für |z| = 1 absolut konvergiert. ∗–< [{; 0) Satz II.11 Sei A ∈ L(H) und A ≥ 0. Dann gibt es einen eindeutig bestimmten Operator B ∈ L(H) mit B ≥ 0 und B 2 = A. Beweis II.14 Es genügt den Fall kAk ≤ 1 zu betrachten. Da kI − ak ≤ 1 ist, folgt auf dem Lemma II.4, daß die Reihe c0 +c1 (I −A)+c2 (I −A)2 +. . . bezüglich der Norm– Topologie absolut gegen ein B ∈ L(H) konvergiert. Daher können wir die Reihe quadrieren und die Terme geeignet umsortieren und so zeigen, daß B 2 = A. Da weiterhin 0 ≤ I − A ≤ I ist, folgt 0 ≤ hx|(I − A)n xi ≤ 1 , ∀n ∈ N, |xi ∈ H : k|xik = 1. Daher, hx|Bxi = 1 + ∞ X ≥ 1+ Wir sind jetzt am Ziel: Satz II.12 Polarzerlegung Sei H ein Hilbert–Raum und A ∈ L(H) beschränkt. Dann gibt es eine partielle Isometrie U mit der Eigenschaft: A = U |A|. Dabei ist U eindeutig bestimmt aus der Forderung Kern(U ) = Kern(A). Außerdem ist Bild(U ) = Bild(A). Beweis II.16 Wir definieren U : Bild(|A|) Bild(A) , U (|A||xi) := A|xi , |xi ∈ H. Da k|A| |xik 2 −→ = hx||A|2 |xi = hx|A† A|xi 2 = kA|xik , ist U wohl definiert, d.h. wenn |A||xi = |A||yi, dann gilt A|xi = A|yi. U is eine Isometrie auf Bild(|A|), und induziert auch eine Isometrie auf auf Bild(A). U kann bequem auf ganz H erweitert werden, dazu brauchen wir lediglich U |ni := 0 , |ni ∈ (Bild(|A|))⊥ ⊂ H. Da |A| selbstadjungiert ist, ist (Bild(|A|))⊥ = Kern(|A|). Außerdem ist |A||ni = 0 genau dann, wenn A|ni = 0, so daß Kern(|A|) = Kern(A). Damit gilt: Kern(U ) = Kern(A). Eindeutigkeit überlassen wir einer Übung. ∗–< [{; 0) cj hx|(I − A)n xi = j=1 ∞ X Lemma II.5 Sei U ∈ L(H) eine partielle Isometrie des Hilbert–Raumes H. Dann ist Pin := U † U die Projektion auf (Kern(U ))⊥ , und Pfi := U U † ist die Projektion auf Bild(U ). Umgekehrt, ist U ∈ L(H) und sind U † U und U U † Projektoren, so ist U eine partielle Isometrie Beweis II.15 Als Übung.∗–< [{; 0) j=0 √ Wenn U eine partielle Isometrie ist, dann kann der Hilbert–Raum H folgendermaßen dargestellt werden: H = Kern(U ) ⊕ (Kern(U ))⊥ und auch H = Bild(U ) ⊕ (Bild(U ))⊥ . U ist ein unitärer Operator U : (Kern(U ))⊥ −→ Bild(U ). Und U † ist gerade die Umkehrabbildung, also U † : Bild(U ) −→ (Kern(U ))⊥ . 4. cj = 0 , ∀|xi ∈ H , j=1 wobei wir cj < 0 , N 3 j ≥ 1 und die Abschätzung aus dem Lemma II.4 benutzt haben. Folglich gilt: B ≥ 0. Eindeutigkeit zeigen wir hier nicht. ∗–< [{; 0) So, jetzt haben wir alles beisammen: Def. II.13 Sei A ∈ L(H). Dann |A| := √ A† A. Bitte die Bezeichnung mit Vorsicht genießen: Für A, B ∈ L(H) gilt weder |AB| = |A||B|, noch |A| = |A† |, im allgemeinen! Das Analogon zu den komplexen Zahlen auf dem Einheitskreis stellt sich nicht so direkt ein. Def. II.14 Ein Operator U ∈ L(H) heißt eine Isometrie, wenn gilt: k|U xik = k|xik , ∀|xi ∈ H. U heißt eine partielle Isometrie, wenn U eingeschränkt auf den abgeschlossenen Unterraum (Kern(U ))⊥ eine Isometrie ist. Kompakte Operatoren Viele Fragestellungen in der Physik sind natürlicher Weise als Probleme von Differentialgleichungen formuliert. Eine Umformulierung dieser Fragestellungen als Integralgleichungen erlaubt oft neue Einsichten und auch deren Beantwortung. Das wohl bekannteste Beispiel in dieser Kategorie ist das weiter unten diskutierte Dirichlet–Problem. Vorbereitend betrachten wir einen Operator K ∈ L(C[0, 1]), definiert durch Z 1 df (KΦ) (x) = dy G(x, y)Φ(y) , 0 wobei die Funktion G(x, y) stetig auf x, y ∈ I := [0, 1] ⊂ R sei. G(x, y) heißt der Integralkern zum Integraloperator K. Es gilt (beachten Sie, daß y ∈ [0, 1]) |(KΦ) (x)| ≤ sup |G(x, y)| sup |Φ(y)| y x,y∈I y kKΦk∞ ≤ y∈I sup |Φ(y)| kΦk∞ . y∈I 12 Somit ist K ein beschränkter Operator auf C[0, 1]. Der Integraloperator K hat eine weitere sehr wichtige Eigenschaft: Bezeichne BM := {Φ ∈ C[0, 1] : kΦk∞ ≤ M } , M ∈ R. Da G(x, y) stetig ist für x, y ∈ I, und weiterhin der I×I kompakt ist, ist G(x, y) sogar gleichmäßig stetig auf I × I. Also zu einem gegebenen R 3 ε > 0 gibt es ein R 3 δ > 0, so daß |x − x0 | < δ bereits impliziert |G(x, y) − G(x0 , y)| < ε , ∀y ∈ I. Ist nun Φ ∈ BM , so folgt |(KΦ) (x) − (KΦ) (x0 )| ≤ ≤ sup |G(x, y) − G(x0 , y)| kΦk∞ y∈I ≤ εM . Somit sind die Funktionen K[BM ] gleichgradig stetig. Da sie auch gleichmäßig beschränkt sind durch kKkM , kann mit dem Satz von Ascoli gefolgert werden, daß zu jede Folge Φn ∈ BM , die Folge KΦn eine konvergente Teilfolge besitzt, wobei der Grenzwert nicht in der Menge K[BM ] liegen muß. Mit anderen Worten: Die Menge K[BM ] ist präkompakt, d.h. die abgeschlossene Hülle von K[BM ] ist kompakt in C[0, 1]. Dabei spielt die konkrete Wahl von M ∈ R keine Rolle, und wir haben gezeigt, daß der Integraloperator K beschränkte Mengen in präkompakte Mengen abbildet. Def. II.15 Seien X , Y Banach–Räume. Ein Operator T ∈ L(X , Y) heißt kompakt, wenn T beschränkte Mengen in X auf präkompakte Mengen in Y abbildet. Äquivalent, T heißt kompakt genau dann, wenn für jede beschränkte Folge {xn } ⊂ X , die Folge {T xn } eine konvergente Teilfolge in Y besitzt. Bsp. II.6 Neben der oben betrachteten Klasse von Integraloperator spielt die folgende Klasse von Operatoren eine wichtige Rolle. Sei dim(Bild(T )) < ∞. Also besitzt |yi ∈ Bild(T ) die folgende Darstellung: |yi = T |xi = N X αj |ej i , wobei N ∈ N, und {|ej i}j={1,...,N } ∈ Y eine vorgegebene Familie von Vektoren ist. Ist {|xn i} eine beschränkte Folge von Vektoren in X , so sind die Koeffizienten αnj beschränkt, weil T beschränkt ist. Wir können (wie üblich) eine konvergente Teilfolge von T |xn i isolieren, womit gezeigt ist, daß T kompakt ist. Banach–Räume und T Satz II.14 Sei H ein separabler Hilbert–Raum. Bezüglich der Norm–Topologie, ist jeder kompakte Operator T ∈ L(H) der Limes einer Folge {Tn } von Operatoren mit dim(Bild(Tn )) < ∞ , n ∈ N. Beweis II.17 Der Beweis setzt ein paar mehr topologische Betrachtungen voraus, als wir hier disktutiert haben. Allerdings können wir die essentielle Schlussfolgerung trotzdem würdigen, zumindestens moralisch. Sei also T ∈ L(H) gegeben. Der konstruktive Teil des Beweises ist dann lediglich eine kleine Rechnung: Sei {|ej i}j∈N eine orthonormale Menge in H. Wir betrachten die Folge df Tn = n X T |ej ihej |◦i . j=1 Offenbar gilt Tn −→ T in der Norm–Topologie. ∗–< [{; 0) Bisher haben wir noch keine wirklich überzeugende Motivation für das Studium von kompakten Operatoren geliefert. Grundsätzlich sind kompakte Operatoren wegen der sogenannten Fredholmschen Alternative von so großer Bedeutung. Worum geht es dabei? Sei H ein Hilbert–Raum und A ∈ L(H) kompakt. Dann gilt entweder A|xi = |xi , |xi ∈ H, oder aber (A − I)−1 existiert. Machen Sie sich klar, daß diese Eigenschaft keineswegs von allen beschränkten Operatoren geteilt wird. Satz II.15 (Fredholm) Sei D ⊂ C offen und zusammenhängend, und f : D −→ L(H) eine analytische operatorwertige Funktion mit: f (z) ist kompakt für alle z ∈ D. Dann gilt genau eine der folgenden Aussagen: (1) (f (z) − I)−1 ist nicht definiert für z ∈ D. j=1 Satz II.13 Seien X , Y L(X , Y). Satz II.13 zeigt, daß der Grenzwert einer Folge von Operatoren mit den Spezifikationen von Beispiel II.6 ein kompakter Operator ist. Gönnen wir uns einen Hilbert– Raum, so ist auch die Umkehrung war, wie der folgende Satz besagt. ∈ (1) Ist die Folge {Tn } , Tn ∈ L(X , Y) kompakt und konvergiert gegen T bezüglich der Norm–Topologie, so ist auch T kompakt. (2) T ist genau dann kompakt, wenn T 0 kompakt ist. (3) Sei Z ein Banach–Raum und S ∈ L(Y, Z) und T oder S kompakt, dann ist auch die Komposition ST ∈ L(X , Z) kompakt. (2) (f (z) − I)−1 exisitert für alle z ∈ D \ S, wobei S ⊂ D diskret ist (d.h. S hat keine Häufungspunkte in D). (f (z) − I)−1 ist dann meromorph in D, analytisch in D \ S, und für die Residuen an den isolierten Polstellen zp ∈ S gilt: dim(Bild(f (zp ))) < ∞. Ist z ∈ S, so besitzt f (z)|xi = |xi eine von Null verschiedene Lösung in H. Beweis II.18 Wir zeigen, daß in einer Umgebung von z0 ∈ D entweder (1) oder (2) gilt. Wegen der geforderten Zusammenhangseigenschaft von D kann diese Aussage dann auf ganz D ausgeweitet werden. Sei also z0 ∈ D gegeben. Wir wählen ein r ∈ R so, daß aus |z−z0 | < r folgt: kf (z) − f (z0 )k < 1/2, und einen Operator F ∈ L(H) mit dim(Bild)(F ) < ∞, so daß kf (z0 ) − F k < 1/2. Für z ∈ Dr := {z ∈ D : |z−z0 | < r} gilt dann kf (z)−F k < 1. Wir entwickeln nun (f (z) − F − I)−1 in eine geometrische Reihe und sehen, daß (f (z) − F − I)−1 existiert und analytisch ist. 13 Da nach Wahl dim(Bild)(F ) < ∞, gibt es Vektoren |x1 i, . . . , |xn i , N 3 n := dim(Bild)(F ), so daß jedes |yi ∈PH folgendermaßen dargestellt werden kann: n F (|yi) = j=1 αj (|yi)|xj i. Hierbei sind αj (◦) beschränkte lineare Funktionale auf H. Daher folgt mit dem Satz von Riesz II.4, es Vektoren |y1 i, . . . , |yn i ∈ H gibt Pdaß n mit F (|yi) = j=1 |xj ihyj |yi , ∀|yi ∈ H. Wir definieren den φj (z) := ((f (z) − F − I))∗ |yj i , N 3 j ∈ {1, . . . , n} und Pn df −1 g(z) = F (f (z) − F − I) = j=1 |xj ihφj (z)|◦i . Nun schreiben wir umständlich (f (z) − I) = F (g(z) − I) (f (z) − F − I) . Also ist f (z) − I , z ∈ Dr genau dann invertierbar, wenn g(z)−I , z ∈ Dr invertierbar ist. Die Gleichung f (z)|xi = |xi besitzt somit genau dann eine von Null verschiedene Lösung, wenn g(z)|yi = |yi eine nicht–triviale Lösung besitzt. Pn Gilt nun g(z)|yi = |yi, dann ist |yi = j=1 βj |yj i und die Koeffizienten βj ∈ C erfüllen folgende Bestimmungsgleichung: βn = n X hφn (z)|xj iβj . (37) j=1 Umgekehrt, Pn hat (37) eine Lösung (β1 , . . . , βn ), so ist |yi = j=1 βj |xj i eine Lösung von g(z)|yi = |yi. Folglich hat g(z)|yi = |yi genau dann eine nicht–triviale Lösung, wenn df d(z) = det [δab − hφa (z)|xb i] = 0 . Mit hφa (z)|xb i ist auch d(z) analytisch in Dr . Damit ist klar, daß entweder Sr := {z ∈ Dr : d(z) = 0} eine diskrete Menge ist, oder Sr = Dr . Sei d(z) 6= 0 und |xi ∈ H gegeben. Wir suchen eine Lösung der PGleichung n (g(z) − I)|yi = |xi. Der Ansatz |yi = |xi + j=1 βj |xj i ist erfolgreich, vorausgesetzt, die Koeffizienten lösen βa = hφa (z)|xi + n X hφa (z)|xj iβj . (38) Satz II.16 (Satz von Riesz & Schauder) Sein A ∈ L(H) kompakt. Dann ist das Spektrum σ(A) eine diskrete Menge mit höchstens einem Häufungspunkt bei λ = 0. Jeder von Null verschiedene Eigenwert λ ∈ σ(A) gehört zu endlich vielen Eigenvektoren. Satz II.17 (Hilbert–Schmidt Theorem) Sei A ∈ L(H) selbstadjungiert und kompakt. Dann gibt es eine vONB {|ej i}j∈N für den Hilbert–Raum H, so daß A|ej i = λj |ej i und λj −→ 0 für j −→ ∞. Beweis II.20 Für jeden Eigenwert von A ∈ L(H) wählen wir eine ONB für die zugehörigen Eigenvektoren. Die Familie aller dieser Vektoren, {|ej }j∈N ist eine orthonormale Menge, da Eigenvektoren zu unterschiedlichen Eigenwerten orthogonal zueinander sind. Sei M := Spann({|ej i}). Da A nach Voraussetzung selbstadjungiert ist und A ∈ L(M), ist auch A ∈ L(M⊥ ). Es bezeichne B die Restriktion von A auf M⊥ . Als Restriktion ist B selbstadjungiert und kompakt. Nach dem Satz von Riesz und Schauder gilt: ist λ 6= 0 in σ(B), so ist λ ein Eigenwert von B und damit auch von A. Der Spektralradius von B, r(B) := supλ∈σ(B) |λ|, ist daher Null, denn jeder Eigenvektor von A (dies schliesst die Eigenvektoren von B ein) ist in M. Daher korrespondiert B zur Null– Abbildung (Null–Operator) auf M⊥ . Also ist M⊥ = ∅, denn |xi ∈ M⊥ bedeutet A|xi = 0, und daraus folgt |xi ∈ M. Damit gilt M = H. Die Aussage λj −→ 0 ist eine Folge des Satzes von Riesz und Schauder. Der erste Teil dieses Satzes besagt ja, daß jeder von Null verschiedene Eigenwert nur zu endlich vielen Eigenvektoren gehört und der einzig mögliche Häufungspunkt von {λj } die Null ist. ∗–< [{; 0) Satz II.18 (Kanonische Form kompakter Operatoren) Sei A ∈ L(H) kompakt. Dann gibt es (nicht notwendigerweise vollständige) orthonormale Mengen {|ej i}j∈I , {|fj i}j∈I , I ⊂ N, und {λj }j∈I , λj ∈ R+ ∀j ∈ I mit λj −→ 0, so daß X A = λj hej |◦i|fj i . (39) j∈I Die Summe (39) konvergiert bezüglich der Norm– Topologie. j=1 Da d(z) 6= 0 angenommen wurde, hat (38) eine Lösung. Also existiert (g(z)−I)−1 . Die Aussage, daß die Residuen von endlichem Rang sind, folgt aus (38). ∗–< [{; 0) Der Satz von Fredholm hat vier wichtige Konsequenzen: Lemma II.6 (Die Fredholmsche Alternative) Sei A ∈ L(H) kompakt. Dann gilt: Entweder (A − I)−1 existiert, oder A|xi = |xi , |xi ∈ H hat eine von Null verschiedene Lösung. Beweis II.19 Wir benutzen den Satz von Fredholm für f (z) := zA an der Stelle z = 1. ∗–< [{; 0) Beweis II.21 Mit A ist nach Satz II.13 auch A† A kompakt. Außerdem ist A† A selbstadjungiert. Der Satz von Hilbert und Schmidt garantiert dann die Existenz einer orthonormalen Menge {|ej i}j∈I mit der hübschen Eigenschaft: A† A|ej i = µj |ej i , µj ∈ R , j ∈ I, und A† A ist der Null–Operator auf dem Unterraum orthogonal zu Spann({|ej i}j∈I ). Da A† A > 0, ist µj > 0. Sei √ λj := + µj und |fj i := A|ej i/λj . Eine kurze Rechnung ergibt: X A|xi = λj hej |xi|fj i . j∈I Der Beweis zeigt, daß die Koeffizienten λj gerade die Eigenwerte von |A| sind. ∗–< [{; 0) 14 Bsp. II.7 (Dirichlet–Problem) Im nächsten Semester werden Sie sich ausführlich mit dem Dirichlet– Problem in der Elektrostatik auseinandersetzen. Es stellt eine gute Motivation für das Studium von kompakten Operatoren dar. Kompakte Operatoren treten auf die Bühne, wenn klassische Randwertprobleme durch Integralgleichungen gelöst werden wollen. Sei D ⊂ R3 offen und beschränkt mit einem glatten Rand ∂D (Oberfläche). Das Dirichlet–Problem für die Lalace–Gleichung ist wie folgt gegeben: gegeben sei eine stetige Funktion f : ∂D −→ R. Wir suchen eine zweimal stetig differenzierbare Funktion u : D −→ R, die auch stetig auf D sein soll, so daß ∆u(x) = 0 , x ∈ D , u(x) = f (x) , x ∈ ∂D . (40) Es bezeichne n(y) die nach außen weisende Normale zu ∂D am Punkt y ∈ ∂D. Sei G(x, y) := hx − y, n(y)i/8π|x − y|3 . Als Funktion von x löst G(x, y) die Laplace–Gleichung ∆(x)G(x, y) = 0 , x ∈ D. Da die Laplace–Gleichung linear ist, schreiben wir ihre Lösung formal als Superposition Z d2 S(y) G(x, y)Q(y) , u(x) = wobei dann ein h ∈ C(∂D) existiert mit (T − I)h = 0, oder aber (T − I)Q = f hat eine eindeutige Lösung für jedes f ∈ C(∂D). Ist u definiert wie in (41), wobei jetzt Q durch h ersetzt wird, so ist u ≡ 0 , ∀x ∈ D. Da weitherin ∇n u stetig ist bei Randdurchquerung, gilt auch ∇n u ≡ 0 , ∀x ∈ ∂D. Partielle Integration zeigt, daß u ≡ 0 außerhalb ∂D. Daher liefern (41) und (42) die Bedingung: 2h(x) ≡ 0 , ∀x ∈ ∂D. Damit ist die erste Alternative obsolet, und wir finden tatsächlich Quellen, die mit den möglichen Randbedingungen verträglich sind. 5. Spurklasse–Operatoren Wir haben im letzten Abschnitt gelernt, daß kompakte Operatoren schöne Eigenschaften haben, die sie auch sehr nützlich in Anwendungen machen. Ein naheliegende Motivation ist somit, effiziente Kriterien zu finden, die es uns praktisch und einfach erlauben, Operatoren dieser Klasse zu identifizieren. Das Ergebnis können wir bereits vorweg nehmen, weil es sich an unsere Betrachtungen schön anschließt: Wir werden zeigen, daß ein Integraloperator T ∈ L(L2 (M, dµ)), definiert durch ∂D Z wobei Q ∈ C(∂D) Quellen auf dem Rand beschreibt (z.B. elektrische Ladungen), und dS(y) das übliche Oberflächenmaß bezeichne. Mit Sicherheit macht das Integral in (41) Sinn für x ∈ D, tatsächlich gilt ∆u(x) = 0 , x ∈ D. Aber wie schaut die Situation auf dem Rand aus? Sei x0 ∈ ∂D und wir lassen x −→ x0 , x ∈ D. Es kann gezeigt werden, daß Z u(x) −→ −Q(x0 ) + d2 S(y) G(x0 , y)Q(y) . (41) ∂D Für x −→ x0 , x ∈ R3 \ D erhalten wir Z u(x) −→ +Q(x0 ) + d2 S(y) G(x0 , y)Q(y) . (42) (T Q) (x) = dµ(y) G(x, y)Q(y) , M kompakt ist, wenn K(◦, ◦) ∈ L2 (M × M, dµ ⊗ dµ). Dazu bedarf es einiger Vorbereitung, die auch recht instruktiv ist. Insbesondere wollen wir das Konzept der Spur aus der gewöhnlichen Linearen Algebra auf L(H) übertragen. Offenbar involviert dies aber unendliche Reihen, weshalb sich die Spur nicht für alle Operatoren definieren läßt. Satz II.19 Sein H ein separabler Hilbert–Raum und {|ej i}j∈N eine vONB. Für jeden Operator L(H) 3 A ≥ 0 definieren wir ∂D Da Q ∈ C(∂D), ist auch das Integral als Funktion von x vom Typ C(∂D). Dies folge im wesentlichen aus der Voraussetzung, daß der Rand glatt sein soll. Daher gilt: Für x, y ∈ ∂D ist hx − y, n(y)i ∝ |x − y|2 im Limes x −→ y. Die entscheidende Frage ist, ob wir Quellen Q finden können, so daß u(x) = f (x) , x ∈ ∂D, also Z f (x) = −Q(x) + d2 S(y) G(x, y)Q(y) , x ∈ ∂D . df Sp (A) = ∞ X hej |Aej i . j=1 Die Zahl Sp(A) heißt die Spur von A und ihr Wert ist unabhängig von der gewählten vONB. Die Spur hat folgende Eigenschaften: Für alle L(H) 3 A, B ≥ 0 , λ ∈ R+ gelten (1) Sp(A + B) = Sp(A) + Sp(B). ∂D Dazu definieren wir T : C(∂D) −→ C(∂D) durch Z df (T Q) (x) = d2 S(y) G(x, y)Q(y) . ∂D T ist beschränkt und kompakt (zeigen wir hier nicht). Nun hilft uns die Fredholmsche Alternative, die ja garantiert, daß entweder λ = 1 im Punktspektrum σ(T ) liegt, (2) Sp(λA) = λSp(A). (3) Sp(U AU −1 ) = Sp(A) , ∀U ∈ L(H) : U † = U −1 . (4) Für 0 ≤ A ≤ B ist Sp(A) ≤ Sp(B). Beweis II.22 Wir zeigen zuerst, daß die Definition nicht von der gewählten vONB abhängt. Seien {|ej i}j∈N 15 und {|fj i}j∈N zwei vONB. Mit offensichtlichen Bezeichnungen rechnen wir nach: ∞ ∞ E2 X X √ Sp|ei (A) = hej |Aej i = Aej = j=1 j=1 ED √ E2 fi Aej = = j=1 i=1 ! ∞ ∞ D E2 X X √ = = fi Aej ∞ ∞ X X = fi j=1 i=1 ∞ X ∞ D E2 X √ Afi ej j=1 i=1 = ∞ X i=1 i=1 E2 √ Afi = N N X X hej |U † V |A|ej i = h|A|1/2 V † U ej | |A|1/2 ej i = j=1 j=1 N X 1/2 † ≤ |A| V U |ej i · |A|1/2 |ej i = j=1 1/2 1/2 N N 2 2 X X 1/2 1/2 † ≤ |A| |ej i |A| V U |ej i = hfi |Afi i = = Sp|f i (A) . Die Summen durften vertauscht werden, da alle Summanden positiv sind. Die Eigenschaften (1), (2) und (4) überlassen wir einer Übung. Es bleibt der Beweis von (3). Dazu bemerken wir, daß mit {|ej i}j∈N auch {|U ej i}j∈N eine vONB ist. Daher gilt Sp U AU −1 = Sp|U ei U AU −1 = Sp|ei (A) = Sp(A) . Das war es auch schon. ∗–< [{; 0) Def. II.16 A ∈ L(H) heißt Spurklasse–Operator genau dann, wenn Sp(|A|) < ∞. Die Familie von Spurklasse– Operatoren wird mit F1 bezeichnet. Die Definition läßt eine strukturelle Relevanz dieser Operatorklasse vermuten, weshalb wir die wichtigen Eigenschaften von F1 darlegen wollen: 1/2 N 2 X 1/2 . = |A|1/2 V † U |ej i · (Sp(|A|)) Wir müssen uns um den ersten Faktor in der letzten Zeile kümmern, was wir sogleich tun: Zunächst erinnern daran, daß U eine partielle Isometrie ist, d.h. U ist eine Isometrie auf (Kern(U ))⊥ . Jeder Vektor der vONB {|ej i}j∈N ist entweder in Kern(U ) oder im orthogonalen Komplement (Kern(U ))⊥ . Also N 2 X 1/2 † |A| V U |ej i ≤ Sp|ei U † V |A|V † U = j=1 ≤ Sp{U |ei} V |A|V † . Wir iterieren unser letztes Argument ein weiteres Mal: Jeder Vektor U |ej i ∈ (Kern(U ))⊥ ist entweder in Kern(V † ) oder in (Kern(V † ))⊥ . Daher gilt weiter: N 2 X 1/2 † |A| V U |ej i ≤ Sp{V † U |ei} (|A|) ≤ Sp(|A|) < ∞ . j=1 Einsetzen in (80) liefert N X hej |U † V |A|ej i ≤ Sp(|A|) < ∞ . j=1 (1) F1 ist ein Vektorraum. (2) Ist A ∈ F1 und B ∈ L(H), so ist auch AB, BA ∈ F1 . (3) Ist A ∈ F1 , so ist auch A† ∈ F1 . Beweis II.23 Wir beginnen mit dem Beweis von (1). Für λ ∈ C gilt |λA| = |λ||A|, also ist F1 abegeschlossen unter Multiplikation mit Skalaren. Seien A, B ∈ F1 . Der Beweis, daß dann auch A + B ∈ F1 ist langwieriger. Es seien U, V, W die partiellen Isometrien zu folgenden Polarzerlegungen: A + B = U |A + B| , A = V |A| , B = W |B|. Dann ist (zunächst für endliche Reihen) N N X X hej | |A + B|ej i = hej |U † (A + B)ej i = ≤ (43) j=1 Satz II.20 F1 ist ein †–Ideal in L(H), d.h. j=1 j=1 j=1 ! 2 ∞ X E X ∞ ED √ = ej ej Afi = i=1 j=1 ∞ X Wir schätzen die erste Summe auf der rechten Seite der Ungleichung ab (mit der zweiten verfahren wir genauso): j=1 N X N X hej | U † V |A|ej i + hej | U † W |B|ej i . j=1 j=1 Insgesamt ergibt sich so endlich N X hej | |A + B|ej i ≤ Sp(|A|) + Sp(|B|) < ∞ . j=1 Damit haben wir gezeigt, daß mit A, B ∈ F1 auch A+B ∈ F1 , und (1) is bewiesen. Wir kommen nun zum Beweis von (2). Zunächst einmal zeigen wir, daß jeder Operator B ∈ L(H) als Linearkombination von vier unitären Operatoren geschrieben werden kann. Es gilt: B = (B + B † )/2 − i(B − B † )/2, also B kann als Linearkombination zweier selbstadjungierter Operatoren geschrieben werden. Sei nun C ∈ L(H) selbstadjungiert, und ohne Einschränung der Allgemein√ 2 unitäre Operatoheit kCk ≤ 1. Dann sind C ± i I − C √ √ ren und es gilt: C = (C +i I − C 2 )/2+C −i I − C 2 /2. 16 Nach dieser Vorarbeit genügt es zu zeigen: Mit A ∈ F1 ist auch√U A, AU ∈ F1 , U ∈ L(H) : U † = U −1 . Es ist |U A| = A† U † U A = |A|, also U A ∈ F1 . Zeigen Sie, daß |AU | = U −1 |A|U . Mit (II.19) folgt nun |AU | ∈ F1 . Es bleibt (3) zu beweisen. Seien A = U |A| und A† = V |A† | die Polarzerlegungen von A und A† . Dann gilt: |A† | = V † A† = V † |A|U † . Ist A ∈ F1 , so ist auch |A| ∈ F1 . Wegen (2) ist dann auch |A† | ∈ F1 . Und damit auch A† = V |A† | ∈ F1 . ∗–< [{; 0) Satz II.21 Sei k◦k1 definiert durch: kAk1 := Sp|A| , A ∈ F1 . Damit wird F1 zu einem Banach–Raum mit Norm k ◦ k1 . Es gilt kAk ≤ kAk1 . Der Zusammenhang zwischen den Spurklasse– Operatoren und den kompakten Operatoren ist folgender: Satz II.22 Jeder Operator A ∈ F1 ist kompakt. Ein kompakter Operator A ist in F1 genau dann, wenn P∞ λ < ∞, wobei λj die Eigenwerte von |A| bezeichj j=1 ne. Beweis II.24 Sei A ∈ F1 . Dann ist auch |A|2 ∈ F1 . Daher gilt bzgl. einer beliebigen vONB {|ej i}j∈N : Sp |A|2 = ∞ X 2 kA|ej ik < ∞ . j=1 Sei nun |f i ∈ {|e1 i, . . . , |en i}⊥ , n ∈ N und k|f ik = 1. Dann ist 2 kA|f ik n X 2 ≤ Sp |A|2 − kA|ej ik , j=1 da {|e1 i, . . . , |en i, |f i} immer zu einer ONB vervollständigt werden kann. Also, n→∞ sup kA|f ik : |f i ∈ {|e1 i, . . . , |en i}⊥ , k|f ik = 1 −→ 0 . Satz II.24 Seien A, B ∈ F2 und C ∈ L(H) kompakt, außerdem sei T ∈ L(H) mit dim(Bild)(T ) < ∞, und {|ej i}j∈N eine beliebige vONB. Wir definieren df (A, B)2 = ∞ X hej |A† Bej i . j=1 Dies ist sinnvoll, da die Definition nicht vonp der gewähl(A, A)2 = ten vONB abhängt. Weiterhin sei kAk := 2 p Sp(A† A). Schließlich bezeichnen wir die Eigenwerte von |A| mit λj . Dann gilt: (1) F2 ist ein †–Ideal. (2) Die Reihe (A, B)2 ist absolut summierbar. (3) Mit (◦, ◦)2 wird F2 zu einem Hilbert–Raum. (4) kAk ≤ kAk2 kAk1 und kAk2 = kA† k2 . (5) Jeder A ∈ F2 ist kompakt. (6) C ∈ F2 genau dann, wenn P∞ j=1 λ2j < ∞. (7) T liegt dicht in F2 bzgl. der Norm k ◦ k2 . (8) A ∈ F2 genau dann, wenn {A|ej i}j∈N ∈ `2 . (9) Z ∈ F1 genau dann, wenn Z = AB. Eine wichtige Tatsache über F2 ist, daß im Falle H = L2 (M, dµ) sich der Hilbert–Raum F2 konkret realisieren läßt. Satz II.25 Sei (M, µ) ein Maßraum und H = L2 (M, dµ). Dann ist A ∈ L(H) genau dann ein Hilbert– Schmidt Operator, wenn es eine Funktion G ∈ L2 (M × M, dµ ⊗ dµ) gibt mit der Eigenschaft Z (AQ) (x) = dµ(y) G(x, y)Q(y) , M Z 2 kAk22 = dµ(x)dµ(y) |G(x, y)| . M×M Pn Damit konvergiert j=1 A|ej ihej |◦i gegen A bezüglich der durch die Norm induzierten Topologie. Somit ist A kompakt. Der zweite Teil des Satzes folgt aus der kanonischen Form kompakter Operatoren und der Beweis bleibt Ihnen überlassen. ∗–< [{; 0) Satz II.23 T ∈ L(H) mit dim(Bild)(T )∞ liegen dicht in F1 bzgl. der Norm k ◦ k1 . Beweis II.25 Sei G ∈ L2 (M × M, dµ ⊗ dµ) und AG der assoziierte Integraloperator. Überzeugen Sie sich, daß AG wohldefiniert ist und kAG k ≤ kGkL2 . Sei {ej (x)}j∈N eine vONB von L2 (M, dµ). Dann ist {ei (x)e∗j (y)}i,j∈N eine vONB für L2 (M × M, dµ ⊗ dµ). Daher, G(x, y) = Def. II.17 T ∈ L(H) heißt Hilbert–Schmidt Operator genau dann, wenn Sp(T † T ) < ∞. Die Familie von Hilbert–Schmidt Operatoren notieren wir mit F2 . Ganz ähnliche Argumente wie wir sie zur Charakterisierung von F1 herangezogen haben, führen auf ∞ X αij ei (x)e∗j (y) . i,j=1 Wir definieren Gn (x, y) = n X i,j=1 αij ei (x)e∗j (y) . 17 Per Konstruktion ist Gn , n ∈ N ein Integralkern zu einem Operator AGn mit dim(Bild(AGn )) < ∞. In der Tat, AG n = n X αij ei (x)(ej (y), ◦) . i,j=1 Aus kGn − GkL2 −→ 0 folgt kAGn − AG k −→ 0 im Limes n −→ ∞. Somit ist AG kompakt, was wir auch folgendermaßen einsehen: ∞ X Sp AG† AG = kAG ej k2 = = j=1 ∞ X 2 |αij | = kGkL2 . i,j=1 Also ist AG ∈ F2 (und daher kompakt) und kAG k2 = kGkL2 . Wir haben gezeigt, daß die Abbildung G −→ AG eine isometrische Einbettung von L2 (M × M, dµ ⊗ dµ) in F2 ist. Zeigen Sie, daß das Bild von G −→ AG sogar F2 ist. ∗–< [{; 0) Bitte beachten Sie, daß obiger Satz eine hinreichende Bedingung für die Eigenschaft Kompaktheit eines Operators liefert, die sehr nützlich, allerdings nicht notwendig ist. Ebenfalls haben wir eine hinreichende Bedingung für die Qualifikation, daß ein Operator ein Integraloperator ist, aber auch diese ist nicht hinreichend. Satz II.26 Sei A ∈ F1 P und {|ej i}j∈N eine beliebige ∞ vONB. Dann konvergiert j=1 hej |Aej i absolut und der Grenzwert ist unabhängig von der vONB–Wahl. Beweis II.26 Als Übung. ∗–< [{; 0) Def. II.18PDie Abbildung Sp : F1 −→ C, definiert durch ∞ Sp(A) = j=1 hej |Aej i, wobei {|ej i}j∈N eine beliebige vONB sei, heißt die Spur. E. Der Spektralsatz für beschränkte Operatoren Der Spektralsatz ist eine konkrete Beschreibung der strukturellen Eigenschaften aller selbstadjungierter Operatoren. Diese strukturelle Aufklärung existiert in verschiedenen Formulierungen, die aus zunächst ganz unterschiedlichen Standpunkten resultieren, aber in der Charakterisierung der maßgeblichen Struktur äquivalent sind. Wir schränken uns zunächst auf beschränkte selbstadjungierte Operatoren ein, um dann im nächsten Unterkapitel von der Qualifikation beschränkt hin zu unbeschränkt zu relaxieren. Der für uns vielleicht zweckmässigste Standpunkt ist folgender: Sei A ∈ L(H) , A† = A beschränkt auf dem Hilbert–Raum H. Dann gibt es immer ein Maß µ auf einem Maßraum M und ein U ∈ L(H) , U † = U −1 , erklärt durch U : H −→ L2 (M, dµ) , U AU −1 f (x) = F (x)f (x) , wobei F eine beschränkte reellwertige meßbare Funktion auf M ist. Dieser Standpunkt ist so attraktiv, weil er eine Verallgemeinerung des entsprechenden Sachverhaltes liefert, der uns aus der Linearen Algebra bekannt ist für endlichdimensionale Vektorräume: Jede selbstadjungierte n × n(n ∈ N) Matrix ist diagonalisierbar. Genauer: Sei V ein Vektorraum über C und A : V −→ V eine selbstadjungierte lineare Abbildung. Dann gibt es eine unitäre lineare Abbildung U : V −→ Cn und reelle Zahlen λ1 , . . . , λn ∈ R, so daß U AU −1 v j = λj vj , j ∈ {1, . . . , n} , für jeden Vektor Cn 3 v = (v1 , . . . , vn ). In der Physik wird M in aller Regel eine Vereinigung von Kopien von R sein und F ≡ x. Das Hauptaugenmerk liegt daher auf der Konstruktion geeigneter Maße. Bevor wir diesen Weg gedanklich beschreiten, beschäftigen wir uns im folgenden Abschnitt damit, wie wir h : L(H) −→ L(H) sinnvoll erklären für stetige Funktionen h angewandt auf selbstadjungierte beschränkte Operatoren. Wir listen die relevanten Eigenschaften: Satz II.27 Für A ∈ F1 , B ∈ L(H) gilt: (1) Sp(◦) ist linear. (2) Sp(A† ) = (Sp(A))∗ . (3) Sp(AB) = Sp(BA). Beweis II.27 Die Aussagen (1) und (2) folgen unmittelbar aus der Spur–Definition und aus der Definition des Hilbert–adjungierten Operators. Den Beweis der Aussage (3) überlassen wir einer Übung. ∗–< [{; 0) 1. Stetiges Funktionalkalkül Die dringlichste Frage ist wohl: gegeben ein beschränkter Operator A ∈ L(H) ohne weitere Qualifikation. Für welche Funktionen f : L(H) −→ L(H) können wir f (A) überhaupt definieren? Zunächst einmal naiv, lassen Sie uns eine Wunschliste aufstellen. Bestimmt hätten PNwir aus Bequemlichkeit gerne Folgendes: Sei f (x) = j=1 aj xj PN ein Polynom, dann soll f (A) = j=1 aj Aj sein. Nehmen P∞ j wir einmal an, daß f (x) = j=0 cj x eine Potenzreihe mit Konvergenzradius R ist. Falls kAk < R, dann P∞ konvergiert j=0 cj Aj in L(H), also ist es nur natürlich 18 P∞ f (A) = j=0 cj Aj zu setzen. Beachten Sie, daß in diesem Fall f analytisch auf einem Definitionsbereich ist, der ganz σ(A) beinhaltet. Welche strukturelle Unterstützung kommt nun von der Qualifikation selbstadjungiert? Sei P ein Polynom und A ∈ L(H) , A† = A beschränkt. Dann ist kP (A)k = supλ∈σ(A) |P (λ)|. Dann erlaubt der zentrale Satz über beschränkte lineare Transformationen4 , das oben skizzierte Funktionalkalkül auf stetige Funktionen auszuweiten. Wir beginnen mit einem Lemma, das wieder für beschränke aber sonst beliebe Operatoren A gilt: PN j Lemma II.7 Sei P (x) = j=0 aj x , und P (A) = PN j j=0 aj A . Dann gilt σ(P (A)) = {P (λ) : λ ∈ σ(A)}. Beweis II.28 Sei λ ∈ σ(A). Da x = λ eine Nullstelle von P (x) − P (λ) ist, folgt P (x) − P (λ) = (x − λ)Q(x), und damit P (A) − P (λ) = (A − λ)Q(A). Da (A − λ) nicht invertiert werden kann, besitzt auch P (A) − P (λ) kein Inverses. Damit ist aber P (λ) ∈ σ(P (A)). Umgekehrt, sei µ ∈ σ(P (A)) und λ1 , . . . , λN die Nullstellen von P (x) − µ. Dann gilt P (x) − µ = a(x − λ1 ) · · · (x − λN ). Wäre nun λ1 , . . . , λN 3 σ(A), so existierte −1 (P (A) − µ) −1 = a−1 (A − λ1 ) −1 · · · (A − λN ) . Dies kann aber nicht sein, da nach Voraussetzung µ ∈ σ(P (A)). Also gibt es wenigstens ein i ∈ {1, . . . , N } mit λi ∈ σ(A), also µ = P (λ) für ein λ ∈ σ(A). ∗–< [{; 0) Wir brauchen noch ein weiteres Lemma. Hier wird ganz wesentlich benutzt, daß für selbstadjungierte Operatoren A der Spektralradius, r(A) := supλ∈σ(A) |λ|, gleich der Norm von A ist, also r(A) = kAk, was wir nicht zeigen, aber zum Beweis des folgenen Lemmas benutzen werden. Lemma II.8 Sei A ein beschränkter selbstadjungierter Operator, und P ein Polynom. Dann gilt: kP (A)k = supλ∈σ(A) |P (λ)|. Beweis II.29 Wir rechnen: ! 2 kP (A)k = P (A)† P (A) = k(P ∗ P ) (A)k = = = sup II.7 |λ| = λ∈σ(P ∗ P (A)) ∗ sup |P P (λ)| = λ∈σ(A) !2 = sup |P (λ)| . λ∈σ(A) Daraus folgt unmittelbar die Behauptung. ∗–< [{; 0) Jetzt sind wir endlich in der Lage, obige Frage zu beantworten. Satz II.28 (Stetiges Funktionalkalkül) Sei H ein Hilbert–Raum und A ∈ L(H) selbstadjungiert. Dann gibt es genau eine Abbildung Φ : C(σ(A)) −→ L(H) mit den folgenden Eigenschaften: (1) Φ ist ein algebraischer †–Homomorphismus, d.h. Φ(f g) Φ(λf ) Φ(1) Φ(f ∗ ) Zur Erinnerung: Sei T eine beschränkte lineare Transformation von einem normierten Vektorraum (V1 , k◦k1 ) in einen vollständigen normierten Raum (V2 , k ◦ k2 ). Dann kann T eindeutig erweitert werden zu einer beschränkten linearen Transformation, T̂ , die die Vervolständigung von V1 auf (V2 , k ◦ k2 ) abbildet. Φ(f )Φ(g) , λΦ(f ) (λ ∈ C) , I, Φ(f )† . (2) Φ ist stetig, d.h. kΦ(f )kL(H) ≤ Ckf k∞ , C ∈ R. (3) Sei f die Funktion f (x) = x, dann ist Φ(f ) = A. (4) Gilt A|ψi = λ|ψi, so ist Φ(f )|ψi = f (λ)|ψi. (5) σ[Φ(f )] = {f (λ) : λ ∈ σ(A)}. (6) Ist f ≥ 0, so ist Φ(f ) ≥ 0. (7) kΦ(f )k = kf k∞ . Die Idee für den Beweis von Satz II.28 ist ganz einfach. Zunächst einmal ist Φ(P ) für jedes Polynom P (x) wegen (1) und (3) eindeutig bestimmt. Lemma II.7 ist bereits ein Spezialfall der zentralen Gleichung (5). Der Satz von Weierstrass liefert uns sofort folgenden Befund: Die Menge der Polynome ist dicht in C(σ(A)). Im Zentrum des Beweises steht daher die Aussage von Lemma II.8. Denn mit der Fußnote 4 folgt dann bequem die Existenz und Eindeutigkeit der Abbildung Φ. Beweis II.30 Sei P ein Polynom und Φ(P ) = P (A). Dann ist kΦ(P )kL(H) = kP kC(σ(A)) . Somit hat Φ genau eine lineare Erweiterung auf die abgeschlossene Hülle der Polynome in C(σ(A)). Die Polynome bilden eine Algebra, die die 1 enthält, abgeschlossen unter komplexer Konjugation ist, und die die Punkte von σ(A) separiert. Damit ist die abgeschlossene Hülle der Polynome ganz C(σ(A)). Die Aussagen (1), (2), (3), (7) folgen direkt. Für (4) bemerken wir: Φ(P )|ψi = P (A)|ψi = P (λ)|ψi. Diese Tatsache läßt sich wegen der Stetigkeit auf ganz C(σ(A)) ausdehnen. Für (6) bemerken wir: Sei f ≥ 0yf = g 2 , g ∈ C(σ(A)) reell. Folglich ist Φ(f ) = Φ(g 2 ) = Φ(g)Φ(g) und, da Φ(g) selbstadjungiert ist, weiter Φ(f ) = Φ(g)† Φ(g) ≥ 0. Die Aussage (5) überlassen wir einer Übung (einen Spezialfall haben wir ja in II.7 betrachtet). ∗–< [{; 0) 2. 4 = = = = Die Spektralmaße Sei H ein Hilbert–Raum und A ∈ L(H) , A† = A beschränkt. Sei |ψi ∈ H. Dann ist die Abbildung C(σ(A)) 3 f −→ hψ|f (A)ψi ein semi–positiv definites Funktional auf C(σ(A)). Das Riesz–Markov Theorem garantiert 19 dann die Existenz eines eindeutig bestimmten Maßes µψ auf der kompakten Menge σ(A), so daß Z hψ|f (A)ψi = dµψ f (λ) . σ(A) Def. II.19 Das Maß µψ heißt mit dem Vektor ψ assoziierte Spekralmaß. das Die einfachste Sache, die wir ausgestattet mit dem Maß µψ anstellen können, ist das Funktionalkalkül auf die Menge der beschränkten Borel–Funktionen auf R, bezeichnet mit B(R), auszuweiten. Satz II.29 (Spektralsatz, Standpunkt: Funktionalkalkül) Sei H ein Hilbert–Raum und A, B ∈ L(H) , A† = A beschränkt. Es gibt genau eine Abbildung Φ̂ : B(R) −→ L(H) mit folgenden Eigenschaften: (1) Φ̂ ist ein algebraischer †–Homomorphismus. Beweis II.32 Wir definieren U durch U Φ(f )|ψi = f , wobei f ∈ C(σ(A)). Wir zeigen zuerst, daß U wohldefiniert ist. Dazu rechnen wir: kΦ(f )|ψik2 = hψ|Φ† (f )Φ(f )ψi Z (6) Für f ≥ 0 gilt auch Φ̂(f ) ≥ 0. R−M hψ|Φ(f ∗ f )ψi = 2 σ(Φ(f ∗ f )) Also, ist f = g bzgl. µψ fast überall, dann gilt auch Φ(f )|ψi = Φ(g)|ψi. Damit ist U wohldefiniert auf {Φ(f )|ψi : f ∈ C(σ(A))} und U erhält die Norm. Da nach Voraussetzung |ψi ein zyklischer Vektor ist folgt weiterhin {Φ(f )|ψi : f ∈ C(σ(A))} = H. Wir können wieder die Fußnote 4 heranziehen und notieren: U kann erweitert werden zu einer isometrischen Abbildung von H nach L2 (σ(A), dµψ ). Da C(σ(A)) dicht liegt in L2 , folgt Bild(U ) = L2 (σ(A), dµψ ). Es bleibt: Sei f ∈ C(σ(A)) , λ ∈ σ(A). Dann gilt, II.28:(3) Df U AU −1 f (λ) = (U AΦ(f )) (λ) = Df = (U Φ(xf )) (λ) = = λf (λ) . (3) Sei f die Funktion f (x) = x. Dann gilt Φ̂(f ) = A. (5) Sei A|ψi = λ|ψi. Dann ist Φ̂(f )|ψi = f (λ)|ψi. = dµψ |f (λ)| . = (2) Φ̂ ist stetig bzgl. der Norm: kΦ̂(f )kL(H) ≤ kf k∞ . (4) Für fn (x) −→ f (x) punktweise und kfn k∞ beschränkt, gilt: Φ̂(fn ) −→ Φ̂(f ) bzgl. der starken Topologie. II.28:(1) Dieses Argument kann von f ∈ C(σ(A)) auf f ∈ L2 erweitert werden. ∗–< [{; 0) Lemma II.10 Sei H ein separabler Hilbert–Raum und A ∈ L(H) selbstadjungiert. Dann gibt eine Zerlegung von H in eine direkte Summe: H = ⊕N j=1 Hj , wobei N ∈ N oder N = ∞, so daß gilt: (1) Aus |ψi ∈ Hj folgt A|ψi ∈ Hj für jedes j. (7) Falls AB = BA, dann gilt Φ̂(f )B = B Φ̂(f ). (2) ∀j ∃ |φj i ∈ Hj : Hj = {f (A)|φj i : f ∈ C(σ(A))}. Beweis II.31 Im wesentlichen wie Satz II.28, ist aber nicht vollkommen trivial, da wir intelligent den Übergang vom stetigen Funktionalkalkül zum meßbaren Funktionalkalkül vollziehen müssen. ∗–< [{; 0) Def. II.20 Ein Vektor |ψi ∈ H heißt zyklischer Vektor von A ∈ L(H), wenn endliche Linearkombinationen von Elementen aus {An |ψi}n∈N dicht in H liegen. Diese Eigenschaft wird leider nicht von allen Operatoren geteilt, aber wenn ein Operator einen zyklischen Vektor besitzt, so ist das ungemein nützlich: Lemma II.9 Sei A ∈ L(H) , A† = A beschränkt, und |ψi ∈ H ein zyklischer Vektor von A. Dann gibt es einen unitären Operator U : H −→ L2 (σ(A), dµψ ) mit der Eigenschaft: U AU −1 f (λ) = λf (λ) , f ∈ L2 (σ(A), dµψ ) , λ ∈ R. Die Gleichheit bezieht sich hier auf die Gleichheit von Elementen aus L2 (σ(A), dµψ ). Beweis II.33 Als Übung mit Zorn. ∗–< [{; 0) Die letzten beiden Lemmata lassen sich mächtig kombinieren zu der Version des Spektralsatzes, die für uns am transparentesten und praktischtesten ist: Satz II.30 (Spektralsatz, Standpunkt: Lieblingsversion von Physikerinnen und Physikern oder Multiplikationsoperator–Form) Sei H ein separabler Hilbert–Raum, A ∈ L(H) beschränkt und selbstadjungiert. Dann gibt es Maße {µj }N j=1 , (N = 1, 2, . . . oder ∞) auf σ(A) und einen unitären Operator mit U : H −→ N M L2 (R, dµj ) , j=1 U AU −1 Ψ j (λ) = λΨj , Ψj ∈ L2 (R, dµj ) , λ ∈ σ(A) . 2 Hierbei gilt folgende Notation: Ψ ∈ ⊕N j=1 L (R, dµj ) ist das N –Tupel (Ψ1 (λ), . . . , ΨN (λ)). Diese Realisierung von A heißt Spektraldarstellung. 20 Beweis II.34 Die Idee ist: Sie benutzen Lemma II.10 zur Zerlegung von H und wenden Lemma II.9 auf jeden Teilraum an. Bitte füllen Sie die Lücken. ∗–< [{; 0) Die Formulierung des Spektralsatzes besagt einfach, daß jeder beschränkte selbstadjungierte Operator als Multiplikationsoperator auf einem geeigneten Maßraum dargestellt werden kann. Def. II.21 Die Maße dµj heißen Spektralmaße. Sie sind gerade die dµψ für geeignete ψ. Diese Maße sind nicht eindeutig bestimmt, was uns noch beschäftigen wird. Zunächst ein paar Beispiele: Bsp. II.8 Sei A eine selbstadjungierte (n × n)–Matrix (n ∈ N). Das Spektraltheorem für endlichdimensionale Vektorräume ist Ihnen ja aus der Linearen Algebra bekannt. Zur formlosen Erinnerung: Es besagt, daß es zu A einen orthonormalen Satz von Eigenvektoren ψ1 , . . . , ψn mit Aψj = λj ψj , j ∈ {1, . . . , n} gibt. Wir nehmen an, daß alle Eigenwerte λ1 , . . . , λn disjunkt sind. Die Frage, die uns in diesem Beispiel interessiert ist, welcher Maßraum den Satz II.30 auf das entsprechende Resultat aus der Linearen Pn Algebra reduziert? Wir probieren folgendes: Sei µ := j=1 δ(x − λj ), wobei δ(x) ein Dirac–Maß bezeichne. L2 (R, dµ) ist dann einfach Cn : f ∈ L2 ist durch f = (f (λ1 ), . . . , f (λn )) gegeben. Probieren Sie es aus! Der Funktion λf entspricht das n–Tupel (λ1 f (λ1 ), . . . , λn f (λn )). Dieses Beispiel eignet sich auch dafür, die Beliebigkeit Pn des Maßes explizit aufzuzeigen: Sei nämlich µ̃ := j=1 aj δ(x − λj ) mit aj > 0 , j ∈ {1, . . . , n}. A kann dann auch als Multiplikationsoperator auf L2 (R, dµ̃) dargestellt werden. Weiterhin sehen wir an diesem Beispiel, wann mehr als ein Maß benötigt wird: Ein selbstadjungierter Operator A auf einem Hilbert–Raum H mit dim(H) < ∞ kann genau dann als Multiplikationsoperator auf L2 (R, dµ) dargestellt werden, wenn A ausschließlich disjunkte Eigenwerte besitzt. Bsp. II.9 Wir wissen bereits, daß kompakte Operatoren viele Eigenschaften mit ihren Verwandten aus der Linearen Algebra teilen. Obiges Beispiel sollte also für kompakte Operatoren eine mühelose Verallgemeinerung besitzen. Dem ist auch so: Sei A kompakt und selbstadjungiert. Das Hilbert–Schmidt Theorem (Satz II.17) garantiert die Existenz eines vONS von Eigenvektoren {ψj }nj=1 , n ∈ N, mit der Eigenschaft: Aψj = λj ψP j . Sind alle Eigenwer∞ n te disjunkt, so eignet sich µ := j=1 δ(x − λj )/2 als Spektralmaß. Bsp. II.10 Wir betrachten den Differentialoperator −id/dx auf L2 (R, dx). Um ganz ehrlich zu sein, dabei handelt es um einen unbeschränkten Operator und als solcher gehört er nicht in diesen Abschnitt. Allerdins werden wir später sehen, daß auch für unbeschränkte Operatoren eine Aussage ganz analog zu Satz II.30 gilt. Wir erlauben uns daher eine gesunde Portion an Naivität und konzentrieren uns auf die unitäre Transformation: Gesucht wird also ein unitären Operator U und ein Maß dµ (es stellt sich an anderer Stelle heraus, daß lediglich ein µ gebraucht wird) mit U : L2 (R, dx) −→ L2 (R, dµ(k)). Sei f (x) := (U −1 g(k))(x) , g ∈ L2 (R, dµ(k)). Die entscheidende Gleichung des Spektralsatzes II.30 lautet dann: (U (−id/dx)f (x))(k) = k(U f (x))(k) , k ∈ σ(−id/dx). Die gesuchte Transformation ist die Fourier– Transformation: Z −1/2 (U f (x))(k) = (2π) dx exp (ixk)g(k) . R Die Fourier–Transformation ist also ein Beispiel für eine Spektraldarstellung. Wir kommen nun zu der bereits angesprochenen Frage, wann A unitär äquivalent zu einem Multiplikationsopearator auf L2 (R, dµ) ist, also wann wir mit nur einem Spektralmaß auskommen. Beispiel II.8 hat uns gelehrt, daß im Falle endlich–dimensionaler Vektorräume dies der Fall ist, wenn alle Eigenwerte von A verschieden sind. Def. II.22 Ein beschränkter selbstadjungierter Operator A heißt nicht–entartet genau dann, wenn A unitär äquivalent zur Multiplikation mit λ auf L2 (R, dµ) für ein Maß µ ist. Intrinsische Charakterisierungen sind: Satz II.31 Die folgenden Aussagen sind äquivalent: (1) A ist nicht–entartet. (2) A hat einen zyklichen Vektor. (3) {B : AB − BA = 0} ist eine Abelsche Algebra. Als nächstes wenden wir uns der Nichteindeutigkeit des Spektralmaßes für nicht–entartete Operatoren zu. In Beipiel II.8 haben wir gesehen, daß akzeptable Maße (Anschluß an die Lineare Algebra) von der Form PN µ = j=1 αj δ(x − λj ) , αj > 0 , j ∈ {1, . . . , n} sind. Diese Einsicht hat eine natürliche Verallgemeinerung auf den Fall unendlich–dimensionaler Vektorräume. Wir nehmen an, daß dµ auf R gegeben ist. Sei F eine meßbare Funktion, die positiv und fast überall von Null verschieden ist bzgl. des Maßes µ, R außerdem soll sie lokal vom Typ L1 (R, dµ) sein, d.h. K dµ |F | < ∞ , K ⊂ R kompakt. Dann ist auch dν = F dµ ein Borel Maß, und die Abbildung U : L2 (R, dµ) −→ L2 (R, dν) , p (U f ) (λ) = F (λ)f (λ) (44) ist unitär (F 6= 0 fast überall) und λU (f ) = U (λf ). Folglich kann ein Operator A mit einer Spekraldarstellung bzgl. µ genau so gut bzgl. ν dargestellt werden. Der entscheidende Fortschritt gelingt nun dank eines Satzes von Radon–Nikodym, der besagt, daß dν = F dµ mit F 6= 0 fast überall gilt genau dann, wenn µ und ν die gleichen Nullmengen haben (also gleiche Teilmengen vom Maß Null). Dies motiviert folgende Definition: 21 Def. II.23 Zwei Borel–Maße µ, ν sind genau dann äquivalent, wenn sie die gleichen Nullmengen haben. Eine Äquivalenzklasse [µ] heißt Maßklasse. Die Nichteindeutigkeit von Spekralmaßen erfährt nun folgende Aufklärung: Satz II.32 Seien µ, ν Borel–Maße auf R mit beschränktem Träger. Sei Aµ auf L2 (R, dµ) gegeben durch (Aµ f )(λ) = λf (λ), und Aν entsprechend auf L2 (R, dν). Dann sind Aµ und Aν genau dann unitär äquivalent, wenn µ und ν äquivalente Maße sind. Die Verallgemeinerung auf den Fall mit Entartung sparen wir uns hier, auch wenn diese in der Physik durchaus wichtig ist, nimmt es hier zuviel Platz weg. 3. Natürlich können wir bzgl. eines projektorwertigen Maßes auch integieren. Sei PΩ ein projektorwertiges Maß, dann ist hφ|PΩ φi das gewöhnliches Maß für jedes φ. In suggestiver Manier werden wir in den Präliminarien die Integration bzgl. dieses Maßes ganz barock mit dhφ|PΩ φi bezeichnen. Satz II.33 Sei PΩ ein projektorwertiges Maß und f eine beschränkte Borel–Funktion auf Träger(PΩ ). Dann gibt Res einen eindeutig bestimmten Operator B, den wir mit dPλ f (λ) bezeichnen, so daß Z hΦ|BΦi = dhφ|Pλ φi f (λ) , ∀|Φi ∈ H . (45) Bsp. II.11 Ist A ein selbstadjungiertert Operator, und PΩ das zugehörige projektorwertige Maß, so gilt: Z A= dPλ λ , λ∈σ(A) Spektralprojektoren Im letzten Abschnitt haben wir das Funktionalkalkül f −→ f (A) für jede Borel–Funktion f und jeden beschränkten selbstadjungierten Operator A angesprochen. Die wichtigsten Funktionen, die wir beim Übergang vom stetigen zum meßbaren Funktionalkalkül gewonnen haben, sind die charakteristischen Funktionen auf Mengen. Def. II.24 Sei A ein beschränkter selbstadjungierter Operator und Ω eine Borel–Menge in R. Wir definieren einen Spektralprojektor von A durch PΩ := χΩ (A). wie wir recht schnell einsehen können in einer ruhigen Minute. Satz II.34 (Spektralsatz, Standpunkt: Auch eine Lieblingsversion von Physikerinnen und Physikern, oder kurz: der maßtheoretische Blickwinkel) Zwischen (beschränkten) selbstadjungierten Operatoren A und beschränkten projektorwertigen Maßen {PΩ } gibt es folgende eineindeutige Beziehung: Z A −→ {PΩ } = {χΩ (A)} , {PΩ } −→ A = dPλ λ . Wie die Definition suggeriert: PΩ ist eine orthogonale Projektion, da χ2Ω = χΩ gilt. Die wichtigen Eigenschaften der Familie {PΩ } := {PΩ : Ω ist eine Borel–Menge} sind die Folgenden: Dieser Satz ist nicht nur mächtig, sondern auch robust gegen eine wichtige Verallgemeinerung, die für den Aufbau der Quantenmechanik essentiell ist: Die Verallgemeinerung auf unbeschränkte Operatoren. Spektralprojektoren sind nützlich zur Untersuchung des Spektrums eines selbstadjungierten Operators: Lemma II.11 Die Familie {PΩ } von Spektralprojektoren eines beschränkten selbstadjungierten Operators A hat die folgenden Eigenschaften: Satz II.35 λ ∈ σ(A) genau dann, wenn für jedes > 0 folgendes gilt: P(λ−,λ+) 6= 0 . (1) Jedes PΩ ist eine orthogonale Projektion. Beweis II.35 Die wesentliche Idee des Beweises beruht auf folgender Feststellung: −1 −1 . (A − λI) = [d(λ, σ(A))] (2) P∅ = 0. (3) Sei Ω = ∪∞ j=1 Ωj mit Ωi ∩ Ωj = ∅ , ∀i 6= j. Dann PΩ = lim N →∞ ∞ X Die Ausarbeitung überlassen wir einer Übung. ∗–< [{; 0) PΩj . Satz II.35 motiviert folgende Klassifikation des Spektrums: j=1 (4) PΩi PΩj = PΩi ∩Ωj , ∀i, j . Dies erinnert schon sehr an die ein Maß definierenden Eigenschaften. Kein Zufall, denn Def. II.25 Eine Familie von Projektoren, (1)–(3) von Lemma II.11 erfüllt, heißt projektiorwertiges Maß. die ein Def. II.26 Wir nennen n o df σkont (A) = λ ∈ σ(A)dim(Bild(P(λ−,λ+) )) = ∞ , ∀ > 0 das kontinuierliche Spektrum, und df σdisk (A) = σ(A) \ σkont (A) das diskrete Spektrum von A. 22 Damit ist σ(A) zerlegt in zwei notwendigerweise disjunkte Untermengen. Dabei ist σdisk nicht unbedingt abgeschlossen, aber: Satz II.36 σkont ist abgeschlossen. Beweis II.36 Sei σkont (A) 3 λn −→ λ, und Iδ := (λ − δ, λ + δ). Nach Voraussetzung gibt es immer n ∈ N und > 0, so daß I := (λn − , λn + ) ⊂ Iδ . Damit ist dim(Bild(PIδ (A))) = ∞, also λ ∈ σkont (A). ∗–< [{; 0) Es folgenden zwei Sätze geben alternative Charakterisierungen von σdisk und σkont . Die Beweise überlassen wir den Übungen. Satz II.37 λ ∈ σdisk genau dann, wenn die folgenden beiden Kriterien gleichzeitig erfüllt sind: Bsp. II.12 Der Ortsoperator Sei H = L2 (R) und Z df D(T ) = f ∈ L2 (R) : dx x2 |f (x)|2 < ∞ . R Für f ∈ D(T ) definieren wir:(T f )(x) := xf (x). Natürlich ist T unbeschränkt, wir brauchen ja lediglich Funktionen in D(T ) zu wählen, deren Träger sich bis nach ±∞ erstreckt. Wir können also kT f k so groß machen, wie wir wollen und gleichzeitig kf k = 1 haben. Nun macht xf (x) auch Sinn, wenn f ∈ / D(T ), aber liegt dann halt nicht in L2 (R). Wollen wir aus bestimmten Gründen, oder müssen gar, auf den Hilbert–Raum L2 (R) einschränken, so erfordert dies, den Definitionsbereich von T zweckmäßig einzuschränken. Der hier angegebene Definitionsbereich ist tatsächlich der größt mögliche, für den das Bild(T ) noch in L2 (R) liegt. (1) ∃ > 0, so daß (λ − , λ + ) ∩ σ(A) = {λ}. (2) dim({|ψi ∈ H : A|ψi = λ|ψi}) < ∞. Satz II.38 (Weyls Kriterium) Sei A ein beschränkter selbstadjungierter Operator. Dann ist λ ∈ σ(A) genau dann, wenn es eine Folge {|ψj i}j∈N gibt mit k|ψj ik = 1 und limj→∞ k(A − λI)|ψj ik = 0. λ ∈ σkont genau dann, wenn die Folgenglieder {|ψj i}j∈N alle orthogonal gewählt werden können. F. Unbeschränkte Operatoren Wir werden schon recht früh sehen, daß wichtige Observablen in der Quantenmechanik durch unbeschränkte Operatoren beschrieben werden. Nach einem Satz von Hellinger–Toeplitz gilt für einen auf dem gesamten Hilbert–Raum H definierten Operator A mit der Eigenschaft hφ|Aψi = hAφ|ψi , |φi, |ψi ∈ H, daß dieser beschränkt ist. Daher wird ein unbeschränkter Operator nur auf einer Untermenge von H definiert sein. 1. Grundbegriffe 5 Präziser, ein Operator T auf einem Hilbert–Raum H ist eine Abbildung von D(T ) ⊂ H −→ H, wobei der Unterraum D(T ) der Definitionsbereich des Operators T heißt. Wir nehmen immer an, daß der Definitionsbereich dicht in H liegt, D(T ) = H. Damit ist der Definitionsbereich eines (unbeschränkten) Operators ein wichtiges Charakteristikum desselben und gehört eigentlich in die Definition des Operators, neben dessen expliziten Wirkung auf Vektoren im Definitionsbereich. Diese buchhalterische Mühe wird in der Physik nicht gepflegt. 5 Wir weisen lediglich auf die Qualifikation ’beschränkt’ explizit hin, ansonsten handelt es sich um einen unbeschränkten Operator. Von von Neumann stammt folgender nützliche Begriff zum Studium von linearen Abbildungen, der sich als besonders nützlich zur Charakterisierung von unbeschränkten Operatoren erweist. Def. II.27 Unter dem Graph Γ(T ) einer linearen Abbildung T verstehen wir folgende Menge: {(f, T f ) : f ∈ D(T )} ⊂ H × H. T heißt ein abgeschlossener Operator, wenn Γ(T ) eine abgeschlossene Untermenge von H × H ist. Def. II.28 Seien T1 und T Operatoren auf H. Gilt Γ(T1 ) ⊃ Γ(T ), dann heißt T1 eine Erweiterung von T , kurz: T1 ⊃ T . Dies ist offenbar äquivalent zu: T1 ⊃ T genau dann, wenn D(T1 ) ⊃ D(T ) und T1 f = T f , ∀f ∈ D(T ). Def. II.29 Ein Operator T heißt abschließbar, wenn T eine abgeschlossene Erweiterung hat. Jeder abschließbare Operator T hat eine kleinste abgeschlossene Erweiterung, die wir den Abschluß von T nennen und mit T bezeichnen. Es ist verführerisch, eine abgeschlossene Erweiterung von T zu finden, im dem wir den Abschluß des entsprechenden Graphen in H × H suchen. Im allgemeinen ist dies keine gute Strategie, da Γ(T ) nicht der Graph eines Operators zu sein braucht. Wir werden weiter unten einsehen, daß dies aber kein Drama für uns darstellt. Lemma II.12 Sei T ein abschließbarer Operator. Dann gilt: Γ(T ) = Γ(T ). Beweis II.37 Sei S eine beliebige abgeschlossene Erweiterung von T , nicht notwendigerweise die kleinste. Dann gilt Γ(T ) ⊂ Γ(S). Wir definieren einen Operator R durch (1) den Definitionsbereich D(R) = {H 3 |ψi : (|ψi, |φi) ∈ Γ(T )} (|φi = T |ψi), und (2) durch die Vorschrift: R|ψi = |φi, wobei |φi ∈ H durch die Forderung (|ψi, |φi) ∈ Γ(T ) eindeutig bestimmt ist. Offenbar 23 ist Γ(R) = Γ(T ), also ist R eine abgeschlossene Erweiterng von T . Folglich gilt auch R ⊂ S. Nun ist S aber eine beliebige abgeschlossene Erweiterung. Mit anderen Worten R ⊂ S gilt für alle abgeschlossenen Erweiterungen. Das ist aber nur möglich, wenn R = T . ∗–< [{; 0) Def. II.30 Sei T ein linearer Operator auf dem Hilbert– Raum H, dessen Definitionsbereich D(T ) dicht in H ist. Sei D(T † ) die Menge der |φi ∈ H für die es ein |ηi ∈ H gibt, so daß Und gleich noch ein Beispiel zu den eben eingeführten Konzepten: Für jedes |φi ∈ D(T † ) definieren wir: T † |φi = |ηi. T † heißt der adjungierte Opertator zu T . Bsp. II.13 Sei H = L2 (R) , D(T ) = C0∞ (R), die beliebig oft stetig differenzierbaren Funktionen mit kompakten Träger, und D(T1 ) = C01 (R), die einmal stetig differenzierbaren Funktionen mit kompakten Träger. Sei (T f )(x) = if 0 (x) , ∀f ∈ D(T ) und (T1 f )(x) = if 0 (x) , ∀f ∈ D(T1 ). T1 ist eine Erweiterung von T , hier beschränken wir uns aber bescheiden auf die Aussage, daß Γ(T ) ⊃ Γ(T1 ). Weiter unten zeigen wir, daß T ein symmetrischer Operator und daher abschließbar ist, woraus folgt T ⊃ T1 . Sei {j (x)} eine Approximation der Eins, konkret: j (x) := j(x/)/, wobei j(x) eine positive, beliebig oft differenzierbare Funktion auf dem RTräger (−1, 1) bezeichne, mit der weiteren Eigenschaft: R dx j(x) = 1. Für φ ∈ D(T1 ) setzen wir Z df φ (x) = dt j (x − t)φ(t) . Nach dem Satz II.4 von Riesz ist |φi ∈ D(T † ) genau dann, wenn |hT ψ|φi| ≤ Ck|ψik ∀|ψi ∈ D(T ). Wir bemerken noch: S ⊂ T y T † ⊂ S † . Die Forderung, daß D(T ) dicht in H sein soll, war hier wichtig, damit |ηi eindeutig durch (46) bestimmt ist. Machen Sie sich klar, daß es prinzipiell möglich ist, folgende Situation vorzufinden: D(T † ) = ∅. R Da j (x) einen kompakten Träger hat und beliebig oft differenzierbar ist, gilt: φ ∈ C0∞ (R), also φ ∈ D(T ) ∀ ∈ R+ . Es ist Z |φ (x) − φ(x)| ≤ dt j (x − t) |φ(t) − φ(x)| R !Z ≤ {t:|x−t|≤} = sup ∀|ψi ∈ D(T ) . (46) Satz II.39 Sei T ein auf H dicht definierter Operator. Dann gelten: (1) T † ist abgeschlossen. (2) T ist abschließbar genau dann, wenn D(T † ) = H. (3) Ist T abschließbar, so gilt: (T )† = T † . Def. II.31 Sei T ein abgeschlossener Operator auf dem Hilbert–Raum H. Die Resolventenmenge ρ(T ) ist folgendermaßen definiert: n bijektiv df ρ(T ) = λ ∈ C : T − λI : D(T ) −→ H o und (T − λI)−1 ist beschränkt . Ist λ ∈ ρ(T ), so heißt Rλ (T ) := (T −λI)−1 die Resolvente dt j (x − t) von T an der Stelle λ. |φ(t) − φ(x)| sup hT ψ|φi = hψ|ηi R |φ(t) − φ(x)| . {t:|x−t|≤} Da φ einen kompakten Träger hat, ist φ gleichmäßig stetig. Daher konvergiert φ ∈ D(T ) gleichmäßig gegen φ ∈ D(T1 ) in L2 (R). Und ähnlich, Z (T φ )(x) = dt (T j )(x − t)φ(t) ZR d = dt (−i) j (x − t) φ(t) dt ZR = dt j (x − t)(T1 φ)(t) R L2 (R) −→ (T φ)(x) . L2 (R) Insgesamt haben wir also gezeigt, daß φ −→ φ und L2 (R) T φ −→ T φ für jedes φ ∈ D(T1 ). Daraus folgt Γ(T ) ⊃ Γ(T1 ). ∗–< [{; 0) Das Konzept des adjungierten Operators kann direkt auf unbeschränkte Operatoren übertragen werden: Das Spektrum, Punktspektrum und residuale Spektrum werden genau so definiert wie im Falle von beschränkten Operatoren. Oft kann sich die Physik–Gemeinschaft nicht des Eindruckes erwehren, daß Fragestellungen bezüglich des Definitionsbereiches oder des Abschlusses eines Operators lediglich eine buchhalterische Pflicht darstellen, die allenfalls eine technische Unannehmlichkeit von periphärem Interesse bedeutet. Dieser Eindruck kommt in etwa von folgender Idee: es ist doch lediglich notwendig, den Definitionsbereich ausreichend klein zu wählen, so daß mit dem unbeschränkte Operator sinnvoll gerechnet werden kann und mehr steht da nicht dahinter. Na ja, den Meinungsbildungsprozeß auf Ihrer Seite will ich nicht beeinflussen, allerdings ist es fair zu erwidern, daß ein sinnvoller Definitionsbereich oft mit der konkreten physikalischen Fragestellung zusammenhängt. Außerdem hängen viele wichtige Eigenschaften von Operatoren sensibel von der Wahl des Definitionsbereichs ab, insbesondere natürlich das Spektrum. 24 2. Symmetrische und selbst-adjungierte Operatoren Wir beginnen zügig mit zwei ganz zentralen Begriffen: Def. II.32 Ein auf einem Hilbert–Raum H dicht definierter Operator T heißt symmetrischer Operator (oder auch hermitescher Operator), wenn T ⊂ T † , also wenn D(T ) ⊂ D(T † ) und T |ψi = T † |ψi , ∀|ψi ∈ H. Äquivalent: T ist symmetrisch genau dann, wenn Auch um den Unterschied zwischen Kapitel II und dem vorliegenden zu betonen, folgen wir hier der angelsächsischen Schule der informativen Wissensvermittlung ohne axiomatischen Herangehensweise, sondern behalten einen lockeren und hoffentlich flüssigen Erzählstil. Bitte behalten Sie immer das einleitende einladende Kapitel I im Blick. A. hT φ|ψi = hφ|T ψi ∀|φi, |ψi ∈ H . Def. II.33 T heißt selbstadjungiert, wenn T = T † , also genau dann, wenn T symmetrisch ist und D(T ) = D(T † ). Ein symmetrischer Operator kann immer abgeschlossen werden, da D(T † ) ⊃ D(T ) dicht in H ist. Ist T symmetrisch, so ist T † ein Abschluß von T . Präziser, für symmetrische Operatoren gilt: T ⊂ (T † )† ⊂ T † . Für einen abgeschlossenen symmetrischen Operator gilt: T = (T † )† ⊂ T † , und für selbstadjungierte Operatoren gilt sogar: T = (T † )† = T † . Dies impliziert, daß ein abgeschlossener symmetrischer Operator T genau dann selbstadjungiert ist, wenn T † symmetrisch ist. Die Unterscheidung zwischen abgeschlossenen symmetrischen Operatoren und selbstadjungierten Operatoren ist ungemein wichtig. Nur für selbstadjungierte Operatoren gilt der Spektralsatz. Außerdem können auch lediglich selbstadjungierte Operatoren exponiert werden, um so unitäre 1–Parametergruppen zu liefern, die unter anderem für die Dynamik in der Quantenmechanik zuständig sind. Daher benötigen wir ein Kriterium für Selbsradjungiertheit. Def. II.34 Ein symmetrischer Operator T heißt essentiell selbstadjungiert, wenn T selbstadjungiert ist. Ist T abgeschlossen, so heißt eine Untermenge D ⊂ D(T ) Kern von T , wenn gilt: T |D = T . Ein essentiell selbstadjungierter Operator T hat genau eine selbstadjungierte Erweiterung. III. PRÄLIMINARIEN (PRAXIS) Dieser Praxisteil ist gut zum Rechnen und zur Erörterung der physikalischen Grundlagen der Quantenmechanik, hilft Ihnen aber nicht bei der Fundierung der mathematischen Konzepte, die zur Formulierung der Quantenmechanik eingesetzt werden. Eine klare Trennung zwischen mathematischen und physikalischen Konzepten ist nur schwer möglich und vielleicht auch gar nicht wünschenswert. Trotzdem hilft Ihnen dieses Kapitel, in die faszinierende Physik der Quantenmechanik alsbald einzutauchen, ohne die mathematische Finesse und das Eigenleben der mathematischen Sprache gebührend zu bewundern. Eine zwar skizzenhafte, aber dennoch angemessene Würdigung des mathematischen Intellekts finden Sie im vorherigen Kapitel II. Der Zustandsraum Gegeben sei ein quantenmechanisches System S, dessen physikalischen Zustand wir mit lediglich einer Observablen notwendigerweise unvollständig charakterisieren wollen. Sei O diese Observable und M(O) ⊂ R die Menge von möglichen Werten dieser Observablen, die bei einem entsprechenden Experiment am betrachteten System S gemessen werden könnten. Übrigens ist M(O) a priori nicht bekannt6 . Den Zustandsvektor (oder kurz: Zustand) bezeichnen wir mit |mi (m ∈ M(O)), genannt ket (nach Dirac). Für den Moment beschränken wir uns als Zustandsraum Z auf einen komplexen Vektorraum (später erweitern wir auf Hilbert–Räume). Sei c ∈ C, c 6= 0, und |m0 i := c|mi ∈ Z. Die naheliegende Frage ist, ob |mi und |m0 i wirklich unterschiedliche Charakterisierungen von S liefern können sollen? Die Antwort ist nein, denn das System S soll ja hinsichtlich einer Messung von O durch M(O) charakterisiert werden7 . Daher führen wir folgende Äquivalenzrelation ein: |mi ∼ |m0 i, wenn |m0 i = c|mi (c 6= 0). Der komplexe Zustandsraum zerfällt dann durch Quotientenbildung Z/ ∼ in Äquivalenzklassen: df [|mi] = {|m0 i : ∃ c ∈ C , c 6= 0, mit |m0 i = c|mi} . Solche Äquivalenklassen heißen Strahlen. Wir verzichten auf die umständliche Schreibweise und arbeiten immer mit Repräsentanten, sind uns aber der Quotientenbildung stets bewußt. Wie lesen wir denn nun die Information über O aus einem Zustandsvektor von S aus? Dies ist eine erste naive Frage nach der mathematischen Beschreibung des Meßprozesses. Physikalisch wäre folgendes wünschenswert: Das System S wird mit einem Meßapparat in Kontakt gebracht, welche in der Lage ist, O zu messen, also entsprechend m ∈ M(O) aus dem Zustand |mi auszulesen. Das Resultat der Messung besteht in der Kenntnis des Meßwertes m ∈ R und des Zustandes |mi, der das System S direkt nach seinem Kontakt mit dem Meßapparat charakterisiert. Wir operieren also mit der Meßapparatur 6 7 Es handelt sich bei der Menge M(O) um das Spektrum der Observablen O, siehe Kapitel II. Tatsächlich renormiert der komplexe Skalar c ja lediglich den Vektor, der als Informationsträger für die möglichen Meßwerte fungiert, allerdings haben wir den Begriff der Norm noch nicht bereitgestellt in diesem Kapitel. 25 auf den Zustand |mi und das Resultat der Messung ist, daß unsere Apparatur m mißt und das detektierte System nach der Messung (falls keine weitere Wechselwirkung folgt) im Zustand |mi ist. Dies können wir mathematisch durch eine Eigenwertgleichung modellieren, wobei wir die Apparatur durch die Observable, die sie messen soll, ersetzen: linear O : Z −→ Z , O|mi = m|mi . Hierbei wird die Observable O als linearer Operator realisiert, und der angesprochene Meßprozeß als Eigenwertgleichung, wobei die Eigenwerte m ∈ M(O) ⊂ R die möglichen Meßwerte bei einer Messung von O am System S im Zustand |mi , m ∈ M(O) sind. Nun braucht ein System S aber nicht derart präpariert zu sein. Die verwendete Mathematik kommt uns jetzt zur Hilfe und erklärt auch c1 |m1 i + c2 |m2 i , c1 , c2 ∈ C , m1 , m2 ∈ M(O) als legitimen Zustand, schließlich ist der Zustandsraum ja ein Vektorraum. Dies bedarf natürlich einer physikalischen Interpretation, die weiter unten auch kommen wird. Im Moment halten wir fest: Sei M(O) = {m1 , . . . , mn } ⊂ R. Dann muß sich ein beliebiger Zustand von S hinsichtlich O als komplexe Linearkombination der |mj i , j ∈ {1, . . . , n} darstellen lassen: | zi = n X cj |mj i , cj ∈ C . j=1 Natürlich fehlt uns im Moment vollkommen die physikalische Interpretation einer solchen Linearkombination (modulo unserer Einsichten aus Kapitel I) B. Der duale Zustandsraum (1) hn|mi = hm|ni∗ ∀|mi, |ni ∈ Z. (2) hm|mi ≥ 0 ∀|mi ∈ Z, wobei hm|mi = 0 genau dann gilt, wenn |mi = 0|m0 i für |m0 i ∈ Z, und |mi in diesem Fall Null–ket genannt wird. Das Skalarprodukt erlaubt es, Geometrie auf dem Zustandsraum Z zu betreiben, und auch eine geometrische Vorstellung und Intuition zu entwickeln. Zum Beispiel heißen zwei Zustände |mi, |ni ∈ Z orthogonal zueinander, wenn hn|mi = 0. Dann gilt offenbar auch hm|ni = 0. Oder ebenfalls ein wichtiges Beispiel: Für |mi = 6 Null–ket betrachten wir normierte Zustandsvektoren, p f = |mi/ hm|mi , hm| f mi f=1, |mi (47) wobei hm|mi die Norm des Zustandes |mi bezeichnet. Wir wählen immer normierte Zustandsvektoren als Repräsentanten der entsprechenden Strahlen, diese sind damit ausgezeichnet und diese Auszeichnung wird später begründet werden. C. Beschränkte Observablen linear Operatoren O : Z −→ Z sind ein wichtiger Bestandteil zur mathematischen Modellierung von Messungen an einem quantenmechanischen System S. Sie sind gewissermaßen die Auslesewerkzeuge, mit denen wir Informationen (Werte von Observablen) aus den Zustandsvektoren (kets) extrahieren, die S hinsichtlich der Observablen O charakterisieren. Eine Besonderheit ist dabei, daß der Auslesevorgang (die Messung) im wesentlichen durch eine Eigenwertgleichung des Operators beschrieben wird, der der Observablen zugeordnet wird: O|mi = m|mi , Sicherlich wollen wir die Möglichkeit haben, Zustandsvektoren linear auf komplexe Zahlen abzubilden. Dies erlaubt die Identifikation der relevanten geometrischen Struktur und stellt somit auch eine Intuitionsstütze dar. Duale Vektoren, bezeichnet mit hn| (nach Dirac bra genannt), tun genau diesen Job für uns: linear hn| : Z −→ C , df |mi −→ hn|(|mi) = hn|mi , wobei n ∈ M(O0 ) und zur Observablen O0 auch der Zustandsraum Z gehört. Die komplexe Zahl hn|mi (nach Dirac bracket gennant) haben wir nicht von ungefähr so notiert: Die Vektoren des Dualraums Z ∗ operieren als lineare Funktionale auf Z. Ist nun der komplexe Vektorraum Z mit einem Skalarprodukt bilin. h◦|◦i : Z × Z −→ C , |m1 i , |m2 i −→ hm1 |m2 i ausgestattet, so erlaubt der Satz II.4 von Riesz folgende salopp notierte Interpretation von dualen Vektoren: Zu jedem hm| ∈ Z ∗ exisitiert ein |mi ∈ Z mit hm| = hm|◦i. Das Skalarprodukt hat folgende Eigenschaften: wobei der Bezeichner (möglicher Meßwert) reell sein muß, m ∈ R. Diese Beschreibung wird uns aufgezwungen, weil |mi ∈ Z und Z ein komplexer Vektorraum ist, und der Zustand |mi selbst damit nicht observable sein kann. Erinnern wir uns an die Klassische Mechanik nach Hamilton: Hier war der Zustand eines Hamilton– Systems (P, H) durch einen Vektor in einem reellen Vektorraum (Phasenraum) P = T ∗ M ∼ = Rn × Rn (n ∈ N) gegeben. Denken wir uns den Phasenraum P global durch (q, p) ∈ Rn ×Rn koordinatisiert, so sind Klassische Observablen (bzw. deren Komponenten) Funktionen B : P −→ R , (q, p) −→ B(q, p) . Wichtige Spezialfälle sind die klassische Ortsvariable: j BOrt := Pj ◦ Pr1 , j ∈ {1, 2, 3}, wobei Pra , a ∈ {1, 2} die Projektion auf den a-ten Faktor im kartesischen Produkt (q, p) bezeichne, und Pj (q) = q j die kanonische Projektion, zum Beispiel durch P j := hej , ◦i über das Euklidische Skalarprodukt h◦, ◦i realisiert. Also ausführlich, j BOrt (q, p) = Pj (Pr1 (q)) = Pj (q) = q j . Und die klassische Impulsvariable: BImp j := Pj ◦ Pr2 , j ∈ {1, 2, 3}, 26 ganz entsprechend. Es hat sich eingebürgert, diese grundlegenden klassischen Observablen mit den entsprechenden Komponenten des Phasenraumvektors gleichzusetj zen: BOrt = q j , BImp j = pj . Wir können folgendermaßen eine engere Beziehung zur klassischen Formulierung herstellen: Sei P := Z ×Z ∗ und BO : P −→ R , df (|mi, hn|) −→ BO (m, n) = hn|O|mi , hn|mi where Z 3 |mi , |ni 6= 0. Mit anderen Worten: BO (|mi, hn|) = m ∈ M(O) ⊂ R. Die Notation ist so gemeint: Z 3 |Omi := O|mi und hn|O|mi := hn|Omi. Es bietet sich nun an zu fragen, welche Eigenschaft von O verantwortlich ist für M(O) ⊂ R. Zunächst führen wir den zu O adjungierten Operator O† ein: linear O† : Z ∗ −→ Z ∗ , hn| −→ hn|O† . Dank Riesz können wir dies salopp so interpretieren: es gibt einen Zustand |Oni := O|ni mit der Eigenschaft hn|O† = hOn|◦i. Also, hn|O† |mi = hOn|mi = hm|Oni∗ = hm|O|ni∗ ∀|mi, |ni ∈ Z. Operatoren mit hn|O|mi = hn|O† |mi heißen selbstadjungiert, also hn|O|mi = hm|O|ni∗ , was auch kurz folgendermaßen notiert wird: O† = O. Selbstadjungierte Operatoren eignen sich wunderbar als Observablen, denn BO (m, n) = BO† (m, n) y hn|mi(BO (m, n) − BO∗ (n, m)) = 0 y (m − n∗ )hn|mi = 0. Ist n = m, so folgt m = m∗ , also m ∈ R. Gilt m 6= n, so folgt (wegen M(O) ⊂ R) (m − n)hn|mi = 0, weshalb außerdem hn|mi = 0 ∀m, n ∈ M(O) , m 6= n folgt. Das bedeutet, daß die Eigenvektoren (Eigenzustände) von O zu unterschiedlichen Eigenwerten orthogonal sind (setzen wir normierte Eigenzustände voraus, so sind Eigenzustände zu unterschiedlichen Eigenwerten sogar orthonormiert). Bezüglich einer Observablen O muß ein beliebiger Zustand | z i als Linearkombination | zi = X c(m)|mi , c(m) ∈ C ∀ m ∈ M(O) . m∈M(O) geschrieben werden können, d.h. {|mi}m∈M(O) ist eine vONB von Z. Dies ist physikalisch absolut sinnvoll, allerdings wollen wir diese folkloristische Aussage ein bisschen genauer beleuchten. Der Zustand | z i kann prinizpiell nämlich noch Information über andere Observablen O(1) , O(2) , . . . tragen, zum Beispiel | z i = |m(1) , m(2) , . . . i , m(1) ∈ M(O(1) ), m(2) ∈ M(O(2) ), . . . . Obige Linearkombination ist daher präziser folgendermaßen zu verstehen: Bezüglich der Observablen O(j) , j ∈ {1, 2, . . . } ⊂ N gilt, (1) (j) | z i ≡ |z , . . . , z , . . . i X c z(1) , . . . , m(j) , . . . |z(1) , . . . , m(j) , . . . i . = m(j) ∈M(O (j) ) Es hat sich aber eingebürgert, lediglich den Bezeichner zu verwenden, der zu der Observablen gehört, die wir konkret zur Charakterisierung des physikalischen Zustandes eines quantenmechanischen Systems heranziehen wollen. Es drängt sich die Frage auf, ob wir ohne Sorge Informationen zu jeder beliebigen Observablen-Kombination oder gar aller Observablen in einen Zustand | z i ablegen können? Dies ist in der Klassischen Mechanik der Fall, was wir sogleich als Eigenschaft der Observablen-Konstruktion i einsehen: Zum Beispiel gilt offenbar BOrt ◦ BImp j = i BImp j ◦ BOrt . Genau diese Eigenschaft charakterisiert die Algebra der klassischen Observablen als Abelsch, d.h. es kommt nicht auf die Reihenfolge der Messungen an, es ist egal, ob zuerst die j–Komponente des Impulses und dann die i–Komponente des Ortes gemessen wird, oder umgekehrt. Diese algebraische Eigenschaft von klassischen Observablen ermöglicht es, den Phasenraum eines HamiltonSystems als Informationsspeicher für die gesamte Information über ein gegebenes mechanisches System anzusehen. Im Falle der Quantenmechanik fragen wir zunächst, linear welche Eigenschaft die Observablen O(j) : Z −→ (j) (1) (2) (j) (1) (2) Z , O |m m i = m |m m i , j ∈ {1, 2} erfüllen müssen, damit die Reihenfolge, in der diese gemessen werden, keine Rolle spielt. Die Antwort ist schnell gefunden und für auf eine neue mathematische Struktur: 0 = BO(1) O(2) − BO(2) O(1) = B[O(1) ,O(2) ] , wobei wir den Kommutator [O(1) , O(2) ] := O(1) ◦ O(2) − O(2) ◦ O(1) von O(1) und O(2) eingeführt haben. Offenbar spielt die Reihenfolge der Komposition (Hintereinanderschaltung) von O(1) und O(2) genau dann keine Rolle, wenn [O(1) , O(2) ] = 0, wenn also O(1) und O(2) kommutieren. Noch ein kleiner Vermerk zur Notation: [O(1) , O(2) ] = 0 meint [O(1) , O(2) ]|Zi = 0 ∀ | z i ∈ Z. Kommutierende Observablen heißen auch miteinander verträgliche Observablen. Es macht sicherlich Sinn, quantenmechanische Zustände mit miteinander verträglichen Observablen zu kennzeichnen. Aber macht es auch keinen Sinn, quantenmechanische Zustände mit unverträglichen (nicht verträglichen) Observablen zu bezeichnen? Sei also [O(1) , O(2) ] = R 6= 0. Dann kann |m(1) , m(2) i nicht gleichzeitig Eigenzustand von O(1) und O(2) sein. Somit eignen sich nur miteinander verträgliche Observablen als gemeinsame Bezeichner von quantenmechanischen Zuständen. Wir haben oben physiaklisch motiviert, daß {|mi}m∈M(O) eine vONB von Z hinsichtlich der Observablen O bildet, X | zi = c(m)|mi , c(m) ∈ C ∀ m ∈ M(O) . m∈M(O) Daher sind die c(m) ∈ C durch c(m) = hm | z i gegeben. Einsetzen in die Linearkombination liefert X X | zi = hm | z i|mi ≡ |mihm | z i . m∈M(O) m∈M(O) 27 Dies legt dem Objekt |mihm| eine strukturelle Bedeutung dann gilt linear nahe. Abbildungstechnisch haben wir |mihm| : Z −→ Z , | z i −→ c(m)|mi. Mit c(m) = hm | z i handelt es bei |mihm| im geometrischen Sinne um eine Projektion von | z i auf |mi entlang des Eigenzustandes |mi der Observablen O. Tatsächlich gilt (|mihm| ◦ |mihm|) | z i = |mihm | z i und (|m0 ihm0 | ◦ |mihm|) | z i = 0 für m 6= m0 . Da die {|mi}m∈M(O) eine vONB bilden, gilt auch X |mihm| = id , m∈M(O) wobei id : Z −→ Z , id | z i =| z i den Identitätsoperator (die identische Abbildung) bezeichne. Sei | z i ∈ Z normiert. Dann gilt 1 = hz | z i X = X m0 ∈M(O) X = hz|m0 ihm0 |mih m | z i | {z } m∈M(O) δm,m0 2 |c(m)| . Wir erhalten also ohne jede Mühe eine Einschränkung der Koeffizienten in der Linearkombination, die ganz den geometrischen Charakter der Projektion widerspiegelt. Die gewonnene geometrische Einsicht können wir nun nutzen, um eine bessere Vorstellung von Operatoren auf Zustandsräumen Z mit dim(Z) < ∞ zu erhalten. Im wesentlichen haben wir es ja mit Endomorphismen zu tun und können daher nach einer Matrixdarstellung solcher Operatoren fragen: X X Y = |m0 ihm0 |Y|mihm| m0 ∈M(O) m∈M(O) X X |m0 iYm0 m hm| , m0 ∈M(O) m∈M(O) wobei die Komponenten Ym0 m der zu Y zugeordneten Matrix folgendermaßen angeordnet seien: hm1 |Y|m1 i hm1 |Y|m2 i . . . hm |Y|m i hm |Y|m i . . . 2 . 1 2 2 .. .. .. . . . X |m0 ihm0 |O|mihm| m0 ∈M(O) m∈M(O) = X m|mihm| . (48) m∈M(O) Ebenso können wir Zustände | z i als Komponenten (hm1 | z i, hm2 | z i, . . . ) von Vektoren bezüglich der Basis {|mj i}mj ∈M(O) auffassen. Wir beschließen diesen Abschnitt über beschränkte Observablen mit einem Beispiel: Bsp. III.1 Gegeben sei eine SGz (±)–Apparatur. Ein Silberatom, welches diese Apparatur durchläuft, hat die Observable Spin Sz in z–Richtung mit den möglichen Meßwerten: M(Sz ) = {Sz (+), Sz (−)}, der zugehörige Vektorraum ist also 2–dimensional und wird von {|Sz (−)i, |Sz (+)i} aufgespannt. Der Identitätsoperator ist explizit durch id = |Sz (−)ihSz (−)| + |Sz (+)ihSz (+)| gegeben. Nach (48) gibt es dann folgende nützliche Darstellung von Sz : X O (1) (1) m0 m00 O m00 m Da {|Sz (−)i, |Sz (+)i} eine vONB ist, finden wir ohne Mühe Sz |Sz (±)i = Sz (±) |Sz (±)i . Ein beliebiger Zustand ist durch | z i = c(+)|Sz (+)i + c(−)|Sz (−)i gegeben, wobei c(±) = hSz (±) | z i und wegen |c(+)|2 + √ |c(−)|2 = 1 aus Symmetriegründen c(±) = 1/ 2 gilt. Bezüglich der vONB {|Sz (−)i, |Sz (+)i} können wir die Eigenzustände von Sz folgendermaßen darstellen: |Sz (+)i = b (1, 0) und |Sz (−)i = b (0, 1). Wenn Sie es nicht gleich sehen, dann schreiben Sie für den allgemeinen Zustand | z i = |Sz (+)ihSz (+) | z i + |Sz (−)ihSz (−) | z i, dies entspricht in der vONB dem Vektor (hSz (+) | z i, hSz (−) | z i). Jetzt brauchen Sie lediglich auf | z i = |Sz (±)i zu spezialisieren und die Normierung der Basis–Eigenzustände zu berücksichtigen. Die Matrixdarstellung von Sz ist somit: Sz (+) 0 Sz = b . (49) 0 Sz (−) IV. Diese Darstellung ist sinnvoll: Sei Y := O(1) ◦ O(2) die Komposition zweier Operatoren O(j) , j ∈ {1, 2} in Z. Dann gilt für m, m0 ∈ M(O): Ym0 m = X Sz = Sz (+) |Sz (+)ihSz (+)| + Sz (−) |Sz (−)ihSz (−)| . m∈M(O) ≡ O = . m00 ∈M(O) Die Matrixdarstellung eines P Operators O wird besonders einfach, wenn wir id = m∈M(O) |mihm| benutzen, denn MESSPROZESS & INTERPRETATION Die Tatsache, daß Zustandsräume in der Quantenmechanik notwendig Vektorräume über dem komplexen Zahlenkörper sind, zwingt uns so ausführlich über Observablen und den Meßprozeß nachzudenken, insbesondere auch was die Interpretation von Zuständen als Linearkombination der Basis–Eigenzustände einer Observablen betrifft. Statt eine Reihe von an dieser Stelle mehr oder weniger motivierten Postulaten zu verdauen, wollen wir den Meßprozeß in der Quantenmechanik ein wenig naiv aber instruktiv modellieren. Das Ziel ist, eine sich beinahe schon 28 aufzwingende, wenn vielleicht auch nicht zwingende Klarheit zu gewinnen, die diese Postulate nachhaltig inspiriert und motiviert. Der Einfachheit halber betrachten wir den Zustandsraum Z = ZO ⊗ ZA , dim(Z) < ∞ eines Systems S, welches sich aus einem Studienobjekt O und einer Meßapparatur A zusammensetzt. Konzeptionell ist hier zu betonen, daß wir auch A in die quantenmechanische Beschreibung miteinbeziehen, nicht nur das eigentliche quantenmechanische Objekt O unserer Forscherbegierde. Dies hat folgende Konsequenz: Sei O(1) eine Observable, die wir zur Beschreibung von O heranziehen wollen, und {|o(1) i}o(1) ∈M(O(1) ) die zugehörige vONB aus Eigenzuständen von O(1) . Sei weiterhin {|aj i}j∈J ⊂N eine vONB von ZA , die wir nicht weiter spezifizieren, weil wir ja an einer Messung von O(1) am Subsystem O interessiert sind. Dann ist ein allgemeiner Zustand | z i durch eine Linearkombination der Form X | zi = c(o(1) , aj ) |o(1) i ⊗ |aj i , (50) einem Eigenzustand vorliegen, sondern kann als LinearP kombination o(1) ∈M(O(1) ) d(o(1) )|o(1) i gegeben sein. In diesem Fall ist der Zustand des Gesamtsystems somit: X | zi = d(o(1) ) | o(1) i ⊗ | [o(1) ] i . (53) o(1) ∈M(O (1) ) Damit nicht genug: Der Zustand von O kann durch eine nicht–leere Menge von verträglichen Observablen beschrieben werden, sagen wir {O(1) , . . . , O(n) : [O(i) , O(j) ] = 0 , ∀ i, j ∈ {1, . . . , n} ⊂ N}, die uns alle interessieren. Hinsichtlich dieser Beschreibung ist ZO = ⊗ni=1 ZOi . Sind wir zunächst wieder lediglich an einer Beschreibung mittels O(1) interessiert und liegt der Zustand von O wieder in einer Überlagerung von Eigenzuständen bzgl. O(1) vor, so gilt für den Zustand des Gesamtsystems unmittelbar nach der Messung: | zi = X f1 (o(1) ) | o(1) i ⊗ mit c(o(1) , aj ) ∈ C ∀ o(1) ∈ M(O(1) ) , j ∈ J gegeben. Offenbar ist z ein legitimer Zustand in Z, allerdings können aus (50) den Zustandsräumen ZO und ZA nicht voneinander unabhängige Zustände zugeordnet werden, außer c(o(1) , aj ) = 0 ∀ o(1) ∈ M(O(1) ) , j ∈ J . Nehmen wir einmal an, das Subsystem O läge im Zustand o ∈ M(O(1) ) vor. Dann ist der Zustand von A relativ zu dem von O und kompatibel mit | z i folgender: X |A ` O . oi = N (o) c (o, aj ) |aj i , (51) j∈J wobei N (o) eine Normierungskonstante bezeichne. Das Konzept des relativen Zustandes |A a O . oi ist offenbar sinnvoll, da |A a O . oi eindeutig durch |oi bestimmt ist, und insbesondere nicht von {|o(1) i}o(1) ∈M(O(1) ),o(1) 6=o abhängt. Es gilt dann X | zi = N −1 o(1) |o(1) i ⊗ |A a O . o(1) i . o(1) ∈M(O (1) ) Der Begriff des relativen Zustandes (auch relationaler Zustand) ist nicht nur sinnvoll, sondern auch zentral insofern, als es ausschließlich sinnvoll ist, nach relativen Zuständen von Subsystemen zu fragen. Wir vereinfachen jetzt die Notation: |[o(1) ]i := N −1 o(1) |A a O . o(1) i, X | zi = | o(1) i ⊗ | [o(1) ] i . (52) o(1) ∈M(O (1) ) Die Interpretation ist: Liegt O im Zustand |o(1) i , o(1) ∈ M(O(1) ) vor, so registriert A dies nachdem beide Subsysteme in Kontakt gebracht wurden, und zeichnet dies entsprechend auf, in dem der zu |o(1) i gehörende Meßwert in den Speicher von A eingetragen wird. Dies verallgemeinern wir sogleich: Der Zustand von O braucht ja nicht in |zj i = X |zj i ⊗ | [o(1) ] i , j=2 o(1) ∈M(O (1) ) o(1) ∈M(O (1) ),j∈J n O fj (o(j) )|o(j) i , j ∈ {1, . . . , n} ⊂ N . o(j) ∈M(O (j) ) (54) Interessiert uns anschließend die Observable O(2) für O im Zustand (54), so erhalten wir unmittelbar nach der Messung den Zustand X X | zi = o(1) ∈M(O (1) ) o(2) ∈M(O (2) ) f1 (o(1) )f2 (o(2) ) | o(1) i ⊗ | o(2) i ⊗ n O |zj i ⊗ | [o(1) , o(2) ] i , ⊗ (55) j=3 wobei fj = ho(j) |zj i , j ∈ {1, 2}, und die Definition von |z1 i ist klar. Die Meßaparatur (Beobachter) hat jetzt [o(1) , o(2) ] in den Speicher geladen. Eine wichtige Annahme bei unserer Modellierung ist, daß auch der uns als klassisch erscheinenden Meßaparatur ein quantenmechanischer Zustand zugeordnet wird, also die quantenmechanische Beschreibung als fundamentaler angesehen wird, die sich tatsächlich auf alle Objekte erstreckt. Tatsächlich halten viele diese Sichtweise in Ehren und betrachten die klassischen Systeme als emergente Objekte, die auf bestimmten Skalen den Gesetzen der Klassischen Mechanik approximativ gehorchen, aber fundamental eine quantenmechanische Natur haben, und exakt eben quantenmechanisch zu beschreiben sind. Dies hat nun eine interessante Konsequenz für eine erste vorsichtige Interpretation von (55). Relativ zu den unterschiedlichen Zuständen, die O bezüglich den Observablen O(j) einnehmen kann, gibt es eben auch unterschiedliche Zustände für die Meßapparatur, die ja die möglichen Meßwerte speichert. Dies bedeuter aber, daß es zu jeder möglichen Kombination von Meßwerten auch 29 entsprechende unterschiedliche Zustände des Meßapparates gibt, obwohl wir diesen zumindestens näherungsweise sicherlich als klassisches Objekt ansehen. Der Meßappart ist aber ein Synonym für eine Beobachterin/einen Beobachter. Da die Beobachter als Subsytem Teil des Gesamtsystems sind, gibt es keine externen Beobachter. Damit scheint es entsprechend der Anzahl der Kombinationen von möglichen Meßwerten genauso viele Beobachterzustände zu geben. Dieser rohen Gedankengänge führt mehr oder weniger unmittelbar zur Vielwelten– Interpretation der Quantenmechanik, die zumindestends vom Sci-Fi–Standpunkt her beurteilt eine fulminante Interpretation darstellt. Fallen wir für den Moment auf den einfacheren Fall (53) zurück. Nach der Messung von O(1) und der entsprechenden Speicherung der möglichen Meßwerte o(1) ∈ M(O(1) ) in den zugehörigen möglichen relativen Zuständen des Meßapparates gibt es keine unabhängigen Zustände mehr, die die Subsysteme O und A unabhängig voneinander beschreiben. Allerdings ist in jedem Summanden |o(1) i ⊗ |[o1 ]i der Linearkombination (53) der relative Objektzustand durch einen Eigenzustand von O(1) gegeben und der Zustand der entsprechende relative Zustand der Meßapparatur beschreibt stellt exakt den Sachverhalt dar, daß der Meßapparat diesen Objektzustand tatsächlich registriert hat. Lassen wir das Objektsystem nun ein weiteres Mal mit der Meßapparatur in Kontakt treten und fragen, wie das Gesamtsystem, welches ursprünglich im Zustand (53) vorliegt, nun zu beschreiben ist. Die Antwort kennen wir: | zi = X d(o(1) ) | o(1) i ⊗ | [o(1) , o(1) ] i . (56) o(1) ∈M(O (1) ) Wieder beschreibt |o(1) i ⊗ |[o(1) , o(1) ]i den relativen Objektzustand in einem Eigenzustand von O(1) , aber jetzt beschreibt der relative Beobachterzustand den Sachverhalt, daß der entsprechende Meßwert zweimal registriert wurde. Somit ist die Messung reproduzierbar, was eine direkte Konsequenz davon ist, daß nach einer Beobachtung der Objektzustand relativ zu einem bestimmten Beobachterzustand eben der entsprechende Eigenzustand von O(1) ist. Wir betrachten jetzt eine ganz andere Situation: Das Objekt O sei N 3 n-mal identisch kopiert worden, die Kopien sollen in keiner direkten Wechselwirkung miteinander stehen, können aber jeweils mit der Meßapparatur in Kontakt gebracht werden. Was können wir mit so einem Aufbau zustande bringen? Wir können die Observable O an einer Untermenge der Kopien messen, sagen wir an N 3 r ≤ n Kopien. Offenbar gilt dann für den Zustand des Gesamtsystems (jede Kopie wird als Subsystem aufgefaßt), |z(r) i = X o1 ∈M(O) ··· X or ∈M(O) f (o1 ) . . . f (or )|o1 i ⊗ · · · ⊗ |or i ⊗ ⊗ n O |zj i ⊗ |[o1 , . . . , or ]i . (57) j=r+1 Die Interpretation von (57) ist jetzt klar: jeder Term r |o1 i⊗· · ·⊗|or i⊗|zj i⊗j=1 ⊗|[o1 , . . . , or ]i in der Linearkombination (57) beschreibt eine Beobachterin/einen Beobachter mit einem bestimmten Speicherinhalt [o1 , . . . , or ]. Bezüglich dieser so charakterisierten Beobachter sind die beobachteten Kopien von O relativ zum Speicherinhalt in Zuständen |oj i , j ∈ {1, . . . , r} ⊂ N, die allesamt Eigenzustände von O sind, währen die restlichen Kopien unberührt in ihren ursprünglichen Zuständen |zk i , k ∈ {r + 1, . . . , n} ⊂ N bleiben. Betrachten wir nun die Situation, in der eine Beobachterin/ein Beobachter die folgende Konfiguration von Meßdaten im Speicher hat: [o1 , . . . , or ], wobei die oj , j ∈ {1, . . . , r} jetzt fest sind. Wir nehmen an, daß jetzt einer der Meßwerte reproduziert wird, die Konfiguration von Meßdaten im Speicher sieht dann so aus:[o1 , . . . , or , ok ] : k ∈ {1, . . . , r}. Jeder Term der Linearkombination (57) beschreibt dann eine Beobachterin/einen Beobachter mit einem Speicherinhalt, bei dem an der k-te und (r + 1)te Position der gleiche Meßwert eingetragen ist. Für die Beobachterin/den Beobachter, selbst ein Subsystem und eben nicht losgelöst vom Objektsystem, erscheint die Sequenz von Messungen derart, daß jede Messung das Objektsystem in den entsprechenden Objektzustand (Eigenzustand der Observablen) springen läßt, in dem es dann während der Meßreihe verbleibt. Dies bedeutet: Obwohl während der gesamten Meßreihe nur ein physikalisches System die Beobachterin/den Beobachter repräsentiert, gibt es dennoch keinen einzigen Zustand, der die Beobachterin/den Beobachter eindeutig beschreibt. Vielmehr ist der Zustand des Gesamtsystems als Linearkombination gegeben, in der jeder Term einen bestimmten Beobachterzustand relativ zum zugehörigen Objektzustand ausweist. Jede Beobachtung führt dazu, daß jeder ursprüngliche Beobachterzustand in weitere verschiedene Beobachterzustände aufspaltet. Jedem dieser Zustände entspricht ein unterschiedliches Meßergebnis und der zugehörige Objektzustand. Alle Möglichkeiten nach einer Meßreihe sind dabei simultan realisiert in der Linearkombination. Im Gegensatz zur Klassischen Mechanik (Trajektorie im Phasenraum) existiert in der Quantenmechanik für eine Meßreihe also nicht nur eine Speicherkonfiguration, sondern ein ganzer Graph von Speicherkonfigurationen derart, daß sämtliche nach einer Meßreihe möglichen Speicherkonfigurationen Teil der Linearkombination sind, die den Zustand des Gesamtsystems beschreibt, wobei die möglichen Konfigurationen mit unterschiedlichen Koeffizienten in der Linearkombination auftreten können. Nun ist Physik aber eine quantitative Naturbeschreibung und es stellt sich die Frage, was es in dieser Situation überhaupt quantitativ auszusagen gibt? Eine quantitative Aussage, die wir gerne machen möchten, betrifft 30 die Frequenz, mit der bestimmte Meßwerte in einer Meßreihe auftauchen. Es genügt, Linearkombinationen der folgenden Form zu betrachten: X Z 3| z i = f (o)|oi . (58) o∈M(O) Wir suchen ein Vorschrift, jedem Element der Linearkombination ein Maß µ : Z −→ R+ so zuzuordnen, die kompatibel ist mit der Häufigkeit, mit der der betreffende Meßwert von einem gegebenen Beobachter gemessen wird. Da die {|oi}o∈M(O) eine vONB bilden, können wir | z i auch als den Vektor (f (o1 ), . . . , f (odim(Z) ))T ∈ Cdim(Z) auffassen, wobei oj ∈ M(O) , j ∈ {1, . . . , dim(Z)}. Jede Komponente zerlegen wir nun so: C 3 f (oj ) = |f (oj )| exp (iϕ(oj )). Die Phasen exp (iϕ(oj )) fassen wir als Elemente von U(1) auf, die als Abbildung R −→ C einbetten. Sie können damit nicht als Bewegungen auf R im maßtheoretischen Sinn erklärt werden. Nach Voraussetzung sind die Eigenzustände {|oi}o∈M(O) normiert. Die Normierungsvorschrift legt den Zustand aber ebenfalls nur bis auf eine Phase fest, die aber prinzipiell willkürlich ist: [|oi] := {|o0 i ∈ Z : |o0 i = exp (iψ)|oi , ψ ∈ [0, 2π] ⊂ R}. Insgesamt ergibt sich also für einen Term in der Linearkombination (58) wieder eine Äquivalenzklasse, die wir kurz mittels der Äquivalenzrelation charakterisieren: f (oj )|oj i ∼ exp (iγj )|f (oj )||oj i , γj ∈ [0, 2π] ⊂ R. In obiger Notation, γj = ϕ(oj ) + ψj , da aber ψj prinizpiell beliebig ist, ist auch γj beliebig. Es bietet sich nun an, diesen Phasenfaktor ganz im Eigenzustand zu absorbieren. Dann gilt | z i = b (|f (o1 )|, . . . , |f (odim(Z) )|)T . So gesehen ist das gesuchte Maß eine Funktion µ : Rdim(Z) −→ R der Komponenten |f (oj )|. Da Maße extensive Größen sind, gilt X µ |f (o1 )| , . . . , f (odim(Z) ) = µ (|f (o)|) . o∈M(O) (59) Wir haben immer die Freiheit, das Maß auf Eins zu normieren. Dann haben wir einerseits µ(|f (o1 )|, . . . , |f (odim(Z) )|) = 1, da alle möglichen Meßwerte im Spektrum M(O) berücksichtigt wurden. Andererseits liefert die Normierung des Zustandes X ! 2 1 = hz | z i = |f (o)| . (60) o∈M(O) Gleichsetzen von (59) und (60) liefert µ(|f (o)|) = |f (o)|2 , o ∈ M(O), da dies für alle Linearkombinationen gelten muß. Wenden wir sogleich unsere Vorschrift auf (57) an, so wird jedem NnElement der Linearkombination |o1 i ⊗ · · · ⊗ |or i ⊗ j=r+1 |zj i ⊗ |[o1 , . . . , or ]i das Maß (Gewicht) µ(f (o1 ), . . . , f (or )) = |f (o1 )|2 · · · |f (or )|2 zugeordnet. Das Gewicht, welches einer bestimmten Speicherkonfiguration [o1 , . . . or ] zugeordnet wird, ist also das Produkt der Gewichte für die einzelnen Speicherinhalte. Es gibt einen direkten Zusammenhang zwischen Maßtheorie, wie sie hier ganz simpel zum Einsatz kommt, und Wahrscheinlichkeitstheorie. Dieser erlaubt uns, Gewichte der Form µ(f (o1 ), . . . , f (or )) gleichzusetzen mit der Wahrscheinlichkeit, eine Meßreihe (Speicherkonfiguration) [o1 , . . . or ] vorzufinden, vorausgezetzt die Meßreihe ist ausreichend lang, so daß sie als zufällig generierte Folge von Messungen angesehen werden kann. Dies kann sofort verallgemeinert werden auf Meßreihen verschiedener Observablen. V. UNBESCHRÄNKTE OBSERVABLEN Wir lassen jetzt die Einschränkung dim(Z) < ∞ fallen, betrachten also zum Beispiel Observablen O mit M(O) = R. Die Theorie dieser Observablen (unbeschränkte Operatoren) ist recht vielseitig und auch subtil. Eine präzise Skizze finden Sie in Abschnitt II F, hier gehen wir heuristischer vor mit einem strengen Augenmerk auf die Aspekte, die tatsächlich relevant sind für die Beschreibung quantenmechanischer Systeme und nicht ausschließlich der logischen Konsistenz geschuldet sind. Zunächst fällt auf, daß es wohl wenig sinnvoll scheint von der Wahrscheinlichkeit zu sprechen, einen Meßwert o ∈ M(O) bei einer entsprechenden Messung von O an einem Zustand aus Z vorzufinden. Auch klassisch können wir Meßwerte nur mit endlicher Genauigkeit bestimmen, in diesem Sinne sind reelle Zahlen in der Natur nicht observabel realisiert. Es mach vielmehr Sinn, in beiden Naturbeschreibungen, einen Meßwert in einem bestimmten Intervall anzusiedeln. In der Theorie Linearer Operatoren ist diese Einsicht eng mit der mathematischen Tatsache verknüpft, daß die zugehörigen Eigenzustände gar nicht normierbar sind und daher nicht bona fide Zustände eines quantenmechanischen Systems darstellen können. Insbesondere ist es unmöglich, ein System so zu präparieren, daß es durch einen nicht normierbaren Zustand repräsentiert werden kann. Eine Beschreibung solcher Observablen verdanken wir von Neumann. Seine Charakterisierung basiert auf der Existenz von 1–Parameter Familien von Projektoren {Eo }o∈R , mit der Eigenschaft: Für beliebige Zustände |φi|, |ψi ∈ Z gilt Z hφ|O|ψi = dhφ|Eo |ψi o . (61) R Hierbei ist f (o) := hφ|Eo |ψi als differenzierbare Funktion zu verstehen, und df (o) = do f 0 (o), wobei f 0 (o) := df /do. Das Integral ist dann das gewöhnliche Riemann– Integral. Es soll nicht verschwiegen werden, daß die Mathematik diese Charakterisierung von O auch dann noch hoch hält, wenn die Funktion f nicht differentierbar ist. Allerdings erfordert dies eine Verallgemeinerung des Integralbegriffs hin zum sogenannten Riemann–Stieltjes– Integral. 31 Für jedes Intervall I := [b, c] ⊂ R , b < c definieren wir Z df EI = dEo . (62) (4) Sei M(O) nicht entartet. Dann ist mit obiger Notation W (o ∈ I ⊂ M(O) , |ψi ∈ Z) Z = do |hψ|oi|2 I EI projiziert auf den Unterraum von Z, in dem die Zustände liegen, die zu Eigenwerten o ∈ I ⊂ M(O) der Observablen O gehören. Die Wahrscheinlichkeit W(o ∈ I ⊂ M(O) , |ψi ∈ Z), daß eine Messung von O am physikalischen System im Zustand |ψi ∈ Z einen Meßwert o ∈ I ⊂ M(O) im Intervall I liefert ist W (o ∈ I ⊂ M(O) , |ψi ∈ Z) = hψ|EI |ψi . die Wahrscheinlichkeit dafür, bei einer Messung der Observablen O an einem physikalischen System im Zustand |ψi einen Meßwert im Intervall I zu beobachten. (63) Für diese Konstruktion ist essentiell, daß I 3 b, c : b < c, da keine Projektoren auf einzelne Zustände |oi , o ∈ M(O) existieren, noch schlimmer: @|oi ∈ Z : O|oi = o|oi. Eine kreativere Charakterisierung unbeschränkter Observablen verdanken wir Dirac. Dirac hat hemmungslos angenommen, daß Eigenzustände |oi in irgend einem Sinne existieren müssen. Diese mutige Annahme konnte im Rahmen von sogenannten Gel0 fand − Tripeln mathematisch konsistent realisiert werden, aber das ist Thema einer anderen Vorlesung. Wir lassen uns von Dirac’s erfahrener Leichtigkeit anstecken und postulieren folgende empirische Regeln: Diese empirischen Regeln können als kontinuierliche Verallgemeinerung der diskreten Beschreibung aus Abschnitt III C angesehen werden. Regel (1) ist natürlich mit Vorsicht zu genießen, da im Falle o0 6= o dem Zustand |oi ja keine vernünftige Norm zugeordnet werden kann. Von Neumanns Konstruktion erlaubt folgende Meinung: im Prinzip sollten wir mit einer kontinuierlichen Überlagerung von Zuständen arbeiten, deren zugehörigen Eigenwerte in einem abgeschlossenen Intervall liegen. Aber das ist mühsam. Der heuristische Anschluß an von Neumanns Beschreibung unbeschränkter Observablen ist folgendermaßen gut einprägsam: (1) Gibt es Zustände {|oi}o∈M(O) mit O|oi = o|oi für o ∈ M(O), wobei M(O) = R möglich ist, so können diese in folgendem verallgemeinerten Sinne orthonormiert werden: ho0 |oi = δ (o0 − o) , o, o0 ∈ M(O) . VI. M(O) (3) Folgende Rechnung macht Sinn: Seien |ψi, |φi ∈ Z. Dann ist Z Z hψ|φi = do do0 0 M(O) 0 hψ|oiho|o iho |φi Z do hψ|oiho|φi = M(O) Z ≡ do ψ ∗ (o)φ(o) . (66) M(O) Insbesondere gilt: Z k|ψik2 ≡ hψ|ψi = do |hψ|oi|2 M(O) Z ≡ do |ψ(o)|2 . M(O) dEo = do |oiho| . (64) (2) Jeder Zustand | z i ∈ Z kann nach den verallgemeinersten Eigenzuständen entwickelt werden: Z | zi = do |oiho | z i . (65) M(O) (68) I⊂M(O) (67) (69) KONSTRUKTION VON OBSERVABLEN I — ELEMENTARE OBSERVABLEN Elementare Observablen heißen die Observablen, die in einem bestimmten Sinne zu den klassischen Observablen korrespondieren, die den Phasenraum eines mechanischen Systems bilden, also Ort und Impuls. In der Klassischen Mechanik lassen sich aus diesen dann alle anderen Observablen in bekannter Weise konstruieren. A. Ort als quantenmechanische Observable Gegeben sei ein quantenmechanisches System im Zustand | z i ∈ Z. Zum Beispiel kann | z i den Zustand eines freien Teilchens beschreiben, welches sich irgendwo auf dem reellen Zahlenstrahl R1 befinde. Sicherlich ist es legitim zu fragen, und diese Frage stellen wir uns klassisch gewohnheitsmäßig, wo sich das Teilchen im Zustand | z i zum Zeitpunkt der Ortsmessung befindet? Diese Frage ist der Anker unserer Konstruktion von Observablen. In diesem Stadium brauchen wir empirische Erfahrungen, die wir klug in unsere mathematische Modellbildung einbeziehen. Da es sich um ein freies Teilchen handelt, kann es a priori jeden Punkt im R1 als Ort einnehmen. Bezeichnen wir die Ortsobservable mit Oq , so gilt sicherlich M(Oq ) = R1 . Es handelt sich also um eine unbeschränkte Observable. Es gibt nun 32 Zustände |xi , x ∈ M(Oq ), in denen Orte gespeichert werden können, und aus denen diese folgendermaßen ausgelesen werden können Oq |xi = x|xi , x ∈ M(Oq ). Diese Ortsspeicher sind verallgemeinerte Eigenzustände von Oq , und wir erinnern uns, daß |xi ∈ / Z. Der Ausleseprozeß (die Ortsmessung) setzt voraus, daß unser Meßgerät (Detektor) irgendwo auf R1 stationiert wird. Sagen wir, der Detektor nehme das abgeschlossene Intervall I ⊂ R1 ein. Ausschließlich im Detektorintervall kann das Teilchen nachgewiesen werden, d.h. wenn gilt Z Z dx |xihx | z i = | z i − dx |xihx | z i I⊂M(Oq ) M(Oq )/I 6= 0 . (70) Das Teilchen muß sich offenbar entweder im Detektorintervall befinden oder außerhalb davon: Z | zi = dx |xihx | z i I∪(M(Oq )/I) Z dx |xihx | z i . = (71) R Daraus folgt, daß die Wahrscheinlickeit dafür, das Teilchen im Detektor vorzufinden (also dafür, daß der Detektor das Teilchen nachweist) folgendermaßen gegeben ist: Z W (x ∈ I, | z i ∈ Z) = dx |Z(x)|2 I = 1 − W (x ∈ M(Oq )/I, | z i ∈ Z) . (72) wobei wir Z(x) := hx | z i gesetzt haben. In der Literatur wird W (x ∈ I, | z i ∈ Z) oft die Aufenthaltswahrscheinlichkeit des Teilchens im Detektor genannt, oder auch Der Erwartungswert E(Oq , | z i) := hz|Oq | z i für den Ort des Teilchens im Zustand | z i ∈ Z ist Z E(Oq , | z i) ≡ hz|Oq | z i = dx |Z(x)|2 x . (73) R Die Interpretation dieses Ausdrucks ist klar: |Z(x)|2 ist das Gewicht (die Wahrscheinlichkeit) dafür, das Teilchen am Ort x ∈ R vorzufinden, und das Integral summiert alle möglichen Aufenthaltsorte mit ihrer entsprechenden Gewichtung auf. Die Gewichte sind wie üblich normiert: E(id, | z i) = hz | z i = 1, wobei id | z i =| z i , | z i ∈ Z. Nun muß auch |z0 i := Oq | z i normierbar sein, also E(id, |z0 i) < ∞. Dies führt auf Z dx |Z(x)|2 x2 < ∞ . (74) Für Z ∈ D(Oq ) setzen wir (Oq Z)(x) = xZ(x). Offenbar ist Oq unbeschränkt, wir brauchen lediglich Z ∈ L2 (R) mit Träger nahe bei ±∞ zu wählen. So können wir kOq Zk beliebig groß werden lassen, und gleichzeitig kZk = 1 haben. Natürlich macht der Ausdruck xZ(x) auch dann noch Sinn, wenn Z ∈ / D(Oq ), aber es ist dann halt xZ(x) ∈ / L2 (R). Wir sehen jedoch, daß es aus physikalischen Gründen unerläßlich ist, nur Z ∈ D(Oq ) ⊂ L2 (R) zu erlauben, weswegen obige Einschränkung des Definitionsbereiches vorgenommen werden muß. Dabei ist D(Oq ) der größte Definitionsbereich, für den Oq Z ∈ L2 (R) gilt. Die Verallgemeinerung auf R3 als Ortsraum macht keine große Mühe. Allerdings lohnt es sich, auf eine konzeptionelle Überlegung hinzuweisen. Bezeichnen wir mit Oq1 die Ortsobservable, mit deren Hilfe die Ortsinformation entlang der q1 –Richtung ausgelesen werden kann, und ensprechend mit Oq2 die Ortsinformation entlang der q2 – Richtung. Das quantenmechanische System liege im Zustand | z i ∈ Z vor. Eine interessante Frage ist nun, ob die Reihenfolge der Ortsmessungen eine Rolle spielt? Es ist eine Erfahrungstatsache, daß auf den Längenskalen, die uns in dieser Vorlesung interessieren, Ortsmessungen kommutieren: [Oq1 , Oq2 ] | z i = 0 ∀ | z i ∈ Z, d.h. die Reihenfolge der Ortsmessungen ist unerheblich, Ortsoperatoren kommutieren. Wir ahnen bereits, daß dies keine Selbstverständlichkeit ist. Andererseits betrachten wir im Moment nur quantenmechanische Systeme im Euklidischen Vektorraum, der mit einer klassischen Geometrie ausgestattet ist. Die Fragestellung, ob diese Geometrie quantisiert werden kann, liegt außerhalb dieses Vorlesungsrahmens. B. Impuls als quantenmechanische Observable Gegeben sei eine klassische Observable B : P −→ R auf dem Phasenraum P ∼ = T ∗M ∼ = R3 × R3 eines mechanischen Systems, und (q, p) ∈ P. Wir vergleichen jetzt B(q + a, p) , a ∈ R3 mit B(q, p). Ohne große Bedenken gilt formal: B(q + a, p) = (1 + ∇a + . . . )B(q, p), wobei ∇a ≡ a · ∇ die Richtungsableitung in Richtung a bezeichne. Also können wir in der Klassischen Mechanik einen Translationsoperator einführen. Bezeichne O(P) die Menge der Observablen auf P, so ist eine endliche Translation in Richtung a ∈ R3 folgendermaßen gegeben: Ta : O(P) −→ O(P), definiert als B −→ Ta (B) := B ◦ Ta , wobei df R Dies ist der Ausgangspunkt für eine anständige Definition der Ortsobservablen: Def. VI.1 (Ortsoperator) Sei Z = L2 (R) und D(Oq ) der Definitionsbereich von Oq , Z 2 2 2 D(Oq ) = Z ∈ L (R) : dx |Z(x)| x < ∞ .(75) R (Ta (B))(q, p) = B(q + a, p) = exp (∇a )B(q, p) . (76) Nun ist es oft zweckmäßiger direkt mit dem Generator Gâ für Translationen in Richtung â ≡ a/kak df Gâ = lim dTa /dkak kak→0 (77) 33 zu arbeiten, wobei die Abbildungsvorschrift klar sein sollte. Somit ist Gâ = ∇â der (infinitesimale) Generator für Translationen in Richtung â. Offenbar handelt es sich bei Translationen um eine Abelsche Gruppe, d.h. die Generatoren für Translationen kommutieren. Ist ein mechanisches System invariant unter räumlichen Translationen (Homogenität des Raumes), so impliziert diese Symmetrie mittels eines Satzes von Noether die Erhaltung des linearen Impulses. Es ist instruktiv, eine algebraische Vorschrift für Translationen zu finden. Dazu betrachten wir die Fourier– Transformierte von B(q, p), die wir folgendermaßen noe p)](q, p). Damit wird aus (76): tieren: B(q, p) = FT [B(k, e p)] (q, p) = Ta FT [B(k, h i e p) (q, p) FT exp (iha, ki)B(k, (78) Der Generator für Translationen in Richtung â im Fourier–Raum ist also gerade hâ, iki. Für den Spezialfall, daß â mit einem Einheitsvektor unseres Koordinatensystems zusammenfällt, finden wir somit, daß der zugehörige Generator im Fourier–Raum gerade die entsprechende Komponente des zu q Fourier–konjugierten Impulses ist. Wir merken uns als wichtiges Resultat folgende Fourier– Korrespondenz: ∇ = b ik. Noch ein Wort zu den Maßeinheiten: Eigentlich hat k die Maßeinheit einer inversen Länge L, [k] = 1/L. Dies garantiert, daß ha, ki frei von Maßeinheiten ist. Damit trägt k aber nicht die Maßeinheit, die zu einem Impuls gehört: [Impuls] = M L/T , wobei M für die Maßeinheit von Masse steht, und T für die Maßeinheit in der Zeit gemessen wird. Wir werden weiter unten sehen, daß k mittels einer dimensionsbehafteten Konstante so reskaliert werden kann, daß k ∝ Impuls gilt. Unsere Sichtweise ist jetzt folgende: In der Klassischen Mechanik ist der Impuls definiert als der Generator von räumlichen Translationen, wenn diese im Fourier– Raum ausgewertet werden. Diese operationelle Sichtweise übertragen wir nun in die Quantenmechanik. Zunächst einmal müssen wir das Konzept von Translationen in die Quantenmechanik übertragen. Das prinzipiell (also nicht nur für diesen Fall) geeignte Mittel zum Übertragen von klassischen Konzepten ist Darstellungstheorie. Def. VI.2 Sei G eine (Matrix–) Gruppe, Z ein komplexer Hilbert–Raum und U(Z) die unitäre Gruppe von Z. Eine unitäre Darstellung von G in Z ist ein Gruppenhomomorphismus U : G −→ U(Z) , (79) der in folgendem Sinn stetig ist: Für alle konvergenten Folgen (gν ) in G und alle |ψi ∈ Z gilt: Die Folge (U (gν )|ψi) konvergiert bezüglich der Norm in Z und es gilt lim U (gν )|ψi = U (lim gν )|ψi. Die Darstellung heißt treu, wenn U injektiv ist, also wenn G isomorph zur Untergruppe U (G) ⊂ U(Z) ist. Die Qualifikation unitär spielt eine wichtige Rolle, weil sie grantiert, daß die Darstellung auf Z normerhaltend operiert. Betrachten wir einmal etwas umständlich für | z i ∈ Z, Z ∈ D(Oq ), x, x0 ∈ M(Oq ) und a ∈ R3 : Z (U (Ta )Z)(x) ≡ hx|U (Ta ) | z i = d3 x0 hx|U (Ta )|x0 ihx0 | z i R3 Z df = d3 x0 hx|x0 + aihx0 | z i R3 = Z(x − a) = (exp (−∇a )Z) (x) . (80) Es fällt auf, daß U (Ta ) nicht manifest unitär ist. Das bedeutet nicht, daß die Darstellung nicht unitär ist, sondern zunächst einmal lediglich, daß die Unitarität der Darstellung nicht offenkundig ist. Aber dies bedeutet auch, daß wir noch nicht davon ausgehen können, daß U (Ta )|xi = |x + ai eine sinnvolle Vorschrift ist. Wir beginnen ganz heuristisch ohne allzu große Bedenken technischer Natur. In Anlehnung an den klase sischen Fall betrachten wir Z(x) = FT [Z(k)](x) e und rechnen (U (Ta )Z)(x) = (U (Ta )FT [Z(k)])(x) = e FT [exp (iha, ki)Z(k)](x). Dabei haben wir benutzt, daß ∇ exp (ihk, xi) = ik exp (ihk, xi) . (81) Dies suggeriert, daß ∇/i ein unbeschränkter Operator ist mit ebenen Wellen als Eigenfunktionen zu Eigenwerten k ∈ R3 , M(∇/i) = R3 . Damit ist ∇/i ein guter Kandidat für eine Observable. Außerdem ist seine Interpretation evident: Modulo dem oben angesprochenen Problem mit den Maßeinheiten ist ∇/i ∝ Op , dem Impulsoperator (der Observable Impuls in der Quantenmechanik). Lassen Sie uns das Problem mit den Maßeinheiten ein für alle Mal aus der Welt schaffen, bevor wir mit der Konstruktion fortfahren. De Broglie hatte 1924 eine ungemein revolutionäre Idee. Er fand es angebracht (wir folgen hier nicht der historischen Entwicklung und halten uns eher bedeckt, was wellenmechanische Ideengeschichte betrifft, da dies aus heutiger Sicht nicht mehr so relevant zu sein scheint), Teilchen Welleneigenschaften zuzusprechen. Für ein Teilchen der Masse m mit einer Geschwindigkeit v c soll nach de Broglie folgende Beziehung zwischen dem Impuls p dieses Teilchens im Laborsystem und der diesem Teilchen über seine Welleneigenschaft zugeordnete Wellenlänge λ bestehen: λ = h/p, dabei ist h eine dimensionsbehaftete Konstante mit [h] = [Wirkung] = M T . Es stellte sich heraus, daß h gerade die Planck–Konstante (auch Plancksches Wirkungsquantum). Nach de Broglie vermittelt das Wirkungsquantum gerade die Konversion zwischen Teilchen– und Welleneigenschaften der Materie. Für uns ist wichtig, daß Op = ~∇/i, wobei ~ := h/2π. Bei unserer heuristischen Untersuchung haben wir also folgendes gefunden: Generator für räumliche Translationen von quantenmechanischen Zuständen ist der Impulsoperator Op = ~∇/i mit M(Op ) = R3 , und Op N exp (ihp, xi/~) = p N exp (ihp, xi/~) , (82) 34 wobei N eine Konstante bezeichnet. Offenbar liegen die Eigenfunktionen von Op nicht in Z. Eine rigorose Untersuchung bezüglich der Fragestellung, ob Op selbstadjungiert ist oder eine selbstadjungierte Erweiterung besitzt wird hier nicht gegeben und ist Gegenstand der Theorie Linearer Operatoren in Hilbert–Räumen. Wir halten fest: Die Konstante N bestimmt sich aus der Rechnung (p, p0 ∈ M(Op )) Z 0 hp|p i = d3 x hp|xihx|p0 i R3 Z 2 = |N | d3 x exp (ihx, p − p0 i/~) R3 2 Def. VI.3 (Impulsoperator) Sei AC(R) die Menge der absolut stetigen Funktionen auf R. Der Impulsoperator Op ist definiert durch: D(Op ) = AC(R) und (Op Z)(x) = −i~Z 0 (x) , Z ∈ AC(R). Bemerken Sie, daß die Definition für eine Komponente der Impulsobservablen gegeben wurde. Wichtig ist nun der Satz VI.1 Es gilt Op = Op† , d.h. der Impulsoperator ist selbstadjungiert. Weiter oben, Gleichung (80), haben wir gefunden, daß U (Ta ) = exp (−∇a ) ist. Dies können wir aber auch so notieren: U (Ta ) = exp (−ia Op /~). Da Op selbstadjungiert ist, ist U (Ta ) unitär (nach einem Satz von Stone). Wir müssen hier natürlich vorsichtig sein mit dem Verständnis von U (Ta ) als Exponentialfunktion, da Op unbeschränkt und selbstadjungiert ist. So einsichtig diese Konstruktion der quantenmechanischen Impulsobservablen analog zur operationellen Vorschrift in der Klassischen Mechanik verläuft, so bricht sie doch mit einer modernen Einsicht, nämlich, daß essentielle Informationen des quantenmechanischen Systems immer von den Zustandsvektoren | z i ∈ Z getragen werden und Wellenfunktionen wie Z(x) ≡ hx | z i oder Z(p) ≡ hp | z i lediglich wegen ihres anschaulichen Charakters Einzug finden. Mathematisch könnten wir an dieser Stelle entgegnen, daß Wellenfunktionen wenigstens in einem Hilbert–Raum liegen, aber das ist nur auf der formalen Ebene von einer gewissen strukturellen Relevanz. Mit Dirac fordern wir die Existenz von Eigenzuständen {|pi}p∈M(Op ) zu Op : Op |pi = p|pi , (83) auch wenn diese nicht normierbar sind, wichtig zur Naturbeschreibung ist ja vielmehr Z Z 3 Op | z i = d3 x |xihx|Op | z i R3 Z = d3 x |xi (Op Z) (x) , (84) R3 woraus folgt, daß hx|Op | z i = Op Z(x). Insbesondere erhalten wir daraus die nützliche Beziehung hx|Op |pi = Op hx|pi. Die Eigenwertgleichung (83) lautet dann ausgedrückt durch Wellenfunktionen: Op hx|pi = phx|pi. Ein Vergleich mit (82) liefert: hx|pi = N exp (ihx, pi/~) . (85) 3 = |N | (2π~) δ (3) (p − p0 ) . (86) ! Wir wählen in Einklang p mit hp|p0 i = δ (3) (p − p0 ) die Kon+ stante als R 3 N = 1/ (2π~)3 . Es ist zwar fast schon offensichtlich, aber trotzdem instruktiv: Den Zusammenhang zwischen den Wellenfunktionen Z(x) und Z(p) erhalten wir ganz zwanglos: Z Z(x) ≡ hx | z i = d3 p hx|pihp | z i R3 d3 p Z = R3 p (2π~)3 Z Z(p) ≡ hp | z i = exp (ihx, pi/~)Z(p) , d3 x hp|xihx | z i R3 d3 x Z = R3 p (2π~)3 exp (−ihx, pi/~)Z(x) , (87) was noch einmal die Praktikabilität von Diracs Notation eindrucksvoll unterstreicht, insbesondere, wenn wir uns auch noch zu einer Verallgemeinerung der Einsteinschen Summenkonvention durchringen könnten. Dann wären die Fourier–Transformationen kurz und bündig wie folgt notiert: Z(x) ≡ hx | z i = hx|pihp | z i und Z(p) ≡ hp | z i = hp|xihx | z i, wobei |pihp| = id und |xihx| = id benutzt wurde in dieser Schreibweise. Sie verlangt eine gewisse Erfahrung, denn zum Beispiel ist (Op Z)(x) ≡ hx|Op | z i = hx|Op |pihp | z i = phx|pihp | z i 6= phx | z i = pZ(x) wenn | z i kein Eigenzustand von Op ist. C. Verträglichkeit Die sich aufdrängende Frage ist nun, ob sich ein Analogon zum Phasenraum der Klassischen Mechanik finden läßt. Dies setzt voraus, daß Ort und Impuls an einem quantenmechanischen System im Zustand | z i ∈ Z quasi simultan gemessen werden können, d.h., daß Orts– und Impulsmessung sich nicht beeinflussen dürfen. Dies können wir sofort überprüfen: Bezeichne Oq = {Oq1 , Oq2 , Oq3 }, wobei q a ≡ hea , qi , a ∈ {1, 2, 3}, und Op = {Op1 , Op2 , Op3 }, mit pb ≡ heb , pi , b ∈ {1, 2, 3}, usw. Dann ist [Oqa , Opb ] | z i = (Oqa ◦ Opb − Opb ◦ Oqa ) | z i , Oqa ◦ Opb | z i = xa pb |xihx|pihp | z i , Opb ◦ Oqa | z i = −i~δba | z i + pb xa |pihp|xihx | z i (88) . 35 Nun benutzen wir, daß M(Oq ) = M(Op ) und x, p stumme Bezeichner sind. Daher können wir im letzten Term von (88) folgende Identität benutzen: pb xa |pihp|xihx | z i = xa pb |xihx|pihp | z i. Als wichtiges Resultat erhalten wir: [Oqa , Opb ] = i~ δba , Z dx |Z(x)|2 xa . hz|Oqa | z i = (90) R Ein Maß für die Ungenauigkeit, mit der q a im Zustand | z i festgelegt ist, gibt die sogenannte Varianz D 2 E z Oqa − qza z Z 2 = dx Oqa − qza Z(x) , df Varz (q a ) = (91) R beziehungsweise die Streuung df Streuz (q a ) = q Varz (q a ) . (92) Für die Impulskoordinate pb gilt entsprechendes. Offenbar gibt es Zustände, für die die Ortskoordinate bzw. die Impulskoordinate beliebig genau lokalisiert sind, d.h. die Streuung der Orts– bzw. Impulskoordinate ist beliebig klein. Jedoch ist es prinzipiell unmöglich, sowohl Streuz (q a ) als auch Streuz (pa ) gleichzeitig beliebig klein (scharf) zu machen. Dieses ungeheuerliche Resultat formulieren wir als Satz VI.2 (Unschärferelation von Heisenberg) Für jeden normierten Zustand | z i ∈ D ⊂ Z gilt: Streuz (q a ) · Streuz (pa ) ≥ ~/2 . Streuz (q a ) · Streuz (pa ) = Schwarz = Oqa − qza | z i k(Opa − pza ) | z ik = D E ≥ z Oqa − qza (Opa − pza ) z E D ≥ Im z Oqa − qza (Opa − pza ) z E D = z Oqa − qza (Opa − pza ) z + D E − z (Opa − pza ) Oqa − qza z /2 D E = z Oqa − qza , Opa − pza z /2 E (89) D = z [Oqa , Opa ] z /2 = (89) für alle möglichen Zustände eines beliebigen quantenmechanischen Systems. Also sind Orts– und Impulsmessung in der Quantenmechanik nicht miteinander verträglich. Folglich macht es keinen Sinn, daß ein Zustand als Speicher gleichzeitg Orts– und Impulsinformation tragen kann. Im Vergleich zur Klassischen Mechanik erlaubt die Quantenmechanik nur Zustände, aus denen eben nicht die gesamte denkbare Observablen–Information gleichzeitig ausgelesen werden kann. Dies führt zum Konzept der maximal möglichen (< gesamten) Information, die ein quantenmechanischer Zustand quasi als Speicher tragen kann. Wir können unser Erstaunen über die prinzipielle Unverträglichkeit von Orts– und Impulsmessung weiter quantifizieren: Der Erwartungswert der Koordinate q a , a ∈ {1, 2, 3} im Zustand | z i ∈ Z ist df qza = schen Ungleichung: (93) Beweis VI.1 Zunächst einmal gilt mit der Schwarz- = ~/2 (94) Damit ist die Unschärferelation bewiesen. ∗–< [{; 0) Die Unschärferelation von Heisenberg ist eine direkte Folge der Unverträglichkeit von Orts– und Impulsmessung, die von prinizpieller Natur ist und nicht eine praktische Schranke darstellt. Sie besagt salopp gesschrieben, daß wir an einem quantenmechanischen System selbst mit idealen Meßapparaturen niemals Ort und Impuls gleichzeitig beliebig scharf messen können. Und mehr noch: Legen wir Wert auf mehr Schärfe bei der Ortsmessung, so führt das aus fundamentalen Gründen zwingend zu mehr Unschärfe bei der Impulsmessung. Eine solche fundamentale Unschärfe existiert im Gütligkeitsbereich der Klassischen Mechanik nicht. Sie widerspricht sogar ganz entschieden ihrer Zustandsbeschreibung. Damit sind wir gezwungen, die Suche nach einem direkten Analogon zum Phasenraum der Klassischen Mechanik nach Hamilton zu verwerfen. Im übrigen läßt sich die Unschärferelation wesentlich verallgemeinern: Satz VI.3 (Verallgemeinerte Unschärferelation) Seien OA , OB Observablen. Dann gilt für alle Zustände | z i ∈ D(OA OB ) ∩ D(OB OA ) ⊂ Z, D E Streuz (A) · Streuz (B) ≥ z [OA , OB ] z /2 . (95) Beweis VI.2 Wie Beweis VI.1, da dort lediglich die Selbstadjungiertheit von Oq , Op ausgenutzt und keine speziellen Eigenschaften dieser Observablen benutzt wurden. ∗–< [{; 0) D. Energie als quantenmechanische Observable Ein mechanisches System ist in der Formulierung nach Hamilton charakterisiert durch das Paar (P, H), wobei P den Impuls–Phasenraum bezeichne und H die Hamilton–Funktion. Unsere bisherigen Überlegungen haben sich daran orientiert, das Konzept des Phasenraumes 36 in die Quantenmechanik zu übertragen. Wir waren semi– erfolgreich, da uns diese Überlegungen zwar zu Orts– und Impulsobservablen geführt haben, diese allerdings nicht beide gleichzeitig beliebig scharf gemessen werden können. Mit der Energiefunktion H haben wir uns noch nicht beschäftigt und das holen wir nun an dieser Stelle nach. Dazu bedarf es einer Erinnerung: Auch die Energie eines Systems ist in der Klassischen Mechanik eine Bewegungskonstante, allerdings ist der Zusammenhang zu einer Symmetrie etwas komplizierter zu verstehen, weil ihre Erhaltung eine Konsequenz der Invarianz unter Zeittranslationen ist, und Zeit eine Sonderrolle in der Klassischen Mechanik spielt, was der Ignoranz gegenüver der Speziellen Relativitätstheorie geschuldet ist. Zum einen nämlich ist Zeit eine Komponente der Galilei–Raumzeit, andererseits wird sie als Paramer benutzt, der die Dynamik in P schlicht parametrisiert. Um den Zusammenhang zwischen Energieerhaltung und Symmetrie bei Zeittranslationen aufzuzeigen, ist es notwendig, die Doppelrolle der Zeit als Komponente der Galilei–Raumzeit einerseits und als dynamischer Parameter andererseits in zwei getrennte Konzepte zu zerlegen. Das geht schnell so: Wir betrachten ein Lagrange– System mit einem Konfigurationsraum Q ⊂ Rn und einer Lagrange–Funktion L : Q × Rn −→ R. Wir erweitern Q zum neuen Konfigurationsraum Q0 := Q × R mit Koordinaten (q, τ ). Der erweiterte Geschwindigkeitsphasenraum ist dann Q0 × Rn+1 mit den Koordinaten (q, τ, v, ν). Die Parameter–Zeit bezeichnen wir mit t, nicht zu verwechseln mit der physikalischen Zeit τ = f (t). Also ist ν = dτ /dt. Was ist nun der Zusammenhange zwischen der neuen (erweiterten) und der alten Lagrange–Funktion? Diese Frage muß mit besonderem Bedacht angegangen werden: Das ist der Fall, weil in der ursprünglichen Wirkung L ja über die Parameter–Zeit integriert wird. Es gilt L0 (q, v, ν)dτ = L(q, v/ν)νdt. Wählen wir ν(t) = 1, so liefern die Euler–Lagrange–Gleichungen für die erweiterte Lagrange–Funktion die gleichen Bewegungsgleichungen wie für die ursprüngliche Lagrange–Funktion. Die Schar von Zeittranslationen {Ts }s∈R mit Ts : Q0 −→ Q0 , definiert durch Ts (q, τ ) := (q, τ + sb) , b ∈ R erfüllt offenbar L0 (Ts (q, τ ), DTs (v, ν)) = L0 (q, v, ν) wegen DTs = T0 = id, so daß sich nach dem Satz von Noether über X(q, τ ) = d(q, τ +sb)/ds = (0, b) als Erhaltungsgröße IX (q, v) = h∂L0 /∂v, oi + (∂L0 /∂ν)(q, v, 1)b = −bE ergibt. Der Name Energie ist gerechtfertigt, da für natürliche Systeme E = T + U . Soweit die Wiederholung aus der elementaren Mechanik. Alternativ: Sei B(q, τ, v) eine Observable im erweiterten Geschwindigkeitsphasenraum. Wir vergleichen B(q, τ + δ, v) , δ ∈ R mit B(q, τ, v). Ohne große Bedenken gilt formal B(q, τ + δ, v) = (1 + δ∂τ + . . . )B(q, τ, v). Operationell führen wir daher in die Klassische Mechanik einen Zeittranslationsoperator folgendermaßen ein: Tδ : O(P 0 ) −→ O(P 0 ), definiert durch df (Tδ (B)) (q, τ, v) = B(q, τ + δ, v) = exp (δ∂τ )B(q, τ, v) . (96) Natürlich ist ∂τ der Generator für Zeittranslationen. Die Fourier–konjugierte Variable zur physikalischen Zeit τ hat die Maßeinheit einer Frequenz f . Durch ähnliche Überlegungen wie bei der Konstruktion der Impulsobservablen kann diese Frequenz mittel E = ~2πf ≡ ~ω zu einer Energie E transformiert werden. Aus stilistischen Gründen bezeichnen wir die Energie–Funktion mit H(q, p) (Hamilton–Funktion). Also ist der Generator für Zeittranslationen im Frequenzraum gerade die Hamilton– Funktion. Die Übertragung in die Quantenmechanik ist nicht so direkt, auch wenn sie trotzdem mittels unitärer Darstellungstheorie geschieht, da die Zeit auch in der Quantenmechanik eine Sonderrolle spielt. Tatsächlich ist die Bühne für die Quantenmechanik auch die Galilei– Raumzeit. Vorab die Situation: Eine zweckmäßige Vorstellung ist die, daß die Zeit mit einer Uhr gemessen wird, die Teil eines klassischen Labors ist, aber niemals aus einem quantenmechanischen Zustand extrahiert werden kann. Mit anderen Worten, die Zeit bleibt eine externe Größe. Nun könnten Sie mit Fug und Recht einwenden, daß dies doch eigentlich auch für den Ort so sein sollte, zumindestens sollten doch Ort und Zeit eigentlich über Maßstab und Uhr beides Größen sein, die externen Charakter haben, weil sie eher unsere Laborausstattung (Koordinatensystem, etc) reflektieren, als eine intrinsische Eigenschaft eines Systems. Und Sie haben damit vollkommen recht, sobald wir gezwungen sind, der spezielle Relativitätstheorie Rechnung zu tragen, wird dies auch so sein: dann werden weder Ort noch Zeit Eigenschaften sein, die ein Zustand intrinsisch trägt. Vielmehr wird der Zustand vermessen in einem Laborsystem, daß mit einem Koordinatensystem und einer Uhr daherkommt. Dass wir hier gegen Ihre Erwartung verstoßen liegt nur daran, daß bereits in der klassischen Mechanik der Ort (Konfigurationsraum, Phasenraum) eine ganz andere Rolle spielt als die Zeit (Parameter). Die Zeit ist bereits in der Klassischen Mechanik keine Meßgröße. Wie gehen wir also vor? Zunächst einmal beschaffen wir uns eine unitäre Darstellung der Zeittranslation, die wir mit U (t − t0 ) , t ∈ [t0 , ∞) ⊂ R bezeichnen, und eine Zeittranslation von t0 nach t beschreiben soll. Wir setzen Z 3| z i(t) := U (t − t0 ) | z i, wobei wir | z i den Zeitpunkt t0 zuordnen, also hierfür auch | z i(t0 ) schreiben könnten. Dies setzt voraus, daß U (0) = id, was offenbar sinnvoll ist. Für die Wellenfunktion im Ortsraum schreiben wir Z(t, x) := hx|U (t − t0 ) | z i(t0 ), auch wenn das die offenkundige Ungleichbehandlung von Zeit und Ort notationstechnisch verwässert. Ähnliche Überlegungen wie zur Impulsobservablen zeigen, daß i~∂t ein selbstadjungierter Operator ist und U (t − t0 ) = exp (−i(t − t0 )(i~∂t )/~) die gesuchte unitäre Darstellung für Zeittranslationen über das Zeitintervall t − t0 . Eine ensprechende Analyse im Fourier–Raum legt nahe, i~∂t mit dem Hamilton–Operator OH zu identifizieren. Für diesen suchen wir noch einen Ausdruck in Abhängigkeit von Orts– und Impulsobservablen, was ja 37 die Analogie zur Klassischen Mechanik darlegt, in der die Hamilton–Funktion ja im Impulsphasenraum definiert ist. Der Frage ob OH = H(Oq , Op ) sinnvoll ist, gehen wir im Abschnitt Kanonische Quantisierung nach. Im Moment haben wir folgende Beziehung zwischen Operatoren: i~∂t = OH , also gilt für alle | z i ∈ Z, i~∂t | z i(t) = OH | z i(t) . (97) Gleichung (97) heißt Schrödinger–Gleichung. Sie ist die grundlegende Prozessgleichung der Quantenmechanik und beschreibt die (externe) Zeitentwicklung eines quantenmechanischen Zustandes relativ zu einer externen Uhr, die als klassische Komponente des Labors vorausgesetzt wird. Im modernen Zugang, also nicht über die Wellenmechanik, ist die Schrödinger–Gleichung eine direkte Konsequenz der unitären Darstellungstheorie von Zeittranslationen auf komplexen Zustandsräumen Z, wenn als Isometriegruppe der Raumzeit die Galilei– Gruppe angenommen wird. Wir nehmen in dieser Vorlesung an, daß OH nicht explizit von der Zeit abhängt. Dann kann die Schrödinger– Gleichung bequem integriert werden und wir erhalten als formale Lösung der Schrödinger Gleichung mit Anfangsbedingung | z i(t)|t=t0 =| z i(t0 ): | z i(t) = exp (−i(t − t0 )OH /~) | z i(t0 ) . (98) Dies war so bequem möglich, weil im Falle, daß OH explizit zeitunabhängig ist, [OH , OH ] = 0 ∀t ∈ R. Im allgemeinen ist OH explizit zeitabhängig und [OH (t1 ), OH (t2 )] 6= 0 , t1 , t2 ∈ R. Dann ist immer noch eine formale Lösung der Schrödinger–Gleichung möglich, und zwar in Form der sogenannten Dyson–Reihe. Da zumindestens OH = f (Oq , Op ) gilt, ist es nicht möglich, direkt Energie–Eigenzustände zu konstruieren, denn Oq , Op vertragen sich ja nicht. Außerdem setzt die Operatorbeziehung i~∂t = OH ja die Energie– Observablen gleich der Zeittranslation relativ zu einer externen Uhr, die nicht von den Zuständen | z i ∈ Z getragen wird und auch keine intrinsische Eigenschaft dieser Zustände mißt. Es läßt sich aber folgendermaßen eine indirekte Konstruktion bewerkstelligen: Sei OA eine Observable mit [OA , OH ] = 0, also eine zu OH verträgliche Observable, mit OA |ai = a|ai , a ∈ M(OA ). Dann ist offenbar OH |ai = E(a)|ai , E(a) ∈ M(OH ) ∀a ∈ M(OA ), d.h. die möglichen Energie–Eigenwerte hängen von den OA –Eigenwerten ab. Für die Zeitevolution eines Zustandes | z i gilt dann | z i(t) ≡ U (t − t0 ) | z i(t0 ) Z X = U (t − t0 ) |aiha | z i(t0 ) a∈M(OA ) = Z X |ai exp (−i(t − t0 )E(a)/~)Z(t0 , a) a∈M(OA ) ≡ Z X Z(t, a)|ai . a∈M(OA ) (99) Hier wird deutlich, daß die Zeitabhängigkeit den Entwicklungskoeffizienten zugeschrieben wird, nicht den Energie–Eigenzuständen. Mit anderen Worten, Zustände entwickeln sich intrinsich gar nicht, lediglich die Wahrscheinlichkeiten, mit denen ein Zustand in einem bestimmten Observablen–Eigenzustand vorliegt. Das ist ein ganz anderes Dynamik–Konzept, als wir es aus der Klassischen Mechanik gewöhnt sind, näher an der Dynamik von Systemen die wir im Rahmen der Statistischen Mechanik behandeln. Einsetzen unseres Resultates (99) in die Schrödinger– Gleichung gibt die Schrödinger–Gleichung für die Wellenfunktion Z(t, a) ≡ ha | z i(t), i~∂t Z(t, a) = OH Z(t, a) . (100) Ein Zustand |ai eines quantenmechanischen Systems heißt stationär, wenn er Eigenzustand von OH ist, d.h. wenn es eine Observable OA gibt mit [OA , OH ] = 0 und OA |ai = a|ai, sagen wir zum Energie–Eigenwert E(a) ∈ M(OH ). Im allgemeinen wird ein solcher Eigenzustand nicht im physikalischen Zustandsraum Z liegen, aber das kümmert uns im Moment nicht, weil wir ja jeden physikalischen Zustand des Systems nach diesen Eigenzuständen entwickeln können. Für diesen Fall liefert die Schrödinger–Gleichung |ai(t) = exp (−i(t − t0 )E(a)/~)|ai(t0 ). Da |ai ein Eigenzustand von OH ist, tritt in der Auswertung der Zeittranslation keine Superposition von Energie– Eigenzuständen auf, was eine wichtige Konsequenz hat: |ai(t) ∼ |ai(t0 ), wobei die Äquivalenzrelation beide Zustände dem selben Strahl zuweist, womit beide exakt die gleiche physikalische Zustandsbeschreibung liefern. E. Nachlese: Unitäre Operatoren & Symmetrien Wir systematisieren ein wenig unsere Erkenntnisse über Symmetrien in der Quantenmechanik und Observablen. Def. VI.4 Ein unitärer Operator ist eine surjektive C– lineare Abbildung U : Z −→ Z, welche das Skalarprodukt in Z invariant läßt, d.h. für alle |φi, |ψi ∈ Z gilt: hφ|U † U |ψi = hφ|ψi. Ein unitärer Operator ist automatisch beschränkt (und deshalb auch stetig), denn es gilt ja kU |ψik2 = hψ|U † U |ψi = hψ|ψi = k|ψik2 wegen der Invarianzeigenschaft, also kU k = sup{kU |ψik : k|ψik = 1} = sup{k|ψik : k|ψik = 1}. Ein unitärer Operator ist außerdem injektiv, denn für |φi, |ψi ∈ Z mit U |φi = U |ψi gilt U (|φi − |ψi) = 0, also k|φi − |ψik = 0, und es folgt |φi = |ψi. Damit ist jeder unitäre Operator U stetig (nicht gezeigt) und bijektiv. Daher ist auch der inverse Operator U −1 als linearer Operator auf ganz Z definiert, und ist auch ein unitärer Operator. Da außerdem für zwei unitäre Operatoren U1 , U2 auch die Komposition U1 ◦ U2 : Z −→ Z unitär ist, bildet die 38 Gesamtheit der unitären Operatoren auf Z eine Gruppe U(Z), die sogenannte unitäre Gruppe. Def. VI.5 Eine 1–Parametergruppe von unitären Operatoren ist eine Schar {Us }s∈R , welche durch die Wirkung Φ : R × Z −→ Z der Gruppe R auf Z gegeben ist, also Us |ψi = Φ(s, |ψi) für (s, |ψi) ∈ R × Z, mit den folgenden Eigenschaften: (1) Us ∈ U(Z) ∀s ∈ R. (2) s −→ Us |ψi , s ∈ R, ist stetig ∀|ψi ∈ Z. Insbesondere folgt aus der Eigenschaft von Φ als Wirkung, daß für alle s, t ∈ R stets Us ◦Ut = Us+t gilt. In moderner Terminologie ist die Abbildung s −→ Us , s ∈ R, von R nach U(Z) eine unitäre Darstellung der additiven Gruppe R der reellen Zahlen. Def. VI.6 Sei {Us }s∈R eine 1–Parametergruppe von unitären Operatoren. Der zugehörige infinitesimale Erzeuger T ist wie folgt definiert: n o df D(T ) = |ψi ∈ Z : ∃ lim (Us − idZ ) |ψi/s s→0 df T |ψi = i lim (Us − idZ ) |ψi/s , |ψi ∈ D(T ) . s→0 Es gilt jetzt der folgende Satz VI.4 von Stone 1. Der infinitesimale Erzeuger einer 1–Parametergruppe von unitären Transformationen ist selbstadjungiert. 2. Zu jedem selbstadjungierten Operator T auf Z gibt es eine eindeutig bestimmte 1–Parametergruppe von unitären Operatoren, zu der T der infinitesimale Erzeuger ist. Diese 1–Parametergruppe von unitären Transformationen wird in Abhängigkeit von T mit Us = exp (−isT ) bezeichnet. Damit stehen also Observablen in einer eineindeutigen Korrespondenz zu einer 1–Parametergruppe von unitären Operatoren. Def. VI.7 Sei G eine (Matrix–) Gruppe, Z ein komplexer Hilbert–Raum und U(Z) die unitäre Gruppe von Z. Eine unitäre Darstellung von G in Z ist ein Gruppenhomomorphismus U : G −→ U(Z) , (101) der in folgendem Sinn stetig ist: Für alle konvergenten Folgen (gν ) in G und alle |ψi ∈ Z gilt: Die Folge (U (gν )|ψi) konvergiert bezüglich der Norm in Z und es gilt lim U (gν )|ψi = U (lim gν )|ψi. Die Darstellung heißt treu, wenn U injektiv ist, also wenn G isomorph zur Untergruppe U (G) ⊂ U(Z) ist. Die Qualifikation unitär spielt eine wichtige Rolle, weil sie garantiert, daß die Darstellung auf Z normerhaltend operiert. Für eine unitäre Darstellung U im physikalischen Zustandsraum Z macht die durch U definierte Wirkung Φ : G × Z −→ Z , (g, | z i) −→ U (g) | z i = Φ(g, | z i) die Gruppe G zu einer Symmetriegruppe im Sinne Ihrer Mechanik–Vorlesung. Die Struktur, die erhalten wird, ist die unitäre Struktur des Zustandsraumes Z, die durch das Skalarprodukt oder durch die unitäre Gruppe U(Z) gegeben ist. Zu der in der Mechanik getroffenen Definition kommt hier allerdings noch die Stetigkeitsbedingung hinzu. Der Begriff der unitären Darstellung für Symmetriebetrachtungen bei quantenmechanischen Systemen rückt ins Zentrum des Interesses, weil, wie oben angemerkt, eine unitäre Darstellung das Skalarprodukt und damit die Übergangswahrscheinlichkeit unverändert läßt. Wir nennen eine unitäre Darstellung U : G −→ U(Z) eine Symmetrie des quantenmechanischen Systems (Z, OH ), wenn außerdem noch die Rolle von OH invariant gelassen wird in folgendem Sinne: Jede Lösung der Gleichung i~∂t | z i = OH | z i soll durch U (g) für jedes g ∈ G in eine Lösung überführt werden, das heißt, es soll gelten, i~∂t U (g) | z i = OH U (g) | z i. Wegen i~∂t U (g) | z i = U (g)i~∂t | z i = U (g)OH | z i folgt: [OH , U(g)] | z i = 0. Wir fassen zusammen: Def. VI.8 Eine unitäre Darstellung U der Matrixgruppe G im Zustandsraum Z ist eine Symmetrie des quantenmechanischen Systems (Z, OH ), wenn für alle g ∈ G gilt: [OH , U (g)] = 0. Mit dieser Definition von Symmetrie ist in Analogie zu der Situation in der Klassischen Mechanik ein Erhaltungssatz verbunden. Der selbstadjungierte Operator OX heißt Bewegungskonstante des quantenmechanischen Systems (Z, OH ), wenn [OH , OX ] = 0. Diese Definition ist sinnvoll, wie wir gesehen haben. Wie in der Klassischen Mechanik ist es zweckmäßig, statt direkt mit der Symmetriegruppe G besser mit den zugehörigen ’infinitesimalen Symmetrien’, also den Elementen aus g = Lie G, zu arbeiten. Eine Rechtfertigung für dieses Vorgehen findet sich in der Tatsache, daß eine unitäre Darstellung der Gruppe G in natürlicher Weise eine Darstellung der zugehörigen Lie–Algebra wie folgt induziert. Sei U : G −→ U(Z) eine endlichdimensionale Darstellung unitäre Darstellung (d.h. dim(Z) < ∞) der Matrixgruppe G. Dann ist für X ∈ g durch Us := U (exp (sX)) , s ∈ R, eine 1– Parametergruppe von unitären Transformationen gegeben. Us hat einen infinitesimalen Erzeuger σ(X), wobei df σ(X)|ψi = i lim (Us − idZ ) |ψi/s , |ψi ∈ D(σ(X)) . s→0 Tatsächlich ist σ(X) auf ganz Z definiert als d σ(X) = i Us . ds s=0 (102) Das ist so, weil dim(Z) < ∞ und daher alle unitäre Operatoren durch unitäre Matrizen dargestellt werden 39 können. Es gilt für die Lie–Klammer auf g bzw. End(Z): [σ(X), σ(Y )] = iσ ([X, Y ]) , ∀X, y ∈ g . (103) Das sehen wir schnell ein: Wir setzen ρ(X) := −iσ(X), also ρ(X) = dU (exp (sX))/ds|s=0 und rechnen [ρ(X), ρ(Y )] = ρ([X, Y ]) nach. Somit ist ρ : g −→ End(Z) eine Darstellung von g in Z, welche auch mit Lie U = ρ bezeichnet wird. Der angesprochene Erhaltungssatz lautet jetzt folgendermaßen: Satz VI.5 Sei (Z, OH ) ein quantenmechanisches System mit einer Symmetrie, die durch eine unitäre Darstellung U : G −→ U(Z) gegeben ist. Für jedes Element X ∈ g der Lie–Algebra g von G ist der infinitesimale Erzeuger σ(X) von U (exp (sX)) eine Bewegungskonstante. Beweis VI.3 Das ist klar, denn [OH , σ(X)] = [OH , idUs /ds|s=0 ] = i d[OH , Us ]/ds|s=0 . Nach Voraussetzung gilt aber [OH , Us ] = 0 ∀s ∈ R y [OH , σ(X)] = 0. Also ist σ(X) eine Bewegungskonstante. ∗–< [{; 0) Im Folgenden wollen wir einen kleinen Einblick in die Darstellungstheorie von kompakten Gruppen wagen, um dann ausführlich einen Überblick über die unitären Darstellungen der Drehgruppe SO(3) zu bekommen. Das Ziel ist also das Konzept der Drehung vom Konfigurationsraum der klassischen Mechanik in die komplexen Zustandsräume quantenmechanischer Systeme zu übertragen. Dazu benötigen wir noch folgenden Begriff: Def. VI.9 Sei U : G −→ U(Z) eine unitäre Darstellung. Ein abgeschlossener linearer Unterraum V ⊂ Z heißt invariant, wenn U (g)V ⊂ V ∀g ∈ G. Ist V ein invarianter Unterraum, so ist die Einschränkung U |V : G −→ U(V), definiert durch U |V (g) := U (g)|V : V −→ V , g ∈ G, eine unitäre Darstellung in V, die sogenannte Reduktion von U auf V. Die unitäre Darstellung U heißt irreduzibel, wenn es keine solche Reduktion gibt, das heißt, wenn für jeden invarianten Unterraum bereits gilt: V = Z oder V = ∅. Es erweist sich nun als ungemein vorteilhaft, daß der Darstellungsraum ein Hilbert–Raum ist, der mit einer schönen und nützlichen geometrischen Struktur ausgestattet ist, daß wir zum Beispiel das Folgende leicht einsehen können: Sei U : G −→ U(Z) eine unitäre Darstellung, und V ⊂ Z ein invarianter Unterraum. Dann ist auch das orthogonale Komplement, df V ⊥ = {|ψi ∈ Z : hφ|ψi = 0 ∀|φi ∈ V} , ein invarianter Unterraum zu U . Deshalb zerlegt sich im Falle ∅ 6= V 6= Z die unitäre Darstellung U in die Einschränkungen U |V und UV ⊥ von U aus V und V ⊥ . Es gilt somit: U = U |V ⊕ UV ⊥ in folgendem Sinne: Jedes |χi ∈ Z hat die eindeutige Zerlegung |χi = |χiV ⊕ |χiV ⊥ mit |χiV ∈ V und |χiV ⊥ ∈ V ⊥ . Und für g ∈ G gilt: U (g)|χi = U |V |χiV ⊕ UV ⊥ |χiV ⊥ . Falls nun V und V ⊥ ebenfalls nichttriviale Unterräume enthalten, so läßt sich dieses Zerlegungsverfahren wiederholen. Es gilt der wichtige Satz VI.6 (von Peter und Weyl) Sei G eine kompakte Matrixgruppe. Dann gilt für jede unitäre Darstellung U : G −→ U(Z) in einem Hilbert–Raum Z: (1) Ist U irreduzibel, so ist dim(Z) < ∞. (2) U zerfällt in irreduzible Darstellungen Uj in folgendem Sinne: Es gibt invariante Teilräume Vj ⊂ Z, welche paarweise orthogonal zueinander sind und Z aufspannen:Z = ⊕j Vj , so daß für die Einschränkungen U |Vj gilt U = ⊕j U |Vj . Je nachdem, ob Z endlich– oder unendlichdimensional ist, ist die Summation über eine endliche oder unendliche Indexmenge {j} zu verstehen. Um den Satz von Peter und Weyl auf physikalische Symmetrien mit einer kompakten Symmetriegruppe G anwenden zu können, ist es also sinnvoll, die irreduziblen Darstellungen von G umfassend zu beschreiben. Es erweist sich als zweckmäßig, anstelle der Gruppe G erst einmal die zugehörigen infinitesimalen Symmetrien zu betrachten, wie wir bereits wissen. Am Beispiel der Drehgruppe SO(3) gehen wir so explizit vor, beschaffen uns also zunächst die irreduziblen Darstellungen der Lie–Algebra so(3) ∼ = su(2). Eine Basis von so(3) ist durch die drei Matrizen 0 0 1 0 0 0 M1 = 0 0 −1 , M2 = 0 0 0 , −1 0 0 0 1 0 0 −1 0 (104) M3 = 1 0 0 , 0 0 0 gegeben. Es gilt [Ma , Mb ] = εabc Mc , a, b, c ∈ {1, 2, 3}. Dies ist die definierende Algebra von infinitesimalen Drehungen. Sei Z ein Hilbert–Raum mit dim(Z) < ∞, und ρ : so(3) −→ End(Z) eine Darstellung von so(3) in Z. Wir setzen Ja := iρ(Ma ) , a ∈ {1, 2, 3}. Ja ist dann der Generator für Drehungen um die a–Achse und entspricht der selbstadjungierten Version der a–ten Komponente des Drehimpulses. Wir werden alsbald einsehen, daß dies mehr liefert als nur die kanonische Quantisierung des klassischen Bahndrehimpulses (siehe unten). Da ρ die Lie–Klammern respektiert, gilt [Ja , Jb ] = iεabc Jc . Statt direkt mit dem Satz {Ja }a∈{1,2,3} zu arbeiten, erweist es sich als zweckmäßiger, mit folgenden Operatoren zu arbeiten: J3 , J± := J1 ± iJ2 . Dies ist natürlich nicht evident, insbesondere weil lediglich J3 ein selbstadjungierter Operator ist, während J± offenbar nicht selbstadjungiert sind, sondern zueinander adjungiert: (J+ )† = J− . Andererseits wissen wir, daß die Komponenten Ja , a ∈ {1, 2, 3} sich nicht vertragen, folglich können wir physikalische Zustände ohnehin nur mit 40 einer Drehimpulskomponente charakterisieren. Wir haben uns für J3 entschieden. Die nicht–selbstadjungierten Operatoren J± sind also in diesem Sinne genauso gut wie die verbleibenden Komponenten. Da wir algebraisch vorgehen wollen, notieren wir Also ist M(J3 ) nach oben beschränkt. Wir sehen aber u.a. gleich, daß das Spektrum M(J3 ) auch nach unten beschränkt sein muß, und zwar aus dem gleichen Grund, nämlich der Voraussetzung eines endlichdimensionalen Darstellungsraumes. [J3 , J± ] = ±J± , [J+ , J− ] = 2J3 , J ◦ J = J− J+ + (id + J3 ) ◦ J3 . Lemma VI.3 Sei m ∈ M(J3 ) wie in Lemma VI.2. Dann gilt m ∈ N/2. Wir setzen |m − ki := (J− )k |mi , k ∈ N. Die Menge {|mi, . . . , | − mi} ist eine Basis eines invarianten Untervektorraumes V ⊂ Z. Es gilt mit J 2 = J1 ◦J1 +J2 ◦J2 +J3 ◦J3 , daß J 2 |m−ki = m(m + 1)|m − ki , k ∈ {0, . . . , 2m} ⊂ N. Das bedeutet, daß V Eigenraum zu J 2 zum Eigenwert m(m + 1) ist. (105) Die folgenden drei Aussagen enthalten die wesentlichen Informationen über irreduzible Darstellungen von so(3). Lemma VI.1 Sei |mi ∈ Z (dim(Z < ∞)) mit J3 |mi = m|mi. Dann gilt: J3 (J± |mi) = (m ± 1)J± |mi . (106) Beweis VI.4 Mittels elementarer Rechnung: J3 (J± |mi) (105) = = = (±J± + J± ◦ J3 ) |mi (±J± + J± m) |mi (m ± 1) J± |mi . Beweis VI.6 Zunächst ist m − k ∈ M(J3 ) nach Lemma VI.1, und J− |m − ki = |m − (k + 1)i nach Definition. Außerdem gilt J+ |m − ki = k (2m − (k − 1)) |m − (k − 1)i ,(108) (107) Das war es auch schon. ∗–< [{; 0) Die Interpretation dieses Lemmas liefert uns eine Interpretation für die durch J± gegebenen Operationen, nämlich, J± |mi ist wieder ein Eigenzustand zu J3 , allerdings zu einem um eine Einheit erhöhten/erniedrigten Eigenwert. Mit anderen Worten, mittels J± können wir das Spektrum M(J3 ) von J3 in äquidistanten Abständen nach oben und unten durchlaufen, wobei jede Stufe dieser Leiter selbst wieder durch einen Eigenwert von J3 gekennzeichnet. Das bedeutet natürlich noch nicht, daß wir auf diese Weise wirklich das gesamte Spektrum durchlaufen, aber es rechtfertigt den Begriff Leiteroperator für J± . Außerdem reflektiert sich hier eine gewisse Logik unserer Methodik: da wir vereinbart haben, Zustände mit den möglichen Meßwerte von J3 zu bezeichnen, und J3 sich nicht mit J1 , J2 verträgt, nutzen wir Linearkombinationen von lezteren, um möglichst viel über M(J3 ) aus algebraischen Betrachtungen zu lernen. Zum Beispiel: wie Sie als Übung per Induktion nach k zeigen sollen. Die Folge J− |mi muß wegen dim(Z) < ∞ irgendwann abbrechen. Sei m ∈ N mit |m − mi = 6 0 und J− |m − mi = 0, wobei m := inf{k 0 ∈ N : J3 |m − k 0 i = 0}. Also ist |m − (m + 1)i = 0 y (108) 0 = J+ |m − (m + 1)i = (m + 1)(2m − m)|m − mi . Nach Voraussetzung ist |m − mi = 6 0y 2m − m = 0y2m = m ∈ N. Für O ∈ {J3 , J± } zeigen die aufgestellten Gleichungen, daß O|m − ki , k ∈ {0, . . . , 2m} ⊂ N eine Linearkombination der Basiszustände {|m − ki}k∈{0,...,2m} ist. Also, OV ⊂ V, d.h. V ist invariant. Schließlich ist J 2 = J− ◦J+ +J3 ◦(id+J3 ), woraus nach einer kleinen Rechnung J 2 |m−ki = m(m+1)|m−ki , k ∈ {0, . . . , 2m} ⊂ N folgt. ∗–< [{; 0) Wir fassen unsere Ergebnisse in einer gebräuchlichen Notation folgendermaßen zusammen: Satz VI.7 Es sei ρ : so(3) −→ End(Z) eine endlichdimensionale Lie–Algebra–Darstellung. Sei j ∈ M(J3 ) mit |ji = 6 0 und J+ |ji = 0. Lemma VI.2 Es gibt einen Eigenzustand |mi ∈ Z von J3 mit J+ |mi = 0. (1) Sei zunächst k ∈ N und Z 3 |j − ki := (J− )k |ji , |j + 1i = 0. Dann gilt für m = j − k: Beweis VI.5 Anschaulich ist das klar, da nach Voraussetzung dim(Z) < ∞. Nun ja: Sei |mi ∈ Z , m ∈ M(J3 ) beliebig. Mit (105) folgt: J3 ◦ J+ |mi = (m + 1)J+ |mi, also J+ |mi =: N |m + 1i, wobei N ∈ C und wir wählen N = 1. Wir denken uns über J3 |m + ni = (m + n)|m + ni , n ∈ N induktiv eine Folge von Eigenzuständen erzeugt. Bricht diese Folge irgendwann ab? Da nach Voraussetzung dim(Z) < ∞, existiert ein n0 ∈ N mit J+ |m + n0 i = 0, sonst wäre dim(Z) = ∞ im Widerspruch zur Voraussetzung. Sei nun n = sup{n0 ∈ N : J3 |m + n0 i = 0}. Für den Zustand |m + ni ∈ Z gilt: m + n ∈ M(J3 ) und J+ |m + ni = 0. Wir setzen m := m + n. ∗–< [{; 0) J3 |mi = m|mi , J− |mi = |m − 1i , J+ |mi = [j(j + 1) − m(m + 1)] |m + 1i , |mi = 0 f ür m < j . (109) (110) (111) (2) Es ist 2j ∈ N, und {| − ji, | − j + 1i, . . . , |ji} ist Basis eines invarianten Unterraums V(j) ⊂ Z mit dim(V(j)) = 2j + 1. (3) Für jeden Zustand |mi ∈ V(j) gilt: J 2 |mi = j(j + 1)|mi. Daher gibt es j1 , j2 , . . . , jn , n ∈ N, so daß J 2 auf Z = ⊕na=1 V(ja ) die Darstellung J 2 = ⊕na=1 ja (ja + 1)Pa , wobei Pa : Z −→ Z die orthogonale Projektion auf den Teilraum V(ja ) bezeichnet. 41 (4) Die Einschränkung ρa von ρ auf V(ja ) ist eine irreduzible Darstellung ρa : so(3) −→ End(V(ja )), und ρ zerlegt sich wie folgt: ρ = ⊕na=1 ρa . R ist (k1 B1 + k2 B2 ) ∈ O(P) ∀(q, p) ∈ P, und 2. ist für B1 , B2 ∈ O(P) auch (B1 B2 ) ∈ O(P) ∀(q, p) ∈ P, wobei (B1 B2 )(q, p) := B1 (q, p)B2 (q, p). Wir vereinbaren: Jede endlichdimensionale irreduzible Darstellung ρ von so(3) hat die im Satz VI.7 angegebene Form mit V(j) = Z für n = 1, j = j1 . Für jede Zahl j ≥ 0 mit 2j ∈ N gibt es eine irreduzible Darstellung ρ(j) : so(3) −→ End(Zj ) in einen (2j +1)–dimensionalen C–Vektorraum Zj mit einer Basis {|mi}m∈M(J3 ) und der Wirkung der J3 , J± wie in Satz VI.7. Die Zahl j heißt der Spin der Darstellung. Eine bessere Bezeichnung wäre Drehimpuls, da j sowohl den Bahndrehimpuls der Klassischen Mechanik, als auch einen mit Spin bezeichneten intrinischen Drehimpuls umfaßt. Letzterer besitzt kein Analogon in der Klassischen Mechanik. An dieser Stelle bleibt noch, die unterdrückten Einheiten durch entsprechende Potenzen von ~ wieder zu restaurieren, zum Beispiel: Vereinbarung VII.1 (Quantisierungsvorschrift) Quantisierung respektiert folgende Strukturen: [Ja , Jb ] = iεabc ~Jc . VII. (112) QUANTISIERUNG & KANONISCHE QUANTISIERUNG Die Schrödinger–Gleichung beschreibt die Enwtwicklung eines quantenmechanischen Zustandes | z i während des Zeitintervalls t − t0 ∈ R relativ zu einer externen Uhr wie oben beschrieben als | z i(t) = U (t, t0 ) | z i(t0 ) = exp (−i(t − t0 )OH /~) | z i(t0 ). Dies motiviert die Fragestellung, wie OH als Funktion der elementaren Observablen Oq , Op ausschaut? In diesem Abschnitt stellen wir uns der Frage, wie wir praktisch und konkret von einem gegebenen mechanischen System mit Impulsphasenraum P und Observablenmenge O(P) zum enstsprechenden quantenmechanischen System mit Zustandsraum Z und Observablenmenge O(Z) übergehen. Viele der prominentesten quantenmechanischen Systeme werden so erzeugt. Die Theorie der klassischen Observablen war recht einfach: Jeder klassischen Observablen ist eine Borel–Funktion O(P) 3 B : P −→ R , (q, p) −→ B(q, p) zugeordnet. Wichtige Beispiele (Abschnitt III C) waren die elemenj taren klassischen Observablen Ort BOrt = Pj ◦ Pr1 und Impuls BImp j = Pj ◦ Pr2 , j ∈ {1, 2, 3}. Quantisierung kann nun zunächst etwas salopp als Abbildung Q : O(P) −→ O(Z) betrachtet werden, so daß jeder klassischen Observablen B ∈ O(P) ein selbstadjungierter Operator Q(B) ≡ OB auf dem Zustandsraum Z zugeordnet wird. Diese Betrachtungsweise ist hauptsächlich von struktureller Relevanz, da O(P) selbst gewisse strukturelle Eigenschaften hat, die bei der Quantisierung (möglicherweise) erhalten bleiben, und daher selbst Einsicht in die Quantisierungsvorschrift vermitteln. Da sind zunächst einmal die beiden natürlichen Strukturen, die O(P) trägt, nämlich 1. die üblichen linearen Operationen auf jedem Vektorraum, also für B1 , B2 ∈ O(P) und k1 , k2 ∈ (1) Linearität, d.h. die Abbildung Q : O(P) −→ O(Z), B −→ Q(B) := OB ist linear: Für B1 , B2 ∈ O(P) und k1 , k2 ∈ R ist k1 B1 + k2 B2 −→ k1 OB1 + k2 OB2 . (2) Sei F(R) 3 F : R −→ R eine beliebige Funktion und O(P) 3 B : P −→ R eine klassische Observable. Dies induziert qua Komposition folgendermaßen eine Abbildung H : F(R) × O(P) −→ O(P): (F, B) −→ H(F, B) := F ◦ B, also H(F, B)(q, p) = F (B(q, p)). Bezeichne OB : Z −→ Z die zu B korrepondierende quantenmechanische Observable und {|bi}b∈M(OB ) , so gilt: OF ◦B |bi = F (b)|bi . (113) Für unbeschränkte Observablen liegt {|bi}b∈M(OB ) nicht in Z, jedoch läßt sich die entscheidende Definition in (2) durch eine kleine Rechnung auf beliebige Zustände | z i ∈ Z ausweiten: Z X OF ◦B | z i = F (b)|bihb | z i . (114) b∈M(OB ) Diese Definition ist sinnvoll, zumindestens für alle komplexwertige Polynome R auf R, denn ausgehend von der Spektraldarstellung für OB , Z X OB = b |bihb| , (115) b∈M(OB ) gilt für diese (Funktionalkalkül) Z X R (OB ) = R(b) |bihb| . (116) b∈M(OB ) Leider ist die Quantisierungsvorschrift VII.1 noch nicht ausreichend, schlimmer noch, sie muß um sogenannte Ersetzungsregeln heuristisch ergänzt werden. Das sehen wir schnell an folgendem Beispiel ein: BOrt BImp ist als klassische Observable genauso gut wie BImp BOrt , während diese Aussage aufgrund der Unverträglichkeit von Oq und Op in der Quantenmechanik nicht mehr gelten kann. Die folgende Ersetzungsregel versucht diesem Umstand Rechnung zu tragen: BOrt BImp 7−→ (Oq ◦ Op + Op ◦ Oq )/2. Die Quantisierungsvorschrift VII.1 erlaubt dann eine zügige Verallgemeinerung: Seien B , B 0 ∈ O(P) beliebige klassische Observablen. Es gilt dann folgende Ersetzungsregel: BB 0 7−→ (OB ◦ OB0 + OB0 OB ) /2 . (117) 42 Eine letzte Anmerkung zu diesem Thema: Wir haben hier die Quantisierung von klassisch realisierten Systemen diskutiert, ausgehend von einer Hamilton– Formulierung für das klassische System, insbesondere von einem Impulsphasenraum P. Dieser ist mit einer weiteren Struktur ausgestattet, der sogenannten symplektischen Struktur, die zum Beispiel über die Poisson– Klammer charakterisiert werden kann: {◦, ◦} : O(P) × O(P) −→ O(P). Auch diese Struktur wird von der Quantisierung respektiert, in folgendem Sinne: Vereinbarung VII.2 (Kanonische Quantisierung) Sei (P, H) ein Hamilton–System gegeben durch einen Phasenraum P ∼ = Q × Rn , n ∈ N für eine offene Menge Q ⊂ Rn , oder durch eine symplektische Mannigfaltigkeit P, zusammen mit einer Hamilton–Funktion H. Die geometrische Struktur von P liefert die Poissonklammer, {◦, ◦} : O(P) × O(P) −→ O(P), die O(P) zu einer Lie– Algebra macht. Zu einer kanonischen Quantisierung gehört die Quantisierungsvorschrift VII.1 und eine Auswahl A ⊂ O(P) von klassischen Observablen, die quantisiert werden sollen. Eine kanonische Quantisierung von (P, H, A) ist dann eine Abbildung ρ : A −→ O(Z) mit den folgenden Bedingungen: (1) Für alle B1 , B2 ∈ A mit {B1 , B2 } ∈ A gilt [ρ (B1 ) , ρ (B2 )] = iρ ({B1 , B2 }) . (118) (2) Ist die konstante Funktion idP ∈ A, so ist ρ (idP ) = idZ . (119) (3) Mit Oq := ρ(BOrt ) und Op := ρ(BImp ) liefert (1), [Oqa , Opb ] = iδba , a, b ∈ {1, 2, 3} . (120) Bsp. VII.1 (Der 1–d harmonische Oszillator) Der Phasenraum ist P = R2 . Als Menge der zu quantisierenden Observablen wählen wir A = {q, p, H, idP }, wobei die Hamiltonfunktion durch H = (p2 + m2 ω 2 q 2 )/(2m) gegeben ist. Als Hilbert–Raum wird L2 (R) genommen. Durch ρ(q) := Oq , ρ(p) := Op , ρ(idP ) := idZ und ρ(H) := OH = (Op ◦ Op + m2 ω 2 Oq ◦ Oq )/(2m) ist dann eine kanonische Quantisierung gegeben, wobei OH folgendermaßen definiert ist: Der Definitionsbereich D(OH ) enthält den linearen Unterraum Z df D = ψ ∈ L2 (R) : dq |q|4 |ψ(q)|2 < ∞ , R Z Z 2 ∃∆f ∈ L (R) : dq g∆f = dq (∆g)f , R R ∀g ∈ E(R) : Träger(g) kompakt in R , (121) wobei E(R) die Menge der differenzierbaren Funktionen auf R bezeichne. Die Wirkung von OH auf D ist folgen- dermaßen definiert: Für |ψi ∈ Z , ψ(q) ∈ D ist hq|OH |ψi ≡ OH ψ(q) = −~2 ∆ + m2 ω 2 q 2 ψ(q) . (122) Deibei ist ∆ := ∂ 2 /∂q 2 . Bsp. VII.2 (Der n–d harmonische Oszillator) Verläuft ganz analog zum 1 − −d harmonischen Oszillator, allerdings ist die Buchhaltung aufwendiger. Zunächst ist der Hilbert–Raum L2 (Rn ) , n ∈ N. Wir gehen hier nicht explizit auf die Definitionsbereiche der Operatoren ein, sondern notieren lediglich, daß die Festsetzungen Oqa ψ = q a ψ, OPa ψ = −i~∂ψ/∂q a , a ∈ I := {1, 2, 3} und ! X 1 2 2 2 −~ ∆ + m ω Oqa ◦ Oqa ψ(q) OH ψ(q) = 2m a∈I (123) eine kanonische Quantisierung von A = {q a , pa , H, idP } liefern. Dabei ist ∆ der klassische Laplace–Operator. Bsp. VII.3 (Das freie nicht–relativistische Teilchen) Der Phasenraum ist P ∼ = R3 × R3 , die Hamilton– Funktion H(q, p) = p2 /2m. Die zu quantisierenden Observablen sind A = {q a , pa , H, idP }. Als Hilbert–Raum dient L2 (R3 ). Wie im vorherigen Beispiel wählen wir Oqa , OPa und OH := −~2 ∆/2m. Damit ist die kanonische Quantisierung spezifiziert. Bsp. VII.4 (Kanonische Quantisierung in Algebraischer Manier) Wir diskutieren diese Konstruktion wieder am Beispiel des 1–d harmonischen Oszillators. Unter der Annahme, daß eine kanonische Quantisierung bereits gegeben ist, gelten folgende algebraische Relationen für die Observablen: [Oq , Op ] = i~ , [Oq , OH , ] = i(~/m)Op , [OH , Op ] = i(m2 ω 2 /2)Oq . (124) In der Klassischen Mechanik haben wir den harmonischen Oszillator auch qualitativ untersucht. Da die Energie R+ 3 E = const. eine Bewegunsinvariante ist, gilt H(q(t), p(t)) = E ∀t ∈ R. Dies führt zum Konzept der 2 2 2 Energieniveauflächen, H −1 √(E) = {(q, p ∈ P : m ω q + 2 1 p = 2mE} = Sr mit r = 2mE. Eine übersicht über alle Bahnen zu einer festen Energie E > 0 erhalten wir, indem wir auf H −1 folgende Äquivalenzrelation einführen: Für a, b ∈ H −1 (E) sei a ∼ b, wenn es eine Bahn mit Energie E im Phasenraum P gibt, die a und b miteinander verbindet. Der Quotient BE := H −1 / ∼ ist dann der Bahnenraum zur Energie E und parametrisiert offenbar alle möglichen Bahnen des Systems mit Energie E. In dieser Situation lassen sich die Bahnen mit Hilfe der 43 komplexen Struktur auf R2 besonders einfach beschreiben: Für (q, p) ∈ P schreiben wir z := mωq + ip ∈ C. Auf diese Weise ist R2 mit C identifiziert. Zeigen Sie, daß folgendes gilt: a ∼ b genau dann, wenn es φ ∈ R gibt mit a = exp (iφ)b. In der Mechanik haben wir an dieser Stelle an den komplex–projektiven Raum P0 (C) erinnert, nämlich P0 (C) := S1r / ∼ mit der Äquivalenzrelation a ∼ b, wenn es ein λ ∈ U (1) := {λ ∈ C : |λ| = 1} gibt mit a = λb. Als Resultat erhalten wir so: Der Bahnenraum BE für den (1 − d) harmonischen Oszillator zur Energie E > 0 ist der komplex–projektive Raum P0 (C), und die Quotientenabbildung ϕ : H −1 (E) −→ BE = P0 (C) hat als Fasern ϕ−1 (x) gerade die Bahnen zur Energie E. Salopp gesprochen versucht die algebraische Methode, die Quantisierung auf obiger qualitativer Beschreibung aufzubauen, natürlich im Al√ Einklang mit (124). ∗ 2m~ω =: a und ρ(z ) := so, ρ(z) := (mωO + iO )/ p √ q † (mωOq − iOp )/ 2m~ω =: a auf dem noch zu bestimmenden Hilbert–Raum. Die Operatoren a und a† sind nicht selbstadjungiert. Es gilt OH = (a◦a† −1/2)~ω. Wir bemerken, daß E0 := ~ω die Einheit einer Energie hat. Somit wird OH in Vielfachen von E0 gemessen (relativ zur Grundzustandsenergie). Der Operator On := a ◦ a† ist selbstadjungiert und dimensionslos. Die algebraischen Relationen (124) liefern: a, a† = 1 . (125) Offenbar ist OH = (On − 1/2)E0 , also M(OH ) = M(On ) − 1/2. Wir nsetzen voraus, daß es einen Eigenvektor |ni ∈ Z gibt mit On |ni = n|ni , n ∈ R. Offenbar ist dann OH |ni = (n − 1/2)~ω|ni. Wir definieren |n − 1i := a|ni. Der Bezeichner des neuen Zustandes ist schon sinnvoll, denn mit (125) ist: On |n − 1i = On a|ni = a(On − 1)|ni = (n − 1)|n − 1i. Genauso gilt mit der Definition |n + 1i := a† |ni und wegen (125): On |n + 1i = On a† |ni = (1 + On )a† |ni = a† (1 + On )|ni = (1 + n)|n + 1i. Außerdem ist für jedes Z 3 |ψi = 6 0 auch a† |ψi = 6 0, denn ka† |ψik2 = † hψ|On |ψi = hψ|a a|ψi + hψ|ψi = ka|ψik2 + k|ψik2 > 0. Wir setzen |n−ki := (a)k |ni , k ∈ N, wobei (a)k die k– fache Komposition von a mit sich selbst bezeichne. Offenbar ist On |n−ki = (n−k)|n−ki und ka† |n−kik2 = hk − n|On |k−ni = (n−k)hk−n|k−ni = (n−k)k|n−kik2 ∀k ∈ N. Folglich ist (n − k) ≥ 0 oder hn − k|n − ki = 0 ∀k ∈ N. Daher gibt es ein N 3 k : |n − ki = 6 0 und a|n − ki = 0. Für diesen Zustand ist n − k − 1 = 0 y n = k + 1 ∈ N, also n ∈ N. Mit all diesen Informationen können wir nun tatsächlich explizit einen geeigneten Hilbert–Raum mit den Operatoren Oq , Op , OH konstruieren. Sei |zi ein Zustand mit Wellenfunktion Z(n) := hn|zi und P∞ 2 |Z(n)| < ∞. Dann können wir so vorgehen: n=1 Es sei H = `2 der Hilbert–Raum der komplexen, quadratsummierbaren Folgen, `2 := {(Z(n))n∈N : Z(n) ∈ P∞ 2 C, |Z(n)| < ∞} mit dem Skalarprodukt hz|wi := P∞ n=1 Z(n)W (n) und den Einheitsvektoren {en }n∈N = n=1 (0, . . . , 1, . . . , 0), wobei die Eins an der Position n ∈ N der Folge steht. Wir finden a† en = √ n en+1 , √ a en = n − 1 en−1 , n ∈ N/{0} , a e0 = 0 . (126) Und weiter folgt für alle |zi mit: ∀n ∈ N ist Z(n) ∈ `2 : On en = n en y OH en = (n − 1/2)E0 en , hn|OH |zi ≡ OH Z(n) = (n − 1/2)E0 Z(n) . (127) Geeignete Fortsetzungen von Oq , Op , OH sind dann selbstadjungierte Operatoren auf H, also Observablen, die den gewünschen Kommutator–Beziehungen (124) genügen. Der Zusammenhang zu den Zuständen p |ni , n ∈ N/{0} ist schnell hergestellt: en ↔ |ni := |ni/ hn|ni. In der Tat ist dann, a† |ni = N(+) |n + 1i , N(+) ∈ C. Wegen der √ Definition |n + 1i = a† |ni folgt N(+) = n. Genauso √ sehen wir ein, daß a|ni = n − 1|n − 1i. Die algebraische Behandlung des harmonischen Oszillators in der Quantenmechanik heisst auch Besetzungszahldarstellung des harmonischen Oszillators. Der Name stammt von folgender Überlegung: Aufgrund der Wirkung von a und a† liegt es nahe, diese als Vernichtungs– und Erzeugungsoperatoren zu bezeichnen. Was in dieser Sprache etws irreführend vernichtet und erzeugt wird sind Anregungen des Oszillators relativ zu seinem Grundzustand mit der Energie −E0 /2 6= 0. Da diese Anregungen immer in natürlichen Portionen kommen, die wir mit n ∈ M(On ) = N parametrisiert haben, scheint diese Sprache sinvoll zu sein. Allerdings ist es wichtig zu betonen, daß eine solche Anregung mittels Operation von a und a† nicht wirklich vernichtet oder erzeugt werden kann, denn diese Operatoren sind ja nicht selbstadjungiert und folglich kann ihre Wirkung auf einen Zustand keinen physikalischen Prozess beschreiben. Vielmehr erlaubt uns On zu zählen, wieviel Anregunsenergie in Portionen E0 relativ zur Grundzustandsenergie E0 /2 in diesem System steckt. Wir notieren auch, daß der Grundzustand nicht zu einem Teilchen mit verschwindender Energie korrespondiert! Eine analoge Konstruktion funktioniert sogar für ein System von unendlich vielen harmonischen Oszillatoren, was zur üblichen Interpretation der Quantentheorie von Feldern führt. Bemerkenswert an dem 1-d Fall ist einerseits, daß es nicht möglich ist, die so einfach strukturierte Menge A = {q, p, H, idP } von klassischen Observablen auf dem Phasenraum P = R2 unter Vewendung eines endlich–dimensionalen Hilbert–Raumes zu quantisieren. Andererseits ist in der Besetzungszahldarstellung die Konstruktion des wichtigsten Operators, OH , der ja die 44 Dynamik es quantenmechanischen Systems als selbstadjungierter Generator der unitären Darstellung von Zeittranslationen auf dem entsprechenden Hilbert–Raum hervorbringt, von vornherein als in seine Eigenräume zerlegt gegeben. VIII. ELEMENTARE ANWENDUNGEN In diesem Kapitel betrachten wir einfache Systeme, die immer durch ein einzelnes Teilchen in einem von außen vorgegebenen klassischen Potentialfeld gegeben sind, und die wir quantenmechanisch beschreiben wollen. Dazu bedarf es ab und an einer ausführlicheren Vorbereitung, in der wir unsere algebraischen Einsichten um analytische Resultate aufstocken, etwa beim harmonischen Oszillator oder beim quantenmechanischen Drehimpuls. A. Harmonischer Oszillator in einer Dimension Bei der algebraischen Behandlung des harmonischen Oszillators in der Quantenmechanik haben wir uns ausschließlich für kinematische Informationen interessiert, die rein algebraisch abgerufen werden konnten. Die explizite Berechnung von Wellenfunktionen war hierfür nicht erforderlich, beschäftigt uns aber im Folgenden. Eine zentrale Rolle bei der algebraischen Behandlung kam den Erzeugungs– und Vernichtungsoperatoren zu, a† und a, die eine Besetzungszahldarstellung |ni , n ∈ M(On := aa† ) des Oszillators erlaubten. Gewissermaßen interessieren wir uns für die Anzahl der elementaren Anregungen im Oszillator relativ zum nicht–trivialen Grundzustand, wobei jede Anregung die gleiche Energie E0 = ~ω trägt. Die Gesamtenergie des harmonischen Oszillators ergibt sich wegen der Additivität der Energie einfach aus der Anzahl der Anregungen mit Energie E0 zuzüglich der Grundzustandsenergie E0 /2. Die Besetzungszahldarstellung ist salopp geschrieben ein Anregungsportrait des Oszillators. Um ein wenig gelenkiger mit den algebraischen Relationen zu werden, nutzen wir sogleich die zentrale Relation [a, a† ] = 1 und redefinieren damit den Besetzungszahl– Operator On . Es gilt ja: On = 1 + a† a. Dies zeigt, daß auch N := a† a als Besetzungszahl–Operator fungieren darf. Damit gilt OH = (N + 1/2)E0 . Beim Übergang von On nach N wird also lediglich die Grundzustandsenergie verschoben, und zwar wird sie um E0 erhöht. Mathematisch haben wir hier sicher alles richtig gemacht, aber verzerrt diese Energieverschiebung nicht unser physikalisches Verständnis? Dies wäre sicherlich der Fall, wenn die Energiemessung absolut wäre. Ist sie aber nicht, wir messen in der Physik immer relative Energien, also Energiedifferenzen! Die algebraischen nützlichen Relationen sind jetzt: a, a† = 1 , [N, a] = −a , N, a† = a† . (128) Mit der Wahl von ON als Besetzungszahl ändert sich auch die Normierung der entsprechenden Zustände. Wir finden: √ a|0i = 0 , a|ni = n|n − 1i , N 3 n ≥ 1 , (129) √ a† |ni = n + 1|n + 1i , (130) was konsistent mit (126) ist, wenn wir bedenken, daß jetzt n ∈ M(N ) ist. Wir wollen nun die Energie–Eigenfunktionen im Ortsraum berechnen. Wie gehen wir geschickt vor? Geleitet von unseren algebraischen Einsichten fragen wir zunächst nach der Wellenfunktion des Grundzustandes |0i. Dieser war definiert als der Besetzungszahl–Zustand für den a|0i = 0 gilt, also von dem aus der Oszillator nicht weiter abgeregt werden kann. Um eine Differentialgleichung für die Grundzustandswellenfunktion zu erhalten, bietet es sich nun an, diese Definition in den Ortsraum zu bringen. Sei x ∈ M(Oq ). Dann gilt hx|a|0i = x + x02 ∂x hx|0i = 0 , (131) p wobei wir x0 := ~/mω eingeführt haben. Bemerken Sie, daß [x0 ] = L, also setzt x0 eine durch die Kreisfrequenz und die Masse des Oszillators gegebene charakteristische Längenskala. Die Gleichung (131) ist rasch gelöst, Z0 (x) := hx|a|0i ∝ exp [−(x/x0 )2 /2]. Mit der korrekten Normierung finden wir explizit: " 2 # 1 1 x Z0 (x) = p√ exp − . (132) 2 x0 πx0 Die Grundzustandswellenfunktion Z0 (x) ist modulo einer multiplikativen Konstante die eindeutige Lösung von (131), es liegt also keine Entartung des Grundzustandes vor. Im Gegensatz zur klassischen Mechanik ist die Energie des Grundzustandes von Null verschieden und der Oszillator braucht sich nicht an der Stelle des Potentialminimums befinden, was durch die endliche räumliche Ausdehnung der zugehörgen Wellenfunktion Z0 (x) zum Ausdruck gibt, die ja wiederum durch x0 charakterisiert ist. Es ist instruktiv, sich die Erwartungswerte für die kinetische und potentielle Energie des harmonischen Oszillators im Grundzustand zu beschaffen. Wir benötigen also E(Op p ◦ Op , |0i) und E(Oq ◦ Oq , |0i). Zunächst einmal ist Op = i mE0 /2(a† − a) und daher 0 Op ◦ Op = − mE a† ◦ a† + a ◦ a − a† ◦ a − a ◦ a† . 2 Wenn wir den Erwartungswert von Op ◦ Op bezüglich des Grundzustandes bilden, dann tragen nur die letzten beiden Summanden bei. Daher finden wir E(Op ◦ Op , |0i) = mE0 /2. Genauso finden wir, daß E(Oq ◦ Oq , |0i) = x02 /2 ist. Der Erwartungswert der kinetischen Energie OT := Op ◦ Op /2m im Grundzustand des harmonischen Oszillators ist somit E(OT , |0i) = E0 /4. Im Grundzu- 45 stand erwarten wir außerdem für die potentielle Energie OV := mω 2 Oq ◦ Oq /2 des harmonischen Oszillators ebenfalls E(OV , |0i) = E0 /4. Mit anderen Worten: E(OT , |0i) = E(OV , |0i) = E(OH , |0i)/2. Weiterhin ist E(Op , |0i) = 0 und E(OV , |0i) = 0. Folglich gilt: Streu|0i (q) · Streu|0i (p) = ~/2 . (133) Damit ist die Unschärferelation zwischen dem quantenmechanischen Ort und Impuls im Grundzustand des harmonischen Oszillators saturiert, das heißt, der minimal mögliche Wert für die Unschärfe wird angenommen. Für beliebige Anregungszustände des harmonischen Oszillators finden folgenden konstruktiven Ausdruck zur Berechnung der zugehörigen Wellenfunktionen im Orts√ raum: Es sei Nn := 1/ 2n n!. Dann gilt n Zn (x) ≡ hx|ni = Nn x−n x − x02 ∂x Z0 (x) .(134) 0 Für diese Wellenfunktionen des angeregten harmonischen Oszillators ist die prinzipielle Unschärfe in Ort und Impuls größer als im Grundzustand. Es ist Streu|0i (q) · Streu|0i (p) = (n + 1/2)~ . (135) Die Energie–Eigenzustände des harmonischen Oszillators sind natürlich stationär. Folglich oszillieren auch nicht die Erwartungswerte E(q, |ni) , E(p, |ni), sie verschwinden sogar unbhängig vom Anregungszustand. Wir können aber umgekehrt fragen, ob es Linearkombinationen von Energie–Eigenzuständen gibt, die den klassischen harmonischen Oszillator möglichst treu imitieren? Die Antwort hierauf ist ja und führt auf das Konzept der kohärenten Zustände, welches leider jenseits dieser Einführung liegt. B. Bahndrehimpuls und Kugelflächenfunktionen Kanonische Quantisierung der kinetischen Energie eines Teilchens liefert nach Beispiel VII.3 den selbstadjungierten Operator T := Op ◦ Op /2m = −~2 ∆/2m auf dem Hilbert–Raum L2 (Rd ). Der Laplace–Operator ∆ kann folgendermaßen zerlegt werden: ∆ = ∆r + ∆Ω /r2 , df ∆r = ∆Ω d−1 ∂ ∂2 + , 2 ∂r r ∂r 2 d 1 X ∂ ∂ = xj k − xk j , 2 ∂x ∂x j,k=1 2 X ∂ ∂ = xj k − xk j . ∂x ∂x df r unabhängiger Differentialausdruck ist, und insbesondere in Kugelkoordinaten lediglich vom Azimuth– und Polarwinkel abhängt. Dabei sind die Richtungsableitungen ∇ab ≡ xab · ∇ , a, b ∈ {1, . . . , d}, wobei die Vektoren xab := (0, . . . , 0, −xb , 0, . . . , xa , 0 . . . , 0) , (xab )a = −xb , (xjk )b = xa , a, b ∈ {1, . . . , d}, bis auf den Faktor −i~ gerade die Komponenten des Bahndrehimpulses, üblicherweise folgendermaßen bezeichnet: La = −i~∇bc . Tatsächlich gilt [La , Lb ] = iεabc ~Lc . Der Vektor xab beschreibt eine Tangente an die Kugel K(0, |x|) mit Mittelpunkt 0 und Radius |x| im Punkt x, die parallel zur (xa , xb )–Ebene verläuft. ∆Ω ist also gewissermaßen ein Differentialausdruck auf der Sphäre, den wir insbesondere auch auf der Einheitssphäre S d−1 := {y ∈ Rd : |y| = 1} ⊂ Rd untersuchen können. Für f ∈ C 2 (S d−1 ) können wir den sogenannten Laplace–Beltrami –Differentialausdruck Bf folgendermaßen erklären: (Bf )(ω) := ∆Ω f (x/|x|)|x=ω , ω ∈ S d−1 . Mit anderen Worten, wir setzen erst f radial konstant fort, wenden dann den Differentialausdruck ∆Ω an, und schränken anschließend wieder auf S d−1 ein. Damit ist auch klar, warum Kugelflächenfunktionen eine wichtige Rolle spielen — wie wir weiter unten sehen werden, bilden sie eine ONB von Eigenfunktionen zu B, denn Kugelflächenfunktionen erhalten wir durch Einschränkung harmonischer Polynome in Rd auf die Einheitssphäre S d−1 . Zur Notation: Ein Multi–Index der Dimension d ∈ N ist ein d–Tupel α = (α1 , . . . , αd ) ∈ Nd . Für einen Multiindex α definieren wir: |α| := a=1 (136) Hierbei bezeichnet r den euklidischen Abstand vom Koordinatenursprung, und Ω soll an den Raumwinkel erinnern. Letztere Bezeichnung ist sinnvoll, weil ∆Ω ein von αa , α x := d Y (xa )αa , x ∈ Rd . (137) a=1 Für ein beliebiges Polynom P vom Grad k ∈ N in d Variablen schreiben wir also X P(x) = cα x α . (138) |α|≤k Es genügt hier homogene harmonische Polynome zu betrachten: Lemma VIII.1 Sei P ein harmonisches Polynom vom Grad k in d Variablen. Dann läßt sich P in der Form Pk P = q=0 Pq schreiben mit homogenen harmonischen Polynomen vom Grad q. P Beweis VIII.1 Wir wählen Pq = |α|≤q cα xα als homogene Polynome vom Grad q. Dann gilt offenbar P(x) = 1≤j<k≤d d X k X q=0 Pq (x) , und 0 = ∆P(x) = k X ∆Pq (x) . q=0 Für jedes q ∈ {0, . . . , k} ist ∆Pq (x) entweder ein homogenes Polynom vom Grad q − 2, oder ∆Pq = 0, wobei letzteres insbesondere für q < 2 gilt. Also muß auch ∆Pq = 0 , ∀q ∈ {1, . . . , k} gelten. ∗–< [{; 0) 46 Für niedrige Grade können die harmonischen Polynome explizit angegeben werden: Jedes Polynom von Grad 0 und 1 ist harmonisch. Linear unabhängige Systeme harmonischer Polynome sind zum Beispiel: P0 (x) = 1(1 Funktion),P1 (x) = xa , a ∈ {1, . . . , m}(m Funktionen), P2 (x) = xa xb , 1 ≤ a < b ≤ d und (x1 )2 − (xj )2 , j ∈ {2, . . . , d}. Für diesen Grad haben wir 0 Funktionen für d = 1, 2 Funktionen für d = 2, 5 Funktionen für d = 3, und allgemein: (d+2)(d−1)/2–Funktionen. Weiter unten zeigen wir, daß dies jeweils maximal linear unabhängige Systeme sind. Eine Funktion F : S d−1 −→ C heißt eine Kugelflächenfunktion vom Grad k ∈ N, wenn es ein homogenes harmonisches Polynom P vom Grad k gibt mit k F (ω) = P(ω) = P(rω)/r ∀ω ∈ S d−1 . (139) Es ist faszinierend, daß diese spärlichen Informationen bereits ausreichen um zu zeigen, daß die Kugelflächenfunktionen in L2 (S d−1 ) total sind: Satz VIII.1 (Approximationssatz) Zu jeder stetigen Funktion f : S d−1 −→ C und zu jedem ε > 0 existiert eine (endliche) Summe F von Kugelflächenfunktionen mit |f (ω) − F (ω)| < ε ∀ω ∈ S d−1 . Insbesondere ist die Menge der Kugelflächenfunktionen total in L2 (S d−1 ). Beweis VIII.2 Der Beweis ist eher technisch und wenig instruktiv für den weiteren Aufbau der Theorie, weshalb wir ihn der Mathematik überlassen. Sie können ihn in jedem guten Werk zur Theorie der Linearen Operatoren in Hilbert–Räumen finden. Grob ist die Idee folgende: Sie überzeigen sich zunächst von der Aussage, daß für jedes homogene (aber nicht notwendig harmonische) Polynom Q vom Grad l ∈ N gilt, X 2k Q(x) = |x| Hl−2k , 0≤k≤l/2 mit homogenen harmonischen Polynomen Hp vom Grad p ∈ N. Im Beweis dieser Aussage steckt die Hauptarbeit. Dann nutzen Sie einen anderen berühmten Approximationssatz — den von Weierstraß — und sind am Ziel. ∗–< [{; 0) Beweis VIII.3 Wir zeigen hier nur (b). Ist Φ eine Kugelflächenfunktion vom Grad 0, so ist Φ konstant, also Eigenfunktion von B zum Eigenwert 0 = 0(0 + d − 2). Sei Φ eine Kugelflächenfunktion vom Grad l ≥ 1, ( |x|l Φ(x/|x|) für x ∈ Rd − {0} , df φ(x) = 0 für x = 0 . Da φ ein harmonisches Polynom vom Grad l ist, gilt für alle ω ∈ S d−1 : 0 = ∆φ(x) |x=ω = ∆ |x|l Φ(x/|x|) |x=ω = ∆r + ∆Ω /r2 |x|l Φ(x/|x|) |x=ω = [l(l − 1) + (d − 1)l] |x|l−2 Φ(x/|x|) |x=ω +|x|l−2 ∆Ω Φ(x/|x|) |x=ω = l(l + d − 2)Φ(ω) + (BΦ) (ω) , also gilt BΦ = −l(l + d − 2)Φ. ∗–< [{; 0) Wir wollen uns nun einen Überblick über die Gesamtheit der Kugelflächenfunktionen verschaffen, d.h. insbesondere, daß wir die Anzahl N (l, d) der linear unabhängigen Kugelflächenfunktionen vom Grad l ∈ N in d ∈ N Variablen auf S d−1 bestimmen. Wir wissen bereits, daß N (0, d) = 1, N (1, d) = d ∀d, und N (l, 1) = 0 ∀l ≥ 2. Sei zunächst A(l, d) die Anzahl linear unabhängiger homogener (nicht notwendig harmonischer) Polynome vom Grad l ∈ N in d ∈ N Variablen. Da jedes homogene Polynom f vom Grad l > 1 ind d > 1 Variablen in der Form f (x1 , . . . , xd ) = Satz VIII.2 Sei B der Laplace–Beltrami– Differentialausdruck auf S d−1 . Dann gilt (a) B ist auf C ∞ (S d−1 ) wesentlich selbstadjungiert. Die selbstadjungierte Vervollständigung nennen wir den Laplace–Beltrami–Operator in L2 (S d−1 ). (b) Jede Kugelfunktion F vom Grad l ist Eigenfunktion von B zum Eigenwert −l(l + d − 2). Insbesondere bilden Kugelfunktionen eine vONB. l X gl−k (x1 , . . . , xd−1 ) (xd )k , k=0 mit homogenen Polynomen gp vom Grad p ∈ N in (d − 1) Variablen geschrieben werden kann, gilt A(l, d) = l X A(k, d − 1) . (141) k=0 Mit Hilfe von A(l, 1) = 1 ∀l ≥ 0 und p X k k=n Die zentrale Bedeutung der Kugelflächenfunktionen für die analytische Theorie des Bahndrehimpulses liegt in folgendem (140) n = p+1 n+1 für p ≥ n , (142) erhalten wir durch vollständige Induktion l+d−1 A(l, d) = für d ≥ 1 , l ≥ 0 . d−1 (143) Um damit N (l, d) zu bestimmen, wollen wir zuerst die allgemeine Form eines homogenen harmonischen Polynoms u von Grad l ∈ N in d ∈ N Variablen ermitteln. Zunächst gilt wieder u(x1 , . . . , xd ) = l X k=0 k al−k (x1 , . . . , xd−1 ) (xd ) ,(144) 47 mit homogenen Polynomen ap vom Grad p ∈ N. Damit ist u genau dann harmonisch, wenn mit ∆0 := ∆ − (∂/∂xd )2 folgendes gilt: 0 = ∆u(x) = l−2 X k ∆0 al−k (x1 , . . . , xd−1 ) (xd ) Für d = 3 hat B in Kugelkoordinaten S 2 3 (x, y, z) = (sin θ cos ϕ, sin θ sin ϕ, cos θ) mit den üblichen Definitionsbereichen die Form 1 ∂2 1 ∂ ∂ Bf (ϕ, θ) = 2 f (ϕ, θ) + s(θ) f (ϕ, θ) , s (θ) ∂ϕ2 s(θ) ∂θ ∂θ k=0 + l X k−2 k(k − 1)al−k (x1 , . . . , xd−1 ) (xd ) , k=2 also (k + 2)(k + 1)al−2−k = −∆0 al−k für k ∈ {0, . . . , l − 2}. Folglich können al und al−1 beliebig (aber homogen) gewählt werden, und dann daraus der Reihe nach al−2−k = − 1 ∆0 al−k , k ∈ {0, . . . , l − 2} (k + 2)(k + 1) berechnen. Mit den so sukzessive bestimmten ap erhalten wir schließlich alle homogenen harmonischen Polynome vom Grad l ∈ N in x1 , . . . , xd und damit alle Kugelflächenfunktionen vom Grad l auf der Einheitskugel S d−1 . Die eben konstruierten homogenen harmonischen Polynome u1 , . . . , un , n ∈ N sind offenbar genau dann linear unabhängig, wenn die entsprechenden Anfangsterme {ak,l (x1 , . . . , xd−1 ) + ak,l−1 (x1 , . . . , xd−1 )xd : k ∈ {1, . . . , n}} linear unabhängig sind. Die Bezeichnungen sind hoffentlich klar. Folglich gilt N (l, d) = (143) = A(l, d − 1) + A(l − 1, d − 1) l+d−2 l+d−3 + d−2 d−2 (2l + d − 2)(l + d − 3)! . l!(d − 2)! = (145) wobei s(θ) := sin θ Es bietet sich offenbar ein Separationsansatz in der Gleichung Bf = −l(l + 1)f an. Etwas vornehmer heißt dies, daß B von den folgenden Teilräumen reduziert wird: df Tk = exp (ikϕ)f (θ) : f ∈ L2 ((0, π)) ,k ∈ Z , die den Hilbert–Raum L2 (S 2 ) ∼ = L2 ((0, 2π) × (0, π)) aufspannen. Die Einschränkung von B auf Tk (k ∈ Z) ist äquivalent zu einer selbstadjungierten Realisierung von 1 τk f (θ) = s(θ) ∂ ∂θ ∂ k2 s(θ) f (θ) − f (θ) ∂θ s(θ) in L2 ((0, π)). Dies ist ein Sturm–Liouville– Differentialausdruck. Wir bezeichnen die selbstadjungierte Realisierung ebenfalls mit τk . Aus der Theorie des Eigenwertproblemes von Sturm–Liouville folgt dann, daß τk nur einfache Eigenwerte besitzt. Wie schaut nun der N (l, 3) = (2l + 1)–dimensionale Teilraum von L2 (S 2 ) der Kugelflächenfunktionen vom Grad l aus? Das ist ja der Eigenraum von B zum Eigenwert −l(l + 1). Da die Teilräume Tk den Operator B reduzieren, besitzt dieser Eigenraum eine Basis der Form Yela (ϕ, θ) = exp (ika ϕ)e pla (θ) , für a ∈ {1, . . . , 2l + 1} , mit der Eigenschaft Wir fassen zusammen: Satz VIII.3 Für die Anzahl N (l, d) von linear unabhängigen Kugelflächenfunktionen vom Grad l auf S d−1 gilt für l ≥ 0 , d ≥ 2 N (l, d) = (2l + d − 2)(l + d − 3)! . l!(d − 2)! (146) Speziell gilt (siehe auch Satz VI.7) N (l, 3) = 2l + 1 . (147) Wir wissen bereits, daß kinematische Aspekte des Bahndrehimpulses rein algebraisch behandelt werden können und insbesondere die explizite Form der Kugelflächenfunktionen hierfür nicht benötigt werden. Allerdings verlangen Fragestellungen, die mit der Dynamik eines quantenmechnischen Systems verknüpft sind, nach einer analytischen Behandlung. Deshalb und weil wir im nächsten Abschnitt das Wasserstoff–Atom diskutieren wollen, beschaffen wir uns noch rasch für den Fall d = 3 die Kugelflächenfunktionen ganz explizit. τka pela (θ) = −l(l + 1)e pla (θ) , für a ∈ {1, . . . , 2l + 1} . Da die τk nur einfache Eigenwerte haben, müssen die ka paarweise verschieden sein. Für ka kommen lediglich die (2l + 1) Werte ka ∈ {−l, −l + 1, . . . , l − 1, l} in Frage, da andernfalls das entsprechende homogene harmonische Polynom yla (x, y, z), dessen Einschränkung auf S 2 gleich Yla ist, als Funktion der ersten beiden Koordinaten (x, y) bereits ein Polynom der Ordnung > l wäre. Also lassen sich die Kugelflächenfunktionen in der folgenden Form darstellen: Für m ∈ {−l, −l + 1, . . . , l − 1, l} ⊂ Z ist Ylm (ϕ, θ) = exp (imϕ)plm (θ) , , τm plm (θ) = −l(l + 1)plm (θ) . Die Funktionen plm (θ) sind die sogenannten assoziierten Legendre–Polynome, plm (θ) = m/2 1 1 − cos θ 2l l! 2 d d cos θ l+m l (cos θ − 1) . 48 C. Zentralpotential & Das Wasserstoff–Atom In diesem Abschnitt behandeln wir die Quantenmechanik eines Teilchens im Zentralpotential V (r) , r ∈ R+ . Die Resultate aus dem vorherigen Abschnitt VIII B über die analytische Theorie des Bahndrehimpulses sind hierfür essentiell. Die Tatsache, daß V (r) invariant unter beliebigen Drehungen um den Ursprung ist, impliziert die Verträglichkeit des Hamilton–Operators 2 ~ H = − 2µ (∆r + ∆Ω ) + V (r) = − ~2 2µ 2 ∂ ∂2 + 2 ∂r r ∂r + 1 ab δ La Lb + V (r) 2µr2 mit allen drei Komponenten des Bahndrehimpuls– Operators. Da die Bahndrehimpulskomponenten nicht untereinander verträglich sind, kann der quantenmechanische Zustand eines Teilchens im Zentralpotential durch die simultane Angabe der möglichen Eigenwerte von {H, La , L2 ≡ δ ab La Lb } , a ∈ {1, 2, 3} charakterisiert werden, wobei wir ohne Beschränkung der Allgemeinheit L3 auszeichnen. Als Zustandsbezeichner wählen wir also E ∈ M(H) , m : m~ ∈ M(L3 ) , l : l(l + 1)~2 ∈ M(L2 ). Offenbar ist zumindestens E = f (l). Den stationären Energie–Eigenzustand geben wir also folgendermaßen an: |E, m, li wobei die Bezeichner mit den Spektren wie oben angegeben zusammenhängen, und H, L3 , L2 |E, m, li = E, m~, l(l + 1)~2 |E, m, li . Wir haben bereits im letzten Abschnitt den zu {L2 , L3 } Satz von simultanen Eigenfunktionen ausgearbeitet. Die Logik der Separationstheorie gebietet daher folgenden Ansatz: Φ(r, θ, φ) ≡ h(r, θ, φ)|E, m, li = R(r) Ylm (θ, φ) , (148) wobei der radiale Anteil R(r) der Wellenfunktion Φ(r, θ, φ) die folgende Eigenwertgleichung erfüllt: 2 ~ l(l + 1)~2 − ∆r + + V (r) R(r) = ER(r) . 2µ 2µr2 (149) Dies ist äquivalent zu folgender Aufgabenstellung: Gegeben sei ein Teilchen, welches sich in einer räumlichen Dimension im effektiven Potential Veff (r) = V (r) + l(l + 1)~2 2µr2 (150) befindet. Eine qualitative Diskussion dieser Aufgabe kennen wir bereits aus der klassischen Mechanik für V (r) ∝ 1/r, die sich dort beim reduzierten 2–Körper–Problem stellte (µ war dort die reduzierte Masse der Relativbewegung um den Massenschwerpunkt). Für das Wasserstoff– Atom ist V (r) = −e2 /r, wobei QP = +e die Ladung des Protons und QE = −e die Ladung des Elektrons in Vielfachen der Elementarladung e ist. Da das effektive Potential Veff von der azimuthalen Quantenzahl l : l(l + 1)~2 ∈ M(L2 ) abhängt, wird auch der Energie–Eigenwert E ∈ M(H) hiervon abhängen. Nun wird dieser sicherlich auch von dem Anteil der kinetischen Energie abhängen, der in die Radialbewegung investiert wird. Das Teilchen kann im Zentralpotential bei festgehaltener Energie, die in die Drehbewegung investiert wird, sicherlich unterschiedliche Mengen an kinetischer Energie in die Radialbewegung investieren. Daher braucht es noch eine weitere Quantenzahl, die radiale Quantenzahl k, welche bei festgehaltenem l den radialen Bewegungszustand charakterisiert. Hierbei liegt k ∈ I ⊂ R, wobei I a priori unbekannt ist. Wir haben also folgende Situation: Eigenwert Quantenzahl Ekl l(l + 1)~2 m~ k l m Bezeichnung radiale Quantenzahl azimuthale Quantenzahl magnetische Quantenzahl Da der Hamilton–Operator von L3 ausschließlich über L2 abhängt, ist der Energie–Eigenwert mindestens (2l + 1)– fach entartet, was gerade der Anzahl von möglichen magnetischen Quantenzahlen bei fester azimuthaler Quantenzahl l entspricht. Diese Entartung heißt essentielle Entartung und wird von der zufälligen Entartung unterschieden, die durch Ek0 l0 = Ekl charakterisiert ist, und keinen fundamentalen Ursprung hat. Zur Vereinfachung des Differentialoperators in (149) redefinieren wir Rkl (r) =: Ukl (r)/r und finden als radiale Zustandsgleichung: 2 2 ~ d − + Veff (l, r) Ukl (r) = Ekl Ukl (r) . (151) 2µ dr2 Offenbar ist es wichtig, daß wir uns Gedanken über das Verhalten von Rkl (r) am Ursprung machen, der die Lage einer Quelle ist, die als Ursache für das Zentralpotential fungiert und den Ursprung übrigens überhaupt erst als solchen auszeichnet. Wir suchen Lösungen von (151), die am Ursprung hinreichend gutartig sind, und wagen den Ansatz (Ckl ∈ C , k ∈ I, l : l(l + 1)~2 ∈ M(l)) lim Ukl (r) ∼ Ckl rs+1 . r→0 (152) Einsetzen in (151) liefert für r −→ 0 die Bedingung s(s + 1) − l(l + 1) = 0, woraus s ∈ {l, −(l + 1)} folgt, also ( rl+1 , wenn s = l lim Ukl (r) ∼ Ckl r→0 r−l , wenn s = −(l + 1) . Um den am Ursprung divergenten Lösungsast auszuschließen, setzen wir eine entsprechende Randwertbedingung, die die physikalische Lösung in Abhängigkeit von der radialen und azimuthalen Quantenzahl eindeutig als 49 Funktion vom Abstand zum Ursprung bestimmt: 2 2 ~ d + Veff (l, r) Ukl (r) = Ekl Ukl (r) , − 2µ dr2 Ukl (0) = 0 . (153) Wir gehen zu dimensionslosen Variablen über. Dazu definieren wir in historischer Anlehnung folgende Größen: ~2 µe2 4 df µe EI = 2 2~ df a0 = Die Randbedingung Vkl (0) = 0 und die Form der Differentialgleichung (160) motiviert einen Ansatz der Form Vkl (ρ) ∝ ρs Pkl (ρ) , R 3 s > 0, wobei Pkl (ρ) eine Potenzreihe in ρ ist (mit Koeffizienten R 3 Cq , q ∈ N). Einsetzen in (160) ergibt nach Ordnen nach Potenzen in ρ: 0 = (Bohr’scher Atomradius) , + (Bohr’sche Ionisierungsenergie) . (154) Die dimensionsbehafteten Größen drücken wir als Vielfache des Atomradius und der Ionisierungsenergie im Bohr’schen Atommodell aus: (155) Bemerken Sie, daß das Minuszeichen unter der Wurzel in (155) der Tatsache Rechnung trägt, daß wir uns für Bindungszustände interessieren, und diese wegen der Form von Veff allesamt durch negative Energie gekennzeichnet sind. Mit diesen Skalierungen kann die radiale Wellengleichung folgendermaßen umgeschrieben werden: 2 d l(l + 1) 2 2 − + − λ kl Ukl (ρ) = 0 , dρ2 ρ2 ρ Ukl (0) = 0 . (156) Wir bestimmen zunächst das asymptotische Verhalten (ρ 1) von (156). Offenbar gilt asymptotisch Ukl (ρ) a= exp (±ρλkl ) . (157) Aus Konsistenzgründen (Normierbarkeit) sind wir gezwungen, die exponentiell wachsende Asymptotik als unphysikalisch zu verwerfen. Die physikalisch sinnvolle Asymptotik ist also Ukl (ρ) a= exp (−ρλkl ) . q=0 ∞ X Cq [(q + s)(q + s − 1) − l(l + 1)] ρq+s−2 + Cq 2 [1 − (q + s)λkl ] ρq+s−1 . Nehmen wir an, daß C0 6= 0, so ist die niedrigste Potenz in ρ offenbar durch den Summanden mit q = 0 gegeben. Die Bedingung, daß dieser verschwindet ist Ukl (ρ) = exp (−ρλkl ) · Vkl (ρ) , ρ ∈ [0, ∞) . (159) Unsere neue Aufgabe lautet damit: 2 d d 2 l(l + 1) − 2λ + − Vkl (ρ) = 0 , kl dρ2 dρ ρ ρ2 Vkl (0) = 0 . (160) (162) wobei s = l + 1 die einzige konsistente Lösung darstellt, die die Randbedingung Vkl (0) = 0 respektiert. Für ein gegebenes N 3 q 6= 0 ist die niedrigste Potenz von ρ nun q + s − 2 = q + l − 1. Für die Koeffizienten erhalten wir damit folgende Rekursionsbeziehung (nach geeigneter Indexverschiebung): q(q + 2l + 1)Cq = 2 [(q + l)λkl − 1] Cq−1 , N 3 q 6= 0 . (163) Nach Bestimmung von C0 (Normierung) folgen hieraus rekursiv alle Koeffizienten von Pkl (ρ). Weiterhin gilt, daß Cq /Cq−1 −→ 0 für q −→ ∞. Die Reihe konvergiert also. Aber Vorsicht, genauer haben wir ja für diesen Grenzfall Cq /Cq−1 −→ 2λkl /q. Sie können sich selbst davon überzeugen, daß Cq −→ (2λkl )q /q! für q −→ ∞ gilt. Für jedes l ∈ N/2 (hier eigentlich l ∈ N) und für jedes k ∈ I gibt es ein Q ∈ N mit CQ = (2λkl )Q /Q!+O(ε). Damit kann die Potenzreihe Pkl (ρ) folgendermaßen aufgespalten werden: Pkl (ρ) = Rkl (ρ) + ∞ q X (2λkl ) q ρ . q! (164) q=Q (158) Eine schöne Eigenschaft dieser Asymptotik ist, daß sie das Verhalten der radialen Wellenfunktion im Intervall ρ ∈ [0, 1) nur wenig beeinflußt. Insbesondere wird das Exponential im Limes ρ −→ 0 gerade Eins und respektiert damit auch die Randbedingung Ukl (0) = 0. Dies motiviert folgenden Ansatz: (161) q=0 s(s − 1) = l(l + 1) , df ρ = r/a0 , df p λkl = −Ekl /EI . ∞ X Im Grenzfall ρ −→ ∞ finden wir daher h i ρ→∞ Vkl (ρ) −→ lim ρl+1 R̃kl (ρ) + exp (2λkl ρ) , (165) ρ→∞ PQ−1 wobei R̃kl (ρ) = Rkl (ρ) + q=0 (2λkl ρ)q /q!. Dies impliziert aber, daß Vkl (ρ) und sogar Ukl (ρ) nicht normierbar sind, da sie im Grenzfall ρ −→ ∞ divergieren, was natürlich keinen Sinn macht. Folglich muß die Rekursion (163) abbrechen, so daß Pkl (ρ) nur ein Polynom in ρ ist. Bricht die Rekusion ab, gibt es keine Normierungsprobleme, da das Dämpfungsexponential in Ukl (ρ) für eine physikalisch vernünfitge Asymptotik sorgt. Nehmen wir an, daß die Rekursion für q = q∗ abbricht. Dann gilt [(q∗ + l)λkl − 1]Cq∗ −1 = 0. Da C0 6= 0 ist auch Cq∗ −1 6= 0 und wir finden: λkl = 1/(q∗ + l). Mit anderen 50 Worten, k = q∗ und die Rekursion bricht gerade für q = k ab. Dies schränkt I ⊂ R auf I = N/{0} ein. Der Energie– Eigenwert in Abhängigkeit von der azimuthalen und der radialen Quantenzahl ist somit Ekl −EI = , l ∈ N , k ∈ N/{0} . (k + l)2 (166) Die Funktion Vkl (ρ) ist daher ein Polynom in ρ von Ordnung l + k, wobei die niedrigste Potenz gerade l + 1 ist. Die Rekursionsbeziehung (163) wird Cq = − 2(k − q) Cq−1 , q(q + 2l + 1)(k + l) (167) wobei der Rekursionsabbruch offenbar implementiert ist. Es lohnt sich in einer ruhigen Minute Cq = f (C0 ) explizit herzuleiten. Bsp. VIII.1 Der radiale Anteil Rk,l (r) der stationären Wellenfunktion eines nichtrelativistischen Elektrons im klassischen Zentralpotential eines Protons (sogenanntes Wasserstoff–Problem) ist für einige radiale und azimuthale Quantenzahlen explizit durch folgende Ausdrücke gegeben: R1,0 (r) = 2(a0 )−3/2 exp (−r/a0 ) , R2,0 (r) = 2(2a0 )−3/2 (1 − r/2a0 ) exp (−r/2a0 ) , R1,1 (r) = (2a0 )−3/2 3−1/2 (r/a0 ) exp (−r/2a0 ) .(168) Für festgelegtes l ∈ N gibt es unendlich viele Energiewerte Ekl ∝ −1/(k + l)2 , da k ∈ N/{0}. Jeder dieser Energiewerte ist wenigstens (2l + 1)–fach entartet: Diese essentielle Entartung hat ihren Ursprung in der Tatsache, daß die Gleichung für den radialen Anteil der Wellenfunktion lediglich von l aber nicht von m abhängt. Zusätzlich gibt es zufällige Entartung: Für Pärchen (k1 , l1 ) , (k2 , l2 ) mit k1 +l1 = k2 +l2 gilt ja Ek1 ,l1 = Ek2 ,l2 . Die zugehörigen Zustände sind also energetisch nicht zu unterscheiden. Speziell für das H–Problem ist es zweckmäßig, die sogenannte Hauptquantenzahl n := k + l einzuführen, da Ekl nur von dieser Kombination abhängt. Also, En ≡ Ek+l := Ekl = −EI /n2 . Prinzipiell haben wir die Wahl, entweder (k, l) oder (n, l) zu spezifizieren, um die Eigenzustände zu bestimmen. Wir folgen der üblichen Konvention und benutzen (n, l) als Quantenzahlen. Die Hauptquantenzahl n charakterisiert die sogenannte Elektronenschale. Da k ∈ N/{0} ist, gibt es für fixiertes n nur eine endliche Anzahl von l–Werten, nämlich l ∈ {0, 1, . . . , n − 1}. Also kann l bei fixiertem n gerade n unterschiedliche Werte annehmen. Daher hat sich folgende Sprechweise eingebürgert: Die mit der Hauptquantenzahl n bezeichnete Elektronenschale hat n Unterschalen, die eben durch l ∈ {0, 1, . . . , n−1} charakterisiert sind. Schließlich kann jeder dieser Unterschalen (2l + 1) unterschiedliche Zustände unterbringen, die durch die (2l + 1) möglichen Werte von m ∈ {−l, . . . , l} ⊂ Z gegeben sind bei festem l. Die totale Entartung ν(n) einer Elektronenschale n (Energie En ) ist somit ν(n) = n−1 X (2l + 1) = n2 . (169) l=0 Aus historischen Gründen, die vor der Entwicklung der Quantenmechanik ihren Ursprung haben, hat sich folgende spektroskopische Bezeichnung eingebürgert, die auch heute noch im Gebrauch ist und ein quasi botanisches Erbe darstellt: l = 0 ↔ s , l = 1 ↔ p , l = 2 ↔ d , l = 3 ↔ f , · · · . Für N 3 l > 3 werden die l–Quantenzahlen mit den Buchstaben nach f in der korrekten alphabetischen Reihenfolge bezeichnet. Wie oben dargelegt werden Unterschalen durch Wertepaare (n, l) charakterisiert, wobei in der spektroskopischen Schreibweise nl benutzt wird und l durch den entsprechenden Buchstaben ersetzt wird. Bsp. VIII.2 (Einige Energiestufen des H–Atoms) Der energetisch tiefliegendste Zustand eines Elektrons im Coulomb–Potential des Protons ist der 1s–Zustand, da für die Hauptquantenzahl N 3 n ≥ 1 gilt. Folglich muß die radiale Quantenzahl k = 1 sein und für die azimuthale Quantenzahl l = 0 ↔ s gelten. Der 1s–Zustand weist hinsichtlich der magnetischen Quantenzahl keine Entartung auf und es ist m = 0. Der energetisch nächst tiefliegende Zustand hat n = 2. Dies ergibt für die azimuthale Quantenzahl folgende Wertemöglichkeiten: l ∈ {0, 1} ↔ {s, p}. Die möglichen Zustände zu n = 2 korrespondieren somit zu den Unterschalen 2s und 2p. Der 2s–Zustand weist hinsichtlich der magnetischen Quantenzahl keine Entartung auf, der 2p– Zustand dagegen ist hinsichtlich der magnetischen Quantenzahl dreifach entartet: m ∈ {−1, 0, 1}. Die totale Entartung ist somit ν(2) = 4, was der Anzahl der möglichen unterscheidbaren Zustände zu n = 2 entspricht. Für n = 3 ist l ∈ {s, p, d}, die möglichen Unterschalen sind also mit 3s, 3p und 3d bezeichnet. Neu ist die azimuthale Quantenzahl l = 2 ↔ d, für die m ∈ {−2, −1, 0, 1, 2} ist. Zu n = 3 gibt es 1+3+5 = 9 unterscheidbare Zustände, die alle auf dem gleichen Energieniveau liegen. Beachten Sie, daß E1 /E2 = 4 , E1 /E3 = 9 und E2 /E3 = 9/4 ist. Bsp. VIII.3 (Einige Wellenfunktionen) Die 1s– Unterschale wird von einem Zustand mit folgender Wellenfunktion Φn,l,m im Ortsraum populiert: Φ1,0,0 = √ 1 πa03 e−r/a0 . (170) Die Wellenfunktion im Ortsraum zum 2s–Zustand ist: 1 Φ2,0,0 = 8πa 1 − 2ar 0 e−r/2a0 . (171) 3 0 Die 2p–Unterschale ist hinsichtlich der magnetischen Quantenzahl dreifach entartet. Die zugehörigen Wellen- 51 funktionen sind (s(θ) := sin θ , c(θ) := cos θ): Φ2,1,−1 = Φ2,1,0 = r −r/2a0 e πao3 a0 √1 8 r −r/2a0 e 2πao3 a0 √1 4 8 c(θ) , r −r/2a0 e πao3 a0 Φ2,1,1 = − √1 IX. s(θ)e−iϕ , (172) s(θ)e+iϕ . S: ELEMENTARE STREUTHEORIE Streuungen sind die elementaren Bausteine vieler physikalischer Prozesse, die wir in der Natur beobachten, und stehen zudem in direktem Zusammenhang mit den fundamentalen Wechselwirkungen, die in den Quantentheorien der Felder formuliert und studiert werden. Aber bereits in der Quantentheorie eines Massepunktes kann der formale Rahmen hierfür entwickelt und studiert werden, auch wenn die Streuung dann nur an einem externen Potential stattfindet, welches bezüglich seiner quantenmechanischer Freiheitsgrade nicht aufgelöst wird und daher als klassisch angenommen wird. Das mag ein wenig ernüchternd sein, hat aber wichtige Anwendungen, wann immer externe Felder von Bedeutung sind, und ist auch schon ein Fortschritt relativ zur Klassischen Mechanik. Mit der beginnen wir übrigens, denn hier kann eine intuitive Verankerung gelegt werden, durch deren Abstraktion der quantenmechanische Rahmen zur Behandlung von Streuprozessen verständlicher wird. A. Klassische Präliminarien Gegeben sei ein Hamilton–System (P ∼ = R3 × R3 , H), wobei P durch (q, p) koordinatisiert sei, mit der Bewegungsgleichung d Z(t) = F (Z(t)) , dt (173) wobei Z(t) = (q(t), p(t))T den mechanischen Zustandes des Systems zur Zeit t ∈ R beschreibt. Im linearen Fall ist die rechte Seite der Hamilton–Bewegungsgleichung (173) durch q(t) p(t)/m F p(t) = −∇V , (174) (q(t)) wobei V das Potentialfeld bezeichne und −∇V ist das zugehörige Kraftfeld. Der Einfachheit halber nehmen wir zunächst an, daß das Potential einen kompakten Träger hat, und daß sich das Teilchen für t −→ −∞ und t −→ +∞ außerhalb dieses Trägers befinde. Dann gilt lim q(t) = Qin + tPin /m , t→−∞ lim q(t) = Qfi + tPfi /m . t→+∞ (Qin , Pin ≡ limt→−∞ P (t)) durch Integration der Bewegungsgleichung mit den Anfangsbedingungen q(t0 ) = Qin +t0 Pin /m , p(t0 ) = p1 berechnet werden, wobei wir t0 so fern in der Vergangenheit wählen, daß q(t) für t < t0 außerhalbt des Trägers von V ist. Die Streuabbildung ist dann die Abbildung (175) Aufgrund der Energieerhaltung gilt |Pin | = Pfi . Prinzipiell können die Größen (Qfi , Pfi ≡ limt→+∞ P (t)) aus P −→ P , Qfi Qin −→ . Pfi Pin (176) ∼ R6 definiert und Die Streuabbildung S ist auf ganz P = surjektiv, das heißt jeder Zustand Z ∈ P kommt als Anfangszustand Zin (initial) und als Endzustand Zfi (final) vor. Bsp. IX.1 (Klassische Streuung an beschränktem Potential in 1–d Konfigurationsraum) Sei P ∼ = R2 und das Potential beschränkt, V (q) ≤ E∗ := max(V ). Für Energien E < E∗ wird das Teilchen an dem Potential reflektiert, wobei der Impuls des Teilchens zeitweise variiert, solange der Ort des Teilchens im Träger von V liegt, aber insgesamt wird nur das Vorzeichen des Impulses geändert. Die Streuabbildung hat also die folgende Form: Qfi (Qin ,Pin ) in = . (177) S Q Pin −Pin Für Energien E > E∗ bewegt sich das Teilchen durch den gesamten Träger von V , wobei innerhalb des Trägers sein Impuls zeitlich variiert, am Ende es jedoch den gleichen Impuls besitzt wie zu anfangs. Im Vergleich zur freien Bewegung wird allerdings die Dynamik aufgrund der Existenz von V eine andere sein. Die Streuabbildung hat die Form ,Pin ) in = Qfi (QPin . (178) S Q Pin in Im Fall E = E∗ kommt das Teilchen am Ort q∗ : V (q∗ ) = E∗ zur Ruhe, falls es diesen in endlicher Zeit erreichen kann. Hat das Potential V keinen kompakten Träger, sondern sind V und |∇V | für große |t| nur hinreichend klein aber endlich, so wird die Bewegung auch für sehr große |t| nicht exakt durch Qin,fi + tPin,fi /m beschrieben. Es ist aber intuitiv zu erwarten, daß die Bewegung wenigstens asymptotisch frei ist, also ∃ (Qin,fi , Pin,fi ) : lim |q(t) − Qin,fi + tPin,fi /m| = 0 . t→±∞ Nun ja, es zeigt sich allerdings, daß dies viel weniger intuitv ist, als gedacht, und zwar in folgendem Sinne: Das Potential muß asymptotisch schon sehr klein sein, zum Beispiel gilt asymptotische Freiheit bereits für das Coulomb–Potential nicht. Wir waren ein wenig engstirnig, denn eigentlich werden nur die Impulse ausreichend vor und nach der Streuung gemessen. Diese sollten asymptotisch konstant sein, was 52 auch für langsamer abfallende Potentiale erwartet werden darf. Die Streuabbildung ist dann nur die Abbildung Pin −→ Pfi . Im Folgenden passen wir unsere intuitive Beschreibung von Streuprozessen dem formalen Rahmen an, den die Quantenmechanik zur Beschreibung von Streuung verlangt. Der Zustand eines Teilchens sei durch Z(t) = (q(t), p(t)) gegeben und werde zum Beispiel zur Zeit t = 0 durch Z(0) = (Q0 , P0 ) beschrieben. Wie zuvor bezeichnen wir die zugehörigen asymptotischen freien Zustände in der fernen Vergangenheit bzw. der fernen Zukunft durch (Qin,fi , Pin,fi ). Wir führen neue Abbildungen ein: Win,fi : (Qin,fi , Pin,fi ) −→ (Q0 , P0 ) . (179) Die Komposition S := Wfi −1 ◦ Win ist dann der sogenannte Streuoperator. Dieser Operator beschreibt offenbar den Streuvorgang im Endeffekt so, daß die Streuung selbst nicht dynamisch aufgelöst wird, da wir ja lediglich die asymptotisch freien Zustände miteinander vergleichen. Das ist komfortabel, aber stellt uns auch vor schwere Aufgaben, wenn wir das sogenannte inverse Problem lösen wollen, also von S auf das Potential oder etwa die Form eines reflektierenden Körpers zurückschließen möchten. Dies ist offenbar eine der wichtigsten Fragestellungen in der Streutheorie, aber auch eine der schwierigsten. B. Ein instruktives Beispiel Im folgenden Beispiel betrachten wir ein Paar von Evolutionsgleichungen, das so einfach ist, daß der Streuoperator explizit berechnet werden kann. Die Überlegungen sind weitgehend unabhängig vom zu Grunde liegenden Funktionenraum und Funktionalanalysis spielt allenfalls im Hintergrund eine Rolle (aus diesem ist sie ohnehin nur schwerlich wegzudenken). Bsp. IX.2 (Konstruiertes Beispiel zur raschen Veranschaulichung) Die Einfachheit der folgenden Diskussion liegt an folgender Annahme: Gegeben sei ein klassisches System im R1 mit der Dispersionsrelation (Energie–Impuls–Beziehung für ein freies Teilchen) E = p. Diese ist artifiziell, da sie nicht einmal approximativ aus der relativistischen folgt. Wir benutzen sie trotzdem, weil sie offenbar die schöne Eigenschaft hat, qua Quantisierung eine Prozessgleichung zu liefern, die ausschließlich Ableitungen erster Ordnung enthält, was die Diskussion enorm vereinfacht und eine exakte Behandlung ermöglicht. Kanonische Quantisierung liefert für die freie Evolution der Wellenfunktion im Ortsraum die Prozessgleichung i~∂t Ψ(t, x) = H0 Ψ(t, x) , (180) wobei H0 := Op ≡ −i~∂x auf R. Die freie Zeitentwicklung ist durch U0 (t) := exp (−iH0 /~) gegeben. Wegen der Form von H0 ist U0 (t) gerade die unitäre Darstellung von räumlichen Translationen um die Distanz t (c=1), jedenfalls im L2 (R)–Fall. Mit anderen Worten, (180) hat die Lösung Ψ(t, x) = U0 (t)Ψ(0, x) = Ψ(0, x − t) . (181) Dies gilt natürlich nur dann, wenn Ψ differenzierbar ist. Der unitäre Operator (im L2 (R)–Fall) U0 (t) dagegen ist auf jedem vernünftigen Funktionenraum über R wohldefiniert und stark stetig (überlegen Sie sich Beispiele), insbesondere in L2 (R). Unitarität von U0 (t) (im L2 (R)– Fall) impliziert U0 † (t) = U0 −1 (t) = U0 (−t). Nun kann das Teilchen auch in den Einflußbereich eines Potentials V (x) mit geeignetem Träger geraten, dann wird die zeitliche Entwicklung der zugehörigen Wellenfunktion nicht mehr von H0 generiert, sondern von H = H0 + V (x). In vielen realistischen Fällen wird V (x) als Störung von H0 betrachtet, da die Evolution im allgemeinen nicht mehr exakt lösbar sein wird, und die exakte Evolution wird um die freie Evolution entwickelt. Das führt uns zu weit im Moment. Die exakte Evolution der Wellenfunktion wird also folgendermaßen beschrieben: i~∂t Ψ(t, x) = (H0 + V (x)) Ψ(t, x) , (182) wobei per Konstruktion die Anfangsbedingung mit der der freien Evolution übereinstimmen soll. Wie schaut der Zeittranslationsoperator U (t) in diesem Fall explizit aus? Zunächst setzen wir Z x i df W Φ(x) = exp dy V (y) Φ(x) . (183) ~ 0 Offenbar ist H = W −1 H0 W, das heißt HΨ(t, x) = (W −1 H0 W)Ψ(t, x) für geeignete Wellenfunktionen, wobei wir Kompositionszeichen unterdrückt haben. Also gilt (Zeigen Sie dies!) Ψ(t, x) = U (t)Ψ(0, x) = W −1 U0 (t)WΨ(0, x) Z i x = exp − dy V (y) ◦ ~ 0 Z x i ◦ U0 (t) exp dy V (y) Ψ(0, x) ~ 0 Z x−t i = exp dy V (y) Ψ(0, x − t) . (184) ~ x Sie können das ganz explizit durch Einsetzen in die Prozessgleichung (182) überprüfen oder etwas formaler folgendermaßen: ∂t U (t)Ψ(0, x) = = = = = ∂t W −1 U0 (t)WΨ(0, x) W −1 ∂t U0 (t)WΨ(0, x) W −1 (−iH0 /~) U0 (t)WΨ(0, x) −(i/~)W −1 H0 WW −1 U0 (t)WΨ(0, x) −(i/~)HU (t)Ψ(0, x) . (185) Der Zustand eines freien Teilchens Ψ± ist genau dann asymptotisch gleich dem Zustand eines Teilchens, daß 53 dem Potential ausgesetzt war, wenn in der fernen Vergangenheit bzw. Zukunft folgendes gilt: lim {U0 (t)Ψ± (0, x) − U (t)Ψ(0, x)} = 0 . t→±∞ (186) Dann gilt weiter Ψ± (0, x) = lim t → ±∞ exp Z x i dy V (y) Ψ(0, x) . ~ x+t Salopp gesprochen wird die Zeitentwicklung auf der rhs(187) vom Wechselwirkungsanteil (also vom Potential) in H betrieben statt von H0 oder ganz H. Die Grenzwerte in (187) existieren genau dann, wenn V bei ±∞ uneigentlich integrierbar ist. Dann ist Z x i dy V (y) Ψ(0, x) Ψ+ (0, x) = exp ~ ∞ Z i ∞ = exp − dy V (y) Ψ(0, x) ~ x Z i ∞ = exp − dy V (y) ◦ ~ x Z x i ◦ exp − dy V (y) Ψ− (0, x) ~ −∞ Z i +∞ = exp − dy V (y) Ψ− (0, x) . ~ −∞ Damit haben wir ein wichtiges Resultat gefunden, nämlich: Wenn V bei ±∞ uneigentlich integrierbar ist, existiert also der Streuoperator S: Ψ+ = SΨ− Z i +∞ = exp − dy V (y) Ψ− . ~ −∞ (187) Der Streuoperator ist einfach die Multiplikation mit einer komplexen Zahl vom Betrag eins. Auf allen normierten Funktionenräumen über R ist S somit isometrisch und bijektiv, in L2 (R) sogar unitär. Die Abbildungen W± : Ψ± −→ Ψ , Z i x W± Ψ± (0, x) = exp − dy V (y) Ψ± (0, x) ~ ±∞ heißen Wellenoperatoren, und es gilt S = W+ −1 ◦W− . C. Das kleine ABC der Sturm–Liouville–Operatoren Dieser Einschub ist lediglich eine kleine Erinnerung, Auffrischung oder Einführung in die aufregende und für die Physik wichtige Theorie der Sturm–Liouville– Operatoren. Je nach dem, wie sehr Ihre kleinen grauen Zellen diesen Stoff bereits verdaut haben, können Sie diesen Abschnitt überspringen, oberflächlich durchgehen oder tiefsinnig studieren, auch wenn er nicht so tiefsinnig präsentiert wird. Ein Sturm–Liouville–Differentialausdruck ist der folgende gewöhnlicher Differentialausdruck in einem beliebigen (beschränkten oder unbeschränkten) Intervall I = (a, b): df OSL Ψ(x) = 1 r(x) {−∂x (p(x)∂x Ψ(x)) + V (x)Ψ(x)} . (188) mit einer als positiv vorausgesetzen Funktion r : R −→ R, die die Rolle einer Gewichtsfunktion in einem Skalarprodukt spielen wird. Solche Differentialausdrücke treten typischer Weise in der Physik auf, nach dem die Zeitabhängigkeit eines dynamischen Systems vom zugehörigen Zustand absepariert wurde. Wichtige Beispiele sind die schwingende Saite, die schwingende Kreismembran, oder der eindimensionale Schrödinger– Operator, also OSL := −Op ◦ Op + V (x) in I mit −∞ ≤ a < b ≤ ∞. 1. Voraussetzungen und minimaler & maximaler Operator Wir setzen dabei stets voraus: (1) p, V, r sind meßbare reellwertige Funktionen mit 1/p, V, r ∈ L1lok (I), das heißt sie sind über jedes kompakte Teilintervall von I integrierbar. (2) p(x) > 0 , r(x) > 0 für fast alle x ∈ I. Mit diesen recht allgemeinen Voraussetzungen ist es oft technisch sehr aufwendig und langwierig, die Theorie der Sturm–Liouville–Operatoren zu entwickeln, und es ist dann verlockend von folgenden wesentlich stärkeren Voraussetzungen auszugehen: (10 ) V, r sind stückweise stetige reellwertige Funktionen auf I, p ist stetig und stückweise differenzierbar. (20 ) Es gilt r(x) > 0 und p(x) 6= 0 für alle x ∈ I. Die zusätzlichen Einschränkungen betreffen nur das Verhalten der Koeffizienten im Innern von I. In vielen Anwendungen sind die Koeffizienten dort hinreichend regulär und bereiten keine Probleme. Was beiden Sätzen an Voraussetzungen gemein und damit also wichtig ist: Es wird beliebig singuläres Verhalten am Rand von I zugelassen. Ist Φ : I ≡ (a, b) −→ C meßbar und z ∈ C, so heißt eine Funktion Ψ : I −→ C eine Lösung von (OSL − z)Ψ = Φ, wenn Ψ und p∂x Ψ absolut stetig sind und −∂x (p∂x Ψ)(x) + (q(x) − zr(x))Ψ(x) = r(x)Φ(x) für fast alle z ∈ I. Wir führen folgenden Hilbert–Raum ein: df L2 (I, r) = Ψ : I −→ C : Ψ meßbar , r|Ψ|2 ∈ L1 (I) 54 mit dem Skalarprodukt und der Norm Z df hΨ, Φir = dx (ΨΦr) (x) , I df kΨkr = p hΨ, Ψir . (189) Der maximale durch OSL erzeugte Operator T ist definiert durch n df D(T ) = Ψ ∈ L2 (I, ∇) : Ψ und p∂x Ψ absolut stetig o in I , OSL Ψ ∈ L2 (I, r) T Ψ = OSL Ψ . Der minimale durch OSL erzeugte Operator T00 ist die Einschränkung von T auf n o df D(T00 ) = f ∈ D(T ) : Ψ hat kompakten Träger in I . Der minimale Operator T00 besitzt selbstadjungierte Fortsetzungen, die auch als selbstadjungierte Realisierungen von OSL bezeichnet werden. Um dies verständlicher zu machen, benötigen wir einen allgemeinen Existenz– und Eindeutigkeitssatz für gewöhnliche lineare Differentialgleichungen: Gegeben sei das Anfangswertproblem (AWP) ∂x y(x) = a(x)y(x) + h(x) , x ∈ I , y(x0 ) = y0 , x0 ∈ I , y0 ∈ Cn , (a) Die Idee zum Beweis dieser Aussage fußt auf einer lokalen Fixpunktkonstruktion. Lokal deswegen, weil verankert um den Anfangswert es gelingt, eine Kontraktion zu konstruieren, deren Fixpunkt das (AWP) lokal eindeutig löst. Die Konstruktion kann dann sukzessive auf I erweitert werden. Das Anfangswertproblem (AWP) ist äquivalent zur Integralgleichung Z x y(x) = y0 + dt [a(t)y(t) + h(t)] . (191) x0 Sei I(x, η) := [x − η, x + η] , x ∈ I , η > 0. Wir wählen η > 0 so, daß gilt: Z dt |a(t)| ≤ q < 1 . I(x0 ,η) Nun betrachten wir die Integralgleichung in dem Banachraum C(I(x0 , η)) mit der Maximumnorm k ◦ k∞ . In diesem Raum ist die Abbildung B mit Z x df dt [a(t)y(t) + h(t)] , x ∈ I(x0 , η) Bu(x) = y0 + x0 eine Kontraktion, denn Z kBu − Bvk∞ ≤ ku − vk∞ dt |a(t)| I(x0 ,η) (190) wobei y, h : I −→ Cn und a : I −→ GL(n, C), und die üblichen Meßbarkeitsanforderungen gelten. Eine Funktion nennen wir eine Lösung von (190), wenn jede Komponente absolut stetig ist und das (AWP) für fast alle x ∈ I erfüllt ist. Dieses (AWP) ist gewissermaßen das Rollenmodell für Sturm–Liouville–Probleme, was wir alsbald zeigen. Zuvor nehmen wir diese Aussage hin als Motivation, um die folgenden grundsätzlichen Aussagen zu studieren. Satz IX.1 (a) Im Anfangswertproblem (AWP) seien |a| , |h| lokal integrierbar in I Dann existiert für jedes x0 ∈ I und jedes y0 ∈ Cn genau eine Lösung. Sind a, h stetig, so ist y stetig differenzierbar. (b) Seien aj : I −→ Cn×n , j ∈ {1, 2} meßbar und lokal integrierbar. Gilt a = a1 + za2 mit z ∈ C, so ist die Lösung yz (x) , x ∈ I von (AWP) eine ganze Funktion von z. (c) Gilt aj −→ a, hj −→ h in L1lok (I) und y0 j −→ y0 , so konvergiere die entsprechenden Lösungen yn in I lokal gleichmäßig gegen die Lösung y. Beweis IX.1 Sind die Koeffizienten von (AWP) stückweise stetig auf I = (a, b) und ersetzen wir in (c) die L1lok –Konvergenz durch gleichmäßige Konvergenz, so ist der Satz Ihnen vermutlich aus der klassischen Theorie gewöhnlicher linearer Differentialgleichungen bekannt. ≤ qku − vk∞ . (192) Mit dem Fixpunktsatz von Banach folgt somit, daß B einen eindeutig bestimmten Fixpunkt y hat, also By(x) = y(x) , x ∈ I(x0 , η). Dieser Fixpunkt löst das Anfangswertproblem in I(x0 , η). Das Verfahren kann nun an den Rändern von I(x0 , η) fortgesetzt werden, das heißt, das gleiche Verfahren kann in I(x0 − η, η) und I(x0 + η, η) vollzogen werden, usw. Da I(x0 , eta) ∩ I(x0 ± η, η) 6= {0} und die Fixpunkte jeweils eindeutig sind, erhalten wir so schließlich eine eindeutige Lösung in I. Die Beweise der Aussagen (b) & (c) bleiben Ihnen beziehungsweise Ihrem Selbststudium überlassen. ∗–< [{; 0) Es folgt nun die angepriesene verwandtschaftliche Beziehung zwischen (AWP) und dem Sturm–Liouville– Anfangswertproblem. Lemma IX.1 Der Sturm–Liouville Differentialausdruck OSL erfülle die obigen Voraussetzungen {(1), (2)} oder {(10 ), (20 )}. Ist Φ : I −→ C meßbar und rΦ ∈ L1lok (I), so ist für beliebige z ∈ C und (y0 , y1 ) ∈ C2 das Anfangswertproblem (OSL − z) Ψ = Φ , Ψ(x0 ) = y0 , (p∂x Ψ) (x0 ) = y1 (193) eindeutig lösbar. Die Lösung Ψz (x) ist für jedes x ∈ I eine ganze Funktion von z. Letzteres gilt auch für (p∂x Ψz )(x). 55 Der Beweis ergibt sich aus der Äquivalenz von dem Anfangswertproblem (193) mit (AWP). Die Äquivalenz ist rasch etabliert: ! ! ! 0 y0 Ψ , ,h = , y(x0 ) = y = rΦ y1 p∂x Ψ ! 0 1/p a = . (194) V − zr 0 Die Lösungen der homogenen GLeichung (OSL −z)U = 0 bilden einen zwei–dimensionalen Vektorraum über dem komplexen Zahlenkörper. Zwei Lösungen U1 , U2 bilden genau dann ein Fundamentalsystem, wenn die (modifizierte) Wronskideterminante ! U1 (x) U2 (x) df (195) W(U1 , U2 ) = det p∂x U1 (x) p∂x U2 (x) nicht verschwindet. Beachten Sie, daß die Determinante nicht von x abhängt. Zeigen Sie das ruhig. Ist Φ : I −→ C so, daß rΦ lokal integrierbar ist, und ist U1 , U2 ein Fundamentalsystem von (OSL −z)U = 0, so sind alle Lösungen Ψ von (OSL −z)Ψ = Φ folgendermaßen gegeben: Ψ(x) = c1 U1 (x) + c2 U2 (x) + Z x n 1 + U1 (x) dt r(t)U2 (t)Φ(t) + W(U1 , U2 ) Zc x o −U2 (x) dt r(t)U1 (t)Φ(t) , c (196) (b) Ist λ ∈ R und U eine Ls̈oung von (OSL − λ)U = 0, so gilt [U, U ]x = W(Ū , U ) = 0 genau dann, wenn U komplexes Vielfaches einer reellen Lösung ist. Beweis IX.2 (a) Gleichung (198) folgt direkt durch partielle Integration. Aus (198) folgt die Existenz der Grenzwerte in (199) und Gleichung (200) durch Grenzübergang α −→ a+ und β −→ b−. (b) Es ist [U, U ]x = 2i= Ū p∂x U . Dieser Wert ist genau dann Null, wenn die Funktionen U und p∂x U in einem reellen Verhältnis stehen. Dies gilt genau dann, wenn U bis auf einen komplexen Vorfaktor eine reelle Lösung ist Das war es auch schon. ∗–< [{; 0) Es ist instruktiv, zunächst sogenannte reguläre Operatoren zu betrachten. OSL heißt regulär bei a, wenn a > −∞ ist, und die Funktionen 1/p, V, r (neben den obigen allgemeinen Voraussetzungen) über [a, c] integrierbar sind für ein (dann alle) c ∈ I. Der Operator OSL heißt regulär bei b, wenn b < ∞ ist und 1/p, V, r über [c, b] integrierbar sind für ein (dann alle) c ∈ I. OSL heißt regulär, wenn er bei a und b regulär ist. OSL heißt singulär bei a (bzw. b) wenn er bei a (bzw. b) nicht regulär ist. OSL heißt singulär, wenn OSL nichr regulär ist. Diese Flut von Begriffsbildungen sind der Gültigkeit des folgenden Satzes gebührend geschuldet. Satz IX.3 Sei OSL regulär bei a, z ∈ C, Φ : I −→ C meßbar und rΦ über I 0 := (a, c) integrierbar für c ∈ I, zum Beispiel Φ ∈ L2 (I 0 , r). (a) Für jede Ls̈ung Ψ von (OSL − z)Ψ = Φ existieren die folgenden Grenzwerte: wobei c1 , c2 ∈ C, c ∈ I. Def. IX.1 Seien Ψ, Φ : I ≡ (a, b) −→ C absolut stetige Funktionen, für die p∂x Ψ und p∂x Φ stetig sind. Die Lagrange–Klammer von Ψ mit Φ für x ∈ I ist definiert als df [Ψ, Φ]x = Ψ(x) (p∂x Φ) (x) − (p∂x Ψ) (x)Φ(x) .(197) Offenbar gilt speziell für Lösungen Ψ, Φ von (OSL −z)U = 0, daß [Ψ, Φ]x = W(Ψ, Φ)(x). Satz IX.2 (a) Sind Ψ, Φ : I = (a, b) −→ C und p∂x Ψ, p∂x Φ absolut stetig, so gilt für J = [α, β] ⊂ I die Lagrange–Identität Z OSL Ψ(x)Φ(x) − Ψ(x)OSL Φ(x) r(x) = df Ψ(a) = df lim Ψ(x) , p∂x Ψ(a) = lim p∂x Ψ(x) (200) . x→a+ x→a+ (b) Für beliebige c0 , c1 ∈ C gibt es genau eine Lösung von (OSL − z)Ψ = Φ mit Ψ(a) = c0 und p∂x Ψ(a) = c1 . (c) Ist OSL auch bei b regulär, so gilt: Für beliebige c0 , c1 , d0 , d1 ∈ C gibt es ein (nicht eindeutig bestimmtes) Ψ ∈ D(T ) mit Ψ(a) = c0 , p∂x Ψ(a) = c1 und Ψ(b) = d0 , p∂x Ψ(b) = d1 . (198) Die Aussage des Satzes ist, daß für Elemente Ψ ∈ D(T ) im regulären Fall Ψ und p∂x Ψ stetig auf [a, b] fortsetzbar sind. Die Funktion ∂x Ψ selbst kann im allgemeinen nicht stetig in die Randpunkte fortgesetzt werden. Sind Ψ, Φ ∈ D(T ), so existieren folgende Grenzwerte: Beweis IX.3 (a) Ergibt sich aus Lemma IX.1, das in diesem Fall bis zu den Randpunkten anwendbar ist. J β = [Ψ, Φ]β − [Ψ, Φ]α =: [Ψ, Φ]α . df df [Ψ, Φ]b = lim [Ψ, Φ]x , [Ψ, Φ]x = lim [Ψ, Φ]x(199) , x→b− x→b− (b) Ergibt sich aus Lemma IX.1, das in diesem Fall bis zu den Randpunkten anwendbar ist. und es gilt b hT Ψ, Φir − hΨ, T Φir = [Ψ, Φ]a . (c)