DIPLOMARBEIT “Lösungsansätze für heuristische Probleme der Quantenelektronik” ausgeführt am Institut für Allgemeine Elektrotechnik der Technischen Universität Wien von Richard Hellrigl Rienzdamm 38, I-39042 Brixen unter Anleitung von Doz. Dr. G. Reider Doz. Dr. P. Wagner Institut f. Allgemeine Elektrotechnik, Abteilung für Quantenelektronik und Laser Institut für Technische Universität Wien Mathematik und Geometrie Universität Innsbruck Oktober 1993 Vorwort Die Quantenmechanik ist heute ein Gebiet, das längst nicht mehr einer kleinen Elite von theoretischen Physikern vorbehalten ist, sondern in zunehmendem Maße von Ingenieuren verschiedenster Fachbereiche benötigt wird. Neben den technischen Physikern und Chemikern zählen heute auch Elektrotechniker immer öfter zu den Anwendern dieser Theorie, da Disziplinen wie Halbleitertechnik, Werkstoffwissenschaft und Laser-Technik sehr starken Gebrauch von quantenmechanischen Modellen machen. In der Halbleitertechnik ist es beispielsweise notwendig (und auch üblich) bereits die elementarsten Leitungsprozesse unter Anwendung einfacher quantenmechanischer Vorstellungen zu beschreiben (Kronig-Penney-Modell); für genauere Berechnungen geht man dann auf entsprechend verfeinerte Modelle über, die nicht nur einem qualitativen Verständnis dienen, sondern auch für quantitative Analysen herangezogen werden, um die Vorgänge im Halbleiter detailliert zu erfassen, insbesondere dort, wo Messungen schwierig oder gar undurchführbar sind. Neben dem großen Gebiet der Halbleitertechnik gibt es für den Elektroingenieur unzählige weitere werkstoffwissenschaftliche Probleme, die quantenmechanischer Natur sind (so z. B. das magnetische Verhalten von Stoffen). Eine außerordentlich bedeutsame elektrotechnische Anwendung der Quantenmechanik ergibt sich aber durch den Laser: für seine Beschreibung ist es zwar nicht unbedingt erforderlich, das Lichtfeld zu quantisieren, doch ist es unumgänglich, ein quantenmechanisches Modell der Materie zugrundezulegen. Auch hier geht es zum einen um das Verständnis der grundlegenden Prinzipien und zum anderen um die Möglichkeit quantitative Berechnungen anzustellen, die für Forschung und Entwicklung unverzichtbar sind. Tatsächlich ist die Quantenmechanik heute ein fester Bestandteil der elektrotechnischen Ausbildung, sei es, weil sie in verschiedenen Vorlesungen immer wieder kurz behandelt wird (so z. B. in Vorlesungen über Werkstoffwissenschaften, Halbleiter oder Photonik), oder weil ihr eine eigene Spezialvorlesung gewidmet ist (Für Studierende der Hochfrequenztechnik an der TU-München ist beispielsweise eine ziemlich umfangreiche Vorlesung über Quantenelektronik vorgeschrieben). Es versteht sich von selbst, daß ein Elektroingenieur an möglichst einfachen und praktisch orientierten Darstellungen der Quantentheorie interessiert ist; jeglichen unnötigen mathematischen Ballast sowie historisch bedingte Komplikationen wird er nach Möglichkeit meiden. Doch trotz eines sehr großen Angebotes an Lehrbüchern zu diesem Thema, ist es für den Anfänger alles andere als einfach, sich die Grundlagen der Quantenmechanik anzueignen, was zu einem nicht unwesentlichen Teil daran 1 2 liegt, daß die heute allgemein üblichen Formulierungen dieser Theorie in mathematischer Hinsicht sehr unbefriedigend sind. Die meisten einführenden Lehrbücher verwenden zur Formulierung der Quantenmechanik den heuristischen Dirac-Formalismus, der aber in seinen mathematischen Eigenschaften nur sehr ungenau und zum Teil widersprüchlich definiert ist. Diese Imperfektion führt dazu, daß dieser Formalismus — trotz seiner rechnerisch einfachen Handhabung — nur auf komplizierte Weise beschrieben werden kann, da die mathematischen Unsicherheiten dem Gebrauch einer klaren Sprache im Wege stehen. Eine korrekte und widerspruchsfreie Darstellung der Quantenmechanik wurde von J. v. Neumann vorgestellt, wobei es sich aber um keine Präzisierung der Diracschen Methode handelt, sondern um ein von vornherein anderes Konzept. Diese Formulierung ist für theoretische Überlegungen hervorragend geeignet, wird aber von Praktikern wenig verwendet, da sie auf Begriffe aufbaut, denen in praktischen Berechnungen keine zentrale Bedeutung zukommt. Wirklich befriedigend ist somit weder die Diracsche Formulierung, noch jene des J. v. Neumann. Am unangenehmsten ist aber die Tatsache, daß der Zusammenhang zwischen diesen beiden Methoden keineswegs offensichtlich ist, wodurch es recht schwierig wird, eine mit Diracschen Begriffen formulierte Aussage in die Neumannsche Formulierung zu übersetzen und umgekehrt. Den Autoren von Physikbüchern sind diese Probleme durchaus bewußt, was man an der Ausführlichkeit erkennt, mit der in vielen Texten obige Komplikationen besprochen werden. Um so unverständlicher ist es daher, daß im allgemeinen nicht versucht wird, diese Probleme durch Anwendung modernerer mathematischer Methoden zu lösen. Die in Lehrbüchern der nichtrelativistischen Quantenmechanik verwendete Mathematik ist meistens auch heute noch identisch mit jener, die von Dirac bzw. v. Neumann Anfang der 30er Jahre entwickelt wurde. Tatsächlich gäbe es aber wesentlich modernere mathematische Konzepte, die es zum einen gestatten, die altbekannten heuristischen Methoden exakt zu definieren, und es zum andern ermöglichen, eine einfache und durchsichtige Verbindung zwischen der Diracschen und der Neumannschen Formulierung herzustellen. In der vorliegenden Arbeit wird nun versucht diese neuen Konzepte so zu beschreiben, daß sie auch demjenigen zugänglich sind, der keine spezialisierten mathematischen Vorkenntnisse hat. Ein zweites Anliegen ist es, detaillierte Regeln für die praktische Anwendung dieser Methoden auszuarbeiten, da sich die meisten Publikationen zu diesem Thema auf eher grundsätzliche Überlegungen beschränken. Die Arbeit ist jedoch nicht als rein mathematische Abhandlung geschrieben, sondern stellt das Gerüst einer Einführung in die Quantenmechanik dar, wie es z. B. als Grundlage für den Entwurf einer Vorlesung dienen könnte. Durch diese Struktur werden die neuen mathematischen Konzepte nicht nur vorgestellt, sondern es wird gleichzeitig gezeigt, wie sie sich bei der Formulierung der Quantenmechanik einsetzen lassen. Nur so ist es möglich zu beurteilen, welche Vor- und Nachteile sie in didaktischer Hinsicht gegenüber anderen Methoden haben. Um alle in dieser Arbeit angeführten Aussagen hinreichend zu begründen und um einen tieferen Einblick in die behandelte Materie zu ermöglichen, werden viele mathematische Details mit einer Ausführlichkeit behandelt, die für den Praktiker eher uninteressant ist. Doch auch nach Streichung dieser Details bleibt die Transparenz und die Korrektheit der mathematischen Struktur voll erhalten, wodurch es möglich wird, die Quantenmechanik gleichzeitig präzise und einfach zu formulieren, um sie — gerade für Studierende der Elektrotechnik — leichter zugänglich zu machen. Inhaltsverzeichnis Vorwort 1 Überblick über verschiedene Möglichkeiten bei der Formulierung der Quantenmechanik 7 Verwendete Symbole und Maßeinheiten 1 Mathematische Grundlagen 1.1 Maße und Integrale . . . . 1.2 Der Hilbertraum . . . . . 1.3 Lineare Operatoren . . . . 1.4 Transformationstheorie . . 11 . . . . 15 15 22 31 38 . . . . . . 45 45 51 55 59 60 71 3 Zusätzliche mathematische Konzepte 3.1 Das Spektrum der Observablen . . . . . . . . . . . . . . . . . . . . . 3.2 Funktionen von Observablen . . . . . . . . . . . . . . . . . . . . . . . 3.3 Die v. Neumann-Methode . . . . . . . . . . . . . . . . . . . . . . . . 75 75 80 84 2 Die 2.1 2.2 2.3 2.4 2.5 2.6 . . . . . . . . . . . . . . . . physikalischen Strukturen Zustände und Observablen . . . . Das Einteilchensystem ohne Spin Das Einteilchensystem mit Spin . Mehrteilchensysteme . . . . . . . Die Zeitentwicklung des Systems . Erwartungswerte und Unschärfe . . . . . . . . . . . . . . . . . . . . . 4 Entwicklung nach Eigenvektoren 4.1 Das Gelfandsche Raumtripel . . . . . 4.2 Die verallgemeinerten Eigenvektoren 4.3 Die Topologie von Φ . . . . . . . . . 4.4 Beispiel: Das Wasserstoffatom . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87 87 97 109 116 Literaturverzeichnis 123 Stichwortverzeichnis 125 5 6 Überblick über verschiedene Möglichkeiten bei der Formulierung der Quantenmechanik In diesem Kapitel werden die gebräuchlichsten Formulierungen der Quantenmechanik gegenübergestellt und mit jener Methode verglichen, die in der vorliegenden Arbeit beschrieben wird1 . Untersucht man eine Vielzahl von Lehrbüchern der Quantenmechanik, so sieht man, daß die meisten im Prinzip die Methode Diracs2 verwenden und somit folgende Grundstruktur aufweisen: i) Den Zuständen des quantenmechanischen Systems entsprechen Vektoren |f i eines Hilbertraumes IH. Den Meßgrößen entsprechen selbstadjungierte Operatoren in IH, die man Observablen nennt. ii) Zu jedem vollständigen Satz {A1 , A2 , . . . , An } kommutierender Observablen gibt es ein (bis auf Konstanten eindeutiges) gemeinsames System von Eigenvektoren {|ξλ i}λ∈Rn 3 . Für ein beliebiges |f i ∈ IH erhält man eine Funktion f (λ) = hξλ | f i indem man |f i mit den Eigenvektoren |ξλ i multipliziert (im Sinne einer Art Skalarprodukt). Obige Funktion f (λ) wird oft Spektraldarstellung von |f i (für den gegebenen Observablen-Satz) genannt. |f (λ)|2 ist die Wahrscheinlichkeitsdichte für die Observablen A1 , A2 , . . . , An und entspricht somit dem, was in Versuchen direkt meßbar ist. 1 Wir setzen dabei eine — zumindest grobe — Kenntnis der mathematischen Struktur der Quantenmechanik voraus, da die hier verwendeten Begriffe erst in späteren Kapiteln genauer definiert werden. 2 Siehe Dirac [9], 1930. 3 Wir schreiben λ für das Tupel (λ1 , λ2 , . . . , λn ). 7 8 Schrödingers Ortsdarstellung ist beispielsweise eine Spektraldarstellung für die Ortsobservablen; die Impulsdarstellung ist eine Spektraldarstellung für die Impulsobservablen. Bei der Beschreibung des Zustandes gebundener Elektronen im Atom verwendet man i. allg. die Energiedarstellung; das ist die Spektraldarstellung für die Observablen H, L2 , Lz (Quantenzahlen n, ℓ, m). Obiger Zusammenhang ist aber nur dann gegeben, wenn die Eigenvektoren |ξλ i in einem speziellen Raum Φ′ liegen, der umfangreicher ist, als der Hilbertraum IH. Meistens werden die Vektoren aus Φ′ und ihre Eigenschaften nur sehr ungenau und heuristisch charakterisiert, was die gesamte Beschreibung der Quantenmechanik nicht nur unbefriedigend, sondern auch schwierig und kompliziert macht. Seit Mitte der 60er Jahre ist man jedoch in der Lage, die Elemente aus Φ′ exakt zu beschreiben, und zwar als Distributionen im sogenannten Rigged Hilbert Space, den wir im Folgenden auch mit RHS bezeichnen werden. Neben dem Diracschen Formalismus wird auch eine andere Methode oft verwendet, die auf J. v. Neumann4 zurückgeht und von Anfang an (d. h. seit 1932) mathematisch exakt war. Punkt i) der Diracschen Methode gilt unverändert auch in der v. Neumann-Methode und wurde sogar dort erstmals explizit in obiger Form formuliert. Bei der Berechnung der Wahrscheinlichkeiten wird dann aber anders vorgegangen: Für einen Satz kommutierender Observablen {A1 , A2 , . . . , An } gibt es einen eindeutigen Satz von Spektralscharen5 {E1 , E2 , . . . , En }, sodaß hf |(E1 (∆1 ) · E2 (∆2 ) · · · En (∆n ))| f i hf | f i die Wahrscheinlichkeit dafür ist, daß die Meßergebnisse für die Observablen Ai in den Intervallen ∆i ⊆ R liegen. Die Ei sind hierbei operatorwertige Funktionen, die den Intervallen ∆i ⊆ R Projektionsoperatoren Ei (∆i ) zuordnen. Diese Methode eignet sich wegen ihrer Exaktheit hervorragend für theoretische Analysen (z. B. in Fragen der Axiomatik oder des Meßproblems), spielt aber in praktisch orientierten Lehrbüchern eine eher untergeordnete Rolle. Das liegt zum Teil an der großen Abstraktheit dieses Konzeptes, da die physikalische Interpretation der Spektralscharen wesentlich weniger anschaulich ist, als jene der Diracschen Eigenvektoren, die man als ‘idealisierte Zustände’ auffassen kann. Der Hauptgrund für die so häufige Bevorzugung der Diracschen Methode dürfte aber darin liegen, daß den Spektralscharen in konkreten praktischen Berechnungen keine zentrale Bedeutung zukommt, da sie i. allg. erst nach Lösung des Eigenwertproblems ermittelt werden können. Bei solchen Berechnungen ist man somit automatisch gezwungen, sich an die Diracsche Methode zu halten; eine nachträgliche Übersetzung in den v. Neumann-Formalismus ist dann eine — keineswegs einfache — ‘Fleißaufgabe’, die von Praktikern i. allg. natürlich weggelassen wird. In der vorliegenden Arbeit werden weder die Eigenvektoren (Dirac-Methode), noch die Spektralscharen (v. Neumann-Methode) in den Mittelpunkt gestellt: als 4 5 Siehe J. v. Neumann [30], 1932. Unterscheide zwischen Spektralschar und Spektraldarstellung. 9 zentralen Begriff verwenden wir jenen der Spektraldarstellung; diese werden wir direkt definieren (als jene Darstellung von IH in der die betreffenden Observablen ‘diagonalisiert’ sind), und nicht erst über den Umweg der Eigenvektoren, wie dies in der Diracschen Methode gemacht wird. Natürlich benötigen wir die Eigenvektoren nach wie vor zur praktischen Berechnung der Spektraldarstellung, nicht aber zur Definition und grundlegenden Charakterisierung dieses Begriffes. Denn der so einfache und elegante Begriff der Spektraldarstellung ist von zentraler physikalischer Bedeutung und benötigt für seine Definition weder Eigenvektoren noch Spektralscharen. Dadurch erscheint es — vom didaktischen Standpunkt aus gesehen — ungünstig, die Spektraldarstellung als lediglich abgeleitetes Konzept einzuführen, das auf so komplizierte Dinge aufbaut, wie es die Eigenvektoren der Qunantenmechanik nun mal sind. Neben diesem didaktischen Argument gibt es aber noch grundlegendere Begründungen für obige Strategie: die Entwicklung nach Eigenvektoren ist in der Literatur keineswegs einheitlich; abgesehen von den heuristischen Formulierungen gibt es eine ganze Palette von RHS-Methoden, von denen aber keine wirklich befriedigend ist, da es bis heute kein einfaches und allgemeingültiges Kriterium gibt, das es gestattet die ‘physikalisch sinnvollen’ von den ‘unphysikalischen’ Eigenvektoren zu unterscheiden. So findet man beispielsweise beim Wasserstoffatom für alle positiven Energie-Werte je zwei Eigenvektoren6 , die beide recht ‘vernünftig’ aussehen, da beide ein einigermaßen ‘vertrauenerweckendes’ Wachstumsverhalten aufweisen; tatsächlich ist aber nur ein Lösungszweig ‘richtig’ und der andere Lösungszweig muß verworfen werden (Genaueres hierzu im Abschnitt 4.4). Da in solchen Fällen zunächst nicht klar ist, welche die ‘richtigen’ Eigenvektoren sind, kann es nicht sinnvoll sein, den Spektraldarstellungs-Begriff mit Hilfe der Eigenvektoren definieren zu wollen. Erst durch die direkte Definition der Spektraldarstellung ist das mathematische Problem überhaupt eindeutig definiert, und erst dann ist es (zumindest im Prinzip) möglich, zu sagen, welche Eigenvektoren ‘richtig’ sind und welche nicht. Die Idee, den Begriff der Spektraldarstellung (an Stelle von Eigenvektoren oder Spektralscharen) in den Mittelpunkt der Theorie zu stellen, ist keineswegs neu und wurde in der bekannten Arbeit von Jauch und Misra [21],1965, auf eine exakte mathematische Basis gestellt. Die Ergebnisse dieser Arbeit waren sehr elegant und hatten nur in einem einzigen Punkt eine etwas unangenehme Komplikation in Form einer Zusatzbedingung. Später wurde aber in einem Artikel von de Dormale und Gautrin [11],1975, gezeigt, daß diese Zusatzbedingung unnötig ist, wobei im Gegensatz zu [21] sogar der Fall von überabzählbar vielen Observablen untersucht wurde7 . Erst durch die Anwendung dieser Ergebnisse wird es möglich, die Quantenmechanik so zu formulieren, wie dies in der vorliegenden Arbeit gemacht wird. 6 Genauer: Die Eigenwertgleichungen H |ξi 2 L |ξi Lz |ξi = E |ξi = ℓ (ℓ + 1) |ξi = m |ξi haben für jedes E > 0 (und für festes ℓ und m) je 2 linear unabhängige Lösungen |ξ1 i und |ξ2 i. 7 Der Fall endlich vieler Observablen wurde bereits von Prugovečki hinreichend untersucht 10 Im Folgenden wollen wir noch etwas genauer auf den RHS eingehen: Die bekannteste (und auch in dieser Arbeit verwendete) RHS-Formulierung der Quantenmechanik geht auf Roberts zurück (siehe [37],1966, [38],1966)8 . Sie beruht auf dem mathematischen Konzept des Gelfandschen Raumtripels9 , bei dem drei in einander verschachtelte Räume betrachtet werden: Φ ⊆ IH ⊆ Φ′ . Φ ist ein Teilraum von IH mit einer sogenannten nuklearen Topologie; Φ′ ist der zu Φ duale Raum (das ist der Raum der linear stetigen Funktionale über Φ). In Φ′ hat man zwar alle Elemente, die für eine Entwicklung nach Eigenvektoren benötigt werden, kann aber kein überall definiertes Skalarprodukt einführen (Φ′ ist kein Hilbertraum). Für ein allgemeines Element aus Φ′ existiert eine Art Skalarprodukt nur mit den Elementen aus Φ , d. h. nur die Elemente aus Φ können mit allen Elementen aus Φ′ multipliziert werden. Dies legt es nahe, den Raum Φ (an Stelle von IH ) als den Raum der physikalisch realisierbaren Zustände anzusehen. Diese Auffassung, die besonders von A. Bohm ([6],1978; [7],1986; [8],1989) vertreten wird, läßt sich physikalisch sehr gut begründen und hat den großen Vorteil, daß in Φ alle betrachteten Observablen stetig und überall definiert sind. Ein gewichtiger Nachteil dieser Interpretation ist dagegen die fehlende Kompatibilität zu den sonst üblichen Formulierungen der Quantenmechanik, in denen ganz IH als Raum der Zustandsvektoren aufgefaßt wird. Der wirkliche Schwachpunkt obiger Interpretation liegt aber in der fehlenden Allgemeingültigkeit: es muß nämlich vorausgesetzt werden, daß alle benötigten Observablen den Raum Φ invariant lassen (d. h. Φ in Φ abbilden) und zusätzlich in Φ wesentlich selbstadjungiert sind. Diese Bedingung ist schwer nachzuprüfen und ist, selbst bei sehr einfachen Systemen, keineswegs immer erfüllbar. Außerdem ist diese Bedingung sonst von keiner großen praktischen oder theoretischen Bedeutung, wodurch es zu einer reinen Zeitverschwendung wird, sie nachprüfen zu wollen. Aus diesem Grund werden wir in der vorliegenden Arbeit den Raum IH (und nicht den Raum Φ) als Raum der physikalisch realisierbaren Zustände interpretieren. Φ muß dann nicht mehr eindeutig sein, und kann somit für jeden Satz kommutierender Observablen neu gewählt werden (Die Existenz von Φ ist dann garantiert). Auch die Bedingung der wesentlichen Selbstadjungiertheit auf Φ kann fallengelassen werden. Abschließend erwähnen wir noch, daß das Gelfandsche Raumtripel keineswegs die einzige Möglichkeit ist, eine Erweiterung des Hilbertraumes vorzunehmen. Interessante Alternativen wurden unter anderem von Babbitt [4],1972, oder van Eijndhoven/ de Graaf [13],1985, vorgeschlagen; die dort beschriebenen Methoden sind jener des Gelfandschen Raumtripels in verschiedener Hinsicht überlegen, sind letztlich aber deutlich komplizierter und hängen teilweise von recht scharfen Bedingungen ab. (siehe [33],1969, [34],1971). 8 Diese Methode wurde auch in einer ganzen Reihe späterer Publikationen beschrieben, so z. B. in Antoine[1],1969. Melsheimer[27],1974, [28],1974. A. Bohm[6], 1978. Diese Arbeiten beinhalten aber — gegenüber den beiden Veröffentlichungen von Roberts — kaum Neues. 9 Siehe Gelfand/Wilenkin [17], 1964. VERWENDETE SYMBOLE UND MAßEINHEITEN LISTE DER SYMBOLE, DIE ALS BEKANNT VORAUSGESETZT WERDEN A⊆B A ist Teilmenge von B (Sind A und B Operatoren, so bedeutet A ⊆ B, daß B eine Erweiterung von A ist; siehe Seite 31) A⊂B A ist Teilmenge von B, aber A 6= B A\B Menge der Elemente, die in A sind, nicht aber in B Z Menge der ganzen Zahlen N Menge der natürlichen Zahlen, also N = {1, 2, 3, . . .} R Menge der reellen Zahlen C Menge der komplexen Zahlen √ Imaginäre Einheit, d. h. j = −1 j a Komplex Konjugiertes zur Zahl a ∈ C (Ist K eine Menge, so bezeichnet K die Abschließung dieser Menge, siehe Seite 24) {xi }i∈I Menge von Elementen xi mit i ∈ I ( I eine beliebige Indexmenge) {xi }∞ i=1 Wie oben,wobei aber präzisiert wird, daß die Indexmenge I gleich der Menge der natürlichen Zahlen ist ∀i ∈ I : Ai Für alle i ∈ I gilt Aussage Ai ∃i ∈ I : Ai Es gibt ein i ∈ I für das die Aussage Ai gilt a := b a ist per definitionem gleich b A :⇔ B Aussage A gilt definitionsgemäß genau dann, wenn Aussage B gilt [a, b] Abgeschlossenes Intervall ]a, b[ n Q bi Offenes Intervall i=1 b1 · b2 · b3 · · · bn 11 12 a, b, c ∈ M Die 3 Elemente a, b, c liegen in der Menge M ∅ Leere Menge (a, b, c) ∈ M Das Element (a, b, c) liegt in M ak → a Ist gleichbedeutend mit lim ak = a A :D → B a 7→ b Abbildung von D in B a ∈ D wird auf b ∈ B abgebildet f −1 (K) Menge aller x aus dem Definitionsbereich von f , mit f (x) ∈ K f (x) A×B k→∞ Dieses Symbol bezeichnet einerseits die Funktion selbst, andererseits aber den Zahlenwert, den die Funktion für ein festes x annimmt. Bei Verwechslungsgefahr schreiben wir (f (x))x für die 1. Bedeutung, und f (x)|x für die 2. Bedeutung. Ist K eine Menge, so bezeichnet f (K) die Menge aller y, für die es ein x ∈ K gibt, das y = f (x) erfüllt. Menge aller geordneten Paare (a, b) mit a ∈ A, b ∈ B {a ∈ A|P (a) } Menge aller a ∈ A, die die Bedingung P (a) erfüllen 13 LISTE DER SYMBOLE, DIE IM TEXT EXPLIZIT DEFINIERT WERDEN Rn siehe Seite 15 RI siehe Seite 15 λ |ψi hψ| siehe Seite 37 IH siehe Seite 46 siehe Seite 15 1 ∂ j i siehe Seite 51 (λi )i∈I siehe Seite 15 St siehe Seite 52 πi (λ) siehe Seite 15 F siehe Seite 53 A ⊆ RI siehe Seite 16 s siehe Seite 55 µℓ siehe Seite 18 σ, σz siehe Seite 55 µℓ0 siehe Seite 18 △ siehe Seite 60 a.e. siehe Seite 19 Σf (λ) siehe Seite 21 O siehe Seite 22 m R L2 RI , µ K siehe Seite 23 siehe Seite 24 C0∞ (Ω) siehe Seite 25 S(Rn ) siehe Seite 25 hf | gi siehe Seite 26 fk −→ f H siehe Seite 27 |f i siehe Seiten 30/46 A ⊆  siehe Seite 31 H- lim fk siehe Seite 27 hg| A |f i siehe Seite 31 A siehe Seite 32 s.a. siehe Seite 34 e.s.a. siehe Seite 34 −1 hAi siehe Seite 71 ∆A siehe Seite 71 [A, B] siehe Seite 73 Ut0 t siehe Seite 63 supp µ siehe Seite 75 spec A siehe Seite 77 E∆ siehe Seite 84 Prod0 {Bk }k∈K siehe Seite 88 ErAlg {Bk }k∈K siehe Seite 88 Alg0 {Bk }k∈K siehe Seite 88 Φ, Φ∗ siehe Seite 92 HW siehe Seite 94 Φ′R siehe Seite 110 Φ′ siehe Seite 114 Yℓ,m (φ, ϑ) siehe Seite 118 14 Maßeinheiten In der gesamten Arbeit wird das sogenannte rationale Maßeinheitensystem verwendet, bei dem µ 0 = ε 0 = c0 = ~ = 1 ist ( c0 = Vakuumlichtgeschwindigkeit, ε0 = Vakuumdielekrizitätskonstante, h ). µ0 = ε01c2 , ~ = 2π 0 Numerische Ergebnisse lassen sich mit folgender Tabelle sehr schnell in SIEinheiten umrechnen: Größe rationale Maßeinheit Zeit 1e s Länge 1m e (= e s) Masse Stromstärke Energie El.Ladung El.Spannung Kraft E-Feld B-Feld H-Feld ∗ = 1s ∗∗ f (= se−1 ) 1Kg e (= e 1A s−1 ) 1Je (= e s−1 ) e (= 1) 1C 1Ve (= se−1 ) e (= se−2 ) 1N e V 1m e−2 ) e (= s 1Te (= se−2 ) e ∗ A 1m e−2 ) e (= s = 2.99792458 · 108 m =r m = = Kg = 1.173388176 · 10−51 Kg prk A = 5.290860041 · 10−19 A k r2 √ f e = 1 Kges2m =k J √ es = prk C = 1Ae q e k = 1 CJe = pr V 2 f e = 1 Kgse2m = kr N q V = prk3 m q Ve se k = 1m = T e2 pr 5 q A = pk r m = 1.0545887 · 10−34 J = 5.290860041 · 10−19 C = 1.993227362 · 10−16 V = 3.517729255 · 10−43 N V = 6.648690814 · 10−25 m = 2.217764536 · 10−33 T A = 1.764840942 · 10−27 m Wir verwenden folgende Abkürzungen: r = 2.99792458 · 108 , k = 1.0545887 · 10−34 , 2 (Es ist somit c0 = r m ~ = k Js, ε0 = p NCm2 ). s , p = 8.854187818 · 10−12 ∗∗ Man nennt diese Längeneinheit auch ‘Lichtsekunde’. Das ist die Länge jener Strecke, die das Licht in einer Sekunde zurücklegt. Seit 1983 wird das ‘Meter’ genau auf die hier beschriebene Art und Weise definiert: 1m ist definitionsgemäß die Länge jener Strecke, die das −1 Licht in 2.99792458 · 108 Sekunden zurücklegt. Durch die Anwendung dieses Einheitensystems werden viele Ausdrucke einfacher und durchsichtiger. Das führt unter anderem zu großen didaktischen Vorteilen, da der physikalische Inhalt vieler Gleichungen wesentlich besser zu erkennen ist, wenn man diese Gleichungen vom unnötigen Ballast der physikalischen Konstanten befreit. Kapitel 1 Mathematische Grundlagen 1.1 Maße und Integrale 1.1.1 1 Die Menge RI R ist die Menge der reellen Zahlen; R2 die Menge der (geordneten) Zahlenpaare (λ1 , λ2 ), mit λ1 ∈ R, λ2 ∈ R. Allgemeiner ist Rn := {(λ1 , λ2 , . . . , λn ) |λ1 ∈ R, λ2 ∈ R, . . . , λn ∈ R} , n = 1, 2, 3, . . . . Wir verwenden ferner die Notationen λ = (λ1 , λ2 , . . . , λn) = (λi)n i=1 und λi = πi(λ). Manchmal werden wir obiges Rn auch in der Form RI mit I = {1, 2, . . . , n} schreiben, da die meisten Ergebnisse für beliebige Indexmengen I gelten, selbst dann, wenn I unendlich ist. Wir definieren somit: RI := {λ |∀i ∈ I : λi ∈ R} (Jedes λ = (λi )i∈I ∈ RI hat für jedes i ∈ I eine Komponente λi = πi (λ). In diesem Sinne ist λ eine I → R - Funktion). Im Bereich der nichtrelativistischen Quantenmechanik ist I normalerweise eine endliche Menge I = {1, 2, 3, . . . , n}. RI und Rn drücken dann dasselbe aus. Für die folgenden Überlegungen ist es günstig, sich unter RI das einfache Beispiel R2 vorzustellen, das — geometrisch gesehen — mit einer ganz gewöhnlichen (2-dimensionalen) Ebene identifiziert werden kann. 1.1.2 Maße auf RI Ein Maß µ auf RI ordnet bestimmten Teilmengen A ⊆ RI eine nichtnegative Zahl µ(A) zu (Es ist auch µ(A) = ∞ mglich). Ist z. B. RI = R2 , so kann man ein Maß 1 Eine detailliertere Beschreibung der Maß- und Integrations-Theorie findet man z. B. in Henze [20] oder Prugovečki [34]. 15 16 KAPITEL 1. MATHEMATISCHE GRUNDLAGEN µ derart definieren, daß es den Teilmengen von R2 ihren Flächeninhalt zugeordnet (siehe Abbildung 1.1). O 8 A5 7 µ(A1 ) µ(A2 ) µ(A3 ) µ(A4 ) µ(A5 ) = = = = = 1 2 0 0 ∞ 6 5 A2 4 A3 3 2 -3 -2 -1 A4 A1 1 1 2 3 4 5 6 7 8 9 10 11 O -2 Abbildung 1.1 Maß µ auf R2 mit µ(A) = Flächeninhalt der Teilmenge A. Das Maß muß nicht für alle Teilmengen definiert sein, sondern nur für die sogenannten meßbaren Mengen. Welche Mengen meßbar sind, ist im wesentlichen Definitionssache. Wir werden genau jene Teilmengen von RI als meßbar bezeichnen, die sich nach folgenden Kriterien konstruieren lassen2 : 1. Ist K ein beliebiges (offenes,abgeschlossenes, oder halboffenes) Intervall in R, so ist die Menge πi−1 (K) := λ ∈ RI |πi (λ) ∈ K} meßbar. 2. Ist A ⊆ RI meßbar, so ist auch RI \ A meßbar. 3. S Sind die Mengen Ak ∈ RI meßbar (k = 1, 2, 3, . . .), so sind auch ∞ k=1 Ak meßbar. T∞ k=1 Ak und 4. RI und ∅ (=leere Menge) sind meßbar. So ist z. B. A5 aus Abbildung 1.1 meßbar, weil A5 = π2−1 (K) mit K = [6, 7]. A1 ist meßbar, weil A1 = π1−1 ([1, 2]) ∩ π2−1 ([2, 3]). A2 ist meßbar, weil es sich als Vereinigung einer unendlichen Folge von immer kleiner werdenden Quadraten darstellen läßt. Obige Kriterien haben wir nur aus Gründen der mathematischen Vollständigkeit angeführt. Für das Verständnis dieser Arbeit reicht es aber aus, zur Kenntnis zu nehmen, daß wir praktisch alle ‘einigermaßen vernünftigen’ Mengen als meßbar bezeichnen (D. h. es ist kaum möglich, bei irgendwelchen physikalischen Fragestellungen auf Mengen zu stoßen, die nicht in obigem Sinne meßbar sind). Wir führen noch folgende Notation ein: m A ⊆ RI bedeutet, daß A eine meßbare Teilmenge von RI ist. 2 Für endliches oder abzählbares I definieren die hier angegebenen 4 Punkte genau die sogenannten Borel Mengen. In R2 sind das genau jene Mengen, die einen anschaulich definierten Flächeninhalt haben, insbesondere also alle Mengen aus Abbildung 1.1. 17 1.1. MASSE UND INTEGRALE Definition 1.1 Ein Maß µ auf RI ordnet jeder meßbaren Menge A ⊆ RI eine nichtnegative Zahl µ(A) zu, wobei auch µ(A) = ∞ möglich ist. Diese Zuordnung muß σ-additiv sein, d. h. es muß ! ∞ ∞ [ X µ Ak = µ(Ak ) wenn Ai ∩ Aj = ∅ für i 6= j k=1 (Bei meßbaren Ak ist k=1 ∞ S Ak ebenfalls meßbar, wie sich aus Punkt 3 von Seite 16 k=1 ergibt). In Abbildung 1.1 bedeutet dies z. B.: B1 := A1 ∪ A2 ∪ A3 B2 := A1 ∪ A5 folgt µ(B1 ) = 1 + 2 + 0 = 3 µ(B2 ) = 1 + ∞ = ∞. aus In diesem Zusammenhang muß vor folgendem Fehlschluß gewarnt werden: In dem zu Abbildung 1.1 definierten Maß wird einem einzelnen Punkt stets das Maß 0 zugeordnet (z. B. µ(A4 ) = 0). Nun setzt sich aber A1 (oder auch jede andere Teilmenge von R2 ) aus einzelnen Punkten zusammen. Da alle diese Punkte das Maß 0 haben, müßte µ(A1 ) = 0 sein. Der Fehler in dieser Überlegung ist der, außer acht zu lassen, daß die σ-Additivität nur für höchstens abzählbar viele Mengen gilt, während A1 aus überabzählbar vielen Einzelpunkten besteht. Wir erinnern den Leser daran, daß eine unendliche Menge abzählbar heißt, wenn ihre Elemente durchgezählt werden können, d. h. umkehrbar eindeutig den natürlichen Zahlen zugeordnet werden können. Die Menge der natürlichen Zahlen ist somit abzählbar. Doch auch die Menge der ganzen Zahlen ist abzählbar, da sich auch die ganzen Zahlen aufzählen lassen: 0, 1, −1, 2, −2, 3, −3, 4, −4, . . . Die Menge der reellen Zahlen ist dagegen nicht abzählbar, wie sich zeigen läßt. Man nennt solche Mengen überabzählbar. Eine Folge hat höchstens abzählbar viele Glieder; eine Reihe hat höchstens abzählbar viele Summanden. Definition 1.2 Ein Maß µ auf RI wird finit genannt, wenn µ RI < ∞. Das Maß wird σ-finit genannt, wenn es eine Folge meßbarer Mengen Fk gibt, mit µ(Fk ) < ∞, ∞ [ k=1 Fk = RI . (1.1) 18 KAPITEL 1. MATHEMATISCHE GRUNDLAGEN Das in Abbildung 1.1 definierte Maß ist zwar nicht finit, immerhin aber σ-finit. 2 Denn mit Fk = (λS |λ1 | < k, |λ2 | < k} ist 1 , λ2 ) ∈ R ∞ 2 µ(Fk ) = 4k 2 und F = R k=1 k Wir werden im Folgenden ausschließlich σ-finite Maße betrachten, auch dann, wenn wir das nicht immer explizit erwähnen. Ergänzung: Ein σ-finites Maß µ kann stets in ein äquivalentes finites Maß µ′ übergeführt werden: setzt man (1.1) voraus, so ist µ′ mit µ′ (A) = ∞ X 1 µ(A ∩ Fk ) 2k µ(Fk ) k=1 I m A ⊆ RI ein Maß mit µ′ R = 1. Die Maße µ und µ′ haben dieselben Nullmengen und werden deshalb als äquivalent bezeichnet (Für die Definition des Begriffs Nullmenge siehe Abschnitt 1.1.4). Viele Sätze, die für finite Maße gelten, können somit auch auf σ-finite Maße angewendet werden können. 1.1.3 Wichtige Maße Das Lebesgue-Maß auf R2 ist genau jenes Maß, das in Abbildung 1.1 vorgestellt wurde: es ordnet den meßbaren Mengen ihren Flächeninhalt als Maß zu. In R ist das Lebesgue-Maß so definiert, daß es die Länge angibt, d. h. es ist z. B. µ([5, 7]) = µ(]5, 7[) = 2. In R3 gibt das Lebesgue Maß dem Rauminhalt der betreffenden Teilmenge an. Analoges gilt in Rn : der n-dimensionale Würfel Wn = {λ ∈ Rn | ai ≤ xi ≤ bi , i = 1, 2, . . . , n} Q hat das Lebesgue-Maß ni=1 (bi − ai ); das Lebesgue-Maß für alle anderen meßbaren Mengen in Rn ergibt sich dann mit Hilfe der σ-Additivität. Besonders interessant ist der Fall eines Maßes µ, das auf einer (meßbaren) Teilmenge B ⊆ Rn dem Lebesgue-Maß entspricht, und auf Rn \ B stets 0 ist, d. h. es ist µ(A) = 0 für alle meßbaren A ⊆ Rn \ B. Nimmt man für B die kleinste abgeschlossene Menge, die dies leistet, so nennt man B den Träger des Maßes µ. Wir nennen ein solches Maß eingeschränktes Lebesgue-Maß3 und bezeichnen es mit µℓ0 . Das Lebesgue-Maß selbst bezeichnen wir mit µℓ. Bisher haben wir nur Maße betrachtet, die einzelnen Punkten immer das Maß 0 zuordnen. In der Quantenmechanik kommen aber auch solche Maße vor, die einzelnen Punkten ein von 0 verschiedenes Maß zuordnen. Wir wollen solche Punkte 3 Der hier eingeführte Begriff des eingeschränkten Lebesgue-Maßes ist ein Spezialfall von dem, was in der Literatur als absolut stetiges Maß (bezüglich des Lebesgue-Maßes) bezeichnet wird. Da man in der Quantenmechanik an Stelle eines beliebigen absolut stetigen Maßes (bez. LebesgueMaß) immer ein ‘äquivalentes’ eingeschränktes Lebesgue-Maß verwenden kann, beschränken wir uns auf die eingeschränkten Lebesgue-Maße. 19 1.1. MASSE UND INTEGRALE Sprungpunkte des Maßes nennen (Im Englischen auch ‘pure points’ genannt)4 . D. h. λ ∈ Rn ist ein Sprungpunkt des Maßes µ, wenn µ({λ}) > 0 ist. (Da wir nur σ-finite Maße µ betrachten, kann es höchstens abzählbar viele Sprungpunkte geben). Ein Maß µ wird reines Punktmaß genannt, wenn es nur aus Sprungpunkten besteht, wenn also für jedes meßbare A ⊆ Rn µ(A) = X µ({λ}) , λ∈A∩P P = Menge der Sprungpunkte . A ∩ P = Menge der Sprungpunkte in A Die in physikalischen Aufgabenstellungen der Quantenmechanik vorkommenden Maße haben im allgemeinen folgende Struktur: µ = µp + µℓ0 , wobei µp ein reines Punktmaß ist, und µℓ0 ein eingeschränktes Lebesgue-Maß (Die Summe ist so zu verstehen, daß µ(A) = µp (A) + µℓ0 (A) für alle meßbaren A). 1.1.4 Nullmengen, Funktionsklassen Definition 1.3 Sei µ ein Maß auf RI . Eine meßbare Menge A ⊆ RI wird Nullmenge genannt (oder Menge vom Maße 0), wenn µ(A) = 0 ist. Gilt eine Eigenschaft für alle Punkte aus RI mit Ausnahme der Punkte einer Nullmenge, so sagt man, diese Eigenschaft gelte ‘fast überall’ (englisch: almost everywhere). Wir kürzen dies mit den Buchstaben a.e. ab. Sind z. B. f1 (λ) , f2 (λ) zwei RI → RI - Funktionen, so bedeutet f1 (λ) = f2 (λ) a.e., daß die Punkte λ ∈ RI , für die f1 (λ) 6= f2 (λ) gilt, in einer Nullmenge liegen. In der Quantenmechanik beschreiben Funktionen, die a.e. gleich sind, den selben physikalischen Zustand und sind in diesem Sinne äquivalent. Man faßt daher solche äquivalenten Funktionen in sogenannte Funktionsklassen zusammen. 1.1.5 Integrale 5 Sei f (λ) eine RI → [0, ∞[ - Funktion und µ ein Maß auf RI . Ist [a, b] ein beliebiges Intervall in R, so ist f −1 ([a, b]) := λ ∈ RI f (λ) ∈ [a, b]} eine Teilmenge von RI (In Abbildung 1.2 ist beispielsweise f −1 ([a2 , a3 ]) auf der Abszissenachse fett eingezeichnet (in diesem Beispiel ist RI = R und somit λ = λ ∈ R)). 4 Die Bezeichnung ‘Sprungpunkt’ ergibt sich daraus, daß µ(A) ‘springt’, wenn man die Menge A um einen Sprungpunkt erweitert. 5 In diesem Abschnitt wird der Begriff des Lebesgue-Integrals in sehr groben Zügen erklärt. Für physikalische Anwendungen reicht diese grobe Erklärung bei weitem aus. Detailliertere Beschreibungen findet der Leser z. B. in Prugovečki [34], Henze [20], oder Großmann [18]. 20 KAPITEL 1. MATHEMATISCHE GRUNDLAGEN f (O) a7 a6 a5 a4 a3 a2 a1 O Abbildung 1.2 Von der Funktion f (λ) wollen wir voraussetzen, daß für alle Intervalle L ⊆ R die Menge f −1 (L) meßbar ist. Die Funktion f (λ) wird dann meßbar genannt 6 . Für eine beliebige Unterteilung der Ordinatenachse in Intervalle [ai , ai+1 [ (siehe Abbildung 1.2) kann man dann folgende Summe bilden: X i ai · µ f −1 ([ai , ai+1 [) . Macht man die Intervalleinteilung der Ordinatenachse immer feiner, so nähert sich obige Summe einem Grenzwert (der auch ∞ sein kann). Diesen Grenzwert nennt man Lebesgue-Integral und bezeichnet ihn mit Z Z f (λ) dµ(λ) oder f (λ) dµ(λ) . λ Man kann auch über einen (meßbaren) Teilbereich B ⊆ RI integrieren (Hierzu setzt man einfach f (λ) = 0 für λ ∈ RI \ B). Wir schreiben dann Z Z f (λ) dµ(λ) . f (λ) dµ(λ) oder B λ∈B Bei λ = λ ∈ R und µ = µℓ verwenden wir auch die Notation Zb a 6 f (λ) dλ := Z f (λ) dµℓ (λ) . λ∈[a,b] Alle stetigen Funktionen, aber auch alle ‘einigermaßen vernünftigen’ unstetigen Funktionen, sind meßbar. Bei physikalischen Anwendungen hat man es somit immer mit meßbaren Funktionen zu tun. 21 1.1. MASSE UND INTEGRALE Bisher haben wir von der Funktion f (λ) vorausgesetzt, daß sie reell und nichtnegativ ist. Für allgemeines komplexwertiges f (λ) gibt es eine Zerlegung f (λ) = f1 (λ) − f2 (λ) + jf3 (λ) − jf4 (λ) mit reellen nichtnegativen Funktionen f1 , f2 , f3 , f4 . Es ist dann Z Z Z Z Z f (λ) dµ(λ) := f1 (λ) dµ(λ) − f2 (λ) dµ(λ) + j f3 (λ) dµ(λ) − j f4 (λ) dµ(λ) (f ist definitionsgemäß genau dann meßbar, wenn es die Funktionen f1 , f2 , f3 , f4 sind). Das Maß µ kann natürlich beliebig sein; besonders interessant ist aber der bereits oben erwähnte Fall µ = µp + µℓ0 mit µp als reines Punktmaß und µℓ0 als eingeschränktes Lebesgue-Maß. Wenn P die Menge der Sprungpunkte ist und alle Sprungpunkte das Maß 1 haben, gilt Z Z X f (λ) dµ(λ) = f (λ) + f (λ) dµℓ0(λ) . (1.2) λ∈P Dieser Fall ist so charakteristisch für die Quantenmechanik, daß einige Autoren für obigen Ausdruck ein eigenes Symbol verwenden, nämlich Z X f (λ) . Das auf der rechten Seite von (1.2) stehende Integral entspricht in der Praxis dem — aus der elementaren Analysis bekannten — Riemann-Integral. Genaugenommen bleibt noch ein kleiner Unterschied zum Riemann-Integral bestehen: bei der Definition des Riemann-Integrals geht man von einer gleichmäßigen Zerlegung der Abszisse (oder allgemeiner: des Definitionsbereiches RI ) aus, während wir bei der Definition des Lebesgue-Integrals von einer gleichmäßigen Zerlegung der Ordinate ausgegangen sind. Dieser feine Unterschied führt dazu, daß das Lebesgue-Integral für einige (stark unstetige) Funktionen noch existiert, für die das Riemann-Integral nicht mehr definiert ist. Dies hat zwar große theoretische Vorteile, ist aber für die Praxis bedeutungslos, da für die dort auftretenden Funktionen das Riemann-Integral existiert und mit dem Lebesgue-Integral übereinstimmt. 22 KAPITEL 1. MATHEMATISCHE GRUNDLAGEN 1.2 Der Hilbertraum 1.2.1 Lineare Räume Definition 1.4 Ein Vektorraum oder Linearer Raum ist eine Menge E, in der folgende Strukturen definiert sind: • Für je 2 Elemente f, g ∈ E ist eine Summe f + g ∈ E definiert, die folgende Eigenschaften hat: ⊲ f + g = g + f , für alle f, g ∈ E (Kommutativgesetz) ⊲ (f + g) + h = f + (g + h), für alle f, g, h ∈ E (Assoziativgesetz) ⊲ Es gibt einen Nullvektor O in E, sodaß O + f = f für alle f ∈ E 7 ⊲ Zu jedem f ∈ E gibt es ein Inverses −f ∈ E, sodaß f + (−f ) = O • Für alle f ∈ E, α ∈ C ist eine Multiplikation αf ∈ E definiert, die folgende Eigenschaften hat8 : α ∈ C, ⊲ α (f + g) = αf + αg, ⊲ (α + β) f = αf + βf, ⊲ α (βf ) = (αβ) f, ⊲ 1f = f, α, β ∈ C, α, β ∈ C, f ∈E f, g ∈ E f ∈E f ∈E Die Elemente des Vektorraumes heißen Vektoren. Weitere Eigenschaften, wie etwa (−1) f = −f 0f = O αO = O lassen sich sofort herleiten. Beispiel 1.1 Wir betrachten den Raum C3 . Seine Elemente sind Zahlentripel a1 a 2 ∈ C3 . a3 7 Die Addition ist definiert durch a1 b1 a1 + b 1 a2 + b 2 = a2 + b 2 . a3 b3 a3 + b 3 Wir verwenden für den Nullvektor das Symbol O, um es von der Zahl 0 zu unterscheiden. An Stelle von C kann im Prinzip auch jeder andere Körper (z. B. R) genommen werden. Wir betrachten hier aber ausschließlich komplexe Vektorräume. 8 23 1.2. DER HILBERTRAUM Die Multiplikation mit einer Konstanten α ∈ C ist definiert durch a1 αa1 α a2 = αa2 . a3 αa3 Man kann leicht nachprüfen, daß alle Bedingungen aus Definition 1.4 erfüllt sind. Grob gesprochen ist ein Vektorraum ein Raum in dem Linearkombinationen αf + βg gebildet werden können. Eine Teilmenge D ⊆ E eines Vektorraumes E ist genau dann wieder ein Vektorraum, wenn alle Linearkombinationen aus D wieder in D liegen, d. h. ∀f, g ∈ D; α, β ∈ C : αf + βg ∈ D. Wir nennen ein solches D einen linearen Teilraum von E. 1.2.2 Der Raum L2 RI , µ Definition 1.5 Eine meßbare Funktion f : RI → C heißt (bez. des Maßes µ) quadratintegrabel oder quadratsummabel, wenn Z |f (λ)|2 dµ(λ) < ∞. Wie bereits früher erwähnt, nennen wir 2 Funktionen f (λ) , g(λ) äquivalent (bez. des Maßes µ), wenn f (λ) = g(λ) a.e.. Definition 1.6 Mit L2 (RI , µ) bezeichnen wir die Menge der quadratintegrablen RI → C - Funktionen, wobei aber zwei äquivalente Funktionen ein und dasselbe EleI ment aus L2 R , µ darstellen. Genaugenommen sind die Elemente aus L2 RI , µ keine Funktionen, sondern Funktionsklassen äquivalenter Funktionen. Dieser Raum steht in der Quantenmechanik im Mittelpunkt aller Berechnungen, da die Zustände eines quantenmechanischen Systems durch quadratintegrable Funktionen dargestellt werden. Seien f (λ) , g(λ) ∈ L2 RI , µ , und α, β ∈ C. Man sieht leicht, daß dann auch die Linearkombination h(λ) := αf (λ) + βg(λ) (1.3) ein Element aus L2 RI , µ ist. 24 KAPITEL 1. MATHEMATISCHE GRUNDLAGEN Begründung: Bei quadratintegrablen f, g ist auch h quadratintegrabel (Denn es gilt |f (λ) + g(λ) |2 ≤ 2|f (λ) |2 + 2|g(λ) |2 ). Da aber die Elemente aus L2 RI , µ Funktionsklassen sind, muß man auch zeigen, daß obige Definition jeder Linearkombination von Funktionsklassen wieder eine eindeutige Funktionsklasse zuordnet: sei f (λ) = f˜(λ) a.e. und Sei ferner h(λ) := αf (λ) + βg(λ) , g(λ) = g̃(λ) a.e.. h̃(λ) := αf˜(λ) + βg̃(λ) . Man sieht leicht, daß dann h(λ) = h̃(λ) a.e. ist. Es läßt sich leicht nachprüfen, daß die durch (1.3) definierten Linearkombinationen alle Eigenschaften aus Definition 1.4 haben. Es gilt somit: Satz 1.1 L2 RI , µ ist ein linearer Raum. 1.2.3 Die Räume C∞ 0 und S Definition 1.7 Sei K eine Teilmenge von Rn . Ein Punkt λ̂ ∈ Rn heißt Häufungspunkt von K, wenn es eine Folge λ1 , λ2 , λ3 , . . . in K gibt, die gegen λ̂ ∈ Rn konvergiert (d. h. für jedes i ∈ {1, 2, . . . , n} konvergiert die Komponente λik = πi (λk ) gegen λi = πi (λ̂)). Die Teilmenge K ⊆ Rn heißt abgeschlossen, wenn sie alle ihre Häufungspunkte enthält. Eine Teilmenge Ω ⊆ Rn heißt offen, wenn Rn \ Ω abgeschlossen ist. Die leere Menge ist per definitionem offen und abgeschlossen. Somit ist auch Rn offen und abgeschlossen. Die Abschließung K von K ⊆ Rn ist jene Menge, die entsteht, wenn man K um ihre Häufungspunkte erweitert. K ist dann (wie sich zeigen läßt) die kleinste abgeschlossene Menge, die K enthält. Beispiel 1.2 Die Menge [0, 1[ ist nicht abgeschlossen. Denn die Zahl 1 ist ein Häufungspunkt von [0, 1[, liegt aber nicht in [0, 1[. Nimmt man diesen Grenzpunt hinzu, so erhält man die Menge [0, 1]; das ist die Abschließung von [0, 1[. Beispiel 1.3 Die einpunktige Menge [1, 1] = {1} ∈ R ist abgeschlossen. Folglich ist R \ {1} offen. Definition 1.8 Sei f : Rn → C eine beliebige Funktion. Die Menge Tf := {λ ∈ Rn | f (λ) 6= 0} wird Träger von f genannt. Man spricht von kompaktem Träger, wenn Tf beschränkt ist (wenn also Tf in einer ‘Kugel’ K(r) = {λ ∈ Rn | |λ| < r} liegt (für irgend ein r < ∞)) 9 . 9 Eine Teilmenge des Rn ist kompakt, wenn sie beschränkt und abgeschlossen ist. Da Tf per definitionem abgeschlossen ist, ist die Menge Tf genau dann kompakt, wenn sie beschränkt ist. 25 1.2. DER HILBERTRAUM Definition 1.9 Sei Ω eine offene Teilmenge von Rn (besonders interessant sind die Fälle Ω = Rn und Ω = Rn \ {0}). C0∞(Ω) ist die Menge der Funktionen f : Rn → C, für die gilt i) f ist beliebig oft differenzierbar (insbesondere also stetig) ii) f hat einen kompakten Träger, der in Ω liegt. Definition 1.10 S(Rn ) ist die Menge der Funktionen f : Rn → C, für die gilt i) f ist beliebig oft differenzierbar (insbesondere also stetig) ii) f fällt — zusammen mit allen Ableitungen — stärker als jede Potenz. D. h. es ist k1 k2 q1 q2 ∂ ∂ ∂ kn qn · · · kn f (λ) < ∞, qi , ki ∈ {0, 1, 2, . . .} . sup λ1 λ2 · · · λn k k 1 2 ∂λn ∂λ1 ∂λ2 λ∈Rn Offensichtlich ist C0∞ (Ω) ⊆ C0∞ (Rn ) ⊂ S(Rn ). Satz 1.2 Es gilt C0∞ (Ω) ⊂ L2 (Rn , µℓ ) und S(Rn ) ⊂ L2 (Rn , µℓ ) (Ω eine offene Teilmenge von Rn ) Dieser Satz muß noch näher erläutert werden, da er — wörtlich genommen — nicht korrekt ist: die Elemente aus C0∞ (Ω) (und auch jene aus S(Rn )) sind Funktionen, während L2 (Rn , µℓ ) aus Funktionsklassen besteht. Somit kann C0∞ (Ω) keine Teilmenge von L2 (Rn , µℓ ) sein. Die Notation C0∞ (Ω) ⊂ L2 (Rn , µℓ ) (1.4) ist hier so zu verstehen, daß C0∞ (Ω) injektiv in L2 (Rn , µℓ ) ‘eingebettet’ werden kann: jedes Element aus C0∞ (Ω) ist quadratintegrabel und läßt sich somit eindeutig einem Element aus L2 (Rn , µℓ ) zuordnen. Obige Teilmengen-Notation ist aber erst dann gerechtfertigt, wenn diese Zuordnung injektiv ist, wenn also zwei verschiedene Elemente aus C0∞ (Ω) stets zwei verschiedenen Elementen aus L2 (Rn , µℓ ) zugeordnet werden. D. h. zwei verschiedene Elemente aus C0∞ (Ω) dürfen nicht a.e. gleich sein. Diese Bedingung ist hier erfüllt und somit die Notation (1.4) gerechtfertigt. Nimmt man an Stelle von µℓ ein eingeschränktes Lebesgue-Maßes µℓ0 , so ist C0∞ (Ω) ⊂ L2 (Rn , µℓ0 ) nur dann korrekt, wenn Ω vollständig im Träger von µℓ0 liegt. Andernfalls kann es vorkommen, daß zwei verschiedene Elemente aus C0∞ (Ω) ein und dem selben Element aus L2 (Rn , µℓ ) entsprechen. Die Linearkombinationen nach (1.3) von Elementen aus C0∞ (Ω) (bzw. aus S(Rn )) liegen wieder in C0∞ (Ω) (bzw. in S(Rn )). Somit gilt: Satz 1.3 C0∞ (Ω) und S(Rn ) sind lineare Räume. 26 KAPITEL 1. MATHEMATISCHE GRUNDLAGEN 1.2.4 Strahlen eines Vektorraumes Definition 1.11 Sei E ein linearer Raum und f ein beliebiges (aber von O verschiedenes) Element aus E. Der Strahl von f ist die Menge {g ∈ E| g = αf mit α ∈ C} Jedes von O verschiedene Element aus E gehört einem eindeutigen Strahl an. Zwei Vektoren f, g ∈ E gehören genau dann dem selben Strahl an, wenn es ein α ∈ C gibt, sodaß g = αf (f, g 6= 0). Dieser Begriff ist deshalb von Bedeutung, weil die quantenmechanischen Zustände umkehrbar eindeutig den Strahlen eines linearem Raumes entsprechen. 1.2.5 Das innere Produkt Definition 1.12 Ein inneres Produkt (oder Skalarprodukt) in einem Vektorraum E ordnet jedem Paar f, g ∈ E eine Zahl hf | gi ∈ C zu, sodaß i) hg | f i = hf | gi ii) hf | α1 g1 + α2 g2 i = α1 hf | g1 i + α2 hf | g2 i, iii) hf | f i ≥ 0, für α1 , α2 ∈ C und hf | f i = 0 ⇐⇒ f = O Ein Vektorraum mit innerem Produkt heißt unitärer Raum (Im Englischen auch ‘inner product space’). Bemerkungen: ad i): hf | gi bezeichnet das komplex Konjugierte zu hf | gi. ad ii): Wir haben hier — wie in der Physik üblich — das Skalarprodukt so definiert, daß es linear im 2. Faktor ist. Wegen i) ist es dann antilinear im 1. Faktor: hα1 f1 + α2 f2 | gi = α1 hf1 | gi + α2 hf2 | gi In Mathematik-Büchern wird das Skalarprodukt oft linear im 1. Faktor definiert (und folglich antilinear im 2. Faktor). ad iii): Aus i) folgt bereits, daß hf | f i reell ist. In iii) wird nun zusätzlich gefordert, daß hf | f i nichtnegativ ist und genau dann 0 ist, wenn f = O. Zur Notation: Oft findet man in der Literatur auch die Schreibweisen hf, gi und (f, g). Satz 1.4 (Schwarzsche Ungleichung) Sei E ein Vektorraum mit Skalarprodukt (also ein unitärer Raum). Dann gilt für beliebige f, g ∈ E |hf | gi|2 ≤ hf | f i · hg | gi. Satz 1.5 In L2 RI , µ läßt sich ein Skalarprodukt wie folgt definieren: für beliebige f, g ∈ L2 RI , µ ist Z hf | gi = f (λ)g(λ) dµ(λ) 27 1.2. DER HILBERTRAUM Zum Beweis dieses Satzes muß gezeigt werden, daß das Integral für alle f, g ∈ L2 RI , µ existiert, endlich ist und alle Bedingungen von Definition 1.12 erfüllt. Man erkennt an dieser Stelle, warum wir L2 RI , µ als Menge von Funktionsklassen definiert haben: nach Punkt iii) von Definition 1.12 muß gelten hf | f i = 0 ⇐⇒ f = O. Aus Z f (λ)f (λ) dµ(λ) = 0 folgt aber nur f (λ) = 0 a.e.. D. h. das Nullelement in L2 RI , µ muß aus allen Funktionen bestehen, die fast überall gleich 0 sind. 1.2.6 Hilbertraum-Konvergenz Definition 1.13 Sei E ein unitärer Raum und f ∈ E. Die Norm von f ist definiert durch p kf k := + hf | f i. Speziell für f ∈ L2 RI , µ erhält man 2 kf k = hf | f i = Z f (λ)f (λ) dµ(λ) = Z |f (λ)|2 dµ(λ) Aus Definition 1.12 folgt kf k ≥ 0 und kf k = 0 ⇐⇒ f = O Weiters läßt sich die sogenannte Dreiecksungleichung zeigen: kf + gk ≤ kf k + kgk . Mit Hilfe der Norm kann im unitären Raum ein Konvergenzbegriff definiert werden: Definition 1.14 Sei (fk )k=1,2,3,... eine Folge von Vektoren eines unitären Raumes E. Die Folge heißt konvergent gegen f ∈ E, wenn die Zahlenfolge kfk − f k gegen 0 konvergiert. Symbolisch: H fk −→ f :⇐⇒ kfk − f k −→ 0 oder H-lim fk = f k→∞ :⇐⇒ lim kfk − f k = 0. k→∞ 28 KAPITEL 1. MATHEMATISCHE GRUNDLAGEN H In L2 RI , µ führt fk (λ) −→ f (λ) zur Konvergenz im Mittel: Z |fk (λ) − f (λ)|2 dµ(λ) −→ 0 Definition 1.15 Eine Folge (fk )k=1,2,3,... im unitären Raum E heißt Cauchy-Folge, wenn ∀ǫ > 0 : ∃N : k1 , k2 > N ⇒ kfk1 − fk2 k < ǫ. Gibt es in E für jede Cauchy-Folge ein Element gegen das diese Folge konvergiert, so heißt E vollständig. Ein vollständiger unitärer Raum wird Hilbertraum genannt. Vollständige Räume haben den Vorteil, daß man nicht mit dem Begriff der Cauchy-Folge arbeiten muß: da in solchen Räumen jede Cauchy-Folge konvergiert, kommt man mit dem Begriff der konvergenten Folge aus. Satz 1.6 Der Raum L2 RI , µ ist vollständig, also ein Hilbertraum. Satz 1.7 Das Skalarprodukt in einem Hilbertraum E ist stetig, d. h. es gilt H H fk −→ f, gk −→ g =⇒ hgk | fk i → hg | f i. Die Grenzwertbildung ist somit mit der Skalarproduktbildung vertauschbar. Dasselbe gilt auch für die algebraischen Operationen: Satz 1.8 Die algebraischen Operationen in einem Hilbertraum E sind stetig, d. h. es gilt H H H fk −→ f, gk −→ g =⇒ αfk + βgk −→ αf + βg Besonders wichtig ist der folgende Begriff: Definition 1.16 Eine Teilmenge D des Hilbertraumes E heißt dicht in E, wenn es für jedes f ∈ E eine Folge (fk )k=1,2,3,... in D gibt, die gegen f konvergiert. Beispiel 1.4 Die Menge C ist ein (besonders einfacher) Hilbertraum. Die Menge der rationalen komplexen Zahlen (Real- und Imaginärteil rational) ist dicht in C. Beispiel 1.5 Die Menge der stetigen Rn → C - Funktionen ist dicht in L2 (Rn , µℓ ) Satz 1.9 Sei D dicht im Hilbertraum E. Dann gilt für beliebige f, g ∈ E: (∀ϕ ∈ D : hϕ | f i = hϕ | gi) =⇒ f =g Satz 1.10 Sei Ω eine offene Teilmenge von Rn . C0∞ (Ω) ist genau dann dicht in L2 (Rn , µℓ ), wenn Rn \ Ω das Lebesgue-Maß 0 hat. (Beweis: siehe Roberts [38], Lemma 1). 29 1.2. DER HILBERTRAUM 1.2.7 Orthonormalsysteme Definition 1.17 Zwei Vektoren f, g eines Hilbertraumes heißen orthogonal, wenn hf | gi = 0. Definition 1.18 Eine Teilmenge {ψk }k∈K eines Hilbertraumes heißt Orthogonalsystem, wenn die ψk paarweise orthogonal sind, d. h. wenn hψk | ψl i = 0 für k 6= l Wenn zusätzlich alle ψk auf 1 normiert sind, spricht man von Orthonormalsystem. Man kann dann schreiben hψk | ψl i = δkl (δkl := 1 für k = l δkl := 0 für k 6= l). Definition 1.19 Ein Orthonormalsystem {ψk }k∈K in einem Hilbertraum E heißt vollständig,wenn es maximal ist, wenn es also keinen (von O verschiedenen) Vektor f gibt, der zu allen ψk orthogonal ist. Es läßt sich leicht zeigen, daß jedes Orthonormalsystem zu einem vollständigen Orthonormalsystem erweitert werden kann. Ein bestimmter Hilbertraum hat natürlich viele verschiedene vollständige Orthonormalsysteme. Es laßt sich aber zeigen, daß all diese vollständigen Orthonormalsysteme die gleiche Mächtigkeit haben. Gibt es z. B. in einem Hilbertraum ein vollständiges Orthonormalsystem mit 5 Elementen, so haben alle vollständigen Orthonormalsysteme in diesem Hilbertraum genau 5 Elemente. Hat man in einem anderen Hilbertraum ein vollständiges Orthonormalsystem mit abzählbar unendlich vielen Elementen, so haben alle vollständigen Orthonormalsysteme in diesem Hilbertraum abzählbar unendlich viele Elemente10 . Definition 1.20 Die Dimension eines Hilbertraumes E ist die Mächtigkeit (=Anzahl der Elemente) der vollständigen Orthonormalsysteme in E (Diese haben bei festem E alle dieselbe Mächtigkeit). Ist die Dimension endlich oder abzählbar unendlich, so nennen wir den Hilbertraum separabel11 . Die in der Quantenmechanik verwendeten Hilberträume haben die Dimension abzählbar unendlich und sind somit immer separabel. Der Raum L2 RI , µ interes siert uns daher nur für solche Maße µ, für die L2 RI , µ separabel ist. Die Separabilität werden wir in allen weiteren Betrachtungen stets voraussetzen. 10 Für einen Beweis dieses Sachverhaltes siehe z. B. Großmann [18], Seite 60. In manchen Texten — besonders in jenen älteren Datums — wird die Separabilität in die Hilbertraum-Definition hineingezogen. Dort ist der Hilbertraum per definitionem ein separabler vollständiger unitärer Raum. 11 30 KAPITEL 1. MATHEMATISCHE GRUNDLAGEN Satz 1.11 Sei E ein separabler Hilbertraum und (ψk )k=1,2,3,... ein vollständiges Orthonormalsystem in E. Für jedes f ∈ E gilt dann f= ∞ X αk = hψk | f i. αk ψk , k=1 Ferner gilt für alle f, g ∈ E hg | f i = ∞ X αk = hψk | f i, βk αk , k=1 βk = hψk | gi Bei der Anwendung dieses Satzes ist es von Vorteil, die sogenannte Diracsche Notation zu verwenden: die Vektoren aus E werden hierbei mit den Symbolen |f i , |gi , |ψi , . . . bezeichnet. Für Satz 1.11 schreiben wir symbolisch ∞ X k=1 |ψk i hψk | = 1. Die Anwendung dieses Satzes erfolgt dann durch das sogenannte Einschieben der Eins: ! ∞ ∞ X X |f i = 1 |f i = |ψk i hψk | |f i = |ψk i hψk | f i k=1 k=1 oder hg | f i = hg | 1f i = hg| ∞ X k=1 ! |ψk i hψk | f i = ∞ X k=1 hg | ψk ihψk | f i. Dieses Einschieben der Eins ist zunächst als rein symbolischer Rechenvorgang zu verstehen. Hinter dieser Symbolik steckt aber ein exakter Formalismus: Interpretiert man |ψk i hψk | als Projektionsoperator (siehe Seite 36), so konvergiert die Reihe P |ψk i hψk | im sogenannten Operator-Norm-Limes gegen den Einheitsoperator. Aus dieser Operator-Konvergenz folgt, daß obiges Einschieben der Eins erlaubt ist. Beispiel 1.6 In L2 (R, µℓ ) bilden die Funktionen ψk (λ) = e− λ2 2 Hk (λ) , Hk (λ) = Hermitesche Polynome ein vollständiges Orthonormalsystem (siehe Großmann [18], Seite 83). Für jede Funktion f (λ) ∈ L2 (R, µℓ ) gilt dann: |f i = X k |ψk i hψk | f i und folglich f (λ) = X k ψk (λ) αk , αk = Z ψk (λ) f (λ) dµℓ (λ) . 31 1.3. LINEARE OPERATOREN 1.3 Lineare Operatoren 1.3.1 Grundlegende Definitionen Definition 1.21 Seien DA und WA lineare Räume. Ein linearer Operator A : DA −→ WA f 7−→ Af ist eine lineare Abbildung von DA in WA . ‘Linear’ heißt hier: für alle f, g ∈ DA , und alle α, β ∈ C gilt A (αf + βg) = αAf + βAg. DA heißt Definitionsbereich, WA Bildbereich oder Wertevorrat. Für beliebiges D ⊆ DA definieren wir AD := {f ∈ WA | ∃g ∈ D : f = Ag} . Wir nennen AD das Bild von D (bez. A). Das Bild des Definitionsbereiches DA wird manchmal auch Bild des Operators A genannt. Umfaßt dieses Bild den gesamten Bildbereich, so sagt man, A sei surjektiv (d. h. A ist surjektiv, wenn ADA = WA ). Definition 1.22 Unter einem linearen Operator im Hilbertraum E verstehen wir einen linearen Operator A : DA → E mit DA ⊆ E und DA dicht in E. Von linearen Operatoren im Hilbertraum E setzen wir also immer voraus, daß sie dicht definiert sind. Ist speziell DA = E, so sagt man, A sei überall definiert. Bemerkung zur Notation: bei Verwendung der Diracschen Notation schreibt man für den Vektor Af , je nach Situation, wahlweise A |f i oder |Af i. Es mag zwar konsequenter erscheinen, immer die Notation A |f i zu verwenden, doch ist das in manchen Situationen nicht sinnvoll. Ähnliches gilt für die Linearkombination αf + βg: in der Diracschen Notation kann man hierfür abwechselnd die Schreibweisen α |f i + β |gi und |αf + βgi verwenden. Wir erwähnen noch, daß manche Autoren für das Skalarprodukt hg | Af i die Notation hg| A |f i verwenden. Sind A : DA → E und  : D → E zwei Operatoren mit DA ⊆ D und Af = Âf, für f ∈ DA , so sagt man,  ist eine Erweiterung von A, bzw. A ist eine Einschränkung von Â; wir schreiben dann A ⊆ Â. Zwei lineare Hilbertraum-Operatoren A : DA → E, B : DB → E werden natürlich genau dann als gleich bezeichnet, wenn DA = DB und ∀f ∈ DA : Af = Bf. Man kann jedoch diese Bedingung abschwächen: 32 KAPITEL 1. MATHEMATISCHE GRUNDLAGEN Satz 1.12 Zwei lineare Hilbertraum-Operatoren A : DA → E, B : DB → E sind genau dann gleich, wenn DA = DB und ∀f ∈ DA : hf | Af i = hf | Bf i. (Für einen Beweis dieses Satzes siehe z. B. Großmann [18], Seite 100). Ein besonders einfacher Operator ist der Einheitsoperator, der jedem Vektor f wieder den selben Vektor f zuordnet. Wir bezeichnen diesen Operator mit 1. Das kann zwar zu Verwechslungen mit der Zahl 1 führen, doch ist das nicht weiter störend, da die Anwendung des Einheitsoperators auf f stets das selbe Ergebnis liefert, wie die Multiplikation von f mit der Zahl 1. Analog zum Einheitsoperator gibt es den Operator α (mit α ∈ C), der dem Vektor f den Vektor αf zuordnet. Hat man zwei lineare Operatoren A : DA → WA , B : DB → WB , so kann man das Produkt AB definieren: AB : DAB −→ WA f 7−→ A (Bf ) , DAB := {f ∈ DB | Bf ∈ DA } . Bei Hilbertraum-Operatoren ist dieses Produkt aber nur dann interessant, wenn DAB dicht im Hilbertraum ist. Zu beachten ist, daß Operator-Produkte im allgemeinen nicht kommutativ sind, d. h. es kann AB 6= BA sein. Das Assoziativgesetz ist dagegen erfüllt: A (BC) = (AB) C. Für zwei lineare Operatoren A : DA → W, Summe A + B definieren: (A + B) : DA+B −→ W f 7−→ Af + Bf. , B : DB → W kann man eine DA+B := DA ∩ DB . Für Hilbertraum-Operatoren ist diese Summe aber nur dann interessant, wenn DA+B dicht im Hilbertraum ist. Hat man noch einen dritten linearen Operator C : DC → W , so gilt das (etwas eingeschränkte) Distributivgesetz: C (A + B) ⊇ CA + CB. Definition 1.23 Sei A : DA → WA ein linearer Operator und BA := ADA . Wenn es einen Operator A−1 : BA −→ DA gibt, der für alle f ∈ DA die Gleichung A−1 Af = f erfüllt, so wird A−1 inverser Operator (zu A) genannt. 33 1.3. LINEARE OPERATOREN Satz 1.13 Existiert zu einem linearen Operator A ein Inverses A−1 , so ist dieses eindeutig und ebenfalls linear. Ferner ist dann A das Inverse zu A−1 , d. h. es ist −1 (A−1 ) = A. Satz 1.14 Seien A : DA → WA , B : DB → WB zwei lineare Operatoren. Existieren die Inversen A−1 , B −1 und das Produkt AB, so hat auch AB ein Inverses und es gilt (AB)−1 = B −1 A−1 . 1.3.2 Beschränkte Operatoren Definition 1.24 Sei A : DA → WA ein linearer Operator. DA und WA seien Teilmengen von Hilberträumen. Die Norm von A ist definiert durch kAk := kAf k . f ∈DA \{O} kf k sup Ist kAk < ∞, so heißt A beschränkt. Die beiden folgenden Sätze zeigen, daß linear-beschränkte Operatoren besonders angenehme Eigenschaften haben. Satz 1.15 Sei A : DA → E ein linear-beschränkter Operator im Hilbertraum E (DA b : E → E erweitert dicht in E). Dann kann A stets zu einem linearen Operator A werden, der auf ganz E definiert ist. Diese Erweiterung ist eindeutig und es gilt b k = kAk. kA Einen linear-beschränkten Operator kann man also stets (eindeutig) zu einem überall definierten Operator erweitern. Wir werden daher von linear-beschränkten Operatoren meistens voraussetzen, daß sie überall definiert sind, was den Umgang mit diesen Operatoren wesentlich erleichtert. Satz 1.16 Sei A : E → E ein linear-beschränkter Operator im Hilbertraum E. Dann ist A überall stetig, d. h. für jede konvergente Folge (fk )k=1,2,3,... in E gilt H H fk −→ f =⇒ Afk −→ Af . Linear-beschränkte Operatoren können somit völlig sorglos mit Grenzwertbildungen vertauscht werden, d. h. es gilt A H- lim fk = H- lim (Afk ) . k k Die beiden oben angeführten Sätze gelten unverändert auch dann, wenn Definitionsbereich und Bildbereich in zwei verschiedenen Hilberträumen E1 und E2 liegen: Der linear-beschränkter Operator A : DA → E 2 , (DA dicht in E1 ) ist stetig und kann in eindeutiger Weise (und unter Beibehaltung der Norm) auf ganz E1 ausgedehnt werden. Es läßt sich sogar zeigen, daß A genau dann stetig ist, wenn A beschränkt ist; die Begriffe ‘linear-beschränkt’ und ‘stetig’ sind somit äquivalent. 34 1.3.3 KAPITEL 1. MATHEMATISCHE GRUNDLAGEN Selbstadjungierte Operatoren Definition 1.25 Sei A : DA → E ein linearer (dicht definierter) Operator im Hilbertraum E. Gilt für alle f, g ∈ DA hf | Agi = hAf | gi, (1.5) so nennt man A symmetrisch. Gilt zusätzlich (A + j) DA = E und (A − j) DA = E, (1.6) so nennt man A selbstadjungiert. Für ‘selbstadjungiert’ verwendet man oft auch die Abkürzung s.a.12 . Ein s.a. Operator A ist ein symmetrischer Operator, der einen so ‘großen’ Definitionsbereich hat, daß die Bilder (A + j)DA und (A − j)DA ganz E umfassen. Ist ein symmetrischer Operator nicht s.a., so kann man ihn eventuell durch Erweiterung des Definitionsbereiches zu einem s.a. Operator machen. Nicht jeder symmetrische Operator läßt sich aber zu einem s.a. Operator erweitern, und selbst dann, wenn es eine s.a. Erweiterung gibt, so ist diese i. allg. nicht eindeutig (d. h. es kann mehrere Möglichkeiten geben DA so zu erweitern, daß A s.a. wird). Definition 1.26 Ein symmetrischer Operator A : DA → E heißt im wesentlichen s.a., wenn er eine eindeutige s.a. Erweiterung besitzt. Wir kürzen diese Eigenschaft mit e.s.a. ab (englisch: essentially self-adjoint). In der Quantenmechanik entsprechen den physikalischen Größen selbstadjungierte Operatoren. Um mit einem solchen Operator zu arbeiten, muß man aber nicht seinen gesamten Definitionsbereich kennen: es genügt eine Teilmenge des Definitionsbereiches zu kennen, auf dem der Operator e.s.a. ist; der s.a. Operator ist dann eindeutig bestimmt. Wir erwähnen noch, daß ein s.a. Operator stets maximal symmetrisch ist: wenn ein Operator s.a. ist, so ist es nicht möglich, diesen Operator noch zu erweitern, ohne dabei die Symmetrieeigenschaft (1.5) zu verlieren. Der folgende Satz zeigt, daß die Frage des Definitionsbereiches nur dann von Bedeutung ist, wenn der s.a. Operator nicht beschränkt ist: 12 Diese Definition ist völlig äquivalent zur gebräuchlicheren Charakterisierungung A = A∗ (mit A als adjungiertem Operator). Einen Beweis hierfür findet man z. B. in Reed/Simon [35], Theorem VIII.3. Wir erwähnen noch, daß aus (1.5) und (1.6) bereits folgt, daß DA dicht in E ist: ist DA nicht dicht, so gibt es ein f ∈ E \ {O} mit hf | pi = 0 für alle p ∈ DA . Wegen (A + j)DA = E gibt es ein k ∈ DA mit f = (A + j)k. Wegen (A − j)DA = E gibt es zu jedem g ∈ E ein p ∈ DA mit g = (A − j)p. Aus der Symmetrie von A folgt schließlich ∗ hk | gi = hk | (A − j)pi = h(A + j)k | pi = hf | pi = 0. Da g beliebig aus E ist, muß k = O sein, was aber ein Widerspruch zur Vorausetzung f 6= O ist. 35 1.3. LINEARE OPERATOREN Satz 1.17 Jeder beschränkte s.a. Operator ist überall definiert. Umgekehrt gilt: jeder symmetrische überall definierte Operator ist s.a.. Aus diesem Satz folgt, daß ein unbeschränkter s.a. Operator nicht überall definiert sein kann. Wir haben bereits auf Seite 33 erwähnt, daß unbeschränkte Operatoren nicht stetig sind, d. h. man darf Grenzwertbildungen nicht sorglos mit der OperatorVorschrift vertauschen. Für s.a. Operatoren gilt aber, daß solche Vertauschungen immerhin dann zulässig sind, wenn man dabei ein vernünftiges Ergebnis erhält: Satz 1.18 Ein s.a. Operator A : DA → E ist immer abgeschlossen, d. h.: wenn (fk )k=1,2,3,... eine Folge in DA ist, die gegen f ∈ E konvergiert und die Folge (Afk )k=1,2,3,... ebenfalls konvergiert (gegen irgend ein Element aus E), so ist f ∈ DA und es gilt Af = A (H- lim fk ) = H- lim (Afk ) . (1.7) Um sicherzustellen, daß (1.7) gilt, genügt es somit nachzuweisen, daß die Folge Afk konvergiert. Bei stetigen (=beschränkten) Operatoren ist diese Überprüfung überflüssig, da — bei konvergentem fk — die Folge Afk immer konvergiert (vergleiche Satz 1.16). Die Abgeschlossenheit der s.a. Operatoren hilft auch bei der Bestimmung des Definitionsbereiches: Satz 1.19 Sei A : ΦA → E ein e.s.a. Operator. Es gibt dann bekanntlich eine eindeutige s.a. Erweiterung A : DA → E. Ein f ∈ E liegt genau dann in DA , wenn es eine Folge (fk )k=1,2,3,... in ΦA gibt, sodaß H fk −→ f und H ∃g ∈ E : Afk −→ g (Nach Satz 1.18 ist dann Af = g). Abschließend erwähnen wir noch: Satz 1.20 Ist A : DA → E ein selbstadjungierter (oder auch nur ein symmetrischer) Operator, so ist das Produkt hf | Af i für alle f ∈ DA reellwertig. Bei f 6= g ist hf | Agi i. allg. naturlich nach wie vor komplexwertig. 1.3.4 Eigenwerte und Eigenvektoren Definition 1.27 Sei A : DA → E ein linearer Operator im Hilbertraum E. Gibt es zu einem λ ∈ C ein vom Nullvektor verschiedenes f ∈ DA mit Af = λf, so heißt λ (eigentlicher) Eigenwert von A, und f ist ein zugehöriger (eigentlicher) Eigenvektor. 36 KAPITEL 1. MATHEMATISCHE GRUNDLAGEN Wir haben in dieser Definition von ‘eigentlichen’ Eigenwerten und Eigenvektoren gesprochen, weil wir fordern, daß f in DA liegt (insbesondere also auch f ∈ E). Im Kapitel 4 werden wir sogenannte ‘verallgemeinerte’ Eigenwerte und Eigenvektoren kennenlernen, bei denen f aus einem umfangreicheren Raum ist. Ist f ein Eigenvektor zum Eigenwert λ, so ist offenbar auch αf (mit α ∈ C) ein Eigenvektor zu λ. Der Eigenvektor zu einem Eigenwert ist somit nie eindeutig bestimmt. Wenn man aber sagt, zu einem Eigenwert gebe es mehrere Eigenvektoren, so meint man i. allg., daß es mehrere Eigenvektoren gibt, die nicht im selben Strahl liegen. In diesem Fall sagt man, der Eigenwert sei entartet13 . Es läßt sich leicht zeigen, daß bei selbstadjungiertem A alle Eigenwerte reell sind und die Eigenvektoren zu verschiedenen Eigenwerten orthogonal sind. I Ist E ein Funktionenraum (z. B. E = L2 R , µ ), so nennt man die Eigenvektoren oft auch Eigenfunktionen. 1.3.5 Projektoren Definition 1.28 Eine Teilmenge R ⊆ E eines Hilbertraumes E nennen wir vollständigen Teilraum, wenn R linear und vollständig ist (d. h. alle Linearkombinationen von Elementen aus R liegen wieder in R, und alle Grenzelemente von konvergenten Folgen aus R liegen wieder in R). R ist dann für sich genommen wieder ein Hilbertraum. Satz 1.21 Sei R ein vollständiger Teilraum des Hilbertraumes E. Für jedes f ∈ E gibt es eine eindeutige Zerlegung f = fR + fR⊥ , sodaß fR ∈ R und fR⊥ orthogonal zu allen Elementen aus R ist. Die Abbildung P : E −→ E f 7−→ P f = fR ist linear, d. h. P ist ein linearer Operator. Er wird Projektor (oder Orthogonalprojektion) genannt, weil er f auf den Teilraum R ‘projiziert’, d. h. er ‘filtert’ von f jene ‘Komponente’ heraus, die in R liegt. Satz 1.22 Wenn P ein Projektor ist, dann gilt: • P ist beschränkt und es ist kP k = 1 • P ist s.a. • P P = P (P ist ‘idempotent’). Umgekehrt ist jeder linear-beschränkte s.a. Operator mit P P = P ein Projektor. 13 Die maximale Anzahl paarweise ortogonaler Eigenvektoren zu einem Eigenwert nennt man den Entartungsgrad (oder die Vielfachheit) dieses Eigenwertes. 37 1.3. LINEARE OPERATOREN Definition 1.29 Sei ψ ∈ E und kψk = 1 (E ein Hilbertraum). Das Symbol |ψi hψ| bezeichnet jenen Operator, der f ∈ E auf αψ abbildet, mit α = hψ | f i. In Diracscher Notation: |ψi hψ| angewendet auf |f i ergibt |ψi hψ | f i. Man sieht leicht, daß |ψi hψ| ein Projektor ist, und zwar jener, der auf folgenden eindimensionalen Teilraum projiziert: R = {g ∈ E| ∃α ∈ C : g = αψ} (Das ist der Strahl von ψ). Satz 1.23 Sei R ein vollständiger Teilraum des (separablen) Hilbertraumes E und sei P der (eindeutig bestimmte!) Projektor zu R. P kann dann in folgender Form dargestellt werden: X P = |ψk i hψk | . k∈K Hierbei ist (ψk )k∈K ein beliebiges vollständiges Orthonormalsystem in R. Obige Summe ist so zu verstehen, daß für beliebiges f ∈ E gilt X Pf = ψk hψk | f i, (1.8) k∈K oder in Diracscher Notation: P |f i = X k∈K |ψk i hψk | f i. Umgekehrt gilt: zu jedem beliebigen Orthonormalsystem (ψk )k∈K in E ist der durch (1.8) definierte Operator ein Projektor. Er projiziert auf einen Teilraum, in dem (ψk )k∈K ein vollständiges Orthonormalsystem ist. Eine spezielle Anwendung dieses Konzeptes haben wir bereits in Satz 1.11 kennengelernt: ist (ψk )k∈K ein vollständiges Orthonormalsystem in E, so ist P = P |ψ i hψ k k | gleich dem Einheitsoperator, was uns auf Seite 30 veranlaßte k∈K X k∈K |ψk i hψk | = 1 zu schreiben. Somit folgt Satz 1.11 aus obigem Satz 1.23. 38 KAPITEL 1. MATHEMATISCHE GRUNDLAGEN 1.4 Transformationstheorie 1.4.1 Unitäre Transformationen e und Definition 1.30 Seien E und Ee zwei Hilberträume (eventuell auch E = E) T : E → Ee ein linearer Operator mit folgenden Eigenschaften: • T ist längentreu (=isometrisch), d. h. ∀f ∈ E : kT f k = kf k e • T ist surjektiv, d. h. das Bild von A umfaßt ganz E. T heißt dann unitärer Operator14 . Gelegentlich nennen wir T : E → Ee auch eine Darstellung (von E). Satz 1.24 Sei T : E → Ee ein unitärer Operator. Dann gilt: i) kT k = 1 ii) T −1 existiert und ist ebenfalls unitär iii) ∀f, g ∈ E : hf | gi = hT f | T gi. Wegen der Surjektivität von T und der Existenz von T −1 ist T bijektiv, d. h. T ist eine umkehrbar eindeutige eins zu eins Zuordnung zwischen den Elementen aus e zu jedem f ∈ E gibt es ein eindeutiges fe ∈ Ee und zu jedem E und jenen aus E: fe ∈ Ee gibt es ein eindeutiges f ∈ E. Da diese Zuordnung auch noch linear und längentreu ist, kann man alle Hilbertraum-Operationen völlig äquivalent in E oder in Ee durchführen. Der durch einen unitären Operator T : E → Ee hergestellte Zusammenhang zwischen E und Ee ist so eng, daß jedem linearen Operator in E genau ein linearer Operator in Ee entspricht: Satz 1.25 Sei T : E −→ Ee f 7−→ fe eine unitäre Transformation. Dann gibt es zu jedem linearen Operator A in E einen e in E, e sodaß eindeutigen linearen Operator A efe = e Af = g ⇐⇒ A g. e heißen unitäräquivalent und es gilt Die Operatoren A und A e = T AT −1 A efe = e (denn es ist A g = T g = T Af = T AT −1 fe). (1.9) Einige Autoren sprechen nur dann von ‘unitärem Operator’, wenn E = Ee ist; für den allgemeineren Fall verwenden sie statt dessen die Bezeichnung ‘isometrischer Operator’. 14 39 1.4. TRANSFORMATIONSTHEORIE e = T AT −1 besitzt, und nicht die Form A e= Um sich zu merken, daß (1.9) die Form A e beide den Bildbereich Ee haben; die Operatoren T −1 AT , beachte man, daß T und A −1 e und T AT haben somit den selben Bildbereich und können daher gleich sein. A Satz 1.26 Sei T : E → Ee eine unitäre Transformation. Ein linearer Operator A in e in Ee s.a. ist. E ist genau dann s.a., wenn der zu A unitäräquivalente Operator A 1.4.2 Multiplikationsoperatoren Definition 1.31 Sei G(λ) eine (meßbare) RI → R - Funktion. In L2 RI , µ ist dann ein linearer Operator G definiert durch G : DG −→ L2 RI , µ f (x) 7−→ G(x) · f (x) mit DG := f (λ) ∈ L2 R , µ n I Z o |G(x) f (x)|2 dµ(x) < ∞ . Die Anwendung des Operators G auf f (x) entspricht also der Multiplikation von f (x) mit der Funktion G(x). Einen Operator dieses Typs nennen wir Multiplikationsoperator15 . Ist die Funktion G(x) beschränkt, so ist der entsprechende Multiplikationsoperator ebenfalls beschränkt und überall definiert (D. h. es ist DG = L2 RI , µ ) 16 . Doch selbst bei unbeschränkter Funktion G(x) ist der Multiplikationsoperator immer noch dicht definiert17 . Ein Spezialfall eines Multiplikationsoperators liegt dann vor, wenn G(λ) = λi ist (für irgend ein i ∈ I); Operatoren dieses Typs nennen wir v-Operatoren: Definition 1.32 Der v-Operator λi sei definiert durch λi : Di −→ L2 RI , µ f (λ) 7−→ λi f (λ) Z n o I Di := f (λ) ∈ L2 R , µ λ2i |f (λ)|2 dµ(λ) < ∞ . Einen solchen Operator gibt es für jedes i ∈ I. Satz 1.27 v-Operatoren sind stets s.a.. 15 An Stelle der Bezeichnung ‘Multiplikationsoperator’ wird häufig auch die Bezeichnung Diagonaloperator verwendet. 16 Es läst sich leich zeigen, daß die Norm des Multiplikationsoperators gleich der kleinsten Zahl M ist, für die |G(λ)| ≤ M a.e. ist. 17 Denn der Multiplikationsoperator F (λ) := |G(λ)| hat offensichtlich den selben Definitionsbereich wie der Multiplikationsoperator G(λ); nach Satz 1.28 ist F (λ) s.a. und somit dicht definiert. 40 KAPITEL 1. MATHEMATISCHE GRUNDLAGEN Beweis: Es läßt sich leicht zeigen, daß λi symmetrisch ist. Für die Selbstadjungiertheit muß aber noch gezeigt werden, daß (λi ± j) Di = L2 RI , µ . Offenbar gilt für jedes λi ∈ R λ2i 2 |λi ± j| = λ2i ≤ 1. λ2i + 1 2 R |h(λ)|2 dµ(λ) < ∞ stets auch λ2i λi1±j h(λ) dµ(λ) < ∞. D. h. für jedes h(λ) ∈ L2 RI , µ ist g(λ) := λi1±j h(λ) ∈ Di . Folglich gibt es zu jedem h(λ) ∈ L2 RI , µ ein g(λ) ∈ Di , sodaß (λi ± j) g(λ) = h(λ). QED Somit ist bei R Doch nicht nur v-Operatoren sind s.a., sondern ganz allgemein alle reellwertigen Multiplikationsoperatoren: Satz 1.28 Ein Multiplikationsoperator G(λ) ist genau dann s.a., wenn die Funktion G(λ) reellwertig ist. Beweis: Bei nicht reellwertigem G(λ) ist der Multiplikationsoperator nicht symmetrisch und somit nicht s.a.. Nehmen wir nun an, G(λ) sei reellwertig, also eine RI → R - Funktion. Wir betrachten die Abbildung T : L2 RI , µ −→ L2 RI × R, µ b f (λ) 7−→ fb(λ, η) . Das Maß µ b sei definiert durch b = µ(∆) µ b(∆) n o b , mit ∆ = λ ∈ RI (λ, G(λ)) ∈ ∆ und die Funktion fb(λ, η) habe die Gestalt fb(λ, η) = f (λ) . Da sich leich zeigen läßt, daß T längentreu und surjektiv ist, ist T unitär. Der Multiplikationsoperator ist somit unitäräquivalent zum v-Operator η, der nach Satz 1.27 s.a. ist. QED. 1.4.3 Spektraldarstellung und Kommutierbarkeit Definition 1.33 Seien A und B zwei beschränkte (überall definierte) HilbertraumOperatoren. Man sagt, diese Operatoren kommutieren, wenn AB = BA. Wir haben in obiger Definition vorausgesetzt, daß die Operatoren beschränkt sind; dadurch können wir annehmen, daß A und B sowie die Operator-Produkte AB und BA überall definiert sind. Bei unbeschränkten Operatoren müssen wir anders vorgehen: 41 1.4. TRANSFORMATIONSTHEORIE Definition 1.34 Seien A und B zwei Hilbertraum-Operatoren und sei B beschränkt. Man sagt diese Operatoren kommutieren, wenn BA ⊆ AB, d. h. wenn ∀f ∈ DA : (Bf ∈ DA und ABf = BAf ). (Wenn auch A beschränkt ist, so geht Definition 1.34 offensichtlich in Definition 1.33 über). Wenn beide Operatoren unbeschränkt sind, definieren wir die Kommutierbarkeit nur mehr für s.a. Operatoren: Definition 1.35 Seien A und B zwei s.a. Operatoren und a, b beliebige komplexe Zahlen mit nichtverschwindendem Imaginärteil. Dann läßt sich zeigen, daß RA (a) := (a − A)−1 und RB (b) := (b − B)−1 beschränkte (und überall definierte) Operatoren sind. Man sagt, die s.a. Operatoren A und B kommutieren, wenn für alle a, b ∈ C mit Im(a) , Im(b) 6= 0 gilt: RA (a) RB (b) = RB (b) RA (a) . Insbesondere kommutiert jeder s.a. Operator mit sich selbst; denn man kann zeigen, daß für beliebige a, b mit nichtverschwindendem Imaginärteil stets RA (a) RA (b) = RA (b) RA (a) ist. Bei beschränkten Operatoren ist Definition 1.35 äquivalent zu Definition 1.33 (bzw. äquivalent zu Definition 1.34, falls nur einer der Operatoren beschränkt ist). Für zwei unbeschränkte s.a. Operatoren ist ABf = BAf für f ∈ DAB ∩ DBA immer noch eine notwendige Bedingung für die Kommutierbarkeit; diese Bedingung ist aber nicht mehr hinreichend (auch dann nicht, wenn DAB ∩ DBA dicht im Hilbertraum ist). Die Kommutierbarkeit bleibt bei unitären Transformationen erhalten: e = Satz 1.29 Seien A, B s.a. Operatoren, T eine unitäre Transformation und A −1 e −1 e e T AT , B = T BT . Dann gilt: A kommutiert mit B genau dann, wenn A mit B kommutiert. Hat man nicht nur zwei Operatoren, sondern einen ganzen Operator-Satz {Ai }i∈J , so bezeichnet man diese Operatoren als kommutierbar, wenn sie paarweise kommutieren, d. h. wenn für alle k, ℓ ∈ J der Operator Ak mit dem Operator Aℓ kommutiert. 42 KAPITEL 1. MATHEMATISCHE GRUNDLAGEN Definition 1.36 Sei E ein separabler Hilbertraum und {Ai }i∈J ein Satz linearer Operatoren in E. Ist T : E → L2 RI , µ eine unitäre Transformation (µ ein σ-finites Maß), so entsprechen den Operatoren Ai unitäräquivalente Operatoren Ai = −1 I T Ai T in L2 R , µ . Falls obige Transformation derart ist, daß alle Ai v-Operatoren in L2 RI , µ sind, nennen wir T eine diagonalisierende Darstellung für I {Ai }i∈J . Gibt es in L2 R , µ keine weiteren v-Operatoren, so nennen wir T eine Spektraldarstellung18 für {Ai }i∈J (Bei einer Spektraldarstellung ist J = I, bei einer diagonalisierenden Darstellung ist J ⊆ I). Da v-Operatoren stets s.a. sind, kann es nur für s.a. Operatoren eine diagonalisierende Darstellung geben. (Denn die Selbstadjungiertheit bleibt nach Satz 1.26 bei einer unitären Transformation erhalten). Die Selbstadjungiertheit ist aber noch keine hinreichende Bedingung für die Existenz einer gemeinsamen diagonalisierenden Darstellung für die Operatoren Ai : Satz 1.30 Sei {Ai }i∈J ein Satz s.a. Operatoren. Für {Ai }i∈J gibt es genau dann eine diagonalisierende Darstellung, wenn die Ai kommutieren (wenn also für alle k, ℓ ∈ J der Operator Ak mit dem Operator Aℓ kommutiert). Beweis: Sind λA und λB zwei v-Operatoren in L2 RI , µ , so gilt offenbar −1 (a − λA ) (b − λB ) −1 −1 f (λ) = (b − λB ) −1 (a − λA ) f (λ) . Somit kommutieren die beiden v-Operatoren. Da die Kommutierbarkeit bei unitären Transformationen erhalten bleibt, kann es für {Ai }i∈J nur dann eine diagonalisierende Darstellung geben, wenn die Ai kommutieren. Es bleibt somit nur noch zu zeigen, daß die Kommutierbarkeit auch hinreichend für die Existenz einer diagonalisierenden Darstellung ist. Sei M eine Menge s.a. Operatoren. Mit M′ bezeichnen wir die Menge aller beschränkten Hilbertraum-Operatoren, die mit allen Operatoren aus M kommutieren. Ergänzung: Sei P jene Operator-Menge, die von den Spektralscharen der Operatoren aus M gebildet wird (Der Begriff der Spektralschar wird im Abschnitt 3.3 Bei Verwendung der dort beschriebenen Terminologie S eingeführt. A ist P = A∈M {E∆ } m ). Dann ist M′ = P ′ (Siehe z. B. Großmann [18], ∆⊆R Gleichung (18.1)). P hat gegenüber M den Vorteil, stets aus beschränkten Operatoren zu bestehen. Mit M′′ bezeichnen wir die Menge aller beschränkten Operatoren, die mit allen Operatoren aus M′ kommutieren; analog dazu ist M′′′ definiert. Man nennt M′′ die von M generierte von Neumann-Algebra. Offensichtlich gilt M1 ⊆ M2 =⇒ M′1 ⊇ M′2 18 Unsere Definition entspricht weitgehend jener aus de Dormale/Gautrin [11]. Im Gegensatz zu [11] haben wir aber explizit die σ-Finitheit von µ gefordert (Nach Halmos/Sunder [19], Example 1.1, folgt die σ-Finitheit noch nicht aus der Separabilität von L2 RI , µ ). Die Ergebnisse aus [11] können aber dennoch unverändert übernommen werden, da das in [11] konstruierte Maß σ-finit ist. 43 1.4. TRANSFORMATIONSTHEORIE ′′′ (Und analog dazu: M′1 ⊇ M′2 ⇒ M′′1 ⊆ M′′2 , bzw. M′′1 ⊆ M′′2 ⇒ M′′′ 1 ⊇ M2 ). Außerdem läßt sich zeigen, daß M′ = M′′′ (Siehe J. von Neumann [31], Seite 405). Die von Neumann-Algebra M′′ wird abelsch genannt, wenn M′′ ⊆ M′′′ ; sie wird maximal abelsch genannt, wenn M′′ = M′′′ . Wenn die Operatoren aus M kommutieren, ist M′′ abelsch (Denn aus der Kommutierbarkeit der s.a. Operatoren aus M folgt die Kommutierbarkeit ihrer Spektralscharen und somit P ⊆ P ′ . Hieraus wiederum folgt P ′ ⊇ P ′′ , was aber äquivalent zu M′ ⊇ M′′ ist; wegen M′ = M′′′ ist dann M′′′ ⊇ M′′ ). In de Dormale/Gautrin [11] wird gezeigt: Für einen Satz M kommutierender s.a. Operatoren gibt es genau dann eine Spektraldarstellung, wenn M′′ maximal abelsch ist. Wir haben nun zu zeigen, daß jeder Satz A := {Ai }i∈J kommutierender s.a. Operatoren so erweitert werden kann, daß die vom erweiterten Satz generierte v. NeumannAlgebra maximal abelsch ist. Hierzu stellen wir zunächst fest, daß die abelsche v. Neumann-Algebra A′′ stets zu einer maximal abelschen v. Neumann-Algebra D erweitert werden kann (Siehe Dixmier [10], Seite 12, Proposition 12, bzw. [10], Seite 2). D kann durch einen einzelnen beschränkten Operator B generiert werden: D = {B}′′ (Siehe J. von Neumann [31], Satz 10). Aus {B}′′ = D ⊇ A′′ folgt {B}′′′ ⊆ A′′′ und somit {B}′ ⊆ A′ . Wegen B ∈ {B}′ ⊆ A′ kommutiert B mit allen Elementen aus A, woraus folgt, daß (A ∪ {B})′′ abelsch ist; es gilt somit (A ∪ {B})′′ ⊆ (A ∪ {B})′′′ . Da außerdem ′′ ′′ (A ∪ {B}) ⊇ {B} = {B} ′′′ ′′′ ⊇ (A ∪ {B}) , muß (A ∪ {B})′′ = (A ∪ {B})′′′ sein. QED. Da jeder s.a. Operator A mit sich selbst kommutiert, gibt es für die einelementige Menge {A} stets eine diagonalisierende Darstellung; jeder s.a. Operator A kann somit über eine unitäre Transformation in einen v-Operator übergeführt werden. In diesem Sinne stellen v-Operatoren bereits die allgemeinste Form von s.a. Operatoren dar und man kann sich beim Studium s.a. Operatoren sehr oft auf die v-Operatoren beschränken. Definition 1.37 Einen Satz {Ai }i∈J kommutierender s.a. Operatoren nennt man vollständig, wenn es eine Spektraldarstellung für {Ai }i∈J gibt. Aus dem Beweis von Satz 1.30 folgt: Satz 1.31 Jeder Satz {Ai }i∈J kommutierender s.a. Operatoren kann durch Hinzunahme eines selbstadjungierten beschränkten Operators B zu einem vollständigen Satz {Ai }i∈J ∪ {B} kommutierender s.a. Operatoren erweitert werden. Aus dem Beweis von Satz 1.28 erhält man: 44 KAPITEL 1. MATHEMATISCHE GRUNDLAGEN Satz 1.32 Sind F (λ) und G(λ) zwei s.a. Multiplikationsoperatoren in L2 RI , µ , so kommutieren sie. Wir erwähnen noch, daß die Spektraldarstellung für einen gegebenen vollständigen Satz s.a. Operatoren nicht eindeutig bestimmt ist. Sei beispielsweise T : E −→ L2 RI , µ f 7−→ f (λ) eine Spektraldarstellung für {Ai }i∈I . Ist α(λ) eine beliebige (meßbare) Funktion mit |α(λ)| = 1, so ist T ′ : E −→ L2 RI , µ f 7−→ α(λ) f (λ) ebenfalls eine Spektraldarstellung für {Ai }i∈I . Eine diagonalisierende Darstellung für einen unvollständigen Satz s.a. Operatoren ist natürlich erst recht nicht eindeutig bestimmt. Dennoch gilt folgender Satz: Satz 1.33 Sei {Ai }i∈J ein Satz kommutierender s.a. Operatoren im Hilbertraum E und sei T : E −→ L2 RI , µ f 7−→ f (λ) eine diagonalisierende Darstellung, die die Operatoren Ai in die v-Operatoren λi überführt (für i ∈ J). Sei ∆ eine meßbare Teilmenge von RI und n o ˆ := λ ∈ RI (λi ) ∆ ∈ ∆ . i∈J Dann ist für beliebiges f ∈ E die Größe Z 2 Pf (∆) := |f (λ)| dµ(λ) ˆ λ∈∆ eindeutig definiert und hängt nur von f und ∆ ab, nicht aber von T . m Beweis: Man zeigt leicht, daß für festes f ∈ E und variables ∆ ⊆ RJ durch Pf (∆) 2 ein Maß auf RJ definiert ist (Wegen Pf RJ = kf k ist dieses Maß finit). Nach Seite 16 lassen sich alle meßbaren Teilmengen von RJ mit Hilfe von Mengen des Typs n o m ∆ = (λi )i∈J ∈ RJ λk ∈ δ , k ∈ J, δ ⊆ R (1.10) generieren. Es genügt dann zu zeigen, daß Pf (∆) für alle ∆ der Form (1.10) unabhängig von T ist. Sei Eδk m die Spektralschar von Ak für k ∈ J (Der Begriff der Spektralschar wird δ ⊆R im Abschnitt 3.3 definiert). Nach de Dormale/Gautrin [11], Lemma 5 ist 1 für λk ∈ δ k −1 k k T Eδ T = χδ (λ) mit χδ (λ) = . 0 für λk ∈ /δ Folglich gilt für jedes ∆ der Form (1.10) Z 2 2 Pf (∆) = |f (x)| dµ(x) = Eδk f −1 λ∈πk (δ) QED. ... unabhängig von T . Kapitel 2 Die physikalischen Strukturen der Quantenmechanik 2.1 Zustände und Observablen 2.1.1 Der Zustand in der klassischen Mechanik Wir betrachten zunächst ein kleines Teilchen, das sich frei oder unter dem Einfluß eines Kraftfeldes bewegt. Das Teilchen habe keine inneren Freiheitsgrade, insbesondere also keinen Spin. Ein wichtiges Beispiel für ein solches System ist das Elektron im elektrischen Potential (genaugenommen hat das Elektron zwar einen Spin, doch ist das, bei Abwesenheit von magnetischen Feldern, in guter Näherung vernachlässigbar). Betrachten wir dieses System im Rahmen der klassischen Mechanik, so wird sich das Elektron, mit dem Fortschreiten der Zeit, entlang irgend einer Bahn bewegen; im System läuft also ein Prozeß ab. Hat man zwei identische Systeme (z. B. zwei identische Kraftfelder mit jeweils einem Elektron darin), so ist es durchaus möglich, daß in beiden Systemen zwei verschiedene Prozesse ablaufen. So kann z. B. das Teilchen des ersten Systems in Ruhe sein, während sich das Teilchen des zweiten Systems zunächst schnell bewegt und erst nach einiger Zeit zur Ruhe kommt. Welcher der möglichen Prozesse in einem System abläuft, hängt von den Anfangsbedingungen ab, also von der Präparierung des Systems. Die Anfangsbedingungen können beispielsweise festlegen, zu welchem Zeitpunkt, an welchem Ort und mit welcher Geschwindigkeit das Teilchen ausgesetzt wurde. Die verschiedenen Prozesse, die in einem gegebenen System ablaufen können, nennen wir Zustände des Systems. Ein System verharrt demnach so lange in einem Zustand, bis durch einen äußeren Eingriff ein neuer Zustand aufgezwungen wird. Der Zustand wird häufig auch anders definiert, nämlich als die Gesamtheit aller momentanen Größen des Prozesses (momentaner Impuls, momentaner Ort, usw.). Man hat dann für jeden Zeitpunkt einen neuen Zustand, auch dann, wenn es keinen äußeren Eingriff in das System gibt. Bei unserer Zustandsdefinition bleibt der Zustand dagegen während der gesamten Zeit, die zwischen zwei äußeren Eingriffen liegt, konstant. 45 46 KAPITEL 2. DIE PHYSIKALISCHEN STRUKTUREN Ein Systemzustand kann auf verschiedenste Weisen beschrieben werden. Eine Möglichkeit ist die, für einen bestimmten Zeitpunkt t den Ort und die Geschwindigkeit des Teilchens anzugeben. Denn durch die Angabe der 6 Größen xt , yt , zt , vxt , vyt , vzt ist der gesamte Prozeß vollständig charakterisiert: man kann aus diesen Werten alle anderen physikalischen Größen wie etwa Energie und Drehimpuls berechnen und ist auch in der Lage die zeitliche Entwicklung aller Größen vorauszuberechnen oder zurückzuverfolgen (denn das Kraftfeld wird ja als bekannt vorausgesetzt). Der Systemzustand kann natürlich genausogut durch die Angabe von xt′ , yt′ , zt′ , vxt′ , vyt′ , vzt′ erfolgen (mit t′ > t oder t′ < t), denn aus den Ortsund Geschwindigkeitswerten des Zeitpunktes t′ lassen sich die Orts- und Geschwindigkeitswerte des Zeitpunktes t ermitteln und umgekehrt (sofern zwischen t und t′ kein äußerer Eingriff erfolgt ist, sofern also das System zu den Zeitpunkten t und t′ im selben Zustand ist). Eine weitere Möglichkeit den Systemzustand zu beschreiben besteht darin, xt , yt , zt , Lt , Lzt , Et für einen Zeitpunkt t anzugeben. E ist hierbei die Energie, L der Betrag des Drehimpulses und Lz die z-Komponente des Drehimpulses. 2.1.2 Der Zustand in der Quantenmechanik In der Quantenmechanik ist es nicht möglich, den Zustand durch Angabe von Ort und Geschwindigkeit zu beschreiben, da das quantenmechanische Teilchen weder einen genau definierten Aufenthaltsort hat, noch eine genau definierte Geschwindigkeit. Der quantenmechanische Zustand kann nicht durch die Angabe von ein paar Zahlenwerten charakterisiert werden, sondern wird mit Hilfe einer Funktion beschrieben. So ist es z. B. möglich den Zustand des oben beschriebenen Einteilchensystems durch Angabe einer Funktion aus L2 (R3 , µℓ ) zu beschreiben. Wie bereits für die klassische Mechanik erwähnt, gibt es auch in der Quantenmechanik viele verschiedene Möglichkeiten einen Zustand zu beschreiben. Diese verschiedenen Möglichkeiten haben aber eines gemeinsam, nämlich die HilbertraumStruktur: Axiom 1 Zu jedem quantenmechanischen System gibt es einen separablen Hilbertraum IH, den wir abstrakten Hilbertraum nennen wollen. Jedem Systemzustand entspricht ein Strahl in IH. Die quantenmechanischen Zustände werden also durch Vektoren eines Hilbertraumes beschrieben, wobei aber zwei Vektoren, die in ein und demselben Strahl liegen, den selben Zustand beschreiben. Unser Ziel, geeignete Beschreibungsmöglichkeiten für die Systemzustände zu finden, kann jetzt auch so formuliert werden, daß wir geeignete Beschreibungsmöglichkeiten für die Elemente aus IH finden wollen. Wir müssen also den abstrakten Hilbertraum IH mit Hilfe von konkreten Hilberträumen I der Form L2 R , µ darstellen. Der abstrakte Hilbertraum IH dient als rein theore- tisches Konzept; konkrete Berechnungen werden mit den Funktionen aus L2 RI , µ durchgeführt. Die Vektoren aus IH nennen wir Zustandsvektoren und schreiben sie in der Form |f i, d. h. wir verwenden für die Elemente aus IH die Diracsche Notation. Häufig 2.1. ZUSTÄNDE UND OBSERVABLEN 47 werden wir einfach vom ‘Zustand |f i’ sprechen und meinen damit jenen Zustand, der dem Zustandsvektor |f i zugeordnet ist. Hierbei setzen wir immer voraus (ohne es explizit zu erwähnen), daß |f i vom Nullvektor verschieden ist (Denn der Nullvektor definiert keinen eindeutigen Strahl und somit auch keinen Zustand). Meistens werden wir der Bequemlichkeit halber kf k = 1 wählen. Axiom 1 besagt, daß es für jeden Systemzustand einen eindeutigen Strahl in IH gibt. Das wirft natürlich die Frage auf, ob auch die Umkehrung gilt, ob es also zu jedem Strahl aus IH einen zugehörigen Zustand gibt. Für alle in dieser Arbeit vorkommenden Systeme kann diese Frage uneingeschränkt bejaht werden. Das gilt ganz allgemein für alle Systeme mit fester Teilchenzahl und somit im gesamten Bereich der nichtrelativistischen Quantenmechanik. Systeme mit variabler Teilchenzahl, wie sie in der Quantenfeldtheorie vorkommen, weichen aber von diesem Schema ab: es kann bei solchen Systemen Strahlen aus IH geben, die keinem physikalisch realisierbaren Zustand entsprechen (superselection rules). Für ein korrektes Verständnis des quantenmechanischen Zustandsbegriffes ist es noch notwendig, festzustellen, daß eine Messung am quantenmechanischen System immer einen äußeren Eingriff darstellt, der das System i. allg. in einen neuen Zustand überführt. 2.1.3 Observablen (Meßgrößen) Unter einer einfachen Meßapparatur A für ein quantenmechanisches System S verstehen wir eine Apparatur, die an diesem System eine Messung ausführen kann und dabei als Ergebnis eine reelle Zahl liefert. Betrachten wir beispielsweise ein System, das aus einem frei beweglichen Teilchen besteht, so gibt es eine einfache Meßapparatur Xt , die, zu einem festen Zeitpunkt t, die x-Komponente des Ortes dieses Teilchens messen kann. Sind t1 und t2 zwei verschiedene Zeitpunkte, so sind Xt1 und Xt2 zwei verschiedene Meßapparaturen. Wir nennen diese Meßapparaturen ‘einfach’, um zu betonen, daß sie nur eine reelle Zahl als Meßergebnis liefern und nicht mehrere. Eine Apparatur mit der die x-, y- und z- Komponenten des Ortes eines Teilchens (zum Zeitpunkt t) gemessen werden können, stellt demnach keine einfache Meßapparatur dar, da sie ein Meßergebnis liefert, das aus 3 reellen Zahlen besteht. Man kann sich diese Apparatur aber aus 3 einfachen Meßapparaturen Xt , Yt, Zt zusammengesetzt denken. Eine Apparatur, die mißt, ob sich ein Teilchen (zu einem festen Zeitpunkt t) in einem bestimmten Raumbereich ∆ ⊆ R3 befindet, liefert als Ergebnis den Wert ‘Ja’ oder den Wert ‘Nein’. Um der Forderung nach reellwertigen Meßergebnissen gerecht zu werden, identifizieren wir das Ergebnis ‘Ja’ mit der Zahl 1 und das Ergebnis ‘Nein’ mit der Zahl 0. Dieser Übergang von Ja/Nein auf 1/0 ist keine sinnlose Spielerei, sondern ist notwendig, damit man immer Mittelwerte bilden kann. Wir betrachten jetzt den Fall daß an einem System S mittels einer einfachen Meßapparatur A eine Messung durchgeführt wird, die ein Ergebnis a ∈ R liefert. Das Meßergebnis a hängt natürlich vom Systemzustand |f i ∈ IH ab, ist aber durch diesen i. allg. nicht eindeutig bestimmt. D. h. zu einem festen Zustand |f i kann die Meßapparatur A verschiedene mögliche Meßwerte liefern; welcher Wert sich letztlich 48 KAPITEL 2. DIE PHYSIKALISCHEN STRUKTUREN bei einer konkreten Versuchsdurchführung wirklich ergibt, ist bis zu einem gewissen Grad zufällig (In diesem Sinne sind quantenmechanische Messungen indeterministisch: ein fester Ausgangszustand führt nicht zwangsläufig zu einem bestimmten — vorhersehbaren — Meßergebnis). Bei gegebenem |f i kann aber für die Apparatur A eine statistische Meßwertverteilung PfA (∆) angegeben werden: PfA (∆) = Wahrscheinlichkeit für a ∈ ∆, m ∆ ⊆ R. Zu jeder einfachen Meßapparatur A und zu jedem Zustand |f i ∈ IH gibt es eine eindeutige Verteilung PfA (∆). Stimmen zwei einfache Meßapparaturen A und B für alle |f i ∈ IH in ihren Meßwertverteilungen überein, d. h. m ∀ |f i ∈ IH : ∀∆ ⊆ R : PfA (∆) = PfB (∆) , so sind A und B als äquivalent anzusehen, da sie effektiv dieselbe Messung durchführen (wenngleich die Apparate A und B möglicherweise einen stark unterschiedlichen technischen Aufbau haben). Es ist dann nicht notwendig zwischen diesen beiden Apparaturen zu unterscheiden. Die Tatsache, daß es für einen Apparat A bei gegebenem Systemzustand |f i nicht möglich ist, den Meßwert a exakt vorherzusagen, bezeichnet man oft als Unschärfe von A. Diese Unschärfe entsteht zum einen durch die quantenmechanische Natur des Systems S an dem die Messung durchgeführt wird; darüber hinaus kann sie aber noch verstärkt werden durch eine Unschärfe, die in der Meßapparatur entsteht. Das ist insbesondere dann der Fall, wenn Teile der Meßapparatur quantenmechanisches — und damit indeterministisches — Verhalten aufweisen, was bei bestimmten Meßstreuungen und Meßumwandlungen prinzipiell unvermeidlich ist (Siehe z. B. Ludwig [25], Abschnitte XII.1, XII.2). Für die meisten Fragestellungen reicht es aber aus, nur solche Meßapparaturen zu betrachten, die von sich aus keine zusätzliche Unschärfe einbringen und in diesem Sinne maximal scharf sind. Exakt kann man den Begriff der maximal scharfen Meßapparatur wie folgt definieren: Eine einfache Meßapparatur ist maximal scharf, wenn es keine (von A verschiedene) einfache Meßapparatur A′ gibt, sodaß m ′ ∀ |f i ∈ IH : ∀∆ ⊆ R : PfA (∆) = 0 =⇒ PfA (∆) = 0 . Die Unschärfe einer maximal scharfen Meßapparatur kann also von keiner anderen Meßapparatur unterboten werden; in diesem Sinne ist diese Unschärfe vollständig dem System S selbst zuzuschreiben und nicht der Meßapparatur. Der Extremfall einer nicht maximal scharfen Apparatur ist ein Gerät, das eigentlich nichts mißt und irgend einen (zufälligen) reellen Wert als ‘Meßergebnis’ liefert. Ein wesentlich realistischeres Beispiel für eine nicht maximal scharfe Meßapparatur ist durch eine Anordnung gegeben, die mißt, ob ein Teilchen 1, das zum System S gehört, einen Auffangschirm erreicht, nachdem es mit einem Teilchen 2 (das der Meßapparatur zugerechnet wird) kollidiert ist (Die durch die Quantennatur des Teilchens 2 bedingte Unschärfe bringt zusätzliche Unsicherheit in die Messung). Zweifellos haben die maximal scharfen Meßapparaturen einen wesentlich fundamentaleren Charakter als allgemeine Meßapparaturen und letztere werden oft nur gebaut, um maximal scharfe Apparaturen zu approximieren. Aus diesem Grund ist es 2.1. ZUSTÄNDE UND OBSERVABLEN 49 meistens gerechtfertigt, nur maximal scharfe Meßapparaturen zu betrachten; man muß sich aber vor Augen halten, daß die tatsächlich eingesetzten Meßapparaturen i. allg. nicht maximal scharf sind, auch dann nicht, wenn sie mit maximaler Präzision gebaut wurden (Denn die durch eine solche Apparatur eingebrachte Unschärfe entsteht nicht durch mangelnde Präzision des Meßgerätes, sondern hat ihren Ursprung im verwendeten Meßprinzip). Eine Analyse allgemeiner (also auch nicht notwendigerweise maximal scharfer) Meßapparaturen findet der Leser beispielsweise in G. Ludwig [25] oder in anderen Arbeiten desselben Autors (Unserem Begriff der maximal scharfen Meßapparatur entspricht bei Ludwig der Begriff der Entscheidungsobservable). Eine quantenmechanische Meßgröße ist etwas, das einer einfache Meßapparatur entspricht, wobei aber zwei äquivalente Meßapparaturen ein- und dieselbe Meßgröße definieren (Eine Meßgröße entspricht in diesem Sinne einer ganzen Klasse äquivalenter Meßapparaturen). Eine Meßgröße, die durch eine maximal scharfe Meßapparatur definiert wird, bezeichnen wir als Observable. Wichtige Observablen des Einteilchensystems sind beispielsweise: - die Orts-Observablen Xt , Yt , Zt - die Impuls-Observablen Pxt , Pyt , Pzt - die Energie-Observable Ht . Normalerweise hängen diese Observablen von der Zeit t ab, d. h. man hat für jeden Zeitpunkt t eine eigene Observable, die sich von jener des Zeitpunktes t′ unterscheidet. Axiom 2 Ist IH der abstrakte Hilbertraum eines quantenmechanischen Systems, so entspricht jeder Observable dieses Systems umkehrbar eindeutig ein s.a. Operator in IH. Den s.a. Operator, der einer Observablen entspricht, werden wir ebenfalls als Observable bezeichne, da keine Veranlassung besteht, zwischen der Meßgröße und dem entsprechenden s.a. Operator zu unterscheiden. Obiges Axiom besagt, daß es zu jeder Observablen einen zugehörigen s.a. Operator gibt. Dies wirft natürlich die Frage auf, ob auch die Umkehrung gilt, ob also jedem s.a. Operator eine Observable entspricht. Für alle in dieser Arbeit vorkommenden Systeme kann diese Frage uneingeschränkt bejaht werden1 . Für Systeme mit superselection rules, wie sie in der Quantenfeldtheorie von Bedeutung sind, ist obige Frage dagegen negativ zu beantworten: es gibt s.a. Operatoren, denen keine Observablen entsprechen (siehe z. B. Bogolubov/Logunov/Todorov [5], Seite 126). 1 Natürlich gilt das nur im Prinzip. Etwas exakter könnte man sagen, daß für jeden s.a. Operator eine zugehörige Meßapparatur in beliebig guter Näherung gebaut werden könnte, falls ein hinreichend großer technischer Aufwand getrieben würde. 50 2.1.4 KAPITEL 2. DIE PHYSIKALISCHEN STRUKTUREN Die statistische Interpretation Definition 2.1 Sei {Ai }i∈J eine Menge von Observablen eines quantenmechanischen Systems. Die Observablen heißen kompatibel, wenn sie zusammen gemessen werden können. D. h. man kann für kompatible Observablen Ai (im Prinzip) eine Apparatur bauen, die an ein und demselben System alle Ai mißt, ohne daß sich diese Messungen gegenseitig beeinflussen (D. h. bei mehrfacher Durchführung des Experimentes ergibt sich für jede Observable Ai genau jene statistische Meßwertverteilung, die man erhält, wenn man Ai alleine mißt). Oft wird an Stelle von ‘zusammen meßbar’ auch der Begriff ‘gleichzeitig meßbar’ verwendet, was aber nicht ganz korrekt ist: Die x-Komponente des Ortes zum Zeitpunkt t1 und die y-Komponente des Ortes zum Zeitpunkt t2 sind zwei kompatible Observablen und sind demnach zusammen meßbar. Bei t1 6= t2 ist es aber nicht sinnvoll von gleichzeitiger Messung zu sprechen. Axiom 3 Observablen sind genau dann kompatibel, wenn die entsprechenden selbstadjungierten Operatoren kommutieren. Axiom 4 (Statistische Interpretation) Sei IH der abstrakte Hilbertraum des quantenmechanischen Systems. Sei {Ai }i∈I ein vollständiger Satz kommutierender Observablen und T : IH −→ L2 RI , µ (2.1) |f i 7−→ f (λ) eine entsprechende Spektraldarstellung. Das System sei im Zustand |f i ∈ IH (mit kf k = 1), und ∆ sei eine (meßbare) Teilmenge von RI . Dann ist die Wahrscheinlichkeit, bei einer gemeinsamen Messung der Observablen Ai ein Meßergebnis aus ∆ zu erhalten, gegeben durch Z P (∆) = |f (λ)|2 dµ(λ) . (2.2) λ∈∆ Hat man dagegen einen unvollständigen Observablen-Satz {Ai }i∈J , für den (2.1) eine diagonalisierende Darstellung ist, dann ist die Wahrscheinlichkeit für ein Meßergebm nis aus ∆ ⊆ RJ gegeben durch Z P (∆) = |f (λ)|2 dµ(λ) ˆ λ∈∆ n o ˆ = λ ∈ RI (λi ) ∈ ∆ . mit ∆ i∈J Beispiel 2.1 Sei A eine Observable. Gesucht sei die Wahrscheinlichkeit dafür, bei einer Messung von A einen Wert aus dem Intervall [0, 1] zu erhalten. Sei St : IH −→ L2 R3 , µℓ |f i 7−→ f (λ1 , λ2 , λ3 ) 51 2.2. DAS EINTEILCHENSYSTEM OHNE SPIN eine unitäre Transformation, die A zum v-Operator λ1 macht. Setzt man ˆ := [0, 1] × R × R = (λ1 , λ2 , λ3 ) ∈ R3 λ1 ∈ [0, 1] , ∆ so hat man mit P ([0, 1]) = Z 2 |f (λ)| dµℓ (λ) ˆ λ∈∆ die gewünschte Wahrscheinlichkeit gefunden. Obiges Axiom ist natürlich nur dann sinnvoll, wenn P (∆) durch |f i und ∆ eindeutig bestimmt ist und somit nicht von T abhängt. Aus Satz 1.33 ergibt sich aber, daß diese Eindeutigkeit immer gegeben ist. 2.2 2.2.1 Das Einteilchensystem ohne Spin Orts- und Impuls-Observablen Im Einteilchensystem gibt es naheliegenderweise 3 Orts-Observablen X, Y, Z und 3 Impuls-Observablen Px , Py , Pz (Da es für jeden Zeitpunkt t eigene Observablen gibt, ist es korrekter Xt , Yt , Zt , bzw. Pxt , Pyt , Pzt zu schreiben). Um diese Meßgrößen exakt zu definieren müßte man entsprechende Meßapparaturen angeben, mit denen man diese Größen messen kann. Wir werden uns aber mit einer eher intuitiven Charakterisierung begnügen, die auf Vorstellungen der klassischen Mechanik aufbaut. Die Ortsmeßgrößen entsprechen im wesentlichen jenen der klassischen Mechanik. Die Impulsmeßgrößen ähneln dagegen nur dann den Impulsmeßgrößen der klassischen Mechanik, wenn das quantenmechanische System durch das Modell des klassischen Teilchens approximiert werden kann2 . In manchen Experimenten gleicht das quantenmechanische System aber eher einem klassisches Wellenfeld (“WelleTeilchen-Dualismus”). Dann entspricht der quantenmechanische Impuls dem, was im klassischen Modell der Wellenvektor ist (Näheres hierzu siehe Abschnitt 2.2.3). 2.2.2 Die Schrödinger-Darstellung Satz 2.1 Der Operator 1 ∂ : C0∞ (Rn ) −→ L2 (Rn , µℓ ) , j ∂xi 1 ∂ f (x1 , . . . , xn ) 7−→ f (x1 , . . . , xn ) j ∂xi i ∈ {1, 2, . . . , n} 2 Genaugenommen ähnelt der quantenmechanische Impuls nicht dem klassischen Linearimpuls (=Masse · Geschwindigkeit), sondern dem sogenannten generalisierten (oder kanonisch konjugierten) Impuls, der in der Hamiltonschen Formulierung der klassischen Mechanik auftritt. Beim Teilchen im Potential stimmen Linearimpuls und generalisierter Impuls überein. Beim Teilchen im elektromagnetischen Feld ist dagegen pg = pℓ + qA, wobei pg = (pgx , pgy , pgz ) der generalisierte Impuls ist, pℓ = (pℓx , pℓy , pℓz ) = (mẋ, mẏ, mż) der Linearimpuls und A = (Ax , Ay , Az ) das elektromagnetische Vektorpotential; m und q sind Masse und Ladung des Teilchens (Siehe z. B. Jelitto [23], Seite 6). 52 KAPITEL 2. DIE PHYSIKALISCHEN STRUKTUREN ist e.s.a. und definiert somit einen eindeutigen s.a. Operator in L2 (Rn , µℓ ), den wir mit 1j ∂xi oder mit 1j ∂i bezeichnen wollen. Der Definitionsbereich von 1j ∂i kann über Satz 1.19 bestimmt werden. Er umfaßt alle Funktionen f (x) ∈ L2 (Rn , µℓ ) die eine ‘einigermaßen vernünftig’ definierbare Ableitung 1j ∂x∂ i f (x) besitzen, die wieder in L2 (Rn , µℓ ) liegt. Axiom 5 Seien Xt , Yt , Zt , Pxt , Pyt , Pzt die Orts- und Impuls-Observablen (für den Zeitpunkt t) des Einteilchensystems ohne Spin. Dann gibt es eine unitäre Transformation St : IH −→ L2 R3 , µℓ |f i 7−→ ft (x) = ft (x, y, z) , der obige Observablen wie folgt transformiert: St Xt St−1 St Yt St−1 St Zt St−1 St Pxt St−1 St Pyt St−1 St Pzt St−1 = = = = = = X Y Z Px Py Pz = v-Operator x = v-Operator y = v-Operator z = 1j ∂x = 1j ∂y = 1j ∂z . Wir nennen St die Schrödinger-Darstellung (für den Zeitpunkt t) und ft (x) eine Schrödinger-Funktion. Die Funktion ft (x) als Funktion in x und t wird oft auch Wellenfunktion genannt. Die Schrödinger-Darstellung ist offenbar eine Spektraldarstellung für {Xt , Yt , Zt } (Diese Operatoren bilden somit einen vollständigen Satz kommutierender Observablen). Aus diesem Grund wird die Schrödinger-Darstellung auch Ortsdarstellung genannt. Es muß aber betont werden, daß St durch die Eigenschaft, eine Spektraldarstellung für {Xt , Yt , Zt } zu sein, noch nicht eindeutig bestimmt ist (siehe Seite 44); erst durch die zusätzliche Festlegung der Struktur der Impuls-Observablen ist die Schrödinger-Darstellung eindeutig definiert. Aus der Tatsache, daß St eine Spektraldarstellung für die Orts-Observablen ist, läßt sich über Axiom 4 sofort eine physikalische Interpretation von ft (x) angeben: ist das System in dem durch die Schrödinger-Funktion ft (x) beschriebenen Zustand, so ist Z P (∆) = |ft (x)|2 dµℓ (x) x∈∆ die Wahrscheinlichkeit dafür, daß bei einer Ortsmessung zum Zeitpunkt t das Teilchen im Raumbereich ∆ ⊆ R3 angetroffen R wird (wobei wir — entsprechend der Forderung kf k = 1 — die ‘Normierung’ |ft (x)|2 dµℓ (x) = 1 voraussetzen). Kennt man also ft (x), so kann man direkt alle ‘Ortswahrscheinlichkeiten’ für den Zeitpunkt 2.2. DAS EINTEILCHENSYSTEM OHNE SPIN 53 t ermitteln: |ft (x)|2 ist unmittelbar die ‘Ortswahrscheinlichkeitsdichte’ für den Zeitpunkt t. Da ft (x) über St den Zustandsvektor |f i — und damit den Systemzustand — eindeutig bestimmt, müssen in ft (x) alle Informationen über den Systemzustand enthalten sein. Tatsächlich lassen sich aus ft (x) die Wahrscheinlichkeitsverteilungen aller Meßgrößen ermitteln. So ist es z. B. möglich, von ft (x) auf ft′ (x) zu schließen; aus ft′ (x) kann dann unmittelbar die Wahrscheinlichkeitsverteilung der OrtsObservablen des Zeitpunktes t′ ermittelt werden. Der Übergang von ft (x) auf ft′ (x) wird durch die Zeitentwicklung des Systems festgelegt, die in Abschnitt 2.5 noch näher behandelt wird. Vorläufig werden wir uns damit auseinandersetzen, wie aus ft (x) die Wahrscheinlichkeitsverteilung für die Impuls-Observablen (des Zeitpunktes t) gewonnen werden kann. Definition 2.2 Der Operator F sei wie folgt definiert: mit F : L2 (Rn , µℓ ) −→ L2 (Rn , µℓ ) f (x) 7−→ fe p 1 fe p = √ n 2π Z f (x) e−j (x·p) dµℓ (x) . F heißt (n-dimensionale) Fourier-Transformation und ist (wie sich zeigen läßt) eine unitäre Transformation. Es läßt sich zeigen, daß F die Operatoren 1j ∂i in die v-Operatoren pi überführt (also F 1j ∂i F−1 = pi ). Hieraus folgt offenbar: Satz 2.2 Sei Πt := FSt das Produkt aus Schrödinger-Darstellung und FourierTransformation. Dann ist Πt : IH −→ L2 R3 , µℓ |f i 7−→ fet p = fet (px , py , pz ) eine Spektraldarstellung für die Impuls-Observablen Pxt , Pyt , Pzt . Wir nennen Πt die Impulsdarstellung (für den Zeitpunkt t). Konkret heißt das: um aus der Schrödinger-Funktion ft (x) die Impulsverteilung zu ermitteln, bildet man zunächst die Fourier-Transformierte fet p = Fft (x) . Durch |fe p |2 ist dann die Wahrscheinlichkeitsdichte für die Impuls-Observablen gegeben3 . Umgekehrt kann natürlich auch ft (x) aus fet p ermittelt werden: wie sich zeigen läßt, hat die inverse Fourier-Transformation F−1 die Gestalt Z 1 −1 e f (x) = F ft p = √ 3 fet p e+j (p·x) dµℓ p . 2π 2 R Wobei wir wieder fet p dµℓ p = 1 voraussetzen R 2 (oder äquivalent dazu: |ft (x)| dµℓ (x) = 1). 3 54 KAPITEL 2. DIE PHYSIKALISCHEN STRUKTUREN 2.2.3 Eigenschaften des quantenmechanischen Impulses Sei die Funktion fet p = Πt |f i derart, daß sie nur in einer unmittelbaren Umgebung von p̂ von Null verschieden ist (Scharf bestimmter Impuls). Aus ft (x) = F−1 fet p ist ft (x) wellenförmig mit einem (mittlerem) Wellenvektor k ≈ p̂ (k · ~ ≈ p̂). (2.3) Je schärfer der Impuls bestimmt ist, desto größer ist die Ähnlichkeit von ft (x) mit der ebenen Welle a(t) ejk·x (Insbesondere folgt daraus, daß bei scharf bestimmten Impuls die Funktion ft (x) weit ausgedehnt ist, was offenbar eine große Ortsunschärfe nach sich zieht. Dies führt zur sogenannten Ort-Impuls Unschärferelation, die wir im Abschnitt 2.6.2 noch genauer quantifizieren werden). Der quantenmechanische Impuls tritt somit in vielen Experimenten als Wellenvektor in Erscheinung (Betrag 2π des Wellenvektors = Wellenlänge ). Da Teilchen mit kleiner Masse i. allg. einen kleinen Impuls haben (und damit verbunden eine kleine absolute Impulsunschärfe), tritt die oben beschriebene ‘Wellenerscheinung’ besonders bei leichten Teilchen wie Photonen oder Elektronen auf. Neben dem soeben beschriebenen ‘Wellenvektor-Charakter’ besitzt der quantenmechanische Impuls auch jene Eigenschaft, die man aus der klassischen Mechanik kennt4 : p̂ ≈ mv. (2.4) Hierbei ist m die Masse des Teilchens und v die mittlere (Gruppen- ) Geschwindigkeit, mit der sich das Wellenpaket ft (x) im Raum weiter bewegt (Dieser Sachverhalt läßt sich mit Hilfe der Zeitentwicklungsaxiome von Abschnitt 2.5 herleiten). Da man bei einer großen Masse i. allg. ein gut definiertes v hat, tritt (2.4) besonders bei schweren Teilchen in Erscheinung. Bei leichten Teilchen ist somit der ‘Wellenaspekt’ (2.3) vorherrschend, bei schweren Teilchen dagegen der ‘Teilchenaspekt’ (2.4) (‘Welle-Teilchen Dualismus’). 4 Wir setzen hier voraus, daß ein System vorliegt, in dem der generalisierte Impuls gleich dem Linearimpuls (also gleich mv) ist. Im allgemeineren Fall ist der quantenmechanische Impuls mit dem generalisierten Impuls der klassischen Mechanik zu vergleichen (siehe Fußnote von Seite 51) 55 2.3. DAS EINTEILCHENSYSTEM MIT SPIN 2.3 2.3.1 Das Einteilchensystem mit Spin Der Begriff des Spins Axiom 6 Der Spin s eines Teilchens ist eine Art Eigendrehimpuls. Er ist für jedes Teilchen fest, d. h. er ist — ähnlich der (Ruhe-) Masse des Teilchens — eine Größe, die für eine bestimmte Teilchenart charakteristisch ist. Es gibt 2 Gruppen von Teilchen: 1) Fermionen haben halbzahligen Spin, d. h. es ist s = k + 21 , 2) Bosonen haben ganzzahligen Spin, d. h. es ist s = k, k = 0, 1, 2, . . .. k = 0, 1, 2, . . .. So ist z. B. bei Elektronen, Protonen, Neutronen und Neutrinos s = 12 (Fermionen). Für Photonen ist s = 1 und für π-Mesonen ist s = 0 (Bosonen). Entlang einer beliebigen räumlichen Achse gibt es 2s + 1 Einstellmöglichkeiten für die Spin-Komponente σ: σ = −s, −s + 1, −s + 2, . . . , s − 1, s (Beachte: s ist eine konstante Teilcheneigenschaft, σ dagegen ein variabler physikalischer Meßwert5 ). Ein Teilchen mit Spin kann man sich als eine rotierende Kugel vorstellen; die Rotationsgeschwindigkeit dieser Kugel — und damit den Betrag des Drehimpulses — muß man sich aber als fest vorstellen (entspricht der Tatsache, daß die Zahl s für ein gegebenes Teilchen fest ist). Variabel ist dagegen die Ausrichtung der Drehachse und damit die Größe der Drehimpuls-Komponente, die entlang einer festen Achse abfällt. Die Größe dieser Komponente entspricht dem σ. Obiges Axiom beinhaltet die bemerkenswerte Aussage, daß die Größe σ nur die diskreten Werte −s, −s + 1, . . . , s annehmen kann. Mit σz bezeichnen wir die Spin-Komponente entlang der z-Achse und nennen sie auch z-Komponente des Spins. Wir werden im Folgenden meistens die SpinKomponente entlang des z-Achse betrachten, obwohl wir genausogut jede andere Achse nehmen könnten. Beim klassischen Modell einer elektrisch geladenen rotierenden Kugel ist mit der Rotation stets ein magnetisches Moment verknüpft. Ähnliches gilt auch für das quantenmechanische Teilchen: Axiom 7 Der Spin eines Teilchens ist mit einem magnetischen Moment verknüpft: ist σz die z-Komponente des Spins, und Mz die z-Komponente des magnetischen Momentes6 , so ist: Mz = g · σz . 5 Häufig wird auch der Wert σ als ‘Spin’ bezeichnet. Um ihn aber von s zu unterscheiden, wollen wir σ immer ‘Spinkomponente’ nennen. 6 Zusätzlich kann es noch ein magnetisches Moment geben, das mit dem Bahndrehimpuls des Teilchens (also mit der Bewegung des Teilchens im Raum) verknüpft ist. Dieses Moment wollen wir hier außer acht lassen 56 KAPITEL 2. DIE PHYSIKALISCHEN STRUKTUREN g ist eine von der Teilchenart abhängige Konstante. Für das Elektron ist in sehr guter Näherung g = − mee , wobei e die Elementarladung ist (e ≈ 1.6 · 10−19 C) und me die Masse des Elektrons (siehe z. B. [40], Seite 166). Für das Proton ist g = 2.795 mep , wobei e wieder die Elementarladung ist und mp die Masse des Protons. Das Neutron hat keine Ladung und dürfte somit nach klassischen Vorstellungen kein magnetisches Moment besitzen. Tatsächlich hat aber auch das Neutron ein magnetisches Moment und zwar mit g = −0.96 men . Hierbei ist mn die Masse des Neutrons und e Elementarladung (siehe z. B. [7], Seite 265). Da man sich bei der Formulierung der Quantenmechanik nicht bedenkenlos auf Begriffe der Klassischen Physik stützen darf, müßte man bei den beiden letzten Axiomen präzisieren, was man unter Drehimpuls und magnetischem Moment versteht. Diese Präzisierung kann durch die Beschreibung von Meßapparaturen erfolgen: man gibt an, wie die Größen σz und Mz zu messen sind und definiert dadurch ihre physikalische Bedeutung. Wir wollen hier nicht näher darauf eingehen und uns lediglich auf die Feststellung beschränken, daß die Messung von σz über die Drehimpulserhaltung erfolgen kann (z. B. Einstein – de Haas Effekt), und jene von Mz über die Ablenkung des Teilchens im elektromagnetischen Feld. Da der Faktor g für eine gegebene Teilchenart konstant ist, ist es aber für viele Überlegungen unnötig zwischen σz und Mz zu unterscheiden. 2.3.2 Die Schrödinger-Darstellung für das Teilchen mit Spin Den Zustand des Teilchen ohne Spin konnten wir durch Schrödinger-Funktionen der Gestalt f (r) = f (x, y, z) ∈ L2 R3 , µℓ (2.5) beschreiben. Beim Teilchen mit Spin tritt an Stelle von (2.5) ein ganzes Funktionstupel: fs (r) fs−1 (r) f(r) = (2.6) , mit fσz (r) ∈ L2 R3 , µℓ . .. . f−s (r) Um eine formale Analogie zu Axiom 5 herstellen zu können, werden wir (2.6) in eine andere Form bringen. Wir führen hierzu folgende Funktion ein: x z }| { f (x) = f(x, y, z , σz ) = f (r, σz ) := fσz (r) . | {z } r Legt man fest, daß σz nur die diskreten Werte −s, −s + 1, . . . , s annehmen darf, so entspricht die Funktion f (x) offensichtlich genau dem Tupel aus (2.6). Die Einschränkung σz ∈ {−s, −s + 1, . . . , s} kann auch so formuliert werden, daß man fordert f (x) ∈ L2 R4 , µsℓ 57 2.3. DAS EINTEILCHENSYSTEM MIT SPIN mit µsℓ (∆) = s X σz =−s µℓ (∆σz ) , ∆σz = r ∈ R3 (r, σz ) ∈ ∆} . (2.7) Die Punkte x ∈ R4 mit σz ∈ / {−s, −s + 1, . . . , s} bilden bezüglich µsℓ eine Nullmenge und sind daher für die Funktion uninteressant: zwei Funktionen f1 (r, σz ) , f2 (r, σz ), die sich nur für σz ∈ / {−s, −s + 1, . . . , s} voneinander unterscheiden, sind (bez. µsℓ ) a.e. gleich, und stellen somit dasselbe Element aus L2 (R4 , µsℓ ) dar. Man hat also eine umkehrbar eindeutige Entsprechung zwischen den Elementen aus L2 (R4 , µsℓ ) und den Funktionstupeln (2.6). Das Skalarprodukt in L2 (R4 , µsℓ ) hat die Form hf | gi = Z f (r, σz )g(r, σz ) dµsℓ (r, σz ) = Z s X fσz (r)gσz (r) dµℓ (r) . σz =−s Im Folgenden werden wir uns auf den Fall s = 21 beschränken; der allgemeine Fall kann aber ganz analog behandelt werden. Bei s = 12 entspricht jedes f (x) ∈ L2 (R4 , µsℓ ) umkehrbar eindeutig einem Paar (f+ 1 (r) , f− 1 (r) ) mit 2 2 f± 1 (r) ∈ L2 (R3 , µℓ ). Es ist aber üblich, an Stelle der Indizes + 12 , − 12 die Symbo2 le ↑, ↓ zu verwenden. Wir haben somit die Entsprechung f↑ (r) f (x) = f (r, σz ) ←→ f(r) = . f↓ (r) Ein linearer Operator A in L2 (R4 , µsℓ ) bildet Spaltenvektoren des Typs f(r) wieder auf Spaltenvektoren desselben Typs ab. Aus der Linearität von A folgt, daß man A als Matrix darstellen kann: g↑ (r) A↑↑ A↑↓ f↑ (r) g(x) = Af (x) ←→ = · . g↓ (r) A↓↑ A↓↓ f↓ (r) Für die rechts stehende Matrizen-Gleichung schreiben wir auch A↑↑ A↑↓ g(r) = Af (r) , mit A = . A↓↑ A↓↓ Die 4 Matrix-Elemente von A sind offenbar lineare Operatoren in L2 (R3 , µℓ ). In L2 (R4 , µsℓ ) gibt es 4 v-Operatoren x, y, z, σz . In Matrix-Form erhalten diese die Gestalt 1 1 0 x 0 y 0 z 0 , , , . 0 x 0 y 0 z 2 0 −1 Die in den Matrizen auftretenden Operatoren x, y, z sind die v-Operatoren von L2 (R3 , µℓ ); 1 ist der Einheitsoperator in L2 (R3 , µℓ ). Nun sind wir in der Lage, das grundlegende Axiom für das Einteilchensystem mit Spin zu formulieren: 58 KAPITEL 2. DIE PHYSIKALISCHEN STRUKTUREN Axiom 8 Seine Xt , Yt , Zt , Pxt , Pyt , Pzt, Σxt , Σyt , Σzt die Observablen für die Orts-, Impuls- und Spin-Komponenten (des Zeitpunktes t) im Einteilchensystem mit Spin 1 . Dann gibt es eine unitäre Transformation 2 St : IH −→ L2 R4 , µsℓ |f i 7−→ ft (x) = ft (x, y, z, σz ) , der obige Observablen wie folgt transformiert: −1 S t Xt S t = X = x ... X = −1 St Y t St = Y = y ... Y = −1 St Z t St = Z = z ... Z = −1 1 St Σzt St = Σz = σz ... Σz = 2 St Σxt St−1 = Σx ... Σx = St Σyt St−1 = Σy ... Σy = St Pxt St−1 = Px = 1 ∂ j ∂x ... Px = St Pyt St−1 = Py = 1 ∂ j ∂y ... Py = St Pzt St−1 = Pz = 1 ∂ j ∂z ... Pz = 0 x 0 v-Operatoren y in L2 (R4 , µsℓ ) 0 z 0 −1 0 1 1 2 1 0 0 −j 1 2 j 0 1 ∂ 0 j x 0 1j ∂x 1 ∂ 0 j y 0 1j ∂y 1 ∂ 0 j z 0 1j ∂z x 0 y 0 z 0 1 0 . Wir nennen St Schrödinger-Darstellung und ft (x) Schrödinger-Funktion. Die Spin-Observablen sind offenbar beschränkt und somit überall definiert. Px ist 1 1 4 für all jene f (r, σz ) ∈ L2 (R , µsℓ ) definiert, für die f r, + 2 und f r, − 2 im Definitionsbereich von 1j ∂x liegen (analoges gilt für Py und Pz ). {Xt , Yt , Zt , Σzt } ist offensichtlich ein vollständiger Satz kommutierender Observablen (Natürlich läßt sich zeigen, daß auch {Xt , Yt , Zt , Σxt } und {Xt , Yt , Zt , Σyt } vollständige Sätze kommutierender Observablen sind, denn die z-Achse ist ja durch nichts ausgezeichnet und wurde in unserer Schrödinger-Darstellung ganz willkürlich bevorzugt). Auch {Pxt , Pyt , Pzt , Σzt } ist ein vollständiger Satz kommutierender Observablen: eine entsprechende Spektraldarstellung erhält man aus der SchrödingerDarstellung über die (3-dimensionale) Fourier-Transformation: fe(px , py , px , σz ) = Ff (x, y, z, σz ) Z 1 = √ 3 f (x, y, z, σz ) e−j(xpx +ypy +zpz ) dµℓ (x, y, z) . 2π 59 2.4. MEHRTEILCHENSYSTEME 2.4 Mehrteilchensysteme Wir beschränken uns hier auf solche Mehrteilchensysteme, bei denen sich die einzelnen Teilchen aufgrund fester Teilcheneigenschaften (wie Masse, Ladung oder Spin) unterscheiden. Für Systeme identischer Teilchen gelten einige Besonderheiten, auf die wir hier nicht eingehen wollen. Axiom 5 läßt sich sofort für Systeme mit N (unterscheidbaren!) Teilchen verallgemeinern: man hat (für jeden Zeitpunkt t) 3N Orts-Observablen X1 , Y1 , Z1 , . . . , XN , YN , ZN und 3N Impuls-Observablen PX1 , PY 1 , PZ1 , . . . , PXN , PY N , PZN , die durch die Schrödinger-Darstellung St : IH −→ L2 R3N , µℓ |f i 7−→ f (x) auf die v-Operatoren bzw. auf die Ableitungsoperatoren transformiert werden. Die Schrödinger-Funktionen haben die Gestalt f (x) = f( x1 , y1 , z1 , . . . , xN , yN , zN ) = f (r1 , . . . , r N ) ∈ L2 R3N , µℓ . | {z } | {z } r1 rN Der Zustand eines 2-Teilchensystems wird beispielsweise durch eine SchrödingerFunktion f (x1 , x2 , x3 , x4 , x5 , x6 ) = f (r 1 , r 2 ) ∈ L2 R6 , µℓ beschrieben. Die Funktion |f (r 1 , r 2 )|2 ist nach Axiom 4 die Wahrscheinlichkeitsdichte für den kombinierten Ort: es ist die Wahrscheinlichkeitsdichte dafür, daß man Teilchen 1 am Ort r1 findet, und Teilchen 2 am Ort r 2 (Verbundwahrscheinlichkeiten). Für das N-Teilchensystem mit Spin ergeben sich ganz analoge Verhältnisse: man hat Schrödinger-Funktionen der Form f (x) = f (r 1 , σ1 , r2 , σ2 , . . . , r N , σN ) ∈ L2 R4N , µsℓ , wobei das Maß µsℓ derart definiert ist, daß Z f (x)g(x) dµsℓ (x) = s1 X s2 X σ1 =−s1 σ2 =−s2 ··· Z sN X σN =−sN f (x)g(x) dµℓ (r 1 , r 2 , . . . , rN ) . 60 KAPITEL 2. DIE PHYSIKALISCHEN STRUKTUREN 2.5 2.5.1 Die Zeitentwicklung des Systems Der Hamilton-Operator In jedem quantenmechanischen System gibt es eine (i. allg. zeitabhängige) Observable Ht , die für die Zeitentwicklung des Systems bestimmend ist. Man nennt Ht den Hamilton-Operator und beschreibt ihn meistens durch die Angabe des entsprechenden Operators Ht = St Ht St−1 in der Schrödinger-Darstellung. Um Ht zu ermitteln gibt es empirisch gefundene Konstruktionsregeln, die z. B. in Messiah [29], Abschnitt 2.2.7, beschrieben werden. Wir geben hier das fertige Ergebnis für einige wichtige Fälle an. Spinloses Teilchen im Potential Der Laplace-Operator △ in L2 (R3 , µℓ ) ist definiert durch △ := ∂x2 + ∂y2 + ∂z2 Hierbei ist ∂i2 = −( 1j ∂i )2 ; 1j ∂i ist der auf Seite 51 definierte s.a. Operator. Der Definitionsbereich D△ von △ ergibt sich gemäß Seite 32 aus den Definitionsbereichen der 1j ∂i . Es läßt sich zeigen, daß △ s.a. ist7 . Mit V(x) bezeichnen wir eine (meßbare) R3 → R - Funktion; faßt man V (x) als Multiplikationsoperator auf, so hat man einen Operator mit Definitionsbereich Z o n 3 DV = f (x) ∈ L2 R , µℓ |V (x) f (x) |2 dµℓ (x) < ∞ ; Nach Satz 1.28 ist dieser Operator s.a.. Wir betrachten nun den Operator H̆ := − 1 △ + V (x) , 2m (2.8) der den Definitionsbereich DH̆ = D△ ∩ DV hat (m sei eine positive Konstante). Dieser Operator ist i. allg. nicht s.a.; für eine sehr große Klasse von Funktionen V (x) 7 Um die Selbstadjungiertheit von △ zu zeigen, betrachten wir △ in der Impulsdarstellung. Dort hat △ die Form Z n o e = p2 + p2 + p2 , D e = fe ∈ L2 R3 , µℓ fe p 2 p2 dµℓ p < ∞, i = 1, 2, 3 . △ 1 2 3 i △ Man prüft leicht nach, daß Z n o 3 e fe p 2 p2 + p2 + p2 dµℓ p < ∞ D△ = f ∈ L R , µ 2 ℓ e 1 2 3 e ein Multiplikationsoperator im Sinne von Definition 1.31 ist. Nach und hat dadurch gezeigt, daß △ e Satz 1.28 ist △ dann s.a., was nach Satz 1.26 die Selbstadjungiertheit von △ nach sich zieht. QED. 61 2.5. DIE ZEITENTWICKLUNG DES SYSTEMS ist er aber e.s.a. und hat somit eine eindeutige s.a. Erweiterung H (In den meisten Fällen ist der Operator H derart, daß er auch auf dem sehr ‘kleinen’ Bereich C0∞ (R3 ) e.s.a. ist). Axiom 9 Wir betrachten das System des spinlosen Teilchens der Masse m, das sich im Potential V (x) bewegt (V (x) sei derart, daß (2.8) e.s.a. ist). Der HamiltonOperator H = St Ht St−1 ist dann durch die (eindeutige) s.a. Erweiterung von (2.8) gegeben. Hat man ein zeitabhängiges Potential Vt (x), so ergibt sich entsprechend ein zeitabhängiger Operator Ht . V (x) ist hierbei jenes energetische Potential (= potentielle Energie), das man erhält, wenn man das System aus der Sichtweise der klassischen Physik betrachtet. Beispiel 2.2 Betrachtet man ein Elektron, das sich im elektrostatischen Feld bewegt, so liegt genau obiger Fall vor: das elektrostatische Feld E(x) kann mit Hilfe eines elektrischen Potentials φ(x) beschrieben werden: E(x) = −grad φ(x). Bezeichnet man die Ladung des Elektrons mit −e (e ≈ 1, 6 · 10−19 C), so erhält man das energetische Potential (= potentielle Energie) V (x) = −eφ(x) . Der Spin des Elektrons wurde hier außer Acht gelassen, was — wegen der Absenz magnetischer Felder — in sehr guter Näherung zulässig ist. Hat man kein statisches, sondern ein langsam veränderliches elektrisches Feld, so kann dieses näherungsweise immer noch durch ein elektrisches Potential φt (x) beschrieben werden (E t (x) = −grad φt (x)) und man hat Vt (x) = −eφt (x) . Bei schnell veränderlichem elektromagnetischen Feld wird diese Näherung unbrauchbar, da die Bewegung des Teilchens dann nicht mehr durch ein Potential Vt (x) bestimmt ist; Axiom 9 kann auf diesen Fall nicht angewandt werden. Spinloses Teilchen im elektromagnetischen Feld Wir betrachten den Operator H̆t = − 1 jq jq q2 △ + A · grad + div A + A · A + qφ. 2m m 2m 2m (2.9) Hierbei ist: m = Masse des Teilchens, q = Ladung des Teilchens (für das Elektron ist beispielsweise q ≈ −1.6 · 10−19 ). φ und A sind das skalare Potential und das Vektorpotential des elektromagnetischen Feldes, d. h. E t (x) = − ∂ A (x) − grad φt (x) , ∂t t B t (x) = rot At (x) . Für eine größe Klasse von Potentialen ist H̆t e.s.a.. Axiom 10 Im System des geladenen spinlosen Teilchens im elektromagnetischen Feld ist der Hamilton-Operator Ht = St Ht St−1 durch die s.a. Erweiterung des Operators (2.9) gegeben (Wir setzen voraus, daß die Potentiale derart sind, daß (2.9) e.s.a. ist). 62 KAPITEL 2. DIE PHYSIKALISCHEN STRUKTUREN Teilchen mit Spin im elektromagnetischen Feld Für das geladene Teilchen mit Spin s = 12 , das sich im elektromagnetischen Feld bewegt, ist der Hamilton-Operator H = St Ht St−1 (in guter Näherung8 ) durch die s.a. Erweiterung von H̆↑↑ H̆↑↓ H̆b 0 = + H̆t = H̆↓↑ H̆↓↓ 0 H̆b 1 0 −Bx 0 jBy −Bz 0 + g + + −Bx 0 −jBy 0 0 Bz 2 gegeben. H̆b ist hierbei der Operator aus (2.9). Bx , By , Bz sind die Komponenten des magnetischen Feldes, und g ist der Faktor aus Axiom 7 (Wir setzen wieder voraus, daß die Felder derart sind, daß obiger Operator e.s.a. ist). 2.5.2 Die quantenmechanische Energie Der im letzten Abschnitt eingeführte Hamilton-Operator ist per definitionem die Energie-Observable und legt somit fest, was man in der Quantenmechanik unter Energie versteht. In vielen Situationen besteht eine große Ähnlichkeit zwischen der quantenmechanischen Energie und dem Energie-Begriff der klassischen Mechanik. Dies gilt i. allg. aber nur für schwere Teilchen, denn nur für diese können Ort und Geschwindigkeit gleichzeitig geringe Unschärfe besitzen, sodaß der klassische Energie-Ausdruck mv 2 E= + V (x) 2 sinnvoll definiert ist. Die quantenmechanische Energie hat aber auch die Eigenschaft eine ‘Schwingfrequenz’ zu sein: wie sich (mit hilfe der Zeitentwicklungsaxiome) zeigen läßt, führt eine sich stark um den Wert Ê konzentrierende Energieverteilung zu einer Zeitentwicklung der Form ft (λ) ≈ ft0 (λ) ejω·(t−t0 ) mit ω ≈ Ê 2.5.3 (ω · ~ ≈ Ê). Implizite und explizite Zeitabhängigkeit der Observablen Sei Xt die Observable für die Messung der x-Komponente des Ortes zum Zeitpunkt t. Xt ist natürlich zeitabhängig, da man für die Ortsmessung zum Zeitpunkt t1 i. allg. ein anderes Ergebnis erwarten wird, wie für die Ortsmessung zum Zeitpunkt t2 (Denn während des Zeitraumes [t1 , t2 ] hat das Teilchen — sofern es sich bewegt — seinen Aufenthaltsort verändert). Transformiert man Xt in die 8 Wir vernachlässigen hier die sogenannte Spin-Bahn Kopplung (Siehe z. B. [23], Seite 40). 63 2.5. DIE ZEITENTWICKLUNG DES SYSTEMS Schrödinger-Darstellung des Zeitpunktes t, so erhält man aber einen zeitunabhängigen Operator: X = St Xt St−1 = v-Operator x ... unabhängig von t. Die Zeitabhängigkeit von Xt wird durch die Zeitabhängigkeit von St aufgehoben. Dasselbe gilt auch für alle anderen Orts-Observablen, sowie für die Impuls- und SpinObservablen: sie alle verlieren in der Schrödinger-Darstellung ihre Zeitabhängigkeit. Anders verhält es sich für den Hamilton-Operator Ht : bei veränderlichem elektromagnetischen Feld ist Ht = St Ht St−1 zeitabhängig. Man sagt dann, die Observable Ht sei explizit zeitabhängig, während die vorher genannten Observablen nur implizit zeitabhängig sind. Da der Übergang von der Schrödinger-Darstellung zur Impulsdarstellung unabhängig von t ist (diese Übergang wird durch die — zeitunabhängige! — FourierTransformation vermittelt), verlieren auch in der Impulsdarstellung alle nur implizit zeitabhängigen Observablen ihre Zeitabhängigkeit. Darstellungen, die (wie die Impulsdarstellung) über eine zeitunabhängige Transformation mit der SchrödingerDarstellung verknüpft sind, nennen wir Schrödinger-Bild-Darstellungen. 2.5.4 Zeitentwicklungs-Operator und Schrödinger-Gleichung Axiom 11 Für alle t0 , t ∈ R gibt es einen unitären Operator Ut0 t : IH −→ IH, sodaß für alle nur implizit zeitabhängigen Observablen At gilt At = Ut−1 At0 Ut0 t . 0t Ferner ist Ut−1 = Utt0 , wodurch sich folgende einprägsame Form ergibt: 0t At = Utt0 At0 Ut0 t . Ut0 t heißt Zeitentwicklungs-Operator von t0 nach t und kann über folgende Gleichung bestimmt werden: d j Ut0 t = Ut0 t Ht (2.10) dt (Anfangsbedingung: Ut0 t0 = 1). d Intuitiv dürfte klar sein, was unter dt Ut0 t zu verstehen ist. Die mathematisch exakte Formulierung von Gleichung (2.10) lautet aber 1 H-lim j (Ut0 ,t+∆t − Ut0 t ) |f i = Ut0 t Ht |f i , für alle |f i ∈ DHt (2.11) ∆t→0 ∆t (Siehe Prugovečki [34], Seite 297). 64 KAPITEL 2. DIE PHYSIKALISCHEN STRUKTUREN Man sieht, daß der Hamilton-Operator den Zeitentwicklungs-Operator Ut0 t bestimmt, und damit die Dynamik aller nur implizit zeitabhängigen Observablen. Ist At nur implizit zeitabhängig, so gibt es in der Schrödinger-Darstellung einen zeitunabhängigen Operator A, sodaß At = St−1 ASt . (2.12) Setzt man A = St0 At0 St−1 in (2.12) ein, so erhält man 0 At = St−1 St0 At0 St−1 St , 0 woraus sich schließlich folgende nützliche Beziehungen ergeben: Ut0 t = St−1 St , 0 Ut−1 = St−1 St0 . 0t (2.13) Satz 2.3 Sei ft (x) die Wellenfunktion des Systems (also ft (x) = St |f i). Dann gilt ft (x) = Ut0 t ft0 (x) . (2.14) Hierbei ist Ut0 t = St Ut0 t St−1 der Zeitentwicklungs-Operator in der SchrödingerDarstellung. Beweis: ft0 (x) = St St−1 St St−1 ft0 (x) = Ut0 t ft0 (x) . ft (x) = St |f i = St St−1 0 0 | {z } Ut0 t QED. Man sieht leicht, daß ein analoger Satz auch für die Impulsdarstellung gilt, und ganz allgemein für jede Schrödinger-Bild-Darstellung. Der Operator Ut0 t = St Ut0 t St−1 kann aber nicht unmittelbar über (2.10) bestimmt werden, da d d d −1 Ut t = St Ut0 t St 6= St Ut t St−1 . dt 0 dt dt 0 Geeignete Umformungen führen aber zu Satz 2.4 Die Bestimmungsgleichung für Ut0 t = St Ut0 t St−1 lautet: j (Ht = St Ht St−1 ). d Ut t = Ht Ut0 t dt 0 (2.15) 65 2.5. DIE ZEITENTWICKLUNG DES SYSTEMS Beweis: Offenbar gilt d d −1 d d −1 −1 Ut0 t = Ut0 t Ut0 t Ut−1 = S S U S S = S U t t0 t t t t t St0 . t0 0t } 0 dt dt dt t0 | {z dt 0 Ut0 t Gleichung (2.10) liefert dann Ut0 t z }| { d = St0 St−1 St St−1 Ht St St−1 j Ut0 t = St0 Ut0 t Ht St−1 St St−1 = Ht Ut0 t . 0 0 dt | {z } | {z } 0 Ht Ut0 t QED. Ergänzung: Die exakte mathematische Formulierung von (2.15) lautet: 1 (Ut0 ,t+∆t − Ut0 t ) f (x) = Ht Ut0 t f (x) , H-lim j für Ut0 t f (x) ∈ DHt . ∆t→0 ∆t Denn mit den in obigem Beweis angeführten Umformungen erhält man aus (2.11) 1 H-lim j (Ut0 ,t+∆t − Ut0 t ) St0 |f i = Ht Ut0 t St0 |f i . ∆t→0 | {z } | {z } ∆t f (x) f (x) Die Bedingung Ut0 t f (x) ∈ DHt ergibt sich aus Ut0 t f (x) = Ut0 t St0 |f i = St |f i und |f i ∈ DHt (⇔ St |f i ∈ DHt ). Einen analogen Satz gibt es natürlich auch für die Impulsdarstellung, sowie für jede andere Schrödinger-Bild-Darstellung. Zu beachten ist, daß man in (2.15) den Ausdruck Ht Ut0 t findet, während in (2.10) der Ausdruck Ut0 t Ht vorkommt (umgekehrte Reihenfolge!). Oft ist es günstiger an Stelle von (2.14) eine Formulierung zu wählen, bei der die Zeitentwicklung von ft (x) direkt mit Hilfe von Ht bestimmt werden kann, ohne den Umweg über Ut0 t zu gehen: Satz 2.5 ((zeitabhängige) Schrödinger-Gleichung) Sei ft (x) die Wellenfunktion des Systems (also ft (x) = St |f i) und Ht = St Ht St−1 der Hamilton-Operator in Schrödinger-Darstellung. Dann gilt j ∂ ft (x) = Ht ft (x) ∂t (2.16) (für ft (x) ∈ DHt ). Beweis: j ∂ ∂ ft (x) = j Ut0 t ft0 (x) = Ht ft (x) . ∂t ∂t QED. Eine analoge Gleichung gibt es auch in jeder anderen Schrödinger-Bild-Darstellung. 66 KAPITEL 2. DIE PHYSIKALISCHEN STRUKTUREN 2.5.5 Systeme mit konstanter Energie In der klassischen Mechanik haben Systeme mit konstanter Energie eine große Bedeutung; es sind das genau jene Systeme, die keinen Energieaustausch mit ihrer Umwelt haben und somit eine konstante innere Gesamtenergie besitzen. Das quantenmechanische Analogon hierzu ist das System mit zeitunabhängigen Hamilton-Operator Ht = H (Denn dieser Operator ist per definitionem die Energie-Observable). Für solche Systeme gelten einige Besonderheiten, auf die wir hier kurz eingehen wollen. Ist Ht = H zeitunabhängig, so gibt es eine (zeitunabhängige!) unitäre Transformation T : IH −→ L2 RI , µ (2.17) |f i 7−→ f (λ) , die H in den v-Operator λH = πH (λ) überführt. Wegen der Zeitunabhängigkeit von T ist dtd (T Ut0 t T −1 ) = T ( dtd Ut0 t )T −1 . Aus (2.10) ergibt sich dann j d Ut t = Ut0 t λH , dt 0 Ut0 t0 = 1 (2.18) (mit Ut0 t = T Ut0 t T −1 , λH = T HT −1 ). Man kann leicht nachprüfen, daß der Multiplikationsoperator Ut0 t = e−jλH ·(t−t0 ) (2.19) die Lösung von (2.18) ist. Für Ut0 t = T −1 Ut0 t T schreiben wir aufgrund von (2.19) Ut0 t = e−jH·(t−t0 ) (auf diese Notation werden wir im Abschnitt 3.2 näher eingehen). Der folgende Satz zeigt, daß ein nicht explizit zeitabhängiger Hamilton-Operator Ht überhaupt keine Zeitabhängigkeit hat: Satz 2.6 Sei Ht der Hamilton-Operator und Ht ein unitäräquivalenter Operator in einer Schrödinger-Bild-Darstellung (z. B. Ht = St Ht St−1 ). Dann gilt: Ht ist genau dann unabhängig von t, wenn Ht unabhängig von t ist. Beweis: Sei Ht = H unabhängig von t. Dann gibt es eine unitäre Transformation (2.17), die H, Ut0 t in λH , e−jλH ·(t−t0 ) überführt. Aus e−jλH ·(t−t0 ) λH e+jλH ·(t−t0 ) = λH folgt Ut0 t HUt−1 = H. 0t Ist St die Schrödinger-Darstellung (oder irgend eine andere Schrödinger-Bild-Darstellung), so gilt nach (2.13) St = St0 Ut0 t und man erhält: −1 Ht = St HSt−1 = St0 Ut0 t HUt−1 = Ht0 . t St | {z 0 } 0 H Ht ist somit ebenfalls unabhängig von t. 67 2.5. DIE ZEITENTWICKLUNG DES SYSTEMS Um zu zeigen, daß aus der Zeitunabhängigkeit von Ht die Zeitunabhängigkeit von Ht folgt, geht man ganz ähnlich vor: man definiert analog zu (2.17) eine unitäre Transformation T , die H in einen v-Operator λH überführt. Man erhält dann an Stelle von (2.18) die aus (2.15) folgende Beziehung j d Ut t = λH Ut0 t , dt 0 Ut0 t0 = 1 (Ut0 t = T Ut0 t T −1 ), die aber dieselbe Lösung wie (2.18) liefert. Der Operator H kommutiert dann mit Uet0 t = St Ut0 t St−1 und man hat −1 −1 Ht = St−1 HSt = St−1 Uet0 t HUet−1 t St = Ut0 t St HSt Ut0 t = Ht0 . | {z } | {z 0 } Ht H QED. Neben der Energie kann es aber auch noch andere Größen geben, die zeitunabhängig sind. Man nennt diese Größen Erhaltungsgrößen und es gilt: Satz 2.7 Sei H der (zeitunabhängige) Hamilton-Operator und At eine nur implizit zeitabhängige Observable. At ist genau dann eine Erhaltungsgröße (d. h. At = At0 für alle t), wenn At mit H kommutiert. Beweis: At ist genau dann eine Erhaltungsgröße, wenn At = Ut−1 At0 Ut0 t . 0t Da diese Gleichung äquivalent ist zu Ut0 t At = At0 Ut0 t , ist At genau dann eine Erhaltungsgröße, wenn At0 mit Ut0 t kommutiert. Nach Satz 3.6 ist dies aber genau dann der Fall, wenn At0 mit H kommutiert (Denn es ist Ut0 t = e−jH·(t−t0 ) ). QED. 2.5.6 Stationäre Zustände Im diesem Abschnitt setzen wir voraus, daß Ht = H unabhängig von t ist. Definition 2.3 Ein Zustand |f i ∈ IH heißt stationär, wenn für alle t ∈ R gilt: Ut0 t |f i = αt0 t |f i , αt0 t ∈ C mit |αt0 t | = 1. Für eine beliebige Schrödinger-Bild-Darstellung Tt gilt: |f i ist genau dann stationär, wenn für ft (λ) = Tt |f i gilt: ft (λ) = αt0 t ft0 (λ) a.e., |αt0 t | = 1. Hieraus folgt |ft (λ)| = |ft0 (λ)| a.e.. Bei stationären Zuständen sind somit die Wahrscheinlichkeitsverteilungen aller nur implizit zeitabhängigen Observablen unabhängig von t. 68 KAPITEL 2. DIE PHYSIKALISCHEN STRUKTUREN Satz 2.8 (Zeitunabhängige Schrödinger-Gleichung) Sei H der (zeitunabhängige) Hamilton-Operator und |f i ein beliebiger Zustand. Dieser Zustand ist genau dann stationär, wenn |f i ein eigentlicher Eigenvektor von H ist, wenn es also ein E ∈ R gibt, sodaß H |f i = E |f i , |f i ∈ DH . Es ist dann Ut0 t |f i = αt0 t mit αt0 t = e−jE·(t−t0 ) . Beweis: Wir schreiben Ut für Ut0 t und nehmen ohne Beschränkung der Allgemeinheit an, daß t0 = 0 ist. Sei T die unitäre Transformation (2.17), die H, Ut in die Multiplikationsoperatoren λH , e−jλH t überführt. Wir haben nun die Äquivalenz der beiden folgenden Aussagen zu zeigen: ∀t ∈ R : e−jλH t f (λ) = αt f (λ) a.e. , |αt | = 1 (2.20) ∃E ∈ R : (λH f (λ) = Ef (λ) a.e.) (2.21) (In (2.21) ist die Bedingung |f i ∈ DH bereits enthalten: da Ef (λ) immer quadratintegrabel ist, impliziert (2.21) die Quadratintegrabilität von λH f (λ); diese wiederum ist äquivalent zu |f i ∈ DH ). Aus (2.21) folgt: fast überall in RI ist λH = E oder f (λ) = 0. Mit αt := e−jEt folgt dann (2.20). Nun nehmen wir an, (2.20) sei erfüllt. Wir definieren (für t 6= 0) o n Gt := λH ∈ Re−jλH t = αt o n o n −1 Ωt := RI \ πH (Gt ) = λ ∈ RI πH (λ) ∈ / Gt = λ ∈ RI e−jλH t 6= αt . Mit φt := j ln αt t gilt Wegen (2.20) ist Mit G := G1 ∩ G√2 n o 2kπ Gt = φt + k ∈ Z . t ∀t ∈ R : (f (λ) = 0 a.e. in Ωt ) . und Ω := Ω1 ∪ Ω√2 = λ ∈ RI πH (λ) ∈ / G ist dann f (λ) = 0 a.e. in Ω. √ Da die Zahlen 1 und 2 in keinem rationalen Verhältnis stehen, kann man leicht zeigen, daß G höchstens ein Element beinhaltet; dieses wollen wir mit E bezeichnen (G kann nicht ganz leer sein, da wir vorausgesetzt haben, daß |f i = 6 O ist). Auf Ω ist f (λ) = 0 a.e.; auf RI \ Ω ist λH − E = 0. Somit gilt auf ganz RI (λH − E)f (λ) = 0 a.e., was aber äquivalent zu (2.21) ist. QED. 2.5.7 Heisenberg-Bild und Schrödinger-Bild Sei IH der abstrakte Hilbertraum des quantenmechanischen Systems und Tt : IH −→ E (2.22) 2.5. DIE ZEITENTWICKLUNG DES SYSTEMS 69 eine unitäre Transformation. Ist Tt = T zeitunabhängig, so nennen wir T eine Heisenberg-Bild-Darstellung. Ein Beispiel einer solchen Darstellung ist St0 : IH −→ L2 (Rn , µℓ ) |f i 7−→ ft0 (x) (für festes t0 ). In dieser Darstellung wird der Systemzustand durch die (zeitunabhängige!) Schrödinger-Funktion des Zeitpunktes t0 dargestellt. Der zeitabhängige Operator St (t variabel) führt dagegen zu einer zeitabhängigen Darstellung St : IH −→ L2 (Rn , µℓ ) |f i 7−→ ft (x) . Diese unitäre Transformation ist der wichtigste Fall eine Schrödinger-Bild-Darstellung. Wie bereits auf Seite 63 erwähnt, nennen wir die Abbildung (2.22) genau dann eine Schrödinger-Bild-Darstellung, wenn Tt über einen zeitunabhängigen unitären Operator mit St verknüpft ist: Tt = F St , F unitär. Der wesentliche Unterschied zwischen Heisenberg- und Schrödinger-Bild-Darstellungen läßt sich wie folgt zusammenfassen: Satz 2.9 Ist Tt : IH → E eine Schrödinger-Bild-Darstellung, so verlieren in E alle wichtigen Observablen — eventuell mit Ausnahme des Hamilton-Operators — ihre Zeitabhängigkeit9; andererseits werden aber die Zustände durch zeitabhängige Vektoren aus E beschrieben. Ist Tt dagegen eine Heisenberg-Bild-Darstellung, so werden die Zustände durch zeitunabhängige Vektoren aus E beschrieben; den Observablen entsprechen zeitabhängigen Operatoren in E (Wenn es sich nicht um Erhaltungsgrößen handelt). Neben diesen beiden ‘Extremfällen’ gibt es auch ‘gemischte’ Darstellungen bei denen die Zeitabhängigkeit von Tt derart ist, daß sowohl die Zustandsvektoren in E zeitabhängig sind, als auch die Observablen in E. Die wichtigste dieser Darstellungen ist die Dirac-Bild-Darstellung (oder auch Wechselwirkungsbild-Darstellung genannt), auf die wir hier aber nicht näher eingehen wollen. Eine sehr spezielle Heisenberg-Bild-Darstellung ist der Einheitsoperator in IH: 1 : IH −→ IH |f i 7−→ |f i . Dieser triviale Fall unterstreicht, daß im abstrakten Hilbertraum IH (so wie wir ihn definiert haben) die Verhältnisse des Heisenberg-Bildes vorliegen: die Zustände werden durch zeitunabhängige Vektoren aus IH dargestellt, die Observablen durch 9 Genauer: alle nur implizit zeitabhängigen Observablen verlieren ihre Zeitabhängigkeit. 70 KAPITEL 2. DIE PHYSIKALISCHEN STRUKTUREN zeitabhängige Operatoren. Man kann in IH aber auch eine abstrakte Form einer Schrödinger-Bild-Darstellung definieren: die Abbildung Ut0 t : IH −→ IH |f i 7−→ |ft i := Ut0 t |f i ist offenbar eine Schrödinger-Bild-Darstellung (Denn es ist Ut0 t = St−1 St ). Den 0 Zuständen entsprechen dann zeitabhängige Vektoren |ft i; den Meßgrößen entsprechen Operatoren AS = Ut0 t At Ut−1 (= At0 ) , 0t die normalerweise zeitunabhängig sind (Der Index ‘S’ steht hier für ‘SchrödingerBild’). Nur dann, wenn At explizit zeitabhängig ist, ergibt sich auch für AS eine Zeitabhängigkeit. Wir schreiben dann: ASt = Ut0 t At Ut−1 . 0t Bei Überlegungen, die alle Schrödinger-Bild-Darstellungen betreffen, ist es naheliegend, die soeben eingeführte abstrakte Schrödinger-Bild-Darstellung zu verwenden. 2.6. ERWARTUNGSWERTE UND UNSCHÄRFE 2.6 71 Erwartungswerte und Unschärfe 2.6.1 Die Berechnung von hAi und ∆A Sei |f i ∈ IH der Zustand des quantenmechanischen Systems und A eine beliebige Observable. Mißt man die Observable A, so erhält man einen Meßwert a ∈ R. Dieser Meßwert kann zwar nicht exakt vorhergesagt werden, doch es ist möglich einen Erwartungswert hAi anzugeben (oft nennt man hAi auch Mittelwert). Da der Erwartungswert von |f i abhängt, schreibt man oft auch hAif . Satz 2.10 Für |f i ∈ DA und kf k = 1 gilt hAif = hf | Af i (Für kf k = 6 1 ergibt sich entsprechend hAif = hf | Af i ). hf | f i Beweis: Sei −→ L2 RI , µ T : IH |f i 7−→ f (λ) eine diagonalisierende Darstellung für {A}, die A in den v-Operator λA = πA (λ) überführt. Aus Axiom 4 ergibt sich für A folgende Wahrscheinlichkeitsverteilung: Z m 2 Pf (∆) = |f (λ)| dµ(λ) ∆⊆R −1 λ∈πA (∆) (Pf (∆) ist ein Maß auf R). In der Wahrscheinlichkeitstheorie ist der Erwartungswert definiert durch Z hAif = λA dPf (α) , λA ∈R woraus sich schließlich hAif = Z 2 λA |f (λ)| dµ(λ) herleiten läßt, was offensichtlich äquivalent zu hAif = hf | Af i ist. QED Der Erwartungswert hAi gibt an, welcher Wert bei der Messung von A im Mittel zu erwarten ist. Die im Mittel zu erwartende Abweichung des tatsächlichen Meßwertes vom Erwartungswert hAi wird durch folgende Größe charakterisiert: q q 2 ∆A := (A − hAi) = hA2 i − hAi2 (2.23) (Auch an Stelle von ∆A kann man (∆A)f schreiben, um die Abhängigkeit vom Zustandsvektor |f i zu betonen). Man nennt ∆A die Standardabweichung und (∆A)2 die Varianz10 . 10 Nach Gleichung (2.23) ist ∆A zunächst nur für |f i ∈ DA2 ⊆ DA definiert. Man kann ∆A aber auf ganz DA definiere, wenn man an Stelle von (2.23) die etwas allgemeinere Beziehung ∆A := k(A − hAi) f k verwendet, die für |f i ∈ DA2 mit (2.23) übereinstimmt. 72 KAPITEL 2. DIE PHYSIKALISCHEN STRUKTUREN Der wahrscheinlichkeitstheoretische Begriff der Standardabweichung ist in der vorliegenden Anwendung ein Maß für die Unschärfe der Observable A (für gegebenes |f i): ist ∆A klein, so weiß man, daß eine Messung von A einen Wert liefern würde, der sehr nahe an hAi liegt. Das System ist somit in einem Zustand in dem der Meßwert für die Observable A auch ohne Messung recht scharf bestimmt ist. Ein großes ∆A bewirkt eine große Unschärfe, denn man weiß vor der Messung nicht, welches Meßergebnis man erhalten wird. Die Unschärfe ist ein typisch quantenmechanisches Phänomen das es in der klassischen Physik nicht gibt. Denn dadurch, daß wir den Systemzustand vollständig kennen, müßten wir, nach den Vorstellungen der klassischen Physik, in der Lage sein, jedes Meßergebnis exakt vorherzusagen. Auch in der Quantenmechanik gibt es den Fall ∆A = 0; hier stellt er aber eine Ausnahme dar: Satz 2.11 Sei |f i ∈ IH ein Zustandsvektor und A eine Observable. Die Unschärfe (∆A)f ist genau dann 0, wenn |f i ein Eigenvektor von A ist, d. h. wenn es einen Eigenwert α ∈ R gibt, sodaß A |f i = α |f i (|f i ∈ DA ) . Es ist dann α = hAif . Beweis: Sei A |f i = α |f i (und ohne Beschränkung der Allgemeinheit kf k = 1). Es ist dann 2 2 2 2 2 2 (∆A) = A2 − hAi = hAf | Af i − (hf | Af i) = α2 kf k − α kf k = 0. 2 Ferner ist hAi = hf | Af i = α kf k = α. Sei nun ∆A = 0. Sei ferner |f i 7→ f (λ) ∈ L2 RI , µ eine diagonalisierende Darstellung für {A}, die A in den v-Operator λA überführt. Es ist dann D E Z 2 2 2 2 (∆A) = (A − hAi) = (λA − hAi) |f (λ)| dµ(λ) = 0. Auf Ω := λ ∈ RI λA 6= hAi muß somit f (λ) = 0 a.e. sein. Man kann dann für λA 6= hAi λA f (λ) = hAi f (λ) (2.24) schreiben. Da für λA = hAi die Gleichung (2.24) ebenfalls gültig ist, gilt sie auf RI a.e., was aber gleichbedeutend mit A |f i = hAi |f i ist. QED. Dieser Satz hat eine wichtige Konsequenz: Eine Observable A, die keine (eigentlichen) Eigenwerte hat, kann niemals ‘scharf bestimmt’ sein, d. h. es gibt keinen Zustand, in dem ∆A = 0 ist. Ein Beispiel für solche Observablen sind die OrtsObservablen X, Y, Z: die Größen ∆X, ∆Y, ∆Z können zwar beliebig klein werden, nicht aber gleich 0. Das Quantenmechanische Teilchen ist somit nie so exakt lokalisiert, wie man dies vom Modell des klassischen Teilchens her gewöhnt ist. Ein Wichtiger Spezialfall ist jener des Hamilton-Operators (=Energie-Observable): Die Eigenvektoren des Hamilton-Operators entsprechen nach Satz 2.11 den Zuständen mit scharf bestimmter Energie. Nach Satz 2.5 sind aber die Eigenvektoren des Hamilton-Operators genau die stationären Zustände des Systems. Somit gilt: Die stationären Zustände sind genau die Zustände mit scharf bestimmter Energie. 73 2.6. ERWARTUNGSWERTE UND UNSCHÄRFE 2.6.2 Unschärferelationen Definition 2.4 Seien A und B zwei lineare Operatoren im Hilbertraum IH (DA und DB seien die entsprechenden Definitionsbereiche). Der Kommutator von A, B ist definiert durch [A, B] := AB − BA. Der Kommutator zweier kommutierenden Observablen ist stets 0. Interessant wird es aber bei nicht kommutierenden Observablen, denn es gilt Satz 2.12 Für zwei beliebige Observablen A, B gilt: 1 ∆A · ∆B ≥ h[A, B]i. 2 (2.25) b := A − hAi , B b := B − hBi und sei kf k = 1 (Für allgemeineres |f i Beweis: Sei A kann man aber ganz analog vorgehen). Offenbar gilt dann b k · kBf b k ≥ hAf b | Bf b i ≥ ImhAf b | Bf b i = ∆A · ∆B = kAf 1 b b b | Af b i = 1 hAf | Bf i − hBf | Af i = 1 f (AB − BA)f . = hAf | Bf i − hBf 2 2 2 QED. Ergänzung zu Satz 2.12: Der Ausdruck [A, B] ist zunächst nur für |f i ∈ D[A,B] = DAB ∩ DBA ⊆ DA ∩ DB definiert, während das Produkt ∆A · ∆B auf ganz DA ∩ DB sinnvoll ist. Aus obigem Beweis sieht man aber, daß 1 hAf | Bf i − hBf | Af i. 2 hAf | Bf i − hBf | Af i stimmt auf D[A,B] mit [A, B] überein, ist aber auf ganz DA ∩ DB definiert. ∆A · ∆B ≥ Ist [A, B] ein beschränkter und dicht definierter Operator, so kann [A, B] eindeutig auf ganz IH erweitert werden. Bezeichnet man diese Erweiterung mit R, so läßt sich zeigen, daß für alle |f i ∈ DA ∩ DB hAf | Bf i − hBf | Af i = hf | Rf i und folglich ∆A · ∆B ≥ 1 hRi . 2 Ein wichtiger Sonderfall ist jener der Orts- und Impulsoperatoren: aus der Beziehung x 1 ∂ 1 ∂ 1 ∂ 1 1 ∂ 1 f (x) − xf (x) = x f (x) − f (x) − x f (x) = − f (x) = jf (x) j ∂x j ∂x j ∂x j j ∂x j folgt offenbar 74 KAPITEL 2. DIE PHYSIKALISCHEN STRUKTUREN Satz 2.13 Sei X eine Orts-Observable und Px die entsprechende Impuls-Observable. Dann gilt [X, Px ] = j und folglich ∆X · ∆Px ≥ 1 2 (für alle |f i ∈ DX ∩ DPx ). Mit Hilfe der Spin-Matrizen Σx , Σy , Σz aus Axiom 8 läßt sich unmittelbar folgender Satz herleiten: Satz 2.14 Seien Σx , Σy , Σz die Observablen für die Spin-Komponenten des Einteilchensystems mit Spin 21 . Dann gilt [Σx , Σy ] = jΣz ... [Σy , Σz ] = jΣx ... [Σz , Σx ] = jΣy ... 1 |hΣz i| 2 1 ∆Σy · ∆Σz ≥ |hΣx i| 2 1 ∆Σz · ∆Σx ≥ |hΣy i| 2 ∆Σx · ∆Σy ≥ Ist nun beispielsweise ∆Σz = 0, so muß nach obigem Satz hΣx i = hΣy i = 0 sein. Da aber Σx und Σy nur die Meßwerte ± 21 annehmen können, ist bei verschwindenden Erwartungswerten stets 1 ∆Σx = ∆Σy = . 2 Es kann somit in jedem Zustand höchstens eine der drei Spin-Komponenten scharf bestimmt sein. Kapitel 3 Zusätzliche mathematische Konzepte 3.1 Das Spektrum der Observablen Definition 3.1 Sei µ ein Maß auf RI . Wir nennen λ ∈ RI einen Konstanzpunkt des Maßes µ, wenn eine offene meßbare Umgebung1 U von λ existiert, sodaß µ(U) = 0. Ist λ kein Konstanzpunkt, so nennen wir λ einen Wachstumspunkt. Ein Sprungpunkt ist ein spezieller Wachstumspunkt λ, für den µ({λ}) > 0 ist2 . Die Menge aller Wachstumspunkte heißt Träger des Maßes und wird mit supp µ abgekürzt (Englisch: ‘support of the measure’). Den Begriff der offenen Menge in RI haben wir auf Seite 24 definiert; wir setzten dabei aber voraus, daß die Indexmenge I endlich ist. Der Vollständigkeit halber geben wir nun an, wie der Begriff der offenen Menge für unendliches (auch überabzählbares) I verallgemeinert werden kann: eine Menge Ω ⊆ RI ist genau dann offen, wenn sie als Vereinigung elementarer offener Mengen darstellbar ist: [ Ω= Ωα . α∈A Die elementaren offenen Mengen Ωα sind hierbei Mengen der Form Y Ωα = ∆i = λ ∈ RI ∀λi ∈ ∆i , i∈I wobei alle ∆i offene Teilmengen von R sind (im Sinne von Seite 24) und nur endlich viele ∆i von R verschieden sind. Abgeschlossen ist eine Menge K genau dann, wenn RI \ K offen ist. Die so definierten Begriffe der offenen und abgeschlossenen Mengen entsprechen genau jenen der sogenannten Tihonov-Topologie (Siehe z. B. Maurin [26], Seite 323). 1 Eine offene Umgebung eines Punktes λ ∈ RI ist eine offene Teilmenge von RI , die λ enthält. Bei überabzählbarem I ist die einpunktige Menge {λ} nicht meßbar. Unter einen Sprungpunkt verstehen wir dann einen Punkt λ, zu dem es ein δ > 0 gibt, sodaß für alle meßbaren Mengen M , die λ enthalten, µ(M ) > δ ist. 2 75 76 KAPITEL 3. ZUSÄTZLICHE MATHEMATISCHE KONZEPTE Satz 3.1 Der Träger eines Maßes µ auf RI ist stets eine abgeschlossene Menge. Beweis: Zunächst setzen wir voraus, daß I endlich ist. Sei {λk }k∈K eine Folge von Wachstumspunkten mit λk → λ. Wenn λ ein Konstanzpunkt ist, so gibt es eine offene meßbare Umgebung U von λ, sodaß µ(U ) = 0 ist. Wegen λk → λ gibt es ein λk , das in U liegt. U ist dann eine offene meßbare Umgebung von λk . Folglich ist λk ein Konstanzpunkt, was aber ein Widerspruch zur Voraussetzung ist. Der Limes einer Folge von Wachstumspunkten ist somit stets wieder ein Wachstumspunkt; supp µ ist dann abgeschlossen. Wenn I unendlich ist, kann man ganz analog argumentieren, wenn man an Stelle des Folgen-Begriffes den Netz-Begriff verwendet (Für den Netz-Begriff siehe Abschnitt 4.3.2). QED. Wegen der Abgeschlossenheit von supp µ ist Ω := RI \ supp µ eine offene Menge. Bei endlichem I gilt folgende einleuchtende Beziehung3 m S ⊆ Ω =⇒ µ(S) = 0. (3.1) Doch auch bei unendlichem I wird man aus physikalischen Überlegungen oft davon I ausgehen, daß (3.1) erfüllt ist. Die Funktionen f (λ) ∈ L2 R , µ sind dann offenbar nur für λ ∈ supp µ interessant; auf Ω kann f (λ) völlig unbestimmt sein. Die große physikalische Bedeutung von supp µ wird durch folgenden Satz hervorgehoben, der sich unmittelbar aus Definition 3.1 ergibt: Satz 3.2 Sei T : IH −→ L2 RI , µ eine Spektraldarstellung für den Observablen-Satz {Ai }i∈I . Die Elemente aus supp µ sind dann genau die möglichen Meßergebnisse, für eine gemeinsame Messung der Observablen Ai (Genauer: λ ∈ RI liegt genau dann in supp µ, wenn es zu jeder offenen meßbaren Umgebung U ⊆ RI von λ einen Zustand |f i ∈ IH gibt, sodaß bei eine kombinierten Messung der Ai eine Wahrscheinlichkeit größer als 0 besteht, ein Meßergebnis aus U zu erhalten). Die Frage nach den möglichen Meßergebnissen ist aber nicht nur für einen vollständigen Observablen-Satz sinnvoll, sondern auch für eine einzelne Observable. Dies führt uns unmittelbar zum Begriff des Spektrums: 3 Einen Beweis fur (3.1) findet man z. B. in Federer [14], 2.2.16. (Die dort gemachte Voraussetzung bezüglich der Finitheit des Maßes kann erfüllt werden, wenn man das σ-finite Maß µ nach der Methode von Seite 18 in ein äquivalentes finites Maß µ′ überführt). 77 3.1. DAS SPEKTRUM DER OBSERVABLEN Definition 3.2 Sei A ein s.a. Operator in E und T : E −→ L2 RI , µ f 7−→ f (λ) eine unitäre Transformation, die A in den v-Operator λA = πA (λ) überführt. Das Spektrum von A ist dann definiert durch spec A := πA (supp µ). (Hierbei ist πA (supp µ) die Abschließung von πA (supp µ)). Die Abbildung 3.1 veranschaulicht obige Definition für einen Fall, in dem {A1 , A2 } einen vollständigen Satz kommutierender s.a. Operatoren bilden. O supp P T A T = v-Operator O 1 T A T = v-Operator O spec A O spec A Abbildung 3.1 Wie wir aus Satz 3.4 sehen werden, ist spec A nur von A abhängig und nicht von der speziellen Wahl der diagonalisierenden Darstellung T . Der folgende Satz zeigt, welche physikalische Bedeutung dem Spektrum einer Observablen zukommt: Satz 3.3 spec A ist genau die Menge der möglichen Meßwerte der Observable A (Genauer: ein α ∈ R liegt genau dann in spec A wenn für jede offene meßbare Umgebung U ⊆ R von α ein Zustand |f i ∈ IH existiert, sodaß bei einer Messung von A eine Wahrscheinlichkeit größer als 0 besteht, ein Meßergebnis aus U zu erhalten). Beweis: Aus Definition 3.2 sieht man sofort, daß jedes α ∈ / spec A kein möglicher Meßwert ist. Ist dagegen α ∈ spec A, so erfüllt jede offene Umgebung U von α die Bedingung U ∩ πA (supp µ) 6= ∅ 78 KAPITEL 3. ZUSÄTZLICHE MATHEMATISCHE KONZEPTE (Wir verwenden die Bezeichnungen aus Definition 3.2). Es gibt somit ein λ̂ ∈ supp µ −1 mit πA(λ̂) ∈ U . πA (U ) enthält λ̂ und ist — wie sich zeigen läßt — offen (Siehe z. B. Maurin [26], Seiten 323/324). Da λ̂ ein Wachstumspunkt ist (λ̂ ∈ supp µ), muß es einen Zustand f (λ) ∈ L2 RI , µ geben mit Z 2 |f (λ)| dµ(λ) > 0. −1 λ∈πA (U) Dies ist aber gerade die Wahrscheinlichkeit dafür, im Zustand f (λ) ein Meßergebnis zu erhalten, das in U liegt. QED. Ist {Ai }i∈I ein vollständiger Satz kommutierender s.a. Operatoren, so folgt aus Definition 3.2 unmittelbar o n Y supp µ ⊆ spec Ai = λ ∈ RI ∀i ∈ I : πi (λ) ∈ spec Ai , i∈I d. h. bei λ ∈ supp µ ist λi ∈ spec Ai für alle i ∈ I. Im allgemeinen ist aber Y supp µ 6= spec Ai , i∈I Q d. h. supp µ ist i. allg. echt kleiner als i∈I spec Ai . Das liegt daran, daß nicht alle ‘Kombinationen’ erlaubt sind: ist λ̂1 ∈ spec A1 und λ̂2 ∈ spec A2 , so sind λ̂1 und λ̂2 mögliche Meßwerte für A1 und A2 ; das heißt aber noch nicht, daß eine kombinierte Messung von A1 und A2 das Wertepaar (λ̂1 , λ̂2 ) liefern kann. So hat man beispielsweise beim Wasserstoffatom für die Observablen H und L2 die möglichen Meßwerte En und l(l + 1) mit n, l = 0, 1, 2, 3, . . .. Obwohl n und l alle natürlichen Zahlen durchlaufen, sind sie nur in der Kombination n≥l erlaubt (Analoge Beispiele lassen sich auch in endlichdimensionalen Hilberträumen konstruieren). Die beiden folgenden Sätze zeigen, wie das Spektrum einer Observablen bestimmt werden kann, ohne vorher das Maß µ einer diagonalisierenden Darstellung zu ermitteln. Satz 3.4 Das Spektrum eines s.a. Operators A ist die Menge aller α ∈ R für die der Operator (A − α)−1 nicht existiert oder zumindest nicht beschränkt ist. Beweis: Sei α∈ / spec A = πA (supp µ) (Wir verwenden die Bezeichnungen aus Definition 3.2). Es gibt dann eine offene Umgebung U von α mit U ⊆ R\πA (supp µ). Folglich gibt es ein r > 0 mit |λA −α| > r für alle λA ∈ πA (supp µ). Für alle λ ∈ supp µ gilt dann 1 −1 (πA (λ) − α) < . r 79 3.1. DAS SPEKTRUM DER OBSERVABLEN Der Multiplikationsoperator (πA (λ) − α)−1 hat somit eine Norm, die kleiner als ist, woraus 1 −1 (A − α) < < ∞ r folgt. 1 r Sei nun α ∈ spec A. Dann gibt es für jedes r > 0 ein λ̂ ∈ supp µ, sodaß πA(λ̂) ∈ −1 ]α − r, α + r[. die Menge U := πA (]α − r, α + r[) ⊆ RI ist eine offene meßbare Umgebung von λ̂ und wegen λ̂ ∈ supp µ ist µ(U ) > 0. Da wir von µ voraussetzen, σ-finit zu sein, gibt es eine meßbare Teilmenge B von U mit 0 < µ(B) < ∞. Die Funktion 1 für λ ∈ B χB (λ) := 0 für λ ∈ /B ist dann ein von O verschiedenes Element aus L2 RI , µ und es gilt r kχB (λ)k > k(πA (λ) − α) χB (λ)k . (3.2) Existiert (A − α)−1 , so folgt aus (3.2) k(A − α)−1 gk > 1 kgk r (mit g := (A − α)χB ). Da r beliebig klein ist, kann (A − α)−1 (falls es überhaupt existiert) nicht beschränkt sein. QED. Bemerkung 1: Wir haben in Satz 3.4 gefordert, daß α reell ist. Man könnte aber genausogut sagen, spec A sei die Menge aller α ∈ C ist, für die (A−α)−1 nicht existiert oder nicht beschränkt ist. Denn es läßt sich zeigen, daß bei selbstadjungiertem A und α ∈ C \ R der Operator (A − α)−1 stets existiert und beschränkt ist. Bemerkung 2: Die in Satz 3.4 gegebene Charakterisierung von spec A dient meistens sogar als Definition von spec A. Auf diese Weise kann das Spektrum auch für nicht selbstadjungierte Operatoren definiert werden; man muß dann aber α ∈ C zulassen, da bei nicht selbstadjungierten Operatoren das Spektrum i. allg. nicht reell ist (Unitäre Operatoren haben beispielsweise ein Spektrum, das auf dem Einheitskreis in C liegt). Satz 3.5 (Weyl-Kriterium) Sei A ein s.a. Operator mit Definitionsbereich DA . Ein α ∈ R liegt genau dann in spec A, wenn es eine Folge (fk )k=1,2,3,... in DA gibt, mit kfk k = 1 und H (A − α) fk −→ O. (3.3) (Einen Beweis dieses Satzes findet man z. B. in Großmann [18], Seite 249). Man sieht sofort, daß alle eigentlichen Eigenwerte in spec A liegen: denn bei Af = αf (3.4) hat man mit f1 = f2 = f3 = . . . = f sofort eine Folge gefunden, die (3.3) erfüllt. Schreibt man die Eigenwertgleichung (3.4) in der Form (A − α) f = O, 80 KAPITEL 3. ZUSÄTZLICHE MATHEMATISCHE KONZEPTE so sieht man, daß (3.3) als eine Verallgemeinerung der Eigenwertgleichung aufgefaßt werden kann; Elemente von spec A können somit als verallgemeinerte Eigenwerte interpretiert werden (Diese Interpretation wird sich im Kapitel 4 noch besser begründen lassen). Man bezeichnet jene Teilmenge von spec A, die von den eigentlichen Eigenwerten gebildet wird als diskretes Spektrum4 . Die Menge aller Punkte aus spec A, die keine eigentlichen Eigenwerte sind, bilden das kontinuierliche Spektrum. Besteht spec A ausschließlich aus eigentlichen Eigenvektoren, so spricht man von rein diskretem Spektrum. 3.2 Funktionen von Observablen Sei {Ai }i∈J ein Satz kommutierender s.a. Operatoren im Hilbertraum E und T : E −→ L2 RI , µ f 7−→ f (λ) eine diagonalisierende Darstellung durch die die Operatoren Ai in die v-Operatoren λi übergeführt werden (für i ∈ J ⊆ I). Im Folgenden verwenden wir die Bezeichnungen α := (λi )i∈J A := (Ai )i∈J , (Wenn der Satz {Ai }i∈J vollständig ist, kann man J = I wählen und hat dann α = λ). Ist G(α) eine beliebige (meßbare) RJ → C - Funktion, die man als Multi plikationsoperator in L2 RI , µ auffaßt, so kann man durch G(A) := T −1 G(α) T (3.5) einen neuen linearen Operator in E definieren. Sein Definitionsbereich ist offenbar Z n o 2 DG(A) := f ∈ E |G(α) f (λ)| dµ(λ) < ∞ Ist G(α) beschränkt, so ist G(A) überall definiert (d. h. DG(A) = E); ist G(α) reellwertig, so ist G(A) s.a. und kommutiert mit allen Ai (Siehe Sätze 1.28 und 1.32). Zu einem gegebenen Operator-Satz {Ai }i∈J gibt es verschiedene diagonalisierende Darstellungen T . Der oben definierte Operator G(A) ist aber unabhängig von T und ist somit durch die Operatoren Ai eindeutig bestimmt. Beweis: Sei Pf (∆) := Z 2 |f (λ)| dµ(λ) , m ∆ ⊆ RJ . α∈∆ 4 Das diskrete Spektrum umfaßt höchstens abzählbar viele Punkte (Daher der Name ‘diskret’). Denn bei selbstadjungiertem A sind die Eigenvektoren zu verschiedenen Eigenwerten orthogonal, und im separablen Hilbertraum hat jedes Orthogonalsystem höchstens abzählbar viele Elemente. Manche Autoren verstehen unter ‘diskretem Spektrum’ die Menge aller (eigentlichen) Eigenwerte mit endlichem Entartungsgrad. 81 3.2. FUNKTIONEN VON OBSERVABLEN Nach Satz 1.33 ist Pf (∆) unabhängig von T . Pf (∆) ist ein Maß auf RJ und es gilt: Z n o DG(A) = f ∈ E |G(α)|2 dPf (α) < ∞ . . . unabhängig von T f G(A) f = Z 2 G(α) |f (λ)| dµ(λ) = Z G(α) dPf (α) ... unabhängig von T . Aus Satz 1.12 folgt dann die Behauptung. QED. Beispiel 3.1 Sei A : DA → E ein s.a. Operator in E. Der Operator ejA ist wie folgt definiert: sei T : E −→ L2 RI , µ f 7−→ f (λ) eine diagonalisierende Darstellung, die A in den v-Operator λA überführt. Dann ist ejA auf dem Definitionsbereich Z n o 2 DejA = f ∈ E ejλA f (λ) dµ(λ) < ∞ = E definiert durch ejA f = T −1 ejλA f (λ) . Es läßt sich leicht zeigen, daß ejA ein unitärer Operator ist. Beispiel 3.2 Wir betrachten den Hilbertraum E = L2 (R, µℓ ) und den Operator A = 1j ∂x . Durch Anwendung der Transformation T = F (Fourier-Transformation) läßt sich zeigen, daß bei U = ejρA = eρ∂x gilt: U f (x) = f (x + ρ) , f (x) ∈ L2 (R, µℓ ) , ρ ∈ R; d. h. eρ∂x entspricht der Translation um den Wert ρ. Das selbe Ergebnis erhält man auch durch eine heuristische Überlegung, wenn man ejρ∂x formal als Potenzreihe anschreibt: eρ∂x = ∞ X ρn dn f (x) = f (x + ρ) n! dxn n=0 (Die linke Gleichung erhält man, indem man die ‘Exponentialfunktion’ eρ∂x formal als Potenzreihe anschreibt, und die zweite Gleichung entspricht der Taylorreihen-Entwicklung von f (x + ρ)). Sind A und B zwei kommutierende s.a. Operatoren (eventuell auch A = B), so kann man auf die oben beschriebene Art und Weise das Produkt AB und die Summe A + B definieren. Im Abschnitt 1.3.1 haben wir aber Produkt und Summe linearer Operatoren bereits definiert. Mit den Symbolen A+B und AB bezeichnen wir stets die im Abschnitt 1.3.1 definierten Operationen. Die im Sinne von (3.5) definierten Summen und Produkte bezeichnen wir mit A+B und AB 82 KAPITEL 3. ZUSÄTZLICHE MATHEMATISCHE KONZEPTE und sprechen in diesem Zusammenhang von starker Summe und starkem Produkt. Aus der Tatsache, daß A und B kommutierende s.a. Operatoren sind5 , folgt, daß A + B und AB dicht definiert sind (Siehe z. B. de Dormale/Gautrin [11], Preposition 3). Weiters sieht man leicht, daß DAB ⊆ DAB . DA+B ⊆ DA+B , Das folgende Beispiel zeigt aber, daß DA+B echt größer als DA+B sein kann: sei B = −A und DA 6= E; dann ist A + B der Nulloperator auf DA und A + B der Nulloperator auf ganz E; A + B ist somit eine echte Erweiterung von A + B. Allgemein kann man sagen, daß A + B die kleinste abgeschlossene Erweiterung (die sogenannte Abschließung) von A+B ist. Analog dazu ist AB die Abschließung von AB. Beweis: A + B ist s.a. und somit abgeschlossen. Es muß noch gezeigt werden, daß A + B die kleinste abgeschlossene Erweiterung von A+ B ist (daß also A + B in jeder abgeschlossenen Erweiterung von A + B enthalten ist). Sei T : E −→ L2 RI , µ f 7−→ f (λ) eine unitäre Transformation, die A, B in die v-Operatoren λA , λB überführt. Für beliebiges f ∈ DA+B gilt Z Z 2 2 λ2A + λ2B |f (λ)| dµ(λ) < ∞. |f (λ)| dµ(λ) < ∞, Sei χk (λ) := Man sieht leicht, daß bei 1 für |λA | ≤ k, |λB | ≤ k . 0 sonst fk (λ) := f (λ) χk (λ) stets fk ∈ DA ∩ DB = DA+B H fk −→ f. und Weiters ist (A + B) fk (λ) − A + B f (λ)2 = Z |λA |>k |λB |>k 2 λ2A + λ2B |f (λ)| dµ(λ) . Da dieses Integral bei anwachsendem k beliebig klein wird, gilt H (A + B)fk −→ (A + B)f. Der Vektor f liegt somit im Definitionsbereich jeder abgeschlossenen Erweiterung von A + B. Völlig analog zeigt man, daß AB die Abschließung von AB ist. QED. 5 Wir haben das starke Produkt und die starke Summe nur für kommutierende s.a. Operatoren definiert. 83 3.2. FUNKTIONEN VON OBSERVABLEN Ein wichtiger Sonderfall ergibt sich für A2 = AA; es läßt sich zeigen, daß AA = AA Der Ausdruck A2 kann somit wahlweise als AA oder als AA = T −1 λ2A T aufgefaßt werden (Analoges gilt für An ). Beweis: Sei T :E f −→ L2 RI , µ 7−→ f (λ) eine unitäre Transformation, die A in den v-Operator λA überführt. Sei An := AA · · · A und An := T −1 λnA T . Für f ∈ DAn gilt: Z Z 2 2 |f (λ)| dµ(λ) < ∞, λ2n A |f (λ)| dµ(λ) < ∞. Für 0 ≤ m ≤ n gilt: Z 2 λ2m A |f (λ)| dµ(λ) = Z λ2m A 2 |f (λ)| dµ(λ) + |λA |<1 ≤ Z 2 |f (λ)| dµ(λ) + |λA |<1 ≤ Z 2 |f (λ)| dµ(λ) + Z Z Z 2 λ2m A |f (λ)| dµ(λ) |λA |≥1 2 λ2n A |f (λ)| dµ(λ) |λA |≥1 2 λ2n A |f (λ)| dµ(λ) < ∞. I es ist somit λm A f (λ) ∈ L2 R , µ für m = 1, 2, 3, . . . , n. Hieraus folgt f ∈ DAn . QED. Satz 3.6 Seien A und B zwei s.a. Operatoren. Die 3 folgenden Aussagen sind dann äquivalent: a) A kommutiert mit B b) ∀t, d ∈ R : ejAd ejBt = ejBt ejAd c) ∀t ∈ R : AejBt = ejBt A. Beweis: a)⇒b): Folgt aus Satz 1.32. b)⇒a): Siehe z. B. Reed/Simon [35], Theorem VIII.13. a)⇒c): Wenn a) erfüllt ist, so folgt aus Satz 1.32 zunächst nur AejBt ⊇ ejBt A. Um c) zu zeigen, muß man noch beweisen, daß AejBt denselben Definitionsbereich wie A hat (denn A hat stets denselben Definitionsbereich wie ejBt A). Hierzu betrachten wir zwei zu A und B unitäräquivalente v-Operatoren λA , λB und stellen fest, daß Z Z 2 λ2A ejλB t |f (λ)|2 dµ(λ) < ∞ ⇐⇒ λ2A |f (λ)|2 dµ(λ) < ∞. | {z } 1 84 KAPITEL 3. ZUSÄTZLICHE MATHEMATISCHE KONZEPTE c)⇒b): cos Bt und sin Bt sind offensichtlich beschränkte s.a. Operatoren und es gilt cos Bt = und 1 jBt e + e−jBt , 2 sin Bt = 1 jBt e − e−jBt 2j ejBt = cos Bt + j sin Bt. Man zeigt leicht, daß die Operatoren A, cos Bt, sin Bt kommutieren; es gibt somit eine unitäre Transformation Pt , die A, cos Bt, sin Bt in die vOperatoren λA , λC , λS überführt. Offensichtlich kommutiert der Multiplikationsoperator ejλA d mit dem Multiplikationsoperator λC + jλS . Hieraus folgt aber, daß ejAd mit ejBt kommutiert. QED. 3.3 Die v. Neumann-Methode Definition 3.3 Sei {E∆ } m eine Menge, in der es für jedes meßbare ∆ ⊆ R einen ∆⊆R Operator E∆ im Hilbertraum E gibt. Diese Operator-Menge heißt Spektralschar, wenn folgende Bedingungen erfüllt sind: i) Jedes E∆ ist ein Projektor ii) E∅ = 0, ER = 1 iii) E∆1 E∆2 = E∆1 ∩∆2 iv) Wenn ∆ = ∞ S k=1 ∆k mit ∆k ∩ ∆ℓ = 0 für k 6= ℓ, so gilt für alle f ∈ E: E∆ f = H- lim N →∞ N X E∆k f. k=1 An Stelle der Bezeichnung Spektralschar findet man auch die Bezeichnungen Spektralmaß, Spektralfamilie und projektorwertiges Maß. Häufig wird an Stelle von {E∆ } m auch die Menge {Êα }α∈R mit ∆⊆R Êα := E]−∞,α] (3.6) verwendet. Über (3.6) können {E∆ } m und {Êα }α∈R aber stets eindeutig und um∆⊆R kehrbar ineinander übergeführt werden (Denn für ein beliebiges Intervall ∆ =]a, b] gilt E∆ = Êb − Êa . Durch Bilden von Vereinigungen und Durchschnitten lassen sich mit Hilfe solcher Intervalle alle meßbaren Teilmengen von R aufbauen). Ist {E∆ } m eine Spektralschar und f ein beliebiger Vektor aus dem Hilber∆⊆R traum E, so kann man leicht zeigen, daß Pf (∆) := kE∆ f k2 = hf | E∆ f i ein Maß auf R ist. 85 3.3. DIE V. NEUMANN-METHODE Satz 3.7 (Spektralsatz) Zu jedem s.a. Operator A : DA → E gibt es eine eindeuA tige Spektralschar {E∆ } m , sodaß für alle f ∈ DA gilt ∆⊆R hf | Af i = Z A 2 PfA (∆) = E∆ f . α dPfA (α) , (3.7) Umgekehrt gibt es zu jeder Spektralschar einen eindeutigen s.a. Operator, der (3.7) erfüllt. Zusatz: Das Spektrum von A besteht aus allen α ∈ R, die keine offene meßbare A Umgebung ∆ ⊆ R mit E∆ = 0 haben. Für die Gleichung (3.7) wird häufig auch Z A = α dEα (3.8) geschrieben6 . Der eher abstrakte Begriff der Spektralschar wird anschaulicher, wenn man zu einer diagonalisierenden Darstellung übergeht: A Satz 3.8 Sei A : DA → E ein s.a. Operator und {E∆ } T : E −→ L2 RI , µ f 7−→ f (λ) m ∆⊆R seine Spektralschar. Ist eine diagonalisierende Darstellung, die A in den v-Operator λA überführt, so wird E∆ in den Multiplikationsoperator 1 für λA ∈ ∆ χ∆ (λ) = 0 für λA ∈ /∆ übergeführt. (Für einen Beweis siehe de Dormale/Gautrin [11], Lemma 5). Aus diesem Satz ergibt sich — im Zusammenhang mit Axiom 4 — die physikalische Interpretation des Maßes PfA (∆): A Satz 3.9 Sei A eine Observable und {E∆ } m ihre Spektralschar; das quantenme∆⊆R chanische System sei in einem Zustand |f i (mit kf k = 1). Die Wahrscheinlichkeit m bei einer Messung von A ein Ergebnis aus ∆ ⊆ R zu erhalten, ist gegeben durch 6 A 2 PfA (∆) = E∆ f = hf | E∆ f i. Die Gleichung (3.8) kann als eine symbolische Abkürzung von (3.7) aufgefaßt werden. Führt man aber einen geeigneten Integralbegriff ein, so ist (3.8) eine wohldefinierte mathematische Aussage, die sogar etwas stärker als (3.7) ist (Siehe z. B. Großmann [18]). 86 KAPITEL 3. ZUSÄTZLICHE MATHEMATISCHE KONZEPTE PfA (∆) ist also die schon mehrmals erwähnte Wahrscheinlichkeitsverteilung für die Observable A, wenn sich das System im Zustand |f i befindet. Dieser Satz stellt das Fundament der von Neumannschen Formulierung der Quantenmechanik dar, wo er als Axiom eingeführt wird und somit unser Axiom 4 ersetzt. Um eine vollständige Übereinstimmung mit Axiom 4 zu erreichen, muß obiger Satz aber noch etwas verallgemeinert werden: hat man nicht nur eine Observable, sondern einen ganzen Satz {Ai }i∈J kompatibler (=kommutierender) Observablen, Q so kannJ man nach der Wahrscheinlichkeit P (∆) fragen, ein Meßergebnis aus ∆ = ∆i ⊆ R i∈J zu erhalten. Die Verallgemeinerung von Satz 3.9 liefert Y 2 Ai P (∆) = E∆i f . (3.9) i∈J Da die Observablen kompatibel sind, spielt die Reihenfolge, in der sie gemessen werden keine Rolle und man wird erwarten, daß (3.9) unabhängig von der Reihenfolge Ai ist, in der die Operatoren E∆ angeordnet sind. Tatsächlich gilt i A Satz 3.10 Seien A und B zwei s.a. Operatoren mit den Spektralscharen {E∆ } m ∆⊆R B und {E∆ } m . Die beiden Operatoren kommutieren genau dann, wenn für alle meß∆⊆R baren ∆1 , ∆2 ⊆ R gilt: A B B A E∆ E∆ = E∆ E∆ . 1 2 2 1 Die Kommutierbarkeit der Spektralscharen wird meistens sogar als Definition für die Kommutierbarkeit unbeschränkter s.a. Operatoren herangezogen. Abschließend geben wir eine zusammenfassende Übersicht über alle in dieser Arbeit angeführten Kommutierbarkeitskriterien für s.a. Operatoren: Satz 3.11 Seien A und B zwei s.a. Operatoren. Die folgenden Aussagen sind dann äquivalent: a) A und B kommutieren e = T AT −1 , B e = T BT −1 kommutieren b) unitäräquivalente Operatoren A c) Es existiert eine diagonalisierende Darstellung für {A, B} d) ∀a, b ∈ C, Im(a) , Im(b) 6= 0 : (a − A)−1 (b − B)−1 = (b − B)−1 (a − A)−1 m A B B A e) ∀∆1 , ∆2 ⊆ R : E∆ E∆ = E∆ E∆ 1 2 2 1 f ) ∀d, t ∈ R : ejAd ejBt = ejBt ejAd g) ∀t ∈ R : AejBt = ejBt A Falls B beschränkt ist: h) AB ⊇ BA Falls A und B beschränkt sind: i) AB = BA. Kapitel 4 Entwicklung nach Eigenvektoren 4.1 4.1.1 Das Gelfandsche Raumtripel Erweiterung des Hilbertraumes In einem endlichdimensionalen Hilbertraum gibt es zu jedem s.a. Operator ein vollständiges Orthonormalsystem von Eigenvektoren. In einem unendlichdimensionalen Hilbertraum E gilt das nicht mehr in voller Allgemeinheit und es gibt sogar s.a. Operatoren, die keinen einzigen (eigentlichen) Eigenvektor haben. Um dennoch eine Entwicklung nach Eigenvektoren zu ermöglichen, erweitert man den Hilbertraum E zu einen ‘aufgetakelten Hilbertraum’ der i. allg. als Rigged Hilbert Space bezeichnet wird (abgekürzt: RHS). Es gibt verschiedene Möglichkeiten einen RHS zu erhalten; die bekannteste ist jene des Gelfandschen Raumtripels, die wir im Folgenden näher beschreiben werden. Bei dieser Methode betrachtet man 3 ineinanderverschachtelte Räume (daher der Name ‘Raumtripel’): Φ ⊆ E ⊆ Φ′ . Φ′ ist hierbei die gewünschte Erweiterung des Hilbertraumes E; der Raum Φ wird benötigt, um Φ′ zu konstruieren. Φ′ wird topologisch dualer Raum von Φ genannt. Zunächst werden wir aber an Stelle von Φ′ den sogenannten algebraisch dualen Raum Φ∗ betrachten, der zwar umfangreicher ist als Φ′ , aber leichter beschrieben werden kann; wir haben somit zunächst das Raumtripel Φ ⊆ E ⊆ Φ∗ . Den Raum Φ′ werden wir erst im Abschnitt 4.3 einführen. 4.1.2 Der Raum Φ Definition 4.1 Sei {Bk }k∈K ein Satz linearer Operatoren im Hilbertraum E; Φ sei ein linearer Teilraum von E. Wir nennen Φ einen invarianten Teilraum für {Bk }k∈K , wenn für alle Bk gilt: Bk Φ ⊆ Φ 87 88 KAPITEL 4. ENTWICKLUNG NACH EIGENVEKTOREN (D. h. Φ liegt im Definitionsbereich von Bk und es gilt Bk ϕ ∈ Φ für alle ϕ ∈ Φ). Wir sprechen von einem dichten invarianten Teilraum, wenn Φ dicht in E ist. Wir nennen Φ einen maximalen invarianten Teilraum, wenn jeder andere invariante Teilraum in Φ enthalten ist1 . Definition 4.2 Sei {Bk }k∈K ein Satz linearer Operatoren (im Hilbertraum E) und Φ der maximale invariante Teilraum. Sei Bk0 der auf den Definitionsbereich Φ eingeschränkte Operator Bk , also Bk0 : Φ −→ Φ f 7−→ Bk f. Wir führen folgende Begriffe ein: • Mit Prod0 {Bk}k∈K bezeichnen wir die Menge aller Φ → Φ - Operatoren, die durch endliche Produkte der Bk0 entstehen. Der Einheitsoperator (in Φ) gehört per definitionem ebenfalls dieser Menge an. • Mit Alg0 {Bk}k∈K bezeichnen wir die Menge aller Φ → Φ - Operatoren die aus endlichen Linearkombinationen der Elemente aus Prod0 {Bk }k∈K entstehen. Man nennt Alg0 {Bk }k∈K die von {Bk0 }k∈K generierte Algebra. • Mit ErAlg {Bk}k∈K bezeichnen wir die Menge aller linearen Operatoren in E, die Erweiterungen der Operatoren aus Alg0 {Bk }k∈K sind. Es gilt offenbar 0 Bk k∈K ⊆ Prod0 {Bk }k∈K ⊆ Alg0 {Bk }k∈K ⊆ ErAlg {Bk }k∈K {Bk }k∈K ⊆ ErAlg {Bk }k∈K . Beispiel 4.1 Gegeben sei die Operatormenge {B1 , B2 , B3 }. Sei ferner 5 0 2 A01 := B10 B20 B1 , A02 := B30 . 3 Dann ist A01 , A02 ∈ Prod0 {Bk }k=1 . Der Operator A0 := α1 A01 + α2 A02 + α3 B10 , ist ein Element aus 3 Alg0 {Bk }k=1 . α1 , α2 , α3 ∈ C Ist A : DA −→ E, DA ⊇ Φ 3 eine Erweiterung von A0 , so liegt A in ErAlg {Bk }k=1 (Insbesondere ist A0 eine — wenn auch unechte — Erweiterung von A0 und liegt somit in ErAlg {Bk }3k=1 ). 1 Einen solchen T maximalen invarianten Teilraum gibt es immer, und es läßt sich zeigen, daß dieser gleich DC ist; P sei hierbei die Menge aller Operatoren der Form C∈P C = Bk1 · Bk2 · · · Bkn , n ∈ N, k1 , . . . , kn ∈ K; DC sei der Definitionsbereich des Operators C. (Beweis: Man sieht leicht, daß jeder invariante T Teilraum in Φm := DC liegt. Es bleibt somit nur noch zu zeigen, daß Φm invariant ist: für C∈P C ∈ P und Ĉ := CBk istTĈ ∈ P und somit Φm ⊆ DĈ ; folglich ist Bk Φm ⊆ DC ; da dies für alle C ∈ P gilt, ist Bk Φm ⊆ DC = Φm ). C∈P 89 4.1. DAS GELFANDSCHE RAUMTRIPEL Definition 4.3 Sei {Bk }k∈K ein Satz s.a. Operatoren und Φ der maximale invariante Teilraum2. Wir nennen {Bk }k∈K eine Roberts-Basis, wenn gilt: In ErAlg {Bk }k∈K gibt es einen s.a. Operator mit rein diskretem Spektrum, dessen Eigenwerte αν die Bedingung X 1 <∞ |αν | ν erfüllen (entartete Eigenwerte gehen entsprechend ihrer Vielfachheit mehrfach in die Summe ein. Null darf kein Eigenwert sein)3 . Der folgende Satz zeigt, daß die Bedingungen aus Definition 4.3 in vielen wichtigen Fällen automatisch erfüllt sind: Satz 4.1 Sei {Bk }k∈K ein Satz selbstadjungierter Operatoren in L2 (Rn , µℓ ). Liegen die v-Operatoren λ1 , λ2 , . . . , λn und die Ableitungsoperatoren 1j ∂1 , 1j ∂2 , . . . , 1j ∂n in ErAlg {Bk }k∈K , so ist {Bk }k∈K eine Roberts-Basis. Beweis: Sei Qi der v-Operator λi , und Pi der Ableitungsoperator mentation von Roberts [37] folgend betrachten wir den Operator H̆ := n X i=1 1 j ∂i . Der Argu- Q2i + Pi2 . Die Abschließung H von H̆ ist ein gut bekannter Operator (Hamilton-Operator des n-dimensionalen harmonischen Oszillators). Er ist s.a. und hat das rein diskrete Spektrum hν = n + 2ν, ν = 0, 1, 2, . . . . (Siehe z. B. Messiah [29], Abschnitt 12.3.1). Diese Eigenwerte haben die Vielfachheit rν = (ν + n − 1)! (ν + n − 1) · · · (ν + 1) = ≤ (2ν + n)n−1 . ν! (n − 1)! (n − 1)! Der Operator A = H n+1 hat die Eigenwerte αν = hn+1 . Offenbar gilt: ν ∞ X ν=0 rν ∞ ∞ X X 1 1 1 = rν ≤ < ∞. n+1 |αν | ν=0 (n + 2ν) (n + 2ν)2 ν=0 QED. Wenn die Bedingungen von Satz 4.1 erfüllt sind, so ist Φ ⊆ S(Rn ). 2 Die Bedingung der Selbstadjungiertheit kann etwas abgeschwächt werden: es genügt, daß die Bk abgeschlossen sind und für jedes Bk der sogenannte adjungierte Operator Bk∗ in ErAlg {Bk }k∈K liegt. Diese Bedingungen sind beispielsweise erfüllt, wenn alle Bk abgeschlossene symmetrische Operatoren sind P P 1 1 3 Die Bedingung |αν | < ∞ kann noch etwas abgeschwächt werden: es genügt, wenn |αν |q < ν ν ∞, für irgend ein q ∈ N (Denn wenn A die Eigenwerte αν hat und in ErAlg {Bk }k∈K liegt, so hat Aq die Eigenwerte αqν und liegt ebenfalls in ErAlg {Bk }k∈K ). 90 KAPITEL 4. ENTWICKLUNG NACH EIGENVEKTOREN Definition 4.4 Sei {Ai }i∈J ein Satz kommutierender s.a. Operatoren im Hilbertraum E, und {Bk }k∈K sei eine Roberts-Basis mit dem maximalen invarianten Teilraum Φ. Wenn Φ dicht in E ist und {Ai }i∈J ⊆ ErAlg {Bk }k∈K gilt, nennen wir Φ einen (von {Bk }k∈K vermittelten) Roberts-Raum für {Ai }i∈J . Offensichtlich ist ein Roberts-Raum immer ein dichter invarianter Teilraum für {Ai }i∈J . Es wird sich zeigen, daß ein Roberts-Raum stets geeignet ist, um ein Gelfandsches Raumtripel zu konstruieren, das es ermöglicht über Entwicklung nach Eigenvektoren eine diagonalisierende Darstellung für {Ai }i∈J zu ermitteln. Wir zeigen nun an einem Beispiel, wie man in der Praxis einen Roberts-Raum findet: Beispiel 4.2 Im Hilbertraum L2 (R3 , µℓ ) seien folgende Operatoren definiert: −1 a △+ 2M |x| 3 3 XX = (xi ∂p xp ∂i − xi ∂p xi ∂p ) H̆ = L̆2 i=1 p=1 L̆z 1 = (x1 ∂2 − x2 ∂1 ) j (x1 , x2 , x3 seien die v-Operatoren in L2 (R3 , µℓ )). Die Operatoren H̆, L˘2 , L˘z sind e.s.a.; ihre selbstadjungierten Erweiterungen bezeichnen wir mit A1 = H, A2 = L2 , A3 = Lz . Es läßt sich zeigen, daß {H, L2 , Lz } ein vollständiger Satz kommutierender s.a. Operatoren ist (siehe de Dormale/Gautrin [12]). Als Roberts-Basis {Bk }k∈K wählen wir B1 = x1 , B2 = x2 , B3 = x3 B4 = 1j ∂1 , B5 = 1j ∂2 B6 = 1j ∂3 1 B7 = |x| . Nach Satz 4.1 ist {Bk }k∈K eine Roberts-Basis. Der maximale invariante Teilraum Φ von {Bk }k∈K hat die Gestalt n o ∂r ∂p ∂q 3 Φ = f (x) ∈ S R | = 0, r, p, q ∈ {0, 1, 2, . . .} . f (x) x=0 ∂xr1 ∂xp2 ∂xq3 (4.1) 3 D. h. Φ besteht aus allen Funktionen der Raumes S(R ), für die an der Stelle x = 0 alle Ableitungen verschwinden. Beweis: Da ErAlg {Bk }k∈K die v-Operatoren xi und die Ableitungsoperatoren ∂i enthält, muß der maximale invariante Teilraum Φ ⊆ S R3 sein. Folglich 1 muß für f (x) ∈ Φ stets B7 B4 f (x) ∈ S R3 sein. Aus |x| ∂1 f (x) stetig in 0 folgt 91 4.1. DAS GELFANDSCHE RAUMTRIPEL aber, daß ∂1 f (x) in 0 verschwinden muß. Analog zeigt man, daß ∂1r ∂2p ∂3q f (x) in 0 verschwindet. Nun zeigen wir, daß das Φ aus (4.1) tatsächlich invariant für B7 ist (Für die anderen Bk ist die Invarianz offensichtlich). Die Taylorsche Formel liefert (für n ∈ N): n f (x) = f (0) + f ′ (0) · x + xT · f ′′ (0) · x + . . . + ε(x) |x| mit lim ε(x) = 0. x→0 Hieraus folgt lim x→0 1 n f (x) = 0. |x| (4.2) mit Hilfe von (4.2) zeigt man leicht, daß lim ∂1r ∂2p ∂3q x→0 1 f (x) = 0. |x| QED. Wegen Φ ⊇ C0∞ (R3 \ {O}) folgt aus Satz 1.10, daß Φ dicht in L2 (R3 , µℓ ) ist. Da zusätzlich {A1 , A2 , A3 } ⊆ ErAlg {Bk }k∈K gilt, ist Φ ein Roberts-Raum für {A1 , A2 , A3 }. 4.1.3 Der Raum Φ∗ Sei E ein Hilbertraum und Φ ein dichter linearer Teilraum von E. Um nicht zu abstrakt zu werden betrachten wir im Folgenden oft das Beispiel E = L2 (R, µℓ ) , Φ = C0∞ (R). Die Elemente aus L2 (R, µℓ ) sind quadratintegrable Funktionen; die Elemente aus C0∞ (R) sind besonders ‘brave’ quadratintegrable Funktionen. Für eine Entwicklung nach Eigenfunktionen werden wir aber auch solche Funktionen benötigen, die nicht quadratintegrabel sind. Ein wichtiges Beispiel einer nicht quadratintegrablen Funktion ist ejλ; offenbar gilt: Z jλ 2 e dµℓ (λ) = Z∞ −∞ 1 dλ = ∞. (4.3) Darüber hinaus benötigen wir aber auch noch ‘schwierigere’ Funktionen, wie etwa die Diracsche δ-Funktion δ(λ), die genaugenommen gar keine echte Funktion ist4 . Wir müssen somit eine Erweiterung des Hilbertraumes E vornehmen, die wir mit Φ∗ bezeichnen. 4 Häufig wird δ(λ) als Funktion mit folgender Gestalt angegeben: 0 für λ 6= 0 δ(λ) = . ∞ für λ = 0 (4.4) Daß dies keine wirkliche Charakterisierung der δ-Funktion ist, sieht man daran, daß (4.4) genaud2 sogut zu 5 · δ(λ) oder zu − dλ 2 δ(λ) paßt. (4.4) dient somit nur dazu, eine intuitive Vorstellung von δ(λ) zu vermitteln (Im Abschnitt 4.1.4 werden wir näher auf δ(λ) eingehen). 92 KAPITEL 4. ENTWICKLUNG NACH EIGENVEKTOREN Da die Elemente aus Φ∗ i. allg. keine echten Funktionen sind, stellt sich die Frage, wie man diese Elemente beschreiben kann. Um hierauf eine Antwort zu geben, muß man wissen, wie die Elemente aus Φ∗ verwendet werden sollen. Im Abschnitt 4.2.3 werden wir sehen, daß die Elemente ξ aus Φ∗ benötigt werden, um mit ihnen Skalarprodukte der Form hξ | ϕi, ϕ∈Φ (4.5) zu bilden5 . Wir verlangen daher von den Elementen aus Φ∗ , daß die Skalarprodukte (4.5) eindeutig definiert sind. Wenn wir darüber hinaus noch fordern, daß hξ | ϕi linear in ϕ ist, so ergibt sich folgende Definition: Definition 4.5 Sei E ein Hilbertraum und Φ ein dichter linearer Teilraum. Die Menge Φ∗ ist eine Erweiterung von E (also Φ∗ ⊇ E) mit folgenden Eigenschaften: 1) Für alle ξ ∈ Φ∗ und alle ϕ ∈ Φ ist ein Produkt hξ | ϕi = hϕ | ξi ∈ C definiert. Für ξ ∈ E stimmt dieses Produkt mit dem Skalarprodukt aus E überein. 2) Das Produkt ist linear im zweiten Faktor (und folglich antilinear im ersten Faktor): hξ | α1 ϕ1 + α2 ϕ2 i = α1 hξ | ϕ1 i + α2 hξ | ϕ2 i hϕ | α1ξ1 + α2 ξ2 i = α1 hϕ | ξ1i + α2 hϕ | ξ2i. 3) Das Produkt charakterisiert die Elemente aus Φ∗ eindeutig, d. h.: ∀ϕ ∈ Φ : hξ1 | ϕi = hξ2 | ϕi =⇒ ξ1 = ξ2 . Darüber hinaus fordern wir, daß Φ∗ maximal ist, d. h. es darf kein Φ∗1 ⊃ Φ∗ geben, das obige 3 Bedingungen erfüllt. Da wir E ⊆ Φ∗ fordern, muß natürlich gewährleistet sein, daß obige 3 Punkte für alle Elemente aus E erfüllt sind. Man kann aber leicht nachprüfen, daß für ξ ∈ E tatsächlich alle 3 Bedingungen immer erfüllt sind: für 1 und 2 ist dies offensichtlich; 3 ist erfüllt, weil Φ dicht in E ist. Für festes ξ ∈ Φ∗ ist ξ : Φ −→ C ϕ 7−→ hξ | ϕi eine lineare Abbildung von Φ in C. Eine Abbildung eines Vektorraumes Φ in die Menge C wird Funktional genannt. In diesem Sinne definiert jedes ξ ∈ Φ∗ ein 5 Da hξ | ϕi i. allg. nur für ϕ ∈ Φ definiert ist (und nicht für alle ϕ ∈ Φ∗ ), ist der Ausdruck Skalarprodukt nicht ganz gerechtfertigt. 93 4.1. DAS GELFANDSCHE RAUMTRIPEL eindeutiges lineares Funktional über Φ. Wegen Punkt 3 von Definition 4.5 ist die Zuordnung ξ ←→ lineares Funktional sogar umkehrbar eindeutig. Tatsächlich wird in eher mathematisch orientierten Texten an Stelle von Definition 4.5 folgende Formulierung gewählt: Definition 4.5’ Φ∗ ist die Menge aller linearen Funktionale über Φ und heißt (algebraisch) dualer Raum von Φ. Die in Definition 4.5 geforderte Maximalität von Φ∗ garantiert, daß Φ∗ der Menge aller linearen Funktionale entspricht, und nicht nur einen Teilmenge. Wir betonen noch einmal, daß es für zwei beliebige Elemente ξ, η ∈ Φ∗ i. allg. kein Produkt hξ | ηi gibt: wenn ξ in Φ∗ \ E liegt, so ist hξ | ηi nur für η ∈ Φ definiert. Durch die Bedingung hα1 ξ1 + α2 ϕ2 | ϕi = α1 hξ1 | ϕi + α2 hξ2 | ϕi (4.6) wird Φ∗ zum linearen Raum (Diese Gleichung ergibt sich aus den Punkten 1 und 2 von Definition 4.5). Wir weisen darauf hin, daß in der Distributionstheorie an Stelle von (4.6) meistens die Bedingung hα1 ξ1 + α2 ϕ2 | ϕi = α1 hξ1 | ϕi + α2 hξ2 | ϕi gewählt wird. Es ist dann aber nicht möglich, den Hilbertraum E als (linear eingebetteten) Teilraum von Φ∗ aufzufassen, wie wir dies in Definition 4.5 gemacht haben. 4.1.4 Verallgemeinerte Funktionen In diesem Abschnitt halten wir uns weiterhin das Beispiel E = L2 (R, µℓ ) , Φ = C0∞ (R) vor Augen. Wir wissen bereits, daß man ein Element ξ aus Φ∗ beschreiben kann, indem man die Zahlen hξ | ϕi für alle ϕ ∈ Φ angibt. Diese Zahlen können in der Praxis natürlich nicht explizit angegeben werden, sondern müssen über eine Rechenvorschrift definiert werden. Für ξ ∈ E ist dies ganz einfach: für ξ(λ) ∈ L2 (R, µℓ ) und ϕ(λ) ∈ C0∞ (R) ist Z hξ | ϕi = ξ(λ)ϕ(λ) dµℓ (λ) . (4.7) Durch Angabe der Funktion ξ(λ) können mit Hilfe der Rechenvorschrift (4.7) alle Produkte hξ | ϕi ermittelt werden. Für ξ ∈ Φ∗ \ E kann es keine entsprechende quadratintegrable Funktion geben (denn sonst wäre ξ ∈ E); es kann aber eine nicht quadratintegrable Funktion ξ(λ) geben, die in (4.7) einzusetzen ist. Beispiel 4.3 Sei ξ(λ) := ejλ . Diese Funktion ist nicht quadratintegrabel (siehe Gleichung (4.3)). Für ϕ(λ) ∈ C0∞ (R) = Φ ist (4.7) aber eindeutig definiert und offensichtlich linear in ϕ. Die Funktion ξ(λ) = ejλ definiert somit ein eindeutiges Element aus Φ∗ . An dieser Stelle erkennt man auch, warum wir Φ ⊆ E und nicht Φ = E wählen müssen: für beliebige ϕ(λ) ∈ L2 (R, µℓ ) ist das Integral (4.7) nicht konvergent; für alle ϕ(λ) ∈ C0∞ (R) ist die Konvergenz dagegen gewährleistet. 94 KAPITEL 4. ENTWICKLUNG NACH EIGENVEKTOREN Es gibt aber auch Elemente in Φ∗ , für die es kein Integral der Form (4.7) gibt, sondern nur eine integralähnliche Rechenvorschrift: Beispiel 4.4 Wir betrachten den Ausdruck Z 1 ϕ(λ) dµℓ (λ) , hξ | ϕi = λ ϕ(λ) ∈ C0∞ (R) . Dieses Integral ist auch für ϕ(λ) ∈ C0∞ (R) i. allg. divergent (wegen der Singularität in λ = 0). Andererseits existiert aber der sogenannte Hauptwert des Integrals: Z Z 1 1 HW ϕ(λ) dµℓ (λ) := lim ϕ(λ) dµℓ (λ) . ǫ→0 λ λ |λ|≥ǫ Definiert man hξ | ϕi über obiges Hauptwert-Integral, so wird dadurch wieder ein eindeutiges Element aus Φ∗ definiert. Es reicht hier aber nicht mehr aus, die Funktion λ1 anzugeben, sondern es muß explizit dazugesagt werden, wie das entsprechende Integral zu bilden ist, nämlich als Hauptwert-Integral. Manchmal schreibt man in diesem Zusammenhang 1 ξ(λ) = HW . λ Funktionen des Typs HW λ1 nennen wir verallgemeinerte Funktionen. Eine verallgemeinerte Funktion besteht also aus einer mehr oder weniger genau definierten Funktionsvorschrift (wie etwa ejλ oder λ1 ) und einer explizit angegebenen Zusatzvorschrift, die besagt, nach welchen Regeln das Integral Z hξ | ϕi = ξ(λ)ϕ(λ) dµℓ (λ) , ϕ∈Φ zu bilden ist. Im Beispiel 4.3 hatten wir die Funktionsvorschrift ejλ und die (triviale) Zusatzvorschrift “berechne das Integral als ganz gewöhnliches (Lebesgue-) Integral”. Im Beispiel 4.4 hatten wir dagegen die Funktionsvorschrift λ1 und die Zusatzvorschrift “bilde den Hauptwert des Integrals”. Im folgenden Beispiel wird die Zusatzvorschrift derart sein, daß eigentlich nichts mehr an ein gewöhnliches Integral erinnert: Beispiel 4.5 Wir betrachten die verallgemeinerte Funktion δ(λ), die Diracsche Delta-Funktion genannt wird. Für δ(λ) wird oft die Funktionsvorschrift 0 für λ 6= 0 δ(λ) = (4.8) ∞ für λ = 0 angegeben. Abgesehen davon, daß (4.8) keine echte R → C - Funktion beschreibt R (da ∞ keine Zahl ist), reicht (4.8) bei weitem nicht aus, um das Integral δ(λ) ϕ(λ) dµℓ (λ) zu definieren. Das Integral wird hier genaugenommen ausschließlich durch die Zusatzvorschrift definiert; diese lautet: Z δ(λ) ϕ(λ) dµ(λ) := ϕ(0) ϕ∈Φ (4.9) 95 4.1. DAS GELFANDSCHE RAUMTRIPEL (Wir haben hier die Konjugiums-Bildung weggelassen, da δ(λ) := δ(λ)). Dieser Ausdruck ist offenbar linear in ϕ und definiert somit ein eindeutiges Element aus Φ∗ . Die Beispiele 4.3 und 4.5 stellen somit zwei Extremfälle dar: im Beispiel 4.3 war die verallgemeinerte Funktion ξ(λ) vollständig durch die Funktionsvorschrift ejλ bestimmt; die Zusatzvorschrift war dort trivial. Im vorliegenden Beispiel 4.5 wird das Integral ausschließlich durch die Zusatzvorschrift (4.9) bestimmt; die Funktionsvorschrift (4.8) dient hier eigentlich nur dazu, eine anschauliche Vorstellung von der verallgemeinerten Funktion δ(λ) zu vermitteln. Eine wesentlich bessere Vorstellung von δ(λ) erhält man aber auf folgende Weise: man betrachtet eine Folge nadelartiger Funktionen, die für k → ∞ immer schmäler und immer höher werden, sodaß die Normierung Z δk (λ) dµℓ (λ) = 1 für alle k erfüllt ist (Siehe Abbildung 4.1). Offenbar gilt dann lim k→∞ Z δk (λ) ϕ(λ) dµℓ (λ) = ϕ(0) . δ(λ) kann in diesem Sinne als ‘Grenzfunktion’ der Folge δk (λ) aufgefaßt werden. G O G O GO O Abbildung 4.1 Analog zur bisher besprochenen ‘eindimensionalen’ δ-Funktion kann man bei E = L2 (Rn , µℓ ) auch eine ‘n-dimensionale’ δ-Funktion definieren: Z δ(λ) ϕ(λ) dµℓ (λ) = ϕ(0) , für alle ϕ(λ) ∈ Φ ⊆ L2 (Rn , µℓ ) (Z. B. Φ = C0∞ (Rn ) oder Φ = S(Rn )). 96 KAPITEL 4. ENTWICKLUNG NACH EIGENVEKTOREN Beispiel 4.6 Wir definieren ein ξ ∈ Φ∗ durch Z Z jλ hξ | ϕi = (e + δ(λ))ϕ(λ) dµℓ (λ) = e−jλ + δ(λ) ϕ(λ) dµℓ (λ) . Nach dem bisher gesagten dürfte auch ohne zusätzliche Erläuterungen klar sein, wie diese Integral zu verstehen ist: es entspricht der Summe Z Z −jλ e ϕ(λ) dµℓ (λ) + δ(λ) ϕ(λ) dµℓ (λ) , wobei der erste Summand ein gewöhnliches Integral ist, und der zweite Summand für ϕ(0) steht. 97 4.2. DIE VERALLGEMEINERTEN EIGENVEKTOREN 4.2 Die verallgemeinerten Eigenvektoren 4.2.1 Erweiterung des Definitionsbereiches auf ganz Φ∗ Definition 4.6 Sei A ein s.a. Operator mit Definitionsbereich DA ⊆ E, und Φ ⊆ E sei ein dichter invarianter Teilraum (d. h. Φ dicht in E und AΦ ⊆ Φ). Für ξ ∈ Φ∗ definieren wir die Wirkung von A durch ∀ϕ ∈ Φ : hAξ | ϕi = hξ | Aϕi (4.10) d. h. Aξ ist jener eindeutig bestimmte Vektor η ∈ Φ∗ , der ∀ϕ ∈ Φ : hη | ϕi = hξ | Aϕi erfüllt. Wegen der Selbstadjungiertheit von A ist (4.10) für alle ξ ∈ DA automatisch erfüllt. Darüber hinaus definiert (4.10) die Wirkung von A aber für alle Elemente aus Φ∗ . Wir haben somit den ursprünglichen Operator A : DA −→ E (4.11) A : Φ∗ −→ Φ∗ (4.12) zu einem Operator erweitert. Obwohl dies nicht sehr konsequent ist, verwenden wir für den s.a. Operator (4.11) und den Erweiterten Operator (4.12) dasselbe Symbol, nämlich ‘A’; in Zweifelsfällen muß dann explizit angegeben werden, welcher der beiden Operatoren gemeint ist. Wir weisen noch einmal darauf hin, daß Definition 4.6 nur für s.a. Operatoren anzuwenden ist. Sie kann beispielsweise für 1j ∂λ angewandt werden, nicht aber für ∂λ . Für nicht s.a. Operatoren muß Definition 4.6 geringfügig abgeändert werden: An die Stelle von (4.10) tritt die Gleichung hAξ | ϕi = hξ | A∗ ϕi. Hierbei ist A∗ der sogenannte adjungierte Operator. Der adjungierte Operator von ∂λ ist beispielsweise der Operator −∂λ . Wir wollen hier aber nicht näher auf diese Verallgemeinerung und die damit verbundenen Komplikationen eingehen. Die folgenden Beispiele zeigen, wie obige Definition in der Praxis gehandhabt werden kann; wir nehmen hierbei wieder den Fall E = L2 (R, µℓ ) , Φ = C0∞ (R) an. Beispiel 4.7 Wir betrachten den s.a. Operator 1j ∂λ . Der Raum C0∞ (R) ⊆ L2 (R, µℓ ) ist offensichtlich invariant für 1j ∂λ . Die verallgemeinerte Funktion ξ(λ) = ejλ entspricht einem Element aus Φ∗ (siehe Beispiel 4.3). Man wird natürlich sofort vermuten, daß 1 ∂λ ejλ = ejλ . j (4.13) 98 KAPITEL 4. ENTWICKLUNG NACH EIGENVEKTOREN Diese Vermutung ist auch tatsächlich korrekt, denn über partielle Integration erhält man die Beziehung Z Z 1 d −jλ e ϕ(λ) dµℓ (λ) = e−jλ ϕ(λ) dµℓ (λ) , ϕ(λ) ∈ C0∞ (R) ; j dλ nach Definition 4.6 ist dies gleichbedeutend mit (4.13). Bei so einfachen Fällen ist es sehr leicht, intuitiv zum richtigen Ergebnis zu gelangen, und es ist daher sehr oft nicht nötig, explizit mit der Gleichung (4.10) zu arbeiten. Beispiel 4.8 Wir betrachten wieder den Operator 1j ∂λ , den wir diesmal auf die verallgemeinerte Funktion 0 für λ < 0 ξ(λ) = 1 für λ ≥ 0 anwenden wollen. Da ξ(λ) nicht differenzierbar ist, betrachten wir zunächst die Funktion ξε (λ) (siehe Abbildung 4.2). [ H O [O O H [ H O Fläche = 1 H Abbildung 4.2 O H H __ d [ O dO H O Für ε → 0 nähert sich ξε (λ) der Funktion ξ(λ) und die Ableitung ξε′ (λ) wird immer schmäler und höher. Analog zu den δk (λ) aus Beispiel 4.5, nähert sich ξε′ (λ) der verallgemeinerten Funktion δ(λ). Naheliegenderweise vermutet man 1 1 ∂λ ξ(λ) = δ(λ) . j j Mit Gleichung (4.10) aus Definition 4.6 kann dies sofort bestätigt werden: Z 1 1 1 h ∂λ ξ | ϕi = hξ | ∂λ ϕi = ξ(λ) ϕ′ (λ) dµℓ (λ) j j j Z∞ 1 1 1 = ϕ′ (λ) dλ = ϕ(λ) |∞ 0 = jϕ(0) = h δ | ϕi. j j j 0 4.2. DIE VERALLGEMEINERTEN EIGENVEKTOREN 99 Beispiel 4.9 Wir wollen 1j ∂λ δ(λ) ermitteln. Gleichung (4.10) liefert: 1 1 1 h ∂λ δ | ϕi = hδ | ∂λ ϕi = ϕ′ (0) . j j j Will man die so definierte verallgemeinerte Funktion veranschaulichen, so ist es günstig, wieder die nadelartigen Funktionen δk (λ) aus Beispiel 4.5 (Seite 95) d zu betrachten; man bildet dann die Ableitungen 1j dλ δk (λ) und läßt k gegen ∞ streben. Beispiel 4.10 Wir betrachten den v-Operator λ. Bei verallgemeinerten Funktionen der Art ejλ oder HW λ1 gibt es keine Zweifel darüber, wie dieser Operator anzuwenden ist. Undurchsichtiger ist dagegen der Ausdruck λδ(λ). Denn λ hat bei λ = 0 eine Nullstelle und δ(λ) hat nach der heuristischen Gleichung (4.8) bei λ = 0 eine Unendlichkeitsstelle; man hat somit das unbestimmte Produkt 0 · ∞. Mit Definition 4.6 erhält man hλδ | ϕi = hδ | λϕi = (λϕ(λ)) |λ=0 . Da ϕ(λ) stetig ist, hat die Funktion λϕ(λ) in λ = 0 eine Nullstelle. Folglich ist hλδ | ϕi = 0; λδ(λ) entspricht somit der Nullfunktion. 4.2.2 Die Eigenwertgleichung Definition 4.7 Sei A ein s.a. Operator im Hilbertraum E, und Φ ⊆ E ein dichter invarianter Teilraum. Gibt es zu einem λ ∈ R einen (von O verschiedenen) Vektor ξ ∈ Φ∗ , für den Aξ = λξ, (4.14) so nennen wir λ einen verallgemeinerten Eigenwert (von A) und ξ einen zugehörigen verallgemeinerten Eigenvektor. Wenn ξ im Definitionsbereich DA des s.a. Operators A liegt, so ist ξ ein eigentlicher Eigenvektor und λ ein eigentlicher Eigenwert (siehe Definition 1.27). Bei ξ ∈ / DA sprechen wir von uneigentlichem Eigenvektor bzw. uneigentlichem Eigenwert6 . Wir unterstreichen, daß uns nur die reellen Eigenwerte interessieren. Die eigentlichen Eigenwerte eines s.a. Operators sind ohnedies stets reell; bei uneigentlichen Eigenwerten muß dies aber explizit gefordert werden, da Gleichung (4.14) im Prinzip auch für λ ∈ C \ R erfüllt sein kann7 . 6 Ist A auf Φ e.s.a., so liegen alle uneigentlichen Eigenvektoren außerhalb von E, d. h. es gibt dann keine Eigenvektoren in E \ DA . 7 Für eine Interpretation und Anwendung komplexer Eigenwerte siehe Arno Bohm [8], 1989. 100 KAPITEL 4. ENTWICKLUNG NACH EIGENVEKTOREN Definition 4.8 Sei {Ai }i∈J ein Satz s.a. Operatoren im Hilbertraum E, und Φ ⊆ E ein dichter invarianter Teilraum. Ein ξ ∈ Φ∗ heißt gemeinsamer (verallgemeinerter) Eigenvektor für die Ai , wenn gilt: ∀i ∈ J : ∃λi ∈ R : Ai ξ = λi ξ. Offenbar gehört zu einem solchen Eigenvektor ein ganzes Tupel (λi )i∈J von Eigenwerten; dieses Eigenwert-Tupel nennen wir multiplen Eigenwert. Diese Definition ist eigentlich trivial. Wir haben sie nur deshalb explizit angeführt, um zu betonen, daß zu einem gemeinsamen Eigenvektor ein ganzer Satz von Eigenwerten gehört, und daß wir nur dann von einem gemeinsamen Eigenvektor sprechen, wenn ein gemeinsamer dichter invarianter Teilraum vorliegt. 4.2.3 Die Berechnung der Spektraldarstellung Satz 4.2 (Entwicklung nach Eigenvektoren) Sei {Ai }i∈I ein vollständiger Satz kommutierender s.a. Operatoren im (separablen) Hilbertraum E, und Φ sei ein entsprechender Roberts-Raum8 . Ist T : E −→ L2 RI , µ (4.15) f 7−→ f (λ) eine Spektraldarstellung für {Ai }i∈I , so gilt: Für fast alle λ ∈ RI (d. h. für alle λ ∈ RI \ N mit µ(N) = 0) gibt es einen Vektor ξλ ∈ Φ∗ , sodaß: • ξλ ist ein gemeinsamer Eigenvektor der Ai zum multiplen Eigenwert λ, d. h.: ∀i ∈ I : Ai ξλ = λi ξλ , ξλ ∈ Φ∗ . • Für f ∈ Φ und f (λ) = T f gilt f (λ) = hξλ | f i a.e.. (4.16) Mit Hilfe der Eigenvektoren kann also über die Gleichung (4.16) direkt die Spektraldarstellung angegeben werden. Die Tatsache, daß (4.16) zunächst nur für f ∈ Φ definiert ist, stellt dabei kein großes Problem dar: für f ∈ E \ Φ sucht man eine H Folge (fk )k=1,2,3,... in Φ mit fk −→ f (Da Φ dicht in E ist, gibt es eine solche Folge immer); die Funktionen fk (λ) lassen sich nach (4.16) ermitteln, und es gilt f (λ) = H-lim fk (λ) k→∞ 8 (4.17) Im Prinzip reicht es aus, daß Φ ein dichter invarianter Teilraum ist, auf dem sich eine nukleare Topologie definieren läßt, die stärker ist als die Hilbertraum-Topologie und bezüglich der alle Ai stetig sind (Genaueres hierzu im Abschnitt 4.3.4). Ist I endlich oder abzählbar, so ist die Existenz eines solchen Raumes gesichert (Siehe Seite 116). 101 4.2. DIE VERALLGEMEINERTEN EIGENVEKTOREN (Dies folgt aus der Tatsache, daß T unitär — und damit stetig — ist). Den Beweis von Satz 4.2 werden wir im Abschnitt 4.3 nachholen. Um mit Hilfe des obigen Satzes eine Spektraldarstellung T zu finden, ist es offenbar notwendig die gemeinsamen Eigenvektoren der Ai zu ermittelt. Darüber hinaus müssen aber noch die folgenden 3 Fragen geklärt werden: a) Wie findet man das Maß µ? b) Wenn ξλ ein Eigenvektor ist, so ist (für beliebiges α ∈ C \ {0}) offensichtlich auch αξλ ein Eigenvektor zum selben multiplen Eigenwert. Es stellt sich somit die Frage, wie der Faktor α bestimmt werden kann. Man bezeichnet die Bestimmung dieses Faktors häufig als Normierung der Eigenvektoren. c) Auch dann, wenn man von der unter b) geschilderten Mehrdeutigkeit absieht, gehen im allgemeinen nicht alle Eigenvektoren in die Entwicklung (4.16) ein. Man muß daher unter Umständen eine gewisse Auswahl treffen, was natürlich sofort die Frage aufwirft, wie man die richtigen von den falschen Eigenvektoren unterscheiden kann. Um auf diese Fragen näher eingehen zu können, müssen wir zunächst ein Kriterium angeben, das es in konkreten Fällen gestattet eindeutig festzustellen, ob man eine Spektraldarstellung gefunden hat: Satz 4.3 Sei {Ai }i∈J ein Satz s.a. Operatoren im Hilbertraum E. Φ ⊆ E sei ein dichter invarianter Teilraum, und {ξλ }λ∈F ⊆RI sei ein Satz gemeinsamer Eigenvektoren, d. h. Ai ξλ = λi ξλ , ξλ ∈ Φ∗ . µ sei ein σ-finites Maß auf RI mit µ RI \ F = 0 (d. h. für fast alle λ ∈ RI hat man einen Eigenvektor ξλ). Der Operator T : E −→ L2 RI , µ f 7−→ f (λ) sei wie folgt definiert: für f ∈ Φ ist f (λ) = hξλ | f i für f ∈ E \ Φ ist f (λ) = H- lim fk (λ) , (4.18) H mit fk −→ f und fk ∈ Φ. (4.19) Die Abbildung T ist genau dann eine Spektraldarstellung für {Ai }i∈I , wenn folgende 3 Punkte erfüllt sind: R 1) Längentreue: ∀ϕ ∈ Φ : kϕk2 = |ϕ(λ)|2 dµ(λ). 2) Surjektivität: ∀f (λ) ∈ L2 RI , µ : ∃f ∈ E : f (λ) = T f . R 3) Definitionsbereich: ∀ψ ∈ ΨAi : λ2i |ψ(λ)|2 dµ(λ) < ∞ (für alle i ∈ I). 102 KAPITEL 4. ENTWICKLUNG NACH EIGENVEKTOREN Die ΨAi sind hierbei Bereiche, auf denen die Ai e.s.a. sind. Ist ein Ai auf Φ e.s.a., so kann ΨAi = Φ gewählt werden; die Bedingung 3 ist dann für dieses Ai automatisch erfüllt. Bemerkung 1: In obigem Satz wird nicht vorausgesetzt, daß die Ai kommutieren. Wenn aber die Bedingungen 1, 2 und 3 erfüllt sind, so ist {Ai }i∈I ein vollständiger Satz kommutierender s.a. Operatoren. Bemerkung 2: Es wird vorausgesetzt, daß T : E → L2 RI , µ eine wohldefinierte Abbildung ist, daß also f (λ) aus (4.18) quadratintegrabel ist, und die Grenzfunktionen aus (4.19) stets (als quadratintegrable Funktionen) existieren. Diese Voraussetzung muß aber nicht zusätzlich überprüft werden, da sie automatisch erfüllt ist, wenn Bedingung 1 zutrifft. Beweis von Satz 4.3: Mit Hilfe der Bedingungen 1 und 2 zeigt man leicht, daß T eine unitäre Transformation ist. Es muß also nur noch gezeigt werden, daß T die Operatoren Ai in die v-Operatoren λi überführt. Sei ψ ∈ ΨAi und ϕ ∈ Φ; dann ist Z Z hϕ | Ai ψi = hAi ϕ | ψi = (Ai ϕ)(λ)ψ(λ) dµ(λ) = λi ϕ(λ)ψ(λ) dµ(λ) |{z} (4.20) ∈Φ (Die letzte Gleichung gilt wegen (Ai ϕ)(λ) = hξλ | Ai ϕi = λi hξλ | ϕi). Aufgrund von Bedingung 3 ist λi ψ(λ) eine quadratintegrable Funktion. Aus (4.20) folgt dann: hϕ | Ai ψi = hϕ(λ) | λi ψ(λ)i = hϕ | T −1 λi T ψi. Da dies für alle ϕ ∈ Φ gilt und Φ dicht in E ist, muß für ψ ∈ ΨAi stets Ai ψ = T −1 λi T ψ gelten. Man sieht somit: Bezeichnen wir die Einschränkung von Ai auf ΨAi mit A′i , so ist T −1 λi T eine s.a. Erweiterung von A′i . Da A′i e.s.a. ist, hat er nur eine s.a. Erweiterung, nämlich Ai . Somit ist Ai = T −1 λi T . Wir zeigen noch, daß die Bedingung 3 automatisch erfüllt ist, wenn Ai auf Φ e.s.a. ist: Mit ϕ ∈ Φ ist auch Ai ϕ ∈ Φ; wegen T Ai ϕ = (Ai ϕ)(λ) = hξλ | Ai ϕi = λi ϕ(λ), folgt dann aus 1 die Beziehung Z 2 2 λ2i |ϕ(λ)| dµ(λ) = kAi ϕk < ∞. QED. Nun werden wir näher auf die 3 offenen Fragen von Seite 101 eingehen, wobei wir uns aber auf den Fall für endliches I beschränken. Wir beginnen mit der Frage c. Bedauerlicherweise gibt es aber kein einfaches allgemeingültiges Kriterium, das es gestattet eine korrekte Auswahl der Eigenvektoren vorzunehmen. Man ist daher unter Umständen auf heuristische Überlegungen angewiesen, um die tatsächlich ‘benötigten’ von den ‘unphysikalischen’ Eigenvektoren zu unterscheiden. Mit Hilfe von Satz 4.3 kann man dann nachträglich feststellen, ob man eine korrekte Auswahl getroffen hat. Um das Erkennen der richtigen Eigenvektoren zu erleichtern ist es günstig, die folgenden 3 Punkte zu beachten: 103 4.2. DIE VERALLGEMEINERTEN EIGENVEKTOREN i) Für jedes λ ∈ RI kann höchstens ein Eigenvektor ξλ genommen werden9 . T ii) Die eigentlichen Eigenvektoren (das sind jene, die in i∈I DAi liegen) sind alle zu nehmen. iii) Jene uneigentlichen Eigenvektoren, die durch stark anwachsende verallgemeinerten Funktionen (wie etwa ex ) dargestellt werden, sind meistens zu verwerfen. Jene Eigenvektoren, die durch ‘brave’ verallgemeinerte Funktionen (wie etwa ejx ) dargestellt werden, sind meistens zu nehmen. Hat man die korrekte Auswahl der Eigenvektoren getroffen, so liegt folgende Aufteilung von RI vor: F = F = P = Menge der verallgemeinerten multiplen Eigenwerte (F ⊆ RI ) Abschließung der Menge F (es ist dann F ⊆ F ⊆ RI ) Menge der eigentlichen multiplen Eigenwerte (P ⊆ F ). Die Festlegung des Maßes µ und die Normierung der Eigenvektoren kann nun folgendermaßen durchgeführt werden: iv) Die Menge F entspricht dem Träger supp µ des Maßes µ der Sprungpunkte. 10 . P ist die Menge v) Den Sprungpunkten ordnet man das Maß 1 zu und die entsprechenden Eigenvektoren werden auf 1 normiert: ∀λ ∈ P : µ({λ}) = 1, kξλ k = 1. vi) Das Maß auf F \ P und die Normierung der uneigentlichen Eigenvektoren muß so gewählt werden, daß die Längentreue der Transformation T erfüllt ist (Bedingung 1 von Satz 4.3). In der Praxis kann µ auf F \ P immer als Lebesgue-Maß gewählt werden11 . Die Bedingung der Längentreue wird dann nur mehr für die Normierung der uneigentlichen Eigenvektoren benötigt12 . 9 Diese Bedingung entsteht durch die Voraussetzung, daß der Observablen-Satz {Ai }i∈I vollständig ist. Den Fall unvollständiger Observablen-Sätze werden wir erst im Abschnitt 4.2.6 behandeln. 10 Begründung: Da man außerhalb von supp µ keine Eigenwerte braucht, ist supp µ ⊇ F ; da supp µ abgeschlossen ist, gilt sogar supp µ ⊇ F . Wäre aber supp µ ⊃ F , so gäbe es in supp µ \ F einenPunkt λ mit einer offenen meßbaren Umgebung U , die außerhalb von F liegt (denn, wenn jede Umgebung von λ einen Punkt aus F enthält, so ist λ ∈ F ). Da es in U keine Eigenwerte gibt, muß µ(U ) = 0 sein, was aber ein Widerspruch zu λ ∈ supp µ ist. 11 Eine ausführliche Begründung für diesen Sachverhalt findet man in [36] 12 ‘Normieren’ heißt hier einen geeigneten multiplikativen Faktor zu finden (Siehe Punkt b von Seite 101). Über die Bedingung der Längentreue kann (bei gegebenem Maß) aber nur der Betrag dieser Faktoren bestimmt werden; es bleiben somit noch unbestimmte Phasenfaktoren. Tatsächlich gibt es (selbst bei gegebenem Maß µ) mehrere Möglichkeiten eine Spektraldarstellung zu bilden (Siehe Seite 44). 104 KAPITEL 4. ENTWICKLUNG NACH EIGENVEKTOREN Das Maß µ hat also folgende Struktur: µ(∆) = µℓ0 (∆) + µp (∆) , m ∆ ⊆ RI , wobei µp (∆) = Anzahl der Sprungpunkte in ∆ µℓ0 (∆) = µℓ ∆ ∩ F . Gelingt es im Punkt vi) nicht, die Längentreue zu erfüllen, so hat man offenbar in iii) eine falsche Auswahl der Eigenvektoren getroffen. Um aber absolut sicher zu sein, daß die in iii) getroffene Auswahl korrekt ist, muß man auch die Bedingungen 2 und 3 aus Satz 4.3 prüfen. Die Bedingung 2 dürfte meistens (möglicherweise sogar immer) automatisch erfüllt sein, wenn man nach obigem Schema vorgeht (und Bedingung 1 erfüllt ist). Sollte Bedingung 3 nicht erfüllt sein, so hat man ebenfalls eine falsche Auswahl an Eigenvektoren getroffen: man hat dann zwar eine Spektraldarstellung gefunden, nicht aber eine für die Operatoren Ai , sondern eine für andere s.a. Operatoren, die auf Φ mit den Ai übereinstimmen. 4.2.4 Beispiel: Spektraldarstellung für den Operator 1j ∂x Wir betrachten den Hilbertraum E = L2 (R, µℓ ) und den s.a. Operator 1j ∂x , der in E einen vollständigen Satz bildet. Gesucht sei eine Spektraldarstellung T : L2 (R, µℓ ) −→ L2 (R, µ) f (x) 7−→ fe(λ) , die 1j ∂x in den v-Operator λ überführt. Über die Roberts-Basis {x, 1j ∂x } erhält man den Roberts-Raum Φ = S(R) . Man prüft leicht nach, daß die verallgemeinerten Funktionen ξλ (x) = kλ ejλx (kλ ∈ C) verallgemeinerte Eigenvektoren von 1j ∂x sind (Siehe Beispiel 4.7): 1 ∂x ξλ (x) = λξλ (x) . j Sie sind alle uneigentlich; eigentliche Eigenvektoren gibt es keine. Da all diese Eigenvektoren dasselbe Konvergenz- und Wachstumsverhalten aufweisen, nehmen wir an, daß sie alle benötigt werden. Nach den im letzten Abschnitt angeführten Kriterien führt uns dies zur Annahme µ = µℓ (Lebesgue-Maß). Die Normierungsfaktoren kλ bleiben vorläufig noch unbestimmt; wir setzen aber k lambda ∈]0, ∞[ voraus, da ein eventueller Phasenfaktor willkürlich ist. Außerdem versuchen wir den Ansatz kλ = k (d. h. kλ unabhängig von λ). 105 4.2. DIE VERALLGEMEINERTEN EIGENVEKTOREN Da T längentreu sein soll, streben wir folgende Beziehung an: Z Z 2 |ϕ(λ)| e dλ = |ϕ(x)|2 dx, ϕ(x) ∈ Φ. (4.21) Wenn wir T durch Entwicklung nach Eigenvektoren erhalten, dann gilt Z ϕ(λ) e = ξλ(x)ϕ(x) dx. (4.22) Hieraus ergibt sich: Z Z Z Z Z 2 |ϕ(λ)| e dλ = ϕ(λ) e ϕ(λ) e dλ = ξλ(x) ϕ(x) dx ξλ (x′ )ϕ(x′ ) dx′ dλ λ λ = k2 = k 2 Z Z Zλ ϕ(x) x ϕ(x) Z Z x′ x ′ ϕ(x′ ) ejλ(x−x ) dx′ dx dλ x′ ′ ϕ(x ) x′ x λ Z ′ ejλ(x−x ) dλ dx′ dx. λ Die letzte Integrationsvertauschung ist nicht erlaubt und das innerste Integral in der letzten Zeile ist auch gar nicht definiert. Der so erhaltene Ausdruck zeigt aber worauf man hinaus will: es soll die symbolische Beziehung Z ′ 2 k ejλ(x−x ) = δ(x′ − x) (4.23) erfüllt sein. Denn wegen Z ϕ(x′ ) δ(x′ − x) dx′ = ϕ(x) ergibt sich aus (4.23) das anzustrebende Ergebnis (4.21). Um die — zunächst rein symbolische — Gleichung (4.23) zu präzisieren, nähern ′ ′ wir ejλ(x−x ) durch ejλ(x−x ) χr (x) an, wobei 1 für |λ| ≤ r χr (x) = , r = 1, 2, 3, . . . . 0 für |λ| > r Man hat dann: Z 2 |ϕ(λ)| e dλ = lim k 2 Z r→∞ Z ϕ(x) Z ′ ϕ(x′ ) ejλ(x−x ) dx′ dx dλ. x′ λ∈[−r,r] x Jetzt kann man vertauschen (Fubini-Theorem) und erhält somit k 2 lim r→∞ Z x ϕ(x) Z x′ | ϕ(x′ ) zZ 2r si(r(x′ −x)) }| jλ(x−x′ ) e λ∈[−r,r] {z fr(x) { dλ dx′ dx, } (mit si y := sin y ). y 106 KAPITEL 4. ENTWICKLUNG NACH EIGENVEKTOREN Man zeigt leicht, daß lim fr (x) = 2πϕ(x). Mit Hilfe der Bedingung ϕ(x) ∈ S(R) r→∞ läßt sich die gleichmäßige Konvergenz der Funktionenfolge fr (x) zeigen; die Grenzwertbildung darf dann mit der Integration vertauscht werden und man erhält Z Z 2 2 lim k ϕ(x)fr (x) dx = 2πk ϕ(x)ϕ(x) dx = 2πk 2 kϕk2 . r→∞ R 2 Mit k = √12π führt dies schließlich zu |ϕ(λ)| e dλ = kϕk2 ; die Längentreue der durch (4.22) definierten Transformation ist dann erfüllt. Da sich auch die Surjektivität dieser Abbildung zeigen läßt, haben wir mit (4.22) tatsächlich die gesuchte Spektraldarstellung gefunden (Bedingung 3 von Satz 4.3 muß nicht explizit nachgeprüft werden, da 1j ∂x auf S(R) e.s.a. ist). Wir haben gesehen, daß beim Überprüfen der Längentreue die Beziehung Z ξλ (x′ )ξλ (x) dλ = δ(x′ − x) zu verifizieren ist (Gleichung(4.23)). Die häufig zitierte ‘Orthonormierungsbedingung’ Z ξλ′ (x)ξλ (x) dx = δ(λ − λ′ ) (4.24) ist dagegen keine hinreichende Bedingung für die Längentreue von T . Diese Gleichung führt letztlich nur auf ϕ(λ) e = hξλ | ϕi, was aber ohnedies per definitionem gilt. Und selbst dann, wenn man es schafft aus (4.24) irgend eine Normierungsbedingung herauszulesen, so hat man immer noch nicht die Längentreue bewiesen: denn selbst bei korrekter Normierung kann es sein, daß man zu wenige, zu viele oder die falschen Eigenvektoren ausgewählt hat. 4.2.5 Die inverse Transformation Sei T : L2 RJ , σ −→ L2 RI , µ f (x) 7−→ fe(λ) eine unitäre Transformation, die durch die Entwicklung Z ϕ(λ) e = ξλ (x)ϕ(x) dσ(x) , ϕ(x) ∈ Φ ⊆ L2 RJ , σ gegeben ist (Φ dicht in L2 RJ , σ ). Von den ξλ (x) setzen wir hier voraus, daß es sich um wohldefinierte (bezüglich x und λ meßbare) Funktionen handelt, die folgende Bedingung erfüllen: Z Z e e e = T Φ. ϕ(x) ∈ Φ, ψ(λ) ∈Φ ξλ (x) ϕ(x) ψ(λ) dσ(x) dµ(λ) < ∞, −1 (4.25) i. allg. folgende Gestalt Unter dieser Bedingung hat die Umkehrtransformation T Z ϕ(x) = ηx (λ)ϕ(λ) e dµ(λ) mit ηx (λ) = ξλ (x). 4.2. DIE VERALLGEMEINERTEN EIGENVEKTOREN 107 Begründung: Sei ϕ(x) b := Z ηx (λ)ϕ(λ) e dµ(λ) , ϕ(λ) e = T ϕ(x) , ϕ(x) ∈ Φ. Wegen (4.25) ergibt sich mit Hilfe des Fubini-Theorems (siehe z. B. [35]): Z Z Z ϕ(x)ψ(x) b dσ(x) = ξλ (x)ϕ(λ) e dµ(λ) ψ(x) dσ(x) Z Z = ϕ(λ) e ξλ (x)ψ(x) dσ(x) dµ(λ) Z Z e = ϕ(λ) e ψ(λ) dµ(λ) = ϕ(x)ψ(x) dσ(x) . Man hat somit Z Z ϕ(x)ψ(x) b dσ(x) = ϕ(x)ψ(x) dσ(x) für alle ψ(x) ∈ Φ; in vielen Fällen läßt sich zeigen, daß hieraus folgt. = ϕ(x) a.e. ϕ(x) b Beispiel 4.11 Wir betrachten wieder das Beispiel des letzten Abschnittes: Z 1 ϕ(λ) e =√ e−jλx ϕ(x) dx (Fourier-Transformation). 2π Unter Anwendung der soeben beschriebenen Methode erhält man Z 1 ϕ(x) = √ e+jλx ϕ(λ) e dλ (inverse Fourier-Transformation). 2π Der oben geschilderte Zusammenhang kann auch von Nutzen sein, wenn es darum geht, auf heuristischem Wege abzuschätzen, ob man alle benötigten Eigenvektoren gefunden hat: Die Gleichung Z ϕ(x) = ξλ (x) ϕ(λ) e dµ(λ) besagt, daß ϕ(x) als ‘Linearkombination’ der Funktionen ξλ (x) dargestellt werden kann (D. h. man faßt obiges Integral als eine unendliche Linearkombination der ξλ (x) auf, die jeweils mit den Zahlen ϕ(λ) e gewichtet sind). Man kann dann sagen, daß ein System {ξλ } von Eigenfunktionen genau dann vollständig ist, wenn es möglich ist, über ‘Linearkombinationen’ der ξλ (x) alle ϕ(x) ∈ Φ zu erzeugen. 4.2.6 Unvollständige Observablen-Sätze Hat man einen unvollständigen Satz {Ai }i∈J kommutierender s.a. Operatoren, so kann es für diesen zwar keine Spektraldarstellung geben, aber immerhin eine diagonalisierende Darstellung T : E −→ L2 RI , µ f 7−→ f (λ) . 108 KAPITEL 4. ENTWICKLUNG NACH EIGENVEKTOREN Die Unvollständigkeit von {Ai }i∈J drückt sich in der Beziehung J ⊂I aus; in L2 RI , µ gibt es demnach neben den {λi }i∈J noch weitere v-Operatoren. Bei der Konstruktion der Abbildung T hat man die Eigenwert-Gleichungen Ai ξλ = λi ξλ nur für i ∈ J zu lösen. Die Lösungen ξλ haben aber nach wie vor einen Parameter λ ∈ I, wobei jedoch die λi mit i ∈ I \ J nicht als Eigenwerte, sondern als abstrakte Parameter aufgefaßt werden. Genaugenommen sind aber auch diese abstrakten Parameter Eigenwerte, und zwar für die Operatoren {T −1 λi T }i∈I\J . 4.2.7 Ermittlung des Spektrums einer Observablen Gegeben sei ein s.a. Operator A im Hilbertraum E; gesucht sei das Spektrum spec A dieses Operators. Die Bestimmung von spec A kann im Prinzip natürlich mit den Methoden aus Abschnitt 3.1 erfolgen (z. B. mittels Weyl-Kriterium). In der Praxis ist es aber oft günstiger das Spektrum über die Eigenwertgleichung zu ermitteln. Ist Φ ein Roberts-Raum für A, so hat man die Gleichung Aξλ = λξλ , ξλ ∈ Φ∗ , λ ∈ R (4.26) zu lösen. Interessiert ist man nicht an ξλ , sondern nur an den Eigenwerten λ, die diese Gleichung lösen. Ist K(A) ⊆ R die Menge aller verallgemeinerten Eigenwerte (also die Menge aller λ ∈ R, die (4.26) erfüllen), so ist spec A ⊆ K(A) (4.27) (Mit K(A) als Abschließung von K(A))13 . Um an Stelle der Teilmengen-Relation (4.27) die Gleichheit spec A = K(A) zu erhalten, dürfte man nur jene Eigenwerte in K(A) aufnehmen, die zu einem Eigenvektor gehören, der in die Entwicklung nach Eigenvektoren (Satz 4.2) eingeht. 4.2.8 Physikalische Interpretation der Eigenvektoren Ist ξ ein eigentlicher Eigenvektor des s.a. Operators A, also Aξ = λξ, ξ ∈ DA , 13 Beweis: Sei A 1 = A und {A1 , A2 } ein vollständiger Satz kommutierender s.a. Operatoren. T : E → L2 R2 , µ sei eine Spektraldarstellung für {A1 , A2 }. Nach Seite 103 gibt es eine Menge F ⊆ R2 multipler Eigenwerte, sodaß F = supp µ ist. Offenbar gilt π1 (F ) ⊆ K(A) und somit π1 (F ) ⊆ K(A). Weiters läßt sich leicht zeigen, daß π1 F = π1 (F ) ist. Man hat dann QED. spec A = π1 F = π1 (F ) ⊆ K(A). 109 4.3. DIE TOPOLOGIE VON Φ so kann ξ sehr leicht physikalisch interpretiert werden: ist das System im Zustand ξ, so würde eine Messung der Observablen A mit Sicherheit den Meßwert λ liefern (Siehe Satz 2.11, Seite 72). Die uneigentlichen Eigenvektoren liegen in Φ∗ \IH und können daher nicht als physikalisch realisierbare Zustände interpretiert werden. Ein uneigentlicher Eigenvektor kann aber häufig als idealisierter Grenzzustand einer Folge δk echter Zustände aufgefaßt werden. In einer Spektraldarstellung für A entsprechen den δk Funktionen δk (λ), wie sie in Abbildung 4.1, Seite 95, angedeutet werden; die Unschärfe der δk nimmt mit wachsendem k ab, sodaß sie beim idealisierte Grenzzustand schließlich 0 ist. Diese Veranschaulichung der uneigentlichen Eigenvektoren ist zwar sehr nützlich, bleibt aber dennoch ein rein heuristisches Konzept, das nie ganz frei von Schwierigkeiten ist (So führt z. B. die Annahme einer verschwindenden Impulsunschärfe zu einen unendlichen Ortsunschärfe). Ist ξ(x) eine verallgemeinerte Funktion, die einen uneigentlichen Eigenvektor darstellt, so kann man |ξ(x)|2 unter Umständen als eine Art Wahrscheinlichkeitsdichte auffassen, wie man dies von eigentlichen Zuständen her gewöhnt ist. Da jedoch die uneigentliche Eigenvektoren nicht normierbar sind (Die Forderung kξk = 1 ist nur dann sinnvoll, wenn ξ ein Hilbertraum-Vektor ist), stellt |ξ(x)|2 keine absolute Wahrscheinlichkeitsdichte dar, sondern bestenfalls eine relative Verteilung, die mehr zu Zwecken der Anschauung dient, als für eine exakte rechnerische Verwendung. 4.3 Die Topologie von Φ Der Raum Φ∗ soll natürlich alle Eigenvektoren beinhalten, die für eine Entwicklung nach Satz 4.2 benötigt werden. Andererseits sollte Φ∗ aber möglichst keine weitere (unbenötigten) Eigenvektoren beinhalten; man ist deshalb daran interessiert, Φ∗ geeignet einzuschränken. Eine solche Einschränkung erhält man, wenn man an Stelle des algebraisch dualen Raums Φ∗ den sogenannten topologisch dualen Raum Φ′ wählt. Φ′ ist kleiner als Φ∗ und es gilt somit Φ ⊆ E ⊆ Φ′ ⊆ Φ∗ (E sei der Hilbertraum). Φ′ beinhaltet nur jene Elemente aus Φ∗ , die Φ-stetig sind. Da es mehrere Möglichkeiten gibt, die Φ-Stetigkeit zu definieren, gibt es auch mehrere Möglichkeiten Φ′ zu bilden. Wir werden eine sehr scharfe Form der Φ-Stetigkeit angeben, die auf Roberts zurückgeht (Siehe [37], [38]). Diese scharfe Stetigkeits-Bedingung führt zu einem kleinen Raum Φ′ — dem kleinsten Φ′ , das im Rahmen der Theorie des Gelfandschen Raumtripels (bei gegebenem Φ) möglich ist. Wir werden die von Roberts angegebene Φ-Stetigkeit in einer Form beschreiben, die sich unmittelbar praktisch anwenden läßt und keine weiteren mathematischen Kenntnisse voraussetzt. In den Abschnitten 4.3.2 bis 4.3.4 werden wir dann näher auf die zugrundeliegenden mathematischen Verhältnisse eingehen; der nur an praktischen Anwendungen interessierte Leser kann diese Abschnitte überspringen. 110 4.3.1 KAPITEL 4. ENTWICKLUNG NACH EIGENVEKTOREN Der Raum Φ′R Definition 4.9 Sei Φ ein durch die Roberts-Basis {Bk }k∈K vermittelter RobertsRaum. Ein ξ ∈ Φ∗ nennen wir Φ-stetig im Sinne von Roberts, wenn gilt: es gibt eine endliche Teilmenge {N1 , N2 , . . . , Np } ⊆ Prod0 {Bk }k∈K und ein C > 0, sodaß ∀ϕ ∈ Φ : |hξ | ϕi| ≤ C · (kN1 ϕk + kN2 ϕk + . . . + kNp ϕk) . (4.28) Mit Φ′R bezeichnen wir die Menge aller ξ ∈ Φ∗ , die diese Bedingung erfüllen. Φ′R ist somit die Menge der linear-stetigen Funktionale über Φ (‘stetig’ im Sinne von Roberts). Satz 4.4 Sei {Ai }i∈J ein Satz kommutierender s.a. Operatoren, und Φ sei ein Roberts-Raum für {Ai }i∈J (vermittelt durch eine Roberts-Basis {Bk }k∈K ). In Φ′R gibt es dann alle Eigenvektoren, die für die Entwicklung einer diagonalisierenden Darstellung benötigt werden. 4.3.2 Der Begriff der Topologie 14 Bisher haben wir, wenn es um Konvergenzbegriffe ging, immer von Folgen gesprochen. In manchen Räumen reicht aber der Folgen-Begriff nicht aus, um exakt festzulegen, was man unter Konvergenz versteht. Wir werden daher sogenannte Netze einführen, die in zweifacher Hinsicht eine Verallgemeinerung des Folgen-Begriffes darstellen: Netze können überabzählbar viele Glieder haben, und die Glieder von Netzen sind nicht so streng geordnet, wie man dies von den Gliedern einer Folge normalerweise fordert. Definition 4.10 Sei K eine Indexmenge in der eine Ordnungsrelation definiert ist, die folgende Eigenschaften hat: i) ∀α ∈ K : α α (Reflexivität) ii) ∀α, β ∈ K : (α β und β α) =⇒ (α = β) iii) ∀α, β, γ ∈ K : (α β und β γ) =⇒ (α γ) (Antisymmetrie) (Transitivität) iv) ∀α, β ∈ K : ∃γ ∈ K : (γ α und γ β). Eine Abbildung K → E nennen wir ein Netz in E und schreiben hierfür (fk )k∈K (Hierbei ist E eine beliebige Menge). Eine Folge (fk )k=1,2,3,... ist ein spezielles Netz, bei dem K = N ist (also K abzählbar) und die Ordnungsrelation der Relation ≥ entspricht. Die Relation ≥ erfüllt offensichtlich alle Bedingungen aus Definition 4.10, hat aber die zusätzliche Eigenschaft, daß für alle α, β ∈ N entweder α ≥ β oder β ≥ α ist. 14 Die Abschnitte 4.3.2 bis 4.3.4 enthalten eine Beschreibung des mathematischen Hintergrundes von Abschnitt 4.3.1. Sie können unter Umständen auch übersprungen werden. 111 4.3. DIE TOPOLOGIE VON Φ Ein Netz (ak )k∈K in R (oder C) konvergiert per definitionem genau dann gegen ein a ∈ R (oder a ∈ C), wenn ∀ǫ > 0 : ∃N ∈ K : k N ⇒ |ak − a| < ǫ. Ein Netz (fk )k∈K in einem allgemeinen Hilbertraum E konvergiert genau dann gegen ein f ∈ E, wenn ∀ǫ > 0 : ∃N ∈ K : k N ⇒ kfk − f k < ǫ. Es gibt aber auch Räume mit wesentlich komplizierteren Konvergenzbegriffen; viele von diesen lassen sich in folgende Definition einordnen: Definition 4.11 E sei ein Vektorraum. Eine Funktion ⌊·⌋ : E → [0, ∞[ wird Seminorm genannt, wenn i) ⌊f + g⌋ ≤ ⌊f ⌋ + ⌊g⌋ , ii) ⌊αf ⌋ = |α| ⌊f ⌋ , für f, g ∈ E für f ∈ E, α ∈ C (Dreiecksungleichung) (Homogenität). Eine Familie { ⌊·⌋ }β∈B von Seminormen definiert auf folgende Weise einen Konvergenzbegriff in E: ein Netz (fk )k∈K in E konvergiert genau dann gegen ein f ∈ E, wenn ∀ǫ > 0 : ∃N ∈ K : k N ⇒ ∀β ∈ B : ⌊fk − f ⌋β < ǫ . Ein Vektorraum, der mit einem solchen Konvergenzbegriff versehen ist, heißt lokal konvexer Raum. Jeder Hilbertraum ist offenbar auch ein lokal konvexer Raum: die entsprechende Familie von Seminormen hat nur ein einziges Element, nämlich die HilbertraumNorm aus Definition 1.13 (In diesem Sinne sind auch R und C lokal konvexe Räume). RI ist ebenfalls ein lokal konvexer Raum: für jedes i ∈ I hat man eine Seminorm ⌊λ⌋i = |πi (λ)| ; ein Netz (λ(k) )k∈K in RI konvergiert genau dann gegen λ ∈ RI , wenn für alle i ∈ I πi(λ(k) ) gegen πi (λ) konvergiert15 . Hat man in einem Raum E einen Konvergenzbegriff eingeführt, so kann man offene und abgeschlossene Mengen definieren: • Eine Menge C ⊆ E ist abgeschlossen, wenn alle Häufungspunkte von C wieder in C liegen (D. h.: wenn ein Netz in C gegen ein f ∈ E konvergiert, so ist f ∈ C). Ferner ist per definitionem auch die leere Menge abgeschlossen. • Eine Menge Ω ⊆ E ist offen, wenn E \ Ω abgeschlossen ist. 15 Bei endlichem I kann dieser Konvergenzbegriff auch durch eine einzige Seminorm X ⌊λ⌋ := ⌊λ⌋i i∈I definiert werden. 112 KAPITEL 4. ENTWICKLUNG NACH EIGENVEKTOREN (In RI ergeben sich mit obiger Definition genau die auf Seite 75 beschriebenen offenen Mengen). In einigen Räumen erhält man die selben offenen und abgeschlossenen Mengen, wenn man an Stelle des Netz-Begriffes nur den eingeschränkteren Folgen-Begriff verwendet. Dies gilt unter anderem in allen separablen Hilberträumen, insbesondere also in R, C, Rn und Cn (In Definition 1.7 haben wir bei der Charakterisierung der offenen und abgeschlossenen Mengen von Rn tatsächlich nur den Folgen-Begriff verwendet). Die Gesamtheit aller offenen Mengen τ = Ω ⊆ E Ω offen nennt man Topologie von E, wenn gilt: i) beliebige Vereinigungen offener Mengen sind wieder offen ii) endliche Durchschnitte offener Mengen sind wieder offen iii) E und ∅ sind offen. Die Konvergenzbegriffe lokal konvexer Räume (und andere werden wir nicht betrachten) führen stets zu offenen Mengen, die eine Topologie bilden. Doch auch umgekehrt definiert jede Topologie einen Konvergenzbegriff: ein Netz (fk )k∈K konvergiert genau dann gegen f , wenn für alle offenen Ω mit f ∈ Ω ein N ∈ K existiert, sodaß für alle k N stets fk ∈ Ω ist. Man kann einen Konvergenzbegriff somit auch dadurch definieren, daß man festlegt, welche Mengen man als offen bezeichnet. In diesem Sinne sind die Begriffe Topologie und Konvergenzbegriff äquivalent. Für weitere Ausführungen zu diesem Thema siehe z. B. Reed/Simon [35], Kapitel IV. Ein Raum in dem eine Topologie (=Konvergenzbegriff) definiert ist, wird topologischer Raum genannt. In ein- und demselben Raum können natürlich auch mehrere Konvergenzbegriffe definiert sein; man verwendet dann: Definition 4.12 Sei E ein Raum, in dem zwei verschiedene Topologien (=Konvergenzbegriffe) τ1 und τ2 definiert sind. Gilt für alle Netze (fk )k∈K die Beziehung τ1 τ2 fk −→ f =⇒ fk −→ f , so sagt man die Topologie τ1 ist stärker als τ2 (bzw. τ2 ist schwächer als τ1 ) 4.3.3 16 . Die Φ-Stetigkeit Definition 4.13 Seien E1 und E2 zwei topologische Räume. Eine Abbildung A : E1 −→ E2 f 7−→ Af wird stetig genannt, wenn für jedes Netz (fk )k∈K in E1 gilt: konvergiert fk gegen f , so konvergiert Afk gegen Af . Symbolisch: E1 E2 fk −→ f =⇒ Afk −→ Af . 16 An Stelle von stärker und schwächer verwendet man auch die Bezeichnungen feiner und gröber. Das ist so zu verstehen, daß eine starke Topologie mehr offene Mengen hat und in diesem Sinne ‘feiner’ ist. 113 4.3. DIE TOPOLOGIE VON Φ In vielen Fällen kann in obiger Definition der Begriff Netz durch den Begriff Folge ersetzt werden, denn es gilt: Satz 4.5 Ist E1 ein lokal konvexer Raum, mit höchstens abzählbar vielen Seminormen, so bleibt Definition 4.13 unverändert, wenn man den Begriff ‘Netz’ durch den Begriff ‘Folge’ ersetzt. Beweis: Bei höchstens abzählbar vielen Seminormen ist E1 ein metrischer Raum (Siehe z. B. [35], Theorem V.5). Für metrische Räume kann die Abschließung B einer Menge B ⊂ E1 über Folgen konstruiert werden (Siehe z. B. [35], Seite 96). Für jedes f ∈ B gibt es dann eine Folge (fk )k=1,2,3,... in B, die gegen f konvergiert. Wenn nun E E 1 2 aus fk −→ f stets Afk −→ Af folgt, so liegt Af in der Abschließung AB von AB, und folglich ist AB ⊆ AB. Nach [26], Seite 323 ist dann A stetig. QED. Gelegentlich ist auch folgender Satz von Nutzen: Satz 4.6 Seien E1 und E2 zwei lokal konvexe Räume. Eine lineare Abbildung A : E1 → E2 ist genau dann stetig, wenn sie in Null stetig ist, wenn also gilt: E1 E2 fk −→ OE1 =⇒ Afk −→ OE2 (OE1 sei der Nullvektor in E1 , und OE2 der Nullvektor in E2 ). Führt man in Φ eine Topologie ein, so kann man Definition 4.13 anwenden, indem man E1 = Φ setzt, und dadurch die Φ-Stetigkeit definiert. Für E2 setzen wir hierbei 3 verschiedene Räume ein: • Ein linearer Operator A : Φ → Φ ist Φ-stetig, wenn Φ Φ ϕk −→ ϕ =⇒ Aϕk −→ Aϕ . • Sei Φ ⊆ E; E ein Hilbertraum. Die Einbettung I : Φ −→ E ϕ 7−→ ϕ ist Φ-stetig, wenn Φ E ϕk −→ ϕ =⇒ ϕk −→ ϕ . Die Φ-Topologie ist dann stärker als die Hilbertraum-Topologie. • Ein lineares Funktional ξ : Φ −→ C ϕ 7−→ hξ | ϕi ist Φ-stetig, wenn ϕk −→ ϕ =⇒ hξ | ϕk i → hξ | ϕi . Φ 114 KAPITEL 4. ENTWICKLUNG NACH EIGENVEKTOREN Für den zuletzt genannten Fall geben wir noch einen Satz an: Satz 4.7 Sei Φ ein lokal konvexer Raum mit den Seminormen { ⌊·⌋β }β∈B . Ein lineares Funktional ξ : Φ −→ C ϕ 7−→ hξ | ϕi ist genau dann stetig, wenn es β1 , β1 , . . . βp ∈ B und ein C > 0 gibt, sodaß ∀ϕ ∈ Φ : |hξ | ϕi| ≤ C · ⌊ϕ⌋β1 + ⌊ϕ⌋β2 + . . . + ⌊ϕ⌋βp . (Siehe z. B. [35], Theorem V.2). Definition 4.14 Sei Φ ein linear konvexer Raum. Mit Φ′ bezeichnen wir die Menge aller linearen Funktionale ξ : Φ −→ C ϕ 7−→ hξ | ϕi die Φ-stetig sind. Φ′ heißt topologisch dualer Raum von Φ. 4.3.4 Bedingungen für die Existenz einer Entwicklung nach Eigenvektoren In diesem Abschnitt werden wir angeben, wie man die Topologie von Φ wählen muß, damit sichergestellt ist, daß Φ′ alle benötigten Eigenvektoren enthält. Satz 4.8 (Gelfand/Maurin) Sei {Ai }i∈J ein Satz kommutierender s.a. Operatoren im (separablen) Hilbertraum E, und Φ sei ein dichter invarianter Teilraum. In Φ sei eine Topologie definiert, für die gilt: i) Die Topologie von Φ ist stärker als die Hilbertraum-Topologie. ii) Die Abbildungen Ai : Φ → Φ sind Φ-stetig. iii) Die Topologie von Φ ist nuklear. Dann gibt es in Φ′ alle Eigenvektoren, die für die Entwicklung einer diagonalisierenden Darstellung benötigt werden. Einen Beweis dieses Satzes findet man in Maurin [26], Seite 83, Theorem 5. Der dort formulierte Satz unterscheidet sich geringfügig von unserem, da Maurin an Stelle der diagonalisierenden Darstellung den Begriff des Direct Integral verwendet. Der bei Maurin angeführte Beweis läßt sich aber fast wörtlich auf unseren Satz anwenden. 115 4.3. DIE TOPOLOGIE VON Φ Vom praktischen Standpunkt aus gesehen ist dieser Satz recht unhandlich, da er die Forderung nach einer nuklearen Topologie enthält. Der Begriff der Nuklearität ist aber eher kompliziert und soll hier auch nicht näher erläutert werden17 . Die Nuklearität von Φ kann aber mit Hilfe des folgenden Satzes erreicht werden: Satz 4.9 (Roberts [37],[38]) Sei {Ai }i∈J ein Satz s.a. Operatoren im separablen Hilbertraum E. Φ ⊆ E sei ein durch die Roberts-Basis {Bk }k∈K vermittelter RobertsRaum. Jedes N ∈ Prod0 {Bk }k∈K definiert eine Seminorm p ⌊ϕ⌋N = kNϕk = hNϕ | Nϕi. Die durch diese Seminormen definierte lokal konvexe Topologie hat folgende Eigenschaften: a) Die Topologie ist nuklear. b) Es ist die schwächste Topologie, für die gilt: – sie ist stärker als die Hilbertraum-Topologie – alle Ai sind Φ-stetig. c) Φ ist vollständig (bezüglich Netz-Konvergenz) und semireflexiv. d) Ist {Bk }k∈K endlich oder abzählbar, so ist Φ ein reflexiver Fréchet-Raum. Diese Topologie nennen wir Roberts-Topologie; den entsprechenden (topologisch) dualen Raum bezeichnen wir mit Φ′R. Mit Hilfe von Satz 4.7 sieht man sofort, daß die soeben gegebene Charakterisierung von Φ′R äquivalent zu jener von Definition 4.9 ist. Die Punkte c) und d) haben wir nur der Vollständigkeit halber angegeben, und werden nicht näher auf sie eingehen. Die Punkte a) und b) benötigen wir aber, um Satz 4.8 anwenden zu können. Die Kombination der beiden letzten Sätze ergibt dann Satz 4.4. In Roberts [37],[38] wurde die in obigem Satz eingeführte Topologie etwas anders definiert: an Stelle von N ∈ Prod0 {Bk }k∈K wurde N ∈ Alg0 {Bk }k∈K zugelassen. Wir zeigen nun die Äquivalenz der beiden Definitionen: Jedes M ∈ Alg0 {Bk }k∈K ist in der Form M= p X γr Nr , r=1 Nr ∈ Prod0 {Bk }k∈K γr ∈ C darstellbar. Folglich gilt für alle ϕ ∈ Φ: kM ϕk ≤ C p X r=1 kNr ϕk , mit C = max |γr | . r=1,...,p Die Behauptung folgt dann aus [35], Seite 126, erste proposition, Punkt (c). QED. 17 Eine ausführliche Behandlung des Nuklearitätsbegriffes findet man z. B. in Pietsch [32], Treves [42], Schaefer [39]. 116 KAPITEL 4. ENTWICKLUNG NACH EIGENVEKTOREN Für theoretische Überlegungen kann es von Bedeutung sein, ob grundsätzlich für alle Sätze {Ai }i∈J kommutierender s.a. Operatoren eine Entwicklung nach Eigenvektoren möglich ist. Für endliches oder abzählbares I kann dies auf jeden Fall bejaht werden: es gibt dann nämlich immer einen nuklearen Raum Φ, der alle Bedingungen aus Satz 4.8 erfüllt18 . Für den Fall überabzählbar vieler Ai ist mir kein entsprechender Existenz-Beweis bekannt; dieser Fall kann aber bei Einhaltung einer physikalisch motivierbaren Minimalitätsbedingung nie auftreten (Siehe Lozada/Sarrazin/Torres [24] 1992). 4.4 4.4.1 Beispiel: Das Wasserstoffatom Modell und Aufgabenstellung Das Wasserstoffatom kann (bei Abwesenheit von äußeren Feldern) in guter Näherung durch ein spinloses Teilchen modelliert werden, das sich in einem elektrischen Potential q2 Υ(x, y, z) = Υ(x) = 4π |x| befindet (q ≈ 1.6 · 10−19 C). Die Masse M dieses Teilchens ist me mp M= ≈ me me + mp (mp =Masse des Protons, me =Masse des Elektrons, M=reduzierte Masse des Elektrons). Der geringfügige Unterschied zwischen M und me entsteht durch die Endlichkeit der Protonenmasse, die dazu führt, daß das Proton nicht völlig unbeweglich ist (Siehe z. B. [29], Seite 323). Nach Abschnitt 2.5.1 führt dies (in der SchrödingerDarstellung) zu folgendem Hamilton-Operator: H= −1 △ + V (|x|) , 2M mit V (|x|) = −q 2 4π |x| −1 (Genaugenommen ist H die s.a. Erweiterung von 2M △ + V (|x|)). Zusätzlich zu H betrachten wir auch die Operatoren L2 und Lz aus Beispiel 4.2 (Seite 90). Nach de Dormale/Gautrin [12] ist {H, L2 , Lz } ein vollständiger Satz kommutierender Observablen. Es gibt somit eine entsprechende Spektraldarstellung und wir werden im Folgenden versuchen, diese mit Hilfe der Eigenvektoren zu ermitteln. Wir suchen also nach verallgemeinerten Funktionen, die folgende Eigenwertgleichungen erfüllen: HξE,η,m(x) = EξE,η,m(x) L2 ξE,η,m(x) = ηξE,η,m(x) Lz ξE,η,m(x) = mξE,η,m (x) 18 Dies folgt aus der Kombination von de Dormale/Gautrin [11]1975, proposition 3, und Maurin [26]1968, Seite 85, Theorem 6. In [11] wird gezeigt, daß es bei höchstens abzählbarem I immer einen dichten invarianten Teilraum gibt; in [26] wird gezeigt, daß dieser Teilraum einen geeigneten nuklearen Raum enthält. 117 4.4. BEISPIEL: DAS WASSERSTOFFATOM 4.4.2 Transformation auf Kugelkoordinaten Wir führen folgende Transformation durch x = r sin ϑ cos φ y = r sin ϑ sin φ z = r cos ϑ r ∈ [0, ∞[, φ ∈ [−π, π[, ϑ ∈ [0, π]. Auf diese Weise können wir jede Funktion h(x, y, z) umkehrbar eindeutig in eine Funktion b h(r, φ, ϑ) überführen: h(x, y, z) = h(r sin ϑ cos φ, r sin ϑ sin φ, r cos ϑ) = b h(r, φ, ϑ) . Nun läßt sich zeigen, daß für jede (absolut integrable19 ) Funktion h(x, y, z) gilt: Z h(x, y, z) dµℓ (x, y, z) = Zπ Zπ Z∞ 0 −π 0 b h(r, φ, ϑ) r 2 sin ϑ dr dφ dϑ. Man kann auch ein Maß µk auf R3 angeben, sodaß Z b h(r, φ, ϑ) dµk (r, φ, ϑ) = Zπ Zπ Z∞ 0 −π 0 b h(r, φ, ϑ) r 2 sin ϑ dr dφ dϑ. Wir haben folglich eine unitäre Transformation K : L2 R3 , µℓ −→ L2 R3 , µk b φ, ϑ) . ψ(x, y, z) 7−→ ψ(r, Der Raum L2 (R3 , µk ) kann noch in die 2 Räume L2 (R, µr ) und L2 (R2 , µw ) ‘zerlegt’ werden. Die Maße µr und µk sind so definiert, daß Z Z p(r) dµr (r) = Z∞ p(p) r 2 dr 0 q(φ, ϑ) dµw (φ, ϑ) = Zπ Zπ q(φ, ϕ) sin ϑ dφ dϑ. 0 −π Man sieht leicht, daß für beliebige f (r) ∈ L2 (R, µr ) , g(φ, ϑ) ∈ L2 (R2 , µw ) stets f (r) · g(φ, ϑ) ∈ L2 (R3 , µk ) ist. Darüber hinaus läßt sich sogar zeigen, daß jedes b φ, ϑ) ∈ L2 (R3 , µk ) in der Form ψ(r, 19 b φ, ϑ) = ψ(r, ∞ X ν=1 fν (r) gν (φ, ϑ) mit fν ∈ L2 (R, µr ) , gν ∈ L2 R2 , µw Eine meßbare Funktion h(x) ist absolut integrabel (bezüglich µℓ ), wenn R |h(x)| dµℓ (x) < ∞. 118 KAPITEL 4. ENTWICKLUNG NACH EIGENVEKTOREN dargestellt werden kann (Das heißt, die Menge der Linearkombinationen der f (r) · g(φ, ϑ) ∈ L2 (R3 , µk ) ist dicht in L2 (R3 , µk )). b Zu jedem Operator A in L2 (R3 , µℓ ) gibt es einen unitäräquivalenten Operator A 3 in L2 (R , µk ). Insbesondere gilt: 1 ∂ ∂ 1 ∂2 c 2 L = − sin ϑ − sin ϑ ∂ϑ ∂ϑ sin2 ϑ ∂φ2 cz = 1 ∂ L j ∂φ 2 c2 . b = − 1 1 ∂ r + V (r) + 1 L H 2M r ∂r 2 2Mr 2 4.4.3 Die Kugelfunktionen c2 und L cz können offensichtlich auch als Operatoren in L2 (R2 , µw ) Die Operatoren L aufgefaßt werden. Die sogenannten Kugelfunktionen Yℓ,m (φ, ϑ) ∈ L2 R3 , µw , ℓ = 0, 1, 2, . . . , m = −ℓ, −ℓ + 1, . . . , ℓ erfüllen die Gleichungen c2 Yℓ,m (φ, ϑ) = ℓ (ℓ + 1) Yℓ,m(φ, ϑ) L cz Yℓ,m (φ, ϑ) = mYℓ,m (φ, ϑ) L (Siehe z. B. Messiah [29], Anhang B.4, insbesondere B.4.2). Ferner läßt sich zeigen, daß die Yℓ,m ein vollständiges Orthonormalsystem in L2 (R2 , µw ) bilden. Ist fE,ℓ (r) eine verallgemeinerte Funktion, die 1 1 ∂2 1 − r + V (r) + ℓ (ℓ + 1) fE,ℓ (r) = EfE,ℓ (r) 2M r ∂r 2 2Mr 2 (4.29) erfüllt, so ist fE,ℓ (r) Yℓ,m (φ, ϑ) c2 , L b L cz (zu den Eigenwerten offensichtlich eine Eigenfunktion der Operatoren H, E, ℓ (ℓ + 1) , m). Man muß somit versuchen, die Gleichung (4.29) zu lösen. 4.4.4 Die Radialgleichung Die Lösung der Gleichung (4.29) führt auf folgendes Ergebnis (Siehe Messiah [29], Anhang B1): 119 4.4. BEISPIEL: DAS WASSERSTOFFATOM Lösungen für E < 0: Für die Werte E = En = − q4M , 2 (4π)2 n2 n = ℓ + 1, ℓ + 2, ℓ + 3, . . . gibt es Lösungen fEn ,ℓ (r) ∈ L2 (R, µr ) . Daneben gibt es weitere Lösungen, die aber außerhalb von L2 (R, µr ) liegen; diese wachsen jedoch für r → ∞ so stark an, daß sie auf jeden Fall zu verwerfen sind. Für E = 0 gibt es keine quadratintegrable Lösung (also keine, die in L2 (R, µr ) liegt). Da ein einzelner uneigentlicher Eigenwert uninteressant ist, müssen wir den Fall E = 0 nicht weiter untersuchen. Lösungen für E > 0: Für E > 0 gibt es keine Lösungen aus von L2 (R, µr ). Außerhalb von L2 (R, µr ) findet man aber für alle E ∈ ]0, ∞[ und ℓ = 0, 1, 2, . . . je 2 linear unabhängige Lösungen, die wir mit FE,ℓ (r) und GE,ℓ (r) bezeichnen wollen. Diese Funktionen weisen folgendes asymptotisches Verhalten auf (Siehe Messiah [29], Anhang B.1.5)20 : αr → ∞ : αr → 0 : FE,ℓ(r) ≈ 1r sin(αr − γ ln 2αr + ǫγℓ ) 1 r GE,ℓ (r) ≈ cos(αr − γ ln 2αr + ǫγℓ ) ) für αr ≫ ℓ (ℓ + 1) + γ 2 FE,ℓ (r) ≈ cE,ℓ αℓ+1r ℓ GE,ℓ (r) ≈ 1 α−ℓ r −ℓ−1 (2ℓ+1)cE,ℓ 1 ℓπ, 2 √ Hierbei ist ǫγ,ℓ = arg Γ(ℓ + 1 + jγ) − α = 2ME, γ = √ 1 geeigneten Maßsystem ist α = E und γ = √dE mit d ≈ 274 . −q 2 4π q (4.30) M . 2E In einem Wegen der Vollständigkeit des Observablen-Satzes {H, L2 , Lz } kann es für jeden multiplen Eigenwert (E, η, m) höchstens eine Eigenfunktion geben (η = ℓ (ℓ + 1)); somit muß die Hälfte der oben angeführten Lösungen verworfen werden. Wegen der Divergenz von GE,ℓ (r) für r → 0 ist man natürlich versucht, die GE,ℓ (r) zu verwerfen; da die Divergenz aber nicht besonders stark ist, erscheint diese Argumentation nicht sehr zwingend. 20 Es ist FE,ℓ (r) = (B.29) und (B.31). 1 r Fℓ (γ; αr) , GE,ℓ (r) = 1 r Gℓ (γ; αr), mit Fℓ und Gℓ aus [29], Gleichungen 120 4.4.5 KAPITEL 4. ENTWICKLUNG NACH EIGENVEKTOREN Analyse im Gelfandschen Raumtripel Im vorliegenden Fall ist es naheliegend, eine genaue Analyse im Rahmen des Gelfandschen Raumtripels vorzunehmen, um zu prüfen, ob tatsächlich beide Lösungen in Φ′R liegen. Einen für unser Problem geeigneten Roberts-Raum Φ haben wir bereits in Beispiel 4.2 (Seite 90) angegeben. Nun läßt sich aber leicht zeigen, daß sowohl FE,ℓ(r) Yℓ,m (φ, ϑ) als auch GE,ℓ (r) Yℓ,m (φ, ϑ) in Φ′R liegen; das Gelfandsche Raumtripel liefert im vorliegenden Fall somit kein Kriterium, das es gestattet die richtigen Eigenfunktionen auszusuchen. Um dieses Problem zu lösen ist man daher gezwungen, direkt die Bedingungen von Satz 4.3 zu prüfen. Es ist somit nicht ausreichend, die Eigenfunktionen einzeln zu betrachten, sondern es ist notwendig, die Spektraldarstellung als ganze zu analysieren. 4.4.6 Die Struktur der Spektraldarstellung Wir wissen, daß die Eigenfunktionen fE,ℓ (r) die folgende Gestalt haben: fE,ℓ (r) = αE,ℓ FE,ℓ (r) + βE,ℓ GE,ℓ (r) . Um die Zahlen αE,ℓ und βE,ℓ zu bestimmen, muß man direkt auf Satz 4.3 zurückgreifen. Wir werden das hier aber nicht explizit durchführen, sondern beschränken uns darauf, anzugeben, welche Struktur die gesuchte Spektraldarstellung hat. Wenn wir annehmen, daß wir die ‘richtigen’ Eigenfunktionen fE,ℓ (r) gefunden haben (und diese korrekt normiert sind), so ergibt sich für die Spektraldarstellung folgende Struktur: T : L2 R3 , µℓ −→ L2 R3 , µ ϕ(x, y, z) 7−→ ϕ(E, e ℓ, m) . L2 (R3 , µℓ ) ist hier der Hilbertraum der Schrödinger-Darstellung, L2 (R3 , µ) ist jener der Energiedarstellung. Eigentlich müßten wir T ϕ(x, y, z) = ϕ(E, e η, m) schreiben; wegen η = ℓ (ℓ + 1) verwenden wir aber die Notation ϕ(E, e ℓ, m) (Der dem L2 entsprechende Operator in L2 (R3 , µ) ist aber nicht der Multiplikationsoperator ℓ, sondern der Multiplikationsoperator ℓ (ℓ + 1)). Die Funktion ϕ(E, e ℓ, m) ergibt sich aus D E ϕ(E, e ℓ, m) = fE,ℓ (r) Yℓ,m (φ, ϑ) ϕ(r, b φ, ϑ) = (4.31) = Z∞ = Zπ Zπ fE,ℓ (r)r 0 2 Zπ Zπ 0 −π Yℓ,m(φ, ϑ)ϕ(r, b φ, ϑ) sin ϑ dφ dϑ dr = Yℓ,m (φ, ϑ) sin ϑ 0 −π (Für ϕ ∈ Φ). Das Maß µ ist derart, daß Z |ϕ(E, e ℓ, m)|2 dµ(E, ℓ, m) = Z∞ 0 fE,ℓ (r)r 2 ϕ(r, b φ, ϑ) dr dφ dϑ 121 4.4. BEISPIEL: DAS WASSERSTOFFATOM = ∞ X ℓ X ℓ=0 m=−ℓ = ∞ X n=ℓ+1 ∞ X n−1 X ℓ X n=1 ℓ=0 m=−ℓ |ϕ(E e n , ℓ, m)|2 + 2 |ϕ(E e n , ℓ, m)| + Z∞ 0 |ϕ(E, e ℓ, m)|2 dE Z∞ ∞ X ℓ X ℓ=0 m=−ℓ 0 |ϕ(E, e ℓ, m)|2 dE. Über Axiom 4 ergibt sich nun die physikalische Interpretation von ϕ(E, e ℓ, m). 4.4.7 Fazit Wir haben gesehen, daß es uns im vorliegenden Beispiel nicht gelungen ist, über den Formalismus des Gelfandschen Raumtripels, eine korrekte Auswahl unter den Eigenfunktionen zu treffen; um die gesuchte Spektraldarstellung zu erhalten müßten wir direkt auf Satz 4.3 zurückgreifen. Der Nutzen des Gelfandschen Raumtripels reduzierte sich hier darauf, einen sauberen theoretischen Rahmen zu liefern, der es ermöglicht, das Wesen der verallgemeinerten Funktionen gut zu durchschauen. Hierfür ist es aber ausreichend den Raum Φ∗ zu betrachten, der wesentlich einfacher ist, als der topologisch duale Raum Φ′ . Aus diesem Grund haben wir bei der Beschreibung des Gelfandschen Raumtripels zunächst den Raum Φ∗ eingeführt; die Konstruktion des komplizierteren Raumes Φ′ ist erst dann angebracht, wenn sich daraus konkrete rechnerische Vorteile ergeben. 122 KAPITEL 4. ENTWICKLUNG NACH EIGENVEKTOREN Literaturverzeichnis [1] J. P. Antoine. Dirac Formalism and Symmetry Problems in Quantum Mechanics. I. General Formalism. Journal of Mathematical Physics, Vol. 10, No. 1, p. 53, January 1969 [2] J. P. Antoine. Dirac Formalism and Symmetry Problems in Quantum Mechanics. II. Symmetry Problems. Journal of Mathematical Physics, Vol. 10, No. 12, p. 2276, December 1969 [3] J. P. Antoine. Rigged Hilbert Spaces in Quantum Field Theory: a Lesson Drawn from Charge Operators. Helvetica Physica Acta. Vol. 45, p.77, 1972 [4] Donald Babbitt. Rigged Hilbert Spaces and One-Particle Schrödinger Operators. Reports on Mathematical Physics. Vol. 3, No. 1, p. 37, 1972 [5] N. N. Bogolubov, A. A. Logunov, I. T. Todorov. Introduction to Axiomatic Quantum Field Theory. W. A. Benjamin, Inc., 1975 [6] Arno Bohm. The Rigged Hilbert Space and Quantum Theory. Lecture Notes in Physics 78. Springer-Verlag, Berlin Heidelberg New York, 1978 [7] Arno Bohm. Quantum Mechanics: Foundations and Applications. SpringerVerlag, 1986 [8] A. Bohm, M. Gadella. Dirac Kets, Gamow Vectors and Gel’fand Triplets. Lecture Notes in Physics 348. Springer-Verlag, 1989 [9] P. A. M. Dirac. The Principles of Quantum Mechanics. Clarendon Press, Oxford, 1930 [10] Jaques Dixmier. Von Neumann Algebras. North Holland Publishing Company, Amsterdam New York Oxford, 1981 [11] Bernard M. de Dormale and Henri-François Gautrin. Spectral representation and decomposition of self-adjoint operators. Journal of Mathematical Physics, Vol. 16, No. 11, p. 2328, November 1975 [12] Bernard M. de Dormale and Henri-François Gautrin. Equation radiale de Schrödinger et complétude du système {H, L2 , Lz }. Can. J. Phys., Vol. 53, p. 1528, 1975 123 124 LITERATURVERZEICHNIS [13] S. J. L. van Eijndhoven, J. de Graaf. Trajectory Spaces, Generalized Functions and Unbounded Operators. Lecture Notes in Mathematics 1162, SpringerVerlag, 1985 [14] Herbert Federer. Geometric Measure Theory. Die Grundlagen der mathematischen Wissenschaften in Einzeldarstellungen, Band 153. Springer-Verlag, Berlin Heidelberg New York, 1969 [15] David Fredricks. Tight Riggings for a Complete Set of Commuting Observables. Rep. Math. Phys. (Poland), Vol. 8, No. 2, p. 277, October 1975 [16] M. Gadella. A rigged Hilbert space for the free radiation field. Journal of Mathematical Physics, Vol. 24, No. 4, April 1985 [17] I. M. Gelfand, N. J. Wilenkin. Verallgemeinerte Funktionen (Distributionen). Band IV. VEB Deutscher Verlag der Wissenschaften, Berlin, 1964 [18] Siegfried Großmann. Funktionalanalysis. 4. Auflage, AULA-Verlag, Wiesbaden, 1988 [19] P. R. Halmos, V. S. Sunder. Bounded integral operators on L2 spaces. SpringerVerlag, Berlin[u.a.], 1978 [20] Ernst Henze. Einführung in die Maßtheorie. B·I· Hochschuhltaschenbücher Band 505, Bibliographisches Institut, Mannheim, 1971 [21] J. M. Jauch and B. Misra. The Spectral Representation. Helvetica Physica Acta, Vol. 38, p. 30, 1965 [22] Rainer J. Jelitto. Theoretische Physik 4: Quantenmechanik I. 2. Auflage, AULAVerlag, Wiesbaden, 1987 [23] Rainer J. Jelitto. Theoretische Physik 5: Quantenmechanik II. AULA-Verlag, Wiesbaden, 1984 [24] A. Lozada, G. Sarrazin, P. L. Torres. Complete sets of commuting observables and irreducible sets of observables. Helvetica Physica Acta, Vol. 65, p. 887, 1992 [25] Günther Ludwig. Einführung in die Grundlagen der Theoretischen Physik, Band 3. Zweite Auflage, Vieweg, Braunschweig, 1984 [26] K. Maurin. General Eigenfunction Expansion and Unitary Representations of Topological Groups. PWN - Polish Scientific Publishers, Warszawa, 1968 [27] Olaf Melsheimer. Rigged Hilbert space formalism as an extended mathematical formalism for quantum systems. I. General theory. Journal of Mathematical Physics, Vol. 15, No. 7, p. 902, July 1974 LITERATURVERZEICHNIS 125 [28] Olaf Melsheimer. Rigged Hilbert space formalism as an extended mathematical formalism for quantum systems. II. Transformation theory in nonrelativistic quantum mechanics. Journal of Mathematical Physics, Vol. 15, No. 7, p. 917, July 1974 [29] Albert Messiah. Quantenmechanik, Band 1. Zweite Auflage, De Gruyter, Berlin New York, 1991 [30] J. von Neumann. Mathematische Grundlagen der Quantentheorie. SpringerVerlag, Berlin, 1932 [31] J. von Neumann. Zur Algebra der Funktionaloperatoren und Theorie der normalen Operatoren. Mathematische Annalen 102, p. 370-427, Berlin, 1930 [32] A. Pietsch. Nuclear Locally Convex Spaces. Springer-Verlag, Berlin Heidelberg New York, 1972 [33] E. Prugovečki. Can. J. Phys. 47, p. 1083, 1969 [34] E. Prugovečki. Quantum Mechanics in Hilbert Spaces. Academic Press, New York and London, 1971 [35] M. Reed, B. Simon. Methods of Modern Mathematical Physics. I. Functional Analysis. Revisited and Enlarged Edition, Academic Press, San Diego Boston London Sydney Tokyo Toronto, 1980 [36] M. Reed, B. Simon. Methods of Modern Mathematical Physics. IV. Analysis of Operators. Academic Press, New York, San Francisco, London, 1978 [37] J. E. Roberts. The Dirac Bra And Ket Formalism. Journal of Mathematical Physics, Vol. 7, No. 6, p. 1097, June 1966 [38] J. E. Roberts. Rigged Hilbert Spaces in Quantum Mechanics. Comm. Math. Phys. (Germany), 3, p. 98, 1966 [39] Helmut H. Schaefer. Topological Vector Spaces. The Macmillan Company, New York, 1967 [40] Franz Schwabl. Quantenmechanik. Springer-Verlag, 1988 [41] D. Tjøstheim. A note on the unified Dirac- v. Neumann formulation of quantum mechanics. Journal of Mathematical Physics, Vol. 16, No. 4, April 1975 [42] François Treves. Topological Vector Spaces, Distributions and Kernels. Academic Press, New York London, 1967 Stichwortverzeichnis a.e., siehe almost everywhere abgeschlossene Menge, 24, 111 abgeschlossener Operator, 35, 82 Abschliesung einer Menge, 24, 77 Abschliesung eines Operators, 82 absolut integrabel, 117 absolut stetiges Mas, 18 abstrakter Hilberraum, 46 abzahlbar, 17 adjungierter Operator, 34, 89, 97 almost everywhere, 19 Antoine, 10 aquivalente Funktionen, 19, 23 aquivalente Mase, 18 Assoziativgesetz, 22, 32 Babbitt, 10 beschrankte Menge, 24 beschrankter Operator, 33, 35, 39 bijektiv, 38 Bild einer Menge, 31 Bild eines Operators, 31 Bildbereich des Operators, 31 Bogolubov/Logunov/Todorov, 49 Bohm, 10, 56 Borel Mengen, 16 Bosonen, 55 Cauchy-Folge, 28 δ-Funktion, 91, 94 Darstellung, 38 Definitionsbereich des Operators, 31 Diagonaloperator, 39 dichter Teilraum, 28, 39, 88 Dimension des Hilbertraumes, 29 Dirac-Bild-Darstellung, 69 Diracsche δ-Funktion, siehe δ-Funktion Diracsche Methode, 2, 7 Diracsche Notation, 30, 31, 37, 46 Direct Integral, 114 diskretes Spektrum, 80 Distributivgesetz, 32 de Dormale/Gautrin, 9, 42, 44, 82, 85, 90, 116 dualer Raum algebraischer, 93, 109 topologischer, 10, 109, 114 e.s.a. Operator, 34, 60 ebene Welle, 54 Eigenfunktion, 36 Eigenvektor eigentlicher, 35, 72, 103 gemeinsamer, 100 uneigentlicher, 99 verallgemeinerter, 7, 99, 100 Eigenwert eigentlicher, 35, 72, 79 multipler, 100 uneigentlicher, 99 verallgemeinerter, 79, 99, 100 van Eijndhoven, 10 Einbettung, 113 einfache Mesapparatur, siehe Mesapparatur eingeschranktes Lebesgue-Mas, 18, 25, 104 Einschieben der Eins, 30 Einschrankung eines Operators, 31 elementare offene Menge, 75 Energie-Observable, 62 Energiedarstellung, 8, 120 entarteter Eigenwert, 36 Entartungsgrad, 36, 80 Entwicklung nach Eigenvektoren, 100 Erhaltungsgrose, 67 Erwartungswert, 71 Erweiterung eines Operators, 31, 33, 34, 60 explizit zeitabhangige Observable, 62, 66 fast uberall, siehe almost everywhere Federer, 76 feinere Topologie, 112 Fermionen, 55 finites Mas, 18 Fourier-Transformation, 53, 58, 107 Fubini-Theorem, 105, 107 Funktional, 92 Funktionsklassen, 19 Gautrin, siehe de Dormale/Gautrin Gelfand, 9 Gelfandsches Raumtripel, 9, 87, 109 de Graaf, 10 126 127 STICHWORTVERZEICHNIS grobere Topologie, 112 Grosmann, 19, 29, 30, 32, 79, 85 Halmos/Sunder, 42 Hamilton-Operator, 60, 63, 66, 72 Haufungspunkt, 24 Hauptwert des Integrals, 94 Heisenberg-Bild-Darstellung, 68 Henze, 15, 19 Hilbertraum, 28 Hilbertraum-Topologie, 111, 113, 114 idempotent, 36 implizit zeitabhangige Observable, 62, 66 Impuls, 54 Impulsdarstellung, 8, 53 injektiv, 25 inneres Produkt, 26, 57 Integral Lebesgue-Integral, 20 Riemann-Integral, 21 invarianter Teilraum, 87 inverser Operator, 32, 38, 106 isometrisch, siehe langentreu Jauch/Misra, 9 Jelitto, 51, 62 Kommutativgesetz, 22 Kommutator, 73 Kommutierbarkeit, 32, 40, 83 kompakter Trager, 24 kompatible Observablen, 50 Konstanzpunkt eines Mases, 75 kontinuierliches Spektrum, 80 Konvergenz eines Netzes, 111 Konvergenz im Mittel, 28 Kugelfunktionen, 118 Langentreue, 38, 101 Laplace-Operator, 60 Lebesgue-Integral, siehe Integral Lebesgue-Mas, 18, 103 Lichtsekunde, 14 linearer Raum, 22 Linearkombinationen, 23 lokal konvexer Raum, 111 Lozada/Sarrazin/Torres, 116 Ludwig, 49 Melsheimer, 10 Mesapparatur, 47 mesbare Funktion, 20, 21 mesbare Mengen, 16 Mesgrose (quantenmechanische), 49 Messiah, 89, 116, 118, 119 Misra, siehe Jauch/Misra Mittelwert, 71 Multiplikationsoperator, 39 Netz, 76, 110 von Neumann-Algebra, 42 von Neumann-Methode, 2, 86 von Neumann-Methode, 8 Norm eines Operators, 33 Norm eines Vektors, 27 Normierung der Eigenvektoren, 101 nukleare Topologie, 10, 100, 114 Nullmenge, 19, 57 Nullvektor, 22 Observable, 7, 49 offene Menge, 24, 75, 111 Operator, 31 im Hilbertraum, 31 Produkt, 32, 82 Summe, 32, 82 orthogonal, 29, 36 Orthogonalprojektion, siehe Projektor Orthogonalsystem, 29 Orthonormalsystem, 29, 37 Orthonormierungsbedingung, 106 Ortsdarstellung, 8 Pietsch, 115 Projektor, 36, 84 Prozes, 45 Prugovečki, 9, 15, 19, 64 Punktmas, 19 pure points, 19 quadratintegrable Funktion, 23 quadratsummable Funktion, 23 Quantenfeldtheorie, 47, 49 rationales Maseinheitensystem, 14 reduzierte Masse, 116 Reed/Simon, 34, 83, 103, 107, 113, 114 RHS, siehe Rigged Hilbert Space Riemann-Integral, siehe Integral magnetisches Moment, 55 Rigged Hilbert Space, 8, 87 Mas, 17 Roberts, 9, 28, 89, 109, 110, 115 Maurin, 75, 78, 113, 114, 116 Roberts-Basis, 89, 110, 115 maximal scharfe Mesapparatur, siehe Mesappa- Roberts-Raum, 90, 110, 115 ratur Roberts-Topologie, 115 128 σ-additiv, 17 σ-finites Mas, 18, 78 s.a. Operator, siehe selbstadjungierter Operator Schaefer, 115 Schrodinger-Bild-Darstellung, 63, 68 Schrodinger-Darstellung, 52, 58–60, 63, 64, 68 Schrodinger-Funktion, 52, 58, 59, 68 Schrodinger-Gleichung zeitabhangige, 65 zeitunabhangige, 68 Schwabl, 56 schwachere Topologie, 112 Schwarzsche Ungleichung, 26 selbstadjungierter Operator, 34, 39, 60 Seminorm, 111 separabler Hilbertraum, 29 Simon, siehe Reed/Simon Skalarprodukt, siehe inneres Produkt Spektraldarstellung, 7, 42, 100 Spektralschar, 8, 42, 44, 84 Spektrum, 77, 108 Spin, 45, 55 Spin-Bahn Kopplung, 62 Spin-Komponente, 55 Sprungpunkt eines Mases, 19, 75 Standardabweichung, 71 starke Summe, 82 starkere Topologie, 112–114 starkes Produkt, 82 stationarer Zustand, 67 stetiges Funktional, 110 Φ-Stetigkeit, 110, 113, 114 Stetigkeit der algebraischen Operationen, 28 Stetigkeit des Skalarproduktes, 28 Stetigkeit von Operatoren, 33, 35 Strahl, 26, 36, 37, 46 Sunder, siehe Halmos/Sunder superselection rules, 47, 49 surjektiv, 31, 38, 101 symmetrischer Operator, 34 Teilraum linearer, 23 vollstandiger, 36 Tihonov-Topologie, 75 Topologie, 112 Trager einer Funktion, 24 Trager eines Mases, 18, 75 Treves, 115 uberabzahlbar, 17 uberall definierter Operator, 31, 33, 39 Umgebung, 75 unitaraquivalent, 38, 42 unitare Transformation, 38 STICHWORTVERZEICHNIS unitarer Operator, siehe unitare Transformation Unscharfe, 48, 54, 71 Unscharferelation, 54 v-Operator, 39 Varianz, 71 Vektor, 22 Vektorpotential, 51, 61 Vektorraum, siehe linearer Raum verallgemeinerte Funktion, 94 Vielfachheit, siehe Entartungsgrad vollst. Satz s.a. Operat., 43, 50 vollstandiger Raum, 28, 115 vollstandiges Orthonormalsystem, 29, 37 Wachstumspunkt eines Mases, 75 Wechselwirkungsbild-Darstellung, 69 Welle-Teilchen Dualismus, 54 Wellenfunktion, 52 Wellenlange, 54 Wellenvektor, 54 Wertevorrat des Operators, 31 wesentlich s.a., siehe e.s.a. Weyl-Kriterium, 79 z-Komponente des Spins, 55 Zeitentwicklungs-Operator, 63 Zustand, 45, 46 Zustandsvektor, 46